از جمله موارد مهم در هر شرکت و یا سازمان، اسناد موجود در آن مجموعه میباشد. این اسناد در حالت کلی به صورت ابتدایی صرفا ذخیره شده و در صورت نیاز به هر سند، باید در لیست اسناد جست و جو شده و طبق نامی که سند مذکور ذخیره شده است، اقدام به بازیابی آن شود.
سامانه مدیریت و پردازش اسناد (سمپا) گروه کانکت شریف، اسناد را به صورت توزیع شده ذخیره میکند که به سبب این موضوع علاوه بر افزایش چشمگیر در یافتن هر سند، مانع از پاک شدن احتمالی سند نیز خواهد شد. همچنین مهمترین ویژگی سامانه سمپا، پردازش متن اسناد از روی فایل pdf سند میباشد؛ بدین صورت که فایل سند بعد از بارگزاری پردازش تصویر شده و طبق متن موجود در سند دسته بندی، خلاصه سازی بر اساس لغات کلیدی و ذخیره سازی خواهد شد.
