یکی از عناصر حیاتی در هر شرکت یا سازمان، اسناد موجود در مجموعه آن است. این اسناد عموماً به صورت ابتدایی ذخیره می شوند و در صورت نیاز، هر سند باید در لیست اسناد جستجو شود و بازیابی باید بر اساس نام ذخیره شده سند انجام شود.
سیستم مدیریت و پردازش اسناد (SAMPA) توسط گروه اتصال شریف اسناد را به صورت توزیع شده ذخیره می کند و نه تنها از پیشرفت قابل توجهی در مکان یابی هر سند اطمینان می دهد، بلکه از حذف احتمالی اسناد نیز جلوگیری می کند. علاوه بر این، مهم ترین ویژگی SAMPA توانایی آن در پردازش متن سند از فایل های PDF است. پس از آپلود، فایل سند تحت پردازش تصویر قرار می گیرد و بر اساس متن درون سند، دسته بندی و خلاصه سازی با استفاده از کلمات کلیدی و به دنبال آن ذخیره سازی انجام می شود.