Особенности хранения документов
СЭД работают, преимущественно, на базе распределенных архитектур и используют разнообразные комбинации технологий сбора, индексирования, хранения, поиска и просмотра электронных документов. В большинстве СЭД реализована иерархическая система хранения документов (по принципу "шкаф/полка/папка"). Каждый документ помещается в папку, которая, в свою очередь, находится на полке и т. д. Количество уровней вложения при хранении документов не ограничено. Один и тот же документ может входить в состав нескольких папок и полок за счет применения механизма ссылок (исходный документ в этом случае остается неизменным и хранится на месте, определенном администратором СЭД). В ряде СЭД реализованы еще более мощные возможности хранения за счет организации связей между документами (эти связи можно устанавливать и редактировать в графическом виде).
Любому документу в СЭД присущ определенный набор атрибутов (например, его название, автор документа, время его создания и др.). Набор атрибутов может меняться от одного типа документа к другому (в пределах одного типа документов он сохраняется неизменным). В СЭД атрибуты документа хранятся в реляционной базе данных. Для каждого типа документов с помощью визуальных средств создается шаблон карточки, где в понятном графическом виде представлены наименования атрибутов документа. При введении документа в СЭД берется необходимый шаблон и заполняется карточка (заносятся значения атрибутов). После заполнения карточка оказывается связанной с самим документом.
В большинстве случаев, серверная часть СЭД состоит из следующих логических компонентов (которые могут располагаться как на одном, так и на нескольких серверах):
- Хранилища атрибутов документов (карточек);
- Хранилища документов;
- Сервисов полнотекстовой индексации.
Под хранилищем документов обычно понимается хранилище содержимого документов. Хранилище атрибутов и хранилище документов часто объединяют под общим названием "архив документов". Для хранения атрибутов в большинстве СЭД используются СУБД Oracle, Sybase, MS SQL Server и Informix, обеспечивающие поиск документов по атрибутам.
Для хранения непосредственно содержимого документов в большинстве СЭД применяются файл-серверы MS Windows NT, Novell NetWare, UNIX и др. В этом случае могут быть реализованы и гетерогенные комбинации сетевых сред. Например, база данных с атрибутами документов может работать под управлением ОС UNIX в сети TCP/IP, а сами документы могут храниться под ОС Novell NetWare в сети IPX/SPX. Следует отметить, что большими преимуществами СЭД являются хранение документов в исходном формате и автоматическое распознавание множества форматов файлов.
В последнее время всё большую популярность приобретает хранение документов вместе с атрибутами в базе данных. Такой подход имеет свои преимущества и недостатки. Преимуществом является значительное повышение безопасности доступа к документам, а основным недостатком — низкая эффективность работы с документами при большом объеме хранимой информации. При данном подходе также требуется использование мощных серверов с большими объемами оперативной памяти и жестких дисков. Кроме того, в случае сбоя базы данных восстановить хранившиеся в ней документы будет очень непросто. Необходимо также строго привязываться к конкретной СУБД.