Полезные советы по автоматизации малого бизнеса: Электронный архив предприятия. С чего начать?
База данных иллюстраций
На SQL.RU человек спросил:
Есть необходимость сделать такую базу, чтобы даже самый
простой пользователь мог найти иллюстрацию по ключевому слову. По сути
внутреиздательский Гугл. Сервер взяли и заполняем.
Прошу совета, какой выбрать программный продукт=оболочку.
И многопользовательская, и удобная?.. А в каком формате иллюстрации? И как их много?
Надо ведь еще теги расставлять… это значит, или система
документооборота с атрибутами документов, поиском и все такое, или как
эрзац-вариант вики - класть в нее превьюшку, подробное текстовое
описание и ссылку на файл…
Организационная проблема в том, что для удобства поиска в такой базе надо прикладывать большие усилия по ее наполнению.
Но это все не так важно.
Важен вопрос, который не прозвучал. Вопрос этот такой:
А зачем?
Как минимум, следует понять место обсуждаемой базы данных в общем информационном пространстве организации.
Потому что может оказаться, что надо знать, в каких публикациях какие иллюстрации были (и были ли) использованы.
Может также оказаться важным знать, кто автор картинки или
фотографии, и что еще принадлежит данному автору, и когда и сколько
заплачено, и на каких условиях автор работает, и каково мнение
сотрудников о разнообразных качествах автора иллюстрации. И какие права
принадлежат редакции.
Обязательно надо оценить первоначальный объем и темпы роста базы
данных. Вполне может оказаться, что ни по деньгам, ни по трудозатратам
полноценную систему внутрииздательского документооборота эта контора не
потянет. А обойдется обыкновенным файл-сервером с разложенными по
каталогам файлами. Файлы, кстати, могут быть еще те - на сотни мегабайт.
Все сказанное относится к процессу создания электронного архива любого предприятия.
Электронный архив - что это вообще такое?
В широком смысле, электронный архив - все данные на электронных носителях, что у предприятия есть.
В узком смысле - это база данных электронных документов, имеющих
типичные для архива атрибуты (карточки документов) и содержащих
различную неструктурированную информацию - тексты, графические файлы,
другие данные.
Смысл существования архива двоякий:
сохранить данные;
обеспечить удобный быстрый поиск,
однако второе требование может входить в противоречие с требованием
осмысленности затрат на содержание и пополнение архива. И если ресурсов
на полноценную СЭД нет (а архив - это в общем-то часть СЭД, место, куда
сваливаются обработанные документы), то придется юзать эрзац-вариант.
Файл-сервер, на котором по иерархической структуре каталогов разложены сканы документов с длинными именами,
даваемыми по строго соблюдаемой инструкции - это очень даже хороший
вариант. Поиск в нем осуществляется по дереву каталогов, по именам
файлов. Для поиска по содержимому (как минимум, по содержимому
текстовых документов) можно использовать Google Desktop, держа копию
архива на достаточно мощном десктопе.