Создание фонда пользования на электронных носителях


В 1995 году, в связи с большим количеством запросов о подтверждении факта угона в Германию во время Отечественной войны была сделана попытка автоматизировать процесс выдачи справок. Для этого в госархиве была создана должность заместителя директора архива по информационным системам, которую и до сегодня занимает Сергей Николаевич Герасимов и организована группа из трех человек для создания первых баз данных и ввода в них информации. Усилиями этих людей была создана первая база данных "Угон в Германию".
Вначале в базу вводили все данные, имевшиеся в деле: фамилия, имя, отчество (полностью); год рождения; национальность; место работы; домашний адрес; адрес дела. Позже выяснилось, что к тому времени, когда в таком формате будут введены все записи, база уже будет невостребованной. Поэтому, для оптимизации работы было принято решение вводить только фамилию, инициалы со ссылкой на фонд, опись, дело и лист, что значительно ускорило процесс ввода информации, но в таком случае, при поиске соответствующей фамилии, приходилось поднимать необходимое дело того или иного фонда, чтобы проверить расшифровку инициалов и установить год рождения угнанного. Позже, в 1999 году, когда был приобретен планшетный сканер формата А4 НР 6200С, все дела содержащие информацию об "угнанных" были отсканированы, что позволило просматривать листы дел на компьютере, не выходя из программы и выводить на печать бланк справки уже с заполненными данными. База данных "Угон в Германию" стал основой для написания новых баз данных таких как:"Метрические записи о рождении в Донецкой области", "Списки расстрелянных во время оккупации мирных жителей Донецкой области", "Списки граждан, проживающих в г.Артемовске, г.Сталино и г.Мариуполе во время оккупации Донецкой области", "Списки депутатов местных советов области ", "Списки граждан, награжденных орденами и медалями СССР".
Более подробно принцип работы базы описан в методическом пособии по созданию базы данных "Угон в Германию" за 2001 г.
Архивные документы, как правило, больше формата А4. поэтому планшетный сканер не дает высокой производительности сканирования. До приобретения в декабре 2004г. книжного сканера, работы по созданию фонда пользования в электронном виде не велись.
С января 2005 г. началась плановая работа по созданию электронных копий архивных документов на книжном сканере Minolta PS-7000. Ему свойственен большой набор возможностей обработки изображений, среди которых автоматическое определение формата, коррекция наклона страниц, уничтожение перегиба, маскирование следов пальцев оператора, коррекция параметров изображения, автоматическое увеличение номеров файла на нужное количество единиц. И еще, что немаловажно для архивов, книжный сканер дает возможность перевода в электронный вид документов без повреждения обложки дел и без необходимости их расшивки.
При необходимости цветных снимков используется обыкновенный планшетный сканер формата А4 HP Scanjet3800.
В 2006 г., после начала сканирования метрических книг церквей для работы исследователей в читальном зале, опыт просмотра дел через базу перешел и на метрические книги. Если есть электронная копия дела, то в базе данных " Метрические записи о рождении в Донецкой области " можно посмотреть лист, на котором находится интересующая фамилия.
Для хранения сканированных документов выделен отдельный жесткий диск объемом 149 Гиг на компьютере, условно назовем его "комп0". На этом винчестере создана папка "Фото", которая вмещает в себя 3 подпапки: "Фонды", "Книги", "Газеты".
Электронные копии архивных документов хранятся в папке "Фонды".
Для каждого фонда в директории "Фонды" создается папка с именем и номером фонда в нее вкладывается папка с номером описи и уже в нее папка с номером дела. Для примера, дело 14 фонда Р-1146 оп.1 будет помещено в папку: \Фото\Фонды\Р-1146\оп.1\14
Сканируются дела в формате tif, с разрешением - 300 dpi, цветовая гамма - градация серого. Файлы нумеруются по номеру листа. Для правильной сортировки в проводнике windows, слева добавляются нули. Например, электронная копия листа №1 - будет называться 001.tif, если у листа есть оборот, то копия будет названа по номеру листа с допиской _об, например 001_об.tif. Исключения составляют метрические книги, т.к. информация находится на 2 страницах. Для удобства просмотра, оборот предыдущего листа со следующим сканируем одним файлом. Литерные листы, соответственно по номеру листа с припиской буквы, например: 001_а.tif. Обложка дела сканируется с названием файла 000.tif. Последним файлом будет лист-заверитель дела, удостоверяющий количество листов, литерные и пропущенные листы. После завершения сканирования, на деле в верхнем правом углу делается пометка о наличии копии, такая же пометка делается в описи.
Для просмотра дел в электронном виде используется программа типа ACDSee. С ее помощью, после сканирования всего дела, пережимаются файлы из формата tif в формат jpg с наименьшей потерей качества.
Электронные копии газетных подшивок хранятся в папке "Газеты". Метод сканирования практически ни чем не отличается от работы над фондами. В директорию "Газеты" вкладываются папки с номером подшивки. Создается электронная копия в формате tif, а затем пережимается в jpg.
Сканируя газеты, мы столкнулись с весьма неприятным моментом. Не смотря на то, что книжный сканер предполагает сканирование документов формата А2, некоторые газеты не вмещаются на стол сканера. В этом случае мы снимаем лист двумя файлами, а затем в графическом редакторе соединяем в один.
Соответственно, электронные копии книг сохраняем в папку "Книги", а уже в ней - папки с кратким названием книг.
Учет сканированных документов ведется в базе данных "Сканирование". Она вмещает в себя информацию об архивных шифрах сканированного документа, количестве файлов, дате создания и фамилии оператора.
Во избежание случайной или намеренной порчи винчестера с информацией, мы создаем вторую копию. Для этого, вся информация, ежедневно синхронизируется по локальной сети на другой компьютер "комп1" с помощью программы Web Synchronizer.
По мере накопления большого блока информации, она переписывается на жесткий диск, который находится в устройстве Mobile Rack на третьем компьютере "комп2". Затем записываем еще одну копию этого винчестера, для создания страхового фонда. Исходная информация на "комп0" и "комп1" уничтожается, освобождая место для новых файлов.
На данном этапе мы уже имеем 2 копии жесткого диска, на котором записаны электронные копии 277 подшивок газет за 1883-1926, 1941-1945 гг., что составляет 27010 файлов, по объему занимаемого места - это 130 ГБ. Отсканировано 386 дел - это 36979 файлов (83 ГБ), 26 книг - 4284 файлов (4,5 ГБ).
Документы, на которые есть фонд пользования, выдаются в читальный зал для просмотра исследователям только в электронном виде. Требование, заполненное исследователем, поступает в отдел физической сохранности документов и информационно-поисковых систем, после чего на компьютер в читальный зал переписывается копия требуемого документа.
Архив ставит цель - полностью перевести работу исследователей в читальных залах с документами в электронном виде. На 1 ноября 2006 года читальный зал 1 корпуса оснащен 3 компьютерами (2 для исследователей, 1 для работника архива), 2 корпус - 1 компьютером. Однако, как показывает опыт работы этого не достаточно. Для сканирования необходимо несколько книжных сканеров, жесткие диски для хранения и накопление информации. Для сканирования, редактирования электронных документов, контроля их копирования и удаление на компьютеры в читальные залы необходимы дополнительные штатные единицы в отдел поисковых систем.
Если кого-то заинтересуют наши наработки по созданию фонда пользования в электронном виде, мы всегда будем рады поделиться своим опытом и оказать помощь начинающим.


Начальник отдела физической
сохранности документов
и информационно поисковых систем
Шишолик И.В.