Сайт Ивана Чередниченко: Сканирование документов для их размещения на Официальном сайте (в единой информационной системе)

Российские официальные сайты в настоящее время, мягко говоря, не очень быстрые, в связи с этим их пользователям часто приходиться приспосабливаться к этому и находить способы ускорения процесса работы. В этой статье пойдет речь о сканировании документов (контрактов и договоров, платежных документов) для их последующего размещения на Официальном сайте (в единой информационной системе) с помощью программного продукта ABBYY FineReader.

Программный продукт ABBYY FineReader предоставляет очень широкий набор функций и возможностей по работе с электронными версиями документов. Нам же необходимо осуществить сканирование документа.

Для каждой отдельной страницы документа можно выбрать параметры сканирования. Для уменьшения размера получаемого файла можно установить параметр Режим сканирования в Черно-белый. Используйте цветной режим сканирования только в том случае, если это действительно необходимо. При черно-белом режиме получаются отчетливые электронные версии печатных документов, но в некоторых случаях плохо сканируются печати.

После того, как все страницы документа были отсканированы, необходимо произвести их сохранение или экспортирование в какой-либо формат. Если не налагается каких-либо ограничений на формат документов, то рекомендуется сохранить полученный документ в формате изображения или в формате PDF. В далеком 1991 году компания Adobe Systems предъявила миру новый формат представления электронных документов - PDF (Portable Document Format). На тот момент главным его назначением был перевод в цифровой вид любой полиграфической продукции. Для просмотра документов формата PDF можно воспользоваться Adobe Reader (абсолютно бесплатная программа с широким набором возможностей) или Foxit Reader (абсолютно свободная для использования программа). 01 июля 2008 года формат PDF прошел официальную стандартизацию ISO.

Следующая таблица демонстрирует то, что размер документа зависит от его формата.

Формат Размер файла, Байт
TIFF, сжатие LZW
PDF

В связи с этим, рекомендую производить сохранение полученного файла в форматах PDF и TIFF (с применением сжатия LZW), так как в некоторых случаях размер PDF-файла меньше размера TIFF-файла, а в других наоборот.

Меньший размер файла позволяет ускорить процесс его прикрепления к формируемым на Официальном сайте (в единой информационной системе) сведениям. Но при работе на сайте были случаи, когда файл размером большим чем десять мегабайт просто не мог прикрепиться, в следствие чего приходилось искать способы уменьшения его размеров.

Если размер все еще большой, то можно попробовать поместить полученный файл в архив, но если изначально файл подвергался сжатию (TIFF со сжатием, JPEG, PNG и ряд других), то размещение такого файла в архив особого эффекта уже не даст (можно достичь степени сжатия всего лишь в несколько процентов в лучшем случае).

Для документов Microsoft Word следует использовать современный формат *.docx (вместо *.doc); для Microsoft Excel - *.xlsx (вместо *.xls), так как эти форматы впервые были введены в офисном пакете Microsoft Office 2007. Международный комитет по стандартизации ISO утвердил стандарт OpenDocument (используемый, в частности, OpenOffice) в качестве стандарта для электронного документооборота. Microsoft Office 2007 использует новый открытый формат файла Open XML, во многом аналогичный OpenDocument; он даже отправлен на утверждение в ISO.

Вообще, чем больший объем занимает данная разновидность информации, тем большее разнообразие типов цифровых данных наблюдается для нее. На практике употребляется всего несколько текстовых форматов - чистый текст, пара - тройка форматов Microsoft (*.doc; *.docx и *.rtf), Open Document Format (*.odf), а также Web-формат HTML и еще иллюстрированный текст PDF. ... Сравнительно немного форматов употребляется на практике и для представления статических изображений. Их список практически исчерпывается пятью разновидностями: TIFF, JPEG, GIF, BMP и PNG.

В связи с вышеизложенным, рекомендую использовать следующие форматы:

Размещая документы в вышеназванных форматах, вы обеспечите в большинстве случаев их свободный доступ у большинства пользователей не только персональных компьютеров, но и на мобильных устройствах. Некоторые форматы были разработаны отдельными компаниями, например, *.docx, *.xlsx и другие, но существуют как платные, так и бесплатные программные продукты для работы с этими форматами.

Источники