Российские официальные сайты в настоящее время, мягко говоря, не очень быстрые, в связи с этим их пользователям часто приходиться приспосабливаться к этому и находить способы ускорения процесса работы. В этой статье пойдет речь о сканировании документов (контрактов и договоров, платежных документов) для их последующего размещения на Официальном сайте (в единой информационной системе) с помощью программного продукта ABBYY FineReader.
Программный продукт ABBYY FineReader предоставляет очень широкий набор функций и возможностей по работе с электронными версиями документов. Нам же необходимо осуществить сканирование документа.
Для каждой отдельной страницы документа можно выбрать параметры сканирования. Для уменьшения размера получаемого файла можно установить параметр Режим сканирования
в Черно-белый
. Используйте цветной режим сканирования только в том случае, если это действительно необходимо. При черно-белом режиме получаются отчетливые электронные версии печатных документов, но в некоторых случаях плохо сканируются печати.
После того, как все страницы документа были отсканированы, необходимо произвести их сохранение или экспортирование в какой-либо формат. Если не налагается каких-либо ограничений на формат документов, то рекомендуется сохранить полученный документ в формате изображения или в формате PDF. В далеком 1991 году компания Adobe Systems предъявила миру новый формат представления электронных документов - PDF (Portable Document Format). На тот момент главным его назначением был перевод в цифровой вид любой полиграфической продукции
. Для просмотра документов формата PDF можно воспользоваться Adobe Reader (абсолютно бесплатная программа с широким набором возможностей
) или Foxit Reader (абсолютно свободная для использования программа
). 01
июля 2008 года формат PDF прошел официальную стандартизацию ISO.
Следующая таблица демонстрирует то, что размер документа зависит от его формата.
| Формат | Размер файла, Байт |
| TIFF, сжатие LZW | |
В связи с этим, рекомендую производить сохранение полученного файла в форматах PDF и TIFF (с применением сжатия LZW), так как в некоторых случаях размер PDF-файла меньше размера TIFF-файла, а в других наоборот.
Меньший размер файла позволяет ускорить процесс его прикрепления к формируемым на Официальном сайте (в единой информационной системе) сведениям. Но при работе на сайте были случаи, когда файл размером большим чем десять мегабайт просто не мог прикрепиться, в следствие чего приходилось искать способы уменьшения его размеров.
Если размер все еще большой, то можно попробовать поместить полученный файл в архив, но если изначально файл подвергался сжатию (TIFF со сжатием, JPEG, PNG и ряд других), то размещение такого файла в архив особого эффекта уже не даст (можно достичь степени сжатия всего лишь в несколько процентов в лучшем случае).
Для документов Microsoft Word следует использовать современный формат *.docx (вместо *.doc); для Microsoft Excel - *.xlsx (вместо *.xls), так как эти форматы впервые были введены в офисном пакете Microsoft Office 2007. Международный комитет по стандартизации ISO утвердил стандарт OpenDocument (используемый, в частности, OpenOffice) в качестве стандарта для электронного документооборота. Microsoft Office 2007 использует новый открытый формат файла Open XML, во многом аналогичный OpenDocument; он даже отправлен на утверждение в ISO
.
Вообще, чем больший объем занимает данная разновидность информации, тем большее разнообразие типов цифровых данных наблюдается для нее. На практике употребляется всего несколько текстовых форматов -
. чистый текст
, пара - тройка форматов Microsoft (*.doc; *.docx и *.rtf), Open Document Format (*.odf), а также Web-формат HTML и еще иллюстрированный текст
PDF. ... Сравнительно немного форматов употребляется на практике и для представления статических изображений. Их список практически исчерпывается пятью разновидностями: TIFF, JPEG, GIF, BMP и PNG
В связи с вышеизложенным, рекомендую использовать следующие форматы:
иллюстрированного текстаи электронных версий печатных документов - *.pdf;
Размещая документы в вышеназванных форматах, вы обеспечите в большинстве случаев их свободный доступ у большинства пользователей не только персональных компьютеров, но и на мобильных устройствах. Некоторые форматы были разработаны отдельными компаниями, например, *.docx, *.xlsx и другие, но существуют как платные, так и бесплатные программные продукты для работы с этими форматами.
Мир ПК- 20 лет. Год 1994-й / Ю. Стрельченко // Мир ПК, ноябрь № 11 2008, С. 86 - 88.