Знайте, Intuit, лекция, на работния процес в съвременния предприятие
документи на хартия в електронни технологии
За разлика от документи на хартиен носител, електронен могат да се обработват по-ефективно (копирани, разпространявани, съхранявани, и т.н.). До момента активно се развива превод технология на хартиени документи в електронен вид, с оглед прилагането на електронно управление на документи. Нека се спрем на използваните технологии и използваната терминология.
В първия етап на превода на документа в електронна форма, изработен тя сканира и създава електронно копие на документа като изображение. Снимки резултат от сканиране, наричани също образа на документа. Сканирането е началния етап на всяка система за автоматизирано сканиране на документи.
Процесът на сканиране може да се извърши чрез софтуер за обработка на изображение и визуален контрол на качеството се извършва (фиг. 3.6).
Фиг. 3.6. Схема преобразуване на хартиени документи в електронен формат
Когато става въпрос за промишлени входни документи, скенери обикновено предоставят редица допълнителни функции, като например възможността за документи с множество формати.
Обикновено, процесът на сканиране - етап на получаване на междинно съединение с електронен документ. Очевидно е, че с електронно изображение на документ, много по-лесно да се работи с от хартия (можете да копирате, изпращате по мрежата и т.н.).
Въпреки това, в повечето случаи, е само по себе си образ (имидж на документ) осигурява малко полза. С цел да бъде в състояние да редактирате документ, за да го потърсите или да използва своите фрагменти в подготовката на нови документи и т.н. Ние трябва да се преведат на полученото изображение в текстов документ, интуитивни офис програми. Ето защо, следващата задача е признание за сканирани документи.
Това изисква специален инструмент, който може да конвертира изображение в текст за редактиране електронен документ. такива инструменти общото име - оптично разпознаване на символи (оптично разпознаване на символи, OCR). С помощта на OCR-програма на компютъра може да "чете" в текста на сканирана страница, което го отделя от илюстрации и други елементи от дизайна, намери маса и "оправи" съдържанието им. И тогава се събере всичко отначало, пресъздаване на външния вид на страницата.
По отношение на превод на документи в електронна форма (входни документи в компютър), тяхното условно разделена на формално, формализирани и специфичен (фиг. 3.7).
Фиг. 3.7. Класификация на документи от гледна точка на спецификата на прехвърлянето на електронен носител
Официални документи - документ, в който предварително определена форма: местоположението на задължителните полета, в който се писмени данни. Например, форми, менителници, форми, каталози и т.н. Формализиран документ - документ за произволна форма: договори, писма и т.н. За да се включат такива специализирани документи, като карти и пръстови отпечатъци.
Превод на всеки един от тези видове документи има своите специфики. Ако са въведени снимките, достатъчно е електронно изображение, ако документът съдържа текст, трябва да се признае, ако е форматиран текст със снимки, трябва не само да признае текста, но и да се възстанови формата на документа, и ако това профил, а след това най-вероятно, в самия документ Нямам нужда, важно е само на информацията, съдържаща се в него. Така например, в обработката на листа за гласуване не е обикновено се изисква от документ, изображение, с достатъчно информация, за кого да гласува вот.
Въвеждане на официални документи
За да се обясни с какви проблеми се случи, когато влезе в официални документи, помислете за конкретен пример.
Да предположим, в офиса на хотела проведе проучване за оценка на равнището на живот на обслужване на различните етажи. Всеки жител на хотелската стая, останали в профила си, че трябва да попълни (фиг. 3.8).
Фиг. 3.8. Пример попълнен въпросник
Ако един месеца натрупаната няколко хиляди такива профили, лечението им е трудна задача. Очевидно е, че за да се получи изображения (цифрови изображения), тези профили че е по-лесно за съхранение, но не позволява да използвате компютъра за обработка на информацията.
В повечето форми на въвеждане задача (в този случай профилите) се преобразуват изображения на документа в един ред база данни, съдържаща съответната информация. Когато всички въпросници ще бъдат въведени в базата данни, ще бъде възможно да ги обработва и, например, да разберете какви грижи етаж е по-добре.
При попълването на формуляра за кандидатстване се изисква да отговарят на въпроси и да направи някои данни в поле услугата и програма задача във формата на вход - да се определят тези специални области, разпознават информацията в тях и да го въведе в базата данни. Когато тази функция влизане образува в компютъра е необходимостта в текст признание, попълнени на ръка.
Обикновено, ако формулярът трябва да бъде разпознато от компютъра, попълване помолени да въведете текстови отделни букви, и този текст се нарича страна отпечатан. handprinted технология за разпознаване на символи се наричат ICR (Intelligent Character Recognition). Признаване на handprinted герои е по-сложна задача в сравнение с признаването на отпечатани, както се изисква да се признае, символът вписан във форма на ръката, като се вземат предвид възможните варианти поради индивидуалните особености на ръкописен текст.
Фиг. 3.9. Шофиране трансфер хартиен носител в запис в база данни
проблем признаване при попълване на формулярите не са непременно свързани с OCR. Когато влезете форми могат да изискват признаването на различни етикети и знаци, за които също има своя мандат: OMR (Optical Марк Recognition). Например, вотът на избирателя е помолен да сложите кръст (или друг знак) пред имената на кандидатите, а задачата на компютъра - да се признае, има известно поле някакъв знак или не.