Исходный размер 1140x1600

OCR-A, OCR-B и развитие машиночитаемой типографики

Данный проект является учебной работой студента Школы дизайна или исследовательской работой преподавателя Школы дизайна. Данный проект не является коммерческим и служит образовательным целям
Проект принимает участие в конкурсе

Рубрикатор

(1) Концепция

(2) Исторический контекст 2.1 Развитие технологий распознавания символов 2.2 Первые машиночитаемые системы

(3) OCR-A и OCR-B 3.1 Создание OCR-A 3.2 Создание OCR-B 3.3 Сравнение OCR-A и OCR-B

(4) Машиночитаемая типографика и её применение 4.1 Банковские и государственные системы

(5) Заключение

(6) Источники

(1) Концепция

Машиночитаемая типографика — это направление в проектировании шрифтов, в котором форма символов создаётся не только для восприятия человеком, но и для стабильного автоматического считывания техническими устройствами. В отличие от традиционной типографики, где приоритетом являются визуальная читаемость, эстетика и ритм набора, здесь добавляется второй принцип — однозначность распознавания знаков машиной.

Возникновение машиночитаемых шрифтов связано с развитием вычислительных систем и автоматизации обработки данных в середине XX века. Банковские операции, документооборот, транспортные и идентификационные системы требовали быстрого и точного считывания информации без участия человека. Это привело к необходимости создания стандартизированных гарнитур, которые могли бы корректно интерпретироваться оптическими и механическими системами распознавания.

Ключевой особенностью таких шрифтов становится строгая формализация формы символов. Упрощается структура букв, устраняются декоративные элементы, увеличивается различимость похожих знаков (например, O и 0, I и 1, B и 8). Шрифт перестаёт быть исключительно культурным объектом и становится частью инженерной системы.

0

Пример гарнитур: OCR-A и OCR-B.

Параллельно с развитием OCR-систем появляются прикладные шрифтовые решения, используемые в реальных инфраструктурах обработки данных. Одним из наиболее известных примеров становится банковская система MICR, в которой специальные символы применяются для автоматического считывания информации с чеков и документов.

Исходный размер 1920x1158

Банковский чек с MICR-линейкой (E-13B)

Таким образом, машиночитаемая типографика фиксирует ключевой переход в истории шрифта: от визуальной коммуникации к системам, в которых текст становится одновременно графическим и вычислительным объектом. В рамках данного исследования рассматривается, как формировались принципы таких шрифтов, какие технологические ограничения определяли их форму и как эти решения повлияли на развитие современной цифровой типографики.

(2) Исторический контекст

Возникновение машинного чтения текста и систем кодирования информации

Развитие технологий машинной обработки текста формируется в двух параллельных направлениях. Первое связано с попытками заставить машины «распознавать» визуальную форму символов (OCR). Второе — с созданием систем, в которых текст заранее преобразуется в структурированный код и больше не требует визуального чтения.

Обе линии развиваются в середине XX века и вместе формируют основу машиночитаемой типографики как области на стыке дизайна и вычислительных систем.

Первая линия связана с анализом изображения текста и развитием OCR-технологий. В этом случае машина работает с визуальной формой символов и пытается интерпретировать её как знак.

Вторая линия развивается иначе: вместо распознавания изображения создаются системы, в которых информация уже заранее закодирована в формализованном виде. Машина работает не с текстом, а со структурой данных.

Наиболее ранним и массовым примером такой логики становятся перфокарты. В них информация существует не как изображение символов, а как расположение отверстий в материальном носителе. Машина не «читает» текст, а считывает физическую структуру данных.

Исходный размер 1280x968

Перфокарта — ранний носитель данных, использовавшийся до появления цифровых систем и технологий оптического распознавания.

Исходный размер 1280x617

Перфокарта как ранняя форма машиночитаемой записи данных. Информация кодируется расположением отверстий и считывается механическим способом.

Этот принцип развивается дальше в вычислительных системах середины XX века. Компьютеры, такие как ранние серии IBM, работают исключительно с заранее подготовленными форматами данных. Это означает, что вся информация должна быть приведена к строгой структуре ещё до попадания в машину. В этом контексте текст перестаёт быть самостоятельной визуальной сущностью и становится частью вычислительного процесса.

Исходный размер 1584x633

IBM 700/7000 series — ранние вычислительные системы, использовавшиеся для научных расчётов и обработки данных в середине XX века.

Исходный размер 1280x1014

IBM 700/7000 series

Особое положение занимает MICR (Magnetic Ink Character Recognition) — система, разработанная для банковской сферы. В отличие от OCR, где анализируется изображение, MICR использует заранее стандартизированные символы, которые считываются с помощью магнитных свойств специальной краски. Внешне это выглядит как типографика, но функционально представляет собой кодовую систему.

MICR становится важным переходным звеном между механическим кодированием (перфокарты) и оптическим распознаванием (OCR), поскольку сохраняет визуальную форму текста, но полностью подчиняет её техническому стандарту.

Исходный размер 3840x1155

MICR (Magnetic Ink Character Recognition): система машинного считывания символов в банковских чеках, где типографика функционирует как код.

Исходный размер 3840x387

пример MICR.

Исходный размер 3840x1781

Банковский чек с MICR-строкой: пример интеграции типографики в автоматизированную финансовую инфраструктуру.

С развитием OCR становится очевидно, что точность распознавания напрямую зависит от формы символов. Это приводит к созданию специализированных гарнитур, где каждый знак проектируется с учётом технических ограничений считывающих устройств.

Таким образом, к середине XX века формируются две принципиально разные стратегии работы с текстом. Первая — OCR — пытается сохранить текст как изображение и научить машину его интерпретировать. Вторая — системы кодирования (перфокарты, MICR) — полностью отказываются от изображения и заменяют его структурой данных.

Именно напряжение между этими подходами становится ключевым для дальнейшего развития машиночитаемой типографики. В последующих системах проектирования шрифтов возникает необходимость объединить обе логики: сохранить визуальную форму текста, но при этом обеспечить его однозначное машинное считывание.

(3) OCR-A и OCR-B

OCR-A и OCR-B представляют два подхода к проектированию машиночитаемой типографики. Их задача — не передача смысла текста, а создание формы символа, устойчивой к автоматическому распознаванию. Это переводит шрифт из области графического дизайна в область инженерного проектирования.

3.1 Создание OCR-A

Исходный размер 1258x613
Исходный размер 1258x613

Геометрическая структура OCR-A: символы построены из простых, унифицированных форм.

OCR-A был разработан в 1960–1970-х годах как стандартизированный шрифт для оптического распознавания текста (OCR). Его задача заключалась в том, чтобы обеспечить максимально стабильное считывание символов машинами при ограниченных вычислительных возможностях того времени.

В отличие от традиционных гарнитур, OCR-A проектировался не как визуальный стиль, а как технический стандарт. Каждый символ создавался с учётом необходимости минимизировать ошибки распознавания: формы упрощались, исключались декоративные элементы, усиливалась различимость похожих знаков.

0

Пример применения OCD-A

3.2 Создание OCR-B

OCR-B был разработан как развитие и одновременно альтернатива OCR-A, с целью снизить «жёсткость» ранних машиночитаемых шрифтов и сделать их более удобными для человеческого восприятия при сохранении машинной считываемости. Проект был стандартизирован в 1960–1970-х годах и стал важным шагом в попытке сбалансировать две задачи: техническую точность распознавания и нормальную визуальную читаемость текста.

Ключевое отличие OCR-B заключается в том, что он проектируется уже не как чисто инженерный код, а как компромисс между типографикой и системой распознавания. Символы становятся менее «механическими», получают более естественные пропорции и ближе к традиционной антикве, сохраняя при этом строгие требования стандарта.

Исходный размер 1258x613
Исходный размер 1258x613

Форма символов OCR-B: более органичная структура по сравнению с OCR-A при сохранении строгой стандартизации.

OCR-B разрабатывался при участии Adrian Frutiger, что стало ключевым моментом в его формировании. Подход Фрутигера заключался в том, чтобы сохранить читаемость для человека, не нарушая требований машинного распознавания. Это приводит к более «типографическому» характеру формы по сравнению с OCR-A.

Adrian Frutiger

Исходный размер 960x606

В отличие от OCR-A, где доминирует геометрическая жесткость, OCR-B допускает более естественные кривые и пропорции. Это делает его ближе к традиционной книжной типографике, но при этом он сохраняет функциональность для машинного считывания.

(3.3) Сравнение OCR-A и OCR-B: две модели машиночитаемой типографики

Исходный размер 1077x599

OCR-A и OCR-B часто рассматриваются как два варианта одного стандарта, но на практике они фиксируют два разных подхода к самой идее машиночитаемой типографики.

OCR-A возникает в момент, когда основная проблема — ошибки распознавания. Ранние OCR-системы плохо различали схожие формы символов, поэтому решение было радикальным: убрать из формы всё, что может быть интерпретировано неоднозначно. В результате шрифт становится максимально «искусственным» — буквы теряют связь с исторической типографикой и превращаются в набор простых геометрических конструкций.

OCR-B появляется позже и уже реагирует на другую проблему: неудобство использования таких шрифтов в реальных документах. Несмотря на точность распознавания, OCR-A плохо читается человеком и выглядит чужеродно в визуальной среде документов. Поэтому OCR-B вводит компромисс: сохраняется машинная считываемость, но форма возвращается ближе к привычной типографической логике.

OCR-A, OCR-B

OCR-A — стандартизированный машиночитаемый шрифт с упрощённой геометрией символов, разработанный для повышения точности оптического распознавания.

OCR-B — машиночитаемый шрифт, разработанный как баланс между машинной считываемостью и визуальной читаемостью.

(4) Машиночитаемая типографика и её применение

4.1 Банковские и государственные системы

Банковские чеки и финансовые документы

OCR-типографика в банковских документах строится на строгой сетке и одинаковых интервалах между символами. Главной задачей становится быстрое и точное считывание данных машиной, поэтому форма символов упрощается и стандартизируется.

0

OCR-A в стандартизированных формах обработки данных: использование в печатных документах для машинного считывания.

Паспорта и MRZ-зона

MRZ-зона в паспортах использует OCR-B благодаря высокой читаемости и стандартизированной структуре. Нижняя часть документа визуально отличается от основной информации и предназначена прежде всего для машинного считывания.

0

OCR-B в MRZ зоне.

Авиационные билеты

OCR-типографика в авиабилетах помогает организовать большое количество информации в компактной форме. Символы выстраиваются в плотные ритмичные блоки, удобные для автоматической обработки.

Исходный размер 800x332

OCR-шрифты применялись в системах регистрации и бронирования авиабилетов.

Исходный размер 2399x915

OCR-шрифты применялись в системах регистрации и бронирования авиабилетов.

Исходный размер 1200x1123

Почтовые системы

В почтовых системах OCR использовался для автоматической сортировки отправлений. Типографика становится частью логистической системы, где важны контрастность, точность и скорость распознавания.

Исходный размер 1733x1260

Подтверждение от Postbank о долгосрочном заказе с использованием OCR-A.

Исходный размер 1280x650

Пример OCR-B. Частично заполненная платежная карта Почты Германии, 1981 год.

(5) Заключение

Машиночитаемая типографика фиксирует переход текста из графической формы в элемент цифровой инфраструктуры. В системах OCR, MICR и последующих стандартах символ перестаёт быть только носителем языка и становится единицей машинной обработки данных.

Развитие этой области показывает смещение цели типографики: от визуальной выразительности к обеспечению однозначного считывания. OCR-A отражает этап максимального упрощения формы ради точности распознавания, OCR-B — попытку сохранить баланс между машинной и человеческой читаемостью. Дальнейшая стандартизация (ISO, ICAO) закрепляет эти принципы на уровне международных систем.

В итоге текст начинает функционировать не как автономное сообщение, а как структурированный код внутри технологических процессов.

(6) Источники

Источники изображений
1.

https://commons.wikimedia.org/wiki/Category:OCR-A (дата обращения 12.05.2026)

2.

https://commons.wikimedia.org/wiki/Category:OCR-B (дата обращения 12.05.2026)

3.

https://scanbot.io/blog/what-is-an-mrz/ (дата обращения 12.05.2026)

4.

https://passport-ocr.com/blog/what-is-passport-mrz (дата обращения 12.05.2026)

5.

https://epsys.no/ocr-readers (дата обращения 12.05.2026)

6.7.8.9.10.

https://about.usps.com/news/photos/ (дата обращения 18.05.2026)

11.12.13.

https://www.abbyy.com/finereader/ (дата обращения 18.05.2026)

14.15.

https://www.zebra.com/us/en/solutions.html (дата обращения 18.05.2026)

16.

https://www.dematic.com/en-us/solutions/ (дата обращения 18.05.2026)

17.18.

http://bse.uaio.ru/DE/0202.htm (дата обращения 18.05.2026)

19.

https://benschmidt.org/slides/Census.html (дата обращения 18.05.2026)

20.21.

https://en.wikipedia.org/wiki/OCR-B (дата обращения 18.05.2026)

22.23.

https://commons.wikimedia.org/wiki/Category:OCR-A (дата обращения 18.05.2026)

24.

https://commons.wikimedia.org/wiki/Category:OCR-B (дата обращения 18.05.2026)

OCR-A, OCR-B и развитие машиночитаемой типографики
Проект создан 21.05.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше