ocr cuneiform что это
Программа для оптического распознавания текста CuneiForm — описание, рекомендации по установке и использованию
Многим фирмам, организациям, компаниям приходится вводить в компьютер факсы, газеты,книги, машинописные тесты и так далее. На 2019 год существует удобная программа оптического распознавания тестов (OCR)- CuneiForm. Данная программа поставляется вместе с наиболее популярными моделями сканеров, МФУ по всему миру. С преобразованным текстом можно работать и редактировать почти в любых офисных пакетах.
Что это за программа, для чего она нужна?
Данная программа разработана для распознания и преобразования копии бумажных документов в их электронные версии. Достаточно просто положить бумагу с текстом или изображением в сканер и через несколько секунд вы получите готовый результат в текстовом редакторе.
Одно из преимуществ cuneiform — это шрифтонезависимость. В системе используется технология самообучения на базе адаптивного распознавания символов. То есть, программа «знает» правила написания букв и требует наличия каких-либо эталонов или специального обучения. Не распознает только рукописный текст и стилизованный под него (например готический шрифт).
Предлагаем посмотреть видео о программе CuneiForm:
Возможности и плюсы
С картинками софт себя поведет, как вы сами захотите: можно проигнорировать изображение, либо сохранить в отдельном документе в черно-белом, сером или цветном варианте.
Как установить?
Программа находится в свободном и бесплатном доступе, совместима с Windows, Linux, Mac Os X. Поддерживает интерфейс на русском языке, включает в себя себя две программы для одиночной и пакетной обработки электронных документов.
На 2019 год последняя версия обновления 12.1 от 24.08.2016, поэтому рекомендовано скачивать именно ее.
Как пользоваться?
По сути программа CuneiForm представляет собой сборник приложений, которые уже давно используются для оптического распознавания текстов и изображений. Но положительных сторон у этого софта хватает. Довольно оптимизированный проект, поддерживающих более 20 языков, а так же смесь английского и русского, ко всему этому продукт не является коммерческим. Встроенные редакторы порадуют новичков, так как не нужно будет использовать сторонние программы для правки и редактирования текстов.
Скачать бесплатно русскую версию Cuneiform
CuneiForm (кьюниформ — клинопись) – бесплатная программа для сканирования и распознавания текстов, разработанная российской компанией Cognitive Technologies. Первый релиз программы состоялся в далеком 1993 году. С того времени в приложение было внесено более 1000 изменений, благодаря которым удалось добиться потрясающего качества сканирования и высокой производительности, а также стабильной работы этого приложения. Скачать бесплатно русскую версию Cuneiform можно на данной странице, кликнув на зеленую кнопку.
Изначально система поставлялась в комплекте со многими известными марками сканеров, например: Corel Draw, Hewlet-Pachard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti.
В 2008 компания Cognitive Technologies открыла исходный код программы, тем самым разработчики официально присвоили своему детищу статус freeware, что конечно же увеличило популярность CuneiForm в несколько раз. Это связано с тем, что по своим функциональным особенностям, данное приложение уступает только ABBYY Finereader, а так как Finereader является платным приложением, то получается с обретением статуса freeware, система CuneiForm вышла на первое место и по большому счету избавилась от конкурентов.
CuneiForm позиционируется как отдельная система, предназначенная для сканирования и распознавания бумажных и электронных копий документов (OCR), с возможностью сохранения структуры документа и стилей шрифтов. Рассматривая данный инструмент, нужно обязательно отметить поддержку пакетного режима работы, который позволяет обработать огромное количество информации, совершая при этом минимальное количество действий. Программа поддерживает более 20 известных языков мира, среди которых имеются следующие:
Также программа обладает поддержкой смеси русского и английского языка.
Возможности и особенности программы:
Наше мнение о CuneiForm
Мы тщательно протестировали данный инструмент перед тем как добавить его в список рассматриваемых нами приложений. В результате этого тестирования программа показала себя только с самой лучшей стороны. Со всеми поставленными задачами приложение отлично справилось, во время работы сбоев или зависаний замечено не было. Многие пользователи называют данное приложением бесплатным аналогом FineReader, мы считаем, что эти слова имеют некий смысл, так как CuneiForm является действительно качественным продуктом.
Если у вас появились проблемы при скачивании CuneiForm или возникли вопросы при использовании этой программы, обязательно пишите о них в комментариях, мы ответим каждому!
Видеообзор CuneiForm
Cuneiform что это за программа
Рано или поздно, все кто часто работает с офисными программами, сталкиваются с типичной задачей — отсканировать текст с книги, журнала, газеты, просто листочков, а затем перевести эти картинки в текстовый формат, например, в документ Word.
Чтобы это сделать необходим сканер и специальная программа для распознавания текста. В этой статье пойдет речь о бесплатном аналоге FineReader — CuneiForm (о распознавании в FineReader — см. в этой статье).
1. Особенности программы CuneiForm, возможности
CuneiForm
Программа для распознавания текста с открытым исходным кодом. К тому же, работает во всех версиях Windows: XP, Vista, 7, 8, что радует. Плюс к этому добавьте полный русский перевод программы!
Плюсы:
— распознавание текста на 20 самых популярных языках мира (английский и русский само собой входит в это число);
— огромная поддержка различных печатных шрифтов;
— проверка по словарю распознанного текста;
— возможность сохранения результаты работы в нескольких вариантах;
— сохранение структуры документа;
— отличная поддержка и распознавание таблиц.
Минусы:
— не поддерживает слишком большие документы и файлы (более 400 dpi);
— не поддерживает на прямую некоторые типы сканеров (ну это не страшно, в комплект к драйверам сканера идет и спец. программа для сканирования);
— дизайн не блещет (но кому он нужен, если программа в полной мере решит задачу).
2. Пример распознавания текста
Будем считать что необходимые картинки для распознавания вы уже получили (отсканировали там, или скачали в интернете книгу в формате pdf/djvu и достали из них нужные картинки. Как это сделать — см. в этой статье).
1) Открываем требуемую картинку в программе CuineForm ( файл/открыть или « Cntrl+O «).
2) Чтобы приступить к распознаванию — нужно сначала выделить различные области: текста, картинок, таблиц и пр. В программе Cuneiform это можно сделать не только в ручную, но и автоматически! Для этого щелкните по кнопке « разметка » в верхней панели окна.
3) Спустя 10-15 сек. программа автоматически подсветит все области различными цветами. Например, область текста выделяется синим цветом. Кстати, подсветила она все области правильно и довольно быстро. Честно говоря, не ожидал от нее такой быстрой и правильной реакции…
4) Для тех, кто не доверяет автоматической разметке, можно воспользоваться и ручной. Для этого есть панелька инструментов (см. картинку ниже), благодаря которой можно выделить: текст, таблицу, картинку. Передвинуть, увеличить/уменьшить начальное изображение, подрезать края. В общем, неплохой набор.
5) После того, как все области были размечены, можно приступить к распознаванию. Для этого просто щелкните по одноименной кнопке, как на картинке ниже.
6) Буквально через 10-20 сек. перед вами откроется документ в Microsoft Word с распознанным текстом. Что интересно, в тексте для этого примера, ошибки, конечно были, но их крайне не много! Тем более, учитывая в каком невзрачном качестве был исходный материал — картинка.
По скорости и качеству вполне сравнимо с FineReader!
3. Пакетное распознавание текста
Эта функция программы может пригодится, когда вам нужно распознать не одну картинку, а сразу несколько. Ярлык для запуска пакетного распознавания, обычно, спрятан в меню « пуск «.
1) После открытия программы, вам нужно создать новый пакет, либо открыть ранее сохраненный. В нашем примере — создадим новый.
2) В следующем шаге даем ему название, желательно такое, чтобы и через полгода вспомнить что в нем сохранено.
3) Далее выбираете язык документа (русско-английский), указываете, есть ли в вашем отсканированном материале картинки и таблицы.
4) Теперь нужно указать папку, в которой расположены файлы для распознавания. Кстати, что интересно, программа сама найдет все картинки и другие графические файлы, которые она сможет распознать и добавить их в проект. Вам же останется удалить лишние.
5) Следующий шаг не важен- выбираете что делать с исходными файлами, после распознавания. Рекомендую выбрать галочку «ничего не делать».
6) Осталось лишь выбрать формат, в котором будет сохранен распознанный документ. Есть несколько вариантов:
— rtf — файл из документа word, открывается всеми популярными офисами (в том числе и бесплатными, ссылка на программы);
— txt — текстовый формат, в нем можно сохранить только текст, картинки и таблицы нельзя;
— htm — гипертекстовая страничка, удобно, если вы сканируете и распознаете файлы для сайта. Его и выберем в нашем примере.
7) После нажатия кнопки « готово » запустится процесс обработки вашего проекта.
8) Программа работает довольно таки быстро. После распознания перед вами появится вкладка с файлами htm. Если щелкнуть по такому файлу запуститься браузер, где вы сможете увидеть результаты. Кстати, пакет можно сохранить для дальнейшей работы с ним.
9) Как видно, результаты работы весьма впечатляющие. Картинку программа легко распознала, а под ней легко распознала текст. При том что программа и бесплатна — то вообще супер!
4. Выводы
Если вы часто не занимаетесь сканированием и распознаванием документов, то покупать программу FineReader, наверное, не имеет смысла. С большинством задач легко справляется CuneiForm.
С другой стороны, есть у нее и минусы.
Во-первых, слишком мало инструментов для редактирования и проверки получившегося результата. Во-вторых, когда приходится распознавать много картинок — то в FineReader удобнее сразу видеть в колонке справа всё, что добавлено в проект: быстро удалять лишнее, вносить правки пр. И третье, на документах совсем уж плохого качества, CuneiForm проигрывает в качестве распознавания: приходится документ доводить до ума — править шибки, проставлять знаки препинания, кавычки и т.д.
На этом все. А вы знаете какую-нибудь еще достойную бесплатную программу для распознавания текста?
CuneiForm — бесплатная программа для распознавания текста
CuneiForm — бесплатная система оптического распознавания текста на изображениях и отсканированных документах, с возможностью дальнейшего редактирования в офисных пакетах и текстовых редакторах.
Назначение и возможности программы CuneiForm OpenOCR
Пользователи часто задаются вопросом: Как отсканированный документ перевести в формат Word? Как раз для этого и предназначен пакет. Приложение позволяет найти и распознать текст на изображениях полученных со сканера, цифровых фото-, видео-, веб-камер, мобильных телефонов, планшетов или скриншотов, и с сохранением форматирования данных перевести документ в редактируемый формат.
Приведем простой пример. Имеется графический файл содержащий фотографию газетной заметки, которую необходимо перевести в текст и отредактировать.
Запустите программу и зайдите в верхнем меню в пункт «Файл», а затем «Открыть».
Откройте меню «Файл» в CuneiForm
В появившейся форме выберите путь к файлу и сам файл.
OpenOCR — выберите необходимый файл
После того как изображение будет открыто в программе, нажмите на пункт меню с изображением циркуля, и в выпадающем меню выберите пункт «Авторазметка»
CuneiForm — пункт меню Авторазметка
Программа в автоматическом режиме выделит блоки для дальнейшего распознавания, пользователь также может создавать, изменять и удалять блоки самостоятельно, либо корректировать результаты работы автоматического режима.
После того как все блоки подготовлены, нажмите на пиктограмму с изображением очков, а в появившемся выпадающем меню пункт «Распознать»
Распознавание текста в CuneiForm OpenOCR
Полученный CuneiForm результат в программе Writer из пакета LibreOffice
Открыть и отредактировать RTF файл можно практически в любом текстовом редакторе, либо офисном пакете, например, в популярных бесплатных LibreOffice или OpenOffice, загрузить которые Вы так же можете на соответствующих страницах нашего ресурса.
Так же Вам может быть полезна программа для сканирования VueScan, позволяющая работать старым сканерам с новыми операционными системами и имеющая дополнительные возможности по сравнению со стандартными драйверами сканера.
CuneiForm | |
---|---|
Тип | оптическое распознавание символов |
Автор | Cognitive Technologies |
Разработчики | команда CuneiForm-Linux |
Написана на | C, C++ |
Интерфейс | командная строка |
Операционная система | Linux, Mac OS X и др. UNIX-подобные |
Первый выпуск | 1996 |
Последняя версия | 1.1.0(19 апреля 2011 [1] ) |
Создаваемые форматы файлов | HOCR |
Состояние | активное |
Лицензия | BSD-подобная лицензия Cognitive Technologies [2] |
Сайт | launchpad.net/cuneiform-… |
OCR CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с наиболее популярными моделями сканеров, МФУ и ПО в России и мире: Corel Draw, Hewlet-Pachard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др. В 2008 году Cognitive Technologies открыла исходные коды OCR CuneiForm.
Содержание
Особенности [ править | править код ]
CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов.
Список языков, поддерживаемых системой:
История [ править | править код ]
1993 год — Cognitive Technologies заключила OEM-контракт с канадской корпорацией Corel Corporation, по которому библиотека распознавания Cognitive встроена в популярный издательский пакет Corel Draw 3.0 (и последующие версии). [4]
1994 год — Заключен контракт с Hewlett-Packard по комплектации сканеров, поставляемых в Россию OCR CuneiForm. Это первый контракт HP с российским разработчиком ПО. [5] [6] [7] [8]
1995 год — Заключен контракт с японской корпорацией Epson о комплектации сканеров OCR CuneiForm. [9] Подписан OEM-контракт с крупнейшим мировым производителем факсимильных аппаратов, лазерных принтеров, сканеров и другого офисного оборудования — Brother Corporation. Согласно договору новый роликовый сканер Brother IC-150 будет комплектоваться программным обеспечением Cognitive для сканирования, распознавания по всему миру.
1996 год — Подписан ОЕМ-контракт с одним из крупнейших мировых производителей мониторов, факсимильных аппаратов, лазерных принтеров, многофункциональных устройств и другого офисного оборудования — Samsung Information Systems America. [10] Согласно договору новое многофункциональное устройство Samsung OFFICE MASTER OML-8630A будет продаваться в комплекте с системой оптического распознавания символов Cognitive Cuneiform LE по всему миру.
Адаптивное распознавание — метод, основанный на комбинации двух видов алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, то есть используется динамическая настройка (адаптация) на конкретные входные символы. Таким образом, метод совмещает универсальность и технологичность бесшрифтового подхода и высокую точность распознавания шрифтового, что позволяет кардинальным образом повысить качество распознавания.
1997 год — В системе CuneiForm впервые применены технологии, основанные на нейронных сетях. Алгоритмы, использующие нейронные сети для распознавания символов, строятся следующим образом. Поступающее на распознавание изображение символа (растр) приводится к некоторому стандартному размеру (нормализуется). Значения яркости в узлах нормализованного растра используются в качестве входных параметров нейронной сети. Число выходных параметров нейронной сети равняется числу распознаваемых символов. Результатом распознавания является символ, которому соответствует наибольшее из значений выходного вектора нейронной сети.
2001 год — Подписан OEM-контракт о комплектации оборудования, производимого компанией Canon (сканеры, многофункциональные устройства), программным обеспечением Cognitive Technologies (OCR CuneiForm) на территории стран Восточной Европы.
Последняя версия OpenSource версии для Windows не обновлялась с февраля 2009.
CuneiForm для Windows
ABBYY Screenshot Reader — простая и удобная программа для создания снимков любой области экрана с.
Отзывы о программе CuneiForm
Андрей про CuneiForm 12 [15-12-2019]
не распознаёт таблицы Плохо распознаёт
2 | 4 | Ответить
Rafael про CuneiForm 12 [01-06-2019]
Юрий Питерских в ответ Rafael про CuneiForm 12 [23-06-2021]
А как же! Жди «коня»! Шутка:)
НЕОБХОДИМО:
1) ВКЛ режим совместимости с Виндовс-8 (Щёлкнуть правой кнопкой мыши на установленном приложении от CunieForm. У меня это setup_OpenOCR_CuneiForm_rus(WINDOWS-XP,VI,7).exe. Вкладка №2 «Совместимость». Область «Режим совместимости». Поставить галку: «Запустить в режиме совместимости с:» и далее выбрать «WINDOWS 8».)
2) Далее нажать на значок проги и соглашаться с требованиями программы. Всё!
2 | | Ответить
EvgeTrofi про CuneiForm 12 [31-10-2018]
В пакетном режиме работает? Из другой программы можно вызвать, используя библиотеку dll или ocx?
2 | 6 | Ответить
Андр про CuneiForm 12 [12-06-2016]
Без проблем установилась на Win-7×64.
Текст на четких скриншотах jpg распознает безупречно.
Сохранять можно в rtf, txt, html.
Рекомендую!
7 | 4 | Ответить
Макс про CuneiForm 12 [23-01-2016]
Это лажа. При попытке открытия любого PDF файла вешает систему.
6 | 19 | Ответить
Скачать КьюниФорм
Обзор OCR CuneiForm
Первый релиз программы состоялся еще в далеком 1993 году, с тех пор ее разработчики не раз усовершенствовали алгоритмы обработки и «научили» софт определять символы, написанные на 23 языках мира. Особого внимания заслуживает возможность распознавания английских и русских данных на одном загруженном файле. Алгоритмы CuneiForm были интегрированы во многие многофункциональные устройства Samsung, Canon и Xerox. Интересно, что в 1996 году в программе впервые в мире были применен способ адаптивного распознавания, ставший в дальнейшем эталоном для индустрии. Год спустя в CuneiForm уже использовались механизмы на основе нейронных сетей, затем были добавлены специальные методы для корректного переноса данных с печатных таблиц.
OCR CuneiForm можно скачать бесплатно с русской версией словарей для компьютеров на основе ОС Windows 7-10 32/64 bit с нашего либо официального сайта.
Особенности
Программа для распознавания текста. CuneiForm может захватывать материал с подключенных сканеров, а также импортировать информацию из всех распространенных форматов изображений. Приложение способно автоматически определять границы для текста, который следует обработать, после распознавания позволяет внести правки в печатные данные с помощью редактора Microsoft Word.
Мультиязычность
Поддержка 23 языков, возможность распознавания англо-русского текста
Выбор разметки
Ручное указание областей для распознавания
Автоматизация
Определение разметки и экспорт в авторежиме
Форматирование
Указание единых параметров для сохранения текста
Бесплатность
Доступность всех функций без финансовых вложений и регистрации
Интеграция
Редактирование текста с помощью MsWord прямо в окне CuneiForm
OCR CuneiForm в рейтинге «Программы для сканирования документов»
Скачать КьюниФорм бесплатно
Скачать CuneiForm для Windows 10, 7, 8, XP
Бесплатная версия: 12
Рекомендуем! InstallPack | Стандартный установщик | Официальный дистрибутив OCR CuneiForm | Тихая установка без диалоговых окон | Рекомендации по установке необходимых программ | Пакетная установка нескольких программ |
---|
SoftOK рекомендует InstallPack, с его помощью вы сможете быстро установить программы на компьютер, подробнее на сайте.