CuneiForm (OpenOCR) — это программа для распознавания текста для печатных шаблонов. Рукописи или PDF-файлы программа распознавать не умеет, однако, кроме табличных структур. Языковая модель применима для 20 языков, а результаты можно использовать в виде текста HTML, RTF или ASCII для сохранения или экспорта непосредственно в Word или Excel. Эти шрифты стоят, а структура документа неизменна.
CuneiForm только недавно выпустила программное обеспечение с открытым исходным кодом. Он разработан российской компанией Cognitive Technologies и означает что-то вроде клинописи (от англ. cuneiform = клиновидный).
Только с апреля 2008 года возможно коммерческое использование, потому что исходный код доступен только с 2008 года. Автор Jussi Pakkanen существует портативная версия CuneiForm. Операционная система: Linux, BSD, Mac OS X и Windows.
Поддержка 20 языков: английский, немецкий, французский, испанский, итальянский, португальский, голландский, русский, смешанный русско-английский, украинский, датский, шведский, финский, сербский, хорватский, польский и другие.