OCRopus(tm) — это современная система анализа документов и оптического распознавания текста, включающая подключаемый анализ макета, подключаемое распознавание символов, статистическое моделирование естественного языка и многоязычные возможности.
Система разрабатывается при щедрой поддержке Google и других организаций; основные разработчики находятся в исследовательской группе IUPR в исследовательском центре DFKI.