ImageTrans — это компьютерный инструмент для перевода изображений и комиксов. Он может автоматически находить текстовые области и выполнять операции OCR, используя современную технологию OCR и доморощенный алгоритм слияния и обнаружения текстовых областей, который специально разработан для комиксов (также вебтун, манга, манхва и манхуа). Исходный текст может быть автоматически стерт, а перевод вставлен заново.
ImageTrans можно использовать не только как переводчик изображений, но и как средство чтения изображений, расшифровщик изображений и аннотатор глубокого обучения.
ImageTrans является результатом моей магистерской диссертации: «Проектирование и внедрение автоматизированного средства перевода комиксов».
Функции
Точное обнаружение текстовой области, он может использовать естественное обнаружение текста сцены, обнаружение объектов и эвристический метод для обнаружения текста.
Точное распознавание текста
Поддержка нескольких OCR
Он поддерживает онлайн-сервисы распознавания текста, такие как Google, Baidu, Sogou и Youdao, а также автономные механизмы распознавания текста, такие как Tesseract, PaddleOCR и встроенный механизм распознавания текста Windows 10. См. FAQ по использованию и список поддерживаемых OCR.
Кроме того, вы также можете вызывать другие службы OCR, написав плагины.
Ассистент перевода
Он может вызывать различные механизмы машинного перевода. Он также поддерживает память переводов, согласование корпусов, управление терминами и другие общие функции программного обеспечения для автоматизированного перевода. Он имеет поисковую систему слов со звуковыми эффектами, предназначенную для перевода комиксов.
Точное удаление текста и повторная вставка
Программное обеспечение может использовать инструменты и алгоритмы, такие как Sickzil-Machine, бинаризация, PatchMatch, для создания текстовой маски и удаления текста. Он может пополнить перевод и автоматически настроить размер шрифта в соответствии с положением и площадью текстовых областей. Все вышеперечисленные операции поддерживают ручную настройку.
Совместимость
Он может использовать сценарии для сохранения результатов в виде PSD-файлов Photoshop.
Он может экспортировать данные в файлы Excel, Word, XLIFF или импортировать данные из этих файлов.