Text Mining Tool — бесплатная программа для извлечения текста из файлов следующих типов:
pdf, doc, rtf, chm, html без необходимости установки каких-либо других программ, таких как Word, Arcrobat и т. д.
Прелесть программы в том, что она очень просто работает почти со всеми распространенными формами документов. Сюда входят веб-страницы HTML, форматы документов DOC и RTF из Microsoft Word и других, таких как Open Office, файлы справки Windows, заканчивающиеся на CHM, и переносимые документы в формате PDF.