Автоматическое суммирование текста — это метод, при котором компьютерная программа суммирует документ. Текст вводится в компьютер и возвращается выделенный (обобщенный) текст. Open Text Summarizer — это инструмент с открытым исходным кодом для суммирования текстов. Программа читает текст и решает, какие предложения важны, а какие нет. Он поставляется с Ubuntu, Fedora и другими дистрибутивами Linux. OTS поддерживает множество (25+) языков, которые настраиваются в XML-файлах. Несколько академических публикаций сравнивали его и хвалили.
OTS — это и библиотека, и инструмент командной строки. Текстовые процессоры, такие как AbiWord и KWord, могут связываться с библиотекой и обобщать документы, в то время как инструмент командной строки позволяет обобщать текст на консоли. Программа может распечатать итоговый текст как текст или HTML. Если HTML, важные предложения выделены. Программа многоязычна и работает с кодировкой UTF-8. Open Text Summarizer обобщает тексты на английском, немецком, испанском, русском, иврите, эсперанто и других языках. Для поддержки большего количества языков или настройки существующих языков можно просто отредактировать XML-файл правил.