Whoosh — это быстрая, многофункциональная библиотека полнотекстового индексирования и поиска, реализованная на чистом Python. Программисты могут использовать его, чтобы легко добавлять функции поиска в свои приложения и веб-сайты. Каждая часть работы Whoosh может быть расширена или заменена в соответствии с вашими потребностями.
Некоторые из функций Whoosh включают в себя:
Питонический API. Чистый Python. Никаких компиляций или бинарных пакетов, никаких загадочных сбоев. Полевая индексация и поиск. Быстрое индексирование и поиск — быстрее, чем любое другое известное мне решение для поиска на чистом Python. См. Контрольные показатели. Подключаемый алгоритм подсчета очков (включая BM25F), анализ текста, хранение, формат публикации и т. д. Мощный язык запросов. Качественная проверка орфографии на чистом Python (насколько мне известно, единственная).Whoosh может быть полезен в следующих случаях:
Везде желательно решение на чистом Python, чтобы избежать необходимости создавать/компилировать собственные библиотеки (или заставлять пользователей создавать/компилировать их). В качестве исследовательской платформы (по крайней мере, для программистов, которым Python легче читать и работать с ним, чем с Java;) Когда простой в использовании интерфейс Pythonic для вас важнее скорости. Если ваше приложение может эффективно использовать одно глубоко интегрированное решение для поиска/поиска, вы можете полагаться на то, что просто будете там, а не на двух разных поисковых решениях (простое/медленное/доморощенное интегрированное, индексированное/быстрое/внешнее бинарное зависимое решение в качестве вариант).Whoosh был создан и поддерживается Мэттом Чапутом. Первоначально он был создан для использования в интерактивной справочной системе программы 3D-анимации Houdini от Side Effects Software. Side Effects Software Inc. любезно согласилась открыть исходный код.