Linguistics
Версия от 23:23, 19 февраля 2009; KirillMaslinsky (обсуждение | вклад) (Новая: '''Лингвистика и обработка естественного языка (Natural language processing)''' {{discuss|FIXME:организовать в более общие ...)
Лингвистика и обработка естественного языка (Natural language processing)
Лемматизация
- Шаблон:Pkgl Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский
Морфологический и синтаксический анализ
- Шаблон:Pkgl Русский, Немецкий, Английский
Лингвистическая аннотация, базы данных
- Шаблон:Pkgl База данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.
Коллокации, анализ сочетаемости
- Шаблон:Pkgl пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
- Шаблон:Pkgl пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от Шаблон:Pkgl.