Linguistics: различия между версиями
Ilis (обсуждение | вклад) Нет описания правки |
|||
Строка 4: | Строка 4: | ||
== Лемматизация == | == Лемматизация == | ||
* '''{{PkgL|perl-Lingua-Stem}}''' — Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский {{discuss|FIXME:описание}} | |||
* {{PkgL|perl-Lingua-Stem}} Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский {{discuss|FIXME:описание}} | |||
== Морфологический и синтаксический анализ == | == Морфологический и синтаксический анализ == | ||
* '''{{PkgL|aot}}''' — Русский, Немецкий, Английский {{discuss|FIXME:описание}} | |||
* {{PkgL|aot}} Русский, Немецкий, Английский {{discuss|FIXME:описание}} | |||
== Лингвистическая аннотация, базы данных == | == Лингвистическая аннотация, базы данных == | ||
* '''{{PkgL|emdros}}''' — база данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД. | |||
* {{PkgL|emdros}} | |||
== Коллокации, анализ сочетаемости == | == Коллокации, анализ сочетаемости == | ||
* '''{{PkgL|perl-Text-NSP}}''' — пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста. | |||
* {{PkgL|perl-Text-NSP}} пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста. | * '''{{PkgL|perl-UCS}}''' — пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от {{PkgL|perl-Text-NSP}}. | ||
* {{PkgL|perl-UCS}} пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от {{PkgL|perl-Text-NSP}}. | |||
[[Категория:Пользователю]] | [[Категория:Пользователю]] | ||
[[Категория:Специализированный софт]] | [[Категория:Специализированный софт]] |
Версия от 08:00, 20 февраля 2009
Лингвистика и обработка естественного языка (Natural language processing)
Лемматизация
- perl-Lingua-Stem — Русский, Немецкий, Францунзский, Итальянский, Датский, Шведский, Португальский
Морфологический и синтаксический анализ
- aot — Русский, Немецкий, Английский
Лингвистическая аннотация, базы данных
- emdros — база данных для аннотированного текста. Оригинальная модель представления аннотированных данных (текста), гибкий язык запросов MQL. Утилиты для импорта из популярных форматов лингвистической аннотации. Графические пользовательские программы для наполнения и запросов к БД.
Коллокации, анализ сочетаемости
- perl-Text-NSP — пакет для статистического анализа N-грамм в тексте (Ted Pedersen). Не полностью корректно поддерживает unicode, поэтому есть проблемы при обработке русского текста.
- perl-UCS — пакет для статистического анализа коллокаций (Stefan Evert), UCSTools. Работает с данными от perl-Text-NSP.