АНАЛИЗ ПОДХОДОВ И ЛИНГВИСТИЧЕСКИХ СРЕДСТВ РЕШЕНИЯ ЗАДАЧИ ИЗВЛЕЧЕНИЯ УТВЕРЖДЕНИЙ ИЗ НЕФОРМАЛИЗОВАННЫХ ТЕКСТОВ
Главная статья
Аннотация
В статье рассматриваются основные виды извлекаемой информации. Описываются особенности извлечения из неформализованного текста именованных сущностей, отношений, фактов и событий. Приводиться анализ двух подходов: машинного обучения и подхода на правилах (инженерного подхода). Описаны плюсы и минусы данных подходов. Приводится обзор и анализ лингвистических средств, использующихся при подходе на правилах: лингвистических шаблонов, лингвистических правил и онтологий. Описаны достоинства и недостатки каждого из этих лингвистических средств. В статье представлен выводы о целесообразности использования онтологии для повышения точности и полноты извлечения утверждений из неформализованного текста.
Подробнее

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.
Неисключительные права на статью передаются журналу в полном соответствии с Лицензией Creative Commons By-NC-SA 4.0 (Международная)