Статья "Современные методы извлечения ключевой информации..."

Наименование статьиСовременные методы извлечения ключевой информации из нормативных документов
Страницы101
АннотацияВ статье демонстрируется подход к устранению сложностей, возникающих при анализе правовых документов в рамках экономических и междисциплинарных исследований. В условиях роста объема и постоянного обновления информации и (или) появления новой области исследований наиболее целесообразным на первом этапе является получение общей структуры всей коллекции документов, некая семантическая компрессия информации. Цель работы – ​продемонстрировать возможности применения методов анализа естественного языка для анализа нормативных документов, регламентирующих вопросы продовольствия и питания, в частности связанные с предупреждением развития железодефицитной анемии (ЖДА). Подход включает выделение ключевой информации объемных текстов (ключевых слов и предложений) на основе графового алгоритма TextRank. Важным звеном, способствующим познанию, является также визуализация семантических связей между словами внутри документов. По нашему мнению, именно комбинация смысловой компрессии и визуализации информации как крупный план текстовых документов, а также возможности дальнейшей детализации путем линейного чтения и анализа являются наиболее актуальным подходом в условиях перенасыщения информации и дефицита внимания. Особенно актуально активное внедрение методов текстовой аналитики для систем, которые не борются за внимание потребителей. Удобство именно таких систем существенно отстает при извлечении значимой информации. Приемы улучшения понимания больших объемов нормативных документов принесут существенную пользу аналитикам, ведущим экономические, юридические или мультидисциплинарные исследования.
Ключевые словацифровая экономика, извлечение ключевых терминов, резюмирование, извлечение ключевых предложений, TextRank, bm‑25, графовый алгоритм, анемия, железодефицитная анемия.
ЖурналЭкономическая наука современной России
Номер выпуска2
Автор(ы)Милкова М. А., Неволин И. В., Пигорев Д. П.