Статья "Современные методы извлечения ключевой информации..."
Наименование статьи | Современные методы извлечения ключевой информации из нормативных документов |
---|---|
Страницы | 101 |
Аннотация | В статье демонстрируется подход к устранению сложностей, возникающих при анализе правовых документов в рамках экономических и междисциплинарных исследований. В условиях роста объема и постоянного обновления информации и (или) появления новой области исследований наиболее целесообразным на первом этапе является получение общей структуры всей коллекции документов, некая семантическая компрессия информации. Цель работы – продемонстрировать возможности применения методов анализа естественного языка для анализа нормативных документов, регламентирующих вопросы продовольствия и питания, в частности связанные с предупреждением развития железодефицитной анемии (ЖДА). Подход включает выделение ключевой информации объемных текстов (ключевых слов и предложений) на основе графового алгоритма TextRank. Важным звеном, способствующим познанию, является также визуализация семантических связей между словами внутри документов. По нашему мнению, именно комбинация смысловой компрессии и визуализации информации как крупный план текстовых документов, а также возможности дальнейшей детализации путем линейного чтения и анализа являются наиболее актуальным подходом в условиях перенасыщения информации и дефицита внимания. Особенно актуально активное внедрение методов текстовой аналитики для систем, которые не борются за внимание потребителей. Удобство именно таких систем существенно отстает при извлечении значимой информации. Приемы улучшения понимания больших объемов нормативных документов принесут существенную пользу аналитикам, ведущим экономические, юридические или мультидисциплинарные исследования. |
Ключевые слова | цифровая экономика, извлечение ключевых терминов, резюмирование, извлечение ключевых предложений, TextRank, bm‑25, графовый алгоритм, анемия, железодефицитная анемия. |
Журнал | Экономическая наука современной России |
Номер выпуска | 2 |
Автор(ы) | Милкова М. А., Неволин И. В., Пигорев Д. П. |