Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 1 2023 год

DOI: 10.17587/prin.14.42-50
УДК: 004.436.2
Проблемы автоматической обработки научных текстов на основе извлечения информации из энциклопедий соответствующих доменных областей
О. И. Бачище, магистрант, bachisheo@yandex.ru, Е. Н. Крючкова, канд. физ.-мат. наук, kruchkova_elena@mail.ru, Д. С. Шушаков, магистрант, shushakov4@yandex.ru, Алтайский государственный технический университет им. И. И. Ползунова, Барнаул

Обсуждены промежуточные результаты работы по созданию аспектно-ориентированного анализатора научных текстов в области фундаментальных дисциплин. В качестве обучающих текстов предложено использовать тематические энциклопедии. Предложена структура шаблонов извлекаемой информации, а также алгоритм формирования семантических зависимостей между специальными терминами. Процесс извлечения знаний в данной работе продемонстрирован на примере обработки математической энциклопедии. В рамках проведенного исследования построен семантический граф с введенными на нем отношениями между математическими терминами, реализован алгоритм поиска ключевых терминов, поведен выборочный анализ текстов статей по математике. Приведены результаты экспериментов.

Ключевые слова: аспектно-ориентированный анализ, научный лексикон, семантический граф, классификация научных текстов, автоматическая обработка неструктурированных текстов, обработка текстов на естественном языке, извлечение ключевых слов
Стр. 42–50
Ссылка для цитирования:
Бачище О. И., Крючкова Е. Н., Шушаков Д. С. Проблемы автоматической обработки научных текстов на основе извлечения информации из энциклопедий соответствующих доменных областей // Программная инженерия. 2023. Том 14, № 1. С. 42—50.