Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 3 2014 год

УДК: 004.89
Тематический анализ новостного кнастера как основа для автоматического аннотирования
А. А. Алексеев, аспирант, Московский государственный университет имени М. В. Ломоносова, e-mail: a.a.alekseew@gmail.com

Предлагается метод построения групп семантически близких слов и выражений, описывающих различных участников сюжета новостного кластера — тематических узлов. Метод основан на совместном использовании разнородных факторов схожести, таких как структурная организация новостных кластеров, анализ контекстов вхождения языковых выражений, а также информацию из предопределенных ресурсов. В качестве базиса для извлечения многословных выражений и построения тематических узлов используются контексты слов. Оценка предложенного метода проводится на основе применимости полученной структуры к задаче построения обзорных рефератов новостных кластеров.

Ключевые слова: искусственный интеллект, компьютерная лингвистика, автоматическое аннотирование, извлечение информации
Стр. 41–48