Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 3 2014 год
Предлагается метод построения групп семантически близких слов и выражений, описывающих различных участников сюжета новостного кластера — тематических узлов. Метод основан на совместном использовании разнородных факторов схожести, таких как структурная организация новостных кластеров, анализ контекстов вхождения языковых выражений, а также информацию из предопределенных ресурсов. В качестве базиса для извлечения многословных выражений и построения тематических узлов используются контексты слов. Оценка предложенного метода проводится на основе применимости полученной структуры к задаче построения обзорных рефератов новостных кластеров.