Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 1 2015 год

УДК: 004.912
Опыт создания тематических словарей для рубрикации коротких описаний веб-сайтов
И. С. Кононенко1, 2, науч. сотр., e-mail: irina_k@cn.ru, Н. В. Саломатина1, 3, канд. физ.-мат. наук, науч. сотр., e-mail: nataly@math.nsc.ru, Е. А. Сидорова1, 2, канд. физ.-мат. наук, ст. науч. сотр., e-mail: lena@iis.nsk.su
1 Новосибирский государственный университет, 2 Институт систем информатики им. А. П. Ершова СО РАН, г. Новосибирск, 3 Институт математики им. С. Л. Соболева СО РАН, г. Новосибирск

Предложены методы построения мультиязычных тематических словарей, базирующиеся как на использовании автоматических средств для создания тематических коллекций и их статистической обработки, так и на экспертных знаниях, представленных в ресурсах типа тезаурусов и каталогов. Создаваемые словари предназначены для классификации коротких текстов (пользовательских запросов). Приведены характеристики построенных русско- и англоязычных словарей, а также результаты их тестирования на подборке запросов.

Ключевые слова: тематический словарь, тематическая коллекция текстов, метапоиск, тезаурус, каталог, классификация запросов, интернет-деятельность
Стр. 41–48
Работа выполнена в Новосибирском государственном университете при финансовой поддержке Министерства образования и науки Российской Федерации (договор № 02.G25.31.0054).