Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 3 2013 год

УДК: 519.246
Алгоритм оптимального расположения названий коллекции документов
A. А. Адуенко, студент, Московский физико-технический институт, e-mail: aduenko1@gmail.com, B. В. Стрижов, канд. физ.-мат. наук, науч. сотр., Вычислительный центр им. А. А. Дородницына РАН, г. Москва, e-mail: strijov@ccas.ru

Исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использован алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.

Ключевые слова: визуализация, тематическая классификация, коллекция документов, функция потерь, алгоритм BFGS
Стр. 21–25
Работа выполнена при поддержке Министерства образования и науки РФ в рамках Государственного контракта 07.524.11.4002