В. О.
Толчеев, канд. техн. наук, доц.
Разработка и исследование новых модификаций метода ближайшего соседа
Проводится сравнительный анализ методов классификации текстовых документов.
Рассматривается метод ближайшего соседа как один из наиболее точных
методов для разбиения массива документальной информации на классы, обсуждаются
его преимущества и недостатки. Предложен ряд новых модификаций метода
ближайшего соседа, компенсирующих его основные недостатки, даны рекомендации
по выбору настраиваемых параметров методов. Кроме того, в работе большое
внимание уделяется проблеме обучения классификаторов на выборках фиксированного
размера и анализу их точностных свойств.
Tolcheev V. О.
Development and Analysis of New Modification of Nearest Neighbor
Method.
We conduct comparison of different methods of text categorization and
extract Nearest Neighbor Method (NNM) for more precisely investigation.
We develop new modifications of NNM, which improves its characteristics
and give recommendations how to choose parameters for our modifications.
Moreover in this article we make emphasis on machine learning problems
and quality of classifiers.
ОГЛАВЛЕНИЕ
Введение
Модели представления текстовых документов
Обзор методов классификации текстовой информации
Обучение классификаторов на конечных выборках
Сравнительный анализ методов классификации текстовой информации
Методы ближайшего соседа и его модификации
Метод k -ближайших соседей и взвешенный метод k-БС
Адаптивные методы ближайшего соседа
Модифицированные методы ближайшего соседа
Редуцированные методы ближайшего соседа
Обобщенный метод ближайшего соседа
Экспериментальные исследования модифицированного метода ближайшего соседа
(ММБС)
Заключение
Список литературы
Список обозначений
|