Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 2 2014 год

УДК: 004.656
Морфологические словари на основе бит-векторов
К. Е. Селезнёв 1,2, канд. техн. наук, вед. инж.-программист, e-mail: skostik@relex.ru, А. А. Владимиров 1, аспирант, e-mail: alcobass@gmail.com
1Воронежский государственный университет, 2ЗАО НПП РЕЛЭКС, г. Воронеж

Рассматривается новый способ построения модулей морфологического анализа. Предлагаемый подход незначительно уступает уже существующим реализациям по скорости и суммарному объему используемой памяти. Однако он позволяет проводить морфологический анализ слов, содержащих опечатки и преднамеренные ошибки. Такие функциональные возможности востребованы в системах, при использовании которых авторы текстов заинтересованы в неправильной обработке своих документов. Ярким примером подобных систем являются спам-фильтры.

Ключевые слова: морфологический анализ, опечатки, ошибки, искажения
Стр. 43–48