Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 10 2013 год

УДК: 004.89:004.912
Предсинтаксический анализ русско-английских текстов
A. А. Харламов 1, д-р техн. наук, стар. науч. сотр., e-mail: kharlamov@analyst.ru, Т. В. Ермоленко 2, канд. техн. наук, науч. сотр., Г. В. Дорохина 2, млад. науч. сотр., А. О. Журавлев 2, специалист,
1Институт высшей нервной деятельности и нейрофизиологии РАН, г. Москва
2Институт проблем искусственного интеллекта, г. Донецк

Приводится описание алгоритма автоматического предсинтаксического анализа текстов на русском и английском языках. Предложенный алгоритм программно реализован в системе предсинтаксического анализа, предназначенной для выделения лексических и нелексических единиц текста в целях дальнейшей их обработки синтаксическим и семантическим компонентами лингвистического процессора. Для выполнения морфологической разметки текста разработан способ представления морфологической информации словоформ английского языка в виде набора битовых полей. Разработанный алгоритм может использоваться при создании средств автоматической обработки текстов для широкого класса интеллектуальных систем.

Ключевые слова: автоматическая обработка текста, предсинтаксический анализ, графематический анализ, морфологический анализ, базовые элементы текста
Стр. 37–47
Статья написана в ходе выполнения работ по проекту "Исследование и разработка программного обеспечения понимания неструктурированной текстовой информации на русском и английском языках на базе создания методов компьютерного полного лингвистического анализа", грант Минобрнауки 2012-1.4-07-514-0018.