Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 10 2013 год
Приводится описание алгоритма автоматического предсинтаксического анализа текстов на русском и английском языках. Предложенный алгоритм программно реализован в системе предсинтаксического анализа, предназначенной для выделения лексических и нелексических единиц текста в целях дальнейшей их обработки синтаксическим и семантическим компонентами лингвистического процессора. Для выполнения морфологической разметки текста разработан способ представления морфологической информации словоформ английского языка в виде набора битовых полей. Разработанный алгоритм может использоваться при создании средств автоматической обработки текстов для широкого класса интеллектуальных систем.