Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397
Номер 6 2015 год
Методы извлечения информации из текстов позволяют автоматически структурировать содержащуюся в документах информацию. Они находят применение в программных системах, осуществляющих обработку больших документальных массивов. В работе рассмотрена задача выявления упоминаний лиц в текстах. Исследованы возможности простых словарно-эвристических алгоритмов. Эффективность алгоритмов оценена на материале двух размеченных русскоязычных новостных коллекций.