Проведен анализ проблемы компьютерной обработки русскоязычного текста, нацеленной на выделение ключевых понятий в текстовом содержимом. В качестве объекта рассмотрения выбраны термины, вводимые в текст впервые, а также сопровождающие их определения. Рассмотрены исключительно статистические сред¬ства выделения понятий, выделены преимущества над словарными методами. Имеется направленность рабо¬ты на автоматическое реферирование. Выделены четыре ключевых этапа для решения проблемы, в которых использованы шаблонные конструкции, анализ слов и комбинаций, статистика встречаемости слов в тексте. Выделены формулы для получения вероятностных характеристик терминов и предложений, их определяющих. Сформирован алгоритм проведения анализа текста, приведены рекомендации по использованию данного алго¬ритма в разработке программных средств.
Библиографическая ссылка
Белая Т.И., Пасечник П.А. ВЫДЕЛЕНИЕ КЛЮЧЕВЫХ ПОНЯТИЙ В ТЕКСТОВОМ СОДЕРЖИМОМ С ИСПОЛЬЗОВАНИЕМ СТАТИСТИЧЕСКОЙ ОЦЕНКИ // Научное обозрение. Технические науки. 2015. № 1. С. 73-73;URL: https://science-engineering.ru/ru/article/view?id=830 (дата обращения: 19.05.2025).