Проведен анализ проблемы компьютерной обработки русскоязычного текста, нацеленной на выделение ключевых понятий в текстовом содержимом. В качестве объекта рассмотрения выбраны термины, вводимые в текст впервые, а также сопровождающие их определения. Рассмотрены исключительно статистические сред¬ства выделения понятий, выделены преимущества над словарными методами. Имеется направленность рабо¬ты на автоматическое реферирование. Выделены четыре ключевых этапа для решения проблемы, в которых использованы шаблонные конструкции, анализ слов и комбинаций, статистика встречаемости слов в тексте. Выделены формулы для получения вероятностных характеристик терминов и предложений, их определяющих. Сформирован алгоритм проведения анализа текста, приведены рекомендации по использованию данного алго¬ритма в разработке программных средств.
Библиографическая ссылка
Белая Т.И., Пасечник П.А. ВЫДЕЛЕНИЕ КЛЮЧЕВЫХ ПОНЯТИЙ В ТЕКСТОВОМ СОДЕРЖИМОМ С ИСПОЛЬЗОВАНИЕМ СТАТИСТИЧЕСКОЙ ОЦЕНКИ // Научное обозрение. Технические науки. – 2015. – № 1. – С. 73-73;URL: https://science-engineering.ru/ru/article/view?id=830 (дата обращения: 06.12.2024).
Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)
«Международный журнал прикладных и фундаментальных исследований»
ИФ РИНЦ = 0,593
«Международный журнал экспериментального образования»
ИФ РИНЦ = 0,425
«Научное Обозрение. Биологические Науки»
ИФ РИНЦ = 0,400
«Научное Обозрение. Медицинские Науки»
ИФ РИНЦ = 0,801
«Научное Обозрение. Экономические Науки»
ИФ РИНЦ = 0,871
«Научное Обозрение. Педагогические Науки»
ИФ РИНЦ = 0,733
«Научное Обозрение. Технические Науки»
ИФ РИНЦ = 0,695
«European journal of natural history»
ИФ РИНЦ = 0,301