МЕТОД ОЦЕНКИ КАЧЕСТВА МАШИННОГО ПЕРЕВОДА НА ОСНОВЕ ФРАЗОВОГО ВЫРАВНИВАНИЯ

Козина А.В. 1, Черепков Е.А. 1, Белов Ю.С. 1

1 Калужский филиал ФГБОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)»

В настоящее время одним из наиболее эффективных подходов в области разработки систем машинного перевода (МП) является подход на основе выравнивания фраз. Методы на основе такого подхода используют непрерывные последовательности слов в качестве единиц перевода. Выравнивание потенциально может улучшить качество систем машинного перевода, поскольку учитывает общие отношения, порядок, контекст между словами. В данной статье предлагается подход к оценке качества машинного перевода с использованием фразового выравнивания. Вводятся функции выравнивания в пределах фразы и за её границами, а также функция покрытия, функция корреляции между частотами исходных и целевых фраз. На основе предложенных функций строится итоговая модель оценки машинного перевода. Проводится тестирование разработанной модели. Определяется наиболее подходящая размерность N-грамм – N последовательных слов для каждой фразы выравнивания. Проводится сравнение данного подхода с традиционными метриками оценки качества перевода, такими как BLEU, GTM, TER и METEOR. Результаты показывают, что предлагаемый подход имеет наилучшую производительность, а также для набора данных WMT 2013 обеспечивает повышение точности не менее 13,92?% по сравнению с традиционными метриками.

Статья в формате PDF

600 KB

оценка качества машинного перевода

выравнивание в машинном переводе

выравнивание на основе слов

выравнивание на основе фраз

BLEU

GTM

TER

METEOR

1. Козина А.В., Черепков Е.А., Белов Ю.С. Обзор подходов к машинному переводу // Международный студенческий научный вестник. 2018. № 6. [Электронный ресурс]. URL: https://www.eduherald.ru/ru/article/view?id=19408 (дата обращения: 25.12.2019).

2. Koehn P. Statistical Machine Translation, 1st ed. New York, NY, USA: Cambridge University Press, 2010. P. 488.

3. Ond?rej Bojar, Rajen Chatterjee, Christian Federmann, Barry Haddow, Matthias Huck, Chris Hokamp, Philipp Koehn, Varvara Logacheva, Christof Monz, Matteo Negri, Matt Post, Carolina Scarton, Lucia Specia, and Marco Turchi. Findings of the 2015 workshop on statistical machine translation. In Proceedings of the Tenth Workshop on Statistical Machine Translation. Lisbon, Portugal // Association for Computational Linguistics. 2015. vol. Proceedings of the Tenth Workshop on Statistical Machine Translation. P. 1–46. [Electronic resource]. URL: https://www.aclweb.org/anthology/W15-3001 (date of access: 25.12.2019).

4. Phillips B. Cunei: Open-Source Machine Translation with Relevance-Based Models of Each Translation Instance // Machine Translation. 2011. vol. 25. no. 2. P. 161–177. DOI: 10.1007/s10590-011-9109-6.

5. Козина А.В., Черепков Е.А., Белов Ю.С. Автоматические метрики оценки качества машинного перевода // Системный администратор. 2019. № 11 (204).

6. Chen B., Cherry C. A systematic comparison of smoothing techniques for sentence-level BLEU // Association for Computational Linguistics. 2014, vol. Proceedings of the Ninth Workshop on Statistical Machine Translation. P. 362–367. [Electronic resource]. URL: https://www.aclweb.org/anthology/W14-3346 (date of access: 25.12.2019).

7. Liu C., Dahlmeier D., H.T. Ng. Better evaluation metrics lead to better machine translation. // Association for Computational Linguistics. 2011, vol. Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. P. 375–384. [Electronic resource]. URL: https://www.aclweb.org/anthology/D11-1035 (date of access:25.12.2019).

Этап выравнивания является важной частью машинного перевода, который заключается в определении соответствия между словами/фразами имеющими одинаковое значение на одном языке со словами/фразами на другом языке. Результатом выравнивания является параллельный текст, который используется для инициализации систем машинного перевода [1]. Улучшение выравнивания позволяет увеличить точность создаваемого системой перевода и кроме того способно внести значительный вклад при оценке качества такого перевода. Целью исследования является разработка подхода к оценке качества машинного перевода с использованием фразового выравнивания.

Механизм выравнивания на основе слов

Рассмотрим механизм выравнивания на примере [2]. Одним из способов визуализации задачи выравнивания является матрица (рис. 1).

Здесь соответствующие выравнивания между словами представлены точками в матрице выравнивания. Выравнивания слов не обязательно должны иметь однозначное соответствие. Слова могут иметь несколько точек выравнивания или не иметь их вовсе. Так, на рис. 1 английское слово assumes соответствует трем немецким словам geht davon aus. Однако не всегда легко установить корректное выравнивание слов. Основная проблема заключается в том, что некоторые слова не имеют четкого эквивалента на другом языке.

kozina1.tif

Рис. 1. Пример матрицы выравнивания слов: Слова на английском языке (строки) выровнены по словами на немецком языке (столбцы), как указано точками в матрице

Для учета выравнивания по нескольким словам можно применить модель выравнивания в двух направлениях: от источника к цели и от цели к источнику. Полученные в результате выравнивания слова могут быть объединены, например, путем объединения точек пересечения или объединения всех точек выравнивания. Этот процесс обычно называют симметризацией выравнивания [2].

Механизм выравнивания на основе фраз

Как уже было указано ранее, иногда одно слово на исходном языке переводится как два или более слова на целевом языке. Процесс симметризации не всегда помогает исправить подобную ситуацию [3]. Один из вариантов решения данной проблемы – использовать более крупные единицы перевода, например фразы. Процесс выравнивания на основе фраз включает в себя два шага:

– создание выравнивания на основе слов между каждой парой предложений параллельного корпуса;

– извлечение фразовых пар, которые соответствуют полученному выравниванию слов.

Для рассматриваемого примера пошаговый процесс извлечения выровненных фраз отражен в таблице.

Процесс извлечения выровненных фраз

Этап	Фраза на английском языке	Фраза на немецком языке
1	michael	michael
2	michael assumes	michael geht davon aus; michael geht davon aus,
3	michael assumes that	michael geht davon aus, dass
4	michael assumes that he	michael geht davon aus, dass er
5	michael assumes that he will stay in the house	michael geht davon aus, dass er im haus bleibt
6	assumes	geht davon aus; geht davon aus,
7	assumes that	geht davon aus, dass
8	assumes that he	geht davon aus, dass er
9	assumes that he will stay in the house	geht davon aus, dass er im haus bleibt
10	that	dass ; , dass
11	that he	dass er ; , dass er
12	that he will stay in the house	dass er im haus bleibt ; , dass er im haus bleibt
13	he	er
14	he will stay in the house	er im haus bleibt
15	will stay	bleibt
16	will stay in the house	im haus bleibt
17	in the	im
18	in the house	im haus
19	house	haus

Оценка выравнивания для каждой пары фраз KOZ01.wmf строится поверх оценок выравнивания слов следующим образом:

KOZ02.wmf (1)

KOZ03.wmf (2)

Функция внешнего выравнивания

Выравнивание подразумевает не только то, что слова в пределах исходной фразы выровнены со словами в пределах целевой фразы, но также что оставшаяся часть исходного предложения, выровнена с подобной частью целевого предложения. Предположим, что набор фраз в исходном предложении – S, в целевом – T. Функция внешнего выравнивания будет выглядеть следующим образом:

KOZ04.wmf (3)

KOZ05.wmf (4)

sout и tout – набор фраз за пределами соответствия между KOZ06.wmf и KOZ07.wmf .

Функция покрытия

Кроме того, полезно учесть, какую часть переводимого текста покрывает рассматриваемая фраза. Пусть KOZ08.wmf и KOZ09.wmf представляют исходную и целевую фразы, S и T представляют исходное и целевое предложения. Отношения KOZ10.wmf и KOZ11.wmf отражают покрытие текста каждой выровненной фразой (1 – предложение охвачено полностью, 0 – отсутствие покрытия). Соответствующие функции выглядят следующим образом:

KOZ12.wmf (5)

KOZ13.wmf (6)

Корреляция между частотами исходных и целевых фраз

С целью сохранить количество предложений в корпусе, в которых встречается конкретная выровненная фраза, вводится дополнительная функция. Пусть KOZ14.wmf – число вхождений фразы KOZ15.wmf в корпус. Аналогичным образом, KOZ16.wmf – число вхождений фразы KOZ17.wmf в корпус. Функция частот будет выглядеть следующим образом:

KOZ18.wmf (7)

Функция итоговой оценки

Учитывая пару фраз KOZ19.wmf и выровненное соответствие KOZ20.wmf , определяется функция KOZ21.wmf для обеспечения единого представления функций, описанных ранее:

KOZ22.wmf (8)

Используем метод аппроксимации логарифмической модели для оценки единиц машинного перевода [4]. Общая функция оценки KOZ23.wmf для пары фраз KOZ24.wmf будет выглядеть следующим образом:

KOZ25.wmf (9)

Результаты работы метода

Для оценки предложенного подхода использовался набор данных WMT 2013. Данные сопровождаются широким спектром языковых пар. В данной работе рассматривались две пары параллельных корпусов: французско-английский и испанско-английский. Параллельные корпуса сопровождаются ручными и автоматическими оценками перевода [5]. Для оценки эффективности данного подхода результаты сравнивались с традиционными метриками оценки МП, такими как BLEU [6], GTM, TER и METEOR [7].

Для определения корреляции с человеческими суждениями использовался коэффициент корреляции баллов Спирмана.

kozin01.wmf (10)

где dij – евклидово расстояние, вычисляемое как разница между данной метрикой оценки и оценкой суждения человека, n – число переводов.

В предлагаемом подходе необходимо было выбрать наиболее подходящую размерность N-грамм. N-грамма состоит из N последовательных слов для каждой фразы выравнивания. Рис. 2, 3 демонстрируют влияние выбора различных значений N на точность предложенного подхода.

kozina2.wmf

Рис. 2. Влияние разной длины N-грамм на корреляцию с суждениями человека с использованием французско-английских данных WMT 2013

kozina3.wmf

Рис. 3. Влияние разной длины N-грамм на корреляцию с суждениями человека с использованием испанско-английских данных WMT 2013

Было обнаружено, что уменьшение значения N приводит к устойчивому улучшению корреляции с человеческими суждениями. В связи с этим было решено проводить дальнейшее тестирование с N-граммами в размере 5 и 9 слов.

На рис. 4, 5 представлена сводная информация о результатах корреляции предлагаемого подхода в сравнении с другими метриками.

kozina4.wmf

Рис. 4. Сравнение с использованием французско-английских данных WMT 2013

kozina5.wmf

Рис. 5. Сравнение с использованием испанско-английских данных WMT 2013

Результаты показали, что предлагаемый подход имеет наилучшую производительность на тестируемом наборе данных. Предложенный подход обеспечивает повышение точности не менее чем на 3,85 %.

Заключение

Таким образом, разработанный в данной работе подход показывает лучшие результаты в сравнении с традиционными метриками машинного перевода. Данный подход имеет потенциал, может быть в дальнейшем улучшен, например, введением дополнительных вероятностных функций с учетом различных границ выравнивания, а также с включением человеческих оценок в процесс обучения системы.

Библиографическая ссылка

Козина А.В., Черепков Е.А., Белов Ю.С. МЕТОД ОЦЕНКИ КАЧЕСТВА МАШИННОГО ПЕРЕВОДА НА ОСНОВЕ ФРАЗОВОГО ВЫРАВНИВАНИЯ // Научное обозрение. Технические науки. 2019. № 6. С. 50-55;
URL: https://science-engineering.ru/ru/article/view?id=1270 (дата обращения: 02.08.2026).

Научный журнал
Научное обозрение. Технические науки

ISSN 2500-0799

ПИ №ФС77-57440

МЕТОД ОЦЕНКИ КАЧЕСТВА МАШИННОГО ПЕРЕВОДА НА ОСНОВЕ ФРАЗОВОГО ВЫРАВНИВАНИЯ

Библиографическая ссылка

Научное обозрение. Технические науки
Научный журнал | ISSN 2500-0799 | ПИ №ФС77-57440