Научный журнал
Научное обозрение. Технические науки
ISSN 2500-0799
ПИ №ФС77-57440

ТЕКСТОНЕЗАВИСИМАЯ ВЕРИФИКАЦИЯ ЛИЧНОСТИ ПО ДИНАМИЧЕСКИМ БИОМЕТРИЧЕСКИМ ПАРАМЕТРАМ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ КОХОНЕНА

Брюхомицкий Ю.А. 1
1 ФГАОУ ВО «Южный федеральный университет»
В данной работе предлагается обобщенный подход к верификации личности по динамическим биометрическим параметрам разной модальности (клавиатурный почерк, рукопись, голос). Представление сигналов динамической биометрии личности осуществляется путем преобразования входных биометрических данных в однотипную последовательность информационных единиц, каждая из которых является ее текущим фрагментом, содержащим одинаковое количество позиций биометрического сигнала соответствующей модальности. Биометрическая последовательность, полученная для легитимной личности и являющаяся ее биометрическим эталоном, подвергается кластеризации на самообучающейся нейронной сети Кохонена большой размерности. Обученная нейронная сеть тестируется затем на биометрии легитимной личности, и производится статистический анализ результатов и получение необходимых числовых характеристик. В рабочем режиме через обученную сеть пропускается последовательность априори неизвестной личности того же размера, что и эталонная, и по результатам статистического анализа вычисляются аналогичные числовые характеристики. Принятие верификационного решения осуществляется, исходя из допустимой величины ошибки первого рода на основе пороговой величины невязки числовых характеристик для верифицируемой и легитимной личностей. Предлагаемый подход позволяет обобщить существенно различные методы верификации личности по динамическим биометрическим параметрам разной модальности. Его преимуществами являются: возможность текстонезависимого анализа динамической биометрии различной модальности, произвольного объема и содержания; принятие верификационного решения за фиксированное время, определяемое принятым размером эталона; возможность задания необходимой точности работы системы верификации путем изменения размерности нейронной сети. Недостатком является необходимость программной реализации нейронных сетей большой размерности. Однако, учитывая высокие темпы повышения производительности вычислительных средств, этот недостаток будет быстро нивелироваться.
динамические биометрические параметры
текстонезависимая верификация личности
кластеризация биометрической последовательности
нейронная сеть Кохонена
статистический анализ результатов обучения
1. Брюхомицкий Ю.А. Биометрические технологии идентификации личности: учебное пособие. Южный федеральный университет. Ростов-на-Дону – Таганрог: Издательство Южного федерального университета, 2017. 263 с.
2. Матвеев Ю.Н. Технологии биометрической идентификации личности по голосу и другим модальностям // Вестник МГТУ им. Н.Э. Баумана, серия Приборостроение. 2012. № 2. С. 46–61.
3. Капустин А.И., Симончик К.К. Система верификации дикторов по голосу на основе использования СГР-SVM подхода // DSPA-2010. Тр. 12-й Межд. конф. «Цифровая обработка сигналов и ее применение». М., 2010. Т. 1. С. 207–210.
4. Pekhovsky T., Lokhanova A. Variational Bayesian Model Selection for GMM–Speaker Verification Using Universal Background Model. INTERSPEECH-2011. Proc. 12th Annual Conf. Florence, 2011. P. 2705–2708.
5. Анисимова Э.С. Идентификация онлайн-подписи с помощью оконного преобразования Фурье и радиального базиса // Компьютерные исследования и моделирование. 2014. Т. 6. № 3. С. 357–364.
6. Лапина Т.И., Епишев Н.Н., Лапин Д.В. Способ биометрической аутентификации пользователя в компьютизированных системах контроля доступа // Труды СПИИРАН. 2013. Вып. 4 (27). С. 189–197.
7. Дорошенко Ю., Костюченко Е.Ю. Система аутентификации на основе динамики рукописной подписи // Доклады ТУСУРа. 2014. № 2 (32). С. 219–223.
8. Брюхомицкий Ю.А. Клавиатурная идентификация личности. Lambert Academic Publishing, Saarbr?cken, Germany, 2012. 140 с.
9. Брюхомицкий Ю.А. Клавиатурная идентификация и мониторинг пользователей компьютерных систем // Актуальные аспекты информационной безопасности: монография: глава 5. С. 310–407. Таганрог: Изд-во ТТИ ЮФУ, 2011. 448 с.
10. Брюхомицкий Ю.А. Искусственные иммунные системы в информационной безопасности: учебное пособие. Южный федеральный университет. Ростов-на-Дону – Таганрог: Издательство Южного федерального университета, 2020. 147 с.
11. Чернышев Ю.О., Григорьев Г.В., Венцов Н.Н. Искусственные иммунные системы: обзор и современное состояние // Программные продукты и системы 2014. № 4 (108). С. 136–141.
12. Нейронные сети Кохонена // NEURONUS.com. [Электронный ресурс]. URL: https://neuronus.com/theory/nn/955-nejronnye-seti-kokhonena.html (дата обращения: 04.05.2021).
13. Манжула В.Г., Федяшов Д.С. Нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных // Фундаментальные исследования. 2011. № 4. С. 108–115.
14. Козлов А.А. Моделирование нейронных сетей Кохонена на графических процессорах // Молодой ученый. 2016. № 28 (132). С. 22–26.

В защищенных информационных и мобильных системах процедура персонификации личности (идентификация и аутентификация) является первым обязательным рубежом защиты. Для реализации этой процедуры в настоящее время все большее внимание уделяется биометрическим методам, обладающим рядом неоспоримых преимуществ [1]. Особой разновидностью биометрических методов персонификации личности является использование ее поведенческих (динамических) характеристик, представленных манерой подсознательного воспроизведения любого текста в трех модальностях: голосом [2–4], рукописью [5–7] или клавиатурным набором [8, 9]. Важным при этом является то, что произвольный текст может быть неограниченного объема и представлен на любом языке. По этой причине такая разновидность биометрии получила название текстонезависимой биометрии. Ее преимуществами является высокая защита от атак воспроизведения текста, сравнительно невысокие затраты на ее реализацию (преимущественно программную). Недостаток, – бо?льшая продолжительность процедуры персонификации, обусловленная необходимостью сопоставления текстов с биометрическими эталонами большого объема. Кроме того, использование текстонезависимой биометрии связано с решением ряда проблем, связанных с оптимальным представлением эталонов образцов текста различной модальности, выбором необходимого объема образцов, своевременным определением момента принятия решения «свой – чужой» при персонификации личности.

Вместе с тем использование текстонезависимой биометрии не ограничивается исключительно задачами персонификации личности при входе в информационные и мобильные системы. Более перспективным направлением ее применения является скрытный мониторинг работы пользователей в уже ранее легально открытых ими информационных и мобильных системах. К таким задачам относятся, в частности [1]: скрытная непрерывная клавиатурная верификации работающих пользователей, исключающая их подмену в ранее легально открытых системах; скрытное выявление легальных пользователей (инсайдеров), осуществляющих неправомерные действия в системах, путем установления отклонений их клавиатурного почерка от нормы, вызванных незаконными действиями (психофизический эффект); открытое или скрытное выявление операторов, имеющих отклонение своего текущего психофизического состояния от нормы, актуальное в системах с большой ценой ошибки оператора; выявление личностей, поставляющих ложную информацию в вопрос-ответных процедурах (иная реализация детектора лжи) и другие задачи.

В текстонезависимой динамической биометрии образы личностей представлены периодическими сигналами. Традиционным подходом к решению задачи распознавания таких сигналов является предварительный перевод их в частотную область путем разложения в какой-либо ряд: Фурье, Уолша, Хаара и др. Коэффициенты разложений выступают в качестве контролируемых информационных параметров, и задача распознавания образов решается уже в формате статического представления [1].

В данной работе предлагается иной подход к распознаванию сигналов текстонезависимой динамической биометрии. Он заключается в первичном временном квантовании исходного сигнала и последующем его вторичном квантовании, позволяющем выделить группы соседних отсчетов сигнала первичного квантования одинакового размера. Выделенные группы представляются далее многомерными векторами в Евклидовом пространстве и трактуются как информационные единицы анализируемого биометрического сигнала. Такой подход имитирует принцип обработки данных в искусственных иммунных системах (ИИС) [10, 11]. Верификация динамической биометрии личности осуществляется далее путем кластеризации указанных многомерных векторов с помощью обученной нейронной сети Кохонена и последующего статистического анализа ее выходных данных.

Размерность сигналов текстонезависимой динамической биометрии зависит от модальности. В голосовых системах сигналы одномерные, в рукописных онлайновых системах мерность определяется числом квазинепрерывных характеристик взаимного положения пера и графического планшета (обычно от двух до восьми степеней свободы), в клавиатурных системах мерность определяется способом представления исходных данных. Поэтому в общем случае сигналы текстонезависимой динамической биометрии следует считать многомерными: BROH01.wmf. Далее на этапе предварительной обработки они оцифровываются BROH02.wmf BROH03.wmf i = 1, 2, ... и приводятся к единому масштабу по всем компонентам. В реальном масштабе времени текст может содержать длительные паузы, не обусловленные индивидуальным характером его воспроизведения данной личностью, поэтому такие паузы исключаются из анализа. При голосовом воспроизведении текста из него исключатся также неинформативные фонемы шипящих звуков.

Сигнал x(ti), i = 1, 2, ... рассматривается далее как последовательность BROH04.wmf элементов, представленных векторами признаков: xi.

В динамической биометрии выявлен принципиально важный феномен, который заключается в том, что личностные особенности воспроизведения определенного текста наблюдаются в большей степени не в одиночных символах, а в группах последовательно расположенных символов, несущих индивидуальную морфологическую окраску слов. Это позволяет существенно повысить точность биометрической верификации личности [1].

Для воспроизведения указанного феномена последовательность BROH05.wmf расчленяется на фрагменты одинакового размера по r отсчетов в каждом фрагменте BROH06.wmf. Каждый фрагмент BROH07.wmf трактуется далее как элемент новой последовательности BROH08.wmf, содержащий r векторов xi исходной последовательности BROH09.wmf

BROH10.wmf

Для использования указанного феномена последовательность BROH11.wmf расчленяется на фрагменты BROH12.wmf одинакового размера по r отсчетов в каждом фрагменте. Результатом будет новая последовательность BROH13.wmf, каждый элемент yj которой содержит r векторов xi исходной последовательности BROH14.wmf:

BROH15.wmf

При этом элементы yj представляют собой s-мерные вектора yj, содержащие s = n×r компонент:

BROH16.wmf

Последовательность BROH17.wmf, ограниченная Ny элементами, представляет биометрический эталон личности.

В итоге общее распределение динамических биометрических данных личности будет представлено множеством кластеров BROH18.wmf s-мерных векторов yj, в пространстве признаков Es. При этом каждый кластер будет содержать фрагменты биометрии, специфичные по воспроизведению данной личностью.

Режим верификации предполагает возможность сопоставления предъявленного образца биометрии априори легитимной личности соответствующему ей биометрическому эталону BROH19.wmf. По результатам сопоставления принимается верификационное решение «свой – чужой». Анализ минимаксных значений BROH20.wmf по координатам s позволяет сузить потенциальное пространство признаков BROH21.wmf в рабочее пространство BROH22.wmf.

Обучение системы осуществляется на основе самоорганизующейся нейронной сети Кохонена (или какой-либо последующей ее модификации) [12–14]. Цель обучения – кластеризация пространства признаков BROH23.wmf для эталона BROH24.wmf. Результатом кластеризации будет совокупность кластеров k = 1, 2, …, l. Число кластеров l выбирается из эмпирических соображений, связанных с приемлемой точностью и вычислительной сложностью воспроизведения сети.

Простейший вариант схемы нейронной сети Кохонена для решения поставленной задачи приведен на рисунке.

brohomick1.tif

Схема нейронной сети Кохонена

Нейроны сети Кохонена реализуют операцию взвешенного суммирования:

BROH25.wmf

где yj компоненты входного вектора yj; zk – выходы нейронов; bk – пороги нейронов; wik – веса нейронов.

Выходные сигналы нейронов подвергаются конкуренции по правилу «победитель получает всё». Для этого выходные сигналы нейронов сравниваются и максимальный из них обращается в 1, остальные обращаются в 0. Если максимум возникает одновременно на выходах нескольких нейронов, то все эти выходные сигналы также обращаются в 1.

Счетчики на выходах блока конкуренции служат для подсчета единиц на выходах сети при предъявлении входной последовательности BROH27.wmf.

Нейрон становится победителем в конкуренции, если для него выполняется соот- ношение

BROH28.wmf

где j – номер нейрона-победителя; d(y, wj) – расстояние между векторами y и w в метрике Евклида

BROH29.wmf

Корректировка весов «выигравшего» нейрона осуществляется по правилу Кохонена

BROH30.wmf

где BROH31.wmf – коэффициент скорости обучения j-нейрона в t-цикле обучения.

Нейронная сеть обучается путем поочередной подачи на ее входы элементов эталонной последовательности BROH32.wmf. После обучения пространство BROH33.wmf будет расчленено на кластеры, представляющие собой s-мерные многогранники Вороного – Дирихле, стороны которых являются фрагментами секущих пространство BROH34.wmf гиперплоскостей. Центры кластеров представлены векторами, соответствующими столбцам весовой матрицы сети.

За один цикл обучения, соответствующий предъявлению всех Ny единиц входных данных P, на каждом из k = 1, 2, …, l выходах сети будет появляться nkP единиц. Величины nkP можно считать случайными величинами, зависящими от структуры входной последовательности BROH35.wmf. Таким образом, общая картина возбуждений сети будет представлена системой случайных величин nkP.

Длительность обучения в системе определяется одним циклом прогона последовательности BROH36.wmf.

После обучения нейронная сеть подвергается тестированию, чтобы зафиксировать конечный результат кластеризации пространства BROH37.wmf, необходимый для последующего статистического анализа.

При тестировании через обученную сеть пропускается последовательность эталона P и по каждому k-выходу сети подсчитывается количество единиц nkP. Далее рассчитывается вероятность появления образов в каждом кластере для эталонной последовательности BROH38.wmf:

BROH39.wmf.

Математическое ожидание количества единиц в k-кластере сети будет равно

BROH40.wmf

Математическое ожидание mP всей картины возбуждений сети для эталона P будет равно сумме математических ожиданий количества единиц в каждом k-кластере:

BROH41.wmf

Полученный результат mP трактуется как статистическая оценка всей картины кластеризации пространства BROH42.wmf для эталона P. На этом этап тестирования сети заканчивается, и она готова для верификации биометрических данных.

В рабочем режиме через обученную сеть пропускается последовательность априори неизвестной личности X того же размера, что и эталонная – BROH43.wmf и делается оценка математического ожидания mx картины кластеризации пространства BROH44.wmf на основе рассчитанных ранее вероятностей появления выходных образов в каждом кластере для эталона P:

BROH45.wmf

BROH46.wmf

Картина кластеризации пространства BROH47.wmf, представленная суммарным математическим ожиданием mX будет характеризовать биометрию личности X. Если анализируемая биометрия принадлежит легальной личности, то mX будет близка к величине mP. Для любой другой личности X она будет существенно отличаться от mP.

Для принятия верификационного решения, исходя из допустимой величины ошибки первого рода (недопуск «своего»), устанавливается пороговая величина невязки BROH49.wmf, на основании которой неизвестную личность X следует признать «своим» XC или «чужим» XЧ:

BROH50.wmf

Заключение

Однотипное представление сигналов динамической биометрии разной модальности позволило предложить общий подход к реализации процедуры верификации личности на основе сочетания принципов представления данных, характерных для в ИИС и принципов их кластеризации в самоорганизующихся нейронных сетях. Перспектива применения такого подхода определяется стремительным ростом производительности вычислительных средств, открывающим возможность эффективно применять ИИС и самоорганизующиеся нейронные сети больших размерностей для решения таких сложных задач.


Библиографическая ссылка

Брюхомицкий Ю.А. ТЕКСТОНЕЗАВИСИМАЯ ВЕРИФИКАЦИЯ ЛИЧНОСТИ ПО ДИНАМИЧЕСКИМ БИОМЕТРИЧЕСКИМ ПАРАМЕТРАМ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ КОХОНЕНА // Научное обозрение. Технические науки. – 2021. – № 3. – С. 5-9;
URL: https://science-engineering.ru/ru/article/view?id=1349 (дата обращения: 23.11.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674