Extracting of high quality biometric parameters from stationary image of handwritten signal


Cite item

Full Text

Abstract

This work describes extracting of high quality biometric parameters from stationary image of handwritten signal. At first step, we perform binarization of initial handwritten signal images by Gabor filter and then map the pen movement directions. These maps are divided to segments, and pen movement direction histograms are plot for each segment. Those histograms are used as initial data during training of three-layer neural classifier by backpropagation algorithm. We propose to define high quality biometric parameters corresponding to data from the outputs of the neural classifier second layer. These extracted high quality biometric parameters can be used for training of neural transformer biometry-code according to methods described in the GOST R 52633.

Full Text

Введение Почерковедческое исследование документов является одной из наиболее популярных экспертиз в гражданских и арбитражных судебных спорах. Наиболее часто объектом почерковедческого исследования является рукописная подпись человека, а предметом исследования - идентификация и верификация рукописной подписи. Автоматизация этой процедуры является крайне актуальной задачей, так как может сократить трудоемкость процедуры исследования и ее стоимость. Одной из важнейших задач при разработке автоматизированных экспертных систем является получение из изображения рукописной подписи высококачественных биометрических параметров, пригодных для дальнейшего анализа с использованием методов машинного обучения. В статье рассматривается система алгоритмов, позволяющая преобразовать растровое изображение рукописной подписи в вектор слабокоррелированных биометрических параметров. Общая схема преобразования Общая схема получения биометрических параметров высокого качества из изображения рукописной подписи включает в себя следующие этапы: - бинаризация изображения рукописной подписи; - построение карты направлений движений пера; - получение биометрических параметров высокого качества при помощи нейросетевого классификатора. Бинаризация с помощью фильтра Габора Простейшая бинаризация с фиксированным порогом может давать неудовлетворительный результат как минимум в двух случаях. 1. Задний фон страницы не является однородным белым, например, перед сканированием бумага была помята, (см. пример на рис. 1). Рис. 1. Пример некачественного фона 2. Ручка или карандаш дают пропуски при письме (см. пример на рис. 2). Рис. 2. Пример пропуска при письме Чаще всего задача бинаризации должна решаться в условиях, когда в той или иной степени проявляются оба этих условия. Следовательно, должен применяться более устойчивый алгоритм, нежели бинаризация с фиксированным порогом. Недостатком бинаризации с фиксированным порогом является независимое от других пикселей принятие решения, является пиксель черным или белым. Применение перед бинаризацией медианного, гауссова или билатерального фильтра позволяет неявно учитывать и соседние пиксели (в радиусе ядра фильтра), но не позволяет использовать априорное знание о структуре «черных» пикселей («черные» пиксели расположены на кривой определенной толщины). Рис. 3. Импульсная переходная характеристика фильтра Габора Следовательно, для решения задачи бинаризации рукописного текста целесообразно применение двумерных фильтров-сверток, учитывающих преимущественно линейное (в небольших окнах) направление границы между белыми и черными пикселями. В качестве таких двумерных фильтров могут быть выбраны любые фильтры, имеющие квазипериодическую структуру с настраиваемыми периодом и фазой, например, фильтр Габора [1]. Импульсная переходная характеристика фильтра Габора имеет вид гармонической функции, умноженной на Гауссиан (см. рис. 3). Рис. 4. Результат работы пороговой бинаризации При выполнении двумерной свертки с использованием фильтра Габора, для каждого пикселя на основании соседних пикселей и ядра фильтра вычисляется отклик. Задача бинаризации решается уже в пространстве откликов. Выбирается некоторый порог; пиксели, для которых отклик превышает порог, считаются черными, остальные, соответственно, - белыми. Рис. 5. Результат работы бинаризации с использованием фильтра Габора Использования комбинации фильтров Габора с различной фазой, периодом и углом нормали позволяет получать приемлемую бинаризацию даже для изображений подписи низкого качества (см. рис. 4 и рис. 5). Рис. 6. Карта направлений движения пера Рис. 7. Разделение карты направлений движения пера на части Построение карты направлений движений пера Для каждого пикселя соответствующий фильтру с максимальным откликом угол нормали определяет направление движения пера, в случае если пиксель «черный». Совокупность направлений движений пера формирует изображение, именуемое далее картой направлений. На рис. 6 сглаженная карта направлений движения пера визуализирована через компонент Hue цветовой схемы HSV. Рис. 8. Гистограмма распределения углов направлений Карта углов может быть рекурсивно разделена поочередно по осям x и y на равные по количеству «черных» пикселей части по принципу k-мерного дерева [2] (см. рис. 7). Для каждой части может быть построена полярная гистограмма углов направлений движения пера (пример полярной гистограммы направлений движения пера для всей подписи показан на рис. 8). Получение параметров высокого качества при помощи нейросетевого классификатора Для получения биометрических параметров высокого качества предлагается использовать искусственную нейронную сеть. В качестве нейронной сети была выбрана трехслойная нейронная сеть, обучаемая при помощи алгоритма обратного распространения ошибки задаче классификации некоторой базы тестовых рукописных подписей. В качестве выходного слоя использовался слой softmax с количеством выходов, равным количеству классов исходных примеров [3]. При этом веса и выходы последнего слоя softmax для получения параметров высокого качества не используются. Независимо от количества нейронов последнего слоя, количество нейронов на предыдущих слоях должно уменьшаться от слоя к слою (см. рис. 9). Рис. 9. Схема нейросетевого классификатора Такая архитектура нейронной сети вынуждает сеть в процессе обучения задаче классификации образов формировать на самом «узком» слое эффективное представление входных данных меньшей размерности. Предполагается, что нейронная сеть, обученная задаче классификации на некоторой базе образов «чужой», сможет формировать на «узком» слое параметры высокого качества, в том числе и для образов, не использовавшихся при обучении. Стоит заранее определить, какое качество параметров можно условно считать высоким в контексте решения задачи биометрической аутентификации. В случае использования полученных биометрических параметров для аутентификации в соответствии с пакетом стандартов ГОСТ Р 52633, решающее значение имеет среднее качество параметров и средний модуль корреляции параметров. Пример распределения значений параметра приведен на рис. 10. Рис. 10. Пример распределения значений биометрического параметра для разных образов Распределения значений модуля корреляции параметров для различных конфигураций сети приведены на рис. 11-14. Рис. 11. Распределения значений модуля корреляции для сети с 32 нейронами Рис. 12. Распределения значений модуля корреляции для сети с 64 нейронами Рис. 13. Распределения значений модуля корреляции для сети с 128 нейронами Рис. 14. Распределения значений модуля корреляции для сети с 256 нейронами Таким образом, было установлено, что наиболее качественные параметры удается получать при разделении подписи на 16 частей и построении гистограмм с 32 разрядами. Общее количество входных параметров нейронной сети при этом равно 512, количество нейронов второго слоя - 128. Выходной слой - softmax, количество нейронов определяется количеством классов. Заключение Описанная в статье система алгоритмов позволяет получить из изображения рукописной подписи биометрические параметры высокого качества, пригодные для дальнейшего использования в алгоритмах преобразования биометрия-код в соответствии с пакетом стандартов ГОСТ Р 52633, а также для анализа с использованием других алгоритмов машинного обучения.
×

About the authors

Eugeny Ivanovich Kachaykin

Russian Ministry of Justice

Email: kachajkin@gmail.com

Sergey Vladimirovich Kulikov

JSC «PNIEI»

Email: dreamreader@list.ru

References

  1. Сойфер В.А. Методы компьютерной обработки изображений. М.: Физматлит, 2003. С. 459.
  2. K-мерное дерево // Википедия. [2014-2014]. Дата обновления: 01.09.2014. URL: http://ru.wikipedia.org/?oldid=65210970 (дата обращения: 01.09.2014).
  3. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. М.: Мир, 1992. C. 118.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2015 Kachaykin E.I., Kulikov S.V.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies