RU2016110818A

RU2016110818A - Способ и устройство для извлечения области изображения

Info

Publication number: RU2016110818A
Application number: RU2016110818A
Authority: RU
Inventors: Фэй Лун; Тао Чжан; Чжицзюнь ЧЭНЬ
Original assignee: Сяоми Инк.
Priority date: 2015-10-30
Filing date: 2015-12-29
Publication date: 2017-10-02
Also published as: KR20170061630A; WO2017071062A1; RU2642404C2; US10127471B2; CN105426818A; CN105426818B; US20170124718A1; MX364147B; JP2018500704A; EP3163504B1; EP3163504A1; MX2016003769A; JP6396605B2; KR101760109B1

Claims

1. Способ выделения области изображения, включающий в себя:

получение позиции первой информационной области на идентификационном изображении;

определение второй информационной области на основании позиции первой информационной области и

сегментирование второй информационной области до получения как минимум одной символьной зоны.

2. Способ по п. 1, отличающийся тем, что позиция области представлена координатами вершины,

причем определение второй информационной области осуществляется на основании позиции первой информационной области, включает в себя:

определение второй информационной области на основании как минимум двух координат вершины первой информационной области и предустановленного относительного соотношения позиций, причем под относительным соотношением позиций понимается относительное соотношение координат вершины и второй информационной области.

3. Способ по п. 2, отличающийся тем, что первой информационной областью номера гражданского удостоверения личности на удостоверении личности второго поколения, двумя координатами вершины выступают координаты области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения,

причем определение второй информационной области на основании координат по меньшей мере двух вершин первой информационной области и предустановленного относительного соотношения позиций включает в себя:

определение нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса;

определение верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты;

определение левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;

определение правой границы области адреса на основе горизонтальной координаты одной из двух вершин и второй предустановленной ширины;

и определения области адреса на основании нижней, верхней, правой и левой границ.

4. Способ по любому из пп. 1-3, отличающийся тем, что сегментация второй информационной области до получения как минимум одной символьной зоны включает в себя:

процесс бинаризации второй информационной области для получения бинаризированной второй информационной области;

расчет первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;

распознавание n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;

расчет второй гистограммы по вертикальному направлению для i-й строки текстовой области, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей, причем n≥i≥1 и i - это положительное целое число;

и распознавание ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

5. Способ по п. 4, дополнительно содержащий:

распознавание межстрочного интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;

исключение из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

6. Способ по п. 4, дополнительно содержащий:

распознавание межсимвольного расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме;

распознавание правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение;

и распознавание левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

7. Устройство для выделения области изображения, включающее в себя:

модуль получения, предназначенный для получения позиции первой информационной области идентификационного изображения;

модуль определения, предназначенный для определения второй информационной области на основании позиции первой информационной области;

и модуль распознавания, предназначенный для сегментирования второй информационной области до получения как минимум одной символьной зоны.

8. Устройство по п. 7, отличающееся тем, что позиция области представлена координатами вершины,

причем модуль распознавания предназначен также для определения второй информационной области в соответствии как минимум с двумя парами координат вершин первой информационной области и предустановленным относительным соотношением, причем под предустановленным соотношением позиций понимается относительное соотношение позиций между парами координат вершин и второй информационной областью.

9. Устройство по п. 8, отличающееся тем, что первой информационной областью является область номера гражданского удостоверения личности на удостоверении личности второго поколения, двумя координатами вершины выступают координаты области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения,

причем модуль определения включает в себя:

первый субмодуль определения, предназначенный для определения нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса;

второй субмодуль определения, предназначенный для определения верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты;

третий субмодуль определения, предназначенный для определения левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;

четвертый субмодуль определения, предназначенный для определения правой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;

субмодуль сегментации, предназначенный для определения области адреса на основании нижней, верхней, правой и левой границ.

10. Устройство по любому из пп. 7-9 отличающееся тем, что модуль распознавания содержит:

подмодуль бинаризации, предназначенный для выполнения процесса бинаризации второй информационной области для получения бинаризованной второй информационной области;

первый расчетный субмодуль, предназначенный для расчета первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;

субмодуль распознавания строк, предназначенный для распознавания n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;

второй расчетный субмодуль, предназначенный для расчета второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в кажом столбце пикселей, причем n≥i≥1 и i является положительным целым числом;

и субмодуль распознавания символов, предназначенный для распознавания ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

11. Устройство по п. 10, дополнительно содержащее:

модуль распознавания межстрочного интервала, предназначенный для распознавания интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;

исключающий модуль, предназначенный для исключения из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

12. Устройство по п. 10, дополнительно содержащее:

модуль распознавания межсимвольного расстояния, предназначенный для распознавания расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме;

модуль распознавания текста, предназначенный для распознавания правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение;

и модуль распознавания отдельного символа, предназначенный для распознавания левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

13. Устройство для выделения области изображения, включающее:

процессор,

память для хранения инструкций, исполняемых процессором;

при этом процессор выполнен с возможностью:

получения позиции первой информационной области на идентификационном изображении;

определения второй информационной области на основании позиции первой информационной области;

и сегментирования второй информационной области до получения как минимум одной символьной зоны.