RU2016110818A - Способ и устройство для извлечения области изображения - Google Patents

Способ и устройство для извлечения области изображения Download PDF

Info

Publication number
RU2016110818A
RU2016110818A RU2016110818A RU2016110818A RU2016110818A RU 2016110818 A RU2016110818 A RU 2016110818A RU 2016110818 A RU2016110818 A RU 2016110818A RU 2016110818 A RU2016110818 A RU 2016110818A RU 2016110818 A RU2016110818 A RU 2016110818A
Authority
RU
Russia
Prior art keywords
area
information area
pixels
histogram
address
Prior art date
Application number
RU2016110818A
Other languages
English (en)
Other versions
RU2642404C2 (ru
Inventor
Фэй Лун
Тао Чжан
Чжицзюнь ЧЭНЬ
Original Assignee
Сяоми Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сяоми Инк. filed Critical Сяоми Инк.
Publication of RU2016110818A publication Critical patent/RU2016110818A/ru
Application granted granted Critical
Publication of RU2642404C2 publication Critical patent/RU2642404C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation

Claims (60)

1. Способ выделения области изображения, включающий в себя:
получение позиции первой информационной области на идентификационном изображении;
определение второй информационной области на основании позиции первой информационной области и
сегментирование второй информационной области до получения как минимум одной символьной зоны.

2. Способ по п. 1, отличающийся тем, что позиция области представлена координатами вершины,
причем определение второй информационной области осуществляется на основании позиции первой информационной области, включает в себя:
определение второй информационной области на основании как минимум двух координат вершины первой информационной области и предустановленного относительного соотношения позиций, причем под относительным соотношением позиций понимается относительное соотношение координат вершины и второй информационной области.

3. Способ по п. 2, отличающийся тем, что первой информационной областью номера гражданского удостоверения личности на удостоверении личности второго поколения, двумя координатами вершины выступают координаты области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения,
причем определение второй информационной области на основании координат по меньшей мере двух вершин первой информационной области и предустановленного относительного соотношения позиций включает в себя:
определение нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса;
определение верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты;
определение левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;
определение правой границы области адреса на основе горизонтальной координаты одной из двух вершин и второй предустановленной ширины;
и определения области адреса на основании нижней, верхней, правой и левой границ.

4. Способ по любому из пп. 1-3, отличающийся тем, что сегментация второй информационной области до получения как минимум одной символьной зоны включает в себя:
процесс бинаризации второй информационной области для получения бинаризированной второй информационной области;
расчет первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;
распознавание n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;
расчет второй гистограммы по вертикальному направлению для i-й строки текстовой области, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей, причем n≥i≥1 и i - это положительное целое число;
и распознавание ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

5. Способ по п. 4, дополнительно содержащий:
распознавание межстрочного интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;
исключение из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

6. Способ по п. 4, дополнительно содержащий:
распознавание межсимвольного расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме;
распознавание правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение;
и распознавание левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

7. Устройство для выделения области изображения, включающее в себя:
модуль получения, предназначенный для получения позиции первой информационной области идентификационного изображения;
модуль определения, предназначенный для определения второй информационной области на основании позиции первой информационной области;
и модуль распознавания, предназначенный для сегментирования второй информационной области до получения как минимум одной символьной зоны.

8. Устройство по п. 7, отличающееся тем, что позиция области представлена координатами вершины,
причем модуль распознавания предназначен также для определения второй информационной области в соответствии как минимум с двумя парами координат вершин первой информационной области и предустановленным относительным соотношением, причем под предустановленным соотношением позиций понимается относительное соотношение позиций между парами координат вершин и второй информационной областью.

9. Устройство по п. 8, отличающееся тем, что первой информационной областью является область номера гражданского удостоверения личности на удостоверении личности второго поколения, двумя координатами вершины выступают координаты области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения,
причем модуль определения включает в себя:
первый субмодуль определения, предназначенный для определения нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса;
второй субмодуль определения, предназначенный для определения верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты;
третий субмодуль определения, предназначенный для определения левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;
четвертый субмодуль определения, предназначенный для определения правой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;
субмодуль сегментации, предназначенный для определения области адреса на основании нижней, верхней, правой и левой границ.

10. Устройство по любому из пп. 7-9 отличающееся тем, что модуль распознавания содержит:
подмодуль бинаризации, предназначенный для выполнения процесса бинаризации второй информационной области для получения бинаризованной второй информационной области;
первый расчетный субмодуль, предназначенный для расчета первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;
субмодуль распознавания строк, предназначенный для распознавания n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;
второй расчетный субмодуль, предназначенный для расчета второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в кажом столбце пикселей, причем n≥i≥1 и i является положительным целым числом;
и субмодуль распознавания символов, предназначенный для распознавания ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

11. Устройство по п. 10, дополнительно содержащее:
модуль распознавания межстрочного интервала, предназначенный для распознавания интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;
исключающий модуль, предназначенный для исключения из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

12. Устройство по п. 10, дополнительно содержащее:
модуль распознавания межсимвольного расстояния, предназначенный для распознавания расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме;
модуль распознавания текста, предназначенный для распознавания правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение;
и модуль распознавания отдельного символа, предназначенный для распознавания левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

13. Устройство для выделения области изображения, включающее:
процессор,
память для хранения инструкций, исполняемых процессором;
при этом процессор выполнен с возможностью:
получения позиции первой информационной области на идентификационном изображении;
определения второй информационной области на основании позиции первой информационной области;
и сегментирования второй информационной области до получения как минимум одной символьной зоны.
RU2016110818A 2015-10-30 2015-12-29 Способ и устройство для извлечения области изображения RU2642404C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510726272.4 2015-10-30
CN201510726272.4A CN105426818B (zh) 2015-10-30 2015-10-30 区域提取方法及装置
PCT/CN2015/099298 WO2017071062A1 (zh) 2015-10-30 2015-12-29 区域提取方法及装置

Publications (2)

Publication Number Publication Date
RU2016110818A true RU2016110818A (ru) 2017-10-02
RU2642404C2 RU2642404C2 (ru) 2018-01-24

Family

ID=55505018

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016110818A RU2642404C2 (ru) 2015-10-30 2015-12-29 Способ и устройство для извлечения области изображения

Country Status (8)

Country Link
US (1) US10127471B2 (ru)
EP (1) EP3163504B1 (ru)
JP (1) JP6396605B2 (ru)
KR (1) KR101760109B1 (ru)
CN (1) CN105426818B (ru)
MX (1) MX364147B (ru)
RU (1) RU2642404C2 (ru)
WO (1) WO2017071062A1 (ru)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229932B (zh) * 2016-03-25 2021-05-28 阿里巴巴集团控股有限公司 一种图像文本的识别方法和装置
CN106547912A (zh) * 2016-11-25 2017-03-29 西安理工大学 身份证数据库中非二代身份证照片的识别和剔除方法
CN108388872B (zh) * 2018-02-28 2021-10-22 北京奇艺世纪科技有限公司 一种基于字体颜色的新闻标题识别方法及装置
CN108764240A (zh) * 2018-03-28 2018-11-06 中科博宏(北京)科技有限公司 基于字符相对大小的计算机视觉身份证字符分割识别技术
KR102063036B1 (ko) * 2018-04-19 2020-01-07 한밭대학교 산학협력단 딥러닝과 문자인식으로 구현한 시각주의 모델 기반의 문서 종류 자동 분류 장치 및 방법
CN109977959B (zh) * 2019-03-29 2021-07-06 国家电网有限公司 一种火车票字符区域分割方法及装置
US11501548B2 (en) * 2019-04-02 2022-11-15 Edgeverve Systems Limited Method and system for determining one or more target objects in an image
CN110321895A (zh) * 2019-04-30 2019-10-11 北京市商汤科技开发有限公司 证件识别方法和装置、电子设备、计算机可读存储介质
CN110378340A (zh) * 2019-07-23 2019-10-25 上海秒针网络科技有限公司 地址合规识别方法、装置、存储介质及电子装置
WO2021145466A1 (ko) * 2020-01-13 2021-07-22 엘지전자 주식회사 객체의 정보를 확인하는 이동 단말기 및 그 제어 방법
CN111539269A (zh) * 2020-04-07 2020-08-14 北京达佳互联信息技术有限公司 文本区域的识别方法、装置、电子设备和存储介质
CN111582085B (zh) * 2020-04-26 2023-10-10 中国工商银行股份有限公司 单据拍摄图像识别方法及装置
CN111639648B (zh) * 2020-05-26 2023-09-19 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111898601A (zh) * 2020-07-14 2020-11-06 浙江大华技术股份有限公司 一种身份证要素提取方法及装置
CN112633193A (zh) * 2020-12-28 2021-04-09 深圳壹账通智能科技有限公司 地址信息的提取方法、装置、设备及介质
WO2022173415A1 (en) * 2021-02-09 2022-08-18 Hewlett-Packard Development Company, L.P. Edge identification of documents within captured image
CN113592877B (zh) * 2021-03-25 2024-04-12 国网新源控股有限公司 一种抽水蓄能电站红线超标识别方法及装置
CN115082919B (zh) * 2022-07-22 2022-11-29 平安银行股份有限公司 一种地址识别方法、电子设备及存储介质
CN115862041B (zh) * 2023-02-13 2023-05-09 武汉天恒信息技术有限公司 一种基于神经网络的不动产证书识别方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3795238B2 (ja) * 1998-10-01 2006-07-12 シャープ株式会社 文書画像処理装置及び文書画像処理方法
RU2329535C2 (ru) * 2006-05-24 2008-07-20 Самсунг Электроникс Ко., Лтд. Способ автоматического кадрирования фотографий
JP2010231541A (ja) * 2009-03-27 2010-10-14 Oki Electric Ind Co Ltd 情報処理装置、文字認識方法、およびプログラム
CN101561876A (zh) * 2009-06-05 2009-10-21 四川泸州航天金穗高技术有限公司 一种身份证信息采集与识别方法及系统
JP5591578B2 (ja) 2010-04-19 2014-09-17 日本電産サンキョー株式会社 文字列認識装置および文字列認識方法
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
KR101295000B1 (ko) * 2013-01-22 2013-08-09 주식회사 케이지모빌리언스 카드 번호의 영역 특성을 이용하는 신용 카드의 번호 인식 시스템 및 신용 카드의 번호 인식 방법
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
JP6188052B2 (ja) * 2013-02-26 2017-08-30 Kddi株式会社 情報システム及びサーバー
CN103488984B (zh) * 2013-10-11 2017-04-12 瑞典爱立信有限公司 基于智能移动设备的二代身份证识别方法及装置
KR20150047060A (ko) 2013-10-23 2015-05-04 주식회사 디오텍 명함 이미지 여부를 판별하는 장치 및 방법
CN104573616A (zh) * 2013-10-29 2015-04-29 腾讯科技(深圳)有限公司 一种信息识别方法、相关装置及系统
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统

Also Published As

Publication number Publication date
KR20170061630A (ko) 2017-06-05
WO2017071062A1 (zh) 2017-05-04
RU2642404C2 (ru) 2018-01-24
US10127471B2 (en) 2018-11-13
CN105426818A (zh) 2016-03-23
CN105426818B (zh) 2019-07-02
US20170124718A1 (en) 2017-05-04
MX364147B (es) 2019-04-12
JP2018500704A (ja) 2018-01-11
EP3163504B1 (en) 2019-01-02
EP3163504A1 (en) 2017-05-03
MX2016003769A (es) 2017-05-30
JP6396605B2 (ja) 2018-09-26
KR101760109B1 (ko) 2017-07-31

Similar Documents

Publication Publication Date Title
RU2016110818A (ru) Способ и устройство для извлечения области изображения
RU2016110142A (ru) Способ и устройство для идентификации области
RU2016110434A (ru) Способ и устройство для идентификации области
RU2016109047A (ru) Способ и устройство для идентификации области
EP3309705B1 (en) Qr code feature detection method and system
Khayyat et al. Arabic handwritten text line extraction by applying an adaptive mask to morphological dilation
RU2014112237A (ru) Ввод данных с изображений документов с фиксированной структурой
US10354111B2 (en) Primary localization method and system for QR codes
US11017260B2 (en) Text region positioning method and device, and computer readable storage medium
CN104794421A (zh) 一种qr码定位及识别方法
CN103473537B (zh) 一种目标图像轮廓特征表示方法及装置
CN102663378A (zh) 连笔手写字符的识别方法
US11074443B2 (en) Method and device for acquiring slant value of slant image, terminal and storage medium
WO2021253633A1 (zh) 一种批量二维码的识别方法及识别终端
JP6338429B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
CN107845068A (zh) 图像视角变换装置以及方法
Hung et al. Skyline localization for mountain images
JP2012150595A (ja) 一時停止線検出装置及びプログラム
CN104616295A (zh) 新闻图像中水平标题字幕的简单快速定位方法
Ma et al. A new algorithm for characters segmentation of license plate based on variance projection and mean filter
CN105574526A (zh) 一种实现逐行扫描的方法及系统
CN113159031B (zh) 一种手写文本检测方法、装置及存储介质
Tian et al. Segmentation of touching characters in mathematical expressions using contour feature technique
JP2004334461A (ja) 文字認識装置及び文字認識プログラム
CN117291208B (zh) 一种二维码提取方法及系统