JP6085999B2 - 画像中の文字列を認識する方法及び装置 - Google Patents
画像中の文字列を認識する方法及び装置 Download PDFInfo
- Publication number
- JP6085999B2 JP6085999B2 JP2013046996A JP2013046996A JP6085999B2 JP 6085999 B2 JP6085999 B2 JP 6085999B2 JP 2013046996 A JP2013046996 A JP 2013046996A JP 2013046996 A JP2013046996 A JP 2013046996A JP 6085999 B2 JP6085999 B2 JP 6085999B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- width
- character string
- context feature
- language type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
(外7)
であり、そのうち、
(外8)
は、初期認識結果中の第i個文字の文字幅であり、
(外9)
は、
(外10)
の文字認識信頼度である。即ち、文字認識信頼度
(外11)
を重み係数の値とする。例えば、目標文字の左側にある第一個の文字の右境界から、該目標文字の右側にある第一個の文字の左境界までの距離(図8Aに示すように)を、該目標文字の文字幅
(外12)
とすることができる。理解すべきは、これは、文字幅の1つの例だけである。例えば、文字幅は、文字自身の幅、文字の両側にある隙間の幅と該文字自身の幅との和、文字の両側にある隙間の幅の半分と該文字自身の幅との和、文字自身の幅と該文字の右側にある隙間の幅との和、及び、文字自身の幅と該文字の左側にある隙間の幅との和、のうちの何れか1つであってもよい。
(外13)
であり、そのうち、
(外14)
は、初期認識結果中の第i個文字の文字幅であり、
(外15)
は、
(外16)
の文字認識信頼度である。差異確定サブユニット1015-5は、経路中の各文字の文字幅と、重み付き平均文字幅との間の差を確定することができる。第二計算サブユニット1015-6は、この差に基づいて文字幅文脈特徴を算出することができる。
画像中の文字列を認識する方法であって、
前記画像中の文字列領域を抽出するステップと、
前記文字列領域に対してオーバーセグメンテーションを行うステップと、
言語種類文脈特徴及び文字幅文脈特徴のうちの少なくとも1つの特徴に基づいて、経路探索戦略により前記文字列領域に含まれる文字列を認識するステップと、を含む、方法。
付記1に記載の方法であって、
前記言語種類文脈特徴は、各探索経路について、
前記探索経路中の各文字及びその一つの隣接する文字が同じ種類の言語に属するかどうかを確定し、及び、
前記確定結果に基づいて、前記言語種類文脈特徴を計算することにより確定される、方法。
付記1に記載の方法であって、
前記言語種類文脈特徴は、各探索経路について、
前記探索経路中の各文字及びその複数の隣接する文字中の各隣接する文字が同じ種類の言語に属するかどうかを確定し、及び、
前記確定結果に基づいて、前記言語種類文脈特徴を計算することより確定される、方法。
付記1に記載の方法であって、
前記文字幅文脈特徴は、各探索経路について、
前記文字列領域に対して初期認識を行い、
前記初期認識結果に基づいて、次の数5により重み付き平均文字幅を推定し、
前記探索経路中の各文字の文字幅と、前記重み付き平均文字幅との間の差を確定し、及び、
前記差に基づいて、前記文字幅文脈特徴を計算することにより確定され、
(外17)
は、前記初期認識結果中の第i個文字の文字幅であり、
(外18)
は、
(外19)
の信頼度である、方法。
付記4に記載の方法であって、
前記文字幅は、文字自身の幅、文字の両側にある隙間の幅と該文字自身の幅との和、文字の両側にある隙間の幅の半分と該文字自身の幅との和、文字自身の幅と該文字の右側にある隙間の幅との和、及び、文字自身の幅と該文字の左側にある隙間の幅との和、のうちの何れか1つである、方法。
付記1乃至5の何れか1つに記載の方法であって、
前記文字列領域に対してオーバーセグメンテーションを行う前に、前記文字列領域に対して前処理を行うステップを更に含む、方法。
付記1乃至5の何れか1つに記載の方法であって、
言語種類文脈特徴及び文字幅文脈特徴のうちの少なくとも1つの特徴に基づいて、経路探索戦略により前記文字列領域に含まれる文字列を認識するステップは、
前記言語種類文脈特徴及び前記文字幅文脈特徴のうちの少なくとも1つの特徴と、単字認識器特徴、語義文脈特徴及び幾何学的文脈特徴のうちの少なくとも1つの特徴とに基づいて、前記経路探索戦略により前記文字列領域に含まれる文字列を認識するステップを含む、方法。
画像中の文字列を認識する装置であって、
前記画像中の文字列領域を抽出する抽出ユニットと、
前記文字列領域に対してオーバーセグメンテーションを行う分割ユニットと、
言語種類文脈特徴及び文字幅文脈特徴のうちの少なくとも1つの特徴に基づいて、経路探索戦略により前記文字列領域に含まれる文字列を認識する認識ユニットと、を含む、装置。
付記8に記載の装置であって、
前記認識ユニットは、
前記探索経路中の各文字及びその1つの隣接する文字が同じ種類の言語に属するかどうかを確定する言語種類確定サブユニットと、
前記確定結果に基づいて、前記言語種類文脈特徴を計算する第一計算サブユニットと、を含む、装置。
付記8に記載の装置であって、
前記認識ユニットは、
前記探索経路中の各文字及びその複数の隣接する文字中の各隣接する文字が同じ種類の言語に属するかどうかを確定する言語種類確定サブユニットと、
前記確定結果に基づいて、前記言語種類文脈特徴を計算する第一計算サブユニットと、を含む、装置。
付記8に記載の装置であって、
前記認識ユニットは、
前記文字列領域に対して初期認識を行う初期認識サブユニットと、
前記初期認識結果に基づいて、次の数6により重み付き平均文字幅を推定する平均文字幅推定サブユニットと、
前記探索経路中の各文字の文字幅と、前記重み付き平均文字幅との間の差を確定する差異確定サブユニットと、
前記差に基づいて、前記文字幅文脈特徴を計算する第二計算サブユニットと、を含み、
(外20)
は、前記初期認識結果中の第i個文字の文字幅であり、
(外21)
は、
(外22)
の信頼度である、装置。
付記11に記載の装置であって、
前記文字幅は、文字自身の幅、文字の両側にある隙間の幅と該文字自身の幅との和、文字の両側にある隙間の幅の半分と該文字自身の幅との和、文字自身の幅と該文字の右側にある隙間の幅との和、及び、文字自身の幅と該文字の左側にある隙間の幅との和、のうちの何れか1つである、装置。
付記8乃至12の何れか1つに記載の装置であって、
前記文字列領域に対して前処理を行う前処理ユニットを更に含む、装置。
付記8乃至12の何れか1つに記載の装置であって、
前記認識ユニットは、前記言語種類文脈特徴及び前記文字幅文脈特徴のうちの少なくとも1つの特徴と、単字認識器特徴、語義文脈特徴及び幾何学的文脈特徴のうちの少なくとも1つの特徴とに基づいて、前記経路探索戦略により前記文字列領域に含まれる文字列を認識する、装置。
コンピュータに、付記1に記載の方法の各ステップを実行させるためのプログラム。
付記15に記載のプログラムを記録しているコンピュータ読み出し可能な記憶媒体。
Claims (10)
- 画像中の文字列を認識する方法であって、
前記画像中の文字列領域を抽出する抽出ステップと、
前記文字列領域に対してオーバーセグメンテーションを行う分割ステップと、
言語種類文脈特徴及び文字幅文脈特徴のうちの少なくとも1つの特徴に基づいて、経路探索戦略により前記文字列領域に含まれる文字列を認識する認識ステップと、を含み、
前記文字幅文脈特徴は、各探索経路について、
前記文字列領域に対して初期認識を行い、
前記初期認識の結果に基づいて、次の数7により重み付き平均文字幅を推定し、
前記探索経路中の各文字の文字幅と、前記重み付き平均文字幅との間の差を確定し、
前記差に基づいて、前記文字幅文脈特徴を計算することにより確定され、
ここで、
(外23)
は、前記重み付き平均文字幅であり、
(外24)
は、前記初期認識の結果中の第i個文字の文字幅であり、
(外25)
は、
(外26)
の信頼度である、方法。 - 請求項1に記載の方法であって、
前記言語種類文脈特徴は、各探索経路について、
前記探索経路中の各文字及びその一つの隣接する文字が同じ種類の言語に属するかどうかを確定し、
前記確定の結果に基づいて、前記言語種類文脈特徴を計算することにより確定される、方法。 - 請求項1に記載の方法であって、
前記言語種類文脈特徴は、各探索経路について、
前記探索経路中の各文字及びその複数の隣接する文字中の各隣接する文字が同じ種類の言語に属するかどうかを確定し、
前記確定の結果に基づいて、前記言語種類文脈特徴を計算することより確定される、方法。 - 請求項1に記載の方法であって、
前記文字幅は、文字自身の幅、文字の両側にある隙間の幅と該文字自身の幅との和、文字の両側にある隙間の幅の半分と該文字自身の幅との和、文字自身の幅と該文字の右側にある隙間の幅との和、及び、文字自身の幅と該文字の左側にある隙間の幅との和、のうちの何れか1つである、方法。 - 画像中の文字列を認識する装置であって、
前記画像中の文字列領域を抽出する抽出ユニットと、
前記文字列領域に対してオーバーセグメンテーションを行う分割ユニットと、
言語種類文脈特徴及び文字幅文脈特徴のうちの少なくとも1つの特徴に基づいて、経路探索戦略により前記文字列領域に含まれる文字列を認識する認識ユニットと、を含み、
前記認識ユニットは、
前記文字列領域に対して初期認識を行う初期認識サブユニットと、
前記初期認識の結果に基づいて、次の数8により重み付き平均文字幅を推定する平均文字幅推定サブユニットと、
前記探索経路中の各文字の文字幅と、前記重み付き平均文字幅との間の差を確定する差異確定サブユニットと、
前記差に基づいて、前記文字幅文脈特徴を計算する第二計算サブユニットと、を含み、
ここで、
(外27)
は、前記重み付き平均文字幅であり、
(外28)
は、前記初期認識の結果中の第i個文字の文字幅であり、
(外29)
は、
(外30)
の信頼度である、装置。 - 請求項5に記載の装置であって、
前記認識ユニットは、
前記探索経路中の各文字及びその1つの隣接する文字が同じ種類の言語に属するかどうかを確定する言語種類確定サブユニットと、
前記確定の結果に基づいて、前記言語種類文脈特徴を計算する第一計算サブユニットと、を含む、装置。 - 請求項5に記載の装置であって、
前記認識ユニットは、
前記探索経路中の各文字及びその複数の隣接する文字中の各隣接する文字が同じ種類の言語に属するかどうかを確定する言語種類確定サブユニットと、
前記確定の結果に基づいて、前記言語種類文脈特徴を計算する第一計算サブユニットと、を含む、装置。 - 請求項5に記載の装置であって、
前記文字幅は、文字自身の幅、文字の両側にある隙間の幅と該文字自身の幅との和、文字の両側にある隙間の幅の半分と該文字自身の幅との和、文字自身の幅と該文字の右側にある隙間の幅との和、及び、文字自身の幅と該文字の左側にある隙間の幅との和、のうちの何れか1つである、装置。 - コンピュータに、請求項1〜4の任意の一項に記載の方法を実行させるためのプログラム。
- 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201210062124.3 | 2012-03-09 | ||
| CN2012100621243A CN103310209A (zh) | 2012-03-09 | 2012-03-09 | 识别图像中的字符串的方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013186906A JP2013186906A (ja) | 2013-09-19 |
| JP6085999B2 true JP6085999B2 (ja) | 2017-03-01 |
Family
ID=49135405
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013046996A Expired - Fee Related JP6085999B2 (ja) | 2012-03-09 | 2013-03-08 | 画像中の文字列を認識する方法及び装置 |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP6085999B2 (ja) |
| CN (1) | CN103310209A (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104399674A (zh) * | 2014-09-11 | 2015-03-11 | 上海大学 | 烟箱品牌视觉检测分拣系统 |
| CN107016387B (zh) * | 2016-01-28 | 2020-02-28 | 苏宁云计算有限公司 | 一种识别标签的方法及装置 |
| CN107092902B (zh) * | 2016-02-18 | 2021-04-06 | 富士通株式会社 | 字符串的识别方法和系统 |
| CN108133208B (zh) * | 2016-12-01 | 2021-04-09 | 北京新唐思创教育科技有限公司 | 一种版面分析中的字符切分方法及其装置 |
| CN109814733B (zh) * | 2019-01-08 | 2022-11-08 | 百度在线网络技术(北京)有限公司 | 基于输入的推荐信息生成方法和装置 |
| CN116343209B (zh) * | 2023-03-14 | 2025-10-03 | 广东电网有限责任公司广州供电局 | 运用于机器人流程自动化的字符串识别方法、设备及介质 |
| CN120013972B (zh) * | 2025-04-21 | 2025-07-08 | 北京霍里思特科技有限公司 | 图像分割方法、图像分割装置、物料分选设备及存储介质 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04335487A (ja) * | 1991-05-10 | 1992-11-24 | Ricoh Co Ltd | 文字認識装置の文字切り出し方法 |
| JP2940747B2 (ja) * | 1992-10-13 | 1999-08-25 | 三洋電機株式会社 | 文字切り出し装置 |
| JP3313272B2 (ja) * | 1996-01-08 | 2002-08-12 | 株式会社日立製作所 | 住所読み取り方法および識別関数重みベクトル生成方法 |
| US6246794B1 (en) * | 1995-12-13 | 2001-06-12 | Hitachi, Ltd. | Method of reading characters and method of reading postal addresses |
| JPH10198761A (ja) * | 1997-01-09 | 1998-07-31 | Oki Electric Ind Co Ltd | 文字認識方法および文字認識装置 |
| JP3919617B2 (ja) * | 2002-07-09 | 2007-05-30 | キヤノン株式会社 | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 |
| JP2005141329A (ja) * | 2003-11-04 | 2005-06-02 | Toshiba Corp | 手書き文字認識装置、及び手書き文字認識方法 |
| JP5322517B2 (ja) * | 2008-07-08 | 2013-10-23 | キヤノン株式会社 | 画像処理装置および方法 |
| CN102289662A (zh) * | 2011-07-28 | 2011-12-21 | 南京大学 | 一种二值工程图中的字符检测方法 |
-
2012
- 2012-03-09 CN CN2012100621243A patent/CN103310209A/zh active Pending
-
2013
- 2013-03-08 JP JP2013046996A patent/JP6085999B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2013186906A (ja) | 2013-09-19 |
| CN103310209A (zh) | 2013-09-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6085999B2 (ja) | 画像中の文字列を認識する方法及び装置 | |
| US11769111B2 (en) | Probabilistic language models for identifying sequential reading order of discontinuous text segments | |
| CN110135427B (zh) | 用于识别图像中的字符的方法、装置、设备和介质 | |
| US10372821B2 (en) | Identification of reading order text segments with a probabilistic language model | |
| Bissacco et al. | Photoocr: Reading text in uncontrolled conditions | |
| CN113780098B (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
| US20210124976A1 (en) | Apparatus and method for calculating similarity of images | |
| US9286527B2 (en) | Segmentation of an input by cut point classification | |
| CN109948615A (zh) | 多语言文本检测识别系统 | |
| US9977995B2 (en) | Image clustering method, image clustering system, and image clustering server | |
| KR101028670B1 (ko) | 언어모델과 ocr을 이용하여 문서에 포함된 문자열을 인식하는 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
| US9424823B2 (en) | Method and apparatus for recognising music symbols | |
| Hussain et al. | Nastalique segmentation-based approach for Urdu OCR | |
| CN112784009A (zh) | 一种主题词挖掘方法、装置、电子设备及存储介质 | |
| CN113537187A (zh) | 文本识别方法、装置、电子设备及可读存储介质 | |
| RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
| CN113469005A (zh) | 一种银行回单的识别方法、相关装置及存储介质 | |
| CN114398952A (zh) | 训练文本生成方法、装置、电子设备及存储介质 | |
| US20200349389A1 (en) | Method and device for training image recognition model and related device | |
| CN116110066A (zh) | 票据文本的信息提取方法、装置、设备及存储介质 | |
| CN110879972A (zh) | 一种人脸检测方法及装置 | |
| CN102968610B (zh) | 收据图像处理方法和设备 | |
| US12462589B2 (en) | Text line detection | |
| US20250111687A1 (en) | Annotation alignment algorithm analysis for character recognition | |
| CN117632110A (zh) | 基于图像的前端代码生成方法、装置、设备及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151007 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160927 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161025 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161209 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170104 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170117 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6085999 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |
