JP5337194B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP5337194B2 JP5337194B2 JP2011097195A JP2011097195A JP5337194B2 JP 5337194 B2 JP5337194 B2 JP 5337194B2 JP 2011097195 A JP2011097195 A JP 2011097195A JP 2011097195 A JP2011097195 A JP 2011097195A JP 5337194 B2 JP5337194 B2 JP 5337194B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- inclination
- character string
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
このような、文書画像へのルビふりシステムにおいて、例えば図17に示すように、原文書がわずかに傾いてスキャンされ文字列L11が傾いているような場合や、原文書中に傾いた文字列L11が存在する場合でも、ルビの美観上、その傾いた文字列に沿って傾けてルビを生成するために、文書画像中の各文字列の正しい傾き値を取得することが必要である。このルビ生成以外の処理でも、正しい文字列の傾き値が必要である。
また、回帰計算をしない方法としては、文字列の始端の文字と終端の文字の座標から、この2個の文字の間の傾きを求め、上記文字列の傾き値とする方法がある。
例えば原文書の文字が英字だと、図18に示すように文字に外接する矩形B11の上端や下端の高さが揃っておらず、文字配置によっては、これらの座標を回帰するだけでは、図19に示すように真の傾きK11と求められた傾きK12とで異なる場合がある。さらに、回帰計算が必要なので、計算量が多い。
また、回帰計算をせずに文字列の始端の文字と終端の文字のみから文字列の傾きを求める方法では、始端の文字および終端の文字次第で、真の傾きと求められた傾きとがより大きく異なる場合がある。
本発明の画像処理装置は、図1の参照符号10で例示するように、光学文字認識部11と、翻訳部12と、傾き取得部13と、画像処理部14とを備える。
翻訳部12は、不図示の記憶部に格納された翻訳辞書に基づいて、光学文字認識部11で認識した文字を翻訳し翻訳文データを作成する。
傾き取得部13は、光学文字認識部11で取得した文字列の傾き値を取得し画像処理部14に出力する。傾き取得部13が有する類似文字抽出部13aと傾き算出部13bについては後述する。
画像処理部14は、光学文字認識部11から出力された文字列の情報と翻訳部12からの翻訳文データと傾き算出部13からの傾きとに基づいて、画像処理を行い、文字列に沿って翻訳文が付与された画像データを作成する。
このように画像処理装置10では、文字列を構成する同一または類似の文字からなる文字群だけ利用して文字列の傾き値を算出するので、文字に外接する矩形形状のばらつきに起因する問題が生じず、正しい(文字配置意図どおりの)傾きが算出できる。
類似文字抽出部13aは、上述のように、光学文字認識部11で取得した文字列を構成する文字のうち互いに形が同一または類似の文字からなる文字群を抽出するものであり、より具体的には、例えば、光学文字認識部11で取得した文字列を構成する文字のうちで最も多い文字からなる実頻出文字群を抽出する。
この文字群に基づいて文字列の傾き値を算出する場合、同一の文字だけ利用するので、文字に外接する矩形形状のばらつきに起因する問題が生じず、正しい(傾き値が算出できる。
類似文字抽出部13aは、図2の例の他に、例えば、光学文字認識部11で取得した文字列の言語の種別を翻訳辞書に基づいて判定し、当該言語において一般的に出現頻度が高く且つ当該文字の外接矩形が揃っている文字(以下、一般頻出文字)を取得する。なお、一般頻出文字は、例えば、不図示の記憶部に言語毎にリストとして格納されており、図3のリストT1には、英語の一般頻出文字である「a」,「c」,「e」,「o」,「s」が記載されている。そして、類似文字抽出部13aは、取得した一般頻出文字であって文字認識した文字列を構成する文字からなる文字群(一般頻出文字群)を抽出する。
この一般頻出文字群に基づいて文字列の傾き値を算出する場合、文字の外接矩形の寸法や、文字列の進行方向に対し垂直な方向へのオフセット量がほぼ揃っている文字だけを利用するので、文字の外接矩形形状のばらつきに起因する問題の影響を最小限にすることができ、正しい傾きが算出できる。また、図2の方法では文字列の傾き値を算出するために十分な数の文字データが利用できない場合に、本例では、上記十分な数の文字データが利用できる可能性がある。
類似文字抽出部13aは、傾き値算出用に抽出した文字群を構成する全ての文字を傾き算出部13bに出力してもよいが、構成する文字数が多い場合などは、一部の文字を抜粋して出力するようにしてもよい。
この方法では、少ない計算量で適切な傾き値が得られる。
2本の文字列L4,L5(図6参照)が1本の文字列として認識された場合、傾き算出部13bは、類似文字抽出部13aから出力された文字群の中から、傾き増減方向に関わる座標の差が最も小さい組み合わせの文字を取得し、該取得した文字についての座標情報のみに基づいて文字列の傾き値を算出する。
このように文字列の傾き値を算出することにより以下の効果がある。すなわち、原文書画像において又は読み込み時にあまり傾いていない2本の文字列L4,L5が1本の文字列として文字認識された場合に、正しい傾きK1(図6参照)に近い傾きK3を少ない計算量で算出することができる。
2本の文字列L6,L7が1本の文字列として認識された場合、傾き算出部13bは、類似文字抽出部13aから出力された文字群の全ての隣接する2つの文字間の傾き値を取得し、取得した文字間の傾き値群のうち統計的に外れ値である傾き値(他と大きく異なる傾き値)を除いたものから文字列の傾き値を算出する。
このように文字列の傾き値を算出することにより以下の効果がある。すなわち、原文書画像において又は読み込み時に傾いていない2本の文字列が1本の文字列として文字認識された場合だけでなく、原文書において又は読み込み時に傾いている2本の文字列L6,L7が一本の文字列として文字認識された場合でも、正しい文字列の傾き値を算出することができる。
このように傾きが微小な場合は傾いていないと扱うことによって以下のような効果がある。すなわち、例えば、原文に対応する訳語等のルビをその原文に沿わせる形態で出力する際に、出力媒体(例えば、表示装置やプリンタや、あるいはそれらのドライバ)の解像度によっては出力文字列(ルビ)において微小な傾きがうまく表現されずに段差があるように表示される問題が解消され、美しく出力される。また、ルビ配置の際の計算量も削減される。本例のようなルビではなく、原文のテキストデータを原文書の傾きを再現して出力するような場合でも、同様に美しく出力され且つ計算量が削減される。
画像処理装置100は、図示するように、光学文字認識部11で文字列と該文字列を構成する文字の座標情報を取得すると、傾き取得部13が文字列の座標系が当初より90度、180度または270度回転した状態の座標系になるよう座標変換し(ステップS1)、上記座標情報を再取得する。これにより、例えば、図9〜図11に示す、文字列の座標値が取得される。
ステップS4では、類似文字抽出部13aが、取得した実頻出文字群と一般頻出文字群のいずれかを選択抽出する。
続いて、類似文字抽出部13aが、選択抽出した文字群のうちから全部または一部の文字を抜粋し、文字群として傾き算出部13bに出力する(ステップS5)。そして、傾き算出部13bが文字列の傾き値を算出する(ステップS6)。
まず、類似文字抽出部13aが、傾き値を取得する対象の文字列が2字以下か否か判定する(ステップS11)。2字以下の場合(NOの場合)は、従来と同様の方法で文字列の傾き値を取得するので処理を終了し、2字より多い場合(YESの場合)は、実頻出文字群が1字以下か否か判定する(ステップS12)。
ステップS12において実頻出文字群が1字より多い場合(NOの場合)、一般頻出文字群が1字以下か否かを判定し(ステップS15)、1字以下の場合(YESの場合)は、実頻出文字を選択抽出する(ステップS21)。1字より多い場合(NOの場合)は、ステップS16に処理を進める。
なお、詳細は省略するが、対象の文字列が2字の場合や、実頻出文字群が1字で一般頻出文字群が1字以下の場合は、従来と同様、文字列を構成する全ての文字や両端の文字の座標情報に基づいて文字列の傾き値を算出する。
まず、類似文字抽出部13aが、選択抽出した文字群の文字数が4以下であるか否か判定する(ステップS31)。4字以下の場合(YESの場合)は、全ての文字を抜粋し、文字群として、傾き算出部13bに出力し(ステップS32)、4字より多い場合(NOの場合)、選択抽出した文字群の文字数を3で割った結果の整数値aを取得する(ステップS33)。そして、選択抽出した文字群のうち、両端の文字と、両端の文字からa字内側の文字を抜粋し、文字群として、傾き算出部13bに出力する(ステップS34)。
そして、Y座標の差が最も小さい文字間の傾き値を文字列の傾き値として算出する(ステップS42)。図10の例では、抜粋された文字のうち、文字番号2の文字「s」と文字番号5の文字「s」の差が最も小さい「2.0」であることが分かるので、この2つの文字間の傾き値が(409.0−407.0/209・0−160.5)=0.041が文字列の傾き値として算出される。
そして、傾き算出部13bは、残った文字間の傾き値から文字列の傾き値を算出する(ステップS54)。例えば、図10の例では、残った傾き値「0.1875」,「0.1867」の平均値「0.1871」を文字列の傾き値として算出する。
Claims (8)
- 文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
前記類似文字抽出部は、前記文字列を構成する文字のうちで最も多い文字からなる文字群を抽出することを特徴とする画像処理装置。 - 文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
前記類似文字抽出部は、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群を抽出することを特徴とする画像処理装置。 - 文書読取装置で読み取られた文書画像から光学文字認識された文字からなる文字列を構成する文字のうち互いに形状及び大きさが同一または類似の文字からなる文字群を抽出し出力する類似文字抽出部と、該類似文字抽出部から出力された文字群の各文字の位置情報に基づいて前記文字列の傾き値を算出する傾き算出部を有し、
前記類似文字抽出部は、前記文字列を構成する文字のうちで最も多い文字からなる文字群と、前記文字列における言語において一般的に出現頻度が高い文字からなる文字群とのうち、前記文字列内において文字間隔がより均等である文字群を抽出することを特徴とする画像処理装置。 - 前記類似文字抽出部は、抽出した前記文字群中から抜粋した文字からなる文字群を出力することを特徴とする請求項1〜3のいずれか1項に記載の画像処理装置。
- 前記傾き算出部は、前記類似文字抽出部から出力された文字群の文字のうち傾き増減方向の座標の差が最も小さい2つの文字の間の傾き値を算出し、該傾き値を前記文字列の傾き値とすることを特徴とする請求項1〜4のいずれか1項に記載の画像処理装置。
- 前記傾き算出部は、前記類似文字抽出部から出力された文字群における全ての隣接する2つの文字間の傾き値を算出し、該算出された文字間の傾き値の群のうち統計的に外れ値であるものを除いた前記文字間の傾き値の群から、前記文字列の傾き値を算出することを特徴とする請求項1〜4のいずれか1項に記載の画像処理装置。
- 文書読取装置における文書の読取態様によらず、前記傾き算出部で算出される前記文字列の傾き値が所定の範囲内となるように、当該文字列を構成する文字を含む画像の座標系が予め変換されることを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。
- 前記傾き算出部で算出した前記文字列の傾き値が所定値以下の場合は、前記文字列の傾き値として0を出力することを特徴とする請求項1〜7のいずれか1項に記載の画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097195A JP5337194B2 (ja) | 2011-04-25 | 2011-04-25 | 画像処理装置 |
US13/417,446 US8705862B2 (en) | 2011-04-25 | 2012-03-12 | Image processing apparatus |
CN201210119225.XA CN102760233B (zh) | 2011-04-25 | 2012-04-20 | 图像处理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097195A JP5337194B2 (ja) | 2011-04-25 | 2011-04-25 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012230480A JP2012230480A (ja) | 2012-11-22 |
JP5337194B2 true JP5337194B2 (ja) | 2013-11-06 |
Family
ID=47021389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011097195A Active JP5337194B2 (ja) | 2011-04-25 | 2011-04-25 | 画像処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8705862B2 (ja) |
JP (1) | JP5337194B2 (ja) |
CN (1) | CN102760233B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5624671B2 (ja) * | 2011-03-04 | 2014-11-12 | グローリー株式会社 | 文字列切出方法及び文字列切出装置 |
US9165363B2 (en) * | 2011-08-03 | 2015-10-20 | Hitachi Medical Corporation | Image diagnostic device and image correction method |
CN104298982B (zh) * | 2013-07-16 | 2019-03-08 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
US10089411B2 (en) * | 2014-01-02 | 2018-10-02 | Neustar Inc. | Method and apparatus and computer readable medium for computing string similarity metric |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
CN110032996B (zh) * | 2018-01-11 | 2021-06-04 | 台达电子工业股份有限公司 | 分类基础式的字符倾斜校正装置及其方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2669661B2 (ja) * | 1988-08-05 | 1997-10-29 | 日本電信電話株式会社 | 文書画像処理方法 |
JP3260979B2 (ja) * | 1994-07-15 | 2002-02-25 | 株式会社リコー | 文字認識方法 |
US5638466A (en) * | 1995-08-30 | 1997-06-10 | Horizon Marketing Corporation Aka Wordwand | Method and apparatus for deskewing images of symbols having a non-linear baseline |
JP3541093B2 (ja) * | 1995-10-12 | 2004-07-07 | 株式会社リコー | 文書画像の傾き検出方法および装置 |
JPH1069520A (ja) * | 1996-06-18 | 1998-03-10 | Nippon Steel Corp | 文字認識方法及びプログラムを記録した記録媒体 |
US7050632B2 (en) * | 2002-05-14 | 2006-05-23 | Microsoft Corporation | Handwriting layout analysis of freeform digital ink input |
JP4553241B2 (ja) * | 2004-07-20 | 2010-09-29 | 株式会社リコー | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
JP4909216B2 (ja) * | 2006-09-13 | 2012-04-04 | 株式会社キーエンス | 文字切り出し装置、方法およびプログラム |
TWI319547B (en) * | 2006-12-01 | 2010-01-11 | Compal Electronics Inc | Method for generating typographical line |
TWI385584B (zh) * | 2008-11-05 | 2013-02-11 | Avermedia Information Inc | 自動排列手寫字串之裝置及方法 |
JP4948586B2 (ja) | 2009-11-06 | 2012-06-06 | シャープ株式会社 | 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 |
-
2011
- 2011-04-25 JP JP2011097195A patent/JP5337194B2/ja active Active
-
2012
- 2012-03-12 US US13/417,446 patent/US8705862B2/en active Active
- 2012-04-20 CN CN201210119225.XA patent/CN102760233B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102760233B (zh) | 2015-04-15 |
CN102760233A (zh) | 2012-10-31 |
JP2012230480A (ja) | 2012-11-22 |
US8705862B2 (en) | 2014-04-22 |
US20120269438A1 (en) | 2012-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5337194B2 (ja) | 画像処理装置 | |
JP3343864B2 (ja) | 語体の分離方法 | |
Berg-Kirkpatrick et al. | Unsupervised transcription of historical documents | |
JP4741977B2 (ja) | 手書文字処理装置及び手書文字処理方法 | |
EP3940589B1 (en) | Layout analysis method, electronic device and computer program product | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
US8208726B2 (en) | Method and system for optical character recognition using image clustering | |
CN107330430B (zh) | 藏文字符识别装置与方法 | |
Calvo-Zaragoza et al. | Avoiding staff removal stage in optical music recognition: application to scores written in white mensural notation | |
US7929772B2 (en) | Method for generating typographical line | |
US20130287300A1 (en) | Defining a layout of text lines of cjk and non-cjk characters | |
JP2011141749A (ja) | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム | |
JP5343617B2 (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
CN108052936A (zh) | 一种盲文图像自动倾斜校正方法及系统 | |
US8989485B2 (en) | Detecting a junction in a text line of CJK characters | |
JP2013254321A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN104850819B (zh) | 信息处理方法及电子设备 | |
CN103489268A (zh) | 一种用于pos平台的阿拉伯语显示方法 | |
US20210303842A1 (en) | Information processing device and non-transitory computer readable medium | |
JP4087191B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP5604276B2 (ja) | 文書画像生成装置および文書画像生成方法 | |
JP2021152735A (ja) | 情報処理装置及びプログラム | |
JP5531493B2 (ja) | 文字認識装置、文字認識方法、プログラム及び記録媒体 | |
JP7034823B2 (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
Zheng et al. | A new method for baseline extraction of Manchu word |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130416 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5337194 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |