JP5600723B2 - 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム - Google Patents
様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム Download PDFInfo
- Publication number
- JP5600723B2 JP5600723B2 JP2012245617A JP2012245617A JP5600723B2 JP 5600723 B2 JP5600723 B2 JP 5600723B2 JP 2012245617 A JP2012245617 A JP 2012245617A JP 2012245617 A JP2012245617 A JP 2012245617A JP 5600723 B2 JP5600723 B2 JP 5600723B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- division
- width
- average
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Character Input (AREA)
Description
本発明は、光学式文字認識に関するものであり、より詳しくは、様々な文字幅を有するテキスト行の文字を分割するための方法及びシステムに関するものである。
光学式文字認識(OCR)システムでは、一般的には、OCR処理は、図3のフローチャートで示されるように実行される。まず、スキャナあるいはカメラ、あるいは他の手段によって取得される文書画像(文書イメージ)が入力される。次に、複数のテキスト行を含む文書画像は、テキスト行画像に分割される。各テキスト行画像に対して、そのテキスト行内の文字に対して文字分割が実行される。その後、文字分割の結果に基づいて、文字認識が実行されて、文字認識結果を生成する。
本発明の一態様に従えば、様々な文字幅を有するテキスト行の文字を分割するための方法が提供される。この方法は、
投影法に基づいて、前記テキスト行を第1の文字のセットに分割する第1の分割ステップと、
前記第1の文字のセットに基づいて第1の平均文字幅を計算する計算ステップと、
計算された前記第1の平均文字幅に基づいて、前記第1の文字のセットの幅広文字を強制分割して、第2の文字のセットを取得する強制分割ステップと、
前記第2の文字のセットの文字に対して、前記テキスト行に隣接する行の平均文字幅または隣接する文字群の文字高さに基づいて第2の平均文字幅を設定する設定ステップと、
前記第1及び第2の平均文字幅に従って、前記第2の文字のセットの文字を結合して複数の分割パターンを作成し、それぞれの分割パターンの文字認識結果に基づいて1つの分割パターンを選択する結合ステップと
を有する。
投影法に基づいて、前記テキスト行を第1の文字のセットに分割するように構成されている第1の分割ユニットと、
前記第1の文字のセットに基づいて第1の平均文字幅を計算するように構成されている計算ユニットと、
計算された前記第1の平均文字幅に基づいて、前記第1の文字のセットの幅広文字を強制分割して、第2の文字のセットを取得するように構成されている強制分割ユニットと、
前記第2の文字のセットの文字に対して、前記テキスト行に隣接する行の平均文字幅または隣接する文字群の文字高さに基づいて第2の平均文字幅を設定するように構成されている設定ユニットと、
前記第1及び第2の平均文字幅に従って、前記第2の文字のセットの文字を結合して複数の分割パターンを作成し、それぞれの分割パターンの文字認識結果に基づいて1つの分割パターンを選択するように構成されている結合ユニットと
を備える。
b)分割点の黒画素投影量が、範囲Aの黒画素投影量の最大値の1/3よりも小さいこと
c)分割点に対応する画素列(あるいは行)内に1つの黒画素ブロックだけが存在すること、黒画素ブロックは、連続する黒画素のグループを意味する
図9は、新規の分割点を追加する必要がある強制分割の例を示す図である。図9では、文字分割結果の場合が示されている。垂直線2は、平均文字幅に基づく検索位置である。正しい分割点は、分割点に対する検索範囲外になっている。垂直線1は、ステップS410−S440を実行することによって検出される分割位置である。また、垂直線3は、ステップS450で追加される新規の分割点である。
ii)2つの行の間の行の高さの差が閾値TH14より小さい、例えば、TH14=X*現在の行の高さあるいは隣接する行の高さの大きい方、ここで、X<0.5であり、好ましくは、X=3/10である。
Claims (18)
- 様々な文字幅を有するテキスト行の文字を分割するための方法であって、
投影法に基づいて、前記テキスト行を第1の文字のセットに分割する第1の分割ステップと、
前記第1の文字のセットに基づいて第1の平均文字幅を計算する計算ステップと、
計算された前記第1の平均文字幅に基づいて、前記第1の文字のセットの幅広文字を強制分割して、第2の文字のセットを取得する強制分割ステップと、
前記第2の文字のセットの文字に対して、前記テキスト行に隣接する行の平均文字幅または隣接する文字群の文字高さに基づいて第2の平均文字幅を設定する設定ステップと、
前記第1及び第2の平均文字幅に従って、前記第2の文字のセットの文字を結合して複数の分割パターンを作成し、それぞれの分割パターンの文字認識結果に基づいて1つの分割パターンを選択する結合ステップと
を有することを特徴とする方法。 - 前記強制分割ステップは、
幅が閾値より大きい幅広文字それぞれに対して、前記幅広文字、あるいは、該幅広文字と隣接する文字との組み合わせからなる複数の分割グループを生成し、前記平均文字幅に基づいて、各分割グループにおける取り得る分割点を検索し、そして、各分割点のスコアを取得するステップと、
前記分割グループにおける各分割点の前記スコアに基づいて、各分割グループに対するスコアを計算するステップと、
前記強制分割の結果として、すべての分割グループから、最小のスコアを有する前記分割グループを選択するステップと
を有する
ことを特徴とする請求項1に記載の方法。 - 前記強制分割ステップは、
選択された前記分割グループのスコアが閾値より大きい場合、投影法に基づいて、現在の文字幅の中間に新規の分割点を追加するステップを有する
ことを特徴とする請求項2に記載の方法。 - 前記各分割グループにおける取り得る分割点を検索し、そして、各分割点のスコアを取得するステップは、
前記第1の平均文字幅に従って、分割グループ内の1つ以上の検索位置を設定するステップと、
各検索位置に対して、前記第1の平均文字幅倍の幅と、前記検索位置が配置されている分割グループの幅の差に従って該検索位置の中心に置かれる分割点に対する検索範囲を動的に決定するステップと、
各検索範囲において、前記テキスト行が水平である場合には、各画素列に対する分割スコアを計算して、前記検索範囲内の分割点として、最小分割スコアを有する前記画素列を選択し、前記テキスト行が垂直である場合には、各画素行に対する分割スコアを計算して、前記検索範囲内の分割点として、最小分割スコアを有する前記画素行を選択するステップと、
各検索範囲に対して、最小分割スコアを有する前記画素列あるいは前記画素行を、自身の分割点として選択するステップと、
各分割グループに対して、自身の分割点とこれらの分割点のスコアを取得するステップと
を有する
ことを特徴とする請求項3に記載の方法。 - 前記設定ステップは、
前記第1の文字のセットの文字間の平均スペースを計算するステップと、
前記第1の文字のセットの文字の数と、前記第2の文字のセットの文字の数と、前記平均スペースに従って、前記テキスト行が、様々な幅を有する大量数の文字を含んでいるかを判定するステップと、
前記判定の結果が肯定である場合、強制分割によって分割した幅広文字に対して前記第2の平均文字幅を設定するステップと
を有する
ことを特徴とする請求項1に記載の方法。 - 前記設定ステップは、
前記強制分割によってのみ分割される隣接する文字の対象のグループであって、その対象のグループの最後の文字とその次の文字との間のスペースが閾値より大きいスペースとなっている対象のグループを検索するステップと、
前記対象のグループが検出される場合、前記対象のグループの幅−高さ−比率を計算するステップと、
前記対象のグループの幅−高さ−比率が閾値より小さい場合、前記対象のグループの第1の文字に対して前記第2の平均文字幅を設定するステップと
を有する
ことを特徴とする請求項1に記載の方法。 - 前記強制分割によって分割した幅広文字に対して前記第2の平均文字幅を設定するステップは、
現在のテキスト行に類似する高さを有する隣接するテキスト行を、類似行として検索するステップと、
前記類似行が検出される場合、前記類似行の平均文字幅を使用して、前記第2の平均文字幅を設定するステップと、
前記類似行が検出されない場合、前記計算するステップで計算される前記第1の平均文字幅に、直接、パラメータを乗算することによって、前記第2の平均文字幅を設定するステップと
を有する
ことを特徴とする請求項5に記載の方法。 - 前記分割パターンは、前記第2の文字のセットの隣接する文字群の組み合わせを示している
ことを特徴とする請求項1に記載の方法。 - 前記計算ステップにおいて、前記第1の平均文字幅は、
前記第1の文字のセットの平均文字幅を計算すること、
前記第1の文字のセットから選択される、所定の範囲内の幅−高さ−比率を有する文字の平均文字幅を計算すること、
直前あるいは次のテキスト行の平均文字幅に従って平均文字幅を計算すること、
前記テキスト行の高さに一定値を乗算することによって平均文字幅を計算すること
の内の1つで計算される
ことを特徴とする請求項1に記載の方法。 - 様々な文字幅を有するテキスト行の文字を分割するためのシステムであって、
投影法に基づいて、前記テキスト行を第1の文字のセットに分割するように構成されている第1の分割ユニットと、
前記第1の文字のセットに基づいて第1の平均文字幅を計算するように構成されている計算ユニットと、
計算された前記第1の平均文字幅に基づいて、前記第1の文字のセットの幅広文字を強制分割して、第2の文字のセットを取得するように構成されている強制分割ユニットと、
前記第2の文字のセットの文字に対して、前記テキスト行に隣接する行の平均文字幅または隣接する文字群の文字高さに基づいて第2の平均文字幅を設定するように構成されている設定ユニットと、
前記第1及び第2の平均文字幅に従って、前記第2の文字のセットの文字を結合して複数の分割パターンを作成し、それぞれの分割パターンの文字認識結果に基づいて1つの分割パターンを選択するように構成されている結合ユニットと
を備えることを特徴とするシステム。 - 前記強制分割ユニットは、
幅が閾値より大きい幅広文字それぞれに対して、前記幅広文字、あるいは、該幅広文字と隣接する文字との組み合わせからなる複数の分割グループを生成し、前記第1の平均文字幅に基づいて、各分割グループにおける取り得る分割点を検索し、そして、各分割点のスコアを取得するように構成されているユニットと、
前記分割グループにおける各分割点の前記スコアに基づいて、各分割グループに対するスコアを計算するように構成されているユニットと、
前記強制分割の結果として、すべての分割グループから、最小のスコアを有する前記分割グループを選択するように構成されているユニットと
を備える
ことを特徴とする請求項10に記載のシステム。 - 前記強制分割ユニットは、更に、
選択された前記分割グループのスコアが閾値より大きい場合、投影法に基づいて、現在の文字幅の中間に新規の分割点を追加するように構成されているユニットを有する
ことを特徴とする請求項11に記載のシステム。 - 前記第1の平均文字幅に基づいて、前記各分割グループにおける取り得る分割点を検索し、そして、各分割点のスコアを取得するように構成されているユニットは、
前記第1の平均文字幅に従って、分割グループ内の1つ以上の検索位置を設定するように構成されているユニットと、
各検索位置に対して、前記第1の平均文字幅倍の幅と、前記検索位置が配置されている分割グループの幅の差に従って該検索位置の中心に置かれる分割点に対する検索範囲を動的に決定するように構成されているユニットと、
各検索範囲において、前記テキスト行が水平である場合には、各画素列に対する分割スコアを計算して、前記検索範囲内の分割点として、最小分割スコアを有する前記画素列を選択し、前記テキスト行が垂直である場合には、各画素行に対する分割スコアを計算して、前記検索範囲内の分割点として、最小分割スコアを有する前記画素行を選択するように構成されているユニットと、
各検索範囲に対して、最小分割スコアを有する前記画素列あるいは前記画素行を、自身の分割点として選択するように構成されているユニットと、
各分割グループに対して、自身の分割点とこれらの分割点のスコアを取得するように構成されているユニットと
を備える
ことを特徴とする請求項12に記載のシステム。 - 前記設定ユニットは、
前記第1の文字のセットの文字間の平均スペースを計算するように構成されているユニットと、
前記第1の文字のセットの文字の数と、前記第2の文字のセットの文字の数と、前記平均スペースに従って、前記テキスト行が、様々な幅を有する大量数の文字を含んでいるかを判定するように構成されているユニットと、
前記判定の結果が肯定である場合、強制分割によって分割した幅広文字に対して前記第2の平均文字幅を設定するように構成されているユニットと
を備える
ことを特徴とする請求項10に記載のシステム。 - 前記設定ユニットは、
前記強制分割によってのみ分割される隣接する文字の対象のグループであって、その対象のグループの最後の文字とその次の文字との間のスペースが閾値より大きいスペースとなっている対象のグループを検索するように構成されているユニットと、
前記対象のグループが検出される場合、前記対象のグループの幅−高さ−比率を計算するように構成されているユニットと、
前記対象のグループの幅−高さ−比率が閾値より小さい場合、前記対象のグループの第1の文字に対して前記第2の平均文字幅を設定するように構成されているユニットと
を備える
ことを特徴とする請求項10に記載のシステム。 - 前記強制分割によって分割した幅広文字に対して前記第2の平均文字幅を設定するように構成されているユニットは、
現在のテキスト行に類似する高さを有する隣接するテキスト行を、類似行として検索するように構成されているユニットと、
前記類似行が検出される場合、前記類似行の平均文字幅を使用して、前記第2の平均文字幅を設定するように構成されているユニットと、
前記類似行が検出されない場合、前記計算するユニットで計算される前記第1の平均文字幅に、直接、パラメータを乗算することによって、前記第2の平均文字幅を設定するように構成されているユニットと
を備える
ことを特徴とする請求項14に記載のシステム。 - 前記分割パターンは、前記第2の文字のセットの隣接する文字群の組み合わせを示している
ことを特徴とする請求項10に記載のシステム。 - 前記計算ユニットにおいて、前記平均文字幅は、
前記第1の文字のセットの平均文字幅を計算すること、
前記第1の文字のセットから選択される、所定の範囲内の幅−高さ−比率を有する文字の平均文字幅を計算すること、
直前あるいは次のテキスト行の平均文字幅に従って平均文字幅を計算すること、
前記テキスト行の高さに一定値を乗算することによって平均文字幅を計算すること
の内の1つで計算される
ことを特徴とする請求項10に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110352060.6 | 2011-11-09 | ||
CN201110352060.6A CN103106406B (zh) | 2011-11-09 | 2011-11-09 | 用于切分具有不同字符宽度的文本行中的字符的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013101616A JP2013101616A (ja) | 2013-05-23 |
JP5600723B2 true JP5600723B2 (ja) | 2014-10-01 |
Family
ID=48314254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012245617A Active JP5600723B2 (ja) | 2011-11-09 | 2012-11-07 | 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5600723B2 (ja) |
CN (1) | CN103106406B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636744A (zh) * | 2013-11-11 | 2015-05-20 | 方正国际软件(北京)有限公司 | 一种数字切分方法及系统 |
CN105046254A (zh) * | 2015-07-17 | 2015-11-11 | 腾讯科技(深圳)有限公司 | 字符识别方法及装置 |
TWI702504B (zh) * | 2017-09-27 | 2020-08-21 | 毅 牛 | 一種實現圖像漢字拼接成詞的系統及移動終端 |
CN108710601B (zh) * | 2018-05-14 | 2022-04-01 | 广州腾讯科技有限公司 | 一种文本显示方法及其设备、存储介质、电子设备 |
CN110728129B (zh) * | 2019-09-03 | 2023-06-23 | 北京字节跳动网络技术有限公司 | 对图片中的文本内容进行排版的方法、装置、介质和设备 |
CN111783781B (zh) * | 2020-05-22 | 2024-04-05 | 深圳赛安特技术服务有限公司 | 基于产品协议字符识别的恶意条款识别方法、装置、设备 |
US11367296B2 (en) | 2020-07-13 | 2022-06-21 | NextVPU (Shanghai) Co., Ltd. | Layout analysis |
CN113936181B (zh) * | 2021-08-01 | 2024-03-26 | 北京工业大学 | 一种粘连手写英文字符的识别方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2995818B2 (ja) * | 1990-08-10 | 1999-12-27 | ソニー株式会社 | 文字切り出し方法 |
JPH06215183A (ja) * | 1993-01-18 | 1994-08-05 | Canon Inc | 文字認識装置 |
JPH07105311A (ja) * | 1993-10-04 | 1995-04-21 | Fuji Facom Corp | 日本語文書における接触文字の切り出し方法 |
JPH0950488A (ja) * | 1995-05-31 | 1997-02-18 | Fuji Facom Corp | 異サイズ混在文字列の読取り方法 |
JP2004038321A (ja) * | 2002-06-28 | 2004-02-05 | Fujitsu Ltd | 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法 |
CN101251892B (zh) * | 2008-03-07 | 2010-06-09 | 北大方正集团有限公司 | 一种字符切分方法和装置 |
CN102169542B (zh) * | 2010-02-25 | 2012-11-28 | 汉王科技股份有限公司 | 文字识别中粘连字符的切分方法和装置 |
CN102156865A (zh) * | 2010-12-14 | 2011-08-17 | 上海合合信息科技发展有限公司 | 手写文本行字符切分方法、识别方法 |
-
2011
- 2011-11-09 CN CN201110352060.6A patent/CN103106406B/zh active Active
-
2012
- 2012-11-07 JP JP2012245617A patent/JP5600723B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN103106406B (zh) | 2016-10-05 |
JP2013101616A (ja) | 2013-05-23 |
CN103106406A (zh) | 2013-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5600723B2 (ja) | 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム | |
CN102982330B (zh) | 文字图像中字符识别方法和识别装置 | |
US20160210507A1 (en) | Image processing system with layout analysis and method of operation thereof | |
US8571270B2 (en) | Segmentation of a word bitmap into individual characters or glyphs during an OCR process | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JP5523537B2 (ja) | 文書画像の行分割方法及び行分割システム | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP2569103B2 (ja) | 文字検出方法 | |
US11710331B2 (en) | Systems and methods for separating ligature characters in digitized document images | |
JP2821303B2 (ja) | 掠れ文字結合方式 | |
Fadeel | An efficient segmentation algorithm for arabic handwritten characters recognition system | |
JPH10214308A (ja) | 文字判別方法 | |
JP3842992B2 (ja) | 文字列読み取り装置及び文字列読み取り方法 | |
JP2982221B2 (ja) | 文字読み取り装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JP2001266070A (ja) | 文字認識装置、文字認識方法および記憶媒体 | |
JPH1185905A (ja) | 書体識別装置および書体識別方法および情報記憶媒体 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP3880091B2 (ja) | 情報処理装置及び方法 | |
JP4209511B2 (ja) | 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3712825B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP2520174B2 (ja) | 文字自動抽出装置 | |
JPH10162104A (ja) | 文字認識装置 | |
JP2009053826A (ja) | 文書処理装置及び文書処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140818 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5600723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |