JP4758461B2 - デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 - Google Patents
デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4758461B2 JP4758461B2 JP2008162465A JP2008162465A JP4758461B2 JP 4758461 B2 JP4758461 B2 JP 4758461B2 JP 2008162465 A JP2008162465 A JP 2008162465A JP 2008162465 A JP2008162465 A JP 2008162465A JP 4758461 B2 JP4758461 B2 JP 4758461B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- character
- histogram
- circumscribed rectangle
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
本発明のテキスト方向判定方法を、コンピュータに実行させることが可能であり、これにより、本発明のテキスト方向判定システムを実現することが可能である。図18は、本発明のテキスト方向判定システムの要部構成を示すブロック図である。
本発明の実施形態によれば、デジタル文書画像のページおよびテキストの天地方向(ページのテキスト方向)を判定するために、アセンダーを有するテキスト文字の相対出現頻度およびディセンダーを有するテキスト文字の相対出現頻度を利用する。本実施形態では、英語のテキストを具体例に挙げている。英語は一例であって、本発明を限定するものではない。
xLで表されるx軸上の左辺34と、xRで表されるx軸上の右辺35と、yBで表されるy軸上の下辺36と、yTで表されるy軸上の上辺37とで定義される。あるいは、デジタル文書画像におけるテキストラインの外接矩形32のサイズまたは位置を定義する他のいずれの方法を採用してもよい。
yT=min{y1(i)}、i=1、・・・、N、
yB=max{y2(i)}、i=1、・・・、N、
xL=min{x1(i)}、i=1、・・・、N、および、
xR=max{x2(i)}、i=1、・・・、N
である。ここで、Nは、テキストラインにおけるテキストオブジェクトまたはテキスト文字の数を表している。y1(i)およびy2(i)は、i番目のテキスト文字またはテキストオブジェクトの外接矩形の、y1およびy2の座標値をそれぞれ表している。x1(i)およびx2(i)は、i番目のテキスト文字またはテキストオブジェクトの外接矩形の、x1およびx2の座標値をそれぞれ表している。
Δtop(i)=y1(i)−yT、i=1、・・・、N および、
Δbottom(i)=yB(i)−y2、i=1、・・・、N
であり、垂直方向のテキストラインについては、
Δtop(i)=x1(i)−xL、i=1、・・・、N および、
Δbottom(i)=xR(i)−x2、i=1、・・・、N
である。対応する上方向特徴量および下方向特徴量は、水平方向および垂直方向のテキストラインについて次式に基づいてそれぞれ算出される。次式とはすなわち、
Δx1=|α(x1)−β(x1)|、Δx2=|α(x2)−β(x2)|、
Δy1=|α(y1)−β(y1)|、Δy2=|α(y2)−β(y2)|、
である。ここで、α(x1)、α(x2)、α(y1)、α(y2)およびβ(x1)、β(x2)、β(y1)、β(y2)は、それぞれ、x1、x2、y1、y2によって上述のとおり定義された、また、図2Aに関連して記載された、αおよびβの外接矩形の座標値である。
多くの文字対に対して、外接矩形特徴量算出によって特徴量が算出されると、その算出された多くの特徴量の中で、最も多く集中する値、あるいは、実質ゼロに近い値がテキスト方向判定に採用される。最も多く集中する値、あるいは、実質ゼロに近い値を持つ特徴量を用いることにより、テキストの言語において予測されるアセンダーおよびディセンダーの相対出現頻度に基づいて、上記文字対が記載されているテキストの方向が決定される。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから90°時計回り(または270°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから270°時計回り(または90°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから180°(反)時計回りに傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストからの回転角度は0°である。
というものである。ここで、histΔx1(0)、histΔx2(0)、histΔy1(0)、および、histΔy2(0)は、Δx1=0、Δx2=0、Δy1=0、および、Δy2=0のそれぞれに対応する各ビンの度数をそれぞれ表している。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから90°時計回り(または270°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから270°時計回り(または90°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから180°(反)時計回りに傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストからの回転角度は0°である。
というものである。ここで、histΔx1(0)、histΔx2(0)、histΔy1(0)、および、histΔy2(0)は、Δx1=0、Δx2=0、Δy1=0、および、Δy2=0のそれぞれに対応する各ビンの度数をそれぞれ表している。
pr=pxcosθ+pysinθ
および
ps=−pxsinθ+pycosθ
である。
γ(x1)=min(γ1、γ2、・・・、γM);
γ(x2)=max(γ1、γ2、・・・、γM);
γ(y1)=min(S1、S2、・・・、SM);および
γ(y2)=max(S1、S2、・・・、SM)
である。ここで、Mは、文字要素γを形成するピクセルの数を表している。配置特徴量は、傾きが除かれた外接矩形を用いて算出される。図10は、回転後の座標系において示される各外接矩形(例えば、126、127)を有する、傾いたテキストラインを示している。
21 外接矩形
22 左上端
23 右下端
24 テキストオブジェクト
25 外接矩形
30 テキストライン
32 外接矩形
120 外接矩形
122 文字要素
125 テキストライン
200 テキスト方向判定システム
201 制御部
202 デジタル文書画像取得部
203 デジタル文書画像記憶部
204 メモリ
210 テキストライン方向判定部(テキストライン方向判定手段)
211 外接矩形判定部(外接矩形判定手段/テキストライン外接矩形判定手段/文字外接矩形判定手段)
212 特徴量算出モジュール(第1配置特徴量算出手段/第2配置特徴量算出手段)
213 ヒストグラム生成部(第1ヒストグラム生成手段/第2ヒストグラム生成手段)
214 傾き補正部(傾き補正手段)
215 座標補正部(第1減算手段/第2減算手段)
216 テキスト方向判定モジュール(テキスト方向判定手段)
220 座標平均値算出部(第1平均値算出手段/第2平均値算出手段)
221 誤差量算出部(第1誤差量算出手段/第2誤差量算出手段)
222 差分算出部(第1差分算出手段/第2差分算出手段)
223 最大値算出部(第1最大値算出手段/第2最大値算出手段)
224 絶対値算出部(第1絶対値算出手段/第2絶対値算出手段)
225 累算部(第1累算手段/第2累算手段)
230 ベースライン辺判定部(ベースライン辺判定手段)
231 出現頻度判定部(第1出現頻度判定手段/第2出現頻度判定手段)
232 ベースライン関連付け部(ベースライン関連付け手段)
Claims (15)
- デジタル画像の天地方向を判定するテキスト方向判定システムであって、
上記デジタル画像に含まれるテキスト文字の連続する行をテキストラインとして認識するテキストライン判定手段と、
上記テキストライン判定手段が判定したテキストラインごと、および、テキストラインに含まれるテキスト文字ごとに、外接矩形を特定する外接矩形判定手段と、
上記外接矩形判定手段が特定したテキストラインの外接矩形の座標と、該テキストラインに含まれるテキスト文字の外接矩形の座標とに基づいて、テキストラインごとの配置特徴量を算出する配置特徴量算出手段と、
上記配置特徴量算出手段が算出した配置特徴量に基づいてテキストラインの天地方向を判定することにより、上記デジタル画像の天地方向を判定するテキスト方向判定手段とを備え、
上記テキストラインの外接矩形における長手方向の一方の辺を第1辺、対向するもう一方の辺を第2辺とした場合に、
上記配置特徴量算出手段は、
上記テキストラインに含まれる各テキスト文字の外接矩形について、上記第1辺と同じ側の辺の座標のばらつきと、上記第2辺と同じ側の辺の座標のばらつきとを配置特徴量として求め、
上記テキスト方向判定手段は、
上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつきと、上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきとの大小に応じて、上記テキストラインの天地を判定することを特徴とするテキスト方向判定システム。 - 上記テキスト方向判定手段は、
(1)上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつき、および、上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきの大小と、
(2)上記テキストラインの言語が、アセンダーを有するテキスト文字の方がディセンダーを有するテキスト文字よりも多く出現する言語、または、ディセンダーを有するテキスト文字の方がアセンダーを有するテキスト文字よりも多く出現する言語のいずれであるのか、とに応じて、
上記テキストラインの天地を判定することを特徴とする請求項1に記載のテキスト方向判定システム。 - 上記テキスト方向判定手段は、
上記テキストラインの言語が、アセンダーを有するテキスト文字の方がディセンダーを有するテキスト文字よりも多く出現する言語である場合に、
上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつきが、上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきよりも大きい場合に、上記テキストラインの第1辺を天、第2辺を地として、上記テキストラインの天地方向を判定し、
上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきが、上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつきよりも大きい場合に、上記テキストラインの第2辺を天、第1辺を地として、上記テキストラインの天地方向を判定する一方、
上記テキストラインの言語が、ディセンダーを有するテキスト文字の方がアセンダーを有するテキスト文字よりも多く出現する言語である場合に、
上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつきが、上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきよりも大きい場合に、上記テキストラインの第2辺を天、第1辺を地として、上記テキストラインの天地方向を判定し、
上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきが、上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつきよりも大きい場合に、上記テキストラインの第1辺を天、第2辺を地として、上記テキストラインの天地方向を判定することを特徴とする請求項2に記載のテキスト方向判定システム。 - 上記配置特徴量算出手段は、
上記テキストラインに含まれる各テキスト文字の外接矩形について、上記第1辺と同じ側の辺の座標平均値を、第1辺座標平均値として求め、
上記第1辺座標平均値と、上記第1辺側の、テキスト文字の外接矩形辺の座標との差をテキスト文字ごとに算出し、算出したテキスト文字ごとの差を統計的に処理した結果を、上記第1辺側の座標のばらつきとして導出し、
上記テキストラインに含まれる各テキスト文字の外接矩形について、上記第2辺と同じ側の座標平均値を、第2辺座標平均値として求め、
上記第2辺座標平均値と、上記第2辺側の、テキスト文字の外接矩形辺の座標との差をテキスト文字ごとに算出し、算出したテキスト文字ごとの差を統計的に処理した結果を、上記第2辺側の座標のばらつきとして導出することを特徴とする請求項1から3までのいずれか1項に記載のテキスト方向判定システム。 - 上記第1辺座標平均値と、上記第1辺側の、テキスト文字の外接矩形辺の座標との差、または、上記第2辺座標平均値と、上記第2辺側の、テキスト文字の外接矩形辺の座標との差は、平均絶対誤差、二乗平均誤差、および、二乗平均平方根誤差からなる群より選択された誤差量であることを特徴とする請求項4に記載のテキスト方向判定システム。
- 上記テキスト方向判定手段は、
上記デジタル画像から認識された複数のテキストラインごとに、天地方向を判定し、
上記複数のテキストラインに対して、最も多く判定された天地方向にしたがって、上記デジタル画像の天地方向を判定することを特徴とする請求項1から5までのいずれか1項に記載のテキスト方向判定システム。 - デジタル画像の天地方向を判定するテキスト方向判定システムであって、
上記デジタル画像に含まれるテキスト文字ごとに、外接矩形を特定する外接矩形判定手段と、
上記テキスト文字と、該テキスト文字に最も近接するテキスト文字とをテキスト文字対として認識し、両方のテキスト文字の外接矩形の座標に基づいて、テキスト文字対ごとの配置特徴量を算出する配置特徴量算出手段と、
上記配置特徴量算出手段が算出したテキスト文字対ごとの配置特徴量に基づいてヒストグラムを生成するヒストグラム生成手段と、
上記ヒストグラム生成手段が生成したヒストグラムに基づいて、上記デジタル画像に含まれる各テキスト文字の天地方向を判定することにより、上記デジタル画像の天地方向を判定するテキスト方向判定手段とを備え、
上記配置特徴量算出手段は、
上記テキスト文字対の各文字の外接矩形の上下左右の4辺について、左辺同士の座標の差分である第1差分、右辺同士の座標の差分である第2差分、上辺同士の座標の差分である第3差分、および、下辺同士の座標の差分である第4差分を、4つの配置特徴量として求め、
上記ヒストグラム生成手段は、
テキスト文字対ごとの第1差分について、差分の大きさと度数とを示す、外接矩形の左辺に対応する第1ヒストグラムと、
テキスト文字対ごとの第2差分について、差分の大きさと度数とを示す、外接矩形の右辺に対応する第2ヒストグラムと、
テキスト文字対ごとの第3差分について、差分の大きさと度数とを示す、外接矩形の上辺に対応する第3ヒストグラムと、
テキスト文字対ごとの第4差分について、差分の大きさと度数とを示す、外接矩形の下辺に対応する第4ヒストグラムとを生成し、
上記テキスト方向判定手段は、
上記第1〜第4ヒストグラムの中から、上記差分が最も小さいビンの度数が最も多いヒストグラムを特定し、特定した上記ヒストグラムに対応する、上下左右いずれかの辺または該辺に対向する辺を、上記デジタル画像に含まれる各テキスト文字の地と判定することを特徴とするテキスト方向判定システム。 - 上記各テキスト文字の言語が、アセンダーを有するテキスト文字の方がディセンダーを有するテキスト文字よりも多く出現する言語である場合に、
上記テキスト方向判定手段は、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムに対応する辺を、各テキスト文字の地と判定することを特徴とする請求項7に記載のテキスト方向判定システム。 - 上記各テキスト文字の言語が、ディセンダーを有するテキスト文字の方がアセンダーを有するテキスト文字よりも多く出現する言語である場合に、
上記テキスト方向判定手段は、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムに対応する辺に対向する辺を、各テキスト文字の地と判定することを特徴とする請求項7に記載のテキスト方向判定システム。 - 上記各テキスト文字の言語が、アセンダーを有するテキスト文字の方がディセンダーを有するテキスト文字よりも多く出現する言語である場合に、
上記テキスト方向判定手段は、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第1ヒストグラムであると判断した場合に、上記第1ヒストグラムに対応する上記外接矩形の左辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿から90度時計回りに傾いていると判断し、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第2ヒストグラムであると判断した場合に、上記第2ヒストグラムに対応する上記外接矩形の右辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿から90度反時計回りに傾いていると判断し、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第3ヒストグラムであると判断した場合に、上記第3ヒストグラムに対応する上記外接矩形の上辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿と上下逆さまであると判断し、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第4ヒストグラムであると判断した場合に、上記第4ヒストグラムに対応する上記外接矩形の下辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿のとおりであると判断することを特徴とする請求項7に記載のテキスト方向判定システム。 - 上記各テキスト文字の言語が、ディセンダーを有するテキスト文字の方がアセンダーを有するテキスト文字よりも多く出現する言語である場合に、
上記テキスト方向判定手段は、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第1ヒストグラムであると判断した場合に、上記第1ヒストグラムに対応する上記外接矩形の左辺に対向する右辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿から90度反時計回りに傾いていると判断し、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第2ヒストグラムであると判断した場合に、上記第2ヒストグラムに対応する上記外接矩形の右辺に対向する左辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿から90度時計回りに傾いていると判断し、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第3ヒストグラムであると判断した場合に、上記第3ヒストグラムに対応する上記外接矩形の上辺に対向する下辺を、各テキスト文字の地と判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿のとおりであると判断し、
上記第1〜第4ヒストグラムのうち、上記差分が最も小さいビンの度数が最も多いヒストグラムが、上記第4ヒストグラムであると判断した場合に、上記第4ヒストグラムに対応する上記外接矩形の下辺に対向する上辺を、各テキスト文字の地であると判定し、上記各テキスト文字を含む上記デジタル画像の向きが元の原稿と上下逆さまであると判断することを特徴とする請求項7に記載のテキスト方向判定システム。 - デジタル画像の天地方向を判定するテキスト方向判定システムの制御方法であって、
上記テキスト方向判定システムのテキストライン判定手段が、上記デジタル画像に含まれるテキスト文字の連続する行をテキストラインとして認識するステップと、
上記テキスト方向判定システムの外接矩形判定手段が、上記認識するステップにて判定されたテキストラインごと、および、テキストラインに含まれるテキスト文字ごとに、外接矩形を特定する外接矩形判定ステップと、
上記テキスト方向判定システムの配置特徴量算出手段が、上記外接矩形判定ステップにて特定されたテキストラインの外接矩形の座標と、該テキストラインに含まれるテキスト文字の外接矩形の座標とに基づいて、テキストラインごとの配置特徴量を算出する配置特徴量算出ステップと、
上記テキスト方向判定システムのテキスト方向判定手段が、上記配置特徴量算出ステップにて算出された配置特徴量に基づいてテキストラインの天地方向を判定することにより、上記デジタル画像の天地方向を判定するテキスト方向判定ステップとを含み、
上記テキストラインの外接矩形における長手方向の一方の辺を第1辺、対向するもう一方の辺を第2辺とした場合に、
上記配置特徴量算出ステップでは、
上記テキストラインに含まれる各テキスト文字の外接矩形について、上記第1辺と同じ側の辺の座標のばらつきと、上記第2辺と同じ側の辺の座標のばらつきとを配置特徴量として求め、
上記テキスト方向判定ステップでは、
上記第1辺側の、各テキスト文字の外接矩形辺の座標のばらつきと、上記第2辺側の、各テキスト文字の外接矩形辺の座標のばらつきとの大小に応じて、上記テキストラインの天地を判定することを特徴とするテキスト方向判定システムの制御方法。 - デジタル画像の天地方向を判定するテキスト方向判定システムの制御方法であって、
上記テキスト方向判定システムの外接矩形判定手段が、上記デジタル画像に含まれるテキスト文字ごとに、外接矩形を特定する外接矩形判定ステップと、
上記テキスト方向判定システムの配置特徴量算出手段が、上記テキスト文字と、該テキスト文字に最も近接するテキスト文字とをテキスト文字対として認識し、両方のテキスト文字の外接矩形の座標に基づいて、テキスト文字対ごとの配置特徴量を算出する配置特徴量算出ステップと、
上記テキスト方向判定システムのヒストグラム生成手段が、上記配置特徴量算出ステップにて算出されたテキスト文字対ごとの配置特徴量に基づいてヒストグラムを生成するヒストグラム生成ステップと、
上記テキスト方向判定システムのテキスト方向判定手段が、上記ヒストグラム生成ステップにて生成されたヒストグラムに基づいて、上記デジタル画像に含まれる各テキスト文字の天地方向を判定することにより、上記デジタル画像の天地方向を判定するテキスト方向判定ステップとを含み、
上記配置特徴量算出ステップでは、
上記テキスト文字対の各文字の外接矩形の上下左右の4辺について、左辺同士の座標の差分である第1差分、右辺同士の座標の差分である第2差分、上辺同士の座標の差分である第3差分、および、下辺同士の座標の差分である第4差分を、4つの配置特徴量として求め、
上記ヒストグラム生成ステップでは、
テキスト文字対ごとの第1差分について、差分の大きさと度数とを示す、外接矩形の左辺に対応する第1ヒストグラムと、
テキスト文字対ごとの第2差分について、差分の大きさと度数とを示す、外接矩形の右辺に対応する第2ヒストグラムと、
テキスト文字対ごとの第3差分について、差分の大きさと度数とを示す、外接矩形の上辺に対応する第3ヒストグラムと、
テキスト文字対ごとの第4差分について、差分の大きさと度数とを示す、外接矩形の下辺に対応する第4ヒストグラムとを生成し、
上記テキスト方向判定ステップでは、
上記第1〜第4ヒストグラムの中から、上記差分が最も小さいビンの度数が最も多いヒストグラムを特定し、特定した上記ヒストグラムに対応する、上下左右いずれかの辺または該辺に対向する辺を、上記デジタル画像に含まれる各テキスト文字の地と判定することを特徴とするテキスト方向判定システムの制御方法。 - コンピュータを、請求項1から11までのいずれか1項に記載のテキスト方向判定システムの各手段として機能させるための制御プログラム。
- 請求項14に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/766,640 | 2007-06-21 | ||
US11/766,640 US8208725B2 (en) | 2007-06-21 | 2007-06-21 | Methods and systems for identifying text orientation in a digital image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003936A JP2009003936A (ja) | 2009-01-08 |
JP4758461B2 true JP4758461B2 (ja) | 2011-08-31 |
Family
ID=40136545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008162465A Active JP4758461B2 (ja) | 2007-06-21 | 2008-06-20 | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8208725B2 (ja) |
JP (1) | JP4758461B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5582674B2 (ja) * | 2007-07-20 | 2014-09-03 | アルパイン株式会社 | 文字データの生成装置および生成方法、文字データの表示制御装置および表示方法、ナビゲーション装置 |
JP4572248B2 (ja) | 2008-06-23 | 2010-11-04 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体 |
JP4625861B2 (ja) * | 2008-11-17 | 2011-02-02 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体 |
JP4927122B2 (ja) * | 2009-06-15 | 2012-05-09 | シャープ株式会社 | 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体 |
US20130027573A1 (en) * | 2011-07-26 | 2013-01-31 | Symbol Technologies, Inc. | Method and apparatus for auto-detecting orientation of free-form document using ocr |
RU2469398C1 (ru) * | 2011-10-07 | 2012-12-10 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обеспечения корректной ориентации документов при автоматической печати |
JP2014215752A (ja) * | 2013-04-24 | 2014-11-17 | 株式会社東芝 | 電子機器および手書きデータ処理方法 |
KR20150060338A (ko) * | 2013-11-26 | 2015-06-03 | 삼성전자주식회사 | 전자장치 및 전자장치의 문자인식 방법 |
US11017258B2 (en) * | 2018-06-05 | 2021-05-25 | Microsoft Technology Licensing, Llc | Alignment of user input on a screen |
US11495038B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Digital image processing |
US11494588B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Ground truth generation for image segmentation |
US11556852B2 (en) | 2020-03-06 | 2023-01-17 | International Business Machines Corporation | Efficient ground truth annotation |
US11361146B2 (en) * | 2020-03-06 | 2022-06-14 | International Business Machines Corporation | Memory-efficient document processing |
Family Cites Families (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0223800Y2 (ja) * | 1985-09-13 | 1990-06-28 | ||
US5031225A (en) | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
EP0325233B1 (en) | 1988-01-18 | 1994-07-27 | Kabushiki Kaisha Toshiba | Character string recognition system |
JPH02116987A (ja) | 1988-10-27 | 1990-05-01 | Toshiba Corp | 文字認識装置 |
US5060276A (en) | 1989-05-31 | 1991-10-22 | At&T Bell Laboratories | Technique for object orientation detection using a feed-forward neural network |
US5191438A (en) | 1989-12-12 | 1993-03-02 | Sharp Kabushiki Kaisha | Facsimile device with skew correction and text line direction detection |
US5077811A (en) | 1990-10-10 | 1991-12-31 | Fuji Xerox Co., Ltd. | Character and picture image data processing system |
JPH04195485A (ja) | 1990-11-28 | 1992-07-15 | Hitachi Ltd | 画像情報入力装置 |
US5235651A (en) | 1991-08-06 | 1993-08-10 | Caere Corporation | Rotation of images for optical character recognition |
US5251268A (en) | 1991-08-09 | 1993-10-05 | Electric Power Research Institute, Inc. | Integrated method and apparatus for character and symbol recognition |
JP3251959B2 (ja) | 1991-10-17 | 2002-01-28 | 株式会社リコー | 画像形成装置 |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
US5276742A (en) | 1991-11-19 | 1994-01-04 | Xerox Corporation | Rapid detection of page orientation |
US6574375B1 (en) | 1992-04-06 | 2003-06-03 | Ricoh Company, Ltd. | Method for detecting inverted text images on a digital scanning device |
JP2723118B2 (ja) | 1992-08-31 | 1998-03-09 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 2次元オブジェクトの認識に用いるためのニューラル・ネットワーク及び光学式文字認識装置 |
DE69333694T2 (de) | 1992-09-11 | 2005-10-20 | Canon K.K. | Verfahren und Anordnung zur Bildverarbeitung |
US5319722A (en) | 1992-10-01 | 1994-06-07 | Sony Electronics, Inc. | Neural network for character recognition of rotated characters |
CA2116600C (en) | 1993-04-10 | 1996-11-05 | David Jack Ittner | Methods and apparatus for inferring orientation of lines of text |
JP3050007B2 (ja) | 1993-08-26 | 2000-06-05 | ミノルタ株式会社 | 画像読取装置およびこれを備えた画像形成装置 |
US5930001A (en) | 1994-10-25 | 1999-07-27 | Canon Kabushiki Kaisha | Copier which rotates an image based on the recognition of an extracted character from various directions |
US5987171A (en) | 1994-11-10 | 1999-11-16 | Canon Kabushiki Kaisha | Page analysis system |
JP3534128B2 (ja) | 1995-01-24 | 2004-06-07 | オムロン株式会社 | 書類の上下方向検知方法及び装置 |
JPH08249422A (ja) | 1995-03-08 | 1996-09-27 | Canon Inc | 文字処理装置及び方法 |
US5689585A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Method for aligning a text image to a transcription of the image |
JPH09130516A (ja) | 1995-10-30 | 1997-05-16 | Minolta Co Ltd | 原稿画像の天地を認識できる画像処理装置 |
US5889884A (en) | 1995-05-23 | 1999-03-30 | Minolta Co., Ltd. | Image forming apparatus capable of recognizing top and bottom of document image |
JPH099040A (ja) | 1995-06-21 | 1997-01-10 | Minolta Co Ltd | 画像処理装置 |
DE69637073T2 (de) | 1995-07-31 | 2007-08-30 | Fujitsu Ltd., Kawasaki | Prozessor und verarbeitungsverfahren für dokumente |
JPH0951422A (ja) | 1995-08-09 | 1997-02-18 | Minolta Co Ltd | 画像編集装置 |
US6137905A (en) | 1995-08-31 | 2000-10-24 | Canon Kabushiki Kaisha | System for discriminating document orientation |
US6188790B1 (en) | 1996-02-29 | 2001-02-13 | Tottori Sanyo Electric Ltd. | Method and apparatus for pre-recognition character processing |
US6473196B2 (en) | 1996-09-19 | 2002-10-29 | Canon Kabushiki Kaisha | Image forming apparatus and method |
US6304681B1 (en) | 1996-09-26 | 2001-10-16 | Canon Kabushiki Kaisha | Image processing apparatus for executing image processing in correspondence with portrait and landscape types |
US6173088B1 (en) | 1996-10-01 | 2001-01-09 | Canon Kabushiki Kaisha | Image forming method and apparatus |
JP3728040B2 (ja) | 1996-12-27 | 2005-12-21 | キヤノン株式会社 | 画像形成装置及び方法 |
KR100247970B1 (ko) | 1997-07-15 | 2000-03-15 | 윤종용 | 문서 영상의 방향 교정방법 |
US6151423A (en) | 1998-03-04 | 2000-11-21 | Canon Kabushiki Kaisha | Character recognition with document orientation determination |
JP3422924B2 (ja) | 1998-03-27 | 2003-07-07 | 富士通株式会社 | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6804414B1 (en) | 1998-05-01 | 2004-10-12 | Fujitsu Limited | Image status detecting apparatus and document image correcting apparatus |
US6798905B1 (en) | 1998-07-10 | 2004-09-28 | Minolta Co., Ltd. | Document orientation recognizing device which recognizes orientation of document image |
JP3695163B2 (ja) | 1998-07-31 | 2005-09-14 | コニカミノルタビジネステクノロジーズ株式会社 | 画像形成装置 |
US6624905B1 (en) | 1998-09-29 | 2003-09-23 | Canon Kabushiki Kaisha | Image formation apparatus having image direction discrimination function |
JP2001043310A (ja) | 1999-07-30 | 2001-02-16 | Fujitsu Ltd | 文書画像補正装置および補正方法 |
JP3854024B2 (ja) | 1999-11-30 | 2006-12-06 | 株式会社Pfu | 文字認識前処理装置及び方法並びにプログラム記録媒体 |
JP4228530B2 (ja) | 2000-02-09 | 2009-02-25 | 富士通株式会社 | 画像処理方法及び画像処理装置 |
US6993205B1 (en) | 2000-04-12 | 2006-01-31 | International Business Machines Corporation | Automatic method of detection of incorrectly oriented text blocks using results from character recognition |
US7031553B2 (en) | 2000-09-22 | 2006-04-18 | Sri International | Method and apparatus for recognizing text in an image sequence of scene imagery |
JP4281236B2 (ja) | 2000-09-27 | 2009-06-17 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 |
US6546215B2 (en) | 2001-09-10 | 2003-04-08 | Toshiba Tec Kabushiki Kaisha | Image forming apparatus and method having document orientation control |
US6567628B1 (en) | 2001-11-07 | 2003-05-20 | Hewlett-Packard Development Company L.P. | Methods and apparatus to determine page orientation for post imaging finishing |
US7215828B2 (en) | 2002-02-13 | 2007-05-08 | Eastman Kodak Company | Method and system for determining image orientation |
CN1183436C (zh) | 2002-04-03 | 2005-01-05 | 摩托罗拉公司 | 用于手写字符的方向确定及其识别 |
US7167279B2 (en) | 2002-05-08 | 2007-01-23 | Kabushiki Kaisha Toshiba | Image forming apparatus |
US20040001606A1 (en) | 2002-06-28 | 2004-01-01 | Levy Kenneth L. | Watermark fonts |
JP2004246546A (ja) | 2003-02-13 | 2004-09-02 | Ricoh Co Ltd | 画像処理方法、該方法の実行に用いるプログラム及び画像処理装置 |
JP2004272798A (ja) | 2003-03-11 | 2004-09-30 | Pfu Ltd | 画像読み取り装置 |
JP4350414B2 (ja) | 2003-04-30 | 2009-10-21 | キヤノン株式会社 | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
US7335695B2 (en) * | 2003-07-18 | 2008-02-26 | Engelhard Corporation | Powder coating precursors and the use thereof in powder coating compositions |
JP4443194B2 (ja) | 2003-11-10 | 2010-03-31 | 日立オムロンターミナルソリューションズ株式会社 | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
US7286718B2 (en) | 2004-01-26 | 2007-10-23 | Sri International | Method and apparatus for determination of text orientation |
JP4553241B2 (ja) | 2004-07-20 | 2010-09-29 | 株式会社リコー | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
EP1628240B1 (en) * | 2004-08-10 | 2008-03-05 | Océ-Technologies B.V. | Outlier detection during scanning |
JP4607633B2 (ja) | 2005-03-17 | 2011-01-05 | 株式会社リコー | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 |
US7545529B2 (en) | 2005-03-24 | 2009-06-09 | Kofax, Inc. | Systems and methods of accessing random access cache for rescanning |
JP2006343960A (ja) | 2005-06-08 | 2006-12-21 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
CN100527064C (zh) * | 2005-10-25 | 2009-08-12 | 摩托罗拉公司 | 用于输入字符的方法和设备 |
US8144989B2 (en) * | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
-
2007
- 2007-06-21 US US11/766,640 patent/US8208725B2/en active Active
-
2008
- 2008-06-20 JP JP2008162465A patent/JP4758461B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20080317343A1 (en) | 2008-12-25 |
US8208725B2 (en) | 2012-06-26 |
JP2009003936A (ja) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4777393B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP4758461B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
US7567730B2 (en) | Detecting an orientation of characters in a document image | |
KR101399709B1 (ko) | 모델-기반 디워핑 방법 및 장치 | |
US8009909B2 (en) | Image processing apparatus and its method | |
JP5620244B2 (ja) | 画像比較および文書認証のための画像位置合わせの方法及びプログラム | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
JP5132438B2 (ja) | 画像処理装置および画像処理方法 | |
JP4796169B2 (ja) | デジタル画像の向きの判定方法 | |
JPH11219407A (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JP6000992B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
US6771842B1 (en) | Document image skew detection method | |
JPWO2017141802A1 (ja) | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 | |
US8064636B2 (en) | Image processing apparatus and method of controlling the same | |
US8600175B2 (en) | Apparatus and method of processing image including character string | |
JP2008234291A (ja) | 文字認識装置及び文字認識方法 | |
US7130085B2 (en) | Half-tone dot elimination method and system thereof | |
JPWO2013061468A1 (ja) | 画像生成方法、情報処理方法、プログラム、及び情報処理装置 | |
US20070171453A1 (en) | Image processing apparatus, image processing method, program, and storage medium | |
JP4070486B2 (ja) | 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム | |
JP4803001B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
JPH08123904A (ja) | 書体種類処理装置 | |
JP4859027B2 (ja) | 文字パターン生成方法および文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4758461 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140610 Year of fee payment: 3 |