JP2009003937A - デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 - Google Patents
デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2009003937A JP2009003937A JP2008162466A JP2008162466A JP2009003937A JP 2009003937 A JP2009003937 A JP 2009003937A JP 2008162466 A JP2008162466 A JP 2008162466A JP 2008162466 A JP2008162466 A JP 2008162466A JP 2009003937 A JP2009003937 A JP 2009003937A
- Authority
- JP
- Japan
- Prior art keywords
- text
- histogram
- appearance frequency
- determining
- text object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
【解決手段】本発明のテキスト方向判定システム200は、デジタル画像における複数のテキストオブジェクト対の各々について、第1配置特徴の第1配置特徴量、および、複数のテキストオブジェクト対の各々について、第2配置特徴の第2配置特徴量を算出する特徴量算出モジュール212と、第1の複数の特徴量値の第1ヒストグラム、および、第2の複数の特徴量値の第2ヒストグラムを生成するヒストグラム生成部213と、第1ヒストグラムおよび第2ヒストグラムに基づいて、デジタル画像におけるテキスト方向を判定するテキスト方向判定モジュール216とを備えていることを特徴としている。
【選択図】図18
Description
本発明のテキスト方向判定方法を、コンピュータに実行させることが可能であり、これにより、本発明のテキスト方向判定システムを実現することが可能である。図18は、本発明のテキスト方向判定システムの要部構成を示すブロック図である。
本発明の実施形態によれば、デジタル文書画像のページおよびテキストの天地方向(ページのテキスト方向)を判定するために、アセンダーを有するテキスト文字の相対出現頻度およびディセンダーを有するテキスト文字の相対出現頻度を利用する。本実施形態では、英語のテキストを具体例に挙げている。英語は一例であって、本発明を限定するものではない。
xLで表されるx軸上の左辺34と、xRで表されるx軸上の右辺35と、yBで表されるy軸上の下辺36と、yTで表されるy軸上の上辺37とで定義される。あるいは、デジタル文書画像におけるテキストラインの外接矩形32のサイズまたは位置を定義する他のいずれの方法を採用してもよい。
yT=min{y1(i)}、i=1、・・・、N、
yB=max{y2(i)}、i=1、・・・、N、
xL=min{x1(i)}、i=1、・・・、N、および、
xR=max{x2(i)}、i=1、・・・、N
である。ここで、Nは、テキストラインにおけるテキストオブジェクトまたはテキスト文字の数を表している。y1(i)およびy2(i)は、i番目のテキスト文字またはテキストオブジェクトの外接矩形の、y1およびy2の座標値をそれぞれ表している。x1(i)およびx2(i)は、i番目のテキスト文字またはテキストオブジェクトの外接矩形の、x1およびx2の座標値をそれぞれ表している。
Δtop(i)=y1(i)−yT、i=1、・・・、N および、
Δbottom(i)=yB(i)−y2、i=1、・・・、N
であり、垂直方向のテキストラインについては、
Δtop(i)=x1(i)−xL、i=1、・・・、N および、
Δbottom(i)=xR(i)−x2、i=1、・・・、N
である。対応する上方向特徴量および下方向特徴量は、水平方向および垂直方向のテキストラインについて次式に基づいてそれぞれ算出される。次式とはすなわち、
Δx1=|α(x1)−β(x1)|、Δx2=|α(x2)−β(x2)|、
Δy1=|α(y1)−β(y1)|、Δy2=|α(y2)−β(y2)|、
である。ここで、α(x1)、α(x2)、α(y1)、α(y2)およびβ(x1)、β(x2)、β(y1)、β(y2)は、それぞれ、x1、x2、y1、y2によって上述のとおり定義された、また、図2Aに関連して記載された、αおよびβの外接矩形の座標値である。
多くの文字対に対して、外接矩形特徴量算出によって特徴量が算出されると、その算出された多くの特徴量の中で、最も多く集中する値、あるいは、実質ゼロに近い値がテキスト方向判定に採用される。最も多く集中する値、あるいは、実質ゼロに近い値を持つ特徴量を用いることにより、テキストの言語において予測されるアセンダーおよびディセンダーの相対出現頻度に基づいて、上記文字対が記載されているテキストの方向が決定される。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから90°時計回り(または270°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから270°時計回り(または90°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから180°(反)時計回りに傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストからの回転角度は0°である。
というものである。ここで、histΔx1(0)、histΔx2(0)、histΔy1(0)、および、histΔy2(0)は、Δx1=0、Δx2=0、Δy1=0、および、Δy2=0のそれぞれに対応する各ビンの度数をそれぞれ表している。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから90°時計回り(または270°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔx1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから270°時計回り(または90°反時計回り)に傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy2(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストから180°(反)時計回りに傾いている。
if (max{histΔx1(0)、histΔx2(0)、histΔy1(0)、histΔy2(0)})=histΔy1(0)、
then デジタル文書画像におけるテキストは、元の原稿のテキストからの回転角度は0°である。
というものである。ここで、histΔx1(0)、histΔx2(0)、histΔy1(0)、および、histΔy2(0)は、Δx1=0、Δx2=0、Δy1=0、および、Δy2=0のそれぞれに対応する各ビンの度数をそれぞれ表している。
pr=pxcosθ+pysinθ
および
ps=−pxsinθ+pycosθ
である。
γ(x1)=min(γ1、γ2、・・・、γM);
γ(x2)=max(γ1、γ2、・・・、γM);
γ(y1)=min(S1、S2、・・・、SM);および
γ(y2)=max(S1、S2、・・・、SM)
である。ここで、Mは、文字要素γを形成するピクセルの数を表している。配置特徴量は、傾きが除かれた外接矩形を用いて算出される。図10は、回転後の座標系において示される各外接矩形(例えば、126、127)を有する、傾いたテキストラインを示している。
21 外接矩形
22 左上端
23 右下端
24 テキストオブジェクト
25 外接矩形
30 テキストライン
32 外接矩形
120 外接矩形
122 文字要素
125 テキストライン
200 テキスト方向判定システム
201 制御部
202 デジタル文書画像取得部
203 デジタル文書画像記憶部
204 メモリ
210 テキストライン方向判定部(テキストライン方向判定手段)
211 外接矩形判定部(外接矩形判定手段/テキストライン外接矩形判定手段/文字外接矩形判定手段)
212 特徴量算出モジュール(第1配置特徴量算出手段/第2配置特徴量算出手段)
213 ヒストグラム生成部(第1ヒストグラム生成手段/第2ヒストグラム生成手段)
214 傾き補正部(傾き補正手段)
215 座標補正部(第1減算手段/第2減算手段)
216 テキスト方向判定モジュール(テキスト方向判定手段)
220 座標平均値算出部(第1平均値算出手段/第2平均値算出手段)
221 誤差量算出部(第1誤差量算出手段/第2誤差量算出手段)
222 差分算出部(第1差分算出手段/第2差分算出手段)
223 最大値算出部(第1最大値算出手段/第2最大値算出手段)
224 絶対値算出部(第1絶対値算出手段/第2絶対値算出手段)
225 累算部(第1累算手段/第2累算手段)
230 ベースライン辺判定部(ベースライン辺判定手段)
231 出現頻度判定部(第1出現頻度判定手段/第2出現頻度判定手段)
232 ベースライン関連付け部(ベースライン関連付け手段)
Claims (25)
- デジタル画像のテキストの方向を判定するテキスト方向判定方法であって、
a)デジタル画像における複数のテキストオブジェクト対の各々について、第1配置特徴の第1配置特徴量を算出することにより、第1の複数の特徴量値を生成するステップと、
b)上記複数のテキストオブジェクト対の各々について、第2配置特徴の第2配置特徴量を算出することにより、第2の複数の特徴量値を生成するステップと、
c)上記第1の複数の特徴量値の第1ヒストグラムを生成するステップと、
d)上記第2の複数の特徴量値の第2ヒストグラムを生成するステップと、
e)上記第1ヒストグラムおよび上記第2ヒストグラムに基づいて、デジタル画像におけるテキスト方向を判定するステップとを含むことを特徴とするテキスト方向判定方法。 - 上記テキスト方向を判定するステップは、文字の配置に関連して行われることを特徴とする請求項1に記載のテキスト方向判定方法。
- 上記テキスト方向を判定するステップは、アセンダーを有するテキスト文字と、ディセンダーを有するテキスト文字との、書かれている言語における相対出現頻度に関連して行われることを特徴とする請求項1に記載のテキスト方向判定方法。
- 上記複数のテキストオブジェクト対の少なくとも1つの対は、上記デジタル画像において隣り合うテキストオブジェクト同士である、第1テキストオブジェクトおよび第2テキストオブジェクトを含むことを特徴とする請求項1に記載のテキスト方向判定方法。
- 上記複数のテキストオブジェクト対の少なくとも1つの対は、上記デジタル画像において互いに隣り合わないテキストオブジェクト同士である、第1テキストオブジェクトおよび第2テキストオブジェクトを含むことを特徴とする請求項1に記載のテキスト方向判定方法。
- 上記複数のテキストオブジェクト対の各々は、第1テキストオブジェクトが第2テキストオブジェクトとは実質同じサイズではないような、第1テキストオブジェクトおよび第2テキストオブジェクトを含むことを特徴とする請求項1に記載のテキスト方向判定方法。
- 上記第1配置特徴の第1配置特徴量を算出することにより第1の複数の特徴量値を生成するステップ、および、上記第2配置特徴の第2配置特徴量を算出することにより第2の複数の特徴量値を生成するステップに先行して、傾き角度にしたがって、上記複数のテキストオブジェクト対の各々の傾きを補正するステップをさらに含むことを特徴とする請求項1に記載のテキスト方向判定方法。
- 上記複数のテキストオブジェクト対の各々は、第1テキストオブジェクトおよび第2テキストオブジェクトを含んでおり、
a)上記の、複数のテキストオブジェクト対の各々について第1配置特徴の第1配置特徴量を算出することにより第1の複数の特徴量値を生成するステップは、
i)上記第1テキストオブジェクトの第1境界線と、対応している上記第2テキストオブジェクトの第1境界線との間の第1絶対差分を判定することにより、上記第1ヒストグラムを上記第1境界線に関連付けるステップを含み、
b)上記の、複数のテキストオブジェクト対の各々について第2配置特徴の第2配置特徴量を算出することにより第2の複数の特徴量値を生成するステップは、
i)上記第1テキストオブジェクトの第2境界線と、対応している上記第2テキストオブジェクトの第2境界線との間の第2絶対差分を判定することにより、上記第2ヒストグラムを上記第2境界線に関連付けるステップを含むことを特徴とする請求項1に記載のテキスト方向判定方法。 - 上記テキスト方向を判定するステップは、
a)上記第1ヒストグラムから、実質ゼロの第1絶対差分に対応する第1出現頻度を判定するステップと、
b)上記第2ヒストグラムから、実質ゼロの第2絶対差分に対応する第2出現頻度を判定するステップと、
c)上記第1出現頻度が、上記第2出現頻度よりも大きく、かつ、書かれた言語において、アセンダーを有するテキスト文字が、ディセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第1境界線に関連付けるステップと、
d)上記第1出現頻度が、上記第2出現頻度よりも小さく、かつ、書かれた言語において、アセンダーを有するテキスト文字が、ディセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第2境界線に関連付けるステップとを含むことを特徴とする請求項8に記載のテキスト方向判定方法。 - 上記テキスト方向を判定するステップは、
a)上記第1ヒストグラムから、実質ゼロの第1絶対差分に対応する第1出現頻度を判定するステップと、
b)上記第2ヒストグラムから、実質ゼロの第2絶対差分に対応する第2出現頻度を判定するステップと、
c)上記第1出現頻度が、上記第2出現頻度よりも小さく、かつ、書かれた言語において、ディセンダーを有するテキスト文字が、アセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第1境界線に関連付けるステップと、
d)上記第1出現頻度が、上記第2出現頻度よりも大きく、かつ、書かれた言語において、ディセンダーを有するテキスト文字が、アセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第2境界線に関連付けるステップとを含むことを特徴とする請求項8に記載のテキスト方向判定方法。 - a)上記複数のテキストオブジェクト対の各々について、第3配置特徴の第3配置特徴値を算出することにより、第3の複数の特徴値を生成するステップと、
b)上記複数のテキストオブジェクト対の各々について、第4配置特徴の第4配置特徴値を算出することにより、第4の複数の特徴値を生成するステップと、
c)上記第3の複数の特徴値の第3ヒストグラムを生成するステップと、
d)上記第4の複数の特徴値の第4ヒストグラムを生成するステップとを含み、
e)上記デジタル画像における上記テキスト方向を判定するステップは、上記第1ヒストグラム、上記第2ヒストグラム、上記第3ヒストグラムおよび上記第4ヒストグラムに基づいて実行されることを特徴とする請求項1に記載のテキスト方向判定方法。 - 上記複数のテキストオブジェクト対の各々は、第1テキストオブジェクトおよび第2テキストオブジェクトを含んでおり、
a)上記複数のテキストオブジェクト対の各々について、上記第3の複数の特徴値を生成するステップは、
i)上記第1テキストオブジェクトの第3境界線と、対応している上記第2テキストオブジェクトの第3境界線との間の第3絶対差分を判定することにより、上記第3ヒストグラムを上記第3境界線に関連付けるステップを含み、
b)上記複数のテキストオブジェクト対の各々について、上記第4の複数の特徴値を生成するステップは、
i)上記第1テキストオブジェクトの第4境界線と、対応している上記第2テキストオブジェクトの第4境界線との間の第4絶対差分を判定することにより、上記第4ヒストグラムを上記第4境界線に関連付けるステップを含むことを特徴とする請求項11に記載のテキスト方向判定方法。 - 上記テキスト方向を判定するステップは、
a)上記第1ヒストグラムから、実質ゼロの第1絶対差分に対応する第1出現頻度を判定するステップと、
b)上記第2ヒストグラムから、実質ゼロの第2絶対差分に対応する第2出現頻度を判定するステップと、
c)上記第3ヒストグラムから、実質ゼロの第3絶対差分に対応する第3出現頻度を判定するステップと、
d)上記第4ヒストグラムから、実質ゼロの第4絶対差分に対応する第4出現頻度を判定するステップと、
e)上記第1出現頻度、上記第2出現頻度、上記第3出現頻度、および、上記第4出現頻度の中から最大出現頻度を判定して、該最大出現頻度に関連付けられたヒストグラムを判定するステップと、
f)書かれた言語において、アセンダーを有するテキスト文字がディセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記最大出現頻度に関連付けられた上記ヒストグラムに対応する上記境界線に、上記テキスト方向のベースライン辺を関連付けるステップとを含むことを特徴とする請求項12に記載のテキスト方向判定方法。 - 上記テキスト方向を判定するステップは、
a)上記第1ヒストグラムから、実質ゼロの第1絶対差分に対応する第1出現頻度を判定するステップと、
b)上記第2ヒストグラムから、実質ゼロの第2絶対差分に対応する第2出現頻度を判定するステップと、
c)上記第3ヒストグラムから、実質ゼロの第3絶対差分に対応する第3出現頻度を判定するステップと、
d)上記第4ヒストグラムから、実質ゼロの第4絶対差分に対応する第4出現頻度を判定するステップと、
e)上記第1出現頻度、上記第2出現頻度、上記第3出現頻度、および、上記第4出現頻度の中から最大出現頻度を判定して、該最大出現頻度に関連付けられたヒストグラムを判定するステップと、
f)書かれた言語において、ディセンダーを有するテキスト文字がアセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記最大出現頻度に関連付けられた上記ヒストグラムに対応する上記境界線に対向する境界線に、上記テキスト方向のベースライン辺を関連付けるステップとを含むことを特徴とする請求項12に記載のテキスト方向判定方法。 - 上記デジタル画像の傾き角度を補正するステップをさらに含むことを特徴とする請求項1に記載のテキスト方向判定方法。
- デジタル画像のテキストの方向を判定するテキスト方向判定システムであって、
a)デジタル画像における複数のテキストオブジェクト対の各々について、第1配置特徴の第1配置特徴量を算出することにより、第1の複数の特徴量値を生成する第1配置特徴量算出手段と、
b)上記複数のテキストオブジェクト対の各々について、第2配置特徴の第2配置特徴量を算出することにより、第2の複数の特徴量値を生成する第2配置特徴量算出手段と、
c)上記第1の複数の特徴量値の第1ヒストグラムを生成する第1ヒストグラム生成手段と、
d)上記第2の複数の特徴量値の第2ヒストグラムを生成する第2ヒストグラム生成手段と、
e)上記第1ヒストグラムおよび上記第2ヒストグラムに基づいて、デジタル画像におけるテキスト方向を判定するテキスト方向判定手段とを備えていることを特徴とするテキスト方向判定システム。 - 上記第1配置特徴量算出手段が第1配置特徴の第1配置特徴量を算出するのに先行して、および、上記第2配置特徴量算出手段が第2配置特徴の第2配置特徴量を算出するのに先行して、傾き角度にしたがって、上記複数のテキストオブジェクト対の各々の傾きを補正する傾き補正手段をさらに備えていることを特徴とする請求項16に記載のテキスト方向判定システム。
- 上記複数のテキストオブジェクト対の各々は、第1テキストオブジェクトおよび第2テキストオブジェクトを含んでおり、
a)上記第1配置特徴量算出手段は、
i)上記第1ヒストグラムを第1境界線に関連付けるための、上記第1テキストオブジェクトの第1境界線と、それに対応する上記第2テキストオブジェクトの第1境界線との間の第1絶対差分を判定する第1減算手段を備え、
b)上記第2配置特徴量算出手段は、
i)上記第2ヒストグラムを第2境界線に関連付けるための、上記第1テキストオブジェクトの第2境界線と、それに対応する上記第2テキストオブジェクトの第2境界線との間の第2絶対差分を判定する第2減算手段を備えていることを特徴とする請求項16に記載のテキスト方向判定システム。 - 上記テキスト方向判定手段は、
a)上記第1ヒストグラムから、実質ゼロの第1絶対差分に対応する第1出現頻度を判定する第1出現頻度判定手段と、
b)上記第2ヒストグラムから、実質ゼロの第2絶対差分に対応する第2出現頻度を判定する第2出現頻度判定手段と、
c)ベースライン関連付け手段とを備え、
上記ベースライン関連付け手段は、
i)上記第1出現頻度が上記第2出現頻度よりも大きく、かつ、書かれた言語において、アセンダーを有するテキスト文字がディセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第1境界線に関連付け、
ii)上記第1出現頻度が上記第2出現頻度よりも小さく、かつ、書かれた言語において、アセンダーを有するテキスト文字がディセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第2境界線に関連付けることを特徴とする請求項18に記載のテキスト方向判定システム。 - 上記テキスト方向判定手段は、
a)上記第1ヒストグラムから、実質ゼロの第1絶対差分に対応する第1出現頻度を判定する第1出現頻度判定手段と、
b)上記第2ヒストグラムから、実質ゼロの第2絶対差分に対応する第2出現頻度を判定する第2出現頻度判定手段と、
c)ベースライン関連付け手段とを備え、
上記ベースライン関連付け手段は、
i)上記第1出現頻度が上記第2出現頻度よりも小さく、かつ、書かれた言語において、ディセンダーを有するテキスト文字がアセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第1境界線に関連付け、
ii)上記第1出現頻度が上記第2出現頻度よりも大きく、かつ、書かれた言語において、ディセンダーを有するテキスト文字がアセンダーを有するテキスト文字よりもその出現頻度が大きい場合に、上記テキスト方向のベースライン辺を、上記第2境界線に関連付けることを特徴とする請求項18に記載のテキスト方向判定システム。 - デジタル画像のテキストの方向を判定するテキスト方向判定方法であって、
a)デジタル画像から第1テキストオブジェクトを選択するステップと、
b)上記第1テキストオブジェクトについて、第1外接矩形を判定するステップと、
c)上記デジタル画像から第2テキストオブジェクトを選択するステップと、
d)上記第2テキストオブジェクトについて、第2外接矩形を判定するステップと、
e)上記第1テキストオブジェクトのサイズが、上記第2テキストオブジェクトのサイズと実質異なる場合に、
i)上記第1テキストオブジェクトおよび上記第2テキストオブジェクトについて、上記第1外接矩形の第1辺に関連している第1外接矩形特徴の第1外接矩形特徴量を判定するステップと、
ii)上記第1外接矩形特徴量に基づいて第1ヒストグラムを更新するステップと、
iii)上記第1テキストオブジェクトおよび上記第2テキストオブジェクトについて、上記第1外接矩形の第2辺に関連している第2外接矩形特徴の第2外接矩形特徴量を判定するステップと、
iv)上記第2外接矩形特徴量に基づいて第2ヒストグラムを更新するステップと、
v)上記第1テキストオブジェクトおよび上記第2テキストオブジェクトについて、上記第1外接矩形の第3辺に関連している第3外接矩形特徴の第3外接矩形特徴量を判定するステップと、
vi)上記第3外接矩形特徴量に基づいて第3ヒストグラムを更新するステップと、
vii)上記第1テキストオブジェクトおよび上記第2テキストオブジェクトについて、上記第1外接矩形の第4辺に関連している第4外接矩形特徴の第4外接矩形特徴量を判定するステップと、
viii)上記第4外接矩形特徴量に基づいて第4ヒストグラムを更新するステップと、
f)第1ヒストグラム、上記第2ヒストグラム、上記第3ヒストグラム、および、上記第4ヒストグラムに基づいて、上記デジタル画像におけるテキスト方向を判定するステップとを含むことを特徴とするテキスト方向判定方法。 - 上記第1テキストオブジェクトおよび上記第2テキストオブジェクトは、上記デジタル画像において互いに隣り合うテキストオブジェクトであることを特徴とする請求項21に記載のテキスト方向判定方法。
- 上記第1テキストオブジェクトおよび上記第2テキストオブジェクトは、上記デジタル画像において互いに隣り合わないテキストオブジェクトであることを特徴とする請求項21に記載のテキスト方向判定方法。
- コンピュータを、請求項16から20までのいずれか1項に記載のテキスト方向判定システムの各手段として機能させるための制御プログラム。
- 請求項24に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/766,661 | 2007-06-21 | ||
US11/766,661 US8144989B2 (en) | 2007-06-21 | 2007-06-21 | Methods and systems for identifying text orientation in a digital image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003937A true JP2009003937A (ja) | 2009-01-08 |
JP4777393B2 JP4777393B2 (ja) | 2011-09-21 |
Family
ID=40136544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008162466A Active JP4777393B2 (ja) | 2007-06-21 | 2008-06-20 | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8144989B2 (ja) |
JP (1) | JP4777393B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003936A (ja) * | 2007-06-21 | 2009-01-08 | Sharp Corp | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 |
JP2014147069A (ja) * | 2013-01-29 | 2014-08-14 | Sharp Corp | 方向判定装置、方向判定方法、及びコンピュータ読み取り可能な記録媒体 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8144989B2 (en) * | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
JP5582674B2 (ja) * | 2007-07-20 | 2014-09-03 | アルパイン株式会社 | 文字データの生成装置および生成方法、文字データの表示制御装置および表示方法、ナビゲーション装置 |
JP4572248B2 (ja) | 2008-06-23 | 2010-11-04 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体 |
US8437576B2 (en) * | 2008-06-23 | 2013-05-07 | Samsung Electronics Co., Ltd. | Method of correcting orientation of an image in automatic printing, and an image forming method and image forming apparatus thereof |
JP4625861B2 (ja) * | 2008-11-17 | 2011-02-02 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体 |
US8175388B1 (en) * | 2009-01-30 | 2012-05-08 | Adobe Systems Incorporated | Recognizing text at multiple orientations |
KR101035739B1 (ko) * | 2009-02-13 | 2011-05-20 | 전남대학교산학협력단 | 문자 인식의 왜곡을 보정하는 방법 |
JP4927122B2 (ja) * | 2009-06-15 | 2012-05-09 | シャープ株式会社 | 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体 |
US9734132B1 (en) * | 2011-12-20 | 2017-08-15 | Amazon Technologies, Inc. | Alignment and reflow of displayed character images |
JP5838887B2 (ja) * | 2012-03-29 | 2016-01-06 | 大日本印刷株式会社 | 文書認識装置、文書認識方法、プログラム |
CN103455806B (zh) * | 2012-05-31 | 2017-06-13 | 富士通株式会社 | 文档处理装置、文档处理方法以及扫描仪 |
JP2014215752A (ja) * | 2013-04-24 | 2014-11-17 | 株式会社東芝 | 電子機器および手書きデータ処理方法 |
RU2633182C1 (ru) * | 2016-06-15 | 2017-10-11 | Общество с ограниченной ответственностью "Аби Девелопмент" | Определение направления строк текста |
US10616443B1 (en) * | 2019-02-11 | 2020-04-07 | Open Text Sa Ulc | On-device artificial intelligence systems and methods for document auto-rotation |
CN112766266B (zh) * | 2021-01-29 | 2021-12-10 | 云从科技集团股份有限公司 | 基于分阶段概率统计的文本方向矫正方法、系统及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09130516A (ja) * | 1995-10-30 | 1997-05-16 | Minolta Co Ltd | 原稿画像の天地を認識できる画像処理装置 |
JP2001155114A (ja) * | 1999-11-30 | 2001-06-08 | Pfu Ltd | 文字認識前処理装置及び方法並びにプログラム記録媒体 |
JP2002109470A (ja) * | 2000-09-27 | 2002-04-12 | Minolta Co Ltd | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 |
JP2006031546A (ja) * | 2004-07-20 | 2006-02-02 | Ricoh Co Ltd | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
JP2006054885A (ja) * | 2004-08-10 | 2006-02-23 | Oce Technol Bv | 走査中のアウトライア検出 |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
EP0325233B1 (en) * | 1988-01-18 | 1994-07-27 | Kabushiki Kaisha Toshiba | Character string recognition system |
JPH02116987A (ja) | 1988-10-27 | 1990-05-01 | Toshiba Corp | 文字認識装置 |
US5060276A (en) * | 1989-05-31 | 1991-10-22 | At&T Bell Laboratories | Technique for object orientation detection using a feed-forward neural network |
US5191438A (en) * | 1989-12-12 | 1993-03-02 | Sharp Kabushiki Kaisha | Facsimile device with skew correction and text line direction detection |
US5077811A (en) * | 1990-10-10 | 1991-12-31 | Fuji Xerox Co., Ltd. | Character and picture image data processing system |
JPH04195485A (ja) * | 1990-11-28 | 1992-07-15 | Hitachi Ltd | 画像情報入力装置 |
US5235651A (en) * | 1991-08-06 | 1993-08-10 | Caere Corporation | Rotation of images for optical character recognition |
US5251268A (en) * | 1991-08-09 | 1993-10-05 | Electric Power Research Institute, Inc. | Integrated method and apparatus for character and symbol recognition |
JP3251959B2 (ja) * | 1991-10-17 | 2002-01-28 | 株式会社リコー | 画像形成装置 |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
US5276742A (en) * | 1991-11-19 | 1994-01-04 | Xerox Corporation | Rapid detection of page orientation |
US6574375B1 (en) * | 1992-04-06 | 2003-06-03 | Ricoh Company, Ltd. | Method for detecting inverted text images on a digital scanning device |
JP2723118B2 (ja) * | 1992-08-31 | 1998-03-09 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 2次元オブジェクトの認識に用いるためのニューラル・ネットワーク及び光学式文字認識装置 |
DE69333694T2 (de) * | 1992-09-11 | 2005-10-20 | Canon K.K. | Verfahren und Anordnung zur Bildverarbeitung |
US5319722A (en) * | 1992-10-01 | 1994-06-07 | Sony Electronics, Inc. | Neural network for character recognition of rotated characters |
CA2116600C (en) * | 1993-04-10 | 1996-11-05 | David Jack Ittner | Methods and apparatus for inferring orientation of lines of text |
JP3050007B2 (ja) * | 1993-08-26 | 2000-06-05 | ミノルタ株式会社 | 画像読取装置およびこれを備えた画像形成装置 |
US5930001A (en) * | 1994-10-25 | 1999-07-27 | Canon Kabushiki Kaisha | Copier which rotates an image based on the recognition of an extracted character from various directions |
US5987171A (en) * | 1994-11-10 | 1999-11-16 | Canon Kabushiki Kaisha | Page analysis system |
JP3534128B2 (ja) * | 1995-01-24 | 2004-06-07 | オムロン株式会社 | 書類の上下方向検知方法及び装置 |
JPH08249422A (ja) * | 1995-03-08 | 1996-09-27 | Canon Inc | 文字処理装置及び方法 |
US5689585A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Method for aligning a text image to a transcription of the image |
US5889884A (en) * | 1995-05-23 | 1999-03-30 | Minolta Co., Ltd. | Image forming apparatus capable of recognizing top and bottom of document image |
JPH099040A (ja) * | 1995-06-21 | 1997-01-10 | Minolta Co Ltd | 画像処理装置 |
CN1287322C (zh) * | 1995-07-31 | 2006-11-29 | 富士通株式会社 | 文件媒体处理方法 |
JPH0951422A (ja) * | 1995-08-09 | 1997-02-18 | Minolta Co Ltd | 画像編集装置 |
US6137905A (en) * | 1995-08-31 | 2000-10-24 | Canon Kabushiki Kaisha | System for discriminating document orientation |
US6188790B1 (en) * | 1996-02-29 | 2001-02-13 | Tottori Sanyo Electric Ltd. | Method and apparatus for pre-recognition character processing |
US6473196B2 (en) * | 1996-09-19 | 2002-10-29 | Canon Kabushiki Kaisha | Image forming apparatus and method |
US6304681B1 (en) * | 1996-09-26 | 2001-10-16 | Canon Kabushiki Kaisha | Image processing apparatus for executing image processing in correspondence with portrait and landscape types |
US6173088B1 (en) * | 1996-10-01 | 2001-01-09 | Canon Kabushiki Kaisha | Image forming method and apparatus |
JP3728040B2 (ja) * | 1996-12-27 | 2005-12-21 | キヤノン株式会社 | 画像形成装置及び方法 |
KR100247970B1 (ko) * | 1997-07-15 | 2000-03-15 | 윤종용 | 문서 영상의 방향 교정방법 |
US6151423A (en) * | 1998-03-04 | 2000-11-21 | Canon Kabushiki Kaisha | Character recognition with document orientation determination |
JP3422924B2 (ja) * | 1998-03-27 | 2003-07-07 | 富士通株式会社 | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6804414B1 (en) * | 1998-05-01 | 2004-10-12 | Fujitsu Limited | Image status detecting apparatus and document image correcting apparatus |
US6798905B1 (en) * | 1998-07-10 | 2004-09-28 | Minolta Co., Ltd. | Document orientation recognizing device which recognizes orientation of document image |
JP3695163B2 (ja) * | 1998-07-31 | 2005-09-14 | コニカミノルタビジネステクノロジーズ株式会社 | 画像形成装置 |
US6624905B1 (en) | 1998-09-29 | 2003-09-23 | Canon Kabushiki Kaisha | Image formation apparatus having image direction discrimination function |
JP2001043310A (ja) | 1999-07-30 | 2001-02-16 | Fujitsu Ltd | 文書画像補正装置および補正方法 |
JP4228530B2 (ja) * | 2000-02-09 | 2009-02-25 | 富士通株式会社 | 画像処理方法及び画像処理装置 |
US6993205B1 (en) * | 2000-04-12 | 2006-01-31 | International Business Machines Corporation | Automatic method of detection of incorrectly oriented text blocks using results from character recognition |
US7031553B2 (en) * | 2000-09-22 | 2006-04-18 | Sri International | Method and apparatus for recognizing text in an image sequence of scene imagery |
US6546215B2 (en) * | 2001-09-10 | 2003-04-08 | Toshiba Tec Kabushiki Kaisha | Image forming apparatus and method having document orientation control |
US6567628B1 (en) * | 2001-11-07 | 2003-05-20 | Hewlett-Packard Development Company L.P. | Methods and apparatus to determine page orientation for post imaging finishing |
US7215828B2 (en) * | 2002-02-13 | 2007-05-08 | Eastman Kodak Company | Method and system for determining image orientation |
CN1183436C (zh) | 2002-04-03 | 2005-01-05 | 摩托罗拉公司 | 用于手写字符的方向确定及其识别 |
US7167279B2 (en) * | 2002-05-08 | 2007-01-23 | Kabushiki Kaisha Toshiba | Image forming apparatus |
US20040001606A1 (en) * | 2002-06-28 | 2004-01-01 | Levy Kenneth L. | Watermark fonts |
JP2004246546A (ja) | 2003-02-13 | 2004-09-02 | Ricoh Co Ltd | 画像処理方法、該方法の実行に用いるプログラム及び画像処理装置 |
JP2004272798A (ja) * | 2003-03-11 | 2004-09-30 | Pfu Ltd | 画像読み取り装置 |
JP4350414B2 (ja) * | 2003-04-30 | 2009-10-21 | キヤノン株式会社 | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
US7335695B2 (en) * | 2003-07-18 | 2008-02-26 | Engelhard Corporation | Powder coating precursors and the use thereof in powder coating compositions |
JP4443194B2 (ja) | 2003-11-10 | 2010-03-31 | 日立オムロンターミナルソリューションズ株式会社 | 携帯端末の文字認識における処理対象選択方法および携帯端末 |
US7286718B2 (en) * | 2004-01-26 | 2007-10-23 | Sri International | Method and apparatus for determination of text orientation |
JP4607633B2 (ja) * | 2005-03-17 | 2011-01-05 | 株式会社リコー | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 |
US7545529B2 (en) * | 2005-03-24 | 2009-06-09 | Kofax, Inc. | Systems and methods of accessing random access cache for rescanning |
JP2006343960A (ja) | 2005-06-08 | 2006-12-21 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
CN100527064C (zh) * | 2005-10-25 | 2009-08-12 | 摩托罗拉公司 | 用于输入字符的方法和设备 |
US8144989B2 (en) * | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
-
2007
- 2007-06-21 US US11/766,661 patent/US8144989B2/en not_active Expired - Fee Related
-
2008
- 2008-06-20 JP JP2008162466A patent/JP4777393B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09130516A (ja) * | 1995-10-30 | 1997-05-16 | Minolta Co Ltd | 原稿画像の天地を認識できる画像処理装置 |
JP2001155114A (ja) * | 1999-11-30 | 2001-06-08 | Pfu Ltd | 文字認識前処理装置及び方法並びにプログラム記録媒体 |
JP2002109470A (ja) * | 2000-09-27 | 2002-04-12 | Minolta Co Ltd | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 |
JP2006031546A (ja) * | 2004-07-20 | 2006-02-02 | Ricoh Co Ltd | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
JP2006054885A (ja) * | 2004-08-10 | 2006-02-23 | Oce Technol Bv | 走査中のアウトライア検出 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003936A (ja) * | 2007-06-21 | 2009-01-08 | Sharp Corp | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 |
JP2014147069A (ja) * | 2013-01-29 | 2014-08-14 | Sharp Corp | 方向判定装置、方向判定方法、及びコンピュータ読み取り可能な記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US8144989B2 (en) | 2012-03-27 |
JP4777393B2 (ja) | 2011-09-21 |
US20080317341A1 (en) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4777393B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP4758461B2 (ja) | デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体 | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
US6640010B2 (en) | Word-to-word selection on images | |
US7567730B2 (en) | Detecting an orientation of characters in a document image | |
US8009909B2 (en) | Image processing apparatus and its method | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
JP2010003087A (ja) | 画像処理装置および画像処理方法 | |
JP6000992B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP5538812B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP5005732B2 (ja) | 画像形成装置及び画像処理方法 | |
US8254693B2 (en) | Image processing apparatus, image processing method and program | |
JPWO2013061468A1 (ja) | 画像生成方法、情報処理方法、プログラム、及び情報処理装置 | |
US20070171453A1 (en) | Image processing apparatus, image processing method, program, and storage medium | |
JP4070486B2 (ja) | 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム | |
JP4803001B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2008269131A (ja) | 画像処理装置及び画像処理プログラム | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
JPH08123904A (ja) | 書体種類処理装置 | |
JPH09120430A (ja) | 画像処理装置 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP4859027B2 (ja) | 文字パターン生成方法および文字認識方法 | |
CN113610089A (zh) | 页面扭曲校正方法及系统、电子设备和计算机可读介质 | |
JP2023053632A (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110629 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4777393 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140708 Year of fee payment: 3 |