JP2011008770A - 原稿方向の検出方法及び装置 - Google Patents

原稿方向の検出方法及び装置 Download PDF

Info

Publication number
JP2011008770A
JP2011008770A JP2010101989A JP2010101989A JP2011008770A JP 2011008770 A JP2011008770 A JP 2011008770A JP 2010101989 A JP2010101989 A JP 2010101989A JP 2010101989 A JP2010101989 A JP 2010101989A JP 2011008770 A JP2011008770 A JP 2011008770A
Authority
JP
Japan
Prior art keywords
stroke
document
cross feature
node
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010101989A
Other languages
English (en)
Other versions
JP5271956B2 (ja
Inventor
Toshiaki Mutsuo
敏明 六尾
Pingli Li
ピンリ リー
Honjii Chan
ホンジー チャン
Mengyou Yuan
モンヨウ ユエン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Founder International Beijing Co Ltd
Kyocera Document Solutions Inc
Original Assignee
Peking University
Founder International Beijing Co Ltd
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Founder International Beijing Co Ltd, Kyocera Mita Corp filed Critical Peking University
Publication of JP2011008770A publication Critical patent/JP2011008770A/ja
Application granted granted Critical
Publication of JP5271956B2 publication Critical patent/JP5271956B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】関連技術に要求された大量の計算量による長い遅延時間や高コストの問題が解消され、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現される。
【解決手段】本発明は、原稿を走査して原稿の文字の筆画図を得るステップと、筆画図により文字の十字特徴を抽出するステップと、十字特徴により原稿方向を検出するステップとを含む原稿方向の検出方法を提供する。また、本発明は、原稿を走査して原稿の文字の筆画図を得る走査モジュールと、筆画図により文字の十字特徴を抽出する抽出モジュールと、十字特徴により原稿方向を検出する検出モジュールとを含む原稿方向の検出装置も提供する。
【選択図】図1

Description

本発明は、画像処理分野に関し、詳しくは原稿方向の検出方法及び装置に関する。

従来、走査装置により画像を走査する場合に、画像の最初のセット方向に基づいて画像が形成されることが知られている。画像が斜めに或は逆向きにセットされると、ユーザの手に入る走査後の画像形成結果も斜め或は逆向きになる。走査される画像が原稿である場合、斜め或は逆向きの方向が混乱している画像形成結果を得る恐れがある。
原稿の画像形成結果に対して原稿方向の検出を行うことができないため、正確な読み方向が得られない。従って、ユーザがそれらを複数回に回転すること、即ち、人力補正により、正確な読み方向を得る必要があり、とても面倒なことになる。
上述した問題点を解決するために、関連技術には、原稿における文字を認識してその認識結果に基づいて原稿方向を判定する原稿方向の検出方法が提案されている。

ところが、発明者は、上記方法を実現する際に、当該方法では、検出中において文字認識を先に完成しなければならないことに起因して、要求される計算量が大きくなり、長い遅延時間や高コストの欠点があることが分かった。
本発明は、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題を解決できる原稿方向の検出方法を提供することを目的とする。

本発明において、原稿を走査して原稿の文字の筆画図を得るステップと、筆画図により文字の十字特徴を抽出するステップと、十字特徴により原稿方向を検出するステップとを含む原稿方向の検出方法が提供されている。
本発明において、原稿を走査して原稿の文字の筆画図を得る走査モジュールと、筆画図により文字の十字特徴を抽出する抽出モジュールと、十字特徴により原稿方向を検出する検出モジュールとを含む原稿方向の検出装置も提供されている。

十字特徴により原稿方向を検出し、これを走査装置による原稿方向自動補正の基礎とするため、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題が解消され、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現される。

本発明の一実施例に係る原稿方向の検出方法を示すフローチャートである。 本発明の一実施例に係る検出方法の筆画ノードを示す模式図である。 図2に対応する筆画図である。 1文字の模式図である。 図4に対応する筆画図である。 本発明の一実施例に係る貫通関係を示す模式図である。 本発明の一実施例に係る横方向十字特徴構造を示す模式図である。 本発明の一実施例に係る縦方向十字特徴構造を示す模式図である。 本発明の他の実施例に係る原稿方向の検出装置を示す構成図である。
以下、図面を参照した上で、実施例に基づいて、本発明を詳しく説明する。
図1には、本発明の一実施例に係る原稿方向の検出方法を示すフローチャートである。この原稿方向の検出方法は、原稿を走査して原稿における文字の筆画図を得るステップS10と、筆画図により文字の十字特徴を抽出するステップS20と、十字特徴により原稿方向を検出するステップS30とを含む。
本実施例において、まず、原稿を一回走査して文字の筆画情報を含む筆画図を取得し、次に筆画図からその十字特徴を抽出し、最後に十字特徴により原稿方向を検出する。この十字特徴による方法により、原稿方向の正確な検出を実現でき、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題が解消され、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現される。
また、ステップS20は、具体的に、筆画図における筆画ノードbody、直筆画wing、非直筆画及びそれらの連結関係により、文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出することと、文字が横方向十字特徴構造である場合、さらに文字の十字特徴の向きを左向きまたは右向きとして抽出することと、文字が縦方向十字特徴構造である場合、さらに文字の十字特徴の向きを上向きまたは下向きとして抽出することを含む。
本実施例において、まず、筆画図から文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出し、次に文字の十字特徴の向きをさらに抽出し、横方向構造の場合、向きを左向きまたは右向きとし、縦方向構造の場合は、向きを上向きまたは下向きとする。筆画図は、原稿を走査して得られたものであり、筆画ノード、直筆画、非直筆画など、文字を構成する基本要素の間の連結関係を反映しているため、筆画図から文字の十字特徴を抽出するのは完全に実行できる。
プログレッシブ記録された画像において、同じ階調値を有する幾つかの画素からなるシーケンスがラン(run)と呼ばれ、ランの中の画像数がランレングス(run-length)と呼ばれている。文字に対して画像処理をするとき、run-lengthの近い隣接ランを連結して筆画ノード(Stroke Node)を得ることができる。図2に示すように、点線楕円ボックスで表した領域において、各ランのrun-lengthが近く、互いに大きな差がない。即ち、各点線ボックスは一つのStroke Nodeに対応する。図2の文字「大」は、合計6つのStroke Nodeがある。
Stroke Nodeの基本種類は、横画、縦画、点、左払い、右払いを含む。また、Stroke Nodeには、位置や長さなどの属性が含まれている。
筆画ノード間の連結関係をグラフで表すと、筆画図(Stroke Graph)が得られる。図3には、基本種類のStroke Nodeで図2の文字の原始画像を表す、図2に対応する筆画図を示す。筆画図において、辺を用いて筆画ノード間の連結関係を表し、マトリックス構造で連結関係を記憶する。図5は、図4に示す文字に対応する筆画図である。図5には、合計(0〜17)の18個の筆画ノードがある。それらの連結関係は、辺を用いて(3, 0)、(3, 2)、(4, 3)、(6, 5)、(7, 4)、(7, 6)、(9, 7)、(10, 7)、(11, 8)、(12, 8)、(13, 9)、(13, 12)、(14, 13)、(14, 11)、(15, 10)、(17, 14)と表すことができる。各辺はそれぞれ数字対に表され、この数字対の要素が、隣接する2つの筆画ノードの番号である。
筆画は、a)1つ又は複数の筆画ノードを連結してなる、b)一方の端部が筆画ノードに連結され、他方の端部が1つの辺のみを有する、c)他の筆画ノードの辺がいずれも2つあり、且つそれぞれ上方と下方に位置する、d)各筆画ノードの平均幅が近似するという条件を満たすと、直筆画と見なされる。
図6には、本発明の一実施例に係る貫通関係の模式図を示す。連結関係は貫通関係を含む。2つの筆画ノードは、同一筆画ノードに繋がる上下の2筆画ノードそれぞれの連結箇所のrun-lengthの中心点であるbcxとhcxとの距離wが該同一筆画ノードの高さhより小さく、且つ上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされる。
本実施例において、上述した関係を満たしている2つの筆画ノードは、互いの貫通ノードと設定されている。貫通関係は、重要な連結関係であって、文字の十字特徴を抽出する基礎でもある。
図7には、本発明の一実施例に係る横方向十字特徴構造の模式図を示す。文字は、その2つの直筆画wingが同一の筆画ノードbodyに連結され、且つ貫通関係を有するという条件と、筆画ノードbodyの端点から直筆画の境界までの距離が直筆画wingの平均run-length幅の1/2よりも大きいという条件と、筆画ノードbodyに連結される他の筆画ノードがいずれも直筆画wingに対して同一側に位置するという条件を同時に満たすと、横方向十字特徴構造とされる。
本実施例において、文字の直筆画wingと筆画ノードbodyとが貫通連結であるか否か、それらの距離、および他の筆画ノードの位置によれば、文字の十字特徴構造を横方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、同一側が右側であると、文字の十字特徴の向きが左向きであり、同一側が左側であると、文字の十字特徴の向きが右向きである。
本実施例において、横方向十字特徴構造を得た後、筆画ノードbodyに連結される他の筆画ノードが直筆画wingの左側に位置するか、右側に位置するかを判定するだけで、横方向十字特徴の向きを得ることができる。図7には、筆画ノードbodyに連結される他の筆画ノードが直筆画wingの左側に位置するため、当該文字の十字特徴の向きが右向きであることがわかった。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
図8には、本発明の一実施例に係る縦方向十字特徴構造の模式図を示す。文字は、第1の筆画ノードbodyの上部に連結される第2の筆画ノードの数が1、即ちupNum=1であり、downNumの値が1又は2でもよく、第1の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第2の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第1の筆画ノードbodyの中間部に位置するという条件と、第1の筆画ノードbodyに連結される筆画が全て直筆画である、或は第1の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
また、文字は、第1の筆画ノードbodyの下部に連結される第2の筆画ノードの数が1、即ちdownNum=1であり、upNumの値が1又は2でもよく、第1の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第2の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第1の筆画ノードbodyの中間部に位置するという条件と、第1の筆画ノードbodyに連結される筆画が全て直筆画である、或は第1の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
本実施例において、文字の第1の筆画ノードbodyに連結される第2の筆画ノードの数、第1の筆画ノードbodyの幅と高さの比、第2の筆画ノードは貫通ノードがあるか否か、当該貫通ノードと第1の筆画ノードbodyとの関係、及び第1の筆画ノードbodyに連結される筆画の性質によれば、文字の十字特徴構造を縦方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、第1の筆画ノードbodyに連結される筆画が全て直筆画である場合、第1の筆画ノードbodyの下部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが上向きであり、第1の筆画ノードbodyの上部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが下向きである。
また、第1の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画である場合、非直筆画が第1の筆画ノードbodyの下部に位置するとき、文字の十字特徴の向きが上向きであり非直筆画が第1の筆画ノードbodyの上部に位置するとき、文字の十字特徴の向きが下向きである。
本実施例において、縦方向十字特徴構造を得た後、第1の筆画ノードbodyに連結される他の筆画ノードが第1の筆画ノードbodyの上部に位置するか、下部に位置するかを判定するだけで、縦方向十字特徴の向きを得ることができる。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
また、ステップS30は、十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計することと、最も多い数に対応する十字特徴の向きを原稿方向に設定することを含む。
本実施例において、原稿中の大量の文字の十字特徴の向きを統計することにより、左向き、右向き、上向き、下向きのそれぞれに対応する文字数を取得し、文字数の最も多い向きを原稿方向として設定する。即ち、筆画図から抽出された十字特徴の向きを原稿方向の検出の基礎とする。これにより、本実施例の原稿方向検出方法によれば、原稿方向の検出速度が加速され、原稿方向の検出精度が向上する。
また、原稿方向の検出方法は、原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、原稿の十字特徴の向きが前記所定の向きになるまで、原稿を補正するステップを更に含む。
本実施例において、検出された原稿方向に基づいて所定の向きでない原稿を補正することにより、ユーザが読みやすい所定の向きの原稿を得る。
図9には、本発明の他の実施例に係る原稿方向の検出装置の構成図を示す。この原稿方向の検出装置は、原稿を走査して原稿の文字の筆画図を得る走査モジュール10と、筆画図により文字の十字特徴を抽出する抽出モジュール20と、十字特徴により原稿方向を検出する検出モジュール30とを含む。
本実施例において、まず、走査モジュール10により原稿を一回走査して文字の筆画情報を含む筆画図を取得し、次に抽出モジュール20により筆画図からその十字特徴を抽出し、最後に検出モジュール30により十字特徴に基づいて原稿方向を検出する。この十字特徴による原稿方向の検出装置は、原稿方向の正確な検出を実現でき、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題を解消し、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果を実現している。
また、抽出モジュール20は、筆画図の筆画ノードbody、直筆画wing、非直筆画及びそれらの連結関係により、文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出する十字特徴構造抽出ユニットと、十字特徴構造に基づいて、さらに文字の十字特徴の向きを抽出し、文字が横方向十字特徴構造である場合、さらに文字の十字特徴の向きを左向きまたは右向きとして抽出し、文字が縦方向十字特徴構造である場合、さらに文字の十字特徴の向きを上向きまたは下向きとして抽出する十字特徴向き抽出ユニットとを含む。
本実施例において、まず、十字特徴構造抽出ユニットにより筆画図から文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出し、次に十字特徴向き抽出ユニットによりさらに文字の十字特徴の向きを抽出し、横方向構造である場合、向きを左向きまたは右向きとし、縦方向構造である場合は、向きを上向きまたは下向きとする。筆画図は、原稿を走査して得られたものであり、筆画ノードbody、直筆画wing、非直筆画など、文字を構成する基本要素の間の連結関係を反映しているため、筆画図から文字の十字特徴を抽出するのは完全に実行できる。
また、連結関係は貫通関係を含み、2つの筆画ノードは、同一筆画ノードに繋がる上下の2筆画ノードそれぞれの連結箇所のrun-lengthの中心点間の距離が該同一筆画ノードの高さより小さく、且つ上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされる。
本実施例において、上述した関係を満たしている2つの筆画ノードは、互いの貫通ノードと設定されている。貫通関係は、重要な連結関係であって、文字の十字特徴を抽出する基礎でもある。
また、文字は、その2つの直筆画wingが同一の筆画ノードbodyに連結され、且つ貫通関係を有するという条件と、筆画ノードbodyの端点から直筆画の境界までの距離が直筆画wingの平均run-length幅の1/2よりも大きいという条件と、筆画ノードbodyに連結される他の筆画ノードがいずれも直筆画wingに対して同一側に位置するという条件を同時に満たすと、横方向十字特徴構造とされる。
本実施例において、文字の直筆画wingと筆画ノードbodyとが貫通連結であるか否か、それらの距離、および他の筆画ノードの位置によれば、文字の十字特徴構造を横方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、同一側が右側であると、文字の十字特徴の向きが左向きであり、同一側が左側であると、文字の十字特徴の向きが右向きである。
本実施例において、横方向十字特徴構造を得た後、筆画ノードbodyに連結される他の筆画ノードが直筆画wingの左側に位置するか、右側に位置するかを判定するだけで、横方向十字特徴の向きを得ることができる。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
また、文字は、第3の筆画ノードbodyの上部に連結される第4の筆画ノードの数が1、即ちupNum=1であり、downNumの値が1又は2でもよく、第3の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第4の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第3の筆画ノードbodyの中間部に位置するという条件と、第3の筆画ノードbodyに連結される筆画が全て直筆画である、或は第3の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
また、文字は、第3の筆画ノードbodyの下部に連結される第4の筆画ノードの数が1、即ちdownNum=1であり、upNumの値が1又は2でもよく、第3の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第4の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第3の筆画ノードbodyの中間部に位置するという条件と、第3の筆画ノードbodyに連結される筆画が全て直筆画である、或は第3の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
本実施例において、文字の第3の筆画ノードbodyに連結される第4の筆画ノードの数、第3の筆画ノードbodyの幅と高さの比、第4の筆画ノードは貫通ノードがあるか否か、当該貫通ノードと第3の筆画ノードbodyとの関係、及び第3の筆画ノードbodyに連結される筆画の性質によれば、文字の十字特徴構造を縦方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、第3の筆画ノードbodyに連結される筆画が全て直筆画である場合、第3の筆画ノードbodyの下部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが上向きであり、第3の筆画ノードbodyの上部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが下向きである。
また、第3の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画である場合、非直筆画が第3の筆画ノードbodyの下部に位置するとき、文字の十字特徴の向きが上向きであり、非直筆画が第3の筆画ノードbodyの上部に位置するとき、文字の十字特徴の向きが下向きである。
本実施例において、縦方向十字特徴構造を得た後、第3の筆画ノードbodyに連結される他の筆画ノードが第3の筆画ノードbodyの上部に位置するか、下部に位置するかを判定するだけで、縦方向十字特徴の向きを得ることができる。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
また、検出モジュール30は、十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計する統計ユニットと、最も多い数に対応する十字特徴の向きを原稿方向に設定する設定ユニットとを含む。
本実施例において、統計ユニットにより原稿中の大量の文字の十字特徴の向きを統計して、左向き、右向き、上向き、下向きのそれぞれに対応する文字数を取得し、設定ユニットにより文字数の最も多い向きを原稿方向に設定する。即ち、筆画図から抽出された十字特徴の向きを原稿方向の検出の基礎とする。これにより、本実施例の原稿方向検出装置によれば、原稿方向の検出速度が加速され、原稿方向の検出精度が向上する。
また、原稿方向の検出装置は、原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、原稿の十字特徴の向きが前記所定の向きになるまで、原稿を補正する補正モジュールを更に含む。
本実施例の補正モジュールは、検出された原稿方向に基づいて所定の向きでない原稿を補正することにより、ユーザが読みやすい所定の向きの原稿を得る。
以上の説明から、本発明の上記実施例によれば、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現されることが分かった。
なお、上述した本発明の各モジュールや各ステップは、汎用の計算装置で実現することができ、単一の計算装置に集積してもよく、複数の計算装置からなるネットワークに配置してもよい。また、各モジュールや各ステップは、計算装置が実行可能なプログラムコードで実現することができる。従って、それらを記憶装置に記憶して計算装置に実行させてもよく、それぞれ各集積回路モジュールとして作成してもよく、それらのうちの複数のモジュール又はステップを単一の集積回路モジュールとして作成して実現してもよい。このように、本発明は、如何なる特定のハードウェアとソフトウェアとの組合せに限定されない。
以上は、本発明の好適な実施例に過ぎず、本発明を限定するものではない。本発明は、様々な変更や変形が可能である。本発明の精神及び原則を逸脱しない範囲で、如何なる変更、同等代替、改良なども本発明の保護範囲内に含まれる。
10 走査モジュール
20 抽出モジュール
30 検出モジュール

Claims (18)

  1. 原稿を走査して前記原稿の文字の筆画図を得るステップと、
    前記筆画図により前記文字の十字特徴を抽出するステップと、
    前記十字特徴により原稿方向を検出するステップと、
    を含むことを特徴とする原稿方向の検出方法。
  2. 前記筆画図により前記文字の十字特徴を抽出するステップは、
    前記筆画図の筆画ノード、直筆画、非直筆画及びそれらの連結関係により、前記文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出するステップと、
    前記文字が前記横方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを左向きまたは右向きとして抽出するステップと、
    前記文字が前記縦方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを上向きまたは下向きとして抽出するステップと、
    を含むことを特徴とする請求項1に記載の原稿方向の検出方法。
  3. 前記連結関係は貫通関係を含み、
    2つの前記筆画ノードは、
    同一筆画ノードに連結される上下の2筆画ノードの端点間の距離が前記同一筆画ノードの高さより小さく、且つ前記上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされることを特徴とする請求項2に記載の原稿方向の検出方法。
  4. 前記文字は、
    その2つの前記直筆画が同一の前記筆画ノードに連結され、且つ貫通関係を有するという条件と、
    前記筆画ノードの端点から前記直筆画の境界までの距離が前記直筆画の平均ラン幅の1/2よりも大きいという条件と、
    前記筆画ノードに連結される他の筆画ノードがいずれも前記直筆画に対して同一側に位置するという条件を同時に満たすと、前記横方向十字特徴構造とされることを特徴とする請求項3に記載の原稿方向の検出方法。
  5. 前記同一側が右側であると、前記文字の十字特徴の向きが左向きであり、
    前記同一側が左側であると、前記文字の十字特徴の向きが右向きであることを特徴とする請求項4に記載の原稿方向の検出方法。
  6. 前記文字は、
    第1の筆画ノードの上部または下部に連結される第2の筆画ノードの数が1であり、前記第1の筆画ノードの幅がその高さの2倍よりも大きいという条件と、
    前記第2の筆画ノードに連結される貫通ノードがあり、且つ前記貫通ノードが前記第1の筆画ノードの中間部に位置するという条件と、
    前記第1の筆画ノードに連結される筆画が全て前記直筆画である、或は前記第1の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画であるという条件を同時に満たすと、前記縦方向十字特徴構造とされることを特徴とする請求項3に記載の原稿方向の検出方法。
  7. 前記第1の筆画ノードに連結される筆画が全て前記直筆画である場合、
    前記第1の筆画ノードの下部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが上向きであり、
    前記第1の筆画ノードの上部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが下向きであり、
    前記第1の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画である場合、
    前記非直筆画が前記第1の筆画ノードの下部に位置するとき、前記文字の十字特徴の向きが上向きであり、
    前記非直筆画が前記第1の筆画ノードの上部に位置するとき、前記文字の十字特徴の向きが下向きであることを特徴とする請求項6に記載の原稿方向の検出方法。
  8. 前記十字特徴により原稿方向を検出するステップは、
    前記十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計するステップと、
    最も多い数に対応する前記十字特徴の向きを前記原稿方向に設定するステップと、
    を含むことを特徴とする請求項1乃至7のいずれか1項に記載の原稿方向の検出方法。
  9. 前記原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、前記原稿の十字特徴の向きが前記所定の向きになるまで、前記原稿を補正するステップを更に含むことを特徴とする請求項8に記載の原稿方向の検出方法。
  10. 原稿を走査して前記原稿の文字の筆画図を得る走査モジュールと、
    前記筆画図により前記文字の十字特徴を抽出する抽出モジュールと、
    前記十字特徴により原稿方向を検出する検出モジュールと、
    を含むことを特徴とする原稿方向の検出装置。
  11. 前記抽出モジュールは、
    前記筆画図の筆画ノード、直筆画、非直筆画及びそれらの連結関係により、前記文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出する十字特徴構造抽出ユニットと、
    前記十字特徴構造に基づいて、さらに前記文字の十字特徴の向きを抽出し、前記文字が前記横方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを左向きまたは右向きとして抽出し、前記文字が前記縦方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを上向きまたは下向きとして抽出する十字特徴向き抽出ユニットと、
    を含むことを特徴とする請求項10に記載の原稿方向の検出装置。
  12. 前記連結関係は貫通関係を含み、
    2つの前記筆画ノードは、
    同一筆画ノードに連結される上下の2筆画ノードの端点間の距離が前記同一筆画ノードの高さより小さく、且つ前記上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされることを特徴とする請求項11に記載の原稿方向の検出装置。
  13. 前記文字は、
    その2つの前記直筆画が同一の前記筆画ノードに連結され、且つ貫通関係を有するという条件と、
    前記筆画ノードの端点から前記直筆画の境界までの距離が前記直筆画の平均ラン幅の1/2よりも大きいという条件と、
    前記筆画ノードに連結される他の筆画ノードがいずれも前記直筆画に対して同一側に位置するという条件を同時に満たすと、前記横方向十字特徴構造とされることを特徴とする請求項12に記載の原稿方向の検出装置。
  14. 前記同一側が右側であると、前記文字の十字特徴の向きが左向きであり、
    前記同一側が左側であると、前記文字の十字特徴の向きが右向きであることを特徴とする請求項13に記載の原稿方向の検出装置。
  15. 前記文字は、
    第3の筆画ノードの上部または下部に連結される第4の筆画ノードの数が1であり、前記第3の筆画ノードの幅がその高さの2倍よりも大きいという条件と、
    前記第4の筆画ノードに連結される貫通ノードがあり、且つ前記貫通ノードが前記第3の筆画ノードの中間部に位置するという条件と、
    前記第3の筆画ノードに連結される筆画が全て前記直筆画である、或は前記第3の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画であるという条件を同時に満たすと、前記縦方向十字特徴構造とされることを特徴とする請求項12に記載の原稿方向の検出装置。
  16. 前記第3の筆画ノードに連結される筆画が全て前記直筆画である場合、
    前記第3の筆画ノードの下部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが上向きであり、
    前記第3の筆画ノードの上部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが下向きであり、
    前記第3の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画である場合、
    前記非直筆画が前記第3の筆画ノードの下部に位置するとき、前記文字の十字特徴の向きが上向きであり、
    前記非直筆画が前記第3の筆画ノードの上部に位置するとき、前記文字の十字特徴の向きが下向きであることを特徴とする請求項15に記載の原稿方向の検出装置。
  17. 前記検出モジュールは、
    前記十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計する統計ユニットと、
    最も多い数に対応する十字特徴の向きを前記原稿方向に設定する設定ユニットと、
    を含むことを特徴とする請求項10乃至16のいずれか1項に記載の原稿方向の検出装置。
  18. 前記原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、前記原稿の十字特徴の向きが前記所定の向きになるまで、前記原稿を補正する補正モジュールを更に含むことを特徴とする請求項17に記載の原稿方向の検出装置。
JP2010101989A 2009-06-26 2010-04-27 原稿方向の検出方法及び装置 Expired - Fee Related JP5271956B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200910088352.6 2009-06-26
CN200910088352A CN101931731B (zh) 2009-06-26 2009-06-26 一种文稿方向的检测方法和装置

Publications (2)

Publication Number Publication Date
JP2011008770A true JP2011008770A (ja) 2011-01-13
JP5271956B2 JP5271956B2 (ja) 2013-08-21

Family

ID=43370640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010101989A Expired - Fee Related JP5271956B2 (ja) 2009-06-26 2010-04-27 原稿方向の検出方法及び装置

Country Status (2)

Country Link
JP (1) JP5271956B2 (ja)
CN (1) CN101931731B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577026A (zh) * 2013-11-15 2014-02-12 浪潮(北京)电子信息产业有限公司 一种检查单板上文字方向的方法
CN107798355A (zh) * 2017-11-17 2018-03-13 山西同方知网数字出版技术有限公司 一种基于文档图像版式自动分析与判断的方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509960B (zh) * 2018-04-20 2022-04-22 科大讯飞股份有限公司 一种文本朝向检测方法及装置
CN113673519B (zh) * 2021-08-24 2023-06-20 平安科技(深圳)有限公司 基于文字检测模型的文字识别方法及其相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JPH10224596A (ja) * 1997-02-07 1998-08-21 Minolta Co Ltd 画像入力装置
JP2001312697A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像方向判別方法及び装置
JP2009020884A (ja) * 2007-07-10 2009-01-29 Sharp Corp 画像データの特徴を特定する方法及びシステム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5191438A (en) * 1989-12-12 1993-03-02 Sharp Kabushiki Kaisha Facsimile device with skew correction and text line direction detection
JPH09222824A (ja) * 1996-02-19 1997-08-26 Toshiba Corp 画像処理装置
JP4350414B2 (ja) * 2003-04-30 2009-10-21 キヤノン株式会社 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP4232679B2 (ja) * 2004-04-15 2009-03-04 富士ゼロックス株式会社 画像形成装置およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JPH10224596A (ja) * 1997-02-07 1998-08-21 Minolta Co Ltd 画像入力装置
JP2001312697A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像方向判別方法及び装置
JP2009020884A (ja) * 2007-07-10 2009-01-29 Sharp Corp 画像データの特徴を特定する方法及びシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577026A (zh) * 2013-11-15 2014-02-12 浪潮(北京)电子信息产业有限公司 一种检查单板上文字方向的方法
CN107798355A (zh) * 2017-11-17 2018-03-13 山西同方知网数字出版技术有限公司 一种基于文档图像版式自动分析与判断的方法

Also Published As

Publication number Publication date
JP5271956B2 (ja) 2013-08-21
CN101931731B (zh) 2012-09-26
CN101931731A (zh) 2010-12-29

Similar Documents

Publication Publication Date Title
CN107093172B (zh) 文字检测方法及系统
US9135489B2 (en) System for decoding two dimensional code and method thereof
US8712188B2 (en) System and method for document orientation detection
KR101690981B1 (ko) 형태 인식 방법 및 디바이스
US8194983B2 (en) Method and system for preprocessing an image for optical character recognition
US20110305387A1 (en) Method and system for preprocessing an image for optical character recognition
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
WO2015007168A1 (en) Character recognition method and device
JP5271956B2 (ja) 原稿方向の検出方法及び装置
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
US8452095B2 (en) Image processing for post-processing rate of character rectangle extraction and character recognition accuracy
JP5847062B2 (ja) 画像処理装置
WO2021168703A1 (zh) 字符处理及字符识别方法、存储介质和终端设备
JP4392907B2 (ja) 文字切出し方法
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JPH09311905A (ja) 行検出方法および文字認識装置
JPS62267889A (ja) 文字読取方式
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
KR100603618B1 (ko) 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법
JP2590099B2 (ja) 文字読取方式
JP2019021085A (ja) 画像処理プログラム、画像処理方法及び画像処理装置
CN106951401B (zh) 一种文档正文识别方法及装置
US20220406083A1 (en) Image processing apparatus, control method thereof, and storage medium
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120321

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130513

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5271956

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees