JP2003529114A - 光学スキャナとそのためのソフトウエア - Google Patents

光学スキャナとそのためのソフトウエア

Info

Publication number
JP2003529114A
JP2003529114A JP2000592785A JP2000592785A JP2003529114A JP 2003529114 A JP2003529114 A JP 2003529114A JP 2000592785 A JP2000592785 A JP 2000592785A JP 2000592785 A JP2000592785 A JP 2000592785A JP 2003529114 A JP2003529114 A JP 2003529114A
Authority
JP
Japan
Prior art keywords
instantaneous
essentially vertical
instantaneous correction
text image
correction factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000592785A
Other languages
English (en)
Other versions
JP2003529114A5 (ja
Inventor
レゲブ,リユーベン
Original Assignee
トツプスキヤン・リミテツド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from IL12795899A external-priority patent/IL127958A0/xx
Application filed by トツプスキヤン・リミテツド filed Critical トツプスキヤン・リミテツド
Publication of JP2003529114A publication Critical patent/JP2003529114A/ja
Publication of JP2003529114A5 publication Critical patent/JP2003529114A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】 本発明は1次元光学センサをもち、スキャン速度決定のための機械的に可動な部品をもたない、表面をスキャンするためのスキャナを提供する。テキスト画像が瞬間スキャン速度の変動によりゆがみを生じた場合に、スキャナでテキストをスキャンして得られたテキスト画像を処理する方法も提供される。本方法は、テキスト中の各フォントについてのモード文字高さとフォント割合を利用し、テキスト画像の各個所における局部的な補正係数を求める。補正係数は当該個所での瞬間スキャン速度と関係しており、ゆがんだテキスト画像を修正するのに用いられる。

Description

【発明の詳細な説明】
【0001】 (発明の分野) 本発明はテキストスキャナとこれに用いるソフトウエアの分野に関わる。
【0002】 (発明の背景) 手でもって操作する小型光学スキャナ(hand−held scanner
)はテキストのスキャニング、バーコード読みとり、ピクチャーグラビング(p
icture grabbing)など広範囲な応用分野で使用されている。こ
れらスキャナは、中央処理ユニット(CPU)によって操作が行われメモリに記
憶される画像情報を獲得するための光学センサを具備する。情報は一般に文字認
識ソフトウエアによって処理された後、ワードプロセッサ、データベース、スプ
レッドシートな どのユーザーアプリケーションに送られる。
【0003】 ある瞬間における手持ちスキャナのビューイング領域(viewing ar
ea)は、スキャンされた媒体全体のごくわずかな部分を含むにすぎない。従っ
て使用に当たっては、得られた画像がそれぞれスキャンされた媒体の一部分に対
応するように、手持ちスキャナをスキャンされる媒体全体にわたって動かして画
像を生成することで、時系列の取得画像を作成する。画像は一定速度で得られる
ため、これに続いて取得時系列画像からスキャンされた媒体を再構築すると、ス
キャン操作中のスキャン速度の変動により画像にゆがみが生じる。手持ちスキャ
ナには、取得画像がオリジナルと同一になるような基準スキャン速度(refe
rence scanning speed)がある。基準スキャン速度は、光
学センサの幅(スキャン方向の)と、センサによる画像取得速度の積である。ス
キャンされた媒体から得られた画像うち、スキャン速度が基準速度より低い個所
では画像が引き延ばされたり広がって見える一方、基準速度より速い速度で得ら
れた部分では押しつぶれたように見える。こうした歪曲画像は文字認識ソフトウ
エア(character recognition software)で認
識できない場合がある。取得画像はそれぞれ、瞬間スキャン速度を基準速度で除
算した数値に等しい補正係数でスキャン方向にスケール修正(rescalin
g)処理を行わなければならない。従来技術によるスキャナはそのため瞬間スキ
ャン速度を連続してモニターするための手段を具備している。例えば米国特許5
,083,218では、スキャン中絶えず瞬間スキャン速度を測定するために、
スキャンされる媒体に沿って回転するホイールを具備する手持ちスキャナを開示
している。米国特許5,023,922では、一つの画像がセンサを横切るのに
要した時間間隔から瞬間速度を計算する2次元光学センサを備える手持ちスキャ
ナを開示している。ホイールあるいは2次元センサを設けると、手持ちスキャナ
がかさばり使いづらくなる。
【0004】 そのため、本技術分野では従来のスキャナの欠点を大幅に減らすあるいは克服
するスキャナが求められている。
【0005】 (用語の説明) 以下に、本書ならびに特許請求の範囲の記述で用いられる用語と定義を挙げる
が、一部は本技術分野で公知のものであり、いくつかは新たに作られたものであ
る。 「視野」(field of view) ある瞬間にスキャナがとらえたスキ
ャン対象媒体の一部 「スキャンされた画像」 スキャナをある表面上を移動させることで生じる2次
元画像。スキャンされた画像はスキャン中に得られた視野の時系列から編集され
る。 「テキスト画像」 言語テキストで構成されるスキャンされた画像 「クラスター」 テキスト画像中で黒色画素が互いに接触して連続する集まり(
contiguous group)。黒色クラスターは通常単一の文字である
が、単一文字の一部分であることもあり、あるいは2つまたはそれ以上の文字の
結合の場合もある。 「水平方向セグメント」 テキストラインに平行で一画素高さの、互いに接触す
る一連の黒色画素の線(line)。水平方向セグメントの長さはその黒色画素
の数である。 「スタック」 スキャンされた画像中の,少なくとも所定数の水平方向セグメン
トが接触するアレイで、以下の特性を持つ。 (a) 2つの水平方向セグメントが共線であることは決してない。 (b) スタック中の最長水平方向セグメント長さと、最短水平方向セグメント
長さの割合が所定の値を超えない (c) スタック中の隣接水平方向セグメントは、少なくとも部分的に重なり合
う(すなわち、スタック中のある一対の隣接水平方向セグメントでは、2つの水
平方向セグメントのそれぞれに同一視野から得られた黒色画素が少なくとも一つ
ある)。
【0006】 各スタックにはこれと関連して、例えばそのスタックを構成する水平方向セグ
メントの数として定義される高さを持つ。各スタックはまたこれと関連して、た
とえばそのスタックを構成する水平方向セグメントの平均長さ、そのスタックを
構成する水平方向セグメントの最小限の長さ、あるいはそのスタックを構成する
水平方向セグメントの任意の一つの長さとして定義される幅を持つ。本発明はこ
れら定義に拘束されるものではなく、本発明の範囲内で他の高さおよび幅の定義
も考えられる。各スタックはこれに関連して、2つの対向する辺が垂直で、2つ
の対向する辺が水平である、領域を限定するための(bounding)最小限
の大きさの長方形をもつ。 「基本的に垂直なスタック」 その高さが所定の高さを超えていて、スタックの
領域を限定する長方形の幅に対するスタック幅の割合が所定の値を超えるスタッ
ク。 「文字認識ソフトウエア」 テキスト画像をASCII文字の文字列に変換する
ためのソフトウエアパッケージ。たとえばオプティカル・キャラクター・レコグ
ニション(OCR)ソフトウエアなど。 「停止区間」 一連の連続する視野で、その数が所定の数を超え、そのすべてが
最初の視野とほぼ同一であるもの。2つの視野のうちの一つに、所定の長さを超
える長さをもつ連続画素の下部視野(subfield)であって、その画素の
すべてがもう一方の視野中の対応画素と異なるような下部視野が存在しない場合
、これら2つの視野はほぼ同一と見なす。 「フォント割合(ratio)」 特定フォントの文字のうち最も一般的で基本的に垂
直な線幅に対するモード文字高さ(最も一般的な文字高さ)の割合。フォント割
合はあるフォントの特徴的な定数(characteristic const
ant)である。かならずしもではないが、ほとんどのフォントでは、フォント
割合は一般的に6前後である。 「補正係数」 瞬間スキャン速度を基準速度で除算したもの。
【0007】
【発明の要旨】
下記説明および特許請求の範囲において、テキストラインの方向および手持ち
スキャナのスキャン方向を水平方向と任意に称する。これは本発明の説明を簡潔
にするためのものであって、その他の方向も本発明の範囲として考えられ、本発
明はこの任意の呼称に制約されるものではない。
【0008】 本発明の第1の側面では、幅が1画素、長さ(高さ)がn個の画素である画像
を作成する1次元(直線)光学センサを持ち、ホイールなどの機械的な可動部品
を持たないスキャナが提供される。一連の記号(a line of symb
ols)をスキャンするためにスキャナのセンサアレイをある表面の上を移動さ
せると、スキャナ内部の内蔵クロック(internal clock)によっ
て決定される一定速度でスキャンされた一連の画像が得られる。センサによって
得た画像情報は、コンピュータの処理ユニットで記憶し、処理することができる
【0009】 本発明の第2の側面では、手持ちスキャナによるスキャン中にテキスト画像の
瞬間補正係数を決定する方法が提供される。瞬間補正係数は瞬間スキャン速度を
スキャナの基準速度で除算したものであるため、本方法は瞬間スキャン速度を決
定する方法に等しい。本方法は機械的な可動部品を持たないスキャナに用いるこ
とができる。また本方法を用いて、スキャン速度の変動によるテキスト画像のゆ
がみを取り除いて、テキストを光学文字認識ソフトウエアで認識できるようにす
る、あるいはユーザが画像として読みとれるようにすることもできる。
【0010】 本発明方法は、スキャンされた画像において、ある特定個所における垂直方向
距離(すなわち、スキャン方向に垂直な距離)がこの個所における瞬間スキャン
速度に依存しないという観察が基になっている。特に、テキスト画像においては
、テキスト文字高さはスキャン速度に依存しない。テキスト画像におけるモード
文字高さは従って、テキスト画像取得中のスキャン速度の変動に左右されない。
下記に開示するように、基本的に垂直なスタックで構成されるテキスト画像にお
ける、ある個所での瞬間スキャン速度、すなわち瞬間補正係数は、基本的に垂直
なスタックの幅、スキャンされたテキストのモード文字高さ、ならびにフォント
割合から決定することができる。
【0011】 本発明はこのように、スキャン速度を決定するために1次元光学センサを持ち
、機械的な可動部品をもたないことを特徴とする、表面をスキャンするためのス
キャナを提供する。
【0012】 本発明はまた、テキストをスキャナでスキャンすることで得た取得テキスト画
像を処理するための方法を提供するもので、テキストは1つまたはそれ以上のフ
ォントをもち、フォントはそれぞれフォント割合をもち、テキスト中の各個所は
瞬間スキャン速度でスキャンされたものであり、テキスト画像は瞬間スキャン速
度における変動によって歪曲されており、方法 は下記のステップからなる: (a) 各フォントのモード文字高さを求め、 (b) 前記モード文字高さとフォント割合を使って補正係数を割り出して(c
onstruct)、ゆがんだテキスト画像を補正する。
【0013】 本発明はさらに、スキャナでテキストをスキャンすることで得た取得テキスト
画像を処理するための実行可能なコンピュータプログラムを記憶する記憶媒体を
提供するもので、テキストは1つまたはそれ以上のフォントをもち、テキストの
各個所は瞬間スキャン速度でスキャンされたものであり、テキスト画像は瞬間ス
キャン速度の変動により歪曲しており、処理は下記ステップからなる。 (a) 各フォントついてモード文字高さを求め、 (b) 前記モード文字高さとフォント割合を使って補正係数を割り出し、ゆが
んだテキスト画像を補正する。
【0014】
【好ましい実施例の詳細な説明】
本発明を理解し、実際にどのようにして実行されるかを理解するために、好ま
しい実施例を非制限的な例として、添付図面を参照しながら説明する。
【0015】 本発明の第1の側面では、1次元(直線)光学センサを持ち、ホイールなどの
機械的な可動部品を持たないスキャナが提供される。図1に示すように、全体を
1で示すスキャナは、1次元光学センサ2と手で掴むためのハンドル3をもち、
機械的な可動部品はない。センサ2を表面上で移動させると、一連のスキャンさ
れた画像が得られる。図2は、本発明による1次元スキャナとプロセッサを備え
るシステムのブロック図である。センサ2は一連の記号をスキャンするために用
いられる。センサは中央処理ユニット12の入力ポートにつながれる。入力機能
はCPU14によって行われる。センサ10によって得られた画像情報16はC
PUによってメモリ18に記憶される。本発明システムの構造は図2に描かれた
特定構造に限定されない。
【0016】 本発明の第2の側面によれば、手持ちスキャナによるスキャン中にテキスト画
像の瞬間補正係数を決定するための方法が提供される。本方法は、機械的な可動
部品をもたないセンサに用いることができ、1次元光学センサのみをもつスキャ
ナにも用いることができる。本発明方法は、センサ2で得たテキスト画像16中
のスキャン速度変動によるゆがみを取り除いて、文字認識ソフトウエアで、ある
いはユーザに認識可能なものにするために用いることができる。以下に詳細を説
明する本方法は、アプリオリにメモリー18に記憶された画像をリアルタイムま
たはオフラインで処理するアプリケーション20によって実行される。処理結果
は、CPUに戻される前あるいはインターフェース22に送られる前に、任意で
文字認識ソフトウエアによる処理にかけてもよい。
【0017】 図3を参照すると、8つのクラスターとして解像された7つの文字が示されて
いる。クラスター31,35および38はそれぞれ1つの文字全体(それぞれe
、c、およびe)を形成する。クラスター32は2つの文字の結合(ff)であ
る。クラスター33、34、36および37はそれぞれある文字(i)の一部を
含む。
【0018】 図4は、成分画素(composite pixels)に分割された2つの
クラスターを示す。図4aでは、水平線49は例えば、6(画素)の長さをもち
、水平線40は8の長さをもつ。スタック40は12の高さをもつ。水平線40
がスタック42に加えられると、その結果得られる成分構造(composit
e structure)中の最短水平方向セグメント長さ(5)に対する最長
水平方向セグメント長さ(8)の割合が、所定の代表的な値である1.3を超え
るため、この構造はスタックではなくなる。スタック42を構成する12の水平
線(45a、45bで示す)のうち2つは長さが5であり、残る10は長さが6
である。スタック42の幅(その水平線長さの平均)を計算すると5.83とな
る。図4bでは、スタック43は高さが6,幅が28であり、これはクラスター
幅に相当する。スタック43の長さは代表的な所定値である約8を超えていない
ため、基本的に垂直なスタックとは見なされない。スタック44は長さが5−6
の水平線セグメント13個で構成される。このスタックでは、最下段の水平線セ
グメント46と最上段の水平線セグメント47に重なりがない。スタック44は
また、その領域を限定する長方形48の幅(12)に対するスタック幅(6.3
)の割合が、代表的な所定値である約0.75を超えていないため、基本的に垂
直なスタックではない。図4のクラスタについて用いられた上述の所定値は一例
にすぎず、本発明はこれらの所定値に限定されない。
【0019】 図5aはスキャンしようとする一連のテキスト(line of text)
を示す。矢印56はモード文字高さを、矢印57は最も一般的な垂直線幅を示す
。フォントによっては、基本的に垂直な線は、真の垂直位置からわずかに傾斜し
ている。最も一般的な基本的に垂直な線の幅57に対するモード文字高さ56の
割合(フォント割合)は、フォントの特長を表す定数である。
【0020】 図5bに、図5aの一連のテキストを手持ちスキャナでスキャンして得た典型
的なテキスト画像を示す。スキャン速度の変動によりテキストがゆがんで見える
。文字幅はスキャン速度に反比例する。オリジナルテキスト(図5a)の文字5
0と51の幅と、テキストスキャンにおける画像(図5b)を比較することでわ
かるように、区間54における瞬間スキャン速度はスキャナの基準速度より早く
、区間55では瞬間スキャン速度は基準速度より遅い。垂直線幅、たとえば垂直
線59の幅もスキャン速度に反比例している。しかしモード文字高さ56はスキ
ャン速度の変動の影響を受けていず、図5a、図5bともに同じである。水平線
幅、例えば線58の幅も、スキャン速度の変動の影響を受けない。区間52は典
型的な停止セグメントである。
【0021】 図6は、図7に示すような取得テキスト画像における異なる個所での瞬間補正
係数を決定するための本発明の一実施例による方法を説明するフローチャートで
ある。図7に示すテキスト画像が得られたテキストのフォントのフォント割合は
、この例では、約6である。テキスト文字のモード高さが決定されるが(60)
、上述のようにこれはスキャン速度の変動に全く依存しない。図7に示す取得テ
キストのモード文字高さは、両方向矢印70で示すが、この例では26画素に相
当する。モード文字高さをフォント割合で除算したものに等しい基準幅が計算さ
れる(61)。図7のテキスト画像の場合、基準幅はこのように26/6すなわ
ち4.3画素と計算される。フォント割合は、フォントを構成する文字の最も一
般的で基本的に垂直な線幅に対するモード文字高さの割合と定義されていること
から、基準幅はスキャン速度が基準速度に等しいときの基本的に垂直なスタック
の予想幅(expected width)となる。そこでテキスト画像中の基
本的に垂直なスタックをすべて識別する(63)。数字71−91は図7におけ
る21の基本的に垂直なスタックのすべてを示す。基本的に垂直なスタックの幅
を決定する(64)。基本的に垂直なスタックで幅が基準幅より大きいものは、
瞬間スキャン速度がスキャナの基準速度を下回ったものである。基本的に垂直な
スタックで幅が基準幅より小さいものは、瞬間スキャン速度がスキャナの基準速
度を上回ったものである。そこで、瞬間スキャン速度がスキャナの基準速度を下
回った時に得られた基本的に垂直なスタックで構成される画像での補正係数を、
基準幅を基本的に垂直なスタックの幅で除算することで求める(65)。したが
って、例えば、その幅が基準幅より大きい幅を持つ基本的に垂直なスタック86
について言えば、補正係数は4.3/5.5すなわち0.8と計算される。瞬間
スキャン速度がスキャナの基準速度を上回った時に得られた基本的に垂直なスタ
ックで構成される画像における補正係数は1である。
【0022】 本発明は取得テキスト画像における停止セグメントでの補正係数の決定につい
ても規定する。停止セグメント102が図7に示されている。停止セグメント1
02では、視野のすべてが、セグメント中の最初の視野とほぼ同一で、これはテ
キスト画像中のスキャン速度が0に近い個所を示すものである。停止セグメント
102を所定の数の連続サブセグメントに分割する(66)。図7では、停止セ
グメント102は、4つのサブセグメントに分割されている。各サブセグメント
では、連続する視野のうち、すべてではないが少なくとも1つの視野を、サブセ
グメントから削除する(67)。たとえば、1つを除き視野のすべてを各サブセ
グメントから削除すると、停止セグメント102は図8のセグメント802とな
る。停止セグメントにおける補正係数は所定の値、例えば、0.1であり、これ
はこの停止セグメント における瞬間スキャン速度が非常に遅かったことを示す
【0023】 図6に戻ると、基本的に垂直なスタックを含まず、上述の処理が行われた停止
セグメントを含まない個所での補正係数は、下記の方法のいずれか一つによって
決定される(68)。(i)当該個所の異なる辺に接触している2つの基本的に
垂直なスタックを探す。2つの基本的に垂直なスタック間にある個所での補正係
数は、2つの接触する基本的に垂直なスタックでの補正係数を内挿する(int
erpolation)ことで決定される。(ii)当該個所の異なる辺に接触
している2つの停止セグメントを探す。2つの停止セグメント間にある個所での
補正係数は、2つの接触する停止セグメントでの補正係数を内挿することで決定
される。(iii)当該個所の異なる辺に接触している停止セグメントと基本的
に垂直なスタックを探す。停止セグメントと基本的に垂直なスタック間にある個
所での補正係数は、停止セグメントと基本的に垂直なスタックでの各補正係数を
内挿することで決定される。
【0024】 テキストのスキャン中の補正係数がいったん決定されれば、スキャン速度の変
動によって生じるテキスト画像のゆがみが修正される(69)。これは、補正係
数が1以下の個所それぞれにおける視野を削除して、補正係数に等しいスケール
修正を行うことで達成されるが、これ自体は公知である。基本的に垂直なスタッ
クをこのようしてに修正すると、このスタックがスキャンされた画像の中で描く
テキスト画像中のの基本的に垂直な線に相似するようになる。図8は図7に示す
取得テキスト画像の補正後を示す。
【0025】 本発明をある程度詳細に説明してきたが、本技術分野に精通するものにとって
は、本方法が本発明の範囲から逸脱することなく変更可能であることは一目瞭然
であろう。特に、本方法を実行するステップの順序は、特許請求の範囲で規定す
る本発明の範囲を逸脱することなく変更可能である。
【図面の簡単な説明】
【図1】 本発明による手持ちスキャナを示す。
【図2】 本発明に基づき実行される処理を示すブロック図。
【図3】 8つのクラスターに解像された7つの文字を示す。
【図4a、4b】 水平方向セグメントに分解されたクラスターを示す。
【図5a】 スキャン対象である一連のテキストを示す。
【図5b】 図5aの一連のテキストを手持ちスキャナでスキャンすることで得たテキスト
画像を示す。
【図6】 本発明に基づき瞬間スキャン速度を決定するためのフローチャート。
【図7a−c】 取得テキスト画像の部分を示す。
【図8】 図7の取得テキスト画像に本発明に基づく補正を行った後を示す。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MA ,MD,MG,MK,MN,MW,MX,NO,NZ, PL,PT,RO,RU,SD,SE,SG,SI,S K,SL,TJ,TM,TR,TT,TZ,UA,UG ,US,UZ,VN,YU,ZA,ZW

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 1次元光学センサをもち、スキャン速度決定のための機械的
    に可動な部品をもたないことを特徴とする、表面をスキャンするためのスキャナ
  2. 【請求項2】 スキャナでテキストをスキャンすることで得た取得テキスト
    画像を処理する方法であって、テキストは1つまたはそれ以上のフォントをもち
    、各フォントはフォント割合をもち、テキスト中の各個所は瞬間スキャン速度で
    スキャンされており、テキスト画像は瞬間スキャン速度の変動により歪曲してお
    り、 (a) 各フォントについてモード文字高さを求め、 (b) 前記モード文字高さとフォント割合を用いて補正係数を割り出し、ゆが
    んだテキスト画像を補正することを含む方法。
  3. 【請求項3】 取得テキスト画像中の1つまたはそれ以上の基本的に垂直な
    スタックでの瞬間補正係数を決定するための請求項2による方法であって、基本
    的に垂直なスタックは幅を持ち、前記ステップ(b)がさらに、取得テキスト画
    像中の1つまたはそれ以上の基本的に垂直なスタックの幅を利用することを含む
    方法。
  4. 【請求項4】 以下のステップを含む請求項3による方法: (a) スキャン済みテキストのモード文字高さを決定し、 (b) モード文字高さをフォント割合で除算することで、基本線幅を計算し、 (c) 1つまたはそれ以上の基本的に垂直なスタックの高さと幅を決定し、 (d) 基本幅を基本的に垂直なスタックの幅で除算することで、1つまたはそ
    れ以上の基本的に垂直なスタックのいずれか一つについて瞬間補正係数を計算し
    て、基本的に垂直なスタックでの瞬間補正係数を求め、 (e) ステップ(d)に基づき計算された補正係数が1より大きい場合は補正
    係数を1に等しく設定すること。
  5. 【請求項5】 以下のステップをさらに含む、請求項4による方法: (a) 1つまたはそれ以上の停止セグメントを所定の数の連続視野のサブセグ
    メントに区分し、 (b) 各サブセグメントから、サブセグメントの視野のうちすべてではないが
    、少なくとも1つの視野を削除すること。
  6. 【請求項6】 1つまたはそれ以上の停止セグメントにおける瞬間補正係数
    を計算するステップをさらに含む請求項5による方法であって、停止セグメント
    における瞬間補正係数が所定の値である方法。
  7. 【請求項7】 基本的に垂直なスタックを含まず、請求項6による方法に基
    づき補正された停止セグメントを含まない取得テキスト画像におけるある個所で
    の瞬間補正係数を計算する方法であって、以下のステップのいずれかを含む方法
    : (a) 当該個所の異なる辺上に接触している(flanking the l
    ocation on different sides)基本的に垂直なスタ
    ックを識別し、2つの基本的に垂直なスタックのそれぞれについて請求項3また
    は4による方法で瞬間補正係数を計算し、瞬間補正係数を内挿することで、基本
    的に垂直なスタックの前記各個所での瞬間補正係数を計算し、 (b) 2つの停止セグメントのそれぞれにおいて当該個所の異なる辺上に接触
    しているサブセグメントを識別し、請求項6による方法で、2つのサブセグメン
    トのそれぞれ1つでの瞬間補正係数を計算し、サブセグメントの瞬間補正係数を
    内挿することで前記個所での瞬間補正係数を計算し、または (c) 当該個所の異なる辺上に接触している基本的に垂直なスタックと停止セ
    グメントのサブセグメントを識別し、請求項3または4による方法で基本的に垂
    直なスタックでの瞬間補正係数を計算し、サブセグメントでの瞬間補正係数を請
    求項6による方法で計算し、基本的に垂直なスタックと停止セグメントの瞬間補
    正係数を内挿することで、前記個所での瞬間補正係数を計算すること。
  8. 【請求項8】 以下のステップを含む、テキストのスキャン中にスキャン速
    度の変動により取得テキスト画像の1つまたはそれ以上の個所に生じたゆがみを
    除去する方法: (a) 請求項2乃至7のいずれかによる方法で、テキスト画像中の1つまたは
    それ以上の個所での瞬間補正係数を計算し、 (b) 補正係数が1以下である1つまたはそれ以上の個所での視野を削除する
    ことで、各個所での瞬間補正係数にほぼ等しい係数で各個所での取得テキスト画
    像のスケール修正を行うこと(to produce rescaling)。
  9. 【請求項9】 テキスト画像を文字認識ソフトウエアで処理するステップを
    さらに含む請求項8による方法。
  10. 【請求項10】 記憶媒体に結合され、請求項2乃至9のいずれかに基づく
    方法を実行するためのソフトウエアを実行するCPUをさらに含む請求項1によ
    るスキャナ。
  11. 【請求項11】 スキャナでスキャンすることで得られた取得テキスト画像
    を処理するための実行可能なコンピュータプログラムを記憶する記憶媒体であっ
    て、テキストは1つまたはそれ以上のフォントをもち、各フォントはフォント割
    合をもち、テキスト中の各個所は瞬間スキャン速度でスキャンされたものであり
    、テキスト画像は瞬間スキャン速度の変動により歪曲しており、処理は以下のス
    テップを含む記憶媒体: (a) 各フォントについてモード文字高さを求め、 (b) 前記モード文字高さをとフォント割合を用いて、歪曲テキスト画像を修
    正するための補正係数を割り出すこと。
  12. 【請求項12】 取得テキスト画像における1つまたはそれ以上の基本的に
    垂直なスタックでの瞬間補正係数を決定するための実行可能なコンピュータプロ
    グラムを記憶する請求項11による記憶媒体であって、基本的に垂直なスタック
    は幅を持ち、前記ステップ(b)がさらに取得テキスト画像中の1つまたはそれ
    以上の基本的に垂直なスタックの幅を利用することを含む、記憶媒体。
  13. 【請求項13】 処理が以下のステップを含む、請求項12に基づく記憶媒
    体: (a) スキャンされたテキストのモード文字高さを決定し、 (b) モード文字高さをフォント割合で除算することで基本線幅を計算し、 (c) 1つまたはそれ以上の基本的に垂直なスタックの高さと幅を決定し、 (d) 基準幅を基本的に垂直なスタックの幅で除算することで1つまたはそれ
    以上の基本的に垂直なスタックのについての瞬間補正係数を計算して、基本的に
    垂直なスタックでの瞬間補正係数を求めること。
  14. 【請求項14】 処理がさらに以下のステップを含む、請求項13による記
    憶媒体: (a) 1つまたはそれ以上の停止セグメントを所定の数の連続視野のサブセグ
    メントに区分し、 (b) 各サブセグメントの視野のうちすべてではないが少なくとも1つをサブ
    セグメントからを削除すること。
  15. 【請求項15】 処理がさらに、1つまたはそれ以上の停止セグメントにお
    ける瞬間補正係数を計算することを含む請求項14による記憶媒体であって、停
    止セグメントについての瞬間補正係数が所定の値である記憶媒体。
  16. 【請求項16】 処理がさらに、基本的に垂直なスタックを含まず、請求項
    6による方法に基づき補正された停止セグメントを含まない取得テキスト画像に
    おけるある個所での瞬間補正係数を計算することを含む請求項15による記憶媒
    体であって、処理が以下のいずれかを含む記憶媒体; (a) 当該個所の異なる辺上に接触している基本的に垂直なスタックを識別し
    、請求項3または4による方法で2つの基本的に垂直なスタックのそれぞれでの
    瞬間補正係数を計算し、基本的に垂直なスタックの瞬間補正係数を内挿すること
    で、前記個所での瞬間補正係数を計算し、 (b) 当該個所の異なる辺上に接触している2つの停止セグメントのそれぞれ
    におけるサブセグメントを識別し、請求項6による方法により2つのサブセグメ
    ントのそれぞれでの瞬間補正係数を計算し、サブセグメントの瞬間補正係数を内
    挿することで、前記個所での瞬間補正係数を計算し、または (c) 当該個所の異なる辺上に接触している基本的に垂直なスタックと停止セ
    グメントのサブセグメントを識別し、請求項3または4の方法により基本的に垂
    直なスタックでの瞬間補正係数を計算し、請求項6の方法によりサブセグメント
    での瞬間補正係数を計算し、基本的に垂直なスタックと停止セグメントの瞬間補
    正係数を内挿することで、前記個所での瞬間補正係数を計算すること。
  17. 【請求項17】 テキストのスキャン中にスキャン速度の変動により生じた
    取得テキスト画像における1つまたはそれ以上の個所での歪曲を除去するために
    取得テキスト画像を処理するための実行可能なコンピュータプログラムを記憶す
    る記憶媒体であって、処理が以下のステップを含む記憶媒体; (a) 請求項2乃至7の方法のいずれかによりテキスト画像における1つまた
    はそれ以上の個所での瞬間補正係数を計算し、 (b) 補正係数が1より小さい1つまたはそれ以上の個所のそれぞれにおける
    視野を削除して、各個所での取得テキスト画像のスケール修正を各個所での瞬間
    補正係数にほぼ等しい係数により行うこと。
  18. 【請求項18】 テキスト画像を文字認識ソフトウエアにより処理するため
    の、請求項17による記憶媒体。
JP2000592785A 1999-01-07 2000-01-06 光学スキャナとそのためのソフトウエア Pending JP2003529114A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
IL12795899A IL127958A0 (en) 1999-01-07 1999-01-07 Optical scanner and software therefor
IL127958 1999-01-07
IL132719A IL132719A (en) 1999-01-07 1999-11-03 Optical scanner and software therefor
IL132719 1999-11-03
PCT/IL2000/000010 WO2000041128A1 (en) 1999-01-07 2000-01-06 Optical scanner and software therefor

Publications (2)

Publication Number Publication Date
JP2003529114A true JP2003529114A (ja) 2003-09-30
JP2003529114A5 JP2003529114A5 (ja) 2007-02-22

Family

ID=26323772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000592785A Pending JP2003529114A (ja) 1999-01-07 2000-01-06 光学スキャナとそのためのソフトウエア

Country Status (9)

Country Link
US (1) US6965703B1 (ja)
EP (1) EP1141882B1 (ja)
JP (1) JP2003529114A (ja)
CN (1) CN1169086C (ja)
AT (1) ATE227035T1 (ja)
AU (1) AU1888300A (ja)
DE (1) DE60000678T2 (ja)
IL (1) IL132719A (ja)
WO (1) WO2000041128A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
DE102008042080A1 (de) 2008-09-15 2010-03-25 Bundesdruckerei Gmbh Verfahren zur automatischen optischen Zeichenerfassung, Computerprogrammprodukt, Datenverarbeitungssystem und Scanner
KR100992858B1 (ko) * 2008-12-30 2010-11-09 엔에이치엔(주) Ocr 결과를 보정하기 위한 방법, 시스템 및 컴퓨터 판독가능한 기록 매체
WO2010105246A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Accessing resources based on capturing information from a rendered document
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US9679179B2 (en) 2015-08-31 2017-06-13 I.R.I.S. Method for processing information from a hand-held scanning device
US9692929B2 (en) 2015-08-31 2017-06-27 I.R.I.S. Method and system for correction of an image from a hand-held scanning device
CN106961534A (zh) * 2016-01-11 2017-07-18 深圳市安普盛科技有限公司 一种具有扫描功能的移动通信终端及其扫描方法
JP6406287B2 (ja) * 2016-03-04 2018-10-17 京セラドキュメントソリューションズ株式会社 画像形成装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5023922A (en) 1985-06-07 1991-06-11 Soricon Corporation Optical character reader
EP0279655A3 (en) 1987-02-17 1990-12-05 Soricon Corporation Data acquisition control method and system for a hand held reader
US5083218A (en) 1989-02-08 1992-01-21 Casio Computer Co., Ltd. Hand-held image reading apparatus
JP3320759B2 (ja) * 1991-12-26 2002-09-03 株式会社東芝 文書画像傾き検出装置およびその方法
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6256408B1 (en) 1994-04-28 2001-07-03 International Business Machines Corporation Speed and recognition enhancement for OCR using normalized height/width position
US5638466A (en) * 1995-08-30 1997-06-10 Horizon Marketing Corporation Aka Wordwand Method and apparatus for deskewing images of symbols having a non-linear baseline
US6036094A (en) * 1997-06-13 2000-03-14 Symbol Technologies, Inc. Hand-held optical scanner for reading two-dimensional bar code symbols and the like
JP2002516052A (ja) * 1997-07-23 2002-05-28 クセロス・インク 改良されたハンドヘルド文書スキャナ
US5999666A (en) * 1997-09-09 1999-12-07 Gobeli; Garth W. Device and method for optical scanning of text

Also Published As

Publication number Publication date
US6965703B1 (en) 2005-11-15
IL132719A (en) 2010-04-29
CN1340176A (zh) 2002-03-13
DE60000678D1 (de) 2002-12-05
IL132719A0 (en) 2001-03-19
WO2000041128A1 (en) 2000-07-13
DE60000678T2 (de) 2003-06-12
EP1141882B1 (en) 2002-10-30
AU1888300A (en) 2000-07-24
CN1169086C (zh) 2004-09-29
ATE227035T1 (de) 2002-11-15
EP1141882A1 (en) 2001-10-10

Similar Documents

Publication Publication Date Title
JP2003529114A (ja) 光学スキャナとそのためのソフトウエア
EP0543593B1 (en) Method for determining boundaries of words in text
JP2940960B2 (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
JP3338537B2 (ja) 画像傾き検出装置
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
JP3576570B2 (ja) 比較方法
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
EP1276074A2 (en) Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
JP2608571B2 (ja) 入力走査画像データのベクトル化のための装置及び方法
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP2761467B2 (ja) 画像切り出し装置及び文字認識装置
US5923782A (en) System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings
JP4323606B2 (ja) 文書画像傾き検出装置
CN111027545A (zh) 卡证图片标志检测方法、装置、计算机设备及存储介质
Chhabra et al. Detection of horizontal lines in noisy run length encoded images: The FAST method
JP2002099911A (ja) ラスタ像のベクトル化のコンピュータ自動化による方法
JP3303246B2 (ja) 画像処理装置
US7734099B2 (en) Method and system for generating polygonal boundary definitions for image objects
WO2000049569A1 (fr) Procede servant a extraire les caracteristiques d'une image binaire
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP2977259B2 (ja) スキュー検出方法
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JP2587812B2 (ja) 図形抽出方法
JP4024960B2 (ja) 画像照合装置および画像照合方法
JPH02278104A (ja) 文書画像の傾き角検出方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070105

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20081003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090810

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090817

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100202