JP4019063B2 - 光学端末装置、画像処理方法およびシステム - Google Patents

光学端末装置、画像処理方法およびシステム Download PDF

Info

Publication number
JP4019063B2
JP4019063B2 JP2004118906A JP2004118906A JP4019063B2 JP 4019063 B2 JP4019063 B2 JP 4019063B2 JP 2004118906 A JP2004118906 A JP 2004118906A JP 2004118906 A JP2004118906 A JP 2004118906A JP 4019063 B2 JP4019063 B2 JP 4019063B2
Authority
JP
Japan
Prior art keywords
image
area
document
image information
scanner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004118906A
Other languages
English (en)
Other versions
JP2004334861A (ja
JP2004334861A5 (ja
Inventor
光雄 中山
Original Assignee
光雄 中山
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 光雄 中山 filed Critical 光雄 中山
Priority to JP2004118906A priority Critical patent/JP4019063B2/ja
Priority to US10/824,906 priority patent/US7477783B2/en
Publication of JP2004334861A publication Critical patent/JP2004334861A/ja
Publication of JP2004334861A5 publication Critical patent/JP2004334861A5/ja
Application granted granted Critical
Publication of JP4019063B2 publication Critical patent/JP4019063B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments

Description

本発明はイメージスキャナ等の画像入力手段を持つ端末および携帯端末、またこれを用いた光学的文字認識装置およびそのシステムに関するものである。
より具体的には、書類上の任意の領域の文字またはコードを端末あるいは携帯端末によって光学的イメージとしてぶれなく確実に取込みを行い、その取込んだイメージに対して文字認識を行ってコンピュータのアプリケーションソフトに文字コードデータとしてデータ入力する、あるいは遠隔地にある装置で文字認識を行ってデータを装置の所望の制御部に入力する、またそのデータを利用することを可能とした光学的文字認識装置および画像処理方法およびシステムに関する。
従来のパーソナルコンピュータとフラット・ベッドあるいはシート・フィード・スキャナ(以下スキャナと称す)とを用いた印刷書類(以下、単に書類と称す)の文字認識装置では、印刷文字の認識作業において以下のような操作を必要とする。
(操作1)・・・書類スキャン 先ず、スキャナへ書類をセットし、書類全体をスキャンする。
(操作2)・・・文字認識スキャナから送られてきた書類全体のイメージは、パーソナルコンピュータのディスプレイ上に展開され、文字認識ソフトで表示される。文字認識ソフト上で“文字認識させたい範囲”(以下、“意図する領域”と称す)をマウスで指定してから、文字認識ソフトを操作して、“意図する領域”のイメージデータをテキストデータ(文字コードデータ)に変換し、再度ディスプレイ上に表示する。
(操作3)・・・修正 文字認識ソフトの認識結果は、文字認識ソフトに表示された書類のイメージと認識結果であるテキストデータとを突き合わせて、キーボードを用いて修正をする。
(操作4)・・・アプリケーションへのコピーまたはペーストを行い、次に、この修正されたテキストデータを、マウスを用いてコピーし、ワープロや表計算機能をもつアプリケーションソフトにペーストする。
(反復操作)・・・認識させたい書類が複数ある場合は、前記操作1から操作4を繰り返す。書類内に“意図する領域”が複数箇所ある場合は、操作2から操作4までを繰り返す。
フラット・ベッドあるいはシート・フィード・スキャナではガイドレールがありスキャン時のぶれが原因でイメージ画像に歪が生ずるといった不具合が発生しないような対策が取られている。
フラット・ベッドあるいはシート・フィード・スキャナ以外には、必要な部分のイメージだけを取込み文字認識するハンディタイプのスキャナがある。このようなハンディスキャナではスキャン部の受光部面積が文字認識を実施したい領域の大きさとが異なるため、一度に全部をスキャンできない場合が多く、スキャナ自体を横方向の決められた方向に数回動かして“意図する領域゛全体の取込みを行う必要がある。さらに、アジア言語にみられる縦書き文字の場合は、縦方向スキャンを行うために、ユーザは走行方向に制限のあるハンディスキャナ自体を持ち替える必要があった。また、ハンディスキャナには、手ぶれによりイメージに歪が生じ、イメージがうまく修得されず文字認識率が低下するという問題点があった。
特許文献1には書類上の“意図する領域”をイメージスキャナでスキャンすることにより得られたイメージデータを、パーソナルコンピュータ内の文字認識ソフトによりテキストデータに変換し、アプリケーションソフトに直接入力すること、また、“意図する領域”の入力開始位置の指定と確認はイメージスキャナの手元のLCDにより行うことを可能にするハンディスキャナおよびこれを用いた光学的文字認識装置が開示されている。ここでは手ぶれ対策また画像をつなぐ手法については述べられていない。
また、蛇行防止のためにガイドローラを用いているハンディスキャナがある。このような機械的に対策したものでは手ぶれ対策は完全でなく問題が残ることに加え、ガイドローラの強度的な問題があり、また使用中に壊れるといった信頼性上の問題がある。
また特許文献2にはハンディタイプの文字認識装置が開示されているが、専用の紙を用いることで歪の補正を行い手ぶれを解決している。この場合、その特殊専用紙にプリントされたもののみが対象であり一般の印刷書類は取り扱えない。
また、特許文献3には、移動量を検出して図形の歪を修正する発光素子と受光素子の対を図形取得用のラインセンサーとは別に複数設け、回転角の補正を行う技術が開示されている。この場合には部品点数が多いので高価になるとともに、機械的に設置するので初期設定等の調整が必要となる。
また特許文献4には隣り合った画像をパターンマッチングする方法が開示されているが、左右に位置する画像に対するものである。このため7−20ポイントの文字しかスキャンできず上下左右にまたがる大きな文字あるいはまとまった文章ブロックに対応するような大きなイメージは処理することができなかった。
国際公開WO00/26851 国際公開WO00/73981 特開平9−282084 USP6,563,951
ハンディスキャナの場合、一般書類上の“意図する領域”をスキャンする際に、いわゆる手ぶれが原因で取込んだイメージ画像の歪み文字認識がうまく行かないという問題が発生する。また、通常の書類に存在する文字のない白地部分を処理し完全なイメージ画像の取り込みをどのようして実現するかという問題がある。これらの問題に対して、特殊な専用紙を必要とせず、機械的強度、また構造に起因する信頼性上の問題がなく、また複数の部品を配置して使用する場合に必要となる調整作業を不要とし、手ぶれの問題を解決して完全なイメージ画像の取り込みを確実に実施する安価な光学端末装置を提供することを課題とする。
本発明では、所望の領域をスキャンする際のいわゆる手ぶれによる画像の歪みを解消し、白地の部分を含め書類のイメージデータを忠実に取込むことによって、文字認識を確実に実行できるようにするとともに、取込んだイメージデータに対する文字認識を端末あるいは携帯端末以外の装置において実行し、その認識結果を光学端末装置が接続されているパーソナルコンピュータあるいは遠隔地にある装置にインストールされているアプリケーションソフトの所望の部分にあるいは装置の所望の制御部に入力することを可能とした光学端末装置および画像処理方法およびシステムを提供することを目的とする。
そこで、上記課題を解決するため、本発明によるフリーハンド・スキャナは、書類上の文字情報の中から文字認識を行う領域を任意に指定できるように前記書類上を移動可能であり、書類上の文字情報を光学的にスキャニングし高速電子シャッタによって複数の静止イメージを連続して取込むイメージセンサと、スキャン中に取込んだ複数の静止イメージとその各々の位置座標を計算する画像処理回路と、前記イメージセンサによりスキャニングした静止イメージ情報を外部に出力する出力部と、外部に出力されたイメージ技術の文字認識結果を入力する入力部とを有し、画像処理部はスキャン中に取込んだ複数のイメージとその各々のイメージの中から選ばれた小イメージ(小静止画)から位置座標情報を計算しこの情報に基づいて全体のイメージ画像(大静止画)を再現することを特徴としている。
本発明の光学的文字認識装置およびシステムによれば、所望の領域をスキャンする際のいわゆる手ぶれによる画像の歪みを解消し、忠実にイメージデータを再現することによって、文字認識を確実に実行できるようにするとともに、取込んだイメージデータに対する文字認識を端末あるいは携帯端末以外の装置において実行し、その認識結果をパーソナルコンピュータあるいは遠隔地にある装置にインストールされているアプリケーションソフトの所望の部分にあるいは装置の所望の制御部に入力することができる。
本発明の利点を以下に列挙する。
1.本発明の手ぶれ防止機能を持つフリーハンド・スキャナによれば、ひとつのイメージセンサで位置座標処理用の小イメージ部を設定して位置座標検知可能な感度にて電子的にデータの処理を行い、また同時にイメージ画像の取得を行うので、特殊な専用紙を必要とせず、また機械的な強度また機械的な構造に起因する信頼性の問題がなく、あるいは配置に起因する調整作業を不要とし、書類上をスキャンする際のいわゆる手ぶれによる画像の歪みを解消し、歪のないイメージ画像の取り込みを確実に実施することができる安価な光学端末装置を提供できる。
2.本発明の手ぶれ防止機能を持つフリーハンド・スキャナによれば、スキャン画像は手ぶれが無く、かつ文字認識に適した解像度で取込まれた静止画で構成されており、また各静止画の位置アドレスは常に計算されているため、スキャンして取込まれた各静止画の高速つなぎ合わせが可能となり、容易に元のイメージデータが再現できる。また横方向スキャンに加えて、左右上下の全方位スキャンが可能である。従って使用者は手元で筆でなぞるのと同じように、上下左右にまた書類上で必要個所のみスキャンし、上下左右にまたがる大きな文字あるいはまとまった文章ブロックに対応するような大きなイメージ、また縦書き横書きの方向に関係なく容易かつ確実に必要なイメージを取り込みその文字認識を実行できる。特に、関心のある個所がとびとびの場合でも、目的の個所だけの文字認識が行える。
3.文字認識を行うソフトウェアをアプリケーションソフトウェアの背後で動作させることで、認識した文字の文字コードデータをこのアプリケーションソフトウェアに直接データ入力することができる。したがって、本発明を用いれば、書類を見ながらキーボード等で文字データの入力を行うのと同じ感覚で、書類内の所望の文字やコードを文字データ化することができるので、使用者の文字入力の作業を大幅に軽減することが可能となる。
4.取込んだイメージデータに対する文字認識を端末あるいは携帯端末以外の装置において実行し、その認識結果をパーソナルコンピュータあるいは遠隔地にある装置にインストールされているアプリケーションソフトの所望の部分にあるいは装置の所望の制御部に入力することを可能とした光学的文字認識装置およびシステムが提供できる。
以下、添付図面を参照しながら、本発明の実施形態について説明する。図1は、本発明による光学的文字認識装置の実施の画像処理の流れ図である。図2は、光学的文字認識装置のシステム構成図である。図3は、イメージセンサ部の撮影方法を説明するための図である。図4は、イメージセンサ部の撮影タイミング図である。図5は、本イメージセンサを用いたマウススキャナのシステム構成図である。図6は、マウススキャナの構造図である。図7は、マウススキャナを組み込んだ携帯電話の構造図である。図8は、スキャナカメラ付携帯電話が役立つ各種インターネットサービスを説明するための図である。
なお、本実施の形態の説明中の用語「書類」は、本、雑誌、新聞またはパンフレット、名刺等の文字や文章が記述された印刷原稿を意味する。また、用語「文字認識」は、「かな」、「片仮名」、「漢字」、「英数字」等の一般的な文字の認識を意味するだけではなく、例えばバーコード等のような符号であっても、コンピュータで認識してキャラクタデータに変換可能なイメージデータであれば範疇に含むものとする。
(1)本発明の実施の形態である画像処理フロー
図1を参照しながら、本発明の実施の形態であるフリーハンド・スキャナによるスキャニングの際のイメージデータ処理を説明する。まず、本フリーハンド・スキャナによって、書類上の情報のスキャンを開始する(S101)。2次元のイメージセンサと高速電子シャッタによって複数の静止イメージがメモリに取得され(S103)、また取込んだ複数のイメージに対して2次元のイメージセンサのキャプチャー領域のうちあらかじめ決められた2ヶ所の位置座標計算用の小領域のイメージデータがメモリに取込まれ画像処理手段に送られる。
画像処理手段では位置座標計算用の小領域のイメージデータを基に各々のイメージの位置座標が計算処理され、各イメージは一時保存される(S105)。各イメージは、一定量貯まると、位置座標データとともに、スキャンが終了するまで出力部からパーソナルコンピュータへ送信される(S107〜109)。各静止イメージデータは、その位置座標データに基づいて、画像の相対的な位置決め並びに画像の回転の補正を行い、且つ重なり合っている部分を除きながらつなぎ合わせて全体のイメージデータが形成される(S111)。このように座標データを用いることによって上下左右の関係が保たれた元のイメージを忠実に再現することができ、いわゆる手ぶれが防止でき完全なイメージデータが取得できる。
その後、画像のみ利用の場合は、ユーザ利用の任意のアプリケーション上のカーソル位置へ選択した画像データを自動的に(または直接)入力し(S119)、作業終了となる(S121)。
文字を利用する場合は、認識ソフトによる全体静止画像データの文字データへの自動変換を行い(S113)、認識した文字データを一時的に保管する(S115)。つづいて、認識結果(文字情報)の手元表示と関心のある文字の選択確定を行い(S117)、ユーザ利用の任意のアプリケーション上のカーソル位置へ選択した文字データを自動的に(または直接)入力し(S119)、作業終了となる(S121)。
(2)本発明の実施の形態であるフリーハンド・スキャナのハードウェア構成
図2を参照しながら、本発明の実施の形態であるフリーハンド・スキャナ(イメージスキャナ)200のハードウェア構成を説明する。
イメージスキャナ200は、書類上の文字情報を光学的にスキャニングして静止イメージ情報として取り込むためのストロボ発光用LED202、位置座標計算用の小領域を取り込む際に紙面に平行な光を照射する発光用LED201、およびイメージセンサ203、ストロボライト発生器205、A/Dコンバータ207、USBコントローラ209、画像位置計算部211、LCD表示部213、USBインタフェース215、メモリ(デジタル画像データ記憶部)217とを具備している。
USBインタフェース215は、イメージセンサ203によりスキャニングしたイメージ情報をパーソナルコンピュータ220に出力する出力部と、この出力部によりパーソナルコンピュータ220に出力されたイメージ情報の文字認識結果をパーソナルコンピュータ220から再入力する入力部とを有している。
LCD表示部213は該入力部で入力した文字認識結果を表示し、イメージスキャナ200はLCD表示部213で表示した文字認識結果の確定の有無を行う操作部(図示せず)を有する。
イメージスキャナ200は、書類上の文字情報の中から文字認識を行う領域を任意に指定できるように書類上を移動可能である。また、指定した領域の文字認識結果をLCD表示部に表示することによりスキャニングした書類上の文字情報の変換結果を手元で確認できるとともに、図示しない操作部により、変換結果の確定が行われるとその旨をパーソナルコンピュータ(パソコン220)に通知する。
パーソナルコンピュータ220は、少なくとも1つのアプリケーションソフトウェア223と、イメージスキャナ200の出力部より出力されたイメージ情報の文字認識を行う文字認識ソフトウェア231とが搭載されている。そして、イメージセンサ200によりスキャニングしたイメージ情報が入力されると、文字認識ソフトウェア231によって実行された文字認識結果をイメージスキャナ200に送信する。
イメージスキャナ200より変換結果の確定の通知を入力すると、アプリケーション・ソフトウェア上のポインティングデバイスのカーソルで指定された位置に確定された文字データが入力される。
(3)本発明の実施の形態であるデータ入力方法
本発明によるデータ入力方法、すなわちパーソナルコンピュータで動作するワープロソフトや表計算ソフトまたはデータベースソフト等のアプリケーションソフトにおけるデータ入力方法の処理シーケンスを以下に説明する。
書類上の文字情報の中から文字認識を行う領域を任意に指定できるように書類上を移動可能なイメージスキャナ200によりスキャニングすると、スキャニングしたイメージデータがパーソナルコンピュータ220に送信される。
パーソナルコンピュータ220がこのイメージデータを受信すると、データ入力を行うアプリケーションソフト223の背後で動作している文字認識ソフト231により、イメージデータの文字認識を行って該当する文字コードデータをイメージスキャナ200に送信する。イメージスキャナ200が文字コードデータを受信すると、この文字をLCD表示部213に表示し、この表示された文字コードデータの確定操作が行われると、パーソナルコンピュータ220に文字コードデータの確定を通知する。
パーソナルコンピュータ220が文字コードデータの確定の通知を受信すると、アプリケーションソフト223にこの文字コードデータが入力される。
(4)本発明の実施の形態の撮影方法
図3を参照しながら、本発明の実施の形態である図2のイメージスキャナ200のイメージセンサ部203の撮影方法について説明する。ここでは、このイメージセンサ203は、毎秒30フレームの撮影が可能で、ランダムアクセス可能な画素数が30万画素(570x570画素)のCMOSイメージセンサとして説明するが、これに限られるものではない。 このイメージセンサ203の撮影フレームサイズは10mm×10mmとし、このサイズを大静止画として処理する。また、このフレーム(大静止画)内の小静止画のサイズを2mm×2mmとする。
大静止画の位置座標を決定するための小静止画は、たとえば、図3に示すように、大静止画の対角の位置の2か所が選ばれる。すなわち大静止画(30万画素(570×570画素))内の対角線上の左下のA部分近傍の位置に矩形領域部分2mm角((2×57)×(2×57)画素)と、またスキャン作業中に起きる回転角度を算出するため、その対角にあたる右上のB部分近傍の位置に矩形領域部分2mm角((2×57)×(2×57)画素)が選ばれる。
フレーム撮影前後で、各小静止画の総画素数の50%から30%以上の重なり合いが必要である。一例として、この10mm角のフレームの90%重なるように、1フレーム毎のスキャナ移動距離を1mmとした場合、毎秒30フレームの撮影が可能なこのCMOSイメージセンサ203を用いたスキャナのスキャン速度は毎秒33mmとなる。
(5)本発明の実施の形態であるタイミングチャート
図4は、本発明の実施の形態であるイメージセンサ203の撮影タイミングを模式的に表したものである。スキャナ回路は図2に、全体システムの画像処理の流れは図1に示したものを使用する。図2に示すにイメージスキャナ200のLED201は位置確認用であり、LED202は文字認識用である。LED201は撮影対象の書類紙面に限りなく平行な光を照射し、LED202は撮影対象の書類紙面にほぼ垂直な光を照射する。
撮影フレームの位置決めは本スキャナの基本機能であるが、位置決めに最適な露光方法、解像度が文字認識の場合と異なるため、図4に示すように本システムでは、位置計算用フレーム撮影を文字認識用フレームの前に行い、両方を一対として、連続撮影を行う。
図4のフレーム1では、LED 201により位置計算用静止画の撮影を行ない、位置の計算は次ぎのフレーム2の撮影期間に行なう。 なお、フレーム2ではLED202により露光を行い、文字やコード認識用静止画を撮影する。
位置計算用フレームの撮影に際しては、LED201により撮影対象の書類紙面に限りなく平行に、光を照射すると、紙面の凹凸などによる陰影が現れ、紙面に文字などの印刷模様がない白下地の場合でも、撮影フレームの位置決めが可能となる。
(6)具体的実施例の説明
(6−1)実施例1
まず、文字やコード認識を実施する場合について説明する。
文字やコード認識のためのフレーム撮影は、位置決めの場合と異なり、図3のLED202により、読取対象の書類紙面に略垂直な光を照射して文字やコードを撮影する。
撮影時間中に対象とする画像(文字やコード)の解像度以上に、画像が動くと正確な静止画が得られない。手ぶれの無い静止画撮影のためには、スキャン速度と解像度の関係から、フレーム撮影(露光)に許される時間が決まる。一例として、高解像度を必要とする、かな漢字認識に必要な解像度は1mm当り16画素ということが経験的に知られており、この場合撮影中に許される移動量を1ドット(0.0625mm)の10%(0.1ドット)とすると、許される露光時間は、0.0625mm×0.1÷スキャン速度(mm/sec)となる。 スキャン速度が毎秒100mmの場合、許容露光時間は62.5マイクロ秒となる。
スキャン速度は、撮影フレーム(大静止画)速度およびフレーム間の重なり具合に大きく依存する。ここで、スキャン速度;S (mm/sec)、撮影フレーム数;F(枚/sec)、撮影フレーム間の重なり度;A(%)、撮影フレームの寸法;B(mm/枚)、撮影フレーム間のズレ;C(mm/枚)とすると、C=B×(1−A)であり、図4の場合、文字認識用フレームの数は半減するので、スキャン速度S=C×F×0.5となる。
認識に必要な解像度は、文字やコードの種類により異なるため、スキャン速度に影響する解像度は可変であることが望ましい。かな漢字の認識に必要な解像度は、1mm当り16画素であり、英数字の認識に必要な解像度は、1mm当り8画素である。1例として、市販の30万画素CMOSセンサを使用する場合、撮影面積を10mm角とすると、このセンサの解像度は1mm当り57画素となるので、文字の読み取りには、WOI技術を用いて、読込む画素を間引き、対象とする文字やコード認識に適した解像度に変えることが望ましい。かな漢字の場合、認識に必要とする解像度はこのセンサの解像度の約3分の1であるので、このセンサの画素数を3分の1に減らすと、毎秒30フレームの撮影速度は、3倍の毎秒90フレームになる。この結果、撮影フレーム間の重なりを90%とした場合の最大スキャン速度は毎秒15mmから45mmと高速化できる。
また、英数字の認識に必要とする解像度は、さらにこのセンサの画素数の約6分の1以下となるので、フレームレートは毎秒150フレーム(撮影間隔6.7msec)となり、撮影フレーム(静止画)間の重なりを90%とした場合の最大スキャン速度は毎秒75mmとさらに高速化ができる。
位置座標を検出するための紙面の撮影に対するセンサの解像度は書類の紙質に依存するので紙質にあった解像度で行うとよい。すなわち上述した文字認識に必要なセンサの解像度とは違った解像度で行う。また、紙面に限りなく平行に光を照射すると、紙面の凹凸は比較的解像度が低くても認識できるので画像の取込みを高速にできる位置座標の計算も短時間にできる。このような状況に対応するため解像度の設定を変えることができるようにしている。
次に文字認識の際の動作手順を図5を用いて説明する。
スキャン・ボタンを押し、スキャンを開始する。
1-1. まずLED光源201のパルス発光により、フレーム1データ全体(大静止画)が撮影されCMOSイメージセンサー203の各画素に電荷が蓄積される。電荷蓄積に要する時間は対象画面の明度にもよるが約60usecである。
1-2. 次に撮影された大静止画の各画素信号は、A/D変換器207によりデジタルデータに変換される。文字認識の場合、最低2値データでもよいが、良好なパターン認識率を得るには多値化するほうが良い。次に2か所の小静止画が撮影されその画像データについてアドレスがスキャンされ、画素データはDSP(Digital Signal Processor)メモリ211bへ転送される。DSPメモリ211bの読み取り速度を60nsecとするとデータ取込みは0.3msec(=60ns×8bit×36×36画素×0.5)で完了する。尚、ここではDSPを用いて説明するが、ロジック回路を用いて実行しても良い。
1-3. DSPメモリ211bへ転送された小静止画データはDSP211によって処理され、大静止画の重心座標値への換算に用いられる。この座標値計算はフレーム撮影後、次のフレーム撮影までの間(33ms)に行われる。座標値(回転角度)の計算は、前後のフレームの小静止画のパターン照合により行われる。パターン照合は、相関係数を求めると計算時間がかかるので、画素数が少ない場合は短い計算時間ですむ残差法(着目画素とそれを取囲む画素のパターンの差を求める)により行う。
1-4. DSP211により計算された大静止画の重心座標位置(含回転角度)と、大静止画の画素データは、メモリ217に一旦格納される。この後引き続き次のフレーム撮影が行われる。
1-5. その後、大静止画データが一定量まとまれば、USB(Universal Serial Bus)を用いてPC220へ連続的して転送される。その際、各静止画には位置座標(重心位置座標値、回転角度)データが添付される。
1-6. 上記処理が繰り返された後、スキャン・ボタンを離すことにより、スキャンは終了する。
また、スキャン中には撮影される画像を表示部にリアルタイムに表示しどのような画像が撮影されているかを、あるいは現在のスキャン位置の確認をするようにすることもできる。
以上の動作後に、PC220における処理が開始される。
2-1. 図4において、位置計算は、フレーム1、フレーム3、‥‥と奇数フレームで行い、文字認識は、フレーム2、フレーム4、‥‥と偶数数フレームで行う。文字認識フレーム2、‥‥の重心位置座標は、前後の位置フレーム、例えば、フレーム1及びフレーム3の重心位置座標の平均値とすればよい。またフレーム1及びフレーム3の相対的移動量は対応する小静止画の重なり具合をパターン認識によって照合し求める。画像データ合成部227は、スキャナ200から転送された各静止画をその位置座標情報に基づいて、画像の相対的な位置決め並びに画像の回転を補正し、且つ重なり合っている部分を除きながらつなぎ合わせ、メモリ(図示せず)内に記録する。これによって上下左右の関係が保たれた元のイメージを忠実に再現することができる。但し、スキャナ200側にメモリおよびDSPに計算余力がある場合、静止画のつなぎ合わせ作業はスキャナ200側で行う。
2-2. その後、BMPデータ変換部229がPC用画像フォーマット(BMP)への変換を行う。
以上の処理の後に、文字認識処理231が実施される。文字認識ソフトは、ユーザが利用するPC用アプリケーションの背後で動作する形に作られている。
3-1. 繋ぎ合わせが完了した静止画は、文字認識ソフト(文字/コード認識部231)に転送される。
3-2. 文字/コード認識部231での文字認識結果は、PC200内のテキストファイル記憶部233に送られ一時保管される。一時保管メモリ233に入った文字認識結果はテキスト入出力取得部225及びUSBインタフェース221を介してスキャナ200に転送される。その後、当該文字認識結果がスキャナ200側のLCD表示部213に表示され、ユーザはスキャナの手元で希望するものかどうかの確認と選択が行える。
3-3. ユーザの希望する文字認識結果は、スキャナ200より確定指示することにより、アプリケーションのカーソル位置に直接自動入力される。
(6−1−1)光学的文字認識装置について
図5を参照しながら、本発明によるイメージスキャナおよびこれを用いた光学的文字認識装置を詳細に説明する。
図5には、本発明によるイメージスキャナをパーソナルコンピュータに対してポインティングデバイスとしての機能を持つマウススキャナとしたときの光学的文字認識装置の実施の形態を示すシステム構成図が示されている。図5において、パーソナルコンピュータ10は、高速双方向通信バスであるユニバーサルシリアルバス(Universal Serial Bus,以下USBと称す)に対応した、例えばマイクロソフトのオペレーションシステムであるWindows(登録商標)XP等が動作する一般的なコンピュータである。
パーソナルコンピュータ10は、ワープロソフト、表計算ソフトまたはデータベースソフト等のアプリケーションソフトが動作するとともに、文字認識ソフトがアプリケーションソフトの背後(バックグラウンド)で動作する。
すなわち、本実施の形態において、パーソナルコンピュータ10で文字認識ソフトが動作している状態でも、使用者にはアプリケーションソフトしか動作していないように見え、文字認識ソフトで認識された文字コードデータは恰もキーボードから入力されたのと同様にアプリケーションソフトに入力される。
図5には示していないが、パーソナルコンピュータ10は、本体にCRTディスプレイまたはLCD(Liquid Crystal Display)等の表示部およびキーボードが接続されている。さらに、パーソナルコンピュータ10の本体にはUSBのコネクタが搭載され、USBケーブル50を介してマウススキャナ20に接続されている。このように、パーソナルコンピュータ10とマウススキャナ20とをUSBにより接続することで、この間での高速双方向通信が可能になるとともに、マウススキャナ20に対してパーソナルコンピュータ10より電源を供給することが可能となる。
マウススキャナ20は、パーソナルコンピュータ10のポインティングデバイスとして機能するマウスと、書類を光学的にスキャンしてそのイメージデータを出力するスキャナとが一体化された装置である。マウススキャナ20は、底面に書類を光学的にスキャンするイメージセンサ回路22を備えており、書類上の所望の位置に移動することが可能である。したがって、マウススキャナ20を文字認識を行いたい書類上の“意図する領域”に移動することで、必要な個所の文字等をスキャニングすることができる。
USBインタフェース回路24は、マウススキャナ20がスキャニングした書類上の“意図する領域”のイメージデータを、USBケーブル50を介してパーソナルコンピュータ10に送信する。
パーソナルコンピュータ10のUSBドライバ12は、イメージデータを受信すると文字認識ソフトで文字認識を行い、その文字認識結果である文字コードをUSBケーブル50を介してマウススキャナ20に送信する。
マウススキャナ20のUSBインタフェース回路24は、文字コードを受信すると、該当する文字をLCD表示部26に表示する。
このように、スキャニングした領域の文字認識結果はLCD表示部26にほぼリアルタイムで表示されるので、認識結果の良否をスキャニングと同時に確認することが可能となる。したがって、文字認識を行う“意図する領域”の位置決め(開始箇所や終了箇所)を含め、スキャニング時点で“意図する領域”の位置の変更やイメージデータを取り込む際の設定(2値化のしきい値等)の変更を行うことができる。
すなわち、本実施の形態ではパーソナルコンピュータ10の性能向上による文字認識の高速化とUSBのデータ転送速度の高速性を利用して、“意図する領域”を指定する際、表示された認識文字は、スキャナ20を僅かに動かして文字認識の開始箇所と終了箇所の位置決め等をLCD表示部26で確認できるので、“意図する領域”が取込めていなければこの時点でやり直すことが可能である。
また、パーソナルコンピュータ10が、音声合成を行うアプリケーションを搭載していれば、文字認識結果を音声出力することで使用者はLCD表示部26を確認すること無く認識結果を知ることができる。
なお、“意図する領域”が取込めていることが確認でき、認識結果を確定する確定処理がマウススキャナ20で行なわれると、パーソナルコンピュータ10上で動作しているワープロソフトや表計算ソフト等のアプリケーションソフトのカーソルの位置に、この認識結果が直接入力される。
このとき、本実施の形態ではアプリケーションソフトウェア上に入力された誤認識箇所の修正をやりやすくするため、アプリケーションソフトウェアに送った文字認識結果の元のイメージデータをパーソナルコンピュータ10上に表示する。
したがって、例えば認識結果の中に“誤認識箇所”があっても、このイメージデータを参照しながらアプリケーションソフト上でキーボード等により容易にその箇所の修正を行うことが可能である。
図5において、マウススキャナ20は、マウスおよびイメージセンサ回路22、USBインタフェース回路24、LCD表示部26、および画像位置計算回路28により構成されている。なお、本実施の形態において、マウススキャナ20はスキャニングしたイメージデータを蓄積することも出来るが、通常はPC10と接続してスキャニングしたイメージデータを蓄積することもなく、リアルタイムでパーソナルコンピュータ10にポインティング情報を高速出力している。
マウスおよびイメージセンサ回路22は、パーソナルコンピュータ10のポインティングデバイスとして機能するマウスと、書類の画像をイメージデータとして認識するイメージセンサとを含んだ回路である。マウスおよびイメージセンサ回路22はまた、スキャナの位置信号をマウスの位置信号として利用する位置センサ回路を備えている。さらにマウスおよびイメージセンサ回路22はUSBインタフェース回路24と制御信号(Control)の送受信を行う。
USBインタフェース回路24は、マウスおよびイメージセンサ回路22およびLCD表示部26と画像位置計算回路28とのインタフェースをとる回路である。すなわち、画像位置検出計算回路28により検出した位置情報をマウス信号としてリアルタイムにUSBインタフェース回路24に通知するとともに、スキャニングの開始、終了、確定等の命令を受けると、マウスおよびイメージセンサ回路22にこれを通知する。
また、USBインタフェース回路24は、USBマイクロコントローラ28を介して、LCD表示部26に文字表示を行う制御データを受信すると、LCD表示部26にこの制御データ(FFC)を出力する。この制御データによりLCD表示部26には該当する文字が表示される。
USBインターフェース回路24は、マウススキャナ20の全体を制御する制御部とUSBによりデータの送受信を行うためのUSBコントローラとを備えた制御回路である。USBマイクロコントローラは、USBケーブル50を介してパーソナルコンピュータ10のUSBドライバ12に接続され、イメージセンサにより取り込んだイメージデータをパーソナルコンピュータ10に送信する。
また、USBマイクロコントローラは、パーソナルコンピュータ10より文字コードデータを受信すると、LCD表示部26の文字表示を行うための制御データをUSBインタフェース回路24に出力する。
マウスおよびイメージセンサ回路22内のイメージセンサにより位置座標用として取り込まれたフレームイメージの小静止画の部分が画像位置計算回路28に送られ、その各々のイメージデータの位置座標が計算される。
その後、マウスおよびイメージセンサ回路22で取込んだ複数の文字認識用イメージとその各々の位置座標は、USBインタフェース回路24により、PC10に送信され、PC10内の画像合成部140で、その位置座標をもとに撮影された複数のイメージは高速補正され、全体のイメージデータが形成される。この結果、従来問題であったハンディスキャナの蛇行や手ぶれなどが原因で文字が正しく認識されないという問題が解決される。
パーソナルコンピュータ10は、OS(Operating System)レベルで制御されるカーネル層(Kernel Layer)のUSBドライバ12と、アプリケーションレベルで制御されるユーザ層(User Layer)のユーザインタフェースとにより構成されている。
画像合成部140は、USBドライバ12を介してマウススキャナ20より受信したイメージデータを取り込む。BMPフォーマット変換部142は、このデータをリアルタイムで例えばビットマップ(BMP)フォーマットの画像データに変換する。
文字認識処理部144は、当該画像データに対して日本語文字認識処理を行う。
テキストファイル記録部146は、この文字コードデータをファイルに一時保存する。テキスト入出力部148は、当該一時保存された文字コードデータをほぼリアルタイムでLCDデータとして、USBドライバ12を介してマウススキャナ20に送信する。
この結果、マウススキャナ20でスキャニングしたイメージデータは、パーソナルコンピュータ10によりリアルタイムで文字・コードデータに変換され、スキャニングした変換結果はスキャニングと同時にLCD表示部26に表示される。
(6−1−2)マウススキャナの構造について
図6は、マウススキャナ20の上面図および側面図である。図6に示すように、マウススキャナ20は、内部にイメージセンサ、レンズ30を備え、マウススキャナ20の全体を制御する制御回路36が配設されている。図6におけるイメージセンサ、レンズ30は、図5おけるマウスおよびイメージセンサ回路22に、図6における制御回路36は、図5におけるインタフェース回路24およびUSBマイクロコントローラ28にそれぞれ相当する。なお、図6のイメージセンサ、レンズ30は、「光源」、「非球面レンズ」と「イメージセンサ」を一体化したイメージセンサ・モジュールである。
このモジュールは操作性を考慮して、スキャン個所が常に見やすいUSBケーブルの付け根に設置してある。マウススキャナ20はまた、上面にLCD表示部26が配置されるとともに、さらに2つ乃至3つのマウスボタン44が上面に配設されている。
同図の左ボタンはスキャニングをスタートするスタートボタン40として、右ボタンはLCD表示部26に表示された文字を確定する確定ボタン42として、それぞれ配設されている。
なお、特に記載はしなかったが、スキャニングの日本語/外国語/各種コードの選択、文字/画像入力の選択等の調整は、パーソナルコンピュータ10で行うか、マウススキャナ20にこれらの調整を行う操作ボタンを設けるか、または両方できるようにしてもよい。
小静止画並びに大静止画に対する解像度の設定についても、同様にマウスボタンによって、あるいはパーソナルコンピュータのいずれからもできるようにするとよい。
(6−2)実施例2
次に単に画像イメージをとる場合について説明する。大静止画の大きさは、10mm角であるので小静止画の大きさ(2mm角)は、大静止画の20%の大きさである。画像を照合するためには、小静止画は作業中常にその総画素数の50%から30%以上の重なり合いが必要となる。この小静止画(2mm角)の重なりをとるため、大静止画は例えば1mm間隔で撮影される。
スキャン速度を30mm/秒とすると、静止画は1mm(33msec)間隔で撮影され、各小静止画は2mm角であるので小静止画の一辺114画素(1mm当り57画素)の半分は連続した次の静止画とは約50%が常に重なり合う。またその重なり合い部分の総画素数は約6,500画素(114×114(画素)×0.5)となりこれが照合すべき画素サイズとなる。
画素数が多い場合、パターン照合に要する計算時間が長くなり、作業に悪影響を及ぼすことが予想されるので、画像を取る場合も、文字認識のレベルまで解像度は下げて利用する。動作手順としては、スキャン開始前に画像取り込みの設定を行うことにより、図1の画像利用のフローを実施する。イメージは、縦または横方向のいずれかの方向に決められて配置される文字の場合と異なり、左右上下にランダムにスキャンしてイメージを取り込むことになる。
(6−3)実施例3
実施例1〜2ではランダムアクセス可能なCMOSセンサを用いた場合を説明したが、ここではランダムアクセスが可能でないイメージセンサCCDを用いたイメージスキャナの実施例について説明する。
本実施例のイメージセンサは、一般に市販されているインターライン型全画素読出し方式CCDであり、メカニカルシャッタ無しに、電子シャッタによる一度の露光で全画素のデータを独立に読み出せる特長を有しているとする。
このCCDは正方画素(縦方向と横方向の画素ピッチ一致)で構成されており、縦と横の解像度が一致するため、画像処理演算を容易にする。
一例として、33万画素(659×494)品では、単位画素寸法が水平・垂直ともに7.40ミクロン、イメージ対角長6.0mm(1/3型)、読出し周波数24.54MHz(41ns)、フレームレート毎秒60.0である。
このセンサの撮影サイズは10mm×10mmとし、このサイズを大静止画とし、小静止画のサイズは0.5mm×10mmとする。本センサのフレームレートは、毎秒60フレームであるから、各フレームの全画素読み出しは、16.6msとなる。
図3に示す光学系で、このセンサを用いて撮影された大静止画の位置関係を計算するための小静止画を求めるが、ランダムアクセス可能なCMOSで用いたWOIはCCDでは使えない。
このため位置座標を求めるための小静止画については連続したアドレスに対するものを使用する。一辺の領域すなわち最初のアドレス番地から順に読み出し例えば0.5mmに相当する領域まで読んでそのデータをメモリに転送し、それとは反対の一辺すなわち最終のアドレス番地から順に読み出し0.5mmに相当する領域まで読んでそのデータをメモリに転送し、これらのデータを使用して位置座標を計算する。
大静止画については全画素の読出しの際には、画素を飛ばしてメモリに収納する。本センサの解像度を57画素/mm(=659×494画素/mm2)として撮影範囲の全画素数の1/3(220×165画素)を読んで高速処理する。
次に文字認識の際の動作手順を説明する。
スキャン・ボタンを押し、スキャンを開始する。
1-1. まずLED光源202のパルス発光により、大静止画データ全体が撮影される。次に撮影された大静止画の各画素信号は、AD変換器207によりデジタルデータに変換される。
1-2. 次にLED光源201のパルス発光により、2か所の小静止画の画素データが読み込まれ、DSPメモリ211bへ転送される。前述のように最初のアドレス番地から順に読み出し例えば0.5mmに相当する領域まで読んでそのデータをメモリに転送し、その後、最終のアドレス番地から順に読み出し0.5mmに相当する領域まで読んでそのデータをDSPメモリ211bに転送される。
1-3. DSPメモリ211bへ転送されたデータはDSP211によって処理され、大静止画のA、B点の座標値換算に用いられ、各小静止画の重心位置座標値計算は文字認識用フレーム撮影期間中に行われる。
1-4. 次に大静止画のCCDアドレスがスキャンされて大静止画全体が読み込みこまれてデジタル画像メモリ217へ転送される。このとき、読み込みを実施するCCDアドレスは間引き、解像度を低くして読み込みが行なわれる。
1-5. その後、全体の大静止画データが一定量まとまれば、位置座標(重心位置座標値、回転角度)データの添付と共に、USBを用いてPC220へ連続的して転送される。
1-6. 上記処理が繰り返され、スキャン・ボタンを離すことによりスキャンは終了する。
以下、PC220での処理は実施例2の場合と同じであるので省略する。
小静止画の読み込み開始のCCDアドレスを最初と最後のアドレスとしたが、アドレス番地を指定しCCDの端部から距離のある途中の矩形部分を指定しても良い。また実施例1と同様に必要に応じてスキャンするアドレスを間引いて読み込みをする、すなわち解像度を低く設定してもよい。
(6−4)実施例4
図7は本発明の実施の形態である光学端末装置の構造図である。本実施例では、携帯電話の一部としてマウススキャナを組み込み、携帯パソコンのマウススキャナとして利用したり、また、携帯電話の処理能力に余裕がある場合には、携帯電話内で文字認識処理を行ったり、さらに、図8に示すように携帯電話の無線公衆回線を介してサーバと接続し、このサーバに光学端末装置にて取得したイメージデータを送信する携帯電話である。
図7は、マウススキャナ20を組み込んだ携帯電話の上面図および側面図である。図7に示すように、マウススキャナ20は、内部にイメージセンサ、レンズ30を備え、マウススキャナ20の全体を制御する制御回路36が配設されている。図7におけるイメージセンサ、レンズ30は、図5におけるマウスおよびイメージセンサ回路22に、図6における制御回路36は、図5におけるインタフェース回路24および画像位置計算回路28にそれぞれ相当する。
なお、図7のイメージセンサ、レンズ30は、「光源」、「非球面レンズ」と「イメージセンサ」を一体化したイメージセンサ・モジュールである。このモジュールの取り付けは、意図する文字コードのスキャン個所が見やすい位置に設置してある。マウスボタンの取り付けも操作性を考慮した位置に取り付けてある。マウススキャナ20はまた、携帯電話にLCD表示部26が配置されるとともに、マウスボタン44が配設されている。
なお、特に記載はしなかったが、スキャニングの日本語/外国語/各種コードの選択、文字/画像入力の選択等の調整は、パーソナルコンピュータ10で行うか、マウススキャナ20にこれらの調整を行う操作ボタンを設けるか、または両方できるようにしてもよい。
イメージセンサ・レンズ30は、携帯電話のカメラと兼用することも可能であり、マウススキャナを組み込んだ携帯電話は、マウススキャナとして、USBコネクタ50を携帯パソコンのUSBコネクタにつないで使うことができる。
さらに携帯パソコンが身近に無い場合は、取り込んだ画像情報を携帯電話の外部メモリに一時保管しておいたり、携帯電話の無線機能を用いて、取り込んだ画像情報をサーバに送り込むことができる。また携帯電話に使われているマイクロコンピュータの能力に余裕がある場合は、パーソナルコンピュータに送り込んで処理する文字認識ソフトウェアを携帯電話に取り込んで処理することも可能である。
(6−5)実施例5
図8は、本発明の実施の形態であるスキャナカメラ付携帯電話を活用することのできる各種インターネットサービスシステムの全体図である。
本実施例では、本発明の実施の形態である光学端末装置を携帯電話の一部として組み込み、携帯電話の一般公衆無線インターネット回線800を介し、前記光学端末装置にて取得したイメージデータを携帯電話809a〜809cから各種サーバ801〜807に送る。サーバ801〜807に送られたイメージデータはサーバ内のソフトウェアにて処理される。
例えば、サーバ801は、旅行者向け外国語文書の国際翻訳サービスを提供するサーバである。日本に来た日本語文書が読めない外国人旅行者向けに旅行者の母国語への翻訳を行うサービスで、誰もが、いつでも、どこでも利用できる便利さが生まれる。
サーバ803は、カタログや新聞・雑誌に掲載された広告に記載のネットアドレスや商品コードを読み込み、通信販売・商品販売会社に直接アクセスするサービスを提供するサーバである。インフラとして普及した携帯電話が利用できる効果は大変大きい。
サーバ805で提供される自治体や国の各種サービスは、公報や諸通知など、さまざまな形で個人に通達されるが、電子政府・電子自治体サービスを受ける際には各サービスのアドレスを携帯電話に代表されるIT機器に入力しなければならない。このアドレス入力が容易になることは電子政府・電子自治体の利用効率に多大な効果がある。
サーバ807は、情報家電へのアクセスを容易化するサーバである。情報家電の進展と共に、外出先から携帯電話809a〜809cを用いてインターネットを経由し、情報家電に指示する機会が増大した。本発明によれば、携帯電話809a〜809cへの情報家電アドレス入力の労力を軽減することができる。一例として、テレビ番組のGコード入力の容易化が期待できる。
以上、本発明の実施形態について示したが、本発明は前述したものだけに限定されるものではなく、その範囲を逸脱しない限り、変更及び修正されたものにも適用できることは言う迄もない。
本発明による光学的文字認識装置の実施の画像処理の流れ図。 光学的文字認識装置のシステム構成図。 イメージセンサ部の撮影方法を説明するための図。 イメージセンサ部の撮影タイミング図。 本イメージセンサを用いたマウススキャナのシステム構成図。 マウススキャナの構造図。 マウススキャナを組み込んだ携帯電話の構造図。 スキャナカメラ付携帯電話が役立つ各種インターネットサービスを説明するための図。
符号の説明
12 USBドライバ
22 マウス及びイメージセンサ回路
24 USBインターフェース回路
26 LCD表示部
28 画像位置計算回路
140 イメージ合成部
142 BMPフォーマット変換部
144 文字認識処理部
146 テキストファイル保存部
148 テキスト入出力部

Claims (7)

  1. 書類上の意図する領域をイメージの撮影時には書類の紙面に略垂直に上方から光を照射する第一の発光素子と、
    小イメージ領域の撮影時には書類の面とほぼ平行に光を照射する第二の発光素子と、
    前記第一の発光素子により光学的に移動スキャニングして複数の大イメージ情報を取り込む第一のエリアと、前記第二の発光素子により光学的に移動スキャニングして、前記複数の大イメージ情報に対してあらかじめ決められた少なくとも2ヶ所から選ばれた小イメージ情報を取り込む第二のエリアとを有するイメージセンサーとからなるイメージキャプチャー部と、
    前記イメージキャプチャー部の前記イメージセンサーの第二のエリアで取込んだ前記小イメージ情報の照合により相対的な位置座標を計算する画像処理部と、
    前記画像処理部で計算して得られた前記小イメージ領域の位置情報とそれに対応する前記大イメージ情報を外部に出力する出力部とを有することを特徴とする光学端末装置。
  2. 位置座標を計算する前記小イメージ領域に対する解像度は前記大イメージ情報に対する解像度とは異ならせていることを特徴とする請求項1に記載の光学端末装置。
  3. 前記光学端末装置はさらに表示部と外部のコンピュータから入力する入力部とを備えており、
    前記イメージ情報は前記出力部より前記コンピュータに出力され、前記イメージ情報が前記位置情報データに基づいて形成された全体のイメージデータから前記コンピュータにて文字認識を実施し、その結果を前記入力部から入力し前記表示部にて表示することを特徴とする請求項1乃至のいずれかに記載の光学端末装置。
  4. 前記表示部は、イメージのスキャン中に前記イメージ情報を表示することを特徴とする請求項1乃至のいずれかに記載の光学端末装置。
  5. 前記光学端末装置は、高速双方向通信バス等の有線手段によって、あるいは、光又は電波等の無線手段によって前記コンピュータと接続されポインティングデバイスとして使用することを特徴とする請求項1乃至のいずれかに記載の光学端末装置。
  6. 前記光学端末装置が携帯電話の一部として組み込まれ携帯電話の無線公衆回線を介してサーバと接続され、前記光学端末装置にて取得した前記イメージ情報並びに前記イメージの位置情報を前記サーバに送信することを特徴とする請求項1乃至5のいずれかに記載の携帯電話。
  7. 光学端末を用いて、書類上の意図する領域を移動スキャンし取込んだイメージ情報を画像処理して合成する方法であって、
    書類上の意図する領域のイメージ撮影時には第一の発光素子により書類の紙面に略垂直に上方から光を照射するステップと、
    小イメージ領域の撮影時には第二の発光素子により書類の面とほぼ平行に光を照射するステップと、
    前記第一の発光素子により光学的に移動スキャニングしてイメージキャプチャー部のイメージセンサーの第一のエリアに複数の大イメージ情報を取り込み、前記第二の発光素子により光学的に移動スキャニングして前記複数の大イメージ情報に対してあらかじめ決められた少なくとも2ヶ所から選ばれた小イメージ情報を前記イメージセンサーの第二のエリアに取り込むステップと、
    前記キャプチャー部の前記イメージセンサーの第二のエリアで取り込んだ前記小イメージ情報の照合により相対的な位置座標を計算する画像処理ステップと、
    前記画像処理部で計算して得られた前記小イメージ領域の位置情報とそれに対応する前記大イメージ情報を外部に出力するステップとを有することを特徴とする光学端末装置の画像処理方法。
JP2004118906A 2003-04-18 2004-04-14 光学端末装置、画像処理方法およびシステム Expired - Fee Related JP4019063B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004118906A JP4019063B2 (ja) 2003-04-18 2004-04-14 光学端末装置、画像処理方法およびシステム
US10/824,906 US7477783B2 (en) 2003-04-18 2004-04-15 Image processing terminal apparatus, system and method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003113750 2003-04-18
JP2004118906A JP4019063B2 (ja) 2003-04-18 2004-04-14 光学端末装置、画像処理方法およびシステム

Publications (3)

Publication Number Publication Date
JP2004334861A JP2004334861A (ja) 2004-11-25
JP2004334861A5 JP2004334861A5 (ja) 2007-06-07
JP4019063B2 true JP4019063B2 (ja) 2007-12-05

Family

ID=33161564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004118906A Expired - Fee Related JP4019063B2 (ja) 2003-04-18 2004-04-14 光学端末装置、画像処理方法およびシステム

Country Status (2)

Country Link
US (1) US7477783B2 (ja)
JP (1) JP4019063B2 (ja)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9008447B2 (en) * 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
JP4398474B2 (ja) * 2004-12-28 2010-01-13 富士通株式会社 画像内の処理対象の位置を特定する画像処理装置
JP2006259830A (ja) * 2005-03-15 2006-09-28 Toshiba Corp 光学的文字認識装置および光学的文字認識結果確認方法
EP2067119A2 (en) 2006-09-08 2009-06-10 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
KR101443404B1 (ko) * 2006-09-15 2014-10-02 구글 인코포레이티드 페이퍼 및 전자 문서내의 주석의 캡처 및 디스플레이
US10255607B2 (en) 2006-11-15 2019-04-09 Disney Enterprises, Inc. Collecting consumer information
JP4795309B2 (ja) * 2007-07-02 2011-10-19 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法および画像処理プログラム
US20090021533A1 (en) * 2007-07-17 2009-01-22 Michael Guerzhoy Method For Extracting An Inexact Rectangular Region Into An Axis-Aligned Rectangle Image
US20110145068A1 (en) * 2007-09-17 2011-06-16 King Martin T Associating rendered advertisements with digital content
US20090219558A1 (en) * 2008-02-28 2009-09-03 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
US8189965B2 (en) * 2008-11-17 2012-05-29 Image Trends, Inc. Image processing handheld scanner system, method, and computer readable medium
WO2010096193A2 (en) * 2009-02-18 2010-08-26 Exbiblio B.V. Identifying a document by performing spectral analysis on the contents of the document
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
CN102349087B (zh) 2009-03-12 2015-05-06 谷歌公司 自动提供与捕获的信息例如实时捕获的信息关联的内容
US8339467B2 (en) * 2010-03-25 2012-12-25 Dacuda Ag Synchronization of navigation and image information for handheld scanner
US8582182B2 (en) * 2009-05-20 2013-11-12 Dacuda Ag Automatic sizing of images acquired by a handheld scanner
US8441695B2 (en) * 2009-05-20 2013-05-14 Dacuda Ag Handheld scanner with high image quality
US8441696B2 (en) * 2009-05-20 2013-05-14 Dacuda Ag Continuous scanning with a handheld scanner
US9300834B2 (en) 2009-05-20 2016-03-29 Dacuda Ag Image processing for handheld scanner
US20100296133A1 (en) * 2009-05-20 2010-11-25 Dacuda Ag Mode switching in a handheld scanner
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) * 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
KR101785601B1 (ko) 2011-01-18 2017-10-16 에이치에스엔아이 엘엘씨 미디어 데이터에 있는 아이템을 인식하고 이와 관련된 정보를 전달하기 위한 시스템 및 방법
US8437497B2 (en) 2011-01-27 2013-05-07 Seiko Epson Corporation System and method for real-time image retensioning and loop error correction
US8253985B2 (en) * 2011-01-27 2012-08-28 Seiko Epson Corporation Image registration parameters and confidence estimation from sensor data
US8279500B2 (en) 2011-01-27 2012-10-02 Seiko Epson Corporation System and method for integrated pair-wise registration of images using image based information and sensor coordinate and error information
JP5697148B2 (ja) * 2011-04-19 2015-04-08 光雄 中山 マウススキャナシステム
EP2538654A1 (en) * 2011-06-22 2012-12-26 LG Electronics Scanning technology
US8987788B2 (en) 2011-09-26 2015-03-24 Semiconductor Components Industries, Llc Metal-strapped CCD image sensors
US8708705B1 (en) * 2012-04-06 2014-04-29 Conscious Dimensions, LLC Consciousness raising technology
JP5989479B2 (ja) * 2012-09-20 2016-09-07 シャープ株式会社 文字認識装置、文字認識装置の制御方法、制御プログラム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体
US10298898B2 (en) 2013-08-31 2019-05-21 Ml Netherlands C.V. User feedback for real-time checking and improving quality of scanned image
EP3540683A1 (en) 2013-12-03 2019-09-18 ML Netherlands C.V. User feedback for real-time checking and improving quality of scanned image
US10410321B2 (en) 2014-01-07 2019-09-10 MN Netherlands C.V. Dynamic updating of a composite image
EP3748953B1 (en) 2014-01-07 2024-04-17 ML Netherlands C.V. Adaptive camera control for reducing motion blur during real-time image capture
EP3143596B1 (en) 2014-05-12 2020-04-08 ML Netherlands C.V. Method and apparatus for scanning and printing a 3d object
JPWO2021084761A1 (ja) * 2019-11-01 2021-05-06

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4804949A (en) * 1987-03-20 1989-02-14 Everex Ti Corporation Hand-held optical scanner and computer mouse
JPH07114630A (ja) * 1993-10-19 1995-05-02 Matsushita Electric Ind Co Ltd イメージ処理機能付小型情報端末装置
JPH07220025A (ja) 1994-01-31 1995-08-18 Canon Inc 画像処理装置
JPH10294855A (ja) 1997-04-18 1998-11-04 Smk Corp 二次元画像データの合成方法
JP2000099709A (ja) 1998-09-25 2000-04-07 Ascii Mirai Kenkyusho:Kk 手走査型スキャナ
CA2335116C (en) * 1999-04-20 2004-06-22 Mitsubishi Denki Kabushiki Kaisha Character display device and character display method
JP2001358916A (ja) 2000-06-15 2001-12-26 Fuji Xerox Co Ltd 画像読取装置
JP2002352190A (ja) 2001-05-28 2002-12-06 Kenwood Corp 携帯端末装置
JP2003037757A (ja) * 2001-07-25 2003-02-07 Fuji Photo Film Co Ltd 画像撮像装置
JP2003087544A (ja) 2001-09-07 2003-03-20 Matsushita Electric Ind Co Ltd スキャナ付き移動体通信端末、画像合成方法及び画像合成プログラム

Also Published As

Publication number Publication date
US7477783B2 (en) 2009-01-13
JP2004334861A (ja) 2004-11-25
US20040208369A1 (en) 2004-10-21

Similar Documents

Publication Publication Date Title
JP4019063B2 (ja) 光学端末装置、画像処理方法およびシステム
US8384947B2 (en) Handheld scanner and system comprising same
US9544473B2 (en) Information processing system and information processing method
KR101027306B1 (ko) 핸디 스캐너 장치 및 그 제어방법
US8582182B2 (en) Automatic sizing of images acquired by a handheld scanner
US20060082557A1 (en) Combined detection of position-coding pattern and bar codes
CN102484724A (zh) 投影图像区域检测装置
US6546152B1 (en) Method and apparatus for providing images in portable 2-D scanners
US7865043B2 (en) Method, apparatus, computer program and storage medium for recording a movement of a user unit
US7679792B2 (en) Merged camera and scanner
KR100766096B1 (ko) 컴퓨터 환경에서의 제어 시스템 및 방법
JP2002204342A (ja) 画像入力装置および記録媒体、並びに画像合成方法
JP2019220069A (ja) カード番号認識装置およびカード番号認識方法
JP2001008072A (ja) 電子カメラ及びその制御方法
JP3240899B2 (ja) 文書画像入力装置
US5971278A (en) Method of alignment for multi-CCD and the apparatus of the same
JP2015102915A (ja) 情報処理装置、制御方法およびコンピュータプログラム
JP2004198817A (ja) プレゼンテーション装置
US20070122057A1 (en) Method of scanning an image using surface coordinate values and device using thereof
JP4504140B2 (ja) 筆記面再生方法、筆記面再生装置及び筆記面再生プログラム
JP2021157249A (ja) Ocr用画像取得システム及びocr用画像取得方法
JP2005210365A (ja) 画像データ補間装置、画像データ補間方法および画像データ補間プログラム。
EP1073990A1 (en) Device for recording information in different modes
JP2019097050A (ja) 画像読取装置及び画像読取プログラム
JPH1013622A (ja) 画像入力装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070412

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070412

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20070427

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20070509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070921

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees