JP2004078672A

JP2004078672A - 検索可能な文書フォーマットでのスキャン装置

Info

Publication number: JP2004078672A
Application number: JP2002239337A
Authority: JP
Inventors: Yukio Sato; 佐藤　幸夫; Tomoshi Yoshida; 吉田　知史; Masaki Toyama; 外山　正樹
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2002-08-20
Filing date: 2002-08-20
Publication date: 2004-03-11

Abstract

【課題】スキャンしたイメージ画像に対して全文検索をさせる場合、イメージデータにＯＣＲしたテキストデータを添付して全文検索用として使う。さらに該テキストを（日本語などに）翻訳しておき日本語からも英文などの検索ができるようにする。
【解決手段】スキャナから読み込んだＲＡＷ画像にＯＣＲ処理をしてテキストデータとして持つ。このテキストデータの文字位置はＲＡＷ画像の文字位置と同一位置関係にある。テキストデータを例えば英語から日本語へと翻訳したテキストデータとして持つ。これら３枚の画像（ＲＡＷ画像データ、ＯＣＲテキストデータ、翻訳テキストデータ）を一枚の画像として、例えばＰＤＦとして出力する。
【選択図】　　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、原稿をスキャンして読み取られた画像データに対してＯＣＲ（文字認識）処理をかけて文字を認識した後にテキストデータを作成し該画像データとともに文字テキストデータも同一文書として例えばＰＤＦフォーマットにした上でデータベースに保存するシステムに関する。例えば、特開平０７−０９３３７４号公報（文書検索方法及びシステム）など。
【０００２】
さらに保存された画像データを検索する場合は文字テキストデータを用いて検索を行いその結果検索がヒットしたときには該当するＲａｗな画像データの該当する部分の同一位置座標に該ヒットした文字部分を修飾表示（たとえば点滅強調表示など）をさせることで検索作業効率をあげるものである。
【０００３】
【従来の技術】
一般にイメージスキャナ装置などを用いてドキュメントなどを大量スキャンしてデータベースなどに蓄積する場合、特に大量のデータベースから所望の文書を検索しようとするとき従来から文書に属性やインデックスをつけてそのキーワードから検索する方法がとられてきた。しかしながら文書の中身の単語そのものから検索させる場合いわゆる全文検索機能などを実行しようとした場合はスキャンしたＲａｗな画像データのままでは無理であった。そこで最近では全文のＯＣＲ処理を施してテキストファイルを作成しこのテキスト文字列から全文検索を行うことが多い。
【０００４】
【発明が解決しようとする課題】
しかしながら、たとえば英語の文書をスキャンして英語ＯＣＲ処理を施し英文テキストデータを作成した場合など、文字検索は当然のことながら英語で検索をすることになる。
【０００５】
したがって、日本語で文字検索をした場合はヒットしないことになった。
【０００６】
【課題を解決するための手段】
本発明は以上のような欠点を解決するために考案されたものであり、英語ＯＣＲ処理で英文テキストが得られた後に、たとえば日本語翻訳処理を行い日本語テキストも同時に作成することによって日本語での全文検索でもヒットしてくることが可能となる。
【０００７】
しかも、単語の位置情報に関しては英語と日本語ともに同じ座標位置関係を保つことによって日本語からの文字検索でもヒットした英語単語部分を修飾文字として表示させることが可能となる
（作用）
これによって、スキャンされた文書がたとえ英語であった場合でも予め他言語への翻訳をしておくことで検索時のわずらわしさを解決することができる。検索してヒットした場合も該単語の位置関係が保たれているので所望の結果が得られる。
【０００８】
【発明の実施の形態】
（実施形態１）
以下に図面を参照して本発明による実施形態１を説明する。
【０００９】
図１において１オリジナル画像はスキャナによって読み取られたＲａｗな画像データである。このＲａｗ画像データ例では「Ｔｈｉｓ　ｉｓ　ａ　ｂｏｏｋ．」と書かれている原稿をスキャナで読取ったビットマップ画像である。２ＯＣＲ画像は１オリジナル画像に対してＯＣＲ処理を施して文字として認識したもので１オリジナル原稿と同じ位置関係、文字大きさや間隔などが一致させて表示してある。また、この２ＯＣＲ画像は不可視レイヤーであり１オリジナル画像に添付されて隠れているものである。同様に３翻訳画像も不可視レイヤーでありこれは２ＯＣＲ画像に対して日本語翻訳をした結果が表示されている。
【００１０】
この場合では「Ｔｈｉｓ　ｉｓ　ａ　ｂｏｏｋ．」が「これは本です。」と訳された結果である。
【００１１】
図２は具体的に読み込まれた画像に対してＯＣＲ処理と翻訳処理がかかる過程を示したものである。さらに、全文検索した結果ヒットした文字があった場合の表示の方法を示したものである。図２（２−１）は読み込んだオリジナル画像を示す。これは図３のフローチャートＳｔｅｐ３０１でのスキャン動作開始をあらわしている。
【００１２】
Ｓｔｅｐ３０２ではＢＳ（ブロック・セパレーション）動作によって最小限の単語単位となるべき画像ブロックに分解するものである。ＢＳ処理をした結果は４つのブロックに分解されブロック１１、ブロック１２、ブロック１３、ブロック１４となる。この分解されたブロックに対してＯＣＲ処理を行うことになる。
【００１３】
Ｓｔｅｐ３０３ではＯＣＲ処理した後、２ＯＣＲ画像として図２（２−２）ブロック２１、ブロック２２、ブロック２３、ブロック２４に示すようにそれぞれテキスト文字として認識されたことになる。当然のことながらブロック１１とブロック２１とは画面上での位置関係が一致しており、その他のブロックも同様に位置関係が一致している。
【００１４】
図２（２−３）は日本語翻訳された結果を表している。（２−２）ＯＣＲ画像は英語だったので英語から日本語への英和翻訳処理（不図示）ソフトが働き日本語に変換される。ここでは翻訳された文章の中は単語単位としてブロックで分けられている。
【００１５】
たとえば（２−２）ＯＣＲ画像のブロック２４の「ｂｏｏｋ」という単語はブロック３２と対応付られている。このことにより日本語で検索してヒットした場合でも英語文の該当する部分の単語を表示することができる。
【００１６】
図３はドキュメントをスキャナ装置で読み取り、検索可能な文書フォーマットとして保存するまでの動作フローチャートである。Ｓｔｅｐ３０１ではスキャナ装置から画像を読み込むことを行っている。図５、図６に示したのでスキャナ装置の一例である。
【００１７】
Ｓｔｅｐ３０２ではＢＳ（ブロックセレクション）処理を行い最小単語での単位にエリアを分解する。例えば図２（２−１）に示すブロック１１からブロック１４に分解された様子を示す。
【００１８】
Ｓｔｅｐ３０３では分解されたそれぞれのブロックに対してＯＣＲ処理（不図示）をかけてＲＡＷなイメージデータをテキスト形式のデータに変換する、そしてこのテキストデータを２ＯＣＲテキストレイヤーとして格納する。次にＳｔｅｐ３０４では他言語への翻訳処理を行う、この例では英語から日本語への翻訳をしていることを示す。
【００１９】
最後にＳｔｅｐ３０５で３枚の画像（１オリジナル画像レイヤー、２ＯＣＲテキストレイヤー、３翻訳テキストレイヤー）を一枚の画像として関連付けて文書ストレージ（不図示）例えば文書管理ソフトに保存する。
【００２０】
図４は読み取った画像に対してワードによる検索を行う場合の動作フローチャートを示している。
【００２１】
まず、Ｓｔｅｐ４０１では検索文字が入力されたかどうか監視している、「本」という日本語文字が入力され、検索動作が開始されることになる。
【００２２】
この時点で「本」という日本語を２ＯＣＲテキストデータのレイヤを用いて検索することになる。もし、ヒットした場合はＳｔｅｐ４０７に進みヒットしたＯＣＲ文字部分に対応したＢＳブロック部分をオリジナル画像レイヤー上で修飾文字として表示することになる。
【００２３】
しかしながら、この「本」という日本語では読み取ったオリジナル画像が英文なのでヒットしないことになる。
【００２４】
次に、Ｓｔｅｐ４０３へ進み、ここで、３翻訳テキストレイヤーでの検索を行うことになる。
【００２５】
Ｓｔｅｐ４０４ではヒットしたかを判定しもしヒットすればＳｔｅｐ４０７へと進む。
【００２６】
この「本」という文字の検索は、図２（２−３）に示したブロック３２でヒットしたことになる。そしてこのブロック３２は（２−２）ＯＣＲテキストデータではブロック２４「ｂｏｏｋ」というブロック２４と位置関係が定義付けられている。
【００２７】
さらに、オリジナル画像で（２−１）ではブロック１４に相当する画像部分が網点表示している部分を修飾文字として表示する。
【００２８】
一方、Ｓｔｅｐ４０４でヒットしなかった場合はＳｔｅｐ４０５に進み「検索エラー」に関するメッセージを表示して終了する。
【００２９】
図５は本発明による実施形態のスキャナ装置のシステム構成図である。
【００３０】
以下順を追ってスキャナ装置と具体的な操作方法を説明する。
【００３１】
５００は画像読み取り装置（以下、「スキャナ」と称する）、５５０は印刷装置（以下、「プリンタと称する」）である。
【００３２】
５００スキャナでは５０１スキャナコントローラがシーケンス制御の中心となっている、そしてネットワーク制御や画像表示や画像処理などは５２０ＣＰＵが中心となりコントロールされ特に５２４ネットワークコントローラを経由して１１２パソコンと接続されている。
【００３３】
また、６００はＡＤＦ（オート・ドキュメント・フィーダ）であり５０２ＡＤＦコントローラによって両面原稿の給紙排紙や表面裏面など原稿ハンドリングの制御がされている。７００は操作パネルでありこれは操作者に対してメッセージを表示すると同時に操作の指示をする為のタッチセンサ入力機能も含むものである、この操作パネルではプレスキャン画像表示も行いスキャン画像の概略を操作者に伝える役目も果たしており、この７００操作パネルを制御しているのが操作パネルコントローラ５０４である。原稿台上の原稿をＲＧＢ各色ごとに５０３露光系コントローラが密着型ＣＣＤラインセンサを駆動し読み取りそして色分解し、点順次のアナログ画像信号に変換する。このアナログ画像信号はＡ／Ｄ変換され８ｂｉｔのデジタル画像信号に変換され輝度で線順次出力される。
【００３４】
次に６００ＡＤＦ（オート・ドキュメント・フィーダー）による原稿の給送について説明する。図６において、矢印▲１▼から▲９▼は原稿が搬送されるパスを示したものである。
【００３５】
まず最初６０１原稿積載トレイに読み取るべき原稿を上向きに置く、次に６０１原稿積載トレイは原稿が給紙されるべく左側に寄せるために図示一点鎖線の如く右上方向に傾く、すると原稿は矢印方向▲１▼に進み６０２半月ローラに到達する。６０２半月ローラと６０３分離ローラの回転により原稿は上側から１ページづつ分離され原稿先頭の第１ページ目が矢印▲２▼方向へと搬送される。この原稿は６０４搬送ローラにくわえ込まれ矢印▲３▼方向へと進行していきやがて６０７全面搬送ベルトによって矢印▲４▼方向へ誘導される。６０７全面搬送ベルトでは原稿を全面で吸着搬送すべく摩擦力が働き原稿をプラテン上所定の位置で正確に停止させることができる。これらＡＤＦ動作のシーケンス制御はすべて５０２ＡＤＦコントローラによって行われている。
【００３６】
所定の位置で停止した原稿は５００スキャナによって５０３露光系コントローラから露光されて原稿が走査され第１ページ目の表面を読み取ることができる。
【００３７】
第１ページ目表面の走査終了後、６０７全面搬送ベルトは逆回転し矢印▲４▼とは反対方向である矢印▲５▼方向へと原稿が移動すべく動作をする。原稿は矢印▲６▼方向へと進行しやがて６０６搬送大ローラの回転搬送力によってローラに巻き付くように矢印▲７▼方向へと進む。
【００３８】
６０８切り替えフラッパーの働きについて説明すると、このフラッパーは原稿を排紙するかまたは原稿を反転させて再度読み取るかいずれかの選択をさせるための搬送方向を切り分ける役目を持っている。図６で図示す方向は原稿を反転させ再度読み取る場合の６０８切り替えフラッパーの位置を示している。この制御によって原稿は矢印▲８▼へと進むことになりやがて６０４搬送ローラにくわえ込まれ前述同様のシーケンスに従い６０７全面搬送ベルトによって所定位置で停止したのち第１面裏面として５００スキャナで読み取られる。
【００３９】
次に、第１ページ目裏面の走査終了後は前述同様に排紙シーケンスが動作し矢印▲５▼→▲６▼→▲７▼と搬送される。６０８切り替えフラッパーを図６図示の位置から黒印を中心に反時計方向に切り替えることにより原稿の搬送方向は矢印▲９▼の方向へと導かれ６０９排紙ローラによって最終的に６０１積載トレイへと戻ってくる。
【００４０】
第２ページ目以降は第１ページ目と同様のシーケンスによって表面から裏面へと順番に原稿が走査され最終ページ裏面が終わると一連の原稿読み取りが終了する。
【００４１】
【発明の効果】
以上述べたようにドキュメント・スキャナシステムにおいて読み取った文書に対してＯＣＲ処理を施して文字テキストとして抽出しオリジナル画像と共にに文書保存をするシステムにおいて、スキャンをして読み取った画像に対して文字検索をさせる場合でも、ＯＣＲ処理を施したテキストだけの検索でなく、他の言語への翻訳（例えば英語から日本語へと翻訳）されたテキストデータも検索することによって、その検索効率や検索漏れなどを防止させることができる。
【図面の簡単な説明】
【図１】実施形態（１）のスキャンドキュメントとそのＯＣＲ処理後のテキスト位置。
【図２】実施形態（１）のブロックにわけられたＯＣＲ文字。
【図３】実施形態（１）のレイヤー作成フローチャー。
【図４】実施形態（１）の検索文字入力による検索手順。
【図５】実施形態（１）のスキャナ装置内部構造。
【図６】実施形態（１）のＡＤＦ（オート・ドキュメント・フィーダ）構造図。

Claims

原稿をスキャンし読み取ったＲａｗ画像データ（ビットマップデータ）にＯＣＲ処理をかけた後、該Ｒａｗ画像データとともにＯＣＲ結果であるテキストファイルを付加して同一原稿として出力されるドキュメントスキャンニング装置において、ＯＣＲ処理したテキストには予め指定された他言語へ翻訳をしたテキストファイルも同時に付加し出力できることを特徴とした検索可能な文書フォーマットでのスキャン装置。
検索可能な文書フォーマットでの文字検索を行う場合、テキストファイル上で文字検索がヒットした時にそのテキスト文字列に該当するＲａｗ画像データ部分をヒット部分として同一座標位置に修飾文字として表示させることができる。さらに文字検索は他言語に翻訳されたテキストファイルでの検索も可能とし翻訳テキストでヒットした場合でも該当するＲａｗ画像データ部分を同一座標軸に修飾文字として表示させることを特徴とした検索可能な文書フォーマットでのスキャン装置。