JP2011513850A

JP2011513850A - スキャンの方法

Info

Publication number: JP2011513850A
Application number: JP2010549149A
Authority: JP
Inventors: スティグニルセン，ラース; メイボム，ヤコブ
Original assignee: ジェイエルホールディングスエーピーエス
Priority date: 2008-03-07
Filing date: 2009-03-05
Publication date: 2011-04-28
Also published as: DK200800356A; MX2010009615A; CN101981569A; US20100315688A1; WO2009109627A1; BRPI0910255A2; US8605297B2; EA201071042A1; EP2260412A1; CA2717378A1; DK176834B1

Abstract

テキストを著作権保護されないコピーから合法的に保護できる、文書（たとえば、新聞または書籍）をスキャンするコンピュータ実施される方法であって、文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも１つの記録をメモリに獲得するステップと、文字認識を実行するために少なくとも１つの記録を処理するステップと、文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと、事前定義の条件に対してストリングを評価することを含む、コンピュータ実施される方法。条件が満足されない場合には、ストリングの少なくとも一部および少なくとも１つの記録の少なくとも一部をメモリからクリアする。条件が満足される場合には、出力を提供すべきかどうかを判定する。

Description

本発明は、テキストを許可されないコピーから合法的に保護できる、印刷された新聞ページまたはテキストの他の形の表示などのテキストを含む文書の光学スキャンによって獲得されるディジタル・イメージまたはディジタル記録のコンピュータ実施される処理に関する。

ＥＵ諸国での著作権法の調和に関する２００１年５月２２日の欧州議会およびＥＵ理事会の指令２００１／２９／ＥＣは、コピーおよびスキャンに関するルールを示す。同等の米国制定法が、ディジタル・ミレニアム著作権法（ＤＭＣＡ）である。

スキャンおよびコピーは、従来のスキャナによって実行することができるが、著作権保護された文書の従来のスキャンは、著作権法に違反するので、この問題に対する解決策の必要がある。

ＥＵＣｏｐｙｒｉｇｈｔＤｉｒｅｃｔｉｖｅＡｒｔｉｃｌｅ２は、最も基本的な「コピー」権を提供する。これは、作品の「直接または間接の、一時的または永久的な」コピーの複製に対する排他的権利を、実演者、レコード制作者、映画制作者、放送機関、および著作者に与える。ＥＵＣｏｐｙｒｉｇｈｔＤｉｒｅｃｔｉｖｅのＡｒｔｉｃｌｅ５は、Ａｒｔｉｃｌｅ２で提供される権利に適用できる制限および例外を示す。Ａｒｔｉｃｌｅ５（１）での複写権に対する必須の例外は、仲介者によるネットワーク伝送の「本質的かつ一体の」部分である「過渡的かつ偶発的な」複写を提供し、あるいは、「独立の経済的重要性」を有しない作品の合法的使用を許可する。

この例外は、権利者が、ディジタル・テクノロジを介する作品へのすべてのアクセスを制御することをも防ぎ、このディジタル・テクノロジは、まさにその設計によって、作品がＤＶＤなどの媒体から処理のためにプレイヤのメモリに転送され、その後にディスプレイまたはスピーカに転送されるときに、作品の一時的「コピー」を作る。

新聞、雑誌、業界誌、科学雑誌、および他の定期刊行物などの著作権保護された刊行物の監視は、組織的に、たとえば重要な記事または他のテキスト・セクションを識別することによってクライアントのために働く媒体監視業の会社によって、実行される。監視は、クライアントの会社および個人が、どれほどしばしばおよびどの程度まで彼らがニュース・メディアで言及されているのかを追跡するのを助けるために実行される。

従来、監視は、たとえば新聞を手作業で読むことに基づく。新聞が、たとえば媒体監視会社で受け取られるときに、新聞は、適任の人間の読み手に渡され、この読み手は、関連する記事、たとえば彼らのクライアントに言及する記事を探して新聞を速読する。読み手は、会社名、個人の名前、および／またはある主題、トピック、もしくはテーマを表す他のキーワードなどの単語を探して、記事のどれが関連記事であるのかを判定する。

読み手は、新聞のページでキーワードを見つけたときに、そのキーワードをマークする。ページ全体を読み終え、すべてのキーワードをマークし終えたときに、読み手は、キーワードごとの評価を実行して、記事がクライアントに関連するかどうかを判定する。記事が関連することがわかった場合には、読み手またはアシスタントは、クライアントのために記事（１つまたは複数）を物理的に切り抜き、クライアントに送る。

このプロセスの時間のかかる部分は、キーワードを見つけることに費やされる時間である。左上角から始めて右下角で終わる、１ページあたりの読む時間は、ページ上のキーワードの個数に対してかなり不変である。これは、新聞に少数の関連記事だけがある場合に、切り抜きあたりの長い時間消費をもたらす。したがって、読むことに費やされるこの時間のほとんどは、非効率的である。

ある程度までは、新聞全体をページごとにスキャンし、ファイル・システムまたはデータ・ベースでの格納のために電子バージョンをたとえばＪＰＧフォーマット、ＴＩＦＦフォーマット、またはＰＤＦフォーマットで格納するために新聞ページのディジタル・イメージを作る従来のスキャナによって、このプロセスの自動化が可能である。その後、各ファイルが、ファイルを作るために光学文字認識のために取り出され、ここでは、認識された文字が、それぞれ、ある符号化方式（たとえば、ＡＳＣＩＩ）に従って表される。これらのファイルも、ファイル・システムまたはデータ・ベースに格納される。さらに、いわゆる検索エンジンが、キーワードのセットと共にロードされ、検索エンジンは、切り抜きリストの形で出力を提供するために、文字および文字のシーケンスが符号化されたファイルを取り出す。切り抜きリストは、新聞から記事を切り抜く人に、彼を物理的な新聞のページに向ける情報すなわち、切り抜かれるべき記事のタイトルおよびそのおおよそのロケーションを規定する情報を与える。この自動化プロセスは、手動プロセスよりも生産性を良好に向上させる。

しかし、ディジタル・イメージは、オリジナル材料の電子コピーを表すので、このプロセスは、多くの制定法の下で著作者の著作権の侵害と考えられる。ある制定法の下では、スキャンされたイメージを表示画面に示すことさえ、著作者の著作権を侵害する行為とみなされる。ディジタル・イメージは、テキストについて直接に検索可能であるのではなく、光学文字認識すなわちＯＣＲによるコーディングされたディジタル形式への変換を必要とする。しかし、この変換からの出力すなわちコーディングされたディジタル形式も、著作権の侵害と考えられる。

いくつかの国では、電子コピーが「過渡的かつ偶発的」であり、検索プロセスまたは要約記述の「本質的かつ一体」の部分である場合には、これは著作者の著作権の侵害ではないと考えられる場合がある。

テキスト媒体を手作業で読むことによる媒体監視の伝統的プロセスが自動化される場合には、テキスト媒体のコピーが行われる。テキスト媒体のコピーの作成は、著作権法に関して問題である。したがって、著作権法は、媒体監視の自動化にとって障害となり得る。したがって、テキスト媒体の監視の自動化および著作権法違反の防止は、解決されなければならないままになっている問題である。したがって、テキスト媒体（たとえば、新聞、書籍）の監視の自動化の問題および著作権法違反の防止の問題を解決する技術的解決策の必要がある。

従来技術
米国特許第６９０４１８３Ｂ２号に、検出器と、検出器に入射する放射を制限するために適合された視野を有するレンズとを有する電子カメラを含む電子イメージ取込装置が開示されている。アクチュエータが、文書にまたがってカメラおよびその視野を移動するために設けられ、コントローラが、文書の異なる区域に対応するオーバーラップするサブイメージのセットを獲得するために設けられる。処理手段が、文書のうちでサブイメージのセットによってカバーされる部分の混成イメージを形成するために設けられる。それぞれのサブイメージに現れる文字に対応する文字のデータ・セットをそれぞれが含むサブイメージのセットが作られる。サブイメージのそれぞれの内容が、空白テキスト文書に縫い合わされて、スキャンされた文書のテキスト内容を含む完全な混成テキスト文書が作られる。サブイメージは、縫い合わせの前に、まず、光学文字認識（ＯＣＲ）ルーチンに通され、したがって、縫い合わせは、文字レベルで実行される。そのようなスキャナは、いわゆるフラットベッド・スキャナより少ない机のスペースを占有するという利益を有する可能性がある。

上の特許出願は、文書のテキスト・スキャンの自動化の問題を解決する。しかし、著作権法に関して、これは、上の特許出願または他の特許出願のどれもが対処せず、解決しない問題ではない。というのは、上の特許出願で、文書がディジタル形式で複製されるからである。コピーは、著作権法に対する侵害なので、この問題は、文書スキャンが新聞または書籍などの印刷されたテキスト媒体に対して行われるときまたはスキャンがｅブックなどの電子的に表示されるテキスト文書に対して行われるときに、解決される必要がある。

米国特許第６９０４１８３Ｂ２号

したがって、著作権法に違反しないニュース・メディアの監視の自動化という問題は、従来技術では解決されていない。

−文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも１つの記録をメモリに獲得するステップと、
−文字認識を実行するために少なくとも１つの記録を処理するステップと、
−文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと
を含む、文書をスキャンするコンピュータ実施される方法であって、
−事前定義の条件に対してストリングを評価することと、
−条件が満足されない場合に、ストリングの少なくとも一部および少なくとも１つの記録の少なくとも一部をメモリからクリアすることと、
−条件が満足される場合に、出力を提供すべきかどうかを判定することと
を特徴とするコンピュータ実施される方法を開示する。

著作権法違反を避けるためには、テキストをディジタル形式で複製しまたは他の形でコピーしてはならない。この問題に対する解決策は、入手することが望まれる情報を抽出し、残りをフィルタリングによって除去するために、文書の内容をフィルタリングすることである。

内容のフィルタリングを実行するためには、フィルタ・プロパティを定義しなければならない。フィルタ・プロパティを、事前定義の条件によって定義することができる。事前定義の条件は、たとえば、キーワードの認識、文字のストリングの最大長などとすることができる。キーワードの認識がフィルタ・プロパティである場合には、これに従って、キーワードだけがフィルタを通過し、文書内の情報の残りは、置き去りにされる。文書の内容をフィルタリングすることによって、文書の完全なコピーは作られず、所望の情報だけが文書から抽出される。所望の情報は、文書内のすべての情報より少ない情報とすることができ、その結果、文書の内容の一部だけが抽出されるようになり、したがって、文書の大多数は、好ましくは絶対に出力として提供されない。

実際には、フィルタがキーワードを認識するときに、そのキーワードおよびそのキーワードの文書内の位置を格納することができる。キーワードおよびその位置が格納されるや否や、そのキーワードを含む記録、たとえばイメージを削除することができる。というのは、そのキーワードに関して必要とされる情報のすべてが登録されているからである。この形で、文書のコピーは全く生成されなくなる。というのは、スキャンが、フィルタリング・プロセスに関係し、コピー作成には関係しないからである。

この方法によるスキャンを、ピープホール・スキャンと表す場合がある。ピープホール・スキャンは、イメージ・フィールドをシフトされた位置に移動することと、カメラを用いて記録を獲得することとによって実行することができる。しかし、ピープホールを、より多数のカメラを文書ページの上に取り付けることと、これらのカメラを順番に使用することによって記録を獲得することとによって実行することもできる。さらに、ピープホール・スキャンを、たとえば、文書を表示する画面のビデオ記録または他の形の直列化された文書表現によって実行することもできる。

さらに、文書の情報のうちで関連する片すなわちキーワードを見つけるために、ピープホール・スキャナが電子入力の内容ベースの評価を実行することが有利である。ピープホール・スキャナは、内容のフィルタリングを実行し、ここで、内容は、文書のフラグメントの形である。

文字のストリングが評価され、たとえば出力が作られるときに、ストリングの一部および記録が、文書のコピーまたは文書の諸部分のコピーがスキャン中に作成されることを阻むために、メモリからクリアされる。

フィルタリング・プロセスは、当初にスキャン中に実行され、したがって、ピープホール・スキャナは、単語ごとのレベルで検索プロセスを行って、文書のコピーが作られるのを避け、著作権法に違反するのを避ける。

したがって、文書のスキャンを実行する、コンピュータならびに関連する装置、機器、および／または機械類のハードウェアまたはソフトウェアは、著作権法に関して法律的に正しい形で機能するように調整される。文書の内容に関して示す情報のいずれもがメモリからクリアされない場合には、著作権法に違反する。逆に、文書の内容に関して示す情報全体がクリアされる場合には、テキスト媒体の監視に関して使用可能な情報はない。本発明は、何もクリアしないこととすべてをクリアすることとの間にある、上で説明した方法を提供する。本発明は、テキスト媒体の自動監視を実行することを可能にすると同時に、著作権法の違反を避ける。

したがって、本発明は、上で説明したコンピュータ実施されるスキャン方法によって、テキスト媒体の監視のプロセスを自動化するという問題を解決し、本発明は、文書の内容に関して示す情報の一部をメモリからクリアし、その結果、文書の完全なコピーがメモリ内に絶対に存在しないようにすることによって、著作権法違反を避けるという問題を解決する。

上で述べた利益のほかに、本発明は、高速で信頼できる、人間によって実行される手作業の仕事のコストを減らす、人間が実行する可能性がある誤りおよび不規則を減らす、その他など、自動化の既知の技術的効果および利益を含む。

さらに、文書のスキャン中にデータが継続的かつ規則的にメモリからクリアされ、削除されるので、従来技術と比較して、メモリまたはデータ・メモリに関する記憶容量があまり必要でない可能性があることが、有利である。

文字は、アルファベットの字、漢字、数字、句読点、およびすべての世界中の書記体系のすべての個々の記号など、字、記号、符号、および／または書記素とすることができる。

一実施形態では、事前定義の条件は、文字のストリングが事前定義のキーワードのうちの１つに現れることを含む。この実施形態の利益は、キーワード全体が文字のストリング内で見つかる場合またはキーワードの一部が文字のストリング内で見つかる場合のいずれかに、この情報が即座にクリアされるのではなく、出力を提供すべきかどうかが判定されることである。したがって、この場合には、所望の情報を、キーワード全体またはキーワードの一部とすることができる。スキャンされる文書内のキーワードの表示がない場合には、内容は格納されない。しかし、キーワードがあることの表示がある場合には、文字のストリングは、即座にクリアされるのではなく、所望の情報を含むかどうかを判定するために検討される。

一実施形態では、事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む。この実施形態の利益は、評価された文字の個数が事前定義の上限またはしきい値を超える場合に、文字認識プロセスが停止することを保証することである。多すぎる文字が評価される場合には、著作権法に違反する可能性があるが、この実施形態は、これが起きないことを保証する。

一実施形態では、事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む。この実施形態の利益は、文字フォント・サイズが最大の事前定義のフォント・サイズより大きい場合に、大きい文字のスキャンを避けるために文字認識プロセスが停止することであり、この大きい文字のスキャンは、そうでなければ非常に時間のかかる非効率的な作業になる可能性がある。

一実施形態では、出力を提供すべきかどうかの判定は、文字のストリングが事前定義のキーワードと一致するかどうかに基づく。この実施形態の利益は、出力を提供すべきかどうかの判定が、キーワード一致があることに依存することである。出力は、その一致の間、文字のストリングの一部がキーワードと一致するとき、または文字のストリングが完全なキーワードを形成するときのいずれかに提供することができる。

一実施形態では、出力は、条件に対して陽性に評価されたストリングに寄与する内容を含む少なくとも１つの記録を含む文書内のロケーションへの参照である。この実施形態の利益は、出力が、文書内のキーワードの位置／ロケーション／区域の参照として作られ、したがって、後に、記録およびキーワードがメモリからクリアされたときに、その出力を見つけることができ、したがって、キーワード・ロケーションに関する情報を含む記録のロケーションへの参照が与えられることである。位置判定と共に記録を獲得することが有利であり、この位置判定は、後に、記録への参照を与えることをより簡単にする。

一実施形態では、ストリングが一致するキーワードは、文書テンプレート内で、スキャンの対象である文書内の対応する単語のロケーションを表すロケーションに配置される。この実施形態の利益は、キーワードをその後に配置でき、その後に切り抜き、リスト生成、要約記述などでの使用のために文書テンプレート上で再び見つけることができることである。文書テンプレートは、文書のコピーを作らずにオリジナル文書内のキーワードの物理的ロケーションの概要を与えるように働く。キーワード以外のすべての単語を、たとえば、文書テンプレート内で灰色の区域によって表すことができる。キーワードのフォント・サイズおよびたとえばグレイスケール色をも文書テンプレート内で示すことができ、その結果、キーワードが見出し、本文などに配置されているかどうかを判定することが可能になる。

一実施形態では、見つかったキーワードの文書内の位置および／または長さに関する情報は、生成され、格納される。この実施形態の利益は、文書内のキーワード（１つまたは複数）の位置を、後で見つけることができ、この情報を使用して、互いに対する相対的なキーワードの位置を比較して、キーワードが互いの近くに配置されているかどうかを判定できることである。キーワードは、他のキーワードと組み合わされたときに特殊な意味を有する場合があり、互いに対する相対的なキーワードのロケーションは、クライアントにとって重要な情報を含む可能性がある。

キーワードの位置に関する情報は、
−キーワードの座標によって、
−キーワードがある行の位置によって、
−キーワードがある文書内の単語数によって、
−印刷記号によって（印刷記号は、終止符、コンマ、および類似物を含む）、
−キーワードがある文書内の文の個数によって、
−キーワードがあるセクション／段落の個数によって、
など、さまざまな手段によって識別することができる。

一実施形態では、出力は、事前定義の条件を満足する文字のストリングを表すコードを含む。この実施形態の利益は、キーワードと一致する文字のストリングの出力を、文字、記号、参照番号、キーワードのリストへのインデックスその他など、任意の適切なコードによって表すことができることである。

一実施形態では、出力は、事前定義のキーワード・リスト内の事前定義のキーワードの中からの１つへの参照を含む。

一実施形態では、出力は、事前定義のキーワードの中からの１つを含む。

一実施形態では、出力は、事前定義のキーワードの中からの１つと、スキャンの対象である文書内の対応する単語のロケーションを表すロケーションへの参照とを含む。

一実施形態では、文字のストリングは、出力が提供されるときにクリアされる。この実施形態の利益は、文字のストリングの内容が出力されるときに、その内容がメモリからクリアされ、この形で、文書のコピーが作られないことである。必要とされる文字のストリングに関する重要な情報のすべてが、この出力によって与えられる。

一実施形態では、この方法は、選択された記録を一緒に合成記録に縫い合わせることを含む。この実施形態の利益は、選択された記録をより大きい記録またはイメージに縫い合わせることが可能であることである。これが有利であるのは、スキャンが文字の多数の異なるフォント・サイズすなわち、見出しのより大きい文字フォント・サイズおよび本文、キャプションなどのより小さいフォント・サイズを含む新聞について実行される場合に、フィールド・サイズが、時々、文字のフォント・サイズよりはるかに小さい（小さい記録またはイメージ・サイズ）からである。また、フィールド寸法が、たとえば文字認識される最小文字のフォント・サイズの５倍未満であることが好ましい場合があるので、より大きい文字は、しばしば、複数の記録にまたがって延び、したがって、選択された記録を一緒に縫い合わせることが必要である。文書ページ上の文字のフォント・サイズは、たとえばオペレータによるキー入力または類似物によるなど、入力としてピープホール・スキャナに提供することができる。

一実施形態では、合成記録は、複数の選択された記録にまたがって延びる文字の認識を実行するために処理される。この実施形態の利益は、記録を一緒に縫い合わせた後に、合成記録が完全な文字のイメージまたはレコードを提供するので、複数の選択された記録にまたがって延びる文字の文字認識を実行できることである。

一実施形態では、選択された記録を一緒に合成記録に縫い合わせるステップは、文字を認識するための少なくとも１つの記録の処理が文字の認識をもたらさなかったときに実行される。この実施形態の利益は、少なくとも１つの記録の処理から文字を認識することが可能ではないときに、合成記録の縫い合わせおよび処理が実行されることである。この形では、文字が複数の記録にまたがって延びる場合であっても、それらの文字を判定することができる。

一実施形態では、事前定義の条件は、縫い合わされた合成記録が、事前定義の個数の記録が縫い合わされたときに文字の認識をもたらすかどうかを含む。この実施形態の利益は、合成記録が文字に似ていない場合に、注意が払われ、処理を継続できないことである。その場合に、合成記録は、絵の一部である可能性が高い。事前に定義された個数の縫い合わされた合成記録は、スキャナが文字を検索中であることに起因して、絵全体が、故意でなく処理されることがないことを保証することができる。この方法によって、適切な事前定義の最大個数の縫い合わされた記録が選択されることによって、著作権法に違反しないことが保証される。この実施形態のさらなる利益は、記録の個数の上限またはしきい値に達する前に注意が払われることを保証することである。スキャンを停止する前に多すぎる記録が評価される場合には、著作権法に違反する可能性があるが、この実施形態は、これが起きないことを保証する。

一実施形態では、事前定義の条件は、同一の色が隣接する記録に現れることを含む。この実施形態の利益は、隣接する記録すなわち互いに隣り合う記録が、同一の色を含む場合に、これらの記録が絵ではなく文字の記録である可能性が高いことである。その一方で、隣接する記録が同一の色を含まない場合には、これらの記録が絵、写真、線描、または類似物である可能性が高い。絵のスキャンを避けるために、文書のこの部分のスキャンは、クリアされる。

一実施形態では、合成記録は、事前定義の条件が満足されるときにクリアされる。この実施形態の利益は、ある条件が満足されるとき、出力が作られ、文書からのすべての所望の情報が入手されたときなどに、記録の縫い合わせをクリアできることである。この形で、文書のコピーを作ることが回避され、著作権法違反が回避される。

一実施形態では、フィールドは、連続するテキストすなわち切れ目のないテキスト内で互いの隣に配置された１１個の単語という寸法を有するように構成される。代替案では、フィールドは、連続するテキスト内で互いの隣の５個の単語、連続するテキスト内で互いの隣の１５個の単語、連続するテキスト内で互いの隣の２０個の単語、連続するテキスト内で互いの隣の２５個の単語、または類似物の寸法を有するように構成される。フィールドが、連続するテキスト内で互いの隣に配置された１１個の単語を含む場合に、そのフィールドは、書籍の１ページの幅またはＡ４文書のサイズの文書の幅をカバーする可能性があり、フィールドの高さは、フォントのサイズである可能性がある。新聞のページなどの複数列ページをスキャンする場合に、各列の行は、連続するテキスト内で互いの隣の１１個未満の単語を含む場合があり、したがって、複数列ページの幅も、連続するテキスト内で互いの隣の１１個未満の単語を含む可能性がある。複数列ページの幅は、１１個を超える単語を含む場合があるが、この１１個の単語は、連続するテキスト内で互いに隣り合わない可能性がある。したがって、一実施形態では、フィールドは、文書の幅および文字のフォント・サイズの高さに対応する寸法を有するように構成される。

一実施形態では、フィールドは、文字認識の対象になる最小文字のサイズの５倍未満の寸法を有するように構成される。代替案では、フィールドは、
−１０ｍｍ、２０ｍｍ、３０ｍｍ、または類似物の寸法を有するように、
−文書ページあたりのフィールドの所定の個数、たとえば１００個または２００個に対応して、
−最大の文字フォント・サイズに対して相対的に、
−最小の文字フォント・サイズに対して相対的に、
−文書ページ・サイズに対して相対的に
など、定義された寸法を有するように構成される。

この実施形態の利益は、多すぎる文字が１つの記録内でスキャンされないことを保証することである。というのは、これが、多すぎるテキストがスキャンされることをもたらし、したがって、故意ではなく著作権法に違反し得ることをもたらし得るからである。フィールドが、たとえば最小文字のフォント・サイズの５倍未満の寸法を有することを保証することによって、故意ではなく一時に多すぎる文字をスキャンすることが可能ではなくなる。

フィールドの寸法を、最小文字のフォント・サイズの４倍未満にすることができ、あるいは、最小文字のフォント・サイズの６倍未満にすることができることも、可能である。

一実施形態では、少なくとも２つの記録は、同時に獲得される。この実施形態の利益は、たとえば同時に垂直により多くの記録を獲得することによって、スキャン・プロセスが、かなりより高速になり得ることである。それと同時に、著作権法に対する侵害になり得る多すぎるテキストの記録の危険性は、存在しない。というのは、垂直により多くの記録を獲得することによって、文書ページ上で水平に記述された単語および文が、同時には記録されないからである。各記録は、光学文字認識を実行するために記録が処理され終え、現れるすべてのキーワードが認識され、または別の条件が満足されたときに、最終的にクリアされ、したがって、文書のコピーは作られない。

さらに、いくつかの言語およびいくつかの国では、読むことが、左から右ではなくページ上で右から左へ、および／または水平ではなく垂直に、および／またはページの最上部からページの最下部ではなくページの最下部からページの最上部へなどで行われる可能性がある。したがって、スキャンを、左から右ではなくページ上で右から左へ、および／または水平ではなく垂直に、および／またはページの最上部からページの最下部ではなくページの最下部からページの最上部へなどで実行することもできる。

いくつかの実施形態では、スキャンされる文書上のテキストの処理が、機械翻訳（ＭＴ）を含む場合があり、この機械翻訳は、コンピュータ・ソフトウェアが、テキストをある言語から別の言語へ翻訳するのに使用される計算言語学の一分野である。基本的に、機械翻訳は、ある言語の単語の、別の言語の単語への単純な置換を実行する。機械翻訳は、ルールベースの機械翻訳、例ベースの機械翻訳、統計的機械翻訳（ＳＭＴ）などとすることができる。

いくつかの実施形態では、スキャンされる文書上のテキストの処理が、言い換え（ｒｅｗｏｒｄｉｎｇｏｒｒｅｐｈｒａｓｉｎｇ）を含むことができる、すなわち、テキストの単語または文をオリジナルの単語または文と同一の意味を有する同一言語の異なる単語または文に言い換える（ｒｅｗｏｒｄｅｄｏｒｒｅｐｈｒａｓｅｄ）ことができる。本発明による方法を使用するときに、たとえば、３つの単語がスキャンされ、メモリに格納され、その後、処理される。この３つの単語の意味（ｍｅａｎｉｎｇｏｒｓｅｎｓｅ）が、ソフトウェア・プログラムによって生成され、３つのオリジナル単語の１つまたは複数の同義単語または同義文が生成される。これによって、オリジナルと同一の意味（ｍｅａｎｉｎｇｏｒｓｅｎｓｅ）を有するが著作権法に違反しない、オリジナルの単語、文、またはテキストの同等の単語、文、またはテキストが生成される。３つより多数または少数の単語を、オリジナルのテキストまたはテキストの一部の言い換え（ｒｅｗｏｒｄｉｎｇｏｒｒｅｐｈｒａｓｉｎｇ）のために処理することができることを理解されたい。

ピープホール・スキャン・プロセスのいくつかの実施形態では、スキャンされる文書は、スキャンの前に、ある種のカバリングによって第１区域で部分的に隠されるかカバーされ、カバーされた文書がスキャンされ終え、内容およびイメージが処理され、削除されたときに、その文書は、スキャンの前に、ある種のカバリングによって今度は反対の第２区域で、やはり部分的に隠されるかカバーされる。

スキャンを、スキャンされる文書を部分的にカバーし、その後、反対の区域で文書を部分的にカバーすることによって実行できることは、有利である。というのは、これが、スキャンを高速に効率的に実行できることをもたらすからである。

本発明は、上および次で説明する方法ならびに、それぞれが最初に述べられた態様に関連して説明される利益および長所のうちの１つまたは複数をもたらし、それぞれが最初に述べられた態様および／または添付の特許請求の範囲で開示される態様に関連して説明される実施形態に対応する１つまたは複数の実施形態を有する、対応する方法、デバイス、使用、および／または生産手段に関する。

具体的に言うと、本明細書では、コンピュータ上で実行されるときに上の実施形態のいずれかに記載の方法を実施するプログラムを符号化されたコンピュータ可読媒体が開示される。

さらなる態様は、スキャン・デバイスと、プログラムがコンピュータ上で実行されるときに上の実施形態のいずれかに記載の方法を実施するプログラムをロードされたコンピュータとを含むシステムである。

さらなる態様は、
−文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも１つの記録を獲得するスキャン・ヘッドと、
−記録内の文字を認識するように適合されたプロセッサと、
−少なくとも１つの記録を格納し、認識された文字を格納するデータ・メモリと、
−実施形態のいずれかに記載の方法を実行するためにプロセッサ上の実行可能プログラム命令のセットを格納するプログラム・メモリと
を含む文書スキャナである。

実施形態の詳細な説明を、図面を参照して下で与える。

スキャン方法を示す流れ図である。ピープホール・スキャナの全体的処理を示す図である。ピープホール・スキャン・プロセスの例を示す図である。読取りヘッド移動をかぶせられた新聞紙のセクションを示す図である。ピープホール・スキャン・プロセスの例を示す図である。

本発明のディジタル・スキャナは、文書のディジタル・コピーを作成せずに文書をスキャンする。スキャン動作のどの所与のときにも、いわゆるピープホール・スキャナは、少数の単語または単語の部分がクリアされるか上書きされる前に、その単語が事前定義の単語リスト内の単語に対応しない場合に、そのメモリ内にその単語または単語の部分のみを含むことができる。このスキャンおよび検索方法によって、ユーザは、それぞれの著作者の著作権を侵害しないはずである。

図１に、スキャン方法の流れ図を示す。スキャンは、記録の位置をシフトすること１０１によって、たとえば、文書、たとえば新聞の表面にまたがって順次の形で移動するスキャナによって実行することができ、各ステップについて、スキャナは、文書のフィールド内の記録、たとえばイメージを獲得する１０２。フィールドは、好ましくは小さく、フィールドのサイズは、さまざまな形で定義することができる。
−文字認識の対象である最小文字のフォント・サイズの５倍未満の寸法を有するようにフィールドを構成することができ、
−１０ｍｍの寸法を有するようにフィールドを構成することができ、
−文書ページあたりの所定の個数の記録またはイメージのフィールドに対応する寸法を有するようにフィールドを構成することができ、
−最大文字フォント・サイズに対する相対的な寸法を有するようにフィールドを構成することができ、
−最小文字フォント・サイズに対する相対的な寸法を有するようにフィールドを構成することができ、
−文書ページ・サイズに対する相対的な寸法を有するようにフィールドを構成することができる。

上で述べたように、ピープホール・スキャンは、イメージ・フィールドをシフトされた位置に移動することと、カメラを用いて記録を獲得することとによって実行することができる。

代替案では、ピープホールを、文書ページの上により多数のカメラを取り付け、これらのカメラを順番に使用することによって記録を獲得することによって実行することもできる。たとえば、１００台のカメラを、正方形の文書の上に取り付けることができ、右上角の第１のカメラは、第１の記録を獲得することができ、第１のカメラの隣の第２のカメラは、第２の記録を獲得することができ、文書全体がスキャンされるまで、以下同様である。

ピープホール・スキャンを、たとえば電子ブックすなわちｅブックなどの電子文書を表示する画面のビデオ記録によって実行することもできる。画面上の文書は、固定されたピープホール・スキャナ、たとえばビデオ・カメラの前で文書を画面上で上下にスクロールすることによって、または画面を横切ってピープホール・スキャナを移動することによってのいずれかで記録することができる。すべての場合において、スキャンは、水平にまたは垂直になど、実行することができる。さらに、ビデオ・スキャンを、ビデオ・グラフィックス・アレイ（ＶＧＡ）モニタ信号または類似物などのコンピュータからのモニタ出力を使用することによって実行することができる。モニタ信号は、モニタに表示される電子文書を直列化されて搬送する。ピープホール・スキャナは、直列化されたモニタ信号から、ピープホール・ウィンドウ、たとえばそれぞれ４０個の連続する走査線内の４０個の画素を抽出することができ、これによって、ピープホール・ウィンドウに対応する絵を、モニタ信号から取り出すことができる。その後、ピープホール・ウィンドウを、上もしくは下にまたは左もしくは右にまたは斜めなどに移動することができ、新しいピープホール・ウィンドウを、ピープホール・スキャナによってスキャンすることができる。各スキャンでは、ピープホール・ウィンドウに対応する絵がとられる。その後、記録されたデータを、コンピュータ内で文字認識によって変換し、上で説明したように処理することができる。

スキャンプロセスの各ステップの後に、ピープホール・スキャナは、文書の表面のセグメントの小さい記録、たとえばイメージを含む１０３。記録は、グレイスケール、白黒すなわち２進、またはカラーのいずれかとすることができる。各記録セグメントまたはイメージセグメントは、光学文字認識（ＯＣＲ）によって分析されて、文字、文字の一部、絵の一部、空白フィールド、またはその組合せを含むかどうかが判定される１０４。

記録セグメントが文字を含む場合には、それを登録し、いわゆるワードビルダ（Ｗｏｒｄｂｕｉｌｄｅｒ）に転送する１０５、下を参照されたい。記録セグメントが文字の一部を含み、その文字がこれによって認識はされない場合には、次の記録を行い１０６、ＯＣＲを待って、記録セグメントを一緒に解いて文字を形成できるかどうかを判定し、ここで形成された文字は、ワードビルダに転送することができる。

記録セグメントが絵または絵の一部を含む場合には、著作権保護された絵、写真などのコピーを作るのを避けるために、絵の一部をクリアすることができる。記録セグメントの残りは、それを後続の記録セグメント（１つまたは複数）と一緒に解いて文字を形成できるかどうかを判定するのに使用される。

連続プロセスで、ワードビルダは、スキャンされた文字を収集し、意味のある単語を形成することを試みる。これらの潜在的な単語は、認識について、事前定義の条件、たとえばキーワード・リストに対してテストされる１０７。単語が認識される場合には、ヒットが作られ、記録され、出力を行う１０９べきかどうかが判断され１０８、その後、より多くの記録を行うことができる。文字のストリングが事前定義の条件と一致しない場合には、文字のストリングの少なくとも一部および少なくとも１つの記録の少なくとも一部をメモリからクリアする１１０。

文字のストリングがキーワードを満足するかどうかをテストするときには、文字の完全なストリングが検査され、文字のストリングが、たとえばハイフンによって２行にまたがって広がる単語を形成するときにも、文字の完全なストリングが検査される。したがって、ピープホール・スキャナは、ハイフンが現在の行の最後の文字記号として現れる場合には、次の行のスキャンを継続する。

ピープホール・スキャナは、従来のスキャナのように機能することができる。従来のスキャナは、イメージ・フィールドをセットし、イメージを撮影し、イメージをメモリに格納することによって機能する。さらに、従来のスキャナは、ＯＣＲのタスクおよび検索エンジン（ＳＥ）処理（キーワード・マッチング）のタスクを実行することができる。従来のスキャナがこれらのステップを実行するときには、獲得された情報が格納され、これによって、スキャンされた文書のコピーが作られる。スキャナは、フラットベッド・スキャナ、ローラー・スキャナ、フィーダー・スキャナ、または類似物とすることができる。

ピープホール・スキャナは、これらと同一の３つのタスクすなわち、スキャン、文字認識、およびキーワード・マッチングを実行することができる。しかし、ピープホール・スキャナは、１つの連続動作で、文書のコピーを全く作成せずに、これらのタスクを実行する。従来のスキャナは、通常、文書全体のイメージを同時に獲得するが、ピープホール・スキャナは、一時に文書の区切られた区域のイメージだけを獲得する。

図２に、ピープホール・スキャナの全体的処理を示すが、図１は、その詳細なプロセスを示す。ピープホール・スキャナは、図１に示されているように、文書を「読み取り」３０１、光学文字認識（ＯＣＲ）を実行し３０２、単語一致を検索する３０３。結果の出力は、スキャンされた文書が含むキーワードのある種の表示である。この表示を、切り抜きリストの作成、キーワード・リストの作成、要約記述を可能にするためなど３０４、さまざまな目的に使用することができる。

ピープホール・スキャナは、ハードウェア・コンポーネント、ファームウェア・コンポーネント、およびソフトウェア・コンポーネントを組み合わせることができる。

図３に、ピープホール・スキャン・プロセスの例を示すが、この例は、全体的に、図１と同様に機能する。図３ａ）では、文書ページ４０１が、スキャナ４０２の下に置かれる。スキャナの読取りヘッド４０３が、トラック（１つまたは複数）４０５上に配置され、トラック（１つまたは複数）４０５は、文書の表面全体にわたって移動するために、グライダ（１つまたは複数）４０６上で移動することができる。読取りヘッド４０３は、フラット・ケーブル、ＵＳＢ接続、赤外線通信、または類似物によって、読取りヘッド移動コントローラ４０８およびスキャン・シーケンサ（ＳＳ）４０７（図３ｂ）を参照されたい）に接続される。一例では、読取りヘッドは、８ビット・グレイスケール分解能を有する１００×１００画素のＣＣＤアレイである。したがって、ピープホールは、１ｃｍ×１ｃｍに対応する物理的ウィンドウ・フィールド内に１００００個の画素を含み、これは、タブロイド・ページ・サイズの１／１０００と等しい。

読取りヘッドの一例にここで言及するが、読取りヘッドが任意の仕様を有することができることを理解されたい。

図３ｂでは、スキャン・シーケンサ（ＳＳ）４０７が、読取りヘッド移動４０８を制御する。一般に、読取りヘッドの移動は、戻りサイクルを伴って左から右へである。光学文字認識（ＯＣＲ）４０９およびジグソーＯＣＲ４１０（下を参照されたい）の結果が、水平に左、垂直に下、または斜めに上など、別の形で読取りヘッドを移動する要求についてステージをセットする場合には、このシーケンスを変更することができる。

読取りヘッド移動４０８を、イメージ獲得デバイスの標準規格であるＴＷＡＩＮインターフェースによって制御することができる。ＴＷＡＩＮインターフェースは、スキャナ読取りヘッドの位置すなわち、読取りヘッドのｘ，ｙ座標と、座標の増分すなわちΔｘ，Δｙなどを制御することができる。

ＯＣＲ４０９は、一連のタスクを実行する。ＯＣＲ４０９は、ピープホール・フィールドの内側区域を検索して、１つまたは複数の完全な文字を突き止めることができ、その後、境界を検索して、文字の部分を形成できる形状を突き止めることができる。ＯＣＲ４０９は、垂直境界線および水平境界線の片を探す。ＯＣＲ４０９は、行間隔を探すことができ、アラインメントを評価する。ＯＣＲ４０９は、連続する符号および列分離間隔を探すことができる。ＯＣＲ４０９は、より大きい文字の一部である可能性があるモノグレイトーン（ｍｏｎｏ−ｇｒｅｙ−ｔｏｎｅ）形状を探すことができる。ＯＣＲ４０９は、絵の一部である可能性がある変化するグレイトーンを有する区域を探すことができる。認識された文字は、たとえばそのフォント・サイズおよび文書内の位置と共に、ワードビルダ４１１に転送される。

ＯＣＲタスクの例にここで言及するが、ＯＣＲスキャンを任意の適切な形で実行できることを理解されたい。

ジグソーＯＣＲ４１０は、隣接するピープホール・イメージまたは記録を組み合わせて、ウィンドウ、たとえば２個、４個、９個、または１６個のピープホール・イメージを形成し、このウィンドウは、その後、反復プロセスでＯＣＲにかけられる。ジグソーＯＣＲ４１０は、スキャン・シーケンサ４０７と相互作用し、文字の完全なイメージを作るためにそれが必要とする隣接するピープホールを要求する。８つまでの隣接スキャンと組み合わされた各スキャンが、文字または文字の一部、線、および絵の認識のために分析される。

ワードビルダ４１１は、ＯＣＲ４０９およびジグソーＯＣＲ４１０から文字を１つずつ、たとえばそのフォント・サイズおよび位置を含めて、受け取る。文字のストリングは、同等のスペース／空白文字および改行を含む。ワードビルダ４１１は、文字を単語に組み立て、これらをキーワード・リストと比較することができる。キーワード・リストにあるものとして認識される単語または文字を、空白にする／クリアするか特殊文字によって置換することができる。絵、写真、および類似物を有する区域を、事前定義のグレイトーンまたはピクセルと置換することができる。スペース文字および垂直行検出と組み合わされたジグソーＯＣＲスキャンは、ページの所与の区域での列分離の尤度を評価することができる。最後に、ページのスキャンの終了後に、ＨＩＴコレクタ４１２が、すべての関連するキーワードおよびたとえばタイトル行のリストを組み立て済みである場合があり、結果の出力は、ヒットおよび文書内のヒットの位置のリストとすることができ、結果の出力を、キーワードを示された空白にされたページの表現（空白にするプロセスを調査中）とすることができ、あるいは、任意の他の適切な出力フォームとすることができる。

その代わりにおよび／またはそれに加えて、スキャンされる文書上のテキストの処理は、機械翻訳（ＭＴ）を含む場合があり、この機械翻訳は、コンピュータ・ソフトウェアが、テキストをある言語から別の言語へ翻訳するのに使用される計算言語学の一分野である。基本的に、機械翻訳は、ある言語の単語の、他の言語の単語への単純な置換を実行する。機械翻訳は、ルールベースの機械翻訳、例ベースの機械翻訳、統計的機械翻訳（ＳＭＴ）などとすることができる。

その代わりにおよび／またはそれに加えて、スキャンされる文書上のテキストの処理が、言い換え（ｒｅｗｏｒｄｉｎｇｏｒｒｅｐｈｒａｓｉｎｇ）を含むことができる、すなわち、テキストの単語または文をオリジナルの単語または文と同一の意味を有する同一言語の異なる単語または文に言い換える（ｒｅｗｏｒｄｅｄｏｒｒｅｐｈｒａｓｅｄ）ことができる。本発明による方法を使用するときに、たとえば、３つの単語がスキャンされ、メモリに格納され、その後、処理される。この３つの単語の意味（ｍｅａｎｉｎｇｏｒｓｅｎｓｅ）が、ソフトウェア・プログラムによって生成され、３つのオリジナル単語の１つまたは複数の同義単語または同義文が生成される。これによって、オリジナルと同一の意味（ｍｅａｎｉｎｇｏｒｓｅｎｓｅ）を有するが著作権法に違反しない、オリジナルの単語、文、またはテキストの同等の単語、文、またはテキストが生成される。３つより多数または少数の単語を、オリジナルのテキストまたはテキストの一部の言い換え（ｒｅｗｏｒｄｉｎｇｏｒｒｅｐｈｒａｓｉｎｇ）のために処理することができることを理解されたい。

図４ａに、読取りヘッド移動をかぶせられた新聞の架空の第１面のセクションを示し、スキャンは、全体的に図１と同様に機能する。開始点は、文書ページの左上角にある。最初の３つのピープホール・スキャン（ＰＨスキャン）５０１、５０２、５０３は、内容をマークせず、クリアされるか空白（ほぼ同一の色）によって上書きされる。４番目のＰＨスキャン、ＰＨ４５０４は、情報を含むが、文字は、ＯＣＲによって認識されない。したがって、５番目の垂直のＰＨスキャン、ＰＨ５５０５が、要求され、ＰＨ４と組み合わされる。ＯＣＲは、組み合わされたスキャンＰＨ４＋ＰＨ５を調べ、文字「Ｔｈｕｒｓ」およびさらなる何かを検出する。スキャン・シーケンサは、６番目および７番目のスキャン、ＰＨ６５０６およびＰＨ７５０７を要求する。スキャンＰＨ４＋ＰＨ５＋ＰＨ６＋ＰＨ７が、組み合わされ、ジグソーＯＣＲに提示される。このＯＣＲは、単語「Ｔｈｕｒｓｄａｙ」、文字「３０ｔ」、およびさらなる何かを返す。スキャン・シーケンサは、次のスキャンを要求することによって継続する。単語「Ｔｈｕｒｓｄａｙ」およびたとえばそのフォント・サイズを、ワード・リコグナイザに転送することができる。フォント・サイズに起因して、この単語を、見出しまたはタイトル文に属するものとして分類することができる。次のスキャンを用いて、単語「Ｎｅｗｓｐａｐｅｒ」が認識されるなどである。

図４ｂに、本文テキストのスキャンを示すが、このスキャンは、図１に示された類似する検索戦略に従い、段階的に、一文字ずつ発見し、一単語ずつ組み立てる。次いで、各組み立てられた単語を、キーワード・リストと比較することができる。ある単語がキーワード・リスト内で見つからない場合には、その単語によって占められる区域を、空白で上書きし、メモリからクリアすることができる。

図４ｂの例は、垂直スキャン・シーケンスを示す。検索プロセスは、次の単語「Ｉｎｆｏｐａｑ」、ファースト・ネーム「Ｊａｃｏｂ」（継続符号を無視して）、および最後に示されたテキスト片内の名字「Ｍｅｉｂｏｍ」を発見する。文書内のすべての絵を、空白にすることができる。

図５に、ピープホール・スキャン・プロセスの例を示し、このプロセスは、全体的に図１と同様に機能する。図５ａ）では、スキャンされる文書６００は、スキャンの前に、ある種のカバリングによって区域６０１で部分的に隠されるかカバーされている。図５ａ）に示されたカバーされた文書がスキャンされ終え、内容およびイメージが処理され、削除されたときに、図５ｂ）に示されているように、文書６００は、スキャンの前に、ある種のカバリングによって今度は反対の区域６０３で、やはり部分的に隠されるかカバーされる。

図５ａ）に示されているように、たとえば従来のスキャナで部分的にカバーされた文書をスキャンするときには、文書のコピーは作られない。というのは、部分的なカバリングに起因して、文書の内容全体が可視または理解できるものではないからである。したがって、文書の区切られた区域６０２だけが、スキャンされ、スキャナのメモリに格納される。部分的にカバーされた文書のスキャンされたイメージは、光学文字認識（ＯＣＲ）を実行するために処理される。登録された文字は、メモリに格納され、文字のストリングが得られるときには、そのストリングが、事前定義の条件に対して評価される。事前定義の条件が満足されるか否かに応じて、出力を提供することができ、ストリングの少なくとも一部およびスキャンされたイメージの少なくとも一部が、メモリからクリアされ、したがって、文書６００の一部６０２だけを表すスキャンされたイメージの内容およびスキャンされたイメージ自体が、少なくとも部分的に削除される。したがって、最終的に、文書６００の一部６０２だけを描くスキャンされたイメージ全体を削除することができ、したがって、文書６００の一部６０２のスキャンは、もはやメモリに格納されなくなる。

ここで、図５ｂ）に示されているように、同一の文書６００が、前とは反対の区域６０３で部分的に隠されるかカバーされる。上で述べたように、たとえば従来のスキャナで部分的にカバーされた文書をスキャンするときには、文書のコピーは作られない。というのは、部分的なカバリングに起因して、文書の内容全体が可視または理解できるものではないからである。したがって、文書６００の区切られた区域６０４だけが、スキャンされ、スキャナのメモリに格納される。部分的にカバーされた文書のスキャンされたイメージは、光学文字認識（ＯＣＲ）を実行するために処理される。登録された文字は、メモリに格納され、文字のストリングが得られるときには、そのストリングが、事前定義の条件に対して評価される。事前定義の条件が満足されるか否かに応じて、出力を提供することができ、ストリングの少なくとも一部およびスキャンされたイメージの少なくとも一部が、メモリからクリアされ、したがって、文書６００の一部６０４だけを表すスキャンされたイメージの内容およびスキャンされたイメージ自体が、少なくとも部分的に削除される。したがって、最終的に、文書６００の一部６０４だけを描くスキャンされたイメージ全体を削除することができ、したがって、文書６００の一部６０４のスキャンは、もはやメモリに格納されなくなる。

したがって、図５ｂ）のように区域６０３内でカバーされた文書６００のスキャンを開始するときに、図５ａ）に見られる区域６０１内でカバーされた文書６００のスキャンされたイメージは、除去済みであり、したがって、文書６００全体を描く完全なイメージは、絶対に存在しない。文書６００の一部６０２は、文書６００の一部６０４が記録され、処理され、削除される前に、認識され、処理され、メモリからクリアされる。

区域６０２および６０４は、たとえばカバーされる区域６０１および６０３が斜めである場合または記録が多少斜めである場合に、文書の部分が失われないことを保証するために、部分的オーバーラップなど、互いにオーバーラップすることができる。

カバリング６０１、６０３は、文書６００のうちでカバーされるべき部分の上に不透明の材料または実体を物理的に置くことによって実現することができる。その代わりにおよび／またはそれに加えて、カバリング６０１、６０２を、スキャナの読取りヘッドまたはガラス・ペインに不透明の材料または実体を物理的に置くことによって実現することができる。カバー材料は、たとえば、紙、不透明テープ、不透明プラスティック、金属、および／または類似物とすることができる。

代替案では、カバリング６０１および６０３を、リーダー・ヘッドの電子マスキングまたは電子ゲーティングによって設けることができる。走査線は、たとえば、高さ１画素、長さ３０００画素とすることができる。リーダー・ヘッドは、文書の各走査線の一部をスキャンし、各走査線の別の部分を削除することができる。たとえば、リーダー・ヘッドは、画素番号１〜１００など、走査線の第１部分をスキャンし、画素番号１００〜２００など、走査線の第２部分を削除し、画素番号２００〜３００など、走査線の第３部分をスキャンし、画素番号３００〜４００など、走査線の第４部分を削除し、すべての走査線の各部分がスキャンされるか削除されるかのいずれかになるまでこれを続けることができる。その後、走査線のすべてのスキャンされた部分を処理した後に、それらがメモリからクリアされ、次に、画素番号１〜１００など、走査線の第１部分を削除し、画素番号１００〜２００など、走査線の第２部分をスキャンし、画素番号２００〜３００など、走査線の第３部分を削除し、画素番号３００〜４００など、走査線の第４部分をスキャンするなど、前にスキャンされたのではなく削除された、走査線のすべての部分が、スキャンされ、前にスキャンされた走査線の部分が、今回は削除される。走査線の部分の削除は、メモリヘの入力が行われないことすなわち、走査線の部分の内容が抑止されまたは無視されることを含む。

新聞ページ上では、字または文字は、高さ１５〜２０画素である場合があり、１ページが、長さ３０００画素である場合があり、これは、上で述べた走査線に対応する。したがって、走査線の部分のスキャンまたは削除によって、図５に見られるカバリングに対応する電子マスキングを得ることができる。

さらに、絵は、通常、グレイスケールまたはカラー変形形態であり、文書上のグレイスケールまたはカラー変形形態が、たとえばリーダー・ヘッドによるなど、スキャナによって検出されるときに、グレイスケールまたはカラー変形形態を含む画素は、ある値を割り当てられ、このある値を有するすべての画素は、その後、絵である可能性があるこれらの画素の内容を隠すために、クリアされるかカバーされる。

カバリング６０１、６０３の形態および形状は、図５に見られるように列とすることができる。その代わりにおよび／またはそれに加えて、カバリング６０１、６０３の形態および形状を、正方形、チェック・パターン、格子、三角形、円、線、任意の個数の辺を有する多角形などとすることができる。

Claims

−文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも１つの記録をメモリに獲得するステップと、
−文字認識を実行するために前記少なくとも１つの記録を処理するステップと、
−文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと
を含む、文書をスキャンするコンピュータ実施される方法であって、
−事前定義の条件に対して前記ストリングを評価することと、
−条件が満足されない場合に、前記ストリングの少なくとも一部および前記少なくとも１つの記録の少なくとも一部を前記メモリからクリアすることと、
−条件が満足される場合に、出力を提供すべきかどうかを判定することと
を特徴とするコンピュータ実施される方法。
前記事前定義の条件は、文字の前記ストリングが事前定義のキーワードのうちの１つに現れることを含む、請求項１に記載のコンピュータ実施される方法。
前記事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む、請求項１または２に記載のコンピュータ実施される方法。
前記事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む、請求項１乃至３のいずれか１項に記載のコンピュータ実施される方法。
出力を提供すべきかどうかの判定は、文字の前記ストリングが事前定義のキーワードのうちの１つと一致するかどうかに基づく、請求項１乃至４のいずれか１項に記載のコンピュータ実施される方法。
前記出力は、前記条件に対して陽性に評価された前記ストリングに寄与する内容を含む前記少なくとも１つの記録を含む前記文書内のロケーションへの参照である、請求項１乃至５のいずれか１項に記載のコンピュータ実施される方法。
前記ストリングが一致するキーワードは、文書テンプレート内で、前記スキャンの対象である前記文書内の対応する単語のロケーションを表すロケーションに配置される、請求項１乃至６のいずれか１項に記載のコンピュータ実施される方法。
見つかったキーワードの前記文書内の位置および／または長さに関する情報は、生成され、格納される、請求項１乃至７のいずれか１項に記載のコンピュータ実施される方法。
前記出力は、前記事前定義の条件を満足する文字の前記ストリングを表すコードを含む、請求項１乃至８のいずれか１項に記載のコンピュータ実施される方法。
前記出力は、事前定義のキーワード・リスト内の事前定義のキーワードの中からの１つへの参照を含む、請求項１乃至９のいずれか１項に記載のコンピュータ実施される方法。
前記出力は、事前定義のキーワードの中からの１つを含む、請求項１乃至１０のいずれか１項に記載のコンピュータ実施される方法。
前記出力は、事前定義のキーワードの中からの１つと、スキャンの対象である前記文書内の対応する単語のロケーションを表すロケーションへの参照とを含む、請求項１乃至１１のいずれか１項に記載のコンピュータ実施される方法。
文字の前記ストリングは、出力が提供されるときにクリアされる、請求項１乃至１２のいずれか１項に記載のコンピュータ実施される方法。
選択された記録を一緒に合成記録に縫い合わせることを含む、請求項１乃至１３のいずれか１項に記載のコンピュータ実施される方法。
前記合成記録は、複数の選択された記録にまたがって延びる文字の認識を実行するために処理される、請求項１４に記載のコンピュータ実施される方法。
選択された記録を一緒に合成記録に縫い合わせるステップは、文字を認識するための前記少なくとも１つの記録の処理が文字の認識をもたらさなかったときに実行される、請求項１４に記載のコンピュータ実施される方法。
前記事前定義の条件は、縫い合わされた合成記録が、事前定義の個数の記録が縫い合わされたときに文字の認識をもたらすかどうかを含む、請求項１４に記載のコンピュータ実施される方法。
前記事前定義の条件は、文字の前記ストリングが事前定義のキーワードのうちの１つに現れることを含む、請求項１４に記載のコンピュータ実施される方法。
前記事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む、請求項１４に記載のコンピュータ実施される方法。
前記事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む、請求項１４乃至１９のいずれか１項に記載のコンピュータ実施される方法。
前記事前定義の条件は、同一の色が隣接する記録に現れることを含む、請求項１４乃至２０のいずれか１項に記載のコンピュータ実施される方法。
前記合成記録は、事前定義の条件が満足されるときにクリアされる、請求項１７に記載のコンピュータ実施される方法。
前記フィールドは、連続するテキスト内で互いの隣に配置された１１個の単語という寸法を有するように構成される、請求項１乃至２２のいずれか１項に記載のコンピュータ実施される方法。
前記フィールドは、前記文書の幅および前記文字のフォント・サイズの高さに対応する寸法を有するように構成される、請求項１乃至２３のいずれか１項に記載のコンピュータ実施される方法。
前記フィールドは、文字認識の対象になる最小文字のサイズの５倍未満の寸法を有するように構成される、請求項１乃至２２のいずれか１項に記載のコンピュータ実施される方法。
少なくとも２つの記録は、同時に獲得される、請求項１乃至２５のいずれか１項に記載のコンピュータ実施される方法。
コンピュータ上で実行されるときに請求項１乃至２６のいずれか１項に記載の方法を実施するプログラムを符号化されたコンピュータ可読媒体。
スキャン・デバイスと、プログラムがコンピュータ上で実行されるときに請求項１乃至２６のいずれか１項に記載の方法を実施する前記プログラムをロードされた前記コンピュータとを含むシステム。
−文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも１つの記録を獲得するスキャン・ヘッドと、
−前記記録内の文字を認識するように適合されたプロセッサと、
−前記少なくとも１つの記録を格納し、認識された文字を格納するデータ・メモリと、
−請求項１乃至２６のいずれか１項に記載の方法を実行するために前記プロセッサ上の実行可能プログラム命令のセットを格納するプログラム・メモリと
を含む文書スキャナ。