JP2011513850A - スキャンの方法 - Google Patents

スキャンの方法 Download PDF

Info

Publication number
JP2011513850A
JP2011513850A JP2010549149A JP2010549149A JP2011513850A JP 2011513850 A JP2011513850 A JP 2011513850A JP 2010549149 A JP2010549149 A JP 2010549149A JP 2010549149 A JP2010549149 A JP 2010549149A JP 2011513850 A JP2011513850 A JP 2011513850A
Authority
JP
Japan
Prior art keywords
computer
document
implemented method
characters
predefined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010549149A
Other languages
English (en)
Inventor
スティグ ニルセン,ラース
メイボム,ヤコブ
Original Assignee
ジェイエル ホールディングス エーピーエス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジェイエル ホールディングス エーピーエス filed Critical ジェイエル ホールディングス エーピーエス
Publication of JP2011513850A publication Critical patent/JP2011513850A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)
  • Facsimiles In General (AREA)
  • Storage Device Security (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Cleaning In Electrography (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

テキストを著作権保護されないコピーから合法的に保護できる、文書(たとえば、新聞または書籍)をスキャンするコンピュータ実施される方法であって、文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録をメモリに獲得するステップと、文字認識を実行するために少なくとも1つの記録を処理するステップと、文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと、事前定義の条件に対してストリングを評価することを含む、コンピュータ実施される方法。条件が満足されない場合には、ストリングの少なくとも一部および少なくとも1つの記録の少なくとも一部をメモリからクリアする。条件が満足される場合には、出力を提供すべきかどうかを判定する。

Description

本発明は、テキストを許可されないコピーから合法的に保護できる、印刷された新聞ページまたはテキストの他の形の表示などのテキストを含む文書の光学スキャンによって獲得されるディジタル・イメージまたはディジタル記録のコンピュータ実施される処理に関する。
EU諸国での著作権法の調和に関する2001年5月22日の欧州議会およびEU理事会の指令2001/29/ECは、コピーおよびスキャンに関するルールを示す。同等の米国制定法が、ディジタル・ミレニアム著作権法(DMCA)である。
スキャンおよびコピーは、従来のスキャナによって実行することができるが、著作権保護された文書の従来のスキャンは、著作権法に違反するので、この問題に対する解決策の必要がある。
EU Copyright Directive Article 2は、最も基本的な「コピー」権を提供する。これは、作品の「直接または間接の、一時的または永久的な」コピーの複製に対する排他的権利を、実演者、レコード制作者、映画制作者、放送機関、および著作者に与える。EU Copyright DirectiveのArticle 5は、Article 2で提供される権利に適用できる制限および例外を示す。Article 5(1)での複写権に対する必須の例外は、仲介者によるネットワーク伝送の「本質的かつ一体の」部分である「過渡的かつ偶発的な」複写を提供し、あるいは、「独立の経済的重要性」を有しない作品の合法的使用を許可する。
この例外は、権利者が、ディジタル・テクノロジを介する作品へのすべてのアクセスを制御することをも防ぎ、このディジタル・テクノロジは、まさにその設計によって、作品がDVDなどの媒体から処理のためにプレイヤのメモリに転送され、その後にディスプレイまたはスピーカに転送されるときに、作品の一時的「コピー」を作る。
新聞、雑誌、業界誌、科学雑誌、および他の定期刊行物などの著作権保護された刊行物の監視は、組織的に、たとえば重要な記事または他のテキスト・セクションを識別することによってクライアントのために働く媒体監視業の会社によって、実行される。監視は、クライアントの会社および個人が、どれほどしばしばおよびどの程度まで彼らがニュース・メディアで言及されているのかを追跡するのを助けるために実行される。
従来、監視は、たとえば新聞を手作業で読むことに基づく。新聞が、たとえば媒体監視会社で受け取られるときに、新聞は、適任の人間の読み手に渡され、この読み手は、関連する記事、たとえば彼らのクライアントに言及する記事を探して新聞を速読する。読み手は、会社名、個人の名前、および/またはある主題、トピック、もしくはテーマを表す他のキーワードなどの単語を探して、記事のどれが関連記事であるのかを判定する。
読み手は、新聞のページでキーワードを見つけたときに、そのキーワードをマークする。ページ全体を読み終え、すべてのキーワードをマークし終えたときに、読み手は、キーワードごとの評価を実行して、記事がクライアントに関連するかどうかを判定する。記事が関連することがわかった場合には、読み手またはアシスタントは、クライアントのために記事(1つまたは複数)を物理的に切り抜き、クライアントに送る。
このプロセスの時間のかかる部分は、キーワードを見つけることに費やされる時間である。左上角から始めて右下角で終わる、1ページあたりの読む時間は、ページ上のキーワードの個数に対してかなり不変である。これは、新聞に少数の関連記事だけがある場合に、切り抜きあたりの長い時間消費をもたらす。したがって、読むことに費やされるこの時間のほとんどは、非効率的である。
ある程度までは、新聞全体をページごとにスキャンし、ファイル・システムまたはデータ・ベースでの格納のために電子バージョンをたとえばJPGフォーマット、TIFFフォーマット、またはPDFフォーマットで格納するために新聞ページのディジタル・イメージを作る従来のスキャナによって、このプロセスの自動化が可能である。その後、各ファイルが、ファイルを作るために光学文字認識のために取り出され、ここでは、認識された文字が、それぞれ、ある符号化方式(たとえば、ASCII)に従って表される。これらのファイルも、ファイル・システムまたはデータ・ベースに格納される。さらに、いわゆる検索エンジンが、キーワードのセットと共にロードされ、検索エンジンは、切り抜きリストの形で出力を提供するために、文字および文字のシーケンスが符号化されたファイルを取り出す。切り抜きリストは、新聞から記事を切り抜く人に、彼を物理的な新聞のページに向ける情報すなわち、切り抜かれるべき記事のタイトルおよびそのおおよそのロケーションを規定する情報を与える。この自動化プロセスは、手動プロセスよりも生産性を良好に向上させる。
しかし、ディジタル・イメージは、オリジナル材料の電子コピーを表すので、このプロセスは、多くの制定法の下で著作者の著作権の侵害と考えられる。ある制定法の下では、スキャンされたイメージを表示画面に示すことさえ、著作者の著作権を侵害する行為とみなされる。ディジタル・イメージは、テキストについて直接に検索可能であるのではなく、光学文字認識すなわちOCRによるコーディングされたディジタル形式への変換を必要とする。しかし、この変換からの出力すなわちコーディングされたディジタル形式も、著作権の侵害と考えられる。
いくつかの国では、電子コピーが「過渡的かつ偶発的」であり、検索プロセスまたは要約記述の「本質的かつ一体」の部分である場合には、これは著作者の著作権の侵害ではないと考えられる場合がある。
テキスト媒体を手作業で読むことによる媒体監視の伝統的プロセスが自動化される場合には、テキスト媒体のコピーが行われる。テキスト媒体のコピーの作成は、著作権法に関して問題である。したがって、著作権法は、媒体監視の自動化にとって障害となり得る。したがって、テキスト媒体の監視の自動化および著作権法違反の防止は、解決されなければならないままになっている問題である。したがって、テキスト媒体(たとえば、新聞、書籍)の監視の自動化の問題および著作権法違反の防止の問題を解決する技術的解決策の必要がある。
従来技術
米国特許第6904183 B2号に、検出器と、検出器に入射する放射を制限するために適合された視野を有するレンズとを有する電子カメラを含む電子イメージ取込装置が開示されている。アクチュエータが、文書にまたがってカメラおよびその視野を移動するために設けられ、コントローラが、文書の異なる区域に対応するオーバーラップするサブイメージのセットを獲得するために設けられる。処理手段が、文書のうちでサブイメージのセットによってカバーされる部分の混成イメージを形成するために設けられる。それぞれのサブイメージに現れる文字に対応する文字のデータ・セットをそれぞれが含むサブイメージのセットが作られる。サブイメージのそれぞれの内容が、空白テキスト文書に縫い合わされて、スキャンされた文書のテキスト内容を含む完全な混成テキスト文書が作られる。サブイメージは、縫い合わせの前に、まず、光学文字認識(OCR)ルーチンに通され、したがって、縫い合わせは、文字レベルで実行される。そのようなスキャナは、いわゆるフラットベッド・スキャナより少ない机のスペースを占有するという利益を有する可能性がある。
上の特許出願は、文書のテキスト・スキャンの自動化の問題を解決する。しかし、著作権法に関して、これは、上の特許出願または他の特許出願のどれもが対処せず、解決しない問題ではない。というのは、上の特許出願で、文書がディジタル形式で複製されるからである。コピーは、著作権法に対する侵害なので、この問題は、文書スキャンが新聞または書籍などの印刷されたテキスト媒体に対して行われるときまたはスキャンがeブックなどの電子的に表示されるテキスト文書に対して行われるときに、解決される必要がある。
米国特許第6904183 B2号
したがって、著作権法に違反しないニュース・メディアの監視の自動化という問題は、従来技術では解決されていない。
−文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録をメモリに獲得するステップと、
−文字認識を実行するために少なくとも1つの記録を処理するステップと、
−文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと
を含む、文書をスキャンするコンピュータ実施される方法であって、
−事前定義の条件に対してストリングを評価することと、
−条件が満足されない場合に、ストリングの少なくとも一部および少なくとも1つの記録の少なくとも一部をメモリからクリアすることと、
−条件が満足される場合に、出力を提供すべきかどうかを判定することと
を特徴とするコンピュータ実施される方法を開示する。
著作権法違反を避けるためには、テキストをディジタル形式で複製しまたは他の形でコピーしてはならない。この問題に対する解決策は、入手することが望まれる情報を抽出し、残りをフィルタリングによって除去するために、文書の内容をフィルタリングすることである。
内容のフィルタリングを実行するためには、フィルタ・プロパティを定義しなければならない。フィルタ・プロパティを、事前定義の条件によって定義することができる。事前定義の条件は、たとえば、キーワードの認識、文字のストリングの最大長などとすることができる。キーワードの認識がフィルタ・プロパティである場合には、これに従って、キーワードだけがフィルタを通過し、文書内の情報の残りは、置き去りにされる。文書の内容をフィルタリングすることによって、文書の完全なコピーは作られず、所望の情報だけが文書から抽出される。所望の情報は、文書内のすべての情報より少ない情報とすることができ、その結果、文書の内容の一部だけが抽出されるようになり、したがって、文書の大多数は、好ましくは絶対に出力として提供されない。
実際には、フィルタがキーワードを認識するときに、そのキーワードおよびそのキーワードの文書内の位置を格納することができる。キーワードおよびその位置が格納されるや否や、そのキーワードを含む記録、たとえばイメージを削除することができる。というのは、そのキーワードに関して必要とされる情報のすべてが登録されているからである。この形で、文書のコピーは全く生成されなくなる。というのは、スキャンが、フィルタリング・プロセスに関係し、コピー作成には関係しないからである。
この方法によるスキャンを、ピープホール・スキャンと表す場合がある。ピープホール・スキャンは、イメージ・フィールドをシフトされた位置に移動することと、カメラを用いて記録を獲得することとによって実行することができる。しかし、ピープホールを、より多数のカメラを文書ページの上に取り付けることと、これらのカメラを順番に使用することによって記録を獲得することとによって実行することもできる。さらに、ピープホール・スキャンを、たとえば、文書を表示する画面のビデオ記録または他の形の直列化された文書表現によって実行することもできる。
さらに、文書の情報のうちで関連する片すなわちキーワードを見つけるために、ピープホール・スキャナが電子入力の内容ベースの評価を実行することが有利である。ピープホール・スキャナは、内容のフィルタリングを実行し、ここで、内容は、文書のフラグメントの形である。
文字のストリングが評価され、たとえば出力が作られるときに、ストリングの一部および記録が、文書のコピーまたは文書の諸部分のコピーがスキャン中に作成されることを阻むために、メモリからクリアされる。
フィルタリング・プロセスは、当初にスキャン中に実行され、したがって、ピープホール・スキャナは、単語ごとのレベルで検索プロセスを行って、文書のコピーが作られるのを避け、著作権法に違反するのを避ける。
したがって、文書のスキャンを実行する、コンピュータならびに関連する装置、機器、および/または機械類のハードウェアまたはソフトウェアは、著作権法に関して法律的に正しい形で機能するように調整される。文書の内容に関して示す情報のいずれもがメモリからクリアされない場合には、著作権法に違反する。逆に、文書の内容に関して示す情報全体がクリアされる場合には、テキスト媒体の監視に関して使用可能な情報はない。本発明は、何もクリアしないこととすべてをクリアすることとの間にある、上で説明した方法を提供する。本発明は、テキスト媒体の自動監視を実行することを可能にすると同時に、著作権法の違反を避ける。
したがって、本発明は、上で説明したコンピュータ実施されるスキャン方法によって、テキスト媒体の監視のプロセスを自動化するという問題を解決し、本発明は、文書の内容に関して示す情報の一部をメモリからクリアし、その結果、文書の完全なコピーがメモリ内に絶対に存在しないようにすることによって、著作権法違反を避けるという問題を解決する。
上で述べた利益のほかに、本発明は、高速で信頼できる、人間によって実行される手作業の仕事のコストを減らす、人間が実行する可能性がある誤りおよび不規則を減らす、その他など、自動化の既知の技術的効果および利益を含む。
さらに、文書のスキャン中にデータが継続的かつ規則的にメモリからクリアされ、削除されるので、従来技術と比較して、メモリまたはデータ・メモリに関する記憶容量があまり必要でない可能性があることが、有利である。
文字は、アルファベットの字、漢字、数字、句読点、およびすべての世界中の書記体系のすべての個々の記号など、字、記号、符号、および/または書記素とすることができる。
一実施形態では、事前定義の条件は、文字のストリングが事前定義のキーワードのうちの1つに現れることを含む。この実施形態の利益は、キーワード全体が文字のストリング内で見つかる場合またはキーワードの一部が文字のストリング内で見つかる場合のいずれかに、この情報が即座にクリアされるのではなく、出力を提供すべきかどうかが判定されることである。したがって、この場合には、所望の情報を、キーワード全体またはキーワードの一部とすることができる。スキャンされる文書内のキーワードの表示がない場合には、内容は格納されない。しかし、キーワードがあることの表示がある場合には、文字のストリングは、即座にクリアされるのではなく、所望の情報を含むかどうかを判定するために検討される。
一実施形態では、事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む。この実施形態の利益は、評価された文字の個数が事前定義の上限またはしきい値を超える場合に、文字認識プロセスが停止することを保証することである。多すぎる文字が評価される場合には、著作権法に違反する可能性があるが、この実施形態は、これが起きないことを保証する。
一実施形態では、事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む。この実施形態の利益は、文字フォント・サイズが最大の事前定義のフォント・サイズより大きい場合に、大きい文字のスキャンを避けるために文字認識プロセスが停止することであり、この大きい文字のスキャンは、そうでなければ非常に時間のかかる非効率的な作業になる可能性がある。
一実施形態では、出力を提供すべきかどうかの判定は、文字のストリングが事前定義のキーワードと一致するかどうかに基づく。この実施形態の利益は、出力を提供すべきかどうかの判定が、キーワード一致があることに依存することである。出力は、その一致の間、文字のストリングの一部がキーワードと一致するとき、または文字のストリングが完全なキーワードを形成するときのいずれかに提供することができる。
一実施形態では、出力は、条件に対して陽性に評価されたストリングに寄与する内容を含む少なくとも1つの記録を含む文書内のロケーションへの参照である。この実施形態の利益は、出力が、文書内のキーワードの位置/ロケーション/区域の参照として作られ、したがって、後に、記録およびキーワードがメモリからクリアされたときに、その出力を見つけることができ、したがって、キーワード・ロケーションに関する情報を含む記録のロケーションへの参照が与えられることである。位置判定と共に記録を獲得することが有利であり、この位置判定は、後に、記録への参照を与えることをより簡単にする。
一実施形態では、ストリングが一致するキーワードは、文書テンプレート内で、スキャンの対象である文書内の対応する単語のロケーションを表すロケーションに配置される。この実施形態の利益は、キーワードをその後に配置でき、その後に切り抜き、リスト生成、要約記述などでの使用のために文書テンプレート上で再び見つけることができることである。文書テンプレートは、文書のコピーを作らずにオリジナル文書内のキーワードの物理的ロケーションの概要を与えるように働く。キーワード以外のすべての単語を、たとえば、文書テンプレート内で灰色の区域によって表すことができる。キーワードのフォント・サイズおよびたとえばグレイスケール色をも文書テンプレート内で示すことができ、その結果、キーワードが見出し、本文などに配置されているかどうかを判定することが可能になる。
一実施形態では、見つかったキーワードの文書内の位置および/または長さに関する情報は、生成され、格納される。この実施形態の利益は、文書内のキーワード(1つまたは複数)の位置を、後で見つけることができ、この情報を使用して、互いに対する相対的なキーワードの位置を比較して、キーワードが互いの近くに配置されているかどうかを判定できることである。キーワードは、他のキーワードと組み合わされたときに特殊な意味を有する場合があり、互いに対する相対的なキーワードのロケーションは、クライアントにとって重要な情報を含む可能性がある。
キーワードの位置に関する情報は、
−キーワードの座標によって、
−キーワードがある行の位置によって、
−キーワードがある文書内の単語数によって、
−印刷記号によって(印刷記号は、終止符、コンマ、および類似物を含む)、
−キーワードがある文書内の文の個数によって、
−キーワードがあるセクション/段落の個数によって、
など、さまざまな手段によって識別することができる。
一実施形態では、出力は、事前定義の条件を満足する文字のストリングを表すコードを含む。この実施形態の利益は、キーワードと一致する文字のストリングの出力を、文字、記号、参照番号、キーワードのリストへのインデックスその他など、任意の適切なコードによって表すことができることである。
一実施形態では、出力は、事前定義のキーワード・リスト内の事前定義のキーワードの中からの1つへの参照を含む。
一実施形態では、出力は、事前定義のキーワードの中からの1つを含む。
一実施形態では、出力は、事前定義のキーワードの中からの1つと、スキャンの対象である文書内の対応する単語のロケーションを表すロケーションへの参照とを含む。
一実施形態では、文字のストリングは、出力が提供されるときにクリアされる。この実施形態の利益は、文字のストリングの内容が出力されるときに、その内容がメモリからクリアされ、この形で、文書のコピーが作られないことである。必要とされる文字のストリングに関する重要な情報のすべてが、この出力によって与えられる。
一実施形態では、この方法は、選択された記録を一緒に合成記録に縫い合わせることを含む。この実施形態の利益は、選択された記録をより大きい記録またはイメージに縫い合わせることが可能であることである。これが有利であるのは、スキャンが文字の多数の異なるフォント・サイズすなわち、見出しのより大きい文字フォント・サイズおよび本文、キャプションなどのより小さいフォント・サイズを含む新聞について実行される場合に、フィールド・サイズが、時々、文字のフォント・サイズよりはるかに小さい(小さい記録またはイメージ・サイズ)からである。また、フィールド寸法が、たとえば文字認識される最小文字のフォント・サイズの5倍未満であることが好ましい場合があるので、より大きい文字は、しばしば、複数の記録にまたがって延び、したがって、選択された記録を一緒に縫い合わせることが必要である。文書ページ上の文字のフォント・サイズは、たとえばオペレータによるキー入力または類似物によるなど、入力としてピープホール・スキャナに提供することができる。
一実施形態では、合成記録は、複数の選択された記録にまたがって延びる文字の認識を実行するために処理される。この実施形態の利益は、記録を一緒に縫い合わせた後に、合成記録が完全な文字のイメージまたはレコードを提供するので、複数の選択された記録にまたがって延びる文字の文字認識を実行できることである。
一実施形態では、選択された記録を一緒に合成記録に縫い合わせるステップは、文字を認識するための少なくとも1つの記録の処理が文字の認識をもたらさなかったときに実行される。この実施形態の利益は、少なくとも1つの記録の処理から文字を認識することが可能ではないときに、合成記録の縫い合わせおよび処理が実行されることである。この形では、文字が複数の記録にまたがって延びる場合であっても、それらの文字を判定することができる。
一実施形態では、事前定義の条件は、縫い合わされた合成記録が、事前定義の個数の記録が縫い合わされたときに文字の認識をもたらすかどうかを含む。この実施形態の利益は、合成記録が文字に似ていない場合に、注意が払われ、処理を継続できないことである。その場合に、合成記録は、絵の一部である可能性が高い。事前に定義された個数の縫い合わされた合成記録は、スキャナが文字を検索中であることに起因して、絵全体が、故意でなく処理されることがないことを保証することができる。この方法によって、適切な事前定義の最大個数の縫い合わされた記録が選択されることによって、著作権法に違反しないことが保証される。この実施形態のさらなる利益は、記録の個数の上限またはしきい値に達する前に注意が払われることを保証することである。スキャンを停止する前に多すぎる記録が評価される場合には、著作権法に違反する可能性があるが、この実施形態は、これが起きないことを保証する。
一実施形態では、事前定義の条件は、同一の色が隣接する記録に現れることを含む。この実施形態の利益は、隣接する記録すなわち互いに隣り合う記録が、同一の色を含む場合に、これらの記録が絵ではなく文字の記録である可能性が高いことである。その一方で、隣接する記録が同一の色を含まない場合には、これらの記録が絵、写真、線描、または類似物である可能性が高い。絵のスキャンを避けるために、文書のこの部分のスキャンは、クリアされる。
一実施形態では、合成記録は、事前定義の条件が満足されるときにクリアされる。この実施形態の利益は、ある条件が満足されるとき、出力が作られ、文書からのすべての所望の情報が入手されたときなどに、記録の縫い合わせをクリアできることである。この形で、文書のコピーを作ることが回避され、著作権法違反が回避される。
一実施形態では、フィールドは、連続するテキストすなわち切れ目のないテキスト内で互いの隣に配置された11個の単語という寸法を有するように構成される。代替案では、フィールドは、連続するテキスト内で互いの隣の5個の単語、連続するテキスト内で互いの隣の15個の単語、連続するテキスト内で互いの隣の20個の単語、連続するテキスト内で互いの隣の25個の単語、または類似物の寸法を有するように構成される。フィールドが、連続するテキスト内で互いの隣に配置された11個の単語を含む場合に、そのフィールドは、書籍の1ページの幅またはA4文書のサイズの文書の幅をカバーする可能性があり、フィールドの高さは、フォントのサイズである可能性がある。新聞のページなどの複数列ページをスキャンする場合に、各列の行は、連続するテキスト内で互いの隣の11個未満の単語を含む場合があり、したがって、複数列ページの幅も、連続するテキスト内で互いの隣の11個未満の単語を含む可能性がある。複数列ページの幅は、11個を超える単語を含む場合があるが、この11個の単語は、連続するテキスト内で互いに隣り合わない可能性がある。したがって、一実施形態では、フィールドは、文書の幅および文字のフォント・サイズの高さに対応する寸法を有するように構成される。
一実施形態では、フィールドは、文字認識の対象になる最小文字のサイズの5倍未満の寸法を有するように構成される。代替案では、フィールドは、
−10mm、20mm、30mm、または類似物の寸法を有するように、
−文書ページあたりのフィールドの所定の個数、たとえば100個または200個に対応して、
−最大の文字フォント・サイズに対して相対的に、
−最小の文字フォント・サイズに対して相対的に、
−文書ページ・サイズに対して相対的に
など、定義された寸法を有するように構成される。
この実施形態の利益は、多すぎる文字が1つの記録内でスキャンされないことを保証することである。というのは、これが、多すぎるテキストがスキャンされることをもたらし、したがって、故意ではなく著作権法に違反し得ることをもたらし得るからである。フィールドが、たとえば最小文字のフォント・サイズの5倍未満の寸法を有することを保証することによって、故意ではなく一時に多すぎる文字をスキャンすることが可能ではなくなる。
フィールドの寸法を、最小文字のフォント・サイズの4倍未満にすることができ、あるいは、最小文字のフォント・サイズの6倍未満にすることができることも、可能である。
一実施形態では、少なくとも2つの記録は、同時に獲得される。この実施形態の利益は、たとえば同時に垂直により多くの記録を獲得することによって、スキャン・プロセスが、かなりより高速になり得ることである。それと同時に、著作権法に対する侵害になり得る多すぎるテキストの記録の危険性は、存在しない。というのは、垂直により多くの記録を獲得することによって、文書ページ上で水平に記述された単語および文が、同時には記録されないからである。各記録は、光学文字認識を実行するために記録が処理され終え、現れるすべてのキーワードが認識され、または別の条件が満足されたときに、最終的にクリアされ、したがって、文書のコピーは作られない。
さらに、いくつかの言語およびいくつかの国では、読むことが、左から右ではなくページ上で右から左へ、および/または水平ではなく垂直に、および/またはページの最上部からページの最下部ではなくページの最下部からページの最上部へなどで行われる可能性がある。したがって、スキャンを、左から右ではなくページ上で右から左へ、および/または水平ではなく垂直に、および/またはページの最上部からページの最下部ではなくページの最下部からページの最上部へなどで実行することもできる。
いくつかの実施形態では、スキャンされる文書上のテキストの処理が、機械翻訳(MT)を含む場合があり、この機械翻訳は、コンピュータ・ソフトウェアが、テキストをある言語から別の言語へ翻訳するのに使用される計算言語学の一分野である。基本的に、機械翻訳は、ある言語の単語の、別の言語の単語への単純な置換を実行する。機械翻訳は、ルールベースの機械翻訳、例ベースの機械翻訳、統計的機械翻訳(SMT)などとすることができる。
いくつかの実施形態では、スキャンされる文書上のテキストの処理が、言い換え(rewording or rephrasing)を含むことができる、すなわち、テキストの単語または文をオリジナルの単語または文と同一の意味を有する同一言語の異なる単語または文に言い換える(reworded or rephrased)ことができる。本発明による方法を使用するときに、たとえば、3つの単語がスキャンされ、メモリに格納され、その後、処理される。この3つの単語の意味(meaning or sense)が、ソフトウェア・プログラムによって生成され、3つのオリジナル単語の1つまたは複数の同義単語または同義文が生成される。これによって、オリジナルと同一の意味(meaning or sense)を有するが著作権法に違反しない、オリジナルの単語、文、またはテキストの同等の単語、文、またはテキストが生成される。3つより多数または少数の単語を、オリジナルのテキストまたはテキストの一部の言い換え(rewording or rephrasing)のために処理することができることを理解されたい。
ピープホール・スキャン・プロセスのいくつかの実施形態では、スキャンされる文書は、スキャンの前に、ある種のカバリングによって第1区域で部分的に隠されるかカバーされ、カバーされた文書がスキャンされ終え、内容およびイメージが処理され、削除されたときに、その文書は、スキャンの前に、ある種のカバリングによって今度は反対の第2区域で、やはり部分的に隠されるかカバーされる。
スキャンを、スキャンされる文書を部分的にカバーし、その後、反対の区域で文書を部分的にカバーすることによって実行できることは、有利である。というのは、これが、スキャンを高速に効率的に実行できることをもたらすからである。
本発明は、上および次で説明する方法ならびに、それぞれが最初に述べられた態様に関連して説明される利益および長所のうちの1つまたは複数をもたらし、それぞれが最初に述べられた態様および/または添付の特許請求の範囲で開示される態様に関連して説明される実施形態に対応する1つまたは複数の実施形態を有する、対応する方法、デバイス、使用、および/または生産手段に関する。
具体的に言うと、本明細書では、コンピュータ上で実行されるときに上の実施形態のいずれかに記載の方法を実施するプログラムを符号化されたコンピュータ可読媒体が開示される。
さらなる態様は、スキャン・デバイスと、プログラムがコンピュータ上で実行されるときに上の実施形態のいずれかに記載の方法を実施するプログラムをロードされたコンピュータとを含むシステムである。
さらなる態様は、
−文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録を獲得するスキャン・ヘッドと、
−記録内の文字を認識するように適合されたプロセッサと、
−少なくとも1つの記録を格納し、認識された文字を格納するデータ・メモリと、
−実施形態のいずれかに記載の方法を実行するためにプロセッサ上の実行可能プログラム命令のセットを格納するプログラム・メモリと
を含む文書スキャナである。
実施形態の詳細な説明を、図面を参照して下で与える。
スキャン方法を示す流れ図である。 ピープホール・スキャナの全体的処理を示す図である。 ピープホール・スキャン・プロセスの例を示す図である。 読取りヘッド移動をかぶせられた新聞紙のセクションを示す図である。 ピープホール・スキャン・プロセスの例を示す図である。
本発明のディジタル・スキャナは、文書のディジタル・コピーを作成せずに文書をスキャンする。スキャン動作のどの所与のときにも、いわゆるピープホール・スキャナは、少数の単語または単語の部分がクリアされるか上書きされる前に、その単語が事前定義の単語リスト内の単語に対応しない場合に、そのメモリ内にその単語または単語の部分のみを含むことができる。このスキャンおよび検索方法によって、ユーザは、それぞれの著作者の著作権を侵害しないはずである。
図1に、スキャン方法の流れ図を示す。スキャンは、記録の位置をシフトすること101によって、たとえば、文書、たとえば新聞の表面にまたがって順次の形で移動するスキャナによって実行することができ、各ステップについて、スキャナは、文書のフィールド内の記録、たとえばイメージを獲得する102。フィールドは、好ましくは小さく、フィールドのサイズは、さまざまな形で定義することができる。
−文字認識の対象である最小文字のフォント・サイズの5倍未満の寸法を有するようにフィールドを構成することができ、
−10mmの寸法を有するようにフィールドを構成することができ、
−文書ページあたりの所定の個数の記録またはイメージのフィールドに対応する寸法を有するようにフィールドを構成することができ、
−最大文字フォント・サイズに対する相対的な寸法を有するようにフィールドを構成することができ、
−最小文字フォント・サイズに対する相対的な寸法を有するようにフィールドを構成することができ、
−文書ページ・サイズに対する相対的な寸法を有するようにフィールドを構成することができる。
上で述べたように、ピープホール・スキャンは、イメージ・フィールドをシフトされた位置に移動することと、カメラを用いて記録を獲得することとによって実行することができる。
代替案では、ピープホールを、文書ページの上により多数のカメラを取り付け、これらのカメラを順番に使用することによって記録を獲得することによって実行することもできる。たとえば、100台のカメラを、正方形の文書の上に取り付けることができ、右上角の第1のカメラは、第1の記録を獲得することができ、第1のカメラの隣の第2のカメラは、第2の記録を獲得することができ、文書全体がスキャンされるまで、以下同様である。
ピープホール・スキャンを、たとえば電子ブックすなわちeブックなどの電子文書を表示する画面のビデオ記録によって実行することもできる。画面上の文書は、固定されたピープホール・スキャナ、たとえばビデオ・カメラの前で文書を画面上で上下にスクロールすることによって、または画面を横切ってピープホール・スキャナを移動することによってのいずれかで記録することができる。すべての場合において、スキャンは、水平にまたは垂直になど、実行することができる。さらに、ビデオ・スキャンを、ビデオ・グラフィックス・アレイ(VGA)モニタ信号または類似物などのコンピュータからのモニタ出力を使用することによって実行することができる。モニタ信号は、モニタに表示される電子文書を直列化されて搬送する。ピープホール・スキャナは、直列化されたモニタ信号から、ピープホール・ウィンドウ、たとえばそれぞれ40個の連続する走査線内の40個の画素を抽出することができ、これによって、ピープホール・ウィンドウに対応する絵を、モニタ信号から取り出すことができる。その後、ピープホール・ウィンドウを、上もしくは下にまたは左もしくは右にまたは斜めなどに移動することができ、新しいピープホール・ウィンドウを、ピープホール・スキャナによってスキャンすることができる。各スキャンでは、ピープホール・ウィンドウに対応する絵がとられる。その後、記録されたデータを、コンピュータ内で文字認識によって変換し、上で説明したように処理することができる。
スキャンプロセスの各ステップの後に、ピープホール・スキャナは、文書の表面のセグメントの小さい記録、たとえばイメージを含む103。記録は、グレイスケール、白黒すなわち2進、またはカラーのいずれかとすることができる。各記録セグメントまたはイメージセグメントは、光学文字認識(OCR)によって分析されて、文字、文字の一部、絵の一部、空白フィールド、またはその組合せを含むかどうかが判定される104。
記録セグメントが文字を含む場合には、それを登録し、いわゆるワードビルダ(Wordbuilder)に転送する105、下を参照されたい。記録セグメントが文字の一部を含み、その文字がこれによって認識はされない場合には、次の記録を行い106、OCRを待って、記録セグメントを一緒に解いて文字を形成できるかどうかを判定し、ここで形成された文字は、ワードビルダに転送することができる。
記録セグメントが絵または絵の一部を含む場合には、著作権保護された絵、写真などのコピーを作るのを避けるために、絵の一部をクリアすることができる。記録セグメントの残りは、それを後続の記録セグメント(1つまたは複数)と一緒に解いて文字を形成できるかどうかを判定するのに使用される。
連続プロセスで、ワードビルダは、スキャンされた文字を収集し、意味のある単語を形成することを試みる。これらの潜在的な単語は、認識について、事前定義の条件、たとえばキーワード・リストに対してテストされる107。単語が認識される場合には、ヒットが作られ、記録され、出力を行う109べきかどうかが判断され108、その後、より多くの記録を行うことができる。文字のストリングが事前定義の条件と一致しない場合には、文字のストリングの少なくとも一部および少なくとも1つの記録の少なくとも一部をメモリからクリアする110。
文字のストリングがキーワードを満足するかどうかをテストするときには、文字の完全なストリングが検査され、文字のストリングが、たとえばハイフンによって2行にまたがって広がる単語を形成するときにも、文字の完全なストリングが検査される。したがって、ピープホール・スキャナは、ハイフンが現在の行の最後の文字記号として現れる場合には、次の行のスキャンを継続する。
ピープホール・スキャナは、従来のスキャナのように機能することができる。従来のスキャナは、イメージ・フィールドをセットし、イメージを撮影し、イメージをメモリに格納することによって機能する。さらに、従来のスキャナは、OCRのタスクおよび検索エンジン(SE)処理(キーワード・マッチング)のタスクを実行することができる。従来のスキャナがこれらのステップを実行するときには、獲得された情報が格納され、これによって、スキャンされた文書のコピーが作られる。スキャナは、フラットベッド・スキャナ、ローラー・スキャナ、フィーダー・スキャナ、または類似物とすることができる。
ピープホール・スキャナは、これらと同一の3つのタスクすなわち、スキャン、文字認識、およびキーワード・マッチングを実行することができる。しかし、ピープホール・スキャナは、1つの連続動作で、文書のコピーを全く作成せずに、これらのタスクを実行する。従来のスキャナは、通常、文書全体のイメージを同時に獲得するが、ピープホール・スキャナは、一時に文書の区切られた区域のイメージだけを獲得する。
図2に、ピープホール・スキャナの全体的処理を示すが、図1は、その詳細なプロセスを示す。ピープホール・スキャナは、図1に示されているように、文書を「読み取り」301、光学文字認識(OCR)を実行し302、単語一致を検索する303。結果の出力は、スキャンされた文書が含むキーワードのある種の表示である。この表示を、切り抜きリストの作成、キーワード・リストの作成、要約記述を可能にするためなど304、さまざまな目的に使用することができる。
ピープホール・スキャナは、ハードウェア・コンポーネント、ファームウェア・コンポーネント、およびソフトウェア・コンポーネントを組み合わせることができる。
図3に、ピープホール・スキャン・プロセスの例を示すが、この例は、全体的に、図1と同様に機能する。図3a)では、文書ページ401が、スキャナ402の下に置かれる。スキャナの読取りヘッド403が、トラック(1つまたは複数)405上に配置され、トラック(1つまたは複数)405は、文書の表面全体にわたって移動するために、グライダ(1つまたは複数)406上で移動することができる。読取りヘッド403は、フラット・ケーブル、USB接続、赤外線通信、または類似物によって、読取りヘッド移動コントローラ408およびスキャン・シーケンサ(SS)407(図3b)を参照されたい)に接続される。一例では、読取りヘッドは、8ビット・グレイスケール分解能を有する100×100画素のCCDアレイである。したがって、ピープホールは、1cm×1cmに対応する物理的ウィンドウ・フィールド内に10000個の画素を含み、これは、タブロイド・ページ・サイズの1/1000と等しい。
読取りヘッドの一例にここで言及するが、読取りヘッドが任意の仕様を有することができることを理解されたい。
図3bでは、スキャン・シーケンサ(SS)407が、読取りヘッド移動408を制御する。一般に、読取りヘッドの移動は、戻りサイクルを伴って左から右へである。光学文字認識(OCR)409およびジグソーOCR 410(下を参照されたい)の結果が、水平に左、垂直に下、または斜めに上など、別の形で読取りヘッドを移動する要求についてステージをセットする場合には、このシーケンスを変更することができる。
読取りヘッド移動408を、イメージ獲得デバイスの標準規格であるTWAINインターフェースによって制御することができる。TWAINインターフェースは、スキャナ読取りヘッドの位置すなわち、読取りヘッドのx,y座標と、座標の増分すなわちΔx,Δyなどを制御することができる。
OCR 409は、一連のタスクを実行する。OCR 409は、ピープホール・フィールドの内側区域を検索して、1つまたは複数の完全な文字を突き止めることができ、その後、境界を検索して、文字の部分を形成できる形状を突き止めることができる。OCR 409は、垂直境界線および水平境界線の片を探す。OCR 409は、行間隔を探すことができ、アラインメントを評価する。OCR 409は、連続する符号および列分離間隔を探すことができる。OCR 409は、より大きい文字の一部である可能性があるモノグレイトーン(mono−grey−tone)形状を探すことができる。OCR 409は、絵の一部である可能性がある変化するグレイトーンを有する区域を探すことができる。認識された文字は、たとえばそのフォント・サイズおよび文書内の位置と共に、ワードビルダ411に転送される。
OCRタスクの例にここで言及するが、OCRスキャンを任意の適切な形で実行できることを理解されたい。
ジグソーOCR 410は、隣接するピープホール・イメージまたは記録を組み合わせて、ウィンドウ、たとえば2個、4個、9個、または16個のピープホール・イメージを形成し、このウィンドウは、その後、反復プロセスでOCRにかけられる。ジグソーOCR 410は、スキャン・シーケンサ407と相互作用し、文字の完全なイメージを作るためにそれが必要とする隣接するピープホールを要求する。8つまでの隣接スキャンと組み合わされた各スキャンが、文字または文字の一部、線、および絵の認識のために分析される。
ワードビルダ411は、OCR 409およびジグソーOCR 410から文字を1つずつ、たとえばそのフォント・サイズおよび位置を含めて、受け取る。文字のストリングは、同等のスペース/空白文字および改行を含む。ワードビルダ411は、文字を単語に組み立て、これらをキーワード・リストと比較することができる。キーワード・リストにあるものとして認識される単語または文字を、空白にする/クリアするか特殊文字によって置換することができる。絵、写真、および類似物を有する区域を、事前定義のグレイトーンまたはピクセルと置換することができる。スペース文字および垂直行検出と組み合わされたジグソーOCRスキャンは、ページの所与の区域での列分離の尤度を評価することができる。最後に、ページのスキャンの終了後に、HITコレクタ412が、すべての関連するキーワードおよびたとえばタイトル行のリストを組み立て済みである場合があり、結果の出力は、ヒットおよび文書内のヒットの位置のリストとすることができ、結果の出力を、キーワードを示された空白にされたページの表現(空白にするプロセスを調査中)とすることができ、あるいは、任意の他の適切な出力フォームとすることができる。
その代わりにおよび/またはそれに加えて、スキャンされる文書上のテキストの処理は、機械翻訳(MT)を含む場合があり、この機械翻訳は、コンピュータ・ソフトウェアが、テキストをある言語から別の言語へ翻訳するのに使用される計算言語学の一分野である。基本的に、機械翻訳は、ある言語の単語の、他の言語の単語への単純な置換を実行する。機械翻訳は、ルールベースの機械翻訳、例ベースの機械翻訳、統計的機械翻訳(SMT)などとすることができる。
その代わりにおよび/またはそれに加えて、スキャンされる文書上のテキストの処理が、言い換え(rewording or rephrasing)を含むことができる、すなわち、テキストの単語または文をオリジナルの単語または文と同一の意味を有する同一言語の異なる単語または文に言い換える(reworded or rephrased)ことができる。本発明による方法を使用するときに、たとえば、3つの単語がスキャンされ、メモリに格納され、その後、処理される。この3つの単語の意味(meaning or sense)が、ソフトウェア・プログラムによって生成され、3つのオリジナル単語の1つまたは複数の同義単語または同義文が生成される。これによって、オリジナルと同一の意味(meaning or sense)を有するが著作権法に違反しない、オリジナルの単語、文、またはテキストの同等の単語、文、またはテキストが生成される。3つより多数または少数の単語を、オリジナルのテキストまたはテキストの一部の言い換え(rewording or rephrasing)のために処理することができることを理解されたい。
図4aに、読取りヘッド移動をかぶせられた新聞の架空の第1面のセクションを示し、スキャンは、全体的に図1と同様に機能する。開始点は、文書ページの左上角にある。最初の3つのピープホール・スキャン(PHスキャン)501、502、503は、内容をマークせず、クリアされるか空白(ほぼ同一の色)によって上書きされる。4番目のPHスキャン、PH4 504は、情報を含むが、文字は、OCRによって認識されない。したがって、5番目の垂直のPHスキャン、PH5 505が、要求され、PH4と組み合わされる。OCRは、組み合わされたスキャンPH4+PH5を調べ、文字「Thurs」およびさらなる何かを検出する。スキャン・シーケンサは、6番目および7番目のスキャン、PH6 506およびPH7 507を要求する。スキャンPH4+PH5+PH6+PH7が、組み合わされ、ジグソーOCRに提示される。このOCRは、単語「Thursday」、文字「30t」、およびさらなる何かを返す。スキャン・シーケンサは、次のスキャンを要求することによって継続する。単語「Thursday」およびたとえばそのフォント・サイズを、ワード・リコグナイザに転送することができる。フォント・サイズに起因して、この単語を、見出しまたはタイトル文に属するものとして分類することができる。次のスキャンを用いて、単語「Newspaper」が認識されるなどである。
図4bに、本文テキストのスキャンを示すが、このスキャンは、図1に示された類似する検索戦略に従い、段階的に、一文字ずつ発見し、一単語ずつ組み立てる。次いで、各組み立てられた単語を、キーワード・リストと比較することができる。ある単語がキーワード・リスト内で見つからない場合には、その単語によって占められる区域を、空白で上書きし、メモリからクリアすることができる。
図4bの例は、垂直スキャン・シーケンスを示す。検索プロセスは、次の単語「Infopaq」、ファースト・ネーム「Jacob」(継続符号を無視して)、および最後に示されたテキスト片内の名字「Meibom」を発見する。文書内のすべての絵を、空白にすることができる。
図5に、ピープホール・スキャン・プロセスの例を示し、このプロセスは、全体的に図1と同様に機能する。図5a)では、スキャンされる文書600は、スキャンの前に、ある種のカバリングによって区域601で部分的に隠されるかカバーされている。図5a)に示されたカバーされた文書がスキャンされ終え、内容およびイメージが処理され、削除されたときに、図5b)に示されているように、文書600は、スキャンの前に、ある種のカバリングによって今度は反対の区域603で、やはり部分的に隠されるかカバーされる。
図5a)に示されているように、たとえば従来のスキャナで部分的にカバーされた文書をスキャンするときには、文書のコピーは作られない。というのは、部分的なカバリングに起因して、文書の内容全体が可視または理解できるものではないからである。したがって、文書の区切られた区域602だけが、スキャンされ、スキャナのメモリに格納される。部分的にカバーされた文書のスキャンされたイメージは、光学文字認識(OCR)を実行するために処理される。登録された文字は、メモリに格納され、文字のストリングが得られるときには、そのストリングが、事前定義の条件に対して評価される。事前定義の条件が満足されるか否かに応じて、出力を提供することができ、ストリングの少なくとも一部およびスキャンされたイメージの少なくとも一部が、メモリからクリアされ、したがって、文書600の一部602だけを表すスキャンされたイメージの内容およびスキャンされたイメージ自体が、少なくとも部分的に削除される。したがって、最終的に、文書600の一部602だけを描くスキャンされたイメージ全体を削除することができ、したがって、文書600の一部602のスキャンは、もはやメモリに格納されなくなる。
ここで、図5b)に示されているように、同一の文書600が、前とは反対の区域603で部分的に隠されるかカバーされる。上で述べたように、たとえば従来のスキャナで部分的にカバーされた文書をスキャンするときには、文書のコピーは作られない。というのは、部分的なカバリングに起因して、文書の内容全体が可視または理解できるものではないからである。したがって、文書600の区切られた区域604だけが、スキャンされ、スキャナのメモリに格納される。部分的にカバーされた文書のスキャンされたイメージは、光学文字認識(OCR)を実行するために処理される。登録された文字は、メモリに格納され、文字のストリングが得られるときには、そのストリングが、事前定義の条件に対して評価される。事前定義の条件が満足されるか否かに応じて、出力を提供することができ、ストリングの少なくとも一部およびスキャンされたイメージの少なくとも一部が、メモリからクリアされ、したがって、文書600の一部604だけを表すスキャンされたイメージの内容およびスキャンされたイメージ自体が、少なくとも部分的に削除される。したがって、最終的に、文書600の一部604だけを描くスキャンされたイメージ全体を削除することができ、したがって、文書600の一部604のスキャンは、もはやメモリに格納されなくなる。
したがって、図5b)のように区域603内でカバーされた文書600のスキャンを開始するときに、図5a)に見られる区域601内でカバーされた文書600のスキャンされたイメージは、除去済みであり、したがって、文書600全体を描く完全なイメージは、絶対に存在しない。文書600の一部602は、文書600の一部604が記録され、処理され、削除される前に、認識され、処理され、メモリからクリアされる。
区域602および604は、たとえばカバーされる区域601および603が斜めである場合または記録が多少斜めである場合に、文書の部分が失われないことを保証するために、部分的オーバーラップなど、互いにオーバーラップすることができる。
カバリング601、603は、文書600のうちでカバーされるべき部分の上に不透明の材料または実体を物理的に置くことによって実現することができる。その代わりにおよび/またはそれに加えて、カバリング601、602を、スキャナの読取りヘッドまたはガラス・ペインに不透明の材料または実体を物理的に置くことによって実現することができる。カバー材料は、たとえば、紙、不透明テープ、不透明プラスティック、金属、および/または類似物とすることができる。
代替案では、カバリング601および603を、リーダー・ヘッドの電子マスキングまたは電子ゲーティングによって設けることができる。走査線は、たとえば、高さ1画素、長さ3000画素とすることができる。リーダー・ヘッドは、文書の各走査線の一部をスキャンし、各走査線の別の部分を削除することができる。たとえば、リーダー・ヘッドは、画素番号1〜100など、走査線の第1部分をスキャンし、画素番号100〜200など、走査線の第2部分を削除し、画素番号200〜300など、走査線の第3部分をスキャンし、画素番号300〜400など、走査線の第4部分を削除し、すべての走査線の各部分がスキャンされるか削除されるかのいずれかになるまでこれを続けることができる。その後、走査線のすべてのスキャンされた部分を処理した後に、それらがメモリからクリアされ、次に、画素番号1〜100など、走査線の第1部分を削除し、画素番号100〜200など、走査線の第2部分をスキャンし、画素番号200〜300など、走査線の第3部分を削除し、画素番号300〜400など、走査線の第4部分をスキャンするなど、前にスキャンされたのではなく削除された、走査線のすべての部分が、スキャンされ、前にスキャンされた走査線の部分が、今回は削除される。走査線の部分の削除は、メモリヘの入力が行われないことすなわち、走査線の部分の内容が抑止されまたは無視されることを含む。
新聞ページ上では、字または文字は、高さ15〜20画素である場合があり、1ページが、長さ3000画素である場合があり、これは、上で述べた走査線に対応する。したがって、走査線の部分のスキャンまたは削除によって、図5に見られるカバリングに対応する電子マスキングを得ることができる。
さらに、絵は、通常、グレイスケールまたはカラー変形形態であり、文書上のグレイスケールまたはカラー変形形態が、たとえばリーダー・ヘッドによるなど、スキャナによって検出されるときに、グレイスケールまたはカラー変形形態を含む画素は、ある値を割り当てられ、このある値を有するすべての画素は、その後、絵である可能性があるこれらの画素の内容を隠すために、クリアされるかカバーされる。
カバリング601、603の形態および形状は、図5に見られるように列とすることができる。その代わりにおよび/またはそれに加えて、カバリング601、603の形態および形状を、正方形、チェック・パターン、格子、三角形、円、線、任意の個数の辺を有する多角形などとすることができる。

Claims (29)

  1. −文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録をメモリに獲得するステップと、
    −文字認識を実行するために前記少なくとも1つの記録を処理するステップと、
    −文字が認識されるときに、それをメモリに登録し、文字のストリングを徐々に入手するために、シフトされた位置で記録しながら上記ステップを繰り返して実行するステップと
    を含む、文書をスキャンするコンピュータ実施される方法であって、
    −事前定義の条件に対して前記ストリングを評価することと、
    −条件が満足されない場合に、前記ストリングの少なくとも一部および前記少なくとも1つの記録の少なくとも一部を前記メモリからクリアすることと、
    −条件が満足される場合に、出力を提供すべきかどうかを判定することと
    を特徴とするコンピュータ実施される方法。
  2. 前記事前定義の条件は、文字の前記ストリングが事前定義のキーワードのうちの1つに現れることを含む、請求項1に記載のコンピュータ実施される方法。
  3. 前記事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む、請求項1または2に記載のコンピュータ実施される方法。
  4. 前記事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む、請求項1乃至3のいずれか1項に記載のコンピュータ実施される方法。
  5. 出力を提供すべきかどうかの判定は、文字の前記ストリングが事前定義のキーワードのうちの1つと一致するかどうかに基づく、請求項1乃至4のいずれか1項に記載のコンピュータ実施される方法。
  6. 前記出力は、前記条件に対して陽性に評価された前記ストリングに寄与する内容を含む前記少なくとも1つの記録を含む前記文書内のロケーションへの参照である、請求項1乃至5のいずれか1項に記載のコンピュータ実施される方法。
  7. 前記ストリングが一致するキーワードは、文書テンプレート内で、前記スキャンの対象である前記文書内の対応する単語のロケーションを表すロケーションに配置される、請求項1乃至6のいずれか1項に記載のコンピュータ実施される方法。
  8. 見つかったキーワードの前記文書内の位置および/または長さに関する情報は、生成され、格納される、請求項1乃至7のいずれか1項に記載のコンピュータ実施される方法。
  9. 前記出力は、前記事前定義の条件を満足する文字の前記ストリングを表すコードを含む、請求項1乃至8のいずれか1項に記載のコンピュータ実施される方法。
  10. 前記出力は、事前定義のキーワード・リスト内の事前定義のキーワードの中からの1つへの参照を含む、請求項1乃至9のいずれか1項に記載のコンピュータ実施される方法。
  11. 前記出力は、事前定義のキーワードの中からの1つを含む、請求項1乃至10のいずれか1項に記載のコンピュータ実施される方法。
  12. 前記出力は、事前定義のキーワードの中からの1つと、スキャンの対象である前記文書内の対応する単語のロケーションを表すロケーションへの参照とを含む、請求項1乃至11のいずれか1項に記載のコンピュータ実施される方法。
  13. 文字の前記ストリングは、出力が提供されるときにクリアされる、請求項1乃至12のいずれか1項に記載のコンピュータ実施される方法。
  14. 選択された記録を一緒に合成記録に縫い合わせることを含む、請求項1乃至13のいずれか1項に記載のコンピュータ実施される方法。
  15. 前記合成記録は、複数の選択された記録にまたがって延びる文字の認識を実行するために処理される、請求項14に記載のコンピュータ実施される方法。
  16. 選択された記録を一緒に合成記録に縫い合わせるステップは、文字を認識するための前記少なくとも1つの記録の処理が文字の認識をもたらさなかったときに実行される、請求項14に記載のコンピュータ実施される方法。
  17. 前記事前定義の条件は、縫い合わされた合成記録が、事前定義の個数の記録が縫い合わされたときに文字の認識をもたらすかどうかを含む、請求項14に記載のコンピュータ実施される方法。
  18. 前記事前定義の条件は、文字の前記ストリングが事前定義のキーワードのうちの1つに現れることを含む、請求項14に記載のコンピュータ実施される方法。
  19. 前記事前定義の条件は、事前定義の個数未満の文字が評価されていることを含む、請求項14に記載のコンピュータ実施される方法。
  20. 前記事前定義の条件は、文字フォント・サイズが事前定義のフォント・サイズ未満であることを含む、請求項14乃至19のいずれか1項に記載のコンピュータ実施される方法。
  21. 前記事前定義の条件は、同一の色が隣接する記録に現れることを含む、請求項14乃至20のいずれか1項に記載のコンピュータ実施される方法。
  22. 前記合成記録は、事前定義の条件が満足されるときにクリアされる、請求項17に記載のコンピュータ実施される方法。
  23. 前記フィールドは、連続するテキスト内で互いの隣に配置された11個の単語という寸法を有するように構成される、請求項1乃至22のいずれか1項に記載のコンピュータ実施される方法。
  24. 前記フィールドは、前記文書の幅および前記文字のフォント・サイズの高さに対応する寸法を有するように構成される、請求項1乃至23のいずれか1項に記載のコンピュータ実施される方法。
  25. 前記フィールドは、文字認識の対象になる最小文字のサイズの5倍未満の寸法を有するように構成される、請求項1乃至22のいずれか1項に記載のコンピュータ実施される方法。
  26. 少なくとも2つの記録は、同時に獲得される、請求項1乃至25のいずれか1項に記載のコンピュータ実施される方法。
  27. コンピュータ上で実行されるときに請求項1乃至26のいずれか1項に記載の方法を実施するプログラムを符号化されたコンピュータ可読媒体。
  28. スキャン・デバイスと、プログラムがコンピュータ上で実行されるときに請求項1乃至26のいずれか1項に記載の方法を実施する前記プログラムをロードされた前記コンピュータとを含むシステム。
  29. −文書の区切られた区域をカバーするフィールドに閉じこめられた少なくとも1つの記録を獲得するスキャン・ヘッドと、
    −前記記録内の文字を認識するように適合されたプロセッサと、
    −前記少なくとも1つの記録を格納し、認識された文字を格納するデータ・メモリと、
    −請求項1乃至26のいずれか1項に記載の方法を実行するために前記プロセッサ上の実行可能プログラム命令のセットを格納するプログラム・メモリと
    を含む文書スキャナ。
JP2010549149A 2008-03-07 2009-03-05 スキャンの方法 Pending JP2011513850A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DK200800356A DK176834B1 (da) 2008-03-07 2008-03-07 Fremgangsmåde til skanning
US6468008P 2008-03-19 2008-03-19
PCT/EP2009/052616 WO2009109627A1 (en) 2008-03-07 2009-03-05 Method of scanning

Publications (1)

Publication Number Publication Date
JP2011513850A true JP2011513850A (ja) 2011-04-28

Family

ID=40138036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010549149A Pending JP2011513850A (ja) 2008-03-07 2009-03-05 スキャンの方法

Country Status (10)

Country Link
US (1) US8605297B2 (ja)
EP (1) EP2260412A1 (ja)
JP (1) JP2011513850A (ja)
CN (1) CN101981569A (ja)
BR (1) BRPI0910255A2 (ja)
CA (1) CA2717378A1 (ja)
DK (1) DK176834B1 (ja)
EA (1) EA201071042A1 (ja)
MX (1) MX2010009615A (ja)
WO (1) WO2009109627A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8798404B2 (en) * 2010-05-26 2014-08-05 Hin Leong Tan Making available to a user machine editable text extracted from an image
CN102385584A (zh) * 2010-08-31 2012-03-21 北大方正集团有限公司 剪报方法、装置及系统
DE102012025351B4 (de) * 2012-12-21 2020-12-24 Docuware Gmbh Verarbeitung eines elektronischen Dokuments
DE102014207874A1 (de) * 2014-04-25 2015-10-29 Siemens Aktiengesellschaft Verfahren zur automatisierten Erstellung eines eine technische Zeichnung charakterisierenden Datensatzes
US10235583B2 (en) * 2015-02-27 2019-03-19 Captricity, Inc. Electronically shredding a document
US11379753B1 (en) * 2017-04-24 2022-07-05 Cadence Design Systems, Inc. Systems and methods for command interpretation in an electronic design automation environment
JP7292988B2 (ja) * 2019-06-17 2023-06-19 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62106574A (ja) * 1985-11-05 1987-05-18 Hitachi Ltd 文書画像フアイル登録検索方式
EP0465818A2 (en) * 1990-06-12 1992-01-15 Horst Froesel Mass document storage and retrieval system
JPH11306197A (ja) * 1998-04-24 1999-11-05 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
JP2000059588A (ja) * 1998-08-12 2000-02-25 Minolta Co Ltd 画像処理装置
JP2011513849A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2359953B (en) * 2000-03-03 2004-02-11 Hewlett Packard Co Improvements relating to image capture systems
ATE322051T1 (de) * 2000-08-24 2006-04-15 Olive Software Inc System und verfahren zur automatischen aufbereitung und suche von abgetasteten dokumenten
US20050076013A1 (en) * 2003-10-01 2005-04-07 Fuji Xerox Co., Ltd. Context-based contact information retrieval systems and methods
JP2007122392A (ja) 2005-10-27 2007-05-17 Canon Inc 画像処理装置及び方法、並びにプログラム及び記憶媒体
JP4747828B2 (ja) * 2005-12-21 2011-08-17 富士ゼロックス株式会社 履歴管理装置
US20080021938A1 (en) * 2006-06-29 2008-01-24 Ashish Jha Technique for allocating objects in a managed run time environment
EP2087448A1 (en) * 2006-11-21 2009-08-12 Cameron Telfer Howie A method of retrieving information from a digital image
US8209605B2 (en) * 2006-12-13 2012-06-26 Pado Metaware Ab Method and system for facilitating the examination of documents

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62106574A (ja) * 1985-11-05 1987-05-18 Hitachi Ltd 文書画像フアイル登録検索方式
EP0465818A2 (en) * 1990-06-12 1992-01-15 Horst Froesel Mass document storage and retrieval system
JPH11306197A (ja) * 1998-04-24 1999-11-05 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
JP2000059588A (ja) * 1998-08-12 2000-02-25 Minolta Co Ltd 画像処理装置
JP2011513849A (ja) * 2008-03-07 2011-04-28 ジェイエル ホールディングス エーピーエス スキャンの方法

Also Published As

Publication number Publication date
DK200800356A (da) 2009-09-08
MX2010009615A (es) 2011-02-24
CN101981569A (zh) 2011-02-23
US20100315688A1 (en) 2010-12-16
WO2009109627A1 (en) 2009-09-11
BRPI0910255A2 (pt) 2015-09-29
US8605297B2 (en) 2013-12-10
EA201071042A1 (ru) 2011-04-29
EP2260412A1 (en) 2010-12-15
CA2717378A1 (en) 2009-09-11
DK176834B1 (da) 2009-11-23

Similar Documents

Publication Publication Date Title
US8520224B2 (en) Method of scanning to a field that covers a delimited area of a document repeatedly
JP5095535B2 (ja) 画像処理方法、画像処理システム、画像処理装置及びプログラム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
JP4557765B2 (ja) 画像処理装置およびその方法
JP4181892B2 (ja) 画像処理方法
JP4854491B2 (ja) 画像処理装置及びその制御方法
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2011513850A (ja) スキャンの方法
US20040139391A1 (en) Integration of handwritten annotations into an electronic original
JPH0750483B2 (ja) 文書画像追加情報の蓄積方法
Le Bourgeois et al. Document images analysis solutions for digital libraries
JP4502385B2 (ja) 画像処理装置およびその制御方法
US20080218812A1 (en) Metadata image processing
TWI725465B (zh) 影像處理系統、影像處理方法及程式產品
Ramel et al. AGORA: the interactive document image analysis tool of the BVH project
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2008028716A (ja) 画像処理方法及び装置
US10560606B2 (en) Image processing device, image processing method, and non-transitory computer readable medium
JPH08180068A (ja) 電子ファイリング装置
JP4278134B2 (ja) 情報検索装置及びプログラム並びに記録媒体
JP2012049860A (ja) 画像処理装置、画像処理方法およびプログラム
WO2011027113A1 (en) Method and apparatus for segmenting images
JP2004280514A (ja) Pdfファイル及びpdfファイル作成システム
JP2007034923A (ja) 画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140304