JP7440256B2 - 拡張現実の文書処理 - Google Patents

拡張現実の文書処理 Download PDF

Info

Publication number
JP7440256B2
JP7440256B2 JP2019227023A JP2019227023A JP7440256B2 JP 7440256 B2 JP7440256 B2 JP 7440256B2 JP 2019227023 A JP2019227023 A JP 2019227023A JP 2019227023 A JP2019227023 A JP 2019227023A JP 7440256 B2 JP7440256 B2 JP 7440256B2
Authority
JP
Japan
Prior art keywords
interest
bundle
point
top page
physical document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019227023A
Other languages
English (en)
Other versions
JP2020149668A (ja
JP2020149668A5 (ja
Inventor
カーク スティーブン テック,
Original Assignee
コニカ ミノルタ ビジネス ソリューションズ ユー.エス.エー., インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニカ ミノルタ ビジネス ソリューションズ ユー.エス.エー., インコーポレイテッド filed Critical コニカ ミノルタ ビジネス ソリューションズ ユー.エス.エー., インコーポレイテッド
Publication of JP2020149668A publication Critical patent/JP2020149668A/ja
Publication of JP2020149668A5 publication Critical patent/JP2020149668A5/ja
Application granted granted Critical
Publication of JP7440256B2 publication Critical patent/JP7440256B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Transforming Electric Information Into Light Information (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、拡張現実の文書処理に関する。
拡張現実(AR)は、ユーザーの視界内でコンピューター作成画像を物理的対象物上に重ね合わせることで、ユーザーに実世界環境のインタラクティブな体験をさせることができる。しかし、ARメガネの使用は一部のユーザーにとって不快となることがある。
コンピュータライズされたサーチ機能(すなわち、デジタル文書サーチワークフロー)は、ユーザーが実際の文書内容を手動で調べることなく電子文書内の関心点(例えば、テキスト文字、非テキスト文字、表、図、グラフ等)を容易に見つけることを可能にする。にもかかわらず、ユーザーは、物理的文書のみをハンドリング及びインタラクティングしながらこれらのコンピュータライズされたサーチ機能にアクセスすることを望む。
主として、一側面において、本発明は、コンピューターを用いて、物理的文書の画像を処理し、前記物理的文書のデジタルサーチを可能にする方法に関する。前記方法は、前記コンピューターが、前記物理的文書のデジタルコピーを取得する工程と、前記物理的文書内の関心点をサーチせよとの指示を受領する工程と、前記物理的文書を撮像し、前記関心点が前記物理的文書の表面上にあると判定する工程と、プロジェクターを用いて、前記物理的文書の表面上に、前記関心点に物理的に重なる視覚補助要素を投影して前記物理的文書の表面上にある関心点を強調表示する工程と、を含む方法であり、前記物理的文書は複数の物理的文書の束内のページであり、前記デジタルコピーは前記束内の全てのページを含み、前記コンピューターが、前記束の最上位ページを撮像する工程と、前記関心点が前記最上位ページの表面上にあると判定する工程と、プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある関心点を強調表示する工程と、を更に含む方法であり、前記コンピューターが、前記最上位ページを撮像し、前記関心点が前記最上位ページ上にないと判定する工程と、前記最上位ページを前記束のデジタルコピー内の前記関心点を含むページと比較する工程と、前記比較に基づいて、前記束を前記関心点の位置までトラバースせよと、前記トラバースする前記束における割合又はページ数が含まれる、更新された指示を出力する工程と、を更に含む方法
主として、一側面において、本発明は、物理的文書の画像を処理し、前記物理的文書のデジタルサーチを可能にするためのプログラムを格納した、非一時的なコンピューター読取り可能な媒体(CRM)のプログラムに関する。前記プログラムは、コンピューターに、前記物理的文書のデジタルコピーを取得させ、前記物理的文書内で関心点をサーチせよとの指示を受領させ、前記物理的文書を撮像して前記関心点が前記物理的文書の表面上にあると判定させ、プロジェクターを用いて、前記物理的文書の表面上に、前記関心点に物理的に重なる視覚補助要素を投影して前記物理的文書の表面上にある関心点を強調表示させるプログラムであり、前記物理的文書は複数の物理的文書の束内のページであり、前記デジタルコピーは前記束内の全てのページを含み、前記コンピューター読取り可能なプログラムコードは、コンピューターに更に前記束の最上位ページを撮像させ、前記関心点が前記最上位ページの表面上にあると判定させ、プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある関心点を強調表示させるプログラムであり、前記プログラムは、コンピューターに更に前記最上位ページを撮像させ、前記関心点が前記最上位ページ上にないと判定させ、前記最上位ページを前記束のデジタルコピー内の前記関心点を含むページと比較させ、前記比較に基づいて、前記束を前記関心点の位置までトラバースせよと、前記トラバースする前記束における割合又はページ数が含まれる、更新された指示を出力させるプログラム
主として、一側面において、本発明は、物理的文書の画像を処理し、前記物理的文書のデジタルサーチを可能にするためのシステムに関する。前記システムは、メモリと、前記メモリに接続されたコンピュータプロセッサーを備える。前記コンピュータプロセッサーは、前記物理的文書のデジタルコピーを取得し、前記物理的文書内で関心点をサーチせよとの指示を受領し、前記物理的文書を撮像し、前記関心点が前記物理的文書の表面上にあると判定し、プロジェクターを用いて、前記物理的文書の表面上に、前記関心点に物理的に重なる視覚補助要素を投影して前記物理的文書の表面上にある関心点を強調表示するシステムであり、
前記物理的文書は複数の物理的文書の束内のページであり、
前記デジタルコピーは前記束内の全てのページを含み、
前記コンピュータプロセッサーは、更に
前記束の最上位ページを撮像し、
前記関心点が前記最上位ページの表面上にあると判定し、
プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある関心点を強調表示するシステムであり、
前記コンピュータプロセッサーは、更に
前記最上位ページを撮像し、前記関心点が前記最上位ページ上にないと判定し、
前記最上位ページを前記束のデジタルコピー内の前記関心点を含むページと比較し、
前記比較に基づいて、前記束を前記関心点の位置までトラバースせよと、前記トラバースする前記束における割合又はページ数が含まれる、更新された指示を出力するシステム
本発明のその他の側面は、以下の説明及び添付の特許請求の範囲から明らかとなる。
図1は、本発明の一以上の実施形態に係るシステムを示す。 図2は、本発明の一以上の実施形態に係るフローチャートを示す。 図3は、本発明の一以上の実施形態に係る実行例を示す。 図4A~4Cは、本発明の一以上の実施形態に係る追加の実行例を示す。 図5は、本発明の一以上の実施形態に係るコンピューティングシステムを示す。
本発明の具体的な実施形態を、添付の図面を参照して詳細に説明する。複数の図における同様の構成要素は、一貫性を保つため、同様の参照符号で示される。
以下の本発明の実施形態の詳細な説明では、本発明がより十分に理解されるよう、具体的な詳細が多数示されている。しかし、当業者にとっては、これらの具体的な詳細なしで本発明が実施可能であることは明らかであろう。他の例では、説明を不必要に複雑にしないよう、周知の特徴について詳細に説明していない。
主として、本発明の実施形態は、物理的文書の画像を処理して物理的文書のデジタルサーチを可能にするための方法、非一時的なコンピューター読取り可能な媒体(CRM)、及びシステムを提供する。具体的には、一つの物理的文書又は物理的文書の束は、インタラクティブキャプチャを伴う投影(Projection with Interactive Capture(PIC))装置を用いて撮像され、電子文書(すなわち、物理的文書のデジタルコピー)としてメモリに記憶される。PIC装置は、以下図3において詳細に説明するが、撮像部(例えば、2次元及び/又は3次元のイメージャー)及び投影部(例えば、プロジェクター)を備え、撮像部と投影部はARメガネを要しないAR環境を作成するために連携して動作する。物理的文書又は束の内容内で関心点(例えば、テキスト文字、非テキスト文字、表、図、グラフ等)をサーチせよとのユーザー指示を受領すると、PIC装置はデジタルコピー上でデジタル文書サーチワークフローを行い、関心点を特定するための指示を出力する。ユーザーが関心点を含む物理的文書に到達すると、PIC装置はプロジェクターを用いて物理的文書の表面上の関心点を強調する。
図1は、本発明の一以上の実施形態に係るシステム(100)を示す。図1に示すように、システム(100)は例えば、バッファ(102)、撮像エンジン(106)、サーチエンジン(108)及び表示エンジン(110)を含む複数の構成要素を有する。これら構成要素(102、106、108及び110)はそれぞれ、同じコンピューティング装置(例えばパーソナルコンピューター(PC)、ノート型コンピューター、タブレット型PC、スマートフォン、多機能プリンター、キオスク、サーバー、PIC装置等)に配置されるか、若しくは有線及び/又は無線セグメントを有する任意のサイズのネットワークによって接続された異なるコンピューティング装置に配置されてよい。それぞれの構成要素を以下で説明する。
バッファ(102)は、ハードウェア(すなわち、回路)、ソフトウェア又はそれらの任意の組合せで実行できる。バッファ(102)は、撮像された一つの物理的文書又は物理的文書の束のデジタルコピー(104)を記憶するように構成される。複数のデジタルコピー(104)がバッファ(102)に記憶されてよい。
デジタルコピー(104)は、撮像された物理的文書の電子バージョンでもよい。デジタルコピー(104)は任意の画像様式(例えば、JPEG画像、GIF画像、BMP画像、TIFF画像、PDF文書等)でバッファ(102)に保存され得る。また、物理的文書は、片面、両面、または片面と両面を組み合わせた文書でよい。
システム(100)は、撮像エンジン(106)を備える。撮像エンジン(106)はハードウェア(すなわち回路)、ソフトウェア、又はそれらの任意の組合せで実行できる。撮像エンジン(106)は物理的文書を撮像し、デジタルコピー(104)を作成する。
さらに、撮像エンジン(106)は、物理的文書のデジタル画像を得ることができる2次元及び/又は3次元イメージャー(例えば、カメラや、一以上のカメラの組合せ等)を備えてもよい。
デジタルコピー(104)は、撮像エンジン(106)によって作成される。あるいは、デジタルコピー(104)は、システム(100)と通信している多機能周辺装置(例えば、スキャナを備えるプリンター)又は自動給紙装置(ADF)などの外部装置によって作成されてもよい。
システム(100)は更に、サーチエンジン(108)を備える。サーチエンジン(108)はハードウェア(すなわち、回路)、ソフトウェア、又はそれらの任意の組合せで実行できる。サーチエンジン(108)は、デジタルコピー(104)内の内容上でコンピュータライズされたサーチ機能(すなわち、デジタル文書サーチワークフロー)を行う。
サーチエンジン(108)は、デジタルコピー(104)に対して光学的文字認識及び非テキスト内容分析を行い、デジタルコピー(104)内の内容(例えば、テキスト文字、非テキスト文字、表、図、グラフ等)を特定する。デジタルコピー(104)内の内容は、特定されると、サーチエンジン(108)によるサーチが可能になる。デジタルコピー(104)内の内容を正確に特定できる任意の画像処理プログラム(例えば、単語認識プログラム、表認識プログラム等)がサーチエンジン(108)によって利用されてよい。
デジタルコピー(104)内で関心点(例えば、テキスト文字、非テキスト文字、表、図、グラフ等)をサーチせよとのユーザー指示を受領すると、サーチエンジン(108)は、デジタルコピー(104)をサーチしてデジタルコピー(104)内の全ての関心点の例を特定する。ユーザー指示は任意の入力装置(例えば、キーボード、タブレット、マイクロフォン等)を介してサーチエンジン(108)に入力されてよい。
サーチエンジン(108)は、関心点の例の数を含む情報をユーザーに伝える。テキストの視覚表示、音声での伝達、視覚テキスト及び音声の組み合わせ、又はユーザーに情報を明確に伝えることが可能な任意の適した方法を用いて指示が伝えられてもよい。関心点は、デジタルコピー(104)内に一度だけ現れる(すなわち、関心点の例が一つだけある)こともある。あるいは、関心点は、デジタルコピー(104)内に複数回現れる(すなわち、関心点の例が複数ある)こともある。
サーチエンジン(108)は、更にユーザーから関心点の例の一つを、要求された関心点の例として特定せよとの指示を受領する。デジタルコピー(104)内に関心点の例が一つだけある場合は、当該一つの例がサーチエンジン(108)によって要求された例として特定される。あるいは、サーチエンジン(108)は、当該一つの例を要求された例として指定するユーザーからの指示を受領するまで待機する。
サーチエンジン(108)は、更にデジタルコピー(104)内の要求された例の位置を特定し、要求された例の物理的位置の情報を含む指示を作成する。テキストの視覚表示、音声での伝達、視覚テキスト及び音声の組み合わせ、又はユーザーに指示を明確に伝えることが可能な任意の適した方法を用いて指示が伝えられてもよい。
文書の束を撮像する場合、サーチエンジン(108)によって作成される指示は特性の異なる情報を含んでもよい。指示は、Xを0より大きい正の整数とすると、束のXパーセントをトラバースするようにユーザーに指示する情報を含んでもよい。例えば、関心点が束内でおよそ60%の深さにあるとする。サーチエンジンによって作成される指示は、例えば、「束の60%をトラバースしてください」となる。
あるいは、Nを、束に残っているページの合計ページ数及び/又は束の合計ページ数よりも小さい0より大きい正の整数だとすると、指示は、ユーザーに束の任意の方向でNページ分のトラバースをするよう指示する情報を含んでもよい。例えば、関心点が現在撮像されている束の最上位ページより5ページ下にあるとする。サーチエンジンによって作成される指示は、例えば、「5ページ分進んでください」となる。別の例として、ユーザーが既に束の一部をトラバースしてユーザーが現在扱っているページより2ページ前で関心点が特定されたとする。サーチエンジンによって作成される指示は、例えば、「2ページ分戻ってください」となる。
サーチエンジン(108)は、上記したものの組み合わせ及び/又はユーザーが物理的文書の束内の関心点の位置を正しく特定するのを助ける任意のやり方を用いて指示を編集してよい。
ユーザーが束をトラバースしている間、撮像エンジン(106)によって束が継続して撮像されてもよいし、サーチエンジン(108)は撮像されている束の最上位ページに基づいて関心点を見つけるための指示を継続して更新してもよい。あるいは、ユーザーが束のトラバースを停止したと判定した場合(例えば、ユーザーの体の一部が画像内に検出されない場合、束の同じ画像が所定時間継続して撮像されている場合、等)のみ撮像エンジン(106)は束を撮像し、束が撮像された場合のみ、サーチエンジン(108)は関心点の位置を見つけるための指示を更新する。
関心点の要求された例はサーチエンジン(108)によって最も優先されてもよい。例えば、関心点の例が複数あり、ユーザーが束を先までトラバースし過ぎて要求された例とは異なる関心点の例に到達したとする。サーチエンジン(108)は、撮像されている現在のページ上の例よりも要求された例の方を優先し、要求された例を見つけるためにユーザーに指示する更新された指示を作成する。
システム(100)は表示エンジン(110)を更に備える。表示エンジン(110)は、ハードウェア(すなわち、回路)、ソフトウェア、又はそれらの任意の組合せにより実現される。表示エンジン(110)は、一以上の光、効果及び/又は画像を表示して、物理的文書の束の周辺に、AR環境を作成する。表示エンジン(110)によりAR環境の投影を行うことで、ARメガネは不要となる。この点は、図3において以下でより詳細に例示される。
表示エンジン(110)はプロジェクターを備えてもよい。表示エンジン(110)は、プロジェクターを用いて、サーチエンジン(108)により作成された指示を表示するよう束から所定の距離以内の表面へ一以上の光、効果及び/又は画像を投影する。所定の距離は、物理的文書又はその束によって占められている領域と重ならないプロジェクターの適用範囲内の任意の距離でよい。この点は、以下図4Bでより詳細に例示される。
さらに、表示エンジン(110)は、プロジェクターを用いて、一以上の光、効果及び/又は画像を投影して物理的文書の表面上の関心点及び関心点の周囲の所定領域を強調表示する。関心点の周囲の所定領域は、他の内容と重ならず、関心領域が表示エンジン(110)によって強調表示されているとユーザーが容易に判断できる任意の大きさでよい。この点は、以下図4Cでより詳細に例示される。
物理的文書上に現れた関心点の一つの例のみが任意の決められた時間に強調表示されてよい。あるいは、物理的文書上に現れた関心点の複数の例が同じ時間に強調表示されてもよい。
システム(100)は4つの要素(102、106、108及び110)を持つものとして示されているが、本発明の他の実施形態では、システム(100)はより多くの又はより少ない要素を有してよい。さらに、上記の各要素の機能は要素間をまたいで分割してもよい。さらに、各要素(102、106、108及び110)は反復操作を行うために複数回利用されてもよい。
図2は、本発明の一以上の実施形態に係るフローチャートを示す。具体的には、このフローチャートは、物理的文書の画像を処理して物理的文書のデジタルサーチを可能にする工程を説明するものである。図2のステップのうち一以上は、図1を参照しながら上記で説明したシステム(100)の要素によって実施され得る。本発明の一以上の実施形態において、図2のステップのうち一以上を省略し、繰り返し、及び/又は図2に示される順序とは異なる順序で実施してもよい。したがって、本発明の範囲は、図2に示される具体的なステップの配置に限定されると考えられるべきではない。
まず、物理的文書の束のデジタルコピーが取得される(ステップ205)。当該デジタルコピーは任意の情報源から取得されてよく(例えば、ダウンロード、スキャン等)、任意のサイズや形式でよい。デジタルコピーは物理的文書の束内の各ページの画像を含めてよい。デジタルコピー上の光学文字認識及び非テキスト内容分析を行ってデジタルコピー内の内容(例えば、テキスト文字、非テキスト文字、表、図、グラフ等)を特定してもよい。
ステップ210では、図1を参照して上述したように、束内の関心点(すなわち、要求された関心点)をサーチせよとの指示をユーザーから受領する。指示は、入力装置(例えば、キーボード、マイクロフォン、タッチパッド等)を介して直接入力により受領されてよい。
ステップ215では、図1を参照して上述したように、ステップ210で受領された要求された関心点のサーチが束内で行われ、ステップ220では、ユーザーに対して、束内の関心点の位置まで束をトラバースせよとの指示を出力する(例えば、投影する)。束内に関心点がない場合は、関心点が束内にないという通知が指示の代わりに投影される。
ステップ225では、図1を参照して上述したように、関心点の位置に到達したか否かを判定するために束の最上位ページが撮像され、ステップ230において、撮像されている最上位ページ上に関心点があるか否かが判定される。
束は、ユーザーが束をトラバースしている間継続して撮像されてもよく、関心点を見つけるための指示は撮像されている束の最上位ページに基づいて継続的に更新されてもよい。あるいは、ユーザーが束をトラバースするのを停止した時のみ束が撮像され、束が撮像されたときのみ関心点を見つけるための指示が更新されてもよい。
ステップ230でYESと判定された場合、処理はステップ235に進み、図1を参照して上述したように、ユーザーに見えるように束の最上位ページの表面上で関心点が強調表示される。
ステップ230でNOと判定された場合、最上位ページはデジタルコピー内の関心点を含むページと比較される。その後、ステップ245において、束をトラバースせよとの更新された指示がユーザーに対して出力(例えば、伝達)され、処理はステップ225へ戻る。
関心点の要求された例は最も優先される。例えば、関心点の例が複数あり、ユーザーが束を先までトラバースし過ぎて要求された例とは異なる関心点の例に到達したとする。撮像されている現在のページ上の例よりも要求された例の方が優先される。その結果、ステップ245にて作成された更新された指示は要求された例に基づくものになる。
束内に関心点の例が複数ある場合、ユーザーから異なる例(例えば、前の例、次の例、2番目の例、5番目の例等)を探すようにとの指示が受領されると、図2の処理が関心点の各々の例について繰り返される。
一以上の実施形態の上記処理は物理的文書が束である状況について述べるのに使用したが、同じ処理は、一枚の物理的文書だけがサーチされる状況にも適用される。物理的文書が一枚だけサーチされる場合、図2のフローチャート内のあるステップ(例えば、ステップ220、230、240及び245)は省略もしくは変更されてよい。例えば、ステップ220において、束をトラバースせよとの指示は出力されず、関心点がない場合は、関心点が束内にないという通知が投影される。
図3は、本発明の一以上の実施形態に係る実行例を示す。図3に示すように、インタラクティブキャプチャを伴う投影装置(PIC装置)(301)は、撮像部(例えば、2次元及び/又は3次元イメージャー)及び投影部(例えば、プロジェクター)を備える。撮像部と投影部は連携して動作し、物理的文書(305)を取り囲む所定領域の辺りにAR環境(303)を生成する。デジタルコンテンツ(307A~307C)は、ユーザーに対してAR環境(303)内に投影される(すなわち、表示される)。図3に示す構成によれば、ARメガネの着用を要さずに、ARを用いて物理的世界からデジタル世界へ橋渡しをすることができる。またPIC装置は、図1を参照しながら上述したように、システム(100)を用いて制御されてもよい。
図4A~4Cは、一以上の実施形態に係る実行例を示す。図4Aに示すように、物理的文書の束(403)が図3を参照して上述されたPIC装置(301)によって撮像される。PIC装置(301)は、束(403)の各ページが撮像されると、束(403)のデジタルコピーを作成する。
図4Bは、PIC装置(301)がユーザーからの指示の受領に応じて関心点に到達するためにユーザーに束(403)をトラバースせよと指示する一連の指示(403)を投影するところを示す。図4Bで分かるように、ユーザーは、PIC装置(301)に束(403)内で「18年度状況報告」というフレーズ(すなわち、関心点)を見つけよとの音声コマンドを発する。束(403)のデジタルコピーをサーチし、束(403)の最上位ページを撮像すると、PIC装置(301)は、関心点に到達するためにユーザーに「2ページ下までトラバース」するように指示する指示を投影する。指示(403)は音声形式でPIC装置(301)によって伝えられてもよい。
図4Cは、PIC装置(301)がユーザーが束(403)内の関心点を含むページに到達した際に強調表示領域(405)を投影するところを示す。図4Cにて分かるように、ユーザーは、束(403)内の「18年度状況報告」というフレーズを含むページに到達している。当該ページが撮像され、そのページが当該フレーズを含むと判定されると、PIC装置(301)は、そのフレーズ上に光、効果及び/又は画像の一以上を投影して、ユーザーに見えるように、束(403)の表面上でフレーズが明確に識別されるように強調表示領域(405)を作成する。
本発明の実施形態は、使用するプラットフォームにかかわらず、事実上あらゆる種類のコンピューティングシステムで実行できる。例えば、コンピューティングシステムは、一以上の可搬装置(例えば、ノート型コンピューター、スマートフォン、パーソナルデジタルアシスタント、タブレット型コンピューター又はその他の可搬装置)、デスクトップコンピューター、サーバー、サーバーシャーシにおけるブレード、又は本発明の一以上の実施形態を実施するための最低限の処理能力、メモリ及び入出力装置を少なくとも備えるその他の種類の一以上のコンピューティング装置であってよい。例えば図5に示すように、コンピューティングシステム(500)は、一以上のコンピュータプロセッサー(502)、関連するメモリ(504)(例えば、ランダムアクセスメモリ(RAM)、キャッシュメモリ、フラッシュメモリ等)、一以上の記憶装置(506)(例えば、ハードディスク、コンパクトディスク(CD)ドライブやデジタル多用途ディスク(DVD)ドライブといった光ドライブ、フラッシュメモリスティック等)、その他多くの構成要素及び機能を有してよい。コンピュータプロセッサー(502)は、指示を処理するための集積回路でもよい。例えば、コンピュータプロセッサーは、一以上のコア又はプロセッサーのマイクロコアでもよい。また、コンピューティングシステム(500)は、タッチスクリーン、キーボード、マウス、マイク、タッチパッド、電子ペン、又はその他の種類の入力装置といった一以上の入力装置(510)を備えてよい。また、コンピューティングシステム(500)は、スクリーン(例えば、液晶ディスプレイ(LCD)、プラズマディスプレイ、タッチスクリーン、ブラウン管(CRT)モニター、プロジェクター、又はその他の表示装置)、プリンター、外部記憶装置、又はその他の出力装置等、一以上の出力装置(508)を備えてよい。一以上の出力装置は、入力装置と同じでも良いし、異なってもよい。コンピューティングシステム(500)は、ネットワークインターフェース接続(図示なし)を介してネットワーク(512)(例えば、ローカルエリアネットワーク(LAN)、インターネット等の広域ネットワーク(WAN)、モバイルネットワーク、又はその他の種類のネットワーク)に接続されてよい。入力装置と出力装置は、ローカルにまたはリモートに(例えば、ネットワーク(512)を介して)コンピュータプロセッサー(502)、メモリ(504)及び記憶装置(506)に接続されてよい。コンピューティングシステムには多くの異なる種類があり、前述の入力装置及び出力装置は他の形態をとってもよい。
本発明の実施形態を実施するためのコンピューター読取り可能なプログラムコードの形態をとるソフトウェア指示は、全て又は一部が、一時的に又は恒久的に、CD、DVD、記憶装置、ディスケット、テープ、フラッシュメモリ、物理メモリ、又はその他のコンピューター読取り可能な記憶媒体といった非一時的なコンピューター読取り可能な媒体に記憶されてよい。具体的には、ソフトウェア指示は、プロセッサーによって実行された際に本発明の実施形態を実施するように構成されたコンピューター読取り可能なプログラムコードに相当し得る。
更に、前述のコンピューティングシステム(500)の構成要素は、そのうち一つ以上が遠隔に配され、ネットワーク(512)を介してその他の構成要素と接続されてもよい。また、本発明の一以上の実施形態は、複数のノードを有する分散システム上で実施されてもよく、本発明の各部は、分散システム内の異なるノード上に位置してもよい。本発明の一実施形態では、ノードは別個のコンピューティング装置に相当する。あるいは、ノードは関連する物理メモリを有するコンピュータプロセッサーに相当してもよい。あるいは、ノードは、共有メモリ及び/又は情報源を有するコンピュータプロセッサー又はコンピュータプロセッサーのマイクロコアに相当してもよい。
本発明の一以上の実施形態は、以下のうち一以上の効果を有し得る:ユーザーが文書の物理的コピーとの相互作用を望む場合に、物理的世界とデジタル世界との橋渡しができる;ユーザーはARメガネを装着せずにAR環境と相互作用できる; 物理的文書のデジタルコピーの位置を知らずにコンピュータライズされたサーチ機能を用いて物理的文書を処理することができる;物理的文書のデジタルコピーに直接アクセスすることなく(すなわち、ユーザーが文書の物理的コピーのみを利用可能であるとき)コンピュータライズされたサーチ機能を用いて物理的文書を処理することができる;ユーザーが文書の物理的コピーを扱うことを好む場合にコンピュータライズされたサーチ機能を用いて物理的文書を処理することができる;など。
限られた数の実施形態に関連して本発明を説明したが、本開示の恩恵に浴する当業者であれば、ここに開示された本発明の範囲から逸脱しない他の実施形態が考案可能であると分かるだろう。したがって、本発明の範囲は、添付の特許請求の範囲によってのみ限定されるものである。

Claims (14)

  1. コンピューターを用いて、物理的文書の画像を処理し、前記物理的文書のデジタルサーチを可能にする方法であって、前記コンピューターが、
    前記物理的文書のデジタルコピーを取得する工程と、
    前記物理的文書内の関心点をサーチせよとの指示を受領する工程と、
    前記物理的文書を撮像し、前記関心点が前記物理的文書の表面上にあると判定する工程と、
    プロジェクターを用いて、前記物理的文書の表面上に、前記関心点に物理的に重なる視覚補助要素を投影して前記物理的文書の表面上にある関心点を強調表示する工程と、を含む方法であり、
    前記物理的文書は複数の物理的文書の束内のページであり、
    前記デジタルコピーは前記束内の全てのページを含み、
    前記コンピューターが、
    前記束の最上位ページを撮像する工程と、
    前記関心点が前記最上位ページの表面上にあると判定する工程と、
    プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある関心点を強調表示する工程と、を更に含む方法であり、
    前記コンピューターが、
    前記最上位ページを撮像し、前記関心点が前記最上位ページ上にないと判定する工程と、
    前記最上位ページを前記束のデジタルコピー内の前記関心点を含むページと比較する工程と、
    前記比較に基づいて、前記束を前記関心点の位置までトラバースせよと、前記トラバースする前記束における割合又はページ数が含まれる、更新された指示を出力する工程と、を更に含む方法
  2. 前記強調表示される関心点は、前記束内で最初に現れる関心点であり、
    前記コンピューターが、
    前記束内で2番目に現れる関心点をサーチせよとの指示を受領する工程と、
    前記2番目に現れる関心点を探す前記束のデジタルコピーのサーチに基づいて、前記束を前記2番目に現れる関心点の位置までトラバースせよとの指示を出力する工程と、
    前記束を撮像し、前記2番目に現れる関心点が前記束の最上位ページの表面上にあると判定する工程と、
    プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある2番目に現れる関心点を強調表示する工程と、を更に含む請求項に記載の方法。
  3. 前記物理的文書は複数の物理的文書の束内のページであり、
    前記物理的文書のデジタルコピーを取得する工程は、
    前記コンピューターが、
    前記束の各ページを撮像してデジタル化する工程と、
    前記撮像されてデジタル化された束を前記複数の物理的文書のデジタルコピーとしてメモリに記憶する工程と、
    前記束の最上位ページを撮像する工程と、
    前記束の前記最上位ページを前記束の前記デジタルコピーのページと比較する工程と、
    前記比較に基づいて、前記束の前記最上位ページが前記束のデジタルコピーのページの一つと合致すると判定する工程と、
    前記判定に基づいて、前記メモリから前記束のデジタルコピーを取り出す工程と、を更に含む請求項1又は2に記載の方法。
  4. 前記物理的文書内の関心点をサーチせよとの指示は、音声コマンドとしてユーザーから受領される請求項1からのいずれか一項に記載の方法。
  5. 前記束を前記関心点の位置までトラバースせよとの指示は、プロジェクターにより、前記複数の物理的文書から所定の距離内の表面上に投影される請求項1から4のいずれか一項に記載の方法。
  6. 前記束を前記関心点の位置までトラバースせよとの指示は、前記関心点が前記最上位ページ上にあると判定されるまで、継続して投影され、更新される請求項1から5のいずれか一項に記載の方法。
  7. 前記物理的文書は、イメージャーや前記プロジェクターを備えるインタラクティブキャプチャを伴う投影装置(PIC装置)を用いて撮像され、
    前記デジタルコピーをサーチするのに光学的文字認識及び非テキスト内容分析が用いられる請求項1からのいずれか一項に記載の方法。
  8. 前記関心点は、テキスト文字、非テキスト文字、テキストの列、画像、グラフ及び表からなるグループより選択されたものである請求項1からのいずれか一項に記載の方法。
  9. 物理的文書の画像を処理し、前記物理的文書のデジタルサーチを可能にするためのプログラムを格納した、非一時的なコンピューター読取り可能な媒体(CRM)において、前記プログラムは、コンピューターに
    前記物理的文書のデジタルコピーを取得させ、
    前記物理的文書内で関心点をサーチせよとの指示を受領させ、
    前記物理的文書を撮像して前記関心点が前記物理的文書の表面上にあると判定させ、
    プロジェクターを用いて、前記物理的文書の表面上に、前記関心点に物理的に重なる視覚補助要素を投影して前記物理的文書の表面上にある関心点を強調表示させるプログラムであり、
    前記物理的文書は複数の物理的文書の束内のページであり、
    前記デジタルコピーは前記束内の全てのページを含み、
    前記コンピューター読取り可能なプログラムコードは、コンピューターに更に
    前記束の最上位ページを撮像させ、
    前記関心点が前記最上位ページの表面上にあると判定させ、
    プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある関心点を強調表示させるプログラムであり、
    前記プログラムは、コンピューターに更に
    前記最上位ページを撮像させ、前記関心点が前記最上位ページ上にないと判定させ、
    前記最上位ページを前記束のデジタルコピー内の前記関心点を含むページと比較させ、
    前記比較に基づいて、前記束を前記関心点の位置までトラバースせよと、前記トラバースする前記束における割合又はページ数が含まれる、更新された指示を出力させるプログラム
  10. 前記強調表示される関心点は、前記束内で最初に現れる関心点であり、
    前記プログラムは、コンピューターに更に
    前記束内で2番目に現れる関心点をサーチせよとの指示を受領させ、
    前記2番目に現れる関心点を探す前記束のデジタルコピーのサーチに基づいて、前記束を前記2番目に現れる関心点の位置までトラバースせよとの指示を出力させ、
    前記束を撮像させ、前記2番目に現れる関心点が前記束の最上位ページの表面上にあると判定させ、
    プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある2番目に現れる関心点を強調表示させる請求項に記載のプログラム。
  11. 前記物理的文書は、イメージャーや前記プロジェクターを備えるインタラクティブキャプチャを伴う投影装置(PIC装置)を用いて撮像され、
    前記デジタルコピーをサーチするのに光学的文字認識及び非テキスト内容分析が用いられ、
    前記関心点は、テキスト文字、非テキスト文字、テキストの列、画像、グラフ及び表からなるグループより選択されたものである請求項9又は10に記載のプログラム。
  12. 物理的文書の画像を処理し、前記物理的文書のデジタルサーチを可能にするためのシステムであって、前記システムは
    メモリと、
    前記メモリに接続されたコンピュータプロセッサーを備え、
    前記コンピュータプロセッサーは、
    前記物理的文書のデジタルコピーを取得し、
    前記物理的文書内で関心点をサーチせよとの指示を受領し、
    前記物理的文書を撮像し、前記関心点が前記物理的文書の表面上にあると判定し、
    プロジェクターを用いて、前記物理的文書の表面上に、前記関心点に物理的に重なる視覚補助要素を投影して前記物理的文書の表面上にある関心点を強調表示するシステムであり、
    前記物理的文書は複数の物理的文書の束内のページであり、
    前記デジタルコピーは前記束内の全てのページを含み、
    前記コンピュータプロセッサーは、更に
    前記束の最上位ページを撮像し、
    前記関心点が前記最上位ページの表面上にあると判定し、
    プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある関心点を強調表示するシステムであり、
    前記コンピュータプロセッサーは、更に
    前記最上位ページを撮像し、前記関心点が前記最上位ページ上にないと判定し、
    前記最上位ページを前記束のデジタルコピー内の前記関心点を含むページと比較し、
    前記比較に基づいて、前記束を前記関心点の位置までトラバースせよと、前記トラバースする前記束における割合又はページ数が含まれる、更新された指示を出力するシステム
  13. 前記強調表示される関心点は、前記束内で最初に現れる関心点であり、
    前記コンピュータプロセッサーは、更に
    前記束内で2番目に現れる関心点をサーチせよとの指示を受領し、
    前記2番目に現れる関心点を探す前記束のデジタルコピーのサーチに基づいて、前記束を前記2番目に現れる関心点の位置までトラバースせよとの指示を出力し、
    前記束を撮像し、前記2番目に現れる関心点が前記束の最上位ページの表面上にあると判定し、
    プロジェクターを用いて、前記最上位ページの表面上に、前記視覚補助要素を投影して前記最上位ページの表面上にある2番目に現れる関心点を強調表示する請求項1に記載のシステム。
  14. 前記物理的文書は、イメージャーや前記プロジェクターを備えるインタラクティブキャプチャを伴う投影装置(PIC装置)を用いて撮像され、
    前記PIC装置は前記コンピュータプロセッサーに制御され、
    前記デジタルコピーをサーチするのに光学的文字認識及び非テキスト内容分析が用いられ、
    前記関心点は、テキスト文字、非テキスト文字、テキストの列、画像、グラフ及び表から
    なるグループより選択されたものである請求項12又は13に記載のシステム。
JP2019227023A 2018-12-28 2019-12-17 拡張現実の文書処理 Active JP7440256B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/235,337 US11080547B2 (en) 2018-12-28 2018-12-28 Augmented reality document processing
US16/235,337 2018-12-28

Publications (3)

Publication Number Publication Date
JP2020149668A JP2020149668A (ja) 2020-09-17
JP2020149668A5 JP2020149668A5 (ja) 2022-07-28
JP7440256B2 true JP7440256B2 (ja) 2024-02-28

Family

ID=71124018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019227023A Active JP7440256B2 (ja) 2018-12-28 2019-12-17 拡張現実の文書処理

Country Status (2)

Country Link
US (1) US11080547B2 (ja)
JP (1) JP7440256B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969464B (zh) * 2021-10-15 2023-05-09 淮阴师范学院 基于毫米波通信的智能可视化显示系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120008820A1 (en) 2010-07-08 2012-01-12 Kahle Todd A Microform Word Search Method and Apparatus
JP2012043400A (ja) 2010-08-16 2012-03-01 Fuji Xerox Co Ltd 情報処理システム、情報処理方法、およびコンピュータプログラム
JP2013046151A (ja) 2011-08-23 2013-03-04 Ricoh Co Ltd プロジェクタ、投影システム及び情報検索表示方法
JP2013254437A (ja) 2012-06-08 2013-12-19 Pfu Ltd 画像処理装置、画像読取装置、画像処理方法及び画像処理プログラム
JP2015011586A (ja) 2013-06-28 2015-01-19 キヤノン株式会社 情報提示装置、情報提示システム、情報提示方法及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260044B1 (en) * 1998-02-04 2001-07-10 Nugenesis Technologies Corporation Information storage and retrieval system for storing and retrieving the visual form of information from an application in a database
US9501467B2 (en) * 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
WO2014027433A1 (ja) * 2012-08-15 2014-02-20 日本電気株式会社 情報提供装置、情報提供方法、及び、プログラム
WO2014126553A1 (en) * 2013-02-13 2014-08-21 Hewlett-Packard Development Company, L.P. Paper feeding for an imaging system
US9977785B2 (en) * 2014-01-03 2018-05-22 Legistek Corporation Method and computer-readable medium for presenting displayable content to an audience
WO2018107104A1 (en) * 2016-12-08 2018-06-14 ViaTech Publishing Solutions, Inc. System and method to facilitate content distribution

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120008820A1 (en) 2010-07-08 2012-01-12 Kahle Todd A Microform Word Search Method and Apparatus
JP2012043400A (ja) 2010-08-16 2012-03-01 Fuji Xerox Co Ltd 情報処理システム、情報処理方法、およびコンピュータプログラム
JP2013046151A (ja) 2011-08-23 2013-03-04 Ricoh Co Ltd プロジェクタ、投影システム及び情報検索表示方法
JP2013254437A (ja) 2012-06-08 2013-12-19 Pfu Ltd 画像処理装置、画像読取装置、画像処理方法及び画像処理プログラム
JP2015011586A (ja) 2013-06-28 2015-01-19 キヤノン株式会社 情報提示装置、情報提示システム、情報提示方法及びプログラム

Also Published As

Publication number Publication date
JP2020149668A (ja) 2020-09-17
US20200210744A1 (en) 2020-07-02
US11080547B2 (en) 2021-08-03

Similar Documents

Publication Publication Date Title
CN109215017B (zh) 图片处理方法、装置、用户终端、服务器及存储介质
JP2017130929A (ja) 撮像装置により取得された文書画像の補正方法及び補正装置
JP2010073114A (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
US10902277B2 (en) Multi-region detection for images
TW201501016A (zh) 資料搜尋方法與其電子裝置
CN105607825B (zh) 用于图像处理的方法和设备
US8532431B2 (en) Image search apparatus, image search method, and storage medium for matching images with search conditions using image feature amounts
JP7440256B2 (ja) 拡張現実の文書処理
US9864750B2 (en) Objectification with deep searchability
US9798724B2 (en) Document discovery strategy to find original electronic file from hardcopy version
US20150138077A1 (en) Display system and display controll device
US20170344820A1 (en) Method and system of identifying fillable fields of an electronic form
JP7398945B2 (ja) 拡張現実の文書編集方法、プログラム及びシステム
CN113273167B (zh) 数据处理设备、方法和存储介质
US20170053003A1 (en) System, method for processing information, and information terminal
KR20140134844A (ko) 객체 기반 사진 촬영 방법 및 장치
JP7019825B2 (ja) 画像分類装置及び方法
JP2014204268A (ja) 画像処理装置および画像処理プログラム
US10976721B2 (en) Information processing apparatus, method, and medium to generate management three-dimensional model data
US9912834B2 (en) Document camera device and cutout assistance method
JP2017142690A (ja) 情報処理装置及びその制御方法
WO2020145164A1 (ja) 画像処理装置、画像処理プログラム、及び画像処理方法
JP2021144302A (ja) 情報処理装置及び情報処理プログラム
JP2023020180A (ja) 画像管理装置、画像管理方法、及びプログラム
JP2022066137A (ja) 情報処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220720

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220720

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240215

R150 Certificate of patent or registration of utility model

Ref document number: 7440256

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150