JP5752200B2 - 取り込まれたレンダリングテキストに基づくコンテキスト動的広告 - Google Patents

取り込まれたレンダリングテキストに基づくコンテキスト動的広告 Download PDF

Info

Publication number
JP5752200B2
JP5752200B2 JP2013191813A JP2013191813A JP5752200B2 JP 5752200 B2 JP5752200 B2 JP 5752200B2 JP 2013191813 A JP2013191813 A JP 2013191813A JP 2013191813 A JP2013191813 A JP 2013191813A JP 5752200 B2 JP5752200 B2 JP 5752200B2
Authority
JP
Japan
Prior art keywords
document
user
text
captured
electronic version
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013191813A
Other languages
English (en)
Other versions
JP2014041620A (ja
Inventor
マーティン ティー キング
マーティン ティー キング
デイル エル グローヴァー
デイル エル グローヴァー
クリフォード エイ クシュラー
クリフォード エイ クシュラー
ジェイムズ クウェンティン スタッフォード−フレイザー
ジェイムズ クウェンティン スタッフォード−フレイザー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2014041620A publication Critical patent/JP2014041620A/ja
Application granted granted Critical
Publication of JP5752200B2 publication Critical patent/JP5752200B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Description

(関連出願への相互参照)
本出願は、その全体が引用により本明細書に組み込まれる「TRIGGERING ACTIONS IN RESPONSE TO OPTICALLY OR ACOUSTICALLY CAPTURING KEYWORDS FROM A RENDERED DOCUMENT(レンダリング文書から光学的又は音響的にキーワードを取り込むことに応答したトリガ動作)」という名称で2005年4月1日に出願された米国特許出願第11/097,103号の一部継続出願である。
本出願は、その全体が引用により本明細書に組み込まれる「CONTEXTUAL DYNAMIC ADVERTISING BASED UPON CAPTURED RENDERED TEXT(取り込まれたレンダリングテキストに基づくコンテキスト動的広告)」という名称で2006年6月6日に出願された米国仮特許出願第60/811,623号に対する優先権を主張する。
本出願は、以下の米国特許出願に関連し、これらの各々は全体が引用により本明細書に組み込まれる:
2004年12月3日に出願された米国特許出願第11/004,637号、
「METHODS AND SYSTEMS FOR INITIATING APPLICATION PROCESSES BY DATA CAPTURE FROM RENDERED DOCUMENTS(レンダリング文書からのデータ取り込みによってアプリケーションプロセスを開始するための方法及びシステム)」という名称で2005年4月1日に出願された米国特許出願第11/097,961号、
「DETERMINING ACTIONS INVOLVING CAPTURED INFORMATION AND ELECTRONIC CONTENT ASSOCIATED WITH RENDERED DOCUMENTS(レンダリング文書に関連付けられた取り込み情報及び電子コンテンツを包含する動作の決定)」という名称で2005年4月1日に出願された米国特許出願第11/097,093号、
「CONTENT ACCESS WITH HANDHELD DOCUMENT DATA CAPTURE DEVICES(ハンドヘルド文書データ取り込みデバイスによるコンテンツアクセス)」という名称で2005年4月1日に出願された米国特許出願第11/098,038号、
「SEARCH ENGINES AND SYSTEMS WITH HANDHELD DOCUMENT DATA CAPTURE DEVICES(ハンドヘルド文書データ取り込みデバイスを備えたサーチエンジン及びシステム)」という名称で2005年4月1日に出願された米国特許出願第11/098,014号、
「SEARCHING AND ACCESSING DOCUMENTS ON PRIVATE NETWORKS FOR USE WITH CAPTURES FROM RENDERED DOCUMENTS(レンダリング文書からの取り込みに使用されるプライベートネットワーク上の文書のサーチ及びアクセス)」という名称で2005年4月1日に出願された米国特許出願第11/098,043号、
「INFORMATION GATHERING SYSTEM AND METHOD(情報収集システム及び方法)」という名称で2005年4月1日に出願された米国特許出願第11/097,981号、
「DOCUMENT ENHANCEMENT SYSTEM AND METHOD(文書拡張システム及び方法)」という名称で2005年4月1日に出願された米国特許出願第11/097,089号、
「PUBLISHING TECHNIQUES FOR ADDING VALUE TO A RENDERED DOCUMENT(レンダリング文書に値を付加するための発行技術)」という名称で2005年4月1日に出願された米国特許出願第11/097,835号、
「ARCHIVE OF TEXT CAPTURES FROM RENDERED DOCUMENTS(レンダリング文書からのテキスト取り込みのアーカイブ)」という名称で2005年4月1日に出願された米国特許出願第11/098,016号、
「ADDING INFORMATION OR FUNCTIONALITY TO A RENDERED DOCUMENT VIA ASSOCIATION WITH AN ELECTRONIC COUNTERPART(対応電子文書との関連付けを介したレンダリング文書への情報又は機能の付加)」という名称で2005年4月1日に出願された米国特許出願第11/097,828号、
「AGGREGATE ANALYSIS OF TEXT CAPTURES PERFORMED BY MULTIPLE USERS FROM RENDERED DOCUMENTS(レンダリング文書から複数のユーザによって行われるテキスト取り込みのアグリゲート解析)」という名称で2005年4月1日に出願された米国特許出願第11/097,833号、
「ESTABLISHING AN INTERACTIVE ENVIRONMENT FOR RENDERED DOCUMENTS(レンダリング文書のためのインタラクティブ環境の設定)」という名称で2005年4月1日に出願された米国特許出願第11/097,836号、
「DATA CAPTURE FROM RENDERED DOCUMENTS USING HANDHELD DEVICE(ハンドヘルドデバイスを使用したレンダリング文書からのデータ取り込み)」という名称で2005年4月1日に出願された米国特許出願第11/098,042号、
「CAPTURING TEXT FROM RENDERED DOCUMENTS USING SUPPLEMENTAL INFORMATION(補足情報を使用したレンダリング文書からのテキストの取り込み)」という名称で2005年4月1日に出願された米国特許出願第11/096,704号、
「PROCESSING TECHNIQUES FOR VISUAL CAPTURE DATA FROM A RENDERED DOCUMENT(レンダリング文書からの視覚的な取り込みデータのための処理技術)」という名称で2005年4月19日に出願された米国特許出願第11/110,353号、
「PROCESSING TECHNIQUES FOR TEXT CAPTURE FROM A RENDERED DOCUMENT(レンダリング文書からのテキスト取り込みのための処理技術)」という名称で2005年5月17日に出願された米国特許出願第11/131,945号、
「AUTOMATIC MODIFICATION OF WEB PAGES(ウェブページの自動修正)」という名称で2005年7月19日に出願された米国特許出願第11/185,908号、
「SCANNER HAVING CONNECTED AND UNCONNECTED OPERATIONAL BEHAVIORS(接続及び未接続オペレーション行動を有するスキャナ)」という名称で2005年8月18日に出願された米国特許出願第11/208,408号、
「LOCATING ELECTRONIC INSTANCES OF DOCUMENTS BASED ON RENDERED INSTANCES, DOCUMENT FRAGMENT DIGEST GENERATION, AND DIGEST BASED DOCUMENT FRAGMENT DETERMINATION(レンダーインスタンス、文書フラグメントダイジェスト生成、及びダイジェストベース文書フラグメント決定に基づく文書の電子インスタンスの位置付け)」という名称で2005年8月18日に出願された米国特許出願第11/208,457号、
「METHODS, SYSTEMS AND COMPUTER PROGRAM PRODUCTS FOR DATA GATHERING IN A DIGITAL AND HARD COPY DOCUMENT ENVIRONMENT(デジタル及びハードコピー文書環境におけるデータ収集のための方法、システム、及びコンピュータプログラム製品)」という名称で2005年8月18日に出願された米国特許出願第11/208,458号、
「APPLYING SCANNED INFORMATION TO IDENTIFY CONTENT(コンテンツを識別するためのスキャン情報の適用)」という名称で2005年8月18日に出願された米国特許出願第11/208,461号、
「A PORTABLE SCANNING DEVICE(ポータブルスキャンデバイス)」という名称で2005年8月23日に出願された米国特許出願第11/209,333号、
「A METHOD AND SYSTEM FOR CHARACTER RECOGNITION(文字認識のための方法及びシステム)」という名称で2005年8月23日に出願された米国特許出願第11/210,260号、
「SECURE DATA GATHERING FROM RENDERED DOCUMENTS(レンダリング文書からの安全なデータ収集)」という名称で2005年9月27日に出願された米国特許出願第11/236,440号、
「HANDHELD DEVICE FOR CAPTURING TEXT FROM BOTH A DOCUMENT PRINTED ON PAPER AND A DOCUMENT DISPLAYED ON A DYNAMIC DISPLAY DEVICE(紙に印刷された文書及び動的ディスプレイデバイスに表示された文書の両方からテキストを取り込むためのハンドヘルドデバイス)」という名称で2005年9月27日に出願された米国特許出願第11/236,330号、
「ASSOCIATION OF A PORTABLE SCANNER WITH INPUT/OUTPUT AND STORAGE DEVICES(ポータブルスキャナと入力/出力及び記憶装置との関連付け)」という名称で2006年2月28日に出願された米国特許出願第11/365,983号、
「PORTABLE SCANNING AND MEMORY DEVICE(ポータブルスキャン及びメモリデバイス)」という名称で2006年5月11日に出願された米国特許出願第11/432,731号、
「A SYSTEM AND METHOD FOR CHARACTER RECOGNITION(文字認識のためのシステム及び方法)」という名称で2005年4月1日に出願された国際特許出願第PCT/US05/11533号、
「SCANNING APPARATUS AND RELATED TECHNIQUES(スキャン装置及び関連技術)」という名称で2005年4月6日に出願された国際特許出願第PCT/US05/13586号、
「ADDING VALUE TO A RENDERED DOCUMENT(レンダリング文書への値の付加)」という名称で2005年4月12日に出願された国際特許出願第PCT/US05/12510号。
本出願は、以下の米国仮特許出願に更に関連し、これらの全体は引用により本明細書に組み込まれる:
2004年4月1日に出願された米国出願第60/559,226号、2004年4月1日に出願された出願第60/558,893号、2004年4月1日に出願された出願第60/558,968号、2004年4月1日に出願された出願第60/558,867号、2004年4月1日に出願された出願第60/559,278号、2004年4月1日に出願された出願第60/559,279号、2004年4月1日に出願された出願第60/559,265号、2004年4月1日に出願された出願第60/559,277号、2004年4月1日に出願された出願第60/558,969号、2004年4月1日に出願された出願第60/558,892号、2004年4月1日に出願された出願第60/558,760号、2004年4月1日に出願された出願第60/558,717号、2004年4月1日に出願された出願第60/558,499号、2004年4月1日に出願された出願第60/558,370号、2004年4月1日に出願された出願第60/558,789号、2004年4月1日に出願された出願第60/558,791号、2004年4月1日に出願された出願第60/558,527号、2004年4月2日に出願された出願第60/559,125号、2004年4月2日に出願された出願第60/558,909号、2004年4月2日に出願された出願第60/559,033号、2004年4月2日に出願された出願第60/559,127号、2004年4月2日に出願された出願第60/559,087号、2004年4月2日に出願された出願第60/559,131号、2004年4月6日に出願された出願第60/559,766号、2004年4月12日に出願された出願第60/561,768号、2004年4月19日に出願された出願第60/563,520号、2004年4月19日に出願された出願第60/563,485号、2004年4月23日に出願された出願第60/564,688号、2004年4月23日に出願された出願第60/564,846号、2004年4月30日に出願された出願第60/566,667号、2004年5月14日に出願された出願第60/571,381号、2004年5月14日に出願された出願第60/571,560号、2004年5月17日に出願された出願第60/571,715号、2004年7月19日に出願された出願第60/589,203号、2004年7月19日に出願された出願第60/589,201号、2004年7月19日に出願された出願第60/589,202号、2004年8月2日に出願された出願第60/598,821号、2004年8月18日に出願された出願第60/602,956号、2004年8月18日に出願された出願第60/602,925号、2004年8月18日に出願された出願第60/602,947号、2004年8月18日に出願された出願第60/602,897号、2004年8月18日に出願された出願第60/602,896号、2004年8月18日に出願された出願第60/602,930号、2004年8月18日に出願された出願第60/602,898号、2004年8月19日に出願された出願第60/603,466号、2004年8月19日に出願された出願第60/603,082号、2004年8月19日に出願された出願第60/603,081号、2004年8月20日に出願された出願第60/603,498号、2004年8月20日に出願された出願第60/603,358号、2004年8月23日に出願された出願第60/604,103号、2004年8月23日に出願された出願第60/604,098号、2004年8月23日に出願された出願第60/604,100号、2004年8月23日に出願された出願第60/604,102号、2004年8月27日に出願された出願第60/605,229号、2004年8月27日に出願された出願第60/605,105号、2004年9月27日に出願された出願第60/613,243号、2004年9月27日に出願された出願第60/613,628号、2004年9月27日に出願された出願第60/613,632号、2004年9月27日に出願された出願第60/613,589号、2004年9月27日に出願された出願第60/613,242号、2004年9月27日に出願された出願第60/613,602号、2004年9月27日に出願された出願第60/613,340号、2004年9月27日に出願された出願第60/613,634号、2004年9月27日に出願された出願第60/613,461号、2004年9月27日に出願された出願第60/613,455号、2004年9月27日に出願された出願第60/613,460号、2004年9月27日に出願された出願第60/613,400号、2004年9月27日に出願された出願第60/613,456号、2004年9月27日に出願された出願第60/613,341号、2004年9月27日に出願された出願第60/613,361号、2004年9月27日に出願された出願第60/613,454号、2004年9月27日に出願された出願第60/613,339号、2004年9月27日に出願された出願第60/613,633号、2004年10月1日に出願された出願第60/615,378号、2004年10月1日に出願された出願第60/615,112号、2004年10月1日に出願された出願第60/615,538号、2004年10月7日に出願された出願第60/617,122号、2004年10月28日に出願された出願第60/622,906号、2004年12月6日に出願された出願第60/633,452号、2004年12月6日に出願された出願第60/633,678号、2004年12月6日に出願された出願第60/633,486号、2004年12月6日に出願された出願第60/633,453号、2004年12月9日に出願された出願第60/634,627号、2004年12月9日に出願された出願第60/634,739号、2005年1月26日に出願された出願第60/647,684号、2005年1月31日に出願された出願第60/648,746号、2005年2月15日に出願された出願第60/653,372号、2005年2月16日に出願された出願第60/653,663号、2005年2月16日に出願された出願第60/653,669号、2005年2月16日に出願された出願第60/653,899号、2005年2月16日に出願された出願第60/653,679号、2005年2月16日に出願された出願第60/653,847号、2005年2月17日に出願された出願第60/654,379号、2005年2月18日に出願された出願第60/654,368号、2005年2月18日に出願された出願第60/654,326号、2005年2月18日に出願された出願第60/654,196号、2005年2月22日に出願された出願第60/655,279号、2005年2月22日に出願された出願第60/655,280号、2005年2月22日に出願された出願第60/655,987号、2005年2月22日に出願された出願第60/655,697号、2005年2月22日に出願された出願第60/655,281号、2005年2月28日に出願された出願第60/657,309号、2006年7月24日に出願された出願第60/833,131号、2006年9月8日に出願された出願第60/843,362号、2006年9月15日に出願された出願第60/844,894号、2006年9月15日に出願された出願第60/844,893号、2006年9月18日に出願された出願第60/845,604号、及び2007年4月5日に出願された出願第60/910,438号。
(技術分野)
記載の技術は、レンダリング文書との対話の分野を対象とし、更に具体的にはレンダリング文書から取り込まれた情報に応答して動作することを対象とする。
紙文書は、コンピュータ時代における紙文書の急増により分かるように永久的な魅力を有する。現在ほど紙文書の印刷及び発行が容易なときはない。電子文書の方が複製、送信、サーチ、及び編集が容易であるにも関わらず、紙文書の方が優勢である。
紙文書の普及と電子文書の利点を考慮すると、両方の利益を組み合わせることが有用となる。
コアシステムの1つの実施形態における情報の流れを示すデータフロー図である。 一般的な動作環境のコンテキストにおける本システムの典型的な実装に含まれるコンポーネントのコンポーネント図である。 スキャナの一実施形態を示すブロック図である。 システムが動作する典型的な環境を示すシステム図である。 ユーザのキーワードの取り込みに応答して動作を実行するためにシステムによって通常実行されるステップを示すフロー図である。 キーワード動作テーブルのサンプルコンテンツを示すテーブル図である。 特定の文書に対する文書動作マップのサンプルコンテンツを示すテーブル図である。 キーワードに関係付けられていないユーザ取り込み資料に応答して動作を実行するためにシステムによって通常実行されるステップを示すフロー図である。 文書の識別に応答して広告を提示するためにシステムによって通常実行されるステップを示すフロー図である。
概要
レンダリング文書から光学的又は音響的にキーワードを取り込むことに応答して、或いは取り込まれたキーワードに基づいて文書を識別することに応答して、広告などの動作をトリガするためのソフトウェア及び/又はハードウェアシステムについて説明する(「システム」)。本明細書で使用されるキーワードとは、1つ又はそれ以上のワード、アイコン、記号、又は画像を意味する。本出願では用語「ワード」及び「複数形のワード」が使用されることが多いが、幾つかの実施形態では、アイコン、記号、又は画像を用いることができる。本明細書で使用されるキーワードはまた、1つ又はそれ以上の隣接する記号から構成されるフレーズを指す。本明細書で使用されるキーワードは、レンダリング文書で扱われたトピック又はサブジェクトに関するワード、或いは取り込みに応答して識別されたレンダリング文書の一部分を含む。
キーワードは、「過負荷状態」であると考えられ、すなわち、キーワードは、テキスト又は記号のようなユーザにとって一般的な(例えば視覚的な)意味を超えた、ある関連する意味或いは動作を有する。幾つかの実施形態では、キーワードと意味又は動作との間の関連付けは、マークアッププロセス又はデータによって設定される。幾つかの実施形態では、キーワード又は文書と意味又は動作との間の関連付けは、取り込み又は識別が行われた時点でシステムに既知となる。幾つかの実施形態では、キーワード又は文書と意味又は動作との間の関連付けは、取り込み又は識別が行われた後に設定される。意味又は動作は、任意選択的に、関連の注釈又は関係のあるコンテンツを表示する段階、ディスプレイ上で見ることができる幾つかのキーワードが特別な意味を有するか或いはすぐに実施可能である(例えば、これらはマウスクリックに応答し、カーソルがキーワードの上に止まった場合にシステムが利用可能な選択肢のメニューを提示するなど)ことを動的ディスプレイ上に視覚的に示す段階を含むことができる。
幾つかの実施形態では、本システムは、文書を識別し、ユーザに提示される広告をトリガ及び選択するために文書のコンテンツを使用する。場合によっては、システムは、文書を解析して、文書のコンテンツを1つ又はそれ以上のキーワードに関連付けることができる。場合によっては、システムは、全文書のコンテンツに基づいて広告(動作)を選択する。場合によっては、システムは、文書の一部分に基づいて広告を選択する。場合によっては、システムは、文書を識別するときに使用されていない文書のコンテンツに基づいて広告を選択する。
第1部−導入部
1.システムの性質
対応電子文書を有するあらゆる紙文書に対して、対応電子文書を識別できる情報の離散的な量が紙文書において存在する。幾つかの実施形態では、システムは、例えばハンドヘルドスキャナを用いて紙文書から取り込まれたテキストのサンプルを使用し、文書の対応電子文書を識別して位置特定する。ほとんどの場合、機能によって必要とされるテキストの量は極めて小さく、文書からのテキストの数ワードが、紙文書に対する識別子として及びその対応電子文書へのリンクとして機能できることが多い。更に、本システムは、その数ワードを使用して、文書だけでなく文書内のロケーションも識別することができる。
従って、紙文書とその対応デジタル文書は、本明細書で説明されたシステムを使用して多くの有用な方法で関連付けることができる。
1.1.将来の俯瞰
本システムが、紙文書におけるテキストの一部を設定された特定のデジタルエンティティに関連付けると、システムは、その関連付けに膨大な量の機能性を構築することができる。
多くの紙文書が、ワールドワイドウェブ上でもしくは他の何らかのオンラインデータベース又は文書コーパスからアクセス可能である、或いは手数料又は購読料の支払いなどに応じてアクセス可能にすることができる対応電子文書を有するケースが増えてきた。最も単純なレベルでは、ユーザが紙文書の数ワードをスキャンしたときに、システムは、この電子文書又はその一部分を取り出す、或いはこれを表示する、誰かに電子メールする、購入する、印刷する、もしくはウェブページに掲載することができる。更なる実施例として、ある人が朝食中に読んでいる本の数ワードをスキャンすることにより、その人が出勤するために運転を始めた時点からその人の車内にあるオーディオ−ブック版を読み始めることができ、或いは、プリンターカートリッジのシリアルナンバーをスキャンすることにより、交換品の注文プロセスを開始することができる。
本システムは、文書を書く、印刷する、及び出版するといった現在のプロセスを変えることを必要とせずに、「紙/デジタル統合」のこれら及び他の多くの実施例を実装し、こうした従来のレンダリング文書にデジタル機能性の全く新しいレイヤをもたらす。
1.2.用語
本システムの一般的な使用は、光学スキャナを使用して紙文書からテキストをスキャンすることから始まるが、他のタイプの文書からの他の取り込み方法も等しく適用可能である点に留意することは重要である。従って、システムは、レンダリング文書からテキストをスキャン又は取り込むものとして説明された場合があり、ここでこれらの用語は以下のように定義される。
レンダリング文書は、印刷文書、或いはディスプレイ又はモニタ上に表示された文書である。永久的な形式又は一時的な表示のいずれであっても、人間に知覚可能な文書である。
スキャン又は取り込みは、レンダリング文書から情報を取得するための体系化された検査プロセスである。このプロセスは、スキャナ又はカメラ(例えば携帯電話のカメラ)を使用した光学的取り込みを含むことができ、或いは文書から音声取り込み装置への読み込み又はキーパッド又はキーボードへのタイプを含むことができる。幾つかの実施形態では、光学的取り込みは、動的ディスプレイの全て又は一部上でどのデータがユーザに光学的に可視であるか(例えばレンダリングされるか)を判定することによって行われる。可視データのこの光学的取り込みは、ディスプレイの記憶バッファを解析することによって(例えば、ディスプレイバッファ内に記憶された画像に光学式文字認識又は他の画像解析を実施することによって)、動的表示に対して行われた変更を傍受し解析することによって(例えば、ユーザがウィンドウ内をスクロールすることによって見えるデータを変更したときにディスプレイに書き込まれる新しいデータを解析することによって)、表示データの生成又は表示データへのアクセスを担うアプリケーション又はオペレーティングシステムのコンポーネントに表示データについての情報を要求することによって、或いはユーザが見ているキーワード及び他のコンテンツが何であるかを他の方法で判定することによって達成することができる。幾つかの実施形態では、動的ディスプレイ上でレンダリングされたテキストは、一連の署名に変換され(例えば、スライディングウィンドウにおける100文字の連続したグループを取ることによって)、データベースに照会して、これらの署名のいずれかに対して関連する動作又はコンテンツが存在するかどうかを判定する。スキャン及び取り込みの実施例については、セクション15を参照されたい。
2.システムの導入
このセクションでは、紙/デジタル統合のためのシステムを構成するデバイス、プロセス、及びシステムの幾つかを説明する。種々の実施形態では、システムは、基本機能を提供するこの基礎コア上に様々なサービス及びアプリケーションを構築する。
2.1.プロセス
図1は、コアシステムの1つの実施形態における情報の流れを示すデータフロー図である。他の実施形態は、本明細書で示される段階又は要素の全てを使用しない場合があるが、より多くを使用するものもある。
レンダリング文書からのテキストが、通常、光学スキャナによる光学的形式で或いはボイスレコーダによる音声形式で取り込まれ(100)、次いで、この画像又は音声データは、例えば取り込みプロセスのアーティファクトを除去するため、或いは信号対雑音比を改善するために処理される(102)。次いで、OCR、音声認識、又は自己相関などの認識プロセス104は、データを幾つかの実施形態ではテキスト、テキストオフセット、又は他の記号から構成される1つ又はそれ以上の署名に任意選択的に変換する。或いは、システムは、レンダリング文書から文書署名を抽出する他の形式を実行する。署名は、幾つかの実施形態において実施可能なテキスト表現形式のセットを表す。このプロセスは、他の段階からのフィードバックにより影響を受ける可能性があり、例えば、サーチプロセス及びコンテキスト解析110は、取り込みが生じる可能性のある幾つかの候補文書を識別した場合、元の取り込みの可能な解釈が狭くなる可能性がある。
後処理106段階は、認識プロセスの出力を取得し、これをフィルタ処理し、又は有用とすることができるような他のオペレーションを実行することができる。実施される実施形態に応じて、この段階では、ユーザの意図を伝えるために本質的に十分な情報を包含するフレーズ又は記号が取り込まれた場合など、後の段階を参照することなく即座に取られる幾つかの直接的動作107を推測可能とすることができる。これらの場合、対応デジタル文書を参照するか、或いはシステムに既知である必要もない。
しかしながら、通常、次の段階は、サーチで使用するクエリー108又はクエリーのセットを構成することになる。クエリー構成の幾つかの態様は、使用されるサーチプロセスに依存する場合があり、よって、次の段階まで実行できないが、明らかに誤って認識された文字又は不適切な文字の除去など、事前に実行できる幾つかのオペレーションが存在するであろう。
次いで、1つ又は複数のクエリーは、サーチ及びコンテキスト解析段階110にわたされる。ここで本システムは、任意選択的に、元のデータが取り込まれた文書を識別しようと試みる。これを行うために、システムは通常、サーチインデックス及びサーチエンジン112、ユーザについての知識114、及びユーザのコンテキスト又は取り込みを行ったコンテキストについての知識116を使用する。サーチエンジン112は、特にレンダリング文書について、これらの対応デジタル文書について、及びウェブ(インターネットプレゼンス)を有する文書についての情報を利用及び/又はインデックス作成を行うことができる。サーチエンジン112は、これらのソースの多くに書き込むこと、並びにこれらから読み取ることができ、上述のように、例えば、候補文書の知識に基づいて言語、フォント、レンダリング及び可能性のある次のワードについての情報を認識システム104に与えることによって、プロセスの他の段階に情報を供給することができる。
状況によっては、次の段階は、識別された1つ又は複数の文書のコピーを取り出すことになる(120)。文書のソース124は、例えばローカルファイリングシステム又はデータベースもしくはウェブサーバから直接アクセス可能とすることができ、或いは、認証、セキュリティ、又は支払いを実施することができる幾つかのアクセスサービス122を介してコンタクトをとる必要があるものとすることができ、或いは、所望のフォーマットへの文書の変換などの他のサービスを提供することができる。
本システムのアプリケーションは、追加の機能、或いはデータと文書の一部又は全てとの関連付けを利用することができる。例えば、セクション10.4で検討される広告アプリケーションは、特定の広告メッセージ又はサブジェクトの文書の一部分との関連付けを使用することができる。この追加の関連する機能又はデータは、文書上の1つ又はそれ以上のオーバーレイと考えることができ、本明細書では「マークアップ」と呼ばれる。次いで、プロセス130の次の段階は、取り込まれたデータに関するあらゆるマークアップを識別することである。このようなマークアップは、ユーザ、起案者、又は発行者、或いは他の何れかの当事者によって提供することができ、あるソース132から直接アクセス可能とすることができ、或いは幾つかのサービス134によって生成することができる。種々の実施形態では、マークアップは、レンダリング文書及び/又はレンダリング文書の対応デジタル文書に、或いはこれらの文書のいずれか又は両方のグループに関連付けて適用することができる。
最後に、より早い段階の結果として、幾つかの動作をとることができる(140)。これらは、見つけられた情報を単に記録するなどのデフォルト動作とすることができ、又はデータもしくは文書に依存することができ、或いはこれらはマークアップ解析から導出することができる。場合によっては、動作は単に、データを別のシステムにわたすことになる。場合によっては、レンダリング文書における特定の時点での取り込みに好適な種々の実施可能な動作が、例えばローカルディスプレイ332上、コンピュータディスプレイ212又は携帯電話又はPDAディスプレイ216上の関連するディスプレイ上でメニューとしてユーザに提示されることになる。ユーザがメニューに応答しない場合、デフォルトの動作を行うことができる。
2.2.コンポーネント
図2は、一般的な動作環境の状況におけるシステムの一般的な実装に含まれるコンポーネントのコンポーネント図である。図示のように、動作環境は、1つ又はそれ以上の光学スキャン取り込み装置202又は音声取り込み装置204を含む。幾つかの実施形態では、同じデバイスが両方の機能を実行する。各取り込み装置は、直接配線又は無線接続のいずれかを使用して、或いは有線又は無線接続を使用して通信できるネットワーク220を介してコンピュータ212及び移動局216(例えば、携帯電話又はPDA)などのシステムの他の部分と通信することができ、ネットワーク220には通常、無線基地局214を含む。幾つかの実施形態では、取り込み装置は、移動局に統合され、任意選択的には、音声通信及び画像撮像用のデバイスで使用される音声及び/又は光コンポーネントの一部を共有する。
コンピュータ212は、スキャンデバイス202及び204からの指令を処理するためのコンピュータ実行可能命令を包含するメモリを含むことができる。一実施例として、指令は、識別子(スキャンデバイス202/204のシリアルナンバー或いはスキャナのユーザを部分的に又は一意的に識別する識別子など)、スキャンコンテキスト情報(例えば、スキャン時刻、スキャンのロケーション、その他)、及び/又はスキャン文書を一意に識別するのに使用されるスキャン情報(テキスト文字列など)を含むことができる。他の実施形態では、動作環境は、より多く又はより少ないコンポーネントを含むことができる。
サーチエンジン232、文書ソース234、ユーザアカウントサービス236、マークアップサービス238、及び他のネットワークサービス239もまた、ネットワーク220上で利用可能である。ネットワーク220は、企業イントラネット、公衆インターネット、携帯電話ネットワーク、又は他の何らかのネットワーク、もしくは上記のいずれかの相互接続とすることができる。
デバイスを互いに結合させる方法に関わらず、これらは全て公知の商取引及び通信プロトコル(例えば、インターネットプロトコル(IP))に従って動作可能とすることができる。種々の実施形態では、スキャンデバイス202、コンピュータ212、及び移動局216の機能及び特徴は、全体的に又は部分的に1つのデバイスに統合することができる。従って、スキャンデバイス、コンピュータ、及び移動局という用語は、デバイスが、スキャンデバイス202、コンピュータ212、及び移動局216の機能又は能力を組み込んでいるかどうかに応じて同じデバイスを指すことができる。更に、サーチエンジン232、文書ソース234、ユーザアカウントサービス236、マークアップサービス238、及び他のネットワークサービス239の機能の一部又は全ては、デバイスのいずれか及び/又は図示されていない他のデバイス上に実装できる。
2.3.取り込み装置
上述のように、取り込み装置は、レンダリング文書から画像データを取り込む光学スキャナを使用して、或いは、テキストのユーザ音読を取り込む音声記録デバイス或いは他の方法を使用して、テキストを取り込むことができる。取り込み装置の幾つかの実施形態はまた、バーコードなどの機械可読コードを含む画像、グラフィカル記号、及びアイコン、その他を取り込むことができる。デバイスは極めて単純にでき、システム内の他の場所に常駐する他の機能に応じた変換器、幾つかの記憶装置、及びデータインターフェース程度のものからなることができ、或いは、更にフル装備のデバイスとすることができる。例証として、このセクションでは、光学スキャナの周辺をベースとし、且つ妥当な数の機能を備えたデバイスについて説明する。
スキャナは、画像を取り込んでデジタル化する公知のデバイスである。コピー機業界の副産物である最初のスキャナは、比較的大きなデバイスであり、一度に文書ページ全体を取り込んでいた。最近では、ペン形ハンドヘルドデバイスのようなポータブル光学スキャナが好都合な外形寸法で導入されている。
幾つかの実施形態では、ポータブルスキャナを用いて、レンダリング文書からテキスト、グラフィクス、又は記号をスキャンする。ポータブルスキャナは、レンダリング文書からテキスト、記号、グラフィクスなどを取り込むスキャン要素を有する。幾つかの実施形態では、紙に印刷された文書に加えて、レンダリング文書は、CRTモニタ又はLCDディスプレイなどの画面上に表示されている文書を含む。
図3は、スキャナ302の実施形態のブロック図である。スキャナ302は、レンダリング文書から情報をスキャンし、これを機械互換性データに変換するための光学スキャンヘッド308、及び光学経路306、すなわち、通常はレンダリング文書からの画像をスキャンヘッドに伝達するレンズ、アパーチャ又は画像コンジットを含む。スキャンヘッド308は、電荷結合素子(CCD)、相補型金属酸化膜半導体(CMOS)撮像デバイス、又は別のタイプの光センサを組み込むことができる。
マイクロフォン310及び関連の回路は、周囲の音(話し言葉を含む)を機械互換性信号に変換し、他の入力機能は、ボタン、スクロールホイール、又はタッチパッドなどの他の触覚センサ314の形態で存在する。
ユーザへのフィードバックは、視覚ディスプレイ又はインジケータライト332を介して、ラウドスピーカ又は他の音声変換器334を介して、及び振動モジュール336を介して実施可能である。
スキャナ302は、種々の他のコンポーネントと対話するための論理回路326を含み、受信信号を異なるフォーマット及び/又は解釈情報に処理することができる。論理回路326は、RAM、ROM、フラッシュ、又は他の適切なメモリなどの関連の記憶装置330内に記憶されたデータ及びプログラム命令を読み書きするよう動作可能とすることができる。論理回路326は、クロックユニット328から時間信号を読み取ることができる。スキャナ302はまた、スキャンされた情報及び他の信号をネットワーク及び/又は関連するコンピューティングデバイスに伝達するためのインターフェース316を含む。幾つかの実施形態では、スキャナ302は、オンボード電源332を有することができる。他の実施形態では、スキャナ302は、ユニバーサルシリアルバス(USB)接続などの別のデバイスへのテザー接続から給電することができる。
スキャナ302の1つの用途の実施例として、読者は、スキャナ302によって新聞記事から何らかのテキストをスキャンすることができる。テキストは、スキャンヘッド308を介してビットマップ画像としてスキャンされる。論理回路326は、ビットマップ画像をクロックユニット328から読み取られた関連するタイムスタンプと共にメモリ330内に記憶される。論理回路326はまた、光学式文字認識(OCR)又は他のスキャン後処理をビットマップ画像に実行し、テキストに変換することができる。論理回路326は、任意選択的に、例えば、文字、記号、又はオブジェクトの反復発生の位置を特定するための畳み込み様プロセスを実行することによって画像から署名を抽出し、これらの反復要素の間の他の文字、記号、又はオブジェクトの間隔又は数を求めることができる。次に読者は、ビットマップ画像(又は、スキャン後処理が論理回路326によって実行された場合、テキスト又は他の署名)をインターフェース316を介して関連するコンピュータにアップロードすることができる。
スキャナ302の別の用途の実施例として、読者は、マイクロフォン310を音響取り込みポートとして使用することによって音声ファイルとして記事から何らかのテキストを取り込むことができる。論理回路326は、音声ファイルをメモリ328内に記憶させる。論理回路326はまた、音声ファイルに音声認識又は他のスキャン後処理を実行し、これをテキストに変換することができる。上記のように、読者は次いで、音声ファイル(又は論理回路326によって実行されるスキャン後処理により生成されるテキスト)をインターフェース316を介して関連するコンピュータにアップロードすることができる。
第2部−コアシステムの領域の概要
紙−デジタル統合がより一般的になるにつれて、この統合を更に良く利用するように、或いはより効果的に実装できるようにするために変更することができる既存の技術の多くの態様が存在する。このセクションでは、これらの問題の一部を明らかにする。
3.サーチ
文書コーパス、更にワールドワイドウェブのような大きなコーパスをサーチすることは、キーボードを使用してサーチエンジンに送られるサーチクエリーを構成する通常のユーザにとって一般的なことになってきた。このセクション及び次のセクションでは、レンダリング文書からの取り込みによって発生したクエリーの構成、及びこのようなクエリーを処理するサーチエンジンの両方の態様を説明する。
3.1.スキャン/スピーク/サーチクエリーとしてのタイプ
説明されたシステムの使用は、通常、上記のセクション1.2で言及されたものを含む幾つかの方法のいずれかを使用して、レンダリング文書から数ワードが取り込まれることで始まる。入力がテキストに変換するために何らかの解釈を必要とする場合、例えば、OCR又は音声入力の場合、文書コーパスを使用して認識プロセスを拡張できるように、システム内にエンドツーエンドフィードバックが存在することができる。エンドツーエンドフィードバックは、認識又は解釈の近似を行い、1つ又はそれ以上の候補一致文書のセットを識別し、次に候補文書における可能性のある一致からの情報を使用して認識又は解釈を更に改良又は限定することによって適用することができる。候補文書は、その考えられる関連性に応じて(例えば、これらの文書をスキャンした他のユーザの数、又はインターネット上のこれらの人気に基づいて)重み付けすることができ、これらの重みは、この反復認識プロセスにおいて適用することができる。
3.2.ショートフレーズサーチ
数語のワードの相対位置が既知である場合に、数ワードに基づくサーチクエリーの選択力が大幅に強化されるので、コーパスにおけるテキストのロケーションをシステムが識別するのに取り込む必要のあるテキストはほんのわずかの量に過ぎない。通常、入力テキストは、ショートフレーズなどの連続したワードのシーケンスとなる。
3.2.1.ショート取り込みからの文書及び文書内ロケーションの発見
フレーズの由来する文書の位置を特定することに加えて、システムは、その文書におけるロケーションを識別し、この知識に基づいて動作を行うことができる。
3.2.2.ロケーションを見つける他の方法
本システムはまた、レンダリング文書における透かし又は他の特別なマーキングなどを使用して、文書及びロケーションを発見する他の方法を用いることができる。
3.3.サーチクエリーへの他の要素の組み込み
取り込まれたテキストに加えて、他の要素(すなわち、ユーザアイデンティティ、プロフィール、及びコンテキストについての情報)は、取り込み時刻、ユーザのアイデンティティ、及び地理的ロケーション、ユーザの習慣及び最近のアクティビティについての知識など、サーチクエリーの一部を形成することができる。
前回の取り込みに関係する文書アイデンティティ及び他の情報は、特にこれらがごく最近のものである場合、サーチクエリーの部分を形成することができる。
ユーザのアイデンティティは、取り込み装置に関連付けられた一意の識別子、及び/又はバイオメトリック又は他の補足情報(話し方、指紋など)から判定することができる。
3.4.サーチクエリーにおける不信頼度の性質の知識(OCRエラーなど)
サーチクエリーは、使用される特定の取り込み方法で発生する可能性のあるエラーのタイプを考慮して構成することができる。この1つの実施例は、特定の文字の認識における疑わしいエラーの表示であり、この場合、サーチエンジンが、これらの文字をワイルドカードとして処理するか、或いはこれらに低い優先順位を割り当てることができる。
3.5.パフォーマンスのためのインデックスのローカルキャッシング/オフライン使用
取り込み装置が、データ取り込み時にサーチエンジン又はコーパスと通信できないことがある。この理由のため、デバイスのオフライン使用に有用な情報を事前にデバイスに、或いはデバイスが通信できる何らかのエンティティにダウンロードすることができる。場合によっては、コーパスに関連付けられたインデックスの全て又はかなりの部分をダウンロードすることができる。このトピックについては、セクション15.3で更に検討する。
3.6.どのような形式であっても記録されて後で実行することができるクエリー
クエリーを伝達すること又は結果を受け取ることに関連する遅延又はコストが発生する可能性が高い場合、この事前にロードされた情報は、ローカルデバイスのパフォーマンスを向上させ、通信コストを低減し、更に有用且つタイムリーなユーザフィードバックを提供することができる。
通信が利用可能でない(ローカルデバイスが「オフライン」である)状況では、クエリーは保存され、通信が回復した時点などでシステムの残りに送信することができる。
これらの場合、各クエリーと共にタイムスタンプを送信することが重要とすることができる。取り込み時刻は、クエリーの解釈において重要な因子とすることができる。例えば、セクション13.1では、早期取り込みに関連して取り込み時刻の重要性について検討している。取り込み時刻は、クエリーが実行された時と常に同じにはならない点に留意することが重要である。
3.7.パラレルサーチ
パフォーマンス上の理由から、単一の取り込みに応答して複数のクエリーを順次的又は並行して開始することができる。単一の取り込みに応答して、例えば新しいワードが取り込みに追加されたとき、或いは並行して複数のサーチエンジンに問い合わせするために幾つかのクエリーを送信することができる。
例えば、幾つかの実施形態では、システムは、現在の文書の特別なインデックス、ローカル機械上のサーチエンジン、企業ネットワーク上のサーチエンジン、及びインターネット上の遠隔サーチエンジンにクエリーを送信する。
特定のサーチの結果には、他のサーチよりも高い優先順位を与えることができる。
所与のクエリーに対する応答は、他の保留クエリーが過剰のものであることを示す場合があり、これらは完了前に取り消すことができる。
4.紙及びサーチエンジン
従来のオンラインクエリーを扱うサーチエンジンは、レンダリング文書から生じたクエリーも扱うことが望ましい場合が多い。従来のサーチエンジンは、説明されたシステムと共に使用するのにより好適にするために幾つかの方法で強化又は修正することができる。
本システムのサーチエンジン及び/又は他のコンポーネントは、異なる又は追加の特徴を有するインデックスを作成及び保持することができる。システムは、入来する紙由来クエリーを修正するか、或いは結果として得られるサーチにおいてクエリーを扱う方法を変更することができ、従って、これらの紙由来クエリーをウェブブラウザ及び他のソースに打ち込まれたクエリーから生じたものとは区別することができる。システムは、紙由来のサーチによって結果が返されたときに、他のソースからのものと比較して異なる動作をとるか、或いは異なるオプションを提供することができる。これらのアプローチの各々を以下で説明する。
4.1.インデックス作成
多くの場合、紙由来又は従来のクエリーを使用して同じインデックスをサーチすることができるが、インデックスは、現在のシステムにおいて様々な方法で使用するために強化することができる。
4.1.1.紙形式についての知識
紙ベースのサーチの場合の助けとなるインデックスに追加のフィールドを付加することができる。
紙形式での文書可用性を示すインデックスエントリ
第1の実施例は、紙形式で文書が存在していること又は配布されていることが既知であるのを示すフィールドである。システムは、クエリーが紙から生じている場合には、このような文書に対し高い優先順位を与えることができる。
紙形式人気度の知識
この実施例では、紙文書の人気度に関する(及び、任意選択的に、これらの文書内のサブ領域に関する)統計的データ(例えば、スキャンアクティビティの量、発行者又は他のソースによって提供される発行部数など)は、これらの文書に高い優先順位を与えること、対応デジタル文書(例えば、ブラウザベースのクエリー又はウェブサーチに対する)の優先順位を引き上げることなどのために使用される。
レンダーフォーマットの知識
別の重要な実施例は、文書の特定のレンダリングのレイアウトについての情報の記録とすることができる。
例えば、特定の版の本において、インデックスは、改行及び改ページがどこで発生するか、どのフォントが使用されたか、又はあらゆる例外的な大文字化についての情報を含むことができる。
インデックスはまた、画像、テキストボックス、テーブル、及び広告など、ページ上の他の項目の近接性についての情報を含むことができる。
オリジナルでの意味情報の使用
最後に、テキストの特定の部分が市場に出される品目に言及していること、又はあるパラグラフがプログラムコードを包含することなど、ソースマークアップから推定できるが紙文書では明らかではない意味情報をインデックスに記録することもできる。
4.1.2.取り込み方法の知識におけるインデックス作成
インデックスの性質を修正できる第2の要因は、使用される可能性が高い取り込みのタイプについての知識である。光学スキャンによって開始されるサーチは、インデックスがOCRプロセスにおいて混同し易い文字を考慮に入れる場合、或いは文書内に使用されたフォントの何らかの知識を含む場合に有利とすることができる。同様に、クエリーが音声認識により提供される場合には、類似の発音音素に基づくインデックスを遙かに効率的にサーチすることができる。説明されたモデルにおけるインデックスの使用に影響を与える可能性のある付加的な要因は、認識プロセス中の反復フィードバックの重要性である。テキストが取り込まれるときにサーチエンジンがインデックスからのフィードバックを提供できる場合、サーチエンジンは、取り込みの精度を大幅に高めることができる。
オフセットを用いたインデックス作成
インデックスがセクション9で説明したオフセットベース/自己相関OCR法を用いてサーチされる可能性が高い場合、幾つかの実施形態では、システムは、インデックス内に適切なオフセット又は署名情報を記憶する。
4.1.3.複数のインデックス
最後に、説明されたシステムでは、多くのインデックスに対してサーチを行うことが一般的とすることができる。インデックスは、企業ネットワークの複数の機械上で保持することができる。取り込み装置、或いは取り込み装置の近くにある機械に部分的なインデックスをダウンロードすることができる。特定の関心、習慣、又は許可を持つユーザ又はユーザのグループに対し、別個のインデックスを作成することができる。インデックスは、ファイルシステムごと、ディレクトリごと、ユーザのハードディスク上のファイルごとにでも存在することができる。インデックスは、ユーザ及びシステムによって発行され利用される。従って、配布、更新、併合、及び分割を効率的に行い得るインデックスを構成することが重要となる。
4.2.クエリーの取扱い
4.2.1.紙からの取り込みであることの認知
サーチエンジンは、サーチクエリーが紙文書由来のものであることを認識したときに異なる動作をとることができる。エンジンは、例えばある取り込み方法において現われる可能性の高いエラーのタイプに対してより耐性のある手法でクエリーを扱うことができる。
サーチエンジンは、クエリーに含まれる何らかの指標(例えば、取り込みの性質を示すフラグ)からこれを推定することができ、或いはクエリー自体からこれを推定することができる(例えば、OCRプロセスに特有のエラー又は不確実性を認識することができる)。
或いは、取り込み装置からのクエリーは、他のソースからのものとは異なるチャンネル又はポート或いは接続のタイプによってエンジンに到達することができ、このようにして区別することができる。例えば、システムの幾つかの実施形態では、専用ゲートウェイを経由してクエリーをサーチエンジンにルーティングする。従って、サーチエンジンは、専用ゲートウェイを通過する全てのクエリーが紙文書に由来したものであることを認知している。
4.2.2.コンテキストの使用
以下のセクション13では、取り込まれたテキスト自体の外部にあるが文書の識別において有意な助けとなり得る様々な異なる要因について説明する。これらは、最近のスキャンの履歴、特定のユーザの長期的読書習慣、ユーザの地理的ロケーション、及びユーザの特定の電子文書の最近の使用などの事柄を含む。このような要因は、本明細書では「コンテキスト」と呼ばれる。
コンテキストの一部は、サーチエンジン自体によって扱われ、検索結果に反映される。例えば、サーチエンジンは、ユーザのスキャン履歴を追跡することができ、このスキャン履歴を従来のキーボードベースのクエリーと相互参照することができる。このような場合、サーチエンジンは、各個々のユーザについて従来の検索エンジンのほとんどが行うよりも多くの状態情報を保持及び使用し、サーチエンジンとの各対話は、複数のサーチにわたって、及び今日一般的であるよりも長い時間期間にわたって拡張されると考えることができる。
コンテキストの一部は、サーチクエリーにおいてサーチエンジンに送信することができ(セクション3.3)、場合によっては、将来のクエリーにおいてある程度機能するようにエンジンに記憶することができる。最後に、コンテキストの一部は、他の場所で扱われるのが最も良く、サーチエンジンからの結果に適用されるフィルタ又は二次サーチとなる。
サーチに対するデータストリーム入力
サーチプロセスへの重要な入力は、ユーザのコミュニティが文書のレンダリングバージョンとどのように対話しているか、例えばどの文書が誰によって最も広く読まれているかに関する広範なコンテキストである。最も頻繁にリンクされたページ、或いは過去のサーチ結果から最も頻繁に選択されたページを返すウェブサーチに関する類似性が存在する。このトピックについての更なる検討は、セクション13.4及び14.2を参照されたい。
4.2.3.文書サブ領域
説明されたシステムは、文書全体についての情報だけでなく、個々のワードに至るまで文書のサブ領域についての情報も提供し使用することができる。多くの既存のサーチエンジンは、単に、特定のクエリーに関連性のある文書又はファイルの位置を特定することに的が絞られている。細粒度がより高いものに作用し且つ文書内のロケーションを識別することができるサーチエンジンは、説明されたシステムに対し有意な利益を提供するであろう。
4.3.結果を返す
サーチエンジンは、現在保持している追加情報の一部を使用して返された結果に影響を及ぼすことができる。
本システムはまた、紙コピーを所有していることの結果としてユーザがアクセスした特定の文書だけを返すことができる(セクション7.4)。
サーチエンジンはまた、テキストの単純な取り出し以外に、説明されたシステムに適切な新しい動作又はオプションを提供することができる。
5.マークアップ、注釈、及びメタデータ
取り込み−サーチ−取り出しプロセスを行うことに加えて、説明されたシステムはまた、追加の機能を文書、詳細には文書内のテキストの特定のロケーション又はセグメントと関連付ける。この追加の機能は、限定ではないが、その対応電子文書と関連付けられることによってレンダリング文書と関連付けられることが多い。一実施例として、ウェブページにおけるハイパーリンクは、そのウェブページのプリントアウトがスキャンされたときに同じ機能を有することができる。場合によっては、この機能は、電子文書では定義されないが、他の場所で記憶又は生成される。
追加の機能のこのレイヤを本明細書では「マークアップ」と称する。
5.1.オーバーレイ、静的及び動的
マークアップの一手法は、文書に対する「オーバーレイ」としてみなすものであり、文書又は文書の一部分についての更なる情報を提供し、これら関連する動作を指定することができる。マークアップは、人間可読のコンテンツを含むことができるが、多くの場合、ユーザに不可視のもの、及び/又は機械用途を意図したものである。実施例としては、ユーザがレンダリング文書の特定のエリアからテキストを取り込んだときに付近のディスプレイ上にポップアップメニューで表示されるオプション、及び特定のフレーズの発音を示すオーディオサンプルが挙げられる。
5.1.1.場合によっては複数のソースから提供される複数のレイヤ
どの文書も複数のオーバーレイを同時に有することができ、これらは、様々なロケーションをソースとすることができる。マークアップデータは、文書の作者によって、或いはユーザによって、もしくは他の何らかの当事者によって作成又は供給することができる。
マークアップデータは、電子文書に添付又は埋め込むことができる。これは、従来のロケーション(例えば、文書と同じ場所にあるが異なるファイル名サフィックスを有する)で見つけることができる。マークアップデータは、元の文書を位置付けるクエリーのサーチ結果に含まれるか、或いは同じ又は別のサーチエンジンへの別々のクエリーによって見つけることができる。マークアップデータは、元の取り込みテキスト及び他の取り込み情報又はコンテキスト情報を使用して見つけることができ、或いは、文書及び取り込みのロケーションについて既に推測された情報を使用して見つけることができる。マークアップデータは、マークアップ自体が文書に含まれていない場合でも文書において指定されたロケーションで見つけることができる。
マークアップは、従来のhtmlウェブページ上のリンクが多くの場合html文書内に静的データとして埋め込まれるのと類似した、高度に静的で且つ文書に固有のものとすることができるが、マークアップはまた、多数の文書に対して動的に生成及び/又は適用することができる。動的マークアップの実施例は、文書内で言及されている会社の最新株価を含む文書に添付された情報である。広く適用されているマークアップの実施例は、特定の言語の複数の文書又は文書のセクションで自動的に利用可能な翻訳情報である。
5.1.2.個人用「プラグ−イン」レイヤ
ユーザはまた、マークアップデータをインストールするか、或いはマークアップデータの特定のソースに加入し、これによって特定の取り込みに対するシステム応答を個人化することができる。
5.2.キーワード及びフレーズ、商標及びロゴ
文書における幾つかの要素は、特定の文書におけるロケーション以外の固有の特徴に基づいて特定の「マークアップ」又は関連する機能を有することができる。実施例としては、純粋にスキャンされることを目的として文書内に印刷される特別なマーク、並びにユーザを関心のある組織についての更なる情報にリンク可能なロゴ及び商標が含まれる。同じことが、テキストにおける「キーワード」又は「キーフレーズ」にも当てはまる。組織は、関連付けられる、又は関連付けられることを望む特定のフレーズを登録し、当該フレーズがスキャンされた場所であればどこでも利用可能な特手のマークアップをそのフレーズに添付することができる。
あらゆるワード、フレーズなどは、関連するマークアップを有することができる。例えばシステムは、「本」というワード、又は本のタイトル、もしくは本に関係するトピックをユーザが取り込んだときには常に、特定の項目をポップアップメニューに追加することができる(例えば、オンラインブックストアへのリンク)。システムの幾つかの実施形態では、対応デジタル文書又はインデックスを照会して、「本」というワード又は本のタイトル、もしくは本に関係するトピックの近くで取り込みが行われたかどうか、及びシステムの動作がキーワード要素に対するこの近接度に従って修正されたかどうかを判定する。前述の実施例では、マークアップにより、非商用テキスト又は文書から取り込まれたデータが商取引をトリガできるようになる点に留意されたい。
5.3.ユーザ提供コンテンツ
5.3.1.マルチメディアを含むユーザコメント及び注釈
注釈は、文書に関連付けることができる別のタイプの電子情報である。例えばユーザは、後で音声注釈として取り出すために特定の文書についてのユーザの見解の音声ファイルを添付することができる。マルチメディア注釈の別の実施例として、ユーザは、文書内で言及された場所の写真を添付することができる。ユーザは、一般に、文書に対する注釈を提供するが、システムは、他のソースからの注釈を関連付けることができる(例えば、ワークグループ内の他のユーザが注釈を共有することができる)。
5.3.2.校正からの注記
ユーザソースのマークアップの重要な実施例は、校正、編集又はレビュープロセスの一部としての紙文書の注釈である。
5.4.サードパーティコンテンツ
前述のように、マークアップデータは、多くの場合、文書の他の読者などのサードパーティによって供給することができる。特定の作業関するコミュニティ管理情報、ボランティア貢献による翻訳及び説明のような、オンラインディスカッション及びレビューは好適な実施例である。
サードパーティマークアップの別の実施例は、広告主によって提供されるものである。
5.5.他のユーザのデータストリームに基づく動的マークアップ
本システムの複数のユーザか又は全てのユーザが文書から取り込まれたデータを解析することによって、コミュニティのアクティビティ及び関心事項に基づいてマークアップを生成することができる。実施例として、実際に、「この本を楽しんだ人は....も楽しんだ」とユーザに示すマークアップ又は注釈を作成するオンラインブックストアとすることができる。マークアップは、匿名性が低いものとすることができ、ユーザの連絡先リストのうちの誰がこの文書を最近読んだかをユーザに示すことができる。データストリーム解析の他の実施例は、セクション14に含まれる。
5.6.外部事象及びデータソースに基づくマークアップ
マークアップは、多くの場合、企業データベースからの入力、公衆インターネットからの情報、或いはローカルオペレーティングシステムによって収集された統計などの外部事象及びデータソースに基づくことになる。
データソースはまた、よりローカルとすることができ、特にユーザのコンテキスト、すなわちユーザのアイデンティティ、ロケーション、及びアクティビティについての情報を提供することができる。例えば、システムは、ユーザの携帯電話と通信し、ユーザが最近電話で話した人に文書を送信するオプションをユーザに与えるマークアップレイヤを提供することができる。
6.認証、個人化、及びセキュリティ
多くの場合、ユーザのアイデンティティは既知となる。場合によっては、これは、例えば取り込み装置のシリアルナンバーによってのみユーザが識別される「匿名アイデンティティ」となる。しかしながら、一般的には、システムがユーザの遙かに詳細な知識を有しており、システムを個人化するため、及びユーザの名前でアクティビティ及び取引を実行できるようにするために用いることができると予想される。
6.1.ユーザ履歴及び「ライフライブラリ」
システムが実行できる最も単純で最も有用な機能の1つは、ユーザが取り込んだテキスト、見つかったあらゆる文書の詳細、その文書内のロケーション、及び結果として取られるあらゆる動作を含む、当該取り込みに関するあらゆる追加情報のユーザについての記録を維持することである。
この記憶された履歴は、ユーザ及びシステムの両方にとって有益である。
6.1.1.ユーザに関して
ユーザには、ユーザが読んで取り込んだ全てのものの記録である「ライフライブラリ」を提示することができる。これは、単に個人の関心を目的としたものとすることができるが、例えば、ユーザの次回の論文の参考文献のための資料を収集している研究者によってライブラリ内で使用することができる。
状況によっては、ユーザは、ウェブログと類似の方式でライブラリをウェブ上に公開することなどによって、ライブラリを公にすることを望むことができ、これによってユーザが読んで興味を持ったものを他者が見ることができるようになる。
最後に、ユーザが何らかのテキストを取り込み、システムが取り込みに即座に対応できない状況(例えば、文書の電子版が未だ利用可能でない理由により)では、取り込みをライブラリ内に記憶することができ、自動的に或いはユーザ要求に応答して後で処理することができる。ユーザはまた、新しいマークアップサービスに加入し、これらを以前に取り込まれたスキャンに適用することができる。
6.1.2.システムに関して
ユーザの過去の取り込みの記録は、システムにとっても有用である。システムオペレーションの多くの態様は、ユーザの読書習慣及び履歴を知ることによって強化することができる。最も単純な実施例では、ユーザによって行われたいずれのスキャンもユーザが最近スキャンした文書から生じたものである可能性が高く、特に、前回のスキャンがここ数分以内であった場合には、同じ文書からのものである可能性が極めて高い。同様に、文書が最初から最後の順序で読まれている可能性が高い。従って、英語文書では、より後でのスキャンは文書中のかなり下の方で起こる可能性も高い。このような要因は、システムが曖昧な場合に取り込みのロケーションを確立するのを助けることができ、取り込む必要のあるテキストの量を低減することもできる。
6.2.支払い、アイデンティティ、及び認証デバイスとしてのスキャナ
取り込みプロセスは、一般に、ある種のデバイス、通常は光学スキャナ又はボイスレコーダから始まるので、このデバイスは、ユーザを識別してある特定の動作を許可するキーとして使用することができる。
6.2.1.スキャナを電話又は他のアカウントに関連付ける
デバイスは、携帯電話に内蔵するか、或いは他の何らかの方法で携帯電話アカウントに関連付けることができる。例えば、スキャナは、アカウントに関連付けられたSIMカードをスキャナに挿入することによって、携帯電話アカウントに関連付けることができる。同様に、デバイスは、クレジットカード又は他の支払いカードに埋め込むことができ、或いはこのようなカードが接続される機能を有することができる。従ってデバイスは、支払いトークンとして使用することができ、レンダリング文書からの取り込みによって金融取引を開始することができる。
6.2.2.認証のためのスキャナ入力の使用
スキャナはまた、特定のユーザ又はアカウントに関連する何らかのトークン、記号、又はテキストをスキャンするプロセスを介して、当該ユーザ又はアカウントに関連付けることができる。更にスキャナは、例えばユーザの指紋をスキャンすることによってバイオメトリック識別に使用することができる。音声ベースの取り込み装置の場合、システムは、ユーザの声紋を一致させることによって、又はユーザに特定のパスワード又はフレーズを話すよう要求することによってユーザを識別することができる。
例えば、ユーザが本からの引用をスキャンし、オンライン小売業者からその本を購入するオプションを提供された場合、ユーザは、このオプションを選択でき、次いで取引を確認するためにユーザの指紋をスキャンするよう促される。
セクション15.5及び15.6も参照されたい。
6.2.3.セキュアスキャンデバイス
取り込み装置を用いて、ユーザを識別及び認証し、ユーザに代わって取引を開始する場合、デバイスとシステムの他の部分との間の通信がセキュアであることが重要である。また、別のデバイスがスキャナになりすますような状況、及びデバイスと他のコンポーネントとの間の通信が傍受されるいわゆる「中間者」攻撃に対して防御することが重要である。
このようなセキュリティを提供するための技術は、当該技術分野において十分に理解されており、種々の実施形態では、システム内のデバイス及び他の場所にあるハードウェア及びソフトウェアは、このような技術を実装するよう構成される。
7.モデル及び要素の発行
説明されたシステムの利点は、システムの利点の多くを得るために、文書を作成、印刷、又は発行する従来のプロセスを変更する必要がない点である。しかしながら、文書の作成者又は発行者(以下、単に「発行者」と称する)は、説明されたシステムをサポートするための機能性の作成を望む可能性があるという理由がある。
このセクションでは、主として、発行された文書自体に関係している。広告などの他の関係のある商取引についての情報は、「Pコマース」と題されたセクション10を参照されたい。
7.1.電子文書と印刷文書
本システムによって、印刷文書は、関連する電子プレゼンスを有することが可能になる。従来は、発行者が、更なるデジタル情報、チュートリアルムービー及び他のマルチメディアデータ、サンプルコードもしくは文書、或いは更なる関連資料を包含するCD−ROMを本と共に出荷することが多かった。更に、一部の発行者は、このような資料だけでなく、正誤表、追加コメント、更新された関連資料、参考文献及び関連データの更なるソース、並びに他の言語への翻訳といった発行後に更新できる情報を提供する特定の発行物に関連付けられたウェブサイトを保持する。オンラインフォーラムによって、読者は、発行物についてのコメントを寄稿することが可能になる。
説明されたシステムにより、このような資料をレンダリング文書にこれまでよりもより密接に関連させることが可能となり、これらの発見及びこれらとの対話をユーザにとって遙かに容易にすることができるようになる。文書からテキストの一部を取り込むことによって、システムは、文書に関連する、より具体的には文書の特定部分に関連するデジタル資料にユーザを自動的に結び付けることができる。同様に、ユーザは、テキストのセクションについて論じているオンラインコミュニティ、或いは他の読者による注釈及び解釈に結び付けられる。過去には、このような情報は通常、特定のページ番号又はチャプターをサーチすることによって見つける必要があった。
この例示的な応用は、学術書の分野範囲にある(セクション17.5)。
7.2.印刷文書に対する「購読」
一部の発行者は、新しい関連事項を通知して欲しい場合、或いは本の新版が発行されたときに読者が購読できるメーリングリストを有することができる。説明されたシステムでは、ユーザは、場合によっては発行者が何らかのこのような機能を提供することを検討する前であっても、特定の文書又は文書の一部への関心を容易に登録することができる。読者の関心は発行者に提供され、更新、更なる情報、新版、又は既存の本に関心があることが分かったトピックに関する全く新しい発行物を提供する時期及び場所についての決定に影響を及ぼす場合がある。
7.3.特別な意味を持つ、又は特別なデータを含む印刷マーク
システムの多くの態様は、単に文書内に既に存在しているテキストの使用を介して可能になる。しかしながら、システムと共に使用できるという知識において文書が作成される場合、追加の情報を特別なマークの形式で印刷することにより追加の機能性を付加することができ、これを利用してテキスト又は要求される動作をより密接に識別するか、或いはシステムとの文書の対話を強化することができる。最も単純で最も重要な実施例は、文書がシステムを介して明確にアクセス可能であることの読者への表示である。例えば、特別なアイコンを用いて、文書が関連するオンラインディスカッションフォーラムを有することを示すことができる。
このような記号は、純粋に読者を対象としたものとすることができ、或いは、スキャンされ何らかの動作を開始するために使用されるときにシステムが認識することができる。単に記号だけでなくそれ以上のものを識別するために、十分なデータを記号内に符号化することができ、例えば、文書、版、及び記号のロケーションについての情報を記憶することもでき、これらはシステムが認識し読み取ることができる。
7.4.紙文書の所有を通じた許可
印刷文書の所有又はこれへのアクセスにより、ユーザに対し一定の特権、例えば文書の電子コピー又は追加資料へのアクセスが与えられることになる場合が幾つかある。説明されたシステムを使用すると、このような特権は、単にユーザが文書からテキストの一部を取り込んだ又は特別に印刷された記号をスキャンした結果として付与することができる。ユーザが文書全体を所有していたことをシステムが確認する必要がある場合、システムは、特定のページからの特定の項目又はフレーズ、例えば「46ページの2行目」をスキャンするようユーザに促すことができる。
7.5.期限切れの文書
印刷文書が追加の資料及び機能性に対するゲートウェイである場合、このような機能へのアクセスも期限付きとすることができる。有効期限後、ユーザは、再度この記事にアクセスするためには手数料を支払うか、或いは文書のより新しい版を取得することが要求される場合がある。勿論、紙文書は依然として使用可能であるが、その強化された電子機能性の一部を失うことになる。例えば、電子資料へのアクセスに対して手数料を受け取ること、或いは適宜新しい版を購入するようユーザに要求することで発行者に収益があるので、或いは、未だ流通している印刷文書の旧版に関連する不利益があるので、これは望ましいとすることができる。クーポンは、有効期限を持つことができる商業文書のタイプの実施例である。
7.6.人気解析及び発行決定
セクション10.5では、著者への報酬及び広告の価格設定に影響を与える、システムの統計の使用について議論する。
幾つかの実施形態では、システムは、関連する電子コミュニティにおけるアクティビティから並びに紙文書の使用から発行物の人気を推測する。これらの要因は、発行者が将来発行するものに関する決定を行うのを助けることができる。例えば、既存の本のチャプターが極めて人気があることが判明した場合、別個の発行物に展開する価値があるものとすることができる。
8.文書アクセスサービス
説明されたシステムの重要な態様は、文書のレンダリングコピーにアクセスできるユーザにその文書の電子版へのアクセスができるようにする機能である。場合によっては、文書は、ユーザがアクセスできるパブリックネットワーク又はプライベートネットワーク上で自由に利用可能である。システムは、取り込まれたテキストを使用して、文書を識別し、位置特定し、及び取り出し、場合によってはこれをユーザの画面に表示するか、或いはユーザの電子メールの受信トレイに預ける。
場合によっては、文書は、電子形式で利用可能であっても、様々な理由によりユーザがアクセスできないことがある。幾つか例を挙げると、文書を取り出すのに十分な接続性がない場合があり、ユーザが文書を取り出す権利を与えられていない場合があり、文書へのアクセスに関連するコストがかかる場合があり、或いは文書が回収され、場合によっては新しい版に代わっている場合があるなどである。システムは通常、これらの状況についてユーザにフィードバックを提供する。
セクション7.4で述べたように、ユーザが文書の印刷されたコピーに既にアクセスできることが既知である場合には、特定のユーザに付与されるアクセスの程度又は性質は異なるものであってもよい。
8.1.認証された文書アクセス
文書へのアクセスは、指定されたユーザ又は特定の条件を満たすユーザに制限することができ、或いは、例えばユーザがセキュアネットワークに接続されている場合のようなある一定の環境においてのみ利用可能とすることができる。セクション6は、ユーザ及びスキャナのクレデンシャルを確立することができる方法の幾つかについて説明している。
8.2.文書購入−著作権所有者の報酬
一般公衆には自由に利用可能でない文書は、多くの場合発行者又は著作権所有者への報酬として、手数料を支払うことによってアクセス可能にすることができる。システムは、支払い機能を直接的に実装することができ、或いはセクション6.2で説明したものを含む、ユーザに関連する他の支払い方法を利用することができる。
8.3.文書エスクロー及び積極的な検索
電子文書は、一時的なものである場合が多く、レンダリング文書のデジタルソース版は、現在は利用可能であるが、将来はアクセスできない可能性がある。システムは、ユーザが要求しなかった場合でも、ユーザに代わって既存の版を取り出して記憶することができ、従って、ユーザが将来要求した場合にその可用性を保証する。また、これにより、例えば将来の取り込みを識別するプロセスの一部としてサーチするためにシステムを利用することができるようになる。
文書にアクセスするのに支払いが要求される事象では、信頼できる「文書エスクロー」サービスは、少額の手数料を支払うなどにより、ユーザに代わって文書を取り出すことができ、ユーザがサービスに文書を要求する場合には著作権所有者が将来完全に報酬が支払われることが保証される。
取り込みの時点で文書が電子形式で利用可能でない場合には、本主題の変形形態を実装することができる。ユーザは、電子文書が後日利用可能になった場合にユーザに代わって文書の要求を提出すること、又はその文書の支払いを行うことをサービスに許可することができる。
8.4.他の購読及びアカウントとの関連付け
場合によっては、別のアカウント又は購読とのユーザの既存の関連付けに基づき、支払いを放棄、削減、或いは返済することができる。新聞の印刷版の購読者には、例えば、電子版を取り出す権限を自動的に与えることができる。
他の場合には、関連付けを完全に直接的にすることができず、ユーザは、雇い主によって設定されたアカウントに基づいて、或いは加入者である友人が所有する印刷されたコピーのスキャンに基づいてアクセスを認めることができる。
8.5.写真複写に代わるスキャン及び印刷
紙文書からテキストを取り込み、電子オリジナルを識別し、そのオリジナル又は取り込みに関連する当該オリジナルの一部を印刷するプロセスは、多くの利点により、従来の写真複写に対する代替形態を形成する。すなわち、
・紙文書は、最終プリントアウトと同じロケーションにある必要はなく、いずれの場合でも同時に存在する必要はない
・写真複写プロセスによって文書、特に古く脆弱な貴重な文書に生じる磨耗及び損傷を回避することができる
・通常、コピーの品質が遙かに高い
・どの文書又は文書の一部が最も頻繁にコピーされるかついての記録を保持することができる
・プロセスの一部として著作権所有者に支払いを行うことができる
・許可されないコピーは禁止することができる
8.6.写真複写による価値のあるオリジナルの位置付け
歴史的又は他の特定の意義を有する法律上の証書又は文書の場合のように、文書が特に貴重である場合、通常は、多くの場合何年にもわたってこれらの文書のコピーで作業することができ、オリジナルは安全なロケーションに保管している。
説明されたシステムは、例えばアーカイブ倉庫内にオリジナル文書のロケーションを記録するデータベースに結合することができ、アーカイブされたオリジナル紙文書の位置を特定するために、誰でもがコピーにアクセスし易くする。
9.テキスト認識技術
従来、光学式文字認識(OCR)技術は、例えば、ページ全体を取り込むフラットベッドスキャナからの大量のテキストを含む画像に的を絞ってきた。OCR技術は多くの場合、有用なテキストを生成するためにユーザによる相当なトレーニング及び補正を必要とする。OCR技術は、OCRを行う機械に相当な処理能力を要求することが多く、多くのシステムが辞書を使用する場合、これらは一般に、事実上無限の語彙で動作することが予想される。
上記の従来の特徴の全ては、説明されたシステムにおいて改善することができる。
このセクションではOCRに焦点を当てるが、検討した問題の多くは、他の認識技術、特に音声認識に直接対応付けられる。セクション3.1で述べたように、紙から取り込むプロセスは、ユーザが音声を取り込むデバイスにテキストを声に出して読むことよって達成することができる。当業者であれば、画像、フォント、及びテキストフラグメントに関して本明細書で検討した原理が、音声サンプル、ユーザ音声モデル、及び音素にも当てはまることが多い点を理解するであろう。
9.1.適切なデバイスの最適化
説明されたシステムと共に使用するスキャンデバイスは、多くの場合、小型で、ポータブルで、低電力になる。スキャンデバイスは、一度に数ワードしか取り込むことができず、幾つかの実装では、一度に文字全体を取り込まず、テキストを通る水平スライスを取り込み、多くのこのようなスライスをまとめて、テキストを推測できる認識可能な信号を形成する。スキャンデバイスはまた、極めて限定された処理能力又は記憶装置を有することができるが、幾つかの実施形態では、OCRプロセス自体の全てを実行することができ、多くの実施形態は、場合によっては後で取り込まれた信号をテキストに変換するためにより強力なデバイスへの接続に依存することになる。最後に、スキャンデバイスは、ユーザ対話のために極めて限定された機能を有することがあり、そのため、ユーザ入力のどのような要求も後に延期し、或いは現在一般的であるよりも高い程度まで「最良推定」モードで動作することを必要とすることがある。
9.2.「不確実な」OCR
説明されたシステム内のOCRの主な新しい特徴は、一般に他の場所に存在しデジタル形式で取り出し得るテキストの画像を調べることである。従って、テキストの正確な転写は、OCRエンジンから常に要求される訳ではない。OCRシステムは、場合によっては確率加重を含む実施可能な一致のセット又はマトリックスを出力することができ、これらを使用してデジタルオリジナルをサーチすることができる。
9.3.反復OCR−推定、曖昧除去、推定・・・
認識を実行するデバイスが処理の時点で文書インデックスと接触できる場合、OCRプロセスは、進行するときに文書コーパスのコンテンツにより通知することができ、場合によってはかなり優れた認識精度を提供することができる。
このような接続によって、デバイスはまた、デジタルソースを識別するために十分なテキストが取り込まれたときにユーザに通知することが可能になる。
9.4.起こり得るレンダリングの知識の使用
システムが、印刷に使用されたフォント書体、又はページのレイアウト、或いはどのセクションがイタリック体になっているかなど、文書の起こり得る印刷レンダリングの態様の知識を有する場合には、このことは認識プロセスの助けとなることができる(セクション4.1.1)。
9.5.フォントキャッシング−ホスト上でフォントを決定し、クライアントにダウンロードする
文書コーパスにおける候補ソーステキストが識別されると、そのフォント又はレンダリングは、認識を助けるためにデバイスにダウンロードすることができる。
9.6.自己相関及び文字オフセット
テキストフラグメントのコンポーネント文字は、文書署名として使用できるテキストのフラグメントを表す最も評価された方法とすることができるが、デジタル文書及び/又はデータベースにおいてテキストフラグメントの位置を特定しようとする際、或いはテキストフラグメントの表示を曖昧除去して可読形式にする際に、テキストフラグメントの実際のテキストを使用する必要がないテキストの他の表示は、十分に良好に作用することができる。テキストフラグメントの他の表示は、実際のテキストの表示が無いという利点を提供することができる。例えば、テキストフラグメントの光学式文字認識は、フラグメント全体について光学式文字認識を用いることなくテキストフラグメントをサーチ及び/又は再作成するのに使用できる取り込まれたテキストフラグメントの他の表示とは異なり、多くの場合エラーを生じやすい。このような方法は、現在のシステムと共に使用する幾つかのデバイスにとってより好適とすることができる。
当業者及び他者は、テキストフラグメントの外観を記述する多くの方法が存在することを理解するであろう。テキストフラグメントのこうした特徴付けは、限定ではないが、ワード長、相対ワード長、文字高、文字幅、文字形状、文字頻度、トークン頻度、及び同様のものを含むことができる。幾つかの実施形態では、一致テキストトークン間のオフセット(すなわち、介在するトークの数プラス1)が、テキストのフラグメントを特徴付けるのに使用される。
従来のOCRは、フォント、文字構造、及び形状についての知識を使用して、スキャンされたテキストにおける文字を判定しようと試みる。本発明の実施形態はこれとは異なり、すなわち、認識プロセスを支援するためにレンダリングテキスト自体を使用する様々な方法を用いる。これらの実施形態は、「互いを認識する」ために文字(又はトークン)を使用する。このような自己認識を指す1つの方法は、「テンプレートマッチング」であり、「畳み込み」と類似している。このような自己認識を実行するために、システムは、テキストのコピーをシステム自体の上で水平方向にスライドさせ、テキスト画像の一致領域を確認する。従来のテンプレートマッチング及び畳み込み技術は、様々な関連技術を含む。文字/トークンをトークン化及び/又は認識するためのこれらの技術は、文字/トークンを一致させる際に自己コンポーネント部分と相関付けるのにテキストが使用される場合に本明細書では総称的に「自己相関」と称する。
自己相関時には、一致する完全接続領域が対象となる。これは、文字(又は文字のグループ)が同じ文字(又はグループ)の他のインスタンスに重なるときに起こる。一致する完全接続領域は、コンポーネントトークンへのテキストのトークン化を自動的に提供する。テキストの2つのコピーが互いにスライドして通り過ぎるときに、完全一致が生じた領域(すなわち、垂直スライスにおける全画素が一致している)が確認される。文字/トークンが自己一致する場合、この一致の水平範囲(例えばテキストの接続された一致部分)も一致する。
この段階では、各トークンの実際のアイデンティティ(すなわち、トークン画像に対応する特定の文字、数字又は記号、或いはこれらのグループ)を求める必要がなく、スキャンされたテキストにおいて同じトークンの次の発生に対するオフセットのみでよい点に留意されたい。オフセット数は、同じトークンが次に発生するまでの間隔(トークンの数)である。トークンがテキスト文字列内で一意的である場合、オフセットはゼロ(0)である。このようにして生成されたトークンオフセットのシーケンスは、スキャンされたテキストを識別するのに使用できる署名である。
幾つかの実施形態では、スキャンされたトークンの文字列について求められたトークンオフセットは、これらのコンテンツのトークンオフセットに基づいて電子文書のコーパスにインデックスを作成するインデックスと比較される(セクション4.1.2)。他の実施形態では、スキャンされたトークンの文字列について求められたトークンオフセットがテキストに変換され、これらのコンテンツに基づいて電子文書のコーパスをインデックス作成する従来型インデックスと比較される。
前述のように、取り込みプロセスが話し言葉の音声サンプルからなる場合には、同様のトークン相関プロセスを音声フラグメントに適用することができる。
9.7.フォント/文字「自己認識」
従来のテンプレートマッチングOCRは、スキャンされた画像を文字画像のライブラリと比較する。本質的には、アルファベットは各フォントで記憶され、新しくスキャンされた画像は、この記憶画像と比較されて一致する文字を見つける。プロセスは、一般に、正しいフォントが識別されるまで初期遅延を有する。ほとんどの文書が全体を通じて同じフォントを使用するので、その後のOCRプロセスは比較的迅速である。従って、後続の画像は、最近識別されたフォントライブラリとの比較することによってテキストに変換することができる。
最も一般的に使用されるフォントの文字の形状は関係がある。例えば、ほとんどのフォントにおいて、「t」と「f」などのように、文字「c」と文字「e」とは視覚的に関係がある。OCRプロセスは、この関係を利用することによって拡張され、未だスキャンされていない文字のテンプレートを構成する。例えば、スキャンされた画像を比較する画像テンプレートのセットをシステムが持たないような以前には遭遇していないフォントの紙文書からのテキストの短い文字列を読者がスキャンした場合、システムは、アルファベットの文字全てに遭遇したことがない場合でも、フォントテンプレートライブラリを構成するためにある一定の文字間の推定関係を活用することができる。次にシステムは、構成されたフォントテンプレートライブラリを使用して、後続のスキャンテキストを認識し、構成されたフォントライブラリを更に改良することができる。
9.8.サーバに認識されていないもの(グラフィクスを含む)の送信
サーチプロセスで使用するのに好適な形式に画像を機械転写できない場合、ユーザが後で使用するために、実施可能なマニュアル転写のため、或いは異なるリソースがシステムに利用可能になる後日処理するために画像自体を保存することができる。
10.P−コマース
本システムによって実施可能になる動作の多くは、何らかの商取引を生じることになる。語句「P−コマース」とは、本明細書ではシステムを介して紙から開始される商業活動を記述するのに使用される。
10.1.物理的な印刷コピーからの文書の販売
ユーザが文書からテキストを取り込むときには、ユーザに対して紙又は電子形式のいずれかで購入するよう当該文書を提供することができる。また、ユーザに対して紙文書に引用又は言及されたもの、又は同様の対象に関するもの、或いは同じ著者によるものなど、関連文書を提供することができる。
10.2.紙によって開始又は助長される他のものの販売
テキストの取り込みは、様々な方法で他の商業活動にリンクさせることができる。取り込まれたテキストは、品目を販売するよう明確に設計されたカタログ内に存在することができ、この場合、テキストは、品目の購入にかなり直接的に関連付けられることになる(セクション18.2)。テキストはまた、広告の一部とすることができ、この場合、広告されている品目の販売が引き続いて発生することができる。
別の場合において、ユーザは、商取引における潜在的な関心を推測することができる他のテキストを取り込む。例えば、特定の国の小説セットの読者は、その国の休日に関心を示す可能性がある。新車のレビューを読む人は、新車の購入を検討している可能性がある。ユーザは、何らかの商業上の機会が結果としてユーザに提示されることになること、或いはユーザの取り込みアクティビティの副次的作用になる場合があることが分かっているテキストの特定のフラグメントを取り込むことができる。
10.3.販売を生じる結果となる品目上のラベル、アイコン、シリアルナンバー、バーコードの取り込み
品目又はそのパッケージ上にテキスト又は記号が実際に印刷されている場合がある。実施例としては、電子機器の一部の後面又は下面のラベルに見られることが多いシリアルナンバー又は製造IDである。システムは、当該テキストを取り込むことによって同じ品目の1つ又はそれ以上を購入する従来の方法をユーザに提供することができる。また、マニュアル、サポート又は修理サービスも提供することができる。
10.4.コンテキスト広告
広告からのテキストの直接取り込みに加えて、システムは、レンダリング文書において必ずしも明確ではないが、人々が読んでいるものに基づいた新しい種類の広告を可能にする。
10.4.1.スキャンコンテキスト及び履歴に基づく広告
従来の紙の発行物において、広告は、一般に新聞記事のテキストに対して大量のスペースを費やし、限定された数の広告を特定の記事の周りに配置することができる。説明されたシステムでは、広告は個々のワード又はフレーズに関連付けることができ、ユーザが当該テキストを取り込み、場合によっては過去のスキャンの履歴を考慮することによって示した特定の関心に従って選択することができる。
説明されたシステムでは、購入を特定の印刷文書に結び付け、広告主が、特定の印刷発行物において広告する効果についてのより多くのフィードバックを有意に得ることができる。
10.4.2.ユーザコンテキスト及び履歴に基づく広告
システムは、ユーザ自身の使用に対するユーザのコンテキストの他の態様について大量の情報を収集することができ(セクション13)、ユーザの地理的ロケーションの推定値は良い実施例である。このようなデータを使用して、システムのユーザに提示される広告を調整することができる。
10.5.報酬のモデル
本システムは、広告主及びマーケティング担当者への報酬の幾つかの新しいモデルを可能にする。広告を含む印刷文書の発行者は、これらの文書から発生した購入から幾らかの収入を受け取ることができる。これは、元の印刷形式で広告が存在しているか否かに関わらず当てはまり、発行者、広告主、又はあるサードパーティのいずれかによって電子的に追加することができ、このような広告のソースは、ユーザが加入することができるものである。
10.5.1.人気ベースの報酬
システムによって生成された統計の解析は、発行物のある特定の部分の人気を示すことができる(セクション14.2)。例えば新聞では、特定のページ又は記事を読者が見るのに費やす時間量、或いは特定のコラムニストの人気を示すことができる。状況によっては、書かれたワード又は配布されたコピー数など、より従来的な評価指標ではなく、読者のアクティビティに基づく報酬を著者又は発行者が受け取ることが適切とすることができる。著作物がある主題について頻繁に読まれた権威のあるものになった著者は、その本が同じ数のコピーを販売したがめったに開かれない著者とは将来の契約において異なると考えることができる(セクション7.6を参照)。
10.5.2.人気ベースの広告
文書における広告についての決定は、読者層についての統計に基づくことができる。最も人気のあるコラムニストの周りの広告スペースは、割増料金で販売することができる。広告主は、文書が発行された後しばらくして、文書がどのように受け取られたかについての知識に基づいて請求され、又は報酬が支払われることができる。
10.6.ライフライブラリに基づくマーケティング
セクション6.1及び16.1で説明された「ライフライブラリ」又はスキャン履歴は、ユーザの関心及び習慣についての極めて価値のある情報のソースとすることができる。適切な承諾及びプライバシー問題に従って、このようなデータは、ユーザへの商品又はサービスの提供を通知することができる。匿名形式でも、収集された統計は極めて有用なものとすることができる。
10.7.後日の販売/情報(利用可能になった場合)
商取引のための広告及び他の機会は、テキスト取り込み時に即座にユーザに提示されない場合がある。例えば、小説の続編を購入する機会は、ユーザが小説を読んでいる時点では利用可能になることはできないが、システムは、続編が発行されたときにその機会をユーザに提示することができる。
ユーザは、購入又は他の商取引に関するデータを取り込むことができるが、取り込みが行われたときに取引を開始/及び又は終了しないことを選択することができる。幾つかの実施形態では、取り込みに関するデータは、ユーザのライフライブラリ内に記憶され、これらのライフライブラリエントリを「アクティブ」のままにすることができる(すなわち、取り込みが行われた時点で利用可能になるものと同様に次の対話が可能である)。従って、ユーザは、幾らか後の時間で取り込みをレビューし、任意選択的にその取り込みに基づいて取引を完了することができる。システムは元の取り込みが発生した時間及び場所を追跡することができるので、取引に包含関与する全ての関係者に適切に報酬を支払うことができる。例えば、ユーザがデータを取り込んだ広告に隣接して表示されていた物語を書いた著者、及びその物語を発行した発行者は、6ヶ月後、ユーザがそのライフライブラリを訪れて、履歴からその特定の取り込みを選択し、及びポップアップメニューから「アマゾンでこの品目を購入」(取り込み時に任意選択的に提示されるメニューに類似又は同一のものとすることができる)を選択すると報酬が支払われることが可能である。
11.オペレーティングシステム及びアプリケーション統合
最新オペレーティングシステム(OS)及び他のソフトウェアパッケージは、説明されたシステムでの使用に有利に利用することができる多くの特徴を有し、また、この使用に対してより良好なプラットフォームを提供するために種々の方法で修正することができる。
11.1.メタデータ及びインデックス作成へのスキャン及び印刷関連情報の組み込み 新しい及び次回のファイルシステム及びこれらの関連データベースは、各ファイルに関連する様々なメタデータを記憶する機能を有することが多い。従来、このメタデータは、ファイルを作成したユーザのID、作成日時、最終修正、及び最終使用などを含んでいた。より新しいファイルシステムによって、キーワード、画像特徴、文書ソース、及びユーザコメントなどのような追加の情報を記憶することが可能になり、幾つかのシステムでは、このメタデータを恣意的に拡張することができる。従って、ファイルシステムを用いて、現在のシステムを実装するのに有用となる情報を記憶することができる。例えば、所与の文書が最後に印刷された日付は、説明されたシステムを使用してどのテキストが、いつ、誰によって紙から取り込まれたかを詳述できるように、ファイルシステムが記憶することができる。
オペレーティングシステムはまた、ユーザがローカルファイルをより容易に見つけ得るサーチエンジン機能を組み込むことを始めている。これらの機能は、システムが有利に使用することができる。これは、セクション3及び4で検討されたサーチ関連概念の多くが、今日のインターネットベース及び同様のサーチエンジンに対してだけでなく、あらゆるパーソナルコンピュータにも適用されることを意味する。
場合によっては、特定のソフトウェアアプリケーションが、OSによって提供される機能に加えてシステムに対するサポートをも含むことになる。
11.2.取り込み装置に対するOSサポート
取り込み装置の適用性は単一のソフトウェアアプリケーションを超えて拡張されているので、ペン型スキャナのような取り込み装置の使用が益々一般的になると、マウス及びプリンタに対してサポートが提供されるのとほぼ同じように、取り込み装置のサポートをオペレーティングシステムに組み込むことが望ましいものとなる。同じことは、システムのオペレーションの他の態様に対しても当てはまる。幾つかの実施例を以下で検討する。幾つかの実施形態では、説明されたシステム全体或いはそのコアがOSによって提供される。幾つかの実施形態では、システムのサポートは、システムの態様を直接的に実装するものを含む、他のソフトウェアパッケージによって使用できるアプリケーションプログラミングインターフェース(API)によって提供される。
11.2.1.OCR及び他の認識技術のサポート
レンダリング文書からテキストを取り込む方法のほとんどは、ソースデータ(通常はスキャンされた画像又は何らかの話し言葉)をシステムで使用するのに好適なテキストとして解釈するために何らかの認識ソフトウェアを必要とする。過去においてOCRの使用は通常、アプリケーションの狭い範囲に限られていたので、OSによっては音声又は手書き文字認識のサポートを含むが、OSがOCRのサポートを含むことはあまり一般的ではない。
認識コンポーネントがOSの一部になると、これら認識コンポーネントは、OSによって提供される他の機能をより上手く利用することができる。多くのシステムは、例えば、スペリング辞書、文法解析ツール、国際化及び地方化機能を含み、特にこれらは、ユーザが一般的に遭遇するワード及びフレーズを含むよう特定のユーザに対してカスタマイズすることができるので、これらの全ては、説明されたシステムが認識プロセス用に有利に利用することができる。
オペレーティングシステムがフルテキストインデックス作成機能を含む場合、これらを用いて、セクション9.3に説明されたように認識プロセスに通知することができる。
11.2.2.スキャン時に行われる動作
光学スキャン又は他の取り込みが生じてOSに提示されると、他のサブシステムが取り込みの所有権を請求しない場合にはデフォルト動作を取らせることができる。デフォルト動作の実施例は、ユーザに代替の選択肢を提示すること、又は取り込まれたテキストをOSの組み込みサーチ機能に実行依頼することである。
11.2.3.OSが特定の文書又は文書タイプに対するデフォルト動作を有する
レンダリング文書のデジタルソースが見つかった場合、OSは、その特定の文書又はその分類の文書がスキャンされたときにとることになる標準的な動作を有することができる。アプリケーション及び他のサブシステムは、ある一定のファイルタイプを扱うこれらの機能を適用することによる通知と同様にして、取り込みの特定のタイプの可能性のあるハンドラとしてOSに登録することができる。
レンダリング文書、又は文書からの取り込みに関連するマークアップデータは、特定のアプリケーションを起動し、アプリケーションに引数、パラメータ、又はデータなどをわたすためのオペレーティングシステムへの命令を含むことができる。
11.2.4.ジェスチャーの解釈及び標準的動作へのマッピング
セクション12.1.3では、特に光学スキャンの場合における「ジェスチャー」の使用が検討されており、ここで、ハンドヘルドスキャナによって行われる特定の移動が、テキスト領域の始まりと終わりをマーキングするなどの標準的動作を表すことができる。
これは、カーソルキーを用いてテキスト領域を選択しながらキーボード上のシフトキーを押下すること、又はマウス上のホイールを使用して文書をスクロールさせることのような動作に似ている。ユーザによるこのような動作は、OSによってシステムワイドな手法で解釈される十分に標準的なものであり、従って、一貫した挙動が保証される。スキャナジェスチャー及び他のスキャナ関連動作についても同様であることが望ましい。
11.2.5.標準的(及び非標準的)アイコン/テキスト印刷メニュー項目に対する応答の設定
同様に、テキスト又は他の記号のあるアイテムは、スキャン時に標準動作を引き起こすようにすることができ、OSは、これらの選択を可能にすることができる。一実施例には、何らかの文書においてテキスト「[印刷]」をスキャンすることにより、OSが当該文書のコピーを取り出して印刷することが挙げられる。OSはまた、このような動作を登録して特定のスキャンと関連付ける手法を提供することができる。
11.3.一般的なスキャン開始による動作のためのシステムGUIコンポーネントにおけるサポート
ほとんどのソフトウェアアプリケーションは、OSによって提供される標準的なグラフィカルユーザインターフェースコンポーネントに実質的に基づいている。
開発者がこれらのコンポーネントを使用すると、複数のパッケージにわたって一貫した挙動を保証するのに役立ち、例えば、全てのプログラマーが同じ機能を別々に実装するのを必要とせずに、何らかのテキスト編集コンテキストにおいて左カーソルキーを押下するとカーソルを左に動かすことになる。
これらのコンポーネントにおける同様の一貫性は、説明されたシステムのテキスト取り込み又は他の態様によって動作が開始される場合に望ましい。以下に実施例を幾つか挙げる。
11.3.1.特定のテキストコンテンツを見つけるためのインターフェース
システムの一般的な使用は、ユーザが紙文書のあるエリアをスキャンすること、並びにシステムが、表示又は編集できるソフトウェアパッケージにおいて対応電子文書を開き、そのパッケージにスキャンされたテキストまでスクロールさせて強調表示させることとすることができる(セクション12.2.1)。電子文書を見つけて開くこのプロセスの第1パートは通常OSによって提供され、ソフトウェアパッケージの間で標準である。しかしながら、文書内でテキストの特定の部分の位置を特定し、パッケージにこの部分までスクロールさせて強調表示させる第2パートは、未だ標準化されておらず、各パッケージ毎に異なるよう実装されることが多い。この機能の標準APIの可用性は、システムのこの態様のオペレーションを大幅に向上させることができる。
11.3.2.テキスト対話
テキストの一部分が文書内で位置付けられると、システムは、そのテキストに様々なオペレーションの実行を望むことができる。一実施例として、システムは、周囲のテキストを要求することができ、これによりユーザの数ワードの取り込みで、これらを含むセンテンス又はパラグラフ全体にシステムがアクセスする結果をもたらすことができる。この場合も同様に、この機能は、テキストを扱うソフトウェアのあらゆる部分に実装されるのではなく、OSが有効に提供することができる。
11.3.3.コンテキスト(ポップアップ)メニュー
システムによって可能になるオペレーションの幾つかは、ユーザフィードバックを要求することになり、これは、データを扱うアプリケーションのコンテキスト内で最適に要求することができる。幾つかの実施形態では、システムは、あるテキスト上でマウスボタンを右クリックすることに従来関連付けられたアプリケーションのポップアップメニューを使用する。システムは、このようなメニューに追加のオプションを挿入して、これらを紙文書のスキャンなどの動作の結果として表示させる。
11.4.ウェブ/ネットワークインターフェース
今日の次第にネットワーク化されてきた世界では、個々の機械で利用可能な機能性の大部分はまた、ネットワーク上でアクセスすることができ、説明されたシステムに関連する機能も例外ではない。一実施例として、オフィス環境では、ユーザが受け取る多くの紙文書は、同じ企業ネットワーク上の他のユーザの機械が印刷していた可能性がある。1つのコンピュータ上のシステムは、取り込みに応答して、適切な許可制御に従い当該取り込みに対応することができる文書について他の機械に問い合わせすることができる。
11.5.文書の印刷により生じる保存
紙文書とデジタル文書の統合における重要な要因は、両者間の移行についてできる限り多くの情報を維持することである。幾つかの実施形態では、OSは、ある文書がいつ誰によって印刷されたかの単純な記録を保持する。幾つかの実施形態では、OSは、システムと共に使用するのにより好適な1つ又はそれ以上の更なる動作をとる。実施例には以下のものが挙げられる。
・文書が印刷されるソースについての情報と共にあらゆる印刷文書のデジタルレンダリング版を保存すること。
・将来のスキャン解釈を助けることができる印刷された版についての有用な情報のサブセット(例えば、使用されたフォント及び改行が行われる場所)を保存すること。
・あらゆる印刷されたコピーに関連するソース文書の版を保存すること。
・印刷時に自動的に文書のインデックスを作成し、将来のサーチのためにその結果を記憶すること。
11.6.(印刷/スキャン済み)マイドキュメント
OSは、特定の重要性を有するフォルダ又はファイルのあるカテゴリーを維持する場合が多い。ユーザの文書は、規定又は設計により、例えば「マイドキュメント」フォルダ内で見つけることができる。標準ファイルオープニングダイアログは、最近開いた文書のリストを自動的に含むことができる。
説明されたシステムと共に使用するために最適化されたOSでは、このようなカテゴリーは、記憶ファイルの紙版とのユーザの相互作用を考慮に入れるようにして拡張又は増強することができる。「印刷済みマイドキュメント」又は「最近読んだマイドキュメント」などのカテゴリーは、オペレーションに有用に識別され組み込むことができる。
11.7.OS−レベルマークアップ階層
システムの重要な態様は、通常セクション5で検討された「マークアップ」概念を使用して提供されるので、複数のアプリケーション並びにOS自体にアクセス可能であるようにしてOSによって提供されるこうしたマークアップのサポートを有することが有利であるのは明らかである。更に、マークアップのレイヤは、制御下での文書の固有の知識及び提供できる機能に基づいてOSによって提供される。
11.8.OS DRM機能の使用
ある形式の「デジタル著作権管理」、すなわち特定のユーザ、ソフトウェアエンティティ、又は機械に付与される権利に従って特定のデータの使用を制御する機能をサポートするオペレーティングシステムの数が益々増えてきている。これは、例えば特定の文書の許可されていないコピー又は配布を禁止することができる。
12.ユーザインターフェース
本システムのユーザインターフェースは、取り込み装置が比較的ダムでありケーブルによってPCに接続されている場合には完全にPC上に存在し、或いは、取り込み装置が高性能であり且つそれぞれが有意な処理能力を有する場合には、完全に装置上に存在することができる。場合によっては、何らかの機能は各コンポーネントに存在する。システムの機能の一部又は全てはまた、携帯電話又はPDAなどの他のデバイス上に実装することができる。
従って、以下のセクションにおける説明は、特定の実装に望ましいとすることができるものを示すが、これらは必ずしも全てに対して適切なものではなく、幾つかの手法で修正することができる。
12.1.取り込み装置上
全ての取り込み装置、特に光学スキャナの場合には、ユーザの注意は一般的に、スキャン時のデバイス及び紙にある。よって、スキャンプロセスの一部として必要とされる何らかの入力及びフィードバックは、ユーザの注意が他の場所(例えばコンピュータの画面上)にあることを必要以上に要求されないことが極めて望ましい。
12.1.1.スキャナでのフィードバック
ハンドヘルドスキャナは、特定の状況についてのフィードバックをユーザに提供する様々な方法を有することができる。最も明確なタイプは、スキャナがインジケータライト又はフルディスプレイまで組み込む直接目に見えるもの、及びスキャナがビープ音、クリック音、又は他の音を出すことができる聴覚的なものである。重要な代替形態は、スキャナが振動し、ブザー音を出し、或いはユーザのタッチ感覚を刺激することができる触覚フィードバック、及び光のカラースポットから何かを紙に投影させることによってステータスを高性能ディスプレイに示す投影フィードバックを含む。
デバイス上に提供できる重要な即時フィードバックは、以下を含む。
・スキャンプロセスでのフィードバック−速すぎる速度で、大きすぎる角度で、或いは特定のライン上での高すぎる又は低すぎるドリフトでのユーザスキャン。
・十分なコンテンツ−存在する場合に一致を見つけるのを極めて確実にするよう十分にスキャンされた−分離オペレーションに重要。
・既知のコンテキスト−位置が特定されたテキストのソース。
・既知の固有コンテキスト−位置が特定されたテキストの1つの固有ソース。
・コンテンツの可用性−コンテンツがユーザに自由に利用可能であるか又は費用がかかるかの表示。
本システムの後の段階に通常関連するユーザ対話の多くはまた、例えば文書の一部又は全てを表示するのに十分な能力を有する場合には、取り込み装置上で行うことができる。
12.1.2.スキャナの制御
デバイスは、基本テキスト取り込みに加えて入力を可能にする様々な方法をユーザに提供することができる。デバイスが、キーボード及びマウスなどの入力オプションを有するホスト機械と密接に関連している場合でも、例えば、スキャナの操作とマウスの使用をユーザが切り替えるために混乱を生じさせる可能性がある。
ハンドヘルドスキャナは、ボタン、スクロール/ジョグホイール、タッチ感知式表面、及び/又はデバイスの動きを検出するための加速度計を有することができる。これらの幾つかにより、スキャナを保持しながら対話のより豊富なセットが可能になる。
例えば、あるテキストのスキャンに応答して、システムは、ユーザに幾つかの可能な一致文書のセットを提示する。ユーザは、スキャナの側面にあるスクロールホイールを使用してリストから1つを選択し、ボタンをクリックして選択を確認する。
12.1.3.ジェスチャー
紙全体にスキャナを動かす主な理由は、テキストを取り込むためであるが、幾つかの動きをデバイスによって検出し、これを用いて他のユーザの意図を示すことができる。このような動きは、本明細書では「ジェスチャー」と称する。
一実施例として、ユーザは、従来の左から右の順序で最初の数ワードを、更に逆の順序、すなわち右から左に最後の数ワードをスキャンすることによって、テキストの大きな領域を示すことができる。ユーザはまた、スキャナを数行にわたってページの下に向けて動かすことによって、関心のあるテキストの垂直方向の範囲を示すことができる。後方スキャンは、前回のスキャンオペレーションの取り消しを示すことができる。
12.1.4.オンライン/オフライン動作
システムの多くの態様は、スキャナなどのシステムのコンポーネントとホストラップトップとの間、或いは企業データベース及びインターネットサーチに対する接続形式での外部とのいずれかのネットワーク接続性に依存することができる。この接続性は、必ずしも存在するとは限らないが、システムの一部又は全てが「オフライン」であるとみなすことができる場合もあることになる。システムがこれらの状況で継続して有効に機能できることが望ましい。
デバイスは、システムの他の部分と接触していないときにテキストを取り込むよう用いることができる。極めて単純なデバイスは、取り込みに関連する、理想的には取り込まれた時間を示すタイムスタンプに関連する画像又は音声データを単に記憶することができる。種々の取り込みは、デバイスが次にシステムと接触したときにシステムの他の部分にアップロードされ、次いで処理することができる。デバイスはまた、取り込みに関連する他のデータ、例えば、光学スキャンに関連する音声注釈、又はロケーション情報をアップロードすることができる。
また、より高性能のデバイスは、これ自体が切断されているにも関わらず、システムオペレーションの一部又は全てを実行することができる。これを行うための機能を向上させる種々の技術がセクション15.3で検討される。オフライン中に所望の動作の全てではなく一部を実行することができることが多い。例えば、テキストを認識できるが、ソースの識別は、インターネットベースのサーチエンジンへの接続に依存する場合がある。従って、幾つかの実施形態では、デバイスは、各オペレーションがシステムの他の部分に対してどの程度進行したかについての十分な情報を記憶し、接続性が回復されたときに効率的に進められる。
本システムのオペレーションは、一般に、即座に利用可能な接続性による利益が得られることになるが、複数の取り込みを実行した後にバッチとして処理することで利点を有することができる場合がある。例えば、以下のセクション13で検討するように、特定の取り込みのソースの識別は、ほぼ同時にユーザによって行われた他の取り込みを調べることによって、大幅に向上させることができる。ユーザに生のフィードバックが提供される完全に接続されたシステムでは、システムは、現在の取り込みを処理しているときには、過去の取り込みを使用することしかできない。しかしながら、取り込みがオフライン時にデバイスによって記憶されたバッチの1つである場合、システムは、その解析を行っているときに以前の取り込み並びに後の取り込みから利用可能なあらゆるデータを考慮に入れることができることになる。
12.2.ホストデバイス上
スキャナは、ユーザとのより詳細な対話を含むシステムの機能の多くを実行するために、PC、PDA、電話、又はデジタルカメラなどの他の何らかのデバイスと通信することが多い。
12.2.1.取り込みに応答して実行される動作
ホストデバイスは、取り込みを受け取ると様々な動作を開始することができる。位置特定後にシステムによって実行される可能なアクティビティの未完リスト並びに取り込み及びその文書内のロケーションに関連する対応電子文書は以下の通りである。
・取り込みの詳細は、ユーザの履歴内に記憶することができる。(セクション6.1)
・文書は、ローカルストレージ又はリモートロケーションから取り出すことができる。(セクション8)
・オペレーティングシステムのメタデータ及び文書に関連する他の記録を更新することができる。(セクション11.1)
・文書に関連するマークアップを調べて、次の関連オペレーションを決定することができる。(セクション5)
・文章上でソフトウェアアプリケーションの編集、ビュー、又はオペレーションを開始することができる。アプリケーションの選択は、ソース文書、又はスキャンのコンテンツ、或いは取り込みの他の何らかの態様に依存することができる。(セクション11.2.2、11.2.3)
・アプリケーションは、取り込みロケーションへのスクロール、取り込みロケーションの強調表示、取り込みロケーションへの挿入ポイントの移動、或いは取り込みロケーションの表示を行うことができる。(セクション11.3)
・取り込まれたテキストの正確な範囲は、例えば取り込まれたテキストの周りのワード全体、センテンス、又はパラグラフを選択するよう修正することができる。(セクション11.3.2)
・ユーザには、取り込みテキストをクリップボードにコピーする、或いは取り込みテキストに対し他の標準的なオペレーティングシステム又はアプリケーション特有のオペレーションを実行するためのオプションを与えることができる。
・注釈は、文書又は取り込まれたテキストに関連付けることができる。これら注釈は、即時ユーザ入力から生じることができ、或いは、例えば光学スキャンに関連する音声注釈の場合に早期に取り込まれたものとすることができる。(セクション19.4)
・マークアップを調べて、ユーザが選択する更なる可能なオペレーションのセットを求めることができる。
12.2.2.コンテキストポップアップメニュー
システムによってとられる適切な動作は明らかな場合もあるが、ユーザによって行われる選択を必要とする場合もある。これを行うための1つの良い手法は、「ポップアップメニュー」の使用によるものであり、又は、コンテンツが画面上にも表示される場合は、コンテンツ付近に現われるいわゆる「コンテキストメニュー」を使用する。(セクション11.3.3を参照)。幾つかの実施形態では、スキャナデバイスが、紙文書の上にポップアップメニューを投影する。ユーザは、キーボード及びマウスなどの従来の方法を使用して、或いは取り込み装置上の制御機構(セクション12.1.2)の使用、ジェスチャー(12.1.3)、或いはスキャナを使用してコンピュータディスプレイと対話することによって(セクション12.2.4)、こうしたメニューから選択することができる。幾つかの実施形態では、取り込みの結果として現われることができるポップアップメニューは、ユーザが応答しない場合、例えばユーザがメニューを無視し別の取り込みを行った場合に行われる動作を表すデフォルト項目を含む。
12.2.3.曖昧除去のフィードバック
ユーザがテキストの取り込みを開始すると、最初に、一致する可能性のある幾つかの文書又は他のテキストロケーションが存在することになる。より多くのテキストが取り込まれ、他の要因が考慮されるときには(セクション13)、候補ロケーションの数は、実際のロケーションが識別されるまで低減され、曖昧性を更に除去するには、ユーザ入力なしでは不可能である。幾つかの実施形態では、システムは、例えばリスト、サムネイル画像又はテキストセグメント形式で見つけられた文書又はロケーションのリアルタイム表示を提供し、取り込みが継続するにつれて当該表示内の要素の数を低減するようにする。幾つかの実施形態では、システムは、全ての候補文書のサムネイルを表示し、ここでサムネイルのサイズ又は位置は、正確に一致する確率に依存する。
取り込みが一義的に識別されると、例えば音声フィードバックを使用してこの事実をユーザに強調することができる。
取り込まれたテキストが多くの文書において存在し、引用文として認識されることがある。システムは、例えば元のソース文書の周りの引例を包含する文書をグループ化することによって画面上でこれを示すことができる。
12.2.4.画面からのスキャン
一部の光学スキャナは、画面並びに紙上に表示されたテキストを取り込むことができる。従って、レンダリング文書という用語は、本明細書では、紙への印刷がレンダリングの唯一の形式ではないこと、及びシステムが使用するテキスト又は記号の取り込みは、そのテキストが電子ディスプレイ上に表示されたときと同等の価値があるものとすることができることを示すのに使用される。
説明されたシステムのユーザは、オプションのリストから選択することなどの様々な他の理由により、コンピュータ画面と対話することが要求される場合がある。ユーザがスキャナを下に置き、マウス又はキーボードを使い始めることは不便なことがある。他のセクションでは、このツールの変更を必要としない入力方法としてスキャナ上の物理的制御機構(セクション12.1.2)又はジェスチャー(セクション12.1.3)を説明したが、画面自体にスキャナを使用して何らかのテキスト又は記号をスキャンすることは、システムによって提供される重要な代替形態である。
幾つかの実施形態では、スキャナの光学機器によって、ライトペンと同様の方式でスキャナを使用することが可能になり、場合によってはコンピュータ上の特別なハードウェア又はソフトウェアの助けを借りて、実際にテキストをスキャンする必要なく画面上の位置を直接感知する。
13.コンテキスト解釈
説明されたシステムの重要な態様は、使用中の文書の識別を助けるため、テキストの文字列を単に取り込む以外に他の要因を使用することである。適度な量のテキストの取り込みは、文書を一意的に識別できることが多いが、多くの場合、識別するのは少数の候補文書になる。1つの解決策は、スキャンされる文書を確認するようユーザに促すことであるが、好ましい代替形態は、他の要因を利用して可能性を自動的に狭めることである。このような補足情報は、取り込む必要のあるテキストの量を劇的に低減でし、及び/又は対応電子文書内のロケーションを識別できる信頼性及び速度を向上させることができる。この追加の資料は、「コンテキスト」と呼ばれ、セクション4.2.2.で簡単に説明した。ここで更に深く検討する。
13.1.システム及び取り込みコンテキスト
恐らくは、このような情報の最も重要な実施例は、ユーザの取り込み履歴である。
特に前回の取り込みがこの数分の間に行われた場合には、いずれかの所与の取り込みは、前回と同じ文書、或いは関連文書から生じたものである可能性が高い(セクション6.1.2)。対照的に、2つのスキャンの間にフォントが変更されたことをシステムが検出した場合には、これらは異なる文書からのものである可能性が高い。
ユーザのより長期間の取り込み履歴及び読書習慣もまた有用である。また、これらを用いて、ユーザの関心事項及び関連付けのモデルを開発することができる。
13.2.ユーザの実世界コンテキスト
有用なコンテキストの別の実施例は、ユーザの地理的ロケーションである。パリにいるユーザは、例えば、「Seattle Times」よりも「Le Monde」を読んでいる可能性が遙かに高い。従って、文書の印刷版のタイミング、サイズ、及び地理的配布が重要とすることができ、システムのオペレーションからある程度推測することができる。
例えば、出勤中にいつもあるタイプの発行物を読み、ランチタイム又は帰宅中の列車では別のものを読むユーザの場合には、1日の時刻も関連する可能性がある。
13.3.関連のデジタルコンテキスト
より従来の手段によりサーチ又は取り出されたものを含む電子文書のユーザの最近の使用はまた、有用な指標となり得る。
場合によっては、企業ネットワーク上などで他の要因が有用と考えられることがある。
・どの文書が最近印刷されたか?
・どの文書が、企業ファイルサーバ上で最近修正されたか?
・どの文書が、最近電子メールで送られたか?
これらの実施例の全ては、ユーザがこれらの文書の紙バージョンを読んでいる可能性が高いことを示唆することができる。対照的に、文書が存在するレポジトリが、文書が印刷されたことがない、或いは印刷できる場所に送られていないことを確認できる場合には、紙に由来する何らかのサーチにおいて安全に削除することができる。
13.4.他の統計−グローバルコンテキスト
セクション14は、紙ベースのサーチから結果として得られるデータストリームの解析を対象として含むが、他の読者に対する文書の人気、その人気のタイミング、及び最も頻繁にスキャンされた文書の部分についての統計は全て、サーチプロセスにおいて有益となり得る追加要因の実施例である点に留意されたい。システムは、紙の世界にGoogleタイプのページランキングの可能性をもたらす。
サーチエンジンのためのコンテキストの使用に関する他の何らかの暗示については、セクション4.2.2を参照されたい。
14.データストリーム解析
システムの使用は、副次的な結果として極めて貴重なデータストリームを発生する。このストリームは、ユーザが何時何を読んでいるかについての記録であり、多くの場合、ユーザが読んだ中で特に貴重であると考えたものの記録である。このようなデータは、紙文書に対してこれまでは利用可能でなかった。
このデータがシステム及びシステムのユーザにとって有用とすることができる幾つかの手法については、セクション6.1で説明されている。このセクションでは、その他の使用に集中している。勿論、人々が読んでいるものについてのデータのあらゆる配布に関しては、考慮すべき実質的なプライバシー問題があるが、データの匿名性を保護する問題は、当業者には公知である。
14.1.文書追跡
いずれかの所与のユーザがどの文書を読んでいるかをシステムが知っている場合、システムは、いずれかの所与の文書を読んでいるのが誰であるかを推測することができる。これにより、組織全体を通じた文書の追跡が可能になり、例えば、誰がいつこれを読んでいるか、どれくらい広く配布されているか、配布するのにどれくらい時間がかかったか、及び他の者が期限切れのコピーから未だ作業している間に誰が現在の版を見ているかについて解析できるようになる。
より広範に配布される発行文書では、個々のコピーの追跡はより困難であるが、読者層の分布の解析は依然として可能である。
14.2.読書ランキング−文書及びサブ領域の人気
ユーザが自分にとって特に関心のあるテキスト又は他のデータを取り込む状況では、システムは、幾つかの文書及びこれらの文書の特定のサブ領域の人気を推測することができる。これは、システム自体に対し価値のある入力(セクション4.2.2)及び、著者、発行者、及び広告主にとって重要な情報ソース(セクション7.6、セクション10.5)を形成する。このデータは、例えば、レンダリング文書から生じるクエリーのサーチ結果のランク付けを支援するため、及び/又はウェブブラウザに打ち込まれた従来のクエリーのランク付けを支援するために、サーチエンジン及びサーチインデックスに統合される場合に有用である。
14.3.ユーザの解析−プロフィールの構築
ユーザが何を読んでいるかについての知識によって、システムは、ユーザの関心及びアクティビティの極めて詳細なモデルを作成可能になる。これは、抽象的統計ベースにおいて有用とすることができ−すなわち、「この新聞を購入するユーザの35%はその著者の最新本を読む」−しかしながら、以下に説明されるような個々のユーザとの他の対話も可能にすることができる。
14.3.1.ソーシャルネットワーキング
1つの実施例は、1人のユーザを関連する関心を有する他者に接続することである。これらは、ユーザにとって既知の人とすることができる。システムは、大学の教授に、「XYZ大学のあなたの同僚もこの論文を読んだばかりであることを知っていますか?」と尋ねることができる。システムは、ユーザに「ジェーンエアを読んでいるあなたの近所の人とリンクすることを望みますか?」と尋ねることができる。このようなリンクは、現実の世界又はオンラインのいずれかでブッククラブ及び同様の社会組織を自動形成するための基礎となることができる。
14.3.2.マーケティング
セクション10.6は、本システムとのユーザの対話に基づいて個々のユーザに製品及びサービスを提供するという概念について既に言及した。例えば、現在のオンライン書籍販売業者は、ユーザの書籍販売業者と前回の対話に基づいてユーザに推薦することが多い。このような推薦は、これらが実際の本との対話に基づいたものである場合により有用となる。
14.4.データストリームの他の態様に基づくマーケティング
本システムが、文書を発行する人々、これらを通じて広告する人々、及び紙から開始される他の販売に影響を与える可能性のある方法の幾つかについて説明してきた(セクション10)。一部の商業活動は、紙文書との直接対話を全く持たない場合があるが、これらによって影響を受ける可能性はある。例えば、あるコミュニティの人々が新聞の金融欄よりもスポーツ欄を読むことにより多くの時間を費やすという知識は、ヘルスクラブを設立しようとする人にとって関心のあるものとすることができる。
14.5.取り込むことができるデータのタイプ
どの文書のどの部分を誰がいつどこで読んでいるかなど、検討された統計に加えて、文書の位置が特定されているかどうかに関わらず、取り込まれたテキストの実際のコンテンツを調べることは関心の対象となることができる。
多くの場合、ユーザはまた、あるテキストを取り込むだけでなく、結果としてある動作を行わせていることになる。例えば、その文書に対する参考資料を知人に電子メールで送ることができる。ユーザのアイデンティティ又は電子メールの受診についての情報がない場合でも、誰かがその文書を電子メールで送信する価値があると考えているという知識は、極めて有用である。
特定の文書又はテキストの一部の価値を推測するために検討された種々の方法に加えて、状況によっては、ユーザは、これに格付けを割り当てることによって価値を明確に示すことになる。
最後に、ユーザの特定のセットがあるグループを形成することが既知である場合、例えば特定の会社の従業員であることが知られている場合、そのグループの総統計を用いて、そのグループに対する特定の文書の重要性を推測することができる。
15.デバイスの特徴及び機能
本システムと共に使用する取り込み装置は、文書のレンダリング版からテキストを取り込む手法を必要とするに過ぎない。上述(セクション1.2)のように、この取り込みは、文書の一部の写真を撮ること、又は携帯電話のキーパッドに数ワードを打ち込むことを含む、様々な方法を介して実現することができる。この取り込みは、一度にテキストの1行又は2行を記録できる小型ハンドヘルド光学スキャナ、或いはユーザが文書からテキストを読み込むボイスレコーダのような音声取り込み装置を使用して実現することができる。使用されるデバイスは、例えば音声注釈も記録できる光学スキャナなど、これらの組合せとすることができ、取り込み機能は、携帯電話、PDA、デジタルカメラ、又はポータブル音楽プレーヤーなどの他の何らかのデバイスに組み込むことができる。
15.1.入力及び出力
このようなデバイスのための場合によっては有利で付加的な入力及び出力機能の多くは、セクション12.1で説明した。これらは、入力としてボタン、スクロールホイール、及びタッチパッドを、更に出力としてディスプレイ、インジケータライト、音声及び触覚変換器を含む。デバイスは、これらの多くを組み込むことがあり、極めて少ない場合もある。取り込み装置は、例えば無線リンクを使用して既にこれらの機能を有している別のデバイスと通信できる場合もあり(セクション15.6)、取り込み機能をこのような他のデバイスに組み込むこともある(セクション15.7)。
15.2.接続性
幾つかの実施形態では、デバイスは、システム自体の大部分を実装する。しかしながら、幾つかの実施形態では、デバイスは、PC又は他のコンピューティングデバイスと、及び通信機能を使用してより広範な世界と通信することが多い。
これらの通信機能は、Ethenet、802.11、又はUWBなどの汎用データネットワーク、或いは、USB、IEEE−1394(Firewire)、Bluetooth(商標)又は赤外線などの標準周辺接続ネットワークの形式である。Firewire又はUSBなどの有線接続が使用されるときには、デバイスは、同じ接続を通じて電力を受け取ることができる。状況によっては、取り込み装置は、接続された機械がUSB記憶装置などの従来の周辺機器であるように見なすことができる。
最後に、デバイスは、状況によっては、当該デバイスと連動して使用されるか或いは好都合な記憶装置として別のデバイスと「ドッキング」することができる。
15.3.キャッシング及び他のオンライン/オフライン機能
セクション3.5及び12.1.4では、分離オペレーションのトピックを取り上げた。取り込み装置がシステムの全機能の限定されたサブセットを有し、更にシステムの他の部分と通信していないときには、依然としてデバイスは有用とすることはできるが、場合によっては利用可能な機能性が低減されることになる。最も単純なレベルでは、デバイスは、取り込まれる生画像又は音声データを記録することができ、これを後で処理することができる。しかしながら、ユーザの利益のために、可能であれば、取り込まれたデータが進行中のタスクにとって十分であるかどうか、認識できるか或いは認識可能であう可能性があるかどうか、及びデータのソースを識別できるか又は後で識別可能になる可能性があるかどうかについてのフィードバックを与えることが重要とすることができる。次にユーザは、この取り込み動作に価値があるかどうかを認知することになる。上記の全てが未知である場合でも、少なくともユーザが後でこれらを参照できるように生データを記憶することができる。例えばスキャンがOCRプロセスによって認識できない場合、スキャンの画像をユーザに提示することができる。
利用可能なオプションの範囲の一部を例示するために、幾分低機能の光学スキャンデバイスとはるかにフル装備のデバイスの両方を以下に説明する。多くのデバイスは、2つの間の中間点を占める。
15.3.1.シンプルスキャナ(SimpleScanner)−低価格オフライン実施例
シンプルスキャナは、テキスト行の長さに沿って移動するときにページから画素を読み取ることができるスキャンヘッドを有する。シンプルスキャナは、ページに沿った動きを検出し、この動きについての幾つかの情報と共に画素を記録することができる。シンプルスキャナはまたクロックを有し、これによって各スキャンにタイムスタンプすることができる。クロックは、シンプルスキャナが接続性を有するときにホストデバイスと同期する。クロックは、実際の時刻を表すことはできないが、クロックから相対時間を求めることができ、これによりホストは、スキャンの実際の時間、或いは最悪の場合でもスキャン間の経過時間を導出することができる。
シンプルスキャナは、どのようなOCR自体を実行するのにも十分な処理能力を持たないが、一般的なワード長、ワード間隔、及びフォントサイズとの関係についての幾らかの基本的な知識を有する。シンプルスキャナは、スキャンが読み取れる可能性があるかどうか、紙の上のヘッドの動きが早すぎるか、遅すぎるか、又は不正確であるかどうか、及び識別される文書に対して所与のサイズの十分なワードがスキャンされた可能性が高いといつ判断されたかをユーザに知らせる幾つかの基本的なインジケータライトを有する。
シンプルスキャナは、USBコネクタを有し、コンピュータ上のUSBポートに差し込むことができ、ここで充電されることになる。コンピュータにとっては、タイムスタンプされたデータファイルが記録されたUSB記憶装置であるように見え、残りのシステムソフトウェアが、このポイントから引き継ぐ。
15.3.2.スーパースキャナ(SuperScanner)−高性能オフラインの実施例
スーパースキャナもまた、そのフルオペレーションのための接続性に依存するが、オフラインの間に取り込まれたデータについてより適切に判断するのを助けることができる相当な量のオンボード記憶装置及び処理能力を有する。
スーパースキャナがテキストのラインに沿って移動すると、取り込まれた画素がまとめられ、テキストを認識しようと試みるOCRエンジンにわたされる。ユーザのPC上のユーザのスペリングチェッカー辞書と同期されてユーザが頻繁に遭遇するワードの多くを包含する辞書を有するように、ユーザが最も読んだ発行物からのものを含む、多数のフォントがこのタスクの実行を助けるためにダウンロードされている。スキャナにはまた、辞書と組み合わせることができる、これらの標準的な使用頻度を持つワード及びフレーズのリストが記憶されている。スキャナは、認識プロセスに役立ち、且つテキストの十分な量がいつ取り込まれたかについての判断を通知するための頻度統計を用いることができ、より頻繁に使用されるフレーズは、サーチクエリーの基準として有用である可能性は低い。
更に、ユーザがオンライン書籍販売業者から最近購入した本のインデックスのような、又はユーザがここ数ヶ月内にスキャンした、最近の新聞記事の完全なインデックス及びユーザが最も一般的に読んでいる定期刊行物がデバイス上に記憶される。最後に、システムにとって利用可能なデータを有する最も人気のある数千の発行物のタイトルが記憶されており、これによって他の情報がなくても、ユーザはタイトルをスキャンでき、特定の作品からの取り込みが後で電子形式で取り出すことが可能であるかどうかに関して良好なアイデアを持つようになる。
スキャンプロセス中、システムは、取り込まれたデータが十分な品質であること、及び接続性が回復したときに電子コピーを取り出せるような十分な性質であることをユーザに通知する。システムは、スキャンが成功したことが知られていること、及びコンテキストがオンボードインデックスの1つで認識されていること、或いは関連の発行物は、データがシステムに利用可能であることが知られており、よって後の取り出しが成功するはずであることをユーザに示すことが多い。
スーパースキャナは、PCのFirewire又はUSBポートに接続されたクレードルにドッキングし、この時点では、取り込まれたデータのアップロードに加えて、その種々のオンボードインデックス及び他のデータベースが、最近のユーザ動作及び新しい発行物に基づいて更新される。スーパースキャナはまた、無線公衆網への接続機能、或いはBluetoothを介した携帯電話との通信機能、更にこれらの機能が利用可能であるときに公衆網と通信する機能を有する。
15.4.光学スキャンの特徴
次に、光学スキャナデバイスで特に望ましいとすることができる特徴の幾つかを検討する。
15.4.1.フレキシブルな位置決め及び好都合な光学機器
依然として紙に人気がある理由の1つは、例えばコンピュータが実用的でないか又は不便である幅広い状況において使い易いためである。従って、紙とのユーザの対話のかなりの部分を取り込むことを意図したデバイスは、同様に使用が好都合でなくてはならない。これは、過去のスキャナではなかったことであり、最も小さなハンドヘルドデバイスでも幾分扱い難かった。ページと接触するよう設計されたハンドヘルドデバイスは、紙に対して正確な角度で保持し、スキャンされるテキストの長さに沿って極めて注意深く動かさなくてはならない。これは、オフィスデスクでビジネスレポートをスキャンする場合には許容できるが、列車を待つ間に小説からフレーズをスキャンする場合には非実用的とすることができる。紙からある距離で動作するカメラタイプの光学機器に基づくスキャナは、幾つかの状況で同様に有用とすることができる。
システムの幾つかの実施形態は、紙に接触してスキャンし、レンズの代わりに、光ファイバー束である画像コンジットを使用してページから光センサーデバイスに画像を送信するスキャナを利用する。このようなデバイスは、自然な位置に保持できるような形状にすることができ、例えば、幾つかの実施形態では、ページに接触する部分はくさび形であり、ユーザの手が蛍光ペンを使用したのと同様の動きでページ上をより自然に動かすことができるようになる。コンジットは、紙に直接接触するか、又は近接しており、起こり得る損傷から画像コンジットを保護できる交換可能な透明先端を有することができる。セクション12.2.4で述べたように、スキャナを用いて画面並びに紙からスキャンすることができ、先端の材料は、このような表示に対する損傷の可能性を低減するよう選択することができる。
最後に、デバイスの幾つかの実施形態では、ユーザのスキャンが早すぎる、遅すぎる、均一でない、或いはスキャンされる行のドリフティングが高すぎる又は低すぎる場合に、光、音、又は触覚フィードバックを使用することによって示すフィードバックをスキャンプロセス中にユーザに提供することになる。
15.5.セキュリティ、アイデンティティ、認証、個人化、及び請求
セクション6で説明されたように、取り込み装置は、セキュアな取引、購入、及び様々な他のオペレーションに対する識別及び承認の重要な部分を形成することができる。従って、取り込み装置は、このような役割に必要な回路及びソフトウェアに加えて、スマートカードリーダー、RFID、又はPINを打ち込むためのキーパッドのような、よりセキュアにすることができる種々のハードウェア機能を組み込むことができる。
取り込み装置は、ユーザの識別を助けるための種々のバイオメトリックセンサを含むことができる。例えば、光学スキャナの場合、スキャンヘッドが指紋を読み取ることもできる。ボイスレコーダの場合、ユーザの声紋を使用することができる。
15.6.デバイス関連付け
幾つかの実施形態では、デバイスは、それ自体又はその機能を向上させるために他の近隣のデバイスとの関連付けを形成することができる。幾つかの実施形態では、例えばデバイスは、近隣のPC又は電話のディスプレイを使用して、そのオペレーションについてのより詳細なフィードバックを提供するか、或いはそのネットワーク接続性を使用する。他方、デバイスは、他のデバイスによって実行されるオペレーションを認証するために、セキュリティ及び識別デバイスとしての役割を果たすことができる。或いは、デバイスは単に、そのデバイスへの周辺機器として機能するように関連付けを形成することができる。
このような関連付けの興味深い態様は、デバイスの取り込み機能を使用して関連付けを開始及び認証することができる点である。例えば、ユーザ自体を公衆コンピュータ端末に対してセキュアに識別させたいユーザは、デバイスのスキャン機能を使用して、端末の画面の特定のエリアに表示されたコード又は記号をスキャンし、キー転送を行うことができる。音声記録デバイスによってピックアップされた音声信号を使用して類似のプロセスを実行することができる。
15.7.他のデバイスとの統合
幾つかの実施形態では、取り込み装置の機能は、既に使用されている他のデバイスと統合される。統合デバイスは、電源、データ取り込み及び記憶機能、並びにネットワークインターフェースを共有可能にすることができる。このような統合は、コスト低減のため、或いは他の場合に利用可能でない機能を可能にするために単に便宜上行うことができる。
取り込み機能を統合できるデバイスの幾つかの実施例を以下に挙げる。
・マウス、スタイラス、USB「ウェブカム」カメラ、Bluetooth(商標)ヘッドセット、又はリモコン装置などの既存の周辺機器:
・PDA、MP3プレーヤー、ボイスレコーダ、デジタルカメラ、又は携帯電話などの別の処理/記憶装置:
・時計、宝石、ペン、車のキーホルダなど、単に便宜上持ち運ぶことの多い他のアイテム:
15.7.1.携帯電話統合
統合の利点の一実施例として、取り込み装置としての修正された携帯電話の使用を考察する。
幾つかの実施形態では、電話器ハードウェアは、テキスト取り込みが音声認識を介して適切に行うことができる場合、テキスト取り込みが電話自体によって処理されるか、又は通話の相手方にあるシステムによって扱うことができる場合、或いは、将来の処理のために電話のメモリ内に記憶できる場合などで、システムをサポートするようには修正されていない。多くの最近の電話は、システムの幾つかの部分を実装できるソフトウェアをダウンロードする機能を有する。このような音声取り込みは、多くの状況では次善最適になる可能性が高いが、例えば、かなりの暗騒音がある場合、正確な音声認識は最も良いときでも困難なタスクである。音声機能は、音声注釈を取り込むために使用されるのが最適とすることができる。
幾つかの実施形態では、多くの携帯電話に組み込まれたカメラは、テキストの画像を取り込むのに使用される。通常はカメラのビューファインダーとして機能する電話器のディスプレイは、画像の品質及びOCRに対する適合性について、テキストのどのセグメントが取り込まれるかについて、及びOCRが電話器上で実行できる場合にはテキストの表現形式についての情報をライブカメラ画像上にオーバーレイすることができる。
幾つかの実施形態では、電話器は、専用の取り込み機能を追加し、或いは電話と通信するクリップオンアダプタ或いはBluetooth接続の別個の周辺機器におけるこのような機能を提供するよう修正される。取り込みメカニズムの性質に関わらず、最新の携帯電話との統合には他の多くの利点がある。電話器は、より広い世界との接続性を有し、これは、クエリーを遠隔サーチエンジン又はシステムの他の部分に提出できること、及び文書のコピーを即時に記憶又は表示するために取り出すことができることを意味する。電話は通常、システムの機能の多くをローカルで実行するのに十分な処理能力と、データの妥当な量を取り込むのに十分な記憶装置とを有する。記憶量はまた、ユーザによって拡張できることが多い。電話器は、ユーザにフィードバックを提供するのに適度に良好なディスプレイ及び音声機能と、多くの場合に触覚フィードバックのための振動機能とを有する。電話器は良好な電源も有する。
全ての中で最も重要なことは、電話器は多くのユーザが既に携帯しているデバイスであるということである。
第3部−システムの例示的なアプリケーション
このセクションは、システム及びシステムに組み込まれるアプリケーションの例示的な使用をリストする。このリストは、純粋に例証のためのものであり、網羅的な意味ではないものとする。
16.個人用アプリケーション
16.1.ライフライブラリ
ライフライブラリ(セクション6.1.1も参照)は、加入者が保存したいあらゆる重要な文書のデジタルアーカイブであり、システムのサービスセットの実施形態である。重要な本、雑誌記事、新聞切り抜きなどは全て、ライフライブラリ内にデジタル形式で保存することができる。更に、加入者の注釈、コメント、及びメモを文書と共に保存することができる。ライフライブラリは、インターネット及びワールドワイドウェブを介してアクセスすることができる。
システムは、加入者のためのライフライブラリ文書アーカイブを作成し管理する。加入者は、文書から情報をスキャンすることによって、或いは特定の文書が加入者のライフライブラリに追加されることをシステムに示すことによって、加入者がどの文書を加入者のライフライブラリに保存させたいのかを示す。スキャン情報は、一般に、文書からのテキストであるが、バーコード又は文書を識別する他のコードとすることもできる。システムはコードを受け付けて、これを用いてソース文書を識別する。文書が識別された後、システムは、ユーザのライフライブラリ内での文書のコピー又は文書を取得できるソースへのリンクを記憶することができる。
ライフライブラリシステムの1つの実施形態では、加入者が電子コピーの取得を許可されているかどうかをチェックすることができる。例えば、読者がニューヨークタイムズ(NYT)の記事のコピーからテキスト又は識別子をスキャンし、これによって記事が読者のライフライブラリに追加されるようにする場合、ライフライブラリシステムは、読者がNYTのオンライン版に加入しているかどうかをNYTが検証し、加入している場合、読者は、自分のライフライブラリアカウントに記憶された記事のコピーを取得し、加入していない場合、文書を識別する情報及び文書の注文方法が読者のライフライブラリアカウントに記憶される。
幾つかの実施形態では、システムは、アクセス権情報を含む各加入者についての加入者プロフィールを維持する。文書アクセス情報は、幾つかの方法でコンパイルすることができ、このうちの2つは、1)加入者が、ライフライブラリシステムに文書アクセス情報を加入者のアカウント名及びパスワード等と共に供給すること、又は2)ライフライブラリのサービスプロバイダが発行者に加入者の情報について問い合わせをし、ライフライブラリ加入者が資料にアクセスすることが許可されている場合に発行者が文書の電子コピーへのアクセスを与えることによって応答することである。ライフライブラリ加入者が文書の電子コピーを有することが許可されていない場合、発行者は、ライフライブラリのサービスプロバイダに価格を提示し、次いで、顧客に電子文書を購入するオプションを提供する。この場合、ライフライブラリのサービスプロバイダは、発行者に直接支払い、後でライフライブラリの顧客に請求するか、或いはライフライブラリのサービスプロバイダが、その購入に対して顧客のクレジットカードに直ちに課金する。ライフライブラリのサービスプロバイダは、購入価格の一定のパーセンテージ、或いは取引を容易にするための小額の固定手数料を受け取ることになる。
システムは、加入者がアーカイブ権を有する加入者の個人ライブラリ及び/又は他の何らかのライブラリ内の文書をアーカイブすることができる。例えば、ユーザが印刷文書からテキストをスキャンすると、ライフライブラリシステムは、レンダリング文書及びその対応電子文書を識別することができる。ソース文書が識別された後、ライフライブラリシステムは、加入者がアーカイブ権を有するユーザの個人ライブラリ及びグループライブラリ内にソース文書についての情報を記録することができる。グループライブラリは、プロジェクトで共に作業するグループ、学術研究者のグループ、グループウェブログ、その他向けの文書レポジトリのような共同アーカイブである。
ライフライブラリは、多くの方法、すなわち時系列、トピック毎、加入者の関心のレベル毎、発行のタイプ(新聞、本、雑誌、技術論文など)毎、読み込む場所、読み込む時間、ISBN毎、或いはデューイ十進毎など、様々に編成することができる。1つの代替形態では、システムは、他の加入者が同じ文書をどのように分類したかに基づいて分類を学習することができる。システムは、ユーザに分類を提案するか、或いはユーザのために自動的に文書を分類することができる。
種々の実施形態では、注釈は、直接文書に挿入することができ、或いは別のファイルに維持することができる。例えば、加入者が新聞記事からテキストをスキャンすると、記事は、スキャンされたテキストが強調表示されて加入者のライフライブラリ内にアーカイブされる。或いは、記事は、関連の注釈ファイルと共に加入者のライフライブラリ内にアーカイブされる(従って、アーカイブ文書は未修正のままである)。システムの実施形態は、各加入者のライブラリ内にソース文書に1つのコピー、多くの加入者がアクセスできるマスターライブラリに1つのコピー、又は発行者によって保持されているコピーへのリンクを保持することができる。
幾つかの実施形態では、ライフライブラリは、文書に対するユーザの修正(例えば、強調表示など)と文書のオンライン版へのリンク(他の場所に記憶されている)だけを記憶する。システム又は加入者は、加入者が次に文書を取り出すときに、文書に対してこの変更を併合する。
注釈が別々のファイルに保持されている場合、ソース文書及び注釈ファイルは加入者に提供され、加入者が、これらを組み合わせて修正文書を作成する。或いは、システムは、2つのファイルを加入者に提示する前に組み合わせる。別の代替形態では、注釈ファイルは、文書ファイルへのオーバーレイであり、加入者のコンピュータ内のソフトウェアによって文書上にオーバーレイすることができる。
ライフライブラリサービスへの加入者は、毎月の手数料を支払い、システムに加入者のアーカイブを維持させる。或いは、加入者は、アーカイブに記憶された各文書に対して小額(例えば、マイクロペイメント)を支払う。或いは、加入者は、1アクセス当たりの手数料で支払って加入者のアーカイブにアクセスする。或いは、加入者は、ライブラリをコンパイルし、ライフライブラリのサービスプロバイダ及び著作権所有者との収益シェアモデル上で資料/注釈に他者がアクセスできるようにする。或いは、ライフライブラリのサービスプロバイダは、ライフライブラリ加入者が文書を注文したときに発行者から支払いを受け取る(出版者との収益シェアモデル、ここではライフライブラリのサービスプロバイダが発行者の収益の持ち分を受け取る)。
幾つかの実施形態では、ライフライブラリのサービスプロバイダは、加入者と著作権所有者(又はCCCとして知られるCopyright Clearance Centerなどの著作権所有者の代理人)との間の仲介人としての役割を果たし、著作権のある資料に対する請求及び支払いを容易にする。ライフライブラリのサービスプロバイダは、この仲介サービスを提供するために加入者の請求情報及び他のユーザアカウント情報を使用する。基本的に、ライフライブラリのサービスプロバイダは、加入者との既存の関係を活用して、加入者に代わって著作権のある資料を購入できるようにする。
幾つかの実施形態では、ライフライブラリシステムは、文書からの抜粋を記憶することができる。例えば、加入者が紙文書からテキストをスキャンしたときに、文書全体がライフライブラリにアーカイブされるのではなく、スキャンされたテキストの周りの領域が抜粋され、ライフライブラリに配置される。これは、オリジナルスキャンの状況を保存することで加入者が関心のある部分を見つけるために文書を再読しないようにするので、文書が長い場合は特に有利である。勿論、紙文書の対応電子文書全体へのハイパーリンクは、抜粋資料と共に含めることができる。
幾つかの実施形態では、システムはまた、著者、発行タイトル、発行日付、発行者、著作権所有者(又は著作権所有者のライセンス代理人)、ISBN、文書の公開注釈へのリンク、読書ランキングなどの文書についての情報をライフライブラリ内に記憶する。文書についてのこの付加的な情報の幾つかは、紙文書メタデータの形式である。サードパーティは、一般公衆のような自己以外の人のアクセスに対する公開注釈ファイルを作成することができる。文書に関するサードパーティのコメントへのリンクは、他のユーザの注釈ファイルを読むことで加入者の文書の理解が深まるので有利である。
幾つかの実施形態では、システムはクラス毎に資料をアーカイブする。この特徴によって、ライフライブラリ加入者は、各紙文書にアクセスすることなく紙文書のクラス全体に対する対応電子文書を迅速に記憶することができる。例えば、加入者が、National Geographic誌のコピーからあるテキストをスキャンした場合、システムは、National Geographicの全てのバックナンバーをアーカイブするオプションを加入者に提供する。加入者が全てのバックナンバーのアーカイブを選択した場合、ライフライブラリのサービスプロバイダは、加入者がアーカイブすることを許可されているかどうかをNational Geographic Societyに確認する。許可されていない場合、ライフライブラリのサービスプロバイダは、National Geographic誌のコレクションをアーカイブする権利の購入を仲介することができる。
16.2.ライフセーバ
ライフライブラリの概念のバリエーション又は拡張は、「ライフセーバ」であり、システムは、ユーザによって取り込まれたテキストを使用してユーザの他の動作について更に推測する。特定のレストランからのメニュー、特定の劇場公演からのプログラム、特定の鉄道駅の時刻表、又は地方の新聞からの記事をスキャンすることによって、システムは、ユーザのロケーション及び社会活動について推測できるようになり、例えば、ウェブサイトのように社会活動の自動ダイアリーを構成することができる。ユーザは、ダイアリーを編集及び修正し、写真などの付加的な資料を追加し、更に、勿論、スキャンされた項目を再度見ることができる。
17.学術アプリケーション
説明されたシステムによってサポートされるポータブルスキャナは、学術的設定において多くの有力な用途がある。ポータブルスキャナは、生徒/教師の対話を向上させ、学習経験を高めることができる。他の使用の中で、生徒らは、生徒固有のニーズに合うように学習材料に注釈を付けることができ、教師は、学業成績をモニタすることができ、教師は、生徒の課題に引用されたソース資料を自動的に検証することができる。
17.1.子供の本
本などの紙文書との子供の対話は、当該システムの実施形態の特定のセットを用いる読み書き能力習得システムによってモニタされる。子供は、読み書き能力習得システムの他の要素と通信するポータブルスキャナを使用する。ポータブルスキャナに加えて、読み書き能力習得システムは、ディスプレイ及びスピーカを有するコンピュータと、コンピュータがアクセス可能なデータベースとを含む。スキャナは、コンピュータに結合されている(ハードワイヤード、短距離RFなど)。子供が本の中の知らないワードを調べるときに、子供は、そのワードをスキャナでスキャンする。1つの実施形態では、読み書き能力習得システムは、スキャンされたテキストをそのデータベース内のリソースと比較して、そのワードを識別する。データベースは、辞書、シソーラス、及び/又はマルチメディアファイル(例えば、音声、グラフィクスなど)を含む。ワードが識別された後、システムは、コンピュータスピーカを使用して、そのワードと定義を子供に音読する。別の実施形態では、ワードとその定義が、読み書き能力習得システムによってコンピュータのモニタ上に表示される。スキャンされたワードについてのマルチメディアファイルはまた、コンピュータのモニタ及びスピーカを通じて再生することができる。例えば、「Goldilocks and the Three Bears」を読んでいる子供が「bear」というワードをスキャンした場合、システムは、「bear」というワードを音読し、コンピュータのモニタ上に熊についてのショートビデオを再生することができる。このようにして、子供は、書いたワードの発音を学び、マルチメディア表現を介してそのワードの意味を視覚的に教わる。
読み書き能力習得システムは、学習プロセスを向上させる聴覚及び/又は視覚情報を即時に提供する。子供は、この補足情報を使用して、書かれた資料を迅速により深く理解する。システムを用いて、初心者の読者に読むことを教えること、より多くの語彙を子供が取得するのを助けることなどが可能である。システムは、子供がよく知らないワードについての情報又は子供がより多くの情報を望むワードについての情報を子供に提供する。
17.2.読み書き能力習得
幾つかの実施形態では、システムは、個人辞書をコンパイルする。読者が、新しい、興味のある、又は特に有用もしくは問題となるワードを調べる場合、読者は、このワードを(その定義と共に)コンピュータファイルに保存する。このコンピュータファイルは、読者の個人化された辞書になる。この辞書は、一般に、通常の辞書よりも小さなサイズであるので、移動局又は関連デバイスにダウンロードすることができ、従って、システムに即座にアクセスできない場合でも利用可能とすることができる。幾つかの実施形態では、個人用辞書エントリは、適切なワードの発音を支援するための音声ファイルと、ワードがスキャンされた紙文書を識別する情報とを含む。
幾つかの実施形態では、システムは、生徒のためにカスタマイズされたスペリング及びボキャブラリーのテストを作成する。例えば、生徒が課題を読むときに、その生徒は、ポータブルスキャナで知らないワードをスキャンすることができる。システムは、生徒がスキャンしたワード全てのリストを記憶する。後で、システムは、関連するモニタ上で生徒にカスタマイズされたスペリング/ボキャブラリーテストを実施する(或いは、関連のプリンタに当該テストを印刷する)。
17.3.音楽教育
譜表上の音符の配列は、テキストの1行における文字の配列に類似している。本システムにおいてテキストを取り込むための上述の同じスキャンデバイスを用いて、音符を取り込むことができ、既知の音楽作品のデータベースに対するサーチを構成する類似のプロセスによって、取り込みが行われた作品が識別可能になり、次いで、取り出し、再生、又は何らかの更なる動作のベースとなることができる。
17.4.盗用検出
教師は、生徒の紙文書からテキストをスキャンしてスキャンされたテキストをシステムに提出することによって、盗用を検出又はソースを検証するためにシステムを使用することができる。例えば、生徒の紙文書における引用が、生徒が挙げたソースからのものであることを検証したい教師は、引用の部分をスキャンし、システムによって識別された文書のタイトルと生徒が挙げた文書のタイトルとを比較することができる。同様に、システムは、生徒の元の作品として提出された課題からのテキストのスキャンを使用して、テキストが代わりにコピーされたものであるかどうかを明らかにすることができる。
17.5.強化された教科書
幾つかの実施形態では、学術的教科書からテキストを取り込むことは、生徒又は職員を、より詳細な説明、更なる演習、資料に関する生徒と職員の討議、関係のある過去の試験問題の例、主題に関する更なる読み込み、主題に関する講義の記録などとリンクする(セクション7.1を参照)。
17.6.言語学習
幾つかの実施形態では、システムは、外国語を教えるために使用される。例えば、スペイン語のワードをスキャンすると、英語でのその定義と共に、そのワードをスペイン語で音読される。
システムは、新しい言語習得プロセスを強化させるために聴覚及び/又は視覚情報を直ちに提供する。読者は、この補足情報を使用し、資料を迅速且つより深く理解するようにする。システムを用いて、初心者の生徒に外国語の読み方を教え、生徒がより多くの語彙を取得するなどを助けることができる。システムは、読者がよく知らない外国語の単語についての情報、或いは読者がより多くの情報を望むワードについての情報を提供する。
新聞又は本などの紙文書と読者との対話は、言語スキルシステムによってモニタされる。読者は、言語スキルシステムと通信するポータブルスキャナを有する。幾つかの実施形態では、言語スキルシステムは、ディスプレイ及びスピーカを有するコンピュータと、コンピュータがアクセス可能なデータベースとを含む。スキャナは、コンピュータと通信する(ハードワイヤード、短距離RFなど)。読者が記事の中の知らないワードを調べるときに、読者は、このワードをスキャナでスキャンする。データベースは、外国語辞書、シソーラス、及び/又はマルチメディアファイル(音声、グラフィクス、その他)を含む。1つの実施形態では、システムは、スキャンされたテキストをそのデータベース内のリソースと比較し、スキャンされたワードを識別する。ワードが識別された後、システムはコンピュータスピーカを使用して、ワードとその定義を読者に音読する。幾つかの実施形態では、ワードとその定義は両方とも、コンピュータのモニタ上に表示される。スキャンされたワードに関連する文法的ヒントについてのマルチメディアファイルはまた、コンピュータのモニタ及びスピーカを介して再生することができる。例えば、「to speak」というワードがスキャンされた場合、システムは「hablar」というワードを発音し、適切なスペイン語の発音を示す短いオーディオクリップを再生し、「hablar」の種々の活用の完全なリストを表示することができる。このようにして、生徒は、書かれたワードの発音を学び、マルチメディア表現を介してそのワードのスペリングを視覚的に教わり、動詞の活用法を学ぶ。システムはまた、慣用句と共に「hablar」の適切な用法についての文法的ヒントを示すことができる。
幾つかの実施形態では、ユーザは、ユーザの母国語(又はユーザが適度に知っている他の言語)以外の言語におけるレンダリング文書からのあるワード又は短いフレーズをスキャンする。幾つかの実施形態では、システムは、ユーザの「好ましい」言語の優先順位リストを保持する。システムは、レンダリング文書の対応電子文書を識別し、文書内のスキャンのロケーションを求める。システムはまた、ユーザの好みの言語の1つに翻訳された文書の第2対応電子文書を識別し、元の文書におけるスキャンのロケーションに対応する翻訳文書におけるロケーションを求める。対応するロケーションが正確に知られていない場合、システムは、スキャンされたロケーションの対応するロケーションを含む小領域(例えば、パラグラフ)を識別する。次いで、対応する翻訳ロケーションがユーザに提示される。これは、語順ベースで正確に翻訳することが困難なことが多いあらゆるスラング又は他の慣用的用法を含む、スキャンされたロケーションでの特定の用法の正確な翻訳をユーザに提供する。
17.7.研究資料の収集
特定のトピックを調査しているユーザは、印刷物及び画面上の両方で全ての種類の資料に遭遇する可能性があり、ユーザは、ある個人用アーカイブにおいてそのトピックに関連するものとして記録することを望む場合がある。システムにより、資料のいずれの部分における短いフレーズをスキャンした結果としてこのプロセスを自動的に行うことが可能となり、また、この主題に関する発行物に掲載するのに好適な参考文献を作成することができる。
18.商用アプリケーション
明らかに、商業活動は、本明細書で記載されたほとんどどのプロセスから説明することができるが、ここでは幾つかの明白な収益の流れに重点を置く。
18.1.手数料ベースのサーチ及びインデックス作成
従来のインターネットサーチエンジンは通常、電子文書の無料サーチを提供しており、また、インデックス内にこれらのコンテンツを含むことに対してコンテンツプロバイダに課金していない。幾つかの実施形態では、システムは、システムのオペレーション及び使用に関してユーザへの課金及び/又はサーチエンジン及び/又はコンテンツプロバイダへの支払いを可能にする。
幾つかの実施形態では、システムのサービスへの加入者は、紙文書のスキャンに由来するサーチに対して手数料を支払う。例えば、株式仲買人は、会社Xによって提供される新しい製品についてWall Street Journalの記事を読んでいる可能性がある。紙文書から会社Xの名前をスキャンして、必要な手数料を支払うことに同意することによって、株式仲買人は、システムを使用し、特別な又は専用データベースをサーチして、アナリストのレポートのような企業に関するプレミアム情報を取得する。システムはまた、例えば特定の日に発行された新聞の全てにインデックスが作成され、新聞が街に出るまでに確実に利用可能にすることによって、紙形式で読まれる可能性が最も高い文書のインデックス作成を優先させるように取り決めることができる。
コンテンツプロバイダは、紙文書から提出されたサーチクエリーにおける幾つかの用語と関連付けられた手数料を支払うことができる。例えば、1つの実施形態では、システムは、プロバイダについての付加的なコンテキストに基づいて最も好ましいコンテンツプロバイダを選択する(コンテキストとは、この場合、結果リストが繰り上がるようにコンテンツプロバイダが手数料を支払ったということである)。本質的に、サーチプロバイダは、コンテンツプロバイダとの既にある支払い協定に基づいて紙文書のサーチ結果を調整している。セクション5.2のキーワード及びキーフレーズの説明も参照されたい。
特定のコンテンツへのアクセスが特定のグループの人々(クライアント又は従業員など)に制限される必要がある場合、このようなコンテンツは、ファイアウォールによって保護され、従って一般的にはサードパーティによるインデックス作成を行うことができない。それでもコンテンツプロバイダは、保護されたコンテンツにインデックスを提供したいと望む場合がある。このような場合、コンテンツプロバイダは、サービスプロバイダに支払いをして、コンテンツプロバイダのインデックスをシステム加入者に提供することができる。例えば、法律事務所は、クライアントの文書の全てにインデックスを作成することができる。文書は、法律事務所のファイアウォールの背後に記憶される。しかしながら、法律事務所は、その従業員及びクライアントにポータブルスキャナを介して文書にアクセスすることを望むので、サービスプロバイダにインデックス(又はインデックスへのポインタ)を提供して、法律事務所の従業員又はクライアントが自分のポータブルスキャナを介して紙をスキャンしたサーチ用語を提出したときに法律事務所のインデックスをサーチする。法律事務所は、従業員及び/又はクライアントのリストをサービスプロバイダのシステムに提供してこの機能を有効にすることができ、又は、システムは、法律事務所のインデックスのサーチの前に法律事務所に問い合わせをすることによってアクセス権を検証することができる。上記の実施例において、法律事務所によって提供されるインデックスは、そのクライアントの文書だけであり、法律事務所における全文書のインデックスではない点に留意されたい。従って、サービスプロバイダは、法律事務所がクライアントに対してインデックスを作成した文書への法律事務所のクライアントアクセスだけが認められる。
紙文書に由来するサーチの結果とすることができる少なくとも2つの別々の収益の流れがあり、1つは、サーチ機能からの収益の流れであり、もう1つはコンテンツ配信機能からの収益の流れである。サーチ機能の収益は、スキャナユーザからの支払い済み購読料から発生することができるが、1サーチ当たりの課金で生成することもできる。コンテンツ配信収益は、コンテンツプロバイダ又は著作権所有者と分配することができる(サービスプロバイダは、各配信に対して小額決済などの販売のある割合又は固定手数料を取ることができる)が、サービスプロバイダが取引を仲介するかどうかに関わらず、加入者がオンラインカタログから注文し、システムが配達又は提供する全ての項目に対して手数料又はある割合を取る「照会」モデルによっても発生することができる。幾つかの実施形態では、システムサービスプロバイダは、識別された製品の購入が行われたときに、所定時間期間又は以降のある時間において加入者がコンテンツプロバイダから行った全ての購入に対して収益を受け取る。
18.2.カタログ
消費者は、ポータブルスキャナを使用して紙のカタログから買い物をすることができる。加入者は、カタログから情報をスキャンして、該カタログを識別する。この情報は、カタログからのテキスト、バーコード、又はカタログの別の識別子である。加入者は、購入したい製品を識別する情報をスキャンする。カタログの宛名ラベルは、カタログベンダーに対して顧客を識別する顧客識別番号を包含できる。この場合、加入者はまた、この顧客識別番号をスキャンすることができる。システムは、加入者とベンダーとの間の仲介者としての役割を果たし、顧客の選択及び顧客識別番号をベンダーに提供することによってカタログ購入を容易にする。
18.3.クーポン
消費者は、紙クーポンをスキャンし、後で取り出して使用するために、スキャナ内、又はコンピュータなどの遠隔デバイス内にクーポンの電子コピーを保存する。電子記憶装置の利点は、消費者が紙クーポンを持ち歩く負担から解放される点である。更なる利点は、電子クーポンがあらゆるロケーションから取り出すことができることである。幾つかの実施形態では、システムは、クーポンの有効期限を追跡し、まもなく期限切れとなるクーポンについて消費者に通知し、及び/又は期限切れのクーポンを記憶装置から削除することができる。クーポンの発行者にとっての利点は、誰がクーポンを使おうとしているか、及びいつどこでクーポンが取り込まれて使用されたかに関してより多くのフィードバックを受け取る可能性があることである。。
19.一般的なアプリケーション
19.1.形式
システムは、紙形式に対応する電子文書を自動的にポピュレートするために使用できる。ユーザは、紙形式を一意的に識別する何らかのテキスト又はバーコードをスキャンする。スキャナは、フォームのアイデンティティ及びユーザを識別する情報を近くのコンピュータに通信する。近くのコンピュータは、インターネット接続を有する。近くのコンピュータは、フォームの第1データベースと、スキャナのユーザに関する情報を有する第2データベース(サービスプロバイダの加入者情報データベースなど)にアクセスすることができる。近くのコンピュータは、第1データベースから紙形式の電子版にアクセスし、第2データベースから取得されたユーザの情報からフォームのフィールドを自動的にポピュレートする。次いで、近くのコンピュータは、完成したフォームを指定受信者に電子メールで送信する。或いは、コンピュータは、完成したフォームを近くのプリンタで印刷することができる。
外部データベースにアクセスするのではなく、幾つかの実施形態では、システムは、アイデンティティモジュール、SIM、又はセキュリティカードなどにユーザの情報を包含するポータブルスキャナを有する。スキャナは、フォームを識別する情報を近くのPCに提供する。近くのPCは、電子フォームにアクセスして、何らかの必要情報についてスキャナに問い合わせをし、そのフォームに記入する。
19.2.名刺
システムは、紙文書から電子アドレス帳又は他の連絡先リストを自動的にポピュレートするのに使用できる。例えば、新しい知人の名刺を受け取ったときに、ユーザは、ユーザの携帯電話を用いて名刺の画像を取り込むことができる。システムは、名刺の電子コピーの位置を特定し、これを用いて、新しい知人の連絡先情報によって携帯電話のオンボードアドレス帳を更新することができる。電子コピーは、新しい知人についての情報を名刺に詰め込むよりも多く含めることができる。更に、オンボードアドレス帳はまた、電子コピーへのリンクを記憶することができ、これによって、電子コピーに対するどのような変更も携帯電話のアドレス帳において自動的に更新されることになる。この実施例では、名刺は、電子コピーの存在を示す記号又はテキストを任意選択的に含む。電子コピーが存在しない場合、携帯電話は、OCR及び標準的な名刺フォーマットの知識を使用して、新しい知人についてアドレス帳のエントリに記入することができる。記号は、画像から直接的に情報を抽出するプロセスを支援することができる。例えば、名刺の電話番号の隣りにある電話アイコンを認識し、電話番号の所在地を特定することができる。
19.3.校正/編集
本システムは、校正及び編集プロセスを拡張することができる。システムが編集プロセスを拡張することができる1つの方法は、紙文書との編集者の対話をその対応電子文書にリンク付けすることに基づく。編集者が紙文書を読み込み、文書の種々の部分をスキャンすると、システムは、紙文書の対応電子文書に対して適切な注釈又は編集を行うことになる。例えば、編集者がテキストの一部分をスキャンし、スキャナを用いて「新しいパラグラフ」の制御ジェスチャーを行った場合、スキャナと通信するコンピュータは、文書の電子コピー内のスキャンされたテキストのロケーションにおいて「新しいパラグラフ」改行を挿入する。
19.4.音声注釈
ユーザは、文書からテキストの一部分をスキャンし、次いでスキャンされたテキストに関連する音声記録を行うことによって、その文書に音声注釈を付けることができる。幾つかの実施形態では、スキャナは、ユーザの口頭注釈を記録するためのマイクロフォンを有する。口頭注釈が記録された後、システムは、テキストがスキャンされた文書を識別し、文書内でスキャンされたテキストの位置を特定し、更にそのポイントに音声注釈を添付する。幾つかの実施形態では、システムは、音声をテキストに変換して、テキストコメントとして注釈を添付する。
幾つかの実施形態では、システムは、注釈を文書から分離して保持し、注釈に対する参照だけが文書と共に保持される。次いで注釈は、特定の加入者又はユーザのグループにとって文書に対する注釈マークアップレイヤとなる。
幾つかの実施形態では、各取り込み及び関連する注釈に対して、本システムは、文書を識別し、ソフトウェアパッケージを使用して文書を開き、スキャンのロケーションまでスクロールして、音声注釈を再生する。次いでユーザは、音声注釈、提案された変更、或いは自分又は他の誰かが記録した他のコメントを参照しながら文書と対話することができる。
19.5.テキスト形式のヘルプ
説明されたシステムを用いて、電子ヘルプメニューによって紙文書を拡張することができる。幾つかの実施形態では、紙文書に関連するマークアップレイヤは、文書についてのヘルプメニュー情報を包含する。例えば、ユーザが文書の特定の部分からテキストをスキャンすると、システムは、文書に関連するマークアップをチェックし、ユーザにヘルプメニューを提示する。ヘルプメニューは、スキャナのディスプレイ上、又は関連する近くのディスプレイ上に提示される。
19.6.ディスプレイとの使用
状況によっては、テレビ、コンピュータモニタ、又は他の同様のディスプレイから情報をスキャンできるようにすることが有利である。幾つかの実施形態では、ポータブルスキャナを用いて、コンピュータモニタ及びテレビからの情報をスキャンする。幾つかの実施形態では、ポータブル光学スキャナは、照射センサを有し、ラスタ化、画面ブランキング、その他のような従来の陰極線管(CRT)ディスプレイ技術と連動するよう最適化される。
文書からテキストを音読しているユーザの音声を取り込むことによって動作する音声取り込み装置は通常、その文書が、紙面上、ディスプレイ上、又は他の何らかの媒体上にあるかどうかに関わらず動作することになる。
19.6.1.公衆ブース及び動的セッションID
ディスプレイの直接スキャンの1つの用途は、セクション15.6で説明されたデバイスの関連付けである。例えば、幾つかの実施形態では、公衆ブースが、そのモニタ上に動的セッションIDを表示する。ブースは、インターネット又は企業イントラネットなどの通信ネットワークに接続されている。セッションIDは、定期的に代わるが、しかしながら、少なくともブースを使用して全ユーザに対して新しいセッションIDが表示されるようにされる度に変わる。ブースを使用するために、加入者は、ブースに表示されたセッションIDをスキャンし、セッションIDをスキャンすることによって、ユーザは、印刷された文書のスキャンから又はブース画面自体から生じたコンテンツを配信するためにユーザのスキャナにブースを一時的に関連付けたいことをシステムに通知する。スキャナは、スキャナを認証するセッションID及び他の情報(シリアルナンバー、アカウント番号、又は他の識別情報など)を直接的にシステムに伝達することができる。例えば、スキャナは、ユーザの携帯電話(Bluetooth(商標)を介してユーザのスキャナとペアにされた)を介してセッション開始メッセージを送信することによって、システムと直接通信することができる(ここでの「直接」とは、ブースを介してメッセージをわたすことがないことを意味する)。或いは、スキャナは、セッション開始情報をブースに転送する(恐らくは、Bluetooth(商標)などの短距離RFを介して)ことによって、ブースとの無線リンクを確立して、ブースの通信リンクを使用することができ、これに応答して、ブースは、インターネット接続を介してセッション開始情報をシステムに送信する。
システムは、デバイスがスキャナに関連付けられている期間(又はセッション)の間に既にスキャナに関連付けられているデバイスを他者が使用できないようにすることができる。この特徴は、別の人のセッションが終了する前に公衆ブースを他者が使用できないようにするのに有用である。インターネットカフェでのコンピュータの使用に関するこの概念の実施例として、ユーザは、ユーザが使用したいPCのモニタ上のバーコードをスキャンし、これに応答して、システムは、表示するモニタにセッションIDを送信し、ユーザが、モニタからセッションIDをスキャンする(又はポータブルスキャナ上のキーパッド又はタッチ画面もしくはマイクロフォンを介してセッションIDを入力する)ことによってセッションを開始し、システムは、そのデータベースにおいてセッションIDを自分のスキャナのシリアルナンバー(又はユーザのスキャナを一意に識別する他の識別子)に関連付けるので、別のスキャナは、ユーザのセッション中にセッションIDをスキャンし、モニタを使用できないようになる。スキャナは、モニタに関連付けられたPCと(Bluetooth(商標)などの無線リンク、ドッキングステーションなどのハードワイヤードリンク、その他を介して)通信するか、或いは携帯電話などの別の手段を介してシステムと直接(すなわち、PCを経由することなく)通信する。
第4部−システムの詳細
レンダリング文書から光学的又は音響的にキーワードを取り込むことに応答して、或いは取り込まれたキーワードに基づいて文書を識別することに応答して広告などの動作をトリガするためのソフトウェア及び/又はハードウェアシステムについて説明する(「システム」)。場合によっては、システムは、キーワードに対する広告を提示し、注釈を表示し、或いは動作を修正又は適用する。本明細書で使用されるキーワードとは、1つ又はそれ以上のワード、アイコン、記号、又は画像を意味する。本出願では用語「ワード」及び「複数のワード」が使用されることが多いが、幾つかの実施形態ではアイコン、記号、又は画像を用いることができる。本明細書で使用されるキーワードはまた、1つ又はそれ以上の隣接する記号から構成されるフレーズを指す。本明細書で使用されるキーワードは、取り込みに応答して識別されレンダリング文書又はレンダリング文書の一部分と共に検討されるトピック又は主題に関連するワードを含む。キーワードは、正規表現アルゴリズム又は画像処理によって認識可能なオブジェクトのクラスを任意選択的に含むことができる。オブジェクトのこのようなクラスは、電子メールアドレス、郵送先住所、電話番号、URL、ハイパーリンク、並びにコンテンツ、引用、商標、ロゴ、正式名称、時刻、日付などへの他のポインタを含むことができる。
キーワードは、「過負荷状態」であると考えられる、すなわち、キーワードは、テキスト又は記号のようなユーザにとって一般的な(例えば視覚的な)意味を超えた、ある関連する意味或いは動作を有する。幾つかの実施形態では、キーワードと意味又は動作の間の関連付けは、マークアッププロセス又はデータによって設定される。幾つかの実施形態では、キーワード又は文書と意味又は動作との間の関連付けは、取り込み又は識別が行われた時点でシステムに既知となる。幾つかの実施形態では、キーワード又は文書と意味又は動作との間の関連付けは、取り込み又は識別が行われた後に設定される。
幾つかの実施形態では、本システムは文書を識別し、ユーザに提示される広告をトリガ及び選択するために文書のコンテンツを使用する。場合によっては、システムは、文書を解析し、文書のコンテンツを1つ又はそれ以上のキーワードに関連付けることができる。場合によっては、システムは、全文書のコンテンツに基づいて広告(動作)を選択する。場合によっては、システムは、取り込まれたテキストを包含するか又はその近傍にある文書の一部分に基づいて広告を選択する。場合によっては、システムは、文書を識別するときに使用されていない文書のコンテンツに基づいて広告を選択する。
説明されたシステムの幾つかの実施形態において、レンダリング文書におけるキーワードとの対話には、文書からの取り込みが具体的にキーワードを包含すること、或いは識別された文書に関連するキーワードが特定のキーワードであることを必要としない。取り込みが、キーワードを全体的に含む、キーワードと重なる(キーワードの一部を包含する)、キーワードに近接する(例えば、同じパラグラフ又は同じページ上にある)、或いはキーワードに包含される情報に類似した情報又は関連する情報(例えば、ワード、アイコン、トークン、記号、画像)を包含する場合には、取り込みは、キーワードに関連する動作をトリガすることができる。キーワードに関連する動作は、ユーザがキーワードに含まれるワードの同義語を取り込んだ場合、或いは文書がキーワードの同義語に関連付けられている場合に呼び出すことができる。例えば、キーワードがワード「猫」を含み、ユーザがワード「ネコ科動物」を含むテキストを取り込んだ場合、任意選択的に、「猫」に関連する動作を呼び出すことができる。或いは、ユーザがワード「猫」又はワード「ネコ科動物」を包含するページ上のどこかを取り込んだ場合、任意選択的に、「猫」を包含するキーワードに関連する動作を呼び出すことができる。
同様に、システムが、「ネコ科動物」を含む文書を識別し、その文書のコンテンツを解析し、更にその文書のキーワードを決定した場合、システムは、キーワード「猫」に関連する動作(広告メッセージなど)を呼び出すことができる。
幾つかの実施形態では、取り込みがどのようにキーワードに関係するか、及びこれらの取り込みからどの特定の動作が生じるかを指定する特定の命令及び/又はデータが、システム内にマークアップとして記憶される。
幾つかの実施形態では、キーワードに関連してとられる動作は、一つには、取り込みがどのように行われたかによって決定される。キーワードの近傍、キーワードへの重なり、キーワードに加えて他の資料を包含する、及びキーワードを厳密に包含する取り込みは各々、種々の動作のセットをもたらすことができる。周りに資料がない状態でキーワード「IBM」を取り込むと、ユーザのブラウザをIBMのウェブサイトに差し向けることができる。周囲のセンテンス内でIBMを取り込むと、システムが他の取り込まれた資料を処理しこれに応答している間、IBMの広告を表示させることができる。幾つかの実施形態では、キーワードをネストすることができ、或いはコーワードを重ねることができる。システムは、「IBMデータ」、「データサーバ」、及び「データ」に関連する動作を有することができ、ユーザが「IBMデータサーバ」というフレーズを取り込んだときに、これらのキーワードの一部又は全てに関連する動作を呼び出すことができる。
キーワードの実施例は、用語「IBM」であり、文書におけるそのキーワードの出現は、読者のウェブブラウザをIBMウェブサイトに誘導することに関連付けることができる。キーワードの他の実施例は、フレーズ「ソニーヘッドセット」、製品型式番号「DR−EX151」、及び本のタイトル「Learning Bash Shell」である。これらのキーワードに関連する動作は、Amazon.comでの販売の対象物のリストを照会すること、含まれる用語の1つ又はそれ以上を販売の1つ又はそれ以上の対象物に一致させること、及びユーザにAmazonを介してこれらの対象物を購入する機会を提供することとすることができる。
幾つかの実施形態では、システムは、テキストの取り込みに基づいて対応電子文書を識別し、次に、識別に基づいた動作(広告の提示など)を実行する。例えば、テキスト「DR−EX151仕様書」の取り込みは、その製品モデルに対する製品仕様文書を識別することができる。この実施例では、システムは、文書の電子版を取り出し、関連の広告と共にこの文書をユーザに提示する。システムは、(類似の製品に関連する情報を提供する電子メールメッセージを送信することなどによって)文書とは別に広告を提示することができ、或いは(対応電子文書内に埋め込むことなどによって)対応電子文書内に広告を提示することができる。
開示されるシステムの幾つかの実施形態は、レンダリング文書からのデータ取り込みに応答してコンテキスト動作を実行する。コンテキスト動作とは、レンダリング文書内の特定のロケーションから取り込まれたテキスト内又はその近傍の情報のような、他の情報のコンテキストにおいて、或いは他の情報に応答してユーザ選択のメニューを提示する又は広告メッセージを提示するといった動作の開始又は取り掛かりを実施することを意味する。
コンテキスト動作の1つのタイプは、コンテキスト広告であり、これは、取り込まれた情報及び何らかのコンテキストに基づいて選択された広告をユーザに提示することを意味する。本明細書で「動的コンテキスト広告」と呼ばれるコンテキスト広告のサブセットは、関連コンテンツに関して提示する幾つかの利用可能な広告メッセージの1つを動的に選択する段階を含む。
コンテキスト広告は、広告主の製品に関心を持つ人々がその関心を調べている時点で広告メッセージが配信されるので、特に効果的である。動的コンテキスト広告は、コンテンツが作成又は発行された時点では利用可能でなかった広告メッセージをコンテンツが読まれている時に提示する融通性を保持するので、特に効果的である。
種々の実施形態は、レンダリング文書に対するコンテキスト動作を提供する。コンテキスト動作は、特定のコンテキストに適した動作及び応答を提供することができ、すなわち、動作は、コンテキストの変化に応じて変わることができる。システムにおけるコンテキスト動作の実施例は、ユーザが文書からテキストを取り込んだときに、ポータブル取り込み装置302に付随するディスプレイ上に現れるメニューである。このメニューは、取り込まれたテキスト、テキストが取り込まれたロケーション、その他に応じて動的に変わることができる。
動作は、「表示する」などの動詞、及び「広告メッセージ」などの目的語を任意選択的に含むことができる。幾つかの実施形態でシステムによってサポートされる付加的な動詞は、送る又は受け取る(例えば、電子メールメッセージ、インスタントメッセージ、取り込み又はキーワードを含む文書のコピー)、印刷する(例えば、パンフレット)、「ブラウズする」(例えば、ウェブページ)、及び「起動する」(例えば、コンピュータアプリケーション)を含む。
幾つかの実施形態では、トリガされる動作は、広告主又はスポンサーに代わって広告メッセージを提示する段階を含む。幾つかの実施形態では、動作は、全ての文書、文書のグループ、単一の文書、又は文書の一部分に関連付けることができる。
幾つかの実施形態では、トリガされる動作は、実施可能なユーザ開始動作又は選択のメニューを提示する段階を含む。幾つかの実施形態では、選択のメニューは、例えば携帯電話ディスプレイ、パーソナルコンピュータディスプレイ421、又は取り込み装置302に統合されたディスプレイなど、関連するディスプレイデバイス上に提示される。幾つかの実施形態では、選択のメニューはまた、ユーザがユーザアカウント履歴又はライフライブラリから後で取り込みをレビューしたときに、全体的に又は部分的に利用可能である。幾つかの実施形態では、動作のメニューは、キーワード、レンダリング文書、又は文書のより大きなグループもしくはクラスに関連付けられたマークアップデータ及び/又はマークアッププロセスによって決定される。
幾つかの実施形態では、動作のメニューは、ゼロ、1、又はそれ以上のデフォルト動作を任意選択的に有することができる。幾つかの実施形態では、デフォルト動作は、ユーザがメニューと対話しない場合、例えばユーザが後続の取り込みに進んだ場合に開始される。幾つかの実施形態では、デフォルト動作は、キーワード、レンダリング文書、又は文書のより大きなグループもしくはクラスに関連付けられたマークアップデータ及び/又はマークアッププロセスによって決定される。
幾つかの実施形態では、動作のメニューは、ユーザによって選択される可能性の高い項目がメニューリストのトップなど、何らかの既知のロケーション又は参考文献により近く現れるように提示される。選択の可能性は、幾つかの実施形態では、システムのこのユーザによって及び他のユーザによって過去に選択された項目を追跡することにより決定することができる。幾つかの実施形態では、動作のメニューは、システムによって用いられる標準的な動作のサブセットを含むことができる。特定の取り込みに固有のメニュー項目と共に、標準的な動作は、種々のコンテキストにおける種々の組み合わせにおいて現れることができる。幾つかの標準的な動作は、キーワードが認識されていない場合及び/又は取り込みのコンテキストが知られていない場合にメニューに現れることができる。幾つかの標準的な動作は、取り込み装置302がシステムの他のコンポーネントから分離されたときに生成されるメニューに現れることができる。
標準的な動作は、特に以下のものを含むことができる。
・このワード/フレーズを話す
・これを別の言語に翻訳する(及び話す、表示する、又は印刷する)
・ヘルプ機能
・これについて詳細に知る
・この写真を表示する
・ブックマークする
・下線を引く
・抜粋する(コピーする)
・マイカレンダーに追加する
・マイ連絡先リストに追加する
・これを購入する
・電子メールで受け取る
・マイアーカイブに保存する
・音声注釈を追加する
・いずれかの関連音声注釈を再生する
・関連付けられたコンテンツを表示する
・関係のあるコンテンツを表示する
・コンテンツのインデックス又はテーブルにおいてこの主題を見つける
・このトピックに関心があることをメモする
・このウェブサイトに行く
・これに関する情報を受け取る
・完成したこのフォームを自分宛に送る
・自分用のこのフォームを終了する
・私の情報と共にこのフォームを提出する
・ウェブ上でこれをサーチする
・この文書を印刷する
・この文書を自分のコンピュータ画面又は関連するディスプレイ上にアップする
・自分のディスプレイに文書内のこのワード/フレーズの出現を全て表示する
・他のコンテキストで使用されたときにこのワード/フレーズをサーチして表示する
・この項目を選択する(例えば、複数の選択)
・注記のリニアファイルに抜粋する
・他者がこの文書/ページ/行/フレーズについて記述又は口述したことを表示する
・この電話番号に電話する
・この文書がオンラインで利用可能になったときに通知してもらう
・利用可能になった場合/タイミングについての情報を受け取る
・電子メールをこの人/会社/アドレスに送る
・このコンテキスト/賞/オファーの勝者である場合に通知をもらう
・このイベント、賞/抽選会/宝くじに登録する
・この一節を読んだことを記録する
・この声明/契約/条項に同意することを記録する
・このトピックに関する新しい情報が利用可能になったときに通知をもらう
・自分についてのトピックを見る
・この文書が変わったタイミング/場合に通知をもらう
幾つかの実施形態では、動作のメニューが、コンテンツ近傍、並びにユーザによって具体的に取り込まれたコンテンツに対し任意選択的に提示される。幾つかの実施形態では、システムは、前の取り込みで選択された選択肢を使用して、文書との後続の対話にどの項目を提示するか、及びプレゼンテーションのこれらの順序を決定する。頻繁に選択されるメニュー項目は、メニュープレゼンテーションのトップに表示することができる。幾つかの実施形態では、メニュー項目は、関係する選択肢の付加的なサブメニューを任意選択的に呼び出すことができる。
以下の文章は、後で更に詳細に説明された添付図面における表記を参照する。複数の動作が単一のキーワードに対して利用可能な場合、システムの幾つかの実施形態は、様々な行動規則を使用して、実行するこれらの動作のサブセットを選択し、例えば該規則は、どの動作が他の動作よりも優先されるかを決定付けるための階層を指定することができる。例えば、規則は、動作が適用されるコンテンツ本体のサイズの昇順でシステムが動作を選択するよう指示することができる。一実施例として、特定の発行者によって発行された特定の教科書の特定のチャプターでキーワードが取り込まれた場合、システムは、教科書のチャプターに関連する第1動作を選択し、次いで、特定の教科書に関連する第2動作を選択し、次に、発行者によって発行された教科書の全てに関連する第3動作を選択することができる。システムはまた、取り込み時に取り込み装置302が存在する地理的領域もしくはロケーション、キーワードが取り込まれた時間又は日付範囲、取り込みに関する種々の他の種類のコンテキスト情報、ユーザに関連する種々の種類のプロフィール情報、及び/又はスポンサーに動作を提供するのにスポンサーが同意したお金の額又は他の報酬に基づいて動作を選択することができる。
幾つかの実施形態では、システムは、コンピュータ212システムに無線接続されたハンドヘルド光学及び/又は音響取り込み装置302、或いは携帯電話における音響及び/又は撮像コンポーネント、或いはPDA(「パーソナルデジタルアシスタント」)に統合された同様のコンポーネントなどのハンドヘルド光学及び/又は音響取り込み装置を利用する。
幾つかの実施形態では、システムは、レンダリング文書から取り込み、キーワード登録情報を記憶するキーワードサーバ440と通信するのに使用される光学及び/又は音響取り込み装置302を含む。幾つかの実施形態では、キーワード登録情報は、登録されたキーワードのデータベース内に記憶される。幾つかの実施形態では、この情報は、マークアップデータのデータベース内に記憶される。幾つかの実施形態では、この情報は、レンダリング文書に関連するマークアップ文書内に記憶される。
幾つかの実施形態では、取り込み装置302は、一度にページ全体をスキャンする「フラットベッド」型スキャナではなく、1行ずつテキストをスキャンするのに好適なスキャンアパーチャを有する「ペン」型スキャナのようなポータブル又はハンドヘルドスキャナである。フラットベッドスキャナは、一般的にはポータブルではなく、ペン型スキャナよりもかなり大きいものである。ペン型スキャナは、キーワードがスキャンされたときにユーザに示すためのインジケータを有することができる。例えばスキャナは、LED332を発光させて、スキャンされたワードがキーワードとして認識されたことをユーザに知らせることができる。ユーザは、スキャナ上のボタンを押下して(或いは、スキャナを用いてジェスチャーを実行して)プロセスを開始することができ、例えば、キーワードに関係する情報がユーザに送信された場合に、関連動作が行われるようになる。
取り込み装置302は、関連するディスプレイデバイスを有することができる。関連するディスプレイデバイスの実施例は、パーソナルコンピュータディスプレイ421及び携帯電話(216)上のディスプレイを含む。動作及び他の対話並びに情報データのメニューは、関連ディスプレイデバイス上に表示することができる。取り込み装置302が携帯電話内に統合されるか、或いは携帯電話のコンポーネントを使用する場合、携帯電話キーパッドを使用して携帯電話ディスプレイに提示されたメニューから選択肢を選択すし、説明されたシステム及び機能を制御及び対話することができる。
取り込み装置302が取り込み中にキーワードサーバ440と通信しない場合には、取り込み装置302内に人気のあるキーワード、関連動作、マークアップデータ、及びその他のローカルキャッシュを有し、取り込み装置302がローカルで且つ独立して動作を開始できるようになる。ローカルで独立した動作の実施例は、キーワードの収集を指示すること、選択メニューをユーザに提示すること、及びメニューに対するユーザの応答を受け取ることである。取り込み装置302が次にキーワードサーバ440と通信すると、キーワード、マークアップ、その他についての付加的な情報が求められ、これに基づいて動作することができる。
種々の実施形態では、ワード又はフレーズを動作に関連付ける情報(例えばマークアップ情報)は、取り込み装置302内、取り込み装置302に接続されたコンピュータ212システム内、及び/又は説明されたシステムが通信可能な他のコンピュータシステム内に記憶することができる。キーワードの取り込みに応答して動作を実行するのには、同様に広い範囲のデバイスが関わることができる。
取り込み装置302と組み合わせて、キーワードサーバ440は、テキストが取り込まれた文書を自動的に識別し、レンダリング文書の電子版の位置を特定することができる。例えば、取り込みにおけるテキストコンテンツは、文書署名として扱うことができる。このような署名は通常、一意に文書を識別するために10又はこれよりも少ないワードを必要とし、多くの場合、3から8ワードで十分である。付加的なコンテキスト情報が既知である場合、文書を識別するのに必要なワードの数は、更に低減することができる。複数の文書が1つの署名に一致する場合、最も可能性の高い一致(例えば、当該又は他のユーザによるほとんどの取り込みを包含するもの)を特別に、例えば、リスト又はメニューの第1項目としてユーザに提示することができる。複数の文書が1つの署名に一致した場合、前回の又は次の取り込みを使用して、候補の曖昧さを除去し、ユーザに所有されているレンダリング文書を正確に識別し、更に任意選択的にその対応デジタル文書の位置を正確に特定することができる。
システムの幾つかの実施形態において提供される文書取り出しサービスの加入者であるユーザに対して、キーワードサーバ440は、取り込まれたテキストに関するコンテンツ、或いは取り込みが実行されたコンテキスト(例えば、パラグラフ、ページ、雑誌記事)の主題に関するコンテンツを配信することができる。従って、取り込みへの応答は、取り込みのコンテキストに動的に依存し、更に、キーワードサーバ440に既知のユーザの習慣及び好みに依存することができる。
システムは、レンダリング発行物から取り込まれたテキスト又は他の情報(商標、記号、トークン、画像など)に関係する電子コンテンツの効率的な配信を可能にする。システムは、新聞及び雑誌などのレンダリング発行物に基づいて製品及びサービスを広告及び販売する新しい方法を可能にする。従来の新聞では、ニュース記事自体は広告を包含していない。このシステムによって、あらゆる記事のテキストが、製品、サービス、会社などに関連付けられたキーワードの使用を介して潜在的に広告を含むことができるようになる。
システムがレンダリング発行物に対して拡張されたコンテンツを配信する方法の1つは、レンダリングテキストにおけるキーワードの使用に基づく。予め設定されたキーワードがユーザによって取り込まれると、取り込まれたキーワードにより、キーワードに関連付けられたコンテンツの配信がトリガされる。幾つかの実施形態では、キーワードがキーワードサーバ440によって再認識され、これによってコンテンツがデータベースから抽出され、ユーザに関連するデバイス(任意選択的にディスプレイ又はスピーカなどの出力デバイス)に送信されるようになる。関連デバイスは、近くのディスプレイ又はプリンタとすることができる。システムは、各レンダーキーワード(又はキーワードの組み合わせ)を製品又はサービスの広告に関連付けることができる。実施例として、ユーザがレンダリング文書(自動車雑誌など)から「新車」というワードを取り込んだ場合、システムは、ローカルのFord販売代理店の広告をポータブル取り込み装置302のロケーション近くのディスプレイに送信するようトリガすることができる。
同様に、ユーザが取り込み装置302を使用してレンダリング文書から商標を取り込んだ場合、システムは、商標所有者の製品ラインについての情報をユーザに送ることができる。ユーザが商標及び製品名を取り込んだ場合、ユーザに送られる情報は、その製品に固有の情報を提供するように更に絞られることになる。例えば、ユーザが「Sanford」というワードを取り込んだ場合、システムは、このワードをSanfordオフィスサプライ社の商標として認識し、ユーザにSanfordオフィスサプライのカタログの電子コピーを提供することができる(或いはその代わりに、システムは、カタログのオンラインコピーを有するSanfordウェブページへのリンクを提供できる)。別の実施例として、ユーザが「Sanfordユニボール」を取り込んだ場合、システムは、これらのキーワードをSanford社製のユニボールインクペンに関係付けるようにプログラムすることができる。この場合、システムは、Sanfordのユニボールインクペンのラインについての情報をユーザに配信することになる。システムは、電子メールの形式でこの情報(Sanfordユニボールインクペンについての情報又はペンについての情報を有するウェブページへのホットリンクを有する)を、ユーザの近くのディスプレイへのプッシュマルチメディアメッセージとして、近くのプリンタに送信されるカタログとしてなどでユーザの電子メールアカウントに配信することができる。
レンダリング発行物から取り込まれたキーワードをユーザへの付加的なコンテンツの配信に関連付けるこの方法は、広告及び他の資料を目標に効率的に提供するのに極めて有用である。ユーザによって取り込まれたキーワードを識別することにより、システムは、適時且つ有用な情報をユーザに提供することができる。プリンタ製造業者は、ユーザが「コンピュータプリンタ」というキーワードを取り込んだときにユーザに送信される製造業者のプリンタの広告を出すことに支払いをすることができる。更に、特定のキーワードの権利は、コンテンツの1つ又はそれ以上のタイプ(例えば、特定の雑誌内、特定のトピックに関連した記事内、又はトピックに当てはまる他のキーワードの近く)に関して販売又はリースすることができる。システムは、「コンピュータプリンタ」というキーワードを単一のプリンタ製造業者に独占的に関連付けることができ、或いは、これらのキーワードを幾つかのプリンタ製造業者に関連付けることができる(又は、トピックが「コンピュータ」というキーワードに関連付けられる記事のコンテキストにおけるワードキーワード「プリンタ」)。複数のプリンタ製造業者がキーワードに関連付けられている場合、システムは、各製造業者から、広告、クーポン、その他を配信することができる(或いは、各製造業者が、別のコンテキストにおいてキーワードの権利を取得できる)。ユーザがクリックスルーして、提供品のいずれかを利用するか、或いは製造業者のウェブサイトを訪れた場合、製造業者には、システムのオペレータが小額の支払い(マイクロペイメントと呼ばれることが多い)を課金することができる。幾つかの実施形態では、取り込み装置302又は関連のコンピュータ212は、後で使用するためのクーポンを記憶することができる。
システムはまた、ユーザがテキストを取り込んだ状況についてのコンテキストを使用して、キーワード及び取り込みを更にカテゴリー化することができる。キーワードは、取り込みについてのコンテキストのシステム知識/認識に基づいて別個に処理することができる。コンテキストの実施例は、ユーザの取り込み履歴及び関心、同じ文書における他のユーザの取り込み履歴、ユーザのロケーション、テキストが取り込まれた文書、取り込み近傍の他のテキスト又は情報(例えば、取り込みと同じパラグラフ内又は同じページ上)、取り込みが行われた時刻などの知識である。例えば、システムは、ユーザのロケーションに応じて、或いはキーワードが出現する周りのテキストに応じて異なるように反応することができる。サービスプロバイダは、取り込み装置302のロケーションを知ることによって、種々の市場で同じキーワードを販売又はリースすることができる。実施例は、同じキーワードをニューヨークのユーザに対して広告主#1に販売し、シアトルのユーザに対して広告主#2に販売することである。サービスプロバイダは、「ハンマー」というキーワードを種々の都市のローカルの工具店に販売することができる。
レンダリング文書のキーワードを「リース」又は販売する多くの方法が存在する。システムは、取り込み時刻、取り込みのロケーション、取り込まれた文書に基づいて他のキーワード(例えば、「釘」又は「建設」という語近くに出現する「ハンマー」)と組み合わせてキーワードのリースを分割することができる。一般的な製品記述をリースする1つの実施例として、「最新本タイトル」及び「ベストセラー」というキーワードを書籍販売業者に販売することができる。ユーザがレンダリング文書(新聞など)から「最新本タイトル」又は「ベストセラー」というワードを取り込むと、最も売れている本のリストが書籍販売業者のウェブページへのリンクと共に送信され、これによってユーザがこれらを購入することができるようになる。或いは、リンクが、キーワードサーバ440を介してルーティングされる「パス−スルー」リンク(これによって、システムはクリックスルー取引をカウント及び監査できる)とすることができ、これによって書籍販売業者はクリック−スルー販売の収益をシステムのオペレータと分けることができ、よって、書籍販売業者は、実績ベースで広告に対して支払いをすることができる(すなわち、販売結果に関わらず、サービスによって発生した各クリック−スルーに対する小額支払い)。同様に、印刷された文書における広告主は、その広告又は広告近傍の取り込みに基づいて支払うことができる。
組み合わされたキーワードの取り込みは、異なるコンテンツの配信を生じることができる。例えば、キーワード「釘」の近くにある(例えば、介在するワードの時間又は数が近い)キーワード「ハンマー(Hammer)」を取り込むことにより、工具店からの広告コンテンツの配信をもたらすことができる。一方、キーワード「M.C」の近傍で取り込まれたキーワード「ハンマー(Hammer)」は、エンターテイナーであるM.C.Hammerに関するコンテンツの配信をもたらすことになる。
商標所有者は、システムを使用して、ユーザがレンダリング文書から商標所有者の商標をスキャンしたときに商標所有者の製品及びサービスについての広告及びメッセージを配信することができる。
キーワードリースは、地理に基づいて分割することができる。例えば、キーワード「新車の購入」は、大きな自動車製造業者に対して全国的にリースすることができ、及び/又はローカルの自動車販売店に地域毎にリースすることができる。「新車の購入」がローカルの自動車販売店からのコンテンツに関連付けられる場合、ニューヨーク市で「新車の購入」を取り込む行為により、ニューヨーク市の自動車販売店からの広告の配信をもたらすことができ、フランスのパリで取り込まれた「新車の購入」という同じフレーズは、パリ近郊の自動車販売店からの広告の配信をもたらすことになる。
キーワードのリースは、テキストが取り込まれた文書に基づいて分割することができる。例えば、銃器雑誌からのキーワード「Assault Weapon Ban(攻撃用武器規制法)」を取り込むことで、National Rifle Association(全米ライフル協会)からの銃支持のコンテンツの配信をもたらすことができる。リベラル派の雑誌からの同じキーワード「攻撃用武器規制法」を取り込むことで、拳銃暴力に対するBrady Centerからの銃所持反対のコンテンツの配信をもたらすことができる。
有名人の名前は、有名人がニュース及びメッセージをファンに配信するのを助けるために使用できる。例えば、フレーズ「Madonna」は、パフォーマーであるマドンナに関するコンテンツに関連付けることができる。ユーザがレンダリング文書からワード「Madonna」を取り込んだ場合、システムは、取り込みのロケーション近傍の開催地のマドンナのコンサート情報、Amzon.comでのマドンナの音楽を購入するためのリンク、マドンナのマーケティングカンパニーからの最新プロモーションのリリース、マドンナの最新ヒット曲からの要約MP3クリップ、その他を送信することができる。
広告を特定の取り込まれたテキストに関連付けるコストは、取り込み時刻に応じて変えることができる。あるピーク時にリースするにはより多くのコストがかかり、閑散時にはより少ないコストになる可能性がある。例えば、用語「ダイヤモンド」は、毎年の所得税が支払われる期間よりもクリスマスショッピングシーズンのピーク期間にダイヤモンド販売者がリースするにはより多くのコストがかかる可能性がある。別の実施例として、「芝刈り機」のような用語は、(レンダリング文書からテキストを取り込むユーザの)深夜のオーディエンスは少ないことが推定されるので、午前9時から午後7時よりも、深夜から午前5時までがリースするのにより少ないコストがかかる可能性がある。
特定の広告又はメッセージは、多くのキーワードに関連付けることができる。例えば、Harley Davidsonオートバイの広告は、「Harley」、「Harley Davidson」、「新車オートバイ」、「クラシックオートバイ」などのキーワードに関連付けることができる。
広告又はメッセージは、相対位置など、あるキーワード間の関係に関連付けることができる。例えばユーザがレンダリング文書からワード「オートバイ」を取り込んだ場合、及びキーワード「買う」がキーワード「オートバイ」の6ワード以内にあった場合、オートバイに関係する広告又はメッセージがユーザに配信されることになる。文書コンテキストが既知であると、キーワード「買う」が取り込まれたワード「オートバイ」の一定の距離以内に存在する事実は、ワード「オートバイ」だけが取り込まれた場合でもシステムには既知となる。従って、キーワード「オートバイを買う」に関連する動作が、ワード「オートバイ」だけを取り込み且つ文書についてのコンテキストを適用してすることによってトリガされ、取り込まれたワードを更に解釈することができる。
幾つかの実施形態では、システムは、テキスト取り込みに基づく文書の識別に応答してキーワードを生成し、生成されたキーワードに基づいて動作を呼び出すことができる。次にシステムは、取り込まれたキーワードに関して上述したように、キーワードに対して広告を関連付けることができる。これらの実施形態に関する付加的な詳細を以下で説明する。
システムを添付の図面に関して以下で更に説明する。図4は、システムが動作することができる1つの環境を示すシステム図である。ユーザは、光学及び/又は音響取り込み装置302を使用して文書400からシーケンス401を取り込む。取り込み装置302は、無線接続、例えばIEEE802.11、802.16、WLAN、Bluetooth、又は赤外線接続などを介して、近くのユーザコンピュータシステム212と対話する。視覚ディスプレイ421及びレンダラー422を含む種々のデバイスは、ユーザコンピュータシステム212に接続できる。
取り込み装置302は、取り込まれたシーケンスをユーザコンピュータシステム212にわたす。ユーザコンピュータシステム212は、シーケンスをネットワーク220(例えば、インターネット又は別のネットワーク)を介してキーワードサーバコンピュータシステム440に送信する。幾つかの実施形態では、キーワードサーバ440は、サービスプロバイダ又はシステムオペレータのネットワークの一部である。幾つかの実施形態では、ユーザコンピュータシステム212は、ユーザを識別する情報、ユーザのロケーションを識別する情報、取り込みの日付及び/又は時間を示す情報などの付加的な情報をシステムが使用可能なシーケンスと共に送信し、シーケンスが含むキーワードに関連する幾つかの実施可能な動作の1つを選択する。
以下で検討されるように、キーワードサーバ440は、特定のキーワードに対する特定の動作を指定するキーワード動作テーブル441(例えば、グローバルマークアップ文書)とシーケンスを比較する。幾つかの実施形態では、キーワードサーバ440は更に、文書識別インデックス442を使用して、取り込まれたシーケンスに基づいて文書を識別する。文書を識別できる限りは、キーワードサーバ440は、識別された文書についての文書動作マップ443(例えば、レンダリング文書に関連付けられた電子マークアップ文書)にアクセスし、該マップは、識別された文書或いは識別された文書の特定の部分における幾つかのキーワードを取り込むことに応答して実行される動作を識別することができる。キーワードサーバ440は、システムが使用できるユーザについてのデータを包含する、取り込み装置ユーザのためのユーザプロフィール444を更に記憶して、シーケンスが含むキーワードに対して実行するのに利用可能な代替の動作から選択することができる。
幾つかの実施形態では、キーワードに関連する動作は、実行する動作のタイプを示す動詞と、動作の目的となるコンテンツを識別する目的語とからなる。場合によっては、オブジェクトは、実際のコンテンツを包含することができ、他の場合では、オブジェクトは、実際のコンテンツのアドレス又は実際のコンテンツへのポインタを包含することができる。場合によっては、実際のコンテンツは、キーワードサーバ440上のどこか(例えば別のメモリロケーション)に記憶され、他の場合では、コンテンツ451(例えば広告コンテンツ)は、別個のコンピュータシステム450(広告主サーバなど)上に記憶される。
上記に説明された環境に関して種々の実施形態を説明しているが、当業者であれば、システムが、単一のコンピュータシステム並びにコンピュータシステム又は種々の方法で接続された同様のデバイスの他の種々の組み合わせを含む、様々な他の環境で実装できる点は理解されるであろう。
図5は、ユーザのキーワードの取り込みに応答して動作を実行するために、システムによって実行される例示的なステップを示すフロー図である。ステップ501で、本システムは、ユーザによって取り込まれたシーケンスを受け取る。任意選択的なステップ502で、システムは、ステップ501で受け取られた取り込みシーケンスを包含する文書、及びこの文書における取り込みシーケンスの位置を識別する。ステップ503で、システムは、1つ又はそれ以上の動作が指定される取り込みシーケンスにおけるワード、フレーズ、又は記号を識別する。動作は、キーワード動作テーブル、識別された文書400のための文書動作マップ、又はこの両方で指定することができる。ステップ504で、システムは、ステップ503で識別されたワード、フレーズ、又は記号に関連する動作を選択する。ステップ505で、システムは、選択された動作を実行する。ステップ505の後、システムはステップ501に戻り、次に取り込まれるシーケンスを受け取る。
当業者であれば、図5に示されたステップを様々な方法で変更できる点は理解されるであろう。例えば、ステップの順序は再配置することができ、サブステップを並行して実行することができ、図示のステップを省略することができ、或いは他のステップを含めることができる、などである。
図6は、キーワード動作テーブルのサンプルコンテンツを示すテーブル図である。キーワード動作テーブル600は、行601−605などの行から構成されており、各々が、特定の動作を一定の条件下での特定のキーワードに関連付けている。各行は、以下の列に分かれており、すなわち、キーワードを包含するキーワード列611、行のキーワードの取り込みに応答して行の動作を実行するために満たす必要のあるあらゆる条件を包含する条件列612、行の動作の動詞又は動作タイプを包含する動作動詞列613、及び行の動作の目的を包含する動作目的列614に分かれている。例えば、行601は、キーワード「ピペット」が文書ID01239876を有する文書から取り込まれたときに、以下の動作:すなわち取り込み装置のユーザからの電子メールメッセージをアドレス「info@garlabs.com」に送信する動作を実行することができることを示す。行602は、キーワード「ピペット」が文書ID012343210又は9766789を有する文書から取り込まれたときに、以下の動作:すなわちラベル「Filbertプレミアムピペットを試す」を有するハイパーテキストリンクとリンクソース「http://www.filbert.com」とをユーザに表示する動作を実行することができることを示す。行603は、キーワード「ピペット」が「教科書」タイプである文書から取り込まれたときに、以下の動作:すなわち「http://www.equips.com/products.htm」にあるウェブページを表示する動作を実行することができることを示す。行604は、キーワード「パイプスミス」が午後6時から午後11時までの時間の間に06465から06469までのZIPコードで取り込まれたときに、以下の動作:すなわち、ラベル「明日午前9時までに配管の見積りをもらう」を有するハイパーテキストリンクとリンクソース「http://www.webplumb.com」とをユーザに表示する動作を実行することができることを示す。行605は、プロフィールがガラス吹き製法への関心を示すユーザによって、キーワード「パイプスミス」が取り込まれたときに、以下の動作:すなわち「http://www.glassworkshop.com」にあるウェブページを表示する動作を実行することができることを示している。
図6及び以下で検討されるテーブル図の各々は、コンテンツ及び組織が人間の読者によってより理解し易いように設計されたテーブルを示しているが、当業者であれば、この情報を記憶するためにシステムによって使用される実際のデータ構造は、例えば、異なる方式で編成することができる、図示されたもの以外の情報を多少含むことができる、圧縮及び/又は暗号化することができるなど、図示のテーブルとは異なる可能性がある点は理解されるであろう。
図7は、特定の文書に対する文書動作マップのサンプルコンテンツを示すテーブル図である。文書動作マップは、行701−703のような行から構成されており、各々は、特定の動作を文書の特定の部分において取り込まれたときの特定のキーワードと関連付けている。各行は、以下の列に分かれており、すなわち、行を適用する文字位置の範囲を識別する文字範囲列711、キーワードを包含するキーワード列712、行の動作の動詞又は動作タイプを包含する動作動詞列713、及び行の動作の目的を包含する動作目的列714に分かれている。例えば、行701は、キーワード「ピペット」が、動作マップの表題である文書内の文字範囲1−15120のどこかで取り込まれた場合に、以下の動作:すなわち、文字列「SanLabs−あなたのピペットニーズの全てに」をユーザに表示する動作を実行することができることを示す。行702は、キーワード「ピペット」が、動作マップの表題である文書の文字範囲50−495のどこかで取り込まれた場合に、以下の動作:すなわち、「http://www.sanlabs.com/hardened_pipette20.htm」にあるウェブページを表示する動作を実行することができることを示す。行703は、キーワード「リトマス」が文字範囲600−1700のどこかで取り込まれた場合に、以下の動作:すなわち、ユーザコンピュータシステム212に接続されたプリンタなどのユーザの近くに位置付けられるプリンタに「http://www.hansen.com/testkit.pdf」から取り出されたパンフレットを印刷する動作を実行することができることを示す。
図8は、キーワードに関係のない資料のユーザ取り込みに応答した動作、或いは図5に示されるようなキーワードに応答した付加的な処理として動作を実行するためにシステムによって実行される例示的なステップを示すフロー図である。ステップ801で、システムは、ユーザによって取り込まれたシーケンスを受け取る。任意選択的なステップ802で、システムは、ステップ801で受け取った取り込みシーケンスを包含する文書400、及びこの文書における取り込みシーケンスの位置を識別する。ステップ803で、システムは、文書400に関連付けられたマークアップデータ又はプロセス、文書におけるロケーション、又はスキャンされた特定のデータを識別する。動作は、レンダリング文書の対応デジタル文書、別のマークアップ文書、マークアップデータ及び命令のデータベースにおいて指定することができる。マークアップデータは、取り込み装置302上、近くのデバイス上のメモリ又は記憶装置内、或いは説明されたシステム内のサーバ上に記憶することができる。ステップ804で、システムは、ステップ803で決定されたマークアップに関連する動作を選択する。ステップ805で、システムは選択された動作を実行する。ステップ805の後、システムは、ステップ801に戻り、次に取り込まれるシーケンスを受け取る。
幾つかの実施形態では、システムは、テキスト取り込みに基づく文書の識別に応答してキーワードを生成し、生成されたキーワードに基づいて動作を呼び出す。次にシステムは、キーワードに対して広告を関連付けることができる。システムは、全てのキーワードを同様に扱うことができ、すなわち、システムは、取り込まれたキーワードを特定の動作に関連付け、生成されたキーワードを同じか又は同様の動作に関連付けることができる。
例えばユーザは、その文書に特有である(従って、文書を識別するのに使用できる)がその文書のテーマ又は主題を示すものではないワードの短いシーケンスを文書から取り込むことができる。この実施例では、ユーザは、フレーズ「私は迅速に後に続き、降りて行った」を文書から取り込む。取り込まれたフレーズを使用すると、システムは、この文書をHarman Melvilleの小説「白鯨」として識別する。文書のコンテンツ「白鯨」の解析は、捕鯨産業、Harman Melvilleの他の小説、その他に関する広告をトリガすることができる。取り込まれたシーケンスからのあらゆる可能なキーワードである、「迅速に」、「続き」、「後に」、又は「降りて」は、関連する広告メッセージをシステムがユーザに表示することにつながる可能性は低い。
更に、システムは、取り込まれたフレーズがその本の「朝食」と題されたチャプター5に位置付けられることを明らかにすることができる。これらの場合、広告は、本の該当する部分を向けることができ、朝食のシリアル、ユーザの近所でブランチをとる場所などに関係する広告を含むことができる。システムは、文書の一部分に関する細分性の種々のレベルに基づいて広告を決定することができる。例えば、この部分は、本のチャプター(或いは、上記で検討されたように本全体)程の大きさとすることができ、或いは、節の1又は2つのセンテンスとすることができる。
従って、取り込まれたテキストは、ユーザによってスキャンされたレンダリング文書を識別できるが、システムは、広告をトリガするのに取り込まれたテキストを必要としない可能性がある。更に、ユーザは、関連の広告メッセージを呼び出すことになるどのようなキーワードも取り込まないが、システムは、ユーザのニーズ又は関心を満たそうとする動的広告を提供することができる。
図9は、文書の識別に応答して広告を提示するために、システムによって行われる例示的なステップを示すフロー図である。ステップ901で、システムは、ユーザにより取り込まれたシーケンスを受け取る。ステップ902で、システムは、ステップ901で受け取られた取り込みシーケンスを包含する文書400、及びこの文書における取り込みシーケンスの位置を識別する。ステップ903で、システムは、文書400に関連付けられたマークアップデータ又はプロセス、文書における識別されたロケーション、又はスキャンされた特定のデータを識別する。広告は、レンダリング文書の対応デジタル文書、別のマークアップ文書、マークアップデータ及び命令のデータベースにおいて指定することができる。マークアップデータは、取り込み装置302上、近くのデバイス上のメモリ又は記憶装置内、或いは説明されたシステム内のサーバ上に記憶することができる。
任意選択的なステップ904で、システムは、識別された文書のコンテンツなどの識別された文書にキーワードを関連付ける。関連付けられたキーワードは、システムが生成することができ、或いは文書が識別されるか又はテキストがユーザによって取り込まれる前に、識別された文書に事前に関連付けることができる。
システムは、幾つかの方法で識別された文書に対してキーワードを生成することができる。例えば、システムは、文書のテキストを解析して反復プロセスを実行し、文書に対する1つ又はそれ以上のキーワードを決定することができる。ワードの頻度(又は頻度なし)を考慮することができる。システムは、文書に関連付けられたメタデータに関心を向けることができる。例えば、文書は、メタデータ内のキーワードを事前に提供することができ、或いは文書に関する参考文献を提供することができる。更に、システムは、文書のコンテンツを解析するときに、逆文書頻度解析、語彙及び意味解析、及び/又は文書要約技術を行うことができる。
更に、システムは、文書を識別した他の取り込みシーケンスを解析し、前回のシーケンスからキーワードを抽出することができる。システムは、キーワードの生成及び/又は識別文書との関連付の際にあらゆる数の技術を利用することができる。
ステップ905で、システムは、ステップ903で決定されたマークアップに関連付けられる広告を選択する。これは、コンテキストを使用して広告を選択する段階を含むことができる。コンテキストの実施例は、レンダリング文書のタイプ(小説、記事、アンケート調査などであるレンダリング文書)、レンダリング文書のソース(新聞、雑誌、教科書、表示されたウェブページなどが提供するレンダリング文書)を含む。コンテキストの他のタイプは、ユーザのアイデンティティ、ユーザのロケーション、ユーザがそのメンバーである人々のグループなどのようなユーザの属性を含むことができる。
ステップ906で、システムは、選択された広告を提示する。幾つかの実施形態では、システムは、識別された文書内に広告を提示する。ユーザがテキストを取り込むレンダリング文書の対応電子文書を配信する際には、システムは、1つ又はそれ以上の広告を電子版に更に追加することができる。広告は、レンダリング文書に固有、各配信された電子版に固有、及び/又はユーザに固有のものとすることができる。例えば、イギリスのユーザは、「ワールドカップ2006ハイライト」というタイトルの記事からテキストを取り込むことができ、米国のユーザは、同じ記事からテキストを取り込むことができる。本システムは、記事の電子版をイギリスのユーザに対してイギリスのサッカーチームに関する広告(ロンドンのサッカーショップの広告など)を付けて配信することができ、米国のユーザは、米国チームに関する広告(オンラインショップが販売するジャージの広告など)を包含する電子版を受け取ることができる。これらの場合、システムは、同じ電子文書の異なるコピー内に異なる広告を提供することが可能である。
幾つかの実施形態では、システムは、ユーザのスキャナ上、近くのディスプレイデバイス上、ユーザの携帯電話上などでユーザに広告を提示する。システムは、スキャンと同時に広告を提示することができる。例えば、上記の実施例を使用すると、イギリスのユーザは、「ワールドカップ2006ハイライト」の記事からテキストを取り込むと同時に、ユーザのコンピュータ上でサッカーショップの広告を受け取ることができる。
或いは、システムは、関連する広告を包含する電子メール又は他のメッセージをユーザ(ユーザの電子メールアドレスなど)に送信することができる。システムは、本明細書で検討された他の多くの方法でユーザに広告を提示することができる。
ステップ906の後、システムはステップ901に戻り、次の取り込みシーケンスを受け取る。
幾つかの実施形態では、システムは、テキスト取り込みには広告動作に関連したワードが含まれていないと判断した場合、ルーチン900のステップの一部又は全てを呼び出して、文書に関連付けられるキーワードを決定し、テキスト取り込みに関する広告を提示するようにすることができる。
幾つかの実施形態では、レンダリング文書から取り込まれたテキストを処理するための方法をコンピューティングシステムに組み入れている。このような実施形態では、システムは、ユーザによってレンダリング文書から光学的又は音響的に取り込まれた1つ又はそれ以上のワードのシーケンスを受け取る。システムは、シーケンスのワードの中で、動作が関連付けられているワード又はフレーズを識別する。システムは、ユーザに対して関連する動作を実行する。
幾つかの実施形態では、レンダリング文書から取り込まれたテキスト内にキーワードを見つけるためのシステムを組み入れている。このような環境では、システムは、レンダリング文書から1つ又はそれ以上のワードのシーケンスを取り込むために、ユーザによって使用可能なハンドヘルド光学及び/又は音響取り込み装置302を含む。システムは更に、ハンドヘルド光学及び/又は音響取り込み装置302を用いて取り込まれるシーケンスのワードの中から、動作が関連付けられているワードを識別し、ユーザに対して関連する動作を実行するプロセッサを含む。
幾つかの実施形態では、キーワードを動作にマップするデータ構造を記憶する1つ又はそれ以上のコンピュータメモリを組み込む。幾つかの実施形態では、データ構造は、ハンドヘルド光学及び/又は音響取り込み装置302を使用してレンダリング文書から取り込むことができる複数のキーワードの各々について、このキーワードに関して実行されることになる動作を指定する情報を包含するエントリを含む。
幾つかの実施形態では、レンダリング文書の対応電子文書に広告を関連付けるためのシステムを組み込む。このような実施形態では、システムは、対応電子文書を識別し、対応電子文書に関連付けられるキーワードを任意選択的に生成して、対応電子文書に関連する広告又は任意選択的に生成されたキーワードを提示する。
幾つかの実施形態では、ユーザに対するレンダリング文書のディスプレイ上でキーワードを見つけるためのシステムを組み込む。このような環境では、システムは、ディスプレイを介してレンダリング文書から1つ又はそれ以上のワードのシーケンスを取り込むために、ユーザによって使用可能なハンドヘルド光学及び/又は音響取り込み装置302を含む。或いは、ユーザは、マウス又は他のポインティングデバイス、又はキーボードなどにより、ユーザによってディスプレイで操作されるカーソル又は他の表示アイコンを使用して、表示されたキーワードを取り込むことができる。システムは更に、取り込まれたシーケンスのワードの中から、動作が関連付けられているキーワードを識別し、をユーザに対して関連する動作を実行するプロセッサを含む。
例えば、システムは、ユーザに対してウェブページ上、ワードプロ文書内、PDF文書内、画像として、或いは他のグラフィカルもしくはテキスト形式内にコンテンツを表示するプレゼンテーションレイヤ・取り込みクライアントを含むことができる。これらのコンテンツフォーマットの各々へのインターフェースを設計しようとするのではなく、幾つかの実施形態では、このシステムは、コンテンツを表現するディスプレイの取り込みと、光学式文字認識(OCR)技術を使用した取り込み画像のテキストへの変換とに依存する。具体的には、ユーザによって使用されるビューイングデバイスの画面バッファの全て又は一部がシステムによって取り込まれる。画面バッファのコンテンツは、OCRコンポーネントに提供されて、取り込まれた画像を処理し、画像内に包含されたあらゆる文字の対応するテキストを生成する。システムは、広告又は他の動作に関するあらゆるコンテンツを、システムによって識別されたOCRテキストに自動的にマップする。このようにして、本システムは、コンテンツのフォーマットに関わらず、表示されたコンテンツに基づいて広告及び他の動作を提供することができる。
幾つかの実施形態では、プレゼンテーションレイヤ・ディスプレイクライアントは、フォーマットに関わらずに広告メッセージをあらゆるコンテンツ上に重畳することができるようにされる。ユーザがビューイングデバイス上でコンテンツを見るときに、ビューイングデバイスの画面バッファの全て又は一部がシステムによって取り込まれる。画面バッファのコンテンツは、OCRコンポーネントに供給され、該コンポーネントが、取り込まれた画像を処理して、画像に包含されているあらゆる文字の対応するテキストを生成する。システムは、取り込まれたテキスト内で1つ又はそれ以上のテキストフラグメントを識別し、テキストフラグメントの図式化をコンテンツサーバに送信する。システムは、受け取られたテキストフラグメントを記憶されているテキストフラグメントと比較し、受け取られたテキストフラグメントに一致するあらゆる記憶テキストフラグメントを識別する。一致したテキストフラグメントに対応する広告は、機能毎に識別され、ディスプレイクライアントに送信される。ディスプレイクライアントは、一致したテキストフラグメントのロケーションに基づいて広告の適切なロケーションを特定し、ユーザが見ているコンテンツ上に重ね合わせられる半透明レイヤ内に広告を表示する。このようにして、広告は、見ているコンテンツのフォーマットに関わらずあらゆるコンテンツ上でユーザに表示することができる。
従って、幾つかの実施形態では、ディスプレイデバイスを介してユーザに表示されたレンダリング文書から画像を取り込むことに応答して広告を提示するシステムを組み込む。場合によっては、図9の一部又は全てのステップに関して検討されたように、表示されたレンダリング文書が識別され、ユーザに提示される。
システムは、レンダリング文書の印刷版からユーザによって取り込まれたテキストフラグメントを受け取り、レンダリング文書の電子版を識別し、更にユーザに関連付けられたディスプレイデバイスを介してレンダリング文書をユーザに提示することができる。システムは、上記で検討されたようにレンダリング文書を提示し、ディスプレイの少なくとも一部分(カーソルでユーザによって強調表示又は選択された部分など)を取り込み、本明細書で説明された光学式文字認識(OCR)技術を使用して取り込まれた画像をテキストに変換し、ユーザに表示される広告などの動作と取り込まれた画像からのテキストの一部又は全てを一致させることができる。
従って、本システムは、ユーザがあるレンダリング文書を使用することを示す環境を提供し、ユーザがレンダリング文書の印刷版又はレンダリング文書の表示版と継続して対話するかどうかに関係なく、広告の提示及び/又は動作の実行を容易にする。システムは、レンダリング文書の提示された版(印刷又はデジタル)からユーザ選択を受け取り、豊富な対話機能をユーザに提供することができる。
例えば、システムは、ユーザに関連付けられたディスプレイを介して、ひも理論に関する新聞記事の電子版をユーザに提示する。場合によっては、ユーザは、新聞記事の印刷版を持つこともあり、この場合、新聞の印刷版からのテキストシーケンスの取り込みにより、ユーザに対して電子版を表示するようシステムに指示する。この実施例では、ユーザは、電子版を介して継続して記事を読み、印刷版からはそれ以上テキストを取り込まない。場合によっては、ユーザは、電子版内でカーソルを使用して関心のあるワード又はフレーズを選択する(例えば、ユーザは、「プリンストン大学の研究者」というフレーズを選択する)。
選択を受け取ったことに応答して、システムは、取り込まれたフレーズの画像を受け取り、画像に対してOCRを実行して1つ又はそれ以上のテキストシーケンスを抽出し、1つ又はそれ以上のテキストシーケンスに関連付けられた広告を識別することができる。この実施例では、システムは、取り込まれた画像がキーワード「研究者」及び「プリンストン大学」を包含すると判定し、プリンストン大学が発行した本及びプリンストン大学で学べるオンラインコース及びセミナーに関する広告をユーザに提示する。従って、システムは、ユーザが文書の印刷版ともはや対話していなくても、ユーザに対して目的ベース、キーワードベース及び/又はロケーションベースの広告を継続して提供する。
結論
上述のシステムは、種々の手法で容易に改案又は拡張できる点は当業者であれば理解されるであろう。例えば、本システムは、広範なハードウェア、文書、動作タイプ、並びに記憶及び処理方式に関連して使用することができる。前述の説明は、種々の実施形態について言及しているが、本発明の範囲は、添付の請求項及び請求項に記載される要素によってのみ定められる。

Claims (26)

  1. 方法であって、
    キーワードサーバにおいて、レンダリング文書から光学的又は音響的に取り込まれた1つ又はそれ以上のワードのシーケンスを受け取る段階と、
    前記取り込まれた1つ又はそれ以上のワードのシーケンスに基づいて前記レンダリング文書の電子版を前記キーワードサーバを用いて識別する段階と、
    前記レンダリング文書の識別された電子版のコンテンツに基づいて、広告メッセージを前記キーワードサーバを用いて選択する段階と、
    前記レンダリング文書の電子版に関連付けられているキーワードを識別する段階と、
    前記取り込まれた1つ又はそれ以上のワードのシーケンスが前記レンダリング文書の電子版において前記レンダリング文書の電子版に関連付けられているキーワードの近くに位置しているか否かを判定する段階と、
    前記取り込まれた1つ又はそれ以上のワードのシーケンスが前記レンダリング文書の電子版において前記レンダリング文書の電子版に関連付けられているキーワードの近くに位置していると判定されたことに応じて、(i)前記取り込まれた1つ又はそれ以上のワードのシーケンス及び(ii)前記レンダリング文書の電子版に関連付けられているキーワードに関連する広告メッセージを選択する段階と、
    前記取り込まれた1つ又はそれ以上のワードのシーケンスが前記レンダリング文書の電子版において前記レンダリング文書の電子版に関連付けられているキーワードの近くに位置していないと判定されたことに応じて、前記取り込まれた1つ又はそれ以上のワードのシーケンスに関連する広告メッセージを選択する段階と、
    前記選択された広告メッセージを提供する段階を含む方法。
  2. 前記レンダリング文書が、サードパーティによってスポンサーされる、
    ことを特徴とする請求項1に記載の方法。
  3. 前記選択された広告メッセージを提供する段階が、前記レンダリング文書の電子版のコピー内に選択された前記広告メッセージを提供する段階を含む、
    請求項1に記載の方法。
  4. 前記広告メッセージを選択する段階が、前記レンダリング文書のタイプに基づいて、前記広告メッセージを選択する段階を含む、
    請求項1に記載の方法。
  5. 前記広告メッセージを選択する段階が、前記レンダリング文書のソースに基づいて、前記広告メッセージを選択する段階を含む、
    請求項1に記載の方法。
  6. 前記広告メッセージを選択する段階が、ユーザの属性に基づいて、前記広告メッセージを選択する段階を含む、
    請求項1に記載の方法。
  7. 前記広告メッセージを選択する段階が、ユーザのアイデンティティに基づいて、前記広告メッセージを選択する段階を含む、
    請求項1に記載の方法。
  8. 前記広告メッセージを選択する段階が、ユーザのロケーションに基づいて、前記広告メッセージを選択する段階を含む、
    請求項1に記載の方法。
  9. 前記広告メッセージを選択する段階が、ユーザグループのメンバーシップに基づいて、前記広告メッセージを選択する段階を含む、
    請求項1に記載の方法。
  10. 前記広告メッセージが、前記レンダリング文書が作成された後に、前記レンダリング文書の識別された電子版に関連付けられる、
    請求項1に記載の方法。
  11. 前記広告メッセージが、前記レンダリング文書がレンダリングされた後に、前記識別された電子版に関連付けられる、
    請求項1に記載の方法。
  12. 方法は、さらに、
    動作と、前記レンダリング文書の識別された電子版を関連付ける段階を含む、
    請求項1に記載の方法。
  13. 前記広告メッセージを選択する段階が、
    ワード頻度解析、逆文書頻度解析、語彙及び意味解析、又は文書要約技術の一又は二以上を使用して前記レンダリング文書の識別された電子版のコンテンツを解析し、前記レンダリング文書の電子版に関連付けられているキーワードを識別する段階を含む、
    請求項1に記載の方法。
  14. システムであって、
    レンダリング文書からの取り込まれたテキストのシーケンスを受け取るよう構成されている受信コンポーネントと、
    前記取り込まれたテキストのシーケンスを包含する前記レンダリング文書の電子版を識別するよう構成されている識別コンポーネントと、
    前記電子版のコンテンツ解析に基づいて、複数のキーワードを生成するよう構成されているコンテンツ解析コンポーネントと、
    前記複数のキーワードに基づいて広告を選択するよう構成されている選択コンポーネントと、
    を含み、
    前記選択は、
    前記取り込まれたテキストのシーケンスが前記電子版において前記生成された複数のキーワードの少なくとも一つの近くに位置しているか否かを判定し、
    前記取り込まれたテキストのシーケンスが前記電子版において前記生成された複数のキーワードの少なくとも一つの近くに位置していると判定されたことに応じて、(i)前記取り込まれたテキストのシーケンス及び(ii)前記生成された複数のキーワードの少なくとも一つに関連する特定の広告メッセージを選択し、
    前記取り込まれたテキストのシーケンスが前記電子版において前記生成された複数のキーワードの少なくとも一つの近くに位置していないと判定されたことに応じて、前記取り込まれたテキストのシーケンスに関連する特定の広告メッセージを選択する
    ことによって選択がなされる、システム。
  15. 前記識別された電子版の前記コンテンツ解析が、ワード頻度解析、逆文書頻度解析、語彙及び意味解析、又は文書要約技術の1つ又はそれ以上を含む、
    請求項14に記載のシステム。
  16. 前記識別された電子版の前記コンテンツ解析が、前記レンダリング文書のタイプ、前記レンダリング文書のソース、又は前記レンダリング文書内の前記取り込まれたテキストの位置の一又は二以上の解析を含む、
    請求項14に記載のシステム。
  17. 前記識別された電子版の前記コンテンツ解析が、ユーザのアイデンティティ、ユーザのロケーション、又は前記取り込まれたテキストのシーケンスを取り込んだユーザのユーザグループのメンバーシップの一又は二以上の解析を含む、
    請求項14に記載のシステム。
  18. 前記コンテンツ解析コンポーネントが、
    前記複数のキーワードを生成するよう構成されているキーワード生成コンポーネントを更に含む、
    ことを特徴とする請求項16に記載のシステム。
  19. レンダリング文書の電子版を広告に関連付けするデータ構造であって、前記レンダリング文書及び広告の電子版を含むデータ構造とキーワードサーバによって実行可能な命令とを集合的に包含する1つ又はそれ以上のコンピュータメモリであって、
    前記キーワードサーバによって実行される命令は、
    前記電子版が取り込まれたテキストシーケンスを包含するという判定に基づいて前記電子版を選択し、
    前記広告は、少なくとも、
    前記電子版に関連付けされているキーワードを識別し、
    前記取り込まれたテキストシーケンスが前記電子版において前記電子版に関連付けされているキーワードの近くに位置しているか否かを判定し、
    前記取り込まれたテキストシーケンスが前記電子版において前記電子版に関連付けされているキーワードの近くに位置していると判定されたことに応じて、(i)前記取り込まれたテキストシーケンス及び(ii)前記電子版に関連付けされているキーワードに関連する特定の広告メッセージを選択し、
    前記取り込まれたテキストシーケンスが前記電子版において前記電子版に関連付けされているキーワードの近くに位置していないと判定されたことに応じて、前記取り込まれたテキストシーケンスに関連する特定の広告メッセージを選択する
    ことによって選択がなされる、一又はそれ以上のコンピュータメモリ。
  20. 方法であって、
    キーワードサーバにおいて、レンダリング文書からテキストのシーケンスを示すデータを受け取る段階と、
    前記受け取られたデータを解析して、前記レンダリング文書に対する対応電子文書を前記キーワードサーバを用いて識別する段階と、
    前記対応電子文書の解析から生成され複数のキーワードに基づいて、1つ又はそれ以上の広告と前記対応電子文書を前記キーワードサーバを用いて関連付ける段階と、
    前記関連付けられた広告の1つ又はそれ以上のうちの少なくとも一つの関連付けされた広告を前記キーワードサーバを用いて提供する段階と、
    を含み、
    当該提供は、
    前記テキストのシーケンスが前記対応電子文書において前記生成された複数のキーワードの少なくとも一つの近くに位置しているか否かを判定し、
    前記テキストのシーケンスが前記対応電子文書において前記生成された複数のキーワードの少なくとも一つの近くに位置していると判定されたことに応じて、(i)前記テキストのシーケンス及び(ii)前記生成された複数のキーワードの少なくとも一つに関連する特定の広告を少なくとも一つの関連付けされた広告として選択し、
    前記テキストのシーケンスが前記対応電子文書において前記生成された複数のキーワードの少なくとも一つの近くに位置していないと判定されたことに応じて、前記テキストのシーケンスに関連する特定の広告を少なくとも一つの関連付けされた広告として選択する
    ことによって提供がなされる、方法。
  21. 前記少なくとも一つの関連付けされた広告を提供する段階が、前記レンダリング文書に関するコンテキスト情報にさらに基づいて前記少なくとも一つの関連付けれた広告を選択する段階を含む、
    ことを特徴とする請求項20に記載の方法。
  22. 前記少なくとも一つの関連付けされた広告を提供する段階が、ユーザに関するコンテキスト情報にさらに基づいて、少なくとも一つの記関連付けられた広告を選択する段階を含む、
    請求項20に記載の方法。
  23. 前記1つ又はそれ以上の広告を関連付ける段階が、前記対応電子文書のコンテンツを表す複数のキーワードを決定し、前記1つ又はそれ以上の広告と前記複数のキーワードを関連付ける段階を含む、
    請求項20に記載の方法。
  24. 前記少なくとも一つの関連付けされた広告を提供する段階が、前記対応電子文書内に広告を提供する段階を含む、
    請求項20に記載の方法。
  25. 前記少なくとも一つの関連付けされた広告を提供する段階が、広告をディスプレイデバイスで提供する段階を含む、
    請求項20に記載の方法。
  26. 受け取られた前記データは、画像を含み、当該受け取られたデータを解析することは、
    前記画像に対して光学式文字認識を行い、テキストのシーケンスを取得する段階を含む、
    請求項20に記載の方法。
JP2013191813A 2006-06-06 2013-09-17 取り込まれたレンダリングテキストに基づくコンテキスト動的広告 Active JP5752200B2 (ja)

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US81162306P 2006-06-06 2006-06-06
US60/811,623 2006-06-06
US83313106P 2006-07-24 2006-07-24
US60/833,131 2006-07-24
US84336206P 2006-09-08 2006-09-08
US60/843,362 2006-09-08
US84489406P 2006-09-15 2006-09-15
US84489306P 2006-09-15 2006-09-15
US60/844,893 2006-09-15
US60/844,894 2006-09-15
US84560406P 2006-09-18 2006-09-18
US60/845,604 2006-09-18
US91043807P 2007-04-05 2007-04-05
US60/910,438 2007-04-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009513598A Division JP2009540404A (ja) 2006-06-06 2007-06-06 取り込まれたレンダリングテキストに基づくコンテキスト動的広告

Publications (2)

Publication Number Publication Date
JP2014041620A JP2014041620A (ja) 2014-03-06
JP5752200B2 true JP5752200B2 (ja) 2015-07-22

Family

ID=38434718

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009513598A Pending JP2009540404A (ja) 2006-06-06 2007-06-06 取り込まれたレンダリングテキストに基づくコンテキスト動的広告
JP2013191813A Active JP5752200B2 (ja) 2006-06-06 2013-09-17 取り込まれたレンダリングテキストに基づくコンテキスト動的広告

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009513598A Pending JP2009540404A (ja) 2006-06-06 2007-06-06 取り込まれたレンダリングテキストに基づくコンテキスト動的広告

Country Status (3)

Country Link
EP (1) EP2036017A1 (ja)
JP (2) JP2009540404A (ja)
WO (1) WO2007141020A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US8799303B2 (en) 2004-02-15 2014-08-05 Google Inc. Establishing an interactive environment for rendered documents
US20060041484A1 (en) 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US8793162B2 (en) 2004-04-01 2014-07-29 Google Inc. Adding information or functionality to a rendered document via association with an electronic counterpart
US20080313172A1 (en) 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US20070300142A1 (en) 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8621349B2 (en) 2004-04-01 2013-12-31 Google Inc. Publishing techniques for adding value to a rendered document
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US9460346B2 (en) 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
WO2007141020A1 (en) * 2006-06-06 2007-12-13 Exbiblio B.V. Contextual dynamic advertising based upon captured rendered text
EP2067119A2 (en) 2006-09-08 2009-06-10 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
CA2667169A1 (en) * 2006-10-17 2008-04-24 Silverbrook Research Pty Ltd Method of delivering an advertisement from a computer system
US10867123B2 (en) 2009-11-09 2020-12-15 Microsoft Technology Licensing, Llc Social browsing
DE202010018601U1 (de) 2009-02-18 2018-04-30 Google LLC (n.d.Ges.d. Staates Delaware) Automatisches Erfassen von Informationen, wie etwa Erfassen von Informationen unter Verwendung einer dokumentenerkennenden Vorrichtung
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
KR102068604B1 (ko) * 2012-08-28 2020-01-22 삼성전자 주식회사 휴대단말기의 문자 인식장치 및 방법
US9697541B1 (en) * 2013-09-12 2017-07-04 Isaac S. Daniel System and method of controlling multimedia display for a game of chance
JP6880556B2 (ja) * 2016-03-10 2021-06-02 凸版印刷株式会社 情報提示装置、情報提示方法、情報提示システム、およびプログラム
US10409903B2 (en) 2016-05-31 2019-09-10 Microsoft Technology Licensing, Llc Unknown word predictor and content-integrated translator
WO2018064294A1 (en) * 2016-09-28 2018-04-05 Michael John Wakerly Mobile web browser providing contextual actions based on web page content
CN116089669B (zh) * 2023-03-09 2023-10-03 数影星球(杭州)科技有限公司 一种基于浏览器的网站上传拦截方式与系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804659B1 (en) * 2000-01-14 2004-10-12 Ricoh Company Ltd. Content based web advertising
JP2001297248A (ja) * 2000-04-12 2001-10-26 Planet Computer:Kk 広告入り電子文書の配信システム
EP1410637A2 (en) * 2000-07-27 2004-04-21 Koninklijke Philips Electronics N.V. Transcript triggers for video enhancement
JP2002117049A (ja) * 2000-10-05 2002-04-19 Fuji Xerox Co Ltd ウェブページ生成システム及びウェブページ生成方法
US7136814B1 (en) * 2000-11-03 2006-11-14 The Procter & Gamble Company Syntax-driven, operator assisted voice recognition system and methods
JP2002269253A (ja) * 2001-03-13 2002-09-20 Ricoh Co Ltd 電子文書変換サービスシステムおよび電子文書変換サービスシステムの課金方法
GB2378775A (en) * 2001-05-03 2003-02-19 Connextra Ltd Provision of Secondary Information based on Context of Primary Information
US20060069616A1 (en) 2004-09-30 2006-03-30 David Bau Determining advertisements using user behavior information such as past navigation information
KR100447526B1 (ko) 2003-03-18 2004-09-08 엔에이치엔(주) 인터넷 사용자의 접속 의도 판단 방법 및 이를 이용한인터넷 상의 광고 방법과 그 시스템
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP2005242711A (ja) * 2004-02-26 2005-09-08 Value Commerce Co Ltd 広告配信管理ネットワークシステム
EP1759278A4 (en) * 2004-04-19 2009-05-06 Exbiblio Bv PROCESSING TECHNIQUES FOR VISUAL DATA ENTRY FROM A RENDERED DOCUMENT
US7752200B2 (en) * 2004-08-09 2010-07-06 Amazon Technologies, Inc. Method and system for identifying keywords for use in placing keyword-targeted advertisements
US8489583B2 (en) * 2004-10-01 2013-07-16 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
WO2007141020A1 (en) * 2006-06-06 2007-12-13 Exbiblio B.V. Contextual dynamic advertising based upon captured rendered text

Also Published As

Publication number Publication date
EP2036017A1 (en) 2009-03-18
JP2014041620A (ja) 2014-03-06
JP2009540404A (ja) 2009-11-19
WO2007141020A1 (en) 2007-12-13

Similar Documents

Publication Publication Date Title
JP5752200B2 (ja) 取り込まれたレンダリングテキストに基づくコンテキスト動的広告
US10318995B2 (en) Contextual dynamic advertising based upon captured rendered text
US10275455B2 (en) Triggering actions in response to optically or acoustically capturing keywords from a rendered document
KR101212929B1 (ko) 렌더링된 문서로부터의 보안 데이터 수집
US8781228B2 (en) Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US7596269B2 (en) Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9268852B2 (en) Search engines and systems with handheld document data capture devices
US8346620B2 (en) Automatic modification of web pages
US8903759B2 (en) Determining actions involving captured information and electronic content associated with rendered documents
US8489624B2 (en) Processing techniques for text capture from a rendered document
US20100278453A1 (en) Capture and display of annotations in paper and electronic documents
JP2010511921A (ja) ポータブルデバイス用の紹介報奨システム
US20060104515A1 (en) Automatic modification of WEB pages
US20110153653A1 (en) Image search using text-based elements within the contents of images
EP1771784A2 (en) Triggering actions in response to optically or acoustically capturing keywords from a rendered document

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140908

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141208

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150519

R150 Certificate of patent or registration of utility model

Ref document number: 5752200

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250