JP2001229340A - 文書上の情報をスキャンしてフォーマット化するシステム - Google Patents
文書上の情報をスキャンしてフォーマット化するシステムInfo
- Publication number
- JP2001229340A JP2001229340A JP2000381844A JP2000381844A JP2001229340A JP 2001229340 A JP2001229340 A JP 2001229340A JP 2000381844 A JP2000381844 A JP 2000381844A JP 2000381844 A JP2000381844 A JP 2000381844A JP 2001229340 A JP2001229340 A JP 2001229340A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- text
- document
- scanning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
取り可能な情報をスキャンする。 【解決手段】 本発明によるシステムは、ユーザによる
文書テキストのスキャンを可能にし、そのテキストを自
動的に認識してユーザに表示するフォーマットにまとめ
る。システム10は、好ましくは、ユーザによって作動
され文書のテキストをスキャンするハンドヘルド装置1
00を含む。ハンドヘルド装置100は、スキャンした
テキスト情報を保存し、このテキスト情報をコンピュー
タ200に転送する。コンピュータ200は、文書にお
ける前記テキストのフォーマット及び文脈にもとづき、
スキャンされたテキストを自動的に認識する。さらに、
コンピュータ200は、スキャンされたテキストを表す
データエントリを自動的に作成し、これらのデータエン
トリをユーザに対して表示すべく整理する。
Description
によってユーザに読み取り可能な情報をスキャンする方
法及びシステムに関し、より詳細には、ユーザの将来的
な使用のためスキャンした情報を発見的に整理する方法
及びシステムに関する。
を読む。日刊新聞をざっと見ただけで、人が一日に見る
可能性のある多くの記事や広告がわかる。職場では、例
えば業界誌、定期刊行ニュース、あるいはインフラオフ
ィス通信などからさらに多くの情報を読む可能性があ
る。しかしながら、このように多くの情報から、重要な
情報をいかに効率的に獲得しあるいは保持すべきか途方
に暮れる経験が多々ある。
て特に重要な情報を見つけると、人は次のようなことを
行う。まず、その重要な情報及びその情報源を書き留め
る可能性がある。さらには、その記事又は広告を切り抜
いたりあるいはフォトコピーして、ある種のフォルダに
入れることもある。しかしながら、その場合に情報を記
録せず、単に自分の記憶を信じるケースが非常に多い。
ところが、前記2つのオプションの1つを行ったとして
も、情報は依然として効果的な方法で収集され、保存さ
れているわけではない。よって、その記録の保存方法は
曖昧なことが多く、後に検索する際には厄介である。
ヘルド装置が開発されている。これらのシステムは、通
常、文書の解釈及び認識についてユーザのガイダンスを
求める。例えば、システムがモードブックを用いて走査
ペンのモードを手動で変更する場合がある。モードブッ
クは複数のモードカードを含み、各モードカードにはペ
ンのモードを変更したりあるいはコマンドを入力すべく
機能する、少なくとも1つのスキャン可能なデータフィ
ールドが含まれる。スキャン可能な各データフィールド
は、機械読み取り可能な情報(例えば、バーコード、2
次元グリフコード、又は簡単に認識できる文字)と人が
読み取り可能なラベルから成る。
する。まず、ユーザが現在スキャンしている文書のタイ
プに関連するモードカードを見つけ、「開始タイトル」
など、スキャンしようとする情報のタイプに関連したフ
ィールドに走査ペンを走らせる。こうして、モードカー
ドはどんなタイプの情報を収集しているのかを走査ペン
に知らせる。よって、ユーザはモードカードのフィール
ドを交互にスキャンし、スキャンした情報をどのように
処理するかについてシステムに指示する。
の問題は、ユーザ側にかなり多くの介入が要求されるこ
とである。例えば、モードカードを常に参照することに
よって、ユーザによる文書読み取りの通常フローが中断
する。さらに、ユーザによって要求される作業量が増え
れば、ユーザが実際にその文書を最初に検討する機会が
妨げられてしまう。
を保存すべく使用でき、ユーザ側の介入が最小限で機能
する走査システムが求められている。さらに、収集した
情報を、ユーザが効率よく見ることのできるフォーマッ
トに自動的に整理できるシステムが求められている。
び方法は、ユーザ側の介入を最小限にして、ユーザに読
み取り可能な情報をスキャンする。さらに、本発明のシ
ステム及び方法は、スキャンした情報を、ユーザが要求
に応じて検討、修正、及び訂正できるフォーマットに自
動的に整理する。
本発明のシステム及び方法は、文書上の情報(indici
a)をスキャンし、フォーマット化する。システムは、
文書上の情報をスキャンする走査ヘッドと、スキャンし
た情報を保存するメモリとを含む。システムはさらに、
メモリに保存された、スキャンした情報の意味を発見的
に認識する処理装置を含む。処理装置は、スキャンした
情報の認識された意味にもとづき、文書及びスキャンし
た情報を表すデータエントリを作成する。
は単なる例示であり、請求の範囲内で本発明のさらなる
説明が提供されることを意図する。
図である。図1に示されるように、システム10は、走
査ペン100とコンピュータ200とを含む。走査ペン
100は、リンク15を介してコンピュータ200と通
信する。リンク15は、例えば、赤外線リンク、無線リ
ンクまたはケーブル通信を含んでもよい。さらに、コン
ピュータ200は、パーソナルコンピュータ、ネットワ
ークコンピュータ、ワークステーション、またはメイン
フレームコンピュータなど、任意のコンピュータでよ
い。
書の表面を横断するようにペン100を走らせる。ユー
ザが文書を横断してペン100を走らせると、ペン10
0はそのヘッドの下方を通過する文書のテキスト情報を
スキャンして収集する。ペン100は、好ましくはスキ
ャンしたテキストに対して文字認識を行い、この情報を
処理するためにコンピュータ200に送る。特に、コン
ピュータ200は、スキャンした情報を所望のフォーマ
ットでユーザに表示するために、テキスト情報を発見的
に整理する。
ヘッド110、処理装置120、データベース130、
ユーザインタフェース140及びデータインタフェース
150を含み、これらがそれぞれバス160を介して接
続されている。なお、図1には上記要素を含むペン10
0が示されているが、本発明によるペン100は、単に
スキャンした情報をリアルタイムで直接コンピュータ2
00に送信する走査ヘッドのみを含んでもよい。この場
合には、ペン100によって行われる下記の処理すべて
をコンピュータ200が行う。
テキストを捕え、それをディジタル形式に変換する単線
(single-line)走査装置である。走査ヘッド110
は、好ましくは、文字、グリフ、バーコード又は手書き
文字でさえも認識する光学式文字認識(OCR)装置を
含む。したがって、走査ヘッド110は、スキャンした
テキストを、フォントの種類及びサイズなどのテキスト
情報を保持するテキストファイル(例えば、ASCII
またはHTMLファイル)に変換する。あるいは、走査
ヘッド110は、単にスキャンしたテキストをビットマ
ップファイルに変換し、このビットマップファイルがコ
ンピュータ200に転送されてここで文字認識を行って
もよい。
から出力されたテキスト情報を保存する。情報の保存に
先立ち、処理装置120は、走査ヘッド110がその情
報をスキャンした時刻を示すクロックの値に基づき、好
ましくはテキスト情報にタイムスタンプする。以下に説
明するように、このタイムスタンプは認識処理において
用いられ、スキャンされたテキスト情報が互いに時間的
に近くスキャンされた別の情報と関連づけられる。さら
に、上記クロックの値は、一日の時間を示す相対時間
と、ペン100による処理の開始に伴って始まった絶対
時間のいずれを示してもよい。
ーフェース140から受信した制御信号に基づきペン1
00の動作を制御する。図1には示されていないが、ユ
ーザインターフェース140は、好ましくは、ボタン、
表示ライト又はディスプレイ画面などの種々のユーザ入
出力装置を備える。ユーザは、以下に説明するように、
インターフェース140のボタンを使って、特定のテキ
スト走査に優先順位又は特定の意味を与えてもよい。ま
た、ユーザインターフェース140により、ユーザは、
スキャンモード、ダウンロードモード、又はOFFモー
ドを含む、走査ペン100の動作モードを選択すること
ができる。スキャンモードでは、走査ペン100は、デ
ータベース130に保存されるテキスト情報を収集す
る。ダウンロードモードを選択することにより、ユーザ
はペン100にデータベース130の内容をデータイン
ターフェース150及びリンク15を介してコンピュー
タ200に送信させることができる。データインターフ
ェース150は、好ましくは、双方向赤外線送受信器ま
たはコンピュータ200との配線接続を可能にするポー
トを含む。
0は、データインターフェース210、データベース2
20、処理装置230、及びネットワークサーバ240
を含み、これらはそれぞれバス260を介して接続され
ている。データインターフェース210はデータインタ
ーフェース150と同様であり、データインターフェー
ス150からリンク15を介して送信されたテキスト情
報を受信し、受信したテキスト情報をベータベース22
0に保存する。コンピュータ200は、ユーザがインタ
ーネットなどのネットワークにリンクし、スキャンした
テキスト情報に関連する情報を探せるようにネットワー
クサーバ240を含む。
保存された情報を発見的に整理するためのソフトウェア
プログラム(図示せず)を実行する。好ましくは、スキ
ャンした情報に対する文字認識ルーチンはペン100が
行うが、処理装置230も同様にこの動作を行ってもよ
い。いずれの場合にも、処理装置230は、認識された
テキスト情報を受信し、認識されたテキストに発見的に
意味を付与してデータエントリを作成する。例えば、処
理装置230は以下に説明する論理に基づいてテキスト
列を分析し、そのテキストをタイトルに対応するとして
指定してもよい。さらに、処理装置230は、認識され
た数字をページ番号であると判断してもよい。
と、認識されたテキストがグループ化されてデータエン
トリが形成される。各データエントリは、ユーザにとっ
て重要である文書内の特定テキストに対応する。一般的
に、データエントリには、ユーザにとって重要な特定テ
キストと文書を識別する情報、及び文書におけるこのテ
キストが含まれる場所から構成される。
1実施形態が示されている。図2に示されるように、走
査ペン100は、走査ヘッド110、プッシュボタン1
42、ディスプレイ144及びデータインターフェース
150を含む。ボタン142及びディスプレイ144
は、図1に関して上記説明したユーザインターフェース
140に対応している。
れたテキストとペン100の選択された動作モードをデ
ィスプレイ画面144によってユーザに確認できる。さ
らに、図2には一般的なペンの形状を有する走査ペン1
00が示されているが、ペン100は他の形状でもよ
い。例えば、走査ペン100は、パームパイロット(登
録商標)に接続するための個別ユニットを含んでもよ
い。この場合も、走査ペン100はここに説明した機能
及び動作をすべて行うが、パームパイロット(登録商
標)のディスプレイを共有してもよい。また、ペン10
0はユーザの指先にはめるシンブルなどの小型装置の形
状でもよい。
明による方法を示すフローチャートである。図示される
方法は、ユーザがユーザインターフェース140のボタ
ンを押し、ペン100が動作モードに入ると開始する。
ペン100が動作モードになると、ユーザは走査ペンに
よって文書の表面を横断するように一連の「走査(swip
e)」を行う。各走査ごとに、スキャンしたテキストの
ディジタル表示が生成される。
書を識別する情報をスキャンする(ステップ310)。
この識別情報には、好ましくは、文書名、文書の発行ナ
ンバー及び発行日、及びユーザが特定テキストをスキャ
ンしたい文書中特定位置のページや項目の見出しなども
含む書籍データが含まれる。例えば、雑誌「ポピュラー
サイエンス」を例にすると、ユーザは次の書籍情報をス
キャンしてもよい。
ーコードやロゴでもよい。これらのいずれによっても、
文書名及びおそらくは文書に関する他の書籍情報も識別
できる。このような場合、コンピュータ200は、バー
コード又はロゴをデータベースに保存された製品情報に
比較し、この書籍情報を決定する。ユーザが上記の書籍
情報をスキャンすると、走査ヘッド110はスキャンし
たテキストに対してOCRルーチンを行い、このテキス
トのディジタル表示をデータベース130に保存する。
ーザにとって重要でユーザが得たい文書中の特定テキス
トをスキャンする(ステップ320)。例えば、ユーザ
は上記ポピュラーサイエンスの記事中の特定の一節を興
味深く思うかも知らないし、あるいはその記事を参照す
るために特定の「キーワード」(例えば、インターネッ
ト、無線、ハンドヘルド、ブラウザなど)を識別したい
かもしれない。ユーザは、関心あるテキスト部分をペン
100でスキャンする。スキャンされたテキストに対
し、走査ヘッド110がOCRルーチンを行い、この特
定テキスト情報のディジタル表示がデータベース130
に保存される。
明したように、ペン100には好ましくは、フォントの
種類及びサイズが保持された、スキャンされたテキスト
のディジタル表示が保存される。文書のスキャンが完了
すると、ユーザはデータインターフェース150,21
0及びリンク15を介して、保存された情報をコンピュ
ータ200に転送する。転送された情報は、コンピュー
タ200のデータベース220に保存される。コンピュ
ータ200は、発見的認識処理において、この保持され
たテキスト情報を使用する。
存されたデータに対して種々の認識処理を行い、個々の
データエントリを発見的に作成する(ステップ33
0)。各エントリは、(1)識別情報と、(2)特定テ
キスト情報自体とを含む。前記識別情報は、(a)文書
名、(b)文書の発行日、巻数、(c)ユーザが特定テ
キスト情報をスキャンしたページの番号、(d)特定テ
キスト情報を含む項目のタイトル又は見出しなどであ
る。処理装置230はユーザがペン100によってスキ
ャンした各特定情報ごとにデータエントリを作成する。
0は、異なる文書でも通常はある共通の認識可能なフォ
ーマット及びスタイルに従っているという事実を利用す
る。例えば、ページ番号は、周りに文字の存在しない数
字として認識することができる。したがって、処理装置
230は、スキャンしたテキストのフォントタイプ、フ
ォントサイズ、周辺テキスト、及び特定テキストフォー
マットを発見的に分析して自動的に各エントリを作成す
る。この分析に基づき、処理装置230はそのテキスト
の意味、すなわちスキャンしたテキストの表す情報の種
類を判定する。
処理を実行するためのソフトウェアインストラクション
を含む。これらのインストラクションは、好ましくは、
特定の文脈において特定種類のテキストを識別するルー
ルの形式をとる。処理装置230はこれらの言語ルール
を使用してテキストを分析し、その意味及びエントリに
おけるその配置を決定する。言語ルールの例を以下に示
す。
と、それを文書名として認識する。さらに、文書名は通
常本文より大きい活字及びフォントスタイルでプリント
されている。よって、処理装置230は、テキストのフ
ォントタイプ及びフォントサイズにもとづき、そのテキ
ストが文書名に対応すると認識してもよい。
タリングされた1ラインをタイトルと認識する。また、
処理装置230は、タイトルの下のより小さい活字のラ
インをそのタイトルの著者名と認識してもよい。文書の
本文中では、太字で印刷され、他の文字列から離れた文
字列を小見出しと認識してもよい。
ない単独の数字を識別すると、それをページ番号として
認識する。
L)及び他のデータフォーマット 処理装置230は、URLのフォーマットを有する文字
列を識別すると、それをURLとして認識する。さら
に、そのURLと時間的に近く(例えば、2〜3秒以内
に)スキャンされたテキストを、そのURLにおいて検
出した情報の記載であると認識してもよい。また、処理
装置230は所定のデータフォーマットを有するテキス
トを識別することにより、その他のデータフォーマット
を認識してもよい。
は、好ましくは、ユーザがスキャンした識別情報に続く
テキストとして処理装置230により認識される。ある
いは、処理装置230は、ユーザに重要な特定テキスト
を、上記の言語ルールに当てはまらないテキストとして
認識してもよい。その場合、このようなテキスト、例え
ばスキャンされた識別情報によって識別された記事の
「キーワード」は上記のようにデータエントリに含まれ
る。
雑誌など、異なる種類の文書に対応する入力テンプレー
トでコンピュータ200をプログラムしてもよい。これ
らのテンプレートは、文書に含まれる情報の識別におい
て、コンピュータ200の認識処理をガイドすることが
できる。特に、これらのテンプレートにより、システム
10がガイドする文書の予想される性質、構造及び内容
に関する情報を提供してもよい。これらのテンプレート
は、好ましくは、文書中の特定データ項目が見つけやす
い場所、これらのデータ項目のフォーマット及び上記認
識処理に役立つ他の要件を示す。
ース140またはコンピュータ200のインターフェー
スを使用してテンプレートを選択してもよい。また、ユ
ーザがさらなる入力を行わなくてもシステム10が文書
の適当なテンプレートを発見的に決定してもよい。これ
は、各種の文書が標準的なフォーマットに従っているた
めに可能である。例えば、雑誌と新聞はそれぞれ特有の
認識可能なフォーマットを有する。上記の認識処理にも
とづき、システム10は適当なテンプレートを識別でき
る。
ーザはインターフェース140のボタンを使用して特定
テキストスキャンに優先順位又は特別な意味を与えても
よい。例えば、文書名のスキャン時に、ユーザはボタン
を押して、ペン100が文書名をスキャンしていること
を示してもよい。この情報は、データベース130に保
存されたテキスト情報に添付され、認識処理過程におい
て処理装置230に使用される。
に、認識されたテキストに意味を与えた後、処理装置2
30は個々のデータエントリを形成する(ステップ34
0)。処理装置230は、各項目がスキャンされた時間
に基づき、スキャンされた異なる項目を互いに関連づけ
る。各項目のスキャン時間は、処理装置120によっ
て、各スキャン項目に添付されたタイムスタンプにより
決定する。従って、タイムスタンプの値及びテキスト情
報に与えられた意味に基づき、処理装置230は識別情
報とユーザにとって重要な特定情報とを含むデータエン
トリを作成する。データエントリは、例えば以下のよう
になる。
48ページ、「ウェブの解放」クリスオマリー、テキス
ト:インターネット、無線、ハンドヘルド、ブラウザ。
示するため、認識した情報を自動的に整理する(ステッ
プ350)。例えば、コンピュータ200はデータエン
トリの時間順目録又は書籍索引を作成してもよい。特
に、時間順目録は、それぞれのタイムスタンプ値に基づ
き時間順に整理された全データエントリを含んでもよ
い。書籍索引は、各文書の名前によって整理され、さら
にその文書の特定の号(issues)及び各号に含まれる記
事又はタイトルによって整理されたデータエントリを含
んでもよい。いずれのフォーマットでも、ユーザは、例
えば文書名又はデータエントリに含まれるキーワードに
基づいて所望の情報を検索することができる。
240を介してネットワーク上の情報にリンクしてもよ
い。例えば、処理装置230が、ユーザのスキャンした
特定のURLを認識した場合、コンピュータ200は対
応するデータエントリとともにそのURLへのリンクを
含んでもよい。また、コンピュータ200は、オリジナ
ル文書の完全なテキストバージョンが保存されているオ
ンラインロケーションへのリンクを提供することもでき
る。このように、ユーザは、コンピュータ200が作成
した特定のデータエントリの読み取りに関連して文書全
体又はその中の関連記事を見ることができる。さらに、
URLの言語ルールに関して上述したように、そのUR
Lにおいて見つけた情報の認識された記載によりリンク
を参照してもよい。
た場合に、作成されたデータエントリをさらなる情報を
求めて「見直す」能力が強化される。例えば、索引には
ユーザの記憶を呼び起こすためのキーワードなど、文書
に含まれる情報のハイライト部分しか含まれていない場
合もある。このような場合には、ユーザは全文書のオン
ラインバージョンを選択し、さらなる情報を得ることが
できる。さらに、データエントリはページ番号が含む可
能性があるので、コンピュータ200のネットワークサ
ーバ240によって、ユーザを文書のオンラインバージ
ョンの関連部分に直ちに接続することができる。
システムとしてシステム10を説明したが、システム1
0によってハンドライティング(手書き文字)又はスピ
ーチを処理してもよい。このために、コンピュータ20
0は、当業界のおいて周知のハンドライティング認識用
の認識ソフトウェアを含んでもよい。コンピュータ20
0は、ペン100によってスキャンした手書きの情報
を、データエントリと共に含む。ペン100はマイクロ
フォンをさらに含み、スキャンしたテキストに関連させ
てユーザの発声をデータエントリに記録してもよい。コ
ンピュータ200はその音声をディジタル化し、記録に
話し言葉が含まれる場合には音声認識装置を用いてそれ
を認識することができる。
ム10がテキストを正確に識別できない可能性が十分に
ある。したがって、システム10は、ユーザがコンピュ
ータ200を使ってスキャンしたテキストを検討し、必
要な訂正を行えるようにする。当業者であれば理解でき
るように、ユーザは認識処理を調整してその精度を高め
ることもできる。これは、認識分析のために使用される
前記言語ルールを調整したり、あるいはユーザのガイダ
ンスを求めたりするいくつかの手段により実現できる
が、その手段はこれらの例に限定されない。
ク図である。
示す図である。
よる方法を示すフローチャートである。
ペン、110 走査ヘッド、120 処理装置、130
データベース、140 ユーザインターフェース、1
42 ボタン、144 ディスプレイ画面、150 デ
ータインターフェース、160 バス、200 コンピ
ュータ、210 データインターフェース、220 デ
ータベース、230 処理装置、240 ネットワーク
サーバ、260 バス。
Claims (3)
- 【請求項1】 文書上の情報をスキャンしてフォーマッ
ト化するシステムであって、 文書上の情報をスキャンする走査ヘッドと、 スキャンした情報を保存するメモリと、 前記メモリに保存されたスキャンされた情報の意味を発
見的に認識し、前記文書及びスキャンされた情報を表す
データエントリを作成する処理装置と、 を備えるシステム。 - 【請求項2】 請求項1に記載のシステムにおいて、 前記処理装置は、ユーザに表示するために、前記認識し
た情報を自動的にフォーマットに整理する第1処理部を
含むことを特徴とするシステム。 - 【請求項3】 文書上の情報をスキャンして整理する方
法であって、 文書上の情報をスキャンするステップと、 スキャンした情報をメモリに保存するステップと、 メモリに保存されたスキャンした情報の意味を発見的に
認識するステップと、 発見的に認識された意味に基づき、前記文書及びスキャ
ンした情報を表すデータエントリを作成するステップ
と、を含む方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/464381 | 1999-12-16 | ||
US09/464,381 US6360951B1 (en) | 1999-12-16 | 1999-12-16 | Hand-held scanning system for heuristically organizing scanned information |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001229340A true JP2001229340A (ja) | 2001-08-24 |
JP4509366B2 JP4509366B2 (ja) | 2010-07-21 |
Family
ID=23843719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000381844A Expired - Fee Related JP4509366B2 (ja) | 1999-12-16 | 2000-12-15 | 文書上の情報をスキャンしてフォーマット化するシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US6360951B1 (ja) |
EP (1) | EP1109125A3 (ja) |
JP (1) | JP4509366B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102215613B1 (ko) * | 2020-02-03 | 2021-02-15 | 주식회사 한글과컴퓨터 | 문서에 삽입된 텍스트를 구성하는 언어에 기반한 텍스트 검색을 가능하게 하는 전자 장치 및 그 동작 방법 |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US7966078B2 (en) | 1999-02-01 | 2011-06-21 | Steven Hoffberg | Network media appliance system and method |
US6491217B2 (en) * | 2001-03-31 | 2002-12-10 | Koninklijke Philips Electronics N.V. | Machine readable label reader system with versatile response selection |
US6948658B2 (en) * | 2001-06-07 | 2005-09-27 | Mustek Systems Inc. | Method for automatically integrating digital data |
US7013029B2 (en) * | 2001-06-29 | 2006-03-14 | Intel Corporation | Incorporating handwritten notations into an electronic document |
US20030004991A1 (en) * | 2001-06-29 | 2003-01-02 | Keskar Dhananjay V. | Correlating handwritten annotations to a document |
US20030089777A1 (en) * | 2001-11-15 | 2003-05-15 | Rajasekharan Ajit V. | Method and system for authoring and playback of audio coincident with label detection |
EP1324216A1 (en) * | 2001-12-28 | 2003-07-02 | Deutsche Thomson-Brandt Gmbh | Machine for classification of metadata |
US7120299B2 (en) | 2001-12-28 | 2006-10-10 | Intel Corporation | Recognizing commands written onto a medium |
ATE356389T1 (de) * | 2003-08-20 | 2007-03-15 | Oce Tech Bv | Dokumentenscanner |
CN100382096C (zh) * | 2003-08-20 | 2008-04-16 | 奥西-技术有限公司 | 文档扫描设备及方法 |
US7305435B2 (en) * | 2003-08-25 | 2007-12-04 | Nokia Corporation | Internet access via smartphone camera |
US8442331B2 (en) | 2004-02-15 | 2013-05-14 | Google Inc. | Capturing text from rendered documents using supplemental information |
US7707039B2 (en) * | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
US7812860B2 (en) * | 2004-04-01 | 2010-10-12 | Exbiblio B.V. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
US8799303B2 (en) * | 2004-02-15 | 2014-08-05 | Google Inc. | Establishing an interactive environment for rendered documents |
US20060041484A1 (en) | 2004-04-01 | 2006-02-23 | King Martin T | Methods and systems for initiating application processes by data capture from rendered documents |
US10635723B2 (en) | 2004-02-15 | 2020-04-28 | Google Llc | Search engines and systems with handheld document data capture devices |
US20080313172A1 (en) * | 2004-12-03 | 2008-12-18 | King Martin T | Determining actions involving captured information and electronic content associated with rendered documents |
US8621349B2 (en) * | 2004-04-01 | 2013-12-31 | Google Inc. | Publishing techniques for adding value to a rendered document |
US7894670B2 (en) | 2004-04-01 | 2011-02-22 | Exbiblio B.V. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
WO2008028674A2 (en) | 2006-09-08 | 2008-03-13 | Exbiblio B.V. | Optical scanners, such as hand-held optical scanners |
US20060081714A1 (en) * | 2004-08-23 | 2006-04-20 | King Martin T | Portable scanning device |
US9143638B2 (en) | 2004-04-01 | 2015-09-22 | Google Inc. | Data capture from rendered documents using handheld device |
US8146156B2 (en) | 2004-04-01 | 2012-03-27 | Google Inc. | Archive of text captures from rendered documents |
US8081849B2 (en) | 2004-12-03 | 2011-12-20 | Google Inc. | Portable scanning and memory device |
US20070300142A1 (en) * | 2005-04-01 | 2007-12-27 | King Martin T | Contextual dynamic advertising based upon captured rendered text |
US7990556B2 (en) | 2004-12-03 | 2011-08-02 | Google Inc. | Association of a portable scanner with input/output and storage devices |
US8793162B2 (en) * | 2004-04-01 | 2014-07-29 | Google Inc. | Adding information or functionality to a rendered document via association with an electronic counterpart |
US9116890B2 (en) | 2004-04-01 | 2015-08-25 | Google Inc. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US20060098900A1 (en) | 2004-09-27 | 2006-05-11 | King Martin T | Secure data gathering from rendered documents |
US20100185538A1 (en) * | 2004-04-01 | 2010-07-22 | Exbiblio B.V. | Content access with handheld document data capture devices |
US8713418B2 (en) | 2004-04-12 | 2014-04-29 | Google Inc. | Adding value to a rendered document |
US8620083B2 (en) | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US8874504B2 (en) | 2004-12-03 | 2014-10-28 | Google Inc. | Processing techniques for visual capture data from a rendered document |
US9460346B2 (en) | 2004-04-19 | 2016-10-04 | Google Inc. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
US8489624B2 (en) | 2004-05-17 | 2013-07-16 | Google, Inc. | Processing techniques for text capture from a rendered document |
US8346620B2 (en) | 2004-07-19 | 2013-01-01 | Google Inc. | Automatic modification of web pages |
US20100092095A1 (en) * | 2008-10-14 | 2010-04-15 | Exbiblio B.V. | Data gathering in digital and rendered document environments |
US20110075228A1 (en) * | 2004-12-03 | 2011-03-31 | King Martin T | Scanner having connected and unconnected operational behaviors |
US7530494B1 (en) * | 2005-12-05 | 2009-05-12 | Streelman Steven M | Multi-functional scanner for reading barcodes |
US20080201632A1 (en) * | 2007-02-16 | 2008-08-21 | Palo Alto Research Center Incorporated | System and method for annotating documents |
US8166056B2 (en) * | 2007-02-16 | 2012-04-24 | Palo Alto Research Center Incorporated | System and method for searching annotated document collections |
JP5557419B2 (ja) * | 2007-10-17 | 2014-07-23 | スパンション エルエルシー | 半導体装置 |
US10769686B2 (en) | 2008-01-31 | 2020-09-08 | Bill.Com Llc | Enhanced invitation process for electronic billing and payment system |
US20110184843A1 (en) * | 2008-01-31 | 2011-07-28 | Bill.Com, Inc. | Enhanced electronic anonymous payment system |
US7809615B2 (en) * | 2008-01-31 | 2010-10-05 | Bill.Com, Inc. | Enhanced automated capture of invoices into an electronic payment system |
US10043201B2 (en) * | 2008-01-31 | 2018-08-07 | Bill.Com, Inc. | Enhanced invitation process for electronic billing and payment system |
US9141991B2 (en) | 2008-01-31 | 2015-09-22 | Bill.Com, Inc. | Enhanced electronic data and metadata interchange system and process for electronic billing and payment system |
US20140129431A1 (en) | 2008-01-31 | 2014-05-08 | Bill.Com, Inc. | Enhanced System and Method For Private Interbank Clearing System |
US20110196786A1 (en) * | 2008-01-31 | 2011-08-11 | Rene Lacerte | Determining trustworthiness and familiarity of users of an electronic billing and payment system |
US8457448B2 (en) * | 2008-02-04 | 2013-06-04 | Hewlett-Packard Development Company, L.P. | Removing inserted text from an image using extrapolation for replacement pixels after optical character recognition |
US7991153B1 (en) | 2008-08-26 | 2011-08-02 | Nanoglyph, LLC | Glyph encryption system and related methods |
US8418055B2 (en) | 2009-02-18 | 2013-04-09 | Google Inc. | Identifying a document by performing spectral analysis on the contents of the document |
US8447066B2 (en) | 2009-03-12 | 2013-05-21 | Google Inc. | Performing actions based on capturing information from rendered documents, such as documents under copyright |
EP2406767A4 (en) | 2009-03-12 | 2016-03-16 | Google Inc | AUTOMATIC CONTENT SUPPLY ASSOCIATED WITH CAPTURED INFORMATION, TYPE INFORMATION CAPTURED IN REAL TIME |
US20110073649A1 (en) * | 2009-09-25 | 2011-03-31 | Getac Technology Corporation | Method and system for recognizing barcode |
US9081799B2 (en) | 2009-12-04 | 2015-07-14 | Google Inc. | Using gestalt information to identify locations in printed information |
US9323784B2 (en) | 2009-12-09 | 2016-04-26 | Google Inc. | Image search using text-based elements within the contents of images |
US20120027246A1 (en) * | 2010-07-29 | 2012-02-02 | Intuit Inc. | Technique for collecting income-tax information |
US9996210B2 (en) * | 2011-06-30 | 2018-06-12 | International Business Machines Corporation | Enabling host active element content related actions on a client device within remote presentations |
US8819789B2 (en) | 2012-03-07 | 2014-08-26 | Bill.Com, Inc. | Method and system for using social networks to verify entity affiliations and identities |
US9690807B2 (en) * | 2012-12-18 | 2017-06-27 | Thomson Reuter's Global Resources (Trgr) | Mobile-enabled systems and processes for intelligent research platform |
US10410191B2 (en) | 2013-03-14 | 2019-09-10 | Bill.Com, Llc | System and method for scanning and processing of payment documentation in an integrated partner platform |
US10115137B2 (en) | 2013-03-14 | 2018-10-30 | Bill.Com, Inc. | System and method for enhanced access and control for connecting entities and effecting payments in a commercially oriented entity network |
US10417674B2 (en) | 2013-03-14 | 2019-09-17 | Bill.Com, Llc | System and method for sharing transaction information by object tracking of inter-entity transactions and news streams |
US10572921B2 (en) | 2013-07-03 | 2020-02-25 | Bill.Com, Llc | System and method for enhanced access and control for connecting entities and effecting payments in a commercially oriented entity network |
US10176159B2 (en) * | 2014-05-05 | 2019-01-08 | Adobe Systems Incorporated | Identify data types and locations of form fields entered by different previous users on different copies of a scanned document to generate an interactive form field |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11238072A (ja) * | 1998-02-23 | 1999-08-31 | Ricoh Co Ltd | 文書保管装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1334218C (en) * | 1989-03-01 | 1995-01-31 | Jerome Swartz | Hand-held laser scanning for reading two dimensional bar codes |
US5587577A (en) * | 1989-06-08 | 1996-12-24 | Norand Corporation | Modular scanner with hand-held data terminal |
US5478989A (en) * | 1989-09-27 | 1995-12-26 | Shepley; Kenneth J. | Nutritional information system for shoppers |
US5334822A (en) * | 1990-05-21 | 1994-08-02 | Universal Computer Technologies Inc. | Method and system for inventoring a distributed plurality of items on a supply |
US5109439A (en) * | 1990-06-12 | 1992-04-28 | Horst Froessl | Mass document storage and retrieval system |
US5237163A (en) * | 1992-01-06 | 1993-08-17 | Ncr Corporation | Method for scanning a plurality of bar code labels |
KR930022235A (ko) | 1992-04-03 | 1993-11-23 | 시모야마 도시로오 | 손이 자유로운 바 코드 스캐너 |
US5640002A (en) * | 1995-08-15 | 1997-06-17 | Ruppert; Jonathan Paul | Portable RF ID tag and barcode reader |
US5859414A (en) * | 1995-12-29 | 1999-01-12 | Aironet Wireless Communications, Inc. | Interactive customer information terminal |
US5950196A (en) * | 1997-07-25 | 1999-09-07 | Sovereign Hill Software, Inc. | Systems and methods for retrieving tabular data from textual sources |
US6234393B1 (en) * | 1999-01-29 | 2001-05-22 | Intermec Ip Corp. | Finger point bar code input device |
-
1999
- 1999-12-16 US US09/464,381 patent/US6360951B1/en not_active Expired - Lifetime
-
2000
- 2000-12-07 EP EP00310895A patent/EP1109125A3/en not_active Withdrawn
- 2000-12-15 JP JP2000381844A patent/JP4509366B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11238072A (ja) * | 1998-02-23 | 1999-08-31 | Ricoh Co Ltd | 文書保管装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102215613B1 (ko) * | 2020-02-03 | 2021-02-15 | 주식회사 한글과컴퓨터 | 문서에 삽입된 텍스트를 구성하는 언어에 기반한 텍스트 검색을 가능하게 하는 전자 장치 및 그 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
US6360951B1 (en) | 2002-03-26 |
EP1109125A3 (en) | 2002-06-12 |
JP4509366B2 (ja) | 2010-07-21 |
EP1109125A2 (en) | 2001-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4509366B2 (ja) | 文書上の情報をスキャンしてフォーマット化するシステム | |
US5450537A (en) | Method and apparatus for completing a partially completed document in accordance with a blank form from data automatically retrieved from a database | |
US5669007A (en) | Method and system for analyzing the logical structure of a document | |
US7643687B2 (en) | Analysis hints | |
CN109933796B (zh) | 一种公告文本关键信息提取方法及设备 | |
US20070171473A1 (en) | Information processing apparatus, Information processing method, and computer program product | |
EP1909200A1 (en) | Apparatus, method and computer program product for processing information | |
JP2000285203A (ja) | Icチップ入りペーパを用いた情報伝達方法 | |
JP2000222394A (ja) | 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体 | |
US20070168916A1 (en) | Specification wizard | |
JPH1145289A (ja) | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 | |
JP2001216311A (ja) | イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置 | |
EP1657665B1 (en) | Analysis alternates in context trees | |
JP3711636B2 (ja) | 情報検索装置および方法 | |
EP1237094A1 (en) | A method for determining rubies | |
US20110019916A1 (en) | Interactive document reading | |
JP3122417B2 (ja) | 情報表示方法及び情報処理装置 | |
JP4251804B2 (ja) | 情報表示方法、情報表示プログラム及び情報表示装置 | |
US20030237042A1 (en) | Document processing device and document processing method | |
JPH10187751A (ja) | 認識データ処理装置およびそのプログラム記録媒体 | |
JP7086424B1 (ja) | 特許用文章生成装置、特許用文章生成方法、および特許用文章生成プログラム | |
US20140111438A1 (en) | System, method and apparatus for the transcription of data using human optical character matching (hocm) | |
JP2006277091A (ja) | 索引データ生成装置、データ検索装置およびプログラム | |
JP2002298101A (ja) | キャラクタ情報認識方法およびキャラクタ情報認識装置 | |
JP3712320B2 (ja) | 可変文書作成システム、可変文書出力装置及び可変原稿作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071210 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100428 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |