JP2008276736A - インタラクティブシステムおよび画像検索性能を高めるプログラム - Google Patents
インタラクティブシステムおよび画像検索性能を高めるプログラム Download PDFInfo
- Publication number
- JP2008276736A JP2008276736A JP2007333333A JP2007333333A JP2008276736A JP 2008276736 A JP2008276736 A JP 2008276736A JP 2007333333 A JP2007333333 A JP 2007333333A JP 2007333333 A JP2007333333 A JP 2007333333A JP 2008276736 A JP2008276736 A JP 2008276736A
- Authority
- JP
- Japan
- Prior art keywords
- word
- user
- image
- word image
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims description 29
- 238000000034 method Methods 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 230000015654 memory Effects 0.000 abstract description 4
- 230000003993 interaction Effects 0.000 abstract 1
- 238000012015 optical character recognition Methods 0.000 description 36
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000011524 similarity measure Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 241000208822 Lactuca Species 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- HEVGGTGPGPKZHF-UHFFFAOYSA-N Epilaurene Natural products CC1C(=C)CCC1(C)C1=CC=C(C)C=C1 HEVGGTGPGPKZHF-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
- G06F18/41—Interactive pattern learning with a human teacher
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19133—Interactive pattern learning with a human teacher
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 システム200は、一つ以上のメモリ210、一つ以上のプロセッサ220、一つ以上の記憶装置またはリポジトリ230を含み、インストラクタのラップトップ290、またはプロジェクタ250から、マルチメディアを自動捕捉するソフトウェア240を含み、更に、記憶装置230内に、マルチメディアスライド画像260、テキスト270、およびオーディオ280を含む。ソフトウェア240は、プレゼンテーションマルチメディアを索引付けし、管理することにより、システムに学生ユーザのインストラクタのスライドを問い合わせるため、ユーザのラップトップ290から、インターネットによるインターラクション、単語画像提案の選択、インストラクタースライドの得られたグループの検索を可能とする。
【選択図】 図15
Description
ベイテル、スティーブン M他著、「OCRテキストコレクションのため検索戦略の調査」ドキュメント画像理解技術(SDIUT)のシンポジウムより、2003年、ダウンロード:p7(2007年4月18日)。 カラン、ジェイミー他著、「情報検索およびOCR:コンテンツ変換から意味の把握まで」、SIGIR2002ワークショップ、テンペレ大学、2002年8月15日、ダウンロード:p6(2007年4月18日)。 ドゥヌー、ローレン他著、「プロジェクターボックス:教室のためのシームレスプレゼンテーション捕捉」、ダウンロード:p6(2007年4月18日)。 ドワーマン、デービッド著、「ドキュメント画像の索引付けと検索:調査」、テクニカルレポート、LAMP−TR−013/CFAR−TR−878/CS−TR−3876、メリーランド大学、カレッジパーク、USA、p39(1998年2月)。 ホン、タオ他著、「単語画像等価によるOCR性能の改良」、ドキュメント解析および情報検索における第4回シンポジウムより、米国、NV、ラスベガス、1995年4月24日〜26日、(1995年4月)、21頁。 カンター、ポール B他著、「TREC−5コンフュージョン追跡におけるレポート」、第5回テキスト検索会議TREC−5の手順、NIST 特別公開500−238、p10、1996年、ダウンロード:p10(2007年4月19日)。 クライン S.T.他著、「自動OCR補正のための投票システム」、SIGIR 2002 ワークショップ、2002年8月15日、テンペレ大学、ダウンロード:p19(2007年4月18日)。 コーラック、オーカン他著、「雑音のあるチャネルモデルを用いたOCRエラー補正」、人類言語技術会議、HLT 2002、米国、カリフォルニア州、サンディエゴ市、(2002年)、p6。 「スキャンソフトオムニページ15 ユーザガイド」94p、2005年。 タグバ、カゼム他著、「OCR出力を自動補正するためのエキスパートシステム」、IS&T/SPIEの手引き、電子画像科学および技術における国際シンポジウム、プロシーディスプレイスクリーン(フィンランド、ヘルシンキ)、プリントセミナー、ダウンロード:p19(2007年4月18日)。 タグバ、カゼム他著、「ハイリーツ:OCRドキュメントのための検索エンジン」、ドキュメント解析システム、V、2002年、p10(2002年1月10日)。 タグバ、カゼム他著、「近似およびグローバル補正によるポスト編集」、パターン認識および人工知能の国際ジャーナル」、1995年、12p(1993年3月)。
OCRソフトウェアによって画像ドキュメント内の単語が誤って認識されたという問題を正すために、OCRソフトウェアを経て画像ドキュメントから変換されたテキストは、最初に、n−グラムを用いて索引付けされる。n−グラム(索引語)は、与えられたシーケンス(順序)のアイテムからのn番目のアイテムのサブシーケンスである。例えば、“a big cat”は、索引付けするために、以下の10個のバイグラム、即ち、「2−グラム」:“ a”、“a ”、“ b”、“bi”、“ig”、“g ”、“ c”、“ca”、“at”、および“t ”(“ ”が単語の境界を表す)へ分解される。ユーザが、例えば、“a big cat”の問い合わせを実行する時、n−グラムの索引付けによって、認識性能が高められる。即ち、n−グラムの索引付けによって、問い合わせ用語を含む正確に検索されたドキュメントの数が増加することを意味する。しかしながら、これらの同じ問い合わせ用語について、n−グラムの索引付けは、該n−グラムの索引付けが不正確に検索されたドキュメント数も増加させるので、残念ながら、精度を低下させてしまう。だが、問い合わせにおける単語数、つまり問い合わせのサイズが十分に大きい場合、精度のロスもそれほど多くない。問い合わせのサイズが大きくなればなるほど、該問い合わせが正しいドキュメントを検索することに成功したことが一層確実とされる。しかしながら、本発明の実施の形態において、問い合わせの大部分が非常に短い。n−グラムの索引付けは、音や言語(スピーチ)を検索するために使用される音声ベースの検索エンジンに使用されてもよい。
“Hilbert”の問い合わせ例について、図5は、単語画像がグループ分けされない場合、ユーザが分類する必要がある467個の単語画像提案の例も示している。OCRソフトウェアは、所定の単語を何通りにも誤って認識する。スペルミスの数は、単語の長さに比例して増加する。例えば、単語“information”は、“add”に比べて誤って認識される頻度が多い。一般に、該OCRソフトウェアは、ユーザへ数百個の単語画像提案を示すので、より長い単語に対するすべての単語画像提案を示された場合、ユーザはこれらの提案に翻弄されてしまう。
図9(A)および図9(B)は、本発明の実施の形態による、図7の単語画像提案を拡大縮小した後に得られる単語画像提案の例を示す。ユーザへ単語画像を提示する前に、単語画像は、最初に同一サイズに拡大縮小され、これによって、単語画像のユーザがより迅速にスキミング(拾い読み)できるようにする。図9(A)において、図7からのボックスが同じ幅と高さに拡大縮小される。ただし、図8からのボックスは、図9(A)に使用することもできたが、図解することが目的であるので、この例においては、図7からのボックスを利用した。図9(B)では、図7からのボックスは、高さのみが同じ高さに拡大縮小されている。しかしながら、図9(B)においては、図解のみを目的としているため、図7からのボックスの主要部分のみが選択され、図示されている。
プロジェクタ・ボックスのソフトウェアのユーザインタフェースによって、学生などのユーザは、彼らのホームコンピュータやラップトップのインターネットを介してプロジェクタ・ボックスとインターフェースすることができる。上述したように、ユーザインタフェースを介して、ユーザは、彼らのインストラクタのスライド用のシステムに問い合わせをし、単語画像提案を選択し、インストラクタのスライドの得られたグループを検索することができる。ユーザは、クリックして単語画像提案を選択し、もう一度クリックして非選択とすることができる。
図13は、本発明の実施の形態による、複数の問い合わせ用語に対して、これらの問い合わせ用語が発見されたスライドを示す表の例を示す。ユーザの問い合わせが複数の用語を含む時、各用語に対して提案技術が適用される。プロジェクタ・ボックスにおける省略時(デフォルトな)行動が問い合わせ用語のAND演算を実行することであるから、すべての他の用語の提案と同時発生しない提案は削除される。この際、提案は、問い合わせ用語の本来のスペルを含む。
上記の解決が、プロジェクタ・ボックス・システムによって捕捉されるOCRデータに対する検索を改良するために設計されているが、この解決は、他の走査されたドキュメントのタイプに適用されてもよい。また、この解決は、プロジェクタ・ボックス・システム以外の他のシステムによって捕捉されるデータに適用され得る。
210: メモリ
220: プロセッサ
230: リポジトリ
240: マルチメディアスライド画像
250: プロジェクタ
250: インストラクタのラップトップ
290: ユーザのコンピュータ
Claims (24)
- 画像として取り込まれた単語をユーザへ適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるためのインタラクティブシステムであって、
システムに取り込まれた一つ以上の画像について一つ以上の問い合わせ用語によって ユーザが該システムに問い合わせをするためのユーザインタフェースと、
前記単語画像から該システムが認識する場合、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案を、前記ユーザインタフェースを介してユーザへ表示する表示手段と、
前記一つ以上の問い合わせ用語について画像のシステム認識性能を高めるために、前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上のユーザにより選択された単語画像提案をシステムに取り込む取込手段と、
を含むインタラクティブシステム。 - 各単語画像提案が単語画像を含み、該単語画像が一単語として取り込まれた一つ以上の画像の一部を含む、請求項1に記載のインタラクティブシステム。
- 前記一つ以上の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザによって選択された一つ以上の単語画像提案をシステムから除外することを更に含む、請求項1に記載のインタラクティブシステム。
- 前記システムのユーザ問い合わせに先立って前記一つ以上の画像から変換されたテキストのn−グラムの索引付けを更に含み、n−グラムが長さnの文字の連結を含む(nは任意の正の整数である)、請求項1に記載のインタラクティブシステム。
- 前記一つ以上の画像内の単語画像の境界ボックスが所定の閾値以上でオーバーラップする場合、前記一つ以上の単語画像提案の場所と大きさによってグルーピングすることを更に含み、グループの代表的な単語画像提案がユーザへ提示される、請求項1に記載のインタラクティブシステム。
- 前記各単語画像が同一テキストと関連しており、該単語画像のテキストがそれぞれの画像内で同一の文脈で使用される場合、前記一つ以上の単語画像提案を原文の文脈でグルーピングすることを更に含み、該グループの代表的な単語画像提案がユーザへ提示される、請求項1に記載のインタラクティブシステム。
- 前記単語画像が類似する画像である場合、前記一つ以上の単語画像提案の類似度によってグルーピングすることを更に含み、二つの画像の画素間の全体的な差がある閾値未満である場合、該二つの画像は類似しており、該グループの代表的な単語画像提案がユーザへ提示されることを更に含む、請求項1に記載のインタラクティブシステム。
- ユーザへ提示するために、前記単語画像提案が単一均一サイズへ拡大縮小されたバージョンの単語画像提案を含む、請求項1に記載のインタラクティブシステム。
- ユーザへ提示するために、各個別の単語画像提案に対して代表的な単語画像提案を選択することによって、一つ以上の単語画像提案の数を削減することを更に含む、請求項1に記載のインタラクティブシステム。
- 認識される単語画像のうち前記一つ以上の画像の数をユーザへ提示することによって、各単語画像提案をランク付けすることを更に含む、請求項1に記載のインタラクティブシステム。
- 前記問い合わせが二つ以上の用語を含む場合、該問い合わせにおける全用語に対する単語画像提案に関連するテキストを含まない画像に対する単語画像提案が除去される、請求項1に記載のインタラクティブシステム。
- 該システムに、問い合わせ用語、関連するユーザ除外単語画像提案、および関連ユーザ含有単語画像提案に関する情報が保存される、請求項1に記載のインタラクティブシステム。
- 画像として取り込まれた単語をユーザへ適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるためのプログラムであって、
コンピュータに、
ユーザインタフェースを介して、ユーザの指示に応じて、一つ以上の問い合わせ用語によって、該システム内に取り込まれた一つ以上の画像について該システムに問い合わせをするステップと、
前記単語画像から該システムが認識する時、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案を、前記ユーザインタフェースを介してユーザへ提示するステップと、
前記一つ以上の問い合わせ用語に対する画像のシステム認識性能を高めるために、ユーザが前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上の単語画像提案を、前記システム内に取り込むようにユーザの指示に応じて選択するステップと、
を実行させるプログラム。 - 各単語画像提案が単語画像を含み、該単語画像が一単語として取り込まれた一つ以上の画像の一部を含む、請求項13に記載のプログラム。
- 前記一つ以上の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザによって選択された一つ以上の単語画像提案をシステムから除外することを更に含む、請求項13に記載のプログラム。
- 前記システムのユーザ問い合わせに先立って前記一つ以上の画像から変換されたテキストのn−グラムの索引付けを更に含み、n−グラムが長さnの文字の連結を含む(nは任意の正の整数である)、請求項13に記載のプログラム。
- 前記一つ以上の画像中の前記単語画像の境界ボックスが所与の閾値より大きい値とオーバーラップする場合、前記一つ以上の単語画像提案を位置および大きさによってグルーピングすることをさらに含む、請求項13に記載のプログラム。
- 前記各単語画像が同一テキストと関連しており、該単語画像のテキストがそれぞれの画像内で同一の文脈で使用される場合、前記一つ以上の単語画像提案を原文の文脈でグルーピングすることを更に含み、該グループの代表的な単語画像提案がユーザへ提示される、請求項13に記載のプログラム。
- 前記単語画像が同様の画像である場合、前記一つ以上の単語画像提案の類似度によってグルーピングすることを更に含み、二つの画像の画素間の全体的な差がある閾値未満である場合、該二つの画像は類似しており、該グループの代表的な単語画像提案がユーザへ提示されることを更に含む、請求項13に記載のプログラム。
- 前記ユーザインタフェースによって一つ以上の単語画像提案を提示することが、前記単語画像提案を単一均一サイズへ拡大縮小することを含む、請求項13に記載のプログラム。
- 各個別の単語画像提案に対して代表的な単語画像提案を選択することによって一つ以上の単語画像提案の数を削減することを更に含み、前記代表的な単語画像提案がユーザへ提示される、請求項13に記載のプログラム。
- 認識される単語画像のうち前記一つ以上の画像の数を前記ユーザへ提示するとによって、各単語画像提案をランク付けすることを更に含む、請求項13に記載のプログラム。
- 前記問い合わせが二つ以上の用語を含む場合、該問い合わせにおける全用語に対する単語画像提案に関連するテキストを含まない画像に対する単語画像提案が除去される、請求項13に記載のプログラム。
- 該システムに、問い合わせ用語、関連するユーザ除外単語画像提案、および関連ユーザ含有単語画像提案に関する情報が保存される、請求項13に記載のプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/740840 | 2007-04-26 | ||
US11/740,840 US8261200B2 (en) | 2007-04-26 | 2007-04-26 | Increasing retrieval performance of images by providing relevance feedback on word images contained in the images |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008276736A true JP2008276736A (ja) | 2008-11-13 |
JP5018459B2 JP5018459B2 (ja) | 2012-09-05 |
Family
ID=39887047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007333333A Expired - Fee Related JP5018459B2 (ja) | 2007-04-26 | 2007-12-25 | インタラクティブシステムおよび画像検索性能を高めるプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8261200B2 (ja) |
JP (1) | JP5018459B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011082958A (ja) * | 2009-10-05 | 2011-04-21 | Fuji Xerox Co Ltd | ビデオ検索システムおよびそのためのコンピュータプログラム |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7814040B1 (en) | 2006-01-31 | 2010-10-12 | The Research Foundation Of State University Of New York | System and method for image annotation and multi-modal image retrieval using probabilistic semantic models |
US8571850B2 (en) * | 2007-09-13 | 2013-10-29 | Microsoft Corporation | Dual cross-media relevance model for image annotation |
US8457416B2 (en) * | 2007-09-13 | 2013-06-04 | Microsoft Corporation | Estimating word correlations from images |
US20090287655A1 (en) * | 2008-05-13 | 2009-11-19 | Bennett James D | Image search engine employing user suitability feedback |
US8452794B2 (en) | 2009-02-11 | 2013-05-28 | Microsoft Corporation | Visual and textual query suggestion |
US8275620B2 (en) * | 2009-06-11 | 2012-09-25 | Microsoft Corporation | Context-relevant images |
KR101072691B1 (ko) | 2009-07-23 | 2011-10-11 | 포항공과대학교 산학협력단 | 연관성 피드백을 이용한 데이터베이스 검색 방법 및 이를 수행하는 프로그램을 기록한 기록매체 |
US8185526B2 (en) * | 2010-01-21 | 2012-05-22 | Microsoft Corporation | Dynamic keyword suggestion and image-search re-ranking |
US9311914B2 (en) * | 2012-09-03 | 2016-04-12 | Nice-Systems Ltd | Method and apparatus for enhanced phonetic indexing and search |
US9767353B2 (en) * | 2014-08-29 | 2017-09-19 | Ancestry.Com Operations Inc. | System and method for transcribing historical records into digitized text |
KR102458338B1 (ko) * | 2017-11-30 | 2022-10-25 | 삼성전자주식회사 | 컴퓨팅 장치의 정보 입력 방법 및 그 컴퓨팅 장치 |
US10929076B2 (en) * | 2019-06-20 | 2021-02-23 | International Business Machines Corporation | Automatic scaling for legibility |
US11436713B2 (en) | 2020-02-19 | 2022-09-06 | International Business Machines Corporation | Application error analysis from screenshot |
JP2021149439A (ja) * | 2020-03-18 | 2021-09-27 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
CN111460227A (zh) * | 2020-04-13 | 2020-07-28 | 赵琰 | 含肢体动作的视频的制作方法、视频产品及使用方法 |
CN111460220A (zh) * | 2020-04-13 | 2020-07-28 | 赵琰 | 一种单词闪卡视频的制作方法及视频产品 |
US11281928B1 (en) * | 2020-09-23 | 2022-03-22 | Sap Se | Querying semantic data from unstructured documents |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0689330A (ja) * | 1992-09-07 | 1994-03-29 | Toshiba Corp | 画像ファイリングシステム |
JPH08202731A (ja) * | 1995-01-27 | 1996-08-09 | Canon Inc | 画像処理方法 |
JP2001022773A (ja) * | 1999-07-08 | 2001-01-26 | Ricoh Co Ltd | イメージ文書のキーワード抽出方法 |
JP2002259388A (ja) * | 2001-03-05 | 2002-09-13 | Fujitsu Ltd | 画像検索システム、方法及び画像検索プログラム |
JP2004171316A (ja) * | 2002-11-21 | 2004-06-17 | Hitachi Ltd | Ocr装置及び文書検索システム及び文書検索プログラム |
JP2004206521A (ja) * | 2002-12-26 | 2004-07-22 | Nec Corp | 文書検索装置および文書検索プログラム |
JP2005004724A (ja) * | 2003-05-20 | 2005-01-06 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2005135041A (ja) * | 2003-10-29 | 2005-05-26 | Hitachi Ltd | 文書検索・閲覧手法及び文書検索・閲覧装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5444840A (en) * | 1990-06-12 | 1995-08-22 | Froessl; Horst | Multiple image font processing |
US5109439A (en) * | 1990-06-12 | 1992-04-28 | Horst Froessl | Mass document storage and retrieval system |
US5926565A (en) * | 1991-10-28 | 1999-07-20 | Froessl; Horst | Computer method for processing records with images and multiple fonts |
US5875263A (en) * | 1991-10-28 | 1999-02-23 | Froessl; Horst | Non-edit multiple image font processing of records |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
GB2273383A (en) * | 1992-12-10 | 1994-06-15 | Ibm | Character recognition |
US5825919A (en) * | 1992-12-17 | 1998-10-20 | Xerox Corporation | Technique for generating bounding boxes for word spotting in bitmap images |
US5553224A (en) * | 1993-08-04 | 1996-09-03 | Xerox Corporation | Method for dynamically maintaining multiple structural interpretations in graphics system |
US5689585A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Method for aligning a text image to a transcription of the image |
US5717914A (en) * | 1995-09-15 | 1998-02-10 | Infonautics Corporation | Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query |
US6137906A (en) * | 1997-06-27 | 2000-10-24 | Kurzweil Educational Systems, Inc. | Closest word algorithm |
US6424743B1 (en) * | 1999-11-05 | 2002-07-23 | Motorola, Inc. | Graphical handwriting recognition user interface |
JP3480404B2 (ja) * | 1999-12-22 | 2003-12-22 | 日本電気株式会社 | 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 |
US6839701B1 (en) * | 2000-01-21 | 2005-01-04 | International Business Machines | Hitmask for querying hierarchically related content entities |
JP4342753B2 (ja) * | 2001-08-10 | 2009-10-14 | 株式会社リコー | 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体 |
US6901411B2 (en) * | 2002-02-11 | 2005-05-31 | Microsoft Corporation | Statistical bigram correlation model for image retrieval |
US6947930B2 (en) * | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7606798B2 (en) * | 2003-09-22 | 2009-10-20 | Google Inc. | Methods and systems for improving a search ranking using location awareness |
US7555165B2 (en) * | 2003-11-13 | 2009-06-30 | Eastman Kodak Company | Method for semantic scene classification using camera metadata and content-based cues |
US20070250501A1 (en) * | 2005-09-27 | 2007-10-25 | Grubb Michael L | Search result delivery engine |
JP2008083769A (ja) * | 2006-09-26 | 2008-04-10 | Just Syst Corp | 文書検索装置および文書検索方法 |
US7945576B2 (en) * | 2007-05-29 | 2011-05-17 | Microsoft Corporation | Location recognition using informative feature vocabulary trees |
US8045800B2 (en) * | 2007-06-11 | 2011-10-25 | Microsoft Corporation | Active segmentation for groups of images |
US8014603B2 (en) * | 2007-08-30 | 2011-09-06 | Xerox Corporation | System and method for characterizing handwritten or typed words in a document |
US8224092B2 (en) * | 2008-07-08 | 2012-07-17 | Xerox Corporation | Word detection method and system |
US8520979B2 (en) * | 2008-08-19 | 2013-08-27 | Digimarc Corporation | Methods and systems for content processing |
US8335381B2 (en) * | 2008-09-18 | 2012-12-18 | Xerox Corporation | Handwritten word spotter using synthesized typed queries |
US8566349B2 (en) * | 2009-09-28 | 2013-10-22 | Xerox Corporation | Handwritten document categorizer and method of training |
US8463041B2 (en) * | 2010-01-26 | 2013-06-11 | Hewlett-Packard Development Company, L.P. | Word-based document image compression |
-
2007
- 2007-04-26 US US11/740,840 patent/US8261200B2/en active Active
- 2007-12-25 JP JP2007333333A patent/JP5018459B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0689330A (ja) * | 1992-09-07 | 1994-03-29 | Toshiba Corp | 画像ファイリングシステム |
JPH08202731A (ja) * | 1995-01-27 | 1996-08-09 | Canon Inc | 画像処理方法 |
JP2001022773A (ja) * | 1999-07-08 | 2001-01-26 | Ricoh Co Ltd | イメージ文書のキーワード抽出方法 |
JP2002259388A (ja) * | 2001-03-05 | 2002-09-13 | Fujitsu Ltd | 画像検索システム、方法及び画像検索プログラム |
JP2004171316A (ja) * | 2002-11-21 | 2004-06-17 | Hitachi Ltd | Ocr装置及び文書検索システム及び文書検索プログラム |
JP2004206521A (ja) * | 2002-12-26 | 2004-07-22 | Nec Corp | 文書検索装置および文書検索プログラム |
JP2005004724A (ja) * | 2003-05-20 | 2005-01-06 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2005135041A (ja) * | 2003-10-29 | 2005-05-26 | Hitachi Ltd | 文書検索・閲覧手法及び文書検索・閲覧装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011082958A (ja) * | 2009-10-05 | 2011-04-21 | Fuji Xerox Co Ltd | ビデオ検索システムおよびそのためのコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US8261200B2 (en) | 2012-09-04 |
US20080267503A1 (en) | 2008-10-30 |
JP5018459B2 (ja) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5018459B2 (ja) | インタラクティブシステムおよび画像検索性能を高めるプログラム | |
AU2017272149B2 (en) | Identifying matching canonical documents in response to a visual query | |
US8521738B2 (en) | System and method for classification and retrieval of chinese-type characters and character components | |
US9087235B2 (en) | Identifying matching canonical documents consistent with visual query structural information | |
US9183224B2 (en) | Identifying matching canonical documents in response to a visual query | |
US6243713B1 (en) | Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types | |
JP5241828B2 (ja) | 辞書の単語及び熟語の判定 | |
US9176986B2 (en) | Generating a combination of a visual query and matching canonical document | |
US7840589B1 (en) | Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation | |
US20120134590A1 (en) | Identifying Matching Canonical Documents in Response to a Visual Query and in Accordance with Geographic Information | |
US20070098263A1 (en) | Data entry apparatus and program therefor | |
US20180046708A1 (en) | System and Method for Automatic Detection and Clustering of Articles Using Multimedia Information | |
US20220222292A1 (en) | Method and system for ideogram character analysis | |
Pantke et al. | An historical handwritten arabic dataset for segmentation-free word spotting-hadara80p | |
US11222080B2 (en) | Guidance content automatic obtaining and displaying equipment | |
US9195706B1 (en) | Processing of document metadata for use as query suggestions | |
Ramel et al. | Interactive layout analysis, content extraction, and transcription of historical printed books using Pattern Redundancy Analysis | |
Al-Maadeed et al. | Word retrieval system for Ancient Arabic manuscripts | |
US10402636B2 (en) | Identifying a resource based on a handwritten annotation | |
US20230267274A1 (en) | Mapping entities in unstructured text documents via entity correction and entity resolution | |
Daddaoua et al. | OCR based slide retrieval | |
Balasubramanian et al. | Textual search in graphics stream of PDF | |
Sangsawad et al. | Using content based image retrieval techniques for the indexing and retrieval of Thai handwritten documents | |
TAPPER | Mechanized Methods of Documentation of Interest to Criminologists |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120528 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5018459 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |