JP2008276736A - インタラクティブシステムおよび画像検索性能を高めるプログラム - Google Patents

インタラクティブシステムおよび画像検索性能を高めるプログラム Download PDF

Info

Publication number
JP2008276736A
JP2008276736A JP2007333333A JP2007333333A JP2008276736A JP 2008276736 A JP2008276736 A JP 2008276736A JP 2007333333 A JP2007333333 A JP 2007333333A JP 2007333333 A JP2007333333 A JP 2007333333A JP 2008276736 A JP2008276736 A JP 2008276736A
Authority
JP
Japan
Prior art keywords
word
user
image
word image
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007333333A
Other languages
English (en)
Other versions
JP5018459B2 (ja
Inventor
Laurent Denoue
ドゥヌ ローラン
John Adcock
アドコック ジョン
David M Hilbert
エム.ヒルバート デイピット
Daniel A Billsus
エー.ビルサス ダニエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2008276736A publication Critical patent/JP2008276736A/ja
Application granted granted Critical
Publication of JP5018459B2 publication Critical patent/JP5018459B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • G06F18/41Interactive pattern learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19133Interactive pattern learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 画像内の単語画像へ関連フィードバックを提供して、画像の画像検索性能を高めること。
【解決手段】 システム200は、一つ以上のメモリ210、一つ以上のプロセッサ220、一つ以上の記憶装置またはリポジトリ230を含み、インストラクタのラップトップ290、またはプロジェクタ250から、マルチメディアを自動捕捉するソフトウェア240を含み、更に、記憶装置230内に、マルチメディアスライド画像260、テキスト270、およびオーディオ280を含む。ソフトウェア240は、プレゼンテーションマルチメディアを索引付けし、管理することにより、システムに学生ユーザのインストラクタのスライドを問い合わせるため、ユーザのラップトップ290から、インターネットによるインターラクション、単語画像提案の選択、インストラクタースライドの得られたグループの検索を可能とする。
【選択図】 図15

Description

本発明は、画像内に含まれる単語画像を適切にフィードバックすることによって、画像の画像検索性能を高めることに関する。
光学的文字認識(OCR)を介してラスター画像からテキストを修復する情報検索システムにおいて、最も正確なシステムにおいても、認識されたテキストにおいてエラーが発生する。これらのエラーは、キーワード検索の効果的な検索性能を低下させる。OCRはプリントされた文字の機械認識である。例えば、OCRは、銀行産業において、小切手やクレジットカードスリップを処理するために使用される。OCRシステムは、多数の異なるOCRフォントのみならず、タイプライタやコンピュータプリントされた文字を認識することができる。テキストドキュメントがコンピュータ内で走査される時、これらが「撮影」され、コンピュータにおいて写真として保存される。これらの写真は、GIF、JPEG、およびMPEG画像などのすべてのビットマップ画像およびビデオフレームが含まれる画像のカテゴリであるラスター画像である。
OCRソフトウェアは、アルファベットの文字および数字桁のそれぞれを識別するために、ラスター画像の明部と暗部を解析する。OCRソフトウェアが文字を認識する時、該文字を実際のASCII(アスキー)テキスト文字へ変換する。実際のテキストの文字がコンピュータディスク上で占める余白が画像が占める余白よりかなり少ないためにOCR変換が実行される。
ユーザは、クエリ(問い合わせ)用語が配置される複数のページドキュメントのフルページの画像を発見し、検索するために、ユーザは、OCR上で問い合わせを行うことができる。OCRデータにおけるエラーは、キーワードサーチの効果的な検索性能を低下させる。また、OCRテキストを検索するためにOCRソフトウェアが使用されると、認識の上では、システマチックエラーが存在する。例えば、ネーム “Hilbert”は、正しいスペルの“Hilbert”ではなく、 “Hubert”として誤って認識されることが非常に頻繁に発生する。この特定の例において、ユーザは、関連する結果の大部分を抜かすことになる。
不完全なOCRデータの検索性能を改良するために使用され得る自動アプローチは多数あるが、これらは、例えば、問い合わせが5単語以上と、長い時、ドキュメントのコンテクストおよび用語の冗長性が長い時、および語彙(ボキャブラリ)が相対的に静的である時、最良に作用する。
いくつかの方法は、ユーザが問い合わせを発する前にOCRエラーを補正しようとする。例えば、該システムの大部分から得られるテキストを出力することによって、「正しい」スペルを自動的に決定するために、「n」個の異なるOCRシステムから得られるOCRの結果の大部分を使用する。これらの方法は、異なるOCRシステムがさまざまな間違いをするという前提に基づいて提供されている。「n」回数分遅延している以外に、使用されているOCRシステムはすべて所与の画像に対して不正確なテキストを生成する場合もあるので、該方法は全てのエラーを取り除くことはできない。
他の方法は、辞書で見つからない単語を自動的に補正するために使用されるであろう辞書の存在を想定する。辞書に載っていそうもない新しい単語については、これらの方法は、新しい単語を辞書からの単語の一つとなるように強制する。これらの新しい単語を辞書からの単語の一つとなるように強制することによって、これらの方法は、過剰補正する。即ち、OCRが一単語を正確に認識するが、この単語が辞書に載っていない場合、この単語は、OCRによって生成されるテキストに最も近い辞書に載っている単語へ変更する。過剰補正(オーバーコレクション)は、スライドにおいて、新しい用語が、例えば、プロジェクトネーム、人物の名前、および頭字語などとして、定義付けられる可能性が高い科学的定義域(ドメイン)において、特に好ましくない。また、過少補正する方法もある。例えば、単語が辞書に載っていたという理由だけでその単語が正確に認識されたと想定することは正しくない。
更に他の方法は、OCRデータが実際に情報検索システムの性能をそれほど大きく低下させないことを示す。あいにく、これらの方法による結果は、問い合わせが長くて、ドキュメントが数百または数千の用語を有するときにのみ有効である。長い問い合わせの例としては、5つ以上の用語を有するテキスト検索会議(TREC)問い合わせが挙げられる。
スキャンされたドキュメントにおいてOCRエラーを手動的に補正するために、いくつかのOCRツールにおいては、誤って認識されたテキストベースバージョンの代わりに、ユーザへ本来の画像を示すこともある。しかしながら、これらのシステムは、一度の単一の用語を構成するために使用され、ドキュメント検索設定、特に、ユーザへ多数の用語が提示されるドキュメント検索設定としては、設計されていない。
ベイテル、スティーブン M他著、「OCRテキストコレクションのため検索戦略の調査」ドキュメント画像理解技術(SDIUT)のシンポジウムより、2003年、ダウンロード:p7(2007年4月18日)。 カラン、ジェイミー他著、「情報検索およびOCR:コンテンツ変換から意味の把握まで」、SIGIR2002ワークショップ、テンペレ大学、2002年8月15日、ダウンロード:p6(2007年4月18日)。 ドゥヌー、ローレン他著、「プロジェクターボックス:教室のためのシームレスプレゼンテーション捕捉」、ダウンロード:p6(2007年4月18日)。 ドワーマン、デービッド著、「ドキュメント画像の索引付けと検索:調査」、テクニカルレポート、LAMP−TR−013/CFAR−TR−878/CS−TR−3876、メリーランド大学、カレッジパーク、USA、p39(1998年2月)。 ホン、タオ他著、「単語画像等価によるOCR性能の改良」、ドキュメント解析および情報検索における第4回シンポジウムより、米国、NV、ラスベガス、1995年4月24日〜26日、(1995年4月)、21頁。 カンター、ポール B他著、「TREC−5コンフュージョン追跡におけるレポート」、第5回テキスト検索会議TREC−5の手順、NIST 特別公開500−238、p10、1996年、ダウンロード:p10(2007年4月19日)。 クライン S.T.他著、「自動OCR補正のための投票システム」、SIGIR 2002 ワークショップ、2002年8月15日、テンペレ大学、ダウンロード:p19(2007年4月18日)。 コーラック、オーカン他著、「雑音のあるチャネルモデルを用いたOCRエラー補正」、人類言語技術会議、HLT 2002、米国、カリフォルニア州、サンディエゴ市、(2002年)、p6。 「スキャンソフトオムニページ15 ユーザガイド」94p、2005年。 タグバ、カゼム他著、「OCR出力を自動補正するためのエキスパートシステム」、IS&T/SPIEの手引き、電子画像科学および技術における国際シンポジウム、プロシーディスプレイスクリーン(フィンランド、ヘルシンキ)、プリントセミナー、ダウンロード:p19(2007年4月18日)。 タグバ、カゼム他著、「ハイリーツ:OCRドキュメントのための検索エンジン」、ドキュメント解析システム、V、2002年、p10(2002年1月10日)。 タグバ、カゼム他著、「近似およびグローバル補正によるポスト編集」、パターン認識および人工知能の国際ジャーナル」、1995年、12p(1993年3月)。
問い合わせが、1〜2単語と、短い場合、ドキュメントがコンテクストや用語冗長性がほとんどなくて短い場合、ボキャブラリが相対的に動的である場合に良好に作用する画像の検索性を高めるためのインタラクティブな解決法が必要とされている。ユーザに単語画像へ関連フィードバックを提供させることによって、検索性能を高めるためのユーザインタフェースを作成することが更に望ましい。
ユーザに画像に含まれる単語へ関連フィードバックを提供させることによって、テキストを記述する画像の検索性能を高めるためのインタラクティブシステムが提供される。システムは、ユーザインタフェースであって、該ユーザインタフェースを介して、ユーザが、一つ以上の問い合わせ用語によって、該システム内に含まれる一つ以上の画像について、該システムに問い合わせをする、前記ユーザインタフェースを含む。単語画像提案はユーザインタフェースを介してユーザへ提示される。前記単語画像から該システムが認識する場合、各単語画像提案が前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストの一つを含む。前記一つ以上の問い合わせ用語に対する画像のシステム想起を高めるために、ユーザが前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上の単語画像提案をシステム内に含有することができる一方、特定の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザが単語画像提案をシステムから除外することができる。
本発明による第1の実施態様は、画像として取り込まれた単語をユーザへ適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるためのインタラクティブシステムであって、システムに取り込まれた一つ以上の画像について一つ以上の問い合わせ用語によって ユーザが該システムに問い合わせをするためのユーザインタフェースと、前記ユーザインタフェースを介してユーザへ提示される一つ以上の単語画像提案であって、前記単語画像から該システムが認識する場合、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案と、前記一つ以上の問い合わせ用語について画像のシステム認識性能を高めるために、前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上のユーザにより選択された単語画像提案についてのシステムへの取込、を含むインタラクティブシステムである。
本発明の第2の実施態様は、第1の実施態様において、各単語画像提案が単語画像を含み、該単語画像が一単語として取り込まれた一つ以上の画像の一部を含む、請求項1に記載のインタラクティブシステムである。
本発明の第3の実施態様は、第1の実施態様において、前記一つ以上の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザによって選択された一つ以上の単語画像提案をシステムから除外することを更に含むインタラクティブシステムである。
本発明の第4の実施態様は、第1の実施態様において、前記システムのユーザ問い合わせに先立って前記一つ以上の画像から変換されたテキストのn−グラムの索引付けを更に含み、n−グラムが長さnの文字の連結を含む(nは任意の正の整数である)インタラクティブシステムである。
本発明の第5の実施態様は、第1の実施態様において、前記一つ以上の画像内の単語画像の境界ボックスが所与の閾値以上でオーバーラップする場合、前記一つ以上の単語画像提案の場所と大きさによって、グルーピングすることを更に含み、グループの代表的な単語画像提案がユーザへ提示されるインタラクティブシステムである。
本発明の第6の実施態様は、第1の実施態様において、前記各単語画像が同一テキストと関連しており、該単語画像のテキストがそれぞれの画像内で同一の文脈で使用される場合、前記一つ以上の単語画像提案を原文の文脈でグルーピングすることを更に含み、該グループの代表的な単語画像提案がユーザへ提示されるインタラクティブシステムである。
本発明の第7の実施態様は、第1の実施態様において、前記単語画像が同様の画像である場合、前記一つ以上の単語画像提案の類似度によってグルーピングすることを更に含み、二つの画像の画素間の全体的な差がある閾値未満である場合、該二つの画像は類似しており、該グループの代表的な単語画像提案がユーザへ提示されることを更に含むインタラクティブシステムである。
本発明の第8の実施態様は、第1の実施態様において、ユーザへ提示するために、前記単語画像提案が単一均一サイズへ拡大縮小されたバージョンの単語画像提案を含むインタラクティブシステムである。
本発明の第9の実施態様は、第1の実施態様において、ユーザへ提示するために、各個別の単語画像提案に対して代表的な単語画像提案を選択することによって、一つ以上の単語画像提案の数を削減することを更に含むインタラクティブシステムである。
本発明の第10の実施態様は、第1の実施態様において、認識される単語画像のうち前記一つ以上の画像の数をユーザへ提示することによって、各単語画像提案をランク付けすることを更に含むインタラクティブシステムである。
本発明の第11の実施態様は、第1の実施態様において、前記問い合わせが二つ以上の用語を含む場合、該問い合わせにおける全用語に対する単語画像提案に関連するテキストを含まない画像に対する単語画像提案が除去されるインタラクティブシステムである。
本発明の第12の実施態様は、第1の実施態様において、該システムに、問い合わせ用語、関連するユーザ除外単語画像提案、および関連ユーザ含有単語画像提案に関する情報が保存されるインタラクティブシステムである。
本発明の第13の実施態様は、画像として取り込まれた単語をユーザへ適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるための方法であって、ユーザインタフェースを介して、ユーザの指示に応じて、一つ以上の問い合わせ用語によって、該システム内に取り込まれた一つ以上の画像について該システムに問い合わせをするステップと、前記単語画像から該システムが認識する時、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案を、前記ユーザインタフェースを介してユーザへ提示するステップと、前記一つ以上の問い合わせ用語に対する画像のシステム認識性能を高めるために、ユーザが前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上の単語画像提案を、前記システム内に取り込むようにユーザの指示に応じて選択するステップと、を含む方法である。
本発明の第14の実施態様は、第13の実施態様において、各単語画像提案が単語画像を含み、該単語画像が一単語として取り込まれた一つ以上の画像の一部を含む方法である。
本発明の第15の実施態様は、第13の実施態様において、前記一つ以上の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザによって選択された一つ以上の単語画像提案をシステムから除外することを更に含む方法である。
本発明の第16の実施態様は、第13の実施態様において、前記システムのユーザ問い合わせに先立って前記一つ以上の画像から変換されたテキストのn−グラムの索引付けを更に含み、n−グラムが長さnの文字の連結を含む(nは任意の正の整数である)方法である。
本発明の第17の実施態様は、第13の実施態様において、前記一つ以上の画像中の前記単語画像の境界ボックスが所与の閾値より大きい値とオーバーラップする場合、前記一つ以上の単語画像提案を位置および大きさによってグルーピングすることをさらに含む方法である。
本発明の第18の実施態様は、第13の実施態様において、前記各単語画像が同一テキストと関連しており、該単語画像のテキストがそれぞれの画像内で同一の文脈で使用される場合、前記一つ以上の単語画像提案を原文の文脈でグルーピングすることを更に含み、該グループの代表的な単語画像提案がユーザへ提示される方法である。
本発明の第19の実施態様は、第13の実施態様において、前記単語画像が同様の画像である場合、前記一つ以上の単語画像提案の類似度によってグルーピングすることを更に含み、二つの画像の画素間の全体的な差がある閾値未満である場合、該二つの画像は類似しており、該グループの代表的な単語画像提案がユーザへ提示されることを更に含む方法である。
本発明の第20の実施態様は、第13の実施態様において、前記ユーザインタフェースによって一つ以上の単語画像提案を提示することが、前記単語画像提案を単一均一サイズへ拡大縮小することを含む方法である。
本発明の第21の実施態様は、第13の実施態様において、各個別の単語画像提案に対して代表的な単語画像提案を選択することによって一つ以上の単語画像提案の数を削減することを更に含み、前記代表的な単語画像提案がユーザへ提示される方法である。
本発明の第22の実施態様は、第13の実施態様において、認識される単語画像のうち前記一つ以上の画像の数を前記ユーザへ提示するとによって、各単語画像提案をランク付けすることを更に含む方法である。
本発明の第23の実施態様は、第13の実施態様において、前記問い合わせが二つ以上の用語を含む場合、該問い合わせにおける全用語に対する単語画像提案に関連するテキストを含まない画像に対する単語画像提案が除去される方法である。
第13の実施態様において、本発明の第24の実施態様は 該システムに、問い合わせ用語、関連するユーザ除外単語画像提案、および関連ユーザ含有単語画像提案に関する情報が保存される方法である。
本発明の第25の実施態様は、画像として取り込まれた単語をユーザに適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるための機能を実行するために、コンピュータによって実行可能な命令のプログラムであって、前記コンピュータに、ユーザインタフェースを介して、ユーザの指示に応じて、一つ以上の問い合わせ用語によって、該システム内に取り込まれた一つ以上の画像についてシステムに問い合わせをするステップと、前記単語画像から該システムが認識する時、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案を、前記ユーザインタフェースを介してユーザへ提示するステップと、前記一つ以上の問い合わせ用語に対する画像のシステム認識性能を高めるために、ユーザが前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上の単語画像提案を、前記システム内に取り込むようにユーザの指示に応じて選択するステップと、を実行させるプログラムである。
本発明による好ましい実施の形態は、以下の図面を参照することによって、より詳細に説明され得る。
検索性能が改良されるべきであるOCR(光学的文字認識)デバイスの一つの例として、プロプラエタリな(所有権を主張できる)“プロジェクタ・ボックス(ProjectorBox)”システムが挙げられる。しかしながら、以下の説明において、プロジェクタ・ボックスに適用される基本原理は、他のタイプのOCRデバイスにも適用され得る。プロジェクタ・ボックスは、学生、インストラクタおよび教育機関のために講義内容を自動的にキャプチャ(捕捉)するように作成された。講義内容を捕捉した後、プロジェクタ・ボックスは、プレゼンテーションマルチメディアを索引付けし、管理する。プロジェクタ・ボックスは、例えば、インストラクタのラップトップ、または、プロジェクタなどのディスプレイデバイスなどのプレゼンテーションデバイスから送られた赤緑青(RGB)情報を記録するために連続的に動作する。プロジェクタ・ボックス・システムは、二つの主要コンポーネント:捕捉コンポーネントとサーバからなる。捕捉コンポーネントは、高解像度のスライド画像、テキストおよびオーディオをシームレス(継ぎ目なし)に捕捉する。ビデオおよびオーディオ捕捉ハードウェアに加えて、捕捉コンポーネントは、更なる解析および記憶のためにサーバへ周期的にデータを転送するソフトウェアアプリケーションからなる。捕捉コンポーネントは、サーバへ画像を送り、オーディオクリップは、外部マイクロフォンから記録され、圧縮MP3ファイルとしてサーバへ記憶される。
サーバ上のウェブベースのユーザインタフェースによって、学生は、捕捉されたプレゼンテーションをブラウザで表示し、検索し、再生し、転送することができる。プロジェクタ・ボックスによって、学生はコンテンツに基づいて講義を検索することができ、ビデオによって、順次、再生しなければならないのとは逆に、捕捉された媒体に非線形的にアクセスすることができる。捕捉された媒体は、ウェブ−ベースのユーザインタフェースへの問い合わせを使用することによって、非線形にアクセスされる。結果的に、OCRは、スライド画像へ用いられ、テキストを抽出し、フルテキスト索引(インデックス)を生成して、学生による検索および非線形アクセスを可能とする。
図1は、本発明の実施の形態による、スライドの例示的なコーパスに対して “Hilbert”と“Hubert”を整合させるスライドの数のヒストグラムの例を示す。プロジェクタ・ボックスは、OCRソフトウェアを用いて、約200,000画像を獲得し、OCRを実行した。プロジェクタ・ボックスからのOCRテキストには、システマチックな認識エラーが存在する。プロジェクタ・ボックスによって認識される用語の発生が経時的にチャート化されてもよい。図3の例においては、スライドの例において、用語“Hilbert”は、スライドのコーパスの多数のスライドに出現する。しかしながら、用語“Hubert”はスライドに出現しない。ヒストグラムの最上列は、プロジェクタ・ボックスが“Hilbert”として正確に整合したスライドの数を示す。ヒストグラムの最下列は、プロジェクタ・ボックスが“Hubert”であると誤って整合してしまった “Hilbert”を含むスライドの数を示す。 “Hilbert”は、プロジェクタ・ボックス・ソフトウェアによって、正確に“Hilbert”と(46回)認識されるよりも、むしろ“Hubert”と非常に頻繁に(307回)誤って認識される。この特定の例が示すように、問い合わせ用語“Hubert”について、プロジェクタ・ボックスによって捕捉されるOCRデータを取り込むように問い合わせをしているユーザは、関連する認識結果の大部分を見落としてしまう。
プロジェクタ・ボックス・システムによって捕捉されるデータは、関連する技術によって捕捉されるデータとはいくつかの点で異なる。第1に、プロジェクタ・ボックスに送られる問い合わせの大部分(89%)は、一個または二個の用語しか含まない。2005年においてプロジェクタ・ボックスによって受信された3275個の問い合わせのうち、1619個(49%)の問い合わせは一個の用語を含んでいたが、1310個(40%)の問い合わせは二個の用語を含んでいた。第2に、例えば、授業の講義におけるMicrosoft PowerPoint(登録商標)のプレゼンテーションに使用されるたぐいのスライドであるので、プロジェクタ・ボックスによって使用される「ドキュメント」は非常に短い。図2は、本発明の実施の形態による、8年間、プロジェクタ・ボックスによって使用された図1のスライドのコーパスの例に対して一年あたりのスライドにおける平均単語数を示すグラフの例である。この例のコーパスは、50,917枚のスライドを含む。グラフから、スライドあたりの平均単語数が32個であることが分かる。第3に、用語は、ドキュメント内へたった一回、定常的に出現する。スライドにおける冗長的な用語の欠落は、あたかも、OCRが、初めて、用語毎に用語を処理している行為に類似することを意味する。したがって、冗長的な用語の欠落はOCR性能を効果的に改良しない。第4に、同一あるいは略同一のドキュメントは共通である。これは、スライド内のテキストボックスの大きさまたは位置が、回復したテキストボックスを複数のスライドに関連付けるために使用され得ることを意味する。関連付けられたテキストボックスは、問い合わせを実行したユーザへプレゼンテーション(提示)するために、まとめてグループ分けされ得る。
画像の検索精度を高めるためには、特定のドキュメントにおいて問い合わせ中のすべての用語が発見されなくても、長い問い合わせであれば、問い合わせ用語の一つ以上が発見できたドキュメントを検索エンジンが整合させることを可能とするので、問い合わせの大きさに左右される。問い合わせの大きさは問い合わせの用語の数に等しい。また、ドキュメントの大きさにも左右される。ユーザが「情報」を検索する場合、長いドキュメントは「情報」の多数の例を含む傾向が強く、したがって、これらの例のいくつかは正確に認識されている可能性が高い。
プロジェクタ・ボックスの場合、スライドが一般に短いドキュメントであるので、一般的に、用語は一ドキュメントに対して一回発生するだけである。したがって、ドキュメントが「情報」の一例のみを含む場合、この情報の唯一の例がOCRソフトウェアによって誤って認識された場合、該ドキュメントはユーザによって検索されない。
誤って認識された単語に代わる単語画像を提示する手段
OCRソフトウェアによって画像ドキュメント内の単語が誤って認識されたという問題を正すために、OCRソフトウェアを経て画像ドキュメントから変換されたテキストは、最初に、n−グラムを用いて索引付けされる。n−グラム(索引語)は、与えられたシーケンス(順序)のアイテムからのn番目のアイテムのサブシーケンスである。例えば、“a big cat”は、索引付けするために、以下の10個のバイグラム、即ち、「2−グラム」:“ a”、“a ”、“ b”、“bi”、“ig”、“g ”、“ c”、“ca”、“at”、および“t ”(“ ”が単語の境界を表す)へ分解される。ユーザが、例えば、“a big cat”の問い合わせを実行する時、n−グラムの索引付けによって、認識性能が高められる。即ち、n−グラムの索引付けによって、問い合わせ用語を含む正確に検索されたドキュメントの数が増加することを意味する。しかしながら、これらの同じ問い合わせ用語について、n−グラムの索引付けは、該n−グラムの索引付けが不正確に検索されたドキュメント数も増加させるので、残念ながら、精度を低下させてしまう。だが、問い合わせにおける単語数、つまり問い合わせのサイズが十分に大きい場合、精度のロスもそれほど多くない。問い合わせのサイズが大きくなればなるほど、該問い合わせが正しいドキュメントを検索することに成功したことが一層確実とされる。しかしながら、本発明の実施の形態において、問い合わせの大部分が非常に短い。n−グラムの索引付けは、音や言語(スピーチ)を検索するために使用される音声ベースの検索エンジンに使用されてもよい。
図1において、n−グラムの索引付けを行なわない場合、“Hilbert”を検索するユーザは、コーパスにおける用語“Hilbert”の配分が過小評価されていることが分かる。n−グラムの索引付けを行った場合、ユーザは、コーパスにおける用語“Hilbert”の配分が過大評価されていることが分かる。上記の例において、バイグラム索引付けが使用されているが、本発明の実施の形態においては、任意の整数“n”に対して、n−グラムの索引付けが使用されてもよい。
“Hilbert”の代わりに“Hubert”を使用することをユーザが考え付くことはありえないので、この問題を克服することができる検索の仕方を作り出すことをユーザに期待することは妥当ではない。したがって、システムが自動的に代替案を提案すれば、それが最も理想的である。
システムに自動的に代替単語を提案させるために、スペルチェッカーシステムが設計されている。これらのシステムは、スペルミスのある単語に類似した代替単語を提案する。代替単語によって、次に、問い合わせはより多くのドキュメントを検索するために拡張され、これによって、該システムの想起を潜在的に改良する。しかしながら、精度を高く維持するために、提案された用語は良好に選択されなければならない。問い合わせ用語にユーザによる単純なスペルミスがあった場合、および、コーパスが問い合わせ単語に対して正しいスペルを含む場合には、正しい提案を選択することに、問題はない。例えば、コーパスが含まない用語“lettice”を用いて問い合わせをした場合、そして、コーバスが用語“lettuce”を含む場合、システムは提案単語“lettuce”を選択し、この単語を、提案された問い合わせ用語として、ユーザへ提示することができる。ユーザは問い合わせにミススペルがあっても問題にならない場合が多く、かれらは正しい提案を簡単に選択することができる。
しかしながら、プロジェクタ・ボックスの場合、問い合わせ用語が正しく綴られる可能性が高いが、誤って認識された単語によって「ノイジー」になる可能性も高い。例えば、ユーザが “Hilbert”で問い合わせを実行する場合、プロジェクタ・ボックスは、コーパスにおいて“Hilbert”の誤って認識された単語の例を検索しないだけでなく、Hilbertを含むすべてのドキュメントがユーザのために検索されるわけではない。プロジェクタ・ボックスは、ユーザへ提案することはできるが、これらの提案単語は、例えば、 “information”を“iformation”と誤って認識された単語であるので、これらの提案単語の多くが意味を成さない。従って、ユーザが、提案単語が意味を成すかどうかを判断することは非常に困難である。
本発明の実施の形態によれば、図3は、問い合わせ用語“Hilbert”に対して、図1のコーパスの例から、プロジェクタ・ボックスのOCRソフトウェアによって認識されたテキスト提案の例を示す。テキスト提案の後の数は、用語がコーパスに出現する回数である。図3において、ユーザが “Hilbert”で問い合わせを行う場合にプロジェクタ・ボックスが作成し得る提案単語が示されている。これらの提案において、最初の2列には、“kimber”、“1−filbert”、“ilbert”、および“dhiibert”などの多数の意味を成さない単語が現れている。これらの提案のテキストが示されている場合、ユーザは、とても「正確な」提案単語を選択することができない。
図4は、本発明の実施の形態による、図3のテキスト提案のいくつかの単語画像バージョンの例を示している。プロジェクタ・ボックスは、正確に認識された単語および誤って認識された単語の両方に対応するテキスト提案をユーザへ提示する代わりに、これらの単語画像を提案単語としてユーザへ提示する。単語画像は、基本的に、単一スライド上で単語を示すOCRデータの一部である。OCRソフトウェアは、OCRソフトウェアによって認識されるオリジナル画像全体、テキスト単語ではなく、テキスト単語周辺の切り取られた領域がユーザへ表示されるように、スライド画像上のテキスト単語の位置を規定する。多少の議論の余地があるにしても、図4における単語画像のリストが提示されたユーザにとって、正確な提案を選択することは図3の正確なテキスト提案を選択するよりもはるかに簡単である。しかしながら、ユーザは、いまなお、多数の画像によって翻弄されている。
図5は、本発明の実施の形態による、図3のテキスト提案の単語画像バージョンのより大きなセットの例を示している。図5は、図3の“Hilbert”に対して誤って認識されたテキスト提案の多くが、図5においては、“Hilbert”単語画像として正確に示されることができることを示している。また、図5は、図3の“Dogbert”および “Alpert”などの“Hilbert”以外の他の提案単語も正確に認識された単語であり、これらが単語画像提案としてユーザへ提示されることを示している。
単語画像のグループ分け手段
“Hilbert”の問い合わせ例について、図5は、単語画像がグループ分けされない場合、ユーザが分類する必要がある467個の単語画像提案の例も示している。OCRソフトウェアは、所定の単語を何通りにも誤って認識する。スペルミスの数は、単語の長さに比例して増加する。例えば、単語“information”は、“add”に比べて誤って認識される頻度が多い。一般に、該OCRソフトウェアは、ユーザへ数百個の単語画像提案を示すので、より長い単語に対するすべての単語画像提案を示された場合、ユーザはこれらの提案に翻弄されてしまう。
OCRソフトウェアが同一の画像表示下にあるいくかの提案をグループ分けし、これによって、ユーザがブラウジングする必要のある単語画像のリストを効果的に削減することができる。単語画像間の類似度を見つけるために、グループ分けはいくつかの類似度測定を用いることによって実行される。
図6は、本発明の実施の形態による、図5の単語画像提案を場所によってグループ分けした後で得られた単語画像提案の例を示す。単語画像提案を場所によってグループ分けした後、ユーザが検討する必要のある単語画像の数は、図5の467個から図6の107個へと大幅に削減される。この最初の類似度測定は、スライド内の単語画像の位置に基づく。2つの画像の関連性がOCRソフトウェアによって同一であると認識され、2つの画像の境界ボックスの位置がそれぞれのスライド上で所定の閾値以上の値でオーバーラップする場合、二つの単語画像は類似する。境界ボックスは、単語画像の周辺のボックスあるいはテキスト単語を含むスライド画像の切り取り領域である。境界ボックスの位置は、単語画像の高さおよび幅の外に、スライド画像内の単語画像の中心の(x,y)座標によって定義付けられる。本発明の実施の形態においては、80%は予め定められた閾値であるが、本発明は、この数値に限定されない。
図7は、本発明の実施の形態による、テキストの文脈(コンテクスト)によって、図6の単語画像提案をグループ分けした後に得られる単語画像提案の例を示す。この第2の類似度測定によって、図6の例の107個から、図7の例の39個まで、単語画像提案の数が削減される。この第2の類似度測定は、それぞれのスライドのコンテクストにおける単語画像のテキストの類似度に基づく。例えば、“David Hilbert”と “David Hilbert”は同一の左側のコンテクスト“David ”を共有しているので、一致する二つの単語画像“Hilbert”のグループ分けが実行される。他の例において、“Don Hilbert is” と“David Hilbert does”は左右のコンテクストのいずれかを共有しないので、一致する二つの単語画像“Hilbert”のグループ分けは実行されない。
図8は、本発明による画像の類似度によって図7の単語画像提案をグループ分けした後に得られる単語画像提案の例を示す。この第3の類似度測定によって、図7の例の39個から、図8の例の33個まで、単語画像提案の数が削減される。現在の技術は、画像の類似度によるグループ分けを実行するために使用され得る。例えば、本発明の実施の形態においては、全体的な画素間の差が、ある閾値未満である場合、これらの二つの画像は類似していると考えられる。他の例において、本発明の実施の形態において、画像間で異なる画素数が全画素のある比率未満である場合、二つの画像は類似していると考えられる。本発明の実施の形態において、画素間の平方根の差がある閾値を超過している場合、二つの画像間の画素が異なると考えられる。本発明の実施の形態において、性能上の理由で、頻出単語または頻繁に問い合わせされる単語のための単語画像とこれらの類似度は、予め演算することができる。
他の実施の形態において、誤って認識された単語に対してグループ分けが許可された場合、単語画像提案のリストは更に削減され得る。この場合、テキストのコンテクストを用いたグループ分けが最適に作用する。例えば、 “text”の誤って認識された単語が“txt”であると仮定する。“txt”が、第1のスライドにおいて“the txt is good”として現れ、第2のスライドでも、 “the txt is good”で現れると仮定する。“txt”に対する単語画像は、二つのスライドのうちの両スライドに対してではなく、片方のスライドに対してのみ、示される。この仮定は、これらの二つの“txt”用語が、両スライドにおいて、同じコンテクスト(“the”...”is good”)によって囲まれているので、同じ用語である確率が高いという仮定である。従って、ユーザが単語画像を補正することを選択する場合、単語画像のうちの一つだけがユーザに示されるので、ユーザは、二つの単語画像提案のうちの一つを補正するだけですむ。
単語画像提案の拡大縮小、削減、分類、およびランク付け手段
図9(A)および図9(B)は、本発明の実施の形態による、図7の単語画像提案を拡大縮小した後に得られる単語画像提案の例を示す。ユーザへ単語画像を提示する前に、単語画像は、最初に同一サイズに拡大縮小され、これによって、単語画像のユーザがより迅速にスキミング(拾い読み)できるようにする。図9(A)において、図7からのボックスが同じ幅と高さに拡大縮小される。ただし、図8からのボックスは、図9(A)に使用することもできたが、図解することが目的であるので、この例においては、図7からのボックスを利用した。図9(B)では、図7からのボックスは、高さのみが同じ高さに拡大縮小されている。しかしながら、図9(B)においては、図解のみを目的としているため、図7からのボックスの主要部分のみが選択され、図示されている。
図10は、本発明の実施の形態において、図9(A)の弁別された提案ごとに代表的な単語画像提案を選択した後に得られる削減された数の単語画像提案の例を示す。図9(A)の39個の画像は、図10に示すように、17個の異なる画像提案に対応している。提案ごとに一つの単語画像を選択することによって、ユーザに示される画像の数を更に削減することができる。本発明の実施の形態において、ユーザインタフェースによって、ユーザは、各グループ内の画像の実際のリストを見て、必要があれば、該グループを拡大することができる。「ポップアップ」ウィンドウには都合がよいことに、画像のグループ分けは不完全であってもよい。例えば、図10のポップアップウィンドウに見られるように、該ポップアップウィンドウは、“Hilbert’s”と“:Hubert.”の異なる提案を示しており、画像のグループ分けが不完全であった。グループの視覚化は、代表的なグループ上でユーザがマウスを動かしている時点で、ポップアップウィンドウを用いて行われてもよい。また、グループの視覚化は、グループ内の画像とマウスの位置をリンクすることによっても実施され得る。ユーザがグループをクリックする場合、各グループ内の画像は、ワードプロセッサを用いて文章に単語を付け加えるのと同様に、マウス位置においてフラットリストまたはレイアウト内へ拡大される。
本発明の実施の形態において、単語画像は異なる基準に応じて分類され、この分類に基づく特定の順番で、ユーザへ提示される。本発明の実施の形態において、ユーザは認識性能について最も影響のある提案により高い関心を持つことから、分類基準は特定の単語画像にマッピングされているスライドの数に基づいていてもよい。本発明の実施の形態において、分類基準は、実際のスライド/ドキュメントにおける画像の単語の大きさに基づいていてもよい。ユーザは、大きな単語画像に比べて、小さな単語画像は、スライドの文脈においてあまり重要ではないので、小さな単語画像に対する提案単語にあまり関心を示さない。
本発明の実施の形態において、システムは、提案をランク付けし、特定の提案を含むスライドやドキュメントの数を提示する。例えば、結果的に100個以上の画像を検索する単語画像提案をユーザが選択した場合、それは、システムに対して、結果的に一個の更なる画像のみを検索する結果となる単語画像提案よりも大きなインパクトを与える。ユーザの作業は提案を選択することによってシステムの認識性能を迅速に改良することであるから、特定の提案によってもたされる認識性能の効果をユーザに示すことは有用である。ランク付けの番号は、ユーザが特定の提案を選択した後、問い合わせ結果が追加されたスライドまたはドキュメントの数を示すので、提案のランク付けによって、ユーザは、認識性能に直接的な効果を及ぼすような最も重要な提案を決定することができる。また、このような提案の分類は、ユーザが最も重要な提案を決定するときに役立つ。
ユーザインタフェース
プロジェクタ・ボックスのソフトウェアのユーザインタフェースによって、学生などのユーザは、彼らのホームコンピュータやラップトップのインターネットを介してプロジェクタ・ボックスとインターフェースすることができる。上述したように、ユーザインタフェースを介して、ユーザは、彼らのインストラクタのスライド用のシステムに問い合わせをし、単語画像提案を選択し、インストラクタのスライドの得られたグループを検索することができる。ユーザは、クリックして単語画像提案を選択し、もう一度クリックして非選択とすることができる。
図11は、本発明の実施の形態による、ユーザに、問い合わせ結果リストから誤って認識された用語を除外させるプロジェクタ・ボックス・ユーザインタフェースのスクリーンショットの例を示す。ユーザは、プロジェクタ・ボックス・ユーザインタフェースを用いて、問い合わせ結果リストから正確に認識された用語を含むこともできる。ユーザがプロジェクタ・ボックス・ユーザインタフェース110を対話的に操作(インタラクト)する時、該ユーザが、問い合わせの結果からスライドを除外したいとする場合もある。例えば、ユーザは、プロジェクタ・ボックス・ユーザインタフェース110の問い合わせにテキストフィールド120内で検索用語“Hubert”を用いて問い合わせを実行する。問い合わせが、画像130のように、“Hilbert”を含むいくつかのスライド画像をユーザへ返した場合、ユーザは、スライドが “Hilbert”に関するものであり、“Hubert”ではないことをすぐに理解する。ユーザは、それらの結果から誤って認識された画像を除外することを選択できる。ユーザは、画像サムネイル“Hilbert”140のハイライト部分を直接クリックすることによって、結果リストから、この用語を削除することができる。
図12は、本発明の実施の形態によって、「ラバーバンド」ツールが、単語画像提案のサブセットをどのようにして選択するかを例示的に示す。ユーザは、結果セットの単語画像提案をクリックすることによって、あるいは、図12のドットボックスによって最初の5個の単語画像提案を選択することによって示されるように、一つ以上の画像を選択するためにラバーバンドをドラッグしたりすることによって、単語画像提案の結果セットのための画像を選択することができる。ユーザによって選択された問い合わせの結果は、結果セットに追加される。或いは、“accept” (受容)および“reject”(拒絶)ボタンまたはチェックボックスが提案画像に関連付けられ、提案結果画像の追加および除外の両方を可能とする。
本発明の実施の形態において、システムは、ユーザの選択された提案を追跡することができる。問い合わせ用語、関連付けられたユーザ除外単語画像提案、および関連付けられたユーザ含有単語画像提案に関する情報がシステムに保存され得る。本発明の実施の形態において、システムはこれらの選択された提案に基づいてテキストを自動的に補正することができる。“Hilbert”を問い合わせ用語の例とすれば、システムが“Hubert”として誤って認識する“Hilbert”のすべての例に対して、ユーザがテキスト“Hubert”に対応する“Hilbert”の提案を選択した場合、該システムは、誤って認識されたテキスト“Hubert”を“Hilbert”に置き換えることができる。ユーザによって選択された提案は、提案のリストを再ランク付けするために使用され得る。時間が経つにつれて、コーパスの品質が向上し、ユーザが提案選択に費やす時間が短縮される。
複数の用語による問い合わせ手段
図13は、本発明の実施の形態による、複数の問い合わせ用語に対して、これらの問い合わせ用語が発見されたスライドを示す表の例を示す。ユーザの問い合わせが複数の用語を含む時、各用語に対して提案技術が適用される。プロジェクタ・ボックスにおける省略時(デフォルトな)行動が問い合わせ用語のAND演算を実行することであるから、すべての他の用語の提案と同時発生しない提案は削除される。この際、提案は、問い合わせ用語の本来のスペルを含む。
例えば、問い合わせが“Information retrieval(情報検索)”である場合、プロジェクタ・ボックスは、“Information”の変形と“retrieval”の変形に対して提案を返す。図13は、スライドNo.7において、本来の問い合わせ用語“Information”が現れたり、発生したりすることを示す。提案単語“nformation”は、スライドNo.1、2および5に現れる。提案“foriiation”が、スライドNo.4および6に現れる。同様に、本来の問い合わせ用語“retrieval”がスライドNo.1に現れる。提案“retrlval”がスライドNo.2、4および8に現われ、提案“retrival”がスライドNo.3および7へ現れる。
図14は、本発明の実施の形態による、問い合わせ結果からスライドが除去された図13の複数の問い合わせ用語を示す表の例を示す。用語ごとに提案(単語)が整合するスライドから候補のみが保持される。この例において、スライドNo.3、5、6および8は、本来の問い合わせ用語のうちの一つのみに対する提案に整合する。コラム2に示されるように、スライドNo.3および8は、“Information”に対する提案に整合しない。コラム3に示されるように、スライドNo.5および6は、“retrieval”に対する提案に整合しない。従って、スライドNo.3、5、6および8は、問い合わせ結果から削除される。第4のコラムに示されているように、スライドNo.1、2、4および7は、“Information retrieval”に対するユーザの問い合わせの結果としてユーザへ提示される。
システムのハードウェア、ソフトウェア、およびコンポーネント
上記の解決が、プロジェクタ・ボックス・システムによって捕捉されるOCRデータに対する検索を改良するために設計されているが、この解決は、他の走査されたドキュメントのタイプに適用されてもよい。また、この解決は、プロジェクタ・ボックス・システム以外の他のシステムによって捕捉されるデータに適用され得る。
図15は、本発明の実施の形態による、プロジェクタ・ボックス・システムの例を示す。一般に、システム200は、一つ以上のメモリ210、一つ以上のプロセッサ220、および数種類の一つ以上の記憶装置またはリポジトリ230を含む。該システム200は、例えば、インストラクタのラップトップから、またはプロジェクタ250から、マルチメディアを自動的に捕捉するソフトウェア240を更に含む。システム200は、記憶装置230内に、マルチメディアスライド画像260、テキスト270、およびオーディオ280を含む。ソフトウェア240は、プレゼンテーションマルチメディアを索引付けし、管理する。また、ソフトウェア240は、学生ユーザが、システムに彼らのインストラクタのスライドを問い合わせるために、彼らのホームコンピュータまたはラップトップ290から、インターネットを介して、インタラクトし、単語画像提案を選択し、彼らのインストラクタースライドの得られたグループを検索することができる、ウェブベースのユーザインタフェースを含む。
本発明の実施の形態は、本開示の教示に従ってプログラムされた従来の汎用のまたは専用ディジタルコンピュータまたはマイクロプロセッサを用いて、実施され得るコンピュータベースの方法およびシステムを含むことができる。適切なソフトウェアの符号化(コーディング)は、本開示の教示に基づいて、プログラマによって、すぐに準備することができる。本発明の実施の形態は、本明細書中に提示されている特徴のいずれかを実行するためにコンピュータによって実施可能な命令のプログラムを含むことができる。
本発明の実施の形態は、コンピュータ読み出し可能記憶媒体などのコンピュータ読み出し可能媒体を含んでいてもよい。コンピュータ読み出し可能記憶媒体は、本明細書中に提示されている特徴のいずれかを実行するためにコンピュータをプログラムするために使用され得る記憶された命令を有することができる。記憶媒体は、限定はされないが、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、および光磁気ディスク、ROM、RAM、EPROM、EEPROM、DRAM、フラッシュメモリを含む任意のタイプのディスク、または命令やデータを記憶するために好適な任意の媒体またはデバイスを含むことができる。本発明は、汎用/専用コンピュータまたはマイクロプロセッサなどのコンピュータのハードウェアをコントロールするだけでなく、本発明の結果を利用してコンピュータのハードウェアを人間ユーザまたは他のメカニズムとインタラクトすることを可能とするソフトウェアを含むことができる。このようなソフトウェアは、限定はされないが、デバイスドライバ、オペレーティングシステム、実施環境/コンテナ、ユーザインタフェース、およびユーザアプリケーションを含んでいてもよい。
本発明の実施の形態には、本発明のプロセスを実施するためのコードを提供することが含まれる。この提供には、任意の方法においてユーザへコードを提供することが含まれる。例えば、この提供には、ユーザへのコードを含むディジタル信号を送信すること、物理的な媒体上のコードをユーザへ提供すること、およびコードを入手可能とさせる任意の他の方法が含まれる。
本発明の実施の形態には、本発明の実施の形態の任意のプロセスを実行するために、コンピュータにおいて実施することができるコードを送信するためのコンピュータ実施方法が含まれ得る。該送信には、インターネットなどのネットワークの任意の部分を介して、大気または空間など、ワイヤ回線を介して、または任意の他のタイプの送信を介しての転送が含まれ得る。該送信には、コードの送信の開始、コードを他の領域や国から任意の領域や国へ手渡すことが含まれ得る。ユーザへの送信には、任意の領域や国において、送信が送られる場所とは無関係に、該ユーザによって受信される任意の送信が含まれ得る。
本発明の実施の形態には、本発明の実施の形態の任意のプロセスを実行するためにコンピュータにおいて実行可能なコードを含む信号が含まれ得る。該信号は、インターネットなどのネットワークを介して、大気または空間など、ワイヤ回線を介して、または任意の他のタイプの送信を介して、送られる。信号全体が同時にトランジットされる必要はない。信号は、その転送の期間にわたって、時間を超過させ得る。信号は、現在トランジットされているもののスナップショットとして考えるべきではない。
本発明の好ましい実施の形態についての以上の説明は、図解および説明を目的として提供されているのであって、本発明の実施の形態によって開示されている具体的な形態以外の形態を排除したり、本発明を限定したりすることを意図するものではない。多くの変更および変形が関連技術における当業者にとって明白であろう。例えば、開示されている本発明の実施の形態において実行された工程は、順序を変えてもよいし、いくつかの工程は省略されてもよいし、更なる工程を追加することも可能である。本発明の他の実施の形態が開発され、本発明および請求の範囲の精神および範囲を逸脱しないことも理解されよう。本発明の実施の形態は、本発明の基本原理とその実践的応用を最適に説明するために選択され、記載されており、これによって、関連技術における他の当業者が種々の実施の形態について、および考案される特定の用途に適した種々の変更によって、本発明を理解することを可能とする。本発明の範囲は、以下の請求の範囲およびこれらと同等ものによって定義付けられることを意図するものである。
本発明の実施の形態による、スライドの例示的なコーパスに対してネーム “Hilbert”と“Hubert”を整合させるスライド数のヒストグラムの例を示す図である。 本発明の実施の形態による、8年間にわたってプロジェクタ・ボックスで使用された図1のスライドのコーパスの例に対して、一年あたりのスライドにおける平均単語数を示す例示的なグラフである。 本発明の実施の形態による、問い合わせ用語“Hilbert”に対して、図1のコーパスの例から、プロジェクタ・ボックスのOCRソフトウェアによって認識されたテキスト提案の例を示す図である。 本発明の実施の形態による、図3のテキスト提案のいくつかの単語画像バージョンの例を示す図である。 本発明の実施の形態による、図3のテキスト提案の単語画像のバージョンのより大きなセットを示す図である。 本発明の実施の形態による、図5の単語画像提案を場所によってグループ分けした後で得られた単語画像提案の例を示す図である。 本発明の実施の形態による、テキストのコンテクストによって図6の単語画像提案をグループ分けした後で得られた単語画像提案の例を示す図である。 本発明の実施の形態による、図7の単語画像提案を画像の類似度によってグループ分けした後に得られた単語画像提案の例を示す図である。 本発明の実施の形態による、図7の単語画像提案を拡大縮小した後に得られた単語画像提案の例を示す図である。 本発明の実施の形態による、図9(A)の弁別された提案ごとに代表的な単語画像提案を選択した後で得られた削減した数の単語画像提案を示す図である。 本発明の実施の形態による、問い合わせ結果リストから誤って認識された用語を除外させるプロジェクタ・ボックス・ユーザインタフェースのスクリーンショットの例を示す図である。 本発明の実施の形態による、「ラバーバンド」ツールの例が、単語画像提案の例のサブセットをどのようにして選択するかを示す図である。 本発明の実施の形態による、複数の問い合わせ用語に対して、該複数の問い合わせ用語が発見されたスライドを示す表である。 本発明の実施の形態による、前記複数の問い合わせ用語に対して、問い合わせ結果からどのスライドが除外されたかを示す表の例を示す図である。 本発明の実施の形態による、プロジェクタ・ボックス・システムの例を示す図である。
符号の説明
200: システム
210: メモリ
220: プロセッサ
230: リポジトリ
240: マルチメディアスライド画像
250: プロジェクタ
250: インストラクタのラップトップ
290: ユーザのコンピュータ

Claims (24)

  1. 画像として取り込まれた単語をユーザへ適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるためのインタラクティブシステムであって、
    システムに取り込まれた一つ以上の画像について一つ以上の問い合わせ用語によって ユーザが該システムに問い合わせをするためのユーザインタフェースと、
    前記単語画像から該システムが認識する場合、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案を、前記ユーザインタフェースを介してユーザへ表示する表示手段と、
    前記一つ以上の問い合わせ用語について画像のシステム認識性能を高めるために、前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上のユーザにより選択された単語画像提案をシステムに取り込む取込手段と、
    を含むインタラクティブシステム。
  2. 各単語画像提案が単語画像を含み、該単語画像が一単語として取り込まれた一つ以上の画像の一部を含む、請求項1に記載のインタラクティブシステム。
  3. 前記一つ以上の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザによって選択された一つ以上の単語画像提案をシステムから除外することを更に含む、請求項1に記載のインタラクティブシステム。
  4. 前記システムのユーザ問い合わせに先立って前記一つ以上の画像から変換されたテキストのn−グラムの索引付けを更に含み、n−グラムが長さnの文字の連結を含む(nは任意の正の整数である)、請求項1に記載のインタラクティブシステム。
  5. 前記一つ以上の画像内の単語画像の境界ボックスが所定の閾値以上でオーバーラップする場合、前記一つ以上の単語画像提案の場所と大きさによってグルーピングすることを更に含み、グループの代表的な単語画像提案がユーザへ提示される、請求項1に記載のインタラクティブシステム。
  6. 前記各単語画像が同一テキストと関連しており、該単語画像のテキストがそれぞれの画像内で同一の文脈で使用される場合、前記一つ以上の単語画像提案を原文の文脈でグルーピングすることを更に含み、該グループの代表的な単語画像提案がユーザへ提示される、請求項1に記載のインタラクティブシステム。
  7. 前記単語画像が類似する画像である場合、前記一つ以上の単語画像提案の類似度によってグルーピングすることを更に含み、二つの画像の画素間の全体的な差がある閾値未満である場合、該二つの画像は類似しており、該グループの代表的な単語画像提案がユーザへ提示されることを更に含む、請求項1に記載のインタラクティブシステム。
  8. ユーザへ提示するために、前記単語画像提案が単一均一サイズへ拡大縮小されたバージョンの単語画像提案を含む、請求項1に記載のインタラクティブシステム。
  9. ユーザへ提示するために、各個別の単語画像提案に対して代表的な単語画像提案を選択することによって、一つ以上の単語画像提案の数を削減することを更に含む、請求項1に記載のインタラクティブシステム。
  10. 認識される単語画像のうち前記一つ以上の画像の数をユーザへ提示することによって、各単語画像提案をランク付けすることを更に含む、請求項1に記載のインタラクティブシステム。
  11. 前記問い合わせが二つ以上の用語を含む場合、該問い合わせにおける全用語に対する単語画像提案に関連するテキストを含まない画像に対する単語画像提案が除去される、請求項1に記載のインタラクティブシステム。
  12. 該システムに、問い合わせ用語、関連するユーザ除外単語画像提案、および関連ユーザ含有単語画像提案に関する情報が保存される、請求項1に記載のインタラクティブシステム。
  13. 画像として取り込まれた単語をユーザへ適切にフィードバックすることによって、テキストを描画する画像の検索性能を高めるためのプログラムであって、
    コンピュータに、
    ユーザインタフェースを介して、ユーザの指示に応じて、一つ以上の問い合わせ用語によって、該システム内に取り込まれた一つ以上の画像について該システムに問い合わせをするステップと、
    前記単語画像から該システムが認識する時、前記一つ以上の問い合わせ用語と同じかあるいは僅かに異なるテキストのいずれかを含む一つ以上の単語画像提案を、前記ユーザインタフェースを介してユーザへ提示するステップと、
    前記一つ以上の問い合わせ用語に対する画像のシステム認識性能を高めるために、ユーザが前記一つ以上の問い合わせ用語と視覚的に整合する一つ以上の単語画像提案を、前記システム内に取り込むようにユーザの指示に応じて選択するステップと、
    を実行させるプログラム。
  14. 各単語画像提案が単語画像を含み、該単語画像が一単語として取り込まれた一つ以上の画像の一部を含む、請求項13に記載のプログラム。
  15. 前記一つ以上の問い合わせ用語に対する画像検索結果の精度を高めるために、ユーザによって選択された一つ以上の単語画像提案をシステムから除外することを更に含む、請求項13に記載のプログラム。
  16. 前記システムのユーザ問い合わせに先立って前記一つ以上の画像から変換されたテキストのn−グラムの索引付けを更に含み、n−グラムが長さnの文字の連結を含む(nは任意の正の整数である)、請求項13に記載のプログラム。
  17. 前記一つ以上の画像中の前記単語画像の境界ボックスが所与の閾値より大きい値とオーバーラップする場合、前記一つ以上の単語画像提案を位置および大きさによってグルーピングすることをさらに含む、請求項13に記載のプログラム。
  18. 前記各単語画像が同一テキストと関連しており、該単語画像のテキストがそれぞれの画像内で同一の文脈で使用される場合、前記一つ以上の単語画像提案を原文の文脈でグルーピングすることを更に含み、該グループの代表的な単語画像提案がユーザへ提示される、請求項13に記載のプログラム。
  19. 前記単語画像が同様の画像である場合、前記一つ以上の単語画像提案の類似度によってグルーピングすることを更に含み、二つの画像の画素間の全体的な差がある閾値未満である場合、該二つの画像は類似しており、該グループの代表的な単語画像提案がユーザへ提示されることを更に含む、請求項13に記載のプログラム。
  20. 前記ユーザインタフェースによって一つ以上の単語画像提案を提示することが、前記単語画像提案を単一均一サイズへ拡大縮小することを含む、請求項13に記載のプログラム。
  21. 各個別の単語画像提案に対して代表的な単語画像提案を選択することによって一つ以上の単語画像提案の数を削減することを更に含み、前記代表的な単語画像提案がユーザへ提示される、請求項13に記載のプログラム。
  22. 認識される単語画像のうち前記一つ以上の画像の数を前記ユーザへ提示するとによって、各単語画像提案をランク付けすることを更に含む、請求項13に記載のプログラム。
  23. 前記問い合わせが二つ以上の用語を含む場合、該問い合わせにおける全用語に対する単語画像提案に関連するテキストを含まない画像に対する単語画像提案が除去される、請求項13に記載のプログラム。
  24. 該システムに、問い合わせ用語、関連するユーザ除外単語画像提案、および関連ユーザ含有単語画像提案に関する情報が保存される、請求項13に記載のプログラム。
JP2007333333A 2007-04-26 2007-12-25 インタラクティブシステムおよび画像検索性能を高めるプログラム Expired - Fee Related JP5018459B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/740840 2007-04-26
US11/740,840 US8261200B2 (en) 2007-04-26 2007-04-26 Increasing retrieval performance of images by providing relevance feedback on word images contained in the images

Publications (2)

Publication Number Publication Date
JP2008276736A true JP2008276736A (ja) 2008-11-13
JP5018459B2 JP5018459B2 (ja) 2012-09-05

Family

ID=39887047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007333333A Expired - Fee Related JP5018459B2 (ja) 2007-04-26 2007-12-25 インタラクティブシステムおよび画像検索性能を高めるプログラム

Country Status (2)

Country Link
US (1) US8261200B2 (ja)
JP (1) JP5018459B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011082958A (ja) * 2009-10-05 2011-04-21 Fuji Xerox Co Ltd ビデオ検索システムおよびそのためのコンピュータプログラム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7814040B1 (en) 2006-01-31 2010-10-12 The Research Foundation Of State University Of New York System and method for image annotation and multi-modal image retrieval using probabilistic semantic models
US8571850B2 (en) * 2007-09-13 2013-10-29 Microsoft Corporation Dual cross-media relevance model for image annotation
US8457416B2 (en) * 2007-09-13 2013-06-04 Microsoft Corporation Estimating word correlations from images
US20090287655A1 (en) * 2008-05-13 2009-11-19 Bennett James D Image search engine employing user suitability feedback
US8452794B2 (en) 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
US8275620B2 (en) * 2009-06-11 2012-09-25 Microsoft Corporation Context-relevant images
KR101072691B1 (ko) 2009-07-23 2011-10-11 포항공과대학교 산학협력단 연관성 피드백을 이용한 데이터베이스 검색 방법 및 이를 수행하는 프로그램을 기록한 기록매체
US8185526B2 (en) * 2010-01-21 2012-05-22 Microsoft Corporation Dynamic keyword suggestion and image-search re-ranking
US9311914B2 (en) * 2012-09-03 2016-04-12 Nice-Systems Ltd Method and apparatus for enhanced phonetic indexing and search
US9767353B2 (en) * 2014-08-29 2017-09-19 Ancestry.Com Operations Inc. System and method for transcribing historical records into digitized text
KR102458338B1 (ko) * 2017-11-30 2022-10-25 삼성전자주식회사 컴퓨팅 장치의 정보 입력 방법 및 그 컴퓨팅 장치
US10929076B2 (en) * 2019-06-20 2021-02-23 International Business Machines Corporation Automatic scaling for legibility
US11436713B2 (en) 2020-02-19 2022-09-06 International Business Machines Corporation Application error analysis from screenshot
JP2021149439A (ja) * 2020-03-18 2021-09-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
CN111460227A (zh) * 2020-04-13 2020-07-28 赵琰 含肢体动作的视频的制作方法、视频产品及使用方法
CN111460220A (zh) * 2020-04-13 2020-07-28 赵琰 一种单词闪卡视频的制作方法及视频产品
US11281928B1 (en) * 2020-09-23 2022-03-22 Sap Se Querying semantic data from unstructured documents

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689330A (ja) * 1992-09-07 1994-03-29 Toshiba Corp 画像ファイリングシステム
JPH08202731A (ja) * 1995-01-27 1996-08-09 Canon Inc 画像処理方法
JP2001022773A (ja) * 1999-07-08 2001-01-26 Ricoh Co Ltd イメージ文書のキーワード抽出方法
JP2002259388A (ja) * 2001-03-05 2002-09-13 Fujitsu Ltd 画像検索システム、方法及び画像検索プログラム
JP2004171316A (ja) * 2002-11-21 2004-06-17 Hitachi Ltd Ocr装置及び文書検索システム及び文書検索プログラム
JP2004206521A (ja) * 2002-12-26 2004-07-22 Nec Corp 文書検索装置および文書検索プログラム
JP2005004724A (ja) * 2003-05-20 2005-01-06 Canon Inc 画像処理装置及びその制御方法、プログラム
JP2005135041A (ja) * 2003-10-29 2005-05-26 Hitachi Ltd 文書検索・閲覧手法及び文書検索・閲覧装置

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444840A (en) * 1990-06-12 1995-08-22 Froessl; Horst Multiple image font processing
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
US5926565A (en) * 1991-10-28 1999-07-20 Froessl; Horst Computer method for processing records with images and multiple fonts
US5875263A (en) * 1991-10-28 1999-02-23 Froessl; Horst Non-edit multiple image font processing of records
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
GB2273383A (en) * 1992-12-10 1994-06-15 Ibm Character recognition
US5825919A (en) * 1992-12-17 1998-10-20 Xerox Corporation Technique for generating bounding boxes for word spotting in bitmap images
US5553224A (en) * 1993-08-04 1996-09-03 Xerox Corporation Method for dynamically maintaining multiple structural interpretations in graphics system
US5689585A (en) * 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
US5717914A (en) * 1995-09-15 1998-02-10 Infonautics Corporation Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
US6137906A (en) * 1997-06-27 2000-10-24 Kurzweil Educational Systems, Inc. Closest word algorithm
US6424743B1 (en) * 1999-11-05 2002-07-23 Motorola, Inc. Graphical handwriting recognition user interface
JP3480404B2 (ja) * 1999-12-22 2003-12-22 日本電気株式会社 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
US6839701B1 (en) * 2000-01-21 2005-01-04 International Business Machines Hitmask for querying hierarchically related content entities
JP4342753B2 (ja) * 2001-08-10 2009-10-14 株式会社リコー 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体
US6901411B2 (en) * 2002-02-11 2005-05-31 Microsoft Corporation Statistical bigram correlation model for image retrieval
US6947930B2 (en) * 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7606798B2 (en) * 2003-09-22 2009-10-20 Google Inc. Methods and systems for improving a search ranking using location awareness
US7555165B2 (en) * 2003-11-13 2009-06-30 Eastman Kodak Company Method for semantic scene classification using camera metadata and content-based cues
US20070250501A1 (en) * 2005-09-27 2007-10-25 Grubb Michael L Search result delivery engine
JP2008083769A (ja) * 2006-09-26 2008-04-10 Just Syst Corp 文書検索装置および文書検索方法
US7945576B2 (en) * 2007-05-29 2011-05-17 Microsoft Corporation Location recognition using informative feature vocabulary trees
US8045800B2 (en) * 2007-06-11 2011-10-25 Microsoft Corporation Active segmentation for groups of images
US8014603B2 (en) * 2007-08-30 2011-09-06 Xerox Corporation System and method for characterizing handwritten or typed words in a document
US8224092B2 (en) * 2008-07-08 2012-07-17 Xerox Corporation Word detection method and system
US8520979B2 (en) * 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
US8335381B2 (en) * 2008-09-18 2012-12-18 Xerox Corporation Handwritten word spotter using synthesized typed queries
US8566349B2 (en) * 2009-09-28 2013-10-22 Xerox Corporation Handwritten document categorizer and method of training
US8463041B2 (en) * 2010-01-26 2013-06-11 Hewlett-Packard Development Company, L.P. Word-based document image compression

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689330A (ja) * 1992-09-07 1994-03-29 Toshiba Corp 画像ファイリングシステム
JPH08202731A (ja) * 1995-01-27 1996-08-09 Canon Inc 画像処理方法
JP2001022773A (ja) * 1999-07-08 2001-01-26 Ricoh Co Ltd イメージ文書のキーワード抽出方法
JP2002259388A (ja) * 2001-03-05 2002-09-13 Fujitsu Ltd 画像検索システム、方法及び画像検索プログラム
JP2004171316A (ja) * 2002-11-21 2004-06-17 Hitachi Ltd Ocr装置及び文書検索システム及び文書検索プログラム
JP2004206521A (ja) * 2002-12-26 2004-07-22 Nec Corp 文書検索装置および文書検索プログラム
JP2005004724A (ja) * 2003-05-20 2005-01-06 Canon Inc 画像処理装置及びその制御方法、プログラム
JP2005135041A (ja) * 2003-10-29 2005-05-26 Hitachi Ltd 文書検索・閲覧手法及び文書検索・閲覧装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011082958A (ja) * 2009-10-05 2011-04-21 Fuji Xerox Co Ltd ビデオ検索システムおよびそのためのコンピュータプログラム

Also Published As

Publication number Publication date
US8261200B2 (en) 2012-09-04
US20080267503A1 (en) 2008-10-30
JP5018459B2 (ja) 2012-09-05

Similar Documents

Publication Publication Date Title
JP5018459B2 (ja) インタラクティブシステムおよび画像検索性能を高めるプログラム
AU2017272149B2 (en) Identifying matching canonical documents in response to a visual query
US8521738B2 (en) System and method for classification and retrieval of chinese-type characters and character components
US9087235B2 (en) Identifying matching canonical documents consistent with visual query structural information
US9183224B2 (en) Identifying matching canonical documents in response to a visual query
US6243713B1 (en) Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
JP5241828B2 (ja) 辞書の単語及び熟語の判定
US9176986B2 (en) Generating a combination of a visual query and matching canonical document
US7840589B1 (en) Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation
US20120134590A1 (en) Identifying Matching Canonical Documents in Response to a Visual Query and in Accordance with Geographic Information
US20070098263A1 (en) Data entry apparatus and program therefor
US20180046708A1 (en) System and Method for Automatic Detection and Clustering of Articles Using Multimedia Information
US20220222292A1 (en) Method and system for ideogram character analysis
Pantke et al. An historical handwritten arabic dataset for segmentation-free word spotting-hadara80p
US11222080B2 (en) Guidance content automatic obtaining and displaying equipment
US9195706B1 (en) Processing of document metadata for use as query suggestions
Ramel et al. Interactive layout analysis, content extraction, and transcription of historical printed books using Pattern Redundancy Analysis
Al-Maadeed et al. Word retrieval system for Ancient Arabic manuscripts
US10402636B2 (en) Identifying a resource based on a handwritten annotation
US20230267274A1 (en) Mapping entities in unstructured text documents via entity correction and entity resolution
Daddaoua et al. OCR based slide retrieval
Balasubramanian et al. Textual search in graphics stream of PDF
Sangsawad et al. Using content based image retrieval techniques for the indexing and retrieval of Thai handwritten documents
TAPPER Mechanized Methods of Documentation of Interest to Criminologists

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120528

R150 Certificate of patent or registration of utility model

Ref document number: 5018459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees