JP4640591B2 - 文書検索装置 - Google Patents

文書検索装置 Download PDF

Info

Publication number
JP4640591B2
JP4640591B2 JP2005169203A JP2005169203A JP4640591B2 JP 4640591 B2 JP4640591 B2 JP 4640591B2 JP 2005169203 A JP2005169203 A JP 2005169203A JP 2005169203 A JP2005169203 A JP 2005169203A JP 4640591 B2 JP4640591 B2 JP 4640591B2
Authority
JP
Japan
Prior art keywords
document
search
keyword
weight
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005169203A
Other languages
English (en)
Other versions
JP2006344010A (ja
Inventor
博仁 柴田
健 吉岡
敏哉 山田
仁 池田
基文 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005169203A priority Critical patent/JP4640591B2/ja
Priority to US11/339,519 priority patent/US7634473B2/en
Publication of JP2006344010A publication Critical patent/JP2006344010A/ja
Application granted granted Critical
Publication of JP4640591B2 publication Critical patent/JP4640591B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

検索キーワードに基づいて文書を検索して表示する文書検索装置に関し、特に、文書と検索キーワードとの関連度を視覚的に明らかにする技術に関する。
多数の文書を蓄積したデータベースやネットワーク上のWebサイトなどから、ユーザが指定した検索キーワードに基づいて、所望の文書を検索することが行われている。
このような文書検索において、1つ又は複数の検索キーワードを利用して検索した場合、検索キーワードが検索された文書(検索文書)中のどのような位置で使用されているのかが判れば、検索文書中の検索キーワードに基づいて当該検索文書の必要性が判断しやすくなる。
このような要求に対処するため、検索文書中に検索キーワードを目立つようにハイライトして表示する方法が実用化されている。
また、文書検索においては、検索キーワードをシソーラス展開した類似語により検索することが行われている。このように類似語により検索された文書にオリジナルの検索キーワードが含まれているか、或いは、どの検索キーワードがどの類似語に展開されたのかが判れば、検索文書が検索された根拠を明らかにすることができて便利である。
そこで、検索キーワードをシソーラス展開した文書検索において、検索キーワードとシソーラス展開された類似語との類似度に応じて、検索文書中で検索キーワードと類似語とを濃淡を違えたハイライト表示する発明が提案されている(特許文献1参照。)。
また、類似語を検索文書中でハイライト表示するとともに、どの検索キーワードから展開されたのかを明らかにするため、類似語の下に検索キーワードを小さく表記する発明が提案されている(特許文献2参照。)。
特開平11−250077号公報。 特開平11−73420号公報。
上記の従来技術は、検索キーワードや展開語を検索文書中でハイライト表示することや、更には、展開語を検索キーワードとの類似度に応じてはハイライトのさせ方を違えることが行われている。
しかしながら、文書に含まれる語の当該記述内容に対する重み(例えば、当該記述内容を特徴付ける程度)は同じ語にあっても文書毎に異なっており、検索された多数の文書を検索キーワードや類似語の重みに応じて整理付けることが、所望の文書を見付け出そうとするユーザにとって重要である。
すなわち、検索文書が多い場合、検索文書内で文書をスコアリングしてスコアの高い順に文書を列挙 (ランキング) することが重要となる。
上記の重みの算出方法としては、文書内における語の出現頻度に基づいて重みを算出するTF、語の出現頻度の他の文書との比較に基づいて重みを算出するIDF、TFとIDFとを組み合わせて重みを算出するTF−IDF、確率的手法に基づいて重みを算出する方法など様々なものが知られており、例えば、文書における語の出現頻度に比例して語の重みが算出され、検索された各文書を検索キーワードの重みに従ってランキングすることが行われる。
しかしながら、検索された文書をランキングして整理した場合にあっても、文書における語の記述内容への係わり度合いが文書毎に異なることから、検索された文書中からユーザが所望の文書を見付け出す上で不便を感じる場合がある。
例えば、複数の検索キーワードを用いて検索を行った場合、ユーザの目的によって各キーワード毎に重要度が異なる場合があり、検索キーワードの重要度に着目すると上記のようなランキング結果が当てはまらず、多数の検索文書内から所望の文書を見付け出す作業が煩雑となってしまう場合がある。
本発明は、上記従来の事情に鑑みなされたもので、検索に用いられる語と当該語を含む各文書との係わり合いを、各検索文書中で一目で把握できるようにすることを目的としている。
本発明は、文書が登録された文書データベースから文書を検索して表示する文書検索装置であって、文書を検索するための検索キーワードの入力を受け付けるキーワード入力手段と、検索キーワードに基づいて文書データベースから文書を検索する文書検索手段と、検索キーワードの前記検索された検索文書の内容を特徴付ける重みをキーワード重みとして算出するキーワード重み算出手段と、検索文書が含む検索キーワードを前記キーワード重みに応じた表示態様として検索文書を表示する表示処理手段と、を備えたことを特徴とする文書検索装置、このような文書検索装置をコンピュータに実行させることで構成する文書検索プログラム、このような文書検索装置により実施される文書検索方法である。
したがって、本発明によると、キーワード入力手段から入力された検索キーワードに基づいて、文書検索手段が文書データベースから文書を検索し、キーワード重み算出手段が検索キーワードの検索された検索文書の内容を特徴付ける重みをキーワード重みとして算出して、表示処理手段により検索文書が含む検索キーワードをキーワード重みに応じた表示態様として当該検索文書を表示する。
これにより、検索された文書毎に当該各文書が含むキーワードの重みが一目して判断できる態様で表示され、例えば、キーワード毎の重みに着目してこれら検索文書を選別する作業を容易に行うことができる。
表示態様としてはユーザがキーワード重みを識別可能な表示であればよく、例えば、キーワードに対する、ハイライトに濃淡をつける、網掛けの種類を変える、背景のグラデーションを変える、シェードの種類を変える、フォントサイズを変える、フォントの種類を変える、アンダーラインの種類を変える等、何れを用いて表示してもよく、また、キーワードや背景の表示色を変化させてもよい。
表示処理手段は、キーワード重みに応じた表示態様を規定する基準値に基づいて検索文書が含む検索キーワードの表示態様を変更して表示するようにしてもよい。
例えば、基準値に応じて複数の背景色を用意しておき、算出されたキーワード重みに応じてキーワードに付加する背景色を決定するようにすれば、ユーザが当該背景色によってどの程度の重みがあるキーワードであるかを容易に判断することができる。
また、検索文書毎にキーワード重みの総和を算出し、当該総和値に応じて検索文書をランク付けする文書ランク付け手段を備えることで、キーワード重みを検索文書のランキングに利用するようにしてもよい。
また、検索キーワードに予め初期重みを付加して、キーワード重み算出手段が初期重みを加味してキーワード重みを算出するようにしてもよい。
これにより、例えば、ユーザの検索の意図に応じた初期重みを複数の検索キーワードに対して異なる値で付加することで、ユーザにとって重要度の高い検索キーワードをより強調表示できるため、ユーザは所望する文書を容易に選別できるようになる。
なお、初期重みは、例えば、ユーザが検索キーワードに明示的に付加しても、検索キーワードの指定順序に基づいてキーワード入力手段が自動的に付加しても、予め検索キーワード毎に定められていてもよく、初期重みの付加方法は問わない。
本発明に係る文書検索装置は検索キーワードの関連語に基づく検索に用いることも可能であり、語に関連する関連語と、当該関連する度合いを示す関連度と、を保持するシソーラス辞書手段を備え、文書検索手段は、検索キーワードとシソーラス辞書手段が保持する当該検索キーワードの関連語とに基づいて文書データベースから文書を検索し、キーワード重み算出手段は、検索キーワードの関連語のキーワード重みを対応する関連語の関連度を加味して算出し、表示処理手段は、検索文書が含む検索キーワードの関連語を前記キーワード重みに応じた表示態様として表示することができる。
これにより、シソーラス展開による文書検索においても、検索キーワードの関連語を各文書における重みに応じた態様で表示することができる。
なお、関連語とは、例えば、同義語、類似語、上位/下位の関係のある語、部分/全体の関係のある語など、語に関連性を有する語である。
また、本発明に係る文書検索装置は、検索キーワード或いは検索キーワードを組み合わせた論理式ではなく文書形式で検索条件を入力する関連文書検索に用いることも可能である。すなわち、入力された文書の内容を特徴付ける特徴語を検索キーワードとして文書を検索して表示する文書検索装置として、表示処理手段は、入力文書が含む検索キーワードを検索文書のキーワード重みに応じた表示態様として入力文書を表示することができる。したがって、入力文書中に表示態様を変えて表示された語を見ることで、検索文書が当該語に基づいて検索されたこと及び当該後の検索文書中での重要度を視覚的に把握することができる。
特徴語としては、例えば、文書内における出現頻度が高い語、他の文書と比較して出現頻度が高い語、出現位置から見て重要な語(例えば、タイトルに使用)を用いることができる。
文書検索装置を関連文書検索に用いる場合は、入力文書又は検索文書のいずれか一方の文書から検索キーワードの選択を受け付けるキーワード選択入力手段を備え、表示処理手段は、他方の文書のうちの前記選択された検索キーワードに対応する語を区別可能な表示態様として表示するようにしてもよい。
これにより、例えば、入力文書中で語を選択することにより、検索文書中の当該語に対応する検索キーワードが明確になり、入力文書と検索文書との検索キーワードによる関係を容易に把握することができる。
また、複数の検索文書の候補を表示した中から検索文書の選択を受け付ける候補文書選択入力手段を備え、表示処理手段は、入力文書が含む検索キーワードを前記選択された検索文書のキーワード重みに応じた表示態様として入力文書を表示するようにしてもよい。
これにより、例えば、入力文書を閲覧している状態において当該入力文書に基づいて検索された複数の検索文書のリストが表示された場合、ユーザがリスト中の何れかの候補を指定することにより、当該指定された検索文書の検索に用いられた検索キーワードが入力文書中の何れの語であるか、更には、当該語の検索文書における重みを把握できる。
本発明によると、ユーザは検索キーワードの検索文書における重みを一目で識別することができ、文書が検索された根拠を容易に把握することができる。これにより、ユーザは検索文書が所望する文書か否かを速やかに判断できるため、効率的に文書検索を行うことができるようになる。
本発明を、図に示す一実施形態に基づいて具体的に説明する。
図1に、本発明に係る文書検索装置の機能構成を示している。
文書検索装置は、検索対象となる複数の文書が登録された文書データベース1と、語の関連語についての情報を保持するシソーラス辞書手段2と、検索キーワード重みに応じた表示態様を規定する濃淡スケール3と、論理式形式又は検索入力文形式で検索キーワードの入力を受け付けるキーワード入力手段4と、検索キーワードに基づいて文書データベース1から文書を検索する文書検索手段5と、検索された各文書について各文書毎に含まれる検索キーワードの重みを算出するキーワード重み算出手段6と、検索文書が含む検索キーワードを識別可能な表示態様として検索文書を表示する文書表示処理手段7と、検索文書をランク付けしてランキング表示する文書ランク表示手段8と、検索文書が表示される画面9と、を備えている。
本発明に係る文書検索装置における文書検索の処理の概要を説明する。
キーワード入力手段4がユーザから検索キーワードを受け付けると、文書検索手段5が当該検索キーワードによって文書データベース1から該当する検索し、キーワード重み算出手段6が当該検索文書における検索キーワードのキーワード重みを算出する。そして、文書表示処理手段7がキーワード重みに応じて濃淡スケール3を参照して表示態様を決定し、検索キーワードを当該表示態様として検索文書を画面9に表示する。
なお、文書ランク表示手段8が、検索文書毎のキーワード重みの総和を算出し、当該総和値に応じてランク付けして画面9に検索された文書間のランキングを表示する。
次に、検索キーワードの入力形式が相違する例を用いて文書検索装置が行う処理内容を説明する。
まず、キーワード入力手段4から受け付ける検索論理式に単数の検索キーワードが含まれている場合について図2を用いて説明する。
キーワード入力手段4が検索キーワード21「カラー」を受け付け、文書検索手段5が検索キーワード21に基づいて文書データベース1から文書を検索して、検索キーワード21と同じ「カラー」を語22として含む文書Aと、検索キーワード21と同じ「カラー」を語23として含む文書Bを検索する。
文書Aでは語22が2回出現し、文書Bでは語23が1回出現しているため、TF−IDFを用いる本例では、キーワード重み算出手段6が算出するキーワード重みは、語23より語22の方が大きい値となる。
文書表示処理手段7は、算出されたキーワード重みに基づいて濃淡スケール3を参照して語22、23の表示態様を決定し、語22、23を当該表示態様にして文書A、文書Bを画面9に表示する。
なお、本例では、画面9に複数の検索文書を並べて表示しているが、各文書を切り替えて画面9に表示するようにしてもよい。
濃淡スケール3は、図3に例示するように、キーワード重みが0.3未満の場合は表示態様3a、キーワード重みが0.3以上0.6未満の場合は表示態様3b、キーワード重みが0.6以上0.9未満の場合は表示態様3c、キーワード重みが0.9以上の場合は表示態様3dが指定されており、表示態様の濃度を重みに応じて高くするようにして、表示態様3aが最も強調度が低く、表示態様3dが最も強調度が高くなるように設定されている。
したがって、キーワード重み算出手段6が算出したキーワード重みが、語22が1.0、語23が0.5であったとすると、語22は表示態様3d、語23は表示態様3bで各文書中に表示される。
これによって、検索キーワードに該当する語22と語23とは同じ語「カラー」であるが、語22が語23より強調表示されているため、文書Aが文書Bより検索キーワード21に関する重みが大きいことが表示態様に把握できる。すなわち、本例では、文書Aの方が語「カラー」によって文書内容の特徴が表現されていることがわかる。
次に、キーワード入力手段4から受け付ける検索論理式に複数の検索キーワードが含まれている場合について図4を用いて説明する。
キーワード入力手段4が検索キーワード41「カラー」、検索キーワード42「コピー」を受け付け、文書検索手段5が検索キーワード41、42に基づいて文書データベース1から文書を検索して、検索キーワード41、42と同じ語を語43、44として含む文書Aと、検索キーワード41、42と同じ語を語45、46として含む文書Bを検索する。
すなわち、文書Aでは検索キーワード「カラー」が2回、検索キーワード「コピー」が1回、文書Bでは検索キーワード「カラー」が1回、検索キーワード「コピー」が2回出現している。
この場合も、検索キーワードが単数の場合と同様に、各語のキーワード重みを算出して対応する表示態様を決定し、語43、44を各キーワード重みに対応する表示態様として文書Aを表示し、語45、46を各キーワード重みに対応する表示態様として文書Bを表示する。
文書Aでは語「カラー」が2回出現し語「コピー」が1回出現する一方、文書Bでは語「カラー」が1回出現し語「コピー」が2回出現しているため、TF−IDFを用いる本例では、キーワード重み算出手段6が算出するキーワード重みは、文書Aでは語「カラー」の方が語「コピー」より重みが大きく、文書Bでは語「コピー」の方が語「カラー」より重みが大きくなる。
したがって、上記のように、文書Aでは語「カラー」の方が語「コピー」より強調して表示され、文書Bでは語「コピー」の方が語「カラー」より強調して表示され、同じ語であっても文書毎に表示態様が異なることにより、各語の各文書における重みを一目して判別することができる。
ここで、本例においては、文書ランク表示処理手段8が画面に表示する検索文書に対して、検索文書毎に含まれるキーワード重みの総和を算出してランク付けする処理も行う。
これにより、多数の文書が検索された場合でも、ランク付け処理を実行することにより、検索キーワードの関連度の大きい文書を容易に見付け出すことができる。
ここで、上記のように各検索文書に応じて検索キーワードの表示態様を異ならせることにより、検索文書のランク付けとは異なる効果を得ることができる。
例えば、上記の例において、各語の基準重みを“1”とすると、ランク付け処理では、文書Aでは検索キーワード「カラー」及び「コピー」の重みの総和は“3”となり、文書Bでは検索キーワード「カラー」及び「コピー」の重みの総和は“3”となって、両文書のランク付けは等しくなる。
一方、検索キーワードの表示態様処理では、文書Aでは検索キーワード「カラー」が大きく強調されて表示され、文書Bでは検索キーワード「コピー」が大きく強調されて表示される。
このため、例えば、ユーザが2つの検索キーワードの内のいずれかをより重要と考えている場合には、当該重要とするキーワードが大きく強調されている文書を見付けるといった作業を行うことで、検索文書群から所望の文書を容易に見出すことができる。
上記の例において、例えば、ユーザが検索に使用する複数の検索キーワードのうちのいずれかのキーワードを重要視するような場合、各キーワードに対して当該重要度に応じた初期重みを予め付与しておくことが有効であり、ユーザの検索の意図を反映させた検索及び表示を行うことができる
例えば、検索キーワード「カラー」に0.5の初期重みが付加され、検索キーワード「コピー」に1.5の初期重みが付加されるとすると、文書Aのキーワード「カラー」の重みは2(出現回数)×0.5(初期重み)=1.0となり、文書Aのキーワード「コピー」の重みは1.5となる。同様に、文書Bのキーワード「カラー」の重みは0.5となり、文書Bのキーワード「コピー」の重みは3.0となる。
ここで、初期重みを付加しない場合は、文書Aのキーワード「カラー」の重み(出現回数)は2.0となり、文書Aのキーワード「コピー」の重みは1.0となるため、文書Aの「カラー」の重み2.0は「コピー」の重み1.0より大きいが、上記のように初期重みを付加することで、文書Aの「カラー」の重み1.0が「コピー」の重み1.5がより小さくなる。初期重みを付加することによってキーワード「カラー」の重みとキーワード「コピー」の重みが逆転するため、初期重みを付加しない場合にはキーワード「カラー」がキーワード「コピー」より強調表示されていたが、初期重みを付加することによってキーワード「コピー」がキーワード「カラー」より強調表示されるようになり、ユーザは検索の意図に応じた初期重みを付加することで、ユーザの所望する検索文書がいずれかを容易に識別できるようになる。
これまでは、検索キーワードを含む文書を検索した場合の文書表示について説明したが、次に、検索キーワードをシソーラス展開して得た検索キーワードの関連語を含む文書を検索した場合の文書表示について図5を用いて説明する。
なお、シソーラス辞書手段2は、語に関連する関連語と、当該関連する度合いを示す関連度が設定されており、図6に例示するように、語「カラー」に関連度「0.4」で関連する関連語「プリンタ」と、語「カラー」に関連度「0.3」で関連する関連語「コピー」と、語「カラー」に関連度「0.8」で関連する関連語「色」とが設定されている。
キーワード入力手段4が検索キーワード「カラー」を受け付けると、文書検索手段5が検索キーワード「カラー」をシソーラス辞書手段2を参照して展開し、検索キーワード「カラー」の関連語「プリンタ」と「コピー」と「色」を取得する。そして、文書検索手段5が、これら「カラー」「プリンタ」「コピー」「色」をキーワードとして文書データベース1から文書を検索し、これらキーワードの少なくともいずれか1つを含む文書を検索する。図5の例では、「カラー」と同じ語を語72と関連語「プリンタ」「コピー」と同じ語を語73、74として含む文書Aと、関連語「プリンタ」「色」と同じ語を語75、76として含む文書Bが検索される。
ここで、キーワード重み算出手段6は検索キーワードと関連語との各検索文書におけるキーワード重みを算出して、文書表示処理手段7が検索キーワードと関連語のキーワードをそれらの重みに応じた表示態様として検索文書を画面9に表示する。
本例においては、検索キーワードの関連語の各検索文書における出現頻度に当該関連語に対する関連度を乗じて重みを算出しており、文書Aにおいて語「プリンタ」は1回出現しており語「カラー」との関連度は0.4であるため重みは0.4となり、語「コピー」の重みは0.3となる。同様に、文書Bにおいて語「プリンタ」の重みは0.4、語「色」の重みは0.8となる。
このため、語「プリンタ」と語「色」の文書Bにおける出現回数はともに1回であるが検索キーワードとの関連度が異なることにより算出されるキーワード重みが異なるため、関連度の高い語「色」の方が関連度の低い「プリンタ」より強調された表示態様として表示される。
したがって、シソーラス展開された関連語を用いた文書検索においても、展開前の検索キーワードと関連語が特定の表示態様で表示されるため、検索文書を検索した根拠を容易に把握することができる。これに加えて、関連語の表示態様はその関連度を加味した度合いとされるため、展開前の検索キーワードは関連語に比してより一層強調された表示態様となり、本来の検索根拠である検索キーワードに重きをおいた表示態様とされる。
ここで、例えば、複数の検索キーワード「カラー」と「印刷」とが入力されたときに、「カラー」の関連語「プリンタ」が「印刷」の関連語でもある場合のように、関連語が重複する場合は、重複する関連語の関連度の総和を用いてキーワード重みを算出すればよく、関連語「プリンタ」の語「カラー」に対する関連度が0.5、関連語「プリンタ」の語「印刷」に対する関連度が0.3であれば、0.5と0.3とを足した0.8を「プリンタ」の関連度としてキーワード重みの算出に用いればよい。
次に、文書形式で検索条件を入力する関連文書検索について図7を用いて説明する。
図7に画面9の表示例を示すように、キーワード入力手段4が入力文書を受け付けると、当該入力文が画面9の左側に表示され、文書検索手段5が入力文書中の特徴語(「安」、「新宿」、「店」、「カラー」、「コピー」、「機」)を検索キーワードとして検索し、同図の右側に示すように検索された文書を表示する。この検索文書の表示し際して、キーワード重み算出手段6が検索文書中の検索キーワードに対応する語「安」、「新宿」、「店」、「カラー」、「コピー」、「機」のキーワード重みを算出し、文書表示処理手段7が検索文書中の各検索キーワードに対応する語をキーワード重みに応じた表示態様として画面9に表示するとともに、入力文書中の各検索キーワードについても検索文書におけるキーワード重みに応じた表示態様として画面9に表示する。
したがって、入力文書と検索文書とが互いに含む検索キーワードが同様な強さで強調表示されるため、ユーザは検索文書がいずれの検索キーワードに基づいて検索されたかを知ることができるとともに、その検索キーワードの検索文書における重みについても把握することができる。
ここで、入力文書中の特徴語は、例えば、キーワード入力手段4が、入力文書を形態素解析し、得られた語についてTF−IDFにより当該入力文書の記述内容を特徴付けるとみなされる上位幾つかの語を採用することで選択される。
図8には、上記のような関連文書検索による検索結果出力の他の例を示してある。
本例では、文書検索装置に備えられたキーワード選択入力手段10により、ユーザが、画面9に表示された入力文書又は検索文書のいずれか一方の文書から検索キーワードを選択すると、文書表示処理手段7は他方の文書のうちの選択された検索キーワードに対応する語を区別可能な表示態様として表示する。
例えば、入力文書中の検索キーワードの1つである特徴語「カラー」を選択した場合、検索文書中の特徴語「カラー」が当該文中の他の語と識別可能な態様で表示される。なお、本例では、上記のようなシソーラス展開処理も行っており、キーワード「カラー」の関連語である語「コピー」、「FAX」についても、検索文書中で同様に識別可能な態様で表示される。
したがって、ユーザが、画面表示された入力文書又は検索文書中のいずれかの語を選択すると、当該語が検索キーワード又は特徴語である場合には、他方の文書中の対応する語が識別可能に表示される。これにより、文中のどこに記載された何れの語によって検索処理がなされたかを一目で把握することができる。
図9には、上記のような関連文書検索による検索結果出力の更に他の例を示してある。
本例では、関連文書検索で検索された複数の検索文書の名称が文書表示処理手段7により候補リスト106として画面9に表示され、候補文書選択入力手段11によりユーザから当該リスト中の検索文書の選択を受け付けると、文書表示処理手段7が当該選択された検索文書を検索したキーワードに対応する語を入力文書中で、当該キーワードの検索文書における重みに応じた表示態様で表示する。
なお、本例では、複数の検索文書の候補を文書名で表示しているが、この他に、文書の作成日時、文書の要約等といった文書を特定し得る識別情報を表示するようにしてもよい。
図9に示す例では、検索文書リスト106に検索候補として「商品案内」、「商品開発企画」、「プレゼン資料(F社)」、「プレゼン資料(X社)」、「会議議事録」の4つの検索文書が表示され、ユーザがマウスカーソルを候補リスト106の中の例えば検索文書「商品開発企画」107に移動させると、検索文書107における検索キーワードのキーワード重みに応じた表示態様として入力文書中の対応する語が表示される。すなわち、検索文書107は入力文書中の語「カラー」、「コピー」、「買える」、「店」をキーワードとして検索され、これら語の検索文書107中における重みは各語の表示態様の強調度によって表現される。
したがって、検索された文書の候補をユーザが選択するだけで、当該選択された文書が入力文書中のどの語に基づき、且つ、当該語が検索分著をどの程度特徴付けているかを一目で把握することができる。
上記に示した関連文書検索の例では、入力文書の記述内容を特徴付ける特徴語を検索キーワードとして文書を検索しているが、他の方法を用いても検索することができる。
例えば、ベクトル空間モデルを用いて検索することができ、ベクトル空間モデルでは、文書が含む特徴語を次元とし、各次元の要素を対応する特徴語の当該文書における重みとしたベクトルで当該文書の特徴を表現し、2つの文書のベクトルの余弦を求めて余弦値が所定の範囲内にあることに基づいて、類似する文書同士を特定する。したがって、入力文書のベクトルとの余弦が所定の範囲内となるベクトルで表現された文書を、入力文書に関連する文書として検索することができる。なお、文書ベクトルの各次元に対応する要素として用いる重みは、例えば、当該文書のTF−IDF値を用いることができる。
本発明の一例に係る文書検索装置の機能構成図である。 本発明の一例に係る文書検索装置における検索文書の表示例を説明する図である。 本発明の一例に係る文書検索装置における濃淡スケールの設定例を説明する図である。 本発明の一例に係る文書検索装置における検索文書の表示例を説明する図である。 本発明の一例に係る文書検索装置における検索文書の表示例を説明する図である。 本発明の一例に係る文書検索装置におけるシソーラス辞書の設定例を説明する図である。 本発明の一例に係る文書検索装置における検索文書の表示例を説明する図である。 本発明の一例に係る文書検索装置における検索文書の表示例を説明する図である。 本発明の一例に係る文書検索装置における検索文書の表示例を説明する図である。
符号の説明
1:文書データベース、
2:シソーラス辞書、
3:濃淡スケール、
4:キーワード入力手段、
5:文書検索手段、
6:キーワード重み算出手段、
7:文書表示処理手段、
8:文書ランク表示処理手段
9:画面
10:キーワード選択入力手段
11:候補文書選択入力手段

Claims (2)

  1. 入力文書に関連する文書を文書データベースから検索し、当該検索された検索文書を表示する文書検索装置であって、
    入力文書の内容を特徴付ける特徴語を検索キーワードとして受け付けるキーワード受け付け手段と、
    前記検索キーワードに基づいて文書データベースから文書を検索する文書検索手段と、
    前記検索キーワードが前記検索文書の内容を特徴付ける重みをキーワード重みとして算出するキーワード重み算出手段と、
    前記検索文書が含む検索キーワードを当該検索文書におけるキーワード重みに応じた表示態様として前記検索文書を表示する検索文書表示処理手段と、
    を備え、更に、
    前記検索された複数の検索文書の候補を表示した中から検索文書の選択を受け付ける候補文書選択受け付け手段と、
    前記入力文書が含む検索キーワードを前記選択された検索文書におけるキーワード重みに応じた表示態様として前記入力文書を表示する入力文書表示処理手段と、
    を備えたことを特徴とする文書検索装置。
  2. コンピュータが実行することにより、入力文書に関連する文書を文書データベースから検索し、当該検索された検索文書を表示する文書検索装置を構成する文書検索プログラムであって、
    前記コンピュータに、
    入力文書の内容を特徴付ける特徴語を検索キーワードとして受け付けるキーワード受け付け機能と、
    前記検索キーワードに基づいて文書データベースから文書を検索する文書検索機能と、
    前記検索キーワードが前記検索文書の内容を特徴付ける重みをキーワード重みとして算出するキーワード重み算出機能と、
    前記検索文書が含む検索キーワードを当該検索文書におけるキーワード重みに応じた表示態様として前記検索文書を表示する表示処理機能と、
    を実現させ、更に、
    前記検索された複数の検索文書の候補を表示した中から検索文書の選択を受け付ける候補文書選択受け付け機能と、
    前記入力文書が含む検索キーワードを前記選択された検索文書におけるキーワード重みに応じた表示態様として前記入力文書を表示する入力文書表示処理機能と、
    実現させるための文書検索プログラム。
JP2005169203A 2005-06-09 2005-06-09 文書検索装置 Expired - Fee Related JP4640591B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005169203A JP4640591B2 (ja) 2005-06-09 2005-06-09 文書検索装置
US11/339,519 US7634473B2 (en) 2005-06-09 2006-01-26 Document retrieval apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005169203A JP4640591B2 (ja) 2005-06-09 2005-06-09 文書検索装置

Publications (2)

Publication Number Publication Date
JP2006344010A JP2006344010A (ja) 2006-12-21
JP4640591B2 true JP4640591B2 (ja) 2011-03-02

Family

ID=37525261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005169203A Expired - Fee Related JP4640591B2 (ja) 2005-06-09 2005-06-09 文書検索装置

Country Status (2)

Country Link
US (1) US7634473B2 (ja)
JP (1) JP4640591B2 (ja)

Families Citing this family (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP4640591B2 (ja) * 2005-06-09 2011-03-02 富士ゼロックス株式会社 文書検索装置
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP2008165303A (ja) * 2006-12-27 2008-07-17 Fujifilm Corp コンテンツ登録装置、及びコンテンツ登録方法、及びコンテンツ登録プログラム
JP2008171164A (ja) * 2007-01-11 2008-07-24 National Institute Of Information & Communication Technology 分類付与支援装置及び方法及びプログラム
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US7814107B1 (en) * 2007-05-25 2010-10-12 Amazon Technologies, Inc. Generating similarity scores for matching non-identical data strings
US8046372B1 (en) 2007-05-25 2011-10-25 Amazon Technologies, Inc. Duplicate entry detection system and method
US7908279B1 (en) 2007-05-25 2011-03-15 Amazon Technologies, Inc. Filtering invalid tokens from a document using high IDF token filtering
JP5186863B2 (ja) * 2007-09-28 2013-04-24 富士ゼロックス株式会社 画像集約装置及び画像集約プログラム
US20090144262A1 (en) * 2007-12-04 2009-06-04 Microsoft Corporation Search query transformation using direct manipulation
US7895225B1 (en) 2007-12-06 2011-02-22 Amazon Technologies, Inc. Identifying potential duplicates of a document in a document corpus
WO2009075771A1 (en) * 2007-12-12 2009-06-18 Packetvideo Corp. System and method for creating metadata
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
WO2010109594A1 (ja) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
JP5424393B2 (ja) * 2009-10-14 2014-02-26 Kddi株式会社 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5073874B2 (ja) * 2010-03-26 2012-11-14 楽天株式会社 ウェブサーバ装置、ウェブサーバプログラム、コンピュータ読み取り可能な記録媒体、及びウェブサービス方法
US8713021B2 (en) * 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8375022B2 (en) 2010-11-02 2013-02-12 Hewlett-Packard Development Company, L.P. Keyword determination based on a weight of meaningfulness
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8626682B2 (en) 2011-02-22 2014-01-07 Thomson Reuters Global Resources Automatic data cleaning for machine learning classifiers
US9292545B2 (en) 2011-02-22 2016-03-22 Thomson Reuters Global Resources Entity fingerprints
EP2678809A1 (en) * 2011-02-22 2014-01-01 Thomson Reuters Global Resources Entity fingerprints
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
JP4945015B2 (ja) * 2012-01-17 2012-06-06 三菱電機インフォメーションシステムズ株式会社 文書検索システム、文書検索プログラム、および文書検索方法
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
JP5530476B2 (ja) 2012-03-30 2014-06-25 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US10380554B2 (en) 2012-06-20 2019-08-13 Hewlett-Packard Development Company, L.P. Extracting data from email attachments
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR102698417B1 (ko) 2013-02-07 2024-08-26 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US10007897B2 (en) * 2013-05-20 2018-06-26 Microsoft Technology Licensing, Llc Auto-calendaring
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
JP5687312B2 (ja) * 2013-06-21 2015-03-18 株式会社Ubic デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
US9880994B1 (en) * 2013-06-21 2018-01-30 Nativo, Inc. Detecting compatible layouts for content-based native ads
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
JP5850973B2 (ja) * 2014-04-18 2016-02-03 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10049085B2 (en) 2015-08-31 2018-08-14 Qualtrics, Llc Presenting views of an electronic document
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
JP6340351B2 (ja) * 2015-10-05 2018-06-06 日本電信電話株式会社 情報検索装置、辞書作成装置、方法、及びプログラム
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10552539B2 (en) * 2015-12-17 2020-02-04 Sap Se Dynamic highlighting of text in electronic documents
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10482074B2 (en) * 2016-03-23 2019-11-19 Wipro Limited System and method for classifying data with respect to a small dataset
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10521503B2 (en) 2016-09-23 2019-12-31 Qualtrics, Llc Authenticating a respondent to an electronic survey
US10706735B2 (en) 2016-10-31 2020-07-07 Qualtrics, Llc Guiding creation of an electronic survey
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US11042659B2 (en) * 2017-07-06 2021-06-22 AO Kaspersky Lab System and method of determining text containing confidential data
JP7211214B2 (ja) * 2019-03-29 2023-01-24 株式会社ぐるなび 文書情報出力方法、プログラム及び文書情報出力装置
CN120898204A (zh) * 2023-11-22 2025-11-04 松下知识产权经营株式会社 检索装置以及控制方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776969B2 (ja) * 1986-04-18 1995-08-16 株式会社東芝 文書処理装置
JP3612769B2 (ja) * 1994-05-25 2005-01-19 富士ゼロックス株式会社 情報検索装置および情報検索方法
JP3606401B2 (ja) * 1995-11-30 2005-01-05 富士通株式会社 文書検索装置および方法
JPH10105555A (ja) * 1996-09-26 1998-04-24 Sharp Corp 対訳例文検索装置
JPH117453A (ja) * 1997-04-22 1999-01-12 Mitsubishi Electric Corp メディア情報推薦装置
JPH1173420A (ja) * 1997-08-28 1999-03-16 Sharp Corp 文書処理装置及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11250077A (ja) * 1998-02-27 1999-09-17 Minolta Co Ltd 情報処理装置、情報処理方法及び記録媒体
JP2004287827A (ja) * 2003-03-20 2004-10-14 Fuji Xerox Co Ltd 検索システム、プログラム、及び検索条件選択肢の提示方法
JP4162223B2 (ja) * 2003-05-30 2008-10-08 日本電信電話株式会社 自然文検索装置、その方法及びプログラム
JP4640591B2 (ja) * 2005-06-09 2011-03-02 富士ゼロックス株式会社 文書検索装置

Also Published As

Publication number Publication date
JP2006344010A (ja) 2006-12-21
US20060282415A1 (en) 2006-12-14
US7634473B2 (en) 2009-12-15

Similar Documents

Publication Publication Date Title
JP4640591B2 (ja) 文書検索装置
JP2960340B2 (ja) データ検索方法及び装置
EP2315135B1 (en) Document search system
JP3282937B2 (ja) 情報検索方法及びシステム
US8150859B2 (en) Semantic table of contents for search results
CN101884044B (zh) 使用直接操纵进行搜索查询变换
US7788261B2 (en) Interactive web information retrieval using graphical word indicators
US8983965B2 (en) Document rating calculation system, document rating calculation method and program
US20150186540A1 (en) Method for inputting and processing feature word of file content
US20070150456A1 (en) Search system and method
WO2008042752A1 (en) Method and system for identifying and displaying images in response to search queries
JP2009245041A (ja) 文書評価支援方法及びシステム
US20060015509A1 (en) Bookmark management apparatus for dynamic categorization
JP2003345829A (ja) 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JPH0934911A (ja) 情報検索装置
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JPH0581326A (ja) データベース検索装置
JPH09311805A (ja) 文書処理方法及び装置
JP4610543B2 (ja) 期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体
JP4713098B2 (ja) 選択項目表示装置、選択項目表示方法、および選択項目表示プログラム
JP2005115457A (ja) 文書ファイル検索方法
JP6707410B2 (ja) 文献検索装置、文献検索方法およびコンピュータプログラム
JPH11134363A (ja) 特許情報処理方法及び特許情報処理システム
JP5292873B2 (ja) 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体
JP3225735B2 (ja) 情報検索装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070928

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071024

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101013

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101117

R150 Certificate of patent or registration of utility model

Ref document number: 4640591

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees