JP4640591B2 - 文書検索装置 - Google Patents
文書検索装置 Download PDFInfo
- Publication number
- JP4640591B2 JP4640591B2 JP2005169203A JP2005169203A JP4640591B2 JP 4640591 B2 JP4640591 B2 JP 4640591B2 JP 2005169203 A JP2005169203 A JP 2005169203A JP 2005169203 A JP2005169203 A JP 2005169203A JP 4640591 B2 JP4640591 B2 JP 4640591B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- keyword
- weight
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
このような文書検索において、1つ又は複数の検索キーワードを利用して検索した場合、検索キーワードが検索された文書(検索文書)中のどのような位置で使用されているのかが判れば、検索文書中の検索キーワードに基づいて当該検索文書の必要性が判断しやすくなる。
このような要求に対処するため、検索文書中に検索キーワードを目立つようにハイライトして表示する方法が実用化されている。
また、類似語を検索文書中でハイライト表示するとともに、どの検索キーワードから展開されたのかを明らかにするため、類似語の下に検索キーワードを小さく表記する発明が提案されている(特許文献2参照。)。
しかしながら、文書に含まれる語の当該記述内容に対する重み(例えば、当該記述内容を特徴付ける程度)は同じ語にあっても文書毎に異なっており、検索された多数の文書を検索キーワードや類似語の重みに応じて整理付けることが、所望の文書を見付け出そうとするユーザにとって重要である。
すなわち、検索文書が多い場合、検索文書内で文書をスコアリングしてスコアの高い順に文書を列挙 (ランキング) することが重要となる。
例えば、複数の検索キーワードを用いて検索を行った場合、ユーザの目的によって各キーワード毎に重要度が異なる場合があり、検索キーワードの重要度に着目すると上記のようなランキング結果が当てはまらず、多数の検索文書内から所望の文書を見付け出す作業が煩雑となってしまう場合がある。
これにより、検索された文書毎に当該各文書が含むキーワードの重みが一目して判断できる態様で表示され、例えば、キーワード毎の重みに着目してこれら検索文書を選別する作業を容易に行うことができる。
例えば、基準値に応じて複数の背景色を用意しておき、算出されたキーワード重みに応じてキーワードに付加する背景色を決定するようにすれば、ユーザが当該背景色によってどの程度の重みがあるキーワードであるかを容易に判断することができる。
これにより、例えば、ユーザの検索の意図に応じた初期重みを複数の検索キーワードに対して異なる値で付加することで、ユーザにとって重要度の高い検索キーワードをより強調表示できるため、ユーザは所望する文書を容易に選別できるようになる。
なお、初期重みは、例えば、ユーザが検索キーワードに明示的に付加しても、検索キーワードの指定順序に基づいてキーワード入力手段が自動的に付加しても、予め検索キーワード毎に定められていてもよく、初期重みの付加方法は問わない。
これにより、シソーラス展開による文書検索においても、検索キーワードの関連語を各文書における重みに応じた態様で表示することができる。
なお、関連語とは、例えば、同義語、類似語、上位/下位の関係のある語、部分/全体の関係のある語など、語に関連性を有する語である。
特徴語としては、例えば、文書内における出現頻度が高い語、他の文書と比較して出現頻度が高い語、出現位置から見て重要な語(例えば、タイトルに使用)を用いることができる。
これにより、例えば、入力文書中で語を選択することにより、検索文書中の当該語に対応する検索キーワードが明確になり、入力文書と検索文書との検索キーワードによる関係を容易に把握することができる。
これにより、例えば、入力文書を閲覧している状態において当該入力文書に基づいて検索された複数の検索文書のリストが表示された場合、ユーザがリスト中の何れかの候補を指定することにより、当該指定された検索文書の検索に用いられた検索キーワードが入力文書中の何れの語であるか、更には、当該語の検索文書における重みを把握できる。
図1に、本発明に係る文書検索装置の機能構成を示している。
文書検索装置は、検索対象となる複数の文書が登録された文書データベース1と、語の関連語についての情報を保持するシソーラス辞書手段2と、検索キーワード重みに応じた表示態様を規定する濃淡スケール3と、論理式形式又は検索入力文形式で検索キーワードの入力を受け付けるキーワード入力手段4と、検索キーワードに基づいて文書データベース1から文書を検索する文書検索手段5と、検索された各文書について各文書毎に含まれる検索キーワードの重みを算出するキーワード重み算出手段6と、検索文書が含む検索キーワードを識別可能な表示態様として検索文書を表示する文書表示処理手段7と、検索文書をランク付けしてランキング表示する文書ランク表示手段8と、検索文書が表示される画面9と、を備えている。
キーワード入力手段4がユーザから検索キーワードを受け付けると、文書検索手段5が当該検索キーワードによって文書データベース1から該当する検索し、キーワード重み算出手段6が当該検索文書における検索キーワードのキーワード重みを算出する。そして、文書表示処理手段7がキーワード重みに応じて濃淡スケール3を参照して表示態様を決定し、検索キーワードを当該表示態様として検索文書を画面9に表示する。
なお、文書ランク表示手段8が、検索文書毎のキーワード重みの総和を算出し、当該総和値に応じてランク付けして画面9に検索された文書間のランキングを表示する。
キーワード入力手段4が検索キーワード21「カラー」を受け付け、文書検索手段5が検索キーワード21に基づいて文書データベース1から文書を検索して、検索キーワード21と同じ「カラー」を語22として含む文書Aと、検索キーワード21と同じ「カラー」を語23として含む文書Bを検索する。
文書表示処理手段7は、算出されたキーワード重みに基づいて濃淡スケール3を参照して語22、23の表示態様を決定し、語22、23を当該表示態様にして文書A、文書Bを画面9に表示する。
なお、本例では、画面9に複数の検索文書を並べて表示しているが、各文書を切り替えて画面9に表示するようにしてもよい。
これによって、検索キーワードに該当する語22と語23とは同じ語「カラー」であるが、語22が語23より強調表示されているため、文書Aが文書Bより検索キーワード21に関する重みが大きいことが表示態様に把握できる。すなわち、本例では、文書Aの方が語「カラー」によって文書内容の特徴が表現されていることがわかる。
キーワード入力手段4が検索キーワード41「カラー」、検索キーワード42「コピー」を受け付け、文書検索手段5が検索キーワード41、42に基づいて文書データベース1から文書を検索して、検索キーワード41、42と同じ語を語43、44として含む文書Aと、検索キーワード41、42と同じ語を語45、46として含む文書Bを検索する。
この場合も、検索キーワードが単数の場合と同様に、各語のキーワード重みを算出して対応する表示態様を決定し、語43、44を各キーワード重みに対応する表示態様として文書Aを表示し、語45、46を各キーワード重みに対応する表示態様として文書Bを表示する。
したがって、上記のように、文書Aでは語「カラー」の方が語「コピー」より強調して表示され、文書Bでは語「コピー」の方が語「カラー」より強調して表示され、同じ語であっても文書毎に表示態様が異なることにより、各語の各文書における重みを一目して判別することができる。
これにより、多数の文書が検索された場合でも、ランク付け処理を実行することにより、検索キーワードの関連度の大きい文書を容易に見付け出すことができる。
例えば、上記の例において、各語の基準重みを“1”とすると、ランク付け処理では、文書Aでは検索キーワード「カラー」及び「コピー」の重みの総和は“3”となり、文書Bでは検索キーワード「カラー」及び「コピー」の重みの総和は“3”となって、両文書のランク付けは等しくなる。
このため、例えば、ユーザが2つの検索キーワードの内のいずれかをより重要と考えている場合には、当該重要とするキーワードが大きく強調されている文書を見付けるといった作業を行うことで、検索文書群から所望の文書を容易に見出すことができる。
なお、シソーラス辞書手段2は、語に関連する関連語と、当該関連する度合いを示す関連度が設定されており、図6に例示するように、語「カラー」に関連度「0.4」で関連する関連語「プリンタ」と、語「カラー」に関連度「0.3」で関連する関連語「コピー」と、語「カラー」に関連度「0.8」で関連する関連語「色」とが設定されている。
本例においては、検索キーワードの関連語の各検索文書における出現頻度に当該関連語に対する関連度を乗じて重みを算出しており、文書Aにおいて語「プリンタ」は1回出現しており語「カラー」との関連度は0.4であるため重みは0.4となり、語「コピー」の重みは0.3となる。同様に、文書Bにおいて語「プリンタ」の重みは0.4、語「色」の重みは0.8となる。
したがって、シソーラス展開された関連語を用いた文書検索においても、展開前の検索キーワードと関連語が特定の表示態様で表示されるため、検索文書を検索した根拠を容易に把握することができる。これに加えて、関連語の表示態様はその関連度を加味した度合いとされるため、展開前の検索キーワードは関連語に比してより一層強調された表示態様となり、本来の検索根拠である検索キーワードに重きをおいた表示態様とされる。
図7に画面9の表示例を示すように、キーワード入力手段4が入力文書を受け付けると、当該入力文が画面9の左側に表示され、文書検索手段5が入力文書中の特徴語(「安」、「新宿」、「店」、「カラー」、「コピー」、「機」)を検索キーワードとして検索し、同図の右側に示すように検索された文書を表示する。この検索文書の表示し際して、キーワード重み算出手段6が検索文書中の検索キーワードに対応する語「安」、「新宿」、「店」、「カラー」、「コピー」、「機」のキーワード重みを算出し、文書表示処理手段7が検索文書中の各検索キーワードに対応する語をキーワード重みに応じた表示態様として画面9に表示するとともに、入力文書中の各検索キーワードについても検索文書におけるキーワード重みに応じた表示態様として画面9に表示する。
ここで、入力文書中の特徴語は、例えば、キーワード入力手段4が、入力文書を形態素解析し、得られた語についてTF−IDFにより当該入力文書の記述内容を特徴付けるとみなされる上位幾つかの語を採用することで選択される。
本例では、文書検索装置に備えられたキーワード選択入力手段10により、ユーザが、画面9に表示された入力文書又は検索文書のいずれか一方の文書から検索キーワードを選択すると、文書表示処理手段7は他方の文書のうちの選択された検索キーワードに対応する語を区別可能な表示態様として表示する。
したがって、ユーザが、画面表示された入力文書又は検索文書中のいずれかの語を選択すると、当該語が検索キーワード又は特徴語である場合には、他方の文書中の対応する語が識別可能に表示される。これにより、文中のどこに記載された何れの語によって検索処理がなされたかを一目で把握することができる。
本例では、関連文書検索で検索された複数の検索文書の名称が文書表示処理手段7により候補リスト106として画面9に表示され、候補文書選択入力手段11によりユーザから当該リスト中の検索文書の選択を受け付けると、文書表示処理手段7が当該選択された検索文書を検索したキーワードに対応する語を入力文書中で、当該キーワードの検索文書における重みに応じた表示態様で表示する。
なお、本例では、複数の検索文書の候補を文書名で表示しているが、この他に、文書の作成日時、文書の要約等といった文書を特定し得る識別情報を表示するようにしてもよい。
したがって、検索された文書の候補をユーザが選択するだけで、当該選択された文書が入力文書中のどの語に基づき、且つ、当該語が検索分著をどの程度特徴付けているかを一目で把握することができる。
例えば、ベクトル空間モデルを用いて検索することができ、ベクトル空間モデルでは、文書が含む特徴語を次元とし、各次元の要素を対応する特徴語の当該文書における重みとしたベクトルで当該文書の特徴を表現し、2つの文書のベクトルの余弦を求めて余弦値が所定の範囲内にあることに基づいて、類似する文書同士を特定する。したがって、入力文書のベクトルとの余弦が所定の範囲内となるベクトルで表現された文書を、入力文書に関連する文書として検索することができる。なお、文書ベクトルの各次元に対応する要素として用いる重みは、例えば、当該文書のTF−IDF値を用いることができる。
2:シソーラス辞書、
3:濃淡スケール、
4:キーワード入力手段、
5:文書検索手段、
6:キーワード重み算出手段、
7:文書表示処理手段、
8:文書ランク表示処理手段
9:画面
10:キーワード選択入力手段
11:候補文書選択入力手段
Claims (2)
- 入力文書に関連する文書を文書データベースから検索し、当該検索された検索文書を表示する文書検索装置であって、
入力文書の内容を特徴付ける特徴語を検索キーワードとして受け付けるキーワード受け付け手段と、
前記検索キーワードに基づいて文書データベースから文書を検索する文書検索手段と、
前記検索キーワードが前記検索文書毎の内容を特徴付ける重みをキーワード重みとして算出するキーワード重み算出手段と、
前記検索文書が含む検索キーワードを当該検索文書におけるキーワード重みに応じた表示態様として前記検索文書を表示する検索文書表示処理手段と、
を備え、更に、
前記検索された複数の検索文書の候補を表示した中から検索文書の選択を受け付ける候補文書選択受け付け手段と、
前記入力文書が含む検索キーワードを前記選択された検索文書におけるキーワード重みに応じた表示態様として前記入力文書を表示する入力文書表示処理手段と、
を備えたことを特徴とする文書検索装置。 - コンピュータが実行することにより、入力文書に関連する文書を文書データベースから検索し、当該検索された検索文書を表示する文書検索装置を構成する文書検索プログラムであって、
前記コンピュータに、
入力文書の内容を特徴付ける特徴語を検索キーワードとして受け付けるキーワード受け付け機能と、
前記検索キーワードに基づいて文書データベースから文書を検索する文書検索機能と、
前記検索キーワードが前記検索文書毎の内容を特徴付ける重みをキーワード重みとして算出するキーワード重み算出機能と、
前記検索文書が含む検索キーワードを当該検索文書におけるキーワード重みに応じた表示態様として前記検索文書を表示する表示処理機能と、
を実現させ、更に、
前記検索された複数の検索文書の候補を表示した中から検索文書の選択を受け付ける候補文書選択受け付け機能と、
前記入力文書が含む検索キーワードを前記選択された検索文書におけるキーワード重みに応じた表示態様として前記入力文書を表示する入力文書表示処理機能と、
を実現させるための文書検索プログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005169203A JP4640591B2 (ja) | 2005-06-09 | 2005-06-09 | 文書検索装置 |
| US11/339,519 US7634473B2 (en) | 2005-06-09 | 2006-01-26 | Document retrieval apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005169203A JP4640591B2 (ja) | 2005-06-09 | 2005-06-09 | 文書検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006344010A JP2006344010A (ja) | 2006-12-21 |
| JP4640591B2 true JP4640591B2 (ja) | 2011-03-02 |
Family
ID=37525261
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005169203A Expired - Fee Related JP4640591B2 (ja) | 2005-06-09 | 2005-06-09 | 文書検索装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US7634473B2 (ja) |
| JP (1) | JP4640591B2 (ja) |
Families Citing this family (148)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
| JP4640591B2 (ja) * | 2005-06-09 | 2011-03-02 | 富士ゼロックス株式会社 | 文書検索装置 |
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| JP2008165303A (ja) * | 2006-12-27 | 2008-07-17 | Fujifilm Corp | コンテンツ登録装置、及びコンテンツ登録方法、及びコンテンツ登録プログラム |
| JP2008171164A (ja) * | 2007-01-11 | 2008-07-24 | National Institute Of Information & Communication Technology | 分類付与支援装置及び方法及びプログラム |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US7814107B1 (en) * | 2007-05-25 | 2010-10-12 | Amazon Technologies, Inc. | Generating similarity scores for matching non-identical data strings |
| US8046372B1 (en) | 2007-05-25 | 2011-10-25 | Amazon Technologies, Inc. | Duplicate entry detection system and method |
| US7908279B1 (en) | 2007-05-25 | 2011-03-15 | Amazon Technologies, Inc. | Filtering invalid tokens from a document using high IDF token filtering |
| JP5186863B2 (ja) * | 2007-09-28 | 2013-04-24 | 富士ゼロックス株式会社 | 画像集約装置及び画像集約プログラム |
| US20090144262A1 (en) * | 2007-12-04 | 2009-06-04 | Microsoft Corporation | Search query transformation using direct manipulation |
| US7895225B1 (en) | 2007-12-06 | 2011-02-22 | Amazon Technologies, Inc. | Identifying potential duplicates of a document in a document corpus |
| WO2009075771A1 (en) * | 2007-12-12 | 2009-06-18 | Packetvideo Corp. | System and method for creating metadata |
| US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
| US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
| US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
| US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
| WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
| WO2010109594A1 (ja) * | 2009-03-24 | 2010-09-30 | 三菱電機インフォメーションシステムズ株式会社 | 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法 |
| US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
| US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
| US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
| US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
| US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
| JP5424393B2 (ja) * | 2009-10-14 | 2014-02-26 | Kddi株式会社 | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 |
| US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
| US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
| JP5073874B2 (ja) * | 2010-03-26 | 2012-11-14 | 楽天株式会社 | ウェブサーバ装置、ウェブサーバプログラム、コンピュータ読み取り可能な記録媒体、及びウェブサービス方法 |
| US8713021B2 (en) * | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
| US8375022B2 (en) | 2010-11-02 | 2013-02-12 | Hewlett-Packard Development Company, L.P. | Keyword determination based on a weight of meaningfulness |
| US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
| US8626682B2 (en) | 2011-02-22 | 2014-01-07 | Thomson Reuters Global Resources | Automatic data cleaning for machine learning classifiers |
| US9292545B2 (en) | 2011-02-22 | 2016-03-22 | Thomson Reuters Global Resources | Entity fingerprints |
| EP2678809A1 (en) * | 2011-02-22 | 2014-01-01 | Thomson Reuters Global Resources | Entity fingerprints |
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
| JP4945015B2 (ja) * | 2012-01-17 | 2012-06-06 | 三菱電機インフォメーションシステムズ株式会社 | 文書検索システム、文書検索プログラム、および文書検索方法 |
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
| US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
| JP5530476B2 (ja) | 2012-03-30 | 2014-06-25 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
| US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
| US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
| US10380554B2 (en) | 2012-06-20 | 2019-08-13 | Hewlett-Packard Development Company, L.P. | Extracting data from email attachments |
| US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
| US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
| US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
| KR102698417B1 (ko) | 2013-02-07 | 2024-08-26 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
| US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
| AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
| WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
| US10007897B2 (en) * | 2013-05-20 | 2018-06-26 | Microsoft Technology Licensing, Llc | Auto-calendaring |
| US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
| WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
| KR101959188B1 (ko) | 2013-06-09 | 2019-07-02 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
| JP5687312B2 (ja) * | 2013-06-21 | 2015-03-18 | 株式会社Ubic | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム |
| US9880994B1 (en) * | 2013-06-21 | 2018-01-30 | Nativo, Inc. | Detecting compatible layouts for content-based native ads |
| US10791216B2 (en) | 2013-08-06 | 2020-09-29 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
| JP5850973B2 (ja) * | 2014-04-18 | 2016-02-03 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
| US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
| US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
| US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
| US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
| US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
| US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
| US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
| US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
| US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
| US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
| US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
| US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
| US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
| US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
| US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
| US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
| US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
| US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
| US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
| US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
| US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
| US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
| US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
| US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
| US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
| US10049085B2 (en) | 2015-08-31 | 2018-08-14 | Qualtrics, Llc | Presenting views of an electronic document |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
| US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
| US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| JP6340351B2 (ja) * | 2015-10-05 | 2018-06-06 | 日本電信電話株式会社 | 情報検索装置、辞書作成装置、方法、及びプログラム |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
| US10552539B2 (en) * | 2015-12-17 | 2020-02-04 | Sap Se | Dynamic highlighting of text in electronic documents |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
| US10482074B2 (en) * | 2016-03-23 | 2019-11-19 | Wipro Limited | System and method for classifying data with respect to a small dataset |
| US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
| US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
| DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
| US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
| US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
| DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| US10521503B2 (en) | 2016-09-23 | 2019-12-31 | Qualtrics, Llc | Authenticating a respondent to an electronic survey |
| US10706735B2 (en) | 2016-10-31 | 2020-07-07 | Qualtrics, Llc | Guiding creation of an electronic survey |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
| DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| US11042659B2 (en) * | 2017-07-06 | 2021-06-22 | AO Kaspersky Lab | System and method of determining text containing confidential data |
| JP7211214B2 (ja) * | 2019-03-29 | 2023-01-24 | 株式会社ぐるなび | 文書情報出力方法、プログラム及び文書情報出力装置 |
| CN120898204A (zh) * | 2023-11-22 | 2025-11-04 | 松下知识产权经营株式会社 | 检索装置以及控制方法 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0776969B2 (ja) * | 1986-04-18 | 1995-08-16 | 株式会社東芝 | 文書処理装置 |
| JP3612769B2 (ja) * | 1994-05-25 | 2005-01-19 | 富士ゼロックス株式会社 | 情報検索装置および情報検索方法 |
| JP3606401B2 (ja) * | 1995-11-30 | 2005-01-05 | 富士通株式会社 | 文書検索装置および方法 |
| JPH10105555A (ja) * | 1996-09-26 | 1998-04-24 | Sharp Corp | 対訳例文検索装置 |
| JPH117453A (ja) * | 1997-04-22 | 1999-01-12 | Mitsubishi Electric Corp | メディア情報推薦装置 |
| JPH1173420A (ja) * | 1997-08-28 | 1999-03-16 | Sharp Corp | 文書処理装置及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
| JPH11250077A (ja) * | 1998-02-27 | 1999-09-17 | Minolta Co Ltd | 情報処理装置、情報処理方法及び記録媒体 |
| JP2004287827A (ja) * | 2003-03-20 | 2004-10-14 | Fuji Xerox Co Ltd | 検索システム、プログラム、及び検索条件選択肢の提示方法 |
| JP4162223B2 (ja) * | 2003-05-30 | 2008-10-08 | 日本電信電話株式会社 | 自然文検索装置、その方法及びプログラム |
| JP4640591B2 (ja) * | 2005-06-09 | 2011-03-02 | 富士ゼロックス株式会社 | 文書検索装置 |
-
2005
- 2005-06-09 JP JP2005169203A patent/JP4640591B2/ja not_active Expired - Fee Related
-
2006
- 2006-01-26 US US11/339,519 patent/US7634473B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006344010A (ja) | 2006-12-21 |
| US20060282415A1 (en) | 2006-12-14 |
| US7634473B2 (en) | 2009-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4640591B2 (ja) | 文書検索装置 | |
| JP2960340B2 (ja) | データ検索方法及び装置 | |
| EP2315135B1 (en) | Document search system | |
| JP3282937B2 (ja) | 情報検索方法及びシステム | |
| US8150859B2 (en) | Semantic table of contents for search results | |
| CN101884044B (zh) | 使用直接操纵进行搜索查询变换 | |
| US7788261B2 (en) | Interactive web information retrieval using graphical word indicators | |
| US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
| US20150186540A1 (en) | Method for inputting and processing feature word of file content | |
| US20070150456A1 (en) | Search system and method | |
| WO2008042752A1 (en) | Method and system for identifying and displaying images in response to search queries | |
| JP2009245041A (ja) | 文書評価支援方法及びシステム | |
| US20060015509A1 (en) | Bookmark management apparatus for dynamic categorization | |
| JP2003345829A (ja) | 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム | |
| JPH0934911A (ja) | 情報検索装置 | |
| JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
| JPH0581326A (ja) | データベース検索装置 | |
| JPH09311805A (ja) | 文書処理方法及び装置 | |
| JP4610543B2 (ja) | 期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体 | |
| JP4713098B2 (ja) | 選択項目表示装置、選択項目表示方法、および選択項目表示プログラム | |
| JP2005115457A (ja) | 文書ファイル検索方法 | |
| JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
| JPH11134363A (ja) | 特許情報処理方法及び特許情報処理システム | |
| JP5292873B2 (ja) | 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体 | |
| JP3225735B2 (ja) | 情報検索装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070928 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071024 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080317 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100805 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101013 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101013 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101104 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101117 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4640591 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |