JP2000315216A - 自然言語検索方法および装置 - Google Patents

自然言語検索方法および装置

Info

Publication number
JP2000315216A
JP2000315216A JP2000056396A JP2000056396A JP2000315216A JP 2000315216 A JP2000315216 A JP 2000315216A JP 2000056396 A JP2000056396 A JP 2000056396A JP 2000056396 A JP2000056396 A JP 2000056396A JP 2000315216 A JP2000315216 A JP 2000315216A
Authority
JP
Japan
Prior art keywords
data
units
matching
natural language
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000056396A
Other languages
English (en)
Other versions
JP2000315216A5 (ja
Inventor
David Elworthy
エルワーシー デビット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2000315216A publication Critical patent/JP2000315216A/ja
Publication of JP2000315216A5 publication Critical patent/JP2000315216A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3341Query execution using boolean model
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 (修正有) 【課題】自然言語による質問を使用して検索を実行する
情報検索システムにおいて、ユーザが簡単に検索結果を
理解できるように、付加情報を提供する。 【解決手段】パーサー2は、質問入力デバイス1aから
質問を受け取って、意味及び統語上の情報を生成すると
共に、検索されるべきデータベース3からの情報を統語
解析し、データの2つの集合を生成する。突き合わせエ
ンジン4は、パーサーからの意味及び統語上の情報を使
用してこれらを突き合わせる。文脈生成エンジン5はこ
のデータを受け取り、記憶デバイス6から言語関係のデ
ータを受け取って、合致したデータのための文脈データ
を生成する。文脈収集エンジン7は文脈データから階層
的索引構造を生成する。この構造を用いて、データベー
スから検索されたデータを文脈データに従って配列し、
データ出力デバイス1bによりユーザに提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般的に、自然言語
質問(query)を使用して自然言語を含む情報の検索を
実行するための方法と装置に関するものである。本発明
は特に、自然言語質問に対する最良の適合物に、文脈(c
ontext)情報を提供する方法と装置に関するものであ
る。
【0002】
【従来の技術】ほとんどの情報検索システムは情報を見
つけることはきわめて得意であるが、その結果をユーザ
ーに示すのは苦手である。典型的には、結果は文書或い
は文書の見出しの簡単なリストとして、時には関連性値
(relevance score)を伴って表示される。いくつかの
ウェブ検索エンジンはこの点を、例えば同じサイトから
のページを一緒にまとめることにより改善しようと試み
ている。ユーザーにとっては結果のリストを有効に活用
することは難しい、なぜならば結果のリストは、文書が
お互いに、そして元の質問に対しどのように関係してい
るかを表示していないからである。
【0003】情報検索システムは言語質問を使用して様
々な方法で情報を検索することが可能である。最も簡単
で最も一般的なのはキーワードの使用である。キーワー
ドは、ブーリアン・ロジックまたは統計学的なテクニッ
クを用いて、質問を形成するために結合させることが可
能である。S.フランク(S Flank)の"NLPに基づい
た情報検索に対する階層的アプローチ"(コンピュータ
言語学協会第36回年次総会議事録、397頁、1998年)と
題された記述より、自然言語入力は検索エンジンの特定
のブーリアン・ロジック質問に翻訳されることが可能で
ある、ということもまた知られている。しかしながら、
そのようなテクニックは自然言語質問のなかで得られる
統語上の情報から恩恵を受けていない。そのような情報
は、統語解析(parsing)のある種の形により、質問と
情報の構造を開拓することによってのみ利用可能であ
る。
【0004】自然言語質問から統語上の情報を利用して
の情報の検索は、多くの従来の技術のシステムにより達
成されてきた。J.フェイガン(J Fagans)の"文書検
索のための自動成句索引付けにおける実験:統語的と非
統語的方法の比較"(コーネル大学博士論文、テクニカ
ルレポートTR87−868)と題された博士論文の中で述
べられているシステムは、自動統語解析機(アナライザ
ー)により生成された解析木から句を選択的に抽出する
ための拡張句構造規則を使用する。
【0005】自然言語処理に基づいた情報検索はまた、
先に参照されたフランクの論文のなかにも開示されてい
る。この論文で述べられている技術は名詞句統語分析を
使用している。
【0006】情報検索の別の方法は、C.シュワルツの
(C Schwartz)"自由文の自動統語分析"(全米情報学学
会、1990年9月、408頁から417頁)と題された論文中に
開示されている。シュワルツにより開示された技術で
は、名詞句は質問の中と情報の中の自然言語文において
認識され、それらは文の統語解析のために選択される。
統語解析された名詞句は正規化され、その意味表現構造
は標準或いは共通の従属構造に割り付けられる。同一の
径路(path)と節点(node)を認識するために、正規化
された意味表現構造の簡単な比較により名詞句突き合わ
せが実行される。
【0007】情報の検索における自然言語質問からの統
語上の情報の使用はより正確な検索技術を提供する一方
で、検索の結果をどのように提示するかの問題は全く解
決しない。検索の結果は、文書がお互いに或いは元の質
問に対してどのように関係しているかについて何の情報
も持たない、質問に対するひとつまたは複数の最良の適
合物であるにすぎない。
【0008】
【発明が解決しようとする課題】本発明の目的は、文脈
内において検索の結果を与えるために、統語上の情報を
使用することによりこの問題に対処することにある。
【0009】
【課題を解決するための手段】本発明の或る形態によれ
ば、自然言語の単位の形態のデータを検索するための、
検索エンジンが提供される。入力質問は、最良の適合物
を認識するために、そして質問の中と情報の集合の中の
どの言葉が適合するのかを認識するために、複数の利用
できる情報の集合に突き合わせられる。多数の最良適合
物のために、質問の中および/または情報の集合の中で
不適合とされた単位は、文脈データを形成するために使
用される。文脈データはひとつ或いはもっと多くの質問
および/または情報の集合の不適合単位からなり、それ
ぞれが適合単位のひとつに対して予め定義された統語上
の関係を持つ。データ出力はこのように、適合単位と、
適合単位に対して言語関係を持つ不適合単位とからな
る。この付加された文脈情報により、検索エンジンのユ
ーザーは適合しているものを認識するだけでなく、それ
が適合している文脈を認識することが可能である。これ
は、ユーザーがもっと簡単に検索の結果を理解すること
を可能にする、より豊富な情報を提供する。
【0010】本発明の文脈内においては、自然言語デー
タは、その間に言語関係を持つ一連の自然言語の単位か
らなる。
【0011】突き合わせ技術は簡単なキーワード突き合
わせ技術により構成することが可能である。これは簡単
という利点があるが、突き合わせ処理を改善するために
利用できる統語上の情報からの恩恵を受けていない。も
しキーワード検索が使用されるのであれば、文脈データ
を形成するために使用された統語上の情報は、突き合わ
せ処理の前または後のどちらかで統語解析演算により決
定可能である。
【0012】入力質問の中と情報の集合の中で入手でき
る統語上の情報を利用するために、好ましくは、質問と
情報の集合は統語解析され、突き合わせは適合物を決定
するために質問と情報の集合の統語上の構造を考慮に入
れる。
【0013】突き合わせにおいて使用される統語上の情
報のレベルは、先に参照したようなフランクやフェイガ
ンによる論文のなかで使用されているような簡単な関連
性のある単語のペアであればよく、或いは1999年9月20
日にファイルされた本出願人の同時係属中の欧州出願番
号99307422.8に記述されているような単語間の意味上の
関係の完全な集合であってもよい。
【0014】統語上の情報を得るために、使用されるパ
ーサーはどのような形態でもよい。例えば、従属性パー
サーは、GB-A-2269923、EP-A-0737928、T.ヤルビネン
(T Jarvinen)とP.タパナイネン(P Tapanainen)によ
る"英語のための従属性パーサー"(テクニカルレポート
No. TR-1、一般言語学部、ヘルシンキ大学、1997年3
月)と題された論文、およびP.タパナイネンとT.ヤルビ
ネンによる"非客観的従属性パーサー"(第5回応用自然
言語処理会議の議事録、ワシントンDC、1997年4月、コ
ンピュータ言語協会)と題された論文に開示されてい
る。従属性パーサーは、単語の意味表現及びそれらの間
の連結(link)から構成されている意味データを生成す
るために、自然言語を統語解析する。連結は、どの意味
表現が他の意味表現の意味を修飾しているかを示し、そ
の連結と連結の型は自然言語の文法に関連して決定され
る。
【0015】本発明の実施形態は、本出願人により、19
99年3月1日に出願された英国特許出願番号9904663.3の
優先権を主張して出願された "自然言語入力データから
プロセッサ使用可能データを生成する装置と方法"と題
された同時係属中の出願に述べられているような、従属
性分析技術を用いた有限状態パーサーの出力を使用す
る。
【0016】検索技術は、多くの異なるタイプの情報の
検索に応用できる。例えば、自然言語質問は文書データ
を検索するのに使用可能である。この場合、自然言語質
問は文書の内容と直接比較されてもよいし、或いは突き
合わせ作業を実行するために文書の要約と比較されても
よい。検索技術はまた非テキストデータの検索にも応用
できる。そのようなデータは、メタデータの形式で自然
言語のキャプションを必要とする。例えば、画像に対し
て画像の内容を示した表題が与えられている画像データ
ベースから画像を検索するために、自然言語質問はデー
タベースの中のデータに対する最良の適合物、または複
数の適合物を得るために、データベースを検索するため
に使用可能である。
【0017】本発明の文脈データは、それぞれが適合ユ
ニットのひとつに対して予め定義された言語上の関係を
持つ、一つまたはそれより多くの不適合ユニットからな
る。実施形態においては、この関係はユニット間の修飾
関係からなる。この情報は従属性パーサーから得られ
る。この実施形態の文脈データの生成は、適合ユニット
と不適合ユニットの間の文脈的に重要な修飾関係を定義
するひとつまたはそれより多くの規則に従って達成され
る。そのように、規則は出力されるべき文脈情報の種類
を定義する。
【0018】より一般的には、ある実施形態において
は、本発明の文脈データは、文脈データの形成のため統
語上または意味上の制約を含むひとつまたはそれより多
くの規則を使用して生成される。
【0019】本発明のある実施形態においては、生成さ
れた文脈データは単なる出力ではなく、検索の結果の構
成に使用される。検索結果はこのように文脈データに従
って配列された、入力質問に対する最良の適合物からな
る情報の集合である。この配列は、索引が統語上の関係
に従って層になっている索引の階層的配列の形態をとる
ことが可能である。この索引は文脈データの適合と不適
合の単語からなる。この実施形態により、ユーザーはよ
り簡単に検索より得られた適合物の間の重要性と関係を
把握することが可能である。
【0020】入力質問に対する最良の適合物として得ら
れた所望のデータは、ユーザーにこの検索がなぜこの特
定のデータを見つけ出したかを認識させることを可能に
するための、これに関連する文脈情報と一緒に出力され
るので、本発明はまた高度のデータ検索システムを用意
する。
【0021】本発明は、多目的コンピュータ上のソフト
ウェアの動作により実行可能である。本発明はそのよう
に、フロッピー(登録商標)ディスク、光学ディスク、
磁気テープ、またはプログラム可能なメモリデバイス、
のような記憶媒体上に与えられたコンピュータプログラ
ムにより実施される。さらに、コンピュータプログラム
はインターネットのようなネットワークを介して送信可
能なので、本発明はコンピュータコードを運ぶ信号とし
て実施可能である。
【0022】
【発明の実施の形態】本発明の実施形態は添付の図面を
参照して説明する。
【0023】先ず、本発明の第1の実施形態を図1から
図5を参照しながら以下に説明する。
【0024】図1は本発明の一実施形態の機能上のユニ
ットを示す図である。インターフェース1はユーザーが
データを入力し文脈(context)データを含む出力デー
タを受け取るために設けられている。このインターフェ
ースはユーザーに質問(query)を入力させるためのデ
バイス1aを含む。インターフェース1はまた、ユーザ
ーに、質問と検索されたデータの間の関係と検索された
データ間の関係をより簡単に理解させることを可能にす
る、検索データと文脈データの出力のための出力デバイ
ス1bを含む。
【0025】パーサー(parser)2は、質問入力デバイ
ス1aから入力質問を受け取って、意味上および統語上
の情報を生成するために設けられている。パーサー2は
また検索されるべきデータベース3からの情報を統語解
析する。パーサー2はそのように、統語解析されたデー
タを突き合わせるための突き合わせエンジン4へ送られ
る統語解析されたデータの2つの集合を生成する。この
実施形態の突き合わせエンジン4は、パーサー2からの
意味上および統語上の両方の情報を使用して突き合わせ
を実行する。意味上および統語上の情報の使用はより正
確な突き合わせ技術を提供する。
【0026】文脈生成エンジン5は突き合わせエンジン
4からデータを受け取り、また記憶デバイス6から言語
関係のデータを受け取る。文脈生成エンジン5は、言語
関係データに従って、合致したデータ(matched data)
のための文脈データを生成する。文脈収集エンジン7は
文脈データを受け取り、これを階層的索引構造を生成す
るために使用する。この構造はデータベース3から検索
されたデータを、文脈データに従って配列されるよう
に、系統立てるのに使用される。文脈データに従って配
列された最良合致データは、次にユーザーへの提示のた
めにデータ出力デバイス1bに送られる。
【0027】図2は、本発明を実行するためにプログラ
ムされた多目的コンピュータからなる、本発明の実施形
態を概要的に図示している。コンピュータの様々な構成
要素がコンピュータバス14により連結されて図示され
ている。ディスプレイデバイス10は検索結果と文脈デ
ータを出力するために設けられている。プロセッサ11
が設けられ、これは図1における機能として図示された
突き合わせエンジン11a、文脈データ生成および収集
エンジン11bそしてパーサー11Cの機能を果たすため
のソフトウェアを実行する。読み出し専用メモリー(RO
M)12が設けられ、これはコンピュータのBIOS(Basic
I/O System)を有する。ランダムメモリー(RAM)13か
らなるワーキングメモリーは、プログラムの実行中にプ
ロセッサにより使用されるために設けられている。キー
ボード17はユーザーによる質問の入力のために設けら
れている。ハードディスクドライブのような記憶デバイ
ス15はコンピュータのプログラムやデータを記憶する
ために設けられている。コンピュータプログラムはコン
ピュータのオペレーティングシステム、プロセッサ11
にパーサー11cを実行させるための統語解析プログラ
ムコード、プロセッサ11に突き合わせエンジン11a
を実行させるための突き合わせプログラムコード、プロ
セッサに文脈データ生成および収集エンジン11bを実
行させるための文脈生成および収集プログラムコードを
含む。記憶デバイス15に記憶されたデータは、パーサ
ー11cの実行のための統語解析プログラムにより要求
されたパーサーデータ、突き合わせエンジン11aを実
行するための突き合わせプログラムにより使用するため
の突き合わせデータ、そして文脈データ生成および収集
エンジン11bを実行するための文脈データ生成および
収集プログラムにより使用するための言語関係データを
有する。
【0028】データベース16もまた設けられ、図1の
データベース3を構成する。このデータベースは検索に
より見つけ出されるはずのデータの集合を含む。
【0029】コミュニケーションインターフェース18
は、ローカルエリアネットワークあるいはインターネッ
トのようなネットワークにコンピュータをインターフェ
ースするために設けられている。このようにこの実施形
態ではデータベース16はコンピュータの内部にあるよ
うに示されているが、データベースは離れて存在しネッ
トワークを通じてアクセスするものであってもよい。本
発明のこの実施形態の一般的な動作は図3を参照しなが
ら以下に説明されるであろう。
【0030】ステップS1ではユーザーが自然言語質問
を入力する。この入力質問は次にステップS2で統語解析
される。ステップS3では検索されるデータベースの参照
データの集合が選択され統語解析される。この実施形態
のパーサーは、従属解析演算を実行する有限状態パーサ
ーからなる。一般的に有限状態パーサーはよく知られて
おり、実行の詳細は本発明の説明にとっては重要ではな
い。特定の実行形態については、"自然言語入力データ
からプロセッサ使用可能データを生成するための装置と
方法"と題された同時係属中の出願に開示されている。
【0031】統語解析された質問と参照データの集合は
次にステップS4において合致する言語上の単位を認識す
るために突き合わせが実行される。言語上の単位は単語
あるいは"ホワイトハウス"のような複合語のような語彙
ユニットからなり得る。実行される突き合わせ処理は本
出願人の先願である欧州出願番号 99307422.8.に説明さ
れているプロセスに従う。
【0032】ステップS6において、突き合わせステップ
の結果として合致する単語があるかどうかが決定され
る。もしそうでなければ、ステップS7において参照デー
タの集合の中の質問間に合致する単語がないので、合致
するであろう参照データの集合がもっとあるかどうかが
次に決定される。もしそうであれば、プロセスはステッ
プS3に戻り、そうでなければ、ステップS8においてメモ
リに記憶されたあらゆる文脈データの出力とともにプロ
セスは終了する。
【0033】突き合わせ動作と有限状態パーサーを使用
した結果として生成されたデータは、連続した単語、品
詞、句括弧(phrase bracketing)構造、および従属関
係を示すデータである。
【0034】ステップS9においては、合致した単語Tの
集合の中の第1の合致した単語tが選択される。次にス
テップS10において参照データの集合の中に合致しない
単語(unmatched word)があるかどうかが決定される。
もしなければ、プロセスはステップS7に進む、なぜなら
ば参照データの集合に対して生成され得る文脈情報はな
いからである。そのように、入力質問は参照データの集
合と合致する。しかしながら、もし参照データの集合
が、質問の中で要求されていない追加の情報を含んでい
るということを示している合致しない単語があるのなら
ば、ステップS11において合致していない単語Uの集合の
中の第1の合致していない単語uが選択される。次に合
致した単語tからの修飾の径路の最後に合致しない単語
uがあるかどうかが決定される。径路は径路規則に定義
されている。径路規則は、合致した単語のための辞書的
品詞、合致した単語から合致しない単語への有効な径路
説明、および合致しない句分類あるいは合致しない単語
のための辞書的品詞、を定義する。もし合致する単語t
と合致しない単語uが径路規則に従って連結されないこ
とが決定されたら、ステップS17において処理されずに
残っている合致しない単語があるかどうかが決定され
る。もしあれば、ステップS13において次に合致しない
単語uが選択され、プロセスはステップS12に戻る。もし
なければ、ステップS18において処理されていない合致
する単語があるかどうかが決定される。もしなければ、
プロセスはステップS7に戻る。それはアルゴリズムが参
照データの集合のためにすべての合致する単語としない
単語を処理しているからである。もしステップS19にお
いて処理する合致する単語がまだあるのならば、次の合
致する単語tが選択され、プロセスはステップS10に戻
る。
【0035】もしステップS12において、径路規則に定
義されているように、合致する単語tからの径路の終点
に合致しない単語uがあると決定されたら、ステップS14
において合致しない単語uが有効句規則において定義さ
れた有効句のなかに存在しているかどうかが決定され
る。もし有効句がなければ、ステップS13において次の
合致しない単語uが選択され、プロセスはステップS12に
戻る。もし有効な句が認識されたら、単語uを含む最小
の有効な句がステップS15において決定され、ステップS
16において、合致した単語tに関係したメモリにその句
が追加される。メモリはそのように、それぞれの合致す
る単語に関連あるいは連結した合致しない単語あるいは
句として文脈データを記憶する。
【0036】有効句は単語の品詞、あるいは単語群の句
分類から構成され得る。ステップS17において、まだ処
理されないで残っている合致しない単語があるかどうか
が決定され、もしそうであるならば、プロセスはステッ
プS13へ次の合致しない単語を選択するために戻る。も
しそうでないならば、ステップS18において処理されて
いない合致した単語があるかどうかが決定される。もし
そうでないならば、合致しない単語とする単語が参照デ
ータの集合のために処理されているので、プロセスはス
テップS7に戻る。まだ処理されるべき合致した単語があ
るのならば、ステップS19において次の合致した単語tが
選択され、プロセスはステップS10に戻る。
【0037】質問がいったん入力され統語解析されれ
ば、統語解析、突き合わせ、および文脈生成ステップは
参照データのそれぞれの集合のために繰り返されること
になる。
【0038】ステップS9からS19のオペレーションは具
体例を参照しながらより詳細に説明される。
【0039】有限状態統語解析テクニックを使用した突
き合わせ処理の出力は、品詞、句括弧構造、および従属
関係とともに連続した単語として表現された句である。
ここでは後に、品詞(pos)は続くそれぞれの単語に"
POS"と与えられる。句形式PTのための句括弧が"〔…〕P
T"と与えられる。更に、質問の中の単語に合致する参照
データの集合の中の単語が太字で記される。
【0040】 質問として: "camera with a lens" そして参照データとして: "black SLR camera with a zoom lens on a white surface" 突き合わせエンジンからのデータ出力は: 〔〔black adj SLR noun camera noun〕NG, 〔with prep a det zoom noun lens noun〕PP, 〔on prep a det white adj surface noun〕PP〕NP mod[camera]=black mod[camera]=SLR pmod[camera]=with pmod[camera]=on mod[with]=lens mod[lens]=zoom mod[on]=surface mod[surface]=white ここで与えられている表記では、品詞は: adj - 形容詞 noun-名詞 prep-前置詞 det-限定詞 句形式は: NG−名詞グループ PP-前置詞句 NP-名詞句 従属関係は、ここに一緒にファイルされている"自然言
語入力データからプロセッサ使用可能データを生成する
ための装置と方法"と題された同時係属中の出願に述べ
られている、有限状態パーサーにより生成された、索引
変数(indexedvariables)として与えられている。その
ように、mod[camera]=blackは、単語"camera"の修飾語
句は単語"black"であると定義している。単語"camera"
の前置詞的修飾語句(pmod)は単語"on"である。
【0041】図4は、修飾関係即ち質問や参照データ集
合のための径路を図示している。
【0042】ここでは、径路について言及され、それは
2語の間の修飾関係からなる。例えば、単語"camera"か
ら単語"black"までの径路は単純な修飾関係、即ちmodに
より与えられている。単語"camera"から単語"surface"
までの径路は、単語"on"を介した二つの連続した径路pm
odとmodにより与えられている。
【0043】アルゴリズムは上で言及されているような
径路規則を使用している。それぞれの径路規則は< rt,
rp, rc>の形を持っていて、そこではrtは合致した単
語のための辞書的品詞 rpはここで説明されているような径路説明 およびrcは合致しない単語のための句分類あるいは辞書
的品詞である。
【0044】これらのうちのどれでもワイルドカード*
により定義することが可能である。これは、規則によ
り、例えば全ての辞書的品詞、径路、あるいは句分類と
いったどんな値でも使用可能であることを意味してい
る。
【0045】径路説明は例えばmod或いはpmod:modとい
うような変数の名前のリストの形を取る。
【0046】アルゴリズムにおいては、3つのテストが
実行され、それぞれのテストがブール結果の中で結果を
出す。
【0047】has pos (t,c):ここでtは合致した単語
でcは品詞である。
【0048】has pos (t,c)は、もしtが品詞cを持って
いるか、またはcがワイルドカード*であれば真とな
る。
【0049】on path(t,u,p):tは合致した単語であ
り、uは合致しない単語であり、pは径路記述である。
【0050】on path(t,u,p)は、もしもpがa*、或いは
tからuへのタイプpの合致しない径路がある、すなわ
ち、径路pにおける関係がtからuへ続いているとした
ら、真となる。これは次のように再帰的に表現すること
ができる。もしpが単一の要素からなるならば、on path
(t,u,p)はもしuがp[t]のメンバーでありさえすれば真で
ある。もしもpが変数の名前のリストであるならば、第
1はqであり、リストの残りはrであるならば、on path
(t,u,q:r)はもしq[t]のメンバーである単語wが存在し、
wが合致したものとしてマークされておらず、on path
(w,u,r)が真でありさえすれば、真である。"メンバーで
ある"とここで言っている理由は、上で示されているpmo
d[camera]={with,on}の例の中にあるように索引変数は
その中に記憶された数個の単語を持つことが可能である
からである。
【0051】Valid-Phrase (C,p,u):pは辞書的品詞或
いは句分類である。Uは合致しない単語である。Cは句或
いは単語である。有効句(C,p,u)は、もしもCが分類或
いは品詞pを持っておりuがCの中で発生したら真であ
る。
【0052】主要アルゴリズム:ステップS7からS17に
より実行される主要アルゴリズムは次のような擬似コー
ドで記述可能である:Sは文脈の集合とさせる、初めは
空である(出力)。
【0053】Pは径路規則の集合とさせる(入力)。
【0054】Tは現在の単語の集合とさせる、全ての合
致した単語に対しイニシャライズされる(入力)。
【0055】Uは入手できる単語の集合とさせる、全て
の合致しない単語に対してイニシャライズされる(入
力)。
【0056】 Tが空でないとき { Tから単語tを選択する、 Uのなかの各単語uについて ( もしもPのなかに径路規則<rt,rp,rc>が次のようにあったなら has pos(t,rt) AND on path(t,u,rp) そして、 valid pharse (C,rc,u)の最小句Cを見つける もしCのようなものがあったなら、 文脈<t,C>をSに加え Uからuを除く ) Tからtを除く } "最小句"が意味しているのは、もし有効句Cと有効句Dが
あり、Cが完全にDのなかへ包含される場合、Cが使用さ
れるということである。
【0057】アルゴリズムの動作を、ここで説明され図
4で図示された例を参照しながら示す。
【0058】初めの集合T={camera, lens} 初めの集合U={black, SLR, zoom, white, surface, wit
h, on, a} 使用されるであろう径路規則は 1.<*,mod,*>(これは修飾語を見つける) 2.<*,pmod:mod,pp>(これは前置詞句を見つける(P
Ps)) 第1の合致した単語t="camera"、そして第1の合致し
ない単語u="black"の中で第1の規則が適用されるの
は、 has pos(camera, *)=真 on path(camera,black,mod)=真 だからである。
【0059】こうしてふさわしい句(実際にはひとつの
単語)c=[black]adjを見つけることができ、だから文脈
データ<camera,[black]adj>が集合Sに追加される。
【0060】2番目の合致しない単語u="SLR"に対して
規則1は上記に与えられたのと同じ理由で適用され、文
脈データ<camera,[SLR]noun>が文脈データ集合Sへ追
加される。
【0061】径路規則とともに構成している集合Uの中
の唯一別の単語は単語"surface"である。U="surface"の
とき規則2が適用される。なぜならば、 has pos(camera, *)=真 on path(camera,surface, pmod:mod)=真 だからである。
【0062】ふさわしい句C=[on a white surface]PPが
見つけ出され、ゆえに文脈データ<camera,[on a white
surface]PP>が文脈データ集合Sに付加される。
【0063】合致した単語t="camera"に対する合致しな
い単語の全てがこのようにして処理されていく。
【0064】次の合致した単語t="lens"が次に選択され
る。径路規則があてはまる唯一の単語はu="zoom"であ
る。規則1が当てはまる。なぜならば: has pos(lens,*)=真 on path(lens, zoom,mod)=真 ふさわしい句(実際にはひとつの単語)はC=[zoom]名詞
であり、ゆえに文脈データ<lens,[zoom]noun>が文脈
データ集合へ付加される。
【0065】アルゴリズムの結果はそのように文脈デー
タSの集合である。集合の中のそれぞれのエントリーは
合致した単語と、言語的に合致した単語と関連している
合致しない単語、或いは句からなる。このデータは、ユ
ーザーが、入力質問がデータの集合と合致するところや
合致した単語のそれぞれの文脈を認識できるように出力
することが可能である。
【0066】データを検索する際、戻ってくる多数の最
良の合致物(best matches)を結果として生じる質問を
使用することは役に立つ。ユーザーが参照データの集合
がお互いにそして質問に対してどのように関係している
のかわかるように、最良合致物を配列するための文脈情
報を使用することが望ましい。前述したように生成され
る文脈データは文脈を収集することによりこれを達成す
るために使用可能である。
【0067】検索結果を構築するために文脈データを一
緒に収集する方法がこれより説明される。
【0068】参照データの集合のそれぞれのために、文
脈データは支配節点と文脈句の形式をとった文脈の集合
からなる。先に挙げられた例では、文脈データは以下か
らなる: <camera,[black]adj> <camera,[SLR]noun> <camera,[on a white surface]PP> <lens,[zoom]noun> 先に見ることができるように、支配節点の単語には1つ
より多くの文脈句が存在し得る。上記の例"camera"が3
つの文脈句を持っている。
【0069】文脈データの出力に構造を与えるために、
付加情報が文脈データに使用される。質問の頭語、すな
わち他の単語を全く修飾していない単語、の知識をもっ
ていなければならない。また、合致した(支配節点の)
単語間の修飾関係を知る必要がある。例えば、図4で
は"camera"はどの単語も修飾していないので入力質問の
頭語であるということがわかる。合致した"lens"は、頭
語から続く修飾鎖の中の次の合致した単語(この例では
実際は唯一の他の合致した単語)である。
【0070】この情報に加えて、径路レベルのリスト
が、出力の構築を定義し関心のある文脈を定義するため
に使用される。この径路は合致した(支配節点の)単語
を定義する空の径路を含む。modやpmodのようなほかの
径路は合致した単語から合致しない単語の修飾径路を定
義する。径路はpmod:modのように連結された径路からな
ることが可能である。
【0071】構造出力を形成する方法は図5とデータ集
合の例を参照しながら説明されるであろう。
【0072】図5のステップS20において、複数のデー
タ集合のための文脈データが入力される。質問に関して
は: "camera with a lens" 合致したデータ集合は文脈データと一緒に下記にリスト
される。文脈データの中で{}は文脈データがないこと
を意味する。合致した単語と合致しない単語の間の径路
はまた下記の文脈データの中で与えられており、[…]で
与えられている。 camera with a lens { } Large camera with a lens <camera [mod], large> camera with a lens on a table <camera [pmod:mod], [on a table]PP> Large camera with a zoom lens <camera [mod], large> <lens [mod], zoom> camera on a table with a long zoom lens <camera [pmod:mod], [on a table]PP> <lens [mod],zoom> <lens [mod],long> 図5のステップS21において、それぞれの合致した(支
配節点の)単語のために、文脈データは鎖状につながれ
ており、その結果特定の合致した単語と特定の径路に対
しひとつの文脈データが存在する。上で与えられた例で
は、最後の例の鎖状のつながりが次のような結果を生
む: camera on a table with a long zoom lens <camera [pmod:mod],[on a table]PP> <lens [mod], long & zoom> この例のプロセスでは、以下の径路リストが使用され
る: [ ] [mod], [pmod:mod] [ ]は空の径路を示しており、合致した(支配節点の)
単語を認識するために使用される。この径路は第1のレ
ベルにある。径路[mod]と[pmod:mod]はどちらも2番目
のレベルである。
【0073】径路リストと入力質問の頭語の知識を使う
と、頭語は図5のステップS22で選択される。ステップS
23では次に文脈単語があるかどうかが決定される。もし
ないとすれば、ステップS24にて、プロセスは次にさら
に処理されていない合致した単語があるかどうかを決定
する。もしなければ、ステップS30において、決定され
たインデックスとサブインッデックスを記憶してプロセ
スは終了する。もしさらに処理すべき合致した単語があ
れば、ステップS25において修飾関連のなかの次の合致
した単語がサブインデックスとして選択され、プロセス
はステップS23に戻る。
【0074】本例では、S23において文脈語があるかど
うかが決定される。そのようにステップS26では第2の
径路レベルでの文脈データが選択される、例えばmodやp
mod:modにより合致した単語cameraに言語的に関係する
合致しない単語である。ステップS27ではデータ集合は
一般文脈語(或いは文脈語の欠落)に従ってグループ分
けされ、共通の文脈語によりインデックス付けされる。
上で与えられた例に対して文脈データを使用してデータ
検索を分類する結果が下記に図示されている。 上記において、合致した単語(頭語)は太字で示されて
いる。( )は空の文脈を意味し、"camera with a len
s"は正確に質問に合致し、cameraに関係している文脈デ
ータはない。
【0075】図5のステップS28において、次に更なる
径路レベルがあるかどうかが決定される。もしステップ
S29に更なる径路レベルがあれば、次の径路レベルが選
択され、ステップS27はさらにデータ集合のサブインデ
ックスグループを生成するために繰り返される。本例で
は、ステップS28において、それ以上の径路レベルはな
いと決定され、従ってステップS25においては次の合致
した単語がサブインデックスとして選択される。この例
の次の合致した単語とは単語"lens"であり、これはひと
つ以上のデータ集合のグループのためのサブインデック
スとして使用される。プロセスは次にステップS23に戻
り、そこでは本例では処理されるべき文脈語があるかど
うかが決定され、ステップS26においては第2の径路レ
ベルのための文脈が選択される。ステップS27において
はデータ集合は共通の文脈語に従ってグループ分けさ
れ、従ってインデックス付けされる。これの結果は下記
に図示されている: Camera large lens zoom large camera with a zoom lens ( ) large camera with a lens [on a table]PP lens long & zoom camera with a long zoom lens on a table ( ) camera with a lens on a table ( ) camera with a lens ステップS30の結果はデータ集合属の属する階層的イン
デックスとサブインデックスの記憶である。例えば、デ
ータ集合"large camera with a zoom lens"はcamera:la
rge:lens:zoomによりインデックスされる。A camera wi
th a lens on atableはcamera:[on a table]PP: lens
( )によりインデックスされる。
【0076】この文脈データを使用した配列は、ユーザ
ーにより簡単に合致物の文脈を理解させることができる
フォーマットで、データをユーザーに対し出力させるこ
とができる。
【0077】文脈情報のレベルの数は使用される径路レ
ベルと合致した単語の数による。それぞれのレベルの文
脈の数は検索されるデータベースの文脈によるであろ
う。例えば、上で与えられた例の中の第1のレベルにお
いて、文脈が2つだけある:large と [on a table]PP
である。もしも例えばred camera with a lens on a ta
ble, small camera with a lens on a tableなどさら
なるデータ集合があったなら、第1のレベルの中の文脈
の数が大きくなる。
【0078】本発明に対する第2の実施形態は図6を参
照しながら説明する。
【0079】図6は図1において図示された第1の実施
形態の機能図と同様の要素を持つ第2の実施形態の機能
図である。第2の実施形態は、入力質問とデータベース
3からのデータ集合を受け取る第1の実施形態のパーサ
ー2が突き合わせエンジン4の出力を統語解析するパー
サー20に入れ替わるということにおいてのみ、第1の
実施形態と異なる。この実施形態において突き合わせエ
ンジンはキーワードマッチングを実行する。文脈データ
を生成するために要求される統語情報は、突き合わせ処
理に続くパーサー20の統語解析動作により得られる。
【0080】この実施形態は、より単純な突き合わせ処
理という恩恵を受けるが、統語情報の欠落により突き合
わせ処理において正確さを欠いてしまう。
【0081】ここでは特定の実施形態を参照しながら上
で本発明に従って説明したが、本発明はこれらの特定の
実施形態に限られるものではなく、添付された請求項の
なかで定義される発明の範囲内で変形が可能である。
【0082】特に、本発明は突き合わせ処理の特定のタ
イプに限られるものではない。突き合わせ処理はデータ
ベースの中のデータの集合のなかの単語に合致する質問
の中における単語を認識するためにだけ必要とされる。
【0083】文脈データの形成を可能にするための必要
な統語情報を得るために、あるレベルの統語解析が要求
される。統語情報の形を提供することができるどんなパ
ーサーでも本発明の実行に使用可能である。例えば、純
粋従属パーサーは、D.スリーター(D Sleator)とD.テ
ンパーリー(D Temperley)(カーネギーメロン大学コ
ンピューターサイエンス学部、テクニカルレポートNo.C
MEU CS 91 196, 1991年10月)による"連結グラマーに
よる英語統語解析"と題された論文に発表されているよ
うに、使用可能である。このシステムでは、句括弧は与
えらていないが、句を抽出するアルゴリズムの部分は代
わりに、合致した項にある従属関係をもっていることに
より定義された連続した単語を抽出することができる。
パーサーは、例えば、GB-A-2269923, EP-A-0737928、
T.ヤルビネンとP.タパナイネンによる論文、P.タパナイ
ネンとT. ヤルビネンによる論文に開示されている。ま
た、より単純な統語解析テクニックがSフランクによる
論文の中で開示されているように使用されることが可能
である。
【0084】本発明はどんな形態の検索テクニックにも
適用でき、ウェブ検索エンジンやデータベース検索エン
ジンのような幅広い検索エンジンで使用可能である。本
発明に組み入れられた検索エンジンのような出力はユー
ザーにさらなる情報を与え、ユーザーは検索の結果の文
脈を見ることができるようになる。
【0085】本発明はプログラムされた多目的コンピュ
ータに属しているように記述されているが、本発明は言
うまでもなく、ロジック回路のように特別に設計された
ハードウェアを使用して実行することも可能である。
【図面の簡単な説明】
【図1】本発明の一実施形態の機能図である。
【図2】本発明の一実施形態の概要図である。
【図3】本発明の一実施形態の動作を示すフローチャー
トである。
【図4】文脈データの生成に使用される統語情報を図示
している。
【図5】本発明の一実施形態に従って検索の結果を配列
するための文脈データの使用を図示しているフローチャ
ートである。
【図6】本発明の別の実施形態の機能図である。

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 自然言語の単位の形式でデータを検索す
    る検索装置であって、 自然言語の単位の形式で入力質問を受け取り、出力デー
    タの形式で検索の結果を出力するためのインターフェー
    ス手段と、 入力質問の単位とデータの単位との間の合致を検索し認
    識するための突き合わせ手段と、 質問及び/又はデータの中で合致しない単位があるとこ
    ろで、質問及び/又はデータのひとつまたはそれより多
    くの合致しない単位の形式で文脈データを生成し、それ
    ぞれの合致しない単位は、合致しない単位のひとつまた
    はそれぞれに対し予め定義された言語的関係を持つ、生
    成手段と、 前記合致した単位及び前記文脈データとして、前記出力
    データを形成するための形成手段とを備えることを特徴
    とする自然言語検索装置。
  2. 【請求項2】 前記生成手段は、それぞれの合致した単
    位に予め定義された修飾関係を持つ文脈データの合致し
    ない単位またはそれぞれを生成するように構成されてい
    ることを特徴とする請求項第1項に記載の自然言語検索
    装置。
  3. 【請求項3】 前記生成手段は合致する或いは合致しな
    い単位の間の文脈的に重要な修飾関係を定義しているひ
    とつまたはそれ以上の規則に従って作動することを特徴
    とする請求項第1項又は第2項に記載の自然言語検索装
    置。
  4. 【請求項4】 前記生成手段は、文脈データの形成のた
    めの統語的または意味的制約を含むひとつまたはそれ以
    上の規則に従って作動することを特徴とする請求項第1
    項又は第2項に記載の自然言語検索装置。
  5. 【請求項5】 単位間の言語関係を決定するために、入
    力質問及び/又はデータ或いは突き合わせ手段の出力を
    統語解析するための統語解析手段を含むことを特徴とす
    る請求項第1項乃至第4項のいずれか1項に記載の自然
    言語検索装置。
  6. 【請求項6】 前記形成手段は、それぞれの合致した単
    位に対し前記予め定義された言語上の関係を持っている
    それぞれの前記合致しない単位に関連したすべての前記
    合致した単位として、前記出力データを形成するように
    構成されることを特徴とする請求項第1項乃至第5項の
    いずれか1項に記載の自然言語検索装置。
  7. 【請求項7】 前記形成手段は、文脈データによりデー
    タの集合を認識する階層的構造として前記出力データを
    形成するよう構成されることを特徴とする請求項第1項
    乃至第6項のいずれか1項に記載の自然言語検索装置。
  8. 【請求項8】 前記形成手段は、入力質問の頭語からな
    る前記合致した単語、ひとつまたはそれ以上の下位層を
    形成している前記頭語のための前記文脈データ、前記下
    位層の更に下位層を形成しているさらなる合致した単
    語、入力質問内の修飾関係による前記さらなる合致した
    単語の選択の順序、更なる下位層を形成している前記更
    なる合致する単語のための前記文脈データ、階層的構造
    のなかの最終的な前記下位層により認識されたデータの
    前記集合、から形成される階層的構造として前記出力デ
    ータを形成するよう構成されることを特徴とする請求項
    第7項に記載の自然言語検索装置。
  9. 【請求項9】 自然言語の単位の形式でデータの検索の
    結果を向上させるようにデータを処理するコンピュータ
    で実行されるデータ処理方法であって、 自然言語の形式で入力質問を受け取り、出力データの形
    式で検索の結果を出力し、 入力質問とデータの単位との間の合致を検索し認識し、 質問及び/又はデータにおけるすべての合致する単位の
    ために、ひとつまたはそれより多くの合致しない質問及
    び/又はデータの単位の形式で文脈データを生成し、 ここで、それぞれの合致しない単位は合致する単位のう
    ちのひとつまたはそれぞれの予め定義された言語的関係
    を持っていて、すべての前記合致する単位とすべてのそ
    れぞれの前記文脈データとして前記出力データを形成す
    ることを特徴とするコンピュータによるデータ処理方
    法。
  10. 【請求項10】 文脈データの合致しない単位またはそ
    れぞれが、それぞれの合致する単位に予め定義された修
    飾関係を持つものとして生成されることを特徴とする請
    求項第9項に記載の方法。
  11. 【請求項11】 文脈データは、合致する単語と合致し
    ない単語の間の文脈的に重要な修飾関係を定義している
    ひとつまたはそれより多くの規則に従って生成されるこ
    とを特徴とする請求項第9項又は第10項に記載の方
    法。
  12. 【請求項12】 文脈データは、文脈データの構成のた
    めに構文的および意味的な制約を含むひとつまたはそれ
    以上の多くの規則に従って生成されることを特徴とする
    請求項第9項又は第10項に記載の方法。
  13. 【請求項13】 入力質問及び/又はデータ、或いは単
    位間の言語関係を決定するための突き合わせステップの
    出力の統語解析を含むことを特徴とする請求項第9項乃
    至第12項のいずれか1項に記載の方法。
  14. 【請求項14】 出力データは、それぞれの合致する単
    位に対して前記予め定義された言語的関係を持ってい
    る、それぞれの前記合致しない単位に関連した、すべて
    の前記合致する単位として形成されることを特徴とする
    請求項第9項乃至第13項のいずれか1項に記載の方
    法。
  15. 【請求項15】 前記出力データは文脈データによりデ
    ータの集合を認識する階層的構造として形成されること
    を特徴とする請求項第9項乃至第14項のいずれか1項
    に記載の方法。
  16. 【請求項16】 前記出力データは、入力質問の頭語か
    らなる前記合致した単語、ひとつまたはそれ以上の下位
    層を形成している前記頭語のための前記文脈データ、前
    記下位層の更に下位層を形成しているさらなる合致した
    単語、入力質問内の修飾関係による前記さらなる合致し
    た単語の選択の順序、更なる下位層を形成している前記
    更なる合致する単語のための前記文脈データ、階層的構
    造のなかの最終的な前記下位層により認識されたデータ
    の前記集合、により形成されることを特徴とする請求項
    第15項に記載の方法。
  17. 【請求項17】 複数の利用できる情報単位から自然言
    語の所望の情報単位を検索するためのデータ検索装置で
    あって、 自然言語単位で質問を入力するための入力手段と、 入力質問と複数の利用できる情報単位との間の最良合致
    を認識するために、入力質問の単位と使用できる情報単
    位の単位との間のすべての合致を検索し認識する突き合
    わせ手段と、 最良の合致を受け取り、入力質問及び/又は情報単位の
    中に合致しない単語がある場合に、合致する単位のひと
    つまたはそれぞれに対して予め定義された言語的な関係
    をそれぞれが持つ、一つまたはそれより多くの合致しな
    い単位の形式で文脈データを生成する生成手段と、 それぞれの文脈データで最良の合致として所望の情報単
    位を出力する出力手段とを備えることを特徴とするデー
    検索装置。
  18. 【請求項18】 前記出力手段は、前記文脈データによ
    り配列された所望の情報単位を出力するよう構成される
    ことを特徴とする請求項第17項に記載の装置。
  19. 【請求項19】 複数の使用できる情報単位のために、
    自然言語の単位を含む所望の情報単位を検索するため
    の、コンピュータにより実行されるデータ検索方法であ
    って、 自然言語単位で質問を入力し、 入力質問と複数の利用できる情報単位との間の最良合致
    を認識するために、入力質問の単位と使用できる情報単
    位の単位との間のすべての合致を検索し認識し、 質問及び/又は情報単位の中に合致しない単語がある場
    合に最良合致のために、合致する単位のひとつまたはそ
    れぞれに対して予め定義された言語的な関係をそれぞれ
    が持つ、一つまたはそれより多くの合致しない単位の形
    式で文脈データを生成し、 それぞれの前記文脈データで最良の合致として所望の情
    報単位を出力することを特徴とするデータ検索方法。
  20. 【請求項20】 所望の情報単位は前記文脈データによ
    り配列された出力であることを特徴とする請求項第19
    項に記載の方法。
  21. 【請求項21】 請求項9乃至16、請求項19又は請
    求項20のいずれか1項の方法を実行する、プロセッサ
    を制御するためのプロセッサ実行可能命令を保持する保
    持媒体。
  22. 【請求項22】 請求項9乃至16、請求項19又は請
    求項20のいずれか1項の方法を実行するプロセッサを
    制御するためのプロセッサ実行可能命令を持つ信号。
JP2000056396A 1999-03-01 2000-03-01 自然言語検索方法および装置 Pending JP2000315216A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9904662.5 1999-03-01
GBGB9904662.5A GB9904662D0 (en) 1999-03-01 1999-03-01 Natural language search method and apparatus

Publications (2)

Publication Number Publication Date
JP2000315216A true JP2000315216A (ja) 2000-11-14
JP2000315216A5 JP2000315216A5 (ja) 2007-04-26

Family

ID=10848716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000056396A Pending JP2000315216A (ja) 1999-03-01 2000-03-01 自然言語検索方法および装置

Country Status (4)

Country Link
US (1) US7389224B1 (ja)
EP (1) EP1033662A3 (ja)
JP (1) JP2000315216A (ja)
GB (1) GB9904662D0 (ja)

Families Citing this family (214)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
AUPQ686200A0 (en) * 2000-04-12 2000-05-11 Uneeque Pty Ltd Database retrieval system
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
GB2390704A (en) 2002-07-09 2004-01-14 Canon Kk Automatic summary generation and display
GB2399427A (en) 2003-03-12 2004-09-15 Canon Kk Apparatus for and method of summarising text
US20060053000A1 (en) * 2004-05-11 2006-03-09 Moldovan Dan I Natural language question answering system and method utilizing multi-modal logic
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8200688B2 (en) * 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8115869B2 (en) 2007-02-28 2012-02-14 Samsung Electronics Co., Ltd. Method and system for extracting relevant information from content metadata
US8863221B2 (en) * 2006-03-07 2014-10-14 Samsung Electronics Co., Ltd. Method and system for integrating content and services among multiple networks
US8732154B2 (en) 2007-02-28 2014-05-20 Samsung Electronics Co., Ltd. Method and system for providing sponsored information on electronic devices
US20080235209A1 (en) * 2007-03-20 2008-09-25 Samsung Electronics Co., Ltd. Method and apparatus for search result snippet analysis for query expansion and result filtering
US20070214123A1 (en) * 2006-03-07 2007-09-13 Samsung Electronics Co., Ltd. Method and system for providing a user interface application and presenting information thereon
US8209724B2 (en) * 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8510453B2 (en) * 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8843467B2 (en) * 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
US20080221989A1 (en) * 2007-03-09 2008-09-11 Samsung Electronics Co., Ltd. Method and system for providing sponsored content on an electronic device
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8935269B2 (en) * 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
US20090055393A1 (en) * 2007-01-29 2009-02-26 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices based on metadata information
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8346756B2 (en) * 2007-08-31 2013-01-01 Microsoft Corporation Calculating valence of expressions within documents for searching a document index
US8463593B2 (en) 2007-08-31 2013-06-11 Microsoft Corporation Natural language hypernym weighting for word sense disambiguation
US8316036B2 (en) * 2007-08-31 2012-11-20 Microsoft Corporation Checkpointing iterators during search
US7984032B2 (en) * 2007-08-31 2011-07-19 Microsoft Corporation Iterators for applying term occurrence-level constraints in natural language searching
US8041697B2 (en) * 2007-08-31 2011-10-18 Microsoft Corporation Semi-automatic example-based induction of semantic translation rules to support natural language search
US8280721B2 (en) * 2007-08-31 2012-10-02 Microsoft Corporation Efficiently representing word sense probabilities
US8229970B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Efficient storage and retrieval of posting lists
US8712758B2 (en) * 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8176068B2 (en) 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
US8001561B2 (en) * 2007-11-20 2011-08-16 Samsung Electronics Co., Ltd. System and method for automatically rating video content
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8938465B2 (en) * 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9934218B2 (en) * 2011-12-05 2018-04-03 Infosys Limited Systems and methods for extracting attributes from text content
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
KR20240132105A (ko) 2013-02-07 2024-09-02 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9824122B2 (en) 2013-03-15 2017-11-21 Entit Software Llc Requests for source code text
CN112230878B (zh) 2013-03-15 2024-09-27 苹果公司 对中断进行上下文相关处理
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
CN105190607B (zh) 2013-03-15 2018-11-30 苹果公司 通过智能数字助理的用户培训
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101772152B1 (ko) 2013-06-09 2017-08-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US11222044B2 (en) * 2014-05-16 2022-01-11 Microsoft Technology Licensing, Llc Natural language image search
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
CN110797019B (zh) 2014-05-30 2023-08-29 苹果公司 多命令单一话语输入方法
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062074A (en) * 1986-12-04 1991-10-29 Tnet, Inc. Information retrieval system and method
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same
GB9217886D0 (en) 1992-08-21 1992-10-07 Canon Res Ct Europe Ltd Method and apparatus for parsing natural language
US5519608A (en) * 1993-06-24 1996-05-21 Xerox Corporation Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation
GB2300495A (en) 1995-04-13 1996-11-06 Canon Kk Language processing
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
US6182029B1 (en) * 1996-10-28 2001-01-30 The Trustees Of Columbia University In The City Of New York System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6018733A (en) * 1997-09-12 2000-01-25 Infoseek Corporation Methods for iteratively and interactively performing collection selection in full text searches
US6411924B1 (en) * 1998-01-23 2002-06-25 Novell, Inc. System and method for linguistic filter and interactive display
JP2002517860A (ja) * 1998-06-08 2002-06-18 ケイシーエスエル インク. データベースから関連情報を検索する方法およびシステム
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries

Also Published As

Publication number Publication date
US7389224B1 (en) 2008-06-17
EP1033662A2 (en) 2000-09-06
GB9904662D0 (en) 1999-04-21
EP1033662A3 (en) 2003-10-15

Similar Documents

Publication Publication Date Title
JP2000315216A (ja) 自然言語検索方法および装置
US7398201B2 (en) Method and system for enhanced data searching
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US8041697B2 (en) Semi-automatic example-based induction of semantic translation rules to support natural language search
US7283951B2 (en) Method and system for enhanced data searching
US6101492A (en) Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
US8271453B1 (en) Paraphrase acquisition
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US20030195872A1 (en) Web-based information content analyzer and information dimension dictionary
US20040117352A1 (en) System for answering natural language questions
US20040054530A1 (en) Generating speech recognition grammars from a large corpus of data
KR20050032937A (ko) 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
JPH08147299A (ja) 自然言語処理方法及びシステム
KR100835706B1 (ko) 자동 색인을 위한 한국어 형태소 분석 시스템 및 그 방법
US20050065776A1 (en) System and method for the recognition of organic chemical names in text documents
JP2011118689A (ja) 検索方法及びシステム
KR101709055B1 (ko) 오픈 웹 질의응답을 위한 질문분석 장치 및 방법
CN105760462A (zh) 基于关联数据查询的人机交互方法及装置
JPH0844771A (ja) 情報検索装置
Moldovan et al. On the role of information retrieval and information extraction in question answering systems
Litkowski Question Answering Using XML-Tagged Documents.
Chandra et al. Natural language interfaces to databases
Vickers Ontology-based free-form query processing for the semantic web
JPH10149370A (ja) 文脈情報を用いた文書検索方法および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070301

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070301

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070301

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090828

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091222