JP2001511564A - 全体の精度を高めるためにサーチ結果の自然言語処理を用いる情報検索システムのための装置および方法 - Google Patents
全体の精度を高めるためにサーチ結果の自然言語処理を用いる情報検索システムのための装置および方法Info
- Publication number
- JP2001511564A JP2001511564A JP2000504525A JP2000504525A JP2001511564A JP 2001511564 A JP2001511564 A JP 2001511564A JP 2000504525 A JP2000504525 A JP 2000504525A JP 2000504525 A JP2000504525 A JP 2000504525A JP 2001511564 A JP2001511564 A JP 2001511564A
- Authority
- JP
- Japan
- Prior art keywords
- documents
- query
- logical form
- document
- document set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 167
- 238000003058 natural language processing Methods 0.000 title abstract description 47
- 230000006870 function Effects 0.000 claims abstract description 25
- 230000004044 response Effects 0.000 claims description 51
- 230000008569 process Effects 0.000 abstract description 66
- 239000003607 modifier Substances 0.000 abstract description 10
- 230000000717 retained effect Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 29
- 241000238413 Octopus Species 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000006872 improvement Effects 0.000 description 9
- 241001325280 Tricardia watsonii Species 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 101000666896 Homo sapiens V-type immunoglobulin domain-containing suppressor of T-cell activation Proteins 0.000 description 6
- 102100038282 V-type immunoglobulin domain-containing suppressor of T-cell activation Human genes 0.000 description 6
- IJJVMEJXYNJXOJ-UHFFFAOYSA-N fluquinconazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1N1C(=O)C2=CC(F)=CC=C2N=C1N1C=NC=N1 IJJVMEJXYNJXOJ-UHFFFAOYSA-N 0.000 description 6
- 230000000877 morphologic effect Effects 0.000 description 6
- 241000251730 Chondrichthyes Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 235000014347 soups Nutrition 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 241000408659 Darpa Species 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 241000700647 Variola virus Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241000238366 Cephalopoda Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- 241000221931 Hypomyces rosellus Species 0.000 description 1
- 208000010718 Multiple Organ Failure Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 208000020968 mature T-cell and NK-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
ジンによって検索された結果を処理するために自然言語処理を利用して全体的な
精度を改善する、情報検索システムのための装置およびそれに付随する方法に関
する。
ための書誌情報を含む従来のデータベースなどの大容量データ記憶装置から記憶
情報を検索するためにますます頻繁に使用されている。このような従来のデータ
ベースはたとえば米国電気電子通信学会(IEEE)によって維持されており、
かつたとえばKnight-Ridder Information Inc.のダイアログ(Dialog)情報サー
ビスによって現在アクセス可能である、INSPECデータベースの場合のよう
に、電気工学およびコンピュータ関連技術などの、広い範囲ではあるが特定のト
ピックに向けられる情報を一般的に含むため、専門的になる傾向がある(DIALOG
はKnight-Ridder Information Inc.の登録サービスマークである)。このタイプ
のデータベースは明らかに、関連の論文および他の出版物の出版数の増加に伴い
増大し続けることは確実だが、この増大は比較的なだらかで、適度にうまく調整
される傾向がある。さらに、このように専門化されたデータベースは比較的うま
く組織化されやすい。
イドウェブ」(以下単に「ウェブ」と称する)の出現および隆盛により、また従
来の出版とは対照的にウェブに情報を投稿しかつそれから情報にアクセスする、
比較的容易で低コストで行えることにより、ウェブ上で利用できる情報量は、爆
発的ではないにしても非常に指数関数的に近い増加を遂げ、現実的な視界内に制
限があるようには思われない。ウェブはおよそ人間が試みる全ての学問分野に及
ぶ、増々膨大な量の情報を提供するが、ウェブ上の情報内容は非常に無秩序であ
り、極端な程に組織化されておらず、そのためウェブからの情報のアクセスおよ
び検索を非常に複雑にし、多大な労苦を強いる。
キュメントの大部分はクエリとは全く関連がないことが多く、ユーザをいらだた
せる。
ドに基づいた従来のサーチエンジン(以下、単に「統計的サーチエンジン」と称
する)は、統計的処理をそれらのサーチ法に取り入れている。たとえば、クエリ
内のキーワードと検索された各ドキュメントレコード中の内容語との間で一致す
るキーワードの総数およびこれらの単語の一致の程度、すなわち組合せとしてお
よび/またはリクエストされた近さのレンジ内にあるか否かに基づいて、統計的
サーチエンジンは、検索されたこのようなドキュメントレコードの各々に対して
、「統計値」と包括的に呼ばれることが多い数値尺度を計算する。これらの統計
値は、一致する各単語に対するドキュメント頻度の逆数を含み得る。その後エン
ジンはそれらの統計値によってドキュメントレコードをランク付けし、最もラン
クの高い、典型的には5個から20個以下の、予め規定された少数の検索済レコ
ードに関するドキュメントレコードを、ユーザに戻す。検索された第1のグルー
プのドキュメントに対するユーザが第1のグループのドキュメントレコード(ま
たはある種のエンジンのように、エンジンによってドキュメントが戻される場合
にはドキュメント自体)をユーザが検討すると、ユーザは、次に高いランキング
のドキュメントレコードのグループを要求することができ、以下同様に検索され
たドキュメントレコード全てがこうして検討されるまで、要求をすることができ
る。
て実際に検索されたこのようなドキュメントの数を百分率で測る。一方、精度は
、検索された全てのドキュメントに対し、クエリに実際に関連するドキュメント
の数を百分率で測る。最終的に検索されるドキュメントの単なる数は重要ではな
いため、ウェブサーチエンジンについて考える場合には、再現は性能に関する重
要な測定基準ではないと考える。実際に、クエリによってはこの数は過度に大き
いこともある。したがって、有用な結果を生み出すためには、エンジンによって
索引付けされた関連のドキュメントの全てを取り出す必要はないと考える。しか
しながら精度は極めて重要であると考えられる。すなわち、ランクが最も高く最
初にユーザに提示されるドキュメントは、クエリに最も関連するものであるべき
であると考える。
、すなわち全ての文章の単語は互いに独立して現われるという仮定に基づいてい
ることに由来する。この場合の独立とは、別のある単語が文書中に存在するとき
にそのドキュメントに任意の1つの単語が表れるという条件付確率が常にゼロで
あること、すなわち、ドキュメントが、構造を持たない単語の集まりを含むだけ
であるか、または単に「1袋の単語」でしかないことを意味する。容易に認識で
きるように、この仮定は全ての言語に関して非常に誤ったものである。英語は、
他の言語と同様に、単語に関する、膨大な量で複雑な統語論上および語彙−意味
論上の構造を有し、これらの単語の意味は、使用される特定の言語的文脈に基づ
いて、しばしば広く、異なることが多く、文脈はその場合にも単語に与えられた
意味と、いかなる単語が後に現われるかとを決定する。したがって、文章に表れ
る単語は単に独立しているのでは全くなく、相互に高度に依存する。キーワード
に基づいたサーチエンジンはこのきめの細かな言語的構造を全く無視している。
たとえば、自然言語で表現された「How many hearts does an octopus have?」 というクエリの例について考える。内容語「hearts」および「octopus」または その形態素的語幹に基づいて動作する統計的サーチエンジンであれば、その材料
の部分に、したがってその内容を表わす単語として「artichoke hearts(アーチ チョークの芯)からsquid(イカ)、onions(タマネギ)およびoctopus(タコ) 」を有するレシピを含む、記憶されたドキュメントを戻すか、またはユーザをそ
のドキュメントに導く。内容を表わす2つの内容単語「octopus」および「heart
s」が一致するので、このエンジンは、たとえば近さおよび論理的なオペレータ を含む統計的測定値に基づいて、実際にはドキュメントがクエリとはかなり無関
係であっても、このドキュメントが優れた一致であると決定してしまう。
論的な句の要素を抽出するためのさまざまな方策が教示されている。これらの要
素はその後、従来の統計的ベクトル−空間モデルにおける(典型的には内部構造
のない)述語として索引付けされる。
exing for Document Retrieval: A Comparison of Syntactic and Non-Syntacti
c Methods", Ph.D. Thesis, Cornell University, 1988, pages i-261に記載さ れている。具体的には、この方策は自然言語処理を使用して英語の文章を分析し
て、統語論的な句の構成要素を抽出し、これらの句の構成要素は後に術語として
扱われ、統計的なベクトル−空間モデルを用いた索引に索引付けされる。検索時
に、はユーザは自然言語でクエリを入力し、この方策の下では、このクエリに自
然言語処理が施され、分析され、索引中検索にレコードされている憶された要素
に類似した統語論的な句の構成要素の要素を抽出する。その後、クエリによる統
語論的な句の構成要素と、索引に記憶されているたものとのを比較照合一致さが
行なわれるせる試みがなされる。著者は、この純粋に統語論的な方策を、統語論
的な句の構成要素を特定するために確率論的方法を使用すると統計的な方策とを
対比させており、この統計的方策では統語論的な句の構成要素を特定するために
確率論的方法が使用されるいる。著者は、自然言語処理ではは確率論的方策から
をの大幅な実質的に改善は見られずせず、自然言語処理が時に提供し得る精度が
のわずかに軽微な改善されることによっては、自然言語処理に伴うかなりの処理
コストはを正当化するものではできない、と結論し付けている。
を使用する場合の、このような統語論に基づいた別の方策が、T. Strzalkowski,
“Natural Language Information Retrieval: TIPSTER-2 Final Report”,Proce edings of Advances in Text Processing: Tipster Program Phase 2, DARPA, 6
-8 May 1996, Tysons Corner, Virginia, pages 143-148(以下、「DARPAの論文
」と呼ぶ)およびT. Strzalkowski,“Natural Language Information Retrieval
”, Information Processing and Management, Vol. 31, No. 3, 1995, pages 3
97-417に記載されている。この方策は理論的には可能性を秘めたものではるが、
DARPAの論文の第147頁から148頁において著者は、基盤となる自然言
語技術を実現するために要求される処理が高度であるために、この方策は現在の
ところは実用的でない、と結論している。 「...ただし、我々の性能要件を満たす(またはこれらの要件に少なくとも近い と考えられる)NLP[自然言語処理]技術は、依然として、自然言語の文を扱
う能力において性能がかなり低い。特に、概念的構成および論理形式などにかか
わる進歩した処理には、計算の面から依然として届かない。これらの進歩した技
術は表現レベルの限界の問題に対処するものであるため、より有効となるであろ
うと仮定することもできるが、実証に乏しく、しかもかなり小さなスケールのテ
ストに限定されざるを得ない。」 この種の統合論に基づいたさらなる方策がB. Katz, “Annotating the World
Wide Web Using Natural Language”, Conference Proceedings of RIAO 97, Co mputer-Assisted Information Searching in Internet, McGill University, Qu ebec, Canada, 25-27 June 1997, Vol. 1, pages 136-155(以下、「Katzの出版
物」と称する)に記載されている。Katzの出版物の記載によれば、内部構造を維
持したままで主語−動詞−目的語表現が作成されるので、検索時には軽微な統語
論上の変更に対処できる。
で利用可能な自然言語処理システムによっては実現できなかったことにより、研
究分野は、クエリによる最初の結果の精度および再現を直接改善しようとする試
みから、ユーザインターフェイスの改善へ、すなわち具体的には、「類語を検索
せよ」とユーザが検索結果に応答することなどの、ユーザとの相互作用に基づい
てクエリの精度を向上させる方法、および適当な固まりに分けて結果を表示する
ことを含む、クエリに対する結果を視覚化するための方法による改善に、移行し
た。
上は依然として失望するほど少なく、キーワードによるサーチに特有なユーザの
感ずる歯がゆさを大幅に軽減するには明らかに不十分である。具体的には、ユー
ザには、関連ある応答がまばらにしかないような比較的大きなドキュメントの集
合を手操作によってふるいにかけることが依然として要求される。
よって達成可能なものに優る著しい精度の改善をもたらすことができる、情報を
検索するための技術、特定的には装置およびそれに付随する方法が必要とされて
いる。さらに、このような技術は、任意に生ずる文章内の、広範囲な文のタイプ
および長さに対しても信頼性が高くかつ反復可能な結果をもたらし、かつ実用的
であり実現の際のコスト面でも有効である必要がある。このような従来の方策の
精度に対して、しかもこの技術分野に特有な問題にもかかわらず、精度を著しく
改善するためには、このような技術は好ましくは、意味的な内容とクエリの内容
との照合に基づいて、関連のドキュメントを選択し検索してその後ユーザに提示
するという効果を得るために自然言語処理を利用するべきである。
よって行なわれるキーワードに基づいたドキュメントサーチの精度を改善するた
めに自然言語処理を採用することにより、この必要を満たす。
ュメントの各々に関連した論理形式を生成し、比較し、それらの一致を重み付け
することを含む。検索されたドキュメントは、クエリおよび検索されたドキュメ
ントの両方に関する「論理形式」の予め規定された関数に基づいて、特定的には
、ドキュメントに関連した一致する論理形式に関連する重みの和に基づいて、ラ
ンク付けされ、その順で最終的に表示される。論理形式とは、任意のサイズのテ
キストを表わす単語がラベル付きの関係によってリンクされる有向非循環グラフ
である。特に、論理形式は入力文字列における重要な単語間の意味論上の関係を
、特に主題および修飾語句の関係を描く。この描写はさまざまな特定の形式をと
ることができ、たとえば論理形式グラフまたは、たとえば論理形式三つ組(trip
le)のリストを含むその任意のサブグラフの形式をとることができる。ここで、
三つ組の各々はたとえば「語−関係詞−語」という形式をとるが、これら形式の
いずれでも我々の発明に用いることができる。
ータベースまたはワールドワイドウェブからの検索されたドキュメントの組が得
られる。その後各ドキュメントには、自然言語処理が施され、特定的には形態素
的、統語論的および論理的な形式に関する処理が施され、最終的には各ドキュメ
ントの各文に対して適当な論理形式が生成される。ユーザによって与えられたク
エリが同様に分析され、それに関する対応の論理形式三つ組の集合が得られる。
クエリに対する論理形式の組はその後、検索されたドキュメントの各々に関連し
た論理形式の組と比較され、クエリの組からの論理形式と各ドキュメントの組か
らの論理形式との一致が確認される。一致を生じないドキュメントはそれ以上は
考慮されない。残りの各ドキュメントはその後ヒューリスティックにスコア付け
される。特に、種々のタイプの関係の各々、すなわち論理形式内に現われ得る深
層主語、深層目的語および機能語などに、予め規定された重みが割当てられる。
このような残りのドキュメントの各々のスコアは、その中にある一致する論理形
式の重みの、予め規定された関数である。この関数は、例えば、そのドキュメン
トに現われる、一意な、一致する三つ組(二重の一致を無視)全てに関連した重
みの和でもよい。最後に、保持されたドキュメントが、それらのスコアに基づい
て、ユーザの選択にしたがい降順に、典型的にはたとえば5個または10個とい
うような予め規定された少数のグループで、最も高いスコアを有するグループか
ら始まり、順に他のグループという順番でユーザに提示される。
、(a)クエリおよびキーワードに基づいたサーチ(ドキュメント検索)の両方
がローカルなパーソナルコンピュータ(PC)などの共通のコンピュータによっ
て処理される場合、(b)キーワードに基づいたサーチがたとえばリモートサー
バであるリモートコンピュータによって処理され、クエリおよびサーチ結果がた
とえばクライアントPCによって処理される場合、または(c)クエリがクライ
アントPCで作成され、残りの処理がさまざまなリモートサーバに分配される場
合、である。さらに、データベースの各ドキュメントを索引付けしてデータベー
ス化する際に前処理して、関連の論理形式を得て、これらの論理形式を記憶して
おいて後にアクセスできるようにすることによって、そのドキュメントが後に検
索されて自然言語処理を受ける場合には常に実行時間が節約されるようになる。
解できる。
照番号を付す。
ンジンであるか否かに関係なく、我々の本発明の教示をほとんど全ての情報検索
システムに容易に利用して、そのシステムで使用されるサーチエンジンの精度を
高めるようにできることが明らかに認識できるであろう。さらに、我々の発明は
、磁気媒体、光媒体(たとえばCD−ROM)または他の媒体に記憶されている
データベースなどのほぼ全てのタイプの大容量記憶装置からテキスト形式の情報
を検索する際に、たとえば英語、スペイン語およびドイツ語など、テキスト形式
の情報がどの言語であるかにかかわらず、精度を改善するために利用できる。
サーチエンジンによって提供されるレコードを、たとえば究極的にはドキュメン
トを、フィルタリングしランク付けするために自然言語処理を用いることによっ
て、検索エンジンの精度を著しく向上させることができることが我々には認識で
きた。
高いレベルのブロック図を示す。システム5はたとえばキーワードに基づいた統
計的検索エンジンである従来の検索エンジン20と、その後に続くプロセッサ3
0とを含む。プロセッサ30は、後に説明するように、我々の発明の自然言語処
理技術を利用して、エンジン20によって生成されたドキュメントをフィルタリ
ングして再度ランク付けし、ユーザによって与えられたクエリに対する関連性が
この技術を仕様しない場合よりも高い、順序付けのされた検索されたドキュメン
トの集合をもたらす。
リには、自然言語処理によってその意味論上の内容を最大限に利用し、それによ
ってエンジン20だけにより得られる精度よりもさらに精度を向上させるために
、(通常は「リテラル」と呼ばれる)フルテキスト形式が用いられる。システム
5はこのクエリをエンジン20およびプロセッサ30の両方に与える。クエリに
応答して、エンジン20は、記憶されたドキュメントのデータセット10をサー
チし、それから検索されたドキュメントの集合を出力する。このドキュメントの
集合(「出力ドキュメント集合」とも呼ばれる。)は、線25で表わされるよう
に、入力としてプロセッサ30に与えられる。後に詳細に説明するように、プロ
セッサ30内では、集合内のドキュメントの各々に対して、自然言語処理、特に
形態素的、統語論的および論理的な形式に関する処理が施され、そのドキュメン
ト内の各文に対する論理形式を生成する。ある文に関するこのような論理形式の
各々は、その文内の言語学的な句の中の単語間の意味論的な関係、特に主題およ
び修飾語句構造を符号化したものである。プロセッサ30は同一の態様でクエリ
を分析し、それに関する対応の論理形式の集合を生成する。そしてプロセッサ3
0は、クエリに関する形式の集合と、その集合内のドキュメントの各々に関連す
る論理形式の集合とを比較し、クエリ集合内の論理形式と各ドキュメントに関す
る論理形式との間に一致があるかどうかを確認する。一致を生まないドキュメン
トはそれ以上考慮されない。残りの、クエリに関する論理形式と一致する少なく
とも1つの論理形式を含むドキュメントの各々は、プロセッサ30によって保持
され、ヒューリスティックにスコア付けされる。後に説明するように、異なった
各タイプの関係、すなわち、論理形式三つ組に現われ得る深層主語、深層目的語
および機能語などに対して、予め規定された重みが割当てられる。このようなド
キュメントの各々の合計の重み(すなわちスコア)は、たとえば一致する一意な
三つ組、すなわち二重に一致する三つ組を無視したものの全ての重みの和である
。最後に、プロセッサ30は、保持されたドキュメントを、それらのスコアに基
づいてランク付けして、たとえば5個とか10個とかという予め定められた数の
グループに分けて、スコアの最も高いものからユーザに提示する。
せることができるので、以下の議論を簡単にするために、我々は1つの例を用い
て我々の発明の用途を議論することとする。この例は、ワールドワイドウェブか
らのドキュメントであって、索引付けされたデータセットを形成する英語のドキ
ュメントの、格納されたレコードを検索するために、従来のキーワードに基づい
た統計的インターネットサーチエンジンを採用する情報検索システムであろう。
このような各レコードは一般に、以下に説明するように、対応のドキュメントに
関する予め規定された情報を含む。他のサーチエンジンの場合、レコードがドキ
ュメント自体の全体を含んでもよい。以下の議論では、ドキュメントに関する、
そのドキュメントを見出すことができるウェブアドレスを含むある情報を含むレ
コードを検索する従来のインターネットサーチエンジンに使用する場合を例とし
て我々の発明を扱うが、包括的に言えば、そのエンジンによって検索される究極
的な項目とは、ウェブからドキュメントに実際にアクセスするために一般的には
そのアドレスを用いる中間的な処理が採用されるとしても、実際にはドキュメン
トである。以下の説明を考慮すると、我々の本発明が、他のいかなる情報検索の
適用例の使用にも容易に適合可能であることが当業者には容易に認められるであ
ろう。
発明の特定の実施例の高いレベルでのブロック図を示す。我々の発明は、主にこ
の特定の実施例を例として詳細に説明する。図示されるように、システム200
はクライアントパーソナルコンピュータ(PC)などのコンピュータシステム3
00を含み、これは、ネットワーク接続205を介して、ネットワーク210(
ここではインターネットであるが、たとえばイントラネットなどの他のこのよう
なネットワークをこれに代えて用いてもよい)およびネットワーク接続215に
よってサーバ220に接続される。サーバは典型的にはコンピュータ222を含
み、これはインターネットサーチエンジン225をホストし、たとえばALTA
VISTAサーチエンジン(ALTA VISTAはマサチューセッツ州メイ
ナード(Maynard, Massachusetts)のDigital Equipment Corporationの登録商 標である。)が典型であり、大容量データ記憶装置227に接続され、これは典
型的には、サーチエンジンによって索引づけられ、インターネット上のワールド
ワイドウェブによってアクセス可能であるドキュメントレコードのデータセット
である。このようなレコードの各々は典型的には、(a)ウェブブラウザによっ
て対応のドキュメントがアクセス可能であるウェブアドレス(通常はユニフォー
ムリソースロケータ−−URLと呼ばれる)と、(b)そのドキュメントに現わ
れる予め規定された内容語とを含み、エンジンによっては、そのドキュメント内
の、他の内容語に対するこのような各単語の相対的なアドレスを含み、さらに(
c)ドキュメントのうち数行だけであるか、またはドキュメントの最初の数行で
あることが多い概要と、(d)ハイパーテキストマークアップ言語(HTML)
記述フィールドに提供されるような、ドキュメントの説明とを含む。
、たとえば関連のウェブブラウザ(たとえばMicrosoft Corporationから入手可 能であり、我々の発明の教示を含むよう適当に変形された「インターネットエク
スプローラ」バージョン3.0に基づくもの)を介して、サーバ220、特にそ
こで動作するサーチエンジン222へのインターネット接続を確立する。さらに
ユーザは、ここでは線201によって表わされるクエリをブラウザに入力し、ブ
ラウザはシステム300を介して、サーバ220へのインターネット接続によっ
て、サーチエンジン225にクエリを送信する。するとサーチエンジンはデータ
セット227に記憶されたドキュメントレコードに対してクエリを処理し、エン
ジンがクエリに関連すると判断したドキュメントに対する検索レコードの集合を
生成する。エンジン225がどのようにしてドキュメントを索引付けしドキュメ
ントレコードを形成してデータ記憶装置227に記憶するか、および記憶された
このようなドキュメントを選択するためにエンジンが実際にはどのような分析を
行なうかはいずれも本発明と無関係であるため、これらの局面はいずれもこれ以
上詳細には説明しない。クエリに応答して、エンジン225が、検索されたドキ
ュメントレコードの集合をインターネット接続を介してウェブブラウザ420に
返す、といえば十分である。ブラウザ420は、エンジン225がドキュメント
を検索するのと同時に、かつ/またはその後に、クエリを分析して、その、論理
形式三つ組の対応の集合を生成する。サーチエンジンがそのサーチを完了し、ド
キュメントレコードの集合を取出し、その集合をブラウザに与えると、対応のド
キュメント(すなわち出力ドキュメントの集合を形成するもの)自体が関連のウ
ェブサーバからブラウザによってアクセスされる(これに関連したデータセット
は全体として保存されたドキュメントの「リポジトリ」を形成する。このような
リポジトリは、たとえば独立したCD−ROMベースのデータ検索アプリケーシ
ョンなどにおけるもののように、スタンドアローンのデータセットであってもよ
い)。するとブラウザはアクセスされたドキュメント(すなわち出力ドキュメン
トの内のもの)の各々を分析し、このようなドキュメントの各々に関する、論理
形式三つ組の、対応する集合を形成する。その後、後に詳細に説明するように、
ブラウザ420は、クエリと、検索されたドキュメントとの間の論理形式三つ組
の一致照合に基づいて、このような一致を有する各ドキュメントをスコア付けし
、それらのドキュメントを、線203によって表わされるようにランクの降順に
、ブラウザを通じたユーザの選択にしたがって、典型的には最も高いランクを有
する少数の予め規定されたドキュメントのグループとして、大きなスコアのもの
からランク付けされてユーザに提示され、さらにこの後、ユーザがこのように提
示されたドキュメントの十分な数を確認するまで、次のグループが続き、以下同
様である。図2はリモートサーバからドキュメントレコードおよびドキュメント
を獲得するためにネットワーク接続を例示的に利用するものとして我々の発明を
示すが、我々の発明はこのようには限定されない。図9Aに関連して以下に詳細
に説明するように、検索アプリケーションおよび我々の発明が共通のコンピュー
タ、すなわちローカルPC上で実行され、そこにたとえばCD−ROMまたは他
の適切な媒体に記憶された付随するデータセットが配置されアクセス可能であれ
ば、このようなネットワーク接続は必要ない。
のコンピュータシステム300はは本発明の教示を取入れたものである。
テムは、全て従来からバス370によって相互接続されている入力インターフェ
イス(INPUT I/F)330と、プロセッサ340と、通信インターフェ
イス(COMM I/F)350と、メモリ375と、出力インターフェイス(
OUTPUT I/F)360とを含む。メモリ375は例えばランダムアクセ
スメモリ(RAM)およびハードディスク記憶装置である種々の様式(これらは
全て簡略化のために特に示してはいない)を一般的に含むが、オペレーティング
システム(O/S)378と、アプリケーションプログラム400とを記憶する
。我々の発明の教示を実装するソフトウェアは典型的にはアプリケーションプロ
グラム400に組込まれ、この実施例では特にウェブブラウザ(図4に示される
)に組込まれる。このオペレーティングシステムは、ウィンドウズNTオペレー
ティングシステム(ワシントン州レッドモンド(Redmond, Washington)のMicro
soft Corporation(登録商標「ウィンドウズNT」も所有する)から現在入手可
能である。)など、どのような従来のオペレーティングシステムによって実装さ
れてもよい。O/S 378の構成要素であるプロセスは発明とは無関係である
ため、各部分については説明しない。しかしながら、ブラウザ、従って我々の発
明のソフトウェアを、オペレーティングシステム自体の中に組込むこともできる
。しかし、例示および簡略化の目的のために我々は、ブラウザがオペレーティン
グシステムから分離可能であり、アプリケーションプログラム400内にあると
仮定する。アプリケーションプログラム400はO/S 378の制御下で実行
される。ウェブブラウザを含む実行アプリケーションプログラムの各々に対して
、1つまたは2つ以上の別個のタスクのインスタンスが、ユーザが特定した各コ
マンド、典型的にはメニューとか、ツールバー内のアイコンなど選択可能なコマ
ンドが利用可能な場合にユーザが入力でバイス390を適切に操作することによ
って対話的に入力されるコマンドに応答して、ユーザによって呼出され、付随す
る情報がディスプレイ380に提示される。
。すなわち、たとえばインターネットおよび/またはイントラネットなどのネッ
トワーク化された他の設備(いずれも全体的に図2にネットワーク210として
示される)から、ネットワーク接続205を介して通信インターフェイス350
(図3に示される)へ達するネットワーク空供給される情報、または経路310
を介して専用の入力ソースから入力インターフェイス330へ達するものである
。専用の入力は、たとえばローカルであると、リモートであると、または他の入
力ソースであるとにかかわらず、外部のデータセットなどさまざまなソースから
生ずる。入力インターフェイス330は経路310に接続され、入力情報の、種
々の専用のソースの各々をコンピュータシステム300に物理的に接続してイン
ターフェイスするために必要である対応の電気接続を提供する適当な回路構成を
含む。アプリケーションプログラム400は、オペレーティングシステムの制御
下で、ネットワーク接続205を介してリモートウェブサーバなどの外部ソース
と、または経路310を介して専用のソースなどと、コマンドおよびデータを交
換し、プログラムの実行時に典型的にはユーザによってリクエストされる情報の
送受信を行なう。
ウスなどのユーザ入力デバイス390をコンピュータシステム300に電気的に
接続し、インターフェイスする。従来のカラーモニタなどのディスプレイ380
および従来のレーザプリンタなどのプリンタ385は、それぞれリード363お
よび367によって出力インターフェイス360に接続される。出力インターフ
ェイスはディスプレイおよびプリンタをコンピュータシステムに電気的に接続し
てインターフェイスさせるために不可欠な回路構成を提供する。実行中のアプリ
ケーションからのハードコピー出力情報はプリンタ385によってユーザに与え
られる。特に、ディスプレイ、プリンタおよび入力デバイス390(特定的には
マウスおよびキーボード)を適切に操作することにより、システム300に配置
されているユーザは、たとえば、インターネットを介して、そこからさらにアク
セス可能なサーチエンジンを含む、膨大な数のリモートウェブサーバのうちのい
ずれかと画面を使って通信し、ローカルに表示および印刷するためにそこからド
キュメントなどの情報を引出すことができる。
ドウェア構成要素およびメモリ375に記憶されたソフトウェアのそれぞれの局
面は従来からのものであり周知であるため、これ以上詳細には説明しない。
プログラム400の非常に高いレベルのブロック図を示す。これらのプログラム
は本発明に関連する範囲では、図4に示されるようにウェブブラウザ420を含
み、このウェブブラウザ420は、我々の本発明を実現するための検索プロセス
600(図6Aおよび図6Bに関連して後に詳細に説明される)を含む。ウェブ
ブラウザと、ALTA VISTAサーチエンジンなどのユーザが選択した統計
的サーチエンジンとの間にインターネット接続が確立されているものと想定する
と、ユーザは、図4に示される線422で表わされるように、プロセス600に
フルテキスト(「リテラル」)サーチ用のクエリを与える。このプロセスは、線
426で表わされるように、ウェブブラウザを介してサーチエンジンにクエリを
転送する。さらに、特に示してはいないが、プロセス600はさらにクエリを内
部で分析し、その対応の論理形式三つ組を生成し、これらは後にコンピュータ3
00内にローカルに記憶される。クエリに応答して、サーチエンジンは線432
で表わされるように統計的に検索されたドキュメントレコードの集合をプロセス
600に与える。これらのレコードの各々は、上述のとおり、のドキュメントを
アクセスすることができるウェブアドレス、特定的にはURLと、さらに、その
ドキュメントがあるリモートウェブサーバによって要求される、そのドキュメン
トを含むコンピュータファイルをインターネットを介してダウンロードするのに
十分な、適切なコマンドを含む。プロセス600がレコード全てを受信すると、
このプロセスは、ウェブブラウザ420を介して、かつ線436によって表わさ
れるように適切なコマンドを送信し、レコードによって特定された全てのドキュ
メント(すなわち出力ドキュメントの集合を形成するもの)にアクセスしてそれ
らをダウンロードしようとする。そしてこれらのドキュメントは、それらに対応
するウェブサーバから順次アクセスされ、線442で表わされるように、ウェブ
ブラウザ420に、特定的にはプロセス600にダウンロードされる。これらの
ドキュメントがダウンロードされると、プロセス600はこのようなドキュメン
トの各々を分析して、それに関する対応の論理形式三つ組を生成してローカルに
記憶する。その後、各ドキュメントに関する論理形式三つ組に対して、クエリに
関する論理形式三つ組を比較することにより、プロセス600は少なくとも1つ
の一致する論理形式三つ組を含む各ドキュメントをスコア付けし、それらのスコ
アに基づいてこれらの特定のドキュメントをランク付け、最後に、線446によ
って表わされるように、ドキュメントのスコアの降順に、グループ毎にこれらの
特定のドキュメントをユーザに提示するようにブラウザ400に対して指示する
。ブラウザ400はディスプレイ380(図3参照)のスクリーン上に適切な選
択ボタンを作成し、これによりユーザは、ユーザのマウスでそれを適切に「クリ
ック」することによって選択を行ない、所望にしたがって、後続するドキュメン
トのグループの各々を表示することができる。
評価するために、この時点で、我々の発明を実現する処理の説明から離れ、関連
する範囲で本発明に用いられる論理形式および論理形式三つ組を例示して説明し
、それらが生成される態様を簡単に説明する。
ラベル付けされた関係によってリンクされる、有向非循環グラフである。論理形
式は、句内の重要な単語、この単語には上位語および/またはその類義語を含め
ることもあり得るが、これら単語間の意味論的な関係を描く。図5Aから図5D
を参照して説明され例示されるように、論理形式は種々の多くの形態のうちいず
れかをとることができ、たとえば論理形式三つ組のリストなどの、論理形式グラ
フまたは任意のそのサブグラフの形式をとることができる。たとえばこれら三つ
組の各々は「語−関係子−語」という形式を持つ。この実施例では、本発明は論
理形式三つ組を生成して比較するが、本発明は、単語間の意味論的な関係を描く
ことができるものであれば、上述したような他のいかなる形式を容易に利用する
ことができる。
とすることによって最もよく理解できるため、まず図5Aを参照する。この図は
、例示的な入力文字列、特定的には「The octopus has three hearts.」という 文に関する論理形式グラフ515と論理形式三つ組525とを示す。
成するために、この文字列はまずパージングされてその構成要素の単語に分解さ
れる。その後、このような各単語に対して、予め格納された辞書にある、予め定
義されたレコード(サーチエンジンによって採用されるドキュメントレコードと
混乱してはならない。)を用いて、これらの構成要素の単語に対応のレコードが
、予め規定された文法規則によって組み合わせられて大きな構造または構文にな
り、さらにそれらは予め定められた文法規則によって再度組み合わせられて、構
文解析木などのさらに大きな構造を形成する。その後論理形式グラフが解析木か
ら構築される。特定の規則が特定の構成要素の集合に適用可能であるか否かは、
部分的には、単語レコードに、ある対応の属性およびそれらの値が存在するか否
かによって支配される。そしてこの論理形式グラフは、一連の論理形式三つ組に
変換される。例えば、我々の発明はおよそ165,000個のヘッド単語のエン
トリを有する辞書を使用する。この辞書は入力文字列に関する解析木が構築でき
るように、入力文字列内の単語に固有な統語論上および意味論上の特性を規定す
る、前置詞、接続詞、動詞、名詞、オペレータおよび数量詞などの、さまざまな
クラスの単語を含む。明らかに、論理形式(またはその問題に関しては、意味論
上の関係を描くことができる、論理形式内の論理形式三つ組または論理形式グラ
フ)を、後に対応のドキュメントが検索されたときに計算するのではなく、対応
のドキュメントが索引付けされている間に、予め計算してたとえばそのドキュメ
ントに関するレコード内に格納して、後のアクセスに使用するようにできる。図
10から図13Bに関連して後に説明する我々の発明の別の実施例に見られるよ
うに、このように予め計算して格納しておくと、自然言語処理の量が劇的に低減
するという効果があり、したがって、我々の発明に従って、検索されたドキュメ
ントを扱うために必要な関連の実行時間が短くなる。
単語の各々に関して辞書内にある予め規定されたレコードを用いて形態素分析さ
れ、それに関するいわゆる「語幹」(または「基体」)形式を生成する。語幹は
、たとえば動詞の時制および単数−複数といった名詞の変形などの種々の単語の
形を、パーサが使用できるような共通の形態素的形式に正規化するために用いら
れる。一旦語幹形式が作成されると、文法規則および構成要素の単語のレコード
内にある属性を用いて、入力文字列がパーサによって構文解析され、それに関す
る構文解析木が生成される。この木は入力文字列の構造を示し、具体的には、た
とえば入力文字列内の「The octopus」という名詞句のような各単語または句と 、たとえば名詞句に対するNPのような、対応の文法的機能のカテゴリと、その
中の、構文的に関連した各単語または句へのリンクとを表わす。例示的な文51
0については、関連の構文解析木は以下のとおりであろう。
義する。文のタイプには、平叙文に関する「DECL」(上の例)と、命令文に
関する「IMPR」と、疑問文に関する「QUES」とが含まれる。開始ノード
の右下垂直に表示されるのは、第1レベルの構文である。この構文は、典型的に
は主動詞(この例では「has」という単語)である、星印によって示されたヘッ ドノードと、(この例では「The octopus」という名詞句である)前置修飾語句 と、その後にくる(「three hearts」という名詞句である)修飾語句とを有する
。木の葉の各々は辞書に含まれる単語または句読点を含む。ここでは、ラベルと
して「NP」は名詞句を示し、「CHAR」は句読点を示す。
510に関するグラフ515などの論理形式グラフが生成される。論理形式グラ
フを作成するプロセスは、入力文字列の構文解析から下層の構造を抽出すること
を含み、論理形式グラフは、互いの間に意味関係と、その関係の機能的性質を有
すると定義された複数の単語を含む。種々の意味関係の分類に使用される「深層
」の格(Case)すなわち機能的役割は、以下を含む。
木の各ノードが検査される。上記の関係に加えて、たとえば下記の他の意味的役
割が使用される。
ラフ515である。入力文字列中の単語で互いの間に(たとえば「Octopus」と 「Have」との間の)意味関係が認められる単語は、互いにリンク付けられ、それ
らの間の関係はリンク付け属性(たとえばDsub)として特定されて示されて
いる。このグラフは、入力文字列510に関するグラフ515に代表されるよう
に、各入力文字列に関する主題および修飾語句の構造を捕らえている。とりわけ
、論理形式分析は、前置詞および冠詞などの機能的単語を、グラフ内に示された
特徴または構造上の関係にマッピングする。論理形式分析はさらに前方照応を解
決、すなわち、たとえば代名詞と、同一指示名詞句との間の正しい先行関係を規
定し、さらに省略に関する適切な機能的関係を検出して示す。論理形式分析時に
は、曖昧さおよび/または他の言語的特異性に対処するためにさらに処理が施さ
れることもあり得る。そして、対応の論理形式三つ組が従来の態様で論理形式グ
ラフから読出され、組として記憶される。各三つ組は、グラフに示されるように
、互いの間の意味関係によってリンク付けられた2つのノード単語を含む。例と
しての入力文字列510に関しては、論理形式三つ組525が処理グラフ515
から結果として得られる。ここでは、論理形式三つ組525は、入力文字列51
0に固有の意味論的な情報を全体として伝える3つの別個の三つ組を含む。
び570、すなわち例示の文「The octopus has three hearts and two lungs. 」、「The octopus has three hearts and it can swim.」、および「I like sh
ark fin soup bowls.」に対しては、論理形式グラフ535、555および57 5ならびに論理形式三つ組540、560および580がそれぞれ結果として得
られる。
含む従来の態様のものとは別に、論理形式三つ組の全てを正しく得るために必要
な追加の自然言語処理が必要な、3つの論理形式構造がある。例示の文「The oc
topus has three hearts and two lungs.」、すなわち入力文字列530におけ るような等位語の場合、単語と、その意味関係と、等位された構成要素の値の各
々とに対する論理形式三つ組が生成される。「特殊な」グラフウォークによると
、図540には2つの論理形式三つ組「have-Dobj-heart」および「have-Dobj-l
ung」があることがわかる。従来のグラフウォークのみを用いると、1つの論理 形式三つ組「have-Dobj-and」しか得られなかったであろう。同様に、指示語(R
efs)を有する構成要素の場合、例示の文「The octopus has three hearts and
it can swim.」、すなわち入力文字列550の場合の様に、従来のグラフウォー
クによって生成された三つ組の他に、単語と、その意味関係と、Refs属性の値の
各々とに対する論理形式三つ組を生成する。この特殊なグラフウォークによると
、従来の論理形式三つ組「swim-Dsub-it」の他に論理形式三つ組「swim-Dsub-oc
topus」が三つ組560に見出される。最後に、例示の文「I like shark fin so
up bowls.」、すなわち入力文字列570におけるように、名詞の修飾語で構成 される場合、名詞の複合語の可能な内部構造を表わすためにさらなる論理形式三
つ組が生成される。従来のグラフウォークでは、可能な内部構造[[shark] [fin]
[soup] bowl]を反映する論理形式三つ組「bowl-Mods-shark」、「bowl-Mods-fi
n」および「bowl-Mods-soup」が生成される。特殊なグラフウォークの場合、下 記の可能な内部構造[[shark fin] [soup] bowl]、[[shark] [fin soup] bowl]お
よび[[shark [fin] soup] bowl]を表わすためにそれぞれ追加の論理形式三つ組 「fin-Mods-shark」、「soup-Mods-fin」、および「soup-Mods-shark」が生成さ
れる。
ため、さらに詳細な説明は省略することとする。しかしながら、これに関するさ
らなる詳細は、1996年6月28日に出願され、連続番号第08/674,6
10号が付与された「構文解析木から意味論的論理形式を計算するための方法お
よびシステム("Method and System for Computing Semantic Logical Forms fr
om Syntax Trees")」と題された同時係属中の米国特許出願と、特に1997年
3月7日に出願された、連続番号 が付与された「テキストの意味表現
を利用する情報検索(“Information Retrieval Utilizing Semantic Represent
ation of Text”)」とを参照されたい。これらはいずれも本願の譲受人に譲渡 されており、引用によってここに援用される。
理の議論に戻ることとする。
々の発明の検索プロセス600のフローチャートは、図6Aおよび図6Bにまと
めて示され、これらの図面の正確な配列が図6に示される。破線で描かれたブロ
ック225に示される動作以外の、これらの図面に示される残りの動作は、たと
えばクライアントPC300(図2および図3参照)であるコンピュータシステ
ムによって行なわれ、具体的にはウェブブラウザ420内で行なわれる。理解を
容易にするために、以下の説明を読みながら図2、図3、図6Aおよび図6Bを
同時に参照すべきである。
クは、実行されると、フルテキスト(リテラル)のクエリをウェブブラウザ42
0に入力することをユーザーに促す。クエリは単一の質問(たとえば「Are ther
e any air-conditioned hotels in Bali?」)でも、単一の文(たとえば「Give me contact information for all fireworks held in Seattle during the mon
th of July.」)でも、文の一部(たとえば「Clothes in Ecuador」)の形式で あってもよい。この質問が得られると、実行処理は経路607を介してブロック
610に、および経路643を介して経路645に分岐する。ブロック645が
実行されると、それはNLPルーチン700を呼出し、クエリを分析し、その対
応の論理形式三つ組の集合を構築してローカルに記憶する。ブロック610が実
行されると、それは、破線615で表わされるように、インターネット接続によ
って、フルテキストのクエリを、ウェブブラウザ620から、サーバ220に置
かれたエンジン225などのリモートサーチエンジンに送信する。この時点で、
ブロック625がサーチエンジンによって実行され、クエリに応答してドキュメ
ントレコードの集合を取出す。この集合が形成されると、破線630で表わされ
るように、その集合はリモートサーバによってコンピュータシステム300に再
送信され、特に、そこで実行されているウェブブラウザ420に戻される。その
後、ブロック635が実行され、レコードの集合を受信し、後に、各レコードに
対して、そのレコードからURLを抽出し、そのURLでウェブサイトにアクセ
スし、さらにはそのレコードに対応するドキュメントを含む関連ファイルをそこ
からダウンロードする。全てのドキュメントがダウンロードされると、ブロック
640が実行される。このような各ドキュメントに対して、このブロックはまず
、そのドキュメントに関連するHTMLタグ内にある全てのテキストを含む、全
てのテキストをそのドキュメントから抽出する。その後、一度に一つの文に対し
て行なわれる自然言語処理を容易にするために、各ドキュメントに関するテキス
トが、従来の一文切出し処理によって各文章(または質問)がファイル内の別々
の行を占めるようなテキストファイルに切出される。その後、ブロック640は
、そのドキュメントのテキストの各行に対して、NLPルーチン700(これは
図7に関連して後に詳細に説明される)を繰返して呼出し、これらのドキュメン
トの各々を分析し、そのドキュメントのテキストの各行に関する対応の論理形式
三つ組の集合を構築してローカルに記憶する。ブロック645における動作は、
ブロック610、635および640におけるものと基本的に並行して行なわれ
るものとして説明したが、前者のブロックの動作は、実際の実装での条件に基づ
いて、ブロック610、635および640の動作と順次に、それらの前または
後のいずれかに行なってもよい。これに代えて、図10から図13Bに関連して
後に説明する我々の発明の別の実施例の場合のように、各ドキュメントに関する
論理形式三つ組を予め計算して記憶しておき、後のドキュメントの検索時に使用
してもよく、この場合にはこれらの三つ組はドキュメントの検索時には計算され
ずに単にアクセスされるだけである。この場合、これら三つ組は、何らかの態様
で、その格納されたドキュメントのプロパティ(属性)として、または、たとえ
ばそのドキュメントに関するレコードまたはそのドキュメントを含むデータセッ
トのいずれかに別のエントリとして、記憶されるであろう。
式三つ組の集合がクエリおよび出力ドキュメントの集合内の検索されたドキュメ
ントの各々の双方に対して構築され完全に記憶されると、ブロック650が実行
される。このブロックは、クエリの論理形式三つ組の各々と、検索されたドキュ
メントの各々に関する論理形式三つ組の各々とを比較して、クエリのいずれかの
三つ組と、ドキュメントのいずれかの三つ組のいずれかとの一致を突き止める。
例としての一致の形式は、これらの三つ組の間での、ノード単語と、関係子タイ
プとの双方の点においてこれら2つの三つ組間で同一の一致が見られることと定
義される。特に、例示の1対の論理形式三つ組、すなわち「語1a−関係子1−
語2iおよび語1d−関係子2−語2b」の場合、ノード単語の語1aおよび語
1bが同一であり、ノード単語の語2aおよび語2bが同一であり、関係子1お
よび関係子2が同じである場合にのみ一致が起こる。1つの三つ組の3つの要素
の全てが別の三つ組の対応する要素と同一に一致しないならば、これらの2つの
三つ組は一致しない。ブロック650が完了すると、ブロック655が実行され
、一致する三つ組が得られない、すなわちクエリの三つ組と一致する三つ組がな
い、検索された全てのドキュメントが破棄される。その後、ブロック660が実
行される。ブロック660により、一致する三つ組の関係子のタイプ、およびこ
れらのドキュメントの各々に関して存在するそれらの重みに基づいて、残りのド
キュメント全てにスコアが割当てられる。特に、論理形式三つ組に生じ得る異な
ったタイプの関係子の各々に、図8Aの表800に示されるもののような対応の
重みが割当てられる。たとえば、図示されるように、例示の関係子Dobj、Dsub、
OpsおよびNadjにはそれぞれ、100、75、10および10という、予め定め られた静的な数の重みを割当てることができる。重みはクエリとドキュメントと
の正しい意味上の一致を示す上で、その関係子に帰すると考えられる相対的な重
要性を反映する。これらの重みの実際の数値は一般に、経験に基づいて定義され
る。後に図8Bに関連して詳細に説明するように、残りのドキュメントの各々に
関して、そのスコアは予め定義された関数であり、ここでは例として、その一意
に一致する三つ組(二重に一致する三つ組は全て無視する。)の重みの数値の和
である。こうしてドキュメントが一旦重み付けされると、ブロック665が実行
されて、スコアの降順に、ドキュメントをランク付ける。最後に、ブロック67
0が実行されて、典型的には、最も高いスコアを示す予め規定された小さなグル
ープのドキュメント、典型的には5個から10個のドキュメントをランク順に表
示する。その後、ユーザーは、たとえばウェブブラウザ420によって表示され
た対応のボタン上でユーザーのマウスを適当に「クリック」することにより、コ
ンピュータシステム(クライアントPC)300に、ランク付けされたドキュメ
ントの次のグループを表示させ、以下同様に、ユーザーがランク付けされたドキ
ュメント全てを順次十分に検討するまでこれを続け、そこでプロセス600を完
了する。
行の入力テキストを与えられ、そのテキストがクエリ、ドキュメント内の文、ま
たはテキストの一部のいずれの場合にも、それに関する対応の論理形式三つ組を
構築する。
行を処理し、図5Aに示される例示のグラフ515などの論理形式グラフを生成
する。この処理は、構文解析木を生成する形態素的および統語論上の処理を含み
、この構文解析木から後に論理形式グラフが算出される。その後、図7に示され
るように、ブロック720が実行されて、グラフから対応の論理形式三つ組の集
合を抽出する(読出す)。これが行なわれると、ブロック730が実行されて、
このような論理形式三つ組の各々を、別個で区別された、フォーマット化された
テキスト文字列として生成する。最後に、ブロック740が実行されて、データ
セット(すなわちデータベース)に入力テキストの行を記憶し、フォーマット化
された一連のテキスト文字列として、その行に関する論理形式三つ組の集合を記
憶する。この集合が完全に記憶されると、実行処理はブロック700を出る。こ
れに代えて、論理形式三つ組の代わりに、たとえば論理形式グラフのような、異
なった表現が論理形式に関連付けられて我々の発明に関し用いられる場合には、
その特定の形式をフォーマット化された文字列として生成するようにブロック7
20および730を容易に変更でき、データセットへの論理形式三つ組の代わり
にその形式を記憶するようにブロック740を変更できる。
ントをランク付ける、我々の発明の態様を十分に認識するために、図8Bを参照
する。この図は、我々の発明の教示に従う論理形式三つ組の比較、ドキュメント
の記憶、ランク付けおよび選択処理を図で示し、これらは、例示のクエリおよび
検索された3つのドキュメントの例示の組に関する、図6Aおよび図6Bに全て
示されるブロック650、660、665および670において行なわれる。例
示の目的で、ユーザーがフルテキストのクエリ810を我々の発明の検索システ
ムに与えたと仮定し、このクエリが「How many hearts does an octopus have? 」というものであるとする。さらに、このクエリに応答して、統計的サーチエン
ジンによって最終的に3つのドキュメント820が検索されたものとする。これ
らのドキュメントのうち、第1のドキュメント(ドキュメント1と記す。)はar
tichoke heartsおよびoctopusを含むレシピである。第2のドキュメント(ドキ ュメント2と記す。)はoctopi(タコ一般)に関する論文である。第3のドキュ
メント(ドキュメント3と記す。)はdeer(鹿)に関する論文である。これらの
3つのドキュメントおよびクエリはそれらの構成要素の論理形式三つ組に変換さ
れ、それらに関する処理は包括的に「NLP」(自然言語処理)によって表わさ
れる。結果として得られる、クエリとドキュメント1、ドキュメント2およびド
キュメント3とに関する論理形式三つ組は、それぞれブロック830、840、
850および860に与えられる。
5で表わされるように、クエリに関する論理形式三つ組がそれぞれドキュメント
1、ドキュメント2およびドキュメント3に関する論理形式三つ組と順次比較さ
れ、いずれかのドキュメントが、クエリのいずれかの論理形式三つ組と一致する
三つ組を含むか否かが確認される。ドキュメント1の場合のように、このような
一致する三つ組を含まないドキュメントは破棄され、さらに考慮されない。一方
、ドキュメント2およびドキュメント3は一致する三つ組を含む。特に、ドキュ
メント2はこのような三つ組を3つ含む。すなわち、これらはたとえば1つの文
に関連する「HAVE-Dsub-OCTOPUS」および「HAVE-Dsub-HEART」と、たとえば別の
文に関連する「HAVE-Dsub-OCTOPUS」である(これらの文は特定的には示さない )。これらの三つ組のうち2つは同一であり、すなわちそれは「HAVE-Dsub-OCTO
PUS」である。ドキュメントに関するスコアは例えば、そのドキュメント内の、 一意に一致する三つ組全ての重みの数値の和である。全てのドキュメントに関し
、二重に一致する三つ組は全て無視される。三つ組に生じ得る異なったタイプの
関係子の相対的な重みの例示的なランク付けは、最も大きな重みから小さな重み
の順に、最初が動詞−目的語の組合せ(Dobj)、動詞−主語の組合せ(Dsub)、
前置詞および機能語(たとえば(Ops)、および最後には修飾語句(たとえばNad
j)である。このような重み付け方式を、図8Aに示される例示の三つ組重み付 け表800に示す。この図を簡単にするために、表800は論理形式三つ組に生
じ得る種々の関係子全てを含むのではなく、図8Bに示される三つ組に関連する
ものだけを示す。この測定基準により、各ドキュメントのうちそのスコアに寄与
する特定の三つ組にチェック(「レ」)マークを付与してある。もちろん、ドキ
ュメントにスコア付けするための予め規定される測定基準として我々が選択した
もの以外を用いてもよく、たとえば、ドキュメントの選択性(区別)を高めるた
めに重みを加算するのではなく乗算すること、または重みを別の態様っで加算す
ること、たとえば同じタイプの複数の一致を含めることおよび/または上述以外
の他の三つ組の重みを除くことなどであってもよい。さらに、任意のドキュメン
トに関して、スコアはある態様で下記のものを考慮に入れるであろう。すなわち
、そのドキュメントにおける三つ組自体のノード単語、そのドキュメント内のこ
れらのノード単語の頻度または意味的な内容、そのドキュメント内の特定のノー
ドの単語の頻度または意味的な内容、またはそのドキュメント内の特定の論理形
式(またはそれのパラフレーズ)および/または特定の論理形式三つ組全体とし
ての頻度、ならびにそのドキュメントの長さである。
明記される重みを考慮すると、ドキュメント2のスコアは175であり、これは
ドキュメント内の、ブロック850に示される第1の文に関連した最初の2つの
三つ組の重み、すなわち100および75を組合せることにより形成される。こ
のドキュメント内の、その第2の文に関連し、このブロックに記載されている第
3の三つ組であって、ドキュメント内に存在する他の三つ組の1つと既に一致し
ているものは無視される。同様に、ドキュメント3に関するスコアは100であ
り、これは、ブロック860に記載されているようにこの特定のドキュメント内
で唯一の一致する三つ組に関する重み、すなわちここでは100により形成され
る。スコアに基づいて、ドキュメント2がドキュメント3より前にランク付けさ
れ、これらのドキュメントはその順番でユーザーに提示される。ここでは起こら
なかったが、いずれか2つのドキュメントが同じスコアを有する場合、これらの
ドキュメントは従来の統計的サーチエンジンによって提供されるのと同じ順番で
ランク付けされ、その順番でユーザーに提示される。
さまざまな部分が、単一のコンピュータ内に存在しても、全体として情報検索シ
ステムを形成する種々のコンピュータに分散いてもよいことが容易に理解される
であろう。この点に関し、図9Aから図9Cはそれぞれ、我々の本発明の教示を
採用した情報検索システムの異なった3つの実施例を示す。
Cなどの単一のローカルコンピュータ910によって行なわれる。この場合、コ
ンピュータ910はサーチエンジンをホストし、そのエンジンによって、入力ド
キュメントを索引付け、ユーザーによって与えられたフルテキストのクエリに応
答して(CD−ROMまたは他の記憶媒体などによってそこにローカルに置かれ
るか、またはそのコンピュータにアクセス可能である)データセットをサーチし
、出力ドキュメント集合を形成する、検索されたドキュメントの集合を最終的に
生成する。このコンピュータはさらに我々の発明の処理をホストし、クエリおよ
びこのような各ドキュメントの両方を分析して、対応の論理形式三つ組の集合を
生成し、その後三つ組の集合を比較し、上述の態様でドキュメントをスコア付け
てランク付け、最後に、たとえばそこに配置されている、またはそこにアクセス
可能なローカルユーザーに結果を提示する。
況を包含するものであって、ここでは検索システムはリモートサーバにネットワ
ーク接続されたクライアントPCで形成される。ここでは、クライアントPC9
20はネットワーク接続925によってリモートコンピュータ(サーバ)930
に接続される。クライアントPC920にいるユーザーはフルテキストのクエリ
を入力し、PCはこれをネットワーク接続を介してリモートサーバに送信する。
クライアントPCはさらにクエリを分析して、その対応の論理形式三つ組の集合
を生成する。サーバは、たとえば従来の統計的サーチエンジンをホストし、その
結果このクエリに応答して、統計的検索を行ない、ドキュメントレコードの集合
を生成する。そしてサーバはレコードの集合を戻し、最終的に、クライアントの
命令によって、またはサーチエンジンまたは関連ソフトウェアの能力に基づいて
自律的に、出力ドキュメントの集合内にある各ドキュメントをクライアントPC
に戻す。そしてクライアントPCは出力ドキュメントの集合内の、受信した対応
のドキュメントの各々を分析し、それに関する論理形式三つ組の集合を生成する
。クライアントPCは次いで、三つ組の集合を適切に比較し、上述の態様でドキ
ュメントを選択し、スコア付けし、ランク付けし、最後に結果をローカルユーザ
ーに提示して、その処理を完了する。
アおよびネットワーク接続を用いるが、クライエントPC920がローカルユー
ザからのフルテキストクエリの依頼を受入れ、そのクエリの依頼をネットワーク
接続925を介してリモートコンピュータ(サーバ)930へ転送する。このサ
ーバは単に従来のサーチエンジンをホストするのではなく、本発明に従う自然言
語処理を提供する。この場合、クライエントPCではなくサーバがクエリを適切
に分析してそのための論理形式三つ組の対応の集合を生じるであろう。サーバは
また必要であれば出力ドキュメント集合内の検索された各ドキュメントをダウン
ロードし、次にこのような各ドキュメントを分析してそのための論理形式三つ組
の対応の集合を生成するであろう。その後、サーバはクエリのための三つ組の集
合とドキュメントとを適切に比較し、前述のようにドキュメントを選択し、それ
にスコアを付け、ランクを付けるであろう。一旦このランク付けが行なわれると
、サーバ930は残りの検索ドキュメントをランク順にネットワーク接続925
を介してクライエントPC920に送信し、そこで表示させるであろう。サーバ
はこれらのドキュメントを前述のようにユーザの指示に従ってグループごとに送
信するか、それらをグループごとに選択してクライエントPCで表示させるため
に全てのドキュメントを順次送信することができる。
自然言語処理および関連の処理の全てを与える1台のみのコンピュータによって
実現される必要はなく、図9Dに示す分散処理方式であってもよい。その場合、
このサーバが請け負う処理は分散処理方式における個別のサーバ間に分散される
。ここで、サーバ930は、メッセージを接続950を介して(サーバ1、サー
バ2、…、サーバnを含む)一連のサーバ960に分散するフロントエンドプロ
セッサ940からなる。これらのサーバの各々が本発明のプロセスの特定の部分
を実施する。この点で、サーバ1は後の検索のために入力ドキュメントの索引付
けを行ない大容量データ記憶装置上のデータセットに格納するために用いること
ができる。サーバ2は、フロントエンドプロセッサ940によって送られるユー
ザから与えられるクエリに応答して大容量データ記憶装置から一組のドキュメン
トレコードを引出すための従来の統計的エンジンのようなサーチエンジンを実現
できる。これらのレコードは、サーバ2からフロントエンドプロセッサ940を
介してたとえばサーバnに送られ、対応のウェブサイトまたはデータベースから
の対応の各ドキュメントを出力ドキュメント集合中にダウンロードするというよ
うな後処理が行なわれるであろう。フロントエンドプロセッサ940はまたクエ
リをサーバnに送るであろう。サーバnは次にそのクエリおよび各ドキュメント
を適切に分析して論理形式三つ組の対応の集合を生じ、次に三つ組の集合を適切
に比較し、前述のようにドキュメントを選択し、それにスコアをつけ、ランクを
つけ、その後ランク付けされたドキュメントをフロントエンドプロセッサ940
を介してクライエントPC920に戻して、そこでランク付けの表示がされるよ
うにする。もちろん、本発明の処理において用いられるさまざまな動作は、実行
時に生ずる条件および/または他により生ずる条件次第で、静的であれ動的であ
れ、他の多くの方法のうちの任意の方法によってサーバ960中に分散されても
よい。さらに、サーバ930は、たとえば従来のサーチエンジンのためのデータ
ベースと自然言語処理のために用いられる辞書との両方が記憶され、サーバ内の
全てのプロセッサからアクセス可能な共用直接アクセス記憶装置(DASD)で
ある、たとえば周知のシスプレックス構成(または他の同様の分散マルチプロセ
ス環境)によって実現することもできる。
ンロードし、次にそのレコードをたとえばクライエントPCによってローカルに
分析してその対応の論理形式三つ組を生じるものとして説明したが、これに替え
てこれらの三つ組はドキュメントに対しサーチエンジンが索引付けをしている間
に生成されてもよい。この点で、サーチエンジンがたとえばウェブクローラを用
いて、索引付けを行なうための新しい各ドキュメントを見つけたときに、エンジ
ンがそのドキュメントのための完全なファイルをダウンロードし、それからその
直後またはさらに後にバッチ処理でそのドキュメントを分析し、その論理形式三
つ組を生成することによってそのドキュメントを前処理することができる。前処
理の終了時にサーチエンジンは次にこれらの三つ組をそのドキュメントのための
索引付けされたレコードの一部としてそのデータベースに記憶するであろう。後
に、そのドキュメントレコードがたとえばサーチクエリに応答して検索されるた
びに、そのための三つ組がドキュメントレコードの一部として比較などの目的の
ためにクライエントPCに戻される。サーチエンジン内でのドキュメントの前処
理によって、クライエントPCでのかなりの量の処理時間が節約されるという効
果があり、それによってクライエントのスループットを増大させることができる
。
例として説明したが、本発明は、(a)インターネットベースであろうとなかろ
うと、専用のネットワーク設備等によってアクセス可能な任意のネットワークア
クセス可能なサーチエンジン、(b)それ自身が所持する予め記録されたデータ
セットに対して動作するローカルなサーチエンジン、たとえば、百科事典、年鑑
または他の独立型スタンドアローンデータセットに代表されるCD−ROMベー
スのデータ検索アプリケーション、および/または(c)その任意の組合せでの
使用に等しく適用可能である。
を集合的に示し、この実施例ではドキュメントの前処理によって論理形式三つ組
を発生し、結果として生じる三つ組、ドキュメントレコードおよびドキュメント
自体を独立型スタンドアローンデータセットとして既存の記憶媒体、たとえば、
1つ以上のCD−ROMまたは(着脱可能なハードディスク、テープ、もしくは
、光磁気または大容量磁気または電子記憶装置に代表される)他の可搬の大容量
媒体にまとめて保存することによりエンドユーザへの頒布が容易になる。これら
の図面の正しい配置は図10に示すとおりである。検索アプリケーション自体と
それに付随するサーチされるべきデータセットとを共通の媒体にまとめて入れる
ことによって、スタンドアローンのデータ検索アプリケーションが得られ、それ
によって、ドキュメントを検索するためにリモートサーバにネットワーク接続す
ることが必要でなくなる。
0051はドキュメントを集め索引付けしてデータセット、すなわち図示するデ ータセット1030を作成し、データセット1030は、独立型ドキュメント検
索アプリケーション、たとえば、百科事典、年鑑、(判例集のような)専用ライ
ブラリ、定期刊行物のコレクション等のためのドキュメントリポジトリを形成す
る。大記憶容量を有するCD−ROMおよび他の形態の媒体を複製するためのコ
ストは急速に低下しつつあり、この実施例は大量のドキュメントをそれを正確に
サーチする性能とともに広いユーザコミュニティに費用効率よく頒布するために
特に魅力的である。
メントは任意数の多様なソースから集められ、コンピュータ1010に順次与え
られる。このコンピュータはメモリ1015内に記憶されている適切なソフトウ
ェアによってドキュメント索引付けエンジンを実現し、ドキュメント索引付けエ
ンジンは、このような各ドキュメントのためのレコードをデータセット1030
内に作成し、そのドキュメントのためのレコードに情報を保存し、またドキュメ
ント自体のコピーを含む適切なエントリをデータセット内に作成し保存する。エ
ンジン1015は三つ組発生プロセス1100を実行する。図11に関連して以
下に詳細に説明するこのプロセスは索引付けされる各ドキュメントごとに別個に
実行される。本質的には、このプロセスは、図6Aおよび図6Bに示すブロック
640に対して前述したのと本質的に同じように、ドキュメント内のテキスト句
を分析し、そうすることによってそのドキュメントに対する論理形式三つ組の対
応の集合を構成してデータセット1030内に記憶する。図10Aおよび図10
Bに示す索引付けエンジン1010によって実行されてドキュメントに索引を付
ける他の全てのプロセス、たとえばそのための適切なレコードを発生するプロセ
スはいずれも本発明には無関係であるので、それらについては詳細に述べない。
三つ組の集合がプロセス1100によって一旦発生されると、エンジン1015
がこの集合をドキュメント自体のコピーとそれに対して作られたドキュメントレ
コードとともにデータセット1030へと記憶する、と述べるだけで十分である
。したがって、全索引付け動作が終わると、データセット1030は索引付けさ
れた全ドキュメントの完全なコピーとそのためのとをその中に記憶しているだけ
でなく、そのドキュメントのための論理形式三つ組の集合をも記憶している。
は、これは「マスタデータセット」と見ることができるが、次に複製部分100
52によって複製される。部分10052内では、従来の媒体複製システム104
0が線1035によって供給されるマスタデータセットの内容のコピーを、線1
043によって供給される検索プロセスおよびユーザインストールプログラムを
含む検索ソフトウェアのための適切なファイルのコピーとともに、1つ以上のC
D−ROMのような共通の記憶媒体に繰返し書込んで、スタンドアローンのドキ
ュメント検索アプリケーションをまとめて形成する。システム1040によって
、個々の複製10501、10502、…、1050nを有する一連の媒体複製1
050が生成される。全複製は同一であり、複製10501に関して具体的に示 してあるように、線1043によって供給されるドキュメント検索アプリケーシ
ョンファイルのコピーと線1035によって供給されるデータセット1030の
コピーとを含む。データセットのサイズおよび構成次第では、各複製が1つ以上
の別個の媒体、たとえば別個のCD−ROMにまたがってもよい。後に、複製は
典型的にはライセンスの取得によって破線1055で示すようにユーザコミュニ
ティ中に流通される。
OM1060とも示す)CD−ROMjのような複製を入手すると、ユーザは、 (同一の構成でないとしても実質的に図3に示すクライエントPC300のよう
な構成を有するPCのような)コンピュータシステム1070によって、本発明
を含むドキュメント検索アプリケーションをCD−ROMjに記憶されているデ ータセットに対して実行してそこから所望のドキュメントを引出すことができる
。特に、ユーザはCD−ROMjを入手した後、CD−ROMをPC1070に 挿入し、CD−ROMに記憶されているインストールプログラムの実行を始め、
それによって、ドキュメント検索アプリケーションファイルのコピーを作り、そ
れをPCのメモリ1075、通常はハードディスク内の予め規定されたディレク
トリへとインストールし、それによって、PC上にドキュメント検索アプリケー
ション1085を作成する。このアプリケーションはサーチエンジン1090お
よび検索プロセス1200を含む。一旦インストールが完了し、アプリケーショ
ン1085が呼出されると、ユーザは適切なフルテキストのクエリをアプリケー
ションに与えることによって、CD−ROMjのデータセットをサーチすること ができる。クエリに応答して、サーチエンジンはそれらのドキュメントのための
とこのような各ドキュメントのための記憶されている論理形式三つ組とを含むド
キュメントの集合をデータセットから引出す。クエリは検索プロセス1200に
も与えられる。このプロセスは図6Aおよび図6Bに関連して前述した検索プロ
セス600に非常に類似しており、クエリを分析し、そのため論理形式三つ組を
構成するものである。その後、図10Aおよび図10Bに示すプロセス1200
がその集合内の検索されたドキュメントの各々のための論理形式三つ組、特にそ
のためのレコードをクエリのための三つ組と比較する。それらの間で発生する三
つ組の一致とそれらの重みとに基づき、プロセス1200は詳細に前述した態様
で少なくとも1つの一致する三つ組を示すドキュメントの各々をスコア付けし、
これらのドキュメントを降順のスコアでランク付けし、最後に、最も高いランク
付けを有する典型的に5−20またはそれよりも少ない小グループのドキュメン
トレコードをユーザに視覚的に提示する。ユーザはこれらのを検討し、関連のあ
るように思われる任意のドキュメントのコピー全体を検索し表示するようドキュ
メント検索アプリケーションに指示することができる。一旦ユーザが最初のグル
ープの検索ドキュメントに対する最初のグループのドキュメントレコードを検討
すると、ユーザは次に高いランク付けを有する次のグループのドキュメントレコ
ードを要求することができ、以下同様に、検索された全ドキュメントレコードを
検討し終わるまでこれを行なうことができる。アプリケーション1085は、初
期状態では、ランク付けされたドキュメントレコードをクエリに応答して戻すが
、これに替えてこのアプリケーションがドキュメント自体のランク付けされたコ
ピーをクエリに応答して戻してもよい。
15によって行なわれる三つ組発生プロセス1100を示す。前述のように、プ
ロセス1100は索引付けされるべきドキュメントの前処理を、そのドキュメン
トにおけるテキストフレーズを分析し、そうすることによってそのドキュメント
のための論理形式三つ組の対応の集合を構成してデータセット1030内に記憶
することによって行なう。特に、プロセス1100を開始するとブロック111
0が実行される。このブロックは初めに、そのドキュメントに関連したHTML
タグ内にある任意のテキストを含む全テキストをそのドキュメントから抽出する
。その後、一度に1文ずつ行なわれる自然言語処理を容易にするために、各ドキ
ュメントのためのテキストが従来の一文切出し処理によって分解され、各文(ま
たは疑問文)がファイル内で別個のラインを占めるテキストファイルとなる。そ
の後、ブロック1110が(図13Aに関連して詳細に後述する)NLPルーチ
ン1300をそのドキュメント内のテキストの各ラインごとに別個に呼出して、
このドキュメントを分析し、そのラインのための論理形式三つ組の対応の集合を
構成してデータセット1030内にローカルに記憶する。これらの動作が完了す
れば、ブロック1110およびプロセス1100の実行が終了する。
うな本発明の検索プロセス1200のフローチャートを図12Aおよび図12B
に集合的に示す。図12Aおよび図12Bの図面の正しい配列は図12に示すと
おりである。(図6Aおよび図6Bに示し、詳細に前述した)検索プロセス60
0とは対照的に、図12Aおよび図12Bに示す全動作は共通のコンピュータシ
ステム、ここではPC1070(図10Aおよび図10B参照)において行なわ
れる。理解を助けるため、以下の説明においては図10Aおよび図10Bを同時
に参照されたい。
ブロックは実行されるとユーザにフルテキストのクエリを入力させる。一旦この
クエリが得られると、実行経路は分岐して経路1207によってブロック121
0へ、および経路1243によって経路1245へ進む。ブロック1245は実
行されるとNLPルーチン1350を呼出してクエリを分析し、対応の論理形式
三つ組の集合を構成し、それをローカルにメモリ1075内に記憶する。ブロッ
ク1210は実行されると、破線1215で示すようにフルテキストのクエリを
サーチエンジン1090に送信する。この時点で、サーチエンジンはクエリに応
答してブロック1220を実行して、ドキュメントレコードの集合とこのような
レコードの各々に関連した関連の論理形式三つ組との両方を検索する。この集合
と関連の論理形式三つ組とが検索されれば、両方は破線1230で示すようにプ
ロセス1200に与えられ、具体的にはそこにおけるブロック1240に与えら
れる。ブロック1240は単にこの情報をサーチエンジン1090から受け、そ
れを後に使用するためにメモリ1075内に記憶する。ブロック1245におけ
る動作をブロック1210、1090および1220における動作と本質的に並
列的に行われるものと説明したが、ブロック1245における動作は実際の実行
上の観点からブロック1210、1090または1220における動作の前また
は後に直列的に行なわれてもよい。
のためにメモリ1075へと記憶されれば、ブロック1250が実行される。こ
のブロックは詳細に前述した態様で、クエリ内の論理形式三つ組の各々を、検索
された各ドキュメントレコードのための論理形式三つ組の各々と比較して、クエ
リ内の任意の三つ組と対応の任意のドキュメントの任意の三つ組との間の一致を
突き止める。一旦ブロック1250が完了すると、ブロック1255が実行され
て、一致する三つ組を示さない、すなわち、クエリ内の任意の三つ組と一致する
三つ組を有さないドキュメントに対する検索された全レコードを廃棄する。その
後、ブロック1260が実行される。ブロック1260によって、残る全ドキュ
メントレコードが、前述のように、対応の各ドキュメントごとに存在する一致す
る三つ組の関係のタイプとそれらの重みとに基づいてスコアを割当てられ、ドキ
ュメントレコードがそのように重み付けされれば、ブロック1265が実行され
てスコアの降順にレコードをランク付ける。最後に、ブロック1270が実行さ
れて、典型的には最も高いスコアを示す予め規定された小グループ、典型的には
5または10のドキュメントレコードについてレコードをランク順に表示する。
その後、ユーザはたとえばコンピュータシステム1070によって表示されてい
る対応のボタンの上でマウスを適切に「クリックする」ことによって、ランク付
けされたドキュメントレコードの次のグループをそのシステムに表示させ、以下
同様にユーザがランク付けされた全ドキュメントレコードを順に十分に調べる(
そしてその中の関心のある任意のドキュメントにアクセスし、それを調べる)ま
でその動作を行なう。この時点で、プロセス1200は完了され、実行が終了す
る。
ルーチン1300のフローチャートを示す。前述のように、NLPルーチン13
00は索引付けされるべき入来するドキュメント、具体的にはそのためにテキス
トの1ラインを分析し、そのドキュメントのための論理形式三つ組の対応の集合
を構成し、それをローカルに図10Aおよび図10Bに示すデータセット内に記
憶する。ルーチン1300は、図7に示し、詳細に前述したNLPルーチン70
0と本質的に同様に動作する。
て、入力テキストのラインを処理して図5Aに示す例示のグラフ515のような
論理形式グラフを生成する。その後、図13Aに示すように、ブロック1320
が実行されてそのグラフから対応の論理形式三つ組の集合を抽出する(読出す)
。一旦これが起こると、ブロック1330が実行されて別個に、かつ区別してフ
ォーマット化されたテキスト文字列としてこのような論理形式三つ組の各々を生
成する。最後に、ブロック1340が実行されて、入力されたテキストのそのラ
インと、一連のフォーマット化されたテキスト文字列として、そのラインのため
の論理形式三つ組の集合とがデータセット1030に保存される。この集合が完
全に記憶されれば、ブロック1300の実行を終了する。これに替えて、論理形
式三つ組ではなく異なる形式、たとえば論理形式グラフまたはそのサブグラフが
本発明に関連して用いられるのであれば、ブロック1320および1330を、
フォーマット化された文字列としてその特定の形式を発生するように、そしてブ
ロック1340が論理形式三つ組の代わりにその形式をデータセットに記憶する
ように、容易に変更できるであろう。
フローチャートを示す。前述のように、NLPルーチン1350はユーザjによ って(図10Aおよび図10Bに示す)ドキュメント検索アプリケーション10
85に与えられるクエリを分析し、そのための対応の論理形式三つ組の集合を構
成し、メモリ1075内にローカルに記憶する。図13Aに関連して詳細に前述
したルーチン1300とルーチン1350との間の動作上の唯一の違いは、対応
の三つ組が記憶される場所である。すなわち、NLPルーチン1300における
ブロック1340の実行ではデータセット1030に記憶され、NLPルーチン
1350におけるブロック1390の実行ではメモリ1075に記憶される、と
いう点である。ルーチン1350の他のブロック、具体的にはブロック1360
、1370および1380によって行なわれる動作はルーチン1300のブロッ
ク1310、1320および1330によってそれぞれ行われるのと実質的に同
じであるので、前者のブロックの詳細な説明をは省略する。
的に試すために、本発明の検索システムにおいてサーチエンジンとしてALTA VIS
TAサーチエンジンを用いた。インターネット上で誰もがアクセス可能なこのエン
ジンは3100万を超えるウェブページが索引付けされていると称されている従
来の統計的サーチエンジンであり、広く用いられている(概算で現在1日当り2
800万ヒットを記録している。)。本発明の検索プロセス600を、MICROSOF
T OFFICE 97プログラムスイートの一部を成す文法チェッカー内に含まれる、辞 書ファイルを含むさまざまな自然言語処理コンポーネントを用いて、一般的なPe
ntium 90 MHzのPC上で実現した(「OFFICE」および「OFFICE 97」はワシント ン州レドモンドのMicrosoft Corporationの商標である)。我々はオンラインの パイプライン処理モデルを用いた。すなわち、続く結果をユーザが待っている間
にドキュメントがパイプラインの態様でオンラインで集められ、処理された。こ
の特定のPCは、各センテンスごとに論理形式三つ組を発生するのに約3分の1
秒から約2分の1秒を要した。
に依頼した。合計121個の広範囲の互いに異なるクエリが作られ、その代表的
なものは「Why was the Celtic civilization so easily conquered by the Rom
ans?(なぜケルト文明はローマ人によって簡単に征服されたのか?)」、「Why d
o antibiotics work on colds but not on viruses?(抗生物質はなぜ風邪に効 くのにウィルスには効かないのか?)」、「Who is the governor of Washington
?(ワシントン州の知事は誰か?)」、「Where does the Nile cross the equato
r?(ナイル川が赤道と交差するのはどこか?)」、および「When did they start
vaccinating for small pox?(天然痘の予防接種が始められたのはいつ頃か?)
」といったものであった。これらの121個の各クエリをALTA VISTAサーチエン
ジンに与え、各クエリに応答して戻った利用可能なものからなる上位30のドキ
ュメントを得た。クエリの中には30未満のドキュメントしか戻らないものがあ
り、その場合は戻った全ドキュメントを使用した。全121クエリに対して、延
べ3361ドキュメント(すなわち、「生の」ドキュメント)が得られた。
て分析されて論理形式三つ組の対応の集合が生成された。集合は適切に比較され
、結果のドキュメントが前述のように選択され、スコアおよびランクをつけられ
た。
との関連性について手作業で別個に評価した。関連性を評価するため、発明者の
具体的な実験目的を知らない一人の人を評価者として利用し、これらの3361
ドキュメントの各々をその対応のクエリとの関連について「最適」、「関連あり
」または「関連なし」として手作業で主観的にランク付けした。最適なドキュメ
ントとは、対応のクエリに対する明らかな回答を含むものであるとされた。関連
のあるドキュメントとは、クエリに対する明らかな回答を含まないがそれにもか
かわらず関連性のあるもののことであるとされた。関連のないドキュメントとは
、クエリに対する有益な回答ではないもの、すなわち、クエリに関連がないか、
英語以外の言語によるか、またはALTA VISTAエンジン(すなわち、「cobweb」リ
ンク)によって与えられた対応のURLからは検索できないドキュメントのこと
であるとされた。評価精度を高めるため、二人目の評価者がこれらの3361ド
キュメント内のサブセット、具体的には、その対応のクエリにおける論理形式三
つ組と一致する少なくとも1つの論理形式三つ組を示したドキュメント(336
1ドキュメントのうち431)と、それまでに関連ありまたは最適であるとラン
ク付けされたが一致する論理形式三つ組を有さないドキュメント(3361ドキ
ュメントのうち102)とを調査した。ドキュメントに対するこれらのランク付
けの意見の相違があれば、それは「仲裁者」となる三人目の評価者によって検討
された。
テムは、ALTA VISTAサーチエンジンが戻す生のドキュメントよりも改善を示した
ことが観察された。全体の(すなわち、選択された全ドキュメントの)精度では
約16%から約47%へと200%程度改善し、上位5ドキュメント内では約2
6%から約51%へと約100%改善した。加えて、本発明のシステムの使用に
よって、最適であるとして戻された最初のドキュメントの精度は生のドキュメン
トのそれに対して約17%から約35%へと約113%改善された。
明はそれに限定されない。その点では、本発明は実質的にいかなるタイプのサー
チエンジンによって得られた検索ドキュメントをも処理してそのエンジンの精度
を高めるよう用いることができる。
の重みを動的に変化させ、実際のところ、適応的としてもよい。これを達成する
ため、たとえばベイズのネットワークまたはニューラルネットワークのような学
習メカニズムを本発明のプロセスに適切に組込み、各種の論理形式三つ組のため
の重み数値を学習経験に基づいて最適な値に変えてもよい。
つ組の間で十分に類似した意味内容を識別する目的のために、一致判断の基準を
緩和してパラフレーズも一致とみなすようにしてもよい。パラフレーズは語彙的
であってもよく構造的であってもよい。語彙的パラフレーズの例は上位語または
類義語であろう。構造的パラフレーズの例は同格関係にある名詞または関係節の
使用である。たとえば、「大統領、ビル・クリントン」のような同格関係にある
名詞構成は「大統領であるビル・クリントン」のような関係節構成と一致すもの
とみなされるべきである。意味レベルでは、2つの語が互いにいかに意味的に類
似しているかについてきめの細かい判断をすることができ、それによって、「ど
こでコーヒーが栽培されるか」というクエリと「コーヒーは熱帯山岳地方でよく
栽培される」というようなコーパス(文例)文との間の一致を認めることができ
る。加えて、一致が存在するか否かを判断するための手順を、与えられたクエリ
のタイプによって変更することができる。たとえば、何かが存在する場所につい
てクエリが尋ねていれば、その手順は、ある文がクエリと一致するとみなされる
ためには、テストされている文と関連した任意の三つ組内に「場所」属性が存在
していなければならない、と要求するであろう。したがって、論理形式三つ組の
「一致」とは同一の一致だけをいうのみならず、このような緩和された、判断を
含むような、変更された一致条件の全てから生じるものをも包含するように包括
的に規定される。
情報の検索を中心とする他の処理技術と容易に組合せて全体の精度を高めること
ができる。一般に、ドキュメント中の非テキスト内容にはよく、たとえば図の記
号または短い説明のような、そのドキュメント中の言語的(テキストによる)描
写が付随するものである。したがって、本発明のプロセス、特にその自然言語成
分の使用を、非テキスト内容にしばしば付随する言語的描写を分析し、処理する
ために用いることができる。クエリに意味的に関連した言語的内容を示すドキュ
メントの集合を初めに探し、次に、このドキュメントの集合をそれらの非テキス
ト内容に関して処理することによって、本発明の自然言語処理技術を用いて関連
あるテキスト内容および非テキスト内容を有するドキュメントを検索することが
できる。これに替えて、ドキュメント検索を初めに非テキスト内容について行な
ってドキュメントの集合を取出し、次に本発明の技術によってそのドキュメント
の集合をそれらの言語的内容について処理することで関連のあるドキュメントを
検索してもよい。
者であればこれらの教示をなお利用する多くの他の実施例に容易に想到すること
ができるであろう。
ロック図である。
索システム200の高いレベルの実施例を示す図である。
アントパーソナルコンピュータであるコンピュータシステム300を示すブロッ
ク図である。
ョンプログラム400を示す非常に高いレベルのブロック図である。
よびそれらに関する対応の論理形式要素を示す図である。
図6Aおよび図6Bは、我々の発明の検索プロセス600のフローチャートを合
わせて示す図である。
ャートを示す図である。
図である。
トの組に関する、図6Aおよび図6Bに全て示されているブロック650、66
0、665および670内で行なわれる、我々の発明の教示に従う論理形式三つ
組の比較、ドキュメントのスコア付け、ランク付けおよび選択処理を視覚的に示
す図である。
3つの異なった実施例をそれぞれ示す図であり、Dは我々の本発明のさらに別の
異なった実施例を実現するにあたり使用される、図9Cに示されるリモートコン
ピュータ(サーバ)930の代替的な実施例を示す図である。
であり、図10Aおよび図10Bは我々の本発明のさらに別の実施例であって、
各ドキュメントに関する論理形式三つ組が、それらに関するドキュメントレコー
ドとともに予め計算されて記憶され、後のドキュメント検索動作時にアクセスさ
れるものを合わせて示す図である。
ジン1015によって行なわれる三つ組生成処理1100を示す図である。
であり、図12Aおよび図12Bは、図10Aおよび図10Bに示されるコンピ
ュータシステム300内で実行される我々の発明の検索処理1200のフローチ
ャートを合わせて示す図である。
00のフローチャートを示す図である。
フローチャートを示す図である。
うな情報検索エンジン(20)によって検索された結果を処理するために自然言
語処理を利用する情報検索システム(5)のための装置およびそれに付随する方
法を提供する。具体的には、このようなサーチは最終的に検索されたドキュメン
トの集合を生む。このような各ドキュメントは次に自然言語処理を受けて論理形
式の集合を生じる。このような各論理形式は句内の語間の意味的関係、特に主題
と修飾語句との構造を語−関係子−語の態様で符号化する。ユーザが与えるクエ
リも同様に分析されてそのための対応の論理形式の集合を生み出す。ドキュメン
トはドキュメントおよびクエリからの論理形式の予め規定された関数としてラン
ク付けされる。具体的には、クエリのための論理形式の集合は、検索されたドキ
ュメントの各々のための論理形式の集合と比較されて両方の集合内のこのような
任意の論理形式間の一致を確認する。少なくとも1つの一致する論理形式を有す
る各ドキュメントがヒューリスティックにスコア付けされ、一致する論理形式の
ための異なる各関係が異なる対応の予め定められた重みを割当てられる。このよ
うな各ドキュメントのスコアはたとえば、その独自に一致する論理形式の重みの
予め規定された関数である。最後に、保持されたドキュメントがスコアの高い順
にランク付けされてその順でユーザに提示される。
Claims (123)
- 【請求項1】 記憶されているドキュメントをリポジトリから検索するため
の情報検索システムにおいて用いるための装置であって、前記システムは、クエ
リに応答してそのクエリに関連した複数の記憶されているドキュメントを検索し
、出力ドキュメント集合を規定するための検索システムを有し、前記装置は、 プロセッサと、 実行可能な命令が記憶されているメモリとを含み、 プロセッサはメモリに記憶されている命令に応答して、 クエリに応答してそのための第1の論理形式を生じ、第1の論理形式はクエリ
に関連した語の間の意味的関係を示し、 出力ドキュメント集合内のドキュメントの各別の1つに対して、対応する第2
の論理形式を取得し、第2の論理形式は前記1つのドキュメント内の句に関連し
た語の間の意味的関係を示し、 クエリの第1の論理形式と、出力ドキュメント集合内の複数のドキュメントの
各1つのための第2の論理形式との予め定義された関数として、出力ドキュメン ト集合内の複数のドキュメントをランク付けしてランク順を規定し、 出力ドキュメント集合に関連した複数の記憶されているエントリを前記ランク
順に出力として与える、装置。 - 【請求項2】 各エントリは出力ドキュメント集合内のドキュメントの対応
の1つであるか、または前記対応の1つのドキュメントに関連したレコードであ る、請求項1に記載の装置。 - 【請求項3】 クエリのための第1の論理形式と出力ドキュメント集合内の
各別のドキュメントのための第2の論理形式との各々はそれぞれ、論理形式グラ
フ、そのサブグラフ、または論理形式三つ組のリストである、請求項2に記載の
装置。 - 【請求項4】 プロセッサは記憶されている命令に応答して、 出力ドキュメント集合内のドキュメントの前記各別の1つのために、記憶媒体 から対応の第2の論理形式を読出すか、または 出力ドキュメント集合内の前記各別の1つのドキュメントを分析することによ
って前記対応の第2の論理形式を生成する、請求項3に記載の装置。 - 【請求項5】 前記関数は、前記ドキュメントの1つのために、クエリに関
連した前記第1の論理形式と前記1つのドキュメントに関連した前記第2の論理
形式の各々との間の予め定められた関係に基づいてスコアを生成し、プロセッサ
は記憶されている命令に応答して、出力ドキュメント集合内の各ドキュメントに
関連したスコアに従って、記憶されているエントリをランク付けしてランク順を
規定する、請求項4に記載の装置。 - 【請求項6】 クエリに関連した前記第1の論理形式または出力ドキュメン
ト集合内の前記ドキュメントの1つに関連した前記第2の論理形式は、それぞれ
前記クエリにまたは前記ドキュメントの1つに関連した語句のパラフレーズをさ
らに含む、請求項5に記載の装置。 - 【請求項7】 前記第1の論理形式および前記第2の論理形式の各々は1つ
以上の論理形式三つ組の、対応の第1のリストおよび第2のリストを含み、前記
第1のリスト内の前記論理形式三つ組と前記第2のリスト内の前記論理形式三つ
組とは各々、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、対
応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、2
つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項6に記載
の装置。 - 【請求項8】 クエリに関連した前記第1の論理形式と出力ドキュメント集
合内の任意のドキュメントに関連した前記第2の論理形式の任意のものとの間の
前記一致は同一の一致である、請求項5に記載の装置。 - 【請求項9】 前記第1の論理形式および前記第2の論理形式の各々は1つ
以上の論理形式三つ組の対応の第1のリストおよび第2のリストを含み、前記第
1のリスト内の前記論理形式三つ組と前記第2のリスト内の前記論理形式三つ組
とは各々、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、対応
の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、2つ
の語の間の意味的関係を表わす予め規定された関係とを含む、請求項8に記載の
装置。 - 【請求項10】 リポジトリはデータセットを含む、請求項5に記載の装置
。 - 【請求項11】 クエリはフルテキストのクエリである、請求項5に記載の
装置。 - 【請求項12】 検索システムは統計的サーチエンジンを含む、請求項5に
記載の装置。 - 【請求項13】 ユーザからのクエリを取得し、出力ドキュメント集合内の
複数のドキュメントを前記ランク順に表示するためのクライエントコンピュータ
と、 ネットワーク接続を介してクライエントコンピュータに接続されるサーバとを
さらに含み、前記サーバは前記プロセッサおよび前記メモリを含み、プロセッサ
はメモリに記憶されている命令に応答して、 クライエントコンピュータからクエリを取得し、 出力ドキュメントの集合内の前記複数のドキュメントを前記ランク順にクライ
エントコンピュータに与える、請求項5に記載の装置。 - 【請求項14】 前記サーバは複数の個別のサーバを含む、請求項13に記
載の装置。 - 【請求項15】 検索システムは統計的サーチエンジンを含む、請求項13
に記載の装置。 - 【請求項16】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項15に記載の装置。 - 【請求項17】 サーチエンジンはクエリに応答して、出力ドキュメントの
集合内の前記複数のドキュメントの各1つのためにリポジトリから記憶されてい
るレコードを検索し、レコードは出力ドキュメント集合内の前記ドキュメントの
各1つが見出され得る場所を特定する情報を含み、プロセッサはメモリに記憶さ
れている命令とレコードに含まれている情報とに応答して、前記ドキュメントの
各1つにそのための関連のサーバからアクセスし、それをダウンロードし、出力
ドキュメント集合内に含める、請求項16に記載の装置。 - 【請求項18】 前記プロセッサおよび前記メモリを有するクライエントコ
ンピュータと、 ネットワーク接続を介してクライエントコンピュータに接続されるサーバとを
さらに含み、前記サーバは前記検索システムを実現し、クライエントコンピュー
タによって与えられるクエリに応答して前記出力ドキュメント集合をクライエン
トコンピュータに与える、請求項5に記載の装置。 - 【請求項19】 検索システムは統計的サーチエンジンを含む、請求項18
に記載の装置。 - 【請求項20】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項19に記載の装置。 - 【請求項21】 サーチエンジンはクエリに応答して、出力ドキュメントの
集合内の前記複数のドキュメントの各1つのためにリポジトリから記憶されてい
るレコードを検索し、レコードは出力ドキュメント集合内の前記ドキュメントの
各1つが見出され得る場所を特定する情報を含み、プロセッサはメモリに記憶さ
れている命令とレコードに含まれている情報とに応答して、前記ドキュメントの
各1つにそのための関連のサーバからアクセスし、それをダウンロードし、出力
ドキュメント集合内に含める、請求項20に記載の装置。 - 【請求項22】 前記プロセッサおよび前記メモリを有するコンピュータを
さらに含み、コンピュータはまたメモリに記憶されている命令に応じて前記検索
システムを実現する、請求項5に記載の装置。 - 【請求項23】 検索システムは統計的サーチエンジンを含む、請求項22
に記載の装置。 - 【請求項24】 前記1つのドキュメントのためのスコアはまた、前記1つ
のドキュメントのための第2の論理形式内のノード語、前記1つのドキュメント
内の前記ノード語の頻度または意味的内容、前記1つのドキュメント内の予め規
定されたノード語の頻度または意味的内容、前記1つのドキュメントのための特
定の論理形式三つ組の頻度、もしくは前記1つのドキュメントの長さの、予め定
められた関数である、請求項5に記載の装置。 - 【請求項25】 クエリはフルテキストのクエリである、請求項24に記載
の装置。 - 【請求項26】 検索システムは統計的サーチエンジンを含む、請求項24
に記載の装置。 - 【請求項27】 ユーザからのクエリを取得し、出力ドキュメント集合内の
複数のドキュメントを前記ランク順に表示するためのクライエントコンピュータ
と、 ネットワーク接続を介してクライエントコンピュータに接続されるサーバとを
さらに含み、前記サーバは前記プロセッサおよび前記メモリを含み、プロセッサ
はメモリに記憶されている命令に応答して、 クライエントコンピュータからクエリを取得し、 出力ドキュメント集合内の前記複数のドキュメントを前記ランク順にクライエ
ントコンピュータに与える、請求項24に記載の装置。 - 【請求項28】 サーバは複数の別個のサーバを含む、請求項27に記載の
装置。 - 【請求項29】 検索システムは統計的サーチエンジンを含む、請求項27
に記載の装置。 - 【請求項30】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項29に記載の装置。 - 【請求項31】 サーチエンジンはクエリに応答して、出力ドキュメント集
合内の前記複数のドキュメントの各1つのためにリポジトリから記憶されている
レコードを検索し、レコードは出力ドキュメント集合内の前記ドキュメントの各
1つが見出され得る場所を特定する情報を含み、プロセッサはメモリに記憶され
ている命令とレコードに含まれている情報とに応じて、前記ドキュメントの各1
つにそのための関連のサーバからアクセスし、それをダウンロードし、出力ドキ
ュメント集合内に含める、請求項30に記載の装置。 - 【請求項32】 前記プロセッサおよび前記メモリを有するクライエントコ
ンピュータと、 ネットワーク接続を介してクライエントコンピュータに接続されるサーバとを
さらに含み、前記サーバは前記検索システムを実現し、クライエントコンピュー
タによって与えられるクエリに応答して前記出力ドキュメント集合をクライエン
トコンピュータに与える、請求項24に記載の装置。 - 【請求項33】 検索システムは統計的サーチエンジンを含む、請求項32
に記載の装置。 - 【請求項34】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項33に記載の装置。 - 【請求項35】 サーチエンジンはクエリに応答して、出力ドキュメント集
合内の前記複数のドキュメントの各1つのためにリポジトリから記憶されている
レコードを検索し、レコードは出力ドキュメント集合内の前記ドキュメントの各
1つが見出され得る場所を特定する情報を含み、プロセッサはメモリに記憶され
ている命令とレコードに含まれている情報とに応答して、前記ドキュメントの各
1つにそのための関連のサーバからアクセスし、それをダウンロードし、出力ド
キュメント集合内に含める、請求項34に記載の装置。 - 【請求項36】 前記プロセッサおよび前記メモリを有するコンピュータを
さらに含み、コンピュータはまたメモリに記憶されている命令に応答して前記検
索システムを実現する、請求項24に記載の装置。 - 【請求項37】 検索システムは統計的サーチエンジンを含む、請求項36
に記載の装置。 - 【請求項38】 前記第1の論理形式および前記第2の論理形式の各々は1
つ以上の論理形式三つ組の対応の第1のリストおよび第2のリストを含み、前記
第1のリスト内の前記論理形式三つ組と前記第2のリスト内の前記論理形式三つ
組とは各々、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、対
応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、2
つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項5に記載
の装置。 - 【請求項39】 クエリに関連した論理形式三つ組の前記第1のリストか、
または出力ドキュメント集合内の前記ドキュメントの1つに関連した論理形式三
つ組の前記第2のリストは、それぞれ前記クエリにまたは前記ドキュメントの1
つに関連した語句のパラフレーズをさらに含む、請求項38に記載の装置。 - 【請求項40】 前記1つのドキュメントのためのスコアはまた、前記1つ
のドキュメントのための第2の論理形式内のノード語、前記1つのドキュメント
内の前記ノード語の頻度または意味的内容、前記1つのドキュメント内の予め規
定されたノード語の頻度または意味的内容、前記1つのドキュメントのための特
定の論理形式三つ組の頻度、もしくは前記1つのドキュメントの長さの、予め定
められた関数である、請求項38に記載の装置。 - 【請求項41】 前記関数は、クエリに関連した論理形式三つ組の少なくと
も1つと同一に一致する、出力ドキュメント集合内の前記複数のドキュメントの
各々に関連した論理形式三つ組にわたってとられた重みの合計であり、一致する
各論理形式三つ組に割当てられる重みはそれに関連した意味的関係のタイプによ
って定義される、請求項38に記載の装置。 - 【請求項42】 プロセッサはメモリに記憶されている命令に応答して、 クエリに関連した論理形式三つ組の任意のものが出力ドキュメント集合内の任
意のドキュメントに関連した論理形式三つ組の任意のものと一致するか否かを判
断して、前記任意のドキュメントに関連した一致する三つ組を規定し、 関連した少なくとも1つの一致する論理形式三つ組を有する前記出力ドキュメ
ント集合内のドキュメントの各1つのために、前記一致する論理形式三つ組の各 々に関連した意味的関係によって予め規定される重み数値を用いて前記各1つの ドキュメント内の一致する論理形式三つ組に重み付けして、前記1つのドキュメ
ントのための1つ以上の重みを形成し、 前記1つ以上の重みの関数として前記1つのドキュメントのためのスコアを計
算し、 前記ドキュメントの各1つをその前記スコアに従ってランク付けしてランク順
を規定する、請求項41に記載の装置。 - 【請求項43】 ランク順は重みの大きいものから小さいものの順である、
請求項42に記載の装置。 - 【請求項44】 プロセッサはメモリに記憶されている命令に応答して、前
記出力ドキュメント集合内のドキュメントの、最も高い、連続するランク付けを
有する、前記出力ドキュメント集合のための前記エントリの第1の予め規定され
たグループを提示する、請求項38に記載の装置。 - 【請求項45】 出力ドキュメント集合内の複数のドキュメントは、関連し
た少なくとも1つの一致する三つ組を有する、前記出力ドキュメント集合内のド
キュメントからなる、請求項44に記載の装置。 - 【請求項46】 前記第1の論理形式三つ組および前記第2の論理形式三つ
組の各々は、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、対
応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、2
つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項45に記
載の装置。 - 【請求項47】 クエリに関連した前記論理形式三つ組か、または出力ドキ
ュメント集合内の前記ドキュメントの1つに関連した前記論理形式三つ組は、前
記語のいずれかの上位語または類義語を含む論理形式三つ組をさらに含む、請求
項38に記載の装置。 - 【請求項48】 クエリに関連した論理形式三つ組の前記任意のものと出力
ドキュメント集合内の任意のドキュメントに関連した論理形式三つ組の前記任意
のものとの間の前記一致は同一の一致である、請求項38に記載の装置。 - 【請求項49】 リポジトリはデータセットを含む、請求項38に記載の装
置。 - 【請求項50】 クエリはフルテキストのクエリである、請求項38に記載
の装置。 - 【請求項51】 検索システムは統計的サーチエンジンを含む、請求項38
に記載の装置。 - 【請求項52】 ユーザからのクエリを取得し、出力ドキュメント集合内の
複数のドキュメントを前記ランク順に表示するためのクライエントコンピュータ
と、 ネットワーク接続を介してクライエントコンピュータに接続されるサーバとを
さらに含み、前記サーバは前記プロセッサおよび前記メモリを含み、プロセッサ
はメモリに記憶されている命令に応答して、 クライエントコンピュータからクエリを取得し、 出力ドキュメント集合内の前記複数のドキュメントを前記ランク順にクライエ
ントコンピュータに与える、請求項38に記載の装置。 - 【請求項53】 サーバは複数の個別のサーバを含む、請求項52に記載の
装置。 - 【請求項54】 検索システムは統計的サーチエンジンを含む、請求項52
に記載の装置。 - 【請求項55】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項54に記載の装置。 - 【請求項56】 サーチエンジンはクエリに応答して、出力ドキュメント集
合内の前記複数のドキュメントの各1つのために、リポジトリから記憶されてい
るレコードを検索し、レコードは出力ドキュメント集合内の前記ドキュメントの
各1つが見出され得る場所を特定する情報を含み、プロセッサはメモリに記憶さ
れている命令とレコードに含まれている情報とに応答して、前記ドキュメントの
各1つにそのための関連のサーバからアクセスし、それをダウンロードし、出力
ドキュメント集合内に含める、請求項55に記載の装置。 - 【請求項57】 前記プロセッサおよび前記メモリを有するクライエントコ
ンピュータと、 ネットワーク接続を介してクライエントコンピュータに接続されるサーバとを
さらに含み、前記サーバは前記検索システムを実現し、クライエントコンピュー
タによって与えられるクエリに応答して前記出力ドキュメント集合をクライエン
トコンピュータに与える、請求項38に記載の装置。 - 【請求項58】 検索システムは統計的サーチエンジンを含む、請求項57
に記載の装置。 - 【請求項59】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項58に記載の装置。 - 【請求項60】 サーチエンジンはクエリに応答して、出力ドキュメント集
合内の前記複数のドキュメントの各1つのために、リポジトリから記憶されてい
るレコードを検索し、レコードは出力ドキュメント集合内の前記ドキュメントの
各1つが見出され得る場所を特定する情報を含み、プロセッサはメモリに記憶さ
れている命令とレコードに含まれている情報とに応答して、前記ドキュメントの
各1つにそのための関連のサーバからアクセスし、それをダウンロードし、出力
ドキュメント集合内に含める、請求項59に記載の装置。 - 【請求項61】 前記プロセッサおよび前記メモリを有するコンピュータを
さらに含み、コンピュータはまたメモリに記憶されている命令に応答して前記検
索システムを実現する、請求項38に記載の装置。 - 【請求項62】 検索システムは統計的サーチエンジンを含む、請求項61
に記載の装置。 - 【請求項63】 記憶されているドキュメントをリポジトリから検索するた
めの情報検索システムにおいて用いるための方法であって、前記システムは、ク
エリに応答してそのクエリに関連した複数の記憶されているドキュメントを検索
し、出力ドキュメント集合を規定するための検索システムを有し、前記方法は、 クエリに応答してそのための第1の論理形式を生じるステップを含み、第1の
論理形式はクエリに関連した語の間の意味的関係を示し、 出力ドキュメント集合内のドキュメントの各別の1つに対して、対応する第2
の論理形式を取得するステップを含み、第2の論理形式は前記1つのドキュメン
ト内の句に関連した語の間の意味的関係を示し、 クエリの第1の論理形式と、出力ドキュメント集合内の複数のドキュメントの
各1つのための第2の論理形式との予め定義された関数として、出力ドキュメン
ト集合内の複数のドキュメントをランク付けしてランク順を規定するステップと
、 出力ドキュメント集合に関連した複数の記憶されているエントリを前記ランク
順に出力として与えるステップとを含む、方法。 - 【請求項64】 各エントリは出力ドキュメント集合内のドキュメントの対
応の1つであるか、または前記対応の1つのドキュメントに関連したレコードで ある、請求項63に記載の方法。 - 【請求項65】 クエリのための第1の論理形式と出力ドキュメント集合内
の各別のドキュメントのための第2の論理形式との各々はそれぞれ、論理形式グ
ラフ、そのサブグラフ、または論理形式三つ組のリストである、請求項64に記
載の方法。 - 【請求項66】 前記取得するステップは、 出力ドキュメント集合内のドキュメントの前記各別の1つのために、記憶媒体
から対応の第2の論理形式を読出すか、または 出力ドキュメント集合内の前記各別の1つのドキュメントを分析することによ
って、前記対応の第2の論理形式を生成するステップを含む、請求項65に記載
の方法。 - 【請求項67】 前記関数は、前記ドキュメントの1つのために、クエリに
関連した前記第1の論理形式と前記1つのドキュメントに関連した前記第2の論
理形式の各々との間の予め定められた関係に基づいてスコアを生成し、前記ラン
ク付けするステップは、出力ドキュメント集合内の各ドキュメントに関連したス
コアに従って、記憶されているエントリをランク付けしてランク順を規定するス
テップを含む、請求項66に記載の方法。 - 【請求項68】 クエリに関連した前記第1の論理形式または出力ドキュメ
ント集合内の前記ドキュメントの1つに関連した前記第2の論理形式は、それぞ
れ前記クエリにまたは前記ドキュメントの1つに関連した語句のパラフレーズを
さらに含む、請求項67に記載の方法。 - 【請求項69】 前記第1の論理形式および前記第2の論理形式の各々は1
つ以上の論理形式三つ組の、対応の第1のリストおよび第2のリストを含み、前
記第1のリスト内の前記論理形式三つ組と前記第2のリスト内の前記論理形式三
つ組とは各々、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、
対応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、
2つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項68に
記載の方法。 - 【請求項70】 クエリに関連した前記第1の論理形式の任意のものと出力
ドキュメント集合内の任意のドキュメントに関連した前記第2の論理形式の任意
のものとの間の前記一致は同一の一致である、請求項67に記載の方法。 - 【請求項71】 前記第1の論理形式および前記第2の論理形式の各々は1
つ以上の論理形式三つ組の、対応の第1のリストおよび第2のリストを含み、前
記第1のリスト内の前記論理形式三つ組と前記第2のリスト内の前記論理形式三
つ組とは各々、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、
対応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、
2つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項70に
記載の方法。 - 【請求項72】 リポジトリはデータセットを含む、請求項67に記載の方
法。 - 【請求項73】 クエリはフルテキストのクエリである、請求項67に記載
の方法。 - 【請求項74】 検索システムは統計的サーチエンジンを含む、請求項67
に記載の方法。 - 【請求項75】 システムはクライエントコンピュータをさらに含み、前記
方法はクライエントコンピュータにおいて、 ユーザからのクエリを取得するステップと、 出力ドキュメント集合内の複数のドキュメントを前記ランク順に表示するステ
ップとを含み、 システムはネットワーク接続を介してクライエントコンピュータに接続される
サーバをさらに含み、前記方法はサーバにおいて、 クライエントコンピュータからクエリを取得するステップと、 出力ドキュメント集合内の前記複数のドキュメントを前記ランク順にクライエ
ントコンピュータに与えるステップとを含む、請求項67に記載の方法。 - 【請求項76】 検索システムは統計的サーチエンジンである、請求項75
に記載の方法。 - 【請求項77】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項76に記載の方法。 - 【請求項78】 サーチエンジンにおいて、クエリに応答して、出力ドキュ
メント集合内の前記複数のドキュメントの各1つのためにリポジトリから記憶さ
れているレコードを検索するステップをさらに含み、レコードは出力ドキュメン
ト集合内の前記ドキュメントの各1つが見出される得る場所を特定する情報を含
み、サーバにおいて、レコードに含まれている情報に応答して、前記ドキュメン
トの各1つにそのための関連のサーバからアクセスし、それをダウンロードし、
出力ドキュメント集合内に含めるステップをさらに含む、請求項77に記載の方
法。 - 【請求項79】 システムはクライエントコンピュータとネットワーク接続
を介してクライエントコンピュータに接続されるサーバとをさらに含み、前記サ
ーバは前記検索システムを実現し、前記方法は、サーバにおいて、クライエント
コンピュータによって与えられるクエリに応答して前記出力ドキュメント集合を
クライエントコンピュータに与えるステップをさらに含む、請求項67に記載の
方法。 - 【請求項80】 検索システムは統計的サーチエンジンを含む、請求項79
に記載の方法。 - 【請求項81】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項80に記載の方法。 - 【請求項82】 サーチエンジンにおいて、クエリに応答して、出力ドキュ
メント集合内の前記複数のドキュメントの各1つのためにリポジトリから記憶さ
れているレコードを検索するステップをさらに含み、レコードは出力ドキュメン
トの集合内の前記ドキュメントの各1つが見出され得る場所を特定する情報を含
み、クライエントコンピュータにおいて、レコードに含まれている情報に応答し
て、前記ドキュメントの各1つにそのための関連のサーバからアクセスし、それ
をダウンロードし、出力ドキュメント集合内に含めるステップをさらに含む、請
求項81に記載の方法。 - 【請求項83】 システムはコンピュータをさらに含み、前記方法はコンピ
ュータにおいて前記検索システムを実現するステップを含む、請求項67に記載
の方法。 - 【請求項84】 検索システムは統計的サーチエンジンを含む、請求項83
に記載の方法。 - 【請求項85】 前記1つのドキュメントのためのスコアはまた、前記1つ
のドキュメントのための第2の論理形式内のノード語、前記1つのドキュメント
内の前記ノード語の頻度または意味的内容、前記1つのドキュメント内の予め規
定されたノード語の頻度または意味的内容、前記1つのドキュメントのための特
定の論理形式三つ組の頻度、もしくは前記1つのドキュメントの長さの、予め定
められた関数である、請求項67に記載の方法。 - 【請求項86】 リポジトリはデータセットを含む、請求項85に記載の方
法。 - 【請求項87】 クエリはフルテキストのクエリである、請求項85に記載
の方法。 - 【請求項88】 検索システムは統計的サーチエンジンを含む、請求項85
に記載の方法。 - 【請求項89】 システムはクライエントコンピュータをさらに含み、前記
方法はクライエントコンピュータにおいて、 ユーザからのクエリを取得するステップと、 出力ドキュメント集合内の複数のドキュメントを前記ランク順に表示するステ
ップとをさらに含み、 システムはネットワーク接続を介してクライエントコンピュータに接続される
サーバをさらに含み、前記方法はサーバにおいて、 クライエントコンピュータからクエリを取得するステップと、 出力ドキュメント集合内の前記複数のドキュメントを前記ランク順にクライエ
ントコンピュータに与えるステップとをさらに含む、請求項85に記載の方法。 - 【請求項90】 検索システムは統計的サーチエンジンを含む、請求項89
に記載の方法。 - 【請求項91】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項90に記載の方法。 - 【請求項92】 サーチエンジンにおいて、クエリに応答して、出力ドキュ
メント集合内の前記複数のドキュメントの各1つのためにリポジトリから記憶さ
れているレコードを検索するステップをさらに含み、レコードは出力ドキュメン
ト集合内の前記ドキュメントの各1つが見出され得る場所を特定する情報を含み
、サーバにおいて、レコードに含まれている情報に応答して、前記ドキュメント
の各1つにそのための関連のサーバからアクセスし、それをダウンロードし、出
力ドキュメント集合内に含めるステップをさらに含む、請求項91に記載の方法
。 - 【請求項93】 システムはクライエントコンピュータとネットワーク接続
を介してクライエントコンピュータに接続されるサーバとを含み、前記サーバは
前記検索システムを実現し、前記方法は、サーバにおいて、クライエントコンピ
ュータによって与えられるクエリに応答して前記出力ドキュメント集合をクライ
エントコンピュータに与えるステップをさらに含む、請求項85に記載の方法。 - 【請求項94】 検索システムは統計的サーチエンジンを含む、請求項93
に記載の方法。 - 【請求項95】 ネットワーク接続はインターネットまたはインターネット
接続である、請求項94に記載の方法。 - 【請求項96】 サーチエンジンにおいて、クエリに応答して、出力ドキュ
メント集合内の前記複数のドキュメントの各1つのためにリポジトリから記憶さ
れているレコードを検索するステップをさらに含み、レコードは出力ドキュメン
ト集合内の前記ドキュメントの各1つが見出され得る場所を特定する情報を含み
、クライエントコンピュータにおいて、レコードに含まれている情報に応答して
、前記ドキュメントの各1つにそのための関連のサーバからアクセスし、それを
ダウンロードし、出力ドキュメント集合内に含めるステップをさらに含む、請求
項95に記載の方法。 - 【請求項97】 システムはコンピュータをさらに含み、前記方法はコンピ
ュータにおいて前記検索システムを実現するステップを含む、請求項85に記載
の方法。 - 【請求項98】 検索システムは統計的サーチエンジンを含む、請求項97
に記載の方法。 - 【請求項99】 前記第1の論理形式および前記第2の論理形式の各々は1
つ以上の論理形式三つ組の対応の第1のリストおよび第2のリストを含み、前記
第1のリスト内の前記論理形式三つ組と前記第2のリスト内の前記論理形式三つ
組とは各々、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、対
応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、2
つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項67に記
載の方法。 - 【請求項100】 クエリに関連した論理形式三つ組の前記第1のリストか
、または出力ドキュメント集合内の前記ドキュメントの1つに関連した論理形式
三つ組の前記第2のリストは、それぞれ前記クエリにまたは前記ドキュメントの
1つに関連した語句のパラフレーズをさらに含む、請求項99に記載の方法。 - 【請求項101】 前記1つのドキュメントのためのスコアはまた、前記1
つのドキュメントのための第2の論理形式内のノード語、前記1つのドキュメン
ト内の前記ノード語の頻度または意味的内容、前記1つのドキュメント内の予め
規定されたノード語の頻度または意味的内容、前記1つのドキュメントのための
特定の論理形式三つ組の頻度、もしくは前記1つのドキュメントの長さの、予め
定められた関数である、請求項99に記載の方法。 - 【請求項102】 前記関数は、クエリに関連した論理形式三つ組の少なく
とも1つと同一に一致する、出力ドキュメント集合内の前記複数のドキュメント
の各々に関連した論理形式三つ組にわたってとられた重みの合計であり、一致す
る各論理形式三つ組に割当てられる重みはそれに関連した意味的関係のタイプに
よって定義される、請求項99に記載の方法。 - 【請求項103】 前記ランク付けするステップは、 クエリに関連した論理形式三つ組の任意のものが出力ドキュメント集合内の任
意のドキュメントに関連した論理形式三つ組の任意のものと一致するか否かを判
断して、前記任意のドキュメントに関連した一致する三つ組を規定するステップ
と、 関連した少なくとも1つの一致する論理形式三つ組を有する前記出力ドキュメ
ント集合内のドキュメントの各1つのために、前記一致する論理形式三つ組の各 々に関連した意味的関係によって予め規定される重み数値を用いて前記各1つの ドキュメント内の一致する論理形式三つ組に重み付けして、前記1つのドキュメ
ントのための1つ以上の重みを形成するステップと、 前記1つ以上の重みの関数として前記1つのドキュメントのためのスコアを計
算するステップと、 前記ドキュメントの各1つをその前記スコアに従ってランク付けしてランク順
を規定するステップとを含む、請求項102に記載の方法。 - 【請求項104】 ランク順は重みの大きいものから小さいものの順である
、請求項103に記載の方法。 - 【請求項105】 記憶されているエントリを与えるステップは、前記出力
ドキュメント集合内のドキュメントの、最も高い、連続するランク付けを有する
、前記出力ドキュメント集合のための前記エントリの第1の予め規定されたグル
ープを提示するステップを含む、請求項99に記載の方法。 - 【請求項106】 出力ドキュメント集合内の前記複数のドキュメントは、
関連した少なくとも1つの一致する三つ組を有する、前記出力ドキュメント集合
内のドキュメントからなる、請求項105に記載の方法。 - 【請求項107】 前記第1の論理形式三つ組および前記第2の論理形式三
つ組の各々は、それぞれクエリ内のまたは前記ドキュメントの各1つの句内の、
対応の論理形式グラフにおいて意味的に関係した2つの語の各々の語幹の形と、
2つの語の間の意味的関係を表わす予め規定された関係とを含む、請求項106
に記載の方法。 - 【請求項108】 クエリに関連した前記論理形式三つ組か、または出力ド
キュメント集合内の前記ドキュメントの1つに関連した前記論理形式三つ組は、
前記語のいずれかの上位語または類義語を含む論理形式三つ組をさらに含む、請
求項99に記載の方法。 - 【請求項109】 クエリに関連した論理形式三つ組の前記任意のものと出
力ドキュメント集合内の任意のドキュメントに関連した論理形式三つ組の前記任
意のものとの間の前記一致は同一の一致である、請求項99に記載の方法。 - 【請求項110】 リポジトリはデータセットを含む、請求項99に記載の
方法。 - 【請求項111】 クエリはフルテキストのクエリである、請求項99に記
載の方法。 - 【請求項112】 検索システムは統計的サーチエンジンを含む、請求項9
9に記載の方法。 - 【請求項113】 前記システムはクライエントコンピュータをさらに含み
、前記方法はクライエントコンピュータにおいて、 ユーザからのクエリを取得するステップと、 出力ドキュメント集合内の複数のドキュメントを前記ランク順に表示するステ
ップとを含み、 前記システムはネットワーク接続を介してクライエントコンピュータに接続さ
れるサーバをさらに含み、前記方法はサーバにおいて、 クライエントコンピュータからクエリを取得するステップと、 出力ドキュメント集合内の前記複数のドキュメントを前記ランク順にクライエ
ントコンピュータに与えるステップとをさらに含む、請求項99に記載の方法。 - 【請求項114】 検索システムは統計的サーチエンジンを含む、請求項1
13に記載の方法。 - 【請求項115】 ネットワーク接続はインターネットまたはインターネッ
ト接続である、請求項114に記載の方法。 - 【請求項116】 サーチエンジンにおいて、クエリに応答して、出力ドキ
ュメント集合内の前記複数のドキュメントの各1つのために、リポジトリから記
憶されているレコードを検索するステップをさらに含み、レコードは出力ドキュ
メント集合内の前記ドキュメントの各1つが見出され得る場所を特定する情報を
含み、サーバにおいて、レコードに含まれている情報に応答して、前記ドキュメ
ントの各1つにそのための関連するサーバからアクセスし、それをダウンロード
し、出力ドキュメント集合内に含めるステップをさらに含む、請求項115に記
載の方法。 - 【請求項117】 システムはクライエントコンピュータとネットワーク接
続を介してクライエントコンピュータに接続されるサーバとを含み、前記サーバ
は前記検索システムを実現し、前記方法は、サーバにおいて、クライエントコン
ピュータによって与えられるクエリに応答して前記出力ドキュメント集合をクラ
イエントコンピュータに与えるステップをさらに含む、請求項99に記載の方法
。 - 【請求項118】 検索システムは統計的サーチエンジンを含む、請求項1
17に記載の方法。 - 【請求項119】 ネットワーク接続はインターネットまたはインターネッ
ト接続である、請求項118に記載の方法。 - 【請求項120】 サーチエンジンにおいて、クエリに応答して、出力ドキ
ュメント集合内の前記複数のドキュメントの各1つのために、リポジトリから記
憶されているレコードを検索するステップをさらに含み、レコードは出力ドキュ
メント集合内の前記ドキュメントの各1つが見出され得る場所を特定する情報を
含み、クライエントコンピュータにおいて、レコードに含まれている情報に応答
して、前記ドキュメントの各1つにそのための関連のサーバからアクセスし、そ
れをダウンロードし、出力ドキュメント集合内に含めるステップをさらに含む、
請求項119に記載の方法。 - 【請求項121】 システムはコンピュータをさらに含み、前記方法はコン
ピュータにおいて前記検索システムを実現するステップをさらに含む、請求項9
9に記載の方法。 - 【請求項122】 検索システムは統計的サーチエンジンを含む、請求項1
21に記載の方法。 - 【請求項123】 コンピュータで実行可能な命令を記憶し、請求項63に
記載のステップを実行するためのコンピュータ読出可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/898,652 US5933822A (en) | 1997-07-22 | 1997-07-22 | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US08/898,652 | 1997-07-22 | ||
PCT/US1998/009711 WO1999005618A1 (en) | 1997-07-22 | 1998-05-13 | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001511564A true JP2001511564A (ja) | 2001-08-14 |
Family
ID=25409820
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000504525A Pending JP2001511564A (ja) | 1997-07-22 | 1998-05-13 | 全体の精度を高めるためにサーチ結果の自然言語処理を用いる情報検索システムのための装置および方法 |
JP2000504528A Expired - Lifetime JP4892130B2 (ja) | 1997-07-22 | 1998-07-17 | 自然言語処理技法を用いたテキスト入力処理システム |
JP2009252231A Expired - Fee Related JP4738523B2 (ja) | 1997-07-22 | 2009-11-02 | 自然言語処理技法を用いたテキスト入力処理システム |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000504528A Expired - Lifetime JP4892130B2 (ja) | 1997-07-22 | 1998-07-17 | 自然言語処理技法を用いたテキスト入力処理システム |
JP2009252231A Expired - Fee Related JP4738523B2 (ja) | 1997-07-22 | 2009-11-02 | 自然言語処理技法を用いたテキスト入力処理システム |
Country Status (5)
Country | Link |
---|---|
US (2) | US5933822A (ja) |
EP (1) | EP0996899B8 (ja) |
JP (3) | JP2001511564A (ja) |
CN (1) | CN1165858C (ja) |
WO (1) | WO1999005618A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7630879B2 (en) | 2002-09-13 | 2009-12-08 | Fuji Xerox Co., Ltd. | Text sentence comparing apparatus |
KR101004515B1 (ko) | 2002-09-19 | 2010-12-31 | 마이크로소프트 코포레이션 | 문장 데이터베이스로부터 문장들을 사용자에게 제공하는 컴퓨터 구현 방법 및 이 방법을 수행하기 위한 컴퓨터 실행가능 명령어가 저장되어 있는 유형의 컴퓨터 판독가능 기록 매체, 문장 데이터베이스로부터 확인 문장들을 검색하는 시스템이 저장되어 있는 컴퓨터 판독가능 기록 매체 |
JP4992715B2 (ja) * | 2005-08-04 | 2012-08-08 | 日本電気株式会社 | データ処理装置、データ処理方法、データ処理プログラム |
JP5716223B1 (ja) * | 2014-07-14 | 2015-05-13 | 株式会社think−plus | 思考支援辞書、思考支援辞書システム、思考支援システム、思考支援方法、思考支援プログラム、思考支援プログラム記憶媒体、および思考支援データ記憶媒体 |
JP2019204153A (ja) * | 2018-05-21 | 2019-11-28 | 日本電信電話株式会社 | 文比較装置、方法、及びプログラム |
Families Citing this family (748)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6067552A (en) * | 1995-08-21 | 2000-05-23 | Cnet, Inc. | User interface system and method for browsing a hypertext database |
US20030212996A1 (en) * | 1996-02-08 | 2003-11-13 | Wolzien Thomas R. | System for interconnection of audio program data transmitted by radio to remote vehicle or individual with GPS location |
US5995921A (en) * | 1996-04-23 | 1999-11-30 | International Business Machines Corporation | Natural language help interface |
US6457004B1 (en) | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
WO1998010307A1 (en) | 1996-09-09 | 1998-03-12 | Dennis Jay Dupray | Location of a mobile station |
US6236365B1 (en) | 1996-09-09 | 2001-05-22 | Tracbeam, Llc | Location of a mobile station using a plurality of commercial wireless infrastructures |
US9134398B2 (en) | 1996-09-09 | 2015-09-15 | Tracbeam Llc | Wireless location using network centric location estimators |
US7714778B2 (en) | 1997-08-20 | 2010-05-11 | Tracbeam Llc | Wireless location gateway and applications therefor |
US7903029B2 (en) | 1996-09-09 | 2011-03-08 | Tracbeam Llc | Wireless location routing applications and architecture therefor |
US6249252B1 (en) | 1996-09-09 | 2001-06-19 | Tracbeam Llc | Wireless location using multiple location estimators |
GB2331166B (en) * | 1997-11-06 | 2002-09-11 | Ibm | Database search engine |
US6498921B1 (en) | 1999-09-01 | 2002-12-24 | Chi Fai Ho | Method and system to answer a natural-language question |
US5836771A (en) | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
JP3270351B2 (ja) | 1997-01-31 | 2002-04-02 | 株式会社東芝 | 電子化文書処理装置 |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US6453334B1 (en) | 1997-06-16 | 2002-09-17 | Streamtheory, Inc. | Method and apparatus to allow remotely located computer programs and/or data to be accessed on a local computer in a secure, time-limited manner, with persistent caching |
US5926808A (en) * | 1997-07-25 | 1999-07-20 | Claritech Corporation | Displaying portions of text from multiple documents over multiple databases related to a search query in a computer network |
US6070134A (en) * | 1997-07-31 | 2000-05-30 | Microsoft Corporation | Identifying salient semantic relation paths between two words |
US6138085A (en) * | 1997-07-31 | 2000-10-24 | Microsoft Corporation | Inferring semantic relations |
AU742831B2 (en) * | 1997-09-04 | 2002-01-10 | British Telecommunications Public Limited Company | Methods and/or systems for selecting data sets |
WO1999017224A1 (en) * | 1997-09-29 | 1999-04-08 | Fujun Bi | A multi-element confidence matching system and the method therefor |
EP0979497A1 (en) * | 1997-10-08 | 2000-02-16 | Koninklijke Philips Electronics N.V. | Vocabulary and/or language model training |
US6708203B1 (en) * | 1997-10-20 | 2004-03-16 | The Delfin Project, Inc. | Method and system for filtering messages based on a user profile and an informational processing system event |
US6311223B1 (en) * | 1997-11-03 | 2001-10-30 | International Business Machines Corporation | Effective transmission of documents in hypertext markup language (HTML) |
US6711568B1 (en) | 1997-11-25 | 2004-03-23 | Krishna Asur Bharat | Method for estimating coverage of web search engines |
US6145003A (en) * | 1997-12-17 | 2000-11-07 | Microsoft Corporation | Method of web crawling utilizing address mapping |
US6021411A (en) * | 1997-12-30 | 2000-02-01 | International Business Machines Corporation | Case-based reasoning system and method for scoring cases in a case database |
US6260047B1 (en) * | 1998-01-02 | 2001-07-10 | Maxagrid International, Inc. | Inventory management system |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
IL123129A (en) * | 1998-01-30 | 2010-12-30 | Aviv Refuah | Www addressing |
JP3664874B2 (ja) * | 1998-03-28 | 2005-06-29 | 松下電器産業株式会社 | 文書検索装置 |
US6253208B1 (en) * | 1998-03-31 | 2001-06-26 | British Telecommunications Public Limited Company | Information access |
US6175829B1 (en) * | 1998-04-22 | 2001-01-16 | Nec Usa, Inc. | Method and apparatus for facilitating query reformulation |
US6199081B1 (en) * | 1998-06-30 | 2001-03-06 | Microsoft Corporation | Automatic tagging of documents and exclusion by content |
US6401118B1 (en) * | 1998-06-30 | 2002-06-04 | Online Monitoring Services | Method and computer program product for an online monitoring search engine |
JP3309077B2 (ja) * | 1998-08-31 | 2002-07-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構文情報を用いた検索方法およびシステム |
US6253187B1 (en) | 1998-08-31 | 2001-06-26 | Maxagrid International, Inc. | Integrated inventory management system |
US6243670B1 (en) * | 1998-09-02 | 2001-06-05 | Nippon Telegraph And Telephone Corporation | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames |
US6167370A (en) * | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
WO2000017784A1 (en) * | 1998-09-18 | 2000-03-30 | Tacit Knowledge Systems | Method of constructing and displaying an entity profile constructed utilizing input from entities other than the owner |
IL126373A (en) | 1998-09-27 | 2003-06-24 | Haim Zvi Melman | Apparatus and method for search and retrieval of documents |
GB9821969D0 (en) * | 1998-10-08 | 1998-12-02 | Canon Kk | Apparatus and method for processing natural language |
US6370532B1 (en) * | 1998-11-09 | 2002-04-09 | Unisys Corporation | Cool ICE batch interface |
US8135413B2 (en) | 1998-11-24 | 2012-03-13 | Tracbeam Llc | Platform and applications for wireless location and other complex services |
US6523028B1 (en) * | 1998-12-03 | 2003-02-18 | Lockhead Martin Corporation | Method and system for universal querying of distributed databases |
US6920464B2 (en) * | 1998-12-03 | 2005-07-19 | Grantley Patent Holdings, Ltd. | System for generating an advertising revenue projection |
US7062707B1 (en) * | 1998-12-08 | 2006-06-13 | Inceptor, Inc. | System and method of providing multiple items of index information for a single data object |
US7493553B1 (en) | 1998-12-29 | 2009-02-17 | Intel Corporation | Structured web advertising |
US6553347B1 (en) * | 1999-01-25 | 2003-04-22 | Active Point Ltd. | Automatic virtual negotiations |
GB9904662D0 (en) * | 1999-03-01 | 1999-04-21 | Canon Kk | Natural language search method and apparatus |
US8572069B2 (en) | 1999-03-31 | 2013-10-29 | Apple Inc. | Semi-automatic index term augmentation in document retrieval |
US8275661B1 (en) | 1999-03-31 | 2012-09-25 | Verizon Corporate Services Group Inc. | Targeted banner advertisements |
AU4328000A (en) | 1999-03-31 | 2000-10-16 | Verizon Laboratories Inc. | Techniques for performing a data query in a computer system |
DE50001172D1 (de) | 1999-04-01 | 2003-03-06 | Oce Printing Systems Gmbh | Vorrichtung und verfahren zum verarbeiten und drucken von informationen |
US6591261B1 (en) * | 1999-06-21 | 2003-07-08 | Zerx, Llc | Network search engine and navigation tool and method of determining search results in accordance with search criteria and/or associated sites |
AU776059B2 (en) * | 1999-07-02 | 2004-08-26 | Telstra Corporation Limited | Search system |
AUPQ138199A0 (en) | 1999-07-02 | 1999-07-29 | Telstra R & D Management Pty Ltd | A search system |
US6718363B1 (en) * | 1999-07-30 | 2004-04-06 | Verizon Laboratories, Inc. | Page aggregation for web sites |
US6430558B1 (en) * | 1999-08-02 | 2002-08-06 | Zen Tech, Inc. | Apparatus and methods for collaboratively searching knowledge databases |
JP2001052014A (ja) * | 1999-08-09 | 2001-02-23 | Just Syst Corp | 自然文検索可能装置およびこれを実現するプログラムを記憶した記憶媒体 |
JP3702414B2 (ja) * | 1999-08-11 | 2005-10-05 | 株式会社日立製作所 | 情報検索支援方法、コンピュータ読み取り可能な記憶媒体および情報検索装置 |
US6845354B1 (en) * | 1999-09-09 | 2005-01-18 | Institute For Information Industry | Information retrieval system with a neuro-fuzzy structure |
US7925610B2 (en) * | 1999-09-22 | 2011-04-12 | Google Inc. | Determining a meaning of a knowledge item using document-based information |
US6816857B1 (en) | 1999-11-01 | 2004-11-09 | Applied Semantics, Inc. | Meaning-based advertising and document relevance determination |
US8051104B2 (en) | 1999-09-22 | 2011-11-01 | Google Inc. | Editing a network of interconnected concepts |
US8914361B2 (en) * | 1999-09-22 | 2014-12-16 | Google Inc. | Methods and systems for determining a meaning of a document to match the document to content |
EP1286735A1 (en) | 1999-09-24 | 2003-03-05 | Dennis Jay Dupray | Geographically constrained network services |
US7949722B1 (en) | 1999-09-29 | 2011-05-24 | Actv Inc. | Enhanced video programming system and method utilizing user-profile information |
US7418431B1 (en) | 1999-09-30 | 2008-08-26 | Fair Isaac Corporation | Webstation: configurable web-based workstation for reason driven data analysis |
AU7840300A (en) * | 1999-09-30 | 2001-04-30 | Hnc Software, Inc. | Webstation: configurable web-based workstation for reason driven data analysis |
AU7941600A (en) * | 1999-10-12 | 2001-04-23 | Shopper Inc., The | A method and system for automatically structuring content from universal marked-up documents |
US7536561B2 (en) | 1999-10-15 | 2009-05-19 | Ebrary, Inc. | Method and apparatus for improved information transactions |
US8311946B1 (en) | 1999-10-15 | 2012-11-13 | Ebrary | Method and apparatus for improved information transactions |
AU1051101A (en) * | 1999-10-27 | 2001-05-08 | Zapper Technologies Inc. | Context-driven information retrieval |
US6569206B1 (en) * | 1999-10-29 | 2003-05-27 | Verizon Laboratories Inc. | Facilitation of hypervideo by automatic IR techniques in response to user requests |
US6493707B1 (en) | 1999-10-29 | 2002-12-10 | Verizon Laboratories Inc. | Hypervideo: information retrieval using realtime buffers |
US6490580B1 (en) | 1999-10-29 | 2002-12-03 | Verizon Laboratories Inc. | Hypervideo information retrieval usingmultimedia |
US6757866B1 (en) | 1999-10-29 | 2004-06-29 | Verizon Laboratories Inc. | Hyper video: information retrieval using text from multimedia |
US6996775B1 (en) * | 1999-10-29 | 2006-02-07 | Verizon Laboratories Inc. | Hypervideo: information retrieval using time-related multimedia: |
JP2001134606A (ja) * | 1999-11-09 | 2001-05-18 | Ricoh Co Ltd | 文書リンク記述方法、文書リンク生成装置および記憶媒体 |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7050977B1 (en) | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6651058B1 (en) * | 1999-11-15 | 2003-11-18 | International Business Machines Corporation | System and method of automatic discovery of terms in a document that are relevant to a given target topic |
WO2001037134A1 (en) | 1999-11-16 | 2001-05-25 | Searchcraft Corporation | Method for searching from a plurality of data sources |
US7249315B2 (en) | 1999-11-23 | 2007-07-24 | John Brent Moetteli | System and method of creating and following URL tours |
WO2001042981A2 (en) * | 1999-12-07 | 2001-06-14 | Qjunction Technology, Inc. | Natural english language search and retrieval system and method |
US6850906B1 (en) | 1999-12-15 | 2005-02-01 | Traderbot, Inc. | Real-time financial search engine and method |
WO2001044986A1 (en) * | 1999-12-17 | 2001-06-21 | Si Han Kim | Information coding and retrieval system and method thereof |
US20010032112A1 (en) * | 1999-12-30 | 2001-10-18 | Linz Aaron M. | Method and system for improved matching and scheduling |
US20010053968A1 (en) * | 2000-01-10 | 2001-12-20 | Iaskweb, Inc. | System, method, and computer program product for responding to natural language queries |
US7849117B2 (en) * | 2000-01-12 | 2010-12-07 | Knowledge Sphere, Inc. | Multi-term frequency analysis |
KR20000024179A (ko) * | 2000-01-26 | 2000-05-06 | 조민형 | 한국어 인터넷 자연어 질의 응답형 정보 검색 엔진 구축방법. |
US6571240B1 (en) * | 2000-02-02 | 2003-05-27 | Chi Fai Ho | Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases |
EP1364308A2 (en) * | 2000-02-24 | 2003-11-26 | Findbase, L.L.C. | Method and system for extracting, analyzing, storing, comparing and reporting on data stored in web and/or other network repositories and apparatus to detect, prevent and obfuscate information removal from information servers |
US6564209B1 (en) * | 2000-03-08 | 2003-05-13 | Accenture Llp | Knowledge management tool for providing abstracts of information |
US7099925B1 (en) | 2000-03-15 | 2006-08-29 | Drugstore.Com | Electronic commerce session management |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
GB0006721D0 (en) * | 2000-03-20 | 2000-05-10 | Mitchell Thomas A | Assessment methods and systems |
US7428500B1 (en) * | 2000-03-30 | 2008-09-23 | Amazon. Com, Inc. | Automatically identifying similar purchasing opportunities |
ES2381530T3 (es) * | 2000-03-31 | 2012-05-29 | Opentv, Inc. | Sistema y método para la inserción de metadatos locales |
US20010039490A1 (en) * | 2000-04-03 | 2001-11-08 | Mikhail Verbitsky | System and method of analyzing and comparing entity documents |
US7120574B2 (en) | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US7177798B2 (en) * | 2000-04-07 | 2007-02-13 | Rensselaer Polytechnic Institute | Natural language interface using constrained intermediate dictionary of results |
US7730072B2 (en) * | 2000-04-14 | 2010-06-01 | Rightnow Technologies, Inc. | Automated adaptive classification system for knowledge networks |
US7356604B1 (en) * | 2000-04-18 | 2008-04-08 | Claritech Corporation | Method and apparatus for comparing scores in a vector space retrieval process |
US7962326B2 (en) * | 2000-04-20 | 2011-06-14 | Invention Machine Corporation | Semantic answering system and method |
US20020010574A1 (en) * | 2000-04-20 | 2002-01-24 | Valery Tsourikov | Natural language processing and query driven information retrieval |
US7030837B1 (en) * | 2000-04-24 | 2006-04-18 | Microsoft Corporation | Auxiliary display unit for a computer system |
US6917373B2 (en) * | 2000-12-28 | 2005-07-12 | Microsoft Corporation | Context sensitive labels for an electronic device |
US7227511B2 (en) * | 2000-04-24 | 2007-06-05 | Microsoft Corporation | Method for activating an application in context on a remote input/output device |
US7120627B1 (en) * | 2000-04-26 | 2006-10-10 | Global Information Research And Technologies, Llc | Method for detecting and fulfilling an information need corresponding to simple queries |
US20020123994A1 (en) * | 2000-04-26 | 2002-09-05 | Yves Schabes | System for fulfilling an information need using extended matching techniques |
US6859800B1 (en) | 2000-04-26 | 2005-02-22 | Global Information Research And Technologies Llc | System for fulfilling an information need |
WO2001084376A2 (en) * | 2000-04-28 | 2001-11-08 | Global Information Research And Technologies Llc | System for answering natural language questions |
US6711561B1 (en) * | 2000-05-02 | 2004-03-23 | Iphrase.Com, Inc. | Prose feedback in information access system |
US7127450B1 (en) | 2000-05-02 | 2006-10-24 | International Business Machines Corporation | Intelligent discard in information access system |
US6704728B1 (en) | 2000-05-02 | 2004-03-09 | Iphase.Com, Inc. | Accessing information from a collection of data |
US6745181B1 (en) * | 2000-05-02 | 2004-06-01 | Iphrase.Com, Inc. | Information access method |
US8478732B1 (en) * | 2000-05-02 | 2013-07-02 | International Business Machines Corporation | Database aliasing in information access system |
US6912525B1 (en) * | 2000-05-08 | 2005-06-28 | Verizon Laboratories, Inc. | Techniques for web site integration |
US6789076B1 (en) | 2000-05-11 | 2004-09-07 | International Business Machines Corp. | System, method and program for augmenting information retrieval in a client/server network using client-side searching |
US20020099730A1 (en) * | 2000-05-12 | 2002-07-25 | Applied Psychology Research Limited | Automatic text classification system |
GB2362238A (en) | 2000-05-12 | 2001-11-14 | Applied Psychology Res Ltd | Automatic text classification |
US6876997B1 (en) | 2000-05-22 | 2005-04-05 | Overture Services, Inc. | Method and apparatus for indentifying related searches in a database search system |
US7013323B1 (en) * | 2000-05-23 | 2006-03-14 | Cyveillance, Inc. | System and method for developing and interpreting e-commerce metrics by utilizing a list of rules wherein each rule contain at least one of entity-specific criteria |
US6983320B1 (en) * | 2000-05-23 | 2006-01-03 | Cyveillance, Inc. | System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages |
US6636848B1 (en) * | 2000-05-31 | 2003-10-21 | International Business Machines Corporation | Information search using knowledge agents |
US10641861B2 (en) | 2000-06-02 | 2020-05-05 | Dennis J. Dupray | Services and applications for a communications network |
US9875492B2 (en) | 2001-05-22 | 2018-01-23 | Dennis J. Dupray | Real estate transaction system |
US6965857B1 (en) * | 2000-06-02 | 2005-11-15 | Cogilex Recherches & Developpement Inc. | Method and apparatus for deriving information from written text |
US10684350B2 (en) | 2000-06-02 | 2020-06-16 | Tracbeam Llc | Services and applications for a communications network |
US7496502B2 (en) * | 2000-06-16 | 2009-02-24 | Semiconductor Energy Laboratory Co., Ltd. | Information providing system and method therefor |
US9699129B1 (en) | 2000-06-21 | 2017-07-04 | International Business Machines Corporation | System and method for increasing email productivity |
US8290768B1 (en) | 2000-06-21 | 2012-10-16 | International Business Machines Corporation | System and method for determining a set of attributes based on content of communications |
US6408277B1 (en) | 2000-06-21 | 2002-06-18 | Banter Limited | System and method for automatic task prioritization |
SE517496C2 (sv) * | 2000-06-22 | 2002-06-11 | Hapax Information Systems Ab | Metod och system för informationsextrahering |
US20020091836A1 (en) * | 2000-06-24 | 2002-07-11 | Moetteli John Brent | Browsing method for focusing research |
US7003513B2 (en) * | 2000-07-04 | 2006-02-21 | International Business Machines Corporation | Method and system of weighted context feedback for result improvement in information retrieval |
US20030225751A1 (en) * | 2000-07-06 | 2003-12-04 | Kim Si Han | Information searching system and method thereof |
US6463430B1 (en) | 2000-07-10 | 2002-10-08 | Mohomine, Inc. | Devices and methods for generating and managing a database |
US6675159B1 (en) * | 2000-07-27 | 2004-01-06 | Science Applic Int Corp | Concept-based search and retrieval system |
US6915294B1 (en) * | 2000-08-18 | 2005-07-05 | Firstrain, Inc. | Method and apparatus for searching network resources |
US7392238B1 (en) * | 2000-08-23 | 2008-06-24 | Intel Corporation | Method and apparatus for concept-based searching across a network |
US6766320B1 (en) * | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning |
US20020120651A1 (en) * | 2000-09-12 | 2002-08-29 | Lingomotors, Inc. | Natural language search method and system for electronic books |
US7236932B1 (en) * | 2000-09-12 | 2007-06-26 | Avaya Technology Corp. | Method of and apparatus for improving productivity of human reviewers of automatically transcribed documents generated by media conversion systems |
US20040107173A1 (en) * | 2000-09-25 | 2004-06-03 | E-Chain Cheng | Operating system using artificial intelligence processing |
US20020147578A1 (en) * | 2000-09-29 | 2002-10-10 | Lingomotors, Inc. | Method and system for query reformulation for searching of information |
US20020040384A1 (en) * | 2000-10-04 | 2002-04-04 | John Moetteli | Communication method using customisable banners |
US20020040311A1 (en) * | 2000-10-04 | 2002-04-04 | John Douglass | Web browser page rating system |
WO2002033582A2 (en) * | 2000-10-16 | 2002-04-25 | Text Analysis International, Inc. | Method for analyzing text and method for builing text analyzers |
US7027974B1 (en) | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
US8060816B1 (en) * | 2000-10-31 | 2011-11-15 | International Business Machines Corporation | Methods and apparatus for intelligent crawling on the world wide web |
US6668251B1 (en) * | 2000-11-01 | 2003-12-23 | Tacit Knowledge Systems, Inc. | Rendering discriminator members from an initial set of result data |
US8831995B2 (en) | 2000-11-06 | 2014-09-09 | Numecent Holdings, Inc. | Optimized server for streamed applications |
US20020083183A1 (en) * | 2000-11-06 | 2002-06-27 | Sanjay Pujare | Conventionally coded application conversion system for streamed delivery and execution |
US7062567B2 (en) | 2000-11-06 | 2006-06-13 | Endeavors Technology, Inc. | Intelligent network streaming and execution system for conventionally coded applications |
US7308445B2 (en) * | 2000-11-08 | 2007-12-11 | Overture Services, Inc. | Method for estimating coverage of web search engines |
US8340955B2 (en) | 2000-11-15 | 2012-12-25 | International Business Machines Corporation | System and method for finding the most likely answer to a natural language question |
US6735592B1 (en) | 2000-11-16 | 2004-05-11 | Discern Communications | System, method, and computer program product for a network-based content exchange system |
US7451196B1 (en) | 2000-12-15 | 2008-11-11 | Stream Theory, Inc. | Method and system for executing a software application in a virtual environment |
US7165023B2 (en) * | 2000-12-15 | 2007-01-16 | Arizona Board Of Regents | Method for mining, mapping and managing organizational knowledge from text and conversation |
US6983240B2 (en) * | 2000-12-18 | 2006-01-03 | Xerox Corporation | Method and apparatus for generating normalized representations of strings |
US6678677B2 (en) * | 2000-12-19 | 2004-01-13 | Xerox Corporation | Apparatus and method for information retrieval using self-appending semantic lattice |
US7644057B2 (en) | 2001-01-03 | 2010-01-05 | International Business Machines Corporation | System and method for electronic communication management |
WO2002054279A1 (en) * | 2001-01-04 | 2002-07-11 | Agency For Science, Technology And Research | Improved method of text similarity measurement |
US7356530B2 (en) * | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
EP1225517B1 (en) * | 2001-01-17 | 2006-05-17 | International Business Machines Corporation | System and methods for computer based searching for relevant texts |
US6766316B2 (en) | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US7027987B1 (en) | 2001-02-07 | 2006-04-11 | Google Inc. | Voice interface for a search engine |
US6741984B2 (en) | 2001-02-23 | 2004-05-25 | General Electric Company | Method, system and storage medium for arranging a database |
US6721728B2 (en) | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
US6823333B2 (en) | 2001-03-02 | 2004-11-23 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for conducting a keyterm search |
US6697793B2 (en) | 2001-03-02 | 2004-02-24 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for generating phrases from a database |
US6741981B2 (en) | 2001-03-02 | 2004-05-25 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) | System, method and apparatus for conducting a phrase search |
US7076485B2 (en) * | 2001-03-07 | 2006-07-11 | The Mitre Corporation | Method and system for finding similar records in mixed free-text and structured data |
US7711547B2 (en) * | 2001-03-16 | 2010-05-04 | Meaningful Machines, L.L.C. | Word association method and apparatus |
US8874431B2 (en) * | 2001-03-16 | 2014-10-28 | Meaningful Machines Llc | Knowledge system method and apparatus |
US8744835B2 (en) * | 2001-03-16 | 2014-06-03 | Meaningful Machines Llc | Content conversion method and apparatus |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
US20030083860A1 (en) * | 2001-03-16 | 2003-05-01 | Eli Abir | Content conversion method and apparatus |
US20030093261A1 (en) * | 2001-03-16 | 2003-05-15 | Eli Abir | Multilingual database creation system and method |
JP2002283301A (ja) * | 2001-03-26 | 2002-10-03 | Makita Corp | 際切りマルノコ |
SE0101127D0 (sv) * | 2001-03-30 | 2001-03-30 | Hapax Information Systems Ab | Method of finding answers to questions |
US6721737B2 (en) * | 2001-04-04 | 2004-04-13 | International Business Machines Corporation | Method of ranking items using efficient queries |
US7136846B2 (en) | 2001-04-06 | 2006-11-14 | 2005 Keel Company, Inc. | Wireless information retrieval |
US7197506B2 (en) * | 2001-04-06 | 2007-03-27 | Renar Company, Llc | Collection management system |
US6904428B2 (en) * | 2001-04-18 | 2005-06-07 | Illinois Institute Of Technology | Intranet mediator |
US20020194166A1 (en) * | 2001-05-01 | 2002-12-19 | Fowler Abraham Michael | Mechanism to sift through search results using keywords from the results |
US6961723B2 (en) * | 2001-05-04 | 2005-11-01 | Sun Microsystems, Inc. | System and method for determining relevancy of query responses in a distributed network search mechanism |
US6950821B2 (en) * | 2001-05-04 | 2005-09-27 | Sun Microsystems, Inc. | System and method for resolving distributed network search queries to information providers |
US7171415B2 (en) * | 2001-05-04 | 2007-01-30 | Sun Microsystems, Inc. | Distributed information discovery through searching selected registered information providers |
US6934702B2 (en) * | 2001-05-04 | 2005-08-23 | Sun Microsystems, Inc. | Method and system of routing messages in a distributed search network |
US7099871B2 (en) * | 2001-05-04 | 2006-08-29 | Sun Microsystems, Inc. | System and method for distributed real-time search |
US7013303B2 (en) * | 2001-05-04 | 2006-03-14 | Sun Microsystems, Inc. | System and method for multiple data sources to plug into a standardized interface for distributed deep search |
US7536413B1 (en) | 2001-05-07 | 2009-05-19 | Ixreveal, Inc. | Concept-based categorization of unstructured objects |
US6970881B1 (en) | 2001-05-07 | 2005-11-29 | Intelligenxia, Inc. | Concept-based method and system for dynamically analyzing unstructured information |
USRE46973E1 (en) | 2001-05-07 | 2018-07-31 | Ureveal, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
US7627588B1 (en) | 2001-05-07 | 2009-12-01 | Ixreveal, Inc. | System and method for concept based analysis of unstructured data |
US7194483B1 (en) | 2001-05-07 | 2007-03-20 | Intelligenxia, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
WO2002091355A1 (en) * | 2001-05-08 | 2002-11-14 | Intel Corporation | High-order entropy error functions for neural classifiers |
US6925457B2 (en) * | 2001-07-27 | 2005-08-02 | Metatomix, Inc. | Methods and apparatus for querying a relational data store using schema-less queries |
US7831442B1 (en) * | 2001-05-16 | 2010-11-09 | Perot Systems Corporation | System and method for minimizing edits for medical insurance claims processing |
US7822621B1 (en) | 2001-05-16 | 2010-10-26 | Perot Systems Corporation | Method of and system for populating knowledge bases using rule based systems and object-oriented software |
US8082096B2 (en) | 2001-05-22 | 2011-12-20 | Tracbeam Llc | Wireless location routing applications and architecture therefor |
US6829605B2 (en) * | 2001-05-24 | 2004-12-07 | Microsoft Corporation | Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval |
EP1412874A4 (en) * | 2001-07-27 | 2007-10-17 | Quigo Technologies Inc | SYSTEM AND METHOD FOR MONITORING AND AUTOMATICALLY ANALYZING THE USE OF DOCUMENTS |
US9009590B2 (en) * | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US7130841B1 (en) * | 2001-07-31 | 2006-10-31 | America Online, Inc. | Enabling a search for both local and remote electronic content |
US8249885B2 (en) * | 2001-08-08 | 2012-08-21 | Gary Charles Berkowitz | Knowledge-based e-catalog procurement system and method |
US6609124B2 (en) | 2001-08-13 | 2003-08-19 | International Business Machines Corporation | Hub for strategic intelligence |
US7526425B2 (en) * | 2001-08-14 | 2009-04-28 | Evri Inc. | Method and system for extending keyword searching to syntactically and semantically annotated data |
US7398201B2 (en) * | 2001-08-14 | 2008-07-08 | Evri Inc. | Method and system for enhanced data searching |
WO2003017023A2 (en) * | 2001-08-14 | 2003-02-27 | Quigo Technologies, Inc. | System and method for extracting content for submission to a search engine |
US7283951B2 (en) * | 2001-08-14 | 2007-10-16 | Insightful Corporation | Method and system for enhanced data searching |
US7403938B2 (en) * | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
JP4065936B2 (ja) * | 2001-10-09 | 2008-03-26 | 独立行政法人情報通信研究機構 | 機械学習法を用いた言語解析処理システムおよび機械学習法を用いた言語省略解析処理システム |
US6918097B2 (en) * | 2001-10-09 | 2005-07-12 | Xerox Corporation | Method and apparatus for displaying literary and linguistic information about words |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US7315848B2 (en) | 2001-12-12 | 2008-01-01 | Aaron Pearse | Web snippets capture, storage and retrieval system and method |
US7206778B2 (en) * | 2001-12-17 | 2007-04-17 | Knova Software Inc. | Text search ordered along one or more dimensions |
US7225183B2 (en) * | 2002-01-28 | 2007-05-29 | Ipxl, Inc. | Ontology-based information management system and method |
US6952691B2 (en) | 2002-02-01 | 2005-10-04 | International Business Machines Corporation | Method and system for searching a multi-lingual database |
US20030154071A1 (en) * | 2002-02-11 | 2003-08-14 | Shreve Gregory M. | Process for the document management and computer-assisted translation of documents utilizing document corpora constructed by intelligent agents |
US7343372B2 (en) * | 2002-02-22 | 2008-03-11 | International Business Machines Corporation | Direct navigation for information retrieval |
US8589413B1 (en) | 2002-03-01 | 2013-11-19 | Ixreveal, Inc. | Concept-based method and system for dynamically analyzing results from search engines |
US20030220917A1 (en) * | 2002-04-03 | 2003-11-27 | Max Copperman | Contextual search |
US8380491B2 (en) * | 2002-04-19 | 2013-02-19 | Educational Testing Service | System for rating constructed responses based on concepts and a model answer |
US7403890B2 (en) * | 2002-05-13 | 2008-07-22 | Roushar Joseph C | Multi-dimensional method and apparatus for automated language interpretation |
US20040039734A1 (en) * | 2002-05-14 | 2004-02-26 | Judd Douglass Russell | Apparatus and method for region sensitive dynamically configurable document relevance ranking |
US7024404B1 (en) * | 2002-05-28 | 2006-04-04 | The State University Rutgers | Retrieval and display of data objects using a cross-group ranking metric |
US7328146B1 (en) * | 2002-05-31 | 2008-02-05 | At&T Corp. | Spoken language understanding that incorporates prior knowledge into boosting |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US6892198B2 (en) * | 2002-06-14 | 2005-05-10 | Entopia, Inc. | System and method for personalized information retrieval based on user expertise |
WO2003107141A2 (en) * | 2002-06-17 | 2003-12-24 | Beingmeta, Inc. | Para-linguistic expansion |
US20040039562A1 (en) * | 2002-06-17 | 2004-02-26 | Kenneth Haase | Para-linguistic expansion |
WO2003107223A1 (en) * | 2002-06-17 | 2003-12-24 | Beingmeta, Inc. | Systems and methods for processing queries |
US20040002849A1 (en) * | 2002-06-28 | 2004-01-01 | Ming Zhou | System and method for automatic retrieval of example sentences based upon weighted editing distance |
US7493253B1 (en) | 2002-07-12 | 2009-02-17 | Language And Computing, Inc. | Conceptual world representation natural language understanding system and method |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
ATE492853T1 (de) * | 2002-07-23 | 2011-01-15 | Quigo Technologies Inc | System und verfahren zur automatisierten abbildung von schlüsselwörtern und schlüsselphrasen auf dokumenten |
US20040019478A1 (en) * | 2002-07-29 | 2004-01-29 | Electronic Data Systems Corporation | Interactive natural language query processing system and method |
US20040034635A1 (en) * | 2002-08-15 | 2004-02-19 | Czarnecki David Anthony | Method and system for identifying and matching companies to business event information |
US7567902B2 (en) * | 2002-09-18 | 2009-07-28 | Nuance Communications, Inc. | Generating speech recognition grammars from a large corpus of data |
US7171351B2 (en) * | 2002-09-19 | 2007-01-30 | Microsoft Corporation | Method and system for retrieving hint sentences using expanded queries |
US7293015B2 (en) * | 2002-09-19 | 2007-11-06 | Microsoft Corporation | Method and system for detecting user intentions in retrieval of hint sentences |
US20040098250A1 (en) * | 2002-11-19 | 2004-05-20 | Gur Kimchi | Semantic search system and method |
US7039625B2 (en) * | 2002-11-22 | 2006-05-02 | International Business Machines Corporation | International information search and delivery system providing search results personalized to a particular natural language |
AU2003274592A1 (en) * | 2002-11-28 | 2004-06-18 | Koninklijke Philips Electronics N.V. | Method to assign word class information |
US8155946B2 (en) * | 2002-12-23 | 2012-04-10 | Definiens Ag | Computerized method and system for searching for text passages in text documents |
EP1460562A1 (en) * | 2002-12-23 | 2004-09-22 | Definiens AG | Computerized method and system for searching for text passages from text documents |
AU2003297523A1 (en) * | 2002-12-24 | 2004-07-22 | American Type Culture Collection | Systems and methods for enabling a user to find information of interest to the user |
US7930716B2 (en) | 2002-12-31 | 2011-04-19 | Actv Inc. | Techniques for reinsertion of local market advertising in digital video from a bypass source |
US7111000B2 (en) * | 2003-01-06 | 2006-09-19 | Microsoft Corporation | Retrieval of structured documents |
US20040153305A1 (en) * | 2003-02-03 | 2004-08-05 | Enescu Mircea Gabriel | Method and system for automated matching of text based electronic messages |
US6947930B2 (en) * | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
GB0306877D0 (en) * | 2003-03-25 | 2003-04-30 | British Telecomm | Information retrieval |
KR100515641B1 (ko) * | 2003-04-24 | 2005-09-22 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
US8495002B2 (en) | 2003-05-06 | 2013-07-23 | International Business Machines Corporation | Software tool for training and testing a knowledge base |
US20050187913A1 (en) | 2003-05-06 | 2005-08-25 | Yoram Nelken | Web-based customer service interface |
US7146361B2 (en) * | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US7403939B1 (en) | 2003-05-30 | 2008-07-22 | Aol Llc | Resolving queries based on automatic determination of requestor geographic location |
US20040249796A1 (en) * | 2003-06-06 | 2004-12-09 | Microsoft Corporation | Query classification |
US7854009B2 (en) | 2003-06-12 | 2010-12-14 | International Business Machines Corporation | Method of securing access to IP LANs |
US8666983B2 (en) * | 2003-06-13 | 2014-03-04 | Microsoft Corporation | Architecture for generating responses to search engine queries |
US7051014B2 (en) * | 2003-06-18 | 2006-05-23 | Microsoft Corporation | Utilizing information redundancy to improve text searches |
US7324648B1 (en) | 2003-07-08 | 2008-01-29 | Copyright Clearance Center, Inc. | Method and apparatus for secure key delivery for decrypting bulk digital content files at an unsecure site |
US8006307B1 (en) * | 2003-07-09 | 2011-08-23 | Imophaze Research Co., L.L.C. | Method and apparatus for distributing secure digital content that can be indexed by third party search engines |
US7296027B2 (en) | 2003-08-06 | 2007-11-13 | Sbc Knowledge Ventures, L.P. | Rhetorical content management with tone and audience profiles |
US8600963B2 (en) * | 2003-08-14 | 2013-12-03 | Google Inc. | System and method for presenting multiple sets of search results for a single query |
US8548995B1 (en) * | 2003-09-10 | 2013-10-01 | Google Inc. | Ranking of documents based on analysis of related documents |
US20050065774A1 (en) * | 2003-09-20 | 2005-03-24 | International Business Machines Corporation | Method of self enhancement of search results through analysis of system logs |
US8014997B2 (en) * | 2003-09-20 | 2011-09-06 | International Business Machines Corporation | Method of search content enhancement |
US7610190B2 (en) * | 2003-10-15 | 2009-10-27 | Fuji Xerox Co., Ltd. | Systems and methods for hybrid text summarization |
US20050108316A1 (en) * | 2003-11-18 | 2005-05-19 | Sbc Knowledge Ventures, L.P. | Methods and systems for organizing related communications |
US20050131892A1 (en) * | 2003-12-10 | 2005-06-16 | Sbc Knowledge Ventures, L.P. | Natural language web site interface |
US7689536B1 (en) | 2003-12-18 | 2010-03-30 | Google Inc. | Methods and systems for detecting and extracting information |
US7287012B2 (en) * | 2004-01-09 | 2007-10-23 | Microsoft Corporation | Machine-learned approach to determining document relevance for search over large electronic collections of documents |
FR2865055A1 (fr) * | 2004-01-12 | 2005-07-15 | Thomson Licensing Sa | Base de connaissance ontologique et procede d'extraction d'informations a partir d'une requete en langage naturel. |
US8296304B2 (en) * | 2004-01-26 | 2012-10-23 | International Business Machines Corporation | Method, system, and program for handling redirects in a search engine |
US7424467B2 (en) * | 2004-01-26 | 2008-09-09 | International Business Machines Corporation | Architecture for an indexer with fixed width sort and variable width sort |
US7293005B2 (en) * | 2004-01-26 | 2007-11-06 | International Business Machines Corporation | Pipelined architecture for global analysis and index building |
US7499913B2 (en) * | 2004-01-26 | 2009-03-03 | International Business Machines Corporation | Method for handling anchor text |
US7430504B2 (en) * | 2004-03-02 | 2008-09-30 | Microsoft Corporation | Method and system for ranking words and concepts in a text using graph-based ranking |
US7415106B2 (en) * | 2004-03-09 | 2008-08-19 | Sbc Knowledge Ventures, Lp | Network-based voice activated auto-attendant service with B2B connectors |
GB0407389D0 (en) * | 2004-03-31 | 2004-05-05 | British Telecomm | Information retrieval |
US8612208B2 (en) * | 2004-04-07 | 2013-12-17 | Oracle Otc Subsidiary Llc | Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query |
US8082264B2 (en) | 2004-04-07 | 2011-12-20 | Inquira, Inc. | Automated scheme for identifying user intent in real-time |
US7747601B2 (en) * | 2006-08-14 | 2010-06-29 | Inquira, Inc. | Method and apparatus for identifying and classifying query intent |
US20050262063A1 (en) * | 2004-04-26 | 2005-11-24 | Watchfire Corporation | Method and system for website analysis |
US20050241727A1 (en) * | 2004-04-29 | 2005-11-03 | Kosmyna Michael J | Vented Funnel |
US8028038B2 (en) | 2004-05-05 | 2011-09-27 | Dryden Enterprises, Llc | Obtaining a playlist based on user profile matching |
US8028323B2 (en) | 2004-05-05 | 2011-09-27 | Dryden Enterprises, Llc | Method and system for employing a first device to direct a networked audio device to obtain a media item |
US7257577B2 (en) * | 2004-05-07 | 2007-08-14 | International Business Machines Corporation | System, method and service for ranking search results using a modular scoring system |
US20060053000A1 (en) * | 2004-05-11 | 2006-03-09 | Moldovan Dan I | Natural language question answering system and method utilizing multi-modal logic |
US20050256700A1 (en) * | 2004-05-11 | 2005-11-17 | Moldovan Dan I | Natural language question answering system and method utilizing a logic prover |
US7752196B2 (en) * | 2004-05-13 | 2010-07-06 | Robert John Rogers | Information retrieving and storing system and method |
US8996546B2 (en) * | 2004-05-28 | 2015-03-31 | Travis L. Headd | Internet based resource retrieval system |
US20050267872A1 (en) * | 2004-06-01 | 2005-12-01 | Yaron Galai | System and method for automated mapping of items to documents |
US7562069B1 (en) | 2004-07-01 | 2009-07-14 | Aol Llc | Query disambiguation |
US7860314B2 (en) * | 2004-07-21 | 2010-12-28 | Microsoft Corporation | Adaptation of exponential models |
US20060020448A1 (en) * | 2004-07-21 | 2006-01-26 | Microsoft Corporation | Method and apparatus for capitalizing text using maximum entropy |
US20060023920A1 (en) * | 2004-07-29 | 2006-02-02 | Gary Buslik | Method and apparatus for matching individuals based on their mental connection |
US7552116B2 (en) * | 2004-08-06 | 2009-06-23 | The Board Of Trustees Of The University Of Illinois | Method and system for extracting web query interfaces |
US20060048136A1 (en) * | 2004-08-25 | 2006-03-02 | Vries Jeff D | Interception-based resource detection system |
US20060047690A1 (en) * | 2004-08-31 | 2006-03-02 | Microsoft Corporation | Integration of Flex and Yacc into a linguistic services platform for named entity recognition |
US20060047691A1 (en) * | 2004-08-31 | 2006-03-02 | Microsoft Corporation | Creating a document index from a flex- and Yacc-generated named entity recognizer |
US20060053156A1 (en) * | 2004-09-03 | 2006-03-09 | Howard Kaushansky | Systems and methods for developing intelligence from information existing on a network |
US7461064B2 (en) | 2004-09-24 | 2008-12-02 | International Buiness Machines Corporation | Method for searching documents for ranges of numeric values |
US7606793B2 (en) | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US20060074980A1 (en) * | 2004-09-29 | 2006-04-06 | Sarkar Pte. Ltd. | System for semantically disambiguating text information |
US8051096B1 (en) | 2004-09-30 | 2011-11-01 | Google Inc. | Methods and systems for augmenting a token lexicon |
US7996208B2 (en) * | 2004-09-30 | 2011-08-09 | Google Inc. | Methods and systems for selecting a language for text segmentation |
US8799107B1 (en) * | 2004-09-30 | 2014-08-05 | Google Inc. | Systems and methods for scoring documents |
US7680648B2 (en) * | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation |
US7240162B2 (en) | 2004-10-22 | 2007-07-03 | Stream Theory, Inc. | System and method for predictive streaming |
EP1825390A2 (en) | 2004-11-13 | 2007-08-29 | Stream Theory, Inc. | Hybrid local/remote streaming |
US7783633B2 (en) * | 2004-11-19 | 2010-08-24 | International Business Machines Corporation | Display of results of cross language search |
ATE396748T1 (de) | 2004-11-26 | 2008-06-15 | Bae Ro Gmbh & Co Kg | Entkeimungsleuchte |
US7921091B2 (en) * | 2004-12-16 | 2011-04-05 | At&T Intellectual Property Ii, L.P. | System and method for providing a natural language interface to a database |
US7818314B2 (en) * | 2004-12-29 | 2010-10-19 | Aol Inc. | Search fusion |
US7349896B2 (en) * | 2004-12-29 | 2008-03-25 | Aol Llc | Query routing |
US7571157B2 (en) * | 2004-12-29 | 2009-08-04 | Aol Llc | Filtering search results |
US7272597B2 (en) | 2004-12-29 | 2007-09-18 | Aol Llc | Domain expert search |
US8843536B1 (en) | 2004-12-31 | 2014-09-23 | Google Inc. | Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries |
US20060161537A1 (en) * | 2005-01-19 | 2006-07-20 | International Business Machines Corporation | Detecting content-rich text |
US7840564B2 (en) | 2005-02-16 | 2010-11-23 | Ebrary | System and method for automatic anthology creation using document aspects |
US7792811B2 (en) * | 2005-02-16 | 2010-09-07 | Transaxtions Llc | Intelligent search with guiding info |
JP4185500B2 (ja) * | 2005-03-14 | 2008-11-26 | 株式会社東芝 | 文書検索システム、文書検索方法及びプログラム |
US8024523B2 (en) | 2007-11-07 | 2011-09-20 | Endeavors Technologies, Inc. | Opportunistic block transmission with time constraints |
WO2006102621A2 (en) | 2005-03-23 | 2006-09-28 | Stream Theory, Inc. | System and method for tracking changes to files in streaming applications |
US8719244B1 (en) * | 2005-03-23 | 2014-05-06 | Google Inc. | Methods and systems for retrieval of information items and associated sentence fragments |
US20060218165A1 (en) * | 2005-03-23 | 2006-09-28 | Vries Jeffrey De | Explicit overlay integration rules |
US20060224566A1 (en) * | 2005-03-31 | 2006-10-05 | Flowers John S | Natural language based search engine and methods of use therefor |
US7555475B2 (en) * | 2005-03-31 | 2009-06-30 | Jiles, Inc. | Natural language based search engine for handling pronouns and methods of use therefor |
US20060224569A1 (en) * | 2005-03-31 | 2006-10-05 | Desanto John A | Natural language based search engine and methods of use therefor |
US7447683B2 (en) * | 2005-03-31 | 2008-11-04 | Jiles, Inc. | Natural language based search engine and methods of use therefor |
US8280882B2 (en) * | 2005-04-21 | 2012-10-02 | Case Western Reserve University | Automatic expert identification, ranking and literature search based on authorship in large document collections |
US20060259494A1 (en) * | 2005-05-13 | 2006-11-16 | Microsoft Corporation | System and method for simultaneous search service and email search |
US7552398B2 (en) * | 2005-05-24 | 2009-06-23 | Palo Alto Research Center Incorporated | Systems and methods for semantically zooming information |
US7502810B2 (en) * | 2005-05-24 | 2009-03-10 | International Business Machines Corporation | Tagging of facet elements in a facet tree |
US7562085B2 (en) * | 2005-05-24 | 2009-07-14 | Palo Alto Research Center Incorporated | Systems and methods for displaying linked information in a sorted context |
US7774383B2 (en) * | 2005-05-24 | 2010-08-10 | International Business Machines Corporation | Displaying facet tree elements and logging facet element item counts to a sequence document |
JP4654780B2 (ja) * | 2005-06-10 | 2011-03-23 | 富士ゼロックス株式会社 | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
US7702665B2 (en) * | 2005-06-14 | 2010-04-20 | Colloquis, Inc. | Methods and apparatus for evaluating semantic proximity |
US7809551B2 (en) * | 2005-07-01 | 2010-10-05 | Xerox Corporation | Concept matching system |
US7433869B2 (en) | 2005-07-01 | 2008-10-07 | Ebrary, Inc. | Method and apparatus for document clustering and document sketching |
US7487150B2 (en) * | 2005-07-02 | 2009-02-03 | International Business Machines Corporation | Method for matching pattern-based data |
US8417693B2 (en) * | 2005-07-14 | 2013-04-09 | International Business Machines Corporation | Enforcing native access control to indexed documents |
CN101223521B (zh) * | 2005-07-15 | 2010-06-16 | 惠普开发有限公司 | 社群特有表现检测装置及方法 |
US8756245B2 (en) * | 2005-07-25 | 2014-06-17 | Iac Search & Media, Inc. | Systems and methods for answering user questions |
US7657524B1 (en) * | 2005-07-28 | 2010-02-02 | Adobe Systems Incorporated | System and/or method for comment migration |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
EP1934971A4 (en) | 2005-08-31 | 2010-10-27 | Voicebox Technologies Inc | DYNAMIC LANGUAGE SCRIPTURE |
US20070055653A1 (en) * | 2005-09-02 | 2007-03-08 | Guerra Currie Anne-Marie P | System and method of generating automated document analysis tools |
JPWO2007029348A1 (ja) * | 2005-09-06 | 2009-03-12 | コミュニティーエンジン株式会社 | データ抽出システム、端末装置、端末装置のプログラム、サーバ装置、及び、サーバ装置のプログラム |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070073533A1 (en) * | 2005-09-23 | 2007-03-29 | Fuji Xerox Co., Ltd. | Systems and methods for structural indexing of natural language text |
US8688673B2 (en) * | 2005-09-27 | 2014-04-01 | Sarkar Pte Ltd | System for communication and collaboration |
US7328199B2 (en) * | 2005-10-07 | 2008-02-05 | Microsoft Corporation | Componentized slot-filling architecture |
EP1952280B8 (en) * | 2005-10-11 | 2016-11-30 | Ureveal, Inc. | System, method&computer program product for concept based searching&analysis |
US7672831B2 (en) * | 2005-10-24 | 2010-03-02 | Invention Machine Corporation | System and method for cross-language knowledge searching |
US20070106496A1 (en) * | 2005-11-09 | 2007-05-10 | Microsoft Corporation | Adaptive task framework |
US7822699B2 (en) * | 2005-11-30 | 2010-10-26 | Microsoft Corporation | Adaptive semantic reasoning engine |
US7606700B2 (en) * | 2005-11-09 | 2009-10-20 | Microsoft Corporation | Adaptive task framework |
US7805455B2 (en) * | 2005-11-14 | 2010-09-28 | Invention Machine Corporation | System and method for problem analysis |
CA2669236C (en) | 2005-11-16 | 2016-05-24 | Evri Inc. | Extending keyword searching to syntactically and semantically annotated data |
US7933914B2 (en) | 2005-12-05 | 2011-04-26 | Microsoft Corporation | Automatic task creation and execution using browser helper objects |
US7831585B2 (en) * | 2005-12-05 | 2010-11-09 | Microsoft Corporation | Employment of task framework for advertising |
US20070130134A1 (en) * | 2005-12-05 | 2007-06-07 | Microsoft Corporation | Natural-language enabling arbitrary web forms |
US7676485B2 (en) * | 2006-01-20 | 2010-03-09 | Ixreveal, Inc. | Method and computer program product for converting ontologies into concept semantic networks |
CN1858737B (zh) * | 2006-01-25 | 2010-06-02 | 华为技术有限公司 | 一种数据搜索的方法和系统 |
US8060357B2 (en) * | 2006-01-27 | 2011-11-15 | Xerox Corporation | Linguistic user interface |
US7657518B2 (en) * | 2006-01-31 | 2010-02-02 | Northwestern University | Chaining context-sensitive search results |
US20070203865A1 (en) * | 2006-02-09 | 2007-08-30 | Hirsch Martin C | Apparatus and methods for an item retrieval system |
US7797303B2 (en) | 2006-02-15 | 2010-09-14 | Xerox Corporation | Natural language processing for developing queries |
US20070198250A1 (en) * | 2006-02-21 | 2007-08-23 | Michael Mardini | Information retrieval and reporting method system |
US20070203869A1 (en) * | 2006-02-28 | 2007-08-30 | Microsoft Corporation | Adaptive semantic platform architecture |
US7996783B2 (en) * | 2006-03-02 | 2011-08-09 | Microsoft Corporation | Widget searching utilizing task framework |
WO2007108788A2 (en) * | 2006-03-13 | 2007-09-27 | Answers Corporation | Method and system for answer extraction |
US7921099B2 (en) * | 2006-05-10 | 2011-04-05 | Inquira, Inc. | Guided navigation system |
US20070265824A1 (en) * | 2006-05-15 | 2007-11-15 | Michel David Paradis | Diversified semantic mapping engine (DSME) |
US7814112B2 (en) * | 2006-06-09 | 2010-10-12 | Ebay Inc. | Determining relevancy and desirability of terms |
US10796390B2 (en) * | 2006-07-03 | 2020-10-06 | 3M Innovative Properties Company | System and method for medical coding of vascular interventional radiology procedures |
US7698328B2 (en) * | 2006-08-11 | 2010-04-13 | Apple Inc. | User-directed search refinement |
US8781813B2 (en) | 2006-08-14 | 2014-07-15 | Oracle Otc Subsidiary Llc | Intent management tool for identifying concepts associated with a plurality of users' queries |
WO2008024800A2 (en) * | 2006-08-21 | 2008-02-28 | Western Slope Utilities, Inc. | Systems and methods for swab transport in pipeline rehabilitation |
US8589869B2 (en) * | 2006-09-07 | 2013-11-19 | Wolfram Alpha Llc | Methods and systems for determining a formula |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
FR2906049A1 (fr) * | 2006-09-19 | 2008-03-21 | Alcatel Sa | Procede, mis en oeuvre par ordinateur, de developpement d'une ontologie a partir d'un texte en langage naturel |
CN100416570C (zh) * | 2006-09-22 | 2008-09-03 | 浙江大学 | 一种基于问答库的中文自然语言问答方法 |
JP4274221B2 (ja) * | 2006-10-02 | 2009-06-03 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
US7774198B2 (en) * | 2006-10-06 | 2010-08-10 | Xerox Corporation | Navigation system for text |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US9645993B2 (en) * | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US8397157B2 (en) * | 2006-10-20 | 2013-03-12 | Adobe Systems Incorporated | Context-free grammar |
US8261345B2 (en) | 2006-10-23 | 2012-09-04 | Endeavors Technologies, Inc. | Rule-based application access management |
US8095476B2 (en) * | 2006-11-27 | 2012-01-10 | Inquira, Inc. | Automated support scheme for electronic forms |
US20080177588A1 (en) * | 2007-01-23 | 2008-07-24 | Quigo Technologies, Inc. | Systems and methods for selecting aesthetic settings for use in displaying advertisements over a network |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US9449322B2 (en) * | 2007-02-28 | 2016-09-20 | Ebay Inc. | Method and system of suggesting information used with items offered for sale in a network-based marketplace |
US20080215607A1 (en) * | 2007-03-02 | 2008-09-04 | Umbria, Inc. | Tribe or group-based analysis of social media including generating intelligence from a tribe's weblogs or blogs |
US8392454B2 (en) * | 2007-03-08 | 2013-03-05 | Xerox Corporation | Concordance searching systems and methods |
CA2717462C (en) * | 2007-03-14 | 2016-09-27 | Evri Inc. | Query templates and labeled search tip system, methods, and techniques |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8001138B2 (en) * | 2007-04-11 | 2011-08-16 | Microsoft Corporation | Word relationship driven search |
US8631440B2 (en) | 2007-04-30 | 2014-01-14 | Google Inc. | Program guide user interface |
US8484192B1 (en) * | 2007-04-30 | 2013-07-09 | Google Inc. | Media search broadening |
US20080270119A1 (en) * | 2007-04-30 | 2008-10-30 | Microsoft Corporation | Generating sentence variations for automatic summarization |
US7890318B2 (en) | 2007-05-23 | 2011-02-15 | Xerox Corporation | Informing troubleshooting sessions with device data |
US8051040B2 (en) | 2007-06-08 | 2011-11-01 | Ebay Inc. | Electronic publication system |
ES2383462T3 (es) * | 2007-06-25 | 2012-06-21 | Siemens Aktiengesellschaft | Procedimiento para retransmitir datos en una red de datos descentralizada |
US20090006179A1 (en) * | 2007-06-26 | 2009-01-01 | Ebay Inc. | Economic optimization for product search relevancy |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
US20090055242A1 (en) * | 2007-08-24 | 2009-02-26 | Gaurav Rewari | Content identification and classification apparatus, systems, and methods |
US8712758B2 (en) * | 2007-08-31 | 2014-04-29 | Microsoft Corporation | Coreference resolution in an ambiguity-sensitive natural language processing system |
US20090070322A1 (en) * | 2007-08-31 | 2009-03-12 | Powerset, Inc. | Browsing knowledge on the basis of semantic relations |
US8041697B2 (en) * | 2007-08-31 | 2011-10-18 | Microsoft Corporation | Semi-automatic example-based induction of semantic translation rules to support natural language search |
US7984032B2 (en) * | 2007-08-31 | 2011-07-19 | Microsoft Corporation | Iterators for applying term occurrence-level constraints in natural language searching |
US8316036B2 (en) | 2007-08-31 | 2012-11-20 | Microsoft Corporation | Checkpointing iterators during search |
US8868562B2 (en) * | 2007-08-31 | 2014-10-21 | Microsoft Corporation | Identification of semantic relationships within reported speech |
US8229970B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Efficient storage and retrieval of posting lists |
US8346756B2 (en) * | 2007-08-31 | 2013-01-01 | Microsoft Corporation | Calculating valence of expressions within documents for searching a document index |
US8229730B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Indexing role hierarchies for words in a search index |
US8463593B2 (en) | 2007-08-31 | 2013-06-11 | Microsoft Corporation | Natural language hypernym weighting for word sense disambiguation |
US8280721B2 (en) * | 2007-08-31 | 2012-10-02 | Microsoft Corporation | Efficiently representing word sense probabilities |
US8639708B2 (en) * | 2007-08-31 | 2014-01-28 | Microsoft Corporation | Fact-based indexing for natural language search |
US20090077180A1 (en) * | 2007-09-14 | 2009-03-19 | Flowers John S | Novel systems and methods for transmitting syntactically accurate messages over a network |
US7716228B2 (en) * | 2007-09-25 | 2010-05-11 | Firstrain, Inc. | Content quality apparatus, systems, and methods |
JP2009080576A (ja) * | 2007-09-25 | 2009-04-16 | Toshiba Corp | 検索装置、方法及びプログラム |
US8024177B2 (en) * | 2007-09-28 | 2011-09-20 | Cycorp, Inc. | Method of transforming natural language expression into formal language representation |
US8301633B2 (en) * | 2007-10-01 | 2012-10-30 | Palo Alto Research Center Incorporated | System and method for semantic search |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US7877344B2 (en) * | 2007-10-10 | 2011-01-25 | Northern Light Group, Llc | Method and apparatus for extracting meaning from documents using a meaning taxonomy comprising syntactic structures |
CA2702937C (en) * | 2007-10-17 | 2014-10-07 | Neil S. Roseman | Nlp-based content recommender |
US8594996B2 (en) | 2007-10-17 | 2013-11-26 | Evri Inc. | NLP-based entity recognition and disambiguation |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US9754022B2 (en) | 2007-10-30 | 2017-09-05 | At&T Intellectual Property I, L.P. | System and method for language sensitive contextual searching |
US20090119584A1 (en) * | 2007-11-02 | 2009-05-07 | Steve Herbst | Software Tool for Creating Outlines and Mind Maps that Generates Subtopics Automatically |
US8892738B2 (en) | 2007-11-07 | 2014-11-18 | Numecent Holdings, Inc. | Deriving component statistics for a stream enabled application |
DE102007056140A1 (de) | 2007-11-19 | 2009-05-20 | Deutsche Telekom Ag | Verfahren und System zur Informationssuche |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996994B2 (en) * | 2008-01-16 | 2015-03-31 | Microsoft Technology Licensing, Llc | Multi-lingual word hyphenation using inductive machine learning on training data |
US20090198488A1 (en) * | 2008-02-05 | 2009-08-06 | Eric Arno Vigen | System and method for analyzing communications using multi-placement hierarchical structures |
US8412571B2 (en) * | 2008-02-11 | 2013-04-02 | Advertising.Com Llc | Systems and methods for selling and displaying advertisements over a network |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US20090228427A1 (en) * | 2008-03-06 | 2009-09-10 | Microsoft Corporation | Managing document work sets |
US20090234803A1 (en) * | 2008-03-11 | 2009-09-17 | Continental Electrical Construction Company, Llc | Keyword search of business information system |
EP2105847A1 (en) * | 2008-03-27 | 2009-09-30 | Alcatel Lucent | Device and method for automatically generating ontologies from term definitions contained into a dictionary |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8726146B2 (en) | 2008-04-11 | 2014-05-13 | Advertising.Com Llc | Systems and methods for video content association |
US8061142B2 (en) * | 2008-04-11 | 2011-11-22 | General Electric Company | Mixer for a combustor |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
KR101475339B1 (ko) | 2008-04-14 | 2014-12-23 | 삼성전자주식회사 | 통신 단말기 및 그의 통합 자연어 인터페이스 방법 |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
JP5316158B2 (ja) * | 2008-05-28 | 2013-10-16 | 株式会社リコー | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 |
US8473279B2 (en) * | 2008-05-30 | 2013-06-25 | Eiman Al-Shammari | Lemmatizing, stemming, and query expansion method and system |
US8074171B2 (en) * | 2008-06-06 | 2011-12-06 | International Business Machines Corporation | System and method to provide warnings associated with natural language searches to determine intended actions and accidental omissions |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US9323832B2 (en) * | 2008-06-18 | 2016-04-26 | Ebay Inc. | Determining desirability value using sale format of item listing |
US8135712B1 (en) * | 2008-06-27 | 2012-03-13 | Google Inc. | Posting questions from search queries |
US20100017392A1 (en) * | 2008-07-18 | 2010-01-21 | Jianwei Dian | Intent match search engine |
US9047285B1 (en) | 2008-07-21 | 2015-06-02 | NetBase Solutions, Inc. | Method and apparatus for frame-based search |
JP5423676B2 (ja) * | 2008-07-30 | 2014-02-19 | 日本電気株式会社 | データ分類システム、データ分類方法、及びデータ分類プログラム |
JP5500070B2 (ja) * | 2008-07-30 | 2014-05-21 | 日本電気株式会社 | データ分類システム、データ分類方法、及びデータ分類プログラム |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US8185509B2 (en) * | 2008-10-15 | 2012-05-22 | Sap France | Association of semantic objects with linguistic entity categories |
US20100138402A1 (en) * | 2008-12-02 | 2010-06-03 | Chacha Search, Inc. | Method and system for improving utilization of human searchers |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US9519712B2 (en) * | 2009-01-06 | 2016-12-13 | At&T Intellectual Property I, L.P. | Systems and methods to evaluate search qualities |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US8666730B2 (en) * | 2009-03-13 | 2014-03-04 | Invention Machine Corporation | Question-answering system and method based on semantic labeling of text documents and user questions |
US8843476B1 (en) * | 2009-03-16 | 2014-09-23 | Guangsheng Zhang | System and methods for automated document topic discovery, browsable search and document categorization |
US9245243B2 (en) | 2009-04-14 | 2016-01-26 | Ureveal, Inc. | Concept-based analysis of structured and unstructured data using concept inheritance |
WO2010120699A2 (en) * | 2009-04-16 | 2010-10-21 | Evri Inc. | Enhanced advertisement targeting |
CN101872349B (zh) * | 2009-04-23 | 2013-06-19 | 国际商业机器公司 | 处理自然语言问题的方法和装置 |
US8788524B1 (en) | 2009-05-15 | 2014-07-22 | Wolfram Alpha Llc | Method and system for responding to queries in an imprecise syntax |
US8601015B1 (en) | 2009-05-15 | 2013-12-03 | Wolfram Alpha Llc | Dynamic example generation for queries |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US20130219333A1 (en) * | 2009-06-12 | 2013-08-22 | Adobe Systems Incorporated | Extensible Framework for Facilitating Interaction with Devices |
CN101930438B (zh) | 2009-06-19 | 2016-08-31 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
WO2010150910A1 (ja) * | 2009-06-26 | 2010-12-29 | 楽天株式会社 | 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体 |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
JP2011033680A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 音声処理装置及び方法、並びにプログラム |
US20110055268A1 (en) * | 2009-08-27 | 2011-03-03 | Chen-Yu Sheu | Search system based on structured natural languages |
US20110099052A1 (en) * | 2009-10-28 | 2011-04-28 | Xerox Corporation | Automatic checking of expectation-fulfillment schemes |
WO2011053758A1 (en) * | 2009-10-29 | 2011-05-05 | Chacha Search, Inc. | Method and system of processing a query using human assistants |
US8645372B2 (en) * | 2009-10-30 | 2014-02-04 | Evri, Inc. | Keyword-based search engine results using enhanced query strategies |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US20110123967A1 (en) * | 2009-11-24 | 2011-05-26 | Xerox Corporation | Dialog system for comprehension evaluation |
CN102083043B (zh) * | 2009-11-27 | 2013-07-24 | 中国移动通信集团山东有限公司 | 确定向用户提供的资费优惠方案的方法及相关装置 |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US9201905B1 (en) * | 2010-01-14 | 2015-12-01 | The Boeing Company | Semantically mediated access to knowledge |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9710556B2 (en) * | 2010-03-01 | 2017-07-18 | Vcvc Iii Llc | Content recommendation based on collections of entities |
US8339094B2 (en) * | 2010-03-11 | 2012-12-25 | GM Global Technology Operations LLC | Methods, systems and apparatus for overmodulation of a five-phase machine |
US10643227B1 (en) | 2010-03-23 | 2020-05-05 | Aurea Software, Inc. | Business lines |
US10546311B1 (en) | 2010-03-23 | 2020-01-28 | Aurea Software, Inc. | Identifying competitors of companies |
US11367295B1 (en) | 2010-03-23 | 2022-06-21 | Aurea Software, Inc. | Graphical user interface for presentation of events |
US8805840B1 (en) * | 2010-03-23 | 2014-08-12 | Firstrain, Inc. | Classification of documents |
US8645125B2 (en) | 2010-03-30 | 2014-02-04 | Evri, Inc. | NLP-based systems and methods for providing quotations |
JP2011227758A (ja) * | 2010-04-21 | 2011-11-10 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
US8161073B2 (en) | 2010-05-05 | 2012-04-17 | Holovisions, LLC | Context-driven search |
US8484015B1 (en) * | 2010-05-14 | 2013-07-09 | Wolfram Alpha Llc | Entity pages |
US8484016B2 (en) | 2010-05-28 | 2013-07-09 | Microsoft Corporation | Locating paraphrases through utilization of a multipartite graph |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8812298B1 (en) | 2010-07-28 | 2014-08-19 | Wolfram Alpha Llc | Macro replacement of natural language input |
US8838633B2 (en) | 2010-08-11 | 2014-09-16 | Vcvc Iii Llc | NLP-based sentiment analysis |
US9538493B2 (en) | 2010-08-23 | 2017-01-03 | Finetrak, Llc | Locating a mobile station and applications therefor |
US8527513B2 (en) | 2010-08-26 | 2013-09-03 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for lexicon generation |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US9405848B2 (en) | 2010-09-15 | 2016-08-02 | Vcvc Iii Llc | Recommending mobile device activities |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US8725739B2 (en) | 2010-11-01 | 2014-05-13 | Evri, Inc. | Category-based content recommendation |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
JP5242722B2 (ja) * | 2011-03-01 | 2013-07-24 | 株式会社東芝 | 代表文抽出装置およびプログラム |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9116995B2 (en) | 2011-03-30 | 2015-08-25 | Vcvc Iii Llc | Cluster-based identification of news stories |
JP5699789B2 (ja) | 2011-05-10 | 2015-04-15 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US9069814B2 (en) | 2011-07-27 | 2015-06-30 | Wolfram Alpha Llc | Method and system for using natural language to generate widgets |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US9734252B2 (en) | 2011-09-08 | 2017-08-15 | Wolfram Alpha Llc | Method and system for analyzing data using a query answering system |
US20130066862A1 (en) * | 2011-09-12 | 2013-03-14 | Microsoft Corporation | Multi-factor correlation of internet content resources |
US8914279B1 (en) * | 2011-09-23 | 2014-12-16 | Google Inc. | Efficient parsing with structured prediction cascades |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US8782042B1 (en) | 2011-10-14 | 2014-07-15 | Firstrain, Inc. | Method and system for identifying entities |
TWM423854U (en) * | 2011-10-20 | 2012-03-01 | Ipxnase Technology Ltd | Document analyzing apparatus |
US9851950B2 (en) | 2011-11-15 | 2017-12-26 | Wolfram Alpha Llc | Programming in a precise syntax using natural language |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10019994B2 (en) | 2012-06-08 | 2018-07-10 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9292505B1 (en) | 2012-06-12 | 2016-03-22 | Firstrain, Inc. | Graphical user interface for recurring searches |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US20140046976A1 (en) * | 2012-08-11 | 2014-02-13 | Guangsheng Zhang | Systems, methods, and user interface for effectively presenting information |
US10817787B1 (en) | 2012-08-11 | 2020-10-27 | Guangsheng Zhang | Methods for building an intelligent computing device based on linguistic analysis |
US9405424B2 (en) | 2012-08-29 | 2016-08-02 | Wolfram Alpha, Llc | Method and system for distributing and displaying graphical items |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
WO2014040263A1 (en) * | 2012-09-14 | 2014-03-20 | Microsoft Corporation | Semantic ranking using a forward index |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
US9710545B2 (en) * | 2012-12-20 | 2017-07-18 | Intel Corporation | Method and apparatus for conducting context sensitive search with intelligent user interaction from within a media experience |
US10592480B1 (en) | 2012-12-30 | 2020-03-17 | Aurea Software, Inc. | Affinity scoring |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
CN112230878B (zh) | 2013-03-15 | 2024-09-27 | 苹果公司 | 对中断进行上下文相关处理 |
US9201865B2 (en) * | 2013-03-15 | 2015-12-01 | Bao Tran | Automated assistance for user request that determines semantics by domain, task, and parameter |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
CN105190607B (zh) | 2013-03-15 | 2018-11-30 | 苹果公司 | 通过智能数字助理的用户培训 |
US9870422B2 (en) | 2013-04-19 | 2018-01-16 | Dropbox, Inc. | Natural language search |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
GB2517477A (en) * | 2013-08-22 | 2015-02-25 | Deep Secure Ltd | A method of transmitting data structures from one computer to another computer |
JP6176017B2 (ja) * | 2013-09-17 | 2017-08-09 | 富士通株式会社 | 検索装置、検索方法、およびプログラム |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
CN103677852A (zh) * | 2013-12-30 | 2014-03-26 | 山东舜德数据管理软件工程有限公司 | 一种可扩充的类自然语言公式编辑器的设计方法 |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
IN2014MU00789A (ja) | 2014-03-07 | 2015-09-25 | Tata Consultancy Services Ltd | |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
CN104021075A (zh) * | 2014-05-22 | 2014-09-03 | 小米科技有限责任公司 | 用于程序代码的评估方法和装置 |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
CN104123394B (zh) * | 2014-08-13 | 2018-05-15 | 中国银行股份有限公司 | 用于数据库的报表文件的加工方法 |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9575961B2 (en) | 2014-08-28 | 2017-02-21 | Northern Light Group, Llc | Systems and methods for analyzing document coverage |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
JP6173990B2 (ja) | 2014-09-16 | 2017-08-02 | 株式会社東芝 | 検索支援装置、方法およびプログラム |
US9626703B2 (en) | 2014-09-16 | 2017-04-18 | Voicebox Technologies Corporation | Voice commerce |
US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
US9836529B2 (en) * | 2014-09-22 | 2017-12-05 | Oracle International Corporation | Semantic text search |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9747896B2 (en) | 2014-10-15 | 2017-08-29 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US9613093B2 (en) | 2014-10-16 | 2017-04-04 | International Business Machines Corporation | Using question answering (QA) systems to identify answers and evidence of different medium types |
US10229156B2 (en) | 2014-11-03 | 2019-03-12 | International Business Machines Corporation | Using priority scores for iterative precision reduction in structured lookups for questions |
US10095736B2 (en) * | 2014-11-03 | 2018-10-09 | International Business Machines Corporation | Using synthetic events to identify complex relation lookups |
US11100557B2 (en) | 2014-11-04 | 2021-08-24 | International Business Machines Corporation | Travel itinerary recommendation engine using inferred interests and sentiments |
KR102033395B1 (ko) * | 2014-11-20 | 2019-10-18 | 한국전자통신연구원 | 심층 자연어 질문 분석 기반 구조화된 지식베이스 질의응답 시스템 및 그 방법 |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
CN105718434A (zh) * | 2014-12-23 | 2016-06-29 | 远光软件股份有限公司 | 一种自然语言公式编辑方法和系统 |
WO2016127338A1 (en) * | 2015-02-11 | 2016-08-18 | Yahoo! Inc. | Method and system for online user profiling |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11886477B2 (en) | 2015-09-22 | 2024-01-30 | Northern Light Group, Llc | System and method for quote-based search summaries |
US11544306B2 (en) | 2015-09-22 | 2023-01-03 | Northern Light Group, Llc | System and method for concept-based search summaries |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US20170116194A1 (en) | 2015-10-23 | 2017-04-27 | International Business Machines Corporation | Ingestion planning for complex tables |
EP3369002A4 (en) * | 2015-10-26 | 2019-06-12 | 24/7 Customer, Inc. | METHOD AND DEVICE FOR FACILITATING THE PREDICTION OF CUSTOMER VISIONS |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10936675B2 (en) | 2015-12-17 | 2021-03-02 | Walmart Apollo, Llc | Developing an item data model for an item |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10459883B1 (en) | 2015-12-30 | 2019-10-29 | EMC IP Holding Company LLC | Retention policies for unscheduled replicas in backup, snapshots, and remote replication |
US10496672B2 (en) * | 2015-12-30 | 2019-12-03 | EMC IP Holding Company LLC | Creating replicas at user-defined points in time |
JP6638480B2 (ja) * | 2016-03-09 | 2020-01-29 | 富士通株式会社 | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US11226946B2 (en) | 2016-04-13 | 2022-01-18 | Northern Light Group, Llc | Systems and methods for automatically determining a performance index |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
CN109937417A (zh) | 2016-08-09 | 2019-06-25 | 瑞普科德公司 | 用于电子记录的上下文检索的系统和方法 |
US20180052838A1 (en) * | 2016-08-22 | 2018-02-22 | International Business Machines Corporation | System, method and computer program for a cognitive media story extractor and video composer |
US9953027B2 (en) * | 2016-09-15 | 2018-04-24 | International Business Machines Corporation | System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning |
US9984063B2 (en) | 2016-09-15 | 2018-05-29 | International Business Machines Corporation | System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning |
US10754969B2 (en) | 2016-09-22 | 2020-08-25 | International Business Machines Corporation | Method to allow for question and answer system to dynamically return different responses based on roles |
US10382440B2 (en) * | 2016-09-22 | 2019-08-13 | International Business Machines Corporation | Method to allow for question and answer system to dynamically return different responses based on roles |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
WO2018096514A1 (en) * | 2016-11-28 | 2018-05-31 | Thomson Reuters Global Resources | System and method for finding similar documents based on semantic factual similarity |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10956469B2 (en) * | 2017-01-06 | 2021-03-23 | International Business Machines Corporation | System and method for metadata correlation using natural language processing |
JP6870421B2 (ja) * | 2017-03-28 | 2021-05-12 | 富士通株式会社 | 判定プログラム、判定装置および判定方法 |
US11276011B2 (en) * | 2017-04-10 | 2022-03-15 | International Business Machines Corporation | Self-managed adaptable models for prediction systems |
CN107122438A (zh) * | 2017-04-21 | 2017-09-01 | 安徽富驰信息技术有限公司 | 一种司法案件检索方法及系统 |
US10872080B2 (en) * | 2017-04-24 | 2020-12-22 | Oath Inc. | Reducing query ambiguity using graph matching |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US11176470B2 (en) | 2017-07-07 | 2021-11-16 | Accenture Global Solutions Limited | Artificial intelligence based solution generator |
US11158311B1 (en) | 2017-08-14 | 2021-10-26 | Guangsheng Zhang | System and methods for machine understanding of human intentions |
US10719507B2 (en) | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US11106872B2 (en) * | 2018-01-09 | 2021-08-31 | Jyu-Fang Yu | System and method for improving sentence diagram construction and analysis by enabling a user positioning sentence construction components and words on a diagramming interface |
US11360969B2 (en) | 2019-03-20 | 2022-06-14 | Promethium, Inc. | Natural language based processing of data stored across heterogeneous data sources |
US11176329B2 (en) | 2020-02-18 | 2021-11-16 | Bank Of America Corporation | Source code compiler using natural language input |
US11250128B2 (en) | 2020-02-18 | 2022-02-15 | Bank Of America Corporation | System and method for detecting source code anomalies |
US11914561B2 (en) | 2020-03-03 | 2024-02-27 | Rovi Guides, Inc. | Systems and methods for interpreting natural language search queries using training data |
US11594213B2 (en) | 2020-03-03 | 2023-02-28 | Rovi Guides, Inc. | Systems and methods for interpreting natural language search queries |
US11449407B2 (en) | 2020-05-28 | 2022-09-20 | Bank Of America Corporation | System and method for monitoring computing platform parameters and dynamically generating and deploying monitoring packages |
US11507572B2 (en) * | 2020-09-30 | 2022-11-22 | Rovi Guides, Inc. | Systems and methods for interpreting natural language search queries |
US20220382852A1 (en) * | 2021-06-01 | 2022-12-01 | Promethium, Inc. | Modifying data pipeline based on services executing across multiple trusted domains |
JP7333891B2 (ja) * | 2021-07-08 | 2023-08-25 | 三菱電機株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
JP2023039785A (ja) * | 2021-09-09 | 2023-03-22 | 富士通株式会社 | 出力プログラム、出力方法、および出力装置 |
US11977852B2 (en) | 2022-01-12 | 2024-05-07 | Bank Of America Corporation | Anaphoric reference resolution using natural language processing and machine learning |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8900587A (nl) | 1989-03-10 | 1990-10-01 | Bso Buro Voor Systeemontwikkel | Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst. |
JP2742115B2 (ja) * | 1989-12-01 | 1998-04-22 | 日本電信電話株式会社 | 類似文書検索装置 |
US5321833A (en) | 1990-08-29 | 1994-06-14 | Gte Laboratories Incorporated | Adaptive ranking system for information retrieval |
JPH04182871A (ja) * | 1990-11-19 | 1992-06-30 | Mitsubishi Electric Corp | 類似文書検索装置 |
US5278980A (en) * | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
JP3270783B2 (ja) * | 1992-09-29 | 2002-04-02 | ゼロックス・コーポレーション | 複数の文書検索方法 |
JP3363501B2 (ja) * | 1993-01-18 | 2003-01-08 | 三洋電機株式会社 | テキスト検索装置 |
US5576954A (en) * | 1993-11-05 | 1996-11-19 | University Of Central Florida | Process for determination of text relevancy |
CA2120447C (en) * | 1994-03-31 | 1998-08-25 | Robert Lizee | Automatically relaxable query for information retrieval |
US5724567A (en) * | 1994-04-25 | 1998-03-03 | Apple Computer, Inc. | System for directing relevance-ranked data objects to computer users |
US5706497A (en) * | 1994-08-15 | 1998-01-06 | Nec Research Institute, Inc. | Document retrieval using fuzzy-logic inference |
US5642502A (en) * | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
US5794050A (en) * | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
BR9606931A (pt) * | 1995-01-23 | 1997-11-11 | British Telecomm | Sistema de acesso de informações e processo para monitoração de inserção de informações para um armazenamento de dados |
US5724571A (en) * | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
US6006221A (en) * | 1995-08-16 | 1999-12-21 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
JP3040945B2 (ja) * | 1995-11-29 | 2000-05-15 | 松下電器産業株式会社 | 文書検索装置 |
US5995922A (en) * | 1996-05-02 | 1999-11-30 | Microsoft Corporation | Identifying information related to an input word in an electronic dictionary |
US5826261A (en) * | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
US5864846A (en) * | 1996-06-28 | 1999-01-26 | Siemens Corporate Research, Inc. | Method for facilitating world wide web searches utilizing a document distribution fusion strategy |
US5966686A (en) * | 1996-06-28 | 1999-10-12 | Microsoft Corporation | Method and system for computing semantic logical forms from syntax trees |
US5813002A (en) * | 1996-07-31 | 1998-09-22 | International Business Machines Corporation | Method and system for linearly detecting data deviations in a large database |
US5870740A (en) * | 1996-09-30 | 1999-02-09 | Apple Computer, Inc. | System and method for improving the ranking of information retrieval results for short queries |
US5987446A (en) * | 1996-11-12 | 1999-11-16 | U.S. West, Inc. | Searching large collections of text using multiple search engines concurrently |
JP2948159B2 (ja) * | 1996-12-06 | 1999-09-13 | 株式会社日立製作所 | データベース装置 |
US5809496A (en) * | 1997-02-20 | 1998-09-15 | International Business Machines Corporation | Hybrid search |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US5907840A (en) * | 1997-07-25 | 1999-05-25 | Claritech Corporation | Overlapping subdocuments in a vector space search process |
US5983216A (en) * | 1997-09-12 | 1999-11-09 | Infoseek Corporation | Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections |
US5987457A (en) * | 1997-11-25 | 1999-11-16 | Acceleration Software International Corporation | Query refinement method for searching documents |
-
1997
- 1997-07-22 US US08/898,652 patent/US5933822A/en not_active Expired - Lifetime
-
1998
- 1998-05-13 CN CNB988083957A patent/CN1165858C/zh not_active Expired - Lifetime
- 1998-05-13 JP JP2000504525A patent/JP2001511564A/ja active Pending
- 1998-05-13 WO PCT/US1998/009711 patent/WO1999005618A1/en active Application Filing
- 1998-05-13 EP EP19980922234 patent/EP0996899B8/en not_active Expired - Lifetime
- 1998-06-16 US US09/097,979 patent/US6901399B1/en not_active Expired - Lifetime
- 1998-07-17 JP JP2000504528A patent/JP4892130B2/ja not_active Expired - Lifetime
-
2009
- 2009-11-02 JP JP2009252231A patent/JP4738523B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7630879B2 (en) | 2002-09-13 | 2009-12-08 | Fuji Xerox Co., Ltd. | Text sentence comparing apparatus |
KR101004515B1 (ko) | 2002-09-19 | 2010-12-31 | 마이크로소프트 코포레이션 | 문장 데이터베이스로부터 문장들을 사용자에게 제공하는 컴퓨터 구현 방법 및 이 방법을 수행하기 위한 컴퓨터 실행가능 명령어가 저장되어 있는 유형의 컴퓨터 판독가능 기록 매체, 문장 데이터베이스로부터 확인 문장들을 검색하는 시스템이 저장되어 있는 컴퓨터 판독가능 기록 매체 |
JP4992715B2 (ja) * | 2005-08-04 | 2012-08-08 | 日本電気株式会社 | データ処理装置、データ処理方法、データ処理プログラム |
JP5716223B1 (ja) * | 2014-07-14 | 2015-05-13 | 株式会社think−plus | 思考支援辞書、思考支援辞書システム、思考支援システム、思考支援方法、思考支援プログラム、思考支援プログラム記憶媒体、および思考支援データ記憶媒体 |
JP2019204153A (ja) * | 2018-05-21 | 2019-11-28 | 日本電信電話株式会社 | 文比較装置、方法、及びプログラム |
JP7088490B2 (ja) | 2018-05-21 | 2022-06-21 | 日本電信電話株式会社 | 文比較装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US5933822A (en) | 1999-08-03 |
WO1999005618A1 (en) | 1999-02-04 |
JP2010079915A (ja) | 2010-04-08 |
JP4892130B2 (ja) | 2012-03-07 |
CN1165858C (zh) | 2004-09-08 |
CN1302412A (zh) | 2001-07-04 |
JP4738523B2 (ja) | 2011-08-03 |
JP2001511565A (ja) | 2001-08-14 |
US6901399B1 (en) | 2005-05-31 |
EP0996899A1 (en) | 2000-05-03 |
EP0996899B8 (en) | 2015-05-20 |
EP0996899B1 (en) | 2015-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4892130B2 (ja) | 自然言語処理技法を用いたテキスト入力処理システム | |
US10496722B2 (en) | Knowledge correlation search engine | |
US8041697B2 (en) | Semi-automatic example-based induction of semantic translation rules to support natural language search | |
US8140559B2 (en) | Knowledge correlation search engine | |
Eikvil | Information extraction from world wide web-a survey | |
US7526425B2 (en) | Method and system for extending keyword searching to syntactically and semantically annotated data | |
CA2536265C (en) | System and method for processing a query | |
Osiński | An algorithm for clustering of web search results | |
JP2011118689A (ja) | 検索方法及びシステム | |
US11216520B2 (en) | Knowledge correlation search engine | |
CN100524294C (zh) | 使用自然语言处理技术用于处理文本输入的系统 | |
EP1016003A1 (en) | Method and apparatus for natural language querying and semantic searching of an information database | |
Yang et al. | Ontology-supported FAQ processing and ranking techniques | |
Torres-Parejo et al. | MTCIR: A multi-term tag cloud information retrieval system | |
EP1974292A1 (en) | A knowledge correlation search engine | |
Zheng et al. | An improved focused crawler based on text keyword extraction | |
Sharma et al. | Improved stemming approach used for text processing in information retrieval system | |
Ramprasath et al. | An overview of question answering system | |
Derczynski | Machine learning techniques for document selection | |
Ramanand et al. | Data Engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061120 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070507 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20070508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070508 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070803 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070907 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20100608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110104 |