JP2013543172A - 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム - Google Patents

質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム Download PDF

Info

Publication number
JP2013543172A
JP2013543172A JP2013530286A JP2013530286A JP2013543172A JP 2013543172 A JP2013543172 A JP 2013543172A JP 2013530286 A JP2013530286 A JP 2013530286A JP 2013530286 A JP2013530286 A JP 2013530286A JP 2013543172 A JP2013543172 A JP 2013543172A
Authority
JP
Japan
Prior art keywords
lat
query
score
candidate
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013530286A
Other languages
English (en)
Other versions
JP5816936B2 (ja
Inventor
ファン、ジェイムズ、ジェイ
フェルッチ、デイヴィッド、エイ
ゴンデック、デイヴィッド、シー
カルヤンプール、アディティヤ、エイ
ラリー、アダム、ピー
マードック、ザ、フォース、ジェイムズ、ダブリュ
ザドロズニ、ウロデク、ダブリュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2013543172A publication Critical patent/JP2013543172A/ja
Application granted granted Critical
Publication of JP5816936B2 publication Critical patent/JP5816936B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers

Abstract

【課題】 得られた候補解答についてより正確な全体スコアを提供するために検出されたLATの信頼性を自動的に推定するためのシステム、方法、およびコンピュータ・プログラム製品を提供する。
【解決手段】 それぞれの検出LATの信頼「スコア」または値を入手し、このシステムおよび方法は、この信頼スコアを、LATと候補解答の解答タイプとの一致度と結合して、候補解答について改善された全体スコアを提供することを実行する。
【選択図】 図1

Description

関連出願の相互参照
本発明は、2010年9月24日に出願され、本願所有者が所有する同時係属米国特許仮出願第61/386,029号に関し、その出願日の恩恵を請求するものである。
質問解答(QA)に関する現在の課題および手法の紹介は、Webベースの参考文献であるhttp://en.wikipedia.org/wiki/Question_answeringで見つけることができる。一般に、QAはあるタイプの情報検索である。文書の集合(World Wide Webまたはローカル・コレクションなど)の場合、システムは自然言語で提起された質問に対する解答を検索することができなければならない。QAは、文献検索など、その他のタイプの情報検索より複雑な自然言語処理(NLP)技法を必要とするものと見なされ、ときには、検索エンジンを越える次のステップと見なされる。
QAリサーチは、事実、リスト、定義、方法、理由、仮説、意味上の制約付き、および言語横断の質問を含む、広範囲の質問タイプを扱おうと試みる。検索集合は、小規模なローカル文書の集合から、内部組織文書、まとめられたニュースワイヤ・レポート、World Wide Webまで様々である。
クローズド・ドメインのQAは、特定のドメイン、たとえば、医学または自動車のメンテナンスに属する質問を扱うものであり、オントロジにおいて頻繁に形式化されたドメイン固有の知識をNLPシステムが活用できるので、より容易なタスクと見なすことができる。オープン・ドメインのQAは、ほとんどすべてのことに関する質問を扱うものであり、一般的なオントロジおよび対象世界に関する知識のみを頼りにすることができる。これに対して、これらのシステムは通常、そこから解答を抽出するために使用可能なデータをそれ以上に持っている。
代わって、クローズド・ドメインのQAは、手続き情報ではなく記述的情報を要求する質問など、限られたタイプの質問のみが受け入れられる状況に関する可能性がある。
情報へのアクセスは、現在、2つのパラダイムによって支配されている。第1に、構造化レコードの集合に含まれるものに関する質問に応答するデータベース照会である。第2に、たとえば、テキストまたはhtmlなどの非構造化データの集合に対する照会に応答して文書リンクの集合を配信する検索である。
このような情報照会パラダイムにおける主な未解決の問題は、構造化、非構造化、またはその両方になり得る文書の集合に含まれる情報に基づいて、事実に基づく質問に正確に応答できるコンピュータ・プログラムの欠如である。このような事実に基づく質問は、「ビタミンKの欠乏によるリスクは何か」などの広いものまたは「ヒラリー・クリントンの父親はいつどこで生まれたか」などの狭いもののいずれかになる可能性がある。
照会を理解すること、解答を含む可能性のある適切な文書を見つけること、ならびにユーザに配信すべき正しい解答を抽出することは、難題である。
米国特許仮出願第61/386,029号 米国特許出願第12/126,642号 米国特許第7,139,752号 米国特許出願第12/152,441号 米国特許第6,829,603号 米国特許第6,983,252号 米国特許第7,136,909号
1997年マグローヒル社発行でTomMitchellによる「Machine Learning」 2000年ケンブリッジ大学出版局発行でJohn Shawe-TaylorおよびNello Cristianiniによる「Support Vector Machines and other kernel-based learning methods」 1996年3月ComputationalLinguistics Journal第22巻第1刷に公表されたAdam L. Berger他による「A maximum entropy approach to natural language processing」
一態様では、質問解答を実行し、特定の照会について間違ったLATを計算するという問題に対処する、コンピューティング・インフラストラクチャおよび方法が提供される。
一態様では、候補解答(candidate answer)についてより正確な全体スコア(overall score)を提供するために照会検出LATの信頼性を自動的に推定する、システム、方法、およびコンピュータ・プログラム製品(computer program product)が提供される。それぞれの検出LATの信頼「スコア」または値を入手し、このシステムおよび方法は、この信頼スコア(confidence score)を、LATと候補解答との一致度(degree ofmatch)と結合して、候補解答について改善された全体スコアを提供することを実行する。
したがって、一態様では、質問に対する解答を自動的に生成するためのシステムおよび方法が提供される。この方法は、入力照会に関連する字句解答タイプ(LAT:lexical answer type)を決定することと、入力照会LATに関する第1のスコアを計算することであって、第1のスコアが照会LATの品質を示すことと、情報源から入力照会に対する候補解答を入手することと、候補解答に関する解答タイプ(AT:answer type)を決定することと、照会LATと候補解答ATを比較することと、比較した照会LATと候補解答ATとの一致度を表す第2のスコアを計算することと、第1のスコアと第2のスコアを結合して、候補解答の品質を示す合計スコア(total score)を提供することを含み、処理装置が、照会LATを決定することと、第1および第2のスコアを計算することと、候補解答を入手することと、ATを決定することと、比較することと、結合することのうちの1つまたは複数を自動的に実行する。
一態様では、入力照会に関連する照会LATに関する第1のスコアを計算することが、決定された照会LATを記述する特徴(feature)のセットを抽出することと、特徴セットにモデルを適用して、決定された照会LATの推定正確度(estimated accuracy)を表すLAT信頼値を生成することであって、第1のスコアが信頼値を含むことを含む。
他の一態様では、質問に対する解答を自動的に生成するためのシステムであって、メモリ・ストレージ・デバイスと、それぞれがメモリ・デバイスに通じていて、入力照会に関連する字句解答タイプ(LAT)を決定することと、照会LATに関する第1のスコアを計算することであって、第1のスコアが照会LATの品質を示すことと、情報源から入力照会に対する候補解答を入手することと、候補解答に関する解答タイプ(AT)を決定することと、照会LATと候補解答ATを比較することと、比較した照会LATと候補解答ATとの一致度を表す第2のスコアを計算することと、第1のスコアと第2のスコアを結合して、候補解答の品質を示す合計スコアを提供することを含む方法を実行するために構成された1つまたは複数のプロセッサ・デバイスとを含む、システムが提供される。
さらに他の一態様では、テキスト・ストリングを含む照会から特徴を抽出するための方法が提供される。この方法は、照会に関連する構文パターン・ルールを識別することであって、そのパターン・ルールが共通字句解答タイプ(LAT)を定義する1組のパターン・ルールから識別され、抽出された特徴のうちの第1の特徴が識別されたパターン・ルールを含むことと、検出された字句解答タイプ(LAT)の前のインスタンスについてチェックし、前のインスタンスに基づいてLATワード頻度(LAT word frequency)を計算することであって、抽出された特徴のうちの第2の特徴が照会ワードが候補LATである算出頻度を含むことと、照会に関連する解析木データ構造(parse tree data structure)を入手することと、解析木構造内の候補LATに関連するワード間の文法関係を識別することであって、抽出された特徴のうちの第3の特徴が候補LATの品詞(part of speech)を含むことと、候補LATワードがLATとして認識された照会内の他の何らかのワードを同一指示する(co-reference)かどうかを判断することであって、抽出された特徴のうちの第4の特徴が同一指示情報(co-reference information)を含むことを含み、1つまたは複数のプログラミングされたプロセッサ・デバイスが、構文パターン・ルールを識別することと、前のインスタンスについてチェックすることと、解析木データ構造を入手することと、文法関係を識別することと、LATワード同一指示を判断することを実行する。
本発明の目的、特徴、および利点は、以下に明記されている詳細な説明の文脈内で理解される。この詳細な説明は、本発明の重要な部分を形成する添付図面の文脈内で理解される。
本発明を使用することができる質問/解答方法の高レベル論理アーキテクチャ10を示す図である。 LAT信頼性推定スコアを生成するためのLAT信頼性推定プロセスおよびソフトウェア・アーキテクチャの流れ図である。 LAT信頼性推定の適用例を描写する流れ図である。 図2の流れ図のステップ160で実行された特徴(複数も可)生成プロセスを示す流れ図である。 照会LAT信頼スコアを計算するためにトラバースされる決定木モデル190の一部分の例を描写する図である。 本発明を使用することができる質問/解答方法の他の高レベル論理アーキテクチャ10を示す図である。 据え置きタイプの評価により質問および解答処理を実行するための流れ図の一例である。 一実施形態において図7の流れ図のステップ132で実行されたTyCorスコア生成を示す流れ図である。 CASデータ構造を処理するためにあるタイプの分析エンジンを提供するためのUIMAフレームワーク実現例の一態様を描写する図である。 一実施形態において図2、図3、図4〜図5、図7〜図8に記載されている方法ステップを実行するための模範的なハードウェア構成を示す図である。
「SYSTEM AND METHOD FORPROVIDING QUESTION AND ANSWERS WITH DEFERRED TYPE EVALUATION」という名称で本願所有者が所有する同時係属米国特許出願第12/126,642号は、質問に関する解答が自動的に生成されるQAシステムおよび方法について記載している。詳細には、これは、質問から決定された字句タイプを、検索から導出された各候補解答に関連する字句タイプと比較することを伴う。質問によって要求された字句解答タイプは本明細書では「字句解答タイプ」または「LAT」と呼ぶ。各候補解答に関連する字句タイプは本明細書では解答タイプまたは「AT」と呼ぶ。
一般に、質問解答(QA)システムは、おそらく構造化、半構造化、および非構造化情報資源の異種混合集合を調べることにより、弁明とともに自然言語で所与の質問に対して厳密な解答を返す。図1は、標準的な質問解答システム10を構成する主要コンポーネントとその作業の流れを示している。
質問分析コンポーネント20は、自然言語質問19(たとえば、「米国の第42代大統領は誰か」)を受け取り、その質問を分析して、最小限で予想解答の意味タイプ(この例では「大統領」)を生成し、そして任意選択で下流の処理のためのその他の分析結果を生成する。コア検索エンジンを使用する検索コンポーネント30aは、質問分析の出力29から照会を公式化し、World Wide Web41あるいは1つまたは複数の知識資源、たとえば、データベース、知識ベース42などの様々な資源を調べて、質問に対する解答に関連する文書、一節、Webページ、データベース・タプルなどを取り出す。次に、候補解答生成コンポーネント30bは、検索結果45から質問に対する潜在的な(候補)解答を抽出し、次にその解答に対し、解答選択コンポーネント50によってスコアおよびランクを付けて、関連の信頼スコアを有する解答の最終ランク付きリストを生成する。
据え置きタイプの評価を有するQAシステムでは、候補解答(すなわち、データ・コーパスまたはインターネットから得られた照会に対する候補解答インスタンス)の抽出後、典型的に、解答のタイプ分けが実行され、すなわち、検索された候補解答とその字句タイプとの関連の決定が行われる。決定された候補解答タイプは、質問分析によって検出された照会の算出字句解答タイプ(「LAT」)と照らし合わせて比較され、解答の正しさを判断する際に評価が行われる。
タイプ強制(TyCor:TypeCoercion)プロセスは、候補解答の解答タイプ(AT)がいくつかの技法に基づいて質問LATに「強制」されるプロセスである。強制プロセスは、構造化資源内のインスタンスに候補解答をマッピングし、そのタイプを入手し、それをLATにマッピングすることを伴う可能性がある。「強制」の結果はTyCorスコアと呼ばれる。
質問/照会のLATは、その質問/照会に対する有効な解答であるエンティティの指示対象のタイプ(すなわち、記述子)である。実際には、LATは、パターンの集合を含む自然言語理解モジュールあるいは意味インタープリタを備えたパーサまたはその両方によって検出された解答の記述子である。
したがって、質問解答システムは、図1の照会分析モジュール20内の字句解答タイプ(LAT)検出処理ブロック200を使用することができる。LATは、正しい解答の意味タイプを識別する質問項目をさらに表している。したがって、LATは、パターンLAT検出ルールにより質問内で検出可能である可能性がある。これらのルールは、関連ルール学習により自動的に機械によって実現され、コード化または学習される。自然言語理解モジュールはこれらのルールを実現することができる。
しかし、いかなる自然言語処理モジュールも完璧ではなく、誤ったLATが検出される。間違ったタイプの解答は正しい解答になる可能性が高いものとして判断されるので、間違ったLATはQAシステムの性能を著しく低減する可能性がある。
QAシステム10に関する詳細について図6に関して述べる。証拠収集および解答スコアリング機能50は、(1)「字句解答タイプ」(LAT)、たとえば、何らかの概念を記述するテキスト・ストリング、および(2)「候補解答」入力(複数も可)、たとえば、何らかのエンティティを記述するテキスト・ストリングを受け取るプログラム式処理コンポーネントである。このプログラム式処理コンポーネントは、そのエンティティがどの程度までその概念のインスタンスであるかを表す判断(たとえば、スコア)を含む出力を生成する。以下の図7および図8に記載されているように、これは、たとえば、算出候補解答タイプ(AT)に基づいて、解答スコアリング機能の一部として使用される。
図4に関して以下に記載されているように、入力照会を処理してLATを決定し、検索し、1つまたは複数の候補解答を入手した後、受け取られた各候補解答について、候補をデータベース内のインスタンスと突き合わせ、その結果、一致インスタンスを含む出力データ構造を生成するステップ132aと、候補解答が要求されたLATを有するという証拠を探して(検索して)、知識ベース(KB)内のこれらのインスタンスに関連するLT(複数も可)を取り出すステップ132bと、LAT(複数も可)をLT(複数も可)(たとえば、パーサ、意味インタープリタ、あるいは単純なパターン・マッチャ、またはこれらの組み合わせを使用する突き合わせ機能によって決定されたもの)と突き合わせようと試みて、一致度を表すスコアを生成するステップ132cが実行される。詳細には、候補ATおよび照会LAT(複数も可)は字句ストリングとして表される。「TyCor」(タイプ強制)スコアと呼ばれるスコアの生成は、(1)候補解答とインスタンスの突き合わせ、(2)インスタンスとタイプの関連の抽出、および(3)LATとタイプの突き合わせという3つのステップで構成される。このスコアは、その候補がLATに「強制」される程度を反映し、スコアが高いほどより良好な強制を示す。
一実施形態では、本発明は、候補解答についてより良好な品質スコアを提供するための追加の機能を提供することにより、同時係属米国特許出願第12/126,642号に記載されたQAシステムおよび方法の有効性を拡張し補足する。具体的には、図1に示されているようなQAシステムは、検出された照会LATの信頼性の自動推定を実行して、LAT信頼スコアを生成する。このLAT信頼スコアは、候補解答のLATと解答タイプ(AT)との一致度と結合されて、候補解答についてより良好な全体スコアを提供する。換言すれば、それぞれの検出されたLATの信頼スコアまたは値を入手し、本システムおよび方法はこのLAT信頼スコアとTyCorスコアとの結合を実行して、候補解答に関する全体スコアを改善する。付随する利点としては、QAシステムがLAT検出エラーに対して抵抗力が高くなることと、LAT信頼性を考慮するときに候補解答が正しくなる可能性が高くなることを含む。
LAT信頼スコアの計算に関して、図2に関して言及しているが、同図は、図1に示されている照会分析モジュール20内のLAT検出処理ブロック200の一部としてまたはそれに関連して実行可能なものなどのLAT信頼性推定のプロセスを描写している。この処理では、本願所有者が所有する同時係属米国特許出願第12/126,642号に記載されているプロセスを使用して、照会について字句解答タイプ(LAT)を計算した後、それぞれのLATの信頼「スコア」または信頼値が計算される。
図2は、2つのコンポーネントを含むLAT信頼性推定のためにコンピュータによって実行されるプロセス150を特に示しており、第1の特徴生成コンポーネント160は候補LAT(たとえば、質問中のワード)を記述する特徴のセット165を抽出する。特徴例としては、1)共通LATを定義する1組のルールからのパターン・ルール(「ルールID」)の適用、たとえば、「この大統領がどのような・・・を行った」の中の「大統領」という名詞として、「この」または「これらの」などの限定詞によって修飾された名詞と一致する構文パターンを記述する「thisWhatNoun」というIDを有するルール、2)そのワードが候補LATになる従来の頻度、3)LATに関連する文法関係を決定するための構文解析情報、たとえば、候補LATワードが解析木の他の部分とどのように関係するか、4)LATの品詞などのその他の文法情報、ならびに5)候補LATワードがLATなどとして認識されたその他の何らかのワードを同一指示するかどうかを判断する同一指示情報を含むことができるが、これらに限定されない。信頼性推定処理コンポーネント175はこのLAT特徴のセットを取り、その組にモデル180が適用されて、そのLATに関連する信頼スコア199を生成する。モデル180は、1組の訓練インスタンスから手動でまたは自動的に構築することができる。
したがって、たとえば、一実施形態においてProlog(登録商標)論理プログラムによる処理に基づいてそのLATに至るパターンを質問の中に見つけることができる。たとえば、過去の訓練データ、すなわち、過去に手動でLATを識別するために以前のプロセスで使用されたデータにより、特定の識別済みパターン(複数も可)について適切な重みが決定される。LAT信頼性推定中に、たとえば、Prolog(登録商標)論理プログラムを使用して、そのLATを囲むテキストを処理して、そのパターンのいずれかが適合するかどうかを判断する。すなわち、一実施形態ではProlog(登録商標)論理プログラムを使用して、パターン・ルール突き合わせを実行することができる。あるパターンが適合する場合、識別済みパターンに関連するルールIDが提供され、その特定のパターンに関する従来の信頼性に基づいて、その特徴に重みが割り当てられる。いずれのパターンも一致しない場合、その特徴に割り当てられる重みは存在しないであろう。
次に、質問分析段階における特徴生成コンポーネント160の一実施形態について図4に関連して説明する。図示の通り、照会LATは、それぞれが特定の特徴抽出機能を実行する複数のモジュールに並行して入力され処理される。複数のモジュールとしては、共通のLATを定義する1組のルールからパターン・ルールIDを識別するためのプロセス162と、たとえば、手動で注釈を付けられたデータの集合から検出されたLATワードの前のインスタンスをチェックし、前のインスタンスの量に基づいてLATワード頻度を計算するためのプロセス164と、候補LATの品詞(たとえば、名詞、動詞、形容詞などのワード・タイプ)を決定するための解析木チェック・プロセス166と、LATに関連する文法関係、たとえば、候補LATワードが解析木の他の部分とどのように関係するかを識別するためのプロセス168と、候補LATワードがLATとして認識されたその他の何らかのワードを同一指示するかどうかを判断する同一指示情報を識別するためのプロセス170とを含む(たとえば、「革命戦争中に将軍であった、この大統領・・・」という質問は、2つのLAT(大統領と将軍)を提供し、「大統領」というワードがLATであることが把握されている場合、「将軍」というワードは最も可能性の高いLATであるとともに「将軍」という候補入力LATワードは既知のLATである大統領を同一指示する)。処理ブロック162〜170の出力172は、ブール(たとえば、文法関係あるいは候補LATが他のLATを参照するかどうかを示す同一指示)、数値的特徴(たとえば、LAT頻度としてのワード)、およびカテゴリ(たとえば、名詞などの品詞)のうちの1つまたは複数を含むがこれらに限定されない内容を有する特徴セットを提供する。次に、出力された特徴セットは信頼性推定モジュール175に入力される。信頼性推定ユニット175は特徴セットを受け取り、推定されたLAT信頼スコアを生成するために訓練されたモデル180がこの特徴セットに適用される。一実施形態では、特徴セットは数値のリスト(たとえば、1、0、0.234、1、1、・・・)を含む。カテゴリ特徴は1組のブール特徴に変えることができる(たとえば、品詞は、is_noun、is_verb、is_adj、is_adv、is_prepに変えることができる)。
一実施形態では、ブール、カテゴリ値、および数値からなる特徴セットは前に訓練されたモデルに入力される。ブール値またはカテゴリ値の場合、たとえば、これらは、0または1などの2進数として特徴セット内に表すことができる。たとえば、0または1という値は、それぞれ偽または真という特徴セットのブール値に関連付けることができる。
訓練されたモデル180に関して、一実施形態は、種々の特徴を結合し、それらに重みを付けて、LAT信頼性推定のための最終スコアを生成するように構成された機械学習モデルである。特徴セットの種々の特徴にどのように重みを付けなければならないかを判断するために数学的モデルである任意の機械学習モデルを使用することができる。この数学的モデルはそれぞれのタイプの特徴に関する重みを含み、特定の入力の特徴セット値の場合、その値はこのモデルに入力され、このモデルがスコアを生成する。個々の特徴値はモデル式(各変数ごとに異なる重みを有する関数)への変数であり、このモデルを適用する場合、数値を生成するためにそれぞれの変数に値が与えられる。このモデルは、1組の訓練インスタンスから手動でまたは自動的に構築することができる。
一実施形態では、訓練されたモデル180は、1997年マグローヒル社発行でTom Mitchellによる「Machine Learning」という参考文献にその説明が記載されているロジスティック回帰モデルである。他の諸実施形態では、2000年ケンブリッジ大学出版局発行でJohn Shawe-TaylorおよびNello Cristianiniによる「Support Vector Machines and other kernel-based learning methods」という参考文献に記載されているように、サポートベクタマシン・モデルを使用することができる。さらに、1996年3月Computational Linguistics Journal第22巻第1刷に公表されたAdam L. Berger他による「A maximum entropyapproach to natural language processing」という参考文献に記載されているような最大エントロピーマシン・モデルを見つけることができる。それ以外には、ルールベースまたは決定木ベースのモデルを実現することができる。
使用可能なロジスティック回帰モデルの一例は以下のように式1)として示される。
Figure 2013543172

ここで、x,...,xは特徴値であり、一実施形態では以下のようになる。
Figure 2013543172

ここで、a,...,aは係数であり、定数cはモデルの訓練中に割り当てられる。非限定的な一例では、特定のモデルは以下のような係数割り当てを有することができる。
=0.484,x=thisWhatRule発火
=2.8671,x=heShePronounRule発火
=12.587 x=事前確率・・・
図5は、一連の判断ポイント(たとえば、決定木内のノード192、194、196)および種々の判断(決定木内の分岐)を含む決定木データ構造190の形で、あるモデルの他の一例を示している。図示の例では、判断は、入力が特定のパターンに適合するかどうかである。それぞれのパターン/ルールは、質問中の「このX・・・」などのパターンを検出する「thisWhatRule」などの関連する名前を有する。あるパターンが入力に適合する場合、特定の信頼性がLATとして返される。決定木データ構造190の処理は、訓練された決定木を自動的にトラバースすることと、信頼スコアを計算するために使用されるスコアをそれぞれの判断ステップ、たとえば、ステップ192、194、196などで計算することを含む。
前述の通り、QA処理中に、候補解答が照会LATのインスタンスであるかどうかについて判断が行われる。LAT検出はエラーを有する可能性があるので、タイプ一致スコア(TyCor)の結果を改善するために、すなわち、算出LAT信頼スコアと生のTyCorスコアを結合することにより、LATに関連する推定信頼スコアが生成される。
図3は、変更されたTyCorスコアを生成するために推定LAT信頼スコア199を適用するためのプログラム式プロセス250を記述している。プログラム式LAT信頼性適用プロセス250では、LAT信頼性推定199および生のTyCorスコア260を結合して最終スコア299を生成する結合ユニット275で単一のステップが実行される。一実施形態では、LAT信頼スコアは0〜1の数にすることができ、これに生のTyCorスコアを掛けて最終TyCorスコアを計算することができる。LAT信頼スコアと生のTyCorスコアの結合は、信頼性加重平均などの様々な方法で実現される。
1つまたは複数の候補LATを有する照会の場合、LAT信頼スコアは重みとして扱われる。たとえば、それぞれのLATは、それに関連する重みがLAT信頼スコアによって表されている。それぞれのLATに関する解答候補および関連の生のTyCorスコアの場合、それぞれのLATについてそれぞれの重み信頼性にタイプ一致(TyCor)スコアを掛けたものの合計として全体スコアが推定される。したがって、本明細書で上述した照会例の場合、すなわち、
「革命戦争中に将軍であった、この大統領・・・」
では、「大統領」と「将軍」という検出された2つのLATについて、「ジョージ・ワシントン」という候補解答に関する全信頼性加重平均は、「将軍」に関する加重信頼スコア(たとえば、0.8)にそのそれぞれのTyCorスコア(たとえば、1.0)を掛けたものを表す第1の合計と、「大統領」に関する加重信頼スコア(0.95)にそのそれぞれのTyCor(たとえば、1.0)を掛けたものを表す第2の合計とを結合した合計として計算される。一般に、1つまたは複数の検出されたLATを有する照会の場合、全加重信頼スコアは以下のように計算される。
全信頼性加重平均スコア=(信頼スコアLAT1)(TyCorLAT1)+(信頼スコアLAT2)(TyCorLAT2)+・・・+(信頼スコアLATn)(TyCorLATn
この加算を計算すると、単一照会の「n」個の検出されたLATについて信頼性加重平均が得られる。
図6は、高レベル論理アーキテクチャ10を描写する、米国特許出願第12/126,642号に記載されているQAシステム図を示している。一般に、図6に示されているように、高レベル論理アーキテクチャ10は、ユーザ照会または質問を受け取って分析するための機能を実現する照会分析モジュール20を含む。「ユーザ」という用語は、システムと対話している1人または複数の人を指す場合もあれば、機械的手段により照会を生成するコンピュータ・システム22を指す場合もあり、ここで「ユーザ照会」という用語はこのように機械的に生成された照会およびコンテキスト19’を指す。候補解答生成モジュール30は、1次ソース・モジュール11および1次ソースから抽出された関係およびリストの集合を含む解答ソース知識ベース(KB)モジュール21に含まれる構造化、半構造化、および非構造化ソースをトラバースすることにより、候補解答の検索を実現するために提供される。すべての情報ソースは、ローカルに保管するか、またはインターネットを含むネットワークにより配布することができる。
アーキテクチャ10の候補解答生成モジュール30は、取り出されたデータの分析に基づいて、候補解答を含む複数の出力データ構造を生成する。図6では、証拠収集モジュール50は、候補解答を有する一節に基づいて証拠を同時に分析するために1次ソース11および知識ベース21と対話し、一実施形態では並列処理動作として、候補解答のそれぞれにスコアを付ける。一実施形態では、このアーキテクチャは、本願所有者が所有する発行済み米国特許第7,139,752号に記載されているように共通分析システム(CAS)候補解答構造を使用して利用することができる。
図6に描写されているように、証拠収集モジュール50は、取り出された一節を分析し、取り出された一節の候補解答のそれぞれにスコアを付けるための候補解答スコアリング・モジュール40を含む。解答ソース知識ベース(KB)21は、関係の集合(たとえば、タイプ別リスト)を含む構造化または半構造化ソース(事前計算またはその他による)の1つまたは複数のデータベースを含むことができる。一実現例では、解答ソース知識ベースは、メモリ・ストレージ・システム、たとえば、ハード・ドライブに保管されたデータベースを含むことができる。
解答ランキング・モジュール60は、候補解答にランクを付け、ユーザのコンピュータ・ディスプレイ・インターフェース(図示せず)またはコンピュータ・システム22を介してユーザに返される応答99を決定するための機能を提供し、この応答は、解答である場合もあれば、質問に対する高品質の解答が見つからないときに、質問に対する応答として前の解答の詳細あるいは解明の要求である場合もある。「解答ランキング」モジュール60が、前のデータから機械学習技法を使用して生成された訓練されたモデル・コンポーネント(図示せず)を含む場合、機械学習の実現例がさらに提供される。
図6に描写されている処理は、エンタープライズ内のサーバまたはサーバ・クラスタ上でローカルに行われる場合もあれば、代わって、上記のように質問解答機能を高めるために公的なまたは私的に入手可能な検索エンジンで分散されるか、それと一体化しているか、あるいはその他の方法でそれと相俟って動作する可能性がある。したがって、この方法は、処理装置によって実行可能な命令を含むコンピュータ・プログラム製品として、あるいはそのコンピュータ・プログラム製品を配備するサービスとして、提供することができる。このアーキテクチャは、インターネット、公的に入手可能なデータベース、Webサイト(たとえば、IMDB.com)、または私的に入手可能なデータベースの検索専用にすることができる候補解答生成モジュール30の一部として検索エンジン(たとえば、文献検索システム)を使用する。データベースは、任意のストレージ・システム、不揮発性メモリ・ストレージ・システム、たとえば、ハード・ドライブまたはフラッシュ・メモリに保管することができ、ネットワークによって配布することができる。
前述の通り、図6のシステムおよび方法は、非構造化情報管理アーキテクチャ(UIMA)のサブシステムであって、分析エンジンおよび非構造化情報管理アプリケーションなどの様々なUIMAコンポーネント間のデータ交換を処理する共通分析システム(CAS)を使用する。CASは、プログラミング言語から独立したタイプ・システムを介してデータ・モデリングをサポートし、強力な索引付けメカニズムによるデータ・アクセスを可能にし、(http://www.research.ibm.com/journal/sj/433/gotz.html)に記載されているようにテキスト・データに関する注釈を作成するためのサポートを提供する。画像、ビデオ、またはその他の非テキスト・モダリティの分析に有用なように、CASは文書とその注釈との間のリンクについて複数の定義を可能にすることに留意されたい(米国特許第7,139,752号に教示されている通り)。
一実施形態では、UIMAは、広範囲の情報源にわたる非構造化情報の効果的な管理および交換のためのミドルウェアとして提供することができる。このアーキテクチャは、一般に、検索エンジン、データ・ストレージ、パイプライン化した文書アノテータを含む分析エンジン、および様々なアダプタを含む。UIMAシステム、方法、およびコンピュータ・プログラムは、入力照会に対する解答を生成するために使用することができる。この方法は、文書を入力することと、文書データをトークン化し、特定のタイプの意味内容を識別して注釈を付けるために複数の結合されたアノテータを含む少なくとも1つのテキスト分析エンジンを操作することを含む。したがって、これは、質問を分析し、文書の集合から質問に対して可能な解答としてのエンティティを抽出するために使用することができる。
図6のアーキテクチャ図においてより詳細にさらに示されているように、「照会分析」モジュール20は、たとえば、そのWebベースのブラウザ装置を介してユーザによって入力された照会19を含む入力を受け取る。入力照会19はテキスト・ストリングを含むことができる。照会分析ブロック20は、解答タイプ(LAT)に関する追加の制約を提供するための機能およびプログラミング・インターフェースを実現する字句解答タイプ(LAT)ブロック200をさらに含む。ブロック20における計算は、字句解答タイプを含むがこれに限定されない。一実施形態では、LAT検出ブロック200は、検出されたLATに関するLAT信頼性推定機能を含むことができる。
上述の通り、質問/照会のLATは、質問に対する有効な解答であるエンティティの指示対象のタイプ(すなわち、記述子)である。実際には、LATは、パターンの集合を含む自然言語理解モジュールまたは意味インタープリタを有するパーサまたはその両方によって検出された解答の記述子である。
図6の照会分析モジュール20内の字句解答タイプ(LAT)ブロック200に関しては、LATは正しい解答の意味タイプを識別する質問項目を表している。一実施形態では、既知の通り、LATはパターンLAT検出ルールにより質問内で検出することができる。これらのルールは実現され、手動でコード化するかまたは関連ルール学習により自動的に機械によって学習することができる。この場合、自然言語理解モジュールはルールの実現に限定することができる。
図7は、米国特許出願第12/126,642号に記載されているように、一実施形態において据え置きタイプの評価により質問および解答を実行するためのコンピュータ・プログラム式方法100の流れ図である。一般に、図7に描写されている「据え置きタイプの評価」の方法では、第1の処理ステップ112は、処理装置で入力照会を受け取り、字句解答タイプ(LAT)処理ユニット・ブロック200(図6)に入力するための質問ストリングおよびコンテキストを含むデータ構造、たとえば、CAS構造を生成するステップを表し、そのブロック200では、ステップ115で示されるように、照会が分析され、字句解答タイプ(LAT)およびLAT信頼スコアが計算される。
ステップ115で実行されるように、LAT処理コンポーネント内の処理の結果として、算出LATおよびおそらく元の質問からの追加の項目を含む出力データ構造、たとえば、CAS構造が生成される。
次に、ステップ120で類型化されているように、LATブロック200内の処理の結果として、計算された元の照会(項、重み)を含む出力データ構造、たとえば、CAS構造が生成される(同時係属米国特許出願第12/152,441号に記載されている通り)。
図7に戻ると、処理ステップ122では、候補解答文書を検索し、その結果を返すステップが実行される。
ステップ122で類型化されているように、候補解答生成モジュール内の処理の結果として、データ・コーパス(たとえば、1次ソースおよび知識ベース)から検出された文書のすべてを含む出力データ構造、たとえば、CAS構造が生成される。
図7のステップ128には、LAT(字句解答タイプ)を使用してCAS構造として出力される可能性のある1組の候補解答を生成するために候補解答についてそれぞれの文書を分析するステップが描写されている。
本明細書で述べた質問例の場合、図7のステップ132で類型化されているように、候補解答生成モジュール30内の処理の結果として、文書内で検出された候補解答が照会LAT要件と照らし合わせてチェックされ、(そのスコアに基づいて)ステップ133で解答(複数も可)として返される。
候補解答とインスタンスの突き合わせにおいて、候補は知識資源内の1つまたは複数のインスタンスと突き合わされ、そのインスタンスが取る形は知識資源によって決まる。構造化知識ベースでは、インスタンスはエンティティになる可能性があり、Wikipediaなどの百科事典的ソースでは、インスタンスは百科事典内の項目になる可能性があり、WordNet(登録商標)(プリンストン大学の理事会の商標)字句データベースなどの字句資源では、インスタンスはsynset項目(同義語のセット)になる可能性があり、非構造化文書(またはWebページ)集合では、インスタンスはテキスト内で発生する用語または語句になる可能性がある。複数のインスタンスが見つかった場合、集約機能を使用するロールアップを使用して、すべての候補からのスコアを結合する。適切なインスタンスがまったく見つからない場合、0というスコアが返される。
次に、インスタンス関連情報が資源から抽出される。この情報は、それぞれのインスタンスを1つのタイプまたは1組のタイプと関連付ける。資源次第でこれは異なる形を取る可能性があり、知識ベースでは、これはインスタンスをタイプに関係づける、関心のある特定の関係に対応し、百科事典的ソースでは、これは字句タイプをエンティティに割り当てる字句カテゴリ情報になる可能性があり、WordNet(登録商標)などの字句資源では、これはsynsetに関する包摂性などの1組の字句関係であり(たとえば、「アーチスト」は「人」である)、非構造化文書集合では、これはタイプを表す他の用語および語句に対する共起または近接性になる可能性がある。
次に、それぞれのLATをそれぞれのタイプと突き合わせようと試みる。そのタイプの字句表示が使用される。たとえば、百科事典では、これはカテゴリを表すストリングになる可能性があり、WordNet(登録商標)などの字句資源では、これはsynset内に含まれるストリングのセットになる可能性がある。この突き合わせは、ストリング突き合わせまたはWordnet(登録商標)などの追加の字句資源を使用して、LATとタイプとの同義性または包摂性の有無をチェックすることによって実行される。関心のあるタイプについて特別なロジックを実現することができ、たとえば、厳密な一致、同義語、または被包摂語関係を必要としないが、むしろLATとタイプの両方が「人」という用語の被包摂語であることを必要とする、人物照合ロジック(person matcher logic)を起動することができる。このようにして、たとえば、「彼」および「画家」は、厳密に同義語または被包摂語ではない場合でも、正のスコアが与えられるであろう。最後に、一致度のスコアを付ける複数対のスコアのセットは、集約機能を介して単一の最終スコアまで解くことができる。
したがって、質問例について図8のステップ132a〜132cに明記されている実現例では、それぞれの候補解答が自動的にLAT要件と照らし合わせてチェックされる。これは、証拠収集モジュール50の一部として図6に示されている候補解答スコアリング・ブロック40によって実行することができ、特に、確率を発生する候補解答タイプ分析モジュール400は、たとえば、それによって候補解答が現れる文書の文法および意味分析に基づいて候補解答が正しいタイプのものであることを判断する。前述の通り、この処理は、異なるタイプ分けスコアの加重結合として表すことができる自動スコアリング機能を使用することを必要とし、一実施形態例では、これは以下のように表すことができる。
Figure 2013543172
その他のスコアの結合も可能であり、最適スコアリング機能は、2008年5月14日出願の同時係属米国特許出願第12/152,441号に記載されているように学習することができる。
スコアリング機能自体は数式であり、一実施形態では、ロジスティック回帰関数(一次式と指数関数の合成関数)に基づくものにすることができ、かなり多数のタイプ分けスコアに適用することができる。
「候補解答スコアリング」モジュール40の出力は、証拠収集モジュール50の候補解答スコアリング・ブロック40に含まれる解答スコアリング・モジュール内の処理モジュールによってそれぞれのスコアが与えられた解答のリストを有するCAS構造である。一実施形態では、これらの候補解答には、上述のように加重信頼スコアと結合されたTyCor一致スコアが提供される。
最後に、図7に戻ると、ステップ133では、最上位の候補解答(それぞれのTyCorスコアに基づく)が返されるか、あるいは本明細書に記載されているようにそれぞれの算出加重LAT信頼スコアと結合するためにさらに処理されるか、またはその両方が行われる。
一実施形態では、図1および図6の上記のモジュールは、UIMA内の機能コンポーネントとして表すことができ、好ましくは、構造化および非構造化情報の組み合わせに対する検索および分析を統合するアプリケーションを開発するためにハードウェアおよびソフトウェアの組み合わせとして実施される。エンドユーザ機能を実現するためにUIMAコンポーネントを使用するソフトウェア・プログラムは一般にアプリケーション、アプリケーション・プログラム、またはソフトウェア・アプリケーションと呼ばれる。
UIMA高レベル・アーキテクチャは、その一実施形態が図6に示されており、UIMアプリケーションを実現するために協力する粒子の大きいコンポーネントの役割、インターフェース、および通信を定義する。これらは、テキスト・データあるいは画像データまたはその両方を含む文書などの非構造化ソース・アーチファクトを分析し、構造化ソースを統合してアクセスし、発見した意味内容に基づいてアーチファクトを保管し、索引を付け、検索することができるコンポーネントを含む。
図示されていないが、UIMA高レベル・アーキテクチャの非限定的な一実施形態は、意味検索エンジン、文書ストア、少なくとも1つのテキスト分析エンジン(TAE)、少なくとも1つの構造化知識ソース・アダプタ、集合処理マネージャ、少なくとも1つの集合分析エンジンを含み、いずれもアプリケーション・ロジックとのインターフェースを取る。一実施形態例では、UIMAは構造化情報および非構造化情報の両方にアクセスするように動作して、本明細書で述べたように候補解答および解答を生成する。非構造化情報は、文書の集合であると見なすことができ、テキスト、グラフィックス、静止画像および動画像、オーディオ、ならびにそれらの様々な組み合わせの形にすることができる。
UIMAの諸態様は図9にさらに示されており、同図では、テキスト分析エンジン(TAE)のコンポーネント部分になり得る分析エンジン(AE)600が示されている。AE600には、共通分析システム(CAS)610と、アノテータ620と、コントローラ630が含まれる。TAE(図示せず)の第2の実施形態は、CASならびに2つ以上のコンポーネント分析エンジンから構成される集約分析エンジンを含み、AE600と同じ外部インターフェースを実現する。
共通分析システム610
共通分析システム(CAS)610は、分析構造にアクセスし変更するためにすべてのアノテータ620が使用する共通機構として設けられる。したがって、CAS610は、アノテータ620間の調整を可能にし、異なるアプリケーションおよび異なるタイプのアーキテクチャ内でのアノテータ620の再利用を容易にする(たとえば、疎結合対密結合)。CAS610は、様々なアノテータの動作を拘束するものと見なすことができる。
CAS610は主として、データ・モデリング、データ作成、およびデータ取り出し機能を提供する。データ・モデリングは好ましくは、以下に示す表1の例に示されているように、(データ)タイプのツリー階層を定義する。これらのタイプは、特徴と呼ばれる属性または特性を有する。好ましい諸実施形態では、整数(int)、浮動小数点(float)、およびストリングなどの少数の組み込み(事前定義)タイプが存在し、UIMAは「注釈」という事前定義データ・タイプも含む。データ・モデルはアノテータ記述子に定義され、他のアノテータと共用される。表1では、本発明の好ましい実施形態において質問解答に対処するために従来技術の非構造化情報管理アプリケーションから拡張されたと見なされるいくつかのタイプとしては以下のものを含む。
Figure 2013543172
表1では、たとえば、すべての質問解答タイプ(左側の列のリスト)は新しいタイプであり、他の新しいタイプまたは既存のタイプ(右側の列に示されている)のいずれかを拡張するものである。たとえば、照会および照会コンテキストはいずれも照会レコードの一種であって新しいタイプであり、候補解答レコードはUIMAタイプの注釈を拡張するものであるが、浮動小数点である新しい特徴の候補解答スコアを追加している。加えて、表1は、UIMA注釈タイプを有するものとして照会LATを記述しており、候補解答ATも注釈であるが、浮動小数点タイプの追加の特徴TyCorスコアを有する。
CAS610のデータ構造は「特徴構造」と呼ぶことができる。特徴構造を作成するために、タイプを指定しなければならない(表1を参照)。注釈(および特徴構造)は索引に保管される。
CAS610は、表現に関するオブジェクトベースのデータ構造を抽象データ・タイプとして実現する、メソッドの集合(たとえば、JavaまたはC++のクラスとして実現されたもの)であると見なすことができる。好ましくは、CAS610の設計は、大部分は、ユーザ定義のオブジェクト、柔軟性に関する特性および値、効率に関する静的タイプ階層、ならびに1つまたは複数の反復子の使用により保管データにアクセスするための方法を提供する、TAE特徴特性構造に基づくものである。
CAS610により実現された抽象データ・モデルは、数ある特徴の中で特に、プラットフォームからの独立性(すなわち、プログラミング言語とは無関係にタイプ・システムが宣言的に定義される)、パフォーマンス上の利点(たとえば、異なるプログラミング言語で作成されたアノテータ610を共通データ・モデルにより結合する場合)、アノテータ610に関する入出力指定によるフローの組成(タイプ・チェックおよびエラー検出ならびにサービス・モデルとしてのアノテータ(TAE)のサポートを可能にする宣言的指定を含むもの)、意味論的索引付け、検索、および取り出しによる第3世代の検索手順のサポート(すなわち、意味タイプは宣言的であって、キーワードベースではない)をUIMA100に提供する。
CAS610は、分析構造を効率的に構築し検索するための機構をアノテータ620に提供する。分析構造は、主に元の文書のテキストの部分列を記述するメタデータで構成されるデータ構造である。分析構造における模範的なタイプのメタデータは注釈である。注釈は、それ専用の特性を有し、テキストの連続に注釈を付けるために使用されるオブジェクトである。任意の数の注釈タイプが存在する。たとえば、注釈は、文書の構造におけるその役割(たとえば、ワード、センテンス、パラグラフなど)に関してテキストの連続にラベルを付けるか、またはその文法上の役割(たとえば、名詞、名詞句、動詞、形容詞など)に関してそれを記述することができる。本質的に、注釈の数または適用に関する制限はまったくない。その他の例としては、適切な名前、位置、軍事目標、時間、イベント、機器、条件、時間条件、関係、生化学的関係、家族関係、あるいは重要性または関心のあるその他の項目としてそれを識別するためのテキストの注釈セグメントを含む。
典型的に、アノテータ620の機能は、テキストならびに既存の分析構造を分析して、認識するために設計された1組の注釈の新しいインスタンスを発見し、他のアノテータ620によりさらに処理するための入力用の分析構造にこれらの注釈を追加することである。
注釈に加えて、図8のCAS610は、元の文書テキストならびにアノテータ620によって生成可能な関連文書(たとえば、元の文書の翻訳あるいは要約またはその両方)を保管することができる。好ましくは、CAS610は、XMLなどの確立されたフォーマットで分析構造の種々の態様(たとえば、1組の注釈)のエクスポートを容易にする拡張部分を含む。
詳細には、CAS610は、TAEのうち、テキストの注釈を定義し保管する部分である。CAS APIは、注釈を作成し、それにアクセスするために、アプリケーションおよびアノテータ620の両方によって使用される。CAS APIは、好ましくは、少なくとも3つの別個のインターフェースを含む。タイプ・システムは、新しいタイプの作成を制御し、タイプ間の関係(継承)ならびにタイプおよび特徴に関する情報を提供する。タイプ定義の非限定的な一例は表1に示されている。構造アクセス・インターフェースは、新しい構造の作成ならびに値のアクセスおよび設定を処理する。構造照会インターフェースは既存の構造の取り出しを扱う。
タイプ・システムは、オブジェクト指向プログラミングにおけるクラス階層と同様に、システムにとって既知のエンティティの分類を提供する。タイプはクラスに対応し、特徴はメンバ変数に対応する。好ましくは、タイプ・システム・インターフェースは、新しいタイプに関する名前を提供し、それが付加されるべき階層内の場所を指定することによって、新しいタイプを追加することと、新しい特徴に関する名前を提供し、その特徴が付加されるべきタイプならびに値タイプを与えることによって、新しい特徴を追加することと、既存のタイプおよび特徴と、「どのタイプ(複数も可)がこのタイプから継承するか」など、それらの関係について照会することという機能を提供する。
好ましくは、タイプ・システムは少数の組み込みタイプを提供する。上述の通り、基本的なタイプはint、float、およびストリングである。Javaの実現例では、これらは、それぞれJavaのint、float、およびストリング・タイプに対応する。注釈のアレイおよび基本的なデータ・タイプもサポートされる。組み込みタイプは構造アクセス・インターフェース内に特殊なAPIサポートを有する。
構造アクセス・インターフェースは、新しい構造の作成ならびに既存の構造の値のアクセスおよび設定を可能にする。好ましくは、これは、所与のタイプの新しい構造の作成、所与の構造上の特徴の値の取得および設定、ならびに組み込みタイプに関するメソッドへのアクセスを提供する。それぞれの特徴が所定の範囲を有するような特徴の定義がドメインについて提供される。
代替の一実施形態では、図1、図6のモジュールはGATE(General Architecture for Text Engineering:テキスト・エンジニアリングに関する一般アーキテクチャ)における機能コンポーネントとして表すことができる(http://gate.ac.uk/releases/gate-2.0alpha2-build484/doc/userguide.htmlを参照)。GATEでは、概念的にGATE自体から分離した明確なインターフェースとともに再利用可能なソフトウェア・チャンクであるコンポーネントを使用する。すべてのコンポーネント・セットは、ユーザによって拡張可能であり、まとめてCREOLE(Collection of REusable Objects for Language Engineering:言語工学に関する再利用可能なオブジェクトの集合)と呼ばれる。GATEフレームワークは、CREOLEコンポーネントを差し込むバックプレーンである。ユーザは、それが始動したときに検索すべきURLのリストをシステムに提供し、コンポーネントはそれらの位置でシステムによってロードされる。一実施形態では、それから始めるためにその構成データのみがロードされ、ユーザが資源のインスタンシエーションを要求したときに実際のクラスがロードされる。GATEコンポーネントは3つのタイプの専門Java Beansの1つである。すなわち、1)資源:最上位のインターフェースであり、すべてのコンポーネントを記述する。すべてのコンポーネントが共通して共用するのは、それらがランタイムにロードできることであり、1組のコンポーネントがクライアントによって拡張可能であることである。それらは、RDF、プレーンXML、またはJavaプロパティなどのフォーマットでメタデータとしてシステムの外部で表される特徴を有する。資源は一実施形態ではすべてJavaのBeanにすることができる。2)処理資源:実行可能な資源であり、(RMIを介して)リモートで呼び出すことができ、クラス・ファイル内に存在する。PR(処理資源)をロードするために、システムはクラスまたはJARファイル(メタデータも含むことになる)を検出すべき場所を把握している。3)言語資源:Java抽象層を介してアクセスされるデータからなる資源である。それらは関係データベース内に存在する。さらに、ビジュアル資源:ビジュアルJavaのBeanであり、主なGATE GUIを含むGUIのコンポーネントである。PRのように、これらのコンポーネントは.classまたは.jarファイル内に存在する。
GATE処理モデルを記述する際に、その1次特性がパーサなどのアルゴリズム・ジェネレータなどである資源は処理資源としてモデル化される。PRは、Javaの実行可能インターフェースを実現する資源である。GATE可視化モデルは、そのタスクがビジュアル資源としてモデル化された他の資源を表示し編集することである資源を実現する。GATE内のコーパス・モデルは、そのメンバが文書であるJava Setである。Corporaおよび文書はいずれも言語資源(LR)のタイプであり、すべてのLRはそれに関連付けられ、資源に関する属性/値情報を保管した特徴マップ(Java Map)を有している。特徴マップは、注釈モデルを介して任意の情報を文書の範囲(たとえば、テキストの断片)に関連付けるためにも使用される。文書は、現在はテキストである文書内容(将来のバージョンは視聴覚内容のサポートを追加することができる)と、Java Setである1つまたは複数の注釈セットを有する。
UIMAとして、GATEは、主なサブモジュールの1つとして開示された質問解答システムを有する自然言語対話システムおよびマルチモーダル対話システムを実現するための基礎として使用することができる。参考文献(米国特許第6,829,603号、第6,983,252号、および第7,136,909号)により、当業者はこのような実現例を構築することができる。
図10は、本システムおよび本方法を使用することができるコンピューティング・システム401の模範的なハードウェア構成を示している。このハードウェア構成は、好ましくは、少なくとも1つのプロセッサまたは中央演算処理装置(CPU)411を有する。CPU411はシステム・バス412を介して、ランダム・アクセス・メモリ(RAM)414、読み取り専用メモリ(ROM)416、入出力(I/O)アダプタ418(ディスク・ユニット421およびテープ・ドライブ442などの周辺装置をバス412に接続するため)、ユーザ・インターフェース・アダプタ422(キーボード424、マウス426、スピーカ428、マイクロホン432、あるいはその他のユーザ・インターフェース装置、またはこれらの組み合わせをバス412に接続するため)、システム400をデータ処理ネットワーク、インターネット、イントラネット、ローカル・エリア・ネットワーク(LAN)などに接続するための通信アダプタ434、およびバス412を表示装置438あるいはプリンタ439(たとえば、デジタル・プリンタなど)またはその両方に接続するためのディスプレイ・アダプタ436に相互接続される。
当業者によって認識されるように、本発明の諸態様は、システム、方法、またはコンピュータ・プログラム製品として実施することができる。したがって、本発明の諸態様は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、またはソフトウェアとハードウェアの態様を組み合わせる実施形態の形を取ることができ、いずれも一般に本明細書では「回路」、「モジュール」、または「システム」と呼ぶことができる。さらに、本発明の諸態様は、そこにコンピュータ可読プログラム・コードが実施されている1つまたは複数のコンピュータ可読媒体に実施されたコンピュータ・プログラム製品の形を取ることができる。
1つまたは複数のコンピュータ可読媒体の任意の組み合わせを使用することができる。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体にすることができる。コンピュータ可読記憶媒体は、たとえば、電子、磁気、光、電磁、赤外線、または半導体のシステム、装置、またはデバイス、あるいは上記のものの任意の適切な組み合わせにすることができるが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的リスト)としては、1つまたは複数のワイヤを有する電気接続、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、光ファイバ、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD−ROM)、光学記憶装置、磁気記憶装置、あるいは上記のものの任意の適切な組み合わせを含むであろう。本明細書の文脈では、コンピュータ可読記憶媒体は、命令を実行するシステム、装置、またはデバイスによりあるいはそれに関連して使用するためのプログラムを収容または保管することができる任意の有形媒体にすることができる。
コンピュータ可読信号媒体は、たとえば、ベースバンド内でまたは搬送波の一部として、そこに実施されたコンピュータ可読プログラム・コードを含む伝搬データ信号を含むことができる。このような伝搬信号は、電磁、光、またはそれらの任意の適切な組み合わせを含むがこれらに限定されない様々な形のうちのいずれかを取ることができる。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体ではなく、命令を実行するシステム、装置、またはデバイスによりあるいはそれに関連して使用するためのプログラムを通信、伝搬、または輸送することができる任意のコンピュータ可読媒体にすることができる。
コンピュータ可読媒体上に実施されたプログラム・コードは、無線、有線、光ファイバ・ケーブル、RFなど、あるいは上記のものの任意の適切な組み合わせを含むがこれらに限定されない任意の適切な媒体を使用して伝送することができる。
本発明の諸態様に関する動作を実行するためのコンピュータ・プログラム・コードは、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語あるいは「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで作成することができる。プログラム・コードは、完全にユーザのコンピュータ上で、一部分はユーザのコンピュータ上で、スタンドアロン・ソフトウェア・パッケージとして、一部分はユーザのコンピュータ上でしかも一部分はリモート・コンピュータ上で、あるいは完全にリモート・コンピュータまたはサーバ上で実行することができる。後者のシナリオでは、ローカル・エリア・ネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを介してリモート・コンピュータがユーザのコンピュータに接続される場合もあれば、(たとえば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに接続が行われる場合もある。
本発明の諸態様は、本発明の諸実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品の流れ図あるいはブロック図またはその両方に関連して記載されている。流れ図あるいはブロック図またはその両方の各ブロックおよび流れ図あるいはブロック図またはその両方内の複数ブロックの組み合わせは、コンピュータ・プログラム命令によって実現可能であることが理解されるであろう。これらのコンピュータ・プログラム命令は、汎用コンピュータ、特殊目的コンピュータ、またはその他のプログラマブル・データ処理装置のプロセッサに提供し、コンピュータまたはその他のプログラマブル・データ処理装置のプロセッサにより実行された命令が流れ図あるいはブロック図またはその両方の1つまたは複数のブロックに指定された機能/行為を実現するための手段を作成するようなマシンを生産することができる。また、これらのコンピュータ・プログラム命令は、コンピュータ可読媒体に保管された命令が流れ図あるいはブロック図またはその両方の1つまたは複数のブロックに指定された機能/行為を実現する命令を含む装置(article of manufacture)を生産するような特定の方法で機能するよう、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイスに指示することができるコンピュータ可読媒体に保管することもできる。
また、コンピュータ・プログラム命令は、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイス上にロードし、コンピュータまたはその他のプログラマブル装置上で実行された命令が流れ図あるいはブロック図またはその両方の1つまたは複数のブロックに指定された機能/行為を実現するためのプロセスを提供するようなコンピュータによって実行されるプロセスを生産するように、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイス上で一連の動作ステップを実行させることもできる。
図面内の流れ図およびブロック図は、本発明の様々な諸実施形態によるシステム、方法、およびコンピュータ・プログラム製品について可能な実現例のアーキテクチャ、機能、および動作を例示している。この点に関しては、流れ図またはブロック図内の各ブロックは、指定の論理機能(複数も可)を実現するための1つまたは複数の実行可能命令を含む、コードのモジュール、セグメント、または一部分を表すことができる。
また、いくつかの代替実現例では、ブロック内に示された機能は図面内に示された順序から外れて行われる可能性があることに留意されたい。たとえば、連続して示されている2つのブロックは、関係する機能次第で、実際にはほぼ同時に実行される場合もあれば、ときには逆の順序で実行される場合もある。また、ブロック図あるいは流れ図またはその両方の各ブロックおよびブロック図あるいは流れ図またはその両方内の複数ブロックの組み合わせは、指定の機能または行為を実行する特殊目的ハードウェアベースのシステムあるいは特殊目的ハードウェアとコンピュータ命令との組み合わせによって実現可能であることも留意されるであろう。
上記の諸実施形態は説明のための例であり、本発明がこれらの特定の諸実施形態に限定されると解釈してはならない。したがって、当業者であれば、特許請求の範囲に定義されている本発明の精神または範囲を逸脱せずに、様々な変更および修正を行うことができる。

Claims (25)

  1. 質問に対する解答を自動的に生成するためのコンピュータによって実行される方法であって、
    入力照会に関連する字句解答タイプ(LAT)を決定するステップと、
    前記入力照会LATに関する第1のスコアを計算するステップであって、前記第1のスコアが前記照会LATの品質を示すステップと、
    情報源から前記入力照会に対する候補解答を入手するステップと、
    前記候補解答に関する解答タイプ(AT)を決定するステップと、
    前記照会LATと前記候補解答ATを比較するステップと、
    前記比較した照会LATと前記候補解答ATとの一致度を表す第2のスコアを計算するステップと、
    前記第1のスコアと前記第2のスコアを結合して、前記候補解答の品質を示す合計スコアを提供するステップと
    を含み、
    処理装置が、前記照会LATを決定することと、前記第1のスコアおよび第2のスコアを計算することと、候補解答を入手することと、ATを決定することと、比較することと、結合することのうちの1つまたは複数を自動的に実行する、コンピュータによって実行される方法。
  2. 前記入力照会に関連する前記照会LATに関する第1のスコアを計算することが、
    前記決定された照会LATを記述する特徴のセットを抽出することと、
    前記特徴セットにモデルを適用して、前記決定された照会LATの推定正確度を表すLAT信頼値を生成することであって、前記第1のスコアが前記信頼値を含むこと
    を含む、請求項1記載のコンピュータによって実行される方法。
  3. 前記適用されたモデルが、訓練インスタンスの以前のセットから手動でまたは自動的に構築されたロジスティック回帰モデルまたは決定木モデルのうちの1つまたは複数である、請求項2記載のコンピュータによって実行される方法。
  4. 前記抽出された特徴セットのうちの1つの特徴がパターン・ルールを含み、前記特徴のセットを抽出することが、
    前記照会に関連する構文パターン・ルールを識別することであって、前記パターン・ルールが共通LATを定義する1組のパターン・ルールから識別されること
    を含む、請求項2記載のコンピュータによって実行される方法。
  5. 前記抽出された特徴セットのうちの1つの特徴が照会ワードが候補LATである頻度を含み、前記特徴のセットを抽出することが、
    検出されたLATワードの前のインスタンスをチェックすることと、
    前記前のインスタンスに基づいてLATワード頻度を計算すること
    をさらに含む、請求項2記載のコンピュータによって実行される方法。
  6. 前記抽出された特徴セットのうちの1つの特徴が前記候補LATの品詞を含み、前記特徴のセットを抽出することが、
    前記照会に関連する解析木データ構造を入手することと、
    前記解析木をトラバースして、前記候補LATに関連するワード間の文法関係を識別すること
    をさらに含む、請求項2記載のコンピュータによって実行される方法。
  7. 前記抽出された特徴セットのうちの1つの特徴が同一指示情報を含み、前記特徴のセットを抽出することが、前記候補LATワードがLATとして認識された前記照会内の他の何らかのワードを同一指示するかどうかを判断することをさらに含む、請求項2記載のコンピュータによって実行される方法。
  8. 前記抽出された特徴セットのうちの1つまたは複数の特徴が並行して抽出される、請求項2記載のコンピュータによって実行される方法。
  9. 前記比較した照会LATと前記候補解答ATとの一致度を表す第2のスコアを計算することが、
    前記候補解答をコーパスまたは知識ベース内のインスタンスと突き合わせることと、
    前記コーパスまたは前記知識ベース内のインスタンスに関連するタイプを取り出すことと、
    前記照会LATを前記取り出されたタイプと突き合わせてタイプ強制(TyCor)値を生成することであって、前記第2のスコアが前記TyCor値を含むこと
    を含む、請求項2記載のコンピュータによって実行される方法。
  10. 1つの照会がn個までの候補LATを有し、結合して前記合計スコアを提供することが、
    (信頼スコアLAT1)(TyCorLAT1)+(信頼スコアLAT2)(TyCorLAT2)+・・・+(信頼スコアLATn)(TyCorLATn
    による加算であり、ここで、信頼スコアLAT1、信頼スコアLAT2、および信頼スコアLATnは前記照会のそれぞれの決定されたLATの推定正確度を表す生成された信頼値であり、TyCorLAT1、TyCorLAT2、およびTyCorLATnはそれぞれのLATを有する候補解答の生成されたタイプ強制(TyCor)値である、請求項9記載のコンピュータによって実行される方法。
  11. 質問に対する解答を自動的に生成するためのシステムであって、
    メモリ・ストレージ・デバイスと、
    それぞれが前記メモリ・デバイスに通じていて、
    入力照会に関連する字句解答タイプ(LAT)を決定することと、
    前記照会LATに関する第1のスコアを計算することであって、前記第1のスコアが前記照会LATの品質を示すことと、
    情報源から前記入力照会に対する候補解答を入手することと、
    前記候補解答に関する解答タイプ(AT)を決定することと、
    前記照会LATと前記候補解答ATを比較することと、
    前記比較した照会LATと前記候補解答ATとの一致度を表す第2のスコアを計算することと、
    前記第1のスコアと前記第2のスコアを結合して、前記候補解答の品質を示す合計スコアを提供すること
    を含む方法を実行するために構成された1つまたは複数のプロセッサ・デバイスと
    を含む、システム。
  12. 前記照会LATに関する第1のスコアを計算するための前記1つまたは複数のプロセッサ・デバイスが、
    前記決定された照会LATを記述する特徴のセットを抽出することと、
    前記特徴セットにモデルを適用して、前記決定された照会LATの推定正確度を表すLAT信頼値を生成することであって、前記第1のスコアが前記信頼値を含むこと
    によって前記計算ステップを実行するように構成される、請求項11記載のシステム。
  13. 前記1つまたは複数のプロセッサ・デバイスが、訓練インスタンスの以前のセットから手動でまたは自動的に構築されたロジスティック回帰モデルまたは決定木モデルのうちの1つまたは複数を適用するように構成される、請求項12記載のシステム。
  14. 前記抽出された特徴セットのうちの1つの特徴がパターン・ルールを含み、特徴のセットを抽出するための前記1つまたは複数のプロセッサ・デバイスが、
    前記照会に関連する構文パターン・ルールを識別することであって、前記パターン・ルールが共通LATを定義する1組のパターン・ルールから識別されること
    をさらに実行する、請求項12記載のシステム。
  15. 前記抽出された特徴セットのうちの1つの特徴が照会ワードが候補LATである頻度を含み、特徴のセットを抽出するための前記1つまたは複数のプロセッサ・デバイスが、
    検出されたLATワードの前のインスタンスをチェックすることと、
    前記前のインスタンスに基づいてLATワード頻度を計算すること
    をさらに実行する、請求項12記載のシステム。
  16. 前記抽出された特徴セットのうちの1つの特徴が前記候補LATの品詞を含み、特徴のセットを抽出するための前記1つまたは複数のプロセッサ・デバイスが、
    前記照会に関連する解析木データ構造を入手することと、
    前記解析木をトラバースして、前記候補LATに関連するワード間の文法関係を識別すること
    をさらに実行する、請求項12記載のシステム。
  17. 前記抽出された特徴セットのうちの1つの特徴が同一指示情報を含み、特徴のセットを抽出するための前記1つまたは複数のプロセッサ・デバイスが、前記候補LATワードがLATとして認識された前記照会内の他の何らかのワードを同一指示するかどうかを判断することをさらに実行する、請求項12記載のシステム。
  18. 第2のスコアを計算するための前記1つまたは複数のプロセッサ・デバイスが、
    前記候補解答をコーパスまたは知識ベース内のインスタンスと突き合わせることと、
    前記コーパスまたは前記知識ベース内のインスタンスに関連するタイプを取り出すことと、
    前記照会LATを前記取り出されたタイプと突き合わせてタイプ強制(TyCor)値を生成することであって、前記第2のスコアが前記TyCor値を含むこと
    によって前記計算ステップを実行するように構成される、請求項12記載のシステム。
  19. 1つの照会がn個の候補LATを有し、結合して前記合計スコアを提供するための前記1つまたは複数のプロセッサ・デバイスが、
    (信頼スコアLAT1)(TyCorLAT1)+(信頼スコアLAT2)(TyCorLAT2)+・・・+(信頼スコアLATn)(TyCorLATn
    による加算を実行し、ここで、信頼スコアLAT1、信頼スコアLAT2、および信頼スコアLATnはそれぞれの決定された照会LATの推定正確度を表す生成された信頼値であり、TyCorLAT1、TyCorLAT2、およびTyCorLATnはそれぞれのLATを有する候補解答の生成されたタイプ強制(TyCor)値である、請求項18記載のシステム。
  20. 質問に対する解答を自動的に生成するためのコンピュータ・プログラム製品であって、前記コンピュータ・プログラム装置が、処理装置によって読み取り可能で、ある方法を実行するために前記処理回路によって実行される命令を保管する記憶媒体を含み、前記方法が、
    入力照会に関連する字句解答タイプ(LAT)を決定することと、
    前記照会LATに関する第1のスコアを計算することであって、前記第1のスコアが前記照会LATの品質を示すことと、
    情報源から前記入力照会に対する候補解答を入手することと、
    前記候補解答に関する解答タイプ(AT)を決定することと、
    前記照会LATと前記候補解答ATを比較することと、
    前記比較した照会LATと前記候補解答ATとの一致度を表す第2のスコアを計算することと、
    前記第1のスコアと前記第2のスコアを結合して、前記候補解答の品質を示す合計スコアを提供すること
    を含む、コンピュータ・プログラム製品。
  21. 前記入力照会に関連するそれぞれのLATに関する第1のスコアを計算することが、
    前記算出された照会LATを記述する特徴のセットを抽出することと、
    前記特徴セットにモデルを適用して、前記決定された照会LATの推定正確度を表すLAT信頼値を生成することであって、前記第1のスコアが前記信頼値を含むこと
    を含む、請求項20記載の質問に対する解答を自動的に生成するためのコンピュータ・プログラム製品。
  22. 前記抽出された特徴セットのうちの第1の特徴がパターン・ルールを含み、前記特徴のセットを抽出することが、前記照会に関連する構文パターン・ルールを識別することであって、前記パターン・ルールが共通LATを定義する1組のパターン・ルールから識別されることを含み、
    前記抽出された特徴セットのうちの第2の特徴が照会ワードが候補LATである頻度を含み、前記特徴のセットを抽出することが、検出されたLATワードの前のインスタンスをチェックすることと、前記前のインスタンスに基づいてLATワード頻度を計算することをさらに含み、
    前記抽出された特徴セットのうちの第3の特徴が前記候補LATの品詞を含み、前記特徴のセットを抽出することが、前記照会に関連する解析木データ構造を入手することと、前記解析木をトラバースして、前記候補LATに関連するワード間の文法関係を識別することをさらに含み、
    前記抽出された特徴セットのうちの第4の特徴が同一指示情報を含み、前記特徴のセットを抽出することが、前記候補LATワードがLATとして認識された前記照会内の他の何らかのワードを同一指示するかどうかを判断することをさらに含む、請求項21記載の質問に対する解答を自動的に生成するためのコンピュータ・プログラム製品。
  23. テキスト・ストリングを含む照会から特徴を抽出するための方法であって、前記方法が、
    前記照会に関連する構文パターン・ルールを識別することであって、前記パターン・ルールが共通字句解答タイプ(LAT)を定義する1組のパターン・ルールから識別され、前記抽出された特徴のうちの第1の特徴が識別されたパターン・ルールを含むことと、
    検出された字句解答タイプ(LAT)の前のインスタンスについてチェックし、前記前のインスタンスに基づいてLATワード頻度を計算することであって、前記抽出された特徴のうちの第2の特徴が照会ワードが候補LATである算出頻度を含むことと、
    前記照会に関連する解析木データ構造を入手することと、
    前記解析木構造内の前記候補LATに関連するワード間の文法関係を識別することであって、前記抽出された特徴のうちの第3の特徴が前記候補LATの品詞を含むことと、
    前記候補LATワードがLATとして認識された前記照会内の他の何らかのワードを同一指示するかどうかを判断することであって、前記抽出された特徴のうちの第4の特徴が同一指示情報を含み、1つまたは複数のプログラミングされたプロセッサ・デバイスが、前記構文パターン・ルールを識別することと、前のインスタンスについてチェックすることと、前記解析木データ構造を入手することと、文法関係を識別することと、LATワード同一指示を判断することを実行すること
    を含む、特徴を抽出するための方法。
  24. 前記1つまたは複数のプログラミングされたプロセッサ・デバイスが、前記1つまたは複数の第1、第2、第3、および第4の特徴を並行して抽出することを実行する、請求項23記載の特徴を抽出するための方法。
  25. 前記抽出された第1、第2、第3、および第4の特徴にモデルを適用して、検出された照会LATの推定正確度を表す信頼値を生成すること
    をさらに含む、請求項23記載の特徴を抽出するための方法。
JP2013530286A 2010-09-24 2011-09-21 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム Active JP5816936B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38602910P 2010-09-24 2010-09-24
US61/386,029 2010-09-24
PCT/US2011/052586 WO2012040350A1 (en) 2010-09-24 2011-09-21 Lexical answer type confidence estimation and application

Publications (2)

Publication Number Publication Date
JP2013543172A true JP2013543172A (ja) 2013-11-28
JP5816936B2 JP5816936B2 (ja) 2015-11-18

Family

ID=45871031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013530286A Active JP5816936B2 (ja) 2010-09-24 2011-09-21 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム

Country Status (6)

Country Link
US (5) US8510296B2 (ja)
EP (1) EP2616974A4 (ja)
JP (1) JP5816936B2 (ja)
CN (1) CN103221952B (ja)
CA (1) CA2812338C (ja)
WO (1) WO2012040350A1 (ja)

Families Citing this family (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101173561B1 (ko) * 2010-10-25 2012-08-13 한국전자통신연구원 질문 형태 및 도메인 인식 장치 및 그 방법
US9087048B2 (en) 2011-06-10 2015-07-21 Linkedin Corporation Method of and system for validating a fact checking system
US8768782B1 (en) * 2011-06-10 2014-07-01 Linkedin Corporation Optimized cloud computing fact checking
CN102903008B (zh) * 2011-07-29 2016-05-18 国际商业机器公司 用于计算机问答的方法及系统
US9229974B1 (en) 2012-06-01 2016-01-05 Google Inc. Classifying queries
US8768049B2 (en) * 2012-07-13 2014-07-01 Seiko Epson Corporation Small vein image recognition and authorization using constrained geometrical matching and weighted voting under generic tree model
CN109583591A (zh) * 2012-09-20 2019-04-05 伊夫维泽德公司 用于简化的知识工程的方法与系统
US9092988B2 (en) 2012-11-16 2015-07-28 International Business Machines Corporation Multi-dimensional feature merging for open domain question answering
US9483159B2 (en) 2012-12-12 2016-11-01 Linkedin Corporation Fact checking graphical user interface including fact checking icons
US9087122B2 (en) * 2012-12-17 2015-07-21 International Business Machines Corporation Corpus search improvements using term normalization
US9753986B2 (en) * 2012-12-17 2017-09-05 International Business Machines Corporation Multi-dimensional feature merging for supporting evidence in a question and answering system
US9754215B2 (en) * 2012-12-17 2017-09-05 Sinoeast Concept Limited Question classification and feature mapping in a deep question answering system
CN103870528B (zh) * 2012-12-17 2018-04-17 东方概念有限公司 深度问题回答系统中的问题分类和特征映射的方法和系统
CN103150331A (zh) * 2013-01-24 2013-06-12 北京京东世纪贸易有限公司 一种提供搜索引擎标签的方法和装置
US9535899B2 (en) * 2013-02-20 2017-01-03 International Business Machines Corporation Automatic semantic rating and abstraction of literature
US9262938B2 (en) 2013-03-15 2016-02-16 International Business Machines Corporation Combining different type coercion components for deferred type evaluation
US9201865B2 (en) * 2013-03-15 2015-12-01 Bao Tran Automated assistance for user request that determines semantics by domain, task, and parameter
US8935272B2 (en) 2013-03-17 2015-01-13 Alation, Inc. Curated answers community automatically populated through user query monitoring
US9613317B2 (en) 2013-03-29 2017-04-04 International Business Machines Corporation Justifying passage machine learning for question and answer systems
US9621601B2 (en) 2013-03-29 2017-04-11 International Business Machines Corporation User collaboration for answer generation in question and answer system
EP2994826B1 (en) * 2013-05-07 2019-08-07 Psigenics Corporation Acquisition and assessment of classically non-inferable information
US20140337355A1 (en) * 2013-05-13 2014-11-13 Gnoetics, Inc. Indexed Natural Language Processing
US9336485B2 (en) * 2013-06-11 2016-05-10 International Business Machines Corporation Determining answers in a question/answer system when answer is not contained in corpus
US9275115B2 (en) * 2013-07-16 2016-03-01 International Business Machines Corporation Correlating corpus/corpora value from answered questions
US9442977B2 (en) 2013-09-06 2016-09-13 Sap Se Database language extended to accommodate entity-relationship models
US9619552B2 (en) 2013-09-06 2017-04-11 Sap Se Core data services extensibility for entity-relationship models
US9361407B2 (en) 2013-09-06 2016-06-07 Sap Se SQL extended with transient fields for calculation expressions in enhanced data models
US9354948B2 (en) 2013-09-06 2016-05-31 Sap Se Data models containing host language embedded constraints
US9575819B2 (en) 2013-09-06 2017-02-21 Sap Se Local buffers for event handlers
US9176801B2 (en) 2013-09-06 2015-11-03 Sap Se Advanced data models containing declarative and programmatic constraints
US9639572B2 (en) 2013-09-06 2017-05-02 Sap Se SQL enhancements simplifying database querying
US9430523B2 (en) 2013-09-06 2016-08-30 Sap Se Entity-relationship model extensions using annotations
US20150127323A1 (en) * 2013-11-04 2015-05-07 Xerox Corporation Refining inference rules with temporal event clustering
US9298802B2 (en) 2013-12-03 2016-03-29 International Business Machines Corporation Recommendation engine using inferred deep similarities for works of literature
US9558263B2 (en) 2013-12-05 2017-01-31 International Business Machines Corporation Identifying and displaying relationships between candidate answers
US9460085B2 (en) 2013-12-09 2016-10-04 International Business Machines Corporation Testing and training a question-answering system
US20150170084A1 (en) * 2013-12-12 2015-06-18 International Business Machines Corporation Augmenting business process execution using natural language processing
US9684709B2 (en) 2013-12-14 2017-06-20 Microsoft Technology Licensing, Llc Building features and indexing for knowledge-based matching
US9779141B2 (en) * 2013-12-14 2017-10-03 Microsoft Technology Licensing, Llc Query techniques and ranking results for knowledge-based matching
US9413855B2 (en) 2013-12-17 2016-08-09 International Business Machines Corporation Expanding an answer key to verify a question and answer system
US10339453B2 (en) 2013-12-23 2019-07-02 International Business Machines Corporation Automatically generating test/training questions and answers through pattern based analysis and natural language processing techniques on the given corpus for quick domain adaptation
US10210156B2 (en) * 2014-01-10 2019-02-19 International Business Machines Corporation Seed selection in corpora compaction for natural language processing
US9959315B1 (en) * 2014-01-31 2018-05-01 Google Llc Context scoring adjustments for answer passages
US9536443B2 (en) * 2014-04-28 2017-01-03 International Business Machines Corporation Evaluating expert opinions in a question and answer system
US20190018893A1 (en) * 2014-05-12 2019-01-17 Google Inc. Determining tone differential of a segment
US9607035B2 (en) 2014-05-21 2017-03-28 International Business Machines Corporation Extensible validation framework for question and answer systems
US9569503B2 (en) * 2014-05-23 2017-02-14 International Business Machines Corporation Type evaluation in a question-answering system
US9471689B2 (en) 2014-05-29 2016-10-18 International Business Machines Corporation Managing documents in question answering systems
US9697099B2 (en) 2014-06-04 2017-07-04 International Business Machines Corporation Real-time or frequent ingestion by running pipeline in order of effectiveness
US9542496B2 (en) 2014-06-04 2017-01-10 International Business Machines Corporation Effective ingesting data used for answering questions in a question and answer (QA) system
US9619513B2 (en) * 2014-07-29 2017-04-11 International Business Machines Corporation Changed answer notification in a question and answer system
US9703840B2 (en) 2014-08-13 2017-07-11 International Business Machines Corporation Handling information source ingestion in a question answering system
US9916375B2 (en) 2014-08-15 2018-03-13 International Business Machines Corporation Extraction of concept-based summaries from documents
US10366621B2 (en) * 2014-08-26 2019-07-30 Microsoft Technology Licensing, Llc Generating high-level questions from sentences
US9189514B1 (en) * 2014-09-04 2015-11-17 Lucas J. Myslinski Optimized fact checking method and system
US20160070791A1 (en) * 2014-09-05 2016-03-10 Chegg, Inc. Generating Search Engine-Optimized Media Question and Answer Web Pages
US9613093B2 (en) 2014-10-16 2017-04-04 International Business Machines Corporation Using question answering (QA) systems to identify answers and evidence of different medium types
US9690862B2 (en) * 2014-10-18 2017-06-27 International Business Machines Corporation Realtime ingestion via multi-corpus knowledge base with weighting
CN104298658B (zh) * 2014-10-29 2017-11-17 百度在线网络技术(北京)有限公司 获取搜索结果的方法和装置
US11100557B2 (en) 2014-11-04 2021-08-24 International Business Machines Corporation Travel itinerary recommendation engine using inferred interests and sentiments
US20160125437A1 (en) * 2014-11-05 2016-05-05 International Business Machines Corporation Answer sequence discovery and generation
US9792549B2 (en) 2014-11-21 2017-10-17 International Business Machines Corporation Extraction of semantic relations using distributional relation detection
US10331673B2 (en) * 2014-11-24 2019-06-25 International Business Machines Corporation Applying level of permanence to statements to influence confidence ranking
US10387793B2 (en) * 2014-11-25 2019-08-20 International Business Machines Corporation Automatic generation of training cases and answer key from historical corpus
US10176228B2 (en) 2014-12-10 2019-01-08 International Business Machines Corporation Identification and evaluation of lexical answer type conditions in a question to generate correct answers
US10380246B2 (en) * 2014-12-18 2019-08-13 International Business Machines Corporation Validating topical data of unstructured text in electronic forms to control a graphical user interface based on the unstructured text relating to a question included in the electronic form
US20160196490A1 (en) * 2015-01-02 2016-07-07 International Business Machines Corporation Method for Recommending Content to Ingest as Corpora Based on Interaction History in Natural Language Question and Answering Systems
US9384450B1 (en) * 2015-01-22 2016-07-05 International Business Machines Corporation Training machine learning models for open-domain question answering system
US10475043B2 (en) 2015-01-28 2019-11-12 Intuit Inc. Method and system for pro-active detection and correction of low quality questions in a question and answer based customer support system
US9684876B2 (en) 2015-03-30 2017-06-20 International Business Machines Corporation Question answering system-based generation of distractors using machine learning
US9703617B2 (en) * 2015-04-15 2017-07-11 International Business Machines Corporation Automated transfer of user data between applications utilizing different interaction modes
US9881166B2 (en) * 2015-04-16 2018-01-30 International Business Machines Corporation Multi-focused fine-grained security framework
US10755294B1 (en) 2015-04-28 2020-08-25 Intuit Inc. Method and system for increasing use of mobile devices to provide answer content in a question and answer based customer support system
US9953265B2 (en) 2015-05-08 2018-04-24 International Business Machines Corporation Visual summary of answers from natural language question answering systems
US10169326B2 (en) 2015-05-22 2019-01-01 International Business Machines Corporation Cognitive reminder notification mechanisms for answers to questions
US9912736B2 (en) 2015-05-22 2018-03-06 International Business Machines Corporation Cognitive reminder notification based on personal user profile and activity information
US10152534B2 (en) 2015-07-02 2018-12-11 International Business Machines Corporation Monitoring a corpus for changes to previously provided answers to questions
US10592540B2 (en) 2015-07-07 2020-03-17 Google Llc Generating elements of answer-seeking queries and elements of answers
US10475044B1 (en) 2015-07-29 2019-11-12 Intuit Inc. Method and system for question prioritization based on analysis of the question content and predicted asker engagement before answer content is generated
US10628413B2 (en) * 2015-08-03 2020-04-21 International Business Machines Corporation Mapping questions to complex database lookups using synthetic events
US10628521B2 (en) * 2015-08-03 2020-04-21 International Business Machines Corporation Scoring automatically generated language patterns for questions using synthetic events
KR20180108562A (ko) * 2015-09-02 2018-10-04 아이덴티포, 인크. 지능형 가상 어시스턴트 시스템들 및 관련 방법들
CN106547785B (zh) * 2015-09-22 2020-08-04 阿里巴巴集团控股有限公司 知识库中信息获取方法和系统
US10769185B2 (en) 2015-10-16 2020-09-08 International Business Machines Corporation Answer change notifications based on changes to user profile information
US10795878B2 (en) 2015-10-23 2020-10-06 International Business Machines Corporation System and method for identifying answer key problems in a natural language question and answering system
US10586161B2 (en) * 2015-11-03 2020-03-10 International Business Machines Corporation Cognitive visual debugger that conducts error analysis for a question answering system
US11048737B2 (en) * 2015-11-16 2021-06-29 International Business Machines Corporation Concept identification in a question answering system
US9646250B1 (en) * 2015-11-17 2017-05-09 International Business Machines Corporation Computer-implemented cognitive system for assessing subjective question-answers
US10229188B2 (en) * 2015-12-04 2019-03-12 International Business Machines Corporation Automatic corpus expansion using question answering techniques
US11227113B2 (en) * 2016-01-20 2022-01-18 International Business Machines Corporation Precision batch interaction with a question answering system
US9842096B2 (en) * 2016-05-12 2017-12-12 International Business Machines Corporation Pre-processing for identifying nonsense passages in documents being ingested into a corpus of a natural language processing system
US10169328B2 (en) 2016-05-12 2019-01-01 International Business Machines Corporation Post-processing for identifying nonsense passages in a question answering system
US10585898B2 (en) * 2016-05-12 2020-03-10 International Business Machines Corporation Identifying nonsense passages in a question answering system based on domain specific policy
US10769537B2 (en) 2016-06-21 2020-09-08 International Business Machines Corporation Cognitive question answering pipeline blending
US10902330B2 (en) 2016-06-21 2021-01-26 International Business Machines Corporation Cognitive question answering pipeline calibrating
US10607153B2 (en) 2016-06-28 2020-03-31 International Business Machines Corporation LAT based answer generation using anchor entities and proximity
JP6929539B2 (ja) * 2016-10-07 2021-09-01 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
US11704551B2 (en) 2016-10-12 2023-07-18 Microsoft Technology Licensing, Llc Iterative query-based analysis of text
US10572954B2 (en) 2016-10-14 2020-02-25 Intuit Inc. Method and system for searching for and navigating to user content and other user experience pages in a financial management system with a customer self-service system for the financial management system
US10733677B2 (en) 2016-10-18 2020-08-04 Intuit Inc. Method and system for providing domain-specific and dynamic type ahead suggestions for search query terms with a customer self-service system for a tax return preparation system
US10552843B1 (en) 2016-12-05 2020-02-04 Intuit Inc. Method and system for improving search results by recency boosting customer support content for a customer self-help system associated with one or more financial management systems
US10685047B1 (en) * 2016-12-08 2020-06-16 Townsend Street Labs, Inc. Request processing system
CN106682194B (zh) * 2016-12-29 2020-05-22 北京百度网讯科技有限公司 基于深度问答的答案定位方法及装置
US10303763B2 (en) 2017-01-06 2019-05-28 International Business Machines Corporation Process for identifying completion of domain adaptation dictionary activities
US10748157B1 (en) 2017-01-12 2020-08-18 Intuit Inc. Method and system for determining levels of search sophistication for users of a customer self-help system to personalize a content search user experience provided to the users and to increase a likelihood of user satisfaction with the search experience
US20180203856A1 (en) * 2017-01-17 2018-07-19 International Business Machines Corporation Enhancing performance of structured lookups using set operations
US11087087B1 (en) * 2017-02-15 2021-08-10 Robert Mayer Comparative expression processing
US10957314B2 (en) 2017-03-02 2021-03-23 Microsoft Technology Licensing, Llc Developer platform for providing automated assistant in new domains
EP3590050A4 (en) * 2017-03-02 2021-01-20 Microsoft Technology Licensing, LLC DEVELOPER PLATFORM TO PROVIDE AN AUTOMATED ASSISTANT IN NEW DOMAINS
US10073831B1 (en) 2017-03-09 2018-09-11 International Business Machines Corporation Domain-specific method for distinguishing type-denoting domain terms from entity-denoting domain terms
US10540409B2 (en) * 2017-05-01 2020-01-21 International Business Machines Corporation Categorized social opinions as answers to questions
JP2018194980A (ja) * 2017-05-15 2018-12-06 富士通株式会社 判定プログラム、判定方法および判定装置
US10817483B1 (en) 2017-05-31 2020-10-27 Townsend Street Labs, Inc. System for determining and modifying deprecated data entries
US10891295B2 (en) * 2017-06-04 2021-01-12 Apple Inc. Methods and systems using linear expressions for machine learning models to rank search results
US10769138B2 (en) 2017-06-13 2020-09-08 International Business Machines Corporation Processing context-based inquiries for knowledge retrieval
US10922367B2 (en) 2017-07-14 2021-02-16 Intuit Inc. Method and system for providing real time search preview personalization in data management systems
US11144602B2 (en) 2017-08-31 2021-10-12 International Business Machines Corporation Exploiting answer key modification history for training a question and answering system
US11093951B1 (en) 2017-09-25 2021-08-17 Intuit Inc. System and method for responding to search queries using customer self-help systems associated with a plurality of data management systems
US11436642B1 (en) 2018-01-29 2022-09-06 Intuit Inc. Method and system for generating real-time personalized advertisements in data management self-help systems
US11157564B2 (en) 2018-03-02 2021-10-26 Thoughtspot, Inc. Natural language question answering systems
CN110569335B (zh) * 2018-03-23 2022-05-27 百度在线网络技术(北京)有限公司 基于人工智能的三元组校验方法、装置及存储介质
US11269665B1 (en) 2018-03-28 2022-03-08 Intuit Inc. Method and system for user experience personalization in data management systems using machine learning
US10795886B1 (en) 2018-03-30 2020-10-06 Townsend Street Labs, Inc. Dynamic query routing system
US11113117B2 (en) * 2018-06-05 2021-09-07 Vmware, Inc. Clustering routines for extrapolating computing resource metrics
US10657204B2 (en) * 2018-07-17 2020-05-19 International Business Machines Corporation Method for improving the accuracy of a statement
US11562135B2 (en) 2018-10-16 2023-01-24 Oracle International Corporation Constructing conclusive answers for autonomous agents
US11822588B2 (en) 2018-10-24 2023-11-21 International Business Machines Corporation Supporting passage ranking in question answering (QA) system
US11568234B2 (en) 2018-11-15 2023-01-31 International Business Machines Corporation Training a neural network based on temporal changes in answers to factoid questions
US11106717B2 (en) * 2018-11-19 2021-08-31 International Business Machines Corporation Automatic identification and clustering of patterns
US10872206B2 (en) 2018-12-03 2020-12-22 Bank Of America Corporation System and framework for dynamic regulatory change management
US10831989B2 (en) 2018-12-04 2020-11-10 International Business Machines Corporation Distributing updated communications to viewers of prior versions of the communications
US11803556B1 (en) 2018-12-10 2023-10-31 Townsend Street Labs, Inc. System for handling workplace queries using online learning to rank
US11281936B2 (en) * 2018-12-31 2022-03-22 Kofax, Inc. Systems and methods for identifying processes for robotic automation and building models therefor
US11132390B2 (en) 2019-01-15 2021-09-28 International Business Machines Corporation Efficient resolution of type-coercion queries in a question answer system using disjunctive sub-lexical answer types
US11093491B2 (en) 2019-01-16 2021-08-17 International Business Machines Corporation Question answering system using topic-sensitive source reliability scoring
US11321536B2 (en) * 2019-02-13 2022-05-03 Oracle International Corporation Chatbot conducting a virtual social dialogue
US10885045B2 (en) 2019-03-07 2021-01-05 Wipro Limited Method and system for providing context-based response for a user query
US11238027B2 (en) 2019-03-22 2022-02-01 International Business Machines Corporation Dynamic document reliability formulation
US11586973B2 (en) * 2019-03-22 2023-02-21 International Business Machines Corporation Dynamic source reliability formulation
US20200327379A1 (en) * 2019-04-09 2020-10-15 GE Precision Healthcare LLC Fastestimator healthcare ai framework
US11442932B2 (en) 2019-07-16 2022-09-13 Thoughtspot, Inc. Mapping natural language to queries using a query grammar
CN112241449A (zh) * 2019-07-18 2021-01-19 周乃杰 问答系统
US20210287128A1 (en) * 2019-08-08 2021-09-16 Lg Electronics Inc. Artificial intelligence server
US11531707B1 (en) 2019-09-26 2022-12-20 Okta, Inc. Personalized search based on account attributes
CN110781663B (zh) * 2019-10-28 2023-08-29 北京金山数字娱乐科技有限公司 文本分析模型的训练方法及装置、文本分析方法及装置
CN110990546B (zh) * 2019-11-29 2023-11-17 中国银行股份有限公司 智能问答语料库更新方法和装置
US11762810B2 (en) 2020-05-08 2023-09-19 International Business Machines Corporation Identification of restrictors to form unique descriptions for generation of answers to questions
US11914967B2 (en) 2020-06-26 2024-02-27 Raytheon Company Question answering models in closed domains
US11907863B2 (en) * 2020-07-24 2024-02-20 International Business Machines Corporation Natural language enrichment using action explanations
US11797517B2 (en) * 2021-06-21 2023-10-24 Yahoo Assets Llc Public content validation and presentation method and apparatus
CN113468176B (zh) * 2021-06-30 2023-09-26 北京百度网讯科技有限公司 信息录入方法和装置、电子设备、计算机可读存储介质
US20230177430A1 (en) * 2021-12-07 2023-06-08 International Business Machines Corporation Streamlining project requests for information

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122533A (ja) * 2003-10-17 2005-05-12 National Institute Of Information & Communication Technology 質問応答システムおよび質問応答処理方法
JP2005157524A (ja) * 2003-11-21 2005-06-16 National Institute Of Information & Communication Technology 質問応答システムおよび質問応答処理方法
JP2006293731A (ja) * 2005-04-12 2006-10-26 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20090287678A1 (en) * 2008-05-14 2009-11-19 International Business Machines Corporation System and method for providing answers to questions
US20090292687A1 (en) * 2008-05-23 2009-11-26 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation

Family Cites Families (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3559995A (en) 1968-04-29 1971-02-02 Psychomantic Game Co Question answering gameboard and spinner
JPS5853787B2 (ja) 1979-08-30 1983-12-01 シャープ株式会社 電子辞典
JPS58201175A (ja) 1982-05-20 1983-11-22 Kokusai Denshin Denwa Co Ltd <Kdd> 機械翻訳方式
US4829423A (en) 1983-01-28 1989-05-09 Texas Instruments Incorporated Menu-based natural language understanding system
US5036472A (en) 1988-12-08 1991-07-30 Hallmark Cards, Inc. Computer controlled machine for vending personalized products or the like
US4921427A (en) 1989-08-21 1990-05-01 Dunn Jeffery W Educational device
US5546316A (en) 1990-10-22 1996-08-13 Hallmark Cards, Incorporated Computer controlled system for vending personalized products
US5559714A (en) 1990-10-22 1996-09-24 Hallmark Cards, Incorporated Method and apparatus for display sequencing personalized social occasion products
JP2804403B2 (ja) 1991-05-16 1998-09-24 インターナショナル・ビジネス・マシーンズ・コーポレイション 質問回答システム
US5374894A (en) 1992-08-19 1994-12-20 Hyundai Electronics America Transition detection circuit
CA2175187A1 (en) 1993-10-28 1995-05-04 William K. Thomson Database search summary with user determined characteristics
US5550746A (en) 1994-12-05 1996-08-27 American Greetings Corporation Method and apparatus for storing and selectively retrieving product data by correlating customer selection criteria with optimum product designs based on embedded expert judgments
US5794050A (en) 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US6061675A (en) 1995-05-31 2000-05-09 Oracle Corporation Methods and apparatus for classifying terminology utilizing a knowledge catalog
US6189002B1 (en) 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US7181438B1 (en) 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US7630986B1 (en) * 1999-10-27 2009-12-08 Pinpoint, Incorporated Secure data interchange
US6947885B2 (en) 2000-01-18 2005-09-20 At&T Corp. Probabilistic model for natural language generation
US6829603B1 (en) 2000-02-02 2004-12-07 International Business Machines Corp. System, method and program product for interactive natural dialog
JP2001297259A (ja) 2000-04-13 2001-10-26 Fujitsu Ltd 質問応答システム
US7831688B2 (en) * 2000-06-06 2010-11-09 Adobe Systems Incorporated Method and system for providing electronic user assistance
US8396859B2 (en) 2000-06-26 2013-03-12 Oracle International Corporation Subject matter context search engine
JP2002041540A (ja) 2000-07-28 2002-02-08 Shinichiro Okude 連想・推論機能を備えた検索システムおよび、それに用いられる、記録媒体献金
US7092928B1 (en) 2000-07-31 2006-08-15 Quantum Leap Research, Inc. Intelligent portal engine
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
AU2002237495A1 (en) 2001-03-13 2002-09-24 Intelligate Ltd. Dynamic natural language understanding
EP1255189B1 (en) 2001-05-04 2008-10-08 Microsoft Corporation Interface control
US7409335B1 (en) * 2001-06-29 2008-08-05 Microsoft Corporation Inferring informational goals and preferred level of detail of answers based on application being employed by the user
US6732090B2 (en) 2001-08-13 2004-05-04 Xerox Corporation Meta-document management system with user definable personalities
US7136909B2 (en) 2001-12-28 2006-11-14 Motorola, Inc. Multimodal communication method and apparatus with multimodal profile
EP1481346B1 (en) * 2002-02-04 2012-10-10 Cataphora, Inc. A method and apparatus to visually present discussions for data mining purposes
WO2003101282A2 (en) * 2002-05-30 2003-12-11 Mclean Hospital Corporation Methods and systems for drug screening and computational modeling
US6946715B2 (en) * 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
JP2004139553A (ja) 2002-08-19 2004-05-13 Matsushita Electric Ind Co Ltd 文書検索システムおよび質問応答システム
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
JP2004118740A (ja) 2002-09-27 2004-04-15 Toshiba Corp 質問応答システム、質問応答方法、質問応答プログラム
US8645122B1 (en) * 2002-12-19 2014-02-04 At&T Intellectual Property Ii, L.P. Method of handling frequently asked questions in a natural language dialog service
US20040122660A1 (en) 2002-12-20 2004-06-24 International Business Machines Corporation Creating taxonomies and training data in multiple languages
EP1440630B1 (en) * 2003-01-22 2006-03-22 Tai Loy Bags Factory Ltd A backpack type satchel with a rain hat and connected cape
US7606714B2 (en) * 2003-02-11 2009-10-20 Microsoft Corporation Natural language classification within an automated response system
US7139752B2 (en) 2003-05-30 2006-11-21 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis, and providing multiple document views derived from different document tokenizations
US8666983B2 (en) 2003-06-13 2014-03-04 Microsoft Corporation Architecture for generating responses to search engine queries
US7454393B2 (en) * 2003-08-06 2008-11-18 Microsoft Corporation Cost-benefit approach to automatically composing answers to questions by extracting information from large unstructured corpora
US20050054927A1 (en) * 2003-09-10 2005-03-10 Scott Love System and method for using scheduled protocol codes to automatically configure ultrasound imaging systems
JP2005092271A (ja) 2003-09-12 2005-04-07 Hitachi Ltd 質問応答方法及び質問応答装置
US20050153263A1 (en) * 2003-10-03 2005-07-14 Scientific Learning Corporation Method for developing cognitive skills in reading
KR100533810B1 (ko) 2003-10-16 2005-12-07 한국전자통신연구원 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법
JP3820242B2 (ja) 2003-10-24 2006-09-13 東芝ソリューション株式会社 質問応答型文書検索システム及び質問応答型文書検索プログラム
US7590606B1 (en) 2003-11-05 2009-09-15 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) Multi-user investigation organizer
JP3944159B2 (ja) 2003-12-25 2007-07-11 株式会社東芝 質問応答システムおよびプログラム
CA2559082A1 (en) * 2004-03-08 2005-09-15 British Telecommunications Public Limited Company Content provisioning method and system
US8612208B2 (en) * 2004-04-07 2013-12-17 Oracle Otc Subsidiary Llc Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
US20060053000A1 (en) 2004-05-11 2006-03-09 Moldovan Dan I Natural language question answering system and method utilizing multi-modal logic
US20050256700A1 (en) 2004-05-11 2005-11-17 Moldovan Dan I Natural language question answering system and method utilizing a logic prover
US20080077570A1 (en) 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US20060106788A1 (en) 2004-10-29 2006-05-18 Microsoft Corporation Computer-implemented system and method for providing authoritative answers to a general information search
US20060122834A1 (en) 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems
US20060141438A1 (en) 2004-12-23 2006-06-29 Inventec Corporation Remote instruction system and method
JP2006221127A (ja) * 2005-01-17 2006-08-24 Fujitsu Ltd 学習プログラム、方法及び装置
US7792829B2 (en) 2005-01-28 2010-09-07 Microsoft Corporation Table querying
US20060183099A1 (en) * 2005-02-14 2006-08-17 Feely Richard A Education and test preparation system, method and computer program product
JP4645242B2 (ja) 2005-03-14 2011-03-09 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2006252382A (ja) 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP4635659B2 (ja) 2005-03-14 2011-02-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20060229909A1 (en) * 2005-04-06 2006-10-12 Sanjeev Kaila Lifecharts medical information system
JP4654745B2 (ja) * 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US8335794B1 (en) 2005-04-28 2012-12-18 Progress Software Corporation Optimizing performance of database middleware
JP4654776B2 (ja) 2005-06-03 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP4654780B2 (ja) 2005-06-10 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US8756245B2 (en) 2005-07-25 2014-06-17 Iac Search & Media, Inc. Systems and methods for answering user questions
US8666928B2 (en) * 2005-08-01 2014-03-04 Evi Technologies Limited Knowledge repository
US20070078842A1 (en) 2005-09-30 2007-04-05 Zola Scot G System and method for responding to a user reference query
CN1952928A (zh) * 2005-10-20 2007-04-25 梁威 建立自然语言知识库及其自动问答检索的计算机系统
US7873624B2 (en) 2005-10-21 2011-01-18 Microsoft Corporation Question answering over structured content on the web
US7831597B2 (en) 2005-11-18 2010-11-09 The Boeing Company Text summarization method and apparatus using a multidimensional subspace
CN101305366B (zh) 2005-11-29 2013-02-06 国际商业机器公司 从非结构化文本提取和显现图表结构化关系的方法和系统
US8832064B2 (en) 2005-11-30 2014-09-09 At&T Intellectual Property Ii, L.P. Answer determination for natural language questioning
US7603330B2 (en) 2006-02-01 2009-10-13 Honda Motor Co., Ltd. Meta learning for question classification
JP2007219955A (ja) * 2006-02-17 2007-08-30 Fuji Xerox Co Ltd 質問応答システム、質問応答処理方法及び質問応答プログラム
WO2007149216A2 (en) 2006-06-21 2007-12-27 Information Extraction Systems An apparatus, system and method for developing tools to process natural language text
US7937402B2 (en) * 2006-07-10 2011-05-03 Nec (China) Co., Ltd. Natural language based location query system, keyword based location query system and a natural language and keyword based location query system
US8145624B1 (en) * 2006-10-31 2012-03-27 At&T Intellectual Property Ii, L.P. Method and apparatus for associating metadata with data
US20100100546A1 (en) 2008-02-08 2010-04-22 Steven Forrest Kohler Context-aware semantic virtual community for communication, information and knowledge management
US7966316B2 (en) * 2008-04-15 2011-06-21 Microsoft Corporation Question type-sensitive answer summarization
US20100138402A1 (en) * 2008-12-02 2010-06-03 Chacha Search, Inc. Method and system for improving utilization of human searchers
US8346701B2 (en) * 2009-01-23 2013-01-01 Microsoft Corporation Answer ranking in community question-answering sites
US20100235343A1 (en) * 2009-03-13 2010-09-16 Microsoft Corporation Predicting Interestingness of Questions in Community Question Answering
US20100235311A1 (en) * 2009-03-13 2010-09-16 Microsoft Corporation Question and answer search
US20100255455A1 (en) * 2009-04-03 2010-10-07 Velozo Steven C Adaptive Assessment
US20100273138A1 (en) * 2009-04-28 2010-10-28 Philip Glenny Edmonds Apparatus and method for automatic generation of personalized learning and diagnostic exercises
US8782069B2 (en) * 2009-06-11 2014-07-15 Chacha Search, Inc Method and system of providing a search tool
US20100318409A1 (en) 2009-06-12 2010-12-16 Accenture Global Services Gmbh Component Based Productivity Measurement
US20100324454A1 (en) * 2009-06-22 2010-12-23 Kircher John C Deception detection using oculomotor movements
US8280838B2 (en) 2009-09-17 2012-10-02 International Business Machines Corporation Evidence evaluation system and method based on question answering
US20110078192A1 (en) * 2009-09-30 2011-03-31 International Business Machines Corporation Inferring lexical answer types of questions from context
US20110106617A1 (en) * 2009-10-29 2011-05-05 Chacha Search, Inc. Method and system of processing a query using human assistants
US8542411B2 (en) * 2010-03-24 2013-09-24 Seiko Epson Corporation Creating and processing a mark-able document
US20110258034A1 (en) * 2010-04-15 2011-10-20 Yahoo! Inc. Hierarchically-structured indexing and retrieval
US9110882B2 (en) * 2010-05-14 2015-08-18 Amazon Technologies, Inc. Extracting structured knowledge from unstructured text

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122533A (ja) * 2003-10-17 2005-05-12 National Institute Of Information & Communication Technology 質問応答システムおよび質問応答処理方法
JP2005157524A (ja) * 2003-11-21 2005-06-16 National Institute Of Information & Communication Technology 質問応答システムおよび質問応答処理方法
JP2006293731A (ja) * 2005-04-12 2006-10-26 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20090287678A1 (en) * 2008-05-14 2009-11-19 International Business Machines Corporation System and method for providing answers to questions
US20090292687A1 (en) * 2008-05-23 2009-11-26 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation

Also Published As

Publication number Publication date
CN103221952A (zh) 2013-07-24
US20160005324A1 (en) 2016-01-07
US20120078890A1 (en) 2012-03-29
WO2012040350A1 (en) 2012-03-29
JP5816936B2 (ja) 2015-11-18
US8600986B2 (en) 2013-12-03
US9805613B2 (en) 2017-10-31
CA2812338C (en) 2019-08-13
US8510296B2 (en) 2013-08-13
US20120323906A1 (en) 2012-12-20
EP2616974A1 (en) 2013-07-24
EP2616974A4 (en) 2016-03-02
CA2812338A1 (en) 2012-03-29
US20160005325A1 (en) 2016-01-07
US9240128B2 (en) 2016-01-19
CN103221952B (zh) 2016-01-20
US20120077178A1 (en) 2012-03-29
US9965971B2 (en) 2018-05-08

Similar Documents

Publication Publication Date Title
JP5816936B2 (ja) 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム
US10482115B2 (en) Providing question and answers with deferred type evaluation using text with limited structure
US11144544B2 (en) Providing answers to questions including assembling answers from multiple document segments
US8943051B2 (en) Lexical answer type confidence estimation and application
US9508038B2 (en) Using ontological information in open domain type coercion
US8332394B2 (en) System and method for providing question and answers with deferred type evaluation
US20150269139A1 (en) Automatic Evaluation and Improvement of Ontologies for Natural Language Processing Tasks
US10303766B2 (en) System and method for supplementing a question answering system with mixed-language source documents
Wang et al. NLP-based query-answering system for information extraction from building information models
US11216520B2 (en) Knowledge correlation search engine
Abebe et al. Supporting concept location through identifier parsing and ontology extraction
JP4864095B2 (ja) 知識相関サーチエンジン
Wisniewski et al. SeeQuery: An Automatic Method for Recommending Translations of Ontology Competency Questions into SPARQL-OWL
Bahmid et al. Hybrid question answering using heuristic methods and linked data schema
Liu et al. Automatic short text annotation for question answering system
Ang et al. Ontology-centric, Service-Oriented Enterprise Campaign Management System
Liu et al. Automatic Text Annotation for Questions.
Parramón Teixidó Enriquidor automàtic de la ontologia de Pat. mapa

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140508

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150630

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150728

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150909

R150 Certificate of patent or registration of utility model

Ref document number: 5816936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250