JP2021530818A - 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス - Google Patents
自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス Download PDFInfo
- Publication number
- JP2021530818A JP2021530818A JP2021503796A JP2021503796A JP2021530818A JP 2021530818 A JP2021530818 A JP 2021530818A JP 2021503796 A JP2021503796 A JP 2021503796A JP 2021503796 A JP2021503796 A JP 2021503796A JP 2021530818 A JP2021530818 A JP 2021530818A
- Authority
- JP
- Japan
- Prior art keywords
- database
- node
- query
- keyword
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 112
- 238000013507 mapping Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 27
- 238000005352 clarification Methods 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 69
- 238000007726 management method Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 22
- 238000013459 approach Methods 0.000 description 14
- 238000005065 mining Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000013526 transfer learning Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000010276 construction Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000008520 organization Effects 0.000 description 6
- 239000010454 slate Substances 0.000 description 6
- 230000037361 pathway Effects 0.000 description 5
- 238000013403 standard screening design Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 229910001369 Brass Inorganic materials 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 241000086550 Dinosauria Species 0.000 description 1
- 241000238558 Eucarida Species 0.000 description 1
- 241000272443 Penelope Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 208000013409 limited attention Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000003325 tomography Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本開示は一般にデータベースに関する。より具体的には、本開示は、自然言語クエリをネイティブデータベースクエリに変換することに関する。
本出願は2018年7月25日に提出された米国仮出願62/703,389に対する優先権を主張し、その全体がすべての目的のために本明細書に組み込まれる。
リレーショナルデータベースは、広範囲の照会メカニズムをサポートする構造化クエリ言語(SQL)などの現代の照会言語によってアクセスすることができる。しかし、SQLインターフェイスは、非ソフトウェア開発者がこれらの言語で検索クエリを設計することは困難であり得る。したがって、これらの低品質クエリは、低品質の結果を引き起こす。
本開示は、自然言語クエリをネイティブデータベースクエリに変換することに関する。例えば、データベースアプリケーションは、ユーザから自然言語クエリを受信し、クエリを節に分割し、節からキーワードを判断し、クエリ内のキーワードを、データベースに照会することができるネイティブクエリにマッピングする。自然言語クエリがマッピングされないキーワードを含む場合、アプリケーションは、このあいまいさをユーザデバイスと解決する。キーワードが従来の方法で、例えば、テーブルまたはフィールドへのマッピングを介して、データベースにマッピングできない場合、アプリケーションは、ペア単位一般化(pair-wise generalization)または他の技法を用いて導出された同義語を含むカスタムインデックスに、キーワードをマッピングすることができる。
本開示の態様は、改善されたデータベースシステムに関する。特に、開示されるシステムは、言語学的アプローチおよびキーワードベースのアプローチの両方を用いることによって、自然言語クエリをデータベースクエリに変換する。いくつかの態様はまた、自然言語クエリ内のあいまいな語を識別し、これらのあいまいさを、自律型エージェント(「チャットボット」)を用いることによって解決する。場合によっては、シソーラスを作成および用いて、様々なエンティティ、アクション、または属性を記述するために人々が用いる単語をデータベーステーブルまたはフィールドとマッチングし得る。このようにして、開示される解決策は、既存の解決策と比較して、改善されたデータベースクエリ、したがって、より意味のある結果を提供する。
本明細書で用いられる場合、「データベース」は、編成または構造化されたデータのセットを指す。データベースは、列および行に編成され得る。
図7は、本開示の一態様によるデータベースの一例を示す図である。図7は、NL2SQLで有効化されたサンプルデータベースを示す。より具体的には、図7は、データベースを、図3に示すパースツリー300のマッチングに関連するデータベーステーブルのための関係とともに示す。図7は、(外部キーを指す「fk_」によってプレフィックス付けされる)異なるリンクによってリンクされるデータベーステーブル(例えば、「customer(顧客)」、「country(国)」、「address(住所)」)を示す。そのようなリンクの例は、fk_customer_addressおよびfk_city_countryである。NLクエリ、中間ステップについてのログ、ならびに結果として得られるSQL表現およびクエリ結果の例を以下に示す。
クエリ: 'what is staff first name when her movie return date is after 2005-06-02 01:02:05(彼女の映画返却日が2005-06-02 01:02:05以降の場合のスタッフのファーストネームは何ですか)'
'[staff, first, name]'について table.field を探す
table.field = staff.first_name が見つかる
'[movie, return, date]'について table.field を探す
table.field = rental.return_date が見つかる
結果: Mike
SQL: select staff.first_name from staff, rental where rental.return_date > '2005-06-02 01:02:05' and rental.staff_id = staff.staff_id
クエリ: 'what film title has actor's first name as Christian and category Documentary(俳優のファーストネームがChristianでカテゴリーがドキュメンタリーである映画はどのようなタイトルか)'
'[film, title]'について table.field を探す
table.field = film.title が見つかる
'[actor, first, name]'について table.field を探す
table.field = actor.first_name が見つかる
結果: ACADEMY DINOSAUR |
CUPBOARD SINNERS |
MOD SECRETARY |
PRINCESS GIANT |
SQL: select film.title from film_category, film_actor, film, actor, category where actor.first_name like '%Christian%' and category.name = 'documentary' and film_actor.film_id = film.film_id and film_actor.actor_id = actor.actor_id and film_actor.film_id = film.film_id and film_actor.actor_id = actor.actor_id and film_category.film_id = film.film_id and film_category.category_id = category.category_id and film_category.film_id = film.film_id and film_category.category_id = category.category_id.
クエリ: 'What is actor fist name when movie category is Documentary and special features are Behind the Scenes(映画のカテゴリーがドキュメンタリーであり特別な特徴が「舞台裏」である場合の俳優のファーストネームは何ですか)'
'[actor]'についてtable.field を探す
table.field = actor.first_name が見つかる
'[movie, category]'について table.field を探す
table ONLYによって= category.name が見つかる
結果: PENELOPE |
CHRISTIAN |
LUCILLE |
SANDRA |
SQL: select actor.first_name from film_category, film_actor, film, actor, category where category.name like '%Documentary%' and film.special_features like '%behind%the%scenes%' and film_actor.film_id = film.film_id and film_actor.actor_id = actor.actor_id and film_actor.film_id = film.film_id and film_actor.actor_id = actor.actor_id and film_category.film_id = film.film_id and film_category.category_id = category.category_id and film_category.film_id = film.film_id and film_category.category_id = category.category_id.
ユーザデバイスは、名前に対して特定のパラメータ値を強調表示する必要はない。別の例では、クエリは、‘What is a category of film…’ と定式化されたかもしれないが、それは、NL2SQLシステムが単語 category および film によって参照されるテーブルのフィールドを判断することをより困難にするであろう。
クエリ: 'What is a film category when film title is Ace Goldfinger(映画のタイトルが Ace Goldfinger の場合、映画のカテゴリは何ですか? )'
'[film, category]'について table.field を探す
table.field = category.name が見つかる
'[film, title]'について table.field を探す
table.field = film.title が見つかる
結果:
Horror |
SQL: select category.name from film_category, film, category where film.title like '%ACE GOLDFINGER%' and film_category.film_id = film.film_id and film_category.category_id = category.category_id
多くの場合、NLクエリにおいてテーブル名への参照が言及されていない場合、データベースアプリケーション102は、列名に基づいてテーブル名の識別を試みる。複数のテーブルが同じ列名を有する場合、データベースアプリケーション102は、ユーザインターフェイスを介して明確化を求める。ユーザは、列名を有するテーブルのリストから1つのテーブルを選択する。
データベースアプリケーション102は、改善されたシソーラスをカスタムインデックスとの関連で用いて、NL検索クエリ120のデータベースエントリへのマッチングを改善し、それにより、改善されたデータベースまたはSQLクエリをもたらすことができる。自律型エージェントの関連性を改善することを意図したエンティティのシソーラスを構築するスケーラブルなメカニズムが、後に続く。シソーラス構築プロセスは、シードエンティティから始まり、これらのシードエンティティに関連付けられる新たなエンティティのために利用可能なソースドメインをマイニングする。新たなエンティティは、構文パースツリーの機械学習(それらの一般化)を既存のエンティティに対する検索結果に適用してそれらの間に共通性を形成することによって、形成される。次いで、これらの共通性表現は、既存のエンティティのパラメータを形成し、次の学習反復において新たなエンティティに転換される。ソースドメインとターゲットドメインとの間で自然言語表現をマッチさせるために、構文一般化、すなわち、これらの表現の構成性パースツリーの最大共通サブツリーのセットを見つける演算を用いる。
・語彙的エンティティ抽出および概念抽出;
・検索に必須であり本研究の対象であるシソーラス抽出;
・発見された非分類学的関係が、知識エンジニアによってラベル付けされ、オントロジーの一部となる、非分類学的表現抽出。
自然言語またはキーワードベースの質問に解答するためには、この質問が何についてであるかを「理解する」ことが有益である。この章の意味において、この「理解すること」は、キーワードの選好的処理である。我々は、以下の、キーワードのセットとその要素 is-about(についてである)(set-of-keywords, keyword)との間の関係の定義を用いる。
is-about({vision, bill, gates}, O); 一方で、
is-about({vision, bill-gates, in- computing}, {bill-gates})。
キーワードのセットは、それが is-about の右側で起こる場合、必須であると言及する。
無関係な解答をフィルタリングにより除去するためにシソーラスを用いるために、我々は、所与の質問からのエンティティの数に関して、この質問に最も近いシソーラス経路(可能な場合にはリーフノードまで)を探す。次いで、この経路およびリーフノードは、質問の意味を最も正確に特定し、どのエンティティが生じなければならないか、およびどれが解答において生じるべきかを、関連性があると考慮されるよう制約する。質問からのn番目のノードエンティティが解答において生じる場合、すべてのk<n個のエンティティも同様に解答において生ずるべきである。
・受容性条件。これは、シソーラス経路に存在するクエリからの必須単語のすべてが解答内にもあることを検証する。
・最大関連性条件。これは、シソーラス経路内に存在し解答内にあるクエリからの単語を見つける。次いで、それは、発見された必須キーワードおよび他のキーワードの数に基づいてスコアを計算する。
スコア(abest) = max{ai}Tp(濃度(ai∩( Tp ∩ q))が、解答Aのすべてに対するスコアの中から見出される。シソーラスに基づくスコアは、検索エンジンアーキテクチャに応じて、他のスコア、例えば、TF*IDF、時間的/崩壊パラメータ、位置距離、価格設定、言語学的類似性、および結果として得られるランク付けのための他のスコアと組み合わせることができる。我々の評価では、このスコアを言語学的類似性スコアと組み合わせる。
a1= {deduct, tax, business, expense, while, decreas(ing), holiday, travel, away, from, office},
a2= {pay, decreas(ed), sales-tax, return, trip, from, office, to, holiday, no, deduct(ion)},
a3= {when, file, tax, return, deduct, decrease-by, not, calculate, office, expense, and, employee, expense}}.
我々の例においてはトークン化および単語形態正規化問題を考慮せず、便宜的に括弧内で終わりを示す。なお、キーワードの重複に関して、a1, a2 および a3 は、いずれも良好な解答のように見える。
スコア(a1) = 濃度(a1 ∩( Tp ∩ q)) = 濃度({tax, deduct}) = 2;
スコア(a2) = 濃度({tax, deduct, sales_tax}) = 3;
スコア(a3) = 濃度({tax, deduct, decrease-by, office-expense}) = 3;この解答は、受容性基準に合格する唯一の解答であることに留意されたい。
a1 = "You must file form 1234 to request a 4 month extension of time to file your tax return(確定申告書を提出するための4か月の期間延長を要求するには、フォーム1234を提出する必要があります。)"
a2= "You must download a file with the extension 'pdf', complete it, and print it to do your taxes(税金を支払うには、拡張子が「pdf」のファイルをダウンロードして完成させ、印刷する必要があります。 )"。
Tp= {<tax> -< file>-<return> -< extension-of-time>}
ここで、tax は主要なエンティティであり、file および return はシード内にあると予想され、extension-of-time は学習されたエンティティであろう;その結果として、a1 はシソーラスとマッチし、受容可能な解答であり、a2 はそうではない。シソーラスを表す別の方法は、それがツリー(最も一般的でない)となるように実施するのではなく、代わりに各ラベルに対して単一のノードだけを許可することである。
ある例示的なプロセスは、クエリ q を受信し、(このアルゴリズムの外で)検索を実行し、候補解答のセットaを取得し、先のセクションで我々が導入した定義に従って最良の受容可能な解答を見つける。
入力:クエリ q
出力:最良の解答 abest
1)クエリ q について、利用可能な手段(キーワードを用いるか、内部インデックスを用いるか、または検索エンジンAPIの外部インデックスを用いる)によって候補解答Aのセットを得る;
2)シソーラス Tp において 、q において最大の語をカバーする経路を、q をカバーする他の経路と共に見つけて、セット P = {Tp}を形成する。
受容可能な解答が見出されなければ、
3)セット Tp ∩ q を計算する。
各解答 ai∈A について
4)ai∩( Tp ∩ q))を計算し、受容性基準を適用する。
5)各 aiについてスコアを計算する。
6)最良の解答 abest および受容可能な解答 Aa のセットを計算する。
7)入手可能な場合には、abest および受容可能な解答 Aa のセットを返す。
ウェブ上の自動化された学習シソーラスの我々の主な仮説は、所与のエンティティのセットに対する検索結果間の共通の表現がこれらのエンティティのパラメータを与えることである。シソーラスの形成は、シードシソーラスエンティティのセットが与えられると、教師なし学習スタイルに従う。このアプローチは、乳児が新たな環境を探索し、新たな規則を形成する、人間発達プロセスと見なすことができる。規則の初期セットは遺伝的に設定され、学習プロセスは、これらの規則を特定の習慣性環境に調整することにより、それらの規則をより感度のよいものにする(したがって、より有益な判断を可能にする)。新たな規則がそれらの適用プロセスの間に受け入れられているか、または拒絶されているので、新たな環境への曝露は、新たな特定の規則の形成を容易にする。新たな、より複雑な規則が評価され、これらの新しく形成された規則のある部分が受け入れられた後、環境の追加の固有性に適合するために、規則の複雑さがより大きくなる。
tax-deduct(税金控除) tax-on-income(所得税) tax-on-property(固定資産税),
を含むことになり、tax はドメイン判断エンティティであり、{deduct, income, property} はこのドメインにおける主要なエンティティである。シソーラス学習の目的は、tax - deduct のような既存のエンティティのさらなるパラメータを取得することである。次の学習の反復において、これらのパラメータは、sales-tax, 401kn のような新たなパラメータのセットが学習されることを可能にするために、エンティティに変換される。
tax - deduct → decrease-by tax - deduct → of-income
tax - deduct → property-of tax - deduct → business
tax - deduct → medical-expense
ここでのフォーマットは、existing_entity → its parameter (to become a new_entity)であり;
ここで、「→」 は、現在の学習ステップでのシソーラス拡張の、ラベルのないエッジ である。
tax-deduct-decrease-by → sales
tax-deduct-decrease-by →401-K
tax-deduct-decrease-by → medical
tax-deduct - of-income →rental
tax-deduct - of-income → itemized
tax-deduct - of-income → mutual-funds
例えば、tax-deduct-decrease についてウェブを検索することにより、税金控除に関連付けられ、通常は「売上税」の意味を伴う、エンティティsales-tax の発見が可能になる。スニペット間の共通性は、税金控除を計算する一方で売上税を斟酌するべきであること、およびそれを減らすであろう何かをしないことを示す。
シソーラス構築アルゴリズム
シソーラスをその終端ノードとともに取り、それら終端ノードをウェブマイニングを介して拡張して新たな終端ノードのセットを取得することを試みる反復アルゴリズムを概説する。反復k で、現在の終端ノード ti を tik1 , tik2 …で拡張することにより、ノードのセットを取得する。このアルゴリズムは、2つのテキストをシーケンス<lemma(word), part-of-speech> として取り、この形式で最も一般的でないテキストのセットを提供する、一般化の操作に基づいている。反復ステップを概説する。
入力:終端ノード {t1 ,t2 … tn} を有するシソーラスTk
Tkに含めるのに十分な証拠を提供する発生回数の閾値:th(k, T)。
出力:終端ノード {t1k1 , t1k2, …, t2k1, t2k2 , … tnk1, tnk2 } を有する拡張されたシソーラス Tk+1
各終端ノード ti について、
1)ルートから ti への経路として検索クエリ q = { troot, …, ti} を形成する;
2)q についてウェブ検索を実行し、解答(スニペット)Aq の組を得る。
3)解答 Aq に対するペア単位一般化(セクション4)を計算する:
Λ(Aq)= a1 ^a2 , a1 ^a3, …, a1 ^am, …, …, am-1^am,
4)Λ(Aq)のすべての要素(単語、フレーズ)を、Λ(Aq)における出現数が多い順にソートする。出現数が閾値th(k, T)を超えるΛ(Aq)の要素だけを保持する。このセットを Λhigh(Aq)と呼ぶ。
5)既存のシソーラスノードのすべてからのラベルを Λhigh(Aq)から減算する:
Λnew (Aq) = Λhigh(Aq)/Tk。
6)Λhigh(Aq)の各要素について、シソーラスノード tihk を生成し、ここで、h∈Λhigh(Aq)であり、k は現在の反復数であり、Tk にシソーラスエッジ (ti, , tihk,)を追加する。
入力:主要ノードである {t1 ,t2 … tn} を有するシソーラス To
出力:終端ノードを有する結果シソーラスT
k を通して反復する
反復ステップを k に適用する
Tk+1が追加すべきノードの空集合を有する場合、停止する。
次に、上述のアルゴリズムを説明する。シード表現 tax-deduct を有すると想定する。
図12は、本開示の一態様によるシソーラス学習を示す。
1)現在利用可能な表現の検索結果を得る。
2)言語学的出現に基づいて属性を選択する。
出現数は、特定の閾値を超える(および2を超える)べきである。
3)共通属性(「overlook(看過する)」のような、濃い灰色で強調された、検索結果間の共通性)を見つける。
4)新たに取得された属性を追加することによってシソーラス経路を拡張する。
ここで、学習ステップは、以下のとおりである:
1)「tax deduct overlook(税金控除看過)」についての検索結果を得る;
2)属性(現在のシソーラス経路からのエンティティの修飾子)を選択する
3)この場合、「PRP-mortgage(PRP-住宅ローン)」などの共通表現を見つける
4)新しく取得した属性を追加することにより、シソーラス経路を拡張する
Tax-deduct-overlook - mortgage,
Tax-deduct- overlook - no_itemize。
十分なシソーラスを構築した後、ここで、それを適用して、シソーラス経路を適切にカバーしない検索結果をフィルタリングにより除去することができる。「can I deduct tax on mortgage escrow account(住宅ローンのエスクロー口座の税金を控除することはできますか )」というクエリの場合、以下のヒットを得るが、それらのうちの2つは無関係であり(長円形枠内に示される)、なぜならば、それらはシソーラスノード {deduct, tax , mortgage, escrow_account} を含まないからである。クエリに最も近いシソーラス経路は、tax - deduct - overlook-mortgage- escrow_account であることに注目されたい。
Sell_hobby=>[[deductions, collection], [making, collection], [sales, business, collection], [collectibles, collection], [loss, hobby, collection], [item, collection], [selling, business, collection], [pay, collection], [stamp, collection], [deduction, collection], [car, collection], [sell, business, collection], [loss, collection]]
benefit=>[[office, child, parent], [credit, child, parent], [credits, child, parent], [support, child, parent], [making, child, parent], [income, child, parent], [resides, child, parent], [taxpayer, child, parent], [passed, child, parent], [claiming, child, parent], [exclusion, child, parent], [surviving, benefits, child, parent], [reporting, child, parent],
hardship=>[[apply, undue], [taxpayer, undue], [irs, undue], [help, undue], [deductions, undue], [credits, undue], [cause, undue], [means, required, undue], [court, undue]。
税金トピックエンティティ sell hobby, benefit, hardship についての3つの経路のセット
各エンティティについて、キーワードのシーケンスが与えられると、読み手は、税金ドメインの文脈における意味を再構築することができる。このスナップショットは、シソーラスベースの検索関連性改善の概念を示し:いったん特定の意味(内容、我々のモデルにおいてはシソーラス経路)が確立されると、関連する解答を見つけることができる。表現の先頭は、それがもたらすすべての経路において生ずる(例えば、{sell_hobby - deductions - collection}, {sell_hobby - making - collection})。
Claims (20)
- データベースを介して自然言語クエリを処理するための方法であって、
テーブルを有するデータベースにアクセスすることを含み、各テーブルは、前記各テーブルを識別するラベルと、フィールドとを含み、各フィールドは属性を含み、前記方法はさらに、
エンティティを含むカスタムデータベースインデックスにアクセスすることを含み、前記エンティティは、前記フィールドと、前記属性と、前記フィールドまたは前記属性の1つ以上の同義語とを含み、前記方法はさらに、
自然言語検索クエリにアクセスすることと、
前記自然言語検索クエリからパースツリーを構築することとを含み、前記パースツリーは、単語タイプを含む少なくとも1つの終端ノードと、前記自然言語検索クエリの単語またはフレーズを表す少なくとも1つの終端ノードとを含み、前記パースツリーは、前記自然言語クエリの構文情報を識別し、前記方法はさらに、
前記パースツリーから1つ以上の節を識別することを含み、節はキーワードを含み、各キーワードは名詞または動詞であり、前記方法はさらに、
以下の1つ以上、すなわち、
各キーワードを、(i)前記テーブルのうちの1つのテーブルのラベルまたは(ii)前記テーブルのうちの1つのテーブルのフィールドまたは(iii)フィールドの属性のいずれかにマッチングさせること、および
前記キーワードと前記カスタムデータベースインデックスとの間のマッチの閾値レベルを判断すること、の1つ以上を実行することと、
前記マッピングされたキーワードからデータベースクエリを生成することと、
前記データベースクエリを前記データベースに提供することによって前記データベースから結果を得ることと、
前記結果をユーザデバイスに表示することとを含む、方法。 - 前記方法はさらに、
前記キーワードのうちのあるキーワードが前記データベース内でマッチしないと判断することに応答して、暗黙ノードを前記パースツリーに挿入することを含み、前記暗黙ノードは前記キーワードを識別し、前記方法はさらに、
前記キーワードを前記ユーザデバイスに提示することを含む、請求項1に記載の方法。 - さらに、
前記ユーザデバイスから明確化を受信することと、
前記明確化に基づいて前記パースツリーを更新することと、
前記パースツリーからの更新された節を前記データベースにマッチングすることとを含む、請求項2に記載の方法。 - 各キーワードをマッピングすることは、前記キーワードのうちの1つを前記テーブルのうちの1つテーブルのラベルにマッチングすることを含む、請求項1に記載の方法。
- 各キーワードをマッピングすることは、前記キーワードのうちの1つを前記テーブルのうちの1つのテーブルのフィールドの単語の閾値数にマッチングすることを含む、請求項1に記載の方法。
- 各キーワードをマッピングすることは、
キーワードの1つ以上の同義語を判断することと、
前記1つ以上の同義語を前記テーブルのうちの1つのテーブルのフィールドにマッピングすることとを含む、請求項1に記載の方法。 - マッチの閾値レベルを判断することは、
前記カスタムデータベースインデックスを検索することによって複数の候補を得ることと、
各候補について、前記エンティティと対応する結果との間のマッチのレベルを判断することと、
すべての前記エンティティのうちで最も高いマッチのレベルを有するエンティティを判断することとを含む、請求項1に記載の方法。 - 前記キーワードと前記カスタムデータベースインデックスの前記エンティティとの間のマッチのレベルは、単語の出現頻度‐逆文書頻度を用いて判断される、請求項7に記載の方法。
- カスタムデータベースインデックスにアクセスすることは、
接続されたノードのセットを含むシソーラスにアクセスすることを含み、前記接続されたノードは、ルートノードおよび終端ノードを含み、前記終端ノードは、前記ルートノードの同義語であり、カスタムデータベースインデックスにアクセスすることはさらに、
反復的に、前記終端ノードの各々について、
前記ルートノードから対応の終端ノードへの経路を含む検索クエリを形成することと、
前記検索クエリを検索エンジンに提供することによって結果のセットを得ることと、
前記結果のセットの各ペアの結果のペア単位一般化を計算することとを含み、ペア単位一般化は、対応のペアの各結果に共通の1つ以上のキーワードを抽出し、カスタムデータベースインデックスにアクセスすることはさらに、反復的に、前記終端ノードの各々について、
前記ペア単位一般化から単語またはフレーズを抽出することと、
前記ペア単位一般化内で閾値頻度を超えて生ずるソートされた要素のサブセットを抽出することと、
前記抽出された要素のサブセットから新たなノードを作成することと、
前記新たなノードを対応の終端ノードに接続することとを含む、請求項1に記載の方法。 - システムであって、
非一時的コンピュータ実行可能プログラム命令を記憶するコンピュータ可読媒体と、
前記コンピュータ可読媒体に通信可能に結合され、前記非一時的コンピュータ実行可能プログラム命令を実行するための処理装置とを備え、前記非一時的コンピュータ実行可能プログラム命令を実行することは、動作を実行するように前記処理装置を構成し、前記動作は、
テーブルを有するデータベースにアクセスすることを含み、各テーブルは、前記各テーブルを識別するラベルと、フィールドとを含み、各フィールドは属性を含み、前記動作はさらに、
エンティティを含むカスタムデータベースインデックスにアクセスすることを含み、前記エンティティは、前記フィールドと、前記属性と、前記フィールドまたは前記属性の1つ以上の同義語とを含み、前記動作はさらに、
自然言語検索クエリにアクセスすることと、
前記自然言語検索クエリからパースツリーを構築することとを含み、前記パースツリーは、単語タイプを含む少なくとも1つの終端ノードと、前記自然言語検索クエリの単語またはフレーズを表す少なくとも1つの終端ノードとを含み、前記パースツリーは、前記自然言語クエリの構文情報を識別し、前記動作はさらに、
前記パースツリーから1つ以上の節を識別することを含み、節はキーワードを含み、各キーワードは名詞または動詞であり、前記動作はさらに、
以下の1つ以上、すなわち、
各キーワードを、(i)前記テーブルのうちの1つのテーブルのラベルまたは(ii)前記テーブルのうちの1つのテーブルのフィールドまたは(iii)フィールドの属性のいずれかにマッチングさせること、および
前記キーワードと前記カスタムデータベースインデックスとの間のマッチの閾値レベルを判断すること、の1つ以上を実行することと、
前記マッピングされたキーワードからデータベースクエリを生成することと、
前記データベースクエリを前記データベースに提供することによって前記データベースから結果を得ることと、
前記結果をユーザデバイスに表示することとを含む、システム。 - 前記動作はさらに、
前記キーワードのうちのあるキーワードが前記データベース内でマッチしないと判断することに応答して、暗黙ノードを前記パースツリーに挿入することを含み、前記暗黙ノードは前記キーワードを識別し、前記動作はさらに、
前記キーワードを前記ユーザデバイスに提示することを含む、請求項10に記載のシステム。 - 前記動作はさらに、
前記ユーザデバイスから明確化を受信することと、
前記明確化に基づいて前記パースツリーを更新することと、
前記パースツリーからの更新された節を前記データベースにマッチングすることとを含む、請求項11に記載のシステム。 - 各キーワードをマッピングすることは、
キーワードの1つ以上の同義語を判断することと、
前記1つ以上の同義語を前記テーブルのうちの1つのテーブルのフィールドにマッピングすることとを含む、請求項10に記載のシステム。 - マッチの閾値レベルを判断することは、
前記カスタムデータベースインデックスを検索することによって複数の候補を得ることと、
各候補について、前記エンティティと対応する結果との間のマッチのレベルを判断することと、
すべての前記エンティティのうちで最も高いマッチのレベルを有するエンティティを判断することとを含む、請求項10に記載のシステム。 - 前記キーワードと前記カスタムデータベースインデックスの前記エンティティとの間のマッチのレベルは、単語の出現頻度‐逆文書頻度を用いて判断される、請求項10に記載のシステム。
- カスタムデータベースインデックスにアクセスすることは、
接続されたノードのセットを含むシソーラスにアクセスすることを含み、前記接続されたノードは、ルートノードおよび終端ノードを含み、前記終端ノードは、前記ルートノードの同義語であり、カスタムデータベースインデックスにアクセスすることはさらに、
反復的に、前記終端ノードの各々について、
前記ルートノードから対応の終端ノードへの経路を含む検索クエリを形成することと、
前記検索クエリを検索エンジンに提供することによって結果のセットを得ることと、
前記結果のセットの各ペアの結果のペア単位一般化を計算することとを含み、ペア単位一般化は、対応のペアの各結果に共通の1つ以上のキーワードを抽出し、カスタムデータベースインデックスにアクセスすることはさらに、 反復的に、前記終端ノードの各々について、
前記ペア単位一般化から単語またはフレーズを抽出することと、
前記ペア単位一般化内で閾値頻度を超えて生ずるソートされた要素のサブセットを抽出することと、
前記抽出された要素のサブセットから新たなノードを作成することと、
前記新たなノードを対応の終端ノードに接続することとを含む、請求項10に記載のシステム。 - コンピュータ実行可能プログラム命令を記憶する非一時的なコンピュータ可読記憶媒体であって、処理装置によって実行されると、前記プログラム命令は前記処理装置に動作を実行させ、前記動作は、
テーブルを有するデータベースにアクセスすることを含み、各テーブルは、前記各テーブルを識別するラベルと、フィールドとを含み、各フィールドは属性を含み、前記動作はさらに、
エンティティを含むカスタムデータベースインデックスにアクセスすることを含み、前記エンティティは、前記フィールドと、前記属性と、前記フィールドまたは前記属性の1つ以上の同義語とを含み、前記動作はさらに、
自然言語検索クエリにアクセスすることと、
前記自然言語検索クエリからパースツリーを構築することとを含み、前記パースツリーは、単語タイプを含む少なくとも1つの終端ノードと、前記自然言語検索クエリの単語またはフレーズを表す少なくとも1つの終端ノードとを含み、前記パースツリーは、前記自然言語クエリの構文情報を識別し、前記動作はさらに、
前記パースツリーから1つ以上の節を識別することを含み、節はキーワードを含み、各キーワードは名詞または動詞であり、前記動作はさらに、
以下の1つ以上、すなわち、
各キーワードを、(i)前記テーブルのうちの1つのテーブルのラベルまたは(ii)前記テーブルのうちの1つのテーブルのフィールドまたは(iii)フィールドの属性のいずれかにマッチングさせること、および
前記キーワードと前記カスタムデータベースインデックスとの間のマッチの閾値レベルを判断すること、の1つ以上を実行することと、
前記マッピングされたキーワードからデータベースクエリを生成することと、
前記データベースクエリを前記データベースに提供することによって前記データベースから結果を得ることと、
前記結果をユーザデバイスに表示することとを含む、非一時的なコンピュータ可読記憶媒体。 - 前記動作はさらに、
前記キーワードのうちのあるキーワードが前記データベース内でマッチしないと判断することに応答して、暗黙ノードを前記パースツリーに挿入することを含み、前記暗黙ノードは前記キーワードを識別し、前記動作はさらに、
前記キーワードを前記ユーザデバイスに提示することを含む、請求項17に記載の非一時的コンピュータ可読記憶媒体。 - マッチの閾値レベルを判断することは、
前記カスタムデータベースインデックスを検索することによって複数の候補を得ることと、
各候補について、前記エンティティと対応する結果との間のマッチのレベルを判断することと、
すべての前記エンティティのうちで最も高いマッチのレベルを有するエンティティを判断することとを含む、請求項17に記載の非一時的コンピュータ可読記憶媒体。 - カスタムデータベースインデックスにアクセスすることは、
接続されたノードのセットを含むシソーラスにアクセスすることを含み、前記接続されたノードは、ルートノードおよび終端ノードを含み、前記終端ノードは、前記ルートノードの同義語であり、カスタムデータベースインデックスにアクセスすることはさらに、
反復的に、前記終端ノードの各々について、
前記ルートノードから対応の終端ノードへの経路を含む検索クエリを形成することと、
前記検索クエリを検索エンジンに提供することによって結果のセットを得ることと、
前記結果のセットの各ペアの結果のペア単位一般化を計算することとを含み、ペア単位一般化は、対応のペアの各結果に共通の1つ以上のキーワードを抽出し、カスタムデータベースインデックスにアクセスすることはさらに、 反復的に、前記終端ノードの各々について、
前記ペア単位一般化から単語またはフレーズを抽出することと、
前記ペア単位一般化内で閾値頻度を超えて生ずるソートされた要素のサブセットを抽出することと、
前記抽出された要素のサブセットから新たなノードを作成することと、
前記新たなノードを対応の終端ノードに接続することとを含む、請求項17に記載の非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862703389P | 2018-07-25 | 2018-07-25 | |
US62/703,389 | 2018-07-25 | ||
PCT/US2019/043505 WO2020023787A1 (en) | 2018-07-25 | 2019-07-25 | Natural language interfaces for databases using autonomous agents and thesauri |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021530818A true JP2021530818A (ja) | 2021-11-11 |
JPWO2020023787A5 JPWO2020023787A5 (ja) | 2022-04-14 |
JP7449919B2 JP7449919B2 (ja) | 2024-03-14 |
Family
ID=67544463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021503796A Active JP7449919B2 (ja) | 2018-07-25 | 2019-07-25 | 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス |
Country Status (5)
Country | Link |
---|---|
US (1) | US10592505B2 (ja) |
EP (1) | EP3788503A1 (ja) |
JP (1) | JP7449919B2 (ja) |
CN (1) | CN112437917B (ja) |
WO (1) | WO2020023787A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299219B (zh) * | 2018-08-31 | 2022-08-12 | 北京奥星贝斯科技有限公司 | 数据查询方法、装置、电子设备及计算机可读存储介质 |
US11360969B2 (en) * | 2019-03-20 | 2022-06-14 | Promethium, Inc. | Natural language based processing of data stored across heterogeneous data sources |
US11734325B2 (en) * | 2019-04-30 | 2023-08-22 | Salesforce, Inc. | Detecting and processing conceptual queries |
US11789940B2 (en) * | 2019-08-16 | 2023-10-17 | American Express Travel Related Services Company, Inc. | Natural language interface to databases |
US11222013B2 (en) * | 2019-11-19 | 2022-01-11 | Sap Se | Custom named entities and tags for natural language search query processing |
CN111666372B (zh) * | 2020-04-29 | 2023-08-18 | 百度在线网络技术(北京)有限公司 | 解析查询词query的方法、装置、电子设备和可读存储介质 |
CN111625554B (zh) * | 2020-07-30 | 2020-11-03 | 武大吉奥信息技术有限公司 | 一种基于深度学习语义理解的数据查询方法及装置 |
CA3135717A1 (en) * | 2020-10-23 | 2022-04-23 | Royal Bank Of Canada | System and method for transferable natural language interface |
US11403326B2 (en) | 2020-12-03 | 2022-08-02 | International Business Machines Corporation | Message-based event grouping for a computing operation |
US11599404B2 (en) | 2020-12-03 | 2023-03-07 | International Business Machines Corporation | Correlation-based multi-source problem diagnosis |
US11995562B2 (en) | 2020-12-03 | 2024-05-28 | International Business Machines Corporation | Integrating documentation knowledge with log mining for system diagnosis |
US11513930B2 (en) | 2020-12-03 | 2022-11-29 | International Business Machines Corporation | Log-based status modeling and problem diagnosis for distributed applications |
US11474892B2 (en) | 2020-12-03 | 2022-10-18 | International Business Machines Corporation | Graph-based log sequence anomaly detection and problem diagnosis |
US11243835B1 (en) | 2020-12-03 | 2022-02-08 | International Business Machines Corporation | Message-based problem diagnosis and root cause analysis |
US11797538B2 (en) | 2020-12-03 | 2023-10-24 | International Business Machines Corporation | Message correlation extraction for mainframe operation |
US20220180056A1 (en) * | 2020-12-09 | 2022-06-09 | Here Global B.V. | Method and apparatus for translation of a natural language query to a service execution language |
CN112819512B (zh) * | 2021-01-22 | 2023-03-24 | 北京有竹居网络技术有限公司 | 一种文本处理方法、装置、设备及介质 |
WO2022164724A1 (en) | 2021-01-27 | 2022-08-04 | Verantos, Inc. | High validity real-world evidence study with deep phenotyping |
US12008043B2 (en) * | 2021-03-29 | 2024-06-11 | Microsoft Technology Licensing, Llc | Natural language query processing and debugging |
US11500865B1 (en) | 2021-03-31 | 2022-11-15 | Amazon Technologies, Inc. | Multiple stage filtering for natural language query processing pipelines |
US11604794B1 (en) | 2021-03-31 | 2023-03-14 | Amazon Technologies, Inc. | Interactive assistance for executing natural language queries to data sets |
US11726994B1 (en) | 2021-03-31 | 2023-08-15 | Amazon Technologies, Inc. | Providing query restatements for explaining natural language query results |
US11494557B1 (en) * | 2021-05-17 | 2022-11-08 | Verantos, Inc. | System and method for term disambiguation |
JP7472078B2 (ja) * | 2021-05-20 | 2024-04-22 | 株式会社東芝 | データ仮想化装置及び方法 |
CN113553414B (zh) * | 2021-06-30 | 2023-08-25 | 北京百度网讯科技有限公司 | 智能对话方法、装置、电子设备和存储介质 |
CN113449003B (zh) * | 2021-07-07 | 2024-04-16 | 京东科技控股股份有限公司 | 信息查询的方法、装置、电子设备及介质 |
US20230127907A1 (en) * | 2021-10-22 | 2023-04-27 | International Business Machines Corporation | Intention identification in dialogue system |
CN114048312B (zh) * | 2021-11-09 | 2024-06-21 | 中国人民银行清算总中心 | 一种自然语言查询任务的模型输入信息处理方法及装置 |
KR20230079729A (ko) * | 2021-11-29 | 2023-06-07 | 주식회사 포티투마루 | 자연어 질의의 sql 변환 방법 및 장치 |
US20230177277A1 (en) * | 2021-12-06 | 2023-06-08 | International Business Machines Corporation | Contextual dialogue framework over dynamic tables |
CN115374765B (zh) * | 2022-10-27 | 2023-06-02 | 浪潮通信信息系统有限公司 | 一种基于自然语言处理的算力网络5g数据解析系统及方法 |
CN116628140B (zh) * | 2023-07-20 | 2023-10-27 | 湖南华菱电子商务有限公司 | 基于人机交互的信息推送方法及装置、人机交互系统 |
CN117271767B (zh) * | 2023-09-15 | 2024-02-13 | 上海海启科技有限公司 | 基于多智能体的运维知识库的建立方法 |
CN117708304B (zh) * | 2024-02-01 | 2024-05-28 | 浙江大华技术股份有限公司 | 数据库问答方法、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944508A (ja) * | 1995-07-27 | 1997-02-14 | Toshiba Corp | データベース自然言語インタフェース装置および方法 |
JP2002207761A (ja) * | 2001-01-10 | 2002-07-26 | Just Syst Corp | 検索装置、検索方法、プログラム、ならびに、記録媒体 |
JP2002288201A (ja) * | 2001-03-23 | 2002-10-04 | Fujitsu Ltd | 質問応答処理方法,質問応答処理プログラム,質問応答処理プログラム記録媒体および質問応答処理装置 |
JP2002342361A (ja) * | 2001-05-15 | 2002-11-29 | Mitsubishi Electric Corp | 情報検索装置 |
JP2005208825A (ja) * | 2004-01-21 | 2005-08-04 | Toshiba Corp | データ検索システム、データ検索方法及びプログラム |
US20170083569A1 (en) * | 2015-09-18 | 2017-03-23 | International Business Machines Corporation | Natural language interface to databases |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417247B2 (en) * | 2014-09-25 | 2019-09-17 | Oracle International Corporation | Techniques for semantic searching |
CN107016011B (zh) * | 2015-09-11 | 2021-03-30 | 谷歌有限责任公司 | 用于自然语言查询的联接路径的消岐 |
US10489393B1 (en) * | 2016-03-30 | 2019-11-26 | Amazon Technologies, Inc. | Quasi-semantic question answering |
US10657124B2 (en) * | 2016-12-08 | 2020-05-19 | Sap Se | Automatic generation of structured queries from natural language input |
US10691685B2 (en) * | 2017-06-03 | 2020-06-23 | Apple Inc. | Converting natural language input to structured queries |
CN107885786B (zh) * | 2017-10-17 | 2021-10-26 | 东华大学 | 面向大数据的自然语言查询接口实现方法 |
CN108052547B (zh) * | 2017-11-27 | 2019-09-27 | 华中科技大学 | 基于问句和知识图结构分析的自然语言问答方法及系统 |
US11409737B2 (en) * | 2017-11-29 | 2022-08-09 | Resilient Cognitive Solutions, LLC | Interactive structured analytic systems |
-
2019
- 2019-07-25 US US16/522,549 patent/US10592505B2/en active Active
- 2019-07-25 WO PCT/US2019/043505 patent/WO2020023787A1/en unknown
- 2019-07-25 EP EP19750015.0A patent/EP3788503A1/en not_active Withdrawn
- 2019-07-25 CN CN201980046615.9A patent/CN112437917B/zh active Active
- 2019-07-25 JP JP2021503796A patent/JP7449919B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944508A (ja) * | 1995-07-27 | 1997-02-14 | Toshiba Corp | データベース自然言語インタフェース装置および方法 |
JP2002207761A (ja) * | 2001-01-10 | 2002-07-26 | Just Syst Corp | 検索装置、検索方法、プログラム、ならびに、記録媒体 |
JP2002288201A (ja) * | 2001-03-23 | 2002-10-04 | Fujitsu Ltd | 質問応答処理方法,質問応答処理プログラム,質問応答処理プログラム記録媒体および質問応答処理装置 |
JP2002342361A (ja) * | 2001-05-15 | 2002-11-29 | Mitsubishi Electric Corp | 情報検索装置 |
JP2005208825A (ja) * | 2004-01-21 | 2005-08-04 | Toshiba Corp | データ検索システム、データ検索方法及びプログラム |
US20170083569A1 (en) * | 2015-09-18 | 2017-03-23 | International Business Machines Corporation | Natural language interface to databases |
Also Published As
Publication number | Publication date |
---|---|
CN112437917B (zh) | 2022-04-12 |
US10592505B2 (en) | 2020-03-17 |
EP3788503A1 (en) | 2021-03-10 |
CN112437917A (zh) | 2021-03-02 |
WO2020023787A1 (en) | 2020-01-30 |
US20200034362A1 (en) | 2020-01-30 |
JP7449919B2 (ja) | 2024-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7449919B2 (ja) | 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス | |
JP6714024B2 (ja) | 言語入力データからnグラムおよび概念関係の自動生成 | |
US11694040B2 (en) | Using communicative discourse trees to detect a request for an explanation | |
JP7086993B2 (ja) | コミュニケーション用談話ツリーの使用による修辞学的分析の可能化 | |
JP7214719B2 (ja) | 質問と要求とを自律エージェントが区別できるようにすること | |
US10210246B2 (en) | Techniques for similarity analysis and data enrichment using knowledge sources | |
US11741316B2 (en) | Employing abstract meaning representation to lay the last mile towards reading comprehension | |
US20190236085A1 (en) | Building dialogue structure by using communicative discourse trees | |
JP2023089059A (ja) | 収束質問に対する回答を改善するための仮想談話ツリーの構築 | |
US20220138432A1 (en) | Relying on discourse analysis to answer complex questions by neural machine reading comprehension | |
US11556698B2 (en) | Augmenting textual explanations with complete discourse trees | |
JP2020537224A (ja) | 名前付きエンティティの構文解析および識別に基づくクロスドキュメントの修辞的つながりの判断 | |
US20210191938A1 (en) | Summarized logical forms based on abstract meaning representation and discourse trees | |
CN106796608A (zh) | 上下文搜索字符串同义词的自动生成 | |
US11928437B2 (en) | Machine reading between the lines | |
JP7515537B2 (ja) | コミュニケーション用談話ツリーの使用による修辞学的分析の可能化 | |
Mulaj | THE USE OF RECOMMENDER SYSTEMS IN WEB APPLICATIONS–THE TROI CASE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220406 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7449919 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |