JP2022546228A - 構造化及び非構造化されたデータを使用する照会の解決 - Google Patents
構造化及び非構造化されたデータを使用する照会の解決 Download PDFInfo
- Publication number
- JP2022546228A JP2022546228A JP2022508750A JP2022508750A JP2022546228A JP 2022546228 A JP2022546228 A JP 2022546228A JP 2022508750 A JP2022508750 A JP 2022508750A JP 2022508750 A JP2022508750 A JP 2022508750A JP 2022546228 A JP2022546228 A JP 2022546228A
- Authority
- JP
- Japan
- Prior art keywords
- subquery
- computer
- knowledge base
- implemented method
- triples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 73
- 238000004590 computer program Methods 0.000 claims description 21
- 239000012634 fragment Substances 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 7
- 230000001052 transient effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 230000015654 memory Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
(会社,取得,?)
を含むことができる。
(会社,買収,?)及び
(?,により買収,会社)
といった、また推定されたクエリーについて適用される。
ナレッジ・ベース(KB)は、多くのデータを中心とした、質問・回答(QA)アプリケーションといったアプリケーションの核となった。大規模なナレッジ・ベースは、異なったエンティティに関する膨大な量の知識を格納し、システムがエンティティを中心とする質問に対する回答を提供することを可能とする。これらのナレッジ・ベースの中でも、キュレートされたKBsは、システムが高い精度の知識にわたって理由付けをし、かつ正確な回答を返すことを可能とする。
「私に2016年における会社Xの競合者の収益を示せ」
(1)(?y,の収益,?x)、及び
(2)(?x,“の競合者”,“会社X”)、
ここで、クエリー(1)は、我々がクエリー(2)に対する回答を知るや否やキュレーテッド・ナレッジ・ベースにより回答することができ、この回答は、会社Xの財務報告のフリーテキストにおいて見出すことができる(報告が実際に興味のある情報を含んでいるものと仮定する。)。
1.所与の自然言語クエリー(NLQ)のローカルな代表を、論理クエリーとして参照すると、対応する照会計画が生成される。この計画は、既存のナレッジ・ベース及び非構造化データに対して照会を行って中間的な結果を生成し、中間的な回答を結合し、そして最終的な結果をアグリゲートする照会操作器から構成される。
2.非構造化データにアクセスする照会操作器については、操作器に関連する関係のある断片が、非構造化データから検索される。
a.関係のある断片からの事実が、抽出され、ランク付けされる。
b.入力した照会操作器についての結果が、抽出された事実から判断
される。
3.キュレーテッド・ナレッジ・ベースにアクセスした照会操作器のために、ナレッジ・ベースに対する照会が行なわれ、関連する事実を検索する。
4.元の照会計画についての最終的な結果が生成される。
Claims (28)
- コンピュータ実装方法であって、
自然言語フォーマットで質問を受領すること、
前記質問から複数のサブクエリーを導出すること、
前記複数のサブクエリーの第1のサブクエリーがキュレーテッド・ナレッジ・ベースを使用して解決できないことを判断すること、
非構造化テキストを使用して、前記第1のサブクエリーを解決すること、
解決された前記第1のサブクエリーを使用して前記キュレーテッド・ナレッジ・ベースを適応させること
を含む、コンピュータ実装方法。 - 前記質問が、質問・回答(QA)アプリケーションにより受領される、請求項1に記載のコンピュータ実装方法。
- 前記サブクエリーが、前記質問の自然言語フォーマットを論理形式にパースすることにより導出される、請求項1に記載のコンピュータ実装方法。
- それぞれのサブクエリーが、不完全な主語/述語/目的語のトリプルを含む、請求項1に記載のコンピュータ実装方法。
- 前記キュレーテッド・ナレッジ・ベースを適応させることが、解決された前記第1のサブクエリーを前記キュレーテッド・ナレッジ・ベースに追加することを含む、請求項1に記載のコンピュータ実装方法。
- 前記第1のサブクエリーを解決することが、前記非構造化テキストを使用して以前に解決された検索インデックスを照会することを含む、請求項1に記載のコンピュータ実装方法。
- クエリー・リラクゼーションが、検索インデックスのクエリー内に含ませるための追加の語を生成するために使用される、請求項6に記載のコンピュータ実装方法。
- 前記第1のサブクエリーを解決することが、前記検索インデックスの照会の結果を受領することを含む、請求項6に記載のコンピュータ実装方法。
- 前記第1のサブクエリーを解決することが、前記検索インデックスの照会の結果を使用して新たなトリプルを生成することを含む、請求項8に記載のコンピュータ実装方法。
- 前記第1のサブクエリーを解決することが、前記新たなトリプルを使用して前記第1のサブクエリーを完全化させることを含む、請求項9に記載のコンピュータ実装方法。
- さらに前記複数のサブクエリーの第2のサブクエリーを、適応させた前記キュレーテッド・ナレッジ・ベースを使用することにより解決することを含む、請求項1に記載のコンピュータ実装方法。
- 解決された前記第1のサブクエリー及び解決された前記第2のサブクエリーが前記受領した質問に対する回答を生成するために使用される、請求項11に記載のコンピュータ実装方法。
- 構造化及び非構造化データを使用してクエリーを解決するためのコンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品は、それに実体化されたプログラム命令を有するコンピュータ可読な記録媒体を含み、前記コンピュータ可読な記録媒体は、それ自体が過渡的な信号ではなく、前記プログラム命令がプロセッサによって実行可能であり、プロセッサをして、
前記プロセッサにより、自然言語フォーマットで質問を受領すること、
前記プロセッサにより、前記質問から複数のサブクエリーを導出すること、
前記プロセッサにより前記複数のサブクエリーの第1のサブクエリーがキュレーテッド・ナレッジ・ベースを使用して解決できないことを判断すること、
前記プロセッサにより、非構造化テキストを使用して、前記第1のサブクエリーを解決すること、
前記プロセッサにより、解決された前記第1のサブクエリーを使用して前記キュレーテッド・ナレッジ・ベースを適応させること
を実行させる、コンピュータ・プログラム製品。 - 前記質問が、質問・回答(QA)アプリケーションにより受領される、請求項13に記載のコンピュータ・プログラム製品。
- 前記サブクエリーが、前記質問の自然言語フォーマットを論理形式にパースすることにより導出される、請求項13に記載のコンピュータ・プログラム製品。
- それぞれのサブクエリーが、不完全な主語/述語/目的語のトリプルを含む、請求項13に記載のコンピュータ・プログラム製品。
- 前記キュレーテッド・ナレッジ・ベースを適応させることが、解決された前記第1のサブクエリーを前記キュレーテッド・ナレッジ・ベースに追加することを含む、請求項13に記載のコンピュータ・プログラム製品。
- 前記第1のサブクエリーを解決することが、前記非構造化テキストを使用して以前に解決された検索インデックスを照会することを含む、請求項13に記載のコンピュータ・プログラム製品。
- クエリー・リラクゼーションが、検索インデックスのクエリー内に含ませるための追加の語を生成するために使用される、請求項18に記載のコンピュータ・プログラム製品。
- 前記第1のサブクエリーを解決することが、前記検索インデックスの照会の結果を受領することを含む、請求項18に記載のコンピュータ・プログラム製品。
- 前記第1のサブクエリーを解決することが、前記検索インデックスの照会の結果を使用して新たなトリプルを生成することを含む、請求項18に記載のコンピュータ・プログラム製品。
- 前記第1のサブクエリーを解決することが、前記新たなトリプルを使用して前記第1のサブクエリーを完全化させることを含む、請求項21に記載のコンピュータ・プログラム製品。
- システムであって、
プロセッサと、
前記プロセッサに一体化され、前記プロセッサにより実行可能であるか、又は前記プロセッサに一体化された論理であって、前記論理が、請求項1~12の方法を実行するように構成される論理と
を含むシステム。 - コンピュータ実装方法であって、
自然言語フォーマットで質問を受領すること、
前記質問から第1のサブクエリー及び第2のサブクエリーを導出すること、
前記第1のサブクエリーが非構造化テキストに基づきキュレーテッド・ナレッジ・ベースを使用して解決できないことを判断すること、
クエリー・リラクゼーションを使用して前記第1のサブクエリーのための追加の検索語を生成すること、
追加の前記検索語を、クエリー・リラクゼーションを使用して生成すること、
前記第1のサブクエリー及び追加の前記検索語を使用して非構造化テキストについて検索インデックスを照会すること、
前記検索インデックスの照会に応答して検索結果を受領すること、
前記検索結果に基づいて新たな主語/述語/目的語のトリプルを生成すること、
前記新たな主語/述語/目的語のトリプルを使用して前記第1のサブクエリーを完全化すること、
完全化した前記第1のサブクエリーを含ませるように、前記キュレーテッド・ナレッジ・ベースをアップデートすること、
前記第2のサブクエリーがアップデートされた前記キュレーテッド・ナレッジ・ベースを使用して解決できることを判断すること、及び
アップデートされた前記キュレーテッド・ナレッジ・ベースを使用して前記第2のサブクエリーを完全化させること
を含むコンピュータ実装方法。 - コンピュータ実装方法であって、
自然言語入力を主語/述語/目的語(SPO)のトリプルに落とし込む自然言語のパーサで、質問に対応する前記自然言語入力を受領すること、
前記SPOトリプルを照会計画生成器に入力すること、
モデルを使用して、キュレーテッド・ナレッジ・ベースに対するセマンティック的な関連性を考慮して、前記SPOトリプルの第1のサブセットをフリーテキストに対する照会モジュールに、かつ前記第1のサブセットとは異なるSPOトリプルの第2のサブセットを、キュレーテッド・ナレッジ・ベースに対する照会モジュールに管理させること、
前記フリーテキストに対する照会モジュールにより、前記SPOトリプルの前記第1のサブセットにおいて興味のある断片を識別するためにインデックス付けされたテキストデータにアクセスすること、
オープン情報抽出を使用して、興味のある前記断片から前記SPOトリプルの前記第1のサブセットに対応するSPOトリプルを抽出すること
抽出されたSPOトリプルをそれらの前記SPOトリプルの前記第1のサブセットに対するセマンティック的な関連性にしたがってランク付けすること、
ランク付けされ、抽出されたSPOトリプルの上位から所定数のSPOトリプルを選択すること、及び
選択された前記所定数のSPOトリプルを、前記SPOトリプルの第2のサブセットに一体化して、前記質問に対する回答を形成すること
を含む、コンピュータ実装方法。 - 前記一体化することが、選択された所定数の前記SPOトリプルと、前記SPOトリプルの前記第2のサブセットとの間の前記自然言語のパーサにより生成された依存性の観点において実行される、請求項25に記載のコンピュータ実装方法。
- ユーザが前記質問をアップデートする、請求項25に記載のコンピュータ実装方法。
- ユーザが、前記自然言語のパーサから出力を受けて前記SPOトリプルを修正して改善する、請求項25に記載のコンピュータ実装方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/559,351 US11841883B2 (en) | 2019-09-03 | 2019-09-03 | Resolving queries using structured and unstructured data |
US16/559,351 | 2019-09-03 | ||
PCT/IB2020/057852 WO2021044246A1 (en) | 2019-09-03 | 2020-08-21 | Resolving queries using structured and unstructured data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022546228A true JP2022546228A (ja) | 2022-11-04 |
Family
ID=74681171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022508750A Pending JP2022546228A (ja) | 2019-09-03 | 2020-08-21 | 構造化及び非構造化されたデータを使用する照会の解決 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11841883B2 (ja) |
JP (1) | JP2022546228A (ja) |
CN (1) | CN114391142A (ja) |
GB (1) | GB2603323A (ja) |
WO (1) | WO2021044246A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3151518A1 (en) * | 2019-08-16 | 2021-02-25 | Rosoka Software, Inc. | Natural language processing comprehension and response system and methods |
US11694289B2 (en) * | 2020-06-30 | 2023-07-04 | Cerner Innovation, Inc. | System and method for conversion achievement |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7013308B1 (en) * | 2000-11-28 | 2006-03-14 | Semscript Ltd. | Knowledge storage and retrieval system and method |
US7437349B2 (en) | 2002-05-10 | 2008-10-14 | International Business Machines Corporation | Adaptive probabilistic query expansion |
US20070073533A1 (en) | 2005-09-23 | 2007-03-29 | Fuji Xerox Co., Ltd. | Systems and methods for structural indexing of natural language text |
CN101436192B (zh) | 2007-11-16 | 2011-03-16 | 国际商业机器公司 | 用于优化针对垂直存储式数据库的查询的方法和设备 |
CN103229162B (zh) | 2010-09-28 | 2016-08-10 | 国际商业机器公司 | 使用候选答案逻辑综合提供问题答案 |
CN102708129B (zh) | 2011-03-04 | 2017-04-12 | 微软技术许可有限责任公司 | 使用计算引擎来改进搜索相关性 |
CN104216913B (zh) * | 2013-06-04 | 2019-01-04 | Sap欧洲公司 | 问题回答方法、系统和计算机可读介质 |
US9659005B2 (en) | 2014-05-16 | 2017-05-23 | Semantix Technologies Corporation | System for semantic interpretation |
US10585924B2 (en) | 2014-08-08 | 2020-03-10 | Cuong Duc Nguyen | Processing natural-language documents and queries |
US11080295B2 (en) | 2014-11-11 | 2021-08-03 | Adobe Inc. | Collecting, organizing, and searching knowledge about a dataset |
RU2605077C2 (ru) | 2015-03-19 | 2016-12-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Способ и система для хранения и поиска информации, извлекаемой из текстовых документов |
US20160306791A1 (en) * | 2015-04-15 | 2016-10-20 | International Business Machines Corporation | Determining User-Friendly Information to Solicit in a Question and Answer System |
EP3142028A3 (en) | 2015-09-11 | 2017-07-12 | Google, Inc. | Handling failures in processing natural language queries through user interactions |
CN106649394A (zh) | 2015-11-03 | 2017-05-10 | 中兴通讯股份有限公司 | 融合知识库处理方法和装置,以及知识库管理系统 |
KR102447513B1 (ko) * | 2016-01-22 | 2022-09-27 | 한국전자통신연구원 | 점증적 대화지식 자가학습 기반 대화장치 및 그 방법 |
KR101992399B1 (ko) | 2016-07-05 | 2019-06-24 | 한국전자통신연구원 | 하이브리드 추론 기반의 자연어 질의응답 시스템 및 그 방법 |
CN107967285A (zh) | 2016-10-20 | 2018-04-27 | 富士通株式会社 | 数据处理方法和数据处理装置 |
US20200065422A1 (en) * | 2018-08-24 | 2020-02-27 | Facebook, Inc. | Document Entity Linking on Online Social Networks |
US11244231B2 (en) * | 2018-09-05 | 2022-02-08 | Siemens Aktiengesellschaft | Quantum-machine training of knowledge graphs |
US20210182709A1 (en) * | 2019-12-17 | 2021-06-17 | Tata Consultancy Services Limited | Method and system for extracting contextual information from a knowledge base |
-
2019
- 2019-09-03 US US16/559,351 patent/US11841883B2/en active Active
-
2020
- 2020-08-21 JP JP2022508750A patent/JP2022546228A/ja active Pending
- 2020-08-21 GB GB2203699.0A patent/GB2603323A/en not_active Withdrawn
- 2020-08-21 WO PCT/IB2020/057852 patent/WO2021044246A1/en active Application Filing
- 2020-08-21 CN CN202080062121.2A patent/CN114391142A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114391142A (zh) | 2022-04-22 |
WO2021044246A1 (en) | 2021-03-11 |
GB2603323A (en) | 2022-08-03 |
US20210064642A1 (en) | 2021-03-04 |
US11841883B2 (en) | 2023-12-12 |
GB202203699D0 (en) | 2022-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10713571B2 (en) | Displaying quality of question being asked a question answering system | |
US9448995B2 (en) | Method and device for performing natural language searches | |
US9213771B2 (en) | Question answering framework | |
JP7232831B2 (ja) | 複雑な回答の補強証拠取り出し | |
US11914627B1 (en) | Parsing natural language queries without retraining | |
US10585924B2 (en) | Processing natural-language documents and queries | |
US20160041986A1 (en) | Smart Search Engine | |
US20120331003A1 (en) | Efficient passage retrieval using document metadata | |
US11226960B2 (en) | Natural-language database interface with automated keyword mapping and join-path inferences | |
TW201314476A (zh) | 基於本體之自動自助式使用者支援 | |
US11468050B2 (en) | Learning user synonyms from sequenced query sessions | |
WO2013088287A1 (en) | Generation of natural language processing model for information domain | |
JP2023507286A (ja) | 自然言語クエリを構造化クエリ言語に変換するためのスキーマ注釈ファイルの自動作成 | |
US12007988B2 (en) | Interactive assistance for executing natural language queries to data sets | |
JP2011118689A (ja) | 検索方法及びシステム | |
US20220129770A1 (en) | Implementing relation linking for knowledge bases | |
JP2022546228A (ja) | 構造化及び非構造化されたデータを使用する照会の解決 | |
CN112507089A (zh) | 一种基于知识图谱的智能问答引擎及其实现方法 | |
US9904674B2 (en) | Augmented text search with syntactic information | |
Song et al. | Semantic query graph based SPARQL generation from natural language questions | |
Abebe et al. | Supporting concept location through identifier parsing and ontology extraction | |
Kuchmann-Beauger | Question answering system in a business intelligence context | |
Atzori et al. | Querying RDF Data Cubes through Natural Language. | |
TWI850128B (zh) | 一種整合生成式人工智慧的語意搜尋方法 | |
Jain et al. | Enhancing relevancy of Search Engine using schema matching techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220308 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220329 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220518 |
|
RD16 | Notification of change of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7436 Effective date: 20220328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240801 |