JP2021111314A - 構造化クエリステートメントを出力する方法および装置 - Google Patents
構造化クエリステートメントを出力する方法および装置 Download PDFInfo
- Publication number
- JP2021111314A JP2021111314A JP2020097333A JP2020097333A JP2021111314A JP 2021111314 A JP2021111314 A JP 2021111314A JP 2020097333 A JP2020097333 A JP 2020097333A JP 2020097333 A JP2020097333 A JP 2020097333A JP 2021111314 A JP2021111314 A JP 2021111314A
- Authority
- JP
- Japan
- Prior art keywords
- structured query
- sample
- statement
- directed acyclic
- acyclic graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Discrete Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (12)
- 構造化クエリステートメント(query statement)を出力する方法であって、
変換する自然言語ステートメントを取得するステップと、
前記変換する自然言語ステートメントを事前トレーニングされたSeq2Seqモデルに入力して、前記変換する自然言語ステートメントに対応するアクションシーケンスを取得するステップと、
前記アクションシーケンスにしたがって有向非循環グラフを生成するステップと、
事前設置された有向非循環グラフと構造化クエリステートメントとの対応関係にしたがって、生成された有向非循環グラフに対応する構造化クエリステートメントを出力するステップとを含む、構造化クエリステートメントを出力する方法。 - 前記Seq2Seqモデルは、以下のステップのトレーニングによって取得されるモデルを含み、
サンプル自然言語ステートメントおよびサンプル自然言語ステートメントに対応するサンプル構造化クエリステートメントを含むサンプルセットを取得するステップと、
事前設置された有向非循環グラフと構造化クエリステートメントの対応関係にしたがって、前記サンプルセット中のサンプル構造化クエリステートメントに対応するサンプル有向非循環グラフを確定するステップと、
確定されたサンプル有向非循環グラフのサンプルアクションシーケンスを取得するステップと、
サンプル自然言語ステートメントとサンプル自然言語ステートメントに対応するサンプルアクションシーケンスをそれぞれ、入力と出力として、トレーニングして前記Seq2Seqモデルを取得するステップであることを特徴とする
請求項1に記載の方法。 - 前記アクションシーケンスにしたがって有向非循環グラフを生成するステップは、
Shift−reduce法に基づいて、前記アクションシーケンスにしたがって有向非循環グラフを生成するステップを含むことを特徴とする
請求項1に記載の方法。 - 前記有向非循環グラフは、親ノード情報、子ノード情報および関係情報を含む少なくとも1つの情報アイテムの組み合わせを含むことを特徴とする
請求項1に記載の方法。 - 前記事前設置された有向非循環グラフと構造化クエリステートメントとの対応関係にしたがって、生成された有向非循環グラフに対応する構造化クエリステートメントを出力するステップは、
有向非循環グラフのノードを構造化クエリステートメント中の第1の部分として確定するステップであって、前記第1の部分は、演算子、フィールド名、テーブル名、属性を含むステップと、
有向非循環グラフ中のノード間の関係を構造化クエリステートメント中の第2の部分として確定するステップとを含むことを特徴とする
請求項1〜4のいずれか一項に記載の方法。 - 構造化クエリステートメントを出力する装置であって、
変換する自然言語ステートメントを取得するように構成される取得ユニットと、
前記変換する自然言語ステートメントを事前トレーニングされたSeq2Seqモデルに入力して、前記変換する自然言語ステートメントに対応するアクションシーケンスを取得するように構成される入力ユニットと、
前記アクションシーケンスにしたがって有向非循環グラフを生成するように構成される生成ユニットと、
事前設置された有向非循環グラフと構造化クエリステートメントとの対応関係にしたがって、生成された有向非循環グラフに対応する構造化クエリステートメントを出力するように構成される出力ユニットとを含む、構造化クエリステートメントを出力する装置。 - 前記装置は、トレーニングユニットをさらに含み、前記トレーニングユニットは、
サンプル自然言語ステートメントおよびサンプル自然言語ステートメントに対応するサンプル構造化クエリステートメントを含むサンプルセットを取得するように構成される取得サブユニットと、
事前設置された有向非循環グラフと構造化クエリステートメントの対応関係にしたがって、前記サンプルセット中のサンプル構造化クエリステートメントに対応するサンプル有向非循環グラフを確定するように構成される第1の確定サブユニットと、
確定されたサンプル有向非循環グラフのサンプルアクションシーケンスを取得するように構成される取得サブユニットと、
サンプル自然言語ステートメントとサンプル自然言語ステートメントに対応するサンプルアクションシーケンスをそれぞれ、入力と出力として、トレーニングして前記Seq2Seqモデルを取得するように構成されるトレーニングサブユニットとを含むことを特徴とする
請求項6に記載の装置。 - 前記生成ユニットは、Shift−reduce法に基づいて、前記アクションシーケンスにしたがって有向非循環グラフを生成するようにさらに構成されることを特徴とする
請求項6に記載の装置。 - 前記有向非循環グラフは、親ノード情報、子ノード情報および関係情報を含む少なくとも1つの情報アイテムの組み合わせを含むことを特徴とする
請求項6に記載の装置。 - 前記出力ユニットは、
有向非循環グラフのノードを構造化クエリステートメント中の第1の部分として確定するように構成される第2の確定サブユニットであって、前記第1の部分は、演算子、フィールド名、テーブル名、属性を含む第2の確定サブユニットと、
有向非循環グラフ中のノード間の関係を構造化クエリステートメント中の第2の部分として確定するように構成される第3の確定サブユニットとを含むことを特徴とする
請求項5〜9のいずれか一項に記載の装置。 - 電子機器であって、
1つまたは複数のプロセッサと、および
1つまたは複数のプログラムが記憶されている記憶装置とを含み、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサが請求項1〜5のいずれか一項に記載の方法を実施する、電子機器。 - コンピュータプログラムが記憶されているコンピュータ可読媒体であって、
前記プログラムがプロセッサによって実行されると、請求項1〜5のいずれか一項に記載の方法が実施される、コンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911413464.4 | 2019-12-31 | ||
CN201911413464.4A CN111125154B (zh) | 2019-12-31 | 2019-12-31 | 用于输出结构化查询语句的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111314A true JP2021111314A (ja) | 2021-08-02 |
JP7096289B2 JP7096289B2 (ja) | 2022-07-05 |
Family
ID=70506553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020097333A Active JP7096289B2 (ja) | 2019-12-31 | 2020-06-04 | 構造化クエリステートメントを出力する方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11449500B2 (ja) |
JP (1) | JP7096289B2 (ja) |
CN (1) | CN111125154B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114461665B (zh) * | 2022-01-26 | 2023-01-24 | 北京百度网讯科技有限公司 | 用于生成语句转换模型的方法、装置及计算机程序产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018213530A2 (en) * | 2017-05-18 | 2018-11-22 | Salesforce.Com, Inc | Neural network based translation of natural language queries to database queries |
US20180349377A1 (en) * | 2017-06-03 | 2018-12-06 | Apple Inc. | Converting natural language input to structured queries |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8312389B2 (en) * | 2007-08-31 | 2012-11-13 | Fair Isaac Corporation | Visualization of decision logic |
CN104657439B (zh) * | 2015-01-30 | 2019-12-13 | 欧阳江 | 用于自然语言精准检索的结构化查询语句生成系统及方法 |
CN107451153B (zh) * | 2016-05-31 | 2020-03-31 | 北京京东尚科信息技术有限公司 | 输出结构化查询语句的方法和装置 |
CN108319585B (zh) * | 2018-01-29 | 2021-03-02 | 北京三快在线科技有限公司 | 数据处理方法及装置、电子设备、计算机可读介质 |
CN109271496B (zh) * | 2018-08-30 | 2021-12-24 | 广东工业大学 | 一种基于文本、知识库及序列到序列的自然问答方法 |
CN109635253B (zh) * | 2018-11-13 | 2024-05-28 | 平安科技(深圳)有限公司 | 文本风格转换方法、装置及存储介质、计算机设备 |
CN109684501B (zh) * | 2018-11-26 | 2023-08-22 | 平安科技(深圳)有限公司 | 歌词信息生成方法及其装置 |
CN109766355A (zh) * | 2018-12-28 | 2019-05-17 | 上海汇付数据服务有限公司 | 一种支持自然语言的数据查询方法和系统 |
US11550783B2 (en) * | 2019-04-18 | 2023-01-10 | Sap Se | One-shot learning for text-to-SQL |
CN110377902B (zh) * | 2019-06-21 | 2023-07-25 | 北京百度网讯科技有限公司 | 描述文本生成模型的训练方法和装置 |
-
2019
- 2019-12-31 CN CN201911413464.4A patent/CN111125154B/zh active Active
-
2020
- 2020-06-04 JP JP2020097333A patent/JP7096289B2/ja active Active
- 2020-06-04 US US16/892,874 patent/US11449500B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018213530A2 (en) * | 2017-05-18 | 2018-11-22 | Salesforce.Com, Inc | Neural network based translation of natural language queries to database queries |
US20180349377A1 (en) * | 2017-06-03 | 2018-12-06 | Apple Inc. | Converting natural language input to structured queries |
Also Published As
Publication number | Publication date |
---|---|
CN111125154B (zh) | 2021-04-02 |
CN111125154A (zh) | 2020-05-08 |
JP7096289B2 (ja) | 2022-07-05 |
US20210200763A1 (en) | 2021-07-01 |
US11449500B2 (en) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102342604B1 (ko) | 뉴럴 네트워크 생성 방법 및 장치 | |
JP7208952B2 (ja) | 対話モデルを生成するための方法及び装置 | |
CN111159220B (zh) | 用于输出结构化查询语句的方法和装置 | |
CN110969012B (zh) | 文本纠错方法、装置、存储介质及电子设备 | |
JP2022002079A (ja) | 異種グラフノード表現用のモデル生成方法及び装置 | |
CN109992338B (zh) | 用于跨多个平台显露虚拟助理服务的方法和系统 | |
US11321534B2 (en) | Conversation space artifact generation using natural language processing, machine learning, and ontology-based techniques | |
CN116127020A (zh) | 生成式大语言模型训练方法以及基于模型的搜索方法 | |
WO2021259205A1 (zh) | 一种文本序列生成方法、装置、设备和介质 | |
CN111104796B (zh) | 用于翻译的方法和装置 | |
CN117591650A (zh) | 计算机实施的方法、训练系统和计算机程序产品 | |
CN110097936B (zh) | 用于输出病历的方法和装置 | |
CN112487137A (zh) | 使用集成共享资源来流线化对话处理 | |
CN111008213A (zh) | 用于生成语言转换模型的方法和装置 | |
CN112182255A (zh) | 用于存储媒体文件和用于检索媒体文件的方法和装置 | |
CN113190517B (zh) | 数据集成方法、装置、电子设备和计算机可读介质 | |
JP7096289B2 (ja) | 構造化クエリステートメントを出力する方法および装置 | |
CN113468344A (zh) | 实体关系抽取方法、装置、电子设备和计算机可读介质 | |
KR20210080561A (ko) | 컨설팅 정보 처리 방법 및 장치 | |
CN110689285A (zh) | 测试方法、装置、电子设备及计算机可读存储介质 | |
CN112148847B (zh) | 一种语音信息的处理方法及装置 | |
CN109857838B (zh) | 用于生成信息的方法和装置 | |
WO2021098876A1 (zh) | 一种基于知识图谱的问答方法及装置 | |
JP2018198043A (ja) | 文字や単語を入力する方法、及び入力システム | |
CN110990528A (zh) | 一种问答方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200917 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7096289 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |