JP7060010B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP7060010B2 JP7060010B2 JP2019509011A JP2019509011A JP7060010B2 JP 7060010 B2 JP7060010 B2 JP 7060010B2 JP 2019509011 A JP2019509011 A JP 2019509011A JP 2019509011 A JP2019509011 A JP 2019509011A JP 7060010 B2 JP7060010 B2 JP 7060010B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- converter
- expression
- node
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習する情報処理装置であって、
形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける形式言語クエリ受付部と、
意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける半構造化データ受付部と、
前記半構造化データ受付部が受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出するノードテキスト抽出部と、
前記ノードテキスト抽出部が抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得るノードテキスト式生成部と、
前記ノードテキスト式生成部が得た前記ノードテキスト式を用いて、前記形式言語クエリ受付部が受け付けた前記クエリ式に対する回答を計算する回答計算部と、
前記回答計算部が計算した回答が、前記形式言語クエリ受付部が受け付けた前記正答データと一致する場合に、前記ノードテキスト式生成部が得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する更新部と、
を備えることを特徴とする。
自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習する情報処理方法であって、
(a)形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける、ステップと、
(b)意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける、ステップと、
(c)前記(b)のステップで受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出する、ステップと、
(d)前記(c)のステップで抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得る、ステップと、
(e)前記(d)のステップで得た前記ノードテキスト式を用いて、前記(a)のステップで受け付けた前記クエリ式に対する回答を計算する、ステップと、
(f)前記(e)のステップで計算した回答が、前記(a)のステップで受け付けた前記正答データと一致する場合に、前記(d)のステップで得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、ステップと、
を備えることを特徴とする。
コンピュータに、自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習させるプログラムであって、
前記コンピュータに、
(a)形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける、ステップと、
(b)意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける、ステップと、
(c)前記(b)のステップで受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出する、ステップと、
(d)前記(c)のステップで抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得る、ステップと、
(e)前記(d)のステップで得た前記ノードテキスト式を用いて、前記(a)のステップで受け付けた前記クエリ式に対する回答を計算する、ステップと、
(f)前記(e)のステップで計算した回答が、前記(a)のステップで受け付けた前記正答データと一致する場合に、前記(d)のステップで得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、ステップと、
を実行させることを特徴とする。
以下、本発明の実施の形態における、情報処理装置、情報処理方法及びプログラムについて、図1~13を参照しながら説明する。
図1は、本実施の形態における情報処理装置10を示すブロック図である。図1に示すように、本実施の形態における情報処理装置10は、変換器100の機械学習を行うための装置である。変換器100は、自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する。本実施形態では、変換器100は、例えば、対数線形モデルを利用して、自然言語のテキストを形式言語の式に変換する。変換器100は、例えば、半構造化データを利用する質問応答システムにおいて自然言語を形式言語に変換する際に利用される。なお、変換器100には、例えば、非特許文献1に開示された技術を利用することができる。
次に、本発明の実施の形態における情報処理装置の動作について図12を用いて説明する。図12は、本発明の実施の形態における情報処理装置の動作を示すフロー図である。以下の説明においては、適宜図1~図11を参酌する。また、本実施の形態では、情報処理装置10を動作させることによって、情報処理方法が実施される。よって、本実施の形態における情報処理方法の説明は、以下の情報処理装置10の動作説明に代える。
なお、図2に示した例では、第1変換器102aと第2変換器104aとが、異なる素性及びパラメータを利用する場合について説明したが、第1変換器102aと第2変換器104aとが共通の素性及びパラメータを用いてもよい。すなわち、第1変換器102aと第2変換器104aとが、共通のパラメータ保持部に格納された素性及びパラメータを用いてもよい。この場合、更新部22は、その共通のパラメータ保持部に格納されたパラメータを更新すればよい。
本発明の実施の形態におけるプログラムは、コンピュータに、図12に示すステップS1~S11を実行させるプログラムであればよい。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態における情報処理装置と情報処理方法とを実現することができる。この場合、情報処理装置となるコンピュータのプロセッサは、形式言語クエリ受付部12、半構造化データ受付部14、ノードテキスト抽出部16、ノードテキスト式生成部18、回答計算部20、更新部22、補正部24、自然言語クエリ受付部26、クエリ式生成部28及び出力部30として機能し、処理を行なう。
ここで、本実施の形態におけるプログラムを実行することによって、情報処理装置を実現するコンピュータについて図を用いて説明する。図13は、本発明の実施の形態における情報処理装置を実現するコンピュータの一例を示すブロック図である。
自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習する情報処理装置であって、
形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける形式言語クエリ受付部と、
意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける半構造化データ受付部と、
前記半構造化データ受付部が受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出するノードテキスト抽出部と、
前記ノードテキスト抽出部が抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得るノードテキスト式生成部と、
前記ノードテキスト式生成部が得た前記ノードテキスト式を用いて、前記形式言語クエリ受付部が受け付けた前記クエリ式に対する回答を計算する回答計算部と、
前記回答計算部が計算した回答が、前記形式言語クエリ受付部が受け付けた前記正答データと一致する場合に、前記ノードテキスト式生成部が得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する更新部と、
を備えることを特徴とする情報処理装置。
前記半構造化データは、前記テキストノードを含む複数のノードが相互に関連付けられたグラフ構造で表すことができる、
付記1に記載の情報処理装置。
前記ノードテキスト式を補正する補正部を更に備え、
前記テキストノードにラベルが関連付けられており、
前記補正部は、前記ノードテキスト式を、対応する前記テキストノードに関連付けられたラベルに対応する述語に組み合せることによって補正し、
前記回答計算部は、前記補正部によって補正された前記ノードテキスト式を用いてクエリ式に対する回答を計算する、
付記1又は2に記載の情報処理装置。
自然言語で記述されたクエリ、及び、前記クエリに対する適切な回答を表す前記正答データを受け付ける自然言語クエリ受付部と、
前記自然言語クエリ受付部が受け付けた前記クエリを前記変換器に入力して、形式言語で記述されたクエリ式を前記変換器から得るクエリ式生成部と、を更に備え、
前記更新部は、前記回答計算部が計算した回答が前記正答データと一致する場合に、前記クエリ式生成部が得た前記クエリ式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、
付記1~3のいずれかに記載の情報処理装置。
前記変換器は、前記ノードテキスト式を出力する第1変換器と、前記クエリ式を出力する第2変換器とを含む、
付記4に記載の情報処理装置。
前記第1変換器と前記第2変換器とがパラメータを共有している、
付記5に記載の情報処理装置。
前記パラメータは、前記第1変換器の第1パラメータと、前記第2変換器の第2パラメータとを含む、
付記5に記載の情報処理装置。
前記変換器のパラメータが、前記変換器に入力される自然言語のテキスト、及び、前記変換器が出力する形式言語の式のペアが保有する特徴に関連付けられた重みであり、
前記更新部は、前記回答計算部が計算した回答が前記正答データと一致する場合に、前記ノードテキスト及び前記ノードテキスト式のペアが保有する特徴に関連付けられた重みが増加するように、前記パラメータを更新する、
付記1~7のいずれかに記載の情報処理装置。
前記更新部によって更新された前記変換器の前記パラメータを出力する出力部を更に備えた、
付記1~8のいずれかに記載の情報処理装置。
自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習する情報処理方法であって、
(a)形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける、ステップと、
(b)意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける、ステップと、
(c)前記(b)のステップで受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出する、ステップと、
(d)前記(c)のステップで抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得る、ステップと、
(e)前記(d)のステップで得た前記ノードテキスト式を用いて、前記(a)のステップで受け付けた前記クエリ式に対する回答を計算する、ステップと、
(f)前記(e)のステップで計算した回答が、前記(a)のステップで受け付けた前記正答データと一致する場合に、前記(d)のステップで得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、ステップと、
を備えることを特徴とする情報処理方法。
前記半構造化データは、前記テキストノードを含む複数のノードが相互に関連付けられたグラフ構造で表すことができる、
付記10に記載の情報処理方法。
(g)前記ノードテキスト式を補正する、ステップを更に備え、
前記テキストノードにラベルが関連付けられており、
前記(g)のステップでは、前記ノードテキスト式を、対応する前記テキストノードに関連付けられたラベルに対応する述語に組み合せることによって補正し、
前記(e)のステップでは、前記(g)のステップで補正された前記ノードテキスト式を用いてクエリ式に対する回答を計算する、
付記10又は11に記載の情報処理方法。
(h)自然言語で記述されたクエリを受け付ける、ステップと、
(i)前記(h)のステップで受け付けた前記クエリを前記変換器に入力して、形式言語で記述されたクエリ式を前記変換器から得る、ステップと、
を更に備え、
前記(a)のステップでは、前記(i)のステップで前記変換器から得た前記クエリ式を受け付け、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記(i)のステップで得た前記クエリ式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、
付記10~12のいずれかに記載の情報処理方法。
前記変換器は、前記ノードテキスト式を出力する第1変換器と、前記クエリ式を出力する第2変換器とを含む、
付記13に記載の情報処理方法。
前記第1変換器と前記第2変換器とがパラメータを共有している、
付記14に記載の情報処理方法。
前記パラメータは、前記第1変換器の第1パラメータと、前記第2変換器の第2パラメータとを含む、
付記14に記載の情報処理方法。
前記変換器のパラメータが、前記変換器に入力される自然言語のテキスト、及び、前記変換器が出力する形式言語の式のペアが保有する特徴に関連付けられた重みであり、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記ノードテキスト及び前記ノードテキスト式のペアが保有する特徴に関連付けられた重みが増加するように、前記パラメータを更新する、
付記10~16のいずれかに記載の情報処理方法。
(j)前記(f)のステップで更新された前記変換器の前記パラメータを出力するステップ、を更に備える、
付記10~17のいずれかに記載の情報処理方法。
コンピュータに、自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習させるプログラムであって、
前記コンピュータに、
(a)形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける、ステップと、
(b)意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける、ステップと、
(c)前記(b)のステップで受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出する、ステップと、
(d)前記(c)のステップで抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得る、ステップと、
(e)前記(d)のステップで得た前記ノードテキスト式を用いて、前記(a)のステップで受け付けた前記クエリ式に対する回答を計算する、ステップと、
(f)前記(e)のステップで計算した回答が、前記(a)のステップで受け付けた前記正答データと一致する場合に、前記(d)のステップで得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、ステップと、
を実行させるプログラム。
前記半構造化データは、前記テキストノードを含む複数のノードが相互に関連付けられたグラフ構造で表すことができる、
付記19に記載のプログラム。
前記コンピュータに、
(g)前記ノードテキスト式を補正するステップ、を実行させる命令を更に含み、
前記テキストノードにラベルが関連付けられており、
前記(g)のステップでは、前記ノードテキスト式を、対応する前記テキストノードに関連付けられたラベルに対応する述語に組み合せることによって補正し、
前記(e)のステップでは、前記(g)のステップで補正された前記ノードテキスト式を用いてクエリ式に対する回答を計算する、
付記19又は20に記載のプログラム。
前記コンピュータに、
(h)自然言語で記述されたクエリを受け付ける、ステップと、
(i)前記(h)のステップで受け付けた前記クエリを前記変換器に入力して、形式言語で記述されたクエリ式を前記変換器から得る、ステップと、
を実行させる命令を更に含み、
前記(a)のステップでは、前記(i)のステップで前記変換器から得た前記クエリ式を受け付け、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記(i)のステップで得た前記クエリ式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、
付記19~21のいずれかに記載のプログラム。
前記変換器は、前記ノードテキスト式を出力する第1変換器と、前記クエリ式を出力する第2変換器とを含む、
付記22に記載のプログラム。
前記第1変換器と前記第2変換器とがパラメータを共有している、
付記23に記載のプログラム。
前記パラメータは、前記第1変換器の第1パラメータと、前記第2変換器の第2パラメータとを含む、
付記23に記載のプログラム。
前記変換器のパラメータが、前記変換器に入力される自然言語のテキスト、及び、前記変換器が出力する形式言語の式のペアが保有する特徴に関連付けられた重みであり、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記ノードテキスト及び前記ノードテキスト式のペアが保有する特徴に関連付けられた重みが増加するように、前記パラメータを更新する、
付記19~25のいずれかに記載のプログラム。
前記プログラムが、前記コンピュータに、
(j)前記(f)のステップで更新された前記変換器の前記パラメータを出力するステップ、を実行させる命令を更に含む、
付記19~26のいずれかに記載のプログラム。
12 形式言語クエリ受付部
14 半構造化データ受付部
16 ノードテキスト抽出部
18 ノードテキスト式生成部
20 回答計算部
22 更新部
24 補正部
26 自然言語クエリ受付部
28 クエリ式生成部
30 出力部
100 変換器
102a 第1変換器
102b 第1パラメータ保持部
104a 第2変換器
104b 第2パラメータ保持部
Claims (27)
- 自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習する情報処理装置であって、
形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける形式言語クエリ受付部と、
意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける半構造化データ受付部と、
前記半構造化データ受付部が受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出するノードテキスト抽出部と、
前記ノードテキスト抽出部が抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得るノードテキスト式生成部と、
前記ノードテキスト式生成部が得た前記ノードテキスト式を用いて、前記形式言語クエリ受付部が受け付けた前記クエリ式に対する回答を計算する回答計算部と、
前記回答計算部が計算した回答が、前記形式言語クエリ受付部が受け付けた前記正答データと一致する場合に、前記ノードテキスト式生成部が得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する更新部と、
を備えることを特徴とする情報処理装置。 - 前記半構造化データは、前記テキストノードを含む複数のノードが相互に関連付けられたグラフ構造で表すことができる、
請求項1に記載の情報処理装置。 - 前記ノードテキスト式を補正する補正部を更に備え、
前記テキストノードにラベルが関連付けられており、
前記補正部は、前記ノードテキスト式を、対応する前記テキストノードに関連付けられたラベルに対応する述語に組み合せることによって補正し、
前記回答計算部は、前記補正部によって補正された前記ノードテキスト式を用いてクエリ式に対する回答を計算する、
請求項1又は2に記載の情報処理装置。 - 自然言語で記述されたクエリ、及び、前記クエリに対する適切な回答を表す前記正答データを受け付ける自然言語クエリ受付部と、
前記自然言語クエリ受付部が受け付けた前記クエリを前記変換器に入力して、形式言語で記述されたクエリ式を前記変換器から得るクエリ式生成部と、を更に備え、
前記更新部は、前記回答計算部が計算した回答が前記正答データと一致する場合に、前記クエリ式生成部が得た前記クエリ式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、
請求項1~3のいずれかに記載の情報処理装置。 - 前記変換器は、前記ノードテキスト式を出力する第1変換器と、前記クエリ式を出力する第2変換器とを含む、
請求項4に記載の情報処理装置。 - 前記第1変換器と前記第2変換器とがパラメータを共有している、
請求項5に記載の情報処理装置。 - 前記パラメータは、前記第1変換器の第1パラメータと、前記第2変換器の第2パラメータとを含む、
請求項5に記載の情報処理装置。 - 前記変換器のパラメータが、前記変換器に入力される自然言語のテキスト、及び、前記変換器が出力する形式言語の式のペアが保有する特徴に関連付けられた重みであり、
前記更新部は、前記回答計算部が計算した回答が前記正答データと一致する場合に、前記ノードテキスト及び前記ノードテキスト式のペアが保有する特徴に関連付けられた重みが増加するように、前記パラメータを更新する、
請求項1~7のいずれかに記載の情報処理装置。 - 前記更新部によって更新された前記変換器の前記パラメータを出力する出力部を更に備えた、
請求項1~8のいずれかに記載の情報処理装置。 - 自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習する情報処理方法であって、
(a)形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける、ステップと、
(b)意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける、ステップと、
(c)前記(b)のステップで受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出する、ステップと、
(d)前記(c)のステップで抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得る、ステップと、
(e)前記(d)のステップで得た前記ノードテキスト式を用いて、前記(a)のステップで受け付けた前記クエリ式に対する回答を計算する、ステップと、
(f)前記(e)のステップで計算した回答が、前記(a)のステップで受け付けた前記正答データと一致する場合に、前記(d)のステップで得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、ステップと、
を備えることを特徴とする情報処理方法。 - 前記半構造化データは、前記テキストノードを含む複数のノードが相互に関連付けられたグラフ構造で表すことができる、
請求項10に記載の情報処理方法。 - (g)前記ノードテキスト式を補正する、ステップを更に備え、
前記テキストノードにラベルが関連付けられており、
前記(g)のステップでは、前記ノードテキスト式を、対応する前記テキストノードに関連付けられたラベルに対応する述語に組み合せることによって補正し、
前記(e)のステップでは、前記(g)のステップで補正された前記ノードテキスト式を用いてクエリ式に対する回答を計算する、
請求項10又は11に記載の情報処理方法。 - (h)自然言語で記述されたクエリを受け付ける、ステップと、
(i)前記(h)のステップで受け付けた前記クエリを前記変換器に入力して、形式言語で記述されたクエリ式を前記変換器から得る、ステップと、
を更に備え、
前記(a)のステップでは、前記(i)のステップで前記変換器から得た前記クエリ式を受け付け、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記(i)のステップで得た前記クエリ式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、
請求項10~12のいずれかに記載の情報処理方法。 - 前記変換器は、前記ノードテキスト式を出力する第1変換器と、前記クエリ式を出力する第2変換器とを含む、
請求項13に記載の情報処理方法。 - 前記第1変換器と前記第2変換器とがパラメータを共有している、
請求項14に記載の情報処理方法。 - 前記パラメータは、前記第1変換器の第1パラメータと、前記第2変換器の第2パラメータとを含む、
請求項14に記載の情報処理方法。 - 前記変換器のパラメータが、前記変換器に入力される自然言語のテキスト、及び、前記変換器が出力する形式言語の式のペアが保有する特徴に関連付けられた重みであり、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記ノードテキスト及び前記ノードテキスト式のペアが保有する特徴に関連付けられた重みが増加するように、前記パラメータを更新する、
請求項10~16のいずれかに記載の情報処理方法。 - (j)前記(f)のステップで更新された前記変換器の前記パラメータを出力するステップ、を更に備える、
請求項10~17のいずれかに記載の情報処理方法。 - コンピュータに、自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する変換器を機械学習させるプログラムであって、
前記コンピュータに、
(a)形式言語で記述されたクエリ式、及び、前記クエリ式に対する適切な回答を表す正答データを受け付ける、ステップと、
(b)意味構造を有する自然言語のテキストを含むテキストノードを有する半構造化データの入力を受け付ける、ステップと、
(c)前記(b)のステップで受け付けた前記半構造化データの前記テキストノードから前記自然言語のテキストをノードテキストとして抽出する、ステップと、
(d)前記(c)のステップで抽出した前記ノードテキストを前記変換器に入力して、形式言語の式であるノードテキスト式を前記変換器から得る、ステップと、
(e)前記(d)のステップで得た前記ノードテキスト式を用いて、前記(a)のステップで受け付けた前記クエリ式に対する回答を計算する、ステップと、
(f)前記(e)のステップで計算した回答が、前記(a)のステップで受け付けた前記正答データと一致する場合に、前記(d)のステップで得た前記ノードテキスト式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、ステップと、
を実行させる命令を含む、プログラム。 - 前記半構造化データは、前記テキストノードを含む複数のノードが相互に関連付けられたグラフ構造で表すことができる、
請求項19に記載のプログラム。 - 前記コンピュータに、
(g)前記ノードテキスト式を補正するステップ、を実行させる命令を更に含み、
前記テキストノードにラベルが関連付けられており、
前記(g)のステップでは、前記ノードテキスト式を、対応する前記テキストノードに関連付けられたラベルに対応する述語に組み合せることによって補正し、
前記(e)のステップでは、前記(g)のステップで補正された前記ノードテキスト式を用いてクエリ式に対する回答を計算する、
請求項19又は20に記載のプログラム。 - 前記コンピュータに、
(h)自然言語で記述されたクエリを受け付ける、ステップと、
(i)前記(h)のステップで受け付けた前記クエリを前記変換器に入力して、形式言語で記述されたクエリ式を前記変換器から得る、ステップと、
を実行させる命令を更に含み、
前記(a)のステップでは、前記(i)のステップで前記変換器から得た前記クエリ式を受け付け、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記(i)のステップで得た前記クエリ式が前記変換器において出力されやすくなるように前記変換器の前記パラメータを更新する、
請求項19~21のいずれかに記載のプログラム。 - 前記変換器は、前記ノードテキスト式を出力する第1変換器と、前記クエリ式を出力する第2変換器とを含む、
請求項22に記載のプログラム。 - 前記第1変換器と前記第2変換器とがパラメータを共有している、
請求項23に記載のプログラム。 - 前記パラメータは、前記第1変換器の第1パラメータと、前記第2変換器の第2パラメータとを含む、
請求項23に記載のプログラム。 - 前記変換器のパラメータが、前記変換器に入力される自然言語のテキスト、及び、前記変換器が出力する形式言語の式のペアが保有する特徴に関連付けられた重みであり、
前記(f)のステップでは、前記(e)のステップで計算した回答が前記正答データと一致する場合に、前記ノードテキスト及び前記ノードテキスト式のペアが保有する特徴に関連付けられた重みが増加するように、前記パラメータを更新する、
請求項19~25のいずれかに記載のプログラム。 - 前記コンピュータに、
(j)前記(f)のステップで更新された前記変換器の前記パラメータを出力するステップ、を実行させる命令を更に含む、
請求項19~26のいずれかに記載のプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017068453 | 2017-03-30 | ||
JP2017068453 | 2017-03-30 | ||
PCT/JP2018/007040 WO2018180106A1 (ja) | 2017-03-30 | 2018-02-26 | 情報処理装置、情報処理方法及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018180106A1 JPWO2018180106A1 (ja) | 2020-02-13 |
JP7060010B2 true JP7060010B2 (ja) | 2022-04-26 |
Family
ID=63675300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019509011A Active JP7060010B2 (ja) | 2017-03-30 | 2018-02-26 | 情報処理装置、情報処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11669691B2 (ja) |
JP (1) | JP7060010B2 (ja) |
WO (1) | WO2018180106A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7149560B2 (ja) * | 2018-04-13 | 2022-10-07 | 国立研究開発法人情報通信研究機構 | リクエスト言換システム、リクエスト言換モデル及びリクエスト判定モデルの訓練方法、及び対話システム |
CN112559552B (zh) * | 2020-12-03 | 2023-07-25 | 北京百度网讯科技有限公司 | 数据对生成方法、装置、电子设备及存储介质 |
US20220318283A1 (en) * | 2021-03-31 | 2022-10-06 | Rovi Guides, Inc. | Query correction based on reattempts learning |
US11481985B1 (en) * | 2021-04-23 | 2022-10-25 | International Business Machines Corporation | Augmented reality enabled appetite enhancement |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014158182A2 (en) | 2013-03-29 | 2014-10-02 | Ajit Bhave | Organizing and fast searching of data |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0546370A (ja) | 1991-08-16 | 1993-02-26 | Toshiba Corp | プログラム生成装置 |
CN105528349B (zh) * | 2014-09-29 | 2019-02-01 | 华为技术有限公司 | 知识库中问句解析的方法及设备 |
JP2016095698A (ja) | 2014-11-14 | 2016-05-26 | 日本電信電話株式会社 | 翻訳学習装置、翻訳装置、方法、及びプログラム |
CN106844368B (zh) * | 2015-12-03 | 2020-06-16 | 华为技术有限公司 | 用于人机对话的方法、神经网络系统和用户设备 |
US10528328B2 (en) * | 2015-12-08 | 2020-01-07 | Microsoft Technology Licensing, Llc | Learning from input patterns in Programing-By-Example |
US10769209B1 (en) * | 2017-01-13 | 2020-09-08 | Marklogic Corporation | Apparatus and method for template driven data extraction in a semi-structured document database |
US20190266286A1 (en) * | 2018-02-28 | 2019-08-29 | Jordi Torras | Method and system for a semantic search engine using an underlying knowledge base |
-
2018
- 2018-02-26 WO PCT/JP2018/007040 patent/WO2018180106A1/ja active Application Filing
- 2018-02-26 JP JP2019509011A patent/JP7060010B2/ja active Active
- 2018-02-26 US US16/498,801 patent/US11669691B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014158182A2 (en) | 2013-03-29 | 2014-10-02 | Ajit Bhave | Organizing and fast searching of data |
Also Published As
Publication number | Publication date |
---|---|
US11669691B2 (en) | 2023-06-06 |
US20210191986A1 (en) | 2021-06-24 |
WO2018180106A1 (ja) | 2018-10-04 |
JPWO2018180106A1 (ja) | 2020-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7060010B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11947917B2 (en) | Natural language processing with an n-gram machine | |
US10210245B2 (en) | Natural language question answering method and apparatus | |
US9147007B2 (en) | Query expression conversion apparatus, query expression conversion method, and computer program product | |
US8788266B2 (en) | Language model creation device, language model creation method, and computer-readable storage medium | |
MXPA04010820A (es) | Sistema para identificar parafrasis utilizando tecnicas de traduccion de maquina. | |
JP6733809B2 (ja) | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム | |
US20220245353A1 (en) | System and method for entity labeling in a natural language understanding (nlu) framework | |
KR101409413B1 (ko) | 단일화 문법을 이용한 자연어 처리 방법 | |
WO2019150583A1 (ja) | 質問群抽出方法、質問群抽出装置および記録媒体 | |
US20140172757A1 (en) | System and Method For Learning Answers To Frequently Asked Questions From a Semi-Structured Data Source | |
US20220222442A1 (en) | Parameter learning apparatus, parameter learning method, and computer readable recording medium | |
JPWO2021112141A5 (ja) | ||
JP2015153261A (ja) | 対話文生成装置、対話文生成方法およびプログラム | |
JP6973515B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20220229998A1 (en) | Lookup source framework for a natural language understanding (nlu) framework | |
Hwang et al. | End-to-end dialogue system with multi languages for hospital receptionist robot | |
Anil Kumar et al. | Providing Natural Language Interface To Database Using Artificial Intelligence | |
KR102324196B1 (ko) | 지식 베이스 보강을 위한 시스템 및 방법 | |
JP6662000B2 (ja) | テーブル語義化装置及び方法 | |
CN112417851A (zh) | 文本纠错分词方法、系统及电子设备 | |
WO2023026444A1 (ja) | 要約学習支援装置、要約学習支援方法及びプログラム | |
US20220245352A1 (en) | Ensemble scoring system for a natural language understanding (nlu) framework | |
JP5856905B2 (ja) | 主題抽出装置およびそのプログラム | |
US20220245350A1 (en) | Framework and interface for machines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190926 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220328 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7060010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |