JP6954549B1 - エンティティとインテントとコーパスの自動生成装置及びプログラム - Google Patents
エンティティとインテントとコーパスの自動生成装置及びプログラム Download PDFInfo
- Publication number
- JP6954549B1 JP6954549B1 JP2021099311A JP2021099311A JP6954549B1 JP 6954549 B1 JP6954549 B1 JP 6954549B1 JP 2021099311 A JP2021099311 A JP 2021099311A JP 2021099311 A JP2021099311 A JP 2021099311A JP 6954549 B1 JP6954549 B1 JP 6954549B1
- Authority
- JP
- Japan
- Prior art keywords
- entity
- intent
- text data
- word
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
2 受付部
3 処理部
4 出力部
11 テーブル格納部
12 インテント格納部
13 情報格納部
15 エンティティ格納部
16 エンティティマッピング情報格納部
17 PK項目格納部
21 会話文受付手段
30 パラメータ化手段
31 インテント決定手段
32 会話文情報決定手段
33 エンティティ取得部
34 パラメータ取得部
35 情報取得手段
36 問合情報構成部
37 検索結果取得手段
41 検索結果出力手段
51 エンティティ知識DB
52 インテント知識DB
53 コーパス知識DB
100 エンティティ自動生成装置
211 音声受付手段
212 音声認識手段
213 文字列受付手段
341 判断手段
343 エンティティ名取得手段
344 翻訳項目名取得手段
345 テーブル識別子取得手段
346 主キー識別子取得手段
347 変換パラメータ取得手段
Claims (12)
- 文書又は会話文からテキストデータを取得するテキストデータ取得手段と、
上記テキストデータ取得手段により取得されたテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出手段と、
単語とエンティティ決定情報とが互いに関連付けられたエンティティ知識データベースを参照し、上記抽出手段により抽出された単語と関連するエンティティ決定情報を探索して抽出するエンティティ候補探索手段と、
上記エンティティ候補探索手段により抽出されたエンティティ決定情報を上記単語のエンティティとして登録するとともに、当該単語をエンティティ値として登録するエンティティ登録手段と、
上記テキストデータをインテントとして登録するとともに、少なくとも指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、上記抽出手段により抽出された指示動作に対応したアクション決定情報を登録するインテント登録手段とを備え、
上記エンティティ候補探索手段は、単語とエンティティ決定情報とが3段階以上の連関度を以って関連付けられたエンティティ知識データベースを参照し、上記抽出手段により抽出された単語と関連するエンティティ決定情報を探索すること
を特徴とするエンティティとインテントの自動生成装置。 - 文書又は会話文からテキストデータを取得するテキストデータ取得手段と、
上記テキストデータ取得手段により取得されたテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出手段と、
単語とエンティティ決定情報とが互いに関連付けられたエンティティ知識データベースを参照し、上記抽出手段により抽出された単語と関連するエンティティ決定情報を探索して抽出するエンティティ候補探索手段と、
上記エンティティ候補探索手段により抽出されたエンティティ決定情報を上記単語のエンティティとして登録するとともに、当該単語をエンティティ値として登録するエンティティ登録手段と、
上記テキストデータをインテントとして登録するとともに、少なくとも指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、上記抽出手段により抽出された指示動作に対応したアクション決定情報を登録するインテント登録手段とを備え、
上記インテント登録手段は、指示動作とアクション決定情報とが3段階以上の連関度を以って関連付けられたインテント知識データベースを参照し、上記抽出手段により抽出された指示動作と関連するアクション決定情報を探索すること
を特徴とするエンティティとインテントの自動生成装置。 - 上記インテント登録手段は、単語及び指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、少なくとも上記抽出手段により抽出された単語及び指示動作と関連するアクション決定情報を探索すること
を特徴とする請求項1又は2記載のエンティティとインテントの自動生成装置。 - 上記テキストデータ取得手段により取得されたテキストデータを、上記エンティティ登録手段により登録されたエンティティ及び上記インテント登録手段により登録されたインテントからなるコーパス決定情報と対応させて格納するコーパス知識データベースと、
上記コーパス知識データベースに格納されたテキストデータをそのままコーパスとして登録するコーパス登録手段とを備えること
を特徴とする請求項1〜3のうち何れか1項記載のエンティティとインテントの自動生成装置。 - 上記コーパス知識データベースは、上記コーパス決定情報としてのエンティティ及びインテントに基づいて、上記格納したテキストデータと同義となる他のテキストデータを生成し、これを当該コーパス決定情報と対応させて格納すること
を特徴とする請求項4記載のエンティティとインテントの自動生成装置。 - 上記コーパス知識データベースは、上記テキストデータ取得手段により取得した新たなテキストデータから上記エンティティ登録手段により登録されたエンティティ及び上記インテント登録手段により登録されたインテントが、既に格納した上記コーパス決定情報と適合する場合には、当該コーパス決定情報と対応させて上記新たなテキストデータを格納すること
を特徴とする請求項4又は5記載のエンティティとインテントの自動生成装置。 - 文書又は会話文からテキストデータを取得するテキストデータ取得手段と、
上記テキストデータ取得手段により取得されたテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出手段と、
上記テキストデータをインテントとして登録するとともに、少なくとも指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、上記抽出手段により抽出された指示動作に対応したアクション決定情報を登録するインテント登録手段とを備え、
上記インテント登録手段は、指示動作とアクション決定情報とが3段階以上の連関度を以って関連付けられたインテント知識データベースを参照し、上記抽出手段により抽出された指示動作と関連するアクション決定情報を探索すること
を特徴とするインテント自動生成装置。 - 文書又は会話文からテキストデータを取得するテキストデータ取得手段と、
上記テキストデータ取得手段により取得されたテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出手段と、
単語とエンティティ決定情報とが互いに関連付けられたエンティティ知識データベースを参照し、上記抽出手段により抽出された単語と関連するエンティティ決定情報を探索して抽出するエンティティ候補探索手段と、
上記エンティティ候補探索手段により抽出されたエンティティ決定情報を上記単語のエンティティとして登録するとともに、当該単語をエンティティ値として登録するエンティティ登録手段とを備え、
上記エンティティ候補探索手段は、単語とエンティティ決定情報とが3段階以上の連関度を以って関連付けられたエンティティ知識データベースを参照し、上記抽出手段により抽出された単語と関連するエンティティ決定情報を探索すること
を特徴とするエンティティ自動生成装置。 - 文書又は会話文からテキストデータを取得するテキストデータ取得ステップと、
上記テキストデータ取得ステップにより取得したテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出ステップと、
単語とエンティティ決定情報とが互いに関連付けられたエンティティ知識データベースを参照し、上記抽出ステップにおいて抽出した単語と関連するエンティティ決定情報を探索して抽出するエンティティ候補探索ステップと、
上記エンティティ候補探索ステップにおいて抽出したエンティティ決定情報を上記単語のエンティティとして登録するとともに、当該単語をエンティティ値として登録するエンティティ登録ステップと、
上記テキストデータをインテントとして登録するとともに、少なくとも指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、上記抽出ステップにおいて抽出した指示動作に対応したアクション決定情報を登録するインテント登録ステップとを有し、
上記エンティティ候補探索ステップでは、単語とエンティティ決定情報とが3段階以上の連関度を以って関連付けられたエンティティ知識データベースを参照し、上記抽出ステップにおいて抽出した単語と関連するエンティティ決定情報を探索することをコンピュータに実行させること
を特徴とするエンティティとインテントの自動生成プログラム。 - 文書又は会話文からテキストデータを取得するテキストデータ取得ステップと、
上記テキストデータ取得ステップにより取得したテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出ステップと、
単語とエンティティ決定情報とが互いに関連付けられたエンティティ知識データベースを参照し、上記抽出ステップにおいて抽出した単語と関連するエンティティ決定情報を探索して抽出するエンティティ候補探索ステップと、
上記エンティティ候補探索ステップにおいて抽出したエンティティ決定情報を上記単語のエンティティとして登録するとともに、当該単語をエンティティ値として登録するエンティティ登録ステップと、
上記テキストデータをインテントとして登録するとともに、少なくとも指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、上記抽出ステップにおいて抽出した指示動作に対応したアクション決定情報を登録するインテント登録ステップとを有し、
上記インテント登録ステップでは、指示動作とアクション決定情報とが3段階以上の連関度を以って関連付けられたインテント知識データベースを参照し、上記抽出ステップにおいて抽出した指示動作と関連するアクション決定情報を探索することをコンピュータに実行させること
を特徴とするエンティティとインテントの自動生成プログラム。 - 文書又は会話文からテキストデータを取得するテキストデータ取得ステップと、
上記テキストデータ取得ステップにおいて取得したテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出ステップと、
上記テキストデータをインテントとして登録するとともに、少なくとも指示動作とアクション決定情報とが互いに関連付けられたインテント知識データベースを参照し、上記抽出ステップにおいて抽出した指示動作に対応したアクション決定情報を登録するインテント登録ステップとを有し、
上記インテント登録ステップでは、指示動作とアクション決定情報とが3段階以上の連関度を以って関連付けられたインテント知識データベースを参照し、上記抽出ステップにおいて抽出した指示動作と関連するアクション決定情報を探索することをコンピュータに実行させること
を特徴とするインテント自動生成プログラム。 - 文書又は会話文からテキストデータを取得するテキストデータ取得ステップと、
上記テキストデータ取得ステップにおいて取得したテキストデータを自然言語解析することにより、指示動作と、これに係り受けする少なくとも単語を抽出する抽出ステップと、
単語とエンティティ決定情報とが互いに関連付けられたエンティティ知識データベースを参照し、上記抽出ステップにおいて抽出した単語と関連するエンティティ決定情報を探索して抽出するエンティティ候補探索ステップと、
上記エンティティ候補探索ステップにおいて抽出したエンティティ決定情報を上記単語のエンティティとして登録するとともに、当該単語をエンティティ値として登録するエンティティ登録ステップとを有し、
上記エンティティ候補探索ステップでは、単語とエンティティ決定情報とが3段階以上の連関度を以って関連付けられたエンティティ知識データベースを参照し、上記抽出ステップにより抽出された単語と関連するエンティティ決定情報を探索することをコンピュータに実行させること
を特徴とするエンティティ自動生成プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021099311A JP6954549B1 (ja) | 2021-06-15 | 2021-06-15 | エンティティとインテントとコーパスの自動生成装置及びプログラム |
PCT/JP2021/023805 WO2022264435A1 (ja) | 2021-06-15 | 2021-06-23 | エンティティとインテントとコーパスの自動生成装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021099311A JP6954549B1 (ja) | 2021-06-15 | 2021-06-15 | エンティティとインテントとコーパスの自動生成装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6954549B1 true JP6954549B1 (ja) | 2021-10-27 |
JP2022190845A JP2022190845A (ja) | 2022-12-27 |
Family
ID=78119228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021099311A Active JP6954549B1 (ja) | 2021-06-15 | 2021-06-15 | エンティティとインテントとコーパスの自動生成装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6954549B1 (ja) |
WO (1) | WO2022264435A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7231171B1 (ja) | 2022-07-21 | 2023-03-01 | ソプラ株式会社 | 処理動作支援装置及びプログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006053203A (ja) * | 2004-08-10 | 2006-02-23 | Sony Corp | 音声処理装置および方法、記録媒体、並びにプログラム |
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
WO2014083945A1 (ja) * | 2012-11-30 | 2014-06-05 | 三菱電機株式会社 | 意図推定装置および意図推定方法 |
US20160078866A1 (en) * | 2014-09-14 | 2016-03-17 | Speaktoit, Inc. | Platform for creating customizable dialog system engines |
WO2016067418A1 (ja) * | 2014-10-30 | 2016-05-06 | 三菱電機株式会社 | 対話制御装置および対話制御方法 |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
WO2016151700A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 意図理解装置、方法およびプログラム |
WO2019142427A1 (ja) * | 2018-01-16 | 2019-07-25 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP2020161153A (ja) * | 2015-10-21 | 2020-10-01 | グーグル エルエルシー | ダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成 |
WO2020261944A1 (ja) * | 2019-06-27 | 2020-12-30 | ソニー株式会社 | 情報処理装置および情報処理方法 |
-
2021
- 2021-06-15 JP JP2021099311A patent/JP6954549B1/ja active Active
- 2021-06-23 WO PCT/JP2021/023805 patent/WO2022264435A1/ja active Application Filing
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006053203A (ja) * | 2004-08-10 | 2006-02-23 | Sony Corp | 音声処理装置および方法、記録媒体、並びにプログラム |
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
WO2014083945A1 (ja) * | 2012-11-30 | 2014-06-05 | 三菱電機株式会社 | 意図推定装置および意図推定方法 |
US20160078866A1 (en) * | 2014-09-14 | 2016-03-17 | Speaktoit, Inc. | Platform for creating customizable dialog system engines |
WO2016067418A1 (ja) * | 2014-10-30 | 2016-05-06 | 三菱電機株式会社 | 対話制御装置および対話制御方法 |
WO2016151698A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 対話装置、方法及びプログラム |
WO2016151700A1 (ja) * | 2015-03-20 | 2016-09-29 | 株式会社 東芝 | 意図理解装置、方法およびプログラム |
JP2020161153A (ja) * | 2015-10-21 | 2020-10-01 | グーグル エルエルシー | ダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成 |
WO2019142427A1 (ja) * | 2018-01-16 | 2019-07-25 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
WO2020261944A1 (ja) * | 2019-06-27 | 2020-12-30 | ソニー株式会社 | 情報処理装置および情報処理方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7231171B1 (ja) | 2022-07-21 | 2023-03-01 | ソプラ株式会社 | 処理動作支援装置及びプログラム |
JP2024014130A (ja) * | 2022-07-21 | 2024-02-01 | ソプラ株式会社 | 処理動作支援装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2022264435A1 (ja) | 2022-12-22 |
JP2022190845A (ja) | 2022-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8812534B2 (en) | Machine assisted query formulation | |
US8260809B2 (en) | Voice-based search processing | |
JP5796496B2 (ja) | 入力支援システム、方法、およびプログラム | |
JP2020191075A (ja) | Web APIおよび関連エンドポイントの推薦 | |
US20080114747A1 (en) | Speech interface for search engines | |
CN113886604A (zh) | 一种职位知识图谱生成方法和系统 | |
CN110888946A (zh) | 一种基于知识驱动的查询的实体链接方法 | |
JP6598418B1 (ja) | 情報出力装置、情報出力方法、およびプログラム | |
US20090006344A1 (en) | Mark-up ecosystem for searching | |
JP6954549B1 (ja) | エンティティとインテントとコーパスの自動生成装置及びプログラム | |
WO2020009211A1 (ja) | 検索装置およびプログラム | |
CN115438142B (zh) | 一种对话式交互数据分析报告系统 | |
CN113656579A (zh) | 文本分类方法、装置、设备及介质 | |
CN113449513A (zh) | 工作总结自动生成方法、系统、计算机设备和存储介质 | |
JP7065473B2 (ja) | 会話文からの業務構築システム | |
JP7231171B1 (ja) | 処理動作支援装置及びプログラム | |
WO2023100384A1 (ja) | 処理動作支援装置及びプログラム | |
CN114586021B (zh) | 信息输出装置、信息输出方法以及记录介质 | |
WO2022190646A1 (ja) | プログラムコード自動生成装置及びプログラム | |
JP6635460B1 (ja) | 情報生成装置、コーパスの生産方法、およびプログラム | |
JP5941345B2 (ja) | 文字情報の分析方法および情報分析装置並びにプログラム | |
US8370322B2 (en) | Assessing an individual's influence over decisions regarding hospitality venue selection | |
JP2022073949A (ja) | セキュリティidの会話文検索システム | |
JP2023151293A (ja) | 情報処理装置、検索システム、情報処理方法およびプログラム | |
CN116644172A (zh) | 一种基于知识图谱的操作路径推荐方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210625 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210916 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6954549 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |