JP2017162112A - 単語抽出装置、方法、及びプログラム - Google Patents
単語抽出装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2017162112A JP2017162112A JP2016044822A JP2016044822A JP2017162112A JP 2017162112 A JP2017162112 A JP 2017162112A JP 2016044822 A JP2016044822 A JP 2016044822A JP 2016044822 A JP2016044822 A JP 2016044822A JP 2017162112 A JP2017162112 A JP 2017162112A
- Authority
- JP
- Japan
- Prior art keywords
- word
- entry
- question sentence
- representing
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
20、220 演算部
21 アノテート済元ドメイン質問文集合
23 元ドメイン教師なしテキスト
24 対象ドメイン教師なしテキスト
25 汎用モデル教師ありテキスト
30 意味ベクトル学習部
32 意味ベクトルモデル
34 汎用モデル学習部
36 汎用モデル
38、238 系列モデル用素性化部
40 系列モデル学習部
42 系列モデル
44、244 回帰モデル用素性化部
46 回帰モデル学習部
48 回帰モデル
100 モデル学習装置
200 単語抽出装置
240 系列モデル適用部
246 回帰モデル適用部
250 出力部
Claims (7)
- 未学習の対象ドメインのデータベースのエントリを表す単語から、入力された対象ドメインの質問文に対応する、前記エントリを表す単語を抽出する単語抽出装置であって、
予め作成された各単語の意味ベクトルを用いて、前記質問文に含まれる各単語について、前記対象ドメインのデータベースのテーブル構成要素毎に、前記テーブル構成要素のエントリを表す単語との類似度を、素性として抽出する系列モデル用素性化部と、
学習済みの元ドメインのデータベースのエントリを表す単語が付与された、前記元ドメインの質問文の集合から予め学習された、単語チャンクに対応するテーブル構成要素を抽出するための系列モデルと、前記系列モデル用素性化部によって前記質問文に含まれる各単語について抽出された、前記テーブル構成要素毎の素性とに基づいて、前記質問文に含まれる各単語チャンクに、前記テーブル構成要素を表すラベルを付与する系列モデル適用部と、
各単語の意味ベクトルを用いて、前記系列モデル適用部によって前記ラベルが付与された単語チャンクの各々について、前記単語チャンクに付与された前記ラベルが表す前記テーブル構成要素のエントリを表す単語の各々との類似度を、素性として抽出する回帰モデル用素性化部と、
前記元ドメインのデータベースのエントリを表す単語が付与された、前記元ドメインの質問文の集合から予め学習された、単語に対応するエントリ表す単語を抽出するための回帰モデルと、前記回帰モデル用素性化部によって抽出された、前記ラベルが付与された単語チャンクの各々の素性とに基づいて、前記質問文に対応する、前記対象ドメインのデータベースのエントリを表す単語を抽出する回帰モデル適用部と、
を含む単語抽出装置。 - 前記回帰モデル用素性化部は、前記系列モデル適用部によって前記ラベルが付与された単語チャンクの各々について、前記単語チャンクに付与された前記ラベルが表す前記テーブル構成要素のエントリを表す単語の各々との類似度を表す、少なくとも1つの素性の各々を抽出し、
前記少なくとも1つの素性の各々について、前記ラベルが表す前記テーブル構成要素のエントリを表す単語の各々との類似度を表す前記素性の相対化を行う請求項1記載の単語抽出装置。 - 各単語の意味ベクトルは、前記対象ドメインのテキスト及び前記元ドメインのテキストに基づいて予め作成されたものである請求項1又は2記載の単語抽出装置。
- 前記回帰モデル用素性化部は、前記系列モデル適用部によって前記ラベルが付与された単語チャンクの各々について、
前記単語チャンクと最も類似する、前記元ドメインの質問文に含まれる単語との類似度、
前記単語チャンクと最も類似する、前記元ドメインの質問文に含まれる単語に付与された前記エントリを表す単語との類似度、及び
前記単語チャンクと最も類似する、前記元ドメインの質問文に含まれる単語に付与された前記エントリを表す単語と、前記単語に付与された前記ラベルが表す前記テーブル構成要素のエントリを表す単語との類似度を組み合わせたドメイン間類似度素性を更に抽出する請求項1〜請求項3の何れか1項記載の単語抽出装置。 - 前記系列モデル用素性化部は、前記質問文に含まれる各単語について、予め学習された、質問文の質問内容、又は単語の上位概念を推定するための、ドメインに依存しない汎用モデルを用いて推定された、前記質問文の推定結果、又は前記単語の推定結果を素性として更に抽出し、
前記回帰モデル用素性化部は、前記系列モデル適用部によって前記ラベルが付与された単語チャンクの各々について、前記汎用モデルを用いて推定された、前記質問文の推定結果、又は前記単語の推定結果を素性として更に抽出する請求項1〜請求項4の何れか1項記載の単語抽出装置。 - 未学習の対象ドメインのデータベースのエントリを表す単語から、入力された対象ドメインの質問文に対応する、前記エントリを表す単語を抽出する単語抽出装置における単語抽出方法であって、
系列モデル用素性化部が、予め作成された各単語の意味ベクトルを用いて、前記質問文に含まれる各単語について、前記対象ドメインのデータベースのテーブル構成要素毎に、前記テーブル構成要素のエントリを表す単語との類似度を、素性として抽出するステップと、
系列モデル適用部が、学習済みの元ドメインのデータベースのエントリを表す単語が付与された、前記元ドメインの質問文の集合から予め学習された、単語チャンクに対応するテーブル構成要素を抽出するための系列モデルと、前記系列モデル用素性化部によって前記質問文に含まれる各単語について抽出された、前記テーブル構成要素毎の素性とに基づいて、前記質問文に含まれる各単語チャンクに、前記テーブル構成要素を表すラベルを付与するステップと、
回帰モデル用素性化部が、各単語の意味ベクトルを用いて、前記系列モデル適用部によって前記ラベルが付与された単語チャンクの各々について、前記単語チャンクに付与された前記ラベルが表す前記テーブル構成要素のエントリを表す単語の各々との類似度を、素性として抽出するステップと、
回帰モデル適用部が、前記元ドメインのデータベースのエントリを表す単語が付与された、前記元ドメインの質問文の集合から予め学習された、単語に対応するエントリ表す単語を抽出するための回帰モデルと、前記回帰モデル用素性化部によって抽出された、前記ラベルが付与された単語チャンクの各々の素性とに基づいて、前記質問文に対応する、前記対象ドメインのデータベースのエントリを表す単語を抽出するステップと、
を含む単語抽出方法。 - コンピュータを、請求項1〜請求項5のいずれか1項に記載の単語抽出装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016044822A JP6334587B2 (ja) | 2016-03-08 | 2016-03-08 | 単語抽出装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016044822A JP6334587B2 (ja) | 2016-03-08 | 2016-03-08 | 単語抽出装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017162112A true JP2017162112A (ja) | 2017-09-14 |
JP6334587B2 JP6334587B2 (ja) | 2018-05-30 |
Family
ID=59857634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016044822A Active JP6334587B2 (ja) | 2016-03-08 | 2016-03-08 | 単語抽出装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6334587B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977203A (zh) * | 2019-03-07 | 2019-07-05 | 北京九狐时代智能科技有限公司 | 语句相似度确定方法、装置、电子设备及可读存储介质 |
CN110347796A (zh) * | 2019-07-05 | 2019-10-18 | 神思电子技术股份有限公司 | 向量语义张量空间下的短文本相似度计算方法 |
CN114492437A (zh) * | 2022-02-16 | 2022-05-13 | 平安科技(深圳)有限公司 | 关键词识别方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132811A (ja) * | 2000-10-19 | 2002-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 |
JP2013250926A (ja) * | 2012-06-04 | 2013-12-12 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、方法、及びプログラム |
US20150161242A1 (en) * | 2013-12-05 | 2015-06-11 | International Business Machines Corporation | Identifying and Displaying Relationships Between Candidate Answers |
JP2015176355A (ja) * | 2014-03-14 | 2015-10-05 | 日本電信電話株式会社 | モデル学習装置、方法及びプログラム |
-
2016
- 2016-03-08 JP JP2016044822A patent/JP6334587B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132811A (ja) * | 2000-10-19 | 2002-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 |
JP2013250926A (ja) * | 2012-06-04 | 2013-12-12 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、方法、及びプログラム |
US20150161242A1 (en) * | 2013-12-05 | 2015-06-11 | International Business Machines Corporation | Identifying and Displaying Relationships Between Candidate Answers |
JP2015176355A (ja) * | 2014-03-14 | 2015-10-05 | 日本電信電話株式会社 | モデル学習装置、方法及びプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977203A (zh) * | 2019-03-07 | 2019-07-05 | 北京九狐时代智能科技有限公司 | 语句相似度确定方法、装置、电子设备及可读存储介质 |
CN109977203B (zh) * | 2019-03-07 | 2021-06-08 | 北京九狐时代智能科技有限公司 | 语句相似度确定方法、装置、电子设备及可读存储介质 |
CN110347796A (zh) * | 2019-07-05 | 2019-10-18 | 神思电子技术股份有限公司 | 向量语义张量空间下的短文本相似度计算方法 |
CN114492437A (zh) * | 2022-02-16 | 2022-05-13 | 平安科技(深圳)有限公司 | 关键词识别方法、装置、电子设备及存储介质 |
CN114492437B (zh) * | 2022-02-16 | 2023-07-18 | 平安科技(深圳)有限公司 | 关键词识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6334587B2 (ja) | 2018-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110825881B (zh) | 一种建立电力知识图谱的方法 | |
CN111522994B (zh) | 用于生成信息的方法和装置 | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
CN112989055B (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN110245238B (zh) | 基于规则推理和句法模式的图嵌入方法及系统 | |
JP6062879B2 (ja) | モデル学習装置、方法及びプログラム | |
CN111831911A (zh) | 查询信息的处理方法、装置、存储介质和电子装置 | |
US20200233908A1 (en) | Interactive system and computer program therefor | |
JP6663826B2 (ja) | 計算機及び応答の生成方法 | |
JP6334587B2 (ja) | 単語抽出装置、方法、及びプログラム | |
CN111814487A (zh) | 一种语义理解方法、装置、设备及存储介质 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN112632258A (zh) | 文本数据处理方法、装置、计算机设备和存储介质 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
JP2019144706A (ja) | 関係性推定モデル学習装置、方法、及びプログラム | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
WO2020199590A1 (zh) | 情绪检测分析方法及相关装置 | |
JP6305630B2 (ja) | 文書検索装置、方法及びプログラム | |
JP2017204219A (ja) | モデル学習装置、単語抽出装置、方法、及びプログラム | |
WO2022262080A1 (zh) | 一种对话关系处理方法、计算机及可读存储介质 | |
CN113408271B (zh) | 基于rpa及ai的信息抽取方法、装置、设备及介质 | |
CN115589446A (zh) | 一种基于预训练与提示的会议摘要生成方法及系统 | |
JP2018169835A (ja) | モデル学習装置、単語抽出装置、方法、及びプログラム | |
CN114218431A (zh) | 视频搜索方法、装置、电子设备以及存储介质 | |
JP2014232145A (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6334587 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |