JP2018180937A - クラスタリング装置、回答候補生成装置、方法、及びプログラム - Google Patents
クラスタリング装置、回答候補生成装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2018180937A JP2018180937A JP2017079659A JP2017079659A JP2018180937A JP 2018180937 A JP2018180937 A JP 2018180937A JP 2017079659 A JP2017079659 A JP 2017079659A JP 2017079659 A JP2017079659 A JP 2017079659A JP 2018180937 A JP2018180937 A JP 2018180937A
- Authority
- JP
- Japan
- Prior art keywords
- score
- word
- answer
- candidate
- word candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
文パターン2:<cand> * できたて * 食べ た い
文パターン3:食べ物 * <cand>
文パターン4:食べ た い 食べ物 * <cand>
文パターン5:できたて * 食べ た い 食べ物 * <cand>
・・・(1)
・・・(2)
・・・(3)
クラスタ(イ):総菜
クラスタ(ウ):パスタ
クラスタ(エ):唐揚げ、ハンバーグ、丼飯、トンカツ、から揚げ
20 演算部
22 概念ベクトルモデル生成部
24 概念ベクトルモデル
26 言語モデル生成部
28 言語モデル
30 文パターン生成部
32 拡張単語候補生成部
34 拡張回答単語候補リランキング部
36 クラスタリング部
38 条件判定部
50 出力部
100 回答候補生成装置
Claims (8)
- 質問文と回答単語候補との組み合わせに対する、予め定められた言語モデルのスコア、及び前記回答単語候補についての単語の概念を表す概念ベクトルのスコアに基づく統合スコアが上位の回答単語候補と、前記質問文に対する回答単語とを含む単語集合に対して、前記概念ベクトルに基づいてクラスタリングを行うクラスタリング部
を含むクラスタリング装置。 - テキスト集合に含まれる単語の各々について、前記単語の概念を表す概念ベクトルを生成する概念ベクトルモデル生成部と、
入力された質問文から、単語に置き換えるためのタグを付与した文パターンを生成する文パターン生成部と、
前記質問文に対する回答単語の各々と前記質問文に含まれる単語の各々とに類似する単語の各々を、前記概念ベクトルのスコアに基づいて求めて、拡張回答単語候補とする拡張単語候補生成部と、
前記文パターンに含まれる前記タグを拡張回答単語候補に置き換えたときに得られるスコア、及び前記拡張回答単語候補についての前記概念ベクトルのスコアに基づく統合スコアが上位N個の拡張回答単語候補を求める拡張回答単語候補リランキング部と、
前記上位N個の拡張回答単語候補と、前記質問文に対する回答単語とを含む単語集合に対して、前記概念ベクトルに基づいてクラスタリングを行うクラスタリング部と、
予め定められた条件を満たすまで前記拡張単語候補生成部、前記拡張回答単語候補リランキング部、及び前記クラスタリング部の処理を繰り返す条件判定部と、
を含み、
前記拡張単語候補生成部は、前記クラスタリング部で得られたクラスタ毎に、前記クラスタに属する単語の各々と前記質問文に含まれる単語の各々とに類似する単語の各々を、前記概念ベクトルのスコアに基づいて求めて、拡張回答単語候補とし、
前記拡張回答単語候補リランキング部は、前記文パターンに含まれる前記タグを前記クラスタについて求められた前記拡張回答単語候補に置き換えたときに得られるスコアを算出し、全てのクラスタにおいて、前記拡張回答単語候補に置き換えたときに得られるスコア、及び前記拡張回答単語候補についての前記概念ベクトルのスコアに基づく統合スコアが上位N個の拡張回答単語候補を求める
回答候補生成装置。 - 前記拡張回答単語候補リランキング部は、前記文パターンに含まれる前記タグを前記クラスタについて求められた前記拡張回答単語候補に置き換えたときに得られるスコア、及び前記拡張回答単語候補が属するクラスタに属する単語数を係数として前記概念ベクトルのスコアに乗算したスコアに基づく統合スコアが上位N個の拡張回答単語候補を求める
請求項2に記載の回答候補生成装置。 - 前記テキスト集合に含まれる単語のNグラムに基づいて言語モデルを生成する言語モデル生成部を更に含み、
前記拡張回答単語候補リランキング部は、前記文パターンに含まれる前記タグを拡張回答単語候補に置き換えたときに得られる、前記言語モデルのスコア、及び前記拡張回答単語候補についての前記概念ベクトルのスコアに基づく統合スコアが上位N個の拡張回答単語候補を求め、
前記文パターンに含まれる前記タグを前記クラスタについて求められた前記拡張回答単語候補に置き換えたときに得られる、前記言語モデルのスコアを算出し、全てのクラスタにおいて、前記言語モデルのスコア、及び前記拡張回答単語候補についての前記概念ベクトルのスコアに基づく統合スコアが上位N個の拡張回答単語候補を求める請求項2又は請求項3に記載の回答候補生成装置。 - クラスタリング部が、質問文と回答単語候補との組み合わせに対する、予め定められた言語モデルのスコア、及び前記回答単語候補についての単語の概念を表す概念ベクトルのスコアに基づく統合スコアが上位の回答単語候補と、前記質問文に対する回答単語とを含む単語集合に対して、前記概念ベクトルに基づいてクラスタリングを行うステップ
を含むクラスタリング方法。 - 概念ベクトルモデル生成部が、テキスト集合に含まれる単語の各々について、前記単語の概念を表す概念ベクトルを生成するステップと、
文パターン生成部が、入力された質問文から、単語に置き換えるためのタグを付与した文パターンを生成するステップと、
拡張単語候補生成部が、前記質問文に対する回答単語の各々と前記質問文に含まれる単語の各々とに類似する単語の各々を、前記概念ベクトルのスコアに基づいて求めて、拡張回答単語候補とするステップと、
拡張回答単語候補リランキング部が、前記文パターンに含まれる前記タグを拡張回答単語候補に置き換えたときに得られるスコア、及び前記拡張回答単語候補についての前記概念ベクトルのスコアに基づく統合スコアが上位N個の拡張回答単語候補を求めるステップと、
クラスタリング部が、前記上位N個の拡張回答単語候補と、前記質問文に対する回答単語とを含む単語集合に対して、前記概念ベクトルに基づいてクラスタリングを行うステップと、
条件判定部が、予め定められた条件を満たすまで前記拡張単語候補生成部、前記拡張回答単語候補リランキング部、及び前記クラスタリング部の処理を繰り返すステップと、
を含み、
前記拡張単語候補生成部は、前記クラスタリング部で得られたクラスタ毎に、前記クラスタに属する単語の各々と前記質問文に含まれる単語の各々とに類似する単語の各々を、前記概念ベクトルのスコアに基づいて求めて、拡張回答単語候補とし、
前記拡張回答単語候補リランキング部は、前記文パターンに含まれる前記タグを前記クラスタについて求められた前記拡張回答単語候補に置き換えたときに得られるスコアを算出し、全てのクラスタにおいて、前記拡張回答単語候補に置き換えたときに得られるスコア、及び前記拡張回答単語候補についての前記概念ベクトルのスコアに基づく統合スコアが上位N個の拡張回答単語候補を求める
回答候補生成方法。 - 前記拡張回答単語候補リランキング部は、前記文パターンに含まれる前記タグを前記クラスタについて求められた前記拡張回答単語候補に置き換えたときに得られるスコア、及び前記拡張回答単語候補が属するクラスタに属する単語数を係数として前記概念ベクトルのスコアに乗算したスコアに基づく統合スコアが上位N個の拡張回答単語候補を求める
請求項6に記載の回答候補生成方法。 - コンピュータを、請求項1に記載のクラスタリング装置、又は請求項2〜請求項4の何れか1項に記載の回答候補生成装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079659A JP6709748B2 (ja) | 2017-04-13 | 2017-04-13 | クラスタリング装置、回答候補生成装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079659A JP6709748B2 (ja) | 2017-04-13 | 2017-04-13 | クラスタリング装置、回答候補生成装置、方法、及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020011236A Division JP6857754B2 (ja) | 2020-01-27 | 2020-01-27 | 回答候補生成装置、回答候補生成方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018180937A true JP2018180937A (ja) | 2018-11-15 |
JP6709748B2 JP6709748B2 (ja) | 2020-06-17 |
Family
ID=64276808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017079659A Active JP6709748B2 (ja) | 2017-04-13 | 2017-04-13 | クラスタリング装置、回答候補生成装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6709748B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829051A (zh) * | 2019-01-30 | 2019-05-31 | 科大讯飞股份有限公司 | 一种数据库相似语句筛选的方法和装置 |
CN110750629A (zh) * | 2019-09-18 | 2020-02-04 | 平安科技(深圳)有限公司 | 机器人对话生成方法、装置、可读存储介质及机器人 |
CN112527975A (zh) * | 2019-09-02 | 2021-03-19 | 科沃斯商用机器人有限公司 | 人机交互方法、装置、智能机器人和存储介质 |
WO2021131406A1 (ja) * | 2019-12-26 | 2021-07-01 | 株式会社日立製作所 | 情報処理装置及び対話シナリオの作成支援方法 |
JP2022500808A (ja) * | 2019-01-24 | 2022-01-04 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 文生成方法と装置、電子機器及びプログラム |
CN114999676A (zh) * | 2022-06-29 | 2022-09-02 | 支付宝(杭州)信息技术有限公司 | 用于自动回复医疗咨询的方法、系统、装置和介质 |
JP7539098B1 (ja) | 2023-09-19 | 2024-08-23 | ゼネリックソリューション株式会社 | 審査業務文書作成支援装置、審査業務文書作成支援方法、及び審査業務文書作成支援プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041573A (ja) * | 2000-05-17 | 2002-02-08 | Matsushita Electric Ind Co Ltd | 情報検索システム |
JP2005149014A (ja) * | 2003-11-13 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書関連語彙獲得方法及び装置及びプログラム |
JP2006163623A (ja) * | 2004-12-03 | 2006-06-22 | Nippon Hoso Kyokai <Nhk> | 質問応答装置及び質問応答プログラム、並びに、テレビ受像機 |
JP2011039977A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 単語クラスタリング装置及び方法及びプログラム及びプログラムを格納した記録媒体 |
JP2012079161A (ja) * | 2010-10-04 | 2012-04-19 | National Institute Of Information & Communication Technology | 自然言語文生成装置及びコンピュータプログラム |
-
2017
- 2017-04-13 JP JP2017079659A patent/JP6709748B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041573A (ja) * | 2000-05-17 | 2002-02-08 | Matsushita Electric Ind Co Ltd | 情報検索システム |
JP2005149014A (ja) * | 2003-11-13 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書関連語彙獲得方法及び装置及びプログラム |
JP2006163623A (ja) * | 2004-12-03 | 2006-06-22 | Nippon Hoso Kyokai <Nhk> | 質問応答装置及び質問応答プログラム、並びに、テレビ受像機 |
JP2011039977A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 単語クラスタリング装置及び方法及びプログラム及びプログラムを格納した記録媒体 |
JP2012079161A (ja) * | 2010-10-04 | 2012-04-19 | National Institute Of Information & Communication Technology | 自然言語文生成装置及びコンピュータプログラム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022500808A (ja) * | 2019-01-24 | 2022-01-04 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 文生成方法と装置、電子機器及びプログラム |
JP7290730B2 (ja) | 2019-01-24 | 2023-06-13 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 文生成方法と装置、電子機器及びプログラム |
CN109829051A (zh) * | 2019-01-30 | 2019-05-31 | 科大讯飞股份有限公司 | 一种数据库相似语句筛选的方法和装置 |
CN109829051B (zh) * | 2019-01-30 | 2023-01-17 | 科大讯飞股份有限公司 | 一种数据库相似语句筛选的方法和装置 |
CN112527975A (zh) * | 2019-09-02 | 2021-03-19 | 科沃斯商用机器人有限公司 | 人机交互方法、装置、智能机器人和存储介质 |
CN112527975B (zh) * | 2019-09-02 | 2024-07-26 | 科沃斯商用机器人有限公司 | 人机交互方法、装置、智能机器人和存储介质 |
CN110750629A (zh) * | 2019-09-18 | 2020-02-04 | 平安科技(深圳)有限公司 | 机器人对话生成方法、装置、可读存储介质及机器人 |
WO2021131406A1 (ja) * | 2019-12-26 | 2021-07-01 | 株式会社日立製作所 | 情報処理装置及び対話シナリオの作成支援方法 |
CN114999676A (zh) * | 2022-06-29 | 2022-09-02 | 支付宝(杭州)信息技术有限公司 | 用于自动回复医疗咨询的方法、系统、装置和介质 |
JP7539098B1 (ja) | 2023-09-19 | 2024-08-23 | ゼネリックソリューション株式会社 | 審査業務文書作成支援装置、審査業務文書作成支援方法、及び審査業務文書作成支援プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6709748B2 (ja) | 2020-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6709748B2 (ja) | クラスタリング装置、回答候補生成装置、方法、及びプログラム | |
JP6857754B2 (ja) | 回答候補生成装置、回答候補生成方法、及びプログラム | |
US20200395008A1 (en) | Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models | |
Turchin et al. | Complex dynamics in ecological time series | |
WO2020004136A1 (ja) | 質問応答装置及びコンピュータプログラム | |
US10789951B2 (en) | Speech continuation determination method, speech continuation determination device, and recording medium | |
CN110795913B (zh) | 一种文本编码方法、装置、存储介质及终端 | |
WO2018165932A1 (en) | Generating responses in automated chatting | |
EP3327592A1 (en) | Information processing method, information processing apparatus, and non-transitory recording medium | |
JP6818706B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
CN111291549A (zh) | 文本处理方法、装置、存储介质和电子设备 | |
JP6920136B2 (ja) | 情報処理システム | |
JP2017076281A (ja) | 単語埋込学習装置、テキスト評価装置、方法、及びプログラム | |
CN107193806B (zh) | 一种词汇义原的自动预测方法及装置 | |
WO2019106758A1 (ja) | 言語処理装置、言語処理システムおよび言語処理方法 | |
Chu | Recipe bot: The application of conversational ai in home cooking assistant | |
WO2020040255A1 (ja) | 単語符号化装置、解析装置、言語モデル学習装置、方法、及びプログラム | |
JP2017010249A (ja) | パラメタ学習装置、文類似度算出装置、方法、及びプログラム | |
JP6630701B2 (ja) | 回答候補生成装置、方法、及びプログラム | |
CN109885668A (zh) | 一种可扩展的领域人机对话系统状态跟踪方法及设备 | |
Sato-Shimokawara et al. | A cloud based chat robot using dialogue histories for elderly people | |
Forsati et al. | Hybrid PoS-tagging: A cooperation of evolutionary and statistical approaches | |
WO2020095655A1 (ja) | 選定装置および選定方法 | |
JP2014232145A (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム | |
CN109657079A (zh) | 一种图像描述方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6709748 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |