JP6709558B2 - 会話処理装置 - Google Patents

会話処理装置 Download PDF

Info

Publication number
JP6709558B2
JP6709558B2 JP2016093766A JP2016093766A JP6709558B2 JP 6709558 B2 JP6709558 B2 JP 6709558B2 JP 2016093766 A JP2016093766 A JP 2016093766A JP 2016093766 A JP2016093766 A JP 2016093766A JP 6709558 B2 JP6709558 B2 JP 6709558B2
Authority
JP
Japan
Prior art keywords
user
utterance
keyword
word
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016093766A
Other languages
English (en)
Other versions
JP2017204023A (ja
Inventor
生聖 渡部
生聖 渡部
加来 航
航 加来
和泉 近藤
和泉 近藤
阿れ 初鹿野
阿れ 初鹿野
惠司 原田
惠司 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Center for Geriatrics and Gerontology
Toyota Motor Corp
Original Assignee
National Center for Geriatrics and Gerontology
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Center for Geriatrics and Gerontology, Toyota Motor Corp filed Critical National Center for Geriatrics and Gerontology
Priority to JP2016093766A priority Critical patent/JP6709558B2/ja
Publication of JP2017204023A publication Critical patent/JP2017204023A/ja
Application granted granted Critical
Publication of JP6709558B2 publication Critical patent/JP6709558B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザと音声会話をするための会話処理装置に関する。
ユーザとロボットが音声で対話する音声対話システムが研究されている。対話システムにおいて、正確な対話知識が大量のデータから学習可能という観点から、常識的な汎用知識に基づいて応答生成する事が行われている。この応答生成方法によると、同じ発話からは全てのユーザに同一の返答が返されることとなり、タスク遂行型の対話(例えば道案内)には、相性がよく、雑談型(ノンタスク)の対話には物足りない場合がある。より自然な対話を実現するために、ユーザを特定してユーザに合わせた応答内容を決定する方法がある。特許文献1には、ユーザとの会話の話題を記憶し、会話の中からユーザのプライベートな情報を取得してユーザと会話するための応答文を作成する会話処理装置が記載されている。この会話処理装置は、更に、他の装置と通信してユーザのプライベートな情報を取得し、プライベートな情報を基に選択した話題に関する情報を記憶し、この情報に基づいて応答文を作成することができる。
特開2001−188787号公報
特許文献1に記載された会話処理装置によると、応答文の作成の際にプライベートな情報を基に話題を選択しているが、ユーザの発話内容との関連性を評価していないため、ユーザの過去の発話内容に応じたユーザ固有の応答文の生成が行えないという課題がある。
本発明は、ユーザの発話内容とユーザの過去の発話内容との関連性を評価し、ユーザに対する固有の応答文を生成することができる会話処理装置を提供することを目的とする。
本発明は、ユーザと会話を行う会話処理装置であって、
前記ユーザを特定するユーザ特定手段と、
前記ユーザの発話をテキストデータとして認識する発話認識手段と、
前記発話を前記ユーザ毎に記録する発話記録手段と、
認識された前記発話の前記テキストデータからキーワードを抽出するキーワード抽出手段と、
抽出された前記キーワードと前記記録手段に記録されている特定された前記ユーザの単語との関連度を前記キーワードの前後に連続する会話文に出現するそれぞれの単語が共起する関係に基づいて評価し、前記関連度が所定値以上に高い関連単語を抽出する関連単語抽出手段と、
抽出された前記関連単語を用いて応答文を生成する応答文生成手段と、を有する、
会話処理装置である。
本発明にかかる会話処理装置によると、ユーザの発話内容とユーザの過去の発話内容との関連性を評価し、ユーザに対する固有の応答文を生成することができる。
本発明の実施形態にかかる会話処理装置の構成を示すブロック図である。 会話処理装置においてユーザを特定し、ユーザの発話からキーワードを抽出する処理を示した図である。 キーワードと発話ログとから関連単語を抽出する処理を示した図である。 抽出された関連単語から応答文を生成する処理を示した図である。 会話処理装置の変形例の構成を示すブロック図である。
以下、図面を参照しつつ、本発明にかかる会話処理装置の実施形態について説明する。
図1に示されるように、会話処理装置1は、ユーザからの発話音声Mを収集してユーザに対する固有の応答文Aを生成する装置である。ユーザが発話すると、ユーザ特定手段2は、発話音声Mを発しているユーザを特定する。ユーザの特定方法は、音声による発話音声特徴を用いるものや、顔認証等のマルチモーダルの特徴を用いたものであっても良い。発話認識手段3は、ユーザの発話音声を入力し、発話をテキストデータに変換する。
ここで、発話認識手段3は、入力された発話に含まれる全て又は一部の単語をテキストデータとして抽出する。一部の単語を抽出する場合には、発話認識手段3は、予め定められた基準に基づいて重要性の高い単語を抽出してもよい。発話認識手段3は、テキストデータを発話記録手段4に出力し、テキストデータは発話記録手段4に記憶される。発話記録手段4は、特定されたユーザの発話履歴を特定の発話単位で記録する。
図2に示されるように、例えば、ロボットより「明日は休日ですね」と問いかけられて、ユーザAが「ちょうど晴れらしいね」と発話が返ってきた場合を考える。発話記録手段4は、音声認識結果をユーザ毎に、かつユーザの発話単位毎に記録する。つまり、ユーザ発話ログには、過去のユーザ発話履歴に今回の発話が追加記録される。ユーザAの発話の音声認識結果より、キーワードとして名詞(この例では「晴れ」)を抽出する。キーワードの設定方法として、品詞(名詞、動詞等)予め設定する既知の単語等が考えられる。
発話認識手段3は、テキストデータを発話記録手段4に出力する際、テキストデータをキーワード抽出手段5にも出力する。キーワード抽出手段5は、テキストデータに基づいて対話内容に関連する特定のキーワードを抽出する。ここで、キーワード抽出手段5は、対話内容に含まれる単語のうち、一連の対話の話題に関した重要性が高い特定の単語をキーワードとして抽出する。キーワード抽出手段5は、抽出されたキーワードを関連単語抽出手段6に出力する。
関連単語抽出手段6は、キーワード抽出手段5から入力されたキーワードと、発話記録手段4に記憶されているユーザの発話の単語との関連性を評価するための関連度を評価する。関連度は、抽出されたキーワードを用いて、ユーザ発話ログ中の単語共起スコアSを計算することにより評価する。単語共起スコアSは、連続する会話文に出現するそれぞれの単語が共起する関係に基づいて計算される。単語共起スコアSは、例えば、探索範囲を3個の連続文として設定した場合、以下の式によって求められる。
Figure 0006709558
ここで、Cは頻度、wは単語、kは探索範囲の最大値を示している。
関連単語抽出手段6は、単語共起スコアSに基づいて関連度が所定値以上に高い関連単語を抽出する。
図3に示されるように、例えば、ユーザAが
(1)今月はずっと晴れ続きだった。
(2)新しくルアーを買って、釣りに行った。
(3)ルアーは1万円もしたよ。
という3個の連続した文を発話した場合、発話中のそれぞれの単語について単語共起スコアSが計算される。例えば、今月:0.01、ルアー:0.05、釣り:0.12、1万円:0.01というスコアが与えられる。ここで、閾値を0.05とした場合「釣り」と「ルアー」と2個の単語が選択される。その後、関連単語抽出手段6は、抽出された関連単語を応答文生成手段7に出力する。
図4に示されるように、応答文生成手段7は、関連単語を発話向けに整形する。即ち、応答文生成手段7は、関連単語を用いて自然な応答文を生成する。応答文生成手段7は、関連単語を用いて予め用意されている応答テンプレートに当てはめる。応答テンプレートは、語尾に発話文らしくなる特定語を付加することなどが考えられる。この例では、動詞性の名詞「釣り」に「〜ができますね」を挿入することとする。この語尾は、カテゴリ(固有名詞、時間名詞など)に応じて変更することができる。
応答文生成手段7は、生成された応答文を発話手段8に出力する。発話手段8は、応答文を発話音声Aに音声合成して再生する。発話手段8は、このように生成した応答文を音声合成、再生することで「釣りができますね」と応答することができる。
上述したように会話処理装置1によると、ユーザが発話した場合、ユーザの発話ログはユーザ毎に異なっているため、例えば、ユーザAでは、「釣りができますね」と応答文を生成することができ、他のユーザBに対しては「洗濯ができますね」というように個人に関係が深く、異なる応答生成をすることができる。即ち、会話処理装置1によると、ユーザの過去の発話内容に応じたユーザ固有の応答文の生成を行うことができる。
尚、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、ユーザの発話内容を更に分類して個人に特有な応答生成を行ってもよい。以下の説明では、上記実施形態と同一の構成については同一の名称及び符号を用い、重複する説明については適宜省略する。
図5に示されるように、会話処理装置20は、ユーザの発話履歴から話題領域を推定する話題分類処理手段21と、ユーザの発話履歴を話題領域毎に分類し、話題領域毎に頻出単語を記録する話題領域別頻出単語データベース22とを更に有する。関連単語抽出手段6では、抽出されたキーワードと話題領域別頻出単語データベースから関連単語を抽出する。関連単語の抽出において、キーワード抽出処理の自立語ベクトルv1と、話題領域の単語(自立語)ベクトルv2とを算出し、v1とv2との類似度(コサイン類似度)が高くなる話題領域を決定する。その後、話題領域内の関連単語を抽出する。その後、応答文生成手段7で関連単語を発話向けに整形する。
上述したように会話処理装置20によると、ユーザ自身の発話ログが応答生成のための知識データベースとなっているため、誰でも同じ応答とならずにユーザに特有な応答生成をすることができる。例えば、「明日は晴れだね」というユーザの発話に対して会話処理装置20は、ユーザAに対して「洗濯ができるね」と応答し、他のユーザBに対しては、「釣りに行けるね」というようにユーザ毎に異なる応答生成をすることができる。
上述の実施形態では、本発明をハードウェアの構成として説明したが、本発明は、これに限定されるものではない。本発明は、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。
上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、DVD(Digital Versatile Disc)、BD(Blu-ray(登録商標) Disc)、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1 会話処理装置
2 ユーザ特定手段
3 発話認識手段
4 発話記録手段
5 キーワード抽出手段
6 関連単語抽出手段
7 応答文生成手段
8 発話手段
20 会話処理装置
21 話題分類処理手段
22 話題領域別頻出単語データベース
A 応答文発話音声
M 発話音声

Claims (1)

  1. ユーザと会話を行う会話処理装置であって、
    前記ユーザを特定するユーザ特定手段と、
    前記ユーザの発話をテキストデータとして認識する発話認識手段と、
    認識された前記発話の前記テキストデータを前記ユーザ毎に記録する発話記録手段と、
    認識された前記発話の前記テキストデータからキーワードを抽出するキーワード抽出手段と、
    抽出された前記キーワードと前記発話記録手段に記録されている特定された前記ユーザの単語との関連度を前記キーワードと前記キーワードの前後に連続する会話文に出現するそれぞれの単語との共起度に基づいて評価し、前記関連度が所定値以上に高い関連単語を抽出する関連単語抽出手段と、
    抽出された前記関連単語を用いて応答文を生成する応答文生成手段と、を有する、
    会話処理装置。
JP2016093766A 2016-05-09 2016-05-09 会話処理装置 Active JP6709558B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016093766A JP6709558B2 (ja) 2016-05-09 2016-05-09 会話処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016093766A JP6709558B2 (ja) 2016-05-09 2016-05-09 会話処理装置

Publications (2)

Publication Number Publication Date
JP2017204023A JP2017204023A (ja) 2017-11-16
JP6709558B2 true JP6709558B2 (ja) 2020-06-17

Family

ID=60322321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016093766A Active JP6709558B2 (ja) 2016-05-09 2016-05-09 会話処理装置

Country Status (1)

Country Link
JP (1) JP6709558B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7252690B2 (ja) * 2018-04-04 2023-04-05 節夫 鶴田 会話処理装置、会話処理システム、会話処理方法及びプログラム
WO2022259531A1 (ja) * 2021-06-11 2022-12-15 日本電信電話株式会社 オンライン会議のための装置、方法及びプログラム
CN117132392B (zh) * 2023-10-23 2024-01-30 蓝色火焰科技成都有限公司 车辆贷款欺诈风险预警方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188784A (ja) * 1999-12-28 2001-07-10 Sony Corp 会話処理装置および方法、並びに記録媒体
JP2015219582A (ja) * 2014-05-14 2015-12-07 日本電信電話株式会社 対話方法、対話装置、対話プログラム及び記録媒体

Also Published As

Publication number Publication date
JP2017204023A (ja) 2017-11-16

Similar Documents

Publication Publication Date Title
JP6857581B2 (ja) 成長型対話装置
US10861458B2 (en) Response sentence generation apparatus, method and program, and voice interaction system
US9558741B2 (en) Systems and methods for speech recognition
US9154629B2 (en) System and method for generating personalized tag recommendations for tagging audio content
US10452352B2 (en) Voice interaction apparatus, its processing method, and program
Mariooryad et al. Building a naturalistic emotional speech corpus by retrieving expressive behaviors from existing speech corpora
US11138334B1 (en) Use of ASR confidence to improve reliability of automatic audio redaction
Rakov et al. " sure, i did the right thing": a system for sarcasm detection in speech.
JP2018072650A (ja) 音声対話装置及び音声対話方法
US11170763B2 (en) Voice interaction system, its processing method, and program therefor
US11270691B2 (en) Voice interaction system, its processing method, and program therefor
EP2988298B1 (en) Response generation method, response generation apparatus, and response generation program
JP6709558B2 (ja) 会話処理装置
JP2013167765A (ja) 知識量推定情報生成装置、知識量推定装置、方法、及びプログラム
CN104750677A (zh) 语音传译装置、语音传译方法及语音传译程序
US10872615B1 (en) ASR-enhanced speech compression/archiving
JP5454469B2 (ja) 音声認識辞書作成支援装置,処理プログラム,および処理方法
US20110224985A1 (en) Model adaptation device, method thereof, and program thereof
US11176943B2 (en) Voice recognition device, voice recognition method, and computer program product
JP2015148758A (ja) 音声対話システム及び音声対話方法
JP5158022B2 (ja) 対話処理装置、対話処理方法、及び対話処理プログラム
JP6067616B2 (ja) 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム
Ohta et al. Selecting type of response for chat-like spoken dialogue systems based on acoustic features of user utterances
JP4705535B2 (ja) 音響モデル作成装置及び音声認識装置並びに音響モデル作成プログラム
Katerenchuk et al. Improving named entity recognition with prosodic features

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200514

R151 Written notification of patent or utility model registration

Ref document number: 6709558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250