JP2021056392A - 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 - Google Patents
音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2021056392A JP2021056392A JP2019179539A JP2019179539A JP2021056392A JP 2021056392 A JP2021056392 A JP 2021056392A JP 2019179539 A JP2019179539 A JP 2019179539A JP 2019179539 A JP2019179539 A JP 2019179539A JP 2021056392 A JP2021056392 A JP 2021056392A
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- chatbot
- voice
- utterance
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000004590 computer program Methods 0.000 title claims description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 57
- 239000000284 extract Substances 0.000 claims abstract description 9
- 230000008451 emotion Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 abstract 1
- 230000004044 response Effects 0.000 description 109
- 238000013473 artificial intelligence Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 34
- 238000012545 processing Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 7
- 241000254158 Lampyridae Species 0.000 description 5
- 102220552596 Putative glycosyltransferase 6 domain-containing protein 1_C11A_mutation Human genes 0.000 description 5
- 102220099508 rs878853797 Human genes 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 102200027487 rs56170584 Human genes 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 102220040233 rs79219465 Human genes 0.000 description 2
- 241000052343 Dares Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
第1実施形態について図1〜図10を参照して説明する。先ず図1を参照して第1実施形態の全体構成について説明する。ここに図1は、第1実施形態に係る、音声認識における認識結果の自動学習装置100を有する音声応答システム1の全体構成を図式的に示している。即ち、本実施形態では、音声応答システム1が、本発明に係る「AIチャットボット」の一例を構成している。
第2実施形態について図11及び図12を参照して説明する。第2実施形態に係る音声応答システム1のハードウエア的な全体構成は、第1実施形態のそれ(図1参照)と同様であるので、図1を援用することとし、その説明は適宜省略する。第2実施形態に係る音声応答システム1の動作処理及び利用イメージは、第1実施形態のそれら(図2及び図3参照)と異なるので、以下詳細に説明する。ここに図11は、第1実施形態の図2と同趣旨の第2実施形態に係るフローチャートであり、図12は、第1実施形態の図3と同趣旨の第2実施形態に係る図式的概念図である。図11及び図12において、第2実施形態では、AIチャットボット(QA検索)部10(図1参照)によるQA検索におけるユーザ20(図1参照)への回答に対する評価判定を行う。
以上説明した実施形態に関して、更に以下の付記を開示する。
付記1に記載のAIチャットボットにおける認識結果の自動学習装置は、話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱部と、前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定部と、前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定部による判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習部とを備える。
付記2に記載の自動学習装置は、前記復唱部は、前記認識結果を、そのまま又は該認識結果を少なくとも部分的に同じ意味を持つ他の言葉に置き換えた上で、前記AIチャットボットからの発話で又は前記話者が認識可能な出力形式で出力することで、復唱することを特徴とする付記1記載の自動学習装置である。
付記3に記載の自動学習装置は、前記判定部は、前記復唱された認識結果に対する前記話者の反応として、前記話者による更なる発話又はAIチャットボットが検出、識別若しくは認識可能な形式での入力内容に基づいて前記認識結果の正誤を判定することを特徴とする付記1又は2に記載の自動学習装置である。
付記4に記載の自動学習装置は、前記学習部は、前記学習データの抽出として、前記反応として前記話者により更なる発話がなされ該更なる発話に係る判定が正となった場合、前記誤となった認識結果と前記正となった認識結果との相互間で差分となる単語を、類音語として辞書登録することを特徴とする付記1から3のいずれか一付記に記載の自動学習装置である。
付記5に記載の自動学習装置は、前記AIチャットボットは、前記反応として前記話者により更なる発話がなされた場合に、前記更なる発話の音声から前記話者の感情認識を行い、前記発話における誤の原因となる箇所を特定し、該特定された個所が誤であるとの前提で前記更なる発話を認識することを特徴とする付記1から4のいずれか一付記に記載の自動学習装置である。
付記6に記載の自動学習装置は、前記判定部は、前記復唱された認識結果に対する前記話者の反応に加えて又は代えて、前記AIチャットボットによる認識結果に応じて前記AIチャットボットにより実行されたQA検索の検索結果に対する前記話者の反応に基づいて、前記認識結果の正誤を判定することを特徴とする付記1から5のいずれか一付記に記載の自動学習装置である。
付記7に記載のAIチャットボットにおける認識結果の自動学習方法は、話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱ステップと、前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定ステップと、前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定ステップによる判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習ステップとを備える。
付記8に記載のコンピュータプログラムは、コンピュータに、付記7に記載のモデル構築方法を実行させるコンピュータプログラムである。
付記9に記載の記録媒体は、付記8に記載のコンピュータプログラムが記録された記録媒体である。
10…AIチャットボット(QA検索)部
11…音声キャプチャ装置
12…音声認識装置
20…ユーザ
21…端末
100…自動学習装置
101…送信部
102…音声応答制御部
103…自動学習部
400…単語辞書DB
401…音響モデルDB
402…言語モデルDB
403…変換ルールDB
404…学習データDB
Claims (9)
- AIチャットボットにおける認識結果の自動学習装置であって、
話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱部と、
前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定部と、
前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定部による判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習部と
を備えることを特徴とするAIチャットボットにおける認識結果の自動学習装置。 - 前記復唱部は、前記認識結果を、そのまま又は該認識結果を少なくとも部分的に同じ意味を持つ他の言葉に置き換えた上で、前記AIチャットボットからの発話で又は前記話者が認識可能な出力形式で出力することで、復唱することを特徴とする請求項1に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記判定部は、前記復唱された認識結果に対する前記話者の反応として、前記話者による更なる発話又はAIチャットボットが検出、識別若しくは認識可能な形式での入力内容に基づいて前記認識結果の正誤を判定することを特徴とする請求項1又は2に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記学習部は、前記学習データの抽出として、前記反応として前記話者により更なる発話がなされ該更なる発話に係る判定が正となった場合、前記誤となった認識結果と前記正となった認識結果との相互間で差分となる単語を、類音語として辞書登録することを特徴とする請求項1から3のいずれか一項に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記AIチャットボットは、前記反応として前記話者により更なる発話がなされた場合に、前記更なる発話の音声から前記話者の感情認識を行い、前記発話における誤の原因となる箇所を特定し、該特定された個所が誤であるとの前提で前記更なる発話を認識することを特徴とする請求項1から4のいずれか一項に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記判定部は、前記復唱された認識結果に対する前記話者の反応に加えて又は代えて、前記AIチャットボットによる認識結果に応じて前記AIチャットボットにより実行されたQA検索の検索結果に対する前記話者の反応に基づいて、前記認識結果の正誤を判定することを特徴とする請求項1から5のいずれか一項に記載のAIチャットボットにおける認識結果の自動学習装置。
- AIチャットボットにおける認識結果の自動学習方法であって、
話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱ステップと、
前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定ステップと、
前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定ステップによる判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習ステップと
を備えることを特徴とするAIチャットボットにおける認識結果の自動学習方法。 - コンピュータに、請求項7に記載のAIチャットボットにおける認識結果の自動学習方法を実行させるコンピュータプログラム。
- 請求項8に記載のコンピュータプログラムが記録された記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019179539A JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
JP2023053622A JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019179539A JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023053622A Division JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021056392A true JP2021056392A (ja) | 2021-04-08 |
JP7363307B2 JP7363307B2 (ja) | 2023-10-18 |
Family
ID=75272261
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179539A Active JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
JP2023053622A Pending JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023053622A Pending JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7363307B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07191687A (ja) * | 1993-12-27 | 1995-07-28 | Toshiba Corp | 自然言語処理装置及びその方法 |
JP2003316386A (ja) * | 2002-04-24 | 2003-11-07 | Toshiba Corp | 音声認識方法および音声認識装置および音声認識プログラム |
US20170229120A1 (en) * | 2014-11-24 | 2017-08-10 | Audi Ag | Motor vehicle operating device with a correction strategy for voice recognition |
JP2018004976A (ja) * | 2016-07-04 | 2018-01-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、音声対話装置及び音声対話プログラム |
JP2018156418A (ja) * | 2017-03-17 | 2018-10-04 | ヤフー株式会社 | 修正装置、修正方法および修正プログラム |
JP2019101291A (ja) * | 2017-12-05 | 2019-06-24 | 株式会社日立製作所 | 成長型対話装置 |
JP2019528470A (ja) * | 2016-07-29 | 2019-10-10 | グーグル エルエルシー | 訂正済みタームを使用する音響モデルトレーニング |
JP2020522733A (ja) * | 2017-05-24 | 2020-07-30 | ロヴィ ガイズ, インコーポレイテッド | 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム |
-
2019
- 2019-09-30 JP JP2019179539A patent/JP7363307B2/ja active Active
-
2023
- 2023-03-29 JP JP2023053622A patent/JP2023080132A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07191687A (ja) * | 1993-12-27 | 1995-07-28 | Toshiba Corp | 自然言語処理装置及びその方法 |
JP2003316386A (ja) * | 2002-04-24 | 2003-11-07 | Toshiba Corp | 音声認識方法および音声認識装置および音声認識プログラム |
US20170229120A1 (en) * | 2014-11-24 | 2017-08-10 | Audi Ag | Motor vehicle operating device with a correction strategy for voice recognition |
JP2018004976A (ja) * | 2016-07-04 | 2018-01-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、音声対話装置及び音声対話プログラム |
JP2019528470A (ja) * | 2016-07-29 | 2019-10-10 | グーグル エルエルシー | 訂正済みタームを使用する音響モデルトレーニング |
JP2018156418A (ja) * | 2017-03-17 | 2018-10-04 | ヤフー株式会社 | 修正装置、修正方法および修正プログラム |
JP2020522733A (ja) * | 2017-05-24 | 2020-07-30 | ロヴィ ガイズ, インコーポレイテッド | 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム |
JP2019101291A (ja) * | 2017-12-05 | 2019-06-24 | 株式会社日立製作所 | 成長型対話装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7363307B2 (ja) | 2023-10-18 |
JP2023080132A (ja) | 2023-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6465077B2 (ja) | 音声対話装置および音声対話方法 | |
US7907705B1 (en) | Speech to text for assisted form completion | |
CN100424632C (zh) | 用于高级交互接口的语义对象同步理解 | |
JP5405672B2 (ja) | 外国語学習装置及び対話システム | |
US6937983B2 (en) | Method and system for semantic speech recognition | |
JP4812029B2 (ja) | 音声認識システム、および、音声認識プログラム | |
US10382624B2 (en) | Bridge for non-voice communications user interface to voice-enabled interactive voice response system | |
US20100217591A1 (en) | Vowel recognition system and method in speech to text applictions | |
Skantze | Exploring human error handling strategies: Implications for spoken dialogue systems | |
JP2006349954A (ja) | 対話システム | |
CN110570853A (zh) | 基于语音数据的意图识别方法和装置 | |
CN111916062B (zh) | 语音识别方法、装置和系统 | |
JP2011232619A (ja) | 音声認識装置および音声認識方法 | |
US10789946B2 (en) | System and method for speech recognition with decoupling awakening phrase | |
JP2018128575A (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
Edlund et al. | Higgins-a spoken dialogue system for investigating error handling techniques. | |
López-Cózar et al. | Combining language models in the input interface of a spoken dialogue system | |
JP7363307B2 (ja) | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 | |
JP4103085B2 (ja) | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 | |
JP2019197221A (ja) | 用件判定装置、用件判定方法およびプログラム | |
Lamel | Spoken language dialog system development and evaluation at LIMSI | |
TW201719452A (zh) | 一種通過語音對機器人進行訓練的系統及方法 | |
JP6615803B2 (ja) | 用件判定装置、用件判定方法およびプログラム | |
López-Cózar et al. | Evaluation of a Dialogue System Based on a Generic Model that Combines Robust Speech Understanding and Mixed-initiative Control. | |
JP4408665B2 (ja) | 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220809 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230918 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7363307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |