JP2023080132A - 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 - Google Patents
音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2023080132A JP2023080132A JP2023053622A JP2023053622A JP2023080132A JP 2023080132 A JP2023080132 A JP 2023080132A JP 2023053622 A JP2023053622 A JP 2023053622A JP 2023053622 A JP2023053622 A JP 2023053622A JP 2023080132 A JP2023080132 A JP 2023080132A
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- chatbot
- recognition
- speaker
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000004590 computer program Methods 0.000 title claims description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 54
- 239000000284 extract Substances 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 5
- 230000004044 response Effects 0.000 description 103
- 238000013473 artificial intelligence Methods 0.000 description 39
- 238000012545 processing Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 20
- 230000000694 effects Effects 0.000 description 14
- 238000012937 correction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000012790 confirmation Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000052 comparative effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 241000254158 Lampyridae Species 0.000 description 5
- 102220099508 rs878853797 Human genes 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 102220552596 Putative glycosyltransferase 6 domain-containing protein 1_C11A_mutation Human genes 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 102200027487 rs56170584 Human genes 0.000 description 2
- 102220040233 rs79219465 Human genes 0.000 description 2
- 241000052343 Dares Species 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Abstract
Description
特許文献2では、対話システムが答えられなかった質問に答えるための知識を拡充する情報処理装置が提案されている。特許文献3では、AIチャットボットサーバーに既に蓄積された知識を利用する音声問合せシステムが提案されている。
第1実施形態について図1~図10を参照して説明する。先ず図1を参照して第1実施形態の全体構成について説明する。ここに図1は、第1実施形態に係る、音声認識における認識結果の自動学習装置100を有する音声応答システム1の全体構成を図式的に示している。即ち、本実施形態では、音声応答システム1が、本発明に係る「AIチャットボット」の一例を構成している。
送信部101は、当該生成された合成音声データ又は合成音声のテキストデータを端末21に送信する。音声応答制御部102は、当該入力された音声認識結果をAIチャットボット(QA検索)部10に出力する。
」と発話し、ユーザ或いはカスタマ(CU)が「パソコンが壊れました。」と発話し、オペレータ(OP)が「どのような症状ですか?」と発話し、ユーザ或いはカスタマ(CU)が「電源が入りません。」の如き対話が行われた後に、当該対話を含む音響データ301から、テキスト化された音声認識結果306が、作業者30の人手により作成される。
この際、テキスト中の未知語の単語辞書400への登録が行われたり、単語の出現ルールを追加することで言語モデル402の構築が行われたりする。
第2実施形態について図11及び図12を参照して説明する。第2実施形態に係る音声応答システム1のハードウエア的な全体構成は、第1実施形態のそれ(図1参照)と同様であるので、図1を援用することとし、その説明は適宜省略する。第2実施形態に係る音声応答システム1の動作処理及び利用イメージは、第1実施形態のそれら(図2及び図3参照)と異なるので、以下詳細に説明する。ここに図11は、第1実施形態の図2と同趣旨の第2実施形態に係るフローチャートであり、図12は、第1実施形態の図3と同趣旨の第2実施形態に係る図式的概念図である。図11及び図12において、第2実施形態では、AIチャットボット(QA検索)部10(図1参照)によるQA検索におけるユーザ20(図1参照)への回答に対する評価判定を行う。
以上説明した実施形態に関して、更に以下の付記を開示する。
付記1に記載のAIチャットボットにおける認識結果の自動学習装置は、話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱部と、前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定部と、前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定部による判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習部とを備える。
付記2に記載の自動学習装置は、前記復唱部は、前記認識結果を、そのまま又は該認識結果を少なくとも部分的に同じ意味を持つ他の言葉に置き換えた上で、前記AIチャットボットからの発話で又は前記話者が認識可能な出力形式で出力することで、復唱することを特徴とする付記1記載の自動学習装置である。
付記3に記載の自動学習装置は、前記判定部は、前記復唱された認識結果に対する前記話者の反応として、前記話者による更なる発話又はAIチャットボットが検出、識別若しくは認識可能な形式での入力内容に基づいて前記認識結果の正誤を判定することを特徴とする付記1又は2に記載の自動学習装置である。
付記4に記載の自動学習装置は、前記学習部は、前記学習データの抽出として、前記反応として前記話者により更なる発話がなされ該更なる発話に係る判定が正となった場合、前記誤となった認識結果と前記正となった認識結果との相互間で差分となる単語を、類音語として辞書登録することを特徴とする付記1から3のいずれか一付記に記載の自動学習装置である。
付記5に記載の自動学習装置は、前記AIチャットボットは、前記反応として前記話者により更なる発話がなされた場合に、前記更なる発話の音声から前記話者の感情認識を行い、前記発話における誤の原因となる箇所を特定し、該特定された個所が誤であるとの前提で前記更なる発話を認識することを特徴とする付記1から4のいずれか一付記に記載の自動学習装置である。
付記6に記載の自動学習装置は、前記判定部は、前記復唱された認識結果に対する前記話者の反応に加えて又は代えて、前記AIチャットボットによる認識結果に応じて前記AIチャットボットにより実行されたQA検索の検索結果に対する前記話者の反応に基づいて、前記認識結果の正誤を判定することを特徴とする付記1から5のいずれか一付記に記載の自動学習装置である。
付記7に記載のAIチャットボットにおける認識結果の自動学習方法は、話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱ステップと、前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定ステップと、前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定ステップによる判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習ステップとを備える。
付記8に記載のコンピュータプログラムは、コンピュータに、付記7に記載のモデル構築方法を実行させるコンピュータプログラムである。
付記9に記載の記録媒体は、付記8に記載のコンピュータプログラムが記録された記録媒体である。
10…AIチャットボット(QA検索)部
11…音声キャプチャ装置
12…音声認識装置
20…ユーザ
21…端末
100…自動学習装置
101…送信部
102…音声応答制御部
103…自動学習部
400…単語辞書DB
401…音響モデルDB
402…言語モデルDB
403…変換ルールDB
404…学習データDB
Claims (9)
- AIチャットボットにおける認識結果の自動学習装置であって、
話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱部と、
前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定部と、
前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定部による判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習部と
を備えることを特徴とするAIチャットボットにおける認識結果の自動学習装置。 - 前記復唱部は、前記認識結果を、そのまま又は該認識結果を少なくとも部分的に同じ意味を持つ他の言葉に置き換えた上で、前記AIチャットボットからの発話で又は前記話者が認識可能な出力形式で出力することで、復唱することを特徴とする請求項1に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記判定部は、前記復唱された認識結果に対する前記話者の反応として、前記話者による更なる発話又はAIチャットボットが検出、識別若しくは認識可能な形式での入力内容に基づいて前記認識結果の正誤を判定することを特徴とする請求項1又は2に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記学習部は、前記学習データの抽出として、前記反応として前記話者により更なる発話がなされ該更なる発話に係る判定が正となった場合、前記誤となった認識結果と前記正となった認識結果との相互間で差分となる単語を、類音語として辞書登録することを特徴とする請求項1から3のいずれか一項に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記AIチャットボットは、前記反応として前記話者により更なる発話がなされた場合に、前記更なる発話の音声から前記話者の感情認識を行い、前記発話における誤の原因となる箇所を特定し、該特定された個所が誤であるとの前提で前記更なる発話を認識することを特徴とする請求項1から4のいずれか一項に記載のAIチャットボットにおける認識結果の自動学習装置。
- 前記判定部は、前記復唱された認識結果に対する前記話者の反応に加えて又は代えて、前記AIチャットボットによる認識結果に応じて前記AIチャットボットにより実行されたQA検索の検索結果に対する前記話者の反応に基づいて、前記認識結果の正誤を判定することを特徴とする請求項1から5のいずれか一項に記載のAIチャットボットにおける認識結果の自動学習装置。
- AIチャットボットにおける認識結果の自動学習方法であって、
話者からの発話に係る前記AIチャットボットによる認識結果を復唱する復唱ステップと、
前記復唱された認識結果に対する前記話者の反応に基づいて前記認識結果の正誤を判定する判定ステップと、
前記発話に関して前記話者及び前記AIチャットボット間でなされる対話の中で、前記判定ステップによる判定が誤となった後に正となった場合における、前記誤となった認識結果と前記正となった認識結果との差分に基づいて前記発話に係る学習データを抽出する学習ステップと
を備えることを特徴とするAIチャットボットにおける認識結果の自動学習方法。 - コンピュータに、請求項7に記載のAIチャットボットにおける認識結果の自動学習方法を実行させるコンピュータプログラム。
- 請求項8に記載のコンピュータプログラムが記録された記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023053622A JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019179539A JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
JP2023053622A JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179539A Division JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023080132A true JP2023080132A (ja) | 2023-06-08 |
Family
ID=75272261
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179539A Active JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
JP2023053622A Pending JP2023080132A (ja) | 2019-09-30 | 2023-03-29 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179539A Active JP7363307B2 (ja) | 2019-09-30 | 2019-09-30 | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7363307B2 (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3566977B2 (ja) * | 1993-12-27 | 2004-09-15 | 株式会社東芝 | 自然言語処理装置及びその方法 |
JP3762327B2 (ja) * | 2002-04-24 | 2006-04-05 | 株式会社東芝 | 音声認識方法および音声認識装置および音声認識プログラム |
DE102014017384B4 (de) * | 2014-11-24 | 2018-10-25 | Audi Ag | Kraftfahrzeug-Bedienvorrichtung mit Korrekturstrategie für Spracherkennung |
JP2018004976A (ja) * | 2016-07-04 | 2018-01-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、音声対話装置及び音声対話プログラム |
US10019986B2 (en) * | 2016-07-29 | 2018-07-10 | Google Llc | Acoustic model training using corrected terms |
JP6824795B2 (ja) * | 2017-03-17 | 2021-02-03 | ヤフー株式会社 | 修正装置、修正方法および修正プログラム |
KR102428911B1 (ko) * | 2017-05-24 | 2022-08-03 | 로비 가이드스, 인크. | 자동 음성 인식을 사용하여 생성되는 입력을 음성에 기초하여 정정하기 위한 방법 및 시스템 |
JP6654611B2 (ja) * | 2017-12-05 | 2020-02-26 | 株式会社日立製作所 | 成長型対話装置 |
-
2019
- 2019-09-30 JP JP2019179539A patent/JP7363307B2/ja active Active
-
2023
- 2023-03-29 JP JP2023053622A patent/JP2023080132A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2021056392A (ja) | 2021-04-08 |
JP7363307B2 (ja) | 2023-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11380327B2 (en) | Speech communication system and method with human-machine coordination | |
US6937983B2 (en) | Method and system for semantic speech recognition | |
López-Cózar et al. | Assessment of dialogue systems by means of a new simulation technique | |
CN100424632C (zh) | 用于高级交互接口的语义对象同步理解 | |
JP4481972B2 (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
JP4812029B2 (ja) | 音声認識システム、および、音声認識プログラム | |
JP5405672B2 (ja) | 外国語学習装置及び対話システム | |
JP3350293B2 (ja) | 対話処理装置及び対話処理方法 | |
US7907705B1 (en) | Speech to text for assisted form completion | |
US20100217591A1 (en) | Vowel recognition system and method in speech to text applictions | |
US10382624B2 (en) | Bridge for non-voice communications user interface to voice-enabled interactive voice response system | |
JP2000339314A (ja) | 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体 | |
Gibbon et al. | Spoken language system and corpus design | |
US11615787B2 (en) | Dialogue system and method of controlling the same | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
Lamel | Spoken language dialog system development and evaluation at LIMSI | |
JP2019197221A (ja) | 用件判定装置、用件判定方法およびプログラム | |
López-Cózar et al. | Combining language models in the input interface of a spoken dialogue system | |
JP7363307B2 (ja) | 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体 | |
WO2022249362A1 (ja) | テキストを合成音声に変換する音声合成 | |
Jackson | Automatic speech recognition: Human computer interface for kinyarwanda language | |
López-Cózar et al. | Evaluation of a Dialogue System Based on a Generic Model that Combines Robust Speech Understanding and Mixed-initiative Control. | |
JP6615803B2 (ja) | 用件判定装置、用件判定方法およびプログラム | |
López-Cózar et al. | Testing dialogue systems by means of automatic generation of conversations | |
Koo et al. | KEBAP: Korean Error Explainable Benchmark Dataset for ASR and Post-processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230329 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240405 |