JP6235360B2 - 発話文収集装置、方法、及びプログラム - Google Patents
発話文収集装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6235360B2 JP6235360B2 JP2014020811A JP2014020811A JP6235360B2 JP 6235360 B2 JP6235360 B2 JP 6235360B2 JP 2014020811 A JP2014020811 A JP 2014020811A JP 2014020811 A JP2014020811 A JP 2014020811A JP 6235360 B2 JP6235360 B2 JP 6235360B2
- Authority
- JP
- Japan
- Prior art keywords
- intention
- slot
- utterance sentence
- bias
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 108
- 230000004044 response Effects 0.000 claims description 103
- 230000007704 transition Effects 0.000 claims description 63
- 238000000605 extraction Methods 0.000 claims description 43
- 239000000284 extract Substances 0.000 claims description 31
- 230000002452 interceptive effect Effects 0.000 claims description 8
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 239000013589 supplement Substances 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 44
- 238000007619 statistical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
図1は、第1の実施形態に係る発話文収集装置100を概略的に示している。発話文収集装置100は、図1に示されるように、発話文入力部101、意図・スロット抽出部102、意図・スロット管理部103、意図・スロット偏り判定部104、及び要求出力部105を備えている。
図2は、発話文収集装置100が対話文を収集する処理に係る手順を概略的に示している。図2のステップS201では、意図・スロット偏り判定部104は、意図・スロット管理部103に蓄積されているデータ(意図に関するデータ及びスロットに関するデータの少なくとも一方)に偏りがあるか否かを判定する。偏りがあると判定された場合、ステップS202に進む。
第1の実施形態では、ユーザは要求出力部が提示した要求文に応じて発話文を入力する。この場合、対話システムとの対話を実際に行っているわけではないため、収集できる発話文は、例えば対話システムとの対話を開始する初期状態のような、ユーザが自由に発話文を入力できる対話状態において入力される発話文に限定されてしまう可能性がある。第2の実施形態では、要求文とともに対話システムが実際に出力する応答文をユーザに提示することで、対話システム利用時の様々な対話状態における発話文を収集することができる。
図8は、発話文収集装置700が発話文を収集する処理に係る手順を概略的に示している。図7に示したステップS804、S805、及びS806の処理はそれぞれ図1に示したステップS203、S204、及びS205の処理と同様であるので、ステップS804、S805、及びS806の処理についての詳細な説明は省略する。
第2の実施形態では、対話システムで出力する応答文をユーザに提示している。第3の実施形態では、実際の対話システムを動作させて発話文を収集する。これにより、ユーザは対話の流れに沿って発話文を入力することになり、その結果、対話の流れを加味した実際に対話システムを運用している際に入力される可能性の高い発話文を収集することができる。
図11は、発話文収集装置1000が発話文を収集する処理に係る手順を概略的に示している。図11に示したステップS1105、S1107、S1108の処理は、図2に示したステップS203、S204、S205の処理と同様であるので、ステップS1105、1107、及び1108の処理についての詳細な説明は省略する。
第3の実施形態では、頻度の低い意図やスロットを抽出して到達すべき対話状態を制御している。様々な対話遷移を含む対話データを収集するためであれば対話状態の到達頻度自体を蓄積して、対話状態の到達頻度の偏りによってユーザに発話文に対する要求を与えてもよいと考えられる。このような対話データを収集することで統計的な対話制御モデルを作成することが可能となる。
図15は、発話文収集装置1400が発話文を収集する処理に係る手順例を示している。図15に示したステップS1505及びS1506の処理は図2に示したステップS204及びS205の処理と同様であり、図15に示したステップS1501、S1504、S1508からS1510の処理は図11に示したステップS1101、S1106、S1110からS1112の処理と同様であるので、ステップS1501、S1504、ステップS1505、S1506、S1508からS1510の処理についての詳細な説明は省略する。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶又は一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (16)
- ユーザからの発話文の入力を受け付ける入力部と、
前記発話文から、当該発話文の意図及び当該意図を補足する情報であるスロットの少なくとも一方を抽出する抽出部と、
前記意図及びスロットの少なくとも一方に関するデータを蓄積する管理部と、
前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記データから頻度の低い意図及びスロットの少なくとも一方を取得する偏り判定部と、
前記偏り判定部によって取得された前記意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する要求出力部と、
を具備する発話文収集装置。 - 前記偏り判定部は、前記データに含まれる意図の総頻度が一定数以上に達しているときに相対頻度が第1閾値より小さい意図が存在する場合と、前記データに含まれるスロットの総頻度が一定数以上に達しているときに相対頻度が第2閾値より小さいスロットが存在する場合と、の少なくとも一方の場合に、前記偏りがあると判定する、請求項1に記載の発話文収集装置。
- 前記偏り判定部は、頻度が最も高い意図と頻度が最も低い意図との間の頻度差が第1閾値以上である場合と、頻度が最も高いスロットと頻度が最も低いスロットとの間の頻度差が第2閾値以上である場合と、の少なくとも一方の場合に、前記偏りがあると判定する、請求項1に記載の発話文収集装置。
- 対話システムが出力する応答文を提示する応答出力部をさらに具備する請求項1乃至3のいずれか1項に記載の発話文収集装置。
- 前記応答出力部は、前記ユーザが前記発話文を入力する前に前記応答文を前記ユーザに提示する、請求項4に記載の発話文収集装置。
- 前記応答出力部は、前記応答文が出現するまでの対話の内容をさらに提示する、請求項4又は5に記載の発話文収集装置。
- 前記抽出部によって抽出された前記意図及びスロットの少なくとも一方に基づいて対話処理を行う対話制御部と、
前記対話処理に応じた応答文を提示する応答出力部と、をさらに具備し、
前記管理部は、前記抽出部によって抽出された前記意図及びスロットの少なくとも一方を、前記対話文の入力時における前記対話制御部の対話状態と関連付けて記憶し、
前記偏り判定部は、対話状態ごとに前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記偏りがある対話状態に到達するルートが存在するか否かを判定し、前記ルートが存在すると判定した場合に、前記偏りがある前記対話状態に対応付けたれた頻度の低い意図及びスロットの少なくとも一方を取得し、
前記要求出力部は、前記偏りがある前記対話状態が、前記対話制御部が前記対話処理を行った後の対話状態と一致する場合に、前記偏り判定部によって取得された前記意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する要求文を提示し、前記偏りがある前記対話状態が、前記対話制御部が前記対話処理を行った後の対話状態と一致しない場合に、前記偏りがある前記対話状態に到達するための意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する、請求項1乃至3のいずれか1項に記載の発話文収集装置。 - 前記要求出力部は、前記偏りがある前記対話状態に到達するための前記意図及びスロットの少なくとも一方に関する候補が複数ある場合、前記候補から最も低い意図及びスロットの少なくとも一方を選択し、前記選択した意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する、請求項7に記載の発話文収集装置。
- 前記偏り判定部は、同じ対話状態での複数の発話文の入力が必要か否かを判定し、
前記要求出力部は、前記偏り判定部によって必要と判定された場合、前記偏り判定部によって取得された前記意図及びスロットの少なくとも一方に関連する発話文を再度入力するように要求する、請求項7又は8に記載の発話文収集装置。 - 前記意図は前記発話文が大まかに伝えようとする内容を示す情報である、請求項1乃至9のいずれか1項に記載の発話文収集装置。
- ユーザからの発話文の入力を受け付けることと、
前記発話文から、当該発話文の意図及び当該意図を補足する情報であるスロットの少なくとも一方を抽出することと、
前記意図及びスロットの少なくとも一方に関するデータを蓄積することと、
前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記データから頻度の低い意図及びスロットの少なくとも一方を取得することと、
前記取得された前記意図及びスロットの少なくとも一方に関連する発話文を入力するように要求することと、
を具備する発話文収集方法。 - コンピュータを、
ユーザからの発話文の入力を受け付ける入力手段と、
前記発話文から、当該発話文の意図及び当該意図を補足する情報であるスロットの少なくとも一方を抽出する抽出手段と、
前記意図及びスロットの少なくとも一方に関するデータを蓄積する管理手段と、
前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記データから頻度の低い意図及びスロットの少なくとも一方を取得する偏り判定手段と、
前記偏り判定手段によって取得された前記意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する要求出力手段として機能させるための発話文収集プログラム。 - ユーザからの発話文の入力を受け付ける入力部と、
前記発話文から、当該発話文の意図及び当該意図を補足する情報であるスロットの少なくとも一方を抽出する抽出部と、
前記意図及びスロットの少なくとも一方に基づいて対話処理を行う対話制御部と、
前記対話処理に応じた応答文を提示する応答出力部と、
前記対話制御部の対話状態に関するデータを蓄積する管理部と、
前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記データから頻度の低い対話状態を取得する判定部と、
前記頻度の低い対話状態に到達するための意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する要求出力部と、
を具備する発話文収集装置。 - 前記管理部は、前記対話処理によって生じる対話状態間の遷移に関するデータを蓄積し、前記偏り判定部は前記遷移に関して前記偏りがあるか否かを判定する、請求項13に記載の発話文収集装置。
- ユーザからの発話文の入力を受け付けることと、
前記発話文から、当該発話文の意図及び当該意図を補足する情報であるスロットの少なくとも一方を抽出することと、
前記意図及びスロットの少なくとも一方に基づいて対話処理を行うことと、
前記対話処理に応じた応答文を提示することと、
前記対話制御部の対話状態に関するデータを記憶することと、
前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記データから頻度の低い対話状態を取得することと、
前記頻度の低い対話状態に到達するための意図及びスロットの少なくとも一方に関連する発話文を入力するように要求することと、
を具備する発話文収集方法。 - コンピュータを、
ユーザからの発話文の入力を受け付ける入力手段と、
前記発話文から、当該発話文の意図及び当該意図を補足する情報であるスロットの少なくとも一方を抽出する抽出手段と、
前記意図及びスロットの少なくとも一方に基づいて対話処理を行う対話制御手段と、
前記対話処理に応じた応答文を提示する応答出力手段と、
前記対話制御部の対話状態に関するデータを記憶する管理手段と、
前記データに偏りがあるか否かを判定し、前記偏りがあると判定した場合に、前記データから頻度の低い対話状態を取得する判定手段と、
前記頻度の低い対話状態に到達するための意図及びスロットの少なくとも一方に関連する発話文を入力するように要求する要求出力手段として機能させるための発話文収集プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014020811A JP6235360B2 (ja) | 2014-02-05 | 2014-02-05 | 発話文収集装置、方法、及びプログラム |
PCT/JP2015/053448 WO2015119267A1 (en) | 2014-02-05 | 2015-02-03 | Uttered sentence collection apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014020811A JP6235360B2 (ja) | 2014-02-05 | 2014-02-05 | 発話文収集装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015148910A JP2015148910A (ja) | 2015-08-20 |
JP6235360B2 true JP6235360B2 (ja) | 2017-11-22 |
Family
ID=53778064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014020811A Active JP6235360B2 (ja) | 2014-02-05 | 2014-02-05 | 発話文収集装置、方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6235360B2 (ja) |
WO (1) | WO2015119267A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017168637A1 (ja) * | 2016-03-30 | 2017-10-05 | 三菱電機株式会社 | 意図推定装置及び意図推定方法 |
JP6803309B2 (ja) * | 2017-08-17 | 2020-12-23 | Kddi株式会社 | 対話データを自動的に追加可能なプログラム、対話サーバ及び方法 |
KR102288249B1 (ko) | 2017-10-31 | 2021-08-09 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 |
JP2019106054A (ja) * | 2017-12-13 | 2019-06-27 | 株式会社東芝 | 対話システム |
JP6964558B2 (ja) * | 2018-06-22 | 2021-11-10 | 株式会社日立製作所 | 音声対話システムとモデル作成装置およびその方法 |
JP2020177367A (ja) * | 2019-04-16 | 2020-10-29 | ナレルシステム株式会社 | エッジ主導型協働aiのためのコンピュータシステム、そのためのプログラム及び方法 |
JP6741322B1 (ja) * | 2019-11-07 | 2020-08-19 | Jeインターナショナル株式会社 | 自動発信システム、処理方法、およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009145775A (ja) * | 2007-12-17 | 2009-07-02 | Nec Corp | 言語モデル生成システム、言語モデル生成方法および言語モデル生成用プログラム |
-
2014
- 2014-02-05 JP JP2014020811A patent/JP6235360B2/ja active Active
-
2015
- 2015-02-03 WO PCT/JP2015/053448 patent/WO2015119267A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2015148910A (ja) | 2015-08-20 |
WO2015119267A1 (en) | 2015-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6235360B2 (ja) | 発話文収集装置、方法、及びプログラム | |
JP6604542B2 (ja) | 対話方法、対話プログラム及び対話システム | |
US11797772B2 (en) | Word lattice augmentation for automatic speech recognition | |
CN108391149B (zh) | 显示设备、控制显示设备的方法、服务器以及控制服务器的方法 | |
WO2018021237A1 (ja) | 音声対話装置、音声対話方法、および記録媒体 | |
JP7132090B2 (ja) | 対話システム、対話装置、対話方法、及びプログラム | |
JP6235757B2 (ja) | 対話データ収集システム、対話データ収集方法、対話データ収集プログラム、対話データ収集支援装置、対話データ収集支援方法および対話データ収集支援プログラム | |
KR20140089861A (ko) | 디스플레이 장치 및 그의 제어 방법 | |
CN104699784A (zh) | 一种基于交互式输入的数据搜索方法及装置 | |
JP6143883B2 (ja) | 対話支援システム、方法、及びプログラム | |
JP6622165B2 (ja) | 対話ログ分析装置、対話ログ分析方法およびプログラム | |
JP2017167659A (ja) | 機械翻訳装置、方法、およびプログラム | |
JPWO2018047421A1 (ja) | 音声処理装置、情報処理装置、音声処理方法および情報処理方法 | |
JP2014202848A (ja) | テキスト生成装置、方法、及びプログラム | |
JP2018194902A (ja) | 生成装置、生成方法および生成プログラム | |
KR20150077580A (ko) | 음성 인식 기반 서비스 제공 방법 및 그 장치 | |
JP2016001242A (ja) | 質問文生成方法、装置、及びプログラム | |
JP2008145769A (ja) | 対話シナリオ生成システム,その方法およびプログラム | |
US8000965B2 (en) | Information-processing device and method that attains speech-recognition to recognize data input via speech | |
WO2019065647A1 (ja) | 対話処理装置および対話処理システム | |
JP3542578B2 (ja) | 音声認識装置及びその方法、プログラム | |
JP6322125B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP5378907B2 (ja) | 音声対話装置及び音声対話プログラム | |
JP2018206228A (ja) | 計算機システム、対話制御方法、及び計算機 | |
JP6050171B2 (ja) | 認識処理制御装置、認識処理制御方法および認識処理制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171026 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6235360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |