JP2017097233A - 異常音検出装置、方法及びプログラム - Google Patents
異常音検出装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2017097233A JP2017097233A JP2015230863A JP2015230863A JP2017097233A JP 2017097233 A JP2017097233 A JP 2017097233A JP 2015230863 A JP2015230863 A JP 2015230863A JP 2015230863 A JP2015230863 A JP 2015230863A JP 2017097233 A JP2017097233 A JP 2017097233A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- utterances
- abnormal sound
- predetermined
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】異常音検出装置は、入力された各発話の音声信号についての所定の特徴量を算出する特徴量算出部1と、各発話の音声信号について音声認識を行い各発話の音声認識結果を得る音声認識部2と、各発話の音声認識結果に所定の発話意図が含まれているか判断する音声対話処理部3と、N,Mを所定の正の整数として、音声認識結果に所定の発話意図が含まれていると判断された発話の割合が所定の値以下又は未満であり、かつ、N個の発話についての算出された特徴量の集合とN個の発話とは異なるM個の発話についての算出された特徴量の集合との間に有為差がある場合には、各発話の音声信号に異常音が含まれていると判断する異常音判断部4、を備えている。
【選択図】図1
Description
以下、図面を参照して、異常音検出装置及び方法の一実施形態について説明する。
特徴量算出部1は、入力された各発話の音声信号についての所定の特徴量を算出する(ステップS1)。算出された特徴量は、異常音判断部4に出力される。
音声認識部2は、各発話の音声信号について音声認識を行い各発話の音声認識結果を得る(ステップS2)。得られた音声認識結果は、音声対話処理部3に出力される。
音声対話処理部3は、各発話の音声認識結果に所定の発話意図が含まれているか判断する(ステップS3)。
異常音判断部4は、N,Mを所定の正の整数として、音声認識結果に所定の発話意図が含まれていると判断された発話の割合が所定の値以下又は未満であり、かつ、N個の発話についての上記算出された特徴量の集合とN個の発話とは異なるM個の発話についての上記算出された特徴量の集合との間に有為差がある場合には、各発話の音声信号に異常音が含まれていると判断する(ステップS4)。
異常音検出装置における各処理をコンピュータによって実現する場合、異常音検出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各処理がコンピュータ上で実現される。
なお、図7に例示するように、異常音検出装置は、特徴量算出部1を有していなくてもよい。この場合、音声認識部2は、各発話の音声信号について音声認識を行い各発話の音声認識結果及びその音声認識結果の信頼度を得て、異常音判断部4に出力される。言い換えれば、音声認識部2の音声認識処理の過程で生じた信頼度が「特徴量」として、異常音判断部4に出力される。例えば、ある発話についての音声認識処理の過程で生じた信頼度の平均値を、その発話の特徴量とする。異常音判断部4は、この信頼度を特徴量として用いて上記と同様の処理により異常音の判断処理を行う。
2 音声認識部
3 音声対話処理部
4 異常音判断部
Claims (5)
- 入力された各発話の音声信号についての所定の特徴量を算出する特徴量算出部と、
上記各発話の音声信号について音声認識を行い上記各発話の音声認識結果を得る音声認識部と、
上記各発話の音声認識結果に所定の発話意図が含まれているか判断する音声対話処理部と、
N,Mを所定の正の整数として、音声認識結果に所定の発話意図が含まれていると判断された発話の割合が所定の値以下又は未満であり、かつ、N個の発話についての上記算出された特徴量の集合と上記N個の発話とは異なるM個の発話についての上記算出された特徴量の集合との間に有為差がある場合には、上記各発話の音声信号に異常音が含まれていると判断する異常音判断部と、
を含む異常音検出装置。 - 上記各発話の音声信号について音声認識を行い上記各発話の音声認識結果及びその音声認識結果の信頼度を得る音声認識部と、
上記各発話の音声認識結果に所定の発話意図が含まれているか判断する音声対話処理部と、
N,Mを所定の正の整数として、音声認識結果に所定の発話意図が含まれていると判断された発話の割合が所定の値以下又は未満であり、かつ、N個の発話についての上記得られた特徴量の集合と上記N個の発話とは異なるM個の発話についての上記得られた特徴量の集合との間に有為差がある場合には、上記各発話の音声信号に異常音が含まれていると判断する異常音判断部と、
を含む異常音検出装置。 - 特徴量算出部が、入力された各発話の音声信号についての所定の特徴量を算出する特徴量算出ステップと、
音声認識部が、上記各発話の音声信号について音声認識を行い上記各発話の音声認識結果を得る音声認識ステップと、
音声対話処理部が、上記各発話の音声認識結果に所定の発話意図が含まれているか判断する音声対話処理ステップと、
異常音判断部が、N,Mを所定の正の整数として、音声認識結果に所定の発話意図が含まれていると判断された発話の割合が所定の値以下又は未満であり、かつ、N個の発話についての上記算出された所定の特徴量の集合と上記N個の発話とは異なるM個の発話についての上記算出された所定の特徴量の集合との間に有為差がある場合には、上記各発話の音声信号に異常音が含まれていると判断する異常音判断ステップと、
を含む異常音検出方法。 - 音声認識部が、上記各発話の音声信号について音声認識を行い上記各発話の音声認識結果及びその音声認識結果の信頼度を得る音声認識ステップと、
音声対話処理部が、上記各発話の音声認識結果に所定の発話意図が含まれているか判断する音声対話処理ステップと、
異常音判断部が、N,Mを所定の正の整数として、音声認識結果に所定の発話意図が含まれていると判断された発話の割合が所定の値以下又は未満であり、かつ、N個の発話についての上記得られた特徴量の集合と上記N個の発話とは異なるM個の発話についての上記得られた特徴量の集合との間に有為差がある場合には、上記各発話の音声信号に異常音が含まれていると判断する異常音判断ステップと、
を含む異常音検出方法。 - 請求項1又は2の異常音検出装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015230863A JP6546077B2 (ja) | 2015-11-26 | 2015-11-26 | 異常音検出装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015230863A JP6546077B2 (ja) | 2015-11-26 | 2015-11-26 | 異常音検出装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017097233A true JP2017097233A (ja) | 2017-06-01 |
JP6546077B2 JP6546077B2 (ja) | 2019-07-17 |
Family
ID=58816768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015230863A Active JP6546077B2 (ja) | 2015-11-26 | 2015-11-26 | 異常音検出装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6546077B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7532552B2 (ja) | 2020-05-20 | 2024-08-13 | エーアイ スピーチ カンパニー リミテッド | 全二重音声インタラクションシステムのテスト方法及び装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05265482A (ja) * | 1992-03-17 | 1993-10-15 | Matsushita Electric Ind Co Ltd | 情報処理装置 |
JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
JP2004226881A (ja) * | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2004325635A (ja) * | 2003-04-23 | 2004-11-18 | Sharp Corp | 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体 |
JP2006141679A (ja) * | 2004-11-19 | 2006-06-08 | Sony Ericsson Mobilecommunications Japan Inc | 介護用端末および介護用通報システム |
-
2015
- 2015-11-26 JP JP2015230863A patent/JP6546077B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05265482A (ja) * | 1992-03-17 | 1993-10-15 | Matsushita Electric Ind Co Ltd | 情報処理装置 |
JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
JP2004226881A (ja) * | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2004325635A (ja) * | 2003-04-23 | 2004-11-18 | Sharp Corp | 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体 |
JP2006141679A (ja) * | 2004-11-19 | 2006-06-08 | Sony Ericsson Mobilecommunications Japan Inc | 介護用端末および介護用通報システム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7532552B2 (ja) | 2020-05-20 | 2024-08-13 | エーアイ スピーチ カンパニー リミテッド | 全二重音声インタラクションシステムのテスト方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6546077B2 (ja) | 2019-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101702829B1 (ko) | 인공 신경망 기반 서브-음성 유닛 구별을 이용한 화자 검증 및 식별 | |
US9875739B2 (en) | Speaker separation in diarization | |
Ferrer et al. | Is the speaker done yet? Faster and more accurate end-of-utterance detection using prosody | |
US9747890B2 (en) | System and method of automated evaluation of transcription quality | |
US20160111112A1 (en) | Speaker change detection device and speaker change detection method | |
US20140156276A1 (en) | Conversation system and a method for recognizing speech | |
US20090313016A1 (en) | System and Method for Detecting Repeated Patterns in Dialog Systems | |
KR102018331B1 (ko) | 음성 인식 시스템에서의 발화 검증 장치 및 그 방법 | |
KR102217917B1 (ko) | 음성대화 시스템, 음성대화 방법 및 프로그램 | |
KR20070060581A (ko) | 화자적응 방법 및 장치 | |
US10468031B2 (en) | Diarization driven by meta-information identified in discussion content | |
JP5342629B2 (ja) | 男女声識別方法、男女声識別装置及びプログラム | |
US8725508B2 (en) | Method and apparatus for element identification in a signal | |
US9697825B2 (en) | Audio recording triage system | |
JP6546077B2 (ja) | 異常音検出装置、方法及びプログラム | |
US20230017728A1 (en) | Techniques for audio feature detection | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP2006039382A (ja) | 音声認識装置 | |
KR101892736B1 (ko) | 실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법 | |
KR20100073160A (ko) | 음성인식 시스템의 발화검증 방법 및 장치 | |
US11922927B2 (en) | Learning data generation device, learning data generation method and non-transitory computer readable recording medium | |
KR100449912B1 (ko) | 음성인식시스템의 핵심어 검출을 위한 후처리방법 | |
KR20180050809A (ko) | 음성 파일 검증 장치 및 방법 | |
WO2016009634A1 (ja) | 会話分析システム、会話分析方法および会話分析プログラムが記録された記憶媒体 | |
CN114299962A (zh) | 基于音频流的对话角色分离方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190411 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190620 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6546077 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |