JP5664480B2 - 異常状態検出装置、電話機、異常状態検出方法、及びプログラム - Google Patents
異常状態検出装置、電話機、異常状態検出方法、及びプログラム Download PDFInfo
- Publication number
- JP5664480B2 JP5664480B2 JP2011146047A JP2011146047A JP5664480B2 JP 5664480 B2 JP5664480 B2 JP 5664480B2 JP 2011146047 A JP2011146047 A JP 2011146047A JP 2011146047 A JP2011146047 A JP 2011146047A JP 5664480 B2 JP5664480 B2 JP 5664480B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- utterance data
- data
- statistic
- abnormal state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000002159 abnormal effect Effects 0.000 title claims description 133
- 238000001514 detection method Methods 0.000 title claims description 133
- 238000012545 processing Methods 0.000 claims description 99
- 238000004364 calculation method Methods 0.000 claims description 48
- 238000013500 data storage Methods 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 19
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 214
- 230000008569 process Effects 0.000 description 197
- 239000000872 buffer Substances 0.000 description 59
- 238000006243 chemical reaction Methods 0.000 description 12
- 108010076504 Protein Sorting Signals Proteins 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 230000008451 emotion Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000009432 framing Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000037433 frameshift Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 206010011224 Cough Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010041232 sneezing Diseases 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Description
なお、この他の技術として、ピッチ周波数やパワーが所定の閾値以上である特異な発話を検出することによって、直前の音声認識処理の結果の正誤を認知するという技術が知られている。
図1の電話機1は異常状態検出装置10を備えている。異常状態検出装置10は、話者の発話を表しているデータ(発話データ2)を分析して、当該話者が異常状態に陥っていることの検出を行う。
取得部11は、電話機1からの発話データ2の入力を取得する。
擬似発話データ作成部13は、取得部11により取得された発話データ2と、基準発話データ3との各々についての上述の特徴パラメータの統計量に基づき擬似発話データ4を作成する。なお、基準発話データ3とは、異常状態の検出対象となる話者の平常状態下の発話を表しているデータである。また、擬似発話データ4とは、上述の特徴パラメータのうちの少なくとも1つの統計量が、基準発話データ3についてのものと一致しているデータである。
なお、検出部15は、取得部11により取得された発話データ2のうちで、上述の特徴パラメータの統計量の時間変化が、所定の第一閾値よりも大きいものを、前記検出の基礎から除外するようにしてもよい。
更新部16は、取得部11が取得した発話データ2と基準発話データ3との各々についての特徴パラメータの統計量の違いが所定の第二閾値よりも少ない場合に、取得した発話データ2を用いて基準発話データ3についての特徴パラメータの統計量の更新を行う。
基準発話データ記憶部17は、複数種類の基準発話データ3の各々についての特徴パラメータの統計量を記憶しておく記憶部である。
なお、図1の電話機1は、異常状態検出装置10と共に、電話帳データ記憶部20を備えていてもよい。
この場合、異常状態検出装置10が備える更新部16は、取得部11が、電話帳データ記憶部20に記憶されている電話帳データに含まれている通話先との通話における話者の発話を表している発話データ2を取得した場合にのみ、前述の更新を行う。
なお、図2には、異常状態検出装置10による話者の異常状態の検出と、音声信号の送信と、電話帳データの管理とに関係する電話機1の構成のみを表しており、その他の構成については省略している。
増幅部22は、マイクロホン21から出力される音声信号の振幅を増幅する。
AD変換部24は、LPF23から出力される、アナログ信号である音声信号に対して標本化及び量子化を施して、当該音声信号を表現しているデジタルデータ(音声データ)に変換するアナログデジタル変換器である。なお、LPF23は、AD変換部24による標本化によって生じる折り返し雑音を遮断するためのアンチエイリアス処理を行わせている。
信号処理部26は、音声符号化部25から出力される音声符号化処理後の音声データに対して、所定のベースバンド信号処理を施す。
送信部28は、変調処理部27から出力される送信信号を増幅してアンテナ29に出力する。
また、電話帳データの管理に関して、電話機1は、電話帳データ記憶部20と電話機制御部30とを備えている。
ここで図3について説明する。図3は、電話帳データ記憶部20において記憶される電話帳データのデータ構造の一例である。
電話機制御部30は、電話機1を構成している各要素の動作の制御を行う制御部であり、特に、電話帳データ記憶部20において記憶されている電話帳データの管理(各データの追加、削除、変更など)を行う。
この異常状態検出装置10は、MPU51、RAM52、ROM53、及びインタフェース装置54を備えている。なお、これらの構成要素はバスライン55を介して接続されており、MPU51の管理の下で各種のデータを相互に授受することができる。
RAM(Random Access Memory)52は、MPU51が各種の制御プログラムを実行する際に、必要に応じて作業用記憶領域として使用する、随時書き込み読み出し可能な半導体メモリである。
まず図5について説明する。図5は、基準発話データ統計量登録処理の処理内容を図解したフローチャートである。この基準発話データ統計量登録処理は、電話機1の使用者である話者についての平常状態下での発話を表現しているデータから、この発話の特徴を表している特徴パラメータの統計量を算出して保存しておく処理である。なお、本実施例では、この特徴パラメータとして、発話のピッチ周波数と対数パワーを採用する。
次に、S102では、発話データ2に対するフレーム化処理及び窓掛け処理を第一算出部12が行う。
なお、本実施例では、母音フレーム検出のために使用する特徴パラメータとして、フレームに含まれる信号系列の対数パワーとケプストラム(Cepstrum)との算出を第一算出部12が行う。
なお、S109の処理の判定基準となる母音フレームの個数は、本実施例においては、時間にして60秒に相当するフレーム数を設定しておくが、他の値としてもよい。
この基準発話データ統計量登録処理は、例えば、電話機1の使用者が平常状態下で通話を行っている間に実行するようにしてもよいし、また、平常状態下での通話を録音しておき、通話終了後に実行するようにしてもよい。また、この処理は、できるだけ平常状態下での通話における発話のデータに対して行うことが望まれる。そこで、前述の電話帳データに含まれている通話先との通話における発話のデータに対してのみ、この処理を行うようにしてもよい。
次に、S202では、発話データ2に対するフレーム化処理及び窓掛け処理を第一算出部12が行う。
次に、S206では、母音フレームの取得数が1000以上に達したか否かを判定する処理を制御部18が行う。この1000フレームとは、フレームシフト長を20ミリ秒と設定した場合における20秒分に相当するフレーム数である。このフレーム数には、後述の各平均値の値が安定する(値の変動が所定範囲内に収まる)のに必要な時間長を設定することが好ましく、本実施例では、この数を1000としたものである。
μ+σ,μ−σ,μ+σ,μ−σ,μ+σ,μ−σ,…
S216では、直近に行われたS204の判定処理によって得られた母音フレームについてのピッチ周波数及び対数パワー値を、リングバッファ62における、直近にサンプルを格納した位置の次の位置に格納する処理を制御部18が行う。
まず図7について説明する。図7は、リングバッファ62内における合成発話データ5の推移を図解したものである。
なお、図8において破線で示されている基準値は、擬似発話データ4についての標準偏差であり、前述したように、この値は基準発話データ3についての標準偏差と同一の値である。
前述の2つの標準偏差の距離の時間変化のふるまいは、母音フレームが3001フレーム以降の場合には、3001フレーム以前の場合から変化する。そこで、平均距離の算出では、通話終了までに得られた母音フレームが3001フレーム未満の場合と3001フレーム以上の場合とで算出方法を切り換えるようにする。
図12において、S251の処理は、図6のS214若しくはS218に続いて実行される。このS251では、前ステップ(すなわちS214若しくはS218)の処理で算出された距離と、その処理の直近に行われていた距離の算出処理で算出されていた距離との差の値を算出する処理を検出部15が行う。
図13において、まず、S301では、異常状態検出処理によって発話データ2から得られた母音フレームの取得数が所定数以上となったか否かを判定する処理を更新部16が行う。ここで、更新部16は、母音フレームの取得数が所定数以上となったと判定したとき(判定結果がYesのとき)にはS302に処理を進める。一方、更新部16は、母音フレームの取得数が所定数未満であると判定したとき(判定結果がNoのとき)には、当該取得数が所定数以上となるまで、この判定処理を繰り返す。
以上までの処理が基準発話データ更新処理であり、この処理によって、基準発話データ3についての特徴パラメータの統計量が、取得した発話データ2を用いて更新される。
図14において、S351の処理は、図13におけるS301の判定処理の結果がYesであった場合に実行される。このS351では、通話先の電話番号が判明しているか否かを判定する処理を更新部16が行う。
2 発話データ
3 基準発話データ
4 擬似発話データ
5 合成発話データ
10 異常状態検出装置
11 取得部
12 第一算出部
13 擬似発話データ作成部
14 第二算出部
15 検出部
16 更新部
17 基準発話データ記憶部
18 制御部
20 電話帳データ記憶部
21 マイクロホン
22 増幅部
23 LPF
24 AD変換部
25 音声符号化部
26 信号処理部
27 変調処理部
28 送信部
29 アンテナ
30 電話機制御部
40 出力部
51 MPU
52 RAM
53 ROM
54 インタフェース装置
55 バスライン
56 可搬型記録媒体
57 データ読出装置
61 バッファ
62 リングバッファ
Claims (11)
- 話者の発話を表している発話データの入力を取得する取得部、
前記発話データから、前記発話の特徴を表している特徴パラメータの統計量を算出する第一算出部、
平常状態下の発話を表している基準発話データと、前記取得部により取得された発話データとの各々についての前記特徴パラメータの統計量に基づき、前記特徴パラメータのうちの少なくとも1つの統計量が該基準発話データについての該統計量と一致する擬似発話データを作成する擬似発話データ作成部、
前記擬似発話データと前記取得部により取得された発話データについての前記特徴パラメータの統計量とに基づき、該擬似発話データを該発話データが入力された分だけ置き換えて得られる合成発話データについての前記特徴パラメータの統計量を算出する第二算出部、及び
前記合成発話データと前記基準発話データとの各々についての前記特徴パラメータの統計量の違いに基づいて、前記取得部により取得された発話データによって表される発話時における、話者の異常状態を検出する検出部、
を備えることを特徴とする異常状態検出装置。 - 前記特徴パラメータは、前記発話のピッチの周波数の時間変化の平均値及び標準偏差並びに該発話の対数パワーの時間変化の平均値及び標準偏差であることを特徴とする請求項1に記載の異常状態検出装置。
- 前記擬似発話データ作成部は、前記擬似発話データとして、該擬似発話データで表される発話のピッチの周波数の時間変化の平均値を、前記取得部により取得された発話データで表されている発話についてのものと一致させると共に、該周波数の時間変化の標準偏差を、前記基準発話データで表されている発話についてのものと一致させ、更に、該擬似発話データで表される発話の対数パワーの時間変化の平均値を、該取得部により取得された発話データで表されている発話についてのものと一致させると共に、該対数パワーの時間変化の標準偏差を、該基準発話データで表されている発話についてのものと一致させたものを作成することを特徴とする請求項2に記載の異常状態検出装置。
- 前記検出部は、発話のピッチの周波数の時間変化の標準偏差と該発話の対数パワーの時間変化の標準偏差とで定義される二次元空間における、前記合成発話データと前記基準発話データとの間の距離の大きさに基づいて、前記取得された発話データによって表される発話時における、話者の異常状態を検出することを特徴とする請求項2又は3に記載の異常状態検出装置。
- 前記検出部は、前記取得部により取得された発話データのうちで、前記特徴パラメータの統計量の時間変化が、所定の第一閾値よりも大きい統計量を除いて、前記異常状態を検出することを特徴とする請求項1から4のうちのいずれか一項に記載の異常状態検出装置。
- 前記取得部が取得した発話データと前記基準発話データとの各々についての前記特徴パラメータの統計量の違いが所定の第二閾値よりも少ない場合に、該取得した発話データを用いて該基準発話データについての前記特徴パラメータの統計量の更新を行う更新部を更に備え、
前記擬似発話データ作成部は、前記更新部により前記更新が行われた場合には、前記更新された基準発話データについての前記特徴パラメータの統計量に基づき前記擬似発話データを作成し、
前記第二算出部は、前記更新部により前記更新が行われた場合には、前記更新された基準発話データについての前記特徴パラメータの統計量に基づいて作成された擬似発話データと前記取得部により取得された発話データとの前記特徴パラメータの統計量に基づき、前記合成発話データについての前記特徴パラメータの統計量を算出し、
前記検出部は、前記更新部により前記更新が行われた場合には、前記更新された基準発話データについての前記特徴パラメータの統計量に基づいて算出された合成発話データについての前記特徴パラメータの統計量と、該更新された基準発話データについての前記特徴パラメータの統計量との違いに基づいて、前記取得部により取得された発話データによって表されている発話の話者が異常状態にあることを検出する、
ことを特徴とする請求項1から5のうちのいずれか一項に記載の異常状態検出装置。 - 複数種類の前記基準発話データの各々についての前記特徴パラメータの統計量を記憶しておく基準発話データ記憶部を更に備え、
前記更新部は、前記複数種類の基準発話データの各々についての前記特徴パラメータの統計量のうちで、新たに取得した発話データについての特徴量との違いが最小であるものを、該新たに取得した発話データを用いて更新する、
ことを特徴とする請求項6に記載の異常状態検出装置。 - 請求項1から7のうちのいずれか一項に記載の異常状態検出装置を備えることを特徴とする電話機。
- 請求項6又は7に記載の異常状態検出装置と、
通話先と該通話先の電話番号とを対応付けた情報である電話帳データを記憶する電話帳データ記憶部と、
を備え、
前記異常状態検出装置が備える前記更新部は、前記取得部が、前記電話帳データ記憶部に記憶されている電話帳データに含まれている通話先との通話における前記話者の発話を表している発話データを取得した場合にのみ、前記更新を行う、
ことを特徴とする電話機。 - 話者の発話を表している発話データの入力を取得し、
前記取得された発話データから、前記発話の特徴を表している特徴パラメータの統計量を算出し、
平常状態下の発話を表している基準発話データと、前記取得された発話データとの各々についての前記特徴パラメータの統計量に基づき、前記特徴パラメータのうちの少なくとも1つの統計量が該基準発話データについての該統計量と一致する擬似発話データを作成し、
前記擬似発話データと前記取得された発話データについての前記特徴パラメータの統計量とに基づき、該擬似発話データを該発話データに繋げて得られる合成発話データについての前記特徴パラメータの統計量を算出し、
前記合成発話データと前記基準発話データとの各々についての前記特徴パラメータの統計量の違いに基づいて、前記取得された発話データによって表される発話時における、発話の異常状態を検出する、
ことを特徴とする異常状態検出方法。 - 話者の発話を表している発話データの入力を取得し、
前記取得された発話データから、前記発話の特徴を表している特徴パラメータの統計量を算出し、
平常状態下の発話を表している基準発話データと、前記取得された発話データとの各々についての前記特徴パラメータの統計量に基づき、前記特徴パラメータのうちの少なくとも1つの統計量が該基準発話データについての該統計量と一致する擬似発話データを作成し、
前記擬似発話データと前記取得された発話データについての前記特徴パラメータの統計量とに基づき、該擬似発話データを該発話データに繋げて得られる合成発話データについての前記特徴パラメータの統計量を算出し、
前記合成発話データと前記基準発話データとの各々についての前記特徴パラメータの統計量の違いに基づいて、前記取得された発話データによって表される発話時における、発話の異常状態を検出する、
処理を演算処理装置に実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011146047A JP5664480B2 (ja) | 2011-06-30 | 2011-06-30 | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム |
US13/446,019 US9020820B2 (en) | 2011-06-30 | 2012-04-13 | State detecting apparatus, communication apparatus, and storage medium storing state detecting program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011146047A JP5664480B2 (ja) | 2011-06-30 | 2011-06-30 | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013011830A JP2013011830A (ja) | 2013-01-17 |
JP5664480B2 true JP5664480B2 (ja) | 2015-02-04 |
Family
ID=47391472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011146047A Expired - Fee Related JP5664480B2 (ja) | 2011-06-30 | 2011-06-30 | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9020820B2 (ja) |
JP (1) | JP5664480B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9583108B2 (en) * | 2011-12-08 | 2017-02-28 | Forrest S. Baker III Trust | Voice detection for automated communication system |
JP6268717B2 (ja) | 2013-03-04 | 2018-01-31 | 富士通株式会社 | 状態推定装置、状態推定方法及び状態推定用コンピュータプログラム |
WO2015111772A1 (ko) * | 2014-01-24 | 2015-07-30 | 숭실대학교산학협력단 | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 |
KR101621774B1 (ko) * | 2014-01-24 | 2016-05-19 | 숭실대학교산학협력단 | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 |
KR101621766B1 (ko) * | 2014-01-28 | 2016-06-01 | 숭실대학교산학협력단 | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 |
KR101569343B1 (ko) | 2014-03-28 | 2015-11-30 | 숭실대학교산학협력단 | 차신호 고주파 신호의 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
KR101621780B1 (ko) | 2014-03-28 | 2016-05-17 | 숭실대학교산학협력단 | 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
KR101621797B1 (ko) | 2014-03-28 | 2016-05-17 | 숭실대학교산학협력단 | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
JP6519413B2 (ja) | 2015-08-31 | 2019-05-29 | 富士通株式会社 | 迷惑電話検出装置、迷惑電話検出方法、及びプログラム |
WO2017168663A1 (ja) * | 2016-03-30 | 2017-10-05 | 富士通株式会社 | 発話印象判定プログラム、発話印象判定方法及び発話印象判定装置 |
DE102016013592B3 (de) * | 2016-10-08 | 2017-11-02 | Patricia Bogs | Verfahren und Vorrichtung zur Erkennung einer Fehlbeanspruchung des Stimmbildungsapparates eines Probanden |
CN106710606B (zh) * | 2016-12-29 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音处理方法及装置 |
SG11202009556XA (en) * | 2018-03-28 | 2020-10-29 | Telepathy Labs Inc | Text-to-speech synthesis system and method |
JP7334467B2 (ja) * | 2019-05-17 | 2023-08-29 | 富士電機株式会社 | 対応支援装置および対応支援方法 |
US11545024B1 (en) | 2020-09-24 | 2023-01-03 | Amazon Technologies, Inc. | Detection and alerting based on room occupancy |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3119510B2 (ja) | 1991-10-28 | 2000-12-25 | 株式会社リコー | 音声認識装置 |
JPH0830290A (ja) | 1994-07-18 | 1996-02-02 | Hitachi Ltd | 音声入力可能な情報処理装置およびそれにおける誤処理検出方法 |
US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US6463415B2 (en) * | 1999-08-31 | 2002-10-08 | Accenture Llp | 69voice authentication system and method for regulating border crossing |
US7222075B2 (en) * | 1999-08-31 | 2007-05-22 | Accenture Llp | Detecting emotions using voice signal analysis |
US6964023B2 (en) * | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
JP2004317822A (ja) | 2003-04-17 | 2004-11-11 | Agi:Kk | 感情分析・表示装置 |
JP2005055606A (ja) * | 2003-08-01 | 2005-03-03 | Toyota Motor Corp | サーバ、情報処理端末、音声認識システム |
KR101248353B1 (ko) * | 2005-06-09 | 2013-04-02 | 가부시키가이샤 에이.지.아이 | 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램 |
DE602006012370D1 (de) * | 2005-12-13 | 2010-04-01 | Nxp Bv | Einrichtung und verfahren zum verarbeiten eines audio-datenstroms |
CN101346758B (zh) * | 2006-06-23 | 2011-07-27 | 松下电器产业株式会社 | 感情识别装置 |
JP2008170820A (ja) | 2007-01-12 | 2008-07-24 | Takeshi Moriyama | コンテンツ提供システム及び方法 |
JP4914295B2 (ja) | 2007-06-21 | 2012-04-11 | パナソニック株式会社 | 力み音声検出装置 |
JP2010169925A (ja) * | 2009-01-23 | 2010-08-05 | Konami Digital Entertainment Co Ltd | 音声処理装置、チャットシステム、音声処理方法、ならびに、プログラム |
JP5834449B2 (ja) * | 2010-04-22 | 2015-12-24 | 富士通株式会社 | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 |
-
2011
- 2011-06-30 JP JP2011146047A patent/JP5664480B2/ja not_active Expired - Fee Related
-
2012
- 2012-04-13 US US13/446,019 patent/US9020820B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013011830A (ja) | 2013-01-17 |
US9020820B2 (en) | 2015-04-28 |
US20130006630A1 (en) | 2013-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5664480B2 (ja) | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム | |
JP6268717B2 (ja) | 状態推定装置、状態推定方法及び状態推定用コンピュータプログラム | |
US9009047B2 (en) | Specific call detecting device and specific call detecting method | |
JP5834449B2 (ja) | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 | |
US11475907B2 (en) | Method and device of denoising voice signal | |
US20210256971A1 (en) | Detection of replay attack | |
CN105118522B (zh) | 噪声检测方法及装置 | |
EP2806415B1 (en) | Voice processing device and voice processing method | |
JP6098149B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6268916B2 (ja) | 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム | |
US10403289B2 (en) | Voice processing device and voice processing method for impression evaluation | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
US20190088272A1 (en) | Apparatus, method for detecting speech production interval, and non-transitory computer-readable storage medium for storing speech production interval detection computer program | |
JP2017216525A (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP6394103B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
EP2541544A1 (en) | Voice sample tagging | |
CN108352169B (zh) | 困惑状态判定装置、困惑状态判定方法、以及程序 | |
EP3438980B1 (en) | Utterance impression determination program, method for determining utterance impression, and utterance impression determination device | |
JP2015087557A (ja) | 発話様式検出装置および発話様式検出方法 | |
JP5234788B2 (ja) | 暗騒音推定装置 | |
JP2012252026A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2015040931A (ja) | 信号処理装置、音声処理装置、信号処理方法および音声処理方法 | |
JP2020129080A (ja) | 音声認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5664480 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |