JP5777568B2 - 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム - Google Patents
音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム Download PDFInfo
- Publication number
- JP5777568B2 JP5777568B2 JP2012116360A JP2012116360A JP5777568B2 JP 5777568 B2 JP5777568 B2 JP 5777568B2 JP 2012116360 A JP2012116360 A JP 2012116360A JP 2012116360 A JP2012116360 A JP 2012116360A JP 5777568 B2 JP5777568 B2 JP 5777568B2
- Authority
- JP
- Japan
- Prior art keywords
- element sound
- model
- call
- specific
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
第一実施形態の音響特徴量計算装置1は、図1に示すように、フレーム分割部11、量子化部12及び特徴量抽出部13を例えば備える。第一実施形態の音響特徴量計算装置1の動作フローを図2に示す。
第二実施形態の音響特徴量計算装置1は、立ち上がり特性を計算する点で第一実施形態の音響特徴量計算装置1と異なる。以下、第一実施形態と異なる部分を中心に説明し、第一実施形態と同様の部分については説明を省略する。
第三実施形態の音響特徴量計算装置1は、調波性及び立ち上がり特性以外の音響特徴量を計算する点で第一実施形態又は第二実施形態の音響特徴量計算装置1と異なる。以下、第一実施形態又は第二実施形態と異なる部分を中心に説明し、第一実施形態又は第二実施形態と同様の部分については説明を省略する。
第四実施形態の音響特徴量計算装置1は、第一実施形態から第三実施形態の特徴量抽出部13で計算された特徴量以外の音響特徴量を計算する点で、第一実施形態から第三実施形態の音響特徴量計算装置1と異なる。以下、第一実施形態から第三実施形態と異なる部分を中心に説明し、第一実施形態から第三実施形態と同様の部分については説明を省略する。
第五実施形態の特定状況モデルデータベース作成装置100は、第一実施形態から第三実施形態の音響特徴量計算装置1を用いて特定状況モデルデータベースを作成するものである。
図12に、第六実施形態の特定状況モデルデータベース作成装置200の機能ブロック図の例を示す。その動作フローの例を図13に示す。特定状況モデルデータベース作成装置200は、上記した特定状況モデルデータベース作成装置100に対して、入力される音響信号列が特定の場を表す音響信号でなくても良い点、つまり不特定の場で録音した音響信号で良い点と、要素音ヒストグラム化部40で作成した要素音ヒストグラムをその分布の形状で分類する分布クラスタリング処理部210と、その出力から状況分類モデルを生成する状況分類モデル化部220と、を備える点で異なる。特定状況モデルデータベース作成装置200も、特定状況モデルデータベース作成装置100と同様に、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
第七実施形態として、特定状況モデルデータベース作成装置100と200を構成する特定要素音モデルデータベース20を作成する特定要素音モデルデータベース作成装置300について説明する。
図15に、第八実施形態である特定要素音モデルデータベース作成装置400の機能ブロック図を示す。特定要素音モデルデータベース作成装置400は、特定要素音モデルデータベース作成装置300に対して、特徴量クラスタリング部410と要素音分類モデル化部420を備える点と、入力される音響信号列に複数の要素音を含む点で異なる。
図16に、第九実施形態の状況推定装置500の機能ブロック図を示す。その動作フローを図17に示す。状況推定装置500は、上記した特定要素音モデルデータベース作成装置300で生成された特定要素音モデルを記憶した特定要素音モデルデータベース20と、上記した特定状況モデルデータベース作成装置100,200で生成された特定状況モデルと状況分類モデルを記憶した特定状況モデルデータベース60と、を用いて音響信号列が表す状況を推定するものである。状況推定装置500は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
第十実施形態の発呼推薦モデル生成装置600は、通信システムの中で用いられ、通話が良く発生する場合の音響信号のモデル化と、通話があまり発生しない場合の音響信号のモデル化を行うものである。図18に、発呼推薦モデル生成装置600の機能ブロック図と、その発呼推薦モデル生成装置600を一方の通信端末に接続した通信システム2000の機能ブロック図を示す。
図20に、第十一実施形態の発呼推薦モデル生成装置610の機能ブロック図を示す。発呼推薦モデル生成装置610が接続された通話端末2010は、通信システム2000を構成する。発呼推薦モデル生成装置610は、例えば、足音、ガラスの割れる音、等の特定要素音と特徴量とを事前に対応付けたモデルを用意しておき、上記した発呼推薦モデル生成装置600の音響特徴量計算装置1で抽出した特徴量から特定要素音を特定し、特定要素音を用いて発呼推薦モデルを生成するものである。
図21に、第十二実施形態の発呼推薦モデル生成装置620の機能ブロック図を示す。発呼推薦モデル生成装置620は、一定時間の特徴量をクラスタリングし、クラスタ毎に生成されたモデルから、音響特徴量計算装置1で抽出した特徴量が属するクラスを判定し、判定した要素音のクラスを用いて発呼推薦モデルを生成するものである。
発呼推薦モデルは、通話の発生度合いTと、他の情報とを対応付けたモデルとすることも可能である。例えば、上記した特徴量そのものに対してではなく、特徴量から推定できる動作/行動情報やその動作/行動情報を分類した動作/行動分類情報と、通話の発生度合いTとを対応付けた発呼推薦モデルとしても良い。
図24に、上記した発呼推薦モデル生成装置610の構成に更に動作/行動分類モデル保存部651と動作/行動クラスタ判定部652を追加した第十四実施形態の発呼推薦モデル生成装置650の機能ブロック図を示す。
図26に、第十五実施形態の発呼適否通知装置700を含む通信システム2000の機能ブロック図を示す。通信システム2000の機能構成は上記したものと同じである。発呼適否通知装置700は、受話側の通信端末2010に接続され、発呼推薦モデル生成装置600で生成した発呼推薦モデルを用いて受話者側が現在通話可能な状況にあるのか否かを通知するものである。
図27に、第十六実施形態の発呼適否通知装置710を含む通信システム2000の機能ブロック図を示す。発呼適否通知装置710は、受話側の通信端末2010に接続され、発呼推薦モデル生成装置610で生成した発呼推薦モデルを用いて受話者側が現在通話可能な状況にあるのか否かを通知するものである。
図28に、第十七実施形態の発呼適否通知装置720を含む通信システム2000の機能ブロック図を示す。発呼適否通知装置720は、受話側の通信端末2010に接続され、発呼推薦モデル生成装置620で生成した発呼推薦モデルを用いて受話者側が現在通話可能な状況にあるのか否かを通知するものである。
発呼適否通知装置は、通話の発生度合いTと、他の情報とを対応付けた発呼推薦モデルを用いても構成することが可能である。例えば、上記した特徴量そのものに対してではなく、特徴量から推定できる動作/行動情報やその動作/行動情報を分類した動作/行動分類情報と、通話の発生度合いTとを対応付けた発呼推薦モデルとしても良い。
行動情報とを対応付けた対応付け情報を入力として、動作/行動情報で一致する発呼推薦
モデルを参照して受話者側において通話が良く発生する状況か若しくは通話があまり発生しない状況かを判定した通話適否通知情報を、通話者側に送信する。
を対応付けた対応付け情報を入力として、動作/行動情報で一致する発呼推薦モデルを参
照して受話者側において通話が良く発生する状況か若しくは通話があまり発生しない状況かを判定した通話適否通知情報を、通話者側に送信する。
図31に、第十九実施形態の発呼適否通知装置750の機能ブロック図を示す。発呼適否通知装置750は、発呼推薦モデル生成装置650で生成した発呼推薦モデルを用いて受話者側が現在通話可能な状況にあるのか否かを通知するものである。
報を入力として動作/行動分類情報で一致する発呼推薦モデルを参照して受話者側におい
て通話が良く発生する状況か若しくは通話があまり発生しない状況かを判定した通話適否通知情報を、通話者側に送信する。
報とを対応付けた対応付け情報を入力として動作/行動分類情報で一致する発呼推薦モデ
ルを参照して受話者側において通話が良く発生する状況か若しくは通話があまり発生しない状況かを判定した通話適否通知情報を、通話者側に送信する。
Claims (13)
- 入力された音響信号を所定の時間長のフレームに分割するフレーム分割部と、
nを各上記フレーム内のサンプル位置とし、x(n)を上記各フレームのn番目のサンプルの大きさを表す指標とし、δ{x(n)・x(n-1)}をx(n)・x(n-1)が0以下の場合には1としx(n)・x(n-1)が0より大の場合には0とし、pdf(n)をnを変数とする所定の確率分布とし、f(n)を
- 請求項1に記載の音響特徴量計算装置において、
各フレームの音響信号をK個の区間に分割し、p- kを上記各フレームのk番目の区間の音響信号の大きさを表す指標の平均値とし、Δp- kを上記各フレームのk番目の区間におけるp- kの変化率とし、mを2以上の所定の整数として、次式で定義される値を計算し、その値が0以上の場合にはその値を上記各フレームの立ち上がり特性とし、その値が0未満の場合には上記各フレームの立ち上がり特性を0とする立ち上がり特性計算部を備える特徴量抽出部、
- 請求項2に記載の音響特徴量計算装置において、
突発性計算部は、上記各フレームの音響信号の時間領域での集中の度合いを示す突発性を計算するとし、
時間拡散性計算部は、上記各フレームの音響信号の時間領域での拡散の度合いを示す時間拡散性を計算するとし、
狭帯域性計算部は、上記各フレームの音響信号の周波数領域での集中の度合いを示す狭帯域性を計算するとし、
帯域拡散性計算部は、上記各フレームの音響信号の周波数領域での拡散の度合いを示す帯域拡散性を計算するとし、
音高特性計算部は、上記各フレームの音響信号の周波数領域でのエネルギーの偏在の度合いを示す音高特性を計算するとし、
振幅偏在性計算部は、上記各フレームの音響信号の振幅値の分布の偏在の度合いを示す振幅偏在性を計算するとし、
上記特徴量抽出部は、上記突発性計算部と、上記時間拡散性計算部と、上記狭帯域性計算部と、上記帯域拡散性計算部と、上記音高特性計算部と、上記振幅偏在性計算部との少なくとも1つを更に備える、
音響特徴量計算装置。 - 請求項1から3の何れかに記載の音響特徴量計算装置と、
複数の特定要素音の特定要素音モデルを記憶する特定要素音モデルデータベースと、
上記音響特徴量計算装置が計算した特徴量と、上記特定要素音モデルデータベースに記憶された特定要素音モデルとを比較して最も類似するモデルの上記特定要素音モデルのラベル、または上記特定要素音モデルのラベルを上記音響信号列に付与したラベル付き音響信号列を出力する要素音モデル比較部と、
上記要素音モデル比較部の出力する特定要素音モデルのラベルまたはラベル付き音響信号列を入力として、上記フレームを所定数まとめたヒストグラムフレーム内の上記特定要素音モデルのラベルごとにその出現頻度である要素音ヒストグラムを作成する要素音ヒストグラム化部と、
上記要素音ヒストグラムを入力として、当該要素音ヒストグラムに対してモデル化手法を用いて上記特定の場に対応する特定状況モデルを生成する特定状況モデル化部と、
を具備する特定状況モデルデータベース作成装置。 - 請求項1から3の何れかに記載の音響特徴量計算装置と、
複数の特定要素音の特定要素音モデルを記憶する特定要素音モデルデータベースと、
上記音響特徴量計算装置が計算した特徴量と、上記特定要素音モデルデータベースに記憶された特定要素音モデルとを比較して最も類似するモデルの上記特定要素音モデルのラベル、または上記特定要素音モデルのラベルを上記音響信号列に付与したラベル付き音響信号列を出力する要素音モデル比較部と、
上記要素音モデル比較部の出力する特定要素音モデルのラベルまたはラベル付き音響信号列を入力として、上記フレームを所定数まとめたヒストグラムフレーム内の上記特定要素音モデルのラベルごとにその出現頻度である要素音ヒストグラムを作成する要素音ヒストグラム化部と、
複数の上記要素音ヒストグラムをその分布の形状で分類した要素音分類を作成する分布クラスタリング処理部と、
上記要素音分類を入力として、当該要素音分類に対してモデル化手法を用いて状況分類モデルを生成する状況分類モデル化部と、
を具備する特定状況モデルデータベース作成装置。 - 請求項4又は5に記載した特定状況モデルデータベース作成装置の上記特定要素音モデルデータベースを作成する特定要素音モデルデータベース作成装置であって、
請求項1から3の何れかに記載の音響特徴量計算装置と、
上記音響特徴量計算装置が計算した特徴量を入力として、当該特徴量に対してモデル化手法を用いて特定要素音モデルを生成する特定要素音モデル化部と、
を具備する特定要素音モデルデータベース作成装置。 - 請求項4又は5に記載した特定状況モデルデータベース作成装置の上記特定要素音モデルデータベースを作成する特定要素音モデルデータベース作成装置であって、
請求項1から3の何れかに記載の音響特徴量計算装置と、
上記音響特徴量計算装置が計算した特徴量を分類して特徴量分類を作成する特徴量クラスタリング部と、
上記特徴量分類を入力として、当該特徴量分類に対してモデル化手法を用いて要素音分類モデルを生成する要素音分類モデル化部と、
を具備する特定要素音モデルデータベース作成装置。 - 請求項1から3の何れかに記載の音響特徴量計算装置と、
請求項6又は7に記載した特定要素音モデルデータベース作成装置で生成された特定要素音モデルを記憶した特定要素音モデルデータベースと、
上記特定要素音モデルと上記音響特徴量計算装置が計算した特徴量をそれぞれ比較し、最も近いものをそれぞれの短時間音響信号の要素音と判定して上記フレーム毎に要素音ラベルを付与する要素音モデル比較部と、
上記ラベル付き音響信号列を入力として、上記特定要素音モデルのラベルとその頻度の要素音ヒストグラムを作成する要素音ヒストグラム化部と、
請求項4又は5に記載した特定状況モデルデータベース作成装置で生成された複数の特定状況モデルと状況分類モデルとを、記憶した特定状況モデルデータベースと、
上記要素音ヒストグラムと、上記特定状況モデルまたは上記状況分類モデルとを比較し、最も類似するものを当該特定状況モデル又は状況分類モデルが表す状況と推定して状況推定結果を出力する状況判定モデル比較部と、
を具備する状況推定装置。 - 請求項1から3の何れかに記載の音響特徴量計算装置と、
通話の発生し易さの度合いとを対応付けた発呼推薦モデルを保存した発呼推薦モデル保存部と、
上記音響特徴量計算装置が計算した特徴量を入力とし、当該特徴量が一致する上記発呼推薦モデルを参照して受話者側において通話が良く発生する状況か若しくは通話があまり発生しない状況かを判定し通話適否通知情報を、通話者側に送信する発呼推薦状況判定部と、
を具備する発呼適否通知装置。 - フレーム分割部が、入力された音響信号を所定の時間長のフレームに分割するフレーム分割ステップと、
調波性計算部が、nを各上記フレーム内のサンプル位置とし、x(n)を上記各フレームのn番目のサンプルの大きさを表す指標とし、δ{x(n)・x(n-1)}をx(n)・x(n-1)が0以下の場合には1としx(n)・x(n-1)が0より大の場合には0とし、pdf(n)をnを変数とする所定の確率分布とし、f(n)を
を計算し、その値を上記各フレームの調波性とする調波性計算ステップと、
- 請求項1から3の何れかに記載した音響特徴量計算装置としてコンピュータを機能させるためのプログラム。
- 請求項8の状況推定装置としてコンピュータを機能させるためのプログラム。
- 請求項9の発呼適否通知装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116360A JP5777568B2 (ja) | 2012-05-22 | 2012-05-22 | 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012116360A JP5777568B2 (ja) | 2012-05-22 | 2012-05-22 | 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013242463A JP2013242463A (ja) | 2013-12-05 |
JP5777568B2 true JP5777568B2 (ja) | 2015-09-09 |
Family
ID=49843407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012116360A Expired - Fee Related JP5777568B2 (ja) | 2012-05-22 | 2012-05-22 | 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5777568B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6726082B2 (ja) * | 2016-10-24 | 2020-07-22 | 株式会社アニモ | 防犯に関わる音の判定方法及び情報処理装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS588046B2 (ja) * | 1976-04-08 | 1983-02-14 | 株式会社高千穂通信機器製作所 | ト−キ−音源装置 |
JPH0689095A (ja) * | 1992-09-08 | 1994-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号選択装置 |
JPH113091A (ja) * | 1997-06-13 | 1999-01-06 | Matsushita Electric Ind Co Ltd | 音声信号の立ち上がり検出装置 |
JP2004240214A (ja) * | 2003-02-06 | 2004-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号判別方法、音響信号判別装置、音響信号判別プログラム |
JP4170978B2 (ja) * | 2004-11-30 | 2008-10-22 | 株式会社エヌ・ティ・ティ・ドコモ | 移動機、サーバ装置、及び、発信制御方法 |
JP4507992B2 (ja) * | 2005-06-09 | 2010-07-21 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP5577787B2 (ja) * | 2009-05-14 | 2014-08-27 | ヤマハ株式会社 | 信号処理装置 |
-
2012
- 2012-05-22 JP JP2012116360A patent/JP5777568B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013242463A (ja) | 2013-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108900725B (zh) | 一种声纹识别方法、装置、终端设备及存储介质 | |
US11670325B2 (en) | Voice activity detection using a soft decision mechanism | |
US10819811B2 (en) | Accumulation of real-time crowd sourced data for inferring metadata about entities | |
US9875739B2 (en) | Speaker separation in diarization | |
CN110557589B (zh) | 用于整合记录的内容的系统和方法 | |
CN107767869B (zh) | 用于提供语音服务的方法和装置 | |
US10290322B2 (en) | Audio and video synchronizing perceptual model | |
US9711167B2 (en) | System and method for real-time speaker segmentation of audio interactions | |
WO2015034633A1 (en) | Method for non-intrusive acoustic parameter estimation | |
JP5800718B2 (ja) | 特定状況モデルデータベース作成装置とその方法と状況推定装置とプログラム | |
KR102171658B1 (ko) | 크라우드전사장치 및 그 동작 방법 | |
JP5777568B2 (ja) | 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム | |
JP5589426B2 (ja) | コンテンツ提供システム、コンテンツ提供方法、およびコンテンツ提供プログラム | |
KR20180024256A (ko) | 화자 분류 장치 및 화자 식별 장치 | |
JP5777569B2 (ja) | 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム | |
JP5777567B2 (ja) | 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム | |
Islam et al. | Non-intrusive objective evaluation of speech quality in noisy condition | |
JP5968414B2 (ja) | 発呼適否通知装置とその方法と、プログラム | |
CN114065742B (zh) | 一种文本检测方法和装置 | |
JP6374771B2 (ja) | ユーザの記憶が曖昧なレコードを検索する検索装置、プログラム及び方法 | |
US20230230613A1 (en) | Computerized distress call detection and authentication | |
KR20210068316A (ko) | 요청시 오디오 레코딩으로의 보충적 오디오 콘텐츠의 동적 삽입 | |
CN117558279A (zh) | 说话人分割模型的训练方法、说话人分割方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150630 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5777568 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |