JP6316669B2 - 状況モデル学習装置、その方法及びプログラム - Google Patents
状況モデル学習装置、その方法及びプログラム Download PDFInfo
- Publication number
- JP6316669B2 JP6316669B2 JP2014122063A JP2014122063A JP6316669B2 JP 6316669 B2 JP6316669 B2 JP 6316669B2 JP 2014122063 A JP2014122063 A JP 2014122063A JP 2014122063 A JP2014122063 A JP 2014122063A JP 6316669 B2 JP6316669 B2 JP 6316669B2
- Authority
- JP
- Japan
- Prior art keywords
- situation
- acoustic
- acoustic event
- probability distribution
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
<第一実施形態のポイント>
本実施形態では、逐次的に得られた、音響イベント列から、音響信号と状況、状況と音響イベントの関係を同時に考慮して、音響信号-状況生成モデル及び状況-音響イベント生成モデルを作成し、同時に、状況の数やその中身の分析及び推定を行う技術について説明する。なお、音響信号-状況生成モデルとは音響信号(または、音響信号から得られる音響特徴量列や音響イベント列全体)から状況が生成される確率分布であり、この分布(モデル)により音響信号と状況が関係づけられる。つまりこの分布(モデル)を用いることで音響信号(または、音響信号から得られる音響特徴量列や音響イベント列全体)から状況が推定可能になる。また、同様に、状況-音響イベント生成モデルとは状況から音響イベントが生成される確率分布であり、この分布(モデル)により状況と音響イベントが関係づけられる。つまり、この分布(モデル)を用いることで音響イベントから状況が推定可能となる。
図1は本実施形態に係る状況モデル学習装置200の機能ブロック図を、図2はその処理フローの例を示す。
音響イベント列合成部203は、複数の音響イベント列(例えば、音響イベント列201h−a、201h−b)を含む音響インベント列の集合201hが入力された場合、これらをつなぎあわせて一つの音響イベント列とし、その結果を状況モデル化部204に送出する(S203)。なお、音響イベント列合成部203を設けず、単一の音響イベント列を状況モデル化部204に直接入力する構成としても良い。
状況モデル化部204では、入力された音響イベント列から、例えば、以下の手順に従って、逐次的に、音響信号-状況生成モデル205、状況-音響イベント生成モデル206、(状況ラベル列207)を算出し、保存DB208に保存する(S204)。なお、音響信号-状況生成モデル205と状況-音響イベント生成モデル206、状況ラベル列207を保存する保存DB208を別の構成としても良い。
状況モデル化部204では、逐次的に、(1)音響イベント列の集合εに含まれる音響イベント列sが状況kを生成する確率の「種」となる確率と、(2)その確率によって変化する、音響イベント列sが状況tを生成する確率と、(3)状況kが音響イベントeを生成する確率を同時に算出し、そこから、音響信号-状況生成モデル205と状況-音響イベント生成モデル206とを生成し、出力する。なお、kは「種」となる状況のインデックスを表し、tは各音響イベント列が有する状況のインデックスを表す。各音響イベント列が有する状況は、「種」となる全ての状況の中から生じやすい状況を抽出したものであり、各音響イベント列が有する状況の総数は、「種」となる状況の総数よりも小さい。本実施形態では、図3に示すように、各音響イベント列が状況を生成する確率には、その「種」となる確率が存在し(図3の最上段の確率分布を参照)、各音響イベント列が状況を生成する確率(図3の中段の確率分布を参照)はこの「種」に規定されていると考える。さらに、各状況が音響イベントの生成確率(図3の最下段の確率分布を参照)を規定すると考える。状況モデル化部204は、これらの関係を生成モデルとして記述し、生成モデルのパラメータを推定することで状況の分析を可能とする。
音響信号-状況生成モデル205及び状況-音響イベント生成モデル206を算出するためには、上記の生成過程を基に変分ベイズ法(VB法、Variational Bayes methods)などの手法を用いることが可能である。
図4は、状況モデル化部204の処理フローの例を示す。
(i-1).s=1,2,…,S、t=1,2,…,Tに対して
a(0) st=1, b(0) st=α0
(i-2).k=1,2,…,Kに対して
u(0) k=1,w(0) k=γ
(i-3).k=1,2,…,K、m=1,2,…,Mに対して
λ(0) km=1/M
ただし、Mは想定される音響イベントの数を表し、mは想定される音響イベントのインデックスであり、予め状況モデル学習装置200の利用者等により与えられるものとする。
(i-4).s=1,2,…,S、t=1,2,…,T、k=1,2,…,Kに対して
ξ(0) stk=1/(T×K)
(i-5).s=1,2,…,S、i=1,2,…,Ns、k=1,2,…,Kに対して
ζ(0) sik=1/K
(i-6).τ0,κ,h=0に対して
ρ(0)=(τ0+h)-κ
として、h←1とする(S204c)。
このような構成により、音響信号や音響イベント列が有する状況の数を事前に設定することなく、さらに、逐次的に音響信号が得られる場合にもモデルの学習、状況の分析および推定を行うことができる。従来技術では、逐次的に得られる音響信号を用いて、音響信号全体をモデル化することは困難であったが、本実施形態の構成であれば、逐次的に得られる音響信号を用いて、音響信号と状況、音響イベント列の関係を考慮して、音響信号全体をモデル化することができる。
第一実施形態と異なる部分を中心に説明する。
特徴量算出部302では、入力された音響信号列の集合301hに対して、短時間(数10msec〜数sec)毎に例えば音圧レベルや音響パワー、MFCC特徴量、LPC特徴量などの特徴量を算出し、音響特徴量列の集合401hを音響イベント判定部303に送出する(図2のS302)。また、特徴量算出部302では、これらの特徴量と、非特許文献1に示す、立ち上がり特性、調波性、時間周期性などの特徴量を組み合わせて用いても良い。
音響イベントモデルDB304には、予め音響イベントのラベルとその音響イベントに対する音響特徴量とを求めておき、記憶しておく。
第一実施形態と異なる部分を中心に説明する。
音響イベントモデルDB304には、予め音響イベントのラベルとその音響イベントに対する音響特徴量とを求めておき、記憶しておく。
図5のS204iの打ち切り処理、正規化処理は必ずしも行わなくともよい。仮に行わずとも、打ち切り対象となる状況k,tに対応する確率は非常に小さなもの(ほぼ0)となるため、学習されたモデルの精度や推定精度には大きな影響を与えない。
本実施形態では、モデルを更新することなく、音響イベント列から状況を推定する。
まず、情報量を比較する方法について説明する。
次に、事後確率を比較する方法について説明する。
このような構成とすることで、第一実施形態で学習した状況-音響イベント生成モデル206を更新することなく、音響イベント列から状況を推定することができる。
第二実施形態と異なる部分を中心に説明する。
第二実施形態と異なる部分を中心に説明する。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (3)
- ある音響イベント列から状況が生成される確率の分布である第三確率分布は、第一確率分布によって規定されるものとし、第一確率分布は、音響イベント列と、発生しうる全ての状況が生成される確率との関係を、離散的な分布で表現したものであり、第一確率分布と第三確率分布とは階層的なディリクレ過程に従うものとし、各状況が音響イベントの生成確率分布である第二確率分布を規定するものとし、
逐次入力される音響イベント列を用いて、第一確率分布と、第二確率分布と、第三確率分布とを同時に算出し、算出した前記第二確率分布を、状況から音響イベントを生成する状況-音響イベント生成モデルとして取得し、音響イベント列から状況を生成する音響信
号-状況生成モデルを取得する状況モデル化部を含む、
状況モデル学習装置。 - 状況モデル学習装置が実行する状況モデル学習方法であって、
ある音響イベント列から状況が生成される確率の分布である第三確率分布は、第一確率分布によって規定されるものとし、第一確率分布は、音響イベント列と、発生しうる全ての状況が生成される確率との関係を、離散的な分布で表現したものであり、第一確率分布と第三確率分布とは階層的なディリクレ過程に従うものとし、各状況が音響イベントの生成確率分布である第二確率分布を規定するものとし、
状況モデル化部が、逐次入力される音響イベント列を用いて、第一確率分布と、第二確率分布と、第三確率分布とを同時に算出し、算出した前記第二確率分布を、状況から音響イベントを生成する状況-音響イベント生成モデルとして取得し、音響イベント列から状
況を生成する音響信号-状況生成モデルを取得する状況モデル化ステップを含む、
状況モデル学習方法。 - 請求項1の状況モデル学習装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014122063A JP6316669B2 (ja) | 2014-06-13 | 2014-06-13 | 状況モデル学習装置、その方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014122063A JP6316669B2 (ja) | 2014-06-13 | 2014-06-13 | 状況モデル学習装置、その方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016004054A JP2016004054A (ja) | 2016-01-12 |
JP6316669B2 true JP6316669B2 (ja) | 2018-04-25 |
Family
ID=55223392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014122063A Active JP6316669B2 (ja) | 2014-06-13 | 2014-06-13 | 状況モデル学習装置、その方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6316669B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI384423B (zh) * | 2008-11-26 | 2013-02-01 | Ind Tech Res Inst | 以聲音事件為基礎之緊急通報方法與系統以及行為軌跡建立方法 |
JP5818759B2 (ja) * | 2012-08-31 | 2015-11-18 | 日本電信電話株式会社 | 状況生成モデル作成装置、状況推定装置、およびプログラム |
-
2014
- 2014-06-13 JP JP2014122063A patent/JP6316669B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016004054A (ja) | 2016-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6090286B2 (ja) | 機械学習装置、機械学習方法、分類装置、分類方法、プログラム | |
JP7055630B2 (ja) | 音声認識のための学習方法、学習装置、コンピュータプログラム及び記憶媒体 | |
CN108229667A (zh) | 基于人工神经网络类别的修剪 | |
JP5638503B2 (ja) | テキスト要約装置、方法及びプログラム | |
JP2015109084A (ja) | 新規物質探索システム及びその探索方法 | |
Soleimani et al. | Artificial neural network application in predicting probabilistic seismic demands of bridge components | |
KR20190045038A (ko) | 음성 인식 방법 및 장치 | |
JPWO2018088277A1 (ja) | 予測モデル生成システム、方法およびプログラム | |
JP5432935B2 (ja) | 予測器選択装置、予測器選択方法、予測器選択プログラム | |
JP5818759B2 (ja) | 状況生成モデル作成装置、状況推定装置、およびプログラム | |
US11847389B2 (en) | Device and method for optimizing an input parameter in a processing of a semiconductor | |
JP6316669B2 (ja) | 状況モデル学習装置、その方法及びプログラム | |
JP2014115685A (ja) | プロファイル解析装置及び方法及びプログラム | |
JP5781040B2 (ja) | 行動推定装置およびそのプログラム | |
JP2020086778A (ja) | 機械学習モデル構築装置および機械学習モデル構築方法 | |
JP6839001B2 (ja) | モデル学習装置、情報判定装置およびそれらのプログラム | |
JP6114209B2 (ja) | モデル処理装置、モデル処理方法、およびプログラム | |
JP2008064849A (ja) | 音響モデル作成装置、その装置を用いた音声認識装置、これらの方法、これらのプログラム、およびこれらの記録媒体 | |
JP2022185799A (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
JP6078441B2 (ja) | モデル処理装置、分析装置、それらの方法およびプログラム | |
KR102266853B1 (ko) | 다중 유형 페어와이즈 기반 아이템 추천 방법 및 장치 | |
JP5244452B2 (ja) | 文書特徴表現計算装置、及びプログラム | |
WO2024057414A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6220694B2 (ja) | モデル処理装置、その方法、およびプログラム | |
WO2022157862A1 (ja) | トラフィック変動予測装置、及びトラフィック変動予測方法、並びにトラフィック変動予測プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6316669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |