JP2016004054A - 状況モデル学習装置、状況推定装置、それらの方法及びプログラム - Google Patents
状況モデル学習装置、状況推定装置、それらの方法及びプログラム Download PDFInfo
- Publication number
- JP2016004054A JP2016004054A JP2014122063A JP2014122063A JP2016004054A JP 2016004054 A JP2016004054 A JP 2016004054A JP 2014122063 A JP2014122063 A JP 2014122063A JP 2014122063 A JP2014122063 A JP 2014122063A JP 2016004054 A JP2016004054 A JP 2016004054A
- Authority
- JP
- Japan
- Prior art keywords
- situation
- acoustic event
- acoustic
- probability distribution
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】状況モデル学習装置は、逐次入力される音響イベント列を用いて、第一確率分布と、第二確率分布と、第三確率分布とを同時に算出し、算出した第二確率分布を状況から音響イベントを生成する状況-音響イベント生成モデルとして取得し、音響イベント列から状況を生成する音響信号-状況生成モデルを取得する状況モデル化部を含む。
【選択図】図1
Description
<第一実施形態のポイント>
本実施形態では、逐次的に得られた、音響イベント列から、音響信号と状況、状況と音響イベントの関係を同時に考慮して、音響信号-状況生成モデル及び状況-音響イベント生成モデルを作成し、同時に、状況の数やその中身の分析及び推定を行う技術について説明する。なお、音響信号-状況生成モデルとは音響信号(または、音響信号から得られる音響特徴量列や音響イベント列全体)から状況が生成される確率分布であり、この分布(モデル)により音響信号と状況が関係づけられる。つまりこの分布(モデル)を用いることで音響信号(または、音響信号から得られる音響特徴量列や音響イベント列全体)から状況が推定可能になる。また、同様に、状況-音響イベント生成モデルとは状況から音響イベントが生成される確率分布であり、この分布(モデル)により状況と音響イベントが関係づけられる。つまり、この分布(モデル)を用いることで音響イベントから状況が推定可能となる。
図1は本実施形態に係る状況モデル学習装置200の機能ブロック図を、図2はその処理フローの例を示す。
音響イベント列合成部203は、複数の音響イベント列(例えば、音響イベント列201h−a、201h−b)を含む音響インベント列の集合201hが入力された場合、これらをつなぎあわせて一つの音響イベント列とし、その結果を状況モデル化部204に送出する(S203)。なお、音響イベント列合成部203を設けず、単一の音響イベント列を状況モデル化部204に直接入力する構成としても良い。
状況モデル化部204では、入力された音響イベント列から、例えば、以下の手順に従って、逐次的に、音響信号-状況生成モデル205、状況-音響イベント生成モデル206、(状況ラベル列207)を算出し、保存DB208に保存する(S204)。なお、音響信号-状況生成モデル205と状況-音響イベント生成モデル206、状況ラベル列207を保存する保存DB208を別の構成としても良い。
状況モデル化部204では、逐次的に、(1)音響イベント列の集合εに含まれる音響イベント列sが状況kを生成する確率の「種」となる確率と、(2)その確率によって変化する、音響イベント列sが状況tを生成する確率と、(3)状況kが音響イベントeを生成する確率を同時に算出し、そこから、音響信号-状況生成モデル205と状況-音響イベント生成モデル206とを生成し、出力する。なお、kは「種」となる状況のインデックスを表し、tは各音響イベント列が有する状況のインデックスを表す。各音響イベント列が有する状況は、「種」となる全ての状況の中から生じやすい状況を抽出したものであり、各音響イベント列が有する状況の総数は、「種」となる状況の総数よりも小さい。本実施形態では、図3に示すように、各音響イベント列が状況を生成する確率には、その「種」となる確率が存在し(図3の最上段の確率分布を参照)、各音響イベント列が状況を生成する確率(図3の中段の確率分布を参照)はこの「種」に規定されていると考える。さらに、各状況が音響イベントの生成確率(図3の最下段の確率分布を参照)を規定すると考える。状況モデル化部204は、これらの関係を生成モデルとして記述し、生成モデルのパラメータを推定することで状況の分析を可能とする。
音響信号-状況生成モデル205及び状況-音響イベント生成モデル206を算出するためには、上記の生成過程を基に変分ベイズ法(VB法、Variational Bayes methods)などの手法を用いることが可能である。
図4は、状況モデル化部204の処理フローの例を示す。
(i-1).s=1,2,…,S、t=1,2,…,Tに対して
a(0) st=1, b(0) st=α0
(i-2).k=1,2,…,Kに対して
u(0) k=1,w(0) k=γ
(i-3).k=1,2,…,K、m=1,2,…,Mに対して
λ(0) km=1/M
ただし、Mは想定される音響イベントの数を表し、mは想定される音響イベントのインデックスであり、予め状況モデル学習装置200の利用者等により与えられるものとする。
(i-4).s=1,2,…,S、t=1,2,…,T、k=1,2,…,Kに対して
ξ(0) stk=1/(T×K)
(i-5).s=1,2,…,S、i=1,2,…,Ns、k=1,2,…,Kに対して
ζ(0) sik=1/K
(i-6).τ0,κ,h=0に対して
ρ(0)=(τ0+h)-κ
として、h←1とする(S204c)。
このような構成により、音響信号や音響イベント列が有する状況の数を事前に設定することなく、さらに、逐次的に音響信号が得られる場合にもモデルの学習、状況の分析および推定を行うことができる。従来技術では、逐次的に得られる音響信号を用いて、音響信号全体をモデル化することは困難であったが、本実施形態の構成であれば、逐次的に得られる音響信号を用いて、音響信号と状況、音響イベント列の関係を考慮して、音響信号全体をモデル化することができる。
第一実施形態と異なる部分を中心に説明する。
特徴量算出部302では、入力された音響信号列の集合301hに対して、短時間(数10msec〜数sec)毎に例えば音圧レベルや音響パワー、MFCC特徴量、LPC特徴量などの特徴量を算出し、音響特徴量列の集合401hを音響イベント判定部303に送出する(図2のS302)。また、特徴量算出部302では、これらの特徴量と、非特許文献1に示す、立ち上がり特性、調波性、時間周期性などの特徴量を組み合わせて用いても良い。
音響イベントモデルDB304には、予め音響イベントのラベルとその音響イベントに対する音響特徴量とを求めておき、記憶しておく。
第一実施形態と異なる部分を中心に説明する。
音響イベントモデルDB304には、予め音響イベントのラベルとその音響イベントに対する音響特徴量とを求めておき、記憶しておく。
図5のS204iの打ち切り処理、正規化処理は必ずしも行わなくともよい。仮に行わずとも、打ち切り対象となる状況k,tに対応する確率は非常に小さなもの(ほぼ0)となるため、学習されたモデルの精度や推定精度には大きな影響を与えない。
本実施形態では、モデルを更新することなく、音響イベント列から状況を推定する。
まず、情報量を比較する方法について説明する。
次に、事後確率を比較する方法について説明する。
このような構成とすることで、第一実施形態で学習した状況-音響イベント生成モデル206を更新することなく、音響イベント列から状況を推定することができる。
第二実施形態と異なる部分を中心に説明する。
第二実施形態と異なる部分を中心に説明する。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (5)
- ある音響イベント列から状況が生成される確率の分布である第三確率分布は、第一確率分布によって規定されるものとし、第一確率分布は、音響イベント列と、発生しうる全ての状況が生成される確率との関係を、離散的な分布で表現したものであり、第一確率分布と第三確率分布とは階層的なディリクレ過程に従うものとし、各状況が音響イベントの生成確率分布である第二確率分布を規定するものとし、
逐次入力される音響イベント列を用いて、第一確率分布と、第二確率分布と、第三確率分布とを同時に算出し、算出した前記第二確率分布を、状況から音響イベントを生成する状況-音響イベント生成モデルとして取得し、音響イベント列から状況を生成する音響信号-状況生成モデルを取得する状況モデル化部を含む、
状況モデル学習装置。 - 請求項1の状況モデル学習装置により生成した状況-音響イベント生成モデルを用いて音響イベント列から状況を推定する状況推定装置であって、
新たに入力された音響イベント列に対して、前記状況-音響イベント生成モデルに基づく状況毎の事後確率、または、前記状況-音響イベント生成モデルと想定される全ての音響イベントに対する各音響イベントの確率分布との差異を表す状況毎の情報量を求め、状況毎の事後確率または情報量を比較し、前記新たに入力された音響イベント列が生成された状況を推定する生成モデル比較部を含む、
状況推定装置。 - 状況モデル学習装置が実行する状況モデル学習方法であって、
ある音響イベント列から状況が生成される確率の分布である第三確率分布は、第一確率分布によって規定されるものとし、第一確率分布は、音響イベント列と、発生しうる全ての状況が生成される確率との関係を、離散的な分布で表現したものであり、第一確率分布と第三確率分布とは階層的なディリクレ過程に従うものとし、各状況が音響イベントの生成確率分布である第二確率分布を規定するものとし、
状況モデル化部が、逐次入力される音響イベント列を用いて、第一確率分布と、第二確率分布と、第三確率分布とを同時に算出し、算出した前記第二確率分布を、状況から音響イベントを生成する状況-音響イベント生成モデルとして取得し、音響イベント列から状況を生成する音響信号-状況生成モデルを取得する状況モデル化ステップを含む、
状況モデル学習方法。 - 請求項1の状況モデル学習方法により生成した状況-音響イベント生成モデルを用いて、状況推定装置が音響イベント列から状況を推定する状況推定方法であって、
生成モデル比較部が、新たに入力された音響イベント列に対して、前記状況-音響イベント生成モデルに基づく状況毎の事後確率、または、前記状況-音響イベント生成モデルと想定される全ての音響イベントに対する各音響イベントの確率分布との差異を表す状況毎の情報量を求め、状況毎の事後確率または情報量を比較し、前記新たに入力された音響イベント列が生成された状況を推定する生成モデル比較ステップを含む、
状況推定方法。 - 請求項1の状況モデル学習装置、または、請求項2の状況推定装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014122063A JP6316669B2 (ja) | 2014-06-13 | 2014-06-13 | 状況モデル学習装置、その方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014122063A JP6316669B2 (ja) | 2014-06-13 | 2014-06-13 | 状況モデル学習装置、その方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016004054A true JP2016004054A (ja) | 2016-01-12 |
JP6316669B2 JP6316669B2 (ja) | 2018-04-25 |
Family
ID=55223392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014122063A Active JP6316669B2 (ja) | 2014-06-13 | 2014-06-13 | 状況モデル学習装置、その方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6316669B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010129078A (ja) * | 2008-11-26 | 2010-06-10 | Ind Technol Res Inst | 音声イベントを基礎とする緊急通報方法とシステム及び行動軌跡構築方法 |
JP2014048522A (ja) * | 2012-08-31 | 2014-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 状況生成モデル作成装置及び状況推定装置 |
-
2014
- 2014-06-13 JP JP2014122063A patent/JP6316669B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010129078A (ja) * | 2008-11-26 | 2010-06-10 | Ind Technol Res Inst | 音声イベントを基礎とする緊急通報方法とシステム及び行動軌跡構築方法 |
JP2014048522A (ja) * | 2012-08-31 | 2014-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 状況生成モデル作成装置及び状況推定装置 |
Non-Patent Citations (1)
Title |
---|
井本 桂右、外3名: "音響イベント列を利用した音響シーン分析のためのオンライン学習手法", 日本音響学会 2014年 春季研究発表会講演論文集, JPN6018010208, 3 March 2014 (2014-03-03), JP, pages 29 - 32, ISSN: 0003764264 * |
Also Published As
Publication number | Publication date |
---|---|
JP6316669B2 (ja) | 2018-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229667A (zh) | 基于人工神经网络类别的修剪 | |
JP7055630B2 (ja) | 音声認識のための学習方法、学習装置、コンピュータプログラム及び記憶媒体 | |
JP2016091166A (ja) | 機械学習装置、機械学習方法、分類装置、分類方法、プログラム | |
JP5795743B2 (ja) | 適応的重み付けを用いた様々な文書間類似度計算方法に基づいた文書比較方法および文書比較システム | |
JP5638503B2 (ja) | テキスト要約装置、方法及びプログラム | |
JP2015109084A (ja) | 新規物質探索システム及びその探索方法 | |
JP2016194914A (ja) | 混合モデル選択の方法及び装置 | |
JPWO2018088277A1 (ja) | 予測モデル生成システム、方法およびプログラム | |
JP5432935B2 (ja) | 予測器選択装置、予測器選択方法、予測器選択プログラム | |
JP5818759B2 (ja) | 状況生成モデル作成装置、状況推定装置、およびプログラム | |
JP7344149B2 (ja) | 最適化装置及び最適化方法 | |
JP6316669B2 (ja) | 状況モデル学習装置、その方法及びプログラム | |
JP2014115685A (ja) | プロファイル解析装置及び方法及びプログラム | |
JP2017134197A (ja) | パラメータ調整システム、パラメータ調整方法、プログラム | |
JP6114209B2 (ja) | モデル処理装置、モデル処理方法、およびプログラム | |
JP2014048523A (ja) | 行動生成モデル作成装置及び行動推定装置 | |
JP6320966B2 (ja) | 言語モデル生成装置、方法及びプログラム | |
JP2022185799A (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
JP5783979B2 (ja) | 生成モデル作成装置及び推定装置 | |
JP6078441B2 (ja) | モデル処理装置、分析装置、それらの方法およびプログラム | |
Vakilzadeh | Stochastic model updating and model selection with application to structural dynamics | |
JP6093670B2 (ja) | モデル処理装置、モデル処理方法、およびプログラム | |
KR102266853B1 (ko) | 다중 유형 페어와이즈 기반 아이템 추천 방법 및 장치 | |
JP2011221873A (ja) | データ分類方法及び装置及びプログラム | |
WO2024057414A1 (ja) | 情報処理装置、情報処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6316669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |