JP2014016423A - 音楽検出通知装置、方法、及びプログラム - Google Patents

音楽検出通知装置、方法、及びプログラム Download PDF

Info

Publication number
JP2014016423A
JP2014016423A JP2012152824A JP2012152824A JP2014016423A JP 2014016423 A JP2014016423 A JP 2014016423A JP 2012152824 A JP2012152824 A JP 2012152824A JP 2012152824 A JP2012152824 A JP 2012152824A JP 2014016423 A JP2014016423 A JP 2014016423A
Authority
JP
Japan
Prior art keywords
frame
music
notification
evaluation value
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012152824A
Other languages
English (en)
Inventor
Tomonori Izumitani
知範 泉谷
Kunio Kashino
邦夫 柏野
Tomoko Matsui
知子 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012152824A priority Critical patent/JP2014016423A/ja
Publication of JP2014016423A publication Critical patent/JP2014016423A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

【課題】入力された音響信号に音楽が含まれているか否かをリアルタイムで知る。
【解決手段】音響特徴抽出部22が、音響信号バッファ20からデジタル音響信号を取得し、短時間フレーム毎にフレーム音響特徴値を抽出し、フレーム評価値算出部24が、フレーム音響特徴値に基づいて、短時間フレーム毎に音響信号に音楽が含まれるか否かを示すフレーム評価値を算出し、通知判断部28が、現フレームを含む過去の所定フレーム分のフレーム評価値に基づいて、音響信号に音楽が含まれていることを通知するか否かを示す通知有無評価値を算出し、算出した通知有無評価値に基づいて、音響信号に音楽が含まれていることを通知するか否かを、短時間フレーム毎に判断し、通知制御部30が、通知判断部28の判断結果が音響信号に音楽が含まれていることを通知することを示すものであった場合に、その判断結果が外部に通知されるように通知装置14を制御する。
【選択図】図1

Description

本発明は、音楽検出通知装置、方法、及びプログラムに係り、特に、入力された音響信号に音楽が含まれているか否かを判断し、通知する音楽検出通知装置、方法、及びプログラムに関する。
入力された音響信号に音楽が含まれるか否かを検出する方法として、音響信号から短時間フレーム毎に音響特徴ベクトル列を抽出し、その音響ベクトル列に基づいて、短時間フレーム毎に音楽を含むか否かを示す音楽情報評価値を算出する音楽区間検出方法が提案されている(例えば、特許文献1参照)。
また、音に反応して動く玩具など、何らかの音が検出された場合に、音が検出されたことを示す動作を行う装置が知られている。
特開2009−8836号公報
しかしながら、特許文献1に記載の方法は、著作権管理や分類などを目的として、オフラインで音響信号を処理するものであり、リアルタイムに音響信号に音楽が含まれているか否かを知ることができない、という問題がある。
また、音に反応して動く玩具などは、音楽だけではなく、音一般に反応してしまうため、会話や背景音なども含む音響信号に音楽が含まれているか否かを知ることができない、という問題がある。
本発明は上記事情に鑑みてなされたものであり、入力された音響信号に音楽が含まれているか否かをリアルタイムで知ることができる音楽検出通知装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の音楽検出通知装置は、入力された音響信号に対して短時間フレームを設定し、各短時間フレームに含まれる音響特徴を抽出する音響特徴抽出手段と、前記抽出手段により抽出された音響特徴に基づいて、前記短時間フレーム毎に音楽が含まれるか否かを示すフレーム評価値を算出するフレーム評価値算出手段と、前記フレーム評価値算出手段により算出された現フレームを含む過去の所定フレーム分のフレーム評価値から算出される通知の有無を示す通知有無評価値に基づいて、前記音響信号に音楽が含まれていることを通知するか否かを、前記短時間フレーム毎に判断する通知判断手段と、前記通知判断手段により前記音響信号に音楽が含まれていることを通知すると判断された場合に、前記音響信号に音楽が含まれていることが外部に通知されるように通知手段を制御する通知制御手段と、を含んで構成されている。
本発明の音楽検出通知装置によれば、音響特徴抽出手段が、入力された音響信号に対して短時間フレームを設定し、各短時間フレームに含まれる音響特徴を抽出し、フレーム評価値算出手段が、抽出手段により抽出された音響特徴に基づいて、短時間フレーム毎に音楽が含まれるか否かを示すフレーム評価値を算出する。そして、通知判断手段が、フレーム評価値算出手段により算出された現フレームを含む過去の所定フレーム分のフレーム評価値から算出される通知の有無を示す通知有無評価値に基づいて、音響信号に音楽が含まれていることを通知するか否かを、短時間フレーム毎に判断し、通知制御手段が、通知判断手段により音響信号に音楽が含まれていることを通知すると判断された場合に、音響信号に音楽が含まれていることが外部に通知されるように通知手段を制御する。
このように、音響信号に音楽が含まれていると判断された場合に、その旨が外部に通知されるため、入力された音響信号に音楽が含まれているか否かをリアルタイムで知ることができる。
また、本発明の音楽検出通知方法は、音響特徴抽出手段が、入力された音響信号に対して短時間フレームを設定し、各短時間フレームに含まれる音響特徴を抽出し、フレーム評価値算出手段が、前記抽出手段により抽出された音響特徴に基づいて、前記短時間フレーム毎に音楽が含まれるか否かを示すフレーム評価値を算出し、通知判断手段が、前記フレーム評価値算出手段により算出された現フレームを含む過去の所定フレーム分のフレーム評価値から算出される通知の有無を示す通知有無評価値に基づいて、前記音響信号に音楽が含まれていることを通知するか否かを、前記短時間フレーム毎に判断し、通知制御手段が、前記通知判断手段により前記音響信号に音楽が含まれていることを通知すると判断された場合に、前記音響信号に音楽が含まれていることが外部に通知されるように通知手段を制御する方法である。
また、本発明の音楽検出通知プログラムは、コンピュータを、上記の音楽検出通知装置を構成する各手段として機能させるためプログラムである。
以上説明したように、本発明の音楽検出通知装置、方法、及びプログラムによれば、音響信号に音楽が含まれていると判断された場合に、その旨が外部に通知されるため、入力された音響信号に音楽が含まれているか否かをリアルタイムで知ることができる、という効果が得られる。
本実施の形態に係る音楽検出通知装置の機能的構成を示すブロック図である。 本実施の形態に係る音楽検出通知装置における音楽検出通知処理ルーチンの内容を示すフローチャートである。 各部の処理の概要を示す説明図である。 通知判断部の処理の概要を示す説明図である。 本実施の形態に係る音楽検出通知装置を携帯端末に搭載した場合の一例を示すイメージ図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
本実施の形態に係る音楽検出通知装置10は、図1に示すように、音響信号が入力される入力装置12と、音響信号に音楽が含まれていることを通知する通知装置14と、音響信号に音楽が含まれるか否かを判断して通知装置14を制御するコンピュータ16とで構成されている。
入力装置12は、例えば、マイクロホンで構成することができ、周辺の音を集音し、集音した音をアナログ信号に変換し、アナログ信号を所定のサンプリング周波数でサンプリングしたデジタル音響信号に変換して出力する。なお、入力装置12からはアナログ音響信号を出力し、コンピュータ16において、アナログ音響信号を取得してデジタル音響信号に変換するようにしてもよい。
通知装置14は、例えば、ディスプレイ、照明装置、振動装置等で構成することができる。コンピュータ16により、音響信号に音楽が含まれていることを通知すると判断された場合には、例えば、その旨をディスプレイに表示したり、照明装置を点滅させたり、振動装置を振動させたりすることにより、通知する。
コンピュータ16は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する音楽検出通知処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えている。このコンピュータは、機能的には、図1に示すように、音響信号バッファ20と、音響特徴抽出部22と、フレーム評価値算出部24と、フレーム評価値バッファ26と、通知判断部28と、通知制御部30とを含んだ構成で表すことができる。
音響信号バッファ20には、入力装置12から出力されて、コンピュータ16に入力されたデジタル音響信号が格納される。
音響特徴抽出部22は、音響信号バッファ20からデジタル音響信号を取得し、例えば100msecなどの短時間フレーム毎に1つまたは複数の音響特徴(フレーム音響特徴値)を抽出し、フレーム評価値算出部24に受け渡す。
フレーム評価値算出部24は、音響特徴抽出部22から受け取ったフレーム音響特徴値に基づいて、短時間フレーム毎に音響信号に音楽が含まれるか否かを示すフレーム評価値を算出し、フレーム評価値バッファ26に格納する。
通知判断部28は、フレーム評価値バッファ26から、現フレームを含む過去の所定フレーム分のフレーム評価値を取得し、これらのフレーム評価値に基づいて、音響信号に音楽が含まれていることを通知するか否かを示す通知有無評価値を算出する。また、通知判断部28は、算出した通知有無評価値に基づいて、音響信号に音楽が含まれていることを通知するか否かを、短時間フレーム毎に判断し、判断結果を通知制御部30に受け渡す。
通知制御部30は、通知判断部28から受け取った判断結果が、音響信号に音楽が含まれていることを通知することを示すものであった場合に、その判断結果が外部に通知されるように通知装置14を制御する。
次に、本実施の形態の音楽検出通知装置10の作用について説明する。入力装置12からコンピュータ16へ音響信号が入力されると、コンピュータ16において、CPUが図2に示す音楽検出通知処理ルーチンを実行するためのプログラムを読み出して実行する。各部の処理の概要を示す図3及び図4も参照して、音楽検出処理ルーチンについて説明する。
ステップ100で、音響特徴抽出部22は、音響信号バッファ20から1フレーム分のデジタル音響信号を取得する。例えば、図3(A)に示すように、幅Wの短時間フレームを、前回ルーチンにおける処理対象フレームからフレームシフト幅(Lサンプル)分シフトさせて設定し、設定した短時間フレーム内のW点のサンプルを取得する。Lの値は、サンプリング周波数とフレームの幅(秒)の関係により決定する。例えば、サンプリング周波数が44,100Hz、フレームの幅(秒)を約100ミリ秒としたい場合、L=4,410などとすればよい。なお、図3の例では、L<Wの場合を示しているが、例えばW=L、L>Wなどとしてもよい。
次に、ステップ102で、音響特徴抽出部22は、上記ステップ100で取得したデジタル音響信号の1フレーム分のサンプルを用いて、図3(B)に示すように、N個のフレーム音響特徴値(y :iはフレーム番号、jは音響特徴の番号)を抽出する。フレーム音響特徴値としては、音響信号処理で一般的に用いられる特徴値を用いることができ、例えば、短時間フーリエ変換などに基づいて算出されるパワースペクトル、メル周波数ケプストラム係数、ケプストラム係数、対数周波数上に等間隔の中心周波数を持つバンドパスフィルタバンク等を用いることができる。Nの値は、例えば、パワースペクトルを用いる場合には、N=256、512、1024程度、メル周波数ケプストラム係数、ケプストラム係数、対数周波数上に等間隔の中心周波数を持つバンドパスフィルタバンクを用いる場合には、N=20〜80程度とすることができる。
次に、ステップ104で、フレーム評価値算出部24は、上記ステップ102で抽出された第iフレームのフレーム音響特徴値y に基づいて、図3(C)に示すように、第iフレームが音楽を含むか否かを示す評価値であるフレーム評価値zを算出する。フレーム評価値zは、第iフレームが音楽を含む度合いに関する評価値を表しており、値が大きければ大きいほど、音楽を含む可能性が高いことを示している。フレーム評価値zを算出する方法としては、例えば、特許文献1における音楽フレーム評価値算出手段などの方法を用いることができる。具体的には、フレーム音響特徴値(y ,j=1,・・・,N)を用いた多項式識別関数を計算し、その識別関数が閾値以上の場合には、音楽を含むことを示す値としてz=1、識別関数が閾値未満の場合には、音楽を含まないことを示す値としてz=0という2値とすることができる。また、フレーム評価値zを、第iフレームに音楽が含まれる確信度(例えば、上記の識別関数)を表す多値または連続値としてもよい。フレーム評価値算出部24は、算出したフレーム評価値zをフレーム評価値バッファ26に格納する。
次に、ステップ106で、通知判断部28は、フレーム評価値バッファ26に格納されたフレーム評価値を取得して、図3(D)に示すように、第iフレームに音楽が含まれていることを通知するか否かを示す通知有無評価値sを算出する。
ここで、対応するフレーム評価値zのみから通知有無評価値sを算出して、第iフレームの通知の有無を判断すると、音楽一般に存在する微小な無音部に敏感に反応し、一連の音楽が続いているのにもかかわらず、フレーム毎に断続的に通知が行われてしまう、という問題が発生してしまう。
そこで、通知判断部28は、図4に示すように、第iフレームを含む過去nフレーム分のフレーム評価値(zi−n+1,・・・,z)に基づいて、第iフレームの通知有無評価値sを算出する。例えば、図4に示すように、窓関数a(k=1,2,・・・,n) を導入し、下記(1)式により判定値uを算出する。そして、下記(2)式に従い、閾値Θを用いて、通知有無評価値sを算出することができる。
窓関数a及び閾値Θの値は、窓関数を図4で示すような一次関数を利用し、例えば、a=2k/n(n+1)、Θ=0.4〜0.6などとすることができる。なお、(2)式では、通知有無評価値sを、通知することを示す値としてs=1、通知しないことを示す値としてs=0という2値とする場合を示しているが、通知有無評価値sを連続値または多値とすることもできる。この場合は、s=uとしたり、uを量子化してsとしたりすることができる。
次に、ステップ108で、通知判断部28は、上記ステップ106で算出された通知有無評価値sが1か否かを判定する。s=1の場合には、通知をする場合であるため、ステップ110へ移行して、通知制御部30が、第iフレームに音楽が含まれていることが外部に通知されるように通知装置14を制御する。例えば、ディスプレイに音楽が検出されたことを示すサインを表示したり、LED等の照明装置を点滅させたり、振動装置を振動させたりする。なお、通知有無評価値sを多値または連続値とした場合であって、通知装置14の強さ(照明の明るさ、ディスプレイの明るさ、ディスプレイに表示されるサイン大きさや色、振動の強さなど)を連続的または多段階的に変化させることができる場合には、通知制御部30は、多値または連続値の通知有無評価値sに応じて、通知装置14の強さを調節してもよい。
図5に、本実施の形態の音楽検出通知装置10をスマートフォン等の携帯端末に実装した場合の例を示す。音楽検出通知装置10は、携帯端末自体が備えるマイクロホンを入力装置12として用い、携帯端末自体が備えるディスプレイ及び振動装置を通知装置14として用いる。また、携帯端末自体が備えるCPU、ROM、RAM等を、コンピュータ16を構成する各部として機能させる。マイクロホンで集音された音響信号に音楽が含まれていない場合には、同図(A)に示すように、通知は行われない。音響信号に音楽が含まれていることが検出された場合には、同図(B)に示すように、ディスプレイに音楽が検出されたことを示すサインを表示するか、振動装置を振動させることで、または、サインを表示すると共に振動装置を振動させることで、ユーザに音響信号に音楽が含まれていることを通知する。
以上説明したように、本実施の形態の音楽検出通知装置によれば、音響信号に音楽が含まれていると判断された場合に、通知装置を制御して外部にその旨を通知するため、入力された音響信号に音楽が含まれているか否かをリアルタイムで知ることができる。また、通知の有無を判断する際に、過去の所定フレーム数分のフレーム評価値を用いて判断するため、音響信号に継続的に音楽が含まれているにもかかわらず、通知が断続的になってしまうことを防止することができる。
本実施の形態の音楽検出装置は、日常生活の様々な場面に適用することができる。例えば、鉄道駅等における列車の発着時、横断歩道における交通信号等でサインとして使われている音楽を検出し、聴力に障害を持った人や耳栓をしている健常者などに対し、その音楽によるサインの存在を通知することができる。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 音楽検出通知装置
12 入力装置
14 通知装置
16 コンピュータ
20 音響信号バッファ
22 音響特徴抽出部
24 フレーム評価値算出部
26 フレーム評価値バッファ
28 通知判断部
30 通知制御部

Claims (3)

  1. 入力された音響信号に対して短時間フレームを設定し、各短時間フレームに含まれる音響特徴を抽出する音響特徴抽出手段と、
    前記抽出手段により抽出された音響特徴に基づいて、前記短時間フレーム毎に音楽が含まれるか否かを示すフレーム評価値を算出するフレーム評価値算出手段と、
    前記フレーム評価値算出手段により算出された現フレームを含む過去の所定フレーム分のフレーム評価値から算出される通知の有無を示す通知有無評価値に基づいて、前記音響信号に音楽が含まれていることを通知するか否かを、前記短時間フレーム毎に判断する通知判断手段と、
    前記通知判断手段により前記音響信号に音楽が含まれていることを通知すると判断された場合に、前記音響信号に音楽が含まれていることが外部に通知されるように通知手段を制御する通知制御手段と、
    を含む音楽検出通知装置。
  2. 音響特徴抽出手段が、入力された音響信号に対して短時間フレームを設定し、各短時間フレームに含まれる音響特徴を抽出し、
    フレーム評価値算出手段が、前記抽出手段により抽出された音響特徴に基づいて、前記短時間フレーム毎に音楽が含まれるか否かを示すフレーム評価値を算出し、
    通知判断手段が、前記フレーム評価値算出手段により算出された現フレームを含む過去の所定フレーム分のフレーム評価値から算出される通知の有無を示す通知有無評価値に基づいて、前記音響信号に音楽が含まれていることを通知するか否かを、前記短時間フレーム毎に判断し、
    通知制御手段が、前記通知判断手段により前記音響信号に音楽が含まれていることを通知すると判断された場合に、前記音響信号に音楽が含まれていることが外部に通知されるように通知手段を制御する
    音楽検出通知方法。
  3. コンピュータを、請求項1記載の音楽検出通知装置を構成する各手段として機能させるため音楽検出通知プログラム。
JP2012152824A 2012-07-06 2012-07-06 音楽検出通知装置、方法、及びプログラム Pending JP2014016423A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012152824A JP2014016423A (ja) 2012-07-06 2012-07-06 音楽検出通知装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012152824A JP2014016423A (ja) 2012-07-06 2012-07-06 音楽検出通知装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2014016423A true JP2014016423A (ja) 2014-01-30

Family

ID=50111180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012152824A Pending JP2014016423A (ja) 2012-07-06 2012-07-06 音楽検出通知装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2014016423A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2004111996A1 (ja) * 2003-06-11 2006-07-20 松下電器産業株式会社 音響区間検出方法および装置
JP2009008836A (ja) * 2007-06-27 2009-01-15 Nippon Telegr & Teleph Corp <Ntt> 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
JP2009229921A (ja) * 2008-03-24 2009-10-08 Victor Co Of Japan Ltd 音響信号分析装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2004111996A1 (ja) * 2003-06-11 2006-07-20 松下電器産業株式会社 音響区間検出方法および装置
JP2009008836A (ja) * 2007-06-27 2009-01-15 Nippon Telegr & Teleph Corp <Ntt> 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
JP2009229921A (ja) * 2008-03-24 2009-10-08 Victor Co Of Japan Ltd 音響信号分析装置

Similar Documents

Publication Publication Date Title
CN110383375B (zh) 用于检测噪声背景环境中的咳嗽的方法和设备
US10026410B2 (en) Multi-mode audio recognition and auxiliary data encoding and decoding
US20180211673A1 (en) Multi-mode audio recognition and auxiliary data encoding and decoding
JP5998603B2 (ja) 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
CN110503961B (zh) 音频识别方法、装置、存储介质及电子设备
US20150287414A1 (en) Method for controlling device and device control system
US11380351B2 (en) System and method for pulmonary condition monitoring and analysis
JP6436088B2 (ja) 音声検出装置、音声検出方法及びプログラム
US20130090926A1 (en) Mobile device context information using speech detection
Carmel et al. Detection of alarm sounds in noisy environments
US20180213339A1 (en) Adapting hearing aids to different environments
EP2881948A1 (en) Spectral comb voice activity detection
JP2011107715A5 (ja)
WO2021169742A1 (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
EP4141869A1 (en) A method for identifying an audio signal
JP2009008823A (ja) 音響認識装置、音響認識方法、及び、音響認識プログラム
US20220084543A1 (en) Cognitive Assistant for Real-Time Emotion Detection from Human Speech
WO2017045429A1 (zh) 一种音频数据的检测方法、系统及存储介质
CN110544491A (zh) 一种实时关联说话人及其语音识别结果的方法及装置
CN111081275B (zh) 基于声音分析的终端处理方法、装置、存储介质及终端
JP6367691B2 (ja) 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム
JP4607908B2 (ja) 音声区間検出装置および音声区間検出方法
JP2012113173A (ja) 雑音抑制装置、雑音抑制方法、及びプログラム
Xie et al. Detection of anuran calling activity in long field recordings for bio-acoustic monitoring
CN109634554B (zh) 用于输出信息的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150519

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20151020