JP2011180470A - 音声可視化装置 - Google Patents

音声可視化装置 Download PDF

Info

Publication number
JP2011180470A
JP2011180470A JP2010046113A JP2010046113A JP2011180470A JP 2011180470 A JP2011180470 A JP 2011180470A JP 2010046113 A JP2010046113 A JP 2010046113A JP 2010046113 A JP2010046113 A JP 2010046113A JP 2011180470 A JP2011180470 A JP 2011180470A
Authority
JP
Japan
Prior art keywords
sound
unit
recording
signal
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010046113A
Other languages
English (en)
Inventor
Noriyuki Hata
紀行 畑
Hideki Nakagawa
秀樹 中川
Masaharu Ono
正晴 大野
Satoshi Yoshiizumi
聡 吉泉
Makoto Tanaka
田中  良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010046113A priority Critical patent/JP2011180470A/ja
Publication of JP2011180470A publication Critical patent/JP2011180470A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】音声の到来方位および時間を直感的に把握することができる音声可視化装置を提供する。
【解決手段】所定方位毎に指向性を形成した音声データを生成し、各音声データの音量から音源の方位を判定する。この音源方位の判定結果に基づいて、音声を収音したタイミングと、音声の到来方位を示す円画像を表示する。円画像は、時間経過に応じて中心に向かって移動させる。また、各音声データの音量に応じて円画像の大きさを変更する。
【選択図】図4

Description

この発明は、音(以下、音声とも言う。)を可視化する技術に関する。
従来、音声を再生するときに、当該音声を可視化する装置として、例えば特許文献1のようなものが提案されている。
特許文献1の装置は、横軸が鍵盤に対応付けられ、縦軸が時間軸に対応付けられたマトリクス状の表示画面に、上方向から下方向に移動する可視画像(玉の画像)を表示するものである。玉の画像が鍵盤に重なると楽音が発音され、他の装置からデータ(演奏情報)を受信してから発音タイミングが到来するまでの時間の経過状態がわかるようになっている。
特許第3922207号公報
近年の録音再生装置では、指向性を制御することができるものも多く、音声の到来方位を把握することも重要になっているが、特許文献1の装置では、時間経過を直感的に把握することはできても、音声の到来方位まで把握することができなかった。
そこで、この発明は、音声の到来方位および時間経過を直感的に把握することができる音声可視化装置を提供することを目的とする。
この発明の音声可視化装置は、複数のマイクと、指向性制御部と、一時記憶部と、音源方位判定部と、表示処理部と、を備えている。指向性制御部は、複数のマイクが収音した音声に基づいて、所定方位毎に指向性を形成した収音信号を生成する。例えば、収音方向が所定角度傾いた2つの指向性マイクを近接して設け、各指向性マイクの収音した音声のゲインを変化させて合成した信号を複数生成する。各マイクの収音した音声のゲインを変化させると、指向性が変化するため、複数の方位に指向性を形成した収音信号を生成することができる。一時記憶部は、この方位毎の収音信号を一時記憶しておく。
音源方位判定部は、各方位の収音信号のレベルを比較し、レベルの大きい方位(所定レベル以上の音量を有する方位)に音源が存在すると判定する。
表示処理部は、音源方位判定部の判定結果に基づいて、マイクで音声を収音したタイミング、および音声の到来方位を示す画像を表示し、当該画像を時間経過に応じて移動表示させる。例えば、画面中心位置を装置の存在位置として、画面内の外側に円画像を表示する。この円画像の円周上が収音タイミングを表すことになる。そして、画面外側から中心に向かって、時間経過とともに移動する玉の画像を表示する。これにより、音声の到来方位および時間経過を直感的に把握することができる。
また、表示処理部は、方位毎のレベルに基づいて、玉の画像の大きさを制御するようにしてもよい。この場合、音量の違いも直感的に把握することができる。
また、音源方位判定部は、所定方位毎の収音信号の周波数特性を検出し、表示処理部は、前記周波数特性に基づいて、画像の表示色を制御するようにしてもよい。例えば、高周波数帯域のレベルが高い音声であれば明るい色、低周波数帯域のレベルが高い音声であれば暗い色を表示する、等である。この場合、音声の周波数特性も直感的に把握することができる。
さらに、音声可視化装置は、複数のマイクが収音した音声に基づく録音データを記録する記録部と、記録部に記録された録音データを再生する再生部と、を備える態様とすることも可能である。
この場合、指向性制御部は、記録部から読み出した録音データに基づいて、所定方位毎の収音信号を生成する。録音データが複数のマイクが収音した音声をそのまま記録したものである場合、上述と同様に、各音声のゲインを制御して合成することで、方位毎の収音信号を生成する。録音時に方位毎の収音信号として記録されたものである場合、そのまま出力する。
そして、表示処理部は、再生部の録音データの再生に同期して、画像を移動表示する。つまり、画面中心位置を装置の存在位置として、画面外側に円画像を表示する場合、この円画像の円周上が音声を放音するタイミングを表すことになる。そして、画面外側から中心に向かって、時間経過とともに移動する玉の画像を表示する。なお、録音データを再生する場合、再生すべき音声の方位とタイミングを先読みして、放音タイミングを表す円画像よりも外側に玉画像を表示し、今後放音されるべき音声を可視化表示することも可能である。
また、音声可視化装置は、ユーザの操作を受け付ける操作部と、前記録音データまたは前記所定方位毎の収音信号に対し、前記操作部の受け付けた操作に応じた信号処理を行う信号処理部と、を備えていてもよい。この場合、表示処理部は、操作部の受け付けた操作に応じて、前記画像の移動態様を変化させる。
例えば、操作部が表示部と一体化したタッチパネルとなっている場合、以下の様なことを実現することができる。すなわち、画面上で画面外側から中心に向かって移動する玉の画像の動きを遮るような操作を行ったとき、この玉の画像の移動を停止させるとともに、その方位の収音信号のレベルをゼロに設定し、録音されないようにする。あるいは、録音データを再生している場合、放音タイミングを表す円画像よりも外側において玉の画像の動きを遮るような操作を行ったとき、この玉の画像の移動を停止させるとともに、その方位の録音データの再生レベルをゼロに設定し、放音されないようにする。
この発明によれば、音声の到来方位および時間経過を直感的に把握することができる。
録音再生装置の外観を示した図である。 録音再生装置の構成を示したブロック図である。 方位別分解処理部の構成を示した図である。 表示部に表示される画面を示した図である。 円画像の移動態様を説明する図である。 側面視の例を示した図である。 ユーザの操作に応じた画面表示例を示す図である。 ファイル選択画面を示した図である。 再生画面を示した図である。
本発明の音声可視化装置に係る実施形態について説明する。図1は、本発明の音声可視化装置を実現した録音再生装置の外観を示した図である、図2は、同録音再生装置の構成を示すブロック図である。
録音再生装置は、マイクユニット1と録音再生ユニット2とからなる。マイクユニット1は、録音再生ユニット2の周辺機器として機能するものであり、3つのマイク101、マイク102、およびマイク103を内蔵したマルチマイク10を備えている。
マイクユニット1は、円筒形状の外観を有し、マルチマイク10が配置されている部分は、強度確保および損傷保護のため、パンチングメタルにより形成されている(ただし、音響的には解放されているものである)。このパンチングメタルで形成された部分は、90度折り曲がるようになっており、マルチマイク10に内蔵されている各マイクの収音方向を90度変化させることができるようになっている。
マイクユニット1は、これら複数のマイクが収音した音声をそのまま、あるいは各種信号処理を行ってから録音再生ユニット2に出力する。また、マイクユニット1は、複数のマイクが収音した音声に基づいて音源の相対的な方位を判定し、この判定結果に基づいて、音源の音声を収音したタイミングおよび当該音源の音声の到来方位を示す画像を表示するためのデータを録音再生ユニットに出力する。
録音再生ユニット2は、カード型の外観を有するデジタルオーディオプレーヤであり、入力された音声データの再生を行う他、内蔵ストレージに記憶されている音声データを再生し、単体でも音声の再生を行うことができる。録音再生ユニット2は、外観上、上面に表示部21を備えており、表示部21は、操作部を兼ねたタッチパネルとなっている。
本実施形態において、録音再生ユニット2のうち、マイクユニットが接続される方向をX方向(右面方向)、その逆方向を−X方向(左面方向)とする。また、X軸を含む平面上で、X方向から左回転90°傾いた方向をY方向(正面方向)、その逆方向を−Y方向(背面方向)とする。表示部21が設けられた方向をZ方向(上面方向)、その逆方向を−Z方向(下面方向)とする。
なお、マイクユニット1と録音再生ユニット2は、本実施形態のように別体であることが必須ではなく、一体型で構成されていてもよい。
図1(A)および同図(B)に示すように、マルチマイク10の3つのマイク101、マイク102、およびマイク103は、音響的に位相差がほとんど無い状態となるように近接して配置されている。同図(A)および同図(B)においては、円筒の一方の端部側から順に、他方の端部に向かってマイク101、マイク102、マイク103と配置される例を示しているが、配置態様はこの例に限らず、例えば同一面内に3つのマイクを配置するようにしてもよい。
マイク101、マイク102、およびマイク103は、単一指向性(カーディオイド特性)を有し、同図(C)に示すように、それぞれの指向性感度の極大となる方向(収音方向)が同一平面上で120度ずつずれるように配置されている。
上述したように、マイクユニット1のマルチマイク10が配置されている部分は、90度折れ曲がるようになっており、同図(A)に示すような折れ曲がった状態(L字型の状態)においては、XY平面上の音声を収音する態様となっている。同図(B)に示すように折り曲げない状態においては、XZ平面上の音声を収音する態様となっている。
同図(C)では、XY平面上の音声を収音する例を示している。同図(C)に示す状態において、マイク101は、Y方向(±0°方向とする。)に収音方向が向けられており、マイク102は、マイク101に対して左回転120°傾いた方向(−120°方向とする。)に収音方向が向けられ、マイク103は、右回転120°傾いた方向(120°方向とする。)に収音方向が向けられている。マイクユニット1は、各マイクをこのような収音方向の配置とすることで、XY平面上(またはXZ平面)の全方向を収音することができる。
なお、同図(C)に示す例においては、各マイクの収音方向が中心位置でクロスするように内向きに配列される例を示しているが、各マイクの収音方向を外向きにしてもよい。ただし、各マイクの収音方向を内向きとする場合、外向きよりもマイク振動面を近接させて配置することができるため、位相差を少なくすることができる。
次に、図2において、マイクユニット1は、上記マルチマイク10に加え、セレクタ(Sel.)11、方位別分解処理部12、分析部13、表示処理部14、インタフェース(I/F)15、チャンネル(ch)別分解処理部16、信号処理部17、データ作成部18、および制御部19を備えている。また、録音再生ユニット2は、上記表示部21に加え、インタフェース(I/F)22、制御部23、操作部(表示部21と兼用のタッチパネル)24、ストレージ25、再生処理部26、通信部27、およびセンサ部28を備えている。なお、本実施形態においては、A/D変換、D/A変換の構成は省略し、特に記載なき場合、各種信号は全てデジタル音声信号であるものとする。
マイクユニット1のセレクタ11は、制御部19の指示に応じてマルチマイク10から入力された各マイクの収音した音声(マイク101の出力音声信号x1(t)、マイク102の出力音声信号x2(t)、マイク103の出力音声信号x3(t))を方位別分解処理部12、チャンネル別分解処理部16、およびデータ作成部18に出力する。
データ作成部18は、セレクタ11から各マイクの収音した音声信号を入力した場合、これら音声信号をそのままインタフェース15に出力する。この場合、録音再生ユニット2に出力された音声信号は、録音再生ユニット2のインタフェース22および制御部23を経て、ストレージ25に録音データとして記録される。録音データの形式は、各マイクの音声信号をそのままデジタル音声信号として記録したものであってもよいし、データ作成部18にて所定のエンコード方式にてエンコードしたものであってもよい。なお、録音再生ユニット2は、センサ部28や通信部27から所定の付加情報(地図情報や、GPSによる位置情報、時刻情報等)を取得し、録音データに対応付けて記録しておくことも可能である。
ストレージ25に記録された録音データは、ユーザが操作部24を用いて再生指示を行うと、再生処理部26に入力されるとともに、制御部23、インタフェース22およびインタフェース15、制御部19を経てセレクタ11に入力される。録音データがエンコードされたものである場合、デコードされて音声信号に変換されるものとする。再生処理部26は、アンプ、スピーカ等を内蔵しており、入力された音声信号に基づいて音声を放音する。
一方、セレクタ11は、制御部19の指示に応じて、マルチマイク10から入力される音声信号と、制御部19から入力される音声信号と、を切り換えて出力するものである。つまり、録音時(録音待機時)には、制御部19は、セレクタ11にマルチマイク10から入力される音声信号を出力するように指示し、ユーザが操作部24を操作して再生を指示したときは録音データに基づく音声信号を出力するように指示する。
方位別分解処理部12は、本発明の指向性制御部に相当し、セレクタ11から音声信号を入力した場合、これらの音声信号のゲインを変化させて合成することにより、所定方位毎に指向性を形成した収音信号を複数生成する。図3を参照して、方位別分解処理部12の構成と処理について説明する。
方位別分解処理部12は、指向性を形成する方向別に複数の信号合成部を備えている。この例においては8方向に指向性を形成するため、8つの信号合成部121〜128を備えている。各信号合成部は、それぞれゲイン調整部31A、ゲイン調整部31B、ゲイン調整部31C、および加算部32を備えている。
入力される3つの音声信号は、方向別の信号合成部の各ゲイン調整部でゲイン調整され、その後、加算部32で加算される。方位別分解処理部12は、各ゲイン調整部のゲインを任意の値に設定することで、任意の方向に指向性を形成した収音信号を生成することができる。
例えば、本実施形態では、音源の方向判定精度(音源分離精度)を高くするべく、最も鋭い指向性を有するハイパーカーディオイド特性に設定する。すなわち、Y方向に単一指向性を形成するために、ゲイン調整部31A、ゲイン調整部31B、ゲイン調整部31Cの各ゲイン(G1、G2、G3)の値を
(G1,G2,G3)=(7/6,−1/3,−1/3)
に設定している。合成後の出力信号X1(t)は、マイク101、マイク102、マイク103の出力信号であるM1(t),M2(t),M3(t)を用いて、
X1(t)=G1×M1(t)+G2×M2(t)+G3×M3(t)=7/6×M1(t)+(−1/3)×M2(t)+(−1/3)×M3(t)
で表される。これにより、3つのマイクの合成特性の感度極大方向の角度を0°方向に向けることができる。すなわち、θ=0°の方向に単一指向性を形成した収音信号X1(t)を生成することができる。他の信号合成部122〜128も同様の処理を行うことにより、本実施形態では、8方向(±0°、+45°、+90°、+135°、±180°、−45°、−90°、−135°)に単一指向性を形成した収音信号X1(t)〜X8(t)を生成することができる。
なお、3つのマイクが配置される平面に直交する方向に感度極大方向を有したマイクをさらに1つ備え、4つのマイクの出力音声信号の合成を行うと、立体的に指向性を制御することもできる。また、アレイマイクによる遅延合成を用いても任意の方向に指向性を形成することができる。
図2に戻り、チャンネル別分解処理部16は、方位別分解処理部12と同様に、複数方向に指向性を有した収音信号を生成するものであるが、収音信号の生成数および方向が異なる。例えば、本実施形態では、5.1ch録音を行うものとして、L,R,SL,SR,C,LFE(ただし、LFEは無指向)に対応する方向の6つの収音信号を生成する。収音信号の生成数および方向は、録音態様によって種々設定することが可能である。無論、方位別分解処理部12と同じ方位、同じ数の収音信号を生成してもよい。
チャンネル別分解処理部16で生成された各収音信号は、信号処理部17で所定の信号処理(ノイズ低減処理等)がなされた後、データ作成部18に出力される。データ作成部18は、入力された収音信号をそのまま、またはエンコード等を行ってインタフェース15に出力する。そして、データ作成部18が出力した録音データは、録音再生ユニット2に出力され、ストレージ25に記録される。
一方、方位別分解処理部12で生成した各方位の収音信号Xn(t)は、分析部13に入力される。分析部13は、本発明の一時記憶部や音源方位判定部に相当し、方位別分解処理部12から入力された各収音信号Xn(t)に基づいて、音源の方位を判定する。すなわち、分析部13は、入力された各方位の収音信号Xn(t)が有音であるか否かを判定する。有音であるか否かは、各収音信号Xn(t)のレベルによって判断される。
分析部13は、各収音信号Xn(t)を所定時間(以下、分析時間と言う。)だけ記憶し、この分析時間内のピークレベルを検出する。このピークレベルが所定のしきい値以上であるか否かを判断し、しきい値以上であれば有音であるとし、この方位に音源が存在すると判定する。同時に複数の方位に音源が存在すると判定する場合もある。また、上記分析時間における平均レベルを算出し、この平均レベルがしきい値以上である場合に有音であると判定してもよいし、サンプリングタイム毎にしきい値以上であるか否かを判定してもよい(この場合、収音信号を分析時間分記憶する構成は不要である)。
なお、分析部13において判定する音源の方位は、録音再生ユニット2の正面方向を0°方向とした相対的な方位であるが、録音再生ユニット2が絶対方位を取得できる場合(例えばセンサ部28に方位角センサが内蔵されている場合)、録音再生ユニット2から自装置の向いている方位情報(0°方向がどの絶対方位に対応するかを示す情報)を受信し、音源の絶対方位を判定することも可能である。
分析部13は、有音であると判定した方位の収音信号Xn(t)を表示処理部14に出力する。また、分析部13は、分析結果に係る情報として、上記ピークレベルや平均レベルを示す情報も表示処理部14に出力する。表示処理部14は、入力された収音信号Xn(t)を所定時間(上記分析時間よりも長い時間)だけ一時記憶する。表示処理部14に記憶される収音信号Xn(t)は、入力開始からの経過時間と対応付けられて記憶されるものとする。
なお、分析部13は、有音であると判定した方位の収音信号Xn(t)について、周波数特性の検出を行ってもよい。周波数特性は、時間軸上の収音信号Xn(t)をフーリエ変換(FFT)することにより、周波数軸上の収音信号Xn(f)に変換することで求められる。このとき、分析部13は、周波数軸上の収音信号Xn(f)をそのまま表示処理部14に出力してもよいが、収音信号Xn(f)を複数の帯域(例えば低周波帯域、高周波数帯域)に分割し、各帯域におけるピークレベルや平均パワー等を算出し、この算出結果を、上記分析結果に係る情報に含めて表示処理部14に出力するようにしてもよい。
表示処理部14は、記憶した収音信号Xn(t)および分析結果に係る情報に基づいて、表示部21に画像表示を行うためのデータを生成し、録音再生ユニット2に出力する。
図4および図5を参照して、表示部21に表示される画像の例について説明する。図4(A)に示すように、表示部21には、画面中心位置を同心円とする円画像であるREC画像251、収音タイミング画像252、および録音タイミング画像253が表示される。また、画面内には、複数の小さい丸い画像(玉の画像)が表示される。例えば、画面左下には、最も外側の玉画像201から順に、4つの玉画像201〜204が表示されている。表示処理部14は、記憶した収音信号Xn(t)に基づいて、マイクで音声を収音したタイミング、および音声の到来方位を示す画像として、各玉画像を表示する制御を行っている。
ここで、ユーザがタッチパネル(操作部24)を操作してREC画像251を押下すると、表示処理部14は、図4(B)に示すような録音画面を表示する。図4(B)の例では、REC画像251を大きくして録音タイミング画像253と同じ大きさの円画像とし、RECORDINGと表示して、録音開始からの経過時間を表示する。録音画面を表示すると、データ作成部18から録音データ(各マイクの音声信号や収音信号等)が出力され、録音再生ユニット2のストレージ25に録音データが記録される。そして、ユーザが再びタッチパネルを操作してREC画像251を押下すると、表示処理部14は、図4(C)に示す様な画面を表示する。図4(C)の例では、録音タイミング画像253の円画像内に、円画像のファイルアイコン255を表示する。ファイルアイコン255内には、録音日時等が表示される。
図5を参照して、玉画像の表示制御について説明する。同図(A)〜(C)の右欄には各方位の収音信号の時間軸波形(レベル変化)を示している。なお、同図においては、説明のために無音であると判定した収音信号も示しているが、実際に表示処理部14に入力されるのは、有音であると判定した分析時間帯における収音信号である。
まず、同図(A)に示すように、表示処理部14は、分析部13から有音であると判定した収音信号Xn(t)が入力されると、その収音信号の指向性を形成している方位(例えば収音信号X1(t)が入力された場合は、角度0°の方位)のうち、収音タイミング画像252の円周上に玉画像を表示する。同図(A)の例では、角度−140°の方位に相当する収音信号が入力されたタイミングとなるため、角度−140°の方位の収音タイミング画像252の円周上に玉画像201を表示している。
そして、時間経過とともに、同図(B)に示すように、入力される収音信号が変化するため、玉画像を画面中心位置に向けて移動させる表示制御を行う。同図(B)の例では、玉画像203に対応する収音信号が録音タイミングに重なる。
ここで、表示処理部14による表示制御とデータ作成部18における録音データの出力は、制御部19によって同期されており、ユーザが録音の指示を行っている場合(図4(B)に示した状態の場合)、表示処理部14が玉画像を録音タイミング画像253(録音中はREC画像251に重なる。)の円周上に移動させたタイミングで、データ作成部18から録音データ(例えば各マイクの出力音声信号)が出力されるようになっている。すなわち、データ作成部18は、入力された各マイクの音声信号や方位別の収音信号を表示処理部14と同じ所定時間だけ一時記憶しており、表示処理部14が玉画像をREC画像251の円周上に移動させたタイミングが制御部19から通知されると、一時記憶しておいた音声信号や収音信号を出力する。なお、表示処理部14が一時記憶している収音信号を録音再生ユニット2のストレージ25に出力し、録音データとして記録するようにしてもよい。
ここで、例えば、図5(B)のタイミングでユーザが録音操作を行うと、この録音タイミング以降の録音データ(マイクの出力音声信号や方位別の収音信号)が出力されることになり、以降は、玉画像201,202,203に対応する方位の音源の音声が録音されることになる。玉画像204に対応する収音信号は、録音タイミングを過ぎたため、録音データには含まれないことになり、この方位の音源の音声は録音されないことになる。
また、玉画像204に対応する収音信号は、録音タイミングを過ぎたため、表示処理部14から消去されることになる。ただし、同図(B)に示すように、録音タイミングを過ぎた後もある程度の時間(例えば上記分析時間分)だけ記憶しておき、画面中心位置に移動するまでは画面上に表示を行っていてもよい。
さらに時間が経過すると、同図(C)に示すように、さらに玉画像を画面中心位置に向けて移動させる表示制御を行う。同図(C)の状態では、玉画像202に対応する収音信号が録音タイミングとなり、録音データには、この方位の音源の音声が含まれていることが視覚的に把握できる。
また、表示処理部14は、収音信号の分析結果に応じて玉画像の大きさや色を変更する。すなわち、表示処理部14は、分析結果のうち、ピークレベルや平均レベルに基づいて、玉画像の大きさを変更する。例えば、レベルの高い収音信号については、玉画像を大きく表示し(玉画像201を参照)、レベルの低い収音信号については、玉画像を小さく表示する(玉画像202〜204を参照)。また、表示処理部14は、周波数特性の分析結果に基づいて、玉画像の色を変更する。例えば、高周波数帯域のレベルが高い場合、明るい色の玉画像を表示し(玉画像201、202を参照)、低周波数帯域のレベルが高い場合、暗い色の玉画像を表示する(玉画像203、204を参照)。なお、周波数軸上の収音信号Xn(f)を入力している場合、この周波数特性を可視光の波長に見立てた色を表示してもよい。例えば、低周波数帯域のレベルが高い場合、波長の長い赤色の玉画像の表示を行い、高周波数帯域のレベルが高い場合、波長の短い青や紫色の玉画像を表示する。
なお、各玉画像の移動速度は、任意であるが、表示処理部14が一時記憶する収音信号の時間長に応じて設定される。例えば、表示処理部14が各方位の収音信号を5秒分記憶する場合、収音タイミング画像252の円周上から録音タイミング画像253の円周上まで5秒の時間をかけて移動させる。
以上の構成により、本実施形態の録音再生装置は、音声の到来方位および時間経過を直感的に把握することができる。この構成によれば、ユーザ自身が実際に音声を聞いて表示部21を参照することで、録音したい音声の到来方位や録音開始タイミングを直感的に把握することができ、従来ではなし得なかった操作態様を実現することができる。
なお、上記の例においては、録音再生装置と音声の到来方位を相対的な方位として表示するヘッドアップ表示を行う例を示しているが、絶対方位を取得する場合、真北方位を固定し、音源の絶対方位を表示するノースアップ表示を行うことも可能である。
また、上述した4つのマイクを用いて立体的に指向性を制御する場合。図6に示すような側面視した表示を行うことも可能である。録音再生ユニット2のセンサ部28が姿勢センサ(加速度センサ)を備えている場合、録音再生ユニット2の正面方向(Y方向)を鉛直上方向に向けると図6に示す側面視した表示を行い、上面方向(Z方向)を鉛直上方向に向けると図4および図5に示した平面視した表示を行うように制御してもよい。
次に、図7を参照して、本実施形態の録音再生装置のユーザ操作による信号処理制御について説明する。録音再生装置は、ユーザがタッチパネルを操作して所定の操作を行うと、ユーザの操作に応じて、各方位の収音信号についてゲイン制御や周波数特性の制御等の各種信号処理を行う。
例えば、図7の画面右上に示すように、ユーザが画面上で、所定方位範囲だけ円周方向に向かって指でなぞる操作を行い、玉画像の動きを遮るような操作を行ったとき、表示処理部14は、この所定方位範囲に相当する玉画像の移動を停止させる。そして、信号処理部17は、この所定方位範囲に相当する収音信号のレベルをゼロに設定し、録音データとして録音されないようにする。
また、同図の画面右下に示すように、ユーザが画面上で、所定方位範囲だけ円周方向に向かって蛇行してなぞる操作を行うと、表示処理部14は、この所定方位範囲に相当する玉画像の色を変化させ、信号処理部17は、この所定方位範囲に相当する収音信号の周波数特性を変化させる。例えば、高周波数帯域を減衰させるローパスフィルタの処理を行い、指でなぞった箇所より内側を移動する玉画像の色を暗い色に変化させる。
このように、本実施形態の録音再生装置は、画面上で種々の操作を行うことで、直感的に信号処理の態様を指示することもできる。
次に、図8および図9を参照して録音再生装置がストレージ25に録音された録音データの再生を行う場合について説明する。図4(C)で示したように、録音再生装置では、ユーザがタッチパネルを操作してREC画像251を押下すると、録音タイミング画像253の円画像内に、円画像のファイルアイコン255を表示するが、このファイルアイコン255は、図8(A)に示すようなファイル選択画面として表示される。図4(C)に示した状態から、「ファイル選択ボタン」等のボタンを操作すると、このファイル選択画面に移動する。ファイル選択画面の表示制御は、録音再生ユニット2の制御部23にて行う。制御部23は、ストレージ25に記録されている各録音データの録音日時等の情報を読み出し、各録音データを図8(A)に示すようなファイルアイコンとして表示する制御を行う。
同図(A)に示すように、ファイル選択画面では、過去の録音データをファイルアイコンとして複数並べて表示しており、平面視した状態では、画面外側から画面中心に向かって右回転に円弧を描くようにファイルアイコンが並んでいる(無論、左回転でもよい)。中心に近いファイルアイコンほど過去の録音データに対応するようになっており、小さく表示されるようになっている。また、側面視した状態では、画面上から下方向に向かって左右を往来するようにファイルアイコンが並んでいる。画面下方向に近いファイルアイコンほど過去の録音データに対応し、小さく表示されるようになっている。すなわち、ファイルアイコンは、螺旋状に配置されているように表示される。
ここで、録音再生ユニット2には、センサ部28において加速度センサを内蔵しているため、同図(B)に示すように、ユーザが録音再生ユニット2を鉛直下方向に移動させる操作を当該加速度センサで検出すると、録音再生ユニット2の制御部23は、過去の録音データに対応するファイルアイコンが円弧状を左回転して大きくなるように表示制御を行う。逆に、ユーザが録音再生ユニット2を鉛直上方向に移動させる操作を当該加速度センサで検出すると、録音再生ユニット2の制御部23は、録画日時の新しい録音データに対応するファイルアイコンが円弧状を右回転して小さくなるように表示制御を行う。
そして、ユーザが各ファイルアイコンを選択する操作を行うと、図9に示す再生画面を表示する。図9(A)に示すように、再生画面においては、図4(A)に示した録音画面と同様の表示を行う。ただし、最も内側の円画像は、再生画像261となり、「PLAY」の文字が表示される。再生画像261の外側には、発音タイミングを表す発音タイミング画像263が表示され、玉画像がこの発音タイミング画像263の円周上に到達したタイミングで音声が放音されるようになっている。最も外側の円画像は、録音時の収音タイミング画像に相当するが、再生時には収音を行っているわけではないため、この収音タイミング画像262の表示はなくてもよい。また、録音時には収音タイミングよりも前の音声(マイクに入力されていない未収音の音声)は可視化していなかったが、再生時には録音データを先読みすることにより、収音タイミングよりも前の音声を可視化することができるため、収音タイミング画像262の外側にも玉画像を表示してもよい。
再生時の表示制御と、音声の再生制御の同期について説明する。図9の例では、録音データが各マイクの出力音声信号を記録したものである場合について説明する。ユーザがファイルアイコンを選択し、図9に示す再生画面に移行すると、制御部23は、ストレージ25から対応する録音データを読み出す。そして、表示制御に同期して再生処理部26に音声信号を出力し、音声を放音する。表示制御との同期は、例えば以下のようにして行う。
まず、制御部23は、読み出した録音データ(各マイクの出力音声信号)をインタフェース22およびインタフェース15を介して制御部19に出力する。制御部19は、入力された各マイクの出力音声信号をセレクタ11を介して方位別分解処理部12およびチャンネル別分解処理部16に出力する。方位別分解処理部12およびチャンネル別分解処理部16は、それぞれ録音時と同様に、各方位の収音信号を生成し、それぞれ分析部13および信号処理部17に出力する。分析部13は、録音時と同様に、各方位の収音信号が有音であるか否かを判定し、表示処理部14に有音である収音信号を出力する。信号処理部17は、入力された収音信号に各種信号処理を行ってからデータ作成部18に出力する。データ作成部18は、入力された各収音信号をそのまま、あるいは合成する等して、制御部23に出力する。
表示処理部14による表示制御とデータ作成部18における収音信号の出力は、録音時と同様に制御部19によって同期されている。ただし、録音時には、録音タイミング画像253の円周上に玉画像が到達したときに録音データを出力する態様としていたが、再生時には、発音タイミング画像263の円周上に玉画像が到達したときに収音信号を出力し、再生処理部26に入力して音声の放音を行うものとする。
一方、本実施形態の録音再生装置は、再生画面において、ユーザが図9(B)に示すような左右の指で画面をこするような操作を行うと、再生早送りや巻き戻しを行うことが可能である。ユーザが画面外側から中心に向かって指をなぞり、玉画像の動きを加速させるような操作を行うと、各種構成部は、処理速度を上げ、再生早送りを行う。逆に、ユーザが画面中心から外側に向かって指をなぞり、中心から玉画像をかき出すような操作を行うと、各種構成部は逆再生を行う。無論、ユーザがなぞる操作を停止したとき、再生の一時停止を行うことも可能である。
また、録音データを再生している場合においても、発音タイミング画像263よりも外側において玉の画像の動きを遮るような操作を行ったとき、この玉の画像の移動を停止させるとともに、その方位の録音データの再生レベルをゼロに設定し、放音されないようにすることも可能であり、ローパスフィルタなどの周波数特性の制御を行うことも可能である。
なお、上記例においては、録音データに含まれる各マイクの音声信号を、チャンネル別分解処理部16にて方位毎の収音信号として生成してから、再生処理部26に入力して放音する例を示したが、録音データに含まれる各マイクの音声信号をそのまま再生処理部26に入力して放音してもよい。この場合、チャンネル別分解処理部16への音声信号の入力は必須ではなく、制御部23が表示処理部14による表示制御と音声信号の出力を同期し、放音を行ってもよい。
また、録音データが方位別の収音信号である場合、再生時には方位別分解処理部12およびチャンネル別分解処理部16が不要となり、制御部19は、分析部13および信号処理部17に録音データの収音信号を入力する。
また、表示処理部14の出力する表示用データをストレージ25に記録しておけば、再生時に音源方位の判定をあらためて行う必要はない。この場合、録音再生ユニット2の制御部23で全ての制御を行うことが可能であるため、録音再生ユニット2単体でも玉画像 の制御や信号処理の制御を行うことができる。
なお、本実施形態では、3つのマイクを設けた例を示したが、最低限2つのマイクを設けることで音源分離を行うことができる。例えば、収音方向が所定角度(90°)傾いた2つの指向性マイクを近接して設け、各指向性マイクの収音した音声のゲインを変化させて合成した信号を複数生成することも可能である。無論、同一平面内でさらに多数のマイクを配列するようにしてもよい。
1…マイクユニット
2…録音再生ユニット
10…マルチマイク
11…セレクタ
12…方位別分解処理部
13…分析部
14…表示処理部
15…インタフェース
16…チャンネル別分解処理部
17…信号処理部
18…データ作成部
19…制御部
21…表示部
22…インタフェース
23…制御部
24…操作部
25…ストレージ
26…再生処理部
27…通信部
28…センサ部

Claims (5)

  1. 複数のマイクと、
    前記複数のマイクが収音した音声を合成し、所定方位毎に指向性を形成した収音信号を生成する指向性制御部と、
    前記所定方位毎の収音信号を所定時間記憶する一時記憶部と、
    前記所定方位毎の収音信号に基づいて、音源の方位を判定する音源方位判定部と、
    前記音源方位判定部の判定結果に基づいて、前記複数のマイクが前記音源の音声を収音したタイミング、および当該音源の音声の到来方位を示す画像を表示し、当該画像を時間経過に応じて移動表示させる表示処理部と、
    を備えたことを特徴とする音声可視化装置。
  2. 前記音源方位判定部は、前記所定方位毎の収音信号のレベルに基づいて音源の方位を判定し、
    前記表示処理部は、前記レベルに基づいて、前記画像の大きさを制御する請求項1に記載の音声可視化装置。
  3. 前記音源方位判定部は、前記所定方位毎の収音信号の周波数特性を検出し、
    前記表示処理部は、前記周波数特性に基づいて、前記画像の表示色を制御する請求項1または2に記載の音声可視化装置。
  4. 前記複数のマイクが収音した音声に基づく録音データを記録する記録部と、
    前記記録部に記録された録音データを再生する再生部と、を備え、
    前記指向性制御部は、前記記録部から読み出した録音データに基づいて、前記所定方位毎の収音信号を生成し、
    前記表示処理部は、前記再生部の録音データの再生に同期して、前記画像を移動表示する請求項1〜3のいずれかに記載の音声可視化装置。
  5. ユーザの操作を受け付ける操作部と、
    前記録音データ、または前記所定方位毎の収音信号に対し、前記操作部の受け付けた操作に応じた信号処理を行う信号処理部と、を備え、
    前記表示処理部は、前記操作部の受け付けた操作に応じて、前記画像の移動態様を変化させる請求項4に記載の音声可視化装置。
JP2010046113A 2010-03-03 2010-03-03 音声可視化装置 Pending JP2011180470A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010046113A JP2011180470A (ja) 2010-03-03 2010-03-03 音声可視化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010046113A JP2011180470A (ja) 2010-03-03 2010-03-03 音声可視化装置

Publications (1)

Publication Number Publication Date
JP2011180470A true JP2011180470A (ja) 2011-09-15

Family

ID=44691992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010046113A Pending JP2011180470A (ja) 2010-03-03 2010-03-03 音声可視化装置

Country Status (1)

Country Link
JP (1) JP2011180470A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013072554A2 (en) * 2011-11-17 2013-05-23 Nokia Corporation Spatial visual effect creation and display such as for a screensaver
WO2013079781A1 (en) * 2011-11-30 2013-06-06 Nokia Corporation Apparatus and method for audio reactive ui information and display
JP2014085386A (ja) * 2012-10-19 2014-05-12 Jvc Kenwood Corp 音声情報表示装置、音声情報表示方法およびプログラム
JP2014086759A (ja) * 2012-10-19 2014-05-12 Jvc Kenwood Corp 音声情報表示装置、音声情報表示方法およびプログラム
US10148903B2 (en) 2012-04-05 2018-12-04 Nokia Technologies Oy Flexible spatial audio capture apparatus
CN113329314A (zh) * 2020-02-28 2021-08-31 日本电产株式会社 声源可视化装置和声源可视化程序

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013072554A2 (en) * 2011-11-17 2013-05-23 Nokia Corporation Spatial visual effect creation and display such as for a screensaver
WO2013072554A3 (en) * 2011-11-17 2013-07-11 Nokia Corporation Spatial visual effect creation and display such as for a screensaver
US9285452B2 (en) 2011-11-17 2016-03-15 Nokia Technologies Oy Spatial visual effect creation and display such as for a screensaver
WO2013079781A1 (en) * 2011-11-30 2013-06-06 Nokia Corporation Apparatus and method for audio reactive ui information and display
US20140337741A1 (en) * 2011-11-30 2014-11-13 Nokia Corporation Apparatus and method for audio reactive ui information and display
US10048933B2 (en) * 2011-11-30 2018-08-14 Nokia Technologies Oy Apparatus and method for audio reactive UI information and display
US10148903B2 (en) 2012-04-05 2018-12-04 Nokia Technologies Oy Flexible spatial audio capture apparatus
US10419712B2 (en) 2012-04-05 2019-09-17 Nokia Technologies Oy Flexible spatial audio capture apparatus
JP2014085386A (ja) * 2012-10-19 2014-05-12 Jvc Kenwood Corp 音声情報表示装置、音声情報表示方法およびプログラム
JP2014086759A (ja) * 2012-10-19 2014-05-12 Jvc Kenwood Corp 音声情報表示装置、音声情報表示方法およびプログラム
CN113329314A (zh) * 2020-02-28 2021-08-31 日本电产株式会社 声源可视化装置和声源可视化程序

Similar Documents

Publication Publication Date Title
JP7389081B2 (ja) 三次元拡張オーディオを提供するシステム及び方法
JP5082327B2 (ja) 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
US7881479B2 (en) Audio processing method and sound field reproducing system
US20150186109A1 (en) Spatial audio user interface apparatus
JP2011180470A (ja) 音声可視化装置
JP2008226400A (ja) オーディオ再生装置およびオーディオ再生方法
KR20070010589A (ko) 턴테이블이 구비되는 이동통신 단말기 및 그 동작방법
US9082382B2 (en) Musical performance apparatus and musical performance program
KR20140053867A (ko) 뼈 전도 변환기와 사용자 인터페이스를 제어하기 위한 시스템 및 장치
JP3823847B2 (ja) 音制御装置、音制御方法、プログラムおよび記録媒体
US8779267B2 (en) Musical performance apparatus
EP2660815B1 (en) Methods and apparatus for audio processing
JP6646116B2 (ja) 映像音声処理プログラム及びゲーム装置
JP6222964B2 (ja) 電子機器、電子システム、音響機器、電子機器の制御方法およびプログラム
JP6154597B2 (ja) 情報処理プログラム、情報処理装置、情報処理システム、および情報処理方法
JP4426159B2 (ja) ミキシング装置
JP5439896B2 (ja) 録音装置および録音再生装置
US8163991B2 (en) Headphone metronome
JP2010278996A (ja) 音響再生システム、音響再生装置、及びそれらの制御方法
KR100661450B1 (ko) 복합 동영상 기기
JP6474292B2 (ja) カラオケ装置
JP7396029B2 (ja) 録音再生装置
US20120078399A1 (en) Sound processing device, sound fast-forwarding reproduction method, and sound fast-forwarding reproduction program
JP6969793B2 (ja) アンビソニックスのためのa/bフォーマット変換装置、a/bフォーマット変換ソフトウェア、レコーダー、再生ソフトウェア
JP2005051801A (ja) 音像定位装置