JPH10191498A - 音信号処理装置 - Google Patents

音信号処理装置

Info

Publication number
JPH10191498A
JPH10191498A JP8351419A JP35141996A JPH10191498A JP H10191498 A JPH10191498 A JP H10191498A JP 8351419 A JP8351419 A JP 8351419A JP 35141996 A JP35141996 A JP 35141996A JP H10191498 A JPH10191498 A JP H10191498A
Authority
JP
Japan
Prior art keywords
sound signal
sound
image
unit
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8351419A
Other languages
English (en)
Inventor
Taro Imagawa
太郎 今川
Michiyo Moriya
みち代 森家
Susumu Maruno
進 丸野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8351419A priority Critical patent/JPH10191498A/ja
Publication of JPH10191498A publication Critical patent/JPH10191498A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】 音到達遅延時間に基づいて音信号を新たに合
成することにより、マイクの設置場所を変えずにマイク
から離れた音源の音を選択的に集音および活用すること
ができる音信号処理装置を提供する。 【解決手段】 音記録部101〜10nにより複数の異
なる位置における音信号を記録し、音記録座標記憶部4
により音記録部101〜10nが音信号を記録する位置
座標を記憶する。次に、位置座標指定部5が出力する位
置座標と音記録座標記憶部4が記憶する位置座標とに基
づいて、遅延時間算出部3により音到達遅延時間を算出
し、遅延時間算出部3が算出した音到達遅延時間に基づ
いて、音信号合成部2により音記録部101〜10nが
記録した音信号から新たな音信号を合成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音を選択的に集音
し、伝送し、記録し、または活用する音信号処理装置に
関するものである。
【0002】
【従来の技術】音を選択的に集音して利用する従来の音
信号処理装置として、例えば、特開平5−56426号
公報に開示されるカメラコントロール回路がある。この
カメラコントロール回路では、テレビ会議において話者
の各席にマイクを設置し、このマイクの音圧を監視する
ことで、音圧がある基準以上になったマイクについて、
音を集音および送信していた。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の音信号処理装置では、マイク付近の音を集音するた
め、マイクから離れた音源の音が必要になった場合に直
ちに対応することができないという課題を有していた。
すなわち、話者が席から移動した場合や新たな話者を追
加する場合においては、マイクの移動、マイクの向きの
調整、マイクの追加などが必要になるという問題があっ
た。
【0004】本発明は、上記の課題を解決するため、音
到達遅延時間に基づいて音信号を新たに合成することに
より、マイクの設置場所を変えずにマイクから離れた音
源の音を選択的に集音および活用することができる音信
号処理装置を提供することを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するた
め、本発明による音信号処理装置は、複数の異なる位置
における音信号を記録する音記録手段と、音記録手段が
記録した複数の音信号から新たな音信号を合成する音信
号合成手段と、位置座標を指定する位置座標指定手段
と、音記録手段が音信号を記録する位置座標を記憶する
音記録座標記憶手段と、位置座標指定手段が出力する位
置座標と音記録座標記憶手段が記憶する位置座標とに基
づいて音到達遅延時間を算出する遅延時間算出手段とを
備え、音信号合成手段は、遅延時間算出手段が算出した
音到達遅延時間に基づいて音記録手段が記録した複数の
音信号から新たな音信号を合成する。
【0006】上記の構成により、遅延時間算出手段が指
定された位置座標からの音到達遅延時間を算出し、音合
成手段が音到達遅延時間に基づいて音信号を新たに合成
することができるので、3次元的に連続的な音の追随が
可能となる。したがって、マイクの設置場所を変えずに
マイクから離れた音源の音を選択的に集音および活用す
ることができる。
【0007】また、音信号合成手段は、遅延時間算出手
段が算出した音到達遅延時間に基づいて音記録手段が記
録した音信号を遅延させる遅延手段と、遅延手段が遅延
させた音信号を合成する合成手段とを含むことが好まし
い。この場合、指定された位置座標に応じて遅延させた
音信号を合成することができる。
【0008】また、遅延時間算出手段は、音記録座標記
憶手段が記憶する位置座標と位置座標指定手段が指定す
る位置座標との距離を算出する距離算出手段と、距離算
出手段が算出した距離に基づいて音到達遅延時間を算出
する遅延算出手段とを含むことが好ましい。この場合、
音記録座標記憶手段が記憶する位置座標と位置座標指定
手段が指定する位置座標との間の距離を算出し、算出し
た距離に基づいて音到達遅延時間を高精度に算出するこ
とができる。
【0009】また、音信号合成手段が合成した音信号が
あらかじめ定めた基準を満たすか否かを判断する音信号
判断手段をさらに含み、位置座標指定手段は、音信号判
断手段の判断結果に基づいて新たな位置座標を指定する
ことが好ましい。この場合、。ユーザが所望の基準を定
めることができ、この基準に基づいて新たな位置座標を
指定することができる。
【0010】また、音信号判断手段は、音信号合成手段
が合成した音信号の音圧強度を基準として、音信号合成
手段が合成した音信号があらかじめ定めた基準を満たす
か否かを判断することが好ましい。この場合、音信号の
判断処理を簡素化することができる。
【0011】また、音信号判断手段は、音信号合成手段
が合成した音信号のスペクトル分布形状を基準として、
音信号合成手段が合成した音信号があらかじめ定めた基
準を満たすか否かを判断することが好ましい。この場
合、音信号をより詳細に区分することができる。
【0012】また、位置座標指定手段は、一ヶ所または
複数ヶ所における物体の位置を計測する位置計測手段
と、位置計測手段が計測した位置に基づいて位置座標を
決定する座標決定手段とを含むことが好ましい。この場
合、物体の位置を計測することにより、集音した音信号
からだけでは困難な音源の位置を容易に特定することが
できる。
【0013】また、位置計測手段は、一ヶ所または複数
ヶ所の赤外線の強度を計測する赤外線センサを含み、座
標決定手段は、赤外線センサにより計測された赤外線の
強度があらかじめ定めた基準を満たす位置座標を決定す
ることが好ましい。この場合、赤外線センサにより、特
定波長の赤外線を放出する人体などを特異的に検出で
き、人や音源の位置を測定することができる。
【0014】また、位置計測手段は、一ヶ所または複数
ヶ所の圧力を計測する圧力センサを含み、座標決定手段
は、圧力センサにより計測された圧力があらかじめ定め
た基準を満たす位置座標を決定することが好ましい。こ
の場合、例えば、圧力センサを床面に設け、人の存在に
よる圧力を検知して人の存在する位置が得られ、人や音
源の位置を測定することができる。
【0015】また、位置計測手段は、一ヶ所または複数
ヶ所の超音波の強度を計測する超音波センサを含み、座
標決定手段は、超音波センサにより計測された超音波の
強度があらかじめ定めた基準を満たす位置座標を決定す
ることが好ましい。この場合、超音波センサにより、近
距離に人が存在する場合に人の存在を検知することがで
き、人や音源の位置を測定することができる。
【0016】また、位置座標指定手段は、ユーザの指示
に応じた位置座標を指定することが好ましい。この場
合、ユーザの指示に応じた位置座標からの音到達遅延時
間を算出し、この音到達遅延時間をもとに音信号を新た
に合成することができる。
【0017】また、位置座標指定手段は、ユーザが所望
の座標を入力するための座標入力手段を含み、位置座標
指定手段は、座標入力手段により入力された座標に基づ
いて位置座標を指定することが好ましい。この場合、ユ
ーザの所望の位置座標からの音到達遅延時間を算出し、
この音到達遅延時間をもとに音信号を新たに合成するこ
とができる。
【0018】また、位置座標指定手段が指定する位置座
標を表示する画像を合成する画像合成手段と、画像合成
手段により合成された画像を表示する画像表示手段とを
さらに含むことが好ましい。この場合、対象位置の確認
が容易となる。
【0019】また、位置座標指定手段が指定する位置座
標を含む領域の画像を入力するための画像入力手段をさ
らに含み、画像合成手段は、画像入力手段により入力さ
れた画像に、位置座標指定手段が指定する位置座標を表
示する画像を合成することが好ましい。この場合、指定
された位置座標を含む領域の画像に、指定された位置座
標を表示する画像が合成されているので、対象位置の確
認がさらに容易となる。
【0020】また、画像入力手段は、画像を撮像する撮
像手段と、撮像手段が撮像した画像を記憶する画像記憶
手段とを含み、画像入力手段は、画像記憶手段が記憶し
ている画像を出力することが好ましい。この場合、撮像
した画像を記憶しているので、ユーザは所望の画像を何
度でも再生することができる。
【0021】また、画像入力手段は、位置座標指定手段
が指定する位置座標を用いて、入力する画像を変更する
ことが好ましい。この場合、指定された位置座標の位置
がわかりやすくなるように入力する画像を変更すること
ができるので、音の選択を容易に行うことができる。
【0022】また、画像入力手段は、位置座標指定手段
が指定する位置座標を用いて、入力する画像を拡大、縮
小、移動、および焦点変更のうち少なくとも一つの処理
を行うことが好ましい。この場合、指定された位置座標
の位置がわかりやすくなるように入力する画像を拡大、
縮小、移動、または焦点変更することができるので、音
の選択をさらに容易に行うことができる。
【0023】また、位置座標指定手段は、画像入力手段
が入力する画像を用いて位置座標を指定することが好ま
しい。この場合、位置座標を容易に指定できる。また、
比較画像を記憶する比較画像記憶手段と、比較画像記憶
手段が記憶している比較画像と画像入力手段が入力する
画像との差分画像を生成する画像差分手段とをさらに含
み、位置座標指定手段は、画像差分手段が出力する差分
画像を用いて位置座標を指定することが好ましい。この
場合、例えば、1フレーム前に入力した画像を用い、フ
レーム間で変化が生じた位置を新しい位置座標とし、動
きのある人などの位置を効率よく検出することができ
る。
【0024】また、音信号合成手段が合成した音信号を
送信する音信号送信手段をさらに含むことが好ましい。
この場合、有線または無線の経路に対して、合成した音
信号を送信することができる。
【0025】また、音信号送信手段が送信する音信号を
受信する音信号受信手段と、音信号受信手段が受信した
音信号を再生して出力する音信号出力手段とをさらに含
むことが好ましい。この場合、送信された音信号を受信
して音信号を再構成して可聴な音に変換することができ
る。
【0026】また、音記録手段が記録した音信号を記憶
する音信号記憶手段をさらに含み、音信号合成手段は、
音信号記憶手段が記憶した音信号から新たな音信号を合
成することが好ましい。この場合、音信号を記憶してお
くことにより、ユーザは、望みの音を何度でも再生で
き、また、同じ時刻の異なる位置の音を再現することが
できる。
【0027】また、ユーザが位置座標を入力するための
位置座標入力手段と、位置座標入力手段により入力され
た位置座標を送信する位置座標送信手段と、位置座標送
信手段が送信した位置座標を受信する位置座標受信手段
とをさらに含み、位置座標指定手段は、位置座標受信手
段が受信した位置座標に基づいて新たな位置座標を指定
することが好ましい。この場合、ユーザが所望の位置座
標を指定することができる。
【0028】また、位置座標指定手段が指定した位置座
標を送信する位置情報送信手段と、位置情報送信手段が
送信した位置座標を受信する位置情報受信手段とをさら
に含み、画像合成手段は、位置情報受信手段が受信した
位置座標に基づいて画像を合成することが好ましい。こ
の場合、位置座標指定手段が指定した位置座標に基づい
て画像を合成することができ、対象位置の確認が容易と
なる。
【0029】また、画像入力手段が入力した画像を送信
する画像送信手段と、画像送信手段が送信した画像を受
信する画像受信手段とをさらに含み、画像合成手段は、
画像受信手段が受信した画像と位置座標指定手段が指定
する位置座標とを用いて画像を合成することが好まし
い。この場合、画像受信手段が受信した画像と位置座標
指定手段が指定した位置座標とに基づいて画像を合成す
ることができ、対象位置の確認がさらに容易となる。
【0030】また、音信号合成手段が合成した音信号を
用いて音声認識を行う音声認識手段をさらに含むことが
好ましい。この場合、音声認識の対象となる人間の発話
位置等が移動するとき、音記録手段の位置を移動せず
に、発話位置等を滑らかに追跡することができ、効率良
く認識対象の音声を追跡できるとともに、発話者にマイ
クの存在を感じさせにくくすることができる。
【0031】
【発明の実施の形態】以下、本発明の各実施の形態につ
いて図面を参照して説明する。図1は、本発明の第一の
実施の形態の音信号処理装置の構成を示すブロック図で
ある。
【0032】図1を参照して、音信号処理装置は、音記
録部101〜10n、音信号合成部2、遅延時間算出部
3、音記録座標記憶部4、位置座標指定部5、音信号判
断部6、画像合成部7、画像表示部8、画像入力部9、
音信号送信部12、音信号受信部13、音信号出力部1
4、位置座標送信部16、位置座標受信部17、位置情
報送信部18、位置情報受信部19、画像送信部20、
画像受信部21、位置座標入力部23を含む。
【0033】また、図2は、図1に示す音信号合成部2
の一例の構成を示すブロック図である。図2を参照し
て、音信号合成部2は、遅延部2a、合成部2bを含
む。図3は、図1に示す遅延時間算出部3の一例の構成
を示すブロック図である。図3を参照して、遅延時間算
出部3は、距離算出部3a、遅延算出部3bを含む。図
4は、図1に示す位置座標指定部5の一例の構成を示す
ブロック図である。図4を参照して、位置座標指定部5
は、位置計測部5a、座標入力部5b、座標決定部5c
を含む。
【0034】次に、図1ないし図4を用いて、本実施の
形態の音信号処理装置の動作について説明する。音記録
部101〜10nは、複数の異なる位置に設置され、音
を同時に集音する。音記録座標記憶部4は、音記録部1
01〜10nがそれぞれ音を記録する位置の座標を記憶
する。音記録部101〜10nの配置としては、例え
ば、図5の(a)〜(c)のような配置が可能である。
図5の(a)は直線上に配置したもの、(b)は円周上
に配置したもの、(c)は2次元格子点上に配置したも
のである。他に3次元的な配置も可能であり、球面上へ
の配置、直方体表面上への配置、3次元格子点上への配
置などでもよい。
【0035】音信号合成部2は、音記録部101〜10
nが記録した複数の音信号から新たな音信号を合成す
る。具体的には、遅延部2aは、遅延時間算出部3が算
出した音到達遅延時間に基づいて、音記録部101〜1
0nの記録した音信号を遅延させ、合成部2bは、遅延
部2aが遅延させた音信号を合成して新しい音信号を合
成する。
【0036】例えば、遅延時間算出部3が、音記録部1
01が記録した音信号を基準として、音記録部102が
記録した音信号に対する音到達遅延時間を1msとして
算出した場合、遅延部2aは、音記録部102が記録し
た音信号を1ms遅らせる。次に、合成部2bは、音記
録部101が記録した音信号と音記録部102が記録し
た音信号を1ms遅らせた信号とを加算する。
【0037】上記のようにして、全ての音記録部101
〜10nの記録した音信号について加算した後、加算し
た信号を音記録部101〜10nの個数nで割り、新た
な音信号とする。このように遅延を持たせて音信号を加
算平均することで各音信号に含まれる特定の位相成分を
強調することができる。なお、上記の例では音信号の合
成方法として加算平均を用いているが、重み付けの加算
平均や、条件付きの加算平均などを用いてもよい。ま
た、合成前の音信号にローパスフィルタ、ハイパスフィ
ルタ、バンドパスフィルタなどを用いて、あらかじめ不
要な周波数成分を低減しておいてもよい。
【0038】音信号判断部6は、音信号合成部2が合成
した信号があらかじめ定めた基準を満たすか否かを判断
する。例えば、音信号判断部6は、音信号合成部2が合
成した信号についてあらかじめ定めた時間、例えば、過
去100ms間にわたる平均強度を求め、この平均強度
があらかじめ定めた基準以上の場合は1を出力し、それ
以外の場合は0を出力する。
【0039】このとき、平均強度を求める代わりに特定
の周波数成分の強度などを用いてもよい。また、信号の
強度を基準値と比較する代わりに、音合成部2が合成し
た音信号のスペクトルパタンを算出し、このスペクトル
パタンがあらかじめ定めたスペクトル分布形状と一致し
た場合に音信号判断部6が1を出力し、一致しない場合
には0を出力するようにしてもよい。前者のように音信
号判断部6が合成音信号の強度を基準とする場合は、簡
素な判断処理が可能であり、後者のように合成音信号の
スペクトル分布形状を基準とする場合は、判断処理は複
雑になるが音信号のより詳細な区別が可能となる。
【0040】位置座標指定部5の位置計測部5aは、人
や音源の位置を計測する。例えば、位置計測部5aは、
赤外線センサを備え、一ヶ所または複数の位置の赤外線
強度を計測し、赤外線強度があらかじめ定めた基準値以
上の位置座標を出力する。位置の計測には、赤外線セン
サ以外に圧力センサや超音波センサなどを使ってもよ
い。
【0041】例えば、位置の計測に圧力センサを用いた
場合、床面に圧力センサを配置し、一ヶ所または複数の
位置の圧力を計測して、床にかかる圧力があらかじめ定
めた基準値以上の位置座標を出力する。また、超音波距
離センサを用いた場合は、超音波を用いて、一ヶ所また
は複数の位置までの距離を計測し、距離があらかじめ定
めた基準値以下の場合にその位置座標を出力する。
【0042】座標入力部5bは、位置座標指定部5の外
部から入力される位置を示す情報に基づいて位置座標を
出力する。座標決定部5cは、位置計測部5a、座標入
力部5b、および音信号判断部6からの入力に基づいて
新たな座標を決定する。座標決定部5cは、座標入力部
5bからの位置座標の入力がある場合には、その位置座
標を新たな位置座標として決定する。一方、座標入力部
5bからの位置座標の入力が無い場合には、音信号判断
部6が1を出力していれば過去に決定した位置座標と同
じ値を新たな位置座標として決定し、音信号判断部6が
0を出力していれば位置計測部5aが出力する位置座標
を新たな位置座標として決定する。
【0043】遅延時間算出部3は、音記録座標記憶部4
が記憶する位置座標と位置座標指定部5が指定する位置
座標とを用いて、位置座標指定部5が指定する位置座標
から音記録座標記憶部4が記憶する位置までの音の到達
時間の差、すなわち音到達遅延時間を計算する。音信号
合成部2は、再度新しい音到達遅延時間を用いて音信号
の合成を行う。
【0044】具体的には、遅延時間算出部3において、
距離算出部3aは、位置座標指定部5の指定する位置座
標と音記録座標記憶部4が記憶するn個の位置座標との
間の距離をそれぞれ計算する。次に、遅延時間算出部3
は、距離算出部3aが算出した距離と音速とを用いて、
位置座標指定部5の指定する位置から音記録座標記憶部
4が記憶するn個の位置までの音到達遅延時間を算出す
る。
【0045】例えば、距離算出部3aが算出する距離と
して、位置座標指定部5の指定する位置から音記録部1
01の記録位置までの距離が4mで、位置座標指定部5
の指定する位置から音記録部102の記録位置までの距
離を10mとする。この場合、遅延算出部3bは、音記
録部101を基準として音記録部102の音到達遅延時
間として両者の距離の差6mを音速で割った値を音記録
部102に対する音到達遅延時間とする。
【0046】音信号送信部12は、有線または無線の経
路に対して、音信号合成部2が合成した音信号を送信
し、音信号受信部13は、音信号送信部12が送信した
音信号を受信して音信号を再構成する。次に、音信号出
力部14は、音信号受信部13が再構成した音信号を可
聴な音に変換する。
【0047】画像入力部9は、位置座標指定部5が指定
する位置座標に対応する位置を含む領域の画像を入力す
る。また、画像入力部9は、必要に応じて位置座標指定
部5が指定する位置を含むように、画像の拡大、縮小、
移動、焦点の変更を行う。なお、画像を入力するカメラ
は複数でもよく、必要に応じて複数のカメラからの画像
を切り替えてもよい。
【0048】画像送信部20は、有線または無線の経路
に対して、画像入力部9が入力した画像を送信し、画像
受信部21は、画像送信部20が送信した画像を受信す
る。また、位置情報送信部18は、有線または無線の経
路に対して、位置座標指定部5が指定した位置座標の情
報を送信し、位置情報受信部19は、位置情報送信部1
8が送信した位置座標の情報を受信する。画像合成部7
は、画像受信部21が受信した画像上に位置情報受信部
19が受信した位置を示す印を加えた画像を合成する。
画像表示部8は、画像合成部7が合成した画像を表示す
る。
【0049】位置座標入力部23は、ユーザが指示する
座標を入力とする。位置座標送信部16は、有線または
無線の経路に対して、位置座標入力部23で入力した位
置座標を送信し、位置座標受信部17は、位置座標送信
部16が送信した位置座標を受信する。位置座標指定部
5において、座標入力部5bは、位置座標受信部17の
受信した位置座標を入力とする。
【0050】次に、上記のように構成された音信号処理
装置において、ユーザを含めた動作を説明する。この場
合、ユーザは、音源と離れた位置から遠隔的に所望の音
を得ることを目的とする。
【0051】画像入力部9で入力した画像は、画像送信
部20、画像受信部21、画像合成部7、および画像表
示部8を通してユーザに伝わる。ここで、位置座標指定
部5が指定する位置は、画像合成部7が画像上に所定の
印として合成し、画像表示部8が表示する。このような
画像の合成により対象位置の確認が容易になる。
【0052】また、ユーザが任意に位置座標指定部5の
指定する位置座標を変更する場合は、位置座標入力部2
3(例えば、マウス、キーボード、音声、タッチパネル
など)により座標を指定し、指定された座標の座標値
を、位置座標送信部16および位置座標受信部17を通
じて位置座標指定部5に送る。位置座標指定部5は、座
標入力部5bに座標の入力があった場合には、その座標
を次に指定する位置座標とする。
【0053】次に、遅延時間算出部3は、位置座標指定
部5が指定した位置座標と音記録座標記憶部4が記憶す
る位置座標とに基づいて音到達遅延時間を算出し、音信
号合成部2は、算出された音到達遅延時間に基づいて音
記録部101〜10nで記録した音信号に時間的な遅延
を加えて加算する。すなわち、位置座標指定部5が指定
する位置と音記録部101〜10nとの距離に応じた音
到達遅延時間を音信号に加えて、各信号を加算すること
により、音信号合成部2において位置座標指定部5の指
定する位置からある時刻に発生した音を同じタイミング
で加算することになる。この結果、位置座標指定部5が
指定する位置付近で発生する音を強調することができ
る。また、位置座標指定部5の指定する位置座標は、任
意に変更可能なため、音記録部101〜10nそのもの
を移動または追加することなく、目的とする音源を変更
または追跡することが可能となる。なお、合成した音信
号は、音信号送信部12、音信号受信部13、および音
信号出力部14を通じてユーザに伝わる。
【0054】一方、ユーザが位置座標を指定しない場合
は、位置測定部5aがセンサを用いて物体の位置を検出
する。位置測定部5aが赤外線センサを用いた場合、特
定波長の赤外線を放出する人体などを特異的に検出でき
る。したがって、音信号判断部6が、その位置において
基準値以上の音圧であると判断することで、発話者の位
置を自動的に検知し、音を選択的に集音することが可能
となる。
【0055】また、音圧を基準とする代わりに、音のス
ペクトルパタンを調べ、人間の発話スペクトルと比較す
ることで、人間の発話か否かを精度良く判断することも
可能である。また、圧力センサを床面に設けた場合に
も、人の存在による圧力を検知して人の存在する位置が
得られる。さらに、超音波距離センサを用いた場合も、
近距離に人が存在する場合に人の存在を検知することが
可能である。このように、位置測定部5aを用いること
で、集音した音信号からだけでは困難な音源の位置を特
定することが容易になる。
【0056】また、画像入力部9は、位置座標指定部5
が指定する位置座標の位置がわかりやすいように、入力
画像を拡大、縮小、移動、または焦点変更することで目
的とする音の選択を容易にすることができる。
【0057】次に、本発明の第二の実施の形態について
図面を参照して説明する。図6は、本発明の第二の実施
の形態の音信号処理装置の構成を示すブロック図であ
る。図6に示す音信号処理装置と図1に示す音信号処理
装置とで異なる点は、音信号記憶部15がさらに付加さ
れ、画像入力部9aが撮像部9bおよび画像記憶部9c
を含む点である。その他の部分は、図1に示す音信号処
理装置と同様であるので、以下詳細な説明は省略する。
【0058】音信号記憶部15は、音記録部101〜1
0nで記録した音信号を記憶し、音信号の記録後いつで
も、音信号合成部2は、所望の音信号を得ることができ
る。撮像部9bは、位置座標指定部5が指定する座標を
含む領域を撮像し、画像記憶部9cは、撮像部9bが撮
像した画像を記憶する。本実施の形態における基本的な
動作は、第一の実施の形態と同様であるが、音信号およ
び画像を記録しておくことにより、ユーザは、望みの音
を何度でも再生でき、また、同じ時刻の異なる位置の音
を再現することが可能となる。
【0059】次に、本発明の第三の実施の形態について
図面を参照して説明する。図7は、本発明の第三の実施
の形態の音信号処理装置の構成を示すブロック図であ
る。図7に示す音信号処理装置と図1に示す音信号処理
装置とで異なる点は、画像差分部10および比較画像記
憶部11がさらに付加された点である。その他の部分
は、図1に示す音信号処理装置と同様であるので、以下
詳細な説明は省略する。
【0060】本実施の形態における基本的な動作は、第
一の実施の形態と同様であるが、以下の点が異なる。比
較画像記憶部11は、画像入力部9が撮像する領域の背
景画像(比較画像)を記憶し、画像差分部10は、比較
画像記憶部11が記憶する画像と画像入力部9が撮像す
る画像との差(差分画像)を求める。位置座標指定部5
において、位置計測部5aは、差分画像の中で画像の差
の大きい位置の座標を新しい位置座標とする。したがっ
て、背景画像では存在しない人の映像などが検出でき、
効率よく音源の位置を推定することが可能となる。
【0061】また、比較画像記憶部11が記憶する画像
として、1フレーム前に画像入力部9が入力した画像を
用いることも可能で、この場合はフレーム間で変化が生
じた位置を位置計測部5aが新しい座標とする。この結
果、動きのある人などの位置を効率よく検出することが
可能となる。
【0062】次に、本発明の第四の実施の形態について
図面を参照して説明する。図8は、本発明の第四の実施
の形態の音信号処理装置の構成を示すブロック図であ
る。図8に示す音信号処理装置と図1に示す音信号処理
装置とで異なる点は、音信号送信部12等の代りに音声
認識部22が具備された点である。その他の部分は、図
1に示す音信号処理装置と同様であるので、以下詳細な
説明は省略する。
【0063】本実施の形態における各ブロックの動作
は、第一の実施の形態と同様であるが、音声認識部22
は、音信号合成部2が合成した音信号を用いて音声認識
を行う。音声認識の手法としては、HMM(隠れマルコ
フモデル)、DP(ダイナミックプログラミング)マッ
チング、ベクトル量子化などを用いることができる。
【0064】本実施の形態では、単一のマイクを用いた
音声認識システムとは異なり、音声認識の対象となる人
間の発話位置が移動するとき、音記録部101〜10n
(マイクなど)の位置を移動せずに、発話位置を滑らか
に追跡することができる。したがって、効率良く認識対
象の音声を追跡できるとともに、発話者にマイクの存在
を感じさせにくいシステムを提供することが可能とな
る。
【0065】以上のように、上記の各実施の形態では、
位置座標指定部5がユーザの指示または音源位置の推定
にしたがって位置座標を指定し、遅延時間算出部3が指
定された位置座標からの音到達遅延時間を算出し、音信
号合成部2が音到達遅延時間をもとに音信号を新たに合
成することで、3次元的に連続的な音の追随を可能とす
る。また、位置座標指定部5が自動的に音源を推定する
ことにより、必ずしもユーザが詳細な位置座標の指定を
行わなくても、適切な音源位置を選択することが可能と
なる。
【0066】このように、位置座標指定部5が指定する
位置座標を変えるごとに音を合成することで、限られた
音情報から数多くの種類の音を自由に取り出すことが可
能なため、ネットワークを通じた音情報の提供システム
などにも非常に有効である。したがって、音記録部10
1〜10nが記録するすべての音信号を残しておけば、
事後に任意の場所の音の提供も可能となる。また、位置
座標指定部5が複数の位置座標を指定することで、同時
に複数の位置の音を再生することも可能である。
【0067】また、マイクの移動無しに選択位置の移動
が可能で、機械的な可動部も不要なため、装置のメンテ
ナンスの負担も大きく軽減することが可能となる。特
に、音声を入力とする場合、人にマイクの移動を意識さ
せないため、ユーザの精神的負担が少ないTV会議シス
テム、TV電話、音声認識システム等を構築することが
可能となる。
【0068】このように、上記の各実施の形態では、音
記録部101〜10nの設置場所を変えずに、ユーザが
離れた音源の音を選択的に集音および活用することがで
きる。なお、上記の各実施の形態におけるの各ブロック
部は、ハードウェアを用いて構成してもよいし、コンピ
ュータ上のソフトウェアを用いて実現してもよい。
【0069】
【発明の効果】本発明によれば、遅延時間算出手段が指
定された位置座標からの音到達遅延時間を算出し、音合
成手段が音到達遅延時間に基づいて音信号を新たに合成
することができるので、3次元的に連続的な音の追随が
可能となり、マイクの設置場所を変えずにマイクから離
れた音源の音を選択的に集音および活用することができ
る。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態による音信号処理装
置の構成を示すブロック図
【図2】図1に示す音信号処理装置の音信号合成部の一
例の構成を示すブロック図
【図3】図1に示す音信号処理装置の遅延時間算出部の
一例の構成を示すブロック図
【図4】図1に示す音信号処理装置の位置座標指定部の
一例の構成を示すブロック図
【図5】図1に示す音信号処理装置の音記録部の配置例
を示す図
【図6】本発明の第二の実施の形態による音信号処理装
置の構成を示すブロック図
【図7】本発明の第三の実施の形態による音信号処理装
置の構成を示すブロック図
【図8】本発明の第四の実施の形態による音信号処理装
置の構成を示すブロック図
【符号の説明】
101〜10n 音記録部 2 音信号合成部 3 遅延時間算出部 4 音記録座標記憶部 5 位置座標指定部 6 音信号判断部 7 画像合成部 8 画像表示部 9 画像入力部 12 音信号送信部 13 音信号受信部 14 音信号出力部 16 位置座標送信部 17 位置座標受信部 18 位置情報送信部 19 位置情報受信部 20 画像送信部 21 画像受信部 23 位置座標入力部

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 複数の異なる位置における音信号を記録
    する音記録手段と、前記音記録手段が記録した複数の音
    信号から新たな音信号を合成する音信号合成手段と、位
    置座標を指定する位置座標指定手段と、前記音記録手段
    が音信号を記録する位置座標を記憶する音記録座標記憶
    手段と、前記位置座標指定手段が出力する位置座標と前
    記音記録座標記憶手段が記憶する位置座標とに基づいて
    音到達遅延時間を算出する遅延時間算出手段とを備え、 前記音信号合成手段は、前記遅延時間算出手段が算出し
    た音到達遅延時間に基づいて前記音記録手段が記録した
    複数の音信号から新たな音信号を合成する音信号処理装
    置。
  2. 【請求項2】 前記音信号合成手段は、前記遅延時間算
    出手段が算出した音到達遅延時間に基づいて前記音記録
    手段が記録した音信号を遅延させる遅延手段と、前記遅
    延手段が遅延させた音信号を合成する合成手段とを含む
    請求項1記載の音信号処理装置。
  3. 【請求項3】 前記遅延時間算出手段は、前記音記録座
    標記憶手段が記憶する位置座標と前記位置座標指定手段
    が指定する位置座標との距離を算出する距離算出手段
    と、前記距離算出手段が算出した距離に基づいて音到達
    遅延時間を算出する遅延算出手段とを含む請求項1また
    は請求項2記載の音信号処理装置。
  4. 【請求項4】 前記音信号合成手段が合成した音信号が
    あらかじめ定めた基準を満たすか否かを判断する音信号
    判断手段をさらに含み、 前記位置座標指定手段は、前記音信号判断手段の判断結
    果に基づいて新たな位置座標を指定する請求項1から請
    求項3までのいずれか一項記載の音信号処理装置。
  5. 【請求項5】 前記音信号判断手段は、前記音信号合成
    手段が合成した音信号の音圧強度を基準として、前記音
    信号合成手段が合成した音信号があらかじめ定めた基準
    を満たすか否かを判断する請求項4記載の音信号処理装
    置。
  6. 【請求項6】 前記音信号判断手段は、前記音信号合成
    手段が合成した音信号のスペクトル分布形状を基準とし
    て、前記音信号合成手段が合成した音信号があらかじめ
    定めた基準を満たすか否かを判断する請求項4または請
    求項5記載の音信号処理装置。
  7. 【請求項7】 前記位置座標指定手段は、一ヶ所または
    複数ヶ所における物体の位置を計測する位置計測手段
    と、前記位置計測手段が計測した位置に基づいて位置座
    標を決定する座標決定手段とを含む請求項1から請求項
    6までのいずれか一項記載の音信号処理装置。
  8. 【請求項8】 前記位置計測手段は、一ヶ所または複数
    ヶ所の赤外線の強度を計測する赤外線センサを含み、 前記座標決定手段は、前記赤外線センサにより計測され
    た赤外線の強度があらかじめ定めた基準を満たす位置座
    標を決定する請求項7記載の音信号処理装置。
  9. 【請求項9】 前記位置計測手段は、一ヶ所または複数
    ヶ所の圧力を計測する圧力センサを含み、 前記座標決定手段は、前記圧力センサにより計測された
    圧力があらかじめ定めた基準を満たす位置座標を決定す
    る請求項7または請求項8記載の音信号処理装置。
  10. 【請求項10】 前記位置計測手段は、一ヶ所または複
    数ヶ所の超音波の強度を計測する超音波センサを含み、 前記座標決定手段は、前記超音波センサにより計測され
    た超音波の強度があらかじめ定めた基準を満たす位置座
    標を決定する請求項7から請求項9までのいずれか一項
    記載の音信号処理装置。
  11. 【請求項11】 前記位置座標指定手段は、ユーザの指
    示に応じた位置座標を指定する請求項1から請求項10
    までのいずれか一項記載の音信号処理装置。
  12. 【請求項12】 前記位置座標指定手段は、ユーザが所
    望の座標を入力するための座標入力手段を含み、 前記位置座標指定手段は、前記座標入力手段により入力
    された座標に基づいて位置座標を指定する請求項11記
    載の音信号処理装置。
  13. 【請求項13】 前記位置座標指定手段が指定する位置
    座標を表示する画像を合成する画像合成手段と、前記画
    像合成手段により合成された画像を表示する画像表示手
    段とをさらに含む請求項1から請求項12までのいずれ
    か一項記載の音信号処理装置。
  14. 【請求項14】 前記位置座標指定手段が指定する位置
    座標を含む領域の画像を入力するための画像入力手段を
    さらに含み、 前記画像合成手段は、前記画像入力手段により入力され
    た画像に、前記位置座標指定手段が指定する位置座標を
    表示する画像を合成する請求項13記載の音信号処理装
    置。
  15. 【請求項15】 前記画像入力手段は、画像を撮像する
    撮像手段と、前記撮像手段が撮像した画像を記憶する画
    像記憶手段とを含み、 前記画像入力手段は、前記画像記憶手段が記憶している
    画像を出力する請求項14記載の音信号処理装置。
  16. 【請求項16】 前記画像入力手段は、前記位置座標指
    定手段が指定する位置座標を用いて、入力する画像を変
    更する請求項14または請求項15記載の音信号処理装
    置。
  17. 【請求項17】 前記画像入力手段は、前記位置座標指
    定手段が指定する位置座標を用いて、入力する画像を拡
    大、縮小、移動、および焦点変更のうち少なくとも一つ
    の処理を行う請求項14から請求項16までのいずれか
    一項記載の音信号処理装置。
  18. 【請求項18】 前記位置座標指定手段は、前記画像入
    力手段が入力する画像を用いて位置座標を指定する請求
    項14から請求項17までのいずれか一項記載の音信号
    処理装置。
  19. 【請求項19】 比較画像を記憶する比較画像記憶手段
    と、前記比較画像記憶手段が記憶している比較画像と前
    記画像入力手段が入力する画像との差分画像を生成する
    画像差分手段とをさらに含み、前記位置座標指定手段
    は、前記画像差分手段が出力する差分画像を用いて位置
    座標を指定する請求項14から請求項18までのいずれ
    か一項記載の音信号処理装置。
  20. 【請求項20】 前記音信号合成手段が合成した音信号
    を送信する音信号送信手段をさらに含む請求項1から請
    求項19までのいずれか一項記載の音信号処理装置。
  21. 【請求項21】 前記音信号送信手段が送信する音信号
    を受信する音信号受信手段と、前記音信号受信手段が受
    信した音信号を再生して出力する音信号出力手段とをさ
    らに含む請求項20記載の音信号処理装置。
  22. 【請求項22】 前記音記録手段が記録した音信号を記
    憶する音信号記憶手段をさらに含み、 前記音信号合成手段は、前記音信号記憶手段が記憶した
    音信号から新たな音信号を合成する請求項1から請求項
    21までのいずれか一項記載の音信号処理装置。
  23. 【請求項23】 ユーザが位置座標を入力するための位
    置座標入力手段と、前記位置座標入力手段により入力さ
    れた位置座標を送信する位置座標送信手段と、 前記位置座標送信手段が送信した位置座標を受信する位
    置座標受信手段とをさらに含み、 前記位置座標指定手段は、前記位置座標受信手段が受信
    した位置座標に基づいて新たな位置座標を指定する請求
    項1から請求項22までのいずれか一項記載の音信号処
    理装置。
  24. 【請求項24】 前記位置座標指定手段が指定した位置
    座標を送信する位置情報送信手段と、前記位置情報送信
    手段が送信した位置座標を受信する位置情報受信手段と
    をさらに含み、 前記画像合成手段は、前記位置情報受信手段が受信した
    位置座標に基づいて画像を合成する請求項13から請求
    項19までのいずれか一項記載の音信号処理装置。
  25. 【請求項25】 前記画像入力手段が入力した画像を送
    信する画像送信手段と、前記画像送信手段が送信した画
    像を受信する画像受信手段とをさらに含み、 前記画像合成手段は、前記画像受信手段が受信した画像
    と前記位置座標指定手段が指定する位置座標とを用いて
    画像を合成する請求項14から請求項19および請求項
    24のいずれか一項記載の音信号処理装置。
  26. 【請求項26】 前記音信号合成手段が合成した音信号
    を用いて音声認識を行う音声認識手段をさらに含む請求
    項1から請求項25までのいずれか一項記載の音信号処
    理装置。
JP8351419A 1996-12-27 1996-12-27 音信号処理装置 Pending JPH10191498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8351419A JPH10191498A (ja) 1996-12-27 1996-12-27 音信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8351419A JPH10191498A (ja) 1996-12-27 1996-12-27 音信号処理装置

Publications (1)

Publication Number Publication Date
JPH10191498A true JPH10191498A (ja) 1998-07-21

Family

ID=18417163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8351419A Pending JPH10191498A (ja) 1996-12-27 1996-12-27 音信号処理装置

Country Status (1)

Country Link
JP (1) JPH10191498A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007104546A (ja) * 2005-10-07 2007-04-19 National Institute Of Advanced Industrial & Technology 安全管理装置
JP2008278433A (ja) * 2007-05-07 2008-11-13 Casio Hitachi Mobile Communications Co Ltd 情報処理装置、プログラム
WO2015090039A1 (zh) * 2013-12-20 2015-06-25 华为技术有限公司 一种声音处理方法、装置及设备
JPWO2015170368A1 (ja) * 2014-05-09 2017-04-20 パナソニックIpマネジメント株式会社 指向性制御方法、記憶媒体及び指向性制御システム
JP2018023137A (ja) * 2017-09-12 2018-02-08 パナソニックIpマネジメント株式会社 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007104546A (ja) * 2005-10-07 2007-04-19 National Institute Of Advanced Industrial & Technology 安全管理装置
JP2008278433A (ja) * 2007-05-07 2008-11-13 Casio Hitachi Mobile Communications Co Ltd 情報処理装置、プログラム
WO2015090039A1 (zh) * 2013-12-20 2015-06-25 华为技术有限公司 一种声音处理方法、装置及设备
JPWO2015170368A1 (ja) * 2014-05-09 2017-04-20 パナソニックIpマネジメント株式会社 指向性制御方法、記憶媒体及び指向性制御システム
JP2018023137A (ja) * 2017-09-12 2018-02-08 パナソニックIpマネジメント株式会社 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム

Similar Documents

Publication Publication Date Title
JP5334037B2 (ja) 音源の位置検出方法及びシステム
US9749738B1 (en) Synthesizing audio corresponding to a virtual microphone location
US8532308B2 (en) Standing wave detection apparatus and method of controlling the same
CN104106267B (zh) 在增强现实环境中的信号增强波束成形
WO2000077537A1 (fr) Procede et appareil de determination d'une source sonore
JP2004528766A (ja) 音声/画像を用いて話者を感知し位置探しする方法及び装置
JP6609383B2 (ja) オーディオ、ビジュアル及びモーション分析を備えたデジタルカメラ
JP2000512108A (ja) 音源位置づけ方法と装置
JP5618043B2 (ja) 映像音響処理システム、映像音響処理方法及びプログラム
JP3714706B2 (ja) 音抽出装置
KR20020017576A (ko) 화상을 이용한 모션 캡처 시스템과 모션 캡처 방법
JP7303862B2 (ja) 映像音声信号処理装置、映像音声信号処理方法及び映像音声信号処理システム
JPH10191498A (ja) 音信号処理装置
KR20200020590A (ko) 시각화된 객체에서 특정영역의 소리를 추출하는 감시 카메라 시스템 및 그 동작 방법
JP3817878B2 (ja) 制御装置およびカラオケ装置
WO2020166324A1 (ja) 情報処理装置および方法、並びにプログラム
KR101155610B1 (ko) 음원 위치 표시 장치 및 그 방법
JP6456171B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH08181962A (ja) 音像定位方法および音像定位制御装置およびテレビ会議システム
JP7111103B2 (ja) 撮像システム、撮像装置及び撮像方法
JP3242006B2 (ja) スポット集音装置
WO2023054047A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2023048531A (ja) 情報処理装置、情報処理方法、プログラム、及び音響自動合成システム
JP6585547B2 (ja) 撮像システム、撮像方法
JP2003264897A (ja) 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム