JP4659556B2 - 音源方向検出装置 - Google Patents

音源方向検出装置 Download PDF

Info

Publication number
JP4659556B2
JP4659556B2 JP2005233621A JP2005233621A JP4659556B2 JP 4659556 B2 JP4659556 B2 JP 4659556B2 JP 2005233621 A JP2005233621 A JP 2005233621A JP 2005233621 A JP2005233621 A JP 2005233621A JP 4659556 B2 JP4659556 B2 JP 4659556B2
Authority
JP
Japan
Prior art keywords
sound
sound source
data
predetermined
direction detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005233621A
Other languages
English (en)
Other versions
JP2007047088A (ja
Inventor
克司 境
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005233621A priority Critical patent/JP4659556B2/ja
Publication of JP2007047088A publication Critical patent/JP2007047088A/ja
Application granted granted Critical
Publication of JP4659556B2 publication Critical patent/JP4659556B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

この発明は、音源の方向を検出する音源方向検出装置に関し、特に音が反響しやすい場所で音源方向検出を行う場合であっても、効率よくかつ正確に音源の方向を検出可能な音源方向検出装置に関するものである。
近年、音源の方向検出に関する研究は、様々な分野、例えば、テレビ会議システム等での話者方向の特定、移動ロボット等の音声認識システム、監視システム、騒音分析など、幅広い分野で行われている。
この音源の方向検出にかかわる技術の一例として、特許文献1では、音声データを複数のチャンネルから取り込み、取り込んだ複数の音声データに基づいて、発話の方向を検出すると共に、検出した発話の方向に応じて電子機器を制御するという技術が公開されている。
なお、特許文献2では、マイクなどの音声入力装置から取得した音声データにフィルタ処理を施し、音声データに含まれるノイズを取り除くことによって、精度よく音源方向を検出可能とする技術が公開されている。
特開2001−236093号公報 特開2001−45592号公報
しかしながら、上述した従来技術では、音声データを取得する場所の環境によって、正確に音源の方向を検出することができないという問題があった。
具体的には、音が反響しやすいホール内やトンネル内などで音源方向検出を行う場合には、ユーザから発せられた音声とホールの壁からの反響音とが重なり合ってしまい、音声と反響音とが判別できなくなってしまうため、正確に音源(この場合はユーザ)の方向を検出することができなかった。
なお、ホール内やトンネル内などで、音声と反響音とが重なり合った音データを解析し、音声と反響音とを分離させて音源方向検出を行うことも考えられるが、音声と反響音とを解析する計算コストが膨大なものとなってしまうため現実的ではない。
すなわち、音が反響しやすい場所で音源方向検出を行う場合であっても、効率よくかつ正確に音源の方向を検出することが極めて重要な課題となっている。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、音が反響しやすい場所で音源方向検出を行う場合であっても、効率よくかつ正確に音源の方向を検出することができる音源方向検索装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、発明にかかる音源方向検出装置は、音源の方向を検出する音源方向検出装置であって、前記音源から発せられた音の音声データを取得し、取得した音声データに所定の特徴を有する音が含まれるか否かを判定する判定手段と、前記音源から発せられた音を反響させる物体と前記音声入力手段との距離を計測し、該距離と前記音声データに基づいて、前記音源から発せられた音の反響音が前記音声入力手段へ到達する反響音到達時間を算出する反響音到達時間算出手段と、前記判定手段によって、前記音声データに所定の特徴を有する音が含まれていると判定された場合に、当該所定の特徴を有する音の開始時点を検出し、前記音声データのうち、当該開始時点から前記反響音到達時間に基づき算出した反響音の影響を受けない時点までの音を基にして、前記音源の方向を検出する音源方向検出手段と、を備えたことを特徴とする。
また、発明にかかる音源方向検出装置は、音を反響する物体の位置情報を記憶する位置情報記録手段を更に備え、前記反響音到達時間算出手段は、前記位置情報を基にして、前記反響音到達時間を算出することを特徴とする。
また、発明にかかる音源方向検出装置は、前記判定手段は、前記音声データに、所定の言葉が含まれている場合に、所定の特徴を有する音が含まれていると判定することを特徴とする。
また、発明にかかる音源方向検出装置は、前記音声入力手段は、前記音源から発せられた音を、複数の位置から取得し、複数の音声データを取得し、前記音源方向検出手段は、前記音声入力手段の位置情報と、前記複数の音声データの位相差を基にして、前記音源の方向を検出することを特徴とする。
また、発明にかかる音源方向検出装置は、前記反響音到達時間算出手段は、前記音源から発せられた音を反響させる物体と前記音声入力手段との距離を計測し、当該距離が所定の距離よりも長いか短いかを判定し、当該距離が所定の距離よりも短いと判定した場合には、当該距離と前記音声データに基づいて、前記音源から発せられた音の反響音が前記音声入力手段へ到達する反響音到達時間を算出し、前記音源方向検出手段は、前記物体と前記音声入力手段との距離が所定の距離よりも短いと判定された場合には、前記開始時点から前記反響音到達時間に基づき算出した反響音の影響を受けない時点までの音を基にして、前記音源の方向を検出し、前記物体と前記音声入力手段との距離が所定の距離よりも長いと判定された場合には、前記音の開始時点からの音を基にして、前記音源の方向を検出することを特徴とする。
発明によれば、音源方向検出装置は、音源から発せられた音を取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定し、所定の特徴を有する音が含まれる場合に、この所定の特徴を有する音の開始時点を検出し、音源から発せられた音のうち、開始時点から音源が発せられた音の反響音の影響を受けない時点までの音を基にして音源の方向を検出するので、反響音の影響を受けることなく、正確に音源の方向を検出することができる。
また、発明によれば、音源方向検出装置は、音を反響する物体の位置情報を基にして、反響音の影響を受けない時点を算出し、音源から発せられた音のうち、開始時点から音源から発せられた音の反響音の影響を受けない時点までの音を検出し、検出した音を基にして、音源の方向を検出するので、反響音の影響を受けることなく、正確に音源の方向を検出することができる。
また、発明によれば、音源方向検出装置は、音源から発せられた音を取得し、取得した音に所定の言葉が含まれるか否かを判定し、所定の言葉が含まれる場合に、この所定の言葉にかかる音の開始時点を検出し、音源から発せられた音のうち、開始時点から音源が発せられた音の反響音の影響を受けない時点までの音を基にして音源の方向を検出するので、効率よくかつ正確に音源の方向を検出することができる。
また、発明によれば、音源方向検出装置は、音源から発せられた音を複数の位置から取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定し、所定の特徴を有する音が含まれる場合に、この所定の特徴を有する音の開始時点を検出し、音源から発せられた音のうち、開始時点から音源が発せられた音の反響音の影響を受けない時点までの音を基にして音源の方向を検出するので、反響音の影響を受けることなく、正確に音源の方向を検出することができる。
また、発明によれば、音源方向検出装置は、音源から発せられた音を取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定し、所定の特徴を有する音が含まれている場合に、音源から発せられた音のうち、所定レベル以上の音量が含まれる位置を検出し、検出した音の位置を基にして、前記音源の方向を検出するので、精度よく音源方向を検出することができる。
以下に添付図面を参照して、この発明に係る音源方向検出装置の好適な実施の形態を詳細に説明する。
まず、本実施例1にかかる音源方向検出装置の特徴について説明する。図1は、本実施例1にかかる音源方向検出装置の特徴を説明するための説明図である。本実施例1にかかる音源方向検出装置は、マイクなどの音声入力装置を複数利用して音源からの音データを取得し、取得した音データに所定の特徴を有する音データ(例えば、所定の言葉など)が含まれるか否かを判定する。以下、所定の特徴を有する音データを所定音声データと表記する。
なお、本実施例1では一例として、マイク(音声入力装置)1〜3から取得された各音データは、順次、それぞれのマイクバッファに記録される。また、マイク1から取得された音データは、音声認識エンジンバッファに記録され、音源方向検出装置は、この音声認識エンジンバッファに記録された音データをスペクトラム解析することによって、記録された音データに所定音声データが含まれるか否かを判定する。
音源方向検出装置は、音データに所定音声データが含まれると判定した場合に、当該所定音声データの開始点(以下、発話開始点と表記する)を検出すると共に、音を反響する物体(ホールの壁など)の位置情報を基にして、反響音がマイクに到達する時間(以下、反響音到達時間と表記する)を算出する。
そして、音源方向検出装置は、複数のマイクによって取得した所定音声データのうち、発話開始点から反響音到達時間までの区間に含まれる各所定音声データに対して相互相関をとり、各所定音声データの位相差およびマイクの位置に基づいて音源の方向を検出する。
このように、本実施例1にかかる音源方向検出装置は、複数のマイクから取得した各音データのうち、反響音の影響を受けない区間を抽出して音源の方向を検出するので、反響音の影響を受けることなく、正確に音源の方向を検出することができる。
つぎに、本実施例1にかかる音源方向検出装置の構成について説明する。図2は、本実施例1にかかる音源方向検出装置の構成を示す機能ブロック図である。同図に示すように、音源方向検出装置100は、マイクアレイ110と、DSP(Digital Signal Processor)120と、距離センサ130と、表示装置140とを有する。
マイクアレイ110は、音データを取得する音声入力装置110a〜110cを有する。なお、本実施例1では説明の便宜上、3つの音声入力装置110a〜110cを用いて説明を行うが、このマイクアレイ110は、複数の音声入力装置を有する。音声入力装置110a〜110cは、外部から取得した音データをDSP120に渡す。
DSP120は、音声入力装置110a〜110cから取得する音データと、距離センサ130から取得する反響音到達時間とを基にして、音源の方向を検出する装置である。このDSP120は、音声認識エンジン部120aと、方向検出エンジン部120bとを有する。
ここで、距離センサ130は、反響音到達時間を算出する装置である。なお、距離センサ130は、音を反響させる物体の位置情報(以下、反響物体位置情報と表記する)を保持し、自音源方向検出装置の位置情報(以下、自装置位置情報と表記する)を検出して、反響物体位置情報、自装置位置情および音速などを基にして、反響音到達時間を算出する。距離センサ130は、算出した反響音到達時間の情報を方向検索エンジン部120bに渡す。
なお、距離センサ130が反響音到達時間を算出するタイミングは、どのように設定してもかまわない。例えば、所定時間ごとに反響音到達時間を算出しても良いし、自音源方向検出装置が所定距離移動した場合に、反響音到達時間を算出しても良い。
音声認識エンジン部120aは、音声入力装置110aから音データを取得し、この音データに所定音声データが含まれるか否かを判定する処理部である。具体的に、この音声認識エンジン部120aは、音声入力装置110aから取得した音データのスペクトラム解析を実行し、スペクトラム解析の結果と、予め保持していた所定音声データのサンプルデータとを比較・照合などすることによって、所定音声データが含まれるか否かを判定する。
そして、音声認識エンジン部120aは、音声入力装置110aから取得した音データに所定音声データが含まれていると判定した場合に、所定音声データの発話開始点を検出し、検出した発話開始点の情報を方向検索エンジン部120bに渡す。
方向検出エンジン部120bは、音声入力装置110a〜110c、音声認識エンジン部120aおよび距離センサ130からそれぞれ音データ、発話開始点および反響音到達時間の情報を取得し、取得した各情報を基にして音源の方向を検出する処理部である。
具体的に、この方向検索エンジン部120bは、音声入力装置110a〜110cから取得した各音データのうち、発話開始点から反響音到達時間までの区間にかかる各所定音声データを抽出する。
そして、方向検索エンジン部120bは、抽出した各所定音声データに対して相互相関をとり、各音声入力装置110a〜110cに対応する所定音声データの位相差をそれぞれ算出する。方向検索エンジン部120bは、算出した所定音声データの各位相差と、音声入力装置110a〜110cの位置情報との関係から音源の方向を検出する。方向検索エンジン部120bは、音源の方向を検出した後に、検出結果をディスプレイなどの表示装置140に出力する。
なお、方向検索エンジン部120bは、音声入力装置110a〜110cに取り付けられた位置検出センサ(図示しない)から各音声入力装置110a〜110cの位置情報を取得する。
なお、ここでは、一例として相互相関を用いて各位相差を算出したが、これに限定されるものではなく、各位相差をどのような方法で算出しても良い。
つぎに、本実施例1にかかる音源方向検出装置の処理について説明する。図3は、本実施例1にかかる音源方向検出装置の処理を示すフローチャートである。同図に示すように、音源方向検出装置100は、音声入力装置110a〜110cが音データを取得し(ステップS101)、距離センサ130が、反響音到達時間を計算する(ステップS102)。
そして、音声認識エンジン部120aが、音声入力装置110aから取得した音データに所定音声データが含まれているか否かを判定し(ステップS103)、所定音声データが含まれていない場合には(ステップS104,No)、ステップS101に移行する。
一方、所定音声データが含まれている場合には(ステップS104,Yes)、音声認識エンジン部120aが、発話開始点を検索し(ステップS105)、検索した発話開始点が適切か否かを判定する(ステップS106)。
検索した発話開始点が適切でない場合には(ステップS107,No)、ステップS105に移行する。一方、検索した発話開始点が適切である場合には(ステップS107,Yes)、方向検出エンジン部120bが、発話開始点から反響音到達時間内で相互相関をとって、各位相差を計算し(ステップS108)、音源方向を検出し、表示装置140に検索結果を出力し(ステップS109)、ステップS101に移行する。
このように、方向検出エンジン部120bが、発話開始点から反響音到達時間までの区間における各所定音声データの相互相関をとり、音源の方向を検出するので、精度よく音源の方向を検出することができる。
上述してきたように、本実施例1にかかる音源方向検出装置100は、音声入力装置110a〜110cが音源から音データを取得し、音声認識エンジン部120aが、音データに所定音声データが含まれるか否かを判定する。そして、音声認識エンジン部120aが、音データに所定音声データが含まれると判定した場合に、発話開始点を検索し、方向検出エンジン部120bが、発話開始点と距離センサ130から取得した反響音到達時間との区間にかかる各所定音声データの相互相関をとり、音源の方向を検出するので、ホール内やトンネル内などであっても、反響音の影響を受けることなく、正確に音源の方向を検出することができる。
なお、本実施例1において示した音源方向検出装置は、音を反響させる物体が自音源方向検出装置の近くに存在する場合を想定していたが、音を反響させる物体が自音源方向検出装置から離れて存在する場合には、反響音到達時間を考慮しなくとも、精度よく、音源の方向を検出することができる。
図4は、反響音到達時間を考慮しない場合の、音源方向検出装置の処理を示すフローチャートである。なお、このフローチャートの説明は、図2に示した音源方向検出装置100を用いて説明する。同図に示すように、音源方向検出装置100は、音声入力装置110a〜110cから音データを取得し(ステップS201)、音声認識エンジン部120aが、所定音声データか否かを判定する(ステップS202)。
所定音声データでない場合には(ステップS203,No)、ステップS201に移行し、所定音声データである場合には(ステップS203,Yes)、音声認識エンジン部120aが、発話開始点を検索し(ステップS204)、検索した発話開始点が適切か否かを判定する(ステップS205)。
そして、発話開始点が適切でない場合には(ステップS206,No)、ステップS204に移行し、発話開始点が適切である場合には(ステップS206,Yes)、方向検出エンジン部120bが、発話開始点からの各所定音声データの相互相関をとって、各位相差を計算し(ステップS207)、音源方向を検出し、検出結果を表示装置140に出力し(ステップS208)、ステップS201に移行する。
このように、音源方向検出装置100は、自音源方向検出装置が音を反響させる物体の位置から十分離れている場合に、方向検出エンジン部120bが、発話開始点に基づいて、各所定音声データの相互相関をとり、音源方向を検出するので、音源方向検出装置100の処理負担を軽減させ、効率よく音源の方向を検出することができる。
なお、自音源方向検出装置が、音を反響させる物体から十分離れているか否かの判定に関しては、距離センサ130が、反響物体位置情報と自装置位置情報とを基にして判定することができる。
つぎに、本実施例2にかかる音源方向検出装置の特徴について説明する。図5は、本実施例2にかかる音源方向検出装置の特徴を説明するための説明図である。本実施例2にかかる音源方向検出装置は、まず、上述した実施例1と同様に、マイクなどの音声入力装置を複数利用して音源からの音データを取得し、取得した音データに所定音声データが含まれるか否かを判定する。
音源方向検出装置は、音データに所定音声データが含まれると判定した場合に、この所定音声データのデータ区間のうち、音量などの値が、規定レベルを超えたデータ位置を検索する(以下、規定レベルを超えたデータ位置をピーク位置と表記する)。
そして、音源方向検出装置は、複数のマイクによって取得した所定音声データのピーク位置を中心として、相互相関をとり、各所定音声データの位相差およびマイクの位置に基づいて音源の方向を検出する。
このように、本実施例2にかかる音源方向検出装置は、複数のマイクから取得した各音データ中のピーク位置を検索し、このピーク位置を中心として相互相関をとり、音源の方向を検出するので、精度よく、音源の方法を検出することができる。
つぎに、本実施例1にかかる音源方向検出装置の構成について説明する。図6は、本実施例2にかかる音源方向検出装置の構成を示す機能ブロック図である。同図に示すように、音源方向検出装置200は、DSP210を有する。その他の構成および動作は、実施例1に示した音源方向検出装置100と同様であるので、同一の構成要素には同一の符号を付して説明を省略する。
DSP210は、音声入力装置110a〜110cから取得する音データのピーク位置を基にして、音源の方向を検出する装置である。このDSP210は、音声認識エンジン部210aと、方向検出エンジン部210bとを有する。
音声認識エンジン部210aは、音声入力装置110aから音データを取得し、この音データに所定音声データが含まれるか否かを判定する処理部である。この音声認識エンジン部210aは、音声入力装置110aから取得した音データのスペクトラム解析を実行し、スペクトラム解析の結果と、予め保持している所定音声データのサンプルデータとを比較・照合などすることによって、所定音声データが含まれるか否かを判定する。
そして、音声認識エンジン部210aは、音声入力装置110aから取得した音データに所定音声データが含まれていると判定した場合に、所定音声データの区間(以下、発話区間と表記する)を検出し、検出した発話区間の情報を方向検索エンジン部210bに渡す。
方向検出エンジン部210bは、音声入力装置110a〜110cおよび音声認識エンジン部210aから音データおよび発話区間をそれぞれ取得し、取得した各情報を基にして音源の方向を検出する処理部である。
具体的に、この方向検索エンジン部210bは、音声入力装置110a〜110cから取得した各音データの発話区間に含まれるピーク位置を検索する。そして、方向検索エンジン部120bは、各所定音声データのピーク位置を中心として相互相関をとり、各音声入力装置110a〜110cに対応する所定音声データの位相差をそれぞれ算出する。
続いて、方向検索エンジン部210bは、算出した音声入力装置110a〜110cにかかわる各位相差と、音声入力装置110a〜110cの位置情報との関係から音源の方向を検出する。方向検索エンジン部210bは、音源の方向を検出した後に、検出結果をディスプレイなどの表示装置140に出力する。
つぎに、本実施例2にかかる音源方向検出装置の処理について説明する。図7は、本実施例1にかかる音源方向検出装置の処理を示すフローチャートである。同図に示すように、音源方向検出装置200は、音声入力装置110a〜110cが音データを取得し(ステップS301)、音声認識エンジン部210aが、音声入力装置110aから取得した音データに所定音声データが含まれているか否かを判定し(ステップS302)、所定音声データが含まれていない場合には(ステップS303,No)、ステップS301に移行する。
一方、所定音声データが含まれている場合には(ステップS303,Yes)、方向検出エンジン部210bが、発話区間に含まれるピーク位置を検索し(ステップS304)、検索したピーク位置が適切か否かを判定する(ステップS305)。
検索したピーク位置が適切でない場合には(ステップS306,No)、ステップS304に移行する。一方、検索したピーク位置が適切である場合には(ステップS306,Yes)、方向検出エンジン部210bが、所定音声データのピーク位置を中心として相互相関をとって、各位相差を計算し(ステップS307)、音源方向を検出し、表示装置140に検索結果を出力し(ステップS308)、ステップS301に移行する。
このように、方向検出エンジン部210bが、所定音声データのピーク位置を中心として相互相関をとり、音源方向を検出するので、制度よく音源の方向を検出することができる。
上述してきたように、本実施例2にかかる音源方向検出装置200は、音声入力装置110a〜110cが音源から音データを取得し、音声認識エンジン部210aが、音データに所定音声データが含まれるか否かを判定する。そして、音声認識エンジン部210aが、音データに所定音声データが含まれると判定した場合に、方向検出エンジン部210bが、各所定音声データのピーク位置を検索し、各ピーク位置を中心として、相互相関をとり、音源方向を検出するので、音源方向を精度よく検出することができる。
なお、音が反響するホール内などで、実施例1および実施例2にかかる音源方向検出装置が音源方向を正確に向くか否かの実験を行ったところ、実施例1の音源方向検出装置100の成功率は90%であり、実施例2の音源方向検出装置200の成功率は14%であった。従来の音源方向検出装置の成功率(音が反響するホール内での成功率)が、1%程度であることに鑑みると実施例1および実施例1の音源方向検出装置は、極めて高い成功率で音源方向を検出可能であることがわかる。
ところで、上記の実施例で説明した音源方向検出装置の各種の処理は、音源方向検出処理に係るプログラムをコンピュータで実行することによって実現することができる。そこで、以下では、図8を用いて、上記の実施例と同様の機能を有する音源方向検出プログラムを実行するコンピュータの一例を説明する。図8は、音源方向検出プログラムを実行するコンピュータを示す図である。
同図に示すように、コンピュータ30は、音声入力装置31〜33、表示装置34、距離センサ35、RAM36、HDD37、ROM38およびCPU39をバス40で接続して構成される。ここで、音声入力装置31〜33、表示装置34、距離センサ35は、図2に示した音声入力装置110a〜110c、表示装置140、距離センサ130にそれぞれ対応する。
そして、ROM38には、上記の実施例の音源方向検出装置と同様の機能を発揮する音源方向検出プログラム、つまり、図8に示すように、音声認識プログラム38aおよび方向検出プログラム38bが予め記憶されている。
そして、CPU39が、これらのプログラム38a、38bをROM38から読み出して実行することで、図8に示すように、各プログラム38a、38bは、音声認識プロセス39a、方向検出プロセス39bとして機能するようになる。各プロセス39a、39bは、図2に示した音声認識エンジン部120a、方向検出エンジン部120bにそれぞれ対応する。
また、HDD37には、図8に示すように、地図情報37aおよびサンプル情報37aが記録される。地図情報37aは、音を反響する物体の位置情報などを含んだ情報でありサンプル情報37aは、所定音声データのサンプルとなる情報である。CPU39は、地図情報37aおよびサンプル情報37bをRAM34に読み出し、読み出した各情報と音声入力装置31〜33が取得した音データ36aとを用いて、音源の方向を検出する。
ところで、上記した各プログラム38a、38bは、必ずしも最初からROM38に記憶させておく必要はなく、例えば、コンピュータ30に挿入されるフレキシブルディスク(FD)、CD−ROM、MOディスク、DVDディスク、光磁気ディスク、ICカードなどの「可搬の物理媒体」、または、コンピュータ30の内外に備えられるハードディスクドライブ(HDD)などの「固定用の物理媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータ30に接続される「他のコンピュータ(またはサーバ)」などに各プログラムを記憶させておき、コンピュータ30がこれらから各プログラムを読み出して実行するようにしてもよい。
(付記1)音源の方向を検出する音源方向検出装置であって、
前記音源から発せられた音を取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定する判定手段と、
前記判定手段によって、所定の特徴を有する音が含まれていると判定された場合に、当該所定の特徴を有する音の開始時点を検出し、前記音源から発せられた音のうち、当該開始時点から反響音の影響を受けない時点までの音を基にして、前記音源の方向を検出する音源方向検出手段と、
を備えたことを特徴とする音源方向検出装置。
(付記2)音を反響する物体の位置情報を記録する位置情報記録手段を更に備え、前記音源方向検出手段は、前記位置情報を基にして、反響音の影響を受けない時点を算出し、前記音源から発せられた音のうち、前記開始時点から反響音の影響を受けない時点までの音を検出し、検出した音を基にして、前記音源の方向を検出することを特徴とする付記1に記載の音源方向検出装置。
(付記3)前記判定手段は、前記音源から発せられた音に、所定の言葉が含まれている場合に、所定の特徴を有する音が含まれていると判定することを特徴とする付記1または2に記載の音源方向検出装置。
(付記4)前記判定手段は、前記音源から発せられた音を、複数の位置から取得することを特徴とする付記1、2または3に記載の音源方向検出装置。
(付記5)音源の方向を検出する音源方向検出装置であって、
前記音源から発せられた音を取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定する判定手段と、
前記判定手段によって、所定の特徴を有する音が含まれていると判定された場合に、前記音源から発せられた音のうち、所定レベル以上の音量が含まれる位置を検出し、検出した位置を基にして、前記音源の方向を検出する音源方向検出手段と、
を備えたことを特徴とする音源方向検出装置。
(付記6)音源の方向を検出する音源方向検出プログラムであって、
前記音源から発せられた音を取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定する判定手順と、
前記判定手順によって、所定の特徴を有する音が含まれていると判定された場合に、当該所定の特徴を有する音の開始時点を検出し、前記音源から発せられた音のうち、当該開始時点から反響音の影響を受けない時点までの音を基にして、前記音源の方向を検出する音源方向検出手順と、
をコンピュータに実行させることを特徴とする音源方向検出プログラム。
(付記7)前記音源方向検出手順は、記録装置に記録された音を反響する物体の位置情報を基にして、前記音源から発せられた音のうち、前記開始時点から前記音源から発せられた音の反響音の影響を受けない時点までの音を検出し、検出した音を基にして、前記音源の方向を検出することを特徴とする付記6に記載の音源方向検出プログラム。
(付記8)前記判定手順は、前記音源から発せられた音に、所定の言葉が含まれている場合に、所定の特徴を有する音が含まれていると判定することを特徴とする付記6または7に記載の音源方向検出プログラム。
(付記9)前記判定手順は、前記音源から発せられた音を、複数の位置から取得することを特徴とする付記6、7または8に記載の音源方向検出プログラム。
(付記10)音源の方向を検出する音源方向検出プログラムであって、
前記音源から発せられた音を取得し、取得した音に所定の特徴を有する音が含まれるか否かを判定する判定手順と、
前記判定手順によって、所定の特徴を有する音が含まれていると判定された場合に、前記音源から発せられた音のうち、所定レベル以上の音量が含まれる位置を検出し、検出した位置を基にして、前記音源の方向を検出する音源方向検出手順と、
をコンピュータに実行させることを特徴とする音源方向検出プログラム。
以上のように、本発明にかかる音源方向検出装置は、音源から発せられる音が反響しやすい領域において、当該音源の方向を正確に検出する必要のある音源方向検出装置等に対して有用である。
本実施例1にかかる音源方向検出装置の特徴を説明するための説明図である。 本実施例1にかかる音源方向検出装置の構成を示す機能ブロック図である。 本実施例1にかかる音源方向検出装置の処理を示すフローチャートである。 反響音到達時間を考慮しない場合の、音源方向検出装置の処理を示すフローチャートである。 本実施例2にかかる音源方向検出装置の特徴を説明するための説明図である。 本実施例2にかかる音源方向検出装置の構成を示す機能ブロック図である。 本実施例1にかかる音源方向検出装置の処理を示すフローチャートである。 音源方向検出プログラムを実行するコンピュータを示す図である。
符号の説明
30 コンピュータ(音源方向検出装置)
31,32,33 音声入力装置
34 表示装置
35 距離センサ
36 RAM
36a 音データ
36b 地図情報
36c サンプル情報
37 HDD
37a 地図情報
37b サンプル情報
38 ROM
38a 音声認識プログラム
38b 方向検出プログラム
39 CPU
39a 音声認証プロセス
39b 方向検出プロセス
100,200 音源方向検出装置
110 マイクアレイ
110a,110b,110c 音声入力装置
120 DSP
120a,210a 音声認識エンジン部
120b,210b 方向検出エンジン部
130 距離センサ
140 表示装置

Claims (5)

  1. 音源の方向を検出する音源方向検出装置であって、
    前記音源から発せられた音が入力され、該音の音声データを取得する音声入力手段と
    前記音声データに所定の特徴を有する音が含まれるか否かを判定する判定手段と、
    前記音源から発せられた音を反響させる物体と前記音声入力手段との距離を計測し、該距離と前記音声データに基づいて、前記音源から発せられた音の反響音が前記音声入力手段へ到達する反響音到達時間を算出する反響音到達時間算出手段と、
    前記判定手段によって、前記音声データに所定の特徴を有する音が含まれていると判定された場合に、当該所定の特徴を有する音の開始時点を検出し、前記音声データのうち、当該開始時点から前記反響音到達時間に基づき算出した反響音の影響を受けない時点までの音を基にして、前記音源の方向を検出する音源方向検出手段と、
    を備えたことを特徴とする音源方向検出装置。
  2. 音を反響する物体の位置情報を記憶する位置情報記録手段を更に備え、
    前記反響音到達時間算出手段は、前記位置情報を基にして、前記反響音到達時間を算出することを特徴とする請求項1に記載の音源方向検出装置。
  3. 前記判定手段は、前記音声データに、所定の言葉が含まれている場合に、所定の特徴を有する音が含まれていると判定することを特徴とする請求項1または2に記載の音源方向検出装置。
  4. 前記音声入力手段は、前記音源から発せられた音を、複数の位置から取得し、複数の音声データを取得し、
    前記音源方向検出手段は、前記音声入力手段の位置情報と、前記複数の音声データの位相差を基にして、前記音源の方向を検出することを特徴とする請求項1、2または3に記載の音源方向検出装置。
  5. 前記反響音到達時間算出手段は、前記音源から発せられた音を反響させる物体と前記音声入力手段との距離を計測し、当該距離が所定の距離よりも長いか短いかを判定し、当該距離が所定の距離よりも短いと判定した場合には、当該距離と前記音声データに基づいて、前記音源から発せられた音の反響音が前記音声入力手段へ到達する反響音到達時間を算出し、
    前記音源方向検出手段は、前記物体と前記音声入力手段との距離が所定の距離よりも短いと判定された場合には、前記開始時点から前記反響音到達時間に基づき算出した反響音の影響を受けない時点までの音を基にして、前記音源の方向を検出し、前記物体と前記音声入力手段との距離が所定の距離よりも長いと判定された場合には、前記音の開始時点からの音を基にして、前記音源の方向を検出することを特徴とする請求項1に記載の音源方向検出装置。
JP2005233621A 2005-08-11 2005-08-11 音源方向検出装置 Expired - Fee Related JP4659556B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005233621A JP4659556B2 (ja) 2005-08-11 2005-08-11 音源方向検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005233621A JP4659556B2 (ja) 2005-08-11 2005-08-11 音源方向検出装置

Publications (2)

Publication Number Publication Date
JP2007047088A JP2007047088A (ja) 2007-02-22
JP4659556B2 true JP4659556B2 (ja) 2011-03-30

Family

ID=37850021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005233621A Expired - Fee Related JP4659556B2 (ja) 2005-08-11 2005-08-11 音源方向検出装置

Country Status (1)

Country Link
JP (1) JP4659556B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
JP7010900B2 (ja) * 2019-07-16 2022-01-26 Kddi株式会社 音源定位装置及び音源定位方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004012151A (ja) * 2002-06-03 2004-01-15 Matsushita Electric Ind Co Ltd 音源方向推定装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH067357B2 (ja) * 1982-10-19 1994-01-26 シャープ株式会社 音声認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004012151A (ja) * 2002-06-03 2004-01-15 Matsushita Electric Ind Co Ltd 音源方向推定装置

Also Published As

Publication number Publication date
JP2007047088A (ja) 2007-02-22

Similar Documents

Publication Publication Date Title
JP4868999B2 (ja) 音声認識方法、音声認識装置及びコンピュータプログラム
JP4812302B2 (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
WO2019148586A1 (zh) 多人发言中发言人识别方法以及装置
KR20130101943A (ko) 음원 끝점 검출 장치 및 그 방법
JP2016080750A (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
CN103688187B (zh) 使用相位谱的声音源定位
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
JP4497911B2 (ja) 信号検出装置および方法、ならびにプログラム
JP2007288242A (ja) オペレータ評価方法、装置、オペレータ評価プログラム、記録媒体
JP4659556B2 (ja) 音源方向検出装置
JP2000310993A (ja) 音声検出装置
JP2002189487A (ja) 音声認識装置および音声認識方法
JP6969597B2 (ja) 音響信号処理装置、方法及びプログラム
JP2008304610A (ja) 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体
WO2017085815A1 (ja) 困惑状態判定装置、困惑状態判定方法、及びプログラム
JPH11231897A (ja) 音声認識装置及び方法
JP6599408B2 (ja) 音響信号処理装置、方法及びプログラム
JP7001029B2 (ja) キーワード検出装置、キーワード検出方法、およびプログラム
JP2002315089A (ja) 話者方向検出回路
JP6633579B2 (ja) 音響信号処理装置、方法及びプログラム
WO2019220883A1 (ja) 検知装置、その方法、およびプログラム
JP2005283646A (ja) 音声認識率推定装置
JP2019029861A (ja) 音響信号処理装置、方法及びプログラム
JP2020024310A (ja) 音声処理システム及び音声処理方法
JP7248087B2 (ja) 連続発話推定装置、連続発話推定方法、およびプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101227

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4659556

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees