JP2023020567A

JP2023020567A - データ処理装置、データ処理方法およびプログラム

Info

Publication number: JP2023020567A
Application number: JP2021125989A
Authority: JP
Inventors: 裕次郎井▲高▼; Yujiro Idaka
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2023-02-09
Also published as: US20230030509A1

Abstract

【課題】音データの解析精度の低下を抑制しつつ、音データのＡＧＣを可能とするデータ処理装置、データ処理方法及びプログラムを提供する。【解決手段】データ処理装置は、マイク１０２を介して入力された音データ１０６をコピーした音データ１０７を生成する音データコピー部１１１と、音データ１０６にＡＧＣゲインをかけて出力するとともに、音データ１０７にＡＧＣゲインをかけないで出力するゲイン処理部１１２と、ＡＧＣゲインがかけられた音データ１０６を配信する音データ配信処理部１０４と、ＡＧＣゲインがかけられてない音データ１０７を解析する音データ解析処理部１０５と、を備える。【選択図】図１

Description

本発明は、データ処理装置、データ処理方法およびプログラムに関する。

ネットワーク、専用線またはリモコン等を介して制御されるカメラには音声入力機能が備わっていることがある。音声入力機能には、音声レベルが常に適切な音量レベルになるように、自動で利得（ゲイン）を調整するＡＧＣ（ＡｕｔｏＧａｉｎＣｏｎｔｏｒｏｌ)機能がある。このＡＧＣ機能では、大きな音声が入力されると、ゲインが下がり、小さな音声が入力されると、ゲインが上がる。
音声入力機能を備えたカメラの搭載機能には、音声認識機能（設定値以上の音量が入ればイベントが上がるなど）と呼ばれる音声を用いた解析機能が複数ある。音声を用いた解析機能は、ＡＧＣ機能によってゲインが変動した場合、正常に機能しない場合がある。

特許文献１には、背景音であるエンジン音がＡＧＣ機能により増幅されるのを防止するため、エンジンの回転数から、エンジンが発するノイズ音とその周波数を推定し、そのノイズ音を低減させるためにバンドパスフィルタをかける技術が開示されている。

特許文献２には、増幅された音声信号に対して音声認識を利用するアプリケーションが実行される時、ＡＧＣをオフにする技術が開示されている。

特開平５－３３６５９０号公報特許第５８１７３６８号公報

しかしながら、特許文献１に開示された技術では、エンジンが発するノイズ音を低減させるために、バンドパスフィルタをかけると、そのノイズ音と同じ周波数帯の本来取りたい音声レベルも下がる。このため、そのノイズ音と同じ周波数帯に検出したい音声があった場合、音声解析の検知性能が低下する。
特許文献２に開示された技術では、音声認識を利用するアプリケーションが実行される時にＡＧＣ機能がオフにされるので、音声配信の音量が大きすぎて飽和したり、小さすぎて聞こえなかったりする。
本発明が解決しようとする課題は、音データの解析精度の低下を抑制しつつ、音データのＡＧＣを可能とすることである。

一態様に係るデータ処理装置は、第１音データをコピーした第２音データを生成するコピー手段と、前記第１音データと前記第２音データとの少なくとも一方に第１ゲインをかける処理手段と、を備える。

本発明の１つの態様によれば、音データの解析精度の低下を抑制しつつ、音データのＡＧＣが可能となる。

第１実施形態に係るデータ処理装置の概略構成例を示すブロック図。第１実施形態に係る撮像装置の概略構成例を示すブロック図。第１実施形態に係るデータ処理装置の構成例を示すブロック図。第１実施形態に係る音データコピー処理を示すフローチャート。第２実施形態に係るデータ処理装置の概略構成例を示すブロック図。第３実施形態に係るデータ処理装置のゲイン設定例を示す図。第４実施形態に係るデータ処理装置のハードウェア構成例を示すブロック図。

以下、添付図面を参照して本発明の実施形態を詳細に説明する。なお、以下の実施形態は本発明を限定するものではなく、また、実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。実施形態の構成は、本発明が適用される装置の仕様や各種条件（使用条件、使用環境等）によって適宜修正または変更され得る。本発明の技術的範囲は、特許請求の範囲によって確定され、以下の個別の実施形態によって限定されない。

＜第１実施形態＞
図１は、第１実施形態に係るデータ処理装置の概略構成例を示すブロック図である。
図１に示す各機能ブロックのうち、ソフトウェアにより実現される機能については、各機能ブロックの機能を提供するためのプログラムがＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等のメモリに記憶される。そして、そのプログラムをＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）に読み出してＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）が実行することにより実現される。ハードウェアにより実現される機能については、例えば、所定のコンパイラを用いることで、各機能ブロックの機能を実現するためのプログラムからＦＰＧＡ上に自動的に専用回路を生成すればよい。ＦＰＧＡとは、ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙの略である。また、ＦＰＧＡと同様にしてゲートアレイ回路を形成し、ハードウェアとして実現するようにしてもよい。また、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）により実現するようにしてもよい。なお、図１に示した機能ブロックの構成は一例であり、複数の機能ブロックが１つの機能ブロックを構成するようにしてもよいし、いずれかの機能ブロックが複数の機能を行うブロックに分かれてもよい。

図１において、データ処理装置は、音データ処理部１０１、音データ配信処理部１０４および音データ解析処理部１０５を備える。音データ処理部１０１は、音データコピー部１１１およびゲイン処理部１１２を備える。ゲイン処理部１１２は、ＡＧＣ部１０３を備える。

音データ処理部１０１は、マイク１０２を介して入力された音データを処理することで、同一音の入力に対して音量が互いに異なる２つの音データを生成し、音データ配信処理部１０４および音データ解析処理部１０５にそれぞれ出力する。このとき、音データ処理部１０１は、２つの音データの少なくとも一方については、ゲインをかけた音データとすることができる。例えば、音データ処理部１０１は、ＡＧＣゲインをかけた音データと、ＡＧＣゲインをかけない音データを生成する。そして、音データ処理部１０１は、ＡＧＣゲインをかけた音データを音データ配信処理部１０４に出力し、ＡＧＣゲインをかけない音データを音データ解析処理部１０５に出力することができる。

音データコピー部１１１は、マイク１０２を介して入力された音データ１０６をコピーした音データ１０７を生成する。
ゲイン処理部１１２は、音データ１０６にＡＧＣゲインをかけて出力するとともに、音データ１０７にＡＧＣゲインをかけないで出力する。ＡＧＣ部１０３は、音データ１０６にＡＧＣゲインをかける。

音データ配信処理部１０４は、ＡＧＣゲインがかけられた音データ１０６を配信する。ＡＧＣゲインがかけられた音データ１０６の配信には、ネットワークまたは専用線を用いてもよい。ＡＧＣゲインがかけられた音データ１０６の配信先は、例えば、撮像装置に接続された情報処理装置である。

音データ解析処理部１０５は、ＡＧＣゲインがかけられてない音データ１０７を解析する。音データ１０７の解析処理は、音データ１０７の認識処理を含んでもよいし、音データ１０７の周波数分析処理を含んでもよい。音データ１０７の認識処理は、例えば、ガラスが割れた音などの異常音の認識処理を含んでもよい。

ここで、ゲイン処理部１１２は、音データ配信処理部１０４に出力される音データ１０６にＡＧＣゲインをかけることにより、音データの配信時の音量が大きすぎて飽和したり、小さすぎて聞こえなかったりするのを防止することができる。
また、ゲイン処理部１１２は、音データ解析処理部１０５に出力される音データ１０７にＡＧＣゲインをかけないようにすることにより、解析対象となるデータが抑圧されるのを防止することができ、音データ１０７の解析精度の低下を抑制することができる。このとき、音データコピー部１１１は、ＡＧＣゲインがかけられる前に音データ１０６をコピーすることにより、マイク１０２で収音された音について、解析精度の低下を抑制しつつ、適正化された音量で配信を実現できる。

図２は、第１実施形態に係る撮像装置の概略構成例を示すブロック図である。なお、図２では、撮像装置としてマイク付きパンチルトカメラを例にとる。この撮像装置は、例えば、監視カメラとして用いることができる。

図２において、カメラ２００は、撮像部２０１、パンチルト駆動部２０２、マイク２０３、演算処理部２０４、パンチルト制御部２０５およびシステム制御部２０７を備える。カメラ２００は、クライアント装置２０８と相互に通信可能な状態に接続されている。クライアント装置２０８は、例えば、パーソナルコンピュータなどの情報処理装置である。ユーザは、クライアント装置２０８からカメラ２００に様々なコマンドを送信することができる。

撮像部２０１は、被写体からの光に基づいて撮像を行う。このとき、撮像部２０１は、撮像面に集光された光を画素ごとに電気信号に変換し、演算処理部２０４に出力する。撮像部２０１は、フォーカスレンズ、ズームレンズなどを含む撮像用レンズ、撮像素子、それらを駆動するメカ駆動系および駆動回路などを備える。撮像素子は、例えば、ＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）センサまたはＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）センサである。

パンチルト駆動部２０２は、カメラ２００のパン（水平方向回転）駆動およびチルト（垂直方向回転）駆動を実施する。パンチルト駆動部２０２は、パンチルト動作を行うメカ駆動系、駆動源のモータおよびモータドライバなどを備える。

演算処理部２０４は、撮像部２０１によって変換された電気信号に対してノイズ除去およびガンマ補正などの画像処理を行って画像データを生成し、システム制御部２０７へ伝達する。また、演算処理部２０４は、システム制御部２０７より受信したコマンドの処理も行う。例えば、演算処理部２０４は、システム制御部２０７からズーム位置またはフォーカス位置の変更指示を受信した場合は、フォーカスレンズまたはズームレンズが指示された位置になるよう駆動させる。また、演算処理部２０４は、システム制御部２０７から画質調整の指示を受信した場合は、画質の調整を行う。また、演算処理部２０４は、パンチルト制御部２０５に送信するパンチルト位置情報に関する演算を行う。

また、演算処理部２０４は、マイク２０３を介して入力された音データに関する演算を行い、音データ解析処理を行う。このとき、演算処理部２０４は、マイク２０３を介して入力された音データをコピーし、ＡＧＣゲインをかけた音データと、ＡＧＣゲインをかけない音データを生成することができる。そして、演算処理部２０４は、ＡＧＣゲインをかけた音データを配信処理し、ＡＧＣゲインをかけない音データを解析処理することができる。

パンチルト制御部２０５は、システム制御部２０７を介して演算処理部２０４で受信したパンチルト制御に関するコマンドの処理を行い、パンチルト駆動部２０２を制御する。例えば、パンチルト制御部２０５は、パンチルト制御に関するコマンドの指示に基づいて、パンチルト駆動部２０２の駆動量、速度および加減速を制御したり、パンチルト駆動部２０２の初期化動作などを行う。

システム制御部２０７は、パンチルトカメラ２００全体を制御する。例えば、システム制御部２０７は、演算処理部２０４で生成された画像データをクライアント装置２０８に配信する。また、システム制御部２０７は、クライアント装置２０８から送られたカメラ制御コマンドを解析し、演算処理部２０４に関するコマンドを撮像部２０１へ伝達する。また、システム制御部２０７は、カメラ制御コマンドに対するレスポンスをクライアント装置２０８へ送信する。

また、システム制御部２０７は、演算処理部２０４から出力された音データをクライアント装置２０８に配信する。このとき、システム制御部２０７は、撮像部２０１の撮像時にマイク２０３で収音された音データを画像データとともにクライアント装置２０８に配信してもよい。あるいは、システム制御部２０７は、マイク２０３で収音された音データを単独でクライアント装置２０８に配信してもよい。また、システム制御部２０７は、ＡＧＣゲインをかけない音データの解析処理に基づいて検出されたイベントの発生をクライアント装置２０８に伝えるようにしてもよい。例えば、システム制御部２０７は、ＡＧＣゲインをかけない音データの解析処理に基づいてガラスが割れる音が検出された場合、イベントの発生をクライアント装置２０８に伝えるようにしてもよい。

なお、本実施形態におけるカメラ２００は、図２で示した構成に限られるものではない。例えば、カメラ２００は、ＳＤＩ（ＳｅｒｉａｌＤｉｇｉｔａｌＩｎｔｅｒｆａｃｅ）またはＨＤＭＩ（Ｈｉｇｈ－ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）（登録商標）などの映像出力端子を備えてもよい。また、カメラ２００は、音データ入出力部または外部デバイス入出力部を備えてもよい。

図３は、第１実施形態に係るデータ処理装置の構成例を示すブロック図である。
図３において、図２の演算処理部２０４は、ＡＤ変換部３０２、フィルタ処理部３０３、ＰＣＭ（ＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ）変換部３０４、ＡＧＣ部３０５、音データ圧縮部３０６および音データ配信処理部３０７を備える。また、演算処理部２０４は、音データコピー部３０８および音データ解析処理部３０８を備える。

ＡＤ変換部３０２において、マイク３０１で取得された音データは、アナログ信号からデジタル信号に変換される。
次に、フィルタ処理部３０３において、デジタル信号に変換された音データから、不要な高周波成分および低周波成分がカットされる。
次に、ＰＣＭ変換部３０４において、フィルタ処理部３０３から出力された音データは、ＰＣＭ信号に変換され、その変換後の音データＰ１は、ＡＧＣ部３０５および音データコピー部３０８に出力される。

次に、ＡＧＣ部３０５において、音データＰ１にＡＧＣゲインがかけられ、音データＰ１の音量が適正化された音データＰ３が生成される。
次に、音データ圧縮部３０６において、ＡＧＣゲインがかけられた音データＰ３は、配信時の帯域を確保するためのデータ圧縮が施され、音データ配信処理部３０７を介して配信される。

一方、音データコピー部３０８において、ＰＣＭ信号に変換後の音データＰ１がコピーされた音データＰ２が生成される。そして、音データ解析処理部３０８において、音データコピー部３０８でコピーされた音データＰ２は、ＡＧＣゲインがかけられることなく音データ解析処理部３０８に送られ、解析処理が実施される。

図４は、第１実施形態に係る音データコピー処理を示すフローチャートである。
なお、図４の各ステップは、図２の撮像装置２００の記憶部に記憶されたプログラムを演算処理部２０４が読み出し、実行することで実現される。また、図４に示すフローチャートの少なくとも一部をハードウェアにより実現してもよい。ハードウェアにより実現する場合、例えば、所定のコンパイラを用いることで、各ステップを実現するためのプログラムからＦＰＧＡ上に自動的に専用回路を生成すればよい。また、ＦＰＧＡと同様にしてＧａｔｅＡｒｒａｙ回路を形成し、ハードウェアとして実現するようにしてもよい。また、ＡＳＩＣにより実現するようにしてもよい。
この場合、図４に示すフローチャートにおける各ブロックは、ハードウェアブロックと見做すことができる。なお、複数のブロックをまとめて１つのハードウェアブロックとして構成してもよく、１つのブロックを複数のハードウェアブロックとして構成してもよい。

図４において、演算処理部２０４は、音データ解析処理を実施するかどうかを判断する（ステップＳ４１）。演算処理部２０４は、音データ解析処理を実施しない場合、処理を終了する。一方、演算処理部２０４は、音データ解析処理を実施する場合、ＡＧＣ機能がＯＮかどうかを判断する（ステップＳ４２）。演算処理部２０４は、ＡＧＣ機能がＯＦＦの場合、処理を終了する。一方、演算処理部２０４は、ＡＧＣ機能がＯＮの場合、音データコピー処理を行う（ステップＳ４３）。

なお、図４の処理は、消費電力を低減するため、音データコピー処理をハードウェア上で行う場合に適用するのが好ましい。ソフトウェア処理等を採用し、消費電力の増大の懸念が小さい場合は、演算処理部２０４は、マイク２０３を介して入力された音データのコピー処理を常時行ってもよい。

＜第２実施形態＞
図５は、第２実施形態に係るデータ処理装置の概略構成例を示すブロック図である。
図５において、このデータ処理装置は、図３の音データコピー部３０８の代わりに、音データコピー部５０１およびゲイン制御部５０２を備える。

音データコピー部５０１は、マイク３０１を介して入力された音データをコピーする。このとき、音データコピー部５０１は、ＡＧＣ部３０５でＡＧＣゲインがかけられる前の音データＰ１をコピーしてもよいし、ＡＧＣ部３０５でＡＧＣゲインがかけられた後の音データＰ３をコピーしてもよい。

ゲイン制御部５０２は、音データコピー部５０１でコピーされた音データに対し、ＡＧＣ部３０５でかけられるＡＧＣゲインとは異なるゲインをかけることができる。例えば、ゲイン制御部５０２は、キャリブレーション時のＡＧＣゲインを記憶し、音データコピー部５０１でコピーされた音データにキャリブレーション時のＡＧＣゲインかけるようにしてもよい。音データ解析処理の内部設定行うキャリブレーション期間では、ＡＧＣ部３０５でゲインがかけられた後の音データＰ３をコピーして音データ解析処理に使用する。このとき、ゲイン制御部５０２は、キャリブレーション時のＡＧＣゲインを保存し、キャリブレーション後に同じＡＧＣゲインをかける。この場合、ゲイン制御部５０２は、音データのコピーには、ＡＧＣ部３０５でゲインがかけられる前の音データＰ１を用いる。

これにより、ゲイン制御部５０２は、データ解析処理データで使用する音データに対し、キャリブレーション期間中に保存された一定のゲインをかけることができる。このため、データ解析処理で使用する音データの音量を適正化することができ、音データ解析処理の精度の低下を抑制することができる。

また、ゲイン制御部５０２は、ＡＧＣ部３０５でゲインがかけられた後の音データＰ３をキャリブレーション期間後にも使用してもよい。このとき、ゲイン制御部５０２は、ＡＧＣ部３０５でかけられたＡＧＣゲインを打ち消すために、そのＡＧＣゲインと符号が逆のマイナスゲインを音データＰ３にかけるようにしてもよい。

これにより、ＡＧＣ部３０５でゲインがかけられる前の音データＰ１をコピーできず、ＡＧＣ部３０５でゲインがかけられた音データＰ３をコピーせざる得ないシステムでも、音データ解析処理部３０８は、ゲインが固定された音データを解析できる。

また、ゲイン制御部５０２は、ＡＧＣ部３０５でゲインがかけられた後の音データＰ３について、そのゲインの変化に応じて音データＰ３の検知スレッショルドを変化させるようにしてもよい。例えば、音データ解析処理部３０８は、音データＰ３の一定以上の音量を検知する場合、ゲイン制御部５０２は、ＡＧＣ部３０５でかけられたゲイン分だけ音量の検知スレッショルドを下げることができる。

これにより、音データ解析処理部３０８は、解析対象が変化し、音データ解析の検知レベルを下げた方が望ましい場合においても、ＡＧＣ部３０５でかけられたゲインに対応しつつ、音データ解析を実施することができる。

＜第３実施形態＞
図６は、第３実施形態に係るデータ処理装置のゲイン設定例を示す図である。
図６において、図５のゲイン制御部５０２は、図２のカメラ２００の内部駆動部に応じて内部駆動部の駆動中に音データにマイナスゲインをかける。カメラ２００の内部駆動部は、例えば、パン駆動部（Ｐａｎ）、チルト駆動部（Ｔｉｌｔ）、撮像部２０１のズーム部（Ｚｏｏｍ）およびフォーカス部（Ｆｏｃｕｓ）である。マイナスゲインは、これらの内部駆動部ごとに設定することができる。マイナスゲインは、内部駆動部が動作中に発する駆動音の大きさに応じて設定することができる。

これにより、内部駆動部が動作中に駆動音が発生する場合においても、解析処理に用いられる音データに重畳される駆動音を低減させることができ、カメラ２００の内部騒音による音データ解析処理の誤作動を防止することができる。

＜第４実施形態＞
図７は、第４実施形態に係るデータ処理装置のハードウェア構成例を示すブロック図である。
図７において、データ処理装置１０は、図２のカメラ２００の機能のうち、ソフトウェアにより実現される機能をカメラ２００上で実現することができる。このとき、データ処理装置１０は、図１の演算処理部２０４の機能を実現することができる。

データ処理装置１０は、プロセッサ１１、通信制御部１２、通信インタフェース１３、主記憶部１４、補助記憶部１５および入出力インタフェース１７を備える。プロセッサ１１、通信制御部１２、通信インタフェース１３、主記憶部１４、補助記憶部１５および入出力インタフェース１７は、内部バス１６を介して相互に接続されている。主記憶部１４および補助記憶部１５は、プロセッサ１１からアクセス可能である。

また、データ処理装置１０の外部には、イメージセンサ２０、マイク２１および駆動部２２が設けられている。イメージセンサ２０、マイク２１および駆動部２２は、入出力インタフェース１７を介して内部バス１６に接続されている。イメージセンサ２０は、例えば、ＣＣＤセンサまたはＣＭＯＳセンサである。マイク２１は、例えば、図２のマイク２０３である。駆動部２２は、例えば、図２のパンチルト駆動部２０５、撮像部２０１のズーム部およびフォーカス部である。

プロセッサ１１は、データ処理装置１０全体の動作制御を司る。プロセッサ１１は、ＣＰＵであってもよいし、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であってもよい。プロセッサ１１は、シングルコアプロセッサであってもよいし、マルチコアプロセッサであってもよい。プロセッサ１１は、処理の一部を高速化するアクセラレータなどのハードウェア回路（例えば、ＦＰＧＡまたはＡＳＩＣ）を備えていてもよい。

主記憶部１４は、例えば、ＳＲＡＭ（ＳｔａｔｉｃＲａｎｄａｍＡｃｃｅｓｓＭｅｍｏｒｙ）またはＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄａｍＡｃｃｅｓｓＭｅｍｏｒｙ）などの半導体メモリから構成することができる。主記憶部１４には、プロセッサ１１が実行中のプログラムを格納したり、プロセッサ１１がプログラムを実行するためのワークエリアを設けたりすることができる。

補助記憶部１５は、不揮発性記憶デバイスであり、例えば、ＲＯＭ、ハードディスク装置またはＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）である。補助記憶部１５は、各種プログラムの実行ファイルやプログラムの実行に用いられるデータを保持することができる。例えば、補助記憶部１５は、データ処理プログラム１５Ａを保持することができる。データ処理プログラム１５Ａは、カメラ２００にインストール可能なソフトウェアであってもよいし、カメラ２００にファームウェアとして組み込まれていてもよい。

通信制御部１２は、外部との通信を制御する機能を備えるハードウェアである。通信制御部１２は、通信インタフェース１３を介してネットワーク１９に接続される。ネットワーク１９は、インターネットであってもよいし、ＷＡＮであってもよいし、ＷｉＦｉまたはイーサネットなどのＬＡＮであってもよいし、インターネットとＷＡＮとＬＡＮが混在していてもよい。

入出力インタフェース１７は、イメージセンサ２０、マイク２１および駆動部２２から入力されるデータをプロセッサ１１が処理可能なデータ形式に変換する。また、入出力インタフェース１７は、プロセッサ１１から出力されるデータをイメージセンサ２０および駆動部２２が処理可能なデータ形式に変換する。

プロセッサ１１は、補助記憶部１５に記憶されたデータ処理プログラム１５Ａを主記憶部１４に読み出して実行することにより、音データコピー処理、音データゲイン処理および音データ解析処理を実現することができる。

なお、音データコピー処理、音データゲイン処理および音データ解析処理を実現するためのプログラムの実行は、複数のプロセッサやコンピュータに分担させてもよい。あるいは、プロセッサ１１は、音データコピー処理、音データゲイン処理および音データ解析処理を実現するためのプログラムの全部または一部の実行を、ネットワーク１９を介してクラウドコンピュータなどに指示し、その実行結果を受け取るようにしてもよい。

＜その他の実施形態＞
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワークまたは記憶媒体を介してシステムまたは装置に供給してもよい。そして、上述の実施形態の１以上の機能は、そのシステムまたは装置のコンピュータにおける１つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＦＰＧＡまたはＡＳＩＣ）でも実現可能である。以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。

１０１音データ処理部、１０２マイク、１０３ＡＧＣ部、１０４音データ配信処理部、１０５音データ解析処理部、１１１音データコピー部、１１２ゲイン処理部

Claims

第１音データをコピーした第２音データを生成するコピー手段と、
前記第１音データと前記第２音データとの少なくとも一方に第１ゲインをかける処理手段と、
を備えることを特徴とするデータ処理装置。
前記処理手段にて第１ゲインがかけられた第１音データを配信する配信手段と、
前記処理手段にて第１ゲインがかけられていない第２音データを解析する解析手段と、
を備えることを特徴とする請求項１に記載のデータ処理装置。
前記処理手段は、前記第１音データにＡＧＣ（ＡｕｔｏＧａｉｎＣｏｎｔｏｒｏｌ）による前記第１ゲインをかける制御手段を備え、
前記第２音データは、前記第１ゲインがかけられる前にコピーされた第１音データのコピーであることを特徴とする請求項２に記載のデータ処理装置。
前記処理手段は、前記第２音データに前記第１ゲインをかけないことを特徴とする請求項３に記載のデータ処理装置。
前記処理手段は、キャリブレーション時のゲインを第２ゲインとして記憶し、前記解析手段で使用される前記第２音データに前記第２ゲインかけることを特徴とする請求項２に記載のデータ処理装置。
前記処理手段は、前記第１音データにＡＧＣ（ＡｕｔｏＧａｉｎＣｏｎｔｏｒｏｌ）による前記第１ゲインをかける制御手段を備え、
前記処理手段にて第１ゲインがかけられた第１音データを配信する配信手段と、
前記処理手段にて第１ゲインがかけられた後にコピーされ前記第１ゲインの少なくとも一部を打ち消すマイナスゲインをかけられた第２音データを解析する解析手段と、
を備えることを特徴とする請求項１に記載のデータ処理装置。
前記処理手段は、前記第１音データにＡＧＣ（ＡｕｔｏＧａｉｎＣｏｎｔｏｒｏｌ）による前記第１ゲインをかける制御手段を備え、
前記処理手段にて第１ゲインがかけられた第１音データを配信する配信手段と、
前記処理手段にてコピーされた第２音データを解析する解析手段と、
を備え、
前記処理手段は、前記第１ゲインの変化に応じて前記第２音データの検知スレッショルドを変化させることを特徴とする請求項１に記載のデータ処理装置。
マイクから出力された音データが撮像装置に入力され、
前記処理手段は、前記撮像装置の駆動部の駆動に応じて前記駆動部の前記駆動中に前記第２音データにマイナスゲインをかけることを特徴とする請求項２から７のいずれか１項に記載のデータ処理装置。
第１音データをコピーした第２音データを生成するステップと、
前記第１音データと前記第２音データとの少なくとも一方にゲインをかけるステップと、
を備えることを特徴とするデータ処理方法。
コンピュータを請求項１から８のいずれか１項に記載のデータ処理装置として動作させるためのプログラム。