JP2016219965A - 指向性制御システム及び音声出力制御方法 - Google Patents

指向性制御システム及び音声出力制御方法 Download PDF

Info

Publication number
JP2016219965A
JP2016219965A JP2015101356A JP2015101356A JP2016219965A JP 2016219965 A JP2016219965 A JP 2016219965A JP 2015101356 A JP2015101356 A JP 2015101356A JP 2015101356 A JP2015101356 A JP 2015101356A JP 2016219965 A JP2016219965 A JP 2016219965A
Authority
JP
Japan
Prior art keywords
sound
directivity
unit
area
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015101356A
Other languages
English (en)
Inventor
徳田 肇道
Tadamichi Tokuda
肇道 徳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2015101356A priority Critical patent/JP2016219965A/ja
Publication of JP2016219965A publication Critical patent/JP2016219965A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】プライバシー保護エリア内で人物により音声が発せられても、その人物が発した音声の内容が他人に知られることなく、人物のプライバシー保護の劣化を抑制する。
【解決手段】カメラ装置CAは、撮像エリアSAの映像を撮像する。マイクアレイ装置MAは、撮像エリアSAの音声を収音する。操作部32は、ディスプレイ装置36に表示された映像に対するプライバシー保護エリアPRAの指定を受け付ける。指向方向算出部34は、マイクアレイ装置MAから指定されたプライバシー保護エリアPRAに対応する音声エリアに向かう指向方向を算出し、算出された指向方向に指向性を形成する。出力制御部35は、マイクアレイ装置MAにより収音された第1の音声の音声データと、プライバシー保護エリアPRAに指向性が形成された第2の音声の音声データとを用いて、プライバシー保護エリアPRAの音声の出力を制限する。
【選択図】図5

Description

本発明は、マイクアレイ装置により収音された音声の出力を制御する指向性制御システム及び音声出力制御方法に関する。
従来、マイクアレイ装置から音声の収音位置(つまり、音源の位置)に向かう指向方向に音声の指向性を形成する指向性制御システムが知られている(例えば、特許文献1参照)。この指向性制御システムは、指定された音声の収音位置(つまり、音源の位置)が既定のプライバシー保護エリアである場合、マイクアレイ装置により収音された音声の音声データの出力を抑制する。
特開2015−029241号公報
しかしながら、特許文献1の構成では、プライバシー保護エリアに近接する外側の位置を音声の収音位置に指定されてしまうと、プライバシー保護エリア内の音が外側に漏れて聞こえてしまい、会話の内容が他人に知られてしまう等、プライバシー保護エリア内にいる人物のプライバシー保護が不十分であるという課題があった。
本発明は、上述した従来の課題を解決するために、プライバシー保護エリア内で人物により音声が発せられても、その人物が発した音声の内容が他人に知られることなく、人物のプライバシー保護の劣化を抑制する指向性制御システム及び音声出力制御方法を提供することを目的とする。
本発明は、撮像エリアの映像を撮像する撮像部と、前記撮像エリアの音声を収音する収音部と、前記撮像部により撮像された映像データを表示する表示部と、前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、指定された前記映像データの指定エリアに対応する音声エリア内の、前記収音部により収音された音声の出力を制限する制御部と、を備える、指向性制御システムである。
また、本発明は、撮像エリアの映像を撮像する撮像部と、前記撮像エリアの音声を収音する収音部と、前記撮像部により撮像された映像データを表示する表示部と、前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、前記収音部から、指定された前記映像データの指定エリアに対応する音声エリアに向かう指向方向を算出する指向方向算出部と、前記指向方向算出部により算出された前記指向方向に、前記収音部により収音された音声の指向性を形成する制御部と、を備え、前記制御部は、前記収音部により収音された第1の音声の音声データと、前記エリア指定に応じて前記制御部により指向性が形成された第2の音声の音声データとを用いて、前記指定エリアの音声の出力を制限する、指向性制御システムを提供する。
また、本発明は、撮像部及び収音部を有する指向性制御システムにおける音声出力制御方法であって、前記撮像部において、撮像エリアの映像を撮像する処理と、前記収音部において、前記撮像エリアの音声を収音する処理と、表示部において、前記撮像部により撮像された映像データを表示する処理と、前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、指定された前記映像データの指定エリア内の、前記収音部により収音された音声の出力を制限する処理と、を実行する、音声出力制御方法を提供する。
また、本発明は、撮像部及び収音部を有する指向性制御システムにおける音声出力制御方法であって、前記撮像部において、撮像エリアの映像を撮像する処理と、前記収音部において、前記撮像エリアの音声を収音する処理と、表示部において、前記撮像部により撮像された映像データを表示する処理と、前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、前記収音部から、指定された前記映像データの指定エリアに対応する音声エリアに向かう指向方向を算出する処理と、算出された前記指向方向に、前記収音部により収音された音声の指向性を形成する処理と、前記収音部により収音された第1の音声の音声データと、前記エリア指定に応じて前記指向性が形成された第2の音声の音声データとを用いて、前記指定エリアの音声の出力を制限する処理と、を実行する、音声出力制御方法を提供する。
本発明によれば、プライバシー保護エリア内で人物により音声が発せられても、その人物が発した音声の内容が他人に知られることなく、人物のプライバシー保護の劣化を抑制できる。
本実施形態の指向性制御システムの内部構成の一例を示すブロック図 (A)〜(E)マイクアレイ装置の外観の一例を示す図 マイクアレイ装置により収音された音声に対して所定の方向に指向性を形成する原理の一例の説明図 本実施形態の指向性制御システムの動作概要の一例の説明図 本実施形態の指向性制御装置の信号処理部における信号処理の一例の説明図 本実施形態の指向性制御装置の音声出力処理の動作手順の一例を説明するフローチャート 図6に続く音声出力処理の動作手順の一例を説明するフローチャート 1つのプライバシー保護エリアを設定する操作の一例を示す図 複数のプライバシー保護エリアを設定する操作の一例を示す図 本実施形態の変形例のマイクアレイ装置の内部構成の一例を示すブロック図 (A)音声データの波形とこの波形の逆位相の波形とを合成して得られる波形の一例を示す図、(B)ボイスチェンジ処理前後の波形の一例を示す図
以下、適宜図面を参照しながら、本発明に係る指向性制御システム及び音声出力制御方法を具体的に開示した実施形態(以下、「本実施形態」という)を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
図1は、本実施形態の指向性制御システム10の内部構成の一例を示すブロック図である。図1に示す指向性制御システム10は、カメラ装置CAと、マイクアレイ装置MAと、指向性制御装置30と、レコーダ装置40とを含む構成を有する。カメラ装置CA、マイクアレイ装置MA、指向性制御装置30及びレコーダ装置40は、ネットワークNWを介して相互にデータ通信可能に接続されている。ネットワークNWは、有線ネットワーク(例えばイントラネット、インターネット)でもよいし、無線ネットワーク(例えば無線LAN(Local Area Network))でもよい。
撮像部の一例としてのカメラ装置CAは、例えば室内の上方(図4参照)に設置された、画角が固定された固定カメラであり、自装置が設置された撮像エリアSAを撮像可能な監視カメラとして機能する。なお、カメラ装置CAは、固定カメラに限らず、撮像エリアSAの全方位画像を撮像可能な全方位カメラ、パン・チルト・ズーム動作自在なPTZ(Pan Tilt Zoom)カメラでもよい。カメラ装置CAは、映像を撮像した時刻(つまり、撮像時刻)を映像データと対応付けて記憶し、ネットワークNWを介して指向性制御装置30又はレコーダ装置40に送信する。
収音部の一例としてのマイクアレイ装置MAは、例えば室内の上方(図4参照)に設置された全方位マイクアレイ装置であり、自装置が設置された収音空間KSにおける全方位の音声を収音する。ここでは、収音空間KSは、撮像エリアSAを含む空間である。
マイクアレイ装置MAは、後述するように、中央に開口部が形成された筐体、及びこの開口部の周囲に円周方向に沿って同心円状に配置された複数のマイクロホンを有する。マイクロホンには、例えば高音質小型エレクトレットコンデンサーマイクロホン(ECM:Electret Condenser Microphone)が用いられる。
マイクアレイ装置MAは、収音した音声データを、収音した時刻(つまり、収音時刻)と対応付けて記憶するとともに、記憶した音声データ及び収音時刻のデータを、ネットワークNWを介して、指向性制御装置30又はレコーダ装置40に送信する。
指向性制御装置30は、例えばマイクアレイ装置MA及びカメラ装置CAが設置された場所から離れた場所に設置される、据置型のPC(Personal Computer)であり、マイクアレイ装置MAで収音された全方位の音声に対し指向性を形成し、その指向方向の音声を強調し、プライバシー保護エリアから発せられる音声を抑制する等の音声出力処理を行う。音声出力処理の詳細については後述する。なお、指向性制御装置30は、PCの代わりに、携帯電話機、タブレット端末、スマートフォン等の通信端末でもよい。
指向性制御装置30は、通信部31と、操作部32と、信号処理部33と、ディスプレイ装置36と、スピーカ装置37と、メモリ38とを少なくとも含む構成である。信号処理部33は、少なくとも指向方向算出部34及び出力制御部35を含む。
通信部31は、カメラ装置CAが送信した撮像時刻を含む映像データ、及びマイクアレイ装置MAが送信した収音時刻を含む音声データを受信して信号処理部33に出力する。
操作部32は、ユーザの入力操作の内容を信号処理部33に通知するためのユーザインターフェース(UI:User Interface)であり、例えばマウス、キーボード等のポインティングデバイスで構成される。また、操作部32は、例えばディスプレイ装置36の画面に対応して配置され、ユーザの指やスタイラスペンによって入力操作が可能なタッチパネル又はタッチパッドを用いて構成されてもよい。
操作部32は、ディスプレイ装置36に表示されたカメラ装置CAの映像データ(図4参照)の中で、ユーザがプライバシー保護を希望するエリアであるプライバシー保護エリアPRA(図中、点線枠)を指定すると、つまり、エリア指定すると、指定された指定エリアの一例としてのプライバシー保護エリアの位置を表す座標データを取得して信号処理部33に出力する。
メモリ38は、例えばRAM(Random Access Memory)を用いて構成され、指向性制御装置30が動作する際、プログラムメモリ、データメモリ、ワークメモリとして機能する。メモリ38は、マイクアレイ装置MAで収音される音声の音声データを収音時刻とともに記憶する。信号処理部33は、メモリ38に記憶された音声データを用いて、後述する音声出力処理を行う。
従って、マイクアレイ装置MAで収音される音声の収音時間より若干遅れて、言い換えると、リアルタイムに音声が収音されたタイミングより僅かに遅れて音声が再生される。この遅れ時間は、マイクアレイ装置MAが音声を収音してから、その音声がプライバシー保護エリア内で収音された音声を抑圧する処理に要する時間である。また、メモリ38に音声データを一旦記憶しておくことで、後述するように、信号処理部33は、プライバシー保護エリアPRAからの音声が検出される所定時間前より音声出力を制御することも可能となる。このように、メモリ38は音声データを一時的に記憶するバッファメモリとしても機能する。
信号処理部33は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)又はDSP(Digital Signal Processor)を用いて構成され、指向性制御装置30の各部の動作を全体的に統括するための制御処理、他の各部との間のデータの入出力処理、データの演算(計算)処理及びデータの記憶処理を行う。
信号処理部33内の指向方向算出部34は、カメラ装置CAで撮像された映像が表示されたディスプレイ装置36に対してユーザによって指定されたプライバシー保護エリアの座標を、マイクアレイ装置MAからプライバシー保護エリアに対応する音声エリアに向かう指向方向を示す座標に変換する。
この座標の変換処理では、指向方向算出部34は、プライバシー保護エリアの指定に応じて、マイクアレイ装置MAからプライバシー保護エリアに対応する音声エリアに向かう指向方向を示す座標(θh,θv)を算出する。この座標算出処理の詳細については、例えば上記特許文献1に記載されている。ここで、θhはマイクアレイ装置MAから音声位置に向かう指向方向の水平角を表し、θvはマイクアレイ装置MAから音声位置に向かう指向方向の垂直角を表す。音声位置は、操作部32がディスプレイ装置36に表示された映像データにおいてユーザの指又はスタイラスペンによって指定された指定位置に対応する実際の音源の位置である。
また、指向方向算出部34は、カメラ装置CAで撮像された映像が表示されたディスプレイ装置36に対してユーザによって指定されたプライバシー保護エリアの座標、及び、プライバシー保護エリアに対応する音声エリアに向かう指向方向を示す座標をメモリ38に記憶する。
信号処理部33内の出力制御部35は、カメラ装置CA、マイクアレイ装置MA、ディスプレイ装置36及びスピーカ装置37の動作を制御し、カメラ装置CAから送信された映像データをディスプレイ装置36に出力させ、マイクアレイ装置MAから送信された音声データをスピーカ装置37に音声出力させる。制御部の一例としての出力制御部35は、マイクアレイ装置MAが収音して指向性制御装置30に送信した音声データを用いて指向性の形成処理を行うことで、信号処理部33により算出された収音方向の座標(θh,θv)に対応する指向方向に、音声データの指向性を形成する。また、出力制御部35は、マイクアレイ装置MAで収音された音声を出力する際、プライバシー保護エリア内で収音された音声を抑圧する。この動作の詳細については後述する。
表示部の一例としてのディスプレイ装置36は、カメラ装置CAが撮像した映像データを画面に表示する。
音声出力部の一例としてのスピーカ装置37は、マイクアレイ装置MAが収音した音声データ、又は信号処理部33が指向方向(θh,θv)に指向性が形成されたマイクアレイ装置MAが収音した音声データを音声出力する。なお、ディスプレイ装置36及びスピーカ装置37は、指向性制御装置30とは別体の装置として構成されてもよい。
レコーダ装置40は、マイクアレイ装置MAから送信されたパケットに含まれる音声データと、例えばカメラ装置CAから送信された画像データとを対応付けて記憶する。
図2(A)〜(E)は、マイクアレイ装置MAの外観を示す図である。ここで、マイクアレイ装置MAの外観について、図2(A)〜(E)を参照して説明する。図2(A)〜図2(E)は、マイクアレイ装置MAで総称される、各マイクアレイ装置MAz,MAy,MAx,MAw,MAvの外観図である。各マイクアレイ装置MAz,MAy,MAx,MAw,MAvでは、外観及び複数のマイクロホンの配置が異なるが、各々のマイクアレイ装置の機能は同等である。
図2(A)に示すマイクアレイ装置MAzは、円盤状の筐体21zを有する。筐体21zには、複数のマイクロホン22,23が同心円状に配置されている。具体的に、複数のマイクロホン22が、筐体21zと同一の中心を有する同心円状に且つ筐体21zの外側に配置され、複数のマイクロホン23が、筐体21zと同一の中心を有する同心円状に且つ筐体21zの内側に配置されている。各々のマイクロホン22は、互いの間隔が広く、直径が大きく、低い音域に適した特性を有する。一方、各々のマイクロホン23は、互いの間隔が狭く、直径が小さく、高い音域に適した特性を有する。
図2(B)に示すマイクアレイ装置MAyは、円盤状の筐体21yを有する。筐体21yには、複数のマイクロホン22が、一様な間隔を隔てて縦方向と横方向の2方向に沿って直線上に配置され、縦方向の配列と横方向の配列とが筐体21yの中心において交わっている。マイクアレイ装置MAyは、複数のマイクロホン22が縦方向と横方向の2方向に直線的に配置されているので、音声データの指向性の形成処理の演算量を低減できる。なお、図2(B)に示すマイクアレイ装置MAyにおいて、縦方向又は横方向の1列だけに、複数のマイクロホン22が配置されてもよい。
図2(C)に示すマイクアレイ装置MAxは、図2(A)に示すマイクアレイ装置MAzに比べ、直径の小さい円盤状の筐体21xを有する。筐体21xには、複数のマイクロホン22が、筐体21xの円周方向に沿って一様な間隔を隔てて配置されている。図2(C)に示すマイクアレイ装置MAxは、各々のマイクロホン22の間隔が短いので、高い音域に適した特性を有する。
図2(D)に示すマイクアレイ装置MAwは、筐体21wの中心に所定の直径を有する開口部21aが形成されたドーナツ型形状又はリング型形状の筐体21wを有する。本実施形態の指向性制御システム10では、例えば図2(D)に示すマイクアレイ装置MAwが用いられる。筐体21wでは、複数のマイクロホン22が、筐体21wの円周方向において、一様な間隔を隔てて同心円状に配置されている。
図2(E)に示すマイクアレイ装置MAvは、矩形状の筐体21vを有する。筐体21vには、複数のマイクロホン22が、筐体21vの外周方向に沿って一様な間隔を隔てて配置されている。図2(E)に示すマイクアレイ装置MAvでは、筐体21vが矩形形状であるので、例えばコーナー又は壁面においてもマイクアレイ装置MAvの設置を簡易化できる。
なお、各マイクロホンは、無指向性マイクロホンでも良いし、双指向性マイクロホン、単一指向性マイクロホン、鋭指向性マイクロホン、超指向性マイクロホン(例えばガンマイク)又はこれらの組み合わせが用いられてもよい。
図3は、マイクアレイ装置MAにより収音された音声に対して所定の方向に指向性を形成する原理の一例の説明図である。指向性制御装置30は、マイクアレイ装置MAから送信された音声データを用いて、音声データの指向性制御処理によって各々のマイクロホン221〜22nにより収音された各音声データを加算し、マイクアレイ装置MAの各マイクロホン221〜22nの位置から特定方向への音声の音量レベルを強調、つまり、増幅するために、特定方向への指向性を形成した音声データを生成する。特定方向とは、マイクアレイ装置MAから操作部32で指定された音声位置に向かう方向である。なお、マイクアレイ装置MAによって収音される音声の指向性を形成するための音声データの指向性制御処理に関する技術は、例えば特開2014−143678号公報や、特開2015−029241号公報(つまり、特許文献1)等に示されるように、公知の技術である。
図3では、説明を分かり易くするため、マイクロホンは直線上に一次元配列としている。この場合、指向性は面内の二次元空間になるが、三次元空間で指向性を形成するためには、マイクロホンを二次元配列にして同様な処理方法を行えば良い。
音源80から発した音波は、マイクアレイ装置MAに内蔵される各マイクロホン221,222,223,〜,22(n−1),22nに対し、ある一定の角度(入射角=(90−θ)[度])で入射する。入射角θは、マイクアレイ装置MAから音声位置に向かう指向方向の水平角θhでも垂直角θvでもよい。
音源80は、例えばマイクアレイ装置MAが収音する収音方向に存在するカメラ装置CAの被写体である人物の会話であり、マイクアレイ装置MAの筐体21の面上に対し、所定角度θの方向に存在する。また、各マイクロホン221,222,223,…,22(n−1),22n間の間隔dは一定とする。
音源80から発した音波は、最初にマイクロホン221に到達して収音され、次にマイクロホン222に到達して収音され、同様に次々に収音され、最後にマイクロホン22nに到達して収音される。
マイクアレイ装置MAの各マイクロホン221,222,223,…,22(n−1),22nが収音したアナログの音声データを、A/D変換器241,242,243,〜,24(n−1),24nがデジタルの音声データにAD変換する。
更に、遅延器251,252,253,〜,25(n−1),25nが、各々のマイクロホン221,222,223,…,22(n−1),22nにおける到達時間差に対応する遅延時間を与えて全ての音波の位相を揃えた後、加算器26が遅延処理後の音声データを加算し、加算後の音声データ27を出力する。これにより、マイクアレイ装置MAの各マイクロホン221,222,223,…,22(n−1),22nで収音された音声データに、所定角度θの方向に指向性を形成することが可能となる。
このように、マイクアレイ装置MAで収音された音声データに対し、遅延器251,252,253,〜,25(n−1),25nに設定される遅延時間D1,D2,D3,〜,Dn−1,Dnを変更することで、収音した音声データの指向性を簡易に形成することができる。
なお、マイクアレイ装置MAで収音された音声データに対し、遅延器251,252,253,〜,25(n−1),25n及び加算器26は、マイクアレイ装置MAに内蔵され、マイクアレイ装置MAからは、指向性が形成された音声データが出力させてもよいが、本実施形態では、遅延器251,252,253,〜,25(n−1),25n及び加算器26は、指向性制御装置30の信号処理部33に備わる。従って、マイクアレイ装置MAからは、単に撮像エリアで収音された無指向性の音声データが出力される。
上記構成を有する指向性制御システム10の動作を示す。
始めに、指向性制御システム10の動作概要について、図4を参照して説明する。図4は、本実施形態の指向性制御システム10の動作概要の一例の説明図である。指向性制御システム10が収音対象とする場所(例えば応接スペースを含む場所)には、カメラ装置CA及びマイクアレイ装置MAが設置される。また、この場所から離れて、指向性制御装置30及びレコーダ装置40が置かれる。
カメラ装置CAは、支柱81に支持され、図4中の上方に設定された位置PS1から固有の画角の範囲内に映る被写体(撮像エリアSA)を撮像するように設置される。図4では、撮像エリアSAは、2人の人物hm1,hm2がそれぞれ椅子73,74に腰かけて会話している応接スペース71に設定されている。
マイクアレイ装置MAは、支柱82に支持され、図中上方に設定された位置PS2から撮像エリアSAを含む収音空間KSで発せられる音声を収音するように設置される。マイクアレイ装置MAは、収音空間KS内の音声を収音する。図4では、応接スペース71内にいる2人の人物hm1,hm2がそれぞれ椅子73,74に腰かけて会話しており、マイクアレイ装置MAは、一方の人物hm1が呼びかけた「Hello」の音声を収音し、他方の人物hm2が発声した「Thanks」の音声を収音している。
カメラ装置CAが撮像した映像データは、指向性制御装置30のディスプレイ装置36に表示される。ディスプレイ装置36に表示された映像の中から、ユーザの指FGによりプライバシー保護エリアPRA(図中、破線枠)が指定されると、このプライバシー保護エリアPRAの撮像位置に対応する音声位置を含む収音空間の、マイクアレイ装置MAにより収音された音声の出力が指向性制御装置30によって抑制される。ここでは、人物hm2が発声した「Thanks」の音声は消去(ミュート処理)され、スピーカ装置37からは、人物hm1が発声した「Hello」の音声だけが再生される。
ユーザが指FGでディスプレイ装置36に表示された映像に対しプライバシー保護エリアPRAを指定する場合、指向性制御装置30は、この指定位置を表す座標データを用いて、マイクアレイ装置MAの位置PS2から音声位置に向かう指向方向を示す座標(θh,θv)を算出する。更に、指向性制御装置30は、この座標(θh,θv)の座標データを用いて、マイクアレイ装置MAの位置PS2から音声位置に向かう指向方向に指向性を形成する。
プライバシー保護エリアPRAに指向性が形成された場合、後述するように(図5参照)、プライバシー保護エリアPRA内で発せられた音声が、全体の音声から差し引かれて、スピーカ装置37から再生された音声が出力される。従って、プライバシー保護エリアPRA内の人物hm2が発した音声はスピーカ装置37から出力されない。
図5は、本実施形態の指向性制御装置30の信号処理部33における信号処理の一例の説明図である。マイクアレイ装置MAの各マイクロホン221,222,…,22nは、全体の音声信号として、無指向性の音声信号A1を出力する。ユーザは、映像が表示されたディスプレイ装置36上においてプライバシー保護エリアPRAを任意に指定する。指向方向算出部34は、指定されたプライバシー保護エリアPRAの範囲内に対して音声の指向性を形成し、プライバシー保護エリアPRAからの音声信号Bを抽出する。音声信号Bは、プライバシー保護エリアPRAの音声が強調される指向特性を有する。
出力制御部35は、全体の音声信号A1からプライバシー保護エリア内の音声信号Bを適応的に差し引くことで、プライバシー保護エリアPRA内の音声信号Bが抑圧された、つまり、プライバシー保護エリアPRAの外側の音声が強調された音声信号Cを出力する。
これにより、指向性制御装置30は、プライバシー保護エリアPRAからの音声信号を抑圧した音声信号Cを出力する。なお、全体の信号として、マイクアレイ装置MAから出力される、無指向性の音声信号A1を用いる代わりに、ユーザによって指定された特定の方向に、指向方向算出部34が指向性を形成し、この指向方向の音声信号A2を用いてもよい。
図6及び図7は、本実施形態の指向性制御装置30の音声出力処理の動作手順の一例を説明するフローチャートである。指向性制御システム10では、カメラ装置CAは、常に撮像エリアSAを撮像している。また、マイクアレイ装置MAは、撮像エリアSAを含む収音空間KSで発せられる音声を収音する。マイクアレイMAで収音された音声の音声データは、カメラ装置CAで撮像された映像データとともに、ネットワークNWを介してレコーダ装置40に送信される。レコーダ装置40は、音声データ及び映像データを記録する。また、マイクアレイMAで収音された音声の音声データは、指向性制御装置30に送信される。指向性制御装置30は、受信した音声データをメモリ38に記憶する。
カメラ装置CAによって撮像された映像がディスプレイ装置36に表示された画面上で、ユーザが指FGでプライバシー保護エリアPRAを指定すると、操作部32は、指定されたプライバシー保護エリアPRAを受け付ける(S1)。プライバシー保護エリアPRAの範囲は、任意の形状及び位置に指定可能である。例えば、プライバシー保護エリアPRAの範囲は、矩形を表す対角点の座標(θhp1,θvp1),(θhp2,θvp2)で設定されてもよい。この場合、2点の座標値を入力するだけであるので、操作部32としてキーボードによる入力が可能である。また、プライバシー保護エリアPRAの範囲は、図4に示すような楕円形、矩形或いは任意の閉曲線に設定されてもよい。操作部32によって指定されたプライバシー保護エリアPRAの範囲はメモリ38に記憶される。プライバシー保護エリアPRAの設定のし方については後述する。
指向方向算出部34は、無指向状態で収音された音声信号A1に対し、プライバシー保護エリアPRA内に指向性を形成する(S2)。指向方向算出部34は、プライバシー保護エリアPRAに指向性が形成された音声信号Bを抽出する(S3)。
信号処理部33は、スピーカ装置37から出力される音声を強調するためのユーザによる位置指定があったか否かを判別する(S4)。ユーザによる位置指定があった場合(S4、YES)、つまり、音声の指向性が形成されるためのユーザによる位置指定があった場合、指向方向算出部34は、指定された位置に対応する指向方向(θh,θv)を取得又は算出する(S5)。
指向方向算出部34は、無指向状態で収音された音声信号A1に対し、指向方向(θh,θv)に指向性を形成する(S6)。指向方向算出部34は、指向方向(θh,θv)に指向性が形成された音声信号A2を抽出する(S7)。
出力制御部35は、指向方向(θh,θv)に指向性が形成された音声信号A2から、プライバシー保護エリアPRAに指向性が形成された音声信号Bを差し引く(減算)処理を行い、音声信号Bを抑圧する(S8)。出力制御部35は、プライバシー保護エリアPRA内の音声信号Bが抑圧された音声信号Cを出力する(S9)。この後、指向性制御装置30は、図6及び図7に示す音声出力処理の動作を終了する。
一方、ステップS4でユーザによる位置指定が無かった場合(S4、NO)、つまり、音声の指向性が形成されるためのユーザによる位置指定が無かった場合、信号処理部33は、レコーダ装置40又はメモリ38に記憶された、無指向状態で収音された音声信号A1を取得する(S10)。ステップS8の処理と同様、出力制御部35は、無指向状態の音声信号A1から、プライバシー保護エリアPRAに指向性が形成された音声信号Bを差し引く(減算)処理を行い、音声信号Bを抑圧する(S10)。出力制御部35は、ステップS9でプライバシー保護エリアPRAの音声信号が抑圧された音声信号Cを出力する。この後、指向性制御装置30は、図6及び図7に示す音声出力処理の動作を終了する。
図8は、1つのプライバシー保護エリアPRAを設定する操作の一例を示す図である。ディスプレイ装置36及び操作部32は、前述したように、タッチパネルで構成される。ユーザは、指FG又はスタイラスペンを用いて、ディスプレイ装置36の画面に表示された人物hm2を楕円形に囲むように、プライバシー保護エリアPRAを指定する。従って、人物hm2を囲む楕円形の範囲がプライバシー保護エリアPRAに設定される。この場合、スピーカ装置37からは、人物hm2が発した音声は出力されない。なお、図中、ディスプレイ装置36の画面に表示された、「Hello」、「…」の吹き出しは、便宜的に描かれているだけで、実際には表示されないが、指向性制御装置30により表示されるようにしてもよい。
図9は、複数(例えば2つ)のプライバシー保護エリアPRA1、PRA2を設定する操作の一例を示す図である。カメラ装置CAで撮像され、ディスプレイ装置36の画面に表示された映像には、新たに3人目の人物hm3が登場している。ユーザは、指FG又はスタイラスペンを用いて、ディスプレイ装置36の画面に表示された人物hm1,hm2をそれぞれ楕円形に囲むように、プライバシー保護エリアPRA1,PRA2を指定する。従って、人物hm1を囲む楕円形の範囲がプライバシー保護エリアPRA1に設定され、人物hm2を囲む楕円形の範囲がプライバシー保護エリアPRA2に設定される。この場合、スピーカ装置37からは、人物hm1と人物hm2の双方が発した音声は出力されない。3人目の人物hm3は、プライバシー保護エリアの範囲外であるので、スピーカ装置37からは、人物hm3が発声した「Bye」の音声だけが出力される。なお、図中、ディスプレイ装置36の画面に表示された、「…」,「Bye」,「…」の吹き出しは、便宜的に描かれているだけで、実際には表示されないが、指向性制御装置30により表示されるようにしてもよい。
なお、本実施形態では、複数のプライバシー保護エリアPRA1,PRA2に対し、同じような方法で音声出力を抑圧する場合を示したが、プライバシー保護エリア毎に異なる方法で音声出力を抑圧してもよい。例えば、プライバシー保護エリアPRA1内の音声に対しては、前述したように減算処理を行うことで、音声の内容を分からなくし、プライバシー保護エリアPRA1内の音声に対しては、ボイスチェンジ処理を行うことで、音声の内容を分からなくしてもよい。
以上により、本実施形態の指向性制御システム10では、カメラ装置CAは、撮像エリアSAの映像を撮像する。マイクアレイ装置MAは、撮像エリアSAの音声を収音する。ディスプレイ装置36は、カメラ装置CAにより撮像された映像を表示する。操作部32は、ディスプレイ装置36に表示された映像に対するプライバシー保護エリアPRAの指定を受け付ける。指向方向算出部34は、マイクアレイ装置MAから、指定されたプライバシー保護エリアPRAに対応する音声エリアに向かう指向方向を算出し、算出された指向方向に、マイクアレイ装置MAにより収音された音声に対して指向性を形成する。出力制御部35は、マイクアレイ装置MAにより収音された第1の音声の音声データと、プライバシー保護エリアPRAに指向性が形成された第2の音声の音声データとを用いて、プライバシー保護エリアPRAの音声の出力を制限する。また、出力制御部35は、マイクアレイ装置MAにより収音された第1の音声の音声データを用いて、映像データが表示されたディスプレイ装置36に対する任意のプライバシー保護エリアPRAの指定に応じて、指定された映像データのプライバシー保護エリアPRAに対応する音声エリア内の、マイクアレイ装置MAにより収音された音声の出力を制限してもよい。例えば、出力制御部35は、プライバシー保護エリアPRAの指定があると、プライバシー保護エリアPRAの座標を操作部32から取得する。また、メモリ38は、例えば音声出力を制限するための既定のプライバシー保護エリアの座標又はその範囲と実際に操作部32において指定されたプライバシー保護エリアPRAの座標又はその範囲との対応関係の一例を示すテーブルを記憶しているとする。この場合、出力制御部35は、操作部32から取得した座標又はその範囲が既定のプライバシー保護エリアの座標又はその範囲に含まれる場合に、マイクアレイ装置MAにより収音された第1の音声の音声データを用いて抑圧処理することで、音声の出力を制限する。なお、この音声の出力の制限には、後述するように、音声の音量レベルの抑圧処理に限らず、例えばミュート処理、マスキング処理又はボイスチェンジ処理でもよい。
これにより、指向性制御システム10は、プライバシー保護エリア内で人物により音声が発せられても、その人物が発した内容が他人に知られることなく、人物のプライバシー保護の劣化を抑制できる。また、指向性制御システム10は、プライバシー保護エリアの外側で収音された音声を出力する場合でも、プライバシー保護エリア内の音が漏れ出ることは無くなる。
また、マイクアレイ装置MAにより収音された第1の音声は無指向性の音声であり、出力制御部35は、無指向性の音声の音声データから、プライバシー保護エリアPRAに指向性が形成された第2の音声の音声データを差し引くことで、プライバシー保護エリアPRAの音声の出力を制限する。これにより、全体の音声を聞く場合にプライバシー保護エリア内の音が紛れることがなく、プライバシーが保護される。
また、マイクアレイ装置MAにより収音された第1の音声は、特定の方向に指向性が形成された音声であり、出力制御部35は、指向性が形成された音声の音声データから、プライバシー保護エリアPRAに指向性が形成された第2の音声の音声データを差し引くことで、プライバシー保護エリアPRAの音声の出力を制限する。これにより、特定の方向に指向性が形成された音声を聞く場合も、プライバシー保護エリア内の音が紛れることがなく、プライバシーが保護される。
また、操作部32は、ディスプレイ装置36に表示された映像に対し、1つ又は複数のプライバシー保護エリアPRA1,PRA2の指定を受け付ける。これにより、秘匿化(マスク処理)したい箇所を任意に指定可能であり、操作性が向上する。
(本実施形態の変形例)
前述実施形態では、指向性制御装置30がプライバシー保護エリア内の人物が発した音声の出力を制限していた。本実施形態の変形例では、指向性制御装置の代わりに、これらの処理をマイクアレイ装置が行う場合を示す。
図10は、本実施形態の変形例のマイクアレイ装置MBの内部構成の一例を示すブロック図である。本実施形態の変形例のマイクアレイ装置MBにおいて、前述実施形態におけるマイクアレイ装置MAと同一の構成要素については同一の符号を用いることでその説明を省略する。
マイクアレイ装置MBは、複数のマイクロホン221、222、…、22n、アンプ231,232,…,23n、A/D変換器241,242,243,…,24n、CPU25、符号化部28及び通信部29を有する。
アンプ231,232,…,23nは、複数のマイクロホン221、222、…、22nで収音した音声信号を増幅する。A/D変換器241,242,243,…,24nは、それぞれアンプ231,232,…,23nによって増幅された音声信号をデジタル音声データに変換する。
CPU25は、複数のマイクロホン221、222、…、22nで収音し、A/D変換器241,242,243,…,24nによって変換された音声データを入力し、これらの音声データを基に、音声出力処理を行う。また、CPU25は、通信部29を介して受信したプライバシー保護エリアPRAの位置情報(つまり、位置座標)を内部メモリに記憶している。また、CPU25は、複数のマイクロホン221、222、…、22nで収音された音声信号A(具体的には、指向性が形成された音声信号、或いは無指向状態で収音された音声信号)を取得し、この音声信号Aから、プライバシー保護エリアPRAに指向性が形成された音声信号Bを差し引く(減算)処理を行い、プライバシー保護エリアPRAの音声信号が抑圧された音声信号Cを出力する(図5参照)。つまり、CPU25は、前述実施形態における指向方向算出部34及び出力制御部35の機能を有する。
符号化部28は、CPU25から出力される音声データを符号化し、ネットワークNWで伝送可能な音声パケットを生成する。通信部29は、符号化部28によって符号化された音声データを、ネットワークNWを介して指向性制御装置30に送信し、また、ネットワークNWを介して指向性制御装置30から送信されるプライバシー保護エリアPRAの位置情報を受信する。
このような構成有するマイクアレイ装置MBは、収音した音声データを、収音した時刻(つまり、収音時刻)と対応付けて記憶するとともに、記憶した音声データ及び収音時刻のデータを、ネットワークNWを介して、指向性制御装置30又はレコーダ装置40に送信する。
以上により、本実施形態の変形例の指向性制御システム10では、マイクアレイ装置MBからネットワークNWを介して送信される音声データは、プライバシー保護エリア内で収音された音声が抑圧された音声データであるので、この音声データがマイクアレイ装置MBから指向性制御装置30に送信される途中で盗聴されても情報が漏れることはなく、マイクアレイ装置MBは、安全に音声データを送信できる。また、この場合、音声データには、プライバシー保護エリア内の音声が抑圧されていることを付属情報として、音声データのヘッダに付加してもよく、付加しておくことで音声データを受け取った側では、音声データが一部秘匿化されていることを即座に知ることができる。
以上、図面を参照しながら実施形態及びその変形例について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば、上記本実施形態では、音声信号A(A1,A2)からプライバシー保護エリア内で抽出した音声信号Bを差し引くことで、音声出力を制限していたが、これに限らず、例えば音声信号Aに対しプライバシー保護エリアで発せられた音声信号Bを用いて重み付けを行う(例えば、音声信号Bに応じて値0〜値1の範囲の係数を乗算する)ことで、音声出力を制限してもよい。
また、音声出力を制限する方法として、ミュート処理を示したが、これに限らず、マスキング処理又はボイスチェンジ処理を行うようにしてもよい。図11(A)は、音声データの波形とこの波形の逆位相の波形とを合成して得られる波形の一例を示す図である。出力制御部35は、マイクアレイ装置MAにより収音された音声の音声信号波形aの逆位相波形bを生成し、音声信号波形aと音声信号波形の逆位相波形bとを合成処理(マスキング処理ともいう)することで、マイクアレイ装置MAにより収音された音声、もしくはマイクアレイ装置MAにより収音されて指向性が形成された音声の出力を抑制した音声信号波形cを得てもよい。
図11(B)は、ボイスチェンジ処理前後の波形の一例を示す図である。出力制御部35は、マイクアレイ装置MAにより収音された、音声信号波形dを有する音声の音声データ、もしくはマイクアレイ装置MAにより収音されて指向性が形成された音声の音声データに対し、ボイスチェンジ処理を施して音声信号波形eを得てもよい。出力制御部35は、マイクアレイ装置MAにより収音された音声の音声データ、もしくはマイクアレイ装置MAにより収音されて指向性が形成された音声の音声データの波形のピッチを増大又は減少する。これにより、出力制御部35は、プライバシー保護エリア内で発せられた音声が誰の声であるかを特定することが難しなり、また、音声の内容を分かりにくくすることができ、プライバシーを効果的に保護することができる。
本発明は、プライバシー保護エリア内で人物により音声が発せられても、その人物が発した音声の内容が他人に知られることなく、人物のプライバシー保護の劣化を抑制する指向性制御システム及び音声出力制御方法として有用である。
10 指向性制御システム
21,21z,21y,21x,21w,21v 筐体
21a 開口部
22,23,221,222,…,22n マイクロホン
25 CPU
26 加算器
27 加算後の音声データ
28 符号化部
29 通信部
30 指向性制御装置
31 通信部
32 操作部
33 信号処理部
34 指向方向算出部
35 出力制御部
36 ディスプレイ装置
37 スピーカ装置
38 メモリ
40 レコーダ装置
71 応接スペース
80 音源
231,232,…,23n アンプ
241,242,243,…,24n A/D変換器
251,252,253,…,25n 遅延器
a,b,c,d,e 音声信号波形
CA カメラ装置
hm1,hm2,hm3 人物
NW ネットワーク
MA,MB,MAv,MAw,MAx,MAy,MAz マイクアレイ装置
PS1,PS2 位置
PRA,PRA1,PRA2 プライバシー保護エリア

Claims (7)

  1. 撮像エリアの映像を撮像する撮像部と、
    前記撮像エリアの音声を収音する収音部と、
    前記撮像部により撮像された映像データを表示する表示部と、
    前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、指定された前記映像データの指定エリアに対応する音声エリア内の、前記収音部により収音された音声の出力を制限する制御部と、を備える、
    指向性制御システム。
  2. 撮像エリアの映像を撮像する撮像部と、
    前記撮像エリアの音声を収音する収音部と、
    前記撮像部により撮像された映像データを表示する表示部と、
    前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、前記収音部から、指定された前記映像データの指定エリアに対応する音声エリアに向かう指向方向を算出する指向方向算出部と、
    前記指向方向算出部により算出された前記指向方向に、前記収音部により収音された音声の指向性を形成する制御部と、を備え、
    前記制御部は、前記収音部により収音された第1の音声の音声データと、前記エリア指定に応じて前記制御部により指向性が形成された第2の音声の音声データとを用いて、前記指定エリアの音声の出力を制限する、
    指向性制御システム。
  3. 請求項2に記載の指向性制御システムであって、
    前記第1の音声は無指向性の音声であり、
    前記制御部は、前記無指向性の音声の音声データから、前記第2の音声の音声データを差し引くことで、前記指定エリアの音声の出力を制限する、
    指向性制御システム。
  4. 請求項2に記載の指向性制御システムであって、
    前記第1の音声は、特定の方向に指向性が形成された音声であり、
    前記制御部は、前記指向性が形成された音声の音声データから、前記第2の音声の音声データを差し引くことで、前記指定エリアの音声の出力を制限する、
    指向性制御システム。
  5. 請求項2に記載の指向性制御システムであって、
    前記映像データが表示された前記表示部に対し、1つ又は複数の前記エリア指定を受け付ける操作部、を更に備えた、
    指向性制御システム。
  6. 撮像部及び収音部を有する指向性制御システムにおける音声出力制御方法であって、
    前記撮像部において、撮像エリアの映像を撮像する処理と、
    前記収音部において、前記撮像エリアの音声を収音する処理と、
    表示部において、前記撮像部により撮像された映像データを表示する処理と、
    前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、指定された前記映像データの指定エリア内の、前記収音部により収音された音声の出力を制限する処理と、を実行する、
    音声出力制御方法。
  7. 撮像部及び収音部を有する指向性制御システムにおける音声出力制御方法であって、
    前記撮像部において、撮像エリアの映像を撮像する処理と、
    前記収音部において、前記撮像エリアの音声を収音する処理と、
    表示部において、前記撮像部により撮像された映像データを表示する処理と、
    前記映像データが表示された前記表示部に対する任意のエリア指定に応じて、前記収音部から、指定された前記映像データの指定エリアに対応する音声エリアに向かう指向方向を算出する処理と、
    算出された前記指向方向に、前記収音部により収音された音声の指向性を形成する処理と、
    前記収音部により収音された第1の音声の音声データと、前記エリア指定に応じて前記指向性が形成された第2の音声の音声データとを用いて、前記指定エリアの音声の出力を制限する処理と、を実行する、
    音声出力制御方法。
JP2015101356A 2015-05-18 2015-05-18 指向性制御システム及び音声出力制御方法 Pending JP2016219965A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015101356A JP2016219965A (ja) 2015-05-18 2015-05-18 指向性制御システム及び音声出力制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015101356A JP2016219965A (ja) 2015-05-18 2015-05-18 指向性制御システム及び音声出力制御方法

Publications (1)

Publication Number Publication Date
JP2016219965A true JP2016219965A (ja) 2016-12-22

Family

ID=57581718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015101356A Pending JP2016219965A (ja) 2015-05-18 2015-05-18 指向性制御システム及び音声出力制御方法

Country Status (1)

Country Link
JP (1) JP2016219965A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149664A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 出力装置、出力方法及び出力プログラム
JP7438678B2 (ja) 2019-07-05 2024-02-27 清水建設株式会社 局所的音場支援装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7438678B2 (ja) 2019-07-05 2024-02-27 清水建設株式会社 局所的音場支援装置
JP2021149664A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 出力装置、出力方法及び出力プログラム
JP7248615B2 (ja) 2020-03-19 2023-03-29 ヤフー株式会社 出力装置、出力方法及び出力プログラム

Similar Documents

Publication Publication Date Title
JP6202277B2 (ja) 音声処理システム及び音声処理方法
JP5958833B2 (ja) 指向性制御システム
US10497356B2 (en) Directionality control system and sound output control method
JP2016146547A (ja) 収音システム及び収音方法
JP5857674B2 (ja) 画像処理装置、及び画像処理システム
WO2014103331A1 (ja) 音声処理システム及び音声処理方法
US20210158828A1 (en) Audio processing device, image processing device, microphone array system, and audio processing method
CN111724823A (zh) 一种信息处理方法及装置、电子设备
US20110193935A1 (en) Controlling a video window position relative to a video camera position
JP2015139162A (ja) 音響信号処理装置、動画撮影装置およびそれらの制御方法
JP5939341B1 (ja) モニタリングシステム及びモニタリング方法
JP2011055076A (ja) 音声通話装置及び音声通話方法
JP6145736B2 (ja) 指向性制御方法、記憶媒体及び指向性制御システム
US11776555B2 (en) Audio modification using interconnected electronic devices
US9516417B2 (en) Boundary binaural microphone array
JP6447976B2 (ja) 指向性制御システム及び音声出力制御方法
JP2016219965A (ja) 指向性制御システム及び音声出力制御方法
WO2019176153A1 (ja) 収音装置、記憶媒体及び方法
JP6569853B2 (ja) 指向性制御システム及び音声出力制御方法
WO2018198790A1 (ja) コミュニケーション装置、コミュニケーション方法、プログラム、およびテレプレゼンスシステム
US20220337945A1 (en) Selective sound modification for video communication
JP6256774B2 (ja) 指向性制御システム、音声出力制御方法及び記録媒体
JP2016119620A (ja) 指向性制御システム及び指向性制御方法
JP2016219966A (ja) 指向性制御システム及び音声出力制御方法
CN117319879A (zh) 处理音频数据的方法、装置、设备和存储介质