JP2019021966A - 収音装置および収音方法 - Google Patents

収音装置および収音方法 Download PDF

Info

Publication number
JP2019021966A
JP2019021966A JP2017135637A JP2017135637A JP2019021966A JP 2019021966 A JP2019021966 A JP 2019021966A JP 2017135637 A JP2017135637 A JP 2017135637A JP 2017135637 A JP2017135637 A JP 2017135637A JP 2019021966 A JP2019021966 A JP 2019021966A
Authority
JP
Japan
Prior art keywords
sound
unit
sound collection
directivity
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017135637A
Other languages
English (en)
Inventor
純一 内田
Junichi Uchida
純一 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2017135637A priority Critical patent/JP2019021966A/ja
Priority to US16/027,411 priority patent/US10531188B2/en
Publication of JP2019021966A publication Critical patent/JP2019021966A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)
  • Stereophonic Arrangements (AREA)

Abstract

【課題】収音対象の状態に応じて指向性を制御することが可能な収音装置および収音方法を提供する。【解決手段】利用者と対象物を結ぶ方向(光軸O、z軸)と略直交する方向(x軸)に隔てて配置され(ステレオ用位置差Ds)、利用者と対象物を結ぶ方向においても距離に差異をもたせて配置した(指向性用位置差Dd)ステレオマイク(2bR、2bL)と、ステレオマイク(2bR、2bL)からの音声信号の指向性を調整する指向性制御部を有する。【選択図】 図3

Description

本発明は、ステレオマイクを用いて収音する場合に、ノイズを簡単な構成で除去し、また音声収音の収音範囲を容易に制御するようにした収音装置および収音方法に関する。
外来音を収音する際に、ノイズが入ると聴き難いことから、外来音収集用の第1のマイクと、装置の機構音を収音用の第2のマイクを設け、第1のマイクからの音声信号を、第2のマイクからの音声信号で生成した機構オンキャンセル信号によって、ノイズを抑制する音声収音装置が知られている(特許文献1参照)。また、動画撮影時に、マイクで収音する場合に、音源の方向を向くように収音の指向性を制御するようにした音声収音装置も知られている(特許文献2参照)。
特開2013−110629号公報 特開2012−129854号公報
特許文献1に記載の収音装置では、ステレオで外来音を収音する場合には、ステレオ用の2本のマイクに加えて機構音収集用のマイクが必要となり、使用するマイクが多くなってしまう。また、特許文献2に記載の収音装置では、音源の方向が設定されている場合に指向性が切り替えられるだけであって、収音状態に応じて指向範囲を制御することについては記載がない。
本発明は、このような事情を鑑みてなされたものであり、収音対象の状態に応じて指向性を制御することが可能な収音装置および収音方法を提供することを目的とする。
上記目的を達成するため第1の発明に係る収音装置は、利用者と対象物を結ぶ方向と、略直交する方向に隔てて配置され、上記利用者と対象物を結ぶ方向においても距離に差異をもたせて配置したステレオマイクと、上記ステレオマイクからの音声信号の指向性を調整する指向性制御部と、を有する。
第2の発明に係る収音装置は、上記第1の発明において、モードを設定するモード設定部と、を有し、上記指向性制御部は、上記モードに応じて、環境音を収音する第1の収音特性と、対話者を主に収音する第2の収音特性に切り替える。
第3の発明に係る収音装置は、上記第1または第2の発明において、上記第1の収音特性は、前方の対象物に向けた指向性である。
第4の発明に係る収音装置は、上記第1または第2の発明において、上記第1の収音特性は、広範囲のステレオ収音である。
第5の発明に係る収音装置は、上記第1または第2の発明において、上記指向性制御部は、前方と後方からの音声の指向性を調整する。
第6の発明に係る収音装置は、上記第1または第2の発明において、上記指向性制御部は、上記前方の狭範囲を収音する第3の収音特性が可能である。
第7の発明に係る収音装置は、上記第1の発明において、上記指向性制御部は、上記ステレオマイクによって取得した上記使用者の音声が機器制御用のコマンドであるか否かを判定し、判定の結果、上記コマンドである場合には、上記コマンドに従って上記収音装置を制御する。
第8の発明に係る収音方法は、利用者と対象物を結ぶ方向と、略直交する方向に隔てて配置され、上記利用者と対象物を結ぶ方向においても距離に差異をもたせて配置したステレオマイクを有する収音装置の収音方法において、上記ステレオマイクからの2つの音声信号の位相差に応じて、収音の指向性を調整する。
本発明によれば、収音対象の状態に応じて指向範囲を制御することが可能な収音装置および収音方法を提供することができる。
本発明の一実施形態に係る収音装置の主として電気的構成を示すブロック図である。 本発明の一実施形態に係る収音装置で記録されるファイルの構造を示す図である。 本発明の一実施形態に係る収音装置が組み込まれたデジタルカメラの斜視図である。 本発明の一実施形態に係る収音装置の収音範囲を示す図である。 本発明の一実施形態に係る収音装置が組み込まれたデジタルカメラの変形例を示す側面図である。 本発明の一実施形態に係る収音装置における指向性制御回路を示すブロック図である。 本発明の一実施形態に係る収音装置における位相差補正回路における位相補正を説明する図である。 本発明の一実施形態に係る収音装置の使用状態を示す図である。 本発明の一実施形態に係る収音装置の動作を示すフローチャートである。 本発明の一実施形態に係る収音装置の動作を示すフローチャートである。 本発明を内視鏡に適用した収音装置の使用状態を示す図である。
以下、本発明の好ましい実施形態に係る収音装置は、種々の機器に適用可能であり、まず、本発明の、一実施形態としてカメラに適用した例について説明する。なお、このカメラは、通常カメラとして使用されるコンパクトカメラ、一眼カメラのみならず、スマートフォンやタブレットPC等に内蔵されるカメラであってもよい。また、撮像部を有するカメラと制御部を有するスマートフォンの組み合わせのようなシステムであってもよい。
このカメラは、撮像部を有し、この撮像部によって被写体像を画像データに変換し、この変換された画像データに基づいて、被写体像を表示部にライブビュー表示する。撮影者はライブビュー表示を観察することにより、構図やシャッタタイミングを決定する。レリーズ釦が操作されると、静止画の画像データが記録媒体に記録され、また動画釦が操作されると、動画の画像データが記録媒体に記録される。
また、このカメラには、撮影レンズの光軸方向と略直交する方向に2つのマイクが配置され、しかもそれぞれのマイクの光軸方向の位置はずれている(後述する図3、図5参照)。このため、2つのマイクからの音声信号は、通常のステレオマイクの特性に加え、カメラの前後方向(撮影レンズの光軸方向)に位相差がある。この位相差を利用して、収音の指向性(指向範囲)を変えることができ、また特定方向からの音声を利用してノイズを除去することができる。
図1は、本発明の一実施形態に係るカメラ11の電気的構成を示すブロック図である。このカメラ11は情報取得部10と音声補助制御部20から構成される。カメラ11が両部10、20を有するように、一体に構成してもよく、また、情報取得部10のみをカメラで構成し、音声補助制御部20はスマートフォンにそれぞれ機能を担うようにしてもよい。後者の場合には情報取得部10と音声補助制御部20は無線または有線で通信を行えばよい。
収音部2は、複数マイク2bと特性音声抽出部2cを備える。複数マイク2bは、音声を音声信号に変換する。この変換された音声信号はデジタルデータに変換され、さらに種々の処理が施される。マイクの収音特性については、図2を用いて後述する。また複数マイク2bは、利用者と対象物を結ぶ方向と、略直交する方向に隔てて配置され、上記利用者と対象物を結ぶ方向においても上記利用者からの距離に差異をもたせて配置したステレオマイクとして機能する。複数マイク2bのそれぞれのマイクの配置については、図3および図5を用いて後述する。
特定音声抽出部2cは、有効距離設定部2dと指向性制御部2eを有する。後述するように制御部1内には、位相差補正部1dが設けられており、2つのマイクの音声信号の位相差を検出する。有効距離設定部2dは、収音する音源の有効距離を設定する。撮像部3内にズームを駆動する機構が設けられており、その焦点距離情報を検出して有効距離設定機能が動作する。ズームレンズを広角から望遠するに従って、マイクの感度が高くなるようにしている。
また、指向性制御部2eは、指向性制御回路を有し、音声信号の位相差に基づいて、収音範囲、すなわち指向性を制御する。指向性制御部2eは、ステレオマイクからの音声信号の指向性を調整する指向性制御部として機能する。指向性制御回路の詳しい構成については、図6を用いて後述する。
指向性制御部2eは、モードに応じて、環境音を収音する第1の収音特性と、対話者を主に収音する第2の収音特性に切り替える指向性制御部として機能する(例えば、図8(a)の第1の収音特性、図8(b)の第2の収音特性、図9のS3、S5〜S9等参照)。第1の収音特性は、前方の対象物に向けた指向性である(例えば、図8(a)参照)。第1の収音特性は、広範囲のステレオ収音である(例えば、図8(a)参照)。指向性制御部2eは、前方と後方からの音声の指向性を調整する指向性制御部として機能する(例えば、図8(b)、図9のS9参照)。
指向性制御部2eは、前方の狭範囲を収音する第3の収音特性が可能である指向性制御部として機能する(例えば、図8(c)、図9のS9等参照)。指向性制御部2eは、ステレオマイクによって取得した使用者の音声が機器制御用のコマンドであるか否かを判定し、判定の結果、コマンドである場合には、コマンドに従って収音装置を制御する指向性制御部として機能する(例えば、図9のS17、S19等参照)。
撮像部3は、光学レンズ、撮像素子、撮像回路、レンズ駆動機構、レンズ駆動回路、絞り、絞り駆動機構、絞り駆動回路、シャッタ、シャッタ駆動機構、シャッタ駆動回路等、種々の部材、回路等を有する。レンズ駆動機構、絞り、シャッタ等は、適宜省略してもよい。撮像部は、光学レンズによって形成された像を撮像素子によって光電変換し、これによって取得した画像信号(画像データ)を制御部1に出力する。
圧縮部4は、静止画圧縮部4aおよび動画圧縮部4bを有する。静止画圧縮部4aは、制御部1から入力した静止画画像データを圧縮処理し、制御部1に出力する。動画圧縮部4bは、制御部1から入力した動画画像データを圧縮処理、制御部1に出力する。制御部1は、これらの圧縮した画像データを記録部26に出力し、記録部26はこれらの画像データを記録する。なお、圧縮部4は、圧縮処理以外にも、圧縮処理した画像データの伸張処理を行い、表示部8はこの伸張した画像データを用いて表示を行うようにしてもよい。
操作部5は、レリーズ釦、動画釦、モード設定ダイヤル、十字釦等、種々のカメラ操作部材を有し、また表示部8のタッチ状態を検出可能なタッチパネル等を有するようにしてもよい。更に、操作部5は、収音部2による収音がステレオ録音かモノラル録音の指定を行うスイッチ等も有する。操作部5は、各種操作部材の操作状態を検出し、検出結果を制御部1に出力する。スマートフォン等が情報取得部10の機能を果たす場合には、スマートフォン等の機器の操作部材が、操作部5としての機能を担う。操作部5は、モードを設定するモード設定部として機能する。
時計部9は、計時機能やカレンダー機能を有し、計時結果やカレンダー情報を制御部1に出力する。これの情報は、音声や画像情報を記録する際等において使用される。
姿勢判定部7は、ジャイロ、角加速度センサ等のセンサを有し、カメラの姿勢を判定し、判定結果を制御部1に出力する。
表示部8は、ディスプレイを有し、このディスプレイに撮像部3によって取得した画像データに基づくライブビュー表示、記録部26に記録された画像データに基づく再生表示、メニュー画面表示等、種々の表示を行う。ディスプレイとしては、カメラの背面に配置された背面表示ディスプレイ(図5、図8参照)や、接眼部を介して観察する電子ビューファインダ(EVF)(図5参照)等があり、いずれか一方のみでも構わない。
制御部1は、CPU(Central Processing Unit)、プログラムを記憶したメモリ、および周辺回路(ハードウエア回路)を含むASIC(Application Specific Integrated Circuit)で構成される。CPUは、メモリに記憶されたプログラムに従って、情報取得部10および音声補助制御部20内の各部を制御する。なお、音声補助制御部20内の制御は、補助制御部21を介して行う。
制御部1内には画像ファイル生成部1cと位相差補正部1dを有する。本実施形態においては、画像ファイル生成部1cはCPUによってソフト的に実現され、位相差補正部1dは周辺回路によって実現される。なお、画像ファイル生成部1cを周辺回路によって、また位相差補正部1dをソフト的に実現するようにしてもよい。また、周辺回路は特定音声抽出部2c、圧縮部4、姿勢判定部7の機能の一部または全部を実現するようにしてもよい。
画像ファイル生成部1cは、撮像部3によって取得された画像データと、収音部2によって取得された音声データ、およびその他の情報からなる画像ファイルを生成する。画像ファイルとしては、本実施形態としては、静止画画像ファイル、動画画像ファイルA、動画画像ファイルBの3種類があり、画像ファイルの詳しい内容については、図2を用いて後述する。
位相差補正部1dは、位相差補正回路を有し、マイク2dの2つのマイクで収音した音声信号の位相差を検出し、位相差を補正する。この位相差補正部1dにおける位相差補正の仕方については、図7を用いて後述する。
音声補助制御部20は、補助制御部21、コマンド判定部23、テキスト化部25、記録部26を有する。
コマンド判定部23は、ユーザが口頭で機器に対して指示した内容を判定する。すなわち、複数マイク2bによって音声が取得される際に、収音方向(収音範囲)やゲインを調整することにより、ユーザの音声のみを抽出する。そして抽出された音声データを基に、記録部26内のコマンド辞書26bを参照して、ユーザが機器に対して行ったコマンドを判定する。例えば、機器がカメラの場合、ユーザが「ズーミング」と発声した場合、ユーザの声をテキストに変換でき、かつコマンド辞書26bに掲載されていれば、これをコマンドとして認識する。
テキスト化部25は、複数マイク2bによって取得された音声に基づく音声データをテキストに変換する。この変換にあたって、記録部26に記録されているテキスト化辞書26aを参照しながら行う。
補助制御部21は、CPU(Central Processing Unit)、プログラムを記憶したメモリ、および周辺回路を含むASIC(Application Specific Integrated Circuit)で構成される。CPUは、メモリに記憶されたプログラムおよび制御部1からの指示に従って、音声補助制御部20内の各部を制御する。
ドキュメント化部21bは、テキスト化部25において変換されたテキストと、記録部26内に記憶されたフォーマット情報26cを用いて、文書(ドキュメント)を作成する。ドキュメント化部21bは、補助制御部21内の周辺回路で実現してもよいが、CPUによってソフト的に実現する。
記録部26は、電気的に書き換え可能な揮発性メモリおよび電気的に書き換え可能な不揮発性メモリを有する。この不揮発性メモリには、制御部1内の画像ファイル生成部1cによって生成された画像ファイルを記録する。また、不揮発性メモリには、テキスト化辞書26a、コマンド辞書26b、フォーマット情報26c、および話者識別記録部26dを有する。
テキスト化辞書26aは、前述したようにテキスト化部25において音声データをテキストに変換する際に使用する辞書である。この辞書には、音声データのパターンに対応するテキストが記憶されている(図9のS15参照)。この辞書によって、専門用語や略語、言語の特徴など、機器が使われる環境にもきめ細かく対応して音声をテキスト化しやすくなり、この辞書にないものは、不適当なテキスト化である等、文字化する時の精度を向上することができる。
コマンド辞書26bは、前述したようにコマンド判定部23において音声データの中でコマンドが含まれているか否かを判定する際に使用する辞書である。この辞書には、音声データのパターンに対応するコマンドが記憶されている(図9のS17参照)。このような辞書をカスタマイズすれば、複雑な制御などにも対応した命令が可能となる。操作命令をテキスト化しやすくなり、この辞書にないものは、誤操作である等判断でき、制御する時の精度を向上することができる。
フォーマット情報26cは、ドキュメント化部21bにおいてドキュメントを作成する際の文書化のための情報を記憶する。定型的な文書を作成する際のパターンが記憶されているので、ドキュメント化部21bはこのパターンに沿ってテキストを嵌め込むことによって文書を生成することができる。
話者識別記録部26dは、話し手を識別するための情報を記憶する。話し手によって、音声データのパターン等に特徴があることから、この特徴を記憶しておき、画像ファイルを作成する際に、この話者識別記録部26dに記録されている情報を用いて、話者を特定し話者名も記録する(図9のS25参照)。
次に、図2を用いて、画像ファイル生成部1cで生成される画像ファイルについて説明する。前述したように、画像ファイルとしては、静止画画像ファイル31、動画画像ファイルA32、動画画像ファイルB33の3種類が作成され、記録部26に記録される。
静止画画像ファイル31は、画像データ31a、音声コマンド・コメント履歴31b、日付31cを記録する領域を有する。静止画画像ファイル31は、後述する図8(c)のような静止画撮影を行った際に記録される。画像データ31aは、ユーザがレリーズ釦を操作した際に取得される静止画の画像データである。音声コマンド・コメント履歴31bは、静止画撮影の際にユーザが発声した音声データ等である。日付31cは、静止画を撮影した日時情報であり、時計部9からの情報に基づいて記録する。このような履歴を様々な処置の過程のエビデンス情報とすることができ、また、これを使った学習や誤動作防止が可能となる。
動画画像ファイルA32は、画像データ32a、対話音声データ32b、会話テロップ32c、日付32dを記録する領域を有する。動画画像ファイルA32は、後述する図8(b)のような動画を撮影する際に作成される。画像データ32aは、ユーザが動画釦を操作して動画記録を開始してから、再度、動画釦を操作して動画記録を終了した時までの間、取得された動画の画像データである。
対話音声データ32bは、親と子との間でなされた対話等、複数の人の間で交わされた対話を音声データとして記録する領域である。本実施形態においては、位相差を検出することにより、指向性を調整することができる。対話がなされている場合には、音源となる人物の方向に指向性を調整し、明瞭な音声を記録することができる。
会話テロップ32cは、対話の音声をテキストにして記録する領域である。テキスト化部25は、対話音声データ32をテキストデータに変換することができ、この変換されたテキストデータを記録しておく。日付32dは、動画を撮影した日時情報であり、撮影開始と終了の日時情報を、時計部9からの情報に基づいて記録する。
動画画像ファイルB33は、画像データ33a、R音声データ33b、L音声データ33c、日付33dを記録する領域を有する。動画画像ファイルB33は、後述する図8(a)のような動画を撮影する際に作成される。画像データ33aは、画像データ32aと同じく、ユーザが動画釦を操作して動画記録を開始してから、再度、動画釦を操作して動画記録を終了した時までの間、取得された動画の画像データである。
R音声33bは、複数マイク2bの内の右側に配置されたマイクによって取得された音声データを記録する領域である。L音声33cは、複数マイク2bの内の左側に配置されたマイクによって取得された音声データを記録する領域である。R音声データおよびL音声データにより、ステレオ音声データとなる。図3に示すように、2つのマイクの配置位置は、光軸方向でずれていることから、位相差が生じ、位相差補正部1dによって位相差が補正された音声データが記録される。
日付33dは、日付32dと同じく、動画を撮影した日時情報であり、撮影開始と終了の日時情報を、時計部9からの情報に基づいて記録する領域である。
次に、図3を用いて、複数マイク2bの配置位置について説明する。図3は、収音装置を備えたカメラ11を示し、このカメラ11の正面には撮影レンズ3aが配置されている。またカメラ本体内部には、右側マイク2bRと左側マイク2bLが配置されている。右側マイク2bRおよび左側マイク2bLの収音範囲の中心線CRとCLは、カメラの正面(前方、撮影レンズ3aの光軸方向(z軸)側からそれぞれ外側に45度程度の方向)側を向いている。
収音範囲の中心線CRと中心線CLの間の距離は、すなわち、2つのマイク2bR、2bLのx軸方向の距離は、ステレオ用位置差Dsである。また、撮影レンズ3aと直交し、右側マイク2bRを通る平面と、左側マイク2bLを通る平面との間の距離は、指向性用位置差Ddである。
このように、複数マイク2bは、利用者と対象物を結ぶ方向(撮影レンズ3aの光軸Oの方向、z軸方向)と、略直交する方向(x軸方向)に隔てて配置され、利用者と対象物を結ぶ方向(光軸O、z軸方向)においても距離に差異をもたせて配置している。
図4は一般的なカメラに内蔵されている単一指向性マイクの指向特性を示す。背面方向から感度は落ちているが、マイク単体の性能では背面の音を完全に消すことはできないため不要な音を拾ってしまう。
次に、図5を用いて、複数マイク2bの配置の変形例について説明する。図3に示した一実施形態においては、2つのマイクをカメラの前方に向けて配置していた。それに対して、図5に示す変形例においては、2つのマイクをカメラの上方に向けて配置している。
カメラの正面側には、図3に示したカメラと同様、撮影レンズ3aが設けられている。カメラの内部には、制御部1、収音部2の回路、撮像部3の回路等が設けられた回路50が配置されている。
また、カメラ本体の背面には、表示部8としての背面パネル8aが可動自在に配置されている。背面パネル8aには、ライブビュー表示、記録済みの画像データに基づく再生画像、メニュー画面等の種々の画像が表示される。また、カメラの背面側上部に電子ビューファインダ(EVF)8bが配置されている。EVF8bは接眼部を介して、ライブビュー表示、記録済みの画像データに基づく再生画像、メニュー画面等の種々の画像を観察することができる。
カメラ本体の背面側であって、EVF8bよりも更に上部には、動画釦5bが配置されている。動画釦5bを操作すると動画の撮影が開始され、更に操作すると動画の撮影が終了する。カメラ本体の上面には、レリーズ釦5aが配置されている。レリーズ釦5aを操作すると、静止画撮影がなされる。
また、カメラ本体の上面には、複数マイク2bの内の第1マイク2bAと第2マイク2bBが配置されている。第1マイク2bAは収音範囲SAAを有し、第2マイク2bBは収音範囲SBAを有する(図5(a)には、収音範囲が記載されていないが、図5(b)の収音範囲と同じである)。また、第1マイク2bAは弾性保持部2bAeによって保持され、第2マイク2bBは弾性保持部2bBeによって保持されている。弾性保持部2bAe、2bBeによってマイクを保持しているのは、ユーザの指の擦れ音が筐体を通しマイク2bA、2bBに入るのを軽減させるためである。
図5は図示し易い一例であるが、図5においても図3と同様に、第1マイク2bAと第2マイク2bBは、カメラ11の正面から見た際に、撮影レンズ3aの光軸Oと直交する面において左右にステレオ用位置差Dsだけ離れている。また、第1マイク2bAと第2マイク2bBは、撮影レンズ3aの光軸O方向に、指向性用位置差Ddだけ離れて配置されている。
図5(a)は、ユーザが動画を撮影する様子を示し、また図5(b)はユーザが静止画を撮影する様子を示す。動画を撮影する際には、一般に、図5(a)に示すように、ユーザはカメラを把持し、背面パネル8aで被写体を観察しながら、動画釦5bを操作する。このとき、ユーザの人指し指52は筐体の前面を支え、また親指53は動画釦5bを操作する。
また、静止画を撮影する際には、一般に、図5(b)に示すように、ユーザはEVF8bで被写体を観察しながら、親指53で筐体の背面を支え、人指し指52でレリーズ釦5aを操作する。
このように、図5に示すマイクの配置の変形例では、第1マイク2bAと第2マイク2bBは、位置がずれていることから、ステレオマイクとして機能し、また撮影レンズ3bの光軸方向にずれていることから、カメラの前後方向に位相差のある音声データを取得することができる。
次に、図6を用いて、収音部2の構成について説明する。収音部2は、複数マイク2b、AD変換器42、加算・乗算器43を備えている。ステレオマイク2bは、主マイク41aと副マイク41bとから構成され、図3または図5に示すような複数マイクの位置に配置される。
主マイク41aと副マイク41bは、それぞれADコンバータ42a、42bに接続され、音声信号がデジタル化される。すなわち、主マイク41aはADコンバータ42aに、また副マイク41bはADコンバータ42bに、それぞれ接続されデジタル音声データを出力する。ADコンバータ42の出力端は、加算・乗算器43に接続され、主副の音声の差分が演算される。ここでは単純化のため2つのマイクで説明する。
すなわち、主マイク41aの音声データを出力するADコンバータ42aは、加算器43aのマイナス側入力端と、加算器43dのプラス側入力端に接続される。また、副マイク41bの音声データを出力するADコンバータ42bは、加算器43aのプラス側入力端と、加算器43dのマイナス側入力端に接続される。
加算器43aの出力は乗算器43bの入力端に接続され、加算器43dの出力端は乗算器43eの入力端に、それぞれ接続される。乗算器43bと乗算器43eの制御端は、信号処理及び制御部1に接続され、乗算器43b、43eのゲインを入力する。加算器43eの入力端は、ADコンバータ42aの出力端と乗算器43bの出力端が接続される。加算器43fの入力端は、ADコンバータ42bの出力端と、乗算器43dの出力端が接続される。
加算・乗算器43の出力端は、収音部2としての出力部であり、記録部26に接続される。すなわち、加算器43eの出力端と、加算器43fの出力端は、それぞれ、右側音声データ、左側音声データを出力し、これらの出力端を介して各音声データは(ICレコーダなら記録部、マイクなら通信部等)外部に出力される。また、ADコンバータ42a、42bの出力も外部で確認できるようにしてある。
このように収音部2の一部は構成されており、マイクからの複数音声データの主副のバランスを制御し、音声の指向性を狭くしたり、広くしたり、指向性を変えたりすることができる。収音部2内の2つのマイク41a、41bによって入力した音声信号は、ADコンバータ42a、42bによってデジタル音声データに変換され、加算器43aによって、(主マイクの音声データ)−(副マイクの音声データ)が演算され、加算器43dによって、(副マイクの音声データ)−(主マイクの音声データ)が演算される。すなわち、加算器43a、43bによって、主副の音声データの差分が演算される。ここで、演算された差分は異なる位置に配置され、それによって使用者の声の伝達が異なる主副マイクの音の差異であり、例えば、この差異を減らすことにより主副のマイクの中央部位置の音を強調することができ、この加算演算はそのための前処理である。
加算器43a、43dで求められた差分は、それぞれ乗算器43b、43dにおいて信号処理及び制御部1からのゲインに基づいて乗算し、この乗算結果を、加算器43e、43fにおいて、主マイク側の音声データと副マイク側の音声データに、それぞれ加算する。なお、加算器43a、43dの出力がマイナスなので、実質的には減算することになる。このため、加算器43e、43fから出力される左右の音声データは、左右の広がりを抑えた音声出力となる。ここで、乗算器43b、43dにおけるゲインを大きくすれば、広がり感をなくすことができ、ゲインを小さくすれば広がり感を広げることができる。制御部1は、後述するステップS9のタイミングにおいて、乗算器43b、43dに対してゲインを制御することにより、広がり感を変えることができる。
このように、本実施形態においては、一対の同じ性能のマイクを用いて、収音の範囲を広げたり、狭めたりすることができる。指向性が広い場合には雰囲気の豊かな環境音を豊富に取り入れることができ、また指向性が狭い場合には、さらに複数のマイクの差異の強調によって指向性の向きを変えて、特定の方向にフォーカスした音声を記録することができる。
次に、図7を用いて位相差制御部1dにおける位相差補正について説明する。図7(a)の左側のグラフは、正面から来た音声を複数マイク2b内の右側マイク(Rch)2bRと左側マイク(Lch)2bLで変換した音声信号の時間的変化を示す。図3に示すように右側マイク2bRと左側マイク2bLは、ステレオ用位置差Dsに加えて、撮影レンズ3aの光軸O方向に指向性用位置差Ddが設けて配置されている。このため、RchとLchの音声信号には、位相差(+PhF)が生じてしまう。
そこで、正面から来た音声については、図7(a)の右側のグラフで示すように、位相差補正回路によって、位相差(+PhF)をキャンセルし、Rchの音声信号とLchの音声信号を揃えるように音声処理を行う。
また、背面から来た音声についても、2つの音声信号に位相差(−PhF)が生じてしまう。正面から来た音声については撮影対象であることから、明瞭に記録するが、一方、背面から来た音声については、撮影対象でない場合が多いことから、なるべく音量を小さくすることが望ましい。そこで、図7(b)の右側のグラフで示すように、位相差補正回路によって、減衰処理を行う。但し、ユーザの音声コマンドを認識する場合には、減衰処理を行わない。
なお、正面からと背面からの音声信号の位相差の絶対値は、PhFであるが、正面と背面では、位相が逆転している。そのため、音声信号の位相差を見ることにより、音源の方向を検出することができ、また位相差を制御することにより、所望する方向、かつ所望の収音範囲の音声のみを抽出することが可能となる。背面方向からの音声を減衰させることにより、背面方向のノイズを減少させることができる。
次に、図8を用いて、本実施形態における収音装置の使用状態について説明する。図8(a)は、ユーザがカメラ11によって運動会のように前方に広がる被写体を含む風景の動画が撮影している場合を示す。この場合には、図5(a)を用いて説明したように、ユーザは背面パネル8aを見ながら撮影を行い、複数マイク2bによって、音の広がりを重視したステレオ録音を行う。収音範囲SAR、SALとしては、図8(d)に示すように、前方のRチャンネルおよびLチャンネルの音声を重視し、周りの音はなるべく抑制する。
図8(b)は、ユーザが、カメラ11によって、子供と対話しながら子供の動画を撮影している場合を示す。この場合にも、ユーザは背面パネル8aを見ながら撮影を行うが、複数マイク2bによる収音範囲は、図8(a)の場合とは異なる。すなわち、対話相手(被写体方向)の収音範囲SAFと、ユーザの方向の収音範囲SABaの2方向のみを収音範囲とする。この場合、ユーザはマイクの近傍にあるのに対して、対話相手は遠方にあることから、図8(e)に示すように、マイクの感度を異ならせる。すなわち、対話相手の方向の収音範囲SAFついてはゲインを大きくし、ユーザの方向の収音範囲SABaについてはゲインを小さくする。
図8(c)は、ユーザが、カメラ11によって、鳥のような対象物を静止画で撮影する様子を示す。この場合には、ユーザは、図5(b)を用いて説明したように、EVF8bを観察しながら被写体の構図とシャッタタイミングを決める。静止画を撮影する場合の音声入力は、音声記録を行ってこれを再現することより、静止画撮影時のカメラ制御のためのコマンド入力や、撮影時の音声メモ等に力点が置かれる。また、音声の収音範囲は狭い範囲で十分なことが多い。
このように、本実施形態においては、撮影状況に応じて、収音範囲が異なる。この収音範囲は指向性制御部2eによって制御される。また背面からの音声を減衰させることにより、背面方向からのノイズを減少させることができる。
次に、図9および図10に示すフローチャートを用いて、本実施形態に係る収音装置を有するカメラの動作について説明する。このフローは、制御部1内のCPUがメモリに記憶されたプログラムに従って収音装置内の各部を制御することにより実現する。
図9に示すフローに入ると、まず撮影状況の判定を行う(S1)。ここでは、ライブビュー表示を開始する。ライブビュー表示は、撮像部3によって取得した画像データに基づいて、表示部8に動画で被写体を表示する。また、撮影状況の判定を行う。この判定は、カメラに設定された撮影モード、複数マイク2bによって取得した音声データに基づいて、周囲の状況を判定する。撮影モードとしては、プログラムモード、シャッタ速度優先モード等の撮影制御モードや、風景モード、人物モード等のシーン別の撮影モード等がある。
撮影状況を判定すると、次に、ステレオ録音か否かを判定する(S3)。ユーザは、操作部5を操作して、ステレオ録音またはモノラル録音のいずれかを設定するので、このステップでは、操作部5による設定状態に応じて判定する。
ステップS3における判定の結果、ステレオ録音の場合には、左右の位相差補正を行う(S5)。ステレオ録音の場合は、図8(a)を用いて説明たように、音の広がりを重視した動画を撮影する場合である。また、図7を用いて説明したように、撮影レンズ3aの光軸Oの方向に指向性用位置差Ddがあることにより、正面および背面から来た音声の内、Rch、Lchに位相差が生じている。このステップでは、位相差補正部1dが位相差の補正を行う。
左右の位相差補正を行うと、左右のチャンネルとして仮記録する(S7)。ここでは、位相差補正された音声データを記録部26に仮記録して、画像と同期して再生できるように後で本記録する(後述する図10のS41参照)。
一方、ステップS3における判定の結果、ステレオ録音でなかった場合には、収音方向切換やゲインアップを行う(S9)。この場合は、図8(b)を用いて説明したように、対話しながら動画を撮影する場合であり、収音範囲を対話者と撮影者(ユーザ)の方向に絞り、また撮影者はカメラのすぐ近くにいることから対話者に比較してゲインを小さくし、対話者のゲインを大きくする。このように、撮影状況に応じて、収音範囲(方向)やゲインについて調整を行う。
続いて、音声判定が可能か否かを判定する(S11)。収音部2で取得された音声データについて、音声認識ができ文字に変換できるか否かを判定する。音声認識ができ文字化できる場合には、後述するように、ユーザ等がカメラに向けって発したコマンドによってカメラを制御したり、また会話等をテキストに変換して記録することが可能となる。
ステップS11における判定の結果、音声判定ができない場合には、警告表示を行う(S13)。ここでは、表示部7等に音声を認識できないことを警告する。
ステップS13において警告表示を行うと、またはステップS11における判定の結果、音声判定が可能な場合には、文字化、ディスプレイ表示を行う(S15)。音声判定できる場合には、テキスト化部25が音声データを文字に変換できる。そこで、このステップでは、収音部2によって取得された音声データを文字に変換し、この変換した文字を表示部8に表示する。
続いて、音声が機器用コマンドか否かを判定する(S17)。ステップS15において文字に変換された音声の内容が、機器制御用のコマンドか否かを判定する(S17)。機器としてカメラの場合には、コマンドとしては、例えば、「ズーミング」「絞り値」「シャッタ速度値」「アートフィルタ」「静止画撮影」「動画撮影開始・終了」等があり、また録音装置としては、「ボイスメモ」、「録音開始・終了」等がある。このステップでは、ステップS15で取得したテキストについて、コマンド辞書26bを参照して、音声が機器用コマンドか否かを判定する。
ステップS17における判定の結果、音声が機器用コマンドの場合には、機器制御を行い、制御履歴を仮記録する(S19)。ここでは、ステップS17において検出された機器用のコマンドに基づいて、収音装置の備えられた機器の制御を行う。また、どんな制御を行ったかを記録部26に仮記録しておく。
一方、ステップS17における判定の結果、音声が機器用コマンドでない場合には、次に、音声が会話か否かを判定する(S25)。音声データの特性を判定することにより、話者が2名以上おり、会話として成立しているか否かを判定する。なお、判定の際に話者識別記録部26dに記録されている話者であるかどうかを参考にしてもよい。
ステップS21における判定の結果、会話でない場合には、単独での文字として仮記録する(S23)。ここでは、いわゆる独り言として仮記録する。ボイスメモとして活用してもよい。
一方、ステップS21における判定の結果が会話の場合には、会話として仮記録する(S25)。図8(b)を用いて説明したような子供との会話のような状況である。ここでは、ステップS15において変換されたテキストを会話として仮記録する。この場合、話者識別記録部26dに記録されている話者であれば、発言者を特定してテキストを仮記録することができる。
ステップS7においてステレオ録音の仮記録を行うと、またはステップS19において機器制御履歴の仮記録を行うと、またはステップS23において単独での文字の仮記録を行うと、またはステップS25において会話として仮記録を行うと、次に、操作部で機器操作を行う(S31)。機器としてカメラの場合には、例えば、ズーミング操作、静止画撮影、動画撮影、絞り値変更、シャッタ速度値変更、アートフィルタの設定等、種々の機器操作を行ったか否かを判定する。
ステップS31における判定の結果、機器操作がなされた場合には、機器制御を行う(S33)。ここでは、操作部5において検出された操作状態に基づいて、機器の制御を行う。
ステップS33において機器制御を行うと、またはステップS31における判定の結果、操作部で機器操作を行っていない場合には、次に、動画撮影の開始か否かを判定する(S35)。ユーザは動画撮影を開始する場合には、操作部5の内の動画釦を操作する。そこで、このステップでは、動画釦が操作されたか否かに基づいて判定する。
ステップS35における判定の結果、動画撮影の開始の場合には、動画途中の音声対応情報を採用する(S37)。動画を撮影中であっても、ステップS39No→S1・・・S17→S19・・・、またはS39Yes→S41→S1・・・S17→S19・・・のルートで音声が制御機器用コマンドか否かを判定する。そこで、制御機器用コマンドと判定された場合には、このステップで音声コマンドに従って機器の制御を行う。
ステップS37における処理を行うと、またはステップS35における判定の結果、動画撮影が開始していない場合には、動画撮影の終了か、または静止画撮影かの判定を行う(S39)。動画撮影を終了する場合には、ユーザが動画釦を再度操作すればよく、また静止画撮影を行う場合には、ユーザがレリーズ釦を操作すればよい。このステップでは、これらの操作がなされたか否かについて判定する。
ステップS39における判定の結果、動画撮影終了、または静止画撮影の場合には、撮影画像と、仮記録情報を関連付けて記録する(S41)。ここでは、画像ファイル生成部1cが、動画の画像データまたは静止画の画像データと、ステップS7、S19、S23、S25等で仮記録された情報を関連付けて画像ファイル(図2参照)を生成する。
ステップS41における処理を行うと、またはステップS39における判定の結果、動画終了でもなく、また静止画撮影でもない場合には、ステップS1に戻り、前述の処理を繰り返す。
次に、図11を用いて、本発明を内視鏡100に適用した例について説明する。内視鏡100には、送気送水操作用推知126、吸引操作用スイッチ127等、種々の操作部材が設けられている。また、レリーズ釦105aが操作者の手前側に配置され、図示しない湾曲部を彎曲させるアングル操作部材と共に操作が可能である。
内視鏡100の上部には複数マイク102bA、102bBが距離差をもって配置されている。一般に操作者とレリーズ釦105aを結ぶ方向に患者がいる位置関係となる。操作者とレリーズ釦を結ぶ方向に対して直交する面で左右方向に距離を離して複数マイク102bA、102bBが配置され、さらに、操作者とレリーズ釦を結ぶ方向の前後に複数マイク102bA、102bBが配置されている。このため、操作者と患者を結ぶラインの左右、および前後に複数マイク102bA、102bBが距離をおいて配置される。そこで、両マイクの音声データの位相差に基づいて、音声の収音方向、収音範囲を適宜制御することが可能となる。
内視鏡100で観察し、画像データを記録する際に、併せて複数マイク102bA、102bBからの音声を記録することができる。この場合、図1〜図10に示した技術を適用することにより、音声の収音方向、収音範囲を最適に調整することができる。例えば、内視鏡で患部を静止画撮影する場合、内視鏡で患部を観察しながら患者と対話する場合、および患部の全体を動画で撮影する場合等に応じて、収音範囲を切り替えるようにしてもよい。
以上説明したように、本実施形態においては、複数マイクを利用者と対象物を結ぶ方向と、略直交する方向に隔てて配置され、利用者と対象物を結ぶ方向においても距離に差異をもたせて配置している(図3、図5参照)。そして、ステレオマイクからの2つの音声信号の位相差に応じて、収音の指向性を調整している(図9のS9等参照)。このため、収音対象の状態に応じて指向性を制御することが可能である。また、ノイズが多い方向からの音声を減衰させれば、背面方向からのノイズを減少させることができる。
なお、本発明の一実施形態においては、収音装置を組み込んだ、若しくは収音装置と協働して動作する機器として、カメラや内視鏡の例を挙げて説明した。しかし、収音装置を組み込んだ、若しくは収音装置と協働して動作する機器としてはこれらの機器に限られない。
また、本発明の一実施形態においては、撮影のための機器として、デジタルカメラを用いて説明したが、カメラとしては、デジタル一眼レフカメラでもミラーレスカメラでもコンパクトデジタルカメラでもよく、ビデオカメラ、ムービーカメラのような動画用のカメラでもよく、さらに、携帯電話、スマートフォン、携帯情報端末、パーソナルコンピュータ(PC)、タブレット型コンピュータ、ゲーム機器等に内蔵されるカメラ、医療用カメラ、顕微鏡等の科学機器用のカメラ、自動車搭載用カメラ、監視用カメラでも構わない。
また、本発明の一実施形態においては、特定音声抽出部2c、圧縮部4、姿勢判定部7、補助制御部21、コマンド判定部23、テキスト化部25を制御部1とは別体の構成としたが、これらの全部または一部を、制御部1と一体の構成としても構わない。また、画像ファイル作成部1cおよび位相差補正部1dを制御部1内に設けたが、これらの全部または一部を制御部と別体の構成としても構わない。
画像ファイル作成部1c、位相差補正部1d、特性音声抽出部2c、圧縮部4、姿勢判定部7、補助制御部21、コマンド判定部23、テキスト化部25等は、ハードウエア回路で構成しても、ヴェリログ(Verilog)によって記述されたプログラム言語に基づいて生成されたゲート回路等のハードウエア構成でもよく、またDSP(Digital Signal Processor)等のソフトを利用したハードウエア構成を利用してもよい。これらは適宜組み合わせてもよいことは勿論である。
また、本明細書において説明した技術のうち、主にフローチャートで説明した制御に関しては、プログラムで設定可能であることが多く、記録媒体や記録部に収められる場合もある。この記録媒体、記録部への記録の仕方は、製品出荷時に記録してもよく、配布された記録媒体を利用してもよく、インターネットを介してダウンロードしたものでもよい。
また、本発明の一実施形態においては、図3および図4のフローチャートを用いて、本実施形態における動作を説明したが、処理手順は、順番を変えてもよく、また、いずれかのステップを省略してもよく、ステップを追加してもよく、さらに各ステップ内における具体的な処理内容を変更してもよい。
また、特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず」、「次に」等の順番を表現する言葉を用いて説明したとしても、特に説明していない箇所では、この順で実施することが必須であることを意味するものではない。
本発明は、上記実施形態にそのまま限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素の幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1・・・制御部、1c・・・画像ファイル生成部、1d・・・位相差補正部、2・・・収音部、2b・・・複数マイク、2bR・・・右側マイク、2bL・・・左側マイク、2bA・・・第1マイク、2bAe・・・弾性保持部、2bB・・・第2マイク、2bBe・・・弾性保持部、2c・・・特性音声抽出部、2d・・・有効距離設定部、2e・・・指向性制御部、3・・・撮像部、3a・・・撮影レンズ、4・・・圧縮部、4a・・・静止画圧縮部、4b・・・動画圧縮部、5・・・操作部、5a・・・レリーズ釦、5b・・・動画釦、7・・・姿勢判定部、8・・・表示部、8a・・・背面パネル、8b・・・電子ビューファインダ(EVF)、9・・・時計部、10・・・情報取得部、11・・・カメラ、20・・・音声補助制御部、21・・・補助制御部、21b・・・ドキュメント化部、23・・・コマンド判定部、25・・・テキスト化部、26・・・記録部、26a・・・テキスト化辞書、26b・・・コマンド辞書、26c・・・フォーマット情報部、26d・・・話者識別記録部、31・・・静止画画像ファイル、31a・・・画像データ、31b・・・音声コマンド・コメント履歴、31c・・・日付、32・・・動画画像ファイルA、32a・・・画像データ、32b・・・対話音声データ、32c・・・会話テロップ、32d・・・日付、33・・・動画画像ファイルB、33a・・・画像データ、33b・・・R音声、33c・・・L音声、33d・・・日付、41a・・・主マイク、41b・・・副マイク、42a・・・ADコンバータ、42b・・・ADコンバータ、43a・・・加算器、43b・・・乗算器、43c・・・加算器、43d・・・乗算器、43e・・・加算器、43f・・・加算器、50・・・回路、52・・・人指し指、53・・・親指

Claims (8)

  1. 利用者と対象物を結ぶ方向と、略直交する方向に隔てて配置され、上記利用者と対象物を結ぶ方向においても距離に差異をもたせて配置したステレオマイクと、
    上記ステレオマイクからの音声信号の指向性を調整する指向性制御部と、
    を有することを特徴とする収音装置。
  2. モードを設定するモード設定部と、
    を有し、
    上記指向性制御部は、上記モードに応じて、環境音を収音する第1の収音特性と、対話者を主に収音する第2の収音特性に切り替えることを特徴とする請求項1に記載の収音装置。
  3. 上記第1の収音特性は、前方の対象物に向けた指向性であることを特徴とする請求項1または2に記載の収音装置。
  4. 上記第1の収音特性は、広範囲のステレオ収音であることを特徴とする請求項1または2に記載の収音装置。
  5. 上記指向性制御部は、前方と後方からの音声の指向性を調整することを特徴とする請求項1または2に記載の収音装置。
  6. 上記指向性制御部は、上記前方の狭範囲を収音する第3の収音特性が可能であることを特徴とする請求項1または2に記載の収音装置。
  7. 上記指向性制御部は、上記ステレオマイクによって取得した上記使用者の音声が機器制御用のコマンドであるか否かを判定し、判定の結果、上記コマンドである場合には、上記コマンドに従って上記収音装置を制御することを特徴とする請求項1に記載の収音装置。
  8. 利用者と対象物を結ぶ方向と、略直交する方向に隔てて配置され、上記利用者と対象物を結ぶ方向においても距離に差異をもたせて配置したステレオマイクを有する収音装置の収音方法において、
    上記ステレオマイクからの2つの音声信号の位相差に応じて、収音の指向性を調整する、
    することを特徴とする収音方法。
JP2017135637A 2017-07-11 2017-07-11 収音装置および収音方法 Pending JP2019021966A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017135637A JP2019021966A (ja) 2017-07-11 2017-07-11 収音装置および収音方法
US16/027,411 US10531188B2 (en) 2017-07-11 2018-07-05 Sound collecting device and sound collecting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017135637A JP2019021966A (ja) 2017-07-11 2017-07-11 収音装置および収音方法

Publications (1)

Publication Number Publication Date
JP2019021966A true JP2019021966A (ja) 2019-02-07

Family

ID=64999373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017135637A Pending JP2019021966A (ja) 2017-07-11 2017-07-11 収音装置および収音方法

Country Status (2)

Country Link
US (1) US10531188B2 (ja)
JP (1) JP2019021966A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022009515A1 (ja) * 2020-07-06 2022-01-13 株式会社島津製作所 データ計測システムおよび計測データの提示方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021057764A (ja) * 2019-09-30 2021-04-08 ソニー株式会社 撮像装置、音声処理方法、プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4334740A (en) * 1978-09-12 1982-06-15 Polaroid Corporation Receiving system having pre-selected directional response
US4984087A (en) * 1988-05-27 1991-01-08 Matsushita Electric Industrial Co., Ltd. Microphone apparatus for a video camera
KR100198289B1 (ko) * 1996-12-27 1999-06-15 구자홍 마이크 시스템의 지향성 제어장치와 제어방법
US6507659B1 (en) * 1999-01-25 2003-01-14 Cascade Audio, Inc. Microphone apparatus for producing signals for surround reproduction
JP4344342B2 (ja) * 2005-05-27 2009-10-14 ホシデン株式会社 携帯電子機器
AR084090A1 (es) * 2010-12-03 2013-04-17 Fraunhofer Ges Forschung Metodo y aparato para adquisicion espacialmente selectiva del sonido mediante triangulacion acustica
JP5712599B2 (ja) 2010-12-16 2015-05-07 カシオ計算機株式会社 撮像装置及びプログラム
JP2013110629A (ja) 2011-11-22 2013-06-06 Sony Corp 撮像装置、音声収音方法
EP2600637A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for microphone positioning based on a spatial power density
EP2809086B1 (en) * 2012-01-27 2017-06-14 Kyoei Engineering Co., Ltd. Method and device for controlling directionality
EP2869591B1 (en) * 2012-06-29 2020-12-09 FINEWELL Co., Ltd. Stereo earphone
US9984675B2 (en) * 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
GB2521649B (en) * 2013-12-27 2018-12-12 Nokia Technologies Oy Method, apparatus, computer program code and storage medium for processing audio signals
US10575117B2 (en) * 2014-12-08 2020-02-25 Harman International Industries, Incorporated Directional sound modification
US20180233129A1 (en) * 2015-07-26 2018-08-16 Vocalzoom Systems Ltd. Enhanced automatic speech recognition
US9800975B1 (en) * 2016-04-18 2017-10-24 mPerpetuo, Inc. Audio system for a digital camera
JP6874430B2 (ja) * 2017-03-09 2021-05-19 ティアック株式会社 音声レコーダ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022009515A1 (ja) * 2020-07-06 2022-01-13 株式会社島津製作所 データ計測システムおよび計測データの提示方法

Also Published As

Publication number Publication date
US20190020949A1 (en) 2019-01-17
US10531188B2 (en) 2020-01-07

Similar Documents

Publication Publication Date Title
US20100182442A1 (en) Digital photographing device, method of controlling the same, and computer-readable storage medium
JP4236986B2 (ja) 撮影装置および方法並びにプログラム
KR101710626B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
JP6739064B1 (ja) 撮像装置
JP5809891B2 (ja) 撮影装置
JP6137965B2 (ja) 電子機器、電子機器の制御方法、及び電子機器の制御プログラム
CN103888684B (zh) 图像处理装置、图像处理方法以及记录介质
US8687076B2 (en) Moving image photographing method and moving image photographing apparatus
JP5299034B2 (ja) 撮影装置
US11372615B2 (en) Imaging apparatus
US10531188B2 (en) Sound collecting device and sound collecting method
JP5510559B2 (ja) 音声制御装置および撮像装置
JP5214394B2 (ja) カメラ
JP5528856B2 (ja) 撮影機器
KR20090083713A (ko) 디지털 영상 처리장치 및 그 제어방법
JP2014122978A (ja) 撮像装置、音声認識方法、及びプログラム
JP5608803B1 (ja) 撮影機器、撮影方法及び撮影制御プログラム
JP2010200253A (ja) 撮像装置
WO2021065398A1 (en) Imaging apparatus, sound processing method, and program
US20210400204A1 (en) Imaging apparatus
JP5750668B2 (ja) カメラ、再生装置、および再生方法
JP2011120165A (ja) 撮像装置
JP6793369B1 (ja) 撮像装置
JP5872850B2 (ja) 撮像本体部、撮像装置システムおよびプログラム
JP2023035585A (ja) 撮像装置、撮像装置の制御方法及びプログラム