JP5963430B2 - 撮像装置、音声処理装置、及びそれらの制御方法 - Google Patents

撮像装置、音声処理装置、及びそれらの制御方法 Download PDF

Info

Publication number
JP5963430B2
JP5963430B2 JP2011264109A JP2011264109A JP5963430B2 JP 5963430 B2 JP5963430 B2 JP 5963430B2 JP 2011264109 A JP2011264109 A JP 2011264109A JP 2011264109 A JP2011264109 A JP 2011264109A JP 5963430 B2 JP5963430 B2 JP 5963430B2
Authority
JP
Japan
Prior art keywords
section
signal
noise
interpolation
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011264109A
Other languages
English (en)
Other versions
JP2013117585A (ja
Inventor
文裕 梶村
文裕 梶村
木村 正史
正史 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011264109A priority Critical patent/JP5963430B2/ja
Priority to US13/678,721 priority patent/US9282229B2/en
Publication of JP2013117585A publication Critical patent/JP2013117585A/ja
Application granted granted Critical
Publication of JP5963430B2 publication Critical patent/JP5963430B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/40Circuit details for pick-up tubes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B15/00Suppression or limitation of noise or interference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • H04N23/673Focus control based on electronic image sensor signals based on contrast or high frequency components of image signals, e.g. hill climbing method

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Studio Devices (AREA)

Description

本発明は、雑音低減技術に関する。
従来、音声を取り扱うものとしてデジタルカメラが知られており、デジタルカメラには、静止画撮影のほかに音声信号記録を伴う動画撮影を行う機能を有するものがある。このようなデジタルカメラにおいては、動画撮影中、フォーカスレンズや絞り機構等の駆動部の動作が行われると、音声信号記録に該駆動部の駆動音が雑音として混入してしまうという問題がある。
特許文献1は、ビデオカメラにおける記憶装置の駆動雑音を除去するための技術に関する。同文献は、駆動雑音混入区間の前後の音声信号から雑音混入区間における雑音の含まれない音声を予測し、予測したデータと入れ替える処理を開示する。この処理は、音声信号の周期性に着目して直前の音声信号から、それ以降の音声信号を予測し補間する技術である。
特開2008−077707号公報
しかしながら、従来の手法では、雑音混入区間前後の音声信号の周期性が低い場合には、音声予測の精度は低下する。
図18において、(a)はある成人女性が「あ」と発音したときの音声信号波形の例を示し、(b)は(a)の信号にレンズ駆動による駆動雑音が混入したときの音声信号波形の例を示している。(a)の音声信号波形は非常に周期性が高いので、(b)のように雑音が混入しても雑音混入区間前後の音声信号から予測して補間することが容易である。
一方、図19において、(a)は同じ成人女性が「か」と発音したときの音声信号波形の例を示し、(b)は(a)の音声信号の子音の直後でレンズ駆動による駆動雑音が混入したときの音声信号波形の例を示している。雑音混入区間直前の子音区間は、雑音混入区間直前の区間及び雑音混入区間で何度も繰り返されているわけではなく、非常に周期性が低い。このとき、従来のように予測処理を行うと、雑音混入区間に、子音部の音声信号や、実際にその雑音混入区間に女性が発した音声とは全く異なる音声の信号が補間されてしまうことが考えられる。
また、撮影レンズ駆動部の駆動命令タイミングに応じて雑音混入区間を決定し、その雑音混入区間に対して予測処理をする場合は、次のようなことが考えられる。
図20は、雑音除去処理の対象である撮影レンズ駆動部の駆動による駆動雑音発生の直前に操作者が撮影装置に触れて擦れ雑音が発生したときの音声信号波形の例を示している。駆動雑音と擦れ雑音以外の音声は図18(a)の被写体音声と同じである。図20に示すように、撮影レンズ駆動部が駆動する直前に操作者が装置表面を擦るなどにより別の雑音が発生した場合、従来の手法では雑音混入区間の音声信号を予測する際、直前に発生した擦れによる雑音を予測に用いてしまう。このため、雑音除去処理後の音声は違和感のある音声となってしまう。
本発明の目的は、例えば、集音された音声に応じた雑音低減処理を実行することができる撮像装置を提供することである。
本発明の一側面によれば、撮像手段と、前記撮像手段の動作に伴って音声を入力する音声入力手段と、前記音声入力手段により入力された音声信号のうちの、前記撮像手段の機構部の駆動に伴って発生した雑音が混入した雑音混入区間を検出する検出手段と、前記検出された雑音混入区間の音声信号を、前記雑音混入区間の前方及び後方の少なくともいずれかの区間における音声信号から作成される信号で置換することで補間を行う補間手段と、前記雑音混入区間の前方及び後方の区間における音声信号の周期性に応じて、前記補間手段による補間方法を制御する制御手段とを有し、前記制御手段は、前記雑音混入区間の前方及び後方の区間における音声信号の周期性が所定の閾値よりも低いときは、前記補間を行わないように前記補間手段を制御することを特徴とする撮像装置が提供される。
本発明によれば、集音された音声に応じた雑音低減処理を実行することができる。
第1の実施形態におけるデジタル一眼レフカメラの断面図。 第1の実施形態におけるデジタル一眼レフカメラの構成を示すブロック図。 第1の実施形態における雑音除去処理に係る機能構成を示す図。 第1の実施形態における音声予測処理の説明図。 第1の実施形態における録音動作のフローチャート。 第1の実施形態における音声予測処理の説明図。 第1の実施形態における音声予測処理の説明図。 第1の実施形態における雑音区間補間判断処理の説明図。 第1の実施形態における補間処理の説明図。 第1の実施形態における補間処理の説明図。 第1の実施形態における補間処理の説明図。 第1の実施形態における補間処理の説明図。 第2の実施形態におけるシステム全体図。 第2の実施形態におけるデジタル一眼レフカメラ及び情報処理装置のブロック図。 第2の実施形態におけるカメラ側動作のフローチャート。 第2の実施形態における情報処理装置側動作のフローチャート。 第2の実施形態におけるメモリカードリーダを有する場合のシステム全体図。 駆動雑音混入時の音声信号波形の例を示す図。 駆動雑音混入時の音声信号波形の例を示す図。 駆動雑音混入時の音声信号波形の例を示す図。
<実施形態1>
図1は、第1の実施形態におけるデジタル一眼レフカメラ100の断面図である。図1において、101はデジタル一眼レフカメラ100のカメラボディを示し、102は撮影レンズを示している。撮影レンズ102はレンズ鏡筒103内に光軸105を有する撮像光学系104を有する。撮影レンズ102は更に、撮像光学系104に含まれるフォーカスレンズ群、手ブレ補正レンズユニット、及び絞り機構を駆動させるレンズ駆動部106、レンズ駆動部106を制御するレンズ制御部107を有する。撮影レンズ102は、レンズマウント接点108でカメラボディ101と電気的に接続されている。
撮影レンズ102前方から入射する被写体光学像は、光軸105を通ってカメラボディに入光し、一部をハーフミラーで構成された主ミラー110で反射され、フォーカシングスクリーン117上に結像する。フォーカシングスクリーン117上に結象した光学像は、ペンタプリズム111を通して接眼窓112から視認される。露出検出部である測光センサ116は、フォーカシングスクリーン117上に結像した光学象の明るさを検出する。また、主ミラー110を透過した被写体光学像は、サブミラー113で反射され、焦点検出部114に入射し、被写体像の焦点検出演算に用いられる。
カメラボディ101内にある不図示のレリーズボタンが操作されて撮影開始命令が発せられると、主ミラー110及びサブミラー113は被写体光学像が撮像素子118に入射するように撮影光路から退避する。焦点検出部114、測光センサ116、撮像素子118に入射した光線はそれぞれ電気信号に変換され、カメラ制御部119に送られカメラシステムの制御が行われる。また、動画撮影時はさらに、マイクロホン115から被写体の音声が入力されカメラ制御部119に送られ、撮像素子118に入射した被写体光学像信号と同期して記録処理される。120は振動検出部である加速度計を示しており、マイクロホン115の近傍のカメラボディ101の内側面に設置されている。加速度計120は、レンズ駆動部106がフォーカスレンズ群、手ブレ補正レンズユニット、絞り機構など機構部を駆動したときに発生し、撮影レンズ102、カメラボディ101を伝播してくる振動を検出する。カメラ制御部119は、その振動検出結果を分析して雑音混入区間を算出する。
図2はデジタル一眼レフカメラ100の電気的制御を説明するブロック図である。カメラは、撮像系、画像処理系、音声処理系、記録再生系、制御系を有する。撮像系は、撮影レンズ102、撮像素子118を含む。画像処理系は、A/D変換器131、画像処理回路132を含む。音声処理系はマイクロホン115及び音声信号処理回路137を含む。記録再生系は、記録処理回路133、メモリ134を含む。制御系は、カメラ制御部119、焦点検出部114、測光センサ116、操作検出部135、レンズ制御部107、レンズ駆動部106を含む。レンズ駆動部106は、焦点レンズ駆動部106a、ブレ補正駆動部106b、絞り駆動部106cを含む。
撮像系は、物体からの光を、撮像光学系104を介して撮像素子118の撮像面に結像する光学処理系である。エイミングなどの撮影予備動作中は、主ミラー110に設けられたミラーを介して、焦点検出部114にも光束の一部が導かれる。また後述するように制御系によって適切に撮像光学系が調整されることで、適切な光量の物体光を撮像素子118に露光するとともに、撮像素子118近傍で被写体像が結像する。
画像処理回路132は、A/D変換器131を介して撮像素子118から受けた撮像素子の画素数の画像信号を処理する信号処理回路である。画像処理回路132は、ホワイトバランス回路、ガンマ補正回路、補間演算による高解像度化を行う補間演算回路等を有する。
音声処理系において、音声信号処理回路137は、マイクロホン115を介して入力した信号に対して適切な処理を施して録音用音声信号を生成する。録音用音声信号は、後述する記録処理部により画像とリンクして記録処理される。
また、加速度計120は、加速度計処理回路138を介して、カメラ制御部119に接続されている。加速度計120で検出されたカメラボディ101の振動の加速度信号は加速度計処理回路138において、増幅、ハイパスフィルタ処理、及びローパスフィルタ処理が行われ、目的の周波数が検出されるように処理される。
記録処理回路133は、メモリ134への画像信号の出力を行うとともに、表示部136に出力する像を生成、保存する。また、記録処理回路133は、予め定められた方法を用いて静止画、動画、音声等のデータの圧縮、記録処理を行う。記録処理回路133及びメモリ134は録音部303を構成する。
カメラ制御部119は撮像の際のタイミング信号などを生成して出力する。焦点検出部114及び測光センサ116はそれぞれ、撮像装置のピント状態及び被写体の輝度を検出する。レンズ制御部107はカメラ制御部119からの信号に応じて適切にレンズを駆動させて光学系の調整を行う。
さらに、制御系は、外部操作に連動して撮像系、画像処理系、記録再生系をそれぞれ制御する。例えば、操作検出部135が不図示のシャッターレリーズ釦の押下を検出すると、カメラ制御部119はこれに応答して、撮像素子118の駆動、画像処理回路132の動作、記録処理回路133の圧縮処理などを制御する。カメラ制御部119は更に、光学ファインダー、液晶モニタ等で構成される表示部136における表示を制御する。
次に、制御系の光学系の調整動作について説明する。カメラ制御部119には焦点検出部114及び露出検出部である測光センサ116が接続されており、カメラ制御部119はこれらの信号に基づき適切な焦点位置及び絞り位置を求める。カメラ制御部119は、求めた焦点位置及び絞り位置をレンズマウント接点108を介してレンズ制御部107に指令を出し、レンズ制御部107は焦点レンズ駆動部106aおよび絞り駆動部106cを適切に制御する。さらにレンズ制御部107には不図示の手ぶれ検出センサが接続されており、手ぶれ補正を行うモードにおいては、レンズ制御部107は手ぶれ検出センサの信号に基づきブレ補正駆動部106bを適切に制御する。また、動画撮影時においては、主ミラー110及びサブミラー113が光軸105から撮像素子118に入光する光路から退避するため、焦点検出部114及び測光センサ116に被写体光学像は入射しない。そこで、カメラ制御部119は、焦点レンズ駆動部106aの駆動量と撮像素子118への露光により得られた連続的な画像情報を用いたいわゆる山登り方式と呼ばれるコントラスト式焦点検出部で撮像光学系のピント状態を調節する。また、カメラ制御部119は、撮像素子118への露光により得られた画像情報を用いて被写体像の輝度を算出し絞り状態を調節する。
次に、図3、図4を用いて本実施形態で行う音声予測による雑音除去処理(雑音低減処理)について説明する。本実施形態における雑音除去処理においては、駆動雑音混入期間の前及び/又は後の音声信号を用いて、駆動雑音混入期間を補間する音声信号を生成する。
図3は、音声信号処理回路137の、雑音除去処理に係る機能構成を示すブロック図である。音声入力部301であるマイクロホン115は、音声信号を取得する。ここで取得される音声信号にはレンズ駆動部106の駆動雑音が含まれる可能性がある。振動検出部304は加速度計120で構成され、レンズ駆動部106の駆動に伴う振動を検出する。そして、雑音混入区間検出部305は、加速度計120からの信号を分析して、正確な雑音混入区間を検出する。
相関値算出部307は、雑音混入区間の直前及び直後の音声信号の周期性が高いか否かを判断するために、各音声信号の相関を算出する。音声信号予測部306は、雑音混入区間の前後の音声信号及びそれらの相関値に基づいて、雑音混入区間の予測音声信号を算出する。予測音声信号の生成の詳細については後述する。雑音区間補間制御部308は、算出された相関値により示される音声信号の周期性の高さに基づき、予測音声信号を補間に用いるか否かを判断し、雑音混入区間補間部302による予測音声信号を用いた音声信号補間を制御する。雑音混入区間補間部302は、雑音区間補間制御部308からの制御信号に従い、雑音混入区間検出部305で検出された雑音混入区間への音声の補間を行う。録音部303は、雑音混入区間補間部302により補間された音声信号を、記録処理回路133を介してメモリ134に記録する。
次に、音声信号予測部306における音声予測処理について述べる。図4(a)〜(g)は、取得される音声信号に対し予測処理を行う各段階の信号を示している。図4(a)〜(g)において、横軸は時間を表す。図4(c)の縦軸は相関値を表す。図4(a)、(b)、(d)〜(g)においては、縦軸は信号レベルを表す。
図4(a)は被写体音信号に絞りの駆動雑音が混入している信号、図4(b)はピッチ検出を行うための相関値参照区間の音声信号、図4(c)は相関値参照区間と相関値算出区間から求められた相関値及びそこから検出されたピッチを示している。なお、相関値参照区間は、たとえば雑音混入区間より前のたとえば、0.01秒分の区間であり、相関値算出区間は、0.05秒分の区間などである。図4(d)は検出されたピッチを用いて雑音混入区間の音声信号を補間するために生成される予測信号、図4(e)は図4(d)の予測信号に三角形状の窓関数を掛けたものを示している。図4(f)は同様にして雑音混入区間の後方からの音声予測結果に図に示す窓関数を掛けたもの、図4(g)は図4(e)及び図4(f)に示す、雑音混入区間前後からの音声予測結果を加算して、雑音混入区間の音声信号の補間を行ったものである。以下、時間的に雑音発生より前の音声信号を前方と呼び、雑音発生後の音声信号を後方と呼ぶこととする。
予測処理においては、まず図4(a)で示される雑音混入区間を雑音混入区間検出部305で検出する。雑音混入区間検出部305では、雑音の混入した音声の周波数を分析して駆動雑音の特徴周波数成分を用いて雑音混入区間を算出することや、レンズ駆動部106への駆動命令タイミングを得ることで雑音混入区間を検出することも考えられる。
次に、音声信号予測部306によって雑音混入区間前後から雑音混入区間の音声予測信号を生成するため、雑音混入区間直前の信号の相関値から繰返しピッチを検出する。図4(a)に示すように、音声信号は、短時間の領域に着目すると、比較的周期性が高い性質がある。このことを利用して、雑音混入区間直前の音声信号を繰り返して再現することで雑音混入区間の音声信号を補間するための予測信号の生成処理を行う。図4(c)は相関値算出部307によって図4(a)の相関値参照区間の信号と相関値算出区間の信号から算出された相関値を示している。相関値は、相関値算出部307によって相関値参照区間の音声信号と相関値算出区間との各時間での音声信号の値の積を加算して求める。さらに、相関値参照区間の音声信号波形を相関値算出区間の音声信号に対し順次シフトして各シフト位置で求めていき、図4(c)のような相関値を求める。音声信号において雑音混入区間直前から相関値が最大になった位置(時間長)が音声の繰返しピッチとなる。ただし、相関値算出区間に対し相関値参照区間が時間的に同期している位置、つまり相関算出時のシフト量が0の位置で相関値が最大になる。したがって、相関値の最大値は雑音除去区間からピッチ閾値間隔の長さ離れた、図4(c)に示す相関最大値探索区間から探す。ピッチ閾値間隔は、録音する音声の基本周波数の最大値の逆数とするとよい。そうすると、求めたい音声の繰返しピッチよりも短いピッチを誤って検出することがなくなる。例えば、日本人の基本周波数は約400Hzまでなので、ピッチ閾値間隔は2.5msecに設定すればよい。
次に、音声信号予測部306は、図4(d)に示すように、検出されたピッチ区間の音声信号が予測区間の終端にくるまで繰り返される予測信号を生成する。以下、この段階での予測信号を「窓掛け前予測信号」と呼ぶ。次に、音声信号予測部306は、図4(e)に示すように、作成した窓掛け前予測信号に三角形状の窓関数を掛けて前方予測信号を完成させる。以下、この段階での予測信号を「窓掛け後予測信号」と呼ぶ。このとき窓関数wf(t)は予測区間のデータ数がN+1点である場合、予測開始直後のデータをn=0とすると、wf(n)=(N‐n)/Nで表される関数である。
図4(f)のように、音声信号予測部306は、同様の処理を雑音混入区間直後についても行い、後方からの窓掛け後予測信号を作る。後方からの窓掛け前予測信号に掛けられる三角形状の窓関数wr(n)は、前方からの予測のときと対称となり、wr(n)=n/Nで表される。
雑音混入区間補間部302は、前方からの窓掛け後予測信号と後方からの窓掛け後予測信号とを加算し、この加算により得られた音声予測信号で、雑音混入区間の音声信号を置き換えることで補間を行う。図4(g)はその結果の信号波形の例を示している。前方、後方の両方からの窓掛け前予測信号に三角形状の窓関数をかけて加算することで、前方からの予測信号と雑音混入区間直後との接続部、及び、後方からの予測信号と雑音混入区間直前との接続部において、音声が滑らかにつなげることができる。なお、前述の説明においては、雑音混入区間の直前、直後の区間の音声信号を用いて予測信号を生成するものとして説明したが、本実施形態においては、「直前」、「直後」に限定されるものではない。たとえば、雑音混入区間より、0.01秒前から0.11秒前までの音声信号を用いて予測信号を生成してもよいし、雑音混入区間より、0.01秒後から0.11秒後までの音声信号を用いて予測信号を生成してもよい。
図4では、一例として、女性が「あ」と発音している間に駆動雑音が混入した例を示したが、次に、別の音声信号の場合に同様の予測処理を行う場合について述べる。
以下、図5のフローチャート及び図6、図7の説明図を用いて、本実施形態の雑音除去処理について述べる。
撮影動作が開始されると同時に録音動作が開始される。まずS1001では、カメラ制御部119は、レンズ駆動部106に駆動命令が発せられたかどうかを判断する。レンズ駆動部106への駆動命令が検出されない場合はS1012に進み、S1012で撮影動作スイッチのOFFが検出されないかぎり、S1001に戻って処理が繰り返される。
レンズ駆動部106が動作すると、その駆動音が雑音として音声信号に混入する可能性がある。そこで、S1001でレンズ駆動命令が検出されると、S1002にて、雑音混入区間検出部305は、振動検出部304としての加速度計120からの信号を用い、レンズ駆動に伴う振動を検出することで雑音混入区間を精度良く検出する。なお、例えば、カメラ制御部119からのレンズ駆動部106への命令発信の時間を監視することで雑音混入区間を算出することも可能である。しかし、レンズ駆動命令から実際のレンズ駆動部106の駆動タイミングとのタイムラグなどがあるため、加速度計を用いた方が精度の良い検出を行うことができる。
次にS1003において、相関値算出部307は、雑音混入区間の直前及び直後において前述の図4(a)〜(c)のように相関値参照区間と相関値算出区間の相関値をそれぞれ求める。雑音混入区間直前の音声信号を用いて求めた相関値をcor_f(τ)、雑音混入区間直後の音声信号を用いて求めた相関値をcor_r(τ)とする。τは相関参照区間のシフト量である。
次にS1004では、相関値算出部307は、図4(c)で示したように、相関値cor_f(τ)及びcor_r(τ)から予測信号に用いるピッチをそれぞれ検出する。次にS1005では、相関値算出部307は、S1003で算出した相関値cor_f(τ)及びcor_r(τ)を正規化し、正規化後の最大相関値を算出する。
図6を用いて、雑音混入区間前方の相関値の正規化と最大相関値の算出について説明する。図6(a)はある成人女性が「あ」と発音したときの音声信号、図6(b)は図6(a)の音声信号から雑音混入区間信号を省略した音声信号の模式図である。また、図6(c)は雑音混入区間直前の相関値参照区間と相関値算出区間から求めた相関値を正規化した模式図であり、図6(a)の音声信号に同期した位置になっている。ピッチの検出方法で前述したように、相関値算出時における相関値参照区間の音声信号シフト量τが0の位置で相関値が最大になるので、その値でcor_f(τ)を割り正規化する。よって、τ=0で正規化相関値は1となる。次にピッチ検出動作と同様にして正規化後相関値の最大値を検出するが、ピッチ検出位置のシフト量をτpとおくと、正規化後最大相関値cor_f_maxは次式により導かれる。
Figure 0005963430
同様にして、雑音混入区間直後の最大相関値cor_r_maxを算出する。
次に、S1006では、雑音区間補間制御部308は、S1005で算出されたcor_f_max及びcor_r_maxが共に相関閾値Tcよりも大きいかを判断する。最大相関値cor_f_max及びcor_r_maxが共に相関閾値Tcより大きいときは、雑音混入区間前後の音声信号は周期性が高いと判断され、予測処理に用いるのに適切であると考えられる。相関閾値Tcの値は1未満の値に設定され、相関値参照区間の時間長、音声入力部であるマイクロホン115の耐雑音性能などによって適切な値が設定される。
S1006で、最大相関値より雑音混入区間の前後の音声信号が共に周期性が高いと判断されるとS1007に進む。S1007では、音声信号予測部306は、図4(d)〜(f)で示したように、S1004で検出されたピッチを用いて雑音混入区間の音声予測信号を前方及び後方から生成する。音声信号予測部306はその後、前方及び後方からの音声予測信号にそれぞれ三角窓関数を掛けて加算し音声予測信号を完成させる。そして、雑音混入区間補間部302は、図4(g)に示すように、雑音混入区間の音声信号を音声予測信号と置き換える。置き換え後の音声信号はメモリ134に記録され、処理はS1012に進む。
一方、S1006で最大相関値cor_f_maxまたはcor_r_maxの少なくともいずれかが相関閾値Tcより低い場合は、処理はS1008に進む。S1008では、雑音区間補間制御部308は、前方の最大相関値cor_f_maxのみが閾値Tc未満であるかを判断する。前方の最大相関値cor_f_maxのみが閾値Tc未満であると判断されると、雑音混入区間直前の音声信号は周期性が低いと判断され、処理はS1009に進む。S1009では、雑音混入区間補間部302は、後方の音声予測信号を用いて、雑音混入区間の音声信号の補間を行う。
図7(a)は、ある成人女性が「か」と発音したときの音声信号波形の例を示している。ただし、雑音混入区間の音声信号は省略している。図7(b)は、図7(a)の音声信号の雑音混入区間直前の音声信号から算出した相関値cor_f(τ)を正規化したものを示し、図7(c)は、雑音混入区間直後の音声信号から算出したcor_r(τ)を正規化したものを示している。図7(a)に示すように、雑音混入区間直前の音声は子音部を含むため音声信号波形の周期性が低い。また、図7(b)に示すように、相関値cor_f(τ)もシフト量τが0から少し変化しただけで大きく下がっており、最大相関値cor_f_maxも相関閾値Tcに対し低い。一方、雑音混入区間直後の音声信号は周期性が高く、図7(b)に示すように、最大相関値cor_r_maxは相関閾値Tc以上である。そこで、この場合には、雑音混入区間前方からの音声予測信号は用いず、後方からの音声予測信号を用いて雑音混入区間の音声信号の補間を行う。
図7(d)は、雑音混入区間前方の音声信号と、雑音混入区間の信号に三角窓関数を乗じた音声信号の波形を示す図である。雑音混入区間の雑音成分は三角窓関数により後方に行くに従い小さくなっていく。図7(e)は、雑音混入区間後方の音声信号と、雑音混入区間後方から得られた音声予測信号に三角窓関数を乗じた音声信号の波形を示す図である。雑音混入区間後方から得られた音声予測信号に乗じる三角窓関数は図7(c)で雑音混入区間に乗じた三角窓関数と対称な形状をしている。そして、雑音混入区間補間部302は、図7(f)に示すように、それぞれ窓関数を乗じた信号を加算して得た音声予測信号で、雑音混入区間の音声信号を置き換える。置き換え後の信号はメモリ134に記録される。
S1009の処理によれば、S1007での雑音除去処理に比べると、雑音除去性能は低いものとなるであろう。しかし、従来のように雑音混入区間前方の周期性の低い音声信号から音声予測信号を生成した場合に比べれば、違和感の少ないものとなる。S1009で雑音区間後方からの音声予測信号を用いて補間を行うと、処理はS1012に進む。
一方、S1008で最大相関値cor_f_maxが相関閾値Tc以上、または最大相関値cor_r_maxが相関閾値Tc未満と判断されると、処理はS1010に進む。S1010では、雑音区間補間制御部308は、後方の最大相関値cor_r_maxのみが相関閾値Tc未満であるかを判断する。後方の最大相関値cor_r_maxのみが相関閾値Tc未満であるときは、雑音混入区間直後の音声信号の周期性が低いと判断され、処理はS1011に進む。S1011では、雑音混入区間補間部302は、雑音混入区間直前からの音声予測信号を用いて雑音混入区間の音声信号の補間を行う。補間の動作の説明は省略する。
一方、S1010で最大相関値cor_f_max及びcor_r_maxが共に相関閾値Tc未満であると判断されると、雑音混入区間前後の音声信号は共に周期性が低いと判断される。そしてこの場合は、音声予測信号による雑音混入区間の補間を行うことなく、処理はS1012に進む。この場合、記録された音声信号に駆動雑音は残ったままになるが、周期性の低い音声信号からの予測した音声信号で補間するよりも、違和感の少ない音声信号を提供することができる。なお、この場合は、雑音混入区間の音声信号を補間する信号として、所定の音声信号(例えば無音を示す音声信号)などを生成して、補間を行ってもよい。
S1012で撮影動作スイッチのOFFが検出されると録音動作が終了する。
以上説明したように、本実施形態では、雑音混入区間の前方又は後方の音声信号から予測処理を行い、音声予測信号を用いて雑音混入区間の音声を補間する。ここで、雑音混入区間の直前又は直後の音声信号の相関値に基づき音声信号波形の周期性を判断し、音声信号波形の周期性が低いと判断された場合は音声予測信号を補間に用いることを禁止する。これにより、周期性の低い音声信号からの予測処理によって発生する違和感のある音声予測信号を補間に用いることを防ぐことができる。なお、本実施形態においては、周期性が所定値よりも低い音声信号に基づく音声予測信号を用いずに、周期性が所定値よりも高い音声信号に基づく音声予測信号のみを用いる例を説明した。しかし、周期性が所定値よりも低い音声信号に基づく音声予測信号の割合を、周期性が所定値よりも高い音声信号に基づく音声予測信号の割合よりも少なくするように、三角窓関数の形状を変更してもよい。たとえば、前方の音声信号の周期性が高く、後方の音声信号の周期性が低い場合。前方の音声信号に基づく音声予測信号には、1から0.4に下がるような三角窓関数を用い、後方の音声信号に基づく音声予測信号には、0から0.6に上がるような三角窓関数を用いる。
本実施形態では、雑音区間補間制御部308において相関値算出部307による相関値正規化後の最大相関値が相関閾値Tcを超えているかどうかを判定し、雑音混入区間直前及び直後の音声信号の周期性を判断した。ただし本発明はこの態様に限定されない。例えば、次のような予測信号結果比較部を用いた方法で判断してもよい。
図8は、S1004で雑音混入区間の前方からピッチ検出を行ったときの音声信号の模式図である。横軸を時間t、縦軸を信号レベルy(t)とし、雑音混入区間の開始位置をtn、検出ピッチ長をtn‐tmとする(第1の区間)。検出ピッチの開始位置tmから検出ピッチ長戻った位置をtlとし、tlからtmの区間(第2の区間)を判定ピッチと呼ぶ。雑音混入区間直前の隣接する第1の区間と第2の区間の相関性が高ければ判定ピッチと検出ピッチにおける音声信号波形はほぼ一致する。そこで、予測信号結果比較部によって次式に示すように判定ピッチと検出ピッチの差分の自乗和σがピッチ閾値Tpを超えているかどうかで周期性の判定を行う。
Figure 0005963430
差分の自乗和σがピッチ閾値Tpよりも低いときは、音声信号の周期性が低いと判断される。
また、S1009で、雑音混入区間の直前または直後のどちらかのみの音声信号の周期性が低いと判断された場合、本実施形態は次のような処理を行った。すなわちこの場合、一方は音声予測信号に三角窓関数を乗じ、もう一方は雑音混入区間に対称な三角窓関数を乗じ、互いを加算することで雑音混入区間の音声信号の補間を行った。しかし、乗じる窓関数を次のようなものにしてもよい。
図9(a)は、図7(a)の音声信号の雑音混入区間前方の音声信号と、雑音混入区間の音声信号に図に示す形状の窓関数を乗じた信号の模式図である。図7(d)とは異なり、雑音混入区間全体ではなく図9(a)に示す減衰区間の長さの三角窓関数を乗じている。図9(b)は図7(e)と同様で、雑音混入区間後方と直後の音声信号から静止した音声信号に三角窓関数を乗じたものである。そして、図9(c)に示すように図9(a)と図9(b)の音声信号を加算して雑音混入区間の音声信号の補間を行う。雑音混入区間全体に三角窓関数を乗じるのに対して減衰区間にのみ三角窓形状を乗じるので、補間後の音声信号に残る駆動雑音成分が少なくなり、聴感上の駆動雑音の影響は低くなる。
また、三角窓関数を雑音混入区間に乗じることなく、図10(a)(b)に示すように音声信号予測に三角窓関数を乗じたものだけで雑音混入区間の補間を行うことも考えられる。この場合、雑音混入区間直前と後方からの予測信号の端部で不連続になり、異音を発生させる可能性がある。そこで、次のように雑音混入区間の補間を行うことが考えられる。図11(a)は雑音混入区間前方の音声信号の図に示す減衰区間に窓関数を乗じたものである。図9(a)と異なり雑音混入区間と減衰区間が重なりあっていない。図11(b)は雑音混入区間後方からの予測信号に窓関数を乗じたものである。図10(b)と異なり、雑音混入区間よりも減衰区間分だけ長めに予測信号を生成しており、窓関数は減衰区間でだけ三角窓形状としている。そして、図11(c)に示すように図11(a)と図11(b)の音声信号を加算して、雑音混入区間及び雑音混入区間より減衰区間分前方の区間の音声信号の補間を行う。図9、図10とは異なり、雑音混入区間の駆動雑音信号に窓関数形状を乗じ補間を行わないので、補間後の音声信号には駆動雑音成分が全く残っていない。よって、より違和感の少ない雑音除去処理を行うことができる。
本実施形態では、雑音混入区間直前及び直後の音声信号からそれぞれ算出された相関値が低く音声信号の周期性が低いと判断された場合、予測音声信号による雑音混入区間の補間を行わず雑音混入信号をそのまま記録している。ただし、本発明はこの態様に限定されるものではない。例えば、雑音混入区間の音声信号を無音処理(ミュート)、つまり無音信号で置換することで補間を行ってもよい。この場合、駆動雑音は完全に除去することができる。ただし、無音処理した雑音混入区間の端部で音声信号が不連続になり、異音を発生させる可能性がある。そこで、図12に示すように、雑音混入区間前方及び後方の音声信号の図に示す減衰区間に窓関数を乗じて補間を行えば、雑音混入区間の端部で音声信号が不連続でなくなるので、より違和感を低減することができる。
さらに、雑音区間補間制御部308において雑音混入区間前方又は後方の音声信号の音圧レベルによって、無音処理による補間を行うか補間処理を行わないかを判断してよい。例えば、雑音混入区間及びその前後の音声信号、つまり被写体音声の音圧レベルが非常に大きいときはレンズ駆動部106による駆動雑音は被写体音声に埋没して雑音除去処理がされていなくても違和感が少ない場合がある。そこで、予めレンズ駆動部106の駆動雑音を録音することで音圧レベル閾値を設定しておく。そして、雑音混入区間前後の音声信号の音圧レベルが所定の音圧レベル閾値より高いときは駆動雑音が被写体音に埋没すると音圧レベル判断部で判断し、無音処理による雑音除去処理を禁止する。一方、雑音混入区間前後の音声信号の音圧レベルが設定の音圧レベル閾値より低いときは無音処理による補間処理を行う。よって、雑音混入区間前後の音声信号の周期性が低い場合でも、違和感の少ない処理を行うことができる。
なお、本実施形態においては、デジタル一眼レフカメラを例に挙げて説明を行ったが、これ以外の装置であってもよい。たとえば、コンパクトデジタルカメラであってもよいし、携帯電話、スマートフォンなどであってもよい。すなわち、音声を集音する集音部、雑音を発生させる駆動部、音声信号の雑音が発生した期間の音声を雑音の発生していない期間の音声に基づいて補間する処理を行う処理部を有する装置であればどのような装置であってもよい。
本実施形態によれば、集音部により集音された音声信号に含まれる、駆動部の駆動に伴って発生する駆動雑音を低減することができる。そのために、駆動雑音の含まれる雑音発生区間の前の区間の音声信号に基づいて生成した前方音声予測信号、及び/又は、後の区間の音声信号に基づいて生成した後方音声予測信号を用いて、音声信号の補間を行う。すなわち、前方音声予測信号及び/又は後方音声予測信号からなる補間音声信号で、雑音発生区間の音声信号を補間する。特に、本実施形態においては、雑音発生区間の前の区間の音声信号の周期性と、雑音発生区間の後の区間の音声信号の周期とに基づいて、前方音声予測信号と後方音声予測信号の両方を用いるか、いずれか一方を用いる。または、雑音発生区間の前の区間の音声信号の周期性と、雑音発生区間の後の区間の音声信号の周期とに基づいて、前方音声予測信号と後方音声予測信号を用いる割合を決定する。すなわち、雑音発生区間の前の区間の音声信号の周期性と、雑音発生区間の後の区間の音声信号の周期とに基づいて、雑音発生区間の音声信号を補間する補間信号の生成方法を切り替える。
<実施形態2>
以下、図13〜図16を用いて第2の実施形態である撮像装置及び情報処理装置について説明を行う。
図13は、第2の実施形態における、デジタル一眼レフカメラと情報処理装置とを含むシステムを示した図であり、デジタル一眼レフカメラ100と情報処理装置170とが通信ケーブル151によって接続されていることを示している。図14は、本実施形態における、デジタル一眼レフカメラ100及び情報処理装置170のブロック図である。本実施形態におけるデジタル一眼レフカメラ100のカメラボディ101には、外部装置との通信を行うための通信コネクタ141が設けられている。この通信コネクタ141には、情報処理装置170の通信コネクタ174と、通信ケーブル151を介して接続されている。図13及び図14において、第1の実施形態と同一の構成要素には同一の符号を付し、その説明を省略する。
情報処理装置170は、制御部171、音声信号処理回路172、メモリ173、操作入力部175、音声再生装置176、表示装置177を有している。制御部171は、通信コネクタ174を介して、カメラボディ101側のメモリ134に記録された音声信号を含む動画記録データを受信する。音声信号処理回路172は、その音声信号に対して雑音除去処理を行う。この雑音除去処理で得られた信号は、メモリ173に記録される。
本実施形態では、メモリ173には雑音除去処理を施していない駆動雑音を含む音声信号と、雑音区間検出部の検出結果である音声信号に同期した雑音混入区間の情報(雑音混入区間タイミング)が記録されている。雑音除去処理は、操作者によって操作される操作入力部175からの命令信号に基づき行われ、雑音除去処理の経過は音声再生装置176及び表示装置177に出力される。
図15、図16を用いて本実施形態のレンズ駆動動作と雑音除去処理の動作について説明する。
図15は本実施形態におけるカメラ側でのレンズ駆動動作及び音声記録のフローチャートである。動画撮影動作スイッチがONにされると、録音動作が開始される。S2001では、カメラ制御部119は、レンズ駆動部106に駆動命令が発せられたかどうかを判断する。レンズ駆動部106への駆動命令が検出されない場合はS2004に進み、S2004で録音スイッチのOFFが検出されないかぎり、S2001に戻って処理が繰り返される。
S2001でレンズ駆動命令が検出されると、S2002に進み、カメラ制御部119は加速度計120の出力信号を分析して雑音混入区間を算出する。次に、カメラ制御部119は、S2002で算出した雑音混入区間のタイミングを音声信号に同期した雑音混入区間タイミング記録としてメモリ134に記録する。S2004で録音スイッチのOFFが検出されるまでS2001に戻って処理を繰り返す。
次に図16を用いて、デジタル一眼レフカメラ100と情報処理装置170とを通信ケーブル151で接続し情報処理装置170で雑音除去処理を行う動作について説明する。
操作入力部175によって雑音除去処理動作の命令が入力されると、デジタル一眼レフカメラ100及び情報処理装置170内で、図16のフローチャートに対応する処理がスタートする。
まず、情報処理装置170は、通信ケーブル151を介し、カメラボディ101内のメモリ134に記録された駆動雑音が混入した音声信号及び雑音混入区間タイミング記録を含む動画記録データを読み込む(S2101)。
次にS2102で、その動画記録データに雑音混入区間タイミング記録が存在するか否かを判断する。雑音混入区間タイミング記録が存在しない場合は処理はS2112に進む。一方、雑音混入区間タイミング記録が検出されると処理はS2103に進む。S2103からS2111までの動作は第1の実施形態のS1003からS1011までの動作と同様のため、説明を省略する。S2112において、読み込んだ動画記録データの終了が検出されるまで、S2101に戻って処理が繰り返される。動画記録データの終了が検出される処理は終了する。
上述した第2の実施形態では、デジタル一眼レフカメラ100と情報処理装置170とを通信ケーブル151で電気的に接続し、音声信号記録及び雑音混入区間タイミング記録を含む動画記録データを通信して雑音除去処理を行った。ただし、本発明はこの態様に限定されるものではなく、例えば次のような構成でもよい。図17に示す全体図では、動画記録データを記録したデジタル一眼レフカメラ100のメモリ134がカメラボディ101から取り外し可能なメモリカード134aで構成されている。この場合、動画記録データが記録されたメモリカード134aをメモリカードリーダ152に差し込み、情報処理装置170へ動画記録データを転送することが可能な状態にして、雑音除去処理を行う。これにより、デジタル一眼レフカメラ100と情報処理装置170との間を通信ケーブル151でつなぐ必要はない。雑音除去処理の動作は図16のS2101がメモリカードから動画記録データを読み込む動作に変更されるだけである。また、情報処理装置170にメモリカード134aを読み込む装置を有していれば、メモリカードリーダ152は必要ない。すなわち、実施形態の情報処理装置170は、単独での動作も可能である。実施形態の情報処理装置170としては、音声信号を処理することができればどのような装置であってもよい。たとえば、パーソナルコンピュータ、スマートフォン、撮像装置、テレビなどであってもよい。
<他の実施形態>
本発明は、以下の処理を実行することによっても実現される。即ち、上記実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (14)

  1. 撮像手段と、
    前記撮像手段の動作に伴って音声を入力する音声入力手段と、
    前記音声入力手段により入力された音声信号のうちの、前記撮像手段の機構部の駆動に伴って発生した雑音が混入した雑音混入区間を検出する検出手段と、
    前記検出された雑音混入区間の音声信号を、前記雑音混入区間の前方及び後方の少なくともいずれかの区間における音声信号から作成される信号で置換することで補間を行う補間手段と、
    前記雑音混入区間の前方及び後方の区間における音声信号の周期性に応じて、前記補間手段による補間方法を制御する制御手段と、を有し、
    前記制御手段は、前記雑音混入区間の前方及び後方の区間における音声信号の周期性が所定の閾値よりも低いときは、前記補間を行わないように前記補間手段を制御することを特徴とする撮像装置。
  2. 撮像手段と、
    前記撮像手段の動作に伴って音声を入力する音声入力手段と、
    前記音声入力手段により入力された音声信号のうちの、前記撮像手段の機構部の駆動に伴って発生した雑音が混入した雑音混入区間を検出する検出手段と、
    前記検出された雑音混入区間の音声信号を、前記雑音混入区間の前方及び後方の少なくともいずれかの区間における音声信号から作成される信号で置換することで補間を行う補間手段と、
    前記雑音混入区間の前方及び後方の区間における音声信号の周期性に応じて、前記補間手段による補間方法を制御する制御手段と、を有し、
    前記制御手段は、前記雑音混入区間の前方及び後方の区間における音声信号の周期性が所定の閾値よりも低いときは、前記雑音混入区間の音声信号を、無音信号で置換するように前記補間手段を制御し、前記雑音混入区間の前方及び後方の区間における音声信号の音圧レベルが所定の音圧レベル閾値よりも高いときは、前記無音信号による置換を禁止することを特徴とする撮像装置。
  3. 前記制御手段は、前記雑音混入区間の前方及び後方のいずれか一方の区間における音声信号の周期性が前記所定の閾値よりも低いときは、前記所定の閾値よりも高い周期性を持つ方の区間における音声信号のみから作成される信号を用いて前記補間を行うよう前記補間手段を制御することを特徴とする請求項1または2に記載の撮像装置。
  4. 前記制御手段は、前記雑音混入区間の前方及び後方のいずれか一方の区間における音声信号の周期性が前記所定の閾値よりも低いときは、前記所定の閾値よりも高い周期性を持つ方の区間における音声信号と前記雑音混入区間の音声信号とを用いて前記補間を行うよう前記補間手段を制御することを特徴とする請求項1または2に記載の撮像装置。
  5. 前記制御手段は、前記雑音混入区間の前方及び後方のいずれか一方の区間における音声信号の周期性が前記所定の閾値よりも低いときは、前記所定の閾値よりも高い周期性を持つ方の区間における音声信号のみから作成される信号を用いて前記雑音混入区間及び前記雑音混入区間の直前又は直後の区間に対して前記補間を行うよう前記補間手段を制御することを特徴とする請求項1または2に記載の撮像装置。
  6. 前記音声信号の周期性は、前記雑音混入区間の前方及び後方の区間における音声信号の相関値に基づくものであることを特徴とする請求項1または2に記載の撮像装置。
  7. 前記音声信号の周期性は、前記雑音混入区間の直前又は直後における隣接する第1の区間と第2の区間の音声信号の相関性に基づくものであることを特徴とする請求項1または2に記載の撮像装置。
  8. 前記検出手段は、前記撮像手段の機構部の駆動に伴って発生した振動を検出する振動検出手段を含むことを特徴とする請求項1または2に記載の撮像装置。
  9. 撮像手段と、前記撮像手段の動作に伴って音声を入力する音声入力手段とを有する撮像装置の制御方法であって、
    前記音声入力手段により入力された音声信号のうちの、前記撮像手段の機構部の駆動に伴って発生した雑音が混入した雑音混入区間を検出する検出工程と、
    前記検出された雑音混入区間の音声信号を、前記雑音混入区間の前方及び後方の少なくともいずれかの区間における音声信号から作成される信号で置換することで補間を行う補間工程と、
    前記雑音混入区間の前方及び後方の区間における音声信号の周期性に応じて、前記補間工程における補間方法を制御する制御工程と、を有し、
    前記制御工程は、前記雑音混入区間の前方及び後方の区間における音声信号の周期性が所定の閾値よりも低いときは、前記補間工程における前記補間を行わないように制御することを特徴とする撮像装置の制御方法。
  10. 撮像手段と、前記撮像手段の動作に伴って音声を入力する音声入力手段とを有する撮像装置の制御方法であって、
    前記音声入力手段により入力された音声信号のうちの、前記撮像手段の機構部の駆動に伴って発生した雑音が混入した雑音混入区間を検出する検出工程と、
    前記検出された雑音混入区間の音声信号を、前記雑音混入区間の前方及び後方の少なくともいずれかの区間における音声信号から作成される信号で置換することで補間を行う補間工程と、
    前記雑音混入区間の前方及び後方の区間における音声信号の周期性に応じて、前記補間工程における補間方法を制御する制御工程と、を有し、
    前記制御工程は、前記雑音混入区間の前方及び後方の区間における音声信号の周期性が所定の閾値よりも低いときは、前記雑音混入区間の音声信号を、無音信号で置換するように前記補間工程を制御し、前記雑音混入区間の前方及び後方の区間における音声信号の音圧レベルが所定の音圧レベル閾値よりも高いときは、前記無音信号による置換を禁止することを特徴とする撮像装置の制御方法。
  11. 音声信号を取得する取得手段と、
    前記取得手段により取得された前記音声信号の所定の区間の音声信号を、前記所定の区間の、前方の第1の区間及び後方の第2の区間の少なくともいずれか一方の区間の音声信号に基づいて生成された補間信号に基づいて補間する音声処理手段と、を有し、
    前記音声処理手段は、前記第1の区間の音声信号の周期性と、前記第2の区間の音声信号の周期性とに応じて、前記補間信号の生成方法を変更し、前記第1の区間及び前記第2の区間における音声信号の周期性が所定の閾値より低いときは、前記補間を行わないようにすることを特徴とする音声処理装置。
  12. 音声信号を取得する取得手段と、
    前記取得手段により取得された前記音声信号の所定の区間の音声信号を、前記所定の区間の、前方の第1の区間及び後方の第2の区間の少なくともいずれか一方の区間の音声信号に基づいて生成された補間信号に基づいて補間する音声処理手段と、を有し、
    前記音声処理手段は、前記第1の区間の音声信号の周期性と、前記第2の区間の音声信号の周期性とに応じて、前記補間信号の生成方法を変更し、
    前記音声処理手段は、前記第1の区間及び前記第2の区間における音声信号の周期性が所定の閾値よりも低いときは、前記所定の区間の音声信号を、無音信号で置換し、前記第1の区間及び前記第2の区間における音声信号の音圧レベルが所定の音圧レベル閾値よりも高いときは、前記無音信号による置換を禁止することを特徴とする音声処理装置。
  13. 音声信号を処理する音声処理装置の制御方法であって、
    音声信号を取得する取得工程と、
    前記取得工程により取得された前記音声信号の所定の区間の音声信号を、前記所定の区間の、前方の第1の区間及び後方の第2の区間の少なくともいずれか一方の区間の音声信号に基づいて生成された補間信号に基づいて補間する音声処理工程と、を有し、
    前記音声処理工程は、前記第1の区間の音声信号の周期性と、前記第2の区間の音声信号の周期性とに応じて、前記補間信号の生成方法を変更し、前記第1の区間及び前記第2の区間における音声信号の周期性が所定の閾値よりも低いときは、前記補間を行わないようにすることを特徴とする音声処理装置の制御方法。
  14. 音声信号を処理する音声処理装置の制御方法であって、
    音声信号を取得する取得工程と、
    前記取得工程により取得された前記音声信号の所定の区間の音声信号を、前記所定の区間の、前方の第1の区間及び後方の第2の区間の少なくともいずれか一方の区間の音声信号に基づいて生成された補間信号に基づいて補間する音声処理工程と、を有し、
    前記音声処理工程は、前記第1の区間の音声信号の周期性と、前記第2の区間の音声信号の周期性とに応じて、前記補間信号の生成方法を変更し、
    前記音声処理工程は、前記第1の区間の及び前記第2の区間における音声信号の周期性が所定の閾値よりも低いときは、前記所定の区間の音声信号を、無音信号で置換し、前記第1の区間及び前記第2の区間における音声信号の音圧レベルが所定の音圧レベル閾値よりも高いときは、前記無音信号による置換を禁止することを特徴とする音声処理装置の制御方法。
JP2011264109A 2011-12-01 2011-12-01 撮像装置、音声処理装置、及びそれらの制御方法 Expired - Fee Related JP5963430B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011264109A JP5963430B2 (ja) 2011-12-01 2011-12-01 撮像装置、音声処理装置、及びそれらの制御方法
US13/678,721 US9282229B2 (en) 2011-12-01 2012-11-16 Audio processing apparatus, audio processing method and imaging apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011264109A JP5963430B2 (ja) 2011-12-01 2011-12-01 撮像装置、音声処理装置、及びそれらの制御方法

Publications (2)

Publication Number Publication Date
JP2013117585A JP2013117585A (ja) 2013-06-13
JP5963430B2 true JP5963430B2 (ja) 2016-08-03

Family

ID=48523742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011264109A Expired - Fee Related JP5963430B2 (ja) 2011-12-01 2011-12-01 撮像装置、音声処理装置、及びそれらの制御方法

Country Status (2)

Country Link
US (1) US9282229B2 (ja)
JP (1) JP5963430B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012203040A (ja) * 2011-03-23 2012-10-22 Canon Inc 音声信号処理装置、及びその制御方法
US20120300100A1 (en) * 2011-05-27 2012-11-29 Nikon Corporation Noise reduction processing apparatus, imaging apparatus, and noise reduction processing program
JP6381366B2 (ja) * 2014-08-26 2018-08-29 キヤノン株式会社 音声処理装置、音声処理方法、及び、プログラム
JP6381367B2 (ja) * 2014-08-26 2018-08-29 キヤノン株式会社 音声処理装置、音声処理方法、及び、プログラム
JP6477295B2 (ja) * 2015-06-29 2019-03-06 株式会社Jvcケンウッド 雑音検出装置、雑音検出方法及び雑音検出プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2424093A1 (en) * 2003-03-31 2004-09-30 Dspfactory Ltd. Method and device for acoustic shock protection
US7596231B2 (en) * 2005-05-23 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing noise in an audio signal
JP2007316254A (ja) * 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
JP2008077707A (ja) 2006-09-19 2008-04-03 Sony Corp 記録装置、ノイズ除去方法、ノイズ除去装置
JP5279629B2 (ja) * 2009-06-19 2013-09-04 キヤノン株式会社 撮像装置
JP2011237753A (ja) * 2010-04-14 2011-11-24 Sony Corp 信号処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2013117585A (ja) 2013-06-13
US20130141598A1 (en) 2013-06-06
US9282229B2 (en) 2016-03-08

Similar Documents

Publication Publication Date Title
US9153243B2 (en) Imaging device, program, memory medium, and noise reduction method
JP5963430B2 (ja) 撮像装置、音声処理装置、及びそれらの制御方法
US8626500B2 (en) Apparatus and method for noise reduction and sound recording
JP2005241805A (ja) オートフォーカス装置及びそのプログラム
KR20110135343A (ko) 음성신호처리장치 및 그 제어 방법
KR20070086061A (ko) 카메라 및 카메라의 화상처리방법
US8698911B2 (en) Sound recording device, imaging device, photographing device, optical device, and program
JP5656586B2 (ja) 撮像装置とその制御方法並びに音声処理装置及び方法
JP6144945B2 (ja) 信号処理装置及び方法
US20120250885A1 (en) Signal-processing device, imaging apparatus, and signal-processing program
JP5158054B2 (ja) 録音装置、撮像装置、および、プログラム
US20110205385A1 (en) Signal processing apparatus and imaging apparatus
JP6061476B2 (ja) 音声処理装置
JP2013183346A (ja) 撮像装置及び音声処理装置
JP2012185445A (ja) 信号処理装置、撮像装置、及び、プログラム
JP5854779B2 (ja) 撮像装置及び情報処理装置、これらの制御方法並びに雑音除去方法及びプログラム
JP2012165219A (ja) 撮像装置
JP5736839B2 (ja) 信号処理装置、撮像装置、及びプログラム
JP2013178456A (ja) 信号処理装置、カメラおよび信号処理プログラム
JP7438732B2 (ja) 撮像装置およびその制御方法
JP2016018082A (ja) 音声処理装置及び方法、並びに撮像装置
JP6278688B2 (ja) 撮像装置、撮像装置の制御方法及びプログラム
JP2013161041A (ja) 信号処理装置、カメラおよび信号処理プログラム
JP2011097260A (ja) 撮像装置
JP2019213090A (ja) 撮像装置、その方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160628

R151 Written notification of patent or utility model registration

Ref document number: 5963430

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees