JP4237768B2 - 音声処理装置、音声処理プログラム - Google Patents

音声処理装置、音声処理プログラム Download PDF

Info

Publication number
JP4237768B2
JP4237768B2 JP2006040691A JP2006040691A JP4237768B2 JP 4237768 B2 JP4237768 B2 JP 4237768B2 JP 2006040691 A JP2006040691 A JP 2006040691A JP 2006040691 A JP2006040691 A JP 2006040691A JP 4237768 B2 JP4237768 B2 JP 4237768B2
Authority
JP
Japan
Prior art keywords
sound
volume
voice
adjusted
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006040691A
Other languages
English (en)
Other versions
JP2007219241A (ja
Inventor
広和 小塩
Original Assignee
株式会社タイトー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社タイトー filed Critical 株式会社タイトー
Priority to JP2006040691A priority Critical patent/JP4237768B2/ja
Publication of JP2007219241A publication Critical patent/JP2007219241A/ja
Application granted granted Critical
Publication of JP4237768B2 publication Critical patent/JP4237768B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、カラオケシステムにおける信号処理に好適な音声処理装置、音声処理プログラムに関する。
従来のカラオケ装置では、カラオケ演奏中に歌唱者によって入力された歌唱音声を本来歌唱すべき正しいピッチに補正するピッチ補正機能を備えたものがある(例えば、特許文献1参照)。特許文献1に記載されたカラオケ装置では、カラオケ演奏中に入力される歌唱者の音声を周波数分析することによって、歌唱者の基準周波数を特定する。同時に演奏されている楽曲の楽曲データからその時点における正しい音程情報を取得する。そして、この楽曲データからの正しい音程情報を周波数に変換し、歌唱者の音声の基準周波数と比較することによって歌唱者の音声の音程が、演奏されている楽曲に対してどの程度ずれているかを算出する。さらに、このずれ分の歌唱者の音声の基準周波数を補正して、音声を再合成することにより、演奏されている楽曲に対して正しい音程の音声を出力させることができる。
特開2001−117599公報
このように従来のカラオケ装置では、歌唱者により入力された歌唱音声に対して周波数分析をすることにより、歌唱者から入力された音声の音程を、楽曲(BGM(back ground music)に対して決められた音程情報に合わせて調整することができる。
しかしながら、従来のカラオケ装置では、楽曲(BGM、演奏音(カラオケ))の音と歌唱者により入力された歌唱音声との不整合を調整することができなかった。例えば、楽曲の音が大きすぎるためにマイクにより集音された歌唱者の音声が聞こえない、あるいは逆に歌唱者の音声が大きいため集音された音声をそのまま出力すると、楽曲に対して音声が大きすぎてしまうといったことが発生してしまう。
なお、多くのカラオケ装置では、歌唱者の音声と楽曲(カラオケ)のバランスを調整するための機能を備えているが、それは手動操作により予めバランスを設定するものであって、実際に入力される歌唱者の音声と楽曲のレベルと関係なく調整されてしまう。このため、実際に入力される歌唱音声と楽曲(BGM)に合わせて適切に音量のバランスを調整することが困難となっていた。
本発明は前述した事情に考慮してなされたもので、その目的は、実際に入力される歌唱音声と楽曲(BGM)に合わせて適切に両者の音量バランスを自動的に調整することが可能な音声処理装置、音声処理プログラムを提供することにある。
本発明は、入力された音声信号と演奏音信号をもとにして音声と演奏音の音量レベルをそれぞれ検知する音量レベル検知手段と、前記音量レベル検知手段により検知された前記音声と前記演奏音のそれぞれの最大音量レベルを、前記音声と前記演奏音のそれぞれに対して予め設定された音量の許容出力に対する比率により示す所定レベルに調整して、この調整後の前記音声と前記演奏音の音量レベルの合計が前記許容出力と同じとなるようにすると共に、前記所定レベルに調整された前記音声の音量レベルの平均値が前記所定レベルに調整された前記演奏音の音量レベルの平均値と同じとなるように、前記所定レベルに調整された前記音声の最大音量を一定に保ったまま音量を変更する処理を実行して前記音声と前記演奏音のバランスを調整する音量調整手段と、前記音量調整手段により音量レベルが調整された音声について周波数分析を実行して周波数特性を求める音声分析手段と、前記音声分析手段により求められた周波数特性をもとに、前記音量調整手段によって前記所定レベルに調整された前記音声から歌唱者の声の高さを表す基本周波数帯域を検出する基本周波数帯域検出手段と、前記音量調整手段により音量レベルが調整された前記演奏音に対して、前記基本周波数帯域検出手段により検出された基本周波数帯域に対応する帯域の音量レベルを所定値分下げる調整をする帯域音量調整手段と、前記帯域音量調整手段により調整された演奏音の演奏音信号と、前記音量調整手段により調整された音声の音声信号を出力する信号出力手段とを具備したことを特徴とする。
本発明によれば、実際に入力される歌唱音声と楽曲(BGM)に合わせて適切に両者の音量バランスを自動的に調整することができる。
以下、図面を参照して本発明の実施の形態について説明する。
図1及び図2は、本実施形態における音声処理装置10を用いたシステムの構成を示すブロック図である。本実施形態では、通常、一般的なカラオケシステム11で処理される楽曲(BGM)の信号、すなわち歌唱者の音声が含まれていない演奏音(カラオケ)の信号(以下、BGM信号と称する)と、マイク12から入力される歌唱者の歌唱による音声の信号(以下、音声信号と称する)に対する音声処理を実行する。
図1に示す構成では、音声処理装置10は、カラオケシステム11から出力されるカラオケコンテンツのBGM信号と、マイク12からの音声信号を入力する。カラオケシステム11は、音声処理装置10に対してBGM信号を出力すると共に、カラオケコンテンツの映像信号をディスプレイ13に出力することにより楽曲の歌詞や背景映像などを表示させる。音声処理装置10は、カラオケシステム11からのBGM信号とマイク12からの音声信号に対して音声処理を実行し、BGM信号と音声信号の音量のバランスを入力信号に応じて調整する。音声処理装置10は、処理されたBGM信号と音声信号とをアンプ14に出力する。アンプ14は、音声処理装置10からの信号を増幅してスピーカ15から音量のバランスが調整された音を出力させる。
図2に示す構成では、音声処理装置10は、図1と同様に、カラオケシステム11からBGM信号を入力し、マイク12から音声信号を入力する。図2に示す音声処理装置10は、音声処理されたBGM信号と音声信号とを、カラオケシステム11に出力する。カラオケシステム11は、映像信号をディスプレイ13に出力することにより楽曲の歌詞や背景映像などを表示させると共に、音声処理装置10により処理されたBGM信号と音声信号とをアンプ14に出力することより、スピーカ15から音量のバランスが調整された音を出力させる。
本実施形態における音声処理装置10は、図1あるいは図2の何れの形態によって使用されても良い。
なお、図1及び図2に示す構成では、音声処理装置10は、カラオケシステム11と別の装置として構成されているが、カラオケシステム11に組み込まれて構成されていても良い。例えば、カラオケシステム11に実装されたコンピュータの機能により、本実施形態における音声処理装置10により音声処理を実行させるための音声処理プログラムを実行させることにより、音声処理装置10と同等の音声処理をカラオケシステム11内で実行することができる。
また、音声処理プログラムは、他のコンピュータの機能が搭載されたカラオケコンテンツを再生出力が可能な装置、例えば携帯電話機、PDA(personal digital assistant)、PC(Personal Computer)などにおいて実行させることも可能である。
図3は、本実施形態における音声処理装置10の構成を示すブロック図である。音声処理装置10は、例えばスピーカ15からの音声信号とカラオケシステム11からのBGM信号を入力するための入力インタフェースと、処理された音声信号とBGM信号を出力する出力インタフェースを備えたコンピュータにより実現される。音声処理装置10を実現するコンピュータは、メモリに記憶された音声処理プログラムをプロセッサにより実行することにより、図3に示す各機能を実現することができる。
図3に示すように、音声処理装置10には、音声信号入力部20、BGM信号入力部21、音圧処理部23、周波数処理部25、入力部27、モード設定部28が設けられる。
音声信号入力部20は、歌唱者による歌唱によって入力された音声の音声信号をマイク12から入力する。音声信号入力部20は、マイク12から入力された音声信号を音声処理装置10において処理可能な形式のデータに変換する。
BGM信号入力部21は、カラオケシステム11からのBGM信号を入力する。BGM信号入力部21は、MIDI(musical instruction digital interface)データ等の信号ではなく、アナログの音声信号を入力して、音声処理装置10において処理可能な形式のデータに変換する。
音圧処理部23は、音声信号入力部20により入力された音声信号と、BGM信号入力部21により入力されたBGM信号に対して、音声信号の音量レベルとBGM信号の音量レベルに基づいて、両者の音量バランスを調整する処理を実行する。
音圧処理部23には、音量レベル検知部30(音声入力判定部31)、音量調整部33が設けられる。
音量レベル検知部30は、音声信号入力部20により入力された音声信号とBGM信号入力部21により入力された演奏音信号をもとにして、音声と演奏音の音量レベルをそれぞれ検知する。
音声入力判定部31は、音声信号に対して検出される音量レベルが所定の状態となったことを判定する。ここでは、楽曲のイントロや間奏の部分を判定するために、歌唱者による音声入力を利用する。例えば、音声入力が一定時間、予め決められた一定値以下の音量レベルとなったことを検知することにより、楽曲のイントロや間奏の部分を判定する。その他の判定方法を用いることも可能である。
音量調整部33は、音量レベル検知部30により検知された音声とBGMのそれぞれの最大音量レベルを、予め設定された設定レベルに調整すると共に、この設定レベルに調整された音声と演奏音のそれぞれの平均値を調整する。これにより、音声とBGMとの音量バランスを調整する。音量調整部33は、モード設定部28により設定されるモード(例えば、標準モード、音声優先モード、演奏優先モード)に応じた音量調整を実行することができる。音量調整部33は、音声入力判定部31により音声信号から検出される音量レベルが所定の状態となったと判定された場合、すなわち楽曲のイントロや間奏と判定された場合には、音声に対する調整をせず、また演奏音に対する音量レベルを、本来、音声が入力される部分よりも上げるように調整する(演奏優先モード)。
周波数処理部25は、音圧処理部23により音量レベルの調整がされたBGMについて、音声が聞き取りやすくなるように周波数特性を変換するための周波数処理を実行する。
周波数処理部25には、音声分析部40、基本周波数帯域検出部41、BGM分析部42、帯域音量調整部43、信号出力部44が設けられる。
音声分析部40は、例えばFFT(Fast Fourier Transform)分析により、音圧処理部23によって音量レベルの調整が施された音声ついて周波数分析を実行して周波数特性を求める。
基本周波数帯域検出部41は、音声分析部40による周波数分析により求められた音声についての周波数特性をもとに、入力された音声の基本周波数帯域(歌唱者の声の高さを表す)を検出する。
BGM分析部42は、例えばFFT(Fast Fourier Transform)分析により、音圧処理部23(音量調整部33)によって音量レベルの調整が施されたBGMついて周波数分析を実行して周波数特性を求める。
帯域音量調整部43は、音圧処理部23(音量調整部33)により音量レベルが調整されたBGMに対して、BGM分析部42による分析結果をもとにして、基本周波数帯域検出部41により検出された基本周波数帯域に対応する帯域の音量レベルを所定値分下げる。
信号出力部44は、帯域音量調整部43により調整された演奏音のBGM信号と、音圧処理部23(音量調整部33)により調整された音声の音声信号を出力する。信号出力部44は、BGM信号と音声信号とを合成した信号を出力する。なお、システムによってはBGM信号と音声信号とを、それぞれを独立して出力するようにしても良い。
入力部27は、システムの利用からの指示を入力するためのもので、各種ボタンや、キー、あるいはリモコン装置からの信号を受信する機能などが設けられている。入力部27には、モード選択ボタン27aが設けられており、音声処理モード、例えば標準モード、音声優先モード、演奏優先モードの何れかを任意に選択することができるものとする。なお、デフォルトでは、標準モードが選択されているものとする。
モード設定部28は、入力部27のモード選択ボタン27aに対する操作に応じた音声処理モード(標準モード、音声優先モード、演奏優先モード)を設定する。音圧処理部23(音量調整部33)は、モード設定部28により設定された音声処理モードに応じて、音声とBGMのそれぞれの最大音量レベルと平均値の調整を実行する。
次に、本実施形態の音声処理装置10における音声処理について、図4に示すフローチャートを参照しながら説明する。図5〜図11は、音声処理装置10の各部における処理を説明するための信号波形の一例を示す図である。はじめに、基本的な音声処理について説明する。ここでは、モード設定部28により設定される音声処理モードとして基本モードが設定されているものとする。
はじめに、音声処理装置10は、音声信号入力部20とBGM信号入力部21のそれぞれから入力される音声信号とBGM信号に対して、音圧処理部23における処理により音量レベルの調整を行う。
まず、音声処理装置10は、カラオケシステム11から出力されるBGM信号(例えばイントロ部分の音声)をBGM信号入力部21によって入力し(ステップA4)、音声が十分に聞こえる音量を確保するためにBGMの音量レベルを調整する。ここでは、音量レベル検知部30によりBGMの最大音量を検知し(ステップA5)、この最大音量が許容出力に対する所定レベル(設定レベル)、例えば50%程度(−6db)になるように、音量調整部33によりBGMの音量レベルを調整(上げる/下げる)する(ステップA6)。ここでの所定レベル(50%)は、予め音声処理モードに応じて設定されているものとする。
図5(b)には、BGM信号入力部21により入力されるBGM信号の波形の一例を示している。また、図5(b)には、同図に示す信号の波形が示す各値の具体例を示している。
図5(b)に示すBGM信号の最大音量(最大振幅値)は、「−0.18db」(0dB近く)であり、許容出力の100%近くとなっていることを示している。
この場合、音圧処理部23は、BGM信号に対して、6dB下げるように調整する。
図6(b)には、入力されたBGM信号に対して、6dB(許容出力の50%)下げる調整をすることにより生成されるBGM信号の波形の一例を示している。図6(b)に示すように、最大音量(最大振幅値)が「−6.18dB」となっている。この時、BGM信号の音量レベルの平均値が「−19.87dB」となっている。
一方、音声処理装置10は、マイク12から出力される音声信号を音声信号入力部20によって入力し(ステップA1)、BGM信号に対する処理と同様の処理を実行する。すなわち、音量レベル検知部30により音声の最大音量を検知し(ステップA2)、この最大音量が許容出力に対する所定レベル、例えば50%(−6db)になるように、音量調整部33によりBGMの音量レベルを調整(上げる/下げる)する(ステップA3)。
図7(a)には、入力された音声信号に対して、6dB(許容出力の50%)下げる調整をすることにより生成される音声信号の波形の一例を示している。図7(a)に示すように、最大音量(最大振幅値)が「−5.97dB」となっている。
この時点では、音声とBGMを合成すると、音声が小さく聞こえてしまう。これは、音声がBGMに比較して音量の変動が大きく、音量レベルの平均値が低いためである。図7(a)に示すように、この時の音声信号の音量レベルの平均値が「−25.01dB」となっており、図6(b)に示す音量レベルを調整した後のBGM信号の平均値「−19.87dB」よりも低くなっている。
そこで、音量調整部33は、音声の音量レベルの平均値を上げるため、最大音量を一定に保ったまま音声の音量を上げるための処理(圧縮)を実行する。
ここで、音量調整部33は、音声の音量レベルの平均値を、例えばBGMの音量レベル平均値と同じとなるように調整することにより音声の音量を上げる。
図8(a)には、音声に対して音量レベルの平均値を上げる調整をすることにより生成される音声信号の波形の一例を示している。図8(a)に示すように、平均値が「−19.51dB」となっている。
こうして、音声信号入力部20とBGM信号入力部21によって実際に入力される音声信号とBGM信号の音量レベルをもとにして、予め設定された設定レベル(ここでは許容出力の50%)に調整すると共に、この設定レベルに調節された音声とBGMの音量レベルの平均値を調整することにより、音声とBGMの音量バランスを、音声とBGMを同時に出力した場合に音声が聞き取りやすくなるように調整することができる。
こうして、音圧処理部23によって音声とBGMに対して音量レベルが調整されると、周波数処理部25によってさらに音声が聞き取りやすくなるように周波数処理を実行する。
音声分析部40は、音圧処理部23(音量調整部33)により音量レベルが調整された音声について周波数分析を実行する(ステップA7)。また、BGM分析部42は、音圧処理部23(音量調整部33)により音量レベルが調整されたBGMについて周波数分析を実行する(ステップA9)。
図9(a)には音声に対する周波数分析結果を示し、図9(b)にはBGMに対する周波数分析結果を示している。
基本周波数帯域検出部41は、音声分析部40による周波数分析の結果をもとに、基本周波数帯域を検出する(ステップA8)。図9(a)に示す周波数分析結果の場合には、600Hz近辺の周波数帯域が最も強いエネルギーを持ち、基本周波数帯域として検出される。なお、基本周波数帯域の検出の方法は、どのような方法を用いても良い。
帯域音量調整部43は、BGM分析部42により分析された音量レベルが調整されたBGMに対して、基本周波数帯域検出部41により検出された音声の基本周波数帯域に対応する帯域の音量レベルを所定値分下げる調整をする(ステップA10)。
図10には、帯域音量調整部43による音量調整を説明するためのBGMの信号波形の一例を示している。図10(a)は、BGM分析部42による周波数分析結果を示している(図9(b)と同じ)。基本周波数帯域検出部41において基本周波数帯域が600Hz近辺として検出されているため、図10(b)に示すように、その帯域に相当するBGMの周波数帯域を所定値、ここでは例えば9dB下げている。なお、BGMの周波数帯域を下げる所定値は9dBに限るものではなく、その他の値とすることも可能である。この値は、動作モードに応じて固定としても良いし、音声から検出される基本周波数帯域の音量レベル(エネルギー)やピーク値、あるいはBGMの基本周波数帯域に相当する帯域の音量レベルなどに基づいて動的に変更するようにしても良い。
帯域音量調整部43は、基本周波数帯域に相当する帯域の音量を下げたBGMに対して音声変換を実行する(ステップA11)。
信号出力部44は、帯域音量調整部43により音声変換されたBGMのBGM信号と、音圧処理部23における音圧処理により音量レベルが調整された音声の音声信号を出力する(ステップA12)。
こうして、音圧処理部23における音量レベルの調整だけでなく、実際に入力された音声から検出される基本周波数帯域に相当する帯域のBGMの音量レベルを下げることにより、BGMと音声を同時に出力した場合においても、音声をより聞きやすくすることが可能となる。
次に、音声処理モードの設定について説明する。
前述した説明では、デフォルトとして設定された標準モードの場合について説明しているが、歌唱者による入力部27のモード選択ボタン27aに対する操作に応じて、その他のモード(音声優先モード、演奏優先モード)を設定することができる。
図11には、各モードを定義するモードデータの一例を示している。
標準モードでは、音声の最大音量50%、BGMの最大音量50%、音声の音量レベルの平均値=BGMの音量レベルの平均値となるように、音圧処理により音声とBGMのそれぞれに対して音量レベルの調整をすることで、BGMだけでなく音声についてもよく聞き取れるようにしている。
これに対して、音声優先モードでは、図11に示すように、例えば音声の最大音量70%、BGMの最大音量30%、音声の音量レベルの平均値=BGMの音量レベルの平均値+6dBとなるように、音圧処理により音声とBGMのそれぞれに対して音量レベルの調整をすることで、BGMよりも音声の方が聞き取り易くすることができる。
図12には、音声優先モードに従い、音圧処理部23における音声信号とBGM信号に対する調整をすることにより生成される信号の波形の一例を示している。音声優先モードでは、図12(a)に示すように、入力される音声信号に対して、最大値(最大振幅値)が70%となる調整をすることで「−3.02dB」となり、音量レベルの平均値をBGM+6dBとする調整をすることで「−17.26dB」となっている。また、入力されるBGM信号に対して、最大値(最大振幅値)が30%となる調整をすることで「−9.92dB」となっている。
また、演奏優先モードでは、図11に示すように、例えば音声の最大音量30%、BGMの最大音量70%、音声の音量レベルの平均値=BGMの音量レベルの平均値−6dBとなるように、音圧処理により音声とBGMのそれぞれに対して音量レベルの調整をすることで、BGMの方が音声よりも聞き取り易くすることができる。
図13には、演奏優先モードに従い、音圧処理部23における音声信号とBGM信号に対する調整をすることにより生成される信号の波形の一例を示している。音声優先モードでは、図13(a)に示すように、入力される音声信号に対して、最大値(最大振幅値)が30%となる調整をすることで「−9.02dB」となり、音量レベルの平均値をBGM−6dBとする調整をすることで「−23.67dB」となっている。また、入力されるBGM信号に対して、最大値(最大振幅値)が70%となる調整をすることで、「−3.92dB」となっている。
なお、図11に示すモードデータの数値は一例であって、音声優先モードでは音声を優先し、演奏優先モードではBGMを優先して出力(聞き取りやすく)することができれば、他の値を設定するようにしても良い。
モード設定部28は、入力部27(モード選択ボタン27a)からの指示に応じて、何れかの音声処理モードを設定する。これにより、音圧処理部23の音量調整部33は、選択されたモードに応じて、図11に示すモードデータが示すように音声とBGMに対する調整を実行する。これにより、音声処理モードに応じた音量バランスの音声とBGMを出力することができる。なお、演奏優先モードが設定された場合には、周波数処理部25における周波数処理が音声を聞き取りやすくするための処理であるので実行しないものとする。
こうして、複数の音声処理モードから任意のモードを予め設定しておくことで、実際に入力される音声信号とBGM信号をもとにした、音声処理モードに従う音量レベルの調整が施された音声とBGMを出力させることが可能となる。
次に、イントロ/間奏処理について説明する。
前述した説明では、音声とBGMとが同時に出力される場合を対象とした音声処理について説明しているが、カラオケ中にはイントロや間奏などに代表されるように、基本的にBGMのみが演奏(出力)されている部分がある。音声処理装置10は、こうしたイントロあるいは間奏などの部分については、次のようなイントロ/間奏処理を実行するようにしても良い。
音量レベル検知部30の音声入力判定部31は、音量レベル検知部30によって検出される音量の音量レベルを継続的に監視し、音声の入力が一定時間、一定値以下になった場合には、イントロあるいは間奏の部分であると判定する。
音量レベル検知部30は、イントロあるいは間奏の部分であると判定すると、音量調整部33に対して演奏優先モードに応じた処理を実行するように指示する。すなわち、音量調整部33によって、入力されたBGM信号に対して、最大音量を70%にするように音圧処理を実行させる。なお、音声については、監視のみとして音圧処理を実行しないものとする。
また、音声入力判定部31は、音量レベル検知部30により検出された音量レベルが一定値を越えた場合(さらに一定時間続く場合を条件としても良い)には、音量調整部33に対して、モード設定部28により設定された音声処理モードに応じた処理を実行するように動作を戻す。
図14には、イントロ/間奏処理実行時の音圧処理部23における音声信号とBGM信号に対する調整をすることにより生成される信号の波形の一例を示している。図14(b)に示すように、音声信号が入力されていない間(例えばイントロ部分)では、演奏優先モードに応じた音圧処理を実行している。すなわち、音声の最大振幅値を「−∞dB」とするのに対して、BGM信号の最大値(最大振幅値)を「−3.00dB(70%)」としている。
こうして、イントロ/間奏処理を実行することにより、音声入力がない状態ではBGMが聞き取りやすくなるように出力し、音声入力(歌唱)が開始されると、音声が聞きやすくなるように、自動的に音声とBGMの音量レベルの調整を実行して、音声とBGMとを同時に出力させることができる。
このようにして、本実施形態における音声処理装置10では、カラオケシステム11から入力されるBGM信号と、マイク12から入力された音声信号とに対して音声処理を実行するので、カラオケシステム11が使用する楽曲データの形式に関係なく音量レベルの調整を実行することができる。従って、音声処理装置10が音声信号の入力元とする装置についてもカラオケシステム11に限るものではなく、音声(演奏)信号の出力が可能な装置、例えばCDプレーヤ、デジタルオーディオプレーヤなど、各種の装置を対象とすることも可能となる。
また、周波数処理では、音声の基本周波数帯域に対して、BGM信号の特性を変更するので、歌唱者の声に対する処理を最低限に抑えて違和感がでないようにしている。
本実施形態の音声処理装置10を用いることで、BGM(演奏)の音量が大きすぎて自分の歌唱音声が聞こえない、あるいは歌唱音声が大きすぎてBGMが聞き取りにくいといった状況を軽減できる。また、音声とBGMとの音量バランスが調整されているので、音声あるいはBGMを聞き取りやすくするため全体の音量を上げる必要もないため、周囲に迷惑となるような音量レベルでの使用を回避できる。さらに、音量に関する調整を手動操作によって行う必要もないので手間を軽減することができる。
また、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
また、実施形態に記載した手法は、コンピュータに実行させることができるプログラム(ソフトウエア手段)として、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD、MO等)、半導体メモリ(ROM、RAM、フラッシュメモリ等)等の記録媒体に格納し、また通信媒体により伝送して頒布することもできる。なお、媒体側に格納されるプログラムには、計算機に実行させるソフトウエア手段(実行プログラムのみならずテーブルやデータ構造も含む)をコンピュータ内に構成させる設定プログラムをも含む。本実施形態における音声処理装置10を実現するコンピュータは、記録媒体に記録されたプログラムを読み込み、また場合により設定プログラムによりソフトウエア手段を構築し、このソフトウエア手段によって動作が制御されることにより上述した処理を実行する。なお、本明細書でいう記録媒体は、頒布用に限らず、コンピュータ内部あるいはネットワークを介して接続される機器に設けられた磁気ディスクや半導体メモリ等の記憶媒体を含むものである。
本実施形態における音声処理装置10を用いたシステムの構成を示すブロック図。 本実施形態における音声処理装置10を用いたシステムの構成を示すブロック図。 本実施形態における音声処理装置10の構成を示すブロック図。 本実施形態の音声処理装置10における音声処理について説明するためのフローチャート。 本実施形態における音圧処理部23の処理を説明するための信号波形の一例を示す図。 本実施形態における音圧処理部23の処理を説明するための信号波形の一例を示す図。 本実施形態における音圧処理部23の処理を説明するための信号波形の一例を示す図。 本実施形態における音圧処理部23の処理を説明するための信号波形の一例を示す図。 本実施形態における周波数処理部25の処理を説明するための信号波形の一例を示す図。 本実施形態における周波数処理部25の処理を説明するための信号波形の一例を示す図。 本実施形態における音声処理モードを定義するモードデータの一例を示す図。 音声優先モードにおける処理を説明するための信号波形の一例を示す図。 演奏優先モードにおける処理を説明するための信号波形の一例を示す図。 本実施形態におけるイントロ/間奏処理を説明するための信号波形の一例を示す図。
符号の説明
10…音声処理装置、11…カラオケシステム、12…マイク、13…ディスプレイ、14…アンプ、15…スピーカ、20…音声信号入力部、21…BGM信号入力部、23…音圧処理部、25…周波数処理部、27…入力部、27a…モード選択ボタン、28…モード設定部、30…音量レベル検知部、31…音声入力判定部、33…音量調整部、40…音声分析部、41…基本周波数帯域検出部、42…BGM分析部、43…帯域音量調整部、44…信号出力部。

Claims (5)

  1. 入力された音声信号と演奏音信号をもとにして音声と演奏音の音量レベルをそれぞれ検知する音量レベル検知手段と、
    前記音量レベル検知手段により検知された前記音声と前記演奏音のそれぞれの最大音量レベルを、前記音声と前記演奏音のそれぞれに対して予め設定された音量の許容出力に対する比率により示す所定レベルに調整して、この調整後の前記音声と前記演奏音の音量レベルの合計が前記許容出力と同じとなるようにすると共に、前記所定レベルに調整された前記音声の音量レベルの平均値が前記所定レベルに調整された前記演奏音の音量レベルの平均値と同じとなるように、前記所定レベルに調整された前記音声の最大音量を一定に保ったまま音量を変更する処理を実行して前記音声と前記演奏音のバランスを調整する音量調整手段と、
    前記音量調整手段により音量レベルが調整された音声について周波数分析を実行して周波数特性を求める音声分析手段と、
    前記音声分析手段により求められた周波数特性をもとに、前記音量調整手段によって前記所定レベルに調整された前記音声から歌唱者の声の高さを表す基本周波数帯域を検出する基本周波数帯域検出手段と、
    前記音量調整手段により音量レベルが調整された前記演奏音に対して、前記基本周波数帯域検出手段により検出された基本周波数帯域に対応する帯域の音量レベルを所定値分下げる調整をする帯域音量調整手段と、
    前記帯域音量調整手段により調整された演奏音の演奏音信号と、前記音量調整手段により調整された音声の音声信号を出力する信号出力手段と
    を具備したことを特徴とする音声処理装置。
  2. 前記音量レベル検知手段は、前記音声信号に対して検出される音量レベルが一定時間、一定値以下となる所定の状態となったことを判定する音声入力判定手段を有し、
    前記音量調整手段は、前記音声入力判定手段により前記音声信号に対して検出される音量レベルが前記所定の状態となったと判定された場合に、前記音声に対する調整をしないことを特徴とする請求項1記載の音声処理装置。
  3. 前記音量レベル検知手段は、前記音声信号に対して検出される音量レベルが一定時間、一定値以下となる所定の状態となったことを判定する音声入力判定手段を有し、
    前記音量調整手段は、前記音声入力判定手段により前記音声信号に対して検出される音量レベルが前記所定の状態となったと判定された場合には、前記所定の状態となったと判定されていない場合よりも前記演奏音に対する音量レベルを上げるように調整することを特徴とする請求項1記載の音声処理装置。
  4. 前記音量調整手段により前記音声と前記演奏音のそれぞれの前記最大音量レベルを調整するための音量の許容出力に対する比率と、前記音量レベルの平均値のバランスを調整するための調整量を示すデータとが、それぞれ設定された複数の音声処理モードのうちの何れかの音声処理モードを設定するモード設定手段をさらに具備し、
    前記音量調整手段は、前記モード設定手段により設定された音声処理モードに応じて、前記音声と前記演奏音の音量レベルの調整を行うことを特徴とする請求項1記載の音声処理装置。
  5. コンピュータを、
    入力された音声信号と演奏音信号をもとにして音声と演奏音の音量レベルをそれぞれ検知する音量レベル検知手段と、
    前記音量レベル検知手段により検知された前記音声と前記演奏音のそれぞれの最大音量レベルを、前記音声と前記演奏音のそれぞれに対して予め設定された音量の許容出力に対する比率により示す所定レベルに調整して、この調整後の前記音声と前記演奏音の音量レベルの合計が前記許容出力と同じとなるようにすると共に、前記所定レベルに調整された前記音声の音量レベルの平均値が前記所定レベルに調整された前記演奏音の音量レベルの平均値と同じとなるように、前記所定レベルに調整された前記音声の最大音量を一定に保ったまま音量を変更する処理を実行して前記音声と前記演奏音のバランスを調整する音量調整手段と、
    前記音量調整手段により音量レベルが調整された音声について周波数分析を実行して周波数特性を求める音声分析手段と、
    前記音声分析手段により求められた周波数特性をもとに、前記音量調整手段によって前記所定レベルに調整された前記音声から歌唱者の声の高さを表す基本周波数帯域を検出する基本周波数帯域検出手段と、
    前記音量調整手段により音量レベルが調整された前記演奏音に対して、前記基本周波数帯域検出手段により検出された基本周波数帯域に対応する帯域の音量レベルを所定値分下げる調整をする帯域音量調整手段と、
    前記帯域音量調整手段により調整された演奏音の演奏音信号と、前記音量調整手段により調整された音声の音声信号を出力する信号出力手段として機能させるための音声処理プログラム。
JP2006040691A 2006-02-17 2006-02-17 音声処理装置、音声処理プログラム Expired - Fee Related JP4237768B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006040691A JP4237768B2 (ja) 2006-02-17 2006-02-17 音声処理装置、音声処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006040691A JP4237768B2 (ja) 2006-02-17 2006-02-17 音声処理装置、音声処理プログラム

Publications (2)

Publication Number Publication Date
JP2007219241A JP2007219241A (ja) 2007-08-30
JP4237768B2 true JP4237768B2 (ja) 2009-03-11

Family

ID=38496611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006040691A Expired - Fee Related JP4237768B2 (ja) 2006-02-17 2006-02-17 音声処理装置、音声処理プログラム

Country Status (1)

Country Link
JP (1) JP4237768B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5371594B2 (ja) * 2009-07-10 2013-12-18 株式会社第一興商 声が大きすぎる人にさりげなく注意を喚起するカラオケ装置
JP5418518B2 (ja) * 2011-02-08 2014-02-19 ブラザー工業株式会社 楽曲データ修正装置
JP5902913B2 (ja) * 2011-05-20 2016-04-13 日本放送協会 ミキシングバランス自動調整装置およびプログラム
CN102355616B (zh) * 2011-06-30 2014-06-04 深圳华昌视数字移动电视有限公司 在公共环境中自动调节音量的方法及设备
JP2014071138A (ja) * 2012-09-27 2014-04-21 Xing Inc カラオケ装置
JP5960635B2 (ja) * 2013-03-29 2016-08-02 株式会社エクシング 楽器音出力装置
JP6482880B2 (ja) * 2015-01-19 2019-03-13 国立大学法人電気通信大学 ミキシング装置、信号ミキシング方法、及びミキシングプログラム

Also Published As

Publication number Publication date
JP2007219241A (ja) 2007-08-30

Similar Documents

Publication Publication Date Title
JP4237768B2 (ja) 音声処理装置、音声処理プログラム
US5753845A (en) Karaoke apparatus creating vocal effect matching music piece
JP2014071138A (ja) カラオケ装置
US9148104B2 (en) Reproduction apparatus, reproduction method, provision apparatus, and reproduction system
US7851688B2 (en) Portable sound processing device
JP4959861B1 (ja) 信号処理方法、信号処理装置、再生装置およびプログラム
WO2012081315A1 (ja) 音声再生装置、再生音調整方法、音響特性調整装置、音響特性調整方法およびコンピュータプログラム
JP2003257162A (ja) 音制御装置、音制御方法、プログラムおよび記録媒体
JP2008058470A (ja) 音声信号処理装置、音声信号再生システム
JP4305084B2 (ja) 音楽再生装置
JP2007133151A (ja) カラオケ機能が搭載された情報装置
WO2017135350A1 (ja) 記録媒体、音響処理装置および音響処理方法
JP2008092093A (ja) 楽音再生装置及びプログラム
JP2010060947A (ja) オーディオアンプ
JP5598722B2 (ja) 音声再生装置、音声再生装置における再生音調整方法
JP4900062B2 (ja) 音声信号処理装置、音声再生装置および音声信号処理方法
JP6089651B2 (ja) 音処理装置、音処理装置の制御方法、プログラム
US20230260490A1 (en) Selective tone shifting device
EP3757985B1 (en) Electronic musical instrument, method and program
JP4168391B2 (ja) カラオケ装置、音声処理方法及びプログラム
JP5625429B2 (ja) カラオケ装置
JP6819236B2 (ja) 音処理装置、音処理方法、及びプログラム
JP6834398B2 (ja) 音処理装置、音処理方法、及びプログラム
JP2004235979A (ja) 音入出力装置および音入出力方法
JP5899865B2 (ja) 音響信号加工装置及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081021

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081218

R150 Certificate of patent or registration of utility model

Ref document number: 4237768

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees