JP2012063726A - 音質補正装置及び音声補正方法 - Google Patents
音質補正装置及び音声補正方法 Download PDFInfo
- Publication number
- JP2012063726A JP2012063726A JP2010210078A JP2010210078A JP2012063726A JP 2012063726 A JP2012063726 A JP 2012063726A JP 2010210078 A JP2010210078 A JP 2010210078A JP 2010210078 A JP2010210078 A JP 2010210078A JP 2012063726 A JP2012063726 A JP 2012063726A
- Authority
- JP
- Japan
- Prior art keywords
- value
- score
- audio signal
- section
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/028—Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
Abstract
【解決手段】実施形態に係る音質補正装置は、オーディオ信号が入力される入力手段と、入力された前記オーディオ信号の特徴量を、一定の時間長の第1区間毎に算出する特徴量算出手段と、算出された前記特徴量に基づいて、前記第1区間毎にスコア値を算出するスコア算出手段と、入力された前記オーディオ信号の変調スペクトルの、所定の変調周波数におけるパワー値を算出する変調スペクトルパワー算出手段と、前記第1区間を複数含む第2区間において算出された前記パワー値が一定値以上である場合、当該第2区間に含まれる複数の前記第1区間毎の前記スコア値を補正するスコア補正手段と、補正された前記スコア値に基づいて前記オーディオ信号を補正する信号補正手段とを備える。
【選択図】 図2
Description
そこで本発明の実施形態は、オーディオ信号の内容に応じた好適な音質補正を行うことのできる音質補正装置及び音質補正方法の提供を目的とする。
図1は第1実施形態に係る音質補正装置の利用形態例を示す図である。第1実施形態に係る音質補正装置は、例えば受信装置100として実現される。そして受信装置100は、デジタルインタフェース300を介して表示・スピーカ装置200と接続されている。
受信装置100は、入力端子14、チューナ15、PSK復調部16、TS復号部17、入力端子19、チューナ20、OFDM復調部21、TS復号部22、アナログチューナ23、アナログ復調部24、信号処理部25、入力端子26、オーディオ処理部27、グラフィック処理部29、OSD信号生成部30、表示処理部31、映像・オーディオ出力部32、操作部35、受光部36、通信I/F37、コネクタ38、HDD39、制御部40、CPU41、ROM42、RAM43、不揮発性メモリ44等を備える。
オーディオ処理部27は、例えば音声特徴量検出部51、音声度算出部52、音楽特徴量検出部53、音楽度算出部54、区間判別部55、調整部56、音質補正部57等を備える。
ここでX1乃至Xnは、音声特徴量検出部51が検出した各種の特徴量パラメータであり、A0乃至Anは、特徴量パラメータの重み付け係数である。なお重み付け係数A0乃至Anとしては、人間が発声した音声の特徴を強く示す特徴量パラメータに対応する係数ほど大きい値となっている。また、重み付け係数A0乃至Anは、例えば、オーディオの内容が既知であるオーディオ信号を参照データとして入力し、その参照データについて特徴パラメータを学習することで算出される。
当該線形識別関数では、例えば以下の式により、音楽スコアS2が算出される。
S2=B0+B1・Y1+B2・Y2+・・・・・・Bn・Yn
ここでY1乃至Ynは、音声特徴量検出部53が検出した各種の特徴量パラメータであり、B0乃至Bnは、特徴量パラメータの重み付け係数である。なお重み付け係数B0乃至Bnとしては、音楽の音の特徴を強く示す特徴量パラメータに対応する係数ほど大きい値となっている。また、重み付け係数B0乃至Bnは、例えば、オーディオの内容が既知であるオーディオ信号を参照データとして入力し、その参照データについて特徴パラメータを学習することで算出される。
次に図4を参照して、オーディオ処理部27による処理例を説明する。
図4に示すオーディオ信号Sgは、例えば数百msecの時間長毎の区間であるフレームF1乃至Fnに分割される。そして、夫々のフレームは、更に数十msecの時間長毎の区間であるサブフレームG1乃至Gnに分割される。ここで音声特徴量検出部51及び音楽特徴量検出部54は、サブフレームG1乃至Gnの夫々から各種パラメータを検出し、当該検出したパラメータを用いて、フレームの特徴量を算出する。
まず音声特徴量検出部51及び音楽特徴量検出部54に、フレーム単位のオーディオ信号が入力される(S501)。そして音声特徴量検出部51及び音楽特徴量検出部54は、入力されたフレームの特徴量を算出する(S502)。また、ここで音声特徴量検出部51は、フレーム単位のオーディオ信号の変調スペクトルのパワー値を算出する(S503)。
以下、図6を参照して、第2実施形態を説明する。なお、第2実施形態に係る音質補正装置は、第1実施形態と同様に例えば受信装置100として実現される。そして第2実施形態に係る受信装置100のシステム構成及び構成毎の機能については第1実施形態と同様であるため、ここでは第1実施形態と異なる機能及び処理フロー例を中心に説明する。
音声特徴量検出部51は、第1実施形態と同様に特徴量を検出し、当該検出した特徴量を音声度算出部52に出力する。また音声特徴量検出部51は、検出した特徴量のうち、オーディオ信号中の発話区間の識別に有効な特徴量を、音声スコア補正用の特徴量として区間判別部55に出力する。なおここで音声特徴量検出部51は、例えば変調スペクトルのパワー値を区間判別部55に出力するが、ここで音声特徴量検出部は、発話区間の識別に有効な特徴量であればどのような特徴量を出力しても構わない。
音楽特徴量検出部53は、特徴量を検出すると共に、検出した特徴量のうち、オーディオ信号中の音楽の区間を効果的に判別することができる特徴量を、音楽スコア補正用の特徴量として区間判別部55に出力する(音楽特徴量検出部53から区間判別部55へのデータフローは不図示)。ここで音楽特徴量検出部53は、例えば音階に関する特徴量のように、オーディオ信号中に音楽が含まれていることを強く示す特徴量を区間判別部55に出力するが、出力する特徴量はこれに限るものではない。
まずオーディオ処理部27にオーディオ信号が入力されると、音声特徴量検出部51及び音楽特徴量検出部54は、入力されたオーディオ信号のフレーム単位で特徴量を算出する(S601)。ここで音声特徴量検出部51は、変調スペクトルのパワー値等の、音声スコアの補正に用いるための特徴量C1を検出する(S602)。またこのとき音楽特徴量検出部53は、例えば音階に関する特徴量等の、音楽スコアの補正に用いるための特徴量C2を検出する(S603)。
Claims (10)
- オーディオ信号が入力される入力手段と、
入力された前記オーディオ信号の特徴量を、一定の時間長の第1区間毎に算出する特徴量算出手段と、
算出された前記特徴量に基づいて、前記第1区間毎にスコア値を算出するスコア算出手段と、
入力された前記オーディオ信号の変調スペクトルの、所定の変調周波数におけるパワー値を算出する変調スペクトルパワー算出手段と、
前記第1区間を複数含む第2区間において算出された前記パワー値が一定値以上である場合、当該第2区間に含まれる複数の前記第1区間毎の前記スコア値を補正するスコア補正手段と、
補正された前記スコア値に基づいて前記オーディオ信号を補正する信号補正手段と
を備える音質補正装置。 - 前記算出手段は、前記第1区間毎に前記パワー値を算出し、
前記スコア補正手段は、前記第2区間に、算出された前記パワー値が一定値以上である前記第1区間が一定数以上含まれる場合に前記スコア値を補正する、請求項1記載の音質補正装置。 - 前記スコア補正手段は、前記第2区間に、算出された前記パワー値が一定値以上である前記第1区間が一定数以上含まれる場合、当該第2区間に後続する区間の前記パワー値が一定値以上でない場合であっても、当該後続する区間の前記スコア値を補正する、請求項2記載の音質補正装置。
- 前記変調スペクトルパワー算出手段は、前記変調スペクトルの、2乃至10Hzの変調周波数帯域に含まれる変調周波数成分のパワー値を算出する、請求項1記載の音質補正装置。
- 前記スコア算出手段は、算出された前記特徴量に基づいて、前記オーディオ信号に含まれる声の音の成分の度合いを示す音声スコア値を前記第1区間毎に算出し、
前記スコア補正手段は、前記第1区間を複数含む第2区間において算出された前記パワー値が一定値以上である場合、当該第2区間に含まれる複数の前記第1区間毎の前記音声スコア値を補正し、
前記信号補正手段は、補正された前記音声スコア値に基づいて前記オーディオ信号に第1の補正を実行する、請求項1記載の音質補正装置。 - 前記スコア算出手段は、算出された前記特徴量に基づいて、前記オーディオ信号に含まれる音楽の音の成分の度合いを示す音楽スコア値を算出し、
前記スコア補正手段は、前記第1区間を複数含む第2区間において算出された特徴量のうち、何れかの特徴量が示す値が一定値以上である場合、当該第2区間に含まれる複数の前記第1区間毎の前記音楽スコア値を補正し、
前記信号補正手段は、補正された前記音楽スコア値に基づいて、前記オーディオ信号に、前記第1の補正とは異なる第2の補正を実行する、請求項5記載の音質補正装置。 - 前記スコア補正手段は、前記第2区間に対して算出された前記パワー値が第1の値以上であり、前記第2区間に対して算出された前記何れかの特徴量が示す値が第2の値以上である場合、前記音声スコア値を、当該音声スコア値が取り得る値の最大値よりも小さな値と、前記取り得る値の最小値よりも大きな値との間の値にクリップする前記第1の補正を実行する、請求項6記載の音質補正装置。
- 前記スコア補正手段は、前記第2区間に対して算出された前記パワー値が第1の値以上であり、前記第2区間に対して算出された前記何れかの特徴量が示す値が第2の値以上である場合、前記音楽スコア値を、当該音楽スコア値が取り得る値の最大値よりも小さな値と、前記取り得る値の最小値よりも大きな値との間の値にクリップする第2の補正を実行する、請求項6記載の音質補正装置。
- オーディオ信号が重畳された放送波を受信するチューナを更に備え、
前記入力手段には、前記チューナが受信した放送波に重畳された前記オーディオ信号が入力される、請求項1記載の音質補正装置。 - オーディオ信号が入力される装置における音質補正方法であって、
オーディオ信号が入力されることと、
入力された前記オーディオ信号の特徴量を、一定の時間長の第1区間毎に算出することと、
算出された前記特徴量に基づいて、前記第1区間毎にスコア値を算出することと、
入力された前記オーディオ信号の変調スペクトルの、所定の変調周波数におけるパワー値を算出することと、
前記第1区間を複数含む第2区間において算出された前記パワー値が一定値以上である場合、当該第2区間に含まれる複数の前記第1区間毎の前記スコア値を補正し、当該補正したスコア値に基づいて前記オーディオ信号を補正することと
を備える音質補正方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010210078A JP4937393B2 (ja) | 2010-09-17 | 2010-09-17 | 音質補正装置及び音声補正方法 |
US13/188,186 US8837744B2 (en) | 2010-09-17 | 2011-07-21 | Sound quality correcting apparatus and sound quality correcting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010210078A JP4937393B2 (ja) | 2010-09-17 | 2010-09-17 | 音質補正装置及び音声補正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012063726A true JP2012063726A (ja) | 2012-03-29 |
JP4937393B2 JP4937393B2 (ja) | 2012-05-23 |
Family
ID=45817794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010210078A Expired - Fee Related JP4937393B2 (ja) | 2010-09-17 | 2010-09-17 | 音質補正装置及び音声補正方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8837744B2 (ja) |
JP (1) | JP4937393B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744335A (zh) * | 2014-01-28 | 2014-04-23 | 福建海媚数码科技有限公司 | 一种嵌入式数字音效处理装置 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102956237B (zh) | 2011-08-19 | 2016-12-07 | 杜比实验室特许公司 | 测量内容一致性的方法和设备 |
JP2013171089A (ja) * | 2012-02-17 | 2013-09-02 | Toshiba Corp | 音声補正装置、方法、及びプログラム |
US8995823B2 (en) * | 2012-07-17 | 2015-03-31 | HighlightCam, Inc. | Method and system for content relevance score determination |
CN105118500B (zh) * | 2015-06-05 | 2019-01-04 | 福建凯米网络科技有限公司 | 歌曲演唱的评价方法、系统及终端 |
CN105050021B (zh) * | 2015-08-05 | 2019-02-22 | Oppo广东移动通信有限公司 | 耳机音质检测方法、系统及终端 |
CN106571146B (zh) | 2015-10-13 | 2019-10-15 | 阿里巴巴集团控股有限公司 | 噪音信号确定方法、语音去噪方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007114413A (ja) * | 2005-10-19 | 2007-05-10 | Toshiba Corp | 音声非音声判別装置、音声区間検出装置、音声非音声判別方法、音声区間検出方法、音声非音声判別プログラムおよび音声区間検出プログラム |
JP2009288669A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP2009288707A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
JP2010152015A (ja) * | 2008-12-24 | 2010-07-08 | Toshiba Corp | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP2011065093A (ja) * | 2009-09-18 | 2011-03-31 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
JP4837123B1 (ja) * | 2010-07-28 | 2011-12-14 | 株式会社東芝 | 音質制御装置及び音質制御方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
JP5157474B2 (ja) | 2008-01-25 | 2013-03-06 | ヤマハ株式会社 | 音処理装置およびプログラム |
JP4364288B1 (ja) | 2008-07-03 | 2009-11-11 | 株式会社東芝 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
-
2010
- 2010-09-17 JP JP2010210078A patent/JP4937393B2/ja not_active Expired - Fee Related
-
2011
- 2011-07-21 US US13/188,186 patent/US8837744B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007114413A (ja) * | 2005-10-19 | 2007-05-10 | Toshiba Corp | 音声非音声判別装置、音声区間検出装置、音声非音声判別方法、音声区間検出方法、音声非音声判別プログラムおよび音声区間検出プログラム |
JP2009288669A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP2009288707A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
JP2010152015A (ja) * | 2008-12-24 | 2010-07-08 | Toshiba Corp | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP2011065093A (ja) * | 2009-09-18 | 2011-03-31 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
JP4837123B1 (ja) * | 2010-07-28 | 2011-12-14 | 株式会社東芝 | 音質制御装置及び音質制御方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744335A (zh) * | 2014-01-28 | 2014-04-23 | 福建海媚数码科技有限公司 | 一种嵌入式数字音效处理装置 |
CN103744335B (zh) * | 2014-01-28 | 2016-08-17 | 福建海媚数码科技有限公司 | 一种嵌入式数字音效处理装置 |
Also Published As
Publication number | Publication date |
---|---|
US8837744B2 (en) | 2014-09-16 |
US20120070016A1 (en) | 2012-03-22 |
JP4937393B2 (ja) | 2012-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4937393B2 (ja) | 音質補正装置及び音声補正方法 | |
JP4439579B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
US20110071837A1 (en) | Audio Signal Correction Apparatus and Audio Signal Correction Method | |
JP4621792B2 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
JP4327886B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
EP2194733B1 (en) | Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus. | |
RU2526746C1 (ru) | Микширование аудиопотока с нормализацией диалогового уровня | |
JP4837123B1 (ja) | 音質制御装置及び音質制御方法 | |
US9002021B2 (en) | Audio controlling apparatus, audio correction apparatus, and audio correction method | |
US9412391B2 (en) | Signal processing device, signal processing method, and computer program product | |
JP5737808B2 (ja) | 音響処理装置およびそのプログラム | |
JP2010014960A (ja) | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム | |
US8099276B2 (en) | Sound quality control device and sound quality control method | |
US9042562B2 (en) | Audio controlling apparatus, audio correction apparatus, and audio correction method | |
US20110235812A1 (en) | Sound information determining apparatus and sound information determining method | |
JP5316560B2 (ja) | 音量補正装置、音量補正方法および音量補正プログラム | |
JP4886907B2 (ja) | オーディオ信号補正装置及びオーディオ信号補正方法 | |
JP2011013383A (ja) | オーディオ信号補正装置及びオーディオ信号補正方法 | |
JP2006093918A (ja) | デジタル放送受信装置、デジタル放送受信方法、デジタル放送受信プログラム及びプログラム記録媒体 | |
JP5929301B2 (ja) | 時間差補正方法、音声信号処理装置、再生装置およびプログラム | |
JP2001236084A (ja) | 音響信号処理装置及びそれに用いられる信号分離装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120221 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |