JP6089789B2 - 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム - Google Patents
音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム Download PDFInfo
- Publication number
- JP6089789B2 JP6089789B2 JP2013039607A JP2013039607A JP6089789B2 JP 6089789 B2 JP6089789 B2 JP 6089789B2 JP 2013039607 A JP2013039607 A JP 2013039607A JP 2013039607 A JP2013039607 A JP 2013039607A JP 6089789 B2 JP6089789 B2 JP 6089789B2
- Authority
- JP
- Japan
- Prior art keywords
- unvoiced
- unvoiced sound
- sound
- extended
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
以下、本発明による音声帯域拡張装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。
図1は、第1の実施形態の音声帯域拡張装置の機能的構成を示すブロック図であり、上述した図10との同一、対応部分には同一、対応符号を付して示している。第1の実施形態の音声帯域拡張装置は、その各部をハードウェアによって構成しても良く、また、CPUと、CPUが実行するプログラム(音声帯域拡張プログラム)として構成しても良いが(例えば、図1に示す各ブロックの機能をプログラムのサブルーチンとして構成しても良い)、機能的には、図1で表すことができる。
次に、第1の実施形態の音声帯域拡張装置200の動作を説明する。以下では、従来の音声帯域拡張装置100には存在しない構成要素の動作を中心に説明し、サンプリング変換部106及び加算部107の動作については、その説明を省略する。
(S2)調音位置が歯茎である摩擦音(「さ」、「す」、「せ」、「そ」の/s/)
(S3)調音位置が歯茎と硬口蓋である摩擦音(「し」、「しゃ」などの/sh/)
以上の分類には破擦音が含まれていないが、破擦音は時間的に破裂音から摩擦音へと推移する子音であるので、上の3つが分類できれば自動的に識別できる。
CV=(LV+1)/2 …(2)
CU=1−CV …(3)
拡張信号合成部214から出力された拡張信号XHは、加算部107において、サンプリング変換部106によって狭帯域音声信号Sがアップサンプリングされて得られたベースバンド信号XLと加算され、これにより、擬似広帯域音声信号Xが得られる。
第1の実施形態によれば、有声音区間の有声拡張信号と無声音区間の無声拡張信号とを合成して拡張信号を生成するにつき、無声音のスペクトル包絡を調音方式に基づいて整形して無声拡張信号を得るようにしたので、音声の明瞭度や了解度が改善されて、聴覚的にクリアな伸びのある擬似広帯域音声信号を得ることができる。
次に、本発明による音声帯域拡張装置及びプログラムの第2の実施形態を説明する。
次に、本発明による音声帯域拡張装置及びプログラムの第3の実施形態を説明する。
(F2)無音区間の後、パワーが急激に増大する
ここで、改めて破裂音の時間波形を観察すると、さらに特徴があることが分かる。図7は、日本語の「か」(/ka/)の時間波形をプロットしたものである。第1の実施形態において捕らえていた時間的特徴は、図7の無音部、破裂部、母音部であった。しかし、厳密には、図7に示す通り、破裂部の後には気音部と呼ばれる/h/に近い波形が存在する。パワーを時系列で観察すると、無音部では非常に弱く、破裂部で瞬時に増大し、気音部でいったん減衰した後、母音部で緩やかに増大する、といった特徴を捕らえることができる。実際に、図7の音声のパワーを観測すると、図8に示すようになり、気音部でパワーが減衰していることが分かる。
次に、本発明による音声帯域拡張装置及びプログラムの第4の実施形態を説明する。
次に、本発明による音声帯域拡張装置及びプログラムの第5の実施形態を、図面を参照しながら説明する。
破裂音の場合には、上述したように平滑化されない。但し、無声音拡張包絡整形部213の特性が瞬時に変わることでインパルス的又はステップ的な雑音が発生する場合には、破裂音の拡張スペクトル包終情報XEUを摩擦音と同じように平滑化するのが良く、このときの平滑化の度合いは1ms〜5msで収束する程度とすれば良い。
上記各実施形態においては、有声拡張信号XHVと無声拡張信号XHUとを加算合成し、得られた拡張信号XHにベースバンド信号XLを加算合成して擬似広帯域音声信号Xを得る場合を示したが、有声拡張信号XHVと、無声拡張信号XHUと、ベースバンド信号XLの合成順序は、これに限定されるものではない。例えば、有声拡張信号XHVとベースバンド信号XLを加算合成した後に、無声拡張信号XHUを加算合成して、擬似広帯域音声信号Xを得るようにしても良い。
Claims (14)
- 周波数帯域が制限された狭帯域音声信号を、制限帯域外の拡張帯域の信号成分を含むように拡張する音声帯域拡張装置であって、
無声音に関する拡張信号を形成する元となる無声音音源信号を生成する無声音音源生成手段と、
上記狭帯域音声信号を周波数解析してスペクトルパラメータを得る周波数解析手段と、
上記周波数解析部が得た上記スペクトルパラメータの時間的特徴及び周波数的特徴の少なくとも一方に基づいて、無声音調音方式の推定情報を得る無声音調音方式推定手段と、
推定された上記無声音調音方式に基づいて、無声音に関する拡張信号に適用するスペクトル包絡情報である無声音拡張スペクトル包絡情報を得る無声音拡張包絡推定手段と、
得られた上記無声音拡張スペクトル包絡情報に基づいて、上記無声音音源信号のスペクトル包絡を整形して無声音に関する拡張信号を得る無声音拡張包絡整形手段と
を備えることを特徴とする音声帯域拡張装置。 - 上記無声音拡張包絡推定手段が、推定された上記無声音調音方式に基づいて、第1義的に定まる当初無声音拡張スペクトル包絡情報を得る無声音拡張包絡推定本体と、当初無声音拡張スペクトル包絡情報を平滑化する平滑化部とを有し、推定された上記無声音調音方式に応じて、無声音拡張スペクトル包絡情報として平滑化された無声音拡張スペクトル包絡情報を出力することを特徴とする請求項1に記載の音声帯域拡張装置。
- 上記平滑化部は、推定された上記無声音調音方式に応じて異なる平滑化を実行することを特徴とする請求項2に記載の音声帯域拡張装置。
- 上記周波数解析手段は、少なくとも2つ以上の帯域のパワー値を含み、そのうちの少なくとも1つ以上のパワー値が、上記狭帯域音声信号を2つ以上の帯域に分割した帯域信号のいずれかのパワー値である上記スペクトルパラメータを出力することを特徴とする請求項1〜3のいずれかに記載の音声帯域拡張装置。
- 上記周波数解析手段は、出力する上記スペクトルパラメータに、ピッチ成分のパワーを有していないパワー値を少なくとも1つ以上含めることを特徴とする請求項1〜4のいずれかに記載の音声帯域拡張装置。
- 上記無声音調音方式推定手段は、無声音の調音方式が破裂音であるか、若しくは摩擦音であるかを識別することを特徴とする請求項1〜5のいずれかに記載の音声帯域拡張装置。
- 上記無声音調音方式推定手段は、摩擦音を、調音位置が歯茎である摩擦音と、調音位置が歯茎と硬口蓋である摩擦音と区別して識別することを特徴とする請求項6に記載の音声帯域拡張装置。
- 上記無声音調音方式推定手段は、上記スペクトルパラメータの少なくとも1つ以上のパワー値の変化が、所定範囲内の時間の無音レベルを得た後、破裂音のときに生じるような傾きで増大するという時間的特徴があったか否かで、上記破裂音であるか否かを推定することを特徴とする請求項6又は7に記載の音声帯域拡張装置。
- 上記無声音調音方式推定手段は、上記傾きの増大の直後にパワー値が減衰するという上記時間的特徴があったか否かで、上記破裂音であるか否かを推定することを特徴とする請求項8に記載の音声帯域拡張装置。
- 上記無声音調音方式推定手段は、入力された上記スペクトルパラメータから、所定の低域におけるスペクトルの傾きに関する特徴を得、得られた傾きが平坦か否かという上記周波数的特徴があったか否かで、調音位置が歯茎である摩擦音か否かを推定することを特徴とする請求項7に記載の音声帯域拡張装置。
- 上記無声音調音方式推定手段は、入力された上記スペクトルパラメータから、所定の低域におけるスペクトルの傾きに関する特徴を得、得られた傾きが高周波に向けて増大しているか否かという上記周波数的特徴があったか否かで、調音位置が歯茎と硬口蓋である摩擦音か否かを推定することを特徴とする請求項7又は10に記載の音声帯域拡張装置。
- 周波数帯域が制限された狭帯域音声信号を、制限帯域外の拡張帯域の信号成分を含むように拡張する音声帯域拡張装置に搭載されるコンピュータを、
無声音に関する拡張信号を形成する元となる無声音音源信号を生成する無声音音源生成手段と、
上記狭帯域音声信号を周波数解析してスペクトルパラメータを得る周波数解析手段と、
上記周波数解析部が得た上記スペクトルパラメータの時間的特徴及び周波数的特徴の少なくとも一方に基づいて、無声音調音方式の推定情報を得る無声音調音方式推定手段と、
推定された上記無声音調音方式に基づいて、無声音に関する拡張信号に適用するスペクトル包絡情報である無声音拡張スペクトル包絡情報を得る無声音拡張包絡推定手段と、
得られた上記無声音拡張スペクトル包絡情報に基づいて、上記無声音音源信号のスペクトル包絡を整形して無声音に関する拡張信号を得る無声音拡張包絡整形手段と
して機能させることを特徴とする音声帯域拡張プログラム。 - 周波数帯域が制限された狭帯域音声信号における無声音を、制限帯域外の拡張帯域の成分を含むように拡張する無声音拡張装置であって、
無声音に関する拡張信号を形成する元となる無声音音源信号を生成する無声音音源生成手段と、
上記狭帯域音声信号を周波数解析してスペクトルパラメータを得る周波数解析手段と、
上記周波数解析部が得た上記スペクトルパラメータの時間的特徴及び周波数的特徴の少なくとも一方に基づいて、無声音調音方式の推定情報を得る無声音調音方式推定手段と、
推定された上記無声音調音方式に基づいて、無声音に関する拡張信号に適用するスペクトル包絡情報である無声音拡張スペクトル包絡情報を得る無声音拡張包絡推定手段と、
得られた上記無声音拡張スペクトル包絡情報に基づいて、上記無声音音源信号のスペクトル包絡を整形して無声音に関する拡張信号を得る無声音拡張包絡整形手段と
を備えることを特徴とする無声音拡張装置。 - 周波数帯域が制限された狭帯域音声信号における無声音を、制限帯域外の拡張帯域の成分を含むように拡張する無声音拡張装置に搭載されたコンピュータを、
無声音に関する拡張信号を形成する元となる無声音音源信号を生成する無声音音源生成手段と、
上記狭帯域音声信号を周波数解析してスペクトルパラメータを得る周波数解析手段と、
上記周波数解析部が得た上記スペクトルパラメータの時間的特徴及び周波数的特徴の少なくとも一方に基づいて、無声音調音方式の推定情報を得る無声音調音方式推定手段と、
推定された上記無声音調音方式に基づいて、無声音に関する拡張信号に適用するスペクトル包絡情報である無声音拡張スペクトル包絡情報を得る無声音拡張包絡推定手段と、
得られた上記無声音拡張スペクトル包絡情報に基づいて、上記無声音音源信号のスペクトル包絡を整形して無声音に関する拡張信号を得る無声音拡張包絡整形手段と
して機能させることを特徴とする無声音拡張プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013039607A JP6089789B2 (ja) | 2013-02-28 | 2013-02-28 | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013039607A JP6089789B2 (ja) | 2013-02-28 | 2013-02-28 | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014167558A JP2014167558A (ja) | 2014-09-11 |
JP6089789B2 true JP6089789B2 (ja) | 2017-03-08 |
Family
ID=51617278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013039607A Active JP6089789B2 (ja) | 2013-02-28 | 2013-02-28 | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6089789B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2956548B2 (ja) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JPH10124089A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 |
-
2013
- 2013-02-28 JP JP2013039607A patent/JP6089789B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014167558A (ja) | 2014-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6889182B2 (en) | Speech bandwidth extension | |
KR101214684B1 (ko) | 대역폭 확장 시스템에서 고-대역 에너지를 추정하기 위한 방법 및 장치 | |
EP2144232B1 (en) | Apparatus and methods for enhancement of speech | |
JP4294724B2 (ja) | 音声分離装置、音声合成装置および声質変換装置 | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
JP4624552B2 (ja) | 狭帯域言語信号からの広帯域言語合成 | |
EP1638083B1 (en) | Bandwidth extension of bandlimited audio signals | |
US20020128839A1 (en) | Speech bandwidth extension | |
KR20070090143A (ko) | 음성 신호들의 대역폭의 인공 확장을 위한 방법 및 장치 | |
Kontio et al. | Neural network-based artificial bandwidth expansion of speech | |
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
JP2010055000A (ja) | 信号帯域拡張装置 | |
JP2011033717A (ja) | 雑音抑圧装置 | |
JP2005157363A (ja) | フォルマント帯域を利用したダイアログエンハンシング方法及び装置 | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
JP6089789B2 (ja) | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム | |
JP5949379B2 (ja) | 帯域拡張装置及び方法 | |
JP2011150232A (ja) | Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム | |
JP6065488B2 (ja) | 帯域拡張装置及び方法 | |
CN112201261A (zh) | 基于线性滤波的频带扩展方法、装置及会议终端系统 | |
Anikin | Package ‘soundgen’ | |
Alcaraz Meseguer | Speech analysis for automatic speech recognition | |
JP6930089B2 (ja) | 音響処理方法および音響処理装置 | |
JP6163785B2 (ja) | 音声帯域拡張装置及びプログラム | |
JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6089789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |