JP2011033672A - 音声信号変換装置、音声信号変換方法および音声信号変換プログラム - Google Patents
音声信号変換装置、音声信号変換方法および音声信号変換プログラム Download PDFInfo
- Publication number
- JP2011033672A JP2011033672A JP2009177427A JP2009177427A JP2011033672A JP 2011033672 A JP2011033672 A JP 2011033672A JP 2009177427 A JP2009177427 A JP 2009177427A JP 2009177427 A JP2009177427 A JP 2009177427A JP 2011033672 A JP2011033672 A JP 2011033672A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- autocorrelation value
- section
- signal
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】音声信号変換装置1は、レベル補正部2と、自己相関値算出部3とを有している。レベル補正部2は、自己相関値を算出する対象区間、例えば、隣接する2つの有声区間の音声信号のレベルが互いに等しくなるように音声信号を補正する。自己相関値算出部3は、レベル補正を行った(補正後の)音声信号に対して自己相関値を算出する。自己相関値算出部3によって算出された自己相関値は、さらに後段の信号処理回路に出力される。そして、話速変換処理等が施される。
【選択図】図1
Description
これらの技術は、例えば、加齢等による受聴能力の低下のために、電話の相手の声が聞こえにくい場合、相手の声をゆっくり再生することで聞き取り易くする等の目的に用いられている。
図8は、音声信号の一例を示す図である。
一方、有声区間92は音素長が有声区間91に比べて短く、ピッチ間のレベル変動が大きい。そのため、隣接するピッチ間の相関値が小さく、ピッチの検出精度が比較的低くなる。このように、有声区間92のようなピッチ間のレベル変動が大きい区間では、ピッチの検出精度が比較的低く、音声信号の十分な伸張や圧縮が行えない場合があるという問題がある。
レベル補正部は、自己相関値を算出する対象区間の音声信号のレベルが互いに等しくなるように音声信号を補正する。
まず、実施の形態の音声信号変換装置の概要について説明し、その後、実施の形態をより具体的に説明する。
図1は、実施の形態の音声信号変換装置の概要を示す図である。
実施の形態の音声信号変換装置1は、レベル補正部2と、自己相関値算出部3とを有している。
この音声信号としては、例えば、通話時に有線または無線で外部から送られてくる音声信号や、記録媒体に予め記録された音声信号等が挙げられる。
この補正により、音声信号の隣接するピッチ間のレベル変動が小さくなる。すなわち、レベルが同等の区間が多くなる。
補正後の音声信号は、補正前の音声信号よりレベル変動が小さい。このため、補正後の音声信号に対する自己相関値は、補正前の音声信号に対する自己相関値よりも大きな値となる。
なお、図1では、自己相関値を音声信号変換装置1の外部に出力する場合を示しているが、音声信号変換装置1が、前述した信号処理回路を有していてもよい。
以下、開示の音声信号変換装置を携帯装置に適用した場合を例にした実施の形態を用いて開示の音声信号変換装置をより具体的に説明する。
携帯装置10は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス109を介してRAM(Random Access Memory)102、記憶装置103、グラフィック処理装置104、入力インタフェース105、外部補助記憶装置106、通信インタフェース107、および、スピーカ108が接続されている。
記憶装置103としては、例えば、フラッシュメモリやEEPROM(Electrically Erasable and Programmable Read Only Memory)等のメモリデバイスが挙げられる。
グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ104aの画面に表示させる。
携帯装置10は、符号化データ受信部11と、データ復号部12と、話速変換部13と、D/A変換部14とを有している。
データ復号部12は、符号化データ受信部11が受信した符号化された音声データを復号する。
D/A変換部14は、話速変換部13によって変換された音声データ(デジタル信号)をアナログ信号に変換し、スピーカ108に出力する。
図4は、話速変換部の機能を示すブロック図である。
話速変換部13は、補正係数算出部131と、自己相関値算出部132と、区間判別部133と、ピッチ検出部134と、話速設定部135と、ピッチ繰り返し/間引き部136と、無音伸長/圧縮部137と、合成部138とを有している。
補正係数算出部131は、自己相関値を算出する信号区間x(i)と信号区間x(i+j)(j=1、2、・・・、(i−1)、i)の信号を同等に補正する補正係数を算出する。
自己相関値算出部132は、補正係数算出部131が算出した補正係数を用いて、入力信号に対する自己相関値を算出する。
この式(3)は、以下の内容を示している。
信号区間x(i)の信号値と信号区間x(i+j)の信号値に補正係数aを乗じた値の積和(Σx(i)×(a×x(i+j)))をそれぞれ演算する。なお、(a×x(i+j))の値は、補正係数算出部131が予め求めてもよいし、自己相関値算出部132が算出するようにしてもよい。
次に、求めた各積和を各パワーで除算して得られるR(1)〜R(j)をそれぞれ算出する。
区間判別部133は、入力信号を、フレーム毎に無音区間、無声区間および有声区間に分類する。
無音伸長/圧縮部137は、区間判別部133にて雑音(無音)区間と判定された区間について、話速設定部135によって設定された倍率に応じて信号の伸張/圧縮処理を行う。
また、区間判別部133により、入力信号が、無音区間、無声区間および有声区間に分類される。
また、話速設定部135により、発話者の話す速さや受聴者の受聴能力等に応じて有声区間のピッチ区間の延長比率と無音区間の延長比率が設定される。
合成部138により、ピッチの繰り返し/間引きを行った有声区間と、無音区間と、伸張/圧縮を行った無音区間とが入力信号と同じ順序で合成される。そして、合成した信号がD/A変換部14に出力される。
図5は、補正係数算出部の処理を示すフローチャートである。
[ステップS1]
まず、信号区間x(i)と信号区間x(i+j)を用いて補正係数aを算出する。その後、ステップS2に遷移する。
次に、補正係数aをx(i+j)に乗算する。これにより、x(i)とx(i+j)のレベルを同等に合わせることができる。
次に、実施の形態の処理の具体例を説明する。
図6では、信号区間x(i)の信号と信号区間x(i+j)の信号が、ピッチも振幅も同一の場合を示している。
また、式(2)を用いると、
従って、この信号の自己相関値R(j)は、いずれも、[0×(1×0)+8×(1×8)+10×(1×10)+8×(1×8)+0×(1×0)+(−8)×{1×(−8)}+(−10)×{1×(−10)}+(−8)×{1×(−8)}+0×(1×0)]/{0×0+8×8+10×10+8×8+0×0+(−8)×(−8)+(−10)×(−10)+(−8)×(−8)+0×0]=1.0となる。
この波形の補正係数は、式(1)を用いると、
従って、この信号の自己相関値R(j)は、[0×(2×0)+8×(2×4)+10×(2×5)+8×(2×4)+0×(2×0)+(−8)×{2×(−4)}+(−10)×{2×(−5)}+(−8)×{2×(−4)}+0×(2×0)]/{0×0+8×8+10×10+8×8+0×0+(−8)×(−8)+(−10)×(−10)+(−8)×(−8)+0×0}=1.0となる。
従って、この信号の自己相関値R(j)は、[0×(4×0)+8×(4×4)+10×(4×5)+8×(4×4)+0×(4×0)+(−8)×{4×(−4)}+(−10)×{4×(−5)}+(−8)×{4×(−4)}+0×(4×0)]/{0×0+8×8+10×10+8×8+0×0+(−8)×(−8)+(−10)×(−10)+(−8)×(−8)+0×0}=2.0となる。しかし、R(j)≦1.0であるため、自己相関値R(j)は、1.0となる。
以上述べたように、携帯装置10によれば、話速変換部13が備える補正係数算出部131が、自己相関値を算出する対象区間の音声信号のレベルが互いに等しくなるような補正係数aを算出するようにした。これにより、レベル変動の大きな有声区間(隣接するピッチの形状が同一でレベルのみ異なる有声区間)でのピッチの検出精度を高めることができる。
なお、本実施の形態では、自己相関値を算出する2つの信号のパワーを利用してレベルを補正する場合と、自己相関値を算出する2つの信号の振幅の最大値を利用してレベルを補正する場合について説明した。しかし、これに限らず、例えば、2つの信号の振幅の平均値を利用してレベルを補正するようにしてもよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、音声信号変換装置1や携帯装置10が有する機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記録装置としては、例えば、ハードディスク装置、フレキシブルディスク、磁気テープ等が挙げられる。光ディスクとしては、例えば、DVD、DVD−RAM、CD−ROM、CD−R/RW等が挙げられる。光磁気記録媒体としては、例えば、MO等が挙げられる。
2 レベル補正部
3、132 自己相関値算出部
10 携帯装置
11 符号化データ受信部
12 データ復号部
13 話速変換部
14 D/A変換部
15 アンテナ
108 スピーカ
131 補正係数算出部
133 区間判別部
134 ピッチ検出部
135 話速設定部
136 ピッチ繰り返し/間引き部
137 無音伸長/圧縮部
138 合成部
Claims (5)
- 自己相関値を算出する対象区間の音声信号のレベルが互いに等しくなるように前記音声信号を補正するレベル補正部と、
レベル補正を行った前記音声信号に対して自己相関値を算出する自己相関値算出部と、
を有することを特徴とする音声信号変換装置。 - 前記レベル補正部は、前記音声信号のパワーが等しくなるように前記音声信号を補正することを特徴とする請求項1記載の音声信号変換装置。
- 前記レベル補正部は、前記音声信号の振幅の最大値が等しくなるように前記音声信号を補正することを特徴とする請求項1記載の音声信号変換装置。
- コンピュータが、
自己相関値を算出する対象区間の音声信号のレベルが互いに等しくなるように前記音声信号を補正し、
レベル補正を行った前記音声信号に対して自己相関値を算出する、
ことを特徴とする音声信号変換方法。 - コンピュータを、
自己相関値を算出する対象区間の音声信号のレベルが互いに等しくなるように前記音声信号を補正するレベル補正手段、
レベル補正を行った前記音声信号に対して自己相関値を算出する自己相関値算出手段、
として機能させることを特徴とする音声信号変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177427A JP2011033672A (ja) | 2009-07-30 | 2009-07-30 | 音声信号変換装置、音声信号変換方法および音声信号変換プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177427A JP2011033672A (ja) | 2009-07-30 | 2009-07-30 | 音声信号変換装置、音声信号変換方法および音声信号変換プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011033672A true JP2011033672A (ja) | 2011-02-17 |
Family
ID=43762840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009177427A Pending JP2011033672A (ja) | 2009-07-30 | 2009-07-30 | 音声信号変換装置、音声信号変換方法および音声信号変換プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011033672A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6119000A (ja) * | 1984-07-05 | 1986-01-27 | 日本電気株式会社 | 音声符号化方法とその装置 |
JPH01131600A (ja) * | 1987-04-08 | 1989-05-24 | Nec Corp | マルチパルス符号化装置 |
JPH05265488A (ja) * | 1992-03-18 | 1993-10-15 | Sony Corp | ピッチ抽出方法 |
JP2000100072A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 情報信号処理方法及び装置 |
-
2009
- 2009-07-30 JP JP2009177427A patent/JP2011033672A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6119000A (ja) * | 1984-07-05 | 1986-01-27 | 日本電気株式会社 | 音声符号化方法とその装置 |
JPH01131600A (ja) * | 1987-04-08 | 1989-05-24 | Nec Corp | マルチパルス符号化装置 |
JPH05265488A (ja) * | 1992-03-18 | 1993-10-15 | Sony Corp | ピッチ抽出方法 |
JP2000100072A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 情報信号処理方法及び装置 |
Non-Patent Citations (2)
Title |
---|
CSNG199900777002; 藤崎 博也 Hiroya FUJISAKI: '遅れ時間比例窓長の自己相関関数を用いた音声のピッチ自動抽出方式 A Scheme for Pitch Extraction of Spe' 電子情報通信学会技術研究報告 Vol.90 No.444 IEICE Technical Report , 19910221, p.9-16, 社団法人電子情報通信学会 The Institute of Electro * |
JPN6013022660; 藤崎 博也 Hiroya FUJISAKI: '遅れ時間比例窓長の自己相関関数を用いた音声のピッチ自動抽出方式 A Scheme for Pitch Extraction of Spe' 電子情報通信学会技術研究報告 Vol.90 No.444 IEICE Technical Report , 19910221, p.9-16, 社団法人電子情報通信学会 The Institute of Electro * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6205420B1 (en) | Method and device for instantly changing the speed of a speech | |
US8271292B2 (en) | Signal bandwidth expanding apparatus | |
JP4675692B2 (ja) | 話速変換装置 | |
KR101334366B1 (ko) | 오디오 배속 재생 방법 및 장치 | |
EP2596496B1 (en) | A reverberation estimator | |
JP6098149B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP5694745B2 (ja) | 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム | |
CN113271386B (zh) | 啸叫检测方法及装置、存储介质、电子设备 | |
JPWO2009031219A1 (ja) | 音信号生成方法、音信号生成装置及びコンピュータプログラム | |
JP2011033672A (ja) | 音声信号変換装置、音声信号変換方法および音声信号変換プログラム | |
JPH11175096A (ja) | 音声信号処理装置 | |
JPH09152889A (ja) | 話速変換装置 | |
JP3357742B2 (ja) | 話速変換装置 | |
JP3081469B2 (ja) | 話速変換装置 | |
JP2008139573A (ja) | 声質変換方法、声質変換プログラム、声質変換装置 | |
JP2011090483A (ja) | 情報処理装置およびプログラム | |
JP2020190606A (ja) | 音声雑音除去装置及びプログラム | |
JP2002297200A (ja) | 話速変換装置 | |
JP3102553B2 (ja) | 音声信号処理装置 | |
JP2860991B2 (ja) | 音声蓄積再生装置 | |
JPH09146587A (ja) | 話速変換装置 | |
JP4556866B2 (ja) | 高能率符号化プログラム及び高能率符号化装置 | |
JPH10224898A (ja) | 補聴器 | |
JPH10214098A (ja) | 音声変換玩具 | |
JP4297433B2 (ja) | 音声合成方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140425 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141125 |