JPS58111995A - 音声スペクトル情報修正方式 - Google Patents
音声スペクトル情報修正方式Info
- Publication number
- JPS58111995A JPS58111995A JP56214566A JP21456681A JPS58111995A JP S58111995 A JPS58111995 A JP S58111995A JP 56214566 A JP56214566 A JP 56214566A JP 21456681 A JP21456681 A JP 21456681A JP S58111995 A JPS58111995 A JP S58111995A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- parameters
- voice
- spectrum information
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1) 発声の技術分野
本発明は、音声の分析合成方式におい文9食食前音声中
異音なとの開き辛い膏の発生を抑制すまための音声スペ
クトル情報修正方丈に関し、轡kLIPパツメータの特
性を利用して、関連す番パラメータの異常検出と修正躯
瑠とを容易に行なうようkしたものである。
異音なとの開き辛い膏の発生を抑制すまための音声スペ
クトル情報修正方丈に関し、轡kLIPパツメータの特
性を利用して、関連す番パラメータの異常検出と修正躯
瑠とを容易に行なうようkしたものである。
(=) 技術の背景
一般1c、PAR,COR,L8Pなとの一形予一方式
では、Pを子側次数、−iを纏潜予−係数にしたと會。
では、Pを子側次数、−iを纏潜予−係数にしたと會。
ml
にようて表わされる金IIIIモデルによ妙音声のスペ
クトル包絡骨性を近似するものであ為ため、この彎デル
にはあては會らない場合の多いN−PMなどの鼻音性の
子音中徽音、あるいは母音の夏などの嬉1フォルマント
周波数が低い音声でかつ基本屑皺数7bX嬉lフォルi
ント周波数IICはぼ一致してい為場合などに1111
i1フオルマントの帯域幅が異常Km<分析されること
がある。このような場合には、含酸された音声は、その
振幅が非常に大きくな2なり、あるいは、聞暑辛い異音
を含むものと傘つ光如することが多い。
クトル包絡骨性を近似するものであ為ため、この彎デル
にはあては會らない場合の多いN−PMなどの鼻音性の
子音中徽音、あるいは母音の夏などの嬉1フォルマント
周波数が低い音声でかつ基本屑皺数7bX嬉lフォルi
ント周波数IICはぼ一致してい為場合などに1111
i1フオルマントの帯域幅が異常Km<分析されること
がある。このような場合には、含酸された音声は、その
振幅が非常に大きくな2なり、あるいは、聞暑辛い異音
を含むものと傘つ光如することが多い。
(3) 従来技術と問題点
徴秦、音声分析合成を行なう場合で、特定の合成奇声の
品質を向上させるためには1合成と試聴1織り遜しなが
ら人手によりてパラメータの異常が生じている時点を細
索し、さらにパラメータに。
品質を向上させるためには1合成と試聴1織り遜しなが
ら人手によりてパラメータの異常が生じている時点を細
索し、さらにパラメータに。
適轟な修正を加えてみる。という作業な繰如返さねばな
らなかつ虎、シかも、従来は1合成音声中の異常性が、
音声パラメータのどの部分に超因−して生じ為のかが、
必ずしも適確には判別できなかりたため、たとえば、短
いが彊い刺激をもりた異音を抑制する場合には、試行錯
−的で非効率な修正部11t’Lいもれていた。
らなかつ虎、シかも、従来は1合成音声中の異常性が、
音声パラメータのどの部分に超因−して生じ為のかが、
必ずしも適確には判別できなかりたため、たとえば、短
いが彊い刺激をもりた異音を抑制する場合には、試行錯
−的で非効率な修正部11t’Lいもれていた。
(4)発明の目的
本発明は9合成音声中の異音発生か、そのスペクトル包
絡における狭いバンド幅をもりた偽の存在Klf接Kl
l連していることから、このような味いバンド幅の礪を
検出し、そのバンド帳V広げ◆ようにパラメータを修正
することにより、異音の発生を抑制することt#目的と
している。
絡における狭いバンド幅をもりた偽の存在Klf接Kl
l連していることから、このような味いバンド幅の礪を
検出し、そのバンド帳V広げ◆ようにパラメータを修正
することにより、異音の発生を抑制することt#目的と
している。
(5)発明の構成
LSF分析を行なりたとき、音声スペクトル包絡中の狭
いバンド幅v7もりた極のまわりには、LSPパラメー
タ、すなわち線スペクトル周線IIkが系中する9とが
知られ【いる*1111fiはその橡子七例示したもの
である。
いバンド幅v7もりた極のまわりには、LSPパラメー
タ、すなわち線スペクトル周線IIkが系中する9とが
知られ【いる*1111fiはその橡子七例示したもの
である。
pii1図において、Pはスペクトル包絡11*”i乃
轟ζ・は、L8Fパラメータであり、それぞれ!Iスベ
タトルmast’sわしている。−から明らかなよ5に
、スペクトル包絡−Fの急峻なビータ(ω・)のまわり
には。
轟ζ・は、L8Fパラメータであり、それぞれ!Iスベ
タトルmast’sわしている。−から明らかなよ5に
、スペクトル包絡−Fの急峻なビータ(ω・)のまわり
には。
巌スペクトル周lll1撒か近接している(−1参1)
。
。
したかって、IIP/(ツメータの7&−スペクトル屑
m歇閾の接近直置いを調べることにより1合成音声液形
中の狭いバンド幅會もりた極の存在を予測すゐことが可
能であり、また、隣接する纏スペクトル周波歇対の間隔
vlAげるように、鍍−スペクトル屑波歇の値な修正し
てやることにより、#1釆として9合成音声波形中の砺
のバンド幅を広げることが!きる。
m歇閾の接近直置いを調べることにより1合成音声液形
中の狭いバンド幅會もりた極の存在を予測すゐことが可
能であり、また、隣接する纏スペクトル周波歇対の間隔
vlAげるように、鍍−スペクトル屑波歇の値な修正し
てやることにより、#1釆として9合成音声波形中の砺
のバンド幅を広げることが!きる。
本発−は1以上の点に着目して、上述した目的な達成す
るものであり、、L8F音声分析合属方式。
るものであり、、L8F音声分析合属方式。
あるいはLAFバツメータに変換しまたL8Fパツメー
タから逆変換することが可能な音声波のスペクトル情報
をもつ置形予渕符号化方式などの音声分析合成方式にお
いて、上記音声液のスペクトル情@t′l、8Fバツメ
ータに変換する手段と、該変換部れたL8Fパッメータ
の中の☆隣接する2つのLAFバッメータについて近接
ft’%定し。
タから逆変換することが可能な音声波のスペクトル情報
をもつ置形予渕符号化方式などの音声分析合成方式にお
いて、上記音声液のスペクトル情@t′l、8Fバツメ
ータに変換する手段と、該変換部れたL8Fパッメータ
の中の☆隣接する2つのLAFバッメータについて近接
ft’%定し。
近接度の高いL 8 F 、(ラメータの対V抽出する
手段と9w1llil#B畜れたLIFパラメータ対に
ついて。
手段と9w1llil#B畜れたLIFパラメータ対に
ついて。
その近1ift’低くするよう咳L8Fパッメーメの値
を修正する手段と、誼修正され友L 8 P−(ラメー
タを含む金L8Pパラメータを上記音声液のスペクトル
情報に逆変換する手段とをそなえ、上記中間のLSPパ
ラメータ段階を介して音声液のスペクトル情報の修正を
行なうことを特徴とするものでb゛る。
を修正する手段と、誼修正され友L 8 P−(ラメー
タを含む金L8Pパラメータを上記音声液のスペクトル
情報に逆変換する手段とをそなえ、上記中間のLSPパ
ラメータ段階を介して音声液のスペクトル情報の修正を
行なうことを特徴とするものでb゛る。
(6) 発明の実施例
以下に、本発明を!iI施例にしたがって説−す為。
I!2図は、入力音声をPARCOR係数にパラメータ
変換する音声分析システムの実施例の処暑フロー説明図
である。同図において、lri入力音声の線形予橢分析
部で、線形予測係数−1(j:1.L・・・P、P:サ
ンプル牝以下同じ)を求める地層を行なう。2は、線形
予測係数lll1からLS?パラメータ/jを求め為−
L 8 Pパラメータ変換部、3は、 LmPパラメ
ータfiの任意の2つの隣接するI4ラメータについて
、その間の近接度を判定する判*II。
変換する音声分析システムの実施例の処暑フロー説明図
である。同図において、lri入力音声の線形予橢分析
部で、線形予測係数−1(j:1.L・・・P、P:サ
ンプル牝以下同じ)を求める地層を行なう。2は、線形
予測係数lll1からLS?パラメータ/jを求め為−
L 8 Pパラメータ変換部、3は、 LmPパラメ
ータfiの任意の2つの隣接するI4ラメータについて
、その間の近接度を判定する判*II。
4は近接度の高いL8FバラメーIの間隔を広げる修正
部15は修正され光LAPパラメーpfi’の線形予測
係数4g g’Sの変換部、6は纏形予欄係龜−rのP
ARCOR%@NiIヘノ1111鄭テh 4.コノP
ARCURfjhlltki’は、修正されたパラメー
タ出力とな−0また7、 IIは、入力音声から、線形
予−分析vfifK、直1iPjlcORi数&求め4
JIH1)4遍ルートである。1はPA凡CO几係歇直
接分析部。
部15は修正され光LAPパラメーpfi’の線形予測
係数4g g’Sの変換部、6は纏形予欄係龜−rのP
ARCOR%@NiIヘノ1111鄭テh 4.コノP
ARCURfjhlltki’は、修正されたパラメー
タ出力とな−0また7、 IIは、入力音声から、線形
予−分析vfifK、直1iPjlcORi数&求め4
JIH1)4遍ルートである。1はPA凡CO几係歇直
接分析部。
II it PAjiCOR係vtt t’ s形予欄
94鎮asに変換する変換部である。
94鎮asに変換する変換部である。
$11181は* lI21HC示LIMllya−E
l、1s、がうill施例システムのIIjiE#Aで
ある。
l、1s、がうill施例システムのIIjiE#Aで
ある。
Allにおいて、9.10は、従来のPAiCOR分析
オ武の音声分析装置におけるものと同様な、#I膠予I
I分析部とPARLOR変換部である。11は。
オ武の音声分析装置におけるものと同様な、#I膠予I
I分析部とPARLOR変換部である。11は。
本発@に基づくバラメータ修正逃履部であり、線形予−
分析部の出力からIII形予綱係gas t’引き込ん
で、これを一旦、LIPバツメータに変換し。
分析部の出力からIII形予綱係gas t’引き込ん
で、これを一旦、LIPバツメータに変換し。
このLBPパ9メータの段階で、異常なパラメータの検
出と修正と1行ない、緒呆t−ait形予wA111数
mffc道変換し【14す機能を呆丁。
出と修正と1行ない、緒呆t−ait形予wA111数
mffc道変換し【14す機能を呆丁。
パラメータ修正#&、i1部11において、 lz、
xs&r:それぞれ腋修正M]111111の入出力イ
ンタ7sイスとなるL8P変換部、およびI、8P道変
換部である。ここで、L8F変換Ill!かうの出力I
IFパラメータは、騙スペクトル周波数で、低い方から
^い方へ向5Jl序で出力される。図には、@義いて出
力される隣*jる2つのLAPパッメーpfi。
xs&r:それぞれ腋修正M]111111の入出力イ
ンタ7sイスとなるL8P変換部、およびI、8P道変
換部である。ここで、L8F変換Ill!かうの出力I
IFパラメータは、騙スペクトル周波数で、低い方から
^い方へ向5Jl序で出力される。図には、@義いて出
力される隣*jる2つのLAPパッメーpfi。
fjが88れており、 fj>fiである。
14、15は、それぞれfj、fiw保持するレジスタ
である。レジスタ14.15の内容は、L8Fパッメー
タ近秦直判定部16およびバラメーメ修正演算部七へ送
られる。
である。レジスタ14.15の内容は、L8Fパッメー
タ近秦直判定部16およびバラメーメ修正演算部七へ送
られる。
近接監判定郁16は、近Ii監の判定式として、たとえ
ば次式な使用する。
ば次式な使用する。
パラメータ修正演算1i17は、近接1判定鄭l・から
t fit //か上式を満たしたとする4141j!
績釆V慢たときe fi’*修正するための演算上行な
い、修正値#’t−得て、レジスタ15のfiと置き換
える。パラメータの修正は、必要な場合*fjK対して
行なうこともできる。修正すべき量は、バッメーI値電
により真なるか、 fj−fiの値か、たとえば5G8
4上となるように修正することが実際上有効な方法であ
る。
t fit //か上式を満たしたとする4141j!
績釆V慢たときe fi’*修正するための演算上行な
い、修正値#’t−得て、レジスタ15のfiと置き換
える。パラメータの修正は、必要な場合*fjK対して
行なうこともできる。修正すべき量は、バッメーI値電
により真なるか、 fj−fiの値か、たとえば5G8
4上となるように修正することが実際上有効な方法であ
る。
修正されたL8Pパッメーメfilは、レジスタ15か
らL8P遊変逆変換3に送られる。LAP逆変換部13
14寡、全てのL8Fパラメータを受入れた後。
らL8P遊変逆変換3に送られる。LAP逆変換部13
14寡、全てのL8Fパラメータを受入れた後。
−廖予−@@as’(i目、礼・・・P)に逆変換する
処mt−行ない、PARCOR変換1110Kmカ丁4
゜PARCOR変換$10ハ、入方13 N ” ”
(g r l e2、・・・、P)sc基づいてPAR
C!OR変換を行ない。
処mt−行ない、PARCOR変換1110Kmカ丁4
゜PARCOR変換$10ハ、入方13 N ” ”
(g r l e2、・・・、P)sc基づいてPAR
C!OR変換を行ない。
修Eflif) PARCOR%1jlRi’(i s
1.2. ・・・、 F ) t’音声パラメータと
して出方する。
1.2. ・・・、 F ) t’音声パラメータと
して出方する。
(7) 54@の効果
本尭@によれば、L8Fパラメータを利用するととによ
り、f声スペクトル包藉中の狭少な帯域@Y:4つ極の
検出と修正とか、従来に比べて容易確実に行なうことか
でき1合成音声の品質改善の鵡履細率七大きく向上させ
ることができる。
り、f声スペクトル包藉中の狭少な帯域@Y:4つ極の
検出と修正とか、従来に比べて容易確実に行なうことか
でき1合成音声の品質改善の鵡履細率七大きく向上させ
ることができる。
III図はL8Fパラメータの説@図、纂2■も寡。
実施例のIIJlm;ya−親明図、第3−は実施例シ
ステムの壽ItwJである。 図において、9は一形予欄分析薄、 1GはPム&CO
&変iI&部、11はパラメータ修正処理部、1@寡L
B E? 49 メI 近’Ik lI IJ定j1
m 174! ハ91 141正演算部、をそれぞれ示
す。 脅許出願人 富士通株式会社 代1人mS士 長谷用 文 廣 (外14) 才1 目 4転肴lくノメータ 才2図
ステムの壽ItwJである。 図において、9は一形予欄分析薄、 1GはPム&CO
&変iI&部、11はパラメータ修正処理部、1@寡L
B E? 49 メI 近’Ik lI IJ定j1
m 174! ハ91 141正演算部、をそれぞれ示
す。 脅許出願人 富士通株式会社 代1人mS士 長谷用 文 廣 (外14) 才1 目 4転肴lくノメータ 才2図
Claims (1)
- L8P音声分析舎威方式、あるいはL S P /(ラ
メータにm換しt禽L8Pパラメータから逆変換す為こ
とが可簡愈音声液のスペクトル情報を4つ纏形予SW*
号化方式などの音声分析含酸方式において、上1音声液
のスペクトル情報をL 8 P ハ9メータに変換する
手段と9wI変換され九L 8 P p<ラメ−Iの中
の舎−纏す12つのL !i P I(ラメーーについ
て近II![を判定し、近接度の高いL8Pパラメータ
の対を抽出す為手段と、皺輸出されたLIPパラメータ
11#について、その近接度を低くするより該L8PA
ラメ−Iの値を修正する手段と、峡修正されたL8Fパ
ラメータを會む食L8Pパラメータを上記音声波のスペ
クトル情報に逆変換す番+*とを七なえ、上日中闘のL
IPパラメータ段階を介して音声波のスペクトル情報の
修正を行なうことを特徴とする音声スペクトル情報修正
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56214566A JPS5912197B2 (ja) | 1981-12-25 | 1981-12-25 | 音声スペクトル情報修正方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56214566A JPS5912197B2 (ja) | 1981-12-25 | 1981-12-25 | 音声スペクトル情報修正方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58111995A true JPS58111995A (ja) | 1983-07-04 |
JPS5912197B2 JPS5912197B2 (ja) | 1984-03-21 |
Family
ID=16657835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56214566A Expired JPS5912197B2 (ja) | 1981-12-25 | 1981-12-25 | 音声スペクトル情報修正方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5912197B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018165824A (ja) * | 2018-06-06 | 2018-10-25 | 株式会社Nttドコモ | 音声信号処理方法及び音声信号処理装置 |
-
1981
- 1981-12-25 JP JP56214566A patent/JPS5912197B2/ja not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018165824A (ja) * | 2018-06-06 | 2018-10-25 | 株式会社Nttドコモ | 音声信号処理方法及び音声信号処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS5912197B2 (ja) | 1984-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Furui | Speaker-independent isolated word recognition using dynamic features of speech spectrum | |
Prasad et al. | Automatic segmentation of continuous speech using minimum phase group delay functions | |
JP5507596B2 (ja) | スピーチ増強 | |
CN102414742B (zh) | 低复杂度听觉事件边界检测 | |
Kawahara et al. | An instantaneous-frequency-based pitch extraction method for high-quality speech transformation: revised TEMPO in the STRAIGHT-suite | |
Sukhostat et al. | A comparative analysis of pitch detection methods under the influence of different noise conditions | |
JPS5850360B2 (ja) | 音声認識装置における前処理方法 | |
RU2296377C2 (ru) | Способ анализа и синтеза речи | |
Ishikawa et al. | Toward clinical application of landmark-based speech analysis: Landmark expression in normal adult speech | |
Scarr | Zero crossings as a means of obtaining spectral information in speech analysis | |
Chennupati et al. | Significance of phase in single frequency filtering outputs of speech signals | |
Hermansky et al. | Analysis and synthesis of speech based on spectral transform linear predictive method | |
Kawahara et al. | Higher order waveform symmetry measure and its application to periodicity detectors for speech and singing with fine temporal resolution | |
Wang et al. | Diffusion-based Speech Enhancement with Schr\" odinger Bridge and Symmetric Noise Schedule | |
JP2000353000A (ja) | 音声信号位相情報処理装置及びその方法 | |
CN116230018A (zh) | 一种用于语音合成系统的合成语音质量评估方法 | |
JPS58111995A (ja) | 音声スペクトル情報修正方式 | |
Sun et al. | Boosting the intelligibility of waveform speech enhancement networks through self-supervised representations | |
JPH0573093A (ja) | 信号特徴点の抽出方法 | |
Alku et al. | Linear predictive method for improved spectral modeling of lower frequencies of speech with small prediction orders | |
Maheshwari et al. | Convolutional Encoder–Decoder Architecture for Speech Enhancement | |
JP3035939B2 (ja) | 音声分析合成装置 | |
Dasgupta et al. | Detection of Glottal Excitation Epochs in Speech Signal Using Hilbert Envelope. | |
Strauss et al. | SEFGAN: Harvesting the Power of Normalizing Flows and GANs for Efficient High-Quality Speech Enhancement | |
Wu et al. | Improving Speech Perceptual Quality and Intelligibility Through Sub-band Temporal Envelope Characteristics |