JP3159930B2 - 音声処理装置のピッチ抽出方法 - Google Patents

音声処理装置のピッチ抽出方法

Info

Publication number
JP3159930B2
JP3159930B2 JP03931197A JP3931197A JP3159930B2 JP 3159930 B2 JP3159930 B2 JP 3159930B2 JP 03931197 A JP03931197 A JP 03931197A JP 3931197 A JP3931197 A JP 3931197A JP 3159930 B2 JP3159930 B2 JP 3159930B2
Authority
JP
Japan
Prior art keywords
pitch
filter
residual signal
frame
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03931197A
Other languages
English (en)
Other versions
JPH1020887A (ja
Inventor
時 雨 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JPH1020887A publication Critical patent/JPH1020887A/ja
Application granted granted Critical
Publication of JP3159930B2 publication Critical patent/JP3159930B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声を符号化しある
いは合成するなどの処理を行うときの音声ピッチ抽出方
法に関し、特に、連続音声のピッチ抽出にも有効なピッ
チ抽出方法に関するものである。
【0002】
【従来の技術】科学技術の発達と共に通信端末機の需要
が毎年急増するに伴い、通信回線は絶対的に不足してき
ている。このような現象を克服するために、音声を8kb
it/s以下の低いビット率に符号化する方法が提案され
た。しかし、このような符号化方法により音声を処理す
る場合には音質が低下するという短所がある。そこで、
おおぜいの研究者により、音声を低いビット率で処理し
ながら音質を改善させるための膨大な研究が進まれてい
る。
【0003】一方、音質を改善するためには心理的属性
である“音程”、“音量”、“音色”を改善しなければ
ならないし、この心理的属性に対応する物理的属性であ
る“ピッチ”、“振幅”、“波形構造”を原音の属性に
近く再生しなければならない。音声の物理的属性である
“ピッチ(pitch) ”は周波数領域では基本周波数または
ピッチ周波数と呼ばれており、時間領域ではピッチ間隔
またはピッチと呼ばれる。ピッチは発声者の性別、発声
音声に対する有声音/無声音の判別に必ず必要なパラメ
ータで、特に、低いビット率に音声を符号化する場合に
は一層必要な情報である。
【0004】現在まで提案されたピッチ抽出方法は、大
きく時間領域で抽出する方法、周波数領域で抽出する方
法、時間領域と周波数領域を混合して抽出する方法の3
つに分けられる。時間領域でピッチを抽出する代表的な
方法としては自己相関法があり、周波数領域でピッチを
抽出する代表的な方法としてはケプストラム法があり、
時間領域と周波数領域でピッチを混合して抽出する方法
としてはAMDF(Average Magnitude Difference Fun
ction )法、LPC(線形予測符号化)法及びAMDF
を混合した方法などがある。
【0005】上記のような既存の方法は、フレームで一
つのピッチのみを求めた後、音声処理時にこの求められ
たピッチを繰り返して復元し、このとき、有声音源をピ
ッチ間隔ごとに適用することにより、音声波形を再生す
る。ところで、実際の連続音声では音素が変わるときに
声帯や声度特性が変化し、干渉によりピッチ間隔が数十
msのフレーム内でも微細に変動する。すなわち、連続音
声のように前後の音素が相互に影響して周期が相互に異
なる音声波形が1フレーム内に存在する場合にピッチ抽
出誤りが発生する。例えば、音声の語頭や語尾、音源の
遷移部、無声音と有声音が存在するフレームまたは無声
子音と有声音が存在するフレームではピッチ抽出誤りが
発生する。このように、既存の方法は連続音声について
は脆弱な短所がある。
【0006】
【発明が解決しようとする課題】したがって本発明の目
的は、音声処理装置で音声を処理するときに音質を改善
する方法を提供することにある。本発明の他の目的は、
音声処理装置で音声のピッチを抽出するときに発生する
誤りを除去させる方法を提供することにある。
【0007】本発明のまた他の目的は、連続音声のピッ
チを抽出するのに有効なピッチ抽出方法を提供すること
にある。
【0008】
【課題を解決するための手段】このような目的を達成す
るために本発明は、フレーム内で音声の高低を示す多数
の残差信号を発生する残差信号発生過程と、前記多数の
残差信号のうち所定条件を満たす残差信号をピッチとし
て発生するピッチ発生過程とからなるピッチ抽出方法を
提供する。前記残差信号発生過程は、FIR フィルタとST
REAKフィルタを結合したFIR-STREAKフィルタを利用して
音声をフィルタリングし、このフィルタリング結果を残
差信号として発生することを特徴とし、前記ピッチ発生
過程は多数の残差信号のうち予め設定された振幅以上の
残差信号と、残差信号間の時間間隔が予め設定された時
間間隔内の場合の残差信号のみをピッチとして発生する
ことを特徴とする。
【0009】
【発明の実施の形態】以下、本発明の好適な実施の形態
を添付の図面を参照して詳細に説明する。まず、本発明
における音声資料は、下記の〈表1〉に示すように、男
女各4人の日本人アナウンサーによる32文章の連続音
声を使用したことである。
【0010】
【表1】
【0011】図1は、本発明による動作のためにFIR(Fi
nite Impulse Response)フィルタとSTREAK(Simplified
Technique for Recursive Estimate Autocorrelation K
parameter)フィルタが結合されたFIR-STREAKフィルタの
構成を示すものである。図1,図2及び図3を参照する
に、FIR-STREAKフィルタは音声信号X(n)を入力して
フィルタリングした後、このフィルタリングされた結果
信号fM (n)及びgM (n)を発生する。一例とし
て、図2の(a)及び図3の(a)に示すような音声信
号が入力されたとき、FIR-STREAKフィルタは図2の
(b)及び図3の(b)に示すような残差信号を出力す
る。このFIR-STREAKフィルタによりピッチ抽出に必要な
周期性の残差信号Rpが求められる。ここで、周期性の
残差信号Rpとは予め設定された時間間隔内で求められ
る信号を意味する。
【0012】以下、残差信号Rpから得たピッチを個別
ピッチパルス(IPP:IndividualPitch Pulse) と称
する。STREAKフィルタは、下記の(式1)のように前方
向誤差信号fi(n)と後方向誤差信号gi(n)に表
す。
【0013】
【数1】
【0014】上記の(式1)をkiにより偏微分すれ
ば、下記の(式2)のようなSTREAK係数が得られる。
【0015】
【数2】
【0016】FIR-STREAKフィルタの伝達関数は次の(式
3)の通りである。
【0017】
【数3】
【0018】上記(式3)で、MFとbiはFIR フィル
タの次数とフィルタ係数で、MSとkiはSTREAKフィル
タの次数とフィルタ係数である。結果的に、FIR-STREAK
フィルタの出力から個別ピッチパルスの手掛りになるR
pが得られる。一般に、3.4kHzのLPF(ローパスフィ
ルタ)により制限された周波数帯域では3〜4個のホル
マント(formant)が存在し、これを抽出するための格子
状フィルタには通常8〜10次のフィルタ次数が用いら
れる。本発明によるSTREAKフィルタも8〜10次のフィ
ルタ次数の範囲を有するとしたら、残差信号Rpは明確
に流出され、本発明では10次のSTREAKフィルタを使用
している。一方、本発明でFIR フィルタの次数Mpは
【0019】
【数4】
【0020】にし、帯域制限周波数Fpはピッチ周波数
が80〜370Hzであることを考えて
【0021】
【数5】
【0022】として残差信号Rpを流出する。実験結
果、Mp及びFpはそれぞれ80次800HzでRpがI
PP位置で明確に現われることを確認することが可能で
あった。しかしながら、音声の語頭や語尾でRpは明確
に現われない場合が多い。これは、音声の語頭や語尾で
ピッチ周波数が第1ホルマントにより大きく影響を受け
ることを意味する。
【0023】図4及び図5は本発明のピッチ抽出方法に
よる処理フローチャートで、図6は本発明の方法により
抽出されたピッチパルスに対する波形図である。図4及
び図5を参照するに、本発明によるピッチ抽出方法は3
過程に大別される。第1過程は、1フレーム内の音声
(Speech) をFIR-STREAKフィルタを利用してフィルタリ
ングする過程である(300段階)。
【0024】第2過程は、FIR-STREAKフィルタによりフ
ィルタリングされた信号のうち所定の条件を満たす信号
を多数の残差信号で発生する過程である(310段階、
320段階、341段階〜349段階または310段
階、320段階、361段階〜369段階)。第3過程
は、各残差信号に前後する残差信号との関係を参照して
フレーム内の他の残差信号を補正/補間し、このように
補正/補間された残差信号と既に発生した残差信号をピ
ッチとして抽出する過程である(350段階〜353段
階または370段階〜374段階)。
【0025】図4及び図5で、EN (n)とEP (n)
の場合ではIPPの抽出方法は同一の処理方法によって
実現されるので、下記ではEP (n)でIPPを抽出す
る方法にのみ限って説明する。まず、振幅が大きな残差
信号を順次に代入して得たAによりEP (n)の振幅を
定規化する。本発明における音声資料を基づいてmP
求めた結果、Rp地点でのmP は0.5 以上である結果を
得た。したがって、EP (n)>AとmP >0.5 の残差
信号をRpにし、ピッチ周波数を基づいたRp間隔Lが
【0026】
【数6】
【0027】のRp位置をIPP位置(Pi,I=0,
1,─,M)とする。そして、Rp位置の漏れによる補
正及び補間処理は、以前フレームの最後のIPP位置
(PM )と現在フレームの時刻0からPoまでの間隔
(ξP )からIB (=N−PM +ξ P )を求める。次
に、平均ピッチの1/2に現われる半分ピッチと平均ピ
ッチの2倍に現われる倍ピッチを防止するために、IB
間隔が平均ピッチ間隔({P0+P1+─+PM}/
M)の50%のときと150%のとき、Pi位置を補正
する。但し、日本語音声では子音に続いて母音が現われ
るので、以前フレームに子音が存在する場合は下記の
(式4)を、子音が存在しない場合は(式5)をそれぞ
れ適用する。
【0028】
【数7】
【0029】
【数8】
【0030】ここで、IA1=(PM −Po)/M,IA2
={IB +(PM −Pi)}/Mである。そして、IP
Pの間隔(IPi),平均間隔(IAV),偏差(DP
i)を下記の(式6)を通じて求める。但し、ξP 及び
フレーム最後からPM までの間隔はDPiに含めない。
次に、
【0031】
【数9】
【0032】の場合と
【0033】
【数10】
【0034】の場合は、下記の(式7)によりそれぞれ
位置補正及び補間を行う。 IPi=Pi−Pi−1 IAV=(PM −Po)/M ・・・(式6) DPi=IAV−IPi
【0035】
【数11】
【0036】ここで、i=1,2,─,Mである。ま
た、前記(式4)〜(式6)をEN (n)に適用して位
置補正及び補間されたPiを求める。このような方法に
より求められた時間軸上の+側Piと−側Piの中でい
ずれか一側を選択しなければならないが、このとき、P
i位置が急激に変化しない側のPiを選択する。その理
由は、数十msのフレーム内でのピッチ間隔は徐々に変化
するからである。すなわち、IAVに対するPi間隔の変
化を下記の(式8)により評価して
【0037】
【数12】
【0038】の場合は+側のPiを、Cp>CN の場合
は−側のPiを選択する。ここで、C N はPN (n)か
ら求めた評価値である。
【0039】
【数13】
【0040】しかし、+側のPiと−側のPiのうちい
ずれか一側を選択することにより時間差(ξP −ξN
が発生し、これを補償するために−側のPiを選択した
場合は、次の式により位置を再び補正した。 Pi=PNi+(ξP −ξN ) ・・・(式9) 図6には、補正されたPiを再び補間処理した場合と補
間処理を行わない場合の例を示す。図6の(a),
(g)は連続したフレームにおいて振幅レベルが減衰す
る音声波形、(d)は振幅レベルが低い音声波形、
(j)は音素が変化する遷移部の音声波形では信号の相
互関係による信号解析が難しいので、Rpが容易に漏落
されてPiを明確に抽出することができない場合が多
い。この場合、他の対策なしにPiを使用して音声合成
を行うと、音質低下の原因となる。しかし、本発明で提
示した方法によりPiを補正及び補間した結果、図6の
(c),(f),(i),(1)に示すようにIPPが
明確に抽出することが分かる。
【0041】IPPの抽出率AER1は、実際のIPP
が存在する位置でIPPが抽出されない場合(“−
ij”)と実際IPPが存在しない位置でIPPが抽出
された場合(“cij”)を抽出誤りとするとき、下記の
(式10)により求められる。
【0042】
【数14】
【0043】ここで、aijは観察されたIPP数で、T
はIPPが存在するフレーム数で、mは音声サンプル数
である。本発明での実験結果、観察されたIPP数は男
性の場合は3483個であり、女性の場合は5374個
である。そして、抽出されたIPP数は男性の場合は3
343個、女性の場合は4566個である。したがっ
て、IPP抽出率は男性の場合は96%で、女性の場合
は85%である。
【0044】本発明によるピッチ抽出方法と従来技術に
よるピッチ抽出方法とを比較すると、次の通りである。
自己相関法やケプトラム法のように平均値のピッチを求
める方法によると、音節の語頭や語尾、音素の推移部
分、無音と有声音または無声子音と有声音が共に存在す
るフレームでピッチ抽出誤りが発生する。一例として、
無声子音と有声音が共に存在するフレームにおいて自己
相関法によってはピッチが抽出されず、ケプトラム法に
よっては無声音部でもピッチが抽出される誤りがある。
このようなピッチ抽出誤りは、有声音/無声音の判別に
対する判別誤りの原因になる。さらに、無声子音と有声
音が共に存在するフレームを無声音源または有声音源の
うちいずれか一側の音源を使用することにより、音質低
下の原因となる。
【0045】他の例として、連続的な音声波形を数十ms
で切って分析する場合、平均ピッチを抽出する方法では
フレーム間のピッチ間隔が他のピッチ間隔より大きく広
くなりあるいは狭くなる現象が現れる。しかし、本発明
によるIPP抽出法によると、変動するピッチ間隔に対
応でき、かつ無声子音と有声音が共に存在するフレーム
でもピッチの位置を明確に求められる。
【0046】本発明においての音声資料を使用し、各方
法によりピッチを抽出する場合、各方法においてのピッ
チ抽出率は下記の〈表2〉の通りである。
【0047】
【表2】一方、本発明の詳細な説明では具体的な実施例
に関して説明したが、本発明の範囲を外れない範囲内で
は多様な変化が可能であることは勿論である。したがっ
て、本発明の範囲は説明した実施例に限って定められて
はいけないし、特許請求の範囲だけでなく、この特許請
求の範囲と均等なものにより定めなければならない。
【0048】
【発明の効果】以上述べてきたように本発明は、FIR-ST
REAKフィルタにより残差信号を求め、この残差信号を使
用して音源の推移や声度特性の干渉により現われるピッ
チ間隔の変動に対応できるピッチ抽出方法を提供する。
このようなピッチ抽出方法は、非周期性音声波形や音声
の語頭や語尾、無音または無声子音と有声音が共に存在
するフレームで発生するピッチ抽出誤りを抑制すること
ができる利点がある。
【図面の簡単な説明】
【図1】本発明による動作のためのFIR-STREAKフィルタ
の構成を示す図である。
【図2】図1のFIR-STREAKフィルタにより求められる残
差信号に対する波形図である。
【図3】図1のFIR-STREAKフィルタにより求められる残
差信号に対する波形図である。
【図4】本発明のピッチ抽出方法による処理流れを示す
フローチャートである。
【図5】図4に続くフローチャートである。
【図6】本発明の方法により抽出されたピッチパルスに
対する波形図である。
フロントページの続き (56)参考文献 特開 平5−19793(JP,A) 特開 平6−131000(JP,A) 特開 昭59−211094(JP,A) 特公 平3−30880(JP,B2) 米国特許5864791(US,A) 英国特許出願公開2314747(GB,A) 1991年電子情報通信学会春季全国大会 講演論文集,第1分冊,A−217「マル チパルス音声符号化方式におけるピッチ 抽出及び無声子音の処理について」, p.1−217(1991) 第35回自動制御連合講演会前刷, 3072,「マルチパルス音声符号化方式に おける個別ピッチパルス抽出法の一検 討」,p.539−540,(1992年10月28 日) 第34回平成2年度日本大学理工学部学 術講演会論文集,M−43,「マルチパル ス音声符号化方式の研究の一方法」, p.611−612,(平成2年) 1990年電子情報通信学会春季全国大会 講演論文集,第1分冊,A−224「低ビ ットレート音声符号化のための各種ピッ チ抽出法の客観的評価」,p.1−224 (1990) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声処理装置で音声に対するピッチを抽
    出する方法において、 FIR フィルタとSTREAKフィルタを結合したFIR-STREAKフ
    ィルタを利用して音声をフィルタリングし、このフィル
    タリング結果を所定フレーム内で音声の高低を示す多数
    の残差信号として発生する残差信号発生過程と、 前記多数の残差信号のうち、予め設定された振幅以上の
    残差信号と、残差信号間の時間間隔が予め設定された時
    間間隔内である場合の残差信号のみをピッチで発生する
    ピッチ発生過程と 以前フレームの最後のピッチパルスと現在フレームの最
    初のピッチパルスとの間隔に従って前記残差信号の位置
    補正及び補間処理を行なう補正/補間過程と を有し、 前記所定フレーム毎に少なくとも一つ以上のピッチを抽
    出する方法。
  2. 【請求項2】 前記補正/補間過程は、以前フレームに
    子音が存在する場合と子音が存在しない場合とで処理を
    区別することを特徴とする請求項記載の方法。
  3. 【請求項3】 FIR フィルタとSTREAKフィルタを結合し
    たFIR-STREAKフィルタを少なくとも有する音声処理装置
    でフレーム単位で連続音声に対するピッチを抽出する方
    法において、 前記FIR-STREAKフィルタを利用して連続音声をフレーム
    単位でフィルタリングした後、そのフィルタリング結果
    信号のうち予め設定された振幅以上の結果信号と、結果
    信号間の間隔が予め設定された時間間隔内である場合の
    結果信号とを多数の残差信号として発生し、前記各残差
    信号の前後の残差信号との関係を参照してフレーム内の
    他の残差信号を補正/補間し、この補正/補間された残
    差信号と既に発生した残差信号をピッチとして抽出し、 前記補正/補間過程は、以前フレームの最後のピッチパ
    ルスと現在フレームの最初のピッチパルスとの間隔に従
    って前記残差信号の位置補正及び補間処理が行なわれ、
    更に以前フレームに子音が存在する場合と子音が存在し
    ない場合とで処理を区別 することを特徴とする方法。
JP03931197A 1996-06-24 1997-02-24 音声処理装置のピッチ抽出方法 Expired - Fee Related JP3159930B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR23341/1996 1996-06-24
KR1019960023341A KR100217372B1 (ko) 1996-06-24 1996-06-24 음성처리장치의 피치 추출방법

Publications (2)

Publication Number Publication Date
JPH1020887A JPH1020887A (ja) 1998-01-23
JP3159930B2 true JP3159930B2 (ja) 2001-04-23

Family

ID=19463123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03931197A Expired - Fee Related JP3159930B2 (ja) 1996-06-24 1997-02-24 音声処理装置のピッチ抽出方法

Country Status (5)

Country Link
US (1) US5864791A (ja)
JP (1) JP3159930B2 (ja)
KR (1) KR100217372B1 (ja)
CN (1) CN1146861C (ja)
GB (1) GB2314747B (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100217372B1 (ko) 1996-06-24 1999-09-01 윤종용 음성처리장치의 피치 추출방법
JP4641620B2 (ja) * 1998-05-11 2011-03-02 エヌエックスピー ビー ヴィ ピッチ検出の精密化
JP2000208255A (ja) 1999-01-13 2000-07-28 Nec Corp 有機エレクトロルミネセント表示装置及びその製造方法
US6488689B1 (en) * 1999-05-20 2002-12-03 Aaron V. Kaplan Methods and apparatus for transpericardial left atrial appendage closure
US8257389B2 (en) * 2004-05-07 2012-09-04 W.L. Gore & Associates, Inc. Catching mechanisms for tubular septal occluder
DE102005025169B4 (de) 2005-06-01 2007-08-02 Infineon Technologies Ag Kommunikationsvorrichtung und Verfahren zur Übermittlung von Daten
US20090143640A1 (en) * 2007-11-26 2009-06-04 Voyage Medical, Inc. Combination imaging and treatment assemblies
US8666734B2 (en) * 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2314747A (en) 1996-06-24 1998-01-07 Samsung Electronics Co Ltd Pitch extraction in a speech processing unit

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
US4879748A (en) * 1985-08-28 1989-11-07 American Telephone And Telegraph Company Parallel processing pitch detector
US4845753A (en) * 1985-12-18 1989-07-04 Nec Corporation Pitch detecting device
JPH0782359B2 (ja) * 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
KR960009530B1 (en) * 1993-12-20 1996-07-20 Korea Electronics Telecomm Method for shortening processing time in pitch checking method for vocoder
US5704000A (en) * 1994-11-10 1997-12-30 Hughes Electronics Robust pitch estimation method and device for telephone speech
US5680426A (en) * 1996-01-17 1997-10-21 Analogic Corporation Streak suppression filter for use in computed tomography systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2314747A (en) 1996-06-24 1998-01-07 Samsung Electronics Co Ltd Pitch extraction in a speech processing unit
US5864791A (en) 1996-06-24 1999-01-26 Samsung Electronics Co., Ltd. Pitch extracting method for a speech processing unit

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
1990年電子情報通信学会春季全国大会講演論文集,第1分冊,A−224「低ビットレート音声符号化のための各種ピッチ抽出法の客観的評価」,p.1−224(1990)
1991年電子情報通信学会春季全国大会講演論文集,第1分冊,A−217「マルチパルス音声符号化方式におけるピッチ抽出及び無声子音の処理について」,p.1−217(1991)
第34回平成2年度日本大学理工学部学術講演会論文集,M−43,「マルチパルス音声符号化方式の研究の一方法」,p.611−612,(平成2年)
第35回自動制御連合講演会前刷,3072,「マルチパルス音声符号化方式における個別ピッチパルス抽出法の一検討」,p.539−540,(1992年10月28日)

Also Published As

Publication number Publication date
GB2314747B (en) 1998-08-26
KR100217372B1 (ko) 1999-09-01
JPH1020887A (ja) 1998-01-23
GB2314747A (en) 1998-01-07
US5864791A (en) 1999-01-26
GB9702817D0 (en) 1997-04-02
KR980006959A (ko) 1998-03-30
CN1146861C (zh) 2004-04-21
CN1169570A (zh) 1998-01-07

Similar Documents

Publication Publication Date Title
Airaksinen et al. Quasi closed phase glottal inverse filtering analysis with weighted linear prediction
US8898055B2 (en) Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech
US8265940B2 (en) Method and device for the artificial extension of the bandwidth of speech signals
JP4946293B2 (ja) 音声強調装置、音声強調プログラムおよび音声強調方法
JP4202090B2 (ja) スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法
EP1252621B1 (en) System and method for modifying speech signals
Song et al. ExcitNet vocoder: A neural excitation model for parametric speech synthesis systems
US8996378B2 (en) Voice synthesis apparatus
EP1995723A1 (en) Neuroevolution training system
US20120095767A1 (en) Voice quality conversion device, method of manufacturing the voice quality conversion device, vowel information generation device, and voice quality conversion system
EP1426926B1 (en) Apparatus and method for changing the playback rate of recorded speech
JP2005157363A (ja) フォルマント帯域を利用したダイアログエンハンシング方法及び装置
JP3159930B2 (ja) 音声処理装置のピッチ抽出方法
JP4225128B2 (ja) 規則音声合成装置及び規則音声合成方法
Islam Interpolation of linear prediction coefficients for speech coding
Ohtani et al. Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP.
JP4433668B2 (ja) 帯域拡張装置及び方法
JP4451633B2 (ja) 最適窓生成方法、窓最適化処理装置、プログラム、線形予測分析最適化方法及び線形予測分析最適化装置
Sasou et al. Glottal excitation modeling using HMM with application to robust analysis of speech signal.
Picone et al. Robust pitch detection in a noisy telephone environment
KR0176623B1 (ko) 연속 음성의 유성음부와 무성자음부의 자동 추출방법 및 장치
de Paiva et al. On the application of RLS adaptive filtering for voice pitch modification
JP3447220B2 (ja) 音声変換装置及び音声変換方法
JP2006284907A (ja) 音素セグメンテーション方法及び装置
Faycal et al. Pitch modification of speech signal using source filter model by linear prediction for prosodic transformations

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080216

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 13

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees