JPH07319498A - 音声信号のピッチ周期抽出装置 - Google Patents

音声信号のピッチ周期抽出装置

Info

Publication number
JPH07319498A
JPH07319498A JP6108544A JP10854494A JPH07319498A JP H07319498 A JPH07319498 A JP H07319498A JP 6108544 A JP6108544 A JP 6108544A JP 10854494 A JP10854494 A JP 10854494A JP H07319498 A JPH07319498 A JP H07319498A
Authority
JP
Japan
Prior art keywords
value
pitch
converter
autocorrelation
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6108544A
Other languages
English (en)
Other versions
JP3402748B2 (ja
Inventor
Tatsuo Inoue
健生 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP10854494A priority Critical patent/JP3402748B2/ja
Priority to KR1019940022600A priority patent/KR100323011B1/ko
Priority to US08/447,646 priority patent/US5819209A/en
Publication of JPH07319498A publication Critical patent/JPH07319498A/ja
Priority to US09/685,938 priority patent/USRE38889E1/en
Application granted granted Critical
Publication of JP3402748B2 publication Critical patent/JP3402748B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【目的】 本発明は、短い処理時間で音声信号から正確
にピッチ周期を抽出する音声信号のピッチ周期抽出装置
を提供することを目的とする。 【構成】 本発明は入力音声信号をディジタル信号に変
換するA/D変換器(1)と、該A/D変換器(1)の出力を
貯えるメモリ(2)と、該メモリ(2)に貯えられた信号の自
己相関値を算出する相関値計算部(3)と、該相関値計算
部(3)が自己相関値を算出する際の遅延時間を、前記A
/D変換器(1)のサンプリング周波数の情報によって決
定する相関範囲制御部(4)と、前記相関値計算部(3)から
出力される自己相関値の最大値を求めることによりピッ
チ周期を得るピッチ検出部(5)と、を備えたことを特徴
とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、実時間処理に適した音
声信号のピッチ周期抽出装置に関する。
【0002】
【従来の技術】半導体メモリなどに音声を記録する場合
やディジタル伝送系などで音声を伝送する場合には、音
声レベルを直接符号化するPCM方法のほか、記録側で
音声の特徴を表すパラメータ形式で分析して記録し、再
生側でそのパラメータから音声を合成する音声符号化方
法が最近注目されている。
【0003】斯かる音声の特徴を表すパラメータの1つ
にピッチ周期があり、このピッチ周期は一般的に声の高
さを表すものである。而して、そのピッチ周期を利用し
た符号化方法では、いかにピッチ周期を正確に求めるか
が再生音の品質を決定することになる。
【0004】また、このような音声符号化方法は電話の
形態と同一形態で使用されることから高い実時間性が要
求される。
【0005】従来では自己相関を用いたピッチ周期抽出
法がピッチ周期抽出の正確さ、及び処理時間の短さの両
者からみて、実時間に適した方法とされていた。斯かる
ピッチ周期抽出に自己相関を用いる場合、従来のように
自己相関値を求める際の遅延時間が予め固定されている
と、A/D変換器のサンプリング周波数が変化しても、
その遅延時間がピッチ周期の抽出に対して最適でなくな
ったり、処理量が増加したりするという問題点があっ
た。
【0006】また、自己相関を用いたピッチ周期抽出法
には、(1)信号は時間制限されていると仮定し、時間
長Tsの区間内だけに信号が存在し、その時間長Tsの区
間外では信号は常にゼロとして自己相関を求める短時間
自己相関を用いる方法(以下方法(1)と称する。)と、
(2)信号は時間制限されていないとして、時間長Tt
の区間と、ピッチの存在が想定される範囲で、その時間
長Ttの区間を遅延させた区間との自己相関を求める変
形短時間自己相関を用いる方法(以下方法(2)と称す
る)の2通りがあった。
【0007】方法(1)においては、ピッチ周期を正確に
抽出できるが、ピッチ周期を正確に抽出するためには少
なくともピッチ周期の2倍程度の時間長を信号の存在区
間と仮定する必要があり、従って処理時間が長くなる欠
点を有する。
【0008】一方、方法(2)においては自己相関を求め
る際の基準とする区間の時間長Ttはピッチ周期程度と
すればよいので、方法(1)に比べて自己相関を求めるの
に用いる時間長は少なくできるので処理時間は短い。し
かし、倍周期のピッチを抽出する場合が多く、方法(1)
に比べてピッチ周期抽出の正確さが劣っている。
【0009】いま、音声波形をディジタル音声データx
(n)で表すと、方法(1)による短時間自己相関値Rn
(k)は、
【0010】
【数1】
【0011】となり、方法(2)による変形短時間自己相
関値R’n(k)は、
【0012】
【数2】
【0013】となる。ここで、Nは方法(1)において信
号が存在すると仮定した時間区間、kは短時間自己相関
値Rn(k)、或るいは変形短時間自己相関値R’n(k)
を算出するときに音声波形を遅延させる際の遅延時間で
あり、N>Ts≫k、Tt≫kの関係にある。
【0014】数1及び数2から明らかなように方法(1)
では積和区間が遅延時間kの増加に伴って減少している
が、方法(2)では積和区間は遅延時間kに拘わらず不変
としていることがわかる。図8は横軸に遅延時間k(サ
ンプル)をとり、縦軸に自己相関値に対する重み付けの
比率をとり、方法(1)(信号があると仮定した時間区間を
200サンプルとした例)と方法(2)の重み付けの関係を
示した図である。方法(1)では結果的に、周期が長い自
己相関値ほど少ない重み付けがされていることになり、
方法(2)では周期に関係なく一様な重み付けがなされて
いることになる。方法(1)において正しいピッチ周期の
倍周期を誤ってピッチ周期とする割合が少ない理由は、
長い周期の自己相関値ほど少ない重み付けがされている
からである。
【0015】更に、ピッチ周期を正確に抽出するために
ピッチ周期の2倍程度の時間長が必要な理由は、ピッチ
周期が短い場合にはその自己相関値は極端に大きい重み
付けが為され、更にピッチ周期が長い場合にはその自己
相関値は極端に小さい重み付けが為されているので、ピ
ッチ周期が長い場合にその自己相関値がピッチ周期では
ない短い周期の自己相関値よりも小さくなることを防ぐ
ためである。
【0016】
【発明が解決しようとする課題】ピッチ周期抽出に自己
相関を用いる場合、自己相関値を算出する際の遅延時間
が予め固定されていると、A/D変換器のサンプリング
周波数が変化した場合、その遅延時間がピッチ周期の抽
出に対しては最適でなくなったり、処理量が増加したり
するという問題点があった。
【0017】また、ピッチ周期抽出に自己相関を用いる
場合、前記のように方法(1)を使うとピッチ周期を正確
に抽出するためには少なくともピッチ周期の2倍程度の
時間長を信号の存在区間と仮定する必要があり、従って
処理時間が長くなる欠点を有する。
【0018】一方、方法(2)を使うと処理時間は短い
が、倍周期のピッチを抽出する場合が多くピッチ周期抽
出の正確さが劣っているという問題点がある。
【0019】本発明は、このような問題点に鑑み為され
たものであり、短い処理時間で入力音声信号から正確に
ピッチ周期を抽出する音声信号のピッチ周期抽出装置を
提供することを目的とする。
【0020】
【課題を解決するための手段】本発明は、入力音声信号
をディジタル信号に変換するA/D変換器と、該A/D
変換器の出力を格納するメモリと、該メモリに格納され
たディジタル信号の自己相関値を算出する相関値計算部
と、該相関値計算部が自己相関値を算出する際の前記デ
ィジタル信号の遅延時間範囲を、前記A/D変換器のサ
ンプリング周波数の情報に従って決定する相関範囲制御
部と、前記相関値計算部から出力される自己相関値の最
大値を求めることにより、前記入力音声信号のピッチ周
期を得るピッチ検出部と、を備えたことを特徴とする。
【0021】また、本発明は、入力音声信号をディジタ
ル信号に変換するA/D変換器と、該A/D変換器の出
力を格納するメモリと、該メモリに格納されたディジタ
ル信号の自己相関値を算出する相関値計算部と、該相関
値計算部が自己相関値を算出する際の前記ディジタル信
号の遅延時間範囲を複数区間に分割する積和範囲制御部
と、前記相関値計算部から出力される自己相関値の最大
値を求めることにより、前記入力音声信号のピッチ周期
を得るピッチ検出部と、を備えたことを特徴とする。
【0022】更に本発明は、入力音声信号をディジタル
信号に変換するA/D変換器と、該A/D変換器の出力
を格納するメモリと、該メモリに格納されたディジタル
信号の自己相関値を算出する相関値計算部と、該相関値
計算部が自己相関値を算出する際の前記ディジタル信号
の遅延時間範囲を、前記A/D変換器のサンプリング周
波数の情報に従って決定する相関範囲制御部と、該相関
範囲制御部によって決定された遅延時間範囲を複数区間
に分割する積和範囲制御部と、前記相関値計算部から出
力される自己相関値の最大値を求めることにより、前記
入力音声信号のピッチ周期を得るピッチ検出部と、を備
えたことを特徴とする。
【0023】
【作用】本発明は上述の如き手段を具備することによっ
て、自己相関値を算出する際の遅延時間を、前記A/D
変換器のサンプリング周波数の情報に基づいて相関範囲
制御部によって設定することにより、遅延時間をピッチ
周期の抽出に対して最適にし、且つ処理量の増加を防ぐ
ことができる。
【0024】また、上述のように自己相関値を算出する
際の遅延時間範囲を、複数区間に分割する場合、該区間
をその始端値の2倍値を含まないように終端値を決定す
るので、斯かる区間内では倍数関係の周期成分を含まな
い。
【0025】従って、積和範囲制御部にて自己相関値を
算出する際の区間を決定することによって処理量の軽減
化を行うことができ、また自己相関値を区間毎によって
重み付けをすることができるので倍周期のピッチを抽出
することを防ぐことができる。
【0026】
【実施例】以下、本発明の音声信号のピッチ周期抽出装
置の一実施例を図1乃至図7に基づいて説明する。 <第1の実施例>図1は本発明の第1の実施例に係る音
声信号のピッチ周期抽出装置の概略ブロック図である。
【0027】図1においてアナログ音声信号x(t)はA
/D変換器1によりディジタル音声データx(n)に変換
され、このディジタル音声データx(n)はメモリ2に格
納される。次に、メモリ2に格納された信号x(n)の自
己相関値Rn(k)は相関値計算部3で求められるが、自
己相関値Rn(k)を求める際の遅延時間kはA/D変換
器1のサンプリング周波数fsの情報に従って相関範囲
制御部4によって決定される。そして、ピッチ検出部5
はディジタル音声データx(n)の自己相関値Rn(k)の
最大値を求め、その時の遅延時間kをアナログ音声信号
x(t)のピッチ周期Pとして出力する。
【0028】次に、本発明の特徴である相関範囲制御部
4の機能を説明する。
【0029】音声のピッチ周期は通常80〜400Hz
程度であり、この範囲において人間が発声する音声の殆
どをカバーすることができる。例えば、A/D変換器1
のサンプリング周波数fsが8kHzのときは、自己相
関値を算出する範囲、即ちピッチ探索区間である遅延時
間kは20≦k≦100サンプルに、またサンプリング
周波数fsが6kHzのときは遅延時間kは15≦k≦
75サンプルに設定されるものとする。尚、斯かるサン
プル数はfs/400〜fs/80によって算出したも
のである。
【0030】以下に、相関範囲制御部4を含めたピッチ
周期抽出装置における動作説明を図2のフローチャート
に基づいて説明する。
【0031】ステップS1では、A/D変換器1は、デ
ィジタル音声データx(n)をメモリ2に格納する際のサ
ンプリング周波数fs(本発明ではサンプリング周波数
fsを8kHz、6kHzの2種類の例を挙げてい
る。)を相関範囲制御部4に送出する。ステップS2に
おいては、サンプリング周波数fsが8kHzのときは
遅延時間kを20≦k≦100に、またサンプリング周
波数fsが6kHzのときは遅延時間kを15≦k≦7
5に設定する。
【0032】ステップS3では、メモリ2に格納されて
いるディジタル音声データx(n)を順次読み出し乍ら、
ステップS2にて設定された遅延時間kにしたがって、
その遅延時間kに該当する自己相関値を数3に従って算
出する。
【0033】
【数3】
【0034】即ちサンプリング周波数fsが8kHzの
ときは自己相関値Rn(20),Rn(21),・・・・・,Rn(9
9),Rn(100)を、一方サンプリング周波数fsが6k
Hzのときは自己相関値Rn(15),Rn(16),・・・・・,
Rn(74),Rn(75)を算出する。ステップS4では、ス
テップS3で算出された自己相関値Rn(k)のうち最大
値を求め、その時の遅延時間kを入力音声信号のピッチ
周期Pとして出力する。 <第2の実施例>図3は本発明の第2の実施例に係る音
声信号のピッチ周期抽出装置の概略ブロック図である。
【0035】図3が図1の構成と異なる点は、相関範囲
制御部4の代わりに積和範囲制御部6を設けたことであ
る。この積和範囲制御部6は、相関値計算部3にて自己
相関値Rn(k)を算出する際のピッチ探索区間である遅
延時間kの範囲を、複数区間に分割する場合、該区間の
終端値をその区間の始端値の2倍値を含まないように決
定する。而して、ピッチ検出部5が自己相関値Rn1
(k)乃至自己相関値Rn3(k)のうちの最大値を求め、
その時の遅延時間kを入力音声信号のピッチ周期Pとし
て出力する。
【0036】以下に、本発明の特徴である積和範囲制御
部6の機能を説明する。
【0037】まず、自己相関値Rn(k)を算出する際の
遅延時間kの範囲を上述の区間に分割する。例えば、上
述のように音声のピッチ周期を80〜400Hz、A/
D変換器1のサンプリング周波数fsを8kHzとする
と、ピッチ探索区間は20≦k≦100サンプルの範囲
とすればよく、第1区間としては20≦k<40サンプ
ルであり、また第2区間としては40≦k<80サンプ
ルであり、更に第3区間としては80≦k≦100サン
プルである。
【0038】一方、A/D変換器1のサンプリング周波
数fsを6kHzとすると、ピッチ探索区間は15≦k
≦75サンプルの範囲とすればよく、第1区間としては
15≦k<30サンプルであり、また第2区間としては
30≦k<60サンプルであり、更に第3区間としては
60≦k≦75サンプルである。
【0039】即ち、第1区間の自己相関値Rn1(k)
は、
【0040】
【数4】
【0041】また、第2区間の自己相関値Rn2(k)
は、
【0042】
【数5】
【0043】更に、第3区間の自己相関値Rn3(k)
は、
【0044】
【数6】
【0045】によって算出される。ここで、サンプリン
グ周波数fsが8kHzの場合には、T1≦N−39、
T2≦N−79、及びT3≦N−100であり、またサ
ンプリング周波数fsが6kHzの場合には、T1≦N
−29、T2≦N−59、及びT3≦N−75である。
【0046】以下に、積和範囲制御部6を含めたピッチ
周期抽出装置における動作説明を図4のフローチャート
に基づいて説明する。
【0047】ステップS10では、サンプリング周波数
fsが8kHzのときは遅延時間kを20≦k≦100
のうち、第1区間20≦k<40サンプル、第2区間4
0≦k<80サンプル、又は第3区間80≦k≦100
サンプルを選択する。一方、サンプリング周波数fsが
6kHzのときは遅延時間kを15≦k≦75のうち、
第1区間15≦k<30サンプル、第2区間30≦k<
60サンプル、又は第3区間60≦k≦75サンプルを
選択する。
【0048】ステップS11では、サンプリング周波数
fsが6kHzのときは遅延時間kを15≦k<30と
して、またサンプリング周波数fsが8kHzのときは
遅延時間kを20≦k<40として、数4に従って自己
相関値Rn1(k)を算出する。
【0049】ステップS12では、サンプリング周波数
fsが6kHzのときは遅延時間kを30≦k<60と
して、またサンプリング周波数fsが8kHzのときは
遅延時間kを40≦k<80として、数5に従って自己
相関値Rn2(k)を算出する。
【0050】ステップS13では、サンプリング周波数
fsが6kHzのときは遅延時間kを60≦k≦75と
して、またサンプリング周波数fsが8kHzのときは
遅延時間kを80≦k≦100として、数6に従って自
己相関値Rn3(k)を算出する。
【0051】ステップS14では、ステップS11乃至
ステップS13で算出された自己相関値Rn1(k)乃至
自己相関値Rn3(k)のうち最大値を求め、その時の遅
延時間kを入力音声信号のピッチ周期Pとして出力す
る。
【0052】本発明においては長い周期の自己相関値ほ
ど少ない重み付けをすることによって、正しいピッチ周
期の倍周期を誤ってピッチ周期とする認識割合が少なく
なり、正しいピッチ周期を抽出することができることに
着目したのである。
【0053】但し、従来の方法(1)のように各周期ごと
の自己相関値に異なった重み付けをしていない。これ
は、ピッチ周期を抽出する際に必要となるのは倍数関係
の周期成分相互間での大小判定であるからである。
【0054】従って、本発明のようにピッチ探索区間で
ある遅延時間範囲を区間毎に分割する場合、その区間の
始端値の2倍値を含まないように終端値を決定すれば、
夫々の区間内には倍数関係の周期成分は存在しないこと
になる。ここで、T1>T2>T3とすれば、結果的に
周期の長い自己相関値ほど少ない重み付けがされている
ことになり、正しいピッチ周期を求めることができる。
また、自己相関値を求める際の区間の終端値を各区間で
取り得る最大値に設定すれば、ピッチ周期の抽出の正確
さが増す。即ち、上述の例では、T1=N−39、T2
=N−79、T3=N−100とすれば正確さが増す。
【0055】図8と同様に、横軸に遅延時間(サンプル)
をとり、縦軸に自己相関値に対する重み付けの比率をと
り、本発明の重み付け(実線)と従来の方法(1)の重み付
け(破線)との関係を図5に示す。図5に示すように、倍
数関係の周期成分が含まれない各区間では一様な重み付
け、即ち、第1区間には(1)の重み付け、第2区間には
(2)の重み付け、第3区間には(3)の重み付けが結果的に
されていることになる。 <第3の実施例>ところで、図6はピッチ周期抽出装置
を実現するブロック図を示す。
【0056】図6が図1の構成と異なる点は、第2の実
施例で述べた積和範囲制御部6を設けたことである。こ
の積和範囲制御部6は、第2の実施例と同様な機能を有
している。従って、第3の実施例では図3のピッチ周期
抽出装置における動作説明を図7のフローチャートに基
づいて説明する。
【0057】ステップS20では、A/D変換器1は、
ディジタル音声データx(n)をメモリ2に格納する際の
サンプリング周波数fs(本発明ではサンプリング周波
数fsを8kHz、6kHzの2種類の例を挙げてい
る。)を相関範囲制御部4に送出する。
【0058】ステップS21では、サンプリング周波数
fsが8kHzのときは遅延時間kを20≦k≦100
のうち、第1区間20≦k<40サンプル、第2区間4
0≦k<80サンプル、又は第3区間80≦k≦100
サンプルを選択する。一方、サンプリング周波数fsが
6kHzのときは遅延時間kを15≦k≦75のうち、
第1区間15≦k<30サンプル、第2区間30≦k<
60サンプル、又は第3区間60≦k≦75サンプルを
選択する。
【0059】ステップS22では、サンプリング周波数
fsが6kHzのときは遅延時間kを15≦k<30と
して、またサンプリング周波数fsが8kHzのときは
遅延時間kを20≦k<40として、自己相関値Rn1
(k)を算出する。
【0060】ステップS23では、サンプリング周波数
fsが6kHzのときは遅延時間kを30≦k<60と
して、またサンプリング周波数fsが8kHzのときは
遅延時間kを40≦k<80として、自己相関値Rn2
(k)を算出する。
【0061】ステップS24では、サンプリング周波数
fsが6kHzのときは遅延時間kを60≦k≦75と
して、またサンプリング周波数fsが8kHzのときは
遅延時間kを80≦k≦100として、自己相関値Rn
3(k)を算出する。
【0062】ステップS25では、ステップS21乃至
ステップS24で算出された自己相関値Rn1(k)乃至
自己相関値Rn3(k)のうち最大値を求め、その時の遅
延時間kを入力音声信号のピッチ周期Pとして出力す
る。
【0063】尚、上述の実施例では、サンプリング周波
数fsを6kHz、8kHzに、また遅延時間kをサン
プリング周波数fsが6kHzの場合は15≦k≦75
に、一方サンプリング周波数fsが8kHzの場合は2
0≦k≦100に設定したがこれには限られない。
【0064】
【発明の効果】本発明に係るピッチ周期抽出装置によれ
ば、A/D変換器のサンプリング周波数が変化した場合
にも、自己相関値Rn(k)を算出する際の遅延時間kは
相関範囲制御部がA/D変換器のサンプリング周波数に
従って決定されるので、最適化される。
【0065】また、従来の方法(1)では、ピッチ周期が
短い場合にはその自己相関値Rn(k)は極端に大きい重
み付けがされていたので、正しいピッチ周期を正確に抽
出するためには少なくともピッチ周期の2倍程度の時間
長を信号の存在区間と仮定する必要があったが、本発明
に係るピッチ周期抽出装置によると、ピッチ周期が短い
場合でも極端に大きい重み付けをしていないので、自己
相関値Rn(k)を算出する際の時間長は、ピッチ周期の
2倍ほども必要はなくなる。
【0066】よって、自己相関値Rn(k)を算出する際
に必要なメモリ容量は小さくなり、また積和の計算回数
が大幅に減少するので処理量が軽減できる。さらに、時
間長をピッチ周期の2倍程度にすれば、ピッチ周期抽出
の正確さが増し、その時の処理量は従来と比べて軽減さ
れている。
【0067】また、従来の方法(2)では、倍周期のピッ
チを抽出する場合が多かったが、本発明に係るピッチ周
期抽出装置では、よりピッチ周期を正確に抽出すること
ができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る音声信号のピッチ
周期抽出装置の概略ブロック図である。
【図2】本発明の第1の実施例に係る音声信号のピッチ
周期抽出装置における動作説明を示すフローチャートで
ある。
【図3】本発明の第2の実施例に係る音声信号のピッチ
周期抽出装置の概略ブロック図である。
【図4】本発明の第2の実施例に係る音声信号のピッチ
周期抽出装置における動作説明を示すフローチャートで
ある。
【図5】本発明の音声信号のピッチ周期抽出装置におけ
るピッチ周期と自己相関値に対する重み付けの関係図で
ある。
【図6】本発明の第3の実施例に係る音声信号のピッチ
周期抽出装置の概略ブロック図である。
【図7】本発明の第3の実施例に係る音声信号のピッチ
周期抽出装置における動作説明を示すフローチャートで
ある。
【図8】従来のピッチ周期抽出装置におけるピッチ周期
と重み付けの関係図である。
【符号の説明】
1 ・・・ A/D変換器 2 ・・・ 自己相関値を算出するためのメモリ 3 ・・・ 相関値計算部 4 ・・・ 相関範囲制御部 5 ・・・ ピッチ検出部 6 ・・・ 積和範囲制御部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号をディジタル信号に変換す
    るA/D変換器と、該A/D変換器の出力を格納するメ
    モリと、該メモリに格納されたディジタル信号の自己相
    関値を算出する相関値計算部と、該相関値計算部が自己
    相関値を算出する際の前記ディジタル信号の遅延時間範
    囲を、前記A/D変換器のサンプリング周波数の情報に
    従って決定する相関範囲制御部と、前記相関値計算部か
    ら出力される自己相関値の最大値を求めることにより、
    前記入力音声信号のピッチ周期を得るピッチ検出部と、
    を備えたことを特徴とする音声信号のピッチ周期抽出装
    置。
  2. 【請求項2】 入力音声信号をディジタル信号に変換す
    るA/D変換器と、該A/D変換器の出力を格納するメ
    モリと、該メモリに格納されたディジタル信号の自己相
    関値を算出する相関値計算部と、該相関値計算部が自己
    相関値を算出する際の前記ディジタル信号の遅延時間範
    囲を複数区間に分割する積和範囲制御部と、前記相関値
    計算部から出力される自己相関値の最大値を求めること
    により、前記入力音声信号のピッチ周期を得るピッチ検
    出部と、を備えたことを特徴とする音声信号のピッチ周
    期抽出装置。
  3. 【請求項3】 入力音声信号をディジタル信号に変換す
    るA/D変換器と、該A/D変換器の出力を格納するメ
    モリと、該メモリに格納されたディジタル信号の自己相
    関値を算出する相関値計算部と、該相関値計算部が自己
    相関値を算出する際の前記ディジタル信号の遅延時間範
    囲を、前記A/D変換器のサンプリング周波数の情報に
    従って決定する相関範囲制御部と、該相関範囲制御部に
    よって決定された遅延時間範囲を複数区間に分割する積
    和範囲制御部と、前記相関値計算部から出力される自己
    相関値の最大値を求めることにより、前記入力音声信号
    のピッチ周期を得るピッチ検出部と、を備えたことを特
    徴とする音声信号のピッチ周期抽出装置。
  4. 【請求項4】 前記遅延時間範囲を複数区間に分割する
    場合、前記積和範囲制御部は、該区間毎の終端値をその
    区間の始端値の2倍値を含まないように決定することを
    特徴とする請求項2、又は3記載の音声信号のピッチ周
    期抽出装置。
  5. 【請求項5】 前記遅延時間範囲を複数区間に分割する
    場合、前記積和範囲制御部は、該区間毎の終端値をその
    区間の始端値の2倍値を含まないように決定すると共
    に、前記区間毎の終端値を各区間毎で取り得る最大値に
    設定することを特徴とする請求項2、3、又は4記載の
    音声信号のピッチ周期抽出装置。
JP10854494A 1994-05-23 1994-05-23 音声信号のピッチ周期抽出装置 Expired - Lifetime JP3402748B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP10854494A JP3402748B2 (ja) 1994-05-23 1994-05-23 音声信号のピッチ周期抽出装置
KR1019940022600A KR100323011B1 (ko) 1994-05-23 1994-09-08 음성신호의피치주기추출장치
US08/447,646 US5819209A (en) 1994-05-23 1995-05-23 Pitch period extracting apparatus of speech signal
US09/685,938 USRE38889E1 (en) 1994-05-23 2000-10-06 Pitch period extracting apparatus of speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10854494A JP3402748B2 (ja) 1994-05-23 1994-05-23 音声信号のピッチ周期抽出装置

Publications (2)

Publication Number Publication Date
JPH07319498A true JPH07319498A (ja) 1995-12-08
JP3402748B2 JP3402748B2 (ja) 2003-05-06

Family

ID=14487521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10854494A Expired - Lifetime JP3402748B2 (ja) 1994-05-23 1994-05-23 音声信号のピッチ周期抽出装置

Country Status (3)

Country Link
US (2) US5819209A (ja)
JP (1) JP3402748B2 (ja)
KR (1) KR100323011B1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050015244A1 (en) * 2003-07-14 2005-01-20 Hideki Kitao Speech section detection apparatus
KR100724736B1 (ko) 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
US8666734B2 (en) 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values
KR101883789B1 (ko) * 2013-07-18 2018-07-31 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483886A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58140798A (ja) * 1982-02-15 1983-08-20 株式会社日立製作所 音声ピツチ抽出方法

Also Published As

Publication number Publication date
USRE38889E1 (en) 2005-11-22
KR100323011B1 (ko) 2002-06-20
JP3402748B2 (ja) 2003-05-06
KR950034058A (ko) 1995-12-26
US5819209A (en) 1998-10-06

Similar Documents

Publication Publication Date Title
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
US6205420B1 (en) Method and device for instantly changing the speed of a speech
JPH0896514A (ja) オーディオ信号処理装置
US5148484A (en) Signal processing apparatus for separating voice and non-voice audio signals contained in a same mixed audio signal
US5488704A (en) Speech codec
US5293450A (en) Voice signal coding system
US20070011001A1 (en) Apparatus for predicting the spectral information of voice signals and a method therefor
EP1239458A2 (en) Voice recognition system, standard pattern preparation system and corresponding methods
EP0829851A2 (en) Voice speed converter
KR100366057B1 (ko) 인간 청각 모델을 이용한 효율적인 음성인식 장치
EP1436805B1 (en) 2-phase pitch detection method and appartus
US4845753A (en) Pitch detecting device
JP3311467B2 (ja) 音声認識システム
JPH10301594A (ja) 有音検出装置
JP2002049397A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP3555490B2 (ja) 声質変換システム
EP0984425A2 (en) Speech synthesizing method and apparatus
US20060077844A1 (en) Voice recording and playing equipment
KR100359988B1 (ko) 실시간 화속 변환 장치
US5793930A (en) Analogue signal coder
US6421637B1 (en) Pitch shifting apparatus and method
JPH04230799A (ja) 音声信号符号化装置
JP2000305581A (ja) 音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、音声信号の時間軸圧縮装置、音声信号の時間軸伸長装置、音声信号の時間軸圧縮伸長装置
JPH0117599B2 (ja)
JPH0519791A (ja) 雑音抑圧装置と雑音抑圧方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100228

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 10

EXPY Cancellation because of completion of term