JPS6220560B2 - - Google Patents
Info
- Publication number
- JPS6220560B2 JPS6220560B2 JP55031564A JP3156480A JPS6220560B2 JP S6220560 B2 JPS6220560 B2 JP S6220560B2 JP 55031564 A JP55031564 A JP 55031564A JP 3156480 A JP3156480 A JP 3156480A JP S6220560 B2 JPS6220560 B2 JP S6220560B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch period
- audio
- pitch
- interval
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
【発明の詳細な説明】
本発明は精度が高く、分析速度の速い音声分析
装置に関するものである。
装置に関するものである。
音声信号に含まれる冗長性を除去し、高能率符
号化する分析法に、線形予測係数の一種である偏
自己相関数(以後PARCOR係数と呼ぶ)を用い
るPARCOR分析法がある。この方法は音声研究
の分野では良く知られた方法であり、詳しい記述
は省略するが、PARCOR分析は、発声された音
声の声道伝達特性を表わす特徴パラメータを抽出
する。音声信号はこの声道伝達特性と音源パラメ
ータとからなるので、音源パラメータの抽出も同
時に行なわれる。一般的に行なわれる方法として
音声信号よりPARCOR係数を抽出した残りの信
号(以後残差信号と呼ぶ)の自己相関係数を求め
る。
号化する分析法に、線形予測係数の一種である偏
自己相関数(以後PARCOR係数と呼ぶ)を用い
るPARCOR分析法がある。この方法は音声研究
の分野では良く知られた方法であり、詳しい記述
は省略するが、PARCOR分析は、発声された音
声の声道伝達特性を表わす特徴パラメータを抽出
する。音声信号はこの声道伝達特性と音源パラメ
ータとからなるので、音源パラメータの抽出も同
時に行なわれる。一般的に行なわれる方法として
音声信号よりPARCOR係数を抽出した残りの信
号(以後残差信号と呼ぶ)の自己相関係数を求め
る。
自己相関係数は音声の基本周期(以後ピツチと
呼ぶ)の遅延時間以外では小さな値をとり、基本
周期に等しい遅延時間において顕著なピークを持
つ。このピーク値の大きさから声帯振動の有無が
分り、ピークの位置から基本周期・ピツチが得ら
れる。
呼ぶ)の遅延時間以外では小さな値をとり、基本
周期に等しい遅延時間において顕著なピークを持
つ。このピーク値の大きさから声帯振動の有無が
分り、ピークの位置から基本周期・ピツチが得ら
れる。
第1図に従来のPARCOR形音声分析系の構成
を示す図において、1は音声入力端子、2はA/
D変換器、3はPARCOR分析器、4は得られた
PARCOR係数、5は音源パラメータ分析器、6
は得られたピツチ信号、7はパワー信号、8は有
声・無声の識別信号、9は符号化器、10は符号
出力である。音声信号は、音声入力端子1から
A/D変換器2で標本化された後、PARCOR分
析器3で近接した標本値間の相関が逐次除去さ
れ、周波数軸上でほぼ平担なスペクトラムを持つ
残差信号となる。
を示す図において、1は音声入力端子、2はA/
D変換器、3はPARCOR分析器、4は得られた
PARCOR係数、5は音源パラメータ分析器、6
は得られたピツチ信号、7はパワー信号、8は有
声・無声の識別信号、9は符号化器、10は符号
出力である。音声信号は、音声入力端子1から
A/D変換器2で標本化された後、PARCOR分
析器3で近接した標本値間の相関が逐次除去さ
れ、周波数軸上でほぼ平担なスペクトラムを持つ
残差信号となる。
残差信号は音源パラメータ分析器5によつて分
析されたピツチ.パワー、有声・無声の情報が得
られる。第2図は音源パラメータ分析器の中のピ
ツチ抽出部の構成を示したものである。ピツチ抽
出部は波形の自己相関係数を求めるもので、11
が残差信号入力端子、12は遅延回路、13は切
り換えスイツチ、14は掛け算器、15は加算
器、16は遅延時間制御信号記憶部である。
析されたピツチ.パワー、有声・無声の情報が得
られる。第2図は音源パラメータ分析器の中のピ
ツチ抽出部の構成を示したものである。ピツチ抽
出部は波形の自己相関係数を求めるもので、11
が残差信号入力端子、12は遅延回路、13は切
り換えスイツチ、14は掛け算器、15は加算
器、16は遅延時間制御信号記憶部である。
第2図において、信号はτ時間遅れた信号と掛
け合わされて自己相関が計算され、加算器15で
順次加算される。同様な計算を遅延時間制御信号
記憶部16からの遅延時間信号を、切り換えスイ
ツチ13で切り換えながら、それぞれのτについ
て行なう。音声ピツチに等しい遅延時間になつた
時のみ加算器15の出力はピーク持つ。以上の様
にしてピツチが抽出される。
け合わされて自己相関が計算され、加算器15で
順次加算される。同様な計算を遅延時間制御信号
記憶部16からの遅延時間信号を、切り換えスイ
ツチ13で切り換えながら、それぞれのτについ
て行なう。音声ピツチに等しい遅延時間になつた
時のみ加算器15の出力はピーク持つ。以上の様
にしてピツチが抽出される。
一方、ピツチ周波数の存在範囲は、男女それぞ
れ 女性:130Hz〜500Hz 男性:66Hz〜200Hz であり、男女合わせて66Hz〜500Hzとなる。
れ 女性:130Hz〜500Hz 男性:66Hz〜200Hz であり、男女合わせて66Hz〜500Hzとなる。
ここで音声のサンプリング周波数を8KHzとし
たときピツチ周期の存在範囲としては16〜120と
なり、このデータが第2図の遅延時間制御信号記
憶部16に記憶され、前述の相関係数の演算が行
なわるが、しかし105回も必要となる。このこと
はPARCOR形音声分析装置の分析処理時間の短
縮に際し大きな障害となつている。
たときピツチ周期の存在範囲としては16〜120と
なり、このデータが第2図の遅延時間制御信号記
憶部16に記憶され、前述の相関係数の演算が行
なわるが、しかし105回も必要となる。このこと
はPARCOR形音声分析装置の分析処理時間の短
縮に際し大きな障害となつている。
本発明の目的は上記した従来技術の欠点をなく
し正確かつ速く、ピツチデータを抽出する音声ピ
ツチ周期検出装置を提供するにある。
し正確かつ速く、ピツチデータを抽出する音声ピ
ツチ周期検出装置を提供するにある。
音声波形を人間が見て、ピツチ周期を検出する
場合、ピークからピークまでの間隔又は零交差点
から零交差点までを測定してピツチ周期としてい
る。
場合、ピークからピークまでの間隔又は零交差点
から零交差点までを測定してピツチ周期としてい
る。
第3図に自然音声“あ”の一部を示す。図の波
形より分るようにこの音声の基本周期は図中a、
又はbの間隔と考えられる。本発明はa、又はb
を正確かつ速く検出するもので、その具体的実施
例を第4図に示す。図において第1図、第2図と
同符号の物は同一物を示す。17は音声記憶部、
18はピーク検出回路、19はカウンターであ
る。
形より分るようにこの音声の基本周期は図中a、
又はbの間隔と考えられる。本発明はa、又はb
を正確かつ速く検出するもので、その具体的実施
例を第4図に示す。図において第1図、第2図と
同符号の物は同一物を示す。17は音声記憶部、
18はピーク検出回路、19はカウンターであ
る。
動作の説明は第5図を用いて行なう。音声入力
端子1に第5図のアの部分からら音声が入つた場
合を考える。音声記憶部17は音成波形そのもの
を記憶する。一方ピーク検出回路18は各ピーク
点において1を出力しそれ以外の時は0を出力す
る。そしてカウンター19はピーク検出回路18
からの初めの1により、0にリセツトされ、そし
て続くピーク検出回路18からの1出力により、
そのときのカウンターの値を遅延時間制御信号記
憶部16に記憶させる。以上の動作により、遅延
時間制御信号記憶部16には〔イとカ、イとコ、
イとセ〕の間隔が記憶される。そして遅延回路1
2、掛け算器14、加算器15からなる相関器に
より上記3つの時間間隔について音声記憶部17
からの音声信号の自己相関が計算されその最大値
がピツチ周期として検出される。この場合はイと
セの間隔がピツチ周期となることは明らかであ
る。
端子1に第5図のアの部分からら音声が入つた場
合を考える。音声記憶部17は音成波形そのもの
を記憶する。一方ピーク検出回路18は各ピーク
点において1を出力しそれ以外の時は0を出力す
る。そしてカウンター19はピーク検出回路18
からの初めの1により、0にリセツトされ、そし
て続くピーク検出回路18からの1出力により、
そのときのカウンターの値を遅延時間制御信号記
憶部16に記憶させる。以上の動作により、遅延
時間制御信号記憶部16には〔イとカ、イとコ、
イとセ〕の間隔が記憶される。そして遅延回路1
2、掛け算器14、加算器15からなる相関器に
より上記3つの時間間隔について音声記憶部17
からの音声信号の自己相関が計算されその最大値
がピツチ周期として検出される。この場合はイと
セの間隔がピツチ周期となることは明らかであ
る。
以上正側のピーク点間隔をピツチ周期と考えて
たが負側のピーク点間隔をピツチ周期として考え
ることも出来、ピーク検出回路18を負側のピー
ク検出回路とすることにより第5図の場合には
〔エとク、エとシ、エとタ〕間隔が遅延時間制御
信号記憶部16に記憶され、それぞれについて相
関が計算され、ピツチ周期としてエとタの間隔が
選ばれるのは明らかである。
たが負側のピーク点間隔をピツチ周期として考え
ることも出来、ピーク検出回路18を負側のピー
ク検出回路とすることにより第5図の場合には
〔エとク、エとシ、エとタ〕間隔が遅延時間制御
信号記憶部16に記憶され、それぞれについて相
関が計算され、ピツチ周期としてエとタの間隔が
選ばれるのは明らかである。
また零交差点間隔をピツチ周期として考えるこ
とも出来〔アとオ、アとケ、アとス、アとチ〕又
は〔ウとキ、ウとサ、ウとソ〕がそれぞれ遅延時
間制御信号記憶部16に記憶されアとス又はウと
ソの間隔がピツチ周期として検出されることは明
らかである。ただしこの場合ピーク検出回路18
は、零交差検出回路に置き換える必要はある。
とも出来〔アとオ、アとケ、アとス、アとチ〕又
は〔ウとキ、ウとサ、ウとソ〕がそれぞれ遅延時
間制御信号記憶部16に記憶されアとス又はウと
ソの間隔がピツチ周期として検出されることは明
らかである。ただしこの場合ピーク検出回路18
は、零交差検出回路に置き換える必要はある。
本発明によれば従来ピツチ周期を検出するのに
105回の相関計算が必要であつたものが1/5〜1/20
に短縮することが出来る。また少ない候補の中か
ら選択するため誤まる確率も少なくなりより正確
なピツチ抽出が出来る。
105回の相関計算が必要であつたものが1/5〜1/20
に短縮することが出来る。また少ない候補の中か
ら選択するため誤まる確率も少なくなりより正確
なピツチ抽出が出来る。
第1図は従来のPARCOR型音声分析装置のブ
ロツク図、第2図は従来のピツチ周期抽出装置の
ブロツク図、第3図は自然音声の波形図、第4図
は本発明による音声ピツチ周期検出装置の実施例
を示すブロツク図、第5図は自然音声の波形図で
ある。 12……遅延回路、13……切換スイツチ、1
4……掛け算器、15……加算器、16……遅延
時間制御信号記憶部、17……音声記憶部、18
……ピーク検出回路、19……カウンタ。
ロツク図、第2図は従来のピツチ周期抽出装置の
ブロツク図、第3図は自然音声の波形図、第4図
は本発明による音声ピツチ周期検出装置の実施例
を示すブロツク図、第5図は自然音声の波形図で
ある。 12……遅延回路、13……切換スイツチ、1
4……掛け算器、15……加算器、16……遅延
時間制御信号記憶部、17……音声記憶部、18
……ピーク検出回路、19……カウンタ。
Claims (1)
- 【特許請求の範囲】 1 標本化された音声信号系列において、ピツチ
周期をτ区間離れた標本間の自己相関係数の最大
値又は差の絶対値の平均の最小値を与えるτとし
て抽出する音声分析装置において極大点間隔につ
いてのみ上記演算を行ない、ピツチ周期の抽出を
行なうことを特徴とする音声ピツチ周期検出装
置。 2 音声信号系の零交差点間隔についてのみ前述
の演算を行ない、ピツチ周期の抽出を行なうこと
を特徴とする特許請求の範囲第1項に記載された
音声ピツチ周期検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3156480A JPS56128999A (en) | 1980-03-14 | 1980-03-14 | Voice pitch period detector |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3156480A JPS56128999A (en) | 1980-03-14 | 1980-03-14 | Voice pitch period detector |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS56128999A JPS56128999A (en) | 1981-10-08 |
JPS6220560B2 true JPS6220560B2 (ja) | 1987-05-07 |
Family
ID=12334668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3156480A Granted JPS56128999A (en) | 1980-03-14 | 1980-03-14 | Voice pitch period detector |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS56128999A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5886600A (ja) * | 1981-11-18 | 1983-05-24 | リコーエレメックス株式会社 | 時間軸変換装置 |
JPS58109821A (ja) * | 1981-12-14 | 1983-06-30 | デ−ビツド・ジエイ・ワ−レンダ− | ピツチ測定装置及び方法 |
NL8400552A (nl) * | 1984-02-22 | 1985-09-16 | Philips Nv | Systeem voor het analyseren van menselijke spraak. |
JP5271771B2 (ja) * | 2009-03-30 | 2013-08-21 | 日本電産サンキョー株式会社 | 異音検査装置および異音検査方法 |
-
1980
- 1980-03-14 JP JP3156480A patent/JPS56128999A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS56128999A (en) | 1981-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4910784A (en) | Low cost speech recognition system and method | |
JPS597120B2 (ja) | 音声分析装置 | |
EP0112717A1 (en) | Continuous speech recognition apparatus | |
JPS6051720B2 (ja) | 音声の基本周期抽出装置 | |
CN101030374B (zh) | 基音周期提取方法及装置 | |
JPS6220560B2 (ja) | ||
US4477925A (en) | Clipped speech-linear predictive coding speech processor | |
KR20020005205A (ko) | 인간 청각 모델을 이용한 효율적인 음성인식 장치 | |
US4390747A (en) | Speech analyzer | |
JPS62229200A (ja) | ピツチ検出器 | |
JPH0122639B2 (ja) | ||
JPS6136240B2 (ja) | ||
JP2580768B2 (ja) | 音声認識装置 | |
JPS61252600A (ja) | Lsp型パタンマツチングボコ−ダ | |
JP2707577B2 (ja) | ホルマント抽出装置 | |
JP2577891B2 (ja) | 単語音声予備選択装置 | |
JPS5911920B2 (ja) | 音声波形自動切り出し装置 | |
JP2638829B2 (ja) | 音声ピッチ抽出装置 | |
JPS62194298A (ja) | ピツチ抽出方式 | |
JPH0448239B2 (ja) | ||
Shanmugam et al. | Development of Speech Controlled System | |
JPH0235993B2 (ja) | ||
JPH10177400A (ja) | 音声認識装置 | |
JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
JPS60238900A (ja) | 基本周波数パタン抽出方式 |