JPH0690635B2 - Pitchiera-correction method - Google Patents
Pitchiera-correction methodInfo
- Publication number
- JPH0690635B2 JPH0690635B2 JP17205486A JP17205486A JPH0690635B2 JP H0690635 B2 JPH0690635 B2 JP H0690635B2 JP 17205486 A JP17205486 A JP 17205486A JP 17205486 A JP17205486 A JP 17205486A JP H0690635 B2 JPH0690635 B2 JP H0690635B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- pitch period
- frame
- value
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【発明の詳細な説明】 産業上の利用分野 本発明は音声合成・音声認識等の音声処理に用いること
のできる、ピッチエラー修正方法に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pitch error correction method that can be used for voice processing such as voice synthesis and voice recognition.
従来の技術 近年、コンピュータの発達と共に、音声合成・音声認識
等の音声処理技術の開発が急速に進められてきている。
なかでも、ピッチ周期抽出は音声処理を行う際には不可
欠な技術であり、それと共にピッチ周期のエラー修正も
より精度の高いものが求められている。2. Description of the Related Art In recent years, with the development of computers, the development of voice processing techniques such as voice synthesis and voice recognition has been rapidly advanced.
In particular, pitch cycle extraction is an indispensable technique when performing voice processing, and in addition, pitch cycle error correction is required to be more accurate.
以下図面を参照しなから、上述した従来のピッチ周期の
エラー修正方法の一例について説明する。第5図は従来
のピッチ周期のエラー修正方法を示すものである。An example of the conventional pitch period error correction method described above will be described below with reference to the drawings. FIG. 5 shows a conventional pitch period error correction method.
ピッチ周期は、倍、半分に誤ることがよくあり、第5図
に示すように、抽出したピッチ周期データの流れを見
て、前後フレームの値から大きくずれているときには、
前後の値または前後の値を補間した値に置き直して修正
するようにする。The pitch cycle is often doubled or halved, and as shown in FIG. 5, when the flow of the extracted pitch cycle data is seen, when it greatly deviates from the values of the preceding and following frames,
Replace the previous and next values or the previous and next values with interpolated values to correct them.
また、有声音と無声音の判断は全く経験的な識別関数を
使って判断しているので、音声データの声質によっては
誤ることがある。このために、無声音を有声音と誤った
場合、でたらめなピッチ周期が抽出されてしまうことに
なる。また、母音の“あ”、“い”を無声音と誤ること
がある。この修正は、音声波形をディスプレイし、人の
目で見て判断する。(例えば、中田和男・三瓶 徹共
編、「音声デバイス活用の実際」、オーム社)。Further, since the judgment of voiced sound and unvoiced sound is made by using a totally empirical discrimination function, it may be erroneous depending on the voice quality of voice data. Therefore, if the unvoiced sound is mistaken for the voiced sound, a random pitch period will be extracted. In addition, the vowel sounds "a" and "i" may be mistaken as unvoiced sounds. This modification displays the speech waveform and makes a visual judgment. (For example, edited by Kazuo Nakata and Toru Sanbe, “Actual Use of Voice Devices”, Ohmsha).
発明が解決しようとする問題点 しかしながら、上記のような方法は、音声合成のよう
な、あらかじめピッチ周期を抽出しておく処理では有効
であるが、ピッチ周期抽出結果をディスプレイして学習
機器に用いる場合には、学習者に誤った情報を与えてし
まうという問題点を有していた。Problems to be Solved by the Invention However, although the above method is effective in a process of extracting a pitch period in advance such as voice synthesis, the result of the pitch period extraction is displayed and used in a learning device. In this case, there is a problem that incorrect information is given to the learner.
本発明は上記問題点に鑑み、パソコンを用いた学習機器
でも簡単に処理できて、しかも精度の良いピッチエラー
修正方法を提供するものである。In view of the above problems, the present invention provides a pitch error correction method that can be easily processed by a learning device using a personal computer and that is accurate.
問題点を解決するための手段 上記問題点を解決するために本発明のピッチエラー修正
方法は、抽出されたピッチ周期を前後のピッチ周期と比
較する際に、あらかじめ定めたしきい値に基づいてエラ
ーが生じているか否かを判断し、エラーが生じていると
判断されたならば、前後のピッチ周期または0で置き換
えるようなピッチエラー修正を行うものである。Means for Solving the Problems In order to solve the above problems, the pitch error correction method of the present invention is based on a predetermined threshold value when comparing the extracted pitch period with the preceding and following pitch periods. Whether or not an error has occurred is determined, and if it is determined that an error has occurred, pitch error correction is performed such that it is replaced with the preceding and following pitch periods or 0.
作用 本発明は上記した方法によって、定量的にしかも簡単に
ピッチ周期のエラー修正を行うことができるので、パソ
コンでも簡単に短時間で処理することができる。Effect The present invention can quantitatively and easily correct the pitch period error by the above-described method, so that it can be easily processed by a personal computer in a short time.
実施例 以下本発明の一実施例のピッチエラー修正方法につい
て、図面を参照しながら説明す。Embodiment A pitch error correcting method according to an embodiment of the present invention will be described below with reference to the drawings.
第1図は本発明の一実施例におけるピッチエラー修正方
法を説明するためのピッチ抽出結果の一例を示すもので
ある。FIG. 1 shows an example of pitch extraction results for explaining a pitch error correction method in an embodiment of the present invention.
第2図は本発明の一実施例におけるピッチエラー修正方
法を説明するためのフローチャートを示すものである。FIG. 2 is a flow chart for explaining the pitch error correction method in the embodiment of the present invention.
本発明のピッチエラー修正方法について、以下第1図お
よび第2図を用いてその方法を説明する。The pitch error correction method of the present invention will be described below with reference to FIGS. 1 and 2.
ピッチ周期を抽出する1区間を1フレームとすると、第
1図において1フレームのピッチ周期は1ドットで表わ
される。4ドット以上すなわち4フレーム以上ピッチ周
期が抽出されているので、以下のピッチエラー修正を行
う。まず、あらかじめしきい値を定める。この値をcと
する。第1フレームのピッチ周期の値をp(1)、第2
フレームのピッチ周期の値をp(2)、第3フレームの
ピッチ周期の値をp(3)、第4フレームのピッチ周期
の値をp(4)とすると、(p(3)−p(4))の絶
対値を算出し、これをd(3)とする。d(3)>cで
あれば、p(3)をp(4)で置き換える。d(3)≦
cであれば、p(3)の値はそのままとする。さらに、
(p(2)−p(4))の絶対値を算出し、これをd
(2)とする。d(2)<cであれば、p(2)をp
(3)で置き換える。p(3)の値がすでに置き換えら
れていればその値を用いる。d(2)≦cであれば、p
(2)の値はそのままとする。最後に、(p(1)−p
(4))の絶対値を算出し、これをd(1)とする。d
(1)>cであれば、p(1)をp(2)で置き換え
る。p(2)の値がすでに置き換えられていればその値
を用いる。d(1)≦cであれば、p(1)の値はその
ままとする。これらの操作をピッチ周期が連続して4フ
レーム以上抽出されている区間すべてについて行う。Assuming that one section is one frame in which the pitch period is extracted, the pitch period of one frame is represented by one dot in FIG. Since the pitch period of 4 dots or more, that is, 4 frames or more is extracted, the following pitch error correction is performed. First, the threshold value is determined in advance. Let this value be c. The value of the pitch period of the first frame is p (1), the second
If the value of the pitch period of the frame is p (2), the value of the pitch period of the third frame is p (3), and the value of the pitch period of the fourth frame is p (4), then (p (3) -p ( The absolute value of 4)) is calculated, and this is designated as d (3). If d (3)> c, replace p (3) with p (4). d (3) ≦
If c, the value of p (3) is left unchanged. further,
The absolute value of (p (2) -p (4)) is calculated, and this is d
(2) If d (2) <c, p (2) is changed to p
Replace with (3). If the value of p (3) has already been replaced, that value is used. If d (2) ≦ c, then p
The value of (2) is left unchanged. Finally, (p (1) -p
The absolute value of (4)) is calculated, and this is designated as d (1). d
If (1)> c, p (1) is replaced with p (2). If the value of p (2) has already been replaced, that value is used. If d (1) ≦ c, the value of p (1) remains unchanged. These operations are performed for all sections in which the pitch cycle is continuously extracted for four frames or more.
以上のように本一実施例によれば、ピッチ周期の比較と
置き換えだけでエラー修正を行うので、処理が簡単で、
しかもエラーが生じやすい有声音の始まりについて修正
を行うので、非常に効果的である。As described above, according to the present embodiment, the error correction is performed only by comparing and replacing the pitch periods, so that the process is simple,
Moreover, it is very effective because it corrects the beginning of voiced sounds that are prone to errors.
以下本発明の第2の一実施例について図面を参照しなが
ら説明する。A second embodiment of the present invention will be described below with reference to the drawings.
第3図は本発明の第2の一実施例におけるピッチエラー
修正方法を説明するためのピッチ抽出結果の一例を示す
ものである。FIG. 3 shows an example of pitch extraction results for explaining the pitch error correction method in the second embodiment of the present invention.
第4図は本発明の第2の一実施例におけるピッチエラー
修正方法を説明するためのフローチャートを示すもので
ある。FIG. 4 is a flow chart for explaining the pitch error correction method in the second embodiment of the present invention.
本発明のピッチエラー修正方法について、以下第3図お
よび第4図を用いてその方法を説明する。The pitch error correction method of the present invention will be described below with reference to FIGS. 3 and 4.
第1の一実施例と同様にピッチ周期を抽出する1区間を
1フレームとすると、第3図において1フレームのピッ
チ周期は1ドットで表わされる。5ドット以上すなわち
5フレーム以上ピッチ周期が抽出されているので、以下
のピッチエラー修正を行う。最終フレームのピッチ周期
の値をp(n)、最終フレームより1フレーム前のピッ
チ周期の値をp(n−1)、最終フレームより2フレー
ム前のピッチ周期の値をp(n−2)とする。(p
(n)−p(n−1))の絶対値を算出し、これをd
(n)とし、(p(n−1)−p(n−2))の絶対値
を算出し、これをd(n−1)とし、d(n)−4*
(d(n−1)+1)の値を求め、この値が正であれば
p(n)を0とするようにする。これらの操作をピッチ
周期が連続して5フレーム以上抽出されている区間すべ
てについて行う。As in the case of the first embodiment, assuming that one section in which the pitch period is extracted is one frame, the pitch period of one frame is represented by one dot in FIG. Since the pitch period of 5 dots or more, that is, 5 frames or more is extracted, the following pitch error correction is performed. The value of the pitch period of the last frame is p (n), the value of the pitch period one frame before the last frame is p (n-1), and the value of the pitch period two frames before the last frame is p (n-2). And (P
The absolute value of (n) -p (n-1)) is calculated, and this is d
(N), the absolute value of (p (n-1) -p (n-2)) is calculated, and this is defined as d (n-1). D (n) -4 *
The value of (d (n-1) +1) is calculated, and if this value is positive, p (n) is set to 0. These operations are performed for all the intervals in which the pitch period is continuously extracted for 5 frames or more.
発明の効果 以上のように本発明は、音声波形より抽出したピッチ周
期の誤りを修正する際に、ピッチ周期を抽出する1区間
を1フレームとすると、ピッチ周期が連続して4フレー
ム以上抽出された場合に、第1フレームから第3フレー
ムまでのピッチ周期各々の値と、第4フレームのピッチ
周期との差の絶対値を各々算出し、上記各々のピッチ周
期差の絶対値をあらかじめ定めたしきい値と比較し、上
記ピッチ周期差の絶対値が上記しきい値より大きけれ
ば、ピッチ周期を修正することとし、第3フレームのピ
ッチ周期は第4フレームのピッチ周期で、第2フレーム
のピッチ周期は第3フレームのピッチ周期で、第1フレ
ームのピッチ周期は第2フレームのピッチ周期で置き換
えるようにしたこと、および、ピッチ周期が連続して5
フレーム以上抽出された場合に、最終フレームのピッチ
周期と上記最終フレームより1フレーム前のピッチ周期
の差の絶対値と、上記最終フレームより1フレーム前の
ピッチ周期と上記最終フレームより2フレーム前のピッ
チ周期との差の絶対値を各々算出し、上記各々のピッチ
周期差の絶対値をあらかじめ定めた式に代入し、計算結
果があらかじめ定めたしきい値より大きければ、最終フ
レームのピッチ周期を0とするようにしたこと、およ
び、抽出したピッチ周期の平均値を算出し、上記抽出し
たピッチ周期各々と上記ピッチ周期の平均値との差の絶
対値を算出し、上記ピッチ周期の差の絶対値があらかじ
め定めたしきい値より大きいピッチ周期があれば、上記
ピッチ周期を0とするようにしたことにより、定量的に
しかも簡単にピッチ周期のエラー修正を行うことができ
るので、パソコンでも簡単に短時間で処理することがで
きる。EFFECTS OF THE INVENTION As described above, according to the present invention, when correcting an error in the pitch cycle extracted from the speech waveform, if one section in which the pitch cycle is extracted is one frame, four or more pitch cycles are continuously extracted. In this case, the absolute value of the difference between each of the pitch periods from the first frame to the third frame and the pitch period of the fourth frame is calculated, and the absolute value of each pitch period difference is determined in advance. If the absolute value of the pitch period difference is larger than the threshold value as compared with the threshold value, the pitch period is corrected, and the pitch period of the third frame is the pitch period of the fourth frame, The pitch cycle is replaced with the pitch cycle of the third frame, the pitch cycle of the first frame is replaced with the pitch cycle of the second frame, and the pitch cycle is 5 consecutive times.
When more than one frame is extracted, the absolute value of the difference between the pitch period of the last frame and the pitch period of one frame before the last frame, the pitch period of one frame before the last frame, and the two frames before the last frame. Calculate the absolute value of the difference with the pitch period, substitute the absolute value of each of the above pitch period difference into a predetermined formula, and if the calculation result is larger than the predetermined threshold value, determine the pitch period of the final frame. The average value of the extracted pitch periods is calculated, and the absolute value of the difference between each of the extracted pitch periods and the average value of the pitch periods is calculated to obtain the difference between the pitch periods. If there is a pitch period whose absolute value is larger than a predetermined threshold value, the pitch period is set to 0, so that the pitch can be quantitatively and easily. Since it is possible to perform error correction of the period, it can be processed easily in a short period of time on a computer.
第1図は本発明の第1の一実施例におけるピッチエラー
修正方法を説明するためのピッチ抽出結果の一例を示す
説明図、第2図は本発明の第1の一実施例におけるピッ
チエラー修正方法を説明するためのフローチャート、第
3図は本発明の第2の一実施例におけるピッチエラー修
正方法を説明するためのピッチ抽出結果の一例を示す説
明図、第4図は本発明の第2の一実施例におけるピッチ
エラー修正方法を説明するためのフローチャート、第5
図は従来のピッチエラー修正方法を説明するための説明
図である。FIG. 1 is an explanatory view showing an example of a pitch extraction result for explaining a pitch error correction method in the first embodiment of the present invention, and FIG. 2 is a pitch error correction in the first embodiment of the present invention. FIG. 3 is a flow chart for explaining the method, FIG. 3 is an explanatory view showing an example of a pitch extraction result for explaining the pitch error correction method in the second embodiment of the present invention, and FIG. 4 is a second view of the present invention. 5 is a flowchart for explaining a pitch error correction method according to an embodiment of the present invention;
The figure is an explanatory view for explaining a conventional pitch error correction method.
Claims (3)
修正する方法であって、ピッチ周期を抽出する1区間を
1フレームとすると、ピッチ周期が連続して4フレーム
以上抽出された場合に用いる方法であって、第1フレー
ムから第3フレームまでのピッチ周期各々の値と、第4
フレームのピッチ周期との差の絶対値を各々算出し、上
記各々のピッチ周期差の絶対値をあらかじめ定めたしき
い値と比較し、上記ピッチ周期差の絶対値が上記しきい
値より大きければ、ピッチ周期を修正することとし、第
3フレームのピッチ周期は第4フレームのピッチ周期
で、第2フレームのピッチ周期は第3フレームのピッチ
周期で、第1フレームのピッチ周期は第2フレームのピ
ッチ周期で置き換えるようにしたことを特徴とするピッ
チエラー修正方法。1. A method for correcting an error in a pitch period extracted from a voice waveform, wherein when one section for extracting the pitch period is one frame, it is used when four or more consecutive pitch periods are extracted. A value of each pitch period from the first frame to the third frame;
The absolute value of the difference from the pitch period of the frame is calculated, and the absolute value of each of the pitch period differences is compared with a predetermined threshold value. If the absolute value of the pitch period difference is greater than the threshold value, , The pitch period of the third frame is the pitch period of the fourth frame, the pitch period of the second frame is the pitch period of the third frame, and the pitch period of the first frame is the pitch period of the second frame. A pitch error correction method characterized in that it is replaced with a pitch period.
された場合に用いる方法であって、最終フレームのピッ
チ周期と上記最終フレームより1フレーム前のピッチ周
期の差の絶対値と、上記最終フレームより1フレーム前
のピッチ周期と上記最終フレームより2フレーム前のピ
ッチ周期との差の絶対値を各々算出し、上記各々のピッ
チ周期差の絶対値をあらかじめ定めた式に代入し、計算
結果があらかじめ定めたしきい値より大きければ、ピッ
チ周期を修正する方法であって、最終フレームのピッチ
周期を0とするようにした特許請求の範囲第(1)項記
載のピッチエラー修正方法。2. A method used when the pitch period is continuously extracted by 5 frames or more, wherein the absolute value of the difference between the pitch period of the final frame and the pitch period of one frame before the final frame, and the final value. The absolute value of the difference between the pitch period one frame before the frame and the pitch period two frames before the last frame is calculated, and the absolute value of each pitch period difference is substituted into a predetermined formula to obtain the calculation result. Is larger than a predetermined threshold value, the method is a method of correcting the pitch period, wherein the pitch period of the final frame is set to 0. The pitch error correcting method according to claim (1).
るようにする方法であって、抽出したピッチ周期の平均
値を算出し、上記抽出したピッチ周期各々と上記ピッチ
周期の平均値との差の絶対値を算出し、上記ピッチ周期
の差の絶対値があらかじめ定めたしきい値より大きいピ
ッチ周期があれば、上記ピッチ周期を0とするようにし
た特許請求の範囲第(2)項記載のピッチエラー修正方
法。3. A method for adjusting the pitch period to a value within a certain difference from the average value, wherein an average value of the extracted pitch periods is calculated, and each of the extracted pitch periods and the average value of the pitch periods are calculated. The absolute value of the difference between the pitch period is calculated, and if there is a pitch period in which the absolute value of the difference between the pitch periods is larger than a predetermined threshold value, the pitch period is set to 0. ) The pitch error correction method described in section.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17205486A JPH0690635B2 (en) | 1986-07-22 | 1986-07-22 | Pitchiera-correction method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17205486A JPH0690635B2 (en) | 1986-07-22 | 1986-07-22 | Pitchiera-correction method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6327896A JPS6327896A (en) | 1988-02-05 |
JPH0690635B2 true JPH0690635B2 (en) | 1994-11-14 |
Family
ID=15934678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17205486A Expired - Fee Related JPH0690635B2 (en) | 1986-07-22 | 1986-07-22 | Pitchiera-correction method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0690635B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2734526B2 (en) * | 1988-06-16 | 1998-03-30 | ヤマハ株式会社 | Pitch extraction device |
KR100278825B1 (en) * | 1993-03-17 | 2001-01-15 | 깁슨 브라이언 씨., 필립 스코트 | Musical entertainment system |
-
1986
- 1986-07-22 JP JP17205486A patent/JPH0690635B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPS6327896A (en) | 1988-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8924216B2 (en) | System and method for synchronizing sound and manually transcribed text | |
EP0688010B1 (en) | Speech synthesis method and speech synthesizer | |
JPS58140798A (en) | Voice pitch extraction | |
JP3311460B2 (en) | Voice recognition device | |
JPH0690635B2 (en) | Pitchiera-correction method | |
CN110600010B (en) | Corpus extraction method and apparatus | |
Strik et al. | Averaging physiological signals with the use of a DTW algorithm | |
CN109817205B (en) | Text confirmation method and device based on semantic analysis and terminal equipment | |
JPS5936758B2 (en) | Voice recognition method | |
JPH05241596A (en) | Basic frequency extraction system for speech | |
JPS61184598A (en) | Pronounciation training apparatus | |
JPH0562357B2 (en) | ||
JPH01310400A (en) | Speech pitch extracting device | |
JPS62150395A (en) | Generation of fundamental frequency waveform for voice synthesization | |
JPS6113299A (en) | Fundamental frequency pattern corrector | |
JP2583854B2 (en) | Voiced / unvoiced judgment method | |
JPH0120439B2 (en) | ||
JPH0635494A (en) | Speech recognizing device | |
JPH02235098A (en) | Voice recognition device | |
CN113409630A (en) | English word recitation auxiliary method and system based on associated vocabulary generation | |
JPS59180597A (en) | Voice division system | |
JPS6039522A (en) | Word voice recognizing method | |
Zuk | An investigation of temporal decomposition of speech parameters for automatic segmentation of speech | |
Gregory et al. | Fundamental frequency characteristics of infant vocalisations: a study in voice quality | |
JPS6022199A (en) | Determination of amplitude parameter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |