JP2534446Y2 - Apparatus for determining valid samples from digitized signals. - Google Patents

Apparatus for determining valid samples from digitized signals.

Info

Publication number
JP2534446Y2
JP2534446Y2 JP1995005132U JP513295U JP2534446Y2 JP 2534446 Y2 JP2534446 Y2 JP 2534446Y2 JP 1995005132 U JP1995005132 U JP 1995005132U JP 513295 U JP513295 U JP 513295U JP 2534446 Y2 JP2534446 Y2 JP 2534446Y2
Authority
JP
Japan
Prior art keywords
sample
samples
search
candidate
detector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1995005132U
Other languages
Japanese (ja)
Other versions
JPH081214U (en
Inventor
リン トムソン ディヴィッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH081214U publication Critical patent/JPH081214U/en
Application granted granted Critical
Publication of JP2534446Y2 publication Critical patent/JP2534446Y2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Abstract

Improved significant sample detection for a pitch detector for use with speech analysis and synthesis methods by performing a reverse order search and a forward order search of digitized speech samples. A reverse search detector (12) is responsive to segmented digital samples for determining a set of candidate samples by initially selecting one of the digitized samples as a present candidate sample and comparing in reverse order each of the digitized samples with the present candidate sample until a digitized sample is found whose amplitude is greater than the present candidate sample or the compared sample is greater than a predefined number of samples from the present candidate sample. When either of the previous conditions occurs, the compared digital sample becomes the new present candidate sample and the reverse search continues. During the reverse search, each of the compared samples that has not replaced the present candidate sample is set equal to zero. After the reverse search has been performed and a set of candidate samples has been determined, a forward search detector (14) then initially determines a present significant sample. The latter detector compares this significant sample with each of the candidate samples until a candidate sample is found whose amplitude is greater than the present significant sample or the compared candidate sample is more than a predefined number of samples away from the present significant sample. When either of those conditions occurs, the forward search detector saves the value of the amplitude and location of the candidate sample and replaces the present significant sample with that candidate sample and continues the search. A single forward and reverse search determines all of the significant samples.

Description

【考案の詳細な説明】[Detailed description of the invention]

【0001】[0001]

【産業上の利用分野】本考案は一般に人の音声信号をデ
ィジタル符号化して、コンパクトに格納、或いは伝送
し、更に合成することに関し、特にディジタル化音声信
号内の有効サンプルを決定してピッチ検出を行うことに
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention generally relates to digitally encoding a human voice signal, compactly storing or transmitting the signal, and further synthesizing the signal. Related to doing.

【0002】[0002]

【考案が解決しようとする問題】符号化した人の音声を
格納或いは伝送するのに必要な秒当りのビット数を、従
来のパルスコード変調法による音声の格納或いは伝送に
必要なビット数以下に低減させる人の音声符号化手法が
知られている。このようにビット数を最小にする符号化
手法を用いるために、アナログ音声サンプルは、最終的
に符号化する前に時間幅が20ミリ秒程度の時間フレー
ム或いはセグメントに分割されるのが普通である。通常
音声信号のサンプリングは8キロヘルツ(KHz)の速
度で行われ、また各々のサンプルは多重ビットディジタ
ル数に符号化される。更に、逐次符号化サンプルは線形
予測符号化器(LPC)で処理されるが、この符号化器
は声道伝達関数のフォルマント構造を模擬する適切なフ
ィルタパラメータを決定するものである。これ等のフィ
ルタパラメータを用いて、予め選択された数の以前のサ
ンプル値の重みづけに基づいて各信号サンプルの現在値
を有効に評価することができる。
SUMMARY OF THE INVENTION The number of bits per second required to store or transmit coded human speech is less than the number of bits required to store or transmit voice using conventional pulse code modulation. Known human speech coding techniques are known. In order to use such a coding method that minimizes the number of bits, an analog audio sample is usually divided into time frames or segments each having a time width of about 20 ms before final encoding. is there. Normally, the sampling of the audio signal is performed at a rate of 8 kilohertz (KHz), and each sample is encoded into a multi-bit digital number. Further, the successively encoded samples are processed by a linear predictive coder (LPC), which determines appropriate filter parameters that simulate the formant structure of the vocal tract transfer function. Using these filter parameters, the current value of each signal sample can be effectively evaluated based on the weighting of a preselected number of previous sample values.

【0003】上記音声信号は、解析の結果、励起信号と
フォルマント伝達関数からなるものと見做される。この
励起成分は喉頭部(larynx or voice
box)に発生し、またフォルマント伝達関数は声道の
残部の励起成分に対する動作から生じる。後者の成分は
更に、声帯により気流に伝えられた基本周波数が存在す
るか否かに従って有声或いは無声と分類される。その励
起が無声の場合は励起成分は単にホワイトノイズを与え
るにすぎない。一方、声帯により気流に伝えられた基本
周波数が存在する時は、この励起成分は有声と分類され
る。ピッチ検出、即ちキーパラメータである有声励起成
分の基本周波数を決定する問題は最小量の計算では実施
が困難である。
[0003] As a result of analysis, the voice signal is considered to be composed of an excitation signal and a formant transfer function. The excited component is a larynx or voice
box), and the formant transfer function results from the action on the excited components of the rest of the vocal tract. The latter component is further classified as voiced or unvoiced according to whether there is a fundamental frequency transmitted to the airflow by the vocal cords. If the excitation is unvoiced, the excitation component simply gives white noise. On the other hand, when there is a fundamental frequency transmitted to the airflow by the vocal cords, this excitation component is classified as voiced. The pitch detection, that is, the problem of determining the fundamental frequency of the voiced excitation component, which is a key parameter, is difficult to implement with a minimum amount of calculation.

【0004】米国特許第4,561,102号にはこの
ピッチを定める1つの方法が示してある。この特許で用
いられている方法は音声フレーム内に有効サンプルの組
を配置するもので、初めに、最大サンプルが見出される
まで全てのサンプルを走査し、次に2番目に大きなサン
プルが見出されるまでサンプルの探索を反復するように
構成されている。このプロセスは、予め定められた数の
サンプルが音声フレーム内に見出されるまで続行され
る。この手法は、実施されなければならない走査数が見
出されるべきサンプル数の二乗に比例するということを
必要とするものである。
US Pat. No. 4,561,102 shows one way to determine this pitch. The method used in this patent places a set of valid samples within a speech frame, first scanning all samples until the largest sample is found, and then scanning until the second largest sample is found. It is configured to iterate the search for samples. This process continues until a predetermined number of samples are found in the audio frame. This approach requires that the number of scans that must be performed is proportional to the square of the number of samples to be found.

【0005】しかしながら、この方法は、極度に特に多
くのサンプルを見出そうとする場合は時間がかかるとい
う欠点がある。この方法は、或る種の複雑でない符号化
方式に対してはディジタルシグナルプロセッサ(DS
P)で実施できるが、符号化方式が更に複雑になると、
この種のシグナルプロセッサでは上記のような特定の探
索法をフレーム毎に適用すると計算能力が不足するとい
う問題がある。
[0005] However, this method has the disadvantage that it takes a long time to find extremely many samples. This method uses a digital signal processor (DS) for some uncomplicated coding schemes.
P), but when the encoding method becomes more complicated,
In this type of signal processor, there is a problem that if the above-described specific search method is applied to each frame, the calculation capability is insufficient.

【0006】本考案は、かかる従来の技術の欠点を解決
することを目的とする。
An object of the present invention is to solve the disadvantages of the prior art.

【0007】[0007]

【問題点を解決するための手段】このため本考案による
装置は、音声信号に応じてこの信号内の有効サンプルを
決定する逆順序探索検出器および正順序探索検出器を利
用する如く構成される。
SUMMARY OF THE INVENTION To this end, an apparatus according to the present invention is configured to utilize an inverse order search detector and a forward order search detector to determine valid samples in a speech signal in response to the signal. .

【0008】上記逆順序探索検出器はディジタル化音声
信号のセグメントに応答して、候補サンプルの組を決定
するもので、これは、先ずディジタル化サンプルの1つ
を現在の候補サンプルとして選択し、次に、振幅が現在
の候補サンプルのものより大きくなるようなディジタル
化サンプルを見出すまでディジタル化サンプルの各々を
現在の候補サンプルと逆の順序で比較することにより、
或いはこの比較されたサンプルが現在の候補サンプルか
ら所定のサンプル数より大きくなるまで上記の比較を行
うことによりなされる。以前の状態のいずれかが生じる
と、比較されたサンプルは新しい現在の候補サンプルに
なり、そして逆の探索が続行される。この逆探索中に、
現在の候補サンプルになっていない比較サンプルの各々
はゼロに等しくセットされる。
The inverse search detector determines a set of candidate samples in response to a segment of the digitized speech signal, which first selects one of the digitized samples as a current candidate sample, Next, by comparing each digitized sample in reverse order with the current candidate sample until finding a digitized sample whose amplitude is greater than that of the current candidate sample,
Alternatively, the comparison is performed until the compared sample is larger than a predetermined number of samples from the current candidate sample. If any of the previous conditions occur, the compared sample becomes the new current candidate sample, and the reverse search continues. During this reverse search,
Each of the comparison samples that are not current candidate samples is set equal to zero.

【0009】このように逆順序探索が実施され、1組の
候補サンプルが決定されると、次に正順序探索検出器が
これ等の候補サンプルから現在の有効サンプルを先ず決
定する。この後者の検出器は、振幅が現在の有効サンプ
ルより大きい候補サンプルが見出されるまで、現在の有
効サンプルを候補サンプルの各々と比較し、或いはこの
比較は、比較された候補サンプルが現在の有効サンプル
から予め決定されたサンプル数より大きくなるまで実施
される。これ等の状態のいずれかが生じると、正順序探
索検出器は候補サンプルの振幅と位置の値を移動し、そ
して現在の有効サンプルを上記候補サンプルに代替し、
探索を継続する。
[0009] Once the reverse order search has been performed and a set of candidate samples has been determined, then the forward search detector first determines the current valid sample from these candidate samples. This latter detector compares the current valid sample to each of the candidate samples until a candidate sample whose amplitude is greater than the current valid sample is found, or the comparison is made by comparing the compared candidate sample to the current valid sample. Until the number of samples exceeds a predetermined number of samples. When any of these conditions occur, the forward search detector shifts the amplitude and position values of the candidate sample, and replaces the current valid sample with the candidate sample,
Continue searching.

【0010】[0010]

【実施例】図1は本考案の特徴をなす最大ロケータを例
示したものである。この最大ロケータは、経路11を介
して受けたアナログ音声信号を代表するディジタルサン
プルのフレームに応答して、有効サンプルを決定するも
のである。これ等の音声フレームは次のように前処理さ
れる。雑音を減らすために、上記音声は初めに低減漏波
され、すなわちローパスフィルタをかけられ、次にディ
ジタル化され、量子化される。このディジタル化音声が
次に、20ミリ秒フレームに分割され、各フレームは、
例えば、160サンプルから構成されている。更に、当
業者には明らかなように、最大ロケータは、ピッチの決
定に利用できるアナログ音声信号から得られる他の形の
信号に応答することができる。このような1つの信号
は、LPC係数の計算時に得られる正順序予測誤差或い
は残留信号である。
FIG. 1 illustrates a maximum locator which is a feature of the present invention. The maximum locator determines valid samples in response to a frame of digital samples representative of the analog audio signal received via path 11. These audio frames are preprocessed as follows. To reduce noise, the speech is first reduced-leaked, ie, low-pass filtered, and then digitized and quantized. This digitized speech is then divided into 20 ms frames, each frame
For example, it is composed of 160 samples. Further, as will be apparent to those skilled in the art, the maximum locator can respond to other forms of signal derived from the analog audio signal that can be used to determine pitch. One such signal is a normal order prediction error or a residual signal obtained when calculating the LPC coefficient.

【0011】ここで、図1の最大ロケータ10の動作を
詳細に説明する。このロケータは、図2に示した音声フ
レームのサンプルに応答して、図4に示した経路17に
出力信号を与える。逆順序探索検出器12は図2に示し
たサンプルを検出する。図には160サンプルのサブセ
ットだけが示してある。検出器12はサンプル159か
ら始めて、次の動作を行いながら右から左に探索する。
検出器12はサンプル159を現在の候補サンプルと想
定してその値を格納する。次にこの検出器12は、現在
の候補サンプルより大きな振幅を持つ他のサンプル或い
は調査される現在の候補サンプルから19番目のサンプ
ルである他のサンプルに出会うまで、各サンプルを左に
調べて行く。もし振幅の大きなサンプルに遭遇すると、
或いは調査されたサンプルの数が現在の候補サンプルか
ら19サンプルに等しくなると、検出器12はそのサン
プルを新しい候補サンプルとして格納し、そして前回の
探索手順を反復する。19サンプルを得た後探索を終了
し、新しい探索を開始する基礎は、人の音声で得られる
最高のピッチが、8KHzのサンプル速度で19サンプ
ルをもたらす約420Hzであるという仮定による。検
出器12が各サンプルを調査する時、もしそのサンプル
が現在の候補サンプル以下で、現在の候補サンプルの1
8サンプル内にある場合は調査中のサンプルはゼロにセ
ットされる。
Here, the operation of the maximum locator 10 of FIG. 1 will be described in detail. This locator provides an output signal on path 17 shown in FIG. 4 in response to the audio frame samples shown in FIG. The reverse order search detector 12 detects the sample shown in FIG. Only a subset of the 160 samples is shown in the figure. Detector 12 starts at sample 159 and searches from right to left, performing the following operations.
Detector 12 assumes sample 159 as the current candidate sample and stores its value. The detector 12 then examines each sample to the left until it encounters another sample with an amplitude greater than the current candidate sample or another sample which is the nineteenth sample from the current candidate sample being examined. . If you encounter a sample with large amplitude,
Alternatively, when the number of examined samples equals 19 from the current candidate sample, detector 12 stores the sample as a new candidate sample and repeats the previous search procedure. The basis for terminating the search after obtaining 19 samples and starting a new search is based on the assumption that the highest pitch obtained with human speech is about 420 Hz, which yields 19 samples at a sample rate of 8 KHz. As the detector 12 examines each sample, if that sample is less than or equal to the current candidate sample and one of the current candidate samples
If so, the sample under investigation is set to zero.

【0012】ここで検出器12が図2に示したサンプル
を処理して図3に示したサンプルを生成する方法につい
て説明する。検出器12はサンプル159から始めて、
各々の引き続くサンプルを調べながら左に進行する。例
えば、サンプル158は159より小さく、そこでサン
プル158はゼロに等しくセットされる。検出器12は
がサンプル152に遭遇すると、検出器12は、このサ
ンプルの振幅がサンプル159のものより大きいと判断
する。次にこの検出器は、現在の候補サンプルとしてサ
ンプル152を用いて探索手順を再初期化する。次にこ
の探索は、サンプル133に到るまでサンプル152か
ら進行する。サンプル133はサンプル152から19
サンプル先なので、サンプル133が現在の候補サンプ
ルとして利用され、探索は左に進行する。図3には、左
に探索を進め、上記探索手順を満足しないサンプルをゼ
ロにする検出器12の結果が示してある。
Here, a method in which the detector 12 processes the sample shown in FIG. 2 to generate the sample shown in FIG. 3 will be described. Detector 12 starts with sample 159,
Proceed to the left while examining each successive sample. For example, sample 158 is smaller than 159, where sample 158 is set equal to zero. When detector 12 encounters sample 152, detector 12 determines that the amplitude of this sample is greater than that of sample 159. The detector then re-initializes the search procedure using sample 152 as the current candidate sample. The search then proceeds from sample 152 until it reaches sample 133. Sample 133 is from samples 152 to 19
Since it is the sample destination, sample 133 is used as the current candidate sample, and the search proceeds to the left. FIG. 3 shows the result of the detector 12 that advances the search to the left and zeros out samples that do not satisfy the above search procedure.

【0013】正順序探索検出器14は逆順序探索検出器
12の出力を検出して、左から右に次の探索手順を実施
する。検出器14は、サンプル0から始めて、現在の有
効サンプルとしてサンプル0を使用し、現在の有効サン
プルより大きなサンプルが得られるまで、或いは現在の
有効サンプルから数において18より大きいサンプルが
調査されるまで逆順序探索検出器12から受けたサンプ
ルの各々を探索する。もし調査したサンプルが既に言及
した基準の1つを満足しない時は、これはゼロにセット
される。サンプルがこの基準を満足する時は、サンプル
の振幅と位置が格納され、このサンプルは新しい現在の
有効サンプルになる。
The forward search detector 14 detects the output of the reverse search detector 12 and performs the following search procedure from left to right. Detector 14 starts at sample 0 and uses sample 0 as the current valid sample, until a sample larger than the current valid sample is obtained, or until a sample greater than 18 in number from the current valid sample is examined. Each of the samples received from the inverse search detector 12 is searched. This is set to zero if the sample examined does not satisfy one of the criteria already mentioned. When a sample satisfies this criterion, the amplitude and position of the sample are stored, and this sample becomes the new current valid sample.

【0014】ここで図3に示したサンプルに対する検出
器14の応答について説明する。検出器14はサンプル
0から始めて、サンプル18である18サンプルを越え
るまで探索する。サンプル19は現在の有効サンプルと
して記録される。検出器14がサンプル104から探索
する時は、サンプル104より大きなサンプルは得られ
ず、サンプル123が現在の有効サンプルとされ、探索
はサンプル123から進められる。図4には、正順序探
索検出器14の結果が示してある。ここでゼロ値を持っ
た若干のサンプルはそれにもかかわらず有効サンプルと
して示されるが、図4には示してない点に注目された
い。これ等のゼロサンプルは後にしきい値検出器16に
より排除される。
Here, the response of the detector 14 to the sample shown in FIG. 3 will be described. Detector 14 starts at sample 0 and searches until it exceeds sample 18, which is 18 samples. Sample 19 is recorded as the current valid sample. When detector 14 searches from sample 104, no sample larger than sample 104 is obtained, sample 123 is made the current valid sample, and the search proceeds from sample 123. FIG. 4 shows the result of the forward search detector 14. Note that some samples with zero values here are nonetheless shown as valid samples, but not shown in FIG. These zero samples are later rejected by the threshold detector 16.

【0015】即ち、検出器16は図4に示したサンプル
を検知して、最大サンプルの振幅の25パーセントより
大きくない全てのサンプルを排除する。このしきい値検
出器16は先ず最大サンプル振幅を決定し、次に振幅が
この最大振幅の25パーセントを越えない全てのサンプ
ルを排除する。
That is, detector 16 detects the samples shown in FIG. 4 and rejects all samples that are not greater than 25 percent of the maximum sample amplitude. The threshold detector 16 first determines the maximum sample amplitude, and then rejects all samples whose amplitude does not exceed 25 percent of this maximum amplitude.

【0016】図5には、ディジタルシグナルプロセッサ
を制御して、検出器12、14、16の機能を果たすの
に用いられるプログラムのフローチャートが示してあ
る。図6にはこのようなディジタルシグナルプロセッサ
システムが示してある。図6に示したシステムは更に、
ローパスフィルタ並びにD/A変換の必要なタスクを実
行する。更に、このシステムは、変換器612から受け
たディジタルサンプルのフレームへのセグメント化を実
行する公知のプログラムを与える。ディジタルシグナル
プロセッサ601 PROM602とRAM603を使
用して上記各種の機能を実施する。PROM602に格
納されたプログラムは図5に示したフローチャートを実
行する。
FIG. 5 shows a flowchart of a program used to control the digital signal processor to perform the functions of the detectors 12, 14, 16. FIG. 6 shows such a digital signal processor system. The system shown in FIG.
Performs tasks that require low pass filters and D / A conversion. Further, the system provides a known program for performing the segmentation of the digital samples received from converter 612 into frames. The digital signal processor 601 performs various functions described above using the PROM 602 and the RAM 603. The program stored in the PROM 602 executes the flowchart shown in FIG.

【0017】ここで、図5に示したプログラムを詳細に
説明する。ブロック501〜507は逆順序探索検出器
12を実行する。ブロック501とは502は2つのイ
ンデックスjとiのセットアップのために用いられる。
定数Lは、本実施例では160サンプルであるサンプル
の数に等しくセットされる。次に、プログラムは、サン
プル全ての調査が終了するまでブロック503〜507
を巡回するように進行する。これ等のサンプルはγで示
したアレイ内に含まれる。判定ブロック504は、調査
中の現在のサンプルの振幅が現在の候補サンプルの振幅
より小さく、18サンプルの領域を越えているかどうか
の判定を行う。これ等の条件が共に満足されると、調査
中の現在のサンプルをゼロにセットするブロック503
が実行される。調査中の現在のサンプルが現在の候補サ
ンプル以上か、或いは18サンプルの範囲を越えた時
は、現在のサンプルが新しい現在のサンプルになる。ブ
ロック506は全てのサンプルを通して巡回するために
用いられるインデックスを単に減分し、また判定ブロッ
ク507は、全てのサンプルが調査されたか否かを判定
する。
Here, the program shown in FIG. 5 will be described in detail. Blocks 501-507 implement the inverse search detector 12. Blocks 501 and 502 are used for setting up two indices j and i.
The constant L is set equal to the number of samples, which in this embodiment is 160 samples. Next, the program executes blocks 503-507 until all samples have been examined.
Proceed to go around. These samples are contained in the array denoted by γ. The decision block 504 determines whether the amplitude of the current sample under investigation is smaller than the amplitude of the current candidate sample and exceeds the area of 18 samples. If both of these conditions are met, block 503 sets the current sample under investigation to zero.
Is executed. If the current sample under investigation is greater than or equal to the current candidate sample, or exceeds the range of 18 samples, the current sample becomes the new current sample. Block 506 simply decrements the index used to cycle through all samples, and decision block 507 determines whether all samples have been examined.

【0018】ブロック508〜515は正順序探索検出
器14を実行する。この検出器は有効サンプルを決定
し、アレイa内のサンプルの振幅とアレイd内のサンプ
ルの位置を格納し、これ等の両アレイはnによりインデ
ックスされる。ブロック508、509、510はイン
デックスの初期値をセットアップする。判定ブロック5
11は、現在調査しているサンプルが現在の有効サンプ
ルより大きいか、或いは現在の有効サンプルからのサン
プルの範囲が18サンプルより大きいかどうかを決定す
る。もしこれ等の条件のいずれかが真の場合は、ブロッ
ク512が実行され、現在調査中のサンプルに等しくな
された新しい現在の有効サンプルをもたらし、そしてこ
のサンプルをアレイaとd内に配置する。最後に、ブロ
ック512はインデックスnを増分する。これ等の条件
が満足されない時は、調査中のサンプルをゼロにするブ
ロック513が実行される。ブロック514はインデッ
クスiを増分する。判定ブロック515は、サンプルの
全てが調査されたか否かを決定する。
Blocks 508-515 implement the forward search detector 14. This detector determines the valid sample and stores the amplitude of the sample in array a and the position of the sample in array d, both of which are indexed by n. Blocks 508, 509, 510 set up the initial value of the index. Decision block 5
11 determines whether the sample currently being investigated is greater than the current valid sample, or whether the range of samples from the current valid sample is greater than 18 samples. If any of these conditions are true, block 512 is executed, resulting in a new current valid sample made equal to the sample currently being examined, and placing this sample in arrays a and d. Finally, block 512 increments index n. If these conditions are not met, block 513 is executed to zero the sample under investigation. Block 514 increments index i. Decision block 515 determines whether all of the samples have been examined.

【0019】以上に説明した実施例は本考案の原理を単
に例示するものであり、本考案の精神と範囲から逸脱せ
ずにその他の構成が可能なことは当業者には明らかであ
ろう。
The embodiments described above are merely illustrative of the principles of the present invention, and it will be apparent to those skilled in the art that other configurations are possible without departing from the spirit and scope of the present invention.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本考案による最大ロケータの概略図FIG. 1 is a schematic diagram of a maximum locator according to the present invention.

【図2】入力ディジタル化音声信号の図式FIG. 2 is a diagram of an input digitized audio signal.

【図3】図1の逆探索検出器により処理された後の音声
信号の図式
FIG. 3 is a diagram of an audio signal after being processed by the inverse search detector of FIG. 1;

【図4】図3の順方向探索検出器により処理された後の
図3のサンプルの図式
FIG. 4 is a diagram of the sample of FIG. 3 after being processed by the forward search detector of FIG. 3;

【図5】図1の最大ロケータを実行するプログラムのフ
ローチャート
FIG. 5 is a flowchart of a program for executing the maximum locator of FIG. 1;

【図6】図1のディジタル信号プロセッサの概略図であ
る。
FIG. 6 is a schematic diagram of the digital signal processor of FIG. 1;

【符号の説明】[Explanation of symbols]

12 逆順序探索検出器 14 正順序探索検出器 16 しきい値検出器 601 ディジタルシグナルプロセッサ 612 A−D変換器 12 reverse order search detector 14 forward order search detector 16 threshold value detector 601 digital signal processor 612 A / D converter

Claims (4)

(57)【実用新案登録請求の範囲】(57) [Scope of request for utility model registration] 【請求項1】 複数の入力スピーチセグメントであっ
て、各々がゼロでない複数のサンプルを有するスピーチ
からなるデジタル化されたスピーチ信号に応答して、潜
在的なピッチパルスであるデジタル化されたスピーチ信
号から重要なサンプルのセットを決定し、該セットのサ
ンプルは、最大の大きさのものであり、また人間のスピ
ーチにおいて遭遇する最も高いピッチとほぼ等しい、少
なくとも所定の時間間隔で該セットにおいて他のサンプ
ルから離れるようなものであるマキシマロケータにおい
て、 前記入力スピーチセグメントの一つのサンプルを逆方向
に探索し、この探索において遭遇した第1のサンプルと
以下の基準を満足する他のサンプルとを選定する第1の
探索器(12)であって、 サンプルの大きさが最近選定されたサンプルよりも大き
い場合、そのサンプルを選定し、 最近選定されたサンプルから所定間隔だけ離れている場
合、そのサンプルを選定するようになっている第1の探
索器と、 前記第1の探索器によって選定されたサンプルを順方向
に探索し、この探索において遭遇した第1のサンプルと
以下の基準を満足する他のサンプルとを選定する第2の
探索器(14)であって、 サンプルの大きさが最近選定されたサンプルよりも大き
い場合、そのサンプルを選定し、 最近選定されたサンプルから少なくとも所定間隔だけ離
れている場合、そのサンプルを選定するようになってい
る第2の探索器と、 前記第2の探索器によって選定されたサンプルを探索し
て、重要なサンプルのセットを選定する第3の探索器で
あって、該重要なサンプルが、最大の大きさのサンプル
と、最大の大きさの所定の割合である大きさを有する全
てのサンプルとからなる第3の探索器とからなるマキシ
マロケータ。
1. A digitized speech signal that is a potential pitch pulse in response to a digitized speech signal comprising a plurality of input speech segments, each having a plurality of non-zero samples. A set of important samples from the set, the samples of the set being of the largest magnitude, and being at least equal to the highest pitch encountered in human speech, at least in a predetermined time interval, In a maximal locator that is away from the samples, searching backwards for one sample of the input speech segment and selecting the first sample encountered in the search and another sample satisfying the following criteria: A first searcher (12), wherein the sample size is the most recently selected sample If the distance is greater than the selected sample, the sample is selected. If the sample is separated from the recently selected sample by a predetermined interval, the first searcher is configured to select the sample. A second searcher (14) that searches forward in the searched samples and selects the first sample encountered in the search and other samples satisfying the following criteria: A second searcher adapted to select the sample if larger than the recently selected sample and to select the sample if it is at least a predetermined distance from the recently selected sample; A third searcher for searching the samples selected by the two searchers to select a set of important samples, the important samples being the largest size samples; A maximal locator comprising a sampler and a third searcher consisting of all samples having a size that is a predetermined percentage of the largest size.
【請求項2】 請求項1記載のマキシマロケータにおい
て、前記第1の探索器は非選定サンプルに遭遇したとき
は、それをゼロと設定する。
2. The maximal locator of claim 1, wherein the first searcher sets a non-selected sample to zero when it encounters it.
【請求項3】 請求項2記載のマキシマロケータにおい
て、前記第2の探索器は非選定サンプルに遭遇したとき
は、それをゼロと設定する。
3. The maximal locator of claim 2, wherein the second searcher sets a non-selected sample to zero when it encounters it.
【請求項4】 請求項1乃至3の何れかに記載のマキシ
マロケータにおいて、前記第2の探索器は、各選定サン
プルの大きさおよび位置を記憶する。
4. The maximal locator according to claim 1, wherein said second searcher stores a size and a position of each selected sample.
JP1995005132U 1986-10-31 1995-05-29 Apparatus for determining valid samples from digitized signals. Expired - Lifetime JP2534446Y2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/926,013 US4803730A (en) 1986-10-31 1986-10-31 Fast significant sample detection for a pitch detector
US926013 1986-10-31

Publications (2)

Publication Number Publication Date
JPH081214U JPH081214U (en) 1996-07-30
JP2534446Y2 true JP2534446Y2 (en) 1997-04-30

Family

ID=25452609

Family Applications (2)

Application Number Title Priority Date Filing Date
JP62215534A Pending JPS63122099A (en) 1986-10-31 1987-08-31 Method and apparatus for determining effective sample from digitizing signal
JP1995005132U Expired - Lifetime JP2534446Y2 (en) 1986-10-31 1995-05-29 Apparatus for determining valid samples from digitized signals.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP62215534A Pending JPS63122099A (en) 1986-10-31 1987-08-31 Method and apparatus for determining effective sample from digitizing signal

Country Status (8)

Country Link
US (1) US4803730A (en)
EP (1) EP0266868B1 (en)
JP (2) JPS63122099A (en)
KR (1) KR960002389B1 (en)
AT (1) ATE115759T1 (en)
AU (1) AU580721B2 (en)
CA (1) CA1307343C (en)
DE (1) DE3750869T2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5430826A (en) * 1992-10-13 1995-07-04 Harris Corporation Voice-activated switch
IT1257431B (en) * 1992-12-04 1996-01-16 Sip PROCEDURE AND DEVICE FOR THE QUANTIZATION OF EXCIT EARNINGS IN VOICE CODERS BASED ON SUMMARY ANALYSIS TECHNIQUES
CN1155942C (en) * 1995-05-10 2004-06-30 皇家菲利浦电子有限公司 Transmission system and method for encoding speech with improved pitch detection
JPH10105194A (en) 1996-09-27 1998-04-24 Sony Corp Pitch detecting method, and method and device for encoding speech signal
EP1309965B1 (en) * 2000-08-09 2010-12-15 Thomson Licensing Method and system for enabling audio speed conversion
MXPA03001200A (en) * 2000-08-10 2003-06-30 Thomson Licensing Sa System and method for enabling audio speed conversion.

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2715411B2 (en) * 1977-04-06 1979-02-01 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Electrical method for determining the fundamental period of a speech signal
JPS597120B2 (en) * 1978-11-24 1984-02-16 日本電気株式会社 speech analysis device
NL177950C (en) * 1978-12-14 1986-07-16 Philips Nv VOICE ANALYSIS SYSTEM FOR DETERMINING TONE IN HUMAN SPEECH.
JPS5918717B2 (en) * 1979-02-28 1984-04-28 ケイディディ株式会社 Adaptive pitch extraction method
JPS58140798A (en) * 1982-02-15 1983-08-20 株式会社日立製作所 Voice pitch extraction
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
AU2944684A (en) * 1983-06-17 1984-12-20 University Of Melbourne, The Speech recognition
US4879748A (en) * 1985-08-28 1989-11-07 American Telephone And Telegraph Company Parallel processing pitch detector
AU5201886A (en) * 1985-11-08 1987-06-02 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
JPH06105394B2 (en) * 1986-03-19 1994-12-21 株式会社東芝 Voice recognition system

Also Published As

Publication number Publication date
DE3750869D1 (en) 1995-01-26
AU7763887A (en) 1988-05-05
KR880005761A (en) 1988-06-30
DE3750869T2 (en) 1995-05-04
JPS63122099A (en) 1988-05-26
AU580721B2 (en) 1989-01-27
KR960002389B1 (en) 1996-02-16
ATE115759T1 (en) 1994-12-15
EP0266868A1 (en) 1988-05-11
JPH081214U (en) 1996-07-30
US4803730A (en) 1989-02-07
EP0266868B1 (en) 1994-12-14
CA1307343C (en) 1992-09-08

Similar Documents

Publication Publication Date Title
JP3840684B2 (en) Pitch extraction apparatus and pitch extraction method
CA1301339C (en) Parallel processing pitch detector
KR100795727B1 (en) A method and apparatus that searches a fixed codebook in speech coder based on CELP
US5097508A (en) Digital speech coder having improved long term lag parameter determination
US6047253A (en) Method and apparatus for encoding/decoding voiced speech based on pitch intensity of input speech signal
US6243672B1 (en) Speech encoding/decoding method and apparatus using a pitch reliability measure
JPS5870299A (en) Discrimination of and analyzer for voice signal
JP2534446Y2 (en) Apparatus for determining valid samples from digitized signals.
KR970001167B1 (en) Speech analysing and synthesizer and analysis and synthesizing method
JP2779325B2 (en) Pitch search time reduction method using pre-processing correlation equation in vocoder
EP0749111A2 (en) Codebook searching techniques for speech processing
US6304842B1 (en) Location and coding of unvoiced plosives in linear predictive coding of speech
JP3418005B2 (en) Voice pitch detection device
US6115685A (en) Phase detection apparatus and method, and audio coding apparatus and method
JPH11242498A (en) Method and device for pitch encoding of voice and record medium where pitch encoding program for voice is record
JP3010654B2 (en) Compression encoding apparatus and method
KR100388488B1 (en) A fast pitch analysis method for the voiced region
JP3471889B2 (en) Audio encoding method and apparatus
JP3271193B2 (en) Audio coding method
JPH0650440B2 (en) LSP type pattern matching vocoder
JP3471542B2 (en) Audio coding device
JP3223564B2 (en) Pitch extraction method
JP2648138B2 (en) How to compress audio patterns
KR960011132B1 (en) Pitch detection method of celp vocoder
JPH0235993B2 (en)

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19961204