WO2000079516A1 - Dispositif et procede de determination de trames voisees/non voisees - Google Patents

Dispositif et procede de determination de trames voisees/non voisees Download PDF

Info

Publication number
WO2000079516A1
WO2000079516A1 PCT/JP2000/003954 JP0003954W WO0079516A1 WO 2000079516 A1 WO2000079516 A1 WO 2000079516A1 JP 0003954 W JP0003954 W JP 0003954W WO 0079516 A1 WO0079516 A1 WO 0079516A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
determination
frame
input signal
band
Prior art date
Application number
PCT/JP2000/003954
Other languages
English (en)
French (fr)
Inventor
Masahiro Serizawa
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to CA002375330A priority Critical patent/CA2375330A1/en
Priority to EP00939086A priority patent/EP1217607A4/en
Publication of WO2000079516A1 publication Critical patent/WO2000079516A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/17Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI

Definitions

  • the present invention relates to an audio / voiceless frame determination device and a determination method thereof, and in particular, determines whether an input signal is audio or non-voice for each fixed section (constant frame). This relates to a voice / non-voice frame determination method.
  • Conventional technology relates to a voice / non-voice frame determination method.
  • Conventional devices for this type of voice frame detection aim to determine a non-voice section and a voice section in order to reduce the average transmission rate by encoding the non-voice section at a lower rate than the voice section. It is used as For example, there is a judging device used in "ITU-T Recommendation G. 729 Annex B". In this conventional device, it is determined whether the frame is a speech section (speech frame) or a non-speech section (frame) using four types of feature parameters extracted from the input signal for each 10 msec frame. The determination in this case is performed by comparing a predetermined determination parameter (threshold) with the extracted characteristic parameter.
  • a predetermined determination parameter threshold
  • the unit length dividing circuit 20 divides the signal input from the input terminal 10 for each frame length of a certain section (for example, 10 msec) and passes the signal to the testing circuit 40.
  • the test circuit 40 determines whether the input signal passed from the unit length division circuit 20 in frame units is a voice section or a non-voice section, and outputs the determination result in frame units from the output terminal 60. It has become.
  • a speech / non-speech frame determination device that determines whether an input signal is a speech or a non-speech for each fixed section, wherein a band conversion unit that performs band conversion of the input signal,
  • a speech / non-speech frame discriminating apparatus is provided, which comprises a decision means for making the decision based on a signal.
  • the determination means is designed for a signal limited to a predetermined band.
  • a speech / non-speech frame determination device that determines whether an input signal is a speech or a non-speech for each fixed section, wherein the dividing section divides the fixed section into shorter short sections
  • a speech / non-speech frame discriminating apparatus comprising: a judgment unit for making the judgment for each short section; and a unit length conversion unit for making a judgment for the certain section based on the judgment result.
  • the unit length conversion means is characterized in that, when any one of the short sections is determined to be speech, the determination corresponding to the certain section is determined to be speech.
  • the apparatus further includes a band conversion unit that performs band conversion on the input signal, and the determination unit performs the determination based on the signal after the band conversion. Further, the determination means is designed for a signal limited to a predetermined band and unit length.
  • a voice / non-voice frame determination method for determining whether an input signal is voice or non-voice for each fixed section, A voice / non-voice frame determination method is provided, which includes a step of performing band conversion and a step of performing the determination based on the signal after the band conversion.
  • a speech / non-speech frame determination method for determining whether an input signal is speech or non-speech for each fixed section, wherein the fixed section is divided into shorter short sections.
  • a voice / non-voice frame determination method which includes a step of performing the determination and a step of determining the predetermined section based on the determination result.
  • the method further includes a step of performing band conversion on the input signal, wherein the determination for each short section is performed based on the signal after band conversion.
  • the determination results obtained for each predetermined unit length are combined to determine the determination result corresponding to the frame. For example, when any one of the determination results for the predetermined unit length is “voice”, the determination result corresponding to the frame can be “voice”.
  • the frame length must be equal to or longer than the predetermined unit time length.
  • FIG. 1 is a block diagram illustrating a configuration example of a first voice / non-voice frame determination device according to the present invention.
  • FIG. 2 is a flowchart showing the operation of the block in FIG.
  • FIG. 3 is a block diagram illustrating a configuration example of a second voice / non-voice frame determination device according to the present invention.
  • FIG. 4 is a flowchart showing the operation of the block in FIG.
  • FIG. 5 is a diagram showing a frame configuration for explaining the operation of the block in FIG.
  • FIG. 6 is a block diagram illustrating a configuration example of a third voice / non-voice frame determination device according to the present invention.
  • FIG. 7 is a flowchart showing the operation of the block in FIG.
  • FIG. 8 is a block diagram illustrating a configuration example of a conventional voice / non-voice frame determination device.
  • FIG. 1 is a block diagram showing the configuration of a first voice / voiceless frame determination apparatus according to the present invention, and the same parts as those in FIG. 8 are denoted by the same reference numerals.
  • FIG. 2 is a flowchart showing a flow of the operation.
  • the unit length dividing circuit 20 divides the signal input from the input terminal 10 into a frame length (for example, 10 msec) which is a predetermined fixed section (step S 10), and the band converting circuit 3 Pass to 0.
  • This band conversion circuit 30 limits the frequency band of the input signal having the frame length passed from the unit length division circuit 20 to a frequency band that can be tested by the test circuit 40 (step S11). , Pass the test circuit 40.
  • the test circuit 40 determines whether the input signal in units of frames passed from the unit length dividing circuit 20 is a voice section or a non-voice section (step S12). The judgment result is output from output terminal 60.
  • the band conversion circuit for example, a circuit having a band-pass filter function or a low-pass filter function can be used, but the band of the input signal is the same as the band after conversion by this band conversion circuit. Of course, it needs to be wider.
  • FIG. 3 is a block diagram showing a second speech / non-speech frame discriminating apparatus according to the present invention, and the same parts as those in FIGS.
  • FIG. 4 is a flowchart showing the flow of the operation.
  • the unit length dividing circuit 20 converts the signal input from the input terminal 10 into a unit length (for example, 2.5 msec) shorter than a frame length (for example, 10 msec) as shown in FIG. (Step S 20) and passed to the test circuit 40.
  • the test circuit 40 determines whether a voice section or a non-voice section is present for each short unit length passed from the unit length dividing circuit 20 (step S 21), and determines the results of these determinations for each frame unit of the input signal. Passed to unit length conversion circuit 50.
  • the unit length conversion circuit 50 derives from the multiple judgment results (judgment results of “Yes” and “No” in the short section in FIG. 5 (A)) passed from the test circuit 40 corresponding to each frame.
  • the determination result of one frame is determined (step S22), and output from the output terminal 60.
  • Fig. 5 (A) if at least one of the short sections constituting one frame is judged as "present”, the judgment result of one frame is shown in Fig. 5 (B). Thus, it is determined to be "Yes".
  • the frame length must be equal to or longer than the predetermined unit time length.
  • FIG. 6 is a block diagram showing a third speech / non-speech frame determination device according to the present invention, and the same parts as those in FIGS.
  • FIG. 7 is a flowchart showing the flow of the operation.
  • the unit length dividing circuit 20 divides the signal input from the input terminal into a unit length (for example, 2.5 msec) shorter than the frame length (for example, 10 msec) as shown in FIG. (Step S 30) Pass it to the band conversion circuit 30.
  • the band conversion circuit 30 receives the input signal of the frame length passed from the unit length division circuit 20.
  • the frequency band possessed is limited to a frequency band that can be tested by the test circuit 40 (step S31) and passed to the test circuit 40.
  • the test circuit 40 determines whether a voice section or a non-voice section is present for each short unit length passed from the band conversion circuit 30 (step S32), and determines the results of these determinations for each frame unit of the input signal.
  • the unit length conversion circuit 50 extracts the multiple judgment results (the judgment results of “Yes” and “No” in the short section in FIG. 5 (A)) passed from the test circuit 40 corresponding to each frame.
  • the frame determination result is determined (step S33) and output from the output terminal 60.
  • the first effect is that it is possible to obtain appropriate judgment results in all cases when constructing a voice / silence frame judgment device that can respond to various input signals with different frequency bands. .
  • the reason is that the judgment can be made with a single judgment parameter.
  • the second effect is that when constructing an audio / voiceless frame determination device that can support various input signals with different unit lengths (frame lengths) for performing determination, it is possible to obtain appropriate determination results in all cases. It is possible. The reason is that it can be reflected with a single judgment parameter.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Telephone Function (AREA)

Description

明細書 音声 · 無音声フレーム判定装置及びその判定方法 この発明は音声'無音声フレーム判定装置及びその判定方法に関し、 特に一定区間 (一定フレーム) 毎に入力信号が音声か音声以外かを判 定する音声 ·無音声フレーム判定方式に関するものである。 従来技術
この種の音声フレーム検出に関する従来装置は、 無音声区間を音声 区間に比べて低レ一トで符号化して平均伝送レートを低減するために、 無音声区間と音声区間とを判定することを目的と して用いられている。 例えば、 " I TU— T勧告 G. 7 2 9 A n n e x B"で使用されて いる判定装置がある。 この従来装置では、 1 0 m s e c フレーム毎に 入力信号から抽出した 4種の特徴パラメータを用いて、 そのフレーム が音声区間 (音声フレーム) か無音声区間 (フレーム) かの判定を行 なう。 この場合の判定は予め定めた判定パラメータ (閾値) と抽出し た特徴パラメ一タとを比較して行なうものである。
図 8を参照して従来装置を説明する。 単位長分割回路 2 0は入力端 子 1 0から入力された信号を、 一定区間のフレーム長 (例えば、 1 0 m s e c ) 毎に分割して、 検定回路 4 0に渡す。 検定回路 4 0は単位 長分割回路 2 0からフレーム単位で渡された入力信号に対して音声区 間か無音声区間かを判定し、 フレーム単位での判定結果を出力端子 6 0から出力する様になつている。 発明が解決しようとする課題
図 8に示した従来方式の問題点は、 周波数帯域や判定を行なう単位 長 (フレーム長) が異なる種々の入力信号に対応可能な音声 ·無音声 フレーム判定装置を構築する際に、 全ての場合で妥当な判定結果を得 るためには、 各々の場合に対して個別に判定パラメ一タを設計する必 要があることである。 その理由は、 単一の判定パラメータを用いると、 判定能力が低下するためである。
本発明の目的は、 入力信号の周波数帯域や区間長が複数種類ある場 合でも、 単一アルゴリズムを用いて剌定を行うことが可能な音声 ·無 音声フレーム判定装置及びその方法を提供することである。 発明の開示
本発明によれば、 一定区間毎に入力信号が音声か音声以外かの判定 を行う音声 · 無音声フレーム判定装置であって、 前記入力信号を帯域 変換する帯域変換手段と、 この帯域変換後の信号に基づいて前記判定 を行う判定手段とを含むことを特徴とする音声 ·無音声フレーム判定 装置が得られる。 そして、 この判定手段は、 予め定められた帯域に制 限された信号に対して設計されていることを特徴としている。
また、 本発明によれば、 一定区間毎に入力信号が音声か音声以外か の判定を行う音声 · 無音声フレーム判定装置であって、 前記一定区間 をより短い短区間に分割する分割手段と、 この短区間毎に前記判定を 行う判定手段と、 この判定結果に基づいて前記一定区間に対する判定 を行う単位長変換手段とを含むことを特徴とする音声 · 無音声フレー ム判定装置が得られる。
そして、 前記単位長変換手段は、 前記短区間のいずれか一つが音声 であると判定されたときに、 前記一定区間に対応する判定を音声であ ると判定する様にした特徴とする。 また前記入力信号を帯域変換する 帯域変換手段を更に含み、 前記判定手段は、 この帯域変換後の信号に 基づいて前記判定を行う様にしたことを特徴とする。 更に、 前記判定 手段は、 予め定められた帯域及び単位長に制限された信号に対して設 計されていることを特徴と している。
更に本発明によれば、 一定区間毎に入力信号が音声か音声以外かの 判定を行う音声 · 無音声フレーム判定方法であって、 前記入力信号を 帯域変換するステップと、 この帯域変換後の信号に基づいて前記判定 を行うステップとを含むことを特徴とする音声 · 無音声フレーム判定 方法が得られる。
更にはまた、 一定区間毎に入力信号が音声か音声以外かの判定を行 う音声 ·無音声フレーム判定方法であって、 前記一定区間をより短い 短区間に分割するステップと、 この短区間毎に前記判定を行ぅステツ プと、 この判定結果に基づいて前記一定区間に対する判定を行うステ ップとを含むことを特徴とする音声 · 無音声フレーム判定方法が得ら れる。
そして、 前記短区間のいずれか一つが音声であると判定されたとき に、 前記一定区間に対応する判定を音声であると判定する様にした特 徴とする。 また、 前記入力信号を帯域変換するステップを更に含み、 この帯域変換後の信号に基づいて前記短区間毎の判定を行う様にした ことを特徴とする。
本発明の作用を述べる。 予め定めた周波数帯域及び予め定めた単位 時間長を使用して音声 · 無音声判定を行なうことができる設定パラメ ータを用意する。 すなわち、 予め定めた帯域及び単位時間長に制限さ れた信号に対して設計された設定パラメータを有する判定回路を用意 するのである。 そして、 入力信号は必ずこの予め定めた周波数帯域と 同じ帯域になるように帯域制限を施した後に、 判定を行なう。 これに より、 異なる帯域に対応するために新たな設定パラメ一タを必要とし ない。 但し、 入力信号が持つ帯域は予め定めた帯域と同一あるいはよ り広い必要がある。
また、 フレーム長が予め定めた単位時間長と異なる場合は、 予め定 めた単位長毎に得た判定結果をまとめて該フレームに対応する判定結 果を決定する。 例えば、 予め定めた単位長に対する判定結果のいずれ か一つが "音声"である場合は、該フレームに対応する判定結果を "音 声" とすることができる。 ここで、 フレーム長は予め定めた単位時間 長と同一あるいはより長い必要がある。 図面の簡単な説明
図 1は、 本発明による第一の音声 · 無音声フレーム判定装置の構成 例を説明するブロ ック図である。
図 2は、 図 1のブロックの動作を示すフロー図である。
図 3は、 発明による第二の音声 · 無音声フレーム判定装置の構成例 を説明するブロック図である。
図 4は、 図 3のブロックの動作を示すフロー図である。
図 5は、 図 3のブロ ックの動作を説明するためのフレーム構成を示 す図である。
図 6は、 発明による第三の音声 · 無音声フレーム判定装置の構成例 を説明するブロック図である。
図 7は、 図 6のブロ ックの動作を示すフロー図である。
図 8は、 従来の音声 · 無音声フレーム判定装置の構成例を説明する ブロック図である。 発明を実施するための最良の形態
以下に、 図面を参照して本発明の実施例を説明する。 図 1は本発明 による第一の音声 ' 無音声フレーム判定装置の構成を示すプロック図 であり、 図 8 と同等部分は同一符号にて示している。 また、 図 2はそ の動作の流れを示すフロー図である。 単位長分割回路 2 0は入力端子 1 0から入力された信号を、 予め定められた一定区間であるフレーム 長 (例えば、 1 0 m s e c ) に分割して (ステップ S 1 0 )、 帯域変換 回路 3 0に渡す。
この帯域変換回路 3 0は、 単位長分割回路 2 0から渡されたフレー ム長の入力信号が持つ周波数帯域を、 検定回路 4 0が検定可能な周波 数帯域に制限し (ステップ S 1 1 )、 検定回路 4 0に渡す。 この検定回 路 4 0は、 単位長分割回路 2 0から渡されたフレーム単位の入力信号 に対して、 音声区間か無音声区間かを判定し (ステップ S 1 2 )、 その 判定結果を出力端子 6 0から出力する。
この場合の帯域変換回路は、 例えば、 バン ドパスフィルタ機能や、 ローパスフィルタ機能を有する回路を使用することができるが、 入力 信号が持つ帯域は、 この帯域変換回路による変換後の帯域と同一ある いはより広い必要があることは勿論である。
図 3は本発明による第二の音声 · 無音声フレーム判定装置を示すブ ロック図であり、 図 1, 8 と同等部分は同一符号にて示している。 ま た、 図 4はその動作の流れを示すフロー図である。 単位長分割回路 2 0は入力端子 1 0から入力された信号を、 図 5 (A) に示す様に、 フ レーム長 (例えば、 1 0 m s e c ) より短い単位長 (例えば、 2. 5 m s e c ) に分割して (ステップ S 2 0 ) 検定回路 4 0に渡す。 検定 回路 4 0は単位長分割回路 2 0から渡された短い単位長毎に音声区間 か無音声区間かを判定し (ステップ S 2 1 )、 これ等の判定結果を入力 信号のフレーム単位毎に単位長変換回路 5 0に渡す。
単位長変換回路 5 0は、 各フレームに対応する検定回路 4 0から渡 された複数の判定結果 (図 5 (A) の短区間の "有"、 "無" の判定結 果) から、 その 1フレームの判定結果を決定し (ステップ S 2 2)、 出 力端子 6 0から出力する。 この場合、 図 5 (A) に示した様に、 1 フ レームを構成する短区間のうち一つでも "有" と判定されれば、 1 フ レームの判定結果は図 5 (B) に示す様に、 "有" と判定されることに なる。 ここで、 フレーム長は予め定めた単位時間長と同一あるいはよ り長い必要があることは勿論である。
図 6は本発明による第三の音声■ 無音声フレーム判定装置を示すブ ロック図であり、 図 1, 3 , 8 と同等部分は同一符号にて示す。 また、 図 7はその動作の流れを示すフロー図である。 単位長分割回路 2 0は 入力端子から入力された信号を、 図 5 (A) に示す様に、 フレーム長 (例えば、 1 0 m s e c ) より短い単位長 (例えば、 2. 5 m s e c ) に分割して (ステップ S 3 0 ) 帯域変換回路 3 0に渡す。 帯域変換回 路 3 0は、 単位長分割回路 2 0から渡されたフレーム長の入力信号が 持つ周波数帯域を、検定回路 4 0が検定可能な周波数帯域に制限し(ス テツプ S 3 1 ) 検定回路 4 0に渡す。
検定回路 4 0は帯域変換回路 3 0から渡された短い単位長毎に音声 区間か無音声区間かを夫々判定し (ステップ S 3 2 )、 これ等の判定結 果を入力信号のフレーム単位毎に単位長変換回路 5 0に渡す。 この単 位長変換回路 5 0は各フレームに対応する検定回路 4 0から渡された 複数の判定結果 (図 5 ( A ) の短区間の "有"、 "無" の判定結果) か らそのフレームの判定結果を決定し (ステップ S 3 3 )、 出力端子 6 0 から出力する。
この場合も、 図 5 ( A ) に示した様に、 1 フレームを構成する短区 間のうち一つでも "有" と判定されれば、 1 フレームの判定結果は図 5 ( B ) に示す様に、 "有" と判定されることになる。 産業上の利用可能性
第一の効果は、 周波数帯域が異なる種々の入力信号に対応可能な音 声 ·無音声フレーム判定装置を構築する際に、 全ての場合で妥当な判 定結果を得ることが可能なことである。 その理由は、 単一の判定パラ メータで判定可能なためである。
第二の効果は、 判定を行なう単位長 (フレーム長) が異なる種々の 入力信号に対応可能な音声'無音声フレーム判定装置を構築する際に、 全ての場合で妥当な判定結果を得ることが可能なことである。 その理 由は、 単一の判定パラメータで反映可能なためである。

Claims

請求の範囲
1 . 一定区間毎に入力信号が音声か音声以外かの判定を行う音 声 ·無音声フレーム判定装置であって、 前記入力信号を帯域変換する 帯域変換手段と、 この帯域変換後の信号に基づいて前記判定を行う判 定手段とを含むことを特徴とする音声 ·無音声フレーム判定装置。
2 . 前記判定手段は、 予め定められた帯域に制限された信号に 対して設計されていることを特徴とする請求項 1記載の音声 ·無音声 フレーム判定装置。
3 . 一定区間毎に入力信号が音声か音声以外かの判定を行う音 声 ·無音声フレーム判定装置であって、 前記一定区間をより短い短区 間に分割する分割手段と、この短区間毎に前記判定を行う判定手段と、 この判定結果に基づいて前記一定区間に対する判定を行う単位長変換 手段とを含むことを特徴とする音声 ·無音声フレーム判定装置。
4 . 前記単位長変換手段は、 前記短区間のいずれか一つが音声 であると判定されたときに、 前記一定区間に対応する判定を音声であ ると判定する様にしたことを特徴とする請求項 3記載の音声 ·無音声 フレーム判定装置。
5 . 前記判定手段は、 予め定められた帯域に制限された信号に 対して設計されていることを特徴とする請求項 3または 4記載の音 声■ 無音声フレーム判定装置。
6 . 前記入力信号を帯域変換する帯域変換手段を更に含み、 前 記判定手段は、 この帯域変換後の信号に基づいて前記判定を行う様に したことを特徴とする請求項 3または 4記載の音声 ·無音声フレーム 判定装置。
7 . 前記判定手段は、 予め定められた帯域及び単位長に制限さ れた信号に対して設計されていることを特徴とする請求項 6記載の音 声 ·無音声フレーム判定装置。
8 . 一定区間毎に入力信号が音声か音声以外かの判定を行う音 声 ·無音声フレーム判定方法であって、 前記入力信号を帯域変換する ステップと、 この帯域変換後の信号に基づいて前記判定を行ぅステツ プとを含むことを特徴とする音声 . 無音声フレーム判定方法。
9 . 前記判定を行うステップは、 予め定められた帯域に制限さ れた信号に対して設計されていることを特徴とする請求項 8記載の音 声 · 無音声フレーム判定方法。
1 0 . —定区間毎に入力信号が音声か音声以外かの判定を行う 音声 · 無音声フレーム判定方法であって、 前記一定区間をより短い短 区間に分割するステップと、 この短区間毎に前記判定を行うステップ と、 この判定結果に基づいて前記一定区間に対する判定を行うステツ プとを含むことを特徴とする音声 · 無音声フレーム判定方法。
1 1 . 前記短区間のいずれか一つが音声であると判定されたと きに、 前記一定区間に対応する判定を音声であると判定する様にした ことを特徴とする請求項 1 0記載の音声■ 無音声フレーム判定方法。
1 2 . 前記判定を行うステップは、 予め定められた帯域に制限 された信号に対して設計されていることを特徴とする請求項 1 0また は 1 1記載の音声 · 無音声フレーム判定方法。
1 3 . 前記入力信号を帯域変換するステップを更に含み、 この 帯域変換後の信号に基づいて前記短区間毎の判定を行う様にしたこと を特徴とする請求項 1 0または 1 1記載の音声 .無音声フレーム判定 方法。
1 4 . 前記判定を行うステップは、 予め定められた帯域及び単 位長に制限された信号に対して設計されていることを特徴とする請求 項 1 3記載の音声 · 無音声フレーム判定方法。
PCT/JP2000/003954 1999-06-23 2000-06-16 Dispositif et procede de determination de trames voisees/non voisees WO2000079516A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CA002375330A CA2375330A1 (en) 1999-06-23 2000-06-16 Speech/non-speech frame discriminator and method for discriminating between speech/non-speech frames
EP00939086A EP1217607A4 (en) 1999-06-23 2000-06-16 DEVICE AND METHOD FOR DETERMINING VOIDED / NON-VOIDED FRAMES

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11176167A JP2001005473A (ja) 1999-06-23 1999-06-23 音声・無音声フレーム判定装置及びその判定方法
JP11/176167 1999-06-23

Publications (1)

Publication Number Publication Date
WO2000079516A1 true WO2000079516A1 (fr) 2000-12-28

Family

ID=16008844

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/003954 WO2000079516A1 (fr) 1999-06-23 2000-06-16 Dispositif et procede de determination de trames voisees/non voisees

Country Status (4)

Country Link
EP (1) EP1217607A4 (ja)
JP (1) JP2001005473A (ja)
CA (1) CA2375330A1 (ja)
WO (1) WO2000079516A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09152894A (ja) * 1995-11-30 1997-06-10 Denso Corp 有音無音判別器
JP2656586B2 (ja) * 1988-11-30 1997-09-24 株式会社日立製作所 音声検出方法及びその装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1486868A (en) * 1974-05-17 1977-09-28 Int Standard Electric Corp Conference circuit
JP3355473B2 (ja) * 1996-12-18 2002-12-09 京セラ株式会社 音声検出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2656586B2 (ja) * 1988-11-30 1997-09-24 株式会社日立製作所 音声検出方法及びその装置
JPH09152894A (ja) * 1995-11-30 1997-06-10 Denso Corp 有音無音判別器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1217607A4 *

Also Published As

Publication number Publication date
CA2375330A1 (en) 2000-12-28
EP1217607A4 (en) 2005-05-04
JP2001005473A (ja) 2001-01-12
EP1217607A1 (en) 2002-06-26

Similar Documents

Publication Publication Date Title
US6807525B1 (en) SID frame detection with human auditory perception compensation
US7171357B2 (en) Voice-activity detection using energy ratios and periodicity
US5848384A (en) Analysis of audio quality using speech recognition and synthesis
JP4995913B2 (ja) 信号変化検出のためのシステム、方法、および装置
KR100986957B1 (ko) 토널 컴포넌트들을 감지하는 시스템들, 방법들, 및 장치들
JP5284477B2 (ja) 音声データの伝送にエラーがある際のエラー隠蔽方法
JP2002366174A (ja) G.729の付属書bに準拠した音声アクティビティ検出回路を収束させるための方法
AU689300B2 (en) Test method
JPH08505715A (ja) 定常的信号と非定常的信号との識別
US6950511B2 (en) Detection of both voice and tones using Goertzel filters
JPS62204652A (ja) 可聴周波信号識別方式
PT1554717E (pt) Pré-processamento de dados digitais áudio para codificadores/descodificadores de áudio móveis
WO2000079516A1 (fr) Dispositif et procede de determination de trames voisees/non voisees
EP1424684A1 (en) Voice activity detection apparatus and method
JP2003514262A (ja) 割込みのない言語品質の評価
US20070100611A1 (en) Speech codec apparatus with spike reduction
US7277537B2 (en) Tone, modulated tone, and saturated tone detection in a voice activity detection device
CA2279264C (en) Speech immunity enhancement in linear prediction based dtmf detector
IL108401A (en) Method and apparatus for indicating the emotional state of a person
JP4309749B2 (ja) 帯域制限を考慮した音声品質客観評価装置
JP2905112B2 (ja) 環境音分析装置
JPH03241400A (ja) 音声検出器
JPS5915228B2 (ja) シングルチヤネルコ−デツク監視装置
JPH0836400A (ja) 音声状態判定回路
JPS62260442A (ja) 故障検出回路

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): DE FR GB

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 10019123

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2000939086

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2375330

Country of ref document: CA

Ref country code: CA

Ref document number: 2375330

Kind code of ref document: A

Format of ref document f/p: F

WWP Wipo information: published in national office

Ref document number: 2000939086

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2000939086

Country of ref document: EP