JPH0259480B2 - - Google Patents

Info

Publication number
JPH0259480B2
JPH0259480B2 JP57106570A JP10657082A JPH0259480B2 JP H0259480 B2 JPH0259480 B2 JP H0259480B2 JP 57106570 A JP57106570 A JP 57106570A JP 10657082 A JP10657082 A JP 10657082A JP H0259480 B2 JPH0259480 B2 JP H0259480B2
Authority
JP
Japan
Prior art keywords
output
frame
value
power
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57106570A
Other languages
English (en)
Other versions
JPS58223198A (ja
Inventor
Hiroshi Hamada
Ryohei Nakatsu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57106570A priority Critical patent/JPS58223198A/ja
Publication of JPS58223198A publication Critical patent/JPS58223198A/ja
Publication of JPH0259480B2 publication Critical patent/JPH0259480B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は例えば単音節毎に発声された音声を
認識し、かな文字列を出力する音声認識方式に用
いられ、入力音声から音声区間を検出する音節入
力装置に関するものである。
<従来技術> 従来の音声入力方式における音声区間検出の例
を第1図に示す。入力された音声はフレーム毎に
音声パワaが計算され、あらかじめ無入力時のパ
ワより定められたしきい値bとの比較が行われ
る。比較の結果しきい値以上のフレームがあらか
じめ定めた長さのフレーム(nSフレーム)以上連
続した場合、その時の音声パワがしきい値を越え
たフレームを音声区間の始端cとする。音声区間
の始端検出後、音声パワがしきい値以下のフレー
ムがあらじめ定めた長さのフレーム(nEフレー
ム)以上連続した場合無音区間が検出されたとし
てその時、音声パワがしきい値以下になつたフレ
ームを音声区間の終端dとする。
以上説明した従来の方法は、音節の発声後、間
隔(nEフレーム以上)をあけて次の音節を発声し
なければ音節の終端が検出されないという欠点が
あつた。そのため高速に次々と音節を発声するこ
とができず、また音節間のポーズを利用者に強制
することとなり負担が大きく、かつ音節間のポー
ズが長いため通常の音声発声速度と比較して遅く
なり過ぎ発声がやりにくかつた。
<発明の概要> この発明はこれらの欠点を解決するために、無
音区間の情報のみでなく、音声パワの谷の情報を
も用いて音声区間の終端検出を行うようにするこ
とにより、音節間に長いポーズがなくても音声区
間の検出が可能となり、高速な音節入力が可能と
なり、音節ごとに区切つて発声するがポーズを入
れなくて済み、通常の発声速度とほゞ同程度で発
声入力させることができる。
<実施例> 第2図はこの発明の一実施例の構成を示すブロ
ツク図である。マイクロホン1からの音声入力信
号は帯域通過フイルタ2を通り帯域制限された
後、AD変換器3によりデイジタル信号に変換さ
れる。次にこのデイジタル信号は音声パワ算出部
4においてあらかじめ定めたフレーム長、フレー
ム周期で音声パワが算出れ、音声パワ出力端子5
へ出力される。
無音区間検出部6では無入力時のパワに適当な
値を加えることにより設定したしきい値と、音声
パワ出力端子5から入力される音声パワとの比較
をフレーム毎に行い、音声パワがしきい値より大
きい場合は“1”を、音声パワがしきい値より小
さい場合は“0”を無音区間出力端子7に出力す
る。
パワ・デイツプ(音声パワの谷)検出部8では
音声パワ出力端子5を通して入力される音声パワ
の谷を検出する。パワ・デイツプ検出法としては
何種類か考えられるが、その一例として音声パワ
時系列を2次曲線近似した場合の2次微係数によ
る方法がある。求められた2次微係数をあらかじ
め設定した適当なしきい値とフレーム毎に比較
し、微係数がしきい値より大きい場合には“1”、
しきい値より小さい場合は“0”をパワ・デイツ
プ出力端子9に、また微係数の値を微係数出力端
子10に出力する。
無音区間決定部11では無音区間出力端子7及
びパワ・デイツプ出力端子9、微係数出力端子1
0を通して入力される情報から音声区間の始端・
終端を決定する。具体的な方法の例としては以下
に述べる方法がある。即ち (1) 無音区間出力端子7の値が“0”から“1”
に変化した後“1”のフレームがnSフレーム以
上連続した場合に、その時“0”から“1”に
変化したフレームを音声の始端とする。
(2) 音声の始端検出後、無音区間出力端子7の値
が“1”から“0”に変化し、“0”のフレー
ムがnEフレーム以上連続した場合に、その時
“1”から“0”に変化したフレームを音声の
終端とする。
(3) 音声の始端検出後、無音区間出力端子7の値
が“0”のフレームが1フレーム以上nEフレー
ム未満で、かつ無音区間出力端子7の値が
“0”の区間にパワ・デイツプ出力端子9の値
が“1”であるフレームが存在する時、無音区
間出力端子7の値が“1”から“0”に変化し
たフレームを音声の終端とする。
(4) 音声の始端検出後、無音区間出力端子7の値
が“1”で、かつパワ・デイツプ出力端子9の
値が“1”である時パワ・デイツプ出力端子9
の値が“1”の区間中、微係数出力端子10か
ら入力される微係数値最大のフレームを音声の
終端及び次の音節の始端とする。
なおこの発明の趣旨は無音区間のみではなく、
音声パワの谷部をもつて音声の終端とすることに
あり、音節ごとに音声を入力するため隣接音節間
が接近していても音節間の音声パワの2次微係数
は大きくなる。
以上の方法で検出された音声区間は音節認識部
12で認識され、かな文字列が認識結果出力端子
13から出力される。音節認識法に関しては例え
ば中津、兵田、石井、高兵「日本語単音節音声認
識法の検討」昭和56年度電子通信学会情報システ
ム部門全国大会予稿集1−117(昭56年10月)に示
されている。
第3図は以上説明した方法による音声区間検出
の例である。音声パワ算出部4において求められ
た音声パワaをしきい値bと比較し、無音区間出
力信号eが求められる。またパワ・デイツプ検出
部8において求められた音声パワを2次曲線近似
した場合の2次微係数fが微係数出力端子10に
出力されると共にしきい値gとの比較によりパ
ワ・デイツプ出力信号hが求められる。これらの
情報から前述の論理に基づいて音声区間の始端
c、終端dが決定される。
以上説明したようにこの発明は音声の終端検出
に無音区間検出のみでなく音声パワの谷部の情報
をも用いるため、各音節間に無音区間を置く必要
がないという利点がある。従つて単語、文節内の
各音節は擬似連続的に発声するなど利用者が任意
の速度で入力可能な高速音節入力装置が実現でき
る。
【図面の簡単な説明】
第1図は従来の音節入力方式における音声区間
検出の例を示す波形図、第2図はこの発明の一実
施例の構成を示すブロツク図、第3図はこの発明
の音節入力装置における音声区間検出の例を示す
波形図である。 1:マイクロホン、2:帯域通過フイルタ、
3:AD変換器、4:音声パワ算出部、5:音声
パワ出力端子、6:無音区間検出部、7:無音区
間出力端子、8:パワ・デイツプ検出部、9:パ
ワ・デイツプ出力端子、10:微係数出力端子、
11:音声区間決定部、12:音節認識部、1
3:認識結果出力端子。

Claims (1)

    【特許請求の範囲】
  1. 1 音節毎に発声された音声の各音節を認識する
    音節入力装置において、入力音声のパワをあらか
    じめ定めた長さのフレーム毎に算出する手段と、
    その算出パワをあらかじめ定めた第1しきい値(b)
    と上記フレーム毎に比較し音声パワが上記第1し
    きい値(b)より大きい場合は“1”を、音声パワが
    上記第1しきい値(b)より小さい場合は“0”を出
    力することにより無音区間を検出する手段と、上
    記算出した音声パワの変化の2次微係数を算出す
    る手段と、その算出された2次微係数をあらかじ
    め定められた第2しきい値(g)と上記フレーム毎に
    比較し上記2次微係数が上記第2しきい値(g)より
    大きい場合“1”を、上記第2しきい値(g)より小
    さい場合は“0”を出力して音声パワの谷を検出
    する手段と、上記無音区間を検出する手段の出力
    の値が“0”から“1”に変化した後“1”のフ
    レームがあらかじめ定めた第1フレーム数(nS
    以上連続した場合において、“0”から“1”に
    変化したフレームを音声の始端とし、音声の始端
    検出後、上記無音区間を検出する手段の出力の値
    が“1”から“0”に変化し、“0”のフレーム
    があらかじめ定めた第2フレーム数(nE)以上連
    続した場合において“1”から“0”に変化した
    フレームを音声の終端とし、又は音声の始端検出
    後、上記無音区間を検出する手段の出力の値が
    “0”であるフレームが1フレーム以上上記第2
    フレーム数(nE)未満で、かつ上記無音区間を検
    出する手段の出力の値が“0”区間において、上
    記音声パワの谷を検出する手段の出力の値が
    “1”であるフレームが存在する時、上記無音区
    間を検出する手段の出力の値が“1”から“0”
    に変化したフレームを音声の終端とし、又は音声
    の始端検出後、上記無音区間を検出する手段の出
    力の値が“1”でかつ上記音声パワの谷を検出す
    る手段の出力の値が“1”である時、上記音声パ
    ワの谷を検出する手段の出力の値が“1”の区間
    中、2次微係数値最大のフレームを音声の終端及
    び次のフレームを次の音声の始端とすることによ
    つて音声区間検出を行う手段とを備えたことを特
    徴とする音節入力装置。
JP57106570A 1982-06-21 1982-06-21 音節入力装置 Granted JPS58223198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57106570A JPS58223198A (ja) 1982-06-21 1982-06-21 音節入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57106570A JPS58223198A (ja) 1982-06-21 1982-06-21 音節入力装置

Publications (2)

Publication Number Publication Date
JPS58223198A JPS58223198A (ja) 1983-12-24
JPH0259480B2 true JPH0259480B2 (ja) 1990-12-12

Family

ID=14436909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57106570A Granted JPS58223198A (ja) 1982-06-21 1982-06-21 音節入力装置

Country Status (1)

Country Link
JP (1) JPS58223198A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713952B2 (ja) * 1988-02-29 1998-02-16 日本電気ホームエレクトロニクス株式会社 自動採譜方法及び装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168800U (ja) * 1982-05-07 1983-11-10 株式会社日立製作所 音声切出し装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device

Also Published As

Publication number Publication date
JPS58223198A (ja) 1983-12-24

Similar Documents

Publication Publication Date Title
JPH0259480B2 (ja)
JP3266124B2 (ja) アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置
JPH04115299A (ja) 音声有音無音判定方法および装置
JPH03114100A (ja) 音声区間検出装置
KR100363251B1 (ko) 음성 끝점 판별 방법
JPS60129796A (ja) 音声入力装置
JPS6217800A (ja) 音声区間判定方式
KR930011739B1 (ko) 초성 프리매칭의 2단매칭을 이용한 음성 인식방법
JPH07104675B2 (ja) 音声認識方法
JP2000099099A (ja) データ再生装置
KR950001540B1 (ko) 음성신호의 끝점 검출장치
JPS61260299A (ja) 音声認識装置
JPH0567039B2 (ja)
JPH02254500A (ja) 発声速度推定装置
JP2557497B2 (ja) 男女声の識別方法
JPS6043697A (ja) 子音と母音の境界検出装置
JPH0449953B2 (ja)
JPS61140999A (ja) 音声区間検出方式
JPS62113197A (ja) 音声認識装置
JPS6335995B2 (ja)
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPH0474720B2 (ja)
JPS6256998A (ja) 子音区間検出装置
JPS6267598A (ja) 音声区間検出方式
JPH0731506B2 (ja) 音声認識方法