JPS6078500A - 音声信号認識方法及び音声認識方式 - Google Patents
音声信号認識方法及び音声認識方式Info
- Publication number
- JPS6078500A JPS6078500A JP59182535A JP18253584A JPS6078500A JP S6078500 A JPS6078500 A JP S6078500A JP 59182535 A JP59182535 A JP 59182535A JP 18253584 A JP18253584 A JP 18253584A JP S6078500 A JPS6078500 A JP S6078500A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- recognition method
- signal
- symbol
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 13
- 238000012360 testing method Methods 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 2
- 229940068031 l-formula Drugs 0.000 claims 1
- 238000005259 measurement Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 210000002414 leg Anatomy 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006854 communication Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003127 knee Anatomy 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- BDEDPKFUFGCVCJ-UHFFFAOYSA-N 3,6-dihydroxy-8,8-dimethyl-1-oxo-3,4,7,9-tetrahydrocyclopenta[h]isochromene-5-carbaldehyde Chemical compound O=C1OC(O)CC(C(C=O)=C2O)=C1C1=C2CC(C)(C)C1 BDEDPKFUFGCVCJ-UHFFFAOYSA-N 0.000 description 1
- 235000011960 Brassica ruvo Nutrition 0.000 description 1
- OWNRRUFOJXFKCU-UHFFFAOYSA-N Bromadiolone Chemical compound C=1C=C(C=2C=CC(Br)=CC=2)C=CC=1C(O)CC(C=1C(OC2=CC=CC=C2C=1O)=O)C1=CC=CC=C1 OWNRRUFOJXFKCU-UHFFFAOYSA-N 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- LFVLUOAHQIVABZ-UHFFFAOYSA-N Iodofenphos Chemical compound COP(=S)(OC)OC1=CC(Cl)=C(I)C=C1Cl LFVLUOAHQIVABZ-UHFFFAOYSA-N 0.000 description 1
- TUWJQNVAGYRRHA-UHFFFAOYSA-N Menadiol dibutyrate Chemical compound C1=CC=C2C(OC(=O)CCC)=CC(C)=C(OC(=O)CCC)C2=C1 TUWJQNVAGYRRHA-UHFFFAOYSA-N 0.000 description 1
- 241001482564 Nyctereutes procyonoides Species 0.000 description 1
- BWRHOYDPVJPXMF-UHFFFAOYSA-N cis-Caran Natural products C1C(C)CCC2C(C)(C)C12 BWRHOYDPVJPXMF-UHFFFAOYSA-N 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229960000265 cromoglicic acid Drugs 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- HTXDPTMKBJXEOW-UHFFFAOYSA-N iridium(IV) oxide Inorganic materials O=[Ir]=O HTXDPTMKBJXEOW-UHFFFAOYSA-N 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Electric Clocks (AREA)
- Selective Calling Equipment (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明1..L音β1信;3/、、 i認識4るIJ払
及びノi j、いこIIIりる。
及びノi j、いこIIIりる。
従来の技術
I E E r= i−ランスツノクシ:1ンズ ノノ
ンド 1ミコニクーシヨンス(I l−にTfE r
ransactio++5and Communica
tion:; ):”j: Com29巻5 ’r’r
(1981年5月)に技術の現状が、l(2明され(
いる。
ンド 1ミコニクーシヨンス(I l−にTfE r
ransactio++5and Communica
tion:; ):”j: Com29巻5 ’r’r
(1981年5月)に技術の現状が、l(2明され(
いる。
ハンブルりの〕・イリゾス G用IJ11のM、l−1
,ターンはヨーロピアン 十しク1へロニクス インJ
−ス’ ([E uro+)ca++ l 1cclr
ouics J 5suas ) C3。
,ターンはヨーロピアン 十しク1へロニクス インJ
−ス’ ([E uro+)ca++ l 1cclr
ouics J 5suas ) C3。
1981からイシュー’I 、 +4182に、8声認
識理論及びj主すス インスッルメンツ、ノイリブス及
びl\ル研究所により考采されlζ15式を説明りる一
連□の記事を寄稿している。1 ミドルセックス、うj′rン1〜ンのフシ:1ノルフイ
ジカル ラボーノトリイズの13.1三、レイ及びC,
R,、:r−バンズは、r+ j+i認識の実用的方式
について彼らが行なった開光につい−(説明した記事を
インタナショナル ジ1/−)−ル ンンマシン スタ
デイズ(I l)t、 +J 、 M 1111−M
1lcllill(! S 1.U(IrO2)(19
81年>1/1.13〜17に寄稿しCいる1゜」二記
の文献は完全な解11rを説明したもの(・あり、IJ
どんどの場合多数のh11朶及び連続音7j、iの認i
、r&を試みている。
識理論及びj主すス インスッルメンツ、ノイリブス及
びl\ル研究所により考采されlζ15式を説明りる一
連□の記事を寄稿している。1 ミドルセックス、うj′rン1〜ンのフシ:1ノルフイ
ジカル ラボーノトリイズの13.1三、レイ及びC,
R,、:r−バンズは、r+ j+i認識の実用的方式
について彼らが行なった開光につい−(説明した記事を
インタナショナル ジ1/−)−ル ンンマシン スタ
デイズ(I l)t、 +J 、 M 1111−M
1lcllill(! S 1.U(IrO2)(19
81年>1/1.13〜17に寄稿しCいる1゜」二記
の文献は完全な解11rを説明したもの(・あり、IJ
どんどの場合多数のh11朶及び連続音7j、iの認i
、r&を試みている。
(工する(小の応用(は、(;(械を動伯さUるIこめ
の10乃〒20の異なる命令用飴等の限られIこifi
! ’:A“パのみか心安(′ある。
の10乃〒20の異なる命令用飴等の限られIこifi
! ’:A“パのみか心安(′ある。
かかる洛声認識装買(:L次のようイjbのがl!X
+、−山1v8れでいる。
+、−山1v8れでいる。
日本電気のD II)−200
インクスノー−1・ 1−レグj−11ニスクのVRC
−100−1 小タンのV−5000 A−リクルの1−−9 !’i 0 インラルの 1sl(C−570 発明が解決しJ、うどりる問題点 これらは、1五μjをフィルりにより周波6夕(11(
ご57割し各周波数帯のエネルギレヘルを分析り−ると
いう原理に基づいて動作してa3す、比較的高l1ll
l乙複雑である。
−100−1 小タンのV−5000 A−リクルの1−−9 !’i 0 インラルの 1sl(C−570 発明が解決しJ、うどりる問題点 これらは、1五μjをフィルりにより周波6夕(11(
ご57割し各周波数帯のエネルギレヘルを分析り−ると
いう原理に基づいて動作してa3す、比較的高l1ll
l乙複雑である。
問題点を解決りるl、−めの手段
以前はディジタル昌jli伝送等1(−ilj (Jる
音Tj、の貿号化のみに用いられ(いIl、:lj法を
用いると比較的安1曲C右効イ> ?j +”’ 14
(d:’+か1141える1゜本発明にJ、れば/ノ
(ム1ント)゛ツドスピーf(“[1ヨS)を用いる(
二と(づ?1徴付(]られる昌71イに号認識方γ人が
1足(Jじ\Iしる1゜4(弁明にJ、ればに+、 /
11、昌Fiイハ号は11−8〕Δ−マット(?:J号
化され、l I” Sシン小ルスj−リームからなるバ
ラメークの少4I:<どらft3つかと試1i6i (
ハ月と(1) l!!I係カf?i r’−’イ、:i
; (/I M ’;’4 k: 小U出)J 4−
r月/J’ J’;’+宋としC得られるJ、−)山内
されることをQ10(::りと(〕る音、jj認識1ノ
式がI!r! (1(される、。
音Tj、の貿号化のみに用いられ(いIl、:lj法を
用いると比較的安1曲C右効イ> ?j +”’ 14
(d:’+か1141える1゜本発明にJ、れば/ノ
(ム1ント)゛ツドスピーf(“[1ヨS)を用いる(
二と(づ?1徴付(]られる昌71イに号認識方γ人が
1足(Jじ\Iしる1゜4(弁明にJ、ればに+、 /
11、昌Fiイハ号は11−8〕Δ−マット(?:J号
化され、l I” Sシン小ルスj−リームからなるバ
ラメークの少4I:<どらft3つかと試1i6i (
ハ月と(1) l!!I係カf?i r’−’イ、:i
; (/I M ’;’4 k: 小U出)J 4−
r月/J’ J’;’+宋としC得られるJ、−)山内
されることをQ10(::りと(〕る音、jj認識1ノ
式がI!r! (1(される、。
作用
従来タイムゴニンー1−1′ツドスビーブはIインタル
8声伝jスに関しくの・7i 、ij/えられてさた。
8声伝jスに関しくの・7i 、ij/えられてさた。
タイム]−ンコーーノツドスピ−1は、音用1波形の荀
号化の一種−Cあるu t”+ I”波形は、相続く実
際の零J11間のレグメン1−に分;!’Iされる11
例えば第1図131ランダムイ【音声波形を示し、矢印
はけロクロス点を示しCいる。波形の各レグメン1〜に
対し旬号は単一のディジタルワードからなる。この1.
ノートはレグメン1〜の2つのパラメータ、つFl“す
if5子化された持続時間及び形状から導かれ′る1、
1)続11,1間の測定は容易であり、第2図(よ相続
く各レグメントのm子化持続時間2,3.6等を承り。
号化の一種−Cあるu t”+ I”波形は、相続く実
際の零J11間のレグメン1−に分;!’Iされる11
例えば第1図131ランダムイ【音声波形を示し、矢印
はけロクロス点を示しCいる。波形の各レグメン1〜に
対し旬号は単一のディジタルワードからなる。この1.
ノートはレグメン1〜の2つのパラメータ、つFl“す
if5子化された持続時間及び形状から導かれ′る1、
1)続11,1間の測定は容易であり、第2図(よ相続
く各レグメントのm子化持続時間2,3.6等を承り。
形状を記述りる方法としては、波のしグメン(〜をレグ
メン1〜におりる正の4ji小点又は負の極大点の数に
より分類リ−るのが好J、しいが、他の方法で形状を記
)ホして−bJ:い。これは第3図に0.0゜1等で示
しである。これら2つのパラメータ(J、数字シンボル
の一意的なアルファベットを形成りるJ:う71−リク
スに構成される。第4図はかかる71〜リクスを承り。
メン1〜におりる正の4ji小点又は負の極大点の数に
より分類リ−るのが好J、しいが、他の方法で形状を記
)ホして−bJ:い。これは第3図に0.0゜1等で示
しである。これら2つのパラメータ(J、数字シンボル
の一意的なアルファベットを形成りるJ:う71−リク
スに構成される。第4図はかかる71〜リクスを承り。
行に治う「S」パラメータI31゜極大点又は極小点の
数であり、列に沿うDパラメータは量子化1)続時間で
ある。ただし、この自然に得られるアルファベットは次
の1111点から甲純化されている。経湾的な11号化
には、この方法C・111+られた自然発生的な識別可
能なシンボルの数(ま、はるかに数の少ない符号デスク
リプタ([7′ルフアベツ1へ」)を形成・jる。J、
う非線型に変換される。
数であり、列に沿うDパラメータは量子化1)続時間で
ある。ただし、この自然に得られるアルファベットは次
の1111点から甲純化されている。経湾的な11号化
には、この方法C・111+られた自然発生的な識別可
能なシンボルの数(ま、はるかに数の少ない符号デスク
リプタ([7′ルフアベツ1へ」)を形成・jる。J、
う非線型に変換される。
本発明の好ましい1・l、 l牧に、」、リタイム1−
ンニ」−デッドスピーヂフンj−マ゛ソト(により1−
71られるががる符号又はイベントデス/ノリ/゛りが
高7ij認識に用いられる。合1−ji信号が例、Ri
f :l、!i kLI Zに帯域制御シ(されている
なら知いイl\ントには極大点又は極小点をイjしえな
いものが+lする9、好シ1、しい実施例CIよε量子
化は20にピッl−秒Q行なわれる。通常のfIi声に
おける1肖続IY’1間のCM’q囲は、20にピッ1
−リンプルの約3〜3011°1、つ31、す30の2
0 kピッ1−リンプルが3.3 kll/ (i、5
周1す」を表わJ。
ンニ」−デッドスピーヂフンj−マ゛ソト(により1−
71られるががる符号又はイベントデス/ノリ/゛りが
高7ij認識に用いられる。合1−ji信号が例、Ri
f :l、!i kLI Zに帯域制御シ(されている
なら知いイl\ントには極大点又は極小点をイjしえな
いものが+lする9、好シ1、しい実施例CIよε量子
化は20にピッl−秒Q行なわれる。通常のfIi声に
おける1肖続IY’1間のCM’q囲は、20にピッ1
−リンプルの約3〜3011°1、つ31、す30の2
0 kピッ1−リンプルが3.3 kll/ (i、5
周1す」を表わJ。
タイムエンコーゲッドスピーヂフA−マツ1〜におt、
N でTit、低周波数(,1,11°11周波数ti
Iと1t71iイrには+7) :1″化しなくてもJ
、い1、 従って第4図を参照()るに、3つのIT、j 47る
持続II’■間を有りるが極大jj、1及び(((小I
j、九をイ]さイfい最ηjの3つのシンボル(1,2
及び3)には、同一のデスクリプタ(1)が(N1勺さ
1しる。シンボルO及び7には同一のデスクリプタ(4
)が(J”jされる。シンボル8,9及び10には、形
状が明jiff ’CないならJril−のデスクリプ
タ(5)、1つの極大員又は極小点がある」8合には1
スクリプタ(6)をイζJ’j7Jる。この1シリ”C
1,J約26のデスクリプタで音声の記述をi−i”、
>つCいる。l 実施191 次にこれらのデスクリプタが如何にして?4 :”1j
:、X識に使用されるかを説明・ノる。これ(ごは例;
<、 t、C所定の話者が発?P1シた単語を疋めるデ
スクリン゛りについ(見るのか、J、い。例とし11詔
lシツクスlを用いる。、第7図には所定の話者により
弁1°′−キれたこの111δIiのタイム−Iンニ1
−ゲラ]・ス1ご−Jンシボルストリームの一部を示し
である。このシン11、シストリームiJ、第4図に示
したアルフッ2ヘツ1−を用いUY−ε05図及び第0
図を参照しく1ねに説明される如き符号器で生成される
。
N でTit、低周波数(,1,11°11周波数ti
Iと1t71iイrには+7) :1″化しなくてもJ
、い1、 従って第4図を参照()るに、3つのIT、j 47る
持続II’■間を有りるが極大jj、1及び(((小I
j、九をイ]さイfい最ηjの3つのシンボル(1,2
及び3)には、同一のデスクリプタ(1)が(N1勺さ
1しる。シンボルO及び7には同一のデスクリプタ(4
)が(J”jされる。シンボル8,9及び10には、形
状が明jiff ’CないならJril−のデスクリプ
タ(5)、1つの極大員又は極小点がある」8合には1
スクリプタ(6)をイζJ’j7Jる。この1シリ”C
1,J約26のデスクリプタで音声の記述をi−i”、
>つCいる。l 実施191 次にこれらのデスクリプタが如何にして?4 :”1j
:、X識に使用されるかを説明・ノる。これ(ごは例;
<、 t、C所定の話者が発?P1シた単語を疋めるデ
スクリン゛りについ(見るのか、J、い。例とし11詔
lシツクスlを用いる。、第7図には所定の話者により
弁1°′−キれたこの111δIiのタイム−Iンニ1
−ゲラ]・ス1ご−Jンシボルストリームの一部を示し
である。このシン11、シストリームiJ、第4図に示
したアルフッ2ヘツ1−を用いUY−ε05図及び第0
図を参照しく1ねに説明される如き符号器で生成される
。
第7図1;k !11i1i! lシックス」のシンポ
ルストリームを承り。第8図は’I’ iri l−シ
ックス1のタイム」ン−+ −−7’ツ1〜スピーディ
ヘン1−を2次元にプ11ツ1へしたもの、゛つまり[
Δ]マトリクスを示り1.最初の数239は別のデスク
リプタ(1)が後続Jるl″゛゛スクリプク)の総数(
、(りる5、数71 LL、でれそれデスクリプタ(1
)に後Xノ1汽\れるフースクリノ“り(2)のらシを
承り、1数7/Iは(2)に1りわ°Llされるノ゛ス
クリゾク(1)の総数である。jメト同();にしくf
ノ+1 < nこの71−リクスC1,、A\斤明のり
f il、Lい一天施1シI]においC単語又は詰1’
lを712:(別りるの(、−用いられろ阜ホ的な基準
とイ「る11.・トリクスh曹)なるイヘン1−間の多
くの相17関1,4’4は、lir;の光量にノIしろ
刈1[:にあ、上り影響されイ車い、’、 I’llえ
ぽントリクス中のf!uも胃1著な、イベンl−1/l
I+’を置は、hllの長さを)出出に光?ηした[
シックス1か−)より引さ延i、r L ’(ブt1[
′lシた[シイーツクス1に変λ−て6あ51り影響を
支・(〕ない1.この場合変化りるのはタ、イノ\Lン
ー1〜−ノッドスピーヂイベントの外形の7/(あり、
他の関係ににり話者か識別さ1;る1゜ TFSシンボルストリーノ\はさらに昌次元の−1)l
−リクスに形成りるC:どが℃さる。ここ(・甲)クロ
な2次元「へコマ1〜リクス(61説明のためのみに用
いられ(いる。
ルストリームを承り。第8図は’I’ iri l−シ
ックス1のタイム」ン−+ −−7’ツ1〜スピーディ
ヘン1−を2次元にプ11ツ1へしたもの、゛つまり[
Δ]マトリクスを示り1.最初の数239は別のデスク
リプタ(1)が後続Jるl″゛゛スクリプク)の総数(
、(りる5、数71 LL、でれそれデスクリプタ(1
)に後Xノ1汽\れるフースクリノ“り(2)のらシを
承り、1数7/Iは(2)に1りわ°Llされるノ゛ス
クリゾク(1)の総数である。jメト同();にしくf
ノ+1 < nこの71−リクスC1,、A\斤明のり
f il、Lい一天施1シI]においC単語又は詰1’
lを712:(別りるの(、−用いられろ阜ホ的な基準
とイ「る11.・トリクスh曹)なるイヘン1−間の多
くの相17関1,4’4は、lir;の光量にノIしろ
刈1[:にあ、上り影響されイ車い、’、 I’llえ
ぽントリクス中のf!uも胃1著な、イベンl−1/l
I+’を置は、hllの長さを)出出に光?ηした[
シックス1か−)より引さ延i、r L ’(ブt1[
′lシた[シイーツクス1に変λ−て6あ51り影響を
支・(〕ない1.この場合変化りるのはタ、イノ\Lン
ー1〜−ノッドスピーヂイベントの外形の7/(あり、
他の関係ににり話者か識別さ1;る1゜ TFSシンボルストリーノ\はさらに昌次元の−1)l
−リクスに形成りるC:どが℃さる。ここ(・甲)クロ
な2次元「へコマ1〜リクス(61説明のためのみに用
いられ(いる。
第5図を参照ηるt、y、第5図は本発明の1実施例に
よる音店認識方式の一ノ1■1−チ17−1へでi(5
る。
よる音店認識方式の一ノ1■1−チ17−1へでi(5
る。
マイクロホンラーーブ記録又は電話線からの?”′、声
は、I’ I N Jから信号の周波数内&を例えは3
001−17から3.3 kt−1zに制限りるフィル
タを含む前処理′1へ供給される。使用されるマイク1
1ホンの1fI性によっては、入力音7jIにJ”)弓
rの周波数内容を勺えるため)II(分向微分7/槓分
等の前処理をtsなう必要かある。音声をタイム」−ン
コーラ0゛イング(TII S rJ8 化) !ll
’ Zy 前ニA C結合/ D C除去ヲiJ 4;
う必要がある場合もある。
は、I’ I N Jから信号の周波数内&を例えは3
001−17から3.3 kt−1zに制限りるフィル
タを含む前処理′1へ供給される。使用されるマイク1
1ホンの1fI性によっては、入力音7jIにJ”)弓
rの周波数内容を勺えるため)II(分向微分7/槓分
等の前処理をtsなう必要かある。音声をタイム」−ン
コーラ0゛イング(TII S rJ8 化) !ll
’ Zy 前ニA C結合/ D C除去ヲiJ 4;
う必要がある場合もある。
第5a図(J、)戸波後直流除去段2ど、1次巡回フィ
ルタ3と、周囲雑音に依(rりるfi!i’ ?At
L/さいlEiか越えられた場合にのみ;、と、答づる
周囲211昌直流しぎい(白塗出段4どからなる414
成を承り。
ルタ3と、周囲雑音に依(rりるfi!i’ ?At
L/さいlEiか越えられた場合にのみ;、と、答づる
周囲211昌直流しぎい(白塗出段4どからなる414
成を承り。
次い−(1a号はTIS符号器5に送られる。、1[−
8符号器の一実施例は第6図に示しCある。芽)6図を
参照Jるに、帯域制限され前処理された人力音声は、△
/D変換器6及び適当な[1ジツ91で71−1シツク
7、R7カウンタ8.エクストレマl\1」シック9及
び正の極小点及び負の極大53このカウンタ10を介し
−(−1−l 、、”iシンポルストリームに変換され
る。ブ「Iクラ、′/ルリードAンリメしり1′1及び
協働り−るI」シック1.+4、第7図に中i、ri
lシックス」の一部につい(例示lツノご如<1)l≧
]1り1]ス点の4数及び1))ilの極小+、、i及
び(1の(1(L人1i、ミの泪故によりi)ドレスさ
1する(どに応じ(l’nJヒッ1への王[7Sシンポ
ルストリ− 4図の一r IE S ノ’ルフノノl\ツトを含む索
引ンーlルとしC沖力く。
8符号器の一実施例は第6図に示しCある。芽)6図を
参照Jるに、帯域制限され前処理された人力音声は、△
/D変換器6及び適当な[1ジツ91で71−1シツク
7、R7カウンタ8.エクストレマl\1」シック9及
び正の極小点及び負の極大53このカウンタ10を介し
−(−1−l 、、”iシンポルストリームに変換され
る。ブ「Iクラ、′/ルリードAンリメしり1′1及び
協働り−るI」シック1.+4、第7図に中i、ri
lシックス」の一部につい(例示lツノご如<1)l≧
]1り1]ス点の4数及び1))ilの極小+、、i及
び(1の(1(L人1i、ミの泪故によりi)ドレスさ
1する(どに応じ(l’nJヒッ1への王[7Sシンポ
ルストリ− 4図の一r IE S ノ’ルフノノl\ツトを含む索
引ンーlルとしC沖力く。
第4図の?1号化0) t#!成は、l F S ’<
’コ”i 器:)ノ7ー二17クヂAノ内にブ11グ,
ノlXされる。−1− fE S首号器は第1図に示し
たl,) ニー9の絹合わμを同定し、第4図に適葺示
したシンボルに変換し、1′3号器5の出力から出力し
てl l 5−;シンポルストリームを形成りる。
’コ”i 器:)ノ7ー二17クヂAノ内にブ11グ,
ノlXされる。−1− fE S首号器は第1図に示し
たl,) ニー9の絹合わμを同定し、第4図に適葺示
したシンボルに変換し、1′3号器5の出力から出力し
てl l 5−;シンポルストリームを形成りる。
り1」ツク信号光/l :’!: 1 2は]」シック
を同期化りる。
を同期化りる。
1−「Sシンポルストリームから第5図の71ヘリクス
特徴パターン仙11目(に;31ににす、本実施例では
2次元の[Δ」−/トリクスである適宜の:/1−リク
スがつくられる。△71ーリクスLl、1j+徴バクー
ン仙出:F:;のボックス31eCQる。この揚台抽出
されるパターン又は1j微は△71〜リクス’L( i
k)る、1これ(ま1−「Sシンボルを2次元マトリク
ス℃゛表示したものである。単品[シックス1が光t!
「され+34つるど、形成された2次几A、・1〜リク
ス(、1,、以前生成され早i(1バクーンブ1−1ツ
ク21に記憶,34′L(いた基L(■パターンと比較
される,、この比較は1.’l I?2パターン比較ノ
1−1ツタ/11(、試11う)パターンどJl」らJ
、く−敗りる阜iijパターンを?ノシ定・ノるJ.ら
1,い)1パターンか順次試験パターンと比軽さPLる
か、ン1、た(J試験バクーンか一連の基IIーパター
ンと比較されることC?jなわれる、、第5)図のノ1
]ーブlノー1−の破線1−内に示した機11ヒ(、1
、ブレツシ−( 1″l(!SSey)のM I l)
R O C−Jンビ」−タにJ、リリアルタイムて夫1
1される。F) D I) 1 1がシスラムじルタ及
び[l−りとしC使用され結果のV(〆(Jlに使用さ
れIこ。
特徴パターン仙11目(に;31ににす、本実施例では
2次元の[Δ」−/トリクスである適宜の:/1−リク
スがつくられる。△71ーリクスLl、1j+徴バクー
ン仙出:F:;のボックス31eCQる。この揚台抽出
されるパターン又は1j微は△71〜リクス’L( i
k)る、1これ(ま1−「Sシンボルを2次元マトリク
ス℃゛表示したものである。単品[シックス1が光t!
「され+34つるど、形成された2次几A、・1〜リク
ス(、1,、以前生成され早i(1バクーンブ1−1ツ
ク21に記憶,34′L(いた基L(■パターンと比較
される,、この比較は1.’l I?2パターン比較ノ
1−1ツタ/11(、試11う)パターンどJl」らJ
、く−敗りる阜iijパターンを?ノシ定・ノるJ.ら
1,い)1パターンか順次試験パターンと比軽さPLる
か、ン1、た(J試験バクーンか一連の基IIーパター
ンと比較されることC?jなわれる、、第5)図のノ1
]ーブlノー1−の破線1−内に示した機11ヒ(、1
、ブレツシ−( 1″l(!SSey)のM I l)
R O C−Jンビ」−タにJ、リリアルタイムて夫1
1される。F) D I) 1 1がシスラムじルタ及
び[l−りとしC使用され結果のV(〆(Jlに使用さ
れIこ。
第9図は、71−リクス形成の訂細な]1]−f\ノー
1〜を承1。ボックス34及び30(よ、第(〕図の?
″1パjシン小ル変操叉L1. l l S ’+゛コ
シュ器5〕(Jl4 +,aりる6、第5図の1、′J
徴パターン浦出器又は、ノトリクス形成ボックス3′1
は第1)1ン1のボックス13 2及G− こ3;)に
対応りる。419図f/.1ノ11ーブレートは次のJ
′うに動作1Jる。
1〜を承1。ボックス34及び30(よ、第(〕図の?
″1パjシン小ル変操叉L1. l l S ’+゛コ
シュ器5〕(Jl4 +,aりる6、第5図の1、′J
徴パターン浦出器又は、ノトリクス形成ボックス3′1
は第1)1ン1のボックス13 2及G− こ3;)に
対応りる。419図f/.1ノ11ーブレートは次のJ
′うに動作1Jる。
1、 人カリンブルl x ’u ’lにり・1し、]
レンククリンプト1人カイ・−次の.1.−)に定S%
Jイン、21’.、’II’n].]−ン(+1 v ’+ □ t/) 、1易合 ・−(I Xu (lかつX’ +u ’ 0のi易会 1 X ]1(、’)かつX ’ Ill ’ 0 ノ”r
A 合2 [土ホックl 4 1111 +1;の(′
lHの連わ”、リップルとしC定義りる1。
レンククリンプト1人カイ・−次の.1.−)に定S%
Jイン、21’.、’II’n].]−ン(+1 v ’+ □ t/) 、1易合 ・−(I Xu (lかつX’ +u ’ 0のi易会 1 X ]1(、’)かつX ’ Ill ’ 0 ノ”r
A 合2 [土ホックl 4 1111 +1;の(′
lHの連わ”、リップルとしC定義りる1。
3 [ティノア1,ノンスl l−4In−1を42(
の代−(定S”−il る 3。
の代−(定S”−il る 3。
dn=x’IIX’u1
4、 11に(13(ノるllクストしン11」を、同
11( dm+) sgn(tl+1) X i! =
−S1+ 、0 1+v(!のiYI月に応ヂ)の場合
eで定52覆る。
11( dm+) sgn(tl+1) X i! =
−S1+ 、0 1+v(!のiYI月に応ヂ)の場合
eで定52覆る。
0.」−クスI−レマムの列から、IIT+の差の絶対
(111が所定の1変動誤差」により小さい対を除去り
る。
(111が所定の1変動誤差」により小さい対を除去り
る。
6、’T’ IE S分析の出力は、’If’+た41
土ポックの最初のリンプルにあられれる。でれは含まれ
るリンプルの数ど含J、れる【クストレマノ、の故とか
らなる。
土ポックの最初のリンプルにあられれる。でれは含まれ
るリンプルの数ど含J、れる【クストレマノ、の故とか
らなる。
7、 数が両ブノとし所定の範囲内にある場合に(3L
、下1三S故は単独なマツピングにより配置さ(しる。
、下1三S故は単独なマツピングにより配置さ(しる。
こ、t′tは&′19図の[スクリーニング−1ボツク
ス3 ’Iで行な4っれる。
ス3 ’Iで行な4っれる。
と3.1クストレマムの数が最大舶を越える場合は、こ
の最大値を入力ど刀る。1−1クスhし/ lxの数が
1J、り小さい場合は、イベントは([’、 1ve]
変動誤差l1Fj内の)背子谷1音から生じた乙のとみ
なしで遅A1線はクリ17される。
の最大値を入力ど刀る。1−1クスhし/ lxの数が
1J、り小さい場合は、イベントは([’、 1ve]
変動誤差l1Fj内の)背子谷1音から生じた乙のとみ
なしで遅A1線はクリ17される。
9.4ノンプルの数が8′[容最人館より多い場合(二
す遅延線はクリアされる。
す遅延線はクリアされる。
H)、 i−E S数はりセッI〜可能遅延線に周込J
(、れる。「延線かい〕ぽいになった」471合、近延
されlこ故が読出され人カフ・′出力の組合ゎμかN次
几く本実施1シリで(,1、N2)のントリクスにj′
IIムレ−1〜される1、リレットされるどjイ延Lj
lはじストグラムがノ′ツノデートさ1′シる前M、
’iTjびノ!り:1」ムレ−1へさ4L17ロ91/
iら4iXい1゜11、最す人力の多が)た(”I ’
+故(1顕乙なイl\ントJ)がヒス1.グツ11がら
jバIIセされ、イのマIヘリクスの座(票(、八It
1iftされる13本実施(9]の1/\−171−
リクスでほこIt 1.1第ε3図にノ1、シた2次元
神Fである。
(、れる。「延線かい〕ぽいになった」471合、近延
されlこ故が読出され人カフ・′出力の組合ゎμかN次
几く本実施1シリで(,1、N2)のントリクスにj′
IIムレ−1〜される1、リレットされるどjイ延Lj
lはじストグラムがノ′ツノデートさ1′シる前M、
’iTjびノ!り:1」ムレ−1へさ4L17ロ91/
iら4iXい1゜11、最す人力の多が)た(”I ’
+故(1顕乙なイl\ントJ)がヒス1.グツ11がら
jバIIセされ、イのマIヘリクスの座(票(、八It
1iftされる13本実施(9]の1/\−171−
リクスでほこIt 1.1第ε3図にノ1、シた2次元
神Fである。
第10図は音i!i11名識/J代の一応用例を承り。
電詰懇は上記に第5図及び第(っ51図を参照しく説明
した?:’+ N’!認r5器1(1:〕/l’ ”)
4’ <J。/ r’/ If 小ン103ハj?l
譬信i3 ヲ受CJ(〔+’L <5 ;7 識’、
’:(: N12へr、)= ル++ 認識器は、フン
クスイッ/ 104/2に揉ゎ’t L rFh作非動
作の切換えを行イ、“)aIII御スイッヂ10/l/
lを石りる3、このスイッチは、゛市話機が使用される
磨に動作するJ:う押され、認識された命令が受取られ
るまでの所定期間認識器を動作さμる0、かがる命令は
:j: !クイ1フルー1を含む。その1りに例えLL
連の故11.;llJ、lワンJ・・・1ノ?′/J
が続< (l iVi[ボース」によ′つて、例えばレ
ベル9の41〜1内I′しF)+交換てタイ飄ノリング
のイル11を1中入りるJ、うりr\ノリングの列が体
」lりる。命令には他に「−11ノシレル1.「Aフッ
ツク」、1−Δフッツク」又(、[これうどイ”9 f
t11iなしのか含5Lれる。命令[グイ1フル11、
L例え(3[タイ1ノリングのためl−71ツノツク」
払1序とりるにうにされ(いる。
した?:’+ N’!認r5器1(1:〕/l’ ”)
4’ <J。/ r’/ If 小ン103ハj?l
譬信i3 ヲ受CJ(〔+’L <5 ;7 識’、
’:(: N12へr、)= ル++ 認識器は、フン
クスイッ/ 104/2に揉ゎ’t L rFh作非動
作の切換えを行イ、“)aIII御スイッヂ10/l/
lを石りる3、このスイッチは、゛市話機が使用される
磨に動作するJ:う押され、認識された命令が受取られ
るまでの所定期間認識器を動作さμる0、かがる命令は
:j: !クイ1フルー1を含む。その1りに例えLL
連の故11.;llJ、lワンJ・・・1ノ?′/J
が続< (l iVi[ボース」によ′つて、例えばレ
ベル9の41〜1内I′しF)+交換てタイ飄ノリング
のイル11を1中入りるJ、うりr\ノリングの列が体
」lりる。命令には他に「−11ノシレル1.「Aフッ
ツク」、1−Δフッツク」又(、[これうどイ”9 f
t11iなしのか含5Lれる。命令[グイ1フル11、
L例え(3[タイ1ノリングのためl−71ツノツク」
払1序とりるにうにされ(いる。
l E S 、A?、識器は、インノル8o 119
qt;のシングルJツブ:Jンビ−7−91■に実現さ
れる。。
qt;のシングルJツブ:Jンビ−7−91■に実現さ
れる。。
認識器は、電話4段が動作りる7X i:aU −E
l−とaQ fり者がI!r!l 邪ヲD イ1JIX
20 ヤil 7i’+ & !3’44K ルIIR
: 作’l!’; に、J、る場合等の昌l)jの9更
に夕・]応りるため認識”I ftfjパターンか第5
〕図の阜i(1パターン記・1.Q 21に11成され
るトレーニング又(J学習上−ドどを切1条える別のス
インf−105をイjりる。スイッチlit 5 b?
’r r”命令(実?iりることかできる。連続的学習
機械の場合では、最後に認識されたパターンか!+i
i(Iパターンへの新たな人ツノとしC使用され、−こ
のlI:j :1.CにnA b使用されることの/l
) /+か′)た1、1.櫂パターン装置8換えら1+
る。、 tニー It、 +、−,,I、゛)C′、人
カi゛′電:1が除々に変(つると、5.2品(−ント
リクス(ン′企わり1幾)へ〇山ノ゛「jグラムは14
iに必四(イ1くイ、′る1、電話殿は、1認識器 1
0/(゛制御;Illされる自動つイ\ノリンクナツゾ
−i CM !l Fl +! !l <、−石づる。
l−とaQ fり者がI!r!l 邪ヲD イ1JIX
20 ヤil 7i’+ & !3’44K ルIIR
: 作’l!’; に、J、る場合等の昌l)jの9更
に夕・]応りるため認識”I ftfjパターンか第5
〕図の阜i(1パターン記・1.Q 21に11成され
るトレーニング又(J学習上−ドどを切1条える別のス
インf−105をイjりる。スイッチlit 5 b?
’r r”命令(実?iりることかできる。連続的学習
機械の場合では、最後に認識されたパターンか!+i
i(Iパターンへの新たな人ツノとしC使用され、−こ
のlI:j :1.CにnA b使用されることの/l
) /+か′)た1、1.櫂パターン装置8換えら1+
る。、 tニー It、 +、−,,I、゛)C′、人
カi゛′電:1が除々に変(つると、5.2品(−ント
リクス(ン′企わり1幾)へ〇山ノ゛「jグラムは14
iに必四(イ1くイ、′る1、電話殿は、1認識器 1
0/(゛制御;Illされる自動つイ\ノリンクナツゾ
−i CM !l Fl +! !l <、−石づる。
1J7 iJLバクーンiJ、〕゛ノノ1トレーニング
し−1−にリン1φえられ(いるする’、 L−11:
’/ %命令4ブト昌りろこと(牛1戊される1、万
、■い、1、例えばハ(1[シックス1の試験パターン
をJim Qlバ/) ンのレッ1〜21に記1ixt
・Jる1、 1、t(識七−1” ((J i;!i l ;’ツク
λ1は△71〜リクスに変換さ(′と、ソウト・“/
l /” (Ji i牧パターン相41関係か実?jさ
れ記憶中+/μゝ(のΔ又はJ、り高次ハ、のマl゛リ
クスが、光昌、、’> 、lシA命令による△又(31
1,」、り畠次元の?I〜リクス11−仕較され、相l
L関係をイ「113111、f!か探される。li;
+Qか?fイrイっれJ、う「延がイKc3れる。。
し−1−にリン1φえられ(いるする’、 L−11:
’/ %命令4ブト昌りろこと(牛1戊される1、万
、■い、1、例えばハ(1[シックス1の試験パターン
をJim Qlバ/) ンのレッ1〜21に記1ixt
・Jる1、 1、t(識七−1” ((J i;!i l ;’ツク
λ1は△71〜リクスに変換さ(′と、ソウト・“/
l /” (Ji i牧パターン相41関係か実?jさ
れ記憶中+/μゝ(のΔ又はJ、り高次ハ、のマl゛リ
クスが、光昌、、’> 、lシA命令による△又(31
1,」、り畠次元の?I〜リクス11−仕較され、相l
L関係をイ「113111、f!か探される。li;
+Qか?fイrイっれJ、う「延がイKc3れる。。
−般
現行(7) V R′lil’ f111+ (用イ’
> レ−(イル26 (1) シンポルアルノノノヘツ
I−+、艮、ディジタル654+T方ヱ(用に構成され
Cいる。1アルフッ′ヘットは、3001−1zか63
.3 kl−I Zま゛(゛に帯域制御見された人力音
声波形から−じツ1〜レー1〜が最小のディジタル出力
が1′〕られj、う(14成され(いる。ヒ゛ツトレー
1へを1rii約・」るため、この)フルフッ/ベット
((よ、f:’j lプ91+;i間が1.2及び3単
位時間のrr5.5Uの3つの畠11i−L、グメン1
〜を単一の1” E Sシンボルl i Jにり・]応
さける1、これはディジタル?:’i ?’7913理
どしくは妥当な11b約(d’>るが、音声認識どして
は無声音に通富伴4f・)伸ノイの異なる短いシンボル
分布を区別づる11丁能イ1が減少りる。
> レ−(イル26 (1) シンポルアルノノノヘツ
I−+、艮、ディジタル654+T方ヱ(用に構成され
Cいる。1アルフッ′ヘットは、3001−1zか63
.3 kl−I Zま゛(゛に帯域制御見された人力音
声波形から−じツ1〜レー1〜が最小のディジタル出力
が1′〕られj、う(14成され(いる。ヒ゛ツトレー
1へを1rii約・」るため、この)フルフッ/ベット
((よ、f:’j lプ91+;i間が1.2及び3単
位時間のrr5.5Uの3つの畠11i−L、グメン1
〜を単一の1” E Sシンボルl i Jにり・]応
さける1、これはディジタル?:’i ?’7913理
どしくは妥当な11b約(d’>るが、音声認識どして
は無声音に通富伴4f・)伸ノイの異なる短いシンボル
分布を区別づる11丁能イ1が減少りる。
このアルファベラ1へどこの帯域の結果[11シンボル
が多くイするため「/\171ヘリクス分(lj”Cは
、J、す!1i純り距囚1測定ど比較してillの有効
4「識別が限定される。このような場合、[Δ171ヘ
リクスから]−1」シンボル及び[1」シンボルの組合
]′ノUを除去りることでより有効な識別がされる。V
[くの1i(jは改1魁されるが、検査/比較は2.2
kllzの狭い帯Iff (0,3kl−I Z −
2,5kl−I Z )に制限される。別の−1−1三
Sアルノノノベツトに(j利なプJ?人は、これらの7
.ejいイベン1−に女・1りるデスクリプタを含・む
J、うリイズを人さく・jイて)こと−Cある。
が多くイするため「/\171ヘリクス分(lj”Cは
、J、す!1i純り距囚1測定ど比較してillの有効
4「識別が限定される。このような場合、[Δ171ヘ
リクスから]−1」シンボル及び[1」シンボルの組合
]′ノUを除去りることでより有効な識別がされる。V
[くの1i(jは改1魁されるが、検査/比較は2.2
kllzの狭い帯Iff (0,3kl−I Z −
2,5kl−I Z )に制限される。別の−1−1三
Sアルノノノベツトに(j利なプJ?人は、これらの7
.ejいイベン1−に女・1りるデスクリプタを含・む
J、うリイズを人さく・jイて)こと−Cある。
背ffl 241高が犬さい1ち1合(・こけ、例えば
′シー、、−1,−1−口r+(PZ)及びイン9ボl
ノー−)ラドty11 < 17)簀の別の丁IE S
アルツノ′ベット4・用いるのか右4.11である。
′シー、、−1,−1−口r+(PZ)及びイン9ボl
ノー−)ラドty11 < 17)簀の別の丁IE S
アルツノ′ベット4・用いるのか右4.11である。
杆済的な音声認11rA )’ル「リスノ\どしく、△
、/1つ変換器を用いずに7゛テ1山が+)r +、
sシンボルストリームをIFする非常に饋1甲イI:1
1丁s変換器が考えられる。それはげロタ11シング倹
111冒j4i 、 /71.1ツタ、ノJウンタ及び
1−1シツクゲートを使用しIJt)のである、。
、/1つ変換器を用いずに7゛テ1山が+)r +、
sシンボルストリームをIFする非常に饋1甲イI:1
1丁s変換器が考えられる。それはげロタ11シング倹
111冒j4i 、 /71.1ツタ、ノJウンタ及び
1−1シツクゲートを使用しIJt)のである、。
bとの?゛今産声信号ΦII I’l +Jろ6のど、
微分され/こ?”′1声1:1月に動作′1Jるbのと
の2つのUllり11シング検出器(Z CI) )が
用いI)れる、。
微分され/こ?”′1声1:1月に動作′1Jるbのと
の2つのUllり11シング検出器(Z CI) )が
用いI)れる、。
d、/(It高出力、ある1、′I定の11¥1111
間隔1:11の6どの音戸1侶号中のエクスト1ノマム
の故に関係Jる旧教を−りえる。選択されたn、)間間
隔は、信号の実際の零点の間の時間、−) :I:り微
分されていない111号についての7C1〕の出力間の
91−1ツタ周朋の数((19る。、これらの故は対に
され、−1−[−Sシンポルストリームが11?1うれ
るJ、う適当な[1シツク(処理される。1 この変形例IJ経ξ〕)1的イfイl 7.’、)を幾
つか44 ’iJインが、△/′1)変1グ3)E(を
用いる実施例が右りる)の応1’lに欠()る1、シか
し、イれ)よ幾つかの中背な粁消的イ〔因子に人さな影
ν゛(シをljえる、ある水<11の]りし端的イ」−
」中細1((を右りる1、
間隔1:11の6どの音戸1侶号中のエクスト1ノマム
の故に関係Jる旧教を−りえる。選択されたn、)間間
隔は、信号の実際の零点の間の時間、−) :I:り微
分されていない111号についての7C1〕の出力間の
91−1ツタ周朋の数((19る。、これらの故は対に
され、−1−[−Sシンポルストリームが11?1うれ
るJ、う適当な[1シツク(処理される。1 この変形例IJ経ξ〕)1的イfイl 7.’、)を幾
つか44 ’iJインが、△/′1)変1グ3)E(を
用いる実施例が右りる)の応1’lに欠()る1、シか
し、イれ)よ幾つかの中背な粁消的イ〔因子に人さな影
ν゛(シをljえる、ある水<11の]りし端的イ」−
」中細1((を右りる1、
り)1図(,1ランタムな音り4j波形、第2図は第1
図の波形の各レグメンl−(7) 量子化された持続]
l′j間を示づ図、第3図は第1図の波形の各レグメン
I−(゛の桟人又【よ極小を承り図、′iA/′1図1
、]、ホ発明の1実施1列で1史用りる/ごめ導かれた
シンボルアルツノツ[〜、第5〕図は本発明の1実施例
による?”: r”認識y)へのフlN − ’f\7
ー1〜、第!.)a図は前処理のノlー1−ヂA7−1
・、第6図【J第X5図の方式の復号器部のブロック図
、第7図は第5図の方式(生成されたv11シックスの
、行を左1)t rう右,j二からIZへIM+に記さ
れたシン小ルス1ーリーム、第8図は第7図のシン11
\ルストリームの′/)次ハ11△1\ノ1ーリ9ス、
第1)図(ま第33図の△、・I・り勺スを11成りる
ための)IJ−ブー−ノー1−、第′10図は第り図の
プノ+(A−’ Ill,山電l詰に1戸用したしのの
回り′8図Cある1。 1・・・1)(1処狸、2・・冒+’l’tAン. F
4”、)、段、こ3・・′1次巡回フイルり、1・・・
周囲層I昌1肖流しさいIlf+ I史出段、1〕II
−S旬号器、(3・・・/\ l) l>、 l受器、
7・・R 、;’ 1.1シツク、8・・・[【/カラ
ン′)、)〕・・・IクスI・レビノ\I−1シック、
′IC)・・・11[の(4(小j1°、!及び゛【1
の(4i人1.“、;のカウンタ、11・・・ブ1」ク
ラ、lfル1り0〜1、′12・・・り1−1ツタ化号
梵牛’D、2′1・・J,l illバクーン、3′1
・・・、・I−リクスfi 微パターン曲出、34・・
・スクリーーシ′/、41・・・’Cr i牧パターン
比軸、 102・・・昌j’F’ ii只1八孔、1[
)3.=、’ インIN ;Ji >−、 lf)/l
,/ 1− 1+’l illl スイ’ン’/、10
4、’ 2・・ソックスrツ1、1 (1 :i・・・
スインJ、。 4Cr i:1出騨1人 レユ゛・Δル1〜 アルフレ
ツドゝ・ 図面のI:1:’j’、1′男゛7に変更な
し)〜・1 〜・2・ l勿、3゜ 00 1 0 2 0 ト→→−←−−1−=−f−−−←−1+→−−H〜、
Z 6111jlj111121211 6136j21S112j61,24 111Siii211124211 161jij112 4326612 1211316335244342 12425521を11コ1116j iji811212241 1225 422116151.3112A25 4211111111264211 1211211+2111T311 111111111144252 4 8 41815112111 111111+1li2
1jiTi 1211 11jTi214T1111253 〜・4・ 口 13 14 15 16 17 18 19 20 2
1 22 23 2425 2611、、、、.2.、
、、。 2.1 1 、 。 1 1 。 1 1 1 1 1 、 2 。 11162 、.421 31.121 32 、 362 、 、 、1 3 、 、 、、 1 、 、、 、 、 、 、 。 1 1 。 手Ueン市、+−LiW鳴 昭和59年9月271 特n庁長官 志 賀 学 殿 1、小イ′1の表示 昭和59年 特b′[願 第182535号2、発明の
名称 音声信号認識方法及び音声信号認識方式3、補正をりる
者 小作どの関係 特8′F出願人 住 所 イギリス国 リーディング アールジ−36ア
ール]ニル クリープトン l−1−ド 6番地氏 名
レジナルト アルフレッド キング(In1祐 イニ
1カス国) 4、代理人 住 所 〒102 東京都千代田区麹町5丁目7番地5
、補正命令の日刊 自発補正 図面。 7、補正の内容 図面の浄8(内’?fに×−′史なし)を別紙の通り補
充づる。
図の波形の各レグメンl−(7) 量子化された持続]
l′j間を示づ図、第3図は第1図の波形の各レグメン
I−(゛の桟人又【よ極小を承り図、′iA/′1図1
、]、ホ発明の1実施1列で1史用りる/ごめ導かれた
シンボルアルツノツ[〜、第5〕図は本発明の1実施例
による?”: r”認識y)へのフlN − ’f\7
ー1〜、第!.)a図は前処理のノlー1−ヂA7−1
・、第6図【J第X5図の方式の復号器部のブロック図
、第7図は第5図の方式(生成されたv11シックスの
、行を左1)t rう右,j二からIZへIM+に記さ
れたシン小ルス1ーリーム、第8図は第7図のシン11
\ルストリームの′/)次ハ11△1\ノ1ーリ9ス、
第1)図(ま第33図の△、・I・り勺スを11成りる
ための)IJ−ブー−ノー1−、第′10図は第り図の
プノ+(A−’ Ill,山電l詰に1戸用したしのの
回り′8図Cある1。 1・・・1)(1処狸、2・・冒+’l’tAン. F
4”、)、段、こ3・・′1次巡回フイルり、1・・・
周囲層I昌1肖流しさいIlf+ I史出段、1〕II
−S旬号器、(3・・・/\ l) l>、 l受器、
7・・R 、;’ 1.1シツク、8・・・[【/カラ
ン′)、)〕・・・IクスI・レビノ\I−1シック、
′IC)・・・11[の(4(小j1°、!及び゛【1
の(4i人1.“、;のカウンタ、11・・・ブ1」ク
ラ、lfル1り0〜1、′12・・・り1−1ツタ化号
梵牛’D、2′1・・J,l illバクーン、3′1
・・・、・I−リクスfi 微パターン曲出、34・・
・スクリーーシ′/、41・・・’Cr i牧パターン
比軸、 102・・・昌j’F’ ii只1八孔、1[
)3.=、’ インIN ;Ji >−、 lf)/l
,/ 1− 1+’l illl スイ’ン’/、10
4、’ 2・・ソックスrツ1、1 (1 :i・・・
スインJ、。 4Cr i:1出騨1人 レユ゛・Δル1〜 アルフレ
ツドゝ・ 図面のI:1:’j’、1′男゛7に変更な
し)〜・1 〜・2・ l勿、3゜ 00 1 0 2 0 ト→→−←−−1−=−f−−−←−1+→−−H〜、
Z 6111jlj111121211 6136j21S112j61,24 111Siii211124211 161jij112 4326612 1211316335244342 12425521を11コ1116j iji811212241 1225 422116151.3112A25 4211111111264211 1211211+2111T311 111111111144252 4 8 41815112111 111111+1li2
1jiTi 1211 11jTi214T1111253 〜・4・ 口 13 14 15 16 17 18 19 20 2
1 22 23 2425 2611、、、、.2.、
、、。 2.1 1 、 。 1 1 。 1 1 1 1 1 、 2 。 11162 、.421 31.121 32 、 362 、 、 、1 3 、 、 、、 1 、 、、 、 、 、 、 。 1 1 。 手Ueン市、+−LiW鳴 昭和59年9月271 特n庁長官 志 賀 学 殿 1、小イ′1の表示 昭和59年 特b′[願 第182535号2、発明の
名称 音声信号認識方法及び音声信号認識方式3、補正をりる
者 小作どの関係 特8′F出願人 住 所 イギリス国 リーディング アールジ−36ア
ール]ニル クリープトン l−1−ド 6番地氏 名
レジナルト アルフレッド キング(In1祐 イニ
1カス国) 4、代理人 住 所 〒102 東京都千代田区麹町5丁目7番地5
、補正命令の日刊 自発補正 図面。 7、補正の内容 図面の浄8(内’?fに×−′史なし)を別紙の通り補
充づる。
Claims (1)
- 【特許請求の範囲】 (1) タイム」−ンコーデツドスビーヂ(1−I三S
)を用いることで特徴イ1()られる?ン「戸j信号認
識方法、。 (2) タイ11土ンコーデツドスビー’f(−l−1
[S )シン小ルイベン1ヘデスクリブタを用いること
Ctji徴f;HJられる特iJ[請求の範囲第1項記
載の8重信号認識))法。 (3) 音iij信号let −r E S −7;A
v ツh −’C<[’ ;3 化0れ、]−[]S
シンポルストリーからなるパラメータの少なくと一6幾
−)かど試験(ii ’;’jどの関係が合声信号の性
τ°(を承り出力信F′jが結果どしC117られるに
う調査されることをq!1徴どする??1声認識方式。 (4) パラメータは、シンポルストリー11及び、/
又はシンボルストリームの構成及び/又はシンボルスト
リーム占有位置、軌跡又は移動からなるイベントを含む
。ことを特徴どりる’l”I R’l 請求の範囲第3
項記載の?”’+lfj認識り式、。 (5) 試験(IEi号は、試jすj昌声イ1−号又は
曲シ1す化さ4zk又は人工的な(i’j ”r (’
II’)ることを1“j徴ど1ノる1、”1t71請
求の範囲第+3If’! i+L!載のN37jj認識
万」(。 (6) パラメータのP+Q 1.、’: 、上る記j
小はパラメータの幾つか又は全部り目)ど;1かれ試験
イハ号ど比較されることを121徴どりろ1、“l u
’l 請求の範囲第31ri記載のfj+ j” jm
Z識万式、。 (7) 調査されるパラメータは正の(か小1i(jで
あることを特徴とりるT+ il’l請求の範囲第3J
11記載の音声認識方式。 (8) 調査されるパラメータは負の極人貞であること
を特徴ど!Jイ) i”l i+’l 請求の範囲第3
Jj’i記載の音声認識方式。 (9) 正の(か小点及び(iの(Φ人魚の数は各11
・5間レグメン1〜毎に31数され、各1時間セグメン
1−の【ハ子化された1h続+1.’1間が測定され、
数にJ、る−J゛スクリブタそれに応じ(’(=J与さ
れることを特徴とする特5′F請求のaむ間第3D’を
記載のf37jj認識lノ式。 〈10〉入力音7.ji倍信号帯域が制限されてJ3す
、帯域中の高い周波数の信号は正の極小点及び負の極大
点の検査を受tノないことを特徴とする特π[請求の範
囲第9項記載の音声認識方式。 (11)帯域中の低い周波数の信号は、符号化の節約の
!こめ測定パラメータにJ3い′C相違が検出されて一
〇同一の数による記述がf]与されることを特徴どりる
’l’!I n’l’ 請求の範囲第91i′!記載の
昌;11五R品Vノ“jl(。 (12)タイム土ンコーデット′スビーヂ(]1三S)
を用いる音声信丹認識方法J、たは音声信号+、I:
TfE SフA−マツ1〜で符号化され、T [q s
シンポルス]・リームからなるパラメータの少4「<ど
も幾つかと試験信号との関係が81[1侶÷〕のf’l
: 74を示づ出力信号が結果としてI+51られるよ
う調Mされる音声認識方式で制御されることを1J1徴
どする自動ダイAフル式電話機。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB8323481 | 1983-09-01 | ||
GB08323481A GB2145864B (en) | 1983-09-01 | 1983-09-01 | Voice recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6078500A true JPS6078500A (ja) | 1985-05-04 |
JP2619852B2 JP2619852B2 (ja) | 1997-06-11 |
Family
ID=10548188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59182535A Expired - Fee Related JP2619852B2 (ja) | 1983-09-01 | 1984-08-31 | 音声信号認識方法及び音声認識方式 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5091949A (ja) |
EP (1) | EP0141497B1 (ja) |
JP (1) | JP2619852B2 (ja) |
AT (1) | ATE48199T1 (ja) |
DE (1) | DE3480569D1 (ja) |
GB (1) | GB2145864B (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8416496D0 (en) * | 1984-06-28 | 1984-08-01 | King R A | Encoding method |
GB8720527D0 (en) * | 1987-09-01 | 1987-10-07 | King R A | Voice recognition |
GB2223844A (en) * | 1988-10-12 | 1990-04-18 | Graviner Ltd | Flame detector |
NO180737C (no) * | 1988-10-12 | 1997-06-04 | Detector Electronics | Apparat og fremgangsmåte for å diskriminere mellom elektromagnetisk stråling fra en brannkilde og fra en ikke-brannkilde |
US5237512A (en) * | 1988-12-02 | 1993-08-17 | Detector Electronics Corporation | Signal recognition and classification for identifying a fire |
GB9103349D0 (en) * | 1991-02-18 | 1991-04-03 | King Reginald A | Artificial neural network systems |
US5355430A (en) * | 1991-08-12 | 1994-10-11 | Mechatronics Holding Ag | Method for encoding and decoding a human speech signal by using a set of parameters |
GB9806401D0 (en) * | 1998-03-25 | 1998-05-20 | Domain Dynamics Ltd | Improvements in voice operated mobile communications |
GB9817500D0 (en) | 1998-08-12 | 1998-10-07 | Domain Dynamics Ltd | Advantageous time encoded (TESPAR) signal processing arrangements |
US6301562B1 (en) * | 1999-04-27 | 2001-10-09 | New Transducers Limited | Speech recognition using both time encoding and HMM in parallel |
US7085717B2 (en) * | 2002-05-21 | 2006-08-01 | Thinkengine Networks, Inc. | Scoring and re-scoring dynamic time warping of speech |
US6983246B2 (en) * | 2002-05-21 | 2006-01-03 | Thinkengine Networks, Inc. | Dynamic time warping using frequency distributed distance measures |
JP3827317B2 (ja) * | 2004-06-03 | 2006-09-27 | 任天堂株式会社 | コマンド処理装置 |
US20080284409A1 (en) * | 2005-09-07 | 2008-11-20 | Biloop Tecnologic, S.L. | Signal Recognition Method With a Low-Cost Microcontroller |
US9697824B1 (en) * | 2015-12-30 | 2017-07-04 | Thunder Power New Energy Vehicle Development Company Limited | Voice control system with dialect recognition |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0004759A2 (en) * | 1978-04-04 | 1979-10-17 | National Research Development Corporation | Methods and apparatus for encoding and constructing signals |
GB2020517A (en) * | 1978-04-04 | 1979-11-14 | King R A | Methods and apparatus for encoding and constructing signals |
GB2084433A (en) * | 1978-04-04 | 1982-04-07 | Gosling Harold William | Methods and apparatus or encoding and constructing signals |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3125723A (en) * | 1964-03-17 | shaver | ||
USB83255I5 (ja) * | 1961-11-14 | |||
US3278685A (en) * | 1962-12-31 | 1966-10-11 | Ibm | Wave analyzing system |
GB1170306A (en) * | 1967-11-16 | 1969-11-12 | Standard Telephones Cables Ltd | Apparatus for Analysing Complex Waveforms |
GB1012765A (en) * | 1964-03-06 | 1965-12-08 | Standard Telephones Cables Ltd | Apparatus for the analysis of waveforms |
GB1155422A (en) * | 1965-08-24 | 1969-06-18 | Nat Res Dev | Speech Recognition |
US3466394A (en) * | 1966-05-02 | 1969-09-09 | Ibm | Voice verification system |
GB1139711A (en) * | 1966-11-30 | 1969-01-15 | Standard Telephones Cables Ltd | Apparatus for analysing complex waveforms |
FR1543791A (fr) * | 1966-12-29 | Ibm | Système d'analyse de la parole | |
US3742143A (en) * | 1971-03-01 | 1973-06-26 | Bell Telephone Labor Inc | Limited vocabulary speech recognition circuit for machine and telephone control |
FR2150174A5 (ja) * | 1971-08-18 | 1973-03-30 | Dreyfus Jean | |
CH549849A (de) * | 1972-12-29 | 1974-05-31 | Ibm | Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls. |
US3940565A (en) * | 1973-07-27 | 1976-02-24 | Klaus Wilhelm Lindenberg | Time domain speech recognition system |
US4178472A (en) * | 1977-02-21 | 1979-12-11 | Hiroyasu Funakubo | Voiced instruction identification system |
US4181813A (en) * | 1978-05-08 | 1980-01-01 | John Marley | System and method for speech recognition |
US4763278A (en) * | 1983-04-13 | 1988-08-09 | Texas Instruments Incorporated | Speaker-independent word recognizer |
-
1983
- 1983-09-01 GB GB08323481A patent/GB2145864B/en not_active Expired
-
1984
- 1984-08-22 DE DE8484305702T patent/DE3480569D1/de not_active Expired
- 1984-08-22 AT AT84305702T patent/ATE48199T1/de not_active IP Right Cessation
- 1984-08-22 EP EP84305702A patent/EP0141497B1/en not_active Expired
- 1984-08-31 JP JP59182535A patent/JP2619852B2/ja not_active Expired - Fee Related
-
1989
- 1989-01-25 US US07/301,365 patent/US5091949A/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0004759A2 (en) * | 1978-04-04 | 1979-10-17 | National Research Development Corporation | Methods and apparatus for encoding and constructing signals |
GB2020517A (en) * | 1978-04-04 | 1979-11-14 | King R A | Methods and apparatus for encoding and constructing signals |
GB2084433A (en) * | 1978-04-04 | 1982-04-07 | Gosling Harold William | Methods and apparatus or encoding and constructing signals |
Also Published As
Publication number | Publication date |
---|---|
ATE48199T1 (de) | 1989-12-15 |
GB2145864B (en) | 1987-09-03 |
GB2145864A (en) | 1985-04-03 |
EP0141497A1 (en) | 1985-05-15 |
US5091949A (en) | 1992-02-25 |
JP2619852B2 (ja) | 1997-06-11 |
EP0141497B1 (en) | 1989-11-23 |
DE3480569D1 (en) | 1989-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6078500A (ja) | 音声信号認識方法及び音声認識方式 | |
CN111164601B (zh) | 情感识别方法、智能装置和计算机可读存储介质 | |
Jalal et al. | Learning temporal clusters using capsule routing for speech emotion recognition | |
CN111415667B (zh) | 一种流式端到端语音识别模型训练和解码方法 | |
Gevaert et al. | Neural networks used for speech recognition | |
CN112037766B (zh) | 一种语音音色转换方法及相关设备 | |
CN110211595B (zh) | 一种基于深度学习的说话人聚类系统 | |
JPS59216284A (ja) | パタ−ン認識装置 | |
CN112466316A (zh) | 一种基于生成对抗网络的零样本语音转换系统 | |
CN113539244A (zh) | 端到端语音识别模型训练方法、语音识别方法及相关装置 | |
CN112669215A (zh) | 一种训练文本图像生成模型、文本图像生成的方法和装置 | |
CN117577119B (zh) | 融合大语言模型的伪造语音检测方法、系统、设备及介质 | |
CN117854492A (zh) | 一种基于大模型的智能交互方法、系统、设备及存储介质 | |
CN113196385A (zh) | 音频信号处理 | |
Van Doremalen et al. | Spoken digit recognition using a hierarchical temporal memory. | |
CN114863949A (zh) | 情绪识别方法、装置、计算机设备及存储介质 | |
CN114974300A (zh) | 一种基于神经网络的语音鉴伪的方法、装置及存储介质 | |
CN112786000A (zh) | 语音合成方法、系统、设备及存储介质 | |
TWI780382B (zh) | 微控制器更新系統和方法 | |
JPH01204099A (ja) | 音声認識装置 | |
Patel et al. | A Performance Study: Convolutional Deep Belief Networks and Convolutional Neural Networks for Audio Classification | |
JP3318958B2 (ja) | 学習型波形認識処理装置 | |
Revesz | A Generalization of the Chomsky-Halle Phonetic Representation using Real Numbers for Robust Speech Recognition in Noisy Environments | |
JP5078032B2 (ja) | 音源同定方法及び音源同定装置 | |
Sahoo et al. | Word extraction from speech recognition using correlation coefficients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |