JPS6078500A - 音声信号認識方法及び音声認識方式 - Google Patents

音声信号認識方法及び音声認識方式

Info

Publication number
JPS6078500A
JPS6078500A JP59182535A JP18253584A JPS6078500A JP S6078500 A JPS6078500 A JP S6078500A JP 59182535 A JP59182535 A JP 59182535A JP 18253584 A JP18253584 A JP 18253584A JP S6078500 A JPS6078500 A JP S6078500A
Authority
JP
Japan
Prior art keywords
recognition
recognition method
signal
symbol
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59182535A
Other languages
English (en)
Other versions
JP2619852B2 (ja
Inventor
レジナルド アルフレツド キング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JPS6078500A publication Critical patent/JPS6078500A/ja
Application granted granted Critical
Publication of JP2619852B2 publication Critical patent/JP2619852B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Electric Clocks (AREA)
  • Selective Calling Equipment (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明1..L音β1信;3/、、 i認識4るIJ払
及びノi j、いこIIIりる。
従来の技術 I E E r= i−ランスツノクシ:1ンズ ノノ
ンド 1ミコニクーシヨンス(I l−にTfE r 
ransactio++5and Communica
tion:; ):”j: Com29巻5 ’r’r
 (1981年5月)に技術の現状が、l(2明され(
いる。
ハンブルりの〕・イリゾス G用IJ11のM、l−1
,ターンはヨーロピアン 十しク1へロニクス インJ
−ス’ ([E uro+)ca++ l 1cclr
ouics J 5suas ) C3。
1981からイシュー’I 、 +4182に、8声認
識理論及びj主すス インスッルメンツ、ノイリブス及
びl\ル研究所により考采されlζ15式を説明りる一
連□の記事を寄稿している。1 ミドルセックス、うj′rン1〜ンのフシ:1ノルフイ
ジカル ラボーノトリイズの13.1三、レイ及びC,
R,、:r−バンズは、r+ j+i認識の実用的方式
について彼らが行なった開光につい−(説明した記事を
インタナショナル ジ1/−)−ル ンンマシン スタ
デイズ(I l)t、 +J 、 M 1111−M 
1lcllill(! S 1.U(IrO2)(19
81年>1/1.13〜17に寄稿しCいる1゜」二記
の文献は完全な解11rを説明したもの(・あり、IJ
どんどの場合多数のh11朶及び連続音7j、iの認i
、r&を試みている。
(工する(小の応用(は、(;(械を動伯さUるIこめ
の10乃〒20の異なる命令用飴等の限られIこifi
! ’:A“パのみか心安(′ある。
かかる洛声認識装買(:L次のようイjbのがl!X 
+、−山1v8れでいる。
日本電気のD II)−200 インクスノー−1・ 1−レグj−11ニスクのVRC
−100−1 小タンのV−5000 A−リクルの1−−9 !’i 0 インラルの 1sl(C−570 発明が解決しJ、うどりる問題点 これらは、1五μjをフィルりにより周波6夕(11(
ご57割し各周波数帯のエネルギレヘルを分析り−ると
いう原理に基づいて動作してa3す、比較的高l1ll
l乙複雑である。
問題点を解決りるl、−めの手段 以前はディジタル昌jli伝送等1(−ilj (Jる
音Tj、の貿号化のみに用いられ(いIl、:lj法を
用いると比較的安1曲C右効イ> ?j +”’ 14
 (d:’+か1141える1゜本発明にJ、れば/ノ
(ム1ント)゛ツドスピーf(“[1ヨS)を用いる(
二と(づ?1徴付(]られる昌71イに号認識方γ人が
1足(Jじ\Iしる1゜4(弁明にJ、ればに+、 /
11、昌Fiイハ号は11−8〕Δ−マット(?:J号
化され、l I” Sシン小ルスj−リームからなるバ
ラメークの少4I:<どらft3つかと試1i6i (
ハ月と(1) l!!I係カf?i r’−’イ、:i
 ; (/I M ’;’4 k: 小U出)J 4−
r月/J’ J’;’+宋としC得られるJ、−)山内
されることをQ10(::りと(〕る音、jj認識1ノ
式がI!r! (1(される、。
作用 従来タイムゴニンー1−1′ツドスビーブはIインタル
8声伝jスに関しくの・7i 、ij/えられてさた。
タイム]−ンコーーノツドスピ−1は、音用1波形の荀
号化の一種−Cあるu t”+ I”波形は、相続く実
際の零J11間のレグメン1−に分;!’Iされる11
例えば第1図131ランダムイ【音声波形を示し、矢印
はけロクロス点を示しCいる。波形の各レグメン1〜に
対し旬号は単一のディジタルワードからなる。この1.
ノートはレグメン1〜の2つのパラメータ、つFl“す
if5子化された持続時間及び形状から導かれ′る1、
1)続11,1間の測定は容易であり、第2図(よ相続
く各レグメントのm子化持続時間2,3.6等を承り。
形状を記述りる方法としては、波のしグメン(〜をレグ
メン1〜におりる正の4ji小点又は負の極大点の数に
より分類リ−るのが好J、しいが、他の方法で形状を記
)ホして−bJ:い。これは第3図に0.0゜1等で示
しである。これら2つのパラメータ(J、数字シンボル
の一意的なアルファベットを形成りるJ:う71−リク
スに構成される。第4図はかかる71〜リクスを承り。
行に治う「S」パラメータI31゜極大点又は極小点の
数であり、列に沿うDパラメータは量子化1)続時間で
ある。ただし、この自然に得られるアルファベットは次
の1111点から甲純化されている。経湾的な11号化
には、この方法C・111+られた自然発生的な識別可
能なシンボルの数(ま、はるかに数の少ない符号デスク
リプタ([7′ルフアベツ1へ」)を形成・jる。J、
う非線型に変換される。
本発明の好ましい1・l、 l牧に、」、リタイム1−
ンニ」−デッドスピーヂフンj−マ゛ソト(により1−
71られるががる符号又はイベントデス/ノリ/゛りが
高7ij認識に用いられる。合1−ji信号が例、Ri
f :l、!i kLI Zに帯域制御シ(されている
なら知いイl\ントには極大点又は極小点をイjしえな
いものが+lする9、好シ1、しい実施例CIよε量子
化は20にピッl−秒Q行なわれる。通常のfIi声に
おける1肖続IY’1間のCM’q囲は、20にピッ1
−リンプルの約3〜3011°1、つ31、す30の2
0 kピッ1−リンプルが3.3 kll/ (i、5
周1す」を表わJ。
タイムエンコーゲッドスピーヂフA−マツ1〜におt、
N でTit、低周波数(,1,11°11周波数ti
Iと1t71iイrには+7) :1″化しなくてもJ
、い1、 従って第4図を参照()るに、3つのIT、j 47る
持続II’■間を有りるが極大jj、1及び(((小I
j、九をイ]さイfい最ηjの3つのシンボル(1,2
及び3)には、同一のデスクリプタ(1)が(N1勺さ
1しる。シンボルO及び7には同一のデスクリプタ(4
)が(J”jされる。シンボル8,9及び10には、形
状が明jiff ’CないならJril−のデスクリプ
タ(5)、1つの極大員又は極小点がある」8合には1
スクリプタ(6)をイζJ’j7Jる。この1シリ”C
1,J約26のデスクリプタで音声の記述をi−i”、
>つCいる。l 実施191 次にこれらのデスクリプタが如何にして?4 :”1j
:、X識に使用されるかを説明・ノる。これ(ごは例;
<、 t、C所定の話者が発?P1シた単語を疋めるデ
スクリン゛りについ(見るのか、J、い。例とし11詔
lシツクスlを用いる。、第7図には所定の話者により
弁1°′−キれたこの111δIiのタイム−Iンニ1
−ゲラ]・ス1ご−Jンシボルストリームの一部を示し
である。このシン11、シストリームiJ、第4図に示
したアルフッ2ヘツ1−を用いUY−ε05図及び第0
図を参照しく1ねに説明される如き符号器で生成される
第7図1;k !11i1i! lシックス」のシンポ
ルストリームを承り。第8図は’I’ iri l−シ
ックス1のタイム」ン−+ −−7’ツ1〜スピーディ
ヘン1−を2次元にプ11ツ1へしたもの、゛つまり[
Δ]マトリクスを示り1.最初の数239は別のデスク
リプタ(1)が後続Jるl″゛゛スクリプク)の総数(
、(りる5、数71 LL、でれそれデスクリプタ(1
)に後Xノ1汽\れるフースクリノ“り(2)のらシを
承り、1数7/Iは(2)に1りわ°Llされるノ゛ス
クリゾク(1)の総数である。jメト同();にしくf
ノ+1 < nこの71−リクスC1,、A\斤明のり
f il、Lい一天施1シI]においC単語又は詰1’
lを712:(別りるの(、−用いられろ阜ホ的な基準
とイ「る11.・トリクスh曹)なるイヘン1−間の多
くの相17関1,4’4は、lir;の光量にノIしろ
刈1[:にあ、上り影響されイ車い、’、 I’llえ
ぽントリクス中のf!uも胃1著な、イベンl−1/l
 I+’を置は、hllの長さを)出出に光?ηした[
シックス1か−)より引さ延i、r L ’(ブt1[
′lシた[シイーツクス1に変λ−て6あ51り影響を
支・(〕ない1.この場合変化りるのはタ、イノ\Lン
ー1〜−ノッドスピーヂイベントの外形の7/(あり、
他の関係ににり話者か識別さ1;る1゜ TFSシンボルストリーノ\はさらに昌次元の−1)l
−リクスに形成りるC:どが℃さる。ここ(・甲)クロ
な2次元「へコマ1〜リクス(61説明のためのみに用
いられ(いる。
第5図を参照ηるt、y、第5図は本発明の1実施例に
よる音店認識方式の一ノ1■1−チ17−1へでi(5
る。
マイクロホンラーーブ記録又は電話線からの?”′、声
は、I’ I N Jから信号の周波数内&を例えは3
001−17から3.3 kt−1zに制限りるフィル
タを含む前処理′1へ供給される。使用されるマイク1
1ホンの1fI性によっては、入力音7jIにJ”)弓
rの周波数内容を勺えるため)II(分向微分7/槓分
等の前処理をtsなう必要かある。音声をタイム」−ン
コーラ0゛イング(TII S rJ8 化) !ll
’ Zy 前ニA C結合/ D C除去ヲiJ 4;
う必要がある場合もある。
第5a図(J、)戸波後直流除去段2ど、1次巡回フィ
ルタ3と、周囲雑音に依(rりるfi!i’ ?At 
L/さいlEiか越えられた場合にのみ;、と、答づる
周囲211昌直流しぎい(白塗出段4どからなる414
成を承り。
次い−(1a号はTIS符号器5に送られる。、1[−
8符号器の一実施例は第6図に示しCある。芽)6図を
参照Jるに、帯域制限され前処理された人力音声は、△
/D変換器6及び適当な[1ジツ91で71−1シツク
7、R7カウンタ8.エクストレマl\1」シック9及
び正の極小点及び負の極大53このカウンタ10を介し
−(−1−l 、、”iシンポルストリームに変換され
る。ブ「Iクラ、′/ルリードAンリメしり1′1及び
協働り−るI」シック1.+4、第7図に中i、ri 
lシックス」の一部につい(例示lツノご如<1)l≧
]1り1]ス点の4数及び1))ilの極小+、、i及
び(1の(1(L人1i、ミの泪故によりi)ドレスさ
1する(どに応じ(l’nJヒッ1への王[7Sシンポ
ルストリ− 4図の一r IE S ノ’ルフノノl\ツトを含む索
引ンーlルとしC沖力く。
第4図の?1号化0) t#!成は、l F S ’<
’コ”i 器:)ノ7ー二17クヂAノ内にブ11グ,
ノlXされる。−1− fE S首号器は第1図に示し
たl,) ニー9の絹合わμを同定し、第4図に適葺示
したシンボルに変換し、1′3号器5の出力から出力し
てl l 5−;シンポルストリームを形成りる。
り1」ツク信号光/l :’!: 1 2は]」シック
を同期化りる。
1−「Sシンポルストリームから第5図の71ヘリクス
特徴パターン仙11目(に;31ににす、本実施例では
2次元の[Δ」−/トリクスである適宜の:/1−リク
スがつくられる。△71ーリクスLl、1j+徴バクー
ン仙出:F:;のボックス31eCQる。この揚台抽出
されるパターン又は1j微は△71〜リクス’L( i
k)る、1これ(ま1−「Sシンボルを2次元マトリク
ス℃゛表示したものである。単品[シックス1が光t!
「され+34つるど、形成された2次几A、・1〜リク
ス(、1,、以前生成され早i(1バクーンブ1−1ツ
ク21に記憶,34′L(いた基L(■パターンと比較
される,、この比較は1.’l I?2パターン比較ノ
1−1ツタ/11(、試11う)パターンどJl」らJ
、く−敗りる阜iijパターンを?ノシ定・ノるJ.ら
1,い)1パターンか順次試験パターンと比軽さPLる
か、ン1、た(J試験バクーンか一連の基IIーパター
ンと比較されることC?jなわれる、、第5)図のノ1
]ーブlノー1−の破線1−内に示した機11ヒ(、1
、ブレツシ−( 1″l(!SSey)のM I l)
R O C−Jンビ」−タにJ、リリアルタイムて夫1
1される。F) D I) 1 1がシスラムじルタ及
び[l−りとしC使用され結果のV(〆(Jlに使用さ
れIこ。
第9図は、71−リクス形成の訂細な]1]−f\ノー
1〜を承1。ボックス34及び30(よ、第(〕図の?
″1パjシン小ル変操叉L1. l l S ’+゛コ
シュ器5〕(Jl4 +,aりる6、第5図の1、′J
徴パターン浦出器又は、ノトリクス形成ボックス3′1
は第1)1ン1のボックス13 2及G− こ3;)に
対応りる。419図f/.1ノ11ーブレートは次のJ
′うに動作1Jる。
1、 人カリンブルl x ’u ’lにり・1し、]
レンククリンプト1人カイ・−次の.1.−)に定S%
 Jイン、21’.、’II’n].]−ン(+1 v ’+ □ t/) 、1易合 ・−(I Xu (lかつX’ +u ’ 0のi易会 1 X ]1(、’)かつX ’ Ill ’ 0 ノ”r
A 合2 [土ホックl 4 1111 +1;の(′
lHの連わ”、リップルとしC定義りる1。
3 [ティノア1,ノンスl l−4In−1を42(
の代−(定S”−il る 3。
dn=x’IIX’u1 4、 11に(13(ノるllクストしン11」を、同
11( dm+) sgn(tl+1) X i! =
−S1+ 、0 1+v(!のiYI月に応ヂ)の場合
eで定52覆る。
0.」−クスI−レマムの列から、IIT+の差の絶対
(111が所定の1変動誤差」により小さい対を除去り
る。
6、’T’ IE S分析の出力は、’If’+た41
土ポックの最初のリンプルにあられれる。でれは含まれ
るリンプルの数ど含J、れる【クストレマノ、の故とか
らなる。
7、 数が両ブノとし所定の範囲内にある場合に(3L
、下1三S故は単独なマツピングにより配置さ(しる。
こ、t′tは&′19図の[スクリーニング−1ボツク
ス3 ’Iで行な4っれる。
と3.1クストレマムの数が最大舶を越える場合は、こ
の最大値を入力ど刀る。1−1クスhし/ lxの数が
1J、り小さい場合は、イベントは([’、 1ve]
変動誤差l1Fj内の)背子谷1音から生じた乙のとみ
なしで遅A1線はクリ17される。
9.4ノンプルの数が8′[容最人館より多い場合(二
す遅延線はクリアされる。
H)、 i−E S数はりセッI〜可能遅延線に周込J
(、れる。「延線かい〕ぽいになった」471合、近延
されlこ故が読出され人カフ・′出力の組合ゎμかN次
几く本実施1シリで(,1、N2)のントリクスにj′
IIムレ−1〜される1、リレットされるどjイ延Lj
lはじストグラムがノ′ツノデートさ1′シる前M、 
’iTjびノ!り:1」ムレ−1へさ4L17ロ91/
iら4iXい1゜11、最す人力の多が)た(”I ’
+故(1顕乙なイl\ントJ)がヒス1.グツ11がら
jバIIセされ、イのマIヘリクスの座(票(、八It
 1iftされる13本実施(9]の1/\−171−
リクスでほこIt 1.1第ε3図にノ1、シた2次元
神Fである。
第10図は音i!i11名識/J代の一応用例を承り。
電詰懇は上記に第5図及び第(っ51図を参照しく説明
した?:’+ N’!認r5器1(1:〕/l’ ”)
 4’ <J。/ r’/ If 小ン103ハj?l
 譬信i3 ヲ受CJ(〔+’L <5 ;7 識’、
’:(: N12へr、)= ル++ 認識器は、フン
クスイッ/ 104/2に揉ゎ’t L rFh作非動
作の切換えを行イ、“)aIII御スイッヂ10/l/
lを石りる3、このスイッチは、゛市話機が使用される
磨に動作するJ:う押され、認識された命令が受取られ
るまでの所定期間認識器を動作さμる0、かがる命令は
:j: !クイ1フルー1を含む。その1りに例えLL
 連の故11.;llJ、lワンJ・・・1ノ?′/J
が続< (l iVi[ボース」によ′つて、例えばレ
ベル9の41〜1内I′しF)+交換てタイ飄ノリング
のイル11を1中入りるJ、うりr\ノリングの列が体
」lりる。命令には他に「−11ノシレル1.「Aフッ
ツク」、1−Δフッツク」又(、[これうどイ”9 f
t11iなしのか含5Lれる。命令[グイ1フル11、
L例え(3[タイ1ノリングのためl−71ツノツク」
払1序とりるにうにされ(いる。
l E S 、A?、識器は、インノル8o 119 
qt;のシングルJツブ:Jンビ−7−91■に実現さ
れる。。
認識器は、電話4段が動作りる7X i:aU −E 
l−とaQ fり者がI!r!l 邪ヲD イ1JIX
20 ヤil 7i’+ & !3’44K ルIIR
: 作’l!’; に、J、る場合等の昌l)jの9更
に夕・]応りるため認識”I ftfjパターンか第5
〕図の阜i(1パターン記・1.Q 21に11成され
るトレーニング又(J学習上−ドどを切1条える別のス
インf−105をイjりる。スイッチlit 5 b?
’r r”命令(実?iりることかできる。連続的学習
機械の場合では、最後に認識されたパターンか!+i 
i(Iパターンへの新たな人ツノとしC使用され、−こ
のlI:j :1.CにnA b使用されることの/l
) /+か′)た1、1.櫂パターン装置8換えら1+
る。、 tニー It、 +、−,,I、゛)C′、人
カi゛′電:1が除々に変(つると、5.2品(−ント
リクス(ン′企わり1幾)へ〇山ノ゛「jグラムは14
iに必四(イ1くイ、′る1、電話殿は、1認識器 1
0/(゛制御;Illされる自動つイ\ノリンクナツゾ
−i CM !l Fl +! !l <、−石づる。
1J7 iJLバクーンiJ、〕゛ノノ1トレーニング
し−1−にリン1φえられ(いるする’、 L−11:
 ’/ %命令4ブト昌りろこと(牛1戊される1、万
、■い、1、例えばハ(1[シックス1の試験パターン
をJim Qlバ/) ンのレッ1〜21に記1ixt
・Jる1、 1、t(識七−1” ((J i;!i l ;’ツク
λ1は△71〜リクスに変換さ(′と、ソウト・“/ 
l /” (Ji i牧パターン相41関係か実?jさ
れ記憶中+/μゝ(のΔ又はJ、り高次ハ、のマl゛リ
クスが、光昌、、’> 、lシA命令による△又(31
1,」、り畠次元の?I〜リクス11−仕較され、相l
L関係をイ「113111、f!か探される。li; 
+Qか?fイrイっれJ、う「延がイKc3れる。。
−般 現行(7) V R′lil’ f111+ (用イ’
> レ−(イル26 (1) シンポルアルノノノヘツ
I−+、艮、ディジタル654+T方ヱ(用に構成され
Cいる。1アルフッ′ヘットは、3001−1zか63
.3 kl−I Zま゛(゛に帯域制御見された人力音
声波形から−じツ1〜レー1〜が最小のディジタル出力
が1′〕られj、う(14成され(いる。ヒ゛ツトレー
1へを1rii約・」るため、この)フルフッ/ベット
((よ、f:’j lプ91+;i間が1.2及び3単
位時間のrr5.5Uの3つの畠11i−L、グメン1
〜を単一の1” E Sシンボルl i Jにり・]応
さける1、これはディジタル?:’i ?’7913理
どしくは妥当な11b約(d’>るが、音声認識どして
は無声音に通富伴4f・)伸ノイの異なる短いシンボル
分布を区別づる11丁能イ1が減少りる。
このアルファベラ1へどこの帯域の結果[11シンボル
が多くイするため「/\171ヘリクス分(lj”Cは
、J、す!1i純り距囚1測定ど比較してillの有効
4「識別が限定される。このような場合、[Δ171ヘ
リクスから]−1」シンボル及び[1」シンボルの組合
]′ノUを除去りることでより有効な識別がされる。V
[くの1i(jは改1魁されるが、検査/比較は2.2
 kllzの狭い帯Iff (0,3kl−I Z −
2,5kl−I Z )に制限される。別の−1−1三
Sアルノノノベツトに(j利なプJ?人は、これらの7
.ejいイベン1−に女・1りるデスクリプタを含・む
J、うリイズを人さく・jイて)こと−Cある。
背ffl 241高が犬さい1ち1合(・こけ、例えば
′シー、、−1,−1−口r+(PZ)及びイン9ボl
ノー−)ラドty11 < 17)簀の別の丁IE S
アルツノ′ベット4・用いるのか右4.11である。
杆済的な音声認11rA )’ル「リスノ\どしく、△
、/1つ変換器を用いずに7゛テ1山が+)r +、 
sシンボルストリームをIFする非常に饋1甲イI:1
1丁s変換器が考えられる。それはげロタ11シング倹
111冒j4i 、 /71.1ツタ、ノJウンタ及び
1−1シツクゲートを使用しIJt)のである、。
bとの?゛今産声信号ΦII I’l +Jろ6のど、
微分され/こ?”′1声1:1月に動作′1Jるbのと
の2つのUllり11シング検出器(Z CI) )が
用いI)れる、。
d、/(It高出力、ある1、′I定の11¥1111
間隔1:11の6どの音戸1侶号中のエクスト1ノマム
の故に関係Jる旧教を−りえる。選択されたn、)間間
隔は、信号の実際の零点の間の時間、−) :I:り微
分されていない111号についての7C1〕の出力間の
91−1ツタ周朋の数((19る。、これらの故は対に
され、−1−[−Sシンポルストリームが11?1うれ
るJ、う適当な[1シツク(処理される。1 この変形例IJ経ξ〕)1的イfイl 7.’、)を幾
つか44 ’iJインが、△/′1)変1グ3)E(を
用いる実施例が右りる)の応1’lに欠()る1、シか
し、イれ)よ幾つかの中背な粁消的イ〔因子に人さな影
ν゛(シをljえる、ある水<11の]りし端的イ」−
」中細1((を右りる1、
【図面の簡単な説明】
り)1図(,1ランタムな音り4j波形、第2図は第1
図の波形の各レグメンl−(7) 量子化された持続]
l′j間を示づ図、第3図は第1図の波形の各レグメン
I−(゛の桟人又【よ極小を承り図、′iA/′1図1
、]、ホ発明の1実施1列で1史用りる/ごめ導かれた
シンボルアルツノツ[〜、第5〕図は本発明の1実施例
による?”: r”認識y)へのフlN − ’f\7
ー1〜、第!.)a図は前処理のノlー1−ヂA7−1
・、第6図【J第X5図の方式の復号器部のブロック図
、第7図は第5図の方式(生成されたv11シックスの
、行を左1)t rう右,j二からIZへIM+に記さ
れたシン小ルス1ーリーム、第8図は第7図のシン11
\ルストリームの′/)次ハ11△1\ノ1ーリ9ス、
第1)図(ま第33図の△、・I・り勺スを11成りる
ための)IJ−ブー−ノー1−、第′10図は第り図の
プノ+(A−’ Ill,山電l詰に1戸用したしのの
回り′8図Cある1。 1・・・1)(1処狸、2・・冒+’l’tAン. F
4”、)、段、こ3・・′1次巡回フイルり、1・・・
周囲層I昌1肖流しさいIlf+ I史出段、1〕II
−S旬号器、(3・・・/\ l) l>、 l受器、
7・・R 、;’ 1.1シツク、8・・・[【/カラ
ン′)、)〕・・・IクスI・レビノ\I−1シック、
′IC)・・・11[の(4(小j1°、!及び゛【1
の(4i人1.“、;のカウンタ、11・・・ブ1」ク
ラ、lfル1り0〜1、′12・・・り1−1ツタ化号
梵牛’D、2′1・・J,l illバクーン、3′1
・・・、・I−リクスfi 微パターン曲出、34・・
・スクリーーシ′/、41・・・’Cr i牧パターン
比軸、 102・・・昌j’F’ ii只1八孔、1[
)3.=、’ インIN ;Ji >−、 lf)/l
,/ 1− 1+’l illl スイ’ン’/、10
4、’ 2・・ソックスrツ1、1 (1 :i・・・
スインJ、。 4Cr i:1出騨1人 レユ゛・Δル1〜 アルフレ
ツドゝ・ 図面のI:1:’j’、1′男゛7に変更な
し)〜・1 〜・2・ l勿、3゜ 00 1 0 2 0 ト→→−←−−1−=−f−−−←−1+→−−H〜、
Z 6111jlj111121211 6136j21S112j61,24 111Siii211124211 161jij112 4326612 1211316335244342 12425521を11コ1116j iji811212241 1225 422116151.3112A25 4211111111264211 1211211+2111T311 111111111144252 4 8 41815112111 111111+1li2
1jiTi 1211 11jTi214T1111253 〜・4・ 口 13 14 15 16 17 18 19 20 2
1 22 23 2425 2611、、、、.2.、
、、。 2.1 1 、 。 1 1 。 1 1 1 1 1 、 2 。 11162 、.421 31.121 32 、 362 、 、 、1 3 、 、 、、 1 、 、、 、 、 、 、 。 1 1 。 手Ueン市、+−LiW鳴 昭和59年9月271 特n庁長官 志 賀 学 殿 1、小イ′1の表示 昭和59年 特b′[願 第182535号2、発明の
名称 音声信号認識方法及び音声信号認識方式3、補正をりる
者 小作どの関係 特8′F出願人 住 所 イギリス国 リーディング アールジ−36ア
ール]ニル クリープトン l−1−ド 6番地氏 名
 レジナルト アルフレッド キング(In1祐 イニ
1カス国) 4、代理人 住 所 〒102 東京都千代田区麹町5丁目7番地5
、補正命令の日刊 自発補正 図面。 7、補正の内容 図面の浄8(内’?fに×−′史なし)を別紙の通り補
充づる。

Claims (1)

  1. 【特許請求の範囲】 (1) タイム」−ンコーデツドスビーヂ(1−I三S
    )を用いることで特徴イ1()られる?ン「戸j信号認
    識方法、。 (2) タイ11土ンコーデツドスビー’f(−l−1
    [S )シン小ルイベン1ヘデスクリブタを用いること
    Ctji徴f;HJられる特iJ[請求の範囲第1項記
    載の8重信号認識))法。 (3) 音iij信号let −r E S −7;A
     v ツh −’C<[’ ;3 化0れ、]−[]S
    シンポルストリーからなるパラメータの少なくと一6幾
    −)かど試験(ii ’;’jどの関係が合声信号の性
    τ°(を承り出力信F′jが結果どしC117られるに
    う調査されることをq!1徴どする??1声認識方式。 (4) パラメータは、シンポルストリー11及び、/
    又はシンボルストリームの構成及び/又はシンボルスト
    リーム占有位置、軌跡又は移動からなるイベントを含む
    。ことを特徴どりる’l”I R’l 請求の範囲第3
    項記載の?”’+lfj認識り式、。 (5) 試験(IEi号は、試jすj昌声イ1−号又は
    曲シ1す化さ4zk又は人工的な(i’j ”r (’
     II’)ることを1“j徴ど1ノる1、”1t71請
    求の範囲第+3If’! i+L!載のN37jj認識
    万」(。 (6) パラメータのP+Q 1.、’: 、上る記j
    小はパラメータの幾つか又は全部り目)ど;1かれ試験
    イハ号ど比較されることを121徴どりろ1、“l u
    ’l 請求の範囲第31ri記載のfj+ j” jm
    Z識万式、。 (7) 調査されるパラメータは正の(か小1i(jで
    あることを特徴とりるT+ il’l請求の範囲第3J
    11記載の音声認識方式。 (8) 調査されるパラメータは負の極人貞であること
    を特徴ど!Jイ) i”l i+’l 請求の範囲第3
     Jj’i記載の音声認識方式。 (9) 正の(か小点及び(iの(Φ人魚の数は各11
    ・5間レグメン1〜毎に31数され、各1時間セグメン
    1−の【ハ子化された1h続+1.’1間が測定され、
    数にJ、る−J゛スクリブタそれに応じ(’(=J与さ
    れることを特徴とする特5′F請求のaむ間第3D’を
    記載のf37jj認識lノ式。 〈10〉入力音7.ji倍信号帯域が制限されてJ3す
    、帯域中の高い周波数の信号は正の極小点及び負の極大
    点の検査を受tノないことを特徴とする特π[請求の範
    囲第9項記載の音声認識方式。 (11)帯域中の低い周波数の信号は、符号化の節約の
    !こめ測定パラメータにJ3い′C相違が検出されて一
    〇同一の数による記述がf]与されることを特徴どりる
    ’l’!I n’l’ 請求の範囲第91i′!記載の
    昌;11五R品Vノ“jl(。 (12)タイム土ンコーデット′スビーヂ(]1三S)
    を用いる音声信丹認識方法J、たは音声信号+、I: 
    TfE SフA−マツ1〜で符号化され、T [q s
    シンポルス]・リームからなるパラメータの少4「<ど
    も幾つかと試験信号との関係が81[1侶÷〕のf’l
    : 74を示づ出力信号が結果としてI+51られるよ
    う調Mされる音声認識方式で制御されることを1J1徴
    どする自動ダイAフル式電話機。
JP59182535A 1983-09-01 1984-08-31 音声信号認識方法及び音声認識方式 Expired - Fee Related JP2619852B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB8323481 1983-09-01
GB08323481A GB2145864B (en) 1983-09-01 1983-09-01 Voice recognition

Publications (2)

Publication Number Publication Date
JPS6078500A true JPS6078500A (ja) 1985-05-04
JP2619852B2 JP2619852B2 (ja) 1997-06-11

Family

ID=10548188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59182535A Expired - Fee Related JP2619852B2 (ja) 1983-09-01 1984-08-31 音声信号認識方法及び音声認識方式

Country Status (6)

Country Link
US (1) US5091949A (ja)
EP (1) EP0141497B1 (ja)
JP (1) JP2619852B2 (ja)
AT (1) ATE48199T1 (ja)
DE (1) DE3480569D1 (ja)
GB (1) GB2145864B (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8416496D0 (en) * 1984-06-28 1984-08-01 King R A Encoding method
GB8720527D0 (en) * 1987-09-01 1987-10-07 King R A Voice recognition
GB2223844A (en) * 1988-10-12 1990-04-18 Graviner Ltd Flame detector
NO180737C (no) * 1988-10-12 1997-06-04 Detector Electronics Apparat og fremgangsmåte for å diskriminere mellom elektromagnetisk stråling fra en brannkilde og fra en ikke-brannkilde
US5237512A (en) * 1988-12-02 1993-08-17 Detector Electronics Corporation Signal recognition and classification for identifying a fire
GB9103349D0 (en) * 1991-02-18 1991-04-03 King Reginald A Artificial neural network systems
US5355430A (en) * 1991-08-12 1994-10-11 Mechatronics Holding Ag Method for encoding and decoding a human speech signal by using a set of parameters
GB9806401D0 (en) * 1998-03-25 1998-05-20 Domain Dynamics Ltd Improvements in voice operated mobile communications
GB9817500D0 (en) 1998-08-12 1998-10-07 Domain Dynamics Ltd Advantageous time encoded (TESPAR) signal processing arrangements
US6301562B1 (en) * 1999-04-27 2001-10-09 New Transducers Limited Speech recognition using both time encoding and HMM in parallel
US7085717B2 (en) * 2002-05-21 2006-08-01 Thinkengine Networks, Inc. Scoring and re-scoring dynamic time warping of speech
US6983246B2 (en) * 2002-05-21 2006-01-03 Thinkengine Networks, Inc. Dynamic time warping using frequency distributed distance measures
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
US20080284409A1 (en) * 2005-09-07 2008-11-20 Biloop Tecnologic, S.L. Signal Recognition Method With a Low-Cost Microcontroller
US9697824B1 (en) * 2015-12-30 2017-07-04 Thunder Power New Energy Vehicle Development Company Limited Voice control system with dialect recognition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0004759A2 (en) * 1978-04-04 1979-10-17 National Research Development Corporation Methods and apparatus for encoding and constructing signals
GB2020517A (en) * 1978-04-04 1979-11-14 King R A Methods and apparatus for encoding and constructing signals
GB2084433A (en) * 1978-04-04 1982-04-07 Gosling Harold William Methods and apparatus or encoding and constructing signals

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3125723A (en) * 1964-03-17 shaver
USB83255I5 (ja) * 1961-11-14
US3278685A (en) * 1962-12-31 1966-10-11 Ibm Wave analyzing system
GB1170306A (en) * 1967-11-16 1969-11-12 Standard Telephones Cables Ltd Apparatus for Analysing Complex Waveforms
GB1012765A (en) * 1964-03-06 1965-12-08 Standard Telephones Cables Ltd Apparatus for the analysis of waveforms
GB1155422A (en) * 1965-08-24 1969-06-18 Nat Res Dev Speech Recognition
US3466394A (en) * 1966-05-02 1969-09-09 Ibm Voice verification system
GB1139711A (en) * 1966-11-30 1969-01-15 Standard Telephones Cables Ltd Apparatus for analysing complex waveforms
FR1543791A (fr) * 1966-12-29 Ibm Système d'analyse de la parole
US3742143A (en) * 1971-03-01 1973-06-26 Bell Telephone Labor Inc Limited vocabulary speech recognition circuit for machine and telephone control
FR2150174A5 (ja) * 1971-08-18 1973-03-30 Dreyfus Jean
CH549849A (de) * 1972-12-29 1974-05-31 Ibm Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls.
US3940565A (en) * 1973-07-27 1976-02-24 Klaus Wilhelm Lindenberg Time domain speech recognition system
US4178472A (en) * 1977-02-21 1979-12-11 Hiroyasu Funakubo Voiced instruction identification system
US4181813A (en) * 1978-05-08 1980-01-01 John Marley System and method for speech recognition
US4763278A (en) * 1983-04-13 1988-08-09 Texas Instruments Incorporated Speaker-independent word recognizer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0004759A2 (en) * 1978-04-04 1979-10-17 National Research Development Corporation Methods and apparatus for encoding and constructing signals
GB2020517A (en) * 1978-04-04 1979-11-14 King R A Methods and apparatus for encoding and constructing signals
GB2084433A (en) * 1978-04-04 1982-04-07 Gosling Harold William Methods and apparatus or encoding and constructing signals

Also Published As

Publication number Publication date
ATE48199T1 (de) 1989-12-15
GB2145864B (en) 1987-09-03
GB2145864A (en) 1985-04-03
EP0141497A1 (en) 1985-05-15
US5091949A (en) 1992-02-25
JP2619852B2 (ja) 1997-06-11
EP0141497B1 (en) 1989-11-23
DE3480569D1 (en) 1989-12-28

Similar Documents

Publication Publication Date Title
JPS6078500A (ja) 音声信号認識方法及び音声認識方式
CN111164601B (zh) 情感识别方法、智能装置和计算机可读存储介质
Jalal et al. Learning temporal clusters using capsule routing for speech emotion recognition
CN111415667B (zh) 一种流式端到端语音识别模型训练和解码方法
Gevaert et al. Neural networks used for speech recognition
CN112037766B (zh) 一种语音音色转换方法及相关设备
CN110211595B (zh) 一种基于深度学习的说话人聚类系统
JPS59216284A (ja) パタ−ン認識装置
CN112466316A (zh) 一种基于生成对抗网络的零样本语音转换系统
CN113539244A (zh) 端到端语音识别模型训练方法、语音识别方法及相关装置
CN112669215A (zh) 一种训练文本图像生成模型、文本图像生成的方法和装置
CN117577119B (zh) 融合大语言模型的伪造语音检测方法、系统、设备及介质
CN117854492A (zh) 一种基于大模型的智能交互方法、系统、设备及存储介质
CN113196385A (zh) 音频信号处理
Van Doremalen et al. Spoken digit recognition using a hierarchical temporal memory.
CN114863949A (zh) 情绪识别方法、装置、计算机设备及存储介质
CN114974300A (zh) 一种基于神经网络的语音鉴伪的方法、装置及存储介质
CN112786000A (zh) 语音合成方法、系统、设备及存储介质
TWI780382B (zh) 微控制器更新系統和方法
JPH01204099A (ja) 音声認識装置
Patel et al. A Performance Study: Convolutional Deep Belief Networks and Convolutional Neural Networks for Audio Classification
JP3318958B2 (ja) 学習型波形認識処理装置
Revesz A Generalization of the Chomsky-Halle Phonetic Representation using Real Numbers for Robust Speech Recognition in Noisy Environments
JP5078032B2 (ja) 音源同定方法及び音源同定装置
Sahoo et al. Word extraction from speech recognition using correlation coefficients

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees