JPS6035798A - スピーチ及び語認識装置及び方法 - Google Patents

スピーチ及び語認識装置及び方法

Info

Publication number
JPS6035798A
JPS6035798A JP59071928A JP7192884A JPS6035798A JP S6035798 A JPS6035798 A JP S6035798A JP 59071928 A JP59071928 A JP 59071928A JP 7192884 A JP7192884 A JP 7192884A JP S6035798 A JPS6035798 A JP S6035798A
Authority
JP
Japan
Prior art keywords
vector
vectors
sequence
distance measurement
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59071928A
Other languages
English (en)
Inventor
ペリアガラム ケイ.ラジヤスエカラン
ジヨージ アール.ドツデイントン
トーマス ビー.シヤーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPS6035798A publication Critical patent/JPS6035798A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の背景及び概要 本発明は話者に無関係なスピーチ認識装置、すなわち未
知の話者からのスピーチ全自動的に認識及び復号可能な
機械に関する。
狭範な用語に対して構成されたこのような話者に無関係
なスピーチ認識装置を設けることが非常に望ましい応用
が沢山おる。例えばこのような詣認識装置は自動車の制
御及びピデオグ9−ムにとつイ廿I訃屋六…プ≧L 北
r路1y 1iEl−ah者お志亀11例I田始しか使
えない場合でも、運転者が頻繁に道路から目を離さなけ
ればならない多くの重装度の低い自動車の制御機能全直
接音声を入力して行うことができる。このような方法で
自動車のラジオすなわちy響装置を有効に制御すること
ができる。より8’f;巧な監視及び計算機能が利用で
きる軍はど叶声なq間/音声出力装置に一層効率的に対
処することができる。例えば運転者が“燃料″と西って
計器板に″26.5リットル(7ガロン) −257,
4km(160マイル)以内に再補給″と答えさせれば
、自動車の制御]11の設計上非常に便利である。同様
にアーケードビデオゲームは゛シュート“、”停止”、
1突進”6左″及び”右”等の限定された1組の言語入
力金堂は入れるように設計することかでさる。このよう
な応用は他の多くの応用と同・腫にコストに対して非常
に敏感である。
従ってこの種の大群の応用に対するrTrj FJ認識
装置提供するには、認識装置は必ずしも非常に広範な用
語を認識できなくてもよい。例えば6〜20− 。
f!ieの侠顛々+1.1 iff々で11のL1\用
に対ニーで」にI瑞に右用である。第2にこのような応
用に対する語g識′装置は必ずしも関連するスピーチに
はめ込まれた語′f:認誠できなくてもよい。多くの簡
単な指令の応用において孤立した[■Hを認識できれば
充分である。第6に多くの応用において置換エラーの方
が1巨絶エラーよりも遥かに好゛ましくなく、例えば消
費者がfff’ 7”選択自動販売機から物を購入する
場合機械に何のことか判りまぜん″と答えさせる方が違
った物品を出すよシも遥かに好ましい。
こうして置換エラーが非常に低い低コストの飴、認識装
置を提供することが本発明の目的である。
このような語認識装置金低計算負荷で作動させることが
非常に好ましい。多くの魅力的な応用において、適度の
誤り率(例えば確度85乃の認識)昧容易に許容でき・
るが、コスト条件は厳しくなる。
従って高速チップや専用プロセッサを必要とせずに通常
の安価な8ビツトマイクロコンビS」−一夕と女画なア
ナログチップによ)実行可能なH呂認識装置が非常に好
ましい。もちろんマイクロコンピュータ−守メーンフレ
ームを使用して話者に無関係なIjf4認識を;1」″
うことは常に可能であるが、大概の応用はコストに対し
て敏感であるため大概の好ましい応用にとってこのよう
な方法は実際上適切でない。
従ってJl常の8ビツトマイクロコンピユータにより実
施できてしかも尚速もしくは特殊機能処理チップを必要
としない話者に無関係な詣認識装置全提供することが本
発明の目的である。
8ビツトマイクロコンピユータ及びアナログチップを曲
用して実施することができ話者に無関係な限定IIji
Rfに対する詔認識装置全提供するととも本発明の1j
的である。
話者に無関係な認識を行うだめのもう一つの問題点は1
却の適切なテンブレー1・全準備することである。な゛
まりのある1人の話者もしくは1組の話者は一貫して一
般的集困が反復できないような!1′i′徴のある語を
発音することがある。すなわち話者に無関係な用請に対
する基準テンプレートは胎の厳密に必要で1lSlニー
ないいかなる特@をも指定してはならない。経験的最適
fヒによ91組の基準テンプレートを準備することは常
に可能であるが、これは非常に時間を消費し使用者が挑
−場で基準テンプレートを生成する可能性が阻まれる。
従って基準テンプレートを準備するのに訓練された研死
者の経験的人力が最少限で済むようなスピーチ認識装置
を提供することも本発明の目的である。
はとんど訓練を受けていない使用者でも実行できる話者
に無関係な飴認識装置に対してにテンブレー14準備す
る方法を提供することも本発明の目的である。
コストに敏感なシステムに対して話者に無関係な語認識
装置′f:阜備する際のもう−りの困難な点はメモリ条
件である。小型マイクロコンピュータを使用する多くの
システムにおいて、非常に多くのプログラムメモリを語
認識アルゴリズム及びテンプレートと結びつけないこと
が非常に好ましい。
竹に(スピーチ指令を受信する計算器や時計等の)多く
の可搬型装置の応用においては、切替えられないメモリ
の電力条件により重すな傭1約が制式h、る。パワーオ
フ期間中スピーチ用6r1テンプレートは保存しなけれ
ばならないため、スピーチ基準テンプレートに必要な(
0MO8もしくは非揮発性)メモリ量C1非常にmWな
コストパラメータとなる。
従って基準テンプレートを記憶するための絶対的最小メ
モリ条1’4=を有する話者に無関係な胎1協識装置を
提供することも本発明の目的である。
話者に無関係な語認識装置(F:、おいて特に重要な任
意の811認識装置のもう一つの間帆点は、典型的VC
話者のスピーチの平均速度たけでは/よく析離のiii
:の音ifi’+のタイミングが変るということである
この情報は通常聴者がmlの認識決定を行う除に曲用さ
)Lないため、一般的に異なる話者のスビーナパターン
間で実質的に剃る。従って話者に無関係に冊認識1(置
は人間のスピーチの平均速度及び地域によるタイミング
の適度な変動範囲に対して鈍感とする必要がある。
従って人間のスピーチの平均速度及び地域による変動に
対して適一度に鈍感な曲’A、l懸改装置を提供するこ
とも本発明の目的である。
人間のスピーチの平均速度及び地域によるタイミングの
変動に対して適度に鈍感であり且つ高価な注文部品を必
要とせずに簡単なマイクロコンピュータを1史用して実
施できるスピーチ認識システム全提供することも本発明
の目的である。
話者に無関係な語認識システムに付与することが好まし
いもう一つの特徴は用語変化能力である。
従って例えばスピーチ指令によりアドレス可能な計算器
では、1絹のスピーチ指令を(例えば)異なるモジュー
ルと共に変化できるようにするかもしくは1史用者が誂
えたソフトウェアを計算器にロードすることにより使用
者が変化させらねるようにすることが好ましい。
しかしながらこれを達成するには基準テンプレートセッ
トの準備葡適度に簡明な排他的アルゴリズムに基いて行
ない、あまり熟練していない1史用者でも新しいテンプ
レートセラトラ準備できるようにすることが好ましい。
またテンプレートセット全アドレス可能として、テンプ
レートヲダウノロード及び買挨できるようにすることも
必要である。
テンプレートの変化能力は各テンプレートに必要なメモ
リスペースに敏感であることにも御注意願いたい。すな
わちメモリテンプレート全適度にコンパクトに記憶でき
れば、マスク位置ヲ使用して記憶された全テンプレート
のどのサブセットが現在アクティブな用語に対応するか
を表示することができる。従って例えば自動車制御シス
テムにおいてマスター用語は6ラジオIZI+ワイパー
”、゛エンジンTI、”コンVユータ”等のさまざまな
制御機11旧ICtJ111!全示す1組の飴だけを含
んでおればよい。こノ1.らの機能領域のいずれか一つ
を選定した後、各11¥定機能領域に対して新たに方言
化された1組の基準テンプレートセットすることができ
る。方F)化された各基準テンプレートセットはマスタ
ーテンプ0レートセツトに戻るだめの一つの指令を含ま
なければならないが、完全に誂えることもできる。こう
して方言化されたラジオ制御指令セットにはF M−”
、。 ″、′商<″、6低M く”、1周波数”、6音量″等の指令を含むことがでる
従って限定された用語に対して機能し、用語セットを容
易に変化させることができる話者に無関係な認識装置を
提供することも本発明の目的である。
限定された用語に対して機能し、用語セットを容易に変
化させることができ且つ簡単な市販されているマイクロ
コンピュータ部品el用して実施できる話者に無関係な
認識装置を提供することも本発明の目的である。
話者に無関係な詔認識システムのもう一つの好ましいオ
プションは話者に依存するモードで機能する能力である
。すなわち自動車制御やスピーチ制御計算器等の応用に
おいては、システムにスピーチ入力全即座に受信する能
力を付与して工場から出荷する必要がある。しかしなが
らこのような装置の多くは代表的に1組の限定された使
用者のみが使用する。従って話者に無関係な装置のテン
プレートセラ)k特定の使用者もしくは使用者群に対し
て最適化することが好ましい。このような14最適化を
使用して用語サイズを増大したり使用時の誤り率を低下
することができるが、テンブレー1−の修正処理は適度
に1”+il単とする必要がある。
従って容易に角最適化して特定の話者もしくは限定され
た話者群に対して話者に依存したモードで作動すること
ができる話者に無関係な語認識装置全提供することも本
発明の目的である。
従って容易に再最適化して特定話者もしくは限定された
話者群に対して話者に依存したモードで作動することが
でき、且つ簡単なマイクロコンピュータ及び簡単なアナ
ログ部品ケ使用して経済的に構成できる話者に無関係な
飴認識装置全提供することも本発明の目的である。
話者に無関係な°語の、認識はせ置市に明確な小さい用
iHに基いて最少のハードウェア条件で行われる。「ハ
1単な予調整濾波器の後で入力スピーチのゼロ交差間隔
が測定され持続時間により分類されて各人力フレーム内
に大まかな測定周波数の分布を行う。ゼロ交差間−の分
布は2進機能ベクトルに変換され、修正ハミング距駆測
定を使用して各基準テンプレートと比較される。動的時
間歪アルゴリズムを使用してさまざまな話者速度を認識
し、基準テンプレート記憶条件全経済的にすることがで
きる。各基準テンプレートに対するマスクベクトルヲ使
用して検出された飴の重要でない(話者に依存する)特
徴を無視する。
本発明のこれらの目的及びその他の目的を達成するため
に、本発明は スピーチに対応するアナログ入力信号を受信する入力装
置と、 所定の特性に従ってAfJ記入力信号を調整し前記調整
された信号のゼロ交差間隔を測定して2進機能ベクトル
を出す信号処理装置と、 前記2進機能ベクトル全複数の2進基準ベクトル(l′
liJ記基準ベク、トルは語に従ったシーケンス構成と
されている)の各々と比較し、前記機能ベクトルの各連
続する1個に対して前記基準ベクトルに関するハミング
距離測定に少くとも部分的に対応する距離測定を行う距
離測定装置と、AiJ記基準基準ベクトル前記谷シーケ
ンスと連続的に受信される前記2進機能ベクトルの一つ
との間の前記距離測定シーケンスに従って鮒を認識する
認識装置とを具備する詣認識装置からなって′いる。
本発明の実施例に従って本発明は 飴認識装置からなり、それは スピーチに対応したアナログ入力信号全受信する入力装
置1ffiと、 所定の特性に従って前記入力信号を調整し前記9司祭さ
れた信号のゼロ交lう間隔を測定して機能ベクトルを出
す信号処理装置と、 前記機能ベクトルを複数の基準ベクトルの各々(i?i
J記基阜ベクトルは語に対応するシーケンス構成とされ
ている)と比較して、・前記機能ベクトルの各連続する
1個に対して前記基準ベクトルに関するハミング距離測
定に少くとも部分的に対応する距離測定を行う距離測定
装置と、 前記基準ベクトルの前記各シーケンスと連続的に受信さ
Jシる前記基準ベクトルの1個と連続的に受1言さJl
oる1jfl A己(幾1行ヒベク]・ルの11固との
間の前6己11′1帽11j Jilj定シーケシ−ケ
ンスてg74を認識する請認識装置とを具備し、前記認
識装置はまた動的計画法段階を実行して連続的に受信す
る前記機能ベクトルの一つと前記基準ベクトルシーケン
スとの間の最適サブシーケンス整合ヲ行う。
実施例の説明 本発明はやましい点ない(つか含んでおり、さまさまの
異った方法で実施することができる。以下の説ゆ」から
本発明のイし止や裳史かい(つか示牧さλL、従って本
発明はい(つかの特足実施例に限雉さJ′lるものでは
ない。
第1図に本発明の胎鎗識装油、に使用される動作の(7
な成を一般H′ソに示し、第2図にマイクロコンピュー
タ15が実行する@龍を詳細に示1−01−なわち生の
スピーチ鼓形10が最初情号調楡ブロック12 (ni
J置装幅器及び微分器)により処理される、りJ−まし
くは413号調整ブロック12はイタめてtttJ単な
予飴汲1j+作、例えは帯域外信号を拒絶するのに使用
されイ)。次に幽aされた入力はセ゛ロ又差イ灸出器1
3により受信され、それは本実施例において信号調整器
12及び機能抽出器14から受信したデジタル板形のゼ
ロ交差間の間隔を単に硬]定し次に任意の1フレーム中
に受信したさまさまなセ′ロ父差間隔測定価を楔にビン
に公知して整数イ汐能ベクトル19を出しそれがそのフ
レーム中の大まかな周波数測定1的の分布を与える。次
に整数機能ベクトルのJjy分がさまざまな閾値と比較
されて2進機能ベクトルを出す。これによって基本的機
能測定が行われるデジタル/アナログ変換は行われない
ことに御注意願いたい。
次に距離6111定16により機能抽出器14から出さ
れる機能ベクトルがテンプレート記憶部18から受傷さ
れる機能ベクトルと比較される。この時点において本発
明の2つのキー機能に御注目願いたい。第1は記憶装置
18か各テンプレートに対して機能ベクトルだけではな
(マスクベクトルも含んでいることである。後記するよ
うにマスクベクトルは各基準チンプレートラ記憶してい
る戦能ベクトルに″ドントケア”貞み伺けを行うのに使
用されろ。従って比較して認識を行う入力フレームの機
能セントが選定され、各飴テンブレー1・の各フレーム
に対して変えることかできる。記1.ハ装置18に記憶
されているさまさまな語テンプレートは各々が一連のフ
レームからなっていることに御注怠願いたい。すなわち
代表的な場合において各飴テンプレートは8〜12フレ
ームの一連のフレームで構成することができる。(各基
準フレームが2個の20 ms人人力レームに対応する
ものと考えることかできるが、後記するように1個のみ
のフレームもしくは4個もの人力フレームにメ4応する
ように歪まぜるどとかできる)。岡1f:J−政!1(
1作2υにより基準テンプレートの各々とiJi’ a
:の人力フレームシーケンスとの最君の布台をゴx足し
て、生の整合の実行6114 k佃21を出力として出
1゜飴の終り1矢出器22か)・イレベル判障r飾I理
24に人力を力え、飴の終り測定(io 23か時出]
−玖プロック20から出される実行累積gけ眼(今度と
共に7・イレベル弔」所論8!24が1治齢娠’IJJ
〜r25乞イ丁うための基イ蘭を与える。
本発明のこれらさまざまな女系の動作については後に詳
記する。代表旧にマイクロフォン(及び代表日゛シにM
+J置装幅器)からの生のアナログ入力であるスピーチ
信号10がイー号調服器12に出され4)。
好ましくは信号調整器12か実行する2検波器機能は極
めて簡単な濾波動作しか含んでいない。実施例において
信号調整器12はアナログ微分器と、シュミットトリガ
−と、帯域外信号を拒絶する( 6.25 MH2のコ
ーナ周波数を有する)低域d=y、 M器と、アナログ
微分器とシュミットトリガ−を具備している。微分器は
入力信号の尚周波成分を効果的に強める。すなわち信号
のゼロ交差特性は強゛い低周波成分により容易に支配さ
れ、ゼロ交差分析を行う関数として第1専関数を使用す
ることによりこの問題が最小限となる。
痘波機能は必ずしも最小限でなくともよいことに御注意
願いたい。特にスピーチ信号のゼロ父着特性は周波数プ
リエンファシス及び予麺波部による位相変移に対して非
常に敏感であり、広範は予鋤波特性をオプションとして
使用することができ、911えは191与の用語セット
内の語をより敵しく区別したり肋定のノイズ特性を拒絶
したりすることかできる。すなわち予濾波特性は知覚で
きる程度に明確な入力フレームが本発明のに、 =アル
ゴリズムから出される非常に限定された情報に測定D」
能1.c程度に四節となる度合いに実践的に彩管を及は
ゴー。
このような広範な1波特性を本発明の伽正及O・変l、
18に導入することかできるか、不発ゆjの主要実施・
vlllに玉ζいては11[記したように1龜j単な処
理嵌能しかイリ・714していない。
さらに本実施例では使用していないが信号−1j躯器に
偶域渥・波を使用してイ1ア域外イa号を拒絶すること
もできイ)。
シュミットトリガーばかなり1要な(M号処理機能、す
なわち中央クリッピングを行うことに何り注想続jいた
い。fなわちノイズを宮む機能のゼロ父7)1・がdl
l、1″#LさJ+ている場合には、非常に低いノイズ
パワーでも関数領がOK近い時点において多くのスプリ
ーj′スセ゛口交差を出すことがある。計′証化行5際
にこの間層を赴けるために、鼓形が2つの脚以づるセ゛
ロヌ差間のある最l」・仙に達しない限り(シュばツト
トリガーのヒステリシス特性乞1す用した)中火クリッ
ピングは実除上ゼロ父差ケ無視1−る。シュミットトリ
ガ−はこの中央クリツビングケ行5 fill−の方法
ではないか、イハ、間隔セ゛口9差のノイズを大幅に低
減するため信号調雅器12に本−けるこのような機能の
いくつかは非nに好寸しい。
実ド1?のセ゛ロ父差情報は水抜(1:Jに習熟した人
&Cは明白′tlc多(の方法で得ることかできる。例
えはアナログ入力化+fj10を前記シュミットトリガ
ーもしくは伺・性/+!!、知飽和出力増幅器に加えて
強(クリップされた信号、すなわち符号の父香する一連
の矩]1今波形を出ずことができる。次にこれらの鼓形
を論理111!に変挨して各矩形鼓形部の持続時1ム1
(ずなわちセ゛ロシ差111Jの各間隔の持続時1h1
)をマイクロコンピュータのクロツクザイクルとしてカ
ウントするマイクロコンピュータ15へ入力として4火
る。もt、ろんこの機能14はフリップフロップ及びカ
ウンタと4(に、もしくは他の方法で容易にSS■論理
に実施することができるか、マイクロプロセンサもしく
はマイクロコンピュータ15に実施1ろことか好けしい
。女子ましくはマイクロ70ロセツザのクロック分角・
ト能は±40μsもしくハソれ以1であるか、Tfj販
の大概のマイクロ70ロセツザばこのう(ζ子つ(に合
致することができる。i3’jjえば8013 [J 
、 7−80もしくは′1M1ヨ7 (J l]” [
3it伶て)必切である。
スピーチイ、1号の次の処理スア“ツブは1ル−ムJt
l’ lbt l・[隔のとられた一連のフレームの各
フレームにセ゛rJ夕バ・1t)1隔分布のノノウント
?冗生′1−ることであイ)。木′ソ、が11例におい
てフレーム11.;隔は’、l Q I+ISであるか
このフレームj1−1・IIl≠はネト基、に変天なこ
とができる。もつと長いフレーム肋間ケ使用した場合に
は尚速スビーナはう了く鹸vホされないことがル)るが
、こノ目工ある応用においてQコ、フ”ロセンサのロー
ドを低くするために許容できる得失となる。同イ、1〈
にフレームル1間か先い〕烏合に(、I:)′ロセツザ
のロードは商< ン’、’cるが性能のA11倚目比敦
旧小じくなる。
使って1〜2001118のノ1(1)回内のフレーム
ル: Itl &フ、本兄明の11・IJ1囲内回内る
入力はこのhの前に必ずしもフレームに分割する必−要
かないことに11:1注娠肋、1いたい。−4″7.c
わちマイクロプロセッサを侵井(してセ゛ロ交ル出1隔
を6J11 >j:′4 ′1−る坏11人〜(はマイクロッ0゛ロセツザか1司
1寸にアナログ入力信号のフレームへの初期分割を行う
ことができることである。
各フレームにおいて機能抽出器14により入力から次の
ように機能ベクトルが発生する;最初フレームル11)
iIと正確に一致する必要のない間隔にわたってアナロ
グ信号のRMSエネルギが測定される。
例えは本実施例においてエネルギは3 Q msの分析
ウィンドにわたって?1411定される。こ才jはフ[
/−ム間のエネルギ1罪を幾分滑らかにし、灼い面エネ
ルギ手象の見洛しを防止する。さらにこの時点において
セ゛ロ交差111」隔が分類される。ここでもゼロ交差
の根性を1114定才る発信ウィンドはフレームル(1
141と1碩に同じである必要はなく、本謀力1具例に
おいては30 msである。
番■つて枦能ペクト、ル19を発生づ−るには6Q m
sの間隔にわたってアナログ波形のセ゛ロアySb其・
1間かh1Δ1べらねる。多数のゼロ交差101隔数か
ら靭ぐ能ベクトル19を抽出する好筐しい方法は次のよ
うでk・るが、ももろス広祿なVt++の方法な使用し
てセ゛ロタ差…1隔の分布を表わすイ愈能ベクトルを出
すことかできる。本実施例においてろQ mSの分析波
形内ノセ゛ロ父ル間綿・が4つの″ビン” Kf)Ai
iす、t+、名ビンは一般的に帯域飴汲器にえ1比、し
ている。すなJ−もビン1け(獄施グ)にふ・いて1ザ
ンゾルがI′llSに等しい)7から13サンプルの曲
の持続時間を有する分析ウィンド内の七口羨差IB・隔
置をカウントし、ビン2は4かも6の曲の出隅のRf 
M+、時11j:を会する分り1ウインr内のセ゛ロタ
ー差IL・階数ヶカウントし、ビン6は2もしくば6ザ
ンゾルの持ゎ゛1時間を有する分析ウィンド内の七口父
差聞隔叡を′カウントし、ビン4は1サンプルの持ち′
121時間を有−4−る分析ウィンド内のセロ佼斉−1
ド1隔数?カウント−→゛る。射」シ(はこゎらの数は
クリップさ第1た矩形波数か・受・信されている時にマ
イクロコンピュータが累ηルて、いかなる虞にオ〆いて
もさ寸さまなセ゛ロ父差の丈際の持続時IU、+を記憶
1−る必要がない7ようにする。すなわちクリップされ
た入カ漱形のr1号が乞4)と、マイクロコンピュータ
が効ましく翰、 jrJ 号の71.; J+%亥化理
化以降ロックパルス叡に江之(、て過切へヒン内の力量
ントを′またげ積分し、そのカウントレジスタをリセッ
トして次のゼロ”2M寸でクロックパルス数をカウント
開始する。こうして仔!・の一つの6ビン”でカウント
さJまたセ゛ロ父差数は一般的に対応する偶域蘭汲器に
より御1足される包のエネルギに対応しており、全ビン
にわたる分布によりη〜幻機能ベクトルが出されそわば
本νこ施例において(14個のM(k数を含んでいる。
次にこの番数機能ベクトルは次のようにして2進様能ベ
クトルに変換される。例えはビン6内のカウントは2つ
の儀←1イ社−と比11ipさ第1て2進斂有[ベクト
ルのDM分5及び6を発生する、カウントか1鉤fL1
135Lよりも大きい場合には2進機能ベクトルのJj
V分5か1に設足され(そうでない」易うにはりにとど
まる)、ビン3内のノノウントが第2の阪l Taq 
B3Uよりも小さければ2進機能ベクトルのル・分6に
1か入力されるにオ]もそうでない場合にはOにとどす
る)。すなわち各ビンは下位〃ひ上位1晟仙を有し、そ
Jl、I;+は経験的に選定されて使用する語を最大限
に助゛ζ別する。本災施例においてサンプル個数で表わ
さオ′また使用1−る8つの1丙佃は次の通りで゛ある
ビンう:Iリ 下位1に: (++ 上位1韻(I+1
 1 4 4 と3 6 8 16 4 16 32 本iu+ 1’l−’4J、Iカス111列は初ル1桧
1瑞として〕)−常に1県に画分解能サンプリングを行
うため、−(<+口交*: l’=;隅はサンプルで衣
わび′i’していろか1.zlV光明の考火ら第1る右
長他モードではこのような市価な局迎高分解能サンプリ
ングは使用せずLIりにF”、I D已したよ51/U
当初アナログj91后を使用ずとン。
Uつて1)IJのプロ七スに木゛いて人力1v号の名−
フレームに対して(本築施例では8ピントの)9北ベク
トルが発生さ汎ている1、この・、・lや能ベクトルは
距^11dllj足ンこ征ってさまさまl工ノ101L
・ベクトルと(すIJ甜割算16において)比較さ4、
品1テンプレート内の基準ベクトルシーケンスと受信さ
れた入力仏、能ベクトルの全音すもしくはいくつかのシ
ーケンスと′−− の1141の屓・離d:11定シーケレスに従ってRJ
のLゎんか行わガる。
使用する距離測定は本質旧には入力フレームと任洞特定
の基準フレームとの間のハミング距離測定であるが、距
離測定にはもう一つの車装な勅しい膚がある。好ましく
はマスクベクトルが各基準ベクトルと共に計1憶されて
基準ベクトルの血要度の低い成分をマスクする。従って
藺の笑除のテンプレートは一連の2進ベクトル対からな
っており、飴テンブレ〜ト内の各基剤フレームに対して
基準機能ベクトル及びマスクベクトルが記憶される。
例えはマスクベクトルの第4成分が1であれは、対応す
る基準ベクトルの東4成分が距t’1iit計藷二に使
用される。マスクさねたベクトル成分がUであれば、伺
随する基剤ベクトルの対応する成分は距離言−+Xに1
史用されない。従ってテストイ幾に旨ベクトルT F’
と、kii基準ベクトルRF(i)とマスクベクトルR
M(i)間の距離は次の論理動作により定修4谷れる。
DTP、i −”’ミングRM(i)、月つ(1°F、
xor、RF)(1))。
従ってDTP、□はテストベクトルTF とだ「与のm
K’x寸するテンプレートの1ベクトルセント+341
のハミング距離となる。この距離はテスト成行[ベクト
ルTFと基準ベクトルR1!’(i)との知似点数を示
し、マスキングはマスクベクトル、RM(1)内のLJ
倫戒分により矩義される。
このようにマスクベクトル クトルの」−11要でない成分?切除1”ることはり」
らかに油が,ムことであり、広flipに・1し止及び
変更1−ることかできること’l Lrg iiMして
いたたきたい。例えは2進マーキング1旧を使用(して
アナログ渡)命ステップの結果をマスクすることもでき
るため、僚能及び基準へりI・ルな2進11μとするこ
とは取払・に必要なわけでレコ、/Iい。事実マスクベ
クトル自体を2油−イ11]とすることは非常に好まし
いことではあるが齢?1,に必要なわけではない。マス
クベクトルがアナログ佃ケとることが出来,Itは、そ
れは不買的に一IJiみイマ1けベクトルとして磯h[
する。tJ4み句はベクトルは誌謳比11反において厘
゛交で1(いヒツトを焦合すイ,)のに依然として、有
用ではあるが、アナログル与(”Jけベクトルでは2進
4スクベクトルr(よりiUられるようなiI算効率は
得られない。さらにHト辱のIN餘m5セットに対して
2進マスクベクトルを準備′1−ることは後記するよう
に非常にm」年月つ効ギ的に行うことかできる。
さらにマスキングベクトルを使用する治)却、性は8ヒ
ツト機能ベクトルを使用することや不買日・り機能ベク
トル抽出ステップかセ゛ロ又差1i、l隔に基いている
よう7.C’VBi4c応用のみに決して制約されるも
のでは7;c < 、いかなるスピーチ詔碌システムに
モ応用できる。
次KdHテンプレート内の一$、h1ベクトルのシロ生
方法について故、明する。
テンプレートを構成するにはし最装橘か誰のスピーチな
し識しなげれはならないかを近似づ−るのに充分多様な
集団が1光追するその詔の多数の独立サンプルか開り膚
となる。(例えは使用するスピーチ鯰疏装楢に共有のな
まりかある男女及び子供の話し1葉を入力する場合、初
期データベースも男女及び子供から得なけれはならすそ
れは使用時に腎部しなげれはならない出来るだけ多イ止
のIIまりを含んでいなけれはならない。
同様に肪づ1膜装置ケ話渚依存モードで作動させるかも
しくは少数の話方群に対して飢える場合には、サンプ0
ル数は太きく7℃けれは/!らないか1rt4+切な七
ツト内の詰渚は比例的に代表される。例えは4人の話渚
ケ昧′d敵する場合には各人か平均25ザンゾルをデー
タベースにを与1−るはすておる。
第1段階は手動分類板階である。” 5top ”の1
ji−t Ic則してテンプレートを4再ル父するもの
と仮矩する。この61[は第4図のスペクトログラフに
示すように6つの明イ1fIな合有セグメントを有して
いる。
これらG、1防Jυ11j5衿音IS1、停止及び1)
開放1tl、1ε呂一部IAI及び最終停止及び開′I
yl p lである。
好ましく +p−これら6つのセグメントはデータベー
ス内の谷サンプルに対してスペクトログラフ及び波形図
をIN・つてグラフインク端末装−上で相互作月]的に
マークされる。従ってこの段1塙でサンフ0ルさ才また
データベース内の対応−1”る音素の位置か手!III
Jで僅やさJ(る。さ筐さ呼な話名か詔同の$7ぶる盲
累の相対聞良さを変えるためにこの数1唱が使用され、
どの機能ベクトルが母−1i+AIに対応するかにデー
タサンプルから評価する際、記者が実際にltlもしく
はlp+を発音している時間歪サンプルにより計算が歪
むことのないようにする必要かある。もちろんデータベ
ース内のサンプルのこの時間一致はイ…の方法で達成す
ることもでき、それには例えばLPO%性に従った者g
境界によるサンプルの自動分類も含まれるか、本実施例
ではこの段陥で手動分類を使用している。
従ってこの手動分類段1も・の後で4卑ベクトル内に含
まなければならない連続音素に対応するデータベース内
の各サンプル内のセグメントを確立しなけわはならない
。次に各稿素セグメントの平均持続時To’l k計算
して各セグメントに必要な基準フレーム数を確立す、る
。例えば歯久1jIS +は130II]Sの平均持続
時間を有するものとする。1゛ると40 msの基準フ
レームル1間において、おテンプレート内の6つの基準
フレームが飽嫉唱−IS1に対比、する。(本実施例の
基準フレーム期111は俊6己する理由により入力スピ
ーチのフレーム凹陥の丁1ザ2倍の長さである。) 次の桟′1潜ば10υサン゛プルの各々につい又サンプ
ルのとの部分を薗拙稿I81に対応する詔テンブレー1
・内の6つの基準フレームの谷々の予参ノ」!位置の計
算に含めるへきか?欠きとめることである。
1−なわち本例においてデータベース内の谷サンプルに
対して益素IS+の持続時面内に均4ψに配b−さJ′
また6店における測足イーに基いて、6つのl5I)A
準機能ベクトルが■1算さJする。従ってこの処理の結
果基準ベクトルを胎A4シなけJlはならないδUテン
プレート内の各フレームに幻してそのフレームに対比、
するデータベース内の谷サンプル内に独特な位i1.′
、′かイ1′11腑され℃いろ。
次にデータベース内のさまさ捷なサンフ0ルの対応部例
基いて詔テンフ0レート内の各基準ベクトルを1昇する
プロセスについて1w明する。初めに合方1糸叔(n切
とll子はれる公差数が勅2脚・的にだ足される。本J
5施例においてnuは[J、93 K靜冗さゎているが
、データー、ベース内の語基の均一1午及U’ k分テ
゛−タベースのサイズによって増豚てることができる。
しかしながら本例において好ましくは90%よりも大き
いイ1θか使用され好寸しくに90〜97%の絶、囲で
ある。
合シ保数nuは身・団の行動の一致が蛎、いと結°論ず
けるI’Jjl K ifF容Tfij能な対応するフ
レームに対して機能ベクトルの任急特定ヒツト+cとれ
だけの不−攻をVl各できるか、を示している。すなわ
七例えはnuな0.96に選定1−るものと仮矩する。
この4合データベース内の100サンフ0ルの中の96
もしくはそれ以上のサンプルが(対応1−るフレーム位
11′において)褐1のアナログパラメータに対してB
ibよりも矢きい帥を慣しておれは、機能ベクトル及び
マスクさハたベクトルの第1欣分は1に設定さ」する。
96もしくはそれ以上のサンプルか第1パラメー4に対
してB1L以下の飴を有しでおれは、基準機能ベクトル
の第1成分は0でありマスクさJまたベクトルの第1成
分は1である。
すなわちこの場合第1″ビン″内に1國佃B1Lよりも
小びいセ゛ロ父差数を自することが一般的竹動であるこ
とに集団か同身していることに7ぶる。しかし’i、c
lがらこの点に同急するサンフ0ルか93よりも少い場
合には、マスクされたベクトルの第1成分がOに静定さ
れ基準ベクトルの第1ft、分は“ドントケア”ffl
+でありOもしくはつと1−ることかできる。
包ってこのプロセスによりベクトル対すなわち谷4卑フ
レーム間隔における4・幾1止へクトルとマスクさ才′
[たベクトルの時間j喧シーケンスである■はテンプレ
ートが発生−1−る。
この70aセスのサンプルは次の通りである。
各サンプルに対して基卑時における磯鹸ベクトルン次定
1−るu i 1o o I Ll 1− サンプル1
B’ Vl 11 ′l (J 1 1 U 1 −サ
ングル1UOII′v・・・・・−・・・・・・・・・
・・・・・・・・・・・・・・・・・・・列方向に7I
llえる3 57 96 97 41 98 95 3
3 −ベクトル’l力?4fl”6’a:lN場−奴除
叔を選択する・・例えは76カ (イボ動分布)+、i
 Xi i X 1 1 X ・・RE′(■)(機能
ペクトノリ1 口 + 1 0’1 1 0 ・・RM
(iバマスクベクトル)(ri+ 女ケ群行動 ) T工8981 22 次にスピーチ入力の1フレーム?にテンプレートの1フ
レームと比較する基本距離測冗について説明する。しか
しなから@識別は単にフレームごとに一致性を調べるだ
けでなく入カフレームシークンスと詰テンノ0レート内
の基準ベクトルシーケンスの知似性?見つけることに基
いている。本実施・しIJ K時いては動的計画法(時
間一致)動作20を使用し又胎テングレートP]の基準
ベクトルシーケンスとスピーチ人力内の截能ベクトルシ
ーケンス曲の最適船台7a1′探している。この動U′
ソロ1′劃法アルゴリズムによりさまざまな話者による
119間歪を高1節することができイ0」のA・11膚
もある。生・−に7髄了虚は制御7.Hされない。すな
わち入カフレームンーグンス内のどこで胎テンプレート
の終点を帥別ずべきかという点V(ついて独立した判断
帳陥を必夾としない。さらにこの方法の紀2のイ・!I
Aは基Y〜)、フレーム1)−・・隔かスピーチ入力伝
号に既されるフレームIli隔の2倍であるため、記憶
朱件か低#きれることである。−散H′シに特出」の各
店に対して累積コスト70ロファイルン与えることによ
り山り矛ノさJ’Lないボ・rント法か砕JJyされ、
聯イFの入力フレームを最終ルート ザ時間7a□ Air (i’1的にするために、本チ
施俸1では後i”fLするようtこ替りKaGの終りウ
ィンド馨1史用してい4)。
や上つ゛(目i1辰IS;・ζ′によりスカラー夛に壌
Jイl!何二6111矩1114JJ,、 、 、か出
さ」1そわは入力フレームJと基準フレームN llJ
iの非類似性をボしていb0仄にこのノド用1jJ性也
り定イ[1−は動的計画法−J=t−により最lJ・サ
ブシークンスh’LJFj+L Jlυ足佃(走置誤り
9町,、、に裳捩さλ′(、それはXI−よしくは次の
ように定義さ才t/,)。
1G,j = DNj 十min(EN−、、j−、+
に.Ju−1,、)−2。
N−1.;4−a 3N−i,5−a ”)E 、 十
〜,E 一;,「”K ”は歪ペナルティを課ずのに仕友に使用
ゴーる矩数である。すなわちノ,(2卑フレームとサン
プルフレームの予想比は一つの基準フレームと2つどと
のサンプルフレームとの比である。しかし7Iがらこ才
1か大184、の間隔でない場合には、入力フレームと
基i+4フレーム、との局賛す比か2−1とは岩なる各
基準に対して最小ザブシーケンス妊」n11にベナルテ
ィーiか力[1えられる。局部比が6−1である場合に
緋されるペナルティは局部比が4−1もしくは1−1で
ある場合に課されるものより遥かに小さい。債ぞって入
力スピーチが基準スピーチ速度よりも蝮分九い< 11
/2倍遅い)、動台には珈度のペナルティしか加えられ
ないか、人力スピーチが基裾スピーチよりも速いかもし
くは基準スピーチにより予Jυ1される速度の1172
侶以上遅い場合には実質的に大きなペナルティか加えら
れる。
すなわち2−1と6−1の1川の平均速jWで入力フレ
ームが基準フレームと整合し、入力フレームの時間分布
が基準フレームの時間分布と同じである場合には、躍通
ザブシーケンス内での入力フレームへの基準フレームの
物足マツピンクは一つおきの入力フレームと2つ、it
−′きの入力フレームとの間で亥化し、全速度弁y合ペ
ナルティはスピーチ返i)兵非J9−合の、#ハリ関数
となる。しかしなから人力サンプルの歪みか充分に非線
型であるためM加Iシーケンス内において基準テンプレ
ートシーケンスのある瞬接対が脚接人カフレームもしく
は他の6つの入力フレームから分111#さおだ入力フ
レームと°忙−合する場合には1.腺型歪み眞対する平
滑ペナルティに7≦らにペプールティが力[iえ[)れ
ろ。ごの性力jペナルティ(佳非線型小ペナルティと叶
ぷことができ、基ン1.イ対人カマンビングk)句音f
iBυに1−2よりも鴇に1−るかもしくは1−6より
も翔にする場合k(のみ課されることに?Ill注γj
olt:いたい。従ってこの止ペナルティはスピーチ速
度114報馨し讃プロセスに厭り込むが、大層の泊碑時
間馨イ・」力1・する必安ばない。
歪ペナルティはオプションであり、本究明乞実施するの
に厳密に必要ではない。すなわち動的計画法抑1>Iニ
ーの糾・返し声明は次のよ5にlfる。
E封J =JaIすJ″−起P1.4] t ”ttl
−1,j−K J本実施例ではl算ローFを最小限とす
るのに歪ペナルティを使用していない。
層、りにJ夕i’ Clノする場合には2−1より大き
い缶1糸数もし2くは基準テンプレートと入力フレーム
との一層札い比率を甥用することかできる。■?ペナル
ティはそれに応じて広−1144,K Kえることかで
きイ)。
前の211目的h11I!11法手順により各人力フレ
ーム1141隔で用ad内の各詔に対して累積適合度御
1足蝕を与えることかできる。この場合院詠装置は分離
スピーチ認識モードではなく連続スピーチ乱iaモード
で作動することができる。
しかし7よがらこれによって頁処理ロードが詠されるた
め本光明の好ましい実施・し0とはならない。
ずなわち各入力フレーム間隔で累積的な最迫・ザブシー
ケンス整合を見つけ出すのに必要な処理ロードは本能明
か特に方図する経虐的実施という点に関して背面である
。この処理ロードをイへ〇、v−4’るために好ましく
は詔の終り、陳出器22が611訴、・する飴の終臓に
おいてのみ詔を6画する。次に紀6図に関して詔の終り
イ突出器220b′11乍についてh弁明する。
本ダ、励例tこヨーいて七ロタ沙G上ビンに分明さλ′
するのみならすセロ父赤鯰数のカウントヵ斃IL侍さλ
1べ)。
例えばこれはビン閾餉に従って20フレーム長とするこ
とかできるフレームバッファ34内の4フレームに対す
るJM−4又イ幾能へクトル3ンのさまさま7よビン内
のカウントを全部力(Ii4して行うことかできる。こ
れによってバッファ、34内の全フレームのゼロ交差に
対して計66か出され、次にごの引36ン1+&l イ
1fjに対してテストすン、)ことができる(ステップ
38)。またセ゛ロ咬差敢の面接実行カウントを単に卸
持し、人力スピーチの各フレームJ!に l=1中にこ
おζrll′−(接Ni3Jパラメータとしてイ禾持す
ることによりこハを行うことかでき/、)。さらに汀だ
谷フレームにメlする歯周IL(セ゛ロ+S叔を車にカ
ウントしンレーム如わたって力p Hl−;゛ることに
より行うこともできに)。
本9i−明のこの局面のttlの終り−q’Bj l*
rにおいて行われるキーテスト38は:11−1度に渋
い1時1ハI (911えQl、30 utns )中
にゼロタ・差数かJすI馬の数?赳えるかと5かk 4
7(kかめることである。この大きなセ゛ロタ差数にL
この30 [J l11sウイントル11ハ」中に低周
ン支エネル\り切って恐らくスピーチがp、ll+Hい
ことを示1−0こ、11−ンユミットトリガー(もし2
くは1[1!の中抜クリップ1幾+i’i )に、痩用
判るバイアス11+:+ K炊分敏感であることに佃1
注怠販[Jいたい。すなわ仁シュεソトトリガーのバイ
アス仙の設□定が高過ぎると、酌)かな環境の元でii
f’tの終りのノイズにより藺の終りの検出に必快な尚
いセ゛ロ文差数を生じることかでき/工い。同様にバイ
アス110か低過ぎる場合には(”gueS8′″寺の
語の終りの”S″のような)長い蛎−声子旨により光分
な尚周波セ゛ロ交差が生じて詔の長り伏出器乞ボ↓つて
トリガ1−4)。
促つ゛(昭の終り(矢出器はtaの終りが生じたことを
選択的に示ゴー。そうであれは第2のウィンド期1川中
に1Gか終っているであろうという想矩の5cで詔の鈴
敲か行われ、それは必ずしも胎のMりか作動す之)のと
同じウィンドではない。す1.cわも本夾力石例におい
て入力スピーチェ不ルギノ鵡)い3(J(JIIISか
生じた場合市の終りが検出さ〕′1(ステップ4U)、
仄に300 msの詔の終り1災出ウインドのノ゛1−
初の2 [+ 1] Jns pこ対して仮想の飴のホ
ロ盾が丹、糸される。しかしなから語の終りが捜さ、f
するこのW52のウィンドは飴の終り検出ウィンドと同
じでモ44つ゛こいでもよ<、=jl=’帛にム翁毛な
バ′ラメータ」氾回内で変動1−心ことかできる。この
除赫5飾1クィンドを小FM <−Jるとプロセッサロ
ードは低θ)・甘ろが非鎗Nc jjO,’4 ;i、
(・、1、増大するかもしれン−Cいとい5ことか木J
4的7.(1:7り(とブ、Cる。
本発明(」、アナログ入出力接続(1なわもマイ′クロ
フオン、f’+ir I直増幅器、A/D波−b、」〕
/A笈;b、、I’t〜、1」」1叱i」曽:lpa七
と及びスビーノノ)をゴ]する ヤA講’l 1/78
(lこ 簑励 し ブご。 し か し ンj7」・ 
ら i’uj i’jc; L ブこように不発り」は
安価なマイクロコンピュータシスブムに5゛、〃10す
4)ことができ、木元四の;I;J釆烏えらλl 7.
)最+1・1実り山モードはマイクロフ゛ロセソザもし
くはマイクロコンピュータと思1−月1ろ。
η′に不発り1η(ε1ビツトマイクロプロ士ツサシス
テムeこ′太7り和するのは111単であイ)。筒1曲
なテ゛−タ変(−9器チツプやエネルギ伸]定装置は不
安である。実、通例に二体いて必安なアナログ収賄は低
域西・汲命と欧分潴とシュミットトリガ−のみであ合1
、本発明を16ビツトシステムに′実施する鳴合に処理
力及び11(1長か(=J加されるのは単に熱分Jたい
用益を前炉することかできること乞し清閑、するに、・
丙きず、月−語テンプレ−1・の開元も幾分容易になる
本技術に習熟した人には明らかなことと思われるが、本
発明は従来技術のスピーチ涯′昌に較へてやましい虚が
沢山ある。従って本発明のイ11シ囲はさまさまなイレ
止例及び俊92例に実施することができ藁(”J’ l
匂ンζ示ずものに限定されない。
【図面の簡単な説明】
第1図は本発明の飴誌臓装も#のブロック図、第2図は
本発明に従った飴鎗脈装瞳の好複しいハードウェア14
′4成を示ずブロック1閃、第6図は本発明の実施例に
おいてi14のイ冬りを何誌するのに1史月1する殆つ
ィンド與!作の終りを示す略図、第4図は枡やセグメン
トに従ったスピーチ入力の分団セ11を刀くず図である
。 符七の音、四 12・・前11′j増幅器及び微分器 13・・ゼロ交差検出襦 14・・杉&f指抽出器 15・・・処Jljjマイクロコンピュータ18・・テ
ンプレート記’1.e(装置22・・nt十の終り斗火
出器 24・・ハイレベル判断咀理 34・・20フレームバツフア 代」」人 浅 ・1・」 皓 第1頁の続き 優先権主張 [相]198坪4月13日[相]米国(U
S)■4848200発明者トーマス ビーンシャ ア
メリカ合衆国テーク 10140 キサス州ダラス、シマロン トレイル 手続補正書(方式) 昭和ご7年?月77日 特許庁長官殿 1、事件の表示 昭和gr年特許願第 272λ? 号 2、発明の名称 スじ′−ケ及V′姻iかh額番ゑダ宅玖3、補正をする
者 事件との関係 特J)出願人 住 所 4、代理人 氏 名 (6669) 浅 村 0椙、1「ぐ−τ5、
 #li、]E!’1to8(t ””””昭和左7年
 7月S1日 6、補正により増加する発明の数

Claims (1)

  1. 【特許請求の範囲】 (1) アナログ人カスぎ−チ信号受信段階と、前6己
    入力信号全調整し前記入力信号のぜ口交差間隔を測定し
    て所定のフレーム間隔で2進機能ベクトルシーケンスを
    出す段階と、 前記各2進機能ベクトルを複截の2進基へへベクトルの
    各々と比較し、ここに前記基準ベクトルはシーケンス構
    成とされており且つ前記各基準ベクトルシーケンスが認
    識h」能な藺に対応しており、前記機能ベクトルシーケ
    ンス内の連続する各ベクトルに対して前記各基準ベクト
    ルに関する距離測定を行う段階と、・ 前記基準ベクトルの前記各シーケンスと前記デジタル信
    号の前記フレームの連続的に受信される谷フレーム間の
    jsij記距離測定に従って語を認識する段階とき有す
    るスピーチ認識方法。 (2) 特fjT 請求の申巳囲第1項記載の方法にお
    いて、前記調()1(段階はAil記アナログ入力信号
    を中央クリップず〆、ことからなるスピ−チ認識方法。 t;3) !1’4r 11’l’ 請求の範囲第1項
    記載の方法K オイテ、前記ril;:l 1% Lジ
    階は前記入力信号の微分に対応する動作を行うスピ−チ
    認識方法。 (4) アツ゛ログ入カスピーチ信号全受信する段階と
    、前記人力信号全調整し前記デジタル信号のゼロ交差間
    隔全測定して所定フレーム間隔でシーケンス機能ベクト
    ル金山す段階と、 前記機能ベクトルを複数の基糸ベクトルの各々と比較し
    、ここに前記基準ベクトルはシーケンス構成とキノジて
    おり且つ前記各基準ベクトルシーケンスがg識0」能な
    飴に対応しており、前記(幾りにベクトルシーケンス内
    の連続する各ベクトルに対して前記各基準ベクトルに関
    する距離測定を行う段階と、 前記基準ベクトルの前記各シーケンスと前記デジタル信
    号の111記フレームの連続的に受信される各フレーム
    間のnIJ記距前測定に従って#全認識する段階とを有
    し、 前記認識段階は動的計画法段階からなり前記機能ベクト
    ルシーケンスと前記各基準ベクトルシーケンス間の最適
    サブシーケンス整合を行うスピーチ認識方法。 (5)特許請求の範囲第4項記載の方法において、前記
    機能ベクトルは2進ベクトルであり且つ前記基準ベクト
    ルも2進ベクトルであり、前記比較段階はハミング距離
    測定からなるスピーチ認識方法。 (6) アナログ入力スピーチ信号受信段階と、前記入
    力信号を調整し前記入力信号のゼロ交差間隔を測定して
    所定フレーム間隔で機能ベクトルシーケンスを出す段階
    と、 前記機能ベクトルを複数の基準ベクトルの各々と比較し
    、ここに前記基準ベクトルはシーケンス構成とされてお
    り・且つ前記各基準ベクトルシーケンスは認識可能な語
    に対応しており、前記機能ベクトルシーケンス内の連続
    する各ベクトルに対して前記谷基準ベクトルに関する距
    離測定を行う段階と、 前記基準ベクトルの前記各シーケンスと前記デジタル信
    号の前記フレームの連続的に受信される各フレーム間の
    前記距離測定に従って飴に認識する段階とケ有し、 前記認識段階は語の終りを確認した場合のみ実施され、
    前記語の終り確認段階は 前記入力信号のゼロ交差全監視し、前記ゼロ交差の平均
    周波数が所定のミリ秒よりも長い時間に対する終点目標
    ゼロ交差周波数を越える場合は常に飴の終り全宣言する
    段階を有するスピーチ認識方法。 (カ スピーチに対応するアナログ人力信号を受信する
    入力装置と、 所定特性に従って前記入力信号を調整し前記調整された
    信号のゼロ交差間隔を測定して2進機能ベクトルを出す
    信号処理装置と、 前記2進機能ベクトルを前記複数の2進基準ベクトルの
    各々と比較しく前記基準ベクトルは語に対応したシーケ
    ンス構成とされている)前記機能ベクトルの連続す−る
    各ベクトルに対して前記基準ベクトルに関するハミング
    距離測定に少くとも部分的に対応した距離測定を行う距
    離測定装置と、前記基準ベクトルの前記各シーケンスと
    前記機能ベクトルの連続的に受信される各ベクトル間の
    前記距離測定シーケンスに従って飴を認識する認識装置
    と、全具備する語詔識装置。 (8) スピーチに対応するアナログ入力全受信する入
    力装置と、 所定特性に従って前記入力信号を調整し前記調整された
    信号のゼロ交差間隔を測定して機能ベクトルを出す信号
    処理装置と、 前記機能ベクトルを複数個の基準ベクトルの各科と比較
    しく前記基準ベクトルは脂に対応するシーケンス構成と
    されている)、前記機能ベクトルの連続する各ベクトル
    に対して前記基準ベクトルに関するノ・ミング・距離測
    定に少くとも部分的に対応した距離測定を行う距離測定
    装置と、前記基準ベクトルの前記各シーケンスと前記機
    能ベクトルの連続的に受信される各ベクトル間の前記距
    離測定シーケンスに従って語を認識し、且つ動的Mt画
    法段階全実行して前記機能ベクトルの連続的に受信され
    る各ベクトルと前記基準ベクトルシーケンス間の最適サ
    ブシーケンス整合を行う認識装置と、を具備する@認識
    装置。 (9) アナログスピーチ入力信号を受信する入力装置
    〃と、 前記入力装置に接続され前記入力信号を測定して所定の
    フレーム間隔で機能ベクトルシーケンスを出す信号調整
    器と、 前記信号調整器に接続され前記各機能ベクトルを複数個
    の基準ベクトルの各々と比較し、ここに前記基準ベクト
    ルはシーケンス構成とされておりItツ前記各基準ベク
    トルシーケンスは認識可能な1ilIj ’rこ対応し
    −Cおり、前記機能ベクトルの連続する名ベクトルに対
    して前記各基準ベクトルニ関スル距離測定を行う距離測
    定装置と、 fljl 記基準ベクトルの前記各シーケンス、!:前
    前記4能能ベクトルシーケンス内連続する各ベクトル間
    の前記距離測定に従って語を認識する装置と、を具備し
    、 前記各基準ベクトルシーケンスにはマスクペクトルが付
    随されており、前記対応するマスクベクトルによシ”ド
    ントケア”ビットと指定されている前記各基準ベクトル
    の成分を無視する間認識装置。 (LO)特許請求の範囲第9項記載の認識装置において
    、前記機能ベクトルは2進ベクトルであり、前記距離測
    定は前記機能ベクトルと前記伺随するマスクベクトルに
    従って修正された前記基準ベクトル間のハミング距離測
    定に対応している語認識装置。 (11)特許請求の範囲第9項記載の認識装置において
    、前記各マスクベクトルは複数ビットからなる2進ベク
    トルであり、前記マスクベクトルの前記各ビットは選択
    的に所定値をとって基準ベクトルの前記対応するシ・−
    ケンスの対応する部分が前記距離測定において無視され
    ることを示す語認識装置。 (I2) 特許請求の範囲第9項記載の認識装置におい
    て、一つのマスクベクトルは前記各基準ベクトルを独特
    に付随している語認識装置。 ([31特許請求の範囲第9項記載の認識装置において
    、一つのマスクベクトルは前記各基準ベクトルを独特に
    伺随しており、前記マスクベクトルは前記付随する基準
    ベクトルと同数のビット’を有する認識装置。 ll4)スピーチに対応するアナログ入力信号を受信す
    る段階と、 前記入力信号を調整及び測定して所定のフレーム間隔で
    機能ベクトルシーケンスを出す段階と、前記各機能ベク
    トルを前記複数個の基準ベクトルの各々と比較し、ここ
    に前記基準ベクトルはシーケンス構成とされており且つ
    MiJ記基準基準ベクトルシーケンス識可能な飴に対応
    しており、前記機能ベクトルの連続する谷ベクトルに対
    して前記谷基準ベクトルに関する距離測定を行う段階と
    、前記基準ベクトルの前記各シーケンスと前記機能ベク
    トルシーケンス内の連続するベクトル間の前記距離測定
    に従って語全g識する段階とを有し、n’jJ記各基準
    ベク、トルシーケンスはそれと共に記憶されたマスクベ
    クトルを有し、前記距離測定は前記マスクベクトルによ
    シ”ドントケア”と指定されている前記各基準ベクトル
    の成分を無視するスピーチ認識方法。 (1つ′特許請求の範囲第14項記載の方法において、
    前記各マスクベルトは複数ビットからなる2進ベクトル
    であり、前記マスクベクトルの前記各ビットは選択的に
    所定値をとって基準ベクトルの前日己対応するシーケン
    スの対応する部分が前記距離測定において無視されるこ
    とを示すスピーチ認識方法。
JP59071928A 1983-04-13 1984-04-12 スピーチ及び語認識装置及び方法 Pending JPS6035798A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US06/484,730 US4712242A (en) 1983-04-13 1983-04-13 Speaker-independent word recognizer
US484820 1983-04-13
US484730 1983-04-13

Publications (1)

Publication Number Publication Date
JPS6035798A true JPS6035798A (ja) 1985-02-23

Family

ID=23925373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59071928A Pending JPS6035798A (ja) 1983-04-13 1984-04-12 スピーチ及び語認識装置及び方法

Country Status (2)

Country Link
US (1) US4712242A (ja)
JP (1) JPS6035798A (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241649A (en) * 1985-02-18 1993-08-31 Matsushita Electric Industrial Co., Ltd. Voice recognition method
US4837831A (en) * 1986-10-15 1989-06-06 Dragon Systems, Inc. Method for creating and using multiple-word sound models in speech recognition
US4984275A (en) * 1987-03-13 1991-01-08 Matsushita Electric Industrial Co., Ltd. Method and apparatus for speech recognition
US4907079A (en) * 1987-09-28 1990-03-06 Teleview Rating Corporation, Inc. System for monitoring and control of home entertainment electronic devices
US4937870A (en) * 1988-11-14 1990-06-26 American Telephone And Telegraph Company Speech recognition arrangement
JPH02232696A (ja) * 1989-03-06 1990-09-14 Toshiba Corp 音声認識装置
US5062137A (en) * 1989-07-27 1991-10-29 Matsushita Electric Industrial Co., Ltd. Method and apparatus for speech recognition
US5845092A (en) * 1992-09-03 1998-12-01 Industrial Technology Research Institute Endpoint detection in a stand-alone real-time voice recognition system
US6192255B1 (en) 1992-12-15 2001-02-20 Texas Instruments Incorporated Communication system and methods for enhanced information transfer
US5465401A (en) * 1992-12-15 1995-11-07 Texas Instruments Incorporated Communication system and methods for enhanced information transfer
US5335276A (en) * 1992-12-16 1994-08-02 Texas Instruments Incorporated Communication system and methods for enhanced information transfer
GB2282906B (en) 1993-10-13 1996-11-06 Dataquill Ltd Data enty systems
JP2606142B2 (ja) * 1994-06-15 1997-04-30 日本電気株式会社 ディジタル携帯電話機
US5890110A (en) * 1995-03-27 1999-03-30 The Regents Of The University Of California Variable dimension vector quantization
JP3968133B2 (ja) * 1995-06-22 2007-08-29 セイコーエプソン株式会社 音声認識対話処理方法および音声認識対話装置
WO1999000758A1 (en) * 1997-06-26 1999-01-07 Charles Schwab & Co., Inc. System and method for automatically providing financial services to a user using speech signals
US6185332B1 (en) 1999-04-22 2001-02-06 Faxtrieve, Inc. Character recognition technique
US20020138218A1 (en) * 2001-03-22 2002-09-26 Williams Richard Ernest Method and device for robust pattern recognition
US7110949B2 (en) * 2004-09-13 2006-09-19 At&T Knowledge Ventures, L.P. System and method for analysis and adjustment of speech-enabled systems
US7567903B1 (en) 2005-01-12 2009-07-28 At&T Intellectual Property Ii, L.P. Low latency real-time vocal tract length normalization
JP4667082B2 (ja) * 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法
US10373608B2 (en) 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
US10235993B1 (en) * 2016-06-14 2019-03-19 Friday Harbor Llc Classifying signals using correlations of segments
AU2017428304B2 (en) * 2017-08-25 2022-12-22 David Tuk Wai LEONG Sound recognition apparatus
SG11202113302UA (en) * 2019-05-30 2021-12-30 Insurance Services Office Inc Systems and methods for machine learning of voice attributes
CN112786017B (zh) * 2020-12-25 2024-04-09 北京猿力未来科技有限公司 语速检测模型的训练方法及装置、语速检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58190999A (ja) * 1982-04-30 1983-11-08 松下電器産業株式会社 音声認識装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3940565A (en) * 1973-07-27 1976-02-24 Klaus Wilhelm Lindenberg Time domain speech recognition system
JPS559742B2 (ja) * 1974-06-20 1980-03-12
US4084260A (en) * 1976-07-12 1978-04-11 Sperry Rand Corporation Best match content addressable memory
US4085447A (en) * 1976-09-07 1978-04-18 Sperry Rand Corporation Right justified mask transfer apparatus
US4107460A (en) * 1976-12-06 1978-08-15 Threshold Technology, Inc. Apparatus for recognizing words from among continuous speech
JPS6024994B2 (ja) * 1980-04-21 1985-06-15 シャープ株式会社 パタ−ン類似度計算方式
AU7529981A (en) * 1980-09-19 1982-03-25 Hitachi Limited Language analysis by pattern recognition
JPS5782896A (en) * 1980-11-12 1982-05-24 Hitachi Ltd Continuous voice recognition system
US4388495A (en) * 1981-05-01 1983-06-14 Interstate Electronics Corporation Speech recognition microcomputer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58190999A (ja) * 1982-04-30 1983-11-08 松下電器産業株式会社 音声認識装置

Also Published As

Publication number Publication date
US4712242A (en) 1987-12-08

Similar Documents

Publication Publication Date Title
JPS6035798A (ja) スピーチ及び語認識装置及び方法
Virtanen Sound source separation using sparse coding with temporal continuity objective
US4763278A (en) Speaker-independent word recognizer
Smith Partial learning and recognition memory in the aged
JPS5998387A (ja) メモリ回路
CN109997186B (zh) 一种用于分类声环境的设备和方法
US3198884A (en) Sound analyzing system
WO2018001125A1 (zh) 一种音频识别方法和装置
JPS5852696A (ja) 音声認識装置
JP2589299B2 (ja) 単語音声認識装置
EP0125422A1 (en) Speaker-independent word recognizer
Huang et al. Bimodal biometric person recognition by score fusion
JP2834880B2 (ja) 音声認識装置
JPH038557B2 (ja)
JP3352144B2 (ja) 音声認識装置
CN113366567B (zh) 一种声纹识别方法、歌手认证方法、电子设备及存储介质
Ponraj et al. Extraction of speech signal based on power normalized cepstral coefficient and mel frequency cepstral coefficient: A comparison
Jang et al. Microcontroller implementation of melody recognition: a prototype
Davis Order dependence in templates for monosyllabic word identification
JPS5862700A (ja) 音声認識装置
JPS60175098A (ja) 音声認識装置
JPS63223796A (ja) 音声認識方法
JP2864511B2 (ja) 話者識別方式と装置
Lowy et al. An architecture for a speech recognition system
CN113366567A (zh) 一种声纹识别方法、歌手认证方法、电子设备及存储介质