JPS59180594A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59180594A
JPS59180594A JP58053493A JP5349383A JPS59180594A JP S59180594 A JPS59180594 A JP S59180594A JP 58053493 A JP58053493 A JP 58053493A JP 5349383 A JP5349383 A JP 5349383A JP S59180594 A JPS59180594 A JP S59180594A
Authority
JP
Japan
Prior art keywords
voice
audio
detection circuit
circuit
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58053493A
Other languages
English (en)
Inventor
上原 堅助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58053493A priority Critical patent/JPS59180594A/ja
Publication of JPS59180594A publication Critical patent/JPS59180594A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、音声認識装置の改良に関する。
〔発明の技術的背景とその問題点〕
音声認識装置において、音声検出部は、入力した音声を
設定された 値により切り出す。この切り出した部分は
バッファに蓄積し、そのデータを特徴抽出部へ送り、そ
こで例えばフィルタバンク全通して周波数スペクトラム
情報に圧縮するなどして特徴抽出を行なう。特徴抽出を
経た情報は、前もって、登録されている辞書と比較計算
が行なわれ、最も距離が短いものが認識結果として判定
される。この距離計算には、従来種々の工夫がなされて
おり、例えば、特徴抽出を経たパターンと辞書パターン
の相関距離や絶対値距離などを計算する方法がある。こ
こで、音声検出部は、入力し] た音声を雑音と区別する為にLBlという閾1値をもう
ける。音声検出部が第1図に示すような音声Aを入力し
たとする。音声検出部は、音声AのレベルがLBIにな
った時点aから音声の切り出しを始め、音声を取り入れ
ていく。ここで、a点より時間t、経た後、音声のレベ
ルがLB1以上であれば、続けて音声を取り入れていく
。しかし、゛第2図に示す音声Bの場合、b点で音声レ
ベルがLBIり下なので、ここで音声の取り入れを中止
してしまう。このような音声は、雑音などに相当し、認
識対象として好ましいものではないので捨てる。すなわ
ち時間をおいてa点、b点間の音声レベルをみるという
ことは、音声と雑音の弁別を目的としている。
次に、音声Aでb点から取り入れが続行し、音声の後端
に達して、音声レベルが 値L B 2以下になり、更
に時間t2  経た時点dでも音声レベルがL f32
以下ならば音声の取り入れを終了する。
しかし、第3し1に示すようにd点で音声レベルがL 
B 2以上ならば続けて音声の取り入れを続行する。
このt2  は、通常音声の無音区間より長くとらない
と、この休止区間で音声の切り出し全終了してしまう。
しかし、音声の認識処理は、音声の切り出しが終Tした
時点dより始まるので、t、が余り長いと認識処理が遅
れて、全認識時間が大きくなってし1う。しかし、単語
認識などで、単語の種類、又発声する人の発声法知よっ
ては休止区間が非常に長くなってし、1う。例えば[も
う一度−1などの単語は、「もう」と「一度」の間を長
く延ばして発声する人がいる。この場合、極端な例では
「もう」だけで切り出して認識して、「一度」は無視し
てしまうことがある。
〔発明の目的〕
本発明は、前記期間t、全あまり長くしないで音声の切
り出しを行ない、音声のレベルが低い谷の部分が長くて
も次に発生するレベルが高い山の部分を見逃すことなく
音声を取り入才することかできる音声認識装置を提供す
ることを目的とする。
〔発明の実施例〕
第4図は本発明の音声認識装置を示すブロック図である
(1)は入力音声、(2)は設定された閾値にょシ音声
を検出する音声検出回路である。(3)は検出した音声
を蓄積するバッファメモリである。(41はバッファメ
モリの内容により特徴抽出を行なう特徴抽出回路である
。(5)は特徴抽出したデータから認識処理を行なう音
声認識回路で(6)の認識結果を外部のデバイスに送る
次に動作を説明する。第4図1てより説明すると、まず
第1図に示す様な音声(1)が音声検出回路(2)に入
力されると、この音声(1)のレベルがL B ]にな
ると音声検出回路が動作全始めて、バッフ1メモリ(3
)に音声を書き込んでいく。そして、時間t1を過ぎて
も音声(1)のレベルがLB1以上の場合は、更に続け
て音声データをバッファメモ!+ (3)K ’L+き
込んでいく。第2図圧示すよう蹟、b点において音声レ
ベルがLB1以下の場合、音声検出回路(2)は動作を
中止する。第1図に示す波形が音声検出回路(2)に入
力されている場合、音声検出回路(2)は0点まで音声
をバッファメモリに書き込んでいく。
ここで音声検出回路(2)は0点より時間【、経たd点
の音声レベルが、LB2以下ならば音声認識回路(5)
に終端検出を知らせる。
このときC虚からd点間も続けて、音声検出回路(2)
は音声をバッファメモリ(3)に省いている。
音声認識回路(5)は、終端検出を受は取るとバッファ
メモリ(3)からa点から6点1での音声データを特徴
抽出回路(4)を通して音声認識回路(5)に送り込む
。音声認識回路(5)は特徴抽出回路(4)を通したデ
ータで認識処理を行なう。一方、音声検出−]路(2)
は、d点から引続いて音声データを取り入れていく。
ここで、入力される音声が第5図に示すように、レベル
の低い谷の部分が非常に長い波形の場合、音声検出回路
(2)はe点に到達すると音声認識回路(5)に割込を
かける。音声認識回路(5)は、音声がd点よりまだ持
続していることを判断して、認識処理を中止する。ここ
で、認識処理は、大量のデータにより演算処理を行なう
必要があり、普通100〜200m5かかるので、通常
延ばして発声した場合でもd−e間は]00m5以内に
なるので、演算処理途中でe点が出会う確率は太きい。
次に音声検出回路(2)は、本当の終端gに到達したと
き、音声認識回路(5)に終端検出を知らせる。
音声認識回路(5)は前記と同様Ka点から2点までの
音声データをバッファメモリ(3)から特徴抽出回路(
4)全通して読み込み認識処理全行なう。そして、認識
結果(6)を外部の装!ご送る。
〔発明の効果〕
音声の谷が長くても、終端検出の余裕時間t?を組くす
ることができるので、認識処理時間全組R6することが
口f「ヒである。そして、確笑にギャグを追跡すること
ができるので、U識率が同上することができる。
【図面の簡単な説明】
第1図、第2図、第3図、第5図は音声入力波形を示す
図、第4図は本発明の音声認識装置を示すブロック図で
ある。 (1)・・・・・・・・・音声入力 (2)・・・・・・・・・音声検出回路(31・・・・
・・・・・バッファメモリ(4)・・・・・・・・・特
徴抽出回路(5)・・・・・・・・・音声認識回路(6
)・・・・・・・・・認識結果

Claims (1)

    【特許請求の範囲】
  1. 入力した音声の始端及び終端を検出して音声データを検
    出するとともに1つの音声データを検出したのち所定時
    間内に次の音声データを検出したら割込信号を出力する
    音声検出回路と、この音声検出回路が検出した音声デー
    タを格納するバッファメモリと、このバッファメモリに
    格納された音声データを認識するととも忙前記音声検出
    回路が出力した割込信号を受信したら現在認識中の音声
    データと新に前記音声検出回路が検出した音声データと
    を結合して認識する音声認識手段とを具備したことを特
    徴とする音声認識装置。
JP58053493A 1983-03-31 1983-03-31 音声認識装置 Pending JPS59180594A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58053493A JPS59180594A (ja) 1983-03-31 1983-03-31 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58053493A JPS59180594A (ja) 1983-03-31 1983-03-31 音声認識装置

Publications (1)

Publication Number Publication Date
JPS59180594A true JPS59180594A (ja) 1984-10-13

Family

ID=12944357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58053493A Pending JPS59180594A (ja) 1983-03-31 1983-03-31 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59180594A (ja)

Similar Documents

Publication Publication Date Title
US4284846A (en) System and method for sound recognition
US4181813A (en) System and method for speech recognition
US4811399A (en) Apparatus and method for automatic speech recognition
JPS5862699A (ja) 音声認識装置
JPS62115199A (ja) 音声応答装置
JPS59180594A (ja) 音声認識装置
JPH0950288A (ja) 音声認識装置及び音声認識方法
JPS61260299A (ja) 音声認識装置
JP2891259B2 (ja) 音声区間検出装置
JPS6267598A (ja) 音声区間検出方式
JPS5911920B2 (ja) 音声波形自動切り出し装置
JPS59114599A (ja) 音声検出方式
JPS61292699A (ja) 音声通過フイルタ
JPS58179900A (ja) 音声認識装置における音声特徴パタ−ン作成装置
JPS61116400A (ja) 音声情報処理装置
JPS6027000A (ja) パタンマツチング方法
JPH0652479B2 (ja) 音声分析方式
JPS61113099A (ja) 音声認識装置における音声区間検出方式
JPS58223192A (ja) 鼻音識別装置
JPS6177099A (ja) 音声認識方法
JPS6026400A (ja) 連続音声認識装置
JPS63306498A (ja) 音声区間検出方式
JPH0443277B2 (ja)
JPS6214200A (ja) 音声認識装置
JPS6167898A (ja) パタ−ン作成方式