JPS59121096A

JPS59121096A - 音声認識装置

Info

Publication number: JPS59121096A
Application number: JP57227705A
Authority: JP
Inventors: 浮田　輝彦; 篠田　英範; 洋一竹林
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1982-12-28
Filing date: 1982-12-28
Publication date: 1984-07-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は信号音に同期して発声された入力音声を効果的
に、且つ信頼性良く認識することのできる音声認識装置
に関する。

〔発明の技術的背景とその問題点〕

近時、音声認識技術の発達が目覚ましく、孤立発声され
た音声を高い精度で認識する音声認識装置や、単音節毎
に区切って発声された音声を入力とする音声タイプライ
タ−等が一部で実用化されるに至っている。ところで、
上記の単語音声認識装置の場合、発声された１音のみを
認識すればよいわけではなく、１音の認識が終了したと
きには速やかに次の１音の認識処理を行うことが必要で
ある。そこで従来では、例えば「ピー」といった信号音
を１音認識終了毎に出力し、この信号音に同期して次の
１音の発声入力を促すことが行われている。また音声タ
イプライタ−にあっては、連続発声された音節を取扱う
ので、キグメンテーションの問題を緩和するべく、上記
信号音を所定の同期で出力し、音声発声のタイミングを
指示する等の工夫が施されている。従って発声者は上記
信号音をモニタし、これに同期１７で音声を発声すれば
よいことになる。また装置にとっては、信号音に同期し
て音声が入力されるので、上記信号音出力タイミングを
基準として入力音声の認識処理を簡易に行うことが可能
となる。

しかして、従来装置にあっては信号音の出力タイミング
を一定の繰返し周期に定めたものや、この繰返し周期を
発声者によりマニュアル調整できるもの等がある。然し
乍ら、一定の繰返１．。

周期で信号音が与えられるものにあっては、発声者を無
視して装置のみにより音声入力が規定されるので柔軟性
に欠けると云う問題がある。

これに比して、繰返し周期を可変設定可能なものは、発
声者に応じた音声入力タイミングを定めることができる
が、疲労等によって音声入力速度が低下した場合、音声
入力を一旦停止して信号音の出力周期を調整し直すこと
が必要となる。また電話回線を介した音声入力の場合等
には、発声者によって上記調整を行うことができない等
の問題があり、取扱い性が悪かった。

Ｃ発明の目的〕本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声入力のタイミング変動に拘
らず、常に安定に信号音に同期した音声認識処理を行い
得る実用性の高い音声認識装置を提供することにある。

〔発明の概要〕

本発明は所定の繰返し周期で信号音を出力して音声の入
力を促し、この入力音声をＬ配信号音に同期して認識処
理すると共に、入力音声と信号音との時間差を求め、こ
の時間差に従って前記信号音の繰返し周期を調整して音
声の発声速度に合せるようにしたものである。

〔発明の効果）従って本発明によれば、入力音声を以って信号音の出力
タイミング（周期）が調整されるので、発声者は疲労度
や身体の状態に応じた速度で音声入力することが可能と
なる。また音声認識処理もタイミング的に整合されてい
るので簡易に行うことができる。そして、発声者は音声
入力速度の調整の為に、音声入力を中断する等の煩られ
しさを招くことがない。更には電話回線等を介した音声
入力であっても、これを確実に認識することが可能とな
る。故に総合的には音声入力の効率向ｔや取扱いの容易
化等、実用上多大なる効果が奏せられる。

〔発明の実施例〕

以下、図面を参照して本発明の一実施例につき説明する
。

第１図および第２図はそれぞれ、信号音と、この信号音
に同期して入力された音声信号の音声パワーとの関係を
示すものである。上記信号音は第３図に実施例装置の概
略構成を示すように、信号音発生部１によって所定の周
期で発生され、出力されるものであり、例えば「ビヅ、
１等の音からなる。発声者はこの信号音を認識１゜乍ら
、これに同期して音節を連続的に発声し、音声入力する
。尚、第１図および第２図では「オンセイニンシキ」な
る音声を発声入力した例が示される。音声認識部２はこ
のようにして入力された音声を、その特徴パラメータを
分析抽出し、この特徴パラメータによって示される入力
音声パターンと、予め辞書登録された標準音声パターン
との類似度計算を行う等してその音声を認識する。この
手法はパターンマツ、チング法と称されるものであるが
、他の音声認識法を採用することも勿論可能である。

本装置は、基本的には上記の如く構成される音声認識装
置において、更に時間差検出部３を持ち、前記信号音と
入力音声との時間差を求め、この時間差に従って前記信
号音の出方繰返し周期を調整するものである。そして、
これによって上記信号音と入力音声とのタイミングの整
合を図り、音声認識処理の安定化と共に、発声者に対し
て音声発声速度の制約を取除くようにしたものである。

ところで、音声入力される日本語の単音節は、基本的に
（子音十母音）の構造を有している。

そして、上記母音位置は周知の音声認識処理によって比
較的容易に検出することができる。例えば入力音声パワ
ーの時間波形について、所定の閾値以上の部分を平滑化
処理し、その中での極大値をとる位置を母音中心位置と
すればよい。

時間差検出部３は、このようにして求められる入力音声
の母音中心位置と信号音発生部２が出力する信号音の基
準位置との時間差を求め、例えばこの時間差が数音節に
亘って所定の閾値以りに増加または減少することを検出
して、前記信号音の発生繰返し周期を可変調整するもの
である。この処理は、例えば′＠４図に示すように、各
音節での時間差情報をシフトレジスタ４に順に格納し、
シフトレジスタ４のタ゛ツブ出力として得られる数音節
の時間差情報を平均化回路５により平均化処理する等し
て行われる。そして、その処理結果に従って、前記信号
音の発生周期を規定する発振器６の発振周波数を可変す
る等して行われる。

かくしてこのようにして信号音の発生繰返［。

周期が制御される本装置によれば、例えば第２図に示す
ように、入力音声の発声速度が変化するに伴い、その時
間差の変化から信号音の周期が可変制御されることにな
る。つまり、「オンセイニンシキ」なる連続音が次第に
速くなるにつれて、「イ」、「二」、「ソ」のタイミン
グで時間差が増え、ここでは過去４タイミングの時間差
に従って、時間差を少なくするべく信号音の発生周期が
短く設定される。尚、日本語にあっては、モーラ音素と
称される促音「ツ」や撥音「ン」が存在し、これらは−
音節分のタイミング発声されることもある。しかし、こ
の場合には先行音節の時間差と同一であると看做すこと
によって、数音節に亘るＬ述した時間差の変化に従う信
号音制御に何ら問題を招くことがない。

以上説明したように、本装置によれば発声者の発声速度
に応じて、信号音の発生繰返し周期が可変制御されるの
で、信号音と入力音声とを効果的に同期されることがで
き、その音声認識を安定に行わしめることができる。そ
して発声者は装置に左右されることなしに、任意の速度
で音声を入力することかで永、従来のように入力動作を
中断して速度調整を行わなければならない等の不都合が
ない。従って、疲労や身体の状態によって認識処理に悪
影響が及ぶ虞れもない等の実用上絶大なる効果が奏せら
れる。そして、効率良く、高速な音声入力が可能となる
。

尚、本発明は上記実施例に限定されるものではない。例
えば所定単位毎に区切られた発声に対する単語音声認識
についても同様に適用できる。この場合、単語開始位置
と信号音との時間差を求めるようにすればよい。また信
号音は、装置への音声入力可能状態も示すので、繰返し
周期の制御範囲には自づと限界がある。従って、この限
界範囲内で調整を行えば、その目的が効果的に達成され
る。また信号音の周期のみならず、その音量や音色等も
併せて制御するようにしても良いことは云うまでもない
。要するに本発明はその要旨を逸脱しない範囲で種々変
形して実施することができる。

【図面の簡単な説明】第１図および第２図はそれぞれ信号音と入力音声との関
係を示す図、第３図は本発明の一実施例装置の概略構成
図、第４図は時間差処理回路の構成例を示す図である。

Claims

【特許請求の範囲】

信号音を出力して音声の入力を促す手段と、上記信号音
に同期して発声入力された音声を認識処理する音声認識
部と、上記発声入力された音声の入力タイミングと前記
信号音の出力タイミングとの時間差を求める手段と、こ
の手段により求められた時間差の情報に従って前記信号
音の出力繰返し周期を調整する手段とを具備したことを
特徴とする音声認識装置。