JPS59121096A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59121096A
JPS59121096A JP57227705A JP22770582A JPS59121096A JP S59121096 A JPS59121096 A JP S59121096A JP 57227705 A JP57227705 A JP 57227705A JP 22770582 A JP22770582 A JP 22770582A JP S59121096 A JPS59121096 A JP S59121096A
Authority
JP
Japan
Prior art keywords
voice
input
signal
signal tone
time difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57227705A
Other languages
English (en)
Inventor
浮田 輝彦
篠田 英範
洋一 竹林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP57227705A priority Critical patent/JPS59121096A/ja
Publication of JPS59121096A publication Critical patent/JPS59121096A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は信号音に同期して発声された入力音声を効果的
に、且つ信頼性良く認識することのできる音声認識装置
に関する。
〔発明の技術的背景とその問題点〕
近時、音声認識技術の発達が目覚ましく、孤立発声され
た音声を高い精度で認識する音声認識装置や、単音節毎
に区切って発声された音声を入力とする音声タイプライ
タ−等が一部で実用化されるに至っている。ところで、
上記の単語音声認識装置の場合、発声された1音のみを
認識すればよいわけではなく、1音の認識が終了したと
きには速やかに次の1音の認識処理を行うことが必要で
ある。そこで従来では、例えば「ピー」といった信号音
を1音認識終了毎に出力し、この信号音に同期して次の
1音の発声入力を促すことが行われている。また音声タ
イプライタ−にあっては、連続発声された音節を取扱う
ので、キグメンテーションの問題を緩和するべく、上記
信号音を所定の同期で出力し、音声発声のタイミングを
指示する等の工夫が施されている。従って発声者は上記
信号音をモニタし、これに同期17で音声を発声すれば
よいことになる。また装置にとっては、信号音に同期し
て音声が入力されるので、上記信号音出力タイミングを
基準として入力音声の認識処理を簡易に行うことが可能
となる。
しかして、従来装置にあっては信号音の出力タイミング
を一定の繰返し周期に定めたものや、この繰返し周期を
発声者によりマニュアル調整できるもの等がある。然し
乍ら、一定の繰返1.。
周期で信号音が与えられるものにあっては、発声者を無
視して装置のみにより音声入力が規定されるので柔軟性
に欠けると云う問題がある。
これに比して、繰返し周期を可変設定可能なものは、発
声者に応じた音声入力タイミングを定めることができる
が、疲労等によって音声入力速度が低下した場合、音声
入力を一旦停止して信号音の出力周期を調整し直すこと
が必要となる。また電話回線を介した音声入力の場合等
には、発声者によって上記調整を行うことができない等
の問題があり、取扱い性が悪かった。
C発明の目的〕 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声入力のタイミング変動に拘
らず、常に安定に信号音に同期した音声認識処理を行い
得る実用性の高い音声認識装置を提供することにある。
〔発明の概要〕
本発明は所定の繰返し周期で信号音を出力して音声の入
力を促し、この入力音声をL配信号音に同期して認識処
理すると共に、入力音声と信号音との時間差を求め、こ
の時間差に従って前記信号音の繰返し周期を調整して音
声の発声速度に合せるようにしたものである。
〔発明の効果) 従って本発明によれば、入力音声を以って信号音の出力
タイミング(周期)が調整されるので、発声者は疲労度
や身体の状態に応じた速度で音声入力することが可能と
なる。また音声認識処理もタイミング的に整合されてい
るので簡易に行うことができる。そして、発声者は音声
入力速度の調整の為に、音声入力を中断する等の煩られ
しさを招くことがない。更には電話回線等を介した音声
入力であっても、これを確実に認識することが可能とな
る。故に総合的には音声入力の効率向tや取扱いの容易
化等、実用上多大なる効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明する
第1図および第2図はそれぞれ、信号音と、この信号音
に同期して入力された音声信号の音声パワーとの関係を
示すものである。上記信号音は第3図に実施例装置の概
略構成を示すように、信号音発生部1によって所定の周
期で発生され、出力されるものであり、例えば「ビヅ、
1等の音からなる。発声者はこの信号音を認識1゜乍ら
、これに同期して音節を連続的に発声し、音声入力する
。尚、第1図および第2図では「オンセイニンシキ」な
る音声を発声入力した例が示される。音声認識部2はこ
のようにして入力された音声を、その特徴パラメータを
分析抽出し、この特徴パラメータによって示される入力
音声パターンと、予め辞書登録された標準音声パターン
との類似度計算を行う等してその音声を認識する。この
手法はパターンマツ、チング法と称されるものであるが
、他の音声認識法を採用することも勿論可能である。
本装置は、基本的には上記の如く構成される音声認識装
置において、更に時間差検出部3を持ち、前記信号音と
入力音声との時間差を求め、この時間差に従って前記信
号音の出方繰返し周期を調整するものである。そして、
これによって上記信号音と入力音声とのタイミングの整
合を図り、音声認識処理の安定化と共に、発声者に対し
て音声発声速度の制約を取除くようにしたものである。
ところで、音声入力される日本語の単音節は、基本的に
(子音十母音)の構造を有している。
そして、上記母音位置は周知の音声認識処理によって比
較的容易に検出することができる。例えば入力音声パワ
ーの時間波形について、所定の閾値以上の部分を平滑化
処理し、その中での極大値をとる位置を母音中心位置と
すればよい。
時間差検出部3は、このようにして求められる入力音声
の母音中心位置と信号音発生部2が出力する信号音の基
準位置との時間差を求め、例えばこの時間差が数音節に
亘って所定の閾値以りに増加または減少することを検出
して、前記信号音の発生繰返し周期を可変調整するもの
である。この処理は、例えば′@4図に示すように、各
音節での時間差情報をシフトレジスタ4に順に格納し、
シフトレジスタ4のタ゛ツブ出力として得られる数音節
の時間差情報を平均化回路5により平均化処理する等し
て行われる。そして、その処理結果に従って、前記信号
音の発生周期を規定する発振器6の発振周波数を可変す
る等して行われる。
かくしてこのようにして信号音の発生繰返[。
周期が制御される本装置によれば、例えば第2図に示す
ように、入力音声の発声速度が変化するに伴い、その時
間差の変化から信号音の周期が可変制御されることにな
る。つまり、「オンセイニンシキ」なる連続音が次第に
速くなるにつれて、「イ」、「二」、「ソ」のタイミン
グで時間差が増え、ここでは過去4タイミングの時間差
に従って、時間差を少なくするべく信号音の発生周期が
短く設定される。尚、日本語にあっては、モーラ音素と
称される促音「ツ」や撥音「ン」が存在し、これらは−
音節分のタイミング発声されることもある。しかし、こ
の場合には先行音節の時間差と同一であると看做すこと
によって、数音節に亘るL述した時間差の変化に従う信
号音制御に何ら問題を招くことがない。
以上説明したように、本装置によれば発声者の発声速度
に応じて、信号音の発生繰返し周期が可変制御されるの
で、信号音と入力音声とを効果的に同期されることがで
き、その音声認識を安定に行わしめることができる。そ
して発声者は装置に左右されることなしに、任意の速度
で音声を入力することかで永、従来のように入力動作を
中断して速度調整を行わなければならない等の不都合が
ない。従って、疲労や身体の状態によって認識処理に悪
影響が及ぶ虞れもない等の実用上絶大なる効果が奏せら
れる。そして、効率良く、高速な音声入力が可能となる
尚、本発明は上記実施例に限定されるものではない。例
えば所定単位毎に区切られた発声に対する単語音声認識
についても同様に適用できる。この場合、単語開始位置
と信号音との時間差を求めるようにすればよい。また信
号音は、装置への音声入力可能状態も示すので、繰返し
周期の制御範囲には自づと限界がある。従って、この限
界範囲内で調整を行えば、その目的が効果的に達成され
る。また信号音の周期のみならず、その音量や音色等も
併せて制御するようにしても良いことは云うまでもない
。要するに本発明はその要旨を逸脱しない範囲で種々変
形して実施することができる。
【図面の簡単な説明】 第1図および第2図はそれぞれ信号音と入力音声との関
係を示す図、第3図は本発明の一実施例装置の概略構成
図、第4図は時間差処理回路の構成例を示す図である。

Claims (1)

    【特許請求の範囲】
  1. 信号音を出力して音声の入力を促す手段と、上記信号音
    に同期して発声入力された音声を認識処理する音声認識
    部と、上記発声入力された音声の入力タイミングと前記
    信号音の出力タイミングとの時間差を求める手段と、こ
    の手段により求められた時間差の情報に従って前記信号
    音の出力繰返し周期を調整する手段とを具備したことを
    特徴とする音声認識装置。
JP57227705A 1982-12-28 1982-12-28 音声認識装置 Pending JPS59121096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57227705A JPS59121096A (ja) 1982-12-28 1982-12-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57227705A JPS59121096A (ja) 1982-12-28 1982-12-28 音声認識装置

Publications (1)

Publication Number Publication Date
JPS59121096A true JPS59121096A (ja) 1984-07-12

Family

ID=16865052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57227705A Pending JPS59121096A (ja) 1982-12-28 1982-12-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59121096A (ja)

Similar Documents

Publication Publication Date Title
JPS6413595A (en) Voice recognition circuit using estimate of phoneme
US7107213B2 (en) Device for normalizing voice pitch for voice recognition
US20160210982A1 (en) Method and Apparatus to Enhance Speech Understanding
JPH09325798A (ja) 音声認識装置
JPS597998A (ja) 連続音声認識装置
JPS59121096A (ja) 音声認識装置
JP3578598B2 (ja) 音声合成装置
JPS59216242A (ja) 音声認識応答装置
JPS6126678B2 (ja)
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
KR100350003B1 (ko) 음성신호로부터워드를결정하는시스템
JPS62145322A (ja) 音声出力装置
JP2956069B2 (ja) 音声合成装置のデータ処理方式
JPS6118200B2 (ja)
JP2536896B2 (ja) 音声合成装置
JP2737122B2 (ja) 音声辞書作成装置
JPS59121097A (ja) 音声認識装置
KR950009328B1 (ko) 단음절단위의 음성인식방법
JP2578771B2 (ja) 音声認識装置
JP2022190769A (ja) 歌詞情報を利用した簡易歌唱音声認識処理方法および処理プログラム
JPS6285324A (ja) 文章発声方式
JPH07160256A (ja) 音声効果装置
JPS6033599A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPH0449953B2 (ja)