JPH09179582A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH09179582A
JPH09179582A JP7339491A JP33949195A JPH09179582A JP H09179582 A JPH09179582 A JP H09179582A JP 7339491 A JP7339491 A JP 7339491A JP 33949195 A JP33949195 A JP 33949195A JP H09179582 A JPH09179582 A JP H09179582A
Authority
JP
Japan
Prior art keywords
standard pattern
voice
recognition
voice recognition
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7339491A
Other languages
English (en)
Inventor
Hiroshi Yamada
洋志 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7339491A priority Critical patent/JPH09179582A/ja
Publication of JPH09179582A publication Critical patent/JPH09179582A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】標準パタンセットの選択を自動化してユーザの
負担を軽減すると共に、学習機能を付与し標準パタンセ
ットを修正することで、認識速度を上げることができる
音声認識装置を提供すること。 【解決手段】音声認識手段7は、音声入力手段1から音
声情報が入力されると、標準パタン選択手段6に対し使
用する標準パタンを問い合わせる。標準パタン選択手段
6は計時手段5によって現在時刻及び作業開始からの経
過時間を得て、選択条件記憶手段4を検索し、検索結果
の標準パタン辞書名を音声認識手段7に通知する。音声
認識手段7は、標準パタン選択手段6が通知する標準パ
タン記憶手段3内の標準パタン辞書を使用して音声認識
を行い、結果を出力手段2から出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識装置に関
し、特に複数の標準パタンセットを切り替えて利用する
音声認識装置に関する。
【0002】
【従来の技術】従来の音声認識装置では、通常、入力さ
れた音声情報と、単語や音節など一定の単位に区切った
音声データの集合である標準パターンセットとを比較し
て認識を行っている。しかし、音声の個人差や同一人物
での音声の変化に対応するためには、固定した標準パタ
ンセットを利用するだけでは不十分である。そのため、
あらかじめ、複数の標準パタンセットを用意してユーザ
に選択させることによって認識性能を上げることが行わ
れている。
【0003】例えば、従来の音声認識装置の一例とし
て、特開平2−204798号公報記載の音声認識方式
では、パラメータを用いて標準パタンセットを変換し、
多様な音声に対応している。
【0004】
【発明が解決しようとする課題】上述した従来の音声認
識装置は、ユーザが直接標準パタンセットの選択を行う
のは、ユーザにとって負担であるという問題点がある。
また、標準パタンセットのどれが最適であるかを決定で
きるとは限らないという問題点がある。一方、パラメー
タによる標準パタンセット変換を用いる手法では、変換
のための時間がかかり、認識速度が低下するという問題
点がある。
【0005】本発明の目的は、標準パタンセットの選択
を自動化してユーザの負担を軽減すると共に、学習機能
を付与し標準パタンセットを修正することで、認識速度
を上げることができる音声認識装置を提供することにあ
る。
【0006】
【課題を解決するための手段】本発明の音声認識装置
は、音声を入力する音声入力手段と、複数の標準パタン
セットを記憶する標準パタン記憶手段と、前記複数の標
準パタンセットの中の一つを用いて前記音声入力手段か
ら入力される音声を認識する音声認識手段と,前記音声
認識手段による認識結果を出力する出力手段と、時刻お
よび時間を計測する計時手段と、前記複数の標準パタン
セットを使用するための条件を記憶する選択条件記憶手
段と、前記計時手段と前記選択条件記憶手段とを用いて
前記複数の標準パタンセットから一つを選択し前記音声
認識手段に通知する標準パタン選択手段とを備える構成
である。
【0007】本発明の音声認識装置は、入力した音声に
対応する正解を入力する正解入力手段と,前記正解入力
手段が入力する正解と音声入力手段が入力する音声とを
基に音声の認識結果を得るため使用する標準パタン記憶
手段に記憶した標準パタンセットを修正する学習手段と
を備えてもよい。
【0008】本発明の音声認識装置は、音声認識を行う
モードと標準パタンセットの学習を行うモードとの切替
えを音声認識手段および学習手段に通知するモード切替
手段を備えてもよい。
【0009】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0010】図1は本発明の第1の実施の形態を示すブ
ロック図である。
【0011】本発明の音声認識装置8は、音声を入力す
る音声入力手段1と、複数の標準パタンセットを記憶す
る標準パタン記憶手段3と、標準パタン記憶手段3が記
憶する複数の標準パタンセットの中の一つを用いて音声
入力手段1から入力される音声を認識する音声認識手段
7と、音声認識手段7による認識結果を出力する出力手
段2と、複数の標準パタンセットを使用するための条件
を記憶する選択条件記憶手段4と、時刻および時間を計
測する計時手段5と、選択条件記憶手段4と計時手段5
とを用いて複数の標準パタンセットから一つを選択し音
声認識手段7に通知する標準パタン選択手段6とを備え
る。
【0012】次に各手段の機能の詳細を述べる。
【0013】ここで、音声入力手段1は、音声情報を信
号化して入力する手段でマイクロホンとCPUなどで実
現できる。標準パタン記憶手段3は、音声情報を単語,
音節,半音節などの単位で記録している複数の標準パタ
ンセットから構成される。
【0014】選択条件記憶手段4は、標準パタン記憶手
段3を構成する標準パタンセットの使用条件を記憶して
いる。図2は選択条件記憶手段4の記憶内容の一例を示
す説明図である。図2では条件種別,条件,標準パタン
セット名が記述されている。条件「default」
は,条件に合う標準パタンセットがないときに選択すべ
き標準パタンセット名を記述している。条件「現在時
刻」は、現在時刻に応じて選択する標準パタンセットを
記述する。図2では,音声入力を行う時刻が8時から1
2時までは標準パタンセットB,12時から16時まで
は標準パタンセットCを使用することを示している。条
件「経過時間」は、音声入力作業開始からの経過時間に
応じて選択する標準パタンセットを記述している。ま
た、経過時間が1時間以内なら標準パタンセットD、1
時間から2時間までは標準パタンセットEを使用するこ
とを示している。複数の標準パタンセットが条件にマッ
チしたときは、最初にマッチした標準パタンセットを選
択する。
【0015】標準パタンセットを選択する条件として
は,前述の実施の形態であげた他に、使用者名や使用マ
シンに基づく条件を記述することも可能である。また、
複数の条件をAND,OR,NOTなどの論理演算で結
合することも可能である。
【0016】図3は複数の条件を組み合わせて記述した
選択条件記憶手段の記憶内容の説明図である。複数の標
準パタンが条件にあったときの処理として、標準パタン
に優先度を与え、もっとも優先度の高い標準パタンを選
択することもできる。
【0017】図4は優先度付きの選択条件記憶手段の記
憶内容の説明図である。
【0018】計時手段5は、現在の時刻及び音声入力作
業開始時刻からの経過時間を得る手段である。
【0019】標準パタン選択手段6は、計時手段5と選
択条件記憶手段4とを参照して標準パタンを選択する手
段である。
【0020】音声認識手段7は音声入力手段1で入力し
た音声情報を標準パタン選択手段6によって選択された
標準パタンと比較して音声認識を行う手段である。音声
認識は、従来の音声認識手法(たとえば,特公昭63−
226693号公報に示されるパターンマッチ方式)で
行う。
【0021】つぎに、本発明の第1の実施の形態の動作
を説明する。
【0022】音声認識手段7は、音声入力手段1から音
声情報が入力されると、標準パタン選択手段6に対し使
用する標準パタンを問い合わせる。標準パタン選択手段
6は計時手段5によって現在時刻及び作業開始からの経
過時間を得て、選択条件記憶手段4を検索し、検索結果
の標準パタン辞書名を音声認識手段7に通知する。音声
認識手段7は、標準パタン選択手段6が通知する標準パ
タン記憶手段3内の標準パタン辞書を使用して音声認識
を行い、結果を出力手段2から出力する。
【0023】たとえば、現在の時刻が8:45で、作業
開始からの経過時間が45分であれば、図2の選択条件
から標準パタンセットBと標準パタンセットDが選ばれ
る。標準パタン選択手段6は、初めに見つかった標準パ
タンセットBを返し、音声認識手段7は、標準パタンセ
ットBを用いて音声認識を行う。また、たとえば、現在
の時刻が18:35で、作業開始からの経過時間が3時
間であれば、図2の選択条件からは条件に合う標準パタ
ンセットが見つからないので、defaultと指定さ
れている標準パタンセットAを使用する。
【0024】図5は本発明の第2の実施の形態を示すブ
ロック図である。
【0025】図5で示される音声認識装置12に使用さ
れる音声入力手段1、出力手段2、選択条件記憶手段
4、計時手段5、標準パタン選択手段6、音声認識手段
7については、第1の実施の形態で示したものと同じな
ので説明を省略する。
【0026】正解入力手段9は、音声入力手段1で入力
した音声に対する正解、すなわち、ユーザの意図する認
識結果を入力する手段である。正解の入力方法として
は、キーボードやペンによる文字入力やメニューからの
選択がある。また、特定の正解について、特定の順序で
学習を行う場合は、ユーザの入力なしに正解を用意でき
る。
【0027】学習手段10は、音声入力手段1で入力し
た音声と正解入力手段9で入力した正解に基づき、標準
パタン選択手段6が選択した標準パタンセットを修正す
る手段である。標準パタンセットの修正は、たとえば、
「音声認識のためのスペクトル内挿を用いた話者適応
化」(篠田ほか,電子情報通信学会論文誌A,Vol.
J77−A,No.2,pp.120−127)で述べ
られている方法で実現できる。
【0028】標準パタン記憶手段11は、学習手段10
からの制御を受け、記憶している標準パタンセットを修
正する。
【0029】つぎに、本発明の第2の実施の形態の動作
を図面を参照して説明する。
【0030】音声認識手段7は、音声入力手段1から音
声情報が入力されると、標準パタン選択手段6に対し使
用する標準パタンを問い合わせる。標準パタン選択手段
6は計時手段5によって現在時刻及び作業開始からの経
過時間を得て、選択条件記憶手段4を検索し、検索結果
の標準パタン辞書名を音声認識手段7に通知する。音声
認識手段7は、標準パタン選択手段6が通知する標準パ
タン辞書を使用して音声認識を行い、結果を出力手段2
によって出力する。音声認識手段7は、認識結果に対し
て、ユーザが候補選択やキーボードやペンによる入力な
どを行った場合は、正解入力手段9によって選択された
候補や入力された文字列の情報を得る。この情報と入力
された音声とを比較することによって,音声認識に用い
た標準パタンセットを修正する。
【0031】図6は本発明の第3の実施の形態を示すブ
ロック図である。
【0032】図6でで示される音声認識装置16に使用
される音声入力手段1、出力手段2、選択条件記憶手段
4、計時手段5、標準パタン選択手段6、正解入力手段
9、標準パタン記憶手段11については、本発明の第2
の実施の形態で示したものと同じなので説明を省略す
る。
【0033】モード切り替え手段13は、ユーザの指定
により音声認識を行うモードと標準パタンセットの学習
を行うモードを切り替える。ユーザによる指定は、音
声、切り替えのためのコマンド入力、メニュー選択など
で行う。
【0034】学習手段14は、モード切り替え手段13
が標準パタンセットの学習を行うモードを指定している
場合、音声入力手段1で入力した音声と正解入力手段9
で入力した正解に基づき、標準パタン選択手段6が選択
した標準パタンセットを修正する手段である。
【0035】音声認識手段15は、モード切り替え手段
13からのモードの指定に従って、音声認識を行うモー
ドと標準パタンセットの学習を行うモードとのいずれか
の動作を行う。
【0036】つぎに、本発明の第3の実施の形態の動作
を図面を参照して説明する。
【0037】モード切り替え手段13が音声認識モード
を指定しているときの動作は本発明の第1の実施の形態
の動作と同様である。
【0038】モード切り替え手段13が学習モードを指
定しているときは、音声入力手段1を用いて音声を入力
し、正解入力手段9を用いて対応する正解を入力する。
正解を入力した後に音声を入力するように構成すること
もできる。標準パタン選択手段4を用いて修正する標準
パタンセット名を得て、学習手段14によって標準パタ
ン記憶手段3に含まれる該標準パタンセットを修正す
る。
【0039】
【発明の効果】以上説明したように、本発明は、音声認
識を行う時刻、認識を開始してからの経過時間を参照し
ながら、認識に利用する標準パタン辞書を選択すること
により、ユーザの声の変化に対応しながら高い認識性能
を得ることができるという効果がある。また、学習結果
を適用する標準パタンセットを条件に応じて切り替える
ことができるため、標準パタンセットを条件によって切
り替えたときの効果が更に大きくなる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態を示すブロック図で
ある。
【図2】選択条件記憶手段4の記憶内容の一例を示す説
明図である。
【図3】複数の条件を組み合わせて記述した選択条件記
憶手段の記憶内容の説明図である。
【図4】優先度付きの選択条件記憶手段の記憶内容の説
明図である。
【図5】本発明の第2の実施の形態を示すブロック図で
ある。
【図6】本発明の第3の実施の形態を示すブロック図で
ある。
【符号の説明】
1 音声入力手段 2 出力手段 3,11 標準パタン記憶手段 4 選択条件記憶手段 5 計時手段 6 標準パタン選択手段 7 音声認識手段 8,12,16 音声認識装置 9 正解入力手段 10,14 学習手段 13 モード切り替え手段 15 音声認識手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する音声入力手段と、複数の
    標準パタンセットを記憶する標準パタン記憶手段と、前
    記複数の標準パタンセットの中の一つを用いて前記音声
    入力手段から入力される音声を認識する音声認識手段
    と,前記音声認識手段による認識結果を出力する出力手
    段と、時刻および時間を計測する計時手段と、前記複数
    の標準パタンセットを使用するための条件を記憶する選
    択条件記憶手段と、前記計時手段と前記選択条件記憶手
    段とを用いて前記複数の標準パタンセットから一つを選
    択し前記音声認識手段に通知する標準パタン選択手段と
    を備えることを特徴とする音声認識装置。
  2. 【請求項2】 入力した音声に対応する正解を入力する
    正解入力手段と,前記正解入力手段が入力する正解と音
    声入力手段が入力する音声とを基に音声の認識結果を得
    るため使用する標準パタン記憶手段に記憶した標準パタ
    ンセットを修正する学習手段とを備えることを特徴とす
    る請求項1記載の音声認識装置。
  3. 【請求項3】 音声認識を行うモードと標準パタンセッ
    トの学習を行うモードとの切替えを音声認識手段および
    学習手段に通知するモード切替手段を備えたことを特徴
    とする請求項2記載の音声認識装置。
JP7339491A 1995-12-26 1995-12-26 音声認識装置 Pending JPH09179582A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7339491A JPH09179582A (ja) 1995-12-26 1995-12-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7339491A JPH09179582A (ja) 1995-12-26 1995-12-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPH09179582A true JPH09179582A (ja) 1997-07-11

Family

ID=18327976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7339491A Pending JPH09179582A (ja) 1995-12-26 1995-12-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPH09179582A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173649A (ja) * 2011-02-23 2012-09-10 Kyocera Corp 通信機器及び表示システム
JPWO2015083741A1 (ja) * 2013-12-03 2017-03-16 株式会社リコー 中継装置、表示装置および通信システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173649A (ja) * 2011-02-23 2012-09-10 Kyocera Corp 通信機器及び表示システム
JPWO2015083741A1 (ja) * 2013-12-03 2017-03-16 株式会社リコー 中継装置、表示装置および通信システム

Similar Documents

Publication Publication Date Title
JP3083640B2 (ja) 音声合成方法および装置
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPWO2005109399A1 (ja) 音声合成装置および方法
EP0942409B1 (en) Phoneme-based speech synthesis
KR20220054655A (ko) 음성 합성 방법 및 장치, 저장 매체
JP2002215187A (ja) 音声認識方法及びその装置
CA2051602C (en) Method and apparatus for generating models of spoken words based on a small number of utterances
JPH09179582A (ja) 音声認識装置
JP2003030187A (ja) 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム
JPH09305197A (ja) 音声変換方法及び装置
JPH09179578A (ja) 単音節認識装置
JP2976811B2 (ja) テキストからの人体動作音声生成システム
JP2002358091A (ja) 音声合成方法および音声合成装置
JPH11282484A (ja) 音声合成装置
JP2708771B2 (ja) 音声認識方式
JP3023957B2 (ja) 音声合成装置
JPH11259091A (ja) 音声合成装置及び方法
JPH01114898A (ja) データ検索装置
JP3700743B2 (ja) 記録媒体および文字入力装置
JP2001249678A (ja) 音声出力装置,音声出力方法および音声出力のためのプログラム記録媒体
JP2758688B2 (ja) 音声合成器
JPH11231899A (ja) 音声・動画像合成装置及び音声・動画像データベース
JP2002014687A (ja) 音声合成装置
JP2003108180A (ja) 音声合成方法および音声合成装置
JP3709436B2 (ja) 音声認識用精細セグメント音響モデルの作成装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981027