JPS6126678B2 - - Google Patents

Info

Publication number
JPS6126678B2
JPS6126678B2 JP54161071A JP16107179A JPS6126678B2 JP S6126678 B2 JPS6126678 B2 JP S6126678B2 JP 54161071 A JP54161071 A JP 54161071A JP 16107179 A JP16107179 A JP 16107179A JP S6126678 B2 JPS6126678 B2 JP S6126678B2
Authority
JP
Japan
Prior art keywords
speech
pattern
voice
input
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54161071A
Other languages
English (en)
Other versions
JPS5683800A (en
Inventor
Noriaki Mori
Masahisa Shimizu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP16107179A priority Critical patent/JPS5683800A/ja
Publication of JPS5683800A publication Critical patent/JPS5683800A/ja
Publication of JPS6126678B2 publication Critical patent/JPS6126678B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声に依つて機器を制御する為の音声
処理方法に関する。
近年音声認識と音声合成に関する研究が急速に
進められており、電子式卓上計算機等の電気機器
の入力を使用者の音声に依つて行ない、その出力
を合声音声に依つて行なわしめる音声処理装置が
開発されている。
斯様な音声処理装置には、特定話者を対象とし
たものと、不特定話者を対象としたものとがある
が数多くの音声パターンを記憶する必要のある不
特定話者用の音声処理装置は、記憶容量に制限の
ある現状にそぐわないので、特定話者用の音声処
理装置がこの種装置の主流となつている。この特
定話者用の音声認識装置は話者が認識させたい語
彙の音声を予め登録しておき、これを参照パター
ンとしその後の入力音声の比較材料とするもので
あるが、一回の登録作業に依つて登録された音声
は話者の標準的な音声とは限らず参照パターンと
しての信頼性に欠けるので、この登録が終了した
後に更にテストを行ない、登録された音声の参照
パターンとしての信頼性を確認する必要がある。
本発明は、登録モード及び実行モードと上述の
如きテストモードとからなる動作モードを有する
音声処理装置の処理方法に於て、認識率の向上を
目的とし、より信頼性のある参照パターンを得る
ために為されたものである。
本発明の音声処理方法を実現する構成を第1図
のブロツク図に示す。同図に於て、1は話者の音
声を電気信号に変換するマイクロフオン、2は該
電気信号から音声の特徴を抽出する特徴抽出手
段、3は該特徴抽出手段2に依つて抽出された音
声の特徴を記憶する入力パターン記憶手段であ
り、実行モードに於ては入力パターンとして記憶
し、テストモードに於てはテストパターンとして
記憶するものである。4は登録モードに於て、上
記特徴抽出手段2に依つて抽出された音声特徴を
参照パターンとして登録する参照パターン登録手
段である。5は上記入力パターン記憶手段に記憶
された入力パターンを上記参照パターン登録手段
に登録された参照パターンと比較し特定の参照パ
ターンと認識する認識処理手段であり、該入力パ
ターンに対応した信号が出力される。6は該認識
処理手段に依つて認識された入力パターンに対応
した制御が為される電子式卓上計算機等に於て代
表される電気機器。7は上記ゲストパターンとこ
のテストパターンに対応した参照パターンとを平
均化して平均値パターンを導出する平均化手段で
あり、この平均値パターンは上記参照パターン登
録手段4に再登録される。8は該参照パターン登
録手段4に登録されている参照パターンを用いて
音声を合成する音声合声手段、9は該合成手段に
依つて合成された音声を発声するスピーカであ
る。
斯様な音声処理装置は、話者が発声する言葉の
音声特徴を抽出して参照パターンとして予め登録
する音声登録モードと、新たに話者が発声する言
葉から音声特徴を抽出して上記参照パターンを修
正するテストモードと、この修正された参照パタ
ーンを用いて入力音声を認識し、この認識結果に
基いて機器の制御を実行する実行モードと、の3
モードに依つて動作するものである。
上記音声処理装置は、その第1のモードである
音声登録モードに於て、話者が認識さてたい言葉
を発声して上記マイクロフオン1に入力し、この
入力音声から上記特徴抽出手段2に依つて音声特
徴を抽出し、該音声特徴を上記参照パターン登録
手段4に記憶する事に依つて音声登録が為され
る。
又、該音声処理装置は、その第2のモードであ
るテストモードに於て、上記参照パターン登録手
段4に登録されている参照パターンを用いて上記
音声合成手段8に依り、特定の語彙の音声を合成
し、スピーカ9から発せられる合成音声の先導に
従い話者がこの言葉を発声してマイクロフオン1
に入力する事に依つてこの入力音声の特徴がテス
トパターンとして上記参照パターンに比較され
る。この比較の結果両パターンの類似度が低い時
には、参照パターンの変更が為される。即ち、上
記マイクロフオン1に入力された入力音声から上
記特徴抽出手段2に依つて音声特徴を抽出し、該
音声特徴を上記入力パターン記憶手段3にテスト
パターンとして一時的に記憶し、上記認識処理手
段5に依つて該テストパターンとこの入力音声の
先導を成した合成音声に用いられた参照パターン
とを比較し、この入力パターンが認識されない場
合に上記平均化手段7に依り該テストパターンと
該参照パターンとから成る平均値パターンを得、
該平均値パターンをこの語彙に対する参照パター
ンとして新めて上記参照パターン登録手段に記憶
する事に依つて、参照パターンの再登録が為され
る。
更に、該音声処理装置は第3のモードである実
行モードに於て、話者が予め登録してある各種の
語彙のうちから任意の言葉を発声して上記マイク
ロフオン1に入力し、この入力音声から上記特徴
抽出手段2に依つて抽出された音声特徴を入力パ
ターンとして上記入力パターン記憶手段3に記憶
し、該入力パターンを上記認識処理手段5に依つ
て各種の参照パターンと比較して特定の参照パタ
ーンと認識し、この入力パターンに対応した信号
を上記機器に伝送する事に依つて、この機器の制
御が為される。
上述の如き本発明の音声処理方法のテストモー
ドに於て、話者の音声特徴から成る参照パターン
を用いて合成されてスピーカから発せられる合成
音声は、音声登録モードに於て話者が発声した音
声が再生されたものとなる。
第2図は、本発明の音声処理方法の他の実施例
を示すブロツク図である。同図に於て、1〜9は
第1図と同様にマイクロフオン〜スピーカを示し
ており、第1図の音声処理装置と異なる点は、語
彙パターン記憶手段10を設けた所にある。該語
彙パターン記憶手段10は、この音声処理装置の
制御対象となる機器6を音声に依つて制御する為
の各種の語彙の音声特徴が語彙パターンとして予
め記憶されているものである。
斯様な語彙パターン記憶手段を有する音声処理
装置は、登録モードに於てのみこの語彙パターン
記憶手段10を用いるものであり、該語彙パター
ン記憶手段10に記憶されている語彙パターンを
用いて合成手段8に依り合成された音声がスピー
カ9から発せられる。この合成音声の先導に従い
話者が発声する音声をマイクロフオン1に入力
し、この入力音声から特徴抽出手段2に依つて音
声特徴を抽出し、該音声特徴を上記参照パターン
登録手段4に登録するものである。
第3図は、本発明の音声処理方法の更に他の実
施例のブロツク図である。同図に於て1〜10
は、第1図及び第2図と同様にマイクロフオン〜
語彙パターン記憶手段であり、第1図及び第2図
の音声処理装置と異なる所は実行モードに於て制
御対象となる機器6の処理結果を音声合成手段8
に導入し、参照パターン登録手段4を用いて該合
成手段で合成されスピーカ9から発せられる合成
音声に依つて上記機器6での処理結果を出力する
点にある。この第3図に示した音声処理装置は、
実行モードに於て、機器6を制御する為に予め登
録されている各種の語彙の内から話者が任意の言
葉を発声する事に依つてこの音声がマイクロフオ
ン1に入力され、この入力音声から特徴抽出手段
2に依り抽出された音声特徴が入力パターンとし
て一時的に入力パターン記憶手段3に記憶され、
この入力パターンが認識処理手段5に依つて上記
各種の参照パターンと比較されて特定の参照パタ
ーンと認識される場合には、この認識結果が機器
6に入力される。更に、該機器6に於てはこの入
力に対応した処理が行なわれ、この処理結果が上
記音声合成手段8に伝送される。この合成手段8
では上記機器6に於ける処理結果に基いて上記参
照パターン登録手段4から選出された特定の参照
パターンを用いて音声が合成され、スピーカ9に
依つてこの合成音声が発声される。
本発明の音声処理方法の制御対象となる機器と
して電子式卓上計算機を例に挙げると、先ず登録
モードに於て、既製の語彙パターンから成る合成
音声が音声処理装置に依つて発せられる。この合
成音声は、イチ、ニ、サン、………、タス、ヒ
ク、カケル、ワル、イコール、等であり、使用者
がこの合成音声に依る先導のイチに続いてイチを
発声する事に依つて使用者のイチの音声が参照パ
ターンとして登録され、以下の音声登録も同様に
為される。斯様にして音声登録が完了すると、続
いてテストモードに移り、使用者の音声特徴を有
する参照パターンから成る合成音声がこの音声処
理装置に依つて登録モードと同様にイチ、ニ、サ
ン、………と順次発せられる。使用者が自らの音
声特徴を有するこの合成音声のイチに続いてイチ
と発声する事に依つてイチの音声特徴を有する参
照パターンは改善される。次に実行モードに於
て、例えば、2×3なる演算を行なう場合には、
「ニ、カケル、サン、イコール」と発声しこれ等
の音声が認識されると電子計算機ではこの2×3
=6なる演算処理が行なわれ、この処理結果であ
る6に対応して使用者の音声特徴を有する参照パ
ターンを用いて「ロク」なる合成音声が発声され
る。
本発明の音声処理方法は、予め参照パターン登
録手段に登録された参照パターンを用いて合成手
段に依り合成した合成音声の先導に従い話者が発
声した音声をマイクロフオンに入力し、その音声
特徴を入力パターン記憶手段にテストパターンと
して一時的に記憶し、平均化手段に依つて該テス
トパターンと上記参照パターンとを平均化して得
られた平均値パターンを参照パターン登録手段に
再登録するテストモードを有しているので、話者
がこのテストモードに於て、参照パターンを用い
た合成音声、即ち自らの音声を聞いてその口調を
確認しながら発声する事に依りこの参照パターン
は、修正されて話者の標準的な音声特徴となり得
る。従つて、本発明装置は、入力音声を比較して
認識する比較材として最適の参照パターンを得る
事ができ、認識率の高い音声認識が可能となる。
又、本発明の音声処理方法は、語彙パターンを
記憶している語彙パターン記憶手段を設ける事に
依つて該語彙パターンからなる合成音声の先導に
従い話者が発声するだけでこの話者の音声特徴を
参照パターンとして参照パターン登録手段に登録
できる音声登録モードを有しているのでこの登録
作業は、話者にとつて非常に簡単なものとなり、
誤操作の恐れを皆無とする事ができる。しかも、
この参照パターンとして登録された音声がその先
導を為した上記語彙パターンからなる合成音声の
影響を受けて話者の標準的な音声と異なつたもの
であつたとしても、前述のテストモードに於て、
この登録音声を聞いて自らの口調を確認しながら
発声する事に依りこの登録音声の特徴である参照
パターンを修正する事ができ、この参照パターン
を入力パターンの比較材として最適なものとする
事ができる。
更に、本発明の音声処理方法は、入力音声の認
識結果に基いて機器の制御を行なうと共に、該機
器に於ける処理結果の出力を上記参照パターンか
らなる合成音声に依つて行なう実行モードを有し
ているので、話者はこの機器の使用中常に自らの
音声特徴を有する合成音声を聞く事になり、自ら
の標準的な口調を自覚しながら音声に依る入力を
続ける事ができる。従つて本発明装置は入力音声
を登録音声と同様に標準的な口調の音声に保つ事
ができ、安定して高い音声認識率を得る事ができ
る。
以上の効果から、本発明の音声処理方法は入力
音声の比較材として最適な登録音声を用いて口調
の安定した入力音声を認識できるので、誤認識の
恐れが皆無となり、目的の機器を音声に依つて確
実に制御する事が可能となる。
【図面の簡単な説明】
第1図は本発明の構成を示すブロツク図、第2
図は本発明の他の実施例の構成を示すブロツク
図、第3図は本発明の更に他の実施例の構成を示
すブロツク図であり、1はマイクロフオン、2は
特徴抽出手段、3は入力パターン記憶手段、4は
参照パターン登録手段、5は認識処理手段、6は
機器、7は平均化手段、8は音声合成手段、9は
スピーカ、10は語彙パターン記憶手段、を夫々
示している。

Claims (1)

  1. 【特許請求の範囲】 1 話者の音声を電気信号に変換するマイクロフ
    オンと、該電気信号から音声の特徴を抽出する特
    徴抽出手段と、該特徴抽出手段に依つて抽出され
    た音声特徴を参照パターンとして登録する参照パ
    ターン登録手段と、これとは別に上記特徴抽出手
    段に依つて抽出された入力音声の音声特徴を入力
    パターンとして記憶する入力パターン記憶手段
    と、該入力パターンと上記参照パターンとを比較
    してその入力パターンを特定音声として認識する
    認識処理手段と、入力パターンと該入力パターン
    に対応する参照パターンとの平均化を行ない平均
    値パターンを得る平均化手段と、上記認識処理手
    段に依つて認識された入力パターンに対応した制
    御が為される機器と、音声を合成する音声合成手
    段と、該音声合成手段からの音声情報を音声に変
    換するスピーカと、を備え、音声登録モードに於
    ては、話者が認識させたい語を発声して上記マイ
    クロフオンに入力し、上記特徴抽出手段に依つて
    抽出された音声特徴を上記参照パターン登録手段
    に参照パターンとして登録し、又、テストモード
    に於ては、該参照パターン登録手段に登録された
    参照パターンを用いて上記音声合成手段に依り合
    成した合成音声を上記スピーカから発声し、この
    合成音声の先導に従い話者が発声した音声を上記
    マイクロフオンに入力してその音声特徴を上記入
    力パターン記憶手段にテストパターンとして一時
    的に記憶し、上記平均化手段に依つて該テストパ
    ターンと上記参照パターンとを平均化して得られ
    た平均値パターンを参照パターン登録手段に再登
    録し、更に、実行モードに於ては、話者が発声す
    る音声を上記マイクロフオンに入力してその音声
    特徴を上記入力パターン記憶手段に入力パターン
    として一時的に記憶し、該入力パターンを上記認
    識処理手段に依つて各種の上記参照パターンと比
    較して認識し、この認識結果に基いて上記機器を
    制御する事を特徴とした音声処理方法。 2 特許請求の範囲第1項記載の音声処理方法に
    於て、話者が認識させたい語彙の音声特徴が語彙
    パターンとして記憶されている語彙パターン記憶
    手段を設け、上記登録モードに於ては、該語彙パ
    ターンを用いて上記音声合成手段に依り合成した
    合成音声を上記スピーカから発声し、この合成音
    声の先導に従い話者が発声した音声の特徴を参照
    パターンとして上記参照パターン登録手段に登録
    する事を特徴とした音声処理方法。 3 特許請求の範囲第1項又は第2項記載の音声
    処理方法に於て、上記実行モードは、入力音声の
    認識結果に基いて上記機器の制御を行うと共に該
    機器に於ける処理結果の出力を上記参照パターン
    登録手段に登録されている参照パターンを用いて
    上記合成手段に依り音声に合成し、その合成音声
    を上記スピーカから発声する事を特徴とした音声
    処理方法。
JP16107179A 1979-12-11 1979-12-11 Voice handler Granted JPS5683800A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16107179A JPS5683800A (en) 1979-12-11 1979-12-11 Voice handler

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16107179A JPS5683800A (en) 1979-12-11 1979-12-11 Voice handler

Publications (2)

Publication Number Publication Date
JPS5683800A JPS5683800A (en) 1981-07-08
JPS6126678B2 true JPS6126678B2 (ja) 1986-06-21

Family

ID=15728062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16107179A Granted JPS5683800A (en) 1979-12-11 1979-12-11 Voice handler

Country Status (1)

Country Link
JP (1) JPS5683800A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259170A (ja) * 1999-02-10 2000-09-22 Internatl Business Mach Corp <Ibm> 音声認識システムにユーザを登録する方法および装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS58136098A (ja) * 1982-02-08 1983-08-12 株式会社京三製作所 認識パタ−ン学習方式
JPS59201141A (ja) * 1983-04-28 1984-11-14 Hitachi Ltd 音声情報入力装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114601A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice recognition system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114601A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259170A (ja) * 1999-02-10 2000-09-22 Internatl Business Mach Corp <Ibm> 音声認識システムにユーザを登録する方法および装置

Also Published As

Publication number Publication date
JPS5683800A (en) 1981-07-08

Similar Documents

Publication Publication Date Title
US9293134B1 (en) Source-specific speech interactions
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
CN110675866B (zh) 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质
US20160210982A1 (en) Method and Apparatus to Enhance Speech Understanding
CN107251137B (zh) 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质
JPS6126678B2 (ja)
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JPH11231895A (ja) 音声認識方法及びその装置
JPS6138479B2 (ja)
JPS597998A (ja) 連続音声認識装置
Prasangini et al. Sinhala speech to sinhala unicode text conversion for disaster relief facilitation in sri lanka
JP2000122678A (ja) 音声認識機器制御装置
JPS5914769B2 (ja) 音声機器
EP1426924A1 (en) Speaker recognition for rejecting background speakers
JP2020085942A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6221267B2 (ja) 音声認識装置及び方法、並びに、半導体集積回路装置
Jois et al. RED: An Intelligent Edge based Speaker System with Ambient Sensing Technology
JPH0556519B2 (ja)
JPH039400A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JP2005148764A (ja) 音声認識対話処理方法および音声認識対話装置
JPS59176791A (ja) 音声登録方式
JPS5953900A (ja) 音声認識方法
JPH01285998A (ja) 音声認識装置
JPH0316038B2 (ja)