JPH02109100A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPH02109100A
JPH02109100A JP63261417A JP26141788A JPH02109100A JP H02109100 A JPH02109100 A JP H02109100A JP 63261417 A JP63261417 A JP 63261417A JP 26141788 A JP26141788 A JP 26141788A JP H02109100 A JPH02109100 A JP H02109100A
Authority
JP
Japan
Prior art keywords
voice
recognition
synthesized
user
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63261417A
Other languages
English (en)
Inventor
Hiroshi Tanaka
宏 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63261417A priority Critical patent/JPH02109100A/ja
Publication of JPH02109100A publication Critical patent/JPH02109100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要〕 装置の使用者が発声した音声をXESL、その認2N結
果を合成音声によって上記使用者に示すよう構成された
音声入力装置に関し、 従来の音声入力装置では、使用者の音声が装置で認識さ
れなかワた場合に、使用者にとって、自分の音声が装置
にどのように間こえているかの判断が困難であり、再び
発声してもやはり認識されないということが多かったと
いう問題の解決を目的とし、 使用者により発声された入力音声をそのまま保持する手
段と、音声認2結果の尤度を判定する手段とを設け、認
識結果の尤度が低い場合か、または認識できなかった場
合には、合成音声の代わりに使用者の入力音声をそのま
ま出力するか、あるいは認識結果の光度に応じて合成音
質の声質を変えて出力するよう構成する。
[産業上の利用分野] 本発明は、装置の使用者が発声した音声を認識し、その
認識結果を合成音声によって上記使用者に示すよう構成
された音声入力装置に関するものである。
[従来の技術] 従来から見られる音声入力装置の多くは、入力された音
声の!j2識結果をデイスプレィ画面上に表示していた
。しかしそのような装置では、容易に画面を見る事ので
きない状況では使用が困難であった。
そこで、本発明の従来例として挙げるような、認識結果
を合成音声で示す装置が有用となる。
これにより、音声を入力する際に、必ずしも画面を見る
必要はなくなる。
第10図は従来技術の音声入力装置について説明する図
を示しており、入力音声は装置内の音声認:J1邪51
で認識処理がされ、その認識結果をそのまま音声合成部
52に入力し、該認2結果をそのまま音声に変換して出
力するように構成されていた。
そのため、認識できない音声が入力された場合には、認
識できfJ、い旨を使用者に示すだめの特別tI音、あ
るいは特定のメツセージを出力していた。
[発明が解決しようとする課8] しかしながら、従来の音声入力*置では、使用者の音声
が装置で認2されなかった場合に、使用者にとって、自
分の音声がiiにどのように聞こえているかの判断が困
難であり、再び発声してもやはりXE、2されないとい
う事が多かっまた、合成音声によって認識結果を示すよ
うな装置では認識結果の得点が示されないため、次に発
声する時に使用者がどの程度注意して発声すべきかが判
断できなかった。
本発明は上記問題点に鑑みなされたものであり、使用者
が発声した音声を、装置がどの程度はっきりと認識した
かを使用者自身に知らせることにより、再発声時の11
!a率の向上を達成する音声入力装置を提供することを
目的とする。
[課題を解決するだめの手段] 第1図は本発明の詳細な説明する図を示しており、lは
音声認識部、2は音声合成部、4はメモリ等の入力音声
をそのまま保持する手段(以下、単に「メモリ」という
)、5は判定部を表わしている。
入力された音声は、従来通り音声認識部1に渡されて認
識処理されるが、同時にメモリ4にその発声内容が保持
される。音声のfjl結果は判定部5に渡され、認識結
果の得点が調べられる。
ここで、得点が非常に低いか、あるいは認識不能である
という結果が示されていた場合は、メモリ4に信号を送
って、その保持内容をそのまま出力させる。そうでない
場合は、認識結果を音声合成部2に渡し、合成音声によ
って認識結果を使用者に示す。
以上の説明は特許請求の範囲の請求項1に対応するもの
であり、請求項2〜5に記載の発明については、第1図
の他に第2図を用いて説明される。
第2図は声質の選択が可能な音声合成部の動作について
説明する図を示しており、3は声質選択が可能な音声合
成品の全体、3−1は音声合成部、3−2は複数の声質
の異なる音声データの保持部、3−2−1〜3−2−n
は各声質の音声データ、3−3は各声質の音声データ選
択手段(以下、単に「スイッチjともいう)を表わして
いる。
すなわち、請求項2〜5に記載の発明については、判定
R5の指示により、合成音声の声質を適宜選択する手段
を用いて構成する。
そのために、第2図に示したような構成を持った音声合
成品が必要となる。これは、判定S5の指示がスイッチ
3−3に入力され、それに従って、音声合成に用いる音
声データを変更できるようなものである。各音声データ
の声質はあらかじめ分かっているので、結局請求項2〜
5に記載の発明の差は、判定部5における指示の出し方
による。
すなわち、請求項2記載の発明については、請求項1記
載の発明において、声質の異なる複数種類の合成音声を
選択して出力する音声合成品を設け、合成音声としては
、発声者自身の声と明確に区別し得る声質の合成音声を
出力し、また、請求項3記載の発明については、請求項
2記載の発明において、発声者が男性であるか女性であ
るかを判断する手段を設け、発声者とは異なった性別の
合成音声を出力し、さらに、請求項4記載の発明につい
ては、請求項1記較の発明において、声質の異なる複数
種類の合成音声を選択して出力する音声合成部を設け、
認2結果の尤度に相応して合成音声の声質を選んで出力
し、 またさらに、請求項5記載の発明については、請求項4
記載の発明において、発声者が男性であるか女性である
かを判断する手段を設け、認識結果の尤度が所定の基準
以上の場合には、発声者とは異なる性別の合成音声を出
力し、尤度が所定の基準以下の場合には、発声者と同じ
性別の合成音声を出力する音声入力装置である。
[作 用] 本発明では、装置使用者が発声した入力音声を音声圧:
A部に入力し、該音声認識部の上皿結果の尤度を判定部
により判断し、 その判断結果に応じて、使用者に示される音声を変化さ
せる。
これにより、認識困難・不能の場合には自分自身の声を
返し、それ以外の時には合成音声によるlRm結果を返
す。また、請求項2〜5に記載の発明については、認識
結果の尤度に応じて合成音声の声質を変化させる。
「実施例コ 以下に説明する実施例では、音声認識及び音声合成の実
現の方式については、特に限定しない。音声上2部の機
能は、−発声単位の音声を認通処理し、認識結果である
文字列または辞書項目の番号と、それに対する得点を出
力する事である。また、音声合成品の機能は、入力され
た文字列を音声信号に変換して出力することである。以
上の機能を実現できる方式であれば、どんなものであっ
ても、本発明中の音声!!識品及び音声合成品として用
いる事ができる。
また、音声の認識単位についても、特に限定しない。た
だし、ここでは簡単のために、IIL語音原音声定して
説明する。
本発明の実施例について説明する前に、まず音声上2部
および音声合成部の一構成例について説明する。
第3図は音声utm部の一構成例を示す図であり、1−
1は分析部、1−2はマツチング部、1−3は辞書、1
−4はソーティング部、1−5は閾値判別部を表わして
いる。
入力された音声は、まず分析B1−1で一定時間毎にス
ペクトル分析され、フレームと呼ばれるベクトル値の列
に変換される。これは、例えば、A/D変挟及びFFT
分析により実現される。
次にマツチング部1−2で、辞書1−3に記憶されてい
る各標準パターンとのマツチングが行なわれ、入力音声
のスペクトル分析されたパターンと上記各標準パターン
とのDP¥離が求められる。
これは、例えば、端点固定型DPマツチングの手法によ
り寥易に計算できる。
ここで得られた結果は、ソーティング部1−4でソーテ
ィングされ、距離の小さい順に並べられる。
最後に、閾値判別部1−5で、あらかじめ設定された閾
値よりもDP距離の大きいものは削除され、残りが出力
される。
第4図は、音声合6.部の一構成例を示す図であり、2
−1はコントローラ、2−2は音声データ部、2−3は
D/A変換部を表わしている。
入力信号は音声認識部の認識結果である単語の番号であ
り、まずコントローラ2−1が単語番号を受は取ると、
そのパターンを音声データ部2−2から読み出し、該パ
ターンをD/A変換52−3が受は取り、D/A変換し
て出力する。
なお、辞書1−3と音声データ部2−2はどちらも音声
データを保持する部分であるが、辞書1−3はスペクト
ル分析されたデータを保有し、音声データ部2−2は音
声を単にA/D変換しただけのデータを保有している。
以上説明した音声認識お及び音声合成部の例は、以下に
説明する各実施例のすべてに共通のものであり(但し、
第2図に示す音声合成品では音声データの選択ができる
)、以下各実施例では音声!!l識部及び音声合成品の
内部には言及しない。
まず、第一の実施例について説明する。
本実施例の全体構成は、第1図の原理構成図に示され、
また音声認識部は第3図に、音声合成部は第4図に示さ
れている。
従って、判定部5の実現方法、及びメモリ40例につい
て以下に説明する。
第5図に、本発明の第一の実施例における判定部の動作
フローチャートを示しており、このフローチャートは請
求項3記載の発明に直接相当するものであるが、同時に
請求項1,2に記載の発明にも相当するものである。
最初に認識結果がφ(集合論では1空“を意味し、ここ
では認識結果の第1位の候補のDP距離が、予め決めら
れた閾値よりも大きい場合を意味する)であるか否かが
調べられ、φであればメモリ中の入力音声を出力させる
φでなかったら、まず入力音声が男性の声か女性の声か
を判断する。入力音声の性別を判断する方法については
、第6図にフローチャートが示しである。
ここでは音声のピッチを求め、その平均を計算する事に
よって得られる声の高さを、性別判定のパラメータとし
て用いている。すなわち、声の高さがある閾値より高け
れば女性の声、低ければ男性の声だと判断する。そして
入力が女性の声であれば、合成音声の声として男性の声
を指示し、入力が男性の声であれば、女性の声を指示す
る。
音声合成部には、第2図に示すようなスイッチング機構
(図中の3−3で示す部分)が設けであるので、指示さ
れた声質のデータを接続する事により、望みの声質の合
成音声が得られる。
次に、本発明の第二の実施例について説明する。
この実施例は請求項2に記載の発明に相当するもののう
ち、請求項3に記載の発明には含まれないものである。
本実施例では、音声認:A邪の認識方式として、一つの
単語に複数のパターンを用いるマルチテンプレート方式
を仮定している。
本実施例では、第3図に示す認識用辞書として、音声合
成に用いる音声データと同じ発声であるものを用いる。
そして、認識結果としては、単語番号及びDP距離の他
に、音声データの番号も出力するものとする。例えば、
声質の異なるn種のデータを認識に用い、最小の距離を
第mlのデータで得たとすると、その第m番という番号
も同時に出力する。
判定部には、各音声データ番号毎に、そのデータと最も
異なるデータの番号が記されている。
ここでは、そのデータが記述された表の事を判定表と呼
び、−例を第7図に示す。第8図には、本実施例におけ
る判定部のフローチャートを示す。
該フローチャートに示した動作手順により、m識結果を
示す合成音声の声質は、使用者の声ともっとも異なるも
のが選ばれるようになる。
さらに、本発明の第三の実施例について説明する。
2′)実施例は請求項5に記載の発明1こ相当するもの
であり、これはまた同時に請求項1及び請求項4に記載
の発明にも相当するものである。
基本的な動作は上記2つの実施例と同じであり、入力音
声の声質にしたがって、出力する合成音声の声質を変化
させるものである。異なる部分は判定部のアルゴリズム
である。そのフローチャートを第9図に示す。
本実施例では、まず認識結果がφかどうかを調べ、φで
ない場合、入力音声の性別を判断する。
ここまでは第一の実施例と同じである。その後、入力音
声の認識尤度(得点)を調べ、尤度があらかじめ設定し
た閾値より高ければ、入力音声と異なる性別の合成音声
を選び、低ければ入力音声と同じ性別の合成音声を選ぶ
[発明の効果] 本発明によると、装置が入力音声を[kできなかった場
合に使用者本人の声をそのまま返すため、発声の何処が
悪かったかを使用者が判断しやすく、再発声の時の認識
率が向上する。
また、認議結果を合成音声で示す時に、入力音声と紛ら
れしいような声質の音声が用いられる事を避けるので、
使用者による認識結果の判断がしやすくなる。
更に、認識結果の得点に応じた声質を選ぶ事により、使
用者に上2得点の高さに関する情報を供し、次の発声を
どの程度注意して発声すれば良いかの判断を可能とする
従って、音声入力装置の使い勝手、及び認識性能の向上
に役立つ。
【図面の簡単な説明】
第1図は本発明の詳細な説明する図、 第2図は音声合成部の声質選択について説明する図、 男3図は音声認識部の一構成例を示す図、第4図は音声
合成部の一構成例を示す図、簗5図は本発明の第一の実
施例の判定部の動作フローチャート、 第6図は入力音声の性別を判断する動作フローチャート
、 第7図は声質データの判定表を示す図、軍8図は本発明
の第二の実施例の判定部の動作フローチャート、 第9図は本発明の第三の実施例の判定部の動作フローチ
ャート、 第1O図は従来技術の音声入力装置について説明する図
である。 l・・・・・・音声認識部、2・・・・・・音声合成部
、3・・・・・・声質選択が可能な音声合成品の全体、
4・・・・・・メモリ、5・・・・・・判定部、 1−1・・・・・・分析能、1−2・・・・・・マツチ
ング部、l−3・・・・・・辞書、l−4,・・・ソー
ティング部、1−5・・・・・・闇値判別部、 2−1・・・・・・コントローラ、2−2・・・・・・
音声データ部、2−3・・・・・・D/Δ変換部、3−
1・・・・・・音声合成品、3−2・・・・・・声質デ
ータ保持部、3−2−1〜3−2−n・・・・・・各声
質の音声データ、3−3・・・・・・スイッチ

Claims (1)

  1. 【特許請求の範囲】 1、使用者が発声した音声を認識する音声認識部と、該
    音声認識部の認識結果を合成音声で出力する音声合成部
    とを有し、装置の使用者が発声した音声を認識し、該認
    識結果を合成音声で使用者に示すよう構成された音声入
    力装置において、 該装置中には、使用者により発声された入 力音声をそのまま保持する手段と、 音声認識部での認識結果の尤度を判定する 手段とを設け、 音声認識部での認識結果の尤度が所定の基 準以下の場合か、または認識できなかった場合には、 合成音声の代わりに、使用者により発声さ れた入力音声そのものを出力することを特徴とする音声
    入力装置。 2、声質の異なる複数種類の合成音声を選択して出力す
    る音声合成部を設け、 合成音声としては、発声者自身の声と明確 に区別し得る声質の合成音声を出力することを特徴とす
    る請求項1記載の音声入力装置。 3、発声者が男性であるか女性であるかを判断する手段
    を設け、 発声者とは異なった性別の合成音声を出力 することを特徴とする請求項2記載の音声入力装置。 4、声質の異なる複数種類の合成音声を選択して出力す
    る音声合成部を設け、 声質の異なる合成音声を複数種類出力する 手段を設け、 認識結果の光度に相応して合成音声の声質 を選んで出力することを特徴とする請求項1記載の音声
    入力装置。 5、発声者が男性であるか女性であるかを判断する手段
    を設け、 認識結果の尤度が所定の基準以上の場合に は、発声者とは異なる性別の音声を出力し、尤度が所定
    の基準以下の場合には、発声者と同じ性別の音声を出力
    することを特徴とする請求項4記載の音声入力装置。
JP63261417A 1988-10-19 1988-10-19 音声入力装置 Pending JPH02109100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63261417A JPH02109100A (ja) 1988-10-19 1988-10-19 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63261417A JPH02109100A (ja) 1988-10-19 1988-10-19 音声入力装置

Publications (1)

Publication Number Publication Date
JPH02109100A true JPH02109100A (ja) 1990-04-20

Family

ID=17361583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63261417A Pending JPH02109100A (ja) 1988-10-19 1988-10-19 音声入力装置

Country Status (1)

Country Link
JP (1) JPH02109100A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195449A (ja) * 2004-12-15 2006-07-27 Yamaha Corp 声質判定装置、声質判定方法、および声質判定プログラム
WO2006083020A1 (ja) * 2005-02-04 2006-08-10 Hitachi, Ltd. 抽出された音声データを用いて応答音声を生成する音声認識システム
JP2007187799A (ja) * 2006-01-12 2007-07-26 Nissan Motor Co Ltd 音声対話装置および音声対話方法
WO2017130486A1 (ja) * 2016-01-28 2017-08-03 ソニー株式会社 情報処理装置、情報処理方法およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59147397A (ja) * 1983-02-10 1984-08-23 株式会社日立製作所 音声認識制御方式
JPS6338996A (ja) * 1986-08-05 1988-02-19 沖電気工業株式会社 音声認識制御方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59147397A (ja) * 1983-02-10 1984-08-23 株式会社日立製作所 音声認識制御方式
JPS6338996A (ja) * 1986-08-05 1988-02-19 沖電気工業株式会社 音声認識制御方式

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195449A (ja) * 2004-12-15 2006-07-27 Yamaha Corp 声質判定装置、声質判定方法、および声質判定プログラム
WO2006083020A1 (ja) * 2005-02-04 2006-08-10 Hitachi, Ltd. 抽出された音声データを用いて応答音声を生成する音声認識システム
JPWO2006083020A1 (ja) * 2005-02-04 2008-06-26 株式会社日立製作所 抽出された音声データを用いて応答音声を生成する音声認識システム
JP2007187799A (ja) * 2006-01-12 2007-07-26 Nissan Motor Co Ltd 音声対話装置および音声対話方法
WO2017130486A1 (ja) * 2016-01-28 2017-08-03 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JPWO2017130486A1 (ja) * 2016-01-28 2018-11-22 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
EP3410433A4 (en) * 2016-01-28 2019-01-09 Sony Corporation INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
JP4574390B2 (ja) 音声認識方法
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
US20090197224A1 (en) Language Learning Apparatus, Language Learning Aiding Method, Program, and Recording Medium
JPH02109100A (ja) 音声入力装置
JP2002123289A (ja) 音声対話装置
TW508564B (en) Method and system for phonetic recognition
JP2001318915A (ja) フォント変換装置
JPH09179578A (ja) 単音節認識装置
JP2000207166A (ja) 音声入力装置及び音声入力方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS60158495A (ja) 情報処理方法
JPH0863185A (ja) 音声認識装置
JP2003323196A (ja) 音声認識システム、音声認識方法および音声認識用プログラム
JPH10198393A (ja) 会話記録装置
JP3515143B2 (ja) パターン追加登録装置
JPS5962899A (ja) 音声認識方式
JP2017068153A (ja) 半導体装置、システム、電子機器、及び、音声認識方法
JPH0538700U (ja) 音声応答装置
JP5152016B2 (ja) 音声認識用辞書作成装置及び音声認識用辞書作成方法
JP2002372989A (ja) 数字音声入力方法、その装置、そのプログラム及びその記録媒体
JPH04199198A (ja) 音声認識装置
JPH08110790A (ja) 音声認識装置
WO2018015989A1 (ja) 音声認識システム、音声認識方法及びプログラム