JPH0619493A - 特定話者方式音声認識装置 - Google Patents

特定話者方式音声認識装置

Info

Publication number
JPH0619493A
JPH0619493A JP19604492A JP19604492A JPH0619493A JP H0619493 A JPH0619493 A JP H0619493A JP 19604492 A JP19604492 A JP 19604492A JP 19604492 A JP19604492 A JP 19604492A JP H0619493 A JPH0619493 A JP H0619493A
Authority
JP
Japan
Prior art keywords
speaker
voice
specific
file
unspecified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP19604492A
Other languages
English (en)
Other versions
JP3018759B2 (ja
Inventor
Hideto Fukuroi
英人 袋井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP19604492A priority Critical patent/JP3018759B2/ja
Publication of JPH0619493A publication Critical patent/JPH0619493A/ja
Application granted granted Critical
Publication of JP3018759B2 publication Critical patent/JP3018759B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 特定話者方式の音声認識に必要な音声データ
の登録操作を不特定話者方式の音声認識を利用すること
により、音声のみで行えるようにする。 【構成】 不特定話者用ファイル6は特定話者用ファイ
ル5へ音声データA1〜Anを登録する際に外部より装置側
に対し与える必要のある指示に対応する予め定められた
音声についての不特定話者方式による音声データB1〜Bm
を保持する。利用者が予め定められた音声をマイクロフ
ォン7に入力すると、不特定話者方式音声認識部3は、
A/D変換器9の出力に現れる音声データを不特定話者
用ファイル6に登録された音声データB1〜Bmに基づいて
認識し、制御部1はこの認識結果に基づいて音声データ
A1〜Anの特定話者用ファイル5への登録を制御する。ま
た、装置側からの応答を音声合成部4およびスピーカ10
を通じて音声にて行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は特定話者方式音声認識装
置に関し、特に特定話者の音声データを登録する操作を
不特定話者方式による音声認識にて音声で行う特定話者
方式音声認識装置に関する。
【0002】
【従来の技術】音声認識装置は、予め音声をデータ化し
たファイルを持ち、外部より入力されてくる音声が、そ
のファイルの中のデータと一致するか否かを判別するも
のであり、話し手を特定した特定話者方式と話し手を特
定しない不特定話者方式との2つの方式がある。
【0003】不特定話者方式は、音声データを広く一般
の使用者の音声の中から登録し、音声認識を行わせるも
のである。この方式では、予め装置にファイル化されて
いる言葉であれば、誰の音声に対しても応答可能である
ことが特徴となっている。
【0004】これに対し、特定話者方式は、その音声の
データファイルを特定の使用者が事前に自分の音声で装
置に登録し、音声認識を行わせるものである。この方式
では、使用者が登録する言葉を自由に選択できるのが特
徴である。
【0005】従って、相手先の名前等のキーワードを発
声すれば予めそのキーワードに対応して登録しておいた
ダイヤル番号に自動的に発呼する音声ダイヤル機能付き
自動車電話等の如く、登録音声を任意なものとすること
が必要な装置では、特定話者方式が一般に採用されてい
る。
【0006】
【発明が解決しようとする課題】このように特定話者方
式は、不特定話者方式にない優れた利点を有している
が、前述したように使用者が事前に自分の音声をデータ
として登録しなければならない。そして、従来は、この
音声データを登録するのに、音声認識装置にキーボード
等の操作部が必要であり、使用者は自ら複雑なキー入力
操作を行う必要があった。
【0007】このため複雑なキー入力操作を行うことに
よる操作性の悪さ、及び操作部のコスト,スペースが必
要になるという問題点があった。
【0008】本発明は、この様な点に鑑みてなされたも
のであり、特定話者方式の音声認識に必要な音声データ
の登録に不特定話者方式の音声認識を利用することによ
り、特定話者音声データの登録操作を複雑なキー入力操
作を行わずに音声で行えるようにした特定話者方式音声
認識装置を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は上記の目的を達
成するために、特定話者音声データを登録する特定話者
用ファイルと、マイクロフォンを通じて外部より入力さ
れた音声の認識を前記特定話者用ファイルに登録された
特定話者音声データに基づいて行う特定話者方式音声認
識部とを備えた特定話者方式音声認識装置において、前
記特定話者音声データを前記特定話者用ファイルへ登録
する際に外部より装置側に対し与える必要のある指示に
対応する予め定められた音声についての不特定話者方式
による不特定話者音声データを記憶する不特定話者用フ
ァイルと、前記マイクロフォンを通じて外部より入力さ
れた音声の認識を前記不特定話者用ファイルに登録され
た不特定話者音声データに基づいて行う不特定話者方式
音声認識部と、該不特定話者方式音声認識部の認識結果
に基づいて、特定話者方式による特定話者音声データの
前記特定話者用ファイルへの登録を制御する制御部とを
備えている。
【0010】また、音声合成部と該音声合成部で合成さ
れた音声を出力するスピーカとを備え、前記制御部は、
特定話者音声データの前記特定話者用ファイルへの登録
制御に関する装置側からの応答を前記音声合成部および
前記スピーカを通じて音声にて行うようにしている。
【0011】
【作用】本発明の特定話者方式音声認識装置において
は、不特定話者用ファイルが、特定話者音声データを特
定話者用ファイルへ登録する際に外部より装置側に対し
与える必要のある指示に対応する予め定められた音声に
ついての不特定話者方式による不特定話者音声データを
保持しており、利用者が予め定められた音声をマイクロ
フォンに入力すると、不特定話者方式音声認識部が、マ
イクロフォンを通じて入力したその音声を不特定話者用
ファイルに登録された不特定話者音声データに基づいて
認識し、制御部が、この認識結果に基づいて特定話者方
式による特定話者音声データの特定話者用ファイルへの
登録を制御する。また、装置側からの応答を音声合成部
およびスピーカを通じて音声にて行う。
【0012】
【実施例】次に、本発明の実施例について図面を参照し
て詳細に説明する。
【0013】図1は本発明の一実施例の構成図であり、
音声ダイヤル機能付き自動車電話に本発明を適用したも
のである。
【0014】前述したように、音声ダイヤル機能付き自
動車電話は、相手先の名前等のキーワードを発声すれば
予めそのキーワードに対応して登録されたダイヤル番号
に自動的に発呼するものであり、登録する相手先の名前
等のキーワードやダイヤル番号は利用者毎に相違するの
で、特定話者方式が適している。
【0015】この実施例の装置は、装置全体の主たる制
御を行う制御部1と、利用者の音声を入力するマイクロ
フォン7と、その出力を増幅するアンプ8と、その出力
をディジタル化するA/D変換器9と、ダイヤル番号E
1〜Enおよびそれらに対応する音声データA1〜An
を記憶する特定話者用ファイル5と、A/D変換器9の
出力に現れる音声データに対する音声認識を特定話者用
ファイル5に記憶された音声データA1〜Anに基づい
て行い、一致した即ち認識した音声データAiに対応す
るダイヤル番号Aiを制御部1に出力する特定話者方式
音声認識部2と、指示・登録e1〜emおよびそれらに
対応する音声データB1〜Bmを記憶する不特定話者用
ファイル6と、A/D変換器9の出力に現れる音声デー
タに対する音声認識を不特定話者用ファイル6に記憶さ
れた音声データB1〜Bmに基づいて行い、一致した音
声データBjに対応する指示・登録ejを制御部1に出
力する不特定話者方式音声認識部3と、制御部1から指
示された音声を合成する音声合成部4と、その出力をア
ナログ信号に変換するD/A変換器12と、その出力を
増幅するアンプ11と、その出力を音声に変換するスピ
ーカ10と、アンテナ14を通じて無線により図示しな
い基地局と信号の授受を行う送受信機13とを備えてい
る。
【0016】図2〜図4は制御部1の処理の一例を示す
フローチャートであり、以下各図を参照して本実施例の
動作を説明する。
【0017】なお、不特定話者用ファイル6の音声デー
タB1〜Bmには、例えば「登録開始」という音声,
「登録終了」という音声,数字の「0」から「9」まで
の音声に対応する音声データが記憶されており、それら
に対応する指示・登録e1〜emの内容は、登録要求の
指示,登録終了の指示,数字の0から9までの数値とす
る。
【0018】図1に示す装置の電源が投入されると、制
御部1は、図2に示す処理を開始し、マイクロフォン7
から音声が入力されたか否かをA/D変換器9の出力に
よって監視する(S1)。そして、何等かの音声が入力
されると、不特定話者方式音声認識部3から登録要求が
出力されたか否か(S2)、特定話者方式音声認識部2
からダイヤル番号が出力されてダイヤル要求されたか否
かを判定し(S3)、何れでもない場合にはノイズ或い
は誤入力として処理S1に戻り、不特定話者方式音声認
識部3から登録要求が出力されていれば処理S5へ移行
し、特定話者方式音声認識部2からダイヤル番号が出力
されていれば処理S4へ進む。
【0019】今、利用者がキーワードの音声データおよ
びそれに対応するダイヤル番号を不特定話者用ファイル
5に登録するために、「登録開始」なる音声を発したと
すると、それが不特定話者方式音声認識部3にて認識さ
れて登録要求が制御部1に出力されるため、制御部1は
処理S2から処理S5以降の登録処理へ進むことにな
る。
【0020】なお、第三者による音声データの不正登録
を防止するために、処理S2と処理S5との間に、音声
による暗証コードの入力とその照合処理とを追加し、照
合がとれた場合に限り処理S5以降の登録処理へ進むよ
うにしても良い。
【0021】制御部1は処理S5において、例えば「登
録番地を指定して下さい」といった登録番地指定促進メ
ッセージ音声を音声合成部4で合成させ、スピーカ10
から発生させる。そして、音声入力を待つ(S6)。
【0022】上記のメッセージ音声に応答して、利用者
が例えば「1」と発声すると、それが不特定話者方式音
声認識部3にて認識され、制御部1へ数値1が出力され
る。制御部1はこの数値「1」を登録番地の指定値とし
て認識し(S7でYES)、内部変数iにこの数値
「1」を設定し(S9)、処理S10へ進む。
【0023】制御部1は処理S10において、例えば
「ダイヤル番号を入力して下さい」といったダイヤル番
号入力促進メッセージ音声を音声合成部4で合成させて
スピーカ10から発生させ、音声入力を待つ(S1
1)。
【0024】次に利用者がダイヤル番号として例えば
「0459392354」を発声すると、その各々の数
値が不特定話者方式音声認識部3にて認識され、それら
の数値が制御部1へ出力されるので、制御部1はダイヤ
ル番号として必要な形式(例えば桁数等)が整っていれ
ばこれらの数値をダイヤル番号として認識し(S12で
YES)、このダイヤル番号を内部変数iが示す登録番
地のダイヤル番号Eiとして特定話者用ファイル5に格
納する(S13)。ダイヤル番号としての形式を有して
いないデータの場合は、ノイズ/誤入力として処理し
(S12でNO)、処理S11に戻って音声入力を再度
受け付ける。
【0025】なお、認識したダイヤル番号を音声合成部
4で音声に変換し、それをスピーカ10から発生させ、
利用者に確認させる処理を付加するようにしても良い。
【0026】次に制御部1は、例えば「キーワードを入
力して下さい」といったキーワード入力促進メッセージ
音声を音声合成部4で合成してスピーカ10から発生さ
せ(S14)、音声入力を待つ(S15)。
【0027】このメッセージ音声に応答して利用者が例
えば「ふくろい」と発生すると、制御部1はA/D変換
器9の出力に現れる信号を処理して得た音声データを内
部変数iが示す登録番地の音声データAiとして特定話
者用ファイル5に格納する(S16)。そして、処理S
5に戻る。
【0028】以上の一連の動作で、特定話者用ファイル
5の登録番地「1」に、ダイヤル番号「0459392
354」およびキーボード「ふくろい」という音声にか
かる音声データが登録されたことになる。
【0029】利用者は以上のような操作を繰り返すこと
により、特定話者用ファイル5に必要なだけのダイヤル
番号とキーワードに対応する音声データとを登録する。
そして、最後に「登録終了」と発生すると、それが不特
定話者方式音声認識部3で認識されて制御部1に登録終
了の指示が出力され、制御部1はこれを処理S8で認識
し、処理S1に戻る。なお、処理S6において音声入力
が検出されたが、登録番地の指定や登録終了の指定でな
い場合は、処理S6に戻って音声入力を再度受け付け
る。
【0030】さて、特定話者用ファイル5に必要なデー
タが登録された後、利用者が自ら登録したキーワードを
発声すると、それが特定話者方式音声認識部2で認識さ
れ、制御部1へ認識したキーワードに対応するダイヤル
番号が出力される。
【0031】制御部1はこれを処理S3で認識し、送受
信機13およびアンテナ14を通じて図示しない基地局
に対し、入力されたダイヤル番号を用いた発呼を行う
(S4)。
【0032】以上のように、本実施例では、不特定話者
方式の音声認識機能を使用して、ダイヤル番号およびそ
れに対応する音声データの登録を、音声だけで行えるよ
うにしている。自動車電話の場合、運転中にキーボード
等を操作して音声データ等を登録することは安全面から
著しく困難であったが、本実施例の音声ダイヤル機能付
き自動車電話によれば、運転中であっても登録が可能と
なるのでその実用的価値は非常に大きいと言える。
【0033】
【発明の効果】以上説明したように本発明の特定話者方
式音声認識装置は、特定話者方式の音声認識に必要な音
声データの登録操作を音声にて行うことができるので、
複雑なキー操作が不要となり、操作性が向上する。
【0034】また、キーボード等の操作部を省略あるい
は簡略化することができ、更に音声入力用のマイクロフ
ォンは特定話者方式の音声認識用として既に存在するも
のを利用するので、装置の小型化,低価格化が達成でき
る。
【0035】更に、装置側からの応答を音声で行う構成
では、応答を出力する表示部等が不要となり、且つ、登
録も対話形式で行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成図である。
【図2】制御部の処理例の一部を示すフローチャートで
ある。
【図3】制御部の処理例の他の部分を示すフローチャー
トである。
【図4】制御部の処理例の残りの部分を示すフローチャ
ートである。
【符号の説明】
1…制御部 2…特定話者方式音声認識部 3…不特定話者方式音声認識部 4…音声合成部 5…特定話者用ファイル 6…不特定話者用ファイル 7…マイクロフォン 8…アンプ 9…A/D変換器 10…スピーカ 11…アンプ 12…D/A変換器 13…送受信機 14…アンテナ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 特定話者音声データを登録する特定話者
    用ファイルと、マイクロフォンを通じて外部より入力さ
    れた音声の認識を前記特定話者用ファイルに登録された
    特定話者音声データに基づいて行う特定話者方式音声認
    識部とを備えた特定話者方式音声認識装置において、 前記特定話者音声データを前記特定話者用ファイルへ登
    録する際に外部より装置側に対し与える必要のある指示
    に対応する予め定められた音声についての不特定話者方
    式による不特定話者音声データを記憶する不特定話者用
    ファイルと、 前記マイクロフォンを通じて外部より入力された音声の
    認識を前記不特定話者用ファイルに登録された不特定話
    者音声データに基づいて行う不特定話者方式音声認識部
    と、 該不特定話者方式音声認識部の認識結果に基づいて、特
    定話者方式による特定話者音声データの前記特定話者用
    ファイルへの登録を制御する制御部とを具備したことを
    特徴とする特定話者方式音声認識装置。
  2. 【請求項2】 音声合成部と該音声合成部で合成された
    音声を出力するスピーカとを備え、 前記制御部は、特定話者音声データの前記特定話者用フ
    ァイルへの登録制御に関する装置側からの応答を前記音
    声合成部および前記スピーカを通じて音声にて行う請求
    項1記載の特定話者方式音声認識装置。
JP19604492A 1992-06-30 1992-06-30 特定話者方式音声認識装置 Expired - Fee Related JP3018759B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19604492A JP3018759B2 (ja) 1992-06-30 1992-06-30 特定話者方式音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19604492A JP3018759B2 (ja) 1992-06-30 1992-06-30 特定話者方式音声認識装置

Publications (2)

Publication Number Publication Date
JPH0619493A true JPH0619493A (ja) 1994-01-28
JP3018759B2 JP3018759B2 (ja) 2000-03-13

Family

ID=16351262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19604492A Expired - Fee Related JP3018759B2 (ja) 1992-06-30 1992-06-30 特定話者方式音声認識装置

Country Status (1)

Country Link
JP (1) JP3018759B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009153188A (ja) * 1999-02-01 2009-07-09 Qualcomm Inc 音声起動移動電話通話応答装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3412492B2 (ja) 1998-02-02 2003-06-03 トヨタ自動車株式会社 車輪速検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009153188A (ja) * 1999-02-01 2009-07-09 Qualcomm Inc 音声起動移動電話通話応答装置

Also Published As

Publication number Publication date
JP3018759B2 (ja) 2000-03-13

Similar Documents

Publication Publication Date Title
JP3168033B2 (ja) 音声テレフォン・ダイヤリング
JP2927891B2 (ja) 音声ダイヤル装置
EP0686297B1 (en) Voice command control and verification system and method
US20020091511A1 (en) Mobile terminal controllable by spoken utterances
JP2003515816A (ja) 音声制御された外国語翻訳デバイスのための方法及び装置
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
US20070047708A1 (en) Voice call reply using voice recognition and text to speech
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
CA2058644C (en) Voice activated telephone set
JP3018759B2 (ja) 特定話者方式音声認識装置
JP2002281145A (ja) 電話番号入力装置
JP2003029776A (ja) 音声認識装置
JP2000165489A (ja) 電話機
KR19990011023A (ko) 기능모드의 음성 인식이 가능한 디지털 휴대용 전화기 및 그 인식방법
JPH0421252A (ja) 音声応答装置
KR940011237B1 (ko) 음성 다이얼링 장치 및 방법
JPH11261683A (ja) 電話装置、プログラムを記録した記録媒体及びデータを記録した記録媒体
JPH098894A (ja) 音声認識コードレス電話機
JPS5915431B2 (ja) 音声ダイヤル装置
JP2782850B2 (ja) 自動車用電話
JPH06303320A (ja) Pbx装置
JPS63241597A (ja) 音声入力制御装置
JPH0376759B2 (ja)
JPS63305396A (ja) 音声認識装置
JPH1013546A (ja) 音声ダイヤルシステム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees