JPS61138999A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61138999A
JPS61138999A JP59260778A JP26077884A JPS61138999A JP S61138999 A JPS61138999 A JP S61138999A JP 59260778 A JP59260778 A JP 59260778A JP 26077884 A JP26077884 A JP 26077884A JP S61138999 A JPS61138999 A JP S61138999A
Authority
JP
Japan
Prior art keywords
voice
speaker
pattern
speech
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59260778A
Other languages
English (en)
Inventor
浩 榊原
真一 吉田
井上 博富
田所 富男
土肥 治
好高 久間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Kobe Steel Ltd
Hitachi Plant Technologies Ltd
Original Assignee
Hitachi Techno Engineering Co Ltd
Hitachi Ltd
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Techno Engineering Co Ltd, Hitachi Ltd, Kobe Steel Ltd filed Critical Hitachi Techno Engineering Co Ltd
Priority to JP59260778A priority Critical patent/JPS61138999A/ja
Publication of JPS61138999A publication Critical patent/JPS61138999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、人間が音声にて情報を入力する音声認識装置
の改良に関するもので、特に、使用者毎の音声パターン
t−予め登録しておき、複数の入が使用できるようにし
た音声認識袋[K係る。
〔発明の背景〕
例えば、特開昭58−68797号公報に述べられてい
るように、従来の音声認識装置は、話者交代の度毎に話
者の音声パターンを再登録しなければならないという欠
点があった。そこで、使用者全員の音声パターンを記憶
装置にあらかじめ記憶しておく方法が提案されて前述の
不便さから解放されたが、話者交代の度毎に人手によっ
て、使用する音声パターンの入れ換えをしなければなら
ないという欠点があった。
〔発明の目的〕
本発明の目的は、上記した従来技術の欠点を解消し、特
定話者用の音声認識装置を複数人の話者が、わずられし
い操作をすることなしに使用できる音声認識装置を提供
することである。
〔発明の概要〕
本発明は、音声認識装置で登録した各人の作業用音声パ
ターンを記憶装置に記憶するとともに、話者識別用音声
パターンをも記憶させておき、まず、話者の音声入力を
話者識別用音声パターンと照合して話者を識別しく第1
の認識動作)、この識別結果により該当する話者に対応
する話者別の作業用音声パターンを選択し、次に音声入
力とこの特定話者の作業用音声パターンを照合して、作
業に必要な言葉を認識(第2の認識動作)して作業を遂
行するようにしたものである。
これによシ、作業者は、わずられしい操作を要すること
なく、音声入力により自分の作業用音声パターンとの照
合による音声認識が可能となる。
本発明の望ましい一実施態様によれば、話者識別用音声
パターンと話者別の作業用音声パターンとを記憶する第
1の記憶手段と、この第1の記憶手段内のいずれかの音
声パターンを書込み、音声入力情報と照合するための第
2の記憶手段と、音声認識装置の始動時に上記第2の記
憶手段に上記話者識別用音声パターンを書込む手段と、
音声入力によシ話者識別の第1の認識動作を実行させる
手段と、この第1の認識動作の結果に応じた特定話者に
対応する作業用音声パターンを上記第2の記憶手段に書
込む手段と、音声入力によシ作業用語の認識である第2
の認識動作を実行させる手段とを設ける。
この構成によれば、使用者は、音声入力のみで自動的に
話者識別から作業へと進むことができる。
ま九、使用者のマニュアル(人為的)操作によって、話
者(自分)を指示する手段を併設し、この操作手段によ
って特定の話者が指示された場合には、該当する特定話
者に対応する作業用音声パターンを第2の記憶手段に書
き込むようにすることもできる。
この場合、話者の識別が不調のときや、使用者の好みに
よって、例えば、キーボードによる話者コードを入力し
て、直ちに、音声認識による作業に入ることができる。
〔発明の実施例〕
以下、本発明の望ましい実施例として、音声によるガイ
ダンス、アンサーバックを行いつつ、音声パターンの登
録1作業及びその結果の記録を行う音声認識装置につい
て説明する。
第1図は本発明に係る音声認識による情報入力記録装置
の一実施例の構成が示されており、同図において音声認
識部1は音声入力用マイクロの音声信号を増幅する増幅
器11、音声信号をディジタル信号に変換するA/D変
換器12、あらかじめ音声パターンを書込んでおく第2
の音声パターンメモリ14及び入力音声と音声パターン
とを照合して音声認識をする音声認識制御回路13によ
って構成されている。
一方、音声出力部2は音声出力をするための音声を記憶
しておく合成音声メモリ22、音声認識結果に応じて合
成音声メモリ22の記憶内容を選別して出力する音声出
力制御回路21、音声出力制御回路21の出力信号をア
ナログ信号に変換するD/A変換器23、アナログ信号
を増幅してスピーカ(またはイヤホン)7からアンサー
バックおよびガイダンスの音声を発生させる増幅器24
によって構成されている。
第1の音声パター/メモリ8は音声認識部1の第1の音
声バターイメモリ14に書込むべき話者識別用音声パタ
ーンおよび話者別の作業用音声パターンを記憶するもの
である。
また制御回路3は音声認識装置1の音声認識制御回路1
3を制御して音声認識結果を取シ込んだり、音声出力装
置2の音声出力制御回路21の制御をしてガイダンスや
アンナーバツク音をスピーカ7から出力させたり、音声
認識部1の音声パターンメモリ14へ吹込まれた音声を
音声パターンとして第1の音声パターンメモリ8に記憶
登録させたり、逆に、第1の音声パター/メモリ8に登
碌済の音声パターンを音声認識部1の第2゛の音声パタ
ー7メモリ14に書込んだシ、表示器(またはプリンタ
)5に制御状態や音声認識結果などを表示(またはプリ
ントアウト)シたりする制御用コンピュータで構成され
る。この制御回路3は音声の他にキーボード4によって
も制御される。
次に本発明の一実施例に受用する音声(単語)パター/
の一例を第2図に示す。
音声パターンには、話者交代をするための話者識別(交
代)用パターンと、各種の作業遂行上で必要な命令や作
業種別ろるいはデータ等を表わす作業用パターンとがあ
る。これらの各音声パターンは、音声パターンメモリ8
にあらかじめ登録しておく。すなわち、話者がマイクロ
を使って音声単語を順次音声で読み上げることによって
行なわれ、その音声は増幅器11、A/D変換器12、
音声認識制御回路13を介して、まず第2の音声パター
ンメモリ14に記憶される。この音声パターンメモリ1
4に記憶された音声パターンは、第1の音声パターンメ
モリ8に話者毎に番地付けされて格納される。これらの
音声パターンは、認識モードに応じて必要な音声パター
ンを第2のメモリ14へ書込むが、この音声パターンメ
モリ14への音声パターンの書込み番地付けに際しては
、作業用語は話者共通の同一番地とし、話者交代用語は
話者毎に相異した番地とする。そして話者識別(交代)
モードにおいては話者全員の話者識別用音声パターンの
みを第2の音声パターンメモリ14に書込んでおき、話
者識別完了後の作業モードでは、識別された特 の話者
に対応する作業用音声パターンを、音声パターンメモリ
14に移して音声でデータの入力(作業)を行なう。
次に本発明による音声情報入力の具体的動作例を第3図
に、フローを第4図に示す。まず、本装置の電源を入れ
始動させると、キーボード4から、マニュアル操作によ
る話者の指示が与えられない限シ、第1の音声パターン
メモリ8から話者識別用音声パターンを続出して第2の
音声パターンメモリ14へ書込むウ スピーカフからの音声ガイダンス「氏名は?」に対し、
A太部が、マイクロから音声で「人太部」と発声すると
、音声認識部1の音声認識制御回路13によって音声パ
ターンメモリ14に記憶されている話者識別用音声パタ
ーンとの照合を行い、最も近い音声パターン「A太部」
を探し出してその記憶番地(あるいは対応するコードデ
ータ)を制御回路3に出力する。
制御回路3は音声パターンコードの入力によりデータと
して取シ込んだ9表示器5に表示したりする他に音声出
力制御回路21にア/サーバンクさせるための指令を発
する。音声出力制御回路21は制御回路3のアンサーバ
ック指令によシ合成音声メモリ22内の音声データを出
力してD/A変換器23、増幅器24を介してスピーカ
7から「A太部」と発声させる。こ\で、A太部がマイ
クロから「OK」と発声して入力すると、音声認識部1
の音声認識制御回路13によって音声パターンメモリ1
4内の話者識別用音声パター/の中から、一致するパタ
ーンrOKJを探し出してそのパターンの記憶番地を制
御回路3に出力する。
制御回路3はこれにより話者識別の完了を判断できるの
で、第1の音声パターンメモリ8に記憶している該当話
者、つまりA太部の作業用音声パターンを第2の音声パ
ターンメモ1J14に移し換えて、A太部の作業モード
にするとともに、音声出力部2を制御してスピーカ7か
ら「作業は7」と音声ガイダンスを発する。以後は、A
太部の入力音声と、A太部の作業用音声パターンとの照
合の下に、音声認識による作業が実行される。
A太部が「入庫」と音声入力すると、音声認識の結果「
品番は?」とスピーカ7からガイダンスが返ってくるの
で、rl、2,3Jと音声入力すると正しく認識されれ
ばri、2,3Jとアンサーバックが返ってくる。次に
「置場は7」のガイダンスに対しrAJと音声入力する
と音声認識の結果rAJとアンサーバックが返ってくる
。これで、A太部は、A太部の音声のみで自分の音声パ
ターンを音声認識部に移すとともに、「品番1230品
物を置場Aに入庫した。」データを入力し記録し九こと
になる。
人太部が作業を終了し、他の話者と交代するときは、「
交代」とマイクロから入力すると作業モードから話者識
別(交代)モードに切り換る。
(第4図のフローでは省略している。)今度はB太部が
マイクロから「B太部」と音声入力すると音声認識の結
果、今度は第2の音声パターンメモリ14には第1の音
声パターンメモリ8からB太部の作業用音声パターンが
入υ、B太部が音声でデータ入力(作業)をすることが
できるようになる。
その後、C太部に交代して作業終了時に、「作業は?」
とのガイダンスに対して、C太部が「終)」と音声入力
すれば、「終り」とのアンサーバックとともに、音声認
識を終了する。
もちろん、電源スィッチあるいは他の終了スイッチによ
ってのみ音声認識を終了するようにしてもよく、更に、
この終了時に、第2の音声パターンメモリ14に、次回
の使用に備えて、話者識別用音声パターンを書込んでお
くようにしてもよい。
第4図のフローにおいては、話者の指示を、音声入力に
よらず、マニュアル操作によって行うこともできる。
すなわち、ステップ101あるいは104において、マ
ニュアル操作(キーボード4から入力)による話者の指
示(特定)がなされたことを知れば、その指示された話
者に対応した作業用音声パターンを第2のメモリ14に
書込む(ステップ105)ことにより、いきなシ作業モ
ードとすることができる。
この70−においては、第3図に示した細部処理につい
ては省略し、ステップ100〜106は共通の判断、処
理ステップを示し、201〜203は第1の認識動作で
ある話者識別モードでの判断。
処理ステップを示し、更に、301〜303には第2の
認識動作である作業モードでの判断、処理ステップを示
している。
このようにして、本実施例によれば、1組の特定話者用
音声認識装置を用いて、複数の話者が交代で自分の音声
のみで自分の音声パターンを導き出して手軽に音声によ
る作業を遂行することができる。
こ\で、第1の音声パターンメモリ8は集積回路のRA
MやROMとしても良く、また、バブルカセット、カセ
ットテープ、フロッピーディスクなどとしても良い。ま
た、音声認識結果を表示器5に表示して、音声出力部2
を省略しても複数の話者が交代して音声情報を入力する
ことができる。
〔発明の効果〕
本発明によれば安価で認識率の高い特定話者用音声認識
装置1組で複数の話者間の切換えが音声で可能であり便
利で操作性に富んだ装置とすることができる。特に、マ
イクの位置と音声認識装置が離れているときにその効果
は甚大である。
【図面の簡単な説明】
第1図は本発明の一実施例を示す音声認識装置の構成を
示すシステム構成図、第2図は第1図に示した音声認識
装置に使用する音声パターンの一例と処理内容を示す図
、第3図は話者交代と作業の一例を示す音声情報入力の
手順を示す図、第4図は本発明の一実施例フローである
。 1・・・音声認識部、2・・・音声出力部、3・・・制
御回路、4・・・キーボード責マニュアル操作手段)、
5・・・表示器またはプリンタ、6・・・マイク、7・
・・スピーカ、8・・・第1の音声パターン記憶手段、
11・・・増幅器、12・・・A/D変換器、13・・
・音声認識制御回路、14・・・第2の音声パターン記
憶手段、21・・・音声出力制御回路、22・・・合成
音声メモリ、23・・・D/A変換器、24・・・増幅
器。

Claims (1)

  1. 【特許請求の範囲】 1、音声入力情報を予め登録された音声パターンと照合
    する音声認識装置において、話者識別用音声パターンと
    各話者毎の作業用音声パターンを記憶する手段と、音声
    入力情報を、上記話者識別用音声パターンと照合する第
    1の認識動作およびこの第1の認識動作によつて識別さ
    れた特定の話者に対応する上記作業用音声パターンと照
    合する第2の認識動作を実行させる制御手段を備えた音
    声認識装置。 2、上記記憶手段は、上記話者識別用音声パターンと上
    記作業用音声パターンとを記憶した第1の記憶手段と、
    この第1の記憶手段に記憶された音声パターンのうち上
    記話者識別用音声パターンまたは各話者別の上記作業用
    音声パターンのいずれかを書換可能に記憶する照合用の
    第2の記憶手段とを備えた第1項記載の音声認識装置。 3、上記制御手段は、上記第1の認識動作によつて特定
    の話者が識別されたことに応動して、上記第1の記憶手
    段から該当話者に対応する作業用音声パターンを読出し
    て、上記第2の記憶手段の記憶内容を該当話者の作業用
    音声パターンに書換える手段を備えた第2項記載の音声
    認識装置。 4、上記制御手段は、上記音声認識装置の始動時に、上
    記第2の記憶手段に上記話者識別用の音声パターンを常
    駐させる手段を備えた第2項または第3項記載の音声認
    識装置。 5、音声入力情報を予め登録された音声パターンと照合
    する音声認識装置において、話者識別用音声パターンと
    各話者毎の作業用音声パターンを記憶する手段と、話者
    識別モードと作業モードとの間にモードを切換える手段
    と、このモード切換手段が話者識別モードを指定してい
    るとき音声入力情報を上記話者識別用音声パターンと照
    合する話者識別の第1の認識動作を実行させるとともに
    上記モード切換手段が上記作業モードを指定していると
    き上記音声入力情報を上記第1の認識動作により識別さ
    れた特定話者に対応する上記作業用音声パターンと照合
    する第2の認識動作を実行させる制御手段を備えた音声
    認識装置。 6、上記モード切換手段は、上記第1の認識動作により
    特定の話者を識別したことに応動して上記作業モードを
    指定する手段を備えた第5項記載の音声認識装置。 7、上記モード切換手段は、上記音声認識装置の始動時
    に、上記話者識別モードを指定する手段を備えた第5項
    または第6項記載の音声認識装置。 8、上記モード切換手段は、話者の指示を入力できる人
    為的操作手段を備え、上記制御手段は、上記音声入力情
    報を上記操作手段によつて指示された特定話者に対応す
    る上記作業用音声パターンと照合する第2の認識動作を
    実行させる第5項、第6項または第7項記載の音声認識
    装置。
JP59260778A 1984-12-12 1984-12-12 音声認識装置 Pending JPS61138999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59260778A JPS61138999A (ja) 1984-12-12 1984-12-12 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59260778A JPS61138999A (ja) 1984-12-12 1984-12-12 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61138999A true JPS61138999A (ja) 1986-06-26

Family

ID=17352593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59260778A Pending JPS61138999A (ja) 1984-12-12 1984-12-12 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61138999A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291124A (ja) * 1988-05-17 1989-11-22 Kubota Ltd メモリ付き体重計
JP2002123295A (ja) * 2000-09-19 2002-04-26 Thomson Licensing Sa 消費者電化製品に関連する装置をボイス制御する方法及び装置
WO2018101458A1 (ja) * 2016-12-02 2018-06-07 ヤマハ株式会社 収音機器、コンテンツ再生機器、及びコンテンツ再生システム
JPWO2019065733A1 (ja) * 2017-09-28 2020-10-22 京セラ株式会社 音声命令システム及び音声命令方法
US11289114B2 (en) 2016-12-02 2022-03-29 Yamaha Corporation Content reproducer, sound collector, content reproduction system, and method of controlling content reproducer

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56119199A (en) * 1980-02-26 1981-09-18 Sanyo Electric Co Voice identifying device
JPS57104193A (en) * 1980-12-19 1982-06-29 Matsushita Electric Ind Co Ltd Voice recognizer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56119199A (en) * 1980-02-26 1981-09-18 Sanyo Electric Co Voice identifying device
JPS57104193A (en) * 1980-12-19 1982-06-29 Matsushita Electric Ind Co Ltd Voice recognizer

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01291124A (ja) * 1988-05-17 1989-11-22 Kubota Ltd メモリ付き体重計
JP2002123295A (ja) * 2000-09-19 2002-04-26 Thomson Licensing Sa 消費者電化製品に関連する装置をボイス制御する方法及び装置
WO2018101458A1 (ja) * 2016-12-02 2018-06-07 ヤマハ株式会社 収音機器、コンテンツ再生機器、及びコンテンツ再生システム
US11289114B2 (en) 2016-12-02 2022-03-29 Yamaha Corporation Content reproducer, sound collector, content reproduction system, and method of controlling content reproducer
JPWO2019065733A1 (ja) * 2017-09-28 2020-10-22 京セラ株式会社 音声命令システム及び音声命令方法

Similar Documents

Publication Publication Date Title
JP2927891B2 (ja) 音声ダイヤル装置
JP3729918B2 (ja) マルチモーダル対話装置及び対話方法
JPH02163819A (ja) テキスト処理装置
JP3178426B2 (ja) 自然言語対話システム及び自然言語対話プログラム記録媒体
JPS61138999A (ja) 音声認識装置
JPH0225517B2 (ja)
JPS602997A (ja) 話者識別音声入力方法
US6381574B1 (en) Device for reproducing information or executing functions
JPS61130999A (ja) 音声認識装置
JP3192324B2 (ja) 特定話者用単語音声認識装置
JPH11237892A (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
JPS63116199A (ja) 音声入力装置の音声辞書格納方式
KR100204240B1 (ko) 메모리 카드를 이용한 음성 인식장치와 음성 인식방법
JP2744039B2 (ja) 音声認識装置
JPS6173998A (ja) 音声認識装置
JP2555029B2 (ja) 音声認識装置
JPH0536499U (ja) 音声認識装置
JP2000206985A (ja) 音声認識装置
JPS62100798A (ja) 音声合成評価方法
JPH0567240B2 (ja)
JPS6175395A (ja) 標準パタ−ン入力方式
JPH0488399A (ja) 音声認識装置
JPS59201141A (ja) 音声情報入力装置
JPS63305396A (ja) 音声認識装置
JPS63281196A (ja) 音声認識装置