JPH01191899A - 音声入出力装置 - Google Patents

音声入出力装置

Info

Publication number
JPH01191899A
JPH01191899A JP63015903A JP1590388A JPH01191899A JP H01191899 A JPH01191899 A JP H01191899A JP 63015903 A JP63015903 A JP 63015903A JP 1590388 A JP1590388 A JP 1590388A JP H01191899 A JPH01191899 A JP H01191899A
Authority
JP
Japan
Prior art keywords
voice
input
recognition
output device
transmitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63015903A
Other languages
English (en)
Inventor
Kensuke Uehara
上原 堅助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63015903A priority Critical patent/JPH01191899A/ja
Publication of JPH01191899A publication Critical patent/JPH01191899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は音声入出力装置に係り、特に製造現場等の騒音
の多い場所でも手を労さずに音声のみで使用に供し得る
音声入出力装置に関する。
(従来の技術) 従来、工場の製造現場等において作業者が、製造過程で
生ずる事象を観察することにより得られた結果を音声を
もって装置入力させると、当該音声入力が音声認識され
て計算機に送出される方法が一般に知られている。この
種の方法は、手がふさがっていたり作業による手の汚れ
が原因で作業者のキーボード操作が不可能な場合に用い
られる音声による計算機へのデータ伝送方法である。
また作業者が現場を移動しながらの計算機へのデータ伝
送を行う方法もおる。いずれの方法にあっても入力を音
声にて行なうので身体が自由になるという長所があり、
更に音声入力が正しく認識されたか否かが音声応答装置
からの確認音声により知ることができるので入力データ
の信頼性が高まるという利点がある。また、無線によっ
て音声を伝送可能なハンドセットを作業者に携帯させれ
ば更に行動が自由になり作業性も向上させ得る。
第6図にこのような方法を実現させる従来における音声
入出力装置の概略を示した。この場合まず作業者はマイ
クロホン1とイヤホン2を頭部に装着してハンドセット
3を携帯する。このようにすることによってマイクロホ
ン1から入力された音声信号はハンドセット3から無線
で音声入出力装置の固定局7に伝送され、他方、音声応
答装置10から出力された音声信号は固定局7から無線
でハンドセット3に伝送される。この際、固定局7、音
声認識装置8、計算機(ホスト計算機)9、音声応答装
@10より構成される音声入出力装置では、前記固定局
7から出力された音声信号を音声認識装置8で音声認識
し、その認識結果から計算機9により音声応答装置10
を制御し、音声応答装置10で音声合成し、当該合成さ
れた音声信号を前記固定局7から出力させる。この音声
入出力装置の使用により作業者は音声でデータ入力し、
それに対する指示を音声でもって受は得るので、丁度、
人と対話するように自然で理解し易いマンマシンインタ
ーフェースが実現したことになる。しかし、製造現場は
一般に騒音が大きく音声入力を行なう上で不利な環境下
にあるので、マイクロホン1から外部の騒音が混入する
のを防ぐ意味で指向性のよい接話マイクロホンや喉の振
動を直接検出する咽喉マイクロホン等の使用が必要とさ
れる。また作業者はマイクロホン1を常に装着している
ので音声入力を、必要としていないときに余分な発声(
例えば「え−と」、「ゴホン」等)をすると、この音声
が音声認識装置8で認識されてその認識結果が計算機9
に送られることにより一連の音声認識シーケンスが狂っ
てしまうこともある。更に認識結果に基づき成る機器を
制御するような用途に用いる場合には、当該機器が誤動
作して重大事故につながる可能性もある。上記のような
不具合点を改善するために従来のハンドセット3には入
力音声用の0N10FFスイツチ4が付加されている。
そのため作業者は、音声入力を必要としないときにはこ
のスイッチ4をOFF状態にしておいて音声認識装置8
に余分な音声が入力されるのを防止している。
しかし、もともと手がふさがっている用途に対して役立
てるために音声入出力装置が使われているのに手でスイ
ッチを0N10FFさせることは装置本来の使用目的か
ら逸脱しているといわざるをえない。特に高所作業で両
手が完全にふさがっているような状態下での用途に対し
ても、手でもってスイッチ4を0N10FFすることは
不可能である。
また手が汚れる作業ではスイッチ4の部分が汚れたり衣
服が汚れたりする心配が常につきまとう。
以上のように従来マイクロホン1から入力される音声を
0N10FFする方法は、ハンドセット3に付加されて
いるスイッチ4を、0N10「Fする以外に方法がなか
った。
(発明が解決しようとする課題) 従来の音声入出力装置では、音声入力が不必要な時間は
ハンドセットに付加されているスイッチをOFFにして
おいて作業者が発声する余分な音声の入力を防止してい
るが、この際そのスイッチを手でもって操作してOFF
にする必要があり、このため手がふさがってしまって音
声入出力装置を使用する長所が生かせなくなるという問
題点を有している。
[発明の構成] (課題を解決するための手段) 本発明は、音声信号を音声認識し、この認識結果から文
章を組み上げて音声合成し、この合成された音声信号を
出力する音声入出力装置において、音源からの音声信号
を受信し、外部には合成された音声信号を送信する送受
信手段と、音声を取り出すための閾値より高いレベルに
ある前記音声信号について音声認識を行う音声認識手段
と、この音声認識の結果に基づく、音声情報を送出する
と共に所定のシーケンスに従ってこの閾値を変化させる
計算機と、この音声情報に基づいて音声を合成してその
合成された音声信号を前記送受信手段に送り出す音声応
答手段とを具備して構成される。
(作用) 本発明では音声入出力装置を送受信手段、音声認識手段
、計算機と音声応答手段とで構成するようにしたので、
音声入力の開始時には大きな声で発声してハンドセット
の音声入力スイッチを手動でスイッチONさせる操作を
代行でき、手が自由となるので手が汚れる作業、手がふ
さがる用途に最適となる。
(実施例) 以下、本発明の好ましい実施例を第1図を参照して詳述
する。第1図は本発明の一実施例による音声入出力装置
のブロック図を示したもので、7は音源(例えばマイク
ロホン1)からの音声信号を受信し、外部(例えばイヤ
ボン2)には合成された音声信号を送信する送受信手段
(例えば固定局)、21は音声を取り出すための閾値よ
り高いレベルにある前記音声信号について音声認識を行
う音声認識手段(例えば音声認識装置)、9はこの音声
認識の結果に基づく音声情報を送出すると共に所定のシ
ーケンスに従ってこの閾値を変化させる計算機(例えば
ホスト計算機)、10はこの音声情報に基づいて音声を
合成してその合成された音声信号を送受信手段7に送り
出す音声応答手段(例えば音声応答装置)でおる。
以下、本実施例の動作を第1図、第2図を基に説明する
。まず第1図に示した音声入出力装置に電源が投入され
るとホスト計n機9は音声認識装置8に対して起動コマ
ンドをかける。それと同時に音声認識装置21の中にあ
る第2図に示す閾値レジスタ16に閾値をセットする。
ここでイニシャライズ状態では閾値レジスタ16には通
常、音声を切り出すレベルより高い値(閾値P1 (第
3図))がセットされている。この状態で固定局7を介
して音声認識装置21に入力されてきた音声信号は、ま
ずA/D変換器11に入力され、ディジタル化され、次
いでバンドパスフィルタ12に入力される。このバンド
パスフィルタ12は、ディジタルフィルタにて形成され
ていて、中心周波数が少しづつ異なるフィルタを並列に
並べた多チャンネルのフィルタバンクになっている。こ
のフィルタバンクの出力は各チャンネルごとに整流回路
13を通されて、フレームごとのパワー成分だけが抽出
されることになる。即ち、この整流回路13の出力はフ
レームごとに抽出された音声信号のパワースペクトラム
を表わしている。
一方、−群のバンドパスフィルタの中でもとりわけ帯域
を広めにとったフィルタがあって、このフィルタからの
出力は音声信号を切り出すためのパワー信号として使用
される。そしてこのフィルタの出力は、整流回路13を
通過させられて音声切り出し回路15に入力される。こ
こで音声切り出し回路15に入力された音声入力信号の
パワーが閾値レジスタ16にセットされた閾値と比較さ
れて、当該閾値を越えないか監視されている(Plが閾
値(第3図))。この閾値P1は、この音声入出力装置
が起動した時点では第3図に示した如く充分高目に設定
しであるので、通常の大きざの発声に伴なう音声信号で
はこの閾値P1を越えることができない。また外部で発
生する衝撃音に起因する音声信号もこの閾値P1を越え
られないので、不必要に認識処理が行なわれることがな
い。
このようなことから作業者は、作業の状態からみて音声
入力開始の必要性が生じた場合に、マイクロホン1を介
しての音声入出力装置に対する第1声を充分大きな声量
で発声する必要がある(例えば「開始」等の単語)。こ
の音声信号はパワーレベルが閾値P1を越えるので音声
の切り出しが可能となる(第5図)。即ち、音声パワー
レベルが閾値レジスタ16に設定された閾値を越えると
音声切り出し回路15が動作を始める。そして音声入力
信号のレベルがこの閾値P1を越える時点(8点(第5
図))から下がる時点(b点く第5図))に至るまでの
間、整流回路13を通過してきたバンドパスフィルタ1
2の出力データはバッフ7メモリ14に逐次に格納され
ていく。次いでバッフ7メモリ14に格納されたデータ
はりサンプリング回路17でもって時間軸方向に等分さ
れ、その等分した点のデータが抽出される。このリサン
プリングが行なわれることにより周波数軸(バンドパス
フィルタの出力データ)と時間軸に分割された2次元の
マトリックスが形成される。
一方、辞書メモリ19には予め認識すべき語いを集めた
辞書が格納されている。この辞書に格納されている辞書
の形態は本発明の音声入出力装置の認識方式に依存して
いる。そして、リサンプリング回路17を通ったりサン
プリングデータは辞書メモリ19に格納された辞書パタ
ーンを使用して類似度演算部20でもって認識計算が行
なわれる。この類似度演算の方法は特定話者単語認識の
場合にはDPマツチング法、不特定話者単語認識の場合
には複合類似度法などが代表的な方式である。いずれの
認識方式においても最終的に類似度が高い単語から順番
に音声認識結果として出力される。
そして、この認識結果はホスト計算機9に送られる。ホ
スト計算機9はこの認識結果に基づく文章情報を音声応
答装置10に送出する。この文章情報に基づいて音声応
答装置10はこれに相当する文章を音声信号として出力
する。この音声信号は固定局7から作業者の携帯するハ
ンドセット3に向けて送信される。この音声信号はイヤ
ホン2から出力され、作業者はこれを音声として聴くこ
とができる。
次いでホスト計算機9は音声認識装置10に対して大き
な声量で発声した後の次の音声を取り入れるために起動
コマンドを送出する。そして閾値レジスタ16に新たな
閾値をセットする。この時点で閾値レジスタ16に設定
される閾値は、前記の閾値P1より低い値の閾値P2(
第4図〉にしておく。
この時点から作業者は通常の声はで音声を入力すること
ができ、音声の始端と終端を検出することができる(a
点およびb点(第4図))。
これ以降は閾値P2(第4図)を越える音声信号につい
て音声認識を行なう。そして音声応答装置10は音声認
識結果に対して適応な音声を合成して出力する。このよ
うにして一連のシーケンスが実行される。そしてこのシ
ーケンスが終了するとホスト計算機9は閾値レジスタ1
6に閾値P1を設定し、かつ、音声認識装置21を起動
してイニシャライズ状態に戻す。
即ち、音声認識及び音声応答を行なう一連のシーケンス
においては、シーケンス開始当初の音声切り出しのため
には閾値を大きめに設定し、それ以降のシーケンス中途
では閾値を低くめに設定し、そしてシーケンスが終了し
た際には当該閾値を再度大きめに設定するようにしてい
る。
本実施例によれば、作業者が第一声の声量を大きく発声
することにより一連のシーケンスに入ることができるの
で、従来のようにハンドセットにマイクロホンへの入力
音声を0N10FFするスイッチが不必要となり、完全
に手が自由になる。
[発明の効果] 以上、上記した如く本発明の音声入出力装置によれば、
騒音の高い場所であっても音声入力開始時に一度大きな
声で発声することの不便を除いては、ハンドセット等に
手を触れずとも普通に発声するだけで音声認識及び音声
合成がされて、−連の作業工程での使用に資することが
できるという効果を秦する。
【図面の簡単な説明】
第1図は本発明の音声入出力装置の一実施例を示すブロ
ック図、第2図は第1図の音声入出力装置に含まれる音
声認識装置のブロック図、第3図は閾値が高めに設定さ
れている場合の音声信号のパワーを示した波形図、第4
図は閾値が低めに設定されている場合の音声信号のパワ
ーを示した波形図、第5図は閾値が低めに設定されてい
る場合において当該閾値以上のパワーを有する音声信号
のパワーを示した波形図、第6図は従来における音声入
出力装置のブロック図である。 7・・・固定局(送受信手段) 9・・・ホスト計算機(計算機) 10・・・音声応答装置(音声応答手段)21・・・音
声認識装@(音声応答手段)代理人 弁理士  則 近
 憲 佑 同  山王 − 第4図  jul 第5図

Claims (1)

    【特許請求の範囲】
  1. 音声信号を音声認識し、この認識結果から文章を組み上
    げて音声合成し、この合成された音声信号を出力する音
    声入出力装置において、音源からの音声信号を受信し、
    外部には合成された音声信号を送信する送受信手段と、
    音声を取り出すための閾値より高いレベルにある前記音
    声信号について音声認識を行う音声認識手段と、この音
    声認識の結果に基づく音声情報を送出すると共に所定の
    シーケンスに従ってこの閾値を変化させる計算機と、こ
    の音声情報に基づいて音声を合成してその合成された音
    声信号を前記送受信手段に送り出す音声応答手段とを具
    備して成ることを特徴とする音声入出力装置。
JP63015903A 1988-01-28 1988-01-28 音声入出力装置 Pending JPH01191899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63015903A JPH01191899A (ja) 1988-01-28 1988-01-28 音声入出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63015903A JPH01191899A (ja) 1988-01-28 1988-01-28 音声入出力装置

Publications (1)

Publication Number Publication Date
JPH01191899A true JPH01191899A (ja) 1989-08-01

Family

ID=11901734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63015903A Pending JPH01191899A (ja) 1988-01-28 1988-01-28 音声入出力装置

Country Status (1)

Country Link
JP (1) JPH01191899A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006136385A (ja) * 2004-11-10 2006-06-01 Pentax Corp 内視鏡

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006136385A (ja) * 2004-11-10 2006-06-01 Pentax Corp 内視鏡

Similar Documents

Publication Publication Date Title
EP2587481B1 (en) Controlling an apparatus based on speech
JP2003202888A (ja) 無線通信機能付きヘッドセットおよびこれを用いた音声処理システム
CN111432303B (zh) 单耳耳机、智能电子设备、方法和计算机可读介质
CN111464918B (zh) 耳机及耳机组
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
EP2482566A1 (en) Method for generating an audio signal
US20040024586A1 (en) Methods and apparatuses for capturing and wirelessly relaying voice information for speech recognition
WO2003107327A1 (en) Controlling an apparatus based on speech
JPH01191899A (ja) 音声入出力装置
CN103295571A (zh) 使用时间和/或频谱压缩的音频命令的控制
JP2007267331A (ja) 発話音声収集用コンビネーション・マイクロフォンシステム
JP2019110447A (ja) 電子機器、電子機器の制御方法、及び、電子機器の制御プログラム
CN113261305A (zh) 耳机、声学信号处理方法和程序
JPH10228367A (ja) データ伝送端末
JP2000125397A (ja) 話者識別型ディジタル補聴器
CN109243452A (zh) 一种用于声音控制的方法及系统
JPS60203991A (ja) 音声入力方式
JP2007336395A (ja) 音声処理装置及び音声通信システム
JPH0424694A (ja) 音声入力回路
JPH04156600A (ja) 音声認識装置
JPH0352635B2 (ja)
JPH04105735U (ja) ラジオ受信装置
JPS59151235A (ja) マイクロホン装置
JPH03112225A (ja) 音声伝送装置
JPH06110487A (ja) ハンドセット型音声入力装置