JPH0566793A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPH0566793A
JPH0566793A JP3227796A JP22779691A JPH0566793A JP H0566793 A JPH0566793 A JP H0566793A JP 3227796 A JP3227796 A JP 3227796A JP 22779691 A JP22779691 A JP 22779691A JP H0566793 A JPH0566793 A JP H0566793A
Authority
JP
Japan
Prior art keywords
voice
control signal
input
external device
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3227796A
Other languages
English (en)
Inventor
Kazuo Fujimoto
和生 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3227796A priority Critical patent/JPH0566793A/ja
Publication of JPH0566793A publication Critical patent/JPH0566793A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 外部機器側の動作状態を知って、外部機器側
で、高速な音声信号処理を実行するために必要な制御情
報と音声信号を、タイミングよく伝送する手段を有する
音声入力装置を提供することにある。 【構成】 音声入力手段2と、音声入力利得を調節し発
声区間を検出する音声レベル検出手段4と、入力音声を
外部機器に伝送する音声信号伝送手段5と、外部機器か
らの応答信号を受け付ける制御信号受信手段7と、外部
機器側の動作モードを受けて次の動作モードを決定する
動作モード制御手段8と、発声区間検出時に、動作モー
ドに従って特定の制御信号を外部機器に伝送する制御信
号伝送手段6と、発声区間検出時に伝送する音声信号を
特定の時間遅らせる時間おくれ設定手段3を有すること
によって、制御信号受信手段7が、外部機器側の動作状
態を受け付け、適正な音声信号処理が行われるように、
時間おくれを設定する手段を有することで、高速な音声
信号処理に適した各種信号をタイミングよく伝送する装
置を構成できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声による入力を受け
付けた時に、入力された音声信号を、入力部と離れた場
所に伝送する手段を有する音声入力装置に関するもので
ある。
【0002】
【従来の技術】近年、音声入力装置は、ワイヤレスマイ
クや、コードレス電話のように、入力部に受け付けられ
た音声信号を各種の変調方式を用いて変調し、電波等を
用いて相手側の外部機器に音声信号を伝送する形態をと
っている。
【0003】以下に従来の音声入力装置について説明す
る。図5は従来の音声入力装置を示すものである。図5
において、51はここで説明する音声入力装置である。
52は音声入力手段で、発声された音声を取り込む。5
3は音声レベル検出手段で、音声入力利得を調整し、音
声信号処理を行う時に適正な音声信号とするために、音
声レベルを検出,調整する手段である。54は制御信号
生成手段で、外部機器側に音声入力装置51の動作状態
を伝達するための信号を生成するものである。55は音
声信号伝送手段で、制御信号生成手段54で生成された
信号と入力された音声信号を変調し、伝送するものであ
る。
【0004】以上のように構成された音声入力装置51
について、以下その動作について説明する。説明を具体
化するために、音声入力装置51として、ワイヤレスマ
イクを想定する。まずワイヤレスマイクのスイッチを入
れることによって、音声入力可能な状態になる。次にワ
イヤレスマイクの入力部に向かってある単語や、言葉を
発声する。音声入力手段52は、この入力を受け付け
る。そして音声レベル検出手段53では、音声の入力レ
ベルを検出するために、設定された域値を持ち、必要に
応じて雑音成分と思われる信号成分を削除する。また伝
送周波数の帯域で送出可能な成分に入力音声を制限す
る。そして音声信号伝送手段55が、規定された変調方
式を用いて入力音声を変調し、ある特定な周波数帯域を
もつ電波によって伝送される。
【0005】外部機器側には、ある特定な周波数帯域を
もつ信号を受信可能な装置があり、伝送された音声信号
が復調されて、音声信号がスピーカ等から再生される。
この音声入力装置51から得られる音声信号から、再生
された音声を発声者が聞くことによって、発声量の大き
さを判定し、声の大小を変化させたり、ワイヤレスマイ
クが持つ入力レベルを変更する手段を用いて、音声レベ
ル検出手段53の域値等を変更し、スピーカから適切な
音声出力が得られるように調整している。
【0006】また外部機器側が、音声信号を情報源にし
て、何かの別の制御に用いたい時には、制御信号生成手
段54が、該当信号を生成し、音声信号の中に別の特定
の制御情報を併せて送信する。外部機器側でこれらを分
離し、音声と制御情報を用いて音声だけでは伝達できな
い情報、あるいは音声情報をさらに意味づける情報とし
て扱うことによって、付加価値の高い情報を伝送する音
声入力装置51として使用されている。
【0007】
【発明が解決しようとする課題】しかしながら従来の構
成では、外部機器側は、音声信号と制御信号を同時に受
けるため、制御信号の中に複雑な情報を入れても、外部
機器側でこの情報に応じた処理を行われなければ、音声
信号処理が始められない問題があった。
【0008】また音声入力装置側から、外部機器側への
一方向伝送であったので、外部機器側が、入力受付不可
能な状態であっても、それを知らせる手段がないという
問題点を有していた。
【0009】本発明は上記従来の問題点を解決するもの
で、外部機器側の動作状態を知る手段を有すると共に、
外部機器側で複雑な音声信号処理を実行するに十分な時
間をとって、音声信号を伝送するための手段を有する音
声入力装置を提供することを目的とする。
【0010】
【課題を解決するための手段】この目的を達成するため
に本発明は、音声入力を受け付ける音声入力手段と、こ
の音声入力手段からの音声入力の利得を調節し発声区間
を検出する音声レベル検出手段と、入力音声を外部機器
に伝送する音声信号伝送手段と、外部機器からの応答信
号を受け付ける制御信号受信手段と、外部機器側の動作
モードを受けて次の動作モードを決定する動作モード制
御手段と、前記発声区間検出時に動作モードに従って特
定の制御信号を外部機器に伝送する制御信号伝送手段
と、前記発声区間検出時に伝送する音声信号を特定の時
間遅らせる時間おくれ設定手段とを有している。
【0011】
【作用】この構成によって、制御信号受信手段が、外部
機器側の動作状態を受け付け、適正な音声信号処理が行
われるように、時間おくれを設定する手段を有すること
で、高速な音声信号処理の伝送に適した音声入力装置を
提供することができる。
【0012】
【実施例】
(実施例1)以下本発明の第1の実施例について、図面
を参照しながら説明する。図1は、本発明の第1の実施
例における音声入力装置を示すものである。図1におい
て、1は本発明による音声入力装置、2は音声入力を受
け付ける音声入力手段、3は音声信号を一定時間遅らせ
て伝送するための時間おくれを設定する時間おくれ設定
手段である。4は音声入力利得を調節し発声区間を検出
する音声レベル検出手段、5は入力音声を外部機器側
(図示せず)に伝送する音声信号伝送手段である。7は
外部機器からの応答信号を受け付ける制御信号受信手段
である。6は音声レベル検出手段4により、発声の開始
が確認された後に、この音声信号処理を行うときに必要
な制御情報を生成し、伝送する制御信号伝送手段であ
る。8は受信した制御信号の結果を判定し、次の動作モ
ードを決定する動作モード制御手段である。
【0013】以上のように構成された音声入力装置1に
ついて、図2を用いてその動作を説明する。まず音声入
力利得は初期値あるいは以前に設定された適当な値にな
っていると仮定する。利用者が音声入力装置1に対して
音声入力を開始すると、音声レベル検出手段4により、
ある域値以上の音声レベルが検出され、発声の開始が確
認される。発声期間中は、時間おくれ設定手段3で設定
された時間の遅延後、音声信号を外部機器に伝送可能な
信号に変調(例えばFM変調等)し、ある特定の周波数
帯域を持つ信号が伝送される。この伝送には、電波ある
いは、赤外線等の光を使用する。
【0014】発声の開始を確認した後で、音声レベル検
出手段4により、入力がある域値以下のレベルになった
時に発声の終了を知ることができる。
【0015】また制御信号伝送手段6は発声の開始とと
もに、現在の動作モードに従って、制御信号を生成し、
制御信号を伝送する。この制御信号伝送期間は、発声区
間全部または、発声の開始からある一定の時間(情報を
伝送し終わるまで)とする。
【0016】この実施例では、音声信号と制御信号を別
々の信号として伝送する例について説明したが、この両
者を合わせた信号伝送手段を設ける構成としても良い。
【0017】一方、制御信号受信手段7は外部機器から
の制御情報を待ち合わせている。制御情報受信手段7が
制御情報を受信したときは、受信した制御情報を動作モ
ード制御手段8に送る。動作モード制御手段8は、送ら
れてきた制御情報を判別し、その内容に応じた制御を行
い、次の動作モードを決定する。
【0018】外部機器から送られる制御情報としては、
次の内容を含む。外部機器側で受信された信号レベル、
外部機器側の動作状態、音声入力受付可能または不可能
の状態、音声信号伝送形態変更の指示、例えば音声信号
のサンプリング周波数変更の指示、量子化レベル値の変
更の指示、時間おくれ設定時間の変更等がある。
【0019】音声入力利得を変化させるために、以下の
動作が行われる。音声入力レベルの大小を、その調整レ
ベル差を外部機器側で判断しその内容を音声入力装置1
に送信する。制御信号受信手段7を経由して、動作モー
ド制御手段8がその内容を受け、音声レベル検出手段4
の入力利得を変更する。入力音声の域値を変更するとき
も、上記の場合と同様で、外部機器側の音声信号処理に
都合の良い音声レベルを得るため域値を変更する信号を
外部機器側から出力する。
【0020】以上のように本実施例によれば、外部機器
側で扱う音声信号を用いて制御を行う場合、例えば音声
認識手段を介す場合には、発声された音声信号と、現在
送信している音声信号に対する付加制御情報を伝送する
時に、制御信号と音声信号の時間差があるので、音声信
号処理を開始するのに必要な前処理等の処理を行うこと
ができ、また外部機器側の制御情報を、音声入力装置側
に伝送する手段を有しているので、認識しやすい音声信
号をタイミングよく送出するために有効な手段になる。
【0021】(実施例2)以下本発明の第2の実施例に
ついて、図面を参照しながら説明する。図3は、本発明
の第2の実施例における音声入力装置を示すものであ
る。図3において、1は第1の実施例と同等の音声入力
装置、21は外部機器、22は信号入力手段で、音声入
力装置1から入力される音声信号と制御信号を分ける。
23は音声信号入力手段、24は制御信号入力手段、2
5は音声認識手段、26は音声データベース、27は制
御信号決定手段、28は制御信号出力手段である。
【0022】外部機器21は、伝送された音声信号を信
号入力手段22を経由して、音声信号と制御信号に分離
し、音声認識手段25に取り込む。音声認識手段25
は、入力された音声信号と制御信号を元に、音声データ
ベース26を参照しながら音声認識を行う。制御信号の
情報には、音声データベース26を検索するキーワード
を含む。例えば音声データベース26を図4のように構
成すると、キーワードは群番号となる。キーワードに第
1群が設定されている場合は、機器名に関する音声情報
であることがわかる。そこで音声認識手段25は、そこ
に登録されている音声情報と、入力された音声情報を比
べることによって音声認識を行う。
【0023】音声データベース26には、例えば第1群
の1番目のテレビに該当する音声情報が音声特徴パラメ
ータとともに、音声信号処理を施した音声認識実行時に
マッチングしやすい情報として納められている。これら
の音声は、外部機器21内または外部機器21に接続さ
れた別の機器の操作を指定するために用いられる。従っ
てテープ装置の走行制御や、時計の時刻設定等、音声に
よる入力を音声認識することで、外部機器21側の対象
機器を制御することができる。このように音声データを
分類し、キーワードとして検索できるようにし、その中
で音声認識する語彙を限定することで、認識速度を速め
ることができる。
【0024】音声入力装置1側から送信する制御情報と
しては、上記のキーワードの他に、現在の時間おくれ設
定時間,音声入力利得等の音声入力装置1内の各制御パ
ラメータ値,音声入力手段2から入力された周囲雑音レ
ベル、音声入力装置1のID番号(複数の音声入力装置
1がある場合)等がある。
【0025】また音声認識を行って、対象の機器を制御
する場合、時間おくれ設定手段3で設定し、伝送を遅延
する時間としては、数マイクロ秒から、無限大(外部機
器側から受付可能の信号が受信されるまで)の機能があ
ることが望ましいが、長い時間の音声情報を記憶する手
段を持つことがむずかしい場合には、音声入力受付不可
能を示す表示装置等を設け、利用者に発声を少し持って
もらう構成にしても良い。このような場合、遅延時間の
最高は数秒程度とする。利用者が発生終了後、対象機器
が所望の動作を開始し、その動作を確認するまでの待ち
時間は、最高でも数秒程度が限度であり、あまり利用者
を待たすような装置は使いやすいと思われない。よって
遅延時間の最高は数秒程度とする。しかし音声認識以外
の用途ではこの限りではない。
【0026】音声認識手段25は、必ずしも確実に認識
できるとは限らない。発声内容のまちがいや、発声が途
中で途切れた場合、入力レベルが音声認識するために小
さすぎる(発声は確認されたが認識するには小さすぎ
る)場合,大きすぎる場合、また発声が長すぎる場合
や、認識可能な語彙以外の発声を受け付けた場合は、そ
の旨を音声入力装置1側に、通知する手段をもつ必要が
ある。
【0027】入力が小さすぎる場合は、制御信号決定手
段27から、音声入力利得を変更する制御信号を発する
構成とする。入力が大きすぎる場合も同様である。
【0028】さらに、音声入力装置1内に出力手段(図
示せず)を設け、音声認識可能な語彙を表示するように
構成することもできる。利用者に発声語彙を、指示する
ためには、制御信号決定手段27で、音声認識可能な語
彙情報を作成し、制御信号出力手段28から出力し、出
力手段に表示する構成をとる。外部機器21側で複雑な
動作を行わせる場合には、この手段が有効である。
【0029】例えば、外部機器がAV機器群に接続され
ている場合、テレビや、ビデオ、各種オーディオ機器
や、エアコン等が1つの音声入力装置1で制御可能にな
る。今までは各装置に1対1に対応したリモコンで操作
していたが、これらを統合できる。音声入力では、まず
該当機器の名前を発声すると、対象機器で設定可能(音
声認識可能な)な語彙を表示する。発声内容によって、
さらに詳細な設定が必要な場合は、その内容を表示す
る。このようにモード遷移を伴った複数の機器を音声に
よって制御することが可能となる。このモード遷移情報
をキーワードとし、これを制御情報として伝送する形態
をとる。また、対象機器の動作状態を制御信号に含めて
伝送することで、音声入力装置1側でその情報を得るこ
とができる。対象機器の動作状態を知ることができるだ
けでなく、故障情報等も知るように構成することも可能
である。
【0030】外部機器21側で音声認識を行うために
は、音声認識を行うに十分な音声信号が存在すれば良
い。例えば音声認識を行うに必要な音声情報量として、
音声を8kHzまたは10kHz等のサンプリング周波数で
サンプリングし、量子化を8ビットから12ビット程度
で行うため、予め音声信号伝送手段5が、入力された音
声をデジタル信号処理し、音声認識を行うに必要な信号
成分のみを伝送するように構成することができる。音声
信号を信号圧縮することにより、信号伝送量を少なくす
ることができる。
【0031】
【発明の効果】以上のように本発明は、音声入力利得を
調節し発声区間を検出する音声レベル検出手段と、入力
音声を伝送する音声信号伝送手段と、動作モードを含む
制御情報を伝送する制御信号伝送手段と、外部機器から
の応答信号を受け付ける制御信号受信手段と、受信した
制御信号の結果を判定する動作モード制御手段を設ける
ことにより、外部機器側で、高速に音声信号処理を行う
ために適した信号をタイミングよく伝送することのでき
る優れた音声入力装置を実現するものである。
【図面の簡単な説明】
【図1】本発明の第1の実施例における音声入力装置の
構成図
【図2】同音声入力装置の動作説明のためのフローチャ
ート
【図3】本発明の第2の実施例における外部機器と組み
合わせた音声入力装置の構成図
【図4】本発明の第2の実施例における音声データベー
スの構成図
【図5】従来の音声入力装置の構成図
【符号の説明】
1 音声入力装置 2 音声入力手段 3 時間おくれ設定手段 4 音声レベル検出手段 5 音声信号伝送手段 6 制御信号伝送手段 7 制御信号受信手段 8 動作モード制御手段 21 外部機器 22 信号入力手段 23 音声信号入力手段 24 制御信号入力手段 25 音声認識手段 26 音声データベース 27 制御信号決定手段 28 制御信号出力手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 H04M 11/00 301 7117−5K

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】音声入力を受け付ける音声入力手段と、こ
    の音声入力手段からの音声入力の利得を調節し発声区間
    を検出する音声レベル検出手段と、入力音声を外部機器
    に伝送する音声信号伝送手段と、外部機器からの応答信
    号を受け付ける制御信号受信手段と、外部機器側の動作
    モードを受けて次の動作モードを決定する動作モード制
    御手段と、前記音声区間検出時に動作モードに従って特
    定の制御信号を外部機器に伝送する制御信号伝送手段
    と、前記音声区間検出時に伝送する音声信号を特定の時
    間遅らせる時間おくれ設定手段とを備えたことを特徴と
    する音声入力装置。
  2. 【請求項2】外部機器内に、音声信号伝送手段と制御信
    号伝送手段から受信された音声信号と制御信号をもとに
    して音声認識する音声認識手段と、認識した結果にもと
    づいて外部機器の制御を行い制御結果を送信する制御信
    号伝送手段とを有し、外部機器の制御用の語彙を音声入
    力とすることを特徴とする請求項1記載の音声入力装
    置。
  3. 【請求項3】音声認識を行うために必要な制御信号に語
    彙選択情報を伝送する制御信号伝送手段を有することを
    特徴とする請求項2記載の音声入力装置。
JP3227796A 1991-09-09 1991-09-09 音声入力装置 Pending JPH0566793A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3227796A JPH0566793A (ja) 1991-09-09 1991-09-09 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3227796A JPH0566793A (ja) 1991-09-09 1991-09-09 音声入力装置

Publications (1)

Publication Number Publication Date
JPH0566793A true JPH0566793A (ja) 1993-03-19

Family

ID=16866527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3227796A Pending JPH0566793A (ja) 1991-09-09 1991-09-09 音声入力装置

Country Status (1)

Country Link
JP (1) JPH0566793A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08115096A (ja) * 1994-10-14 1996-05-07 Sanyo Electric Co Ltd 音声処理装置
JP2002182688A (ja) * 2000-12-18 2002-06-26 Seiko Epson Corp 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム
JP2002182679A (ja) * 2000-12-18 2002-06-26 Seiko Epson Corp 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体
WO2003001511A1 (en) * 2001-06-20 2003-01-03 Nec Corporation Server-client type speech recognition apparatus and method
JP2006350090A (ja) * 2005-06-17 2006-12-28 Nippon Telegr & Teleph Corp <Ntt> クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08115096A (ja) * 1994-10-14 1996-05-07 Sanyo Electric Co Ltd 音声処理装置
JP2002182688A (ja) * 2000-12-18 2002-06-26 Seiko Epson Corp 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム
JP2002182679A (ja) * 2000-12-18 2002-06-26 Seiko Epson Corp 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体
WO2003001511A1 (en) * 2001-06-20 2003-01-03 Nec Corporation Server-client type speech recognition apparatus and method
US7478046B2 (en) 2001-06-20 2009-01-13 Nec Corporation Server-client type speech recognition apparatus and method
JP2006350090A (ja) * 2005-06-17 2006-12-28 Nippon Telegr & Teleph Corp <Ntt> クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体
JP4603429B2 (ja) * 2005-06-17 2010-12-22 日本電信電話株式会社 クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
US4426733A (en) Voice-controlled operator-interacting radio transceiver
EP1278183B1 (en) Voice operated electronic appliance
WO2018173293A1 (ja) 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法
US7706553B2 (en) Auto-mute command stream by voice-activated remote control
WO2003049003A3 (en) Systems and methods for tv navigation with compressed voice-activated commands
EP1307875B1 (en) System for controlling an apparatus with speech commands
WO1997033419A3 (en) Method and apparatus for adaptive volume control for a radiotelephone
KR20020071966A (ko) 음향 출력 디바이스를 포함하는 유닛의 제어 방법
US20050259834A1 (en) Voice controlled system and method
US20030061033A1 (en) Remote control system for translating an utterance to a control parameter for use by an electronic device
JPH05160773A (ja) 音声通信装置
JPH0566793A (ja) 音声入力装置
US7020292B1 (en) Apparatuses and methods for recognizing an audio input and muting an audio device
JP2023501536A (ja) 人工知能型マルチメディア装置の制御方法及びシステム
JP2019184809A (ja) 音声認識装置、音声認識方法
JP2005192004A (ja) ヘッドセットおよびヘッドセットの音楽データの再生制御方法
JP2001275176A (ja) リモートコントロール装置
EP0676868B1 (en) Audio signal transmission apparatus
JPH11239067A (ja) 音声認識による選局装置及び方法並びに音声認識による選局用プログラムを記録した記録媒体
KR20160134769A (ko) 오디오 기기, 오디오 시스템, 및 볼륨값 제어 방법
JPH06233359A (ja) 制御装置
JPH04351094A (ja) リモートコントロール装置
JP4672152B2 (ja) 音声出力制御装置
US20190334495A1 (en) Sound adjustment method and system
JPS59195739A (ja) 音声応答装置