JP2003504752A - コンピュータ用のフットスイッチ - Google Patents

コンピュータ用のフットスイッチ

Info

Publication number
JP2003504752A
JP2003504752A JP2001510079A JP2001510079A JP2003504752A JP 2003504752 A JP2003504752 A JP 2003504752A JP 2001510079 A JP2001510079 A JP 2001510079A JP 2001510079 A JP2001510079 A JP 2001510079A JP 2003504752 A JP2003504752 A JP 2003504752A
Authority
JP
Japan
Prior art keywords
information
audio
text
computer
input unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001510079A
Other languages
English (en)
Inventor
マンフレッド ヘルンドル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003504752A publication Critical patent/JP2003504752A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Abstract

(57)【要約】 口述記録機を形成するコンピュータ(1)用の、足で操作することができる入力ユニット(3)において、制御情報(SI)を操作的に入力する足操作入力手段(24)を備え、該制御情報により当該口述記録機のオーディオ再生モードを活性化(25)又は非活性化(26)することができ、活性化されたオーディオ再生モードでは上記口述記録機に記憶されたオーディオ情報(AI)をアナログオーディオ信号(AS3)としてヘッドフォン(34)又はスピーカ(32)に供給することができ、当該入力ユニット(3)をコンピュータ(1)に接続する接続手段(28、33、35)を含み、該接続手段(28、33、35)を介して制御情報(SI)をコンピュータ(1)に伝送することができ、接続手段(28、33、35)はデジタルデータバスリンクを介してコンピュータ(1)からオーディオ情報(AI)をデジタルオーディオデータとして受信すると共にコンピュータ(1)へ制御情報(SI)を伝送するように構成され、ヘッドフォン(34)又は前記スピーカを接続手段(28、33、35)に接続することができる。

Description

【発明の詳細な説明】
【0001】
【技術分野】
本発明は、請求項1の導入部に記載されたような入力ユニットに関する。
【0002】
【背景技術】
請求項1の導入部に記載された斯様な足で操作される入力ユニットは、文献W
O97/34407から既知であり、フットスイッチの形態である。この既知の
フットスイッチは、制御情報を伝送するために該フットスイッチをコンピュータ
のゲームポートに接続することができるような接続手段を有している。該コンピ
ュータに更に接続することができるものは、マイクロフォンが接続される入力増
幅器、ヘッドフォンが接続される出力増幅器、キーボード及びモニタである。コ
ンピュータは、A/D変換器段、D/A変換器段及びオーディオ記憶手段を含ん
でいる。
【0003】 上記コンピュータを用いてアプリケーションプログラムを実行することができ
、該アプリケーションプログラムにおいて、当該コンピュータが口述記録機を形
成するように口述記録モードを活性化することができる。活性化された口述記録
モードにおいては、ユーザによりマイクロフォンに対して発せられる口述の音声
通信が、上記入力増幅器によりアナログオーディオ信号として増幅され、上記A
/D変換器段により処理され、当該コンピュータの上記オーディオ記憶手段にデ
ジタルオーディオ信号として記憶される。
【0004】 上記アプリケーションプログラムの間に、更にオーディオ再生モードを活性化
することができ、該モードにおいては上記オーディオ記憶手段に記憶されたデジ
タルオーディオ情報がD/A変換器段により処理されると共に、出力増幅器によ
り増幅されたアナログオーディオ信号としてヘッドフォンに送出される。秘書は
、該ヘッドフォンにより再生された音声情報を聞き取ると共に当該コンピュータ
のキーボードを用いて対応するテキスト情報を書き込み、その後該テキスト情報
はモニタ上に表示される。
【0005】 前記フットスイッチは、足入力手段を形成する足で操作されるスイッチを有し
ている。足により上記スイッチを作動させることにより、秘書は制御信号を発生
させることができ、該制御信号は前記ゲームポートを介して当該コンピュータに
伝送されると共に、上記オーディオ再生モードを活性化又は非活性化させ、これ
によりキーボードを用いた書き込みのために手を自由にさせる。
【0006】 コンピュータ用の上記既知の足操作入力ユニットは、オーディオ記憶手段に記
憶されたオーディオ情報の再生ために、ヘッドフォンを別個のケーブルによりコ
ンピュータに接続しなければならず、これはコンピュータとの多くの接続の可能
性があるためにユーザにとり簡単ではないという問題があることが分かった。
【0007】 前述した入力増幅器及び出力増幅器は、しばしば、コンピュータ内のサウンド
カード上に設けられ、斯かるサウンドカードは、通常、マイクロフォン用の単一
の入力接続部とヘッドフォン又はスピーカ用の単一の出力接続部としか有してい
ない。この場合の問題点は、コンピュータが、3つの接続部を備えるサウンドカ
ードと空きのゲームポート接続部との両方が利用可能である場合にしか口述記録
機として使用することができないということである。
【0008】 更に、コンピュータのゲームポートを介しての制御信号の伝送は、余り高信頼
度では機能せず、時にはアプリケーションプログラムの望まないモードが活性化
されてしまう点で問題があることが分かった。
【0009】
【発明の開示】
本発明の目的は、足により操作することができる入力ユニットであって、既知
の入力ユニットの問題が発生しないような入力ユニットを提供することにある。
この目的は、請求項1の導入部に記載されるような足操作入力ユニットにおいて
、請求項1の特徴部の対策により達成される。
【0010】 請求項1に記載された対策によれば、デジタルデータバスリンクを確立する接
続手段を有するスピーカ又はヘッドフォンを当該入力ユニットに直接接続するこ
とができる。上記ヘッドフォンの又はスピーカの接続手段を介して入力されるデ
ジタルオーディオデータは、該ヘッドフォン又はスピーカの処理手段により処理
されると共に音響的に再生することができる。
【0011】 口述を聴くための上記ヘッドフォン又はスピーカの入力ユニットへの直接接続
は、ヘッドフォン又はスピーカの接続ケーブルの設置が簡単になるという利点と
、コンピュータのサウンドカードの及びゲートポートの出力接続部が他のアプリ
ケーションのために空きとなるという利点の両方を提供する。更に、コンピュー
タは口述記録機としてオーディオ再生モードで動作するようなサウンドカードを
有する必要がなくなる。
【0012】 オーディオ情報及び制御情報が上記デジタルデータバスリンクを介して伝送さ
れる場合、エラー訂正コードも同時に伝送され、これにより、ケーブル接続又は
プラグインコネクタが劣化した場合においてさえも、伝送の間にオーディオ情報
の又は制御情報の品質の損失がないという利点がある。
【0013】 請求項2に記載された対策によれば、前記オーディオ記憶手段にデジタルオー
ディオデータとして記憶された口述の音声情報のアナログオーディオ信号を当該
入力ユニットの接続手段から通常のアナログヘッドフォン又はアナログスピーカ
に直接供給することができるという利点が得られる。
【0014】 請求項3に記載の対策によれば、USBデータリンクを介して電源電圧及び十
分な電源電流も伝送することができ、これが当該入力ユニットのオーディオ処理
手段に電力を供給するのに適しているという利点が得られる。更に、既に多くの
コンピュータがUSB接続を伴う接続手段を含んでおり、結果として当該入力ユ
ニットは多くのコンピュータに接続することができる。
【0015】 請求項4に記載の対策によれば、前記オーディオ記憶手段に記憶されたオーデ
ィオ情報を当該入力ユニットに組み込まれたスピーカにアナログオーディオ信号
として直接供給することができ、従って、それ以上の接続ケーブルが必要ではな
いという利点が得られる。
【0016】 請求項5及び6に記載された対策によれば、制御信号及びオーディオ情報を伝
送するために何のケーブルリンクも必要ではないという利点が得られる。
【0017】 本発明の、これら及び他の特徴は、以下に述べる実施例から明らかとなるであ
ろうし、斯かる実施例を参照して説明される。
【0018】
【発明を実施するための最良の形態】
図1はコンピュータ1を示し、該コンピュータにより音声認識方法に従う音声
認識プログラムが実行され、該コンピュータ1は二次的音声認識装置を備える口
述記録機を形成する。
【0019】 該コンピュータ1は、手に保持することが可能な入力ユニットを形成する口述
マイクロフォン2と、足により作動することが可能な入力ユニットを形成するフ
ットスイッチ3と、モニタ4と、キーボード5とを有している。図2は、上記口
述マイクロフォンをブロック図の形で更に詳細に示している。
【0020】 口述マイクロフォン2はマイクロフォン6を有し、該マイクロフォンはオーデ
ィオ入力手段を形成すると共に、ユーザにより該マイクロフォン6に発せられる
音声通信を入力し、且つ、第1アナログオーディオ信号AS1を送出するために
設けられている。口述マイクロフォン2は、更に、オーディオ処理手段7を含み
、該手段は上記第1アナログオーディオ信号AS1を処理すると共にデジタルオ
ーディオデータをオーディオ情報AIとして送出するために設けられている。
【0021】 オーディオ処理手段7は、第1増幅器段8と、アナログ/デジタル変換器段A
/D9と、第2増幅器段10と、デジタル/アナログ変換器段D/A11とを含
んでいる。第1アナログオーディオ信号AS1は第1増幅器段8に供給すること
ができ、増幅された第1アナログオーディオ信号はアナログ/デジタル変換器段
A/D9に供給することができる。アナログ/デジタル変換器段A/D9は、増
幅されたアナログオーディオ信号を16kHzなるサンプリングレートでサンプ
ルすると共にサンプルされた値をデジタルオーディオデータとして送出するため
に設けられ、該デジタルオーディオデータは16ビットのデータブロックを有す
ると共にオーディオ情報AIとしてUSB接続手段12に送出することができる
【0022】 これにより、第1アナログオーディオ信号AIが当該口述マイクロフォン内で
デジタル化され、増幅器段8は当該口述マイクロフォン2の製造の早い段階でマ
イクロフォン6の最大出力電圧に調整することができるという利点が提供される
。このようにして、増幅器段8が過度変調されることにより音声情報が失われる
ことがなく、従ってデジタルオーディオデータを含むデジタルオーディオ情報A
Iは良好な品質を有することになる。
【0023】 デジタルオーディオデータを含むオーディオ情報AIは、USB接続手段12
により、当該オーディオ処理手段7のデジタル/アナログ変換器D/A11に供
給することができる。上記デジタルオーディオデータに対応するアナログオーデ
ィオ信号は、デジタル/アナログ変換器段D/A11により、第2増幅器段10
に供給することができる。該第2増幅器段10により送出される第2アナログオ
ーディオ信号AS2は、音響的に再生されるようにスピーカ13に供給すること
ができる。
【0024】 口述マイクロフォン2は、更に、制御情報SIを手により入力するための入力
手段14を含み、該入力手段はキーボード15と、トラックボール16と、入力
処理手段17とを含んでいる。キーボード15は、とりわけ、記録キー18と、
停止キー19と、高速順方向送り釦20と、高速逆方向送り釦21とを有してい
る。キーボード15は、入力処理手段17にキー情報TSIを供給することがで
きる。
【0025】 トラックボール16は当該口述マイクロフォン2の開口に埋め込まれたボール
により形成され、該ボールは、例えばモニタ4上に表示されるカーソルを位置決
めするためにユーザにより回転することができる。該トラックボール16を用い
ることにより、トラックボール情報TBIを入力処理手段17に供給することが
可能となる。入力処理手段17は、該手段に供給されるキー情報TSI及びトラ
ックボール情報TBIを処理すると共に、各制御情報SIをUSB接続手段12
に供給するために設けられている。
【0026】 USB接続手段12は、オーディオ処理手段7と入力手段14との両方に電源
電圧Uを供給し、該オーディオ処理手段7及び入力手段14に含まれる各段に電
圧を供給することができる。これにより、当該口述マイクロフォン2が単一のケ
ーブルリンクのみを介して口述マイクロフォン2の各段の情報及び電源電圧Uの
両方を入力するという利点が提供される。
【0027】 USB接続手段12は、口述マイクロフォン2の接続部22を介してコンピュ
ータ1のUSB接続手段23に接続される。口述マイクロフォン2のUSB接続
手段12は、コンピュータ1のUSB接続手段23に対して、デジタルデータバ
スリンクを確立し、更に有利にはUSBデータバスリンク(汎用直列バス:19
96年1月15日の仕様バージョン1.0及びバージョン2.0)を確立するよう
に構成されている。
【0028】 USBデータバスリンク上では、USB接続手段12又は23に伝送されるオ
ーディオ情報AIのオーディオデータ又は制御情報SIの制御データにエラー訂
正コードが付加され、これらはUSB接続手段23又は12に送信データUDと
してまとめて送信される。送信されたデータUDが受信されたUSB接続手段1
2又は23は、上記エラー訂正コードを評価すると共に、必要なら、送信の間に
発生した上記オーディオデータ又は制御データのエラーを訂正するようになって
いる。USBデータバスリンクにおいては、制御情報SIの制御データは毎秒1
.5MBなるデータ伝送レートで伝送され、オーディオ情報AIのオーディオデ
ータは毎秒12MBのデータ伝送レートで伝送される。
【0029】 図3は、図1に示すフットスイッチ3をブロック図の形で詳細に示している。
該フットスイッチ3は、足で制御情報SIを入力するための入力手段24を有し
ている。入力手段24は、オーディオ再生スイッチ25と、停止スイッチ26と
、入力処理手段27とを有している。オーディオ再生スイッチ25又は停止スイ
ッチ26により生成されたスイッチ情報SCIは、入力処理手段27に供給する
ことができる。入力処理手段27は、供給されたスイッチ情報SCIを処理する
と共に、各制御情報SIを当該フットスイッチ3のUSB接続手段28に供給す
るために設けられている。
【0030】 フットスイッチ3は、更に、デジタル/アナログ変換器段D/A30と第3増
幅器段31とを有するオーディオ処理手段29を含んでいる。オーディオデータ
を含むオーディオ情報AIはUSB接続手段28によりデジタル/アナログ変換
器段D/A30に供給することができ、該変換器段は上記オーディオデータに対
応するアナログオーディオ信号を第3増幅器段31に供給する。第3増幅器段3
1により送出される第3アナログオーディオ信号AS3は、当該フットスイッチ
3内に設けられたスピーカ32と当該フットスイッチの第1接続部33との両方
に供給することができる。該第1接続部33にはヘッドフォン34が接続される
。スピーカ32及びヘッドフォン34によれば、音声通信の音響的再生を行うこ
とができるが、これについては後に更に説明する。
【0031】 オーディオ処理手段29がフットスイッチ3内に取り付けられているので、ヘ
ッドフォン34又はスピーカをフットスイッチ3に直接接続することができると
いう利点が得られる。結果として、口述記録機をも形成するコンピュータ1はオ
ーディオ処理手段を備えるサウンドカードを有する必要がない。
【0032】 フットスイッチ3のUSB接続手段28は、前記USB接続手段12及び23
に相当する。USB接続手段28は、電源電圧Uを入力処理手段24とオーディ
オ処理手段29との両方に供給し、これら入力処理手段24及びオーディオ処理
手段29に含まれる各段を給電することができる。これは、フットスイッチ3が
単一のケーブルリンクのみを介して通信及び電源電圧Uを入力するという利点を
提供する。
【0033】 フットスイッチ3のUSB接続手段28は、該フットスイッチの第2接続部3
5を介してコンピュータ1のUSB接続手段23に接続される。コンピュータ1
は受信手段36を有し、該受信手段はUSB接続手段23及びオーディオ記憶手
段37を有すると共に話し手により発声された音声通信を受信するようになって
いる。口述マイクロフォン2のマイクロフォン6に話し手により発せられた音声
通信は、USB接続手段12からUSB接続手段23へデジタルオーディオデー
タにより構成されるオーディオ情報AIとして伝達されると共に、USB接続手
段23からオーディオ記憶手段37へオーディオ情報AIとして記憶されるべく
伝送することができる。口述マイクロフォン2のUSB接続手段12から又はフ
ットスイッチ3のUSB接続手段28からコンピュータ1のUSB接続手段23
へ供給される制御情報SIは、該USB接続手段23により受信されると共に、
コンピュータ1の他の手段に伝送されるが、これについては後述する。
【0034】 コンピュータ1により形成される音声認識装置は、音声係数指示子SKIを記
憶するために設けられた音声係数記憶手段38を含んでいる。音声係数識別子S
KIは、音声モデルデータSMIと、文脈情報WIと、音素基準情報PRIとを
含んでいる。
【0035】 文脈情報WIは、文脈記憶手段39に記憶され、当該音声認識装置により音声
通信内で認識される全ての語と、音声通信における語の発生頻度を示す語頻度メ
ータとを含んでいる。音声モデルデータSMIは、音声モデル記憶手段40に記
憶され、語列と、音声通信におけるこれら語列の発生の頻度を示す語列頻度メー
タとを含んでいる。音素基準情報PRIは、音素基準記憶手段41に記憶される
と共に、話し手の発音の特異性に対する当該音声認識装置の調整を可能にする。
【0036】 当該音声認識装置は、更に、音声認識手段42を含んでいる。USB接続手段
23は、制御情報SIを該音声認識手段42に供給し、音声認識モードを活性化
させて、音声認識方法を実施することができる。音声認識モードが活性化される
と、音声認識手段42は、オーディオ記憶手段37に記憶されたオーディオ情報
AIを読み出すと共に、音声係数記憶手段38に記憶された音声係数指示子SK
Iを読み出すようになっている。
【0037】 音声認識方法の実行の間、音声認識手段42はオーディオ情報AIと音声係数
指示子SKIとを評価するようになっている。次いで、音声認識手段42はオー
ディオ情報AIの各部分に関し、適切なオーディオ情報AIの各部分に対応する
複数の可能性のある語の列を決定し、これらの可能性のある語列を当該オーディ
オ情報AIの全ての部分に対して、可能性のあるテキスト情報PTIとして発生
する。これらの可能性のあるテキスト情報PTIは、例えば、当該オーディオ情
報AIに対して20個の可能性のある語列を含む。更に、音声認識方法が実行さ
れる間、音声認識手段42はオーディオ情報AIの各部分に対してその都度最も
ありそうな語列を決定し、当該オーディオ情報AIの全てに対してこれらの最も
ありそうな語列を、認識されたテキスト情報RTIとして発生する。
【0038】 当該音声認識装置は、テキスト情報を記憶するためのテキスト記憶手段43を
有している。該テキスト記憶手段43は、有可能性テキスト記憶手段44と、認
識テキスト記憶手段45と、訂正テキスト記憶手段46と、訓練テキスト記憶手
段47とを含んでいる。当該音声認識方法の実行の間に音声認識手段42により
発生された可能性のあるテキスト情報PTIは有可能性テキスト記憶手段44に
記憶することができ、認識されたテキスト情報RTIは認識テキスト記憶手段4
5に記憶することができる。
【0039】 コンピュータ1は、更に、例えばウィンドウズ(登録商標)95用のワードの ようなテキスト処理プログラムを実行するように構成されており、テキスト処理 手段48を形成する。当該音声認識方法の実行の間に音声認識手段42により発 生された認識テキスト情報RTIは、テキスト処理手段48に供給することがで きる。この場合、該テキスト処理手段48は、認識テキスト情報RTIを含む画 像情報PIをモニタ4に伝送するように構成されている。
【0040】 口述マイクロフォン2の入力手段14により制御情報SIが入力され得、該制
御情報は、音声認識手段42及びテキスト処理手段48に供給することができる
と共に、当該音声認識装置の訂正モードを活性化させる。ここでは、テキスト処
理手段48、モニタ4及びキーボード5が訂正手段49を構成する。訂正モード
が活性化されると、ユーザは、キーボード5により、認識されたテキスト情報R
TIを訂正すると共に、訂正されたテキスト情報CTIを訂正テキスト記憶手段
46に記憶させることができるが、これについては後述する。
【0041】 訓練テキスト記憶手段47には訓練テキスト情報TTIが記憶されるが、該情
報は或るドメイン(ビジネスレター;研究分野:放射線医学;研究分野:法律;
…)の句又は語列の典型的な語を含む。制御情報SIは口述マイクロフォン2の
入力手段14により入力することができ、該制御情報は音声認識手段42及びテ
キスト処理手段48に供給することができると共に、当該音声認識装置の初期訓
練モードを活性化する。
【0042】 上記初期訓練モードが活性化されると、テキスト処理手段48は訓練テキスト
記憶手段47から訓練テキスト情報TTIを読み出すと共に各画像情報PIをモ
ニタ4に供給するようになっている。この場合、ユーザはモニタ4上に表示され
た訓練テキストをマイクロフォン6に向かって発することにより、当該音声認識
装置を該ユーザの発音の型に調整することができる。
【0043】 当該音声認識装置は、音声係数記憶手段38に記憶された音声係数指示子SK
Iを当該ユーザの発音の型に並びに当該ユーザにより通常使用される語及び語列
に調整する調整手段50を有している。テキスト記憶手段43、訂正手段49及
び調整手段50は、一緒に訓練手段51を形成している。斯様な音声係数指示子
SKIの調整は、上記初期訓練モードが活性化される際に行われるが、該モード
においてはユーザにより読まれる訓練テキスト情報TTIは既知である。
【0044】 しかしながら、このような調整は調整モードにおいても行われ、該モードにお
いては音声情報に対応するテキスト情報が認識テキスト情報RTIとして認識さ
れると共に、ユーザにより、訂正されたテキスト情報CTIに訂正される。この
目的のため、訓練手段51はテキスト比較手段52を有し、該手段は認識された
テキスト情報RTIと訂正されたテキスト情報CTIとを比較すると共に少なく
とも一致指示子CIを決定するようになっている。該テキスト比較手段52にお
いては、調整モードがオンの場合に図4に示す調整テーブル53が確立されるが
、該テーブルについては後述する。
【0045】 調整情報NIとなる上記調整の結果は、調整手段50により音声係数記憶手段
38に伝送することができ、該調整情報は記憶された音声係数指示子SKIを調
整する。訓練手段51の調整手段50によっては訓練指示子TIを更に送出する
ことができ、該訓練指示子TIは音声係数記憶手段38に記憶された音声係数指
示子SKIの調整の程度を示す。訓練指示子TIは、どの様な頻度で及びどれだ
け多くの語において、音声係数記憶手段38に記憶された音声係数指示子SKI
がユーザに対して既に調整されたかについての情報を含む。ユーザに対して音声
係数指示子SKIが調整された頻度が高いほど、このユーザに対する当該音声認
識装置の認識率は良好になる。
【0046】 当該音声認識装置は転送手段54を含み、該転送手段は、音声係数指示子SK
Iをインポートすると共に該インポートされた音声係数指示子SKIを音声係数
記憶手段38に記憶し、及び/又は音声係数記憶手段38に記憶された音声係数
指示子SKIをエクスポートするのを可能にする。この目的のため、ユーザはキ
ーボード5により転送情報TRIを入力し、該情報を転送手段54に送ることが
できるが、これについては後述する。
【0047】 第1の応用例を参照して、口述マイクロフォン2、フットスイッチ3、並びに
上記コンピュータにより形成される口述記録機及び音声認識装置の機能を更に説
明する。この第1の応用例によれば、コンピュータ1のユーザは、彼の知人“ジ
ョン”に“高級”型のコンピュータ3台を注文するレターを口述したいと仮定す
る。この目的のため、該ユーザは口述マイクロフォン2の記録キー18に触って
、“Dear John I herewith order three Quality computers for my office Har
ry(ジョンさん、私の事務所ハリーのために3台の高級コンピュータを注文しま
す)”と口述する。この場合、この音声情報に対応するオーディオ情報AIが伝
送データUDとして口述マイクロフォン2からUSB接続手段23に送信され、
最終的にオーディオ記憶手段37に記憶される。この動作の間に、口述マイクロ
フォン2とコンピュータ1とは口述記録機を構成する。
【0048】 口述マイクロフォン2の記録キー18を作動させることにより、音声認識手段
42の音声認識モードを活性化する制御情報SIが、該口述マイクロフォン2に
よりUSB接続手段23を介して音声認識手段42に対し伝送データUDとして
供給される。音声認識手段42で活性化された音声認識モードにおいては、オー
ディオ記憶手段37に記憶されたオーディオ情報AIが読み出されると共に、音
声係数記憶手段38から読み出された音声係数識別子SKIと一緒に評価される
。この場合、音声認識手段42は複数の可能性のある語列を有可能性テキスト情
報PTIとして決定すると共に、これらを有可能性テキスト記憶手段44に記憶
する。当該オーディオ情報AIの最初の部分に対しては、可能性のあるテキスト
情報PTIは、例えば、“Hear John why”、“Dear John I”及び“Bear John
hi”なる語列を含む可能性がある。
【0049】 音声認識手段42は、“Dear John I herewith organ three Quality compute
rs for my office Mary”を最も可能性のあるテキスト情報として決定し、該テ
キスト情報を認識テキスト記憶手段45に認識されたテキスト情報RTIとして
送出する。発音された語“order”は誤って語“organ”として認識され、発音さ
れた語“Harry”は誤って語“Mary”として認識されている。
【0050】 次いで、音声認識手段42により認識され且つ認識テキスト記憶手段45に記
憶された認識テキスト情報RTIは、テキスト処理手段48により読み出され、
モニタ4上に表示される。ユーザは、発音された2つの語“order”及び“Harry
”が誤って認識されたことを理解し、該認識されたテキスト情報RTIを訂正し
ようとする。そのため、該ユーザは口述マイクロフォン2の入力手段14を用い
て当該音声認識装置の訂正モードを活性化する。
【0051】 訂正モードが活性化されると、ユーザは、フットスイッチ3のオーディオ再生
スイッチ25に接触することにより、オーディオ記憶手段37に記憶されたオー
ディオ情報AIをヘッドフォン又はスピーカ32により音響的に再生させ、その
際に該オーディオ情報AIから認識されたテキスト情報が上記の再生されるオー
ディオ情報AIと同期してモニタ4上に表示される。このような同期した編集又
は訂正は、長く知られているものである。
【0052】 認識されたテキスト情報RTIのユーザによる第1の型の訂正においては、ユ
ーザは誤って認識された語“organ”及び“Mary”のみを2つの本来発音された
語“order”及び“Harry”に訂正し、訂正されたテキスト情報CTIがテキスト
処理手段48において構築されて訂正テキスト記憶手段46に記憶される。該第
1訂正ステップの後に訂正テキスト記憶手段46に記憶された訂正されたテキス
ト情報CTIは、音声係数指示子SKIを調整するのに極めて適しているであろ
う。以降の口述においてユーザにより発音される語“order”及び“Harry”は、
次の音声認識動作においては以前に調整された音声係数指示子SKIを用いて正
しく認識されるであろう。
【0053】 実践が示すように、訂正モードが活性化された場合、ユーザは他の第2の型式
の訂正も行う。第1の応用例においては、ユーザが、“標準”型の3台のコンピ
ュータも注文したいことを思い出し、このために該ユーザは既に訂正されたテキ
スト情報CTIにキーボード5を用いて“and three Standard computers(及び
3台の標準コンピュータ)”なる語列を挿入する。更に、ユーザは上記の既に訂
正されたテキスト情報CTIの始点より前にテキストAをコピーするが、該テキ
ストAは当該レターの知人“John”宛の住所を含む。最後に、ユーザは訂正され
たテキスト情報CTIに対して、既に訂正された該テキスト情報CTIの後にテ
キストBをコピーするが、該テキストBは斯様な注文においては普通である同意
された割引率についての脚注を含む。
【0054】 この場合、ユーザは上記の認識されたテキスト情報RTIに、口述の間にユー
ザにより発せられた音声情報とは何の関係もないテキスト部分を追加する。この
ようなテキスト部分は音素基準情報PRIを調整するために評価されてはならな
い。何故なら、対応するオーディオ情報AIがオーディオ記憶手段37に記憶さ
れていないからである。更に、文脈情報WI又は音声モデルデータSMIを斯様
なテキスト部分を用いて調整するのも良くない。何故なら、テキストA及びテキ
ストBは、しばしば、ユーザの訂正されたテキスト情報CTIに含まれるが、殆
ど口述では発音されることがないからである。
【0055】 もし、文脈情報WI及び音声モデルデータSMIが、音声情報と何の関係もな
いテキスト部分により訓練されたとすると、例えば、該ユーザはJohnに対して頻
繁にレターを書き、且つ、訂正されたテキスト情報CTIに住所を常にコピーす
るので、該知人Johnの住所のテキストAに含まれる通り名“Hell Road”の語列
は高い発生確率を有するであろう。しかしながら、口述において発音される語列
“Hello Rod”は容易に誤って認識されてしまうであろう。何故なら、語列“Hel
lo Rod”は該ユーザの口述には比較的頻繁に発生するかもしれないが、音声モデ
ル記憶手段40における語列“Hello Rod”は語列“Hell Road”よりも相対的に
低い発生確率を有するようになるからである。
【0056】 ユーザが望む全ての訂正を該ユーザが行った後、且つ、訂正されたテキスト情
報CTIが訂正テキスト記憶手段46に記憶された後、該ユーザは口述マイクロ
フォン2のキーボード15のキーを触って、当該音声認識装置の調整モードを活
性化し、当該音声認識装置の音声係数指示子SKIを調整する。この場合、口述
マイクロフォン2はUSB接続手段23を介して音声認識手段42に各制御情報
SIを供給する。
【0057】 当該音声認識装置において活性化された調整モードにおいては、調整手段50
は、テキスト記憶手段43に記憶された有可能性テキスト情報PTI、認識テキ
スト情報RTI及び訂正テキスト情報CTIのようなオーディオ記憶手段37に
記憶されたオーディオ情報AIを読み取るようになっている。更に、活性化され
た調整モードにおける比較手段52は、図4に示すような調整テーブル53を設
けて、音声係数指示子SKIを調整するのに適した訂正テキスト情報CTIのテ
キスト部分を決定するようになっている。
【0058】 この目的のため、先ず、認識テキスト情報RTI及び訂正テキスト情報CTI
が調整テーブル53に書き込まれ、その際に誤って認識された語並びに訂正及び
挿入された語及びテキスト部分が太字で表される。テキスト比較手段52は、認
識テキスト情報RTIと訂正テキスト情報CTIとを比較すると共に、一致する
語を当該調整テーブル53の各位置においてグレイ領域により示すようになって
いる。認識テキスト情報RTIにおける“three computers”なる語を持つテキ
スト部分が、訂正テキスト情報CTIでは2回見つかる。
【0059】 更に、認識テキスト情報RTIと訂正テキスト情報CTIとを比較する場合、
テキスト比較手段52は、各テキスト部分に対して一致指示子CIを決定するよ
うになっている。この場合、比較手段52は、テキスト部分が、グレイ領域によ
り示される幾つの一致語を含むかを決定する。更に、テキスト比較手段52は、
各テキスト部分に対して罰則点を決定するが、1罰則点が訂正テキスト情報CT
Iにおける1つの語の各挿入、削除又は置換に与えられる。テキスト部分の一致
指示子CIは、テキスト部分の一致する語の数と罰則点とから決定される。
【0060】 テキスト比較手段52においては、上記一致指示子CIに対する最小値MWも
決定され、該最小値には、テキスト部分に対して訂正テキスト情報CTIにおけ
る隣接する語の訂正のために3を越える罰則点が付与される場合には達しない。
音声係数指示子SKIの調整に対しては、その一致指示子CIが上記最小値MW
を越えるテキスト部分のみしか使用されない。
【0061】 テキスト比較手段52は、調整テーブル53を評価して、テキストA及びテキ
ストBの全ての語が訂正テキスト情報CTIに挿入されたことを理解する。この
理由により、テキスト比較手段52は、テキストA及びテキストBの語の数に対
応するような多数の罰則点をテキストA及びテキストBに付与する。従って、テ
キスト比較手段52は、調整手段50に対して、最小値MWより小さい指示子値
の一致指示子CIを付与する。これは、音声情報と全く関係がない訂正テキスト
情報CTIのテキスト部分が音声係数指示子SKIの調整には使用されないとい
う利点を提供する。
【0062】 上記調整テーブル53によれば、音声係数指示子SKIの調整に使用すること
ができるテキスト部分は、訂正テキスト情報CTIの経路P1及び経路P2上に
は存在しない。
【0063】 経路P1は“Dear John I herewith”なる第1テキスト部分を含み、該テキス
ト部分はテキスト比較手段52から如何なる罰則点も受けず、従って、その一致
指示子は最小値MWを越える。経路P1は、上記第1テキスト部分の後に“orde
r three Quality computers and”なる第2テキスト部分を含み、該テキスト部
分は“order three Quality computers”なる語の挿入及び“organ”なる語の“
and”なる語による置換のために5つの罰則点(1)ないし(5)が付与され、
従って、その一致指示子は最小値MWには達しない。経路P1は上記第2テキス
ト部分の後に“three Standard computers for my office Harry”なる第3テキ
スト部分を含み、該テキスト部分には“Standard”なる語の挿入により1つの罰
則点(6)のみしか付与されず、従って、その一致指示子CIは最小値MWを越
える。従って、経路P1は、音声係数指示子SKIの調整に原理的には適した第
1及び第3テキスト部分を含んでいる。
【0064】 経路P2は“Dear John I herewith order three Quality computers”なる第
4テキスト部分を含み、該テキスト部分は“organ”なる語の“order”なる語に
よる置換のためにテキスト比較手段52から1つの罰則点(1)しか受けず、従
って、その一致指示子CIは最小値MWを越える。経路P2は、上記第4テキス
ト部分の後に“and three Standard computers”なる第5テキスト部分を含み、
該テキスト部分は、これら語の挿入のために4つの罰則点(2)ないし(5)を
受け、従って、その一致指示子は最小値MWには達しない。経路P2は上記第5
テキスト部分の後に“for my office Harry”なる第6テキスト部分を含み、該
テキスト部分には“Mary”なる語の“Harry”なる語による置換により1つの罰
則点(6)のみしか付与されず、従って、その一致指示子CIは最小値MWを越
える。従って、経路P2は、音声係数指示子SKIの調整に原理的に適した第4
及び第6テキスト部分を含んでいる。
【0065】 テキスト比較手段52は、最大の合計一致指示子SCIを持つような経路P1
又はP2のテキスト部分を決定する。この目的のため、テキスト比較手段52は
、補正テキスト情報CTIにおける経路P1の9つの語及び経路P2の10個の
語が認識テキスト情報RTIの語に完全に一致し、調整テーブル53にグレイの
領域として示されていると判定する。更に、テキスト比較手段52は各経路の罰
則点を加算し、この場合は、経路P1に対しては7なる罰則点が決定され、経路
P2に対しては6なる罰則点が決定される。
【0066】 最後に、テキスト比較手段52は、10個の一致語を有し且つ6なる罰則点し
か有さない経路2のテキスト情報の方が認識テキスト情報RTIに対して大きな
合計一致を有していると判定し、経路P2のテキスト部分に関する各々の高い合
計一致指示子SCIを調整手段50に供給する。
【0067】 これは、音声係数指示子SKIの調整に対して、例えば“order”及び“Harry
”のような第1の型式の訂正により訂正された語は斯かる調整に使用される一方
、音声情報とは何の関係も有さない例えば“and three Standard computers”の
ような第2の型式の訂正により訂正されたテキスト部分は斯かる調整に使用され
ないという利点を提供する。結果として、音声係数指示子SKIはユーザの発音
の特異性及びユーザの典型的な表現に対して非常に迅速に且つ良好に調整される
一方、当該音声認識装置の特に良好な認識率が達成される。
【0068】 当該音声認識装置で活性化された調整モードにおける調整手段50は、上記の
合計された一致指示子SCIがテキスト比較手段52から入力された後、訂正テ
キスト記憶手段46から訂正テキスト情報CTIの経路P2のテキスト部分を読
み出すと共に、これらテキスト部分を評価するようになっている。
【0069】 文脈情報WIを、各々が語“順序”P2の第4及び第6テキスト部分“Dear”
、“John”、“I”、…“Harry”の語に割り付けられ、且つ、各語と一緒に文脈
記憶手段39に記憶された頻度メータ値に対して調整するために、頻度メータ値
は当該ユーザの口述における各語の発生の確率を示す。調整のために使用される
テキスト部分の語がユーザにより最初に口述されると、該語は頻度メータの値“
1”と共に文脈記憶手段39に記憶される。
【0070】 音声モデル記憶手段40に記憶された音声モデルデータSMIを調整するため
には、例えば、語列“I herewith order”に割り当てられた記憶された頻度メー
タ値が値“1”により増加され、ユーザの口述における斯様な表現の高い発生確
率を示すようにする。
【0071】 音素基準記憶手段41に記憶された音素基準情報PRIを調整するには、語列
P2の第4及び第6テキスト部分における認識テキスト情報RTIの語に完全に
一致する語のみが、関連するオーディオ情報AIと一緒に評価され、調整テーブ
ル53においてグレイの領域により示される。更に、可能性のあるテキスト情報
PTIの語も関連するオーディオ情報AIと共に評価することができる。この目
的のため、調整手段50は、ユーザにより第1型式の訂正で置換された語(“or
der”、“Harry”)が有可能性テキスト記憶手段44にオーディオ情報AIの、
この部分のために記憶されているかをチェックする。もし、斯様な語が有可能性
テキスト記憶手段44で見つかる場合は、この語は関連するオーディオ情報AI
と共に、音素基準情報PRIを調整するために評価される。
【0072】 次いで、これらの調整を含む可調整情報NIが、音声係数指示子SKIを調整
するために調整手段50により音声係数記憶手段38に供給される。同様にして
、調整手段50は訓練指示子TIを転送手段54に供給するが、該指示子は音声
係数記憶手段38に既に記憶されている音声係数指示子SKIが、どれだけ多く
の語を用いて訓練されたかを示す。これは、訓練指示子TIにより、当該音声認
識装置がユーザに対して既に良好に調整されており、従って恐らく該ユーザに対
して良好な認識率を有するであろうかが、即座に明らかになるという利点を提供
する。
【0073】 第2の応用例によれば、コンピュータ1により形成される音声認識装置のユー
ザが、第2の音声認識装置を形成する第2のコンピュータも更に有すると仮定す
る。明らかに該ユーザは、その音声認識情報SKIを数ヶ月にわたり訓練したコ
ンピュータ1により形成される当該音声認識装置でユーザが既に達成しているの
と、同様に良好な認識率を該第2の音声認識装置でも達成したいと欲する。
【0074】 この目的のため、ユーザがキーボード5のキーを作動させると、その後、転送
情報TRIがキーボード5により転送手段54に送出される。この場合、転送手
段54は音声係数記憶手段38に記憶された音声係数指示子SKIを読み出すた
めに使用される。該転送手段54は、更に、該読み出された音声係数指示子SK
I及び音声係数指示子SKIの訓練指示子TIを、コンピュータ1のディスクド
ライブに挿入されたディスク55上に記憶するために使用される。
【0075】 これは、音声係数記憶手段38に記憶され且つ当該ユーザにより既に訓練され
た音声係数指示子SKIをコンピュータ1からエクスポートすることができると
いう利点を提供する。更に、該音声係数指示子SKIは、当該ユーザの第2のコ
ンピュータにインポートすることもできる。結果として、ユーザは彼自身により
訓練された音声係数指示子SKIを、図1に示した音声認識装置に対応する音声
認識装置を形成するような望むだけ多数の他のコンピュータにおいて使用するこ
とができ、且つ、このようにして、これらのコンピュータによっても上記音声認
識装置の良好な認識率を得ることができる。
【0076】 有利には、音声係数指示子SKIがエクスポートされる場合、該音声係数指示
子SKIの訓練指示子TIも共にエクスポートされるようにする一方、音声係数
指示子SKIが転送手段54からインポートされる場合は、とりあえず、該イン
ポートされるべき音声係数指示子SKIが、音声係数記憶手段38に記憶されて
いる音声係数指示子SKIよりも良好に訓練されているかを検証することができ
る。転送手段54は、上記検証が、インポートされるべき音声係数指示子SKI
が音声係数記憶手段38に記憶されている音声係数指示子SKIよりも既に良好
に訓練されていることを示す場合にのみ、上記音声係数指示子SKIをインポー
トする。
【0077】 第3の応用例によれば、コンピュータ1はインターネットに接続されたインタ
ーネットサーバを形成し、該コンピュータ1の接続部56によりインターネット
に接続されていると仮定する。更に、口述記録機を形成する他のコンピュータの
ユーザが、コンピュータ1のホームページ記憶手段57に記憶された当該インタ
ーネットサーバのホームページからテキスト情報を質問し、このテキスト情報が
コンピュータ1の接続部56を介して上記他のコンピュータに伝送されたと仮定
する。上記ホームページからの該テキスト情報は、通常行われているように、ホ
ームページ記憶手段57に記憶された他のテキスト情報を質問することができる
ようなリンク情報を含んでいる。図1に示すインターネットサーバの音声認識装
置は、上記他のコンピュータのユーザが、ホームページ上に示されるリンク情報
を、該他のコンピュータにより供給される音声情報により活性化するのを可能に
する。
【0078】 該第3の応用例によれば、更に、上記ユーザが上記ホームページ上に示される
“hotels”なるリンク情報を活性化しようとすると仮定する。この目的のため、
ユーザは上記他のコンピュータの口述マイクロフォンの記録キーを作動させると
共に、該口述マイクロフォンに向かって“hotel”なる音声情報を発する。この
音声情報に含まれるオーディオ情報AIは、その接続部56を介してコンピュー
タ1に供給され、該オーディオ情報AIはオーディオ記憶手段37に記憶される
。この音声情報により活性化されたコンピュータ1における音声認識装置の音声
認識モードにおいては、上記“hotels”なる語が音声認識手段42により認識テ
キスト情報RTIとして認識され、このリンク情報に割り当てられたテキスト情
報が、ホームページ記憶手段57から当該コンピュータ1の接続部56を介して
上記ユーザの他のコンピュータに伝送される。
【0079】 上記音声認識モードが活性化される前に、上記他のコンピュータによりエクス
ポートされ、インターネットを介して接続部56に供給された音声係数指示子S
KIは、ここで、有利にも転送手段54によりコンピュータ1にインポートされ
る。結果として、コンピュータ1により形成されるインターネットサーバは各ユ
ーザに対して調整されるようになり、これが極めて高い認識率が達成される理由
である。
【0080】 ユーザの音声係数指示子SKIを、インターネットに送信される各オーディオ
情報AIと共に同時送信することができることが分かる。しかしながら、ユーザ
の音声係数指示子SKIはインターネットサーバのホームページが質問された最
初にのみインターネットサーバに送信されるようにすると共に、該音声係数指示
子SKIをこのユーザのために該インターネットサーバに記憶するようにするの
が特に有利である。このユーザの上記他のコンピュータからのオーディオ情報A
Iの以降の各受信に対しては、上記インターネットサーバは既に記憶された音声
係数指示子SKIを音声認識のために使用することができる。
【0081】 音声係数指示子SKIを調整するための調整モードは、訂正されたテキスト情
報CTIが記憶された後に自動的に活性化されるようにすることもできるし、コ
ンピュータ1のキーボード5のキーを介してユーザにより活性化することもでき
ることが分かる。
【0082】 前記実施例の例を参照して述べた可能性以外に、経路におけるテキスト部分の
一致値又はテキスト部分の合計された一致値を決定するための他の可能性も存在
することが分かる。更に、3つの連続した罰則点が付与された場合に最小値MW
に達しないとの結論は、一例としてのみ理解されたい。同様に、テキスト部分の
或る数の語における或る数の罰則点を超えるような多数の罰則点も、上記最小値
MWに達しないものとして定義することができる。
【0083】 また、音声係数指示子SKIを調整するために、テキスト部分における音声係
数指示子SKIを調整するのに原理的に適した或る区域のみを使用するのも有利
であることが分かり、斯かるテキスト部分の決定は音声係数指示子SKIの調整
に関して前記実施例の第1例を参照して説明した通りである。例えば、テキスト
比較手段52により罰則点が付与された語、及び調整テーブル53において、こ
れらの語に隣接するグレイ領域により示される語のみが使用される。
【0084】 これは、音声認識処理の間に誤って認識され、ユーザにより訂正(置換)され
た語(“order”、“Harry”)及びこれら語に隣接する語が調整に使用されると
いう利点を提供する。調整に原理的に適したテキスト部分の訂正されたテキスト
情報CTIにおける、認識されたテキスト情報RTIに完全に一致する区域は、
ここでは、調整には使用されない。何故なら、これらの区域はユーザにより全く
訂正されていないかもしれないからである。
【0085】 手持ち型入力装置の入力手段もコンピュータに制御情報を供給し、該コンピュ
ータを電力節約モードから活動モードにすることも可能であることが分かる。
【0086】 また、足で操作される入力装置も、通常、コンピュータ内の動作モードを活性
化するために使用することができることが分かる。該コンピュータはテレビジョ
ン受信機を形成することができ、テレビジョンチャンネルは前記フットスイッチ
により選択することができ、該チャンネルにおいてテレビジョン放送が受信され
、該放送が前記モニタにより表示される。
【0087】 マイクロフォン又はスピーカもUSB接続手段を有している場合は、前記入力
装置のUSB接続手段を接続することができる該マイクロフォン又はスピーカは
、足で操作される入力装置に接続することができることが分かる。この場合、上
記の足で操作される入力装置がオーディオ処理手段を有する必要はない。何故な
ら、この場合には、アナログオーディオ信号を伝送するためにオーディオ処理手
段が該マイクロフォン及びスピーカに配置されるからである。
【0088】 デジタルデータバスリンクは、例えばブルートゥース仕様(ブルートゥース・
スペシャル・インタレスト・グループ、1998年5月)に従うような無線周波
数無線リンクにより形成することも可能であることが分かる。これは、上記入力
装置とコンピュータとの間に最早何のケーブルリンクも必要でないという利点を
提供する。
【0089】 また、スピーカもフットスイッチ3の第1接続部33に接続することができる
ことが分かる。
【図面の簡単な説明】
【図1】 図1は、手に保持することができる入力ユニット及び足により作動される入力
ユニットが接続されると共に、認識されたテキスト情報と訂正されたテキスト情
報とを比較するテキスト比較手段を含み、且つ、音声係数指示子をインポート又
はイクスポートする転送手段を含むような音声認識装置をブロック図の形で示す
【図2】 図2は、図1に示す手に保持することができる入力ユニットをブロック図の形
で示し、該入力ユニットはアナログオーディオ信号を処理すると共にデジタルオ
ーディオデータを送出するオーディオ処理手段を有する。
【図3】 図3は、足により作動することができると共に図1に示された入力ユニットを
ブロック図の形で示し、該入力ユニットにはヘッドフォンを接続することができ
る一方、該入力ユニットは組込式スピーカを含む。
【図4】 図4は、上記音声認識装置のテキスト比較手段により確立される調整テーブル
を示し、該テーブルには認識されたテキスト情報と訂正されたテキスト情報とが
入力される。
【符号の説明】
1…コンピュータ 3…足操作入力ユニット 24…入力手段 25…オーディオ再生スイッチ 27…入力処理手段 28…USB接続手段 29…オーディオ処理手段 30…デジタル/アナログ変換器段 31…増幅器段 32…スピーカ 33…第1接続部 34…ヘッドフォン 35…第2接続部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5E501 AA02 AA30 BA05 CA08 CB03 EA01 EA21 FA13 FA32

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 口述記録機を形成するコンピュータ用の足操作入力ユニット
    であって、 制御情報を操作的に入力する足操作入力手段であって、前記制御情報により前
    記口述記録機のオーディオ再生モードを活性化又は非活性化することができ、活
    性化されたオーディオ再生モードの場合は前記口述記録機に記憶されたオーディ
    オ情報をヘッドフォン又はスピーカに供給することができるような足操作入力手
    段と、 前記入力ユニットを前記コンピュータに接続する接続手段であって、該接続手
    段により前記制御情報を前記コンピュータに伝送することができるような接続手
    段と、 を有する足操作入力ユニットにおいて、 デジタルデータバスリンクを前記接続手段に接続することができ、 前記接続手段は前記デジタルデータバスリンクを介して前記コンピュータから
    前記オーディオ情報をデジタルオーディオデータとして受信すると共に、前記コ
    ンピュータへ前記制御情報を制御データとして伝送するように構成され、 前記ヘッドフォン又は前記スピーカを前記接続手段に接続することができる、
    ことを特徴とする足操作入力ユニット。
  2. 【請求項2】 請求項1に記載の入力ユニットにおいて、前記接続手段を介
    して入力された前記オーディオ情報を処理すると共に前記接続手段に前記ヘッド
    フォン又はスピーカ用のアナログオーディオ信号を供給するように構成されたオ
    ーディオ処理手段が設けられることを特徴とする入力ユニット。
  3. 【請求項3】 請求項2に記載の入力ユニットにおいて、前記接続手段はU
    SBデータリンク(汎用直列バス:1996年1月15日付けバージョン1.0
    又はバージョン2.0)を確立するように構成されていることを特徴とする入力
    ユニット。
  4. 【請求項4】 請求項1に記載の入力ユニットにおいて、スピーカが設けら
    れると共に、前記オーディオ処理手段が前記アナログオーディオ信号を組込式ス
    ピーカに供給するように構成されていることを特徴とする入力ユニット。
  5. 【請求項5】 請求項1に記載の入力ユニットにおいて、前記接続手段が無
    線周波数無線リンクを介してデジタルデータバスリンクを確立するように構成さ
    れていることを特徴とする入力ユニット。
  6. 【請求項6】 請求項5に記載の入力ユニットにおいて、前記接続手段がブ
    ルートゥース仕様(ブルートゥース・スペシャル・インタレスト・グループ、1
    998年5月)に対応する無線周波数無線リンクを確立するように構成されてい
    ることを特徴とする入力ユニット。
JP2001510079A 1999-07-08 2000-07-07 コンピュータ用のフットスイッチ Pending JP2003504752A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99890234 1999-07-08
EP99890234.0 1999-07-08
PCT/EP2000/006436 WO2001004739A1 (en) 1999-07-08 2000-07-07 Foot switch for a computer

Publications (1)

Publication Number Publication Date
JP2003504752A true JP2003504752A (ja) 2003-02-04

Family

ID=8243998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001510079A Pending JP2003504752A (ja) 1999-07-08 2000-07-07 コンピュータ用のフットスイッチ

Country Status (4)

Country Link
US (1) US6856959B1 (ja)
EP (1) EP1110139A1 (ja)
JP (1) JP2003504752A (ja)
WO (1) WO2001004739A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5547372B2 (ja) 2004-08-27 2014-07-09 トムソン ライセンシング データ・バスを介してディジタルおよびアナログのデータ通信を可能にするための装置および方法
CN102256193B (zh) * 2011-06-22 2013-06-26 天地融科技股份有限公司 一种音频信号接收装置,音频信号传输系统
US20150194179A1 (en) * 2014-01-03 2015-07-09 David Wayne Smith Hands-free media device control apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01272014A (ja) * 1988-04-22 1989-10-31 Kokusai Dengiyou Kk フットスイッチ
JPH04328351A (ja) * 1991-04-30 1992-11-17 Olympus Optical Co Ltd 情報再生速度の自動調整装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56115701U (ja) * 1980-01-30 1981-09-04
US5197052A (en) * 1988-03-10 1993-03-23 Grundig E.M.V. Personal computer dictation system with voice anad text stored on the same storage medium
AU2301292A (en) * 1991-07-16 1993-02-23 BCB Technology Group Incorporated, The Dos compatible dictation and voice mail system
US5519808A (en) * 1993-03-10 1996-05-21 Lanier Worldwide, Inc. Transcription interface for a word processing station
US5447089A (en) * 1993-04-27 1995-09-05 Marrash; James G. Electronic metronome with variable tempo control
DE4319925A1 (de) * 1993-06-16 1994-12-22 Treudler Reinhard Dipl Ing Anschlußkabel für einen Personal-Computer
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
TR199701340T1 (xx) * 1996-03-11 1998-06-22 Koninklijke Philips Electronics N.V. Konu�ma sinyallerinin depolanmas� i�in dikte cihaz�.
US5914877A (en) * 1996-10-23 1999-06-22 Advanced Micro Devices, Inc. USB based microphone system
US6366622B1 (en) * 1998-12-18 2002-04-02 Silicon Wave, Inc. Apparatus and method for wireless communications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01272014A (ja) * 1988-04-22 1989-10-31 Kokusai Dengiyou Kk フットスイッチ
JPH04328351A (ja) * 1991-04-30 1992-11-17 Olympus Optical Co Ltd 情報再生速度の自動調整装置

Also Published As

Publication number Publication date
EP1110139A1 (en) 2001-06-27
US6856959B1 (en) 2005-02-15
WO2001004739A1 (en) 2001-01-18

Similar Documents

Publication Publication Date Title
US7945342B2 (en) Audio processing apparatus for automatic gain control
US11848022B2 (en) Personal audio assistant device and method
US10009677B2 (en) Methods and mechanisms for inflation
JP4241376B2 (ja) 認識されたテキスト中の音声シーケンスと手動入力される補正ワードの音声転写との比較を通した音声認識により認識されたテキストの補正
EP1110204B1 (en) Adaptation of a speech recognizer from corrected text
KR101455090B1 (ko) 재생 음악과 연주 음악간의 자동 키 매칭 방법 및 장치 및그 오디오 재생 장치
JP2005505805A (ja) 認識されたテキストの一部をマークする補正装置
JP2008539647A (ja) エコー機能を有するリモコン
US20020133342A1 (en) Speech to text method and system
US20080059197A1 (en) System and method for providing real-time communication of high quality audio
JP2009060209A (ja) 再生装置、プログラム、及び再生装置における周波数特性調整方法
US6868379B1 (en) Speech recognition device with transfer means
JP2003504752A (ja) コンピュータ用のフットスイッチ
JP5401980B2 (ja) オーディオ信号処理システム
JP4305084B2 (ja) 音楽再生装置
US20210280193A1 (en) Electronic Speech to Text Court Reporting System Utilizing Numerous Microphones And Eliminating Bleeding Between the Numerous Microphones
WO2001004740A1 (en) Dictation microphone for a computer
CN100487787C (zh) 实现语音业务融合背景音乐的系统及其方法
JP4035076B2 (ja) データ処理装置及び方法
TWI286288B (en) System and method for managing volume
JP4297433B2 (ja) 音声合成方法及びその装置
JP5114922B2 (ja) 車両用音響装置、及び、外部音源装置
JP2003509712A (ja) スピーチ情報の無線送受信のための個人用情報システム
WO2003055112A1 (fr) Microphone installe dans un reseau informatique
JPH11168785A (ja) 出力端子付マイクロフォン

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100706