JP2002132285A - 連続音声処理と指令・制御音声処理のための統合dspを備えたコンピュータ母板アーキテクチャ - Google Patents

連続音声処理と指令・制御音声処理のための統合dspを備えたコンピュータ母板アーキテクチャ

Info

Publication number
JP2002132285A
JP2002132285A JP2001212688A JP2001212688A JP2002132285A JP 2002132285 A JP2002132285 A JP 2002132285A JP 2001212688 A JP2001212688 A JP 2001212688A JP 2001212688 A JP2001212688 A JP 2001212688A JP 2002132285 A JP2002132285 A JP 2002132285A
Authority
JP
Japan
Prior art keywords
computer
dsp
computer motherboard
architecture
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001212688A
Other languages
English (en)
Other versions
JP4132737B2 (ja
Inventor
Robert G Schultz
ジー シュルツ ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xybernaut Corp
Original Assignee
Xybernaut Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24719254&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2002132285(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Xybernaut Corp filed Critical Xybernaut Corp
Publication of JP2002132285A publication Critical patent/JP2002132285A/ja
Application granted granted Critical
Publication of JP4132737B2 publication Critical patent/JP4132737B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Stored Programmes (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Hardware Redundancy (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 統合されたデジタル信号処理(DSP)能力
を持つ新しい母板アーキテクチャの提供。 【解決手段】 DSPハードウェアは、音声カード又は
統合音声モジュールの音声入力部とマイクロプロセッサ
との間のブリッジとしての機能を果す。DSPチップ自
体は、指令音声及び連続音声を処理するためのプロセッ
サ及び埋め込み音声認識エンジンとしてとしての機能を
果す。更に、DSPチップは、連続音声処理の前置プロ
セッサとしての機能を果し、音声を表わすデジタルビッ
トストリームを、CPU及びソフトウェア利用の音声認
識エンジンにより処理するための音素に変換し、デジタ
ル携帯電話機能及び文字から音声への変換を円滑化する
ことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、基本的には、デジ
タル信号処理用ハードウェアを音声の直接入力インター
フェースとして母板に統合することにより、連続音声処
理を行うとともに、指令・制御音声処理を行う新しいコ
ンピュータ母板のアーキテクチャに関する。
【0002】
【従来の技術】ソフトウェアを用いた音声認識エンジン
がより強力なものとなるとともに、マイクロプロセッサ
の処理速度が1GHzにも達するのと並行し、音声認識
や音声駆動技術も益々普及する方向にある。本来、音声
認識技術は、口述筆記したりオペレーティングシステム
を限定的に制御したりする手段として考え出されたもの
であるが、現在そして将来に渡り、あらゆる用途におい
て広範囲に普及すると考えられる。発話は、最も自然で
効果的なコミュニケーションの形態である。その音声
は、制御指令に、更にウェブブラウザや検索エンジン等
の様々なアプリケーションに取り込むことができる。ま
た、コンピュータにおいて手動で行われる多くの操作を
自動化するために音声を使用することもできる。一部の
最新コンピュータは、主として音声で制御されるように
設計されている。米国特許第5,305,244号及び第
5,844,824号は、これに関連する二つの例であ
り、これら特許には、手を使わない形で(即ち、ハンズ
フリー方式で)ユーザがコンピュータを操作することが
できる音声駆動の身体装着型コンピュータが開示されて
いる。米国特許第5,305,244号には、「コンピュ
ータ装置は、プロセッサと通信してユーザからの音声指
令を受信し、受信音声指令を電気信号に変換してこの変
換電気信号を認識し、認識信号を処理するプロセッサに
送るための音声認識モジュールを備えており、この音声
認識モジュールが、ユーザによって支持される。」こと
が記載されている。更に、米国特許第5,844,824
号には、「キーボード入力装置即ちキーボード駆動装置
を使用することなく、ハンズフリー方式で行える様々な
駆動手段を備えた身体装着型のハンズフリー方式のコン
ピュータシステム」が開示されている。これら駆動手段
の一つは音声である。このように、上記二つの特許に開
示された発明には、主駆動源として音声を使用してオペ
レーティングシステム及び様々なアプリケーションを制
御することができるコンピュータのハードウェアプラッ
トフォームが示されている。
【0003】大半の人は、タイプする約五倍の速度で話
し、書くよりほぼ十倍の速度で話すことができる。従っ
て、音声認識や音声処理をパーソナルコンピュータ(以
下、“PC”ともいう)に統合できれば、効率面で大き
な利点がある。コンピュータ環境での最新の音声処理方
法は、主としてソフトウェアを使用したものである。音
声カードが音声入力装置として使用され、この音声カー
ドは、標準的なアナログマイクロフォンで捕捉した音声
/言語を受け取り、これをデジタルビットストリームに
変換してマイクロプロセッサに送るアナログ・デジタル
(A/D)変換器を備えている。そして、メモリに記憶
されたソフトウェアがCPUと連携する形で使用される
ことにより、指令か単なる文字かに係らず、音声を表す
信号を処理して適切な指令即ち機能を実行する。この種
の相互作用を行うための主要ソフトウェアアプリケーシ
ョンとしては、IBM社Via Voice(登録商
標)やDragon Systems社のNatura
lly Speaking(登録商標)がある。これら
はいずれも全ての音声処理にコンピュータのCPUを利
用する音声認識ソフトウェアエンジンを使用した音声認
識プログラムである。このタスクは、CPUに非常に集
中的な演算を強いるものであり、システム資源を強く拘
束しそれに制約を加える。これは、AC電力が十分供給
されるようなデスクトップ型又はラップトップ型のコン
ピュータ環境においては、単にシステム性能を低下させ
るに過ぎない。しかし、通常はバッテリにより電力供給
される移動用の身体装着型コンピュータ環境において
は、上記タスクによって、過度の電力が消費されるとい
う問題も生じる。CPUにより実行されるクロックサイ
クルと電力消費との間には直接的な相関関係がある。そ
れに加え、余裕空間が限られているため能動的冷却方式
を採用することはまず不可能である移動用の身体装着型
コンピュータ環境では、過剰な熱発生により、メモリ、
母板、その他のシリコンを使用した電子部品が劣化する
とともに、熱蓄積によりCPUの処理速度も低下してし
まう可能性がある。このように、効率的且つ効果的に音
声処理を行うとともに、バッテリ寿命を延ばし、更に、
CPUによる熱蓄積を低減するアーキテクチャにより、
現状の技術は大幅に進展すると考えられる。
【0004】近年、生の音声を処理するために、デジタ
ル信号処理(以下、DSPという)チップが使用され始
めた。この一例として、顧客サービス電話システムがあ
る。このシステムによれば、呼び出し側において、電話
に一体化されたキーパッドでキー入力でき、更に、話す
ことによっても入力を行うことができる。DSPは、通
常の電話回線システムに統合されている。このシステム
が発声言語を表す信号を受信すると、DSPは、既知の
言語を表わす既知の信号との照合を行い、このデータの
入力を行う。しかし、このシステムは、通常、数字の認
識に限られており、消費者志向の製品としては市販され
ていない。
【0005】DSPは、本質的に汎用マイクロプロセッ
サであり、様々な具体的用途に使用できる。DSPは、
通常はマイクロプロセッサからは連想できない処理速
度、電力消費レベル、効率で、数学的機能を実行するた
めの特殊な論理ハードウェアを備えている。これらチッ
プは、様々な信号処理機能を実行するようにプログラム
することができる。DSPを持つ様々なPC用拡張カー
ドが市販されており、また、信号処理機能を実行するた
めにそれらチップをプログラムするソフトウェアアプリ
ケーションも一般的に存在する。それらは、通常、その
ハードウェア及びアーキテクチャ故に、特定の集中的な
計算機能を実行するのに好適である。
【0006】DSPは、通常、演算の中でも、相関、重
畳、有限インパルス応答(FIR)フィルタ、無限イン
パルス応答(IIR)フィルタ、高速フーリエ変換(F
FT)、マトリックス計算、及び内積等の数学的アルゴ
リズムに対して、特に最適なものになるよう設計され
る。これら数学的アルゴリズムの実行には、通常、体系
的な算術/乗法演算の長いシーケンスが必要となる。F
FT及び各フィルタは、音声処理と特に関連性を持つも
のである。
【0007】通常、CPUは、実行ユニット、キャッシ
ュメモリ、メモリ管理ユニット、浮動小数点ユニット、
及びその他の論理ユニットを備える。汎用CPUのタス
クとは、コードを実行し、コンピュータメモリ内のデー
タについての演算を行い、それによって計算プラットホ
ームを管理することである。概して、基本的X86及び
その他の形式のコンピュータ用CPUは、主としてブー
ル/管理/データ処理の演算を実行する。汎用CPUで
実行される命令には、基本的な数学的機能が含まれる。
しかし、これらの機能は、複雑なDSP形式の数学的演
算に適合したものとは言えない。従って、汎用CPU
は、DSPに関連する、つまり、基本的なDSP機能を
実行する膨大な数の命令を実行する必要がある。
【0008】従来技術では、ハードウェア及びソフトウ
ェアの双方において、DSPをPCのアーキテクチャに
組み込み、そうすることに関連する効果を利用しようと
していた。米国特許第5,794,068号(以下、‘0
68特許という)には、一つの例が示されている。‘0
68特許では、X86コアのような汎用CPUユニット
を設けるとともに、DSPコアを付加した汎用CPUが
開示されている。このCPUは、命令シーケンスを調べ
てDSP機能が実行中であるか否かを判定するDSP機
能デコーダ即ちプリプロセッサを備える。デコーダが、
DSP機能が実行中であると判定すると、機能デコーダ
は命令シーケンスをDSPマクロに変換し、このマクロ
をDSPコアに送る。DSPコアは、汎用CPUコアに
よって実行される他の演算と並行し、DSP機能を実行
することができる。この設計は、DSP操作の実行を必
要とする既存のソフトウェアパッケージとの間に、更
に、そうする必要のないものとの間にも、逆の互換性を
持つことを保証している。しかしながら、プリプロセッ
サであるために、余分な処置が実行サイクル中に割り込
むことになる。‘068特許の欠点は、指令を処理する
前に、DSP命令を確認するために命令を解読しなけれ
ばならない点にある。‘068特許によるシステムの他
の欠点は、このアーキテクチャが音声処理用に最適化さ
れていない点にあり、‘068特許には、DSPチップ
自体に指令・制御音声認識エンジンを設けることは示さ
れていない。また、このDSPは、コンピュータの音声
入力により生成される全ての音声入力信号に対する主イ
ンターフェースとしては機能しない。
【0009】他の例として、米国特許第5,915,23
6号(以下、‘236特許という)には、音声処理のた
めにDSPを利用する場合のソフトウェア的手法が示さ
れている。‘236特許には、言語認識システムが開示
されており、このシステムは、処理速度、プロセッサの
数、DSPの存在等の利用可能な計算用資源を検出し、
この検出に応答してシステム自身が実行する命令を変更
することにより、これら命令の割当てを最適化するよう
になっている。このシステムは、本来、音声認識プログ
ラムであるが、実際の言語認識プログラムは、利用可能
な計算用資源の機能に応じて信号処理の計算能力を変え
ることができる。プログラムが、CPUとDSPプロセ
ッサとの双方を検出した場合、いつプログラムがCPU
に割り込むべきかをDSPに判定させることができる。
また、プログラムは、利用可能な資源階層の機能に応じ
て、認識プロセスの間、比較的スコーリングの低い言語
を度外視するようにフィルタをかける度合いを変更する
こともできる。このシステムの欠点若しくは課題は、ソ
フトウェアを利用した解決策であるということ、つま
り、本質的にこのソフトウェアを実行しているコンピュ
ータのアーキテクチャにより制約を受ける点にある。言
い換えると、DSPがない場合には、システムは、確実
さ正確さの面で低い性能に甘んじることになる。更に、
ソフトウェア及びCPUは、DSP命令コードを確認す
る必要があり、余分なステップがプロセスに持ち込まれ
ることになる。
【0010】このように、パーソナルコンピュータ、特
に、移動用、手持型、身体装着型コンピュータのため
の、上述の欠点を克服した音声処理アーキテクチャに対
するニーズは現在も存在する。
【0011】
【発明が解決しようとする課題】従って、本発明の目的
は、上記の欠点のない新しい母板のアーキテクチャを提
供することにある。
【0012】本発明の他の目的は、統合されたデジタル
信号処理(DSP)能力を持つ新しい母板アーキテクチ
ャを提供することにある。
【0013】本発明の他の目的は、音声処理のために最
適化されたハードウェアのアーキテクチャを提供するこ
とにある。
【0014】本発明の他の目的は、音声処理時の電力消
費とCPUのクロックサイクルとを低減する母板アーキ
テクチャを提供することにある。
【0015】本発明の他の目的は、既存のソフトウェア
を使用した音声処理方法を凌ぐ、優れた精度と能力を持
つコンピュータのアーキテクチャを提供することにあ
る。
【0016】本発明の他の目的は、音声処理に必要なC
PUのサイクル数を低減するようにしたPC、特に、移
動用の手持型及び身体装着型のPC、及びその他の電子
装置用の母板アーキテクチャを提供することにある。
【0017】本発明の他の目的は、音声処理時の電力消
費と発熱とを低減するようにした移動用の手持型及び身
体装着型のコンピュータ、及びその他の電子装置用の音
声処理設計を提供することにある。
【0018】本発明の他の目的は、音声処理を行いなが
ら雑音を消去したり低減したりできるアーキテクチャを
提供することにある。
【0019】本発明の他の目的は、指令・制御音声の用
語をカスタマイズすることができるDSP埋め込み音声
認識エンジンを提供することにある。
【0020】
【課題を解決するための手段】本発明の上記目的及びそ
の他の目的は、全体としては、音声入力部とマイクロプ
ロセッサとの間の音声指令を認識し処理するためのイン
ターフェースとして、DSPハードウェアを母板に組み
込むコンピュータ母板設計によって達成される。
【0021】
【発明の実施の形態】本明細書及び特許請求の範囲にお
いて、「コンピュータ母板」という用語には、パーソナ
ルコンピュータ、身体装着型コンピュータ、携帯型コン
ピュータ、ラップトップ型コンピュータ、演算機能と通
信機能とが組合わされた装置、又はパームトップ型コン
ピュータと共に使用される母板であれば、どのような母
板も含まれる。
【0022】本発明は、本質的に、音声カード又は同様
な音声入力装置とマイクロプロセッサとの間のインター
フェースとして、DSPハードウェアを母板に組み込ん
だ新しいコンピュータ母板のアーキテクチャである。こ
れにより、既存の音声処理アーキテクチャに付随する幾
つかの問題が解決される。DSPを音声データ入力スト
リームに組み込むことで、現行の音声処理アーキテクチ
ャに重要な能力を追加し、更に、音声処理中のマイクロ
プロセッサの使用を最小限にする。CPU及びソフトウ
ェア利用のエンジンを使用して音声を処理するVia
Voice(登録商標)やNaturally Spe
aking(登録商標)のような現行の方法の問題は、
マイクロプロセッサが音声処理に必要な膨大な数の高速
フーリエ変換(以下、“FFT”という)を実行するの
に適していないという点にある。これは、電力を枯渇さ
せるプロセッサの集中的使用の原因となり、過度の熱蓄
積を発生させ、プロセッサが通常の処理速度で他のタス
クを実行できないようにしてしまう。マイクロプロセッ
サは、ワットレベルにも達する電力を消費する。DSP
をA/D変換器とマイクロプロセッサとの間をブリッジ
するように設けることで、連続的な指令音声の前処理を
DSPにより行うことができ、これにより大幅な電力節
減をするとともに、精度を高めるための付加的な確認・
照合を行うことができるようになる。米国テキサス州ダ
ラスにあるテキサスインスツルメンツ社製のDSPであ
るTMS5000シリーズのようなDSPチップは、ミ
リワット程度の電力しか消費せず、CPUに比べて数桁
レベルの低減となる。更に、これらのチップは、効果的
で効率的な音声処理に必要とされるいわば計算作業を実
行するように最適化されている。従って、正確さ、処理
速度、及び能力の向上は、このアーキテクチャの成果と
して実現される。また、CPUは、コンピュータ上で同
時に実行されているソフトウェアアプリケーションに関
連する他のタスクを自由に実行でき、このタスクの一部
は、認識精度やユーザとの対話経験率を向上するために
使用することができる。これは、デスクトップ型コンピ
ュータ及び家庭用コンピュータのみならず身体装着型/
携帯型コンピュータの両者にとって大きな利点となる。
特に、身体装着型や携帯型コンピュータ環境において
は、確固たる音声処理能力によって装置全体の有用性が
増大する。本明細書において、身体装着型コンピュータ
とは、米国ヴァージニア州フェアファックスのXybe
rnaut社に譲渡された米国特許第5,844,824
号に開示され、Mobile Assistant(登
録商標)という商品名で商品化されているようなコンピ
ュータである。米国特許第5,844,824号には、ユ
ーザ支持型コンピュータとの通信手段の使用が開示され
ている。また、HMD、首部吊下げ型表示装置、及びフ
ラットパネル型表示装置等の表示装置を本システムと組
合せて使用することができる。これらについては、上記
特許の開示事項を参考として参照されたい。しかしなが
ら、当業者であれば、身体装着型コンピュータが、他の
企業により製造されるコンピュータ又は母板を使用した
コンピュータ、及び現在のところ製造されていない電子
製品をも指す用語であることは認識される所であろう。
この技術を組み込むことにより、ユーザは、手動又はポ
インティング装置での駆動ではなく又はそれに加えて、
音声駆動を使用した上記装置を確実に且つ正確に利用す
ることが可能となる。また、CPUに比べてDSPの電
力消費が低減されるため、本装置のバッテリ寿命が大幅
に延びる。また、デスクトップ型コンピュータ環境で
は、より効率的な音声処理とCPUクロックサイクルに
自由度を与える利点も実現される。
【0023】コンピュータにおける音声処理は、二つの
基本的な種類に分類することができる。即ち、一つは、
指令・制御音声の処理であり、二つ目は、連続音声の処
理である。指令・制御の音声とは、オペレーティングシ
ステムを制御するため、又は特定のアプリケーションを
介して誘導するために使用される言語である。これらの
各単語や語句は、特定の指令にカスタマイズしたりリン
クさせたりすることができる。「オープンウィンドウ」
や「スクロールダウン」等の語句を、指令・制御の音声
の例として挙げることができる。それらは、通常、限定
即ち区分化した用語群即ち用語集の中から選択される言
語であり、各々の言語はコンピュータ用の特定の指令と
結び付けられている。現在、指令・制御音声は、ソフト
ウェア利用の音声認識エンジン及びCPUによって処理
されている。しかし、DSPは、これら指令・制御言語
即ち語句のための音声認識エンジンとしての機能を果す
ことができる。音声認識エンジン自体は、DSPチップ
に埋め込まれたメモリ内にあるので、変換された指令だ
けが実行用CPUに送られる。これにより、CPUを全
く利用することなく、DSPによって音声の完全な解釈
と処理を行うことができる。法律用語に関する指令言語
用テンプレートをDSPメモリに置くことができ、その
代わりに、アプリケーションに応じて様々な異なる制御
指令ライブラリを使用できるようにするコンテキストや
アプリケーションに基づいて、上記指令言語用テンプレ
ートを、ホストCPU即ちホストプロセッサからDSP
メモリにロードすることもできる。この形態では、DS
Pメモリには限定された指令言語群しか存在せず、どの
時点でも又はコンテキストの変更時に、コンテキストに
対応する言語テンプレートがDSPメモリに能動的にロ
ードされるので、DSPは大規模なメモリを持つ必要が
なくなる。指令・制御音声認識エンジンのメモリ要件
は、大幅に緩和されるので効率的な演算が可能になる。
64キロバイトのメモリであれば、指令・制御ライブラ
リには十分で、これは現行のDSPのメモリ容量内にあ
る。DSPチップは、そのメモリ容量に関して言えば、
より健全なものとなるので、DSPメモリ内により多く
の又は全ての指令・制御言語用テンプレートを記憶する
ことが現実的且つ有効となる。このエンジン自体はカス
タマイズすることができるので、ユーザは動作を起こさ
せる口頭の指令を設定することができる。これにより、
音響的には同類のものであるが異なる指令となる言語に
関する問題を軽減することができる。例えば、音声学的
には同類のものであるが異なる結果をもたらす二つの指
令がある場合、同じ結果をもたらすように他の音声指令
に置換するか、又は、指令の適切なコンテキスト及び環
境群によって適切に応答させるようにすることができ
る。
【0024】連続音声処理に関しては、音声処理におい
てCPUを補助するためにDSPを使用することによっ
ても大きな利点がもたれされる。発話言語を表わすサン
プリングされたデジタルビットストリームを、符号化/
復合化装置(CODEC)のA/D変換器からCPUが
受信すると、CPUは、これらデジタルビットを文字群
又は部分的な言語を表わす音素又は音に変換した後、こ
の音の組み合わせを表わす最も確立の高い単語/文を見
付けなければならない。このビットストリームを音素に
変換するプロセスでは非常に集中的計算が行われるが、
汎用CPUの論理演算はこの種のプロセスに対し最適化
されていない。そこで、DSPチップは、ソフトウェア
利用の連続音声認識エンジンの前置プロセッサとしての
機能を果すこともできる。連続音声認識エンジン用の言
語辞書は非常に大きな容量を必要とするのに対してDS
Pのメモリ容量は限られているため、CPU及びソフト
ウェア利用の音声認識エンジンをバックエンド処理のた
めに使用する方が効率的である。DSPは、音声のビッ
トストリーム入力を受け、それを音素に変換して、ソフ
トウェア利用の音声認識エンジンと照合するためにCP
Uに送る。音素は、分割できない音の基本単位であり、
文字の単一音節の組み合わせのような言語を構成する。
通常はCPUで行われる上記事前処理により、CPUの
みによる従来の音声処理方法に比べ、CPUよって所定
数の言語を処理するのに必要とされる実行サイクルの総
数は大幅に減少される。膨大なFFT計算を必要とする
のは、ビットストリームから音素への変換である。そこ
で、電力効率の良いDSPチップが、現在CPUが行っ
ている作業の大半を行うことによってCPUの使用を軽
減し、音素を実際の単語や文に変換するのに必要なソフ
トウェア命令を処理する自由度即ち余裕をCPUに与え
る。これにより、次に、音声認識エンジンにより向上し
た精度、より高速のシステム性能、熱発生の減少、より
効率的な電力使用という形で現れる利点が生み出され
る。この新しいアーキテクチャの利点を最大に活かすた
めには、DSPに前置処理即ち事前処理させるような連
続音声処理用の新しいソフトウェア利用の音声認識エン
ジンの開発が必要となる。その代わりに、Via Vo
ice(登録商標)やNaturally Speak
ing(登録商標)等の市販されている連続音声認識エ
ンジンのソースコードを、現在CPUが行っている音声
の前置処理をDSPに行わせるように修正することも可
能である。
【0025】本発明の他の利点は、周囲の雑音をフィル
タにかけて低減する能力にある。DSPチップは、フィ
ルタリング及び雑音消去アルゴリズムを実行するのに適
しており、連続音声であるか指令・制御音声であるかに
係らず、音声を表わすデジタルビットストリームを受け
取って、雑音を取り除いて明瞭な音素に変換する。指令
・制御音声処理モードの場合には、DSPチップは、指
令を取り出してそれをCPUに送る。連続音声処理モー
ドの場合には、DSPチップは、ソフトウェア利用の音
声認識エンジンで処理するために、上記音素をCPUに
送る。音声から雑音を消去するこの能力により、本アー
キテクチャに基づくコンピュータのユーザは、高い周囲
雑音環境の中においても高い精度で作業することができ
るようになる。例えば、タービン発電施設で整備作業を
行う人でも、工具、ロボット、リベット打ち等の高雑音
の航空機の組み立てラインで作業を行う人でも、ほとん
ど又は全く性能低下しない状態で、音声駆動を使って正
確に彼らのコンピュータを制御することができる。この
点は、上記したような環境で利用され場合が多い音声駆
動の身体装着型コンピュータや手持型コンピュータにと
って特に有利であり、ユーザは、彼らの手を自由にした
状態でコンピュータ上の情報を見たりスクロールしたり
することができる。通常、この種の用途では、対話式電
子技術マニュアルを見ることがあるため、技術者は、整
備や組み立て作業をしながら、コンピュータ利用のエキ
スパートシステムによって、部品リストや概略図をスク
ロールしたり検索したりすることができる必要がある。
この種の操作は、しばしば、大きな即ち簡単には動かせ
ない設備部品や製品について行われることが多い。この
ように、技術者が、工場、発電所、組み立てライン等に
共通した高い周囲雑音環境において、コンピュータを操
作しマニュアルを通じての作業を継続できるとすれば、
技術者の身体装着型コンピュータの実用性を高めること
ができる。
【0026】本発明は、従来のPC、身体装着型PCの
双方にとっての他の大きな利点を持つ。つまり、DSP
は、文字を音声に変換するプロセスを容易に及び/又は
補助することができる点である。このプロセスは、文字
言語自体を音響スピーカに出力するために複合音素に分
解する必要があるため、音声認識の逆のプロセスとな
る。また、母板搭載のDSPを利用しているコンピュー
タが、身体装着型又は手持型の装置で、それが、無線モ
デム又はその他の通信装置のような無線通信能力を備え
ている場合、DSPは、音声駆動ダイヤル呼び出し、音
声制御、雑音低減、音声から信号への変換等の機能を助
長するため、音声及び指令のデジタル化のような移動電
話機能を処理することができる。
【0027】好ましい実施形態では、DSPが作動する
モード、即ち指令・制御音声処理モード又は連続音声処
理モード、を指定するための、ソフトウェアを利用した
制御が存在する。これは、いくらかある方法の一つによ
り行うことができる。一つは、ユーザは、システム起動
時又はシステムに電力が供給されている時のいずれか
に、ソフトウェア利用の制御を起動することにより上記
DSPのモードを設定する。このモードは、変更される
までデフォルトとして維持される。その代わりに、指令
・制御音声処理モード状態でシステムの電源をオンし、
ユーザが、ログインしてオペレーティングシステムを制
御し、特定のアプリケーションを選択することができる
ようにしてもよい。しかし、アプリケーションが呼び出
された時、それがワードプロセッサのように連続音声処
理を要求するアプリケーションの場合には、モードは自
動的に連続音声処理モードに変更される。アプリケーシ
ョンが実行されている最中に、ユーザがモードを変更で
きるモード割り込み指令を設定して使用することもでき
る。例えば、ユーザが自身のアプリケーションに文字を
口述記録させた後に、アプリケーションのプルダウンメ
ニューの使用を必要とするファイル保存又は他のタスク
を実行しようとする場合には、ユーザの発声する言語
は、単なる口述音声ではなく、指令として解釈される。
更に、アプリケーションの中には、アプリケーション呼
び出し時に、DSPのメモリにロードできる指令・制御
言語の特定用語をサポートできるものもある。例えば、
ウェブブラウザが呼び出された場合、標準的なブラウザ
機能を誘導したり実行したりするのに必要な全ての指令
がDSPのメモリにロードされる。本発明の全体として
の実用性は、オペレーティングシステムを制御するため
の基本的指令に加え、様々なアプリケーション特有の指
令を行い易くすることによって最適化される。
【0028】他の好ましい実施形態では、本発明を、自
然言語から他の言語にオンザフライ方式で翻訳し易くす
るために使用することができる。例えば、音声認識翻訳
プログラムを実行している人は、ある言語でコンピュー
タに発声し、音声をそのプログラムにより、文字入力又
は表示出力や音声出力のいずれかのための他の言語に翻
訳させることができる。DSPは、CPU及びソフトウ
ェア用の前置プロセッサとしての機能を果し、外国語に
関する事前処理を実行することができる。更に、特定の
方言を正常な状態に戻すために最適化された特別のフィ
ルタをDSPにロードして、音声入力をより正確に翻訳
することも可能である。この場合も、DSPのハードウ
ェア設計は、CPUよりもこのタスクを更に効率的に実
行することができるようにする。
【0029】他の好ましい実施形態では、本発明は、携
帯型コンピュータや通信装置のような他の演算装置に音
声を統合するために使用することができる。例えば、パ
ーソナルデジタルアシスタント(携帯用情報端末、PD
A)、パーソナル通信装置(即ち、インターネット形式
の情報を受信、表示可能な移動電話)、及びパームトッ
プ型又は手持型のコンピュータでも、本発明の利点を使
用することができる。本発明の開示事項を組み込むこと
により、これらの装置は、確実で大幅に電力効率を高め
た形態で音声制御を行うことができる。携帯型の演算・
通信装置は、通常、全電力をバッテリから取り出してい
るため、アプリケーション実行時に電力を効率的に使用
することは、最も重要性なことである。更に、これら形
式の装置におけるプロセッサは、通常、身体装着型コン
ピュータやデスクトップ型コンピュータのプロセッサの
能力はないので、それらは、最先端のCPUと比較し、
DSP機能を実行することは難しい状況にある。上記し
た全体的な実用性を向上するとともにユーザに対する便
利性をさせることも実現可能である。例えば、電話にお
いて、ユーザは、電話に対し数字を発声するか、或いは
人の名前を発声し、その音声をメモリに記憶された数字
とDSPによって照合することによって信号を得るよう
にして音声駆動呼び出しを容易に行うためにDSPを使
用することができる。PDAやパームトップ型コンピュ
ータでは、DSPは、電子メールプログラム又はウェブ
ブラウザの制御を円滑にするために使用でき、又は、オ
ペレーティングシステム自体を制御するために使用でき
る。ユーザは、タッチ画面、マウス又はその他の手動駆
動手段を利用することなく、単に指令を発声するだけで
電子メールのチェックをしたりブラウザを開いたりする
ことができる。
【0030】他の好ましい実施形態では、本発明の開示
事項を、手持型、身体装着型、或いは携帯型又は非携帯
型のゲーム用コンピュータにおける音声制御を円滑にす
るために使用することができる。母板上のDSPは、ユ
ーザが決定を行うためにボタンを押すことを必要とせ
ず、ゲーム機の音声制御を円滑にするために使用でき
る。その代わりに、手動制御と連携する形でDSPを使
用し、特定の決定を音声で行うことができるようにし
て、手動制御の複雑さを軽減することもできる。例え
ば、(動き、位置及び/又は行動がゲームをしている人
に制御されるような)キャラクターが、動きながら、且
つ、発砲又は投球といった手の行為を行うようなゲーム
を実行する場合、手動制御を動きのために使用するとと
もに、発砲、投球、又は武器の選択や弾の装填ような行
為を行わせるのに音声を使用することができる。これに
より、ゲームには更に現実的な次元が付加され、基本的
な指令により集中してユーザの手を使うことができる。
これを、10以上の異なる同時指令を行うことができる
ゲームコントローラを備えたソニー及び任天堂で製造さ
れているような最新ビデオゲームシステムに使用するこ
とは益々重要となる。これらの指令の一部を音声駆動と
することのより、必要とされる手の器用さのレベルは軽
減される。
【0031】本発明の例示的な実施形態をして図面を引
用する。図1は、代表的なコンピュータの母板1を示
す。母板は、パーソナルコンピュータの母板、移動用コ
ンピュータの母板、演算・通信用装置の母板、又はその
他の電子的演算装置の母板とすることができる。この母
板は、通常、CPU、メモリ、データバス、電力インタ
ーフェース、入出力(I/O)インターフェース、ビデ
オ出力部、音声出力部、及びオプション用入力部のよう
な基本的システムコンポーネントを備える。図2は、音
声入力を受信することができるパーソナルコンピュータ
の代表的なシステムレベルの実施例を示す。このコンピ
ュータシステムは、表示装置10、CPUボックス9、
キーボード11、マウス12、及びマイクロフォン8を
備える。マイクロフォン8は、全てのアプリケーション
について、コンピュータへの直接的音声入力源としての
機能を果す。
【0032】図3は、本発明における音声入力の機能的
流れ図を示す。音声は、マイクロフォン入力13からシ
ステムに入力され、この音声は、電気信号に変換され
る。次に、データ経路は、この信号をCODEC14又
はこの信号をアナログ・デジタル(A/D)変換するチ
ップに導く。次に、このデジタル信号は、DSP15に
処理のため移動する。この時点で、システムは、DSP
が指令・制御(C&C)音声処理モードで動作している
か、又は連続音声処理モードで動作しているかについて
の判定状態16に入る。DSPがC&C音声処理モード
にある場合、実際の指令がステップ17で取り出された
後、処理のためにCPU19に送られる。しかし、DS
P15が連続音声処理モードで動作している場合には、
DSPはデジタル信号をステップ18で音素に変換した
後、ソフトウェア利用の音声認識エンジンと協力してこ
れら音素を処理するためにCPU19に送る。
【0033】図4は、音声を表す信号を受信した時にD
SPに起こるプロセスの流れ図を示す。音声信号20
は、連続音声処理モード又はC&C音声処理モードのい
ずれかに設定されているDSP15に入力される。連続
音声処理モードにある場合、信号はフィルタにかけら
れ、雑音は全てステップ24で取り除かれる。このプロ
セスは、音声についての特定の物理的環境やコンテキス
トに応じて変更することができる。次にステップ25
で、信号は音素に変換され、ステップ26で、CPU及
びソフトウェア利用の音声認識エンジンによる認識のた
めにCPUに送られる。DSPがC&C音声処理モード
に設定されている場合、ステップ21で、信号は同じく
フィルタにかけられ雑音が消去される。これも同様に、
周囲の雑音環境や制御ライブラリの形式に応じて最適化
することができる。次にステップ22で、この指令を表
す明瞭な信号は、DSPによりアクセス可能なメモリに
記憶された信号とDSPによって照合される。指令が取
り出されると、ステップ23で、その指令はCPUへ送
られる。
【0034】図5は、移動用コンピュータシステムにお
ける母板搭載DSPの例示的実施例を示す。素子103
は、TMS5000シリーズのDSPチップである。素
子103は、音声入力部101、CODEC102、C
PU108、及び統合Intel82443MX100
N&Sブリッジ105との間のブリッジとしてシステム
母板に統合されている。DSP103とパラレルPCI
バス106との間の通信は、DSP103の出力信号を
バス106に接続することを可能とするTIPCI20
40PCT・DSP ブリッジチップ104によって円
滑にされる。本例におけるCPU108は、Intel
社製の600MHzの移動用Pentium(登録商
標)チップである。しかしながら、当業者であれば、適
切なものであればコンピュータCPUであれば、本発明
の思想又は範囲を逸脱することなく如何なるCPUに置
換可能であることは理解される所であろう。本例におい
ては、ユーザインターフェースPCB100が示されて
いる。これには、ユーザインターフェースポート10
1、USBポート110、1394ポート111、及び
表示装置・ポート109のような代表的ないくつかの入
出力のインターフェースが含まれている。
【0035】指令・制御音声処理又は連続音声処理のた
めの代表的なデータストリーム経路は、以下のようにな
る。音声が、アナログ音声入力部101を介して標準的
アナログマイクロフォンから入力さる、つまり、音声
は、ユーザインターフェースポート101から入力され
る。アナログ音声信号は、CODEC102に移され、
アナログ・デジタル(A/D)変換器がこれをデジタル
ビットストリームに変える。次に、このビットストリー
ムは、DSPチップ103に移される。DSP103は
「浄化」するために必要な機能を実行するとともに、音
声を音素に加工処理する。コンピュータが指令・制御音
声処理モードにある場合、DSP103は、内部の音声
認識エンジンを使用して音声音素を実際の指令と関連付
ける。連続音声処理モードにある場合は、単に音声を音
素に変換するだけである。次のステップでは、CPU1
08によって実行される指令即ち一連の音素の出力を、
データパスを介してCPU108に渡し、出力がCPU
108によって処理されるようにする。これは、出力を
PCIバス106と互換性のあるビット状フォーマット
に変換するDSP・PCIブリッジチップ104を介し
てこの出力の経路付けることにより行われる。次に、こ
の出力は、CPU108と直接通信するためのInte
l82443MX100 105を介して経路付けられ
る。この出力が指令・制御信号であれば、指令はCPU
108によって実行される。CPU108は、この時点
まで音声処理に関してはアイドル状態にある。それが連
続音声処理の場合と同様に、この出力が音素ストリーム
である場合は、CPU108は、音声認識のソフトウェ
ア利用の音声認識エンジンを呼び出して音素を処理し、
その音声に関連するアプリケーションが何の目的のもの
でもそれらを文字に変換する。当業者であれば、この物
理的な実施形態は例示目的のためにだけ示されたもので
あり、本発明自体は、音声入力データパスにあるDSP
を、連続音声認識エンジン及び指令・制御音声認識エン
ジン、及び/又は連続音声処理のための前置プロセッサ
として使用し、メニュー選択又は移動電話の指令・制御
を処理・円滑化し且つ文字を音声に変換するのを円滑化
するという本発明の基本的概念が存在する限り、形態に
係わりなく全てのコンピュータ母板に適用でき、更に、
本発明の思想又は範囲を逸脱することなく、種々の置換
及び変更が可能であることは理解される所であろう。
【0036】本明細書に述べられた本発明の好ましい実
施形態及び最適に好ましい実施形態は、本発明の根本的
な原理を例示するものであり、本発明の思想及び範囲を
逸脱することなく、多くの修正や変更が可能であること
は理解される所であろう。
【図面の簡単な説明】
【図1】代表的システムコンポーネントを備える代表的
なコンピュータ即ち演算装置の母板を示す図である。
【図2】音声入力源としてのマイクロフォンを備える代
表的パーソナルコンピュータを示す図である。
【図3】演算装置への音声入力に関する本発明のプロセ
スを流れ図で示す図である。
【図4】連続音声処理モード及び指令・制御音声処理モ
ードの双方の流れ図及び決定ツリーを示す図である。
【図5】母板の回路設計とデータ経路とに統合されたD
SPを備える身体装着型コンピュータの一例の母板を示
す図である。
【符号の説明】
1 母板 2 CPU 3 メモリ 4 入出力インターフェース 5 電力インターフェース 6: ビデオ出力部 7: メモリ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 21/02 G10L 9/18 301B

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 CPU、データバス、電力インターフェ
    ース、及び音声入力データ経路を含む代表的コンポーネ
    ントを有するコンピュータ母板を備え、前記音声入力デ
    ータ経路は、前記母板の音声入力部を前記CPUに接続
    しており、更に 前記音声入力データ経路内にあるDSPチップと、 前記DSPチップと前記コンピュータ母板上のデータバ
    スとの間を接続するPCI・DSPブリッジと、 前記DSPチップに電気的に接続されたメモリと、 前記DSPチップの前記メモリにある指令・制御音声認
    識エンジンとを備えたことを特徴とするコンピュータ母
    板アーキテクチャ。
  2. 【請求項2】 前記DSPは、全ての音声入力に対し、
    前記CPUによる命令の実行に先立って音声入力を処理
    するプリプロセッサとしての機能を果すことを特徴とす
    る請求項1に記載のコンピュータ母板アーキテクチャ。
  3. 【請求項3】 前記DSPが、連続音声処理モード又は
    指令・制御音声処理モードのいずれかに、ユーザによっ
    て動的に設定されるようにしたことを特徴とする請求項
    1に記載のコンピュータ母板アーキテクチャ。
  4. 【請求項4】 前記音声入力データ経路は、マイクロフ
    ォン入力部と、前記音声入力データ経路の音声入力をデ
    ジタル化する手段と、DSPチップと、前記データバス
    に接続したPCI・DSPブリッジチップを備えたこと
    を特徴とする請求項1に記載のコンピュータ母板アーキ
    テクチャ。
  5. 【請求項5】 前記DSPチップが、前記音声入力を音
    素に変換するようにしたことを特徴とする請求項1に記
    載のコンピュータ母板アーキテクチャ。
  6. 【請求項6】 前記音声認識エンジンは、特定の命令又
    はコンテキストの環境に関連付けられた音声言語の用語
    群を含むことを特徴とする請求項1に記載のコンピュー
    タ母板アーキテクチャ。
  7. 【請求項7】 前記音声言語の用語群は、前記DSPチ
    ップの前記メモリにあることを特徴とする請求項6に記
    載のコンピュータ母板アーキテクチャ。
  8. 【請求項8】 前記音声言語の用語群が、静的又は動的
    モードのいずれかにおいて、ユーザによって設定できる
    ことを特徴とする請求項6に記載のコンピュータ母板ア
    ーキテクチャ。
  9. 【請求項9】 前記音声言語の用語群が、ホストプロセ
    ッサで実行されているアプリケーションのコンテキスト
    に基づいて、前記CPUによって更新されることを特徴
    とする請求項1に記載のコンピュータ母板アーキテクチ
    ャ。
  10. 【請求項10】 前記DSPチップが、コンピュータ上
    の所定場所にあるソフトウェア利用の音声認識エンジン
    に対して事前処理を実行するようにしたことを特徴とす
    る請求項1に記載のコンピュータ母板アーキテクチャ。
  11. 【請求項11】 前記DSPチップが、音声起動呼び出
    し、音声制御、雑音消去、音声の信号への変換を含む、
    移動電話の音声機能のようなメニュー選択を実行するよ
    うにしたことを特徴とする請求項1に記載のコンピュー
    タ母板アーキテクチャ。
  12. 【請求項12】 前記DSPチップが、雑音消去機能を
    実行するようにしたことを特徴とする請求項1に記載の
    コンピュータ母板アーキテクチャ。
  13. 【請求項13】 前記DSPチップが、指令・制御音声
    処理モードで機能するようにしたことを特徴とする請求
    項1に記載のコンピュータ母板アーキテクチャ。
  14. 【請求項14】 前記DSPチップが、連続音声処理モ
    ードで機能するようにしたことを特徴とする請求項1に
    記載のコンピュータ母板アーキテクチャ。
  15. 【請求項15】 前記DSPチップが、移動電話モード
    で機能するようにしたことを特徴とする請求項1に記載
    のコンピュータ母板アーキテクチャ。
  16. 【請求項16】 前記DSPが、言語翻訳モードで機能
    するようにしたことを特徴とする請求項1に記載のコン
    ピュータ母板アーキテクチャ。
  17. 【請求項17】 前記コンピュータ母板は、ユーザ支持
    型コンピュータの母板であることを特徴とする請求項1
    に記載のコンピュータ母板アーキテクチャ。
  18. 【請求項18】 前記ユーザ支持型コンピュータは、音
    声駆動のユーザ支持型コンピュータであることを特徴と
    する請求項17に記載のコンピュータ母板アーキテクチ
    ャ。
  19. 【請求項19】 前記コンピュータ母板は、携帯型コン
    ピュータの母板であることを特徴とする請求項1に記載
    のコンピュータ母板アーキテクチャ。
  20. 【請求項20】 前記コンピュータ母板は、パーソナル
    デジタルアシスタントの母板であることを特徴とする請
    求項1に記載のコンピュータ母板アーキテクチャ。
  21. 【請求項21】 前記コンピュータ母板は、デスクトッ
    プ型コンピュータの母板であることを特徴とする請求項
    1に記載のコンピュータ母板アーキテクチャ。
  22. 【請求項22】 前記コンピュータ母板は、手持型コン
    ピュータの母板であることを特徴とする請求項1に記載
    のコンピュータ母板アーキテクチャ。
  23. 【請求項23】 前記コンピュータ母板は、ビデオゲー
    ムシステム用コンピュータの母板であることを特徴とす
    る請求項1に記載のコンピュータ母板アーキテクチャ。
  24. 【請求項24】 前記コンピュータ母板は、演算・通信
    装置のコンピュータの母板であることを特徴とする請求
    項1に記載のコンピュータ母板アーキテクチャ。
  25. 【請求項25】 前記コンピュータ母板は、ユーザ支持
    型コンピュータ、ラップトップ型コンピュータ、デスク
    トップ型コンピュータ、携帯型コンピュータ、及びそれ
    らの組み合わせから成るグループから選択されたものの
    コンポーネントであることを特徴とする請求項1に記載
    のコンピュータ母板アーキテクチャ。
  26. 【請求項26】 前記コンピュータ母板は、セル方式携
    帯電話、無線電話、携帯型コンピュータ、有線又は無線
    の通信手段、及びそれらの組み合わせから成るグループ
    から選択されたもののコンポーネントであることを特徴
    とする請求項1に記載のコンピュータ母板アーキテクチ
    ャ。
  27. 【請求項27】 コンピュータにおいて音声処理する方
    法であって、 指令・制御音声処理モードを指定する段階、 連続音声処理モードを指定する段階、 DSPチップを母板上で音声入力データ経路に設ける段
    階、 DSP・PCIブリッジチップ又はそれと等価の回路
    を、前記DSPチップの後に直列に設けて前記コンピュ
    ータのPCIバスと接続する段階、 前記音声入力データ経路を介して音声入力を受け取る段
    階、 前記指令・制御音声処理モードにある場合には、前記D
    SPチップは、前記音声入力を音素に変換するとともに
    前記音素を前記DSPチップのメモリに記憶された指令
    と照合してCPU命令を生成する段階、 前記連続音声処理モードにある場合には、前記DSPチ
    ップは、前記音声入力を音素に変換する段階、及び前記
    DSP・PCIブリッジチップ又はそれと等価の前記母
    板上の経路を介して、前記命令又は前記音素をCPUに
    移す段階を含むことを特徴とする方法。
  28. 【請求項28】 音声処理するために最適化されたコン
    ピュータ母板アーキテクチャであって、 マイクロプロセッサと、 バスと、 DSPチップと、 前記DSPチップに直列接続され、前記DSPからの出
    力を前記マイクロプロセッサに伝えるDSP・PCIブ
    リッジチップと、 前記DSPチップ内の又は前記DSPチップにアクセス
    可能なメモリと、 前記DSPチップのメモリにある指令・制御音声認識エ
    ンジンとを備えたことを特徴とする母板。
  29. 【請求項29】 音声処理するために最適化されたコン
    ピュータ母板アーキテクチャであって、 マイクロプロセッサ手段と、 バスと、 デジタル信号処理手段と、 前記デジタル信号処理手段と前記マイクロプロセッサ手
    段との間の通信のための手段と、 指令・制御音声認識エンジンを記憶するために、前記デ
    ジタル信号処理手段にアクセス可能なメモリ手段と、 前記デジタル信号処理手段の指令・制御音声処理モード
    又は連続音声処理モードのいずれかをユーザが指定する
    ための制御手段と、 音声入力・デジタル化手段と、を備えたことを特徴とす
    るコンピュータ母板アーキテクチャ。
  30. 【請求項30】 前記制御手段は、前記母板と電気的に
    接続された記憶装置内にありユーザによって制御される
    ようにしたコンピュータソフトウェアプログラムを含む
    ことを特徴とする請求項29に記載のコンピュータ母板
    アーキテクチャ。
JP2001212688A 2000-10-02 2001-07-12 音声処理装置及び方法 Expired - Fee Related JP4132737B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US677569 1984-12-03
US09/677,569 US7162426B1 (en) 2000-10-02 2000-10-02 Computer motherboard architecture with integrated DSP for continuous and command and control speech processing

Publications (2)

Publication Number Publication Date
JP2002132285A true JP2002132285A (ja) 2002-05-09
JP4132737B2 JP4132737B2 (ja) 2008-08-13

Family

ID=24719254

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001212688A Expired - Fee Related JP4132737B2 (ja) 2000-10-02 2001-07-12 音声処理装置及び方法

Country Status (9)

Country Link
US (1) US7162426B1 (ja)
EP (1) EP1193690B1 (ja)
JP (1) JP4132737B2 (ja)
KR (1) KR20020026804A (ja)
AT (1) ATE265730T1 (ja)
DE (1) DE60102993T2 (ja)
ES (1) ES2220630T3 (ja)
PT (1) PT1193690E (ja)
TW (1) TW541470B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100554249B1 (ko) 2004-07-06 2006-02-24 주식회사 현대오토넷 Mgt5200의 psc포트를 이용한 외부소자 인터페이스장치
JP2015520409A (ja) * 2012-04-26 2015-07-16 ニュアンス コミュニケーションズ,インコーポレイテッド ユーザ定義可能な制約条件を有する省スペースの音声認識を構築する為の埋め込みシステム
JP2021110945A (ja) * 2020-01-03 2021-08-02 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スマートオーディオ装置、方法、電子デバイスおよびコンピュータ可読媒体

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7774202B2 (en) * 2006-06-12 2010-08-10 Lockheed Martin Corporation Speech activated control system and related methods
US9256396B2 (en) * 2011-10-10 2016-02-09 Microsoft Technology Licensing, Llc Speech recognition for context switching
TWI577193B (zh) * 2015-03-19 2017-04-01 陳光超 耳膜助聽器
US20220097960A1 (en) * 2015-09-16 2022-03-31 Simplehuman, Llc Containers with multiple sensors
KR102081335B1 (ko) 2018-06-25 2020-02-25 주식회사 소비코프로페셔널 듀얼코어를 이용한 디지털 오디오 시스템 및 그 제어 방법
US10983842B2 (en) 2019-07-08 2021-04-20 Microsoft Technology Licensing, Llc Digital signal processing plug-in implementation
JP7410684B2 (ja) * 2019-10-21 2024-01-10 シャープ株式会社 マイクシステム
CN111261169A (zh) * 2020-01-08 2020-06-09 上海齐网网络科技有限公司 基于多路数据处理器的语音识别芯片
CN112164389B (zh) * 2020-09-18 2023-06-02 国营芜湖机械厂 一种多模式语音识别送话装置及其控制方法
US20220091707A1 (en) 2020-09-21 2022-03-24 MBTE Holdings Sweden AB Providing enhanced functionality in an interactive electronic technical manual
US20220261530A1 (en) 2021-02-18 2022-08-18 MBTE Holdings Sweden AB Providing enhanced functionality in an interactive electronic technical manual
US11445148B1 (en) 2021-05-06 2022-09-13 Microsoft Technology Licensing, Llc Video teleconference curated user profile picture
US11947906B2 (en) 2021-05-19 2024-04-02 MBTE Holdings Sweden AB Providing enhanced functionality in an interactive electronic technical manual

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR890016480A (ko) * 1988-04-27 1989-11-29 안시환 실시간 음성인식 보드장치
US6230255B1 (en) 1990-07-06 2001-05-08 Advanced Micro Devices, Inc. Communications processor for voice band telecommunications
JP2662120B2 (ja) * 1991-10-01 1997-10-08 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声認識装置および音声認識用処理ユニット
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
IT1256823B (it) * 1992-05-14 1995-12-21 Olivetti & Co Spa Calcolatore portatile con annotazioni verbali.
US5915236A (en) 1992-11-13 1999-06-22 Dragon Systems, Inc. Word recognition system which alters code executed as a function of available computational resources
KR970005830B1 (ko) * 1993-12-27 1997-04-21 재단법인 한국전자통신연구소 오디오 코덱 보드
US5640490A (en) * 1994-11-14 1997-06-17 Fonix Corporation User independent, real-time speech recognition system and method
JPH09114543A (ja) 1995-10-02 1997-05-02 Xybernaut Corp ハンドフリーコンピュータ装置
TW439380B (en) * 1995-10-09 2001-06-07 Hitachi Ltd Terminal apparatus
US5754807A (en) * 1995-11-20 1998-05-19 Advanced Micro Devices, Inc. Computer system including a multimedia bus which utilizes a separate local expansion bus for addressing and control cycles
US5794164A (en) * 1995-11-29 1998-08-11 Microsoft Corporation Vehicle computer system
US5797043A (en) * 1996-03-13 1998-08-18 Diamond Multimedia Systems, Inc. System for managing the transfer of data between FIFOs within pool memory and peripherals being programmable with identifications of the FIFOs
US6085314A (en) 1996-03-18 2000-07-04 Advnced Micro Devices, Inc. Central processing unit including APX and DSP cores and including selectable APX and DSP execution modes
US5794068A (en) 1996-03-18 1998-08-11 Advanced Micro Devices, Inc. CPU with DSP having function preprocessor that converts instruction sequences intended to perform DSP function into DSP function identifier
US5987590A (en) 1996-04-02 1999-11-16 Texas Instruments Incorporated PC circuits, systems and methods
US6182203B1 (en) * 1997-01-24 2001-01-30 Texas Instruments Incorporated Microprocessor
US6324592B1 (en) * 1997-02-25 2001-11-27 Keystone Aerospace Apparatus and method for a mobile computer architecture and input/output management system
US5983073A (en) * 1997-04-04 1999-11-09 Ditzik; Richard J. Modular notebook and PDA computer systems for personal computing and wireless communications
JP4067063B2 (ja) 1997-11-14 2008-03-26 松下電器産業株式会社 マイクロプロセッサ
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6330247B1 (en) * 1999-02-08 2001-12-11 Qualcomm Incorporated Communication protocol between a communication device and an external accessory
US6233557B1 (en) * 1999-02-23 2001-05-15 Motorola, Inc. Method of selectively assigning a penalty to a probability associated with a voice recognition system
US6275806B1 (en) * 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
US6192340B1 (en) * 1999-10-19 2001-02-20 Max Abecassis Integration of music from a personal library with real-time information
KR100316696B1 (ko) * 1999-11-12 2001-12-12 송문섭 Imt-2000 단말기용 플랫폼 보드

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100554249B1 (ko) 2004-07-06 2006-02-24 주식회사 현대오토넷 Mgt5200의 psc포트를 이용한 외부소자 인터페이스장치
JP2015520409A (ja) * 2012-04-26 2015-07-16 ニュアンス コミュニケーションズ,インコーポレイテッド ユーザ定義可能な制約条件を有する省スペースの音声認識を構築する為の埋め込みシステム
JP2021110945A (ja) * 2020-01-03 2021-08-02 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スマートオーディオ装置、方法、電子デバイスおよびコンピュータ可読媒体

Also Published As

Publication number Publication date
PT1193690E (pt) 2004-09-30
DE60102993T2 (de) 2005-05-04
TW541470B (en) 2003-07-11
JP4132737B2 (ja) 2008-08-13
KR20020026804A (ko) 2002-04-12
US7162426B1 (en) 2007-01-09
DE60102993D1 (de) 2004-06-03
EP1193690A1 (en) 2002-04-03
EP1193690B1 (en) 2004-04-28
ATE265730T1 (de) 2004-05-15
ES2220630T3 (es) 2004-12-16

Similar Documents

Publication Publication Date Title
JP4132737B2 (ja) 音声処理装置及び方法
JP6285914B2 (ja) ユーザ定義可能な制約条件を有する省スペースの音声認識を構築する為の埋め込みシステム
US7010490B2 (en) Method, system, and apparatus for limiting available selections in a speech recognition system
US6748361B1 (en) Personal speech assistant supporting a dialog manager
US7624018B2 (en) Speech recognition using categories and speech prefixing
WO2004036939A1 (fr) Appareil de communication mobile numerique portable, procede de commande vocale et systeme
CN101008942A (zh) 机器翻译装置和机器翻译方法
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
WO2019169722A1 (zh) 快捷键识别方法、装置、设备以及计算机可读存储介质
EP1374228B1 (en) Method and processor system for processing of an audio signal
CN111345016A (zh) 一种智能终端的启动控制方法及启动控制系统
Zhou et al. Two-way speech-to-speech translation on handheld devices.
CN100380442C (zh) 利用优化音素集进行普通话语音识别的系统和方法
EP1213639A1 (en) Wearable computer system
JP2003058538A (ja) 文章解析方法とその方法を利用可能な文章解析装置
Kao et al. A low cost dynamic vocabulary speech recognizer on a GPP-DSP system
Liu et al. English speech recognition system on chip
JP2003202890A5 (ja)
Hemphill et al. Developing web-based speech applications
Dabre et al. A Framework for System Interfacing of Voice User Interface for Personal Computers
Nouza et al. Very large vocabulary voice dictation for mobile devices
Sertsi et al. Offline Thai speech recognition framework on mobile device
Delaney Reduced energy consumption and improved accuracy for distributed speech recognition in wireless environments
CN118155604A (zh) 语音识别方法、系统、装置、车辆、电子设备和存储介质
Chang et al. Real-time implementation of speech recognition using RISC processor core

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080502

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130606

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees