TW541470B - Computer motherboard architecture with integrated DSP for continuous and command and control speech processing - Google Patents
Computer motherboard architecture with integrated DSP for continuous and command and control speech processing Download PDFInfo
- Publication number
- TW541470B TW541470B TW090118073A TW90118073A TW541470B TW 541470 B TW541470 B TW 541470B TW 090118073 A TW090118073 A TW 090118073A TW 90118073 A TW90118073 A TW 90118073A TW 541470 B TW541470 B TW 541470B
- Authority
- TW
- Taiwan
- Prior art keywords
- computer motherboard
- computer
- patent application
- scope
- dsp
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 5
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 11
- 230000002079 cooperative effect Effects 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000013519 translation Methods 0.000 claims description 2
- 244000061176 Nicotiana tabacum Species 0.000 claims 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims 1
- 230000003068 static effect Effects 0.000 claims 1
- 238000013461 design Methods 0.000 abstract description 7
- 238000004364 calculation method Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000013256 coordination polymer Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- LAXBNTIAOJWAOP-UHFFFAOYSA-N 2-chlorobiphenyl Chemical compound ClC1=CC=CC=C1C1=CC=CC=C1 LAXBNTIAOJWAOP-UHFFFAOYSA-N 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- 101710149812 Pyruvate carboxylase 1 Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000020169 heat generation Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
- Stored Programmes (AREA)
- Mobile Radio Communication Systems (AREA)
- Hardware Redundancy (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
541470 A7 B7 五、發明説明(3 ) 先進技術的重大進步。 (請先閲讀背面之注意事項再填寫本頁) 近年來,已使用數位信號處理器(後文中稱爲D S P )晶片處理自然語音。此例之一是客戶服務電話系統,藉 著呼叫者說出他們的輸入,如同在與電話結爲一體的鍵盤 上鍵入數字。D S P整合在樹狀的電話系統中。當系統接 收到代表所說文字的信號時,D S P執行與代表已知字之 已知信號間的匹配,並將此資料輸入。不過,這些系統一 般只限於數字的辨識,並不適用於消費者導向的產品。 D S P基本上是一通用的微處理器,它可應用到各種 特殊用途。它包括特殊的邏輯硬體用以執行數學功能,它 的速率、耗電水準及效率通常與微處理器無關。這些晶片 可被規劃以執行各種信號處理功能。有許多商用的P C擴 充卡中都包括DSP,且通常有軟體應用程式規劃它們以 執行信號處理功能。由於它們的硬體及架構,通常它們較 適合執行某些計算密集的功能。 經濟部智慧財產局員工消費合作社印製 典型上,D S P的設計特別適合數學演算,如相關、 捲積、有限脈衝響應(F I R )濾波器、無限脈衝響應( I I R )濾波器、快速傅利葉轉換(F F T )、矩陣計算 、以及其它運算間的內積。這些數學演算的實施通常包括 很長的對稱算術/乘法運算序列。語苜的處理特別需要用 到F F T及濾波器。 C P U通常包括執行單元、快取記憶體、記憶體管理 單元、浮點單元及其它邏輯。通用c P U的工作是執行碼 及執行電腦記憶體中之資料的運算,因此而管理電腦平台 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -6 - 541470 A7 B7 五、發明説明(4 ) 。一般言之,基本的X8 6或其它型式的電腦CPU,其 設計主要是用來執行布林/管理/資料操作判斷運算。 (請先閲讀背面之注意事項再填寫本頁) 通用C P U執行的指令包括基本的數學功能。不過, 這些功能並不非常適合複雜的D S P -類型的數學運算。 因此,相較於D S P,通用的C P U需要執行大量的指令 才能執行非常基本的D S P功能。 經濟部智慧財產局員工消費合作社印製 在習知技術中,無論是硬體或軟體,都曾經嘗試過將 D S P結合到P C的架構中,以利用與其相關的效率。美 國專利5,7 9 4,0 6 8 (後文中稱爲’ 〇 6 8專利)即 是一例。在’0 6 8專利中,揭示一種通用的CPU,它包 含通用的C P U單元,如X 8 6核心,也包括D S P核心 。C P U還包括D S P功能解碼器或預處理器,它檢查指 令序列以決定是否要執行D S P功能。如果解碼器決定所 要執行的是D S P功能,功能解碼器即將指令序列轉換成 D S P巨集,並將巨集路由到D S P核心。D S P核心可 在通用C P U核心執行其它運算之時平行執行D S p功能 。此設計確保可與需要與不需要執行D S P運算之現有的 套裝軟體逆相容。不過,由於有預處理器,在執行周期中 引進了額外的步驟。’ 0 6 8專利的缺點是在執行命令前必 須先解碼檢查D S P指令的命令。’ 〇 6 8專利之系統的另 一缺點是此架構並不適合處理語音,且並未教導將命令與 控制的語音引擎包括到D S P晶片本身內部。此外, D S P也非做爲來自電腦之聲音輸入之所有語音輸入信號 的主要介面。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 541470 A7 B7 五、發明説明(6 ) 本發明還有另一目的是提供一種硬體架構,它最適合 處理語音。 (請先閱讀背面之注意事項再填寫本頁) 本發明進一步的目的是提供一種電腦架構,它所提供 的精確度與能力優於現有的軟體式語音處理法。 本發明還有另一目的是提供一種用於p c的主機板架 構,特別是用於行動、手持及佩帶式P C及其它電子裝置 ,它可減少以C P U處理語音所需的周期數量。 本發明還有另一目的是提供行動、手持及佩帶式電腦 一種語音處理設計,可降低語音處理期間的電力消耗及所 產生的熱。 本發明還有另一目的是提供一種架構,它可在處理語 音時消除及減少雜訊。 本發明還有另一目的是提供一種內嵌D S P的語音引 擎,它具有命令與控制語音之語彙個人化的能力。 本發明所揭示的這些及其它目的一般可經由電腦主機 板的設計達成,其中,將D S P硬體結合到主機板中,做 爲聲音輸入與微處理器間的介面,用以辨識及處理語音命 經濟部智慧財產局員工消費合作社印製 令 明I 說 單 簡 式 圖 的 置 裝 算 計 或 腦 電 型 典 之 件 組 統 系 型 典 有 具 明 說 1—- ο 圖板 機 主 電 人 個 型 典 的 源 音 之 入 輸 音 聲 爲 做 風 克 麥 以 明 說 2 圖 腦 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -9- 541470 A7 B7 五、發明説明(7 ) 圖3說明本發明有關語音輸入到電腦裝置之方法的流 程圖。 圖4說明連續語音模式及命令與控制語音模式的流程 圖及樹狀決策圖。 圖5說明例示性的佩帶式電腦主機板,在電路設計及 主機板的資料路徑中整合了 D S P。 元件表 1 主機板 2 中央處理單元 3 記憶體 4 輸入/輸出 5 電源介面 6 視訊輸出 7 記憶體 8 麥克風 9 C P U 盒 10 顯示器 11 鍵盤 12 滑鼠 13 麥克風輸入 14 編碼解碼器 15 數位信號處理器 2 0 語音信號 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X 297公釐) (請先閲讀背面之注意事項再填寫本頁) 衣. — 經濟部智慧財產局員工消費合作社印製 -10- A7 ____ _ B7 2 0 0 行 動 電 腦 系 統 主 機 板 1 〇 1 成 音 輸 入 1 〇 2 編 碼 解 碼 器 1 0 8 中 央 處 理 單 元 1 〇 3 數 位 信 號 處 理 晶 片 1 0 6 P C I 匯 流 排 1 〇 0 使 用 者 介 面 印 刷 電 路板 1 1 0 U S B 埠 1 1 1 1 3 9 4 璋 1 0 9 顯 示 器 埠 541470 五、發明説明(8 ) (請先閲讀背面之注意事項再填寫本頁) 發明詳細說明 經濟部智慧財產局員工消費合作社印製 基於本說明書及申請專利範圍的目的,”電腦主機板 ”一詞將包括任何個人電腦、佩帶式電腦、可攜式電腦、 膝上型電腦、計算與通信裝置的組合、或掌上型電腦所使 用的主機板。基本上,本發明是一創新的電腦主機板架構 ,它在主機板中結合了 D S P硬體,做爲音效卡或類似聲 音輸入裝置與微處理器間的介面。它可解決目前語音處理 架構的若干問題。在聲音資料輸入流中結合D S P將可大 幅提升目前語音處理架構的能力,且使用微處理器對語音 的處理減至最少。目前處理語音的方法是使用C P U及軟 體式引擎(如 ViaVoice®及 Naturally Speaking®),問題是 微處理器並不適合執行處理語音所需的大量快速傅利葉轉 換(後文中稱爲F F T )。此導致處理器被大量使用,消 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -11 - 541470 A7 —_ B7 五、發明説明(1〇 ) (請先閲讀背面之注意事項再填寫本頁) 確地使用聲音操作這些裝置,而不需要或額外需要使用人 工或點選的裝置操作。此外,由於D s p所消耗的電力比 CPU低,因此,裝置之電池的可用壽命也大幅延長。在 桌上型的環境中,更有效率的語音處理以及釋放c P U之 時計周期的益處也將得以實現。 經濟部智慧財產局員工消費合作社印製 有關於電腦的語音處理基本上可分成兩類:第一類是 命令與控制,第二類是連續語音。命令與控制的語音是字 詞,它用來控制作業系統或在特定的應用軟體中導覽。這 些字詞或片語可以個人化並鏈結到特定的命令。諸如”開 啓視窗”或”下捲”等片語是命令與控制的語音範例。這 些字詞通常是選擇自有限的或經過劃分的字彙組,其中, 每一字詞與電腦的某特定命令鏈結在一起。目前,此項處 理是由軟體式的語音引擎及CPU處理。不過,DSP有 能力做爲這些命令與控制字詞或片語的語音引擎。這些語 音引擎本身即常駐在D S P晶片內的記憶體中。這將允許 對語音的解釋及處理完全由D S P處理,根本不需要用到 C P U。合法字詞的命令字詞範本可常駐在D S P上的記 憶體中,或者,也可根據上下文意及應用軟體允許各種不 同的控制命令庫從主C P U載入到D S P的記憶體中,視 所使用的應用軟體而定。按此方式,DSP就不需要大量 的記憶體,因爲在某一時間,只需將有限的命令字詞組及 與文意相關的文字範本載入D S P的記憶體。容許命令與 控制語音引擎有效率操作所需的記憶體將可大幅減少。 6 4 k b的記憶體足夠命令與控制庫使用,正好是目前 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -13- 541470 A7 B7 __ 五、發明説明(11 ) (請先閱讀背面之注意事項再填寫本頁) D S P內的記憶體容量。當D S P晶片的記憶體容量變得 更健全,它可變得更實用,且可更有效率地將更多或所有 的命令及控制字詞範本儲存到D S P的記憶體中。引擎本 身可個人化以便使用者可以定義能有效動作的言辭命令。 此將減少聲音相同但命令效果不同之字的問題。例如,如 果有兩個發音相同但產生不同結果的命令,可以使用聲音 不同但能產生相同結果的命令取代。 經濟部智慧財產局員工消費合作社印製 至於連續語音處理,使用D S P輔助C P U處理語音 也能獲致重大優點。當C P U接收到來自編碼解碼器之A / D轉換器代表言語的數位取樣位元流時,它必須將它們 轉換成代表字母群組或部分字的音位(phoneme )或聲音 ,並接著找到最可能代表該些聲音組合的字/句。將位元 流轉換成音位的處理需要極密集的計算,通用C P U的邏 輯並不適合此類的處理。D S P晶片也可做爲軟體式連續 語音引擎的前端處理器。由於連續語音引擎的字典非常龐 大,且D S P的記憶體容量有限,使用C p υ及軟體式語 音引擎做爲後端處理將更有效率。D S P取得語音的位元 流輸入,並將其轉換成音位,傳遞給C P U與軟體式語音 引擎進行匹配。音位是聲音不可分割的基本單元,字由音 位構成,例如字的單音節組合。此項預處理(通常是由 C P U執行)可大幅減少傳統只使用c p u之語音處理法 中C P U所需執行的總周期次數。將位元流轉換成音位需 要大量的F F T計算。因此,功能強大的D s P晶片執行 現今由C P U執行的大部分工作,即可減少對c p u的使 本紙張尺度適用中關家標隼「CNS ) A4規格(21GX297公釐)一~ -— -14 - 541470 A7 B7 五、發明説明(12 ) (請先閲讀背面之注意事項再填寫本頁) 用,空出C P U以便處理將音位轉換成實際字及句的軟體 指令。此必然可增進語音引擎的正確性,加快系統執行的 速度,減少熱的產生,以及對電力的使用更有效率。也許 需要發展新的軟體式語音引擎處理連續語音,它允許使用 D S P做前端處理,以對此新架構做最佳的利用。或者, 取得商用連續語音引擎(例如Vi a Voice®及Naturally Speakmg® )的原始碼加以修改,以允許D S P執行目前由 C P U執行的語音前端處理。 經濟部智慧財產局員工消費合作社印製 本發明的另一優點是可以濾除及降低四周的噪音。無 論是連續語音或命令與控制的語音,D S P晶片都適合執 行濾波及雜訊消除的演算,並得到代表語音的數位位元流 ,減去雜訊並接著轉換成純淨的音位。如果是命令與控制 模式,它將擷取命令並將其傳送到C P U。如果是連續語 音模式,音位將被傳送到C P U以供軟體式語音引擎處理 。消除語音中雜訊的能力允許電腦使用者以此架構在吵雜 的環境中操作且具有很高的準確性。例如,某人在渦輪電 廠或飛機組裝線中進行保養工作,這些處所的工具、機器 人及鉚接會產生極吵雜的噪音,他們仍能使用聲音準確地 控制他們的電腦,只會稍許甚至不會減損性能。這對語音 操作的佩帶式電腦及手持式電腦特別有利,這些電腦經常 是在這類環境中使用,以允許使用者空出他們的手,同時 可觀看及捲動電腦上的資訊。典型上,這類應用包括觀看 互動式電子技術手冊,技師需要能捲動及搜尋電腦式的專 家系統、零件表或槪圖,同時執行保養或組裝的作業。此 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -15- 541470 A 7 B7 五、發明説明(13 ) (請先閱讀背面之注意事項再填寫本頁) 類操作通常是在大型或不易移動的設備或製造的物件上執 行。因此,如果他能在吵雜的工作環境中(如一般的工廠 、電廠、組裝線等)連續操作他的電腦並導覽他的手冊, 將可擴大技師之佩帶式電腦的效用。 本發明對傳統式及佩帶式P C還有其它重大的優點。 D S P有助於將文字轉換成聲音。此過程是語音辨識的逆 處理,因爲需要將文字本身破解成組成它們的音位以便輸 出到可發出聲音的喇叭。此外,如果使用內建D S P的電 腦是佩帶式電腦或手持式裝置,它可配備無線的通信能力 ,如無線的數據機或其它通信裝置,D S P可以處理行動 電話的功能,如聲音及命令的數位化,以有利於諸如聲音 撥號、聲音控制、噪音衰減、及聲音與信號間的轉換等特 徵。 經濟部智慧財產局員工消費合作社印製 在較佳實施例中是使用軟體式的控制指定D S P的操 作模式,亦即命令與控制模式或是連續語音模式。有數種 方法可供採用。其中一種方法是使用者可以在系統啓動時 或是系統已在供電狀態下啓動軟體式控制以設定D S P的 模式。可將此模式保持爲原設値直到改變。或者,系統開 機時可以在命令與控制狀態,允許使用者登入及控制作業 系統並選擇特定的應用軟體。不過,一旦被喚出的應用軟 體需要連續語音,例如文字處理器,則模式將自動切換到 連續語音。模式中斷命令很有用處,它允許使用者在使用 應用軟體的當中切換模式。例如,如果使用者是在對他的 應用軟體口述文字,且現在想要儲存檔案或執行其它工作 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -16- 541470 A7 B7 五、發明説明(14 ) (請先閱讀背面之注意事項再填寫本頁) ,這些工作需要用到應用軟體的下拉式選單,於是,它所 說的字詞被當成命令解釋,而非單純的口述語音。此外, 有些應用軟體可支援命令及特定的控制字彙,在喚出應用 軟體後這些字彙可以載入D S P的記憶體。例如,如果是 喚出網路瀏覽器,則導覽及執行標準瀏覽器之功能所需的 所有命令都會載入D S P的記憶體。除了控制作業系統的 基本命令之外,經由各種應用軟體之特定命令之助,本發 明的整體效能將可發揮到極致。 在另一實施例中,使用本發明可以很容易將一種自然 語言即時翻譯成不同的語言。例如某人執行一語音辨識翻 譯程式,它可以將說入電腦的語言翻譯成其它語言,以用 於文章的輸入或用於顯示或聲音輸出。D S P可做爲 C P U及軟體的前端處理器,並可對外語做預處理。此外 ,最適合復原某特定方言的特殊濾波器也可載入D S P, 以允許它對輸入的語音執行更精確的翻譯。再次,D S P 的硬體設計允許它比C P U更有效率地執行此項工作。 經濟部智慧財產局員工消費合作社印製 還有另一實施例,可使用本發明將語音整合到其它電 腦裝置,如可攜式電腦及通信裝置。例如,個人數位助理 (PDA)、個人通信裝置(例如可以接收及顯示網際網 路類型內容的行動電話)、甚至掌上型或手持式電腦,都 可從本發明獲益。這些裝置結合了本發明就可在健全且極 高的用電效率下實施語音控制。由於這些可攜式電腦及通 信裝置通常是以電池供電,因此,在執行應用軟體時能有 效率地使用電力是最重要的重點。此外,這類裝置中的處 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -17- 541470 A7 B7 五、發明説明(15 ) (請先閱讀背面之注意事項再填寫本頁) 理器,其能力通常不及佩帶式或桌上型電腦,因此,它們 比先進技術的C P U更難執行D S P功能。本發明同樣可 增加整體的實用性及對使用者的方便性。以電話爲例,使 用者可以使用D S P以便於使用聲音撥號,可以直接將電 話號碼說入電話,或說出對方的姓名,接著,D S P將儲 存在記憶體中的數字與相關的信號匹配。在P D A或掌上 型電腦中,使用D S P可以很方便地控制特定的應用軟體 ,例如電子郵件程式或網路瀏覽器,或者用來控制它本身 的作業系統。使用者可以簡單地說出命令以查閱電子郵件 或打開瀏覽器,不需要使用觸控式螢幕、滑鼠或其它人工 操作機構。 經濟部智慧財產局員工消費合作社印製 在另一實施例中,本發明的教導可用在手持式、身體 佩帶式、以其它方式攜行或非攜行的遊戲電腦中以利於聲 音控制。在主機板上使用D S P以有利於遊戲機的聲音控 制,而不需要使用者按下按鈕做決定。另者,它可與人工 控制共同使用,經由允許以聲音下達某些決定以降低人工 控制的複雜度。例如,當在玩遊戲時,其中的角色(可由 玩遊戲之人控制移動、位置、及/或動作的實體)同時在 移動及執行人工動作,例如發射武器或投球,就可以使用 人工控制移動,同時以語音影響動作,如射擊或投球,或 選擇或裝塡武器。此將可增加遊戲額外的真實維度,且可 不佔用使用者的手,以將注意力更集中在基本命令。這對 先進技術的電視遊戲系統,如Sony公司及Nintendo公司製 造的電視遊戲系統愈來愈重要,這些遊戲機的控制器允許 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -18- 541470 A7 B7 五、發明説明(16 ) 同時發出1 0種或更多不同的命令。經由將某些命令卸載 給語音操作,可降低手所需的敏捷度水準。 (請先閲讀背面之注意事項再填寫本頁) 凰式及較佳實施例詳細說明 以下將參閱各圖描述本發明的例示式實施例。圖1說 明典型的電腦主機板1。主機板可以是個人電腦的主機板 、行動電腦的主機板、電腦及通信裝置的主機板、或其它 電子計算裝置的主機板。典型上,這類主機板具有基本的 系統組件,例如C P U、記憶體、資料匯流排、電源介面 ' I/O介面、視訊輸出及成音輸出、以及選用的輸入。 圖2說明實施可接受語音輸入之個人電腦的系統層次。電 腦系統包括顯示器1 0、C P U盒9、鍵盤1 1、滑鼠 1 2及麥克風8。麥克風8做爲所有應用軟體直接輸入電 腦的語音音源。 經濟部智慧財產局員工消費合作社印製 圖3說明關於本發明之語音輸入的機能流程圖。語音 經由麥克風輸入1 3進入系統,它將語音轉換成電氣信號 °接著,資料路徑將此信號導引到編碼解碼器1 4或類似 的晶片,用以對信號執行類比到數位(A / D )轉換。接 著,此數位信號被傳送到D S P 1 5進行處理。在此點 ,系統進入一決定狀態1 6,D S P是在命令與控制( C & C )中操作或是在連續語音中操作。如果是在c & C 模式,即在1 7擷取實際的命令,並接著送到C P U供處 理1 9。不過,如果D S P 1 5是在連續語音模式中操 作,則D S P必須在步驟1 8將其轉換成音位,並接著將 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -19- 541470 A7 B7 五、發明説明(18 ) (請先閱讀背面之注意事項再填寫本頁) 本例中顯示使用者介面PCB 1 0 0。其中包括數種典 型的輸入及輸出介面,例如使用者介面埠1 〇 1、USB 埠1 1 0、1 3 9 4埠1 1 1及顯示器埠1 〇 9。 經濟部智慧財產局員工消費合作社印製 處理命令與控制或連續語音之典型的資料流路徑如下 。來自標準類比麥克風的語音經由類比成音輸入1 0 1進 入。類比成音信號前進到編碼解碼器1 〇 2,在該處,類 比到數位(A / D )轉換器將其轉換成數位位元流。接者 ,此位元流前進到D S P晶片1 〇 3。D S P 1 〇 3執行 必要的功能以”淨化”信號並將語音處理成音位。如果電 腦是在命令與控制模式,D S P 1 0 3使用它內部的語 音引擎將語音的音位與實際的命令相關。如果是在連續模 式,它僅將語音轉換成音位。下一步是經由資料路徑將輸 出(C P U 1 0 8所執行的命令或是一連串的音位)傳送 給CPU 108處理。輸出被路由通過DSP - t 〇 — P C I橋晶片1 0 4轉換成與P C I匯流排1 〇 6相容的 位元式格式。接著,此輸出被路由通過Intel 82443MX100 1 05直接與C P U 1 0 8通信。如果是命令與控制信號, 則命令被C P U 1 0 8執行。C P U 1 0 8將相對於 聲音處理被閒置到此點。如果是音位的位元流,例如是連 續語音,則C P U 1 0 8將喚出語音辨識軟體式語音引 擎處理音位,並爲與語音相關的應用軟體將它們轉換成文 字。熟悉一般技術之人士應瞭解,雖然爲了說明的目的提 供了此實際的實施例,但發明本身可應用於任何一種主機 板,無論它的結構如何或是各種的變換與變化,只要存有 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -21 - 541470 A7 B7_____ 五、發明説明(19 ) 本發明的基本構想,都不會偏離本發明的範圍與精神,即 ,在聲音輸入資料路徑中使用D S P做爲連續及命令語音 的引擎,及/或做爲連續語音的前端處理器,以處理及有 助於選擇選單或行動電話的命令與控制,並輔助文字到語 音的轉換。 現已描述了在本發明原理下的較佳且最理想的較佳實 施例,但須瞭解,它可做各種的修改與交錯,都不會偏離 本發明的範圍與精神。 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -22-
Claims (1)
- 5444^70 r 等月日,卞女;mx4 A8 B8 C8 D8 六 、申請專利範圍 附件4a:第90118073號專利申妹安 修正後無劃線之中文巾請專—換本 民國92年2月7曰修 修 rJJ:个 V· fg讀# 1Λ4 ΙΊ ”二/VI葬之 ~?ϊ::'ν'是否子修 經濟部智慧財產局員工消費合作社印製 1 · 一種電腦主機板架構,包括: 電腦主機板,具有典型的組件,包括c p U、資料匯 流排、電源介面、以及聲音輸入資料路徑,該聲音輸入資 7料路徑將主機板的聲音輸入連接到C P U ; D S P晶片,位在聲音輸入資料路徑中; P C I -到一 ϋ s P的橋接介面,位於電腦主機板上 的該D S Ρ晶片與匯流排之間; 記憶體,電氣連接於該D S Ρ晶片; 命令與控制的語音引擎,常駐於該D s Ρ晶片的該記 憶體中。 2 ·如申請專利範圍第1項的電腦主機板架構,其中 該D S Ρ做爲所有語音輸入的前處理器,用以在◦ ρ υ執 行指令之前處理輸入的語音。 3 ·如申請專利範圍第1項的電腦主機板架構,其中 該D S Ρ可由使用者動態地設定在連續語音模式或命令與 控制模式操作。 4 ·如申請專利範圍第1項的電腦主機板架構,其中 該聲音輸入資料路徑包括麥克風輸入、在該聲音輸入資料 路徑中將聲音輸入數位化的機構、D S Ρ晶片、以及 P C I —到一 D S Ρ的橋接晶片,與該匯流排通信。 本紙張尺度適用中國國家標準(CNS ) A4規格(2】0X297公羡) (請先閲讀背面之注意事項再填寫本頁) 541470 經濟部智慧財產局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 5 ·如申請專利範圍第1項的電腦主機板架構,其中 該D S P晶片將該聲音輸入轉換成音位。 6 .如申請專利範圍第1項的電腦主機板架構,其中 該語音引擎包括語音名詞的字彙,這些詞與特定的指令或 前後文的環境相關。 7 .如申請專利範圍第6項的電腦主機板架構,其中 該語音名詞的字彙駐在該D S P晶片的該記憶體中。 8 ·如申請專利範圍第6項的電腦主機板架構,其中 該語音名詞的字彙可由使用者定義,可以是靜態或主動模 式。 9 ·如申請專利範圍第1項的電腦主機板架構,其中 該語音名詞的字彙可由C P U根據在主處理器上執行之應 用軟體的文章脈絡更新。 1 〇 .如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可爲駐在電腦其它位置的軟體式語音引擎 執行預處理。 1 1 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可執行選單的選擇,例如行動電話的聲音 功能,包括聲音撥號、聲音控制、雜訊消除及語音與信號 間的轉換。 1 2 .如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可執行雜訊消除功能。 1 3 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在命令與控制語音模式中操作。 本紙張尺度適用中國國家標準(CNS ) A4規格(21〇χ297公釐) (讀先閲讀背面之注意事項再填寫本頁)-2 - 經濟部智慧財產局員工消費合作社印製 541470 A8 氣 …·/ B8 C8 _ D8 六、申請專利範圍 1 4 .如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在連續語音模式中操作。 1 5 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在行動電話模式中操作。 1 6 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在語言翻譯模式中操作。 1 7 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是使用者支托的電腦主機板。 1 8 ·如申請專利範圍第1 7項的電腦主機板架構, 其中該使用者支托的電腦是以聲音操作、使用者支托的電 腦。 1 9 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是可攜的電腦主機板。 2 〇 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是個人數位式助理的主機板。 2 1 .如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是桌上型電腦主機板。 2 2 .如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是手持式電腦主機板。 2 3 ·如申請專利範圍第1項的電腦主瓒板架構,其 中該電腦主機板是電視遊戲系統的電腦主機板。 2 4 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是計算與通信裝置的電腦主機板·。 2 5 .如申請專利範圍第1項的電腦主機板架構,其 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) (請先閲讀背面之注意事項再填寫本頁)- 3- 541470 A8 B8 々 ρ -7 C8 D8 六、申請專利範圍 中該電腦主機板是使用者支托型電腦、膝上型電腦、桌上 型電腦、可攜型電腦及上述混合型中的組件。 (請先閱讀背面之注意事項再填寫本頁j 2 6 .如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是細胞式電話、無線電話、可攜型電腦、 硬線及無線通信裝置及上述混合型中的組件。 2 7 _ —種在電腦中處理語音的方法,該方法包括: 指定命令與控制處理模式; 指定連續語音模式; 將D S P晶片置於主機板上的聲音輸入資料路徑中; 將D S P -到一 P C I橋接晶片或相等的電路串聯於 D S P晶片之後,用以與該電腦的P C I匯流排通信; 經由該聲音輸入資料路徑接收語音輸入; 如果是在該命令與控制處理模式,該D S P晶片將該 語音輸入轉換成音位,並將該音位與儲存在該D S P常駐 記憶體中的命令匹配以產生C P U的指令; 如果是在該連續語音模式,該D S P晶片將該輸入的 語音轉換成音位; 經濟部智慧財產局員工消費合作社印製 經由該主機板上的D S P -到- P C I橋接晶片或相 等路徑將該指令或該音位傳送給C P U。 2 8 · —種經最佳化以處理語音之電腦主機板架構, 該電腦主機板架構包括: 微處理器; 匯流排; D S P晶片; 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -4 - 541470 A8 B8 貌 C8 D8 六、申請專利範圍 D S P —到一 P C I橋接晶片,與該D S P晶片串聯 ,用以將D S P的輸出連通到該微處理器; (請先閲讀背面之注意事項再填寫本頁) 記憶體,在該D S P晶片中或可被該晶片存取; 命令與控制語音引擎,在該D S P晶片的記憶體中。 2 9 · —種經最佳化以處理語音之電腦主機板架構, 該電腦主機板架構包括: 微處理器; 匯流排; 數位信號處理機構; 在該數位信號處理機構與該微處理器機構間通信的機 構; 記憶體機構,可供該數位信號處理機構存取,用以儲 存命令與控制語音辨識引擎; 控制機構,用以供使用者指定該數位信號處理機構爲 命令與控制模式或連續語音模式; 以及語音輸入及數位化機構。 經濟部智慧財產局員工消費合作社印製 3 〇 .如申請專利範圍第2 9項的電腦主機板架構, 其中該控制機構包括駐在與該主機板電氣通信之儲存裝® 中的電腦軟體程式,該主機板可由使用者控制操作。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -5-
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/677,569 US7162426B1 (en) | 2000-10-02 | 2000-10-02 | Computer motherboard architecture with integrated DSP for continuous and command and control speech processing |
Publications (1)
Publication Number | Publication Date |
---|---|
TW541470B true TW541470B (en) | 2003-07-11 |
Family
ID=24719254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW090118073A TW541470B (en) | 2000-10-02 | 2001-07-24 | Computer motherboard architecture with integrated DSP for continuous and command and control speech processing |
Country Status (9)
Country | Link |
---|---|
US (1) | US7162426B1 (zh) |
EP (1) | EP1193690B1 (zh) |
JP (1) | JP4132737B2 (zh) |
KR (1) | KR20020026804A (zh) |
AT (1) | ATE265730T1 (zh) |
DE (1) | DE60102993T2 (zh) |
ES (1) | ES2220630T3 (zh) |
PT (1) | PT1193690E (zh) |
TW (1) | TW541470B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI577193B (zh) * | 2015-03-19 | 2017-04-01 | 陳光超 | 耳膜助聽器 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100554249B1 (ko) | 2004-07-06 | 2006-02-24 | 주식회사 현대오토넷 | Mgt5200의 psc포트를 이용한 외부소자 인터페이스장치 |
US7774202B2 (en) * | 2006-06-12 | 2010-08-10 | Lockheed Martin Corporation | Speech activated control system and related methods |
US9256396B2 (en) * | 2011-10-10 | 2016-02-09 | Microsoft Technology Licensing, Llc | Speech recognition for context switching |
US9117449B2 (en) * | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
US20220097960A1 (en) * | 2015-09-16 | 2022-03-31 | Simplehuman, Llc | Containers with multiple sensors |
KR102081335B1 (ko) | 2018-06-25 | 2020-02-25 | 주식회사 소비코프로페셔널 | 듀얼코어를 이용한 디지털 오디오 시스템 및 그 제어 방법 |
US10983842B2 (en) | 2019-07-08 | 2021-04-20 | Microsoft Technology Licensing, Llc | Digital signal processing plug-in implementation |
JP7410684B2 (ja) * | 2019-10-21 | 2024-01-10 | シャープ株式会社 | マイクシステム |
CN111145752B (zh) * | 2020-01-03 | 2022-08-02 | 百度在线网络技术(北京)有限公司 | 智能音频装置、方法、电子设备及计算机可读介质 |
CN111261169A (zh) * | 2020-01-08 | 2020-06-09 | 上海齐网网络科技有限公司 | 基于多路数据处理器的语音识别芯片 |
CN112164389B (zh) * | 2020-09-18 | 2023-06-02 | 国营芜湖机械厂 | 一种多模式语音识别送话装置及其控制方法 |
US20220091707A1 (en) | 2020-09-21 | 2022-03-24 | MBTE Holdings Sweden AB | Providing enhanced functionality in an interactive electronic technical manual |
US20220261530A1 (en) | 2021-02-18 | 2022-08-18 | MBTE Holdings Sweden AB | Providing enhanced functionality in an interactive electronic technical manual |
US11445148B1 (en) | 2021-05-06 | 2022-09-13 | Microsoft Technology Licensing, Llc | Video teleconference curated user profile picture |
US11947906B2 (en) | 2021-05-19 | 2024-04-02 | MBTE Holdings Sweden AB | Providing enhanced functionality in an interactive electronic technical manual |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR890016480A (ko) * | 1988-04-27 | 1989-11-29 | 안시환 | 실시간 음성인식 보드장치 |
US6230255B1 (en) | 1990-07-06 | 2001-05-08 | Advanced Micro Devices, Inc. | Communications processor for voice band telecommunications |
JP2662120B2 (ja) * | 1991-10-01 | 1997-10-08 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声認識装置および音声認識用処理ユニット |
US5353376A (en) * | 1992-03-20 | 1994-10-04 | Texas Instruments Incorporated | System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment |
IT1256823B (it) * | 1992-05-14 | 1995-12-21 | Olivetti & Co Spa | Calcolatore portatile con annotazioni verbali. |
US5915236A (en) | 1992-11-13 | 1999-06-22 | Dragon Systems, Inc. | Word recognition system which alters code executed as a function of available computational resources |
KR970005830B1 (ko) * | 1993-12-27 | 1997-04-21 | 재단법인 한국전자통신연구소 | 오디오 코덱 보드 |
US5640490A (en) * | 1994-11-14 | 1997-06-17 | Fonix Corporation | User independent, real-time speech recognition system and method |
JPH09114543A (ja) | 1995-10-02 | 1997-05-02 | Xybernaut Corp | ハンドフリーコンピュータ装置 |
TW439380B (en) * | 1995-10-09 | 2001-06-07 | Hitachi Ltd | Terminal apparatus |
US5754807A (en) * | 1995-11-20 | 1998-05-19 | Advanced Micro Devices, Inc. | Computer system including a multimedia bus which utilizes a separate local expansion bus for addressing and control cycles |
US5794164A (en) * | 1995-11-29 | 1998-08-11 | Microsoft Corporation | Vehicle computer system |
US5797043A (en) * | 1996-03-13 | 1998-08-18 | Diamond Multimedia Systems, Inc. | System for managing the transfer of data between FIFOs within pool memory and peripherals being programmable with identifications of the FIFOs |
US6085314A (en) | 1996-03-18 | 2000-07-04 | Advnced Micro Devices, Inc. | Central processing unit including APX and DSP cores and including selectable APX and DSP execution modes |
US5794068A (en) | 1996-03-18 | 1998-08-11 | Advanced Micro Devices, Inc. | CPU with DSP having function preprocessor that converts instruction sequences intended to perform DSP function into DSP function identifier |
US5987590A (en) | 1996-04-02 | 1999-11-16 | Texas Instruments Incorporated | PC circuits, systems and methods |
US6182203B1 (en) * | 1997-01-24 | 2001-01-30 | Texas Instruments Incorporated | Microprocessor |
US6324592B1 (en) * | 1997-02-25 | 2001-11-27 | Keystone Aerospace | Apparatus and method for a mobile computer architecture and input/output management system |
US5983073A (en) * | 1997-04-04 | 1999-11-09 | Ditzik; Richard J. | Modular notebook and PDA computer systems for personal computing and wireless communications |
JP4067063B2 (ja) | 1997-11-14 | 2008-03-26 | 松下電器産業株式会社 | マイクロプロセッサ |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6081780A (en) * | 1998-04-28 | 2000-06-27 | International Business Machines Corporation | TTS and prosody based authoring system |
US6330247B1 (en) * | 1999-02-08 | 2001-12-11 | Qualcomm Incorporated | Communication protocol between a communication device and an external accessory |
US6233557B1 (en) * | 1999-02-23 | 2001-05-15 | Motorola, Inc. | Method of selectively assigning a penalty to a probability associated with a voice recognition system |
US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US6192340B1 (en) * | 1999-10-19 | 2001-02-20 | Max Abecassis | Integration of music from a personal library with real-time information |
KR100316696B1 (ko) * | 1999-11-12 | 2001-12-12 | 송문섭 | Imt-2000 단말기용 플랫폼 보드 |
-
2000
- 2000-10-02 US US09/677,569 patent/US7162426B1/en not_active Expired - Fee Related
-
2001
- 2001-07-10 ES ES01115769T patent/ES2220630T3/es not_active Expired - Lifetime
- 2001-07-10 DE DE60102993T patent/DE60102993T2/de not_active Expired - Fee Related
- 2001-07-10 PT PT01115769T patent/PT1193690E/pt unknown
- 2001-07-10 EP EP01115769A patent/EP1193690B1/en not_active Expired - Lifetime
- 2001-07-10 AT AT01115769T patent/ATE265730T1/de not_active IP Right Cessation
- 2001-07-12 JP JP2001212688A patent/JP4132737B2/ja not_active Expired - Fee Related
- 2001-07-24 TW TW090118073A patent/TW541470B/zh not_active IP Right Cessation
- 2001-08-22 KR KR1020010050673A patent/KR20020026804A/ko not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI577193B (zh) * | 2015-03-19 | 2017-04-01 | 陳光超 | 耳膜助聽器 |
Also Published As
Publication number | Publication date |
---|---|
PT1193690E (pt) | 2004-09-30 |
DE60102993T2 (de) | 2005-05-04 |
JP4132737B2 (ja) | 2008-08-13 |
KR20020026804A (ko) | 2002-04-12 |
US7162426B1 (en) | 2007-01-09 |
DE60102993D1 (de) | 2004-06-03 |
EP1193690A1 (en) | 2002-04-03 |
EP1193690B1 (en) | 2004-04-28 |
JP2002132285A (ja) | 2002-05-09 |
ATE265730T1 (de) | 2004-05-15 |
ES2220630T3 (es) | 2004-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW541470B (en) | Computer motherboard architecture with integrated DSP for continuous and command and control speech processing | |
US6917920B1 (en) | Speech translation device and computer readable medium | |
US6581033B1 (en) | System and method for correction of speech recognition mode errors | |
US6952665B1 (en) | Translating apparatus and method, and recording medium used therewith | |
JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
US6952676B2 (en) | Voice recognition peripheral device | |
JP2008287697A (ja) | 音声チャットシステム、情報処理装置およびプログラム | |
KR20040103443A (ko) | 고도의 대화형 인터페이스를 위한 의미 객체 동기 이해 | |
JP2004287444A (ja) | 多言語テキスト音声変換システムのためのフロントエンドアーキテクチャ | |
US9812130B1 (en) | Apparatus and methods for dynamically changing a language model based on recognized text | |
CA2613154A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
JP2005249829A (ja) | 音声認識を行うコンピュータネットワークシステム | |
JP2002116797A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
Zhou et al. | Two-way speech-to-speech translation on handheld devices. | |
Zhou et al. | A hand-held speech-to-speech translation system | |
CN100380442C (zh) | 利用优化音素集进行普通话语音识别的系统和方法 | |
JP4230142B2 (ja) | 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術 | |
JPH10260976A (ja) | 音声対話方法 | |
JP3411198B2 (ja) | 通訳装置及び方法並びに通訳装置制御プログラムを記憶した媒体 | |
Hsiao et al. | Optimizing components for handheld two-way speech translation for an English-Iraqi Arabic system | |
Gardner-Bonneau et al. | Spoken language interfaces for embedded applications | |
Ackermann et al. | Speedata: Multilingual spoken data entry | |
WO2002099786A1 (en) | Method and device for multimodal interactive browsing | |
Zhu et al. | Generative Pre-Trained Speech Language Model with Efficient Hierarchical Transformer | |
Korchynskyi et al. | Methods of improving the quality of speech-to-text conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |