TW541470B - Computer motherboard architecture with integrated DSP for continuous and command and control speech processing - Google Patents

Computer motherboard architecture with integrated DSP for continuous and command and control speech processing Download PDF

Info

Publication number
TW541470B
TW541470B TW090118073A TW90118073A TW541470B TW 541470 B TW541470 B TW 541470B TW 090118073 A TW090118073 A TW 090118073A TW 90118073 A TW90118073 A TW 90118073A TW 541470 B TW541470 B TW 541470B
Authority
TW
Taiwan
Prior art keywords
computer motherboard
computer
patent application
scope
dsp
Prior art date
Application number
TW090118073A
Other languages
English (en)
Inventor
Robert G Schultz
Original Assignee
Xybernaut Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24719254&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TW541470(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Xybernaut Corp filed Critical Xybernaut Corp
Application granted granted Critical
Publication of TW541470B publication Critical patent/TW541470B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Stored Programmes (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Hardware Redundancy (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

541470 A7 B7 五、發明説明(3 ) 先進技術的重大進步。 (請先閲讀背面之注意事項再填寫本頁) 近年來,已使用數位信號處理器(後文中稱爲D S P )晶片處理自然語音。此例之一是客戶服務電話系統,藉 著呼叫者說出他們的輸入,如同在與電話結爲一體的鍵盤 上鍵入數字。D S P整合在樹狀的電話系統中。當系統接 收到代表所說文字的信號時,D S P執行與代表已知字之 已知信號間的匹配,並將此資料輸入。不過,這些系統一 般只限於數字的辨識,並不適用於消費者導向的產品。 D S P基本上是一通用的微處理器,它可應用到各種 特殊用途。它包括特殊的邏輯硬體用以執行數學功能,它 的速率、耗電水準及效率通常與微處理器無關。這些晶片 可被規劃以執行各種信號處理功能。有許多商用的P C擴 充卡中都包括DSP,且通常有軟體應用程式規劃它們以 執行信號處理功能。由於它們的硬體及架構,通常它們較 適合執行某些計算密集的功能。 經濟部智慧財產局員工消費合作社印製 典型上,D S P的設計特別適合數學演算,如相關、 捲積、有限脈衝響應(F I R )濾波器、無限脈衝響應( I I R )濾波器、快速傅利葉轉換(F F T )、矩陣計算 、以及其它運算間的內積。這些數學演算的實施通常包括 很長的對稱算術/乘法運算序列。語苜的處理特別需要用 到F F T及濾波器。 C P U通常包括執行單元、快取記憶體、記憶體管理 單元、浮點單元及其它邏輯。通用c P U的工作是執行碼 及執行電腦記憶體中之資料的運算,因此而管理電腦平台 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -6 - 541470 A7 B7 五、發明説明(4 ) 。一般言之,基本的X8 6或其它型式的電腦CPU,其 設計主要是用來執行布林/管理/資料操作判斷運算。 (請先閲讀背面之注意事項再填寫本頁) 通用C P U執行的指令包括基本的數學功能。不過, 這些功能並不非常適合複雜的D S P -類型的數學運算。 因此,相較於D S P,通用的C P U需要執行大量的指令 才能執行非常基本的D S P功能。 經濟部智慧財產局員工消費合作社印製 在習知技術中,無論是硬體或軟體,都曾經嘗試過將 D S P結合到P C的架構中,以利用與其相關的效率。美 國專利5,7 9 4,0 6 8 (後文中稱爲’ 〇 6 8專利)即 是一例。在’0 6 8專利中,揭示一種通用的CPU,它包 含通用的C P U單元,如X 8 6核心,也包括D S P核心 。C P U還包括D S P功能解碼器或預處理器,它檢查指 令序列以決定是否要執行D S P功能。如果解碼器決定所 要執行的是D S P功能,功能解碼器即將指令序列轉換成 D S P巨集,並將巨集路由到D S P核心。D S P核心可 在通用C P U核心執行其它運算之時平行執行D S p功能 。此設計確保可與需要與不需要執行D S P運算之現有的 套裝軟體逆相容。不過,由於有預處理器,在執行周期中 引進了額外的步驟。’ 0 6 8專利的缺點是在執行命令前必 須先解碼檢查D S P指令的命令。’ 〇 6 8專利之系統的另 一缺點是此架構並不適合處理語音,且並未教導將命令與 控制的語音引擎包括到D S P晶片本身內部。此外, D S P也非做爲來自電腦之聲音輸入之所有語音輸入信號 的主要介面。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 541470 A7 B7 五、發明説明(6 ) 本發明還有另一目的是提供一種硬體架構,它最適合 處理語音。 (請先閱讀背面之注意事項再填寫本頁) 本發明進一步的目的是提供一種電腦架構,它所提供 的精確度與能力優於現有的軟體式語音處理法。 本發明還有另一目的是提供一種用於p c的主機板架 構,特別是用於行動、手持及佩帶式P C及其它電子裝置 ,它可減少以C P U處理語音所需的周期數量。 本發明還有另一目的是提供行動、手持及佩帶式電腦 一種語音處理設計,可降低語音處理期間的電力消耗及所 產生的熱。 本發明還有另一目的是提供一種架構,它可在處理語 音時消除及減少雜訊。 本發明還有另一目的是提供一種內嵌D S P的語音引 擎,它具有命令與控制語音之語彙個人化的能力。 本發明所揭示的這些及其它目的一般可經由電腦主機 板的設計達成,其中,將D S P硬體結合到主機板中,做 爲聲音輸入與微處理器間的介面,用以辨識及處理語音命 經濟部智慧財產局員工消費合作社印製 令 明I 說 單 簡 式 圖 的 置 裝 算 計 或 腦 電 型 典 之 件 組 統 系 型 典 有 具 明 說 1—- ο 圖板 機 主 電 人 個 型 典 的 源 音 之 入 輸 音 聲 爲 做 風 克 麥 以 明 說 2 圖 腦 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -9- 541470 A7 B7 五、發明説明(7 ) 圖3說明本發明有關語音輸入到電腦裝置之方法的流 程圖。 圖4說明連續語音模式及命令與控制語音模式的流程 圖及樹狀決策圖。 圖5說明例示性的佩帶式電腦主機板,在電路設計及 主機板的資料路徑中整合了 D S P。 元件表 1 主機板 2 中央處理單元 3 記憶體 4 輸入/輸出 5 電源介面 6 視訊輸出 7 記憶體 8 麥克風 9 C P U 盒 10 顯示器 11 鍵盤 12 滑鼠 13 麥克風輸入 14 編碼解碼器 15 數位信號處理器 2 0 語音信號 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X 297公釐) (請先閲讀背面之注意事項再填寫本頁) 衣. — 經濟部智慧財產局員工消費合作社印製 -10- A7 ____ _ B7 2 0 0 行 動 電 腦 系 統 主 機 板 1 〇 1 成 音 輸 入 1 〇 2 編 碼 解 碼 器 1 0 8 中 央 處 理 單 元 1 〇 3 數 位 信 號 處 理 晶 片 1 0 6 P C I 匯 流 排 1 〇 0 使 用 者 介 面 印 刷 電 路板 1 1 0 U S B 埠 1 1 1 1 3 9 4 璋 1 0 9 顯 示 器 埠 541470 五、發明説明(8 ) (請先閲讀背面之注意事項再填寫本頁) 發明詳細說明 經濟部智慧財產局員工消費合作社印製 基於本說明書及申請專利範圍的目的,”電腦主機板 ”一詞將包括任何個人電腦、佩帶式電腦、可攜式電腦、 膝上型電腦、計算與通信裝置的組合、或掌上型電腦所使 用的主機板。基本上,本發明是一創新的電腦主機板架構 ,它在主機板中結合了 D S P硬體,做爲音效卡或類似聲 音輸入裝置與微處理器間的介面。它可解決目前語音處理 架構的若干問題。在聲音資料輸入流中結合D S P將可大 幅提升目前語音處理架構的能力,且使用微處理器對語音 的處理減至最少。目前處理語音的方法是使用C P U及軟 體式引擎(如 ViaVoice®及 Naturally Speaking®),問題是 微處理器並不適合執行處理語音所需的大量快速傅利葉轉 換(後文中稱爲F F T )。此導致處理器被大量使用,消 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -11 - 541470 A7 —_ B7 五、發明説明(1〇 ) (請先閲讀背面之注意事項再填寫本頁) 確地使用聲音操作這些裝置,而不需要或額外需要使用人 工或點選的裝置操作。此外,由於D s p所消耗的電力比 CPU低,因此,裝置之電池的可用壽命也大幅延長。在 桌上型的環境中,更有效率的語音處理以及釋放c P U之 時計周期的益處也將得以實現。 經濟部智慧財產局員工消費合作社印製 有關於電腦的語音處理基本上可分成兩類:第一類是 命令與控制,第二類是連續語音。命令與控制的語音是字 詞,它用來控制作業系統或在特定的應用軟體中導覽。這 些字詞或片語可以個人化並鏈結到特定的命令。諸如”開 啓視窗”或”下捲”等片語是命令與控制的語音範例。這 些字詞通常是選擇自有限的或經過劃分的字彙組,其中, 每一字詞與電腦的某特定命令鏈結在一起。目前,此項處 理是由軟體式的語音引擎及CPU處理。不過,DSP有 能力做爲這些命令與控制字詞或片語的語音引擎。這些語 音引擎本身即常駐在D S P晶片內的記憶體中。這將允許 對語音的解釋及處理完全由D S P處理,根本不需要用到 C P U。合法字詞的命令字詞範本可常駐在D S P上的記 憶體中,或者,也可根據上下文意及應用軟體允許各種不 同的控制命令庫從主C P U載入到D S P的記憶體中,視 所使用的應用軟體而定。按此方式,DSP就不需要大量 的記憶體,因爲在某一時間,只需將有限的命令字詞組及 與文意相關的文字範本載入D S P的記憶體。容許命令與 控制語音引擎有效率操作所需的記憶體將可大幅減少。 6 4 k b的記憶體足夠命令與控制庫使用,正好是目前 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -13- 541470 A7 B7 __ 五、發明説明(11 ) (請先閱讀背面之注意事項再填寫本頁) D S P內的記憶體容量。當D S P晶片的記憶體容量變得 更健全,它可變得更實用,且可更有效率地將更多或所有 的命令及控制字詞範本儲存到D S P的記憶體中。引擎本 身可個人化以便使用者可以定義能有效動作的言辭命令。 此將減少聲音相同但命令效果不同之字的問題。例如,如 果有兩個發音相同但產生不同結果的命令,可以使用聲音 不同但能產生相同結果的命令取代。 經濟部智慧財產局員工消費合作社印製 至於連續語音處理,使用D S P輔助C P U處理語音 也能獲致重大優點。當C P U接收到來自編碼解碼器之A / D轉換器代表言語的數位取樣位元流時,它必須將它們 轉換成代表字母群組或部分字的音位(phoneme )或聲音 ,並接著找到最可能代表該些聲音組合的字/句。將位元 流轉換成音位的處理需要極密集的計算,通用C P U的邏 輯並不適合此類的處理。D S P晶片也可做爲軟體式連續 語音引擎的前端處理器。由於連續語音引擎的字典非常龐 大,且D S P的記憶體容量有限,使用C p υ及軟體式語 音引擎做爲後端處理將更有效率。D S P取得語音的位元 流輸入,並將其轉換成音位,傳遞給C P U與軟體式語音 引擎進行匹配。音位是聲音不可分割的基本單元,字由音 位構成,例如字的單音節組合。此項預處理(通常是由 C P U執行)可大幅減少傳統只使用c p u之語音處理法 中C P U所需執行的總周期次數。將位元流轉換成音位需 要大量的F F T計算。因此,功能強大的D s P晶片執行 現今由C P U執行的大部分工作,即可減少對c p u的使 本紙張尺度適用中關家標隼「CNS ) A4規格(21GX297公釐)一~ -— -14 - 541470 A7 B7 五、發明説明(12 ) (請先閲讀背面之注意事項再填寫本頁) 用,空出C P U以便處理將音位轉換成實際字及句的軟體 指令。此必然可增進語音引擎的正確性,加快系統執行的 速度,減少熱的產生,以及對電力的使用更有效率。也許 需要發展新的軟體式語音引擎處理連續語音,它允許使用 D S P做前端處理,以對此新架構做最佳的利用。或者, 取得商用連續語音引擎(例如Vi a Voice®及Naturally Speakmg® )的原始碼加以修改,以允許D S P執行目前由 C P U執行的語音前端處理。 經濟部智慧財產局員工消費合作社印製 本發明的另一優點是可以濾除及降低四周的噪音。無 論是連續語音或命令與控制的語音,D S P晶片都適合執 行濾波及雜訊消除的演算,並得到代表語音的數位位元流 ,減去雜訊並接著轉換成純淨的音位。如果是命令與控制 模式,它將擷取命令並將其傳送到C P U。如果是連續語 音模式,音位將被傳送到C P U以供軟體式語音引擎處理 。消除語音中雜訊的能力允許電腦使用者以此架構在吵雜 的環境中操作且具有很高的準確性。例如,某人在渦輪電 廠或飛機組裝線中進行保養工作,這些處所的工具、機器 人及鉚接會產生極吵雜的噪音,他們仍能使用聲音準確地 控制他們的電腦,只會稍許甚至不會減損性能。這對語音 操作的佩帶式電腦及手持式電腦特別有利,這些電腦經常 是在這類環境中使用,以允許使用者空出他們的手,同時 可觀看及捲動電腦上的資訊。典型上,這類應用包括觀看 互動式電子技術手冊,技師需要能捲動及搜尋電腦式的專 家系統、零件表或槪圖,同時執行保養或組裝的作業。此 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -15- 541470 A 7 B7 五、發明説明(13 ) (請先閱讀背面之注意事項再填寫本頁) 類操作通常是在大型或不易移動的設備或製造的物件上執 行。因此,如果他能在吵雜的工作環境中(如一般的工廠 、電廠、組裝線等)連續操作他的電腦並導覽他的手冊, 將可擴大技師之佩帶式電腦的效用。 本發明對傳統式及佩帶式P C還有其它重大的優點。 D S P有助於將文字轉換成聲音。此過程是語音辨識的逆 處理,因爲需要將文字本身破解成組成它們的音位以便輸 出到可發出聲音的喇叭。此外,如果使用內建D S P的電 腦是佩帶式電腦或手持式裝置,它可配備無線的通信能力 ,如無線的數據機或其它通信裝置,D S P可以處理行動 電話的功能,如聲音及命令的數位化,以有利於諸如聲音 撥號、聲音控制、噪音衰減、及聲音與信號間的轉換等特 徵。 經濟部智慧財產局員工消費合作社印製 在較佳實施例中是使用軟體式的控制指定D S P的操 作模式,亦即命令與控制模式或是連續語音模式。有數種 方法可供採用。其中一種方法是使用者可以在系統啓動時 或是系統已在供電狀態下啓動軟體式控制以設定D S P的 模式。可將此模式保持爲原設値直到改變。或者,系統開 機時可以在命令與控制狀態,允許使用者登入及控制作業 系統並選擇特定的應用軟體。不過,一旦被喚出的應用軟 體需要連續語音,例如文字處理器,則模式將自動切換到 連續語音。模式中斷命令很有用處,它允許使用者在使用 應用軟體的當中切換模式。例如,如果使用者是在對他的 應用軟體口述文字,且現在想要儲存檔案或執行其它工作 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -16- 541470 A7 B7 五、發明説明(14 ) (請先閱讀背面之注意事項再填寫本頁) ,這些工作需要用到應用軟體的下拉式選單,於是,它所 說的字詞被當成命令解釋,而非單純的口述語音。此外, 有些應用軟體可支援命令及特定的控制字彙,在喚出應用 軟體後這些字彙可以載入D S P的記憶體。例如,如果是 喚出網路瀏覽器,則導覽及執行標準瀏覽器之功能所需的 所有命令都會載入D S P的記憶體。除了控制作業系統的 基本命令之外,經由各種應用軟體之特定命令之助,本發 明的整體效能將可發揮到極致。 在另一實施例中,使用本發明可以很容易將一種自然 語言即時翻譯成不同的語言。例如某人執行一語音辨識翻 譯程式,它可以將說入電腦的語言翻譯成其它語言,以用 於文章的輸入或用於顯示或聲音輸出。D S P可做爲 C P U及軟體的前端處理器,並可對外語做預處理。此外 ,最適合復原某特定方言的特殊濾波器也可載入D S P, 以允許它對輸入的語音執行更精確的翻譯。再次,D S P 的硬體設計允許它比C P U更有效率地執行此項工作。 經濟部智慧財產局員工消費合作社印製 還有另一實施例,可使用本發明將語音整合到其它電 腦裝置,如可攜式電腦及通信裝置。例如,個人數位助理 (PDA)、個人通信裝置(例如可以接收及顯示網際網 路類型內容的行動電話)、甚至掌上型或手持式電腦,都 可從本發明獲益。這些裝置結合了本發明就可在健全且極 高的用電效率下實施語音控制。由於這些可攜式電腦及通 信裝置通常是以電池供電,因此,在執行應用軟體時能有 效率地使用電力是最重要的重點。此外,這類裝置中的處 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -17- 541470 A7 B7 五、發明説明(15 ) (請先閱讀背面之注意事項再填寫本頁) 理器,其能力通常不及佩帶式或桌上型電腦,因此,它們 比先進技術的C P U更難執行D S P功能。本發明同樣可 增加整體的實用性及對使用者的方便性。以電話爲例,使 用者可以使用D S P以便於使用聲音撥號,可以直接將電 話號碼說入電話,或說出對方的姓名,接著,D S P將儲 存在記憶體中的數字與相關的信號匹配。在P D A或掌上 型電腦中,使用D S P可以很方便地控制特定的應用軟體 ,例如電子郵件程式或網路瀏覽器,或者用來控制它本身 的作業系統。使用者可以簡單地說出命令以查閱電子郵件 或打開瀏覽器,不需要使用觸控式螢幕、滑鼠或其它人工 操作機構。 經濟部智慧財產局員工消費合作社印製 在另一實施例中,本發明的教導可用在手持式、身體 佩帶式、以其它方式攜行或非攜行的遊戲電腦中以利於聲 音控制。在主機板上使用D S P以有利於遊戲機的聲音控 制,而不需要使用者按下按鈕做決定。另者,它可與人工 控制共同使用,經由允許以聲音下達某些決定以降低人工 控制的複雜度。例如,當在玩遊戲時,其中的角色(可由 玩遊戲之人控制移動、位置、及/或動作的實體)同時在 移動及執行人工動作,例如發射武器或投球,就可以使用 人工控制移動,同時以語音影響動作,如射擊或投球,或 選擇或裝塡武器。此將可增加遊戲額外的真實維度,且可 不佔用使用者的手,以將注意力更集中在基本命令。這對 先進技術的電視遊戲系統,如Sony公司及Nintendo公司製 造的電視遊戲系統愈來愈重要,這些遊戲機的控制器允許 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -18- 541470 A7 B7 五、發明説明(16 ) 同時發出1 0種或更多不同的命令。經由將某些命令卸載 給語音操作,可降低手所需的敏捷度水準。 (請先閲讀背面之注意事項再填寫本頁) 凰式及較佳實施例詳細說明 以下將參閱各圖描述本發明的例示式實施例。圖1說 明典型的電腦主機板1。主機板可以是個人電腦的主機板 、行動電腦的主機板、電腦及通信裝置的主機板、或其它 電子計算裝置的主機板。典型上,這類主機板具有基本的 系統組件,例如C P U、記憶體、資料匯流排、電源介面 ' I/O介面、視訊輸出及成音輸出、以及選用的輸入。 圖2說明實施可接受語音輸入之個人電腦的系統層次。電 腦系統包括顯示器1 0、C P U盒9、鍵盤1 1、滑鼠 1 2及麥克風8。麥克風8做爲所有應用軟體直接輸入電 腦的語音音源。 經濟部智慧財產局員工消費合作社印製 圖3說明關於本發明之語音輸入的機能流程圖。語音 經由麥克風輸入1 3進入系統,它將語音轉換成電氣信號 °接著,資料路徑將此信號導引到編碼解碼器1 4或類似 的晶片,用以對信號執行類比到數位(A / D )轉換。接 著,此數位信號被傳送到D S P 1 5進行處理。在此點 ,系統進入一決定狀態1 6,D S P是在命令與控制( C & C )中操作或是在連續語音中操作。如果是在c & C 模式,即在1 7擷取實際的命令,並接著送到C P U供處 理1 9。不過,如果D S P 1 5是在連續語音模式中操 作,則D S P必須在步驟1 8將其轉換成音位,並接著將 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -19- 541470 A7 B7 五、發明説明(18 ) (請先閱讀背面之注意事項再填寫本頁) 本例中顯示使用者介面PCB 1 0 0。其中包括數種典 型的輸入及輸出介面,例如使用者介面埠1 〇 1、USB 埠1 1 0、1 3 9 4埠1 1 1及顯示器埠1 〇 9。 經濟部智慧財產局員工消費合作社印製 處理命令與控制或連續語音之典型的資料流路徑如下 。來自標準類比麥克風的語音經由類比成音輸入1 0 1進 入。類比成音信號前進到編碼解碼器1 〇 2,在該處,類 比到數位(A / D )轉換器將其轉換成數位位元流。接者 ,此位元流前進到D S P晶片1 〇 3。D S P 1 〇 3執行 必要的功能以”淨化”信號並將語音處理成音位。如果電 腦是在命令與控制模式,D S P 1 0 3使用它內部的語 音引擎將語音的音位與實際的命令相關。如果是在連續模 式,它僅將語音轉換成音位。下一步是經由資料路徑將輸 出(C P U 1 0 8所執行的命令或是一連串的音位)傳送 給CPU 108處理。輸出被路由通過DSP - t 〇 — P C I橋晶片1 0 4轉換成與P C I匯流排1 〇 6相容的 位元式格式。接著,此輸出被路由通過Intel 82443MX100 1 05直接與C P U 1 0 8通信。如果是命令與控制信號, 則命令被C P U 1 0 8執行。C P U 1 0 8將相對於 聲音處理被閒置到此點。如果是音位的位元流,例如是連 續語音,則C P U 1 0 8將喚出語音辨識軟體式語音引 擎處理音位,並爲與語音相關的應用軟體將它們轉換成文 字。熟悉一般技術之人士應瞭解,雖然爲了說明的目的提 供了此實際的實施例,但發明本身可應用於任何一種主機 板,無論它的結構如何或是各種的變換與變化,只要存有 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -21 - 541470 A7 B7_____ 五、發明説明(19 ) 本發明的基本構想,都不會偏離本發明的範圍與精神,即 ,在聲音輸入資料路徑中使用D S P做爲連續及命令語音 的引擎,及/或做爲連續語音的前端處理器,以處理及有 助於選擇選單或行動電話的命令與控制,並輔助文字到語 音的轉換。 現已描述了在本發明原理下的較佳且最理想的較佳實 施例,但須瞭解,它可做各種的修改與交錯,都不會偏離 本發明的範圍與精神。 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -22-

Claims (1)

  1. 5444^70 r 等月日,卞女;mx4 A8 B8 C8 D8 六 、申請專利範圍 附件4a:第90118073號專利申妹安 修正後無劃線之中文巾請專—換本 民國92年2月7曰修 修 rJJ:个 V· fg讀# 1Λ4 ΙΊ ”二/VI葬之 ~?ϊ::'ν'是否子修 經濟部智慧財產局員工消費合作社印製 1 · 一種電腦主機板架構,包括: 電腦主機板,具有典型的組件,包括c p U、資料匯 流排、電源介面、以及聲音輸入資料路徑,該聲音輸入資 7料路徑將主機板的聲音輸入連接到C P U ; D S P晶片,位在聲音輸入資料路徑中; P C I -到一 ϋ s P的橋接介面,位於電腦主機板上 的該D S Ρ晶片與匯流排之間; 記憶體,電氣連接於該D S Ρ晶片; 命令與控制的語音引擎,常駐於該D s Ρ晶片的該記 憶體中。 2 ·如申請專利範圍第1項的電腦主機板架構,其中 該D S Ρ做爲所有語音輸入的前處理器,用以在◦ ρ υ執 行指令之前處理輸入的語音。 3 ·如申請專利範圍第1項的電腦主機板架構,其中 該D S Ρ可由使用者動態地設定在連續語音模式或命令與 控制模式操作。 4 ·如申請專利範圍第1項的電腦主機板架構,其中 該聲音輸入資料路徑包括麥克風輸入、在該聲音輸入資料 路徑中將聲音輸入數位化的機構、D S Ρ晶片、以及 P C I —到一 D S Ρ的橋接晶片,與該匯流排通信。 本紙張尺度適用中國國家標準(CNS ) A4規格(2】0X297公羡) (請先閲讀背面之注意事項再填寫本頁) 541470 經濟部智慧財產局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 5 ·如申請專利範圍第1項的電腦主機板架構,其中 該D S P晶片將該聲音輸入轉換成音位。 6 .如申請專利範圍第1項的電腦主機板架構,其中 該語音引擎包括語音名詞的字彙,這些詞與特定的指令或 前後文的環境相關。 7 .如申請專利範圍第6項的電腦主機板架構,其中 該語音名詞的字彙駐在該D S P晶片的該記憶體中。 8 ·如申請專利範圍第6項的電腦主機板架構,其中 該語音名詞的字彙可由使用者定義,可以是靜態或主動模 式。 9 ·如申請專利範圍第1項的電腦主機板架構,其中 該語音名詞的字彙可由C P U根據在主處理器上執行之應 用軟體的文章脈絡更新。 1 〇 .如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可爲駐在電腦其它位置的軟體式語音引擎 執行預處理。 1 1 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可執行選單的選擇,例如行動電話的聲音 功能,包括聲音撥號、聲音控制、雜訊消除及語音與信號 間的轉換。 1 2 .如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可執行雜訊消除功能。 1 3 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在命令與控制語音模式中操作。 本紙張尺度適用中國國家標準(CNS ) A4規格(21〇χ297公釐) (讀先閲讀背面之注意事項再填寫本頁)
    -2 - 經濟部智慧財產局員工消費合作社印製 541470 A8 氣 …·/ B8 C8 _ D8 六、申請專利範圍 1 4 .如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在連續語音模式中操作。 1 5 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在行動電話模式中操作。 1 6 ·如申請專利範圍第1項的電腦主機板架構,其 中該D S P晶片可在語言翻譯模式中操作。 1 7 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是使用者支托的電腦主機板。 1 8 ·如申請專利範圍第1 7項的電腦主機板架構, 其中該使用者支托的電腦是以聲音操作、使用者支托的電 腦。 1 9 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是可攜的電腦主機板。 2 〇 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是個人數位式助理的主機板。 2 1 .如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是桌上型電腦主機板。 2 2 .如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是手持式電腦主機板。 2 3 ·如申請專利範圍第1項的電腦主瓒板架構,其 中該電腦主機板是電視遊戲系統的電腦主機板。 2 4 ·如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是計算與通信裝置的電腦主機板·。 2 5 .如申請專利範圍第1項的電腦主機板架構,其 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) (請先閲讀背面之注意事項再填寫本頁)
    - 3- 541470 A8 B8 々 ρ -7 C8 D8 六、申請專利範圍 中該電腦主機板是使用者支托型電腦、膝上型電腦、桌上 型電腦、可攜型電腦及上述混合型中的組件。 (請先閱讀背面之注意事項再填寫本頁j 2 6 .如申請專利範圍第1項的電腦主機板架構,其 中該電腦主機板是細胞式電話、無線電話、可攜型電腦、 硬線及無線通信裝置及上述混合型中的組件。 2 7 _ —種在電腦中處理語音的方法,該方法包括: 指定命令與控制處理模式; 指定連續語音模式; 將D S P晶片置於主機板上的聲音輸入資料路徑中; 將D S P -到一 P C I橋接晶片或相等的電路串聯於 D S P晶片之後,用以與該電腦的P C I匯流排通信; 經由該聲音輸入資料路徑接收語音輸入; 如果是在該命令與控制處理模式,該D S P晶片將該 語音輸入轉換成音位,並將該音位與儲存在該D S P常駐 記憶體中的命令匹配以產生C P U的指令; 如果是在該連續語音模式,該D S P晶片將該輸入的 語音轉換成音位; 經濟部智慧財產局員工消費合作社印製 經由該主機板上的D S P -到- P C I橋接晶片或相 等路徑將該指令或該音位傳送給C P U。 2 8 · —種經最佳化以處理語音之電腦主機板架構, 該電腦主機板架構包括: 微處理器; 匯流排; D S P晶片; 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -4 - 541470 A8 B8 貌 C8 D8 六、申請專利範圍 D S P —到一 P C I橋接晶片,與該D S P晶片串聯 ,用以將D S P的輸出連通到該微處理器; (請先閲讀背面之注意事項再填寫本頁) 記憶體,在該D S P晶片中或可被該晶片存取; 命令與控制語音引擎,在該D S P晶片的記憶體中。 2 9 · —種經最佳化以處理語音之電腦主機板架構, 該電腦主機板架構包括: 微處理器; 匯流排; 數位信號處理機構; 在該數位信號處理機構與該微處理器機構間通信的機 構; 記憶體機構,可供該數位信號處理機構存取,用以儲 存命令與控制語音辨識引擎; 控制機構,用以供使用者指定該數位信號處理機構爲 命令與控制模式或連續語音模式; 以及語音輸入及數位化機構。 經濟部智慧財產局員工消費合作社印製 3 〇 .如申請專利範圍第2 9項的電腦主機板架構, 其中該控制機構包括駐在與該主機板電氣通信之儲存裝® 中的電腦軟體程式,該主機板可由使用者控制操作。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -5-
TW090118073A 2000-10-02 2001-07-24 Computer motherboard architecture with integrated DSP for continuous and command and control speech processing TW541470B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/677,569 US7162426B1 (en) 2000-10-02 2000-10-02 Computer motherboard architecture with integrated DSP for continuous and command and control speech processing

Publications (1)

Publication Number Publication Date
TW541470B true TW541470B (en) 2003-07-11

Family

ID=24719254

Family Applications (1)

Application Number Title Priority Date Filing Date
TW090118073A TW541470B (en) 2000-10-02 2001-07-24 Computer motherboard architecture with integrated DSP for continuous and command and control speech processing

Country Status (9)

Country Link
US (1) US7162426B1 (zh)
EP (1) EP1193690B1 (zh)
JP (1) JP4132737B2 (zh)
KR (1) KR20020026804A (zh)
AT (1) ATE265730T1 (zh)
DE (1) DE60102993T2 (zh)
ES (1) ES2220630T3 (zh)
PT (1) PT1193690E (zh)
TW (1) TW541470B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI577193B (zh) * 2015-03-19 2017-04-01 陳光超 耳膜助聽器

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100554249B1 (ko) 2004-07-06 2006-02-24 주식회사 현대오토넷 Mgt5200의 psc포트를 이용한 외부소자 인터페이스장치
US7774202B2 (en) * 2006-06-12 2010-08-10 Lockheed Martin Corporation Speech activated control system and related methods
US9256396B2 (en) * 2011-10-10 2016-02-09 Microsoft Technology Licensing, Llc Speech recognition for context switching
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
US20220097960A1 (en) * 2015-09-16 2022-03-31 Simplehuman, Llc Containers with multiple sensors
KR102081335B1 (ko) 2018-06-25 2020-02-25 주식회사 소비코프로페셔널 듀얼코어를 이용한 디지털 오디오 시스템 및 그 제어 방법
US10983842B2 (en) 2019-07-08 2021-04-20 Microsoft Technology Licensing, Llc Digital signal processing plug-in implementation
JP7410684B2 (ja) * 2019-10-21 2024-01-10 シャープ株式会社 マイクシステム
CN111145752B (zh) * 2020-01-03 2022-08-02 百度在线网络技术(北京)有限公司 智能音频装置、方法、电子设备及计算机可读介质
CN111261169A (zh) * 2020-01-08 2020-06-09 上海齐网网络科技有限公司 基于多路数据处理器的语音识别芯片
CN112164389B (zh) * 2020-09-18 2023-06-02 国营芜湖机械厂 一种多模式语音识别送话装置及其控制方法
US20220091707A1 (en) 2020-09-21 2022-03-24 MBTE Holdings Sweden AB Providing enhanced functionality in an interactive electronic technical manual
US20220261530A1 (en) 2021-02-18 2022-08-18 MBTE Holdings Sweden AB Providing enhanced functionality in an interactive electronic technical manual
US11445148B1 (en) 2021-05-06 2022-09-13 Microsoft Technology Licensing, Llc Video teleconference curated user profile picture
US11947906B2 (en) 2021-05-19 2024-04-02 MBTE Holdings Sweden AB Providing enhanced functionality in an interactive electronic technical manual

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR890016480A (ko) * 1988-04-27 1989-11-29 안시환 실시간 음성인식 보드장치
US6230255B1 (en) 1990-07-06 2001-05-08 Advanced Micro Devices, Inc. Communications processor for voice band telecommunications
JP2662120B2 (ja) * 1991-10-01 1997-10-08 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声認識装置および音声認識用処理ユニット
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
IT1256823B (it) * 1992-05-14 1995-12-21 Olivetti & Co Spa Calcolatore portatile con annotazioni verbali.
US5915236A (en) 1992-11-13 1999-06-22 Dragon Systems, Inc. Word recognition system which alters code executed as a function of available computational resources
KR970005830B1 (ko) * 1993-12-27 1997-04-21 재단법인 한국전자통신연구소 오디오 코덱 보드
US5640490A (en) * 1994-11-14 1997-06-17 Fonix Corporation User independent, real-time speech recognition system and method
JPH09114543A (ja) 1995-10-02 1997-05-02 Xybernaut Corp ハンドフリーコンピュータ装置
TW439380B (en) * 1995-10-09 2001-06-07 Hitachi Ltd Terminal apparatus
US5754807A (en) * 1995-11-20 1998-05-19 Advanced Micro Devices, Inc. Computer system including a multimedia bus which utilizes a separate local expansion bus for addressing and control cycles
US5794164A (en) * 1995-11-29 1998-08-11 Microsoft Corporation Vehicle computer system
US5797043A (en) * 1996-03-13 1998-08-18 Diamond Multimedia Systems, Inc. System for managing the transfer of data between FIFOs within pool memory and peripherals being programmable with identifications of the FIFOs
US6085314A (en) 1996-03-18 2000-07-04 Advnced Micro Devices, Inc. Central processing unit including APX and DSP cores and including selectable APX and DSP execution modes
US5794068A (en) 1996-03-18 1998-08-11 Advanced Micro Devices, Inc. CPU with DSP having function preprocessor that converts instruction sequences intended to perform DSP function into DSP function identifier
US5987590A (en) 1996-04-02 1999-11-16 Texas Instruments Incorporated PC circuits, systems and methods
US6182203B1 (en) * 1997-01-24 2001-01-30 Texas Instruments Incorporated Microprocessor
US6324592B1 (en) * 1997-02-25 2001-11-27 Keystone Aerospace Apparatus and method for a mobile computer architecture and input/output management system
US5983073A (en) * 1997-04-04 1999-11-09 Ditzik; Richard J. Modular notebook and PDA computer systems for personal computing and wireless communications
JP4067063B2 (ja) 1997-11-14 2008-03-26 松下電器産業株式会社 マイクロプロセッサ
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6330247B1 (en) * 1999-02-08 2001-12-11 Qualcomm Incorporated Communication protocol between a communication device and an external accessory
US6233557B1 (en) * 1999-02-23 2001-05-15 Motorola, Inc. Method of selectively assigning a penalty to a probability associated with a voice recognition system
US6275806B1 (en) * 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
US6192340B1 (en) * 1999-10-19 2001-02-20 Max Abecassis Integration of music from a personal library with real-time information
KR100316696B1 (ko) * 1999-11-12 2001-12-12 송문섭 Imt-2000 단말기용 플랫폼 보드

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI577193B (zh) * 2015-03-19 2017-04-01 陳光超 耳膜助聽器

Also Published As

Publication number Publication date
PT1193690E (pt) 2004-09-30
DE60102993T2 (de) 2005-05-04
JP4132737B2 (ja) 2008-08-13
KR20020026804A (ko) 2002-04-12
US7162426B1 (en) 2007-01-09
DE60102993D1 (de) 2004-06-03
EP1193690A1 (en) 2002-04-03
EP1193690B1 (en) 2004-04-28
JP2002132285A (ja) 2002-05-09
ATE265730T1 (de) 2004-05-15
ES2220630T3 (es) 2004-12-16

Similar Documents

Publication Publication Date Title
TW541470B (en) Computer motherboard architecture with integrated DSP for continuous and command and control speech processing
US6917920B1 (en) Speech translation device and computer readable medium
US6581033B1 (en) System and method for correction of speech recognition mode errors
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
US6952676B2 (en) Voice recognition peripheral device
JP2008287697A (ja) 音声チャットシステム、情報処理装置およびプログラム
KR20040103443A (ko) 고도의 대화형 인터페이스를 위한 의미 객체 동기 이해
JP2004287444A (ja) 多言語テキスト音声変換システムのためのフロントエンドアーキテクチャ
US9812130B1 (en) Apparatus and methods for dynamically changing a language model based on recognized text
CA2613154A1 (en) Dictionary lookup for mobile devices using spelling recognition
JP2005249829A (ja) 音声認識を行うコンピュータネットワークシステム
JP2002116797A (ja) 音声処理装置、音声処理方法及び記憶媒体
Zhou et al. Two-way speech-to-speech translation on handheld devices.
Zhou et al. A hand-held speech-to-speech translation system
CN100380442C (zh) 利用优化音素集进行普通话语音识别的系统和方法
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JPH10260976A (ja) 音声対話方法
JP3411198B2 (ja) 通訳装置及び方法並びに通訳装置制御プログラムを記憶した媒体
Hsiao et al. Optimizing components for handheld two-way speech translation for an English-Iraqi Arabic system
Gardner-Bonneau et al. Spoken language interfaces for embedded applications
Ackermann et al. Speedata: Multilingual spoken data entry
WO2002099786A1 (en) Method and device for multimodal interactive browsing
Zhu et al. Generative Pre-Trained Speech Language Model with Efficient Hierarchical Transformer
Korchynskyi et al. Methods of improving the quality of speech-to-text conversion

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees