TWI297123B - Interactive entertainment center - Google Patents
Interactive entertainment center Download PDFInfo
- Publication number
- TWI297123B TWI297123B TW093141258A TW93141258A TWI297123B TW I297123 B TWI297123 B TW I297123B TW 093141258 A TW093141258 A TW 093141258A TW 93141258 A TW93141258 A TW 93141258A TW I297123 B TWI297123 B TW I297123B
- Authority
- TW
- Taiwan
- Prior art keywords
- interactive
- name
- server
- dialogue
- vocabulary
- Prior art date
Links
- 230000002452 interceptive effect Effects 0.000 title claims description 44
- 238000000034 method Methods 0.000 claims description 27
- 101150012579 ADSL gene Proteins 0.000 claims description 2
- 102100020775 Adenylosuccinate lyase Human genes 0.000 claims description 2
- 108700040193 Adenylosuccinate lyases Proteins 0.000 claims description 2
- 206010011469 Crying Diseases 0.000 claims description 2
- 239000002775 capsule Substances 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 229920001690 polydopamine Polymers 0.000 claims 2
- 239000000126 substance Substances 0.000 claims 2
- 241000282320 Panthera leo Species 0.000 claims 1
- 230000001404 mediated effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 241000255925 Diptera Species 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/16—Analogue secrecy systems; Analogue subscription systems
- H04N7/162—Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
- H04N7/163—Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/16—Analogue secrecy systems; Analogue subscription systems
- H04N7/173—Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
- H04N7/17309—Transmission or handling of upstream communications
- H04N7/17318—Direct or substantially direct transmission and handling of requests
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Description
1297,123 九、發明說明: 【發明所屬之技術領域】 . 本發明係與一種多媒體娛樂系統有關,尤其是盘一種對 互動式多媒體娛樂系統有關。 ' ^ 【先前技術】 現今多數豕庭都具備許多種視聽娛樂家電裝置,像是 視、錄影機、DVD、投影機、音響、手機以及具備網路功能的個 人電腦等,由於這些裝置都各有其特殊功能,因此整合各式各 樣的娛樂家電產品(尤其是客廳中所有的家電)成為所謂的多媒 體娛樂系統(Entertainment Center)便成為未來視聽界 · (Audio-Visual)的一種發展趨勢。 ) 請參閱第一圖,其係習知的多媒體娛樂系統之架構示音 圖。目前多媒體娛樂系統大致可區分為幾個部分,包括多媒^ 糸統100、祠服器糸統101、網路系統1〇2以及控制介面 多媒體系統100中包含音響1001、電視1002、錄影機1003、 ‘ 投影機1004以及機上盒(Set-top Box) 1005等設備,伺服器 系統101則包含全球内容伺服器(gl〇bal content server) 1〇1^ 以及本地伺服器(local server) 1012,網路系統i〇2則包含路 由器1021、數據機1〇22、個人電腦1〇23等網路通設備,控 籲 制介面103則包含各種控制裝置,例如pda 1〇31、遙控器1032 等等。一般來說,機上盒1005負責整合多媒體系統1〇〇中的裝 置,並透過網路系統102與伺服器系統101相連,當使用者經 由控制介面103輸入指令時,會視所需狀況使用全球内容伺服 器1011或是本地伺服器1012所提供的服務,例如從資料庫中 搜尋並擷取所需的資料。 最初’多媒體娛樂系統僅允許使用者做單向操作,使用者 輸入受限制的指令,多媒體系統則依據該指令做出適當的回 應。為了因應機器人性化的趨勢,互動式技術終於也成功地應 11 1297123 用在多媒體娛樂系統上,讓使用者在輸入指令後 循序誘導的選單幫助使用者做更進一步的操作。此外 訊科技的逄勃發展’經由網路所能提供的服務越來越多 互動式系統的優點發揮的淋漓盡致。 即便如此,使用按鍵等方式操作仍然離人性化操作 段不小的距離、然而,隨著語音/語者辨識技術的成孰 者利用聲音對機n下指令已經不是夢想,上述的多聰= 統在整合支援語音/語者辨識技術的介面後透^ ί=ί=Γΐ:系統的裝置。可惜的== 是兮類多女竿:娱U:法做到多方/階層的查詢/命令,但 疋夕媒體綠糸統依然不具備人與機器對話功能。 職是之故,申請人鑑於習知技術之缺失,乃經悉 :二ir不捨之精神,終於研發出-種以對話互動的 【發明内容】 互動在ίίΓ種搭配語音對話系統之對話 不具備人與機器對話功能的缺陷。/類夕媒體無樂糸統 ^虞上述構想,本發明提供一種對 統(Interactive Entertainment Center),媒=樂系 ^統,用以提供各種多媒體服務;一伺服“用2體 舌互動式多媒體娛樂系統所需之各項服務一立亥 器系統及該語音對話系多媒體系統、該伺服 音訊系統, 根據上述構想,其巾該多舰纽更包含: 12 1297123 =提供該使用者音訊相關服務;一視訊系統,用以提供該使 用者視訊_服務;以及-整合裝置,其侧以整合該音訊系 統及該視訊系統,並連結至該網路系統。 根據上述構想,其中該音訊系統係為一立樂梦詈。 根據上述構想,其中該該音訊系統ί為。 根據上述構想,其中該視訊系統為一錄放影機。 根據上述構想’其中該視訊系統為一電視。 根據上述構想,其中該視訊系統為_投影機。 根據上述構想,纟中該整合系統係為—機上盒
Box) 〇 ^ 猶,其巾細料岐包含:—雜機,其係 統;以及—路由器,其係連結該數據機及該 根據上述構想,其中該數據機係為ADSL。 mod二據上述構想,其中該數據機係纜線數據機(—e 服哭構想,其巾賴服料錢包含:—全球内容伺 时謂⑹;以及一本地伺服器(1〇如 ,據上述構想’其中該語音對話系統更包含:—語音/ 辨識益,用以辨識所輸入之語音指令/語者;一文法 j ; —_控制器,其可根據^和解 應;π-語音合成器,用以因應2 上述構想,射該語音/語者辨麵更包含: ^要獨立模型(如為語者辨識則 庫。根據上親想,射敎法觸器更包含_指令語法資料 13 1297123 述構想,其中更包含—多型態(mul ti_m〇 複數個輸人裝置;以及複數個輸錄置。 # ' ^^fuhantLZ^^^^ ' ^11 ^ 音^難細、鄕機、外八、 法,在於提供-種建立辨識字較料庫的方 1該辨識予㈣料庫制於—對話互動式多媒财 能.("Μ όά 1 郎之名稱字彙並自動歸類該節目之型 以:統—名稱字彙;⑷簡化 峨,揭二為:以識=⑷根一 歌手其目之謂__、專輯、 根據上述構想,其中該歌曲、專 係,碟之識別資料(discid)經網路_斤獲ts ’ 係利用list怎:歌曲、專輯、歌手及其相關資訊, =用日紅案之表頭植(header)、槽名及文件名其中之一所 名稱根據上述構想’射目之名辭㈣為树電視節目 有線獲ί中該有線電視節目名稱係經由網路擷取
EntrfpfPn^;^ A^^^(MaxiM Ϊΐ上述構想,其中步驟⑷係根據詞頻方式完成。 之資更新-語音對話系統 對話錢_於—對話互動式多媒體 14 1297123 娱樂系統(Interactive Entertainment Center),該方法包含·· (a)透過夕型悲(muiti-m〇(jai)控制介面輸入一指至續對 ί互體娛樂系統;⑹該語音對話系統根_指1, 恶下自動搜尋並分析可能需要之辨識字彙;以及(C) 根據步驟(b)更新該語音對話系統之資料庫。 —ΐίΐ述構想,其中該語音對話系統之資料庫係為-辨識 子菜勇料庫。 語法Si述構想,其中該語音對話系統之資料庫係為一指令 模型根據上述構想,其巾該語音對料統之㈣縣為一語言 入/ί據上述,’其巾該多麵控制介關包含:複數個輸 入裝置,以及複數個輸出裝置。 鍵 盤 ^上述構想,其中該輸入裝置係為麥克風、遙控器 /月乳及手持(hand held)裝置其中之一。 喇 口八 ίΐ上ΪΪ想,其中該該輸出裝置係為電視、投影機 曰響、錄放影機及電腦其中之一。 ^上述構想,其巾該蚊狀_树歧 3上述構想’其巾雜定狀態麵查詢特定資料庫。 本^狀再-縣在_供—種乡簡
Ett" t!,; ^ ^ ^ ^ ^ ^ ^ dnteraciive 制^肥龄 ),其係包含一多型態(multil〇dal)控 =二面、:正合裝置以及—伺服㈣統,該方法包含 ;⑹根據麵識字彙長度作分級;(e)當該辨 第:服值,或是只有鮮鶴控制介面具 辨識莱之f庫時,由該多型態控制介面進行運算 門^佶日士)ί _識字彙長度A於該第—m錄且小於一第二 彙行Ϊ算辨識;以及⑴當該辨識字 亥弟—門祕^· ’由鋪服料統進行運算辨識。 15 1297.123 ,ΐ:第一門檻值係為_字。 ίϊ' ’ ΐΐ該第二門檀值係為ig酬0字。 根據上賴想,射衫鶴 入裝置;以及複數個輸蚊置。”面更w複數個輸 根據上述構想,其中該輸人裝置鱗風 盤、滑鼠及手持(hand held)裝置其中之—。 工《。鍵 根據上述構想,其中該手持裝置係為一手機。 ⑽f。據上述縣’其巾該顿裝置係為—個人數位助理 音響魏、郷機'♦ 八、
Box)根據上述構想,其中該整合裝置係為—機上盒伽, ,據上述構想,其中該舰器系 (remote server)。 u 服口口 多媒搭配語音對話系統之對話互動式 對話的方式,引導使用;用;ί輸乂 更精細的查_谷’來查詢或操作所要執行的工作。 【實施方式】 太枯ί案將可㈣"I的實施例·而得到充分瞭解,使得熟習 施例而被限制其實施型態。 下】貝 之圖古為,之對話互動式多媒體娛樂系統 加:t ^話糸,洗之方塊,’在弟一圖所提供之多舰娛樂系統 載此語音對話系統’即可成為本案之對話互動式多媒 體士失樂糸統。語音對話糸統2〇包含★五立 16 1297123 气哭201 ,使用者輸入語音之後,該語音/語者辨 依識字彙資料庫2011和語言模型2012,將 齡麵2G13,料_料或加上 ^ 以作為辨識語者之用。文法辨識器202可包含一 以斗庫2021 ’其係用以解析最高分字 、查沾if 可、、Ό 5切對話的語紐4朗者最村能要表 、〜義,將其建成語義訊框(semantie f — =框控制器2Q3。對話控制器2^據 ΐί斜入查詢節目或個人資料庫205,或由新輸入的 =亦可針對查詢結果作分析,引導使用進= 後對話控制器203便將所要輸出的訊息送至 。口曰合成斋204合成語音輸出。 所社’對話互動式多媒體娛樂系統可以是以網路 ΐ二t 祕載上述之語音對料、統2g,包含視訊裝 視、錄放影機、投影機)、音訊裝置(例如音響、剩 合裝置(例如機上盒)與網路系統將多媒體與通訊結 二伺服,系統。在操作方面’對話互動式多媒體娛 u 多型悲(muiti_modai)控制介面配合手動操作或 ϋΐ作’手動操作可利用遙控器、鍵盤、滑鼠等輸入,語音 Γ f可使ϋ克風或是PDA、手機等手持裝置(hand—heid)輸 伺服态系統方面,包含有全球内容伺服器(global =〇n ent server)和本地伺服器(i〇cai server),本地祠服器定 :月可文由全球内容伺服器透過網路傳來之節目表、最新文 Ϊ、字ί或是程式更新,而使用者則透過網路由本地伺服器獲 侍所需貧訊,或是任何其他由本地伺服器所提供的服務。 此外,浯音對話系統2〇所包含的語音/語者辨識器2〇1使 17 1297,123 如^^可,j自動建立個別的專 常聽的歌、常聯絡的人等等,包3吊看的頻這/節目、 的使用者,並呼叫出其ί Li過=辨識,、系統可分辨目前 亦可定時自動幫使用者更新=我^互=多媒體娛樂系統 態(例如節目時間異動、文二t,貝目的最新狀 目。各使用老之摘作,直接找到最常用的項 能,㈣含峨用權限的功 查該使用者是否有“ 要彳依fi用者的聲音便能檢 參 碼頻道或_頻道等。 ㈠’修疋否有觀切換至鎖 ======步介 並力:以分析,猎此更新辨識字彙龍庫顧、語言模型2。12 ίΐ令ΪΓί料庫2〇21,使語音/語者辨識器201可隨時搭配 娛樂系統的行為,達到具有無限制數量的辨 識字彙適應使用者的操作。 项 j亦提供-種建立對話互動式多媒體娛樂系統所常用的 «,的方法。首先,由系統擷取及/紐用者輸人節目的名 稱字彙’並對該節目進行歸類動作。舉例來說,歌曲的名稱 ί來源有以下幾種··⑴若是音樂光碟,則可利用光碟之識別 資料(DISCID)至網路(http://www. freedb. org)上查詢,可以搜 尋到,f樂光碟之專輯名稱、歌手、歌名、長度等資訊可作為 名稱字彙;(2)若是mp3等音樂檔案,則可從音樂檔案之表^ 檔(header)獲得該檔案之專輯名稱、歌手、歌名等資訊可作為 名稱子莱,(3)若音樂播案不具表頭檐(hea(jer),則播名亦^ 18 I297J23 ==地:;S目=可如前文所述,由全球内 為了節省許多可能囊通常很繁雜’因此 機會,接著就必須統一名稱字彙 有造成辨識錯誤的 有「早安您好華視新聞」、巧:視新聞就 等等,若全舰照節目表建=^,聞么華視午間新聞」 用者也不可能記得這麼多節二子菜’便有混淆的可能,使 -律將華視所有的_節f據本案之方法, 輸入的語法簡單易記,而對辨識細者來說 能還存在著,==但二 口些7便可去掉。舉以 理《如_什晴泞二;:會掉。最後,再以最大熵原 稱字彙中的關鍵字。舉例來$,hi詞頻方式,擷取該名 為「航海王」、+例采5兒上例中的辨識字彙就可能展開 ί 〇 目名稱太長或亡奸曰L辨識子菜,即使使用者可能因為節 者依% ’而僅輸入部分的節目名稱’使用 的節目或歌曲^ 旬的方式,找到類似使用者所要查詢 分散袁樂系統是以網路所結合的 二是環節。-般辨識系統的運算ί 做辨識:以;=遠端舰器(_叫去 辨識的運算架構,級 辨識運算’在使用者輸入裝置、 19 1297123 ,可以根據辨識字囊長度做分級,若辨1字-具 度叙紐,或是辨識字彙所對應的資 識子菜長 時,例如PDA、手機儲存的個人通訊錚,者輪入裝置 「我的最愛」這種約幾百字彙以内,便^ 所提及的 比較複雜-__互動式多髓置做辨識; 節目查解_千字的觸工作,便令、或是 ==識幾十萬字°的辨識4這種整合 像是查 询電話料,便交給遠端触騎行 間互動式多媒體娛樂系 二=由多;,系統。縱使 解:本案得藉由下列圖示與實施例之說明,俾得一更深入之瞭 【圖式簡單說明】 以及 話系統之方塊圖 篇示ΪΓ:的多媒體娱樂系統之架構示意圖,一 為本*之對話互動❹舰娛樂祕之語音對 【主要元件符號說明】 100 :多媒體系統 1001 :音響 1002 :電視 1003 :錄影機 1004 :投影機 1005 :機上盒(Set-top Box) 101 :伺服器系統 20 1297123 1011 :全球内容飼服器(global content server) 1012 :本地伺服器(i〇cai server) 102 :網路系統 1021:路由器 1022 :數據機 1023 :個人電腦 103 :控制介面
1031 : PDA 1032 :遙控器 20 ·语音對話系統 201 ··語音/語者辨識器 2〇11 ·辨識字彙資料庫(Lexicon) 2012 ·語言模型(Language Model) 2013 ·語者獨立模型(gpeaker independent Model) 2014 ·個別語者模型(Speaker Dependent Model) 202 ·文法辨識器(Naturai Language Grammar Parser) 2021 :指令語法資料庫 203 :對話控制器 204:語音合成器 205 :個人資料庫
Claims (1)
1297123 十、申請專利範圍: 1. 一種對話互動式多媒體娛樂系統(Interactive Entertainment Center),其包含·· 一多媒體糸統,用以提供各種多媒體服務; -飼服m用以提供該對話互動式多媒體娛樂系 需之各項服務; 一#音對話系統,用以作為一使用者利用語音控制 互動式多媒體娛樂系統之介面;以及 ^ 酬蝴、鋪酬統及該語 與能動式多媒崎系統 2统如叙賴絲❹聰埃樂系 一音訊,統,用以提供該使用者音訊相關服務; 一=訊系統,用以提供該使用者視訊相關服務;以及 i如專鄉2項雌之對話絲❹媒體娛樂系 、、先,其中該音訊系統係為一音響裝置。 、、’、 4統如其输祕媒嶋系 6統對話互動式多媒體娱樂系 第2項所狀職絲式多顧娱樂系 8如申^訊糸統為一投影機。 • Τ明專利範圍第2項所述之對話互動式多媒體娛樂系 22 1297123 統,其中該整合系統係為一機上盒(Set-top Box)。 9·如申請專利範圍第1項所述之對話互動式多媒體娛樂系 統,其中該網路系統更包含: 一數據機,其係連結至該伺服器系統;以及 一路由器,其係連結該數據機及該多媒體系統。 10·如申請專利範圍第9項所述之對話互動式多媒體娛樂系 統,其中該數據機係為ADSL。 11·如申請專利範圍第9項所述之對話互動式多媒體娛樂系 統,其中該數據機係纜線數據機化让^ m〇dem)。 12·如申請專利範圍第丨項所述之對話互動式多媒體娛樂系 統,其中該伺服器系統更包含: 一全球内容伺服器(global content server);以及 一本地伺服器(local server)。 - 觸裔,肋賴所輸人之語音指令/語者; -’ μ解析該語音指令之語義; 回應;以1彻,其可根據辨識和解析結果判斷給予適當 14.如圍::該回應而輸出-合成語音。 統,其愧語話互喊錢體娛樂系 一辨識字彙資料庫;文匕3 · 一語言模型; 一語者模型;以及 一语者獨立模型。 15·如申請專利範圚楚 統,其中該文法辨妈哭由3,所述之對話互動式多媒體娛樂系 16.如申請專利範包含一指令語法資料庫。 弟1項所述之對話互動式多媒體娛樂系 23 1297123 統’其中更包含一多型態(multi_modal)控制介面,宜 衩數個輸入裝置;以及 複數個輸出裝置。 17.如申請專利範圍第16項所述之對話互動式多 統,其中該輸入裝置係為麥克風、遙控器、鍵盤:滑ϋ 持(hand held)裝置其中之一。 亍 18·如申請專利範圍第16項所述之對話互 統,其中該輸出裝置係為電視、投影機uti 影機及電腦其中之一。 綠放
1 用辨f庫的方法’該觸字彙資料庫係 用於一對話互動式多媒體娛樂系統(interactive Entertainment Center)之一語音對話系統,該方法包含: (a)擷取一節目之名稱字彙並歸類該節目之型能; (W巧一該節目名稱字彙成為一統一名稱字彙了, (c)簡化該統-名稱字彙成為_簡化名稱|以 字囊⑷根據該簡化名稱字彙,綠取至少—關鍵字作為辨識 t如申請專利範圍第19項所述之方法,其中該節目之名摇 字彙係為歌曲、專輯、歌手及其相關資丄
21. 如申請專利範圍項所述之方法,直、中t曲 22. 如申請專利範圍第2〇項所述之方法,其 歌手及其相隨訊,係湘音樂魅 名及文件名其中之-所獲得。木之表雌(―㈣、檔 23·如申請專利範圍第丨9項所述之 字彙係為有線電視節目名稱。 / ’、巾4目之名稱 24·如申請專利範圍第23項所述之 目名稱係經由網«取有線電視節目表所^林線電視即 24 1297123 如申請專利範圍第19項所述之方法,其中 最大墒原理(Maximum Entropy Principle)完成/)係利用 利範圍第19項所述之方法,其中步_)係根據 2j::獅態更新-語音對話祕之資料庫之方法,該纽立 舌糸統_於-對話互動式多媒體娛縣統(加⑽曰 Entertainment Center),該方法包含: (a) 透過一多型態(multi一m〇dal)控制介面輸入 a 至該對話互動式多媒體娛樂系統; 曰7 (b) 該語音對話系統根據該指令,於一 搜尋並分析可能需要之辨識字彙;以及4寺疋狀怨下自動 (c) 根據步驟(b)更新該語音對話系統之資料 28·如申請專利範圍第27項所述之方法 統之資料庫係為一辨識字彙資料庫。 Y 曰對話糸 其中該語音對話系 其中該語音對話系 29·如申请專利範圍第27項所述之方法 統之資料庫係為一指令語法資料庫。 30·如申請專利範圍第27項所述之方法 統之資料庫係為一語言模型。 專利範圍第27項所述之方法,其中該多型態控制 複數個輸入裝置;以及 棱數個輸出裝置。 第27項所述之方法’其懷定狀態係 25 1297123 3為4查ίΐίί:圍第27項所述之方法,其中該特定狀態係 3斑5'_^級觸運算方法’其係適用於—互動式多媒體娱 多 ^ 能 f Entertainment Center),其係包含- 統,^ ^含她Ό控制介面、一整合裝置以及一祠服器系 (a) 提供一辨識字彙; (b) 根據該辨識字彙長度作分級; 控制介面進行運算ίΐ辨識子菜之資料料,由該多型態 門伊t當字彙長度大於該第—門檻值且小於一第二 門k值%,由該整合裝置進行運算辨識;以及 器系=2=彙長度大於該第二門檻值時,細服 Ϊ為專利乾圍第35項所述之方法,其中該第-門檻值 Ϊ面專利範圍第35項所述之方法,其中該多型態控制 複數個輸入裝置;以及 複數個輸出裴置。 3為9夫3請!利範圍第38項所述之方法,其中該輸入㈣ ^克風、遙控ϋ、鍵盤、滑鼠及手持(handheld)裝置其中 =·一=請專利範圍第39項所述之方法,其中該手持裝置係 41.如申請專利範圍第39項所述之方法,其中該手持裝置係 26 1297123 為一個人數位助理(PDA)。 42. 如申請專利範圍第38項所述之方法,其中該輸出裝置係 為電視、投影機、喇队、音響、錄放影機及電腦其中之一。 43. 如申請專利範圍第35項所述之方法,其中該整合裝置係 為一機上盒(Set-top Box)。 44. 如申請專利範圍第35項所述之方法,其中該伺服器系統 係為一遠端伺服器(remote server)。
27 1297】23 七、指定代表圖: (一) 本案指定代表圖為:第(一、二)圖。 (二) 本代表圖之元件符號簡單說明: 100:多媒體系統 1001 ··音響 1002 :電視 1003 :錄影機 1004 :投影機 1005 :機上盒(Set-top Box) 101 :伺服器系統 1011 ·全球内容伺服器(global c〇ntent server) 1012 ·本地祠服 (i〇cai server) 102 :網路系統 1021 :路由器 1022 :數據機 1023 :個人電腦 103 :控制介面 1031 : PDA 1032 :遙控器 20 ·#音對話系統 201 :語音/語者辨識器 2〇11 ·辨識字彙資料庫(Lexicon) 2012 ·語言模型(Language Model) 2013 :語者獨立模型(Speaker Independent Model) 2014 ·個別語者模型(Speaker Dependent Model) 202 ·文法辨識器(Natural Language Grammar Parser) 2021 :指令語法資料庫 1297123 203 :對話控制器 204 :語音合成器 205 :個人資料庫 八、本案若有化學式時,請揭示最能顯示發明特徵的化學式:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW093141258A TWI297123B (en) | 2004-12-29 | 2004-12-29 | Interactive entertainment center |
US11/294,307 US20060143681A1 (en) | 2004-12-29 | 2005-12-05 | Interactive entertainment center |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW093141258A TWI297123B (en) | 2004-12-29 | 2004-12-29 | Interactive entertainment center |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200625157A TW200625157A (en) | 2006-07-16 |
TWI297123B true TWI297123B (en) | 2008-05-21 |
Family
ID=36613330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW093141258A TWI297123B (en) | 2004-12-29 | 2004-12-29 | Interactive entertainment center |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060143681A1 (zh) |
TW (1) | TWI297123B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8473276B2 (en) * | 2008-02-19 | 2013-06-25 | Google Inc. | Universal language input |
KR102112742B1 (ko) * | 2013-01-22 | 2020-05-19 | 삼성전자주식회사 | 전자장치 및 그 음성 처리 방법 |
US11314826B2 (en) | 2014-05-23 | 2022-04-26 | Samsung Electronics Co., Ltd. | Method for searching and device thereof |
US9990433B2 (en) | 2014-05-23 | 2018-06-05 | Samsung Electronics Co., Ltd. | Method for searching and device thereof |
CN108885872A (zh) | 2016-04-11 | 2018-11-23 | 三菱电机株式会社 | 应答生成装置、对话控制系统以及应答生成方法 |
CN114341866A (zh) * | 2019-09-30 | 2022-04-12 | 深圳市欢太科技有限公司 | 同声传译方法、装置、服务器和存储介质 |
WO2021102754A1 (zh) * | 2019-11-27 | 2021-06-03 | 深圳市欢太科技有限公司 | 数据处理方法、装置和存储介质 |
TWI735168B (zh) * | 2020-02-27 | 2021-08-01 | 東元電機股份有限公司 | 語音控制機器人 |
CN113359538A (zh) * | 2020-03-05 | 2021-09-07 | 东元电机股份有限公司 | 语音控制机器人 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6643620B1 (en) * | 1999-03-15 | 2003-11-04 | Matsushita Electric Industrial Co., Ltd. | Voice activated controller for recording and retrieving audio/video programs |
US7533399B2 (en) * | 2004-12-02 | 2009-05-12 | Panasonic Corporation | Programming guide content collection and recommendation system for viewing on a portable device |
-
2004
- 2004-12-29 TW TW093141258A patent/TWI297123B/zh not_active IP Right Cessation
-
2005
- 2005-12-05 US US11/294,307 patent/US20060143681A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
TW200625157A (en) | 2006-07-16 |
US20060143681A1 (en) | 2006-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3725566B2 (ja) | 音声認識インターフェース | |
US5526407A (en) | Method and apparatus for managing information | |
US5583965A (en) | Methods and apparatus for training and operating voice recognition systems | |
Arons | Hyperspeech: Navigating in speech-only hypermedia | |
CN100394438C (zh) | 信息处理装置及其方法 | |
US20040006481A1 (en) | Fast transcription of speech | |
KR20120038000A (ko) | 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템 | |
US20060095848A1 (en) | Audio user interface for computing devices | |
JP2011209786A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
KR102208954B1 (ko) | 대화록 서비스를 제공하는 컴퓨팅 장치 | |
JP2011209787A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
JP5731998B2 (ja) | 対話支援装置、対話支援方法および対話支援プログラム | |
CN108063969A (zh) | 显示设备、控制显示设备的方法、服务器以及控制服务器的方法 | |
WO2007132690A1 (ja) | 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム | |
US20230252981A1 (en) | Systems and Methods for Identifying and Providing Information about Semantic Entities in Audio Signals | |
CN107527619A (zh) | 语音控制业务的定位方法及装置 | |
TWI297123B (en) | Interactive entertainment center | |
JP2000207170A (ja) | 情報処理装置および情報処理方法 | |
EP1317749A1 (en) | Method of and system for improving accuracy in a speech recognition system | |
JP2005202035A (ja) | 対話情報分析装置 | |
Roy et al. | Wearable audio computing: A survey of interaction techniques | |
US20230153061A1 (en) | Hierarchical Context Specific Actions from Ambient Speech | |
US20220236945A1 (en) | Information processing device, information processing method, and program | |
JP2006189799A (ja) | 選択可能な音声パターンの音声入力方法及び装置 | |
JPH08249343A (ja) | 音声情報取得装置及び音声情報取得方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |