TWI311310B

TWI311310B -

Info

Publication number: TWI311310B
Application number: TW95111658A
Authority: TW
Inventors: Chien An Chen
Original assignee: Inventec Besta Co Ltd
Priority date: 2006-03-31
Filing date: 2006-03-31
Publication date: 2009-06-21
Also published as: TW200737123A

Description

1311310 九、發明說明：【發明所屬之技術領域】特別是指利用辨識語示之圖像產生與人互一種使用語音命令之互動系統及方法，音命令來控制呈現相對應的互動資料，使顯動之效果的系統及方法。【先前技術】聲音辨識的對象包括人類發出的語音、樂器發_音樂讀出的噪音、_的叫聲、聲納、大自然的聲音等。簡單的說，聲音辨識就是以機器騎人類耳朵的聽覺功能，進而使機器執行相對應的工作，來達到自動化的效果。、電腦藉__數位的轉換裝置將語音取樣的龍數位化成為數值讀之後，會將輸人的聲音樣本與麟的聲音樣本進行比對工作’比對完成後電腦會輸出一個它認為最像的聲音樣本序號，於是就可以知道輸入的語音要它做什麼樣的工作。 ±但是，要知道即使同一個人在同一環境使用同樣的麥克風連 ‘發出兩次同樣的語音，語音取樣㈣也不可能完全相同，所以如何把語音在異中求同，這就是聲音辨識技術的問題所在。也因此，在辨識人類發出的語音方面，根據詞彙聲音樣本數量分為小字彙(<100詞）、中字彙(10CM 000詞）、大字彙i 〇〇1 Μ 〇〇〇〇詞）、極大字彙(>10000詞)幾類，各類有著不同複雜度的辨識技術，使知°司菜數多的類別儘量的提高辨識率。 5 1311310 、雖然在數年㈣已财人提絲來語音輸人將是主要的輸入方Ί甚至連不少大型軟體商也都看好這個有著璀燦未來和魔大商機的市場’但是，由於上述賴_語音辨翻_度，因此。口曰辨識技術直恶法有效的提高輸入的語音的辨識率，是故語音輸入-直沒有如職的被使用在各軟體上。雖然如此’在消電子產品方面，隨著舰上的進步，輸入方式發生了輸崎，從傳統的魏輸人進步至齡式螢幕的輸入，甚至到現在的手寫輸入以及語音輸入，而目前在消費性電子產品上語讀錢_語音觸技術，大乡是語 (V〇,CeC咖喊_)的部份，其使用中或小字囊的辛識 3。是故，實際上可以辨識的詞彙並不多，所以由就#使用上來看，相當的不具親和力，因此使用者對細術的接受度不高。日辨4技然而，語音辨識技術在未來幾年識率這是—倾㈤有相提高辨入嗎問’所以可以預期的五效的提升辨識率之前，如何增加使用語。1雜術有要解決的問題。 ^镇和力疋-個需【發明内容】以上的_，本發明的主要目的在於脖— 使:;令的=來控制呈現該語音命令 _ 使件顯不之圖像與人產生互動的系統及方土飞動4，用者利用語音命令歸輸人讀，會：過本發明，在使應该语音命令所對應的晝

為達上述目的，本發明可簡由方法與紐兩方面達成，本動斤揭路之系統，包括有：語音接收模組、語音辨識模組、互 =組料賴組。本發明簡露之方法，包括有下列步人，'接收_δ#音命令，细語音辨識技術細識該語音命 :，辨識後會產生-個_資料，接著依據辨識產生的辨識資料料庫中讀㈣應的互動資料，最後將讀出的互動資料呈规出來。合另外’本發明逛可以在系統上附加一個下載模組，在方法上 =加-财驟，下載—個圖像或—個互動資料，並把下載的圖象或互動資料存入互動資料庫中。

有關树賴雜與實作，舰合_作最佳實明如下。【實施方式】本發明可以藉由系統及方法兩部分的執行來達到預期的目 ^以下先以「第1圖」本伽之語音命令之互動系統及方 :之功能區翻來綱本發統運作。如_示，本發明之系統含有語音接收模組110、語音辨識模組12〇、互動模組⑽、互動資料庫模組15〇。其中語音接收模組彻負責接收語立，並將接收_語音命令秘語音觸歡咖語音觸模組^ 7 1311310 負責辨識語音接收槿έ Ή 生對應於語音命令的辨t 音命令，並於辨識後產 ⑽；互__ ^貝^=將該辨識資料送往互動模址音粗> % 負貝在取侍-音辨識模組120所送來的辨識互動、域接收到的辨識資料由互動資料庫模組150中讀出出亚且於互動資料讀取完畢之後將讀出的互動資料呈現料。’貪料庫模組150負責儲存包含有動晝或聲音的互動資方法之方^由第2圖」本發明之使躲音命令之互動系統及來說明本剌方法的運作絲。當使用者使用語二個崎令，語音接收模組m會接收該电120^/ 1Q) ’亚會將接_的語音命令交給語音辨識模識技術對音命令之齡使轉音辨 μ ^曰°P々進行觸（步驟220)，在辨識完該語音命令 "赶靖應於該語音命令㈣識資料，並交給互動模模組140在取得語音辨識模組12〇產生的辨識資料料，從互動資料庫模組150中讀出對應於 …日貝；、且已含有動晝或聲音的互動資料（步驟230)，最後將料呈現給使用者（步驟_，使使用者在聽覺或視= 接著以-個實施例來解說本發_運作系統與方法。當使用者使用執衫本發子辭觸，制者可町料—語音么令「查劍橋百科」，於是本發明就會接收到第—語音命令「查^ 8 !31131〇、=的聲音，並對第一語音命令「查劍橋百科」進行辨識，經 = 4'，本㈣可以由互動倾縣得第—語音命令「查劍橋放第」的第—聲音「沒問題，請使用^ (第—互動資料），並播 =一聲音給使用者朗，同時將電子字典的絲晝面切換橋百科的輸入晝面。本發_互動射則貞㈣統的所發生的事件 ’並由_料庫模組15〇中取得對應於系統發生的事絲㈣，以呈現給細者。延續上—個實施例，當使 =將电子辭典_時’本發明會偵測到系統發生關機的事件，於疋本發明由互動資料庫取得關機事件的第二聲音（第二料）’並播放出第二聲音「謝謝您的使用丨」貝接著再以第二實_來說贿說本發明崎作系雖方法，使用者將執行有本發明的PDA進行開機時，如「第3a圖」所干，本發明會在顯示幕上，顯示—個虛擬_像，該虛擬的圖像包含人像、動物㈣ '卡通人物、植_铸，但不以限’第一圖像以可愛美少女為例，開機晝面會顯示-個可愛美; ^並播放第三聲音「主人您好，您需要什麼服務呢？」及播放嘴巴開閨」的第一動晝（第三互動資料），如「第3A圖」、 3B圖」、「第3C圖」、「第3B圖」、「第3A圖」所示之連續動作，使得可愛❹、女看似在與者·，如此會使得制者更有歲可愛美少女互_感覺。當職完成至使用者下達語音命令的中、途，可以由本發明_發現使用者正處於間置狀態，於是讀出使 1311310 用者閒置的第二動畫「愛美少姐眼的動畫呈現於畫面上，如「第放可開始晝面，「第3D周+ A圖」表不眨眼之續閒置，則會進入:幕俾^眼進行中之晝面。若使用者依然繼「玩勒日1^ 顧式。直到賴者下達第二語音命令 η T本發明讀出對應於第二語音五互動資料—可愛玩遊戲」的弟的動作，接著遊戲便門㈣賴選項，並有將該遊戲取出間之互動關係更為密^執仃，如此將使得可愛美少女與使用者本發明更包含有—個下細組湖二圖像下載並儲存至貞讀互動貝枓或者弟互動方式可以不斷的改，使得使用者與圖像的實施例，在進式時更續上述第二幕保鳟、〗α為絲胃料庫林有對應螢 ❺互動㈣’故本發明無法呈現相關的互動資者。但是在下载了可錢少女所屬的螢 =動㈣之後，當進人螢幕保護模式之前， = 要時在叫我丨」的聲立万叙从夺「 s褚放而使用者以η 旦面第3E圖」之問候動晝與 / °除了下鼓動資狀外，本伽也可以下賴们m Π二個實施例來說明之’使用者欲將顯示之虛擬的圖可久美少女更換為卡通圖案，於是下載第二圖像卡 =圖案的圖像’如「第4圖」，當下載完成 =成的系嶋發生，於是可以播放可愛美少女= 旦弟七互動貪料）來告知使用者以下載完成，此時使用者便 10 1311310 =將弟—圖像（可愛美少女）進行更換，並繼續下載卡通圖案 ^ :圖像）的互動資料，例如開機、進入螢幕保護模式、關機 r田下载完成之後’如有互動資料庫中存有卡通圖案（第' 像)>的下敎成料的第八互動資料，則原先播放的可愛美少^ =圖像）的第七互動貧料會改為播放卡通圖案（第二圖的弟八互動㈣來告知使用者下餘畢，若互動資料庫沒有統事件之互動資料則不產生互動。心糸雖然本發_賊之触實_減如上，然魅非用定本發明，任何㈣娜祕者，在不_本_之精神和範圍内，當可作些許之更動與_，因此本發明之專利保護範圍本說明書所附之申請專利範圍所界定者為準。、見【圖式簡單說明】第1圖係本發騎提之使聽音命令能區塊圖。 _、、紐方法之功第2圖係本發明所提之使用語音命令之法流程圖。 Μ統及方法之方第3Α圖係本發明實施例所提之說話分解動作厂、立。第3Β圖係本發明實施例所提之說話分解動作厂、立: 第3C圖係本發明實施例所提之說話分解動作示二: 第3D圖係本發明實施例所提之眨眼動作示音。心回第3Ε圖係本發明實施例所提之問候 : /忭不意圖。 11 1311310 第4圖係本發明實施例所提之下載之新圖像。【主要元件符號說明】 100 裝置 110 語音接收模組 120 語音辨識模組 140 互動模組 150 互動資料庫模組 160 下載模組 190 事件訊息 300 PDA顯示幕 310 虛擬圖像步驟210接收語音命令步驟220辨識語音命令步驟230讀出對應的互動資料步驟240呈現互動資料 12

Claims

1311310 、申請專利範圍·· 卜％[2月f 更)替換買 1. 一種使用語音命令之互動系第一圖像進行互動，該系统包含糊用—語音命令與一顯示之二音接收模組，用簡^語音命令；一浯音辨識模組，用以立應於該語音命令之一辨識資料h ’於辨識後產生對網互^料庫模組，用以錯存該第一圖像之至少一第一互動貝科該弟-互動資料至少包含一動晝或一聲料中之―，且該第一互動㈣對應於該辨識資料；及動私、、且用以依據該辨識資料由該互動資料庫模經中至対出該第-互動資料，並呈現該第一互動資料，其令該互動撫，中之據_出該第—互動f料之該辨識資料還可為一事件資料’該事件資料產生於谓測到一事件發生時，該事件為開機、進入螢幕保護模式、顯示提示資訊、或關機。 2. 如申請專利細第）項所述之使用語音命令之互動系統，其中該動晝至少包含該第一圖像之一動作。 3. 如申請專利範圍第1項所述之使用語音命令之互動系統，其中更包含一下載模組，用以下載第二圖像或第二互動資料，並存入該互動資料庫模組中。 4.如申請專利範圍第1項所述之使用語音命令之互動系統，其中該系統更可以包含複數個圖像，經由切換顯示該複數個圖像其中之一。 13

-種使用語音命令之互動方法，係糊_語音命令與—顯示之第一圖像進行互動，該方法包含下列步驟： ’' (a)接收該語音命令； ⑼辨識該語音命令’於觸後纽對應_語音命令之一辨識資料； ⑹由一互動資料庫中讀出對應於該辨識資料的該第一圖像之至少-第-互動資料，其中該第—互動資料至少包含一動晝或一聲音其中之一，該辨識資料還可為一事件資料，該事件資料產生於_有-事件發生時，該事件為職、進入榮幕保護模式、顯示提示資訊、或關機；及 (d)呈現該第一互動資料。如申請專利範圍第5項所述之使用語音命令之互動方法，其中該步驟(c)所述之該動晝至少包含該第一圖像之一動作。如申請專利範圍第5項所述之使用語音命令之互動方法，其中更包含一步驟，下載第二圖像或第二互動資料，並存入該互資料庫中。如申請專利範圍第5項所述之使用語音命令之互動方法，其中更包含一步驟’經由切換顯示預先存於該互動資料庫之複數個圖像其中之一。