TWI311310B - - Google Patents
Download PDFInfo
- Publication number
- TWI311310B TWI311310B TW95111658A TW95111658A TWI311310B TW I311310 B TWI311310 B TW I311310B TW 95111658 A TW95111658 A TW 95111658A TW 95111658 A TW95111658 A TW 95111658A TW I311310 B TWI311310 B TW I311310B
- Authority
- TW
- Taiwan
- Prior art keywords
- interactive
- data
- voice
- voice command
- image
- Prior art date
Links
Landscapes
- User Interface Of Digital Computer (AREA)
- Details Of Television Systems (AREA)
Description
1311310 九、發明說明: 【發明所屬之技術領域】 特別是指利用辨識語 示之圖像產生與人互 一種使用語音命令之互動系統及方法, 音命令來控制呈現相對應的互動資料,使顯 動之效果的系統及方法。 【先前技術】 聲音辨識的對象包括人類發出的語音、樂器發_音樂 讀出的噪音、_的叫聲、聲納、大自然的聲音等。簡單的說, 聲音辨識就是以機器騎人類耳朵的聽覺功能,進而使機器執行 相對應的工作,來達到自動化的效果。 、電腦藉__數位的轉換裝置將語音取樣的龍數位化成 為數值讀之後,會將輸人的聲音樣本與麟的聲音樣本進行比 對工作’比對完成後電腦會輸出一個它認為最像的聲音樣本序 號,於是就可以知道輸入的語音要它做什麼樣的工作。 ±但是,要知道即使同一個人在同一環境使用同樣的麥克風連 ‘發出兩次同樣的語音,語音取樣㈣也不可能完全相同,所以 如何把語音在異中求同,這就是聲音辨識技術的問題所在。也因 此,在辨識人類發出的語音方面,根據詞彙聲音樣本數量分為小 字彙(<100詞)、中字彙(10CM 000詞)、大字彙i 〇〇1 Μ 〇〇〇〇詞)、 極大字彙(>10000詞)幾類,各類有著不同複雜度的辨識技術,使 知°司菜數多的類別儘量的提高辨識率。 5 1311310 、雖然在數年㈣已财人提絲來語音輸人將是主要的輸入 方Ί甚至連不少大型軟體商也都看好這個有著璀燦未來和魔大 商機的市場’但是,由於上述賴_語音辨翻_度,因此 。口曰辨識技術直恶法有效的提高輸入的語音的辨識率,是故語 音輸入-直沒有如職的被使用在各軟體上。 雖然如此’在消電子產品方面,隨著舰上的進步,輸 入方式發生了輸崎,從傳統的魏輸人進步至齡式螢幕 的輸入,甚至到現在的手寫輸入以及語音輸入,而目前在消費性 電子產品上語讀錢_語音觸技術,大乡是語 (V〇,CeC咖喊_)的部份,其使用中或小字囊的辛識 3。是故,實際上可以辨識的詞彙並不多,所以由就#使用 上來看,相當的不具親和力,因此使用者對 細 術的接受度不高。 日辨4技 然而,語音辨識技術在未來幾年 識率這是—倾㈤有相提高辨 入嗎問’所以可以預期的 五 效的提升辨識率之前,如何增加使用語 。1雜術有 要解決的問題。 ^镇和力疋-個需 【發明内容】 以上的_,本發明的主要目的在於脖— 使:;令的=來控制呈現該語音命令 _ 使件顯不之圖像與人產生互動的系統及方土 飞動4, 用者利用語音命令歸輸人讀,會:過本發明,在使 應该语音命令所對應的晝
為達上述目的,本發明可簡由方法與紐兩方面達成,本 動斤揭路之系統,包括有:語音接收模組、語音辨識模組、互 =組料賴組。本發明簡露之方法,包括有下列步 人,'接收_δ#音命令,细語音辨識技術細識該語音命 :,辨識後會產生-個_資料,接著依據辨識產生的辨識資料 料庫中讀㈣應的互動資料,最後將讀出的互動資料呈 规出來。 合另外’本發明逛可以在系統上附加一個下載模組,在方法上 =加-财驟,下載—個圖像或—個互動資料,並把下載的圖 象或互動資料存入互動資料庫中。
有關树賴雜與實作,舰合_作最佳實 明如下。 【實施方式】 本發明可以藉由系統及方法兩部分的執行來達到預期的目 ^以下先以「第1圖」本伽之語音命令之互動系統及方 :之功能區翻來綱本發統運作。如_示,本發明之 系統含有語音接收模組110、語音辨識模組12〇、互動模組⑽、 互動資料庫模組15〇。其中語音接收模組彻負責接收語立, 並將接收_語音命令秘語音觸歡咖語音觸模組^ 7 1311310 負責辨識語音接收槿έ Ή 生對應於語音命令的辨t 音命令,並於辨識後產 ⑽;互__ ^貝^=將該辨識資料送往互動模址 音粗> % 負貝在取侍-音辨識模組120所送來的辨識 互動、域接收到的辨識資料由互動資料庫模組150中讀出 出亚且於互動資料讀取完畢之後將讀出的互動資料呈現 料。’貪料庫模組150負責儲存包含有動晝或聲音的互動資 方法之方^由第2圖」本發明之使躲音命令之互動系統及 來說明本剌方法的運作絲。當使用者使用 語二個崎令,語音接收模組m會接收該 电120^/ 1Q) ’亚會將接_的語音命令交給語音辨識模 識技術對音命令之齡使轉音辨 μ ^曰°P々進行觸(步驟220),在辨識完該語音命令 "赶靖應於該語音命令㈣識資料,並交給互動模 模組140在取得語音辨識模組12〇產生的辨識資料 料,從互動資料庫模組150中讀出對應於 …日貝;、且已含有動晝或聲音的互動資料(步驟230),最後將 料呈現給使用者(步驟_,使使用者在聽覺或視= 接著以-個實施例來解說本發_運作系統與方法。當使用 者使用執衫本發子辭觸,制者可町料—語音么 令「查劍橋百科」,於是本發明就會接收到第—語音命令「查^ 8 !31131〇 、=的聲音,並對第一語音命令「查劍橋百科」進行辨識,經 = 4',本㈣可以由互動倾縣得第—語音命令「查劍橋 放第」的第—聲音「沒問題,請使用^ (第—互動資料),並播 =一聲音給使用者朗,同時將電子字典的絲晝面切換 橋百科的輸入晝面。 本發_互動射則貞㈣統的所發生的事件 ’並由_料庫模組15〇中取得對應於系統發生的事 絲㈣,以呈現給細者。延續上—個實施例,當使 =將电子辭典_時’本發明會偵測到系統發生關機的事件, 於疋本發明由互動資料庫取得關機事件的第二聲音(第二 料)’並播放出第二聲音「謝謝您的使用丨」 貝 接著再以第二實_來說贿說本發明崎作系雖方法, 使用者將執行有本發明的PDA進行開機時,如「第3a圖」所干, 本發明會在顯示幕上,顯示—個虛擬_像,該虛擬的 圖像包含人像、動物㈣ '卡通人物、植_铸,但不以 限’第一圖像以可愛美少女為例,開機晝面會顯示-個可愛美; ^並播放第三聲音「主人您好,您需要什麼服務呢?」及播放 嘴巴開閨」的第一動晝(第三互動資料),如「第3A圖」、 3B圖」、「第3C圖」、「第3B圖」、「第3A圖」所示之連續動作, 使得可愛❹、女看似在與者·,如此會使得制者更有歲 可愛美少女互_感覺。當職完成至使用者下達語音命令的中、 途,可以由本發明_發現使用者正處於間置狀態,於是讀出使 1311310 用者閒置的第二動畫「 愛美少姐眼的動畫呈現於畫面上,如「第放可 開始晝面,「第3D周+ A圖」表不眨眼之 續閒置,則會進入:幕俾^眼進行中之晝面。若使用者依然繼 「玩勒日1^ 顧式。直到賴者下達第二語音命令 η T本發明讀出對應於第二語音 五互動資料—可愛 玩遊戲」的弟 的動作,接著遊戲便門㈣賴選項,並有將該遊戲取出 間之互動關係更為密^執仃,如此將使得可愛美少女與使用者 本發明更包含有—個下細組湖 二圖像下載並儲存至 貞讀互動貝枓或者弟 互動方式可以不斷的改,使得使用者與圖像的 實施例,在進式時更續上述第二 幕保鳟、〗α為絲胃料庫林有對應螢 ❺互動㈣’故本發明無法呈現相關的互動資 者。但是在下载了可錢少女所屬的螢 =動㈣之後,當進人螢幕保護模式之前, = 要時在叫我丨」的聲立万叙从夺 「 s褚放而 使用者以η 旦面第3E圖」之問候動晝與 / °除了下鼓動資狀外,本伽也可以下賴 们m Π二個實施例來說明之’使用者欲將顯示之虛擬的圖 可久美少女更換為卡通圖案,於是下載第二圖像卡 =圖案的圖像’如「第4圖」,當下載完成 =成的系嶋發生,於是可以播放可愛美少女= 旦弟七互動貪料)來告知使用者以下載完成,此時使用者便 10 1311310 =將弟—圖像(可愛美少女)進行更換,並繼續下載卡通圖案 ^ :圖像)的互動資料,例如開機、進入螢幕保護模式、關機 r田下载完成之後’如有互動資料庫中存有卡通圖案(第' 像)>的下敎成料的第八互動資料,則原先播放的可愛美少^ =圖像)的第七互動貧料會改為播放卡通圖案(第二圖 的弟八互動㈣來告知使用者下餘畢,若互動資料庫沒有 統事件之互動資料則不產生互動。 心糸 雖然本發_賊之触實_減如上,然魅非用 定本發明,任何㈣娜祕者,在不_本_之精神和範圍 内,當可作些許之更動與_,因此本發明之專利保護範圍 本說明書所附之申請專利範圍所界定者為準。 、見 【圖式簡單說明】 第1圖係本發騎提之使聽音命令 能區塊圖。 _、、紐方法之功 第2圖係本發明所提之使用語音命令之 法流程圖。 Μ統及方法之方 第3Α圖係本發明實施例所提之說話分解動作厂、立。 第3Β圖係本發明實施例所提之說話分解動作厂、立: 第3C圖係本發明實施例所提之說話分解動作示二: 第3D圖係本發明實施例所提之眨眼動作示音。心回 第3Ε圖係本發明實施例所提之問候 : /忭不意圖。 11 1311310 第4圖係本發明實施例所提之下載之新圖像。 【主要元件符號說明】 100 裝置 110 語音接收模組 120 語音辨識模組 140 互動模組 150 互動資料庫模組 160 下載模組 190 事件訊息 300 PDA顯示幕 310 虛擬圖像 步驟210接收語音命令 步驟220辨識語音命令 步驟230讀出對應的互動資料 步驟240呈現互動資料 12
Claims (1)
1311310 、申請專利範圍·· 卜%[2月f 更)替換買 1. 一種使用語音命令之互動系 第一圖像進行互動,該系统包含糊用—語音命令與一顯示之 二音接收模組,用簡^語音命令; 一浯音辨識模組,用以 立 應於該語音命令之一辨識資料h ’於辨識後產生對 網互^料庫模組,用以錯存該第一圖像之至少一第一互 動貝科該弟-互動資料至少包含一動晝或一聲料中之―, 且該第一互動㈣對應於該辨識資料;及 動私、、且用以依據該辨識資料由該互動資料庫模經中 至対出該第-互動資料,並呈現該第一互動資料,其令該互 動撫,中之據_出該第—互動f料之該辨識資料還可為一 事件資料’該事件資料產生於谓測到一事件發生時,該事件為 開機、進入螢幕保護模式、顯示提示資訊、或關機。 2. 如申請專利細第)項所述之使用語音命令之互動系統,其中 該動晝至少包含該第一圖像之一動作。 3. 如申請專利範圍第1項所述之使用語音命令之互動系統,其中 更包含一下載模組,用以下載第二圖像或第二互動資料,並存 入該互動資料庫模組中。 4.如申請專利範圍第1項所述之使用語音命令之互動系統,其中 該系統更可以包含複數個圖像,經由切換顯示該複數個圖像其 中之一。 13
-種使用語音命令之互動方法,係糊_語音命令與—顯示之 第一圖像進行互動,該方法包含下列步驟: ’' (a)接收該語音命令; ⑼辨識該語音命令’於觸後纽對應_語音命令之 一辨識資料; ⑹由一互動資料庫中讀出對應於該辨識資料的該第一圖 像之至少-第-互動資料,其中該第—互動資料至少包含一動 晝或一聲音其中之一,該辨識資料還可為一事件資料,該事件 資料產生於_有-事件發生時,該事件為職、進入榮幕保 護模式、顯示提示資訊、或關機;及 (d)呈現該第一互動資料。 如申請專利範圍第5項所述之使用語音命令之互動方法,其中 該步驟(c)所述之該動晝至少包含該第一圖像之一動作。 如申請專利範圍第5項所述之使用語音命令之互動方法,其中 更包含一步驟,下載第二圖像或第二互動資料,並存入該互 資料庫中。 如申請專利範圍第5項所述之使用語音命令之互動方法,其中 更包含一步驟’經由切換顯示預先存於該互動資料庫之複數個 圖像其中之一。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW095111658A TW200737123A (en) | 2006-03-31 | 2006-03-31 | Interactive system and method using voice commands |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW095111658A TW200737123A (en) | 2006-03-31 | 2006-03-31 | Interactive system and method using voice commands |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200737123A TW200737123A (en) | 2007-10-01 |
TWI311310B true TWI311310B (zh) | 2009-06-21 |
Family
ID=45072404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095111658A TW200737123A (en) | 2006-03-31 | 2006-03-31 | Interactive system and method using voice commands |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW200737123A (zh) |
-
2006
- 2006-03-31 TW TW095111658A patent/TW200737123A/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
TW200737123A (en) | 2007-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022048403A1 (zh) | 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端 | |
US10664741B2 (en) | Selecting a behavior of a virtual agent | |
Levin et al. | In-situ speech visualization in real-time interactive installation and performance | |
Cox et al. | Tessa, a system to aid communication with deaf people | |
CA3045132C (en) | Communication with augmented reality virtual agents | |
CN106710590A (zh) | 基于虚拟现实环境的具有情感功能的语音交互系统及方法 | |
WO2022079933A1 (ja) | コミュニケーション支援プログラム、コミュニケーション支援方法、コミュニケーション支援システム、端末装置及び非言語表現プログラム | |
CN113641442B (zh) | 交互方法、电子设备及存储介质 | |
JP2023552854A (ja) | ヒューマンコンピュータインタラクション方法、装置、システム、電子機器、コンピュータ可読媒体及びプログラム | |
CN106200886A (zh) | 一种基于语言交互操控的移动智能玩具及玩具使用方法 | |
CN111145777A (zh) | 一种虚拟形象展示方法、装置、电子设备及存储介质 | |
WO2022089224A1 (zh) | 一种视频通信方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN112652041B (zh) | 虚拟形象的生成方法、装置、存储介质及电子设备 | |
WO2006011295A1 (ja) | 通信装置 | |
CN108885768A (zh) | 信息处理系统、信息处理设备、信息处理方法以及记录介质 | |
Peters et al. | Bodily Expression in Electronic Music: Perspectives on Reclaiming Performativity | |
WO2022242706A1 (zh) | 基于多模态的反应式响应生成 | |
Borkowski | Vocal Aesthetics, AI Imaginaries: Reconfiguring Smart Interfaces | |
Cox et al. | The development and evaluation of a speech-to-sign translation system to assist transactions | |
TWI311310B (zh) | ||
JP2006185329A (ja) | 画像合成装置 | |
Jude | Vocal processing in transnational music performances, from phonograph to Vocaloid | |
US20240323332A1 (en) | System and method for generating and interacting with conversational three-dimensional subjects | |
CN110166844A (zh) | 一种数据处理方法和装置、一种用于数据处理的装置 | |
Barbulescu | Generation of audio-visual prosody for expressive virtual actors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |