TWI311310B - - Google Patents

Download PDF

Info

Publication number
TWI311310B
TWI311310B TW95111658A TW95111658A TWI311310B TW I311310 B TWI311310 B TW I311310B TW 95111658 A TW95111658 A TW 95111658A TW 95111658 A TW95111658 A TW 95111658A TW I311310 B TWI311310 B TW I311310B
Authority
TW
Taiwan
Prior art keywords
interactive
data
voice
voice command
image
Prior art date
Application number
TW95111658A
Other languages
English (en)
Other versions
TW200737123A (en
Inventor
Chien An Chen
Original Assignee
Inventec Besta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Co Ltd filed Critical Inventec Besta Co Ltd
Priority to TW095111658A priority Critical patent/TW200737123A/zh
Publication of TW200737123A publication Critical patent/TW200737123A/zh
Application granted granted Critical
Publication of TWI311310B publication Critical patent/TWI311310B/zh

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Details Of Television Systems (AREA)

Description

1311310 九、發明說明: 【發明所屬之技術領域】 特別是指利用辨識語 示之圖像產生與人互 一種使用語音命令之互動系統及方法, 音命令來控制呈現相對應的互動資料,使顯 動之效果的系統及方法。 【先前技術】 聲音辨識的對象包括人類發出的語音、樂器發_音樂 讀出的噪音、_的叫聲、聲納、大自然的聲音等。簡單的說, 聲音辨識就是以機器騎人類耳朵的聽覺功能,進而使機器執行 相對應的工作,來達到自動化的效果。 、電腦藉__數位的轉換裝置將語音取樣的龍數位化成 為數值讀之後,會將輸人的聲音樣本與麟的聲音樣本進行比 對工作’比對完成後電腦會輸出一個它認為最像的聲音樣本序 號,於是就可以知道輸入的語音要它做什麼樣的工作。 ±但是,要知道即使同一個人在同一環境使用同樣的麥克風連 ‘發出兩次同樣的語音,語音取樣㈣也不可能完全相同,所以 如何把語音在異中求同,這就是聲音辨識技術的問題所在。也因 此,在辨識人類發出的語音方面,根據詞彙聲音樣本數量分為小 字彙(<100詞)、中字彙(10CM 000詞)、大字彙i 〇〇1 Μ 〇〇〇〇詞)、 極大字彙(>10000詞)幾類,各類有著不同複雜度的辨識技術,使 知°司菜數多的類別儘量的提高辨識率。 5 1311310 、雖然在數年㈣已财人提絲來語音輸人將是主要的輸入 方Ί甚至連不少大型軟體商也都看好這個有著璀燦未來和魔大 商機的市場’但是,由於上述賴_語音辨翻_度,因此 。口曰辨識技術直恶法有效的提高輸入的語音的辨識率,是故語 音輸入-直沒有如職的被使用在各軟體上。 雖然如此’在消電子產品方面,隨著舰上的進步,輸 入方式發生了輸崎,從傳統的魏輸人進步至齡式螢幕 的輸入,甚至到現在的手寫輸入以及語音輸入,而目前在消費性 電子產品上語讀錢_語音觸技術,大乡是語 (V〇,CeC咖喊_)的部份,其使用中或小字囊的辛識 3。是故,實際上可以辨識的詞彙並不多,所以由就#使用 上來看,相當的不具親和力,因此使用者對 細 術的接受度不高。 日辨4技 然而,語音辨識技術在未來幾年 識率這是—倾㈤有相提高辨 入嗎問’所以可以預期的 五 效的提升辨識率之前,如何增加使用語 。1雜術有 要解決的問題。 ^镇和力疋-個需 【發明内容】 以上的_,本發明的主要目的在於脖— 使:;令的=來控制呈現該語音命令 _ 使件顯不之圖像與人產生互動的系統及方土 飞動4, 用者利用語音命令歸輸人讀,會:過本發明,在使 應该语音命令所對應的晝
為達上述目的,本發明可簡由方法與紐兩方面達成,本 動斤揭路之系統,包括有:語音接收模組、語音辨識模組、互 =組料賴組。本發明簡露之方法,包括有下列步 人,'接收_δ#音命令,细語音辨識技術細識該語音命 :,辨識後會產生-個_資料,接著依據辨識產生的辨識資料 料庫中讀㈣應的互動資料,最後將讀出的互動資料呈 规出來。 合另外’本發明逛可以在系統上附加一個下載模組,在方法上 =加-财驟,下載—個圖像或—個互動資料,並把下載的圖 象或互動資料存入互動資料庫中。
有關树賴雜與實作,舰合_作最佳實 明如下。 【實施方式】 本發明可以藉由系統及方法兩部分的執行來達到預期的目 ^以下先以「第1圖」本伽之語音命令之互動系統及方 :之功能區翻來綱本發統運作。如_示,本發明之 系統含有語音接收模組110、語音辨識模組12〇、互動模組⑽、 互動資料庫模組15〇。其中語音接收模組彻負責接收語立, 並將接收_語音命令秘語音觸歡咖語音觸模組^ 7 1311310 負責辨識語音接收槿έ Ή 生對應於語音命令的辨t 音命令,並於辨識後產 ⑽;互__ ^貝^=將該辨識資料送往互動模址 音粗> % 負貝在取侍-音辨識模組120所送來的辨識 互動、域接收到的辨識資料由互動資料庫模組150中讀出 出亚且於互動資料讀取完畢之後將讀出的互動資料呈現 料。’貪料庫模組150負責儲存包含有動晝或聲音的互動資 方法之方^由第2圖」本發明之使躲音命令之互動系統及 來說明本剌方法的運作絲。當使用者使用 語二個崎令,語音接收模組m會接收該 电120^/ 1Q) ’亚會將接_的語音命令交給語音辨識模 識技術對音命令之齡使轉音辨 μ ^曰°P々進行觸(步驟220),在辨識完該語音命令 "赶靖應於該語音命令㈣識資料,並交給互動模 模組140在取得語音辨識模組12〇產生的辨識資料 料,從互動資料庫模組150中讀出對應於 …日貝;、且已含有動晝或聲音的互動資料(步驟230),最後將 料呈現給使用者(步驟_,使使用者在聽覺或視= 接著以-個實施例來解說本發_運作系統與方法。當使用 者使用執衫本發子辭觸,制者可町料—語音么 令「查劍橋百科」,於是本發明就會接收到第—語音命令「查^ 8 !31131〇 、=的聲音,並對第一語音命令「查劍橋百科」進行辨識,經 = 4',本㈣可以由互動倾縣得第—語音命令「查劍橋 放第」的第—聲音「沒問題,請使用^ (第—互動資料),並播 =一聲音給使用者朗,同時將電子字典的絲晝面切換 橋百科的輸入晝面。 本發_互動射則貞㈣統的所發生的事件 ’並由_料庫模組15〇中取得對應於系統發生的事 絲㈣,以呈現給細者。延續上—個實施例,當使 =將电子辭典_時’本發明會偵測到系統發生關機的事件, 於疋本發明由互動資料庫取得關機事件的第二聲音(第二 料)’並播放出第二聲音「謝謝您的使用丨」 貝 接著再以第二實_來說贿說本發明崎作系雖方法, 使用者將執行有本發明的PDA進行開機時,如「第3a圖」所干, 本發明會在顯示幕上,顯示—個虛擬_像,該虛擬的 圖像包含人像、動物㈣ '卡通人物、植_铸,但不以 限’第一圖像以可愛美少女為例,開機晝面會顯示-個可愛美; ^並播放第三聲音「主人您好,您需要什麼服務呢?」及播放 嘴巴開閨」的第一動晝(第三互動資料),如「第3A圖」、 3B圖」、「第3C圖」、「第3B圖」、「第3A圖」所示之連續動作, 使得可愛❹、女看似在與者·,如此會使得制者更有歲 可愛美少女互_感覺。當職完成至使用者下達語音命令的中、 途,可以由本發明_發現使用者正處於間置狀態,於是讀出使 1311310 用者閒置的第二動畫「 愛美少姐眼的動畫呈現於畫面上,如「第放可 開始晝面,「第3D周+ A圖」表不眨眼之 續閒置,則會進入:幕俾^眼進行中之晝面。若使用者依然繼 「玩勒日1^ 顧式。直到賴者下達第二語音命令 η T本發明讀出對應於第二語音 五互動資料—可愛 玩遊戲」的弟 的動作,接著遊戲便門㈣賴選項,並有將該遊戲取出 間之互動關係更為密^執仃,如此將使得可愛美少女與使用者 本發明更包含有—個下細組湖 二圖像下載並儲存至 貞讀互動貝枓或者弟 互動方式可以不斷的改,使得使用者與圖像的 實施例,在進式時更續上述第二 幕保鳟、〗α為絲胃料庫林有對應螢 ❺互動㈣’故本發明無法呈現相關的互動資 者。但是在下载了可錢少女所屬的螢 =動㈣之後,當進人螢幕保護模式之前, = 要時在叫我丨」的聲立万叙从夺 「 s褚放而 使用者以η 旦面第3E圖」之問候動晝與 / °除了下鼓動資狀外,本伽也可以下賴 们m Π二個實施例來說明之’使用者欲將顯示之虛擬的圖 可久美少女更換為卡通圖案,於是下載第二圖像卡 =圖案的圖像’如「第4圖」,當下載完成 =成的系嶋發生,於是可以播放可愛美少女= 旦弟七互動貪料)來告知使用者以下載完成,此時使用者便 10 1311310 =將弟—圖像(可愛美少女)進行更換,並繼續下載卡通圖案 ^ :圖像)的互動資料,例如開機、進入螢幕保護模式、關機 r田下载完成之後’如有互動資料庫中存有卡通圖案(第' 像)>的下敎成料的第八互動資料,則原先播放的可愛美少^ =圖像)的第七互動貧料會改為播放卡通圖案(第二圖 的弟八互動㈣來告知使用者下餘畢,若互動資料庫沒有 統事件之互動資料則不產生互動。 心糸 雖然本發_賊之触實_減如上,然魅非用 定本發明,任何㈣娜祕者,在不_本_之精神和範圍 内,當可作些許之更動與_,因此本發明之專利保護範圍 本說明書所附之申請專利範圍所界定者為準。 、見 【圖式簡單說明】 第1圖係本發騎提之使聽音命令 能區塊圖。 _、、紐方法之功 第2圖係本發明所提之使用語音命令之 法流程圖。 Μ統及方法之方 第3Α圖係本發明實施例所提之說話分解動作厂、立。 第3Β圖係本發明實施例所提之說話分解動作厂、立: 第3C圖係本發明實施例所提之說話分解動作示二: 第3D圖係本發明實施例所提之眨眼動作示音。心回 第3Ε圖係本發明實施例所提之問候 : /忭不意圖。 11 1311310 第4圖係本發明實施例所提之下載之新圖像。 【主要元件符號說明】 100 裝置 110 語音接收模組 120 語音辨識模組 140 互動模組 150 互動資料庫模組 160 下載模組 190 事件訊息 300 PDA顯示幕 310 虛擬圖像 步驟210接收語音命令 步驟220辨識語音命令 步驟230讀出對應的互動資料 步驟240呈現互動資料 12

Claims (1)

1311310 、申請專利範圍·· 卜%[2月f 更)替換買 1. 一種使用語音命令之互動系 第一圖像進行互動,該系统包含糊用—語音命令與一顯示之 二音接收模組,用簡^語音命令; 一浯音辨識模組,用以 立 應於該語音命令之一辨識資料h ’於辨識後產生對 網互^料庫模組,用以錯存該第一圖像之至少一第一互 動貝科該弟-互動資料至少包含一動晝或一聲料中之―, 且該第一互動㈣對應於該辨識資料;及 動私、、且用以依據該辨識資料由該互動資料庫模經中 至対出該第-互動資料,並呈現該第一互動資料,其令該互 動撫,中之據_出該第—互動f料之該辨識資料還可為一 事件資料’該事件資料產生於谓測到一事件發生時,該事件為 開機、進入螢幕保護模式、顯示提示資訊、或關機。 2. 如申請專利細第)項所述之使用語音命令之互動系統,其中 該動晝至少包含該第一圖像之一動作。 3. 如申請專利範圍第1項所述之使用語音命令之互動系統,其中 更包含一下載模組,用以下載第二圖像或第二互動資料,並存 入該互動資料庫模組中。 4.如申請專利範圍第1項所述之使用語音命令之互動系統,其中 該系統更可以包含複數個圖像,經由切換顯示該複數個圖像其 中之一。 13
-種使用語音命令之互動方法,係糊_語音命令與—顯示之 第一圖像進行互動,該方法包含下列步驟: ’' (a)接收該語音命令; ⑼辨識該語音命令’於觸後纽對應_語音命令之 一辨識資料; ⑹由一互動資料庫中讀出對應於該辨識資料的該第一圖 像之至少-第-互動資料,其中該第—互動資料至少包含一動 晝或一聲音其中之一,該辨識資料還可為一事件資料,該事件 資料產生於_有-事件發生時,該事件為職、進入榮幕保 護模式、顯示提示資訊、或關機;及 (d)呈現該第一互動資料。 如申請專利範圍第5項所述之使用語音命令之互動方法,其中 該步驟(c)所述之該動晝至少包含該第一圖像之一動作。 如申請專利範圍第5項所述之使用語音命令之互動方法,其中 更包含一步驟,下載第二圖像或第二互動資料,並存入該互 資料庫中。 如申請專利範圍第5項所述之使用語音命令之互動方法,其中 更包含一步驟’經由切換顯示預先存於該互動資料庫之複數個 圖像其中之一。
TW095111658A 2006-03-31 2006-03-31 Interactive system and method using voice commands TW200737123A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW095111658A TW200737123A (en) 2006-03-31 2006-03-31 Interactive system and method using voice commands

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW095111658A TW200737123A (en) 2006-03-31 2006-03-31 Interactive system and method using voice commands

Publications (2)

Publication Number Publication Date
TW200737123A TW200737123A (en) 2007-10-01
TWI311310B true TWI311310B (zh) 2009-06-21

Family

ID=45072404

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095111658A TW200737123A (en) 2006-03-31 2006-03-31 Interactive system and method using voice commands

Country Status (1)

Country Link
TW (1) TW200737123A (zh)

Also Published As

Publication number Publication date
TW200737123A (en) 2007-10-01

Similar Documents

Publication Publication Date Title
WO2022048403A1 (zh) 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端
US10664741B2 (en) Selecting a behavior of a virtual agent
Levin et al. In-situ speech visualization in real-time interactive installation and performance
Cox et al. Tessa, a system to aid communication with deaf people
CA3045132C (en) Communication with augmented reality virtual agents
CN106710590A (zh) 基于虚拟现实环境的具有情感功能的语音交互系统及方法
WO2022079933A1 (ja) コミュニケーション支援プログラム、コミュニケーション支援方法、コミュニケーション支援システム、端末装置及び非言語表現プログラム
CN113641442B (zh) 交互方法、电子设备及存储介质
JP2023552854A (ja) ヒューマンコンピュータインタラクション方法、装置、システム、電子機器、コンピュータ可読媒体及びプログラム
CN106200886A (zh) 一种基于语言交互操控的移动智能玩具及玩具使用方法
CN111145777A (zh) 一种虚拟形象展示方法、装置、电子设备及存储介质
WO2022089224A1 (zh) 一种视频通信方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN112652041B (zh) 虚拟形象的生成方法、装置、存储介质及电子设备
WO2006011295A1 (ja) 通信装置
CN108885768A (zh) 信息处理系统、信息处理设备、信息处理方法以及记录介质
Peters et al. Bodily Expression in Electronic Music: Perspectives on Reclaiming Performativity
WO2022242706A1 (zh) 基于多模态的反应式响应生成
Borkowski Vocal Aesthetics, AI Imaginaries: Reconfiguring Smart Interfaces
Cox et al. The development and evaluation of a speech-to-sign translation system to assist transactions
TWI311310B (zh)
JP2006185329A (ja) 画像合成装置
Jude Vocal processing in transnational music performances, from phonograph to Vocaloid
US20240323332A1 (en) System and method for generating and interacting with conversational three-dimensional subjects
CN110166844A (zh) 一种数据处理方法和装置、一种用于数据处理的装置
Barbulescu Generation of audio-visual prosody for expressive virtual actors

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees