TWI387888B - Windows detection system - Google Patents

Windows detection system Download PDF

Info

Publication number
TWI387888B
TWI387888B TW097133984A TW97133984A TWI387888B TW I387888 B TWI387888 B TW I387888B TW 097133984 A TW097133984 A TW 097133984A TW 97133984 A TW97133984 A TW 97133984A TW I387888 B TWI387888 B TW I387888B
Authority
TW
Taiwan
Prior art keywords
window
window detection
voice
detection system
module
Prior art date
Application number
TW097133984A
Other languages
English (en)
Other versions
TW201011565A (en
Inventor
Tsung Han Tsai
chen wei Su
Chun Pin Fang
Min Ching Wu
Original Assignee
Aibelive Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aibelive Co Ltd filed Critical Aibelive Co Ltd
Priority to TW097133984A priority Critical patent/TWI387888B/zh
Publication of TW201011565A publication Critical patent/TW201011565A/zh
Application granted granted Critical
Publication of TWI387888B publication Critical patent/TWI387888B/zh

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Description

視窗偵測系統
本發明係提供一種視窗偵測系統,尤指具有視窗偵測系統可將顯示幕目前工作視窗訊號與外部語音輸入指令進行比對,並搜尋、擷取主機內部資料庫相符合工作視窗訊號之語音資料來顯示於顯示幕上,具有操作簡易、迅速及辨識率提高之功效。
按,由於電腦及網路的發達,許多作業系統及應用程式應運而生,並以電腦及軟體完成各種資料處理工作及獲取各式各樣的資訊,為了提高操作便利性,許多作業系統、應用程式多採用視窗操作介面,以滑鼠擊點、拖曳或拋放等動作來操作,並以電腦運用普及,各種視窗應用軟體也隨之增加,如提供網頁瀏覽功能的IE軟體程式、提供文書處理功能的Word軟體程式、提供表格設計功能的Excel軟體程式、提供簡報設計功能的PowerPoint軟體程式及提供影音播放功能的MultiMedia Player軟體程式等等,這些視窗應用軟體運用在簡報資料、投影片、數據表格等說明上扮演重要角色。
而視窗顯示系統僅允許使用者利用游標控制裝置來控制游標的位移並啟動視窗介面上各種不同的視窗功能或是應用 程式,且由於視窗介面上的各種功能以及應用程式的快速發展,因此使得視窗介面變成非常複雜而不易操作,雖然今日的視窗顯示系統提供了許多功能,但是由於使用者無法一一熟記各種指令在視窗介面上的位置,因此常會有不知去何處尋找一個指令的問題發生;此外,有些指令由於不在使用者當時所使用的視窗介面上,因此使用者就必需離開目前使用的視窗介面,而後再開啟或關閉層層的視窗之後,才能執行到另一個指令,這些問題使習知視窗顯示系統在日驅複雜的情況下,變得越來越難使用。
是以,即有一種語音輸入控制程式可在電腦內部供使用者語音輸入、辨識,來控制多個應用程式同時執行的視窗上相關作業(如開啟、儲存或編輯檔案等執行動作),然而,在電腦內不同作業係由不同的作業系統或應用程式來執行,且複數個開啟的應用程式視窗於電腦內儲存、索引的檔案眾多,以致於有重覆名稱或重覆字詞等檔案因素,導致螢幕上開啟多個視窗並執行語音輸入控制程式時,各個視窗的應用程式會同步找出被檢索到重覆的檔案,並將各個檔案顯示於電腦螢幕上,在使用者操控時,亦發生部份使用上的不便,如多個視窗的應用程式同步檢索到資料量較大,且同時顯示於螢幕的檔案眾多、選擇困難,又,電腦內運作找尋的檔案量多,則執行時間及速率較慢,以及同時搜尋多個應用程式 內部資料檔案量大,於檢索辨識準確性大幅降低,造成操作不便等問題。
是以,要如何解決習用之缺失與不足,即為從事此行業者所亟欲改善之方向所在。
故,發明人有鑑於上述缺失,乃搜集相關資料,經由多方評估及考量,並以從事於此行業累積之多年經驗,經由不斷試作及修改,始設計出此種視窗偵測系統的發明專利誕生者。
本發明之主要目的乃在於視窗偵測模組之虛擬助理可接收並處理外部語音輸入單元訊號,且視窗偵測模組又與預設主機顯示幕連接,使視窗偵測模組可同步偵測主機顯示幕桌面目前的工作視窗訊號,當顯示幕開啟數個視窗作業時,其語音輸入單元可接收使用者發話指令,並以視窗偵測系統之虛擬助理處理、判斷正確執行命令,再以視窗偵測模組所偵測顯示幕工作視窗訊號來比對語音指令,而語音辨識模組則可透過中央處理器搜尋並擷取主機內部資料庫資料,來完成相符合目前工作視窗的語音資料於顯示幕上顯示,具有操作簡易、迅速及辨識率提高之功效。
為達成上述目的及功效,本發明所採用之技術手段及其 構造,茲繪圖就本發明之較佳實施例詳加說明其特徵與功能如下,俾利完全瞭解。
請參閱第一圖所示,係為本發明之方塊圖,由圖中可以清楚看出,本發明所述之視窗偵測系統1為分別具有中央處理器11、視窗偵測模組12及語音辨識模組13,其視窗偵測模組12設有接收外部語音輸入單元2訊號並進行處理之虛擬助理121,且視窗偵測模組12另與主機顯示幕14連接,並可同步偵測主機顯示幕14目前工作視窗141訊號,而語音辨識模組13亦與主機顯示幕14連接並透過中央處理器11搜尋並擷取主機內部資料庫111相符合工作視窗141訊號之語音資料來顯示於顯示幕14上。
本發明視窗偵測系統1可安裝於一般電子裝置(如桌上型電腦、筆記型電腦等)內,且視窗偵測系統1之中央處理器11可連接電子裝置內儲存資料庫,並將資料庫內各筆資料建立索引、標記,在中央處理器11擷取資料庫內資料的過程中,則可將符合工作視窗141訊號之語音資料來顯示於顯示幕14上,其索引、標記的資料可以符合關鍵字、同義字、專業領域字、斷詞等分類條件詞組供搜尋、擷取;亦可形成數字搭配特殊符號來自行定義詞庫,如(1.)語音為一逗點,來出現模組式詞句,如(1.每日一顆蘋果,健康長久)等詞句。
且上述說明之外部語音輸入單元2為可是連接於電子裝置主機之麥克風,以麥克風接收使用者發話指令至虛擬助理121處理;而語音辨識模組13本身可具有判讀言語或音調以進行比對、校正等語音辨識功能。
請參閱第二圖所示,係為本發明之使用流程圖,由圖中可清楚瞭解,本發明之視窗偵測系統於使用上之流程為包括下列步驟執行:(100)操作介面3控制顯示幕14上複數視窗141作業。
(101)視窗偵測模組12接收語音輸入單元2輸入所需搜尋之語音指令。
(102)視窗偵測模組12判斷工作視窗141是否符合可執行之命令動作?若是則進行步驟(104),若否則進行步驟(103)。
(103)視窗偵測模組12之虛擬助理121列出:指令不符,請重新說明服務指令,再執行步驟(106)。
(104)語音辨識模組13透過中央處理器11搜尋並擷取內部資料庫111相符合的語音資料,再執行步驟(105)。
(105)搜尋語音資料之結果顯示於顯示幕14上,再執 行步驟(106)。
(106)結束。
當使用者操作本發明視窗偵測系統1時,為以操作介面3(如觸控螢幕、滑鼠、鍵盤等)來控制顯示幕14上複數視窗141作業,其複數視窗141可為Word、Excel、IE瀏覽器與Skype視窗141供操作介面3選擇操作,當選擇Word為工作視窗141時,使用者可以語音輸入單元2輸入所需搜尋之語音指令(如開啟第一份金額檔案),而此語音訊號會傳輸至視窗偵測模組12接收並進行類比轉數位動作,再以虛擬助理121接收並進行後續動作,而視窗偵測模組12會偵測並判斷目前工作視窗141是否為符合Word應用程式可執行之命令動作,若是,則語音辨識模組13會透過中央處理器11來搜尋並擷取內部資料庫111相符合之語音資料(開啟第一份金額檔案)來顯示於顯示幕14上,供使用者操作,若否,則虛擬助理121會以喇叭發聲說明或於顯示幕14上列出:指令不符,請重新說明服務等執行指令。
上述顯示幕14可供操作介面3(如觸控螢幕、滑鼠、鍵盤等)來控制顯示幕14上視窗141作業,而顯示幕14桌面無任何應用程式時,使用者亦可開啟本發明視窗偵測系統1的程式運作,而視窗偵測系統1為可供使用者選擇以 情境模式來操作,其情境模式為以虛擬助理121以喇叭發聲說明或於顯示幕14上列出:「請說服務等執行指令」而使用者只需對準麥克風說出「打開瀏覽器指令」,此刻,其語音辨識則進行集合動作(應用程式開啟指令),其桌面上目前工作視窗141則開啟瀏覽器,續以虛擬助理121又會以喇叭發聲說明或於顯示幕14上列出:「請說網站等執行指令」,使用者亦可說出「Yahoo」等網站名稱,則集合動作(網站名稱)與網站控制指令及前往主選單指令動作;若桌面上目前工作視窗141為Skype程式視窗141時,則集合動作(Skype暱稱)與Skype控制指令與前往主選單指令動作,是以,視窗偵測模組12會將使用者可能透過操作介面3及語音輸入單元2指令訊號通知語音辨識主流程控制模組進行語音辨識集合切換,以符合使用者情境與有效降低語音辨識詞彙集合,來提高辨識率。
本發明視窗偵測系統1主要可以電子裝置(如桌上型電腦、筆記型電腦或掌上型PDA等)內記憶體(如硬碟)資料庫來作為視窗偵測系統1所建立之索引、標記,提供使用上利用視窗偵測系統1來直接抓取相符合之資料即可。
本發明視窗偵測系統1之虛擬助理121可以語音或視窗141浮現字體方式來與使用者互動,且虛擬助理121亦可經由視窗偵測模組12所設之選單模式來顯示,其選單 模式可具有一主選單區域及連結主選單區域之分散子目錄選單供使用者操作,在使用者使用上具有簡易操作方式。
上述本發明所述複數應用程式的視窗141檔案可分別為簡報檔案格式(如PowerPoint檔案格式)、文件檔案格式(如Word或Excel檔案格式)、圖像檔案格式(如Bmp、Gif或Jpg檔案格式)、影音檔案格式(如Wma、Wmv、Mpeg或Avi檔案格式)或瀏覽器檔案格式(如html檔案格式)等現今電腦內部應用程式的視窗141,且本發明於使用情境模式下,可使顯示幕14桌面無任何應用程式視窗141時,視窗偵測模組12之虛擬助理121會以列出與使用者互動之訊息,進而形成互動式人機介面。
是以,本發明之視窗偵測系統1於使用時,可解決習用之缺失如下:本發明視窗偵測系統1之視窗偵測模組12設有接收外部語音輸入單元2訊號並進行處理之虛擬助理121,且視窗偵測模組12另與顯示幕14連接,並可同步偵測顯示幕14目前工作視窗141訊號,當顯示幕14開啟數個視窗141作業時,其語音輸入單元2可接收使用者發話指令,並以視窗偵測系統1之虛擬助理121處理、判斷正確執行命令,再以視窗偵測模組12所偵測顯示幕14工作視窗1 41訊號來比對語音指令,直接以語音辨識模組13透過中央處理器11搜尋並擷取主機內部資料庫111資料,來完成相符合目前工作視窗141的語音資料進行顯示,具有操作簡易、迅速及辨識率提高之功效。
惟,以上所述僅為本發明之較佳實施例而已,非因此即侷限本發明之專利範圍,故舉凡運用本發明說明書及圖式內容所為之簡易修飾及等效結構變化,均應同理包含於本發明之專利範圍內,合予陳明。
綜上所述,本發明之視窗偵測系統1於使用時,為確實能達到其功效及目的,故本發明誠為一實用性優異之研發創設,為符合發明專利之申請要件,爰依法提出申請,盼審委早日賜准本案之發明專利,以保障發明人之辛苦創作,倘若鈞局審委有任何稽疑,請不吝來函指示,發明人定當竭力配合,實感德便。
1‧‧‧視窗偵測系統
11‧‧‧中央處理器
111‧‧‧資料庫
12‧‧‧視窗偵測模組
121‧‧‧虛擬助理
13‧‧‧語音辨識模組
14‧‧‧顯示幕
141‧‧‧視窗
2‧‧‧語音輸入單元
3‧‧‧操作介面
第一圖 係為本發明之方塊圖。
第二圖 係為本發明之使用流程圖。
1‧‧‧視窗偵測系統
11‧‧‧中央處理器
111‧‧‧資料庫
12‧‧‧視窗偵測模組
121‧‧‧虛擬助理
13‧‧‧語音辨識模組
14‧‧‧顯示幕
141‧‧‧視窗
2‧‧‧語音輸入單元
3‧‧‧操作介面

Claims (7)

  1. 一種視窗偵測系統,係包括有中央處理器、視窗偵測模組及語音辨識模組所組成,其視窗偵測模組設有接收外部語音輸入單元訊號並進行處理之虛擬助理,且視窗偵測模組另與預設主機顯示幕連接,並可同步偵測主機顯示幕目前工作視窗訊號與語音指令比對,而語音辨識模組亦與預設主機顯示幕連接,且語音辨識模組透過中央處理器搜尋並擷取主機內部資料庫相符合工作視窗訊號之語音資料來顯示於顯示幕上。
  2. 如申請專利範圍第1項所述之視窗偵測系統,其中該視窗偵測系統之中央處理器可連接主機內儲存資料庫,並將資料庫內各筆資料建立索引、標記。
  3. 如申請專利範圍第1項所述之視窗偵測系統,其中該視窗偵測模組之虛擬助理可為情境模式供顯示幕列出互動訊息。
  4. 如申請專利範圍第1項所述之視窗偵測系統,其中該視窗偵測模組之虛擬助理可為情境模式供喇叭發出互動訊息。
  5. 如申請專利範圍第1項所述之視窗偵測系統,其中該視窗偵測模組連結有語音辨識主流程控制模組,以將外部操作介面及語音輸入單元指令訊號通知進行語音辨識集合的切換。
  6. 一種視窗偵測系統,其使用流程為包括下列步驟:(1)操作介面控制顯示幕上複數視窗作業;(2)視窗偵測模組接收語音輸入單元輸入之語音指令; (3)視窗偵測模組判斷工作視窗符合可執行之命令動作;(4)語音辨識模組透過中央處理器搜尋並擷取內部資料庫相符合的語音資料;(5)搜尋語音資料之結果顯示於顯示幕上。
  7. 如申請專利範圍第6項所述之視窗偵測系統,其中第2步驟中視窗偵測模組可將語音訊號透過所連結之虛擬助理進行處理。
TW097133984A 2008-09-04 2008-09-04 Windows detection system TWI387888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW097133984A TWI387888B (zh) 2008-09-04 2008-09-04 Windows detection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW097133984A TWI387888B (zh) 2008-09-04 2008-09-04 Windows detection system

Publications (2)

Publication Number Publication Date
TW201011565A TW201011565A (en) 2010-03-16
TWI387888B true TWI387888B (zh) 2013-03-01

Family

ID=44828665

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097133984A TWI387888B (zh) 2008-09-04 2008-09-04 Windows detection system

Country Status (1)

Country Link
TW (1) TWI387888B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157351A (zh) * 2021-03-18 2021-07-23 福建马恒达信息科技有限公司 一种用于表格工具快捷调用的语音插件构建方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157351A (zh) * 2021-03-18 2021-07-23 福建马恒达信息科技有限公司 一种用于表格工具快捷调用的语音插件构建方法

Also Published As

Publication number Publication date
TW201011565A (en) 2010-03-16

Similar Documents

Publication Publication Date Title
JP7037602B2 (ja) デジタルアシスタントサービスの遠距離拡張
US10866785B2 (en) Equal access to speech and touch input
KR102586185B1 (ko) 자연스러운 어시스턴트 상호작용
US11003349B2 (en) Actionable content displayed on a touch screen
US9299342B2 (en) User query history expansion for improving language model adaptation
US8150699B2 (en) Systems and methods of a structured grammar for a speech recognition command system
JP6204982B2 (ja) 自然動作入力を使用する文脈的クエリ調整
US9298287B2 (en) Combined activation for natural user interface systems
US9601113B2 (en) System, device and method for processing interlaced multimodal user input
US20150025885A1 (en) System and method of dictation for a speech recognition command system
US9691381B2 (en) Voice command recognition method and related electronic device and computer-readable medium
WO2012135218A2 (en) Combined activation for natural user interface systems
Le et al. Shortcut gestures for mobile text editing on fully touch sensitive smartphones
WO2023087934A1 (zh) 一种语音控制方法、装置、设备以及计算机存储介质
TWI387888B (zh) Windows detection system
TW201506685A (zh) 以語音辨識來選擇控制客體的裝置及方法
JPH1124813A (ja) マルチモーダル入力統合システム
DK179559B1 (en) INTELLIGENT AUTOMATED ASSISTANT FOR MEDIA EXPLORATION
US20100100821A1 (en) Window detection system and method for operating the same
CN111433730A (zh) 一种基于智能终端的歌曲试听方法及歌曲试听系统
WO2020116193A1 (ja) 情報処理装置、情報処理方法、およびプログラム
Yalcina et al. Computer control software for impaired people with voice commands