TWI664536B - 文書編輯軟體之語音控制方法及語音控制系統 - Google Patents
文書編輯軟體之語音控制方法及語音控制系統 Download PDFInfo
- Publication number
- TWI664536B TWI664536B TW106139781A TW106139781A TWI664536B TW I664536 B TWI664536 B TW I664536B TW 106139781 A TW106139781 A TW 106139781A TW 106139781 A TW106139781 A TW 106139781A TW I664536 B TWI664536 B TW I664536B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- execution
- information
- document editing
- feature
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 239000000203 mixture Substances 0.000 claims description 41
- 239000000284 extract Substances 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 7
- 238000007667 floating Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
- Stored Programmes (AREA)
Abstract
一種文書編輯軟體之語音控制方法及系統,透過對輸入的語音指令進行解析以得到相應的語音特徵,據以令文書編輯軟體執行相應的操作,藉以簡化文書編輯操作,並提升用戶的文書編輯軟體的使用體驗。
Description
本發明涉及人機交互技術領域,更詳而言之,係指一種文書編輯軟體之語音控制方法及系統。
隨著電子科技的不斷發展,人們的日常工作和學習生活越來越離不開電子科技,而為了滿足不同使用群體的使用需求,目前大多數的電子設備支持有語音輸入功能,此功能可以極大地方便使用者進行文字信息的輸入操作。
然而,在現有技術中,針對文書編輯軟體而言,僅針對文字信息的輸入提供語音輸入控制功能,然大都不支持文字的編輯操作,也就是針對文書編輯軟體中的執行工具及其執行內容不提供語音輸入控制的功能。以word文書編輯軟體而言,當使用者在編輯界面中輸入了文字內容之後,還需要針對編輯界面中所顯示的文字信息進行編輯,例如,中文字型、字型色彩、行距等文字內容的編輯操作,或者列印、電子郵件等文檔處理操作,目前,這些編輯操作還需依賴於使用者通過手工輸入來完成,也就是需在word文書編輯軟體的工具欄中找到相應的執行工具按鈕,然後通過點選進入該執行工具的操作界面,再於該操作界面中選擇相應的執行內容,才能實現上述的文字信息的編輯操作,該操作過程較為繁複,且對於word文書編輯軟體的操作界面不甚熟悉的操作者而言,往往需要花費很多時間在眾多的執行工具選擇中找出其所需要的執行工具,此極大地影響了使用者的使用體驗,並降低了文字編輯的工作效率。
有鑑於此,如何提供一種文書編輯軟體的輸入控制方法,以克服習知技術中所存在的技術問題,乃為本發明待解決的技術課題。
鑒於上述先前技術之缺點,本發明的主要目的係提供一種文書編輯軟體之語音控制方法及系統,可通過語音輸入方式控制執行文書編輯操作,以簡化文書編輯操作,並提升用戶的文書編輯使用體驗。
為達到上述目的以及其他目的,本發明提供一種文書編輯軟體之語音控制方法,係以語音方式控制文書編輯軟體執行操作,該語音控制方法包括:提供一語音指令資料庫,以供儲存一執行工具信息及其對應的至少一第一語音特徵,以及儲存一執行內容信息及其對應的至少一第二語音特徵,其中該執行工具信息係對應於該文書編輯軟體的執行工具,該執行內容信息係對應於該執行工具中的執行內容;輸入一語音指令;解析該語音指令的特徵組成;當該語音指令的特徵組成與該第一語音特徵相符時,自該語音指令資料庫中提取與該第一語音特徵相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具;當該語音指令的特徵組成與該第二語音特徵相符時,自該語音指令資料庫中提取與該第二語音特徵相對應的執行內容信息,且當與該第二語音特徵對應執行內容的執行工具開啟時,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作;以及,當該語音指令的特徵組成同時與該第一、第二語音特徵相符時,首先,自該語音指令資料庫中提取與該第一語音特徵信息相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的菜單工具,而後,自該語音指令資料庫中提取與該第二語音特徵信息相對應的執行內容信息,俾令該文書編輯軟體依據該執行內容信息擇取該菜單工具中對應的執行選項內容,並據以執行相應的操作。
較佳地,於上述文書編輯軟體之語音控制方法中,還包括提供輸入一語音控制開啟指令,俾令該文書編輯軟體根據該輸入之語音控制開啟指令而啟動一語音控制應用,而依據所輸入的該語音指令執行相應之操作。
較佳地,於上述文書編輯軟體之語音控制方法中,該文書編輯軟體執行時係提供有一執行視窗,該執行視窗包含有一文書編輯界面與一執行工具欄界面,該文書編輯界面係用於顯示文書編輯的狀態,該執行工具欄界面係用於啟動該執行工具,當該文書編輯軟體的該語音控制應用啟動時,係自動關閉該執行工具欄界面,而使該文書編輯界面佔滿該執行視窗。
較佳地,於上述文書編輯軟體之語音控制方法中,該文書編輯軟體執行時係提供一浮動式指令觸發界面,該浮動式指令觸發界面係浮動設置於該文書編輯界面,俾供觸發生成該語音控制開啟指令。
較佳地,於上述文書編輯軟體之語音控制方法中,該文書編輯軟體執行時係提供一透明度調整界面,該透明度調整界面係用於調整該浮動式指令觸發界面於該文書編輯界面上的透明度。
較佳地,於上述文書編輯軟體之語音控制方法中,還包括提供一語音特徵自定義界面,係針對該執行工具信息自定義該第一語音特徵,或者,針對該執行內容信息自定義該第二語音特徵。
較佳地,於上述文書編輯軟體之語音控制方法中,其中,該執行內容信息係包括執行一瀏覽文檔指令或執行至少一項編輯文檔指令。
較佳地,於上述文書編輯軟體之語音控制方法中,還包括提供一語料資料庫,係儲存語料資料,該方法還包括依據該語料資料對該語音指令執行一語義解析處理,以解析該語音指令的特徵組成
較佳地,於上述文書編輯軟體之語音控制方法中,還包括提供該語音指令資料庫儲存一腳本信息及其對應的至少一第三語音特徵,其中該腳本信息係包括複數該執行內容信息,各該執行內容信息對應於不同之該執行工具中的執行內容;以及當解析該語音指令的特徵組成與該第三語音特徵相符時,自該語音指令資料庫中提取該腳本信息,以令該文書編輯軟體運行該腳本信息,而依序執行該腳本信息中所包含之該複數執行內容信息。
本發明還提供一種文書編輯軟體之語音控制系統,係以語音方式控制文書編輯軟體執行操作,該語音控制系統包括:用於儲存一執行工具信息及其對應的至少一第一語音特徵的一語音指令資料庫,以及儲存一執行內容信息及其對應的至少一第二語音特徵,其中該執行工具信息係對應於該文書編輯軟體的執行工具,該執行內容信息係對應於執行工具中的執行內容;提供輸入一語音指令的一語音輸入模組;用於解析該語音指令的特徵組成的一解析模組;以及一執行模組,係依據該解析模組的解析結果,控制該文書編輯軟體執行相應的操作,其中,當該解析模組的解析結果為該語音指令的特徵組成與該第一語音特徵相符時,該執行模組自該語音指令資料庫中提取與該第一語音特徵相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具;當該解析模組的解析結果為該語音指令的特徵組成與該第二語音特徵相符時,該執行模組自該語音指令資料庫中提取與該第二語音特徵相對應的執行內容信息,且當與該第二語音特徵對應執行內容的執行工具開啟時,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作;當該解析模組的解析結果為該語音指令的特徵組成同時與該第一、第二語音特徵相符時,該執行模組首先自該語音指令資料庫中提取與該第一語音特徵信息相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具,而後自該語音指令資料庫中提取與該第二語音特徵信息相對應的執行內容信息,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作。
較佳地,於上述文書編輯軟體之語音控制系統中,還包括一觸發模組,係提供輸入一語音控制開啟指令,俾使該文書編輯軟體根據該輸入之語音控制開啟指令啟動語音控制應用,而藉由該語音輸入模組輸入該語音指令,並依據輸入之該語音指令執行相應之操作。
較佳地,於上述文書編輯軟體之語音控制系統中,該文書編輯軟體執行時係提供有一執行視窗,該執行視窗包含有一文書編輯界面與一執行工具欄界面,該文書編輯界面係用於顯示文書編輯的狀態,該執行工具欄界面係用於啟動該執行工具,該觸發模組還包括當啟動該文書編輯軟體的該語音控制應用時,自動關閉該執行工具欄界面,而使該文書編輯界面佔滿該執行視窗。
較佳地,於上述文書編輯軟體之語音控制系統中,該觸發模組係為該文書編輯軟體執行時所提供之一浮動式指令觸發界面,該浮動式指令觸發界面係浮動設置於該文書編輯界面,俾供觸發生成該語音控制開啟指令。
較佳地,於上述文書編輯軟體之語音控制系統中,還包括一透明度調整模組,係為該文書編輯軟體執行時所提供之一透明度調整界面,用於調整該浮動式指令觸發界面於該文書編輯界面上的透明度。
較佳地,於上述文書編輯軟體之語音控制系統中,還包括一自定義模組,係提供一語音特徵自定義界面,係針對該執行工具信息自定義該第一語音特徵,或者,針對該執行內容信息自定義該第二語音特徵。
較佳地,於上述文書編輯軟體之語音控制系統中,該執行內容信息係包括執行一瀏覽文檔指令或執行至少一項編輯文檔指令。
較佳地,於上述文書編輯軟體之語音控制系統中,還包括提供一語料資料庫,係儲存語料資料,俾供該解析模組依據該語料資料對該語音指令執行一語義解析處理,以解析該語音指令的特徵組成。
較佳地,於上述文書編輯軟體之語音控制系統中,該語音指令資料庫還儲存一腳本信息及其對應的至少一第三語音特徵,其中該腳本信息係包括複數該執行內容信息,各該執行內容信息對應於不同之該執行工具中的執行內容;且當該解析模組解析該語音指令的特徵組成與該第三語音特徵相符時,該執行模組還包括自該語音指令資料庫中提取該腳本信息,以令該文書編輯軟體運行該腳本信息,而依序執行該腳本信息中所包含之該複數執行內容信息。
較佳地,於上述文書編輯軟體之語音控制系統中,該文書編輯軟體係裝載並運行於一電子設備中,該語音輸入模組係為裝載於該電子設備中的麥克風。
綜上所述,本發明之文書編輯軟體之語音控制方法及系統透過預先建立語音指令資料庫,以針對文書編輯軟體中的執行工具及其執行內容編輯對應的語音特徵,俾通過解析所輸入的語音指令中包含的語音特徵,而實現以語音方式控制文書編輯軟體執行操作的目的,以簡化文書編輯操作的複雜度,並提升文書編輯軟體的使用體驗。
再者,透過對所述的語音指令進行語義分析以及提供使用者自定義語音特徵,而使語音控制更符合使用者自身的操作習慣。此外,更可針對一腳本信息定義對應的語音特徵,以供使用者僅需輸入簡單的語音指令,即可令文書編輯軟體依序執行多項執行內容,以提高工作效率。
以下內容將搭配圖式,藉由特定的具體實施例說明本發明之技術內容,熟悉此技術之人士可由本說明書所揭示之內容輕易地了解本發明之其他優點與功效。本發明亦可藉由其他不同的具體實施例加以施行或應用。本說明書中的各項細節亦可基於不同觀點與應用,在不背離本發明之精神下,進行各種修飾與變更。尤其是,於圖式中各個元件的比例關係及相對位置僅具示範性用途,並非代表本發明實施的實際狀況。
圖1為本發明的文書編輯軟體之語音控制系統的基本架構示意圖。如圖所示,本發明的語音系統1搭載於文書編輯軟體2中,文書編輯軟體2可為裝載並運行於一電子設備(未予圖示)中的應用軟體,其中,電子設備例如為桌上型電腦、筆記本電腦、平板電腦等,而文書編輯軟體2則例如為裝載並運行於筆記本電腦中的Microsoft Office應用軟體(包括word、outlook、excel等),然並不以此為限,其他任何現有的文書編輯軟體均可適用。以下將以文書編輯軟體2為microsoft word應用軟體為例,詳細說明本發明的語音控制系統1。
如圖1所示,語音控制系統1包括一語音指令資料庫11、一語音輸入模組12、一解析模組13、以及一執行模組14。
語音指令資料庫11用於儲存一執行工具信息及其對應的至少一第一語音特徵,以及儲存一執行內容信息及其對應的至少一第二語音特徵,其中,該執行工具信息可對應於文書編輯軟體2的執行工具,該執行內容信息係對應於執行工具中的執行內容。於本實施例中,該執行內容信息係包括執行一瀏覽文檔指令或執行至少一項編輯文檔指令,當執行內容信息係包括瀏覽文檔指令時,其可例如為microsoftword應用軟體的“檢視”工具選項61,而對應於“檢視”執行工具下的執行內容則例如為“整頁模式611”、“閱讀版面配置612”、“WEB版面配置613”、“大綱模式614”、“草稿615”等內容選項(如圖6A所示),當執行內容信息係包括編輯文檔指令時,其可例如為microsoftword應用軟體中的“字型”工具選項62,而對應於“字型”執行工具下的執行內容則例如為“字型樣式621”、“字型的大小622”、“字型色彩623”、“字型的效果624”等內容選項(如圖6B所示);又如,當執行工具對應於microsoft word應用軟體中“段落”的工具選項63時,則執行內容63可對應於“一般631”、“缩排632”、“段落間距633”等內容選項(如圖6C所示)。此外,與執行工具信息所對應的第一語音特徵可與該執行工具信息的名稱完全吻合,抑或僅包含執行工具信息的名稱中的部分關鍵字,而與執行內容信息所對應的第二語音特徵亦是如此。例如,對應於執行工具為“版面配置“的第一語音特徵,可以是完整的“版面配置”,也可以是“配置”兩個關鍵字即可。
於本發明的一實施例中,語音指令資料庫11中還可用於儲存一腳本信息及其對應的至少一第三語音特徵,其中,該腳本信息可包括複數該執行內容信息,而各該執行內容信息對應於不同的該執行工具中的執行內容,藉此,當文書編輯軟體2需連續執行多個編輯操作時,可將該多個編輯操作編輯為一腳本信息,並針對該腳本信息設定對應的第三語音特徵,藉此,當後續使用者需令文書編輯軟體2執行該多個編輯操作時,僅需一次性輸入簡單的語音指令即可,而無需分批輸入各編輯操作所對應的執行工具及其執行內容的語音指令,以簡化使用者的操作。
語音輸入模組12用於提供輸入一語音指令。於本實施例中,語音輸入模組12係例如為裝載於電子設備中的麥克風。
解析模組13用於解析語音輸入模組12所輸入的語音指令的特徵組成,而執行模組14則用以依據解析模組13的解析結果,而控制該文書編輯軟體2執行相應的操作。
具體而言,當解析模組13的解析結果為語音指令的特徵組成與語音指令資料庫11中儲存的第一語音特徵相符時,則執行模組14自語音指令資料庫11中提取與第一語音特徵相對應的執行工具信息,以令文書編輯軟體2依據執行工具信息開啟相應的執行工具。例如,當解析模組13解析出使用者所輸入的語音指令中包含“字型”的特徵組成時,則執行模組14自語音指令資料庫11中查找出與之相符合的第一語音特徵,並自語音指令資料庫11中提取與該第一語音特徵相對應的執行工具信息,而令文書編輯軟體2據以開啟“字型”的執行工具。
當解析模組13的解析結果為語音指令的特徵組成與第二語音特徵相符時,則執行模組14自語音指令資料庫11中提取與第二語音特徵相對應的執行內容信息,且當與第二語音特徵對應執行內容的執行工具開啟時,俾令文書編輯軟體2依據執行內容信息擇取執行工具中對應的執行選項內容,並據以執行相應的操作。例如,當解析模組13解析出使用者所輸入的語音指令中包含“字型樣式”的特徵組成時,執行模組14自語音指令資料庫11中查找與之相吻合的第二語音特徵,並提取該第二語音特徵所對應的執行內容信息,即“字型樣式”,而後分析該執行內容所屬的執行工具是否已經開啟,即判斷文書編輯軟體2當前是否已經開啟“字型”的執行工具,且當判斷結果為已開啟時,令文書編輯軟體2執行“字型樣式”的編輯操作。
當解析模組13的解析結果為語音指令的特徵組成同時與該第一、第二語音特徵相符時,執行模組14首先自語音指令資料庫11中提取與該第一語音特徵信息相對應的執行工具信息,以令文書編輯軟體2依據該執行工具信息開啟相應的執行工具,而後自語音指令資料庫11中提取與該第二語音特徵信息相對應的執行內容信息,俾令文書編輯軟體2依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作。例如,當解析模組13解析出使用者所輸入的語音指令中同時包含有“字型”以及“字型樣式”的特徵組成時,則執行模組14首先自語音指令資料庫11中提取與“字型”相吻合的第一語音特徵,並調取與之相對應的執行工具信息,以令文書編輯軟體2開啟“字型”的執行工具,而後再從語音指令資料庫11中提取與“字型樣式”相吻合的第二語音特徵,並調取與之相對應的執行內容信息,以令文書編輯軟體2執行“字型樣式”的編輯操作。
再者,當解析模組13的解析結果為語音指令的特徵組成與該第三語音特徵相符時,則執行模組14自語音指令資料庫11中提取與第三語音特徵所對應的腳本信息,以令文書編輯軟體2運行該腳本信息,而依序執行該腳本信息中所包含之多個執行內容信息。例如當使用者輸入包含有“發郵件給小明”的特徵組成的語音指令時,則執行模組14自語音指令資料庫11中提取與之相吻合的第三語音特徵,並調取與該第三語音特徵相對應的腳本信息,而令文書編輯軟體2運行該腳本信息,包括,首先打開“郵件”的執行工具,而後執行“編輯新郵件”的執行內容,並自聯繫人信息中找到“小明”的聯繫信息以自動填入“收件人”欄位,並自郵件設置中找出對應的“郵件簽名”(如果已有設置的話),並將所設置的“郵件簽名”附於郵件正文的末端,而後執行郵件發送任務以發送郵件給小明,從而完成該腳本信息的運行。
請配合參閱圖2,於本發明的一實施例中,語音控制系統1還包括一觸發模組15,其用於提供輸入一語音控制開啟指令,俾使文書編輯軟體2根據該輸入之語音控制開啟指令以啟動語音控制應用,而藉由語音輸入模組12輸入該語音指令,並依據輸入之該語音指令執行相應之操作。於本實施例中,觸發模組15可例如為顯示於文書編輯軟體2的文書編輯界面中的一功能按鈕,當使用者透過例如滑鼠、鍵盤等輸入模組選中該功能按鈕時,則語音控制系統1即觸發語音輸入模組12啟動執行語音指令的採集操作。
於一實施例中,文書編輯軟體2在執行時提供有一執行視窗,其中,該執行視窗中包含有一文書編輯界面以及一執行工具欄界面,該文書編輯界面用於顯示文書編輯的狀態,而該執行工具欄界面則用於啟動該執行工具。較佳者,在當觸發模組15啟動文書編輯軟體2的該語音控制應用時,可令文書編輯軟體2自動關閉該執行工具欄界面,而使該文書編輯界面佔滿該執行視窗,從而提供一更大的文書編輯界面,以利於使用者瀏覽。於本實施例中,觸發模組15則例如為文書編輯軟體2於執行時所提供的一浮動式指令觸發界面,並浮動設置於該文書編輯界面中,俾於被觸發時,生成該語音控制開啟指令,以令文書編輯軟體2啟動語音控制功能而依據所輸入的語音指令執行相應的編輯操作。
再者,如圖3所示,為了提高使用者的文書編輯使用體驗,本發明的語音控制系統1還包括一透明度調整模組16,其為文書編輯軟體2執行時所提供之一透明度調整界面,用於調整該浮動式指令觸發界面於該文書編輯界面上的透明度。例如,當使用者暫時無需使用觸發模組15以觸發語音控制開啟指令時,可利用透明度調整模組16而將該浮動式指令觸發界面調整為透明狀,以不影響文書編輯界面的正常使用,即令浮動式指令觸發界面不會遮擋住文書編輯界面。
請繼續參閱圖4,為使本發明更符合人性化的使用需求,以迎合不同使用者的使用習慣,語音控制系統1還包括有一自定義模組17,係提供一語音特徵自定義界面,係針對該執行工具信息自定義該第一語音特徵,或者,針對該執行內容信息自定義該第二語音特徵。也就是說,使用者可以根據自身的使用習慣,而設定帶有個人屬性的第一語音特徵和第二語音特徵,舉例而言,設置不同語言版本的第一語音特徵和第二語音特徵,例如將執行工具為“郵件”所對應的第一語音特徵設定為“email”。
請繼續參閱圖4,於另一實施例中,語音控制系統1還可包括一語料資料庫18,其可用於儲存語料資料,俾供解析模組13依據語料資料庫18中所儲存的該語料資料而對語音輸入模組12所輸入的該語音指令執行一語義解析處理,以解析該語音指令的特徵組成。例如,當使用者輸入的語音指令為“字太大”,則語音控制系統1可按照語料資料庫18中儲存的語料資料而分析出使用者希望進行“調整字型的大小”的編輯操作,則令文書編輯軟體2據以開啟“字型”的執行工具,並執行“字型的大小”的編輯操作。
請配合參閱圖5,其為顯示本發明的文書編輯軟體之語音控制方法的步驟流程圖。本發明的語音控制方法用於提供以語音方式控制文書編輯軟體執行操作。如圖所示,該語音控制方法的步驟流程主要包括:
步驟S501,提供一語音指令資料庫,以供儲存一執行工具信息及其對應的至少一第一語音特徵,以及儲存一執行內容信息及其對應的至少一第二語音特徵,其中該執行工具信息係對應於該文書編輯軟體的執行工具,該執行內容信息係對應於該執行工具中的執行內容。於本實施例中,該執行內容信息係包括執行一瀏覽文檔指令或執行至少一項編輯文檔指令,當執行內容信息係包括瀏覽文檔指令時,其可例如為microsoftword應用軟體的“檢視”工具選項61,而對應於“檢視”執行工具下的執行內容則例如為“整頁模式611”、“閱讀版面配置612”、“WEB版面配置613”、“大綱模式614”、“草稿615”等內容選項(如圖6A所示),當執行內容信息係包括編輯文檔指令時,其可例如為microsoftword應用軟體中的“字型”工具選項62,而對應於“字型”執行工具62下的執行內容則例如為“字型樣式621”、“字型的大小622”、“字型色彩623”、“字型的效果624”等內容選項(如圖6B所示);又如,當執行工具對應於microsoft word應用軟體中“段落”的工具選項63時,則執行內容63可對應於“一般631”、“缩排632”、“段落間距633”等內容選項(如圖6C所示)。此外,與執行工具信息所對應的第一語音特徵可與該執行工具信息的名稱完全吻合,抑或包含有執行工具信息中至少兩個相同的關鍵字,與執行內容信息所對應的第二語音特徵亦是如此。例如,對應於執行工具為“版面配置“的第一語音特徵,可以是“版面配置”抑或“配置”。
於本發明的一實施例中,語音指令資料庫中還可用於儲存一腳本信息及其對應的至少一第三語音特徵,其中,該腳本信息可包括複數該執行內容信息,而各該執行內容信息對應於不同的該執行工具中的執行內容,藉此,當文書編輯軟體需連續執行多個編輯操作時,可將該多個編輯操作編輯為一腳本信息,並針對該腳本信息設定對應的第三語音特徵,藉此,當後續使用者需令文書編輯軟體2執行該多個編輯操作時,僅需一次性輸入簡單的語音指令即可,而無需分批輸入各編輯操作所對應的執行工具及其執行內容的語音指令,以簡化使用者的操作。
步驟S502,輸入一語音指令。於本實施例中,可例如藉由裝載於電子設備中的麥克風輸入該語音指令。
步驟S503,解析該語音指令的特徵組成,例如使用語音識別技術將該語音指令轉換為對應的文字信息,以分析該語音指令中的特徵組成,接著按照解析結果,選擇執行步驟S5041、S5042或S5043中的一者。
步驟S5041,當該語音指令的特徵組成與該第一語音特徵相符時,自該語音指令資料庫中提取與該第一語音特徵相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具。例如,當解析出使用者所輸入的語音指令中包含“字型”的特徵組成時,則自語音指令資料庫中查找出與之相符合的第一語音特徵,並自語音指令資料庫中提取與該第一語音特徵相對應的執行工具信息,而令文書編輯軟體據以開啟“字型”的執行工具。
步驟S5042,當該語音指令的特徵組成與該第二語音特徵相符時,自該語音指令資料庫中提取與該第二語音特徵相對應的執行內容信息,且當與該第二語音特徵對應執行內容的執行工具開啟時,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作。例如,當解析出使用者所輸入的語音指令中包含“字型樣式”的特徵組成時,自語音指令資料庫11中查找與之相吻合的第二語音特徵,並提取該第二語音特徵所對應的執行內容信息,即“字型樣式”,而後分析該執行內容所屬的執行工具是否已經開啟,即判斷文書編輯軟體當前是否已經開啟“字型”的執行工具,且當判斷結果為已開啟時,令文書編輯軟體執行“字型樣式”的編輯操作。
步驟S5043,當該語音指令的特徵組成同時與該第一、第二語音特徵相符時,首先,自該語音指令資料庫中提取與該第一語音特徵信息相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的菜單工具,而後,自該語音指令資料庫中提取與該第二語音特徵信息相對應的執行內容信息,俾令該文書編輯軟體依據該執行內容信息擇取該菜單工具中對應的執行選項內容,並據以執行相應的操作。例如,當解析出使用者所輸入的語音指令中同時包含有“字型”以及“字型樣式”的特徵組成時,則首先自語音指令資料庫中提取與“字型”相吻合的第一語音特徵,並調取與之相對應的執行工具信息,以令文書編輯軟體開啟“字型”的執行工具,而後再從語音指令資料庫中提取與“字型樣式”相吻合的第二語音特徵,並調取與之相對應的執行內容信息,以令文書編輯軟體執行“字型樣式”的編輯操作。
此外,於其他實施例中,當解析結果為語音指令的特徵組成與該第三語音特徵相符時,則自語音指令資料庫中提取與第三語音特徵所對應的腳本信息,以令文書編輯軟體運行該腳本信息,而依序執行該腳本信息中所包含之多個執行內容信息。例如當使用者輸入包含有“發郵件給小明”的特徵組成的語音指令時,則自語音指令資料庫中提取與之相吻合的第三語音特徵,並調取與該第三語音特徵相對應的腳本信息,而令文書編輯軟體運行該腳本信息,包括,首先打開“郵件”的執行工具,而後執行“編輯新郵件”的執行內容,並自聯繫人信息中找到“小明”的聯繫信息以自動填入“收件人”欄位,並自郵件設置中找出對應的“郵件簽名”(如果已有設置的話),並將設置的“郵件簽名”附於郵件正文的末端,而後執行郵件發送任務以發送郵件給小明,從而完成腳本信息的運行。
於一實施例中,所述方法還包括提供輸入一語音控制開啟指令,俾令文書編輯軟體根據所輸入的語音控制開啟指令而啟動一語音控制應用,而依據所輸入的該語音指令執行相應之操作。於本實施例中,可例如於文書編輯軟體的文書編輯界面中顯示一功能按鈕,當使用者透過例如滑鼠、鍵盤等輸入模組選中該功能按鈕時,即觸發執行語音指令的採集操作。
較佳者,文書編輯軟體於執行時提供有一執行視窗,該執行視窗包含有一文書編輯界面與一執行工具欄界面,其中,文書編輯界面係用於顯示文書編輯的狀態,而執行工具欄界面則用於啟動該執行工具,當文書編輯軟體的語音控制應用啟動時,文書編輯軟體可自動關閉該執行工具欄界面,而使文書編輯界面佔滿該執行視窗。,從而提供使用者具有一更大的文書編輯界面,以利於編輯操作。此外,文書編輯軟體於執行時還可提供一浮動式指令觸發界面,其可浮動設置於文書編輯界面中,俾供觸發生成該語音控制開啟指令。再者,當文書編輯軟體在執行時,還可提供一透明度調整界面,以提供使用者調整浮動式指令觸發界面於該文書編輯界面上的透明度。例如,當使用者暫時無需使用語音控制開啟指令時,可利用該透明度調整界面而將該浮動式指令觸發界面調整為透明狀,以不影響文書編輯界面的正常編輯使用,即浮動式指令觸發界面不會遮擋住文書編輯界面。
為使本發明更符合人性化的使用需求,以迎合不同使用者的使用習慣,於另一實施例中,所述方法還包括提供一語音特徵自定義界面,係針對該執行工具信息自定義該第一語音特徵,或者,針對該執行內容信息自定義該第二語音特徵,也就是說,使用者可以根據自身的使用習慣,而設定帶有個人屬性的第一語音特徵和第二語音特徵,舉例而言,設置不同語言版本的第一語音特徵和第二語音特徵,例如將執行工具為“郵件”所對應的第一語音特徵設定為“email”。
於另一實施例中,還可提供建立一語料資料庫,以儲存語料資料,俾依據該語料資料對該語音指令執行一語義解析處理,以解析該語音指令的特徵組成。例如,當使用者輸入的語音指令為“字太大”,則語音控制系統1可按照語料資料庫18中儲存的語料資料而分析出使用者希望進行“調整大小”的編輯操作,則令文書編輯軟體2據以開啟“字型”的執行工具,並執行“字型的大小”的編輯操作。
由上可知,本發明所提供的文書編輯軟體之語音控制方法及系統,係透過建立語音指令資料庫,以儲存文書編輯軟體中所包含的執行工具及其執行內容所對應的語音特徵,俾於使用者輸入語音指令時,通過解析該語音指令中的特徵組成,並與語音資料庫中儲存的語音特徵進行比對,以控制文書編輯軟體調用相應的執行工具及其執行內容而執行編輯操作任務,無需使用者手動查找相應的工具欄來執行編輯操作,可以簡化文書編輯操作的複雜度,並提高文書編輯軟體的使用體驗。
再者,本發明透過提供自定義語音特徵,並建立可針對語音指令執行語義解析處理的語料資料庫,據以分析語音指令的特徵組成,以使所輸入的語音指令更符合人性化的使用需求。
此外,本發明的語音資料庫還可針對腳本信息定義對應的語音特徵,俾供使用者僅需輸入一簡單的語音指令,即可令文書編輯軟體通過運行腳本信息,而依序執行腳本信息中所包含的多個執行內容,以輔助提高工作效率。
上述實施例僅例示性說明本發明之原理及功效,而非用於限制本發明。任何熟習此項技術之人士均可在不違背本發明之精神及範疇下,對上述實施例進行修飾與改變。因此,本發明之權利保護範圍,應如本發明申請專利範圍所列。
1 | 語音控制系統 |
11 | 語音指令資料庫 |
12 | 語音輸入模組 |
13 | 解析模組 |
14 | 執行模組 |
15 | 觸發模組 |
16 | 透明度調整模組 |
17 | 自定義模組 |
18 | 語料資料庫 |
2 | 文書編輯軟體 |
61 | “檢視”執行工具的操作界面 |
611~615 | “檢視”執行工具下的執行內容 |
62 | “字型”執行工具的操作界面 |
621~624 | “字型”執行工具下的執行內容 |
63 | “段落”執行工具的操作界面 |
631~633 | “段落”執行工具下的執行內容 |
S501~S5043 | 步驟 |
圖1為顯示本發明的文書編輯軟體之語音控制系統的基本架構示意圖;
圖2至圖4為顯示本發明的文書編輯軟體之語音控制系統的不同實施例示意圖;
圖5為顯示本發明的文書編輯軟體之語音控制方法的步驟流程圖;以及
圖6A至圖6C為顯示本發明的文書編輯軟體的不同的執行工具的界面操作實施例示意圖。
Claims (10)
- 一種文書編輯軟體之語音控制方法,係以語音方式控制文書編輯軟體執行操作,該語音控制方法包括:提供一語音指令資料庫,以供儲存一執行工具信息及其對應的至少一第一語音特徵,以及儲存一執行內容信息及其對應的至少一第二語音特徵,其中該執行工具信息係對應於該文書編輯軟體的執行工具,該執行內容信息係對應於該執行工具中的執行內容;輸入一語音指令;解析該語音指令的特徵組成;當該語音指令的特徵組成與該第一語音特徵相符時,自該語音指令資料庫中提取與該第一語音特徵相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具;當該語音指令的特徵組成與該第二語音特徵相符時,自該語音指令資料庫中提取與該第二語音特徵相對應的執行內容信息,且當與該第二語音特徵對應執行內容的執行工具開啟時,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作;當該語音指令的特徵組成同時與該第一、第二語音特徵相符時,首先,自該語音指令資料庫中提取與該第一語音特徵信息相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的菜單工具,而後,自該語音指令資料庫中提取與該第二語音特徵信息相對應的執行內容信息,俾令該文書編輯軟體依據該執行內容信息擇取該菜單工具中對應的執行選項內容,並據以執行相應的操作;提供該語音指令資料庫儲存一腳本信息及其對應的至少一第三語音特徵,其中該腳本信息係包括複數該執行內容信息,各該執行內容信息對應於不同之該執行工具中的執行內容,其中,需連續執行多個編輯操作時,可將該多個編輯操作編輯為該腳本信息;以及當解析該語音指令的特徵組成與該第三語音特徵相符時,自該語音指令資料庫中提取該腳本信息,以令該文書編輯軟體依據該語音指令運行該腳本信息,而依序執行該腳本信息中所包含之該複數執行內容信息,藉此達到一次性輸入語音指令連續執行多個編輯操作。
- 如申請專利範圍第1項所述之語音控制方法,還包括提供輸入一語音控制開啟指令,俾令該文書編輯軟體根據該輸入之語音控制開啟指令而啟動一語音控制應用,而依據所輸入的該語音指令執行相應之操作。
- 如申請專利範圍第1項所述之語音控制方法,還包括提供一語音特徵自定義界面,係針對該執行工具信息自定義該第一語音特徵,或者,針對該執行內容信息自定義該第二語音特徵。
- 如申請專利範圍第1項所述之語音控制方法,其中,該執行內容信息係包括執行一瀏覽文檔指令或執行至少一項編輯文檔指令。
- 如申請專利範圍第1項所述之語音控制方法,還包括提供一語料資料庫,係儲存語料資料,該方法還包括依據該語料資料對該語音指令執行一語義解析處理,以解析該語音指令的特徵組成。
- 一種文書編輯軟體之語音控制系統,係以語音方式控制文書編輯軟體執行操作,該語音控制系統包括:一語音指令資料庫,用於儲存一執行工具信息及其對應的至少一第一語音特徵,以及儲存一執行內容信息及其對應的至少一第二語音特徵,其中該執行工具信息係對應於該文書編輯軟體的執行工具,該執行內容信息係對應於執行工具中的執行內容,且該語音指令資料庫還儲存一腳本信息及其對應的至少一第三語音特徵,其中該腳本信息係包括複數該執行內容信息,各該執行內容信息對應於不同之該執行工具中的執行內容,其中,需連續執行多個編輯操作時,可將該多個編輯操作編輯為該腳本信息;一語音輸入模組,係提供輸入一語音指令;一解析模組,係用於解析該語音指令的特徵組成;以及一執行模組,係依據該解析模組的解析結果,控制該文書編輯軟體執行相應的操作,其中,當該解析模組的解析結果為該語音指令的特徵組成與該第一語音特徵相符時,該執行模組自該語音指令資料庫中提取與該第一語音特徵相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具;當該解析模組的解析結果為該語音指令的特徵組成與該第二語音特徵相符時,該執行模組自該語音指令資料庫中提取與該第二語音特徵相對應的執行內容信息,且當與該第二語音特徵對應執行內容的執行工具開啟時,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作;當該解析模組的解析結果為該語音指令的特徵組成同時與該第一、第二語音特徵相符時,該執行模組首先自該語音指令資料庫中提取與該第一語音特徵信息相對應的執行工具信息,以令該文書編輯軟體依據該執行工具信息開啟相應的執行工具,而後自該語音指令資料庫中提取與該第二語音特徵信息相對應的執行內容信息,俾令該文書編輯軟體依據該執行內容信息擇取該執行工具中對應的執行選項內容,並據以執行相應的操作;當該解析模組解析該語音指令的特徵組成與該第三語音特徵相符時,該執行模組還包括自該語音指令資料庫中提取該腳本信息,以令該文書編輯軟體依據該語音指令運行該腳本信息,而依序執行該腳本信息中所包含之該複數執行內容信息,藉此達到一次性輸入語音指令連續執行多個編輯操作。
- 如申請專利範圍第6項所述之語音控制系統,還包括一觸發模組,係提供輸入一語音控制開啟指令,俾使該文書編輯軟體根據該輸入之語音控制開啟指令啟動語音控制應用,而藉由該語音輸入模組輸入該語音指令,並依據輸入之該語音指令執行相應之操作。
- 如申請專利範圍第6項所述之語音控制系統,還包括一自定義模組,係提供一語音特徵自定義界面,係針對該執行工具信息自定義該第一語音特徵,或者,針對該執行內容信息自定義該第二語音特徵。
- 如申請專利範圍第6項所述之語音控制系統,其中,該執行內容信息係包括執行一瀏覽文檔指令或執行至少一項編輯文檔指令。
- 如申請專利範圍第6項所述之語音控制系統,還包括提供一語料資料庫,係儲存語料資料,俾供該解析模組依據該語料資料對該語音指令執行一語義解析處理,以解析該語音指令的特徵組成。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106139781A TWI664536B (zh) | 2017-11-16 | 2017-11-16 | 文書編輯軟體之語音控制方法及語音控制系統 |
CN201711318291.9A CN109801620A (zh) | 2017-11-16 | 2017-12-12 | 文书编辑软件的语音控制方法及语音控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106139781A TWI664536B (zh) | 2017-11-16 | 2017-11-16 | 文書編輯軟體之語音控制方法及語音控制系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201923622A TW201923622A (zh) | 2019-06-16 |
TWI664536B true TWI664536B (zh) | 2019-07-01 |
Family
ID=66556150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106139781A TWI664536B (zh) | 2017-11-16 | 2017-11-16 | 文書編輯軟體之語音控制方法及語音控制系統 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109801620A (zh) |
TW (1) | TWI664536B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291539B (zh) * | 2020-01-21 | 2023-10-20 | 深圳富联精匠科技有限公司 | 文件编辑控制方法、装置、计算机装置及存储介质 |
CN113157351B (zh) * | 2021-03-18 | 2022-06-07 | 福建马恒达信息科技有限公司 | 一种用于表格工具快捷调用的语音插件构建方法 |
CN113127105B (zh) * | 2021-03-18 | 2022-06-10 | 福建马恒达信息科技有限公司 | 一种excel自动语音工具调用方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW502196B (en) * | 1998-02-25 | 2002-09-11 | Primax Electronics Ltd | Window display system capable of receiving speech commands |
TW201030734A (en) * | 2009-02-06 | 2010-08-16 | Aten Int Co Ltd | Voice recognition device and operating method thereof |
CN103324406A (zh) * | 2012-03-23 | 2013-09-25 | 联想(北京)有限公司 | 一种控制方法及一种受控设备 |
CN105161099A (zh) * | 2015-08-12 | 2015-12-16 | 恬家(上海)信息科技有限公司 | 一种语音控制的遥控装置及其实现方法 |
CN107155121A (zh) * | 2017-04-26 | 2017-09-12 | 海信集团有限公司 | 语音控制文本的显示方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1229216A (zh) * | 1998-03-16 | 1999-09-22 | 致伸实业股份有限公司 | 可接受语音指令的视窗显示系统 |
EP1456838A1 (en) * | 2001-11-16 | 2004-09-15 | Koninklijke Philips Electronics N.V. | Device to edit a text in predefined windows |
CN102510426A (zh) * | 2011-11-29 | 2012-06-20 | 安徽科大讯飞信息科技股份有限公司 | 个人助理应用访问方法及系统 |
CN104992709B (zh) * | 2015-06-25 | 2019-06-11 | 广州视源电子科技股份有限公司 | 一种语音指令的执行方法及语音识别设备 |
CN105551492A (zh) * | 2015-12-04 | 2016-05-04 | 青岛海信传媒网络技术有限公司 | 语音控制的方法、装置与终端 |
CN106653011A (zh) * | 2016-09-12 | 2017-05-10 | 努比亚技术有限公司 | 一种语音控制方法、装置及终端 |
-
2017
- 2017-11-16 TW TW106139781A patent/TWI664536B/zh not_active IP Right Cessation
- 2017-12-12 CN CN201711318291.9A patent/CN109801620A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW502196B (en) * | 1998-02-25 | 2002-09-11 | Primax Electronics Ltd | Window display system capable of receiving speech commands |
TW201030734A (en) * | 2009-02-06 | 2010-08-16 | Aten Int Co Ltd | Voice recognition device and operating method thereof |
CN103324406A (zh) * | 2012-03-23 | 2013-09-25 | 联想(北京)有限公司 | 一种控制方法及一种受控设备 |
CN105161099A (zh) * | 2015-08-12 | 2015-12-16 | 恬家(上海)信息科技有限公司 | 一种语音控制的遥控装置及其实现方法 |
CN107155121A (zh) * | 2017-04-26 | 2017-09-12 | 海信集团有限公司 | 语音控制文本的显示方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109801620A (zh) | 2019-05-24 |
TW201923622A (zh) | 2019-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4829423A (en) | Menu-based natural language understanding system | |
US7403888B1 (en) | Language input user interface | |
US7853888B1 (en) | Methods and apparatus for displaying thumbnails while copying and pasting | |
US8031943B2 (en) | Automatic natural language translation of embedded text regions in images during information transfer | |
TWI664536B (zh) | 文書編輯軟體之語音控制方法及語音控制系統 | |
JP2003186614A (ja) | アプリケーションプログラムの状態に基づく自動的なソフトウェア入力パネル選択 | |
JPH10333799A (ja) | ウィンドウディスプレイに複数のダイアログボックスを表示するためのシステム及び方法 | |
US10699072B2 (en) | Immersive electronic reading | |
CN104133815B (zh) | 输入和搜索的方法及系统 | |
JPH1125098A (ja) | 情報処理装置、リンク先ファイルの取得方法および記憶媒体 | |
CN111881655A (zh) | 一种语音输入标点符号快速切换方法 | |
US20190243532A1 (en) | Information processing device and non-transitory computer readable medium | |
JP2002304388A (ja) | ルビ表示判定方法 | |
JPWO2020044290A5 (zh) | ||
CN113157966A (zh) | 显示方法、装置及电子设备 | |
JP5703244B2 (ja) | トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラム | |
JP6458358B2 (ja) | 画像処理装置及びプログラム | |
JP2019133603A (ja) | 情報処理装置及び情報処理プログラム | |
JP2019133604A (ja) | 情報処理装置及び情報処理プログラム | |
Cherid et al. | Building Natural Language Understanding System from User Manual to Execute Office Application Functions | |
TWI421709B (zh) | 具即時翻譯的寫作系統及其寫作方法 | |
JPH09179859A (ja) | 文字列変換装置および文字列変換方法 | |
AU2017101087A4 (en) | Interaction Language Design Pattern | |
CN111930245A (zh) | 字符输入控制方法、装置及电子设备 | |
JP2001092821A (ja) | 文章校正装置及び文章校正処理プログラムを記録したコンピュータ読取可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |