TW202520249A

TW202520249A - 控制方法、控制系統以及顯示裝置

Info

Publication number: TW202520249A
Application number: TW112143736A
Authority: TW
Inventors: 郭嘉恒
Original assignee: 大陸商昆山揚皓光電有限公司
Priority date: 2023-11-08
Filing date: 2023-11-13
Publication date: 2025-05-16
Also published as: TWI890193B; CN119967629A

Abstract

控制方法、控制系統以及顯示裝置。所述控制方法包括：藉由顯示裝置產生及顯示存取物件；藉由用戶端裝置取得存取物件，並根據存取物件的資訊開啟瀏覽器，藉由瀏覽器連線至顯示裝置；藉由顯示裝置提供操作介面與語音識別模組至用戶端裝置，以在用戶端裝置的瀏覽器中顯示操作介面；響應於用戶端裝置藉由操作所述操作介面而接收到語音訊號，藉由用戶端裝置執行語音識別模組，以獲得與語音訊號相匹配的控制指令，並傳送控制指令至顯示裝置；以及響應於顯示裝置接收到控制指令，藉由顯示裝置根據控制指令執行對應的動作。

Description

控制方法、控制系統以及顯示裝置

本發明是有關於一種控制機制，且特別是有關於一種基於語音的控制方法、控制系統以及顯示裝置。

近年來，隨著智能手機、智能終端裝置以及物聯網技術的發展，控制傳統投影機的系統也得到相應的技術升級。藉由智能手機遙控智能投影機的方式分為兩種：直接通信模式以及間接通信模式。

直接通信模式的原理是在智能手機中安裝遙控應用程式（remote application，remote APP），利用智能手機內置的紅外線發送模組或藍牙通信模組，與智能投影機內置的紅外線接收模組或藍牙模組建立通信通道。使用者操作智能手機中的遙控應用程式控制紅外線發送模組或藍牙模組向智能投影機發出指令。智能投影機根據預設的通信協議來解析出指令的內容，以執行對應的遙控動作。

然，由於智能投影機會因為品牌不同或型號不同而使用不同的韌體（firmware），導致需要為不同品牌或不同型號的投影機開發用在不同作業系統上的個別的遙控應用程式及通信協定。因此，在軟硬體（software or hardware）的開發與維護上所需的技術要求較高，且成本亦較高。此外，使用者必須在其使用的終端裝置安裝對應的遙控應用程式，在使用上亦較繁雜。倘若需對不同品牌或不同型號的多台投影機進行遙控，則終端裝置上需安裝上所有投影機對應的遙控應用程式，進而占用終端裝置的儲存容量與資源。

“先前技術”段落只是用來幫助了解本發明內容，因此在“先前技術”段落所揭露的內容可能包含一些沒有構成所屬技術領域中具有通常知識者所知道的習知技術。在“先前技術”段落所揭露的內容，不代表該內容或者本發明一個或多個實施例所要解決的問題，在本發明申請前已被所屬技術領域中具有通常知識者所知曉或認知。

本發明提供一種控制方法、控制系統以及顯示裝置，用戶端裝置不用安裝額外程式便能夠方便且快捷地實現對顯示裝置的語音控制。

本發明的其他目的和優點可以從本發明所揭露的技術特徵中得到進一步的了解。

為達上述之一或部份或全部目的或是其他目的，本發明的控制方法適於經由用戶端裝置來控制顯示裝置，所述控制方法包括步驟如下：藉由顯示裝置連線至網路，並產生及顯示存取物件；藉由用戶端裝置取得存取物件，並根據存取物件的資訊開啟瀏覽器，藉由瀏覽器經由網路連線至顯示裝置；藉由顯示裝置經由網路提供操作介面與語音識別模組至用戶端裝置，以在用戶端裝置的瀏覽器中顯示操作介面；響應於用戶端裝置藉由操作所述操作介面而接收到語音訊號，藉由用戶端裝置執行語音識別模組，以獲得與語音訊號相匹配的控制指令，並傳送控制指令至顯示裝置；以及響應於顯示裝置接收到控制指令，藉由顯示裝置根據控制指令執行對應的動作。

在本發明的一實施例中，在藉由顯示裝置經由網路提供操作介面與語音識別模組至用戶端裝置，以在用戶端裝置的瀏覽器中顯示操作介面之後，更包括：在藉由操作介面接收語音訊號之前，啟動用戶端裝置的收音設備，並使用戶端裝置初始化語音識別模組；其中，響應於用戶端裝置藉由操作所述操作介面接收到語音訊號，藉由用戶端裝置執行語音識別模組的步驟包括：將語音訊號轉換為符合指定格式的語音檔；利用語言模型將語音檔轉換為文字內容；以及利用語料資訊以及拼音字典，對文字內容執行文字匹配，而獲得匹配結果，其中匹配結果關聯於控制指令。

在本發明的一實施例中，響應於用戶端裝置藉由操作所述操作介面接收到語音訊號，藉由用戶端裝置執行語音識別模組的步驟包括：經由網路傳送匹配結果至雲端平台，以由雲端平台對匹配結果執行語意分析，並自雲端平台接收根據匹配結果執行語意分析而產生的控制指令；以及傳送控制指令至顯示裝置。

在本發明的一實施例中，藉由顯示裝置連線至網路，並產生及顯示存取物件的步驟包括：藉由顯示裝置部屬網頁服務端（Web server），並藉由網頁服務端執行下述步驟：取得顯示裝置的網際網路協定（Internet Protocol，IP）位址以及埠號（port number）；基於IP位址以及埠號，產生存取物件。

在本發明的一實施例中，所述存取物件為二維碼，所述二維碼為基於IP位址以及埠號產生的客戶端存取網址所生成，顯示裝置的顯示模組顯示二維碼，藉由用戶端裝置取得存取物件，並根據存取物件的資訊開啟瀏覽器，藉由瀏覽器經由網路連線至顯示裝置更包括步驟如下：藉由驅動用戶端裝置的圖像掃描器來掃描顯示模組上所顯示的二維碼；以及響應於圖像掃描器取得二維碼，用戶端裝置啟動瀏覽器，並藉由瀏覽器存取二維碼對應的客戶端存取網址，進而經由網路連線至顯示裝置。

在本發明的一實施例中，所述存取物件為基於IP位址以及埠號產生的客戶端存取網址，顯示裝置的顯示模組顯示客戶端存取網址，所述方法更包括步驟如下：藉由用戶端裝置啟動瀏覽器，並於瀏覽器中根據客戶端存取網址經由網路連線至顯示裝置。

在本發明的一實施例中，所述控制方法更包括步驟如下：響應於顯示裝置連線至網路，藉由顯示裝置的顯示模組顯示存取物件，其中所述存取物件關聯於客戶端存取網址；以及響應於顯示裝置斷開與網路的連線，藉由顯示裝置的顯示模組停止顯示存取物件，並使客戶端存取網址為無效。

在本發明的一實施例中，其中在藉由顯示裝置連線至網路之後，更包括步驟如下：藉由顯示裝置部屬網頁服務端，並藉由網頁服務端執行下述步驟：基於顯示裝置的IP位址以及埠號，產生通信服務接口；以及基於顯示裝置的IP位址以及埠號，產生客戶端存取網址，其中在藉由用戶端裝置取得存取物件之後，更包括：藉由網路，於用戶端裝置根據存取物件而存取客戶端存取網址，其中用戶端裝置藉由通信服務接口與顯示裝置進行數據傳輸。

在本發明的一實施例中，藉由瀏覽器經由網路連線至顯示裝置之後，更包括步驟如下：藉由用戶端裝置基於存取物件所關聯的客戶端存取網址，在用戶端裝置的顯示介面上建立快捷圖標，以在快捷圖標被致能時，直接啟動瀏覽器，以藉由瀏覽器經由網路連線至顯示裝置。

本發明的控制系統，包括：用戶端裝置，連線至網路，並具有瀏覽器；以及顯示裝置，經配置以：連線至網路，並產生及顯示存取物件，其中存取物件用以供用戶端裝置藉由開啟瀏覽器經由網路連線至顯示裝置；響應於與用戶端裝置的連線，提供操作介面與語音識別模組至用戶端裝置，以在用戶端裝置的瀏覽器中顯示操作介面；以及接收來自用戶端裝置的控制指令，並根據控制指令執行對應的動作，其中控制指令為響應用戶端裝置利用語音識別模組與語音訊號相匹配所獲得。

本發明的顯示裝置，包括：通信設備，經配置以連線至網路；處理器，耦接至通信設備；以及顯示模組，耦接至處理器，其中，處理器經由通信設備連線至網路，產生存取物件並藉由顯示模組顯示存取物件，其中存取物件用以供用戶端裝置經由網路連線至顯示裝置；處理器響應於與用戶端裝置的連線，藉由通信設備輸出操作介面與語音識別模組；以及接收來自用戶端裝置的控制指令，並根據控制指令執行對應的動作，其中控制指令為響應用戶端裝置利用語音識別模組與語音訊號相匹配所獲得。

基於上述，本揭露經由顯示裝置所提供的存取物件，使得用戶端裝置能夠與顯示裝置通訊連接，並由顯示裝置提供操作介面與語音識別模組至用戶端裝置。據此，用戶端裝置不用安裝額外應用程式便能夠方便且快捷地實現對顯示裝置的語音控制。

有關本發明之前述及其他技術內容、特點與功效，在以下配合參考圖式之一較佳實施例的詳細說明中，將可清楚的呈現。以下實施例中所提到的方向用語，例如：上、下、左、右、前或後等，僅是參考附加圖式的方向。因此，使用的方向用語是用來說明並非用來限制本發明。

圖1是依照本發明一實施例的控制系統的方塊圖。請參照圖1，控制系統100包括用戶端裝置110及顯示裝置120。用戶端裝置110具有瀏覽器（Web Browser）B01，即用戶端裝置110可執行內建的瀏覽器B01應用程式。在本實施例中，可透過路由器或交換器來建立網路，以供用戶端裝置110與顯示裝置120在相同的網路環境下建立雙向通信來進行數據交換。例如，經由路由器來建立區域網路（Local Area Network，LAN）。用戶端裝置110與顯示裝置120連線至區域網路來建立雙向通信。或者，顯示裝置120建立AP（access point，存取點）熱點網路，藉此使得用戶端裝置110與顯示裝置120透過網際網路來進行通訊連線。

在一實施例中，藉由用戶端裝置110控制顯示裝置120的方法可採用超文本傳輸協議（HyperText Transfer Protocol，HTTP）通信技術來實現，用以在用戶端裝置110與顯示裝置120之間建立連接來進行雙向的數據傳輸。用戶端裝置110連接到路由器所建立的區域網路或者由顯示裝置120所建立的AP熱點網路時，可以藉由存取顯示裝置120的操作介面來實現通信及控制操作。

用戶端裝置110與顯示裝置120皆為具有通信功能以及運算功能的實體裝置，底下舉例來說明。圖2A是依照本發明一實施例的用戶端裝置的方塊圖。圖2B是依照本發明一實施例的顯示裝置的方塊圖。

在圖2A中，用戶端裝置110例如是智能手機或者智能平板等。用戶端裝置110包括處理器201、通信設備203、儲存設備205、顯示介面207、圖像掃描器209以及收音設備211。處理器201耦接至通信設備203、儲存設備205、顯示介面207、圖像掃描器209以及收音設備211。由處理器201來驅動並控制通信設備203、儲存設備205、顯示介面207、圖像掃描器209以及收音設備211的至少其中之一。在其他實施例中，圖像掃描器209可以是非必要構件。

處理器201例如為中央處理單元（Central Processing Unit，CPU）、物理處理單元（Physics Processing Unit，PPU）、可程式化之微處理器（Microprocessor）、嵌入式控制晶片、數位訊號處理器（Digital Signal Processor，DSP）、特殊應用積體電路（Application Specific Integrated Circuits，ASIC）或其他類似裝置。

通信設備203可以是採用支援區域網路技術、無線區域網路（Wireless LAN，WLAN）技術等的晶片或電路。區域網路例為乙太網路（Ethernet）。無線區域網路例如為Wi-Fi。

儲存設備205例如是任意型式的固定式或可移動式隨機存取記憶體（Random Access Memory，RAM）、唯讀記憶體（Read-Only Memory，ROM）、快閃記憶體（Flash memory）、安全數位卡、硬碟或其他類似裝置或這些裝置的組合。儲存設備205儲存有至少一程式碼片段，上述程式碼片段在被安裝後，會由處理器201來執行。用戶裝置110的瀏覽器B01應用程式式儲存在儲存設備205，並可透過用戶裝置110的處理器201來執行瀏覽器B01應用程式。

顯示介面207例如為液晶顯示器（Liquid Crystal Display，LCD）、發光二極體（light-emitting diode，LED）顯示器、電漿顯示器（Plasma Display）、觸控式螢幕（touch screen）或其他類似裝置或這些裝置的組合。

圖像掃描器209可以是採用了電荷耦合元件（Charge coupled device，CCD）鏡頭或互補式金氧半電晶體（Complementary metal oxide semiconductor transistors，CMOS）鏡頭的攝影機、照相機等。收音設備211例如為麥克風。

在圖2B中，顯示裝置120包括處理器221、通信設備223、儲存設備225以及顯示模組227。處理器221耦接至通信設備223、儲存設備225以及顯示模組227。由處理器221來驅動並控制通信設備223、儲存設備225以及顯示模組227的其中之一。顯示裝置120例如是投影機（projector）或具有顯示面板的電子裝置，例如是液晶電視或顯示器。在一實施例中，採用投影機作為顯示裝置120的情況下，顯示模組227可投射影像至牆壁或投影屏幕（projection screen）上。投影機作為顯示裝置120的情況下，投影機的顯示模組227包括光源、多個光學透鏡以及光閥，用於投射影像。在其他實施例中，採用其他具有顯示面板的電子裝置作為顯示裝置120的情況下，顯示模組227例如為液晶顯示器、LED顯示器、電漿顯示器等顯示面板。

顯示裝置120的處理器221、通信設備223及儲存設備225與用戶端裝置110的處理器201、通信設備203及儲存設備205具有相同或相似的功能，故，顯示裝置120的處理器221、通信設備223及儲存設備225的具體實現可參照上述用戶端裝置110的處理器201、通信設備203及儲存設備205來進行設計，在此不再贅述。

圖3是依照本發明一實施例的控制方法的流程圖。請參照圖1～圖3，在步驟S305中，藉由顯示裝置120連線至網路，並產生及顯示存取物件。所述網路例如為區域網路（Local Area Network，LAN）或網際網路（經由熱點連線）。具體而言，在顯示裝置120中，在藉由通信設備223連線至網路之後，處理器221產生存取物件，並進一步藉由顯示模組227顯示存取物件。存取物件是用來供用戶端裝置110經由網路連線至顯示裝置120。存取物件為關聯於客戶端存取網址而可以是客戶端存取網址或者是二維碼。所述客戶端存取網址可採用統一資源定位符（Uniform Resource Locator，URL）來實現。所述二維碼例如為快速回應（Quick Response Code，QR）碼。

在一實施例中，顯示裝置120設計為：響應於顯示裝置120連線至網路，透過顯示模組227顯示存取物件；響應於顯示裝置120斷開與網路的連線，顯示裝置120的顯示模組227停止顯示存取物件，並使客戶端存取網址變為無效。即，顯示裝置120在連線至網路的狀態下才會產生並提供存取物件，一旦顯示裝置120的連線斷開，則此存取物件會立即失效。

接著，在步驟S310中，藉由用戶端裝置110取得存取物件，並根據存取物件的資訊開啟用戶端裝置110的瀏覽器B01，藉由瀏覽器B01經由所述網路連線至顯示裝置120。舉例來說，當使用者欲透過用戶端裝置110來控制顯示裝置120時，用戶端裝置110可利用圖像掃描器209來掃描顯示裝置120所生成的存取物件（例如二維碼），或者在用戶端裝置110的瀏覽器B01中直接輸入客戶端存取網址。亦即，用戶端裝置110可以根據存取物件的資訊，藉由開啟瀏覽器B01經由網路連線至顯示裝置120。

在步驟S315中，響應於用戶端裝置110與顯示裝置120的連線，藉由顯示裝置120的通信設備223經由網路提供操作介面與語音識別模組至用戶端裝置110，以在用戶端裝置110的瀏覽器B01中顯示操作介面。例如，經由通信技術在用戶端裝置110與顯示裝置120之間建立連接，使得顯示裝置120通過所述連接提供操作介面與語音識別模組至用戶端裝置110。用戶端裝置110可通過瀏覽器B01來存取顯示裝置120提供的操作介面，並且通過所述操作介面接收語音識別模組。

接著，在步驟S320中，響應於用戶端裝置110藉由操作所述操作介面而接收到語音訊號，藉由用戶端裝置110執行語音識別模組，以獲得與語音訊號相匹配的控制指令，並傳送控制指令至顯示裝置120。進一步來說，控制指令為響應用戶端裝置110利用語音識別模組與語音訊號相匹配所獲得。

顯示裝置120中的語音識別模組加載至用戶端裝置110後，可讓使用者透過語音直接藉由載入至用戶端裝置110中的語音識別模組就可以產生控制指令。之後，在步驟S325中，響應於顯示裝置120接收到控制指令，藉由顯示裝置120根據控制指令執行對應的動作。

舉圖4～圖6來分別說明透過用戶端裝置110實現控制顯示裝置120的不同應用例。其中用戶端裝置110例如為圖1及圖2A所示之架構。

圖4是依照本發明一實施例的藉由用戶端裝置來實現控制顯示裝置的第一應用例的示意圖。在本實施例中，用戶端裝置110及顯示裝置120分別採用智慧終端裝置與投影機來實現，而顯示裝置120的顯示模組227投射影像。此外，採用二維碼411作為存取物件。在此實施例中，二維碼411為QR碼。

首先，在顯示裝置120連線至網路，產生存取物件後，經由顯示裝置120的顯示模組227將二維碼411投射至牆壁或投影屏幕等投影面401上。接著，使用者操作用戶端裝置110以驅動用戶端裝置110的圖像掃描器209來掃描顯示裝置120投射的二維碼411。此時，在用戶端裝置110掃描二維碼411之後，響應於圖像掃描器209取得二維碼411的資訊，如圖中狀態410所示，用戶端裝置110的顯示介面207的畫面會由原本的二維碼411切換至瀏覽器B01，亦即用戶端裝置110的處理器201會對應二維碼411的資訊來執行瀏覽器B01應用程式，進而開啟瀏覽器B01，藉由瀏覽器B01存取二維碼411對應的客戶端存取網址，經由網路連線至顯示裝置120，以在用戶端裝置110藉由瀏覽器B01顯示操作介面U，供使用者於用戶端裝置110的操作介面U中進行操作。例如，使用者可觸發操作介面U中的語音輸入功能，以輸入語音訊號。

圖5是依照本發明一實施例的藉由用戶端裝置來實現控制顯示裝置的第二應用例的示意圖。在本實施例中，存取物件為客戶端存取網址501，顯示裝置120顯示客戶端存取網址501。在狀態510中，用戶端裝置110經由使用者操作顯示介面207以令用戶端裝置110的處理器201來執行瀏覽器B01應用程式，並開啟瀏覽器B01以在顯示介面207上顯示，使用者輸入客戶端存取網址501至用戶端裝置110，以使用戶端裝置110藉由瀏覽器B01根據客戶端存取網址501經由網路連線至顯示裝置120。接著，如狀態520所示，用戶端裝置110在顯示介面207中，藉由瀏覽器B01基於客戶端存取網址501來存取顯示裝置120提供的操作介面U，供使用者於用戶端裝置110的操作介面中進行操作。

圖6是依照本發明一實施例的藉由用戶端裝置來實現控制顯示裝置的第三應用例的示意圖。在本實施例中，為了方便使用者下次使用，在通過由圖4所示的第一應用例或圖5所示的第二應用例存取了顯示裝置120提供的存取物件之後，可在用戶端裝置110的顯示介面207中的顯示桌面上基於存取物件所關聯的客戶端存取網址501（圖5所示）設置對應的快捷圖標611，如狀態610所示。待後續欲藉由用戶端裝置110來使用控制功能時，可直接致能（例如藉由點擊的方式）用戶端裝置110中的快捷圖標611，直接啟動瀏覽器B01，以由瀏覽器B01經由網路連線至顯示裝置120，進而在瀏覽器B01中顯示操作介面U，如狀態620所示。第三應用例的實施前提為客戶端存取網址501不會改變。

當使用者利用用戶端裝置110對顯示裝置120進行語音控制時，需要將用戶端裝置（智慧終端裝置）110連接區域網路或是連接顯示裝置120所創建的AP熱點網路，並驅動用戶端裝置110的圖像掃描器209來掃描由顯示裝置120產生的二維碼411，或直接在用戶端裝置110的瀏覽器B01的網址欄位中輸入客戶端存取網址501，以存取具有語音識別模組的操作介面U。繼續使用時，使用者只需通過觸發快捷圖標611便可快速通過瀏覽器B01打開具有語音識別模組的操作介面U。

另外，在另一實施例中，也可不建立快捷圖標611，而是將客戶端存取網址501（圖5所示）保存至書籤或收藏夾。

用戶端裝置110需連入與顯示裝置120相同的網路環境下才能對顯示裝置120進行語音控制。例如，用戶端裝置110與顯示裝置120同時連接於相同的區域網路，或者在沒有區域網路時，由顯示裝置120創建AP熱點網路供用戶端裝置110連入。

圖7是依照本發明一實施例的控制系統的整體動作示意圖。請參照圖7，顯示裝置120在連線至網路後，顯示裝置120的處理器221部屬網頁服務端（Web server）710，並由網頁服務端710來配置網頁客戶端（Web client）720，以藉由網頁客戶端720來提供操作介面U以及語音識別模組721給用戶端裝置110。顯示裝置120中還包括儲存在儲存設備225中的指令庫730。指令庫730中儲存多個控制指令與其對應執行的具體動作的對應關係。

使用者經由用戶端裝置110的瀏覽器B01存取客戶端存取網址後，連接至顯示裝置120的網頁客戶端720。舉例來說，顯示裝置120建立的網頁服務端710始終開啟HTTP請求服務來監聽訊息。當使用者點擊如圖6所示之用戶端裝置110的顯示介面207上的快捷圖標611，進而立即通過用戶端裝置110的瀏覽器B01快速打開連接至客戶端存取網址501並與相應的網頁客戶端720來建立通訊連接。此時，網頁客戶端720所提供的操作介面U會在用戶端裝置110的瀏覽器B01中顯示。接著，使用者可在瀏覽器B01中所顯示的操作介面U中按下對應於錄音功能的按鈕進行錄音，使用戶端裝置110經由在瀏覽器B01對操作介面U進行操作而接收到語音訊號，之後透過載入至用戶端裝置110的網頁客戶端720中的語音識別模組721進行識別後將產生的匹配結果輸出至操作介面U中顯示。使用者即可根據顯示的匹配結果確認是否為所欲執行的控制指令。當使用者按下操作介面U中對應送出控制指令功能的按鈕時，用戶端裝置110便可將匹配結果作為控制指令，以HTTP請求的方式傳送至顯示裝置120的網頁服務端710，網頁服務端710在接收到控制指令之後對控制指令進行解析，並基於解析結果來比對指令庫730中的具體動作，進而使顯示裝置120執行相對應的動作。

底下舉例說明由用戶端裝置110運行語音識別模組721的詳細步驟。圖8是依照本發明一實施例的用戶端裝置運行語音識別模組的流程圖。其中用戶端裝置110及顯示裝置120例如為圖1、圖2A及圖2B所示之架構。請參照圖1、圖2A、圖2B及圖8，本實施例用以進一步說明，在由顯示裝置120提供操作介面U與語音識別模組721至用戶端裝置110，以在用戶端裝置110的瀏覽器B01中顯示操作介面U之後的詳細動作。

首先，在步驟S805中，在用戶端裝置110中，響應於使用者的操作，處理器201啟動收音設備211進行錄音，並初始化語音識別模組721。接著，處理器201執行語音識別模組721來執行步驟S810～S825。在一實施例中，語音識別模組721包括音頻錄製部件、音頻處理部件、聲學模型、計算模型、語言模型、拼音字典以及語料資訊（corpus information）。

當使用者利用用戶端裝置110存取網頁客戶端720時，網頁客戶端720會詢問用戶端裝置110以開啟收音設備211的使用權限。在獲得使用收音設備211的許可權之後，用戶端裝置110的處理器201初始化載入的語音識別模組721。初始化的目的是為了將事先擬定的語料資訊與語音識別模型721中的模型(如聲學模型、計算模型、語言模型、拼音字典)相匹配，從而減少後續識別過程中的計算時間。具體而言，由於聲學模型、計算模型、語言模型（定義了與文字出現的順序、時間相關的內容，即處理文字序列）、拼音字典以及語料資訊的資料量龐大，為了減少後續的搜尋時間，因此需要初始化。由於已經知道要進行語音控制，因此利用事先錄製好的相關的語音控制的字詞（例如，“打開xxx設置”，“xxx”可以是任何關於操作的功能；例如是“關閉電源”；“降低音量”等等），並且根據用戶語言習慣不同設計不同的語序的排列組合。初始化的目的便是要讓語音識別模型721的搜尋範圍縮小，僅從跟語音控制相關的功能進行搜索即可，如此可減少搜索的時間。

初始化完畢之後，在步驟S810中，透過音頻錄製部件接收由收音設備211所錄製的語音訊號。例如，可在操作介面U上提示使用者開始使用。使用者按下操作介面U中的錄音按鈕並開始說話。此時，用戶端裝置110的處理器201調用音頻錄製部件開始工作，即調用用戶端裝置110的收音設備211採集使用者發出的聲音來作為語音訊號。

接著，便可執行如圖3的步驟S320：響應於用戶端裝置110藉由操作所述操作介面而接收到語音訊號，藉由用戶端裝置110執行語音識別模組721，以獲得與語音訊號相匹配的控制指令，並傳送控制指令至顯示裝置120。詳細來說，步驟S815～S825為圖3的步驟S320的一個詳細實施方式。在步驟S815中，用戶端裝置110的處理器201調用音頻處理部件，將語音訊號轉換為符合一指定格式的語音檔。例如，錄製的語音訊號為MP3（MPEG-1 Audio Layer III或MPEG-2 Audio Layer III）格式或WMV（Windows Media Video）格式，為了後續音頻比對需要透過音頻處理部件進行轉檔的動作。

在步驟S820中，利用語言模型將語音檔轉換為文字內容。用戶端裝置110的處理器201根據聲學模型擬定的特定頻率聲紋，將語音訊號的觀測特徵與句子的語音建模單元聯繫起來，同時通過計算模型來計算語音訊號對應可能的文字序列的機率。之後，透過語言模型來獲得機率最大的文字序列作為語音辨識的文字內容。

在步驟S825中，利用語料資訊以及拼音字典，對文字內容執行文字匹配，而獲得匹配結果，其中所述匹配結果關聯於控制指令。在一實施例中，匹配結果可直接為控制指令。在獲得文字內容後，處理器201根據事先擬定好的語料資訊以及拼音字典來精確鎖定對應的文字，最終獲得匹配結果，再將匹配結果呈現在操作介面U上。

在一實施例中，聲學模型、計算模型、語言模型、拼音字典可視為是一個語言運算規則。首先，開發者定義好語料資訊的內容，例如：“打開xxx設置”；“關閉電源”；“降低音量”等字詞。同時，在使用者觸發語音識別模組721時，可在操作介面U上提示幾個常用功能對應的語言描述（當然，所述語言描述也可用於語料資訊中先定義好）。在使用者說完後，語音識別模組721會運行前述的語言運算規則，並在定義好的語料資訊中進行比對。倘若比對成功則輸出對應的匹配結果在用戶端裝置110。

在一實施例中，圖3的步驟S320可更包含步驟S830～S835，於步驟S825之後執行。在步驟S830中，用戶端裝置110的處理器201經由網路傳送匹配結果至雲端平台，以由雲端平台對匹配結果執行語意分析，並自雲端平台接收根據匹配結果執行語意分析而產生的控制指令。所述雲端平台例如為執行自然語言處理（Natural Language Processing，NLP）的平台。然後，在步驟S835中，傳送控制指令至顯示裝置120。執行步驟S830~S835的目的是在於更進一步地提高語音識別的準確度，以產生符合語音訊號的語意的控制指令，但並不以此為限，可根據使用上的需求來增設或省略此步驟。

另外，在其他實施例中，在用戶端裝置110連接至外部網路的前提下，用戶端裝置110的處理器201也可將採集到的語音訊號以音頻檔案的形式發送至具有語音識別環境的雲端伺服器或只其他第三方雲端語音識別服務介面，之後將識別後所獲得的控制指令回傳給用戶端裝置110，再由用戶端裝置110傳送控制指令至顯示裝置120。

底下再分別針對顯示裝置120與用戶端裝置110的內部細節動作分別舉例來說明。

圖9是依照本發明一實施例的顯示裝置的內部細節動作的流程圖。請參照圖2B、圖7及圖9，在步驟S901中，在顯示裝置120中，啟動主程序啟動器（launcher）。在一實施例中，可藉由開啟顯示裝置120或是操作顯示裝置120的使用者介面(User Interface)來啟動主程序啟動器。接著，在步驟S903中，判斷顯示裝置120是否連線至網路，待連接至網路才繼續執行後續步驟。在初期開發中，開發人員在主程序啟動器中將打包好的代碼塊以及JAR（Java Archive）檔案導入，按照配置文檔並根據機種特性修改部分指令參數並編譯。據此，主程序啟動器可移植至其他顯示裝置中，而無須再另外開發。

顯示裝置120連接至網路後，在步驟S905中，顯示裝置120的處理器221部屬網頁服務端710。以安卓（Android）系統為例，跟隨主程序啟動器的啟動，顯示裝置120的處理器221以子執行緒（sub-thread）方式運行網頁服務端710，並根據網路的連線狀態來控制網頁服務端710的啟動與停止，並監聽網際網路協定（Internet Protocol，IP）位址以及通訊埠（port）。同時，處理器221設置連接超時的時間、安全套接層（Secure Sockets Layer，SSL）、狀態監聽等設定。此外，本發明也適用於iOS系統。

接著，在步驟S907中，藉由網頁服務端710來取得顯示裝置120當下的IP位址以及埠號（port number）。並且，在步驟S909中，顯示裝置120的處理器221藉由網頁服務端710來配置網頁客戶端720。在一實施例中，網頁客戶端720是由超文本標記語言（HyperText Markup Language，HTML）、階層式樣式表（Cascading Style Sheets，CSS）和JavaScript語言所編寫。網頁客戶端720可藉由各種網頁瀏覽器（Web browser）來存取，或者網頁客戶端720可藉由具有與網頁瀏覽器相同功能的由HTML、CSS和JavaScript語言編寫的程式來存取。

之後，顯示裝置120可基於IP位址以及埠號來產生存取物件。詳細來說，在步驟S911中，網頁服務端710基於IP位址以及埠號，產生客戶端存取網址。客戶端存取網址是由網頁服務端710配置並儲存在顯示裝置120中，可避免被用戶端裝置110的使用者改寫。客戶端存取網址可供用戶端裝置110的瀏覽器B01藉由網路直接存取。例如，網頁服務端710根據當前網路狀態獲取IP位址“192.168.0.100”以及埠號“:8080”。接著，網頁服務端710根據IP位址與埠號，並結合靜態位址（例如：“/web/client.html”），自動生成可供用戶端裝置110存取的客戶端存取網址，即“http:// 192.168.0.100:8080/web/client.html”。而不同的IP位址或埠號，所生成的客戶端存取網址也會不同。

在步驟S913中，處理器221根據客戶端存取網址產生二維碼，以將二維碼作為存取物件。例如，處理器221藉由編程（programming）將客戶端存取網址從字串轉換為二維碼。之後，在步驟S915中，處理器221藉由顯示模組227顯示二維碼。例如，將二維碼渲染（render）在投影面上。在其他實施例中，也可直接藉由顯示模組227將客戶端存取網址作為存取物件而顯示。

在一實施例中，網頁服務端710配置有網路狀態變化的監聽程式，當網路斷開時，網頁服務端710停止運行，二維碼自動消失，同樣客戶端存取網址也失效。而當恢復連接至網路時，網頁服務端710自動重啟並重新按照上述步驟S907～S913來產生二維碼。

在另一實施例中，當區域網路斷開時，網頁服務端710停止運行。接著，顯示裝置120的處理器221自動創建AP熱點網路，重新部署網頁服務端710並按照上述步驟S907～S913來刷新二維碼(或是存取物件)，客戶端存取網址也同時變更。當區域網路恢復時，顯示裝置120關閉AP熱點網路，重新部署網頁服務端710並按照上述步驟S907～S913來產生二維碼。

此外，在獲取IP位址與埠號之後，在步驟S917中，網頁服務端710基於顯示裝置120當下的IP位址以及埠號，產生通信服務接口。在本實施例中，用戶端裝置110與顯示裝置120之間需要一對通信接口以藉由網路進行通信。其中，運行於顯示裝置120的網頁服務端710的稱為通信服務接口，運行於用戶端裝置110的網頁客戶端720的稱為通信客戶接口。在用戶端裝置110取得存取物件後，用戶端裝置110藉由網路根據存取物件而存取客戶端存取網址，用戶端裝置110便藉由通信服務接口與顯示裝置120進行數據傳輸。

網頁服務端710基於IP位址與埠號生成通信服務端程序（process），並綁定至網頁服務端710的套接字（Socket），而生成服務端套接字（即，通信服務接口）。客戶端套接字（通信客戶接口）則是在用戶端裝置110藉由瀏覽器B01存取操作介面U時創建並初始化。

在步驟S921中，藉由通信服務接口判斷是否自通信客戶接口接收到控制指令，並在接收到控制指令之後才會繼續往下執行。在接收到來自用戶端裝置110的控制指令之後，在步驟S923中，藉由網頁服務端710來解析控制指令。之後，在步驟S925中，根據網頁服務端710解析控制指令的結果，來使顯示裝置120執行對應的動作。

顯示裝置120所創建的網頁服務端710為本地服務，因此不用依託於外部的網路服務器，顯示裝置120在無外部網路存取的情況下，也可以實現存取控制操作。此外，顯示裝置120所創建的網頁服務端710獲取系統服務許可權，保證後台長期工作運行，不會停止。即便顯示裝置120關機，重新啟動顯示裝置120後，網頁服務端710也會自動開啟，始終保持套接字的監聽狀態，任何時段都可以接收來自用戶端裝置110的控制指令並據以執行對應的動作。

在另一實施利中，倘若顯示裝置120設定其允許的連接數量為多個或是不限制連接數量，則多台用戶端裝置可以同時存取（access）來控制同一台顯示裝置120。而各台用戶端裝置的進行控制的各步驟如同上述實施方式所述。顯示裝置120根據接收控制指令的順序來執行對應的動作。

圖10是依照本發明一實施例的用戶端裝置的內部細節動作的流程圖。請參照圖2A、圖7及圖10，在步驟S1001中，用戶端裝置110驅動圖像掃描器209來掃描二維碼。接著，在步驟S1003中，啟動用戶端裝置110的瀏覽器B01。之後，在步驟S1005中，藉由用戶端裝置110的通信設備203存取客戶端存取網址，建立並初始化通信客戶接口。即，用戶端裝置110掃描二維碼而解析出二維碼中的客戶端存取網址之後，自動跳轉至用戶端裝置110的瀏覽器B01來存取客戶端存取網址。在存取客戶端存取網址時，建立並初始化通信客戶接口。

接著，在步驟S1007中，用戶端裝置110在連線成功後，於用戶端裝置110的瀏覽器B01中顯示操作介面U。用戶端裝置110通過瀏覽器B01快速打開相應的網頁客戶端720來建立通訊連接。在步驟S1009中，響應於透過操作介面U接收到語音訊號，執行語音識別模組721。之後，在步驟S1011中，用戶端裝置110藉由通信客戶接口向通信服務接口傳送控制指令。

語音識別模組721是在用戶端裝置110與顯示裝置120連線後，由顯示裝置120下載至用戶端裝置110而由用戶端裝置110來運行。即，在用戶端裝置110透過瀏覽器B01存取網頁客戶端720時，將操作介面U與語音識別模組721一同載入至用戶端裝置110，以直接在用戶端裝置110中執行。

載入至用戶端裝置110的網頁客戶端720在啟動運行之後，會自動根據當前網頁服務端710所獲取的IP位址以及埠號配置生成HTTP請求服務。在本實施例中，用戶端裝置110的瀏覽器B01所存取的網頁客戶端720內使用JavaScript語言來編寫程式。JavaScript語言具有標準的HTTP通訊協定。HTTP通訊協定是基於TCP/IP協定來傳輸資訊的通訊方式。網頁服務端710提供指定參數以及請求服務的介面（例如：http://x.x.x.x:port/VoiceControl/command）。載入至用戶端裝置110的網頁客戶端720在獲得用戶端裝置110的控制指令之後，可通過HTTP通訊協定的POST請求，實現向網頁服務端710創建的請求服務的介面發送控制指令。例如，網頁客戶端720發起POST請求將控制指令作為請求參數（例如：command=“打開xxx設置”），並發送至網頁服務端710。倘若網頁客戶端720發出的請求出錯或是超時，則提示錯誤資訊。倘若網頁客戶端720發出的請求成功，則繼續後續動作。

顯示裝置120的網頁服務端710在接收到請求之後，判斷請求格式以及內容（例如擷取到請求內容，即，command=“打開xxx設置”），並回應用戶端裝置110的網頁客戶端720的請求的結果。倘若指令庫730中存在相應的指令，則網頁服務端710使顯示裝置120執行對應的動作。倘若指令庫730中不存在相應的指令，則發送代表“未知意圖”的通知至用戶端裝置110。

此外，在其他實施例中，一台用戶端裝置110也可以遙控多台任意顯示裝置。即，當有多台顯示裝置連接至用戶端裝置110所在的網路時，想要實現一台用戶端裝置110控制多台顯示裝置，只要切換瀏覽器B01存取的客戶端存取網址即可。

圖11是依照本發明一實施例的用戶端裝置與顯示裝置之間的交互動作的流程圖。圖11是整合了圖9與圖10雙方的交互動作。請參照圖2A、圖2B及圖11，在步驟S1101中，用戶端裝置110的處理器201會判斷是否藉由通信設備203連接至網路，待連接至網路才繼續執行後續步驟。同樣，在步驟S1111中，顯示裝置120的處理器221會判斷是否藉由通信設備223連接至網路，待連接至網路才繼續執行後續步驟。

顯示裝置120在連線至網路後，在步驟S1112中，顯示裝置120的處理器221部署網頁服務端710，以執行後續步驟S1113～S1116。接著，在步驟S1113中，處理器221藉由網頁服務端710來取得顯示裝置120當下的IP位址以及埠號。在步驟S1114中，網頁服務端710基於IP位址以及埠號，產生與客戶端存取網址相關連的存取物件並提供存取物件。並且，在步驟S1115中，由網頁服務端710生成服務通信接口。

在顯示裝置120藉由顯示模組227顯示存取物件之後，在步驟S1102中，用戶端裝置110的處理器201驅動圖像掃描器209。此時，用戶端裝置110的顯示畫面如狀態A01所示。在通過圖像掃描器209掃描顯示模組227顯示的存取物件，用戶端裝置110的顯示畫面如狀態A02所示。接著，在步驟S1103中，用戶端裝置110啟動瀏覽器B01存取客戶端存取網址。具體而言，用戶端裝置110基於存取物件獲得客戶端存取網址之後，自動跳轉至瀏覽器B01來存取客戶端存取網址，同時在步驟S1104中，建立並初始化通信客戶接口。

之後，在步驟S1105中，用戶端裝置110與顯示裝置120藉由通信客戶接口與通信服務接口來建立雙向傳輸。網頁服務端710至網頁客戶端720的資料封包標頭只有2～10位元組，網頁客戶端720到網頁服務端710需要加上4位元組的遮罩（mask）。HTTP請求每次都需要攜帶完整的標頭。在此，使用HTTP請求的通訊數據格式比較輕量，性能開銷小，通訊高效。

在雙方建立連線之後，用戶端裝置110的顯示畫面如狀態A03所示，在用戶端裝置110的瀏覽器B01中顯示操作介面U，使得用戶端裝置110的使用者得以在操作介面U中進行錄音，並透過操作介面U將語音訊號傳送給用戶端裝置110所載入的語音識別模組721進行語音識別，再由操作介面U顯示語音識別所產生的匹配結果（即，控制指令）。之後，在步驟S1106中，透過操作介面U傳送控制指令至顯示裝置120。

在顯示裝置120中，在接收到控制指令之後，在步驟S1116中，基於控制指令執行對應的動作。在一實施例中，控制指令的執行需要顯示裝置120的作業系統（例如安卓系統）與數位顯示處理器（Digital Display Processor，DDP）通過序列通訊（Serial communication）來實現。網頁服務端710在獲得控制指令（例如：“打開xxx設置”）之後，先匹配指令庫730，確認作業系統是否具備執行此控制指令的行為。倘若作業系統不支援，則將控制指令指向到DDP動作行為，即，通過序列埠向DDP發出控制指令資料。一般使用16進位的HEX碼，DDP匹配指令協定資料成功後執行相應的動作。倘若控制指令為作業系統的行為（例如：“打開網路設置”）時，則直接執行相應的動作。

再進一步說明，以顯示裝置120為投影裝置而言，倘若控制指令為投影相關的操作指令，則部分動作需要透過DDP來執行（例如：亮度調整），部分動作需要透過作業系統來執行（例如：打開網路設置），因此可先判斷語音訊號所代表的指令意圖是否與作業系統有關，接下來再判斷是否與DDP有關。在此，並不限定判斷的先後順序。

使用者在利用用戶端裝置110操作顯示裝置120提供的操作介面的過程中，在執行關閉操作介面U或退出瀏覽器B01時，用戶端裝置110與顯示裝置120之間的連線也會隨即關閉，不需要進行特定的關閉或退出動作。而在用戶端裝置110下次連接顯示裝置120提供的操作介面U時，用戶端裝置110與顯示裝置120之間的連線會自動初始化並連接，以繼續遙控操作。

綜上所述，本揭露可以方便快捷地實現對顯示裝置的語音識別控制，並且用戶端裝置無須安裝任何應用程式（application，APP），且不需外部網路環境，極大程度上簡化了語音控制顯示裝置的交互流程，免去繁雜的安裝配對等步驟，實現即掃即用。使用者可隨時體驗語音識別控制功能，提高控制的時效和便利性，提升使用者操作體驗。

使用者操作的用戶端裝置只負責發送控制指令，其他具體操作均由顯示裝置執行，故，顯示裝置可基於其韌體來做更大自由度的指令開發，根據不同的工作單元開放的動作執行應用程式介面（Application Programming Interface，API）結合指令腳本執行更為複雜的常用設置操作。無須再根據選項菜單一步一步跳轉至要修改的配置介面再進行修改調整。

惟以上所述者，僅為本發明之較佳實施例而已，當不能以此限定本發明實施之範圍，即大凡依本發明申請專利範圍及發明說明內容所作之簡單的等效變化與修飾，皆仍屬本發明專利涵蓋之範圍內。另外本發明的任一實施例或申請專利範圍不須達成本發明所揭露之全部目的或優點或特點。此外，摘要部分和標題僅是用來輔助專利文件搜尋之用，並非用來限制本發明之權利範圍。此外，本說明書或申請專利範圍中提及的“第一”、“第二”等用語僅用以命名元件(element)的名稱或區別不同實施例或範圍，而並非用來限制元件數量上的上限或下限。

100:控制系統 110:用戶端裝置 120:顯示裝置 201、221:處理器 203、223:通信設備 205、225:儲存設備 207:顯示介面 209:圖像掃描器 211:收音設備 227:顯示模組 401:投影面 410、510、520、610、620、A01、A02、A03:狀態 411:二維碼 501:客戶端存取網址 611:快捷圖標 710:網頁服務端 720:網頁客戶端 721:語音識別模組 730:指令庫 B01:瀏覽器 U:操作介面 S305～S325:控制方法的步驟 S805～S835:用戶端裝置運行語音識別模組的方法 S901～S925:顯示裝置的內部細節動作 S1001～S1011:用戶端裝置的內部細節動作 S1101～S1116:用戶端裝置與顯示裝置的之間交互動作

圖1是依照本發明一實施例的控制系統的方塊圖。圖2A是依照本發明一實施例的用戶端裝置的方塊圖。圖2B是依照本發明一實施例的顯示裝置的方塊圖。圖3是依照本發明一實施例的控制方法的流程圖。圖4是依照本發明一實施例的藉由用戶端裝置來實現控制顯示裝置的第一應用例的示意圖。圖5是依照本發明一實施例的藉由用戶端裝置來實現控制顯示裝置的第二應用例的示意圖。圖6是依照本發明一實施例的藉由用戶端裝置來實現控制顯示裝置的第三應用例的示意圖。圖7是依照本發明一實施例的控制系統的整體動作示意圖。圖8是依照本發明一實施例的用戶端裝置運行語音識別模組的流程圖。圖9是依照本發明一實施例的顯示裝置的內部細節動作的流程圖。圖10是依照本發明一實施例的用戶端裝置的內部細節動作的流程圖。圖11是依照本發明一實施例的用戶端裝置與顯示裝置之間的交互動作的流程圖。

S305~S325:控制方法的步驟

Claims

一種控制方法，適於經由一用戶端裝置來控制一顯示裝置，該控制方法包括步驟如下：藉由該顯示裝置連線至一網路，並產生及顯示一存取物件；藉由該用戶端裝置取得該存取物件，並根據該存取物件的資訊開啟一瀏覽器，藉由該瀏覽器經由該網路連線至該顯示裝置；藉由該顯示裝置經由該網路提供一操作介面與一語音識別模組至該用戶端裝置，以在該用戶端裝置的該瀏覽器中顯示該操作介面；響應於該用戶端裝置藉由操作該操作介面而接收到一語音訊號，藉由該用戶端裝置執行該語音識別模組，以獲得與該語音訊號相匹配的一控制指令，並傳送該控制指令至該顯示裝置；以及響應於該顯示裝置接收到該控制指令，藉由該顯示裝置根據該控制指令執行對應的一動作。
如請求項1所述的控制方法，其中在藉由該顯示裝置經由該網路提供該操作介面與該語音識別模組至該用戶端裝置，以在該用戶端裝置的該瀏覽器中顯示該操作介面之後，更包括：在藉由該操作介面接收該語音訊號之前，啟動該用戶端裝置的一收音設備，並使該用戶端裝置初始化該語音識別模組；其中，響應於該用戶端裝置藉由操作該操作介面而接收到該語音訊號，藉由該用戶端裝置執行該語音識別模組的步驟包括：將該語音訊號轉換為符合一指定格式的語音檔；利用一語言模型將該語音檔轉換為一文字內容；以及利用一語料資訊以及一拼音字典，對該文字內容執行一文字匹配，而獲得一匹配結果，其中該匹配結果關聯於該控制指令。
如請求項2所述的控制方法，其中響應於該用戶端裝置藉由操作該操作介面而接收到該語音訊號，藉由該用戶端裝置執行該語音識別模組的步驟包括：經由該網路傳送該匹配結果至一雲端平台，以由該雲端平台對該匹配結果執行一語意分析，並自該雲端平台接收根據該匹配結果執行語意分析而產生的該控制指令；以及傳送該控制指令至該顯示裝置。
如請求項1所述的控制方法，其中藉由該顯示裝置連線至該網路，並產生及顯示該存取物件的步驟包括：藉由該顯示裝置部屬一網頁服務端，並藉由該網頁服務端執行下述步驟：取得該顯示裝置的一網際網路協定位址以及一埠號；基於該網際網路協定位址以及該埠號，產生該存取物件。
如請求項4所述的控制方法，其中該存取物件為二維碼，該二維碼為基於該網際網路協定位址以及該埠號產生的一客戶端存取網址所生成，該顯示裝置的一顯示模組顯示該二維碼，藉由該用戶端裝置取得該存取物件，並根據該存取物件的該資訊開啟該瀏覽器，藉由該瀏覽器經由該網路連線至該顯示裝置更包括步驟如下：藉由驅動該用戶端裝置的一圖像掃描器來掃描該顯示模組上所顯示的該二維碼；以及響應於該圖像掃描器取得該二維碼，該用戶端裝置啟動該瀏覽器，並藉由該瀏覽器存取該二維碼對應的該客戶端存取網址，進而經由該網路連線至該顯示裝置。
如請求項4所述的控制方法，其中該存取物件為基於該網際網路協定位址以及該埠號產生的一客戶端存取網址，該顯示裝置的一顯示模組顯示該客戶端存取網址，該方法更包括步驟如下：藉由該用戶端裝置啟動該瀏覽器，並於該瀏覽器中根據該客戶端存取網址經由該網路連線至該顯示裝置。
如請求項1所述的控制方法，更包括步驟如下：響應於該顯示裝置連線至該網路，藉由該顯示裝置的一顯示模組顯示該存取物件，其中該存取物件關聯於一客戶端存取網址；以及響應於該顯示裝置斷開與該網路的連線，藉由該顯示裝置的該顯示模組停止顯示該存取物件，並使該客戶端存取網址為無效。
如請求項1所述的控制方法，其中在藉由該顯示裝置連線至該網路之後，更包括步驟如下：藉由該顯示裝置部屬一網頁服務端，並藉由該網頁服務端執行下述步驟：基於該顯示裝置的一網際網路協定位址以及一埠號，產生一通信服務接口；以及基於該顯示裝置的該網際網路協定位址以及該埠號，產生一客戶端存取網址，其中在藉由該用戶端裝置取得該存取物件之後，更包括：藉由該網路，於該用戶端裝置根據該存取物件而存取該客戶端存取網址，其中該用戶端裝置藉由該通信服務接口與該顯示裝置進行數據傳輸。
如請求項1所述的控制方法，其中藉由該瀏覽器經由該網路連線至該顯示裝置之後，更包括步驟如下：藉由該用戶端裝置基於該存取物件所關聯的一客戶端存取網址，在該用戶端裝置的一顯示介面上建立一快捷圖標，以在該快捷圖標被致能時，直接啟動該瀏覽器，以藉由該瀏覽器經由該網路連線至該顯示裝置。
一種控制系統，包括：一用戶端裝置，連線至一網路，並具有一瀏覽器；以及一顯示裝置，經配置以：連線至該網路，並產生及顯示一存取物件，其中該存取物件用以供該用戶端裝置藉由開啟該瀏覽器經由該網路連線至該顯示裝置；響應於與該用戶端裝置的連線，提供一操作介面與一語音識別模組至該用戶端裝置，以在該用戶端裝置的該瀏覽器中顯示該操作介面；以及接收來自該用戶端裝置的一控制指令，並根據該控制指令執行對應的一動作，其中該控制指令為響應該用戶端裝置利用該語音識別模組與一語音訊號相匹配所獲得。
如請求項10所述的控制系統，其中該用戶端裝置經配置以：取得該存取物件，並藉由開啟該瀏覽器經由該網路連線至該顯示裝置；在該操作介面顯示於該瀏覽器之後，響應於操作該操作介面而接收到該語音訊號，執行該語音識別模組，以獲得與該語音訊號相匹配的該控制指令，並傳送該控制指令至該顯示裝置。
如請求項11所述的控制系統，其中該用戶端裝置經配置以：在操作該操作介面而接收該語音訊號之前，啟動一收音設備，並初始化該語音識別模組；響應藉由該操作介面接收到該語音訊號，執行該語音識別模組以：將該語音訊號轉換為符合一指定格式的語音檔；利用一語言模型將該語音檔轉換為一文字內容；以及利用一語料資訊以及一拼音字典，對該文字內容執行一文字匹配，而獲得一匹配結果，其中該匹配結果關聯於該控制指令。
如請求項12所述的控制系統，其中該用戶端裝置經配置以：經由該網路傳送該匹配結果至一雲端平台，以由該雲端平台對該匹配結果執行一語意分析，並自該雲端平台接收根據該匹配結果執行語意分析而產生的該控制指令；以及傳送該控制指令至該顯示裝置。
如請求項10所述的控制系統，其中該顯示裝置經配置以：部屬一網頁服務端，並藉由該網頁服務端以：取得該顯示裝置的一網際網路協定位址以及一埠號；基於該網際網路協定位址以及該埠號，產生該存取物件。
如請求項14所述的控制系統，其中該存取物件為一客戶端存取網址或二維碼，該二維碼為基於該網際網路協定位址以及該埠號產生的該客戶端存取網址所生成。
如請求項10所述的控制系統，其中該顯示裝置包括一顯示模組，該顯示裝置經配置以：響應於該顯示裝置連線至該網路，藉由該顯示模組顯示該存取物件，其中該存取物件關聯於一客戶端存取網址；以及響應於該顯示裝置斷開與該網路的連線，藉由該顯示模組停止顯示該存取物件，並使該客戶端存取網址為無效。
如請求項10所述的控制系統，其中該顯示裝置經配置以：部屬一網頁服務端，並藉由該網頁服務端以：基於該顯示裝置的一網際網路協定位址以及一埠號，產生一通信服務接口；以及基於該顯示裝置的該網際網路協定位址以及該埠號，產生一客戶端存取網址，其中該用戶端裝置經配置以：根據該存取物件而存取該客戶端存取網址，其中該用戶端裝置藉由該通信服務接口與該顯示裝置進行數據傳輸。
如請求項10所述的控制系統，其中該用戶端裝置經配置以：基於該存取物件所關聯的一客戶端存取網址，在該用戶端裝置的一顯示介面上建立一快捷圖標，以在該快捷圖標被致能時，直接啟動該瀏覽器，以藉由該瀏覽器經由該網路連線至該顯示裝置。
一種顯示裝置，包括：一通信設備，經配置以連線至一網路；一處理器，耦接至該通信設備；以及一顯示模組，耦接至該處理器，其中，該顯示裝置經由該通信設備連線至該網路，該處理器產生一存取物件並藉由該顯示模組顯示該存取物件，其中該存取物件用以供一用戶端裝置經由該網路連線至該顯示裝置；該處理器響應於與該用戶端裝置的連線，藉由該通信設備輸出一操作介面與一語音識別模組；以及接收來自該用戶端裝置的一控制指令，並根據該控制指令執行對應的一動作，其中該控制指令為響應該用戶端裝置利用該語音識別模組與一語音訊號相匹配所獲得。
如請求項19所述的顯示裝置，其中該處理器經配置以部屬一網頁服務端，並藉由該網頁服務端以取得該顯示裝置的一網際網路協定位址以及一埠號，再基於該網際網路協定位址以及該埠號，產生該存取物件。