TWI714021B

TWI714021B - 推論方法、推論裝置與顯示器

Info

Publication number: TWI714021B
Application number: TW108108327A
Authority: TW
Inventors: 陳豐元
Original assignee: 緯創資通股份有限公司
Priority date: 2019-03-12
Filing date: 2019-03-12
Publication date: 2020-12-21
Also published as: US20200293930A1; CN111695691B; CN111695691A; US11494678B2; TW202034232A

Abstract

推論方法、推論裝置與顯示器。所述方法包括：藉由所述第一推論裝置或第二推論裝置接收一輸入訊號；藉由所述第一推論裝置根據所述輸入訊號執行一第一推論操作以獲得一第一推論資訊；藉由所述第二推論裝置根據所述輸入訊號執行一第二推論操作以獲得一第二推論資訊；以及藉由所述第二推論裝置根據所述輸入訊號、所述第一推論資訊與所述第二推論資訊提供一輸出訊號。

Description

推論方法、推論裝置與顯示器

本發明是有關於一種推論方法、推論裝置與顯示器。

機器學習(machine learning)或深度學習(deep learning)等智能學習的應用越來越廣泛。一般來說，可以透過智能學習的技術即時地辨識許多物件(object)。然而，一般人並沒有夠多的資料來源去進行智能學習與辨識。另外，在智能學習的技術上常有侷限性的辨識。因此，如何讓各種資料來源皆能透過智能學習的技術來辨識該資料來源中的各種物件，是本領域技術人員所欲解決的問題之一。

本發明提供一種推論方法、推論裝置與顯示器，可以根據不同設備的輸入訊號執行推論操作以達到辨識物件的功能。

本發明提出一種推論方法，用於一推論系統，所述推論系統包括一第一推論裝置與一第二推論裝置，所述第一推論裝置耦接至所述第二推論裝置，所述方法包括：藉由所述第一推論裝置或所述第二推論裝置接收一輸入訊號；藉由所述第一推論裝置根據所述輸入訊號執行一第一推論操作以獲得一第一推論資訊；藉由所述第二推論裝置根據所述輸入訊號執行一第二推論操作以獲得一第二推論資訊；以及藉由所述第二推論裝置根據所述輸入訊號、所述第一推論資訊與所述第二推論資訊提供一輸出訊號。

本發明提出一種顯示器，包括：輸入/輸出介面、第一推論裝置與顯示面板。輸入/輸出介面用以接收一輸入訊號。第一推論裝置耦接至所述輸入/輸出介面，用以根據所述輸入訊號執行一第一推論操作以獲得一第一推論資訊。顯示面板耦接至所述輸入/輸出介面，其中所述輸入/輸出介面還用以接收根據所述輸入訊號與所述第一推論資訊所產生的一輸出訊號，並將所述輸出訊號提供給所述顯示面板，所述顯示面板根據所述輸出訊號進行顯示。

本發明提出一種推論裝置，包括：輸入介面、推論引擎、資料混合引擎與第一輸出介面。輸入介面用以接收一輸入訊號。推論引擎用以根據所述輸入訊號執行一推論操作以獲得一推論資訊。資料混合引擎用以根據所述輸入訊號與所述推論資訊產生一輸出訊號。第一輸出介面用以輸出所述輸出訊號。

基於上述，本發明推論方法、推論裝置與顯示器可以根據不同設備的輸入訊號執行推論操作以達到辨識物件的功能。此外，發明可將推論裝置整合至顯示器中或放在外部使用。另外，本發明也可以連接多個推論裝置以達到的菊花鏈(daisy chain)的功能。透過多個推論裝置的連接，可以顯示不同類的推論資訊以達成累加的功能。另外，本發明還可以將推論資訊回報給外部的電子裝置以執行進一步的擴充應用，例如執行對應的應用程式(如，找出對應的資料)等。

為讓本發明的上述特徵和優點能更明顯易懂，下文特舉實施例，並配合所附圖式作詳細說明如下。

100:推論裝置

101:輸入介面

103:解碼器

105:推論引擎

107:資料混合引擎

109:編碼器

111:輸出介面

113:儲存電路

115:輸出介面

200:顯示器

20:輸入/輸出介面

20a:第一視頻輸入介面

20b:第二視頻輸入介面

20c:第一視頻輸出介面

20d:第二視頻輸出介面

20e:第一推論視頻輸入介面

20f:第二推論視頻輸入介面

20g:音源輸出介面

20h:顯示面板輸出介面

21:推論裝置

21a:解碼器

21b:推論引擎

21c:資料混合引擎

21d:編碼器

21e:輸出介面

21f:儲存電路

22:輸出介面

23:使用者輸入介面

24:顯示面板

25、26:聲音輸出介面

27:訊號源

28:電子裝置

30:輸出裝置

32、34:推論裝置

D1、D2、D3:影像

FM1、FM2:物件框

NM1、NM2:名稱

300、301、302:推論系統

36、38、40:推論裝置

DF1、DF2、DF3:資料格式

P1、P2、P3:位置

R1、R2、R3:顯示結果

S701~S711、S801~S817、S901~S907、S1001~S1011、S1101~S1107、S1201~S1209、S1301~S1307:步驟

圖1是依照本發明的一實施例所繪示的推論裝置的示意圖。

圖2是依照本發明的一實施例所繪示的具有推論裝置的顯示器的示意圖。

圖3是依照本發明的一實施例所繪示的推論裝置的運作的示意圖。

圖4是依照本發明的一實施例所繪示的多個推論裝置的運作的示意圖。

圖5是依照本發明的另一實施例所繪示的多個推論裝置的運作的示意圖。

圖6是依照本發明的另一實施例所繪示的根據不同的輸出模式產生輸出訊號的示意圖。

圖7是依照本發明的一實施例所繪示的圖2中輸入/輸出介面的運作的流程圖。

圖8是依照本發明的一實施例所繪示的推論裝置的運作的流程圖。

圖9是依照本發明的一實施例所繪示的偵測選擇訊號的運作的流程圖。

圖10是依照本發明的一實施例所繪示的根據被設定的輸出模式進行輸出的運作的流程圖。

圖11是依照本發明的一實施例所繪示的電子裝置的運作的流程圖。

圖12是依照本發明的一實施例所繪示的根據聲音的訊號進行推論的流程圖。

圖13是依照本發明的一實施例所繪示的推論方法的流程圖。

現將詳細參考本發明之示範性實施例，在附圖中說明所述示範性實施例之實例。另外，凡可能之處，在圖式及實施方式中使用相同標號的元件/構件代表相同或類似部分。

圖1是依照本發明的一實施例所繪示的推論裝置的示意圖。

請參照圖1，推論裝置100包括輸入介面101、解碼器103、推論引擎105、資料混合引擎107、編碼器109、輸出介面111、儲存電路113與輸出介面115。輸入介面101耦接至解碼器 103。解碼器103耦接至推論引擎105與資料混合引擎107。推論引擎105耦接至儲存電路113、輸出介面115與資料混合引擎107。資料混合引擎107耦接至編碼器109。編碼器109耦接至輸出介面111。

輸入介面101可以是符合影片圖型陣列(Video Graphics Array,VGA)、高畫質多媒體介面(High Definition Multimedia Interface,HDMI)或顯示埠(Display Port,DP)等連接介面規範的傳輸介面電路。

解碼器103例如是用來將輸入介面101所提供的訊號轉換成推論引擎105所能讀取的資料格式的視訊解碼器。解碼器103例如可以支援H.261、H.263、MPEG-1、MPEG-2、MPEG-4、MPEG-H、AVS、DivX、WMV或其他的格式。

推論引擎105例如是中央處理器(CPU)及/或圖形處理器(GPU)等處理電路或處理晶片。推論引擎105例如可以執行儲存電路113中儲存的多個程式碼片段。例如，儲存電路113中包括多個模組，藉由這些模組來分別執行推論裝置100中的各個運作，其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此，推論引擎105的各個運作也可以是使用其他硬體形式的方式來實現。此外，推論引擎105也可以執行儲存電路113中預先儲存並訓練好的模型以對影像或聲音中的物件進行推論(或辨識)並獲得對應的推論資訊。

資料混合引擎107為可以將解碼器103解碼後的訊號與推論引擎105所產生的推論資訊進行混合(或疊加)的軟體模組或硬體電路。在一實施例中，假設解碼器103是用於影像的解碼且推論資訊例如包括一標記或一物件框的大小與位置。資料混合引擎107可以根據該物件框的大小與位置，在影像中經由疊加該物件框而框選出物件並產生輸出訊號，之後將此輸出訊號提供給編碼器109。

編碼器109是用來將資料混合引擎107所提供的訊號轉換成輸出介面111所能讀取的資料格式的視訊編碼器。編碼器109例如可以支援H.261、H.263、MPEG-1、MPEG-2、MPEG-4、MPEG-H、AVS、DivX、WMV或其他的格式。

輸出介面111可以是符合影片圖型陣列(Video Graphics Array,VGA)、高畫質多媒體介面(High Definition Multimedia Interface,HDMI)或顯示埠(Display Port,DP)等連接介面規範的傳輸介面電路。輸出介面111可以用於連接下一個推論裝置或者是一顯示器。

儲存電路113可以是任何型態的固定或可移動隨機存取記憶體(random access memory，RAM)、唯讀記憶體(read-only memory，ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。

輸出介面115主要用於連接至一電子裝置(例如，主機或筆記型電腦)。輸出介面115例如是支援通用序列匯流排(Universal Serial Bus，USB)或其他的介面格式。

需注意的是，在一實施例中，推論裝置100也可以整合在一顯示器中。

更詳細來說，圖2是依照本發明的一實施例所繪示的具有推論裝置的顯示器的示意圖。

請參照圖2，顯示器200可以包括輸入/輸出介面20、推論裝置21、輸出介面22、使用者輸入介面23、顯示面板24、聲音輸出介面25~26。

輸入/輸出介面20包括第一視頻輸入介面20a、第二視頻輸入介面20b、第一視頻輸出介面20c、第二視頻輸出介面20d、第一推論視頻輸入介面20e、第二推論視頻輸入介面20f、音源輸出介面20g以及顯示面板輸出介面20h。

第一視頻輸入介面20a、第二視頻輸入介面20b、第一推論視頻輸入介面20e與第二推論視頻輸入介面20f例如是與前述輸入介面101相類似的元件，在此不再贅述。第一視頻輸出介面20c與第二視頻輸出介面20d例如是與前述輸出介面111相類似的元件，在此不再贅述。

音源輸出介面20g例如是可以支援輸出音源訊號的介面。

顯示面板輸出介面20h例如是用以輸出影像訊號以供顯示面板24進行顯示的輸出介面。

推論裝置21包括解碼器21a、推論引擎21b、資料混合引擎21c、編碼器21d、輸出介面21e與儲存電路21f。解碼器21a耦接至第一視頻輸出介面20c。

解碼器21a、推論引擎21b、資料混合引擎21c、編碼器21d、輸出介面21e與儲存電路21f可以分別是與前述解碼器103、推論引擎105、資料混合引擎107、編碼器109、輸出介面115、儲存電路113相類似的元件，在此不再贅述。特別是，在其他實施例中，一個顯示器200可以具有多個推論裝置。舉例來說，以一個顯示器200具有兩個推論裝置為例，第二個推論裝置的解碼器可以耦接至第一個推論裝置的編碼器，且第二個推論裝置的編碼器可以耦接至第一推論視頻輸入介面20e。

輸出介面22主要用於連接至一電子裝置(例如，主機或筆記型電腦)。輸出介面22例如是支援通用序列匯流排(Universal Serial Bus，USB)或其他的介面格式。

使用者輸入介面23主要用於接收使用者的輸入訊號。使用者輸入介面23可以是觸控式螢幕的螢幕感測器、鍵盤或滑鼠等。

顯示面板24可以是液晶顯示器(Liquid Crystal Display,LCD)、發光二極體顯示器(Light-Emitting Diode(LED)Display)、有機電激發光顯示器(Organic Light Emitting Display,OLED)、電泳動顯示器(Electro-Phoretic Display,EPD)或其他種類的顯示器。

聲音輸出介面25與聲音輸出介面26可以是支援S/PDIF(Sony/Philips Digital Interface Format)或其他種類的數位傳輸介面。推論裝置21的資料混合引擎21c例如可以提供音源訊號給聲音輸出介面25。輸入/輸出介面20的音源輸出介面20g例如可以提供音源訊號給聲音輸出介面26。

訊號源27例如是DVD播放器或其他多媒體播放器所提供的訊號源。電子裝置28可以是電腦主機、筆記型電腦或其他種類的電子裝置。

在本範例實施例中，輸入/輸出介面20可以接收訊號源27所提供的訊號(例如，影像)並將該訊號的尺寸或格式轉換為推論裝置21所能接受的格式，並將轉換後的訊號提供給推論裝置21。此外，在一實施例中，顯示器200還可以包括與推論裝置21相類似的另一推論裝置，此另一推論裝置例如是耦接至輸入/輸出介面20。輸入/輸出介面20例如可以透過第二視頻輸出介面20d提供輸入訊號給此另一推論裝置。而此另一推論裝置中的推論引擎可以根據輸入訊號進行推論以產生推論資訊，並根據輸入訊號、推論裝置21所產生的推論資訊與該另一推論裝置所產生的推論資訊產生輸出訊號並提供輸出訊號給輸入/輸出介面20的第二推論視頻輸入介面20f。

在一實施例中，推論裝置21(或前述的另一推論裝置)可以透過輸出介面22提供推論裝置21所產生的推論資訊(或前述的另一推論裝置所產生的推論資訊)給電子裝置28。電子裝置28例如可以執行對應的應用程式以獲得一訊息並將此訊息提供給輸入/輸出介面20。

請參照圖3，推論系統300可以包括訊號源27、輸出裝置30、推論裝置32與電子裝置28。在一實施例中，推論裝置32可以是類似於前述的推論裝置21且推論裝置32可以與輸出裝置30組合成如前述圖2的顯示器200。而在另一實施例中，推論裝置32可以是類似於前述的推論裝置100，而輸出裝置30例如是一般的顯示器。

在圖3的範例中，例如可以藉由DVD播放器提供訊號源27。輸出裝置30在接收到前述的訊號源27後，可以提供一輸入訊號(例如，影像D1)給推論裝置32。推論裝置32中的推論引擎可以將該影像D1輸入至預先訓練好的模型以獲得(或推論出)一推論資訊。在本實施例中，此模型用於推論出影像所屬的電影名稱以及影像中用於辨識的物件。在本實施例中，推論資訊包括影像D1所屬的電影名稱NM1(例如，「Wonderwoman」)以及用於框選出影像D1中的物件的物件框FM1。之後，推論裝置32中的資料混合引擎可以將電影名稱NM1以及物件框FM1疊加至影像D1以產生影像D2，並將影像D2提供給輸出裝置30進行顯示。

此外，推論裝置32所產生的推論資訊還可以輸出(例如透過輸出介面115或輸出介面22)給電子裝置28以讓電子裝置28根據此推論資訊執行對應的應用程式。例如，電子裝置28可以開啟瀏覽器並自動地查詢電影名稱NM1以獲得相關的資訊。

需注意的是，在本發明的一實施例中，推論系統300還可以串接多個推論裝置。

更詳細來說，圖4是依照本發明的一實施例所繪示的多個推論裝置的運作的示意圖。

請參照圖4，推論系統301可以包括訊號源27、輸出裝置30、推論裝置32、推論裝置34與電子裝置28。在一實施例中，推論裝置32與推論裝置34可以是類似於前述的推論裝置21且推論裝置32與推論裝置34可以與輸出裝置30組合成如前述圖2的顯示器200(亦即，具有兩個推論裝置的顯示器)。而在另一實施例中，推論裝置32與推論裝置34可以是類似於前述的推論裝置100，而輸出裝置30例如是一般的顯示器。

需注意的是，電子裝置28還可以用於對推論裝置32或推論裝置34進行更新。在一實施例中，可利用電子裝置28針對單一推論裝置做更新(例如，僅對推論裝置32進行更新)而不需要改動全部的推論裝置，此方式可以讓推論裝置的使用更加靈活。

在圖4的範例中，例如可以藉由DVD播放器提供訊號源27。輸出裝置30在接收到前述的訊號源27的訊號後，可以提供一輸入訊號(例如，影像D1)給推論裝置32。推論裝置32中的推論引擎可以將該影像D1輸入至預先訓練好的模型以執行一推論操作(亦稱為，第一推論操作)並獲得(或推論出)一推論資訊(亦稱為，第一推論資訊)。在本實施例中，推論裝置32所使用的模型用於推論出影像所屬的電影名稱以及影像中用於辨識的物件(亦稱為，第一物件)。在本實施例中，第一推論資訊包括該第一物件所屬的電影的名稱NM1(例如「Wonderwoman」，亦稱為第一物件的名稱)以及用於框選出影像D1中屬於該電影的物件的物件框 FM1(亦稱為，第一物件框)。之後，推論裝置32中的資料混合引擎可以將第一推論資訊(即，電影名稱NM1以及物件框FM1)以及影像D1提供給推論裝置34。

之後，推論裝置34中的推論引擎可以將影像D1輸入至預先訓練好的模型以執行一推論操作(亦稱為，第二推論操作)並獲得(或推論出)一推論資訊(亦稱為，第二推論資訊)。在本實施例中，推論裝置34所使用的模型用於推論出影像中明星(亦稱為，第二物件)的名稱。在本實施例中，第二推論資訊包括影像D1中的明星的名稱NM2(例如，「Gal Gadot」)以及用於框選出影像D1中的明星的物件框FM2(亦稱為，第二物件框)。之後，推論裝置32中的資料混合引擎可以將第一推論資訊(即，電影名稱NM1以及物件框FM1)、第二推論資訊(即，明星的名稱NM2以及物件框FM2)疊加至影像D1以產生影像D3，並提供對應於影像D3的輸出訊號給輸出裝置30。之後，輸出裝置30例如可以顯示影像D3。也就是說，在本實施例中，輸出訊號用以顯示影像D1以及疊加至影像D1的第一物件框、第一物件的名稱、第二物件框以及第二物件的名稱。

此外，推論裝置32以及推論裝置34所產生的推論資訊還可以輸出(例如透過輸出介面115或輸出介面22)給電子裝置28以讓電子裝置28根據此推論資訊執行對應的應用程式。例如，電子裝置28可以開啟瀏覽器並自動地查詢電影名稱NM1與明星的名稱NM2以獲得相關的資訊。

請參照圖5，推論系統302可以包括訊號源27、輸出裝置30、推論裝置36、推論裝置38與推論裝置40。在一實施例中，推論裝置36、推論裝置38與推論裝置40可以是類似於前述的推論裝置21且推論裝置36、推論裝置38與推論裝置40可以與輸出裝置30組合成如前述圖2的顯示器200(亦即，具有三個推論裝置的顯示器)。而在另一實施例中，推論裝置36、推論裝置38與推論裝置40可以是類似於前述的推論裝置100，而輸出裝置30例如是一般的顯示器。

在圖5的範例中，例如可以藉由DVD播放器提供訊號源27。輸出裝置30在接收到前述的訊號源27的訊號後，可以提供一輸入訊號(例如，前述的影像D1)給推論裝置36。推論裝置36中的推論引擎可以將該影像D1輸入至預先訓練好的模型以執行一推論操作並獲得(或推論出)一推論資訊。在本實施例中，此推論資訊的資料格式DF1包括影像D1中的明星的名稱(例如，“Gal Gadot”)以及用於框選出該明星的物件框的左上角的位置(例如，“position”：[900,10])與物件框的大小(例如，“size”：[160,160])。之後，推論裝置36中的資料混合引擎可以將影像D1與前述的推論資訊的資料格式DF1提供給推論裝置38。特別是，在一實施例中，使用者例如可以透過前述的使用者輸入介面23執行輸入操作(例如，觸碰)以產生一選擇訊號。此選擇訊號例如是作用在影像D1 中的某個位置。假設判斷選擇訊號作用在影像D1中的位置不在框選出該明星的物件框的內部，因此在資料格式DF1中以「“touch”：no」進行表示。

之後，推論裝置38中的推論引擎可以將影像D1輸入至預先訓練好的模型以執行一推論操作並獲得(或推論出)一推論資訊。在本實施例中，推論裝置38所使用的模型用於推論出影像所屬的電影名稱以及影像中用於辨識的物件。在本實施例中，此推論資訊的資料格式DF2包括該物件所屬的電影的名稱(例如“Wonderwoman”)以及用於框選出該電影的物件框的左上角的位置(例如，“position”：[800,0])與物件框的大小(例如，“size”：[320,1080])。此外，在此假設，使用者透過前述的使用者輸入介面23執行輸入操作所產生的選擇訊號作用在影像D1中的位置被判斷位在框選出該物件的物件框的內部，因此在資料格式DF2中以「“touch”：yes」進行表示。之後，推論裝置38中的資料混合引擎可以將影像D1與前述的推論資訊的資料格式DF]與資料格式DF2提供給推論裝置40。

之後，推論裝置40中的推論引擎可以將影像D1輸入至預先訓練好的模型以執行一推論操作並獲得(或推論出)一推論資訊。在本實施例中，推論裝置40所使用的模型用於推論出影像中屬於「雲(cloud)」的物件的推論資訊。在本實施例中，此推論資訊的資料格式DF3包括該物件的名稱(例如，“cloud”)以及用於框選出該物件的物件框的左上角的位置(例如，“position”：[0,0])與物件框的大小(例如，“size”：[1920,200])。此外，在此假設使用者透過前述的使用者輸入介面23執行輸入操作所產生的選擇訊號作用在影像D1中的位置被判斷位在框選出該物件的物件框的內部，因此在資料格式DF3中以「“touch”：yes」進行表示。之後，推論裝置40中的資料混合引擎可以根據前述的選擇訊號、影像D1、資料格式DF1、資料格式DF2與資料格式DF3產生一輸出訊號並提供此輸出訊號給推論裝置40。

在此需說明的是，資料格式DF1、資料格式DF2與資料格式DF3主要是用於描述疊加至影像D1的圖層(即，物件框與物件名稱的圖層)。在本實施例中，越早產生的資料格式是屬於較底層的圖層，越晚產生的資料格式是屬於較上層的圖層。以前述範例來說，資料格式DF3所表示的圖層是最上層，資料格式DF2所表示的圖層是位於中間的層，資料格式DF1所表示的圖層是最底層。另外，於另一實施例中，串接的多個推論裝置中的最後一個推論裝置40可進一步依照預先設定之疊加順序調整每個資料格式描述的圖層之疊加順序。此外，在另一實施例中還可以藉由手動或自動地方式，將一輸出模式設定為第一模式、第二模式或第三模式，以讓輸出裝置30基於輸出模式顯示上述推論資訊。

需說明的是，在一實施例中，用於框選物件的物件框也可以使用點陣列(array points)或線(lines)或其他方式進行框選，比如使用形狀(Shape)函數或範圍(Radius)函數產生物件框，本發明不限於此。

為了方便說明，在此將前述圖5的範例中屬於「雲」的物件稱為「第二物件」，將用於框選出「雲」的物件框稱為「第二物件框」，並且將「雲」的物件名稱稱為「第二物件的名稱」。此外，在此將前述圖5的範例中屬於某一「電影」的物件稱為「第一物件」，將用於框選出「電影」的物件框稱為「第一物件框」，並且將「電影」的物件名稱稱為「第一物件的名稱」。再者，在此將前述圖5的範例中屬於「電影明星」的物件稱為「第三物件」，將用於框選出「電影明星」的物件框稱為「第三物件框」，並且將「電影明星」的物件名稱稱為「第三物件的名稱」。

在本實施例中，當選擇訊號是作用在一位置，該位置與第一物件框和第二物件框的範圍重疊，且輸出模式被設定為第一模式時，輸出訊號是用以顯示輸入訊號的影像、涵蓋選擇訊號所作用的位置的所有物件框、以及對應的物件的名稱(即，目前被顯示的物件框的物件的名稱)。當輸出模式被設定為第二模式時，輸出訊號是用以顯示輸入訊號的影像、涵蓋選擇訊號所作用的位置的第一物件框與第二物件框中之最上層者、以及對應的第一物件的名稱或第二物件的名稱(即，目前被顯示的物件框的物件的名稱)。當輸出模式被設定為第三模式時，輸出訊號用以顯示輸入訊號的影像、所有物件框中之非涵蓋選擇訊號所作用的位置的其他物件框、以及對應的物件的名稱(即，目前被顯示的物件框的物件的名稱)。於另一實施例中，當輸出模式被設定為第三模式時，更顯示涵蓋選擇訊號所作用的位置的物件框中之非最上層者，以及對應的物件的名稱。

更詳細來說，圖6是依照本發明的另一實施例所繪示的根據不同的輸出模式產生輸出訊號的示意圖。

請參照圖6，在此假設前述的選擇訊號是作用在影像D1中的位置P1(亦稱為，第一位置)且輸出模式被設定為第一模式。由圖6可以看出，位置P1位於第一物件框(即，用於框選出「Wonderwoman」的物件框)中與第二物件框(即，用於框選出「雲」的物件框)中但不位於第三物件框(即，用於框選出「電影明星」的物件框)中。此時，前述推論裝置40所產生的輸出訊號是用以透過所述輸出裝置顯示影像D1以及疊加至影像D1的第一物件框、第一物件的名稱、第二物件框以及第二物件的名稱，如顯示結果R1所示。換句話說，在第一模式中，若一物件框涵蓋選擇訊號所對應的位置，則此物件框以及該物件框所對應的物件的名稱皆會被顯示。

在此假設前述的選擇訊號是作用在影像D1中的位置P2(亦稱為，第二位置)且輸出模式被設定為第二模式。由圖6可以看出，位置P2位於第一物件框(即，用於框選出「Wonderwoman」的物件框)中與第二物件框(即，用於框選出「雲」的物件框)中但不位於第三物件框(即，用於框選出「電影明星」的物件框)中。此時，前述推論裝置40所產生的輸出訊號是用以透過所述輸出裝置顯示影像D1以及疊加至影像D1的第二物件框以及第二物件的名稱，如顯示結果R2所示。換句話說，在第二模式中，若選擇訊號所對應的位置位在多個物件框中，則僅有位於最上層的圖層的物件框以及該物件框所對應的物件的名稱會被顯示。

在此假設前述的選擇訊號是作用在影像D1中的位置P3(亦稱為，第三位置)且輸出模式被設定為第三模式。由圖6可以看出，位置P3位於第二物件框(即，用於框選出「雲」的物件框)中但不位於第一物件框(即，用於框選出「Wonderwoman」的物件框)中與第三物件框(即，用於框選出「電影明星」的物件框)中。此時，前述推論裝置40所產生的輸出訊號是用以透過所述輸出裝置顯示影像D1以及疊加至影像D1的第一物件框、第一物件的名稱、第三物件框與第三物件的名稱，如顯示結果R3所示。換句話說，在第三模式中，若選擇訊號所對應的位置位在多個物件框中，則顯示非涵蓋該位置的其他物件框以及該物件框所對應的物件的名稱。

請參照圖7，在步驟S701中，輸入/輸出介面20的一控制電路(未繪示)判斷第一推論視頻輸入介面20e與第一視頻輸出介面20c是否被致能。當第一推論視頻輸入介面20e與第一視頻輸出介面20c未被致能時，在步驟S703中，輸入/輸出介面20的控制電路將第一視頻輸入介面20a接收到的輸入訊號提供給顯示面板輸出介面20h以讓顯示面板24進行顯示。當第一推論視頻輸入介面20e與第一視頻輸出介面20c被致能時，在步驟S705中輸入/輸出介面20的控制電路偵測是否有推論裝置21。若沒有推論裝置21，則返回執行步驟S703。若有推論裝置21，在步驟S707中輸入/輸出介面20的控制電路偵測推論裝置21所需的解析度。之後在步驟S709中，輸入/輸出介面20的控制電路將從第一視頻輸入介面20a獲得的影像縮放至該解析度，並將縮放後的影像輸出至第一視頻輸出介面20c。之後，在步驟S711中，第一推論視頻輸入介面20e從推論裝置21接收輸出訊號，並透過顯示面板輸出介面20h輸出該輸出訊號至顯示面板24。

請參照圖8，以圖1的推論裝置為例，在步驟S801中，訊號源可以透過圖1的輸入介面101將視頻的影像輸入至推論裝置100。之後在步驟S803中推論引擎105執行物件偵測。在步驟S805中，資料混合引擎107判斷是否有下一個推論裝置。在本實施例中，資料混合引擎107例如可以判斷是否偵測到下一個推論裝置的產品識別碼(Product ID，PID)或供應商識別碼(Vendor ID，VID)來判斷是否存在下一個推論裝置。若有，在步驟S807中資料混合引擎107傳送推論資訊給下一個推論裝置。若沒有，在步驟S809中，推論裝置100的資料混合引擎107判斷是否有(例如，從圖2的使用者輸入介面)接收選擇訊號。若沒有，則在步驟S811中，資料混合引擎107判斷預設的物件偵測是否被致能。若是，則在步驟S813中，資料混合引擎107決定顯示所有的物件框與物件的名稱，並執行步驟S817中視頻的輸出。若否，則直接執行步驟S817中視頻的輸出。

此外，當在步驟S809中推論裝置100的資料混合引擎107判斷有(例如，從圖2的使用者輸入介面)接收到選擇訊號時，在步驟S815中，資料混合引擎107會根據選擇訊號(與對應的輸出模式)決定欲顯示的物件框與物件的名稱，之後執行步驟S817中視頻的輸出。

請參照圖9，以圖2的顯示器200為例，在步驟S901中，使用者輸入介面23偵測選擇訊號。之後在步驟S903中，推論裝置21的資料混合引擎21c判斷是否有下一個推論裝置。若沒有，則結束圖9的流程。若有，則在步驟S905中，資料混合引擎21c根據輸出的解析度轉換選擇訊號所對應的座標，並且在步驟S907中透過編碼器21d發送轉換後的座標至下一個推論裝置，之後再重複執行步驟S903。

請參照圖10，以圖1的推論裝置100為例，在步驟S1001中，資料混合引擎107判斷預設的物件偵測是否被致能。若是，則在步驟S1011中資料混合引擎107產生輸出訊號以顯示所有的物件框與物件的名稱。若否，則在步驟S1003中，資料混合引擎 107判斷第一模式、第二模式或第三模式被設定。當第一模式被設定時，在步驟S1005中資料混合引擎107產生輸出訊號以顯示所述影像，並且顯示所有涵蓋選擇訊號的位置的物件對應的名稱和物件框。當第二模式被設定時，在步驟S1007中資料混合引擎107產生輸出訊號以顯示所述影像，並且顯示涵蓋選擇訊號的位置的最上層的物件對應的名稱與物件框。當第三模式被設定時，在步驟S1009中資料混合引擎107產生輸出訊號以顯示所述影像，並且顯示所有不涵蓋選擇訊號的位置的物件對應的名稱和物件框。即，不顯示所有涵蓋選擇訊號的位置的物件以及與所述物件相對應的名稱和物件框。

請參照圖11，以圖2的電子裝置28為例，在步驟S1101中，電子裝置28例如透過輸出介面22連接至推論裝置21。在步驟S1103中，電子裝置28識別推論裝置21。在步驟S1105中，電子裝置28從推論裝置21取得推論資訊。在步驟S1107中，電子裝置28根據推論資訊執行對應的應用程式。

在此需說明的是，雖然前述的範例皆是使用「影像」作為輸入並進行推論。然而在其他實施例中，用於推論的輸入訊號也可以是「聲音」的訊號。例如，可以藉由一推論裝置(亦稱為，第一推論裝置)根據一聲音訊號執行第一推論操作以獲得第一聲音訊號。之後，可以藉由另一推論裝置(亦稱為，第二推論裝置) 根據所述聲音訊號執行第二推論操作以獲得第二聲音訊號。之後在所產生的輸出訊號中，第一聲音訊號與第二聲音訊號會被分別配置在不同的頻道(channel)中。

請參照圖12，以圖1的推論裝置100為例，在步驟S1201中，視頻被輸入至推論裝置100以取得聲音訊號。之後在步驟S1203中，解碼器103對聲音訊號進行解碼。在步驟S1205中，推論引擎105對解碼後的聲音訊號執行推論操作以獲得推論後的聲音訊號。在步驟S1207中，資料混合引擎107將推論後的聲音訊號加入一通道。最後在步驟S1209中，編碼器109對聲音訊號進行編碼。在實際的應用上，圖12的流程例如可以應用在會議中同步多國語言的翻譯，並將不同的語言配置於不同的通道中。例如，假設被輸入至推論裝置100的聲音訊號為中文句子，推論後的聲音訊號例如是對應該中文句子的英文句子。推論後的聲音訊號可以被加入前述的通道以供選擇聆聽。

圖13是依照本發明的一實施例所繪示的推論方法的流程圖。

請參照圖13，在步驟S1301中，藉由第一推論裝置接收輸入訊號。在步驟S1303中，藉由第一推論裝置根據輸入訊號執行第一推論操作以獲得第一推論資訊。在步驟S1305中，藉由第二推論裝置根據輸入訊號執行第二推論操作以獲得第二推論資訊。在步驟S1307中，藉由第二推論裝置根據輸入訊號、第一推論資訊與第二推論資訊提供輸出訊號。

綜上所述，本發明推論方法、推論系統、推論裝置與顯示器可以根據不同設備的輸入訊號執行推論操作以達到辨識物件的功能。此外，本發明還可以針對不同的推論裝置進行格式(例如，解析度)的轉換以符合該推論裝置所需的格式。此外，發明可將推論裝置整合至顯示器中或放在外部使用。另外，本發明也可以依照需求串聯多個推論裝置以達到的菊花鏈(daisy chain)的功能，或者並聯多種推論裝置以達到辨識多種物件的需求。透過多個推論裝置的連接，可以顯示不同類的推論資訊以達成累加的功能。另外，本發明還可以將推論資訊回報給外部的電子裝置以執行進一步的擴充應用，例如執行對應的應用程式(如，找出對應的資料)等。

特別是，本發明的推論方法、推論系統、推論裝置與顯示器還可以應用於多個領域。舉例來說，本發明的推論裝置可以應用於監視系統中。如果要偵測搶案，警局可以不用更動既有的錄影設備。只要接上具有訓練過的推論引擎的推論裝置，即可直接偵測搶案。當偵測到相關事件時，可以立即地在畫面加上物件框以及其他可能的提示。或者，本發明的推論裝置可以應用於教育用途中。例如，假設被輸入至推論裝置的訊號為中文電影，推論裝置可以根據該中文電影的聲音訊號進行推論以產生翻譯後的的英文語音(或字幕)，並且輸出此英文語音(或字幕)供使用者學習。

雖然本發明已以實施例揭露如上，然其並非用以限定本發明，任何所屬技術領域中具有通常知識者，在不脫離本發明的精神和範圍內，當可作些許的更動與潤飾，故本發明的保護範圍當視後附的申請專利範圍所界定者為準。

S1301~S1307:步驟

Claims

一種推論方法，用於一推論系統，所述推論系統包括一第一推論裝置與一第二推論裝置，所述第一推論裝置耦接至所述第二推論裝置，所述方法包括：藉由所述第一推論裝置接收一影像；藉由所述第一推論裝置根據所述影像執行一第一推論操作以獲得一第一推論資訊，其中所述第一推論資訊包括用於框選出所述影像中的至少一第一物件的至少一第一物件框以及所述第一物件的名稱；藉由所述第一推論裝置傳送所述影像及所述第一推論資訊至所述第二推論裝置；藉由所述第二推論裝置根據所述影像執行一第二推論操作以獲得一第二推論資訊，其中所述第二推論資訊包括用於框選出所述影像中的至少一第二物件的至少一第二物件框以及所述第二物件的名稱；以及藉由所述第二推論裝置根據所述影像、所述第一推論資訊與所述第二推論資訊提供一輸出訊號。
如申請專利範圍第1項所述的推論方法，其中所述輸出訊號用以顯示所述影像、所述第一物件框、所述第一物件的名稱、所述第二物件框以及所述第二物件的名稱。
如申請專利範圍第1項所述的推論方法，更包括：接收一選擇訊號；其中藉由所述第二推論裝置根據所述影像、所述第一推論資訊與所述第二推論資訊提供所述輸出訊號的步驟包括：根據所述影像、所述第一推論資訊、所述第二推論資訊以及所述選擇訊號提供所述輸出訊號，其中當所述選擇訊號是作用在所述影像的一位置且一輸出模式被設定為一第一模式時，所述輸出訊號用以顯示所述影像、涵蓋所述位置的所述第一物件或所述第二物件對應的名稱以及物件框，當所述輸出模式被設定為一第二模式時，所述輸出訊號用以顯示所述影像、涵蓋所述位置的所述第一物件及所述第二物件中之最上層者對應的名稱以及物件框，當所述輸出模式被設定為一第三模式時，所述輸出訊號用以顯示所述影像、不涵蓋所述位置的所述第一物件或所述第二物件對應的名稱以及物件框。
如申請專利範圍第1項所述的推論方法，更包括：藉由所述第二推論裝置判斷其是否還連接至另一推論裝置；以及當判定所述第二推論裝置還連接至另一推論裝置時，所述第二推論裝置傳送所述第一推論資訊、所述第二推論資訊和所述選擇訊號給所述另一個推論裝置。
如申請專利範圍第1項所述的推論方法，其中所述推論系統更包括一電子裝置，所述方法更包括：藉由所述電子裝置接收所述第一推論資訊或所述第二推論資訊；以及藉由所述電子裝置根據所述第一推論資訊或所述第二推論資訊執行一對應的應用程式。
一種推論方法，用於一推論系統，所述推論系統包括一第一推論裝置與一第二推論裝置，所述第一推論裝置耦接至所述第二推論裝置，所述方法包括：藉由所述第一推論裝置接收一聲音訊號；藉由所述第一推論裝置根據所述聲音訊號執行一第一推論操作以獲得一第一聲音訊號，並傳送所述聲音訊號及所述第一聲音訊號至所述第二推論裝置；藉由所述第二推論裝置根據所述聲音訊號執行一第二推論操作以獲得一第二聲音訊號；以及藉由所述第二推論裝置提供包括所述第一聲音訊號及所述第二聲音訊號的輸出訊號中，其中所述第一聲音訊號與所述第二聲音訊號分別位於不同的頻道(channel)。
一種顯示器，包括：一輸入/輸出介面，用以接收一影像；一第一推論裝置，耦接至所述輸入/輸出介面，用以根據所述影像執行一第一推論操作以獲得一第一推論資訊；以及一顯示面板，耦接至所述輸入/輸出介面，其中，所述第一推論裝置根據所述影像執行所述第一推論操作以獲得用於框選出所述影像中的至少一第一物件的至少一第一物件框以及所述第一物件的名稱來作為所述第一推論資訊，所述輸入/輸出介面還用以接收根據所述影像與所述第一推論資訊所產生的一輸出訊號，並將所述輸出訊號提供給所述顯示面板，所述顯示面板根據所述輸出訊號進行顯示。
如申請專利範圍第7項所述的顯示器，更包括：一輸出介面，用以連接至一電子裝置，並且將所述第一推論資訊傳送給所述電子裝置，其中所述輸入/輸出介面耦接至所述電子裝置，所述輸入/輸出介面更用以接收所述電子裝置根據所述第一推論資訊所產生的一訊息。
如申請專利範圍第7項所述的顯示器，更包括：一使用者輸入介面，耦接至所述第一推論裝置，用以接收使用者輸入的一選擇訊號，其中所述第一推論裝置根據所述選擇訊號、所述影像與所述第一推論資訊產生所述輸出訊號。
如申請專利範圍第7項所述的顯示器，更包括：一第二推論裝置，耦接至所述輸入/輸出介面，其中所述第一推論裝置傳送所述影像及所述第一推論資訊至所述第二推論裝置，所述第二推論裝置根據所述影像執行一第二推論操作以獲得一第二推論資訊，以及所述第二推論裝置根據所述影像、所述第一推論資訊與所述第二推論資訊提供所述輸出訊號給所述輸入/輸出介面。
如申請專利範圍第10項所述的顯示器，其中在根據所述影像執行所述第二推論操作以獲得所述第二推論資訊的運作中，所述第二推論裝置根據所述影像執行所述第二推論操作以獲得用於框選出所述影像中的至少一第二物件的至少一第二物件框以及所述第二物件的名稱。
如申請專利範圍第n項所述的顯示器，其中所述輸出訊號用以顯示所述影像、所述第一物件框、所述第一物件的名稱、所述第二物件框以及所述第二物件的名稱。
如申請專利範圍第10項所述的顯示器，更包括：一使用者輸入介面，用以接收一選擇訊號，其中在所述第二推論裝置根據所述影像、所述第一推論資訊與所述第二推論資訊提供所述輸出訊號的運作中，所述第二推論裝置根據所述影像、所述第一推論資訊、所述第二推論資訊以及所述選擇訊號提供所述輸出訊號，其中當所述選擇訊號是作用在所述影像的一位置且一輸出模式被設定為一第一模式時，所述輸出訊號用以顯示所述影像、涵蓋所述位置的所述第一物件或所述第二物件對應的名稱以及物件框，當所述輸出模式被設定為一第二模式時，所述輸出訊號用以顯示所述影像、涵蓋所述位置的所述第一物件及所述第二物件中之最上層者對應的名稱以及物件框，當所述輸出模式被設定為一第三模式時，所述輸出訊號用以顯示所述影像、不涵蓋所述位置的所述第一物件或所述第二物件對應的名稱以及物件框。
如申請專利範圍第13項所述的顯示器，其中所述第一推論裝置或所述第二推論裝置判斷其是否連接至另一推論裝置，以及當判定所述第一推論裝置連接至所述第二推論裝置，所述第一推論裝置傳送所述第一推論資訊和所述選擇訊號給所述第二推論裝置，當所述第二推論裝置連接至所述第一推論裝置，並判定所述第二推論裝置還連接至另一推論裝置時，所述第二推論裝置傳送所述第一推論資訊、所述第二推論資訊和所述選擇訊號給所述另一個推論裝置。
一種顯示器，包括：一輸入/輸出介面，用以接收一聲音訊號；一第一推論裝置，耦接至所述輸入/輸出介面，用以根據所述聲音訊號執行一第一推論操作以獲得一第一聲音訊號，一第二推論裝置，耦接至所述第一推論裝置；以及一顯示面板，耦接至所述輸入/輸出介面，其中所述第一推論裝置傳送所述聲音訊號及所述第一聲音訊號至所述第二推論裝置，所述第二推論裝置根據所述聲音訊號執行一第二推論操作以獲得一第二聲音訊號，藉由所述第二推論裝置提供包括所述第一聲音訊號及所述第二聲音訊號的輸出訊號，其中所述第一聲音訊號與所述第二聲音訊號分別位於不同的頻道(channel)。
如申請專利範圍第15項所述的顯示器，更包括：一聲音輸出介面，耦接至所述第二推論裝置，用以接收所述輸出訊號，並將所述輸出訊號提供給一揚聲器。
一種推論裝置，包括：一輸入介面，用以接收一影像；一推論引擎，用以根據所述影像執行一推論操作以獲得一推論資訊，其中所述推論資訊包括用於框選出所述影像中的至少一物件的至少一物件框以及所述物件的名稱；一資料混合引擎，用以根據所述影像與所述推論資訊產生一輸出訊號；以及一第一輸出介面，用以輸出所述輸出訊號。
如申請專利範圍第17項所述的推論裝置，更包括：一第二輸出介面，用以連接至一電子裝置，並且將所述推論資訊傳送給所述電子裝置以使得所述電子裝置根據所述推論資訊執行一對應的應用程式。