TW202304196A

TW202304196A - 會議檢視方法及裝置

Info

Publication number: TW202304196A
Application number: TW110124469A
Authority: TW
Inventors: 周辰威
Original assignee: 信驊科技股份有限公司
Priority date: 2021-07-02
Filing date: 2021-07-02
Publication date: 2023-01-16
Also published as: US20230006851A1; TWI790669B; US11689380B2

Abstract

本發明提出一種會議檢視方法及裝置，其可在取得某特定會議的寬視角影片、相關的會議事件資料及各參與者的發言內容之後，相應地產生此特定會議的精華影片。藉此，可提升會議檢視的效率。

Description

會議檢視方法及裝置

本發明是有關於一種資訊記錄技術，且特別是有關於一種會議檢視方法及裝置。

在現有技術中，常見的視訊會議紀錄軟體多半都是直接錄製整場視訊會議的畫面來產生會議記錄。然而，此種方式除了造成錄製的內容過於冗長之後，事後也難以用於查找到所需的會議重點部分。此外，上述方式通常也不一定能夠錄製到觀看者想看的會議部分，而此這種情況在所使用的攝影機視角大於180度時更為嚴重。

有鑑於此，本發明提供一種會議檢視方法及裝置，其可用於解決上述技術問題。

本發明提供一種會議檢視方法，包括：取得一特定會議的一寬視角影片及關聯於寬視角影片的多個會議事件資料，其中各會議事件資料對應於特定會議的一時間點，且各會議事件資料記錄有在對應的時間點的一發言者的一聲源方向及發言者在寬視角影片中的一影像範圍；取得特定會議的多個參與者個別的發言內容；在寬視角影片中決定多個特定時間區段，並依據各特定時間區段對應的所述多個會議事件資料找出各特定時間區段中的至少一討論者；取得各特定時間區段中的各討論者的發言內容；將各特定時間區段的各討論者的討論畫面及發言內容整理為對應的一討論影音片段；將各特定時間區段對應的討論影音片段組織為對應於特定會議的一會議記錄影片。

本發明提供一種會議檢視裝置，包括儲存電路及處理器。儲存電路儲存一程式碼。處理器其耦接儲存電路，存取程式碼以執行：取得一特定會議的一寬視角影片及關聯於寬視角影片的多個會議事件資料，其中各會議事件資料對應於特定會議的一時間點，且各會議事件資料記錄有在對應的時間點的一發言者的一聲源方向及發言者在寬視角影片中的一影像範圍；取得特定會議的多個參與者個別的發言內容；在寬視角影片中決定多個特定時間區段，並依據各特定時間區段對應的所述多個會議事件資料找出各特定時間區段中的至少一討論者；取得各特定時間區段中的各討論者的發言內容；將各特定時間區段的各討論者的討論畫面及發言內容整理為對應的一討論影音片段；將各特定時間區段對應的討論影音片段組織為對應於特定會議的一會議記錄影片。

100:會議記錄裝置

102,302:儲存電路

104,304:處理器

110,120,130,140,150:會議畫面

120a,120b,120c,120d:長方框

130a,130b:標籤

200:格式

210,221,222:會議事件資料

300:會議檢視裝置

50,60,70:會議時間軸

50a~50c:指定時間區段

501~50K:參與討論時間軸

501a~501c,50Ka~50Kc,61a~61c:參與討論區間

60a~60c:圖標

62a~62c:討論者清單

71:特定時間區段

71a,71b:子時間區段

72:指定畫面佈局

72a,72b,83a,83b:畫面框

72c,83c:發言內容框

81:錨點

82:第一畫面佈局

83:第二畫面佈局

90a~90c:討論影音片段

910:會議記錄影片

S410~S460:步驟

T1,T2:時間點

圖1A是依據本發明之一實施例繪示的會議記錄裝置示意圖。

圖1B是依據本發明之一實施例的寬視角會議畫面的示意圖。

圖2是依據本發明之一實施例繪示的會議事件資料示意圖。

圖3是依據本發明之一實施例繪示的會議檢視裝置示意圖。

圖4是依據本發明之一實施例繪示的會議檢視方法流程圖。

圖5A是依據本發明第一實施例繪示的決定特定時間區段的示意圖。

圖5B是依據本發明第二實施例繪示的決定特定時間區段的示意圖。

圖6是依據本發明第三實施例繪示的決定特定時間區段的示意圖。

圖7是依據本發明之一實施例繪示的產生討論影音片段的示意圖。

圖8是依據圖7繪示的設置錨點示意圖。

圖9是依據本發明之一實施例繪示的產生會議記錄影片的示意圖。

一般而言，常見的會議記錄系統大多包括以下技術：(1)波束成形(beamforming)：可透麥克風陣列估算聲音來源的方位；(2)物件追蹤(object tracking)：追蹤會議畫面中的指定物件；(3)人物尋找(people finding)：可找出會議畫面中的特定人物所在位置；(4)講者視圖(speaker view)：可自動將攝影機對準發聲來源進行拍攝；(5)與會者模式：自動把整個會議的大畫面縮減至只保留與會者的畫面；(6)儲存會議記錄：直接錄製整場視訊會議的畫面；(7)將聲音轉換為文字(voice to text)；(8)自下語言處理：包括翻譯、摘要等。

請參照圖1A，其是依據本發明之一實施例繪示的會議記錄裝置示意圖。在不同的實施例中，會議記錄裝置100可實現為各式智慧型裝置及/或電腦裝置。

如圖1A所示，會議記錄裝置100可包括儲存電路102及處理器104。儲存電路102例如是任意型式的固定式或可移動式隨機存取記憶體(Random Access Memory，RAM)、唯讀記憶體(Read-Only Memory，ROM)、快閃記憶體(Flash memory)、硬碟或其他類似裝置或這些裝置的組合，而可用以記錄多個程式碼或模組。

處理器104耦接於儲存電路102，並可為一般用途處理器、特殊用途處理器、傳統的處理器、數位訊號處理器、多個微處理器(microprocessor)、一個或多個結合數位訊號處理器核心的微處理器、控制器、微控制器、特殊應用積體電路(Application Specific Integrated Circuit，ASIC)、現場可程式閘陣列電路(Field Programmable Gate Array，FPGA)、任何其他種類的積體電路、狀態機、基於進階精簡指令集機器(Advanced RISC Machine，ARM)的處理器以及類似品。

在本發明的實施例中，處理器104可存取儲存電路102中記錄的模組、程式碼來實現本發明提出的會議記錄方法，其細節詳述如下。

在一實施例中，為使本發明的概念更易於理解，以下另輔以圖1B作進一步說明，其中圖1B是依據本發明之一實施例的寬視角會議畫面的示意圖。

在圖1B中，會議畫面110例如是由設置於一會議場所中的寬視角攝影機(其視角可大於或等於180度)所拍攝的某一個寬視角會議畫面，但可不限於此。

在一實施例中，在取得會議畫面110之後，會議記錄裝置100的使用者可在會議畫面110中將感興趣的人物及/或物件(例如白板)以對應的長方框框出。另外，處理器104也可自動對會議畫面110進行人物偵測，以將會議畫面110中所偵測到的人物以對應的長方框框出，進而產生如會議畫面120所示的內容。在經過上述操作之後，可會議畫面110可相應地改變為包括多個長方框(例如長方框120a、120b)的會議畫面120。

在一些實施例中，使用者可自行對會議畫面120中的各長方框編輯對應的標籤(例如人名/物體名等)。舉例而言，假設長方框120a、120b個別對應於會議的參與者，則使用者可將各長方框120a、120b的標籤寫入對應的參與者名稱，但可不限於此。此外，處理器104亦可自行將會議畫面120中的一或多個長方框的標籤以某些預設的名稱顯示。例如，對應於某些參與者的長方框，處理器104可將其標籤編輯為「人物1」、「人物2」等預設名稱。相似地，對應於某些物體的長方框，處理器104可將其標籤編輯為「物體1」、「物體2」等預設名稱，但可不限於此。

經過上述操作之後，會議畫面120可相應地改變為會議畫面130，其中各長方框可具有對應的標籤，例如對應於長方框120a的標籤130a，以及對應於長方框120b的標籤130b，但可不限於此。

在一些實施例中，使用者可在會議畫面130中選取需要追蹤的一或多個長方框(例如對應於主講者的長方框)，而會議畫面130可相應地改變為如會議畫面140所示的內容。在此情況下，處理器104即會持續追蹤位於所選取的一或多個長方框(例如長方框120c)內的人物/物體，並相應地讓長方框隨著此人物/物體的移動而移動。

在一實施例中，處理器104還可偵測會議中聲音的聲源方向，並基於此聲源方向在會議畫面140中找出對應的長方框。藉此，處理器104即可得知上述聲音是由哪一個長方框所對應的人物所發出。在一實施例中，處理器104可將對應於聲源方向的長方框以特殊方式標記(例如改為某種特定顏色)，以突顯當下是哪個長方框內的人物在發出聲音，如會議畫面150所例示的長方框120d。在一實施例中，處理器104還可將上述聲音進行語音辨識，以獲得長方框120d內人物的發言內容(例如逐字稿)。

在一些實施例中，處理器104例如可基於波束成形、到達方向(direction of arrival，DOA)、聲源定位(sound localization)、唇部偵測(lip detection)、臉部辨識等技術來判定上述聲音的聲源方向及其對應的長方框，但可不限於此。

基於上述概念，處理器104可記錄整場會議中的每個參與者在每個會議畫面中的影像範圍(即，對應的長方框)、其相關的發言內容及相關的時間點，但可不限於此。

請參照圖2，其是依據本發明之一實施例繪示的會議事件資料示意圖。在本實施例中，處理器104可將會議中出現的各個會議事件以對應的會議事件資料進行記錄，其中各會議事件例如對應於會議中的一或多個參與者的說話狀態發生改變的時間點(例如從未說話改變為說話，或是從說話改變為停止說話)，但可不限於此。

在圖2中，各會議事件相關的會議事件資料例如可採用格式200進行記錄。舉例而言，假設在時間點T1時出現了會議中的第1個會議事件，則處理器104可基於格式200而將相關的資訊記錄為會議事件資料210。在一實施例中，會議事件資料210例如可記錄有所述第1個會議事件的索引值(即，「1」)、時間點T1、事件內容(即，「參與者A及C開始說話」)、參與者A的聲源方向及影像範圍(即，當下對應於參與者A的長方框範圍)、參與者C的聲源方向及影像範圍(即，當下對應於參與者C的長方框範圍)，但可不限於此。並且，在產生會議事件資料221的同時，處理器104還可基於先前的教示一併將參與者A及C的相關發言內容予以記錄。

此外，假設在時間點T2時出現了會議中的第2個會議事件，則處理器104可基於格式200而將相關的資訊記錄為對應的會議事件資料221。在一實施例中，會議事件資料221例如可記錄有所述第2個會議事件的索引值(即，「2」)、時間點T2、事件內容(即，「參與者A停止說話」)、參與者A的聲源方向及影像範圍。

在其他實施例中，由於所述第2個會議事件亦可理解為「參與者C持續說話」，故處理器104還可基於格式200而將所述第2個會議事件相關的資訊記錄為會議事件資料222。在一實施例中，會議事件資料222例如可記錄有所述第2個會議事件的索引值(即，「2」)、時間點T2、事件內容(即，「參與者C持續說話」)、參與者C的聲源方向及影像範圍。換言之，會議事件資料221及222是對於同一個會議事件的不同記錄方式，但可不限於此。並且，在產生會議事件資料221、222的同時，處理器104還可基於先前的教示一併將參與者C的相關發言內容予以記錄。

針對其他的會議事件(例如「參與者C停止說話」、「參與者C開始說話」等)，處理器104亦可基於以上教示的方式將相關的資訊記錄為對應的會議事件資料，其細節於此不另贅述。

在一些實施例中，假設某個會議是由位於不同會議場所的參與者同步參與時，處理器104仍可基於上述教示而產生相關的會議事件資料。舉例而言，假設在會議室A及B中分別設置有寬視角攝影機C及D，且會議室A及B中的人員係參與同一場線上會議。在此情況下，處理器104可在接收寬視角攝影機C及D針對此線上會議所拍攝的會議畫面時，執行先前實施例中教示的機制，以綜合寬視角攝影機C及D的會議畫面而產生上述線上會議相關的會議事件資料，但可不限於此。

在一些實施例中，本發明還提出一種會議檢視方法，其可在取得某特定會議的寬視角影片(其包括所述特定會議的多個會議畫面)及相關的會議事件資料之後，將較為冗長的所述寬視角影片以較為精簡的會議記錄影片(其可理解為上述特定會議的精華片段)呈現。藉此，可讓使用者可僅基於此會議記錄影片即理解上述特定會議的大致內容。相關細節詳述如下。

請參照圖3，其是依據本發明之一實施例繪示的會議檢視裝置示意圖。在不同的實施例中，會議檢視裝置300可實現為各式智慧型裝置及/或電腦裝置。

如圖3所示，會議檢視裝置300可包括儲存電路302及處理器304，其中儲存電路302及處理器304個別可能的實施方式可參照儲存電路102及處理器104，於此不另贅述。

在一些實施例中，會議記錄裝置100及會議檢視裝置300 可實現為同一個裝置，也可實現為不同的裝置。

在本發明的實施例中，處理器304可存取儲存電路302中記錄的模組、程式碼來實現本發明提出的會議檢視方法，其細節詳述如下。

請參照圖4，其是依據本發明之一實施例繪示的會議檢視方法流程圖。在本實施例中，圖4的方法可由圖3的會議檢視裝置300執行，以下即搭配圖3所示的元件說明圖4各步驟的細節。

首先，在步驟S410中，處理器304可取得特定會議的寬視角影片及關聯於寬視角影片的多個會議事件資料。在一實施例中，假設會議記錄裝置100係用於錄製上述特定會議的寬視角影片及產生相關的會議記錄資料，則處理器304例如可從會議記錄裝置100接收處理器104針對上述特定會議記錄的寬視角影片及相關的會議事件資料，但可不限於此。

之後，在步驟S420中，處理器304可取得特定會議的多個參與者個別的發言內容。在一實施例中，處理器304還可從會議記錄裝置100接收處理器104針對上述特定會議的各參與者記錄的發言內容，但可不限於此。

在步驟S430中，處理器304可在寬視角影片中決定多個特定時間區段，並依據各特定時間區段對應的所述多個會議事件資料找出各特定時間區段中的討論者。

在不同的實施例中，處理器304可基於不同的方式在寬視角影片中決定上述特定時間區段，以下將作進一步說明。

請參照圖5A，其是依據本發明第一實施例繪示的決定特定時間區段的示意圖。在本實施例中，處理器304例如可提供寬視角影片的會議時間軸50，以讓使用者自行在會議時間軸50上標示所需的一或多個時間段。假設使用者在會議時間軸50上標示有多個指定時間區段50a~50c，則處理器304可以指定時間區段50a~50c作為步驟S430中的所述多個特定時間區段。

請參照圖5B，其是依據本發明第二實施例繪示的決定特定時間區段的示意圖。在本實施例中，處理器304例如可提供寬視角影片的會議時間軸50以供使用者參考。此外，處理器304還可提供上述特定會議的各參與者在特定會議中的參與討論時間軸，其中各參與者的參與討論時間軸可標示有各參與者在特定會議中的參與討論區間。

舉例而言，假設上述特定會議包括參與者1至參與者K(其中K為正整數)，則處理器304可基於上述特定會議的相關會議記錄資料而提供參與者1至參與者K個別的參與討論時間軸501~50K。在參與者1的參與討論時間軸501中，處理器304可標示有參與者1在特定會議中的參與討論區間501a~501c，其中各參與討論區間501a~501c例如是參與者1曾參與討論(例如，發言)的時間區間，但可不限於此。相似地，在參與者K的參與討論時間軸50K中，處理器304可標示有參與者K在特定會議中的參與討論區間50Ka~50Kc，其中各參與討論區間50Ka~50Kc例如是參與者K曾參與討論(例如，發言)的時間區間，但可不限於此。

基於參與討論時間軸501~50K，使用者即可得知哪個參與者在哪段時間曾參與討論，進而決定欲在會議時間軸50上標示的一或多個時間段。假設使用者在會議時間軸50上標示圖5A中的指定時間區段50a~50c，則處理器304可以指定時間區段50a~50c作為步驟S430中的所述多個特定時間區段，但可不限於此。

請參照圖6，其是依據本發明第三實施例繪示的決定特定時間區段的示意圖。在本實施例中，處理器304可提供上述特定會議的參與者供選取。在圖6中，處理器304可顯示對應於上述參與者的圖標60a~60c，而使用者可從中選取一或多個欲關注的參與者。

舉例而言，假設使用者欲找出參與者Claire及Benny分別作為主講者的參與討論區間時，使用者可相應地選取圖標60a及60c。在此情況下，處理器304可在寬視角影片的會議時間軸60上標示Claire及Benny在上述特定會議中的參與討論區間61a~61c。

在圖6中，依據上述會議事件資料，處理器304還可針對各參與討論區間61a~61c提供對應的討論者清單62a~62c，而使用者即可據以得知在各參與討論區間61a~61c參與討論的討論者。並且，處理器304還可在討論者清單62a~62c將當下的主講者以特定方式加以強調，以讓使用者得知各參與討論區間61a~61c中的主講者。

舉例而言，假設Claire在參與討論區間61a及61b中為主講者，則處理器304可相應地在討論者清單62a及62b中將Claire的圖標以較大的尺寸呈現。舉另一例而言，假設Benny在參與討論區間61c中為主講者，則處理器304可相應地在討論者清單62c中將Benny的圖標以較大的尺寸呈現。藉此，使用者即可得知Claire為參與討論區間61a及61b中的主講者，而Benny為參與討論區間61c中的主講者，但可不限於此。

此外，在提供參與討論區間61a~61c之後，使用者還可自行依需求調整各參與討論區間61a~61c的大小。舉例而言，假設參與討論區間61a原本的時間起點及時間終點為所示的0：15：00至0：25：00，則使用者可自行將上述時間起點及時間終點分別調整為所需的值，例如所示的0：14：00及0：26：00，但可不限於此。之後，處理器304即可將(經調整的)各參與討論區間61a~61c作為步驟S430中的所述多個特定時間區段，但可不限於此。

在以上情境中，雖假設使用者欲關注某些參與者作為主講者的參與討論區間，但在其他實施例中，使用者亦可基於其他的原則來決定欲關注的參與者的特性。例如，在一些實施例中，假設使用者欲找出參與者Claire及Benny分別作為討論者的參與討論區間時，使用者可在觸發處理器304提供相關的搜尋功能/介面後，相應地選取圖標60a及60c。在此情況下，處理器304亦可在寬視角影片的會議時間軸60上標示Claire及Benny在上述特定會議中作為討論者的參與討論區間61a~61c，但可不限於此。

在其他實施例中，處理器304還可基於其他原則決定寬視角影片中的上述特定時間區段。舉例而言，在第四實施例中，處理器304可先提供如圖5A所示的寬視角影片的會議時間軸50。之後，處理器304可取得使用者所設定的一指定人數。

在一實施例中，處理器304可依據上述指定人數在會議時間軸50上標示多個第一參考時間區段。在一實施例中，各第一參考時間區段對應的參與者數量可不低於上述指定人數。具體而言，由於會議的過程中可能會有部分參與者因故而中途離開或加入，故在使用者設定指定人數之後，處理器304可將上述特定會議過程中的參與者數量不小於指定人數的時間區段找出，以作為上述第一參考時間區段。藉此，可排除某些參與者數量過少的時間區段(例如休息時間)。

在另一實施例中，各第一參考時間區段對應的討論者數量可不低於上述指定人數。具體而言，由於會議的過程中可能會有某些部分較多人熱烈參與討論，也可能會有某些部分只有少數人零星參與討論。在此情況下，在使用者設定指定人數之後，處理器304可將上述特定會議過程中較多人參與討論的時間區段找出，以作為上述第一參考時間區段。藉此，可找出較為熱烈的討論區間。

在提供上述第一參考時間區段供使用者參考之後，使用者可從中選取一或多個指定時間區段(例如圖5A中的指定時間區段50a~50c)。之後，處理器304可相應地以上述指定時間區段作為步驟S430中的所述多個特定時間區段。

在第五實施例中，在決定寬視角影片中的上述特定時間區段的過程中，處理器304可先提供如圖5A所示的寬視角影片的會議時間軸50。之後，處理器304可提供一關鍵字搜尋框，以供使用者輸入感興趣的關鍵字。

在一實施例中，在取得使用者於關鍵字搜尋框輸入的搜尋關鍵字之後，處理器304可據以在會議時間軸50標示多個第二參考時間區段，其中所述特定會議的參與者在各第二參考時間區段中的發言內容可包括上述搜尋關鍵字。簡言之，在取得搜尋關鍵字之後，處理器304可找出曾有參與者提及搜尋關鍵字的時間區段，並將這些時間區段取出作為上述第二參考時間區段。

在提供上述第二參考時間區段供使用者參考之後，使用者可從中選取一或多個指定時間區段(例如圖5A中的指定時間區段50a~50c)。之後，處理器304可相應地以上述指定時間區段作為步驟S430中的所述多個特定時間區段，但可不限於此。

在依上述教示決定寬視角影片中的上述特定時間區段之後，處理器304可依據各特定時間區段對應的所述多個會議事件資料找出各特定時間區段中的討論者。

以圖2為例，假設某特定時間區段D1涵蓋圖2中的時間點T1及T2，則處理器304可基於對應於時間點T1及T2的會議事件資料210、221(或222)而得知此特定時間區段D1中的討論者包括參與者A及C，但可不限於此。

在其他實施例中，處理器304除了依據使用者選取的一或多個指定時間區段來決定所述多個特定時間區段之外，還可依適當的機制自動決定所述多個特定時間區段。

舉例而言，在所述第四實施例中，在處理器304依據上述指定人數在會議時間軸50上標示所述多個第一參考時間區段之後，處理器304可直接以這些第一參考時間區段作為步驟S430中的所述多個特定時間區段，但可不限於此。

在一實施例中，處理器304例如可從參與者中辨識特定會議的特定參與者(例如是整個特定會議的主講者或是使用者關注的其他參與者)，並提供此特定參與者在上述特定會議中的參與討論時間軸。在一實施例中，此特定參與者的參與討論時間軸可標示有此特定參與者在上述特定會議中的一或多個參與討論區間。之後，處理器304可從此特定參與者的上述參與討論區間中找出多個指定時間區段，並以這些指定時間區段作為步驟S430中的所述多個特定時間區段。在一實施例中，處理器304依上述方式找出的各指定時間區間之間的時間差可大於一時間門限值。藉此，可避免處理器304所找出的指定時間區間之間因過於相近而無法較佳地表徵整場特定會議的內容，但可不限於此。

在一些實施例中，處理器304還可將先前各實施例中的指定時間區段往前/後擴展一段時間，再將擴展後的指定時間區段作為步驟S430中的所述多個特定時間區段，但可不限於此。

接著，在步驟S440中，處理器304可取得各特定時間區段中的各討論者的發言內容。再以上述特定時間區段D1為例，在已知其中的討論者包括參與者A及C之後，處理器304即可依據特定時間區段D1中的各個時間點而找出參與者A及C在特定時間區段D1中的發言內容，但可不限於此。

在步驟S450中，處理器304可將各特定時間區段的各討論者的討論畫面及發言內容整理為對應的討論影音片段。

在一實施例中，處理器304對於各特定時間區段所執行的用於產生對應討論影音片段的機制大致相同，故以下暫以上述特定時間區段中的第i個(i為索引值，且為正整數)特定時間區段為例作說明，但可不限於此。

概略而言，處理器304可找出屬於所述第i個特定時間區段的一或多個討論者，為與前述各討論者區別，此處第i個特定時間區段的一或多個討論者被稱為第一討論者，並找出各第一討論者在所述第i個特定時間區段中的第一討論畫面及第一發言內容。之後，處理器304可依據指定畫面佈局將各第一討論者的第一討論畫面及第一發言內容整理為對應於所述第i個特定時間區段的討論影音片段。在一實施例中，上述指定畫面佈局可包括發言內容框及對應各第一討論者的第一畫面框，其中各第一畫面框可呈現各第一討論者的第一討論畫面，發言內容框可包括各第一討論者的第一發言內容，且各第一討論者的第一發言內容可依各第一討論者的發言時間排序於發言內容框中。為使以上概念更易於理解，以下另輔以圖7作進一步說明。

請參照圖7，其是依據本發明之一實施例繪示的產生討論影音片段的示意圖。在圖7中，假設處理器304依先前實施例的教示而在會議時間軸70上決定了特定時間區段71。在此情況下，處理器304可找出屬於特定時間區段71的討論者。為便於說明，以下假設特定時間區段71中的討論者即為圖6中的Claire及Benny，但可不限於此。

相應地，處理器304可找出Claire及Benny在特定時間區段71中的討論畫面及發言內容，並依據指定畫面佈局72將Claire及Benny在特定時間區段71中的討論畫面及發言內容整理為對應於特定時間區段71的討論影音片段。

在圖7中，指定畫面佈局72可包括發言內容框72c及對應各討論者的畫面框72a及72b。在一實施例中，指定畫面佈局72例如可將特定時間區段71中的主講者(例如Claire)的討論畫面以較大的畫面框72a呈現，並將其他討論者(例如Benny)的討論畫面以較小的畫面框72b呈現。並且，發言內容框72c可包括Claire及Benny在特定時間區段71中的發言內容，且這些發言內容可依各Claire及Benny的發言時間排序於發言內容框72c中。

在此情況下，在播放對應於特定時間區段71的討論影音片段時，即可看到Claire及Benny在特定時間區段71中發表相關言論時的討論畫面，但可不限於此。

在不同的實施例中，以上由處理器304使用的指定畫面佈局亦可依設計者的需求而調整為其他佈局形式，並不限於圖7 所示的子母畫面態樣。在一些實施例中，處理器304可自行決定指定畫面佈局的態樣，或是由使用者自行選擇所需的態樣作為指定畫面佈局，但可不限於此。

在一些實施例中，由於所述第i個特定時間區段中的一或多個第一討論者可能會因故而在所述第i個特定時間區段中的某個子時間區段中不具有對應的第一討論畫面，因此處理器304可相應地調整上述第一討論者在此子時間區段中的第一畫面框的內容。

再以圖7為例，假設Benny在特定時間區段71中的某個子時間區段中未具有對應的討論畫面。在此情況下，處理器304可找出對應於Benny的畫面框72b，並在此子時間區段中將畫面框72b顯示為預設圖(例如是一人像圖)或空白圖，或是將此子時間區段調整為未包括畫面框72b的畫面佈局(例如僅包括畫面框72a的畫面佈局)，但可不限於此。

在一些實施例中，對於所述第i個特定時間區段而言，使用者可進一步在其中設置錨點，以將所述第i個特定時間區段依序劃分為多個子時間區段，並對各子時間區段設定不同的畫面佈局。

請參照圖8，其是依據圖7繪示的設置錨點示意圖。在圖8中，在決定特定時間區段71之後，假設使用者另於特定時間區段71中設置錨點81(其對應的時間點例如是「0：20：00」)，則處理器304可據以將特定時間區段71劃分為子時間區段71a及71b。

在本實施例中，處理器304例如可依據一第一畫面佈局82(其可相同於圖7的指定畫面佈局72)將Claire與Benny在子時間段71a中的討論畫面及發言內容整理為對應於子時間段71a的第一子討論影音片段。另外，處理器304還可依據第二畫面佈局83將Claire與Benny在子時間段71b中的討論畫面及發言內容整理為對應於子時間段71b的第二子討論影音片段。

在圖8中，第二畫面佈局83可包括發言內容框83c及對應各討論者的畫面框83a及83b。在一實施例中，第二畫面佈局83例如可將子時間區段71b中的討論者(例如Benny及Claire)以相同尺寸的畫面框83a及83b呈現。並且，發言內容框83c可包括Claire及Benny在子時間區段71b中的發言內容，且這些發言內容可依各Claire及Benny的發言時間排序於發言內容框83c中，但可不限於此。

之後，處理器304可將第一子討論影音片段及第二子討論影音片段依序拼接為對應於特定時間區段71的討論影音片段。在此情況下，在播放對應於特定時間區段71的討論影音片段時，即可依序看到對應於第一畫面佈局82的第一子討論影音片段及對應於第二畫面佈局83的第二子討論影音片段，但可不限於此。

在一些實施例中，在將特定時間區段71劃分為子時間區段71a及71b之後，處理器304還可進一步在排序在前的子時間區段71a的結尾片段(例如是最後的一至數秒)插入一轉場動畫，其中此轉場動畫可用於將第一畫面佈局82轉換為第二畫面佈局 83。在此情況下，在播放對應於特定時間區段71的討論影音片段時，即可依序看到對應於第一畫面佈局82的第一子討論影音片段、上述轉場動畫及對應於第二畫面佈局83的第二子討論影音片段，但可不限於此。

在其他實施例中，使用者可依需求而在所需的特定時間區段中設置所需數量的錨點，而處理器304所相應執行的操作可參考上述教示而得知，於此不另贅述。

在取得各特定時間區段對應的討論影音片段之後，在步驟S460中，處理器304可將各特定時間區段對應的討論影音片段組織為對應於特定會議的會議記錄影片(其可理解為上述特定會議的精華片段)。

請參照圖9，其是依據本發明之一實施例繪示的產生會議記錄影片的示意圖。在本實施例中，假設處理器304在決定特定時間區段50a~50c之後，已依據上述教示而產生分別對應於特定時間區段50a~50c的討論影音片段90a~90c。在此情況下，處理器304例如可將討論影音片段90a~90c依序組合為對應於上述特定會議的會議記錄影片910，但可不限於此。

在一些實施例中，各特定時間區段對應的討論影音片段還可經設定有不同的幀率，藉以在播放會議記錄影片時達到縮時/慢速播放的效率。

以圖9為例，假設使用者欲讓討論影音片段90b、90c在被播放時產生縮時/加速播放的效果，則使用者例如可將討論影音片段90a設定為第一幀率(例如30幀/秒)，並將討論影音片段90b、90c設定為高於第一幀率的第二幀率(例如60幀/秒)。之後，處理器304可再將討論影音片段90a~90c依序組合為對應於上述特定會議的會議記錄影片910。藉此，在播放會議記錄影片910的過程中，當播放到討論影音片段90b、90c的部分時，即會因幀率的改變而使得討論影音片段90b、90c出現縮時/加速播放的效果，但可不限於此。

進一步而言，相較於習知以捨棄部分幀的方式來達到縮時/加速播放效果的作法，本發明的作法可更為完整地保留所有的畫面。

另一方面，假設使用者欲讓討論影音片段90b、90c在被播放時產生慢速播放的效果，則使用者例如可將討論影音片段90a設定為第一幀率(例如30幀/秒)，並將討論影音片段90b、90c設定為低於第一幀率的第二幀率(例如15幀/秒)。之後，處理器304可再將討論影音片段90a~90c依序組合為對應於上述特定會議的會議記錄影片910。藉此，在播放會議記錄影片910的過程中，當播放到討論影音片段90b、90c的部分時，即會因幀率的改變而使得討論影音片段90b、90c出現慢速播放的效果，但可不限於此。

在一些實施例中，在進行縮時/慢速播放的調整時，處理器304亦可在保持音調的情況下對聲音部分進行相應的調整，但可不限於此。

在一些實施例中，處理器304還可依據上述會議事件資料將各參與者的發言內容整理為可編輯逐字稿，其中此可編輯逐字稿可將各參與者的發言內容依對應的發言時間進行排序。在一些實施例中，處理器304還可提供對上述可編輯逐字稿進行翻譯/摘要的功能。此外，使用者還可在上述可編輯逐字稿選取一或多個段落，而處理器304可從使用者所選的一或多個段落中找出主講者(例如是發言內容最多的參與者)。此外，使用者還可自行手動編輯上述可編輯逐字稿的內容。在一些實施例中，使用者還可從參與者中選擇欲關注的一者，而處理器304可相應地找出此參與者的相關發言內容的逐字稿，以供使用者參考/編輯，但不限於此。

在一些實施例中，處理器304可依一定原則從上述可編輯逐字稿中找出一或多個文字片段，再將相應的畫面進行結合，以產生對應的會議記錄影片。舉例而言，處理器304可依據各文字片段對應的互動熱烈程度、語調起伏程度、語句間隔時間等因素對各文字片段進行評分，其中各文字片段的分數可正相關於其對應的互動熱烈程度、語調起伏程度，並負相關於其對應的語句間隔時間，但可不限於此。

在一些實施例中，假設上述特定會議在進行時，相關人員曾在某些時間點將其發言模式切換為主講者模式(即，只有主講者在發言)，則處理器304可將對應於主講者模式的時間區段取出作為上述特定時間區段，但可不限於此。

在一些實施例中，假設上述寬視角影片中還包括如台灣專利申請號109145738(其全文以引用方式併入本文中)中所提及的感興趣區域(region of interest，ROI)時，則處理器304可將各ROI的屬性發生變化時的時間點找出，並將與這些時間點相關的時間區段取出作為上述特定時間區段，但可不限於此。

綜上所述，本發明可在取得特定會議的寬視角影片相關的會議事件資料及各參與者的發言內容之後，讓使用者手動在寬視角影片中決定多個特定時間區段，或是由本發明的會議檢視裝置自動依一定的原則決定上述特定時間區段。之後，本發明的方法可將各特定時間區段的各討論者的討論畫面及發言內容整理為對應的討論影音片段，其中各特定時間區段對應的討論影音片段可採用對應的佈局畫面呈現各討論者的討論畫面及發言內容。接著，本發明的方法可將各特定時間區段對應的討論影音片段組織為對應於特定會議的會議記錄影片。藉此，本發明的方法可智慧地將冗長且不易查看的的寬視角影片濃縮為精簡的精華片段，進而改進檢視會議的效率。

雖然本發明已以實施例揭露如上，然其並非用以限定本發明，任何所屬技術領域中具有通常知識者，在不脫離本發明的精神和範圍內，當可作些許的更動與潤飾，故本發明的保護範圍當視後附的申請專利範圍所界定者為準。

S410~S460:步驟

Claims

一種會議檢視方法，包括：

取得一特定會議的一寬視角影片及關聯於該寬視角影片的多個會議事件資料，其中各該會議事件資料對應於該特定會議的一時間點，且各該會議事件資料記錄有在對應的該時間點的一發言者的一聲源方向及該發言者在該寬視角影片中的一影像範圍；

取得該特定會議的多個參與者個別的發言內容；

在該寬視角影片中決定多個特定時間區段，並依據各該特定時間區段對應的該些會議事件資料找出各該特定時間區段中的至少一討論者；

將各該特定時間區段的各該討論者的討論畫面及各該討論者的該發言內容整理為對應的一討論影音片段；

將各該特定時間區段對應的該討論影音片段組織為對應於該特定會議的一會議記錄影片。
如請求項1所述的方法，其中在該寬視角影片中決定該些特定時間區段的步驟包括：

提供該寬視角影片的一會議時間軸；

反應於判定該會議時間軸經一使用者標示有多個指定時間區段，以該些指定時間區段作為該些特定時間區段。
如請求項2所述的方法，更包括：

提供各該參與者在該特定會議中的一參與討論時間軸，其中各該參與者的該參與討論時間軸標示有各該參與者在該特定會議中的至少一參與討論區間。
如請求項1所述的方法，其中在該寬視角影片中決定該些特定時間區段的步驟包括：

提供該特定會議的該些參與者供選取；

反應於判定該些參與者中的一第一參與者經該使用者選取，在該寬視角影片的一會議時間軸上標示該第一參與者在該特定會議中的至少一參與討論區間；

以該第一參與者的該至少一參與討論區間作為該些特定時間區段。
如請求項4所述的方法，更包括：

依據該些會議事件資料找出在該第一參與者的該至少一參與討論區間中的該至少一討論者，並將各該參與討論區間對應的各該討論者以對應於各該參與討論區間的一討論者清單呈現。
如請求項1所述的方法，其中在該寬視角影片中決定該些特定時間區段的步驟包括：

提供該寬視角影片的一會議時間軸；

取得一指定人數，並據以在該會議時間軸標示多個第一參考時間區段，其中各該第一參考時間區段對應的一參與者數量或一討論者數量不低於該指定人數；

反應於判定該些第一參考時間區段經該使用者選定有多個指定時間區段，以該些指定時間區段作為該些特定時間區段。
如請求項1所述的方法，其中在該寬視角影片中決定該些特定時間區段的步驟包括：

提供該寬視角影片的一會議時間軸；

取得一搜尋關鍵字，並據以在該會議時間軸標示多個第二參考時間區段，其中該些參與者在各該第二參考時間區段中的該發言內容包括該搜尋關鍵字；

反應於判定該些第二參考時間區段經該使用者選定有多個指定時間區段，以該些指定時間區段作為該些特定時間區段。
如請求項1所述的方法，其中該些特定時間區段包括第i個特定時間區段，i為正整數，且將各該特定時間區段的各該討論者的討論畫面及該發言內容整理為對應的該討論影音片段的步驟包括：

找出屬於所述第i個特定時間區段的至少一第一討論者，並找出各該第一討論者在所述第i個特定時間區段中的一第一討論畫面及一第一發言內容；

依據一指定畫面佈局將各該第一討論者的該第一討論畫面及該第一發言內容整理為對應於所述第i個特定時間區段的該討論影音片段，其中該指定畫面佈局包括一發言內容框及對應該至少一第一討論者的至少一第一畫面框，其中各該第一畫面框呈現各該第一討論者的該第一討論畫面，該發言內容框包括各該第一討論者的該第一發言內容，且各該第一討論者的該第一發言內容依各該第一討論者的發言時間排序於該發言內容框中。
如請求項8所述的方法，其中反應於判定該至少一第一討論者中的一第二討論者在所述第i個特定時間區段中的一子時間區段不具有對應的該第一討論畫面，所述方法更包括：

在該至少一第二畫面框中找出對應於該第二討論者的一第三畫面框；

在該子時間區段中將該第三畫面框顯示為一預設圖或一空白圖，或是將該子時間區段調整為未包括該第三畫面框的另一畫面佈局。
如請求項1所述的方法，其中該些特定時間區段包括第i個特定時間區段，i為正整數，且所述方法更包括：

找出屬於所述第i個特定時間區段的至少一第三討論者，並找出各該第三討論者在所述第i個特定時間區段中的一第一討論畫面及一第一發言內容；

反應於判定所述第i個特定時間區段中經插入有一錨點，依據該錨點將該所述第i個特定時間區段依序劃分為一第一子時間段及一第二子時間段；

依據一第一畫面佈局將各該第三討論者在該第一子時間段中的該第一討論畫面及該第一發言內容整理為對應於該第一子時間段的一第一子討論影音片段；

依據一第二畫面佈局將各該第三討論者在該第二子時間段中的該第一討論畫面及該第一發言內容整理為對應於該第二子時間段的一第二子討論影音片段；

將該第一子討論影音片段及該第二子討論影音片段依序拼接為對應於所述第i個特定時間區段的該討論影音片段。
如請求項10所述的方法，更包括：

在該第一子討論影音片段的一結尾片段插入一轉場動畫，其中該轉場動畫用於將該第一畫面佈局轉換為該第二畫面佈局。
如請求項1所述的方法，更包括：

依據該些會議事件資料將各該參與者的該發言內容整理為一可編輯逐字稿。
如請求項1所述的方法，其中該些特定時間區段包括第i個特定時間區段及第i+1個特定時間區段，i為正整數，且將各該特定時間區段對應的該討論影音片段組織為對應於該特定會議的該會議記錄影片的步驟更包括將對應於所述第i個特定時間區段的該討論影音片段設定為一第一幀率，將對應於所述第i+1個特定時間區段的該討論影音片段設定為一第二幀率，且該第一幀率不同於該第二幀率。
如請求項1所述的方法，其中在該寬視角影片中決定該些特定時間區段的步驟包括：

從該些參與者中辨識該特定會議的一特定參與者，並提供該特定參與者在該特定會議中的一參與討論時間軸，其中該特定參與者的該參與討論時間軸標示有該特定參與者在該特定會議中的至少一參與討論區間；

從該特定參與者的該至少一參與討論區間中找出多個指定時間區段，並以該些指定時間區段作為該些特定時間區段，其中各該指定時間區間之間的時間差大於一時間門限值。
如請求項1所述的方法，其中在該寬視角影片中決定該些特定時間區段的步驟包括：

提供該寬視角影片的一會議時間軸；

取得一指定人數，並據以在該會議時間軸標示多個第一參考時間區段，其中各該第一參考時間區段對應的一參與者數量或一討論者數量不低於該指定人數；

以該些第一參考時間區段作為該些特定時間區段。
如請求項1所述的方法，其中該寬視角影片的視角大於或等於180度。
如請求項1所述的方法，更包括：

於該寬視角影片中標出多個感興趣的人物及/或物件，該多個感興趣的人物及/或物件至少部分對應於該多個參與者；

選擇性地以多個標籤標註該多個感興趣的人物及/或物件的至少一部分；以及

選擇性地令一使用者選取用以對應於該多個參與者之該多個感興趣的人物及/或物件之該至少部分。
一種會議檢視裝置，包括：

一儲存電路，其儲存一程式碼；以及

一處理器，其耦接該儲存電路，存取該程式碼以執行：

取得一特定會議的一寬視角影片及關聯於該寬視角影片的多個會議事件資料，其中各該會議事件資料對應於該特定會議的一時間點，且各該會議事件資料記錄有在對應的該時間點的一發言者的一聲源方向及該發言者在該寬視角影片中的一影像範圍；

取得該特定會議的多個參與者個別的發言內容；

在該寬視角影片中決定多個特定時間區段，並依據各該特定時間區段對應的該些會議事件資料找出各該特定時間區段中的至少一討論者；

將各該特定時間區段的各該討論者的討論畫面及各該討論者的該發言內容整理為對應的一討論影音片段；

將各該特定時間區段對應的該討論影音片段組織為對應於該特定會議的一會議記錄影片。