TWI755037B

TWI755037B - 影音錄製裝置與影音編輯播放系統

Info

Publication number: TWI755037B
Application number: TW109128580A
Authority: TW
Inventors: 陳筱涵
Original assignee: 陳筱涵
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2022-02-11
Also published as: TW202209301A

Abstract

一種影音錄製裝置與影音編輯播放系統，包含用以錄影產生影像檔的影像擷取器、拾音器與處理器。拾音器之麥克風陣列可分別朝多個拾音區域進行指向性收音以得到多個聲音檔。處理器能控制啟動影像擷取器與其中至少兩個麥克風陣列，並對該影像檔與該等聲音檔進行時間同步處理以建立影音資料。藉此設計，使得所建立的該影音資料會具有多個可供個別選擇編輯與輸出的聲音檔，方便透過安裝在電子裝置之影音編輯播放系統隨時選擇要與當前播放中之影像檔同步播放輸出的聲音檔，可改善目前影音錄製設備的影音錄製缺點。

Description

影音錄製裝置與影音編輯播放系統

本發明是有關於一種影音處理裝置與影音處理系統，特別是指一種影音錄製裝置與影音編輯播放控制系統。

傳統的影音錄製設備使用時，會在利用影像擷取器錄影建立影像檔的同時，也同步透過拾音器進行拾音以建立聲音檔，並對影像檔與聲音檔進行時間同步處理以建立一個影音檔。但因為拾音器在進行收音時，若是採用指向性麥克風進行收音，則通常是朝語音能量最大的方向進行指向性收音，以至於其它方向的語音會被衰減忽略，而會遺漏掉其他人的講話內容；而若採用全向性麥克風進行收音時，則會同時收到許多人的聲音，所有的人聲會混雜在一起而無法個別分離，進而造成該影音檔的人聲吵雜，難以清楚區別與聆聽某一位人士講話內容，也會造成影音檔後製上的困難。

因此，本發明的目的，即在提供一種能改善先前技術的至少一個缺點的影音錄製裝置。

於是，本發明影音錄製裝置，包含一個機殼，及設置在該機殼的一個影像擷取器、一個拾音器與一個處理器。該影像擷取器能被控制啟動，而朝該機殼前方一水平視野範圍進行錄影以得到一個影像檔。該拾音器包括多個麥克風陣列，該等麥克風陣列可被控制啟動，而分別朝該水平視野範圍中之多個水平排列的拾音區域進行指向性收音，以得到多個聲音檔。該處理器是訊號連接該影像擷取器與該拾音器，包括一個用以控制啟動該影像擷取器與其中至少兩個麥克風陣列的錄製管控單元，及一個會對該影像檔與被啟動之該等麥克風陣列的該等聲音檔進行時間同步處理以建立一個影音資料的影音建檔單元。

因此，本發明的另一目的，即在提供一種能改善先前技術的至少一個缺點的影音編輯播放系統。

於是，本發明影音編輯播放系統，適用於程式化建構在一電子裝置，可用以控制該電子裝置播放前述影音資料。該影音播放系統包含一個影音輸出控制單元，該影音輸出控制單元包括一個用以控制該電子裝置播放顯示該影音資料之該影像檔的影像播放控制模組、一個用以控制該電子裝置顯示一個音軌選擇介面的聲音輸出設定模組，及一個聲音播放控制模組。該音軌選擇介面可供操作以選擇該影音資料中的其中至少一個聲音檔，該聲音播放控制模組會根據該影像檔當前被播放的時間點，控制該電子裝置同步播放輸出該音軌選擇介面當前被選擇之該至少一聲音檔。

本發明的功效在於：透過該影音錄製裝置能在進行影像擷取的同時，也以該等麥克風陣列分別對水平視野範圍內的多個拾音區域同步進行指向性收音的設計，使得所建立的該影音資料會具有多個可供個別選擇編輯與輸出的聲音檔，方便以安裝在電子裝置之影音編輯播放系統隨時選擇改變要與當前播放之該影像檔同步播放輸出的聲音檔，可改善目前影音錄製設備的影音錄製缺點。

在本發明被詳細描述前，應當注意在以下的說明內容中，類似的元件是以相同的編號來表示。

參閱圖1、2、3，本發明影音錄製裝置100的一個實施例，適用於與一個電子裝置900訊號連接，所述電子裝置900例如但不限於手機與平板電腦等行動裝置，以及筆記型電腦、桌上型電腦和雲端伺服器等電腦設備。

該影音錄製裝置100包含一個機殼2，及整合設置在該機殼2的一個顯示器5、一個影像擷取器3、一個拾音器4、一個通訊器6與一個處理器7。

該影像擷取器3可用以朝該機殼2前方一水平視野範圍進行影像擷取以得到一個影像檔，該顯示器5可顯示該影像檔。該拾音器4包括多個左右間隔設置的麥克風陣列41與一個全向性麥克風42，該等麥克風陣列41可被控制啟動，而分別朝該水平視野範圍中之多個水平排列的拾音區域進行指向性收音以得到多個聲音檔，該全向性麥克風42可被控制啟動，而朝該機殼2前方進行全向性收音，以得到一個背景音訊檔。

該通訊器6可透過有線通訊技術及/或無線通訊技術訊號連接該電子裝置900，以進行資料傳輸。所述無線通訊技術可以是目前已知的藍芽、wifi等無線網路技術，及/或4G、5G等行動通訊網路技術。

該處理器7是訊號連接該影像擷取器3、該拾音器4與該通訊器6，包括一個錄製管控單元71，及一個影音建檔單元72。該錄製管控單元71包括一個用以控制該影像擷取器3之運作的錄影控制模組711、多個分別訊號連接該等麥克風陣列41與該全向性麥克風42的錄音控制模組712，及一個訊號連接該錄影控制模組711與該等錄音控制模組712之同步管控模組713。

該同步管控模組713可於該顯示器5顯示一啟動設定介面714，該啟動設定介面714可供操作以選擇設定要被控制啟動的錄音控制模組712，該同步管控模組713會被觸發而同步控制啟動該錄影控制模組711與該啟動設定介面714被設定要啟動之所有錄音控制模組712，藉以控制該影像擷取器3、對應之麥克風陣列41及該全向性麥克風42同步啟動。在本實施例中，該全向性麥克風42對應之該錄音控制模組712是預設為恆被啟動之狀態，但實施時，在本發明之其它實施態樣中，也可將該全向性麥克風42對應之該錄音控制模組712改為可經由該啟動設定介面714設定是否啟動之態樣。

該影音建檔單元72可接收處理該影像檔、該等聲音檔與該背景音訊檔，並具有一個語音增強處理模組721，及一個建檔處理模組722。該語音增強處理模組721會對每一聲音檔進行語音訊號增強之語音訊號處理（Speech processing），所述語音訊號處理例如但不限於類比數位轉換、濾波去雜訊處理、噪音訊號及語音訊號分離處理，以及降噪處理和語音訊號提取等。由於前述語音訊號處理為現有技術且方式眾多，因此不再詳述。

該建檔處理模組722會對該影像檔、該背景音訊檔，及經過語音增強處理後的該等聲音檔進行時間同步處理，並彙整該影像檔、該背景音訊檔，及經過語音增強處理後的該等聲音檔以建立一個影音資料，並經由該通訊器6將該影音資料傳送至該電子裝置900。

本發明影音編輯播放系統800的一個實施例，適用於程式化實施建構在前述電子裝置900，可用以控制該電子裝置900對該影音錄製裝置100所建立的該影音資料進行輸出與編輯處理。所述程式化實施方式例如但不限於以APP（mobile application）型式，或其它程式語言型式。

該影音編輯播放系統800包含一個影音輸出控制單元81，及一個影音後製編輯單元82。該影音輸出控制單元81包括一個影像播放控制模組811、一個聲音輸出設定模組812，及一個聲音播放控制模組814。

該影像播放控制模組811可用以控制該電子裝置900播放顯示該影音資料中的該影像檔。該聲音輸出設定模組812可控制該電子裝置900顯示一個音軌選擇介面813，並於該音軌選擇介面813顯示出該影音檔中的所有聲音檔與該背景音訊檔，該音軌選擇介面813可供操作選擇要被播放輸出的聲音檔與該背景音訊檔，可供選擇一個聲音檔、多個聲音檔，及/或該背景音訊檔。

該聲音播放控制模組814會根據該影像播放控制模組811當前播放輸出之該影像檔的時間點，控制該電子裝置900同步播放輸出該音軌選擇介面813當前被選擇要輸出的所有聲音檔及/或該背景音訊檔，也就是控制該電子裝置900時間同步地播放該影像檔與被選擇之所有聲音檔及/或該背景音訊檔。

該影音後製編輯單元82包括一個影音編輯設定模組821、一個聲音擷取模組823，及一個編輯整合模組824。該影音編輯設定模組821會控制該電子裝置900顯示一個影音編輯介面822，該影音編輯介面822可供操作以將該影音資料之該影像檔依時間區分成多個影像區段，該等個影像區段的時間長度可相同也可不同，該等影像區段的起迄時間可局部重疊或完全不重疊。此外，該影音編輯介面822還可供操作以針對每一個影像區段個別選擇設定要被同步播放輸出的聲音檔及/或該背景音訊檔，每一影像區段可被設定一個聲音檔、多個聲音檔及/或該背景音訊檔。

該聲音擷取模組823會根據每一影像區段之起訖時間，對每一影像區段被設定之每一聲音檔及/或該背景音訊檔進行相同時間區段的聲音擷取以得到一個聲音片段資料。該編輯整合模組824會將該影像檔，及該影像檔之每一影像區段對應的所有聲音片段資料進行時間同步處理與整合以建立一個影音播放檔。

本發明之該影音錄製裝置100與該影音編輯播放系統800使用時，可將該影音編輯播放系統800安裝在一電子裝置900，並使該影音錄製裝置100訊號連接該電子裝置900。

當啟動該影音錄製裝置100錄製該影音資料時，該錄製管控單元71會於該顯示器5顯示輸出該影像擷取器3當前擷取之影像檔，並將該影像檔的水平視野範圍區分成多個拾音區域。此時，使用者可根據該影像檔所存在之所有要被收音對像所對應的拾音區域，或者是想要進行收音的拾音區域，透過操作該啟動設定介面714來選擇設定對應的麥克風陣列41。該錄製管控單元71會於控制啟動該影像擷取器3以開始錄影產生一影像檔時，同步控制啟動所有被選擇設定要啟動的麥克風陣列41與該全向性麥克風42進行收音，被啟動的每一麥克風陣列41會收音產生該聲音檔，該全向性麥克風42會收音產生該背景音訊檔。

該影音建檔單元72會對所有聲音檔進行語音增強訊號處理，並對該影像檔、所有聲音檔與該背景音訊檔進行時間同步處理。然後，彙整該影像檔、所有聲音檔與該背景音訊檔以建立該影音資料，且將該影音資料傳送至該電子裝置900。

接著，使用者可操作該電子裝置900以啟動該影音編輯播放系統800，使該影音輸出控制單元81控制該電子裝置900播放輸出該影音資料，且在該影像檔播放期間，使用者可隨時透過操作該音軌選擇介面813以選擇設定當前要隨該影像檔同步輸出的聲音檔及/或背景音訊檔，例如僅想聽到某一個人的聲音、某一個拾音區域的聲音，及/或該背景環境聲音。該影音輸出控制單元81會根據該影像檔當前播放時間，控制該電子裝置900同步播放輸出被選擇之所有聲音檔及/或該背景音訊檔內容。

當使用者要對該影音資料進行編輯處理時，可操作啟動該影音後製編輯單元82，並透過該影音編輯設定模組821之該影音編輯介面822將該影像檔區分為多個影像區段，且針對每一個影像區段選擇設定一個或多個聲音檔，及/或選擇設定該背景音訊檔。該聲音擷取模組823會根據每一影像區段的起訖時間，對對應之每一聲音檔及/或該背景音訊檔進行相同時間區段的聲音擷取以得到該聲音片段資料。該編輯整合模組824會將該影像檔及所有聲音片段資料進行時間同步處理，並彙整建立一個影音播放檔。

綜上所述，透過該影音錄製裝置100能在進行影像擷取以建立該影像檔的同時，也以該等麥克風陣列41分別對該影像檔之該水平視野範圍的多個拾音區域同步進行指向性收音的設計，由於該等聲音檔是分別對應該等拾音區域，使得所建立的該影音資料會具有多個可供個別選擇編輯與輸出的聲音檔，可改善目前影音錄製設備的影音錄製缺點。

並可進一步透過實施在該電子裝置900的該影音編輯播放系統800設計，方便使用者在控制該電子裝置900播放該影音資料的同時，隨時選擇調整當前要被播放輸出的聲音檔。而當需要配合該影音資料之該影像檔對所有聲音檔進行後製編輯處理時，則可選擇啟動該影音後製編輯單元82，以針對該影像檔之每一個影像區段個別設定要同步輸出的聲音檔及/或背景音訊檔，所以可方便使用者針對每一個影像區段選擇設定想要聆聽的聲音內容，藉以建立具有專屬聲音檔編排配置的該影音播放檔。因此，本發明影音錄製系統確實是一種相當創新且方便實用的創作，確實能達成本發明的目的。

惟以上所述者，僅為本發明的實施例而已，當不能以此限定本發明實施的範圍，凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾，皆仍屬本發明專利涵蓋的範圍內。

100:影音錄製裝置 2:機殼 3:影像擷取器 4:拾音器 41:麥克風陣列 42:全向性麥克風 5:顯示器 6:通訊器 7:處理器 71:錄製管控單元 711:錄影控制模組 712:錄音控制模組 713:同步管控模組 714:啟動設定介面 72:影音建檔單元 721:語音增強處理模組 722:建檔處理模組 800:影音編輯播放系統 81:影音輸出控制單元 811:影像播放控制模組 812:聲音輸出設定模組 813:音軌選擇介面 814:聲音播放控制模組 82:影音後製編輯單元 821:影音編輯設定模組 822:影音編輯介面 823:聲音擷取模組 824:編輯整合模組 900:電子裝置

本發明的其他的特徵及功效，將於參照圖式的實施方式中清楚地呈現，其中：圖1是本發明影音錄製裝置的一實施例安裝在一個電子裝置使用時的立體示意圖；圖2是該實施例之不完整的立體圖；圖3是該實施例的不完整的俯視圖；圖4是該實施例的功能方塊圖；及圖5是本發明影音編輯播放系統的一個實施例的功能方塊圖。

100:影音錄製裝置

2:機殼

3:影像擷取器

4:拾音器

41:麥克風陣列

42:全向性麥克風

5:顯示器

900:電子裝置

Claims

一種影音錄製裝置，適用於訊號連接一電子裝置，包含：一個機殼；一個影像擷取器，安裝在該機殼，可被控制啟動而朝該機殼前方一水平視野範圍進行錄影以得到一個影像檔；一個通訊器，可透過有線通訊技術及/或無線通訊技術接收該電子裝置發送的一個控制訊號；一個拾音器，包括多個安裝在該機殼的麥克風陣列，該等麥克風陣列可被控制啟動，而分別朝該水平視野範圍中之多個水平排列的拾音區域進行指向性收音，以得到多個聲音檔；及一個處理器，設置在該機殼且訊號連接該影像擷取器與該拾音器，包括一個可被該控制訊號觸發而同步啟動該影像擷取器與其中至少兩個對應之麥克風陣列的錄製管控單元，及一個會對該影像檔與被啟動之該等麥克風陣列的該等聲音檔進行時間同步處理以建立一個影音資料的影音建檔單元。
如請求項1所述的影音錄製裝置，其中，錄製管控單元包括一個用以控制啟動該影像擷取器之錄影控制模組、多個分別訊號連接該等麥克風陣列且用以分別控制啟動該等麥克風陣列的錄音控制模組，及一個訊號連接該等錄音控制模組與該錄影控制模組的同步管控模組，該同步管控模組可被觸發而同步控制啟動該錄影控制模組與其中至少二個錄音控制模組。
如請求項2所述的影音錄製裝置，其中，該同步管控模組具有一個可供操作以選擇設定要被控制啟動的每一錄音控制模組的啟動設定介面，該同步管控模組是同步控制啟動該錄影控制模組，及該啟動設定介面被設定要啟動的所有錄音控制模組。
如請求項3所述的影音錄製裝置，還包含一個設置在該機殼且用以顯示該啟動設定介面以供操作的顯示器。
如請求項2所述的影音錄製裝置，其中，該拾音器還包括一個可被啟動而對該影像擷取器前方進行全向性收音，以得到一個背景音訊檔的全向性麥克風，該錄製管控單元還包括另一訊號連接該全向性麥克風，且可被該同步管控模組控制以啟動該全向性麥克風的錄音控制模組，該同步管控模組可被觸發而控制該影像擷取器、該全向性麥克風與其中至少二個麥克風陣列同步啟動，該影音建檔單元會對影像檔、該等聲音檔與該背景音訊檔進行時間同步處理以建立該影音資料。
如請求項5所述的影音錄製裝置，其中，該影音建檔單元包括一個會對每一聲音檔進行語音訊號增強之訊號處理的語音增強處理模組，及一個建檔處理模組，該建檔處理模組會對該背景音訊檔、該語音增強處理模組處理後之該等聲音檔與該影像檔進行時間同步處理以建立該影音資料。
如請求項1或2所述的影音錄製裝置，其中，該影音建檔單元包括一個會對每一聲音檔進行語音訊號增強之訊號處理的語音增強處理模組，及一個建檔處理模組，該建檔處理模組會對該語音增強處理模組處理後之該等聲音檔與該影像檔進行時間同步處理以建立該影音資料。
一種影音編輯播放系統，適用於程式化建構在一電子裝置，可用以控制該電子裝置播放請求項1~7任一項所述之該影音資料，該影音編輯播放系統包含：一個影音輸出控制單元，包括，一個影像播放控制模組，用以控制該電子裝置播放顯示該影音資料之該影像檔，一個聲音輸出設定模組，用以控制該電子裝置顯示一個音軌選擇介面，該音軌選擇介面可供操作以選擇該影音資料中的其中至少一個聲音檔，及一個聲音播放控制模組，會根據該影像檔當前被播放的時間點，控制該電子裝置同步播放輸出該音軌選擇介面當前被選擇之該至少一聲音檔；及一個影音後製編輯單元，包括一個影音編輯設定模組、一個聲音擷取模組，及一個編輯整合模組，該影音編輯設定模組可用以控制該電子裝置顯示一個影音編輯介面，該影音編輯介面可供操作以依時間將該影像檔區分成多個影像區段，並可供操作以針對每一個影像區段設定至少一個要同步播放輸出的聲音檔，該聲音擷取模組會根據該每一影像區段之起迄時間，對該影像區段被設定之每一聲音檔進行相同起迄時間範圍的聲音擷取以得到一個聲音片段資料，該編輯整合模組會將該影像檔，及該影像檔之每一影像區段所對應的所有聲音片段資料進行時間同步處理以建立一個影音播放檔。