TWI704805B - Video editing method and device - Google Patents
Video editing method and device Download PDFInfo
- Publication number
- TWI704805B TWI704805B TW108117520A TW108117520A TWI704805B TW I704805 B TWI704805 B TW I704805B TW 108117520 A TW108117520 A TW 108117520A TW 108117520 A TW108117520 A TW 108117520A TW I704805 B TWI704805 B TW I704805B
- Authority
- TW
- Taiwan
- Prior art keywords
- video
- sub
- target sub
- segment
- segments
- Prior art date
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
一種影片編輯方法,由一影片編輯裝置來實施,該影片編輯裝置儲存有一影片,該影片包括一演講者,該影片編輯方法包含以下步驟:(A)根據該影片的音訊獲得多個目標子影片段落;(B)根據該等目標子影片段落的內容將該等目標子影片段落進行排序;(C)根據該等目標子影片段落的排序,從該等目標子影片中篩選出多個待合成子影片段落;及(D)將該等待合成子影片段落合成,以產生一合成影片。此外,本發明還提供一種影片編輯裝置。A video editing method is implemented by a video editing device. The video editing device stores a video including a speaker. The video editing method includes the following steps: (A) Obtain multiple target sub-videos based on the audio of the video Paragraphs; (B) sort the target sub-video segments according to the content of the target sub-video segments; (C) filter out multiple target sub-videos to be synthesized according to the order of the target sub-video segments Sub-video segment; and (D) synthesize the sub-video segment waiting to be synthesized to generate a composite video. In addition, the present invention also provides a video editing device.
Description
本發明是有關於一種影片編輯方法,特別是指一種用於編輯演講影片或教學影片的影片編輯方法。The present invention relates to a video editing method, in particular to a video editing method used for editing lecture videos or teaching videos.
隨著數位時代的來臨,影片可以更方便地儲存、傳輸和流通,因此,現有許多影音平台提供演講影片或教學影片,供大眾觀看學習。With the advent of the digital age, videos can be stored, transmitted and circulated more conveniently. Therefore, many existing audio-visual platforms provide speech videos or teaching videos for the public to watch and learn.
然而,一段完整的演講或教學影片的內容會有高低起伏,有時候影片過於冗長,會使觀看者觀看的興致降低,若需要找到影片中演說者的亮點與主要說話的畫面,擷取影片中精華的部分,則通常必須經過影片編輯者通過長時間的篩選出精彩片段,再加以後製成精彩片段影片,非常費時,再者,所篩選出之精彩片段,往往是影片編輯者之單向主觀認定,因此也可能會遺漏其他關鍵精彩片段,而無法客觀地呈現精彩片段影片。However, the content of a complete speech or instructional video will fluctuate. Sometimes the video is too long, which will make the viewer less interested in watching. If you need to find the highlights of the speaker and the main speaking screen in the video, capture the video For the essence part, it is usually necessary for the film editor to filter out the highlights for a long time, and then make the highlight film, which is very time-consuming. Moreover, the selected highlights are often one-way for the film editor. Subjectively determined, so other key highlights may be missed, and the highlight film cannot be presented objectively.
因此,本發明的目的,即在提供一種能提高影片編輯效率且能客觀呈現的影片編輯方法。Therefore, the purpose of the present invention is to provide a video editing method that can improve the efficiency of video editing and can be objectively presented.
於是,本發明影片編輯方法,由一影片編輯裝置來實施,該影片編輯裝置儲存有一影片,該影片包括一演講者,該影片編輯方法,包含一步驟(A)、一步驟(B)、一步驟(C),及一步驟(D)。Therefore, the video editing method of the present invention is implemented by a video editing device that stores a video, the video includes a speaker, and the video editing method includes one step (A), one step (B), one Step (C), and one step (D).
在該步驟(A)中,該影片編輯裝置根據該影片的音訊獲得多個目標子影片段落。In this step (A), the video editing device obtains a plurality of target sub-video segments according to the audio of the video.
在該步驟(B)中,該影片編輯裝置根據該等目標子影片段落的內容將該等目標子影片段落進行排序。In the step (B), the video editing device sorts the target sub-video segments according to the content of the target sub-video segments.
在該步驟(C)中,該影片編輯裝置根據該等目標子影片段落的排序,從該等目標子影片中篩選出多個待合成子影片段落。In the step (C), the video editing device selects multiple sub-video segments to be synthesized from the target sub-videos according to the order of the target sub-video segments.
在該步驟(D)中,該影片編輯裝置將該等待合成子影片段落合成,以產生一合成影片。In the step (D), the video editing device synthesizes the sub-video segments waiting to be synthesized to generate a synthesized video.
本發明的目的,即在提供一種能提高影片編輯效率且能客觀呈現的影片編輯裝置。The purpose of the present invention is to provide a video editing device that can improve the efficiency of video editing and can present objectively.
於是,該影片編輯裝置,包含一儲存單元及一處理單元。Therefore, the video editing device includes a storage unit and a processing unit.
該儲存單元,儲存有一影片,該影片包括一演講者。The storage unit stores a video, and the video includes a speaker.
該處理單元電連接該儲存單元,該處理單元根據該影片的音訊獲得多個目標子影片段落,再根據該等目標子影片段落的內容將該等目標子影片段落進行排序,接著根據該等目標子影片段落的排序,從該等目標子影片中篩選出多個待合成子影片段落,最後將該等待合成子影片段落合成,以產生一合成影片。The processing unit is electrically connected to the storage unit. The processing unit obtains a plurality of target sub-video segments according to the audio information of the video, and then sorts the target sub-video segments according to the content of the target sub-video segments, and then according to the targets The sequence of the sub-video segments is to filter out multiple sub-video segments to be synthesized from the target sub-videos, and finally synthesize the sub-video segments to be synthesized to generate a synthesized video.
本發明之功效在於:藉由該影片編輯裝置根據該等目標子影片段落的內容將該等目標子影片段落進行排序,並根據該等目標子影片段落的排序,從該等目標子影片中篩選出該等待合成子影片段落,以提高影片編輯效率,並能客觀地呈現精彩片段影片。The effect of the present invention is that the video editing device sorts the target sub-video segments according to the content of the target sub-video segments, and filters the target sub-videos according to the order of the target sub-video segments The waiting to be synthesized sub-movie paragraphs are generated to improve the efficiency of movie editing and present the highlight movie objectively.
在本發明被詳細描述前,應當注意在以下的說明內容中,類似的元件是以相同的編號來表示。Before the present invention is described in detail, it should be noted that in the following description, similar elements are represented by the same numbers.
參閱圖1,本發明影片編輯裝置100的一實施例,包含一儲存單元11、及一電連接該儲存單元11的處理單元12。該儲存單元11儲存有一影片,該影片包括一演講者。Referring to FIG. 1, an embodiment of a
參閱圖1與圖2,說明本發明影片編輯裝置100如何執行本發明金流關係圖產生方法之一實施例。Referring to FIGS. 1 and 2, it will be described how the
在步驟201中,該處理單元12濾除該影片中一預定頻率區間外的聲音,值得注意的是,在本實施例中,該預定頻率區間例如500Hz到2000Hz的非人聲頻率,以去除背景音及雜音,但不以此為限。In
在步驟202中,該處理單元12根據該影片的音訊將該影片分割成多個影片段落,在本實施例中,該處理單元12對音訊進行語音活性檢測(Voice Activity Detection)在不切斷完整語音段落的前提下進行分割,其主要方式係音波間的時間間隔小於一預定時間(例如3秒)時表示同一段話,視為同一個影片段落。In
在步驟203中,該處理單元12根據該等影片段落的音訊從該等影片段落篩選出該等感興趣影片段落,其中,篩選出的該等感興趣影片段落的影片長度大於一第一預定時段(例如6秒)。In
在步驟204中,對於每一感興趣影片段落,該處理單元12將該感興趣影片段落進行語音辨識,以獲得一文字檔。In
在步驟205中,對於每一感興趣影片段落,該處理單元12根據該感興趣影片段落所對應的該文字檔將該感興趣影片段落分割成多個包括完整句子且影片長度小於一第二預定時段(例如30秒)的候選子影片段落,每一候選子影片段落對應一子文字檔。值得注意的是,在本實施例中,該處理單元12係利用自然語言處理(Natural Language Processing)對該文字檔進行分詞,以獲得該等候選子影片段落,在其他實施方式中,亦可利用Bi-LSTM-CRF模型或深度學習模型對該文字檔進行分詞,不以此為限。In
搭配參閱圖3,由音波圖可知,該處理單元12根據該影片的音訊將該影片分割成多個影片段落A、B、C,其中該等影片段落A、B、C的音波間的時間間隔大於等於該預定時間,且該等影片段落A、B、C的影片長度皆大於該第一預定時段,故皆為感興趣影片段落,該處理單元12再根據該感興趣影片段落A對應的文字檔,將感興趣影片段落A分割成多個候選子影片段落A1、A2、A3,根據該感興趣影片段落B對應的文字檔,將感興趣影片段落B分割成多個候選子影片段落B1、B2、B3,根據該感興趣影片段落C對應的文字檔,將感興趣影片段落A分割成多個候選子影片段落C1、C2。With reference to FIG. 3, it can be seen from the sound wave diagram that the
在步驟206中,從該等感興趣影片段落所對應的候選子影片段落篩選出該等目標子影片段落。搭配參閱圖4,步驟206包括子步驟61、62,以下說明步驟61、62。In
在步驟61中,對於每一候選子影片段落,該處理單元12根據該候選子影片段落所對應的該子文字檔將對應有子文字檔包括連續重複一預定次數(例如3次)之字詞的候選子影片段落刪除。In
在步驟62中,對於每一未刪除的候選子影片段落,該處理單元12將對應有響度大於一預定分貝(例如90分貝)的候選子影片段落刪除。In
要特別注意的是,在本實施例中步驟61在步驟62之前,在其他實施方式中,步驟62亦可在步驟61之前,不以此為限。It should be particularly noted that in this embodiment,
在步驟207中,該處理單元12根據該等目標子影片段落的內容將該等目標子影片段落進行排序。搭配參閱圖5,步驟207包括子步驟71~80,以下說明步驟71~80。In
在步驟71中,對於該等目標子影片段落的每一影像,該處理單元12獲得該影像中相關於該演講者的多個第一臉部特徵點(例如眼睛、鼻子、嘴巴、左側鬢角、右側鬢角等),以確定該演講者的臉部在影像中的位置範圍。值得注意的是,在本實施例中,該處理單元12係使用開源的OpenCV作為抓取該等第一臉部特徵點的工具,利用該等第一臉部特徵點算出臉部的角度及範圍,並在使用前提供大量的資料訓練其準確度,但不以此為限。In
在步驟72中,對於每一目標子影片段落,該處理單元12根據該目標子影片段落的所有第一臉部特徵點判定出相關於該演講者的臉部處於該目標子影片段落的一臉部位置狀態,其中該臉部位置狀態指示出一置中狀態及一非置中狀態。值得注意的是,在本實施例中,對於每一影像,當該演講者的臉部範圍的長與寬在影像所佔的比例在一預定範圍(例如40%~70%)內,且該演講者的臉部在影像中的位置範圍距離影像的每一邊緣的距離佔影像的比例大於等於一預設值(例如(100%-長寬比平均)*k%)時,其中0<k<1,該處理單元12視該影像為臉部置中,而對於每一目標子影片段落,視該為臉部置中的影像幀數大於視該為臉部非置中的影像幀數時,該目標子影片段落的該臉部位置狀態指示出置中狀態,但不以此為限。In
搭配參閱圖6,舉例來說,在其中一影像中長為X,寬為Y,該演講者的臉部在影像中的距離影像的左側邊緣為x
1,距離影像的右側邊緣為x
3,距離影像的上側邊緣為y
1,距離影像的下側邊緣為y
3,該演講者的臉部在影像中的長度為x
2,寬度為y
2,則當x
2/X及y
2/Y在該預定範圍內,且x
1/X、x
3/X、y
1/Y、y
3/Y皆大於等於該預設值時,該處理單元12視該影像為臉部置中。
Refer to Figure 6 together. For example, in one of the images, the length is X and the width is Y. The distance of the speaker’s face in the image is x 1 from the left edge of the image and x 3 from the right edge of the image. The upper edge of the distance image is y 1 and the lower edge of the distance image is y 3. The length of the speaker’s face in the image is x 2 and the width is y 2 , then when x 2 /X and y 2 /Y When within the predetermined range and x 1 /X, x 3 /X, y 1 /Y, and y 3 /Y are all greater than or equal to the preset value, the
在步驟73中,該處理單元12根據該等目標子影片段落對應的臉部位置狀態排序該等目標子影片段落。值得注意的是,在本實施例中,該處理單元12將該等目標子影片段落分成2群,該臉部位置狀態指示出該置中狀態的目標子影片段落分成一群排序在前,該臉部位置狀態指示出該非置中狀態的目標子影片段落分成另一群排序在後,如下表1。
表1
在步驟74中,對於該等目標子影片段落的每一影像,該處理單元12獲得該目標子影片段落中相關於該演講者的多個第二臉部特徵點。值得注意的是,在本實施例中,該處理單元12是利用例如臉部動作編碼系統(Facial Action Coding System,FACS)的概念,利用OpenCV抓取該等第二臉部特徵點,但不以此為限。In
在步驟75中,對於每一目標子影片段落,該處理單元12根據該目標子影片段落的所有第二臉部特徵點,判定出相關於該演講者的一表情情緒狀態,其中該表情情緒狀態指示出一正向狀態、一一般狀態,及一負面狀態之其中一者。值得注意的是,在本實施例中,若該處理單元12根據該等第二臉部特徵點辨識出該演講者眼睛皆睜開且嘴角上揚,則判定出該表情情緒狀態指示出該正向狀態;若該處理單元12根據該等第二臉部特徵點辨識出該演講者眼睛皆睜開且嘴角平齊,則判定出該表情情緒狀態指示出該一般狀態;若該處理單元12根據該等第二臉部特徵點辨識出該演講者眼睛閉眼且嘴角向下,則判定出該表情情緒狀態指示出該負面狀態,但不以此為限。In
在步驟76中,該處理單元12根據該等目標子影片段落對應的表情情緒狀態排序該等目標子影片段落。值得注意的是,在本實施例中,該處理單元12將該等目標子影片段落分成5群,依序分別為該臉部位置狀態指示出該置中狀態且該表情情緒狀態指示出該正面狀態的目標子影片段落、該臉部位置狀態指示出該置中狀態且該表情情緒狀態指示出該一般狀態的目標子影片段落、該臉部位置狀態指示出該非置中狀態且該表情情緒狀態指示出該正面狀態的目標子影片段落、該臉部位置狀態指示出該非置中狀態且該表情情緒狀態指示出該一般狀態的目標子影片段落、及該表情情緒狀態指示出該負面狀態的目標子影片段落,如下表2。
表2
在步驟77中,對於該等目標子影片段落的每一影像,該處理單元12獲得該影像中相關於該演講者的多個肢體特徵點。In
在步驟78中,對於每一目標子影片段落,根據該目標子影片段落的所有肢體特徵點,判定出相關於該演講者的一肢體情緒狀態,其中該肢體情緒狀態指示出一正向狀態、一一般狀態,及一負面狀態之其中一者。值得注意的是,在本實施例中,該處理單元12係先根據每一目標子影片段落所有肢體特徵點判定出該演講者於每一幀影像的肢體位置,再由該等肢體位置判定出該肢體情緒狀態,若該演講者高舉雙手、高舉單手、正常速度移動,則該處理單元12判定出該肢體情緒狀態指示出該正向狀態;若該演講肢體軀幹歪斜、肢體軀幹異常晃動、肢體軀幹移動速度過快,則該處理單元12判定出該肢體情緒狀態指示出該負向狀態;其他情形該處理單元12則判定出該肢體情緒狀態指示出該一般狀態,其中高舉雙手、高舉單手、肢體軀幹歪斜等可以通過識別主要肢體特徵點位置(例如肩部、手肘等)來進行判定,而正常移動速度、移動速度過快、異常晃動等可以通過特定肢體特徵點(例如肢體軀幹)的移動速度來進行判定,但不以此為限。In
在步驟79中,該處理單元12根據該等目標子影片段落對應的肢體情緒狀態排序該等目標子影片段落。值得注意的是,在本實施例中,該處理單元12將該等目標子影片段落分成9群,依序分別為該臉部位置狀態指示出該置中狀態且該表情情緒狀態指示出該正面狀態且該肢體情緒狀態指示出該正面狀態的目標子影片段落、該臉部位置狀態指示出該置中狀態且該表情情緒狀態指示出該正面狀態且該肢體情緒狀態指示出該一般狀態的目標子影片段落、該臉部位置狀態指示出該置中狀態且該表情情緒狀態指示出該一般狀態的目標子影片段落且該肢體情緒狀態指示出該正面狀態的目標子影片段落、該臉部位置狀態指示出該置中狀態且該表情情緒狀態指示出該一般狀態的目標子影片段落且該肢體情緒狀態指示出該一般狀態的目標子影片段落、該臉部位置狀態指示出該非置中狀態且該表情情緒狀態指示出該正面狀態且該肢體情緒狀態指示出該正面狀態的目標子影片段落、該臉部位置狀態指示出該非置中狀態且該表情情緒狀態指示出該正面狀態且該肢體情緒狀態指示出該一般狀態的目標子影片段落、該臉部位置狀態指示出該非置中狀態且該表情情緒狀態指示出該一般狀態且該肢體情緒狀態指示出該正面狀態的目標子影片段落、該臉部位置狀態指示出該非置中狀態且該表情情緒狀態指示出該一般狀態且該肢體情緒狀態指示出該一般狀態的目標子影片段落、及該表情情緒狀態指示出該負面狀態或該肢體情緒狀態指示出該負面狀態的目標子影片段落,如下表3。
表3
在步驟80中,該處理單元12根據每一目標子影片段落所對應的子文字檔中相關於至少一預定字詞(例如關鍵字詞、同義字詞)的出現次數來排序該等目標子影片段落。值得注意的是,在本實施例中,該處理單元12係分別對9個群組進行排序,對應的子文字檔中該至少一預定字詞的出現次數越多的目標子影片段落順序越前(若出現次數相同則以影片長度越長者越前),如下表4。
表4
要特別注意的是,在其他實施方式中,步驟71~73可在步驟74~76或步驟77~79之後,步驟74~76可在步驟77~79之後,不以此為限,根據執行步驟順序不同,所獲得的排序亦不相同。It should be particularly noted that in other embodiments, steps 71 to 73 can be after
在步驟208中,該處理單元12根據該等目標子影片段落的排序,從該等目標子影片中篩選出多個待合成子影片段落,其中,該等待合成子影片段落的影片長度總和低於一第三預定時段(例如60秒)。值得注意的是,在本實施例中,該等待合成子影片段落分別屬於不同的感興趣影片段落,但不以此為限。In
在步驟209中,該處理單元12將該等待合成子影片段落合成,以產生一合成影片。In
綜上所述,本發明影片編輯方法及裝置,藉由該影片編輯裝置100的該處理單元12根據該等目標子影片段落的內容將該等目標子影片段落進行排序,並根據該等目標子影片段落的排序,從該等目標子影片中篩選出該等待合成子影片段落,以提高影片編輯效率,並能客觀地呈現精彩片段影片,故確實能達成本發明的目的。To sum up, in the video editing method and device of the present invention, the
惟以上所述者,僅為本發明的實施例而已,當不能以此限定本發明實施的範圍,凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾,皆仍屬本發明專利涵蓋的範圍內。However, the above are only examples of the present invention. When the scope of implementation of the present invention cannot be limited by this, all simple equivalent changes and modifications made in accordance with the scope of the patent application of the present invention and the content of the patent specification still belong to Within the scope of the patent for the present invention.
100:影片編輯裝置100: Video editing device
11:儲存單元11: storage unit
12:處理單元12: Processing unit
201~209:步驟201~209: Steps
61、62:步驟61, 62: steps
71~80:步驟71~80: steps
本發明的其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:
圖1是一方塊圖,說明本發明影片編輯裝置的一實施例;
圖2是一流程圖,說明本發明影片編輯方法的一實施例;
圖3是一示意圖,說明一影片分割成多個影片段落;
圖4是一流程圖,輔助說明圖2的步驟206的子步驟61、62;
圖5是一流程圖,輔助說明圖2的步驟207的子步驟71~80;及
圖6是一示意圖,說明判定一目標子影片段落的一影像的一臉部位置狀態。
Other features and effects of the present invention will be clearly presented in the embodiments with reference to the drawings, in which:
Figure 1 is a block diagram illustrating an embodiment of the video editing device of the present invention;
Figure 2 is a flowchart illustrating an embodiment of the film editing method of the present invention;
Figure 3 is a schematic diagram illustrating that a movie is divided into multiple movie segments;
Fig. 4 is a flowchart to assist in explaining
201~209:步驟 201~209: Steps
Claims (13)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910305049.0A CN109889920B (en) | 2019-04-16 | 2019-04-16 | Network course video editing method, system, equipment and storage medium |
CN201910305049.0 | 2019-04-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI704805B true TWI704805B (en) | 2020-09-11 |
TW202041037A TW202041037A (en) | 2020-11-01 |
Family
ID=66937500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108117520A TWI704805B (en) | 2019-04-16 | 2019-05-21 | Video editing method and device |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109889920B (en) |
TW (1) | TWI704805B (en) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110401869A (en) * | 2019-07-26 | 2019-11-01 | 歌尔股份有限公司 | A kind of net cast method, system and electronic equipment and storage medium |
CN110351579B (en) * | 2019-08-16 | 2021-05-28 | 深圳特蓝图科技有限公司 | Intelligent video editing method |
CN110650374B (en) * | 2019-08-16 | 2022-03-25 | 咪咕文化科技有限公司 | Clipping method, electronic device, and computer-readable storage medium |
CN110545408B (en) * | 2019-09-06 | 2021-01-26 | 苏州凌犀物联网技术有限公司 | Intelligent manufacturing display system and method based on intelligent service platform |
CN110650369B (en) * | 2019-09-29 | 2021-09-17 | 北京谦仁科技有限公司 | Video processing method and device, storage medium and electronic equipment |
CN111199210B (en) * | 2019-12-31 | 2023-05-30 | 武汉星巡智能科技有限公司 | Expression-based video generation method, device, equipment and storage medium |
CN111405197B (en) * | 2020-03-19 | 2022-11-08 | 京东科技信息技术有限公司 | Video clipping method, image processing method and device |
CN111901627B (en) * | 2020-05-28 | 2022-12-30 | 北京大米科技有限公司 | Video processing method and device, storage medium and electronic equipment |
CN111918122A (en) * | 2020-07-28 | 2020-11-10 | 北京大米科技有限公司 | Video processing method and device, electronic equipment and readable storage medium |
CN112532897B (en) * | 2020-11-25 | 2022-07-01 | 腾讯科技(深圳)有限公司 | Video clipping method, device, equipment and computer readable storage medium |
CN114697700B (en) * | 2020-12-28 | 2024-07-16 | 北京小米移动软件有限公司 | Video editing method, video editing device and storage medium |
CN112911332B (en) * | 2020-12-29 | 2023-07-25 | 百度在线网络技术(北京)有限公司 | Method, apparatus, device and storage medium for editing video from live video stream |
CN112866808B (en) * | 2020-12-31 | 2022-09-06 | 北京市商汤科技开发有限公司 | Video processing method and device, electronic equipment and storage medium |
CN113920534A (en) * | 2021-10-08 | 2022-01-11 | 北京领格卓越科技有限公司 | Method, system and storage medium for extracting video highlight |
CN116074574A (en) * | 2021-11-03 | 2023-05-05 | 腾讯科技(深圳)有限公司 | Video processing method, device, equipment and storage medium |
CN115567660B (en) * | 2022-02-28 | 2023-05-26 | 荣耀终端有限公司 | Video processing method and electronic equipment |
CN115734007B (en) * | 2022-09-22 | 2023-09-01 | 北京国际云转播科技有限公司 | Video editing method, device, medium and video processing system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102612707A (en) * | 2009-08-03 | 2012-07-25 | 印度孟买技术研究院 | System for creating a capsule representation of an instructional video |
CN106375695A (en) * | 2016-08-30 | 2017-02-01 | 百味迹忆(厦门)网络科技有限公司 | Audio/video scoring and storing method and device |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8856636B1 (en) * | 2009-09-22 | 2014-10-07 | Adobe Systems Incorporated | Methods and systems for trimming video footage |
CN103716661A (en) * | 2013-12-16 | 2014-04-09 | 乐视致新电子科技(天津)有限公司 | Video scoring reporting method and device |
CN105933181B (en) * | 2016-04-29 | 2019-01-25 | 腾讯科技(深圳)有限公司 | A kind of call time delay appraisal procedure and device |
CN106210902B (en) * | 2016-07-06 | 2019-06-11 | 华东师范大学 | A kind of cameo shot clipping method based on barrage comment data |
CN108924648B (en) * | 2018-07-17 | 2021-07-23 | 北京新唐思创教育科技有限公司 | Method, apparatus, device and medium for playing video data to a user |
CN109121021A (en) * | 2018-09-28 | 2019-01-01 | 北京周同科技有限公司 | A kind of generation method of Video Roundup, device, electronic equipment and storage medium |
-
2019
- 2019-04-16 CN CN201910305049.0A patent/CN109889920B/en active Active
- 2019-05-21 TW TW108117520A patent/TWI704805B/en active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102612707A (en) * | 2009-08-03 | 2012-07-25 | 印度孟买技术研究院 | System for creating a capsule representation of an instructional video |
CN106375695A (en) * | 2016-08-30 | 2017-02-01 | 百味迹忆(厦门)网络科技有限公司 | Audio/video scoring and storing method and device |
Also Published As
Publication number | Publication date |
---|---|
CN109889920B (en) | 2022-08-05 |
TW202041037A (en) | 2020-11-01 |
CN109889920A (en) | 2019-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI704805B (en) | Video editing method and device | |
US11894014B2 (en) | Audio-visual speech separation | |
Czyzewski et al. | An audio-visual corpus for multimodal automatic speech recognition | |
WO2022110354A1 (en) | Video translation method, system and device, and storage medium | |
WO2020237855A1 (en) | Sound separation method and apparatus, and computer readable storage medium | |
US11682401B2 (en) | Matching speakers to meeting audio | |
US10037313B2 (en) | Automatic smoothed captioning of non-speech sounds from audio | |
Mittal et al. | Animating face using disentangled audio representations | |
US20170287481A1 (en) | System and method to insert visual subtitles in videos | |
US8873861B2 (en) | Video processing apparatus and method | |
KR101492816B1 (en) | Apparatus and method for providing auto lip-synch in animation | |
WO2020147407A1 (en) | Conference record generation method and apparatus, storage medium and computer device | |
WO2023197979A1 (en) | Data processing method and apparatus, and computer device and storage medium | |
EP2324475A1 (en) | Robust media fingerprints | |
KR20070020252A (en) | Method of and system for modifying messages | |
CN1639738A (en) | Method and system for generating caricaturized talking heads | |
WO2022100691A1 (en) | Audio recognition method and device | |
JP2010011409A (en) | Video digest apparatus and video editing program | |
WO2022100692A1 (en) | Human voice audio recording method and apparatus | |
Lu et al. | Self-supervised audio spatialization with correspondence classifier | |
CN112330579B (en) | Video background replacement method, device, computer equipment and computer readable medium | |
Hegde et al. | Visual speech enhancement without a real visual stream | |
CN111970579A (en) | Video music adaptation method and system based on AI video understanding | |
CN117609548A (en) | Video multi-mode target element extraction and video abstract synthesis method and system based on pre-training model | |
CN117768597B (en) | Guide broadcasting method, device, equipment and storage medium |