TWI716033B

TWI716033B - 影像配樂智能系統

Info

Publication number: TWI716033B
Application number: TW108124933A
Authority: TW
Inventors: 李姿慧; 朱沛全; 陳玉璇; 陳克強
Original assignee: 李姿慧
Priority date: 2019-07-15
Filing date: 2019-07-15
Publication date: 2021-01-11
Also published as: US20210020149A1; CN112231499A; TW202105302A

Abstract

本發明係提供一種影像配樂智能系統，係一種根據色調、分鏡節奏、影像對白、長度與分類、導演特殊需求之影像分析模組及一種紀錄曲式、段落轉折、風格、旋律、情緒張力之音樂分析模組，再利用AI配對模組將上述影像分析模組之影像與音樂分析模組之音樂特徵做合適的配對，以快速完成影像配樂的創作選曲功能者。

Description

影像配樂智能系統

本發明係有關於一種影像配樂智能系統，特別是指一種透過AI配對將影像配樂之音樂編輯系統。

目前有關提供音樂資訊的歌手、音樂人、專輯製作人員、單曲製作人員、唱片公司或版權公司，在製作影像創作選曲時，由音樂人選曲或由影像單位或應用音樂單位自行選曲，通常是影片剪輯、製作人員如廣告公司、電影宣傳片製作、電影公司、影片製作學生、攝影師製作相片配樂、戲劇劇團、跳舞舞團、遊戲公司、網頁設計音樂、企業宣傳曲、活動背景音樂、活動現場演出、展演音樂、展覽音樂、互動設計音樂、AR/VR互動裝置音樂、多媒體影像配樂；或其餘音樂應用之單位被上述需應用到音樂公司委任選曲或作曲之音樂製作/配樂/錄音室/創作者/歌手、音樂人、專輯製作人員、單曲製作人員、唱片公司或版權公司/單位，而上述有音樂需求的使用者，譬如上述影像製作、戲劇創作等應用音樂單位，常會遇到音樂授權的種種問題，有時只是上傳給喜歡的影片到VouTube網站上，而產生侵權警告的行為，甚至遭到刪除帳號的制裁可能；而上述提供音樂資訊者欲尋找影像配樂及授權時，係相當地耗費時間，往往為了要找到一支好的影像配樂，得花上8小時至6個月的時間在選曲、試聽及尋找授權上，其中：在影像創作選曲單元，應用音樂創作者自行選曲每次約花5小時、委託製作每次約花5日、權利簽署時間過程係非常的繁瑣；在音樂買賣單元，所花費的時間每次約花5小時、權利簽署的時間約6個月、權利金的分配，有很多狀況並沒有分配，最多僅可獲得60%的權利金，可獲得權利金的平均數約10~20%左右，因此如何提供一種讓影像人製作影像配樂時或劇團行戲劇創作時，能大幅度縮短影像創作選曲的時間以及音樂買賣授權簽署的時間，乃是眾多音樂應用者或影像創作者較希望解決的問題。

本發明人有鑑於此，於是精心研究並再三研究改良，如今終於發明出一種影像配樂智能系統，可以摒除目前有關找尋音樂授權的單位，如影像製作單位、劇團等，在製作影像創作選曲時，常會遇到音樂種種的問題，進而提供產業上的利用價值者。

鑒於以上的問題，本發明的主要目的在於提供一種影像配樂智能系統，係利用AI配對模組連結影像分析模組及音樂分析模組，運用影像與音樂特徵做合適的配對，可推薦數首歌曲來做配對，若不滿意時，亦可重新推薦其他歌曲來做配對，以智能配對快速地達到影像創作選曲之目的。

為達上述目的，本發明採用如下的技術手段：一種影像配樂智能系統，該系統係包含：一影像分析模組，係根據色調、分鏡節奏、影像對白、長度與分類、導演特殊需求與特徵來做分析；一音樂分析模組，係根據記錄曲式、段落轉折、風格、旋律、速度、樂器、和弦伴奏、聲部、節奏、音量及情緒張力來做分析；上述音樂分析與內容係包括有樂性分析、情緒分析及音樂特徵資訊；一AI配對模組，係連結影像分析模組及音樂分析模組，運用影像與音樂特徵做合適的配對；及一音樂編輯模組，係與AI配對模組連結，透過影片剪接、音樂剪貼串聯、音樂音量調整及音場模擬，將音樂與影像兩檔案之時間軸及撞擊點(Hit Point)完全對上。

為了讓貴審查委員對本發明有更進一步的了解，茲佐以圖式詳細說明本發明如下：

(10):影像分析模組

(20):音樂分析模組

(30):AI配對模組

(40):音樂編輯模組

(50):API端點區塊鏈智能合約

(100):影像配樂智能平台

第一圖：係本發明影像配樂智能系統之系統架構圖。

第二圖：係現行影像分析中之色彩分析示意圖。

第三圖：係現行影像分析中之色彩分析群類結構圖。

第四圖：係本發明影像配樂智能系統文字分析之情緒字典示意圖。

第五圖：係現行音樂分析中之情緒參數示意圖。

第六圖：係本發明影像配樂智能系統配樂參考資訊之示意圖。

第七圖：係本發明影像配樂智能系統配樂方式之流程圖。

第七之一圖：係本發明第七圖配樂架構之部分放大圖。

第八圖：係本發明影像配樂智能系統之另一系統架構圖。

第九圖：係本發明影像配樂智能系統之商業模式示意圖。

第十圖：係本發明影像配樂智能系統其他商業行為之示意圖。

第十一圖：係本發明影像配樂智能系統之影像配樂智能平台之介紹示意圖。

第十二圖：係本發明影像配樂智能系統之系統截圖示意圖。

請參閱第一圖所示，本發明影像配樂智能系統之系統架構圖，如圖所示，本發明之系統包含有影像分析模組10、音樂分析模組20、AI配對模組30及音樂編輯模組40。

其中影像分析模組10係根據色調、分鏡節奏、影像對白(如故事性或轉折詞等)、長度與分類、導演特殊需求與特徵來做分析；上述影像分析模組10中之影像內容分析係包括有：色彩分析、內容分析及人物表情分析，其中色彩分析請參閱第二圖所示，現行影像分析中之色彩分析示意圖，係分析在電影中的色彩功能、色彩數值及如第三圖所示現行影像分析中之色彩分析群類結構；內容分析係根據影像中場景、人物、物品、光線，來分辨人事時地物(如年代、地點、時間、劇情等)；人物表情分析係根據表情判斷影像中人物的情緒、劇情及可能的對話…等等；綜合以上影像內容分析，可以分別得到各種影像之向量值。上述影像分析模組10中處理分鏡節奏之分鏡檔分析係根據分鏡節奏的時間點做分析，之後再輸入模式，便於做鏡頭切換的時間點記錄、音樂與音效插入點的參考。上述分鏡檔分析所得到每個分鏡的秒數，係可針對每個分鏡內容做分析或對點的設計；而影像分析模組及音樂分析模組20的音效或配樂分析中之分鏡表，係可蒐集逐格分析的Word分鏡檔案與影片本身者。上述影像分析模組10中處理影像對白之人本分析係根據影像對白與劇本分析，處理影像對白找出故事性或刪去轉折詞，使得關鍵字清晰且以依附性(或影響力)來排列，等比例平均地找到相對應之情緒參數；請參閱第四圖所示，關於文字分析依據現有中文情緒字典做處理。上述影像分析模組10處理導演特殊需求時，係依據導演提出之特殊需求加權於結果之排序(此種因素影響的結果比例較大)。

音樂分析模組20係根據記錄曲式、段落轉折、風格、旋律、速度、樂器、和弦伴奏、聲部、節奏、音量及情緒張力來做分析，上述音樂分析模組20中之音樂分析與內容係包括有：樂性分析、情緒分析及音樂特徵資訊，其中樂性分析係分析音樂調性、器樂編曲結構、節奏、和弦、和弦進行、旋律音高、音階進行、風格、曲式、段落、樂句、歌詞句、曲風及其他音樂檔案資訊；情緒分析請參閱第五圖所示現行音樂分析中之情緒參數示意圖，係依據音樂內容，透過機器訓練、智能學習，記錄每首歌在不同時間點時之情緒參數(x，y)，該情緒參數之x軸(Valence)係為情緒正向與負面(數字正數為正向、負數為負向情緒)的數值，情緒參數之y軸(Arousal)係為情緒的激動程度。音樂資訊係依據歌手、音樂人、專輯製作人員、單曲製作人員、唱片公司、版權公司、OP、SP、區域團體、集管團體、著作權、合約關係等，記錄音樂長度、風格、檔案位置、公開區域、串流連結、下載連結、視聽連結、midi檔案、wav檔案及mp3檔案；另，音樂分析模組20中之參考音樂分析，係輸入偏愛的參考音樂、程式，將根據輸入之參考音樂做音樂分析，找到與資料庫分析結果相符之曲目。

請參閱第六圖所示，本發明配樂參考資訊之示意圖，本發明依照下列分鏡檔分析、文本分析、導演特殊需求、參考音樂分析、影像內容分析及音樂分析得到相對應數值，將影像與音樂兩者數值做對應相配。配合第七圖所示，本發明配樂方法之流程圖，本發明依照配樂常用的分類功能、分類，歸納出影像與音樂最終的結果，其中有關影像類型係根據故事調性來設定確認；主要依隨係根據想要配樂所欲強調的哪部分；如角色(包括角色性格、角色內心情感)、劇情、場景(包括地點或城市)、時間、動作對點等；畫面特殊需求係不依照影像內容進行之反向或平行作用力，如反向進行作用力、平行鋪墊(或隱喻性音樂)、欺騙或暗示觀眾、以音樂來做轉場連結等。

本發明主要特徵所述為AI配對模組30，該AI配對模組30係連結影像分析模組10及音樂分析模組20，運用影像與音樂特徵做合適的配對，實務上可推薦五首歌曲來做配對，不滿意時可重新推薦其他歌曲來做配對。音樂編輯模組40係與AI配對模組30連結，本發明透過影片剪接、音樂剪貼串聯、音樂音量調整及音場模擬，將音樂與影像兩檔案之時間軸及撞擊點(Hit Point)完全對上。上述音樂編輯模組40與音樂分析模組20之音效對點，所引用到的影片資料中，卡通音效係可以多一點，分析波形可以得到音效的插入點。

本發明訓練AI配對模組30引用到的影片資料如：YouTube-Movie、YouTube-movieclips、Roku Channel、Crackle、Dailymotion及愛奇藝網站…等。

請參閱第八圖所示，本發明影像配樂智能系統之另一系統架構圖，如圖所示，本發明之系統包含有影像分析模組10、音樂分析模組20、AI配對模組30、音樂編輯模組40。本發明影像配樂智能系統亦可運用API端點區塊鏈智能合約50連結音樂編輯模組40，來達到授權使用自由的功能；請參閱第九圖所示，本發明與音樂人簽訂的API端點區塊鏈智能合約50，協力將音樂販售給影像人，影像人則透過本發明影像配樂智能平台100完成結帳之商業行為；上述的音樂亦可為一片段或一分軌，假設該首歌的音樂是一個搖滾樂團的編制，該首歌內有電吉他聲、人聲、鼓聲或電貝斯聲，利用本發明影像配樂智能系統的程式，就能夠將該首歌單純的〝鼓聲〞或其他別首歌〝分軌〞的音樂或其他如電吉他〝分軌〞的音樂，一起融合到本發明影像配樂智能系統之程式裡做處理。請參閱第十圖所示，本發明影像智能平台100可以跟使用者(如：影像人)、科技商、音樂人(或音樂公司)、樂迷等完成影片(如：應用音樂)、媒體露出(如：廣告主)、下載音樂或串流音樂平台導流行銷等商業行為。請參閱第十一圖所示，本發明影像配樂智能平台100透過使用者可以輸入資訊，如：選擇要上傳的影片、選擇要上傳的分鏡檔、選擇要上傳的參考音樂或劇本文本與對白後，下一頁面可得到影像配樂與建議，使用者可直接觀看成果與購買音樂。

請參閱第十二圖所示，本發明系統截圖之示意圖，其中資料庫頁面中有關關鍵字搜尋係包括：名稱、曲風、風格、速度、樂器、相關的關鍵字、演唱者、情緒、封面照片等；音訊訊號之獨家功能係以視聽MP3、下載wav或下載MP3等格式；而有關授權與訂單上係以Loop、midi、音樂授權等估算訂單金額、下訂單、更新訂單、下載已購買的音樂等商業行為。

本發明AI配對模組30演算法之內容係包括：一篩選方式及一計分方式；其中篩選方式係以常態分佈標準差之範圍內，給予篩選與否之標準，其在68%可信任度內(一個標準差的誤差範圍內)的值是被允許的，該篩選的類別包括有曲風或情緒參數等。計分方式係將節奏、樂器編制、和弦、音樂情緒(x，y)、關鍵字情緒(x，y)、導演輸入資訊、影像主色調及影像內容等類別之內容作量化，以計算出每個項目的分數做加權平均。

綜上所述，本發明影像配樂智能系統，係一種專業的影像配樂智能平台，主要利用AI配對模組連結影像分析模組與音樂分析模組，運用影像與音樂特徵做合適的配對，影像公司多元登入，在選擇影片後，經由導演審核，只要在平台上透過API端點區塊鏈智能合約，音樂人、影像公司及版權公司便可快速地完成影像配樂的功能者。因而具有產上之應用價值者，而本發明又從未公諸於世或已見於其他刊物，實已符合專利法的規定，爰依法提出發明專利申請。

(10)‧‧‧影像分析模組

(20)‧‧‧音樂分析模組

(30)‧‧‧AI配對模組

(40)‧‧‧音樂編輯模組

Claims

一種影像配樂智能系統，該系統係包含：一影像分析模組，係根據色調、分鏡節奏、影像對白、長度與分類、導演特殊需求與特徵來做分析，其中影像分析模組中處理分鏡節奏之分鏡檔分析係根據分鏡節奏的時間點做分析，之後再輸入模式，便於做鏡頭切換的時間點記錄、音樂與音效插入點的參考，影像分析模組中處理影像對白之人本分析係根據影像對白與劇本分析，處理影像對白找出故事性或刪去轉折詞，使得關鍵字清晰且以依附性(或影響力)來排列，等比例平均找到相對應之情緒參數；一音樂分析模組，係根據記錄曲式、段落轉折、風格、旋律、速度、樂器、和弦伴奏、聲部、節奏、音量及情緒張力來做分析；上述音樂分析與內容係包括有樂性分析、情緒分析及音樂特徵資訊，其中音樂分析模組中之情緒分析係依據音樂內容，透過機器訓練、智能學習，記錄每首歌在不同時間點時之情緒參數(x，y)，其中情緒參數之x軸(Valence)係為情緒正向的數值，情緒參數之y軸(Arousal)係為情緒負面的激動程度；一AI配對模組，係連結影像分析模組及音樂分析模組，運用影像與音樂特徵做合適的配對，其中AI配對模組之篩選方式係以常態分佈標準差之範圍內，給予篩選與否之標準，其在68%可信任度內(一個標準差的誤差範圍內)的值是被允許的，該篩選的類別包括有曲風或情緒參數，AI配對模組之計分方式係將節奏、樂器編制、和弦、音樂情緒(x，y)、關鍵字情緒(x，y)、導演輸入資訊、影像主色調及影像內容等類別之內容作量化，以計算出每個項目的分數做加權平均；及一音樂編輯模組，係與AI配對模組連結，透過影片剪接、音樂剪貼串聯、音樂音量調整及音場模擬，將音樂與影像兩檔案之時間軸及撞擊點(Hit Point)完全對上。
如申請專利範圍第1項所述之影像配樂智能系統，其中影像分析模組包括有分析在電影中的色彩功能、色彩數值及色彩分析群類結構之色彩分析；根據影像中場景、人物、物品、光線，來分辨人事時地物之內容分析及依據表情判斷影像中人物的情緒、劇情及可能的對話之人物表情分析。
如申請專利範圍第1項所述之影像配樂智能系統，其中音樂分析模組中之樂性分析係分析音樂調性、器樂編曲結構、節奏、和弦、和弦進行、旋律音高、音階進行、風格、曲式、段落、樂句、歌詞句及其他音樂檔案資訊。
如申請專利範圍第1項所述之影像配樂智能系統，其中音樂分析模組中之音樂特徵資訊係依據歌手、音樂人、專輯製作人員、單曲製作人員、唱片公司、版權公司、OP、SP、區域團體、集管團體、著作權、合約關係等，記錄音樂長度、風格、檔案位置、公開區域、串流連結、下載連結、視聽連結、midi 檔案、wav檔案及mp3檔案。
如申請專利範圍第1項所述之影像配樂智能系統，其中AI配對模組演算法之內容係包括：一篩選方式及一計分方式。