TWI556226B - 音訊檔案合成方法及其所適用之音訊檔案合成系統 - Google Patents

音訊檔案合成方法及其所適用之音訊檔案合成系統 Download PDF

Info

Publication number
TWI556226B
TWI556226B TW103133621A TW103133621A TWI556226B TW I556226 B TWI556226 B TW I556226B TW 103133621 A TW103133621 A TW 103133621A TW 103133621 A TW103133621 A TW 103133621A TW I556226 B TWI556226 B TW I556226B
Authority
TW
Taiwan
Prior art keywords
audio file
hidden
volume
synthesizing
time point
Prior art date
Application number
TW103133621A
Other languages
English (en)
Other versions
TW201612894A (en
Inventor
常祥
黃宗慶
彭子謹
李昕倫
Original Assignee
威盛電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 威盛電子股份有限公司 filed Critical 威盛電子股份有限公司
Priority to TW103133621A priority Critical patent/TWI556226B/zh
Priority to CN201510037440.9A priority patent/CN104599666B/zh
Publication of TW201612894A publication Critical patent/TW201612894A/zh
Application granted granted Critical
Publication of TWI556226B publication Critical patent/TWI556226B/zh

Links

Description

音訊檔案合成方法及其所適用之音訊檔案合成系統
本發明係關於一種合成方法及其所適用之合成系統,尤指一種音訊檔案合成方法及其所適用之音訊檔案合成系統。
在資訊爆炸的年代,每日都有上億筆的資料在互相傳遞,資料也廣泛散佈在各地,而這些數位資料也因為容易被竊取或不正當的複製使用,使得人們更重視資料安全這一領域。
傳統的資料藏匿方法是透過數位簽章的方式針對影像、視訊、音頻進行加密,目前主流的資料藏匿方法的大致上如下:浮水印藏匿法、LSB藏匿法、小波轉換藏匿法…等等。
資料藏匿(Data Hiding)在目前的應用當中,時常被使用在資料傳輸時的一種應用,主要類別分成強健性(robust)與易碎性(fragile)兩類。強健性主要是為了保護傳輸中藏匿的資料不會被破壞,讓原本檔案被破壞了之後,還是可以將藏匿的資料解譯出來,主要應用是在安全性和保護智慧財產權。而易碎性是為了要查看原始檔案是否有被修改過,如果有修改過檔案的話,裡面藏匿的資料就會整個被破壞,使得資料藏匿的東西無法取出,通常應用都是在證明音訊的完整性,像是錄口供、偵查犯罪資料的用途。
針對強健性的類別,主要就是要保護傳輸隱匿的資料不會被 破壞,可將含有藏匿資料的音訊檔案加入一原始音訊檔案中,以讓藏匿資料可隨著原始音訊檔案傳播出去。或者,需要藏匿的資料本身就為音訊檔案,而讓藏匿資料可隨著原始音訊檔案傳播出去。而習知所採用的合成方法係將含有藏匿資料的音訊檔案分成多筆單位資料,並以固定間距時間將多筆單位資料分別加入原始音訊檔案中。舉例而言:每隔2秒就將含有藏匿資料的音訊檔案的一個單位資料加入原始音訊檔案中,以隨著原始音訊檔案傳播出去。雖然習知的合成方法確實可達到傳送含有藏匿資料的音訊檔案的功效,但是,由於習知係以固定間距時間的方式將一個單位資料加入原始音訊檔案中,一旦加入的時間點對應到原始音訊檔案的音量正處於低音量或是低振福的狀態時,人耳將會很清楚的察覺到含有藏匿資料的音訊檔案的雜音,而造成播放品質不佳的問題。
因此,如何發展一種音訊檔案合成方法及其所適用之音訊檔案合成系統,實為目前迫切需要解決之問題。
本案之主要目的在於提供一種音訊檔案合成方法及其所適用之音訊檔案合成系統,俾解決習知合成方法係以固定間距時間的方式將一個單位資料加入原始音訊檔案中,當加入的時間點對應到原始音訊檔案的音量正處於低音量或是低振幅的狀態時,人耳將會很清楚的察覺到含有藏匿資料的音訊檔案的雜音,而造成播放品質不佳等缺點。
為達上述目的,本案之一較廣義實施態樣為提供一種音訊檔案合成方法,用以將含有一藏匿資訊之一第一音訊檔案合成至一第二音訊檔案中,至少包含步驟:分析該第一音訊檔案,以設定一頻率範圍;根據介於該頻率範圍及大於一音量門檻值之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置;以及於該可藏入時間點附近將含有該藏匿資訊 之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案。
為達上述目的,本案之另一較廣義實施態樣為提供一種音訊 檔案合成方法,用以將含有一藏匿資訊之一第一音訊檔案合成至一第二音訊檔案中,至少包含步驟:分析該第一音訊檔案,以設定一頻率範圍;根據一單位搜尋時間及介於該頻率範圍之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置;以及於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案。
為達上述目的,本案之另一較廣義實施態樣為提供一種音訊 檔案合成方法,用以將含有一藏匿資訊之一第一音訊檔案合成至一第二音訊檔案中,至少包含步驟:分析該第一音訊檔案,以設定一頻率範圍;根據介於一音量區間及該頻率範圍之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置;以及於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案。
為達上述目的,本案之另一較廣義實施態樣為提供一種音訊 檔案合成系統,至少包含:一合成裝置,接收含有一藏匿資訊之一第一音訊檔案及一第二音訊檔案,包含:一分析部件,對該第一音訊檔案及該第二音訊檔案進行分析,以分別獲得一頻率範圍及一音量門檻值;一混合部件,於該第二音訊檔案之至少一個可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案,其中該可藏入時間點位置係根據介於該頻率範圍及大於該音量門檻值之條件所找出;一接收裝置,其係接收該第三音訊檔案並具有一應用程式,使該應用程式從該第三音訊檔案中獲取該藏匿資訊。
為達上述目的,本案之又一較廣義實施態樣為提供一種音訊 檔案合成系統,至少包含:一合成裝置,接收含有一藏匿資訊之一第一音訊檔案及一第二音訊檔案,包含:一分析部件,對該第一音訊檔案進行分析,以獲得一頻率範圍;一混合部件,於該第二音訊檔案之至少一個可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案,其中該可藏入時間點位置係根據一單位搜尋時間及介於該頻率範圍之條件所找出;以及一接收裝置,其係接收該第三音訊檔案並具有一應用程式,使該應用程式從該第三音訊檔案中獲取該藏匿資訊。
為達上述目的,本案之另一較廣義實施態樣為提供一種音訊檔案合成系統,至少包含:一合成裝置,接收含有一藏匿資訊之一第一音訊檔案及一第二音訊檔案,包含:一分析部件,對該第一音訊檔案進行分析,以獲得一頻率範圍;一混合部件,於該第二音訊檔案之至少一個可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案,其中該可藏入時間點位置係根據介於一音量區間及該頻率範圍之條件所找出;一接收裝置,其係接收該第三音訊檔案並具有一應用程式,使該應用程式從該第三音訊檔案中獲取該藏匿資訊。
1、2‧‧‧音訊檔案合成系統
11、21‧‧‧合成裝置
111、211‧‧‧分析部件
112‧‧‧混合部件
12‧‧‧接收裝置
121‧‧‧應用程式
AF1‧‧‧第一音訊檔案
AF2‧‧‧第二音訊檔案
AF3‧‧‧第三音訊檔案
S31-34、S41、S51、S61-64、S71-74‧‧‧音訊檔案合成步驟
S321、S322、S3231-S3233、S3241-S3242‧‧‧音量門檻值的設定步驟
A、A1‧‧‧波形區域
P‧‧‧波峰點
T、T1、T2‧‧‧可藏入時間點
t‧‧‧單位間隔藏入時間
B、C‧‧‧區域
圖1係為本案第一較佳實施例之音訊檔案合成系統之結構示意圖。
圖2係為本案第二較佳實施例之音訊檔案合成系統之結構示意圖。
圖3A係為本案第三較佳實施例之音訊檔案合成方法之流程圖。
圖3B、圖3C、圖3D、圖3E係為圖3A的步驟S32的音量門檻值設定方法之流程圖。
圖3F係為使用圖3A之流程於第二音訊檔案之波形中所找出的可藏入時 間點位置示意圖。
圖4A係為本案第四較佳實施例之音訊檔案合成方法之流程圖。
圖4B係為使用圖4A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖。
圖5A係為本案第五較佳實施例之音訊檔案合成方法之流程圖。
圖5B係為使用圖5A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖。
圖6A係為本案第六較佳實施例之音訊檔案合成方法之流程圖。
圖6B係為使用圖6A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖。
圖6C係為圖6B中B區域的放大示意圖。
圖7A係為本案第七較佳實施例之音訊檔案合成方法之流程圖。
圖7B係為使用圖7A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖。
圖7C係為圖7B中C區域的放大示意圖。
體現本案特徵與優點的一些典型實施例將在後段的說明中詳細敘述。應理解的是本案能夠在不同的態樣上具有各種的變化,其皆不脫離本案的範圍,且其中的說明及圖示在本質上係當作說明之用,而非用以限制本案。
請參閱圖1,其係為本案第一較佳實施例之音訊檔案合成系統之結構示意圖,如圖所示,本案之音訊檔案合成系統1可由合成裝置11及接收裝置12所組成,主要是透過聲音掩蓋法,於兩種音訊檔案混音時,可以將含有隱藏資訊的音訊檔案所發出的噪音給遮掩住。合成裝置11接收含有一藏匿資訊之第一音訊檔案AF1以及一第二音訊檔案AF2,且至少可包含 一分析部件111及一混合部件112,分析部件111與混合部件112電性連接。本案之分析部件111的實施態樣可為一音訊分析軟體或是一分析儀器,但不以此為限。
混合部件112則根據分析部件111的分析結果將含有藏匿資 訊之第一音訊檔案AF1利用混音的方式合成至第二音訊檔案AF2中,以形成具有該藏匿資訊之一第三音訊檔案AF3。接收裝置12內部則包含有一應用程式121,當接收裝置12執行應用程式121後,應用程式121將藉由接收裝置12內部之無線通訊單元(本圖未示出)從合成裝置11中接收具有藏匿資訊之第三音訊檔案AF3,以從第三音訊檔案AF3中獲取該藏匿資訊。
於本實施例中,合成裝置11可為一廣告螢幕模組、一廣播模 組、電視系統或是一手持式行動裝置,而接收裝置12則可為一智慧型手機、一平板電腦、一電視機或是一筆記型電腦,但合成裝置11與接收裝置12的實施態樣並不以此為限。至於,藏匿資訊則可為文字、控制指令、數據等資料型態。舉例而言,當合成裝置11為廣告螢幕模組,而接收裝置12為智慧型手機時,一旦使用者接觸到感興趣的廣告或頻道時如果想要更進一步的了解目前介紹的內容,就可以利用執行智慧型手機之應用程式來接收由廣告螢幕模組所播放之含有藏匿資訊之第三音訊檔案AF3,以獲取該藏匿資訊,至於該藏匿資訊可為針對廣告內容的進一步說明、優惠卷、抽獎活動、歌詞、e-mail位址等訊息。
請再參閱圖1,於本實施例中,合成裝置11之分析部件111 係接收含有藏匿資訊之第一音訊檔案AF1及第二音訊檔案AF2,分析部件111對第一音訊檔案AF1進行分析,可獲得關於第一音訊檔案AF1的頻率,並根據第一音訊檔案AF1的頻率來設定一頻率範圍。於本實施例中,頻率範圍的設定可為由1000赫茲到第一音訊檔案AF1的頻率扣除2000赫茲後的範圍,舉例而言:當含有藏匿資訊之第一音訊檔案AF1的頻率為15000赫茲時,則頻率範圍設定為1000頻率到13000赫茲,當然頻率範圍的設定方式並不以 此為限。其中,本案含有藏匿資訊之第一音訊檔案AF1的頻率可介於10000赫茲到20000赫茲。特別說明的是,由於含有藏匿資訊之第一音訊檔案AF1其頻率若介於10000赫茲到20000赫茲,則對於人耳來說,是屬於令人不舒服的雜音。因此,將含有藏匿資訊之第一音訊檔案AF1,以及透過以下對第二音訊檔案AF2的分析,而得到的合成後的第三音訊檔案AF3,可以解決上述的問題。詳細說明如下。
當第二音訊檔案AF2輸入分析部件111後,分析部件111即可 取得關於整個第二音訊檔案AF2的音量與時間的音訊波形圖,以根據音訊波形圖來分析第二音訊檔案AF2的音量振幅狀況,來得知振幅較大的區域在第二音訊檔案AF2的那些波形區域,進而透過分析部件111來設定一音量門檻值。於本實施例中,分析部件111係計算音量平均值跟波峰最大值,再根據音量平均值與波峰最大值範圍依照不同音訊檔案去調整適合的音量門檻值,但可實施的態樣並不以此為限。
請再參閱圖1,混合部件112係接收分析部件111所輸出之頻 率範圍及音量門檻值、第一音訊檔案AF1以及第二音訊檔案AF2,並根據介於該頻率範圍及大於該音量門檻值之條件,於第二音訊檔案AF2中找出至少一個可藏入時間點位置,並於第二音訊檔案AF2之可藏入時間點附近將含有該藏匿資訊之第一音訊檔案AF1利用混音的方式合成至第二音訊檔案AF2中,以形成具有該藏匿資訊之第三音訊檔案AF3,利用這種掩蓋方式可將含有藏匿資料的第一音訊檔案AF1的雜訊聲音給覆蓋住,使得人耳不會察覺到含有藏匿資料的第一音訊檔案AF1的雜音(例如:頻率介於10000赫茲到20000赫茲之第一音訊檔案AF1),讓藏匿資料可以隨著第三音訊檔案AF3的音樂散發出去。當接收裝置12執行應用程式121後,應用程式121將藉由接收裝置12內部之無線通訊單元(本圖未示出)從合成裝置11中接收具有藏匿資訊之第三音訊檔案AF3,並由第三音訊檔案AF3中獲取該藏匿資訊。
請參閱圖2,其係為本案第二較佳實施例之音訊檔案合成系 統之結構示意圖,如圖所示,本實施例之音訊檔案合成系統2同樣可由合成裝置21及接收裝置12所組成,合成裝置21則包含一分析部件211及一混合部件112,主要是透過聲音掩蓋法,於兩種音訊檔案混音時,可以將含有隱藏資訊的音訊檔案所發出的噪音給遮掩住。
與第一較佳實施例相較,本實施例之分析部件211僅接收含 有藏匿資訊之第一音訊檔案AF1,主要對第一音訊檔案AF1進行分析,以根據第一音訊檔案AF1的頻率來設定一頻率範圍。至於,本案用來尋找第二音訊檔案AF2中之可藏入時間點位置所需要之音量門檻值則可由一操作者直接手動來進行設定。當混合部件112接收到分析部件211所輸出之頻率範圍、操作者手動設定之音量門檻值、第一音訊檔案AF1以及第二音訊檔案AF2後,即可根據介於該頻率範圍及大於該音量門檻值之條件,於第二音訊檔案AF2中找出至少一個可藏入時間點位置,並於第二音訊檔案AF2之可藏入時間點附近將含有該藏匿資訊之第一音訊檔案AF1利用混音的方式合成至第二音訊檔案AF2中,以形成具有該藏匿資訊之第三音訊檔案AF3。至於,圖2所示之接收裝置12以及其所包含之應用程式121的連接關係及運作方式已詳述於第一較佳實施例中,於此不再重複提出說明。
當然,本案用來尋找第二音訊檔案AF2中之可藏入時間點位 置所需要的判斷條件,並不侷限於以頻率範圍搭配音量門檻值的實施態樣,於一些實施例中,更可以根據一單位搜尋時間及介於該頻率範圍之條件找出可藏入時間點,或是可根據介於一音量區間及該頻率範圍之條件找出可藏入時間點位置。其中,該單位搜尋時間及該音量區間可由一操作者直接手動來進行設定,但不以此為限。
請參閱圖3A、圖1及圖2,其中圖3A係為本案第三較佳實施 例之音訊檔案合成方法之流程圖,如圖所示,本實施例之音訊檔案合成方法可適用於一音訊檔案合成系統,主要是透過聲音掩蓋法,於第一音訊檔案AF1混音時,可以將含有隱藏資訊的音訊檔案所發出的噪音給遮掩住,可 包含下列步驟:首先,藉由分析部件111、211對第一音訊檔案AF1進行分析,可獲得關於第一音訊檔案AF1的頻率,並根據第一音訊檔案AF1的頻率來設定一頻率範圍(如步驟S31所示),接著,設定一音量門檻值(如步驟S32所示)。
至於,步驟S32所示之音量門檻值的設定方法可以使用圖 3B、圖3C、圖3D或圖3E所示之方法來實施,以下將分別提出說明:請參閱圖3B,音量門檻值的設定方法可由一操作者以人工的方式直接手動進行設定(如步驟S321所示);請參閱圖3C,可透過分析部件111來分析第二音訊檔案AF2的音量振幅狀況,並將第二音訊檔案AF2的平均音量值設定為該音量門檻值(如步驟S322所示)。
請參閱圖3D,首先,根據介於該頻率範圍及大於一第一音 量值之條件找出於第二音訊檔案AF2中可藏入時間點的數量(如步驟S3231所示),若找出的可藏入時間點的數量小於一預設可藏入時間點數量時,將該第一音量值調降為一第二音量值(如步驟S3232所示),接續,根據介於該頻率範圍及大於該第二音量值之條件找出於該第二音訊檔案AF2中可藏入時間點的數量,若找出的可藏入時間點數量大於該預設可藏入時間點數量時,將該第二音量值設定為音量門檻值(如步驟S3233所示),即一開始可以先從比較大範圍的音量值開始搜尋,如果搜尋結果發現可藏入時間點的數量小於一預設可藏入時間點數量,例如:第二音訊檔案AF2總長度的1/3個數門檻值,則將音量值開始降階調整,直到搜尋到的可藏入時間點數量大於該預設可藏入時間點數量時,則將對應之該音量值設定為該音量門檻值,但可實施的態樣並不以此為限。
舉例而言,初始階段將第一音量值設定為-20dB,以搜尋第 二音訊檔案AF2中音量大於-20dB並且符合該頻率範圍的區域為何,如果搜尋出來的可藏入時間點數量低於第二音訊檔案AF2總長度的1/3個數門檻值時,代表第一音量值設定太高,則將第一音量值降階調整為第二音量值, 第二音量值可設定為-25dB,至於音量值的降階調整程度可如:-20dB、-25dB、-30dB、-35dB、-40dB、-45dB所示,直到搜尋到的可藏入時間點數量大於第二音訊檔案AF2總長度1/3的個數,例如:第二音訊檔案AF2總長度時間為三分鐘,預設可藏入時間點數量為第二音訊檔案AF2的1/3長度,即為一分鐘長度,若以秒為單位,代表預設可藏入時間點數量為60,搜尋到的可藏入時間點數量至少要有60點以上,若設定的第一音量值無法符合需求則採取自動降階調整音量值,則調降成第二音量值後再去搜尋可藏入時間點數量,如果執行到最後這些條件都不成立,就代表此第二音訊檔案AF2過於小聲,不適合進行混音。
請參閱圖3E,於一些實施例中,可將第二音訊檔案AF2分割 成複數個段落(如步驟S3241所示),後續,每一段落則以自動降階調整音量值的方法,即圖3D所示之步驟S3231、S3232、S3233,來設定每一段落所對應之音量門檻值(如步驟S3242所示)。舉例而言,當第二音訊檔案AF2為一首3分鐘長度的歌曲時,可將歌曲分成三個段落,一個段落為1分鐘歌曲長度,針對這些段落來套用圖3D所示之步驟S3231、S3232、S3233所述之自動降階調整音量值的方法,即可找出適合每一段落的音量門檻值。此方法就可以針對音量幅度變化較大的歌曲,依照音量大小分佈來做音量門檻值最佳適應性的調整。
請再參閱圖3A及圖3F,其中圖3F為使用圖3A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖,於步驟S32之後,混合部件112將根據介於該頻率範圍及大於該音量門檻值之條件,於第二音訊檔案AF2之波形中找出符合介於該頻率範圍及大於該音量門檻值條件的至少一波形區域A,並將該波形區域A之波峰點P所對應之時間,即將每一波峰點P垂直對應至符合該音量門檻值條件的位置,設定為該可藏入時間點T,以於第二音訊檔案AF2中找出可藏入時間點T的位置(如步驟S33所示)。最後,於第二音訊檔案AF2之可藏入時間點T附近將含有該藏匿資訊之第一 音訊檔案AF1利用混音的方式合成至第二音訊檔案AF2中,以形成具有該藏匿資訊之第三音訊檔案AF3(如步驟S34所示),利用這種掩蓋方式將含有藏匿資料的第一音訊檔案AF1的雜訊聲音給覆蓋住,使得人耳不會察覺到含有藏匿資料的第一音訊檔案AF1的雜音,讓藏匿資料可以隨著第三音訊檔案AF3的音樂散發出去。
當然,本案之音訊檔案合成方法對於第二音訊檔案AF2之波 形中可藏入時間點位置的找尋方法並不侷限於圖3A之步驟S33所述的步驟,請參閱圖4A、4B,其中圖4A係為本案第四較佳實施例之音訊檔案合成方法之流程圖,圖4B係為使用圖4A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖,如圖所示,於步驟S31、S32之後,混合部件112將根據介於該頻率範圍及大於該音量門檻值之條件,於第二音訊檔案AF2之波形中找出符合介於該頻率範圍及大於該音量門檻值條件的至少一波形區域A,並將每一波形區域A之起點位置及終點位置設定為可藏入時間點T,以於第二音訊檔案AF2中找出可藏入時間點T的位置(如步驟S41所示)。至於,圖4A所示之步驟S31-32及步驟S34的實施態樣已詳述於第三較佳實施例中,於此不再重複提出說明。
請參閱圖5A、5B,其中圖5A係為本案第五較佳實施例之音訊檔案合成方法之流程圖,圖5B係為使用圖5A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖,如圖所示,於步驟S31、S32之後,混合部件112將根據介於該頻率範圍及大於該音量門檻值之條件,於第二音訊檔案AF2之波形中找出符合介於該頻率範圍及大於該音量門檻值條件的至少一波形區域A,並將每一該波型區域A的起點位置設定為第一該可藏入時間點T1,並根據每一該波形區域A之時間長度以及該第二音訊檔案AF2之一單位間隔藏入時間t來設定接續之該可藏入時間點T2(如步驟S51所示)。舉例而言:如圖5B所示,假設一波形區域A1的時間長度為0.5秒,而含有隱藏資訊的第二音訊檔案AF2的單位間隔藏入時間t為0.25秒,則可以判斷此波 形區域A1可設置兩個可藏入時間點T,其中第一可藏入時間點T1為波形區域A1的起點位置,而第二可藏入時間點T2為經過一單位間隔藏入時間t後的接續點。至於,圖5A所示之步驟S31-32及步驟S34的實施態樣已詳述於第三較佳實施例中,於此不再重複提出說明。
請參閱圖6A、6B,其中圖6A係為本案第六較佳實施例之音 訊檔案合成方法之流程圖,圖6B係為使用圖6A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖,如圖所示,本實施例之音訊檔案合成方法可包含下列步驟:首先,藉由分析部件111、211對第一音訊檔案AF1進行分析,可獲得關於第一音訊檔案AF1的頻率,並根據第一音訊檔案AF1的頻率來設定一頻率範圍(如步驟S61所示),接著,設定一單位搜尋時間(如步驟S62所示),其中,該單位搜尋時間可由一操作者直接手動來進行設定,但不以此為限。
接著,請再參閱圖6B及圖6C,其中圖6C係為圖6B中B區域 的放大示意圖,混合部件112將根據該單位搜尋時間及介於該頻率範圍之條件,於每一該單位搜尋時間內找出於第二音訊檔案AF2之波形中符合介於該頻率範圍條件的波形區域,並將波形區域之波峰點P所對應的時間設定為可藏入時間點T(如步驟S63所示),最後,混合部件112將含有該藏匿資訊之第一音訊檔案的音量調降至低於該波形區域之該波峰點P所對應的音量,並將調降音量後之第一音訊檔案AF1於該波峰點P所對應的可藏入時間點附近合成至該第二音訊檔案AF2中,以形成具有該藏匿資訊之該第三音訊檔案AF3(如步驟S64所示)。
舉例而言,假設第二音訊檔案AF2為具有三分鐘長度的歌 曲,並設定單位搜尋時間為1秒搜尋一次,則整首第二音訊檔案AF2總共可有180個可藏入時間點,在每1秒的單位搜尋時間當中,找到第二音訊檔案AF2的波形中符合介於該頻率範圍條件的波形區域的波峰點P。請參閱圖6C,假設此波峰點P所對應的音量為-25dB,則在此波峰點P對應的可藏入時 間點T的位置插入低於-25dB,例如:-30dB,的含有該藏匿資訊之第一音訊檔案AF1,即可形成具有該藏匿資訊之該第三音訊檔案AF3。
請參閱圖7A、7B,其中圖7A係為本案第七較佳實施例之音 訊檔案合成方法之流程圖,圖7B係為使用圖7A之流程於第二音訊檔案之波形中所找出的可藏入時間點位置示意圖,如圖所示,本實施例之音訊檔案合成方法可包含下列步驟:首先,藉由分析部件111、211對第一音訊檔案AF1進行分析,可獲得關於第一音訊檔案AF1的頻率,並根據第一音訊檔案AF1的頻率來設定一頻率範圍(如步驟S71所示),接著,設定一音量區間(如步驟S72所示),其中,該音量區間可由一操作者直接手動來進行設定,但不以此為限。
接著,請再參閱圖7B及圖7C,其中圖7C係為圖7B中C區域 的放大示意圖,於步驟S72之後,混合部件112將根據介於該音量區間及該頻率範圍之條件,於該音量區間中找出於第二音訊檔案AF2之波形中符合介於該頻率範圍條件的波形區域,並將波形區域之波峰點P所對應的時間設定為可藏入時間點T(如步驟S73所示),最後,混合部件112將含有該藏匿資訊之第一音訊檔案的音量調降至低於該波形區域之該波峰點P所對應的音量,並將調降音量後之第一音訊檔案AF1於該波峰點P所對應的可藏入時間點附近合成至該第二音訊檔案AF2中,以形成具有該藏匿資訊之該第三音訊檔案AF3(如步驟S74所示)。
舉例而言,於一些實施例中,設定音量區間為 -25dB~-40dB,在音量區間為-25dB~-40dB的區間中,尋找第二音訊檔案AF2的波形中符合介於該頻率範圍條件的波形區域的波峰點P,請參閱圖7C,假設此波峰點P所對應的音量為-30dB,則在此波峰點P對應的可藏入時間點T的位置插入低於-30dB,例如:-35dB,的含有該藏匿資訊之第一音訊檔案AF1,即可形成具有該藏匿資訊之該第三音訊檔案AF3。
綜上所述,本案之音訊檔案合成方法及其所適用之音訊檔案 合成系統係藉由分析含有一藏匿資訊之第一音訊檔案來設定一頻率範圍,並根據介於該頻率範圍及大於一音量門檻值之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置,進而於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案利用混音的方式合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案,利用這種掩蓋方式將含有藏匿資料的第一音訊檔案的雜訊聲音給覆蓋住,使得人耳不會察覺到含有藏匿資料的第一音訊檔案的雜音,讓藏匿資料可以隨著第三音訊檔案的音樂散發出去,而包含藏匿資訊的第一音訊檔案可以透過聲音傳輸資料的技術,讓應用範圍更廣泛且可加強傳輸訊號的範圍。
另外,本案也可根據一單位搜尋時間及介於該頻率範圍之條件找出第二音訊檔案中之可藏入時間點位置,或是根據介於一音量區間及頻率範圍之條件找出可藏入時間點的位置,進而於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案利用混音的方式合成至該第二音訊檔案中,以形成具有該藏匿資訊之第三音訊檔案,以使含有該藏匿資訊之該第一音訊檔案的聲音會被第二音訊檔案給掩蓋住,以維持良好的播放品質。
本案得由熟知此技術之人士任施匠思而為諸般修飾,然皆不脫如附申請專利範圍所欲保護者。
S31-34‧‧‧音訊檔案合成步驟

Claims (19)

  1. 一種音訊檔案合成方法,用以將含有一藏匿資訊之一第一音訊檔案合成至一第二音訊檔案中,至少包含步驟:分析該第一音訊檔案,以設定一頻率範圍;根據介於該頻率範圍及大於一音量門檻值之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置,該可藏入時間點位置位於該第二音訊檔案的波形中符合該頻率範圍及大於該音量門檻值所得的至少一波形區域中;以及於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案。
  2. 如申請專利範圍第1項所述之音訊檔案合成方法,其中該音量門檻值係由一操作者進行設定。
  3. 如申請專利範圍第1項所述之音訊檔案合成方法,其中該音量門檻值係為該第二音訊檔案之平均音量值。
  4. 如申請專利範圍第1項所述之音訊檔案合成方法,其中該音量門檻值的設定方式係為:根據介於該頻率範圍及大於一第一音量值之條件找出於該第二音訊檔案中該可藏入時間點的數量;若於該可藏入時間點的數量小於一預設可藏入時間點數量時,將該第一音量值調降為一第二音量值;根據介於該頻率範圍及大於該第二音量值之條件找出於該第二音訊檔案中該可藏入時間點的數量;以及若於該可藏入時間點的數量大於該預設可藏入時間點數量時,將該第二音量值設定為該音量門檻值。
  5. 如申請專利範圍第1項所述之音訊檔案合成方法,其中更包含步驟:將該第二音訊檔案分割成複數個段落;以及 根據該複數個段落分別設定對應之音量門檻值,以於該第二音訊檔案中找出該可藏入時間點位置。
  6. 如申請專利範圍第1項所述之音訊檔案合成方法,其中該可藏入時間點位置的找尋步驟係為:於該第二音訊檔案之波形中找出符合介於該頻率範圍及大於該音量門檻值條件的至少一波形區域;以及將該波形區域之波峰點所對應之時間設定為該可藏入時間點。
  7. 如申請專利範圍第1項所述之音訊檔案合成方法,其中該可藏入時間點位置的找尋步驟係為:於該第二音訊檔案之波形中找出符合介於該頻率範圍及大於該音量門檻值條件的至少一波形區域;以及將該波形區域之起點位置及終點位置設定為該可藏入時間點。
  8. 如申請專利範圍第1項所述之音訊檔案合成方法,其中該可藏入時間點位置的找尋步驟係為:於該第二音訊檔案之波形中找出符合介於該頻率範圍及大於該音量門檻值條件的至少一波形區域;以及將該波型區域之起點位置設定為第一該可藏入時間點,並根據該波形區域之時間長度以及該第二音訊檔案之一單位間隔藏入時間來設定接續之該可藏入時間點。
  9. 一種音訊檔案合成方法,用以將含有一藏匿資訊之一第一音訊檔案合成至一第二音訊檔案中,至少包含步驟:分析該第一音訊檔案,以設定一頻率範圍;根據一單位搜尋時間及介於該頻率範圍之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置,該可藏入時間點位置位於該第二音訊檔案的波形中符合該頻率範圍及位於該單位搜尋時間內的至少一波形區域中;以及 於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案。
  10. 如申請專利範圍第9項所述之音訊檔案合成方法,其中該可藏入時間點位置的找尋步驟係為:於該單位搜尋時間內找出該第二音訊檔案之波形中符合介於該頻率範圍條件的一波形區域,並將該波形區域之至少一波峰點所對應的時間設定為該可藏入時間點。
  11. 如申請專利範圍第10項所述之音訊檔案合成方法,其中更包含步驟:將含有該藏匿資訊之該第一音訊檔案的音量調降至低於該波形區域之該波峰點所對應的音量,並於該可藏入時間點附近合成至該第二音訊檔案中,以形成具有該藏匿資訊之該第三音訊檔案。
  12. 一種音訊檔案合成方法,用以將含有一藏匿資訊之一第一音訊檔案合成至一第二音訊檔案中,至少包含步驟:分析該第一音訊檔案,以設定一頻率範圍;根據介於一音量區間及該頻率範圍之條件,於該第二音訊檔案中找出至少一個可藏入時間點位置,該可藏入時間點位置位於該第二音訊檔案的波形中符合該音量區間及該頻率範圍的至少一波形區域中;以及於該可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案。
  13. 如申請專利範圍第12項所述之音訊檔案合成方法,其中該可藏入時間點位置的找尋步驟係為:於該音量區間中找出該第二音訊檔案之波形中符合介於該頻率範圍條件的一波形區域,並將該波形區域之至少一波峰點所對應的時間設定為該可藏入時間點。
  14. 如申請專利範圍第13項所述之音訊檔案合成方法,其中更包含步驟:將含有該藏匿資訊之該第一音訊檔案的音量調降至低於該波形區域之該波峰所對應的音量,並於該可藏入時間點附近合成至該第二音訊檔案中,以形成具有該藏匿資訊之該第三音訊檔案。
  15. 一種音訊檔案合成系統,至少包含:一合成裝置,接收含有一藏匿資訊之一第一音訊檔案及一第二音訊檔案,包含:一分析部件,對該第一音訊檔案及該第二音訊檔案進行分析,以分別獲得一頻率範圍及一音量門檻值;一混合部件,於該第二音訊檔案之至少一個可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案,其中該可藏入時間點位置係根據介於該頻率範圍及大於該音量門檻值之條件所找出;一接收裝置,其係接收該第三音訊檔案並具有一應用程式,使該應用程式從該第三音訊檔案中獲取該藏匿資訊。
  16. 如申請專利範圍第15項所述之音訊檔案合成系統,其中該音量門檻值係為該第二音訊檔案之平均音量值。
  17. 如申請專利範圍第15項所述之音訊檔案合成系統,其中該音量門檻值係根據介於該頻率範圍及大於一第一音量值之條件找出於該第二音訊檔案中該可藏入時間點的數量,於該可藏入時間點的數量小於一預設可藏入時間點數量時,將該第一音量值調降為一第二音量值,並根據介於該頻率範圍及大於該第二音量值之條件找出於該第二音訊檔案中該可藏入時間點的數量,於該可藏入時間點的數量大於該預設可藏入時間點數量時,該第二音量值係設定為該音量門檻值。
  18. 一種音訊檔案合成系統,至少包含:一合成裝置,接收含有一藏匿資訊之一第一音訊檔案及一第二音訊檔案,包含:一分析部件,對該第一音訊檔案進行分析,以獲得一頻率範圍;一混合部件,於該第二音訊檔案之至少一個可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該 藏匿資訊之一第三音訊檔案,其中該可藏入時間點位置係根據一單位搜尋時間及介於該頻率範圍之條件所找出;以及一接收裝置,其係接收該第三音訊檔案並具有一應用程式,使該應用程式從該第三音訊檔案中獲取該藏匿資訊。
  19. 一種音訊檔案合成系統,至少包含:一合成裝置,接收含有一藏匿資訊之一第一音訊檔案及一第二音訊檔案,包含:一分析部件,對該第一音訊檔案進行分析,以獲得一頻率範圍;一混合部件,於該第二音訊檔案之至少一個可藏入時間點附近將含有該藏匿資訊之該第一音訊檔案合成至該第二音訊檔案中,以形成具有該藏匿資訊之一第三音訊檔案,其中該可藏入時間點位置係根據介於一音量區間及該頻率範圍之條件所找出;一接收裝置,其係接收該第三音訊檔案並具有一應用程式,使該應用程式從該第三音訊檔案中獲取該藏匿資訊。
TW103133621A 2014-09-26 2014-09-26 音訊檔案合成方法及其所適用之音訊檔案合成系統 TWI556226B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW103133621A TWI556226B (zh) 2014-09-26 2014-09-26 音訊檔案合成方法及其所適用之音訊檔案合成系統
CN201510037440.9A CN104599666B (zh) 2014-09-26 2015-01-26 音频文件合成方法及其所适用的音频文件合成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103133621A TWI556226B (zh) 2014-09-26 2014-09-26 音訊檔案合成方法及其所適用之音訊檔案合成系統

Publications (2)

Publication Number Publication Date
TW201612894A TW201612894A (en) 2016-04-01
TWI556226B true TWI556226B (zh) 2016-11-01

Family

ID=53125400

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103133621A TWI556226B (zh) 2014-09-26 2014-09-26 音訊檔案合成方法及其所適用之音訊檔案合成系統

Country Status (2)

Country Link
CN (1) CN104599666B (zh)
TW (1) TWI556226B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI661421B (zh) * 2018-04-12 2019-06-01 中華電信股份有限公司 具音訊浮水印之系統及方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI578772B (zh) * 2016-01-26 2017-04-11 威盛電子股份有限公司 多媒體檔案的播放方法與播放裝置
CN109187743B (zh) * 2018-08-27 2021-04-13 深圳市刻锐智能科技有限公司 玻璃破碎检测方法、玻璃破碎报警器及存储介质
CN109979488B (zh) * 2019-03-14 2021-05-14 浙江大学 基于重音分析的人声转乐谱系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW315436B (en) * 1996-11-27 1997-09-11 Ibm Kk Data hiding and data extracting method
EP2631904A1 (en) * 2008-05-29 2013-08-28 Intrasonics S.A.R.L. Recovery of a data message embedded in an audio signal
US20140129011A1 (en) * 2012-11-02 2014-05-08 Dolby Laboratories Licensing Corporation Audio Data Hiding Based on Perceptual Masking and Detection based on Code Multiplexing

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850910B1 (en) * 1999-10-22 2005-02-01 Matsushita Electric Industrial Co., Ltd. Active data hiding for secure electronic media distribution
CN1768386A (zh) * 2003-04-08 2006-05-03 皇家飞利浦电子股份有限公司 与隐藏数据信道有关的脆弱音频水印
CN1452100A (zh) * 2003-05-27 2003-10-29 无敌科技(西安)有限公司 一种从声音数据中辩别音乐数据的方法
CN100359908C (zh) * 2004-04-23 2008-01-02 哈尔滨工业大学 隐密电话
EP2210252B1 (en) * 2007-11-12 2017-05-24 The Nielsen Company (US), LLC Methods and apparatus to perform audio watermarking and watermark detection and extraction
CN103475467A (zh) * 2013-08-29 2013-12-25 郑静晨 一种方舱医院语音对讲中的侧信道通信方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW315436B (en) * 1996-11-27 1997-09-11 Ibm Kk Data hiding and data extracting method
EP2631904A1 (en) * 2008-05-29 2013-08-28 Intrasonics S.A.R.L. Recovery of a data message embedded in an audio signal
US20140129011A1 (en) * 2012-11-02 2014-05-08 Dolby Laboratories Licensing Corporation Audio Data Hiding Based on Perceptual Masking and Detection based on Code Multiplexing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI661421B (zh) * 2018-04-12 2019-06-01 中華電信股份有限公司 具音訊浮水印之系統及方法

Also Published As

Publication number Publication date
CN104599666B (zh) 2018-02-09
TW201612894A (en) 2016-04-01
CN104599666A (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
TWI556226B (zh) 音訊檔案合成方法及其所適用之音訊檔案合成系統
CN105632508B (zh) 音频处理方法及音频处理装置
US20140192200A1 (en) Media streams synchronization
US11921781B2 (en) Display apparatus, background music providing method thereof and background music providing system
CN109982231B (zh) 一种信息处理方法、设备及存储介质
CN104980773A (zh) 一种流媒体处理方法、装置、终端及服务器
US10014841B2 (en) Method and apparatus for controlling audio playback based upon the instrument
WO2020108045A1 (zh) 视频播放方法、装置和多媒体数据播放方法
CN209089103U (zh) 一种编辑系统
WO2021147461A1 (zh) 展示字幕信息的方法、装置、电子设备和计算机可读介质
CN103327156A (zh) 一种语音文件输出方法及装置
US10957321B2 (en) Electronic device and control method thereof
CN104038774B (zh) 生成铃声文件的方法及装置
MY148206A (en) Image processing apparatus, image processing method, and program
WO2017113701A1 (zh) 制作视频集锦的方法、装置、电子设备、服务器及系统
US20230289622A1 (en) Volume recommendation method and apparatus, device and storage medium
CN104038772B (zh) 生成铃声文件的方法及装置
EP3803862A1 (en) Audio waveform display using mapping function
WO2023246823A1 (zh) 一种视频播放方法、装置、设备及存储介质
US20180246695A1 (en) Individually customized automated media content filtering
CN104778958A (zh) 一种含噪声歌曲拼接的方法及装置
US9445210B1 (en) Waveform display control of visual characteristics
KR101326275B1 (ko) 문자 및 음성 동기화 출력 장치
CN104778219A (zh) 一种预设效果歌曲拼接的方法及装置
US20210044875A1 (en) Electronic device and control method therefor