CN104599666A - 音频文件合成方法及其所适用的音频文件合成系统 - Google Patents
音频文件合成方法及其所适用的音频文件合成系统 Download PDFInfo
- Publication number
- CN104599666A CN104599666A CN201510037440.9A CN201510037440A CN104599666A CN 104599666 A CN104599666 A CN 104599666A CN 201510037440 A CN201510037440 A CN 201510037440A CN 104599666 A CN104599666 A CN 104599666A
- Authority
- CN
- China
- Prior art keywords
- audio file
- angle
- incidence point
- hide
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 26
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 26
- 238000001308 synthesis method Methods 0.000 title abstract 2
- 238000010189 synthetic method Methods 0.000 claims description 40
- 238000000034 method Methods 0.000 abstract description 39
- 230000002194 synthesizing effect Effects 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 15
- 238000002156 mixing Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Landscapes
- Stereophonic System (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明为一种音频文件合成方法及其所适用的音频文件合成系统。该音频文件合成方法,用以将含有一藏匿信息的一第一音频文件合成至一第二音频文件中,至少包含步骤:分析该第一音频文件,以设定一频率范围;根据介于该频率范围及大于一音量阈值的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及在该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件。
Description
技术领域
本发明涉及一种合成方法及其所适用的合成系统,尤其涉及一种音频文件合成方法及其所适用的音频文件合成系统。
背景技术
在信息爆炸的年代,每日都有上亿笔的数据在互相传递,数据也广泛散布在各地,而这些数字数据也因为容易被窃取或不正当的复制使用,使得人们更重视数据安全这一领域。
传统的数据藏匿方法是通过数字签章的方式针对图像、视频、音频进行加密,目前主流的数据藏匿方法的大致上如下:浮水印藏匿法、LSB藏匿法、小波转换藏匿法…等等。
数据藏匿(Data Hiding)在目前的应用当中,时常被使用在数据传输时的一种应用,主要类别分成强健性(robust)与易碎性(fragile)两类。强健性主要是为了保护传输中藏匿的数据不会被破坏,让原本文件被破坏了之后,还是可以将藏匿的数据解译出来,主要应用是在安全性和保护智慧财产权。而易碎性是为了要查看原始文件是否有被修改过,如果有修改过文件的话,里面藏匿的数据就会整个被破坏,使得数据藏匿的东西无法取出,通常应用都是在证明音频的完整性,像是录口供、侦查犯罪数据的用途。
针对强健性的类别,主要就是要保护传输隐匿的数据不会被破坏,可将含有藏匿数据的音频文件加入一原始音频文件中,以让藏匿数据可随着原始音频文件传播出去。或者,需要藏匿的数据本身就为音频文件,而让藏匿数据可随着原始音频文件传播出去。而已知所采用的合成方法将含有藏匿数据的音频文件分成多笔单位数据,并以固定间距时间将多笔单位数据分别加入原始音频文件中。举例而言:每隔2秒就将含有藏匿数据的音频文件的一个单位数据加入原始音频文件中,以随着原始音频文件传播出去。虽然已知的合成方法确实可达到传送含有藏匿数据的音频文件的功效,但是,由于已知以固定间距时间的方式将一个单位数据加入原始音频文件中,一旦加入的时间点对应到原始音频文件的音量正处于低音量或是低振福的状态时,人耳将会很清楚的察觉到含有藏匿数据的音频文件的杂音,而造成播放质量不佳的问题。
因此,如何发展一种音频文件合成方法及其所适用的音频文件合成系统,实为目前迫切需要解决的问题。
发明内容
本申请的主要目的在于提供一种音频文件合成方法及其所适用的音频文件合成系统,从而解决已知合成方法以固定间距时间的方式将一个单位数据加入原始音频文件中,当加入的时间点对应到原始音频文件的音量正处于低音量或是低振幅的状态时,人耳将会很清楚的察觉到含有藏匿数据的音频文件的杂音,而造成播放质量不佳等缺点。
为达上述目的,本申请的一较广义实施例为提供一种音频文件合成方法,用以将含有一藏匿信息的一第一音频文件合成至一第二音频文件中,至少包含步骤:分析该第一音频文件,以设定一频率范围;根据介于该频率范围及大于一音量阈值的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及在该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件。
为达上述目的,本申请的另一较广义实施例为提供一种音频文件合成方法,用以将含有一藏匿信息的一第一音频文件合成至一第二音频文件中,至少包含步骤:分析该第一音频文件,以设定一频率范围;根据一单位搜寻时间及介于该频率范围的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及于该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件。
为达上述目的,本申请的另一较广义实施例为提供一种音频文件合成方法,用以将含有一藏匿信息的一第一音频文件合成至一第二音频文件中,至少包含步骤:分析该第一音频文件,以设定一频率范围;根据介于一音量区间及该频率范围的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及在该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件。
为达上述目的,本申请的另一较广义实施例为提供一种音频文件合成系统,至少包含:一合成装置,接收含有一藏匿信息的一第一音频文件及一第二音频文件,包含:一分析部件,对该第一音频文件及该第二音频文件进行分析,以分别获得一频率范围及一音量阈值;一混合部件,在该第二音频文件的至少一个可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件,其中该可藏入时间点位置根据介于该频率范围及大于该音量阈值的条件所找出;一接收装置,其接收该第三音频文件并具有一应用程序,使该应用程序从该第三音频文件中获取该藏匿信息。
为达上述目的,本申请的又一较广义实施例为提供一种音频文件合成系统,至少包含:一合成装置,接收含有一藏匿信息的一第一音频文件及一第二音频文件,包含:一分析部件,对该第一音频文件进行分析,以获得一频率范围;一混合部件,在该第二音频文件的至少一个可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件,其中该可藏入时间点位置根据一单位搜寻时间及介于该频率范围的条件所找出;以及一接收装置,其接收该第三音频文件并具有一应用程序,使该应用程序从该第三音频文件中获取该藏匿信息。
为达上述目的,本申请的另一较广义实施例为提供一种音频文件合成系统,至少包含:一合成装置,接收含有一藏匿信息的一第一音频文件及一第二音频文件,包含:一分析部件,对该第一音频文件进行分析,以获得一频率范围;一混合部件,在该第二音频文件的至少一个可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件,其中该可藏入时间点位置根据介于一音量区间及该频率范围的条件所找出;一接收装置,其接收该第三音频文件并具有一应用程序,使该应用程序从该第三音频文件中获取该藏匿信息。
附图说明
图1为本申请第一优选实施例的音频文件合成系统的结构示意图。
图2为本申请第二优选实施例的音频文件合成系统的结构示意图。
图3A为本申请第三优选实施例的音频文件合成方法的流程图。
图3B、图3C、图3D、图3E为图3A的步骤S32的音量阈值设定方法的流程图。
图3F为使用图3A的流程于第二音频文件的波形中所找出的可藏入时间点位置示意图。
图4A为本申请第四优选实施例的音频文件合成方法的流程图。
图4B为使用图4A的流程于第二音频文件的波形中所找出的可藏入时间点位置示意图。
图5A为本申请第五优选实施例的音频文件合成方法的流程图。
图5B为使用图5A的流程于第二音频文件的波形中所找出的可藏入时间点位置示意图。
图6A为本申请第六优选实施例的音频文件合成方法的流程图。
图6B为使用图6A的流程于第二音频文件的波形中所找出的可藏入时间点位置示意图。
图6C为图6B中B区域的放大示意图。
图7A为本申请第七优选实施例的音频文件合成方法的流程图。
图7B为使用图7A的流程在第二音频文件的波形中所找出的可藏入时间点位置示意图。
图7C为图7B中C区域的放大示意图。
【符号说明】
音频文件合成系统:1、2
合成装置:11、21
分析部件:111、211
混合部件:112
接收装置:12
应用程序:121
第一音频文件:AF1
第二音频文件:AF2
第三音频文件:AF3
音频文件合成步骤:S31-34、S41、S51、S61-64、S71-74
音量阈值的设定步骤:S321、S322、S3231-S3233、S3241-S3242
波形区域:A、A1
波峰点:P
可藏入时间点:T、T1、T2
单位间隔藏入时间:t
区域:B、C
具体实施方式
体现本申请特征与优点的一些典型实施例将在后段的说明中详细叙述。应理解的是本申请能够在不同的态样上具有各种的变化,其皆不脱离本申请的范围,且其中的说明及图示在本质上当作说明之用,而非用以限制本申请。
请参阅图1,其为本申请第一优选实施例的音频文件合成系统的结构示意图,如图所示,本申请的音频文件合成系统1可由合成装置11及接收装置12所组成,主要是通过声音掩盖法,在两种音频文件混音时,可以将含有隐藏信息的音频文件所发出的噪音给遮掩住。合成装置11接收含有一藏匿信息的第一音频文件AF1以及一第二音频文件AF2,且至少可包含一分析部件111及一混合部件112,分析部件111与混合部件112电性连接。本申请的分析部件111的实施例可为一音频分析软件或是一分析仪器,但不以此为限。
混合部件112则根据分析部件111的分析结果将含有藏匿信息的第一音频文件AF1利用混音的方式合成至第二音频文件AF2中,以形成具有该藏匿信息的一第三音频文件AF3。接收装置12内部则包含有一应用程序121,当接收装置12执行应用程序121后,应用程序121将藉由接收装置12内部的无线通信单元(本图未示出)从合成装置11中接收具有藏匿信息的第三音频文件AF3,以从第三音频文件AF3中获取该藏匿信息。
在本实施例中,合成装置11可为一广告屏幕模块、一广播模块、电视系统或是一手持式移动装置,而接收装置12则可为一智能手机、一平板计算机、一电视机或是一笔记型计算机,但合成装置11与接收装置12的实施例并不以此为限。至于,藏匿信息则可为文字、控制指令、数据等数据类型。举例而言,当合成装置11为广告屏幕模块,而接收装置12为智能手机时,一旦使用者接触到感兴趣的广告或频道时如果想要更进一步地了解目前介绍的内容,就可以利用执行智能手机的应用程序来接收由广告屏幕模块所播放的含有藏匿信息的第三音频文件AF3,以获取该藏匿信息,至于该藏匿信息可为针对广告内容的进一步说明、优惠卷、抽奖活动、歌词、e-mail地址等讯息。
请再参阅图1,在本实施例中,合成装置11的分析部件111接收含有藏匿信息的第一音频文件AF1及第二音频文件AF2,分析部件111对第一音频文件AF1进行分析,可获得关于第一音频文件AF1的频率,并根据第一音频文件AF1的频率来设定一频率范围。在本实施例中,频率范围的设定可为由1000赫兹到第一音频文件AF1的频率扣除2000赫兹后的范围,举例而言:当含有藏匿信息的第一音频文件AF1的频率为15000赫兹时,则频率范围设定为1000频率到13000赫兹,当然频率范围的设定方式并不以此为限。其中,本申请含有藏匿信息的第一音频文件AF1的频率可介于10000赫兹到20000赫兹。特别说明的是,由于含有藏匿信息的第一音频文件AF1其频率若介于10000赫兹到20000赫兹,则对于人耳来说,是属于令人不舒服的杂音。因此,将含有藏匿信息的第一音频文件AF1,以及通过以下对第二音频文件AF2的分析,而得到的合成后的第三音频文件AF3,可以解决上述的问题。详细说明如下。
当第二音频文件AF2输入分析部件111后,分析部件111即可取得关于整个第二音频文件AF2的音量与时间的音频波形图,以根据音频波形图来分析第二音频文件AF2的音量振幅状况,来得知振幅较大的区域在第二音频文件AF2的那些波形区域,进而通过分析部件111来设定一音量阈值。在本实施例中,分析部件111计算音量平均值跟波峰最大值,再根据音量平均值与波峰最大值范围依照不同音频文件去调整适合的音量阈值,但可实施的态样并不以此为限。
请再参阅图1,混合部件112接收分析部件111所输出的频率范围及音量阈值、第一音频文件AF1以及第二音频文件AF2,并根据介于该频率范围及大于该音量阈值的条件,在第二音频文件AF2中找出至少一个可藏入时间点位置,并在第二音频文件AF2的可藏入时间点附近将含有该藏匿信息的第一音频文件AF1利用混音的方式合成至第二音频文件AF2中,以形成具有该藏匿信息的第三音频文件AF3,利用这种掩盖方式可将含有藏匿数据的第一音频文件AF1的噪声声音给覆盖住,使得人耳不会察觉到含有藏匿数据的第一音频文件AF1的杂音(例如:频率介于10000赫兹到20000赫兹的第一音频文件AF1),让藏匿数据可以随着第三音频文件AF3的音乐散发出去。当接收装置12执行应用程序121后,应用程序121将藉由接收装置12内部的无线通信单元(本图未示出)从合成装置11中接收具有藏匿信息的第三音频文件AF3,并由第三音频文件AF3中获取该藏匿信息。
请参阅图2,其为本申请第二优选实施例的音频文件合成系统的结构示意图,如图所示,本实施例的音频文件合成系统2同样可由合成装置21及接收装置12所组成,合成装置21则包含一分析部件211及一混合部件112,主要是通过声音掩盖法,在两种音频文件混音时,可以将含有隐藏信息的音频文件所发出的噪音给遮掩住。
与第一优选实施例相较,本实施例的分析部件211仅接收含有藏匿信息的第一音频文件AF1,主要对第一音频文件AF1进行分析,以根据第一音频文件AF1的频率来设定一频率范围。至于,本申请用来寻找第二音频文件AF2中的可藏入时间点位置所需要的音量阈值则可由一操作者直接手动来进行设定。当混合部件112接收到分析部件211所输出的频率范围、操作者手动设定的音量阈值、第一音频文件AF1以及第二音频文件AF2后,即可根据介于该频率范围及大于该音量阈值的条件,在第二音频文件AF2中找出至少一个可藏入时间点位置,并在第二音频文件AF2的可藏入时间点附近将含有该藏匿信息的第一音频文件AF1利用混音的方式合成至第二音频文件AF2中,以形成具有该藏匿信息的第三音频文件AF3。至于,图2所示的接收装置12以及其所包含的应用程序121的连接关系及运作方式已详述于第一优选实施例中,在此不再重复提出说明。
当然,本申请用来寻找第二音频文件AF2中的可藏入时间点位置所需要的判断条件,并不局限于以频率范围搭配音量阈值的实施例,在一些实施例中,还可以根据一单位搜寻时间及介于该频率范围的条件找出可藏入时间点,或是可根据介于一音量区间及该频率范围的条件找出可藏入时间点位置。其中,该单位搜寻时间及该音量区间可由一操作者直接手动来进行设定,但不以此为限。
请参阅图3A、图1及图2,其中图3A为本申请第三优选实施例的音频文件合成方法的流程图,如图所示,本实施例的音频文件合成方法可适用于一音频文件合成系统,主要是通过声音掩盖法,在第一音频文件AF1混音时,可以将含有隐藏信息的音频文件所发出的噪音给遮掩住,可包含下列步骤:首先,藉由分析部件111、211对第一音频文件AF1进行分析,可获得关于第一音频文件AF1的频率,并根据第一音频文件AF1的频率来设定一频率范围(如步骤S31所示),接着,设定一音量阈值(如步骤S32所示)。
至于,步骤S32所示的音量阈值的设定方法可以使用图3B、图3C、图3D或图3E所示的方法来实施,以下将分别提出说明:请参阅图3B,音量阈值的设定方法可由一操作者以人工的方式直接手动进行设定(如步骤S321所示);请参阅图3C,可通过分析部件111来分析第二音频文件AF2的音量振幅状况,并将第二音频文件AF2的平均音量值设定为该音量阈值(如步骤S322所示)。
请参阅图3D,首先,根据介于该频率范围及大于一第一音量值的条件找出在第二音频文件AF2中可藏入时间点的数量(如步骤S3231所示),若找出的可藏入时间点的数量小于一预设可藏入时间点数量时,将该第一音量值调降为一第二音量值(如步骤S3232所示),接续,根据介于该频率范围及大于该第二音量值的条件找出在该第二音频文件AF2中可藏入时间点的数量,若找出的可藏入时间点数量大于该预设可藏入时间点数量时,将该第二音量值设定为音量阈值(如步骤S3233所示),即一开始可以先从比较大范围的音量值开始搜寻,如果搜寻结果发现可藏入时间点的数量小于一预设可藏入时间点数量,例如:第二音频文件AF2总长度的1/3个数阈值,则将音量值开始降阶调整,直到搜寻到的可藏入时间点数量大于该预设可藏入时间点数量时,则将对应的该音量值设定为该音量阈值,但可实施的态样并不以此为限。
举例而言,初始阶段将第一音量值设定为-20dB,以搜寻第二音频文件AF2中音量大于-20dB并且符合该频率范围的区域为何,如果搜寻出来的可藏入时间点数量低于第二音频文件AF2总长度的1/3个数阈值时,代表第一音量值设定太高,则将第一音量值降阶调整为第二音量值,第二音量值可设定为-25dB,至于音量值的降阶调整程度可如:-20dB、-25dB、-30dB、-35dB、-40dB、-45dB所示,直到搜寻到的可藏入时间点数量大于第二音频文件AF2总长度1/3的个数,例如:第二音频文件AF2总长度时间为三分钟,预设可藏入时间点数量为第二音频文件AF2的1/3长度,即为一分钟长度,若以秒为单位,代表预设可藏入时间点数量为60,搜寻到的可藏入时间点数量至少要有60点以上,若设定的第一音量值无法符合需求则采取自动降阶调整音量值,则调降成第二音量值后再去搜寻可藏入时间点数量,如果执行到最后这些条件都不成立,就代表此第二音频文件AF2过于小声,不适合进行混音。
请参阅图3E,在一些实施例中,可将第二音频文件AF2分割成多个段落(如步骤S3241所示),后续,每一段落则以自动降阶调整音量值的方法,即图3D所示的步骤S3231、S3232、S3233,来设定每一段落所对应的音量阈值(如步骤S3242所示)。举例而言,当第二音频文件AF2为一首3分钟长度的歌曲时,可将歌曲分成三个段落,一个段落为1分钟歌曲长度,针对这些段落来套用图3D所示的步骤S3231、S3232、S3233所述的自动降阶调整音量值的方法,即可找出适合每一段落的音量阈值。此方法就可以针对音量幅度变化较大的歌曲,依照音量大小分布来做音量阈值最佳适应性的调整。
请再参阅图3A及图3F,其中图3F为使用图3A的流程在第二音频文件的波形中所找出的可藏入时间点位置示意图,在步骤S32之后,混合部件112将根据介于该频率范围及大于该音量阈值的条件,在第二音频文件AF2的波形中找出符合介于该频率范围及大于该音量阈值条件的至少一波形区域A,并将该波形区域A的波峰点P所对应的时间,即将每一波峰点P垂直对应至符合该音量阈值条件的位置,设定为该可藏入时间点T,以在第二音频文件AF2中找出可藏入时间点T的位置(如步骤S33所示)。最后,于第二音频文件AF2的可藏入时间点T附近将含有该藏匿信息的第一音频文件AF1利用混音的方式合成至第二音频文件AF2中,以形成具有该藏匿信息的第三音频文件AF3(如步骤S34所示),利用这种掩盖方式将含有藏匿数据的第一音频文件AF1的噪声声音给覆盖住,使得人耳不会察觉到含有藏匿数据的第一音频文件AF1的杂音,让藏匿数据可以随着第三音频文件AF3的音乐散发出去。
当然,本申请的音频文件合成方法对于第二音频文件AF2的波形中可藏入时间点位置的找寻方法并不局限于图3A的步骤S33所述的步骤,请参阅图4A、4B,其中图4A为本申请第四优选实施例的音频文件合成方法的流程图,图4B为使用图4A的流程于第二音频文件的波形中所找出的可藏入时间点位置示意图,如图所示,在步骤S31、S32之后,混合部件112将根据介于该频率范围及大于该音量阈值的条件,在第二音频文件AF2的波形中找出符合介于该频率范围及大于该音量阈值条件的至少一波形区域A,并将每一波形区域A的起点位置及终点位置设定为可藏入时间点T,以于第二音频文件AF2中找出可藏入时间点T的位置(如步骤S41所示)。至于,图4A所示的步骤S31-32及步骤S34的实施例已详述于第三优选实施例中,于此不再重复提出说明。
请参阅图5A、5B,其中图5A为本申请第五优选实施例的音频文件合成方法的流程图,图5B为使用图5A的流程于第二音频文件的波形中所找出的可藏入时间点位置示意图,如图所示,在步骤S31、S32之后,混合部件112将根据介于该频率范围及大于该音量阈值的条件,在第二音频文件AF2的波形中找出符合介于该频率范围及大于该音量阈值条件的至少一波形区域A,并将每一该波型区域A的起点位置设定为第一该可藏入时间点T1,并根据每一该波形区域A的时间长度以及该第二音频文件AF2的一单位间隔藏入时间t来设定接续的该可藏入时间点T2(如步骤S51所示)。举例而言:如图5B所示,假设一波形区间A1的时间长度为0.5秒,而含有隐藏信息的第二音频文件AF2的单位间隔藏入时间t为0.25秒,则可以判断此波形区间A1可设置两个可藏入时间点T,其中第一可藏入时间点T1为波形区间A1的起点位置,而第二可藏入时间点T2为经过一单位间隔藏入时间t后的接续点。至于,图5A所示的步骤S31-32及步骤S34的实施例已详述于第三优选实施例中,在此不再重复提出说明。
请参阅图6A、6B,其中图6A为本申请第六优选实施例的音频文件合成方法的流程图,图6B为使用图6A的流程在第二音频文件的波形中所找出的可藏入时间点位置示意图,如图所示,本实施例的音频文件合成方法可包含下列步骤:首先,藉由分析部件111、211对第一音频文件AF1进行分析,可获得关于第一音频文件AF1的频率,并根据第一音频文件AF1的频率来设定一频率范围(如步骤S61所示),接着,设定一单位搜寻时间(如步骤S62所示),其中,该单位搜寻时间可由一操作者直接手动来进行设定,但不以此为限。
接着,请再参阅图6B及图6C,其中图6C为图6B中B区域的放大示意图,混合部件112将根据该单位搜寻时间及介于该频率范围的条件,在每一该单位搜寻时间内找出在第二音频文件AF2的波形中符合介于该频率范围条件的波形区域,并将波形区域的波峰点P所对应的时间设定为可藏入时间点T(如步骤S63所示),最后,混合部件112将含有该藏匿信息的第一音频文件的音量调降至低于该波形区域的该波峰点P所对应的音量,并将调降音量后的第一音频文件AF1在该波峰点P所对应的可藏入时间点附近合成至该第二音频文件AF2中,以形成具有该藏匿信息的该第三音频文件AF3(如步骤S64所示)。
举例而言,假设第二音频文件AF2为具有三分钟长度的歌曲,并设定单位搜寻时间为1秒搜寻一次,则整首第二音频文件AF2总共可有180个可藏入时间点,在每1秒的单位搜寻时间当中,找到第二音频文件AF2的波形中符合介于该频率范围条件的波形区域的波峰点P。请参阅图6C,假设此波峰点P所对应的音量为-25dB,则在此波峰点P对应的可藏入时间点T的位置插入低于-25dB,例如:-30dB,的含有该藏匿信息的第一音频文件AF1,即可形成具有该藏匿信息的该第三音频文件AF3。
请参阅图7A、7B,其中图7A为本申请第七优选实施例的音频文件合成方法的流程图,图7B为使用图7A的流程在第二音频文件的波形中所找出的可藏入时间点位置示意图,如图所示,本实施例的音频文件合成方法可包含下列步骤:首先,藉由分析部件111、211对第一音频文件AF1进行分析,可获得关于第一音频文件AF1的频率,并根据第一音频文件AF1的频率来设定一频率范围(如步骤S71所示),接着,设定一音量区间(如步骤S72所示),其中,该音量区间可由一操作者直接手动来进行设定,但不以此为限。
接着,请再参阅图7B及图7C,其中图7C为图7B中C区域的放大示意图,在步骤S72之后,混合部件112将根据介于该音量区间及该频率范围的条件,在该音量区间中找出于第二音频文件AF2的波形中符合介于该频率范围条件的波形区域,并将波形区域的波峰点P所对应的时间设定为可藏入时间点T(如步骤S73所示),最后,混合部件112将含有该藏匿信息的第一音频文件的音量调降至低于该波形区域的该波峰点P所对应的音量,并将调降音量后的第一音频文件AF1于该波峰点P所对应的可藏入时间点附近合成至该第二音频文件AF2中,以形成具有该藏匿信息的该第三音频文件AF3(如步骤S74所示)。
举例而言,在一些实施例中,设定音量区间为-25dB~-40dB,在音量区间为-25dB~-40dB的区间中,寻找第二音频文件AF2的波形中符合介于该频率范围条件的波形区域的波峰点P,请参阅图7C,假设此波峰点P所对应的音量为-30dB,则在此波峰点P对应的可藏入时间点T的位置插入低于-30dB,例如:-35dB,的含有该藏匿信息的第一音频文件AF1,即可形成具有该藏匿信息的该第三音频文件AF3。
综上所述,本申请的音频文件合成方法及其所适用的音频文件合成系统藉由分析含有一藏匿信息的第一音频文件来设定一频率范围,并根据介于该频率范围及大于一音量阈值的条件,在该第二音频文件中找出至少一个可藏入时间点位置,进而在该可藏入时间点附近将含有该藏匿信息的该第一音频文件利用混音的方式合成至该第二音频文件中,以形成具有该藏匿信息的一第三音频文件,利用这种掩盖方式将含有藏匿数据的第一音频文件的噪声声音给覆盖住,使得人耳不会察觉到含有藏匿数据的第一音频文件的杂音,让藏匿数据可以随着第三音频文件的音乐散发出去,而包含藏匿信息的第一音频文件可以通过声音传输数据的技术,让应用范围更广泛且可加强传输信号的范围。
另外,本申请也可根据一单位搜寻时间及介于该频率范围的条件找出第二音频文件中的可藏入时间点位置,或是根据介于一音量区间及频率范围的条件找出可藏入时间点的位置,进而在该可藏入时间点附近将含有该藏匿信息的该第一音频文件利用混音的方式合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件,以使含有该藏匿信息的该第一音频文件的声音会被第二音频文件给掩盖住,以维持良好的播放质量。
本申请得由本领域技术人员任施匠思而为诸般修饰,然皆不脱如附权利要求书所欲保护的范围。
Claims (19)
1.一种音频文件合成方法,用以将含有藏匿信息的第一音频文件合成至第二音频文件中,至少包含步骤:
分析该第一音频文件,以设定频率范围;
根据介于该频率范围及大于音量阈值的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及
在该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件。
2.如权利要求1所述的音频文件合成方法,其中该音量阈值由操作者进行设定。
3.如权利要求1所述的音频文件合成方法,其中该音量阈值为该第二音频文件的平均音量值。
4.如权利要求1所述的音频文件合成方法,其中该音量阈值的设定方式为:
根据介于该频率范围及大于第一音量值的条件找出在该第二音频文件中该可藏入时间点的数量;
若在该可藏入时间点的数量小于预设可藏入时间点数量时,将该第一音量值调降为第二音量值;
根据介于该频率范围及大于该第二音量值的条件找出于该第二音频文件中该可藏入时间点的数量;以及
若在该可藏入时间点的数量大于该预设可藏入时间点数量时,将该第二音量值设定为该音量阈值。
5.如权利要求1所述的音频文件合成方法,其中还包含步骤:
将该第二音频文件分割成多个段落;以及
根据该多个段落分别设定对应的音量阈值,以在该第二音频文件中找出该可藏入时间点位置。
6.如权利要求1所述的音频文件合成方法,其中该可藏入时间点位置的找寻步骤为:
在该第二音频文件的波形中找出符合介于该频率范围及大于该音量阈值条件的至少一波形区域;以及
将该波形区域的波峰点所对应的时间设定为该可藏入时间点。
7.如权利要求1所述的音频文件合成方法,其中该可藏入时间点位置的找寻步骤为:
在该第二音频文件的波形中找出符合介于该频率范围及大于该音量阈值条件的至少一波形区域;以及
将该波形区域的起点位置及终点位置设定为该可藏入时间点。
8.如权利要求1所述的音频文件合成方法,其中该可藏入时间点位置的找寻步骤为:
在该第二音频文件的波形中找出符合介于该频率范围及大于该音量阈值条件的至少一波形区域;以及
将该波型区域的起点位置设定为第一该可藏入时间点,并根据该波形区域的时间长度以及该第二音频文件的单位间隔藏入时间来设定接续的该可藏入时间点。
9.一种音频文件合成方法,用以将含有藏匿信息的第一音频文件合成至第二音频文件中,至少包含步骤:
分析该第一音频文件,以设定频率范围;
根据单位搜寻时间及介于该频率范围的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及
在该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件。
10.如权利要求9所述的音频文件合成方法,其中该可藏入时间点位置的找寻步骤为:在该单位搜寻时间内找出该第二音频文件的波形中符合介于该频率范围条件的波形区域,并将该波形区域的至少一波峰点所对应的时间设定为该可藏入时间点。
11.如权利要求10所述的音频文件合成方法,其中还包含步骤:将含有该藏匿信息的该第一音频文件的音量调降至低于该波形区域的该波峰点所对应的音量,并在该可藏入时间点附近合成至该第二音频文件中,以形成具有该藏匿信息的该第三音频文件。
12.一种音频文件合成方法,用以将含有藏匿信息的第一音频文件合成至第二音频文件中,至少包含步骤:
分析该第一音频文件,以设定频率范围;
根据介于音量区间及该频率范围的条件,在该第二音频文件中找出至少一个可藏入时间点位置;以及
在该可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件。
13.如权利要求12所述的音频文件合成方法,其中该可藏入时间点位置的找寻步骤为:在该音量区间中找出该第二音频文件的波形中符合介于该频率范围条件的波形区域,并将该波形区域的至少一波峰点所对应的时间设定为该可藏入时间点。
14.如权利要求13所述的音频文件合成方法,其中还包含步骤:将含有该藏匿信息的该第一音频文件的音量调降至低于该波形区域的该波峰所对应的音量,并在该可藏入时间点附近合成至该第二音频文件中,以形成具有该藏匿信息的该第三音频文件。
15.一种音频文件合成系统,至少包含:
合成装置,接收含有藏匿信息的第一音频文件及第二音频文件,包含:
分析部件,对该第一音频文件及该第二音频文件进行分析,以分别获得频率范围及音量阈值;
混合部件,在该第二音频文件的至少一个可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件,其中该可藏入时间点位置根据介于该频率范围及大于该音量阈值的条件所找出;
接收装置,其接收该第三音频文件并具有应用程序,使该应用程序从该第三音频文件中获取该藏匿信息。
16.如权利要求15所述的音频文件合成系统,其中该音量阈值为该第二音频文件的平均音量值。
17.如权利要求15所述的音频文件合成系统,其中该音量阈值
根据介于该频率范围及大于第一音量值的条件找出于该第二音频文件中该可藏入时间点的数量,在该可藏入时间点的数量小于预设可藏入时间点数量时,将该第一音量值调降为第二音量值,并根据介于该频率范围及大于该第二音量值的条件找出于该第二音频文件中该可藏入时间点的数量,在该可藏入时间点的数量大于该预设可藏入时间点数量时,该第二音量值设定为该音量阈值。
18.一种音频文件合成系统,至少包含:
合成装置,接收含有藏匿信息的第一音频文件及第二音频文件,包含:
分析部件,对该第一音频文件进行分析,以获得频率范围;
混合部件,在该第二音频文件的至少一个可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件,其中该可藏入时间点位置根据单位搜寻时间及介于该频率范围的条件找出;以及
接收装置,其接收该第三音频文件并具有应用程序,使该应用程序从该第三音频文件中获取该藏匿信息。
19.一种音频文件合成系统,至少包含:
合成装置,接收含有藏匿信息的第一音频文件及第二音频文件,包含:
分析部件,对该第一音频文件进行分析,以获得频率范围;
混合部件,在该第二音频文件的至少一个可藏入时间点附近将含有该藏匿信息的该第一音频文件合成至该第二音频文件中,以形成具有该藏匿信息的第三音频文件,其中该可藏入时间点位置根据介于音量区间及该频率范围的条件找出;
接收装置,其接收该第三音频文件并具有应用程序,使该应用程序从该第三音频文件中获取该藏匿信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103133621 | 2014-09-26 | ||
TW103133621A TWI556226B (zh) | 2014-09-26 | 2014-09-26 | 音訊檔案合成方法及其所適用之音訊檔案合成系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104599666A true CN104599666A (zh) | 2015-05-06 |
CN104599666B CN104599666B (zh) | 2018-02-09 |
Family
ID=53125400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510037440.9A Active CN104599666B (zh) | 2014-09-26 | 2015-01-26 | 音频文件合成方法及其所适用的音频文件合成系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104599666B (zh) |
TW (1) | TWI556226B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105810231A (zh) * | 2016-01-26 | 2016-07-27 | 威盛电子股份有限公司 | 多媒体文件的播放方法与播放装置 |
CN109187743A (zh) * | 2018-08-27 | 2019-01-11 | 深圳市刻锐智能科技有限公司 | 玻璃破碎检测方法、玻璃破碎报警器及存储介质 |
CN109979488A (zh) * | 2019-03-14 | 2019-07-05 | 浙江大学 | 基于重音分析的人声转乐谱系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI661421B (zh) * | 2018-04-12 | 2019-06-01 | 中華電信股份有限公司 | 具音訊浮水印之系統及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1191356A (zh) * | 1996-11-27 | 1998-08-26 | 国际商业机器公司 | 数据隐藏方法及数据析取方法 |
CN1452100A (zh) * | 2003-05-27 | 2003-10-29 | 无敌科技(西安)有限公司 | 一种从声音数据中辩别音乐数据的方法 |
CN1571444A (zh) * | 2004-04-23 | 2005-01-26 | 哈尔滨工业大学 | 隐密电话 |
US6850910B1 (en) * | 1999-10-22 | 2005-02-01 | Matsushita Electric Industrial Co., Ltd. | Active data hiding for secure electronic media distribution |
US20060198557A1 (en) * | 2003-04-08 | 2006-09-07 | Van De Kerkhof Leon M | Fragile audio watermark related to a buried data channel |
CN101918999A (zh) * | 2007-11-12 | 2010-12-15 | 尼尔森(美国)有限公司 | 执行音频水印嵌入以及水印检测和提取的方法和设备 |
CN102047324A (zh) * | 2008-05-29 | 2011-05-04 | 因特拉松尼克斯有限公司 | 数据嵌入系统 |
CN103475467A (zh) * | 2013-08-29 | 2013-12-25 | 郑静晨 | 一种方舱医院语音对讲中的侧信道通信方法 |
US20140129011A1 (en) * | 2012-11-02 | 2014-05-08 | Dolby Laboratories Licensing Corporation | Audio Data Hiding Based on Perceptual Masking and Detection based on Code Multiplexing |
-
2014
- 2014-09-26 TW TW103133621A patent/TWI556226B/zh active
-
2015
- 2015-01-26 CN CN201510037440.9A patent/CN104599666B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1191356A (zh) * | 1996-11-27 | 1998-08-26 | 国际商业机器公司 | 数据隐藏方法及数据析取方法 |
US6850910B1 (en) * | 1999-10-22 | 2005-02-01 | Matsushita Electric Industrial Co., Ltd. | Active data hiding for secure electronic media distribution |
US20060198557A1 (en) * | 2003-04-08 | 2006-09-07 | Van De Kerkhof Leon M | Fragile audio watermark related to a buried data channel |
CN1452100A (zh) * | 2003-05-27 | 2003-10-29 | 无敌科技(西安)有限公司 | 一种从声音数据中辩别音乐数据的方法 |
CN1571444A (zh) * | 2004-04-23 | 2005-01-26 | 哈尔滨工业大学 | 隐密电话 |
CN101918999A (zh) * | 2007-11-12 | 2010-12-15 | 尼尔森(美国)有限公司 | 执行音频水印嵌入以及水印检测和提取的方法和设备 |
CN102047324A (zh) * | 2008-05-29 | 2011-05-04 | 因特拉松尼克斯有限公司 | 数据嵌入系统 |
US20140129011A1 (en) * | 2012-11-02 | 2014-05-08 | Dolby Laboratories Licensing Corporation | Audio Data Hiding Based on Perceptual Masking and Detection based on Code Multiplexing |
CN103475467A (zh) * | 2013-08-29 | 2013-12-25 | 郑静晨 | 一种方舱医院语音对讲中的侧信道通信方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105810231A (zh) * | 2016-01-26 | 2016-07-27 | 威盛电子股份有限公司 | 多媒体文件的播放方法与播放装置 |
TWI578772B (zh) * | 2016-01-26 | 2017-04-11 | 威盛電子股份有限公司 | 多媒體檔案的播放方法與播放裝置 |
CN105810231B (zh) * | 2016-01-26 | 2019-01-25 | 威盛电子股份有限公司 | 多媒体文件的播放方法与播放装置 |
CN109187743A (zh) * | 2018-08-27 | 2019-01-11 | 深圳市刻锐智能科技有限公司 | 玻璃破碎检测方法、玻璃破碎报警器及存储介质 |
CN109187743B (zh) * | 2018-08-27 | 2021-04-13 | 深圳市刻锐智能科技有限公司 | 玻璃破碎检测方法、玻璃破碎报警器及存储介质 |
CN109979488A (zh) * | 2019-03-14 | 2019-07-05 | 浙江大学 | 基于重音分析的人声转乐谱系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104599666B (zh) | 2018-02-09 |
TWI556226B (zh) | 2016-11-01 |
TW201612894A (en) | 2016-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11611843B2 (en) | Dynamic positional audio | |
TWI759223B (zh) | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 | |
CN105632508B (zh) | 音频处理方法及音频处理装置 | |
US11474775B2 (en) | Sound effect adjustment method, device, electronic device and storage medium | |
CN104599666A (zh) | 音频文件合成方法及其所适用的音频文件合成系统 | |
CN105808182B (zh) | 显示控制方法及系统、广告破口判断装置、影音处理装置 | |
CN104683294A (zh) | 一种数据处理方法和系统 | |
US20130326575A1 (en) | Social Media Driven Generation of a Highlight Clip from a Media Content Stream | |
CN105159639A (zh) | 音频封面显示方法及装置 | |
CN105228050A (zh) | 终端上耳机音质的调整方法以及装置 | |
US20140336799A1 (en) | Discovery of music artist and title via companionship between a cellular phone and a broadcast radio receiver | |
US20140335834A1 (en) | Discovery of music artist and title by a smart phone provisioned to listen to itself | |
WO2020199749A1 (zh) | 基于反馈的信息推送方法、装置及电子设备 | |
Burri | Contemplating a'Public service navigator': in search of new (and better) functioning public service media | |
US20140336797A1 (en) | Audio content monitoring and identification of broadcast radio stations | |
CN103327156A (zh) | 一种语音文件输出方法及装置 | |
CN104980773A (zh) | 一种流媒体处理方法、装置、终端及服务器 | |
CN104038774B (zh) | 生成铃声文件的方法及装置 | |
CN103747277A (zh) | 一种多媒体节目识别方法和装置 | |
US10468018B2 (en) | Methods and systems for recognizing audio played and recording related video for viewing | |
CN110602553B (zh) | 媒体文件播放中的音频处理方法、装置、设备及存储介质 | |
CN104038772B (zh) | 生成铃声文件的方法及装置 | |
WO2023246823A1 (zh) | 一种视频播放方法、装置、设备及存储介质 | |
CN104778958A (zh) | 一种含噪声歌曲拼接的方法及装置 | |
CN111930338A (zh) | 一种音量推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |