CN103093782A - 一种dat缺失音频的数据识别和替换方法 - Google Patents

一种dat缺失音频的数据识别和替换方法 Download PDF

Info

Publication number
CN103093782A
CN103093782A CN2013100536866A CN201310053686A CN103093782A CN 103093782 A CN103093782 A CN 103093782A CN 2013100536866 A CN2013100536866 A CN 2013100536866A CN 201310053686 A CN201310053686 A CN 201310053686A CN 103093782 A CN103093782 A CN 103093782A
Authority
CN
China
Prior art keywords
sample segments
file
sample
master file
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100536866A
Other languages
English (en)
Other versions
CN103093782B (zh
Inventor
叶丹
李柏岩
王良鸣
宋晖
王劲松
闵友钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI XIEYAN SCIENCE AND TECHNOLOGY SERVICE Co Ltd
SHANGHAI MEDIA GROUP Inc
Original Assignee
SHANGHAI XIEYAN SCIENCE AND TECHNOLOGY SERVICE Co Ltd
SHANGHAI MEDIA GROUP Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI XIEYAN SCIENCE AND TECHNOLOGY SERVICE Co Ltd, SHANGHAI MEDIA GROUP Inc filed Critical SHANGHAI XIEYAN SCIENCE AND TECHNOLOGY SERVICE Co Ltd
Priority to CN201310053686.6A priority Critical patent/CN103093782B/zh
Publication of CN103093782A publication Critical patent/CN103093782A/zh
Application granted granted Critical
Publication of CN103093782B publication Critical patent/CN103093782B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种DAT缺失音频的数据识别和替换方法,包括使用DAT转录机对磁带进行转录两次,得到主文件和辅文件;将辅文件相对于主文件对齐;在辅文件中搜索与各个主文件样本段相匹配的样本段,得到主文件和辅文件的样本段的匹配关系;分析匹配关系,得到可用的主文件样本段和辅文件样本段;建立新文件,按顺序将主文件的样本段写入新文件,可用的样本段直接写入新文件,不可用的样本段用辅文件中的与之匹配的可用样本段替换后写入新文件,该新文件是对DAT缺失音频修复好的文件。本发明的DAT缺失音频的数据识别和替换方法,对转录的音频文件出现的缺失音频的识别能力很高,又通过替换方法,对DAT缺失音频进行了有效修复。

Description

一种DAT缺失音频的数据识别和替换方法
技术领域
本发明涉及一种数据识别和替换方法,尤其涉及一种缺失音频数据的识别和替换方法。
背景技术
Audio DAT是一种用于磁带数字录音的专业品质级别的标准媒体和技术。
Audio DAT设备是一个数字磁带转录机,大多数的Audio DAT转录机都能以44.1千赫、CD音频标准录音。DAT已经成为掌握录音的专业和半专业环境中的标准存档技术。
Audio DAT转录机在转录过程中经过一次模拟音频信号转换,由于其本身固有的缺陷,转录得到的音频数据会被转录过程中产生的噪音干扰,而且用Audio DAT转录机器转录数据时还会随机产生小段的扭曲、丢失等现象。这些转录数据出现的噪音干扰和扭曲、缺失现象大致分为两种情况:1.数据缺失,即缺失数据段的样本值为0;2.数据畸变,即声音样本未出现断音现象,只是声音质量下降。对于这两种情况,数据缺失比较容易辨识,而数据畸变比较复杂,需要通过多种方法综合使用才能识别和修复。这种数据缺失畸变的情况不是个别机器出现的偶然现象,而是几乎每台机器在转录时都会发生的,只是出现的频率或时间不同。这种转录过程出现的不可避免的数据缺失畸变情况严重影响了转录出的数字音频文件的文化特色和音质特点。
由于目前DAT技术逐步退出了市场,这种DAT转录机已经停产,而厂家也不再提供技术支持,因此在硬件上修复转录得到的数字音频是不可能的。而到国外专门的修复机构去修复的话,成本会很高。因此必须考虑通过数字处理等技术手段来对转录得到的音频结果进行分析、研究,以找到修复方法、手段,实现对DAT的转录音频的修复。
因此,本领域的技术人员致力于开发一种音频数据的识别和替换方法,在DAT转录音频中找到可用的数据并对DAT音频进行替换修复。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种音频数据的识别和替换方法,通过对磁带的两次转录得到的两个转录音频文件,使用技术手段找到两个文件的音频数据的匹配关系,并根据匹配关系,对文件中的不可用数据段,即缺失数据段进行替换,修复音频数据。
为实现上述目的,本发明提供了一种DAT缺失音频的数据识别和替换方法,其特征在于,包括:
步骤100使用DAT转录机对DAT磁带进行第一次转录,得到第一次转录音频;再使用所述DAT转录机对所述磁带进行第二次转录,得到第二次转录音频;对所述第一转录音频和所述第二转录音频做归一化处理,再将其中长度较长的一个作为主文件,长度较短的一个作为辅文件;
步骤200将所述主文件和所述辅文件对齐;
步骤300将所述主文件分割成n个样本段,并对分割后的所述主文件的样本段赋予编号,得到样本段A1、样本段A2、…、样本段An,在所述辅文件中搜索与各个所述主文件样本段匹配的样本段作为所述辅文件的样本段,得到m个所述辅文件的样本段:样本段B1、样本段B2、…、样本段Bm;各个所述主文件样本段与各个所述辅文件样本段之间的匹配关系为:所述样本段B1与所述样本段A1匹配、所述样本段B2与所述样本段A2匹配、…、所述样本段Bm与所述样本段Am匹配,所述m≤n;建立所述匹配关系的匹配表;
步骤400分析所述的匹配表,找出所述主文件的样本段和所述辅文件的样本段中的可用样本段,并对各个所述可用样本段作标识;
步骤500建立新文件,按照所述编号顺序,依次将所述主文件和所述辅文件中的所述可用样本段写入所述新文件;
步骤600输出所述新文件;
步骤700结束。
进一步地,所述的第一转录音频和所述的第二转录音频的采样频率都为44.1kHz;所述第一转录音频和所述第二转录音频的长度都要大于3×217
进一步地,所述的步骤200中的所述主文件和所述辅文件的对齐包括:在所述辅文件中的前20%位置处取一个长度为217的样本段m,所述样本段m的起始位置为PBm,并在所述主文件的前10%-30%的范围内搜索与所述样本段m匹配的匹配样本段,根据所述的匹配样本段的起始位置来对齐所述主文件和所述辅文件。
进一步地,在所述主文件的前10%-30%的范围内搜索匹配的匹配样本段,包括:从所述主文件的10%的位置到所述主文件的30%的位置,按所述样本段m的长度分别选取多个样本段,计算所述样本段m和各个选取的所述样本段之间的匹配误差,与所述样本段m之间的所述匹配误差最小的选取的所述样本段就是所述样本段m的匹配样本段,所述匹配样本段的起始位置为Pmin
进一步地,所述的根据所述的匹配样本段的起始位置来对齐所述主文件和所述辅文件,包括:
若Pmin<0,则对齐失败,直接跳入所述步骤700,结束;
若Pmin>PBm,则设定所述主文件上与所述辅文件匹配的起始位置PAh为:PAh=Pmin-PBm,所述辅文件上与所述主文件匹配的起始位置P Bh为所述辅文件的起始位置P B0
若Pmin<PBm,则设定所述主文件上与所述辅文件匹配的起始位置PAh为所述主文件的起始位置PA0,所述辅文件上与所述主文件匹配的起始位置PBh为:PBh=PBm-Pmin
若Pmin=PBm,则所述主文件和所述辅文件已对齐,设定所述主文件上与所述辅文件匹配的起始位置PAh为所述主文件的起始位置PA0,所述辅文件上与所述主文件匹配的起始位置P Bh为所述辅文件的起始位置P B0
进一步地,所述步骤300中的所述主文件的分割是从所述主文件的所述起始位置开始。
进一步地,对所述主文件的分割是等长度的分割,经过分割得到的所述各个主文件样本段的长度皆为214
进一步地,所述步骤300中在所述辅文件中搜索与各个所述主文件的样本段的匹配的样本段为:从所述样本段A2开始对所述主文件中的各个样本段在所述辅文件中搜索与其匹配的样本段,包括:对于所述样本段A2,从所述辅文件的起始位置开始,到27×214的范围内按所述样本段A2的长度在所述辅文件中分别选取多个样本段,计算出所述辅文件的各选取的所述样本段与所述主文件的样本段A2之间的匹配误差,与所述主文件的样本段A2之间的匹配误差最小的样本段即为所述样本段A2在所述辅文件中的匹配的样本段B2;对于所述主文件中在所述样本段A2之后的待匹配的样本段,从与所述主文件中所述待匹配的样本段的前一个样本段在所述辅文件中的匹配的样本段的末端开始,在27×214的范围内按长度为214在所述辅文件中分别选取多个样本段,计算出所述辅文件的各选取的所述样本段与所述待匹配的样本段之间的匹配误差,与所述待匹配的样本段之间的匹配误差最小的样本段即为所述待匹配的样本段在所述辅文件中的匹配的样本段。
进一步地,所述的步骤400中的所述的可用样本段的判断依据为:所述主文件的样本段在所述主文件中的位置为PA,根据所述匹配表,获得其在所述辅文件中的匹配的样本段和所述匹配的样本段在所述辅文件中的位置PB
若PA=PB,则所述主文件样本段和所述辅文件样本段为所述可用的所述主文件样本段和所述可用的所述辅文件样本段;
若PA>PB,则所述主文件样本段为所述可用的所述主文件样本段;
若PB>PA,则所述辅文件样本段为所述可用的所述辅文件样本段;
在所述辅文件中,若所述编号连续的两个样本段均为可用样本段,则所述编号连续的两个样本段之间的空隙段亦为可用样本段。
进一步地,在所述的步骤500中,依次将所述主文件和所述辅文件的所述可用样本段写入所述新文件中以构造所述新文件的各个样本段Ck,其中k=1、2、…、n,包括:
当k=1时,将所述主文件的样本段A1写入所述新文件以构造所述样本段C1;
当k>1时,
若所述主文件的样本段Ak是可用的,则直接将所述主文件的可用的样本段Ak写入所述新文件以构造所述样本段Ck;
若所述主文件的样本段Ak是不可用的,且所述辅文件中样本段Bk与样本段Bk-1之间无空隙段,则用所述辅文件的可用的样本段Bk替换所述主文件的不可用的样本段Ak,写入所述新文件以构造所述样本段Ck;
若所述主文件的样本段Ak是不可用的,且所述辅文件中的样本段Bk与样本段Bk-1之间具有空隙段并且此空隙段可用,则用所述辅文件的可用样本段Bk和此空隙段一起替换所述主文件的不可用样本段Ak,写入所述新文件以构造所述样本段Ck;
若所述主文件的样本段Ak是不可用的,且所述辅文件中的样本段Bk与样本段Bk-1之间具有的空隙段并且此空隙段不可用,则用所述辅文件的可用样本段Bk替换所述主文件的不可用样本段Ak,写入所述新文件以构造所述样本段Ck。
在本发明的较佳实施方式中,使用本发明的缺失音频的数据识别和替换方法对DAT磁带进行了音频修复,包括步骤:使用DAT转录机对DAT磁带进行第一次转录,获得的数字波形音频作为第一转录音频,使用上述DAT转录机对该DAT磁带进行第二次转录,获得的数字波形音频作为第二转录音频,其中,第一转录音频和第二转录音频的采样频率皆为44.1kHz;将第一转录音频和第二转录音频的数据进行归一化处理,并将其中长度较长的一个作为主文件,长度较短的一个作为辅文件。确定主文件上与辅文件匹配的起始位置,确定辅文件上与主文件匹配的起始位置,使辅文件相对于主文件对齐。等长度分割主文件,得到n个长度皆为214的样本段作为主文件样本段,并对各个主文件样本段进行编号;在辅文件上,从起始位置开始选取样本段,搜索辅文件中与各个编号的主文件样本段的匹配误差最小的样本段作为辅文件与主文件各个编号的样本段匹配的匹配样本段,得到各个主文件样本段与各个辅文件样本段之间的匹配关系。分析该匹配关系,得到可用的主文件样本段,可用的辅文件样本段和可用空隙段。建立新文件,依次将主文件和符文的可用样本段写入新文件,以构造新文件的各个样本段Ck,其中k=1、2、3、…、n:首先直接将主文件的可用样本段A1直接写入新文件的样本段C1,其次,当k>1时,若主文件样本段Ak是可用的,则直接将可用的主文件样本段Ak写入新文件的样本段以构造所述样本段Ck;若所述主文件的样本段Ak是不可用的,且辅文件中样本段Bk与样本段Bk-1之间无空隙段,则用辅文件的可用的样本段Bk替换主文件的不可用的样本段Ak,写入新文件以构造所述样本段Ck;若主文件的样本段Ak是不可用的,且辅文件中的样本段Bk与样本段Bk-1之间具有空隙段并且此空隙段可用,则用辅文件的可用样本段Bk和此空隙段一起替换主文件的不可用样本段Ak,写入新文件以构造所述样本段Ck;若主文件的样本段Ak是不可用的,且辅文件中的样本段Bk与样本段Bk-1之间具有的空隙段并且此空隙段不可用,则用辅文件的可用样本段Bk替换主文件的不可用样本段Ak,写入新文件以构造样本段Ck。该新文件就是对该DAT磁带的转录音频进行识别和替换后的数据。
由此可见,本发明的DAT缺失音频的数据识别和替换方法,通过对DAT磁带进行两次转录得到两个转录音频文件,分别为主文件和辅文件;然后对主文件和辅文件的样本段进行匹配,分析,得到主文件和辅文件的可用样本段;对于主文件中的不可用样本段用辅文件中与之匹配的可用样本段进行替换,得到缺失音频的数据识别和替换后的文件。该方法对缺失音频数据的识别能力很高,通过替换的方法,缺失的音频数据可以得到有效的修复,从而有利于转录DAT磁带以抢救这些磁带中存储的珍贵录音资料,而且本发明的数据识别和替换方法并不限于用于DAT磁带,还可用于其他磁带或存储媒介,因而具有广泛的应用领域和应用前景。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的DAT缺失音频的数据识别和替换方法的流程图;
图2是本发明的DAT缺失音频的数据识别和替换方法的文件对齐的一个示例的示意图;
图3是本发明的DAT缺失音频的数据识别和替换方法的文件对齐的另一个示例的示意图;
图4是本发明的DAT缺失音频的数据识别和替换方法的实施例的样本段匹配示意图和可用段标识;
图5是本发明的DAT缺失音频的数据识别和替换方法的实施例的新文件的写入示意图。
具体实施方式
下面结合附图来来具体说明本发明的实施例。
在本实施例中,如图1所示,应用本发明的DAT缺失音频的数据识别和替换方法对DAT磁带进行音频修复,包括步骤:
步骤100,首先使用一台DAT转录机对需要修复的磁带连续进行转录两次,转录后的音频文件分别为第一转录音频和第二转录音频,其中第一转录音频和第二转录音频的采样频率为44.1kHz;然后对第一转录音频和所述第二转录音频做归一化处理,使第一转录音频和第二转录音频的数据的值在-1.0~1.0的范围内,再将其中文件长度较长的一个作为主文件A,长度较短的一个作为辅文件B。典型地,转录音频的长度为228
步骤200,匹配主文件A和辅文件B,如图2和3所示,其中A表示主文件A,B表示辅文件B。
在辅文件的前20%位置处取长度为217的样本段m,该样本段m的起始位置为PBm,在主文件A的前10%-30%的范围内,按长度为217,从主文件A的10%的位置开始到主文件A的30%的位置,按步长为1调整取样位置,依次分别选取样本(即数据)c1、c2、…、ci作为样本段c,分别计算样本段m中的各个数据mi和样本段c中的各个样本c1、c2、…、ci之间误差并将误差之和作为匹配误差
V = &Sigma; i = 1 N = 2 17 | m i - c i | ,
其中N为样本段的长度,即217。调整样本段c的起始位置并计算其与样本段m的匹配误差,其中对应的匹配误差最小的样本段c就是样本段m在辅文件B中的匹配段,匹配样本段c的起始位置为Pmin
若Pmin<0,则对齐失败,直接进入步骤700;
若Pmin>PBm,设定主文件上与辅文件匹配的起始位置PAh为:PAh=Pmin-PBm,辅文件上与主文件匹配的起始位置P Bh为辅文件的起始位置PB0,如图2所示;
若Pmin<PBm,则设定主文件上与辅文件匹配的起始位置PAh为主文件的起始位置PA0,所述辅文件上与主文件匹配的起始位置PBh为:PBh=PBm-Pmin,如图3所示;
若Pmin=PBm,则主文件和辅文件已对齐,设定主文件上与辅文件匹配的起始位置PAh为主文件的起始位置PA0,辅文件上与主文件匹配的起始位置PBh为所述辅文件的起始位置PB0
步骤300匹配主文件A和辅文件B的样本段。
将主文件A按照长度为214从主文件A相对于辅文件B的起始位置开始分割成若干长度相同的样本段:样本段A1、样本段A2、样本段A3、…、样本段An。从样本段A2开始,在辅文件B中,搜索范围从其起始位置开始,开始在27×214的范围内,按步长为1依次选取长度为214的样本段中的各个样本b2j,计算主文件的样本段A2中的各个样本a2j和各选取的样本b2j之间误差并将误差之和作为样本段A2与辅文件B中的选取样本段之间的匹配误差
V 2 = &Sigma; j = 1 N = 2 14 | a 2 j - b 2 j | ,
其中N是样本段A2的长度,即214。在辅文件B中改变搜索范围的起始位置进行新的搜索并计算样本段A2与辅文件B中的选取样本段之间的匹配误差。改变起始位置的方法是,在辅文件B中从上一次搜索的起始位置朝辅文件B的尾部移动211个样本后的位置。样本段A2与辅文件B中的各个选取样本段之间的,匹配误差最小的辅文件B中的选取样本段就是辅文件B中与主文件A的样本段A2相匹配的样本段B2。然后按编号顺序,对于主文件A的样本段A3,在辅文件B中,从样本段A2在辅文件B中的样本段B2的末端开始,同样在27×214的范围内,按步长为1,依次选取长度为214的样本段中的各个样本b3j,计算样本段A3中的各个样本a3j与辅文件B中的各个样本b3j之间误差并将误差之和作为样本段A3与辅文件B中的选取样本段之间的匹配误差
V 3 = &Sigma; j = 1 N = 2 14 | a 3 j - b 3 j | ,
类似地获得样本段A3在辅文件B中的匹配样本段B3。依此类推,按主文件样本段的编号顺序,将主文件中待匹配的样本段,分别在辅文件B中,按27×214的搜索范围选取样本段,搜索范围的起始位置为主文件中待匹配的样本段的前一个样本段在辅文件中的匹配的样本段的末端,依次计算主文件A的样本段Ai和辅文件B的选取样本段之间的匹配误差
V i = &Sigma; j = 1 N = 2 14 | a ij - b ij | ,
其中N为样本段的长度,即214。依据匹配误差最小的原则,判断主文件A的样本段Ai在辅文件B中的匹配样本段。最后,将主文件A的各个样本段位置,辅文件B的各个匹配样本段位置按编号标识入匹配表中。
步骤400标识主文件A和辅文件B的可用样本段,具体如图4所示,其中A表示主文件A,B表示辅文件B,空白方框表示该样本段为不可用样本段,有阴影的方框表示该样本段为可用样本段:
根据匹配表,对于每一个主文件样本段和与其匹配的一个辅文件样本段,获取该主文件样本段在主文件A中的位置PA(其开始位置为相对于主文件A的文件头的位置),以及获取与主文件样本段匹配的辅文件的样本段在辅文件B中的位置PB(其开始位置为相对于辅文件B文件头的位置),
若PA=PB,该主文件和辅文件的样本段都为可用的,如样本段A1和B1,A2和B2;
若PA>PB,该主文件的样本段为可用的样本段,该辅文件的样本段为不可用的样本段;
若PB>PA,该主文件的样本段为不可用的样本段,该辅文件的样本段为可用样本段,如样本段A3和B3;
此外,在辅文件B中,若编号连续的两个样本段均为可用样本段,则编号连续的两个样本段之间的空隙段亦为可用样本段,如空隙段段BI3,样本段B2和B3均为可用样本段,所以空隙段BI3为可用样本段。
步骤500建立新文件C,根据匹配表,按编号顺序1、2、…、k、…、n,将可用样本段写入新文件C,过程如图5所示,图5中A表示主文件A,B表示辅文件B,C表示新文件C,空白方框表示该样本段为不可用样本段,有阴影的方框表示该样本段为可用样本段:
当k=1时,直接将主文件的可用样本段A1做为新文件C的样本段C1直接写入新文件C;
当k>1时,
若主文件的样本段Ak是可用的,则直接将主文件的可用样本段Ak做为新文件C的样本段Ck直接写入新文件C;如可用样本段A2做为样本C2直接写入新文件C;
若主文件A的样本段Ak是不可用的,且辅文件B中的样本段Bk和样本段Bk-1之间没有空隙段,则将辅文件B中的可用样本段Bk替换主文件A的不可用样本段Ak,做为新文件C的样本段Ck写入新文件C,如可用样本段B4替换不可用样本段A4,做为新文件C的样本段C4写入新文件C;
若主文件A的样本段Ak是不可用的,且辅文件B中的样本段Bk和样本段Bk-1之间的空隙段是可用的,则将辅文件B中的可用样本段Bk和该可用空隙段一起替换主文件A的不可用样本段Ak,做为新文件C的样本段Ck写入新文件C,如空隙段BI3和可用样本段B3一起替换不可用样本段A3,做为新文件C的样本段C3写入新文件C;
若主文件A的样本段Ak是不可用的,且辅文件B中的样本段Bk和样本段Bk-1之间的空隙段是不可用的,则将辅文件B的可用样本段Bk替换主文件的不可用样本段Ak,做为新文件C的样本段Ck写入新文件C。
步骤600输出步骤500中写入可用样本段的新文件C。
步骤700结束。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种DAT缺失音频的数据识别和替换方法,其特征在于,包括:
步骤(100)使用DAT转录机对DAT磁带进行第一次转录,得到第一次转录音频;再使用所述DAT转录机对所述磁带进行第二次转录,得到第二次转录音频;对所述第一转录音频和所述第二转录音频做归一化处理,再将其中长度较长的一个作为主文件,长度较短的一个作为辅文件;
步骤(200)将所述主文件和所述辅文件对齐;
步骤(300)将所述主文件分割成n个样本段,并对分割后的所述主文件的样本段赋予编号,得到样本段(A1)、样本段(A2)、…、样本段(An),在所述辅文件中搜索与各个所述主文件样本段匹配的样本段作为所述辅文件的样本段,得到m个所述辅文件的样本段:样本段(B1)、样本段(B2)、…、样本段(Bm);各个所述主文件样本段与各个所述辅文件样本段之间的匹配关系为:所述样本段(B1)与所述样本段(A1)匹配、所述样本段(B2)与所述样本段(A2)匹配、…、所述样本段(Bm)与所述样本段(Am)匹配,所述m≤n;建立所述匹配关系的匹配表;
步骤(400)分析所述的匹配表,找出所述主文件的样本段和所述辅文件的样本段中的可用样本段,并对各个所述可用样本段作标识;
步骤(500)建立新文件,按照所述编号顺序,依次将所述主文件和所述辅文件中的所述可用样本段写入所述新文件;
步骤(600)输出所述新文件;
步骤(700)结束。
2.如权利要求1所述的一种DAT缺失音频的数据识别和替换方法,其中所述的第一转录音频和所述的第二转录音频的采样频率都为44.1kHz;所述第一转录音频和所述第二转录音频的长度都要大于3×217
3.如权利要求1所述的一种DAT缺失音频的数据识别和替换方法,其中所述的步骤(200)中的所述主文件和所述辅文件的对齐包括:在所述辅文件中的前20%位置处选取一个长度为217的样本段(m),所述样本段(m)的起始位置为PBm,并在所述主文件的前10%-30%的范围内搜索与所述样本段(m)匹配的匹配样本段,根据所述的匹配样本段的起始位置来对齐所述主文件和所述辅文件。
4.如权利要求3所述的一种DAT缺失音频的数据识别和替换方法,其中在所述主文件的前10%-30%的范围内搜索匹配的匹配样本段,包括:从所述主文件的10%的位置到所述主文件的30%的位置,按所述样本段(m)的长度分别选取多个样本段,计算所述样本段(m)和各个选取的所述样本段之间的匹配误差,与所述样本段(m)之间的所述匹配误差最小的选取的所述样本段就是所述样本段(m)的匹配样本段,所述匹配样本段的起始位置为Pmin
5.如权利要求3所述的一种DAT缺失音频的数据识别和替换方法,其中所述的根据所述的匹配样本段的起始位置来对齐所述主文件和所述辅文件,包括:
若Pmin<0,则对齐失败,直接跳入所述步骤(700),结束;
若Pmin>PBm,则设定所述主文件上与所述辅文件匹配的起始位置(PAh)为:PAh=Pmin-PBm,所述辅文件上与所述主文件匹配的起始位置(P Bh)为所述辅文件的起始位置(P B0);
若Pmin<PBm,则设定所述主文件上与所述辅文件匹配的起始位置(PAh)为所述主文件的起始位置(PA0),所述辅文件上与所述主文件匹配的起始位置(PBh)为:PBh=PBm-Pmin
若Pmin=PBm,则所述主文件和所述辅文件已对齐,设定所述主文件上与所述辅文件匹配的起始位置(PAh)为所述主文件的起始位置(P A0),所述辅文件上与所述主文件匹配的起始位置(P Bh)为所述辅文件的起始位置(P B0)。
6.如权利要求1所述的一种DAT缺失音频的数据识别和替换方法,其中所述步骤(300)中的所述主文件的分割是从所述主文件的所述起始位置开始。
7.如权利要求6所述的一种DAT缺失音频的数据识别和替换方法,其中对所述主文件的分割是等长度的分割,经过分割得到的所述各个主文件样本段的长度皆为214
8.如权利要求6所述的一种DAT缺失音频的数据识别和替换方法,其中所述步骤(300)中在所述辅文件中搜索与各个所述主文件的样本段的匹配的样本段为:从所述样本段(A2)开始对所述主文件中的各个样本段在所述辅文件中搜索与其匹配的样本段,包括:对于所述样本段(A2),从所述辅文件的起始位置开始到27×214的范围内,按所述样本段(A2)的长度在所述辅文件中分别选取多个样本段,计算出所述辅文件的各选取的所述样本段与所述主文件的样本段(A2)之间的匹配误差,与所述主文件的样本段(A2)之间的匹配误差最小的样本段即为所述样本段(A2)在所述辅文件中的匹配的样本段(B2);对于所述主文件中在所述样本段(A2)之后的待匹配的样本段,从与所述主文件中所述待匹配的样本段的前一个样本段在所述辅文件中的匹配的样本段的末端开始,在27×214的范围内按长度为214在所述辅文件中分别选取多个样本段,计算出所述辅文件的各选取的所述样本段与所述待匹配的样本段之间的匹配误差,与所述待匹配的样本段之间的匹配误差最小的样本段即为所述待匹配的样本段在所述辅文件中的匹配的样本段。
9.如权利要求1所述的一种DAT缺失音频的数据识别和替换方法,其中所述的步骤(400)中的所述的可用样本段的判断依据为:所述主文件的样本段在所述主文件中的位置为PA,根据所述匹配表,获得其在所述辅文件中的匹配的样本段和所述匹配的样本段在所述辅文件中的位置PB
若PA=PB,则所述主文件样本段和所述辅文件样本段为所述可用的所述主文件样本段和所述可用的所述辅文件样本段;
若PA>PB,则所述主文件样本段为所述可用的所述主文件样本段;
若PB>PA,则所述辅文件样本段为所述可用的所述辅文件样本段;
在所述辅文件中,若所述编号连续的两个样本段均为可用样本段,则所述编号连续的两个样本段之间的空隙段亦为可用样本段。
10.如权利要求1所述的一种DAT缺失音频的数据识别和替换方法,其中在所述的步骤(500)中,依次将所述主文件和所述辅文件的所述可用样本段写入所述新文件中以构造所述新文件的各个样本段(Ck),其中k=1、2、…、n,包括:
当k=1时,将所述主文件的样本段(A1)写入所述新文件以构造所述样本段(C1);
当k>1时,
若所述主文件的样本段(Ak)是可用的,则直接将所述主文件的可用的样本段(Ak)写入所述新文件以构造所述样本段(Ck);
若所述主文件的样本段(Ak)是不可用的,且所述辅文件中样本段(Bk)与样本段(Bk-1)之间无空隙段,则用所述辅文件的可用的样本段(Bk)替换所述主文件的不可用的样本段(Ak),写入所述新文件以构造所述样本段(Ck);
若所述主文件的样本段(Ak)是不可用的,且所述辅文件中的样本段(Bi)与样本段(Bk-1)之间具有空隙段并且此空隙段可用,则用所述辅文件的可用样本段(Bk)和此空隙段一起替换所述主文件的不可用样本段(Ak),写入所述新文件以构造所述样本段(Ck);
若所述主文件的样本段(Ak)是不可用的,且所述辅文件中的样本段(Bk)与样本段(Bk-1)之间具有的空隙段并且此空隙段不可用,则用所述辅文件的可用样本段(Bk)替换所述主文件的不可用样本段(Ak),写入所述新文件以构造所述样本段(Ck)。
CN201310053686.6A 2013-02-19 2013-02-19 一种dat缺失音频的数据识别和替换方法 Expired - Fee Related CN103093782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310053686.6A CN103093782B (zh) 2013-02-19 2013-02-19 一种dat缺失音频的数据识别和替换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310053686.6A CN103093782B (zh) 2013-02-19 2013-02-19 一种dat缺失音频的数据识别和替换方法

Publications (2)

Publication Number Publication Date
CN103093782A true CN103093782A (zh) 2013-05-08
CN103093782B CN103093782B (zh) 2016-01-06

Family

ID=48206276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310053686.6A Expired - Fee Related CN103093782B (zh) 2013-02-19 2013-02-19 一种dat缺失音频的数据识别和替换方法

Country Status (1)

Country Link
CN (1) CN103093782B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107293312A (zh) * 2017-06-09 2017-10-24 上海音乐学院 一种录像带音频信号的转录修复方法
CN108182953A (zh) * 2017-12-27 2018-06-19 上海传英信息技术有限公司 音频尾部pop音处理方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0753849A2 (en) * 1995-07-10 1997-01-15 Sony Corporation Signal processing device
CN1421857A (zh) * 1995-11-30 2003-06-04 索尼公司 数字音频信号处理装置及方法
CN1516169A (zh) * 1999-11-16 2004-07-28 ������������ʽ���� 复制控制方法
JP2006302501A (ja) * 2006-06-20 2006-11-02 Sony Corp 記録装置及び記録方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0753849A2 (en) * 1995-07-10 1997-01-15 Sony Corporation Signal processing device
CN1421857A (zh) * 1995-11-30 2003-06-04 索尼公司 数字音频信号处理装置及方法
CN1516169A (zh) * 1999-11-16 2004-07-28 ������������ʽ���� 复制控制方法
JP2006302501A (ja) * 2006-06-20 2006-11-02 Sony Corp 記録装置及び記録方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107293312A (zh) * 2017-06-09 2017-10-24 上海音乐学院 一种录像带音频信号的转录修复方法
CN108182953A (zh) * 2017-12-27 2018-06-19 上海传英信息技术有限公司 音频尾部pop音处理方法和装置
CN108182953B (zh) * 2017-12-27 2021-03-16 上海传英信息技术有限公司 音频尾部pop音处理方法和装置

Also Published As

Publication number Publication date
CN103093782B (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
US20220122609A1 (en) System and method of text zoning
CN109065031B (zh) 语音标注方法、装置及设备
CN101145346B (zh) 语音增强设备和语音记录设备及方法
CN102163460B (zh) 用于硬盘缺陷区域检测和分类的基于频率的方法
DE19916104A1 (de) Verfahren und Vorrichtung zur Erkennung von Defekten auf einer Platte in einem Plattenlaufwerk
CN103077709B (zh) 一种基于共有鉴别性子空间映射的语种识别方法及装置
CN104182335A (zh) 软件测试方法和装置
CN111326171B (zh) 一种基于简谱识别和基频提取的人声旋律提取方法及系统
CN107591167B (zh) 一种实现车载多媒体音频兼容性自动检测的方法及系统
CN102254554B (zh) 一种对普通话重音进行层次化建模和预测的方法
CN111312209A (zh) 文本到语音的转换处理方法、装置及电子设备
CN1522433A (zh) 提供帐单信息的方法和用来转录口述的方法及装置
CN103093782B (zh) 一种dat缺失音频的数据识别和替换方法
CN109213977A (zh) 庭审笔录的生成系统
CN104182657A (zh) 一种高通量转录组测序数据的分析方法
CN105513610A (zh) 一种声音分析方法及装置
CN107293312A (zh) 一种录像带音频信号的转录修复方法
CN100458457C (zh) 检查电路板及其设备的方法、设备和系统
CN103198849B (zh) 一种用于dat转录音频的音频修复方法及其系统
CN101350211B (zh) 光盘装置
CN102982827B (zh) 用于dat音频修复的音频数据的模式匹配方法
Liang et al. Ba-sot: Boundary-aware serialized output training for multi-talker asr
CN106971750A (zh) 歌词文件和音调文件对齐方法及装置
CN102360568A (zh) 一种并行异步存储器及其数据读取方法
Li et al. Adapting multi-lingual asr models for handling multiple talkers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160106

Termination date: 20210219

CF01 Termination of patent right due to non-payment of annual fee