CN108021675B - 一种多设备录音的自动切分对齐方法 - Google Patents

一种多设备录音的自动切分对齐方法 Download PDF

Info

Publication number
CN108021675B
CN108021675B CN201711284222.0A CN201711284222A CN108021675B CN 108021675 B CN108021675 B CN 108021675B CN 201711284222 A CN201711284222 A CN 201711284222A CN 108021675 B CN108021675 B CN 108021675B
Authority
CN
China
Prior art keywords
recording
time
long
recordings
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711284222.0A
Other languages
English (en)
Other versions
CN108021675A (zh
Inventor
吴妍
郑羲光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huiting Technology Corp
Original Assignee
Beijing Huiting Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huiting Technology Corp filed Critical Beijing Huiting Technology Corp
Priority to CN201711284222.0A priority Critical patent/CN108021675B/zh
Publication of CN108021675A publication Critical patent/CN108021675A/zh
Application granted granted Critical
Publication of CN108021675B publication Critical patent/CN108021675B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本发明公开一种多设备录音的自动切分对齐方法,包括步骤:将不同形式的多个原始录音对应处理成同一格式的多个长时录音;将多个所述长时录音中所包含的相同长时录音进行关联;利用短时参考录音对相关联的长时录音分别进行对齐,然后切分成与所述短时参考录音对应的短时录音。本发明解决了录制多设备语音识别数据库的数据处理中复杂的问题。

Description

一种多设备录音的自动切分对齐方法
技术领域
本发明涉及语音识别数据库制作技术领域,涉及一种多设备录音的自动切分对齐方法。
背景技术
在语音识别数据库制作过程中,通过利用多设备同时采集录音,可大幅提高录音的效率和多样性。例如,通过在录音中同时采集头戴麦克风、手机和麦克风阵列的信号,可保证信道的多样性,进而提高识别数据库的实用性,使得数据库可在远场识别、唤醒、降噪等应用中使用。由于同时存在近讲、远讲的对应数据,可方便评估远场识别、唤醒、降噪算法的性能。
然而在多设备录音采集的过程中,由于录音设备不同,各录音设备无法在时间上同时开始录音(即同时按下录音开关或发出录音命令);部分录音设备的录音丢帧问题和录音过程中的操作失误,给语音识别数据的后期处理带来一定挑战。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种用于语音识别数据库制作的多设备录音的自动切分对齐方法,通过以短时参考录音作为参考,实现自动分别地多个目标录音中的关联录音对齐,然后切分形成对应的短时录音存储在语音识别数据库中,从而实现将不同原始录音转化为语音识别系统可使用的短时录音。
为实现本发明的目的所采用的技术方案是:
一种多设备录音的自动切分对齐方法,包括步骤:
将不同形式的多个原始录音对应处理成同一格式的多个长时录音;
将多个所述长时录音中所包含的相同长时录音进行关联;
利用短时参考录音对相关联的长时录音分别进行对齐,然后切分成与所述短时参考录音对应的短时录音。
本发明中,所述长时录音是指不同录音设备自其录音开始时刻至结束时刻不间断采集的全部录音,包括有效录音与无效录音;所述短时录音指自所述长时录音中切分出的有效录音。
本发明中,所述原始录音包括原始短时录音与原始长时录音,分别通过以下步骤形成所述长时录音;
对原始长时录音,则在原始长时录音解压后进行统一格式转换,并按统一采样率对原始长时录音重新采样,从而形成所述长时录音;
对原始短时录音,则在原始短时录音解压后进行统一格式转换,并按统一采样率对原始短时录音重新采样后,将原始短时录音根据时间戳拼接成所述长时录音。
其中,利用短时参考录音对多个相关联的长时录音分别进行对齐,可以是采用在多个所述相关联的长时录音中分别搜索短时参考录音来实现。
进一步的,利用短时参考录音对多个相关联的长时录音分别进行对齐,还可以采用下方式实现:
分别截取相关联的长时录音和短时参考录音的头尾两段,计算相关联的长时录音和短时参考录音在录音开始阶段、结束阶段的录音偏移;
根据所述录音偏移获取短时参考录音在相关联的长时录音中的位置,然后利用该短时参考录音在相关联的长时录音中切出对应的短录音。
具体的,所述录音偏移的计算,可在原始时域信号上计算,或是在降噪后的时域信号上计算,或是在信号特征的域上计算。
其中,所述短时参考录音可以是对参考录音设备录制的长时参考录音切分而形成,或是参考录音设备直接录制的短时录音。
所述对参考录音设备录制的长时参考录音切分,是利用语音活动检测信息进行切分的。
本发明中,将多个所述长时录音中所包含的相同长时录音进行关联,是通过读取长时录音的内容,通过计算多个长时录音的内容的相关度来实现。
上述的所述相关度包括录音的时域相关度与音频特征序列的相关度。
本发明的多设备录音的自动切分对齐方法,通过对多不同录音设备的原始录音格式统一后,自动关联目标录音文件、对目标录音利用参考短时录音进行对齐后切分,能自动将多录音设备录制的不同格式的原始录音转化为语音识别系统使用的短时录音,解决了录制多设备语音识别数据库的数据处理复杂的问题。
附图说明
图1是多设备录音的自动切分对齐方法的处理流程示意图;
图2是对原始录音进行格式统一处理的流程示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参见图1-2所示,一种多设备录音的自动切分对齐方法,包括步骤:
将不同形式的多个原始录音对应处理成同一格式的多个长时录音;
将多个所述长时录音中所包含的相同长时录音进行关联;
利用短时参考录音对相关联的长时录音分别进行对齐,然后切分成与所述短时参考录音对应的短时录音。
所述切分成与所述短时参考录音对应的短时录音,存储在语音识别数据库中进行识别使用,从而实现将不同的原始录音转化为语音识别系统可使用的短时录音。
其中,不同形式的多个原始录音由不同的录音输入设备,如图1所示,由录音设备1、录音设备2……录音设备N输入,首先通过格式统一处理的步骤,将不同形式的多个原始录音对应处理成同一格式的多个长时录音,然后将同一格式的长时录音中的同一录音文件中的相同的录音文件进行关联,然后利用短时参考录音对相关联的长时录音分别进行对齐后,进行切分,即可实现形成语音识别数据库存储的录音,然后由录音设备1、录音设备2……录音设备N分别输出到语音识别数据库存储。
所述的原始录音,是来自于不同的录音设备,如头戴麦克风、手机和麦克风阵列等,由于各个录音设备的采集的录音的格式会存在不一致的可能,为了方便后续切分处理,本发明中,首先对不同的不同形式的多个原始录音对应处理成同一格式的多个长时录音,以便为后续处理提供处理的基础。
由于录音设备的不同,在采集音频的过程中,有可能形成的原始录音是原始短时录音,也有可能是原始长时录音,因此,针对原始短时录音与原始长时录音的处理,分别通过以下步骤形成相应的长时录音;
对原始长时录音,则在原始长时录音解压(与解密)后进行统一格式转换,并按统一采样率对原始长时录音重新采样,从而形成所述长时录音;
对原始短时录音,则在原始短时录音解压(与解密)后进行统一格式转换,并按统一采样率对原始短时录音重新采样后,将原始短时录音根据时间戳信息,拼接成所述长时录音。
对原始短时录音拼接具体可以是:
若Sk为第k个原始短时录音(1≤k≤K),K为自然数,Sk对应的时间戳为tk=[tk start,tk end],则对应时间戳t所拼接的长时录音S(t)为:
Figure BDA0001498102540000041
Sk(t)为时间戳t对应的第k个原始短时录音;tk start,tk end为Sk对应的时间戳的起始时刻与结束时刻。
其中,短时参考录音,可以由相应的录音参考设备选取,录音参考设备可根据录音文件信噪比选取信噪比高的设备作为录音参考设备,也可以根据实际录音项目需求来选取录音参考设备。
通过统一文件格式和采样率,并统一形成长时录音,方便后续处理。
本发明中,所述长时录音是指不同录音设备自其录音开始时刻至结束时刻不间断采集的全部录音,包括有效录音与无效录音;由于各个录音设备的开始和/或结束的时间不一定相同,采集音频中间的重录、暂停等过程都包含在长时录音中。
所述短时录音指自所述长时录音中按照切分规则所切分出的有效录音,通常为一完整的句子或段落等。
由于不同录音设备的启动、停止时间不同以及部分录音设备在录音过程中可能出现丢帧,暂停现象,因此在对其他录音设备的录音切分时,需要将短时参考录音与目标长时录音(即关联的相同长时录音)先进行对齐处理。
其中,利用短时参考录音对多个相关联的长时录音分别进行对齐,可以是采用在多个所述相关联的长时录音中分别搜索短时参考录音来实现,此方法需要对每句短录音都搜索,搜索范围比较大且容易导致对齐出错。
进一步的,利用短时参考录音对多个相关联的长时录音分别进行对齐,还可以采用下方式实现:
分别截取相关联的长时录音和短时参考录音的头尾两段,计算相关联的长时录音和短时参考录音在录音开始阶段、结束阶段的录音偏移;
根据所述录音偏移获取短时参考录音在相关联的长时录音中的位置,然后利用该短时参考录音在相关联的长时录音中切出对应的短录音。
以上方法,是通过计算目标长时录音和参考长时录音开始和结束阶段截取的对应信号间的互相关系数实现,可以提高对齐准确度,同时缩小搜索范围,具体如下:
步骤1:分别截取目标长时录音S1和参考长时录音S2的头尾两段,分别计算目标长时录音和参考长时录音在录音开始阶段、结束阶段的录音偏移量D1,D2,此处的偏移量指时间的偏移量,如由于目标长时录音S1和参考长时录音S2的采集设备按下录音开关的时刻不同,S1与S2间可能相差D秒,此处的录音偏移量即为D秒。若目标长时录音S1与参考长时录音S2长度为N,则若S1与S2未发生时间上的偏离,其二者信号间的互相关系数应在N+1处出现最大值;否则,D=互相关系数最大值-(N+1),其中,D为录音偏移量。
如果录音的头尾偏移D1=D2,则表明录音设备良好,参考设备t1时刻的录音在目标设备t1+D位置,直接进入步骤3;否则,表明录音过程中存在丢帧或者暂停等现象,进入步骤2;
步骤2:根据录音头尾偏移D1,D2,对于参考设备t1时刻开始,t2时刻结束的短录音,在目标长时录音的[D1+t1-delta,D2+t2+delta]范围内搜索对应录音,进而得到该短录音在目标设备上的位置,进入步骤3。其中delta为扩展的搜索时长(如1秒)。
步骤3:根据短时参考录音在目标长时录音的位置,切出目标长时录音所对应的短录音。
具体的,所述录音偏移的计算,可在原始时域信号上计算,或是在降噪后的时域信号上计算,或是在信号特征的域上计算。
其中,所述短时参考录音可以是参考录音设备直接录制的短时录音。
由于采用特定的录音软件可在录音过程中逐句录制,则不需要再次切分,可直接使用原始短时录音,直接采用该原始短时录音,作为短时参考录音,对要处理的目标长时录音进行对齐切分处理。
所述短时参考录音可以是对参考录音设备录制的长时参考录音切分而形成,如果所述对参考录音设备录制的长时参考录音切分,可以是利用语音活动检测信息进行切分的。
利用语音活动检测(VAD)信息进行切分:对于长时原始录音文件,可分析语音信号的VAD信息,进而根据预先定义的准则把长时录音切分成短句,可以根据语音信号停顿时长进行切分,一般在每句话结束时都有比在每句话进行中明显长的停顿。利用VAD信息可根据两段VAD检测值为真的句子中间的停顿长度进行切分。如发现连续停顿超过2秒即在停顿重点做一次切分。在对话数据库录制时,还可结合对话双方头戴式麦克风能量的大小,提高切分的精度。
由于在录音采集过程中,经常需要同时处理多人(段)的录音。因此,在多设备录音处理过程中,需要关联不同录音设备的录音,即找出某人(段)录音在不同录音设备中对应的文件,即将多个长时录音中包含的相同长时录音进行关联。
上述的,将多个长时录音中所包含的相同长时录音关联可以采用以下方式进行,如根据录音的文件名,录音的时长,录音的文件大小等信息关联。也可是通过读取长时录音的内容,通过计算多个长时录音的内容的相关度来实现。
根据读取录音文件内容,可通过计算录音文件间相关度进行关联。假如有N个录音设备,每个录音设备有M段录音。在短时录音拼接后仍出现多个文件,原因是某一个录音设备可能参与了多人的录音,文件都存入到了同一个存储设备中。以参考录音为基准,对于某个目标录音,可计算该目标录音所有文件与参考录音所有文件的相关度,得到一个M*M的录音相关度矩阵T。两个录音设备n1(1≤n1≤N),n2(1≤n2≤N),n1≠n2的两段录音
Figure BDA0001498102540000077
m1(1≤m1≤M),m2(1≤m2≤M),m1≠m2,的相关系数ρ12为:
Figure BDA0001498102540000071
其中,
Figure BDA0001498102540000072
E[·]为期望。则两个录音设备n1,n2的相关度矩阵T为:
Figure BDA0001498102540000073
基于相关度矩阵T,根据一定选取准则(如最大化关联后的总相关度),可得到目标录音文件与参考录音文件的一一对应关系。即与
Figure BDA0001498102540000074
关联度最高的
Figure BDA0001498102540000075
中m为
Figure BDA0001498102540000076
上述的所述相关度可以是录音的时域相关度,也可是音频特征序列的相关度。
以上关联的方法优点是可直接应用于所有设备,为降低计算复杂度。在实际系统中,可以通过简化相关度计算(例如在计算时域相关度时抽样),来减少计算复杂度。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种多设备录音的自动切分对齐方法,其特征在于,包括步骤:
将不同形式的多个原始录音对应处理成同一格式的多个长时录音;
将多个所述长时录音中所包含的相同长时录音进行关联;
利用短时参考录音对相关联的长时录音分别进行对齐,然后切分成与所述短时参考录音对应的短时录音;
利用短时参考录音对多个相关联的长时录音分别进行对齐,包括以下步骤:
分别截取相关联的长时录音和短时参考录音的头尾两段,计算相关联的长时录音和短时参考录音在录音开始阶段、结束阶段的录音偏移;
根据所述录音偏移获取短时参考录音在相关联的长时录音中的位置,然后利用该短时参考录音在相关联的长时录音中切出对应的短录音。
2.如权利要求1所述多设备录音的自动切分对齐方法,其特征在于,所述长时录音是指不同录音设备自其录音开始时刻至结束时刻不间断采集的全部录音,包括有效录音与无效录音;所述短时录音指自所述长时录音中切分出的有效录音。
3.如权利要求1所述多设备录音的自动切分对齐方法,其特征在于,所述原始录音包括原始短时录音与原始长时录音,分别通过以下步骤形成所述长时录音;
对原始长时录音,则在原始长时录音解压后进行统一格式转换,并按统一采样率对原始长时录音重新采样,从而形成所述长时录音;
对原始短时录音,则在原始短时录音解压后进行统一格式转换,并按统一采样率对原始短时录音重新采样后,将原始短时录音根据时间戳拼接成所述长时录音。
4.如权利要求1所述多设备录音的自动切分对齐方法,其特征在于,利用短时参考录音对多个相关联的长时录音分别进行对齐,是采用在多个所述相关联的长时录音中分别搜索短时参考录音来实现。
5.如权利要求1所述多设备录音的自动切分对齐方法,其特征在于,所述录音偏移的计算,可在原始时域信号上计算,或是在降噪后的时域信号上计算,或是在信号特征的域上计算。
6.如权利要求1所述多设备录音的自动切分对齐方法,其特征在于,所述短时参考录是对参考录音设备录制的长时参考录音切分而形成,或是参考录音设备直接录制的短时录音。
7.如权利要求6所述多设备录音的自动切分对齐方法,其特征在于,所述对参考录音设备录制的长时参考录音切分,是利用语音活动检测信息进行切分。
8.如权利要求1所述多设备录音的自动切分对齐方法,其特征在于,将多个所述长时录音中所包含的相同长时录音进行关联,是通过读取长时录音的内容,通过计算多个长时录音的内容的相关度来实现。
9.如权利要求8所述多设备录音的自动切分对齐方法,其特征在于,所述相关度包括录音的时域相关度与音频特征序列的相关度。
CN201711284222.0A 2017-12-07 2017-12-07 一种多设备录音的自动切分对齐方法 Active CN108021675B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711284222.0A CN108021675B (zh) 2017-12-07 2017-12-07 一种多设备录音的自动切分对齐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711284222.0A CN108021675B (zh) 2017-12-07 2017-12-07 一种多设备录音的自动切分对齐方法

Publications (2)

Publication Number Publication Date
CN108021675A CN108021675A (zh) 2018-05-11
CN108021675B true CN108021675B (zh) 2021-11-09

Family

ID=62078879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711284222.0A Active CN108021675B (zh) 2017-12-07 2017-12-07 一种多设备录音的自动切分对齐方法

Country Status (1)

Country Link
CN (1) CN108021675B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108769559B (zh) * 2018-05-25 2020-12-01 数据堂(北京)科技股份有限公司 多媒体文件的同步方法及装置
CN109166570B (zh) * 2018-07-24 2019-11-26 百度在线网络技术(北京)有限公司 一种语音切分的方法、装置、设备和计算机存储介质
CN109151705A (zh) * 2018-08-27 2019-01-04 北京爱数智慧科技有限公司 一种会议数据的对齐方法及相关设备
CN109195048B (zh) * 2018-09-03 2020-05-08 中科探索创新(北京)科技院 一种不失真录制耳机
CN110334240B (zh) * 2019-07-08 2021-10-22 联想(北京)有限公司 信息处理方法、系统及第一设备、第二设备
CN116758939B (zh) * 2023-08-21 2023-11-03 北京希尔贝壳科技有限公司 一种多设备音频数据的对齐方法、装置及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612205A (zh) * 2003-10-29 2005-05-04 雅马哈株式会社 音频信号处理器
CN1716380A (zh) * 2005-07-26 2006-01-04 浙江大学 基于决策树和说话人改变检测的音频分割方法
CN101075183A (zh) * 2007-06-29 2007-11-21 北京中星微电子有限公司 一种多路音频数据处理系统
CN102364952A (zh) * 2011-10-25 2012-02-29 浙江万朋网络技术有限公司 一种多路音视频同时播放时处理音视频同步的方法
CN103354588A (zh) * 2013-06-28 2013-10-16 贵阳朗玛信息技术股份有限公司 录放音采样率的确定方法、装置及系统
CN104347096A (zh) * 2013-08-09 2015-02-11 上海证大喜马拉雅网络科技有限公司 集音频裁剪、续录及合并于一体的录音系统和方法
CN104700839A (zh) * 2015-02-26 2015-06-10 深圳市中兴移动通信有限公司 多声道声音采集的方法、装置、手机及系统
CN105989846A (zh) * 2015-06-12 2016-10-05 乐视致新电子科技(天津)有限公司 一种多通道语音信号同步方法及装置
CN106504777A (zh) * 2016-11-25 2017-03-15 维沃移动通信有限公司 一种录音数据的处理方法及移动终端
CN106782508A (zh) * 2016-12-20 2017-05-31 美的集团股份有限公司 语音音频的切分方法和语音音频的切分装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107195316B (zh) * 2017-04-28 2019-11-08 北京声智科技有限公司 用于远场语音识别的训练数据准备系统及方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612205A (zh) * 2003-10-29 2005-05-04 雅马哈株式会社 音频信号处理器
CN1716380A (zh) * 2005-07-26 2006-01-04 浙江大学 基于决策树和说话人改变检测的音频分割方法
CN101075183A (zh) * 2007-06-29 2007-11-21 北京中星微电子有限公司 一种多路音频数据处理系统
CN102364952A (zh) * 2011-10-25 2012-02-29 浙江万朋网络技术有限公司 一种多路音视频同时播放时处理音视频同步的方法
CN103354588A (zh) * 2013-06-28 2013-10-16 贵阳朗玛信息技术股份有限公司 录放音采样率的确定方法、装置及系统
CN104347096A (zh) * 2013-08-09 2015-02-11 上海证大喜马拉雅网络科技有限公司 集音频裁剪、续录及合并于一体的录音系统和方法
CN104700839A (zh) * 2015-02-26 2015-06-10 深圳市中兴移动通信有限公司 多声道声音采集的方法、装置、手机及系统
CN105989846A (zh) * 2015-06-12 2016-10-05 乐视致新电子科技(天津)有限公司 一种多通道语音信号同步方法及装置
CN106504777A (zh) * 2016-11-25 2017-03-15 维沃移动通信有限公司 一种录音数据的处理方法及移动终端
CN106782508A (zh) * 2016-12-20 2017-05-31 美的集团股份有限公司 语音音频的切分方法和语音音频的切分装置

Also Published As

Publication number Publication date
CN108021675A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN108021675B (zh) 一种多设备录音的自动切分对齐方法
US11699456B2 (en) Automated transcript generation from multi-channel audio
JP5826291B2 (ja) 音声信号からの特徴フィンガープリントの抽出及びマッチング方法
CN104078044B (zh) 移动终端及其录音搜索的方法和装置
Burges et al. Distortion discriminant analysis for audio fingerprinting
JP5362178B2 (ja) オーディオ信号からの特徴的な指紋の抽出とマッチング
JP6469252B2 (ja) アカウント追加方法、端末、サーバ、およびコンピュータ記憶媒体
US8706276B2 (en) Systems, methods, and media for identifying matching audio
WO2019076313A1 (zh) 音频识别方法、装置和服务器
WO2014191054A1 (en) Processing of audio data
CN105975568B (zh) 一种音频处理方法及装置
CN110111808B (zh) 音频信号处理方法及相关产品
WO2016197708A1 (zh) 一种录音方法及终端
CN103559882A (zh) 一种基于说话人分割的会议主持人语音提取方法
US20120035919A1 (en) Voice recording device and method thereof
US9058384B2 (en) System and method for identification of highly-variable vocalizations
CN103050116A (zh) 语音命令识别方法及系统
CN106098081B (zh) 声音文件的音质识别方法及装置
CN112242149A (zh) 音频数据的处理方法、装置、耳机及计算机可读存储介质
CN101950564A (zh) 一种远程数字化语音采集分析识别系统
KR101382356B1 (ko) 오디오파일의 위변조 검출장치
Kepesi et al. Joint position-pitch estimation for multiple speaker scenarios
CN111382303A (zh) 一种基于指纹权重的音频样例检索方法
CN110661923A (zh) 一种在会议中记录发言信息的方法和装置
CN111540377B (zh) 广播节目智能碎片化的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant