CN112601153B - 一种声音自动采集与传输装置及其使用方法 - Google Patents

一种声音自动采集与传输装置及其使用方法 Download PDF

Info

Publication number
CN112601153B
CN112601153B CN202110223490.1A CN202110223490A CN112601153B CN 112601153 B CN112601153 B CN 112601153B CN 202110223490 A CN202110223490 A CN 202110223490A CN 112601153 B CN112601153 B CN 112601153B
Authority
CN
China
Prior art keywords
audio
mute
silent
segment
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110223490.1A
Other languages
English (en)
Other versions
CN112601153A (zh
Inventor
陈鹏
赵启军
侯蓉
汤茂林
闫蔚然
郭龙银
张艳秋
刘鹏
吴永胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Sichuan University
Original Assignee
CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING, Sichuan University filed Critical CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Priority to CN202110223490.1A priority Critical patent/CN112601153B/zh
Publication of CN112601153A publication Critical patent/CN112601153A/zh
Application granted granted Critical
Publication of CN112601153B publication Critical patent/CN112601153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及声音信号处理领域,具体涉及一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置及其使用方法。中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;音频数据处理模块与存储模块连接。本发明通过中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合,能够实现自动录音功能、自动存储处理功能以及自动发送功能,减小了人力物力的投入,提高了声音数据采集的效率,保证了数据的有效性和实时性,同时减小了存储空间的占用;在存储空间足够的情况下,该装置可以长时间不间断工作,提高数据采集效率,保证了数据的可靠性。

Description

一种声音自动采集与传输装置及其使用方法
技术领域
本发明涉及声音信号处理领域,具体涉及一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置及其使用方法。
背景技术
野生动物的栖息地多为人迹罕至的地方,这些地方通常难以到达。在研究野生动物的时候,现有采集数据方法一般为视频画面采集,需要工作人员手工回收采集数据,这种工作方式风险大,工作人员甚至可能遭受野兽袭击;同时,由于人工费用的不断上涨,这种方式的成本也越来越高;人工回收数据有时间间隔性,如果数据不及时,无法准确、实时的进行相关研究;对于这种采集设备,设备无法自动剔除无用信息,占用存储空间大,一旦存储空间占用满,就无法记录新鲜数据;无用信息不仅对后续实验占用过多存储空间,还会导致实验结果不准确,影响工作人员的判断,影响后续安排。
声音信号所占存储空间远远低于视频信号,且目前动物声音信号研究发展迅速,能获得的信息也非常丰富。然而目前对于动物语音的获取都是被动获取,即录音设备开启录音,把除了野生动物声音之外的其他杂音或者静音都录入,会占用较大的存储空间。录音需要传输到平台然后再进行处理、分析,时效性较差。
发明内容
针对现有技术中的缺陷,本发明提供一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置。
本发明解决上述问题所采取的方案是:一种声音自动采集与传输装置,包括中央处理器,该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;所述的音频数据处理模块与所述的存储模块连接;
所述的麦克风阵列,采集音频信号并传送到中央处理器;
所述的中央处理器,获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中;
所述的音频数据处理模块,与中央处理器配合,并从存储模块中调取音频数据进行加工处理,然后返回存储模块;
所述的网络模块,将中央处理器与外部控制系统连接,进行数据交换。
本发明提供一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置的使用方法:
包括以下步骤:
a、启动录音模块,让麦克风阵列开始录音,并保存录音至存储模块;
b、剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
c、判断网络模块是否联网,若联网,则将压缩存储模块中的音频文件,并发送至服务器;若未联网则保持音频文件存储在存储模块中;
d、结束。
优选的,在所述的步骤b中,剪切静音片段时,首先启动中央处理器中的静音检测程序自动检测录音中的静音部分;对于非静音片段的音频,判断相邻两个音频的间隔是否满足提前设置好的阈值,若满足则将相邻音频合并成一个片段保存,若不满足则不合并。
优选的,在所述的步骤b中,剪切静音片段时,保留非静音片段附近的音频,保证录音的连续性。
优选的,在剪切静音片段时:
保持最低静音长度
Figure DEST_PATH_IMAGE002
不长于切分音频的长度,设置好静音阈值
Figure DEST_PATH_IMAGE004
:
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
为音频采样值,
Figure DEST_PATH_IMAGE010
为音频的最高振幅;
检查连续的声音是否静音,以步长
Figure DEST_PATH_IMAGE012
为单位,遍历长度为
Figure DEST_PATH_IMAGE014
,其中audio为音频,
Figure DEST_PATH_IMAGE016
为检测的音频长度;
从音频的起点开始遍历并保存超过步长的声音段的起始位置
Figure DEST_PATH_IMAGE018
优选的,合并非静音片段时,以
Figure 442603DEST_PATH_IMAGE002
为一个静音范围长度,遍历所有标注的
Figure 170387DEST_PATH_IMAGE018
时刻,并合并一个静音块长度内重合的起始点,保证每一个静音范围都是原音频中且不重叠的;
返回保存的静音片段集合
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE022
表示第i个静音片段开始时间,
Figure DEST_PATH_IMAGE024
表示第i个静音片段结束时间,
Figure DEST_PATH_IMAGE026
表示静音片段的个数。
优选的,合并非静音片段时:
调用检测静音函数获取静音范围,判断是否存在静音范围 ,如果不存在直接返回无静音范围
Figure DEST_PATH_IMAGE028
,
Figure DEST_PATH_IMAGE030
为音频长度;
若存在静音范围,判断是否整个音频为静音,如果判断出整个音频都为静音,则返回空值;
如果不是整个音频为静音,获取每个静音范围的开始时间点
Figure 144291DEST_PATH_IMAGE022
和结束时间点
Figure 553406DEST_PATH_IMAGE024
,通过遍历得出每个非静音段
Figure DEST_PATH_IMAGE032
,若
Figure DEST_PATH_IMAGE034
为空,则丢弃,若
Figure DEST_PATH_IMAGE036
为空,则丢弃;
得到非静音片段集合
Figure DEST_PATH_IMAGE038
;其中,
Figure DEST_PATH_IMAGE040
表示第j个非静音片段的开始时间,
Figure DEST_PATH_IMAGE042
表示第j个非静音片段的结束时间,
Figure DEST_PATH_IMAGE044
表示非静音片段的个数;
返回非静音片段集合
Figure 559015DEST_PATH_IMAGE038
优选的,为了使得相邻两个非静音片段合并得到一个更加连贯的片段,遍历非静音片段集合
Figure 457701DEST_PATH_IMAGE038
,设置非静音片段最短时间间隔
Figure DEST_PATH_IMAGE046
,若两个相邻的非静音片段
Figure DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE050
之间的时间间隔
Figure DEST_PATH_IMAGE052
小于
Figure 981217DEST_PATH_IMAGE046
,则合并两个非静音片段为
Figure DEST_PATH_IMAGE054
,最后得到合并后的非静音片段集合
Figure DEST_PATH_IMAGE056
Figure DEST_PATH_IMAGE058
表示合并后第k个非静音片段的开始时间,
Figure DEST_PATH_IMAGE060
表示合并后第k个非静音片段的结束时间,
Figure DEST_PATH_IMAGE062
表示合并后的非静音片段个数。
优选的,为了让非静音片段开始和结尾部分声音更加平滑,遍历合并后的非静音片段集合
Figure 535302DEST_PATH_IMAGE056
,设置保留静音时长参数
Figure DEST_PATH_IMAGE064
,得到输出目标范围集合
Figure DEST_PATH_IMAGE066
返回保存的输出目标范围集合
Figure DEST_PATH_IMAGE068
本发明的有益效果体现在:本发明的一种声音自动采集与传输装置及其使用方法,通过 中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合,能够实现自动录音功能、自动存储处理功能以及自动发送功能,减小了人力物力的投入,提高了声音数据采集的效率,保证了数据的有效性和实时性,同时减小了存储空间的占用,提高了一种声音自动采集与传输装置的工作时间;在存储空间足够的情况下,该装置可以长时间不间断工作,提高数据采集效率,保证了数据的可靠性。采用本发明装置,可以实现声音的自动采集与静音片段的自动裁剪,在存储容量小、计算能力有限的设备上实现长时间的录音与存储。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明的一种声音自动采集与传输装置的一种结构框图;
图2为本发明的一种声音自动采集与传输装置录音时的一种流程框图;
图3为本发明的一种声音自动采集与传输装置静音检测时的一种结构框图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例1:
如图1至图3所示,本发明的一种声音自动采集与传输装置,包括中央处理器,该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;所述的音频数据处理模块与所述的存储模块连接;
所述的麦克风阵列,采集音频信号并传送到中央处理器;
所述的中央处理器,获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中;
所述的音频数据处理模块,与中央处理器配合,并从存储模块中调取音频数据进行加工处理,然后返回存储模块;
所述的网络模块,将中央处理器的与外部控制系统连接,进行数据交换。
本发明的一种声音自动采集与传输装置,通过 中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合,能够实现自动录音功能、自动存储处理功能以及自动发送功能,减小了人力物力的投入,提高了声音数据采集的效率,保证了数据的有效性和实时性,同时减小了存储空间的占用,提高了一种声音自动采集与传输装置的工作时间;在存储空间足够的情况下,该装置可以长时间不间断工作,提高数据采集效率,保证了数据的可靠性。采用本发明装置,可以实现声音的自动采集与静音片段的自动裁剪,在存储容量小、计算能力有限的设备上实现长时间的录音与存储。
包括以下步骤:
a、启动录音模块,让麦克风阵列开始录音,并保存录音至存储模块;
b、剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
c、判断网络模块是否联网,若联网,则将压缩存储模块中的音频文件,并发送至服务器;若未联网则保持音频文件存储在存储模块中;
d、结束。这样进行以后,在一边录音存储的时候,一边也可以同时进行录音的处理,剪切静音片段,合并非静音片段,减少占用的存储空间;再配合判断网络是否接通,接通时则及时压缩并传输音频文件至服务器。作为优选的,在所述的步骤b中,剪切静音片段时,首先启动中央处理器中的静音检测程序自动检测录音中的静音部分;对于非静音片段的音频,判断相邻两个音频的间隔是否满足提前设置好的阈值,若满足则将相邻音频合并成一个片段保存,若不满足则不合并。在所述的步骤b中,剪切静音片段时,保留非静音片段附近的音频,保证录音的连续性。
作为优选的,在剪切静音片段时:保持最低静音长度
Figure 726243DEST_PATH_IMAGE002
不长于切分音频的长度,设置好静音阈值
Figure 530251DEST_PATH_IMAGE004
:
Figure DEST_PATH_IMAGE006A
Figure 928347DEST_PATH_IMAGE008
为音频采样值,
Figure 476003DEST_PATH_IMAGE010
为音频的最高振幅;
检查连续的声音是否静音,以步长
Figure 442822DEST_PATH_IMAGE012
为单位,遍历长度为
Figure 886573DEST_PATH_IMAGE014
,其中audio为音频,
Figure 571632DEST_PATH_IMAGE016
为检测的音频长度;
从音频的起点开始遍历并保存超过步长的声音段的起始位置
Figure 126241DEST_PATH_IMAGE018
作为优选的,合并非静音片段时,以
Figure 416408DEST_PATH_IMAGE002
为一个静音范围长度,遍历所有标注的
Figure 827798DEST_PATH_IMAGE018
时刻,并合并一个静音块长度内重合的起始点,保证每一个静音范围都是原音频中且不重叠的;
返回保存的静音片段集合
Figure 734574DEST_PATH_IMAGE020
Figure 889612DEST_PATH_IMAGE022
表示第i个静音片段开始时间,
Figure 34285DEST_PATH_IMAGE024
表示第i个静音片段结束时间,
Figure 616577DEST_PATH_IMAGE026
表示静音片段的个数。
作为优选的,合并非静音片段时:
调用检测静音函数获取静音范围,判断是否存在静音范围 ,如果不存在直接返回无静音范围
Figure 273298DEST_PATH_IMAGE028
,
Figure 966448DEST_PATH_IMAGE030
为音频长度;
若存在静音范围,判断是否整个音频为静音,如果判断出整个音频都为静音,则返回空值;
如果不是整个音频为静音,获取每个静音范围的开始时间点
Figure 700049DEST_PATH_IMAGE022
和结束时间点
Figure 453241DEST_PATH_IMAGE024
,通过遍历得出每个非静音段
Figure DEST_PATH_IMAGE070
,若
Figure 69030DEST_PATH_IMAGE034
为空,则丢弃,若
Figure 769133DEST_PATH_IMAGE036
为空,则丢弃;
得到非静音片段集合
Figure 419557DEST_PATH_IMAGE038
;其中,
Figure 78071DEST_PATH_IMAGE040
表示第j个非静音片段的开始时间,
Figure 712315DEST_PATH_IMAGE042
表示第j个非静音片段的结束时间,
Figure 747267DEST_PATH_IMAGE044
表示非静音片段的个数;
返回非静音片段集合
Figure 517777DEST_PATH_IMAGE038
作为优选的,为了使得相邻两个非静音片段合并得到一个更加连贯的片段,遍历非静音片段集合
Figure 550455DEST_PATH_IMAGE038
,设置非静音片段最短时间间隔
Figure 426924DEST_PATH_IMAGE046
,若两个相邻的非静音片段
Figure 531146DEST_PATH_IMAGE048
Figure 890583DEST_PATH_IMAGE050
之间的时间间隔
Figure 156479DEST_PATH_IMAGE052
小于
Figure 437419DEST_PATH_IMAGE046
,则合并两个非静音片段为
Figure 79753DEST_PATH_IMAGE054
,最后得到合并后的非静音片段集合
Figure 824855DEST_PATH_IMAGE056
Figure 261653DEST_PATH_IMAGE058
表示合并后第k个非静音片段的开始时间,
Figure 826626DEST_PATH_IMAGE060
表示合并后第k个非静音片段的结束时间,
Figure 210334DEST_PATH_IMAGE062
表示合并后的非静音片段个数。
作为优选的,为了让非静音片段开始和结尾部分声音更加平滑,遍历合并后的非静音片段集合
Figure 809943DEST_PATH_IMAGE056
,设置保留静音时长参数
Figure 417642DEST_PATH_IMAGE064
,得到输出目标范围集合
Figure 469911DEST_PATH_IMAGE066
返回保存的输出目标范围集合
Figure 188468DEST_PATH_IMAGE068
作为一种优选的实施方式,
步骤1.一种声音自动采集与传输装置采用嵌入式设备,并安装Linux操作系统,同时安装麦克风阵列驱动程序,将麦克风阵列与嵌入式设备连接。
步骤2.启动嵌入式设备并启动程序,启动程序时可通过Linux操作系统设置开机自启动,也可以通过局域网或互联网启动程序。
步骤3.启动录音进程,麦克风阵列开始录音,每隔一分钟保存一次音频并存储至SD卡当中的固定文件夹里,并以时间作为音频的文件名。为了让录制的音频数据在后续实验中有可用性,以及处理的方便,选择一分钟保存一次音频,保存的音频为录制的原始音频,不经过任何处理。保存在固定文件夹中,方便日后的操作,不至于混淆音频。
步骤4.启动静音检测进程,静音检测程序自动剪切静音片段。为防止出现声音不连贯的情况,对剪切完成后的相邻非静音片段进行时间间隔判断,若低于提前设置好的阈值,则合并为一个片段保存至SD卡中;若不低于阈值,则将剪切完成后的音频分开保存至SD卡中。音频是具有非常强烈的时序特征的信号,若将音频静音部分直接剪切,则极有可能导致音频前后时域上的特征不连续情况,同时直接剪切音频也非常有可能剪切掉原始音频的部分特征,使得后续实验结果不可靠,所以在剪切静音片段的时候需要注意音频前后的连续性,在本实施例中,在检测完静音之后,保留原始音频前后100毫秒的长度,尽可能保证音频信息不被裁剪掉。
步骤5.每隔一段时间将保存在SD卡中的非静音片段压缩并删除原音频。步骤4中设置了相邻两个非静音片段之间的最小时间间隔,若剪切完静音片段之后,相邻两个音频的时间间隔小于设定好的阈值,则将两个音频合并。为了一种声音自动采集与传输装置的正常运行,以及本着节约存储空间的理念,对于已经压缩完成的音频,将会删掉保存在SD卡中的原始音频,以释放存储空间,减少空间的占用。
步骤6.检测是否连接了局域网或互联网,若连接了网络则自动将压缩包发送至服务器端。对音频进行压缩操作后,判断嵌入式设备是否已经联网,如果联网,则向服务器发送压缩包,发送成功后则将保存在SD卡中的压缩包删除,以释放存储空间。若嵌入式设备没有联网,则工作人员需要及时前往一种声音自动采集与传输装置处,人工取出SD卡,以免发生存储空间被占用完,装置无法正常工作的情况。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (8)

1.一种声音自动采集与传输装置,其特征在于:包括中央处理器,该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;所述的音频数据处理模块与所述的存储模块连接;
所述的麦克风阵列,采集音频信号并传送到中央处理器;
所述的中央处理器,获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中;
所述的音频数据处理模块,与中央处理器配合,并从存储模块中调取音频数据进行加工处理,包括剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
所述的网络模块,将中央处理器与外部控制系统连接,进行数据交换;
合并非静音片段时,遍历非静音片段集合
Figure 797958DEST_PATH_IMAGE001
,其中,
Figure 620420DEST_PATH_IMAGE002
表示第j个非静音片段的开始时间,
Figure 621874DEST_PATH_IMAGE003
表示第j个非静音片段的结束时间,
Figure 24037DEST_PATH_IMAGE004
表示非静音片段的个数;设置非静音片段最短时间间隔
Figure 161757DEST_PATH_IMAGE005
,若两个相邻的非静音片段
Figure 155121DEST_PATH_IMAGE006
Figure 112713DEST_PATH_IMAGE007
之间的时间间隔
Figure 849725DEST_PATH_IMAGE008
小于
Figure 841951DEST_PATH_IMAGE005
,则合并两个非静音片段为
Figure 740637DEST_PATH_IMAGE009
,最后得到合并后的非静音片段集合
Figure 949639DEST_PATH_IMAGE010
Figure 224763DEST_PATH_IMAGE011
表示合并后第k个非静音片段的开始时间,
Figure 71496DEST_PATH_IMAGE012
表示合并后第k个非静音片段的结束时间,
Figure 406663DEST_PATH_IMAGE013
表示合并后的非静音片段个数。
2.一种声音自动采集与传输装置的使用方法,其特征在于:包括以下步骤:
a、启动录音模块,让麦克风阵列开始录音,并保存录音至存储模块;
b、剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
c、判断网络模块是否联网,若联网,则将压缩存储模块中的音频文件,并发送至服务器;若未联网则保持音频文件存储在存储模块中;
d、结束;
在步骤b中,遍历非静音片段集合
Figure 604426DEST_PATH_IMAGE014
,其中,
Figure 417661DEST_PATH_IMAGE015
表示第j个非静音片段的开始时间,
Figure 650059DEST_PATH_IMAGE016
表示第j个非静音片段的结束时间,
Figure 624968DEST_PATH_IMAGE017
表示非静音片段的个数;设置非静音片段最短时间间隔
Figure 575607DEST_PATH_IMAGE005
,若两个相邻的非静音片段
Figure 926954DEST_PATH_IMAGE006
Figure 246814DEST_PATH_IMAGE007
之间的时间间隔
Figure 658204DEST_PATH_IMAGE008
小于
Figure 564980DEST_PATH_IMAGE005
,则合并两个非静音片段为
Figure 720018DEST_PATH_IMAGE009
,最后得到合并后的非静音片段集合
Figure 661429DEST_PATH_IMAGE010
Figure 243720DEST_PATH_IMAGE011
表示合并后第k个非静音片段的开始时间,
Figure 903372DEST_PATH_IMAGE012
表示合并后第k个非静音片段的结束时间,
Figure 862101DEST_PATH_IMAGE013
表示合并后的非静音片段个数。
3.根据权利要求2所述的一种声音自动采集与传输装置的使用方法,其特征在于:在所述的步骤b中,剪切静音片段时,首先启动中央处理器中的静音检测程序自动检测录音中的静音部分;对于非静音片段的音频,判断相邻两个音频的间隔是否满足提前设置好的阈值,若满足则将相邻音频合并成一个片段保存,若不满足则不合并。
4.根据权利要求3所述的一种声音自动采集与传输装置的使用方法,其特征在于:在所述的步骤b中,剪切静音片段时,保留非静音片段附近的音频。
5.根据权利要求2所述的一种声音自动采集与传输装置的使用方法,其特征在于:在剪切静音片段时:
保持最低静音长度
Figure 658018DEST_PATH_IMAGE018
不长于切分音频的长度,设置好静音阈值
Figure 411211DEST_PATH_IMAGE019
:
Figure 292579DEST_PATH_IMAGE020
Figure 553534DEST_PATH_IMAGE021
为音频采样值,
Figure 203958DEST_PATH_IMAGE022
为音频的最高振幅;
检查连续的声音是否静音,以步长
Figure 393631DEST_PATH_IMAGE023
为单位,遍历长度为
Figure 762295DEST_PATH_IMAGE024
,其中audio为音频,
Figure 62827DEST_PATH_IMAGE025
为检测的音频长度;
从音频的起点开始遍历并保存超过步长的声音段的起始位置
Figure 567757DEST_PATH_IMAGE026
6.根据权利要求5所述的一种声音自动采集与传输装置的使用方法,其特征在于:合并非静音片段时,以
Figure 928331DEST_PATH_IMAGE018
为一个静音范围长度,遍历所有标注的
Figure 784292DEST_PATH_IMAGE026
时刻,并合并一个静音块长度内重合的起始点,
返回保存的静音片段集合
Figure 622935DEST_PATH_IMAGE027
Figure 513531DEST_PATH_IMAGE028
表示第i个静音片段开始时间,
Figure 779427DEST_PATH_IMAGE029
表示第i个静音片段结束时间,
Figure 644656DEST_PATH_IMAGE030
表示静音片段的个数。
7.根据权利要求6所述的一种声音自动采集与传输装置的使用方法,其特征在于:合并非静音片段时:
调用检测静音函数获取静音范围,判断是否存在静音范围 ,如果不存在直接返回无静音范围
Figure 21411DEST_PATH_IMAGE031
,
Figure 766513DEST_PATH_IMAGE025
为音频长度;
若存在静音范围,判断是否整个音频为静音,如果判断出整个音频都为静音,则返回空值;
如果不是整个音频为静音,获取每个静音范围的开始时间点
Figure 203311DEST_PATH_IMAGE032
和结束时间点
Figure 33863DEST_PATH_IMAGE033
,通过遍历得出每个非静音片段
Figure 214309DEST_PATH_IMAGE034
,若
Figure 79497DEST_PATH_IMAGE035
为空,则丢弃,若
Figure 890458DEST_PATH_IMAGE036
为空,则丢弃;得到非静音片段集合
Figure 175684DEST_PATH_IMAGE037
;其中,
Figure 425399DEST_PATH_IMAGE038
表示第j个非静音片段的开始时间,
Figure 879514DEST_PATH_IMAGE039
表示第j个非静音片段的结束时间,
Figure 923694DEST_PATH_IMAGE040
表示非静音片段的个数;
返回非静音片段集合
Figure 197680DEST_PATH_IMAGE041
8.根据权利要求7所述的一种声音自动采集与传输装置的使用方法,其特征在于:遍历合并后的非静音片段集合
Figure 985508DEST_PATH_IMAGE042
,设置保留静音时长参数
Figure 559709DEST_PATH_IMAGE043
,得到输出目标范围集合
Figure 774789DEST_PATH_IMAGE044
返回保存的输出目标范围集合
Figure 801651DEST_PATH_IMAGE045
CN202110223490.1A 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法 Active CN112601153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110223490.1A CN112601153B (zh) 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110223490.1A CN112601153B (zh) 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法

Publications (2)

Publication Number Publication Date
CN112601153A CN112601153A (zh) 2021-04-02
CN112601153B true CN112601153B (zh) 2021-05-07

Family

ID=75207643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110223490.1A Active CN112601153B (zh) 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法

Country Status (1)

Country Link
CN (1) CN112601153B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
CN101221762A (zh) * 2007-12-06 2008-07-16 上海大学 一种mp3压缩域音频分割方法
CN107623860A (zh) * 2017-08-09 2018-01-23 北京奇艺世纪科技有限公司 多媒体数据分割方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02302152A (ja) * 1989-05-16 1990-12-14 Nec Corp 音声録音装置およびメッセージ録音メモリの管理方法
JPH08294199A (ja) * 1995-04-20 1996-11-05 Hitachi Ltd 話速変換装置
US7168010B2 (en) * 2002-08-12 2007-01-23 Intel Corporation Various methods and apparatuses to track failing memory locations to enable implementations for invalidating repeatedly failing memory locations
CN104202321B (zh) * 2014-09-02 2017-10-03 上海天脉聚源文化传媒有限公司 一种声音录制的方法及装置
CN105845124B (zh) * 2016-05-05 2020-06-19 北京小米移动软件有限公司 音频处理方法及装置
CN106448702B (zh) * 2016-09-14 2019-10-01 努比亚技术有限公司 一种录音数据处理装置、移动终端及方法
CN106935253A (zh) * 2017-03-10 2017-07-07 北京奇虎科技有限公司 音频文件的裁剪方法、装置及终端设备
US20200381017A1 (en) * 2017-11-28 2020-12-03 Justin Garak Flexible content recording slider
CN111128253B (zh) * 2019-12-13 2022-03-01 北京小米智能科技有限公司 音频剪辑方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
CN101221762A (zh) * 2007-12-06 2008-07-16 上海大学 一种mp3压缩域音频分割方法
CN107623860A (zh) * 2017-08-09 2018-01-23 北京奇艺世纪科技有限公司 多媒体数据分割方法和装置

Also Published As

Publication number Publication date
CN112601153A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
US20100026815A1 (en) Information processing method, information processing apparatus, and computer-readable storage medium
US9424743B2 (en) Real-time traffic detection
CN109669663B (zh) 音区幅值获取方法、装置、电子设备及存储介质
US11490057B2 (en) Recording device, recording method, reproduction method, and program
CN111128253B (zh) 音频剪辑方法及装置
CN110223696B (zh) 一种语音信号的采集方法、装置及终端设备
CN106328130A (zh) 一种机器人语音寻向转动系统及方法
CN112601153B (zh) 一种声音自动采集与传输装置及其使用方法
CN103327433B (zh) 音频输入接口检测方法及其系统
JP2009122598A (ja) 電子機器、電子機器の制御方法、音声認識装置、音声認識方法及び音声認識プログラム
US11170760B2 (en) Detecting speech activity in real-time in audio signal
CN112380977A (zh) 吸烟行为检测方法和装置
WO2018086334A1 (zh) 一种监控可移动目标的方法及其监控端
CN101950564A (zh) 一种远程数字化语音采集分析识别系统
CN112071315A (zh) 一种便携式信息采集装置、方法、存储介质和电子装置
CN113689847A (zh) 语音交互方法、装置及语音芯片模组
JP2829014B2 (ja) 音声認識装置及び方法
CN109525916A (zh) 一种智能麦克风控制方法及装置
CN114783448A (zh) 一种音频信号处理装置、方法及可存储介质
CN104202321A (zh) 一种声音录制的方法及装置
CN114268893B (zh) 蓝牙音频设备播放异常的检测方法、设备和可读存储介质
CN115706875A (zh) 对讲语音质量优化方法、装置、设备及存储介质
CN108364654B (zh) 语音处理方法、介质、装置和计算设备
CN114268893A (zh) 蓝牙音频设备播放异常的检测方法、设备和可读存储介质
CN108235137B (zh) 一种通过声音波形判断切台动作的方法、装置及电视机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant