CN112601153A - 一种声音自动采集与传输装置及其使用方法 - Google Patents

一种声音自动采集与传输装置及其使用方法 Download PDF

Info

Publication number
CN112601153A
CN112601153A CN202110223490.1A CN202110223490A CN112601153A CN 112601153 A CN112601153 A CN 112601153A CN 202110223490 A CN202110223490 A CN 202110223490A CN 112601153 A CN112601153 A CN 112601153A
Authority
CN
China
Prior art keywords
audio
mute
segment
silent
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110223490.1A
Other languages
English (en)
Other versions
CN112601153B (zh
Inventor
陈鹏
赵启军
侯蓉
汤茂林
闫蔚然
郭龙银
张艳秋
刘鹏
吴永胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Sichuan University
Original Assignee
CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING, Sichuan University filed Critical CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Priority to CN202110223490.1A priority Critical patent/CN112601153B/zh
Publication of CN112601153A publication Critical patent/CN112601153A/zh
Application granted granted Critical
Publication of CN112601153B publication Critical patent/CN112601153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及声音信号处理领域,具体涉及一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置及其使用方法。中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;音频数据处理模块与存储模块连接。本发明通过中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合,能够实现自动录音功能、自动存储处理功能以及自动发送功能,减小了人力物力的投入,提高了声音数据采集的效率,保证了数据的有效性和实时性,同时减小了存储空间的占用;在存储空间足够的情况下,该装置可以长时间不间断工作,提高数据采集效率,保证了数据的可靠性。

Description

一种声音自动采集与传输装置及其使用方法
技术领域
本发明涉及声音信号处理领域,具体涉及一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置及其使用方法。
背景技术
野生动物的栖息地多为人迹罕至的地方,这些地方通常难以到达。在研究野生动物的时候,现有采集数据方法一般为视频画面采集,需要工作人员手工回收采集数据,这种工作方式风险大,工作人员甚至可能遭受野兽袭击;同时,由于人工费用的不断上涨,这种方式的成本也越来越高;人工回收数据有时间间隔性,如果数据不及时,无法准确、实时的进行相关研究;对于这种采集设备,设备无法自动剔除无用信息,占用存储空间大,一旦存储空间占用满,就无法记录新鲜数据;无用信息不仅对后续实验占用过多存储空间,还会导致实验结果不准确,影响工作人员的判断,影响后续安排。
声音信号所占存储空间远远低于视频信号,且目前动物声音信号研究发展迅速,能获得的信息也非常丰富。然而目前对于动物语音的获取都是被动获取,即录音设备开启录音,把除了野生动物声音之外的其他杂音或者静音都录入,会占用较大的存储空间。录音需要传输到平台然后再进行处理、分析,时效性较差。
发明内容
针对现有技术中的缺陷,本发明提供一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置。
本发明解决上述问题所采取的方案是:一种声音自动采集与传输装置,包括中央处理器,该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;所述的音频数据处理模块与所述的存储模块连接;
所述的麦克风阵列,采集音频信号并传送到中央处理器;
所述的中央处理器,获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中;
所述的音频数据处理模块,与中央处理器配合,并从存储模块中调取音频数据进行加工处理,然后返回存储模块;
所述的网络模块,将中央处理器与外部控制系统连接,进行数据交换。
本发明提供一种能够自动采集、减少数据占用空间、提高数据采集时的安全性和时效性的一种声音自动采集与传输装置的使用方法:
包括以下步骤:
a、启动录音模块,让麦克风阵列开始录音,并保存录音至存储模块;
b、剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
c、判断网络模块是否联网,若联网,则将压缩存储模块中的音频文件,并发送至服务器;若未联网则保持音频文件存储在存储模块中;
d、结束。
优选的,在所述的步骤b中,剪切静音片段时,首先启动中央处理器中的静音检测程序自动检测录音中的静音部分;对于非静音片段的音频,判断相邻两个音频的间隔是否满足提前设置好的阈值,若满足则将相邻音频合并成一个片段保存,若不满足则不合并。
优选的,在所述的步骤b中,剪切静音片段时,保留非静音片段附近的音频,保证录音的连续性。
优选的,在剪切静音片段时:
保持最低静音长度
Figure 100002_DEST_PATH_IMAGE002
不长于切分音频的长度,设置好静音阈值
Figure 100002_DEST_PATH_IMAGE004
:
Figure 100002_DEST_PATH_IMAGE006
Figure 100002_DEST_PATH_IMAGE008
为音频采样值,
Figure 100002_DEST_PATH_IMAGE010
为音频的最高振幅;
检查连续的声音是否静音,以步长
Figure 100002_DEST_PATH_IMAGE012
为单位,遍历长度为
Figure 100002_DEST_PATH_IMAGE014
,其中audio为音频,
Figure 100002_DEST_PATH_IMAGE016
为检测的音频长度;
从音频的起点开始遍历并保存超过步长的声音段的起始位置
Figure 100002_DEST_PATH_IMAGE018
优选的,合并非静音片段时,以
Figure 442603DEST_PATH_IMAGE002
为一个静音范围长度,遍历所有标注的
Figure 170387DEST_PATH_IMAGE018
时刻,并合并一个静音块长度内重合的起始点,保证每一个静音范围都是原音频中且不重叠的;
返回保存的静音片段集合
Figure 100002_DEST_PATH_IMAGE020
Figure 100002_DEST_PATH_IMAGE022
表示第i个静音片段开始时间,
Figure 100002_DEST_PATH_IMAGE024
表示第i个静音片段结束时间,
Figure 100002_DEST_PATH_IMAGE026
表示静音片段的个数。
优选的,合并非静音片段时:
调用检测静音函数获取静音范围,判断是否存在静音范围 ,如果不存在直接返回无静音范围
Figure 100002_DEST_PATH_IMAGE028
,
Figure 100002_DEST_PATH_IMAGE030
为音频长度;
若存在静音范围,判断是否整个音频为静音,如果判断出整个音频都为静音,则返回空值;
如果不是整个音频为静音,获取每个静音范围的开始时间点
Figure 144291DEST_PATH_IMAGE022
和结束时间点
Figure 553406DEST_PATH_IMAGE024
,通过遍历得出每个非静音段
Figure 100002_DEST_PATH_IMAGE032
,若
Figure 100002_DEST_PATH_IMAGE034
为空,则丢弃,若
Figure 100002_DEST_PATH_IMAGE036
为空,则丢弃;
得到非静音片段集合
Figure 100002_DEST_PATH_IMAGE038
;其中,
Figure 100002_DEST_PATH_IMAGE040
表示第j个非静音片段的开始时间,
Figure 100002_DEST_PATH_IMAGE042
表示第j个非静音片段的结束时间,
Figure 100002_DEST_PATH_IMAGE044
表示非静音片段的个数;
返回非静音片段集合
Figure 559015DEST_PATH_IMAGE038
优选的,为了使得相邻两个非静音片段合并得到一个更加连贯的片段,遍历非静音片段集合
Figure 457701DEST_PATH_IMAGE038
,设置非静音片段最短时间间隔
Figure 100002_DEST_PATH_IMAGE046
,若两个相邻的非静音片段
Figure 100002_DEST_PATH_IMAGE048
Figure 100002_DEST_PATH_IMAGE050
之间的时间间隔
Figure 100002_DEST_PATH_IMAGE052
小于
Figure 981217DEST_PATH_IMAGE046
,则合并两个非静音片段为
Figure 100002_DEST_PATH_IMAGE054
,最后得到合并后的非静音片段集合
Figure 100002_DEST_PATH_IMAGE056
Figure 100002_DEST_PATH_IMAGE058
表示合并后第k个非静音片段的开始时间,
Figure 100002_DEST_PATH_IMAGE060
表示合并后第k个非静音片段的结束时间,
Figure 100002_DEST_PATH_IMAGE062
表示合并后的非静音片段个数。
优选的,为了让非静音片段开始和结尾部分声音更加平滑,遍历合并后的非静音片段集合
Figure 535302DEST_PATH_IMAGE056
,设置保留静音时长参数
Figure 100002_DEST_PATH_IMAGE064
,得到输出目标范围集合
Figure 100002_DEST_PATH_IMAGE066
返回保存的输出目标范围集合
Figure 100002_DEST_PATH_IMAGE068
本发明的有益效果体现在:本发明的一种声音自动采集与传输装置及其使用方法,通过 中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合,能够实现自动录音功能、自动存储处理功能以及自动发送功能,减小了人力物力的投入,提高了声音数据采集的效率,保证了数据的有效性和实时性,同时减小了存储空间的占用,提高了一种声音自动采集与传输装置的工作时间;在存储空间足够的情况下,该装置可以长时间不间断工作,提高数据采集效率,保证了数据的可靠性。采用本发明装置,可以实现声音的自动采集与静音片段的自动裁剪,在存储容量小、计算能力有限的设备上实现长时间的录音与存储。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明的一种声音自动采集与传输装置的一种结构框图;
图2为本发明的一种声音自动采集与传输装置录音时的一种流程框图;
图3为本发明的一种声音自动采集与传输装置静音检测时的一种结构框图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例1:
如图1至图3所示,本发明的一种声音自动采集与传输装置,包括中央处理器,该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;所述的音频数据处理模块与所述的存储模块连接;
所述的麦克风阵列,采集音频信号并传送到中央处理器;
所述的中央处理器,获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中;
所述的音频数据处理模块,与中央处理器配合,并从存储模块中调取音频数据进行加工处理,然后返回存储模块;
所述的网络模块,将中央处理器的与外部控制系统连接,进行数据交换。
本发明的一种声音自动采集与传输装置,通过 中央处理器、麦克风阵列、音频数据处理模块、存储模块以及网络模块等的配合,能够实现自动录音功能、自动存储处理功能以及自动发送功能,减小了人力物力的投入,提高了声音数据采集的效率,保证了数据的有效性和实时性,同时减小了存储空间的占用,提高了一种声音自动采集与传输装置的工作时间;在存储空间足够的情况下,该装置可以长时间不间断工作,提高数据采集效率,保证了数据的可靠性。采用本发明装置,可以实现声音的自动采集与静音片段的自动裁剪,在存储容量小、计算能力有限的设备上实现长时间的录音与存储。
包括以下步骤:
a、启动录音模块,让麦克风阵列开始录音,并保存录音至存储模块;
b、剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
c、判断网络模块是否联网,若联网,则将压缩存储模块中的音频文件,并发送至服务器;若未联网则保持音频文件存储在存储模块中;
d、结束。这样进行以后,在一边录音存储的时候,一边也可以同时进行录音的处理,剪切静音片段,合并非静音片段,减少占用的存储空间;再配合判断网络是否接通,接通时则及时压缩并传输音频文件至服务器。作为优选的,在所述的步骤b中,剪切静音片段时,首先启动中央处理器中的静音检测程序自动检测录音中的静音部分;对于非静音片段的音频,判断相邻两个音频的间隔是否满足提前设置好的阈值,若满足则将相邻音频合并成一个片段保存,若不满足则不合并。在所述的步骤b中,剪切静音片段时,保留非静音片段附近的音频,保证录音的连续性。
作为优选的,在剪切静音片段时:保持最低静音长度
Figure 726243DEST_PATH_IMAGE002
不长于切分音频的长度,设置好静音阈值
Figure 530251DEST_PATH_IMAGE004
:
Figure DEST_PATH_IMAGE006A
Figure 928347DEST_PATH_IMAGE008
为音频采样值,
Figure 476003DEST_PATH_IMAGE010
为音频的最高振幅;
检查连续的声音是否静音,以步长
Figure 442822DEST_PATH_IMAGE012
为单位,遍历长度为
Figure 886573DEST_PATH_IMAGE014
,其中audio为音频,
Figure 571632DEST_PATH_IMAGE016
为检测的音频长度;
从音频的起点开始遍历并保存超过步长的声音段的起始位置
Figure 126241DEST_PATH_IMAGE018
作为优选的,合并非静音片段时,以
Figure 416408DEST_PATH_IMAGE002
为一个静音范围长度,遍历所有标注的
Figure 827798DEST_PATH_IMAGE018
时刻,并合并一个静音块长度内重合的起始点,保证每一个静音范围都是原音频中且不重叠的;
返回保存的静音片段集合
Figure 734574DEST_PATH_IMAGE020
Figure 889612DEST_PATH_IMAGE022
表示第i个静音片段开始时间,
Figure 34285DEST_PATH_IMAGE024
表示第i个静音片段结束时间,
Figure 616577DEST_PATH_IMAGE026
表示静音片段的个数。
作为优选的,合并非静音片段时:
调用检测静音函数获取静音范围,判断是否存在静音范围 ,如果不存在直接返回无静音范围
Figure 273298DEST_PATH_IMAGE028
,
Figure 966448DEST_PATH_IMAGE030
为音频长度;
若存在静音范围,判断是否整个音频为静音,如果判断出整个音频都为静音,则返回空值;
如果不是整个音频为静音,获取每个静音范围的开始时间点
Figure 700049DEST_PATH_IMAGE022
和结束时间点
Figure 453241DEST_PATH_IMAGE024
,通过遍历得出每个非静音段
Figure DEST_PATH_IMAGE070
,若
Figure 69030DEST_PATH_IMAGE034
为空,则丢弃,若
Figure 769133DEST_PATH_IMAGE036
为空,则丢弃;
得到非静音片段集合
Figure 419557DEST_PATH_IMAGE038
;其中,
Figure 78071DEST_PATH_IMAGE040
表示第j个非静音片段的开始时间,
Figure 712315DEST_PATH_IMAGE042
表示第j个非静音片段的结束时间,
Figure 747267DEST_PATH_IMAGE044
表示非静音片段的个数;
返回非静音片段集合
Figure 517777DEST_PATH_IMAGE038
作为优选的,为了使得相邻两个非静音片段合并得到一个更加连贯的片段,遍历非静音片段集合
Figure 550455DEST_PATH_IMAGE038
,设置非静音片段最短时间间隔
Figure 426924DEST_PATH_IMAGE046
,若两个相邻的非静音片段
Figure 531146DEST_PATH_IMAGE048
Figure 890583DEST_PATH_IMAGE050
之间的时间间隔
Figure 156479DEST_PATH_IMAGE052
小于
Figure 437419DEST_PATH_IMAGE046
,则合并两个非静音片段为
Figure 79753DEST_PATH_IMAGE054
,最后得到合并后的非静音片段集合
Figure 824855DEST_PATH_IMAGE056
Figure 261653DEST_PATH_IMAGE058
表示合并后第k个非静音片段的开始时间,
Figure 826626DEST_PATH_IMAGE060
表示合并后第k个非静音片段的结束时间,
Figure 210334DEST_PATH_IMAGE062
表示合并后的非静音片段个数。
作为优选的,为了让非静音片段开始和结尾部分声音更加平滑,遍历合并后的非静音片段集合
Figure 809943DEST_PATH_IMAGE056
,设置保留静音时长参数
Figure 417642DEST_PATH_IMAGE064
,得到输出目标范围集合
Figure 469911DEST_PATH_IMAGE066
返回保存的输出目标范围集合
Figure 188468DEST_PATH_IMAGE068
作为一种优选的实施方式,
步骤1.一种声音自动采集与传输装置采用嵌入式设备,并安装Linux操作系统,同时安装麦克风阵列驱动程序,将麦克风阵列与嵌入式设备连接。
步骤2.启动嵌入式设备并启动程序,启动程序时可通过Linux操作系统设置开机自启动,也可以通过局域网或互联网启动程序。
步骤3.启动录音进程,麦克风阵列开始录音,每隔一分钟保存一次音频并存储至SD卡当中的固定文件夹里,并以时间作为音频的文件名。为了让录制的音频数据在后续实验中有可用性,以及处理的方便,选择一分钟保存一次音频,保存的音频为录制的原始音频,不经过任何处理。保存在固定文件夹中,方便日后的操作,不至于混淆音频。
步骤4.启动静音检测进程,静音检测程序自动剪切静音片段。为防止出现声音不连贯的情况,对剪切完成后的相邻非静音片段进行时间间隔判断,若低于提前设置好的阈值,则合并为一个片段保存至SD卡中;若不低于阈值,则将剪切完成后的音频分开保存至SD卡中。音频是具有非常强烈的时序特征的信号,若将音频静音部分直接剪切,则极有可能导致音频前后时域上的特征不连续情况,同时直接剪切音频也非常有可能剪切掉原始音频的部分特征,使得后续实验结果不可靠,所以在剪切静音片段的时候需要注意音频前后的连续性,在本实施例中,在检测完静音之后,保留原始音频前后100毫秒的长度,尽可能保证音频信息不被裁剪掉。
步骤5.每隔一段时间将保存在SD卡中的非静音片段压缩并删除原音频。步骤4中设置了相邻两个非静音片段之间的最小时间间隔,若剪切完静音片段之后,相邻两个音频的时间间隔小于设定好的阈值,则将两个音频合并。为了一种声音自动采集与传输装置的正常运行,以及本着节约存储空间的理念,对于已经压缩完成的音频,将会删掉保存在SD卡中的原始音频,以释放存储空间,减少空间的占用。
步骤6.检测是否连接了局域网或互联网,若连接了网络则自动将压缩包发送至服务器端。对音频进行压缩操作后,判断嵌入式设备是否已经联网,如果联网,则向服务器发送压缩包,发送成功后则将保存在SD卡中的压缩包删除,以释放存储空间。若嵌入式设备没有联网,则工作人员需要及时前往一种声音自动采集与传输装置处,人工取出SD卡,以免发生存储空间被占用完,装置无法正常工作的情况。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (9)

1.一种声音自动采集与传输装置,其特征在于:包括中央处理器,该中央处理器连接有麦克风阵列、音频数据处理模块、存储模块以及网络模块;所述的音频数据处理模块与所述的存储模块连接;
所述的麦克风阵列,采集音频信号并传送到中央处理器;
所述的中央处理器,获取麦克风阵列采集的音频信号并转化为音频数据存储于存储模块中;
所述的音频数据处理模块,与中央处理器配合,并从存储模块中调取音频数据进行加工处理,然后返回存储模块;
所述的网络模块,将中央处理器与外部控制系统连接,进行数据交换。
2.一种声音自动采集与传输装置的使用方法,其特征在于包括以下步骤:
a、启动录音模块,让麦克风阵列开始录音,并保存录音至存储模块;
b、剪切录音中的静音片段,并判断非静音片段间隔是否满足合并要求,若满足合并要求,则合并非静音片段,保存至存储模块;若不满足合并要求,则保持非静音片段原样保存至存储模块中;
c、判断网络模块是否联网,若联网,则将压缩存储模块中的音频文件,并发送至服务器;若未联网则保持音频文件存储在存储模块中;
d、结束。
3.根据权利要求2所述的一种声音自动采集与传输装置的使用方法,其特征在于:在所述的步骤b中,剪切静音片段时,首先启动中央处理器中的静音检测程序自动检测录音中的静音部分;对于非静音片段的音频,判断相邻两个音频的间隔是否满足提前设置好的阈值,若满足则将相邻音频合并成一个片段保存,若不满足则不合并。
4.根据权利要求3所述的一种声音自动采集与传输装置的使用方法,其特征在于:在所述的步骤b中,剪切静音片段时,保留非静音片段附近的音频,保证录音的连续性。
5.根据权利要求2所述的一种声音自动采集与传输装置的使用方法,其特征在于:在剪切静音片段时:
保持最低静音长度
Figure DEST_PATH_IMAGE002
不长于切分音频的长度,设置好静音阈值
Figure DEST_PATH_IMAGE004
:
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
为音频采样值,
Figure DEST_PATH_IMAGE010
为音频的最高振幅;
检查连续的声音是否静音,以步长
Figure DEST_PATH_IMAGE012
为单位,遍历长度为
Figure DEST_PATH_IMAGE014
,其中audio为音频,
Figure DEST_PATH_IMAGE016
为检测的音频长度;
从音频的起点开始遍历并保存超过步长的声音段的起始位置
Figure DEST_PATH_IMAGE018
6.根据权利要求5所述的一种声音自动采集与传输装置的使用方法,其特征在于:合并非静音片段时,以
Figure 89138DEST_PATH_IMAGE002
为一个静音范围长度,遍历所有标注的
Figure 475120DEST_PATH_IMAGE018
时刻,并合并一个静音块长度内重合的起始点,保证每一个静音范围都是原音频中且不重叠;
返回保存的静音片段集合
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE022
表示第i个静音片段开始时间,
Figure DEST_PATH_IMAGE024
表示第i个静音片段结束时间,
Figure DEST_PATH_IMAGE026
表示静音片段的个数。
7.根据权利要求6所述的一种声音自动采集与传输装置的使用方法,其特征在于:合并非静音片段时:
调用检测静音函数获取静音范围,判断是否存在静音范围 ,如果不存在直接返回无静音范围
Figure DEST_PATH_IMAGE028
,
Figure DEST_PATH_IMAGE030
为音频长度;
若存在静音范围,判断是否整个音频为静音,如果判断出整个音频都为静音,则返回空值;
如果不是整个音频为静音,获取每个静音范围的开始时间点
Figure 167043DEST_PATH_IMAGE022
和结束时间点
Figure 31094DEST_PATH_IMAGE024
,通过遍历得出每个非静音片段
Figure DEST_PATH_IMAGE032
,若
Figure DEST_PATH_IMAGE034
为空,则丢弃,若
Figure DEST_PATH_IMAGE036
为空,则丢弃;得到非静音片段集合
Figure DEST_PATH_IMAGE038
;其中,
Figure DEST_PATH_IMAGE040
表示第j个非静音片段的开始时间,
Figure DEST_PATH_IMAGE042
表示第j个非静音片段的结束时间,
Figure DEST_PATH_IMAGE044
表示非静音片段的个数;
返回非静音片段集合
Figure 468635DEST_PATH_IMAGE038
8.根据权利要求7所述的一种声音自动采集与传输装置的使用方法,其特征在于:为了使得相邻两个非静音片段合并得到一个更加连贯的片段,遍历非静音片段集合
Figure 759939DEST_PATH_IMAGE038
,设置非静音片段最短时间间隔
Figure DEST_PATH_IMAGE046
,若两个相邻的非静音片段
Figure DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE050
之间的时间间隔
Figure DEST_PATH_IMAGE052
小于
Figure 574442DEST_PATH_IMAGE046
,则合并两个非静音片段为
Figure DEST_PATH_IMAGE054
,最后得到合并后的非静音片段集合
Figure DEST_PATH_IMAGE056
Figure DEST_PATH_IMAGE058
表示合并后第k个非静音片段的开始时间,
Figure DEST_PATH_IMAGE060
表示合并后第k个非静音片段的结束时间,
Figure DEST_PATH_IMAGE062
表示合并后的非静音片段个数。
9.根据权利要求8所述的一种声音自动采集与传输装置的使用方法,其特征在于:为了让非静音片段开始和结尾部分声音更加平滑,遍历合并后的非静音片段集合
Figure 989987DEST_PATH_IMAGE056
,设置保留静音时长参数
Figure DEST_PATH_IMAGE064
,得到输出目标范围集合
Figure DEST_PATH_IMAGE066
返回保存的输出目标范围集合
Figure DEST_PATH_IMAGE068
CN202110223490.1A 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法 Active CN112601153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110223490.1A CN112601153B (zh) 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110223490.1A CN112601153B (zh) 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法

Publications (2)

Publication Number Publication Date
CN112601153A true CN112601153A (zh) 2021-04-02
CN112601153B CN112601153B (zh) 2021-05-07

Family

ID=75207643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110223490.1A Active CN112601153B (zh) 2021-03-01 2021-03-01 一种声音自动采集与传输装置及其使用方法

Country Status (1)

Country Link
CN (1) CN112601153B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02302152A (ja) * 1989-05-16 1990-12-14 Nec Corp 音声録音装置およびメッセージ録音メモリの管理方法
JPH08294199A (ja) * 1995-04-20 1996-11-05 Hitachi Ltd 話速変換装置
US20040030957A1 (en) * 2002-08-12 2004-02-12 Sitaram Yadavalli Various methods and apparatuses to track failing memory locations to enable implementations for invalidating repeatedly failing memory locations
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
CN101221762A (zh) * 2007-12-06 2008-07-16 上海大学 一种mp3压缩域音频分割方法
CN104202321A (zh) * 2014-09-02 2014-12-10 上海天脉聚源文化传媒有限公司 一种声音录制的方法及装置
CN105845124A (zh) * 2016-05-05 2016-08-10 北京小米移动软件有限公司 音频处理方法及装置
CN106448702A (zh) * 2016-09-14 2017-02-22 努比亚技术有限公司 一种录音数据处理装置、移动终端及方法
CN106935253A (zh) * 2017-03-10 2017-07-07 北京奇虎科技有限公司 音频文件的裁剪方法、装置及终端设备
CN107623860A (zh) * 2017-08-09 2018-01-23 北京奇艺世纪科技有限公司 多媒体数据分割方法和装置
CN111128253A (zh) * 2019-12-13 2020-05-08 北京小米智能科技有限公司 音频剪辑方法及装置
US20200381017A1 (en) * 2017-11-28 2020-12-03 Justin Garak Flexible content recording slider

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02302152A (ja) * 1989-05-16 1990-12-14 Nec Corp 音声録音装置およびメッセージ録音メモリの管理方法
JPH08294199A (ja) * 1995-04-20 1996-11-05 Hitachi Ltd 話速変換装置
US20040030957A1 (en) * 2002-08-12 2004-02-12 Sitaram Yadavalli Various methods and apparatuses to track failing memory locations to enable implementations for invalidating repeatedly failing memory locations
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
CN101221762A (zh) * 2007-12-06 2008-07-16 上海大学 一种mp3压缩域音频分割方法
CN104202321A (zh) * 2014-09-02 2014-12-10 上海天脉聚源文化传媒有限公司 一种声音录制的方法及装置
CN105845124A (zh) * 2016-05-05 2016-08-10 北京小米移动软件有限公司 音频处理方法及装置
CN106448702A (zh) * 2016-09-14 2017-02-22 努比亚技术有限公司 一种录音数据处理装置、移动终端及方法
CN106935253A (zh) * 2017-03-10 2017-07-07 北京奇虎科技有限公司 音频文件的裁剪方法、装置及终端设备
CN107623860A (zh) * 2017-08-09 2018-01-23 北京奇艺世纪科技有限公司 多媒体数据分割方法和装置
US20200381017A1 (en) * 2017-11-28 2020-12-03 Justin Garak Flexible content recording slider
CN111128253A (zh) * 2019-12-13 2020-05-08 北京小米智能科技有限公司 音频剪辑方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
WEIRAN YAN: "Audio-based automatic mating success prediction of giant pandas", 《ARXIV》 *
刘嘉勇: "基于VoiceDSP的语音监控装置设计研究", 《微电子学与计算机》 *
刘璇: "圈养大熊猫初生幼仔声音通讯行为研究", 《四川动物》 *
李鹏超: "基于LabVIEW的声卡音频信号处理器设计", 《电脑编程技巧与维护》 *

Also Published As

Publication number Publication date
CN112601153B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
AU2016260156B2 (en) Method and device for improving audio processing performance
US20100026815A1 (en) Information processing method, information processing apparatus, and computer-readable storage medium
CN109669663B (zh) 音区幅值获取方法、装置、电子设备及存储介质
US9424743B2 (en) Real-time traffic detection
CN110223696B (zh) 一种语音信号的采集方法、装置及终端设备
CN111128253B (zh) 音频剪辑方法及装置
CN110458591A (zh) 广告信息检测方法、装置及计算机设备
CN106328130A (zh) 一种机器人语音寻向转动系统及方法
CN112601153B (zh) 一种声音自动采集与传输装置及其使用方法
JP2009122598A (ja) 電子機器、電子機器の制御方法、音声認識装置、音声認識方法及び音声認識プログラム
CN111061707B (zh) 一种dpi设备协议规则库和规则样本的优化方法和装置
US11170760B2 (en) Detecting speech activity in real-time in audio signal
CN112380977A (zh) 吸烟行为检测方法和装置
WO2018086334A1 (zh) 一种监控可移动目标的方法及其监控端
CN110246500A (zh) 基于录音文件的语音识别方法及系统
CN109525916A (zh) 一种智能麦克风控制方法及装置
CN113689847A (zh) 语音交互方法、装置及语音芯片模组
CN114783448A (zh) 一种音频信号处理装置、方法及可存储介质
CN114268893B (zh) 蓝牙音频设备播放异常的检测方法、设备和可读存储介质
CN108235137B (zh) 一种通过声音波形判断切台动作的方法、装置及电视机
CN114268893A (zh) 蓝牙音频设备播放异常的检测方法、设备和可读存储介质
CN108364654B (zh) 语音处理方法、介质、装置和计算设备
CN105611209A (zh) 基于nvr录像文件的人脸检索和抓拍方法
JP2001056700A (ja) 音声記録再生装置
CN111933176A (zh) 一种批量定位语音内容的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant