CN115762525A - 一种基于全方位语音获取的语音过滤收录方法及系统 - Google Patents
一种基于全方位语音获取的语音过滤收录方法及系统 Download PDFInfo
- Publication number
- CN115762525A CN115762525A CN202211458962.2A CN202211458962A CN115762525A CN 115762525 A CN115762525 A CN 115762525A CN 202211458962 A CN202211458962 A CN 202211458962A CN 115762525 A CN115762525 A CN 115762525A
- Authority
- CN
- China
- Prior art keywords
- voice
- recording
- recorded
- time
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000001914 filtration Methods 0.000 title claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 41
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 238000010223 real-time analysis Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000012797 qualification Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于全方位语音获取的语音过滤收录方法及系统,涉及语音过滤收录技术领域,解决了现有技术中,无法根据实时收录环境分析以及实时收录语音分析进行拾音器控制,导致收录效率降低的技术问题,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,以至于降低了语音收录的准确性,影响语音收录的质量,造成语音收录的效率降低且增加投入成本;将对应数量的拾音器以圆形形状进行摆放,并将其摆放位置设置为预设采集声源的实时位置;控制拾音器的收音面积,防止环境影响程度增加,同时保证需采集声音的收录效率。
Description
技术领域
本发明涉及语音过滤收录技术领域,具体为一种基于全方位语音获取的语音过滤收录方法及系统。
背景技术
拾音器,又称监听头。监听拾音器是用来采集现场环境声音再传送到后端设备的一个器件,它是由麦克风和音频放大电路构成。拾音器一般分为数字拾音器和模拟拾音器,数字拾音器就是通过数字信号处理系统将模拟的音频信号转换成数字信号并进行相应的数字信号处理的声音传感设备。
但是在现有技术中,无法根据实时收录环境分析以及实时收录语音分析进行拾音器控制,导致收录效率降低,无法保证收录的合格性。
针对上述的技术缺陷,现提出一种解决方案。
发明内容
本发明的目的就在于为了解决上述提出的问题,而提出一种基于全方位语音获取的语音过滤收录方法及系统,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,以至于降低了语音收录的准确性,影响语音收录的质量,造成语音收录的效率降低且增加投入成本;将对应数量的拾音器以圆形形状进行摆放,并将其摆放位置设置为预设采集声源的实时位置;控制拾音器的收音面积,防止环境影响程度增加,同时保证需采集声音的收录效率。
本发明的目的可以通过以下技术方案实现:
一种基于全方位语音获取的语音过滤收录系统,包括服务器,服务器通讯连接有:
语音收录环境分析单元,用于将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,通过分析生成收录环境高影响信号和收录环境低影响信号,并将其发送至服务器,服务器接收后生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元,通过拾音器控制单元进行拾音器控制;
实时收录语音分析单元,用于将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,通过分析生成高难度收录信号和低难度收录信号,并将其发送至服务器,服务器接收后,生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元,通过拾音器控制单元进行控制;
收录语音识别划分单元,用于将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数,通过分析获取到选中收录语音。
作为本发明的一种优选实施方式,语音收录环境分析单元的运行过程如下:
采集到语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度,并将语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度分别与最大增加跨度阈值和平均增加速度阈值进行比较:
若语音收录环境内的声源数量同时刻最大增加跨度超过最大增加跨度阈值,或者语音收录环境内声源数量平均增加速度超过平均增加速度阈值,则判定语音收录环境的实时分析不合格,生成收录环境高影响信号并将收录环境高影响信号发送至服务器;
若语音收录环境内的声源数量同时刻最大增加跨度未超过最大增加跨度阈值,且语音收录环境内声源数量平均增加速度未超过平均增加速度阈值,则判定语音收录环境的实时分析合格,生成收录环境低影响信号并将收录环境低影响信号发送至服务器。
作为本发明的一种优选实施方式,拾音器控制单元接收到拾音器限定控制信号后,将当前语音收录环境内的拾音器进行控制,将实时运营的拾音器进行位置设定,根据语音开始收录时刻与收录环境内声源出现时刻位置设定,即将收录环境内声源出现时刻与语音开始收录时刻的间隔时长未超过间隔时长阈值,且收录环境内声源出现时刻早于语音开始收录时刻,则将对应收录环境内声源标记为预设采集声源,且预设采集声源不唯一,将对应数量的拾音器以圆形形状进行摆放,并将其摆放位置设置为预设采集声源的实时位置。
作为本发明的一种优选实施方式,实时收录语音分析单元的运行过程如下:
采集到实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度,并将实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度分别与最大浮动值阈值和持续降低速度阈值进行比较:
若实时需收录语音对应相邻时刻语音分贝最大浮动值超过最大浮动值阈值,或者实时需收录语音在收录过程中语音分贝的持续降低速度超过持续降低速度阈值,则判定实时收录语音的收录难度大,生成高难度收录信号并将高难度收录信号发送至服务器;若实时需收录语音对应相邻时刻语音分贝最大浮动值未超过最大浮动值阈值,且实时需收录语音在收录过程中语音分贝的持续降低速度未超过持续降低速度阈值,则判定实时收录语音的收录难度小,生成低难度收录信号并将低难度收录信号发送至服务器。
作为本发明的一种优选实施方式,拾音器控制单元接收到拾音器增强控制信号后,将拾音器位置摆放设定,若当前实时收录语音难度高时,将对应实时使用的拾音器进行整列摆放,并将拾音器摆放成矩形方阵,增加当前语音收录面积保证实时收录语音的稳定;若当前实时收录语音难度低时,则根据当前投入使用的拾音器进行数量限定,且数量限定前提为满足当前收录语音的收录需求。
作为本发明的一种优选实施方式,收录语音识别划分单元的运行过程如下:
将各个语音段进行文字识别,并根据文字识别过程进行分析,将不通过文字识别过程的语音段以及文字识别转换的文字语义搭配异常的语音段标记为排除语音段;
将通过文字识别过程的语音段以及文字识别转换的文字语义搭配正常的语音段标记为待收录语音段,采集到待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长,并将待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长分别与声音时长占比阈值与平均语音时长阈值进行比较:
若待收录语音段对应声源的产音时长与总收录时长的占比超过声音时长占比阈值,且对应待收录语音内可通过文字识别过程中的平均语音时长超过平均语音时长阈值,则将对应待收录语音标记为选中收录语音,并将选中收录语音进行收录存储;若待收录语音段对应声源的产音时长与总收录时长的占比未超过声音时长占比阈值,或者对应待收录语音内可通过文字识别过程中的平均语音时长未超过平均语音时长阈值,则将对应待收录语音标记为未选中收录语音,并将未选中收录语音进行删除或者重新收录。
作为本发明的一种优选实施方式,一种基于全方位语音获取的语音过滤收录方法,语音过滤收录方法具体步骤如下:
步骤一、语音收录环境分析,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,完成实时收录环境的分析后通过拾音器控制单元进行拾音器控制;
步骤二、实时收录语音分析,将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,完成实时收录语音分析后通过拾音器控制单元进行控制;
步骤三、收录语音识别划分,将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数,通过分析获取到选中收录语音。
与现有技术相比,本发明的有益效果是:
1、本发明中,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,以至于降低了语音收录的准确性,影响语音收录的质量,造成语音收录的效率降低且增加投入成本;将对应数量的拾音器以圆形形状进行摆放,并将其摆放位置设置为预设采集声源的实时位置;控制拾音器的收音面积,防止环境影响程度增加,同时保证需采集声音的收录效率;
2、本发明中,将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,保证在高难度收录语音收录合格性,提高了收录语音的实时收录效率;将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,保证收录过程的准确性,增强了语音收录的效率,同时确保了用户进行语音收录的实用性。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的原理框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参阅图1所示,一种基于全方位语音获取的语音过滤收录系统,包括服务器,服务器通讯连接有语音收录环境分析单元、实时收录语音分析单元、收录语音识别划分单元以及拾音器控制单元,其中,服务器与语音收录环境分析单元、实时收录语音分析单元、收录语音识别划分单元以及拾音器控制单元均为双向通讯连接;
在进行全方位语音收录时,服务器生成实时语音收录环境信号并将实时语音收录环境信号发送至语音收录环境分析单元,语音收录环境分析单元接收到实时语音收录环境信号后,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,以至于降低了语音收录的准确性,影响语音收录的质量,造成语音收录的效率降低且增加投入成本;
采集到语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度,并将语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度分别与最大增加跨度阈值和平均增加速度阈值进行比较:
若语音收录环境内的声源数量同时刻最大增加跨度超过最大增加跨度阈值,或者语音收录环境内声源数量平均增加速度超过平均增加速度阈值,则判定语音收录环境的实时分析不合格,生成收录环境高影响信号并将收录环境高影响信号发送至服务器;
若语音收录环境内的声源数量同时刻最大增加跨度未超过最大增加跨度阈值,且语音收录环境内声源数量平均增加速度未超过平均增加速度阈值,则判定语音收录环境的实时分析合格,生成收录环境低影响信号并将收录环境低影响信号发送至服务器;
服务器接收到收录环境高影响信号后,生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元,拾音器控制单元接收到拾音器限定控制信号后,将当前语音收录环境内的拾音器进行控制,将实时运营的拾音器进行位置设定,根据语音开始收录时刻与收录环境内声源出现时刻位置设定,即将收录环境内声源出现时刻与语音开始收录时刻的间隔时长未超过间隔时长阈值,且收录环境内声源出现时刻早于语音开始收录时刻,则将对应收录环境内声源标记为预设采集声源,且预设采集声源不唯一,将对应数量的拾音器以圆形形状进行摆放,并将其摆放位置设置为预设采集声源的实时位置;控制拾音器的收音面积,防止环境影响程度增加,同时保证需采集声音的收录效率;
服务器接收到收录环境低影响信号后,生成实时收录语音分析信号并将实时收录语音分析信号发送至实时收录语音分析单元,实时收录语音分析单元接收到实时收录语音分析信号后,将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,保证在高难度收录语音收录合格性,提高了收录语音的实时收录效率;
采集到实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度,并将实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度分别与最大浮动值阈值和持续降低速度阈值进行比较:
若实时需收录语音对应相邻时刻语音分贝最大浮动值超过最大浮动值阈值,或者实时需收录语音在收录过程中语音分贝的持续降低速度超过持续降低速度阈值,则判定实时收录语音的收录难度大,生成高难度收录信号并将高难度收录信号发送至服务器;
若实时需收录语音对应相邻时刻语音分贝最大浮动值未超过最大浮动值阈值,且实时需收录语音在收录过程中语音分贝的持续降低速度未超过持续降低速度阈值,则判定实时收录语音的收录难度小,生成低难度收录信号并将低难度收录信号发送至服务器;
服务器接收到高难度收录信号和低难度收录信号后,生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元,拾音器控制单元接收到拾音器增强控制信号后,将拾音器位置摆放设定,若当前实时收录语音难度高时,将对应实时使用的拾音器进行整列摆放,并将拾音器摆放成矩形方阵,增加当前语音收录面积保证实时收录语音的稳定;若当前实时收录语音难度低时,则根据当前投入使用的拾音器进行数量限定,且数量限定前提为满足当前收录语音的收录需求;
在拾音器完成控制后,服务器生成收录语音识别划分信号并将收录语音识别划分信号发送至收录语音识别划分单元,收录语音识别划分单元接收到收录语音识别划分信号后,将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,保证收录过程的准确性,增强了语音收录的效率,同时确保了用户进行语音收录的实用性;
将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数;将各个语音段进行文字识别,并根据文字识别过程进行分析,将不通过文字识别过程的语音段以及文字识别转换的文字语义搭配异常的语音段标记为排除语音段,其中,文字语义搭配异常表示为文字对应主谓宾的搭配顺序不合理或者文字仅为语气词等;
将通过文字识别过程的语音段以及文字识别转换的文字语义搭配正常的语音段标记为待收录语音段,采集到待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长,并将待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长分别与声音时长占比阈值与平均语音时长阈值进行比较:
若待收录语音段对应声源的产音时长与总收录时长的占比超过声音时长占比阈值,且对应待收录语音内可通过文字识别过程中的平均语音时长超过平均语音时长阈值,则将对应待收录语音标记为选中收录语音,并将选中收录语音进行收录存储;
若待收录语音段对应声源的产音时长与总收录时长的占比未超过声音时长占比阈值,或者对应待收录语音内可通过文字识别过程中的平均语音时长未超过平均语音时长阈值,则将对应待收录语音标记为未选中收录语音,并将未选中收录语音进行删除或者重新收录;
一种基于全方位语音获取的语音过滤收录方法,语音过滤收录方法具体步骤如下:
步骤一、语音收录环境分析,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,完成实时收录环境的分析后通过拾音器控制单元进行拾音器控制;
步骤二、实时收录语音分析,将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,完成实时收录语音分析后通过拾音器控制单元进行控制;
步骤三、收录语音识别划分,将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数,通过分析获取到选中收录语音。
本发明在使用时,通过语音收录环境分析单元将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,通过分析生成收录环境高影响信号和收录环境低影响信号,并将其发送至服务器,服务器接收后生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元,通过拾音器控制单元进行拾音器控制;通过实时收录语音分析单元将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,通过分析生成高难度收录信号和低难度收录信号,并将其发送至服务器,服务器接收后,生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元,通过拾音器控制单元进行控制;通过收录语音识别划分单元将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数,通过分析获取到选中收录语音。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (7)
1.一种基于全方位语音获取的语音过滤收录系统,其特征在于,包括服务器,服务器通讯连接有:
语音收录环境分析单元,用于将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,通过分析生成收录环境高影响信号和收录环境低影响信号,并将其发送至服务器,服务器接收后生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元,通过拾音器控制单元进行拾音器控制;
实时收录语音分析单元,用于将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,通过分析生成高难度收录信号和低难度收录信号,并将其发送至服务器,服务器接收后,生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元,通过拾音器控制单元进行控制;
收录语音识别划分单元,用于将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数,通过分析获取到选中收录语音。
2.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统,其特征在于,语音收录环境分析单元的运行过程如下:
采集到语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度,并将语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度分别与最大增加跨度阈值和平均增加速度阈值进行比较:
若语音收录环境内的声源数量同时刻最大增加跨度超过最大增加跨度阈值,或者语音收录环境内声源数量平均增加速度超过平均增加速度阈值,则判定语音收录环境的实时分析不合格,生成收录环境高影响信号并将收录环境高影响信号发送至服务器;
若语音收录环境内的声源数量同时刻最大增加跨度未超过最大增加跨度阈值,且语音收录环境内声源数量平均增加速度未超过平均增加速度阈值,则判定语音收录环境的实时分析合格,生成收录环境低影响信号并将收录环境低影响信号发送至服务器。
3.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统,其特征在于,拾音器控制单元接收到拾音器限定控制信号后,将当前语音收录环境内的拾音器进行控制,将实时运营的拾音器进行位置设定,根据语音开始收录时刻与收录环境内声源出现时刻位置设定,即将收录环境内声源出现时刻与语音开始收录时刻的间隔时长未超过间隔时长阈值,且收录环境内声源出现时刻早于语音开始收录时刻,则将对应收录环境内声源标记为预设采集声源,且预设采集声源不唯一,将对应数量的拾音器以圆形形状进行摆放,并将其摆放位置设置为预设采集声源的实时位置。
4.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统,其特征在于,实时收录语音分析单元的运行过程如下:
采集到实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度,并将实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度分别与最大浮动值阈值和持续降低速度阈值进行比较:
若实时需收录语音对应相邻时刻语音分贝最大浮动值超过最大浮动值阈值,或者实时需收录语音在收录过程中语音分贝的持续降低速度超过持续降低速度阈值,则判定实时收录语音的收录难度大,生成高难度收录信号并将高难度收录信号发送至服务器;若实时需收录语音对应相邻时刻语音分贝最大浮动值未超过最大浮动值阈值,且实时需收录语音在收录过程中语音分贝的持续降低速度未超过持续降低速度阈值,则判定实时收录语音的收录难度小,生成低难度收录信号并将低难度收录信号发送至服务器。
5.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统,其特征在于,拾音器控制单元接收到拾音器增强控制信号后,将拾音器位置摆放设定,若当前实时收录语音难度高时,将对应实时使用的拾音器进行整列摆放,并将拾音器摆放成矩形方阵,增加当前语音收录面积保证实时收录语音的稳定;若当前实时收录语音难度低时,则根据当前投入使用的拾音器进行数量限定,且数量限定前提为满足当前收录语音的收录需求。
6.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统,其特征在于,收录语音识别划分单元的运行过程如下:
将各个语音段进行文字识别,并根据文字识别过程进行分析,将不通过文字识别过程的语音段以及文字识别转换的文字语义搭配异常的语音段标记为排除语音段;
将通过文字识别过程的语音段以及文字识别转换的文字语义搭配正常的语音段标记为待收录语音段,采集到待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长,并将待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长分别与声音时长占比阈值与平均语音时长阈值进行比较:
若待收录语音段对应声源的产音时长与总收录时长的占比超过声音时长占比阈值,且对应待收录语音内可通过文字识别过程中的平均语音时长超过平均语音时长阈值,则将对应待收录语音标记为选中收录语音,并将选中收录语音进行收录存储;若待收录语音段对应声源的产音时长与总收录时长的占比未超过声音时长占比阈值,或者对应待收录语音内可通过文字识别过程中的平均语音时长未超过平均语音时长阈值,则将对应待收录语音标记为未选中收录语音,并将未选中收录语音进行删除或者重新收录。
7.一种基于全方位语音获取的语音过滤收录方法,其特征在于,语音过滤收录方法具体步骤如下:
步骤一、语音收录环境分析,将语音收录的实时环境进行分析,判断当前实时收录环境对应语音收录是否存在影响,完成实时收录环境的分析后通过拾音器控制单元进行拾音器控制;
步骤二、实时收录语音分析,将实时收录环境内的收录语音进行分析,判断收录语音的采集难易程度,根据不同难易程度的收录语音进行拾音器合理设置,完成实时收录语音分析后通过拾音器控制单元进行控制;
步骤三、收录语音识别划分,将实时收录的语音进行识别划分,将收录的语音内进行人声和外界声音进行划分,将实时完成收录的语音标记为待分析语音,并将其进行分析,获取到待分析语音内对应声源的语音,并将根据声源进行待分析语音划分为i个语音段,i为大于1的自然数,通过分析获取到选中收录语音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211458962.2A CN115762525B (zh) | 2022-11-18 | 2022-11-18 | 一种基于全方位语音获取的语音过滤收录方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211458962.2A CN115762525B (zh) | 2022-11-18 | 2022-11-18 | 一种基于全方位语音获取的语音过滤收录方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115762525A true CN115762525A (zh) | 2023-03-07 |
CN115762525B CN115762525B (zh) | 2024-05-07 |
Family
ID=85334120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211458962.2A Active CN115762525B (zh) | 2022-11-18 | 2022-11-18 | 一种基于全方位语音获取的语音过滤收录方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115762525B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010036210A (ko) * | 1999-10-06 | 2001-05-07 | 윤종용 | 주변잡음을 이용한 휴대폰 제어방법 |
JP2011248001A (ja) * | 2010-05-25 | 2011-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル学習用ラベル作成装置、その方法及びプログラム |
US20130218559A1 (en) * | 2012-02-16 | 2013-08-22 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
CN108152788A (zh) * | 2017-12-22 | 2018-06-12 | 西安Tcl软件开发有限公司 | 声源追踪方法、声源追踪设备及计算机可读存储介质 |
CN109489803A (zh) * | 2018-10-17 | 2019-03-19 | 浙江大学医学院附属邵逸夫医院 | 一种环境噪音智能分析与提醒装置 |
CN110858476A (zh) * | 2018-08-24 | 2020-03-03 | 北京紫冬认知科技有限公司 | 一种基于麦克风阵列的声音采集方法及装置 |
CN111429939A (zh) * | 2020-02-20 | 2020-07-17 | 西安声联科技有限公司 | 一种双声源的声音信号分离方法和拾音器 |
CN112634924A (zh) * | 2020-12-14 | 2021-04-09 | 深圳市沃特沃德股份有限公司 | 基于语音通话的噪声过滤方法、装置和计算机设备 |
CN113129898A (zh) * | 2021-04-08 | 2021-07-16 | 上海交通大学 | 一种机器辅助的会议记录系统及方法 |
WO2021204027A1 (zh) * | 2020-04-08 | 2021-10-14 | 华为技术有限公司 | 麦克风阵列控制方法、装置、电子设备及计算机存储介质 |
CN114974200A (zh) * | 2022-07-13 | 2022-08-30 | 恩平市菲玛特电子科技有限公司 | 基于物联网的麦克风语音交互管理系统及方法 |
CN114979584A (zh) * | 2022-06-08 | 2022-08-30 | 湖南城市学院 | 一种用于道路施工设备的数据采集监控装置 |
-
2022
- 2022-11-18 CN CN202211458962.2A patent/CN115762525B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010036210A (ko) * | 1999-10-06 | 2001-05-07 | 윤종용 | 주변잡음을 이용한 휴대폰 제어방법 |
JP2011248001A (ja) * | 2010-05-25 | 2011-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル学習用ラベル作成装置、その方法及びプログラム |
US20130218559A1 (en) * | 2012-02-16 | 2013-08-22 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
CN108152788A (zh) * | 2017-12-22 | 2018-06-12 | 西安Tcl软件开发有限公司 | 声源追踪方法、声源追踪设备及计算机可读存储介质 |
CN110858476A (zh) * | 2018-08-24 | 2020-03-03 | 北京紫冬认知科技有限公司 | 一种基于麦克风阵列的声音采集方法及装置 |
CN109489803A (zh) * | 2018-10-17 | 2019-03-19 | 浙江大学医学院附属邵逸夫医院 | 一种环境噪音智能分析与提醒装置 |
CN111429939A (zh) * | 2020-02-20 | 2020-07-17 | 西安声联科技有限公司 | 一种双声源的声音信号分离方法和拾音器 |
WO2021204027A1 (zh) * | 2020-04-08 | 2021-10-14 | 华为技术有限公司 | 麦克风阵列控制方法、装置、电子设备及计算机存储介质 |
CN112634924A (zh) * | 2020-12-14 | 2021-04-09 | 深圳市沃特沃德股份有限公司 | 基于语音通话的噪声过滤方法、装置和计算机设备 |
CN113129898A (zh) * | 2021-04-08 | 2021-07-16 | 上海交通大学 | 一种机器辅助的会议记录系统及方法 |
CN114979584A (zh) * | 2022-06-08 | 2022-08-30 | 湖南城市学院 | 一种用于道路施工设备的数据采集监控装置 |
CN114974200A (zh) * | 2022-07-13 | 2022-08-30 | 恩平市菲玛特电子科技有限公司 | 基于物联网的麦克风语音交互管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115762525B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102436812B (zh) | 会议记录装置及利用该装置对会议进行记录的方法 | |
CN108172242B (zh) | 一种改进的蓝牙智能云音箱语音交互端点检测方法 | |
CN103903627A (zh) | 一种语音数据的传输方法及装置 | |
CN103124165A (zh) | 自动增益控制 | |
CN103530912A (zh) | 一种具有情绪识别功能的考勤系统及方法 | |
CN110148418B (zh) | 一种场景记录分析系统、方法及其装置 | |
CN111105796A (zh) | 无线耳机控制装置及控制方法、语音控制设置方法和系统 | |
CN111145763A (zh) | 一种基于gru的音频中的人声识别方法及系统 | |
CN106448690A (zh) | 一种音频信号的自动增益控制方法和装置 | |
CN106372653A (zh) | 一种基于堆栈式自动编码器的广告识别方法 | |
CN110970020A (zh) | 一种利用声纹提取有效语音信号的方法 | |
CN115862608A (zh) | 一种基于音频增强、Mel声谱图和ViT的环境声音分类方法 | |
CN111223489B (zh) | 一种基于Attention注意力机制的特定关键词识别方法及系统 | |
CN109448700A (zh) | 一种基于改进mfcc算法的嵌入式语音识别系统及方法 | |
CN113223492B (zh) | 一种语音播报系统 | |
CN113259793B (zh) | 智能麦克风及其信号处理方法 | |
CN115762525A (zh) | 一种基于全方位语音获取的语音过滤收录方法及系统 | |
CN108735230A (zh) | 基于混合音频的背景音乐识别方法、装置及设备 | |
CN113259824A (zh) | 一种实时多通道数字助听器降噪方法和系统 | |
CN116386633A (zh) | 一种适用于噪声条件下的智能终端设备控制方法及系统 | |
CN111863031B (zh) | 加载于已有摄像头网络的音频监测装置及其监测方法 | |
CN210575088U (zh) | 语音识别家电控制装置 | |
CN114373294A (zh) | 一种基于环境噪音自动调节音量的声响提示装置及方法 | |
CN114664303A (zh) | 连续语音指令快速识别控制系统 | |
CN111988705B (zh) | 音频处理方法、装置、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |