CN115762525B

CN115762525B - 一种基于全方位语音获取的语音过滤收录方法及系统

Info

Publication number: CN115762525B
Application number: CN202211458962.2A
Authority: CN
Inventors: 高岩
Original assignee: Beijing Zhongkeyi Technology Co ltd
Current assignee: Beijing Zhongkeyi Technology Co ltd
Priority date: 2022-11-18
Filing date: 2022-11-18
Publication date: 2024-05-07
Anticipated expiration: 2042-11-18
Also published as: CN115762525A

Abstract

本发明公开了一种基于全方位语音获取的语音过滤收录方法及系统，涉及语音过滤收录技术领域，解决了现有技术中，无法根据实时收录环境分析以及实时收录语音分析进行拾音器控制，导致收录效率降低的技术问题，将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，以至于降低了语音收录的准确性，影响语音收录的质量，造成语音收录的效率降低且增加投入成本；将对应数量的拾音器以圆形形状进行摆放，并将其摆放位置设置为预设采集声源的实时位置；控制拾音器的收音面积，防止环境影响程度增加，同时保证需采集声音的收录效率。

Description

一种基于全方位语音获取的语音过滤收录方法及系统

技术领域

本发明涉及语音过滤收录技术领域，具体为一种基于全方位语音获取的语音过滤收录方法及系统。

背景技术

拾音器，又称监听头。监听拾音器是用来采集现场环境声音再传送到后端设备的一个器件，它是由麦克风和音频放大电路构成。拾音器一般分为数字拾音器和模拟拾音器，数字拾音器就是通过数字信号处理系统将模拟的音频信号转换成数字信号并进行相应的数字信号处理的声音传感设备。

但是在现有技术中，无法根据实时收录环境分析以及实时收录语音分析进行拾音器控制，导致收录效率降低，无法保证收录的合格性。

针对上述的技术缺陷，现提出一种解决方案。

发明内容

本发明的目的就在于为了解决上述提出的问题，而提出一种基于全方位语音获取的语音过滤收录方法及系统，将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，以至于降低了语音收录的准确性，影响语音收录的质量，造成语音收录的效率降低且增加投入成本；将对应数量的拾音器以圆形形状进行摆放，并将其摆放位置设置为预设采集声源的实时位置；控制拾音器的收音面积，防止环境影响程度增加，同时保证需采集声音的收录效率。

本发明的目的可以通过以下技术方案实现：

一种基于全方位语音获取的语音过滤收录系统，包括服务器，服务器通讯连接有：

语音收录环境分析单元，用于将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，通过分析生成收录环境高影响信号和收录环境低影响信号，并将其发送至服务器，服务器接收后生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元，通过拾音器控制单元进行拾音器控制；

实时收录语音分析单元，用于将实时收录环境内的收录语音进行分析，判断收录语音的采集难易程度，根据不同难易程度的收录语音进行拾音器合理设置，通过分析生成高难度收录信号和低难度收录信号，并将其发送至服务器，服务器接收后，生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元，通过拾音器控制单元进行控制；

收录语音识别划分单元，用于将实时收录的语音进行识别划分，将收录的语音内进行人声和外界声音进行划分，将实时完成收录的语音标记为待分析语音，并将其进行分析，获取到待分析语音内对应声源的语音，并将根据声源进行待分析语音划分为i个语音段，i为大于1的自然数，通过分析获取到选中收录语音。

作为本发明的一种优选实施方式，语音收录环境分析单元的运行过程如下：

采集到语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度，并将语音收录环境内的声源数量同时刻最大增加跨度以及语音收录环境内声源数量平均增加速度分别与最大增加跨度阈值和平均增加速度阈值进行比较：

若语音收录环境内的声源数量同时刻最大增加跨度超过最大增加跨度阈值，或者语音收录环境内声源数量平均增加速度超过平均增加速度阈值，则判定语音收录环境的实时分析不合格，生成收录环境高影响信号并将收录环境高影响信号发送至服务器；

若语音收录环境内的声源数量同时刻最大增加跨度未超过最大增加跨度阈值，且语音收录环境内声源数量平均增加速度未超过平均增加速度阈值，则判定语音收录环境的实时分析合格，生成收录环境低影响信号并将收录环境低影响信号发送至服务器。

作为本发明的一种优选实施方式，拾音器控制单元接收到拾音器限定控制信号后，将当前语音收录环境内的拾音器进行控制，将实时运营的拾音器进行位置设定，根据语音开始收录时刻与收录环境内声源出现时刻位置设定，即将收录环境内声源出现时刻与语音开始收录时刻的间隔时长未超过间隔时长阈值，且收录环境内声源出现时刻早于语音开始收录时刻，则将对应收录环境内声源标记为预设采集声源，且预设采集声源不唯一，将对应数量的拾音器以圆形形状进行摆放，并将其摆放位置设置为预设采集声源的实时位置。

作为本发明的一种优选实施方式，实时收录语音分析单元的运行过程如下：

采集到实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度，并将实时需收录语音对应相邻时刻语音分贝最大浮动值以及实时需收录语音在收录过程中语音分贝的持续降低速度分别与最大浮动值阈值和持续降低速度阈值进行比较：

若实时需收录语音对应相邻时刻语音分贝最大浮动值超过最大浮动值阈值，或者实时需收录语音在收录过程中语音分贝的持续降低速度超过持续降低速度阈值，则判定实时收录语音的收录难度大，生成高难度收录信号并将高难度收录信号发送至服务器；若实时需收录语音对应相邻时刻语音分贝最大浮动值未超过最大浮动值阈值，且实时需收录语音在收录过程中语音分贝的持续降低速度未超过持续降低速度阈值，则判定实时收录语音的收录难度小，生成低难度收录信号并将低难度收录信号发送至服务器。

作为本发明的一种优选实施方式，拾音器控制单元接收到拾音器增强控制信号后，将拾音器位置摆放设定，若当前实时收录语音难度高时，将对应实时使用的拾音器进行整列摆放，并将拾音器摆放成矩形方阵，增加当前语音收录面积保证实时收录语音的稳定；若当前实时收录语音难度低时，则根据当前投入使用的拾音器进行数量限定，且数量限定前提为满足当前收录语音的收录需求。

作为本发明的一种优选实施方式，收录语音识别划分单元的运行过程如下：

将各个语音段进行文字识别，并根据文字识别过程进行分析，将不通过文字识别过程的语音段以及文字识别转换的文字语义搭配异常的语音段标记为排除语音段；

将通过文字识别过程的语音段以及文字识别转换的文字语义搭配正常的语音段标记为待收录语音段，采集到待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长，并将待收录语音段对应声源的产音时长与总收录时长的占比以及对应待收录语音内可通过文字识别过程中的平均语音时长分别与声音时长占比阈值与平均语音时长阈值进行比较：

若待收录语音段对应声源的产音时长与总收录时长的占比超过声音时长占比阈值，且对应待收录语音内可通过文字识别过程中的平均语音时长超过平均语音时长阈值，则将对应待收录语音标记为选中收录语音，并将选中收录语音进行收录存储；若待收录语音段对应声源的产音时长与总收录时长的占比未超过声音时长占比阈值，或者对应待收录语音内可通过文字识别过程中的平均语音时长未超过平均语音时长阈值，则将对应待收录语音标记为未选中收录语音，并将未选中收录语音进行删除或者重新收录。

作为本发明的一种优选实施方式，一种基于全方位语音获取的语音过滤收录方法，语音过滤收录方法具体步骤如下：

步骤一、语音收录环境分析，将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，完成实时收录环境的分析后通过拾音器控制单元进行拾音器控制；

步骤二、实时收录语音分析，将实时收录环境内的收录语音进行分析，判断收录语音的采集难易程度，根据不同难易程度的收录语音进行拾音器合理设置，完成实时收录语音分析后通过拾音器控制单元进行控制；

步骤三、收录语音识别划分，将实时收录的语音进行识别划分，将收录的语音内进行人声和外界声音进行划分，将实时完成收录的语音标记为待分析语音，并将其进行分析，获取到待分析语音内对应声源的语音，并将根据声源进行待分析语音划分为i个语音段，i为大于1的自然数，通过分析获取到选中收录语音。

与现有技术相比，本发明的有益效果是：

1、本发明中，将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，以至于降低了语音收录的准确性，影响语音收录的质量，造成语音收录的效率降低且增加投入成本；将对应数量的拾音器以圆形形状进行摆放，并将其摆放位置设置为预设采集声源的实时位置；控制拾音器的收音面积，防止环境影响程度增加，同时保证需采集声音的收录效率；

2、本发明中，将实时收录环境内的收录语音进行分析，判断收录语音的采集难易程度，根据不同难易程度的收录语音进行拾音器合理设置，保证在高难度收录语音收录合格性，提高了收录语音的实时收录效率；将实时收录的语音进行识别划分，将收录的语音内进行人声和外界声音进行划分，保证收录过程的准确性，增强了语音收录的效率，同时确保了用户进行语音收录的实用性。

附图说明

为了便于本领域技术人员理解，下面结合附图对本发明作进一步的说明。

图1为本发明的原理框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

请参阅图1所示，一种基于全方位语音获取的语音过滤收录系统，包括服务器，服务器通讯连接有语音收录环境分析单元、实时收录语音分析单元、收录语音识别划分单元以及拾音器控制单元，其中，服务器与语音收录环境分析单元、实时收录语音分析单元、收录语音识别划分单元以及拾音器控制单元均为双向通讯连接；

在进行全方位语音收录时，服务器生成实时语音收录环境信号并将实时语音收录环境信号发送至语音收录环境分析单元，语音收录环境分析单元接收到实时语音收录环境信号后，将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，以至于降低了语音收录的准确性，影响语音收录的质量，造成语音收录的效率降低且增加投入成本；

若语音收录环境内的声源数量同时刻最大增加跨度未超过最大增加跨度阈值，且语音收录环境内声源数量平均增加速度未超过平均增加速度阈值，则判定语音收录环境的实时分析合格，生成收录环境低影响信号并将收录环境低影响信号发送至服务器；

服务器接收到收录环境高影响信号后，生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元，拾音器控制单元接收到拾音器限定控制信号后，将当前语音收录环境内的拾音器进行控制，将实时运营的拾音器进行位置设定，根据语音开始收录时刻与收录环境内声源出现时刻位置设定，即将收录环境内声源出现时刻与语音开始收录时刻的间隔时长未超过间隔时长阈值，且收录环境内声源出现时刻早于语音开始收录时刻，则将对应收录环境内声源标记为预设采集声源，且预设采集声源不唯一，将对应数量的拾音器以圆形形状进行摆放，并将其摆放位置设置为预设采集声源的实时位置；控制拾音器的收音面积，防止环境影响程度增加，同时保证需采集声音的收录效率；

服务器接收到收录环境低影响信号后，生成实时收录语音分析信号并将实时收录语音分析信号发送至实时收录语音分析单元，实时收录语音分析单元接收到实时收录语音分析信号后，将实时收录环境内的收录语音进行分析，判断收录语音的采集难易程度，根据不同难易程度的收录语音进行拾音器合理设置，保证在高难度收录语音收录合格性，提高了收录语音的实时收录效率；

若实时需收录语音对应相邻时刻语音分贝最大浮动值超过最大浮动值阈值，或者实时需收录语音在收录过程中语音分贝的持续降低速度超过持续降低速度阈值，则判定实时收录语音的收录难度大，生成高难度收录信号并将高难度收录信号发送至服务器；

若实时需收录语音对应相邻时刻语音分贝最大浮动值未超过最大浮动值阈值，且实时需收录语音在收录过程中语音分贝的持续降低速度未超过持续降低速度阈值，则判定实时收录语音的收录难度小，生成低难度收录信号并将低难度收录信号发送至服务器；

服务器接收到高难度收录信号和低难度收录信号后，生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元，拾音器控制单元接收到拾音器增强控制信号后，将拾音器位置摆放设定，若当前实时收录语音难度高时，将对应实时使用的拾音器进行整列摆放，并将拾音器摆放成矩形方阵，增加当前语音收录面积保证实时收录语音的稳定；若当前实时收录语音难度低时，则根据当前投入使用的拾音器进行数量限定，且数量限定前提为满足当前收录语音的收录需求；

在拾音器完成控制后，服务器生成收录语音识别划分信号并将收录语音识别划分信号发送至收录语音识别划分单元，收录语音识别划分单元接收到收录语音识别划分信号后，将实时收录的语音进行识别划分，将收录的语音内进行人声和外界声音进行划分，保证收录过程的准确性，增强了语音收录的效率，同时确保了用户进行语音收录的实用性；

将实时完成收录的语音标记为待分析语音，并将其进行分析，获取到待分析语音内对应声源的语音，并将根据声源进行待分析语音划分为i个语音段，i为大于1的自然数；将各个语音段进行文字识别，并根据文字识别过程进行分析，将不通过文字识别过程的语音段以及文字识别转换的文字语义搭配异常的语音段标记为排除语音段，其中，文字语义搭配异常表示为文字对应主谓宾的搭配顺序不合理或者文字仅为语气词等；

若待收录语音段对应声源的产音时长与总收录时长的占比超过声音时长占比阈值，且对应待收录语音内可通过文字识别过程中的平均语音时长超过平均语音时长阈值，则将对应待收录语音标记为选中收录语音，并将选中收录语音进行收录存储；

若待收录语音段对应声源的产音时长与总收录时长的占比未超过声音时长占比阈值，或者对应待收录语音内可通过文字识别过程中的平均语音时长未超过平均语音时长阈值，则将对应待收录语音标记为未选中收录语音，并将未选中收录语音进行删除或者重新收录；

一种基于全方位语音获取的语音过滤收录方法，语音过滤收录方法具体步骤如下：

本发明在使用时，通过语音收录环境分析单元将语音收录的实时环境进行分析，判断当前实时收录环境对应语音收录是否存在影响，通过分析生成收录环境高影响信号和收录环境低影响信号，并将其发送至服务器，服务器接收后生成拾音器限定控制信号并将拾音器限定控制信号发送至拾音器控制单元，通过拾音器控制单元进行拾音器控制；通过实时收录语音分析单元将实时收录环境内的收录语音进行分析，判断收录语音的采集难易程度，根据不同难易程度的收录语音进行拾音器合理设置，通过分析生成高难度收录信号和低难度收录信号，并将其发送至服务器，服务器接收后，生成拾音器增强控制信号并将拾音器增强控制信号发送至拾音器控制单元，通过拾音器控制单元进行控制；通过收录语音识别划分单元将实时收录的语音进行识别划分，将收录的语音内进行人声和外界声音进行划分，将实时完成收录的语音标记为待分析语音，并将其进行分析，获取到待分析语音内对应声源的语音，并将根据声源进行待分析语音划分为i个语音段，i为大于1的自然数，通过分析获取到选中收录语音。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种基于全方位语音获取的语音过滤收录系统，其特征在于，包括服务器，服务器通讯连接有：

收录语音识别划分单元，用于将实时收录的语音进行识别划分，将收录的语音内进行人声和外界声音进行划分，将实时完成收录的语音标记为待分析语音，并将其进行分析，获取到待分析语音内对应声源的语音，并将根据声源进行待分析语音划分为i个语音段，i为大于1的自然数，通过分析获取到选中收录语音；

语音收录环境分析单元的运行过程如下：

拾音器控制单元接收到拾音器限定控制信号后，将当前语音收录环境内的拾音器进行控制，将实时运营的拾音器进行位置设定，根据语音开始收录时刻与收录环境内声源出现时刻位置设定，即将收录环境内声源出现时刻与语音开始收录时刻的间隔时长未超过间隔时长阈值，且收录环境内声源出现时刻早于语音开始收录时刻，则将对应收录环境内声源标记为预设采集声源，且预设采集声源不唯一，将对应数量的拾音器以圆形形状进行摆放，并将其摆放位置设置为预设采集声源的实时位置。

2.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统，其特征在于，实时收录语音分析单元的运行过程如下：

3.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统，其特征在于，拾音器控制单元接收到拾音器增强控制信号后，将拾音器位置摆放设定，若当前实时收录语音难度高时，将对应实时使用的拾音器进行整列摆放，并将拾音器摆放成矩形方阵，增加当前语音收录面积保证实时收录语音的稳定；若当前实时收录语音难度低时，则根据当前投入使用的拾音器进行数量限定，且数量限定前提为满足当前收录语音的收录需求。

4.根据权利要求1所述的一种基于全方位语音获取的语音过滤收录系统，其特征在于，收录语音识别划分单元的运行过程如下：

5.一种基于权利要求1-4任一所述的一种基于全方位语音获取的语音过滤收录系统的语音过滤收录方法，其特征在于，语音过滤收录方法具体步骤如下：