CN117351993B - 一种基于音频分发的音频传输质量评价方法及系统 - Google Patents
一种基于音频分发的音频传输质量评价方法及系统 Download PDFInfo
- Publication number
- CN117351993B CN117351993B CN202311644880.1A CN202311644880A CN117351993B CN 117351993 B CN117351993 B CN 117351993B CN 202311644880 A CN202311644880 A CN 202311644880A CN 117351993 B CN117351993 B CN 117351993B
- Authority
- CN
- China
- Prior art keywords
- audio
- data
- analysis
- audio data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 33
- 230000007613 environmental effect Effects 0.000 claims abstract description 108
- 230000009467 reduction Effects 0.000 claims abstract description 48
- 230000000737 periodic effect Effects 0.000 claims abstract description 34
- 230000006399 behavior Effects 0.000 claims description 83
- 230000006835 compression Effects 0.000 claims description 50
- 238000007906 compression Methods 0.000 claims description 50
- 238000012360 testing method Methods 0.000 claims description 35
- 230000008859 change Effects 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 12
- 238000001303 quality assessment method Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 23
- 238000011156 evaluation Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
- G10K11/17823—Reference signals, e.g. ambient acoustic environment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1787—General system configurations
- G10K11/17885—General system configurations additionally using a desired external signal, e.g. pass-through audio such as music or speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3012—Algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3038—Neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于音频分发的音频传输质量评价方法及系统,通过将用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。通过本发明,能够基于用户行为特征,在音频数据的处理中,实现动态调整音频处理方案的目的,从而提高音频数据的传输效率与降噪处理的质量,实现音频数据的科学评价分析,提高用户体验。
Description
技术领域
本发明涉及音频分析领域,更具体的,涉及一种基于音频分发的音频传输质量评价方法及系统。
背景技术
随着音频数据处理的快速发展,如何有效地分析和处理这些数据成为了一个重要的问题。在音频分析领域,现有的方法往往只关注音频本身的特征,而忽略了用户特征和行为对于音频分析的影响,且缺少动态分析用户音频数据处理与科学评价分析音频数据的技术方案,因此,本发明提出一种基于音频分发的音频传输质量评价方法,以解决现有技术的不足。
发明内容
本发明克服了现有技术的缺陷,提出了一种基于音频分发的音频传输质量评价方法及系统。
本发明第一方面提供了一种基于音频分发的音频传输质量评价方法,包括:
在一个预设时间段内,基于预设用户终端,获取用户音频数据;
将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;
基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;
基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;
基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。
本方案中,所述在一个预设时间段内,基于预设用户终端,获取用户音频数据,具体为:
基于一个预设时间段,划分为多个分析周期;
在一个预设时间段内,获取第一音频数据;
基于所述多个分析周期,将用户音频数据进行数据划分,形成多个用户音频数据。
本方案中,所述将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据,具体为:
从系统数据库中获取用户历史人声音频数据;
基于所述用户历史人声音频数据进行基于频率、振幅、音频波形的特征提取,得到音频对比特征数据;
分析所有用户音频数据并进行人声与环境声分离,结合音频对比特征数据进行特征相似性分析,并得到分离后的环境音频数据与人声音频数据。
本方案中,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,具体为:
基于每个分析周期的人声音频数据进行人声音频质量评估,得到音频质量信息;
基于每个分析周期的人声音频数据进行用户通话行为分析,得到通话时长与通话时间段信息;
基于所述通话时长、通话时间段信息、音频质量信息,生成用户行为特征数据。
本方案中,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,还包括:
获取每个分析周期的环境音频数据;
基于所述环境音频数据进行基于频率、振幅、音频波形的特征提取,得到环境音频特征数据;
基于所述环境音频特征数据进行周期性的变化分析,变化分析维度包括频率、振幅、波形的特征变化,得到周期性变化特征信息。
本方案中,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,之前包括:
构建基于LSTM的预测模型;
从系统数据库中获取预设数据量的用户历史环境音频数据;
将所述用户历史环境音频数据进行数据清洗、去重、标准化预处理;
将所述用户历史环境音频数据按照预设比例与时间顺序划分训练集和测试集;
将所述训练集和测试集导入所述预测模型进行模型训练,直至模型的预测准确率达到预设值。
本方案中,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,具体为:
根据当前时间段,分析出当前在一个预设时间段内的所属分析周期,并标记为当前分析周期;
获取当前分析周期与前N个分析周期的对应环境音频数据,并将所述的对应环境音频数据标记为实时环境音频数据;
基于时间维度,将所述实时环境音频数据进行音频特征提取与特征数据序列化,得到环境音频序列化数据;
将所述环境音频序列化数据导入预测模型,进行下一个分析周期的音频数据预测,得到序列化格式的音频预测数据;
将所述音频预测数据进行数据分段,并判断是否符合周期性变化特征信息,将符合周期性变化特征信息的预测数据进行提取,得到结果预测音频数据。
本方案中,所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案,具体为:
获取预设实时音频压缩算法信息;
将所述结果预测音频数据作为测试压缩数据,根据预设实时音频压缩算法信息进行多种压缩算法的测试,得到多个测试音频数据;
基于所述多个测试音频数据进行音频质量评估,得到音频质量评价结果,并将质量最优的测试数据所对应的音频压缩算法作为下一分析周期的传输压缩算法;
基于反相技术将预测音频数据进行降噪分析,得到降噪特征数据;
基于降噪特征数据与用户行为特征数据动态生成下一分析周期的音频降噪方案;
基于所述传输压缩算法与音频降噪方案进行方案整合,形成音频传输方案;
基于音频传输方案,对预设用户终端进行音频数据的实时分发与传输。
本发明第二方面还提供了一种基于音频分发的音频传输质量评价系统,该系统包括:存储器、处理器,所述存储器中包括基于音频分发的音频传输质量评价程序,所述基于音频分发的音频传输质量评价程序被所述处理器执行时实现如下步骤:
在一个预设时间段内,基于预设用户终端,获取用户音频数据;
将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;
基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;
基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;
基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于音频分发的音频传输质量评价程序,所述基于音频分发的音频传输质量评价程序被处理器执行时,实现如上述任一项所述的基于音频分发的音频传输质量评价方法的步骤。
本发明公开了一种基于音频分发的音频传输质量评价方法及系统,通过将用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。通过本发明,能够基于用户行为特征,在音频数据的处理中,实现动态调整音频处理方案的目的,从而提高音频数据的传输效率与降噪处理的质量,实现音频数据的科学评价分析,提高用户体验。
附图说明
图1示出了本发明一种基于音频分发的音频传输质量评价方法的流程图;
图2示出了本发明用户音频数据获取流程图;
图3示出了本发明环境音频数据获取流程图;
图4示出了本发明一种基于音频分发的音频传输质量评价系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于音频分发的音频传输质量评价方法的流程图。
如图1所示,本发明第一方面提供了一种基于音频分发的音频传输质量评价方法,包括:
S102,在一个预设时间段内,基于预设用户终端,获取用户音频数据;
S104,将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;
S106,基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;
S108,基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;
S110,基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。
需要说明的是,所述LSTM即长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列数据。
图2示出了本发明用户音频数据获取流程图。
根据本发明实施例,所述在一个预设时间段内,基于预设用户终端,获取用户音频数据,具体为:
S202,基于一个预设时间段,划分为多个分析周期;
S204,在一个预设时间段内,获取第一音频数据;
S206,基于所述多个分析周期,将用户音频数据进行数据划分,形成多个用户音频数据。
需要说明的是,所述预设用户终端包括用户音频使用终端与数据处理终端,且数据处理终端与用户音频使用终端可通过优先或无线方式进行连接,所述用户音频使用终端一般为耳机,所述数据处理终端一般为移动终端或计算机终端。所述第一音频数据为在一个预设时间段得到的总音频数据,包括用户使用音频设备的通话音频、环境音频、用户媒体音频数据等。
图3示出了本发明环境音频数据获取流程图。
根据本发明实施例,所述将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据,具体为:
S302,从系统数据库中获取用户历史人声音频数据;
S304,基于所述用户历史人声音频数据进行基于频率、振幅、音频波形的特征提取,得到音频对比特征数据;
S306,分析所有用户音频数据并进行人声与环境声分离,结合音频对比特征数据进行特征相似性分析,并得到分离后的环境音频数据与人声音频数据。
需要说明的是,每个分析周期均有对应环境音频数据与人声音频数据。后续通过周期性分析用户的行为特征。
根据本发明实施例,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,具体为:
基于每个分析周期的人声音频数据进行人声音频质量评估,得到音频质量信息;
基于每个分析周期的人声音频数据进行用户通话行为分析,得到通话时长与通话时间段信息;
基于所述通话时长、通话时间段信息、音频质量信息,生成用户行为特征数据。
需要说明的是,所述人声音频数据即每个周期的分析得到的人声音频数据,即代表了用户在使用音频设备时的通话数据,通过人声音频数据,基于时间维度能够分析出用户的通话时间、时长、与音频通话质量等信息。另外,所述用户行为特征数据包括不同使用周期下的音频质量信息,通过音频质量信息,在后续进行行为特征分析与方案分析时,能够针对不同的使用周期进行在方案中进行针对性音频数据调控,例如降噪调控,从而提高用户体验。
根据本发明实施例,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,还包括:
获取每个分析周期的环境音频数据;
基于所述环境音频数据进行基于频率、振幅、音频波形的特征提取,得到环境音频特征数据;
基于所述环境音频特征数据进行周期性的变化分析,变化分析维度包括频率、振幅、波形的特征变化,得到周期性变化特征信息。
需要说明的是,本发明实施例中,所述一个预设时间段可以为一天,或一周,具体为用户的一个使用周期决定。例如,在一周内,用户使用音频设备的频率为周六日全天与周一到周五的某个固定时间段,则预设时间段可以设置为一周,分析周期可以为一天。通过周期性分析音频数据,能够从数据角度获知其环境音频的变化特征与涉及人声音频时的使用行为特征。在一个固定用户的使用音频设备过程中,由于手使用习惯与人为特定,一般其使用环境会呈现一定的规律变化,进一步能够反映在其音频特征的变化上。如,某一用户固定于某一时间段进行户外运动,其音频设备采集的户外音频环境特征将呈一定的周期性变化。
根据本发明实施例,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,之前包括:
构建基于LSTM的预测模型;
从系统数据库中获取预设数据量的用户历史环境音频数据;
将所述用户历史环境音频数据进行数据清洗、去重、标准化预处理;
将所述用户历史环境音频数据按照预设比例与时间顺序划分训练集和测试集;
将所述训练集和测试集导入所述预测模型进行模型训练,直至模型的预测准确率达到预设值。
根据本发明实施例,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,具体为:
根据当前时间段,分析出当前在一个预设时间段内的所属分析周期,并标记为当前分析周期;
获取当前分析周期与前N个分析周期的对应环境音频数据,并将所述的对应环境音频数据标记为实时环境音频数据;
基于时间维度,将所述实时环境音频数据进行音频特征提取与特征数据序列化,得到环境音频序列化数据;
将所述环境音频序列化数据导入预测模型,进行下一个分析周期的音频数据预测,得到序列化格式的音频预测数据;
将所述音频预测数据进行数据分段,并判断是否符合周期性变化特征信息,将符合周期性变化特征信息的预测数据进行提取,得到结果预测音频数据。
需要说明的是,所述得到的音频预测数据中,为一个较大预设数据量的预测数据,通过后续的周期性变化特征信息进行较佳预测数据的筛选。
根据本发明实施例,所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案,具体为:
获取预设实时音频压缩算法信息;
将所述结果预测音频数据作为测试压缩数据,根据预设实时音频压缩算法信息进行多种压缩算法的测试,得到多个测试音频数据;
基于所述多个测试音频数据进行音频质量评估,得到音频质量评价结果,并将质量最优的测试数据所对应的音频压缩算法作为下一分析周期的传输压缩算法;
基于反相技术将预测音频数据进行降噪分析,得到降噪特征数据;
基于降噪特征数据与用户行为特征数据动态生成下一分析周期的音频降噪方案;
基于所述传输压缩算法与音频降噪方案进行方案整合,形成音频传输方案;
基于音频传输方案,对预设用户终端进行音频数据的实时分发与传输。
需要说明的是,所述音频传输方案实时压缩算法的选择方案与周期性降噪方案。所述预设实时音频压缩算法信息包括多种压缩算法,如MP3、AAC、OGG等,不同压缩算法在实时音频传输的数据传输效果存在差异。在本发明中,通过对用户特征分析与周期性环境音频分析与音频数据与预测,并基于预测数据进行传输测试,并最终形成较佳的压缩算法的选择与降噪方案,能够实现动态更正用户传输方案,使用户在不同的使用周期下保持最佳体验,并提升音频传输系统的稳定性与传输效率。所述音频质量评价结果为通过分析音频质量、音频压缩后数据大小与音频传输延迟得到的,为一种综合评价数据,通过该数据能够综合评价一种预设算法对当前结果预测音频数据的数据传输效果。
根据本发明实施例,还包括:
设定一个预设时间段内包括N个分析周期;
获取N个分析周期对应的用户行为特征数据;
基于所述用户行为特征数据进行设备音频需求分析,得到周期性人声音频传输需求信息;
基于所述周期性人声音频传输需求信息,结合用户行为特征数据、传输压缩算法,生成人声音频增强方案。
需要说明的是,所述人声增强需求信息包括人声增强需求时间段与增强算法选择。在本发明中,通过周期性用户行为特征数据,能够得到用户在使用音频设备时,有人声音频处理需求的时间,并基于该时间段,进一步分析出对于人声音频进行音频增强的需求方案(即人声音频增强方案),该方案包括预设的增强时间段,对人声增强后数据传输的压缩算法选择等信息。所述人声音频增强方案适用于下一分析周期的人声音频处理过程。
N为预定值。
图4示出了本发明一种基于音频分发的音频传输质量评价系统的框图。
本发明第二方面还提供了一种基于音频分发的音频传输质量评价系统4,该系统包括:存储器41、处理器42,所述存储器中包括基于音频分发的音频传输质量评价程序,所述基于音频分发的音频传输质量评价程序被所述处理器执行时实现如下步骤:
在一个预设时间段内,基于预设用户终端,获取用户音频数据;
将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;
基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;
基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;
基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。
根据本发明实施例,所述在一个预设时间段内,基于预设用户终端,获取用户音频数据,具体为:
基于一个预设时间段,划分为多个分析周期;
在一个预设时间段内,获取第一音频数据;
基于所述多个分析周期,将用户音频数据进行数据划分,形成多个用户音频数据。
需要说明的是,所述预设用户终端包括用户音频使用终端与数据处理终端,且数据处理终端与用户音频使用终端可通过优先或无线方式进行连接,所述用户音频使用终端一般为耳机,所述数据处理终端一般为移动终端或计算机终端。所述第一音频数据为在一个预设时间段得到的总音频数据,包括用户使用音频设备的通话音频、环境音频、用户媒体音频数据等。
根据本发明实施例,所述将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据,具体为:
从系统数据库中获取用户历史人声音频数据;
基于所述用户历史人声音频数据进行基于频率、振幅、音频波形的特征提取,得到音频对比特征数据;
分析所有用户音频数据并进行人声与环境声分离,结合音频对比特征数据进行特征相似性分析,并得到分离后的环境音频数据与人声音频数据。
需要说明的是,每个分析周期均有对应环境音频数据与人声音频数据。后续通过周期性分析用户的行为特征。
根据本发明实施例,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,具体为:
基于每个分析周期的人声音频数据进行人声音频质量评估,得到音频质量信息;
基于每个分析周期的人声音频数据进行用户通话行为分析,得到通话时长与通话时间段信息;
基于所述通话时长、通话时间段信息、音频质量信息,生成用户行为特征数据。
需要说明的是,所述人声音频数据即每个周期的分析得到的人声音频数据,即代表了用户在使用音频设备时的通话数据,通过人声音频数据,基于时间维度能够分析出用户的通话时间、时长、与音频通话质量等信息。另外,所述用户行为特征数据包括不同使用周期下的音频质量信息,通过音频质量信息,在后续进行行为特征分析与方案分析时,能够针对不同的使用周期进行在方案中进行针对性音频数据调控,例如降噪调控,从而提高用户体验。
根据本发明实施例,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,还包括:
获取每个分析周期的环境音频数据;
基于所述环境音频数据进行基于频率、振幅、音频波形的特征提取,得到环境音频特征数据;
基于所述环境音频特征数据进行周期性的变化分析,变化分析维度包括频率、振幅、波形的特征变化,得到周期性变化特征信息。
需要说明的是,本发明实施例中,所述一个预设时间段可以为一天,或一周,具体为用户的一个使用周期决定。例如,在一周内,用户使用音频设备的频率为周六日全天与周一到周五的某个固定时间段,则预设时间段可以设置为一周,分析周期可以为一天。通过周期性分析音频数据,能够从数据角度获知其环境音频的变化特征与涉及人声音频时的使用行为特征。在一个固定用户的使用音频设备过程中,由于手使用习惯与人为特定,一般其使用环境会呈现一定的规律变化,进一步能够反映在其音频特征的变化上。如,某一用户固定于某一时间段进行户外运动,其音频设备采集的户外音频环境特征将呈一定的周期性变化。
根据本发明实施例,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,之前包括:
构建基于LSTM的预测模型;
从系统数据库中获取预设数据量的用户历史环境音频数据;
将所述用户历史环境音频数据进行数据清洗、去重、标准化预处理;
将所述用户历史环境音频数据按照预设比例与时间顺序划分训练集和测试集;
将所述训练集和测试集导入所述预测模型进行模型训练,直至模型的预测准确率达到预设值。
根据本发明实施例,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,具体为:
根据当前时间段,分析出当前在一个预设时间段内的所属分析周期,并标记为当前分析周期;
获取当前分析周期与前N个分析周期的对应环境音频数据,并将所述的对应环境音频数据标记为实时环境音频数据;
基于时间维度,将所述实时环境音频数据进行音频特征提取与特征数据序列化,得到环境音频序列化数据;
将所述环境音频序列化数据导入预测模型,进行下一个分析周期的音频数据预测,得到序列化格式的音频预测数据;
将所述音频预测数据进行数据分段,并判断是否符合周期性变化特征信息,将符合周期性变化特征信息的预测数据进行提取,得到结果预测音频数据。
需要说明的是,所述得到的音频预测数据中,为一个较大预设数据量的预测数据,通过后续的周期性变化特征信息进行较佳预测数据的筛选。
根据本发明实施例,所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案,具体为:
获取预设实时音频压缩算法信息;
将所述结果预测音频数据作为测试压缩数据,根据预设实时音频压缩算法信息进行多种压缩算法的测试,得到多个测试音频数据;
基于所述多个测试音频数据进行音频质量评估,得到音频质量评价结果,并将质量最优的测试数据所对应的音频压缩算法作为下一分析周期的传输压缩算法;
基于反相技术将预测音频数据进行降噪分析,得到降噪特征数据;
基于降噪特征数据与用户行为特征数据动态生成下一分析周期的音频降噪方案;
基于所述传输压缩算法与音频降噪方案进行方案整合,形成音频传输方案;
基于音频传输方案,对预设用户终端进行音频数据的实时分发与传输。
需要说明的是,所述音频传输方案实时压缩算法的选择方案与周期性降噪方案。所述预设实时音频压缩算法信息包括多种压缩算法,如MP3、AAC、OGG等,不同压缩算法在实时音频传输的数据传输效果存在差异。在本发明中,通过对用户特征分析与周期性环境音频分析与音频数据与预测,并基于预测数据进行传输测试,并最终形成较佳的压缩算法的选择与降噪方案,能够实现动态更正用户传输方案,使用户在不同的使用周期下保持最佳体验,并提升音频传输系统的稳定性与传输效率。
根据本发明实施例,还包括:
设定一个预设时间段内包括N个分析周期;
获取N个分析周期对应的用户行为特征数据;
基于所述用户行为特征数据进行设备音频需求分析,得到周期性人声音频传输需求信息;
基于所述周期性人声音频传输需求信息,结合用户行为特征数据、传输压缩算法,生成人声音频增强方案。
需要说明的是,所述人声增强需求信息包括人声增强需求时间段与增强算法选择。在本发明中,通过周期性用户行为特征数据,能够得到用户在使用音频设备时,有人声音频处理需求的时间,并基于该时间段,进一步分析出对于人声音频进行音频增强的需求方案(即人声音频增强方案),该方案包括预设的增强时间段,对人声增强后数据传输的压缩算法选择等信息。所述人声音频增强方案适用于下一分析周期的人声音频处理过程。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于音频分发的音频传输质量评价程序,所述基于音频分发的音频传输质量评价程序被处理器执行时,实现如上述任一项所述的基于音频分发的音频传输质量评价方法的步骤。
本发明公开了一种基于音频分发的音频传输质量评价方法及系统,通过将用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案。通过本发明,能够基于用户行为特征,在音频数据的处理中,实现动态调整音频处理方案的目的,从而提高音频数据的传输效率与降噪处理的质量,实现音频数据的科学评价分析,提高用户体验。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (6)
1.一种基于音频分发的音频传输质量评价方法,其特征在于,包括:
在一个预设时间段内,基于预设用户终端,获取用户音频数据;
将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;
基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;
基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;
基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案;
其中,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,具体为:
基于每个分析周期的人声音频数据进行人声音频质量评估,得到音频质量信息;
基于每个分析周期的人声音频数据进行用户通话行为分析,得到通话时长与通话时间段信息;
基于所述通话时长、通话时间段信息、音频质量信息,生成用户行为特征数据;
其中,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,还包括:
获取每个分析周期的环境音频数据;
基于所述环境音频数据进行基于频率、振幅、音频波形的特征提取,得到环境音频特征数据;
基于所述环境音频特征数据进行周期性的变化分析,变化分析维度包括频率、振幅、波形的特征变化,得到周期性变化特征信息;
其中,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,具体为:
根据当前时间段,分析出当前在一个预设时间段内的所属分析周期,并标记为当前分析周期;
获取当前分析周期与前N个分析周期的对应环境音频数据,并将所述的对应环境音频数据标记为实时环境音频数据;
基于时间维度,将所述实时环境音频数据进行音频特征提取与特征数据序列化,得到环境音频序列化数据;
将所述环境音频序列化数据导入预测模型,进行下一个分析周期的音频数据预测,得到序列化格式的音频预测数据;
将所述音频预测数据进行数据分段,并判断是否符合周期性变化特征信息,将符合周期性变化特征信息的预测数据进行提取,得到结果预测音频数据;
其中,所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案,具体为:
获取预设实时音频压缩算法信息;
将所述结果预测音频数据作为测试压缩数据,根据预设实时音频压缩算法信息进行多种压缩算法的测试,得到多个测试音频数据;
基于所述多个测试音频数据进行音频质量评估,得到音频质量评价结果,并将质量最优的测试数据所对应的音频压缩算法作为下一分析周期的传输压缩算法;
基于反相技术将预测音频数据进行降噪分析,得到降噪特征数据;
基于降噪特征数据与用户行为特征数据动态生成下一分析周期的音频降噪方案;
基于所述传输压缩算法与音频降噪方案进行方案整合,形成音频传输方案;
基于音频传输方案,对预设用户终端进行音频数据的实时分发与传输。
2.根据权利要求1所述的一种基于音频分发的音频传输质量评价方法,其特征在于,所述在一个预设时间段内,基于预设用户终端,获取用户音频数据,具体为:
基于一个预设时间段,划分为多个分析周期;
在一个预设时间段内,获取第一音频数据;
基于所述多个分析周期,将用户音频数据进行数据划分,形成多个用户音频数据。
3.根据权利要求1所述的一种基于音频分发的音频传输质量评价方法,其特征在于,所述将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据,具体为:
从系统数据库中获取用户历史人声音频数据;
基于所述用户历史人声音频数据进行基于频率、振幅、音频波形的特征提取,得到音频对比特征数据;
分析所有用户音频数据并进行人声与环境声分离,结合音频对比特征数据进行特征相似性分析,并得到分离后的环境音频数据与人声音频数据。
4.根据权利要求3所述的一种基于音频分发的音频传输质量评价方法,其特征在于,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,之前包括:
构建基于LSTM的预测模型;
从系统数据库中获取预设数据量的用户历史环境音频数据;
将所述用户历史环境音频数据进行数据清洗、去重、标准化预处理;
将所述用户历史环境音频数据按照预设比例与时间顺序划分训练集和测试集;
将所述训练集和测试集导入所述预测模型进行模型训练,直至模型的预测准确率达到预设值。
5.一种基于音频分发的音频传输质量评价系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括基于音频分发的音频传输质量评价程序,所述基于音频分发的音频传输质量评价程序被所述处理器执行时实现如下步骤:
在一个预设时间段内,基于预设用户终端,获取用户音频数据;
将所述用户音频数据进行环境声音频分析与人声音频分析,得到环境音频数据与人声音频数据;
基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据;
基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,结果预测音频数据;
基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案;
其中,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,具体为:
基于每个分析周期的人声音频数据进行人声音频质量评估,得到音频质量信息;
基于每个分析周期的人声音频数据进行用户通话行为分析,得到通话时长与通话时间段信息;
基于所述通话时长、通话时间段信息、音频质量信息,生成用户行为特征数据;
其中,所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析,得到行为特征数据,还包括:
获取每个分析周期的环境音频数据;
基于所述环境音频数据进行基于频率、振幅、音频波形的特征提取,得到环境音频特征数据;
基于所述环境音频特征数据进行周期性的变化分析,变化分析维度包括频率、振幅、波形的特征变化,得到周期性变化特征信息;
其中,所述基于时间维度,获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测,生成结果预测音频数据,具体为:
根据当前时间段,分析出当前在一个预设时间段内的所属分析周期,并标记为当前分析周期;
获取当前分析周期与前N个分析周期的对应环境音频数据,并将所述的对应环境音频数据标记为实时环境音频数据;
基于时间维度,将所述实时环境音频数据进行音频特征提取与特征数据序列化,得到环境音频序列化数据;
将所述环境音频序列化数据导入预测模型,进行下一个分析周期的音频数据预测,得到序列化格式的音频预测数据;
将所述音频预测数据进行数据分段,并判断是否符合周期性变化特征信息,将符合周期性变化特征信息的预测数据进行提取,得到结果预测音频数据;
其中,所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析,得到音频传输方案,具体为:
获取预设实时音频压缩算法信息;
将所述结果预测音频数据作为测试压缩数据,根据预设实时音频压缩算法信息进行多种压缩算法的测试,得到多个测试音频数据;
基于所述多个测试音频数据进行音频质量评估,得到音频质量评价结果,并将质量最优的测试数据所对应的音频压缩算法作为下一分析周期的传输压缩算法;
基于反相技术将预测音频数据进行降噪分析,得到降噪特征数据;
基于降噪特征数据与用户行为特征数据动态生成下一分析周期的音频降噪方案;
基于所述传输压缩算法与音频降噪方案进行方案整合,形成音频传输方案;
基于音频传输方案,对预设用户终端进行音频数据的实时分发与传输。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于音频分发的音频传输质量评价程序,所述基于音频分发的音频传输质量评价程序被处理器执行时,实现如权利要求1至4中任一项所述的基于音频分发的音频传输质量评价方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311644880.1A CN117351993B (zh) | 2023-12-04 | 2023-12-04 | 一种基于音频分发的音频传输质量评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311644880.1A CN117351993B (zh) | 2023-12-04 | 2023-12-04 | 一种基于音频分发的音频传输质量评价方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117351993A CN117351993A (zh) | 2024-01-05 |
CN117351993B true CN117351993B (zh) | 2024-02-13 |
Family
ID=89363574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311644880.1A Active CN117351993B (zh) | 2023-12-04 | 2023-12-04 | 一种基于音频分发的音频传输质量评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117351993B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101740036A (zh) * | 2009-12-14 | 2010-06-16 | 深圳华为通信技术有限公司 | 通话音量自动调节方法及装置 |
JP2012255866A (ja) * | 2011-06-08 | 2012-12-27 | Konica Minolta Business Technologies Inc | プレゼンテーションコーチシステム |
CN103177728A (zh) * | 2011-12-21 | 2013-06-26 | 中国移动通信集团广西有限公司 | 语音信号降噪处理方法及装置 |
CN112767908A (zh) * | 2020-12-29 | 2021-05-07 | 安克创新科技股份有限公司 | 基于关键声音识别的主动降噪方法、电子设备及存储介质 |
CN114333881A (zh) * | 2022-03-09 | 2022-04-12 | 深圳市迪斯声学有限公司 | 基于环境自适应的音频传输降噪方法、装置、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10978040B2 (en) * | 2019-03-25 | 2021-04-13 | Sony Network Communications Europe B.V. | Spectrum matching in noise masking systems |
US20200335128A1 (en) * | 2019-04-19 | 2020-10-22 | Magic Leap, Inc. | Identifying input for speech recognition engine |
US11676586B2 (en) * | 2019-12-10 | 2023-06-13 | Rovi Guides, Inc. | Systems and methods for providing voice command recommendations |
-
2023
- 2023-12-04 CN CN202311644880.1A patent/CN117351993B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101740036A (zh) * | 2009-12-14 | 2010-06-16 | 深圳华为通信技术有限公司 | 通话音量自动调节方法及装置 |
JP2012255866A (ja) * | 2011-06-08 | 2012-12-27 | Konica Minolta Business Technologies Inc | プレゼンテーションコーチシステム |
CN103177728A (zh) * | 2011-12-21 | 2013-06-26 | 中国移动通信集团广西有限公司 | 语音信号降噪处理方法及装置 |
CN112767908A (zh) * | 2020-12-29 | 2021-05-07 | 安克创新科技股份有限公司 | 基于关键声音识别的主动降噪方法、电子设备及存储介质 |
CN114333881A (zh) * | 2022-03-09 | 2022-04-12 | 深圳市迪斯声学有限公司 | 基于环境自适应的音频传输降噪方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117351993A (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0840975B1 (en) | Assessment of signal quality | |
CN104517613A (zh) | 语音质量评估方法及装置 | |
CN110782962A (zh) | 听力语言康复装置、方法、电子设备及存储介质 | |
CN113204655B (zh) | 多媒体信息的推荐方法、相关装置及计算机存储介质 | |
CN110647456A (zh) | 一种存储设备的故障预测方法、系统及相关装置 | |
CN112925924A (zh) | 多媒体文件的推荐方法、装置、电子设备及存储介质 | |
CN111861488A (zh) | 机器学习模型对比方法及装置 | |
CN111062439A (zh) | 一种视频清晰度分类方法、装置、设备和存储介质 | |
CN115185760A (zh) | 异常检测方法以及装置 | |
CN116308497A (zh) | 数据处理方法及装置 | |
CN110909005A (zh) | 一种模型特征分析方法、装置、设备及介质 | |
CN117351993B (zh) | 一种基于音频分发的音频传输质量评价方法及系统 | |
CN110390160B (zh) | 一种时序信号的周期检测方法、装置及相关设备 | |
CN116761185A (zh) | 一种基于信令预测日活跃用户的方法、系统及介质 | |
CN116819352A (zh) | 电池阈值的自适应设定方法、装置、设备及存储介质 | |
CN114842382A (zh) | 一种生成视频的语义向量的方法、装置、设备及介质 | |
CN104572791A (zh) | 搜索提示系统的评估方法及装置 | |
CN113420165A (zh) | 二分类模型的训练、多媒体数据的分类方法及装置 | |
CN108536811B (zh) | 基于机器学习的语音交互路径确定方法及装置、存储介质、终端 | |
CN114330866B (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN117357104B (zh) | 一种基于用户特征的音频分析方法 | |
CN117370215B (zh) | 寻优抽样方法、装置、电子设备及存储介质 | |
CN111081264B (zh) | 一种语音信号处理方法、装置、设备及存储介质 | |
CN116452747B (zh) | 一种基于多场景的bim模型渲染方法及系统 | |
CN115273909A (zh) | 语音活性检测方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |