CN110364187A - 一种语音信号的端点识别方法和装置 - Google Patents

一种语音信号的端点识别方法和装置 Download PDF

Info

Publication number
CN110364187A
CN110364187A CN201910594124.XA CN201910594124A CN110364187A CN 110364187 A CN110364187 A CN 110364187A CN 201910594124 A CN201910594124 A CN 201910594124A CN 110364187 A CN110364187 A CN 110364187A
Authority
CN
China
Prior art keywords
frame
signal
value
sub
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910594124.XA
Other languages
English (en)
Other versions
CN110364187B (zh
Inventor
李涛
吴玉峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huahai Jianbing Technology Co Ltd
Original Assignee
Shenzhen Huahai Jianbing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huahai Jianbing Technology Co Ltd filed Critical Shenzhen Huahai Jianbing Technology Co Ltd
Priority to CN201910594124.XA priority Critical patent/CN110364187B/zh
Publication of CN110364187A publication Critical patent/CN110364187A/zh
Application granted granted Critical
Publication of CN110364187B publication Critical patent/CN110364187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音信号的端点识别方法和装置,包括:分帧语音信号,获得子帧信号;处理所述子帧信号,获得邻域极值差分信号;基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;根据分维数和信号能量,计算对应的能维比;基于自适应阈值判断能维比以区别语音帧和非语音帧。装置用于执行方法。本发明实施例通过分帧语音信号,获得子帧信号;处理子帧信号,获得邻域极值差分信号;基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;根据分维数和信号能量,计算对应的能维比;基于自适应阈值判断能维比以区别语音帧和非语音帧,能够为后续的编码提供指示,提高传输效率。

Description

一种语音信号的端点识别方法和装置
技术领域
本发明涉及信号处理技术领域,尤其是一种语音信号的端点识别方法和装置。
背景技术
语音交流是人类之间最常见也是最重要的一种信息交换方式,随着数字通信技术的发展,人和人之间通过数字通信系统而不是面对面进行语音沟通正在成为一种普遍的生活方式。语音信号在数字通信系统的传输过程中,包含了大量被嵌入语音中的停顿,例如,当一个人在说话而另一个人在聆听时,有效话音段时间大约占整个通话期间的50%左右。如果能正确的找出有效语音话音段,使得在对话语音的语音编码系统中可以使用非连续发送(DTX)或者在语音编码中减低噪声和静音段的比特率来增加编码的效率,可以显著提升传输效率。
目前现有技术中,一般抽取语音信号时-频域的特征参数,然后对其进行分类判断以完成语音信号端点检测的任务。语音信号的时域特征参数包括短时平均能量、短时平均幅度和短时平均过零率,而其时-频域特征参数包括倒谱系数、周期率测度和分形维数等;语音信号的端点判断方式由原来的单门限和双门限发展到基于模糊逻辑和模式分类的判断。
发明内容
本发明实施例旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明实施例的一个目的是提供一种语音信号的端点识别方法和装置。
本发明所采用的技术方案是:
第一方面,本发明实施例提供一种语音信号的端点识别方法,包括:分帧语音信号,获得子帧信号;处理所述子帧信号,获得邻域极值差分信号;基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;根据所述分维数和信号能量,计算对应的能维比;基于自适应阈值判断所述能维比以区别语音帧和非语音帧。
优选地,还包括:根据预设帧阈值判断所述非语音帧以重新确定其是否属于语音帧。
优选地,所述获得邻域极值差分信号包括:根据临域尺寸确定待处理信号点的邻域,根据加权值和临域计算临域值;等值扩展所述待处理信号点,得到待处理信号点的基准值;所述临域值与所述基准值的差值的最大值的集合为邻域极值差分信号。
优选地,设置分维数D包括:最小二乘拟合logN(s)和log(1/s)得到分维数其中,S为网格边长,N(s)为子网格数。
优选地,所述基于自适应阈值检测子帧信号包括:
初始阈值为其中,EDR为能维比,N0为采样帧的数量;
后续第i帧的判断阈值其中为过去P帧非语音帧EDRj的均值,σi为标准差,EDRmin为基础阈值;
基于θi+1=λθ×θi+(1-λθ)×θi+1对阈值进行平滑处理,其中,θi表示判断阈值,λ为滤波系数,EDRi表示得分值,当EDRii时,对应的帧为语音帧,否则为非语音帧。
第二方面,本发明实施例提供一种语音信号的端点识别装置,包括:分配模块,用于分帧语音信号,获得子帧信号;邻域处理模块,用于处理所述子帧信号,获得邻域极值差分信号;预处理模块,用于基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;能维比模块,用于根据所述分维数和信号能量,计算对应的能维比;判断模块,用于基于自适应阈值判断所述能维比以区别语音帧和非语音帧。
优选地,还包括:误判防止模块,用于根据预设帧阈值判断所述非语音帧以重新确定其是否属于语音帧。
优选地,所述获得邻域极值差分信号包括:根据临域尺寸确定待处理信号点的邻域,根据加权值和临域计算临域值;等值扩展所述待处理信号点,得到待处理信号点的基准值;所述临域值与所述基准值的差值的最大值的集合为邻域极值差分信号。
优选地,设置分维数D包括:最小二乘拟合logN(s)和log(1/s)得到分维数其中,S为网格边长,N(s)为子网格数。
优选地,所述基于自适应阈值检测子帧信号包括:
初始阈值为其中,EDR为能维比,N0为采样帧的数量;
后续第i帧的判断阈值其中为过去P帧非语音帧EDRj的均值,σi为标准差,EDRmin为基础阈值;
基于θi+1=λθ×θi+(1-λθ)×θi+1对阈值进行平滑处理,其中,θi表示判断阈值,λ为滤波系数,EDRi表示得分值,当EDRii时,对应的帧为语音帧,否则为非语音帧。
本发明实施例的有益效果是:
本发明实施例通过分帧语音信号,获得子帧信号;处理子帧信号,获得邻域极值差分信号;基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;根据分维数和信号能量,计算对应的能维比;基于自适应阈值判断能维比以区别语音帧和非语音帧,能够为后续的编码提供指示,提高传输效率。
附图说明
图1是语音信号的端点识别方法的一种实施例的流程图;
图2是语音信号的端点识别装置的一种实施例的连接图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
分形是混沌信号描述的其中一个方法,语音实质上属于混沌的自然现象,其能对信号的精细度与规则性进行度量,对信噪比相对较低的环境具有适用性,同时分形维数受信号能量强度与信噪比的干扰偏低,其阈值的稳定性较高。在语音中的有话区间能量是向上凸起的,而分形维数相反,在有话区间是向下凹陷。这表明,有话区间能量的数值大,而分形维数值小;在噪声区间能量的数值小,而分形维数数值大,所以把能量值除以分形维数值,则可以更突出有话区间的数值,噪声区间的数值变得更小,拉开了有话区间和噪声区间的数值差距,更容易检测出语音的端点。
实施例1。
本实施例提供如图1所示的语音信号的端点识别方法,包括:
S1、分帧语音信号,获得子帧信号;
S2、处理所述子帧信号,获得邻域极值差分信号;
S3、基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;
S4、根据所述分维数和信号能量,计算对应的能维比;
S5、基于自适应阈值判断所述能维比以区别语音帧和非语音帧。
其中,具体的语音信号的端点识别流程包括:
第一步,执行分帧:
设置分帧的规格,具体可以是帧长20ms,帧移为0.5倍数的帧长。
第二步,邻域差分计算:
含噪语音信号可以表示为fn(x),一般而言其邻近信号之间具有较高的关联度。设fn(x)在信号点n0处(N个信号点范围内,即邻域尺寸)的邻域信号其下标M=(N-1)/2。根据Katz算法可知差分信号能够反映原信号的复杂度,可设置一个邻域差分探测子搜索区间内邻域插值最大量反应信号的变化程度。
设置一个N邻域差分加权模块,集合其中,N邻域范围内的加权信号为A与加权值(简称为权值)的点乘即邻域值。设信号中的任意一(信号)点表示为将其等值扩展为与具有相同尺寸的矢量,即基准值,与该矢量相减得到的差值矢量的最大值即极值差分量,将得到的fn(x)的全部邻域极值差分量的信号用f(x)表示,即邻域极值差分信号。
在本实施例中,取帧长Franlen=160,邻域范围N取81样点,则对应样点的下标M=(N-1)/2=40。对于每帧信号,取第Franlen/4+1样点到3Franlen/4样点范围内,对应的邻域极值差分信号f(x),其长度为Franlen/4。
第三步,设置分维数:
分维的定义有多种,如相似性维数、容量维数、Haudorff维数、信息维数、计盒维数等。本实施例利用计盒维数的定义求取分维数D。
设有集合A,用一个网状栅格将其覆盖,网格边长维S,N(S)为网格中含有集合A任意一部分的网格数,则计盒维数为:
本实施例采用最小二乘拟合logN(s)~log(1/s)直线,求出此直线的斜率即为计盒维数D。具体实现过程为:
移位操作,将最小值点移动到坐标0点,fshift(x)=f(x)-fmin
通过一维线性插值将信号fshift(x)扩展长度为cellmax+1,得到插值后的信号finterp(x),其中cellmax为网格的最大边长,可以取2的偶数次幂次(1,2,4,8...),取大于数据长度的偶数。
按比例缩放信号finterp(x),使其最大值为cellmax,即将原始语音信号归一化到单位正方形区域,得到归一化信号fnormal(x),
将正方形区域划分为边长为S的网格,计算出logN(S),logN(1/S)。
改变S的大小,计算相应的logN(S),logN(1/S)。
令xi=log(1/si),yi=logN(si),i=1,2,...,M,利用(xi,yi)最小二乘拟合直线y=kx+b,k为计盒维数D,其中
第四步,计算邻域极值差分信号的信号能量:
计算邻域极值差分信号f(x)的能量,能量公式:本实施例在此引入改进的能量计算关系:logeng=log10(1+(eng/aparam)),其中,参数aparam=2。由于有aparam的存在,当aparam取较大的数值时,eng幅值有剧烈变化时将在logeng中得到缓和,适当选择aparam可有助于区分噪声和清音。
第五步,计算能维比:
按照上述步骤得到的能量的计算值和分维数就能估计出邻域极值差分信号f(x)的能维比其中参数bparam是一个较小的常数,防止在静音帧(即数据全为0)时D估计不出时出0现-∞的情况,在本实施例中bparam=1。
第六步,自适应阈值判断:
装置采用动态自适应阈值法检测语音段,默认开始的前10帧为静音段,初始阈值为:
后续第i帧的阈值:
其中为过去P帧(本方法取P=25)非语音帧的能维比EDRj的均值,σi为其标准差,EDRmin为预设的基础阈值。
本方法采用θi+1=λθ×θi+(1-λθ)×θi+1对阈值进行平滑。设T0和T1分别表示非语音和语音,λ为滤波系数,θi表示判断阈值,EDRi表示得分值,那么当EDRii时,其对应的帧为语音帧,否则为非语音帧。判断公式为:T0:EDRi≤θi,T1:EDRii
第七步,延迟保护
基于语音相关性的基础,把输入的带噪语音分为三种状态,即语音状态、噪声状态及语音和噪声之间的转换状态,并为语音状态转换为噪声状态以及噪声状态转换为语音状态分别设置了不同的延迟保护长度,其目的在于保持一次语音的连续性,防止出现由于误判帧属于非语音帧,导致信息得不到合理的编码,出现不清晰的情况。
如果当前帧的初步判断结果在保护长度之内,则判定当前帧为转换状态,而初步判断结果作为累计值保存起来;如果当前帧的初步判断结果超出了保护长度的范围,则判定当前帧为新的语音状态或噪声状态。即根据预设帧阈值判断所述非语音帧以重新确定其是否属于语音帧;例如,连续10帧判断属于语音帧,然后出现5帧判断属于非语音帧,而预设帧阈值为1帧,则后续的5帧非语音帧中,第一帧属于保护长度的范围,则重新确定该非语音帧为语音帧。
实施例2。
本实施例提供如图2所示的一种语音信号的端点识别装置,包括:
分配模块1,用于分帧语音信号,获得子帧信号;
邻域处理模块2,用于处理所述子帧信号,获得邻域极值差分信号;
预处理模块3,用于基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;
能维比模块4,用于根据所述分维数和信号能量,计算对应的能维比;
判断模块5,用于基于自适应阈值判断所述能维比以区别语音帧和非语音帧。
误判防止模块,用于根据预设帧阈值判断所述非语音帧以重新确定其是否属于语音帧。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种语音信号的端点识别方法,其特征在于,包括:
分帧语音信号,获得子帧信号;
处理所述子帧信号,获得邻域极值差分信号;
基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;
根据所述分维数和信号能量,计算对应的能维比;
基于自适应阈值判断所述能维比以区别语音帧和非语音帧。
2.根据权利要求1所述的语音信号的端点识别方法,其特征在于,还包括:
根据预设帧阈值判断所述非语音帧以重新确定其是否属于语音帧。
3.根据权利要求1所述的语音信号的端点识别方法,其特征在于,所述获得邻域极值差分信号包括:
根据临域尺寸确定待处理信号点的邻域,根据加权值和临域计算临域值;
等值扩展所述待处理信号点,得到待处理信号点的基准值;
所述临域值与所述基准值的差值的最大值的集合为邻域极值差分信号。
4.根据权利要求1所述的语音信号的端点识别方法,其特征在于,设置分维数D包括:
最小二乘拟合logN(s)和log(1/s)得到分维数其中,S为网格边长,N(s)为子网格数。
5.根据权利要求1所述的语音信号的端点识别方法,其特征在于,所述基于自适应阈值检测子帧信号包括:
初始阈值为其中,EDR为能维比,N0为采样帧的数量;
后续第i帧的判断阈值其中为过去P帧非语音帧EDRj的均值,σi为标准差,EDRmin为基础阈值;
基于θi+1=λθ×θi+(1-λθ)×θi+1对阈值进行平滑处理,其中,θi表示判断阈值,λ为滤波系数,EDRi表示得分值,当EDRii时,对应的帧为语音帧,否则为非语音帧。
6.一种语音信号的端点识别装置,其特征在于,包括:
分配模块,用于分帧语音信号,获得子帧信号;
邻域处理模块,用于处理所述子帧信号,获得邻域极值差分信号;
预处理模块,用于基于计盒维数设置分维数,基于预设的能量公式计算邻域极值差分信号的信号能量;
能维比模块,用于根据所述分维数和信号能量,计算对应的能维比;
判断模块,用于基于自适应阈值判断所述能维比以区别语音帧和非语音帧。
7.根据权利要求6所述的语音信号的端点识别装置,其特征在于,还包括:误判防止模块,用于根据预设帧阈值判断所述非语音帧以重新确定其是否属于语音帧。
8.根据权利要求6所述的语音信号的端点识别装置,其特征在于,所述获得邻域极值差分信号包括:
根据临域尺寸确定待处理信号点的邻域,根据加权值和临域计算临域值;
等值扩展所述待处理信号点,得到待处理信号点的基准值;
所述临域值与所述基准值的差值的最大值的集合为邻域极值差分信号。
9.根据权利要求6所述的语音信号的端点识别装置,其特征在于,设置分维数D包括:
最小二乘拟合logN(s)和log(1/s)得到分维数其中,S为网格边长,N(s)为子网格数。
10.根据权利要求6所述的语音信号的端点识别装置,其特征在于,所述基于自适应阈值检测子帧信号包括:
初始阈值为其中,EDR为能维比,N0为采样帧的数量;
后续第i帧的判断阈值其中为过去P帧非语音帧EDRj的均值,σi为标准差,EDRmin为基础阈值;
基于θi+1=λθ×θi+(1-λθ)×θi+1对阈值进行平滑处理,其中,θi表示判断阈值,λ为滤波系数,EDRi表示得分值,当EDRii时,对应的帧为语音帧,否则为非语音帧。
CN201910594124.XA 2019-07-03 2019-07-03 一种语音信号的端点识别方法和装置 Active CN110364187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910594124.XA CN110364187B (zh) 2019-07-03 2019-07-03 一种语音信号的端点识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910594124.XA CN110364187B (zh) 2019-07-03 2019-07-03 一种语音信号的端点识别方法和装置

Publications (2)

Publication Number Publication Date
CN110364187A true CN110364187A (zh) 2019-10-22
CN110364187B CN110364187B (zh) 2021-09-10

Family

ID=68217921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910594124.XA Active CN110364187B (zh) 2019-07-03 2019-07-03 一种语音信号的端点识别方法和装置

Country Status (1)

Country Link
CN (1) CN110364187B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114495907A (zh) * 2022-01-27 2022-05-13 多益网络有限公司 自适应的语音活动检测方法、装置、设备以及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5845092A (en) * 1992-09-03 1998-12-01 Industrial Technology Research Institute Endpoint detection in a stand-alone real-time voice recognition system
US20040015352A1 (en) * 2002-07-17 2004-01-22 Bhiksha Ramakrishnan Classifier-based non-linear projection for continuous speech segmentation
CN101308653A (zh) * 2008-07-17 2008-11-19 安徽科大讯飞信息科技股份有限公司 一种应用于语音识别系统的端点检测方法
CN104021789A (zh) * 2014-06-25 2014-09-03 厦门大学 一种利用短时时频值的自适应端点检测方法
CN104867493A (zh) * 2015-04-10 2015-08-26 武汉工程大学 基于小波变换的多重分形维数端点检测方法
CN106448659A (zh) * 2016-12-19 2017-02-22 广东工业大学 一种基于短时能量和分形维数的语音端点检测方法
CN106875938A (zh) * 2017-03-10 2017-06-20 南京信息工程大学 一种改进的非线性自适应语音端点检测方法
CN109165545A (zh) * 2018-07-05 2019-01-08 上海电机学院 一种新的基于分形维数的信号特征提取方法
CN109545188A (zh) * 2018-12-07 2019-03-29 深圳市友杰智新科技有限公司 一种实时语音端点检测方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5845092A (en) * 1992-09-03 1998-12-01 Industrial Technology Research Institute Endpoint detection in a stand-alone real-time voice recognition system
US20040015352A1 (en) * 2002-07-17 2004-01-22 Bhiksha Ramakrishnan Classifier-based non-linear projection for continuous speech segmentation
CN101308653A (zh) * 2008-07-17 2008-11-19 安徽科大讯飞信息科技股份有限公司 一种应用于语音识别系统的端点检测方法
CN104021789A (zh) * 2014-06-25 2014-09-03 厦门大学 一种利用短时时频值的自适应端点检测方法
CN104867493A (zh) * 2015-04-10 2015-08-26 武汉工程大学 基于小波变换的多重分形维数端点检测方法
CN106448659A (zh) * 2016-12-19 2017-02-22 广东工业大学 一种基于短时能量和分形维数的语音端点检测方法
CN106875938A (zh) * 2017-03-10 2017-06-20 南京信息工程大学 一种改进的非线性自适应语音端点检测方法
CN109165545A (zh) * 2018-07-05 2019-01-08 上海电机学院 一种新的基于分形维数的信号特征提取方法
CN109545188A (zh) * 2018-12-07 2019-03-29 深圳市友杰智新科技有限公司 一种实时语音端点检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
THEODOROS PATESATODIS ET AL.: "《Convex Combination of Multiple Statistical Models With Application to VAD》", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 *
陈雪勤 等: "《低信噪比环境下语音检测的邻域极值差分信号功率谱分维算法》", 《应用科学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114495907A (zh) * 2022-01-27 2022-05-13 多益网络有限公司 自适应的语音活动检测方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN110364187B (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
US8275609B2 (en) Voice activity detection
KR101437830B1 (ko) 음성 구간 검출 방법 및 장치
CN110047470A (zh) 一种语音端点检测方法
CN112017682B (zh) 一种单通道语音同时降噪和去混响系统
CN106875395A (zh) 基于深度神经网络的超像素级sar图像变化检测方法
CN105513614A (zh) 一种基于噪声功率谱Gamma分布统计模型的有音区检测方法
CN108335294A (zh) 复杂条件下的配电房异常状态图像识别方法
CN110364187A (zh) 一种语音信号的端点识别方法和装置
CN104835127B (zh) 一种自适应平滑滤波方法
CN112420079B (zh) 语音端点检测方法和装置、存储介质及电子设备
CN114239749A (zh) 基于残差收缩及双向长短期记忆网络的调制识别方法
CN117239917B (zh) 变电站数据采集与处理装置及方法
CN116309600A (zh) 基于图像处理的环保纺织品质量检测方法
CN103325123A (zh) 一种基于自适应神经模糊推理系统的图像边缘检测方法
CN104867493B (zh) 基于小波变换的多重分形维数端点检测方法
CN101656070B (zh) 一种语音检测方法
CN117541582A (zh) 一种高频变频器igbt绝缘质量检测方法
CN106023160A (zh) 高炉料面图像边缘检测方法及装置
CN101308651A (zh) 音频暂态信号的检测方法
CN113034387B (zh) 一种图像去噪方法、装置、设备及介质
CN113989516A (zh) 烟雾动态识别方法及相关装置
CN117576632A (zh) 基于多模态ai大模型的电网监控火灾预警系统及方法
CN116993745B (zh) 基于图像处理给水管表面漏损检测方法
CN102148030A (zh) 一种语音识别的端点检测方法
CN110600019B (zh) 基于实时场景下语音信噪比预分级的卷积神经网络计算电路

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant