CN103514170B - 一种语音识别的文本分类方法和装置 - Google Patents

一种语音识别的文本分类方法和装置 Download PDF

Info

Publication number
CN103514170B
CN103514170B CN201210204350.0A CN201210204350A CN103514170B CN 103514170 B CN103514170 B CN 103514170B CN 201210204350 A CN201210204350 A CN 201210204350A CN 103514170 B CN103514170 B CN 103514170B
Authority
CN
China
Prior art keywords
text
word
training
gram
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210204350.0A
Other languages
English (en)
Other versions
CN103514170A (zh
Inventor
万鹏
梁政
刘江
鹿晓亮
李钊辉
刘庆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Anhui Co Ltd
Original Assignee
China Mobile Group Anhui Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Anhui Co Ltd filed Critical China Mobile Group Anhui Co Ltd
Priority to CN201210204350.0A priority Critical patent/CN103514170B/zh
Publication of CN103514170A publication Critical patent/CN103514170A/zh
Application granted granted Critical
Publication of CN103514170B publication Critical patent/CN103514170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明公开了一种语音识别的文本分类方法和装置,其中,该方法包括:根据业务类别的类型,为每个业务类别收集训练文本和与训练文本的内容保持一致的训练语音;对训练语音进行解码,得到训练语音的词混淆网络;根据训练文本和词混淆网络,提取训练文本的文本特征;根据文本特征,训练集内支持向量机分类器;由经过训练的所述支持向量机分类器对文本进行分类。本发明的语音识别的文本分类方法和装置,将词图网络转化为适合于文本分类的词混淆网络,将词混淆网络所包含的混淆词转化为文本特征后,利用支持向量机算法,进行基于混淆词的文本分类,得到更准确的分类结果,提高了语音识别文本分类的正确率。

Description

一种语音识别的文本分类方法和装置
技术领域
本发明涉及通信领域中语音识别技术领域,具体地,涉及一种语音识别的文本分类方法和装置。
背景技术
文本分类是指给定分类目标下,根据文本内容自动确定文本类别的过程。借助于文本分类技术,对文本进行分类,可以让机器理解人类语言,从而实现智能语音交互。文本分类技术已经在互联网搜索、语音识别等人机交互领域得到了相当广泛的应用。
在自助语音识别服务系统中,利用文本分类技术对语音识别的文本结果进行分类,并根据最终类别的不同,自助语音服务系统向最终用户提供不同的自助语音服务,实现轻松自然的自助语音交互。如将自然语言“请帮我查询一下我的手机有无欠费”理解为语义“余额查询”,提供“余额查询”的自助服务。
目前主流的文本分类使用统计学习的方法:首先通过提取文本中的特征,将文本转化为带权重分量的特征矢量,并利用机器学习的方法,构建文本分类模型。
目前主要的文本分类学习算法包含Rocchio算法、朴素贝叶斯分类算法、决策树算法、神经网络算法及支持向量机算法(SVM,Support Vector Machine)等等,并在相应的算法上进行一些改进及融合,使文本分类的准确率持续不断的提高。
在申请号为99808930.3的中国专利文件中公开了一种根据文本信息对象训练集生成分类器之参数以便确认文本信息对象所属种类的方法。在申请号为200810012887.0的中国专利文件公开了一种利用最小二乘方法来拟合用支持向量机方法所得到的分类超平面,从而得到最优的超平面的方法,实现较佳的文本分类效果。
在自助语音服务系统中,文本分类需要与语音识别系统一起使用。传统的文本分类应用中,使用语音识别系统产生的第一优选(One Best)结果作为文本分类器的输入,文本分类器根据分类模型计算输入文本Wi对每个目标分类类别Tj的得分贡献,并选取得分最高的类别作为该输入文本对应的分类结果,如图1-2所示。在图2中,用第一优先结果进行文本分类,最终最优分类类别GRPS的得分为0+0+0+0.3+0.8=1.1。
这种方法在语音识别准确率较高的语音识别系统中,有优良的性能;但在语音识别引擎识别准确率较低的语音识别系统中,很可能输出包含较多错误的文本识别结果,这会直接导致文本分类的正确率的急剧下降。例如语音识别引擎因口音问题将识别出某段语音为:“我要用手机伤亡”,则SVM文本分类器得分如图3所示。因为错误识别结果“伤亡”对“GRPS”的贡献得分为0,造成“话费查询”与“GPRS”的最终得分均为0.3,造成分类错误。
发明内容
本发明是为了克服现有技术中语音识别的文本分类错误率高的缺陷,根据本发明的一个方面,提出一种语音识别的文本分类方法。
根据本发明实施例的语音识别的文本分类方法,包括:根据业务类别的类型,为每个业务类别收集训练文本和与训练文本的内容保持一致的训练语音;对训练语音进行解码,得到训练语音的词混淆网络;根据训练文本和词混淆网络,提取训练文本的文本特征;根据文本特征,训练集内支持向量机分类器;由经过训练的所述支持向量机分类器对文本进行分类。
本发明的语音识别的文本分类方法,在收集训练文本和训练语音后,在收集业务类别的训练文本和训练语音后,得到训练语音的词混淆网络,提取训练文本的文本特征,根据文本特征训练集内支持向量机分类器,由经过训练的所述支持向量机分类器对文本进行分类;本发明的语音识别的文本分类方法,通过语音识别所特有的词图网络,由于其对正确语音识别结果具有更高的覆盖度,将词图网络转化为适合于文本分类的词混淆网络,将词混淆网络所包含的混淆词转化为文本特征后,利用支持向量机算法,进行基于混淆词的文本分类,得到更准确的分类结果,提高了语音识别文本分类的正确率。
本发明是为了克服现有技术中语音识别的文本分类错误率高的缺陷,根据本发明的另一个方面,提出一种语音识别的文本分类装置。
根据本发明实施例的语音识别的文本分类装置,包括:文本收集模块,用于根据业务类别的类型,为每个业务类别收集训练文本和与所述训练文本的内容保持一致的训练语音;语音解码模块,用于对训练语音进行解码,得到训练语音的词混淆网络;特征提取模块,用于根据训练文本和词混淆网络,提取训练文本的文本特征;分类器训练模块,用于根据文本特征,训练集内支持向量机分类器;文本分类模块,用于由经过训练的支持向量机分类器对文本进行分类。
本发明的语音识别的文本分类装置,在收集训练文本和训练语音后,在收集业务类别的训练文本和训练语音后,得到训练语音的词混淆网络,提取训练文本的文本特征,根据文本特征训练集内支持向量机分类器,由经过训练的所述支持向量机分类器对文本进行分类;本发明的语音识别的文本分类装置,通过语音识别所特有的词图网络,由于其对正确语音识别结果具有更高的覆盖度,将词图网络转化为适合于文本分类的词混淆网络,将词混淆网络所包含的混淆词转化为文本特征后,利用支持向量机算法,进行基于混淆词的文本分类,得到更准确的分类结果,提高了语音识别文本分类的正确率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为现有技术中传统的文本分类方法的流程示意图;
图2为现有技术中利用第一优先结果进行文本分类的示意图;
图3为现有技术中利用第一优先结果进行文本分类过程中因识别错误导致分类错误的示意图;
图4为本发明语音识别系统的词混淆网络的结构示意图;
图5为本发明使用词混淆网络进行文本分类的示意图;
图6为本发明语音识别的文本分类方法实施例一的流程图;
图7为本发明语音识别的文本分类方法实施例二中训练文本的结构示意图;
图8为本发明语音识别的文本分类方法实施例二中使用语音识别引擎对收集的训练语音进行解码的结构示意图;
图9为本发明语音识别的文本分类方法实施例二中混淆网络的结构示意图;
图10为本发明语音识别的文本分类方法实施例二中文本特征的结构示意图;
图11为本发明语音识别的文本分类方法实施例二中混淆网络的结构示意图;
图12为本发明语音识别的文本分类装置的结构示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
本发明语音识别系统产生的词混淆网络(Word Confusion Network,WCN)作为文本分类器的输入,词混淆网络不仅包含了语音识别系统的第一优选结果,而且还包含了其它最可能的若干个识别结果,即混淆词,如图4所示。其中,文本分类器是支持向量机分类器(Support Vector Machine,SVM)中的一种,SVM分类器是分类器的统称。
文本分类器以词混淆网络作为输入,当一个词被语音识别系统识别为第一优选结果,则其所有的混淆词获得相应加分,并将整个词混淆网络输入到文本分类器,而不是只把第一优选结果作为输入,降低了文本分类器对语音识别系统识别结果的依赖性,从而增强了系统的容错性,在相同语音识别系统的基础上可获得更优的分类结果,如图5所示。
语音识别系统输出:“我要用手机伤亡”,则“伤亡”的混淆词“上网”同样获得相应的加分;如图5所示,“GPRS”获得的总得分为0+0+0+0.3+0.8+0=1.1,仍然为最优分类结果。因此,通过使用词混淆网络进行分类,可以显著减小分类系统对语音识别系统的过度依赖,提高了文本分类的准确率。所以,基于词混淆网络的文本分类法较传统分类方法更具优越性。
方法实施例
根据本发明实施例,提供了一种语音识别的文本分类方法,图6为本发明语音识别的文本分类方法实施例一的流程图。如图6所示,本实施例包括:
步骤102:根据预先设计的业务类别的类型,每个业务类别收集一定数量的训练文本;
步骤104:再收集与上述业务类别对应的训练语音,训练语音的内容与步骤102中的训练文本的内容要保持一致,使用语音识别引擎对收集的训练语音进行解码,得到该训练语音的词混淆网络。其中,词混淆网络中除了包含生成文本外,还包含有该生成文本中词语对应的声学置信度。
步骤106:根据训练文本和词混淆网络提取训练文本的文本特征,文本特征使用字的Four-gram,即(Wi-2|Wi-1|Wi|Wi+1),其中,Wi为当前字,Wi-2和Wi-1为当前字的前续,Wi+1为当前字的后续。对于训练文本而言,如果某个N-gram出现,与该N-gram对应的文本特征的权重即为1,否则,该文本特征的权重为0;对于训练语音的词混淆网络而言,如果某个N-gram出现,与该N-gram对应的文本特征的权重为该N-gram中所有字的声学置信度的积,否则,该文本特征的权重为0。
步骤108:根据步骤106中得到的文本特征训练集内支持向量机分类器(SupportVector Machine,SVM);
SVM训练技术,该技术为国际通用模式识别训练技术,详见SVM原理。
步骤110:通过经过步骤108训练的支持向量机分类器(即SVM)对文本进行分类。
根据本发明实施例,提供了另一种语音识别的文本分类方法。该实施例以具体业务为例,对本发明的文本分类方法进行进一步说明;其中,假定业务类别为:话费查询和手机上网,对于用户的语音命令输入进行文本识别。本实施例包括:
步骤202:根据预先设计的业务类别的类型,每个业务类别收集一定数量的训练文本,如图7所示;
步骤204:再收集与上述业务类别对应的训练语音,训练语音的内容与步骤202中的训练文本的内容要保持一致,使用语音识别引擎对收集的训练语音进行解码,如图8所示,得到该训练语音的词混淆网络,如图9所示;在图8中,()表示多候选,[]表示文本丢失{}表示增加。
其中,词混淆网络中除了包含生成文本外,还包含有该生成文本中词语对应的声学置信度。
步骤206:根据训练文本和词混淆网络提取训练文本的文本特征,文本特征使用字的Four-gram,即(Wi-2|Wi-1|Wi|Wi+1),其中,Wi为当前字,Wi-2和Wi-1为当前字的前续,Wi+1为当前字的后续。对于现有的训练文本而言,如果某个N-gram出现,与该N-gram对应的文本特征的权重即为1,否则,该文本特征的权重为0,如图10所示;对于本发明的训练语音的词混淆网络而言,如果某个N-gram出现,与该N-gram对应的文本特征的权重为该N-gram中所有字的声学置信度的积,否则,该文本特征的权重为0,如图11所示。在图11中,第1行中的“我”的声学置信度取词混淆网络中上下两路中的较大值,故取0.7。
步骤208:根据步骤206中得到的文本特征训练SVM分类器。SVM分类器采用的是SVM训练技术,该技术为国际通用的模式识别训练技术,主要是将文本特性表示为高维特征矢量,矢量参数通过已有的文本特征进行计算,最终获得SVM分类器。其中,SVM训练技术包括如下内容:
一、SVM特征提取
(1)训练使用文本:使用训练语料中的“字”及其N-gram,即使用训练字典中所有“字”及其N-gram组成一个高维的特征矢量,对于某条训练语料,如果某个“字”出现,该维特征即为“1”,反之为“0”。
(2)训练使用WCN:提取SVM特征时设置声学CM(Confidence Measure,置信度)门限,首先将CM较小的词裁剪掉;其次同样取WCN中的“字”及其N-gram,当某个N-gram出现时其权重的计算与其声学CM有关,如果这个N-gram包含一个以上的“字”,使用这几个“字”声学CM的几何平均,声学置信度的计算公如下:
二、SVM训练
SVM是一个常用的解决分类问题的方法,通常将输入向量映射到高维空间,在高维空间中形成线性分类器以解决分类问题,但是在诸如呼叫导航等大规模文本分类任务中,其输入向量维数巨大,一般采用线性核可以取得较好的分类效果。求解线性核的方法一般分为两大类,即求解原始问题与对偶问题,我们采用的SVM的训练方法为求解C-线性支持向量分类机的对偶问题,即求解下面的问题:
0≤αi≤C,i=1,...,l
这里假设训练集为:
T={(x1,y1),...,(xl,yl)}∈(Rn×Y)l
其求解方法使用著名的序列最小最优化算法(即SMO),该算法是分解算法的特殊情形,它选取的工作集B中只包含2个元素,即每次迭代过程中只调整相应于两个练点(xi,yi)和(xj,yj)的αi和αj,这时需要求解的最优化子问题只有两个变量(这里略去该算法的详细求解步骤),与通常的分解算法比较,尽管需要更多的迭代次数,但由于每次迭代的计算量很少,该算法表现出整体的快速收敛性质。
另一个问题是SVM分类器为两类分类器,而我们的任务为多类分类任务,这里采用成对分类(one versus one)构造多个分类器,即对于M类问题,需要构造(M-1)*M/2个两类分类器。例如针对余额和上网二个业务,首先需要收集几千条余额业务的不同说法,再收集上网业务的几千条说法,针对每条说法按照上述的方式提取文本特征,然后形成可以区分余额和上网业务的模型。
步骤210:通过步骤208训练的支持向量机分类器(即SVM分类器)对文本进行分类。
通过以上分类器进行文本分类,输入一段文本后,系统首先提取出输入文本的特征,然后与之前训练的SVM分类器进行比较计算,概率最大的即为该文本对应的分类。加入混淆网络的优点在于,如果语音识别的解码出现错误,比如用户说:“我想查话费”,系统识别成“我想查花费”,如果“花费”没有加入到训练集中,会导致无法识别,采用将混淆词网络加入训练的方法则可以有效的解决这个问题,提升分类正确率。SVM分类计算方法具体为:
(1)特征提取:与训练时特征提取过程类似;
(2)分类过程:使用“投票法”进行判决,将待测样本x分别利用N(N-1)/2个SVM的决策函数进行判决,当第i类与第j类之间SVM的判决函数fij(x)≥0,则给i类记一票,反之给j类记一票,当所有的决策函数都给出判决后,得票最多的那个类就是x所属的类。
如果用户说了一句:“我要查余额”,此时首先提取出特征,然后计算分类得分,最终可以计算出分类属于余额而不属于上网业务。
本发明的语音识别的文本分类方法,在收集训练文本和训练语音后,在收集业务类别的训练文本和训练语音后,得到训练语音的词混淆网络,提取训练文本的文本特征,根据文本特征训练集内支持向量机分类器,由经过训练的所述支持向量机分类器对文本进行分类;本发明的语音识别的文本分类方法,通过语音识别所特有的词图网络,由于其对正确语音识别结果具有更高的覆盖度,将词图网络转化为适合于文本分类的词混淆网络,将词混淆网络所包含的混淆词转化为文本特征后,利用支持向量机算法,进行基于混淆词的文本分类,得到更准确的分类结果,提高了语音识别文本分类的正确率。
装置实施例
根据本发明实施例,提供了一种语音识别的文本分类装置,如图12所示,本实施例包括:
文本收集模块11,用于根据业务类别的类型,为每个业务类别收集训练文本和与训练文本的内容保持一致的训练语音;
语音解码模块12,用于对训练语音进行解码,得到训练语音的词混淆网络;
特征提取模块13,用于根据训练文本和词混淆网络,提取训练文本的文本特征;
分类器训练模块14,用于根据文本特征,训练集内支持向量机分类器;
文本分类模块15,用于由经过训练的支持向量机分类器对文本进行分类。
其中,词混淆网络包括生成文本和与所述生成文本中的词语对应的声学置信度。
其中,文本特征使用字的Four-gram表示,其中,Wi为当前字,Wi-2和Wi-1为所述字的前续,Wi+1为所述字的后续。
其中,在训练语音的词混淆网络中,如果文本特征对应的N-gram出现,文本特征的权重为所述N-gram中所有字的声学置信度的积,否则,文本特征的权重为0。
本发明的语音识别的文本分类装置,在收集训练文本和训练语音后,在收集业务类别的训练文本和训练语音后,得到训练语音的词混淆网络,提取训练文本的文本特征,根据文本特征训练集内支持向量机分类器,由经过训练的所述支持向量机分类器对文本进行分类;本发明的语音识别的文本分类装置,通过语音识别所特有的词图网络,由于其对正确语音识别结果具有更高的覆盖度,将词图网络转化为适合于文本分类的词混淆网络,将词混淆网络所包含的混淆词转化为文本特征后,利用支持向量机算法,进行基于混淆词的文本分类,得到更准确的分类结果,提高了语音识别文本分类的正确率。
本发明能有多种不同形式的具体实施方式,上面以图4-图12为例结合附图对本发明的技术方案作举例说明,这并不意味着本发明所应用的具体实例只能局限在特定的流程或实施例结构中,本领域的普通技术人员应当了解,上文所提供的具体实施方案只是多种优选用法中的一些示例,任何体现本发明权利要求的实施方式均应在本发明技术方案所要求保护的范围之内。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种语音识别的文本分类方法,其特征在于,包括:
根据业务类别的类型,为每个业务类别收集训练文本和与所述训练文本的内容保持一致的训练语音;
对所述训练语音进行解码,得到所述训练语音的词混淆网络;
根据所述训练文本和词混淆网络,提取训练文本的文本特征;
根据所述文本特征,训练集内支持向量机分类器;
由经过训练的所述支持向量机分类器对文本进行分类;
所述词混淆网络包括生成文本和与所述生成文本中的词语对应的声学置信度;
所述文本特征使用字的Four-gram表示,其中,Wi为当前字,Wi-2和Wi-1为所述字的前续,Wi+1为所述字的后续;
对于训练文本,如果所述文本特征对应的N-gram出现,与该N-gram对应的文本特征的权重即为1,否则,该文本特征的权重为0;在所述训练语音的词混淆网络中,如果所述文本特征对应的N-gram出现,所述文本特征的权重为所述N-gram中所有字的声学置信度的积,否则,所述文本特征的权重为0;
根据所述文本特征,训练集内支持向量机分类器包括:提取支持向量机分类器特征时,设置声学置信度门限,取词混淆网络中的所述字及所述字的N-gram,当N-gram出现时,如果所述N-gram包含一个以上的所述字,使用所述字的声学置信度的几何平均;所述声学置信度的计算公式如下:
G ( w 1 , ... , w n ) = Π i = 1 n C o n f ( w i ) .
2.一种语音识别的文本分类装置,其特征在于,包括:
文本收集模块,用于根据业务类别的类型,为每个业务类别收集训练文本和与所述训练文本的内容保持一致的训练语音;
语音解码模块,用于对所述训练语音进行解码,得到所述训练语音的词混淆网络;
特征提取模块,用于根据所述训练文本和词混淆网络,提取训练文本的文本特征;
分类器训练模块,用于根据所述文本特征,训练集内支持向量机分类器;
文本分类模块,用于由经过训练的所述支持向量机分类器对文本进行分类;
所述词混淆网络包括生成文本和与所述生成文本中的词语对应的声学置信度;
所述文本特征使用字的Four-gram表示,其中,Wi为当前字,Wi-2和Wi-1为所述字的前续,Wi+1为所述字的后续;
对于训练文本,如果某个N-gram出现,与该N-gram对应的文本特征的权重即为1,否则,该文本特征的权重为0;
在所述训练语音的词混淆网络中,如果所述文本特征对应的N-gram出现,所述文本特征的权重为所述N-gram中所有字的声学置信度的积,否则,所述文本特征的权重为0;
根据所述文本特征,训练集内支持向量机分类器包括:提取支持向量机分类器特征时,设置声学置信度门限,取词混淆网络中的所述字及所述字的N-gram,当N-gram出现时,如果所述N-gram包含一个以上的所述字,使用所述字的声学置信度的几何平均;所述声学置信度的计算公式如下:
G ( w 1 , ... , w n ) = Π i = 1 n C o n f ( w i ) .
CN201210204350.0A 2012-06-20 2012-06-20 一种语音识别的文本分类方法和装置 Active CN103514170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210204350.0A CN103514170B (zh) 2012-06-20 2012-06-20 一种语音识别的文本分类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210204350.0A CN103514170B (zh) 2012-06-20 2012-06-20 一种语音识别的文本分类方法和装置

Publications (2)

Publication Number Publication Date
CN103514170A CN103514170A (zh) 2014-01-15
CN103514170B true CN103514170B (zh) 2017-03-29

Family

ID=49896910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210204350.0A Active CN103514170B (zh) 2012-06-20 2012-06-20 一种语音识别的文本分类方法和装置

Country Status (1)

Country Link
CN (1) CN103514170B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104142974B (zh) 2014-01-20 2016-02-24 腾讯科技(深圳)有限公司 一种语音文件查询方法和装置
WO2015192210A1 (en) * 2014-06-17 2015-12-23 Maluuba Inc. Method and system for classifying queries
CN105810199A (zh) * 2014-12-30 2016-07-27 中国科学院深圳先进技术研究院 一种说话人的身份确认方法和装置
US9384188B1 (en) * 2015-01-27 2016-07-05 Microsoft Technology Licensing, Llc Transcription correction using multi-token structures
CN105243143B (zh) * 2015-10-14 2018-07-24 湖南大学 基于即时语音内容检测的推荐方法及系统
CN107665704B (zh) * 2016-07-29 2020-09-11 科大讯飞股份有限公司 语音指令检测模型构建方法、检测方法及系统、人机交互方法及设备
CN109635254A (zh) * 2018-12-03 2019-04-16 重庆大学 基于朴素贝叶斯、决策树和svm混合模型的论文查重方法
CN110223675B (zh) * 2019-06-13 2022-04-19 思必驰科技股份有限公司 用于语音识别的训练文本数据的筛选方法及系统
CN111222331B (zh) * 2019-12-31 2021-03-26 北京捷通华声科技股份有限公司 辅助解码方法、装置、电子设备及可读存储介质
CN112037792B (zh) * 2020-08-20 2022-06-17 北京字节跳动网络技术有限公司 一种语音识别方法、装置、电子设备及存储介质
CN112133308A (zh) * 2020-09-17 2020-12-25 中国建设银行股份有限公司 一种用于语音识别文本多标签分类的方法和装置
CN112836042A (zh) * 2020-10-13 2021-05-25 讯飞智元信息科技有限公司 有害音频识别方法、装置、电子设备及计算机可读介质
CN112837677A (zh) * 2020-10-13 2021-05-25 讯飞智元信息科技有限公司 一种有害音频检测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1402408A1 (en) * 2001-07-04 2004-03-31 Cogisum Intermedia AG Category based, extensible and interactive system for document retrieval
CN101350017A (zh) * 2008-08-20 2009-01-21 盛秀英 基于最小二乘支持向量机的文本分类方法
CN101510222B (zh) * 2009-02-20 2012-05-30 北京大学 一种多层索引语音文档检索方法

Also Published As

Publication number Publication date
CN103514170A (zh) 2014-01-15

Similar Documents

Publication Publication Date Title
CN103514170B (zh) 一种语音识别的文本分类方法和装置
CN108984530B (zh) 一种网络敏感内容的检测方法及检测系统
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN110110062B (zh) 机器智能问答方法、装置与电子设备
CN111859978B (zh) 一种基于深度学习的情感文本生成方法
CN107944559B (zh) 一种实体关系自动识别方法及系统
WO2022134833A1 (zh) 语音信号的处理方法、装置、设备及存储介质
CN110188047B (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN108319666A (zh) 一种基于多模态舆情分析的供电服务评估方法
CN107908715A (zh) 基于Adaboost和分类器加权融合的微博情感极性判别方法
CN108763510A (zh) 意图识别方法、装置、设备及存储介质
CN112269868B (zh) 一种基于多任务联合训练的机器阅读理解模型的使用方法
CN112818861A (zh) 一种基于多模态上下文语义特征的情感分类方法及系统
CN113887643B (zh) 一种基于伪标签自训练和源域再训练的新对话意图识别方法
CN110992988B (zh) 一种基于领域对抗的语音情感识别方法及装置
CN109933792A (zh) 基于多层双向lstm和验证模型的观点型问题阅读理解方法
CN112417132B (zh) 一种利用谓宾信息筛选负样本的新意图识别方法
CN110225210A (zh) 基于通话摘要自动填写工单方法及系统
CN111966827A (zh) 基于异构二部图的对话情感分析方法
CN111597333B (zh) 一种面向区块链领域的事件与事件要素抽取方法及装置
CN112988970A (zh) 一种服务于智能问答系统的文本匹配算法
CN113672718A (zh) 基于特征匹配和领域自适应的对话意图识别方法及系统
CN111091809A (zh) 一种深度特征融合的地域性口音识别方法及装置
Agarla et al. Semi-supervised cross-lingual speech emotion recognition
Chan et al. Applying and optimizing NLP model with CARU

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant