CN111666750A - 语音识别结果修正方法、系统、终端以及储存介质 - Google Patents

语音识别结果修正方法、系统、终端以及储存介质 Download PDF

Info

Publication number
CN111666750A
CN111666750A CN202010525326.1A CN202010525326A CN111666750A CN 111666750 A CN111666750 A CN 111666750A CN 202010525326 A CN202010525326 A CN 202010525326A CN 111666750 A CN111666750 A CN 111666750A
Authority
CN
China
Prior art keywords
corpus
document
dictionary
documents
data input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010525326.1A
Other languages
English (en)
Inventor
周康明
吴昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eye Control Technology Co Ltd
Original Assignee
Shanghai Eye Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eye Control Technology Co Ltd filed Critical Shanghai Eye Control Technology Co Ltd
Priority to CN202010525326.1A priority Critical patent/CN111666750A/zh
Publication of CN111666750A publication Critical patent/CN111666750A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供一种语音识别结果修正方法、系统、电子终端以及储存介质,包括:构建语料库;从语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;根据语料文档,生成对应的数据输入方式和语料库字典文档;根据数据输入方式和语料库字典文档来训练一ELMo模型,以用于对语料库字典文档进行向量化处理后得到向量文档;根据向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。解决了现有技术中没有好的语音识别结果的修正,导致语音识别结果误差较大以及准确率不高的问题,本申请借助ELMO模型模型进行修正,并对语料库中的每个字符进行向量化操作,使修正结果更精确,并同时兼顾了网络的性能。

Description

语音识别结果修正方法、系统、终端以及储存介质
技术领域
本申请涉及一种语音识别技术领域,特别是涉及一种语音识别结果修正方法、系统、终端以及储存介质。
背景技术
语音识别结果在受到外界的背景音、发音人的发声以及语音转义系统自身的精度等影响会造成偏差,会影响工程中的产品性能,特别是在专业的应用领域,例如:气象会商。
目前,我们在进行语音后处理时,除了传统的逻辑处理外,还会借助语言模型进行修正,利用语言模型对语料库中的每个字符进行embedding操作,一个准确的embedding表达会直接影响语音识别结果的修正。但是对于不同领域的任务,语言模型的输入和结构也会有所不同,现有技术中没有一个好的embedding模型进行语料库的向量表达可以做好语音识别结果的修正,导致语音识别结果误差较大,识别准确率不高。
申请内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种语音识别结果修正方法、系统、终端以及储存介质,用于解决现有技术中对于不同领域的任务,语言模型的输入和结构也会有所不同,没有一个好的embedding模型进行语料库的向量表达可以做好语音识别结果的修正,导致语音识别结果误差较大,识别准确率不高的问题。
为实现上述目的及其他相关目的,本申请提供一种语音识别结果修正方法,包括:构建语料库;从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;根据所述语料文档,生成对应的数据输入方式和语料库字典文档;根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档;根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
于本申请的一实施例中,从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档的方式包括:获取所述语料库;将所述语料库中的空白文档以及无关联词语作为不符合相关度要求的语料删除;将删除后的语料库中的一或多个语料集合成对应的语料文档。
于本申请的一实施例中,根据所述语料文档,生成对应的数据输入方式和语料库字典文档的方式包括:将所述语料文档进行分词并按行储存;将经过分词后的语料文档拆解为多行字符,并储存至预处理文档;构建语料库字典文档,并将所述预处理文档中语料库字典文档中不存在的字符储存至所述语料库字典文档;将所述语料文档中的中文语料转为无声调拼音,并设于所述中文语料后储存至数据输入方式文档以及所述语料库字典文档。
于本申请的一实施例中,根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档的方式包括:输入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与所述语料库字典文档;对所述语料库字典文档中的字符进行编码并进行高速神经网络层的筛选;将筛选后的所述语料库字典文档通过双向长短时结构提取当前序列的上下文信息以得到ELMo模型;利用所述ELMo模型对所述语料库字典文档进行向量化表示,并储存至向量文档。
于本申请的一实施例中,根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:将所述ELMo模型的最后一层的条件随机场函数层修改为分类函数层,生成命名实体识别模型;载入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与包括所述语料库字典向量文档向量化的向量文档;利用所述向量文档对所述数据输入方式文档进行向量化;利用所向量化的所述数据输入方式文档对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
于本申请的一实施例中,利用所向量化的所述第二预处理文档对所述命名实体识别模型进行训练还包括:得到语料的标签概率分布,采用分类函数进行分类,以输出概率阈值内的标签值。
于本申请的一实施例中,所述语料库包括:气象语料库。
为实现上述目的及其他相关目的,本申请提供一种语音识别结果修正系统,包括:语料库构建模块,用于构建语料库;语料筛选模块,用于从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;数据输入方式和语料库字典文档生成模块,用于根据所述语料文档,生成对应的数据输入方式和语料库字典文档;向量文档模块,用于根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档;语音结果修正模块,用于根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
为实现上述目的及其他相关目的,本申请提供一种语音识别结果修正终端,包括:存储器,用于存储计算机程序;处理器,用于运行所述计算机程序,以执行所述的语音识别结果修正方法。
为实现上述目的及其他相关目的,本申请提供一种计算机存储介质,存储有计算机程序,所述计算机程序运行时实现所述的语音识别结果修正方法。
如上所述,本申请的语音识别结果修正方法、系统、终端以及储存介质,具有以下有益效果:本申请借助ELMO模型模型进行修正,利用ELMO模型模型对语料库中的每个字符进行embedding操作,经过ELMO模型的训练数据输入和vocab的生成,并对ELMo网络结构的改进,不仅使修正结果更精确,还可以更好的挖掘语料库的语义信息,同时兼顾了网络的性能。
附图说明
图1显示为本申请一实施例中的语音识别结果修正方法的流程示意图。
图2显示为本申请一实施例中的语音识别结果修正系统的结构示意图。
图3显示为本申请一实施例中的电子语音识别结果修正终端的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、““下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
其中提到的第一、第二及第三等术语是为了说明多样的部分、成份、区域、层及/或段而使用的,但并非限定于此。这些术语只用于把某部分、成份、区域、层或段区别于其它部分、成份、区域、层或段。因此,以下叙述的第一部分、成份、区域、层或段在不超出本申请范围的范围内,可以言及到第二部分、成份、区域、层或段。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
语音识别结果在受到外界的背景音、发音人的发声以及语音转义系统自身的精度等影响会造成偏差,会影响工程中的产品性能。
因此,本申请一种语音识别结果修正方法,解决了现有技术中对于不同领域的任务,语言模型的输入和结构也会有所不同,没有一个好的embedding模型进行语料库的向量表达可以做好语音识别结果的修正,导致语音识别结果误差较大,识别准确率不高的问题,本申请借助ELMO模型模型进行修正,利用ELMO模型模型对语料库中的每个字符进行embedding操作,经过ELMO模型的训练数据输入和vocab的生成,并对ELMo网络结构的改进,不仅使修正结果更精确,还可以更好的挖掘语料库的语义信息,同时兼顾了网络的性能。
所述方法包括:
构建语料库;
从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;
根据所述语料文档,生成对应的数据输入方式和语料库字典文档;
根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档;
根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
下面以附图1为参考,针对本申请得实施例进行详细说明,以便本申请所述技术领域的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限于此处说明的实施例。
如图1所示,展示一实施例中语音识别结果修正方法的流程示意图,即经过以下步骤;
步骤S11:构建语料库。
可选的,搜集语料,并构建语料库。
可选的,利用网络爬虫以及人工听语音转义的方式搜集语料,并构建语料库。
可选的,所述语料库为气象语料库。
可选的,利用网络爬虫以及人工听气象会商语音进行转义的方式搜集大量的气象语料,并构建气象语料库。
步骤S12:从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档。
可选的,对所述语料库中不符合相关度要求的语料删除,以筛选出符合相关度要求的一或多个语料,将符合相关度要求的一或多个语料集合成相对应的语料文档。
可选的,从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档的方式包括:获取所述语料库;将所述语料库中的空白文档以及无关联词语作为不符合相关度要求的语料删除;将删除后的语料库中的一或多个语料集合成对应的语料文档。
可选的,从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档的方式包括:
加载所述语料库,其中每篇报道为一个文档;
将所述语料库中空白的文档以及将语料报道中的无关联词语替换为空白,以清洗掉相关度较低、且有规律的语料,提高语料的相关度;
将删除后的语料库中的语料报道中的一或多个语料集合成与所述语料报道对应的语料文档。
可选的,无关联词语包括:“本报讯”、“图片来源”以及“据报道”等无关联词语。
可选的,从所述气象语料库中筛选出符合相关度要求的一或多个气象语料,以形成对应的气象语料文档的方式包括:
加载所述气象语料库,其中每篇气象报道为一个文档;
将所述气象语料库中空白的文档以及将气象语料报道中的无关联词语替换为空白,以清洗掉相关度较低、且有规律的语料,提高语料与气象的相关度;
将删除后的气象语料库中的气象语料报道中的一或多个气象语料集合成与所述气象语料报道对应的气象语料文档。
可选的,从所述气象语料库中筛选出符合相关度要求的一或多个气象语料,以形成对应的气象语料文档的方式包括:
加载获取气象语料库txt,每篇气象报道为一个txt;
将所述气象语料库中空白的txt删除,并将气象语料报道中的空格、“本报讯”、“图片来源”等字眼替换为空白,清洗掉相关度较低、且有规律的语料,提高语料与气象的相关度;
遍历处理后的文件夹下的所有txt中的报道,写入到一个空白的txt中,记为1.txt,每篇报道与报道之间以单个空行间隔。
S13:根据所述语料文档,生成对应的数据输入方式和语料库字典文档;
可选的,根据所述语料文档,生成对应的训练ELMo模型数据的输入方式和语料库字典文档。
可选的,根据所述语料文档,生成对应的数据输入方式和语料库字典文档的方式包括:
将所述语料文档进行分词并按行储存;
将经过分词后的语料文档拆解为多行字符,并储存至预处理文档;
构建语料库字典文档,并将所述预处理文档中语料库字典文档中不存在的字符储存至所述语料库字典文档;
将所述语料文档中的中文语料转为无声调拼音,并设于所述中文语料后储存至数据输入方式文档以及所述语料库字典文档。
可选的,根据所述语料文档,生成对应的数据输入方式和语料库字典文档的方式包括:
将所述语料文档中的内容进行分词,并将所述分词后的内容按行储存,优选的,每行中只有一个中文分词或者阿拉伯数字;
将经过分词后的语料文档中的每行字符拆解为多行,其中每一行包括一个字符,储存至预处理文档;
构建语料库字典文档,根据搜索所述预处理文档中每一行字符,找出在所述语料库字典文档中不存在的字符放入所述语料库字典文档;
将所述语料文档中的中文语料分别转为无声调拼音,置于所述中文语料后面,并将其存储至数据输入方式文档以及所述语料库字典文档;需要注意的是,在所述语料库字典文档中存在的重复无声调拼音只保留一个。
可选的,根据所述气象语料文档,生成对应的数据输入方式和气象语料库字典文档的方式包括:
将所述气象语料文档中的内容进行分词,并将所述分词后的内容按行储存,优选的,每行中只有一个中文分词或者阿拉伯数字;
将经过分词后的气象语料文档中的每行字符拆解为多行,其中每一行包括一个字符,储存至预处理文档;如果是数字,则转为中文大写数字后再按行分开。
构建气象语料库字典文档,根据搜索所述预处理文档中每一行字符,找出在所述气象语料库字典文档中不存在的字符放入所述气象语料库字典文档;
将所述气象语料文档中的中文语料分别转为无声调拼音,置于所述中文语料后面,并将其存储至数据输入方式文档以及所述气象语料库字典文档;需要注意的是,在所述气象语料库字典文档中存在的重复无声调拼音只保留一个。
可选的,根据所述气象语料文档,生成对应的数据输入方式和气象语料库字典文档的方式包括:
遍历1.txt中的内容,先进行分词,将分词按行存储,即每行中只有一个中文分词或者阿拉伯数字;
遍历经过分词后的1.txt中每一行字符,如果为中文字符或标点符号且数量大于1,则拆解为多行,每一行为一个字符,如果是数字,则转为中文大写数字后再按行分开,存储到2.txt中;
新建一个txt,记为vocab,遍历2.txt中的每一行字符Ci,若在vocab中不存在就将Ci放入vocab,反之则舍弃。
将1.txt中的中文气象语料转为无声调拼音,然后粘帖在中文气象语料后面,存到3.txt中,即3.txt中的前半部分是中文,后半部分是无声调拼音。同样地,对于vocab文档也作同样的操作,不同的是vocab文档中存在的重复无声调拼音只保留一个。
S14:根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档。
可选的,利用ELMo网络结构构建一ELMo模型,根据所述数据输入方式以及语料库字典训练所述ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档。
可选的,根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档的方式包括:
输入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与所述语料库字典文档;
对所述语料库字典文档中的字符进行编码并进行高速神经网络层的筛选;
将筛选后的所述语料库字典文档通过双向长短时结构提取当前序列的上下文信息以得到ELMo模型;
利用所述ELMo模型对所述语料库字典文档进行向量化表示,并储存至向量文档。
可选的,根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档的方式包括:
输入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与所述语料库字典文档至由ELMo网络构建的ELMo模型;
对所述语料库字典文档中的字符进行编码,采用所述ELMo模型中的高速神经网络层(highway layers)允许一部分信息直接通过,一部分信息进行处理后可以再传输到下一层,这样就可以减少有用信息的损失,highway具体表达式如下:
Figure BDA0002533532040000081
其中,x表示输入,y表示输出,H(H表示的是网络的一层)表示从输入x映射到输出y,T表示经过H层转化后的结果流入输入y的比例。
对经过高速神经网络层的语料库字典文档通过双向长短时结构层(Bilstm层)时,提取当前序列的上下文信息,得到所述双向长短时结构层(Bilstm层)各个层的表征之后,经过一个混合层,并将之前的层的表示进行线性融合,得到ELMo模型;
利用所述ELMo模型对所述语料库字典文档进行向量化表示,并设置每个字符的向量化维度,并将向量化的语料字典文档储存至向量文档。
可选的,根据所述数据输入方式和气象语料库字典文档来训练一ELMo模型,以用于对所述气象语料库字典文档进行向量化处理后得到气象向量文档的方式包括:
输入储存由所述气象语料文档中的中文气象语料转为无声调拼音以及所述中文气象语料的数据输入方式文档与所述气象语料库字典文档至由ELMo网络构建的ELMo模型;
对所述气象语料库字典文档中的字符进行编码,采用所述ELMo模型中的高速神经网络层(highway layers)允许一部分信息直接通过,一部分信息进行处理后可以再传输到下一层,这样就可以减少有用信息的损失,highway具体表达式如下:
Figure BDA0002533532040000082
其中,x表示输入,y表示输出,H(H表示的是网络的一层)表示从输入x映射到输出y,T表示经过H层转化后的结果流入输入y的比例。
对经过高速神经网络层的气象语料库字典文档通过双向长短时结构层(Bilstm层)时,提取当前序列的上下文信息,得到所述双向长短时结构层(Bilstm层)各个层的表征之后,经过一个混合层,并将之前的层的表示进行线性融合,得到ELMo模型;
利用所述ELMo模型对所述气象语料库字典文档进行向量化表示,并设置每个字符的向量化维度,并将向量化的气象语料字典文档储存至气象向量文档。
可选的,根据所述数据输入方式和气象语料库字典文档来训练一ELMo模型,以用于对所述气象语料库字典文档进行向量化处理后得到气象向量文档的方式包括:
加载中的储存由所述气象语料文档中的中文气象语料转为无声调拼音以及所述中文气象语料的3.txt文档和vocab送入ELMo网络中;
对气象语料库字典中的字符进行编码,采用2个highway layers,在信息通过该网络层时,允许一部分信息直接通过,一部分信息进行处理后再传输到下一层,这样就可以减少有用信息的损失,highway具体表达式如下:
Figure BDA0002533532040000091
其中x表示输入,y表示输出,H(H表示的是网络的一层)表示从输入x映射到输出y,T表示经过H层转化后的结果流入输入y的比例;
接着进入Bilstm层,提取当前序列的上下文信息,得到bilstm各个层的表征之后,经过一个混合层,将前面这些层的表示进行线性融合,得到最终的ELMo模型;
利用EMLo模型对vocab进行向量表示,每个字符的embedding维度为200,输出到一个新的txt中,记为4.txt。
S15:根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
可选的,调整所述ELMo模型,将所述向量文档以及所述语料库字典文档送入至所述调整后的所述ELMo模型进行训练,生成用于修正语音识别结果的命名实体识别模型。
可选的,根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
将所述ELMo模型的最后一层的条件随机场函数层修改为分类函数层,生成命名实体识别模型;以加快所述模型的训练速度。
载入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与包括所述语料库字典向量文档向量化的向量文档;
利用所述向量文档对所述数据输入方式文档进行向量化;
利用所向量化的所述数据输入方式文档对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
可选的,根据所述气象向量文档和气象语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
将所述ELMo模型的最后一层的条件随机场函数层修改为分类函数层,生成命名实体识别模型;以加快所述模型的训练速度。
加载储存由所述气象语料文档中的中文气象语料转为无声调拼音以及所述中文气象语料的数据输入方式文档与包括所述气象语料库字典向量文档向量化的向量文档;
利用所述气象向量文档对所述数据输入方式文档进行向量化;
利用所向量化的所述数据输入方式文档对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
可选的,根据所述气象向量文档和气象语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
修改所述ELMo模型最后一层CRF输出为softmax,可以加快网络训练速度;
加载训练所述数据输入方式文档3.txt和所述气象语料库字典vocab的气象向量文档4.txt;
采用所述气象向量文档4.txt中字符的向量表达对数据输入方式文档3.txt进行向量化操作;
利用所向量化的数据输入方式文档3.txt对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
可选的,利用所向量化的所述第二预处理文档对所述命名实体识别模型进行训练还包括:得到语料的标签概率分布,采用分类函数进行分类,以输出概率阈值内的标签值,其中所述概率阈值可以自定义设定。举例来说,输出概率值较高的标签值。
与上述实施例原理相似的是,本申请提供一种语音识别结果修正系统,所述系统包括:
语料库构建模块,用于构建语料库;
语料筛选模块,用于从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;
数据输入方式和语料库字典文档生成模块,用于根据所述语料文档,生成对应的数据输入方式和语料库字典文档;
向量文档模块,用于根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档;
语音结果修正模块,用于根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
以下结合附图提供具体实施例:
如图2所示展示本申请实施例中的一种语音识别结果修正系统的结构示意图。
所述系统包括:
所述语料库构建模块21,用于构建语料库;
所述语料筛选模块22,用于从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;
所述数据输入方式和语料库字典文档生成模块23,用于根据所述语料文档,生成对应的数据输入方式和语料库字典文档;
所述向量文档模块24,用于根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档;
所述语音结果修正模块25,用于根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
可选的,所述语料库构建模块21搜集语料,并构建语料库。
可选的,所述语料库构建模块21利用网络爬虫以及人工听语音转义的方式搜集语料,并构建语料库。
可选的,所述语料库构建模块21所述语料库为气象语料库。
可选的,所述语料库构建模块21利用网络爬虫以及人工听气象会商语音进行转义的方式搜集大量的气象语料,并构建气象语料库。
可选的,所述语料筛选模块22对所述语料库中不符合相关度要求的语料删除,以筛选出符合相关度要求的一或多个语料,将符合相关度要求的一或多个语料集合成相对应的语料文档。
可选的,所述语料筛选模块22从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档的方式包括:获取所述语料库;将所述语料库中的空白文档以及无关联词语作为不符合相关度要求的语料删除;将删除后的语料库中的一或多个语料集合成对应的语料文档。
可选的,所述语料筛选模块22从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档的方式包括:
加载所述语料库,其中每篇报道为一个文档;
将所述语料库中空白的文档以及将语料报道中的无关联词语替换为空白,以清洗掉相关度较低、且有规律的语料,提高语料的相关度;
将删除后的语料库中的语料报道中的一或多个语料集合成与所述语料报道对应的语料文档。
可选的,无关联词语包括:“本报讯”、“图片来源”以及“据报道”等无关联词语。
可选的,所述语料筛选模块22从所述气象语料库中筛选出符合相关度要求的一或多个气象语料,以形成对应的气象语料文档的方式包括:
加载所述气象语料库,其中每篇气象报道为一个文档;
将所述气象语料库中空白的文档以及将气象语料报道中的无关联词语替换为空白,以清洗掉相关度较低、且有规律的语料,提高语料与气象的相关度;
将删除后的气象语料库中的气象语料报道中的一或多个气象语料集合成与所述气象语料报道对应的气象语料文档。
可选的,所述语料筛选模块22从所述气象语料库中筛选出符合相关度要求的一或多个气象语料,以形成对应的气象语料文档的方式包括:
加载获取气象语料库txt,每篇气象报道为一个txt;
将所述气象语料库中空白的txt删除,并将气象语料报道中的空格、“本报讯”、“图片来源”等字眼替换为空白,清洗掉相关度较低、且有规律的语料,提高语料与气象的相关度;
遍历处理后的文件夹下的所有txt中的报道,写入到一个空白的txt中,记为1.txt,每篇报道与报道之间以单个空行间隔。
可选的,所述数据输入方式和语料库字典文档生成模块23根据所述语料文档,生成对应的训练ELMo模型数据的输入方式和语料库字典文档。
可选的,所述数据输入方式和语料库字典文档生成模块23根据所述语料文档,生成对应的数据输入方式和语料库字典文档的方式包括:
将所述语料文档进行分词并按行储存;
将经过分词后的语料文档拆解为多行字符,并储存至预处理文档;
构建语料库字典文档,并将所述预处理文档中语料库字典文档中不存在的字符储存至所述语料库字典文档;
将所述语料文档中的中文语料转为无声调拼音,并设于所述中文语料后储存至数据输入方式文档以及所述语料库字典文档。
可选的,所述数据输入方式和语料库字典文档生成模块23根据所述语料文档,生成对应的数据输入方式和语料库字典文档的方式包括:
将所述语料文档中的内容进行分词,并将所述分词后的内容按行储存,优选的,每行中只有一个中文分词或者阿拉伯数字;
将经过分词后的语料文档中的每行字符拆解为多行,其中每一行包括一个字符,储存至预处理文档;
构建语料库字典文档,根据搜索所述预处理文档中每一行字符,找出在所述语料库字典文档中不存在的字符放入所述语料库字典文档;
将所述语料文档中的中文语料分别转为无声调拼音,置于所述中文语料后面,并将其存储至数据输入方式文档以及所述语料库字典文档;需要注意的是,在所述语料库字典文档中存在的重复无声调拼音只保留一个。
可选的,所述数据输入方式和语料库字典文档生成模块23根据所述气象语料文档,生成对应的数据输入方式和气象语料库字典文档的方式包括:
将所述气象语料文档中的内容进行分词,并将所述分词后的内容按行储存,优选的,每行中只有一个中文分词或者阿拉伯数字;
将经过分词后的气象语料文档中的每行字符拆解为多行,其中每一行包括一个字符,储存至预处理文档;如果是数字,则转为中文大写数字后再按行分开。
构建气象语料库字典文档,根据搜索所述预处理文档中每一行字符,找出在所述气象语料库字典文档中不存在的字符放入所述气象语料库字典文档;
将所述气象语料文档中的中文语料分别转为无声调拼音,置于所述中文语料后面,并将其存储至数据输入方式文档以及所述气象语料库字典文档;需要注意的是,在所述气象语料库字典文档中存在的重复无声调拼音只保留一个。
可选的,所述数据输入方式和语料库字典文档生成模块23根据所述气象语料文档,生成对应的数据输入方式和气象语料库字典文档的方式包括:
遍历1.txt中的内容,先进行分词,将分词按行存储,即每行中只有一个中文分词或者阿拉伯数字;
遍历经过分词后的1.txt中每一行字符,如果为中文字符或标点符号且数量大于1,则拆解为多行,每一行为一个字符,如果是数字,则转为中文大写数字后再按行分开,存储到2.txt中;
新建一个txt,记为vocab,遍历2.txt中的每一行字符Ci,若在vocab中不存在就将Ci放入vocab,反之则舍弃。
将1.txt中的中文气象语料转为无声调拼音,然后粘帖在中文气象语料后面,存到3.txt中,即3.txt中的前半部分是中文,后半部分是无声调拼音。同样地,对于vocab文档也作同样的操作,不同的是vocab文档中存在的重复无声调拼音只保留一个。
可选的,所述向量文档模块24利用ELMo网络结构构建一ELMo模型,根据所述数据输入方式以及语料库字典训练所述ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档。
可选的,所述向量文档模块24根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档的方式包括:
输入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与所述语料库字典文档;
对所述语料库字典文档中的字符进行编码并进行高速神经网络层的筛选;
将筛选后的所述语料库字典文档通过双向长短时结构提取当前序列的上下文信息以得到ELMo模型;
利用所述ELMo模型对所述语料库字典文档进行向量化表示,并储存至向量文档。
可选的,所述向量文档模块24根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档的方式包括:
输入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与所述语料库字典文档至由ELMo网络构建的ELMo模型;
对所述语料库字典文档中的字符进行编码,采用所述ELMo模型中的高速神经网络层(highway layers)允许一部分信息直接通过,一部分信息进行处理后可以再传输到下一层,这样就可以减少有用信息的损失,highway具体表达式如下:
Figure BDA0002533532040000141
其中,x表示输入,y表示输出,H(H表示的是网络的一层)表示从输入x映射到输出y,T表示经过H层转化后的结果流入输入y的比例。
对经过高速神经网络层的语料库字典文档通过双向长短时结构层(Bilstm层)时,提取当前序列的上下文信息,得到所述双向长短时结构层(Bilstm层)各个层的表征之后,经过一个混合层,并将之前的层的表示进行线性融合,得到ELMo模型;
利用所述ELMo模型对所述语料库字典文档进行向量化表示,并设置每个字符的向量化维度,并将向量化的语料字典文档储存至向量文档。
可选的,所述向量文档模块24根据所述数据输入方式和气象语料库字典文档来训练一ELMo模型,以用于对所述气象语料库字典文档进行向量化处理后得到气象向量文档的方式包括:
输入储存由所述气象语料文档中的中文气象语料转为无声调拼音以及所述中文气象语料的数据输入方式文档与所述气象语料库字典文档至由ELMo网络构建的ELMo模型;
对所述气象语料库字典文档中的字符进行编码,采用所述ELMo模型中的高速神经网络层(highway layers)允许一部分信息直接通过,一部分信息进行处理后可以再传输到下一层,这样就可以减少有用信息的损失,highway具体表达式如下:
Figure BDA0002533532040000151
其中,x表示输入,y表示输出,H(H表示的是网络的一层)表示从输入x映射到输出y,T表示经过H层转化后的结果流入输入y的比例。
对经过高速神经网络层的气象语料库字典文档通过双向长短时结构层(Bilstm层)时,提取当前序列的上下文信息,得到所述双向长短时结构层(Bilstm层)各个层的表征之后,经过一个混合层,并将之前的层的表示进行线性融合,得到ELMo模型;
利用所述ELMo模型对所述气象语料库字典文档进行向量化表示,并设置每个字符的向量化维度,并将向量化的气象语料字典文档储存至气象向量文档。
可选的,所述向量文档模块24根据所述数据输入方式和气象语料库字典文档来训练一ELMo模型,以用于对所述气象语料库字典文档进行向量化处理后得到气象向量文档的方式包括:
加载中的储存由所述气象语料文档中的中文气象语料转为无声调拼音以及所述中文气象语料的3.txt文档和vocab送入ELMo网络中;
对气象语料库字典中的字符进行编码,采用2个highway layers,在信息通过该网络层时,允许一部分信息直接通过,一部分信息进行处理后再传输到下一层,这样就可以减少有用信息的损失,highway具体表达式如下:
Figure BDA0002533532040000152
其中x表示输入,y表示输出,H(H表示的是网络的一层)表示从输入x映射到输出y,T表示经过H层转化后的结果流入输入y的比例;
接着进入Bilstm层,提取当前序列的上下文信息,得到bilstm各个层的表征之后,经过一个混合层,将前面这些层的表示进行线性融合,得到最终的ELMo模型;
利用EMLo模型对vocab进行向量表示,每个字符的embedding维度为200,输出到一个新的txt中,记为4.txt。
可选的,所述语音结果修正模块25调整所述ELMo模型,将所述向量文档以及所述语料库字典文档送入至所述调整后的所述ELMo模型进行训练,生成用于修正语音识别结果的命名实体识别模型。
可选的,所述语音结果修正模块25根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
将所述ELMo模型的最后一层的条件随机场函数层修改为分类函数层,生成命名实体识别模型;以加快所述模型的训练速度。
载入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与包括所述语料库字典向量文档向量化的向量文档;
利用所述向量文档对所述数据输入方式文档进行向量化;
利用所向量化的所述数据输入方式文档对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
可选的,所述语音结果修正模块25根据所述气象向量文档和气象语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
将所述ELMo模型的最后一层的条件随机场函数层修改为分类函数层,生成命名实体识别模型;以加快所述模型的训练速度。
加载储存由所述气象语料文档中的中文气象语料转为无声调拼音以及所述中文气象语料的数据输入方式文档与包括所述气象语料库字典向量文档向量化的向量文档;
利用所述气象向量文档对所述数据输入方式文档进行向量化;
利用所向量化的所述数据输入方式文档对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
可选的,所述语音结果修正模块25根据所述气象向量文档和气象语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
修改所述ELMo模型最后一层CRF输出为softmax,可以加快网络训练速度;
加载训练所述数据输入方式文档3.txt和所述气象语料库字典vocab的气象向量文档4.txt;
采用所述气象向量文档4.txt中字符的向量表达对数据输入方式文档3.txt进行向量化操作;
利用所向量化的数据输入方式文档3.txt对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
可选的,所述语音结果修正模块25利用所向量化的所述第二预处理文档对所述命名实体识别模型进行训练还包括:得到语料的标签概率分布,采用分类函数进行分类,以输出概率阈值内的标签值,其中所述概率阈值可以自定义设定。举例来说,输出概率值较高的标签值。
如图3所示,展示本申请实施例中的语音识别结果修正终端30的结构示意图。
所述语音识别结果修正终端30包括:存储器31及处理器32所述存储器31用于存储计算机程序;所述处理器32运行计算机程序实现如图1所述的语音识别结果修正方法。
可选的,所述存储器31的数量均可以是一或多个,所述处理器32的数量均可以是一或多个,而图3中均以一个为例。
可选的,所述语音识别结果修正终端30中的处理器32会按照如图2所述的步骤,将一个或多个以应用程序的进程对应的指令加载到存储器31中,并由处理器32来运行存储在存储器31中的应用程序,从而实现如图1所述语音识别结果修正方法中的各种功能。
可选的,所述存储器31,可能包括但不限于高速随机存取存储器、非易失性存储器。例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备;所述处理器32,可能包括但不限于中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,所述处理器32可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请还提供计算机可读存储介质,存储有计算机程序序,所述计算机程序运行时实现如图1所示的语音识别结果修正方法;所述计算机可读存储介质可包括,但不限于,软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件。
综上所述,本申请语音识别结果修正方法、系统、终端以及储存介质,解决了现有技术中对于不同领域的任务,语言模型的输入和结构也会有所不同,没有一个好的embedding模型进行语料库的向量表达可以做好语音识别结果的修正,导致语音识别结果误差较大,识别准确率不高的问题,本申请借助ELMO模型模型进行修正,利用ELMO模型模型对语料库中的每个字符进行embedding操作,经过ELMO模型的训练数据输入和vocab的生成,并对ELMo网络结构的改进,不仅使修正结果更精确,还可以更好的挖掘语料库的语义信息,同时兼顾了网络的性能。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。

Claims (10)

1.一种语音识别修正方法,其特征在于,包括:
构建语料库;
从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的修正语料文档;
根据所述修正语料文档,生成对应的修正数据输入方式和修正语料库字典文档;
根据所述修正数据输入方式和修正语料库字典文档来训练一ELMo模型,以用于对所述修正语料库字典文档进行向量化处理后得到修正向量文档;
将修正向量文档和修正语料库字典文档送入到所述ELMo模型,以生成语音识别修正模型;
将待识别语音语料文档输入所述语音识别修正模型,得到与所述待识别语音语料文档对应的语音识别修正结果。
2.根据权利要求1所述的语音识别结果修正方法,其特征在于,从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档的方式包括:
获取所述语料库;
将所述语料库中的空白文档以及无关联词语作为不符合相关度要求的语料删除;
将删除后的语料库中的一或多个语料集合成对应的语料文档。
3.根据权利要求1所述的语音识别结果修正方法,其特征在于,根据所述语料文档,生成对应的数据输入方式和语料库字典文档的方式包括:
将所述语料文档进行分词并按行储存;
将经过分词后的语料文档拆解为多行字符,并储存至预处理文档;
构建语料库字典文档,并将所述预处理文档中语料库字典文档中不存在的字符储存至所述语料库字典文档;
将所述语料文档中的中文语料转为无声调拼音,并设于所述中文语料后储存至数据输入方式文档以及所述语料库字典文档。
4.根据权利要求1所述的语音识别结果修正方法,其特征在于,根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档的方式包括:
输入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与所述语料库字典文档;
对所述语料库字典文档中的字符进行编码并进行高速神经网络层的筛选;
将筛选后的所述语料库字典文档通过双向长短时结构提取当前序列的上下文信息以得到ELMo模型;
利用所述ELMo模型对所述语料库字典文档进行向量化表示,并储存至向量文档。
5.根据权利要求1所述的语音识别结果修正方法,其特征在于,根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型的方式包括:
将所述命名实体识别网络的最后一层的条件随机场函数层修改为分类函数层,生成命名实体识别模型;
载入储存由所述语料文档中的中文语料转为无声调拼音以及所述中文语料的数据输入方式文档与包括所述语料库字典向量文档向量化的向量文档;
利用所述向量文档对所述数据输入方式文档进行向量化;
利用所向量化的所述数据输入方式文档对所述命名实体识别模型进行训练得到用于修正语音识别结果的命名实体识别模型。
6.根据权利要求5所述的语音识别结果修正方法,其特征在于,利用所向量化的所述第二预处理文档对所述命名实体识别模型进行训练还包括:得到语料的标签概率分布,采用分类函数进行分类,以输出概率阈值内的标签值。
7.根据权利要求1所述的语音识别结果修正方法,其特征在于,所述语料库包括:气象语料库。
8.一种语音识别结果修正系统,其特征在于,包括:
语料库构建模块,用于构建语料库;
语料筛选模块,用于从所述语料库中筛选出符合相关度要求的一或多个语料,以形成对应的语料文档;
数据输入方式和语料库字典文档生成模块,用于根据所述语料文档,生成对应的数据输入方式和语料库字典文档;
向量文档模块,用于根据所述数据输入方式和语料库字典文档来训练一ELMo模型,以用于对所述语料库字典文档进行向量化处理后得到向量文档;
语音结果修正模块,用于根据所述向量文档和语料库字典文档来调整所述ELMo模型,以生成用于修正语音识别结果的命名实体识别模型。
9.一种语音识别结果修正终端,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于运行所述计算机程序,以执行如权利要求1至7中任一项所述的语音识别结果修正方法。
10.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序运行时实现如权利要求1至7中任一项所述的语音识别结果修正方法。
CN202010525326.1A 2020-06-10 2020-06-10 语音识别结果修正方法、系统、终端以及储存介质 Pending CN111666750A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010525326.1A CN111666750A (zh) 2020-06-10 2020-06-10 语音识别结果修正方法、系统、终端以及储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010525326.1A CN111666750A (zh) 2020-06-10 2020-06-10 语音识别结果修正方法、系统、终端以及储存介质

Publications (1)

Publication Number Publication Date
CN111666750A true CN111666750A (zh) 2020-09-15

Family

ID=72386659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010525326.1A Pending CN111666750A (zh) 2020-06-10 2020-06-10 语音识别结果修正方法、系统、终端以及储存介质

Country Status (1)

Country Link
CN (1) CN111666750A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117351946A (zh) * 2023-10-27 2024-01-05 之江实验室 一种语音识别方法、装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070233487A1 (en) * 2006-04-03 2007-10-04 Cohen Michael H Automatic language model update
CN110473523A (zh) * 2019-08-30 2019-11-19 北京大米科技有限公司 一种语音识别方法、装置、存储介质及终端
CN111222335A (zh) * 2019-11-27 2020-06-02 上海眼控科技股份有限公司 语料修正方法、装置、计算机设备和计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070233487A1 (en) * 2006-04-03 2007-10-04 Cohen Michael H Automatic language model update
CN110473523A (zh) * 2019-08-30 2019-11-19 北京大米科技有限公司 一种语音识别方法、装置、存储介质及终端
CN111222335A (zh) * 2019-11-27 2020-06-02 上海眼控科技股份有限公司 语料修正方法、装置、计算机设备和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王子龙;李俊峰;王宏岩;王思杰;: "基于递归神经网络的端到端语音识别" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117351946A (zh) * 2023-10-27 2024-01-05 之江实验室 一种语音识别方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110427623B (zh) 半结构化文档知识抽取方法、装置、电子设备及存储介质
CN111177326B (zh) 基于精标注文本的关键信息抽取方法、装置及存储介质
Creutz et al. Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1.0
CN112016310A (zh) 文本纠错方法、系统、设备及可读存储介质
JP5128629B2 (ja) 品詞タグ付けシステム、品詞タグ付けモデルのトレーニング装置および方法
US7480612B2 (en) Word predicting method, voice recognition method, and voice recognition apparatus and program using the same methods
US8868609B2 (en) Tagging method and apparatus based on structured data set
JP2001519043A (ja) コンテキスト・フリー・グラマーを使用するテキスト正規化
CN112307773B (zh) 机器阅读理解系统的自定义问题数据自动生成方法
Holliday Variation in question intonation in the corpus of regional African American language
CN116205211A (zh) 基于大规模预训练生成模型的文档级简历解析方法
KR102516560B1 (ko) 수기로 작성된 문서의 관리 시스템
CN110929714A (zh) 一种基于深度学习的密集文本图片的信息提取方法
JP2022128441A (ja) 弱教師ありマルチ報酬強化学習を使用した文章分類のためのテキストデータの増強
CN113051887A (zh) 一种公告信息元素抽取方法、系统及装置
CN116484808A (zh) 一种公文用可控文本生成方法及装置
Alfaro-Contreras et al. Late multimodal fusion for image and audio music transcription
CN112185361A (zh) 一种语音识别模型训练方法、装置、电子设备及存储介质
CN113569021B (zh) 用户分类的方法、计算机设备和可读存储介质
CN111666750A (zh) 语音识别结果修正方法、系统、终端以及储存介质
CN112036183B (zh) 基于BiLSTM网络模型及CRF模型的分词方法、装置、计算机装置及计算机存储介质
KR20200040032A (ko) 양방향 lstm―attention 기반 한국어 게시글 분류 방법
CN114118068A (zh) 训练文本数据的扩增方法、装置及电子设备
CN116737935B (zh) 基于提示学习的藏文文本分类方法、装置及存储介质
Lawal Spoken character classification using abductive network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200915