CN113642339A - 一种提高翻译精度的机器翻译系统及其方法 - Google Patents

一种提高翻译精度的机器翻译系统及其方法 Download PDF

Info

Publication number
CN113642339A
CN113642339A CN202010344432.XA CN202010344432A CN113642339A CN 113642339 A CN113642339 A CN 113642339A CN 202010344432 A CN202010344432 A CN 202010344432A CN 113642339 A CN113642339 A CN 113642339A
Authority
CN
China
Prior art keywords
translation
words
source language
language sentence
professional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010344432.XA
Other languages
English (en)
Inventor
付迎春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yaxincheng Medical Info Tech Co ltd
Original Assignee
Beijing Yaxincheng Medical Info Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yaxincheng Medical Info Tech Co ltd filed Critical Beijing Yaxincheng Medical Info Tech Co ltd
Priority to CN202010344432.XA priority Critical patent/CN113642339A/zh
Publication of CN113642339A publication Critical patent/CN113642339A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及机器自动翻译技术领域,尤其涉及一种用于医疗器械和医学资料翻译的提高翻译精度的机器翻译系统及其方法,尤所述方法具体包括以下步骤:输入步骤,所述步骤用于将待翻译的源语言语句的输入;识别步骤,所述步骤用于输入的源语言语句进行识别;标准化检验步骤,所述步骤用于结合上下文对翻译后译文进行标准化检验,翻译步骤,所述步骤用于将完成检验和其它语句进行整句翻译;输出步骤,所述用于将翻译后整句整合后输出翻译全文。由于采用上述技术方案,本发明具有避免了因人工翻译需要将词的意思加语法连成局并结合语境、语音、语调再进行翻译,保证医学术语的标准化,无需要后续再次校对,降低了成本,提高了翻译的精度。

Description

一种提高翻译精度的机器翻译系统及其方法
技术领域
本发明涉及机器自动翻译技术领域,尤其涉及一种用于医疗器械和医学资料翻译的提高翻译精度的机器翻译系统及其方法。
背景技术
目前,在医学领域中现有的统计机器翻译技术中由于有些词汇为专业词汇,这样使用普通的翻译器时,未登录词的出现频率较高,从而使翻译结果的准确性大大降低,一句话最终的翻译结果多处为“未知”。另一方面,机器翻译与人为翻译目前依然存在较大差异,因为机器翻译采用直接翻译的方法,即字、词加语法组合直接翻译,但是一个词会有很多种意思,通过语法连接也会产生很多种意思,而人工翻译需要将词的意思加语法连成局并结合语境、语音、语调再进行翻译,有的还需要进一步意译,这样很难保证在医学领域中很重要的一个环节,即医学术语的标准化,需要后续再次校对,提高了成本,大幅度降低了翻译的精度。
发明内容
本发明公开了一种提高翻译精度的机器翻译系统及其方法,以解决现有技术的上述以及其他潜在问题中任一问题。
为了解决上述技术问题,本发明的技术方案是:一种提高翻译精度的机器翻译系统,其特征在于,该系统包括:
输入单元,用于接受要翻译的源语言语句的输入;
识别模块,用于对输入的源语言语句进行识别,判断输入的源语言语句中是否含专业用语,并将专业用语提取出来,并确认译文;
标准化检验模块,用于将识别模块确认的译文结合上下文对翻译后译文进行标准化检验;
自动翻译模块,所述步骤用于将完成检验的专业用语的译文和其它语句进行整句翻译;
输出模块,用于将标准化的词语与普通词汇进行整合后输出。
进一步,所述系统还包括判定子单元模块,用于将判定输入的源语言语句是否为机器可识别语句,如果不是将其转换为机器可识别语句;
专业用语译文确认模块,用于将专业用语的整词根据专业用语数据库中译文进行翻译;
进一步,所述系统还包括转化模块,用于将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词,并计算相似度值,确定专用词的词向量与标准化表上专用词的向量词关系。
进一步,所述系统还包括录入模块:用于将没有对应到译文,录入,并收录入专业用语数据库中;
本发明的另一目的提供一种采用上述提高翻译精度的机器翻译系统的翻译方法,该方法具体包括以下步骤:输入步骤,所述步骤用于将待翻译的源语言语句的输入;
识别步骤,所述步骤用于输入的源语言语句进行识别是否有专业用语,如果有则提取出专业用语,否则直接翻译;
标准化检验步骤,所述步骤用于将提取出专业用语的译文结合上下文对进行标准化检验,
自动翻译步骤,所述步骤用于将完成检专业用语的译文和其它语句进行整句翻译;
输出步骤,所述用于将翻译后整句整合后输出翻译全文。
进一步,所述方法还包括以下步骤:
专业用语译文确认步骤,所述步骤用于将专业用语的整词根据专业用语数据库中进行翻译,如有相对应的译文,则输出结果,如果否,则对词组进行拆分,然后输出翻译结果。
进一步,所述步骤还包括:收录步骤:如果对于拆词后仍然没有相对应的译文,则录入翻译译文,并收录入专业用语数据库中。
进一步,所述识别步骤的具体为:
判定所输入的源语言语句是否为机器可翻译;
进一步,所述识别步骤具体如下:
在所输入的源语言语句被判定为非机器可翻译的情况下,通过比较所输入的源语言语句中所包括的单词或单词组合和受控源语言语句数据库内所存储的源语言语句中包括的单词或单词组合,来判定所输入的源语言语句是否能转换为所述受控源语言语句,并且在所输入的源语言语句被判定为能转换的情况下,
将所输入的源语言语句转换为所述受控源语言语句,并将所输入的源语言语句判定为机器可翻译,以及在所输入的源语言语句被判定为不能转换的情况下,将所输入的源语言语句判定为非机器可翻译。
进一步,所述识别模型训练的具体步骤为:
将标准化的医学词汇的文本内容作为卷积神经识别模型的训练集;
对所述训练集内所有待训练标准化的医学词汇做统一处理;
将处理后的数据输入到卷积神经识别模型的输入层中,在输出层中比较输出结果和样本标签实际值的误差计算最终值;
若输出层经过CTC算法处理之后的输出结果和实际标签结果差别较小,更新当前对应的卷积神经识别模型的隐层中各神经元的网络权值和阈值,使网络误差函数沿负梯度方向下降,使输出结果逼近期望输出,即得到训练后的识别模型。
进一步,所述标准化检验步骤具体为:
将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词;
计算所述专用词的向量词与标准化表上专用词的向量词的相识度;
根据该专用词的词向量与标准化表上专用词的向量词的相识度,对专用词的词向量进行聚类,以便确定专用词的词向量与标准化表上专用词的向量词关系,
然后基于相识度对专用词的向量词标准化。
一种实现上述的一种提高翻译精度的机器翻译的计算机程序。
一种实现上述的一种提高翻译精度的机器翻译的信息处理终端。
一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述的一种提高翻译精度的机器翻译。
本发明的有益效果是:由于采用上述技术方案,本发明具有避免了因人工翻译需要将词的意思加语法连成局并结合语境、语音、语调再进行翻译,保证医学术语的标准化,无需要后续再次校对,降低了成本,提高了翻译的精度。
附图说明
图1为本发明一种提高翻译精度的机器翻译方法的流程示意图。
图2为本发明一种提高翻译精度的机器翻译系统逻辑框图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案做进一步说明。
如图1所示,本发明一种提高翻译精度的机器翻译方法,所述方法具体包括以下步骤:
输入步骤,所述步骤用于将待翻译的源语言语句的输入;
识别步骤,所述步骤用于输入的源语言语句进行识别;
标准化检验步骤,所述步骤用于结合上下文对翻译后译文进行标准化检验,
翻译步骤,所述步骤用于将完成检验和其它语句进行整句翻译;
输出步骤,所述用于将翻译后整句整合后输出翻译全文。
进一步,所述翻译方法还包括以下步骤:
专业用语译文确认步骤,所述步骤用于将专业用语的整词根据专业用语数据库中进行翻译,如有相对应的译文,则输出结果,如果否,则对词组进行拆分,然后输出翻译结果。
进一步,所述步骤还包括:如果对于拆词后仍然没有相对应的译文,则录入翻译译文,并收录入专业用语数据库中。
进一步,所述识别步骤的具体为:
判定所输入的源语言语句是否为机器可翻译;
对判定后的输入的源语言语句输入识别模型对专业用语识别,如果有专业用语,则将专业用语提取出来,进入专业用语译文确认步骤;否,则进行翻译步骤。
进一步,所述识别步骤具体如下:
在所输入的源语言语句被判定为非机器可翻译的情况下,通过比较所输入的源语言语句中所包括的单词或单词组合和受控源语言语句数据库内所存储的源语言语句中包括的单词或单词组合,来判定所输入的源语言语句是否能转换为所述受控源语言语句,并且在所输入的源语言语句被判定为能转换的情况下,
将所输入的源语言语句转换为所述受控源语言语句,并将所输入的源语言语句判定为机器可翻译,以及在所输入的源语言语句被判定为不能转换的情况下,将所输入的源语言语句判定为非机器可翻译。
进一步,所述识别模型训练的具体步骤为:
将标准化的医学词汇的文本内容作为网络模型的训练集;
对所述训练集内所有待训练标准化的医学词汇做统一处理;
将处理后的数据输入到识别模型的输入层中,在输出层中比较输出结果和样本标签实际值的误差计算最终值;
若输出层经过CTC算法处理之后的输出结果和实际标签结果差别较小,更新当前对应的卷积神经识别模型的隐层中各神经元的网络权值和阈值,使网络误差函数沿负梯度方向下降,使输出结果逼近期望输出,即得到训练后的识别模型。
进一步,所述标准化检验步骤具体为:
将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词;
计算所述专用词的向量词与标准化表上专用词的向量词的相识度;
根据该专用词的词向量与标准化表上专用词的向量词的相识度,对专用词的词向量进行聚类,以便确定专用词的词向量与标准化表上专用词的向量词关系,
然后基于相识度对专用词的向量词标准化。
上述是用来产生词向量的相关模型,模型为双层的神经网络,用来训练以重新建构语言学之词文本,网络以词表现,并且根据相邻位置的输入词在word2vec中词袋模型假设下,词的顺序是不重要的,训练完成后,在word2vec模型可以用来映射每个词到一个向量,用来表示词对词之间的关系,从而实现了自动化标注的医疗词语标准表的医疗词的对应关系,进而避免了现有技术中依赖人工标注医疗术语带来的缺陷。
一种实现上述的一种专业资料的翻译方法的计算机程序。
一种实现上述的一种专业资料的翻译方法的信息处理终端。
一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述的一种专业资料的翻译方法。
本发明的另一目的是提供一种实现提高翻译精度的机器翻译方法的系统;所述系统包括:
输入单元,用于接受要翻译的源语言语句的输入;
识别模块,用于对输入的源语言语句进行识别,判断输入的源语言语句中是否含专业用语,并将专业用语提取出来,并确认译文;
标准化检验模块,用于将识别模块确认的译文结合上下文对翻译后译文进行标准化检验;
自动翻译模块,所述步骤用于将完成检验的专业用语的译文和其它语句进行整句翻译;
输出模块,用于将标准化的词语与普通词汇进行整合后输出。
进一步,所述系统还包括判定子单元模块,用于将判定输入的源语言语句是否为机器可识别语句,如果不是将其转换为机器可识别语句;
专业用语译文确认模块,用于将专业用语的整词根据专业用语数据库中译文进行翻译(如图2所示);
进一步,所述系统还包括转化模块,用于将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词,并计算相似度值,确定专用词的词向量与标准化表上专用词的向量词关系。
以上对本申请实施例所提供的一种一种提高翻译精度的机器翻译系统及其方法,进行了详细介绍。以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
如在说明书及权利要求书当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求书并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求书当中所提及的“包含”、“包括”为一开放式用语,故应解释成“包含/包括但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。
说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求书所界定者为准。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求书的保护范围内。

Claims (10)

1.一种提高翻译精度的机器翻译系统,其特征在于,该系统包括:
输入单元,用于接受要翻译的源语言语句的输入;
识别模块,用于对输入的源语言语句进行识别,判断输入的源语言语句中是否含专业用语,并将专业用语提取出来,并确认译文;
标准化检验模块,用于将识别模块确认的译文结合上下文对翻译后译文进行标准化检验;
自动翻译模块,所述步骤用于将完成检验的专业用语的译文和其它语句进行整句翻译;
输出模块,用于将标准化的词语与普通词汇进行整合后输出。
2.根据权利要求1所述的系统,其特征在于,所述系统还包括判定子单元模块,用于将判定输入的源语言语句是否为机器可识别语句,如果不是将其转换为机器可识别语句;
专业用语译文确认模块,用于将专业用语的整词根据专业用语数据库中译文进行翻译。
3.根据权利要求2所述的系统,其特征在于,所述系统还包括转化模块,用于将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词,并计算相似度值,确定专用词的词向量与标准化表上专用词的向量词关系。
4.一种采用上述提高翻译精度的机器翻译系统的翻译方法,其特征在于,所述方法具体包括以下步骤:
输入步骤,所述步骤用于将待翻译的源语言语句的输入;
识别步骤,所述步骤用于输入的源语言语句进行识别是否有专业用语,如果有则提取出专业用语,否则直接翻译;
标准化检验步骤,所述步骤用于将提取出专业用语的译文结合上下文对进行标准化检验,
自动翻译步骤,所述步骤用于将完成检专业用语的译文和其它语句进行整句翻译;
输出步骤,所述用于将翻译后整句整合后输出翻译全文。
5.根据权利要求4所述的方法,其特征在于,所述识别步骤的具体为:
判定所输入的源语言语句是否为机器可翻译;
对判定后的输入的源语言语句输入识别模型对专业用语识别,如果有专业用语,则将专业用语提取出来,进入专业用语译文确认步骤;否,则进行翻译步骤。
6.根据权利要求5所述的方法,其特征在于,所述判定为机器可翻译的具体步骤为:
在所输入的源语言语句被判定为非机器可翻译的情况下,通过比较所输入的源语言语句中所包括的单词或单词组合和受控源语言语句数据库内所存储的源语言语句中包括的单词或单词组合,来判定所输入的源语言语句是否能转换为所述受控源语言语句,并且在所输入的源语言语句被判定为能转换的情况下,
将所输入的源语言语句转换为所述受控源语言语句,并将所输入的源语言语句判定为机器可翻译,以及在所输入的源语言语句被判定为不能转换的情况下,将所输入的源语言语句判定为非机器可翻译。
7.根据权利要求6所述的方法,其特征在于,所述标准化检验步骤具体为:
将翻译后专业用语的专用词输入Word2Vec模型转化为所述专用词的向量词;
计算所述专用词的向量词与标准化表上专用词的向量词的相识度;
根据该专用词的词向量与标准化表上专用词的向量词的相识度,对专用词的词向量进行聚类,以便确定专用词的词向量与标准化表上专用词的向量词关系,
然后基于相识度对专用词的向量词标准化。
8.一种实现如权利要求4-7任一项所述的提高翻译精度的机器翻译的翻译方法的计算机程序。
9.一种实现如权利要求4-7任一项所述的提高翻译精度的机器翻译的翻译方法的信息处理终端。
10.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求4-7任意一项所述的提高翻译精度的机器翻译的翻译方法。
CN202010344432.XA 2020-04-27 2020-04-27 一种提高翻译精度的机器翻译系统及其方法 Pending CN113642339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010344432.XA CN113642339A (zh) 2020-04-27 2020-04-27 一种提高翻译精度的机器翻译系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010344432.XA CN113642339A (zh) 2020-04-27 2020-04-27 一种提高翻译精度的机器翻译系统及其方法

Publications (1)

Publication Number Publication Date
CN113642339A true CN113642339A (zh) 2021-11-12

Family

ID=78415059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010344432.XA Pending CN113642339A (zh) 2020-04-27 2020-04-27 一种提高翻译精度的机器翻译系统及其方法

Country Status (1)

Country Link
CN (1) CN113642339A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180011842A1 (en) * 2006-10-26 2018-01-11 Facebook, Inc. Lexicon development via shared translation database
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN110543644A (zh) * 2019-09-04 2019-12-06 语联网(武汉)信息技术有限公司 包含术语翻译的机器翻译方法、装置与电子设备
CN110807338A (zh) * 2019-11-08 2020-02-18 北京中献电子技术开发有限公司 英汉机器翻译术语一致性自修正系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180011842A1 (en) * 2006-10-26 2018-01-11 Facebook, Inc. Lexicon development via shared translation database
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN110543644A (zh) * 2019-09-04 2019-12-06 语联网(武汉)信息技术有限公司 包含术语翻译的机器翻译方法、装置与电子设备
CN110807338A (zh) * 2019-11-08 2020-02-18 北京中献电子技术开发有限公司 英汉机器翻译术语一致性自修正系统及方法

Similar Documents

Publication Publication Date Title
Chang et al. Code-switching sentence generation by generative adversarial networks and its application to data augmentation
CN107729313B (zh) 基于深度神经网络的多音字读音的判别方法和装置
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US7840399B2 (en) Method, device, and computer program product for multi-lingual speech recognition
US8566076B2 (en) System and method for applying bridging models for robust and efficient speech to speech translation
US8370130B2 (en) Speech understanding system using an example-based semantic representation pattern
CN111177324B (zh) 基于语音识别结果进行意图分类的方法和装置
US20230069935A1 (en) Dialog system answering method based on sentence paraphrase recognition
CN112016271A (zh) 语言风格转换模型的训练方法、文本处理方法以及装置
JP6778655B2 (ja) 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム
Graja et al. Discriminative framework for spoken tunisian dialect understanding
CN111339750A (zh) 去除停用语并预测句子边界的口语文本处理方法
Yılmaz et al. Semi-supervised acoustic model training for speech with code-switching
CN111651978A (zh) 基于实体的词法检查方法与装置和计算机设备及存储介质
CN111177351A (zh) 基于规则的自然语言表达意图获取方法、装置和系统
CN111414745A (zh) 文本标点确定方法与装置、存储介质、电子设备
Lee et al. A review of the Mandarin-English code-switching corpus: SEAME
Graja et al. Statistical framework with knowledge base integration for robust speech understanding of the Tunisian dialect
Suhasini et al. SUH_ASR@ LT-EDI-ACL2022: Transformer based approach for speech recognition for vulnerable individuals in Tamil
Besacier et al. ASR and translation for under-resourced languages
CN113642339A (zh) 一种提高翻译精度的机器翻译系统及其方法
CN117493548A (zh) 文本分类方法、模型的训练方法和装置
CN115881108A (zh) 语音识别方法、装置、设备及存储介质
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
Chadha et al. Code switched and code mixed speech recognition for indic languages

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination