CN111652005A - 汉语与乌尔都语同步互译系统及方法 - Google Patents

汉语与乌尔都语同步互译系统及方法 Download PDF

Info

Publication number
CN111652005A
CN111652005A CN202010464081.6A CN202010464081A CN111652005A CN 111652005 A CN111652005 A CN 111652005A CN 202010464081 A CN202010464081 A CN 202010464081A CN 111652005 A CN111652005 A CN 111652005A
Authority
CN
China
Prior art keywords
language
voice
characters
module
context information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010464081.6A
Other languages
English (en)
Other versions
CN111652005B (zh
Inventor
沙塔尔江·吾甫尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sha TaerjiangWufuer
Original Assignee
Sha TaerjiangWufuer
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sha TaerjiangWufuer filed Critical Sha TaerjiangWufuer
Priority to CN202010464081.6A priority Critical patent/CN111652005B/zh
Publication of CN111652005A publication Critical patent/CN111652005A/zh
Application granted granted Critical
Publication of CN111652005B publication Critical patent/CN111652005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明涉及翻译技术领域,具体涉及一种汉语与乌尔都语同步互译系统,包括:输入模块,用于输入并发送第一语言的语音;识别模块,用于将第一语言的语音转变成第一语言的文字;解析模块,用于识别出第一语言的多义词与上下文信息;查询模块,用于根据上下文信息在数据库里找到与第一语言的多义词最相关的第一语言的解释,并用第一语言的解释替换第一语言的多义词;翻译模块,用于将第一语言的文字翻译成第二语言的文字;合成模块,用于将第二语言的文字转换成第二语言的语音;输出模块,用于输出第二语言的语音。本发明在进行互译时,降低了在数据库中与目标语言进行匹配时出现错配、误配的概率,从而使得翻译的结果更加准确。

Description

汉语与乌尔都语同步互译系统及方法
技术领域
本发明涉及翻译技术领域,具体涉及一种汉语与乌尔都语同步互译系统及方法。
背景技术
同声互译,是指不打断讲话者讲话的情况下,不间断地将内容从一种语言翻译成另一种语言。通常,同声互译需要专业的翻译员来完成。随着科技的发展以及AI技术的逐渐成熟,市面上出现了各种各样的翻译设备,可以快速地将A种语言时翻译为B种语言。比如,文件CN101697581A公开了一种支持同声传译视讯会议的方法、装置及系统,所述方法包括:接收会议终端发送的翻译语音,所述翻译语音由所述会议终端对自身所在会场的原始语音进行翻译后得到;根据所述翻译语音的语言类型对所述翻译语音进行混音处理,得到混音处理后的各语言类型的翻译混音;将各语言类型的所述翻译混音发送到支持相应语言类型的会场对应的会议终端。该发明实施例支持在各个会议终端中设立翻译机构,无需设立独立的翻译会议终端,方案易于实现,具有很高的实用性。
对于汉语与乌尔都语互译,文件CN204331572U公开了一种互译PAD,能够进行汉语和维语互译、双语发声,满足不同的需要,使得互译更加准确。同时,也避免了平板初始化、升级带来的数据丢失,可方便、持续的进行双语工作、互译学习,便于广大用户工作、学习。
现有的语音互译系统,通常都是先将待翻译的语音转换为对应的文本,再将该文本翻译为目标语言的文本,最后将目标语言的文本转换为目标语言的语音。但是,乌尔都语中很多文字以阿拉伯字母为基础,总共35个字母,其中28个字母同阿拉伯语,4个字母同波斯语,另有3个字母
Figure RE-GDA0002603794550000011
为乌尔都语字母。乌尔都语的印刷体采用的是“波斯体”
Figure RE-GDA0002603794550000012
字母连写时变形“严重”,有时印刷不清楚的资料甚至难以辨认。将乌尔都语文本翻译为目标语言的文本时,需要在数据库中与目标语言进行匹配,可能会出现错配、误配的情况,从而使得翻译的结果不准确,甚至出现根本性的错误。
发明内容
本发明提供一种汉语与乌尔都语同步互译系统及方法,解决了现有的汉语与乌尔都语互译技术在数据库中与目标语言进行匹配时可能会出现错配、误配的情况,从而使得翻译的结果不准确、甚至出现根本性错误的技术问题。
本发明提供的基础方案为:汉语与乌尔都语同步互译系统,包括:
输入模块,用于输入第一语言的语音,并发送第一语言的语音;
识别模块,用于接收第一语言的语音,将第一语言的语音转变成第一语言的文字,并发送第一语言的文字;
解析模块,用于接收第一语言的文字,识别出第一语言文字的多义词与上下文信息,并发送第一语言的多义词与上下文信息;
数据库,用于储存第一语言的多义词与上下文信息,以及对应的解释;
查询模块,用于接收第一语言的多义词以及上下文信息,采用ESIM算法根据上下文信息在数据库里找到与第一语言的多义词最相关的第一语言的解释,并用第一语言的解释替换第一语言的多义词;
翻译模块,用于将第一语言的文字翻译成第二语言的文字;
合成模块,用于将第二语言的文字转换成第二语言的语音;
输出模块,用于输出第二语言的语音。
本发明的工作原理在于:在输入第一语言的语音后,将其转化为第一语言的文字。然后,对第一语言的文字进行分析,挑选出具有多种含义的词语,也即多义词,并挑选出多义词前后相关的一些词语作为上下文信息。通常情况下,结合上下文信息就能对多义词进行解释,确定其唯一的含义。这样,用解释出的含义对多义词进行替换,然后翻译并输出语音,就消除了歧义。此外,ESIM算法,也即Enhanced LSTM for Natural LanguageInference,是一种专为自然语言推断而生的加强版LSTM(一种深度学习算法),具有精细的设计序列式的推断结构,同时考虑局部推断和全局推断,在进行文本匹配时会比较的两句话产生的交互,从而提高准确性。
本发明的优点在于:在进行互译时,降低了在数据库中与目标语言进行匹配时出现错配、误配的概率,从而使得翻译的结果更加准确;也可以有效消除含义多义词带来的歧义,从而使得翻译的结果更接近谈话者的真实意思,也更加灵活。
本发明针对乌尔都语的特点,采用ESIM算法解决了现有的汉语与乌尔都语互译技术在数据库中与目标语言进行匹配时可能会出现错配、误配的技术问题。
进一步,输入模块,还用于检测语音开始的状态,并进行识别;还用于去除第一语言的语音中的噪声。有益效果在于:检测语音开始的状态,有利于明确开始采集语音的时刻,减少录入无关的语音;去除噪声,则可以减少杂音,降低对文字转化准确率的影响。
进一步,识别模块还用于判断第一语言的种类。有益效果在于:不同的语言种类,语法结构各不相同。确定语言种类后,有利于针对该语言的语法结构进行转化,从而提高语音转文字的效率。
进一步,解析模块还用于将第一语言的文字切分为句子,并以句子为单位进行分析。有益效果在于:第一语言的文字是有一定篇幅的,将其划分为若干句子进行分析,有利于合理确定多义词的上下文信息。若以整个篇幅进行分析,上下文信息会太过遥远,不利于确定多义词的含义。
进一步,输出模块还用于根据需要选择输出的语言种类。有益效果在于:这样当第一语言的语音被翻译成第二语言的语音后,用户既可以选择输出第二语言的语音,也可以选择输出其他种类的语言的语音,从而使得互译的功能更加多样化,满足不同场景的需求。
基于上述汉语与乌尔都语同步互译系统,本发明还提供一种汉语与乌尔都语同步互译方法,包括步骤:S1、输入第一语言的语音,并发送第一语言的语音;S2、接收第一语言的语音,将第一语言的语音转变成第一语言的文字,并发送第一语言的文字;S3、接收第一语言的文字,识别出第一语言的多义词与上下文信息,并发送第一语言的多义词与上下文信息;S4、接收第一语言的多义词以及上下文信息,采用ESIM算法根据上下文信息在数据库里找到与第一语言的多义词最相关的第一语言的解释,并用第一语言的解释替换第一语言的多义词;S5、将第一语言的文字翻译成第二语言的文字;S6、将第二语言的文字转换成第二语言的语音;S7、输出第二语言的语音。
本发明的工作原理及优点在于:通过对第一语言的文字进行分析,挑选出多义词及上下文信息;结合上下文信息就能对多义词进行解释,确定其唯一的含义,从而消除歧义。使得在进行互译时,翻译的结果更接近谈话者的真实意思。
进一步,步骤S1中还包括:检测语音开始的状态,并进行识别;去除第一语言的语音中的噪声。有益效果在于:有利于明确开始采集语音的时刻,减少录入无关的语音;并去除杂音,降低对文字转化准确率的影响。
进一步,步骤S2中还包括:判断第一语言的种类。有益效果在于:确定语言种类后,有利于针对该语言的语法结构进行转化,从而提高语音转文字的效率。
进一步,步骤S4中还包括:将第一语言的文字切分为句子,并以句子为单位进行分析。有益效果在于:划分为若干句子进行分析,有利于合理确定多义词的上下文信息。若以整个篇幅进行分析,上下文信息会太过遥远,不利于确定多义词的含义。
进一步,步骤S7中还包括:根据需要选择输出的语言种类。有益效果在于:用户既可以选择输出第二语言的语音,也可以选择输出其他种类的语言的语音,从而使得互译的功能更加多样化,满足不同场景的需求。
附图说明
图1为本发明汉语与乌尔都语同步互译系统实施例1的系统结构框图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
实施例1
本发明汉语与乌尔都语同步互译系统实施例基本如附图1所示,包括:输入模块,用于输入第一语言的语音,并发送第一语言的语音;识别模块,用于接收第一语言的语音,将第一语言的语音转变成第一语言的文字,并发送第一语言的文字;解析模块,用于接收第一语言的文字,识别出第一语言的多义词与上下文信息,并发送第一语言的多义词与上下文信息;数据库,用于储存第一语言的多义词与上下文信息,以及对应的解释;查询模块,用于接收第一语言的多义词以及上下文信息,采用ESIM算法根据上下文信息在数据库里找到与第一语言的多义词最相关的第一语言的解释,并用第一语言的解释替换第一语言的多义词;翻译模块,用于将第一语言的文字翻译成第二语言的文字;合成模块,用于将第二语言的文字转换成第二语言的语音;输出模块,用于输出第二语言的语音。
本实施例中第一语言为汉语,第二语言为乌尔都语。用户张三用汉语说出这样一段话,需要将其翻译为乌尔都语,“…上次你建议我多花时间学习,是什么意思呀?是让我多看一些课外书吗?我也觉得多看课外书挺有意思的,不然一个暑假在家多无聊!噢…对了,上周末老师讲的那篇课文是什么意思呀?作者要表达什么中心思想呀?麻烦你有空给我讲解一下…”
当张三说这段话的时候,输入模块会检测张三语音开始说话的状态,并进行识别,识别到张三开始说话了就进行录音。这段语音被录入后,输入模块采用高斯滤波的方式去其中的噪声。随后,输入模块将经过滤波处理后的语音发送到识别模块。识别模块接收到语音后,判断处出语音中语言的种类为汉语,将其转化为文字时要依据汉语的语法结构。转化后的文字如上所述,包括一个段落,并将这段文字发送到解析模块。
解析模块接收到这些文字后,以其标点符号将这个段落分为若干个句子,标点符号主要采用逗号、分号、句号、问号或者感叹号。比如说,这段话可分为如下句子:“上次你建议我多花时间学习”、“是什么意思呀?”、“是让我多看一些课外书吗?”、“我也觉得多看课外书挺有意思的”、“不然一个暑假在家多无聊!”、“上周末老师讲的那篇课文是什么意思呀”、“作者要表达什么中心思想呀?”、“麻烦你有空给我讲解一下”…然后,以句子为单位进行分析,识别出多义词及其对应的上下文关系。比如,“意思”这个词就是多义词,而且出现了三次。第一处的“意思”出现在“是什么意思呀?”这句话中,后面提到“是让我多看一些课外书吗?”;第二处的“意思”出现在“我也觉得多看课外书挺有意思的”这句话中,后面提到“不然一个暑假在家多无聊!”;第三处的“意思”出现在“上周末老师讲的那篇课文是什么意思呀?”这句话中,后面提到“作者要表达什么中心思想呀?”。最后,将三处“意思”及其对应的上下文信息发送到查询模块。
查询模块接收到三处“意思”及其对应的上下文信息后,根据各处对应的上下文信息在数据库中进行查询,找出三处“意思”对应的解释,查询的依据是上下文信息的关键词。查询时,需要进行匹配,匹配时采用ESIM算法,也即Enhanced LSTM for Natural LanguageInference,一种专为自然语言推断而生的加强版LSTM(一种深度学习算法),具体的实现过程及程序代码可参考现有技术,比如CSDN技术社区网站。
在数据库中,储存有多义词在各种场景的解释。比如说,格式如下:(多义词)—(对应的上下文信息的关键词)—(解释)。这样,查询模块就能查到三处“意思”对应的解释。比如说,第一处意思,意思—是什么—想法;第二处意思,意思—无聊—乐趣;第三处意思,意思—中心思想—含义。然后,将第一处意思替换为“想法”,将第二处意思替换为“乐趣”,将第三处意思替换为“含义”。
接下来,翻译模块将替换后的这段文字翻译为用乌尔都语。也就是说,第一处意思表示“想法”,翻译成乌尔都语为
Figure RE-GDA0002603794550000061
第二处意思表示“乐趣”,翻译成乌尔都语为
Figure RE-GDA0002603794550000062
第三处意思表示“含义”,翻译成乌尔都语为
Figure RE-GDA0002603794550000063
整段话的翻译结果如下:
Figure RE-GDA0002603794550000064
Figure RE-GDA0002603794550000065
Figure RE-GDA0002603794550000066
最后,合成模块将上述这段乌尔都语转化为语音,并由输出模块输出语音。输出时,除了乌尔都语,也可以用英语输出。
实施例2
与实施例1不同之处仅在于,汉语与乌尔都语的互译分为两种场景:有网络的场景和没有网络的场景,在有网络的场景下,包括一个学习、记录的过程。
在本实施例中,需要将汉语“生日快乐”的语音翻译成乌尔都语
Figure RE-GDA0002603794550000067
的语音。在有网络的情况下,张三首先将“生日快乐”以语音的形式输入系统(第一语音),“生日快乐”的语音输入系统以后,被转换为“生日快乐”的汉语文本。接下来,系统进行汉语与乌尔都语文本之间的互译,也即将“生日快乐”(第一文本,也即汉语形式的文本)翻译为
Figure RE-GDA0002603794550000071
(第二文本,也即乌尔都语形式的文本)。然后,将乌尔都语形式的文本(第二文本)转换为乌尔都语形式的语音(第二语音);转换完毕后,提示用户进行确认,确认的方式为用户自己读出
Figure RE-GDA0002603794550000072
的发音(第三语音)。最后,系统判断第二语音与第三语音相同是否相同:若第二语音与第三语音相同,系统建立并保存第一语音与第二语音的映射关系,并输出第二语音;若第二语音与第三语音不相同,系统建立并保存第一语音与第三语音的映射关系,并输出第三语音。这样,系统经过学习,就会建立起输入语音与输出语音的映射关系,这些映射关系被保存到数据库里。
在没有网络的场景下,若要将汉语“生日快乐”的语音翻译成乌尔都语
Figure RE-GDA0002603794550000073
的语音,系统就难以进行上述的语音互译过程。这时候,张三输入“生日快乐”的语音 (第一语音)后,系统自动在数据库里查找是否存在对应的乌尔都语形式的语音,也即查找第二语音或第三语音。由于数据库里在有网络的情况下储存了与第一语音相对应的第二语音或第三语音,系统则直接调用第二语音或第三语音,然后输出。若数据库里在有网络的情况下没有储存与第一语音相对应的第二语音或第三语音,这时系统就提示用户“暂时无法翻译”。比如说,要将汉语“祝你好运”的语音翻译为乌尔都语
Figure RE-GDA0002603794550000074
Figure RE-GDA0002603794550000075
的语音,但是数据库里没有与
Figure RE-GDA0002603794550000076
对应的第二语音或第三语音,这时系统就输出“暂时无法翻译”的语音。
可见,类似的方式,在有网络的情况下可以将工作、生活中经常使用的高频词汇对应的第二语音或第三语音储存在数据库里,这样即使在没有网络的情况下依然能够进行汉语和乌尔都语的语音的互译,随着使用次数的增加,还可以逐渐扩大数据库里的内容。此外,当某些词汇出现更好的翻译的方式时,可以修改或者删除数据库里储存的相应的映射关系。比如说,实施例1中第二处“意思”,张三输入的语音为第一语音,数据库里原本储存的映射是对应
Figure RE-GDA0002603794550000077
的语音,该语音为第二语音或第三语音。但是,如果按照乌尔都语的文化来说,翻译成
Figure RE-GDA0002603794550000078
更好,该语音为第四语音。那么,系统就可以删除掉数据库里第一语音与第二语音或第三语音的映射关系,建立并保存第一语音与第四语音的映射关系,或者直接将数据库里第一语音与第二语音或第三语音的映射关系替换为第一语音与第四语音的映射关系。这样,可以灵活地对汉语与乌尔都语的互译过程进行优化。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (10)

1.汉语与乌尔都语同步互译系统,其特征在于:
包括:
输入模块,用于输入第一语言的语音,并发送第一语言的语音;
识别模块,用于接收第一语言的语音,将第一语言的语音转变成第一语言的文字,并发送第一语言的文字;
解析模块,用于接收第一语言的文字,识别出第一语言文字的多义词与上下文信息,并发送第一语言的多义词与上下文信息;
数据库,用于储存第一语言的多义词与上下文信息,以及对应的解释;
查询模块,用于接收第一语言的多义词以及上下文信息,采用ESIM算法根据上下文信息在数据库里找到与第一语言的多义词最相关的第一语言的解释,并用第一语言的解释替换第一语言的多义词;
翻译模块,用于将第一语言的文字翻译成第二语言的文字;
合成模块,用于将第二语言的文字转换成第二语言的语音;
输出模块,用于输出第二语言的语音。
2.根据权利要求1所述的汉语与乌尔都语同步互译系统,其特征在于:输入模块,还用于检测语音开始的状态,并进行识别;还用于去除第一语言的语音中的噪声。
3.根据权利要求2所述的汉语与乌尔都语同步互译系统,其特征在于:识别模块还用于判断第一语言的种类。
4.根据权利要求3所述的汉语与乌尔都语同步互译系统,其特征在于:解析模块还用于将第一语言的文字切分为句子,并以句子为单位进行分析。
5.根据权利要求4所述的汉语与乌尔都语同步互译系统,其特征在于:输出模块还用于根据需要选择输出的语言种类。
6.汉语与乌尔都语同步互译方法,其特征在于:
包括步骤:
S1、输入第一语言的语音,并发送第一语言的语音;
S2、接收第一语言的语音,将第一语言的语音转变成第一语言的文字,并发送第一语言的文字;
S3、接收第一语言的文字,识别出第一语言的多义词与上下文信息,并发送第一语言的多义词与上下文信息;
S4、接收第一语言的多义词以及上下文信息,采用ESIM算法根据上下文信息在数据库里找到与第一语言的多义词最相关的第一语言的解释,并用第一语言的解释替换第一语言的多义词;
S5、将第一语言的文字翻译成第二语言的文字;
S6、将第二语言的文字转换成第二语言的语音;
S7、输出第二语言的语音。
7.根据权利要求6所述的汉语与乌尔都语同步互译方法,其特征在于:步骤S1中还包括:检测语音开始的状态,并进行识别;去除第一语言的语音中的噪声。
8.根据权利要求7所述的汉语与乌尔都语同步互译方法,其特征在于:步骤S2中还包括:判断第一语言的种类。
9.根据权利要求8所述的汉语与乌尔都语同步互译方法,其特征在于:步骤S4中还包括:将第一语言的文字切分为句子,并以句子为单位进行分析。
10.根据权利要求9所述的汉语与乌尔都语同步互译方法,其特征在于:步骤S7中还包括:根据需要选择输出的语言种类。
CN202010464081.6A 2020-05-27 2020-05-27 汉语与乌尔都语同步互译系统及方法 Active CN111652005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010464081.6A CN111652005B (zh) 2020-05-27 2020-05-27 汉语与乌尔都语同步互译系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010464081.6A CN111652005B (zh) 2020-05-27 2020-05-27 汉语与乌尔都语同步互译系统及方法

Publications (2)

Publication Number Publication Date
CN111652005A true CN111652005A (zh) 2020-09-11
CN111652005B CN111652005B (zh) 2023-04-25

Family

ID=72346996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010464081.6A Active CN111652005B (zh) 2020-05-27 2020-05-27 汉语与乌尔都语同步互译系统及方法

Country Status (1)

Country Link
CN (1) CN111652005B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117521680A (zh) * 2024-01-04 2024-02-06 深圳和成视讯科技有限公司 一种记录仪的在线翻译方法及记录仪

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297285A1 (en) * 2012-05-02 2013-11-07 Electronics And Telecommunications Research Institute Apparatus and method for providing two-way automatic interpretation and translation service
CN103838714A (zh) * 2012-11-22 2014-06-04 北大方正集团有限公司 一种语音信息转换方法及装置
US20140303957A1 (en) * 2013-04-08 2014-10-09 Electronics And Telecommunications Research Institute Automatic translation and interpretation apparatus and method
CN110532573A (zh) * 2018-12-29 2019-12-03 苏州七星天专利运营管理有限责任公司 一种翻译方法和系统
CN110580343A (zh) * 2017-07-04 2019-12-17 艾朝君 一种汉字与乌尔都语的互通互识技术方法
CN110991196A (zh) * 2019-12-18 2020-04-10 北京百度网讯科技有限公司 多义词的翻译方法、装置、电子设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297285A1 (en) * 2012-05-02 2013-11-07 Electronics And Telecommunications Research Institute Apparatus and method for providing two-way automatic interpretation and translation service
CN103838714A (zh) * 2012-11-22 2014-06-04 北大方正集团有限公司 一种语音信息转换方法及装置
US20140303957A1 (en) * 2013-04-08 2014-10-09 Electronics And Telecommunications Research Institute Automatic translation and interpretation apparatus and method
CN110580343A (zh) * 2017-07-04 2019-12-17 艾朝君 一种汉字与乌尔都语的互通互识技术方法
CN110532573A (zh) * 2018-12-29 2019-12-03 苏州七星天专利运营管理有限责任公司 一种翻译方法和系统
CN110991196A (zh) * 2019-12-18 2020-04-10 北京百度网讯科技有限公司 多义词的翻译方法、装置、电子设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117521680A (zh) * 2024-01-04 2024-02-06 深圳和成视讯科技有限公司 一种记录仪的在线翻译方法及记录仪

Also Published As

Publication number Publication date
CN111652005B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US10672391B2 (en) Improving automatic speech recognition of multilingual named entities
US8214197B2 (en) Apparatus, system, method, and computer program product for resolving ambiguities in translations
JP4267081B2 (ja) 分散システムにおけるパターン認識登録
US8504350B2 (en) User-interactive automatic translation device and method for mobile device
KR101694286B1 (ko) 양방향 자동 통역 및 번역 서비스 제공 장치 및 그 방법
US6694055B2 (en) Proper name identification in chinese
JP2000137596A (ja) 対話型音声応答システム
CN101025735A (zh) 用于通过不同语言之间的翻译来支持交流的装置和方法
CN109616096A (zh) 多语种语音解码图的构建方法、装置、服务器和介质
US11907665B2 (en) Method and system for processing user inputs using natural language processing
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
CA2613154A1 (en) Dictionary lookup for mobile devices using spelling recognition
CN111652005A (zh) 汉语与乌尔都语同步互译系统及方法
KR101424496B1 (ko) 음향 모델 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
JP5099367B2 (ja) 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム
CN103164398A (zh) 汉维电子辞典及其自动转译汉维语的方法
KR20130126570A (ko) 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
Soky et al. Building wfst based grapheme to phoneme conversion for khmer
CN113889115A (zh) 一种基于语音模型的方言转述方法及相关装置
CN107342080B (zh) 一种会议现场同步速记的系统和方法
CN109712607B (zh) 一种处理方法、装置及电子设备
Hahn et al. Optimizing CRFs for SLU tasks in various languages using modified training criteria
Allauzen et al. Voice query refinement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant