CN108090050A - 基于深度神经网络的游戏翻译系统 - Google Patents

基于深度神经网络的游戏翻译系统 Download PDF

Info

Publication number
CN108090050A
CN108090050A CN201711091316.6A CN201711091316A CN108090050A CN 108090050 A CN108090050 A CN 108090050A CN 201711091316 A CN201711091316 A CN 201711091316A CN 108090050 A CN108090050 A CN 108090050A
Authority
CN
China
Prior art keywords
language
game
user
neural network
deep neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711091316.6A
Other languages
English (en)
Inventor
秦谦
王宏志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Mingtong Tech Co Ltd
Original Assignee
Jiangsu Mingtong Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Mingtong Tech Co Ltd filed Critical Jiangsu Mingtong Tech Co Ltd
Priority to CN201711091316.6A priority Critical patent/CN108090050A/zh
Publication of CN108090050A publication Critical patent/CN108090050A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web

Abstract

本发明公开了一种基于深度神经网络的游戏翻译系统,包括云翻译平台,所有用户均通过用户端与云翻译平台进行相互通信,云翻译平台上布置若干个机器翻译模块,实现对用户输入进行翻译;在进行社交时,用户在用户端(手机、网页)进行输入,然后提交到云翻译平台,云翻译平台的机器翻译模块采用深度学习机制对用户输入进行翻译。本发明针对跨语言跨国家游戏进行,提升跨语言跨国家游戏的可用性。

Description

基于深度神经网络的游戏翻译系统
技术领域
本发明涉及一种基于深度神经网络的游戏翻译系统,属于互联网游戏开发技术领域。
背景技术
随着互联网游戏和手机游戏的普及,越来越多的用户在互联网游戏中和好友交流,使游戏的社交属性得到极大的增强。随着游戏功能的拓展和国际化趋势,很多游戏会在不同国家进行部署和推广。此时,不同国家或地区的游戏玩家会使用不同语言进行交流。因此,一个有效的机器翻译系统可以大大增强游戏交流的可行性。目前中国互联网游戏和手机游戏针对不同国家用户的使用还没有很好的机器翻译系统。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于深度神经网络的游戏翻译系统,针对跨语言跨国家游戏进行,提升跨语言跨国家游戏的可用性。
为解决上述技术问题,本发明提供一种基于深度神经网络的游戏翻译系统,包括云翻译平台,所有用户均通过用户端与云翻译平台进行相互通信;所述云翻译平台上布置若干个机器翻译模块,实现对用户输入进行翻译;所述机器翻译模块采用深度学习机制对用户输入进行翻译。
前述的机器翻译模块包括两种形式,一种是多个机器翻译模块同时支持一种语言;第二种是不同的机器翻译模块来支持不同的语言。
前述的用户端上并不存储机器翻译模块,当需要翻译时,用户直接提交到云翻译平台上进行计算处理。
前述的机器翻译模块采用深度学习机制对用户输入进行翻译,具体为:
首先,采用Seq2Seq模型对已标注数据进行训练;所述已标注数据是源语言和目标语言的句子对;然后使用注意力机制将源语言有效投影到目标语言,同时也支持将目标语言投影到源语言。
前述的采用Seq2Seq模型对已标注数据进行训练,具体为:第一个Seq模型输入为源语言句子,通过深度模型源语言句子得到一个高维空间的向量;第二个Seq模型以第一个Seq模型输出的高维空间的向量为输入,逐渐解码目标语言句子。
前述的注意力机制是通过对目标语言的编码与源语言的词之间的相似度,得到哪些源语言需要得到更多的关注,得到更多关注的源语言的词会在编码过程中加以更大的权重。
前述的对大量不同语言提取特征训练一个语言分类器,通过语言分类器判断用户输入的文本属于哪个语言。
前述的如果一到两次交互以后用户无法进行沟通,则翻译另一方。
前述的如果多方在对话,则都翻译成英语,同时,在界面上提供选项查看原始输入,并且在界面上提供选项翻译成用户自己的语言。
本发明所达到的有益效果:
本发明针对跨语言跨国家游戏进行,提升跨语言跨国家游戏的可用性。
具体实施方式
下面对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的基于深度神经网络的游戏翻译系统包括云翻译平台,所有用户均通过用户端与云翻译平台进行相互通信。云翻译平台上布置机器翻译模块,实现对用户输入进行翻译,用户端上并不存储机器翻译模块,当需要翻译时,用户直接提交到云翻译平台上进行计算处理。云翻译平台使用并行机制,并同时部署多个机器翻译模块,以满足不同用户的需求。机器翻译模块包括两种形式,一种是多个机器翻译模块可以同时支持一种语言,处理高并发需求;第二种是不同的机器翻译模块来支持不同的语言。
机器翻译模块采用深度学习机制对用户输入进行翻译。具体为,首先,使用Seq2Seq模型对已标注数据进行训练;已标注数据是源语言(用户输入语言)和目标语言(需要翻译成的语言)的句子对。Seq2Seq是一种深度学习模型。第一个Seq模型输入为源语言句子,通过深度模型源语言句子得到一个高维空间的向量。第二个Seq模型以第一个Seq模型输出的高维空间的向量为输入,逐渐解码目标语言句子。同时,使用注意力机制将源语言有效投影到目标语言(即需要翻译成的语言),同时也支持将目标语言投影到源语言。注意力机制是通过对目标语言的编码(高维空间的向量)与源语言的词之间的相似度得到哪些源语言需要得到更多的关注,得到更多关注的源语言的词会在编码过程中加以更大的权重。在这个模型中,我们不同于已有的机器翻译,使用了基于知识蒸馏的方法,把复杂的模型简单化。知识蒸馏是通过一个简单的语言模型来模拟一个复杂的语言模型的方法。通常来说,我们已经有了一个训练好的复杂语言模型,通过以这个模型输出的结果作为训练集,可以训练一个更加简单的语言模型,从而得到与复杂模型较为相似的输出结果。
在进行社交时,用户在用户端(手机、网页)进行输入,然后提交到云翻译平台,如果双方使用的是不同语言,则云翻译平台给其中一方进行翻译,通常会选择一个更为常用的语言进行翻译。通过语言分类器判断语言,通过对大量不同语言提取特征的方法训练一个语言分类器。对一个新的语言,可以使用该分类器判断输入的文本属于哪个语言。
如果一到两次交互以后用户无法进行沟通,则翻译另一方。云平台可以识别双方的语言,因此如果用户无法沟通,有可能是其中一方无法理解机器翻译的结果,那么我们可以根据云平台对另一方语言的判断,来把另外一方语言翻译过去,以增大双方可以相互理解的可能。如果多方在对话,则都翻译成英语,同时,在界面上提供选项看原始输入。在界面上,提供给每一个用户的语言都不同,翻译的结果尽量以用户能理解的语言为准。例如,用户说的是日语,那么把其他用户跟他说话的文本都翻译成日语。但是如果一个聊天会话有多方加入,并且使用不同语言,我们优先在每个用户界面上使用英语,同时提供用户选项可以翻译成他自己的语言。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (9)

1.基于深度神经网络的游戏翻译系统,其特征在于,包括云翻译平台,所有用户均通过用户端与云翻译平台进行相互通信;所述云翻译平台上布置若干个机器翻译模块,实现对用户输入进行翻译;所述机器翻译模块采用深度学习机制对用户输入进行翻译。
2.根据权利要求1所述的基于深度神经网络的游戏翻译系统,其特征在于,所述机器翻译模块包括两种形式,一种是多个机器翻译模块同时支持一种语言;第二种是不同的机器翻译模块来支持不同的语言。
3.根据权利要求1所述的基于深度神经网络的游戏翻译系统,其特征在于,所述用户端上并不存储机器翻译模块,当需要翻译时,用户直接提交到云翻译平台上进行计算处理。
4.根据权利要求1所述的基于深度神经网络的游戏翻译系统,其特征在于,所述机器翻译模块采用深度学习机制对用户输入进行翻译,具体为:
首先,采用Seq2Seq模型对已标注数据进行训练;所述已标注数据是源语言和目标语言的句子对;然后使用注意力机制将源语言有效投影到目标语言,同时也支持将目标语言投影到源语言。
5.根据权利要求4所述的基于深度神经网络的游戏翻译系统,其特征在于,所述采用Seq2Seq模型对已标注数据进行训练,具体为:第一个Seq模型输入为源语言句子,通过深度模型源语言句子得到一个高维空间的向量;第二个Seq模型以第一个Seq模型输出的高维空间的向量为输入,逐渐解码目标语言句子。
6.根据权利要求4所述的基于深度神经网络的游戏翻译系统,其特征在于,所述注意力机制是通过对目标语言的编码与源语言的词之间的相似度,得到哪些源语言需要得到更多的关注,得到更多关注的源语言的词会在编码过程中加以更大的权重。
7.根据权利要求1所述的基于深度神经网络的游戏翻译系统,其特征在于,对大量不同语言提取特征训练一个语言分类器,通过语言分类器判断用户输入的文本属于哪个语言。
8.根据权利要求1所述的基于深度神经网络的游戏翻译系统,其特征在于,如果一到两次交互以后用户无法进行沟通,则翻译另一方。
9.根据权利要求1所述的基于深度神经网络的游戏翻译系统,其特征在于,如果多方在对话,则都翻译成英语,同时,在界面上提供选项查看原始输入,并且在界面上提供选项翻译成用户自己的语言。
CN201711091316.6A 2017-11-08 2017-11-08 基于深度神经网络的游戏翻译系统 Pending CN108090050A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711091316.6A CN108090050A (zh) 2017-11-08 2017-11-08 基于深度神经网络的游戏翻译系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711091316.6A CN108090050A (zh) 2017-11-08 2017-11-08 基于深度神经网络的游戏翻译系统

Publications (1)

Publication Number Publication Date
CN108090050A true CN108090050A (zh) 2018-05-29

Family

ID=62172052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711091316.6A Pending CN108090050A (zh) 2017-11-08 2017-11-08 基于深度神经网络的游戏翻译系统

Country Status (1)

Country Link
CN (1) CN108090050A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492231A (zh) * 2018-10-20 2019-03-19 杭州欧成网络科技有限公司 一种国际语言自动配备客服的购物系统
CN109783825A (zh) * 2019-01-07 2019-05-21 四川大学 一种基于神经网络的古文翻译方法
CN110543644A (zh) * 2019-09-04 2019-12-06 语联网(武汉)信息技术有限公司 包含术语翻译的机器翻译方法、装置与电子设备
CN110609877A (zh) * 2018-06-14 2019-12-24 百度在线网络技术(北京)有限公司 一种图片采集的方法、装置、设备和计算机存储介质
CN110765784A (zh) * 2019-09-12 2020-02-07 内蒙古工业大学 一种基于对偶学习的蒙汉机器翻译方法
CN111414767A (zh) * 2019-01-04 2020-07-14 永德利硅橡胶科技(深圳)有限公司 游戏设备的语言即时传译方法及相关产品
CN111950302A (zh) * 2020-08-20 2020-11-17 上海携旅信息技术有限公司 基于知识蒸馏的机器翻译模型训练方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1866934A (zh) * 2005-05-20 2006-11-22 腾讯科技(深圳)有限公司 一种即时通讯服务的实现方法及其系统
CN102780644A (zh) * 2012-03-07 2012-11-14 史超 不同语言用户在互联网即时通信上无障碍即时沟通的方法
CN103298529A (zh) * 2010-11-17 2013-09-11 斯蒂尔塞瑞斯有限责任公司 用于管理视频游戏中的用户输入的装置和方法
CN104794111A (zh) * 2015-04-15 2015-07-22 广州华多网络科技有限公司 交互方法和装置
CN107066453A (zh) * 2017-01-17 2017-08-18 881飞号通讯有限公司 一种网络语音通信中实现多语言互译的方法
CN107133224A (zh) * 2017-04-25 2017-09-05 中国人民大学 一种基于主题词的语言生成方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1866934A (zh) * 2005-05-20 2006-11-22 腾讯科技(深圳)有限公司 一种即时通讯服务的实现方法及其系统
CN103298529A (zh) * 2010-11-17 2013-09-11 斯蒂尔塞瑞斯有限责任公司 用于管理视频游戏中的用户输入的装置和方法
CN102780644A (zh) * 2012-03-07 2012-11-14 史超 不同语言用户在互联网即时通信上无障碍即时沟通的方法
CN104794111A (zh) * 2015-04-15 2015-07-22 广州华多网络科技有限公司 交互方法和装置
CN107066453A (zh) * 2017-01-17 2017-08-18 881飞号通讯有限公司 一种网络语音通信中实现多语言互译的方法
CN107133224A (zh) * 2017-04-25 2017-09-05 中国人民大学 一种基于主题词的语言生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OCEANPVG: ""基于深度学习的维汉口语机器翻译研究"", 《HTTP://WWW.DOC88.COM/P-2186355938909.HTML》 *
甘鹏辉: ""谷歌神经翻译系统在译文质量上的突破与瓶颈"", 《海外英语》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609877A (zh) * 2018-06-14 2019-12-24 百度在线网络技术(北京)有限公司 一种图片采集的方法、装置、设备和计算机存储介质
CN110609877B (zh) * 2018-06-14 2023-04-18 百度在线网络技术(北京)有限公司 一种图片采集的方法、装置、设备和计算机存储介质
CN109492231A (zh) * 2018-10-20 2019-03-19 杭州欧成网络科技有限公司 一种国际语言自动配备客服的购物系统
CN111414767A (zh) * 2019-01-04 2020-07-14 永德利硅橡胶科技(深圳)有限公司 游戏设备的语言即时传译方法及相关产品
CN109783825A (zh) * 2019-01-07 2019-05-21 四川大学 一种基于神经网络的古文翻译方法
CN109783825B (zh) * 2019-01-07 2020-04-28 四川大学 一种基于神经网络的古文翻译方法
CN110543644A (zh) * 2019-09-04 2019-12-06 语联网(武汉)信息技术有限公司 包含术语翻译的机器翻译方法、装置与电子设备
CN110543644B (zh) * 2019-09-04 2023-08-29 语联网(武汉)信息技术有限公司 包含术语翻译的机器翻译方法、装置与电子设备
CN110765784A (zh) * 2019-09-12 2020-02-07 内蒙古工业大学 一种基于对偶学习的蒙汉机器翻译方法
CN111950302A (zh) * 2020-08-20 2020-11-17 上海携旅信息技术有限公司 基于知识蒸馏的机器翻译模型训练方法、装置、设备及介质
CN111950302B (zh) * 2020-08-20 2023-11-10 上海携旅信息技术有限公司 基于知识蒸馏的机器翻译模型训练方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108090050A (zh) 基于深度神经网络的游戏翻译系统
CN103853703B (zh) 一种信息处理方法及电子设备
CN106202010B (zh) 基于深度神经网络构建法律文本语法树的方法和装置
CN110930980B (zh) 一种中英文混合语音的声学识别方法及系统
CN108463815A (zh) 聊天数据的命名实体识别
CN110111780A (zh) 数据处理方法和服务器
CN105117391A (zh) 翻译语言
CN108228574B (zh) 文本翻译处理方法及装置
CN110517668B (zh) 一种中英文混合语音识别系统及方法
CN108710704A (zh) 对话状态的确定方法、装置、电子设备及存储介质
CN111383631A (zh) 一种语音交互方法、装置及系统
CN101308512B (zh) 一种基于网页的互译翻译对抽取方法及装置
CN110175323A (zh) 消息摘要的生成方法和装置
Bansal et al. Code-switching patterns can be an effective route to improve performance of downstream NLP applications: A case study of humour, sarcasm and hate speech detection
Okur et al. Data augmentation with paraphrase generation and entity extraction for multimodal dialogue system
CN115309877A (zh) 对话生成方法、对话模型训练方法及装置
TW202013145A (zh) 互動回應方法及其相關電腦系統
CN109325178A (zh) 用于处理信息的方法和装置
CN112560510A (zh) 翻译模型训练方法、装置、设备及存储介质
CN105920839A (zh) 网络游戏对话在线编辑系统
CN108268443A (zh) 确定话题点转移以及获取回复文本的方法、装置
CN107623620B (zh) 随机性交互数据的处理方法、网络服务器及智能对话系统
CN115860013B (zh) 对话消息处理方法、装置、系统、设备及介质
CN107729983A (zh) 一种利用机器视觉实现人机对弈的方法、装置及电子设备
CN112699231A (zh) 基于滑窗相关性计算和Copy机制的工单摘要总结方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180529