CN113743131A - 电子邮件的翻译方法、装置和计算机设备 - Google Patents

电子邮件的翻译方法、装置和计算机设备 Download PDF

Info

Publication number
CN113743131A
CN113743131A CN202010470528.0A CN202010470528A CN113743131A CN 113743131 A CN113743131 A CN 113743131A CN 202010470528 A CN202010470528 A CN 202010470528A CN 113743131 A CN113743131 A CN 113743131A
Authority
CN
China
Prior art keywords
mail
text
translation
markup language
language data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010470528.0A
Other languages
English (en)
Inventor
刘让琼
孟麟
周国强
谭悦伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010470528.0A priority Critical patent/CN113743131A/zh
Publication of CN113743131A publication Critical patent/CN113743131A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/42Mailbox-related aspects, e.g. synchronisation of mailboxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种电子邮件的翻译方法、装置和计算机设备。该方法包括:响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本;通过分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据;解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。采用本方法能够简化用户的操作步骤。

Description

电子邮件的翻译方法、装置和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种电子邮件的翻译方法、装置和计算机设备。
背景技术
在接收或者撰写外文邮件时,用户通常需要复制邮件,再粘贴到翻译软件上进行翻译,得到翻译结果,再在邮件软件上粘贴翻译结果。然而,粘贴后的翻译结果的格式通常会改变,用户需要对格式重新调整,导致操作繁琐。
发明内容
基于此,有必要针对上述技术问题,提供一种能够简化用户操作步骤的电子邮件的翻译方法、装置、计算机设备和存储介质。
一种电子邮件的翻译方法,所述方法包括:
响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,翻译所述邮件文本获得翻译内容,将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,所述邮件内容包括所述翻译内容。
一种电子邮件的翻译方法,所述方法包括:
接收终端发送的电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,并翻译所述邮件文本获得翻译内容;
将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
向所述终端发送所述重组标记语言数据,使得所述终端解析所述重组标记语言数据并显示解析得到的邮件内容;所述邮件内容包括所述翻译内容。
一种电子邮件的翻译装置,所述装置包括:
获取模块,用于响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
邮件文本翻译模块,用于通过所述分区标签从所述标记语言数据提取所述邮件文本,翻译所述邮件文本获得翻译内容,将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
显示模块,用于解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,所述邮件内容包括所述翻译内容。
在其中一个实施例中,显示模块还用于在所述邮件界面中的原文显示区域,显示电子邮件的邮件内容;解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面中的译文显示区域显示。
在其中一个实施例中,电子邮件的翻译装置还包括译文修改模块,译文修改模块用于响应于在所述邮件界面所触发的译文修改操作,将所述译文显示区域置为编辑状态;根据对所述译文显示区域的编辑操作,修改所述翻译内容。
在其中一个实施例中,对所述邮件文本的翻译是通过服务器上的翻译模型进行的。电子邮件的翻译装置还包括上报模块,上报模块用于将修改后的翻译内容上报至服务器,使得所述服务器基于翻译前的邮件内容和所述修改后的翻译内容更新所述翻译模型。
在其中一个实施例中,获取模块,用于响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当所述邮件界面中原文显示区域的邮件内容变化时,获取所述原文显示区域所对应的电子邮件的标记语言数据;显示模块用于将每次接收到的重组标记语言数据进行解析,并将每次解析获得的所述电子邮件的邮件内容在所述邮件界面的译文显示区域中更新显示。
在其中一个实施例中,获取模块,用于响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器;每当循环定时器计时到预设时长时,检测所述原文显示区域中的邮件内容;当检测到所述原文显示区域中的邮件内容变化时,获取所述原文显示区域所对应的电子邮件的标记语言数据。
在其中一个实施例中,电子邮件的翻译装置还包括译文替换模块,译文替换模块用于响应于在所述邮件界面触发的邮件内容替换操作,将所述原文显示区域中的邮件内容替换为所述译文显示区域中的邮件内容;关闭所述译文显示区域。
在其中一个实施例中,该电子邮件的翻译装置还包括目标文本发送模块和翻译文本接收模块;获取模块用于响应于在所述邮件界面中触发的文本选取操作,获取目标文本;所述目标文本是所述邮件文本的一部分;所述目标文本发送模块用于响应于在所述邮件界面触发的局部文本翻译操作,向服务器发送所述目标文本;翻译文本接收模块用于接收所述服务器发送的对于所述目标文本的翻译文本;显示模块用于显示所述翻译文本。
在其中一个实施例中,显示模块用于获取所述目标文本相当于所述邮件界面的坐标;确定所述翻译文本的文本尺寸;当所述文本尺寸在悬浮窗所支持的尺寸范围内时,根据所述坐标和所述文本尺寸在所述邮件界面显示悬浮窗,并在所述悬浮窗显示所述翻译文本;当所述文本尺寸大于所述尺寸范围的最大尺寸时,根据所述坐标和所述最大尺寸在所述邮件界面显示悬浮窗,调整所述翻译文本的排布方式,并在所述悬浮窗显示调整后的翻译文本;当所述文本尺寸小于所述尺寸范围的最小尺寸时,根据所述坐标和所述最小尺寸在所述邮件界面显示悬浮窗,并在所述悬浮窗显示所述翻译文本。
在其中一个实施例中,获取模块用于获取默认语种;检测所述电子邮件的邮件文本的原始语种;当所述原始语种与所述默认语种不匹配时,显示翻译提示工具栏;响应于在所述翻译提示工具栏触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据。
在其中一个实施例中,获取模块用于获取所述邮件文本中字符所对应的字符编码;在所述字符编码中,确定位于预设语种的字符编码区间的字符编码的比例;当所述比例大于预设比例时,确定所述电子邮件的邮件文本的原始语种为所述预设语种。
在一个实施例中,邮件文本翻译模块用于基于所述标记语言数据中的图片标签获取邮件图片;从所述邮件图片识别出识别文本和相应的文本格式;翻译所述识别文本,获得识别文本译文;将所述标记语言数据中的邮件文本替换为所述翻译内容,并将所述图片标签对应的标记语言替换为与所述识别文本译文和所述文本格式相应的标记语言,生成重组标记语言数据。
一种电子邮件的翻译装置,所述装置包括:
标记语言数据接收模块,用于接收终端发送的电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
提取模块,用于通过所述分区标签从所述标记语言数据提取所述邮件文本,并翻译所述邮件文本获得翻译内容;
替换模块,用于将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
重组标记语言数据发送模块,用于向所述终端发送所述重组标记语言数据,使得所述终端解析所述重组标记语言数据并显示解析得到的邮件内容;所述邮件内容包括所述翻译内容。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,翻译所述邮件文本获得翻译内容,将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,所述邮件内容包括所述翻译内容。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收终端发送的电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,并翻译所述邮件文本获得翻译内容;
将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
向所述终端发送所述重组标记语言数据,使得所述终端解析所述重组标记语言数据并显示解析得到的邮件内容;所述邮件内容包括所述翻译内容。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,翻译所述邮件文本获得翻译内容,将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,所述邮件内容包括所述翻译内容。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收终端发送的电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,并翻译所述邮件文本获得翻译内容;
将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
向所述终端发送所述重组标记语言数据,使得所述终端解析所述重组标记语言数据并显示解析得到的邮件内容;所述邮件内容包括所述翻译内容。
上述电子邮件的翻译方法、装置、计算机设备和存储介质,响应于邮件文本翻译操作,利用标记语言数据的特性,通过分区标签从标记语言数据中提取邮件文本,并翻译得到翻译内容,将标记语言数据中的邮件文本替换为翻译内容,即仅对邮件文本进行翻译,而标记语言数据中其他内容不发生变化,即重组标记语言数据中解析出来的邮件内容与原文的邮件内容相比,仅文本部分发生变化,因此能够使翻译后的邮件内容不丢失原文样式,简化了用户的操作步骤,在电子邮件程序中即可实现翻译,提高用户撰写或者预览外文邮件的效率。
附图说明
图1为一个实施例中电子邮件的翻译方法的应用环境图;
图2为一个实施例中电子邮件的翻译方法的流程示意图;
图3为一个实施例中邮件内容的示意图;
图4(a)为一个实施例中邮件界面的界面示意图;
图4(b)为一个实施例中翻译对照的界面示意图;
图5(a)为一个实施例中触发实时翻译的界面示意图;
图5(b)为一个实施例中实时翻译的界面示意图;
图6为一个实施例中包含译文修改控件的邮件界面示意图;
图7为一个实施例中译文替换后的邮件界面示意图;
图8(a)为一个实施例中取词翻译的界面示意图;
图8(b)为一个实施例中包含取词翻译文本的界面示意图;
图9为一个实施例中显示翻译文本的流程示意图;
图10为一个实施例中包含翻译提示工具栏的界面示意图;
图11为另一个实施例中包含翻译提示工具栏的界面示意图;
图12(a)为一个实施例中翻译前手机端的邮件界面示意图;
图12(b)为一个实施例中翻译后的手机端的邮件界面示意图;
图13为一个实施例中邮件的翻译方法的系统架构图;
图14为另一个实施例中电子邮件的翻译方法的流程示意图;
图15为一个实施例中电子邮件的翻译装置的结构框图;
图16为一个实施例中电子邮件的翻译装置的结构框图;
图17为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的电子邮件的翻译方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端102可用于获取并显示各种电子邮件数据等,而服务器104用于对邮件文本进行翻译。本申请提供的电子邮件的翻译方法可应用于电子邮件程序中,电子邮件程序可应用于终端102。
在一个实施例中,如图2所示,提供了一种电子邮件的翻译方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤202,响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本。
其中,电子邮件是一种用电子手段提供信息交换的通信方式。电子邮件的邮件界面可用于显示电子邮件的邮件内容。电子邮件的邮件界面上可显示功能栏、邮件列表、菜单栏等不限于此。邮件文本翻译操作用于翻译电子邮件的邮件文本。邮件文本翻译操作可包括邮件全文翻译操作、邮件文本实时翻译操作等不限于此。邮件全文翻译操作用于在不改变邮件格式的前提下,对整一封邮件文本进行翻译。邮件文本实时翻译操作用于在撰写邮件时,根据用户输入的内容进行实时动态翻译。电子邮件的标记语言数据具体可以是电子邮件的HTML(Hyper Text Markup Language,超级文本标记语言)数据、电子邮件的XML(Extensible Markup Language,可扩展标记语言)数据或电子邮件的XHTML(ExtensibleHyper Text Markup Language,可延伸超文件标记语言)等不限于此。分区标签用于标记邮件文本,将邮件文本与电子邮件的其他内容区分开。在HTML数据中,分区标签具体可以是<div>标签。邮件文本是指不携带格式的文本,即纯文本。
具体地,在电子邮件的邮件界面的功能栏中可显示邮件文本翻译控件。例如全文翻译控件、实时翻译控件等不限于此。终端响应于在电子邮件的邮件界面上所触发的邮件全文翻译操作,获取电子邮件的标记语言数据。或者,终端响应于在电子邮件的邮件界面上所触发的邮件实时翻译操作,获取电子邮件的标记语言数据。
步骤204,通分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据。
其中,翻译内容是指对邮件文本进行翻译后得到的翻译内容。例如,邮件文本为英文,翻译后的翻译内容为中文。电子邮件的标记语言数据中包括邮件文本、分区标签以及文本格式等数据。重组标记语言数据中包括翻译内容、该分区标签以及该文本格式等数据。
具体地,终端可在本地实现邮件文本的翻译。终端通过分区标签从标记语言数据中提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为该翻译内容,得到重组标记语言数据。
本实施例中,由于终端计算资源有限,因此将翻译的工作交由计算能力强大的服务器来完成。终端向服务器发送标记语言数据,以使服务器通过分区标签从标记语言数据中提取邮件文本,服务器翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,则形成重组标记语言数据。服务器向终端发送重组标记语言数据。终端接收服务器返回的重组标记语言数据。
例如,如图3所示,为一个实施例中邮件内容的示意图。以下是电子邮件的标记语言数据:
<div><br></div><div>你好</div><hr id="FMSigSeperator"style="WIDTH:210px;HEIGHT:1px"color="#b5c4df"size="1"align="left"><div><span id="_FoxFROMNAME"><div style="MARGIN:10px;FONT-FAMILY:verdana;FONT-SIZE:10pt"><div>curtainliu(刘让琼)</div></div></span></div>
其中,WIDTH:210px;HEIGHT:1px是指宽度为210个像素点,高度为1个像素点,color是指颜色,size是指尺寸,align是指排列,align="left"即靠左排列。MARGIN是指空白,空白处有10个像素点。FONT-FAMILY是指字体样式,verdana是字体样式名称。FONT-SIZE是指字体大小。
本实施例中,邮件文本会被放置在<div></div>标签对中,<style>表示当前标签的格式。在翻译的时候,只会提取<div></div>标签中的数据来进行翻译,<style>标签中的内容不会被提取出来进行翻译。从而可以做到只翻译邮件文本的同时不会丢失原文的样式。正如截图里所展现的“以上翻译结果来自微信”;Foxmail的邮件翻译是由多个部门共同联调完成的。
步骤206,解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。
其中,邮件内容包括翻译内容,还包括翻译内容所对应的格式。且翻译内容所对应的格式即为邮件文本所对应的格式。邮件文本所对应的文本格式以及翻译内容的格式具体均可以是字体大小、是否增加下划线、是否加粗、是否斜体、是否增加表情等不限于此。
具体地,终端解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。例如,终端可将解析获得的邮件内容在原文显示区域上显示。或者终端可新建一个译文显示区域,将解析获得的邮件内容在译文显示区域进行显示。或者,终端可再新建一个邮件界面,在新建的邮件界面上的原文显示区域显示原电子邮件内容,在译文显示区域显示解析获得的邮件内容。
上述电子邮件的翻译方法,响应于邮件文本翻译操作,利用标记语言数据的特性,通过分区标签从标记语言数据中提取邮件文本,并翻译得到翻译内容,将标记语言数据中的邮件文本替换为翻译内容,即仅对邮件文本进行翻译,而标记语言数据中其他内容不发生变化,即重组标记语言数据中解析出来的邮件内容与原文的邮件内容相比,仅文本部分发生变化,因此能够使翻译后的邮件内容不丢失原文样式,简化了用户的操作步骤,在电子邮件程序中即可实现翻译,提高用户撰写或者预览外文邮件的效率。
在一个实施例中,在响应于在电子邮件的邮件界面所触发的邮件文本翻译操作之前,该方法还包括:在邮件界面中的原文显示区域,显示电子邮件的邮件内容。解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,包括:解析重组标记语言数据,并将解析获得的邮件内容在邮件界面中的译文显示区域显示。
其中,原文显示区域用于显示电子邮件的原邮件内容。
具体地,在邮件界面中的原文显示区域,终端显示电子邮件的原邮件内容。终端解析重组标记语言数据,将解析获得的邮件内容在邮件界面中的译文显示区域显示。
如图4(a)所示,为一个实施例中邮件界面的界面示意图。图4(b)为一个实施例中翻译对照的界面示意图。图4(a)和图4(b)均为PC(Personal Computer,个人计算机)端上的界面示意图。图4(a)即为一个邮件界面400,包括原文显示区域402。具体地,图4(a)可为邮件预览界面。在原文显示区域402显示电子邮件的邮件内容。获取在邮件界面上通过鼠标右键触发的翻译全文操作,新建如图4(b)中的邮件界面410。其中,412为原文显示区域,414为译文显示区域。图4(b)中原文显示区域412中的邮件内容与图4(a)的原文显示区域402中的内容相同。终端解析重组标记语言数据并将解析获得的邮件内容在邮件界面410的译文显示区域414中显示。具体地,原文显示区域412和译文显示区域414的字体字号大小、加粗等字段格式、图片的排布等方式均未发生变化。并且,电子邮件的标题与电子邮件的正文部分均会被服务器翻译。如图中的“Introduction”翻译为“介绍”。并且,图4(b)中的图片位置也不发生改变。在原文显示区域中,图片在“BBBBBB Public Interest Foundation”之后;在译文显示区域中,该图片则显示在“BBBBBB公益基金会捐赠给非洲的医疗用品的一部分”之后。
如图5(a)所示,为一个实施例中触发实时翻译的界面示意图。图5(b)为一个实施例中实时翻译的界面示意图。图5(a)和图5(b)均为PC(Personal Computer,个人计算机)端上的界面示意图。图5(b)中包括邮件界面500,包括原文显示区域502。具体地,图5(a)可为邮件编辑界面。在原文显示区域502显示电子邮件的邮件内容。获取在邮件界面上的工具栏通过鼠标左键触发的实时翻译操作,如图5(b)所示,终端在邮件界面500中新建译文显示区域504。图5(b)中原文显示区域502中的邮件内容与图5(a)的原文显示区域502中的内容相同。终端解析重组标记语言数据并将解析获得的邮件内容在邮件界面500的译文显示区域504中显示。具体地,原文显示区域502和译文显示区域504的字体字号大小、加粗等字段格式、图片的排布等方式均未发生变化。
上述电子邮件的翻译方法,在邮件界面中的原文显示区域,显示电子邮件的邮件内容,解析重组标记语言数据,并将解析获得的邮件内容在邮件界面中的译文显示区域显示,能够在界面上更加直观地同时展示原文和译文。
在一个实施例中,该电子邮件的翻译方法还包括:响应于在邮件界面所触发的译文修改操作,将译文显示区域置为编辑状态;根据对译文显示区域的编辑操作,修改翻译内容。
其中,译文修改操作用于在译文显示区域中修改解析获得的邮件内容。编辑状态即为可修改状态。对译文显示区域的编辑操作即在译文显示区域发生的编辑操作,该编辑操作可以是替换某个字符、增加字符、删除字符等不限于此。
具体地,终端响应于在邮件界面所触发的译文修改操作,将译文显示区域置为编辑状态。终端将原文显示区域置为不可编辑状态。即当触发了译文修改操作之后,原文显示区域不能被编辑。终端还可在第一工具栏显示“当前为修改译文状态”等字样,并且关闭“译文修改”控件。根据对译文显示区域的编辑操作,终端修改翻译内容。
如图6所示,为一个实施例中包含译文修改控件的邮件界面示意图。终端可响应于图5(b)中的对修改译文控件的触发操作,将译文显示区域置为编辑状态。根据对译文显示区域的编辑操作,修改翻译内容。在图6中的第一工具栏显示“当前为修改译文状态”等字样,并且关闭“译文修改”控件,保留“替换正文”控件和“返回”控件。
或者,终端可响应于图4(b)中的“纠错译文”,新建译文修改界面,根据对译文修改界面的编辑操作,修改翻译内容。
上述电子邮件的翻译方法,响应于在邮件界面所触发的译文修改操作,将译文显示区域置为编辑状态,根据对译文显示区域的编辑操作,修改翻译内容,提供了译文修改功能,能在译文不符合预期要求时对译文进行修改,提高替换后的译文的正确性。
在一个实施例中,对邮件文本的翻译是通过服务器上的翻译模型进行的。该电子邮件的翻译方法还包括:将修改后的翻译内容上报至服务器,使得服务器基于翻译前的邮件内容和修改后的翻译内容更新翻译模型。
其中,翻译模型是根据文本样本和译文样本进行训练得到的。翻译模型具体可以是CNN(Convolutional Neural Networks,卷积神经网络)模型、BERT(BidirectionalEncoder Representations from Transformers,双向编码器表征量)模型、LSTM(LongShort-Term Memory,长短时记忆网络)模型等不限于此。
具体地,终端将修改后的翻译内容上报服务器,使得服务器基于翻译前的邮件内容和修改后的翻译内容,对原翻译模型进行再训练,从而更新翻译模型。
上述电子邮件的翻译方法,将修改后的翻译内容上报至服务器,使得服务器基于翻译前的邮件内容和修改后的翻译内容更新翻译模型,能够获取更多的样本数据对翻译模型进行训练,从而提高翻译模型的翻译准确性。
在一个实施例中,响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取电子邮件的标记语言数据,包括:响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据。
解析重组标记语言数据,并将解析获得的电子邮件的邮件内容在邮件界面上显示,包括:将每次接收到的重组标记语言数据进行解析,并将每次解析获得的电子邮件的邮件内容在邮件界面的译文显示区域中更新显示。
具体地,邮件文本实时翻译操作用于使邮件产生“此改彼变”的翻译效果。响应于在电子邮件的邮件编辑界面所触发的邮件文本实时翻译操作,终端检测邮件界面中原文显示区域的邮件内容是否发生变化。当终端检测到邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据。即,只要邮件界面中原文显示区域的邮件内容发生变化,则终端需要获取原文显示区域所对应的电子邮件的标记语言数据,该标记语言数据包含原文显示区域所对应的电子邮件的邮件文本。终端每获取一次原文显示区域所对应的电子邮件的标记语言数据,就向服务器发送一次标记语言数据,以使服务器通过分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据。服务器向终端发送重组标记语言数据。
终端将每次接收到的重组标记语言数据进行解析,并将每次解析获得的电子邮件的邮件内容、在邮件界面的译文显示区域中更新显示。例如,当原文显示区域中的邮件内容为“hello”时,终端向服务器发送包含“hello”的标记语言数据,译文显示区域中的邮件内容为“你好”。当原文显示区域中的邮件内容为“hello,nice to see you”时,终端向服务器发送包含“hello,nice to see you”的标记语言数据,译文显示区域中的邮件内容为“你好,很高兴见到你”。
上述电子邮件的翻译方法,响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据,将每次接收到的重组标记语言数据进行解析,并将每次解析获得的电子邮件的邮件内容在邮件界面的译文显示区域中更新显示,能够达到实时翻译的效果,提高用户体验,并且当邮件界面中原文显示区域的邮件发生变化时,才获取原文显示区域所对应的电子邮件的标记语言数据,能够减少网络负担和客户端计算负担。
在一个实施例中,响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据,包括:响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器;每当循环定时器计时到预设时长时,检测原文显示区域中的邮件内容;当检测到原文显示区域中的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据。
其中,循环定时器用于重复执行定时操作。预设时长即循环定时器每次定时的时长。例如循环计时器可每次计时10毫秒、50毫秒、2秒等不限于此。
具体地,终端响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器。循环定时器开始定时,每当循环定时器计时达到预设时长时,终端检测原文显示区域中的邮件内容。当终端检测到原文显示区域中的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据。例如,当用户打开邮件编辑界面,且触发了邮件文本实时翻译操作。那么响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,终端触发循环定时器。每隔1秒检测原文显示区域中的邮件内容是否发生变化。例如该变化可以是字体格式发生变化、字体颜色发生变化、邮件文本发生变化等不限于此。具体可以是当检测到原文显示区域中的邮件文本变化时,则获取原文显示区域所对应的电子邮件的标记语言数据。
上述电子邮件的翻译方法,响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器,每当循环定时器计时到预设时长时,检测原文显示区域中的邮件内容,当检测到原文显示区域中的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据,能够通过循环定时器和邮件内容的检测,达到实时翻译的效果,并且当既触发了循环定时器,且邮件界面中原文显示区域的邮件发生变化时,才获取原文显示区域所对应的电子邮件的标记语言数据,能够减少网络负担和客户端计算负担。
在一个实施例中,该电子邮件的翻译方法还包括:响应于在邮件界面触发的邮件内容替换操作,将原文显示区域中的邮件内容替换为译文显示区域中的邮件内容;关闭译文显示区域。
具体地,在邮件界面触发了邮件内容替换操作,响应于在邮件界面触发的邮件内容替换操作,将原文显示区域中的邮件内容替换为译文显示区域中的邮件内容,并关闭译文显示区域。即将原文显示区域所对应的标记语言数据,替换为译文显示区域的标记语言数据,并关闭译文显示区域。因此,仅保留一个原文显示区域。
如图5(b)所示,邮件界面左边是原文显示区域,右边是译文显示区域。该两个区域为独立的浏览窗口,类似于平时用户浏览网页时打开了两个浏览器平铺在桌面上。因此原文翻译之后,服务器返回的重组标记语言数据会在译文显示区域这个窗口进行渲染显示。而响应于在邮件界面触发的邮件内容替换操作之后,如图7所示,为一个实施例中译文替换后的邮件界面示意图。由图7可见,替换后仅包含译文显示区域702中的邮件内容,原译文显示区域已被关闭。
上述电子邮件的翻译方法,响应于在邮件界面触发的邮件内容替换操作,将原文显示区域中的邮件内容替换为译文显示区域中的邮件内容,关闭译文显示区域,则能够实现自动将译文显示区域中的邮件内容显示在原文显示区域,并且关闭译文显示区域,能够使得操作更加简便。
在一个实施例中,该电子邮件的翻译方法还包括:响应于在邮件界面中触发的文本选取操作,获取目标文本;目标文本是邮件文本的一部分;响应于在邮件界面触发的局部文本翻译操作,向服务器发送目标文本;接收服务器发送的对于目标文本的翻译文本;显示翻译文本。
其中,文本选取操作是指从邮件文本中选取一部分邮件文本的操作。目标文本是邮件文本的是至少一部分。目标文本也可以是邮件文本的全部。例如目标文本可以仅仅是一个字、一个词、一个句子等不限于此。局部文本翻译操作是指仅针对选取的目标文本所做的翻译操作。
具体地,在邮件界面中通过鼠标左键选取目标文本,获取目标文本。通过鼠标右键触发与目标文本所对应的菜单栏,在邮件界面上的该菜单栏触发局部文本翻译操作,向服务器发送目标文本。终端接收服务器发送的对于目标文本的翻译文本,并显示该翻译文本。终端可以通过悬浮窗的方式显示该翻译文本,也可以通过新建译文显示区域显示该翻译文本等。
图8(a)为一个实施例中取词翻译的界面示意图。图8(b)为一个实施例中包含取词翻译文本的界面示意图。如图8(a)所示,响应于在邮件界面中通过鼠标左键触发的文本选取操作,获取目标文本China supports Africa in fighting the epidemic,目标文本是邮件文本的一部分。通过鼠标右键触发菜单栏。其中,菜单栏中可以包括复制操作、全选操作、添加到记事操作、翻译操作、翻译全文操作。图中的翻译操作即为局部文本翻译操作。终端响应于在邮件界面触发的局部文本翻译操作,向服务器发送目标文本。如图8(b)所示,终端接收服务器发送的对于该目标文本的翻译文本“中国支持非洲抗击疫情”,并在悬浮窗显示该翻译文本。
上述电子邮件的翻译方法,响应于在邮件界面中触发的文本选取操作,获取目标文本,目标文本是邮件文本的一部分,响应于在邮件界面触发的局部文本翻译操作,向服务器发送目标文本,接收服务器发送的对于目标文本的翻译文本,显示翻译文本,一般在选词翻译的场景中,不需要展示原文格式,例如加粗、字体颜色等,那么发送目标文本,能够提高获取翻译文本的效率。
在一个实施例中,如图9所示,为一个实施例中显示翻译文本的流程示意图,包括:
步骤902,获取目标文本相当于邮件界面的坐标。
具体地,由于目标文本在邮件界面内,因此,以邮件界面的一个角为原点,邮件界面的边框分别为x轴和y轴,可以构建与该邮件界面有关的坐标系。那么目标文本相当于邮件界面即存在坐标。该坐标可以是正着渲染的目标文本的左上角的坐标、可以是该目标文本的中间坐标、可以是该目标文本的左下角的坐标、还可以是目标文本的右下角的坐标等不限于此。
步骤904,确定翻译文本的文本尺寸。
其中,文本尺寸包括文本宽度和文本高度。文本宽度和文本高度均可用像素点(PX,Pixel)的数量表示。该文本尺寸包括每个字符之间的间距。每个字符的字符尺寸可根据需求配置。
具体地,服务器对目标文本进行翻译得到翻译文本。在终端可预设翻译文本的字符大小、字符格式等不限于此。那么终端确定翻译文本的文本尺寸。例如,翻译文本为“中国支持非洲抗击疫情”,那么确定“中国支持非洲抗击疫情”的文本尺寸。
步骤906,当文本尺寸在悬浮窗所支持的尺寸范围内时,根据坐标和文本尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本。
其中,尺寸范围包括宽度范围、高度范围、由高度和宽度计算得到的面积范围中至少一种。以尺寸范围为宽度范围为例,当文本尺寸中的文本宽度,大于悬浮窗所支持的最小宽度且小于悬浮窗所支持的最大宽度时,终端以该坐标为定位点,在邮件界面显示与该文本尺寸相应大小的悬浮窗,并在悬浮窗中显示翻译文本。即当文本尺寸在悬浮窗所支持的尺寸范围内时,悬浮窗的尺寸会随着翻译文本的文本尺寸而变化。
本实施例中,悬浮窗的左上角坐标可以与目标文本的左下角坐标相同,也可以在目标文本左下角坐标的基础上,再在目标文本的坐标的y值上增加A个像素点,以使界面更加美观。文本尺寸可在原文本尺寸的基础上再增大尺寸。例如在文本尺寸下再增加10个像素等不限于此。悬浮窗的尺寸可包括页边距。例如左右的页边距为M个像素,上下的页边距为N个像素。终端还可以在悬浮窗的翻译文本下增加控件。例如纠错控件,显示“翻译结果来自微信”等标签控件。
步骤908,当文本尺寸大于尺寸范围的最大尺寸时,根据坐标和最大尺寸在邮件界面显示悬浮窗,调整翻译文本的排布方式,并在悬浮窗显示调整后的翻译文本。
其中,最大尺寸包含最大宽度、最大高度、由最小宽度和最小高度所得到的面积中至少一种。
具体地,以尺寸范围的最大尺寸为最大宽度为例,当文本尺寸大于最大宽度时,终端根据坐标和最大宽度在邮件界面上显示悬浮窗,并根据尺寸范围调整翻译文本的排布方式,在悬浮窗中显示调整后的翻译文本。
例如,当文本宽度大于悬浮窗所支持的最大宽度时,根据文本宽度和最大宽度的比值,得到翻译文本的拆分行数,根据拆分行数与翻译文本的字符高度之积,得到悬浮窗的目标高度,根据坐标、最大宽度和目标高度,确定悬浮窗的显示位置。终端调整翻译文本的排列方式,并在悬浮窗显示调整后的翻译文本。
步骤910,当文本尺寸小于尺寸范围的最小尺寸时,根据坐标和最小尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本。
其中,最小尺寸包含最小宽度最小高度,最小尺寸也可以是由最小宽度和最小高度所得到的面积。最小宽度可依据终端的设置确定。最小高度尺寸即与翻译文本的字符高度相关。
具体地,当文本尺寸小于尺寸范围的最小尺寸时,终端根据坐标和最小尺寸在邮件界面上显示以该坐标为定位点、最小宽度和最小高度的悬浮窗,并在该悬浮窗显示翻译文本。
上述电子邮件的翻译方法,获取目标文本相当于邮件界面的坐标,确定翻译文本的文本尺寸,当文本尺寸在悬浮窗所支持的尺寸范围内时,根据坐标和文本尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本,当文本尺寸大于尺寸范围的最大尺寸时,根据坐标和最大尺寸在邮件界面显示悬浮窗,调整翻译文本的排布方式,并在悬浮窗显示调整后的翻译文本,当文本尺寸小于尺寸范围的最小尺寸时,根据坐标和最小尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本,能够根据翻译文本的文本尺寸调整悬浮窗的尺寸、翻译文本的排布方式等,通过悬浮窗的方式能够更加直观地显示原文译文对照结果。
在一个实施例中,响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取电子邮件的标记语言数据包括:获取默认语种;检测电子邮件的邮件文本的原始语种;当原始语种与默认语种不匹配时,显示翻译提示工具栏;响应于在翻译提示工具栏触发的邮件文本翻译操作,获取电子邮件的标记语言数据。
其中,默认语种是指在电子邮件软件中默认设置的语种。例如默认语种可以为中文、英文等不限于此。邮件文本的原始语种可以是指浏览的邮件文本的原始语种,也可以是撰写的邮件文本的原始语种。翻译提示工具栏用于询问用户是否需要触发邮件文本翻译操作。翻译提示工具栏可包括全文翻译工具栏和实时翻译工具栏。翻译提示工具栏包括邮件文本翻译控件。原始语种与默认语种不匹配是指邮件文本中占比最高的语种与默认语种不匹配。例如,邮件文本中占比最高的语种为英语,默认语种为中文,即原始语种与默认语种不匹配。
具体地,终端获取默认语种,检测电子邮件的邮件文本的原始语种。当原始语种与默认语种不匹配时,在邮件界面上显示翻译提示工具栏,翻译提示工具栏中包括邮件文本翻译控件。响应于在翻译提示工具栏触发的邮件文本翻译操作,终端获取电子邮件的标记语言数据。例如,在进行邮件预览时,且原始语种与默认语种不匹配,显示全文翻译工具栏,响应于在翻译提示工具栏触发的邮件文本全文翻译操作,获取电子邮件的标记语言数据。或者,在进行邮件撰写时,且原始语种与默认语种不匹配,显示实时翻译工具栏;响应于在实时翻译工具栏触发的邮件文本实时翻译操作,获取电子邮件的标记语言数据。
如图10所示,为一个实施例中包含翻译提示工具栏的界面示意图。以默认语种为中文为例,且图中的原始语种为英文。那么,在进行邮件预览时,当原始语种“英文”与默认语种“中文”不匹配时,显示翻译提示工具栏1002。翻译提示工具栏中包括“立即翻译”控件,“立即翻译”控件可用于触发邮件全文翻译操作。翻译提示工具栏中还用于显示“翻译此邮件”的询问语句。响应于在翻译提示工具栏1002触发的邮件全文翻译操作,终端获取电子邮件的标记语言数据。
如图11所示,为另一个实施例中包含翻译提示工具栏的界面示意图。以默认语种为中文为例,且图中的原始语种为英文。“Nice to meet you”。当原始语种“英文”与默认语种“中文”不匹配时,显示翻译提示工具栏1102。并且在翻译提示工具栏上显示“打开实时翻译,只需输入中文,即可实时翻译为目标语言,写海外邮件更方便”。翻译提示工具栏1102包括“立即打开”控件。“立即打开”控件可用于触发邮件文本实时翻译操作。响应于在翻译提示工具栏1102触发的邮件文本实时翻译操作,终端获取电子邮件的标记语言数据。由于用户输入的邮件文本的原始语种与默认语种不相同,那么说明该用户可能需要撰写外文邮件,而外文邮件撰写的速度可能比中文邮件的撰写速度慢。那么响应于邮件文本实时翻译操作,用户不需要直接撰写外文邮件,只需要输入中文邮件文本,即可在译文显示区域显示翻译文本,提高外文邮件撰写效率。
上述电子邮件的翻译方法,获取默认语种,检测电子邮件的邮件文本的原始语种,当原始语种与默认语种不匹配时,显示翻译提示工具栏,响应于在翻译提示工具栏触发的邮件文本翻译操作,获取电子邮件的标记语言数据,能够提示用户触发翻译操作,使得用户快速触发翻译操作,提高邮件预览或者邮件撰写效率。
在一个实施例中,检测电子邮件的邮件文本的原始语种,包括:获取邮件文本中字符所对应的字符编码;在字符编码中,确定位于预设语种的字符编码区间的字符编码的比例;当比例大于预设比例时,确定电子邮件的邮件文本的原始语种为预设语种。
其中,字符编码可以是GB2312、Unicode(统一码)等不限于此。不同的字符编码区间表示不同的符号或者语种等。例如,在[4E00,9FA5]区间内的Unicode码所对应的语种是中文。预设语种可以是中文、英文、德文或法文等不限于此。中文文本的每个字均有对应的字符编码。而英文、德文、法文则是按照单词确定字符编码。预设比例在终端上预设。例如预设比例可以是60%、70%......等不限于此。终端可不对数字进行编码,也可不计入比例中。
具体地,终端获取邮件文本中每个字符所对应的字符编码。在字符编码中,终端确定位于预设语种的字符编码区间的字符编码的比例。当该比例大于预设比例例如,终端确定位于中文字符区间的字符编码,与该邮件文本的字符编码的比例。数字可不进行编码,也可不计入分母中。当该比例大于预设比例时,终端确定邮件文本的原始语种为该预设语种。以预设语种为中文为例,在字符编码中,终端确定位于中文的字符编码区间[4E00,9FA5]的字符编码的比例。当该比例大于预设比例60%时,终端确定原始语种为预设语种。
本实施例中,当该比例小于或等于预设比例时,终端确定电子邮件的邮件文本的原始语种不为预设语种。例如,该原始语种可以为英文。
上述电子邮件的翻译方法,获取邮件文本中字符所对应的字符编码;在字符编码中,确定位于预设语种的字符编码区间的字符编码的比例,当比例大于预设比例时,确定电子邮件的邮件文本的原始语种为预设语种,能够自动检测邮件文本的语种,可不用输入语种,提高邮件处理效率。
在一个实施例中,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据,包括:基于标记语言数据中的图片标签获取邮件图片;从邮件图片识别出识别文本和相应的文本格式;翻译识别文本,获得识别文本译文;将标记语言数据中的邮件文本替换为翻译内容,并将图片标签对应的标记语言替换为与识别文本译文和文本格式相应的标记语言,生成重组标记语言数据。
其中,标记语言数据中的图片标签用于标记邮件图片。例如图片标签可以是<img>。邮件图片的表现形式可以是一个邮件图片路径,例如URL(Uniform Resource Locator,统一资源定位符)等不限于此。邮件图片的格式不限,例如可以是JPEG格式(JointPhotographic Experts Group,联合图片专家组)、png(Portable Network Graphics,便携式网络图形)、bmp(Bitmap,位图)等不限于此。文本格式例如可以是字符之间的间距、字体大小、字体样式、字体颜色等不限于此。图片标签对应的标记语言即包含图片标签和邮件图片路径的标记语言。与识别文本译文和文本格式相应的标记语言即包含识别文本译文和文本格式信息的标记语言。
具体地,终端基于标记语言数据中的图片标签得到邮件图片路径,根据邮件图片路径获取邮件图片。终端通过OCR(Optical Character Recognition,光学字符识别)的方式从邮件图片中识别出识别文本和相应的文本格式。终端翻译识别文本,获得识别文本译文。根据识别文本译文和相应的文本格式生成相应的标记语言数据。终端将标记语言数据中的邮件文本替换为翻译内容,并将图片标签对应的标记语言替换为与识别文本译文和文本格式相应的标记语言,生成重组标记语言数据。
本实施例中,可通过服务器基于标记语言数据中的图片标签获取邮件图片,从邮件图片识别出识别文本和相应的文本格式,翻译识别文本,获得识别文本译文,将标记语言数据中的邮件文本替换为翻译内容,并将图片标签对应的标记语言替换为与识别文本译文和文本格式相应的标记语言,生成重组标记语言。
本实施例中,由于图片的尺寸与电子邮件软件的译文显示区域的默认尺寸可能不匹配,那么终端可依据译文显示区域的尺寸对识别文本译文的排布方式进行调整,以适配于译文显示区域的尺寸。如图4(b)所示,原文显示区域412中的邮件内容可为图片,由于英文文本一般比翻译出来的中文文本长,那么识别出来的英文文本及排布方式为“The planewas filled with Supplies donated by China-5.4mil(换行)lion masks”,而在译文显示区域显示的“飞机上装满了中国捐赠的物资-540万口罩”可在一行之内显示。
本实施例中,当识别出邮件图片中还包含图片Z时,终端记录该图片Z在邮件图片中的显示位置,并生成与该图片Z对应的标记语言数据,将图片标签对应的标记语言替换为与识别文本译文、文本格式和图片Z相应的标记语言数据。例如图4(b)中的图片在“BBBBBBPublic Interest Foundation”之后,那么该图片则显示在“BBBBBB公益基金会捐赠给非洲的医疗用品的一部分”之后。或者,终端也可以识别段落标记,段落标记例如可以是换行标记、段落前空格等,记录图片在哪个段落标记下,以记录显示位置。
上述电子邮件的翻译方法,基于图片标签获取邮件图片,识别出邮件图片中的识别文本和相应的文本格式,并翻译得到识别文本译文,将原图片标签对应的标记语言,替换成与识别文本译文和文本格式相应的标记语言,即在显示时,邮件图片替换成携带有该文本格式的识别文本译文,能够保证邮件图片所对应的识别文本译文的格式不发生改变,简化了用户操作。
在一个实施例中,如图12(a)所示,为一个实施例中翻译前手机端的邮件界面示意图。在手机端的邮件界面上触发邮件文本翻译操作,即图中的“翻译邮件”操作,终端获取电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本,向服务器发送标记语言数据,以使服务器通过分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据。终端接收服务器返回的重组标记语言数据,解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。如图12(b)所示,为一个实施例中翻译后的手机端的邮件界面示意图。图12(b)中包括解析获得的邮件内容,且解析获得的邮件内容包括翻译内容以及所对应的字体样式。通过点击图12(b)中的“原文”控件,可查看原文。
在一个实施例中,如图13所示,为一个实施例中邮件的翻译方法的系统架构图。终端启动Foxmail程序。其中Foxmail提供邮件取词翻译、邮件全文翻译和邮件实时翻译三种功能。其中,为了实现邮件全文翻译功能,终端响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,终端及服务器均获取电子邮件的标记语言数据,即获取邮件HTML数据,标记语言数据包括通过分区标签标记的邮件文本。向服务器发送标记语言数据,以使服务器解析邮件HTML数据,通过分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据,即组装HTML。终端接收服务器返回的重组标记语言数据,解析重组标记语言,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。为了实现邮件取词翻译的功能,响应于界面中触发的文本选取操作,获取目标文本,目标文本是邮件文本的一部分;响应于在邮件界面触发的局部文本翻译操作,向服务器发送目标文本,接收服务器发送的对于目标文本的翻译文本,显示翻译文本。为了实现邮件实时翻译功能,终端响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器;每当循环定时器计时到预设时长时,检测原文显示区域中的邮件内容;当检测到邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据。那么在Foxmail软件中进行外文邮件预览、或撰写外文邮件时,用户可分别通过取词翻译、全文翻译、实时翻译功能来完成对邮件句落、邮件全文以及写邮件时的键入内容进行针对性翻译。Foxmail中邮件本质是HTML数据,为了保证邮件原有的格式,必须经过HTML解析、正文提取、正文翻译、HTML组装四个步骤。因客户端计算资源有限,将上述四个步骤交于计算能力强大的服务器来完成;客户端将待翻译的邮件HTML数据发送给服务器,服务器通过HTML解析,提取需要翻译的正文进行翻译,再将译文替换掉原有的HTML标签内容,形成新HTML数据返回给客户端;在保有原有格式的条件下,客户端将邮件译文展现给用户。
在一个实施例中,如图14所示,为另一个实施例中电子邮件的翻译方法的流程示意图,以该方法应用于服务器为例,包括:
步骤1402,接收终端发送的电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本。
其中,电子邮件的标记语言数据具体可以是电子邮件的HTML(Hyper Text MarkupLanguage,超级文本标记语言)数据、电子邮件的XML(Extensible Markup Language,可扩展标记语言)数据或电子邮件的XHTML(Extensible Hyper Text Markup Language,可延伸超文件标记语言)等不限于此。分区标签用于标记邮件文本,将邮件文本与电子邮件的其他内容区分开。在HTML数据中,分区标签具体可以是<div>标签。邮件文本是指不携带格式的文本,即仅包含文本。
具体地,服务器接收终端发送的电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本。
步骤1404,通过分区标签从标记语言数据提取邮件文本,并翻译邮件文本获得翻译内容。
具体地,因HTML数据中包含了大量的标签,且标签内存在递归包含其他标签。所以在提取邮件文本时,需要将HTML数据解析成一颗DOM(Document Object Model,文档对象模型)树。其中DOM树是一种数据结构。在DOM树中逐个遍历标签,忽略标签本身和标签内的内容,剩余的就是邮件文本。比如:
<div><br></div><div>你好</div><hr id="FMSigSeperator"style="WIDTH:210px;HEIGHT:1px"color="#b5c4df"size="1"align="left"><div><span id="_FoxFROMNAME"><div style="MARGIN:10px;FONT-FAMILY:verdana;FONT-SIZE:10pt"><div>curtainliu(刘让琼)</div></div></span></div>
其中:
<div><br></div><div>你好</div>:所有的标签会被忽略掉,剩下的“你好”就是邮件文本。
<hr id="FMSigSeperator"style="WIDTH:210px;HEIGHT:1px"color="#b5c4df"size="1"align="left">:hr标签会被忽略掉,而尖括号中的内容数据标签内的内容,也会被忽略掉。
<div>curtainliu(刘让琼)</div>:<div>标签会被忽略掉,剩下的“curtainliu刘让琼”就是正文。
翻译功能则涉及到深度学习技术,单纯靠客户端难以完成翻译这个复杂功能。因此Foxmail会将电子邮件的标记语言数据发给服务器。服务器调用已经训练好的翻译模型来进行翻译。
步骤1406,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据。
具体地,服务器将标记语言数据中邮件文本替换为翻译内容,标记语言数据中其他数据不改变,得到重组标记语言数据。
其中,邮件内容包括翻译内容,还包括翻译内容所对应的格式。且翻译内容所对应的格式即为邮件文本所对应的格式。翻译内容的格式具体可以是字体大小、是否增加下划线、是否加粗、是否斜体、是否增加表情等不限于此。
步骤1408,向终端发送重组标记语言数据,使得终端解析重组标记语言数据并显示解析得到的邮件内容,邮件内容包括翻译内容。
具体地,服务器向终端发送重组标记语言数据,使得终端解析重组标记语言数据,并显示解析得到的邮件内容,邮件内容包括翻译内容。
上述电子邮件的翻译方法,由于终端计算资源有限,因此将翻译的工作交由计算能力较强的服务器来完成,接收终端发送的电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本,通过分区标签从标记语言数据提取邮件文本,并翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据,通过服务器完成翻译功能,能降低终端的计算资源耗费,并且服务器仅对标记语言数据中的邮件文本进行翻译,而其他内容不会进行翻译,因此服务器只翻译邮件文本,对电子邮件的标记语言数据中的其他数据不做改动,能够实现显示的翻译后的邮件内容不丢失原文样式,简化用户的操作步骤,在电子邮件程序中即可进行翻译,提高用户撰写或者预览外文邮件的效率。
应该理解的是,虽然图2、9和14的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、9和14中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图15所示,提供了一种电子邮件的翻译装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块1502、邮件文本翻译模块1504和显示模块1506,其中:
获取模块1502,用于响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本;
邮件文本翻译模块1504,用于向服务器发送标记语言数据,以使服务器通过分区标签从标记语言数据提取邮件文本,翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据;
重组标记语言数据接收模块1506,用于接收服务器返回的重组标记语言数据;
显示模块1506,用于解析重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,邮件内容包括翻译内容。
上述电子邮件的翻译装置,响应于邮件文本翻译操作,利用标记语言数据的特性,通过分区标签从标记语言数据中提取邮件文本,并翻译得到翻译内容,将标记语言数据中的邮件文本替换为翻译内容,即仅对邮件文本进行翻译,而标记语言数据中其他内容不发生变化,即重组标记语言数据中解析出来的邮件内容与原文的邮件内容相比,仅文本部分发生变化,因此能够使翻译后的邮件内容不丢失原文样式,简化了用户的操作步骤,在电子邮件程序中即可实现翻译,提高用户撰写或者预览外文邮件的效率。
在一个实施例中,显示模块1506还用于在邮件界面中的原文显示区域,显示电子邮件的邮件内容;解析重组标记语言数据,并将解析获得的邮件内容在邮件界面中的译文显示区域显示。
上述电子邮件的翻译装置,在邮件界面中的原文显示区域,显示电子邮件的邮件内容,解析重组标记语言数据,并将解析获得的邮件内容在邮件界面中的译文显示区域显示,能够在界面上更加直观地同时展示原文和译文。
在一个实施例中,电子邮件的翻译装置还包括译文修改模块,译文修改模块用于响应于在邮件界面所触发的译文修改操作,将译文显示区域置为编辑状态;根据对译文显示区域的编辑操作,修改翻译内容。
上述电子邮件的翻译装置,响应于在邮件界面所触发的译文修改操作,将译文显示区域置为编辑状态,根据对译文显示区域的编辑操作,修改翻译内容,提供了译文修改功能,能在译文不符合预期要求时对译文进行修改,提高替换后的译文的正确性。
在一个实施例中,对邮件文本的翻译是通过服务器上的翻译模型进行的。电子邮件的翻译装置还包括上报模块,上报模块用于将修改后的翻译内容上报至服务器,使得服务器基于翻译前的邮件内容和修改后的翻译内容更新翻译模型。
上述电子邮件的翻译装置,将修改后的翻译内容上报至服务器,使得服务器基于翻译前的邮件内容和修改后的翻译内容更新翻译模型,能够获取更多的样本数据对翻译模型进行训练,从而提高翻译模型的翻译准确性。
在一个实施例中,获取模块1502,用于响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据;显示模块1506用于将每次接收到的重组标记语言数据进行解析,并将每次解析获得的电子邮件的邮件内容在邮件界面的译文显示区域中更新显示。
上述电子邮件的翻译装置,响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当邮件界面中原文显示区域的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据,将每次接收到的重组标记语言数据进行解析,并将每次解析获得的电子邮件的邮件内容在邮件界面的译文显示区域中更新显示,能够达到实时翻译的效果,提高用户体验,并且当邮件界面中原文显示区域的邮件发生变化时,才获取原文显示区域所对应的电子邮件的标记语言数据,能够减少网络负担和客户端计算负担。
在一个实施例中,获取模块1502,用于响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器;每当循环定时器计时到预设时长时,检测原文显示区域中的邮件内容;当检测到原文显示区域中的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据。
上述电子邮件的翻译装置,响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器,每当循环定时器计时到预设时长时,检测原文显示区域中的邮件内容,当检测到原文显示区域中的邮件内容变化时,获取原文显示区域所对应的电子邮件的标记语言数据,能够通过循环定时器和邮件内容的检测,达到实时翻译的效果,并且当既触发了循环定时器,且邮件界面中原文显示区域的邮件发生变化时,才获取原文显示区域所对应的电子邮件的标记语言数据,能够减少网络负担和客户端计算负担。
在一个实施例中,电子邮件的翻译装置还包括译文替换模块,译文替换模块用于响应于在邮件界面触发的邮件内容替换操作,将原文显示区域中的邮件内容替换为译文显示区域中的邮件内容;关闭译文显示区域。
上述电子邮件的翻译装置,响应于在邮件界面触发的邮件内容替换操作,将原文显示区域中的邮件内容替换为译文显示区域中的邮件内容,关闭译文显示区域,则能够实现自动将译文显示区域中的邮件内容显示在原文显示区域,并且关闭译文显示区域,能够使得操作更加简便。
在一个实施例中,该电子邮件的翻译装置还包括目标文本发送模块和翻译文本接收模块;获取模块1502用于响应于在邮件界面中触发的文本选取操作,获取目标文本;目标文本是邮件文本的一部分;目标文本发送模块用于响应于在邮件界面触发的局部文本翻译操作,向服务器发送目标文本;翻译文本接收模块用于接收服务器发送的对于目标文本的翻译文本;显示模块1506用于显示翻译文本。
上述电子邮件的翻译装置,响应于在邮件界面中触发的文本选取操作,获取目标文本,目标文本是邮件文本的一部分,响应于在邮件界面触发的局部文本翻译操作,向服务器发送目标文本,接收服务器发送的对于目标文本的翻译文本,显示翻译文本,一般在选词翻译的场景中,不需要展示原文格式,例如加粗、字体颜色等,那么发送目标文本,能够提高获取翻译文本的效率。
在一个实施例中,显示模块1506用于获取目标文本相当于邮件界面的坐标;确定翻译文本的文本尺寸;当文本尺寸在悬浮窗所支持的尺寸范围内时,根据坐标和文本尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本;当文本尺寸大于尺寸范围的最大尺寸时,根据坐标和最大尺寸在邮件界面显示悬浮窗,调整翻译文本的排布方式,并在悬浮窗显示调整后的翻译文本;当文本尺寸小于尺寸范围的最小尺寸时,根据坐标和最小尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本。
上述电子邮件的翻译装置,获取目标文本相当于邮件界面的坐标,确定翻译文本的文本尺寸,当文本尺寸在悬浮窗所支持的尺寸范围内时,根据坐标和文本尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本,当文本尺寸大于尺寸范围的最大尺寸时,根据坐标和最大尺寸在邮件界面显示悬浮窗,调整翻译文本的排布方式,并在悬浮窗显示调整后的翻译文本,当文本尺寸小于尺寸范围的最小尺寸时,根据坐标和最小尺寸在邮件界面显示悬浮窗,并在悬浮窗显示翻译文本,能够根据翻译文本的文本尺寸调整悬浮窗的尺寸、翻译文本的排布方式等,通过悬浮窗的方式能够更加直观地显示原文译文对照结果。
在一个实施例中,获取模块1502用于获取默认语种;检测电子邮件的邮件文本的原始语种;当原始语种与默认语种不匹配时,显示翻译提示工具栏;响应于在翻译提示工具栏触发的邮件文本翻译操作,获取电子邮件的标记语言数据。
上述电子邮件的翻译装置,获取默认语种,检测电子邮件的邮件文本的原始语种,当原始语种与默认语种不匹配时,显示翻译提示工具栏,响应于在翻译提示工具栏触发的邮件文本翻译操作,获取电子邮件的标记语言数据,能够提示用户触发翻译操作,使得用户快速触发翻译操作,提高邮件预览或者邮件撰写效率。
在一个实施例中,获取模块1502用于获取邮件文本中字符所对应的字符编码;在字符编码中,确定位于预设语种的字符编码区间的字符编码的比例;当比例大于预设比例时,确定电子邮件的邮件文本的原始语种为预设语种。
上述电子邮件的翻译装置,获取邮件文本中字符所对应的字符编码;在字符编码中,确定位于预设语种的字符编码区间的字符编码的比例,当比例大于预设比例时,确定电子邮件的邮件文本的原始语种为预设语种,能够自动检测邮件文本的语种,可不用输入语种,提高邮件处理效率。
在一个实施例中,邮件文本翻译模块1504用于基于标记语言数据中的图片标签获取邮件图片;从邮件图片识别出识别文本和相应的文本格式;翻译识别文本,获得识别文本译文;将标记语言数据中的邮件文本替换为翻译内容,并将图片标签对应的标记语言替换为与识别文本译文和文本格式相应的标记语言,生成重组标记语言数据。
上述电子邮件的翻译装置,基于图片标签获取邮件图片,识别出邮件图片中的识别文本和相应的文本格式,并翻译得到识别文本译文,将原图片标签对应的标记语言,替换成与识别文本译文和文本格式相应的标记语言,即在显示时,邮件图片替换成携带有该文本格式的识别文本译文,能够保证邮件图片所对应的识别文本译文的格式不发生改变,简化了用户操作。
在一个实施例中,如图16所示,为另一个实施例中电子邮件的翻译装置的结构框图。该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:标记语言数据接收模块1602、提取模块1604、替换模块1606和重组标记语言数据发送模块1608,其中:
标记语言数据接收模块1602,用于接收终端发送的电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
提取模块1604,用于通过所述分区标签从所述标记语言数据提取所述邮件文本,并翻译所述邮件文本获得翻译内容;
替换模块1606,用于将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
重组标记语言数据发送模块1608,用于向所述终端发送所述重组标记语言数据,使得所述终端解析所述重组标记语言数据并显示解析得到的邮件内容;所述邮件内容包括所述翻译内容。
上述电子邮件的翻译装置,由于终端计算资源有限,因此将翻译的工作交由计算能力较强的服务器来完成,接收终端发送的电子邮件的标记语言数据,标记语言数据包括通过分区标签标记的邮件文本,通过分区标签从标记语言数据提取邮件文本,并翻译邮件文本获得翻译内容,将标记语言数据中的邮件文本替换为翻译内容,得到重组标记语言数据,通过服务器完成翻译功能,能降低终端的计算资源耗费,并且服务器仅对标记语言数据中的邮件文本进行翻译,而其他内容不会进行翻译,因此服务器只翻译邮件文本,对电子邮件的标记语言数据中的其他数据不做改动,能够实现翻译后的邮件内容不丢失原文样式,简化用户的操作步骤,在电子邮件程序中即可进行翻译,提高用户撰写或者预览外文邮件的效率。
关于电子邮件的翻译装置的具体限定可以参见上文中对于电子邮件的翻译方法的限定,在此不再赘述。上述电子邮件的翻译装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种电子邮件的翻译方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种电子邮件的翻译方法,其特征在于,所述方法包括:
响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,翻译所述邮件文本获得翻译内容,将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,所述邮件内容包括所述翻译内容。
2.根据权利要求1所述的方法,其特征在于,在所述响应于在电子邮件的邮件界面所触发的邮件文本翻译操作之前,所述方法还包括:
在所述邮件界面中的原文显示区域,显示电子邮件的邮件内容;
所述解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,包括:
解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面中的译文显示区域显示。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于在邮件界面所触发的译文修改操作,将所述译文显示区域置为编辑状态;
根据对所述译文显示区域的编辑操作,修改所述翻译内容。
4.根据权利要求3所述的方法,其特征在于,对所述邮件文本的翻译是通过服务器上的翻译模型进行的;所述方法还包括:
将修改后的翻译内容上报至所述服务器,使得所述服务器基于翻译前的邮件内容和所述修改后的翻译内容更新所述翻译模型。
5.根据权利要求2所述的方法,其特征在于,所述响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,包括:
响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当所述邮件界面中原文显示区域的邮件内容变化时,获取所述原文显示区域所对应的电子邮件的标记语言数据;
所述解析所述重组标记语言数据,并将解析获得的所述电子邮件的邮件内容在所述邮件界面上显示,包括:
将每次接收到的重组标记语言数据进行解析,并将每次解析获得的所述电子邮件的邮件内容在所述邮件界面的译文显示区域中更新显示。
6.根据权利要求5所述的方法,其特征在于,所述响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,当所述邮件界面中原文显示区域的邮件内容变化时,获取所述原文显示区域所对应的电子邮件的标记语言数据包括:
响应于在电子邮件的邮件界面所触发的邮件文本实时翻译操作,触发循环定时器;
每当循环定时器计时到预设时长时,检测所述原文显示区域中的邮件内容;
当检测到所述原文显示区域中的邮件内容变化时,获取所述原文显示区域所对应的电子邮件的标记语言数据。
7.根据权利要求2至6任一项所述的方法,其特征在于,所述方法还包括:
响应于在所述邮件界面触发的邮件内容替换操作,将所述原文显示区域中的邮件内容替换为所述译文显示区域中的邮件内容;
关闭所述译文显示区域。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于在所述邮件界面中触发的文本选取操作,获取目标文本;所述目标文本是所述邮件文本的一部分;
响应于在所述邮件界面触发的局部文本翻译操作,向服务器发送所述目标文本;
接收所述服务器发送的对于所述目标文本的翻译文本;
显示所述翻译文本。
9.根据权利要求8所述的方法,其特征在于,所述显示所述翻译文本包括:
获取所述目标文本相当于所述邮件界面的坐标;
确定所述翻译文本的文本尺寸;
当所述文本尺寸在悬浮窗所支持的尺寸范围内时,根据所述坐标和所述文本尺寸在所述邮件界面显示悬浮窗,并在所述悬浮窗显示所述翻译文本;
当所述文本尺寸大于所述尺寸范围的最大尺寸时,根据所述坐标和所述最大尺寸在所述邮件界面显示悬浮窗,调整所述翻译文本的排布方式,并在所述悬浮窗显示调整后的翻译文本;
当所述文本尺寸小于所述尺寸范围的最小尺寸时,根据所述坐标和所述最小尺寸在所述邮件界面显示悬浮窗,并在所述悬浮窗显示所述翻译文本。
10.根据权利要求1所述的方法,其特征在于,所述响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据包括:
获取默认语种;
检测所述电子邮件的邮件文本的原始语种;
当所述原始语种与所述默认语种不匹配时,显示翻译提示工具栏;
响应于在所述翻译提示工具栏触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据。
11.根据权利要求10所述的方法,其特征在于,所述检测所述电子邮件的邮件文本的原始语种,包括:
获取所述邮件文本中字符所对应的字符编码;
在所述字符编码中,确定位于预设语种的字符编码区间的字符编码的比例;
当所述比例大于预设比例时,确定所述电子邮件的邮件文本的原始语种为所述预设语种。
12.根据权利要求1所述的方法,其特征在于,所述将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据,包括:
基于所述标记语言数据中的图片标签获取邮件图片;
从所述邮件图片识别出识别文本和相应的文本格式;
翻译所述识别文本,获得识别文本译文;
将所述标记语言数据中的邮件文本替换为所述翻译内容,并将所述图片标签对应的标记语言替换为与所述识别文本译文和所述文本格式相应的标记语言,生成重组标记语言数据。
13.一种电子邮件的翻译方法,其特征在于,所述方法包括:
接收终端发送的电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
通过所述分区标签从所述标记语言数据提取所述邮件文本,并翻译所述邮件文本获得翻译内容;
将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
向所述终端发送所述重组标记语言数据,使得所述终端解析所述重组标记语言数据并显示解析得到的邮件内容;所述邮件内容包括所述翻译内容。
14.一种电子邮件的翻译装置,其特征在于,所述装置包括:
获取模块,用于响应于在电子邮件的邮件界面所触发的邮件文本翻译操作,获取所述电子邮件的标记语言数据,所述标记语言数据包括通过分区标签标记的邮件文本;
邮件文本翻译模块,用于通过所述分区标签从所述标记语言数据提取所述邮件文本,翻译所述邮件文本获得翻译内容,将所述标记语言数据中的邮件文本替换为所述翻译内容,得到重组标记语言数据;
显示模块,用于解析所述重组标记语言数据,并将解析获得的邮件内容在邮件界面上显示,所述邮件内容包括所述翻译内容。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
CN202010470528.0A 2020-05-28 2020-05-28 电子邮件的翻译方法、装置和计算机设备 Pending CN113743131A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010470528.0A CN113743131A (zh) 2020-05-28 2020-05-28 电子邮件的翻译方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010470528.0A CN113743131A (zh) 2020-05-28 2020-05-28 电子邮件的翻译方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN113743131A true CN113743131A (zh) 2021-12-03

Family

ID=78724297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010470528.0A Pending CN113743131A (zh) 2020-05-28 2020-05-28 电子邮件的翻译方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN113743131A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10149363A (ja) * 1996-11-20 1998-06-02 Sanyo Electric Co Ltd 機械翻訳システム
CN102073628A (zh) * 2009-11-24 2011-05-25 英业达股份有限公司 翻译视窗显示系统及其方法
CN102428461A (zh) * 2009-03-18 2012-04-25 谷歌公司 利用显示替换的web翻译
CN103902619A (zh) * 2012-12-28 2014-07-02 中国移动通信集团公司 一种网络舆情监控方法及系统
US20140288946A1 (en) * 2013-03-22 2014-09-25 Panasonic Corporation Advertisement translation device, advertisement display device, and method for translating an advertisement
CN110263351A (zh) * 2019-06-17 2019-09-20 深圳前海微众银行股份有限公司 一种网页的多语言翻译方法、装置及设备
WO2020019330A1 (zh) * 2018-07-27 2020-01-30 华为技术有限公司 一种邮件翻译的方法及电子设备
CN111178088A (zh) * 2019-12-20 2020-05-19 沈阳雅译网络技术有限公司 一种面向xml文档的可配置神经机器翻译方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10149363A (ja) * 1996-11-20 1998-06-02 Sanyo Electric Co Ltd 機械翻訳システム
CN102428461A (zh) * 2009-03-18 2012-04-25 谷歌公司 利用显示替换的web翻译
CN102073628A (zh) * 2009-11-24 2011-05-25 英业达股份有限公司 翻译视窗显示系统及其方法
CN103902619A (zh) * 2012-12-28 2014-07-02 中国移动通信集团公司 一种网络舆情监控方法及系统
US20140288946A1 (en) * 2013-03-22 2014-09-25 Panasonic Corporation Advertisement translation device, advertisement display device, and method for translating an advertisement
WO2020019330A1 (zh) * 2018-07-27 2020-01-30 华为技术有限公司 一种邮件翻译的方法及电子设备
CN110263351A (zh) * 2019-06-17 2019-09-20 深圳前海微众银行股份有限公司 一种网页的多语言翻译方法、装置及设备
CN111178088A (zh) * 2019-12-20 2020-05-19 沈阳雅译网络技术有限公司 一种面向xml文档的可配置神经机器翻译方法

Similar Documents

Publication Publication Date Title
US7447706B2 (en) Method and system for generating an auto-completion list for a cascading style sheet selector
RU2412470C2 (ru) Списки автоматического заполнения и рукописный ввод
JP4344693B2 (ja) ブラウザの文書編集のためのシステムおよびその方法
US8482581B2 (en) Selective display of OCR&#39;ed text and corresponding images from publications on a client device
US10853319B2 (en) System and method for display of document comparisons on a remote device
US20110264705A1 (en) Method and system for interactive generation of presentations
US20140344662A1 (en) Ink to text representation conversion
CN101197849A (zh) 将互联网页面转换为无线应用协议页面的转换方法和装置
US20190311022A1 (en) Automated document content modification
US9535888B2 (en) System, method, software arrangement and computer-accessible medium for a generator that automatically identifies regions of interest in electronic documents for transcoding
JP6866551B2 (ja) 数式処理方法、装置、デバイス及びプログラム
CN111291533B (zh) 待显示句段的显示方法、装置、计算机设备和存储介质
CN109933751B (zh) 图文绘制方法、装置、计算机可读存储介质和计算机设备
CN108804469B (zh) 一种网页识别方法以及电子设备
Bader et al. Responsive web design techniques
CN111552903A (zh) 基于html模板的页面生成方法、装置和计算机设备
US20110035433A1 (en) Webpage display method, computer system, and program
CN113836092A (zh) 基于rpa和ai的文件比对方法、装置、设备及存储介质
JP2010157065A (ja) 機械翻訳システム及び機械翻訳方法
CN113743131A (zh) 电子邮件的翻译方法、装置和计算机设备
CN110162301B (zh) 一种表单渲染方法、装置和存储介质
TWI493365B (zh) 多字集字碼輸入與即時顯示方法、系統與裝置
JP5483526B2 (ja) 機械翻訳システム及び機械翻訳方法
CN115309476A (zh) 一种基于浏览器的ofd文件显示和编辑方法
CN112001157B (zh) 一种网页数据表格在线设计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination