CN108694170A - 一种页面文本信息的翻译方法及系统 - Google Patents

一种页面文本信息的翻译方法及系统 Download PDF

Info

Publication number
CN108694170A
CN108694170A CN201810459701.XA CN201810459701A CN108694170A CN 108694170 A CN108694170 A CN 108694170A CN 201810459701 A CN201810459701 A CN 201810459701A CN 108694170 A CN108694170 A CN 108694170A
Authority
CN
China
Prior art keywords
page
text information
translated
translation
page text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810459701.XA
Other languages
English (en)
Inventor
李承璋
李中琪
陈文涛
吕晋
林旭冕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Futu Network Technology Co Ltd
Original Assignee
Shenzhen Futu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Futu Network Technology Co Ltd filed Critical Shenzhen Futu Network Technology Co Ltd
Priority to CN201810459701.XA priority Critical patent/CN108694170A/zh
Publication of CN108694170A publication Critical patent/CN108694170A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种页面文本信息的翻译方法及系统,其方法包括:检测页面是否存在需要翻译的文本信息,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。

Description

一种页面文本信息的翻译方法及系统
技术领域
本发明涉及翻译技术领域,尤其涉及一种页面文本信息的翻译方法及系统。
背景技术
随着互联网技术的快速发展,人们的工作和生活越来越依赖互联网信息平台,由于世界上存在多民族多语言,则人们在阅读非母语网页时,可能会遇到语言障碍,翻译技术给人们带来了很大的便利。
翻译是使用计算机实现从一种语言信息转变成另一种语言信息的行为,现有针对页面文本信息的翻译方案,一般是用户需要对当前页面中如文本信息进行翻译时,用户需要另外打开翻译软件或者词典网站进行手动翻译,无法实现自动化翻译,操作繁琐,翻译效率较低。
发明内容
本发明提供一种页面文本信息的翻译方法及系统,用以解决现有技术中用户需要对当前页面中如文本信息进行翻译时,用户需要另外打开翻译软件或者词典网站进行手动翻译,无法实现自动化翻译,操作繁琐,翻译效率较低的技术问题。
为解决上述技术问题,本发明提供一种页面文本信息的翻译方法,包括:
检测页面是否存在需要翻译的文本信息。
检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息;
对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文。
其中,所述检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息,包括:
检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息。
其中,所述检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息,包括:
检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取所述需要翻译的页面文本信息。
其中,所述对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文,包括:
根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文。
其中,所述根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文,包括:
根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,替换所述获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>,过滤掉非英文的字符,并加上相应标识标签包括<notrans>,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供所述需要翻译的页面文本信息的译文。
为解决上述技术问题,本发明还提供一种页面文本信息的翻译系统,包括:检测模块、获取模块、翻译模块;
所述检测模块,用于检测页面是否存在需要翻译的文本信息;
所述获取模块,用于根据所述检测模块检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息;
所述翻译模块,用于对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文。
其中,所述获取模块,用于根据所述检测模块检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息,包括:
所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息。
其中,所述所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息,包括:
所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取所述需要翻译的页面文本信息。
其中,所述翻译模块,用于对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文,包括:
所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文。
其中,所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文,包括:
所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,替换所述获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括
<a>\<strong>\<u>,过滤掉非英文的字符,并加上相应标识标签包括<notrans>,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供所述需要翻译的页面文本信息的译文。
本发明提供的页面文本信息的翻译方法,包括:检测页面是否存在需要翻译的文本信息,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。
本发明提供的页面文本信息的翻译系统,包括:检测模块、获取模块、翻译模块;检测模块,用于检测页面是否存在需要翻译的文本信息;获取模块,用于根据检测模块检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息;翻译模块,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文;从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。
附图说明
图1为本发明页面文本信息的翻译方法的流程示意图;
图2为本发明页面文本信息的翻译系统的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明作进一步的详细描述。特别指出的是,以下实施例仅用于说明本发明,但不对本发明的范围进行限定。同样的,以下实施例仅为本发明的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种页面文本信息的翻译方法。
请参见图1,图1为本发明页面文本信息的翻译方法的流程示意图,本发明页面文本信息的翻译方法,包括:
S101:检测页面是否存在需要翻译的文本信息。
S102:检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息。
S103:对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文。
其中,检测页面是否存在需要翻译的文本信息,包括:
检测页面文本信息最近的更新时间,检测页面是否存在需要翻译的文本信息。
其中,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,包括:
检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息。
其中,检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息,包括:
检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取该需要翻译的页面文本信息。
其中,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,包括:
根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文。
其中,根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文,包括:
根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,替换该获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>等,过滤掉非英文的字符,并加上相应标识标签包括<notrans>等,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供该需要翻译的页面文本信息的译文。
本发明还提供一种页面文本信息的翻译系统。
请参见图2,图2为本发明页面文本信息的翻译系统的结构示意图,本发明页面文本信息的翻译系统,包括:检测模块201、获取模块202、翻译模块203。
检测模块201,用于检测页面是否存在需要翻译的文本信息。
获取模块202,用于根据检测模块201检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息。
翻译模块203,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文。
其中,检测模块201,用于检测页面是否存在需要翻译的文本信息检测页面是否存在需要翻译的文本信息,包括:
检测模块201,用于检测页面是否存在需要翻译的文本信息检测页面文本信息最近的更新时间,检测页面是否存在需要翻译的文本信息。
其中,获取模块202,用于根据检测模块201检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,包括:
获取模块202,用于根据检测模块201检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息。
其中,获取模块202,用于根据检测模块201检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取该需要翻译的页面文本信息,包括:
获取模块202,用于根据检测模块201检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取该需要翻译的页面文本信息。
其中,翻译模块203,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,包括:
翻译模块203,用于根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文。
其中,翻译模块203,用于根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供该需要翻译的页面文本信息的译文,包括:
翻译模块203,用于根据该获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对该获取的需要翻译的页面文本信息进行翻译,替换该获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>等,过滤掉非英文的字符,并加上相应标识标签包括<notrans>等,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供该需要翻译的页面文本信息的译文。
本发明提供的页面文本信息的翻译方法,包括:检测页面是否存在需要翻译的文本信息,检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息,对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文,从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。
本发明提供的页面文本信息的翻译系统,包括:检测模块、获取模块、翻译模块;检测模块,用于检测页面是否存在需要翻译的文本信息;获取模块,用于根据检测模块检测到页面存在需要翻译的文本信息时,获取该需要翻译的页面文本信息;翻译模块,用于对该获取的需要翻译的页面文本信息进行翻译,提供该需要翻译的页面文本信息的译文;从而达到实现可将当前页面的文本信息进行自动化翻译,操作便捷,翻译效率较高。
本发明提供的页面文本信息的翻译方法及系统,包括:
读取第一方传入的参数,根据参数进行校验,如果不符合则返回相应错误;
根据订单号及是否强制翻译标记去缓存中取数据,如取到而又不强制翻译则返回缓存数据,否则向第二方发起翻译;
读取待翻译的内容,如果是text,则去掉所以的HTML标签,然后分段如可以设置每段内容不超过3000字节,然后循环向第二方翻译,第二方翻译返回翻译内容后合并内容,写入缓存数据表,以备第一方再次发起翻译时可取到缓存数据,也减轻了翻译的压力;
如果是一个http(s)的请求,先获取到html内容,然后对内容进行基本的过滤,例如过滤掉<a>连接及<strong><u>此类在翻译时可能引起翻译不通顺的标签;
对内容进一步过滤,对于非英文字符插入<notrans>标签,解释脚本认为该类标签不需要翻译;
解释脚本遍历html dom,将需要翻译的内容取出来,组成一个数组如可以设置每个数据内总字段不超过3000字节,然后多个数组循环向第二方发起翻译,第二方返回翻译结果后,再组成一个大的数组,然后用数据反遍历html dom,把数据填回去,然后再把翻译后的html数据存入数据库,完成翻译;
将翻译好的数据返回给第一方,第一方存入dbh如果来源是连接的形式,还需要提供一个落地URL以供第一方直接调用,连接采用orderId/idx/setNumber的形式提供,用以防止被第三方遍历抓取。
本发明提供的页面文本信息的翻译方法及系统,可以实现翻译交互展示,可以实现翻译过程的实现展示,可以实现翻译公告后提供防爬取的连接形式。
在本发明所提供的几个实施方式中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的部分实施例,并非因此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效装置或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种页面文本信息的翻译方法,其特征在于,包括:
检测页面是否存在需要翻译的文本信息。
检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息;
对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文。
2.如权利要求1所述的页面文本信息的翻译方法,其特征在于,所述检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息,包括:
检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息。
3.如权利要求2所述的页面文本信息的翻译方法,其特征在于,所述检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息,包括:
检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取所述需要翻译的页面文本信息。
4.如权利要求1或3所述的页面文本信息的翻译方法,其特征在于,所述对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文,包括:
根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文。
5.如权利要求4所述的页面文本信息的翻译方法,其特征在于,所述根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文,包括:
根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,替换所述获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>,过滤掉非英文的字符,并加上相应标识标签包括<notrans>,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供所述需要翻译的页面文本信息的译文。
6.一种页面文本信息的翻译系统,其特征在于,包括:检测模块、获取模块、翻译模块;
所述检测模块,用于检测页面是否存在需要翻译的文本信息;
所述获取模块,用于根据所述检测模块检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息;
所述翻译模块,用于对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文。
7.如权利要求6所述的页面文本信息的翻译系统,其特征在于,所述获取模块,用于根据所述检测模块检测到页面存在需要翻译的文本信息时,获取所述需要翻译的页面文本信息,包括:
所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息。
8.如权利要求7所述的页面文本信息的翻译系统,其特征在于,所述所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取所述需要翻译的页面文本信息,包括:
所述获取模块,用于根据所述检测模块检测到页面文本信息最近的更新时间,大于最近一次的页面文本信息的翻译时间,则检测到页面存在需要翻译的文本信息,此时获取当前页面文本信息与最近一次的页面文本信息的翻译时间的页面文本信息不相同的更新的文本信息,获取所述需要翻译的页面文本信息。
9.如权利要求6或8所述的页面文本信息的翻译系统,其特征在于,所述翻译模块,用于对所述获取的需要翻译的页面文本信息进行翻译,提供所述需要翻译的页面文本信息的译文,包括:
所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文。
10.如权利要求9所述的页面文本信息的翻译系统,其特征在于,所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,翻译成预定的目标语言类型,提供所述需要翻译的页面文本信息的译文,包括:
所述翻译模块,用于根据所述获取的需要翻译的页面文本信息的原始语言类型和预定的目标语言类型,对所述获取的需要翻译的页面文本信息进行翻译,替换所述获取的需要翻译的页面文本信息中的关键语句,如果文本信息包括text类型信息,则过滤掉text中全部的html标签,将text分段并组成数组,如果文本信息包括html类型信息,则过滤掉影响翻译质量的标签包括<a>\<strong>\<u>,过滤掉非英文的字符,并加上相应标识标签包括<notrans>,读取html、dom类型信息并组成数组,如果文本信息包括连接类型信息,则取得html内容信息,翻译成预定的目标语言类型,如果文本信息包括text类型信息,则根据数组直接组成文章,如果文本信息包括html类型信息,则反遍历dom类型信息,将数据信息填回去,如果文本信息包括连接类型信息,按数据格式组成新的连接类型信息,提供所述需要翻译的页面文本信息的译文。
CN201810459701.XA 2018-05-15 2018-05-15 一种页面文本信息的翻译方法及系统 Withdrawn CN108694170A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810459701.XA CN108694170A (zh) 2018-05-15 2018-05-15 一种页面文本信息的翻译方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810459701.XA CN108694170A (zh) 2018-05-15 2018-05-15 一种页面文本信息的翻译方法及系统

Publications (1)

Publication Number Publication Date
CN108694170A true CN108694170A (zh) 2018-10-23

Family

ID=63847214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810459701.XA Withdrawn CN108694170A (zh) 2018-05-15 2018-05-15 一种页面文本信息的翻译方法及系统

Country Status (1)

Country Link
CN (1) CN108694170A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323935A (zh) * 2011-08-31 2012-01-18 中兴通讯股份有限公司 中间服务器、移动浏览方法及系统
US9430466B1 (en) * 2015-08-26 2016-08-30 Google Inc. Techniques for crowd sourcing human translations to provide translated versions of web pages with additional content
CN107943796A (zh) * 2017-11-17 2018-04-20 珠海市魅族科技有限公司 一种翻译方法和装置、终端、可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323935A (zh) * 2011-08-31 2012-01-18 中兴通讯股份有限公司 中间服务器、移动浏览方法及系统
US9430466B1 (en) * 2015-08-26 2016-08-30 Google Inc. Techniques for crowd sourcing human translations to provide translated versions of web pages with additional content
CN107943796A (zh) * 2017-11-17 2018-04-20 珠海市魅族科技有限公司 一种翻译方法和装置、终端、可读存储介质

Similar Documents

Publication Publication Date Title
CN101211364B (zh) 用于万维网页中暴露的资源的公共书签的方法和系统
CN109376291B (zh) 一种基于网络爬虫的网站指纹信息扫描的方法及装置
CN104899269A (zh) 一种访问网址链接的方法及装置
CN104243273A (zh) 即时通讯客户端显示信息的方法及设备和信息显示系统
CN104866512A (zh) 提取网页内容的方法、装置及系统
CN101667118A (zh) 多语言版本的开发、替换方法及装置
CN103902653A (zh) 一种构建数据仓库表血缘关系图的方法和装置
CN102591874A (zh) 提示方法、终端和服务器
CN110851136A (zh) 数据获取方法、装置、电子设备及存储介质
CN101895517B (zh) 一种脚本语义提取方法和提取装置
CN114756868A (zh) 一种基于指纹的网络资产与漏洞关联方法及装置
CN102902784A (zh) 网页分类存储系统及方法
CN112597123B (zh) 数据多版本动态切换方法及装置
CN101470705A (zh) 动态网页翻译系统及方法
CN100514916C (zh) 安全管理中心系统中的日志格式化单元及方法
CN113971205A (zh) 一种威胁报告攻击行为提取方法、装置、设备及存储介质
CN109885583A (zh) 基于区块链的数据查询方法、装置、设备及存储介质
CN112667208A (zh) 翻译错误识别方法、装置、计算机设备及可读存储介质
CN105589918A (zh) 一种提取页面信息的方法及装置
CN110472126A (zh) 一种页面数据的获取方法、装置和设备
CN104778232A (zh) 一种基于长查询的搜索结果的优化方法和装置
KR101223864B1 (ko) 인터넷 쇼핑몰 검색 시스템 및 방법
CN108694170A (zh) 一种页面文本信息的翻译方法及系统
CN109062890B (zh) 一种标签切换方法和装置、计算机可读存储介质
CN113407678B (zh) 知识图谱构建方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20181023

WW01 Invention patent application withdrawn after publication