CN112182469A - 一种网站页面多语种自动复制及翻译方法 - Google Patents
一种网站页面多语种自动复制及翻译方法 Download PDFInfo
- Publication number
- CN112182469A CN112182469A CN202011122780.9A CN202011122780A CN112182469A CN 112182469 A CN112182469 A CN 112182469A CN 202011122780 A CN202011122780 A CN 202011122780A CN 112182469 A CN112182469 A CN 112182469A
- Authority
- CN
- China
- Prior art keywords
- translation
- website
- queue
- time
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000013519 translation Methods 0.000 claims abstract description 110
- 230000008569 process Effects 0.000 claims abstract description 31
- 230000010076 replication Effects 0.000 claims abstract description 24
- 230000008859 change Effects 0.000 claims abstract description 16
- 238000003780 insertion Methods 0.000 claims abstract description 4
- 230000037431 insertion Effects 0.000 claims abstract description 4
- 230000001360 synchronised effect Effects 0.000 claims description 15
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000007792 addition Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 230000014616 translation Effects 0.000 description 65
- 230000006870 function Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
Abstract
一种网站页面多语种自动复制及翻译方法,包括两个流程:插入复制翻译队列方法实现流程及复制翻译队列执行方法实现流程;所述的插入复制翻译队列方法实现流程:1)系统每隔一段时间查询开启了网站自动复制翻译服务的网站;时间根据具体业务需要进行设定,定为30分钟到1个小时;2)判断是否通过领动翻译系统进行过整站复制翻译;3)判断上次同步完成时间至本次方法执行时间区间内源网站是否有变动,若没有变动则结束流程;复制翻译队列执行方法实现流程中,根据情况分别判断对目标网站内容是执行新增、修改亦或者删除操作。
Description
技术领域
本发明属于计算机数据处理的领域,具体涉及一种网站页面多语种自动复制及翻译方案。
背景技术
领动云营销平台是一款基于Saas模式的云建站工具,让客户很轻松的建造自己的网站,自上线以来,颇受用户好评。尤其是之前开发的网站整站复制、翻译功能,让用户只利用自己熟悉的语言,例如常用的中文或英文创建一个网站,然后一键将网站内容复制、翻译到其他语种的网站上。
然而在实际使用中,整站复制、翻译功能存在一些不足以及局限性。用户的网站在设计阶段初期可以按照个性化需要随意改动,然而在设计阶段后期,或者网站正式交付后,如果有少许的主站网站改动,然而用户需要将这些改动应用到其他语种网站上,则用户就只有两种选择:一是重新整站翻译,这样既消耗了用户的翻译字符数需要付出更多的翻译费用,又占用了更多的服务器资源,并且用户在目标(小语种)网站上做出的一些改动也会被覆盖,十分用户不友好。二是用户可以在目标(小语种)网站手动修改,在用户网站数量较少、改动量较少时工作量不大。然而有些网站(如领动)有相当多的用户有十几个甚至更多的小语种网站,一个个修改过去的工作量也是相当大的。
针对以上的问题,我们在整站复制、翻译功能的基础上,开发了自动翻译功能,可以满足以下需求:在用户开通自动翻译功能后,自动检测用户对网站做出的改动,并将这些网站内容改动复制、翻译到目标(小语种)网站。减少服务端机器大量重复翻译的运行压力,提高翻译系统效率。节约用户翻译字符数消耗,减少用户花费,缩减网站翻译时间,提升用户满意度。
发明内容
为解决相关网站的现有翻译功能不灵活、效率低的问题,提出一种网站页面多语种自动复制及翻译方案,本发明的目的还在于,通过判断用户网站内容新增、更新时间,通过对比源网站更新时间以及目标网站上次通过领动复制翻译系统同步的时间,获取其中做的改动,对其做处理,再同步到对应的目标网站中。
本发明技术方案是,一种网站页面多语种自动复制及翻译方法,包括两个流程:插入复制翻译队列方法实现流程及复制翻译队列执行方法实现流程。
插入复制翻译队列方法实现流程:
1)系统每隔一段时间查询开启了网站自动复制翻译服务的网站。这里的时间可以根据具体业务需要进行设定,例如根据领动云建站目前的网站翻译量以及应用硬件配置,定为30分钟到1个小时为佳。
2)判断是否通过领动翻译系统进行过整站复制翻译,如果否则结束流程,是则继续,并且得到上次同步完成时间。这样做的目的在于确认目标网站与源网站内容之间的对应关系,如果关系不存在则后面的同步过程是无法正常运作的。
3)判断上次同步完成时间至本次方法执行时间区间内源网站是否有变动,若没有变动则结束流程。有变动,则继续。在本阶段中,主要通过时间筛选了用户做了修改,但并未同步翻译至目标网站的数据。
4)判断现在执行的同步队列中是否含有向目标网站导入数据的队列,如果有,则结束流程。如果没有,则插入自动复制翻译队列。本阶段判断的目的在于避免出现重复插入翻译队列,导致目标网站出现重复数据。
5)等待一定时间后,重复本流程。
复制翻译队列执行方法实现流程:
1)复制翻译队列开始后首先查询上次同步完成时间至本次方法执行时间区间内源网站内容的变动,根据情况分别判断对目标网站内容是执行新增、修改亦或者删除操作。
2)如果是新增或更新,还需要判断是否需要翻译,如果需要翻译则调用接口将内容进行翻译。
3)最终借助领动复制翻译系统将数据同步至目标网站。至此自动复制翻译流程完成。
有益效果:
1)原版的翻译系统需要用户每次都设置参数,操作步骤繁琐。在用户开通自动翻译功能后,只需设置一次参数,在自动翻译流程执行时,系统自动检测用户对网站做出的改动,并将这些网站内容改动复制、翻译到多个目标(小语种)网站。2)原版的翻译系统每次都会对所有网站内容进行操作,重复工作量大,而自动翻译开启后,大大减少服务端机器大量重复翻译的运行压力,提高翻译系统效率,做到精准化。3)节约用户翻译字符数消耗,减少用户花费,缩减网站翻译时间,提升用户满意度。主站网站改动,然而用户需要将这些改动处应用到其他语种网站上,用户在目标(小语种)网站上做出的一些改动也会被覆盖,十分用户不友好。应用于十几个甚至更多的小语种网站时能大大减少工作量。
附图说明
图1为本发明实施例中插入复制翻译队列方法实现流程图;
图2为本发明实施例中复制翻译队列执行方法实现流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1为插入复制翻译队列方法实现流程图。
1)系统每隔30分钟查询开启了网站自动复制翻译服务的网站。
2)判断是否通过领动翻译系统进行过整站复制翻译,如果否则结束流程,是则继续,并且得到上次同步完成时间。
具体判断方式为:数据库中建有翻译队列表,该表中保存有之前用户网站翻译执行信息。根据该表中的翻译类型字段,可以判断该网站是否由其他网站整站翻译而来。根据目标网站唯一标识以及翻译类型查询,如果存在一条或多条队列信息,则认为通过领动翻译系统进行过整站复制翻译。
3)判断上次同步完成时间至本次方法执行时间区间内源网站是否有变动,若没有变动则结束流程。有变动,则继续。
具体判断方式为:数据库建有网站内容结构表,只要用户对网站页面做过调整并保存,该结构表的更新时间字段即会更新。如果网站内容结构表的更新时间在上一次完成复制翻译的时间之后,即可视为用户网站页面存在变动。
4)判断现在执行的同步队列中是否含有向目标网站导入数据的队列,如果有,则结束流程。如果没有,则插入自动复制翻译队列。
具体判断方式为:翻译队列表中存有目标网站唯一标识,以及队列状态。根据目标网站唯一标示查询翻译队列表,如果存在队列状态不为“已完成”的同步队列,则视为含有向目标网站导入数据的队列。
5)等待30分钟后,重复本流程。
图2为复制翻译队列执行方法流程图。
1)复制翻译队列开始后首先查询上次同步完成时间至本次方法执行时间区间内源网站内容的变动,根据情况分别判断对目标网站内容是执行新增、修改亦或者删除操作。
具体判断方式为:从翻译队列表中获取上一次网站完成复制翻译的时间。通过该时间,与网站内容各表数据的更新时间对比,如果网站内容数据更新时间在上一次完成复制翻译的时间之后,则认为该数据是有更新的,需要复制同步到目标(小语种)网站。
2)如果是新增或更新,还需要判断是否需要翻译,如果需要翻译则调用接口将内容进行翻译。
具体判断方式为:翻译队列表中存有是否需要翻译字段,该字段由系统对比源网站语种与目标网站语种获得,如果语种相同,则置为“是”,如果不同,则置为“否”。
其中翻译内容接口则选择了谷歌开放的谷歌翻译接口:
https://translate.google.cn/#view=home&op=translate&sl=en&tl=zh- CN&text=%E7%BF%BB%E8%AF%91。通过修改sl(原语种)及tl(目标语种)和text(翻译内容)参数,获取对应的翻译过后的数据。
3)最终通过领动复制翻译系统将数据同步至目标网站。至此自动复制翻译流程完成。
Claims (3)
1.一种网站页面多语种自动复制及翻译方法,其特征是,包括两个流程:插入复制翻译队列方法实现流程及复制翻译队列执行方法实现流程;
所述的插入复制翻译队列方法实现流程:
1)系统每隔一段时间查询开启了网站自动复制翻译服务的网站;时间根据具体业务需要进行设定,定为30分钟到1个小时;
2)判断是否通过领动翻译系统进行过整站复制翻译,如果否则结束流程,是则继续,并且得到上次同步完成时间;用于确认目标网站与源网站内容之间的对应关系,如果关系不存在则后面的同步过程则无法正常运作;
3)判断上次同步完成时间至本次方法执行时间区间内源网站是否有变动,若没有变动则结束流程;有变动,则继续即列出变动;在本阶段中,通过时间筛选用户做修改,但并未同步翻译至目标网站的数据;
4)判断现在执行的同步队列中是否含有向目标网站导入数据的队列,如果有,则结束流程;如果没有,则插入自动复制翻译队列;在于避免出现重复插入翻译队列,导致目标网站出现重复数据;
5)等待一定时间后,重复本流程;
所述复制翻译队列执行方法实现流程:
1)复制翻译队列开始后首先查询上次同步完成时间至本次方法执行时间区间内源网站内容的变动,根据情况分别判断对目标网站内容是执行新增、修改亦或者删除操作;
2)如果是新增或更新,还需要判断是否需要翻译,如果需要翻译则调用接口将内容进行翻译;
3)最终借助复制翻译系统将数据同步至目标网站;至此自动复制翻译流程完成。
2.根据权利要求1所述的网站页面多语种自动复制及翻译方法,其特征是,
1)系统每隔30分钟查询开启了网站自动复制翻译服务的网站;
2)判断是否通过领动翻译系统进行过整站复制翻译,如果否则结束流程,是则继续,并且得到上次同步完成时间;
具体判断方式为:数据库中建有翻译队列表,该表中保存有之前用户网站翻译执行信息;根据该表中的翻译类型字段,能判断该网站是否由其他网站整站翻译而来;根据目标网站唯一标识以及翻译类型查询,如果存在一条或多条队列信息,则认为通过领动翻译系统进行过整站复制翻译;
3)判断上次同步完成时间至本次方法执行时间区间内源网站是否有变动,若没有变动则结束流程;有变动,则继续;
具体判断方式为:数据库建有网站内容结构表,只要用户对网站页面做过调整并保存,该结构表的更新时间字段即会更新。如果网站内容结构表的更新时间在上一次完成复制翻译的时间之后,即可视为用户网站页面存在变动。
4)判断现在执行的同步队列中是否含有向目标网站导入数据的队列,如果有,则结束流程;如果没有,则插入自动复制翻译队列;
具体判断方式为:翻译队列表中存有目标网站唯一标识,以及队列状态。根据目标网站唯一标示查询翻译队列表,如果存在队列状态不为“已完成”的同步队列,则视为含有向目标网站导入数据的队列;
5)等待30分钟后,重复本流程。
3.根据权利要求1所述的网站页面多语种自动复制及翻译方法,其特征是,
复制翻译队列执行方法流程中,1)复制翻译队列开始后首先查询上次同步完成时间至本次方法执行时间区间内源网站内容的变动,根据情况分别判断对目标网站内容是执行新增、修改亦或者删除操作。
具体判断方式为:从翻译队列表中获取上一次网站完成复制翻译的时间。通过该时间,与网站内容各表数据的更新时间对比,如果网站内容数据更新时间在上一次完成复制翻译的时间之后,则认为该数据是有更新的,需要复制同步到目标(小语种)网站;
2)如果是新增或更新,还需要判断是否需要翻译,如果需要翻译则调用接口将内容进行翻译;具体判断方式为:翻译队列表中存有是否需要翻译字段,该字段由系统对比源网站语种与目标网站语种获得,如果语种相同,则置为“是”,如果不同,则置为“否”;其中翻译内容接口则选择了谷歌开放的谷歌翻译接口,通过修改sl(原语种)及tl(目标语种)和text(翻译内容)参数,获取对应的翻译过后的数据;
3)最终通过领动复制翻译系统将数据同步至目标网站;至此自动复制翻译流程完成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011122780.9A CN112182469A (zh) | 2020-10-20 | 2020-10-20 | 一种网站页面多语种自动复制及翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011122780.9A CN112182469A (zh) | 2020-10-20 | 2020-10-20 | 一种网站页面多语种自动复制及翻译方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112182469A true CN112182469A (zh) | 2021-01-05 |
Family
ID=73922170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011122780.9A Pending CN112182469A (zh) | 2020-10-20 | 2020-10-20 | 一种网站页面多语种自动复制及翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182469A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7383320B1 (en) * | 1999-11-05 | 2008-06-03 | Idom Technologies, Incorporated | Method and apparatus for automatically updating website content |
US20170083845A1 (en) * | 2015-09-22 | 2017-03-23 | Homeaway, Inc. | Generic entity translations using priority queuing |
CN108062368A (zh) * | 2017-12-08 | 2018-05-22 | 北京百度网讯科技有限公司 | 全量数据翻译方法、装置、服务器及存储介质 |
CN109669742A (zh) * | 2018-09-26 | 2019-04-23 | 深圳壹账通智能科技有限公司 | 网站的展示方法、装置、终端设备及存储介质 |
CN109783579A (zh) * | 2019-01-22 | 2019-05-21 | 南京焦点领动云计算技术有限公司 | 一种快速复制和翻译网站的方法 |
CN111368557A (zh) * | 2020-03-06 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 视频内容的翻译方法、装置、设备及计算机可读介质 |
-
2020
- 2020-10-20 CN CN202011122780.9A patent/CN112182469A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7383320B1 (en) * | 1999-11-05 | 2008-06-03 | Idom Technologies, Incorporated | Method and apparatus for automatically updating website content |
US20170083845A1 (en) * | 2015-09-22 | 2017-03-23 | Homeaway, Inc. | Generic entity translations using priority queuing |
CN108062368A (zh) * | 2017-12-08 | 2018-05-22 | 北京百度网讯科技有限公司 | 全量数据翻译方法、装置、服务器及存储介质 |
CN109669742A (zh) * | 2018-09-26 | 2019-04-23 | 深圳壹账通智能科技有限公司 | 网站的展示方法、装置、终端设备及存储介质 |
CN109783579A (zh) * | 2019-01-22 | 2019-05-21 | 南京焦点领动云计算技术有限公司 | 一种快速复制和翻译网站的方法 |
CN111368557A (zh) * | 2020-03-06 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 视频内容的翻译方法、装置、设备及计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933752B (zh) | 一种导出电子文档的方法和装置 | |
CN108762743B (zh) | 一种数据表操作代码生成方法及装置 | |
CN107783949B (zh) | 一种ppt文档的处理方法和装置 | |
CN101645010A (zh) | 代码自动生成系统及方法 | |
CN112905178B (zh) | 业务功能页面生成方法、装置、设备及介质 | |
CN111104151B (zh) | 一种基于Shell脚本的Git代码简化的管理方法 | |
CN110109981B (zh) | 工作队列的信息展示方法、装置、计算机设备和存储介质 | |
CN109783579B (zh) | 一种快速复制和翻译网站的方法 | |
JP7346332B2 (ja) | データベースマイグレーション方法、データベースマイグレーションシステム、及びデータベースマイグレーションプログラム | |
CN114489950A (zh) | 一种组件适配方法、装置、电子设备及存储介质 | |
CN111061469B (zh) | Web前端源代码生成方法、装置、存储介质及处理器 | |
CN113656005A (zh) | 应用组件库构建方法、应用组件配置方法及相关装置 | |
CN112182469A (zh) | 一种网站页面多语种自动复制及翻译方法 | |
CN110941471A (zh) | 一种软件系统基础数据国际化的方法及装置 | |
CN112597123A (zh) | 数据多版本动态切换方法及装置 | |
CN110007994B (zh) | 一种软件国际化方法及系统 | |
CN113408736B (zh) | 语音语义模型的处理方法和装置 | |
JP2019079165A (ja) | 編集プログラム、編集装置、及び、編集方法 | |
CN113961300A (zh) | 一种iOS APP字符串资源文件翻译方法及系统 | |
CN113010232A (zh) | 配置驱动的轻量级批量数据处理方法及装置 | |
CN112817578B (zh) | 嵌入r的动态更新检索函数参数并能自动复制执行的方法 | |
US20190019054A1 (en) | Contact Information Identification System | |
CN112905164A (zh) | 一种项目代码处理方法和装置 | |
CN113867986B (zh) | 一种接口数据处理方法、装置、设备及存储介质 | |
CN113778488B (zh) | 一种页面更新方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |