CN104281711B - Web应用多语言处理方法和装置 - Google Patents
Web应用多语言处理方法和装置 Download PDFInfo
- Publication number
- CN104281711B CN104281711B CN201410584772.4A CN201410584772A CN104281711B CN 104281711 B CN104281711 B CN 104281711B CN 201410584772 A CN201410584772 A CN 201410584772A CN 104281711 B CN104281711 B CN 104281711B
- Authority
- CN
- China
- Prior art keywords
- multilingual
- label
- text message
- dictionary
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title abstract description 4
- 238000010276 construction Methods 0.000 claims abstract description 9
- 238000003672 processing method Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 12
- 230000008520 organization Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了一种WEB应用多语言处理方法和装置,包括:根据需要支持的语言环境,建立字典文件目录结构,以键:值对的形式构造字典条目,形成多语言字典;如果需要对标签进行多语言处理,遍历文件对象模型DOM树,查找具有多语言属性的标签,获取标签的多语言属性值,查找多语言字典,获取当前语言环境的文本信息,将文本信息写入到标签;如果需要对提示信息进行多语言处理,根据提示信息的KEY值查询多语言字典,获取当前语言环境的文本信息,将文本信息写入到提示信息。本发明能够显示当前语言环境的文字,从而提高开发效率和节省开发成本。
Description
技术领域
本发明涉及互联网和网页WEB技术领域,尤其涉及一种WEB应用多语言处理方法和装置。
背景技术
随着互联网和WEB技术的不断发展,很多网站和WEB应用逐步走向国际化,WEB应用的多国语言环境访问已逐渐成为常态,这就给应用系统提出了多语言支持的要求,例如在具体应用中标签显示、提示信息等都要与当前语言环境相符。
现有的技术方案基本是做多套页面方式,即每个页面文件分别做不同语言的版本,这样做存在如下问题:修改某个逻辑问题需要变更各语言版本的N个页面,维护工作量大;增加新语言支持的场合,需要将页面复制一遍,然后修改各个文件中的文本,成本较高。
有鉴于此,需要一种改进的WEB应用多语言处理方法来解决现有技术的问题。
发明内容
为了解决上述技术问题,本发明提供了一种WEB应用多语言处理方法和装置,能够实现WEB应用页面标签和提示信息的多语言处理,使应用显示与当前语言环境相符的文字和提示信息,从而提高开发效率和节省开发成本。
为了达到本发明目的,本发明提供了一种WEB应用多语言处理方法,包括:根据需要支持的语言环境,建立字典文件目录结构,以键KEY:值VALUE对的形式构造字典条目,形成多语言字典;如果需要对标签进行多语言处理,遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签;如果需要对提示信息进行多语言处理,根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息。
进一步地,所述多语言字典采用JSON格式;所述KEY:VALUE对中的KEY值对应多语言属性值或提示信息的KEY值。
进一步地,所述遍历DOM树之前,还包括:对需要多语言处理的标签定义多语言属性,并设置多语言属性值,所述多语言属性值对应多语言字典的字典条目的KEY值,其中,标签是超文本标记语言HTML标签。
进一步地,所述遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签,包括:在HTML页面加载DOM,遍历DOM树;获取HTML标签列表;获取一个所述HTML标签列表中标签;检查所述标签是否存在多语言属性,如果存在,获取所述标签的多语言属性值,根据所述多语言属性值查询多语言字典,获取当前语言环境的文本信息;将所述文本信息写入到所述标签,显示与当前语言环境相符的标签文字。
进一步地,所述根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息,包括:如果需要显示提示信息,调用所述提示信息的处理程序;所述处理程序根据提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息;将文本信息写入到所述提示信息,显示与当前语言环境相符的提示信息文字。
一种用于WEB应用多语言处理的装置,包括:多语言字典存储模块,用于根据需要支持的语言环境,建立字典文件目录结构,以KEY:VALUE对的形式构造字典条目,形成多语言字典;标签多语言处理模块,用于如果需要对标签进行多语言处理,遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签;提示信息多语言处理模块,用于如果需要对提示信息进行多语言处理,根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息。
进一步地,所述多语言字典采用JSON格式;所述KEY:VALUE对中的KEY值对应多语言属性值或提示信息的KEY值。
进一步地,所述标签多语言处理模块,还用于对需要多语言处理的标签定义多语言属性,并设置多语言属性值,所述多语言属性值对应多语言字典的字典条目的KEY值,其中,标签是超文本标记语言HTML标签。
进一步地,所述标签多语言处理模块,具体用于:在HTML页面加载DOM,遍历DOM树;获取HTML标签列表;获取一个所述HTML标签列表中标签;检查所述标签是否存在多语言属性,如果存在,获取所述标签的多语言属性值,根据所述多语言属性值查询多语言字典,获取当前语言环境的文本信息;将所述文本信息写入到所述标签,显示与当前语言环境相符的标签文字。
进一步地,所述提示信息多语言处理模块,具体用于:如果需要显示提示信息,调用所述提示信息的处理程序;所述处理程序根据提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息;将文本信息写入到所述提示信息,显示与当前语言环境相符的提示信息文字。
与现有技术相比,本发明包括:根据需要支持的语言环境,建立字典文件目录结构,以键KEY:值VALUE对的形式构造字典条目,形成多语言字典;如果需要对标签进行多语言处理,遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签;如果需要对提示信息进行多语言处理,根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息。本发明基于JavaScript进行WEB应用多语言处理,可实现WEB应用页面标签和提示信息的多语言处理,使应用显示与当前语言环境相符的文字和提示信息;对于开发者,只需维护一套页面,就可以实现各语言环境共享;此外,增加新语言支持,只需要翻译现有语言文件为目标语言文件,无需逐个文件查找修改,从而可大大提高开发效率、节省开发成本。
附图说明
图1是本发明WEB应用多语言处理方法的流程示意图。
图2是本发明字典文件目录的结构示意图。
图3是本发明多语言字典的存储结构示意图。
图4是本发明多语言属性的存储结构示意图。
图5是本发明对标签进行多语言处理的流程示意图。
图6是本发明对提示信息进行多语言处理的流程示意图。
图7是本发明用于WEB应用多语言处理的装置的结构示意图。
具体实施方式
下面结合附图对本发明进行进一步的详细说明。通过足够详细的描述这些实施示例,使得本领域技术人员能够实践本发明。在不脱离本发明的主旨和范围的情况下,可以对实施做出逻辑的、实现的和其他的改变。
图1是本发明WEB应用多语言处理方法的流程示意图,如图1所示,具体可以包括:
步骤11,根据需要支持的语言环境,建立字典文件目录结构,以键KEY:值VALUE对的形式构造字典条目,形成多语言字典。
在本步骤中,字典文件目录的结构示意图可以如图2所示,在Web content的message下存在message_en和message_zh_cn两种需要支持的语言。
以KEY:VALUE对的形式构造字典条目,形成JSON(JavaScript Object Notation)格式的多语言字典,其中,KEY对应多语言属性值或提示信息的KEY值。
多语言字典的存储结构示意图可以如图3所示,JSON格式就是若干个KEY:VALUE对的集合。
步骤12,如果需要对标签进行多语言处理,遍历文件对象模型(DOM,DocumentObject Model)树,查找具有多语言属性的标签,获取该标签的多语言属性值,查找多语言字典,获取当前语言环境的文本信息,将文本信息写入到该标签。
在本步骤之前,对需要多语言处理的标签定义多语言属性,并设置属性值,该属性值对应多语言字典的字典条目的KEY值,其中,标签可以是超文本标记语言(HTML,HyperText Mark-up Language)标签,且HTML标签多语言属性的存储结构示意图如4所示。
在本步骤中,可以包括如图5所示的子步骤,具体为:
步骤121,在HTML页面加载DOM,遍历DOM树;
步骤122,获取HTML标签列表;
步骤123,获取一个HTML标签列表中标签;
具体地,可以依次获取HTML标签列表中标签或者按照设定顺序获取HTML标签列表中标签。
步骤124,检查标签是否存在多语言属性,如果存在,进入步骤125;如果不存在,返回步骤123。
步骤125,获取标签的多语言属性值,根据多语言属性值查询多语言字典,获取当前语言环境的文本信息;
步骤126,将文本信息写入到该标签,显示与当前语言环境相符的标签文字;
如此,完成标签的多语言处理。
步骤13,如果需要对提示信息进行多语言处理,根据提示信息的KEY值查询字典,获取当前语言环境的文本信息,将文本信息写入到该提示信息。
本步骤中,具体可以包括如图6所示的子步骤,具体为:
步骤131,如果需要显示提示信息,调用该提示信息的处理程序;
步骤132,该处理程序根据提示信息的KEY值查询字典,获取当前语言环境的文本信息;
步骤133,将文本信息写入到该提示信息,显示与当前语言环境相符的提示信息文字;
如此,完成提示信息的多语言处理。
图7是本发明用于WEB应用多语言处理的装置的结构示意图,如图6所示,具体可以包括:
多语言字典存储模块,用于根据需要支持的语言环境,建立字典文件目录结构,以KEY:VALUE对的形式构造字典条目,形成多语言字典;
标签多语言处理模块,用于如果需要对标签进行多语言处理,遍历DOM树,查找具有多语言属性的标签,获取该多语言属性值,查找多语言字典,获取当前语言环境的文本信息,将文本信息写入到该标签;
提示信息多语言处理模块,用于如果需要对提示信息进行多语言处理,根据提示信息KEY值查询字典,获取当前语言环境的文本信息,将文本信息写入到该提示信息。
用于WEB应用多语言处理的装置是和WEB应用多语言处理方法对应的,因此,用于WEB应用多语言处理的装置具体的实现细节可参看WEB应用多语言处理方法,在此不赘述。
本发明基于JavaScript进行WEB应用多语言处理,可实现WEB应用页面标签和提示信息的多语言处理,使应用显示与当前语言环境相符的文字和提示信息;对于开发者,只需维护一套页面,就可以实现各语言环境共享;此外,增加新语言支持,只需要翻译现有语言文件为目标语言文件,无需逐个文件查找修改,从而可大大提高开发效率、节省开发成本。
应当理解,虽然本说明书根据实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用于限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (8)
1.一种WEB应用多语言处理方法,其特征在于,包括:
根据需要支持的语言环境,建立字典文件目录结构,以键KEY:值VALUE对的形式构造字典条目,形成多语言字典;
如果需要对标签进行多语言处理,遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签,
其中,所述遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签,包括:
在HTML页面加载DOM,遍历DOM树;获取HTML标签列表;获取一个所述HTML标签列表中标签;检查所述标签是否存在多语言属性,如果存在,获取所述标签的多语言属性值,根据所述多语言属性值查询多语言字典,获取当前语言环境的文本信息;将所述文本信息写入到所述标签,显示与当前语言环境相符的标签文字;
如果需要对提示信息进行多语言处理,根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息。
2.根据权利要求1所述的WEB应用多语言处理方法,其特征在于,
所述多语言字典采用JSON格式;
所述KEY:VALUE对中的KEY值对应多语言属性值或提示信息的KEY值。
3.根据权利要求1所述的WEB应用多语言处理方法,其特征在于,所述遍历DOM树之前,还包括:
对需要多语言处理的标签定义多语言属性,并设置多语言属性值,所述多语言属性值对应多语言字典的字典条目的KEY值,其中,标签是超文本标记语言HTML标签。
4.根据权利要求1所述的WEB应用多语言处理方法,其特征在于,所述根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息,包括:
如果需要显示提示信息,调用所述提示信息的处理程序;所述处理程序根据提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息;将文本信息写入到所述提示信息,显示与当前语言环境相符的提示信息文字。
5.一种用于WEB应用多语言处理的装置,其特征在于,包括:
多语言字典存储模块,用于根据需要支持的语言环境,建立字典文件目录结构,以KEY:VALUE对的形式构造字典条目,形成多语言字典;
标签多语言处理模块,用于如果需要对标签进行多语言处理,遍历文件对象模型DOM树,查找具有多语言属性的标签,获取所述标签的多语言属性值,查找所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述标签,
其中,所述标签多语言处理模块,具体用于:在HTML页面加载DOM,遍历DOM树;获取HTML标签列表;获取一个所述HTML标签列表中标签;检查所述标签是否存在多语言属性,如果存在,获取所述标签的多语言属性值,根据所述多语言属性值查询多语言字典,获取当前语言环境的文本信息;将所述文本信息写入到所述标签,显示与当前语言环境相符的标签文字;
提示信息多语言处理模块,用于如果需要对提示信息进行多语言处理,根据所述提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息,将所述文本信息写入到所述提示信息。
6.根据权利要求5所述的用于WEB应用多语言处理的装置,其特征在于,所述多语言字典采用JSON格式;所述KEY:VALUE对中的KEY值对应多语言属性值或提示信息的KEY值。
7.根据权利要求5所述的用于WEB应用多语言处理的装置,其特征在于,所述标签多语言处理模块,还用于对需要多语言处理的标签定义多语言属性,并设置多语言属性值,所述多语言属性值对应多语言字典的字典条目的KEY值,其中,标签是超文本标记语言HTML标签。
8.根据权利要求5所述的用于WEB应用多语言处理的装置,其特征在于,所述提示信息多语言处理模块,具体用于:如果需要显示提示信息,调用所述提示信息的处理程序;所述处理程序根据提示信息的KEY值查询所述多语言字典,获取当前语言环境的文本信息;将文本信息写入到所述提示信息,显示与当前语言环境相符的提示信息文字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410584772.4A CN104281711B (zh) | 2014-10-27 | 2014-10-27 | Web应用多语言处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410584772.4A CN104281711B (zh) | 2014-10-27 | 2014-10-27 | Web应用多语言处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104281711A CN104281711A (zh) | 2015-01-14 |
CN104281711B true CN104281711B (zh) | 2018-04-27 |
Family
ID=52256584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410584772.4A Active CN104281711B (zh) | 2014-10-27 | 2014-10-27 | Web应用多语言处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104281711B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978394A (zh) * | 2015-05-08 | 2015-10-14 | 安徽机电职业技术学院 | 支持多语种显示的网页标签数据组织更新方法 |
CN107203405A (zh) * | 2017-06-23 | 2017-09-26 | 郑州云海信息技术有限公司 | 一种检查多语言定义的方法和装置 |
CN108536688A (zh) * | 2018-04-23 | 2018-09-14 | 苏州大学 | 发现全网多语言网站并获得平行语料的方法 |
CN109344412A (zh) * | 2018-09-20 | 2019-02-15 | 五八有限公司 | 一种语言转换方法、装置、设备及存储介质 |
CN111159616B (zh) * | 2019-12-31 | 2023-04-14 | 深圳市丰润达科技有限公司 | 基于多语言的交换机管理方法、装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079041A (zh) * | 2006-12-29 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种更新动态网页的方法及系统 |
US7447624B2 (en) * | 2001-11-27 | 2008-11-04 | Sun Microsystems, Inc. | Generation of localized software applications |
CN101676904A (zh) * | 2008-09-19 | 2010-03-24 | 中兴通讯股份有限公司 | 一种Web应用系统多语化的方法和装置 |
CN101840402A (zh) * | 2009-03-18 | 2010-09-22 | 日电(中国)有限公司 | 从多语言网站构建多语言的对象层次结构的方法和系统 |
CN102364437A (zh) * | 2011-09-22 | 2012-02-29 | 厦门游家网络有限公司 | 多语言站点开发系统及其实现方法 |
CN102567384A (zh) * | 2010-12-29 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 基于网页浏览器引擎的网页多语言动态切换方法及系统 |
-
2014
- 2014-10-27 CN CN201410584772.4A patent/CN104281711B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7447624B2 (en) * | 2001-11-27 | 2008-11-04 | Sun Microsystems, Inc. | Generation of localized software applications |
CN101079041A (zh) * | 2006-12-29 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种更新动态网页的方法及系统 |
CN101676904A (zh) * | 2008-09-19 | 2010-03-24 | 中兴通讯股份有限公司 | 一种Web应用系统多语化的方法和装置 |
CN101840402A (zh) * | 2009-03-18 | 2010-09-22 | 日电(中国)有限公司 | 从多语言网站构建多语言的对象层次结构的方法和系统 |
CN102567384A (zh) * | 2010-12-29 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 基于网页浏览器引擎的网页多语言动态切换方法及系统 |
CN102364437A (zh) * | 2011-09-22 | 2012-02-29 | 厦门游家网络有限公司 | 多语言站点开发系统及其实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104281711A (zh) | 2015-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | A robustly optimized BERT pre-training approach with post-training | |
CN104281711B (zh) | Web应用多语言处理方法和装置 | |
US9208136B2 (en) | Automated document revision markup and change control | |
CN105022803B (zh) | 一种提取网页正文内容的方法及系统 | |
CN104809176A (zh) | 藏语实体关系抽取方法 | |
US10417335B2 (en) | Automated quantitative assessment of text complexity | |
CN104331438B (zh) | 对小说网页内容选择性抽取方法和装置 | |
CN103294781A (zh) | 一种用于处理页面数据的方法与设备 | |
CN109976840A (zh) | 一种基于前后台分离平台下实现多语言自动适配的方法及系统 | |
CN102651002A (zh) | 一种网页信息抽取方法及其系统 | |
CN104978394A (zh) | 支持多语种显示的网页标签数据组织更新方法 | |
US11120362B2 (en) | Identifying a product in a document | |
Rousinopoulos et al. | Sentiment analysis of free/open source developers: preliminary findings from a case study | |
US20160041974A1 (en) | Enhancing textual searches with executables | |
Modi et al. | Part-of-speech tagging of Hindi corpus using rule-based method | |
Bu et al. | An FAR-SW based approach for webpage information extraction | |
Ngo et al. | EVBCorpus-a multi-layer English-Vietnamese bilingual corpus for studying tasks in comparative linguistics | |
KR20210098813A (ko) | 텍스트 데이터 수집과 분석 장치 및 방법 | |
US11048707B2 (en) | Identifying a product in a document | |
Han et al. | An automatic web news article contents extraction system based on RSS feeds | |
Sarma et al. | Building multilingual lexical resources using wordnets: Structure, design and implementation | |
CN114490709B (zh) | 文本生成方法、装置、电子设备及存储介质 | |
Kim et al. | Correcting Misspelled Words in Twitter Text | |
Han et al. | Attribute Value Extraction Based on Rule Matching | |
Rai et al. | A Karaka based approach to cross lingual sentiment analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |