WO2013177905A1 - 支持多国语言的网页处理方法、网页加载方法及其系统 - Google Patents

支持多国语言的网页处理方法、网页加载方法及其系统 Download PDF

Info

Publication number
WO2013177905A1
WO2013177905A1 PCT/CN2012/084784 CN2012084784W WO2013177905A1 WO 2013177905 A1 WO2013177905 A1 WO 2013177905A1 CN 2012084784 W CN2012084784 W CN 2012084784W WO 2013177905 A1 WO2013177905 A1 WO 2013177905A1
Authority
WO
WIPO (PCT)
Prior art keywords
language
file
translation
xml
string
Prior art date
Application number
PCT/CN2012/084784
Other languages
English (en)
French (fr)
Inventor
吴飏
石炎明
万鹏
向晓
张小媛
Original Assignee
杭州海康威视数字技术股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杭州海康威视数字技术股份有限公司 filed Critical 杭州海康威视数字技术股份有限公司
Priority to EP12877824.8A priority Critical patent/EP2857984B1/en
Priority to US14/404,791 priority patent/US20150121199A1/en
Publication of WO2013177905A1 publication Critical patent/WO2013177905A1/zh
Priority to US15/184,652 priority patent/US10417348B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/197Version control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3088Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/70Type of the data to be coded, other than image and sound
    • H03M7/707Structured documents, e.g. XML

Definitions

  • Webpage processing method supporting multi-language, webpage loading method and system thereof
  • the invention relates to the field of computer network applications, in particular to a webpage implementation technology supporting multiple languages.
  • Each web page writes an HTML file for each language, and reloads the Hypertext Makeup Language ("HTML”) file of the corresponding national language when switching languages;
  • HTML Hypertext Makeup Language
  • Each web page corresponds to an HTML file and a translation file.
  • the translation file is usually but not limited to an extensible Markup Language (“XML”) file (the following uses an XML file as a translation file to show Description), the XML file establishes a node set for each language, and extracts a string (hereinafter referred to as a "language string”) that is dynamically inserted in the HTML file or dynamically inserted through the web script code, and is different from each country language, and By indexing a string associated with a collection of language nodes in the XML file, loading the web page or When the language is switched, the string in the HTML file is replaced by the index from the set of national language nodes corresponding to the XML file;
  • XML extensible Markup Language
  • Each web page corresponds to an HTML file, and an XML file is written for each language, the language string in the HTML file is extracted and associated with the string in each XML file through the index, and the web page is loaded or the language is switched.
  • the string in the HTML file is replaced by an index from the XML file of the corresponding national language.
  • the language string in the web page is soft-coded (that is, the language string) Separated from the HTML file), but the language types supported by the product are hard-coded in the Web script code, so you need to modify the source code each time you provide a product that supports a collection of different languages.
  • the currently known three schemes are based on the id attribute of a label containing a language string in the HTML file (hereinafter referred to as "language label") as an index key with the XML file, and the World Wide Web Consortium requires an HTML file.
  • language label a language string in the HTML file
  • the id attribute of all tags in the tag is not repeatable, so that the tag of the same language string displayed in different positions in an HTML file must be assigned different location attributes, and repeated in the corresponding XML file;
  • the object of the present invention is to provide a webpage processing method, a webpage loading method and a system thereof, which support multi-language, and reduce the time and cost of manual investment when adding or tampering with a certain national language.
  • the storage capacity of the provincial web server increases the speed of page loading and translation rendering and reduces the redundancy of the translated file set.
  • an embodiment of the present invention discloses a webpage processing method supporting multiple languages, a translation file set based on a tree structure, wherein each hypertext markup language
  • the HTML file has a corresponding translation file, including the following steps: scanning all translation files in the translation file set; extracting the same language string in different translation files or different node sets of the same translation file, and inserting into the different translation file The smallest common ancestor translation file or a common node set of the same translation file; the same language string in the original translation file or node collection is deleted.
  • the embodiment of the present invention further discloses a webpage loading method supporting multiple languages, based on a tree structure translation file set, wherein each hypertext markup language HTML file has a corresponding translation file, and is characterized in that it includes the following Step: downloading, from the server, a translation file corresponding to the current HTML file and all ancestor translation files corresponding to the translation file; and merging the language string of the translated file with a language string common to all ancestral translation files;
  • the embodiment of the invention also discloses a webpage processing system supporting multiple languages, based on a tree structure translation file set, wherein each hypertext markup language HTML file has a corresponding translation file, including the following modules: Scanning module , for scanning all translation files in the translation file set; an extraction module, configured to extract different translation files scanned by the scanning module or the same language strings in different node sets of the same translation file; An insertion module, configured to insert the same language string extracted by the extraction module into a minimum common ancestor translation file of the different translation file or a common node collection of the same translation file; a deletion module, configured to use the original translation file or node set And the same language string extracted by the above extraction module is deleted.
  • Scanning module for scanning all translation files in the translation file set
  • an extraction module configured to extract different translation files scanned by the scanning module or the same language strings in different node sets of the same translation file
  • An insertion module configured to insert the same language string extracted by the extraction module into a minimum common ancestor translation file of the different
  • the embodiment of the invention also discloses a webpage loading system supporting multiple languages, based on a tree structure translation file set, wherein each hypertext markup language HTML file has a corresponding translation file, including the following modules: Download module , for downloading an XML file corresponding to the current HTML file from the server and all ancestor XML files corresponding to the XML file; a merge module, a language common to the language string of the XML file downloaded by the download module and all of its ancestor XML files String merging; translation rendering module, used to insert or replace the language tag content of the merged module into the language tag content of the HTML file for multi-language display or switching.
  • Download module for downloading an XML file corresponding to the current HTML file from the server and all ancestor XML files corresponding to the XML file
  • a merge module a language common to the language string of the XML file downloaded by the download module and all of its ancestor XML files String merging
  • translation rendering module used to insert or replace the language tag
  • the storage capacity of the web server can be saved, and the page loading can be improved. And the speed of rendering rendering, and reducing the redundancy of the set of translated file files.
  • the language category collection and default language supported by the product are stored in a separate XML file in a soft-coded manner, and the XML file sets in each language are saved in their respective folders. You don't need to modify the source code of web pages and scripts every time you need to provide products that support different national language collections or different default languages.
  • callback queue technology when the user selects to switch languages or when the webpage is loaded, only a small number of callback functions in the queue can be executed, thereby improving the response speed of the webpage or the webpage when the user selects the language to be switched, and simultaneously solving the problem.
  • switch languages it is not possible to replace dynamic language strings or to refresh web pages while switching languages.
  • FIG. 1 is a schematic flowchart of a method for processing a webpage supporting multiple languages in a first embodiment of the present invention
  • FIG. 2 is a schematic diagram showing a relationship between a language type, an HTML file, and an XML file of a webpage processing method supporting multi-language
  • FIG. 4 is a schematic diagram of a workflow of the second language and the language supported by the added web page
  • FIG. 5 is a schematic diagram of a workflow of the second country and the language supported by the added web page
  • FIG. 6 is a schematic diagram of a webpage processing system supporting multi-language in a fifth embodiment of the present invention
  • FIG. 7 is a schematic structural diagram of a webpage processing system supporting multi-language in a sixth embodiment of the present invention
  • FIG. 8 is a schematic structural diagram of a webpage loading system supporting multi-language according to a seventh embodiment of the present invention
  • It is a schematic structural diagram of a webpage loading system supporting multiple languages in the eighth embodiment of the present invention.
  • FIG. 1 is a schematic flowchart of the method for processing a webpage supporting multiple languages.
  • the multi-language webpage processing method is based on a tree-structured translation file set, wherein each hypertext markup language HTML file has a corresponding translation file. Specifically, as shown in FIG.
  • the multi-language webpage processing method includes the following steps: In step 101, all translation files in the translation file set are scanned. Thereafter, proceeding to step 102, different translation files or the same language string in different node sets of the same translation file are extracted. Thereafter, proceeding to step 103, inserting the extracted same language string into the different translation The smallest common ancestor translation file of the file or a collection of common nodes of the same translation file. Thereafter, proceeding to step 104, the same language string in the original translation file or node set is deleted. This process ends thereafter.
  • HTML Hypertext Makeup Language
  • XML extensible Markup Language
  • a relationship can also be a many-to-one relationship.
  • the "one-to-one" relationship between an HTML file and an XML file is: For a certain language, the language string in an HTML file is saved in a corresponding translation file. in.
  • the "many-to-one" relationship between an HTML file and a translated file is: For a country's language, the language strings in multiple HTML files are stored in different node sets of the same translation file.
  • the language string is a hypertext markup language (Hyper Text Makeup)
  • FIG. 2 is a schematic diagram of the relationship between the language type, the HTML file, and the XML file of the multi-language webpage processing method
  • FIG. 3 and FIG. 4 are schematic flowcharts of the multi-language webpage processing method.
  • the second embodiment is improved on the basis of the first embodiment, and the main improvement is that: by using a tree-like extensible markup language XML file set corresponding to a language type, the product development process can be reduced.
  • the language category set and the default language supported by the product are stored in a separate XML file in a soft code manner, and the XML file sets of the respective languages are saved in their respective languages.
  • the folder You don't need to modify the source code of web pages and scripts every time you need to provide products that support different national language collections or different default languages. Just modify this XML file and remove or add the corresponding folder. Set a label with the same name attribute for a language string with the same literal value, and then write the attribute name to the key name of the same language string.
  • the same language string in the language XML file set while further reducing the redundancy of the language strings in the Extensible Markup Language XML fileset.
  • the translation file is an extensible markup language XML file; a tree-like extensible markup language XML file set corresponds to a language type.
  • the technical solution in the present invention is written in an extensible markup language XML file as a special case of a translation file.
  • the translation file may also use JSON (used to mark a data object or an array).
  • the language type L 2 corresponds to a tree-like extensible markup language XML file: ⁇ XML X , L2 I ⁇ A, B, CDE, p (A, B), p (A, B, CDE) ⁇ ⁇ .
  • the translation file is an extensible markup language XML file. Before scanning all the translation files in the translation file set, the following steps are also included:
  • the translation file is an Extensible Markup Language (XML) file.
  • the steps to scan all the translated files in the translation file set include the following steps:
  • the label setting of the HTML file corresponding to the same character string in the XML file is set to have the same name attribute '; '; the same name attribute is written to the key name of the same language string.
  • the multi-language-supported web page processing is to delete the same language string between multiple XML files while retaining only one copy to them.
  • HTML Hyper Text Makeup Language
  • XML extensible markup language
  • the closure is pushed into the pre-created callback queue to execute the code segment corresponding to each closure in the callback queue according to the principle of the advanced callback queue first execution when the webpage language is switched.
  • the context information is added to the Fimc A property, which is convenient for Fimc A internal code calls.
  • the workflow of the first language supported by the added web page includes the following steps: In step 301, the first language supported by the web page is confirmed, and the language file is written. XM L L file, as the default language L D . Thereafter, proceeding to step 302, a ⁇ 3 ⁇ attribute is added for the same language string tag in each HTML file.
  • step 303 a corresponding XML file group is written for each HTML file (because the web page supports only one language at this time, each XML file group has only one XML file).
  • step 304 the same language string is merged.
  • step 305 to revise or translate the language string for the first language. This process only has a revision string, which is primarily a translation string for languages in the second country and above.
  • step 306 the set of XML files is saved in the identified folder, and the process ends thereafter.
  • the workflow of the second country and above supported by the added web page includes the following steps:
  • step 401 the language file XML L file is expanded with the nth language L n supported by the web page, and the default language is confirmed.
  • step 402 to add an XML file of the new language L n to each XML file group.
  • the language string is revised or translated. Since the first language supported by the web page has been added, the merge operation is added, and when the second country and the above language L n is added, there is no need to repeat, just follow The existing L ⁇ XML file set can be translated into the L 2 language string. Therefore, the number of language strings to be translated will be reduced by "% (relative to prior art scheme 1 and prior art scheme 2).
  • step 404 the XML file set of L n is saved in the folder identified by L n , and the flow is terminated thereafter.
  • FIG. 5 is a schematic flowchart of the method for loading a webpage supporting multiple languages.
  • the multi-language webpage loading method is based on a tree-structured translation file set, wherein each hypertext markup language HTML file has a corresponding translation file. Specifically, as shown in FIG.
  • the multi-language-supporting webpage loading method includes the following steps: In step 501, downloading a translation file corresponding to a current HTML file from the server and the flipping All ancestor translation files corresponding to the translated file. Thereafter, proceeding to step 502, the language string of the translated file is merged with the language string common to all of the ancestral translation files. Thereafter, proceeding to step 503, the merged language string is inserted or replaced with the language tag content of the HTML file for multi-language display or switching. This process ends thereafter.
  • step 501 downloading a translation file corresponding to a current HTML file from the server and the language string common to all of the ancestral translation files, and rendering the merged language string, the storage capacity of the web server can be saved, and the page loading can be improved.
  • HTML Hypertext Makeup Language
  • XML extensible Markup Language
  • a relationship can also be a many-to-one relationship.
  • the "one-to-one" relationship between an HTML file and an XML file is: For a certain language, the language string in an HTML file is saved in the corresponding XML file. in.
  • the "many-to-one" relationship between an HTML file and an XML file is: For a country's language, the language strings in multiple HTML files are stored in different node sets of the same XML file.
  • the language string is a hypertext markup language (Hyper Text Makeup Language (“HTML”) file which is different from the languages of different countries, and needs to be replaced when the webpage switches languages, and also includes script code through webpages.
  • HTML Hyper Text Makeup Language
  • the server may also be referred to as a web server, and when referred to as a web server, the client is a browser that browses the web page.
  • a fourth embodiment of the present invention relates to a web page loading method supporting multiple languages.
  • a tree-like extensible markup language XML file set corresponds to a language type, which can reduce the workload of adding new languages and maintaining existing languages during product development. Use the attribute value of the tag with the same name attribute as the index key when the page language is switched or when the page is loaded, to correlate the scan to find the same language string in the Extensible Markup Language XML file set, while further reducing the Extensible Markup Language XML Redundancy of language strings in a file set.
  • the translation file is an extensible markup language XML file; a tree-like extensible markup language XML file set corresponds to a language type.
  • the translation file is an extensible markup language XML file.
  • the following substeps are also included: Combining the XML file and all its ancestor XML files into A document structure; in the merged document structure, the key name of the scanned language string; the scanned key name is used as an index to insert or replace the language tag content of the HTML file.
  • Hypertext Markup Language Hyper Text Makeup Language
  • the name of the 'HTML' is the name attribute of the language tag in the file. It is used as an index key between the file and the extensible markup language ("XML") file, and is processed by the webpage supporting the multi-language ( Or the "merge up" operation, compared with the id attribute of the language tag in the HTML file in the prior art scheme 1 and the prior art scheme 2 as an index key with the XML file, and the merge operation
  • the method when the large-capacity web page is switched between languages or when the web page is loaded, the number of language strings that need to be revised will be significantly reduced, and the redundancy between the language strings is almost zero, that is, there is almost no existence.
  • the same repeated language string needs to be revised, where the reduction of the language string that needs to be revised is related to the number of web pages or web pages, the number of repeated strings between the web page and the web page, to 30 HTML
  • the webpage product of the document, r% usually reaches 20-40%.
  • the code segment corresponding to each closure, wherein the closure is created by a corresponding code segment related to the dynamic language string in the HTML file, and the callback queue can be empty.
  • the technical solution of the present invention can be implemented by the following process:
  • L XML file
  • C L language type set
  • L D default language supported by the product.
  • the browser's current language (L B ) is first determined. If L B e C L , L B is displayed as the default language of the web page. Otherwise, L D is used as the default language of the web page. display.
  • Each XML file in the group saves a string of a national language (L 1 L CL ), and the name attribute of the language tag in the HTML file is used as the XML file. Index key. Save the XML files of the same language to form an XML file set ( ⁇ XML L1 ⁇ ), which is saved in the folder identified by . 3.
  • Each XML file (XML A ) contains at least one collection of nodes named after this file name (A ) (XML A ⁇ A> ) and a collection of common nodes (XML A ⁇ com> ).
  • XML A and XML B have the same ancestor (possibly XML A and XML B are the same level, or XML A may be the same or opposite to the ancestor of XML B , it is also possible that XML A is the ancestor of XML B or vice versa), and XML A With the same strings S A and S B in XML B , add characters in the public node set of XMLA and XMLB's public minimum ancestor XML file ( XMLp(AB) ) ( XML p(AB) ⁇ com> ) String S AB ( ), And in XM L A S A and XM L B S B is deleted (this hereinafter referred to as the cartridge "put on the merge").
  • HTML file There is no need between the HTML file and the XML file - the corresponding (hereinafter referred to as "one-to-one" relationship), or multiple HTML files can be associated with the same set of XML files (the following is called “many-to-one," For example, three HTML files (HTML C , HTML D, and HTML E ) are associated with the same set of XML files ( ⁇ XML CDE , Li I ⁇ CJ ), and the language strings of HTML C , HTML D, and HTML E are stored in XML CDE , respectively.
  • node set XML CDE ⁇ C>, node set XML CDE ⁇ D> and node set XML CDE ⁇ E> while establishing a common node set XMI_ CDE ⁇ com> in the XML CDE in.
  • the three XML files marked with a diagonal stripe background constitutes an XML file group described in Technical Solution 2, where HTML A , HTML B, and their corresponding XML file groups ( ⁇ XML A , Li ⁇ , ⁇ XML B , Li ⁇ ) is a "one-to-one,, relationship between HTML C , HTML D.
  • HTML E and a common XML file group ( ⁇ XML CDE , Li
  • the file set ⁇ XML X , U ⁇ consists of three levels.
  • XML P(A , B ) U is the parent XML of XML A and XML B
  • XML P(A , B, CDE) LI is XML P(A , B ), parent XML of L1 and XML CDE .
  • Leaf XML for "one-to-one" relationship ( The public node set of XML B , U ) ( 1 ⁇ /11_ ⁇ 1 ( ⁇ > and XML B , L1 ⁇ com> ) is an empty set of 0.
  • XML for "one-to-one" relationship ( The public node set of XML B , U ) ( 1 ⁇ /11_ ⁇ 1 ( ⁇ > and XML B , L1 ⁇ com> ) is an empty set of 0.
  • XML for "one-to-one" relationship ( The public node set of XML B , U ) ( 1 ⁇ /11_ ⁇ 1 (
  • non-common node set (XML p(A , B ), L1 ⁇ p(A, B) ⁇ p XML p(A , B, cD E ), Li ⁇ p(A ) B , CDE)> ) may be 0 or non-zero.
  • XML P(A , B ), L1 Take XML P(A , B ), L1 as an example.
  • HTML A and HTML B act as HTML AB 's inline frame iframe containing another document or by using asynchronous data transfer between the browser and the web server ( Asynchronous JavaScript and XML, referred to as "Ajax" )
  • Asynchronous JavaScript and XML referred to as "Ajax"
  • L1 corresponds to HTML AB
  • L1 ⁇ p(A, B)> holds XML P(A , B ) , the language string in L1 , at this time XML p ( A , B ), L1 ⁇ p(A,B)> ⁇ 0.
  • the merging between XML can be performed not only between two XMLs, but also between multiple XMLs, such as (for example, between three XMLs):
  • the method embodiments of the present invention can all be implemented in software, hardware, firmware, and the like. Whether the invention is implemented in software, hardware, or firmware, the instruction code can be stored in any type of computer-accessible memory (eg, permanent or modifiable, volatile or non-volatile, solid state Or non-solid, fixed or replaceable media, etc.).
  • the memory may be, for example, Programmable Array Logic ("PAL"), Random Access Memory (RAM), Programmable Read Only Memory (Programmable Read Only Memory) Called “PROM”), Read-Only Memory (“ROM”), Electrically Erasable Programmable ROM (EEPROM), Disk, Disc, Digital General CD (Digital Versatile Disc, "DVD”) and so on.
  • PAL Programmable Array Logic
  • RAM Random Access Memory
  • PROM Programmable Read Only Memory
  • ROM Read-Only Memory
  • EEPROM Electrically Erasable Programmable ROM
  • Disk Disc
  • Digital General CD Digital Versatile Disc, "DVD" and so
  • FIG. 6 is a schematic structural diagram of the webpage processing system supporting the multi-language.
  • the multi-language web page processing system A translation file set based on a tree structure, wherein each Hypertext Markup Language HTML file has a corresponding translation file, including the following modules: a scanning module for scanning all translation files in the translation file set; an extraction module, for Extracting different translation files scanned by the scanning module or the same language string in different node sets of the same translation file; inserting module, for inserting the same language string extracted by the extraction module into the minimum of the different translation files A public ancestor translation file or a common node set of the same translation file; a deletion module, configured to delete the same language string extracted from the original translation file or the node collection and extracted by the extraction module.
  • HTML Hypertext Makeup Language
  • XML extensible Markup Language
  • the "one-to-one" relationship between an HTML file and an XML file is: For a certain language, the language string in an HTML file is saved in the corresponding XML file. in.
  • the "many-to-one" relationship between an HTML file and an XML file is: For a country's language, the language strings in multiple HTML files are stored in different node sets of the same XML file.
  • the language string is a hypertext markup language (Hyper Text Makeup Language (“HTML”) file which is different from the languages of different countries, and needs to be replaced when the webpage switches languages, and also includes script code through webpages.
  • HTML Hyper Text Makeup Language
  • the first embodiment is implemented in cooperation with each other.
  • the related technical details mentioned in the first embodiment are still effective in the present embodiment, and are not described herein again in order to reduce repetition. Accordingly, the related technical details mentioned in the present embodiment can also be applied to the first embodiment.
  • a sixth embodiment of the present invention relates to a web page processing system supporting multiple languages.
  • Fig. 7 is a schematic structural view of the webpage processing system supporting the multi-language.
  • the sixth embodiment is improved on the basis of the fifth embodiment, and the main improvement is that: the XML file set of the extensible markup language through a tree structure corresponds to a language type, which can reduce the addition in the product development process.
  • the language categories supported by the web page processed in the language file the language category set and the default language supported by the product are stored in a separate XML file in a soft code manner, and the XML file sets of the respective languages are saved in their respective languages.
  • the translated file is an extensible markup language XML file
  • a tree-like extensible markup language XML file set corresponds to a language type.
  • the multi-language webpage processing system further includes the following modules: a query module, configured to query a language file for a language type supported by a webpage switch, wherein the language file is used to save a collection of language types supported by the webpage and a default language. ;
  • the selection module is configured to select an extensible markup language XML file set corresponding to the tree structure according to a language type supported by the webpage queried by the query module.
  • the translation file is an extensible markup language XML file.
  • the multi-language web processing system also includes the following modules: a setting module, configured to set a label having an identical name for an HTML file corresponding to the same string in the XML file; a writing module, configured to write the same name attribute set by the setting module to the same language The key name of the string.
  • the multi-language-supported web page processing is to delete the same language string between multiple XML files while retaining only one copy to them.
  • the public node collection of public minimum ancestor-level XML files or the operation of a common ancestor Or delete the same language string between different node sets in the same XML file, while retaining only one operation to the public node set or common ancestor.
  • HTML Hyper Text Makeup Language
  • XML extensible markup language
  • r% can usually reach 20-40%.
  • the multi-language web processing system also includes the following modules:
  • a queue module configured to pre-create a corresponding closure for each code segment related to the dynamic language string in the HTML file, and push the closure into the pre-created callback queue; the callback module is used when the webpage language is switched According to the principle that the advanced callback queue is executed first, the code segment corresponding to each closure in the callback queue is executed.
  • the callback queue CbQueue is created in the webpage script code, and if the webpage (A) has the dynamic language string S d A , the S d A related code segment CodeSeg A is pressed into the CbQueue in the form of the closure Func A.
  • the context information of CodeSeg A is added to the property of Func A , which facilitates the call of Func A internal code.
  • the dynamic language string is a language string dynamically inserted into the webpage in the form of web script code.
  • a seventh embodiment of the present invention relates to a webpage loading system supporting multiple languages.
  • FIG. 8 is a schematic structural diagram of the webpage loading system supporting the multi-language.
  • the multi-language webpage loading system is based on a tree-structured translation file set, wherein each hypertext markup language HTML file has a corresponding translation file.
  • the following modules are included: a download module, configured to download an XML file corresponding to the current HTML file from the server and all ancestor XML files corresponding to the XML file.
  • a merge module that merges the language string of the XML file downloaded by the download module with the language string common to all of its ancestor XML files.
  • the translation rendering module is used to insert or replace the language tag content of the merged module into the language tag content of the HTML file for multi-language display or switching.
  • HTML Hypertext Makeup Language
  • XML extensible Markup Language
  • a relationship can also be a many-to-one relationship.
  • the "one-to-one" relationship between an HTML file and an XML file is: For a certain language, the language string in an HTML file is saved in the corresponding XML file. in.
  • the "many-to-one" relationship between an HTML file and an XML file is: For a country's language, the language strings in multiple HTML files are stored in different node sets of the same XML file.
  • the language string is a hypertext markup language (Hyper Text Makeup Language (“HTML”) file which is different from the languages of different countries, and needs to be replaced when the webpage switches languages, and also includes script code through webpages.
  • HTML Hyper Text Makeup Language
  • the server may also be referred to as a web server, and when referred to as a web server, the client is a browser that browses the web page.
  • An eighth embodiment of the present invention relates to a webpage loading system supporting multiple languages.
  • FIG. 9 is a schematic structural diagram of the webpage loading system supporting the multi-language.
  • the eighth embodiment is improved on the basis of the seventh embodiment, and the main improvement is that: an XML file set of an extensible markup language corresponding to a tree type through a tree structure can reduce the addition in the product development process.
  • the new language and the amount of work required to maintain an existing language. Use the attribute value of the tag with the same name attribute as the index key when the page language is switched or when the page is loaded, to correlate the scan to find the same language string in the Extensible Markup Language XML file set, while further reducing the Extensible Markup Language XML Redundancy of language strings in a file set.
  • Web page loading uses callback queue technology, which only needs to execute a small number of closures in the queue, thus improving the use of The user selects the response speed of the web page or web page when switching languages, and solves the problem that when the user chooses to switch languages, the dynamic language string cannot be replaced or the web page can be refreshed only when the language is switched.
  • a tree-like extensible markup language XML file set corresponds to a language type.
  • the callback queue CbQueue is created in the webpage script code, and if the webpage (A) has the dynamic language string S d A , the S d A related code segment CodeSeg A is pressed into the CbQueue in the form of the closure Func A.
  • the multi-language webpage loading system further includes the following modules: a loading module, configured to load a language file, wherein the language file is used to save a collection of language types supported by the webpage and a default language.
  • the language query module is configured to query the language type supported by the loaded webpage in the language file loaded by the loading module.
  • the selection module is configured to select an extensible markup language XML file set corresponding to the tree structure according to a language type supported by the webpage selected by the language query module.
  • the dynamic translation rendering module is configured to execute the code segment corresponding to each index function in the callback queue according to the principle of executing the advanced callback queue first, wherein the index function is created by the corresponding code segment related to the dynamic language string in the HTML file, and the callback is The queue can be empty.
  • HTML Hyper Text Makeup Language
  • the identifier id attribute of the language tag in the HTML file is used as an index key between the XML file and the method of not performing the merge operation, and the large-capacity webpage is used for the language.
  • the number of language strings that need to be revised will be significantly reduced.
  • the redundancy r% between language strings is almost zero, that is, there is almost no same repeated language string that needs to be revised.
  • the reduction of the language string that needs to be revised is related to the number of web pages or web pages, the number of repeated strings between the web page and the web page, and the web product of 30 HTML files is taken as an example, r% is usually Can reach 20-40%.
  • each module mentioned in each device implementation manner of the present invention is a logic module.
  • a logic module may be a physical module, or may be part of a physical module, or may have multiple physical entities.
  • the combined implementation of modules, the physical implementation of these logic modules themselves is not the most important, the combination of the functions implemented by these logic modules is the key to solving the technical problems raised by the present invention.
  • the above-mentioned various device embodiments of the present invention do not introduce modules that are less closely related to solving the technical problems proposed by the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及计算机网络应用领域,公开了一种支持多国语言的网页处理方法、网页加载方法及其系统。当添加或修改某一国语言时,减少人工投入的时间和成本。节省网页服务器的存储容量,提高页面加载和翻译渲染的速度,以及降低翻译文件集的冗余度。本发明中,基于一个树状结构的翻译文件集,其中,每个超文本标记语言HTML文件有对应的翻译文件,包括以下步骤:扫描翻译文件集中所有的翻译文件;将不同翻译文件或同一翻译文件不同节点集合中的相同的语言字符串提取出来,并插入到该不同翻译文件的最小公共祖先翻译文件或该同一翻译文件的公共节点集合;将原始翻译文件或节点集合中的相同语言字符串删除。

Description

支持多国语言的网页处理方法、 网页加载方法及其系统 技术领域
本发明涉及计算机网络应用领域, 特别涉及一种支持多国语言的网页实 现技术。
背景技术
国际化的必要条件是设计和开发容易适应不同区域要求产品。 对于可通 过网络访问的产品, 它要求万维网 (World Wide Web, 筒称 "WWW" ) 页 面可以方便地实现多国语言的切换显示。 这种方便包括两个方面:
Figure imgf000003_0001
2.用户使用 Web页面的交互体验。 前者要求 Web页面支持多国语言的 方法需要尽量减少添加新语言和维护现有语言时的工作量, 后者要求该方法 具有较高的响应速度。
为了实现 Web 页面支持多国语言, 现有技术通常采用以下三种方案之
1.每一个 Web页面针对每一国语言编写一个 HTML文件, 在切换语言 时重新载入对应国语言的文本标记语言 ( Hyper Text Makeup Language, 筒 称 "HTML" ) 文件;
2.每一个 Web页面对应一个 HTML文件和一个翻译文件, 翻译文件通 常但不限于为可扩充标记语言( extensible Markup Language,筒称 "XML" ) 文件 (以下均使用 XML文件作为翻译文件, 以示说明) , XML文件中针对 每一国语言建立一个节点集合, 将 HTML文件中或通过 Web脚本代码动态 插入的与各国语言有差异的字符串 (以下筒称 "语言字符串" )抽离, 并通 过索引与 XML文件中各国语言节点集合的字符串关联, 在加载 Web页面或 切换语言时从 XML文件对应国语言节点集合中通过索引替换 HTML文件中 的字符串;
3.每一个 Web页面对应一个 HTML文件,针对每一国语言编写一个 XML 文件, 将 HTML文件中语言字符串抽离并通过索引与各 XML文件中的字符 串关联, 在加载 Web页面或切换语言时从对应国语言的 XML文件中通过索 引替换 HTML文件中的字符串。
对于 Web页面支持多国语言的可维护性: 上述方案 2优于方案 1 , 方案 3又优于方案 2。 对于用户切换 Web页面语言时的响应速度: 上述方案 2和 方案 3均优于方案 1。 而方案 2和方案 3的比较则要视具体情况而定: 对于 遍历算法的时间复杂度二者相同, 都是当前 Web页面语言字符串个数(n ) 的平方 (次) , 对于 Web前端 (浏览器) 与 Web后端 (服务器) 的交互速 度: 方案 2在加载一个 Web页面时只需获取一个 HTML文件和一个 XML文 件(或称为 XMLII ) , 切换语言时无需获取; 方案 3在加载一个 Web页面时 需获取一个 HTML文件和一个 XML (或称为 XMLIII ) 文件, 每次切换语言 时需获取另一个对应国语言的 XML文件 (或称为 XMLIII' ) 。 当支持语言种 类 ( L )较少时 ( L 2 ) , XMLII与 XMLIII的文件长度相近, 影响用户体验 的主要因素是 Web前后端的交互次数, 因此方案 2优于方案 3。 当支持语言 种类较多时(L > 2 ) , XMLII是 XMLIII文件长度的 L倍, 影响用户体验的主 要因素变为 Web前后端的交互时间, 方案 3可将每次加载一个新 Web页面 时的交互时间平分到每次切换语言时, 而用户重新切换语言的频率要比用户 加载一个新 Web页面的频率低得多, 因此方案 3优于方案 2。 随着产品的国际化, 要求 Web 页面支持的语言种类越来越多, 所以目 前 Web页面支持多国语言的实现方法多采用方案 3。但方案 2和方案 3均普 遍存在以下缺点:
1.虽然 Web页面中的语言字符串采用软编码的设计方式(即语言字符串 与 HTML 文件分离) , 但产品所支持的语言种类则是硬编码的方式存在于 Web脚本代码, 因此每次提供支持不同国语言种类集合的产品时, 需要修改 源代码;
2.目前已知的 3种方案均是以 HTML文件中包含语言字符串的标签(以 下筒称 "语言标签" ) 的 id属性作为与 XML文件间的索引键, 而万维网联 盟标准要求一个 HTML 文件中所有标签的 id 属性不可重复, 导致在一个 HTML文件中显示在不同位置的同一个语言字符串所在的标签必须赋以不同 的位置属性, 同时在对应的 XML文件中重复多次;
3.当多个 HTML 文件具有相同的语言字符串时, 要在对应的多个 XML 文件中各保留一份;
4.对于某些语言字符串个数较少同时关系较密切 (可能会被用户频繁地 相互间来回切换) 的 Web页面, 每次加载一个新 HTML文件的同时还必须 加载一个 XML文件, 势必增大 Web前后端交互的压力;
5.当用户选择切换语言时, 无法替换以 Web 脚本代码方式动态插入到 Web页面中的语言字符串(以下筒称 "动态语言字符串",指并非通过 HTML 文件中的语言标签与 XML 文件节点相关联的语言字符串) , 或者只能在切 换语言的同时刷新 Web页面。 综上, 缺点 1、 2、 3增大了添加新语言和维护现有语言时的工作量, 增 加了语言字符串间的冗余; 缺点 4、 5则降低了用户切换 Web页面或切换语 言时的响应速度。
发明内容
本发明的目的在于提供一种支持多国语言的网页处理方法、 网页加载方 法及其系统, 当添加或爹改某一国语言时, 减少人工投入的时间和成本, 节 省网页服务器的存储容量, 提高页面加载和翻译渲染的速度, 以及降低翻译 文件集的冗余度。 为解决上述技术问题, 本发明的实施方式公开了一种支持多国语言的网 页处理方法, 基于一个树状结构的翻译文件集, 其中, 每个超文本标记语言
HTML文件有对应的翻译文件, 包括以下步骤: 扫描翻译文件集中所有的翻 译文件; 将不同翻译文件或同一翻译文件不同节点集合中的相同的语言字符 串提取出来, 并插入到该不同翻译文件的最小公共祖先翻译文件或该同一翻 译文件的公共节点集合; 将原始翻译文件或节点集合中的相同语言字符串删 除。 本发明的实施方式还公开了一种支持多国语言的网页加载方法, 基于一 个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件有对应的 翻译文件, 其特征在于, 包括以下步骤: 从服务器中下载当前 HTML文件对应的翻译文件及该翻译文件对应的所 有祖先翻译文件; 将所述翻译文件的语言字符串与其所有祖先翻译文件公共的语言字符 串合并;
将合并的语言字符串插入或替换 HTML文件的语言标签内容, 进行多语 言的显示或切换。 本发明的实施方式还公开了一种支持多国语言的网页处理系统, 基于一 个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件有对应的 翻译文件, 包括以下模块: 扫描模块, 用于扫描翻译文件集中所有的翻译文件; 提取模块, 用于将扫描模块所扫描的不同翻译文件或同一翻译文件不同 节点集合中的相同的语言字符串提取出来; 插入模块, 用于将提取模块所提取的相同的语言字符串插入到该不同翻 译文件的最小公共祖先翻译文件或该同一翻译文件的公共节点集合; 删除模块, 用于将原始翻译文件或节点集合中且上述提取模块所提取的 相同语言字符串删除。 本发明的实施方式还公开了一种支持多国语言的网页加载系统, 基于一 个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件有对应的 翻译文件, 包括以下模块: 下载模块, 用于从服务器中下载当前 HTML文件对应的 XML文件及该 XML文件对应的所有祖先 XML文件; 合并模块, 用于将下载模块所下载的 XML 文件的语言字符串与其所有 祖先 XML文件公共的语言字符串合并; 翻译渲染模块, 用于将合并模块所合并的语言字符串插入或替换 HTML 文件的语言标签内容, 进行多语言的显示或切换。 本发明实施方式与现有技术相比, 主要区别及其效果在于:
通过合并不同的翻译文件或同一翻译文件不同节点集合中相同的字符 串到最小公共祖先翻译文件或同一翻译文件的公共节点集合, 再将原始翻译 文件或节点集合中的相同字符串删除, 当添加或修改某一国语言时, 减少人 工投入的时间和成本, 可以节省网页服务器的存储容量, 提高页面加载和翻 译渲染的速度, 以及降低翻译文件集的冗余度。
通过从服务器中下载并合并当前 HTML文件对应的翻译文件的语言字符 串与其所有祖先翻译文件公共的语言字符串, 并将合并的语言字符串翻译渲 染, 可以节省网页服务器的存储容量, 提高页面加载和翻译渲染的速度, 以 及降低翻译文件文件集的冗余度。 进一步地, 根据语言文件中查询到的网页处理时所支持的语言类型, 将 产品支持的语言种类集合和缺省语言以软编码的方式保存在单独的 XML 文 件, 将各国语言的 XML 文件集保存在各自的文件夹中。 每次需要提供支持 不同国语言种类集合或不同缺省语言的产品时, 无需修改 Web 页面和脚本 的源代码, 只需^ ίι爹改此 XML文件, 同时移除或添加对应的文件夹即可。 进一步地,为字面值相同的语言字符串设置具有相同 name属性的标签, 再将该属性名称写入到相同的语言字符串的键名, 可以在网页切换时将标签 的 name属性作为索引,以关联扫描查找可扩展标记语言 XML文件集中的相 同语言字符串, 同时进一步降低了可扩展标记语言 XML 文件集中语言字符 串的冗余度。
进一步地, 通过采用回调队列技术, 当用户选择切换语言时或者网页加 载时, 只需执行队列中的少量回调函数即可, 从而提高了用户选择切换语言 时网页或 Web 页面的响应速度, 同时解决了当用户选择切换语言时, 无法 替换动态语言字符串或者只能在切换语言的同时刷新网页的问题。
附图说明
图 1是本发明第一实施方式中一种支持多国语言的网页处理方法的流程 示意图; 图 2是该支持多国语言的网页处理方法语言种类、 HTML文件和 XML 文件之间的关系示意图; 图 3是该支添加 Web页面支持的第一国语言的工作流程示意图; 图 4是该该添加 Web页面支持的第二国及以上语言的工作流程示意图; 图 5是本发明第三实施方式中一种支持多国语言的网页加载方法的流程 示意图; 图 6是本发明第五实施方式中一种支持多国语言的网页处理系统的结构 示意图; 图 7是本发明第六实施方式中一种支持多国语言的网页处理系统的结构 示意图; 图 8是本发明第七实施方式中一种支持多国语言的网页加载系统的结构 示意图; 图 9是本发明第八实施方式中一种支持多国语言的网页加载系统的结构 示意图。
具体实施方式
在以下的叙述中, 为了使读者更好地理解本申请而提出了许多技术细 节。 但是, 本领域的普通技术人员可以理解, 即使没有这些技术细节和基于 以下各实施方式的种种变化和修改, 也可以实现本申请各权利要求所要求保 护的技术方案。 为使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发 明的实施方式作进一步地详细描述。 本发明第一实施方式涉及一种支持多国语言的网页处理方法。 图 1是该 支持多国语言的网页处理方法的流程示意图。 该支持多国语言的网页处理方 法基于一个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件 有对应的翻译文件。 具体地说,如图 1所示,该支持多国语言的网页处理方法包括以下步骤: 在步骤 101 中, 扫描翻译文件集中所有的翻译文件。 此后进入步骤 102 , 将不同翻译文件或同一翻译文件不同节点集合中的 相同的语言字符串提取出来。 此后进入步骤 103, 将提取出来的相同的语言字符串插入到该不同翻译 文件的最小公共祖先翻译文件或该同一翻译文件的公共节点集合。 此后进入步骤 104, 将原始翻译文件或节点集合中的相同语言字符串删 除。 此后结束本流程。 通过合并不同的翻译文件或同一翻译文件不同节点集合中相同的字符 串到最小公共祖先翻译文件或同一翻译文件的公共节点集合, 再将原始翻译 文件或节点集合中的相同字符串删除, 当添加或修改某一国语言时, 减少人 工投入的时间和成本, 可以节省网页服务器的存储容量, 提高页面加载和翻 译渲染的速度, 以及降低翻译文件集的冗余度。 当添加或修改某一国语言时, 如本来交给技术支持或翻译公司翻译的字 符串有 5000条, 但其中有 2000条可能是重复的字符串。 经过本发明的处理 方法后, 只剩下 3000条需要人工翻译了。 匕夕卜, 可以理解, 超文本标 i己语言( Hyper Text Makeup Language, 简 称 "HTML" ) 文件与可扩充标记语言 ( extensible Markup Language, 筒 称 "XML" )文件之间的关系可以是一对一的关系, 也可以是多对一的关系, HTML文件与 XML文件之间 "一对一" 的关系为: 对于某一国语言, 一个 HTML文件中的语言字符串保存在对应的一个翻译文件中。 HTML文件与翻 译文件之间 "多对一" 的关系为: 对于某一国语言, 多个 HTML文件中的语 言字符串分别保存在同一个翻译文件不同的节点集合中。 本发明中, 语言字符串为超文本标记语言 ( Hyper Text Makeup
Language, 筒称 "HTML" ) 文件中与各国语言有差异、 当网页切换语言时 需要被替换的字符串, 也包括通过网页脚本代码动态插入页面的字符串。 本发明第二实施方式涉及一种支持多国语言的网页处理方法。 图 2是该 支持多国语言的网页处理方法的语言种类、 HTML文件和 XML文件之间的关 系示意图, 图 3和图 4是该支持多国语言的网页处理方法的流程示意图。 第二实施方式在第一实施方式的基础上进行了改进, 主要改进之处在 于: 通过一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应, 可以减少了产品开发过程中添加新语言和维护现有语言时的工作量。 根据语 言文件中查询到的网页处理时所支持的语言类型, 将产品支持的语言种类集 合和缺省语言以软编码的方式保存在单独的 XML文件, 将各国语言的 XML 文件集保存在各自的文件夹中。 每次需要提供支持不同国语言种类集合或不 同缺省语言的产品时,无需修改 Web页面和脚本的源代码,只需修改此 XML 文件, 同时移除或添加对应的文件夹即可。 为字面值相同的语言字符串设置 具有相同 name属性的标签, 再将该属性名称写入到相同的语言字符串的键 名, 可以在网页切换时将标签作为索引, 以关联扫描查找可扩展标记语言 XML 文件集中的相同语言字符串, 同时进一步降低了可扩展标记语言 XML 文件集中语言字符串的冗余度。 通过采用回调队列技术, 当用户选择切换语 言时或者网页加载时, 只需执行队列中的少量闭包即可, 从而提高了用户选 择切换语言时网页或 Web 页面的响应速度, 同时解决了当用户选择切换语 言时,无法替换动态语言字符串或者只能在切换语言的同时刷新网页的问题。 具体地说: 翻译文件为可扩展标记语言 XML文件; 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。 本发明中的技术方案是以可扩展标记语言 XML 文件作为翻译文件的一 个特例进行撰写, 在本发明的其他某些实施例中, 翻译文件也可以为用了 JSON (用来标记数据对象或数组的一种数据交换格式) 或自定义格式等的 翻译文件, 作为本发明的一个优选实施例, 如图 2所示,语言类型 L2对应一个树状 结构的可扩展标记语言 XML文件: {XMLX,L2 I {A,B,CDE,p(A,B),p(A,B,CDE)} } 。 翻译文件为可扩展标记语言 XML 文件, 在扫描翻译文件集中所有的翻 译文件的步骤之前, 还包括以下步骤:
在语言文件中查询网页切换时所支持的语言类型, 其中该语言文件用于 保存网页支持的语言类型的集合和缺省语言;
根据网页所支持的语言类型, 选取对应的树状结构的可扩展标记语言
XML文件集。
翻译文件为可扩展标记语言 XML 文件, 在扫描翻译文件集中所有的翻 译文件的步骤之前, 还包括以下步骤:
将对应于 XML文件中的相同字符串所在 HTML文件的标签设置具有相 同 name属'] "生; 将所述相同 name属性写到所述相同的语言字符串的键名中。
此外, 可以理解, 筒而言之, 该支持多国语言的网页处理 (或称为 "合 并上提" )操作就是将多个 XML 文件之间相同的语言字符串删除, 同时只 保留一份到它们的公共最小祖先级 XML 文件的公共节点集合或者公共祖先 的操作。 或将同个 XML 文件中不同节点集合之间相同的语言字符串删除, 同时只保留一份到公共节点集合或者公共祖先的操作。
由于以超文本标记语言( Hyper Text Makeup Language,筒称" HTML" ) 文件中语言标签的名称 name 属性作为与可扩充标记语言 ( extensible Markup Language, 筒称 "XML" ) 文件间的索引键、 及经过该支持多国语 言的网页处理 (或称为 "合并上提" )操作, 相较于现有技术方案 1和现有 技术方案 2中以 HTML文件中语言标签的识别号 id属性作为与 XML文件间 的索引键、 及未经过合并上提操作的方法, 当大容量的网页进行语言切换时 或者网页加载时而言, 需要进行修订的语言字符串个数将明显减少, 语言字 符串之间的冗余度「%几乎为 0, 即几乎不存在相同重复的语言字符串需要进 行修订, 其中, 需要进行修订的语言字符串的减少量与网页或 Web 页面个 数、 Web页面内部和 Web页面之间重复的字符串个数有关, 以 30个 HTML 文件的网页产品为例, r%通常可达到 20-40%。 在将原始翻译文件或节点集合中的相同语言字符串删除的步骤之后, 还 包括以下步骤: 预先为所述 HTM L文件中的动态语言字符串相关的各代码段创建对应的 闭包;
将闭包压入到预先创建的回调队列中, 以在网页语言切换时, 按照先进 回调队列先执行的原则, 执行回调队列中各闭包对应的代码段。 在网页脚本代码中创建回调队列 CbQueue, 如果网页 (A )存在动态语 言字符串 Sd A, 则将 Sd A相关的代码段 CodeSegA以闭包 FuncA的形式压入 CbQueue,将 CodeSegA的上下文信息添力口为 FimcA的属性, 方便 FimcA内部 代码调用。 当用户切换语言时, 按照队列顺序依次执行 CbQueue 中的所有 回调函数, 其中, 动态语言字符串为以 Web 脚本代码方式动态插入到网页 中的语言字符串。 作为本发明的一个优选实施方式, 如图 3所示, 该添加 Web页面支持 的第一国语言的工作流程包括以下步骤: 在步骤 301中,确认 Web页面支持的第一国语言 ,编写语言文件 XM LL 文件, 以 作为缺省语言 LD。 此后进入步骤 302, 为每个 HTML文件中的相同的语言字符串标签添加 Π3ΙΠΘ属性。 此后进入步骤 303, 为每个 HTML文件编写对应的 XML文件组 (因为 此时 Web页面只支持一国语言,所以每个 XML文件组只有一个 XML文件)。 此后进入步骤 304, 合并上提相同的语言字符串。 此后进入步骤 305, 对语言字符串进行修订或者翻译, 对于第一国语言 此过程只有修订字符串, 对于第二国及以上语言此过程主要为翻译字符串。 此后进入步骤 306, 将 的 XML文件集保存在以 标识的文件夹中, 此后结束本流程。
作为本发明的另一个优选实施例, 如图 4所示, 该添加 Web页面支持的第 二国及以上语言的工作流程包括以下步骤:
在步骤 401中, 以 Web页面支持的第 n国语言 Ln扩充语言文件 XMLL文件, 并确认缺省语言。
此后进入步骤 402 , 在每个 XML文件组中添加新语言 Ln的 XML文件
( XMLx,Ln ) 。
此后进入步骤 403, 对语言字符串进行修订或者翻译, 由于添加 Web页面 支持的第一国语言时已经过合并上提操作, 在添加第二国及以上语言 Ln时无 需重复进行, 只需按照现有的 L^ XML文件集对 L2的语言字符串进行翻译即 可。 因此, 需翻译的语言字符串个数将减少「% (相对于现有技术方案 1和现 有技术方案 2 ) 。
此后进入步骤 404, 将 Ln的 XML文件集保存在以 Ln标识的文件夹中, 此后 结束本流程。
同样, 在 Web页面的维护过程中, 如果发现某一国语言 (Ln ) 的字符串 S 有误需修改时, 只需修改 S所在 XML中的一处即可, 避免由于 S在 Web页面中 多处出现, 导致部分遗漏而未修改的问题。 本发明第三实施方式涉及一种支持多国语言的网页加载方法。 图 5是该 支持多国语言的网页加载方法的流程示意图。 该支持多国语言的网页加载方 法基于一个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件 有对应的翻译文件。 具体地说,如图 5所示,该支持多国语言的网页加载方法包括以下步骤: 在步骤 501 中,从服务器中下载当前 HTML文件对应的翻译文件及该翻 译文件对应的所有祖先翻译文件。 此后进入步骤 502 , 将翻译文件的语言字符串与其所有祖先翻译文件公 共的语言字符串合并。 此后进入步骤 503, 将合并的语言字符串插入或替换 HTML文件的语言 标签内容, 进行多语言的显示或切换。 此后结束本流程。 通过从服务器中下载并合并当前 HTML文件对应的翻译文件的语言字符 串与其所有祖先翻译文件公共的语言字符串, 并将合并的语言字符串翻译渲 染, 可以节省网页服务器的存储容量, 提高页面加载和翻译渲染的速度, 以 及降低翻译文件文件集的冗余度。 匕夕卜, 可以理解, 超文本标 i己语言( Hyper Text Makeup Language, 简 称 "HTML" ) 文件与可扩充标记语言 ( extensible Markup Language, 筒 称 "XML" )文件之间的关系可以是一对一的关系, 也可以是多对一的关系, HTML文件与 XML文件之间 "一对一" 的关系为: 对于某一国语言, 一个 HTML文件中的语言字符串保存在对应的一个 XML文件中。 HTML文件与 XML文件之间 "多对一" 的关系为: 对于某一国语言, 多个 HTML文件中的 语言字符串分别保存在同一个 XML文件不同的节点集合中。 本发明中, 语言字符串为超文本标记语言 ( Hyper Text Makeup Language, 筒称 "HTML" ) 文件中与各国语言有差异、 当网页切换语言时 需要被替换的字符串, 也包括通过网页脚本代码动态插入页面的字符串。 这里, 服务器也可以称为网页服务器, 当称为网页服务器时, 客户端为 浏览网页的浏览器。 本发明第四实施方式涉及一种支持多国语言的网页加载方法。
第四实施方式在第三实施方式的基础上进行了改进, 主要改进之处在 于: 通过一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应, 可以减少了产品开发过程中添加新语言和维护现有语言时的工作量。 在网页 语言切换时或网页加载时将具有相同 name 属性的标签的属性值作为索引 键, 以关联扫描查找可扩展标记语言 XML 文件集中的相同的语言字符串, 同时进一步降低了可扩展标记语言 XML 文件集中语言字符串的冗余度。 网 页加载采用回调队列技术, 只需执行队列中的少量闭包即可, 从而提高了用 户选择切换语言时网页或 Web 页面的响应速度, 同时解决了当用户选择切 换语言时, 无法替换动态语言字符串或者只能在切换语言的同时刷新网页的 问题。 具体地说: 翻译文件为可扩展标记语言 XML文件; 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。 在从服务器中下载当前 HTML文件对应的翻译文件及该翻译文件对应的 所有祖先翻译文件的步骤之前, 还包括以下步骤:
加载一个语言文件, 其中该语言文件用于保存网页支持的语言类型的集 合和缺省语言。 在语言文件中查询加载的网页所支持的语言类型。 根据网页所支持的语言类型, 选取对应的树状结构的可扩展标记语言 XML文件集。 翻译文件为可扩展标记语言 XML 文件, 在将翻译文件的语言字符串与 其所有祖先翻译文件公共的语言字符串合并的步骤中, 还包括以下子步骤: 将 XML文件及其所有祖先 XML文件组合为一个文档结构; 在合并后的文档结构中, 扫描语言字符串的键名; 将扫描的键名作为索引, 插入或替换 HTML文件的语言标签内容。 此外, 可以理解, 由于以超文本标记语言 ( Hyper Text Makeup Language, 筒称 ' 'HTML" ) 文件中语言标签的名称 name属性作为与可扩 充标记语言 ( extensible Markup Language, 筒称 "XML" ) 文件间的索引 键、 及经过该支持多国语言的网页处理 (或称为 "合并上提" )操作, 相较 于现有技术方案 1和现有技术方案 2中以 HTML文件中语言标签的 id属性 作为与 XML 文件间的索引键、 及经过合并上提操作的方法, 当大容量的网 页进行语言切换时或者网页加载时而言, 需要进行修订的语言字符串个数将 明显减少, 语言字符串之间的冗余度「%几乎为 0, 即几乎不存在相同重复的 语言字符串需要进行修订, 其中, 需要进行修订的语言字符串的减少量与网 页或 Web页面个数、 Web页面内部和 Web页面之间重复的字符串个数有关, 以 30个 HTML文件的网页产品为例, r%通常可达到 20-40%。
将合并的语言字符串插入或替换 HTM L文件的语言标签内容, 进行多语 言的显示或切换(或渲染) 的步骤, 还包括以下子步骤: 按照先进回调队列先执行的原则, 执行回调队列中各闭包对应的代码 段,其中闭包由 HTML文件中的动态语言字符串相关的对应代码段创建而成, 回调队列可为空。 作为本发明的另一个优选实施例, 本发明的技术方案可由以下过程实 现:
1. 建立一个 XML文件 (XMLL ) , 保存产品支持的语言类型集合(CL ) 和缺省语言 (LD ) 。 通过 Web 页面访问产品时, 首先判断浏览器的当前语 言 (LB ) , 如果 LB e CL, 则以 LB作为 Web 页面的缺省语言显示, 否则以 LD作为 Web页面的缺省语言显示。
2. 根据 Web页面的 HTML文件建立对应的 XML文件组, 组中的每一 个 XML文件保存一国语言 ( L1 L CL ) 的字符串, 以 HTML文件中语言 标签的 name属性作为与 XML文件间的索引键。保存相同语言 的 XML文 件组成一个 XML文件集 ({XMLL1} ) , 保存在以 标识的文件夹中。 3. 每一个 XML文件 (XMLA ) 至少包含一个以本文件名 (A )命名的节 点集合(XMLA<A> ) 和一个公共节点集合(XMLA<com> ) 。
XML文件之间具有层级关系。 加载一个 Web 页面 (A ) 或切换语言时 (语言为 ) , 首先将该 HTML文件( HTM )关联的 XML文件( XMLA,L1 ) 的本节点集合( XMLA,L1<A> )、 XMLA,L1的公共节点集合( XMLA,L1 <com> )、 XMLA,L1的父级 XML文件( XMLP(A),L1 )的公共节点集合( XMLP(A),L1 <com> )、 XMLA,L1 的 祖 父级 XML 文件 ( XMLp2(A),L1 ) 的 公共节 点 集合 ( XMLp2 (A),Li <com> ) ……和 XMLA,L1的根父级 XML文件 ( XMLP n(A),L1 ) 的 公共节点集合( XMLpn (A),L1<com> )组合为一个 XML文档结构( XMLDOCA,LI ) , 然后通过索引键, 从 XMLDocA,u中查找并替换 HTMLA中的字符串。 如果 XMLA与 XMLB具有相同祖先 (可能 XMLA与 XMLB同级, 也可能 XMLA与 XMLB的祖先同级或相反,也可能 XMLA即是 XMLB的祖先或相反), 且 XMLA与 XMLB中具有相同的字符串 SA和 SB, 则在 XMLA与 XMLB的公 共最小祖先级 XML文件 ( XMLp(AB) ) 的公共节点集合 ( XMLp(AB)<com> ) 中添加字符串 SAB (
Figure imgf000018_0001
) , 并将 XM LA中的 SA和 XM LB中的 SB删 除(此操作以下筒称为 "合并上提" ) 。
4. HTML文件与 XML文件之间并非必须——对应 (以下筒称 "一对一" 的关系) , 也可以多个 HTML文件关联同一组 XML文件 (以下筒称 "多对 一,, 的关系) 。 例如三个 HTML文件 (HTMLC、 HTMLD和 HTMLE ) 关联同 一组 XML文件({XMLCDE,Li I ζ CJ ) , HTMLC、 HTMLD和 HTMLE的语言 字符串分别保存在 XMLCDE的节点集合 XMLCDE<C>、 节点集合 XMLCDE<D> 和节点集合 XMLCDE<E>中, 同时在 XMLCDE 中建立公共节点集合 XMI_CDE<com>。 如果 XMLCDE<C>和 XMLCDE<D>中具有相同的字符串 Sc和 SD, 则在 XM LCDE<com>中添加字符串 SCD ( SCD=SC=SD ) , 并将 XM LCDE<C>中的 SC 和 XMLCDE<D>中的 SD删除(此操作以下筒称为 "合并上提" );如果 XMLCDE 与另一个 XML文件(XMLF )具有相同祖先, 且 XMLCDE与 XMLF中具有相同 的字符串 SCDE和 SF, 则将 SCDE和 SF合并上提至 XMLCDE与 XMLj^ 公共最 小祖先级 XML文件 ( XMLP(CDE,F) ) 的公共节点集合 XMLp(CDE,F)<com>中。 5. 在 Web脚本代码中创建回调队列 CbQueue, 如果 Web页面 (A ) 存在动态语言字符串 Sd A, 则将 SdA相关的代码段 CodeSegA以闭包 FuncA 的形式压入 CbQueue, 将 CodeSegA的上下文信息添加为 FuncA的属性, 予 FuncA 内部代码调用。 当用户切换语言时, 按照队列顺序依次执行 CbQueue中的所有闭包。 如上图 2所示, 语言类型集合包含三种语言类型 (Cj^i I^ } ) , 其 中 为缺省语言;共有 5个 Web页面(5个 HTML文件, HTMLA~HTMLE ) , 如图 1 中以斜条纹背景标出的 3个 XML文件({XMLA,U | 构成技术 方案 2所述的一个 XML文件组, 其中 HTMLA、 HTMLB与各自对应的 XML 文件组( {XMLA,Li}、 {XMLB,Li} )之间是 "一对一,, 的关系, HTMLC、 HTMLD. HTMLE与共同的 XML文件组({XMLCDE,Li | Li ^ CL} )之间是 "多对一" 的关 系 ; 如图 1 中 实线框包围 的 5 个 XML 文件 ( {XMLX,L2 | X ^ {A,B,CDE,p(A,B),p(A,B,CDE)}} )构成技术方案 2所述的一个 XML文件集, 其中文件集 {XMLX,L1}、 {XMLX,L2}、 {XMLX,L3}分别保存在以 L L2、 L3标识的 文件夹中。
以语言 为例, 文件集 {XMLX,U}共包括 3 个层级。 其中, XMLP(A,B),U 为 XMLA和 XMLB的父级 XML , XMLP(A,B,CDE),LI为 XMLP(A,B),L1和 XMLCDE的父 级 XML。 对于 "一对一" 关系的叶子 XML (
Figure imgf000019_0001
XMLB,U ) 的公共节 点集合 ( 1\/11_^1 (^>和 XMLB,L1<com> ) 为空集 0。 对于非叶子 XML
,B,CDE),L1 )的非公共节点集合(XMLp(A,B),L1<p(A,B)^p XMLp(A,B,cDE),Li<p(A)B,CDE)> )可能为 0, 也可能非 0。 以 XMLP(A,B),L1为例, 当存在主框架 (HTMLAB ) , 而 HTMLA和 HTMLB作为 HTMLAB的包含另外 一个文档的内联框架 iframe 或通过在浏览器与 Web 服务器之间使用异步 数据传输 ( Asynchronous JavaScript and XML, 简称 "Ajax" ) 动态插入 HTMLAB时, XMLP(A,B),L1与 HTMLAB对应, 即 XMLp(A,B),L1<p(A,B)>中保存 XMLP(A,B),L1中的语言字符串, 此时 XMLp(A,B),L1<p(A,B)>≠0。 当 HTMLA和 HTMLB作为独立文档时, XMLp(A,B),L1<p(A,B)>=0, XMLP(A,B),L1只作为用于保 存从 XMLA和 XMLB合并上提的字符串的一个虚拟层级 XML文件。除非作为 根父级的虚拟层级 XML文件, 否则不建议保留。
以语言 Li为例, XML之间的合并上提关系 (以符号 表示) 如:
XMLAL1<A>
XMLD T 1 <B> ^ XMLp (琴 <醒>
XMLA,L1<A>
XMLp(A,B),Li <c m>
XML p(A,B),Ll <p(A,B)>
XMLAL1<A>
XMLp(AACDE)>Ll <COm>
XMLCDE>L1<C>
XML p(A,B),Ll <p(A,B)>
^> XMLp(A,B,CDE),Ll <COm>
XML CDE,L1 <C>
XML A,L1 <A>
XML XM
p(A,B,CDE),Ll <p(A,B,CDE)> Lp(A,B,CDE),Ll <COm>
XMLp(A B) L1<p(A,B)>
XMLp(A,B,CDE),Ll <COm>
XMLp(A,B,CDE),L1<p(A,B,CDE)>
XMLCDE,L1<C>
XML XMLp(A,B,CDE),Ll <C
p(A,B,CDE),Ll <p(A,B,CDE)> Om>
XML之间的合并上提不仅可在两个 XML间进行, 也可在多个 XML间进 行, 如 (以 3个 XML间为例) :
XMLA>L1<A>
B'L1<B> ^ XMLp(A B) L1<com>
XMLp(A,B),L1<p(A,B)> XMLA L1<A>
XMLp(A,B),L1<p(A,B)〉 XMLp(A,B,CDE),Ll <COm>
XML p(A,B,CDE),Ll <p(A,B,CDE)>
XMLA L1<A>
XMLB L1<B> ^ XMLp(A,B,CDE),Ll <COm>
XMLC
XMLA;L1<A>
XML p(A,B),Ll <p(A,B)> ^ XMLp(A,B,CDE),Ll <COm>
XML CDE,L1 <C>
XMLA L1<A>
XMLCDE,L1<C> XMLp(A,B,CDE),Ll <COm> XML p(A, nB,―CDE), T, <p(A,B,CDE)>
XMLp(A,B,CDE),Ll <C m>
Figure imgf000021_0001
本发明的各方法实施方式均可以以软件、 硬件、 固件等方式实现。 不管 本发明是以软件、 硬件、 还是固件方式实现, 指令代码都可以存储在任何类 型的计算机可访问的存储器中 (例如永久的或者可修改的, 易失性的或者非 易失性的, 固态的或者非固态的, 固定的或者可更换的介质等等) 。 同样, 存储器可以例如是可编程阵列逻辑 ( Programmable Array Logic , 筒称 "PAL" ) 、 随机存取存储器(Random Access Memory, 筒称 " RAM" ) 、 可编程只读存储器( Programmable Read Only Memory, 筒称 "PROM" ) 、 只读存储器(Read-Only Memory, 筒称 "ROM" ) 、 电可擦除可编程只读 存储器( Electrically Erasable Programmable ROM , 筒称 "EEPROM" ) 、 磁盘、 光盘、 数字通用光盘 ( Digital Versatile Disc, 筒称 "DVD" ) 等等。 本发明第五实施方式涉及一种支持多国语言的网页处理系统。 图 6是该 支持多国语言的网页处理系统的结构示意图。 该支持多国语言的网页处理系 统基于一个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件 有对应的翻译文件, 包括以下模块: 扫描模块, 用于扫描翻译文件集中所有的翻译文件; 提取模块, 用于将扫描模块所扫描的不同翻译文件或同一翻译文件不同 节点集合中的相同的语言字符串提取出来; 插入模块, 用于将提取模块所提取的相同的语言字符串插入到该不同翻 译文件的最小公共祖先翻译文件或该同一翻译文件的公共节点集合; 删除模块, 用于将原始翻译文件或节点集合中且上述提取模块所提取的 相同语言字符串删除。 通过合并不同的翻译文件或同一翻译文件不同节点集合中相同的字符 串到最小公共祖先翻译文件或同一翻译文件的公共节点集合, 再将原始翻译 文件或节点集合中的相同字符串删除, 当添加或修改某一国语言时, 减少人 工投入的时间和成本, 可以节省网页服务器的存储容量, 提高页面加载和翻 译渲染的速度, 以及降低翻译文件集的冗余度。 匕夕卜, 可以理解, 超文本标 i己语言( Hyper Text Makeup Language, 简 称 "HTML" ) 文件与可扩充标记语言 ( extensible Markup Language, 筒 称 "XML" )文件之间的关系可以是一对一的关系, 也可以是多对一的关系, HTML文件与 XML文件之间 "一对一" 的关系为: 对于某一国语言, 一个 HTML文件中的语言字符串保存在对应的一个 XML文件中。 HTML文件与 XML文件之间 "多对一" 的关系为: 对于某一国语言, 多个 HTML文件中的 语言字符串分别保存在同一个 XML文件不同的节点集合中。 本发明中, 语言字符串为超文本标记语言 ( Hyper Text Makeup Language, 筒称 "HTML" ) 文件中与各国语言有差异、 当网页切换语言时 需要被替换的字符串, 也包括通过网页脚本代码动态插入页面的字符串。 第一实施方式互相配合实施。 第一实施方式中提到的相关技术细节在本实施 方式中依然有效, 为了减少重复, 这里不再赘述。 相应地, 本实施方式中提 到的相关技术细节也可应用在第一实施方式中。
本发明第六实施方式涉及一种支持多国语言的网页处理系统。 图 7是该 支持多国语言的网页处理系统的结构示意图。
第六实施方式在第五实施方式的基础上进行了改进, 主要改进之处在 于: 通过一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应, 可以减少了产品开发过程中添加新语言和维护现有语言时的工作量。 根据语 言文件中查询到的网页处理时所支持的语言类型, 将产品支持的语言种类集 合和缺省语言以软编码的方式保存在单独的 XML文件, 将各国语言的 XML 文件集保存在各自的文件夹中。 每次需要提供支持不同国语言种类集合或不 同缺省语言的产品时,无需修改 Web页面和脚本的源代码,只需修改此 XML 文件, 同时移除或添加对应的文件夹即可。 具体地说:
翻译文件为可扩展标记语言 XML文件;
一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。 该支持多国语言的网页处理系统还包括以下模块: 查询模块, 用于在语言文件中查询网页切换时所支持的语言类型, 其中 该语言文件用于保存网页支持的语言类型的集合和缺省语言;
选择模块, 用于根据查询模块所查询到的网页所支持的语言类型, 选取 对应的树状结构的可扩展标记语言 XML文件集。 翻译文件为可扩展标记语言 XML 文件, 该支持多国语言的网页处理系 统还包括以下模块: 设置模块, 用于为对应于 XML文件中的相同字符串所在 HTML文件的 标签设置具有相同 name属性; 写入模块, 用于将所述设置模块所设置的相同 name属性写到所述相同 的语言字符串的键名中。 此外, 可以理解, 筒而言之, 该支持多国语言的网页处理 (或称为 "合 并上提" )操作就是将多个 XML 文件之间相同的语言字符串删除, 同时只 保留一份到它们的公共最小祖先级 XML 文件的公共节点集合或者公共祖先 的操作。 或将同个 XML 文件中不同节点集合之间相同的语言字符串删除, 同时只保留一份到公共节点集合或者公共祖先的操作。
由于以超文本标记语言( Hyper Text Makeup Language,筒称" HTML" ) 文件中语言标签的名称 name 属性作为与可扩充标记语言 ( extensible Markup Language, 筒称 "XML" ) 文件间的索引键、 及经过该支持多国语 言的网页处理 (或称为 "合并上提" )操作, 相较于现有技术方案 1和现有 技术方案 2中以 HTML文件中语言标签的识别号 id属性作为与 XML文件间 的索引键、 及未经过合并上提操作的方法, 当大容量的网页进行语言切换时 或者网页加载时而言, 需要进行修订的语言字符串个数将明显减少, 语言字 符串之间的冗余度「%几乎为 0, 即几乎不存在相同重复的语言字符串需要进 行修订, 其中, 需要进行修订的语言字符串的减少量与网页或 Web 页面个 数、 Web页面内部和 Web页面之间重复的字符串个数有关, 以 30个 HTML 文件的网页产品为例, r%通常可达到 20-40%。 该支持多国语言的网页处理系统还包括以下模块:
队列模块, 用于预先为 HTML文件中的动态语言字符串相关的各代码段 创建对应的闭包, 并将闭包压入到预先创建的回调队列中; 回调模块, 用于在网页语言切换时, 按照先进回调队列先执行的原则, 执行回调队列中各闭包对应的代码段。 此外, 可以理解, 在网页脚本代码中创建回调队列 CbQueue , 如果网 页 ( A )存在动态语言字符串 Sd A, 则将 Sd A相关的代码段 CodeSegA以闭包 FuncA的形式压入 CbQueue,将 CodeSegA的上下文信息添力口为 FuncA的属 性, 方便 FuncA内部代码调用。 当用户切换语言时, 按照队列顺序依次执行 CbQueue中的所有闭包, 其中, 动态语言字符串为以 Web脚本代码方式动 态插入到网页中的语言字符串。
第二实施方式互相配合实施。 第二实施方式中提到的相关技术细节在本实施 方式中依然有效, 为了减少重复, 这里不再赘述。 相应地, 本实施方式中提 到的相关技术细节也可应用在第二实施方式中。 本发明第七实施方式涉及一种支持多国语言的网页加载系统。 图 8是该 支持多国语言的网页加载系统的结构示意图。 该支持多国语言的网页加载系 统基于一个树状结构的翻译文件集, 其中, 每个超文本标记语言 HTML文件 有对应的翻译文件。 包括以下模块: 下载模块, 用于从服务器中下载当前 HTML文件对应的 XML文件及该 XML文件对应的所有祖先 XML文件。 合并模块, 用于将下载模块所下载的 XML 文件的语言字符串与其所有 祖先 XML文件公共的语言字符串合并。 翻译渲染模块, 用于将合并模块所合并的语言字符串插入或替换 HTML 文件的语言标签内容, 进行多语言的显示或切换。 通过从服务器中下载并合并当前 HTML文件对应的 XML文件的语言字 符串与其所有祖先 XML 文件公共的语言字符串, 并将合并的语言字符串翻 译渲染,可以节省网页服务器的存储容量,提高页面加载和翻译渲染的速度, 以及降低可扩展标记语言 XML文件集的冗余度。 匕夕卜, 可以理解, 超文本标 i己语言( Hyper Text Makeup Language, 简 称 "HTML" ) 文件与可扩充标记语言 ( extensible Markup Language, 筒 称 "XML" )文件之间的关系可以是一对一的关系, 也可以是多对一的关系, HTML文件与 XML文件之间 "一对一" 的关系为: 对于某一国语言, 一个 HTML文件中的语言字符串保存在对应的一个 XML文件中。 HTML文件与 XML文件之间 "多对一" 的关系为: 对于某一国语言, 多个 HTML文件中的 语言字符串分别保存在同一个 XML文件不同的节点集合中。 本发明中, 语言字符串为超文本标记语言 ( Hyper Text Makeup Language, 筒称 "HTML" ) 文件中与各国语言有差异、 当网页切换语言时 需要被替换的字符串, 也包括通过网页脚本代码动态插入页面的字符串。 这里, 服务器也可以称为网页服务器, 当称为网页服务器时, 客户端为 浏览网页的浏览器。
第三实施方式互相配合实施。 第三实施方式中提到的相关技术细节在本实施 方式中依然有效, 为了减少重复, 这里不再赘述。 相应地, 本实施方式中提 到的相关技术细节也可应用在第三实施方式中。 本发明第八实施方式涉及一种支持多国语言的网页加载系统。 图 9是该 支持多国语言的网页加载系统的结构示意图。
第八实施方式在第七实施方式的基础上进行了改进, 主要改进之处在 于: 通过一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应, 可以减少了产品开发过程中添加新语言和维护现有语言时的工作量。 在网页 语言切换时或网页加载时将具有相同 name 属性的标签的属性值作为索引 键, 以关联扫描查找可扩展标记语言 XML 文件集中的相同的语言字符串, 同时进一步降低了可扩展标记语言 XML 文件集中语言字符串的冗余度。 网 页加载采用回调队列技术, 只需执行队列中的少量闭包即可, 从而提高了用 户选择切换语言时网页或 Web 页面的响应速度, 同时解决了当用户选择切 换语言时, 无法替换动态语言字符串或者只能在切换语言的同时刷新网页的 问题。 具体地说: 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。 此外, 可以理解, 在网页脚本代码中创建回调队列 CbQueue , 如果网 页 ( A )存在动态语言字符串 Sd A, 则将 Sd A相关的代码段 CodeSegA以闭包 FuncA的形式压入 CbQueue,将 CodeSegA的上下文信息添力口为 FuncA的属 性, 方便 FuncA内部代码调用。 当用户切换语言时, 按照队列顺序依次执行 CbQueue中的所有回调函数, 其中, 动态语言字符串为以 Web脚本代码方 式动态插入到网页中的语言字符串。 如图 9所示, 该支持多国语言的网页加载系统还包括以下模块: 加载模块, 用于加载一个语言文件, 其中该语言文件用于保存网页支持 的语言类型的集合和缺省语言。 语言查询模块, 用于在加载模块所加载的语言文件中查询加载的网页所 支持的语言类型。 选取模块, 用于根据语言查询模块所选取的网页所支持的语言类型, 选 取对应的树状结构的可扩展标记语言 XML文件集。 动态翻译渲染模块, 用于按照先进回调队列先执行的原则, 执行回调队 列中各索引函数对应的代码段, 其中索引函数由 HTML文件中的动态语言字 符串相关的对应代码段创建而成, 回调队列可为空。 此外, 可以理解, 由于以超文本标记语言 ( Hyper Text Makeup Language, 筒称 ' 'HTML" ) 文件中语言标签的名称 name属性作为与可扩 充标记语言 ( extensible Markup Language, 筒称 "XML" ) 文件间的索引 键、 及经过该支持多国语言的网页处理 (或称为 "合并上提" )操作, 相较 于现有技术方案 1和现有技术方案 2中以 HTML文件中语言标签的识别号 id 属性作为与 XML 文件间的索引键、 及未经过合并上提操作的方法, 当大容 量的网页进行语言切换时或者网页加载时而言, 需要进行修订的语言字符串 个数将明显减少, 语言字符串之间的冗余度 r%几乎为 0, 即几乎不存在相同 重复的语言字符串需要进行修订, 其中, 需要进行修订的语言字符串的减少 量与网页或 Web页面个数、 Web页面内部和 Web页面之间重复的字符串个 数有关, 以 30个 HTML文件的网页产品为例, r%通常可达到 20-40%。
第四实施方式互相配合实施。 第四实施方式中提到的相关技术细节在本实施 方式中依然有效, 为了减少重复, 这里不再赘述。 相应地, 本实施方式中提 到的相关技术细节也可应用在第四实施方式中。 需要说明的是, 本发明各设备实施方式中提到的各模块都是逻辑模块, 在物理上, 一个逻辑模块可以是一个物理模块, 也可以是一个物理模块的一 部分, 还可以以多个物理模块的组合实现, 这些逻辑模块本身的物理实现方 式并不是最重要的, 这些逻辑模块所实现的功能的组合才是解决本发明所提 出的技术问题的关键。 此外, 为了突出本发明的创新部分, 本发明上述各设 备实施方式并没有将与解决本发明所提出的技术问题关系不太密切的模块引
虽然通过参照本发明的某些优选实施方式, 已经对本发明进行了图示和 描述, 但本领域的普通技术人员应该明白, 可以在形式上和细节上对其作各 种改变, 而不偏离本发明的精神和范围。

Claims

权 利 要 求
1. 一种支持多国语言的网页处理方法, 基于一个树状结构的翻译文件 集, 其中,每个超文本标记语言 HTML文件有对应的翻译文件, 其特征在于, 包括以下步骤: 扫描所述翻译文件集中所有的翻译文件; 将不同翻译文件或同一翻译文件不同节点集合中的相同的语言字符串 提取出来, 并插入到该不同翻译文件的最小公共祖先翻译文件或该同一翻译 文件的公共节点集合; 将原始翻译文件或节点集合中的相同语言字符串删除。
2. 根据权利要求 1所述的支持多国语言的网页处理方法, 其特征在于, 所述翻译文件为可扩展标记语言 XML文件; 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。
3. 根据权利要求 1所述的支持多国语言的网页处理方法, 其特征在于, 所述翻译文件为可扩展标记语言 XML文件; 在所述扫描所述翻译文件集中所有的翻译文件的步骤之前, 还包括以下 步骤: 在语言文件中查询网页切换时所支持的语言类型, 其中该语言文件用于 保存网页支持的语言类型的集合和缺省语言; 根据网页所支持的语言类型, 选取对应的树状结构的可扩展标记语言 XML文件集。
4. 根据权利要求 1所述的支持多国语言的网页处理方法, 其特征在于, 所述翻译文件为可扩展标记语言 XML文件; 在所述扫描所述翻译文件集中所有的翻译文件的步骤之前, 还包括以下 步骤: 将对应于 XML文件中的相同字符串所在 HTML文件的标签设置具有相 同 name属性; 将所述相同 name属性写到所述相同的语言字符串的键名中。
5. 根据权利要求 1所述的支持多国语言的网页处理方法, 其特征在于, 在所述将原始翻译文件或节点集合中的相同语言字符串删除的步骤之后, 还 包括以下步骤: 预先为所述 HTM L文件中的动态语言字符串相关的各代码段创建对应的 闭包; 将所述闭包压入到预先创建的回调队列中, 以在网页语言切换时, 按照 先进回调队列先执行的原则, 执行回调队列中各闭包对应的代码段。
6. 一种支持多国语言的网页加载方法, 基于一个树状结构的翻译文件 集, 其中,每个超文本标记语言 HTML文件有对应的翻译文件, 其特征在于, 包括以下步骤: 从服务器中下载当前 HTML文件对应的翻译文件及该翻译文件对应的所 有祖先翻译文件; 将所述翻译文件的语言字符串与其所有祖先翻译文件公共的语言字符 串合并;
将合并的语言字符串插入或替换 HTML文件的语言标签内容,进行多语 言的显示或切换。
7. 根据权利要求 6所述的支持多国语言的网页加载方法, 其特征在于, 所述翻译文件为可扩展标记语言 XML文件; 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。
8. 根据权利要求 6所述的支持多国语言的网页加载方法, 其特征在于, 在所述从服务器中下载当前 HTML文件对应的翻译文件及该翻译文件对应的 所有祖先翻译文件的步骤之前, 还包括以下步骤:
加载一个语言文件, 其中该语言文件用于保存网页支持的语言类型的集 合和缺省语言;
在所述语言文件中查询加载的网页所支持的语言类型; 根据网页所支持的语言类型, 选取对应的树状结构的可扩展标记语言 XML文件集。
9. 根据权利要求 6所述的支持多国语言的网页加载方法, 其特征在于, 所述翻译文件为可扩展标记语言 XML文件;
在所述翻译文件的语言字符串与其所有祖先翻译文件公共的语言字符 串合并的步骤中, 还包括以下子步骤:
将 XML文件及其所有祖先 XML文件组合为一个文档结构; 在合并后的文档结构中, 扫描语言字符串的键名;
将扫描的键名作为索引, 插入或替换 HTML文件的语言标签内容。
10.根据权利要求 6所述的支持多国语言的网页加载方法,其特征在于, 所述翻译文件为可扩展标记语言 XML文件; 所述将合并的语言字符串插入或替换 HTML文件的语言标签内容, 进行 多语言的显示或切换的步骤, 还包括以下子步骤: 按照先进回调队列先执行的原则, 执行回调队列中各闭包对应的代码 段, 其中闭包由所述 HTM L文件中的动态语言字符串相关的对应代码段创建 而成, 回调队列可为空。
1 1. 一种支持多国语言的网页处理系统, 基于一个树状结构的翻译文件 集, 其中,每个超文本标记语言 HTML文件有对应的翻译文件, 其特征在于, 包括以下模块: 扫描模块, 用于扫描所述翻译文件集中所有的翻译文件; 提取模块, 用于将所述扫描模块所扫描的不同翻译文件或同一翻译文件 不同节点集合中的相同的语言字符串提取出来;
插入模块, 用于将所述提取模块所提取的相同的语言字符串插入到该不 同翻译文件的最小公共祖先翻译文件或该同一翻译文件的公共节点集合; 删除模块, 用于将原始翻译文件或节点集合中的所述提取模块所提取的 相同语言字符串删除。
12. 根据权利要求 1 1 所述的支持多国语言的网页处理系统, 其特征在 于, 所述翻译文件为可扩展标记语言 XML文件; 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。
13. 根据权利要求 1 1 所述的支持多国语言的网页处理系统, 其特征在 于, 所述翻译文件为可扩展标记语言 XML文件; 所述系统还包括以下模块: 查询模块, 用于在语言文件中查询网页切换时所支持的语言类型, 其中 该语言文件用于保存网页支持的语言类型的集合和缺省语言;
选择模块, 用于根据所述查询模块所查询到的网页所支持的语言类型, 选取对应的树状结构的可扩展标记语言 XML文件集。
14. 根据权利要求 1 1 所述的支持多国语言的网页处理系统, 其特征在 于, 所述翻译文件为可扩展标记语言 XML文件; 所述系统还包括以下模块: 设置模块, 用于为对应于 XML文件中的相同字符串所在 HTML文件的 标签设置具有相同 name属性; 写入模块, 用于将所述设置模块所设置的相同 name属性写到所述相同 的语言字符串的键名中。
15. 根据权利要求 1 1 所述的支持多国语言的网页处理系统, 其特征在 于, 还包括以下模块: 队列模块, 用于预先为所述 HTML文件中的动态语言字符串相关的各代 码段创建对应的闭包, 并将闭包压入到预先创建的回调队列中; 回调模块, 用于在网页语言切换时, 按照先进回调队列先执行的原则, 执行回调队列中各闭包对应的代码段。
16. 一种支持多国语言的网页加载系统, 基于一个树状结构的翻译文件 集, 其中,每个超文本标记语言 HTML文件有对应的翻译文件, 其特征在于, 包括以下模块: 下载模块, 用于从服务器中下载当前 HTML文件对应的翻译文件及该翻 译文件对应的所有祖先翻译文件; 合并模块, 用于将所述下载模块所下载的翻译文件的语言字符串与其所 有祖先翻译文件公共的语言字符串合并; 翻译渲染模块, 用于将所述合并模块所合并的语言字符串插入或替换 HTML文件的语言标签内容, 进行多语言的显示或切换。
17. 根据权利要求 16所述的支持多国语言的网页加载系统, 其特征在 于, 所述翻译文件为可扩展标记语言 XML文件; 一个树状结构的可扩展标记语言 XML文件集与一种语言类型对应。
18. 根据权利要求 16所述的支持多国语言的网页加载系统, 其特征在 于, 还包括以下模块: 加载模块, 用于加载一个语言文件, 其中该语言文件用于保存网页支持 的语言类型的集合和缺省语言;
语言查询模块, 用于在所述加载模块所加载的语言文件中查询加载的网 页所支持的语言类型;
选取模块, 用于根据所述语言查询模块所选取的网页所支持的语言类 型, 选取对应的树状结构的可扩展标记语言 XML文件集。 动态翻译渲染模块, 用于按照先进回调队列先执行的原则, 执行回调队 列中各索引函数对应的代码段, 其中索引函数由所述 HTML文件中的动态语 言字符串相关的对应代码段创建而成, 回调队列可为空。
PCT/CN2012/084784 2012-06-01 2012-11-16 支持多国语言的网页处理方法、网页加载方法及其系统 WO2013177905A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP12877824.8A EP2857984B1 (en) 2012-06-01 2012-11-16 Method for processing web page supporting multiple languages, web paging loading method, and system thereof
US14/404,791 US20150121199A1 (en) 2012-06-01 2012-11-16 Method for processing and loading web pages supporting multiple languages and system thereof
US15/184,652 US10417348B2 (en) 2012-06-01 2016-06-16 Method for processing and loading web pages supporting multiple languages and system thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210182827.XA CN102693322B (zh) 2012-06-01 2012-06-01 支持多国语言的网页处理方法、网页加载方法及其系统
CN201210182827.X 2012-06-01

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US14/404,791 A-371-Of-International US20150121199A1 (en) 2012-06-01 2012-11-16 Method for processing and loading web pages supporting multiple languages and system thereof
US15/184,652 Division US10417348B2 (en) 2012-06-01 2016-06-16 Method for processing and loading web pages supporting multiple languages and system thereof

Publications (1)

Publication Number Publication Date
WO2013177905A1 true WO2013177905A1 (zh) 2013-12-05

Family

ID=46858755

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/084784 WO2013177905A1 (zh) 2012-06-01 2012-11-16 支持多国语言的网页处理方法、网页加载方法及其系统

Country Status (4)

Country Link
US (2) US20150121199A1 (zh)
EP (1) EP2857984B1 (zh)
CN (1) CN102693322B (zh)
WO (1) WO2013177905A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567384B (zh) * 2010-12-29 2017-02-01 上海掌门科技有限公司 基于网页浏览器引擎的网页多语言动态切换方法及系统
CN102693322B (zh) 2012-06-01 2014-10-22 杭州海康威视数字技术股份有限公司 支持多国语言的网页处理方法、网页加载方法及其系统
CN103793368B (zh) * 2012-10-31 2016-12-21 上海佑译信息科技有限公司 一种在自动化翻译处理中自动保护标记语言中标记的方法
CN103067265B (zh) * 2012-12-19 2016-04-06 上海市共进通信技术有限公司 应用于家庭网关的多语言web用户界面显示控制方法
CN103902261B (zh) * 2012-12-25 2017-03-01 北京慧点科技有限公司 一种处理软件资源的方法及装置
CN103544306A (zh) * 2013-11-01 2014-01-29 广东威创视讯科技股份有限公司 一种网站支持多语言显示的方法与装置
US20150324336A1 (en) * 2014-05-07 2015-11-12 Transifex Limited Content localization
CN104915204A (zh) * 2015-06-08 2015-09-16 小米科技有限责任公司 网页处理方法及装置
US10733237B2 (en) 2015-09-22 2020-08-04 International Business Machines Corporation Creating data objects to separately store common data included in documents
CN105573993A (zh) * 2015-12-31 2016-05-11 深圳市科陆电子科技股份有限公司 软件多国语言翻译方法及系统
CN105760542B (zh) * 2016-03-15 2022-07-29 腾讯科技(深圳)有限公司 一种显示控制方法、终端及服务器
CN105868320A (zh) * 2016-03-25 2016-08-17 乐视控股(北京)有限公司 显示方法、装置和系统
JP6744571B2 (ja) * 2016-06-22 2020-08-19 富士ゼロックス株式会社 情報処理装置およびプログラム
CN106202066B (zh) * 2016-07-05 2019-07-05 腾讯科技(深圳)有限公司 网站的翻译方法和装置
US11516300B2 (en) * 2016-11-30 2022-11-29 Hughes Network Systems, Llc System, method and program for localizing web page interfaces via asynchronous data and automatic binding
US10467275B2 (en) * 2016-12-09 2019-11-05 International Business Machines Corporation Storage efficiency
CN106843901B (zh) * 2017-02-10 2020-08-25 广州优视网络科技有限公司 一种页面渲染和验证的方法和装置
WO2018160205A1 (en) * 2017-03-03 2018-09-07 Perkinelmer Informatics, Inc. Systems and methods for searching and indexing documents comprising chemical information
CN109976840B (zh) * 2017-12-27 2022-03-04 航天信息股份有限公司 一种基于前后台分离平台下实现多语言自动适配的方法及系统
CN110795915B (zh) * 2018-07-31 2024-07-16 南京中兴新软件有限责任公司 xml文件批量修改方法、系统、设备和计算机可读存储介质
JP6517414B1 (ja) * 2018-08-24 2019-05-22 グレイステクノロジー株式会社 ドキュメント作成支援システム
CN111078338A (zh) * 2019-11-28 2020-04-28 北京三快在线科技有限公司 软件国际化处理的方法和装置、存储介质和电子设备
CN113032842B (zh) * 2019-12-25 2024-01-26 南通理工学院 基于云平台的网页防篡改系统及方法
CN111221617A (zh) * 2020-01-20 2020-06-02 厦门靠谱云股份有限公司 一种基于网页单项目中多语言切换的方法及系统
CN111767104B (zh) * 2020-05-07 2023-09-01 北京奇艺世纪科技有限公司 一种语言种类切换方法、装置、计算机设备及存储介质
US11307838B2 (en) 2020-05-21 2022-04-19 Microsoft Technology Licensing, Llc De-duplication of localized resources
CN111857906B (zh) * 2020-06-03 2022-02-01 北京旷视科技有限公司 终端的文本显示方法、装置、系统和存储介质
CN112052648B (zh) * 2020-09-02 2021-11-16 文思海辉智科科技有限公司 一种字串翻译方法、装置、电子设备及存储介质
CN114253641A (zh) * 2020-09-25 2022-03-29 支付宝实验室(新加坡)有限公司 数据处理方法、移动终端及开放平台
CN112257462A (zh) * 2020-11-03 2021-01-22 沈阳雅译网络技术有限公司 一种基于神经机器翻译技术的超文本标记语言翻译方法
CN112988297A (zh) * 2021-03-10 2021-06-18 深圳市创想三维科技有限公司 基于触摸屏的语言切换方法、装置、电子设备及存储介质
CN112988300A (zh) * 2021-03-15 2021-06-18 北京金山云网络技术有限公司 页面中文本的显示方法及装置、存储介质、电子设备
CN113568692B (zh) * 2021-07-12 2024-03-26 交控科技股份有限公司 多语言显示方法、装置、电子设备及存储介质
CN113296754B (zh) * 2021-07-28 2021-11-12 北京蔚领时代科技有限公司 基于xml的脚本语言转换方法、编辑器、设备及存储介质
CN116627542B (zh) * 2023-06-16 2024-08-27 上海聚水潭网络科技有限公司 前端组件在.netcore开发中的加载方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040060858A (ko) * 2004-01-15 2004-07-06 엔에이치엔(주) 다국어 검색 번역 서비스 제공 방법 및 이를 위한 시스템
CN102103494A (zh) * 2009-12-16 2011-06-22 新奥特(北京)视频技术有限公司 一种软件资源更改的方法和装置
CN102402432A (zh) * 2010-09-16 2012-04-04 正文科技股份有限公司 用于产生多国语言网页的方法
CN102402516A (zh) * 2010-09-08 2012-04-04 英业达股份有限公司 以第一语言网页生成第二语言网页的系统及其方法
CN102693322A (zh) * 2012-06-01 2012-09-26 杭州海康威视数字技术股份有限公司 支持多国语言的网页处理方法、网页加载方法及其系统

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4011268B2 (ja) * 2000-07-05 2007-11-21 株式会社アイアイエス 多言語翻訳システム
US20020123878A1 (en) * 2001-02-05 2002-09-05 International Business Machines Corporation Mechanism for internationalization of web content through XSLT transformations
US20030005159A1 (en) * 2001-06-07 2003-01-02 International Business Machines Corporation Method and system for generating and serving multilingual web pages
NO316006B1 (no) * 2001-10-08 2003-11-24 Ericsson Telefon Ab L M Plassbesparende fil-håndtering i servere
US20030084401A1 (en) * 2001-10-16 2003-05-01 Abel Todd J. Efficient web page localization
US6934908B2 (en) * 2001-10-17 2005-08-23 International Business Machines Corporation Uniform handling of external resources within structured documents
CN1578954B (zh) * 2001-10-29 2010-04-14 英国电讯有限公司 计算机语言翻译扩展系统
US7784026B1 (en) * 2002-06-05 2010-08-24 Adobe Systems Incorporated Web application internationalization
US20040044518A1 (en) * 2002-08-27 2004-03-04 Reed John E. Method and system for multilingual display generation
US20040049374A1 (en) * 2002-09-05 2004-03-11 International Business Machines Corporation Translation aid for multilingual Web sites
US7680646B2 (en) * 2004-12-21 2010-03-16 Xerox Corporation Retrieval method for translation memories containing highly structured documents
US8265924B1 (en) * 2005-10-06 2012-09-11 Teradata Us, Inc. Multiple language data structure translation and management of a plurality of languages
US8145993B2 (en) * 2007-01-03 2012-03-27 Oracle International Corporation XML-based translation
US20080221864A1 (en) * 2007-03-08 2008-09-11 Daniel Blumenthal Process for procedural generation of translations and synonyms from core dictionaries
JP5239307B2 (ja) * 2007-11-20 2013-07-17 富士ゼロックス株式会社 翻訳装置及び翻訳プログラム
US8719693B2 (en) * 2008-02-22 2014-05-06 International Business Machines Corporation Method for storing localized XML document values
US8595710B2 (en) * 2008-03-03 2013-11-26 Microsoft Corporation Repositories and related services for managing localization of resources
CN101615181B (zh) * 2008-06-27 2012-05-16 国际商业机器公司 创建国际化网络应用的系统和方法
KR101642449B1 (ko) * 2009-03-18 2016-07-25 구글 인코포레이티드 디스플레이 대체물에 의한 웹 번역
CN102103495A (zh) * 2009-12-16 2011-06-22 新奥特(北京)视频技术有限公司 一种图文包装编控软件的国际化系统
US8751925B1 (en) * 2010-04-05 2014-06-10 Facebook, Inc. Phased generation and delivery of structured documents
US9213685B2 (en) * 2010-07-13 2015-12-15 Motionpoint Corporation Dynamic language translation of web site content
US8670973B2 (en) * 2010-09-16 2014-03-11 International Business Machines Corporation Language translation reuse in different systems
US9442744B2 (en) * 2012-02-23 2016-09-13 Microsoft Technology Licensing, Llc Multilingual build integration for compiled applications
US8789015B2 (en) * 2012-02-23 2014-07-22 Microsoft Corporation Integrated application localization

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040060858A (ko) * 2004-01-15 2004-07-06 엔에이치엔(주) 다국어 검색 번역 서비스 제공 방법 및 이를 위한 시스템
CN102103494A (zh) * 2009-12-16 2011-06-22 新奥特(北京)视频技术有限公司 一种软件资源更改的方法和装置
CN102402516A (zh) * 2010-09-08 2012-04-04 英业达股份有限公司 以第一语言网页生成第二语言网页的系统及其方法
CN102402432A (zh) * 2010-09-16 2012-04-04 正文科技股份有限公司 用于产生多国语言网页的方法
CN102693322A (zh) * 2012-06-01 2012-09-26 杭州海康威视数字技术股份有限公司 支持多国语言的网页处理方法、网页加载方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2857984A4 *

Also Published As

Publication number Publication date
CN102693322A (zh) 2012-09-26
US20160299888A1 (en) 2016-10-13
EP2857984A1 (en) 2015-04-08
CN102693322B (zh) 2014-10-22
EP2857984B1 (en) 2019-02-13
EP2857984A4 (en) 2015-06-24
US20150121199A1 (en) 2015-04-30
US10417348B2 (en) 2019-09-17

Similar Documents

Publication Publication Date Title
WO2013177905A1 (zh) 支持多国语言的网页处理方法、网页加载方法及其系统
US11288338B2 (en) Extracting a portion of a document, such as a page
US9652545B2 (en) Result types for conditional data display
US9753926B2 (en) Extracting a portion of a document, such as a web page
US20090210780A1 (en) Document processing and management approach to creating a new document in a mark up language environment using new fragment and new scheme
US11907203B2 (en) Path encoded tree structures for operations
US20080134019A1 (en) Processing Data And Documents That Use A Markup Language
WO2009000141A1 (fr) Procédé, système et dispositif de représentation d&#39;informations de structure logique de fichier de mise en page
WO2017058047A1 (ru) Способ подготовки документов на языках разметки
US20080270464A1 (en) Document processing system and method therefor
US9817887B2 (en) Universal text representation with import/export support for various document formats
WO2004061713A1 (ja) 構造化文書の構造変換装置、構造変換方法、記録媒体
CN110377371B (zh) 一种基于Web标签的样式表系统管理方法
CN105740355B (zh) 基于聚集文本密度的网页正文提取方法及装置
US20080263333A1 (en) Document processing method
US20110078552A1 (en) Transclusion Process
US12056434B2 (en) Generating tagged content from text of an electronic document
JPH09282218A (ja) Html文書本型整形方法及びその装置
WO2005098666A1 (en) Processing data and documents that use a markup language
RU2821841C2 (ru) Способ визуализации, электронное устройство и носитель данных
EP1743256A1 (en) Processing documents in multiple markup representations
CN117421365A (zh) 数据转换方法、装置、计算机设备和存储介质
Hong et al. Design and Implementation of Cultural Relic Image Storage Based on SVG
JP2012073772A (ja) コンテンツ処理方法、コンテンツ処理プログラム及びコンテンツ処理装置
JP2005038064A (ja) 画面レイアウト設定プログラムおよびプログラム記憶媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12877824

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14404791

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2012877824

Country of ref document: EP