WO2017114193A1 - 一种文本资源文件的比对方法及装置 - Google Patents
一种文本资源文件的比对方法及装置 Download PDFInfo
- Publication number
- WO2017114193A1 WO2017114193A1 PCT/CN2016/110398 CN2016110398W WO2017114193A1 WO 2017114193 A1 WO2017114193 A1 WO 2017114193A1 CN 2016110398 W CN2016110398 W CN 2016110398W WO 2017114193 A1 WO2017114193 A1 WO 2017114193A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- text
- record
- resource file
- original
- updated
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
Definitions
- the present application relates to the field of computer technology, and in particular, to a method and apparatus for comparing text resource files.
- the text resource file includes text content for display on the display interface.
- the text resource file includes Chinese text content, and the Chinese text content can be displayed on the web page by parsing the text resource file.
- multi-language text content needs to be displayed.
- many web pages have a language switching function, and the Chinese text content displayed on the web page is switched to the corresponding English text content.
- the technical problem to be solved by the present application is to provide a method and device for comparing text resource files, so as to achieve no need to manually compare text resource files, thereby improving work efficiency and reducing error rate.
- the application provides a method for comparing text resource files, including:
- the original first text resource file and the updated first text resource file respectively comprise at least one text record in a first language, each piece of text
- the record includes a corresponding record identifier and text content
- a text record of the change is output.
- the changed text record includes one or more of a newly added text record, a deleted text record, and a modified text record;
- the newly added text record is a text record in which the updated first resource file exists and the original first resource file does not exist, and the deleted text record is not the updated first resource file.
- the method further includes:
- the original second text resource file including at least one text record in a second language, the original second text resource file corresponding to the original first text resource file;
- the changed text record includes the deleted text record
- Updating the original second text resource file according to the changed text record to generate an updated second text resource file including:
- the text record of the change includes a new text record or a modified text record
- Updating the original second text resource file according to the text record of the corresponding second language to generate an updated second text resource file including:
- the record identifier is used to indicate the display position or implementation function of the text content.
- the application provides a comparison device for a text resource file, including:
- An obtaining unit configured to obtain an original first text resource file and an updated first text resource file; the original first text resource file and the updated first text resource file respectively include at least one text in a first language Record, each text record includes a corresponding record identifier and text content;
- a comparison unit configured to compare the updated first text resource file with the original first text resource file by text content corresponding to the same record identifier, and obtain the changed text record
- An output unit for outputting the text record of the change.
- the changed text record includes one or more of a newly added text record, a deleted text record, and a modified text record;
- the newly added text record is a text record in which the updated first resource file exists and the original first resource file does not exist, and the deleted text record is not the updated first resource file.
- an update unit is further included;
- the obtaining unit is further configured to acquire an original second text resource file, where the original second text resource file includes at least one text record in a second language, and the original second text resource file and the original Corresponding to the first text resource file;
- the updating unit is configured to update the original second text resource file according to the changed text record and/or the text record corresponding to the changed text record, to generate an updated second Text resource file.
- the changed text record includes the deleted text record
- the updating unit is specifically configured to delete, from the original second text resource file, a text record that is the same as the record identifier of the deleted text record, to generate an updated second text resource file.
- the text record of the change includes a new text record or a modified text record
- the updating unit is configured to combine the original second text resource file and the corresponding second language text record according to the record identifier to generate an updated second text resource file.
- the record identifier is used to indicate the display position or implementation function of the text content.
- the manual comparison method when the original first text resource file and the updated first text resource file are compared, the manual comparison method is no longer used, but the same record identifier is used. The corresponding text content is compared, so that the text record in which the change has occurred can be acquired, and the text record of the change is output. It can be seen that since the manual comparison method is no longer used in the embodiment of the present application, the work efficiency is improved, and the error rate is reduced.
- FIG. 1 is a schematic flow chart of an embodiment of a method provided by the present application.
- FIG. 2 is a schematic flow chart of another method embodiment provided by the present application.
- FIG. 3 is a schematic flow chart of another method embodiment provided by the present application.
- FIG. 4 is a schematic structural diagram of an apparatus according to an embodiment of the present application.
- the text resource file may be a word file, a txt file, or the like, and includes text content for display on a display interface such as a web page or a software interface.
- the embodiment of the present application provides a method and device for comparing text resource files, so as to achieve no need to manually compare text resource files, thereby improving work efficiency and reducing error rate.
- the present application provides a method embodiment of a method for comparing text resource files.
- the method of this embodiment includes:
- the original first text resource file and the updated first text resource file respectively include at least one text record in a first language
- the first language may be Chinese.
- each text record includes a corresponding record identifier and text content.
- each text record may be in a Key-Value format, wherein the information in the Key is a record identifier, and the information in the Value is a text content.
- the original first text resource file includes a text record as shown in Table 1.
- the updated first text resource file includes a text record as shown in Table 2.
- the record identifier can be used to indicate the display position of the text content or to implement the function. For example, when the record identifiers are different, respectively corresponding to being displayed on different display positions, the text content corresponding to the record identifiers can be displayed on the display position corresponding to the record identifiers by parsing the record identifiers in the text resource files.
- Step 102 Compare the updated first text resource file with the original first text resource file by text content corresponding to the same record identifier, and obtain the changed text record.
- the text content corresponding to the same record identifier is compared.
- the text records in Tables 1 and 2 are compared according to the Value corresponding to the same Key, and the changed text record can be obtained.
- the changed text record may include one or more of a newly added text record, a deleted text record, and a modified text record.
- the newly added text record is a text record in which the updated first resource file exists and the original first resource file does not exist, for example, a text record corresponding to Key 004 in Table 2;
- the deleted text Recording is a text record in which the updated first resource file does not exist and the original first resource file exists, for example, a text record corresponding to Key 003 in Table 1;
- the modified text record is the same as the record identifier Corresponding text records with different text contents, such as the text record corresponding to Key 002 in Table 2.
- new text records, deleted text records, and modified text records can be output separately.
- the manual comparison method when the original first text resource file and the updated first text resource file are compared, the manual comparison method is no longer used. Instead, the text content corresponding to the same record identifier is compared, so that the changed text record can be acquired, and the changed text record can be output. It can be seen that since the manual comparison method is no longer used in the embodiment of the present application, the work efficiency is improved, and the error rate is reduced.
- the text content therein may be translated by a translator or a translation software to generate a corresponding second language text record. Thereby updating the corresponding text resource file according to the text record of the second language.
- the method in this embodiment further includes:
- the original second text resource file corresponds to the original first text resource file, that is, the original second text resource file and the original first text resource file.
- the text content with the same record identifier is essentially the same, but the language type is different.
- the original second text resource file includes at least one text record in a second language.
- the first language may be Chinese, and the second language is any language other than Chinese.
- the second language is English
- the original second text resource file includes a text record as shown in Table 3.
- the changed text record includes the deleted text record
- 202 specifically includes: deleting, from the original second text resource file, the same text record as the deleted text record, generating an update The second text resource file.
- the deleted text record includes the text record corresponding to Key 003 in Table 1, the text record corresponding to Key 003 in Table 3 is deleted.
- the changed text record includes a newly added text record or a modified text record; 202 specifically includes: combining the original second text resource file with the corresponding second language text record, and merging according to the record identifier , generating an updated second text resource file.
- the text content of the text can be translated by a translator or a translation software to generate a corresponding second language text record, and the original second text is
- the resource file and the corresponding text record of the second language are merged according to the record identifier, for example, the text record of the second language corresponding to the newly added text record is directly added to the original second text resource file.
- the text record corresponding to the second language of the modified text record is replaced with the corresponding text record in the original second text resource file.
- the text record corresponding to the second language corresponding to the newly added text record includes:
- the text record corresponding to the modified text record in the second language includes:
- the changed content of the first text resource file can be automatically output, and the second text resource file is adaptively changed according to the changed content.
- the following application provides a specific embodiment in which the first language is Chinese and the second language is a foreign language.
- the present application provides an embodiment of a method for comparing text resource files.
- the method of this embodiment includes:
- the Chinese resource package includes at least one Chinese text record, and the foreign language resource package includes at least one foreign text record, each text record is in a Key-Value format, wherein the information in the Key is a record identifier, and the information in the Value is a text content.
- the changed text record includes a new text record, a deleted text record, and a modified text record.
- the updated Chinese resource package may be compared with the number of text records of the foreign resource resource package backed up in 301. If the number of the entries is different, the updated Chinese resource package may be prompted to be untranslated.
- the foreign text resource package of the updated foreign language resource package corresponding to the newly added text record and the modified text record is merged according to the record identifier.
- the updated Chinese resource package and foreign language resource package can be backed up, and the process returns to step 301 to enter the loop process.
- the present application provides an apparatus embodiment of a comparison device for a text resource file.
- the apparatus of this embodiment includes an acquisition unit 401, a comparison unit 402, and an output unit 403.
- the obtaining unit 401 is configured to obtain an original first text resource file and an updated first text resource file.
- the original first text resource file and the updated first text resource file respectively include at least one text record in a first language
- the first language may be Chinese.
- each text record includes a corresponding record identifier and text content.
- each text record may be in a Key-Value format, wherein the information in the Key is a record identifier, and the information in the Value is a text content.
- the original first text resource file includes a text record as shown in Table 1.
- the updated first text resource file includes a text record as shown in Table 2.
- the record identifier can be used to indicate the display position of the text content or to implement the function. For example, when the record identifiers are different, respectively corresponding to being displayed on different display positions, the text content corresponding to the record identifiers can be displayed on the display position corresponding to the record identifiers by parsing the record identifiers in the text resource files.
- the comparing unit 402 is configured to compare the updated first text resource file with the original first text resource file by text content corresponding to the same record identifier, and obtain the changed text record.
- the text content corresponding to the same record identifier is compared.
- the text records in Tables 1 and 2 are compared according to the Value corresponding to the same Key, and the changed text record can be obtained.
- the changed text record may include one or more of a newly added text record, a deleted text record, and a modified text record.
- the newly added text record is a text record in which the updated first resource file exists and the original first resource file does not exist, for example, a text record corresponding to Key 004 in Table 2;
- the deleted text Recording is a text record in which the updated first resource file does not exist and the original first resource file exists, for example, a text record corresponding to Key 003 in Table 1;
- the modified text record is the same as the record identifier Corresponding text records with different text contents, such as the text record corresponding to Key 002 in Table 2.
- the output unit 403 is configured to output the changed text record.
- new text records, deleted text records, and modified text records can be output separately.
- the manual comparison method when the original first text resource file and the updated first text resource file are compared, the manual comparison method is no longer used, but the same record identifier is used. The corresponding text content is compared, so that the text record in which the change has occurred can be acquired, and the text record of the change is output. It can be seen that since the manual comparison method is no longer used in the embodiment of the present application, the work efficiency is improved, and the error rate is reduced.
- the text content therein may be translated by a translator or a translation software to generate a corresponding second language text record. Thereby updating the corresponding text resource file according to the text record of the second language.
- the apparatus of this embodiment may further include an update unit
- the obtaining unit 401 is further configured to acquire an original second text resource file, where the original second text resource file includes at least one text record in a second language, and the original second text resource file and the original A text resource file corresponds.
- the first language may be Chinese
- the second language is any language other than Chinese.
- the second language is English
- the original second text resource file includes a text record as shown in Table 3.
- the updating unit is configured to update the original second text resource file according to the changed text record and/or the text record corresponding to the changed text record, to generate an updated second Text resource file.
- the updating unit is specifically configured to: from the original second text resource file, the same text record as the record identifier of the deleted text record Delete, generate an updated second text resource file.
- the updating unit is specifically configured to: record the original second text resource file and the corresponding second language text according to The record identifiers are merged to generate an updated second text resource file.
- the changed content of the first text resource file can be automatically output, and the second text resource file is adaptively changed according to the changed content.
- the disclosed system, apparatus, and method may be implemented in other manners.
- the device embodiments described above are merely illustrative.
- the division of the unit is only a logical function division.
- there may be another division manner for example, multiple units or components may be combined or Can be integrated Go to another system, or some features can be ignored or not executed.
- the mutual coupling or direct coupling or communication connection shown or discussed may be an indirect coupling or communication connection through some interface, device or unit, and may be in an electrical, mechanical or other form.
- the units described as separate components may or may not be physically separated, and the components displayed as units may or may not be physical units, that is, may be located in one place, or may be distributed to multiple network units. Some or all of the units may be selected according to actual needs to achieve the purpose of the solution of the embodiment.
- each functional unit in each embodiment of the present application may be integrated into one processing unit, or each unit may exist physically separately, or two or more units may be integrated into one unit.
- the above integrated unit can be implemented in the form of hardware or in the form of a software functional unit.
- the integrated unit if implemented in the form of a software functional unit and sold or used as a standalone product, may be stored in a computer readable storage medium.
- a computer readable storage medium A number of instructions are included to cause a computer device (which may be a personal computer, server, or network device, etc.) to perform all or part of the steps of the methods described in various embodiments of the present application.
- the foregoing storage medium includes: a U disk, a mobile hard disk, a read-only memory (ROM), a random access memory (RAM), a magnetic disk, or an optical disk, and the like. .
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种文本资源文件的比对方法及装置,所述方法包括:获取原始的第一文本资源文件和更新的第一文本资源文件(101);所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录(102);输出所述变更的文本记录(103)。
Description
本申请涉及计算机技术领域,尤其是涉及一种文本资源文件的比对方法及装置。
文本资源文件中包括用于在显示界面上进行显示的文本内容。例如,文本资源文件包括中文文本内容,通过解析该文本资源文件,能够在网页上显示该中文文本内容。
在一些应用场景下,需要显示多语言对照的文本内容,例如,很多网页都具有语言切换功能,将网页上显示的中文文本内容切换成对应的英文文本内容。在具体实现时,通常需要生成基准的文本资源文件和对照的文本资源文件,这两个文本资源文件的文本内容相对应。
当基准的文本资源文件被更新后,需要比对原始的和更新的文本内容,输出变更的文本内容,从而对应地更新对照的文本资源文件。目前,在比对原始的和更新的文本内容时,通常由翻译人员进行人工比对,不仅效率很低,而且容易出错。
发明内容
本申请解决的技术问题在于提供一种文本资源文件的比对方法及装置,以实现不需要人工比对文本资源文件,从而提高工作效率并且降低出错率。
为此,本申请解决技术问题的技术方案是:
本申请提供了一种文本资源文件的比对方法,包括:
获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;
将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;
输出所述变更的文本记录。
可选的,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;
其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
可选的,所述方法还包括:
获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;
根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括删除的文本记录;
根据所述变更的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:
从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括新增的文本记录或修改的文本记录;
根据所述对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:
将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
可选的,记录标识用于表示文本内容的显示位置或者实现功能。
本申请提供了一种文本资源文件的比对装置,包括:
获取单元,用于获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;
比对单元,用于将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;
输出单元,用于输出所述变更的文本记录。
可选的,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;
其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
可选的,还包括更新单元;
所述获取单元,还用于获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;
所述更新单元,用于根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括删除的文本记录;
所述更新单元具体用于,从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括新增的文本记录或修改的文本记录;
所述更新单元具体用于,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
可选的,记录标识用于表示文本内容的显示位置或者实现功能。
通过上述技术方案可知,本申请实施例中,在对原始的第一文本资源文件和更新的第一文本资源文件进行比对时,不再采用人工比对的方式,而是按照相同记录标识所对应的文本内容进行比对,从而能够获取到发生变更的文本记录,并输出该变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其它的附图。
图1为本申请提供的一种方法实施例的流程示意图;
图2为本申请提供的另一种方法实施例的流程示意图;
图3为本申请提供的另一种方法实施例的流程示意图;
图4为本申请提供的一种装置实施例的结构示意图。
文本资源文件可以为word文件、txt文件等,其中包括用于在网页、软件界面等显示界面上进行显示的文本内容。
在一些应用场景下,需要显示多语言对照的文本内容。在具体实现时,需要生成基准的文本资源文件和对照的文本资源文件,这两个文本资源文件的文本内容相对应,即实质内容相同但是所使用的语言类型不同。
当基准的文本资源文件被更新后,需要比对原始的和更新的文本内容。目前,将原始的和更新的文本内容全部输出给翻译人员,由翻译人员进行人工比对,并且再对新增或者修改的文本内容进行翻译,从而对应地更新对照的文本资源文件。显然,由于需要由翻译人员进行人工比对,不仅效率很低,而且容易出错。
本申请实施例提供一种文本资源文件的比对方法及装置,以实现不需要人工比对文本资源文件,从而提高工作效率并且降低出错率。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
请参阅图1,本申请提供了文本资源文件的比对方法的一种方法实施例。本实施例的所述方法包括:
101:获取原始的第一文本资源文件和更新的第一文本资源文件。
在本实施例中,所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,所述第一语言可以为中文。
其中,每条文本记录包括对应的记录标识和文本内容。例如,每条文本记录可以为Key-Value格式,其中Key中的信息为记录标识,Value中的信息为文本内容。例如原始的第一文本资源文件包括如表1所示的文本记录。
表1
Key | Value |
001 | 标题 |
002 | 新闻:12月20日 |
003 | 广告 |
更新的第一文本资源文件包括如表2所示的文本记录。
表2
Key | Value |
001 | 标题 |
002 | 新闻:12月21日 |
004 | 天气预报 |
其中,记录标识可以用于表示文本内容的显示位置或者实现功能。例如,当记录标识不同时,分别对应于显示在不同的显示位置上,因此通过解析文本资源文件中的记录标识,能够将记录标识对应的文本内容显示在记录标识对应的显示位置上。
102:将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录。
在本实施例中,将所述更新的第一文本资源文件与所述原始的第一文本资源文件进行比对时,按照相同记录标识所对应的文本内容进行比较。例如,将表1和表2中的文本记录,按照相同Key对应的Value进行比较,可以得出变更的文本记录。
其中,所述变更的文本记录可以包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种。
所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,例如表2中Key为004所对应的文本记录;所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,例如表1中Key为003所对应的文本记录;所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录,例如表2中Key为002所对应的文本记录。
103:输出所述变更的文本记录。
例如,可以分别输出新增的文本记录、删除的文本记录和修改的文本记录。
通过上述技术方案可知,本申请实施例中,在对原始的第一文本资源文件和更新的第一文本资源文件进行比对时,不再采用人工比对的方式,
而是按照相同记录标识所对应的文本内容进行比对,从而能够获取到发生变更的文本记录,并输出该变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。
在本申请实施例中,当输出所述变更的文本记录之后,可以由翻译人员或者翻译软件对其中的文本内容进行翻译,生成对应的第二语言的文本记录。从而根据第二语言的文本记录,更新相应的文本资源文件。下面具体说明。
如图2所示,本实施例的所述方法还包括:
201:获取原始的第二文本资源文件。
本实施例中,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应,也就是说,所述原始的第二文本资源文件与所述原始的第一文本资源文件相比,记录标识相同的文本内容实质上是相同的,但是语言类型不同。所述原始的第二文本资源文件包括至少一条第二语言的文本记录。
其中,所述第一语言可以为中文,所述第二语言为除中文之前的任一种语言。例如,第二语言为英文,所述原始的第二文本资源文件包括如表3所示的文本记录。
表3
Key | Value |
001 | Title |
002 | News:December 20th |
003 | Advertising |
202:根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
若所述所述变更的文本记录包括删除的文本记录,202具体包括:从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
例如所述删除的文本记录包括表1中Key为003所对应的文本记录,则将表3中Key为003所对应的文本记录删除。
若所述变更的文本记录包括新增的文本记录或修改的文本记录;202具体包括:将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
在103中输出所述新增的文本记录或修改的文本记录,可以由翻译人员或者翻译软件对其中的文本内容进行翻译,生成对应的第二语言的文本记录,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,例如,将新增的文本记录对应的第二语言的文本记录,直接增加到所述原始的第二文本资源文件中;将修改的文本记录对应的第二语言的文本记录,替换所述原始的第二文本资源文件中相应的文本记录。
例如所述新增的文本记录对应的第二语言的文本记录包括:
004 | Weather Report |
所述修改的文本记录对应的第二语言的文本记录包括:
002 | News:December 21st |
将上述两项文本记录与表3所示的文本记录,按照记录标识进行合并。
可见,本申请实施例中,能够自动输出第一文本资源文件的变更内容,并且根据该变更内容,对第二文本资源文件进行适应性的变更。
下面本申请以第一语言为中文,第二语言为外文为例,提供一种具体的实施例。
请参阅图3,本申请提供了文本资源文件的比对方法的一种方法实施例。本实施例的所述方法包括:
301:项目待发布时,备份中文资源包和外文资源包。
其中,中文资源包包括至少一条中文的文本记录,外文资源包包括至少一条外文的文本记录,每条文本记录为Key-Value格式,其中Key中的信息为记录标识,Value中的信息为文本内容
302:获取更新的中文资源包,将301中备份的中文资源包与更新的中文资源包,按相同Key对应的Value进行比对,获取变更的文本记录。
其中,变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录。
本实施例中,还可以将更新的中文资源包与301中备份的外文资源包的文本记录的条数进行比对,若条数不同,则可以提示更新的中文资源包存在未翻译的情况。
303:输出新增的文本记录和修改的文本记录,由翻译人员或者翻译软件翻译成相应的外文。
304:获取新增的文本记录和修改的文本记录对应的外文的文本记录。
305:从更新的外文资源包中,将与所述删除的文本记录的记录标识相同的文本记录删除。
306:将更新的外文资源包,与新增的文本记录和修改的文本记录对应的外文的文本记录,按照记录标识进行合并。
此步骤之后可以备份更新的中文资源包和外文资源包,返回步骤301进入循环过程。
请参阅图4,本申请提供了文本资源文件的比对装置的一种装置实施例。本实施例的所述装置包括:获取单元401、比对单元402和输出单元403。
获取单元401,用于获取原始的第一文本资源文件和更新的第一文本资源文件。
在本实施例中,所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,所述第一语言可以为中文。
其中,每条文本记录包括对应的记录标识和文本内容。例如,每条文本记录可以为Key-Value格式,其中Key中的信息为记录标识,Value中的信息为文本内容。例如原始的第一文本资源文件包括如表1所示的文本记录。更新的第一文本资源文件包括如表2所示的文本记录。
其中,记录标识可以用于表示文本内容的显示位置或者实现功能。例如,当记录标识不同时,分别对应于显示在不同的显示位置上,因此通过解析文本资源文件中的记录标识,能够将记录标识对应的文本内容显示在记录标识对应的显示位置上。
比对单元402,用于将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录。
在本实施例中,将所述更新的第一文本资源文件与所述原始的第一文本资源文件进行比对时,按照相同记录标识所对应的文本内容进行比较。例如,将表1和表2中的文本记录,按照相同Key对应的Value进行比较,可以得出变更的文本记录。
其中,所述变更的文本记录可以包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种。
所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,例如表2中Key为004所对应的文本记录;所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,例如表1中Key为003所对应的文本记录;所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录,例如表2中Key为002所对应的文本记录。
输出单元403,用于输出所述变更的文本记录。
例如,可以分别输出新增的文本记录、删除的文本记录和修改的文本记录。
通过上述技术方案可知,本申请实施例中,在对原始的第一文本资源文件和更新的第一文本资源文件进行比对时,不再采用人工比对的方式,而是按照相同记录标识所对应的文本内容进行比对,从而能够获取到发生变更的文本记录,并输出该变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。
在本申请实施例中,当输出所述变更的文本记录之后,可以由翻译人员或者翻译软件对其中的文本内容进行翻译,生成对应的第二语言的文本记录。从而根据第二语言的文本记录,更新相应的文本资源文件。下面具体说明。
本实施例的所述装置还可以包括更新单元;
获取单元401,还用于获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应。其中,所述第一语言可以为中文,所述第二语言为除中文之前的任一种语言。例如,第二语言为英文,所述原始的第二文本资源文件包括如表3所示的文本记录。
所述更新单元,用于根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
若所述所述变更的文本记录包括删除的文本记录,所述更新单元具体用于,从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
若所述变更的文本记录包括新增的文本记录或修改的文本记录;所述更新单元具体用于,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
可见,本申请实施例中,能够自动输出第一文本资源文件的变更内容,并且根据该变更内容,对第二文本资源文件进行适应性的变更。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成
到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (12)
- 一种文本资源文件的比对方法,其特征在于,包括:获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;输出所述变更的文本记录。
- 根据权利要求1所述的方法,其特征在于,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
- 根据权利要求1所述的方法,其特征在于,所述方法还包括:获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
- 根据权利要求3所述的方法,其特征在于,所述变更的文本记录包括删除的文本记录;根据所述变更的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
- 根据权利要求3所述的方法,其特征在于,所述变更的文本记录包括新增的文本记录或修改的文本记录;根据所述对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
- 根据权利要求1至5任一项所述的方法,其特征在于,记录标识用于表示文本内容的显示位置或者实现功能。
- 一种文本资源文件的比对装置,其特征在于,包括:获取单元,用于获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;比对单元,用于将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;输出单元,用于输出所述变更的文本记录。
- 根据权利要求7所述的装置,其特征在于,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
- 根据权利要求7所述的装置,其特征在于,还包括更新单元;所述获取单元,还用于获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;所述更新单元,用于根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
- 根据权利要求9所述的装置,其特征在于,所述变更的文本记录包括删除的文本记录;所述更新单元具体用于,从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
- 根据权利要求9所述的装置,其特征在于,所述变更的文本记录包括新增的文本记录或修改的文本记录;所述更新单元具体用于,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
- 根据权利要求7至11任一项所述的装置,其特征在于,记录标识用于表示文本内容的显示位置或者实现功能。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511024548.0 | 2015-12-30 | ||
CN201511024548.0A CN106933782A (zh) | 2015-12-30 | 2015-12-30 | 一种文本资源文件的比对方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2017114193A1 true WO2017114193A1 (zh) | 2017-07-06 |
Family
ID=59224532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2016/110398 WO2017114193A1 (zh) | 2015-12-30 | 2016-12-16 | 一种文本资源文件的比对方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106933782A (zh) |
WO (1) | WO2017114193A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929500A (zh) * | 2019-11-08 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 文件比较方法及相关装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644090B (zh) * | 2017-09-26 | 2019-02-05 | 北京金堤科技有限公司 | 一种变更信息处理方法及装置 |
CN108491398B (zh) * | 2018-03-26 | 2021-09-07 | 深圳市元征科技股份有限公司 | 一种对更新的软件文本进行翻译的方法及电子设备 |
CN111144090A (zh) * | 2019-12-23 | 2020-05-12 | 网易(杭州)网络有限公司 | 一种文件对比方法、装置、电子设备及存储介质 |
CN112104917B (zh) * | 2020-08-06 | 2022-07-08 | 武汉译满天下科技有限公司 | 一种单双语字幕修改查找处理方法及系统 |
CN117709362B (zh) * | 2023-11-22 | 2024-10-01 | 赛力斯汽车有限公司 | 多语言资源的修改方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916255A (zh) * | 2010-07-02 | 2010-12-15 | 互动在线(北京)科技有限公司 | Html内容对比装置及方法 |
US20120110445A1 (en) * | 2010-11-02 | 2012-05-03 | Greenspan David L | Realtime Synchronized Document Editing by Multiple Users for Blogging |
CN102467497A (zh) * | 2010-10-29 | 2012-05-23 | 国际商业机器公司 | 校对程序中的文本翻译的方法和系统 |
CN103207874A (zh) * | 2012-01-17 | 2013-07-17 | 腾讯科技(深圳)有限公司 | 一种网页更新内容的提示方法及系统 |
-
2015
- 2015-12-30 CN CN201511024548.0A patent/CN106933782A/zh active Pending
-
2016
- 2016-12-16 WO PCT/CN2016/110398 patent/WO2017114193A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916255A (zh) * | 2010-07-02 | 2010-12-15 | 互动在线(北京)科技有限公司 | Html内容对比装置及方法 |
CN102467497A (zh) * | 2010-10-29 | 2012-05-23 | 国际商业机器公司 | 校对程序中的文本翻译的方法和系统 |
US20120110445A1 (en) * | 2010-11-02 | 2012-05-03 | Greenspan David L | Realtime Synchronized Document Editing by Multiple Users for Blogging |
CN103207874A (zh) * | 2012-01-17 | 2013-07-17 | 腾讯科技(深圳)有限公司 | 一种网页更新内容的提示方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929500A (zh) * | 2019-11-08 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 文件比较方法及相关装置 |
CN110929500B (zh) * | 2019-11-08 | 2022-07-08 | 腾讯科技(深圳)有限公司 | 文件比较方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106933782A (zh) | 2017-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017114193A1 (zh) | 一种文本资源文件的比对方法及装置 | |
EP3686748B1 (en) | Synchronizing content blocks between multiple electronic documents | |
US10089288B2 (en) | Annotations management for electronic documents handling | |
EP3113043B1 (en) | Method, device and host for updating metadata stored in columns in distributed file system | |
US9456229B2 (en) | Parsing single source content for multi-channel publishing | |
US10089338B2 (en) | Method and apparatus for object storage | |
WO2016074370A1 (zh) | 一种KeyValue数据库的数据表的更新方法与表数据更新装置 | |
EP3779715A1 (en) | Method and apparatus for deleting duplicate data | |
CN107203574B (zh) | 数据管理和数据分析的聚合 | |
CN107832308B (zh) | 一种机器翻译的断句方法及系统、计算机程序、计算机 | |
US20150154019A1 (en) | Cloud-based localization platform | |
US20190325043A1 (en) | Method, device and computer program product for replicating data block | |
US11455464B2 (en) | Document content classification and alteration | |
RU2586872C2 (ru) | Удаление поврежденных стилей из документов расширяемого языка разметки | |
CN110765782B (zh) | 基于键值的字段翻译方法、装置、计算机设备及存储介质 | |
US20140095522A1 (en) | Reference data segmentation from single to multiple tables | |
US9286055B1 (en) | System, method, and computer program for aggregating fragments of data objects from a plurality of devices | |
US11409610B1 (en) | Context-driven data backup and recovery | |
US10242025B2 (en) | Efficient differential techniques for metafiles | |
US11138075B2 (en) | Method, apparatus, and computer program product for generating searchable index for a backup of a virtual machine | |
TWI676112B (zh) | 在雲搜尋平台中構建索引和進行搜尋的方法和裝置 | |
AU2021250466A1 (en) | Systems and methods for collaborative editing of electronic objects | |
US9710263B2 (en) | Understanding computer code with human language assistance | |
US20140289002A1 (en) | Methods for identifying and providing notification about web content associated with an organization and devices thereof | |
US10795875B2 (en) | Data storing method using multi-version based data structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 16880983 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 16880983 Country of ref document: EP Kind code of ref document: A1 |