CN106933782A - 一种文本资源文件的比对方法及装置 - Google Patents

一种文本资源文件的比对方法及装置 Download PDF

Info

Publication number
CN106933782A
CN106933782A CN201511024548.0A CN201511024548A CN106933782A CN 106933782 A CN106933782 A CN 106933782A CN 201511024548 A CN201511024548 A CN 201511024548A CN 106933782 A CN106933782 A CN 106933782A
Authority
CN
China
Prior art keywords
text entry
text
textual resources
file
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511024548.0A
Other languages
English (en)
Inventor
张治中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201511024548.0A priority Critical patent/CN106933782A/zh
Priority to PCT/CN2016/110398 priority patent/WO2017114193A1/zh
Publication of CN106933782A publication Critical patent/CN106933782A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种文本资源文件的比对方法及装置,所述方法包括:获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;输出所述变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。

Description

一种文本资源文件的比对方法及装置
技术领域
本申请涉及计算机技术领域,尤其是涉及一种文本资源文件的比对方法及装置。
背景技术
文本资源文件中包括用于在显示界面上进行显示的文本内容。例如,文本资源文件包括中文文本内容,通过解析该文本资源文件,能够在网页上显示该中文文本内容。
在一些应用场景下,需要显示多语言对照的文本内容,例如,很多网页都具有语言切换功能,将网页上显示的中文文本内容切换成对应的英文文本内容。在具体实现时,通常需要生成基准的文本资源文件和对照的文本资源文件,这两个文本资源文件的文本内容相对应。
当基准的文本资源文件被更新后,需要比对原始的和更新的文本内容,输出变更的文本内容,从而对应地更新对照的文本资源文件。目前,在比对原始的和更新的文本内容时,通常由翻译人员进行人工比对,不仅效率很低,而且容易出错。
发明内容
本申请解决的技术问题在于提供一种文本资源文件的比对方法及装置,以实现不需要人工比对文本资源文件,从而提高工作效率并且降低出错率。
为此,本申请解决技术问题的技术方案是:
本申请提供了一种文本资源文件的比对方法,包括:
获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;
将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;
输出所述变更的文本记录。
可选的,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;
其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
可选的,所述方法还包括:
获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;
根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括删除的文本记录;
根据所述变更的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:
从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括新增的文本记录或修改的文本记录;
根据所述对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:
将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
可选的,记录标识用于表示文本内容的显示位置或者实现功能。
本申请提供了一种文本资源文件的比对装置,包括:
获取单元,用于获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;
比对单元,用于将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;
输出单元,用于输出所述变更的文本记录。
可选的,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;
其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
可选的,还包括更新单元;
所述获取单元,还用于获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;
所述更新单元,用于根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括删除的文本记录;
所述更新单元具体用于,从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
可选的,所述变更的文本记录包括新增的文本记录或修改的文本记录;
所述更新单元具体用于,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
可选的,记录标识用于表示文本内容的显示位置或者实现功能。
通过上述技术方案可知,本申请实施例中,在对原始的第一文本资源文件和更新的第一文本资源文件进行比对时,不再采用人工比对的方式,而是按照相同记录标识所对应的文本内容进行比对,从而能够获取到发生变更的文本记录,并输出该变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其它的附图。
图1为本申请提供的一种方法实施例的流程示意图;
图2为本申请提供的另一种方法实施例的流程示意图;
图3为本申请提供的另一种方法实施例的流程示意图;
图4为本申请提供的一种装置实施例的结构示意图。
具体实施方式
文本资源文件可以为word文件、txt文件等,其中包括用于在网页、软件界面等显示界面上进行显示的文本内容。
在一些应用场景下,需要显示多语言对照的文本内容。在具体实现时,需要生成基准的文本资源文件和对照的文本资源文件,这两个文本资源文件的文本内容相对应,即实质内容相同但是所使用的语言类型不同。
当基准的文本资源文件被更新后,需要比对原始的和更新的文本内容。目前,将原始的和更新的文本内容全部输出给翻译人员,由翻译人员进行人工比对,并且再对新增或者修改的文本内容进行翻译,从而对应地更新对照的文本资源文件。显然,由于需要由翻译人员进行人工比对,不仅效率很低,而且容易出错。
本申请实施例提供一种文本资源文件的比对方法及装置,以实现不需要人工比对文本资源文件,从而提高工作效率并且降低出错率。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
请参阅图1,本申请提供了文本资源文件的比对方法的一种方法实施例。本实施例的所述方法包括:
101:获取原始的第一文本资源文件和更新的第一文本资源文件。
在本实施例中,所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,所述第一语言可以为中文。
其中,每条文本记录包括对应的记录标识和文本内容。例如,每条文本记录可以为Key-Value格式,其中Key中的信息为记录标识,Value中的信息为文本内容。例如原始的第一文本资源文件包括如表1所示的文本记录。
表1
Key Value
001 标题
002 新闻:12月20日
003 广告
更新的第一文本资源文件包括如表2所示的文本记录。
表2
Key Value
001 标题
002 新闻:12月21日
004 天气预报
其中,记录标识可以用于表示文本内容的显示位置或者实现功能。例如,当记录标识不同时,分别对应于显示在不同的显示位置上,因此通过解析文本资源文件中的记录标识,能够将记录标识对应的文本内容显示在记录标识对应的显示位置上。
102:将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录。
在本实施例中,将所述更新的第一文本资源文件与所述原始的第一文本资源文件进行比对时,按照相同记录标识所对应的文本内容进行比较。例如,将表1和表2中的文本记录,按照相同Key对应的Value进行比较,可以得出变更的文本记录。
其中,所述变更的文本记录可以包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种。
所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,例如表2中Key为004所对应的文本记录;所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,例如表1中Key为003所对应的文本记录;所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录,例如表2中Key为002所对应的文本记录。
103:输出所述变更的文本记录。
例如,可以分别输出新增的文本记录、删除的文本记录和修改的文本记录。
通过上述技术方案可知,本申请实施例中,在对原始的第一文本资源文件和更新的第一文本资源文件进行比对时,不再采用人工比对的方式,而是按照相同记录标识所对应的文本内容进行比对,从而能够获取到发生变更的文本记录,并输出该变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。
在本申请实施例中,当输出所述变更的文本记录之后,可以由翻译人员或者翻译软件对其中的文本内容进行翻译,生成对应的第二语言的文本记录。从而根据第二语言的文本记录,更新相应的文本资源文件。下面具体说明。
如图2所示,本实施例的所述方法还包括:
201:获取原始的第二文本资源文件。
本实施例中,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应,也就是说,所述原始的第二文本资源文件与所述原始的第一文本资源文件相比,记录标识相同的文本内容实质上是相同的,但是语言类型不同。所述原始的第二文本资源文件包括至少一条第二语言的文本记录。
其中,所述第一语言可以为中文,所述第二语言为除中文之前的任一种语言。例如,第二语言为英文,所述原始的第二文本资源文件包括如表3所示的文本记录。
表3
Key Value
001 Title
002 News:December 20th
003 Advertising
202:根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
若所述所述变更的文本记录包括删除的文本记录,202具体包括:从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
例如所述删除的文本记录包括表1中Key为003所对应的文本记录,则将表3中Key为003所对应的文本记录删除。
若所述变更的文本记录包括新增的文本记录或修改的文本记录;202具体包括:将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
在103中输出所述新增的文本记录或修改的文本记录,可以由翻译人员或者翻译软件对其中的文本内容进行翻译,生成对应的第二语言的文本记录,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,例如,将新增的文本记录对应的第二语言的文本记录,直接增加到所述原始的第二文本资源文件中;将修改的文本记录对应的第二语言的文本记录,替换所述原始的第二文本资源文件中相应的文本记录。
例如所述新增的文本记录对应的第二语言的文本记录包括:
004 Weather Report
所述修改的文本记录对应的第二语言的文本记录包括:
002 News:December 21st
将上述两项文本记录与表3所示的文本记录,按照记录标识进行合并。
可见,本申请实施例中,能够自动输出第一文本资源文件的变更内容,并且根据该变更内容,对第二文本资源文件进行适应性的变更。
下面本申请以第一语言为中文,第二语言为外文为例,提供一种具体的实施例。
请参阅图3,本申请提供了文本资源文件的比对方法的一种方法实施例。本实施例的所述方法包括:
301:项目待发布时,备份中文资源包和外文资源包。
其中,中文资源包包括至少一条中文的文本记录,外文资源包包括至少一条外文的文本记录,每条文本记录为Key-Value格式,其中Key中的信息为记录标识,Value中的信息为文本内容
302:获取更新的中文资源包,将301中备份的中文资源包与更新的中文资源包,按相同Key对应的Value进行比对,获取变更的文本记录。
其中,变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录。
本实施例中,还可以将更新的中文资源包与301中备份的外文资源包的文本记录的条数进行比对,若条数不同,则可以提示更新的中文资源包存在未翻译的情况。
303:输出新增的文本记录和修改的文本记录,由翻译人员或者翻译软件翻译成相应的外文。
304:获取新增的文本记录和修改的文本记录对应的外文的文本记录。
305:从更新的外文资源包中,将与所述删除的文本记录的记录标识相同的文本记录删除。
306:将更新的外文资源包,与新增的文本记录和修改的文本记录对应的外文的文本记录,按照记录标识进行合并。
此步骤之后可以备份更新的中文资源包和外文资源包,返回步骤301进入循环过程。
请参阅图4,本申请提供了文本资源文件的比对装置的一种装置实施例。本实施例的所述装置包括:获取单元401、比对单元402和输出单元403。
获取单元401,用于获取原始的第一文本资源文件和更新的第一文本资源文件。
在本实施例中,所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,所述第一语言可以为中文。
其中,每条文本记录包括对应的记录标识和文本内容。例如,每条文本记录可以为Key-Value格式,其中Key中的信息为记录标识,Value中的信息为文本内容。例如原始的第一文本资源文件包括如表1所示的文本记录。更新的第一文本资源文件包括如表2所示的文本记录。
其中,记录标识可以用于表示文本内容的显示位置或者实现功能。例如,当记录标识不同时,分别对应于显示在不同的显示位置上,因此通过解析文本资源文件中的记录标识,能够将记录标识对应的文本内容显示在记录标识对应的显示位置上。
比对单元402,用于将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录。
在本实施例中,将所述更新的第一文本资源文件与所述原始的第一文本资源文件进行比对时,按照相同记录标识所对应的文本内容进行比较。例如,将表1和表2中的文本记录,按照相同Key对应的Value进行比较,可以得出变更的文本记录。
其中,所述变更的文本记录可以包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种。
所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,例如表2中Key为004所对应的文本记录;所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,例如表1中Key为003所对应的文本记录;所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录,例如表2中Key为002所对应的文本记录。
输出单元403,用于输出所述变更的文本记录。
例如,可以分别输出新增的文本记录、删除的文本记录和修改的文本记录。
通过上述技术方案可知,本申请实施例中,在对原始的第一文本资源文件和更新的第一文本资源文件进行比对时,不再采用人工比对的方式,而是按照相同记录标识所对应的文本内容进行比对,从而能够获取到发生变更的文本记录,并输出该变更的文本记录。可见,由于本申请实施例中不再采用人工比对的方式,因此提高工作效率,并且降低出错率。
在本申请实施例中,当输出所述变更的文本记录之后,可以由翻译人员或者翻译软件对其中的文本内容进行翻译,生成对应的第二语言的文本记录。从而根据第二语言的文本记录,更新相应的文本资源文件。下面具体说明。
本实施例的所述装置还可以包括更新单元;
获取单元401,还用于获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应。其中,所述第一语言可以为中文,所述第二语言为除中文之前的任一种语言。例如,第二语言为英文,所述原始的第二文本资源文件包括如表3所示的文本记录。
所述更新单元,用于根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
若所述所述变更的文本记录包括删除的文本记录,所述更新单元具体用于,从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
若所述变更的文本记录包括新增的文本记录或修改的文本记录;所述更新单元具体用于,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
可见,本申请实施例中,能够自动输出第一文本资源文件的变更内容,并且根据该变更内容,对第二文本资源文件进行适应性的变更。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (12)

1.一种文本资源文件的比对方法,其特征在于,包括:
获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;
将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;
输出所述变更的文本记录。
2.根据权利要求1所述的方法,其特征在于,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;
其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;
根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
4.根据权利要求3所述的方法,其特征在于,所述变更的文本记录包括删除的文本记录;
根据所述变更的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:
从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
5.根据权利要求3所述的方法,其特征在于,所述变更的文本记录包括新增的文本记录或修改的文本记录;
根据所述对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件,包括:
将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
6.根据权利要求1至5任一项所述的方法,其特征在于,记录标识用于表示文本内容的显示位置或者实现功能。
7.一种文本资源文件的比对装置,其特征在于,包括:
获取单元,用于获取原始的第一文本资源文件和更新的第一文本资源文件;所述原始的第一文本资源文件和所述更新的第一文本资源文件分别包括至少一条第一语言的文本记录,每条文本记录包括对应的记录标识和文本内容;
比对单元,用于将所述更新的第一文本资源文件与所述原始的第一文本资源文件按相同记录标识对应的文本内容进行比对,获取变更的文本记录;
输出单元,用于输出所述变更的文本记录。
8.根据权利要求7所述的装置,其特征在于,所述变更的文本记录包括新增的文本记录、删除的文本记录和修改的文本记录中的一种或多种;
其中,所述新增的文本记录为所述更新的第一资源文件存在且所述原始的第一资源文件不存在的文本记录,所述删除的文本记录为所述更新的第一资源文件不存在且所述原始的第一资源文件存在的文本记录,所述修改的文本记录为记录标识相同且对应的文本内容不同的文本记录。
9.根据权利要求7所述的装置,其特征在于,还包括更新单元;
所述获取单元,还用于获取原始的第二文本资源文件,所述原始的第二文本资源文件包括至少一条第二语言的文本记录,所述原始的第二文本资源文件与所述原始的第一文本资源文件相对应;
所述更新单元,用于根据所述变更的文本记录和/或所述变更的文本记录对应的第二语言的文本记录,对所述原始的第二文本资源文件进行更新,生成更新的第二文本资源文件。
10.根据权利要求9所述的装置,其特征在于,所述变更的文本记录包括删除的文本记录;
所述更新单元具体用于,从所述原始的第二文本资源文件中,将与所述删除的文本记录的记录标识相同的文本记录删除,生成更新的第二文本资源文件。
11.根据权利要求9所述的装置,其特征在于,所述变更的文本记录包括新增的文本记录或修改的文本记录;
所述更新单元具体用于,将所述原始的第二文本资源文件与所述对应的第二语言的文本记录,按照记录标识进行合并,生成更新的第二文本资源文件。
12.根据权利要求7至11任一项所述的装置,其特征在于,记录标识用于表示文本内容的显示位置或者实现功能。
CN201511024548.0A 2015-12-30 2015-12-30 一种文本资源文件的比对方法及装置 Pending CN106933782A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201511024548.0A CN106933782A (zh) 2015-12-30 2015-12-30 一种文本资源文件的比对方法及装置
PCT/CN2016/110398 WO2017114193A1 (zh) 2015-12-30 2016-12-16 一种文本资源文件的比对方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511024548.0A CN106933782A (zh) 2015-12-30 2015-12-30 一种文本资源文件的比对方法及装置

Publications (1)

Publication Number Publication Date
CN106933782A true CN106933782A (zh) 2017-07-07

Family

ID=59224532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511024548.0A Pending CN106933782A (zh) 2015-12-30 2015-12-30 一种文本资源文件的比对方法及装置

Country Status (2)

Country Link
CN (1) CN106933782A (zh)
WO (1) WO2017114193A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644090A (zh) * 2017-09-26 2018-01-30 北京金堤科技有限公司 一种变更信息处理方法及装置
CN108491398A (zh) * 2018-03-26 2018-09-04 深圳市元征科技股份有限公司 一种对更新的软件文本进行翻译的方法及电子设备
CN111144090A (zh) * 2019-12-23 2020-05-12 网易(杭州)网络有限公司 一种文件对比方法、装置、电子设备及存储介质
CN112104917A (zh) * 2020-08-06 2020-12-18 武汉译满天下科技有限公司 一种单双语字幕修改查找处理方法及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929500B (zh) * 2019-11-08 2022-07-08 腾讯科技(深圳)有限公司 文件比较方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120110445A1 (en) * 2010-11-02 2012-05-03 Greenspan David L Realtime Synchronized Document Editing by Multiple Users for Blogging
CN102467497A (zh) * 2010-10-29 2012-05-23 国际商业机器公司 校对程序中的文本翻译的方法和系统
CN103207874A (zh) * 2012-01-17 2013-07-17 腾讯科技(深圳)有限公司 一种网页更新内容的提示方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916255B (zh) * 2010-07-02 2012-02-15 互动在线(北京)科技有限公司 Html内容对比装置及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467497A (zh) * 2010-10-29 2012-05-23 国际商业机器公司 校对程序中的文本翻译的方法和系统
US20120110445A1 (en) * 2010-11-02 2012-05-03 Greenspan David L Realtime Synchronized Document Editing by Multiple Users for Blogging
CN103207874A (zh) * 2012-01-17 2013-07-17 腾讯科技(深圳)有限公司 一种网页更新内容的提示方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644090A (zh) * 2017-09-26 2018-01-30 北京金堤科技有限公司 一种变更信息处理方法及装置
CN108491398A (zh) * 2018-03-26 2018-09-04 深圳市元征科技股份有限公司 一种对更新的软件文本进行翻译的方法及电子设备
CN108491398B (zh) * 2018-03-26 2021-09-07 深圳市元征科技股份有限公司 一种对更新的软件文本进行翻译的方法及电子设备
CN111144090A (zh) * 2019-12-23 2020-05-12 网易(杭州)网络有限公司 一种文件对比方法、装置、电子设备及存储介质
CN112104917A (zh) * 2020-08-06 2020-12-18 武汉译满天下科技有限公司 一种单双语字幕修改查找处理方法及系统
CN112104917B (zh) * 2020-08-06 2022-07-08 武汉译满天下科技有限公司 一种单双语字幕修改查找处理方法及系统

Also Published As

Publication number Publication date
WO2017114193A1 (zh) 2017-07-06

Similar Documents

Publication Publication Date Title
CN106933782A (zh) 一种文本资源文件的比对方法及装置
US10838996B2 (en) Document revision change summarization
CN107145482B (zh) 基于人工智能的文章生成方法及装置、设备与可读介质
CN101667118A (zh) 多语言版本的开发、替换方法及装置
CN108491326B (zh) 测试行为重组方法、装置及存储介质
CN104503958A (zh) 文档摘要的生成方法及装置
CN111126019B (zh) 基于模式定制的报表生成方法、装置和电子设备
CN105095059A (zh) 一种自动化测试的方法和装置
US20220019739A1 (en) Item Recall Method and System, Electronic Device and Readable Storage Medium
CN108681547A (zh) 一种基于小程序的网页内容转换方法及装置
US10108590B2 (en) Comparing markup language files
CN104978332A (zh) 用户生成内容标签数据生成方法、装置及相关方法和装置
CN106528088A (zh) 在线表单中填充控件的方法和装置
CN103399766A (zh) 更新输入法系统的方法和设备
CN105446986A (zh) 用于处理web页面的方法和装置
CN105389184A (zh) 产品界面信息的配置方法及装置
CN104750472A (zh) 一种终端应用的资源包管理方法和装置
US9658988B2 (en) Systems and methods to segment text for layout and rendering
US9063949B2 (en) Inferring a sequence of editing operations to facilitate merging versions of a shared document
CN104217170A (zh) 一种文档只读方法及装置
CN114036561A (zh) 信息隐藏、信息获取方法、装置、存储介质及电子设备
CN104536947A (zh) 版式文档的处理方法及装置
CN107203509A (zh) 标题生成方法和装置
CN105630744A (zh) 一种基于审阅文档的阅读方法及阅读装置
CN104484399A (zh) 网页页面的跳转处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170707

RJ01 Rejection of invention patent application after publication