CN112632212A - 一种待翻译词条的更新方法、装置、设备和介质 - Google Patents

一种待翻译词条的更新方法、装置、设备和介质 Download PDF

Info

Publication number
CN112632212A
CN112632212A CN201910953106.6A CN201910953106A CN112632212A CN 112632212 A CN112632212 A CN 112632212A CN 201910953106 A CN201910953106 A CN 201910953106A CN 112632212 A CN112632212 A CN 112632212A
Authority
CN
China
Prior art keywords
entry
translation
translated
entries
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910953106.6A
Other languages
English (en)
Other versions
CN112632212B (zh
Inventor
朱海军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910953106.6A priority Critical patent/CN112632212B/zh
Publication of CN112632212A publication Critical patent/CN112632212A/zh
Application granted granted Critical
Publication of CN112632212B publication Critical patent/CN112632212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/328Management therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种待翻译词条的更新方法、装置、设备和介质,所述方法能够根据当前基准词条、历史基准词条和翻译词条,筛选出待翻译的基准词条。其中,根据所述当前基准词条和所述翻译词条的索引值,可以确定新增的基准词条。根据所述当前基准词条、所述历史基准词条和所述翻译词条,可以确定修改的基准词条。根据索引值进行查找能够对所述当前基准词条和所述翻译词条进行快速匹配,提高查找待翻译的基准词条的效率。此外将当前基准词条和所述历史基准词条进行比对,以及将所述当前基准词条和所述翻译词条进行比对,可以避免遗漏和重复待翻译的基准词条,提高查找待翻译的基准词条的准确率。

Description

一种待翻译词条的更新方法、装置、设备和介质
技术领域
本发明涉及数据查找的领域,尤其涉及一种待翻译词条的更新方法、装置、设备和介质。
背景技术
随着智能手机的普及,人们在沟通、社交、娱乐等活动中越来越依赖于应用程序软件。由于应用程序的市场并不局限于某一国家和地区,因此在应用程序内部可以设置多语言模式,便于各个国家和地区的用户使用。
应用程序的多语言模式能够达到不同的用户显示不同语言的目的。在具有多语言功能的应用程序的开发过程中,随着需求的增加和变更,多语言目录下的词条也在不停的增加和变更,翻译也在持续的进行。在整理新增或改动的词条时,需要开发人员人工记录或肉眼逐条识别是否有新增或改动,重新整理成新的待翻译词条列表给翻译人员进行翻译,翻译完毕后,再合并替换到对应的词条。
但是由于同一种语言只有一个词条文件,多个开发人员都需要增加或修改词条,且词条在文件中的位置不固定。人工肉眼比对工作量大、效率低且准确性差,容易造成词条遗漏、未翻译或翻译的词条较旧等多种问题。
发明内容
为了解决待翻译词条查找时效率低且准确性低的问题,得到提高待翻译词条查找的效率和准确性的技术效果,本发明提供了一种待翻译词条的更新方法、装置、设备和介质。
一方面,本发明提供了一种待翻译词条的更新方法,所述方法包括:
获取当前基准词条;
获取历史基准词条,所述历史基准词条为当前翻译的上一次翻译时的基准词条;
获取每种语言对应的翻译词条;
基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条;
基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条;
将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中。
另一方面提供了一种待翻译词条的更新装置,所述装置包括:当前基准词条获取模块、历史基准词条获取模块、翻译词条获取模块、新增词条确定模块,修改词条确定模块和待翻译词条更新模块;
所述当前基准词条获取模块用于获取当前基准词条;
所述历史基准词条获取模块用于获取历史基准词条,所述历史基准词条为当前翻译的上一次翻译时的基准词条;
所述翻译词条获取模块用于获取每种语言对应的翻译词条;
所述新增词条确定模块用于基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条;
所述修改词条确定模块用于基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条;
所述待翻译词条存储模块用于将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中。
另一方面提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述所述的一种待翻译词条的更新方法。
另一方面提供了一种计算机可读存储介质,所述存储介质包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述所述的一种待翻译词条的更新方法。
本发明提供的一种待翻译词条的更新方法、装置、设备和介质,所述方法能够根据当前基准词条、历史基准词条和翻译词条,筛选出待翻译的基准词条。其中,根据所述当前基准词条和所述翻译词条的索引值,可以确定新增的基准词条。根据所述当前基准词条、所述历史基准词条和所述翻译词条,可以确定修改的基准词条。根据索引值进行查找能够对所述当前基准词条和所述翻译词条进行快速匹配,提高查找待翻译的基准词条的效率。此外将当前基准词条和所述历史基准词条进行比对,以及将所述当前基准词条和所述翻译词条进行比对,可以避免遗漏和重复待翻译的基准词条,提高查找待翻译的基准词条的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种待翻译词条的更新方法的应用场景示意图;
图2为本发明实施例提供的一种待翻译词条的更新方法的流程图;
图3为本发明实施例提供的一种待翻译词条的更新方法中确定每种语言对应的新增的基准词条的方法的流程图;
图4为本发明实施例提供的一种待翻译词条的更新方法中查找每种语言中与所述当前基准词条对应的所述翻译词条的方法的流程图;
图5为本发明实施例提供的一种待翻译词条的更新方法中确定每种语言对应的修改的基准词条的方法的示意图;
图6为本发明实施例提供的一种待翻译词条的更新方法中获取对应关系后,确定每种语言对应的修改的基准词条的方法的流程图;
图7为本发明实施例提供的一种待翻译词条的更新方法中获取了待翻译的基准词条之后的方法的流程图;
图8为本发明实施例提供的一种待翻译词条的更新方法中根据所述翻译后的基准词条,更新对应语言的翻译词条集的方法的流程图;
图9为本发明实施例提供的一种待翻译词条的更新方法在具体场景应用时的方法流程图;
图10为本发明实施例提供的一种待翻译词条的更新装置的结构示意图;
图11为本发明实施例提供的一种用于实现本发明实施例所提供的方法的设备的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。而且,术语“第一”、“第二”等适用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
请参见图1,其显示了本发明实施例提供的一种待翻译词条的更新方法的应用场景示意图,所述应用场景包括用于进行待翻译词条更新的用户终端110,在所述用户终端中,通过词条整理程序,对比当前基准词条和各个语言中的翻译词条,获得各个语言对应的新增的基准词条,对比当前基准词条和历史基准词条的内容,以及对比当前基准词条和各个语言中的翻译词条的内容,获得各个语言对应的修改的基准词条,所述新增的基准词条和所述修改的基准词条即为待翻译词条,将所述待翻译词条对应各个语言更新带待翻译词条列表中。
在本发明实施例中,所述用户终端110包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序等。本申请实施例中在所述用户终端110上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、Unix、windows等。所述用户终端110包括UI(UserInterface,用户界面)层,所述用户终端110通过所述UI层对外提供待翻译词条的显示,另外,基于API(Application Programming Interface,应用程序接口)将整理好的待翻译词条发送给翻译人员进行翻译。
请参见图2,其显示了一种待翻译词条的更新方法,可应用于终端侧,所述方法包括:
S210.获取当前基准词条;
具体地,所述当前基准词条指的是在当前的基准词条列表中存储的基准词条。所述基准词条是用基准语言记录的词条,例如在一个多语言环境的应用软件中,如果默认的基准语言是简体中文,则基准语言词条都是由简体中文记录的。最终查找到的待翻译的词条也是基准词条,通过基准语言的形式进行记录的,分别存放在需要翻译的语言的目录中,便于翻译工作的进行。
S220.获取历史基准词条,所述历史基准词条为当前翻译的上一次翻译时的基准词条;
具体地,所述历史基准词条指的是在本次进行翻译之前的上一次翻译时的基准词条,即是在这一轮修改和增加词条之前的基准词条。所述历史基准词条和当前基准词条可以互相参考,从而得到当前基准词条中修改的部分。
S230.获取每种语言对应的翻译词条;
具体地,所述翻译词条是对应所述基准词条翻译成为其他语言的词条,所述每种语言对应的翻译词条指的是在每一种基准语言之外的语言都会对应的一组翻译词条,例如当前具有繁体中文和英文两个语言列表,那么翻译词条为繁体中文列表下存储的繁体中文的词条和英文列表下存储的英文的词条。
S240.基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条;
进一步地,请参见图3,所述确定每种语言对应的新增的基准词条的方法包括:
S310.根据所述当前基准词条,查找每种语言中与所述当前基准词条对应的翻译词条;
S320.若查找的结果中不存在与所述当前基准语言词条对应的所述翻译词条,则确定所述当前基准词条为每种语言对应的新增的基准词条。
具体地,在获取新增的基准词条时,可以基于当前基准词条和翻译词条的对应关系,对比当前基准词条和每种语言中的翻译词条,来获取每种语言中新增的基准词条。由于不同语言的难易程度不同或者存在特定术语等原因,开发人员或者其他人员有时在新增了基准词条后,会主动对部分翻译词条进行翻译,导致不同的语言中新增的词条可能不同,因此需要将基准词条和每种语言下的翻译词条进行比对,获得对应语言的新增的基准词条。
例如,所述当前基准词条为一、二、三、四。所述英文词条为one、two。所述繁体中文的词条为壹、贰、叁。那么确定的英文对应的新增的基准词条为三、四。确定的繁体中文对应的新增的基准词条为四。分别对英文对应的新增的基准词条和繁体中文对应的新增的基准词条生成两个待翻译词条集,用以存储对应语言的待翻译的基准词条。
进一步地,请参见图4,所述根据所述当前基准词条,查找每种语言中与所述当前基准词条对应的所述翻译词条包括:
S410.获取所述当前基准词条的基准索引值;
S420.获取每种语言中的所述翻译词条的翻译索引值;
S430.查找与所述基准索引值一致的翻译索引值;
S440.将所述翻译索引值对应的翻译词条作为每种语言中与所述当前基准词条对应的翻译词条。
具体地,通过当前基准词条的基准索引值和翻译词条的翻译索引值之间的对应关系,可以基于当前基准词条的基准索引值,查找每种语言对应的翻译词条中是否存在一致的索引值,若存在,则所述翻译词条和所述当前基准语言词条具有对应关系,若不存在,则所述当前基准词条为新增的基准词条,所述新增的基准词条不存在对应的翻译词条。
在一个具体的示例中,为了进行多语言的切换,在当前基准词条和其他语言对应的翻译词条之间的索引值可以使用键值对(key-value)来标识,并将所述对应的当前基准词条和其他语言词条存储在当前基准词条的列表和翻译词条的列表中。key是关键字,可以作为当前基准词条和翻译词条的索引值。获取当前基准词条的key值,根据所述当前基准词条的key值,在每种语言对应的翻译词条中查找是否存在一致的翻译词条的key值,若存在,则所述当前基准词条与所述翻译词条具有对应关系,若不存在,则所述当前基准词条为新增的基准词条。所述键值对的方式具有极高的并发读写性能。
通过索引值的方式查找具有对应关系的当前基准词条和翻译词条,能够快速定位到对应的翻译词条,从而快速查找到新增的基准词条,提高了查找词条的效率。
S250.基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条;
进一步地,请参见图5,所述基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条包括:
S510.获取与所述当前基准词条对应的翻译词条;
S520.获取与所述当前基准词条对应的历史基准词条;
S530.基于所述当前基准词条、所述当前基准词条对应的历史基准词条和所述当前基准词条对应的翻译词条,确定每种语言对应的修改的基准词条。
具体地,确认所述修改的基准词条,是在获取词条之间的对应关系之后再进行确认的。通过新增的基准词条的判断,可以获取当前基准词条和所述翻译词条之间的对应关系。根据索引值的查找方法,也可以确定当前基准词条和历史基准词条之间的对应关系,获得基准语言以及其他的语言中对应的修改的基准词条。
在一个具体的示例中,若所述当前基准词条和其他语言对应的翻译词条之间使用键值对(key-value)来标识,则key对应的为索引值,在确认所述修改的基准词条时,通过value来确定所述当前基准词条和其他语言词条是否一致,同样可以通过value来确定所述当前基准词条和所述历史基准词条是否一致。
在进行基准词条的修改时,由于研发人员的不同或者开发需求的不同等原因,在对当前基准词条进行修改后,可能存在对应修改了翻译词条的情况,也可能不存在对应修改了翻译词条的情况,因此需要获取当前基准词条与历史基准词条的对应关系,也需要获取当前基准词条与翻译词条的对应关系。比对所述当前基准词条和所述历史基准词条,以及所述当前基准词条和所述翻译词条,通过比对所述当前基准词条和所述历史基准词条获取上次翻译后修改的全部词条信息,通过比对所述当前基准词条和所述翻译词条获取其他语言下的修改的基准词条,以提高每种语言对应的修改的基准词条查找的准确度,避免发生遗落基准词条或者重复基准词条的情况。
进一步地,请参见图6,所述基于所述当前基准词条、所述当前基准词条对应的历史基准词条和所述当前基准词条对应的翻译词条,确定每种语言对应的修改的基准词条包括:
S610.对比所述当前基准词条和所述当前基准词条对应的历史基准词条;
S620.对比所述当前基准词条和所述当前基准词条对应的翻译词条;
S630.若对比的结果中所述当前基准词条和所述历史基准词条不一致,或所述当前基准词条和所述翻译词条不一致,则确定所述当前基准词条为每种语言对应的修改的基准词条。
具体地,在进行修改的基准词条的确认时,需要将当前基准词条和对应的历史基准词条进行对比,同时也需要将当前基准词条与对应的翻译词条进行对比。在进行当前基准词条和对应的历史基准词条对比时,若所述当前基准词条与对应的历史基准词条并不匹配,则所述当前基准词条为修改的基准词条,或者若所述当前基准词条与对应的翻译词条并不匹配,则所述当前基准词条为修改的基准词条。
例如,所述当前基准词条为六、七。所述对应的英文词条为four、five。所述对应的繁体中文的词条为陆、伍。所述对应的历史基准词条为四、五。将所述当前基准词条与对应的历史基准词条进行对比,获得基准语言对应的修改的基准词条为:六、七。将所述当前基准词条与对应的英文词条进行比对,获得英文对应的修改的基准词条为六、七。将所述当前基准词条与对应的繁体中文词条进行比对,获得对应的修改的基准词条为七。
所述当前基准语言词条与对应的历史基准词条进行对比,得到的基准语言对应的修改的基准词条可以作为一个修改词条参照的结果。由于在其他语言中,可能存在已经修改后的翻译词条,为了不重复进行翻译,还需要将当前基准语言词条与翻译词条进行对比,获得每种语言对应的修改的基准词条。
在获取对应关系的基础上,获取不同语言对应的修改的基准词条,通过将当前基准词条与历史基准词条进行比对,并将当前基准词条与翻译词条进行比对的方法,可以避免出现重复的待翻译的基准词条,也可以避免遗漏待翻译的基准词条,提高了修改后的词条查找的准确度。
S260.将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中。
具体地,所述新增的基准词条和所述修改的基准词条都是待翻译的基准词条,但是不同的语言下这些待翻译的基准词条可能不相同,因此需要对应每种语言存储所述新增的基准词条和所述修改的基准词条,便于后续步骤中将所述词条翻译成对应的语言。
所述待翻译词条集可以为待翻译词条列表,将所述新增的基准词条和所述修改的基准词条存放在对应语言的待翻译词条列表中。
将所述待翻译的基准词条对应语言进行存储,可以便于后续翻译过程中明确哪些基准词条应该翻译成为哪些语言,提高了翻译的效率。
进一步地,请参见图7,所述将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条列表中之后,还包括:
S710.基于首字母顺序,对所述每种语言对应的待翻译词条集中的基准词条进行排序;
S720.根据基准词条的顺序,翻译所述每种语言对应的待翻译词条集中的基准词条;
S730.根据所述翻译后的基准词条,更新对应语言的翻译词条集。
具体地,由于存储在待翻译词条集中的词条为基准词条,不同语言对应的待翻译的词条都是基准词条,都是用基准语言进行记录的,因此可以根据基准语言的首字母顺序对所述待翻译词条集中的词条进行排序,排列的顺序可以为从小到大也可以为从大到小的顺序。进行排序步骤可以使得词条的排列更加清晰,便于后续进行翻译。
在将所述基准词条排列好顺序后,基于所述基准词条的顺序,翻译所述每种语言对应的待翻译词条集中的基准词条。将事先按照语言分类的待翻译的基准词条翻译成为需要的语言,翻译的过程可以通过人工翻译进行。在翻译后,将翻译后的基准词条更新到对应语言的翻译词条集中,完成所述待翻译词条的更新方法。
请参见图8,所述根据所述翻译后的基准词条,更新对应语言的翻译词条集包括:
S810.将翻译后的新增的基准词条增加到对应语言的翻译词条集中;
S820.将翻译后的修改的基准词条替换对应语言的翻译词条集中的翻译词条。
具体地,对于新增的基准词条和修改的基准词条,在翻译步骤结束后,更新到对应语言的翻译词条集中时,所述翻译后的新增的基准词条通过增加的方式添加到对应语言的翻译词条集中,获取与对应的当前基准词条一致的索引值。所述翻译后的修改的基准词条通过替换的方式添加到对应语言的翻译词条集中,所述翻译后的修改的基准词条会替换原本的翻译词条,与对应的当前基准词条建立对应关系,获得与对应的当前基准词条一致的索引值。
在一个具体的示例中,请参见图9,图9显示了在开发具有多语言切换功能的应用程序时,对程序中使用的语言进行翻译并整理的方法。开发人员根据需求说明编码实现具体的业务逻辑,将应用程序中使用的字符串写入默认语言的词条的配置文件内,再通过词条的索引值进行引用,再提供语言切换的设置,达到不同的用户显示不同语言的目的。一个或一批多个需求开发完成后,可能会对基准词条进行增加或者修改。自动提取新增或修改的基准词条,排序整理到待翻译文件列表,再对待翻译文件列表中的基准词条进行翻译,并将翻译后的基准词条更新到对应语言的翻译词条列表。
具体地,在使用工具自动提取新增或修改的基准词条时,需要读取当前基准语言词条所在目录,将基准语言所有的当前基准词条读到内存。分别提取上次翻译后新增的基准词条和上次翻译后修改的基准词条,获得待翻译的基准词条。按照字母顺序从小到大或者从大到小对所述新增的基准词条和所述修改后的基准词条进行排序,将所有待翻译的基准词条按目录输出到待翻译文件。翻译人员将待翻译的基准词条翻译成对应的语言,如将简体中文翻译成繁体中文,将简体中文翻译成英文等。将翻译完毕后的基准词条合并替换到应用程序内对应的翻译词条。
随着对应用程序的开发需求的不断增加和变更,会对基准词条列表中的基准词条持续进行新增和修改,因此整理词条和翻译词条的操作会循环进行。
具体地,提取本次多语言下新增的基准词条时,读取所有多语言词条所在目录,获取每种语言对应的翻译词条,在进行读取所有多语言词条所在目录时,不包含基准词条目录。逐条提取当前基准词条的索引值和其他多语言的翻译词条的索引值进行逐条比对,判断在该语言的翻译词条中是否存在与所述当前基准词条对应的翻译词条,如果不存在,则所述当前基准词条为新增的基准词条,将所述当前基准词条添加到该语言的待翻译词条列表中,如果存在,则比对下一当前基准词条。
具体地,提取在上次翻译后修改过的基准词条时,读取上次翻译时的基准词条所在的目录,可以获取历史基准词条。根据当前基准词条的索引值和其他多语言的翻译词条的索引值,获取当前基准词条和其他多语言的翻译词条的对应关系,提取当前基准词条和对应的其他多语言的翻译词条进行比对,并且根据当前基准词条的索引值和历史基准词条的索引值,获取当前基准词条和历史基准词条的对应关系,提取当前基准词条和对应的历史基准词条进行比对。判断当前基准词条是否与上次翻译时的历史基准词条不相同,判断当前基准词条是否与对应的翻译词条不一致。如果不一致,则所述当前基准词条为修改的基准词条,将所述当前基准词条添加到该语言的待翻译词条列表。如果相同,则比对下一当前基准词条。
本发明提出的一种待翻译词条的更新方法,所述方法能够根据当前基准词条、历史基准词条和翻译词条,筛选出待翻译的基准词条。其中,根据所述当前基准词条和所述翻译词条的索引值,可以确定新增的基准词条。根据所述当前基准词条、所述历史基准词条和所述翻译词条,可以确定修改的基准词条。根据索引值进行查找能够对所述当前基准词条和所述翻译词条进行快速匹配,提高查找待翻译的基准词条的效率。此外将当前基准词条和所述历史基准词条进行比对,以及将所述当前基准词条和所述翻译词条进行比对,可以避免遗漏和重复待翻译的基准词条,提高查找待翻译的基准词条的准确率。
本发明实施例还提供了一种待翻译词条的更新装置,请参见图10,所述装置包括:当前基准词条获取模块1010、历史基准词条获取模块1020、翻译词条获取模块1030、新增词条确定模块1040,修改词条确定模块1050和待翻译词条更新模块1060;
所述当前基准词条获取模块1010用于获取当前基准词条;
所述历史基准词条获取模块1020用于获取历史基准词条,所述历史基准词条为当前翻译的上一次翻译时的基准词条;
所述翻译词条获取模块1030用于获取每种语言对应的翻译词条;
所述新增词条确定模块1040用于基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条;
所述修改词条确定模块1050用于基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条;
所述待翻译词条存储模块1060用于将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中。
进一步地,所述新增词条确定模块1040包括基准索引值获得单元、翻译索引值获得单元、索引值查找单元和新增基准词条确定单元;
所述基准索引值获得单元用于获取所述当前基准词条的基准索引值;
所述翻译索引值获得单元用于获取每种语言中的所述翻译词条的翻译索引值;
所述索引值查找单元用于查找与所述基准索引值一致的翻译索引值,将所述翻译索引值对应的翻译词条作为每种语言中与所述当前基准词条对应的翻译词条;
所述新增基准词条确定单元用于若查找的结果中不存在与所述当前基准语言词条对应的所述翻译词条,则确定所述当前基准词条为每种语言对应的新增的基准词条。
进一步地,所述修改词条确定模块1050包括第一对应关系获得单元、第二对应关系获得单元、第一对比单元、第二对比单元和修改基准词条确定单元;
所述第一对应关系获得单元用于获取与所述当前基准词条对应的翻译词条;
所述第二对应关系获得单元用于获取与所述当前基准词条对应的历史基准词条;
所述第一对比单元用于对比所述当前基准词条和所述当前基准词条对应的历史基准词条;
所述第二对比单元用于对比所述当前基准词条和所述当前基准词条对应的翻译词条;
所述修改基准词条确定单元用于若对比的结果中所述当前基准词条和所述历史基准词条不一致,或所述当前基准词条和所述翻译词条不一致,则确定所述当前基准词条为每种语言对应的修改的基准词条。
进一步地,在存储所述翻译词条之后,还可以进行词条排序、翻译词条和更新翻译词条集的操作,因此所述装置还包括词条排序模块、词条翻译模块和翻译词条集更新模块。
所述词条排序模块用于基于首字母顺序,对所述每种语言对应的待翻译词条集中的基准词条进行排序;
所述词条翻译模块用于根据基准词条的顺序,翻译所述每种语言对应的待翻译词条集中的基准词条;
所述翻译词条集更新模块用于根据所述翻译后的基准词条,更新对应语言的翻译词条集。
上述实施例中提供的装置可执行本发明任意实施例所提供方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的一种待翻译词条的更新方法。
本实施例还提供了一种计算机可读存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令由处理器加载并执行本实施例上述的一种待翻译词条的更新方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例还提供了一种设备,所述设备包括处理器和存储器,其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行本实施例上述的一种待翻译词条的更新方法。
所述设备可以为计算机终端、移动终端或服务器,所述设备还可以参与构成本发明实施例所提供的装置或系统。如图11所示,计算机终端11(或移动终端11或服务器11)可以包括一个或多个(图中采用1102a、1102b,……,1102n来示出)处理器1102(处理器1102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1104、以及用于通信功能的传输装置1106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图11所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端11还可包括比图11中所示更多或者更少的组件,或者具有与图11所示不同的配置。
应当注意到的是上述一个或多个处理器1102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端11(或移动终端)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器1104可用于存储应用软件的软件程序以及模块,如本发明实施例中所述的方法对应的程序指令/数据存储装置,处理器1102通过运行存储在存储器1104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种基于自注意力网络的时序行为捕捉框生成方法。存储器1104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1104可进一步包括相对于处理器1102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端11。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端11的通信供应商提供的无线网络。在一个实例中,传输装置1106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置1106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端11(或移动终端)的用户界面进行交互。
本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤和顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或中断产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。应当理解到,本实施例中所揭露的方法、装置等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元模块的间接耦合或通信连接。
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本发明的范围。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种待翻译词条的更新方法,其特征在于,所述方法包括:
获取当前基准词条;
获取历史基准词条,所述历史基准词条为当前翻译的上一次翻译时的基准词条;
获取每种语言对应的翻译词条;
基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条;
基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条;
将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中。
2.根据权利要求1所述的一种待翻译词条的更新方法,其特征在于,所述基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条包括:
根据所述当前基准词条,查找每种语言中与所述当前基准词条对应的翻译词条;
若查找的结果中不存在与所述当前基准语言词条对应的所述翻译词条,则确定所述当前基准词条为每种语言对应的新增的基准词条。
3.根据权利要求2所述的一种待翻译词条的更新方法,其特征在于,所述根据所述当前基准词条,查找每种语言中与所述当前基准词条对应的所述翻译词条包括:
获取所述当前基准词条的基准索引值;
获取每种语言中的所述翻译词条的翻译索引值;
查找与所述基准索引值一致的翻译索引值;
将所述翻译索引值对应的翻译词条作为每种语言中与所述当前基准词条对应的翻译词条。
4.根据权利要求1所述的一种待翻译词条的更新方法,其特征在于,所述基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条包括:
获取与所述当前基准词条对应的翻译词条;
获取与所述当前基准词条对应的历史基准词条;
基于所述当前基准词条、所述当前基准词条对应的历史基准词条和所述当前基准词条对应的翻译词条,确定每种语言对应的修改的基准词条。
5.根据权利要求4所述的一种待翻译词条的更新方法,其特征在于,所述基于所述当前基准词条、所述当前基准词条对应的历史基准词条和所述当前基准词条对应的翻译词条,确定每种语言对应的修改的基准词条包括:
对比所述当前基准词条和所述当前基准词条对应的历史基准词条;
对比所述当前基准词条和所述当前基准词条对应的翻译词条;
若对比的结果中所述当前基准词条和所述历史基准词条不一致,或所述当前基准词条和所述翻译词条不一致,则确定所述当前基准词条为每种语言对应的修改的基准词条。
6.根据权利要求1所述的一种待翻译词条的更新方法,其特征在于,所述将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中之后,还包括:
基于首字母顺序,对所述每种语言对应的待翻译词条集中的基准词条进行排序;
根据基准词条的顺序,翻译所述每种语言对应的待翻译词条集中的基准词条;
根据所述翻译后的基准词条,更新对应语言的翻译词条集。
7.根据权利要求6所述的一种待翻译词条的更新方法,其特征在于,所述根据所述翻译后的基准词条,更新对应语言的翻译词条集包括:
将翻译后的新增的基准词条增加到对应语言的翻译词条集中;
将翻译后的修改的基准词条替换对应语言的翻译词条集中的翻译词条。
8.一种待翻译词条的更新装置,其特征在于,所述装置包括:当前基准词条获取模块、历史基准词条获取模块、翻译词条获取模块、新增词条确定模块,修改词条确定模块和待翻译词条更新模块;
所述当前基准词条获取模块用于获取当前基准词条;
所述历史基准词条获取模块用于获取历史基准词条,所述历史基准词条为当前翻译的上一次翻译时的基准词条;
所述翻译词条获取模块用于获取每种语言对应的翻译词条;
所述新增词条确定模块用于基于所述当前基准词条和所述翻译词条,确定每种语言对应的新增的基准词条;
所述修改词条确定模块用于基于所述当前基准词条、所述历史基准词条和所述翻译词条,确定每种语言对应的修改的基准词条;
所述待翻译词条存储模块用于将所述新增的基准词条和所述修改的基准词条更新到对应语言的待翻译词条集中。
9.一种设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-7任一项所述的一种待翻译词条的更新方法。
10.一种存储介质,其特征在于,所述存储介质包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-7任一项所述的一种待翻译词条的更新方法。
CN201910953106.6A 2019-10-08 2019-10-08 一种待翻译词条的更新方法、装置、设备和介质 Active CN112632212B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910953106.6A CN112632212B (zh) 2019-10-08 2019-10-08 一种待翻译词条的更新方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910953106.6A CN112632212B (zh) 2019-10-08 2019-10-08 一种待翻译词条的更新方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN112632212A true CN112632212A (zh) 2021-04-09
CN112632212B CN112632212B (zh) 2024-03-15

Family

ID=75283453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910953106.6A Active CN112632212B (zh) 2019-10-08 2019-10-08 一种待翻译词条的更新方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN112632212B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114330248A (zh) * 2022-02-22 2022-04-12 深圳市微克科技有限公司 一种智能穿戴系统自动切换多国语言的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11316758A (ja) * 1998-04-30 1999-11-16 Brother Ind Ltd 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000137709A (ja) * 1998-10-30 2000-05-16 Brother Ind Ltd 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001344236A (ja) * 2000-05-31 2001-12-14 Toshiba Corp 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
WO2013113135A1 (en) * 2012-02-03 2013-08-08 Google Inc. Translating application resources
US20170300475A1 (en) * 2014-09-29 2017-10-19 International Business Machines Corporation Translation using related term pairs
CN107748746A (zh) * 2017-11-06 2018-03-02 四川长虹电器股份有限公司 一种自动化管理词条的方法
CN108399064A (zh) * 2017-02-07 2018-08-14 南京南瑞继保电气有限公司 基于Qt开发的多语言词条生成方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11316758A (ja) * 1998-04-30 1999-11-16 Brother Ind Ltd 形態素解析装置、形態素解析装置を備えた機械翻訳装置、形態素解析処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び形態素解析処理プログラムを備えた機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000137709A (ja) * 1998-10-30 2000-05-16 Brother Ind Ltd 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001344236A (ja) * 2000-05-31 2001-12-14 Toshiba Corp 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
WO2013113135A1 (en) * 2012-02-03 2013-08-08 Google Inc. Translating application resources
US20170300475A1 (en) * 2014-09-29 2017-10-19 International Business Machines Corporation Translation using related term pairs
CN108399064A (zh) * 2017-02-07 2018-08-14 南京南瑞继保电气有限公司 基于Qt开发的多语言词条生成方法
CN107748746A (zh) * 2017-11-06 2018-03-02 四川长虹电器股份有限公司 一种自动化管理词条的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114330248A (zh) * 2022-02-22 2022-04-12 深圳市微克科技有限公司 一种智能穿戴系统自动切换多国语言的方法

Also Published As

Publication number Publication date
CN112632212B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN112650907B (zh) 搜索词的推荐方法、目标模型的训练方法、装置及设备
CN106257452B (zh) 基于上下文特征修改搜索结果
CN111310440A (zh) 文本的纠错方法、装置和系统
CN104156454A (zh) 搜索词的纠错方法和装置
US9697194B2 (en) Contextual auto-correct dictionary
JP2021192286A (ja) モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品
CN104077294A (zh) 一种信息推荐方法、装置及信息资源推荐系统
CN111435406A (zh) 一种纠正数据库语句拼写错误的方法和装置
CN110705226A (zh) 电子表格的创建方法、装置及计算机设备
CN103870553A (zh) 一种输入资源推送方法及系统
EP3839799A1 (en) Method, apparatus, electronic device and readable storage medium for translation
CN111523019B (zh) 用于输出信息的方法、装置、设备以及存储介质
CN112632212B (zh) 一种待翻译词条的更新方法、装置、设备和介质
CN111931524B (zh) 用于输出信息的方法、装置、设备以及存储介质
US20180081884A1 (en) Method and apparatus for processing input sequence, apparatus and non-volatile computer storage medium
CN106844406B (zh) 检索方法和检索装置
CN114881008B (zh) 一种文本生成方法、装置、电子设备及介质
CN115129976B (zh) 一种资源召回方法、装置、设备及存储介质
CN115730037A (zh) 目标文本检索方法及装置
US11972224B2 (en) Model mapping and enrichment system
CN108228802A (zh) 一种输入联想的推荐方法及装置
CN111399666B (zh) 一种候选词显示方法、装置以及电子设备
CN110659419B (zh) 确定目标用户的方法及相关装置
CN112380879A (zh) 一种智能翻译方法、装置、计算机设备和存储介质
CN112685540A (zh) 搜索方法、装置、存储介质以及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40042497

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant