CN114462430A - 词条提取方法及装置 - Google Patents

词条提取方法及装置 Download PDF

Info

Publication number
CN114462430A
CN114462430A CN202210055703.9A CN202210055703A CN114462430A CN 114462430 A CN114462430 A CN 114462430A CN 202210055703 A CN202210055703 A CN 202210055703A CN 114462430 A CN114462430 A CN 114462430A
Authority
CN
China
Prior art keywords
entry
target
language
content
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210055703.9A
Other languages
English (en)
Inventor
袁德红
胥昕
王豪迈
张旭明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xingchen Tianhe Technology Co ltd
Original Assignee
Beijing Xingchen Tianhe Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xingchen Tianhe Technology Co ltd filed Critical Beijing Xingchen Tianhe Technology Co ltd
Priority to CN202210055703.9A priority Critical patent/CN114462430A/zh
Publication of CN114462430A publication Critical patent/CN114462430A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种词条提取方法及装置。其中,该方法包括:通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件,其中,目标词条包括目标标签和词条内容,生成文件包括目标词条的键值对,键值对的键和值均为目标词条的词条内容;根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对;根据更新的键值对,将生成文件保存在目标文件中,其中,目标文件用于将目标词条由第一语言切换至第二语言。本发明解决了相关技术中的词条提取方式,效率低,且设置复杂,浪费时间的技术问题。

Description

词条提取方法及装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种词条提取方法及装置。
背景技术
目前web开发(网页程序开发)过程中,很多项目都会考虑到使用国际化功能模块。而词条提取也是开发者在做项目国际化时会经常需要考虑的一点内容,因此每一套成熟的国际化解决方案都会附带一个词条提取工具,用来提取母语词条进行翻译替换。
现在的react-intl-universal-extract(词条提取工具)的词条提取逻辑大致如此:对每一个需要提取的词条使用defaultMessage(即默认语言)将其包裹,然后再进行代码内容扫描,得到我们需要的词条文件。
目前的react-intl-universal-extract的词条提取工具是通过设置英文key的前提下,再通过设置defaultMessage的默认语言的词条内容;需要同时满足这2种条件才能达到提取词条的条件,这对于我们开发员们来说设置了key键还需要设置defaultMessage是一件比较繁琐的事,这么来看目前的react-intl-universal-extract的词条提取工具对于我们开发员来说是不够便捷;
另外,我们开发时每次需要考虑一个词条的key的英文名称是否合适描述这一段词条,而且每次遇到类型的词条时,还得再全局搜索是否有重复的词条;这样极大耗费了我们开发的时间成本。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种词条提取方法及装置,以至少解决相关技术中的词条提取方式,效率低,且设置复杂,浪费时间的技术问题。
根据本发明实施例的一个方面,提供了一种词条提取方法,包括:通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件,其中,所述目标词条包括目标标签和词条内容,所述生成文件包括所述目标词条的键值对,所述键值对的键和值均为所述目标词条的词条内容;根据所述生成文件,将所述键值对的值中的词条内容,翻译为第二语言的目标内容,并更新所述键值对;根据更新的键值对,将所述生成文件保存在目标文件中,其中,所述目标文件用于将所述目标词条由所述第一语言切换至所述第二语言。
可选的,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件之前,所述方法还包括:获取执行代码,其中,所述执行代码包括所述第一语言的多个词条;对需要进行翻译的第一语言的目标词条,通过目标标签进行标识。
可选的,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件包括:通过所述词条提取工具,提取具有所述目标标签的目标词条的词条内容;通过所述目标词条的词条内容,生成所述键值对;将所述键值对保存在预设格式的生成文件。
可选的,通过所述目标词条的词条内容,生成所述键值对之前,所述方法还包括:根据所述目标词条提取所述目标词条对应的第一语言的非文本组件,其中,所述非文本组件包括与所述目标词条对应的非文本词条内容,所述非文本词条内容与所述词条内容的内容相同,格式不同。
可选的,根据所述生成文件,将所述键值对的值中的词条内容,翻译为第二语言的目标内容,并更新所述键值对包括:将所述生成文件发送至服务平台,其中,所述服务平台接收所述生成文件后,将生成文件的键值对的值中的词条内容,翻译为第二语言的目标内容;接收所述服务平台返回的目标内容;将所述键值对的值更新为所述目标内容。
可选的,根据更新的键值对,将所述生成文件保存在目标文件中之后,所述方法还包括:将所述目标文件发送给所述目标词条对应的服务项目,存储在所述服务项目的预设位置,其中,所述服务项目根据语言切换指令,调用所述目标文件对所述服务项目的目标词条进行语言切换。
可选的,所述第一语言与所述词条的服务项目的语言相同。
根据本发明实施例的另一方面,还提供了一种词条提取装置,包括:提取模块,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件,其中,所述目标词条包括目标标签和词条内容,所述生成文件包括所述目标词条的键值对,所述键值对的键和值均为所述目标词条的词条内容;翻译更新模块,根据所述生成文件,将所述键值对的值中的词条内容,翻译为第二语言的目标内容,并更新所述键值对;存储模块,根据更新的键值对,将所述生成文件保存在目标文件中,其中,所述目标文件用于将所述目标词条由所述第一语言切换至所述第二语言。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质用于存储程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的词条提取方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的词条提取方法。
在本发明实施例中,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件,其中,目标词条包括目标标签和词条内容,生成文件包括目标词条的键值对,键值对的键和值均为目标词条的词条内容;根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对;根据更新的键值对,将生成文件保存在目标文件中,其中,目标文件用于将目标词条由第一语言切换至第二语言,通过目标标签对第一语言的提取词条进行标识,以键值对的方式进行保存翻译为第二语言,达到了简化词条方式的目的,实现了提高词条提取效率,加快语言翻译速度的技术效果,进而解决了相关技术中的词条提取方式,效率低,且设置复杂,浪费时间的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种词条提取方法的流程图;
图2是根据本发明实施方式的react-intl-universal的国际化技术的词条提取方法优化的步骤的示意图;
图3是根据本发明实施例的一种词条提取装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面对本实施例出现的专业术语进行解释说明:
正则:全名为正则表达式(英文:Regular Expression,常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器裡,正则表达式通常被用来检索、替换那些符合某个模式的文本;
Node:是能够在浏览器上或者服务器上运行的开放原始码,支持跨平台执行环境。以JavaScript形式写出程序,运行对于处理逻辑;
JSON:JavaScript Object Notation,是一种轻量级的数据交换格式。它基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。
根据本发明实施例,提供了一种词条提取方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种词条提取方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件,其中,目标词条包括目标标签和词条内容,生成文件包括目标词条的键值对,键值对的键和值均为目标词条的词条内容;
步骤S104,根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对;
步骤S106,根据更新的键值对,将生成文件保存在目标文件中,其中,目标文件用于将目标词条由第一语言切换至第二语言。
通过上述步骤,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件,其中,目标词条包括目标标签和词条内容,生成文件包括目标词条的键值对,键值对的键和值均为目标词条的词条内容;根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对;根据更新的键值对,将生成文件保存在目标文件中,其中,目标文件用于将目标词条由第一语言切换至第二语言,通过目标标签对第一语言的提取词条进行标识,以键值对的方式进行保存翻译为第二语言,达到了简化词条方式的目的,实现了提高词条提取效率,加快语言翻译速度的技术效果,进而解决了相关技术中的词条提取方式,效率低,且设置复杂,浪费时间的技术问题。
上述第一语言可以是任意一种编程语言,可以通过词条提取工具对上述第一语言中的词条内容进行提取,也即是对上述目标词条进行提取,提取的词条可以是任意语言,提取的目标词条可以通过词条提取工具进行提取,该词条提取工具可以为翻译工具react-intl-universal的词条提取工具react-intl-universal-extract,也可以是不依赖翻译工具react-intl-universal的其他词条提取工具,其中,提取的目标词条可以是文本语言也可以是非文本语言,非文本语言与文本语言的内容一致,格式可以不同,为方便第一语言翻译为其他语言,还可以将上述提取的目标词条内容转换成键值对的形式,通过键值对的方式可以将目标词条内容生产预设格式的生产文件。
上述目标词条可以包括目标标签和词条内容,其中上述目标标签可以用于对上述目标词条进行标识,通过上述目标标签可以在第一语言中对目标词条进行查找,上述目标词条内容可以以键值对的形式存放在生成文件中。上述目标标签可以是intl.get(),通过intl.get()将目标词条进行包裹,对目标词条进行标识。例如,对于词条“你好,词条提取”,可以通过上述intl.get()对词条进行包裹,得到intl.get(‘你好,词条提取’)。
需要说明的是,通过目标标签对目标词条进行标识,将目标词条以键值对的形式存放,不再采用现有技术中通过设置英文key键的前提下,再设置defaultMessage的默认语言的词条内容进行词条翻译,还可以不再考虑同一段目标词条的重复问题,通过直接将需要翻译的目标词条通过目标标签进行标识,保证要翻译的内容就是对应键值即可,不再对整个第一语言搜索是否有重复词条,达到减少翻译的时间成本的目的。同时也避免了现有技术中的英文key只能针对英文,无法对其他语言的词条进行提取。
上述生成文件可以用于将目标词条由第一语言翻译为第二语言,通过将生成文件中键值对的值中的词条内容对应翻译为第二语言的目标内容,也即是将目标词条内容翻译为第二语言的词条内容,还可以将存储第一语言目标词条的键值对的值更新为存储第二语言目标键值对的值,以达到更新键值对的目的。
上述目标文件可以对更新键值对的生成文件进行保存,通过目标文件可以将第一语言切换为第二语言。上述目标文件的数据格式可以与上述生成文件的数据格式相同,以便于对生成文件的数据进行保存。
通过目标标签对第一语言的提取词条进行标识,以键值对的方式进行保存翻译为第二语言,达到了简化词条方式的目的,实现了提高词条提取效率,加快语言翻译速度的技术效果,进而解决了相关技术中的词条提取方式,效率低,且设置复杂,浪费时间的技术问题。
可选的,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件之前,方法还包括:获取执行代码,其中,执行代码包括第一语言的多个词条;对需要进行翻译的第一语言的目标词条,通过目标标签进行标识。
上述执行代码可以是通过第一语言进行编写的代码,上述执行代码的多个词条也即是上述目标词条,为减少词条翻译成本,可以无需考虑同一段目标词条的重复,直接将需要翻译的目标词条通过目标标签进行标识,具有同一目标标识的词条也即是同一段词条。
例如,在前端代码执行环境中使用intl.get(‘你好,词条提取’)的形式,intl.get也即是上述目标标签,‘你好,词条提取’也即是词条内容的一个举例,intl.get(‘你好,词条提取’)的形式来包裹词条内容;此处get使用任意语言都可以,具体使用什么语言看项目的主语言是什么决定。开发员在项目中开发时,直接将需要翻译的主语言词条放入get中即可,无需考虑任何key的名称的重复,因为react-intl-universal认为重复的key就是同一段文本词条,所以要翻译的内容就是key会极大减少开发员思考的成本和时间成本。
通过直接将需要翻译的目标词条通过目标标签进行标识,不再考虑同一段目标词条的重复问题,保证要翻译的内容就是对应键值即可,不再对整个第一语言搜索是否有重复词条,达到减少翻译的时间成本的目的,实现了提高词条翻译速度的技术效果。
可选的,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件包括:通过词条提取工具,提取具有目标标签的目标词条的词条内容;通过目标词条的词条内容,生成键值对;将键值对保存在预设格式的生成文件。
通过上述词条提取工具,由于目标词条可以通过目标标签进行标识,因此可以通过目标标签提取具有目标标签的目标词条的词条内容,通过目标词条的词条内容,可以生成目标词条对应的键值对,将目标词条的词条内容以键值对的形式保存在预设格式的生成文件中。
例如,将key键的内容也设置成value的值,并以json(即上述生成文件)的形式存在,已满足react-intl-universal获取文本的条件。
通过将目标词条以键值对的形式进行保存,达到了便于对目标词条进行处理目标,提高了目标词条处理效率的技术效果。
可选的,通过目标词条的词条内容,生成键值对之前,方法还包括:根据目标词条提取目标词条对应的第一语言的非文本组件,其中,非文本组件包括与目标词条对应的非文本词条内容,非文本词条内容与词条内容的内容相同,格式不同。
通过目标词条的词条内容,生成键值对之前,还可以判断目标词条的内容格式,若与第一语言的目标词条对应的词条内容形同,格式不同,如,目标词条内容可以是文本的形式,还可以是非文本词条的形式,而还可以提取目标词条的对应的第一语言的非文本组件。
例如,提取有intl.get(也即是提取文本词条)或者intl.getHTML(也即是提取非文本组件词条)的内容,因为react-intl-universal(翻译工具)就是通过这个2个来得到对应语言的key的value。
通过对内容相同格式不同的目标词条均进行提取,生成键值对,达到了解决现有技术中词条提取格式单一问题的目的,实现了提高词条提取全面性的技术效果。
可选的,根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对包括:将生成文件发送至服务平台,其中,服务平台接收生成文件后,将生成文件的键值对的值中的词条内容,翻译为第二语言的目标内容;接收服务平台返回的目标内容;将键值对的值更新为目标内容。
将含有目标词条内容的键值对的生成文件可以发送至服务平台,上述服务平台接收生成文件后,可以将生成文件中的键值对值中的词条内容,从第一语言翻译为第二语言词条,也即是将键值对的值中的词条内容翻译为第二语言的目标内容,其中目标内容还可以是键值对的形式,服务平台可以返回目标内容,将生成文件中键值对更新为目标内容。
可选的,根据更新的键值对,将生成文件保存在目标文件中之后,方法还包括:将目标文件发送给目标词条对应的服务项目,存储在服务项目的预设位置,其中,服务项目根据语言切换指令,调用目标文件对服务项目的目标词条进行语言切换。
上述服务项目可以接收语言切换指令,具有存储功能,可以用于对目标词条进行语言切换,在生成文件的键值对更新为第二语言的键值对后,可以将更新后生成文件保存在目标文件中,还可以将目标文件发送给目标词条对应的服务项目,将目标文件存储在服务项目的预设位置,服务项目可以根据接收到语言切换指令,调用目标文件对服务项目的目标词条进行语言切换。
通过服务项目根据语言切换指令,调用目标文件对服务项目的目标词条进行语言切换,达到快速进行语言切换的目的,实现了提高语言切换效率的技术效果。
可选的,第一语言与词条的服务项目的语言相同。
由于代码执行的项目可以用同一种语言进行编写,第一语言可以与服务项目的主语言相同,也即是第一语言与词条的服务项目的语言可以相同。
需要说明的是,本实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
本实施方式提供了一种基于react-intl-universal的国际化技术的词条提取方法,图2是根据本发明实施方式的react-intl-universal的国际化技术的词条提取方法优化的步骤的示意图;如图2所示,主要有以下内容:
首先,在前端代码执行环境中使用intl.get(‘你好,词条提取’)的形式,来包裹词条内容;此处get使用任意语言都可以,具体使用什么语言看项目的主语言是什么决定。开发员在项目中开发时,直接将需要翻译的主语言词条放入get中即可,无需考虑任何key的名称的重复,因为react-intl-universal认为重复的key就是同一段文本词条,所以你要翻译的内容就是你的key会极大减少开发员思考的成本和时间成本;
接着,词条提取时我们只需要设置哪些文件不进行扫描,和哪些文件需要扫描即可;这样可以加快词条提取时间,避免扫描一些不必要的文件而导致词条提取时间过长。
再接着,我们只需要对扫描后的内容进行正则解析。解析过程如下:
1.只提取有intl.get(也即是提取文本词条)或者intl.getHTML(也即是提取非文本组件词条)的内容,因为react-intl-universal(翻译工具)就是通过这个2个来得到对应语言的key的value,Key-value,也即是键值对;
2.将key键的内容也设置成value的值,并以json(也即是上述生成文件)的形式存在,已满足react-intl-universal获取文本的条件;
3.最后,将提取的json格式内容,保存在json文件中;以主语言中文为例,以zhCN.json命名;
最后,把提取的词条文件保存在项目中,走正规的词条翻译流程即可。
本实施方式针对目前的react-intl-universal-extract的词条提取工具需要设置key和defaultMessage(默认消息)的默认语言的词条内容的懊恼的问题,以及时间成本耗费的考虑;因此,实现对react-intl-universal的国际化的词条提取只需设置key即可提取我们的词条文本内容的方法,使得我们在使用react-intl-universal国际化的技术时,极大地减少开发人员的思考成本和时间成本。
本实施方式的关键在于本实施方式是基于react-intl-universal的词条提取,支持中文等语言为key,利用正则来提取key中的中文等语言词条文本内容的主意,词条翻译处理流程。
本实施方式在react-intl-universal的国际化技术中,词条提取支持以中文为key,无需设置defaultMessage也可以提取项目中主语言词条内容。减少开发员对key的取名思考负担,以及提升了整体的开发效率。
本实施方式在产品开发时,使用了上述的解决方案提升了前端日常开发的效率,减少了前端开发人员的思考成本。
图3是根据本发明实施例的一种词条提取装置的示意图,如图3所示,根据本发明实施例的另一方面,还提供了一种词条提取装置,该装置包括:提取模块32,翻译更新模块34和存储模块36,下面对该装置进行详细说明。
提取模块32,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件,其中,目标词条包括目标标签和词条内容,生成文件包括目标词条的键值对,键值对的键和值均为目标词条的词条内容;翻译更新模块34,与上述提取模块32相连,根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对;存储模块36,与上述翻译更新模块34相连,根据更新的键值对,将生成文件保存在目标文件中,其中,目标文件用于将目标词条由第一语言切换至第二语言。
通过上述装置,提取模块32对具有目标标签的第一语言的目标词条进行提取,生成目标词条的生成文件,其中,目标词条包括目标标签和词条内容,生成文件包括目标词条的键值对,键值对的键和值均为目标词条的词条内容;翻译更新模块34根据生成文件,将键值对的值中的词条内容,翻译为第二语言的目标内容,并更新键值对;存储模块36根据更新的键值对,将生成文件保存在目标文件中,其中,目标文件用于将目标词条由第一语言切换至第二语言,通过目标标签对第一语言的提取词条进行标识,以键值对的方式进行保存翻译为第二语言,达到了简化词条方式的目的,实现了提高词条提取效率,加快语言翻译速度的技术效果,进而解决了相关技术中的词条提取方式,效率低,且设置复杂,浪费时间的技术问题。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质用于存储程序,其中,在程序运行时控制存储介质所在设备执行上述中任意一项的词条提取方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项的词条提取方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种词条提取方法,其特征在于,包括:
通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件,其中,所述目标词条包括目标标签和词条内容,所述生成文件包括所述目标词条的键值对,所述键值对的键和值均为所述目标词条的词条内容;
根据所述生成文件,将所述键值对的值中的词条内容,翻译为第二语言的目标内容,并更新所述键值对;
根据更新的键值对,将所述生成文件保存在目标文件中,其中,所述目标文件用于将所述目标词条由所述第一语言切换至所述第二语言。
2.根据权利要求1所述的方法,其特征在于,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件之前,所述方法还包括:
获取执行代码,其中,所述执行代码包括所述第一语言的多个词条;
对需要进行翻译的第一语言的目标词条,通过目标标签进行标识。
3.根据权利要求2所述的方法,其特征在于,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件包括:
通过所述词条提取工具,提取具有所述目标标签的目标词条的词条内容;
通过所述目标词条的词条内容,生成所述键值对;
将所述键值对保存在预设格式的生成文件。
4.根据权利要求3所述的方法,其特征在于,通过所述目标词条的词条内容,生成所述键值对之前,所述方法还包括:
根据所述目标词条提取所述目标词条对应的第一语言的非文本组件,其中,所述非文本组件包括与所述目标词条对应的非文本词条内容,所述非文本词条内容与所述词条内容的内容相同,格式不同。
5.根据权利要求1所述的方法,其特征在于,根据所述生成文件,将所述键值对的值中的词条内容,翻译为第二语言的目标内容,并更新所述键值对包括:
将所述生成文件发送至服务平台,其中,所述服务平台接收所述生成文件后,将生成文件的键值对的值中的词条内容,翻译为第二语言的目标内容;
接收所述服务平台返回的目标内容;
将所述键值对的值更新为所述目标内容。
6.根据权利要求1所述的方法,其特征在于,根据更新的键值对,将所述生成文件保存在目标文件中之后,所述方法还包括:
将所述目标文件发送给所述目标词条对应的服务项目,存储在所述服务项目的预设位置,其中,所述服务项目根据语言切换指令,调用所述目标文件对所述服务项目的目标词条进行语言切换。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述第一语言与所述词条的服务项目的语言相同。
8.一种词条提取装置,其特征在于,包括:
提取模块,通过词条提取工具,对具有目标标签的第一语言的目标词条进行提取,生成所述目标词条的生成文件,其中,所述目标词条包括目标标签和词条内容,所述生成文件包括所述目标词条的键值对,所述键值对的键和值均为所述目标词条的词条内容;
翻译更新模块,根据所述生成文件,将所述键值对的值中的词条内容,翻译为第二语言的目标内容,并更新所述键值对;
存储模块,根据更新的键值对,将所述生成文件保存在目标文件中,其中,所述目标文件用于将所述目标词条由所述第一语言切换至所述第二语言。
9.一种存储介质,其特征在于,所述存储介质用于存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的词条提取方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的词条提取方法。
CN202210055703.9A 2022-01-18 2022-01-18 词条提取方法及装置 Pending CN114462430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210055703.9A CN114462430A (zh) 2022-01-18 2022-01-18 词条提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210055703.9A CN114462430A (zh) 2022-01-18 2022-01-18 词条提取方法及装置

Publications (1)

Publication Number Publication Date
CN114462430A true CN114462430A (zh) 2022-05-10

Family

ID=81410366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210055703.9A Pending CN114462430A (zh) 2022-01-18 2022-01-18 词条提取方法及装置

Country Status (1)

Country Link
CN (1) CN114462430A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116522966A (zh) * 2023-06-30 2023-08-01 天津华来科技股份有限公司 基于多语言词条的文本翻译方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399064A (zh) * 2017-02-07 2018-08-14 南京南瑞继保电气有限公司 基于Qt开发的多语言词条生成方法
CN112965772A (zh) * 2021-03-02 2021-06-15 网易(杭州)网络有限公司 web页面显示方法、装置和电子设备
CN113296827A (zh) * 2021-03-31 2021-08-24 厦门科灿信息技术有限公司 不同语言的转换方法、装置及终端设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399064A (zh) * 2017-02-07 2018-08-14 南京南瑞继保电气有限公司 基于Qt开发的多语言词条生成方法
CN112965772A (zh) * 2021-03-02 2021-06-15 网易(杭州)网络有限公司 web页面显示方法、装置和电子设备
CN113296827A (zh) * 2021-03-31 2021-08-24 厦门科灿信息技术有限公司 不同语言的转换方法、装置及终端设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116522966A (zh) * 2023-06-30 2023-08-01 天津华来科技股份有限公司 基于多语言词条的文本翻译方法及系统
CN116522966B (zh) * 2023-06-30 2023-09-15 天津华来科技股份有限公司 基于多语言词条的文本翻译方法及系统

Similar Documents

Publication Publication Date Title
US11238232B2 (en) Written-modality prosody subsystem in a natural language understanding (NLU) framework
CN108491199B (zh) 一种自动生成接口的方法及终端
WO2013116022A1 (en) Resolving out-of-vocabulary words during machine translation
CN111831384B (zh) 语言切换方法和装置、设备及存储介质
CN102567384A (zh) 基于网页浏览器引擎的网页多语言动态切换方法及系统
CN101667118A (zh) 多语言版本的开发、替换方法及装置
CN113139390A (zh) 一种应用于代码字符串的语言转换方法和装置
CN109976840A (zh) 一种基于前后台分离平台下实现多语言自动适配的方法及系统
CN102364437A (zh) 多语言站点开发系统及其实现方法
CN113076167A (zh) 一种代码处理方法及相关设备
CN105573992A (zh) 实时翻译方法及装置
CN114462430A (zh) 词条提取方法及装置
CN1975716A (zh) 中英翻译方法和系统
CN111443979B (zh) 文档处理方法、装置、计算机设备及存储介质
CN113641433A (zh) 基于i18n技术的前端国际化多语言文件的多语言页面转换方法和单元
CN111240790B (zh) 一种应用的多语言适配方法、装置、客户端和存储介质
CN112015374A (zh) 一种基于自然语言的跨编程语言微服务集成系统
CN111639504A (zh) 网页的多语言翻译方法和装置及设备
CN109923538B (zh) 文本检索装置、文本检索方法以及计算机程序
CN114416107A (zh) 翻译逻辑的方法、装置、存储介质和设备
CN109885743B (zh) 一种网页数据信息提取方法
CN113868312A (zh) 多方法融合的机构匹配方法、装置、设备和存储介质
CN117234507A (zh) 代码处理方法、装置、设备及可读存储介质
CN110909119A (zh) 嵌入式产品术语管理的方法及术语管理数据库
CN112949283B (zh) 文本处理方法、装置、非易失性存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100094 101, floors 1-5, building 7, courtyard 3, fengxiu Middle Road, Haidian District, Beijing

Applicant after: Beijing Xingchen Tianhe Technology Co.,Ltd.

Address before: 100097 room 806-1, block B, zone 2, Jinyuan times shopping center, indigo factory, Haidian District, Beijing

Applicant before: Beijing Xingchen Tianhe Technology Co.,Ltd.

CB02 Change of applicant information