CN108427671A - 信息转换方法和装置、存储介质及电子装置 - Google Patents

信息转换方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN108427671A
CN108427671A CN201810073579.2A CN201810073579A CN108427671A CN 108427671 A CN108427671 A CN 108427671A CN 201810073579 A CN201810073579 A CN 201810073579A CN 108427671 A CN108427671 A CN 108427671A
Authority
CN
China
Prior art keywords
source information
target
information
transformation result
intermediate state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810073579.2A
Other languages
English (en)
Other versions
CN108427671B (zh
Inventor
谢军
王明轩
黄江泉
姚健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810073579.2A priority Critical patent/CN108427671B/zh
Publication of CN108427671A publication Critical patent/CN108427671A/zh
Priority to PCT/CN2019/072973 priority patent/WO2019144906A1/zh
Priority to US16/881,310 priority patent/US11880667B2/en
Application granted granted Critical
Publication of CN108427671B publication Critical patent/CN108427671B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种信息转换方法和装置、存储介质及电子装置。其中,该方法包括:获取与待转换的源信息对应的源信息向量序列;依次根据源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象;在预先配置的映射列表中查找源信息中包含的目标源信息对象组合;在查找到目标源信息对象组合的情况下,从映射列表中获取与目标源信息对象组合对应的目标组合转换结果信息;根据目标组合转换结果信息获取与目标源信息对象对应的目标转换结果信息。本发明解决了相关技术中信息转换灵活性较差的技术问题。

Description

信息转换方法和装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种信息转换方法和装置、存储介质及电子装置。
背景技术
信息转换是指在保证原有意思不被改变的基础上,将一种信息转换为另一种信息的过程,也就是说,通过信息转换技术将源信息转换为目标信息。其中,目前常用的信息转换技术包括:机器翻译,例如,传统的统计机器翻译(Statistical Machine Translation,简称SMT)和神经网络机器翻译(Neural Machine Translation,简称NMT)。其中,在通过神经网络机器翻译NMT进行信息转换的过程中,通常是将输入的源信息编码为向量或者向量序列,然后基于编码得到的向量或者向量序列逐词生成目标信息。
然而,在采用上述方式进行信息转换的过程中,所使用的往往是已完成训练的神经网络模型,如果希望调整翻译结果,则需重新获取训练对象,对神经网络模型重新进行训练。也就是说,相关技术所提供的信息转换方式存在对外部资源利用困难,无法在信息转换过程中及时添加信息转换所需的新的映射关系,从而导致信息转换灵活性较差的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种信息转换方法和装置、存储介质及电子装置,以至少解决相关技术中信息转换灵活性较差的技术问题。
根据本发明实施例的一个方面,提供了一种信息转换方法,包括:获取与待转换的源信息对应的源信息向量序列,其中,上述源信息向量序列包括:与上述源信息中所包含的源信息对象对应的源信息对象向量;依次根据上述源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,上述历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;在预先配置的映射列表中查找上述源信息中包含的目标源信息对象组合,其中,在上述目标源信息对象组合中,上述目标源信息对象位于第一目标位置,上述映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;在查找到上述目标源信息对象组合的情况下,从上述映射列表中获取与上述目标源信息对象组合对应的目标组合转换结果信息;根据上述目标组合转换结果信息获取与上述目标源信息对象对应的目标转换结果信息。
根据本发明实施例的另一方面,还提供了一种信息转换装置,包括:第一获取单元,用于获取与待转换的源信息对应的源信息向量序列,其中,上述源信息向量序列包括:与上述源信息中所包含的源信息对象对应的源信息对象向量;确定单元,用于依次根据上述源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,上述历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;查找单元,用于在预先配置的映射列表中查找上述源信息中包含的目标源信息对象组合,其中,在上述目标源信息对象组合中,上述目标源信息对象位于第一目标位置,上述映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;第二获取单元,用于在查找到上述目标源信息对象组合的情况下,从上述映射列表中获取与上述目标源信息对象组合对应的目标组合转换结果信息;第三获取单元,用于根据上述目标组合转换结果信息获取与上述目标源信息对象对应的目标转换结果信息。
可选地,上述转换单元包括:第一获取模块,用于获取上述目标组合转换结果信息的目标组合长度;第二获取模块,用于获取与上述目标组合长度匹配的中间状态集合,其中,上述中间状态集合中的每一个中间状态分别用于控制转换得到一个转换结果信息,上述中间状态集合包括用于转换得到上述目标转换结果信息的第一目标中间状态,在上述中间状态集合中上述第一目标中间状态位于第二目标位置;第三获取模块,用于通过从上述中间状态集合中确定的上述第一目标中间状态获取上述目标转换结果信息。
可选地,还包括:第一确定模块,用于在上述通过从上述中间状态集合中确定的上述第一目标中间状态获取上述目标转换结果信息之后,确定用于转换得到下一个上述目标转换结果信息的第二目标中间状态;第四获取模块,用于在上述第二目标中间状态属于上述中间状态集合的情况下,根据上述目标组合转换结果信息获取下一个上述目标转换结果信息。
可选地,上述第四获取模块包括:获取子模块,用于在上述目标组合转换结果信息中,从与上述第一目标中间状态对应的上述目标转换结果信息之后,获取下一个转换结果信息,作为与上述第二目标中间状态对应的下一个上述目标转换结果信息。
可选地,还包括:第一查找模块,用于在上述确定用于转换得到下一个上述目标转换结果信息的第二目标中间状态之后,在上述第二目标中间状态不属于上述中间状态集合的情况下,重新在上述映射列表中查找下一个上述目标源信息对象组合,其中,下一个上述目标源信息对象组合中包括下一个所要转换的上述目标源信息对象。
可选地,还包括:第五获取模块,用于在上述确定用于转换得到下一个上述目标转换结果信息的第二目标中间状态之后,获取上述第一目标中间状态叠加上述第二目标中间状态的中间状态数量;第二确定模块,用于在上述中间状态数量小于等于上述目标组合长度的情况下,确定上述第二目标中间状态属于上述中间状态集合;在上述中间状态数量大于上述目标组合长度的情况下,确定上述第二目标中间状态不属于上述中间状态集合。
可选地,上述查找单元包括:第六获取模块,用于根据上述目标源信息对象从上述映射列表中获取包含在上述源信息中的源信息对象组合集,其中,在上述源信息对象组合集的每一个上述源信息对象组合中,上述目标源信息对象均位于上述第一目标位置;第二查找模块,用于在上述源信息对象组合集中,查找源组合长度最大的上述源信息对象组合,作为上述目标源信息对象组合。
可选地,上述第一确定单元包括:第七获取模块,用于从上述历史转换结果信息中,获取上一个转换结果信息;第八获取模块,用于根据上述源信息向量序列及上述上一个转换结果信息,从上述源信息向量序列中获取目标源信息对象向量;第三确定模块,用于根据上述目标源信息对象向量确定上述目标源信息对象。
根据本发明实施例的又一方面,还提供了一种存储介质,上述存储介质中存储有计算机程序,其中,上述计算机程序被设置为运行时执行上述的方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的方法。
在本发明实施例中,通过从预先配置的映射列表中查找与源信息中包含的目标源信息对象组合对应的目标组合转换结果信息,从而实现在信息转换过程从外部引入映射列表,以利用映射列表中记录的源信息对象组合与组合转换结果信息之间的映射关系,来干预调整对源信息的信息转换。其中,外部引入的映射列表可以实现及时调整,而无需再重新训练信息转换所需的神经网络模型,从而实现及时更新信息转换所需的新的映射关系,提高信息转换的灵活性的效果,进而解决了相关技术中信息转换灵活性较差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的信息转换方法的应用环境示意图;
图2是根据本发明实施例的一种可选的信息转换方法的流程图;
图3是根据本发明实施例的一种可选的信息转换方法的示意图;
图4是根据本发明实施例的另一种可选的信息转换方法的示意图;
图5是根据本发明实施例的一种可选的信息转换装置的示意图;
图6是根据本发明实施例的一种可选的信息转换装置中转换单元的示意图;
图7是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本发明实施例中,提供了一种上述信息转换方法的实施例。作为一种可选的实施方式,该信息转换方法可以但不限于应用于如图1所示的应用环境中,通过用户终端102(如包括移动终端或台式终端)的信息转换界面获取待转换的源信息,将源信息通过网络104发送给用于执行信息转换的硬件设备106,硬件设备106获取与上述源信息对应的源信息向量序列,其中,该源信息向量序列中包括与源信息中所包含的源信息对象对应的源信息对象向量,依次根据上述获取到的源信息向量序列以及历史转换结果信息,确定所要转换的目标源信息对象,然后,硬件设备106执行步骤S102至步骤S106:从数据库108获取用于记录源信息对象组合与组合转换结果信息之间的映射关系的映射列表,并在该映射列表中查找上述源信息中包含的目标源信息对象组合,其中,在该目标源信息对象组合中,上述目标源信息对象位于第一位置,在查找到上述目标源信息对象组合的情况下,从上述映射列表中获取与上述目标源信息对象组合对应的目标组合转换结果信息,从而根据该目标组合转换结果信息获取与上述目标源信息对象对应的目标转换结果信息。
在本实施例中,在获取到源信息对应的源信息向量序列之后,根据上述源信息向量序列及完成转换后的历史转换结果信息,确定所要转换的目标源信息对象,然后利用预先配置的映射列表查找源信息中包含的目标源信息对象组合,其中,目标源信息对象在该目标源信息对象组合中位于第一目标位置,并在查找到上述目标源信息对象组合的情况下,从映射列表中获取目标源信息对象组合对应的目标组合转换结果信息,从而实现利用该目标组合转换结果信息获取与上述目标源信息对象对应的目标转换结果信息。也就是说,通过从预先配置的映射列表中查找与源信息中包含的目标源信息对象组合对应的目标组合转换结果信息,从而实现在信息转换过程从外部引入映射列表,以利用映射列表中记录的源信息对象组合与组合转换结果信息之间的映射关系,来干预调整对源信息的信息转换。其中,外部引入的映射列表可以实现及时调整,而无需再重新训练信息转换所需的神经网络模型,从而实现及时更新信息转换所需的新的映射关系,提高信息转换的灵活性的效果。进一步,通过在映射列表中查找所记录的映射关系来实现信息转换,还将大大缩短转换所需时长,进而达到提高信息转换的效率的效果。
可选地,在本实施例中,上述用户终端可以包括但不限于:手机、平板电脑、笔记本电脑等移动终端,或台式PC机、数字电视等台式终端,及其他用于实现信息转换的硬件设备。上述网络可以包括但不限于以下至少之一:广域网、城域网、局域网。上述只是一种示例,本实施例对此不做任何限定。
根据本发明实施例的一个方面,提供了一种信息转换方法,该方法可以如图2所示,该方法包括:
S202,获取与待转换的源信息对应的源信息向量序列,其中,源信息向量序列包括:与源信息中所包含的源信息对象对应的源信息对象向量;
S204,依次根据源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;
S206,在预先配置的映射列表中查找源信息中包含的目标源信息对象组合,其中,在目标源信息对象组合中,目标源信息对象位于第一目标位置,映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;
S208,在查找到目标源信息对象组合的情况下,从映射列表中获取与目标源信息对象组合对应的目标组合转换结果信息;
S210,根据目标组合转换结果信息获取与目标源信息对象对应的目标转换结果信息。
可选地,在本实施例中,上述信息转换方法可以但不限于结合神经网络机器翻译(Neural Machine Translation,简称NMT)实现。此外,上述信息转换方法可以但不限于应用于在保证原有意思的基础上,将一种信息转换为另一种信息的过程,其中,信息转换可以包括但不限于:信息表现方式转换、信息格式转换等。例如,信息翻译:1)文学翻译,将文学作品中的抽象文本信息转换为通俗易懂的白话文文本信息;2)语种翻译,将一个语种的文本信息(如中文文本信息)转换为另一个语种的文本信息(如英文文本信息);3)语音翻译,将音频格式的语音信息转换为文本格式的文本信息等等。上述应用场景仅是一种示例,本实施例中提供的信息转换方法还可以但不限于应用于其他信息转换场景,本实施例中对此不做任何限定。
需要说明的是,在本实施例中,在根据获取到的源信息对应的源信息向量序列及历史转换结果,确定出源信息中所要转换的目标源信息对象的情况下,引入预先配置的映射列表,通过从该映射列表中查找与源信息中包含的目标源信息对象组合对应的目标组合转换结果信息,其中,上述目标源信息对象位于目标源信息对象组合中的第一目标位置,从而实现在信息转换过程从外部引入映射列表,以利用映射列表中记录的源信息对象组合与组合转换结果信息之间的映射关系,来干预调整对源信息的信息转换。其中,外部引入的映射列表可以实现及时调整,而无需再重新训练信息转换所需的神经网络模型,从而实现及时更新信息转换所需的新的映射关系,提高信息转换的灵活性的效果。进一步,通过在映射列表中查找所记录的映射关系来实现信息转换,还将大大缩短转换所需时长,进而达到提高信息转换的效率的效果。
可选地,在本实施例中,上述待转换的源信息可以包括但不限于:一个或多个源信息对象,其中,源信息对象可以但不限于为语义完整的最小单位对象,如单词。进一步,与源信息对应的源信息向量序列中可以包括但不限于:与上述源信息对象对应的源信息对象向量。如将单词转换为机器可识别的词向量。
此外,在本实施例中,上述源信息还可以包括但不限于:一个或多个源信息对象组合,其中,每个源信息对象组合中可以包括但不限于:一个或多个源信息对象。如组合得到的短语或技术术语。
例如,以文本翻译为例。假设源信息指示待翻译文本“A Bb Ddd”,其中,源信息中所包含的源信息对象指示该待翻译文本中的每个字母,如源信息对象“A”、源信息对象“B”、源信息对象“b”、源信息对象“D”、源信息对象“d”。源信息对象组合可以为上述字母组成的短语,如源信息对象组合“Bb”、源信息对象组合“Ddd”、源信息对象组合“Bb Ddd”。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,上述映射列表可以但不限于用于记录源信息对象组合与组合转换结果之间的映射关系。其中,在上述映射列表中可以包括但不限于:一个或多个与所要查找的目标源信息对象组合对应的组合转换结果信息,其中,在上述所要查找的目标源信息对象组合中,目标源信息对象均位于第一目标位置。
可选地,在本实施例中,上述目标源信息对象组合的确定方式可以包括但不限于:获取源信息中以目标源信息对象为第一位对象的源信息对象组合;按照上述获取到的源信息对象组合的组合长度从大到小的顺序,在映射列表中进行查找;在未查找到与组合长度为s+1的源信息对象组合对应的组合转换结果信息的情况下,获取组合长度为i的源信息对象组合继续查找;在查找到与组合长度为i的源信息对象组合对应的组合转换结果信息的情况下,将组合长度为i的该源信息对象组合作为目标源信息对象组合,将查找到的组合转换结果信息作为目标组合转换结果信息。其中,i为大于1的自然数。
可选地,在本实施例中,上述目标源信息对象可以但不限于根据输入的源信息对象向量序列,及已完成转换的历史转换结果信息确定。例如,根据历史转换结果信息获取上一个完成转换的源信息对象的隐藏状态Ht,根据上述隐藏状态Ht及源信息对象向量序列,确定当前所要转换的目标源信息对象对应的隐藏状态Ht+1,进而根据该隐藏状态Ht+1确定目标源信息对象。
具体结合图3所示进行说明,假设获取到待转换的源信息对应的源信息向量序列为:X1X2X3…Xt,根据该源信息向量序列及上一个完成转换的源信息对象的隐藏状态H(i-1),确定当前所要转换的目标源信息对象对应的隐藏状态Hi,而根据该隐藏状态Hi获取目标源信息对象为向量X2对应的源信息对象。在映射列表中查找源信息中包含目标源信息对象组合,假设查找到的组合长度最长的目标源信息对象组合为X2X3,获取到对应的目标组合转换结果信息为Y2Y3,则可根据目标组合转换结果信息Y2Y3,对目标源信息对象对应的隐藏状态Hi进行干预,使得对目标源信息对象X2转换后的结果为根据目标组合转换结果信息Y2Y3得到的Y2。
进一步,重复执行以上步骤,直至完成对源信息的信息转换过程。
需要说明的是,在重复执行上述步骤的过程中,在目标组合转换结果信息的组合长度为m(m>1)的情况下,则表示该目标组合转换结果信息将对转换过程中的m个隐藏状态产生干预影响。假设上述隐藏状态Hi为m个隐藏状态中的第1个隐藏状态,则在根据隐藏状态Hi+1进行转换的过程中,可以但不限于屏蔽重新根据上述步骤预测出的与隐藏状态Hi+1对应的转换结果信息,而是可以直接利用查找到的目标组合转换结果信息Y2Y3,得到隐藏状态Hi+1对应的转换结果信息Y3。
此外,在执行信息转换的过程中,每个隐藏状态对应的转换结果信息集合中可以包括但不限于多个转换结果信息,如图3所示Y1-Yn。在本实施例中,可以但不限于通过配置对应的权重来从上述转换结果信息集合中获取目标转换结果信息。例如,假设当前所要获取到的目标转换结果信息为“Y2”,则可以为“Y2”配置权重1,其他转换结果信息配置权重0;也可以为“Y2”配置权重a,其他转换结果信息配置权重b,其中a>b。
通过本申请提供的实施例,在根据获取到的源信息对应的源信息向量序列及历史转换结果,确定出源信息中所要转换的目标源信息对象的情况下,引入预先配置的映射列表,通过从该映射列表中查找与源信息中包含的目标源信息对象组合对应的目标组合转换结果信息,其中,上述目标源信息对象位于目标源信息对象组合中的第一目标位置,从而实现在信息转换过程从外部引入映射列表,以利用映射列表中记录的源信息对象组合与组合转换结果信息之间的映射关系,来干预调整对源信息的信息转换。其中,外部引入的映射列表可以实现及时调整,而无需再重新训练信息转换所需的神经网络模型,从而实现及时更新信息转换所需的新的映射关系,提高信息转换的灵活性的效果。
作为一种可选的方案,根据目标组合转换结果信息获取与目标源信息对象对应的目标转换结果信息包括:
S1,获取目标组合转换结果信息的目标组合长度;
S2,获取与目标组合长度匹配的中间状态集合,其中,中间状态集合中的每一个中间状态分别用于控制转换得到一个转换结果信息,中间状态集合包括用于转换得到目标转换结果信息的第一目标中间状态,在中间状态集合中第一目标中间状态位于第二目标位置;
S3,通过从中间状态集合中确定的第一目标中间状态获取目标转换结果信息。
可选地,在本实施例中,上述目标组合长度可以但不限于为转换后的目标组合转换结果信息的结果长度。例如,以文本信息转换为例,上述组合长度可以但不限于为短语中单词数量。上述仅是一种示例,本实施例中对此不做任何限定。
需要说明的是,上述目标组合转换结果信息的目标组合长度可以与源信息对象组合的组合长度相同,如图4所示单词数量为2的源信息对象组合“A g”对应的目标组合转换结果信息为单词数量为2的“Y1Y07”;此外,也可以与源信息对象组合的组合长度不同,如图4所示单词数量为4的源信息对象组合“A Bb T”对应的目标组合转换结果信息为单词数量为4的“Y1Y2Y02Y20”,也可以为组合长度为5的“Y1Y2Y02Y Y”,本实施例中对此不做任何限定。
具体结合图4所示进行说明,假设待转换的源信息为“A Bb Ddd hh”,在映射列表中查找到目标源信息对象组合“A Bb Ddd”对应的目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”,其中,目标组合长度指示的单词数量为6,则可以获取与该目标组合长度匹配的中间状态集合。根据上述示例可以中间状态集合中包含6个中间状态(也可称作隐藏状态),可以包括:Hi,Hi+1,Hi+2,Hi+3,Hi+4,Hi+5。
需要说明的是,上述第二目标位置与第一目标位置可以为指示相同次序的位置。假设当前确定的目标源信息对象为“A”,其中,目标源信息对象“A”在目标源信息对象组合中位于第一个对象的位置,对应的,第一目标中间状态可以对应为中间状态集合中位于第一个位置的隐藏状态Hi。
也就是说,从隐藏状态Hi开始,直至隐藏状态Hi+5,在进行信息转换的过程时,均可以按照在隐藏状态Hi执行转换时查找到的目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”进行信息转换,而屏蔽根据神经网络模型预测出的预测结果,不再单一地使用神经网络模型机器翻译的结果。
其中,在上述中间状态集合中确定出第一目标中间状态为隐藏状态Hi,对应获取目标转换结果信息为目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”中的“Y1”。
通过本申请提供的实施例,利用查找到的目标组合转换结果信息的目标组合长度,对源信息对象组合整体信息转换控制,从而实现利用预先配置的映射列表来干预信息转换过程,直接查找获取目标组合转换结果信息,节省信息转换过程对神经网络模型进行反复训练所延长的时间,进而达到提高信息转换的速度及效率的效果。
作为一种可选的方案,在通过从中间状态集合中确定的第一目标中间状态获取目标转换结果信息之后,还包括:
S1,确定用于转换得到下一个目标转换结果信息的第二目标中间状态;
S2,在第二目标中间状态属于中间状态集合的情况下,根据目标组合转换结果信息获取下一个目标转换结果信息。
可选地,在本实施例中,在第二目标中间状态属于中间状态集合的情况下,根据目标组合转换结果信息获取下一个目标转换结果信息包括:在目标组合转换结果信息中,从与第一目标中间状态对应的目标转换结果信息之后,获取下一个转换结果信息,作为与第二目标中间状态对应的下一个目标转换结果信息。
具体结合图3所示进行说明,假设第一目标中间状态(如隐藏状态Hi)对应的目标源信息对象已完成转换,获取到下一个中间状态,即第二目标中间状态(如隐藏状态Hi+1),判断该隐藏状态Hi+1是否属于中间状态集合,根据上述示例可知,该隐藏状态Hi+1属于中间状态集合,则可根据目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”,从与第一目标中间状态(如隐藏状态Hi)对应的目标转换结果信息(如“Y1”)之后,获取下一个转换结果信息,作为与第二目标中间状态(隐藏状态Hi+1)对应的下一个目标转换结果信息,如“Y2”。
需要说明的是,判断第二目标中间状态是否属于中间状态集合的判断方式可以包括但不限于:从第一目标中间状态开始,对之后转换所使用的中间状态进行计数,在计数的结果未达到中间状态集合中所包含的中间状态的数量的情况下,可直接利用从映射列表中查找到的目标组合转换结果信息完成信息转换;在计数的结果超出中间状态集合中所包含的中间状态的数量的情况下,根据上述实施例重新执行查找转换步骤。
可选地,在本实施例中,在计数的结果超出中间状态集合中所包含的中间状态的数量的情况下,根据上述实施例重新执行查找转换步骤可以包括但不限于:在确定用于转换得到下一个目标转换结果信息的第二目标中间状态之后,在第二目标中间状态不属于中间状态集合的情况下,重新在映射列表中查找下一个目标源信息对象组合,其中,下一个目标源信息对象组合中包括下一个所要转换的目标源信息对象。
也就是说,在第二目标中间状态不属于中间状态集合的情况下,可以但不限于根据上述实施例中记载的方法重新在映射列表中查找目标组合转换结果信息,以继续信息转换过程,直至完成对源信息的转换。
通过本申请提供的实施例,根据下一个中间状态是否属于中间状态集合的判断结果,确定是否直接利用从映射列表中查找到的目标组合转换结果信息来完成信息转换,从而达到提高信息转换的速度及效率的效果。
作为一种可选的方案,在确定用于转换得到下一个目标转换结果信息的第二目标中间状态之后,还包括:
S1,获取第一目标中间状态叠加第二目标中间状态的中间状态数量;
S2,在中间状态数量小于等于目标组合长度的情况下,确定第二目标中间状态属于中间状态集合;
S3,在中间状态数量大于目标组合长度的情况下,确定第二目标中间状态不属于中间状态集合。
可选地,在本实施例中,可以但不限于通过从第一目标中间状态开始,对之后转换所使用的中间状态进行计数,以确定第二目标中间状态是否属于中间状态集合。
具体结合以下示例进行说明,对中间状态进行计数,假设叠加第二目标中间状态后的中间状态数量为T。进一步,假设目标组合长度为6,若中间状态数量T小于等于6,表示第二目标中间状态属于中间状态集合,从而可以实现直接利用上一次查找到的目标组合转换结果信息直接进行信息转换;若中间状态数量T大于6,表示第二目标中间状态不属于中间状态集合,则需重新执行查找转换步骤。
通过本申请提供的实施例,通过对中间状态计数,实现准确利用目标组合转换结果信息,对源信息对象组合进行信息转换,避免转换误差。
作为一种可选的方案,在预先配置的映射列表中查找源信息中包含的目标源信息对象组合包括:
S1,根据目标源信息对象从映射列表中获取包含在源信息中的源信息对象组合集,其中,在源信息对象组合集的每一个源信息对象组合中,目标源信息对象均位于第一目标位置;
S2,在源信息对象组合集中,查找源组合长度最大的源信息对象组合,作为目标源信息对象组合。
具体结合图4所示进行说明,假设待转换的源信息为“A Bb Ddd hh”,在映射列表中查找以目标源信息对象“A”为首的源信息对象组合集,如查找到的源信息对象组合集中包括:“A Bb D”、“A Bb Ddd”、“A Bb”,其中,源组合长度最大的源信息对象组合为“A BbDdd”,则可将该“A Bb Ddd”作为目标源信息对象组合。
通过本申请提供的实施例,通过在源信息对象组合集中查找源组合长度最大的源信息对象组合,其中,在源信息对象组合集的每一个源信息对象组合中,目标源信息对象均位于第一目标位置,从而实现尽可能使用映射列表中已记录的映射关系来完成信息转换,节省通过神经网络模型机器翻译的时长,进而实现提高信息转换的效率的目的。
作为一种可选的方案,根据源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象包括:
S1,从历史转换结果信息中,获取上一个转换结果信息;
S2,根据源信息向量序列及上一个转换结果信息,从源信息向量序列中获取目标源信息对象向量;
S3,根据目标源信息对象向量确定目标源信息对象。
具体结合图3所示进行说明,假设获取到待转换的源信息对应的源信息向量序列为:X1X2X3…Xt,根据该源信息向量序列及上一个完成转换的源信息对象的隐藏状态H(i-1),确定源信息对象向量X2对应的权重a2对当前所要转换的目标源信息对象对应的隐藏状态Hi产生影响最大。则可预测出目标源信息对象为向量X2对应的源信息对象。
通过本申请提供的实施例,根据源信息向量序列及上一个转换结果信息可以准确从源信息对应的源信息向量序列中预测出所要获取到的目标源信息向量,进而根据该目标源信息向量来确定目标源信息对象。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施信息转换方法的信息转换装置,如图5所示,该装置包括:
(1)第一获取单元502,用于获取与待转换的源信息对应的源信息向量序列,其中,源信息向量序列包括:与源信息中所包含的源信息对象对应的源信息对象向量;
(2)第一确定单元504,用于依次根据源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;
(3)查找单元506,用于在预先配置的映射列表中查找源信息中包含的目标源信息对象组合,其中,在目标源信息对象组合中,目标源信息对象位于第一目标位置,映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;
(4)第二获取单元508,用于在查找到目标源信息对象组合的情况下,从映射列表中获取与目标源信息对象组合对应的目标组合转换结果信息;
(5)转换单元510,用于根据目标组合转换结果信息获取与目标源信息对象对应的目标转换结果信息。
可选地,在本实施例中,上述信息转换装置可以但不限于结合神经网络机器翻译(Neural Machine Translation,简称NMT)实现。此外,上述信息转换方法可以但不限于应用于在保证原有意思的基础上,将一种信息转换为另一种信息的过程,其中,信息转换可以包括但不限于:信息表现方式转换、信息格式转换等。例如,信息翻译:1)文学翻译,将文学作品中的抽象文本信息转换为通俗易懂的白话文文本信息;2)语种翻译,将一个语种的文本信息(如中文文本信息)转换为另一个语种的文本信息(如英文文本信息);3)语音翻译,将音频格式的语音信息转换为文本格式的文本信息等等。上述应用场景仅是一种示例,本实施例中提供的信息转换方法还可以但不限于应用于其他信息转换场景,本实施例中对此不做任何限定。
需要说明的是,在本实施例中,在根据获取到的源信息对应的源信息向量序列及历史转换结果,确定出源信息中所要转换的目标源信息对象的情况下,引入预先配置的映射列表,通过从该映射列表中查找与源信息中包含的目标源信息对象组合对应的目标组合转换结果信息,其中,上述目标源信息对象位于目标源信息对象组合中的第一目标位置,从而实现在信息转换过程从外部引入映射列表,以利用映射列表中记录的源信息对象组合与组合转换结果信息之间的映射关系,来干预调整对源信息的信息转换。其中,外部引入的映射列表可以实现及时调整,而无需再重新训练信息转换所需的神经网络模型,从而实现及时更新信息转换所需的新的映射关系,提高信息转换的灵活性的效果。进一步,通过在映射列表中查找所记录的映射关系来实现信息转换,还将大大缩短转换所需时长,进而达到提高信息转换的效率的效果。
可选地,在本实施例中,上述待转换的源信息可以包括但不限于:一个或多个源信息对象,其中,源信息对象可以但不限于为语义完整的最小单位对象,如单词。进一步,与源信息对应的源信息向量序列中可以包括但不限于:与上述源信息对象对应的源信息对象向量。如将单词转换为机器可识别的词向量。
此外,在本实施例中,上述源信息还可以包括但不限于:一个或多个源信息对象组合,其中,每个源信息对象组合中可以包括但不限于:一个或多个源信息对象。如组合得到的短语或技术术语。
例如,以文本翻译为例。假设源信息指示待翻译文本“A Bb Ddd”,其中,源信息中所包含的源信息对象指示该待翻译文本中的每个字母,如源信息对象“A”、源信息对象“B”、源信息对象“b”、源信息对象“D”、源信息对象“d”。源信息对象组合可以为上述字母组成的短语,如源信息对象组合“Bb”、源信息对象组合“Ddd”、源信息对象组合“Bb Ddd”。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,上述映射列表可以但不限于用于记录源信息对象组合与组合转换结果之间的映射关系。其中,在上述映射列表中可以包括但不限于:一个或多个与所要查找的目标源信息对象组合对应的组合转换结果信息,其中,在上述所要查找的目标源信息对象组合中,目标源信息对象均位于第一目标位置。
可选地,在本实施例中,上述目标源信息对象组合的确定方式可以包括但不限于:获取源信息中以目标源信息对象为第一位对象的源信息对象组合;按照上述获取到的源信息对象组合的组合长度从大到小的顺序,在映射列表中进行查找;在未查找到与组合长度为s+1的源信息对象组合对应的组合转换结果信息的情况下,获取组合长度为i的源信息对象组合继续查找;在查找到与组合长度为i的源信息对象组合对应的组合转换结果信息的情况下,将组合长度为i的该源信息对象组合作为目标源信息对象组合,将查找到的组合转换结果信息作为目标组合转换结果信息。其中,i为大于1的自然数。
可选地,在本实施例中,上述目标源信息对象可以但不限于根据输入的源信息对象向量序列,及已完成转换的历史转换结果信息确定。例如,根据历史转换结果信息获取上一个完成转换的源信息对象的隐藏状态Ht,根据上述隐藏状态Ht及源信息对象向量序列,确定当前所要转换的目标源信息对象对应的隐藏状态Ht+1,进而根据该隐藏状态Ht+1确定目标源信息对象。
具体结合图3所示进行说明,假设获取到待转换的源信息对应的源信息向量序列为:X1X2X3…Xt,根据该源信息向量序列及上一个完成转换的源信息对象的隐藏状态H(i-1),确定当前所要转换的目标源信息对象对应的隐藏状态Hi,而根据该隐藏状态Hi获取目标源信息对象为向量X2对应的源信息对象。在映射列表中查找源信息中包含目标源信息对象组合,假设查找到的组合长度最长的目标源信息对象组合为X2X3,获取到对应的目标组合转换结果信息为Y2Y3,则可根据目标组合转换结果信息Y2Y3,对目标源信息对象对应的隐藏状态Hi进行干预,使得对目标源信息对象X2转换后的结果为根据目标组合转换结果信息Y2Y3得到的Y2。
进一步,重复执行以上步骤,直至完成对源信息的信息转换过程。
需要说明的是,在重复执行上述步骤的过程中,在目标组合转换结果信息的组合长度为m(m>1)的情况下,则表示该目标组合转换结果信息将对转换过程中的m个隐藏状态产生干预影响。假设上述隐藏状态Hi为m个隐藏状态中的第1个隐藏状态,则在根据隐藏状态Hi+1进行转换的过程中,可以但不限于屏蔽重新根据上述步骤预测出的与隐藏状态Hi+1对应的转换结果信息,而是可以直接利用查找到的目标组合转换结果信息Y2Y3,得到隐藏状态Hi+1对应的转换结果信息Y3。
此外,在执行信息转换的过程中,每个隐藏状态对应的转换结果信息集合中可以包括但不限于多个转换结果信息,如图3所示Y1-Yn。在本实施例中,可以但不限于通过配置对应的权重来从上述转换结果信息集合中获取目标转换结果信息。例如,假设当前所要获取到的目标转换结果信息为“Y2”,则可以为“Y2”配置权重1,其他转换结果信息配置权重0;也可以为“Y2”配置权重a,其他转换结果信息配置权重b,其中a>b。
通过本申请提供的实施例,在根据获取到的源信息对应的源信息向量序列及历史转换结果,确定出源信息中所要转换的目标源信息对象的情况下,引入预先配置的映射列表,通过从该映射列表中查找与源信息中包含的目标源信息对象组合对应的目标组合转换结果信息,其中,上述目标源信息对象位于目标源信息对象组合中的第一目标位置,从而实现在信息转换过程从外部引入映射列表,以利用映射列表中记录的源信息对象组合与组合转换结果信息之间的映射关系,来干预调整对源信息的信息转换。其中,外部引入的映射列表可以实现及时调整,而无需再重新训练信息转换所需的神经网络模型,从而实现及时更新信息转换所需的新的映射关系,提高信息转换的灵活性的效果。
作为一种可选的方案,如图6所示,转换单元510包括:
(1)第一获取模块602,用于获取目标组合转换结果信息的目标组合长度;
(2)第二获取模块604,用于获取与目标组合长度匹配的中间状态集合,其中,中间状态集合中的每一个中间状态分别用于控制转换得到一个转换结果信息,中间状态集合包括用于转换得到目标转换结果信息的第一目标中间状态,在中间状态集合中第一目标中间状态位于第二目标位置;
(3)第三获取模块606,用于通过从中间状态集合中确定的第一目标中间状态获取目标转换结果信息。
可选地,在本实施例中,上述目标组合长度可以但不限于为转换后的目标组合转换结果信息的结果长度。例如,以文本信息转换为例,上述组合长度可以但不限于为短语中单词数量。上述仅是一种示例,本实施例中对此不做任何限定。
需要说明的是,上述目标组合转换结果信息的目标组合长度可以与源信息对象组合的组合长度相同,如图4所示单词数量为2的源信息对象组合“A g”对应的目标组合转换结果信息为单词数量为2的“Y1Y07”;此外,也可以与源信息对象组合的组合长度不同,如图4所示单词数量为4的源信息对象组合“A Bb T”对应的目标组合转换结果信息为单词数量为4的“Y1Y2Y02Y20”,也可以为组合长度为5的“Y1Y2Y02Y Y”,本实施例中对此不做任何限定。
具体结合图4所示进行说明,假设待转换的源信息为“A Bb Ddd hh”,在映射列表中查找到目标源信息对象组合“A Bb Ddd”对应的目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”,其中,目标组合长度指示的单词数量为6,则可以获取与该目标组合长度匹配的中间状态集合。根据上述示例可以中间状态集合中包含6个中间状态(也可称作隐藏状态),可以包括:Hi,Hi+1,Hi+2,Hi+3,Hi+4,Hi+5。
需要说明的是,上述第二目标位置与第一目标位置可以为指示相同次序的位置。假设当前确定的目标源信息对象为“A”,其中,目标源信息对象“A”在目标源信息对象组合中位于第一个对象的位置,对应的,第一目标中间状态可以对应为中间状态集合中位于第一个位置的隐藏状态Hi。
也就是说,从隐藏状态Hi开始,直至隐藏状态Hi+5,在进行信息转换的过程时,均可以按照在隐藏状态Hi执行转换时查找到的目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”进行信息转换,而屏蔽根据神经网络模型预测出的预测结果,不再单一地使用神经网络模型机器翻译的结果。
其中,在上述中间状态集合中确定出第一目标中间状态为隐藏状态Hi,对应获取目标转换结果信息为目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”中的“Y1”。
通过本申请提供的实施例,利用查找到的目标组合转换结果信息的目标组合长度,对源信息对象组合整体信息转换控制,从而实现利用预先配置的映射列表来干预信息转换过程,直接查找获取目标组合转换结果信息,节省信息转换过程对神经网络模型进行反复训练所延长的时间,进而达到提高信息转换的速度及效率的效果。
作为一种可选的方案,还包括:
(1)第一确定模块,用于在通过从中间状态集合中确定的第一目标中间状态获取目标转换结果信息之后,确定用于转换得到下一个目标转换结果信息的第二目标中间状态;
(2)第四获取模块,用于在第二目标中间状态属于中间状态集合的情况下,根据目标组合转换结果信息获取下一个目标转换结果信息。
可选地,在本实施例中,第四获取模块包括:获取子模块,用于在目标组合转换结果信息中,从与第一目标中间状态对应的目标转换结果信息之后,获取下一个转换结果信息,作为与第二目标中间状态对应的下一个目标转换结果信息。
具体结合图3所示进行说明,假设第一目标中间状态(如隐藏状态Hi)对应的目标源信息对象已完成转换,获取到下一个中间状态,即第二目标中间状态(如隐藏状态Hi+1),判断该隐藏状态Hi+1是否属于中间状态集合,根据上述示例可知,该隐藏状态Hi+1属于中间状态集合,则可根据目标组合转换结果信息“Y1Y2Y02Y4Y04Y04”,从与第一目标中间状态(如隐藏状态Hi)对应的目标转换结果信息(如“Y1”)之后,获取下一个转换结果信息,作为与第二目标中间状态(隐藏状态Hi+1)对应的下一个目标转换结果信息,如“Y2”。
需要说明的是,判断第二目标中间状态是否属于中间状态集合的判断方式可以包括但不限于:从第一目标中间状态开始,对之后转换所使用的中间状态进行计数,在计数的结果未达到中间状态集合中所包含的中间状态的数量的情况下,可直接利用从映射列表中查找到的目标组合转换结果信息完成信息转换;在计数的结果超出中间状态集合中所包含的中间状态的数量的情况下,根据上述实施例重新执行查找转换步骤。
可选地,在本实施例中,在计数的结果超出中间状态集合中所包含的中间状态的数量的情况下,根据上述实施例重新执行查找转换步骤可以包括但不限于:通过第一查找模块,在确定用于转换得到下一个目标转换结果信息的第二目标中间状态之后,在第二目标中间状态不属于中间状态集合的情况下,重新在映射列表中查找下一个目标源信息对象组合,其中,下一个目标源信息对象组合中包括下一个所要转换的目标源信息对象。
也就是说,在第二目标中间状态不属于中间状态集合的情况下,可以但不限于根据上述实施例中记载的方法重新在映射列表中查找目标组合转换结果信息,以继续信息转换过程,直至完成对源信息的转换。
通过本申请提供的实施例,根据下一个中间状态是否属于中间状态集合的判断结果,确定是否直接利用从映射列表中查找到的目标组合转换结果信息来完成信息转换,从而达到提高信息转换的速度及效率的效果。
作为一种可选的方案,还包括:
(1)第五获取模块,用于在确定用于转换得到下一个目标转换结果信息的第二目标中间状态之后,获取第一目标中间状态叠加第二目标中间状态的中间状态数量;
(2)第二确定模块,用于在中间状态数量小于等于目标组合长度的情况下,确定第二目标中间状态属于中间状态集合;在中间状态数量大于目标组合长度的情况下,确定第二目标中间状态不属于中间状态集合。
可选地,在本实施例中,可以但不限于通过从第一目标中间状态开始,对之后转换所使用的中间状态进行计数,以确定第二目标中间状态是否属于中间状态集合。
具体结合以下示例进行说明,对中间状态进行计数,假设叠加第二目标中间状态后的中间状态数量为T。进一步,假设目标组合长度为6,若中间状态数量T小于等于6,表示第二目标中间状态属于中间状态集合,从而可以实现直接利用上一次查找到的目标组合转换结果信息直接进行信息转换;若中间状态数量T大于6,表示第二目标中间状态不属于中间状态集合,则需重新执行查找转换步骤。
通过本申请提供的实施例,通过对中间状态计数,实现准确利用目标组合转换结果信息,对源信息对象组合进行信息转换,避免转换误差。
作为一种可选的方案,查找单元506包括:
(1)第六获取模块,用于根据目标源信息对象从映射列表中获取包含在源信息中的源信息对象组合集,其中,在源信息对象组合集的每一个源信息对象组合中,目标源信息对象均位于第一目标位置;
(2)第二查找模块,用于在源信息对象组合集中,查找源组合长度最大的源信息对象组合,作为目标源信息对象组合。
具体结合图4所示进行说明,假设待转换的源信息为“A Bb Ddd hh”,在映射列表中查找以目标源信息对象“A”为首的源信息对象组合集,如查找到的源信息对象组合集中包括:“A Bb D”、“A Bb Ddd”、“A Bb”,其中,源组合长度最大的源信息对象组合为“A BbDdd”,则可将该“A Bb Ddd”作为目标源信息对象组合。
通过本申请提供的实施例,通过在源信息对象组合集中查找源组合长度最大的源信息对象组合,其中,在源信息对象组合集的每一个源信息对象组合中,目标源信息对象均位于第一目标位置,从而实现尽可能使用映射列表中已记录的映射关系来完成信息转换,节省通过神经网络模型机器翻译的时长,进而实现提高信息转换的效率的目的。
作为一种可选的方案,第一确定单元包括:
(1)第七获取模块,用于从历史转换结果信息中,获取上一个转换结果信息;
(2)第八获取模块,用于根据源信息向量序列及上一个转换结果信息,从源信息向量序列中获取目标源信息对象向量;
(3)第三确定模块,用于根据目标源信息对象向量确定目标源信息对象。
具体结合图3所示进行说明,假设获取到待转换的源信息对应的源信息向量序列为:X1X2X3…Xt,根据该源信息向量序列及上一个完成转换的源信息对象的隐藏状态H(i-1),确定源信息对象向量X2对应的权重a2对当前所要转换的目标源信息对象对应的隐藏状态Hi产生影响最大。则可预测出目标源信息对象为向量X2对应的源信息对象。
通过本申请提供的实施例,根据源信息向量序列及上一个转换结果信息可以准确从源信息对应的源信息向量序列中预测出所要获取到的目标源信息向量,进而根据该目标源信息向量来确定目标源信息对象。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行任一项方法实施例中的步骤。
可选地,在本实施例中,存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取与待转换的源信息对应的源信息向量序列,其中,源信息向量序列包括:与源信息中所包含的源信息对象对应的源信息对象向量;
S2,依次根据源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;
S3,在预先配置的映射列表中查找源信息中包含的目标源信息对象组合,其中,在目标源信息对象组合中,目标源信息对象位于第一目标位置,映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;
S4,在查找到目标源信息对象组合的情况下,从映射列表中获取与目标源信息对象组合对应的目标组合转换结果信息;
S5,根据目标组合转换结果信息获取与目标源信息对象对应的目标转换结果信息。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标组合转换结果信息的目标组合长度;
S2,获取与目标组合长度匹配的中间状态集合,其中,中间状态集合中的每一个中间状态分别用于控制转换得到一个转换结果信息,中间状态集合包括用于转换得到目标转换结果信息的第一目标中间状态,在中间状态集合中第一目标中间状态位于第二目标位置;
S3,通过从中间状态集合中确定的第一目标中间状态获取目标转换结果信息。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,确定用于转换得到下一个目标转换结果信息的第二目标中间状态;
S2,在第二目标中间状态属于中间状态集合的情况下,根据目标组合转换结果信息获取下一个目标转换结果信息。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,在目标组合转换结果信息中,从与第一目标中间状态对应的目标转换结果信息之后,获取下一个转换结果信息,作为与第二目标中间状态对应的下一个目标转换结果信息。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,在第二目标中间状态不属于中间状态集合的情况下,重新在映射列表中查找下一个目标源信息对象组合,其中,下一个目标源信息对象组合中包括下一个所要转换的目标源信息对象。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,获取第一目标中间状态叠加第二目标中间状态的中间状态数量;
S2,在中间状态数量小于等于目标组合长度的情况下,确定第二目标中间状态属于中间状态集合;
S3,在中间状态数量大于目标组合长度的情况下,确定第二目标中间状态不属于中间状态集合。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,根据目标源信息对象从映射列表中获取包含在源信息中的源信息对象组合集,其中,在源信息对象组合集的每一个源信息对象组合中,目标源信息对象均位于第一目标位置;
S2,在源信息对象组合集中,查找源组合长度最大的源信息对象组合,作为目标源信息对象组合。
可选地,存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,从历史转换结果信息中,获取上一个转换结果信息;
S2,根据源信息向量序列及上一个转换结果信息,从源信息向量序列中获取目标源信息对象向量;
S3,根据目标源信息对象向量确定目标源信息对象。
可选地,存储介质还被设置为存储用于执行实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
根据本发明实施例的又一个方面,还提供了一种用于实施上述信息转换方法的电子装置,如图7所示,该电子装置包括存储器702、处理器704、显示器708和传输装置710,以及用于连接处理器704与显示器708和传输装置710的用户接口706。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取与待转换的源信息对应的源信息向量序列,其中,上述源信息向量序列包括:与上述源信息中所包含的源信息对象对应的源信息对象向量;
S2,依次根据上述源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,上述历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;
S3,在预先配置的映射列表中查找上述源信息中包含的目标源信息对象组合,其中,在上述目标源信息对象组合中,上述目标源信息对象位于第一目标位置,上述映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;
S4,在查找到上述目标源信息对象组合的情况下,从上述映射列表中获取与上述目标源信息对象组合对应的目标组合转换结果信息;
S5,根据上述目标组合转换结果信息获取与上述目标源信息对象对应的目标转换结果信息。
可选地,本领域普通技术人员可以理解,图7所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图7中所示更多或者更少的组件(如网络接口等),或者具有与图7所示不同的配置。
其中,存储器702可用于存储软件程序以及模块,如本发明实施例中的信息转换方法及装置对应的程序指令/模块,处理器704通过运行存储在存储器702内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的信息转换方法。存储器702可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器702可进一步包括相对于处理器704远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置710用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置710包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置710为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器702用于存储源信息、映射列表、转换结果信息等。用户接口706用于获取源信息,显示器708用于显示转换结果信息。上述仅是一种示例,本实施例中对此不做任何限定。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种信息转换方法,其特征在于,包括:
获取与待转换的源信息对应的源信息向量序列,其中,所述源信息向量序列包括:与所述源信息中所包含的源信息对象对应的源信息对象向量;
依次根据所述源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,所述历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;
在预先配置的映射列表中查找所述源信息中包含的目标源信息对象组合,其中,在所述目标源信息对象组合中,所述目标源信息对象位于第一目标位置,所述映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;
在查找到所述目标源信息对象组合的情况下,从所述映射列表中
获取与所述目标源信息对象组合对应的目标组合转换结果信息;
根据所述目标组合转换结果信息获取与所述目标源信息对象对应的目标转换结果信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标组合转换结果信息获取与所述目标源信息对象对应的目标转换结果信息包括:
获取所述目标组合转换结果信息的目标组合长度;
获取与所述目标组合长度匹配的中间状态集合,其中,所述中间状态集合中的每一个中间状态分别用于控制转换得到一个转换结果信息,所述中间状态集合包括用于转换得到所述目标转换结果信息的第一目标中间状态,在所述中间状态集合中所述第一目标中间状态位于第二目标位置;
通过从所述中间状态集合中确定的所述第一目标中间状态获取所述目标转换结果信息。
3.根据权利要求2所述的方法,其特征在于,在所述通过从所述中间状态集合中确定的所述第一目标中间状态获取所述目标转换结果信息之后,还包括:
确定用于转换得到下一个所述目标转换结果信息的第二目标中间状态;
在所述第二目标中间状态属于所述中间状态集合的情况下,根据所述目标组合转换结果信息获取下一个所述目标转换结果信息。
4.根据权利要求3所述的方法,其特征在于,所述在所述第二目标中间状态属于所述中间状态集合的情况下,根据所述目标组合转换结果信息获取下一个所述目标转换结果信息包括:
在所述目标组合转换结果信息中,从与所述第一目标中间状态对应的所述目标转换结果信息之后,获取下一个转换结果信息,作为与所述第二目标中间状态对应的下一个所述目标转换结果信息。
5.根据权利要求3所述的方法,其特征在于,在所述确定用于转换得到下一个所述目标转换结果信息的第二目标中间状态之后,还包括:
在所述第二目标中间状态不属于所述中间状态集合的情况下,重新在所述映射列表中查找下一个所述目标源信息对象组合,其中,下一个所述目标源信息对象组合中包括下一个所要转换的所述目标源信息对象。
6.根据权利要求3所述的方法,其特征在于,在所述确定用于转换得到下一个所述目标转换结果信息的第二目标中间状态之后,还包括:
获取所述第一目标中间状态叠加所述第二目标中间状态的中间状态数量;
在所述中间状态数量小于等于所述目标组合长度的情况下,确定所述第二目标中间状态属于所述中间状态集合;
在所述中间状态数量大于所述目标组合长度的情况下,确定所述第二目标中间状态不属于所述中间状态集合。
7.根据权利要求1所述的方法,其特征在于,在预先配置的映射列表中查找所述源信息中包含的目标源信息对象组合包括:
根据所述目标源信息对象从所述映射列表中获取包含在所述源信息中的源信息对象组合集,其中,在所述源信息对象组合集的每一个所述源信息对象组合中,所述目标源信息对象均位于所述第一目标位置;
在所述源信息对象组合集中,查找源组合长度最大的所述源信息对象组合,作为所述目标源信息对象组合。
8.根据权利要求1所述的方法,其特征在于,所述依次根据所述源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象包括:
从所述历史转换结果信息中,获取上一个转换结果信息;
根据所述源信息向量序列及所述上一个转换结果信息,从所述源信息向量序列中获取目标源信息对象向量;
根据所述目标源信息对象向量确定所述目标源信息对象。
9.一种信息转换装置,其特征在于,包括:
第一获取单元,用于获取与待转换的源信息对应的源信息向量序列,其中,所述源信息向量序列包括:与所述源信息中所包含的源信息对象对应的源信息对象向量;
第一确定单元,用于依次根据所述源信息向量序列及历史转换结果信息,确定所要转换的目标源信息对象,其中,所述历史转换结果信息为完成转换后的源信息对象所对应的转换结果信息;
查找单元,用于在预先配置的映射列表中查找所述源信息中包含的目标源信息对象组合,其中,在所述目标源信息对象组合中,所述目标源信息对象位于第一目标位置,所述映射列表用于记录源信息对象组合与组合转换结果信息之间的映射关系;
第二获取单元,用于在查找到所述目标源信息对象组合的情况下,从所述映射列表中获取与所述目标源信息对象组合对应的目标组合转换结果信息;
转换单元,用于根据所述目标组合转换结果信息获取与所述目标源信息对象对应的目标转换结果信息。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。
11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至8任一项中所述的方法。
CN201810073579.2A 2018-01-25 2018-01-25 信息转换方法和装置、存储介质及电子装置 Active CN108427671B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810073579.2A CN108427671B (zh) 2018-01-25 2018-01-25 信息转换方法和装置、存储介质及电子装置
PCT/CN2019/072973 WO2019144906A1 (zh) 2018-01-25 2019-01-24 信息转换方法和装置、存储介质及电子装置
US16/881,310 US11880667B2 (en) 2018-01-25 2020-05-22 Information conversion method and apparatus, storage medium, and electronic apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810073579.2A CN108427671B (zh) 2018-01-25 2018-01-25 信息转换方法和装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN108427671A true CN108427671A (zh) 2018-08-21
CN108427671B CN108427671B (zh) 2021-06-25

Family

ID=63156259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810073579.2A Active CN108427671B (zh) 2018-01-25 2018-01-25 信息转换方法和装置、存储介质及电子装置

Country Status (3)

Country Link
US (1) US11880667B2 (zh)
CN (1) CN108427671B (zh)
WO (1) WO2019144906A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019144906A1 (zh) * 2018-01-25 2019-08-01 腾讯科技(深圳)有限公司 信息转换方法和装置、存储介质及电子装置
CN114257658A (zh) * 2021-12-24 2022-03-29 珠海格力电器股份有限公司 通信协议转换配置方法、通信协议转换方法和相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131690A (zh) * 2006-08-21 2008-02-27 富士施乐株式会社 简体汉字和繁体汉字相互转换方法及其系统
US8868430B2 (en) * 2009-01-16 2014-10-21 Sony Corporation Methods, devices, and computer program products for providing real-time language translation capabilities between communication terminals
US20140350914A1 (en) * 2012-01-27 2014-11-27 Nec Corporation Term translation acquisition method and term translation acquisition apparatus
CN104508658A (zh) * 2012-07-13 2015-04-08 微软公司 基于短语的词典提取和翻译质量评估
CN105760372A (zh) * 2014-12-15 2016-07-13 中兴通讯股份有限公司 面向对象模型数据的转换方法及转换装置
CN107305549A (zh) * 2016-04-18 2017-10-31 北京搜狗科技发展有限公司 语言数据处理方法、装置以及用于语言数据处理的装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
US7680780B2 (en) * 2007-04-06 2010-03-16 International Business Machines Corporation Techniques for processing data from a multilingual database
US8775155B2 (en) * 2010-10-25 2014-07-08 Xerox Corporation Machine translation using overlapping biphrase alignments and sampling
US8311973B1 (en) * 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers
JP6136142B2 (ja) * 2012-08-24 2017-05-31 富士通株式会社 文字列置換装置、方法及びプログラム
CN104391842A (zh) * 2014-12-18 2015-03-04 苏州大学 一种翻译模型构建方法和系统
US10091140B2 (en) * 2015-05-31 2018-10-02 Microsoft Technology Licensing, Llc Context-sensitive generation of conversational responses
CN107229616B (zh) * 2016-03-25 2020-10-16 阿里巴巴集团控股有限公司 语言识别方法、装置及系统
CN105893574B (zh) * 2016-03-31 2020-05-26 联想(北京)有限公司 一种数据处理方法及电子设备
CN110663049B (zh) * 2017-04-28 2023-12-26 谷歌有限责任公司 神经网络优化器搜索
US20180329884A1 (en) * 2017-05-12 2018-11-15 Rsvp Technologies Inc. Neural contextual conversation learning
KR20190044878A (ko) * 2017-10-23 2019-05-02 삼성전자주식회사 뉴럴 네트워크에서 파라미터를 처리하는 방법 및 장치
CN108427671B (zh) * 2018-01-25 2021-06-25 腾讯科技(深圳)有限公司 信息转换方法和装置、存储介质及电子装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131690A (zh) * 2006-08-21 2008-02-27 富士施乐株式会社 简体汉字和繁体汉字相互转换方法及其系统
US8868430B2 (en) * 2009-01-16 2014-10-21 Sony Corporation Methods, devices, and computer program products for providing real-time language translation capabilities between communication terminals
US20140350914A1 (en) * 2012-01-27 2014-11-27 Nec Corporation Term translation acquisition method and term translation acquisition apparatus
CN104508658A (zh) * 2012-07-13 2015-04-08 微软公司 基于短语的词典提取和翻译质量评估
CN105760372A (zh) * 2014-12-15 2016-07-13 中兴通讯股份有限公司 面向对象模型数据的转换方法及转换装置
CN107305549A (zh) * 2016-04-18 2017-10-31 北京搜狗科技发展有限公司 语言数据处理方法、装置以及用于语言数据处理的装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐瑾: "汉英翻译中的认知映射和还原映射", 《考试周刊》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019144906A1 (zh) * 2018-01-25 2019-08-01 腾讯科技(深圳)有限公司 信息转换方法和装置、存储介质及电子装置
US11880667B2 (en) 2018-01-25 2024-01-23 Tencent Technology (Shenzhen) Company Limited Information conversion method and apparatus, storage medium, and electronic apparatus
CN114257658A (zh) * 2021-12-24 2022-03-29 珠海格力电器股份有限公司 通信协议转换配置方法、通信协议转换方法和相关设备

Also Published As

Publication number Publication date
CN108427671B (zh) 2021-06-25
US20200285816A1 (en) 2020-09-10
US11880667B2 (en) 2024-01-23
WO2019144906A1 (zh) 2019-08-01

Similar Documents

Publication Publication Date Title
CN110364142B (zh) 语音音素识别方法和装置、存储介质及电子装置
CN107832432A (zh) 一种搜索结果排序方法、装置、服务器和存储介质
CN108711420A (zh) 多语言混杂模型建立、数据获取方法及装置、电子设备
CN110335592B (zh) 语音音素识别方法和装置、存储介质及电子装置
CN106354701A (zh) 汉字处理方法和装置
CN111027403A (zh) 手势估计方法、装置、设备及计算机可读存储介质
CN106601254A (zh) 信息输入方法和装置及计算设备
CN105929980A (zh) 用于信息输入的方法和装置
CN107479400A (zh) 家电设备的控制方法、装置、家电设备及可读存储介质
CN107122295A (zh) 测试用例脚本的生成方法和装置
CN109697091A (zh) 页面的处理方法、装置、存储介质和电子装置
CN107993651A (zh) 一种语音识别方法、装置、电子设备及存储介质
CN108427671A (zh) 信息转换方法和装置、存储介质及电子装置
CN108388549A (zh) 信息转换方法、装置、存储介质和电子装置
CN110245224A (zh) 对话生成方法及装置
CN112434746B (zh) 基于层次化迁移学习的预标注方法及其相关设备
CN110148413A (zh) 语音评测方法及相关装置
CN108737487A (zh) 数据同步方法和装置、存储介质及电子装置
CN111274813B (zh) 语言序列标注方法、装置存储介质及计算机设备
CN106776277A (zh) 一种跨进程测试的方法、装置及电子设备
CN110674268B (zh) 人机对话方法及相关设备
CN109992178A (zh) 目标组件的控制方法、装置、存储介质及电子装置
CN104007896B (zh) 一种信息处理方法及电子设备
KR20120004719A (ko) 그룹학습 지원 방법, 시스템, 장치 및 단말기
CN107644022A (zh) 一种地理位置搜索方法、移动终端及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant