CN111506717B - 问题答复方法、装置、设备及存储介质 - Google Patents

问题答复方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111506717B
CN111506717B CN202010297845.7A CN202010297845A CN111506717B CN 111506717 B CN111506717 B CN 111506717B CN 202010297845 A CN202010297845 A CN 202010297845A CN 111506717 B CN111506717 B CN 111506717B
Authority
CN
China
Prior art keywords
text
question
reply
expression
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010297845.7A
Other languages
English (en)
Other versions
CN111506717A (zh
Inventor
邵建智
张荣升
张林箭
张聪
毛晓曦
范长杰
胡志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202010297845.7A priority Critical patent/CN111506717B/zh
Publication of CN111506717A publication Critical patent/CN111506717A/zh
Application granted granted Critical
Publication of CN111506717B publication Critical patent/CN111506717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种问题答复方法、装置、设备及存储介质,涉及语言处理技术领域。该方法包括:根据输入的问题文本,采用预先训练的问答模型确定所述问题文本对应的回复文本;根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像,其中,所述表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系;将所述表情图像作为所述问题文本对应的答复结果进行回复。相对于现有技术,避免了无法通过语义的问答来回复表情图像,造成用户使用聊天机器人聊天的趣味性不高的问题。

Description

问题答复方法、装置、设备及存储介质
技术领域
本申请涉及语言处理技术领域,具体而言,涉及一种问题答复方法、装置、设备及存储介质。
背景技术
随着互联网的发展,用户聊天的方式也发生了很大的改变,出现了可以自动与用户聊天的聊天机器人,聊天机器人是自然语言处理(Natural Language Process,NLP)技术应用的重要领域,机器人通过信息的交互,与用户进行聊天。
现实生活中的信息交互的方式非常多,除了文本外,图片、视频、音频等都是信息交互的重要方式。其中,图片是一个典型的信息交互渠道,在聊天中,用户可以表情图像为载体发送和接收图片,使聊天过程变得简洁有趣。在聊天机器人产品中,机器人接收到用户的输入文本或语音,通过内部处理后,向用户返回对应的输出文本或表情图像。
但是目前市面上的聊天机器人产品对于表情图像的应用,主要是通过对用户输入信息的语义匹配来回复表情图像,无法通过语义的问答来回复表情图像,造成用户使用聊天机器人聊天的趣味性不高。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种问题答复方法、装置、设备及存储介质,以解决现有技术中无法通过语义的问答来回复表情图像,造成用户使用聊天机器人聊天的趣味性不高的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请一实施例提供了一种问题答复方法,所述方法包括:
根据输入的问题文本,采用预先训练的问答模型,确定所述问题文本对应的回复文本;
根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像;其中,所述表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系;
将所述表情图像作为所述问题文本对应的答复结果进行回复。
可选地,所述根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像,包括:
根据所述回复文本,在所述预设的表情搜索引擎中进行搜索,确定与所述回复文本的语义相似度最高的文本描述为目标文本描述,并将所述目标文本描述对应的表情图像作为所述回复文本对应的表情图像。
可选地,所述将所述表情图像作为所述问题文本对应的答复结果进行回复,包括:
以预设概率将所述表情图像作为所述问题文本对应的答复结果进行回复。
可选地,所述根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像之前,所述方法还包括:
根据至少一个表情文本对中的文本描述,建立倒排索引,并基于所述倒排索引构建所述表情搜索引擎;其中,每个表情文本对包括:一个表情图像和所述表情图像对应的文本描述。
可选地,所述根据输入的问题文本,采用预先训练的问答模型,确定所述问题文本对应的回复文本之前,所述方法还包括:
根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对;其中,每个所述问题回复对包括:一个问题文本和所述问题文本对应的回复文本;
根据所述多个目标问题回复对进行模型训练,得到所述问答模型。
可选地,所述根据所述多个目标问题回复对进行模型训练,得到所述问答模型,包括:
根据每个所述目标问题回复对,采用所述问答模型,确定所述目标问题回复对中回复文本的答中概率;
根据所述目标问题回复对中回复文本的答中概率,确定所述问答模型的损失参数;
根据所述损失参数,对所述问答模型的参数进行优化,直至满足预设的迭代停止条件。
可选地,所述根据每个所述目标问题回复对,采用所述问答模型,确定所述目标问题回复对中回复文本的答中概率,包括:
采用所述问答模型中的编码模块,对所述每个目标问题回复对中的问题文本进行编码处理,得到问题编码信息;
采用所述问答模型中的解码模块,对所述问题编码信息以及所述每个目标问题回复对的回复文本进行解码,得到所述每个目标问题回复对的回复文本的答中概率。
可选地,所述根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对,包括:
确定所述表情图像的文本描述与各所述问题回复对中回复文本的语义相似度;
从多个所述问题回复对中,确定与所述表情图像的文本描述的语义相似度大于或等于预设相似度的回复文本所在的问题回复对,为所述表情图像对应的目标问题回复对。
第二方面,本申请另一实施例提供了一种问题答复装置,所述装置包括:确定模块和回复模块,其中:
所述确定模块,用于根据输入的问题文本,采用预先训练的问答模型,确定所述问题文本对应的回复文本;
所述确定模块,还用于根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像;其中,所述表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系;
所述回复模块,用于将所述表情图像作为所述问题文本对应的答复结果进行回复。
可选地,所述确定模块,还用于根据所述回复文本,在所述预设的表情搜索引擎中进行搜索,确定与所述回复文本的语义相似度最高的文本描述为目标文本描述,并将所述目标文本描述对应的表情图像作为所述回复文本对应的表情图像。
可选地,所述回复模块,还用于以预设概率将所述表情图像作为所述问题文本对应的答复结果进行回复。
可选地,所述装置还包括:建立模块,用于根据至少一个表情文本对中的文本描述,建立倒排索引,并基于所述倒排索引构建所述表情搜索引擎;其中,每个表情文本对包括:一个表情图像和所述表情图像对应的文本描述。
可选地,所述装置还包括:训练模块;
所述确定模块,还用于根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对;其中,每个所述问题回复对包括:一个问题文本和所述问题文本对应的回复文本;
所述训练模块,用于根据所述多个目标问题回复对进行模型训练,得到所述问答模型。
可选地,所述装置还包括:优化模块;
所述确定模块,还用于根据每个所述目标问题回复对,采用所述问答模型,确定所述目标问题回复对中回复文本的答中概率;
所述确定模块,还用于根据所述目标问题回复对中回复文本的答中概率,确定所述问答模型的损失参数;
所述优化模块,用于根据所述损失参数,对所述问答模型的参数进行优化,直至满足预设的迭代停止条件。
可选地,所述装置还包括:编码模块和解码模块,其中:
所述编码模块,用于对所述每个目标问题回复对中的问题文本进行编码处理,得到问题编码信息;
所述解码模块,用于对所述问题编码信息以及所述每个目标问题回复对的回复文本进行解码,得到所述每个目标问题回复对的回复文本的答中概率。
可选地,所述确定模块,还用于确定所述表情图像的文本描述与各所述问题回复对中回复文本的语义相似度;
所述确定模块,还用于从多个所述问题回复对中,确定与所述表情图像的文本描述的语义相似度大于或等于预设相似度的回复文本所在的问题回复对,为所述表情图像对应的目标问题回复对。
第三方面,本申请另一实施例提供了一种问题答复设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当问题答复设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面任一所述方法的步骤。
第四方面,本申请另一实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述方法的步骤。
本申请的有益效果是:采用本申请提供的问题答复方法,预先训练的问答模型可以根据用户输入的问题文本确定对应的回复文本,并根据预设的表情搜索引擎确定该回复文本对应的表情图像,将表情图像作为该问题文本对应的答复结果进行回复,这样的问题答复方法使得可以根据用户输入的问题文本,确定对应的表情图像作为答复结果进行回复,提高了用户使用的趣味性,从而提高用户体验。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的问题答复方法的流程示意图;
图2为本申请另一实施例提供的问题答复方法的流程示意图;
图3为本申请另一实施例提供的问题答复方法的流程示意图;
图4为本申请另一实施例提供的问题答复方法的流程示意图;
图5为本申请另一实施例提供的问题答复方法的流程示意图;
图6为本申请一实施例提供的问题答复装置的结构示意图;
图7为本申请另一实施例提供的问题答复装置的结构示意图;
图8为本申请另一实施例提供的问题答复装置的结构示意图;
图9为本申请另一实施例提供的问题答复装置的结构示意图;
图10为本申请另一实施例提供的问题答复装置的结构示意图;
图11为本申请一实施例提供的问题答复设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
下文所提供的各问题答复方法可由问题答复设备执行,该问题答复设备的产品形态可以为具有语言处理功能的终端设备,例如:手机、平板、笔记本电脑、具有显示屏的机器人、智能显示屏等,还可以为具有语言处理功能的服务器。该语言处理功能可通过安装并运行预设的语言处理应用实现。在本申请的下述实施例中,均以执行主体为终端设备为例进行说明,但是具体可以根据用户需要设计,本申请在此不做任何限制。
无论该问题答复设备的产品形态为何,为实现本申请下述各实施例所提供的问题答复方法,其可安装有聊天机器人的程序,可通过运行该聊天机器人程序,实现与虚拟机器人的线上聊天,该聊天机器人的程序可以为游戏应用程序,线上交易应用程序等应用程序中的一个子功能插件。
如下结合多个具体的应用示例,对本申请实施例所提供的问题答复方法进行解释说明。图1为本申请一实施例提供的一种问题答复方法的流程示意图,如图1所示,该方法可包括:
S101:根据输入的问题文本,采用预先训练的问答模型,确定问题文本对应的回复文本。
可选地,问题文本为用户在打开预设的聊天界面后,通过聊天界面上以文字形式输入的问题文本;也可以为通过语音输入的问题语音,由终端设备对该问题语音进行转换处理后得到的问题文本,具体问题文本的输入方式并不以上述实施例给出的为限。
该预先训练的问答模型可以为基于多组训练数据进行训练得到的模型,每组训练数据包括一个问题文本,以及对应的回复文本。也就是说,该问答模型中包括了问答文本和回复文本的对应关系,因此,将该输入的问题文本,输入该问答模型,便可获取该问答模型所输出的该问题文本对应的回复文本。
S102:根据回复文本,在预设的表情搜索引擎中进行搜索,确定回复文本对应的表情图像。
其中,表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系。每个文字描述为一个表情图像的文字描述,其可用于表示该表情图像的语义。
在本申请的一个实施例中,确定回复文本对应的表情图像的过程可以如下:在表情搜索引擎中确定回复文本对应的文字描述,根据映射关系获取该文字描述对应的表情图像,并将该表情图像作为回复文本对应的表情图像。回复文本对应的文字描述例如可以为与该回复文本的语义最近的文字描述。
S103:将表情图像作为问题文本对应的答复结果进行回复。
可选地,将表情图像作为问题文本对应的答复结果返回预设的聊天界面进行展示。
需要指出的是,本申请所涉及的表情图像可以为图片、短视频形式、动画形式或者截图形式等等,其也可称为表情包。
采用本申请提供的问题答复方法,预先训练的问答模型可以根据用户输入的问题文本确定对应的回复文本,并根据预设的表情搜索引擎确定该回复文本对应的表情图像,将表情图像作为该问题文本对应的答复结果进行回复,这样的问题答复方法可以根据用户输入的问题文本,确定对应的表情图像作为答复结果进行回复,提高了用户使用的趣味性,从而提高用户体验。
可选地,在本申请的一个实施例中,S102可包括:根据回复文本,在预设的表情搜索引擎中进行搜索,确定与回复文本的语义相似度最高的文本描述为目标文本描述,并将目标文本描述对应的表情图像作为回复文本对应的表情图像。
在一些可能的实现方式中,可通过计算该回复文本以及该表情搜索请求中每个文本描述之间的特征距离,并根据该回复文本与各文本描述之间的特征距离,确定该回复文本与该各文本描述之间的语义相似度,继而根据该回复文本与该各文本描述之间的语义相似度,从该图像搜索引擎中的多个文本描述中确定与回复文本的语义相似度最高的文本描述为目标文本描述。
其中,该回复文本以及文本描述之间的特征距离越小,可用于表示该回复文本与该文本描述的语义相似度越高,反之,该回复文本以及文本描述之间的特征距离越大,可用于表示该回复文本与该文本描述的语义相似度越小。
可选地,在本申请的一个实施例中,若存在多个与回复文本的语义相似度相同,且均为最高的文本描述,则随机获取其中的一个文本描述作为目标文本描述;或根据获取各文本描述的先后顺序,选择第一个获取的文本描述作为目标文本描述,具体可以根据用户需要设计,并不以上述实施例给出的为限。
可选地,在本申请的一个实施例中,S103可包括:以预设概率将表情图像作为问题文本对应的答复结果进行回复。
在应用示例中,可以预设概率(需要说明的:预设概率,可以是预先设置好的固定概率值,也可以是根据预设算法随机生成的概率值),确定采用该回复文本,还是该回复文本对应的表情图像作为该问题文本对应的答复结果进行回复。也就是说,在该实施例提供的方法中,针对同一问题文本,其答复结果可能是回复文本,也可能是该回复文本对应的表情图像,而并非固定的回复结果。
可选地,在本申请的一个实施例中,可以在S102之前,就以预设概率确定此次问答是否要采用表情图像作为答复结果,若确定结果为是,则进行后续步骤,若确定结果为否,则直接返回问题文本对应的回复文本至预设的聊天界面,使得仅在需要以表情图像作为答复结果的时候,才会根据回复文本确定对应的表情图像,从而达到减少工作量的效果,但具体应用方式可根据用户需要设置,并不以上述实施例给出的为限。
这样的设置方式使得用户不是每次输入的问题都会收到表情图像回复,而是以一定的概率收到表情图像回复,使得用户的使用过程中增加了惊喜感,从而增加了用户的使用粘性。
可选的,在上述实施例的基础上,本申请实施例还可提供一种问题答复方法,如下结合附图进行说明。图2为本申请另一实施例提供的问题答复方法的流程示意图,如图2所示,S101之前,该方法还包括:
S104:根据至少一个表情文本对中的文本描述,建立倒排索引,并基于倒排索引构建表情搜索引擎。
其中,每个表情文本对包括:一个表情图像和表情图像对应的文本描述。
可选地,在本申请的一个实施例中,表情搜索引擎的建立方式可以为:获取多个表情图像,同时获取每个表情图像对应的文字描述,并对获取到的各表情图像和各文字描述进行整理,建立各文字描述与表情图像之间的映射关系,并对文字描述建立倒排索引,基于倒排索引构建表情搜索引擎。
如上所获取的多个表情图像例如可以是从网络爬取的方式获取的标签图像。在一些可能的示例中,在从爬取的表情图像中确定图像质量大于或等于预设质量的表情图像即高质量表情图像,继而该些图像质量大于或等于预设质量的表情图像,以及其对应的文字描述构建该表情搜索引擎。
本实施例中,通过建立表情搜索引擎,实现了表情图像和对应的文本描述之前的关联,从而表情搜索引擎可以在获取问题文本后,先确定对应的文本描述,再根据文本描述,确定对应的表情图像。
可选的,在上述实施例的基础上,本申请实施例还可提供一种问题答复方法,如下结合附图进行说明。图3为本申请另一实施例提供的问题答复方法的流程示意图,如图3所示,S101之前,该方法还包括:
S105:根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对。
其中,每个问题回复对包括:一个问题文本和问题文本对应的回复文本。
通过该多个表情图像的文本描述,从该多个问题回复对中确定该多个目标问题回复对,可使得建立问答模型所采用的目标问题回复对,为与表情图像的文本描述相关度较高的一些问题回复对,可有效保证后续确定的表情图像与问题文本更对应,存在语义问答关系,有效保证回复结果的准确度。
S106:根据多个目标问题回复对进行模型训练,得到问答模型。
其中,根据多个目标问题回复对作为模型训练的样本,对问答模型进行训练。训练后的问答模型可以根据用户输入的问题得到对应的回复文本。
根据多个表情图像的文本描述和多个问题回复对,确定的多个目标问题回复对,使得多个目标问题回复对均是与多个表情图像的文字描述相关的问题回复对,从而为后续根据用户输入的问题文本返回对应的表情图像做准备。
可选的,在上述实施例的基础上,本申请实施例还可提供一种问题答复方法,如下结合附图进行说明。图4为本申请另一实施例提供的问题答复方法的流程示意图,如图4所示,S106可包括:
S107:根据每个目标问题回复对,采用问答模型,确定目标问题回复对中回复文本的答中概率。
可选地,在本申请的一个实施例中,S106可包括:采用问答模型中的编码模块,对每个目标问题回复对中的问题文本进行编码处理,得到问题编码信息;采用问答模型中的解码模块,对问题编码信息以及每个目标问题回复对的回复文本进行解码,得到每个目标问题回复对的回复文本的答中概率。
可选地,在本申请的一个实施例中,编码模块和解码模块均是基于整体架构的预训练语言模型编码结构实现的,结构共12层。区别在于解码模块只能以自回归的方式预测每个词,即只能使用回答中当前预测词之前的信息,而无法使用未来信息。
S108:根据目标问题回复对中回复文本的答中概率,确定问答模型的损失参数。
其中,根据每个目标问题回复对中回复文本的答中概率,计算交叉熵损失,计算结果即为损失参数。
S109:根据损失参数,对问答模型的参数进行优化,直至满足预设的迭代停止条件。
其中,根据损失函数优化编码模块和解码模块的参数,并持续迭代,直至损失参数不再下降时,则停止训练,并获取当前问答模型为训练好的问答模型。
通过迭代的方式对问答模型进行优化,使得优化后的问答模型其回复文本的答中概率更高,进一步提高用户使用体验,避免答非所问的情况。
可选的,在上述实施例的基础上,本申请实施例还可提供一种问题答复方法,如下结合附图进行说明。图5为本申请另一实施例提供的问题答复方法的流程示意图,如图5所示,S105可包括:
S110:确定表情图像的文本描述与各问题回复对中回复文本的语义相似度。
可选地,在本申请的一个实施例中,可以选择BM25算法计算语义相似度,但计算语义相似度的算法可以根据用户需要设计,并不以上述实施例给出的算法为限。
S111:从多个问题回复对中,确定与表情图像的文本描述的语义相似度大于或等于预设相似度的回复文本所在的问题回复对,为表情图像对应的目标问题回复对。
可选地,仍以采用BM25算法计算语义相似度,为例进行说明,根据BM25算法,确定表情图像的文本描述与各问题回复对中回复文本的相关性得分,并选择相关性得分大于或等于预设相似度的回复文本所在的问题回复对,为表情图像对应的目标问题回复对。
通过表情图像的文本描述与各问题回复中答复文本的语义相似度,来确定与表情图像对应的目标问题回复对,从而使得根据问题文本确定的表情图像的文本描述之间的相关性更高,从而使得后续回复的表情图像更符合用户输入的问题文本,保证了回复的准确性。
采用本申请提供的问题答复方法,预先训练的问答模型可以根据用户输入的问题文本确定对应的回复文本,并根据预设的表情搜索引擎确定该回复文本对应的表情图像,并将表情图像作为该问题文本对应的答复结果,以一定的概率进行回复,这样的问题答复方法使得可以根据用户输入的问题文本,确定对应的表情图像作为答复结果进行回复,提高了用户使用的趣味性和惊喜感,从而提高用户体验和使用粘度。
下述结合附图对本申请所提供的问题答复装置进行解释说明,该问题答复装置可执行上述图1-图5任一问题答复方法,其具体实现以及有益效果参照上述,如下不再赘述。
图6为本申请一实施例提供的问题答复装置的结构示意图,如图6所示,该装置包括:确定模块201和回复模块202,其中:
确定模块201,用于根据输入的问题文本,采用预先训练的问答模型,确定问题文本对应的回复文本。
确定模块201,还用于根据回复文本,在预设的表情搜索引擎中进行搜索,确定回复文本对应的表情图像;其中,表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系。
回复模块202,用于将表情图像作为问题文本对应的答复结果进行回复。
可选地,确定模块201,还用于根据回复文本,在预设的表情搜索引擎中进行搜索,确定与回复文本的语义相似度最高的文本描述为目标文本描述,并将目标文本描述对应的表情图像作为回复文本对应的表情图像。
可选地,回复模块202,还用于以预设概率将表情图像作为问题文本对应的答复结果进行回复。
图7为本申请一实施例提供的问题答复装置的结构示意图,如图7所示,该装置还包括:建立模块203,用于根据至少一个表情文本对中的文本描述,建立倒排索引,并基于倒排索引构建表情搜索引擎;其中,每个表情文本对包括:一个表情图像和表情图像对应的文本描述。
图8为本申请一实施例提供的问题答复装置的结构示意图,如图8所示,该装置还包括:训练模块204;
确定模块201,还用于根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对;其中,每个问题回复对包括:一个问题文本和问题文本对应的回复文本。
训练模块204,用于根据多个目标问题回复对进行模型训练,得到问答模型。
图9为本申请一实施例提供的问题答复装置的结构示意图,如图9所示,该装置还包括:优化模块205;
确定模块201,还用于根据每个目标问题回复对,采用问答模型,确定目标问题回复对中回复文本的答中概率。
确定模块201,还用于根据目标问题回复对中回复文本的答中概率,确定问答模型的损失参数。
优化模块205,用于根据损失参数,对问答模型的参数进行优化,直至满足预设的迭代停止条件。
图10为本申请一实施例提供的问题答复装置的结构示意图,如图10所示,该装置还包括:编码模块206和解码模块207,其中:
编码模块206,用于对每个目标问题回复对中的问题文本进行编码处理,得到问题编码信息;
解码模块207,用于对问题编码信息以及每个目标问题回复对的回复文本进行解码,得到每个目标问题回复对的回复文本的答中概率。
可选地,确定模块201,还用于确定表情图像的文本描述与各问题回复对中回复文本的语义相似度。
确定模块201,还用于从多个问题回复对中,确定与表情图像的文本描述的语义相似度大于或等于预设相似度的回复文本所在的问题回复对,为表情图像对应的目标问题回复对。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图11为本申请一实施例提供的问题答复设备的结构示意图,该问题答复设备可以集成于终端设备或者终端设备的芯片,也可以为服务器,或者服务器的芯片。
该问题答复设备包括:处理器501、存储介质502和总线503。
处理器501用于存储程序,处理器501调用存储介质502存储的程序,以执行上述图1-图5对应的方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种程序产品,例如存储介质,该存储介质上存储有计算机程序,包括程序,该程序在被处理器运行时执行上述方法对应的实施例。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (8)

1.一种问题答复方法,其特征在于,所述方法包括:
根据输入的问题文本,采用预先训练的问答模型,确定所述问题文本对应的回复文本;
根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像;其中,所述表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系;
将所述表情图像作为所述问题文本对应的答复结果进行回复;
所述将所述表情图像作为所述问题文本对应的答复结果进行回复,包括:
以预设概率将所述表情图像作为所述问题文本对应的答复结果进行回复;
所述根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像之前,所述方法还包括:
根据至少一个表情文本对中的文本描述,建立倒排索引,并基于所述倒排索引构建所述表情搜索引擎;其中,每个表情文本对包括:一个表情图像和所述表情图像对应的文本描述;
所述根据输入的问题文本,采用预先训练的问答模型,确定所述问题文本对应的回复文本之前,所述方法还包括:
根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对;其中,每个所述问题回复对包括:一个问题文本和所述问题文本对应的回复文本;
根据所述多个目标问题回复对进行模型训练,得到所述问答模型。
2.如权利要求1所述的方法,其特征在于,所述根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像,包括:
根据所述回复文本,在所述预设的表情搜索引擎中进行搜索,确定与所述回复文本的语义相似度最高的文本描述为目标文本描述,并将所述目标文本描述对应的表情图像作为所述回复文本对应的表情图像。
3.如权利要求1所述的方法,其特征在于,所述根据所述多个目标问题回复对进行模型训练,得到所述问答模型,包括:
根据每个所述目标问题回复对,采用所述问答模型,确定所述目标问题回复对中回复文本的答中概率;
根据所述目标问题回复对中回复文本的答中概率,确定所述问答模型的损失参数;
根据所述损失参数,对所述问答模型的参数进行优化,直至满足预设的迭代停止条件。
4.如权利要求3所述的方法,其特征在于,所述根据每个所述目标问题回复对,采用所述问答模型,确定所述目标问题回复对中回复文本的答中概率,包括:
采用所述问答模型中的编码模块,对每个所述目标问题回复对中的问题文本进行编码处理,得到问题编码信息;
采用所述问答模型中的解码模块,对所述问题编码信息以及每个所述目标问题回复对的回复文本进行解码,得到每个所述目标问题回复对的回复文本的答中概率。
5.如权利要求1所述的方法,其特征在于,所述根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对,包括:
确定所述表情图像的文本描述与各所述问题回复对中回复文本的语义相似度;
从多个所述问题回复对中,确定与所述表情图像的文本描述的语义相似度大于或等于预设相似度的回复文本所在的问题回复对,为所述表情图像对应的目标问题回复对。
6.一种问题答复装置,其特征在于,所述装置包括:确定模块和回复模块,其中:
所述确定模块,用于根据输入的问题文本,采用预先训练的问答模型,确定所述问题文本对应的回复文本;
所述确定模块,还用于根据所述回复文本,在预设的表情搜索引擎中进行搜索,确定所述回复文本对应的表情图像;其中,所述表情搜索引擎包括:多个文字描述与多个表情图像之间的映射关系;
所述回复模块,用于将所述表情图像作为所述问题文本对应的答复结果进行回复;
所述回复模块,还用于以预设概率将所述表情图像作为所述问题文本对应的答复结果进行回复;
所述装置还包括:建立模块,用于根据至少一个表情文本对中的文本描述,建立倒排索引,并基于所述倒排索引构建所述表情搜索引擎;其中,每个表情文本对包括:一个表情图像和所述表情图像对应的文本描述;
所述装置还包括:训练模块;
所述确定模块,还用于根据多个表情图像的文本描述和多个问题回复对,确定多个目标问题回复对;其中,每个所述问题回复对包括:一个问题文本和所述问题文本对应的回复文本;
所述训练模块,用于根据所述多个目标问题回复对进行模型训练,得到所述问答模型。
7.一种问题答复设备,其特征在于,所述设备包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当问题答复设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行上述权利要求1-5任一项所述的方法。
8.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1-5任一项所述的方法。
CN202010297845.7A 2020-04-15 2020-04-15 问题答复方法、装置、设备及存储介质 Active CN111506717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010297845.7A CN111506717B (zh) 2020-04-15 2020-04-15 问题答复方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010297845.7A CN111506717B (zh) 2020-04-15 2020-04-15 问题答复方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111506717A CN111506717A (zh) 2020-08-07
CN111506717B true CN111506717B (zh) 2024-02-09

Family

ID=71869382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010297845.7A Active CN111506717B (zh) 2020-04-15 2020-04-15 问题答复方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111506717B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113934825B (zh) * 2021-12-21 2022-03-08 北京云迹科技有限公司 一种问题回答方法、装置和电子设备
CN114637833A (zh) * 2022-03-24 2022-06-17 支付宝(杭州)信息技术有限公司 一种人机交互方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063164A (zh) * 2018-08-15 2018-12-21 百卓网络科技有限公司 一种基于深度学习的智能问答方法
CN109814730A (zh) * 2017-11-20 2019-05-28 北京搜狗科技发展有限公司 输入方法和装置、用于输入的装置
CN109831572A (zh) * 2018-12-14 2019-05-31 深圳壹账通智能科技有限公司 聊天图片控制方法、装置、计算机设备及存储介质
US10489474B1 (en) * 2019-04-30 2019-11-26 Capital One Services, Llc Techniques to leverage machine learning for search engine optimization
CN110597963A (zh) * 2019-09-23 2019-12-20 腾讯科技(深圳)有限公司 表情问答库的构建方法、表情搜索方法、装置及存储介质
CN110895558A (zh) * 2018-08-23 2020-03-20 北京搜狗科技发展有限公司 一种对话回复的方法及相关装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109814730A (zh) * 2017-11-20 2019-05-28 北京搜狗科技发展有限公司 输入方法和装置、用于输入的装置
CN109063164A (zh) * 2018-08-15 2018-12-21 百卓网络科技有限公司 一种基于深度学习的智能问答方法
CN110895558A (zh) * 2018-08-23 2020-03-20 北京搜狗科技发展有限公司 一种对话回复的方法及相关装置
CN109831572A (zh) * 2018-12-14 2019-05-31 深圳壹账通智能科技有限公司 聊天图片控制方法、装置、计算机设备及存储介质
US10489474B1 (en) * 2019-04-30 2019-11-26 Capital One Services, Llc Techniques to leverage machine learning for search engine optimization
CN110597963A (zh) * 2019-09-23 2019-12-20 腾讯科技(深圳)有限公司 表情问答库的构建方法、表情搜索方法、装置及存储介质

Also Published As

Publication number Publication date
CN111506717A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN108304439B (zh) 一种语义模型优化方法、装置及智能设备、存储介质
CN109313650B (zh) 在自动聊天中生成响应
CN112487173B (zh) 人机对话方法、设备和存储介质
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
JP2023535709A (ja) 言語表現モデルシステム、事前訓練方法、装置、機器及び媒体
CN110163121B (zh) 图像处理方法、装置、计算机设备及存储介质
CN110166802B (zh) 弹幕处理方法、装置及存储介质
CN112131368B (zh) 对话生成方法、装置、电子设备及存储介质
CN108959388B (zh) 信息生成方法及装置
CN109978139B (zh) 图片自动生成描述的方法、系统、电子装置及存储介质
EP3563302A1 (en) Processing sequential data using recurrent neural networks
CN113407851B (zh) 基于双塔模型的确定推荐信息的方法、装置、设备和介质
CN111506717B (zh) 问题答复方法、装置、设备及存储介质
CN115309877A (zh) 对话生成方法、对话模型训练方法及装置
CN111193657A (zh) 聊天表情回复方法、装置及存储介质
CN111767394A (zh) 一种基于人工智能专家系统的摘要提取方法及装置
CN114840734A (zh) 多模态表示模型的训练方法、跨模态检索方法及装置
CN113360683A (zh) 训练跨模态检索模型的方法以及跨模态检索方法和装置
CN112486947A (zh) 一种知识库构建方法、装置、电子设备及可读存储介质
CN117114063A (zh) 用于训练生成式大语言模型和用于处理图像任务的方法
CN116958738A (zh) 图片识别模型的训练方法和装置、存储介质及电子设备
CN108509059B (zh) 一种信息处理方法、电子设备和计算机存储介质
CN116521832A (zh) 对话交互方法、装置及系统、电子设备和存储介质
CN116775815B (zh) 对话数据的处理方法、装置、电子设备及存储介质
CN114970666B (zh) 一种口语处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant