CN114416939A - 智能问答方法、装置、设备及存储介质 - Google Patents

智能问答方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114416939A
CN114416939A CN202111624590.1A CN202111624590A CN114416939A CN 114416939 A CN114416939 A CN 114416939A CN 202111624590 A CN202111624590 A CN 202111624590A CN 114416939 A CN114416939 A CN 114416939A
Authority
CN
China
Prior art keywords
user
question
entity
knowledge base
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111624590.1A
Other languages
English (en)
Inventor
万宏志
罗燕
陈来龙
曹明新
刘浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ruihang Technology Co ltd
Original Assignee
Guangzhou Ruihang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ruihang Technology Co ltd filed Critical Guangzhou Ruihang Technology Co ltd
Priority to CN202111624590.1A priority Critical patent/CN114416939A/zh
Publication of CN114416939A publication Critical patent/CN114416939A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Abstract

本发明涉及人工智能技术,揭露了一种智能问答方法,包括:根据用户问题在知识库中检索;能检索到用户问题时,从知识库中提取用户问题对应的答案;检索不到用户问题时,对用户问题进行实体识别;当识别到的第一实体为单个时,从知识图谱数据库中提取第一实体的属性标签,并根据属性标签、用户问题获取第二实体,将第二实体作为第一实体对应的答案;当第一实体为多个时,获取多个第一实体间的属性标签,根据第一实体间的属性标签及用户问题分析得到对应的答案。本发明还提出一种智能问答装置、电子设备以及存储介质。本发明可以提高问答识别结果的准确性。

Description

智能问答方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种智能问答方法、装置、电子设备及计算机可读存储介质。
背景技术
智能问答是一种针对自然语言处理的新型信息检索系统,其是将积累的无序预料信息进行科学和有序的整理,建立基于知识库的智能问答模型。现有技术中,智能问答通常会进行语义匹配,即将用户问题与知识库中的问题进行匹配,从而确定用户问题是什么,再得到用户问题对应的答案。但是,在实际使用中发现,仅仅进行语义匹配会使得语义识别准确率较低,导致问答识别时,用户问题识别不准,回复的答案也不准确。
发明内容
本发明提供一种智能问答方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决问答识别结果的准确性较低的问题。
为实现上述目的,本发明提供的一种智能问答方法,包括:
从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索;
若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
若在所述知识库中检索不到所述用户问题,则对所述用户问题进行实体识别,得到所述用户问题的第一实体;
若所述第一实体为单个,则从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
若所述第一实体为多个,则从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
可选地,所述从用户输入的信息中提取用户问题,包括:
根据所述用户输入的信息的消息头类型判断所述用户输入的信息为文字还是图片;
若所述消息头为文本标识,则判定所述用户输入的信息为文字,并将所述文字作为用户问题;
若所述消息头为图片标识,则判定所述用户输入的信息为图片,对所述图片进行OCR文本识别得到文本,并将所述文本中的文字作为用户问题。
可选地,所述将所述用户问题在预设的知识库中进行检索,包括:
提取所述用户问题的文本语义并获取所述知识库中每一个现有问题的文本语义;
根据所述用户问题的文本语义和所述知识库中现有问题的文本语义进行相似度检测;
判断相似度检测结果中最大相似度是否大于预设阈值;
若所述最大相似度大于预设阈值,则确定所述知识库中能够检索到所述用户问题,并确定所述相似度最大的文本语义对应的现有问题为所述用户问题;
若所述最大相似度小于或等于预设阈值,则确定所述知识库中检索不到所述用户问题。
可选地,所述对所述用户问题进行实体识别,得到所述用户问题的第一实体,包括:
提取所述用户问题中的关键词,并根据所述关键词在预设的知识图谱数据库中进行相似检索;
将检索到相似的关键词作为所述用户问题的第一实体。
可选地,所述根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案,包括:
对所述用户问题进行意图识别,计算所述意图识别的结果与所述属性标签之间的相似度;
选取相似度最大的属性标签为所述第一实体的属性标签,提取所述属性标签对应的第二实体作为所述用户问题对应的答案。
可选地,所述对所述用户问题进行意图识别,包括:
提取所述用户问题的特征向量;
利用预构建的随机森林模型对所述特征向量进行类别预测,得到预测类别及对应的类别预测值;
选取类别预测值最大的预测类别,作为所述用户问题的意图识别结果。
可选地,所述根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案,包括:
用预设的句式模板将所述第一实体与所述属性标签生成目标语句;
通过预设的语义分析模型对所述目标语句及所述用户问题的语义进行逻辑处理,得到语义分析结果,并将所述语义分析结果作为所述答案。
为了解决上述问题,本发明还提供一种智能问答装置,所述装置包括:
知识库检索模块,用于从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索,若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
实体识别模块,用于在所述知识库中检索不到所述用户问题时,对所述用户问题进行实体识别,得到所述用户问题的第一实体,判断所述第一实体是否为多个;
第一答案获取模块,用于在所述第一实体为单个时,从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
第二答案获取模块,用于在所述第一实体为多个时,从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的智能问答方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的智能问答方法。
本发明实施例通过知识库识别和实体识别两种方法,在知识库识别中,基于根据以往问答不断更新的知识库对获得的用户问题进行初次识别,减少对用户问题进行分析的步骤,提高了获取答案的效率;在实体识别中,依赖于实体以及属性和关系,根据实体数量的不同情况进行区别检索,进一步提高了检索的效率,并且通过实体识别以及意图识别结合,实现了提高问答识别结果的准确性。因此本发明提出的智能问答方法、装置、电子设备及计算机可读存储介质,可以解决问答识别结果的准确性较低的问题。
附图说明
图1为本发明一实施例提供的智能问答方法的流程示意图;
图2为本发明一实施例提供的检索用户问题的流程示意图;
图3为本发明一实施例提供的获取单个实体的答案的流程示意图;
图4为本发明一实施例提供的智能问答装置的功能模块图;
图5为本发明一实施例提供的实现所述智能问答方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种智能问答方法。所述智能问答方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述智能问答方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的智能问答方法的流程示意图。
在本实施例中,所述智能问答方法包括:
S1、从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索。
本发明实施例中,所述用户输入的信息可以是文字内容或图片内容;所述知识库为存储问答对的数据库,其中,所述知识库中的问答对可以存在多对一、一对一等映射关系,即多个问题对应一个答案,或者单个问题对应单个答案。
本发明实施例中,所述从用户输入的信息中提取用户问题,包括:
根据所述用户输入的信息的消息头类型判断所述用户输入的信息为文字还是图片;
若所述消息头为文本标识,则判定所述用户输入的信息为文字,并将所述文字作为用户问题;
若所述消息头为图片标识,则判定所述用户输入的信息为图片,对所述图片进行OCR文本识别得到文本,并将所述文本中的文字作为用户问题。
本发明实施例中,文字和图片的消息结构和标识都有所区别,本发明实施例可以通过消息标识进行区分,文本的消息头类型为text,图片的消息头类型为image,通过对消息头类型的识别进而确定对应的信息类型。
本发明实施例中,所述OCR(Optical Character Recognition,光学字符识别)是指对文本资料的图像文件进行分析识别处理,获取所述图像文件中的文字及版面信息的过程。所述OCR文本识别可以通过预先训练的识别模型(包括文字检测模型和文本识别模型)实现,通过检测过程和识别过程进而获得图像中的文本内容。
本发明实施例中,参阅图2所示,所述将所述用户问题在预设的知识库中进行检索,包括:
S11、提取所述用户问题的文本语义并获取所述知识库中每一个现有问题的文本语义;
S12、根据所述用户问题的文本语义和所述知识库中现有问题的文本语义进行相似度检测;
S13、判断相似度检测结果中最大相似度是否大于预设阈值;
若所述最大相似度大于预设阈值,则执行S14、确定所述知识库中能够检索到所述用户问题,并确定所述相似度最大的文本语义对应的现有问题为所述用户问题;
若所述最大相似度小于或等于预设阈值,则执行S15、确定所述知识库中检索不到所述用户问题。
本发明实施例中,所述用户问题的文本语义和所述知识库中现有问题的文本语义可以为文本向量,通过计算所述用户问题的文本向量和所述知识库中现有问题的文本向量的距离值,得到相似度结果。
本发明实施例,通过先进行知识库检索识别,无需对用户问题进一步分析就能够得到答案,提高了获取答案的效率。
S2、若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案。
本发明实施例中,若在所述知识库中能够检索到所述用户问题,则说明所述知识库中存在所述用户问题对应的回答,因为所述知识库中的问题与答案都以问答对的形式存在,问题与答案之间根据映射关系进行关联存储,在确定用户问题的情况下,可以提取所述用户问题对应的答案。
S3、若在所述知识库中检索不到所述用户问题,则对所述用户问题进行实体识别,得到所述用户问题的第一实体。
本发明实施例中,可以利用预设的知识图谱数据库对所述用户问题进行实体识别,所述实体识别是指识别并选取所述用户问题中包含的第一实体,得到所述用户问题对应的一个或多个第一实体,例如:用户问题为“2月1号是春节吗”,进行实体识别后可以得到两个第一实体“春节”和“2月1号”。
本发明实施例中,所述对所述用户问题进行实体识别,得到所述用户问题的第一实体,包括:
提取所述用户问题中的关键词,并根据所述关键词在预设的知识图谱数据库中进行相似检索;
将检索到相似的关键词作为所述用户问题的第一实体。
具体地,所述提取所述用户问题中的关键词,包括:
对所述用户问题进行分词处理,得到文本分词;
从所述文本分词中逐个选取其中一个分词为目标分词;
利用预设的关键词算法计算所述目标分词在预设分词库中的频率指数;
选取所述频率指数大于预设的关键词阈值的文本分词为所述关键词。
详细地,所述频率指数是一个词语普遍重要性的度量,例如逆向文件频率。所述预设的关键词算法包括但不仅限于:TF-IDF、TextRank。
例如,对用户问题为“2月1号是春节吗”进行关键词提取,得到关键词为“春节”“2月1号”,根据以上两个关键词在所述知识图谱数据库中检索,知识图谱数据库中存在实体“春节”和“2月1号”,则可以将以上两个关键词作为所述用户问题的第一实体;又如,对用户问题为“春节是几月几号”进行关键词提取,得到关键词为“春节”,根据这一个关键词在所述知识图谱数据库中检索,知识图谱数据库中存在实体“春节”,则可以将这一个关键词作为所述用户问题的第一实体。
S4、判断所述第一实体是否为多个。
本发明实施例中,通过对识别得到的第一实体进行统计,可以确定用户问题对应第一实体的数量。
若所述第一实体为单个,则执行S5、从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案。
本发明实施例中,一个第一实体可以对应着多个属性标签,例如第一实体“春节”对应的属性标签有“日期”、“假期”等,一个属性标签分别连接两个实体,例如,第一实体“春节”对应的属性标签“假期”中,一端连接的第一实体是“春节”,一端连接的第二实体是“7天”。
本发明实施例以用户问题为“春节是几月几号”进行举例,实体识别得到的第一实体只有一个“春节”,根据意图识别确定所述第一实体表达的意思,对“春节”这一第一实体进行限定,若意图识别得到结果为“咨询日期”,则将根据“咨询日期”获取“春节”这一第一实体的与之对应的属性标签。
本发明实施例中,参阅图3所示,所述根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案,包括:
S51、对所述用户问题进行意图识别,计算所述意图识别的结果与所述属性标签之间的相似度;
S52、选取相似度最大的属性标签为所述第一实体的属性标签,提取所述属性标签对应的第二实体作为所述用户问题对应的答案。
进一步地,本发明实施例中,所述对所述用户问题进行意图识别,包括:
提取所述用户问题的特征向量;
利用预构建的随机森林模型对所述特征向量进行类别预测,得到预测类别及对应的类别预测值;
选取类别预测值最大的预测类别,作为所述用户问题的意图识别结果。
本发明实施例中,通过随机森林模型对所述特征向量进行最优节点划分,最终得到类别预测值,根据类别预测值可以确定意图识别得到的预测类别。例如,“春节是几月几号”进行预测,最终模型输出结果:预测类别为“咨询日期”的预测值为10,预测类别为“咨询节假日”的预测值为5,则确定“咨询日期”为意图识别的结果。
进一步地,本发明实施例通过下述方法计算所述意图识别的结果与所述属性标签的Jaccard相似度:
Figure BDA0003439523860000081
其中,A、B分别为所述意图识别的结果及所述属性标签。
本发明实施例中,在知识图谱数据库中,不同实体之间是通过属性标签实现关联连接,例如存在实体“中国”,与之连接的属性标签之一为“节假日”,“节假日”另一端连接的实体可以为“春节”,而与“春节”连接的属性标签之一为“日期”,“日期”这一属性标签连接的另一实体可以为“2月1号”。
因此,本发明实施例提取所述属性标签对应的第二实体作为所述用户问题对应的答案,例如,提取第一实体“春节”的属性标签“日期”连接的第二实体“2月1号”为所述问题“春节是几月几号”的答案。
进一步地,本发明实施例中,所述根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案之后,所述方法还包括:
在所述知识库中检索所述答案;
若在所述知识库中检索到所述答案,则将所述用户问题与在所述知识库中检索到的答案形成映射关系并关联存储至所述知识库中;
若在所述知识库中未检索到所述答案,则将所述答案与所述用户问题形成映射关系并关联存储至所述知识库中。
例如,存在用户问题“春节有几天假期”和对应的答案“7天”,在所述知识库中已存在问题“国庆有几天假期”以及对应的答案“7天”,上述用户问题与所述知识库中已存在问题对应的答案是相同的,因此可以在将用户问题和对应的答案进行存储之前,利用用户问题对应的答案“7天”在问答库中检索,检索到相同的答案,则直接利用知识库已有的答案与所述用户问题建立映射关系并进行存储。
本发明实施例中,通过将实体识别以及意图识别后的答案和对应的用户问题存储至知识库中,能够使知识库中的数据达到自动更新,提高下一次相同用户问题识别速度,提高了问答识别的效率。
若所述第一实体为多个,则执行S6、从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
本发明实施例以用户问题为“2月1号是春节吗”进行举例,实体识别得到的实体有两个:“春节”和“2月1号”,由于这两个实体之间存在属性标签,因此通过上述实体“春节”在知识图谱数据库中检索就等得到对应的属性标签的信息。
进一步地,由于知识图谱数据库中的实体间存在着属性标签,因此从所述多个实体获取实体间的属性标签可以直接利用计算机程序语言在知识图谱数据库中进行抓取。
本发明实施例中,所述根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案,包括:
用预设的句式模板将所述第一实体与所述属性标签生成目标语句;
通过预设的语义分析模型对所述目标语句及所述用户问题的语义进行逻辑处理,得到语义分析结果,并将所述语义分析结果作为所述答案。
本发明实施例中,所述句式模板可以为具有不同语法结构结构(如主谓宾结构或主谓结构)的语法模板,例如;实体为“春节”和“2月1号”,属性标签为“日期”,则根据句式模板组合得到目标语句为“春节的日期为2月1号”。
本发明实施例中,所述语义分析模型可以为LSTM模型(Long short-termmemory,长短期记忆神经网络),通过输入层将句子转化成数据序列,将数据序列输入隐藏层进行计算,在隐藏层的多层网络中计算时可以将之前隐藏层计算的结果作为新的输入,实现在多次的计算后不脱离原始输入数据,最后,输出时经过sigmod激活函数激活的得到分析结果。
本发明实施例中,所述根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案之后,还可以包括上述S5中将所述答案以及所述问题存储至所述知识库中的步骤,在此不过多赘述。
本发明实施例通过知识库识别和实体识别两种方法,在知识库识别中,基于根据以往问答不断更新的知识库对获得的用户问题进行初次识别,减少对用户问题进行分析的步骤,提高了获取答案的效率;在实体识别中,依赖于实体以及属性和关系,根据实体数量的不同情况进行区别检索,进一步提高了检索的效率,并且通过实体识别以及意图识别结合,实现了提高问答识别结果的准确性。因此本发明提出的智能问答方法可以解决问答识别结果的准确性较低的问题。
如图4所示,是本发明一实施例提供的智能问答装置的功能模块图。
本发明所述智能问答装置100可以安装于电子设备中。根据实现的功能,所述智能问答装置100可以包括知识库检索模块101、实体识别模块102、实体识别模块102、第一答案获取模块103及第二答案获取模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述知识库检索模块101,用于从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索;若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
所述实体识别模块102,用于在所述知识库中检索不到所述用户问题时,对所述用户问题进行实体识别,得到所述用户问题的第一实体,判断所述第一实体是否为多个;
所述第一答案获取模块103,用于在所述第一实体为单个时,从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
所述第二答案获取模块104,用于在所述第一实体为多个时,从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
详细地,本发明实施例中所述智能问答装置100中所述的各模块在使用时采用与上述图1至图3中所述的智能问答方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明一实施例提供的实现智能问答方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如智能问答程序。
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行智能问答程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如智能问答程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线12可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的智能问答程序是多个指令的组合,在所述处理器10中运行时,可以实现:
从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索;
若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
若在所述知识库中检索不到所述用户问题,则对所述用户问题进行实体识别,得到所述用户问题的第一实体;
若所述第一实体为单个,则从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
若所述第一实体为多个,则从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索;
若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
若在所述知识库中检索不到所述用户问题,则对所述用户问题进行实体识别,得到所述用户问题的第一实体;
若所述第一实体为单个,则从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
若所述第一实体为多个,则从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种智能问答方法,其特征在于,所述方法包括:
从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索;
若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
若在所述知识库中检索不到所述用户问题,则对所述用户问题进行实体识别,得到所述用户问题的第一实体;
若所述第一实体为单个,则从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
若所述第一实体为多个,则从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
2.如权利要求1所述的智能问答方法,其特征在于,所述从用户输入的信息中提取用户问题,包括:
根据所述用户输入的信息的消息头类型判断所述用户输入的信息为文字还是图片;
若所述消息头为文本标识,则判定所述用户输入的信息为文字,并将所述文字作为用户问题;
若所述消息头为图片标识,则判定所述用户输入的信息为图片,对所述图片进行OCR文本识别得到文本,并将所述文本中的文字作为用户问题。
3.如权利要求1所述的智能问答方法,其特征在于,所述将所述用户问题在预设的知识库中进行检索,包括:
提取所述用户问题的文本语义并获取所述知识库中每一个现有问题的文本语义;
根据所述用户问题的文本语义和所述知识库中现有问题的文本语义进行相似度检测;
判断相似度检测结果中最大相似度是否大于预设阈值;
若所述最大相似度大于预设阈值,则确定所述知识库中能够检索到所述用户问题,并确定所述相似度最大的文本语义对应的现有问题为所述用户问题;
若所述最大相似度小于或等于预设阈值,则确定所述知识库中检索不到所述用户问题。
4.如权利要求1所述的智能问答方法,其特征在于,所述对所述用户问题进行实体识别,得到所述用户问题的第一实体,包括:
提取所述用户问题中的关键词,并根据所述关键词在预设的知识图谱数据库中进行相似检索;
将检索到相似的关键词作为所述用户问题的第一实体。
5.如权利要求1所述的智能问答方法,其特征在于,所述根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案,包括:
对所述用户问题进行意图识别,计算所述意图识别的结果与所述属性标签之间的相似度;
选取相似度最大的属性标签为所述第一实体的属性标签,提取所述属性标签对应的第二实体作为所述用户问题对应的答案。
6.如权利要求5所述的智能问答方法,其特征在于,所述对所述用户问题进行意图识别,包括:
提取所述用户问题的特征向量;
利用预构建的随机森林模型对所述特征向量进行类别预测,得到预测类别及对应的类别预测值;
选取类别预测值最大的预测类别,作为所述用户问题的意图识别结果。
7.如权利要求1至6中任一项所述的智能问答方法,其特征在于,所述根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案,包括:
用预设的句式模板将所述第一实体与所述属性标签生成目标语句;
通过预设的语义分析模型对所述目标语句及所述用户问题的语义进行逻辑处理,得到语义分析结果,并将所述语义分析结果作为所述答案。
8.一种智能问答装置,其特征在于,所述装置包括:
知识库检索模块,用于从用户输入的信息中提取用户问题,并将所述用户问题在预设的知识库中进行检索,若在所述知识库中能够检索到所述用户问题,则从所述知识库中提取所述用户问题对应的答案;
实体识别模块,用于在所述知识库中检索不到所述用户问题时,对所述用户问题进行实体识别,得到所述用户问题的第一实体,判断所述第一实体是否为多个;
第一答案获取模块,用于在所述第一实体为单个时,从预设的知识图谱数据库中提取所述第一实体的属性标签,并根据所述属性标签、所述用户问题获取第二实体,将所述第二实体作为所述用户问题对应的答案;
第二答案获取模块,用于在所述第一实体为多个时,从所述知识图谱数据库中提取所述多个第一实体间的属性标签,根据所述第一实体间的属性标签及所述用户问题分析得到所述用户问题对应的答案。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的智能问答方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的智能问答方法。
CN202111624590.1A 2021-12-28 2021-12-28 智能问答方法、装置、设备及存储介质 Pending CN114416939A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111624590.1A CN114416939A (zh) 2021-12-28 2021-12-28 智能问答方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111624590.1A CN114416939A (zh) 2021-12-28 2021-12-28 智能问答方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114416939A true CN114416939A (zh) 2022-04-29

Family

ID=81269821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111624590.1A Pending CN114416939A (zh) 2021-12-28 2021-12-28 智能问答方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114416939A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115357693A (zh) * 2022-07-12 2022-11-18 浙江中控技术股份有限公司 基于加氢裂化装置知识图谱的智能问答系统的构建方法
CN115599899A (zh) * 2022-11-08 2023-01-13 中国空气动力研究与发展中心计算空气动力研究所(Cn) 基于飞行器知识图谱的智能问答方法、系统、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115357693A (zh) * 2022-07-12 2022-11-18 浙江中控技术股份有限公司 基于加氢裂化装置知识图谱的智能问答系统的构建方法
CN115599899A (zh) * 2022-11-08 2023-01-13 中国空气动力研究与发展中心计算空气动力研究所(Cn) 基于飞行器知识图谱的智能问答方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN113312461A (zh) 基于自然语言处理的智能问答方法、装置、设备及介质
CN112860848B (zh) 信息检索方法、装置、设备及介质
CN114416939A (zh) 智能问答方法、装置、设备及存储介质
CN115002200A (zh) 基于用户画像的消息推送方法、装置、设备及存储介质
CN114138784A (zh) 基于存储库的信息溯源方法、装置、电子设备及介质
CN112906377A (zh) 基于实体限制的问答方法、装置、电子设备及存储介质
CN113886708A (zh) 基于用户信息的产品推荐方法、装置、设备及存储介质
CN113268615A (zh) 资源标签生成方法、装置、电子设备及存储介质
CN115238670A (zh) 信息文本抽取方法、装置、设备及存储介质
CN113821622B (zh) 基于人工智能的答案检索方法、装置、电子设备及介质
CN114840684A (zh) 基于医疗实体的图谱构建方法、装置、设备及存储介质
CN113887941A (zh) 业务流程生成方法、装置、电子设备及介质
CN113111159A (zh) 问答记录生成方法、装置、电子设备及存储介质
CN115525761A (zh) 一种文章关键词筛选类别的方法、装置、设备及存储介质
CN115346095A (zh) 视觉问答方法、装置、设备及存储介质
CN114610854A (zh) 智能问答方法、装置、设备及存储介质
CN114996386A (zh) 业务角色识别方法、装置、设备及存储介质
CN114219367A (zh) 用户评分方法、装置、设备及存储介质
CN114676307A (zh) 基于用户检索的排序模型训练方法、装置、设备及介质
CN114595321A (zh) 问题标注方法、装置、电子设备及存储介质
CN114708073A (zh) 一种围标串标智能检测方法、装置、电子设备及存储介质
CN113707302A (zh) 基于关联信息的服务推荐方法、装置、设备及存储介质
CN112364068A (zh) 课程标签生成方法、装置、设备及介质
CN112632264A (zh) 智能问答方法、装置、电子设备及存储介质
CN114385815A (zh) 基于业务需求的新闻筛选方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination