CN110275937A - 一种问答机器人的构建方法和装置 - Google Patents

一种问答机器人的构建方法和装置 Download PDF

Info

Publication number
CN110275937A
CN110275937A CN201910399197.3A CN201910399197A CN110275937A CN 110275937 A CN110275937 A CN 110275937A CN 201910399197 A CN201910399197 A CN 201910399197A CN 110275937 A CN110275937 A CN 110275937A
Authority
CN
China
Prior art keywords
question
text library
information
faq
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910399197.3A
Other languages
English (en)
Inventor
王伟健
薛沐凡
陈林颖
郑俊杰
方友鑫
林儒延
唐尉棉
徐戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minjiang University
Original Assignee
Minjiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minjiang University filed Critical Minjiang University
Priority to CN201910399197.3A priority Critical patent/CN110275937A/zh
Publication of CN110275937A publication Critical patent/CN110275937A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

为提供一种利用已有的问答、交互文本语料等资源,针对新的输入文本自动给出回复的软件系统,发明人提出了一种问答机器人的构建方法,包括如下步骤:建立FAQ文本库;接收用户输入的问句信息;处理并计算所述问句信息与FAQ文本库内信息的相似度;在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句。发明人同时还提供了一种实现上述构建方法的问答机器人的构建装置。区别于现有技术,上述技术方案能够使得使用该方案的相关企业单位的客服自动化和智能化,从而降低人工成本、缩短问题响应时间、保障问题回复的一致性,充分有效地提高用户体验。

Description

一种问答机器人的构建方法和装置
技术领域
本发明涉及计算机软件领域,特别涉及一种问答机器人的构建方法和装置。
背景技术
FAQ是英文Frequently Asked Questions的缩写,中文意思就是“经常问到的问题”,或者更通俗地叫做“常见问题解答”。FAQ是当前网络上提供在线帮助的主要手段,通过事先组织好一些可能的常问问答对(Question Answer Pair),发布在网页上或聊天群中为用户提供咨询服务。
问答机器人是利用已有的问答、交互文本语料等资源,针对新的输入文本自动给出回复的软件系统。问答机器人在不同的应用场合也被称为智能问答系统、自动问答系统、智能客服机器人、聊天机器人等。问答机器人作为一种基础性的交互手段,已经被广泛的运用在客服、教育、呼叫中心、陪伴、导航、行政助手等领域。对相关企业单位而言,客服的自动化和智能化能够降低人工成本、缩短问题响应时间、保障问题回复的一致性,从而提高用户体验。
发明内容
为此,需要提供一种构建问答机器人的技术方案。
为实现上述目的,发明人提供了一种问答机器人的构建方法,包括如下步骤:
建立FAQ文本库;
接收用户输入的问句信息;
处理并计算所述问句信息与FAQ文本库内信息的相似度;
在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句。
进一步地,所述的问答机器人的构建方法中,所述步骤“建立FAQ文本库”具体包括:
获取高于预设数量的个数的常见问答对;
对获取的所述常见问答对一一进行预处理,并按照一个问句和一个答句的格式建立FAQ文本,形成FAQ文本库。
进一步地,所述的问答机器人的构建方法中,所述步骤“处理并计算所述问句信息与FAQ文本库内信息的相似度”具体包括:
对所述问句进行分词处理;
利用预设算法计算所述问句信息与FAQ文本库内信息的相似度。
进一步地,所述的问答机器人的构建方法中,步骤“在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句”中所述的预设数量为3-5。
发明人同时还提供了一种问答机器人的构建装置,包括文本库建立单元、输入单元、处理单元、查找单元和输出单元;
所述文本库建立单元用于建立FAQ文本库;
所述输入单元用于接收用户输入的问句信息;
所述处理单元用于处理所述并计算所述问句信息与FAQ文本库内信息的相似度;
所述查找单元用于在FAQ文本库中查找与问句信息相似度最高的预设数量个答句;所述输出单元用于输出与问句信息相似度最高的预设数量个答句。
进一步地,所述的问答机器人的构建装置中,所述文本库建立单元“建立FAQ文本库”具体包括:
获取高于预设数量的个数的常见问答对;
对获取的所述常见问答对一一进行预处理,并按照一个问句和一个答句的格式建立FAQ文本,形成FAQ文本库。
进一步地,所述的问答机器人的构建装置中,所述“处理单元用于处理所述并计算所述问句信息与FAQ文本库内信息的相似度”具体包括:
对所述问句进行分词处理;
利用预设算法计算所述问句信息与FAQ文本库内信息的相似度。
进一步地,所述的问答机器人的构建装置中,“所述查找单元用于在FAQ文本库中查找与问句信息相似度最高的预设数量个答句;所述输出单元用于输出与问句信息相似度最高的预设数量个答句”中所述的预设数量为3-5。
区别于现有技术,上述技术方案提供了利用已有的问答、交互文本语料等资源,针对新的输入文本自动给出回复的软件系统,能够使得使用该方案的相关企业单位的客服自动化和智能化,从而降低人工成本、缩短问题响应时间、保障问题回复的一致性,充分有效地提高用户体验。
附图说明
图1为本发明一实施方式所述的问答机器人的构建方法的流程图;
图2为本发明一实施方式所述的问答机器人的构建装置的结构示意图。
附图标记说明:
1-文本库建立单元
2-输入单元
3-处理单元
4-查找单元
5-输出单元
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
请参阅图1,为本发明一实施方式所述的问答机器人的构建方法的流程图;所述方法包括如下步骤:
S1、建立FAQ文本库;
进一步地,所述的问答机器人的构建方法中,所述步骤“建立FAQ文本库”具体包括:
获取高于预设数量的个数的常见问答对;
对获取的所述常见问答对一一进行预处理,并按照一个问句和一个答句的格式建立FAQ文本,形成FAQ文本库。
S2、接收用户输入的问句信息;
S3、处理并计算所述问句信息与FAQ文本库内信息的相似度;
进一步地,本步骤中所说的“处理并计算所述问句信息与FAQ文本库内信息的相似度”具体包括:
对所述问句进行分词处理;
利用预设算法计算所述问句信息与FAQ文本库内信息的相似度。
S4、在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句。
进一步地,本步骤“在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句”中所述的预设数量为3-5。
请参阅图2,为本发明一实施方式所述的一种问答机器人的构建装置的结构示意图。所述问答机器人的构建装置包括文本库建立单元1、输入单元2、处理单元3、查找单元4和输出单元5;
所述文本库建立单元1用于建立FAQ文本库;
所述输入单元2用于接收用户输入的问句信息;
所述处理单元3用于处理所述并计算所述问句信息与FAQ文本库内信息的相似度;
所述查找单元4用于在FAQ文本库中查找与问句信息相似度最高的预设数量个答句;所述输出单元5用于输出与问句信息相似度最高的预设数量个答句。
进一步地,所述的问答机器人的构建装置中,所述文本库建立单元1“建立FAQ文本库”具体包括:
获取高于预设数量的个数的常见问答对;
对获取的所述常见问答对一一进行预处理,并按照一个问句和一个答句的格式建立FAQ文本,形成FAQ文本库。
进一步地,所述的问答机器人的构建装置中,所述“处理单元2用于处理所述并计算所述问句信息与FAQ文本库内信息的相似度”具体包括:
对所述问句进行分词处理;
利用预设算法计算所述问句信息与FAQ文本库内信息的相似度。
进一步地,所述的问答机器人的构建装置中,“所述查找单元3用于在FAQ文本库中查找与问句信息相似度最高的预设数量个答句;所述输出单元4用于输出与问句信息相似度最高的预设数量个答句”中所述的预设数量为3-5。
区别于现有技术,上述技术方案提供了利用已有的问答、交互文本语料等资源,针对新的输入文本自动给出回复的软件系统,能够使得使用该方案的相关企业单位的客服自动化和智能化,从而降低人工成本、缩短问题响应时间、保障问题回复的一致性,充分有效地提高用户体验。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。
本领域内的技术人员应明白,上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机设备可读取的存储介质中,用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备,包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等;所述的存储介质,包括但不限于:RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。
上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器,使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中,使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机设备上,使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。

Claims (8)

1.一种问答机器人的构建方法,其特征在于,包括如下步骤:
建立FAQ文本库;
接收用户输入的问句信息;
处理并计算所述问句信息与FAQ文本库内信息的相似度;
在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句。
2.如权利要求1所述的问答机器人的构建方法,其特征在于,所述步骤“建立FAQ文本库”具体包括:
获取高于预设数量的个数的常见问答对;
对获取的所述常见问答对一一进行预处理,并按照一个问句和一个答句的格式建立FAQ文本,形成FAQ文本库。
3.如权利要求1或2所述的问答机器人的构建方法,其特征在于,所述步骤“处理并计算所述问句信息与FAQ文本库内信息的相似度”具体包括:
对所述问句进行分词处理;
利用预设算法计算所述问句信息与FAQ文本库内信息的相似度。
4.如权利要求3所述的问答机器人的构建方法,其特征在于,步骤“在FAQ文本库中查找并输出与问句信息相似度最高的预设数量个答句”中所述的预设数量为3-5。
5.一种问答机器人的构建装置,其特征在于,包括文本库建立单元、输入单元、处理单元、查找单元和输出单元;
所述文本库建立单元用于建立FAQ文本库;
所述输入单元用于接收用户输入的问句信息;
所述处理单元用于处理所述并计算所述问句信息与FAQ文本库内信息的相似度;
所述查找单元用于在FAQ文本库中查找与问句信息相似度最高的预设数量个答句;所述输出单元用于输出与问句信息相似度最高的预设数量个答句。
6.如权利要求5所述的问答机器人的构建装置,其特征在于,所述文本库建立单元“建立FAQ文本库”具体包括:
获取高于预设数量的个数的常见问答对;
对获取的所述常见问答对一一进行预处理,并按照一个问句和一个答句的格式建立FAQ文本,形成FAQ文本库。
7.如权利要求5或6所述的问答机器人的构建装置,其特征在于,所述“处理单元用于处理所述并计算所述问句信息与FAQ文本库内信息的相似度”具体包括:
对所述问句进行分词处理;
利用预设算法计算所述问句信息与FAQ文本库内信息的相似度。
8.如权利要求7所述的问答机器人的构建装置,其特征在于,“所述查找单元用于在FAQ文本库中查找与问句信息相似度最高的预设数量个答句;所述输出单元用于输出与问句信息相似度最高的预设数量个答句”中所述的预设数量为3-5。
CN201910399197.3A 2019-05-14 2019-05-14 一种问答机器人的构建方法和装置 Pending CN110275937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910399197.3A CN110275937A (zh) 2019-05-14 2019-05-14 一种问答机器人的构建方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910399197.3A CN110275937A (zh) 2019-05-14 2019-05-14 一种问答机器人的构建方法和装置

Publications (1)

Publication Number Publication Date
CN110275937A true CN110275937A (zh) 2019-09-24

Family

ID=67959039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910399197.3A Pending CN110275937A (zh) 2019-05-14 2019-05-14 一种问答机器人的构建方法和装置

Country Status (1)

Country Link
CN (1) CN110275937A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113053393A (zh) * 2021-03-30 2021-06-29 福州市长乐区极微信息科技有限公司 音频标注处理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030018629A1 (en) * 2001-07-17 2003-01-23 Fujitsu Limited Document clustering device, document searching system, and FAQ preparing system
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN108595619A (zh) * 2018-04-23 2018-09-28 海信集团有限公司 一种问答方法及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030018629A1 (en) * 2001-07-17 2003-01-23 Fujitsu Limited Document clustering device, document searching system, and FAQ preparing system
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN108595619A (zh) * 2018-04-23 2018-09-28 海信集团有限公司 一种问答方法及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113053393A (zh) * 2021-03-30 2021-06-29 福州市长乐区极微信息科技有限公司 音频标注处理装置
CN113053393B (zh) * 2021-03-30 2024-04-30 闽江学院 音频标注处理装置

Similar Documents

Publication Publication Date Title
CN104951428B (zh) 用户意图识别方法及装置
CN113590776B (zh) 基于知识图谱的文本处理方法、装置、电子设备及介质
CN112487173A (zh) 人机对话方法、设备和存储介质
CN113408284A (zh) 文本处理模型的训练方法、装置、电子设备及存储介质
EP3850500A1 (en) Inferring topics with entity linking and ontological data
CN114090755A (zh) 基于知识图谱的回复语句确定方法、装置及电子设备
CN113868519A (zh) 信息搜索方法、装置、电子设备和存储介质
CN114492669B (zh) 关键词推荐模型训练方法、推荐方法和装置、设备、介质
CN111428486B (zh) 物品信息数据处理方法、装置、介质及电子设备
CN110275946A (zh) 一种faq自动问答方法和装置
CN110275937A (zh) 一种问答机器人的构建方法和装置
CN113792134A (zh) 一种基于数字孪生技术的用户服务方法及系统
CN117521625A (zh) 问答方法、装置、电子设备及介质
CN116662495A (zh) 问答处理方法、训练问答处理模型的方法及装置
CN114647739B (zh) 实体链指方法、装置、电子设备及存储介质
CN114036397B (zh) 数据推荐方法、装置、电子设备和介质
CN110543635A (zh) 基于深度学习的信息检测方法、装置及计算机存储介质
CN114398883B (zh) 演示文稿生成方法、装置、计算机可读存储介质及服务器
CN110134867A (zh) 企业信息查询方法及相关产品
JP2023554210A (ja) インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN111897884B (zh) 数据关系信息显示方法、终端设备
CN111241236B (zh) 任务导向性问答方法、系统、电子设备、可读存储介质
CN110287295A (zh) 基于小程序的问答机器人构建方法和系统
CN111507366B (zh) 推荐概率模型的训练方法、智能补全方法及相关装置
CN113256395A (zh) 基于推荐图网络的产品推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Xu Ge

Inventor after: Wang Weijian

Inventor after: Xue Mufan

Inventor after: Chen Linying

Inventor after: Zheng Junjie

Inventor after: Fang Youxin

Inventor after: Lin Ruyan

Inventor after: Tang Weimian

Inventor before: Wang Weijian

Inventor before: Xue Mufan

Inventor before: Chen Linying

Inventor before: Zheng Junjie

Inventor before: Fang Youxin

Inventor before: Lin Ruyan

Inventor before: Tang Weimian

Inventor before: Xu Ge

CB03 Change of inventor or designer information
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190924

WD01 Invention patent application deemed withdrawn after publication