CN109460448A - 一种可自主配置的faq服务框架 - Google Patents
一种可自主配置的faq服务框架 Download PDFInfo
- Publication number
- CN109460448A CN109460448A CN201811007288.XA CN201811007288A CN109460448A CN 109460448 A CN109460448 A CN 109460448A CN 201811007288 A CN201811007288 A CN 201811007288A CN 109460448 A CN109460448 A CN 109460448A
- Authority
- CN
- China
- Prior art keywords
- answer
- question
- knowledge base
- api
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种可自主配置的FAQ服务框架,其包括底层、中间层、上层;其中:底层用于提供问答对知识库、基础数据、基础模型;中间层用于提供问答对匹配算法;根据所述基础数据、所述基础模型和所述问答对匹配算法,将用户提出的问题与所述知识库进行匹配计算,得到所述问答对知识库中与所述问题相对应的答案;上层用于提供问答对匹配API和知识库管理API;用户通过所述问答对匹配API输入所述问题以传送至中间层进行算法匹配,并通过所述知识库管理API对所述问答对知识库进行管理;不仅支持开发者对知识库进行管理,同时支持底层算法的自主配置,达到快速、灵活定制FAQ服务的效果。
Description
技术领域
本发明涉及人工智能技术领域,特别是一种可自主配置的FAQ服务框架。
背景技术
FAQ是英文Frequently Asked Questions的缩写,中文意思就是“经常问到的问题”,或者更通俗地叫做“常见问题解答”。FAQ是当前网络上提供在线帮助的主要手段,通过事先组织好一些可能的常问问答对,发布在网页上为用户提供咨询服务,或者通过FAQ机器人为访客提供智能客服。
在网络营销中,FAQ被认为是一种常用的在线顾客服务手段,一个好的FAQ系统,应该至少可以回答用户80%的一般问题,以及常见问题。这样不仅方便了用户,也大大减轻了网站工作人员的压力,节省了大量的顾客服务成本,并且增加了顾客的满意度。
例如,聊天机器人QnA Maker是一套易于使用的REST API和基于Web的服务,QnAMaker主要是通过开发者提供的现有常见有关问答网址中的所有内容进行文档管理和编辑,自动提取所有可能的问题和答案,并进行匹配,允许开发者进行编辑、删除和添加,然后将知识库作为API终结点进行发布;同时也可以使用友好的web界面进行知识库的测试和训练。
但是,对于现有的聊天机器人,开发者能参与的仅仅是问答对知识库的编辑,例如:增、删、改、查等操作,无法参与底层算法的开发和调用,只能被动地使用内置默认的匹配算法。
发明内容
本发明为解决上述问题,提供了一种可自主配置的FAQ服务框架,其不仅支持开发者对知识库进行管理,同时支持底层算法的自主配置,达到快速、灵活定制FAQ服务的效果。
为实现上述目的,本发明采用的技术方案为:
一种可自主配置的FAQ服务框架,其包括:
底层,用于提供问答对知识库、基础数据、基础模型;用户可根据需求进行配置所述基础数据和所述基础模型,并按照指定格式存放至指定目录下,系统自动加载所述基础数据和所述基础模型;
中间层,用于提供问答对匹配算法;根据所述基础数据、所述基础模型和所述问答对匹配算法,将用户提出的问题与所述知识库进行匹配计算,得到所述问答对知识库中与所述问题相对应的答案;
上层,用于提供问答对匹配API和知识库管理API;用户通过所述问答对匹配API输入所述问题以传送至中间层进行算法匹配,并通过所述知识库管理API对所述问答对知识库进行管理。
优选的,所述的底层中,若开发者未配置所述基础数据和所述基础模型,则开发系统默认加载通用数据和通用模型。
进一步的,所述基础数据包括训练语料、用户词典、停用词表;所述基础模型是指根据所述训练语料进行训练得到的词向量模型。
优选的,所述的中间层中,所述问答对匹配算法是指文本相似度算法;其根据用户提出的问题进行文本相似度计算,从而计算出所述问答对知识库中与所述问题相似度最大的相似问题,并将该相似问题所对应的答案作为所述问题的答案。
优选的,还包括服务层,所述上层中的问答对匹配API和知识库管理API分别与所述服务层相连接;所述问答对匹配API从应用程序输入接口或穿戴设备输入接口或机器人输入接口或公众平台输入接口进行获取用户的问题和反馈对应的答案;所述知识库管理API用于知识库的创建、知识库的删除、增加或更新问答对。
进一步的,所述的知识库的创建,是通过使用Elasticsearch作为数据存储和查询工具,并在数据库结构文件里指定至少以下四个字段:问答对ID、问题、回答、元数据;所述的知识库的删除,是根据知识库的名称或者编号进行定位和删除指定的知识库。
进一步的,所述的增加或更新问答对,包括:
a.问答对批量插入:将多个问答对按照QAMID格式存储于文档中进行批量导入所述问答对知识库;
b.问答对更新:将每个问答对按照QAMID格式分别构建请求体进行导入所述问答对知识库;
c.问答对删除:根据知识库名称进行定位当前知识库,并在当前知识库中根据问答对ID进一步定位待删除的问答对,对所述问答对进行删除操作;
其中,所述QAMID格式是指“问题Q、回答A、元数据M、问答对ID”的格式,所述QAMID格式的顺序可调换。
本发明的有益效果是:
本发明的一种可自主配置的FAQ服务框架,其包括底层、中间层、上层;其中:底层用于提供问答对知识库、基础数据、基础模型;用户可根据需求进行配置所述基础数据和所述基础模型,并按照指定格式存放至指定目录下,系统自动加载所述基础数据和所述基础模型;中间层用于提供问答对匹配算法;根据所述基础数据、所述基础模型和所述问答对匹配算法,将用户提出的问题与所述知识库进行匹配计算,得到所述问答对知识库中与所述问题相对应的答案;上层用于提供问答对匹配API和知识库管理API;用户通过所述问答对匹配API输入所述问题以传送至中间层进行算法匹配,并通过所述知识库管理API对所述问答对知识库进行管理;不仅支持开发者对知识库进行管理,同时支持底层算法的自主配置,达到快速、灵活定制FAQ服务的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种可自主配置的FAQ服务框架的结构示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的一种可自主配置的FAQ服务框架,其包括底层、中间层、上层;其中:
底层,用于提供问答对知识库、基础数据、基础模型;用户可根据需求进行配置所述基础数据和所述基础模型,并按照指定格式存放至指定目录下,系统自动加载所述基础数据和所述基础模型;
中间层,用于提供问答对匹配算法;根据所述基础数据、所述基础模型和所述问答对匹配算法,将用户提出的问题与所述知识库进行匹配计算,得到所述问答对知识库中与所述问题相对应的答案;
上层,用于提供问答对匹配API和知识库管理API;用户通过所述问答对匹配API输入所述问题以传送至中间层进行算法匹配,并通过所述知识库管理API对所述问答对知识库进行管理。
对于底层:
所述的底层中,通常提供初始的通用数据与通用模型,开发人员可以根据个性化需求进行灵活替换;例如,收集特定语料(Corpus)、训练word2vec模型、构建领域词典(Dictionary)、构建停用词(StopWords)等;
若开发者未配置所述基础数据和所述基础模型,则开发系统默认加载通用数据和通用模型;所述基础数据包括训练语料、用户词典、停用词表;所述基础模型是指根据所述训练语料进行训练得到的词向量模型。
本实施例中,根据个性化需求,进行配置基础数据和基础模型的信息如下:
base_data_config={
"w2v":"similarity_words_dict.json",
"dict":"user_dict",
"stopwords":"stop_words.txt"
};
其中,w2v为词向量模型,开发者需要根据特定领域语料进行训练;dict为用户词典,开发者需要收集通用词汇以及本领域涉及的特定词汇,并整合为用户词典;stopwords为停用词表,用于过滤无实际意义的词汇。
总之,开发者可以需要根据需求配置基础数据与基础模型,并按照指定格式存放到指定目录下,本发明的FAQ服务框架QA Studio会自动加载,提供个性化服务。若开发者没有配置基础数据与模型信息,QA Studio将默认加载通用的数据与模型。
对于中间层:
所述的中间层中,所述问答对匹配算法是指文本相似度算法;其根据用户提出的问题进行文本相似度计算,从而计算出所述问答对知识库中与所述问题相似度最大的相似问题,并将该相似问题所对应的答案作为所述问题的答案。
开发者可通过已有的基础数据、基础模型、问答对知识库、问答对匹配算法进行问答对匹配,其中,基础数据可包括爬虫爬取的语料数据、对语料进行加工后的数据、通用词典、行业词典、用户自定义词典、停用词表等,基础模型可包括分类模型、对话模型、训练模型等,本领域技术人员可根据需要自行选配所需的数据和模型,并采用与所选数据和所选模型相匹配的问答对匹配算法,不以此为限。
具体过程如下:
(1),开发者可以根据已有的基础数据和基础模型,在中间层配置所需的问答对匹配算法(例如本实施例的文本相似度算法),该算法模块只要按照要求接受输入并提供输出,就能与本发明的FAQ服务框架QA Studio无缝结合;
(2),使用知识库获取问题的答案:底层有基础数据和基础模型的支撑,上层有相似度算法的指引,再结合开发者构建的问答对知识库,QA Studio即可提供完备的FAQ功能。
对于上层:
所述的上层中,QA Studio提供的API类型可以分为两类:一类是知识库管理API,一类是问答对匹配API,开发者根据提供的知识库管理API文档,可以轻松地进行知识库建设和管理。
本实施例中,还包括服务层,所述上层中的问答对匹配API和知识库管理API分别与所述服务层相连接;所述问答对匹配API从应用程序输入接口或穿戴设备输入接口或机器人输入接口或公众平台输入接口进行获取用户的问题和反馈对应的答案;所述知识库管理API用于知识库的创建、知识库的删除、增加或更新问答对。
具体如下:
(1),所述的知识库的创建,是通过使用Elasticsearch作为数据存储和查询工具,并在数据库结构文件里指定至少以下四个字段:qam_id(问答对id)、question(问题)、answer(回答)、etadata(元数据);在创建知识库时,实际上是创建了一个空知识库,里面没有任何数据;因此在之后的操作中需要往知识库里插入数据;
(2),所述的知识库的删除,是根据知识库的名称或者编号进行定位,通过访问知识库管理API在知识库层面进行操作进行删除指定的知识库;开发者在创建知识库时可以自由地指定知识库名称,知识库名称是知识库的唯一标识,QA Studio通过知识库名称来区分不同的知识库;
(3),QA Studio允许开发者对知识库数据进行增、删、改、查操作;本实施例中,所述的增加或更新问答对,包括:
a.问答对批量插入:
将多个问答对按照QAMID格式存储于文档中进行批量导入所述问答对知识库;本实施例中,可将多个问答对存储于txt文档中并访问相应的API,即可实现数据的批量导入,例如:
Q101@@##$$:有什么差别么已经购买的?
A101@@##$$:没有的,只是问您一下哈。亲,您要发给我,我才能帮您预约。
M101@@##$$:[]
Q102@@##$$:小气泡是属于哪种呢?
A102@@##$$:去黑头,深层洁净。
M102@@##$$:[]
Q103@@##$$:您那边晚上有营业吗?
A103@@##$$:8点下班。
M103@@##$$:[]
b.问答对更新:
将每个问答对按照QAMID格式分别构建请求体进行导入所述问答对知识库;因此,开发者如果只需增加或者更新少量数据时,可以按照如下方式构建请求体,并访问相应的API;如下:
{
“qams”:[
{
“qam_id”:0,
“question”:“有什么差别么已经购买的?”,
“answer”:“没有的,只是问您一下哈。亲,您要发给我,我才能帮您预约。”,
“metadata”:[]
},
{
“qam_id”:1,
“question”:“小气泡是属于哪种呢?”,
“answer”:“去黑头,深层洁净。”,
“metadata”:[]
},
{
“qam_id”:2,
“question”:“您那边晚上有营业吗?”,
“answer”:“8点下班”,
“metadata”:[]
}
]
}
c.问答对删除:
根据知识库名称进行定位当前知识库,并在当前知识库中根据问答对ID进一步定位待删除的问答对,对所述问答对进行删除操作;
d.问答对查看:
QA Studio还提供了问答对查看功能,定位问答对的方式同c,即,先通过知识库名称定位到当前知识库,再通过问答对id定位到的需要查看的问答对,通过访问获取问答对API,即可进行查看操作。
其中,所述QAMID格式是指“问题Q、回答A、元数据M、问答对ID”的格式,所述QAMID格式的顺序可调换;例如,批量导入时,Q101@@##$$中的Q代表问题,紧随其后的数字101代表问答对ID;同理的,A101@@##$$中的A代表答案,紧随其后的数字101代表问答对ID;M101@@##$$中的M代表元数据,紧随其后的数字101代表问答对ID;又例如,少量更新时,请求体中的0、1、2代表问答对ID,question代表问题,answer代表答案,metadata代表元数据。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (7)
1.一种可自主配置的FAQ服务框架,其特征在于,包括:
底层,用于提供问答对知识库、基础数据、基础模型;用户可根据需求进行配置所述基础数据和所述基础模型,并按照指定格式存放至指定目录下,系统自动加载所述基础数据和所述基础模型;
中间层,用于提供问答对匹配算法;根据所述基础数据、所述基础模型和所述问答对匹配算法,将用户提出的问题与所述知识库进行匹配计算,得到所述问答对知识库中与所述问题相对应的答案;
上层,用于提供问答对匹配API和知识库管理API;用户通过所述问答对匹配API输入所述问题以传送至中间层进行算法匹配,并通过所述知识库管理API对所述问答对知识库进行管理。
2.根据权利要求1所述的一种可自主配置的FAQ服务框架,其特征在于:所述的底层中,若开发者未配置所述基础数据和所述基础模型,则开发系统默认加载通用数据和通用模型。
3.根据权利要求1或2所述的一种可自主配置的FAQ服务框架,其特征在于:所述基础数据包括训练语料、用户词典、停用词表;所述基础模型是指根据所述训练语料进行训练得到的词向量模型。
4.根据权利要求1所述的一种可自主配置的FAQ服务框架,其特征在于:所述的中间层中,所述问答对匹配算法是指文本相似度算法;其根据用户提出的问题进行文本相似度计算,从而计算出所述问答对知识库中与所述问题相似度最大的相似问题,并将该相似问题所对应的答案作为所述问题的答案。
5.根据权利要求1所述的一种可自主配置的FAQ服务框架,其特征在于:还包括服务层,所述上层中的问答对匹配API和知识库管理API分别与所述服务层相连接;所述问答对匹配API从应用程序输入接口或穿戴设备输入接口或机器人输入接口或公众平台输入接口进行获取用户的问题和反馈对应的答案;所述知识库管理API用于知识库的创建、知识库的删除、增加或更新问答对。
6.根据权利要求5所述的一种可自主配置的FAQ服务框架,其特征在于:所述的知识库的创建,是通过使用Elasticsearch作为数据存储和查询工具,并在数据库结构文件里指定至少以下四个字段:问答对ID、问题、回答、元数据;所述的知识库的删除,是根据知识库的名称或者编号进行定位和删除指定的知识库。
7.根据权利要求5所述的一种可自主配置的FAQ服务框架,其特征在于:所述的增加或更新问答对,包括:
a.问答对批量插入:将多个问答对按照QAMID格式存储于文档中进行批量导入所述问答对知识库;
b.问答对更新:将每个问答对按照QAMID格式分别构建请求体进行导入所述问答对知识库;
c.问答对删除:根据知识库名称进行定位当前知识库,并在当前知识库中根据问答对ID进一步定位待删除的问答对,对所述问答对进行删除操作;
其中,所述QAMID格式是指“问题Q、回答A、元数据M、问答对ID”的格式,所述QAMID格式的顺序可调换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811007288.XA CN109460448A (zh) | 2018-08-31 | 2018-08-31 | 一种可自主配置的faq服务框架 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811007288.XA CN109460448A (zh) | 2018-08-31 | 2018-08-31 | 一种可自主配置的faq服务框架 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109460448A true CN109460448A (zh) | 2019-03-12 |
Family
ID=65606446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811007288.XA Pending CN109460448A (zh) | 2018-08-31 | 2018-08-31 | 一种可自主配置的faq服务框架 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109460448A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947928A (zh) * | 2019-04-16 | 2019-06-28 | 上海海事大学 | 一种检索式人工智能问答机器人开发方法 |
CN110659302A (zh) * | 2019-09-30 | 2020-01-07 | 出门问问信息科技有限公司 | 一种问答对热更新的方法、设备、系统及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答系统实现方法 |
CN106570708A (zh) * | 2016-10-31 | 2017-04-19 | 厦门快商通科技股份有限公司 | 一种智能客服知识库的管理方法及系统 |
CN106649394A (zh) * | 2015-11-03 | 2017-05-10 | 中兴通讯股份有限公司 | 融合知识库处理方法和装置,以及知识库管理系统 |
CN107180029A (zh) * | 2016-03-09 | 2017-09-19 | 阿里巴巴集团控股有限公司 | 一种基于咨询业务的信息处理方法及装置 |
CN107329967A (zh) * | 2017-05-12 | 2017-11-07 | 北京邮电大学 | 基于深度学习的问答系统以及方法 |
CN107391614A (zh) * | 2017-07-04 | 2017-11-24 | 重庆智慧思特大数据有限公司 | 一种基于wmd的中文问答匹配方法 |
CN107704521A (zh) * | 2017-09-07 | 2018-02-16 | 北京零秒科技有限公司 | 一种问答处理服务器、客户端以及实现方法 |
-
2018
- 2018-08-31 CN CN201811007288.XA patent/CN109460448A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答系统实现方法 |
CN106649394A (zh) * | 2015-11-03 | 2017-05-10 | 中兴通讯股份有限公司 | 融合知识库处理方法和装置,以及知识库管理系统 |
CN107180029A (zh) * | 2016-03-09 | 2017-09-19 | 阿里巴巴集团控股有限公司 | 一种基于咨询业务的信息处理方法及装置 |
CN106570708A (zh) * | 2016-10-31 | 2017-04-19 | 厦门快商通科技股份有限公司 | 一种智能客服知识库的管理方法及系统 |
CN107329967A (zh) * | 2017-05-12 | 2017-11-07 | 北京邮电大学 | 基于深度学习的问答系统以及方法 |
CN107391614A (zh) * | 2017-07-04 | 2017-11-24 | 重庆智慧思特大数据有限公司 | 一种基于wmd的中文问答匹配方法 |
CN107704521A (zh) * | 2017-09-07 | 2018-02-16 | 北京零秒科技有限公司 | 一种问答处理服务器、客户端以及实现方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947928A (zh) * | 2019-04-16 | 2019-06-28 | 上海海事大学 | 一种检索式人工智能问答机器人开发方法 |
CN110659302A (zh) * | 2019-09-30 | 2020-01-07 | 出门问问信息科技有限公司 | 一种问答对热更新的方法、设备、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guizzardi | Ontology, ontologies and the “I” of FAIR | |
Panda et al. | Exploring the viability of ChatGPT as an alternative to traditional chatbot systems in library and information centers | |
US10923115B2 (en) | Dynamically generated dialog | |
CN105094315A (zh) | 基于人工智能的人机智能聊天的方法和装置 | |
JP2019020995A (ja) | 自動応答サーバー装置、端末装置、応答システム、応答方法、およびプログラム | |
CN108228559A (zh) | 一种用于用户业务的人机交互实现方法及系统 | |
CN110807566A (zh) | 人工智能模型评测方法、装置、设备及存储介质 | |
Garrido et al. | Smart tourist information points by combining agents, semantics and AI techniques | |
CN108038748A (zh) | 用于辅助应答交互界面显示方法及设备 | |
KR102140253B1 (ko) | 챗봇 통신을 기반으로 한 사용자 맞춤형 공공지식 정보 제공방법 및 그 시스템 | |
CN111767385A (zh) | 一种智能问答方法及装置 | |
CN111708869A (zh) | 人机对话的处理方法及装置 | |
CN109460448A (zh) | 一种可自主配置的faq服务框架 | |
CN108510292A (zh) | 用于电力呼叫服务中故障场景问题的自动流程辅助方法 | |
Lamontagne et al. | Textual reuse for email response | |
KR20210070904A (ko) | 다중 문서 질의 응답을 위한 방법 및 장치 | |
CN112287082A (zh) | 结合rpa与ai的数据的处理方法、装置、设备及存储介质 | |
Wahde et al. | DAISY: an implementation of five core principles for transparent and accountable conversational AI | |
US20230274095A1 (en) | Autonomous conversational ai system without any configuration by a human | |
Panda et al. | Implementing Conversational AI in Libraries: A practical approach | |
JP6797382B1 (ja) | 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム | |
CN109087175A (zh) | 客服会话切换的方法、装置及系统 | |
CN101377772B (zh) | 用于全球化支持操作的系统和方法 | |
US20190026647A1 (en) | Authoring System for Subject Matter Experts (SMEs) to Develop a Computer-Based Question and Answer (QA) system for their Instructional Materials | |
JPH06301577A (ja) | データベース装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190312 |
|
RJ01 | Rejection of invention patent application after publication |