CN110941708A - 智能问答库建立方法、智能问答方法及装置、计算机设备 - Google Patents
智能问答库建立方法、智能问答方法及装置、计算机设备 Download PDFInfo
- Publication number
- CN110941708A CN110941708A CN201911066088.6A CN201911066088A CN110941708A CN 110941708 A CN110941708 A CN 110941708A CN 201911066088 A CN201911066088 A CN 201911066088A CN 110941708 A CN110941708 A CN 110941708A
- Authority
- CN
- China
- Prior art keywords
- question
- questions
- answer
- standard
- answers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种智能问答方法,包括:接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;根据对所述用户问题的分词和提取的关键词;匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
Description
技术领域
本发明涉及人工智能技术领域,尤指一种智能问答库、智能问答方法、计算机设备和存储介质。
背景技术
随着科技的发展,人工智能技术在各行业的应用越来越多。如QQ、微信、阿里旺旺,以及各种软件系统内的智能客服等等这些智能问答的对话系统,多依赖于自动聊天、自动问答,知识库,自然语言处理等技术。这种智能问答系统以自然语言技术为核心,涉及到语言学、信息科学和人工智能等多门学科。但将智能问答对话系统应用于桌面应用软件中却很少,而且都无法获得较好的交互结果。
发明内容
本发明实施例的目的是提供一种智能问答库建立方法及装置、智能问答方法及装置、计算机设备,以实现基于智能对话的问答能够在桌面应用中实现,用以解决现有问答系统功能复杂,由于应用场景较多导致用户无法直接获取需要的问题答案,从而人机交互不友好的问题。
为解决上述问题,第一方面,本发明实施例提供了一种智能问答库建立方法,所述方法包括:
根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;
提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;
对建立映射关系的问题和答案进行分词,建立话题列表,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题ID关系映射;
根据对问题与答案的分词和所提取的关键词,对问题进行分类;
根据对问题的分词,提取同类问题不同表述方式、关键词在语句中的位置特征,并根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
优选地,所述方法还包括:
由所述标准问题中关键词的同义、近义词、表述方式、句法相似度构建所述标准问题的扩展问题、相似问题;
根据所述问答映射关系,将所述标准问题、及其扩展问题、相似问题,映射到所述标准问题相应的答案或相近的答案。
优选地,所述方法还包括:
对于归于同一分类中的问题,根据所述话题ID映射关系,将标准问题、及其对应的扩展问题、相似问题,统一为所述标准问题的对话话题;
根据所述标准问题的对话话题,建立问题与相应的答案匹配模式。
第二方面,本发明实施例还提供了一种智能问答方法,所述方法包括:
接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;
根据对所述用户问题的分词和提取的关键词;
匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;
根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
第三方面,本发明实施例还提供了一种智能问答装置,所述装置包括:
人机交互模块,用于接收用户输入的用户问题;
问题处理模块,用于对所述用户问题进行自然语言处理获得分词,并提取关键词;
话题匹配模块,用于根据对所述用户问题的分词和提取的关键词,匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;
答案获取模块;用于根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问答映射关系,获取标准问题对应的答案。
第四方面,本发明实施例还提供了一种智能问答库建立装置,所述装置包括:
问题确定模块,用于根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;
问答映射模块,用于提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;
话题建立模块,用于对建立映射关系的问题和答案进行分词,建立话题列表,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题ID关系映射;
问题分类模块,用于根据对问题与答案的分词和所提取的关键词,对问题进行分类;
问答匹配模块,用于根据对问题的分词,提取同类问题不同表述方式、关键词在语句中的位置特征,并根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
优选地,所述装置还包括:
问题扩展模块,用于由所述标准问题中关键词的同义、近义词、表述方式、句法相似度构建所述标准问题的扩展问题、相似问题,根据所述问答映射关系,将所述标准问题、及其扩展问题、相似问题,映射到标准问题相应的答案或相近的答案。
优选地,所述问题扩展模块还包括:
话题扩展模块,用于对于归于同一分类中的问题,根据所述话题ID映射关系,将标准问题、及其对应的扩展问题、相似问题,同一为所述标准问题的对话话题;
根据所述标准问题的对话话题,建立问题与相应的答案匹配模式。
第五方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或更多个处理器;
一个或更多个存储器;
一个或更多个模块,其被存在存储器中且能够由所述一个或更多个处理器中的至少一个处理器以执行如第一方面所述智能问答库建立方法的步骤。
第六方面,本发明实施例还提供了一种用于实现智能问答的计算机设备,所述计算机设备包括:
一个或更多个处理器;
一个或更多个存储器;
一个或更多个模块,其被存在存储器中且能够由所述一个或更多个处理器中的至少一个处理器以执行如第一方面所述的智能问答方法的步骤。
本发明实施例通过将智能问答系统实现在桌面应用,帮助用户以问答对话的方式,查找并匹配用户问题对应的答案,得到用户需要的功能、与业务相适应的使用场景等内容,以更友好、更便捷的方式向用户提供桌面式智能应用。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对异步系统的实现方法、计算机设备和存储介质的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明实施例中一种智能问答库建立方法的流程图;
图2是本发明实施例中一种智能问答方法的流程图;
图3是本发明实施例中一种智能问答库建立装置的流程图;
图4是本发明实施例中一种智能问答装置的流程图;
图5是本发明实施例一种智能问答库建立方法的计算机设备的结构示意图;
图6是本发明实施例一种实现智能问答方法的计算机设备的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
如图1所示,本发明实施例提供了一种智能问答库建立方法,所述方法包括:
S100.根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;
由于用户面对很多应用程序,这些应用程序提供诸多的功能,然而用户在未受到完整功能或者使用技巧培训的情况下,很难获取这些应用程序的所有功能及应用技巧,在此情况下,用户很有可能会遇到应用程序不会使用导致自己所需要的功能不能得到满足的情况。本发明实施例一方面试图解决该问题,可以通过获取应用程序的使用手册对其提供功能的说明,并汇总相关问题;
或者,本发明实施例还可以去向应用程序的用户社区寻找问题;
或者通过采集用户在使用应用程序过程中遇到的问题或者反馈的问题;
本发明实施例并不限制该些问题的获取方式,任何能够体现应用程序使用问题的获取方式并为本领域一般技术人员所熟知,例如网络爬虫、服务器收集、用户使用手册、用户社区集中式的收集都可以为本发明的其中实施方式之一。
以桌面应用面向公安情报分析领域的为例,该公安情报分析应用的功能说明、用户手册,BBS社区中用户的提问,以及应用软件的售后技术支持团队从用户处收集的惯常使用问题等,可以为本发明中问答库的素材。基于该些问题,将应用程序的使用问题提炼成标准问题,例如,在数据处理时,关于数据的集中导入,会有如下问题:“数据导入怎么处理”作为标准问题。
当然,本发明实施例并不限定如下将问题进行标准化表述。
S200.提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;
基于该些标准问题,提供相应的标准答案,并建立问题和答案的映射关系,该些答案可能来自于用户手册的回答,也可能是用户惯常使用提炼出来的答案,或者基于该些标准功能库撰写的答案。
S300.对建立映射关系的问题和答案进行分词,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题列表,关键词与话题对应的话题ID关系映射;
对问题和答案先进行分词,在分词之后,提取出语句中的关键词。根据关键词来建立话题列表、话题ID关系映射。
例如:在“案件管理”中,有“切换案件”这个话题。那么“切换案件”这个话题是如何来的呢?对应“切换案件”话题,有标准问题:“怎么切换案件?”,另外也有不同的扩展问题,即不同的提问方法,“如何切换案件?”,“怎么更换到其他案件”,“咋切到另一个案件”等等。这些涉及到“案件切换”的问题,其答案是一样的,即“点击菜单’文件’->’退出案件’,返回主页后选择案件管理,即可切换案件。”
“切换案件”这个话题对应的关键词,即“切换案件”、“变换案件”“更换案件”。
S400.根据对问题与答案的分词和所提取的关键词,对问题进行分类;
对标准问题与标准答案的分类,主要是结合应用软件的功能模块来进行划分的。
还是以公安情报分析软件为例,其功能模块包含:案件管理、新手入门、数据导入、数据清洗、建模、图表分析、关系碰撞、通联分析、账单分析、社交网络数据分析、物流数据分析、网络数据分析、层级分析。
分类的依据可以按照应用软件中所具备的功能,由功能模块决定了有哪些类别,然后对从各处收集的问题以及答案按预先定义的类别来分类。
具体分类的原理即先分词,再提取关键词,然后依次进行比对,将其按预先定义的分类进行归类。对于无法按预先定义的类别分类的,则按关键词的不同,以及频率将相似的内容聚类到一个新类别,再由人工进行校验。
例如:
在“案件管理”分类中,新录入了如下问题:
“怎么看案件数据”
“如何查看案件数据?”
“怎么能看到案件数据?”
“怎么能找到案件数据?”
“案件中的数据怎么查?”
“如何查找已经建好的案件?”
“如何查看案件?”
“怎么查看案件”
“怎么找到已经建好的案件?”
“如何能找到建好了的案件?”
“删除已经建好的案件”
“删掉之前的案件”
“如何删除已经建立的案件?”
“删除案件”
“怎么删除以前建立的案件?”
“我要怎么删掉案子?”
“怎么对数据进行去重处理?”
“怎么对一批数据进行清洗?”
“可以导入那些类型的文件?”以上示例问题中,通过将问题输入分词器,对问题分词后,提取其中的关键词(方法为去掉“停用词”,副词、助词等不具备语义的词),相应的关键词有:“看/查看/看到/找到/查案件数据”,“查/查看/查找案件”,“删除/删掉/删案件|案子”,“数据去重/去掉重复”,“数据清洗/转换”,“导入文件”。这些对应的话题则分别为:“查看案件数据”,“查看案件”,“删除案件”都是案件相关的,划分到“案件管理”类别;话题“数据去重/去掉重复”,“数据清洗/转换”都是与数据处理相关的,则划分到“数据清洗”;话题“导入文件”则是同文件、数据导入相关的,则划分到“数据导入”类别。
以上分类划分的依据,则是通过关键词,近义词,以及与预先定义的分类类别的相似度,将其划分到具体的分类中,并辅以人工校正的方式。
S500.根据对问题的分词,根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
根据对问题的分析,来提取同类问题不同表述方式、关键词在语句中的位置特征,针对每个话题,需生成相应的匹配规则,以保证相同的问题、类似的提问能够被正确的匹配到该类话题,并索引到该话题对应的答案。
如针对“查看案件数据”这个话题,涉及到问题有如下这些:
“怎么看案件数据”
“如何查看案件数据?”
“怎么能看到案件数据?”
“怎么能找到案件数据?”
“案件中的数据怎么查?”
这些都是针对“查看案件数据”这个话题,不同的问法。
那么这个话题生成的匹配规则为:{怎么如何怎样咋}<<[查看看查查找看到找到]["案件数据"案件数据([案件案子]*~2[数据资源])]>>
规则的定义:[]内的词,可以为近义词,需要满足至少有一个能被匹配到。
()内的词,必须匹配到,并且有先后顺序。
<<>>内的匹配规则,可以是无序的。
{}内词,可以都不被匹配到,对匹配规则是否匹配的匹配度不影响。
*~2则表示,可以是0~2个词,省略不做匹配。
以上的匹配规则,不仅能够匹配上面的问题。还可以应对一些变体、扩展问题。例如:
“案件数据怎么查看?”
“我要怎样查找案件资源?”
等。
优选地,所述方法还包括:
由所述标准问题中关键词的同义、近义词、表述方式、句法相似度构建所述标准问题的扩展问题、相似问题;
根据所述问答映射关系,将所述标准问题、及其扩展问题、相似问题,映射到所述标准问题相应的答案或相近的答案。
优选地,所述方法还包括:
对于归于同一分类中的问题,根据所述话题ID映射关系,将标准问题、及其对应的扩展问题、相似问题,统一为所述标准问题的对话话题;
根据所述标准问题的对话话题,建立问题与相应的答案匹配模式。
本发明实施例通过对用户针对每个应用程序使用过程中可能碰到的功能性问题、操作性问题等等进行相似或者扩展,并针对相似问题、扩展问题结合标准问题建立建立问题库和答案库的映射关系,同时基于关键词、关键词位置特征建立话题列表,使得用户的问题总得得到一个话题列表,从而总能得到答案,这一方面方便了问答库的建立,避免了大量工作量,同时对于用户来说,不必拘泥于系统设立的问题,可以根据自己的使用习惯来设问,本发明实施例智能问答系统总能给客户较好的答案,提高了用户体验。
第二方面,如图2所示,本发明实施例还提供了一种智能问答方法,所述方法包括:
S1.接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;
S2.根据对所述用户问题的分词和提取的关键词,匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;
S3.根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
基于本发明实施例里的智能问答库的智能问答方法的实施例,这里不再一一赘述。
如图3所示,本发明实施例还提供了一种智能问答装置,所述装置包括:
人机交互模块100,用于接收用户输入的用户问题;
问题处理模块101,用于对所述用户问题进行自然语言处理获得分词,并提取关键词;
话题匹配模块102,用于根据对所述用户问题的分词和提取的关键词,匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;
答案获取模块103;用于根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问答映射关系,获取标准问题对应的答案。
如图4所示,本发明实施例还提供了一种智能问答库建立装置,所述装置包括:
问题确定模块201,用于根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;
问答映射模块202,用于提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;
话题建立模块203,用于对建立映射关系的问题和答案进行分词,建立话题列表,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题ID关系映射;
问题分类模块204,用于根据对问题与答案的分词和所提取的关键词,对问题进行分类;
问答匹配模块205,用于根据对问题的分词,提取同类问题不同表述方式、关键词在语句中的位置特征,并根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
优选地,所述问题确定模块201还包括:
问题扩展模块206,用于由所述标准问题中关键词的同义、近义词、表述方式、句法相似度构建所述标准问题的扩展问题、相似问题,根据所述问答映射关系,将所述标准问题、及其扩展问题、相似问题,映射到标准问题相应的答案或相近的答案。
相应地,所述话题建立模块203还包括:
话题扩展模块2061,用于对于归于同一分类中的问题,根据所述话题ID映射关系,将标准问题、及其对应的扩展问题、相似问题,同一为所述标准问题的对话话题;
根据所述标准问题的对话话题,建立问题与相应的答案匹配模式。
本发明实施例通过将智能问答实现在桌面应用,帮助用户以问答对话的方式,查找并匹配用户问题对应的答案,得到用户需要的功能、与业务相适应的使用场景等内容,以更友好、更便捷的方式向用户提供桌面式智能应用。
图5为本发明实施例提供的计算机设备的实体结构示意图,所述计算机设备架设于第三方设备中,例如移动终端、便携式计算机、IPAD等,如图5所示,该服务器可以包括:一个或多个处理器(processor)610、通信接口(Communications Interface)620、一个或多个存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行如下方法:根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;对建立映射关系的问题和答案进行分词,建立话题列表,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题ID关系映射;根据对问题与答案的分词和所提取的关键词,对问题进行分类;根据对问题的分词,提取同类问题不同表述方式、关键词在语句中的位置特征,并根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
通信总线640是连接所描述的元素的电路并且在这些元素之间实现传输。例如,处理器610通过通信总线640从其它元素接收到命令,解密接收到的命令,根据解密的命令执行计算或数据处理。存储器630可以包括程序模块,例如内核(kernel),中间件(middleware),应用程序程序编程接口(ApplicationProgramming Interface,API)和应用程序。该程序模块可以是有软件、固件或硬件、或其中的至少两种组成。通信接口620将该计算机设备与其它网络设备、客户端、移动设备、网络进行连接。例如,通信接口620可以通过有线或无线连接到网络以连接到外部其它的网络设备或用户设备。无线通信可以包括以下至少一种:无线保真(WiFi),蓝牙(BT),近距离无线通信技术(NFC),全球卫星定位系统(GPS)和蜂窝通信等等。有线通信可以包括以下至少一种:通用串行总线(USB),高清晰度多媒体接口(HDMI),异步传输标准接口(RS-232)等等。网络可以是电信网络和通信网络。通信网络可以为计算机网络、因特网、物联网、电话网络。计算机设备可以通过通信接口620连接网络,计算机设备和其它网络设备通信所用的协议可以被应用程序、应用程序程序编程接口(API)、中间件、内核和通信接口620至少一个支持。
图6为本发明实施例提供的计算机设备的实体结构示意图,所述计算机设备架设于租赁服务器中,如图6所示,该服务器可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行如下方法:接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;根据对所述用户问题的分词和提取的关键词;匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
通信总线940是连接所描述的元素的电路并且在这些元素之间实现传输。例如,处理器910通过通信总线940从其它元素接收到命令,解密接收到的命令,根据解密的命令执行计算或数据处理。存储器930可以包括程序模块,例如内核(kernel),中间件(middleware),应用程序程序编程接口(ApplicationProgramming Interface,API)和应用程序。该程序模块可以是有软件、固件或硬件、或其中的至少两种组成。通信接口920将该计算机设备与其它网络设备、客户端、移动设备、网络进行连接。例如,通信接口920可以通过有线或无线连接到网络以连接到外部其它的网络设备或用户设备。无线通信可以包括以下至少一种:无线保真(WiFi),蓝牙(BT),近距离无线通信技术(NFC),全球卫星定位系统(GPS)和蜂窝通信等等。有线通信可以包括以下至少一种:通用串行总线(USB),高清晰度多媒体接口(HDMI),异步传输标准接口(RS-232)等等。网络可以是电信网络和通信网络。通信网络可以为计算机网络、因特网、物联网、电话网络。计算机设备可以通过通信接口920连接网络,计算机设备和其它网络设备通信所用的协议可以被应用程序、应用程序程序编程接口(API)、中间件、内核和通信接口920至少一个支持。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;根据对所述用户问题的分词和提取的关键词;匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
进一步地,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;根据对所述用户问题的分词和提取的关键词;匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
本领域普通技术人员可以理解:此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制,上述实施例均可根据需要自由组合;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种智能问答库建立方法,其特征在于,所述方法包括:
根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;
提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;
对建立映射关系的问题和答案进行分词,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题列表,问题和话题的话题ID关系映射;
根据对问题与答案的分词和所提取的关键词,对问题进行分类;
根据对问题的分词,根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
2.根据权利要求1所述的智能问答库建立方法,其特征在于,所述方法还包括:
由所述标准问题中关键词的同义、近义词、表述方式、句法相似度构建所述标准问题的扩展问题、相似问题;
根据所述问答映射关系,将所述标准问题、及其扩展问题、相似问题,映射到所述标准问题相应的答案或相近的答案。
3.根据权利要求2所述的智能问答库建立方法,其特征在于,所述方法还包括:
对于归于同一分类中的问题,根据所述话题ID映射关系,将标准问题、及其对应的扩展问题、相似问题,统一为所述标准问题的对话话题;
根据所述标准问题的对话话题,建立问题与相应的答案匹配模式。
4.一种基于权利要求1-3任意一项所述智能问答库建立方法的智能问答方法,其特征在于,所述方法包括:
接受输入的用户问题,并对所述用户问题进行自然语言处理获得分词,并提取关键词;
根据对所述用户问题的分词和提取的关键词,匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;
根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问题答案映射关系,获取标准问题对应的答案。
5.一种智能问答库建立装置,其特征在于,所述装置包括:
问题确定模块,用于根据应用程序对象提供的功能、用户对所述应用程序对象使用过程中反馈的问题、和/或用户社区内的问题,确定若干标准问题;
问答映射模块,用于提供所述标准问题对应的标准答案,建立所述标准问题和标准答案的问答映射关系;
话题建立模块,用于对建立映射关系的问题和答案进行分词,建立话题列表,并抽取决定所述问题和答案中的语句主体含义的关键词,根据所述关键词建立话题ID关系映射;
问题分类模块,用于根据对问题与答案的分词和所提取的关键词,对问题进行分类;
问答匹配模块,用于根据对问题的分词,提取同类问题不同表述方式、关键词在语句中的位置特征,并根据所述话题ID映射关系,建立所述问题与相应的答案匹配模式,得到问题和答案匹配的问答库。
6.根据权利要求5所述的智能问答库建立装置,其特征在于,所述装置还包括:
问题扩展模块,用于由所述标准问题中关键词的同义、近义词、表述方式、句法相似度构建所述标准问题的扩展问题、相似问题,根据所述问答映射关系,将所述标准问题、及其扩展问题、相似问题,映射到标准问题相应的答案或相近的答案。
7.根据权利要求6所述的智能问答库建立装置,其特征在于,所述问题扩展模块还包括:
话题扩展模块,用于对于归于同一分类中的问题,根据所述话题ID映射关系,将标准问题、及其对应的扩展问题、相似问题,同一为所述标准问题的对话话题;
根据所述标准问题的对话话题,建立问题与相应的答案匹配模式。
8.一种基于权6-7任意一项所述的智能问答库建立装置的智能问答装置,其特征在于,所述装置包括:
人机交互模块,用于接收用户输入的用户问题;
问题处理模块,用于对所述用户问题进行自然语言处理获得分词,并提取关键词;
话题匹配模块,用于根据对所述用户问题的分词和提取的关键词,匹配问答库中的话题列表,依次对所述话题列表中的话题进行用户问题的语义匹配和关键词匹配;
答案获取模块;用于根据在问答库中匹配到的相似问句,将所述用户问题映射到标准问题,根据问答映射关系,获取标准问题对应的答案。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或更多个处理器;
一个或更多个存储器;
一个或更多个模块,其被存在存储器中且能够由所述一个或更多个处理器中的至少一个处理器以执行如权利要求1至3任一所述智能问答库建立方法的步骤。
10.一种用于实现智能问答方法的计算机设备,其特征在于,所述计算机设备包括:
一个或更多个处理器;
一个或更多个存储器;
一个或更多个模块,其被存在存储器中且能够由所述一个或更多个处理器中的至少一个处理器以执行如权利要求4所述的智能问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911066088.6A CN110941708B (zh) | 2019-11-04 | 2019-11-04 | 智能问答库建立方法、智能问答方法及装置、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911066088.6A CN110941708B (zh) | 2019-11-04 | 2019-11-04 | 智能问答库建立方法、智能问答方法及装置、计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110941708A true CN110941708A (zh) | 2020-03-31 |
CN110941708B CN110941708B (zh) | 2023-02-28 |
Family
ID=69906513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911066088.6A Active CN110941708B (zh) | 2019-11-04 | 2019-11-04 | 智能问答库建立方法、智能问答方法及装置、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110941708B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111782785A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 自动问答方法、装置、设备以及存储介质 |
CN112328762A (zh) * | 2020-11-04 | 2021-02-05 | 平安科技(深圳)有限公司 | 基于文本生成模型的问答语料生成方法和装置 |
CN112925890A (zh) * | 2021-03-05 | 2021-06-08 | 湖南神通智能股份有限公司 | 一种智能问答系统 |
CN113220881A (zh) * | 2021-02-24 | 2021-08-06 | 盐城幼儿师范高等专科学校 | 基于深度学习的教育问答实现方法、装置及服务器 |
CN116932721A (zh) * | 2023-07-25 | 2023-10-24 | 深圳市神州云海智能科技有限公司 | 一种银行业务问答匹配方法、装置、客服机器人 |
CN116932721B (zh) * | 2023-07-25 | 2024-06-04 | 深圳市神州云海智能科技有限公司 | 一种银行业务问答匹配方法、装置、客服机器人 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897334A (zh) * | 2016-06-24 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种问题推送方法和设备 |
CN107169105A (zh) * | 2017-05-17 | 2017-09-15 | 北京品智能量科技有限公司 | 用于车辆的问答装置及方法 |
CN107301213A (zh) * | 2017-06-09 | 2017-10-27 | 腾讯科技(深圳)有限公司 | 智能问答方法及装置 |
CN108509476A (zh) * | 2017-09-30 | 2018-09-07 | 平安科技(深圳)有限公司 | 问题联想推送方法、电子装置及计算机可读存储介质 |
CN108804567A (zh) * | 2018-05-22 | 2018-11-13 | 平安科技(深圳)有限公司 | 提高智能客服应答率的方法、设备、存储介质及装置 |
US20190115008A1 (en) * | 2017-10-17 | 2019-04-18 | International Business Machines Corporation | Automatic answer rephrasing based on talking style |
-
2019
- 2019-11-04 CN CN201911066088.6A patent/CN110941708B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897334A (zh) * | 2016-06-24 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种问题推送方法和设备 |
CN107169105A (zh) * | 2017-05-17 | 2017-09-15 | 北京品智能量科技有限公司 | 用于车辆的问答装置及方法 |
CN107301213A (zh) * | 2017-06-09 | 2017-10-27 | 腾讯科技(深圳)有限公司 | 智能问答方法及装置 |
CN108509476A (zh) * | 2017-09-30 | 2018-09-07 | 平安科技(深圳)有限公司 | 问题联想推送方法、电子装置及计算机可读存储介质 |
US20190115008A1 (en) * | 2017-10-17 | 2019-04-18 | International Business Machines Corporation | Automatic answer rephrasing based on talking style |
CN108804567A (zh) * | 2018-05-22 | 2018-11-13 | 平安科技(深圳)有限公司 | 提高智能客服应答率的方法、设备、存储介质及装置 |
Non-Patent Citations (2)
Title |
---|
ZONGCHENG JI ET AL: "Question-answer topic model for question retrieval in community question answering", 《PROCEEDINGS OF THE 21ST ACM INTERNATIONAL CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT》 * |
张青 等: "基于主题扩展的领域问题分类方法", 《计算机工程》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111782785A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 自动问答方法、装置、设备以及存储介质 |
CN111782785B (zh) * | 2020-06-30 | 2024-04-19 | 北京百度网讯科技有限公司 | 自动问答方法、装置、设备以及存储介质 |
CN112328762A (zh) * | 2020-11-04 | 2021-02-05 | 平安科技(深圳)有限公司 | 基于文本生成模型的问答语料生成方法和装置 |
CN112328762B (zh) * | 2020-11-04 | 2023-12-19 | 平安科技(深圳)有限公司 | 基于文本生成模型的问答语料生成方法和装置 |
CN113220881A (zh) * | 2021-02-24 | 2021-08-06 | 盐城幼儿师范高等专科学校 | 基于深度学习的教育问答实现方法、装置及服务器 |
CN113220881B (zh) * | 2021-02-24 | 2024-02-06 | 盐城幼儿师范高等专科学校 | 基于深度学习的教育问答实现方法、装置及服务器 |
CN112925890A (zh) * | 2021-03-05 | 2021-06-08 | 湖南神通智能股份有限公司 | 一种智能问答系统 |
CN116932721A (zh) * | 2023-07-25 | 2023-10-24 | 深圳市神州云海智能科技有限公司 | 一种银行业务问答匹配方法、装置、客服机器人 |
CN116932721B (zh) * | 2023-07-25 | 2024-06-04 | 深圳市神州云海智能科技有限公司 | 一种银行业务问答匹配方法、装置、客服机器人 |
Also Published As
Publication number | Publication date |
---|---|
CN110941708B (zh) | 2023-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941708B (zh) | 智能问答库建立方法、智能问答方法及装置、计算机设备 | |
US10958598B2 (en) | Method and apparatus for generating candidate reply message | |
CN108229704B (zh) | 用于推送信息的方法和装置 | |
CN110096584B (zh) | 一种应答方法和装置 | |
CN111566638B (zh) | 向应用编程接口添加描述性元数据以供智能代理使用 | |
CN104077294A (zh) | 一种信息推荐方法、装置及信息资源推荐系统 | |
KR102207632B1 (ko) | 전문가 긴급 추천 서비스 시스템 | |
US20120197937A1 (en) | Method and system for providing detailed information in an interactive manner in a short message service (sms) environment | |
US9524320B2 (en) | Collection and storage of a personalized, searchable, unstructured corpora | |
CN111046135A (zh) | 非结构文本处理方法、装置、计算机设备、存储介质 | |
CN111538830B (zh) | 法条检索方法、装置、计算机设备及存储介质 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN106156262A (zh) | 一种搜索信息处理方法及系统 | |
CN114298007A (zh) | 一种文本相似度确定方法、装置、设备及介质 | |
KR102151322B1 (ko) | 정보 푸시 방법 및 장치 | |
CN114491010A (zh) | 信息抽取模型的训练方法及装置 | |
CN112989011B (zh) | 数据查询方法、数据查询装置和电子设备 | |
KR102560521B1 (ko) | 지식 그래프 생성 방법 및 장치 | |
US20220262353A1 (en) | Method and device for Processing Voice Information, Storage Medium and Electronic Apparatus | |
CN111382365B (zh) | 用于输出信息的方法和装置 | |
CN113988954A (zh) | 理财产品营销方法及装置 | |
WO2021135103A1 (zh) | 一种语义分析方法、装置、计算机设备及存储介质 | |
CN112579733B (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN114239501A (zh) | 合同生成方法、装置、设备及介质 | |
CN109522389B (zh) | 文档推送方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |