CN107025297A - 一种聊天机器人及其自动聊天方法 - Google Patents
一种聊天机器人及其自动聊天方法 Download PDFInfo
- Publication number
- CN107025297A CN107025297A CN201710251306.8A CN201710251306A CN107025297A CN 107025297 A CN107025297 A CN 107025297A CN 201710251306 A CN201710251306 A CN 201710251306A CN 107025297 A CN107025297 A CN 107025297A
- Authority
- CN
- China
- Prior art keywords
- user
- feedback
- knowledge base
- question
- chat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2358—Change logging, detection, and notification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种聊天机器人及其自动聊天方法,其中,聊天机器人中包括:用于对通过交互平台获取的用户聊天信息进行预处理的预处理模块;用于根据预处理模块得到的关键字在知识库中查询匹配的反馈字段,并根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信息反馈至交互平台的反馈查询模块;用于根据反馈查询模块的查询结果运算用户聊天信息与问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信息反馈至交互平台的相似度运算模块。在对话过程中,首先利用知识库进行问题匹配,若匹配到了则返回相应的反馈信息;若没有匹配到则利用问答库得出相似度最高的反馈信息反馈至用户,以此保证了聊天机器人的可靠性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种聊天机器人及其自动聊天方 法。
背景技术
现今,各行业需要承担的用户咨询/反馈解答的工作越来越多,如,在互联 网行业中的售后或者客服服务。随着用户数量的爆炸式增长,无法再采用人工 的方式对所有用户的咨询进行一一回答,此外,用户的问题大多集中在某些特 定的知识点上,人工回复很多时候都是在进行重复性地劳动,严重浪费人力, 以此,基于客服服务的聊天机器人应运而生,用以辅助人工进行问题的回复。
自动问答(Question Answering,QA)是指根据用户使用自然语言提出的 问题找到一个明确的答案。传统的自动问答系统,如图1所示,主要包括:接 口单元、预处理单元和知识库,在工作过程中,接口单元将用户用自然语言提 问的问题发送给预处理单元,预处理单元对问题进行解析得到问题的结构化表 达及关键字,以此推理单元根据问题的结构化表达式、本体知识技术及语言知 识技术从知识库中匹配获得问题模板,之后利用自然语言处理技术、获得的应 答内容及获得的问题模板,完成知识推理并最终生成答案。
现有的聊天机器人一般都是基于上述自动问答系统的,在知识库的构建阶 段,需要从输入的新问答对中挖掘问题模板,构建出模板库,以供推理单元查 询获得问题模板,采用语言知识技术对输入的新知识进行处理以获得与关键字 对应的应答,或对输入的新问答进行知识解析以获得与关键字对应的应答。知 识库中保存的知识即为与关键字对应的应答。
但是,在聊天机器人中,知识库的构建需要人为编写完成,这使得管理人 员的工作量巨大,而且人为编写的知识库很难做到覆盖所有用户可能会问的问 题。当然,目前也有问答系统能够支持知识库的批量形成,其虽然可以减少管 理人员的工作量,但是批量形成的知识库可靠性不高,且不具备逻辑性,只能 涉及一问一答的方式回复用户的问题。
发明内容
针对上述问题,本发明提供了一种聊天机器人及其自动聊天方法,有效解 决了现有聊天机器人可靠性不高的技术问题。
本发明提供的技术方案如下:
一种聊天机器人,包括:
知识库,存储的数据包括逻辑行为自然常识、词汇库、对话信息蕴含的关 键字段及与之匹配的反馈字段,所述关键字段由多个关键字组成;
问答库,存储的数据包括词汇库、对话信息中蕴含的问答对及其对应的关 键字;
交互平台,用于与用户进行信息交互;
预处理模块,用于对通过交互平台获取的用户聊天信息进行预处理,包括 分词得到其中蕴含的关键字/关键字段;
反馈查询模块,用于根据预处理模块得到的关键字在知识库中查询匹配的 反馈字段,并根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信 息反馈至交互平台;
相似度运算模块,用于根据反馈查询模块的查询结果运算用户聊天信息与 问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信 息反馈至交互平台。
在本技术方案中,在该聊天机器人中既包括高可靠性和高逻辑性的知识 库,又包括大批量生产的问答库,这样,在与用户进行对话的过程中,首先利 用知识库进行问题匹配,若匹配到了则返回相应的反馈信息;若没有匹配到则 利用问答库得出相似度最高的反馈信息反馈至用户,以此保证了聊天机器人的 可靠性。
进一步优选地,在所述预处理模块中包括:
拆分单元,用于将通过交互平台获取的用户聊天信息拆分成若干分词;
语素识别单元,用于对拆分单元拆分得到的分词进行语素识别;
整理单元,用于根据语素识别单元的识别结果整理得到关键字/关键字段。
在本技术方案中,对用户聊天信息进行拆分之后,进行语素识别,以此根 据词汇库将停用词等去掉,以此提高反馈查询模块的查询效率和准确度。
进一步优选地,在所述整理单元中:根据预设规则和语素识别单元的识别 结果保留相应的分词,并根据问答库中的词汇库对保留的分词进行语义扩展得 到关键字/关键字段。
在本技术方案中,对关键词进行语义扩展之后计算其与存储问题之间的相 似度,以此提高计算结果的准确度。
进一步优选地,在所述相似度运算模块中包括:
计算单元,用于计算用户聊天信息与问答库中存储的问题之间的相似度;
判断单元,用于根据计算单元的计算结果,判断与用户聊天信息相似度最 高的存储问题;
反馈单元,用于将判断单元判断的相似度最高的存储问题对应的反馈信息 反馈至交互平台。
在本技术方案中,将用户聊天信息逐一与存储的问题进行相似度计算,将 相似度最高的问题对应的答案作为反馈信息反馈至用户,最大程度保证反馈信 息的准确性。
进一步优选地,所述聊天机器人中还包括用户反馈模块,用于在通过交互 平台将反馈信息反馈至用户之后,获取用户对反馈信息的满意度。
进一步优选地,所述聊天机器人中还包括知识库更新模块,用于综合多个 用户反馈的满意度将交互平台中相应的问答对更新至知识库中。
在本技术方案中,根据用户对反馈信息的满意度将对话更新至知识库中, 以此实现知识库的自动更新,大大减少了工作人员的工作量;且综合多个用户 反馈的满意度进行知识库的更新,有效排除有些用户恶意差评的情况,提高系 统的可信度。
本发明还提供了一种聊天机器人自动聊天方法,所述聊天机器人中包括 一,存储有逻辑行为自然常识、对话信息蕴含的关键字段及与之匹配的反馈字 段的知识库及一存储有词汇库、对话信息中蕴含的问答对及其对应的关键字的 问答库,所述自动聊天方法中包括:
S1与用户进行信息交互获取用户聊天信息;
S2对获取的用户聊天信息进行预处理,包括分词得到其中蕴含的关键字/ 关键字段;
S3根据得到的关键字在知识库中查询匹配的反馈字段;
S4若在知识库中查询到匹配关键字,根据查询到的反馈字段和知识库中 的逻辑行为自然常识将反馈信息反馈至用户;
S5若在知识库中未查询到匹配关键字,运算用户聊天信息与问答库中存 储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信息反馈至用 户。
在本技术方案中,在该聊天机器人中既包括高可靠性和高逻辑性的知识 库,又包括大批量生产的问答库,这样,在与用户进行对话的过程中,首先利 用知识库进行问题匹配,若匹配到了则返回相应的反馈信息;若没有匹配到则 利用问答库得出相似度最高的反馈信息反馈至用户,以此保证了聊天机器人的 可靠性。
进一步优选地,在步骤S2中具体包括:
将获取的用户聊天信息拆分成若干分词;
对拆分单元拆分得到的分词进行语素识别;
根据语素识别单元的识别结果整理得到关键字/关键字段。
在本技术方案中,对用户聊天信息进行拆分之后,进行语素识别,以此根 据词汇库将停用词等去掉,以此提高反馈查询模块的查询效率和准确度。
进一步优选地,在步骤S5中具体包括:
计算用户聊天信息与问答库中存储的问题之间的相似度;
根据计算单元的计算结果,判断与用户聊天信息相似度最高的存储问题;
将相似度最高的存储问题对应的反馈信息反馈至用户。
在本技术方案中,将用户聊天信息逐一与存储的问题进行相似度计算,将 相似度最高的问题对应的答案作为反馈信息反馈至用户,最大程度保证反馈信 息的准确性。
进一步优选地,在步骤S5之后,所述自动聊天方法中还包括:
S6获取用户对反馈信息的满意度;
S7根据满意度将相应的问答对更新至知识库中。
在本技术方案中,根据用户对反馈信息的满意度将对话更新至知识库中, 以此实现知识库的自动更新,大大减少了工作人员的工作量;且综合多个用户 反馈的满意度进行知识库的更新,有效排除有些用户恶意差评的情况,提高系 统的可信度。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技 术特征、优点及其实现方式予以进一步说明。
图1为现有技术中问答系统工作流程示意图;
图2为本发明中聊天机器人一种实施方式示意图;
图3为本发明中预处理模块示意图;
图4为本发明中相似度运算模块示意图;
图5为本发明中聊天机器人另一种实施方式示意图;
图6为本发明中聊天机器人另一种实施方式示意图;
图7为本发明中聊天机器人自动聊天方法一种实施方式流程示意图;
图8为本发明中聊天机器人自动聊天方法一种实施方式流程示意图。
附图标记:
100-聊天机器人,110-知识库,120-问答库,130-交互平台,140-预处理模 块,141-拆分单元,142-语素识别单元,143-整理单元,150-反馈查询模块,160- 相似度运算模块,161-计算单元,162-判断单元,163-反馈单元,170-用户反馈 模块,180-知识库更新模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附 图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图,并获得其他的实施方式。
如图2所示为本发明提供的聊天机器人一种实施方式示意图,从图中可以 看出,在该聊天机器人100中包括:知识库110、问答库120、交互平台130、 预处理模块140、反馈查询模块150以及相似度运算模块160,其中,预处理 模块140与交互平台130连接,反馈查询模块150分别与预处理模块140和知 识库110连接,相似度运算模块160分别与反馈查询模块150和问答库120连 接。
在本实施方式中,知识库110中存储有逻辑行为自然常识、词汇库、对话 信息蕴含的关键字段及与之匹配的反馈字段,其中,关键字段由多个关键字组 成;问答库120中存储有词汇库、对话信息中蕴含的问答对及其对应的关键字。 在实际应用中,在使用聊天机器人100进行聊天服务之前,根据该聊天机器人 100需要应用的领域建立逻辑性强和高可靠性的知识库110,在该知识库110 中除了包括逻辑行为自然常识和词汇库之外,还包括日常聊天对话。此外,基 于大量一问一答形式的问答对批量生成问答库120,并对其中的问题进行关键 字提取。在一实例中,假若该聊天机器人将服务于儿童服装行业,则针对儿童 服装行业建立知识库,同时自动生成问答库存储在聊天机器人中。
基于此,在工作过程中,当聊天机器人通过交互平台130获取到用户发送 的聊天信息之后,随即通过预处理模块140对其进行预处理,包括分词得到其 中蕴含的关键字/关键字段。得到关键字之后,反馈查询模块150根据得到的关 键字在知识库110中进行严格的问题匹配,若匹配到相应的问题,则找到该问 题对应的答案(匹配到的反馈字段),并根据查询到的反馈字段和知识库110 中的逻辑行为自然常识将反馈信息反馈至交互平台130进行显示。若没有匹配 到相应的问题,则相似度运算模块160计算用户聊天信息与问答库120中存储 的问题之间的相似度,并根据运算结果将相似度最高的反馈信息反馈至交互平 台130,以此保证了聊天机器人的可靠性。
在一实例中,知识库中采用树状结构的方式存储关键字,反馈查询模块在 查询过程中根据在知识库中查询到相应的关键字组成关键字段,以此得到相应 的反馈字段。具体,假若用户通过交互平台询问“今天是星期几”,预处理模 块接收到该聊天信息之后,随即对其进行预处理进行分词得到关键词“今天”、 “是”、“星期几”,此后,反馈查询模块根据得到的关键词在知识库中进行 查找,查找到根节点“今天”之后进一步依次查找关键字“是”和“星期几”, 若查找到知识库中包括该三个关键字并能够组成关键字段,则反馈相应关键字 段对应的反馈字段“今天是星期一”。此外,若反馈查询模块根据逻辑行为自 然常识判断出“今天是星期五”,则反馈查询模块根据判断结果生成反馈信息 并将其反馈至交互平台,通知用户。
对上述实施方式进行改进得到本实施方式,在本实施方式中,该聊天机器 人100中包括:知识库110、问答库120、交互平台130、预处理模块140、反 馈查询模块150以及相似度运算模块160,其中,如图3所示,预处理模块140 包括:拆分单元141、语素识别单元142以及整理单元143,其中,语素识别 单元142分别与拆分单元141和整理单元143连接。
在工作过程中,预处理模块140从交互平台130中获取了聊天信息之后, 随即通过拆分单元141对其进行拆分得到分词,之后通过语素识别单元142对 其语素进行识别,最后整理单元143根据语素识别单元142的识别结果整理得 到关键字/关键字段。更进一步来说,在整理单元143中,根据预设规则和语素 识别单元142的识别结果保留相应的分词,将不需要的分词去除,如停用词, 并根据问答库120中的词汇库对保留的分词进行语义扩展得到关键字/关键字 段。要说明的是,在本实施方式中,语素识别单元142对识别的素词类别根据 实际需求进行设定;整理单元143中根据语素识别单元142的识别结果对各分 词的保留去除同样根据实际需求进行设定,在此不做具体限定。
在一实例中,根据需求,语素识别单元识别聊天信息中的主语、谓语、宾 语等,在识别完了之后,根据词汇库将其中包括的停用词去除,在去除了停用 词之后,将剩余的分词进一步根据词汇库进行扩展得到关键字。假若用户通过 交互平台询问“今天空调的价格”,拆分单元将其拆分为“今天”、“空调”、 “的”、“价格”之后,语素识别单元对其语素进行识别,以此整理单元将停 用词“的”除去,根据词汇库将剩余的分词“今天”、“空调”、“价格”其 进行语义扩展,将“价格”扩展为“多少钱”、“怎么卖”、“价钱”,得到 关键字“今天”、“空调”、“价格”、“多少钱”、“怎么卖”、“价钱”。 要说明的是,反馈查询模块在知识库中查询的过程中,根据扩展之前的关键词 进行查询严格匹配,只有在知识库中查询到根据“今天”“空调”“价格”三 个关键词组成的关键字段,才将相应的反馈字段进行反馈,否则使用相似度运 算模块根据语义扩展之后的关键词运算其与各存储问题之间的相似度,并根据 计算结果得到反馈字段。
对上述实施方式进行改进得到本实施方式,在本实施方式中,该聊天机器 人100中包括:知识库110、问答库120、交互平台130、预处理模块140、反 馈查询模块150以及相似度运算模块160,其中,预处理模块140包括:拆分 单元141、语素识别单元142以及整理单元143,其中,语素识别单元142分 别与拆分单元141和整理单元143连接。如图4所示,在相似度运算模块160 中包括:计算单元161、判断单元162以及反馈单元163,其中判断单元162分别与计算单元161和反馈单元连接163。
在本实施方式中,反馈查询模块150根据关键字在知识库110中没有查询 到相应的关键字段之后,随即通过计算单元161计算用户聊天信息与问答库120 中存储的问题之间的相似度;之后,判断单元162根据计算单元161的计算结 果,判断与用户聊天信息相似度最高的存储问题;最后,反馈单元163将判断 单元162判断的相似度最高的存储问题对应的反馈信息反馈至交互平台130。 在一实例中,计算单元计算聊天信息与问答库中存储的问题之间的余弦相似 度,并根据计算的结果判断与聊天信息相似度最高的存储问题,以此反馈单元 将其对应的反馈字段作为反馈信息进行反馈。在其他实例中,还可以采用其他方式计算聊天信息与存储问题之间的相似度,在此不做限定,根据实际情况进 行设定。
对上述实施方式进行改进得到本实施方式,在本实施方式中,如图5所示, 该聊天机器人100中除了包括上述知识库110、问答库120、交互平台130、预 处理模块140、反馈查询模块150以及相似度运算模块160之外,还包括用户 反馈模块170,用于在通过交互平台130将反馈信息反馈至用户之后,获取用 户对反馈信息的满意度。
在本实施方式中,反馈查询模块150将查询到的反馈信息反馈至交互平台 130或相似度运算模块160将反馈信息反馈至交互平台130之后,用户反馈模 块170通过交互平台130针对所做的问答获取用户的满意度评分。具体,在评 分的过程中,用户反馈模块170针对各问答对获取用户满意度评分。在一实例 中,假若某一用户通过交互平台130提问“今天星期几”和“今天空调卖多少 钱”,则得到反馈信息之后,用户在交互平台130中分别对两个问题的反馈信 息进行评分,并通过用户反馈模块170对该用户的评分进行统计存储。
对上述实施方式进行改进得到本实施方式,在本实施方式中,如图6所示, 该聊天机器人100中除了包括上述知识库110、问答库120、交互平台130、预 处理模块140、反馈查询模块150、相似度运算模块160以及用户反馈模块170 之外,还包括知识库更新模块180,用于综合多个用户反馈的满意度将交互平 台130中相应的问答对更新至知识库110中。
在本实施方式中,反馈查询模块150将查询到的反馈信息反馈至交互平台 130或相似度运算模块160将反馈信息反馈至交互平台130之后,用户反馈模 块170通过交互平台130针对所做的问答获取用户的满意度评分,以此知识库 更新模块180根据用户反馈模块170统计的满意度将问答对更新至知识库110 中,大大减少了工作人员的工作量,且知识库更新模块180综合多个用户反馈 的满意度进行知识库110的更新,有效排除有些用户恶意差评的情况,提高系 统的可信度。
在一实例中,假若有10个用户都通过交互平台130提问“今天星期几” 和“今天空调卖多少钱”,在得到反馈信息之后,分别在交互平台130中对两 个问题的反馈信息进行评分,用户反馈模块170对该用户的评分进行统计之后 发现,10个用户对“今天星期几”的反馈信息平均满意度大于预设值,如80%, 但是对“今天空调卖多少钱”的反馈信息平均满意度小于预设值,如80%,则 知识库更新模块180将基于“今天星期几”的问答对更新至知识库110中,实 现知识库110的自动扩充。在其他实例中,还可以将上述预设值设定为其他值,如85%、90%等,在此不做具体限定。
本发明还提供了一种聊天机器人自动聊天方法,聊天机器人中包括一,存 储有逻辑行为自然常识、对话信息蕴含的关键字段及与之匹配的反馈字段的知 识库及一存储有词汇库、对话信息中蕴含的问答对及其对应的关键字的问答 库,如图7所示,在该自动聊天方法一种实施方式中包括:S1与用户进行信 息交互获取用户聊天信息;S2对获取的用户聊天信息进行预处理,包括分词 得到其中蕴含的关键字/关键字段;S3根据得到的关键字在知识库中查询匹配 的反馈字段;S4若在知识库中查询到匹配关键字,根据查询到的反馈字段和 知识库中的逻辑行为自然常识将反馈信息反馈至用户;S5若在知识库中未查 询到匹配关键字,运算用户聊天信息与问答库中存储的问题之间的相似度,并 根据运算结果将相应问题对应的反馈信息反馈至用户。
在本实施方式中,知识库中存储有逻辑行为自然常识、词汇库、对话信息 蕴含的关键字段及与之匹配的反馈字段,其中,关键字段由多个关键字组成; 问答库中存储有词汇库、对话信息中蕴含的问答对及其对应的关键字。在实际 应用中,在使用聊天机器人进行聊天服务之前,根据该聊天机器人需要应用的 领域建立逻辑性强和高可靠性的知识库,在该知识库中除了包括逻辑行为自然 常识和词汇库之外,还包括日常聊天对话。此外,基于大量一问一答形式的问 答对批量生成问答库,并对其中的问题进行关键字提取。
基于此,在工作过程中,当聊天机器人通过交互平台获取到用户发送的聊 天信息之后,随即通过对其进行预处理,包括分词得到其中蕴含的关键字/关键 字段。得到关键字之后,根据得到的关键字在知识库中进行严格的问题匹配, 若匹配到相应的问题,则找到该问题对应的答案(匹配到的反馈字段),并根 据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信息反馈至交互 平台进行显示。若没有匹配到相应的问题,则计算用户聊天信息与问答库中存 储的问题之间的相似度,并根据运算结果将相似度最高的反馈信息反馈至交互 平台,以此保证了聊天机器人的可靠性。
在一实例中,知识库中采用树状结构的方式存储关键字,反馈查询模块在 查询过程中根据在知识库中查询到相应的关键字组成关键字段,以此得到相应 的反馈字段。具体,假若用户通过交互平台询问“今天天气怎么样”,预处理 模块接收到该聊天信息之后,随即对其进行预处理进行分词得到关键词“今 天”、“天气”、“怎么样”,此后,反馈查询模块根据得到的关键词在知识 库中进行查找,查找到根节点“今天”之后进一步依次查找关键字“天气”和 “怎么样”,若在知识库中查找不到包括该三个关键字的关键字段,则相似度运算模块进一步计算该聊天信息计算其与问答库中各问题之间的余弦相似度, 经过计算后发现,问答库中与该聊天信息相似度最高的问题为“今天天气如 何”,则反馈相应问题对应的反馈字段“今天是晴天”,生成反馈信息将其反 馈至交互平台,通知用户。
对上述实施方式进行改进得到本实施方式,在本实施方式中,在该自动聊 天方包括:S1与用户进行信息交互获取用户聊天信息;S21将获取的用户聊 天信息拆分成若干分词;S22对拆分单元拆分得到的分词进行语素识别;S23 根据语素识别单元的识别结果整理得到关键字/关键字段;S3根据得到的关键 字在知识库中查询匹配的反馈字段;S4若在知识库中查询到匹配关键字,根 据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信息反馈至用户; S5若在知识库中未查询到匹配关键字,运算用户聊天信息与问答库中存储的 问题之间的相似度,并根据运算结果将相应问题对应的反馈信息反馈至用户。
在本实施方式中,从交互平台中获取了聊天信息之后,随即对其进行拆分 得到分词,之后对其语素进行识别,最后根据语素识别单元的识别结果整理得 到关键字/关键字段。更进一步来说,在整理过程中,根据预设规则和语素识别 单元的识别结果保留相应的分词,将不需要的分词去除,如停用词,并根据问 答库中的词汇库对保留的分词进行语义扩展得到关键字/关键字段。
在一实例中,假若用户通过交互平台询问“今天空调的价格”,拆分得到 “今天”、“空调”、“的”、“价格”之后,随即对其语素进行识别,并根 据需求将停用词“的”除去,最后根据词汇库将剩余的分词“今天”、“空调”、 “价格”其进行语义扩展,将“价格”扩展为“多少钱”、“怎么卖”、“价 钱”,得到关键字“今天”、“空调”、“价格”、“多少钱”、“怎么卖”、 “价钱”。要说明的是,在知识库中查询的过程中,根据扩展之前的关键词进 行查询严格匹配,只有在知识库中查询到根据“今天”“空调”“价格”三个 关键词组成的关键字段,才将相应的反馈字段进行反馈,否则使用语义扩展之 后的关键词运算其与各存储问题之间的相似度,并根据计算结果得到反馈字 段。
对上述实施方式进行改进得到本实施方式,在本实施方式中,在该自动聊 天方包括:S1与用户进行信息交互获取用户聊天信息;S21将获取的用户聊 天信息拆分成若干分词;S22对拆分单元拆分得到的分词进行语素识别;S23 根据语素识别单元的识别结果整理得到关键字/关键字段;S3根据得到的关键 字在知识库中查询匹配的反馈字段;S4若在知识库中查询到匹配关键字,根 据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信息反馈至用户; S51计算用户聊天信息与问答库中存储的问题之间的相似度;S52根据计算单 元的计算结果,判断与用户聊天信息相似度最高的存储问题;S53将相似度最 高的存储问题对应的反馈信息反馈至用户。
在本实施方式中,根据关键字在知识库中没有查询到相应的关键字段之 后,随即通过计算用户聊天信息与问答库中存储的问题之间的相似度;之后, 根据计算结果,判断与用户聊天信息相似度最高的存储问题;最后,将判断的 相似度最高的存储问题对应的反馈信息反馈至交互平台。在一实例中,计算聊 天信息与问答库中存储的问题之间的余弦相似度,并根据计算的结果判断与聊 天信息相似度最高的存储问题,以此反馈单元将其对应的反馈字段作为反馈信 息进行反馈。在其他实例中,还可以采用其他方式计算聊天信息与存储问题之 间的相似度,在此不做限定,根据实际情况进行设定。
对上述实施方式进行改进得到本实施方式,在本实施方式中,如图8所示, 在该自动聊天方法中包括:S1与用户进行信息交互获取用户聊天信息;S2对 获取的用户聊天信息进行预处理,包括分词得到其中蕴含的关键字/关键字段; S3根据得到的关键字在知识库中查询匹配的反馈字段;S4若在知识库中查询 到匹配关键字,根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈 信息反馈至用户;S5若在知识库中未查询到匹配关键字,运算用户聊天信息 与问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈 信息反馈至用户;S6获取用户对反馈信息的满意度;S7根据满意度将相应的问答对更新至知识库中。
在本实施方式中,将在知识库中查询到的反馈信息反馈至交互平台或将问 答库中查询到的反馈信息反馈至交互平台之后,通过交互平台针对所做的问答 获取用户的满意度评分。具体,在评分的过程中,针对各问答分别获取用户满 意度评分并进行统计,以此根据用户反馈模块统计的满意度将问答对更新至知 识库中,大大减少了工作人员的工作量,且知识库更新模块综合多个用户反馈 的满意度进行知识库的更新,有效排除有些用户恶意差评的情况,提高系统的 可信度。
在一实例中,假若有10个用户都通过交互平台提问“今天星期几”和“今 天空调卖多少钱”,在得到反馈信息之后,分别在交互平台中对两个问题的反 馈信息进行评分,对该用户的评分进行统计之后发现,10个用户对“今天星期 几”和“今天空调卖多少钱”的反馈信息平均满意度均大于预设值,如80%, 则将两个问题的问答对都更新至知识库中,实现知识库的自动扩充。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明 的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离 本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为 本发明的保护范围。
Claims (10)
1.一种聊天机器人,其特征在于,所述聊天机器人中包括:
知识库,存储的数据包括逻辑行为自然常识、词汇库、对话信息蕴含的关键字段及与之匹配的反馈字段,所述关键字段由多个关键字组成;
问答库,存储的数据包括词汇库、对话信息中蕴含的问答对及其对应的关键字;
交互平台,用于与用户进行信息交互;
预处理模块,用于对通过交互平台获取的用户聊天信息进行预处理,包括分词得到其中蕴含的关键字/关键字段;
反馈查询模块,用于根据预处理模块得到的关键字在知识库中查询匹配的反馈字段,并根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信息反馈至交互平台;
相似度运算模块,用于根据反馈查询模块的查询结果运算用户聊天信息与问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信息反馈至交互平台。
2.如权利要求1所述的聊天机器人,其特征在于,在所述预处理模块中包括:
拆分单元,用于将通过交互平台获取的用户聊天信息拆分成若干分词;
语素识别单元,用于对拆分单元拆分得到的分词进行语素识别;
整理单元,用于根据语素识别单元的识别结果整理得到关键字/关键字段。
3.如权利要求2所述的聊天机器人,其特征在于,在所述整理单元中:根据预设规则和语素识别单元的识别结果保留相应的分词,并根据问答库中的词汇库对保留的分词进行语义扩展得到关键字/关键字段。
4.如权利要求1或2或3所述的聊天机器人,其特征在于,在所述相似度运算模块中包括:
计算单元,用于计算用户聊天信息与问答库中存储的问题之间的相似度;
判断单元,用于根据计算单元的计算结果,判断与用户聊天信息相似度最高的存储问题;
反馈单元,用于将判断单元判断的相似度最高的存储问题对应的反馈信息反馈至交互平台。
5.如权利要求1或2或3所述的聊天机器人,其特征在于,所述聊天机器人中还包括用户反馈模块,用于在通过交互平台将反馈信息反馈至用户之后,获取用户对反馈信息的满意度。
6.如权利要求5所述的聊天机器人,其特征在于,所述聊天机器人中还包括知识库更新模块,用于综合多个用户反馈的满意度将交互平台中相应的问答对更新至知识库中。
7.一种聊天机器人自动聊天方法,其特征在于,所述聊天机器人中包括一,存储有逻辑行为自然常识、对话信息蕴含的关键字段及与之匹配的反馈字段的知识库及一存储有词汇库、对话信息中蕴含的问答对及其对应的关键字的问答库,所述自动聊天方法中包括:
S1与用户进行信息交互获取用户聊天信息;
S2对获取的用户聊天信息进行预处理,包括分词得到其中蕴含的关键字/关键字段;
S3根据得到的关键字在知识库中查询匹配的反馈字段;
S4若在知识库中查询到匹配关键字,根据查询到的反馈字段和知识库中的逻辑行为自然常识将反馈信息反馈至用户;
S5若在知识库中未查询到匹配关键字,运算用户聊天信息与问答库中存储的问题之间的相似度,并根据运算结果将相应问题对应的反馈信息反馈至用户。
8.如权利要求7所述的自动聊天方法,其特征在于,在步骤S2中具体包括:
将获取的用户聊天信息拆分成若干分词;
对拆分单元拆分得到的分词进行语素识别;
根据语素识别单元的识别结果整理得到关键字/关键字段。
9.如权利要求7所述的自动聊天方法,其特征在于,在步骤S5中具体包括:
计算用户聊天信息与问答库中存储的问题之间的相似度;
根据计算单元的计算结果,判断与用户聊天信息相似度最高的存储问题;
将相似度最高的存储问题对应的反馈信息反馈至用户。
10.如权利要求7或8或9所述的自动聊天方法,其特征在于,在步骤S5之后,所述自动聊天方法中还包括:
S6获取用户对反馈信息的满意度;
S7根据满意度将相应的问答对更新至知识库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710251306.8A CN107025297A (zh) | 2017-04-18 | 2017-04-18 | 一种聊天机器人及其自动聊天方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710251306.8A CN107025297A (zh) | 2017-04-18 | 2017-04-18 | 一种聊天机器人及其自动聊天方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107025297A true CN107025297A (zh) | 2017-08-08 |
Family
ID=59526425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710251306.8A Pending CN107025297A (zh) | 2017-04-18 | 2017-04-18 | 一种聊天机器人及其自动聊天方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107025297A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107471226A (zh) * | 2017-09-21 | 2017-12-15 | 塔米智能科技(北京)有限公司 | 一种服务机器人系统及其交互方法 |
CN108509477A (zh) * | 2017-09-30 | 2018-09-07 | 平安科技(深圳)有限公司 | 语义识别方法、电子装置及计算机可读存储介质 |
CN109299240A (zh) * | 2018-09-30 | 2019-02-01 | 北京小谛机器人科技有限公司 | 聊天机器人信息交互方法及装置 |
CN109388748A (zh) * | 2018-09-26 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 一种评论信息的回复方法、存储介质和服务器 |
CN110019708A (zh) * | 2017-11-15 | 2019-07-16 | 上海挖数互联网科技有限公司 | 聊天机器人的语料生成方法及装置、存储介质、服务器 |
CN110114764A (zh) * | 2017-09-18 | 2019-08-09 | 微软技术许可有限责任公司 | 在会话中提供饮食帮助 |
CN110188183A (zh) * | 2019-06-04 | 2019-08-30 | 软通智慧科技有限公司 | 一种智能问答知识库的更新方法、装置、设备和存储介质 |
CN110321931A (zh) * | 2019-06-05 | 2019-10-11 | 上海易点时空网络有限公司 | 原创内容仲裁方法及装置 |
CN110992643A (zh) * | 2019-11-28 | 2020-04-10 | 航天精一(广东)信息科技有限公司 | 基于知识推理的接处警预案管理平台 |
CN111145903A (zh) * | 2019-12-18 | 2020-05-12 | 东北大学 | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 |
CN109189897B (zh) * | 2018-07-27 | 2020-07-31 | 什伯(上海)智能技术有限公司 | 一种基于数据内容匹配的聊天方法及聊天装置 |
CN112035638A (zh) * | 2020-08-28 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、存储介质及设备 |
CN112199471A (zh) * | 2020-10-12 | 2021-01-08 | 康佳集团股份有限公司 | 一种客服问题信息处理方法、设备及存储介质 |
CN113569019A (zh) * | 2021-05-24 | 2021-10-29 | 恩亿科(北京)数据科技有限公司 | 基于聊天对话进行知识提取的方法、系统、设备及存储介质 |
CN113918704A (zh) * | 2021-10-28 | 2022-01-11 | 平安普惠企业管理有限公司 | 基于机器学习的问答方法、装置、电子设备及介质 |
CN115277613A (zh) * | 2022-07-01 | 2022-11-01 | 浪潮通信信息系统有限公司 | 一种基于业务的机器人聊天系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760128A (zh) * | 2011-04-26 | 2012-10-31 | 华东师范大学 | 一种基于智能客服机器人交互的电信领域套餐推荐方法 |
US20150120718A1 (en) * | 2013-10-24 | 2015-04-30 | International Business Machines Corporation | Smart question routing and answerer growing for online community question-answer services |
CN104615646A (zh) * | 2014-12-25 | 2015-05-13 | 上海科阅信息技术有限公司 | 智能聊天机器人系统 |
CN105824970A (zh) * | 2016-04-12 | 2016-08-03 | 华南师范大学 | 基于大数据知识库和用户反馈的机器人交互方法和系统 |
CN106294616A (zh) * | 2016-08-02 | 2017-01-04 | 长江大学 | 一种基于移动互联网的智能问答机器人系统 |
-
2017
- 2017-04-18 CN CN201710251306.8A patent/CN107025297A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760128A (zh) * | 2011-04-26 | 2012-10-31 | 华东师范大学 | 一种基于智能客服机器人交互的电信领域套餐推荐方法 |
US20150120718A1 (en) * | 2013-10-24 | 2015-04-30 | International Business Machines Corporation | Smart question routing and answerer growing for online community question-answer services |
CN104615646A (zh) * | 2014-12-25 | 2015-05-13 | 上海科阅信息技术有限公司 | 智能聊天机器人系统 |
CN105824970A (zh) * | 2016-04-12 | 2016-08-03 | 华南师范大学 | 基于大数据知识库和用户反馈的机器人交互方法和系统 |
CN106294616A (zh) * | 2016-08-02 | 2017-01-04 | 长江大学 | 一种基于移动互联网的智能问答机器人系统 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110114764B (zh) * | 2017-09-18 | 2023-09-15 | 微软技术许可有限责任公司 | 在会话中提供饮食帮助 |
CN110114764A (zh) * | 2017-09-18 | 2019-08-09 | 微软技术许可有限责任公司 | 在会话中提供饮食帮助 |
CN107471226A (zh) * | 2017-09-21 | 2017-12-15 | 塔米智能科技(北京)有限公司 | 一种服务机器人系统及其交互方法 |
CN108509477A (zh) * | 2017-09-30 | 2018-09-07 | 平安科技(深圳)有限公司 | 语义识别方法、电子装置及计算机可读存储介质 |
US11392775B2 (en) | 2017-09-30 | 2022-07-19 | Ping An Technology (Shenzhen) Co., Ltd. | Semantic recognition method, electronic device, and computer-readable storage medium |
WO2019062010A1 (zh) * | 2017-09-30 | 2019-04-04 | 平安科技(深圳)有限公司 | 语义识别方法、电子装置及计算机可读存储介质 |
CN110019708A (zh) * | 2017-11-15 | 2019-07-16 | 上海挖数互联网科技有限公司 | 聊天机器人的语料生成方法及装置、存储介质、服务器 |
CN109189897B (zh) * | 2018-07-27 | 2020-07-31 | 什伯(上海)智能技术有限公司 | 一种基于数据内容匹配的聊天方法及聊天装置 |
CN109388748A (zh) * | 2018-09-26 | 2019-02-26 | 深圳壹账通智能科技有限公司 | 一种评论信息的回复方法、存储介质和服务器 |
CN109299240B (zh) * | 2018-09-30 | 2022-02-25 | 北京小谛机器人科技有限公司 | 聊天机器人知识展示方法及装置 |
CN109299240A (zh) * | 2018-09-30 | 2019-02-01 | 北京小谛机器人科技有限公司 | 聊天机器人信息交互方法及装置 |
CN110188183A (zh) * | 2019-06-04 | 2019-08-30 | 软通智慧科技有限公司 | 一种智能问答知识库的更新方法、装置、设备和存储介质 |
CN110321931A (zh) * | 2019-06-05 | 2019-10-11 | 上海易点时空网络有限公司 | 原创内容仲裁方法及装置 |
CN110992643A (zh) * | 2019-11-28 | 2020-04-10 | 航天精一(广东)信息科技有限公司 | 基于知识推理的接处警预案管理平台 |
CN110992643B (zh) * | 2019-11-28 | 2022-04-01 | 航天精一(广东)信息科技有限公司 | 基于知识推理的接处警预案管理平台 |
CN111145903A (zh) * | 2019-12-18 | 2020-05-12 | 东北大学 | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 |
CN112035638A (zh) * | 2020-08-28 | 2020-12-04 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、存储介质及设备 |
CN112199471A (zh) * | 2020-10-12 | 2021-01-08 | 康佳集团股份有限公司 | 一种客服问题信息处理方法、设备及存储介质 |
CN113569019A (zh) * | 2021-05-24 | 2021-10-29 | 恩亿科(北京)数据科技有限公司 | 基于聊天对话进行知识提取的方法、系统、设备及存储介质 |
CN113569019B (zh) * | 2021-05-24 | 2024-04-30 | 恩亿科(北京)数据科技有限公司 | 基于聊天对话进行知识提取的方法、系统、设备及存储介质 |
CN113918704A (zh) * | 2021-10-28 | 2022-01-11 | 平安普惠企业管理有限公司 | 基于机器学习的问答方法、装置、电子设备及介质 |
CN115277613A (zh) * | 2022-07-01 | 2022-11-01 | 浪潮通信信息系统有限公司 | 一种基于业务的机器人聊天系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107025297A (zh) | 一种聊天机器人及其自动聊天方法 | |
CN109493166B (zh) | 一种针对电子商务导购场景任务型对话系统的构建方法 | |
CN109522556B (zh) | 一种意图识别方法及装置 | |
CN107329967B (zh) | 基于深度学习的问答系统以及方法 | |
US11593763B2 (en) | Automated electronic mail assistant | |
CN106469554B (zh) | 一种自适应的识别方法及系统 | |
CN105608218A (zh) | 智能问答知识库的建立方法、建立装置及建立系统 | |
CN107590133A (zh) | 基于语义的招聘职位与求职简历匹配的方法及系统 | |
CN103593412B (zh) | 一种基于树形结构问题的应答方法及系统 | |
CN106528845A (zh) | 基于人工智能的检索纠错方法及装置 | |
CN106649742A (zh) | 数据库维护方法和装置 | |
CN109460457A (zh) | 文本语句相似度计算方法、智能政务辅助解答系统及其工作方法 | |
CN105677795B (zh) | 抽象语义的推荐方法、推荐装置及推荐系统 | |
CN111062220B (zh) | 一种基于记忆遗忘装置的端到端意图识别系统和方法 | |
US20040158562A1 (en) | Data quality system | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
CN104008160A (zh) | 一种实现并行话题控制的模糊推理聊天机器人方法和系统 | |
CN110765759A (zh) | 意图识别方法及装置 | |
CN111797202B (zh) | 一种基于人工智能的客服对话方法 | |
CN111581990A (zh) | 跨境交易撮合匹配方法及装置 | |
CN110096581A (zh) | 一种基于用户行为构建问答体系推荐问的系统及方法 | |
CN109885823A (zh) | 一种金融行业的分布式语义识别方法及系统装置 | |
CN112711950A (zh) | 地址信息抽取方法、装置、设备及存储介质 | |
CN109871527A (zh) | 一种基于分词的语义识别方法 | |
CN114238373A (zh) | 一种自然语言问题转换为结构化查询语句的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170808 |
|
WD01 | Invention patent application deemed withdrawn after publication |