CN108733722B - 一种对话机器人自动生成方法及装置 - Google Patents

一种对话机器人自动生成方法及装置 Download PDF

Info

Publication number
CN108733722B
CN108733722B CN201710270940.6A CN201710270940A CN108733722B CN 108733722 B CN108733722 B CN 108733722B CN 201710270940 A CN201710270940 A CN 201710270940A CN 108733722 B CN108733722 B CN 108733722B
Authority
CN
China
Prior art keywords
machine learning
learning model
user
robot
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710270940.6A
Other languages
English (en)
Other versions
CN108733722A (zh
Inventor
汤鹏飞
彭明超
白铖
王远斌
赵紫星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710270940.6A priority Critical patent/CN108733722B/zh
Priority to PCT/CN2018/083836 priority patent/WO2018196684A1/zh
Publication of CN108733722A publication Critical patent/CN108733722A/zh
Application granted granted Critical
Publication of CN108733722B publication Critical patent/CN108733722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Manipulator (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种对话机器人自动生成方法及装置,涉及机器学习领域,其中方法包括:基于用户输入的机器人建立指令确定所需创建的机器学习模型;将初始语料集合作为训练样本对机器学习模型进行训练;获取训练好的机器学习模型进行部署,并设置与机器学习模型对应的机器人对话入口;将对话交互信息输入与机器人对话入口相对应的机器学习模型,以使机器学习模型生成应答信息。本发明的对话机器人自动生成方法及装置,对用户开放建立和部署对话机器人的功能,机器学习模型的训练和部署由系统自动完成,用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答,提高了用户建立和部署对话机器人的效率,提升了用户体验。

Description

一种对话机器人自动生成方法及装置
技术领域
本发明涉及机器学习技术领域,尤其涉及一种对话机器人自动生成方法及装置。
背景技术
智能对话机器人利用自然语言处理、机器学习等人工智能领域技术,接收用户咨询问题,理解问题语义、识别用户意图并给出正确的应答。智能对话机器人通常使用机器学习模型接收用户咨询并生成应答。机器学习模型是一种数据模型,通过训练出的模型可对用户的咨询问题进行分类,从而识别用户意图。随着网络的发展,网络购物已经悄然兴起,现在的客服机器人需要通过专业技术人员通过编程建立并维护,难以满足业务高速发展的需要,不具有编程能力的普通用户具有构建属于自己的客服机器人的强烈愿望。因此,需要使普通用户能够生成基于机器学习模型的对话机器人的方法,以使普通用户能够无需编程也可构建客服机器人。
发明内容
有鉴于此,本发明要解决的一个技术问题是提供一种对话机器人自动生成方法及装置。
根据本发明的一个方面,提供一种对话机器人自动生成方法,包括:基于用户输入的机器人建立指令确定所需创建的机器学习模型;接收用户输入的初始语料集合,将初始语料集合作为训练样本对所述机器学习模型进行训练;基于用户输入的机器人部署指令获取训练好的所述机器学习模型进行部署,并设置与所述机器学习模型对应的机器人对话入口;接收到用户输入的对话交互信息,将所述对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型,以使所述机器学习模型生成应答信息。
可选地,所述接收用户输入的初始语料集合、将所述初始语料集合作为训练样本对所述机器学习模型进行训练包括:基于所述初始语料集合中的初始语料进行分类训练,获取用于判定所述初始语料的类别的分类规则;向用户显示所述分类规则,以使用户基于所述分类规则对所述初始语料进行分类,并对所述初始语料标注类别;接收到用户提交的对所述初始语料标注类别的结果,将标注有所述类别的初始语料作为训练样本对所述机器学习模型进行训练。
可选地,所述基于所述初始语料集合中的初始语料进行分类训练、获取用于判定所述初始语料的类别的分类规则包括:提取所述初始语料的特征信息,并利用特征上下位和/或特征同义词关系对所述特征信息进行泛化处理;对泛化处理后的所述特征信息进行聚类处理,用以获取所述初始语料的聚类结果;融合所述聚类结果得到所述初始语料的分类结果,基于所述分类结果建立所述分类规则。
可选地,在将所述初始语料集合作为训练样本对所述机器学习模型进行训练之后还包括:获取验证语料集合,使用所述机器学习模型对所述验证语料集合进行分类检验,获取所述验证语料集合中验证语料的类别;确定所述分类检验的成功率,判断所述成功率是否低于预设的阈值;如果是,则提示用户输入新的初始语料集合,将所述新的初始语料作为新的训练样本,用以继续对所述机器学习模型进行训练。
可选地,如果所述成功率高于所述阈值,则停止对所述机器学习模型进行训练;接收用户设置的与所述类别相对应的应答信息,并在所述机器学习模型中设置所述类别与所述应答信息的对应关系。
可选地,所述接收到用户输入的对话交互信息、将所述对话交互信息输入所述机器学习模型包括:接收到用户输入的文字信息,确定与文字信息相对应的机器人入口,并将所述文字信息发送至所述机器人入口;对所述文字信息进行纠错处理,并对所述文字信息进行分词处理,对进行所述分词处理后的文字信息进行特征词提取,构造所述文字信息的语义向量;将所述语义向量输入所述机器人入口对应的所述机器学习模型,以使所述机器学习模型基于所述语义向量确定所述文字信息的类别,获取与所述类别相对应的应答信息。
可选地,所述机器人包括:客服机器人,所述类别包括:退货、付款、购买。
根据本发明的又一方面,提供一种对话机器人自动生成装置,包括:模型确定模块,用于基于用户输入的机器人建立指令确定所需创建的机器学习模型;模型训练模块,用于接收用户输入的初始语料集合,将所述初始语料集合作为训练样本对所述机器学习模型进行训练;模型部署模块,用于基于用户输入的机器人部署指令获取训练好的所述机器学习模型进行部署,并设置与所述机器学习模型对应的机器人对话入口;运行控制模块,用于接收到用户输入的对话交互信息,将所述对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型,以使所述机器学习模型生成应答信息。
可选地,所述模型训练模块,包括:语料分类单元,用于基于所述初始语料集合中的初始语料进行分类训练,获取用于判定所述初始语料的类别的分类规则;标注提示单元,用于向用户显示所述分类规则,以使用户基于所述分类规则对所述初始语料进行分类,并对所述初始语料标注类别;样本训练单元,用于接收到用户提交的对所述初始语料标注类别的结果,将标注有所述类别的初始语料作为训练样本对所述机器学习模型进行训练。
可选地,所述语料分类单元,还用于提取所述初始语料的特征信息,并利用特征上下位和/或特征同义词关系对所述特征信息进行泛化处理;对泛化处理后的所述特征信息进行聚类处理,用以获取所述初始语料的聚类结果;融合所述聚类结果得到所述初始语料的分类结果,基于所述分类结果建立所述分类规则。
可选地,所述样本训练单元,还用于获取验证语料集合,使用所述机器学习模型对所述验证语料集合进行分类检验,获取所述验证语料集合中验证语料的类别;确定所述分类检验的成功率,判断所述成功率是否低于预设的阈值;如果是,则提示用户输入新的初始语料集合,将所述新的初始语料作为新的训练样本,用以继续对所述机器学习模型进行训练。
可选地,所述样本训练单元,还用于如果所述成功率高于所述阈值,则停止对所述机器学习模型进行训练;接收用户设置的与所述类别相对应的应答信息,并在所述机器学习模型中设置所述类别与所述应答信息的对应关系。
可选地,所述运行控制模块,还包括:入口确定单元,用于接收用户输入的文字信息,确定与文字信息相对应的机器人入口,并将所述文字信息发送至所述机器人入口;文本处理单元,用于对所述文字信息进行纠错处理,并对所述文字信息进行分词处理,对进行所述分词处理后的文字信息进行特征词提取,构造所述文字信息的语义向量;应答生成单元,用于将所述语义向量输入所述机器人入口对应的所述机器学习模型,以使所述机器学习模型基于所述语义向量确定所述文字信息的类别,获取与所述类别相对应的应答信息。
根据本发明的又一方面,提供一种对话机器人自动生成装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的对话机器人自动生成方法。
根据本发明的再一方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如上所述任一项所述的对话机器人自动生成方法。
本发明的对话机器人自动生成方法及装置,对用户开放建立和部署对话机器人的功能,机器学习模型的训练和部署由系统自动完成,用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答,提高了用户建立和部署对话机器人的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明的对话机器人自动生成方法的一个实施例的流程示意图;
图2为根据本发明的对话机器人自动生成方法的另一个实施例中的机器学习模型建立的流程示意图;
图3为根据本发明的对话机器人自动生成方法的又一个实施例中的机器学习模型生成应答的流程示意图;
图4为根据本发明的对话机器人自动生成装置的一个实施例的模块示意图;
图5为根据本发明的对话机器人自动生成装置的一个实施例中的模型训练模块的模块示意图;
图6为根据本发明的对话机器人自动生成装置的一个实施例中的运行控制模块的模块示意图;
图7为根据本发明的对话机器人自动生成装置的另一个实施例的模块示意图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面结合各个图和实施例对本发明的技术方案进行多方面的描述。
下文中的“第一”、“第二”等仅用于描述上相区别,并没有其它特殊的含义。
图1为根据本发明的对话机器人自动生成方法的一个实施例的流程示意图,如图所示:
步骤101,基于用户输入的机器人建立指令确定所需创建的机器学习模型。
机器学习模型可以为多种,例如逻辑回归模型、随机森林模型、贝叶斯方法模型、支持向量机模型、神经网络模型等。
步骤102,接收用户输入的初始语料集合,将初始语料集合作为训练样本对机器学习模型进行训练。
初始语料集合可以为在日常工作中所接收到的咨询问题。例如,一个电商接收到的客户通过QQ、邮件等发送的咨询问题,包括:询价、订货、退货等问题。
步骤103,基于用户输入的机器人部署指令获取训练好的机器学习模型进行部署,并设置与机器学习模型对应的机器人对话入口。
步骤104,接收到用户输入的对话交互信息,将对话交互信息输入与机器人对话入口相对应的机器学习模型,以使机器学习模型生成应答信息。
例如,在电商网站上部署基于训练好的机器学习模型的客服机器人,并在电商网站上设置客服服务标识作为机器人对话入口。客户点击客服服务标识则弹出提问窗口,客户在提问窗口中可以输入咨询问题,将咨询问题输入与提问窗口相对应的机器学习模型,机器学习模型生成应答信息,并向客户显示。
上述实施例中的对话机器人自动生成方法,可以对用户提供人机友好界面,例如为网页,并对所进行的每一步操作都进行使用提示,机器学习模型的建立、部署都由后台系统自动完成,使普通用户能够建立自定义的机器学习模型及基于该模型的客服机器人并进行部署,可以利用机器学习模型对客户的咨询等提供自动应答。
图2为根据本发明的对话机器人自动生成方法的另一个实施例中的机器学习模型建立的流程示意图,如图2所示:
步骤201,创建机器学习模型。用户通过人机界面输入自定义机器人名及开头语等,自动创建机器学习模型。
步骤202,接收用户输入的初始语料集合。机器学习模型需要学习已有的语料,用户通过人机界面导入已有的初始语料,可以基于初始语料集合中的初始语料进行分类训练。
步骤203,提取初始语料的特征信息,并利用特征上下位和/或特征同义词关系对特征信息进行泛化处理,对泛化处理后的特征信息进行聚类处理,获取初始语料的聚类结果。
泛化是指将一些相似的词替换为同一种表示,例如将“170cm”泛化为“170厘米”。聚类是指应用聚类算法将相似的语料归类到一起,为创建分类规则做参考。泛化和聚类处理都由系统自动进行。
步骤204,融合聚类结果得到初始语料的分类结果,基于分类结果建立分类规则。
文本描述模型可以为布尔逻辑模型、向量空间模型VSM、概率模型等。通过文本分类算法,可根据文本特征自动划分文档所属类别。文本分类算法有朴素贝叶斯、K邻近算法、支持向量机、人工神经网络等。
例如,将文本进行分词,提取文本特征词,最后利用提取的特征词构造空间向量表示文本。采用向量空间模型(VSM)将文本向量化为向量空间的点,采用向量夹角距离,向量内积或者欧几里得几何距离判定文本相似度。
以聚类结果为参考,可以使用多种分类工具创建一些分类类别。例如,用户导入的初始语料是有关电商售后政策的,以如下三个语料为例:1、怎么退货?2、我要退货;3、退款怎么还没收到。则可建立两个分类规则“退货”及“退款”。语料1和2属于“退货”分类,语料3属于“退款”分类。
步骤205,对初始语料标注类别。通过人机界面向用户显示分类规则,用户基于分类规则对初始语料进行分类,并对初始语料标注类别。
分类规则创建完毕后,需要人工对导入的初始语料一一进行标注。标注即将语料标为属于分类规则的哪一个分类,以便机器学习模型“学习”。例如已经有“退款”分类,可将初始语料“在哪可申请退款”标注为属于“退款”分类。也可以用机器学习模型自动对需标注的初始语料进行类别标注,为人工标注提供参考。
步骤206,对机器学习模型进行训练。接收到用户提交的对初始语料标注类别的结果,将标注有类别的初始语料作为训练样本对机器学习模型进行训练。可以根据建立的机器学习模型类型,选取相应的方法进行训练。
步骤207,验证机器学习模型。获取验证语料集合,使用机器学习模型对验证语料集合进行分类检验,获取验证语料集合中验证语料的类别。确定分类检验的成功率,判断成功率是否低于预设的阈值,如果是,则提示用户输入新的初始语料集合,将新的初始语料作为新的训练样本,继续对机器学习模型进行训练,即重复步骤202-206。
步骤208,部署机器学习模型。如果使用机器学习模型对验证语料集合进行分类检验的成功率高于阈值,则停止对机器学习模型进行训练。如果用户需要部署机器人,通过人机界面进行设置。接收用户设置的与类别相对应的应答信息,例如,对于“退货”类别设置相关的退货政策信息作为应答信息。并设置与机器学习模型对应的机器人对话入口。
机器学习模型的训练、部署由系统自动完成,通过语料及标注结果训练机器学习模型,采用的机器学习算法有逻辑回归、支持向量机等。机器学习模型训练完成后需由系统自动对其分类的准确率进行估测,准确率高于阈值时,机器学习模型才可上线,低于阈值则需增加样本或修改标注重新训练。
图3为根据本发明的对话机器人自动生成方法的又一个实施例中的机器学习模型生成应答的流程示意图,如图3所示:
步骤,确定文字信息对应的机器人入口。接收到用户输入的文字信息,确定与文字信息相对应的机器人入口,并将文字信息发送至机器人入口。
例如,对于一个系统可能会有多个机器人,每个机器人会有多个入口。以电商网站为例,商品页、订单页、售后页等都会有客服机器人图标,点击这些图标便可咨询客服机器人。接收到用户的咨询请求后首先要定位用户咨询的机器人及对应入口。
步骤302,对文字信息进行纠错处理。纠错处理是纠正用户咨询的文字信息里的错别字或错误语法。
步骤303,对文字信息进行分词处理。分词处理是基于分词算法将用户的文字信息分成独立的词。
步骤304,对进行分词处理后的文字信息进行特征词提取,构造文字信息的语义向量。在分词之后得到的集合中,会发现一些无效词,可以被排除。也可以识别出文字信息里特定的实体,如手机号实体,长度实体等。构造文字信息的语义向量是构造在向量空间的向量,即文本向量空间模型中的向量,将文字信息转换为二进制表示,以便进行分类。
步骤306,将语义向量输入机器人入口对应的机器学习模型。
步骤307,机器学习模型基于语义向量确定文字信息的类别,获取与类别相对应的应答信息。机器学习模型采用向量空间模型进行分类,将语义向量与向量空间模型的已知类别的向量进行比对,采用向量夹角距离,向量内积或者欧几里得几何距离判定相似度,获取最相似的已知类别的向量,即确定用户输入的文字信息的类别。
机器学习模型可以进行意图识别,即用构造的机器学习模型对文字信息转换而成的向量进行分类,识别用户问话对应的类别,而后用应答引擎给出对应的回答。例如,机器学习模型生成应答的过程如下所示:
用户问:“我要退货”。对文本信息“我要退货”进行纠错:无错误,不需纠正。对文本信息“我要退货”进行分词处理的结果为:转换为“我|要|退货”。进行实体识别:无要识别的实体。构造向量空间:在分词基础上再对用户问话进行切分,如切换为“我|我要|要|要退|退|退货|货”,假设机器人词库有一万个字词,则词库可理解为一个具有一万个字词的数组,“我|我要|要|要退|退|退货|货”包含7个字词,若词库中存在“我”、“我要”等字词,则对应数组元素为1,否则为0。从而用户问话为转换为形如“00000010000…………”的二进制串,此二进制串则为用户问话转换而成的向量。将向量用机器学习模型进行分类,可分类为“退货”,根据“退货”类别预定义的应答策略和信息给出预先设置的答案。
上述实施例中提供的对话机器人自动生成方法,对用户开放建立和部署对话机器人的功能,机器学习模型的训练和部署由系统自动完成,用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答,提高了用户建立和部署对话机器人的效率。
在一个实施例中,本发明提供一种对话机器人自动生成装置40,包括:模型确定模块41、模型训练模块42、模型部署模块43和运行控制模块44。模型确定模块41基于用户输入的机器人建立指令确定所需创建的机器学习模型。模型训练模块42接收用户输入的初始语料集合,将初始语料集合作为训练样本对机器学习模型进行训练。
模型部署模块43基于用户输入的机器人部署指令获取训练好的机器学习模型进行部署,并设置与机器学习模型对应的机器人对话入口。运行控制模块44接收到用户输入的对话交互信息,将对话交互信息输入与机器人对话入口相对应的机器学习模型,以使机器学习模型生成应答信息。
如图5所示,模型训练模块42包括:语料分类单元421、标注提示单元422和样本训练单元423。语料分类单元421基于初始语料集合中的初始语料进行分类训练,获取用于判定初始语料的类别的分类规则。标注提示单元422向用户显示分类规则,以使用户基于分类规则对初始语料进行分类,并对初始语料标注类别。样本训练单元423接收到用户提交的对初始语料标注类别的结果,将标注有类别的初始语料作为训练样本对机器学习模型进行训练。
语料分类单元421提取初始语料的特征信息,并利用特征上下位和/或特征同义词关系对特征信息进行泛化处理。语料分类单元421对泛化处理后的特征信息进行聚类处理,用以获取初始语料的聚类结果。语料分类单元421融合聚类结果得到初始语料的分类结果,基于分类结果建立分类规则。
样本训练单元423获取验证语料集合,使用机器学习模型对验证语料集合进行分类检验,获取验证语料集合中验证语料的类别。样本训练单元423确定分类检验的成功率,判断成功率是否低于预设的阈值。如果是,则样本训练单元423提示用户输入新的初始语料集合,将新的初始语料作为新的训练样本,用以继续对机器学习模型进行训练。
如果成功率高于阈值,则样本训练单元423停止对机器学习模型进行训练。样本训练单元423接收用户设置的与类别相对应的应答信息,并在机器学习模型中设置类别与应答信息的对应关系。
如图6所示,运行控制模块44包括:入口确定单元441、文本处理单元442和应答生成单元443。入口确定单元441接收用户输入的文字信息,确定与文字信息相对应的机器人入口,并将文字信息发送至机器人入口。文本处理单元442对文字信息进行纠错处理,并对文字信息进行分词处理,对进行分词处理后的文字信息进行特征词提取,构造文字信息的语义向量。应答生成单元443将语义向量输入机器人入口对应的机器学习模型,以使机器学习模型基于语义向量确定文字信息的类别,获取与类别相对应的应答信息。
图7为根据本发明的对话机器人自动生成装置的另一个实施例的模块示意图。如图7所示,该装置可包括存储器71、处理器72、通信接口73以及总线74。存储器71用于存储指令,处理器72耦合到存储器71,处理器72被配置为基于存储器71存储的指令执行实现上述的对话机器人自动生成方法。
存储器71可以为高速RAM存储器、非易失性存储器(non-volatile memory)等,存储器71也可以是存储器阵列。存储器71还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器72可以为中央处理器CPU,或专用集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明的对话机器人自动生成方法的一个或多个集成电路。
在一个实施例中,本发明提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上任一个实施例中的对话机器人自动生成方法。
上述实施例中提供的对话机器人自动生成方法及装置,对用户开放建立和部署对话机器人的功能,机器学习模型的训练和部署由系统自动完成,用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答,提高了用户建立和部署对话机器人的效率,并且基于机器学习模型能够快速、准确地生成应答信息,提升了用户体验。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (15)

1.一种对话机器人自动生成方法,其特征在于,包括:
基于用户通过人机界面输入的机器人建立指令确定所需创建的机器学习模型,用以自动创建机器学习模型;
接收用户输入的初始语料集合,将所述初始语料集合作为训练样本对所述机器学习模型进行训练;
基于用户通过人机界面输入的机器人部署指令获取训练好的所述机器学习模型进行部署,用以自动部署机器学习模型,并设置与所述机器学习模型对应的机器人对话入口;
接收到用户输入的对话交互信息,将所述对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型,以使所述机器学习模型生成应答信息;
其中,所述对话交互信息为文字信息;所述接收到用户输入的对话交互信息、将所述对话交互信息输入所述机器学习模型包括:
接收到用户输入的文字信息,确定与文字信息相对应的机器人对话入口,并将所述文字信息发送至所述机器人对话入口。
2.如权利要求1所述的方法,其特征在于,所述接收用户输入的初始语料集合、将所述初始语料集合作为训练样本对所述机器学习模型进行训练包括:
基于所述初始语料集合中的初始语料进行分类训练,获取用于判定所述初始语料的类别的分类规则;
向用户显示所述分类规则,以使用户基于所述分类规则对所述初始语料进行分类,并对所述初始语料标注类别;
接收到用户提交的对所述初始语料标注类别的结果,将标注有所述类别的初始语料作为训练样本对所述机器学习模型进行训练。
3.如权利要求2所述的方法,其特征在于,所述基于所述初始语料集合中的初始语料进行分类训练、获取用于判定所述初始语料的类别的分类规则包括:
提取所述初始语料的特征信息,并利用特征上下位和/或特征同义词关系对所述特征信息进行泛化处理;
对泛化处理后的所述特征信息进行聚类处理,用以获取所述初始语料的聚类结果;
融合所述聚类结果得到所述初始语料的分类结果,基于所述分类结果建立所述分类规则。
4.如权利要求3所述的方法,其特征在于,在将所述初始语料集合作为训练样本对所述机器学习模型进行训练之后还包括:
获取验证语料集合,使用所述机器学习模型对所述验证语料集合进行分类检验,获取所述验证语料集合中验证语料的所述类别;
确定所述分类检验的成功率,判断所述成功率是否低于预设的阈值;
如果是,则提示用户输入新的初始语料集合,将所述新的初始语料作为新的训练样本,用以继续对所述机器学习模型进行训练。
5.如权利要求4所述的方法,其特征在于,还包括:
如果所述成功率高于所述阈值,则停止对所述机器学习模型进行训练;
接收用户设置的与所述类别相对应的应答信息,并在所述机器学习模型中设置所述类别与所述应答信息的对应关系。
6.如权利要求5所述的方法,其特征在于,所述接收到用户输入的对话交互信息、将所述对话交互信息输入所述机器学习模型还包括:
对所述文字信息进行纠错处理,并对所述文字信息进行分词处理,对进行所述分词处理后的文字信息进行特征词提取,构造所述文字信息的语义向量;
将所述语义向量输入所述机器人对话入口对应的所述机器学习模型,以使所述机器学习模型基于所述语义向量确定所述文字信息的类别,获取与所述类别相对应的应答信息。
7.如权利要求2所述的方法,其特征在于,
所述机器人包括:客服机器人,所述类别包括:退货、付款、购买。
8.一种对话机器人自动生成装置,其特征在于,包括:
模型确定模块,用于基于用户通过人机界面输入的机器人建立指令确定所需创建的机器学习模型,用以自动创建机器学习模型;
模型训练模块,用于接收用户输入的初始语料集合,将所述初始语料集合作为训练样本对所述机器学习模型进行训练;
模型部署模块,用于基于用户通过人机界面输入的机器人部署指令获取训练好的所述机器学习模型进行部署,用以自动部署机器学习模型,并设置与所述机器学习模型对应的机器人对话入口;
运行控制模块,用于接收到用户输入的对话交互信息,将所述对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型,以使所述机器学习模型生成应答信息;
其中,所述对话交互信息为文字信息;所述运行控制模块,还包括:
入口确定单元,用于接收用户输入的文字信息,确定与文字信息相对应的机器人对话入口,并将所述文字信息发送至所述机器人对话入口。
9.如权利要求8所述的装置,其特征在于,
所述模型训练模块,包括:
语料分类单元,用于基于所述初始语料集合中的初始语料进行分类训练,获取用于判定所述初始语料的类别的分类规则;
标注提示单元,用于向用户显示所述分类规则,以使用户基于所述分类规则对所述初始语料进行分类,并对所述初始语料标注类别;
样本训练单元,用于接收到用户提交的对所述初始语料标注类别的结果,将标注有所述类别的初始语料作为训练样本对所述机器学习模型进行训练。
10.如权利要求9所述的装置,其特征在于,
所述语料分类单元,还用于提取所述初始语料的特征信息,并利用特征上下位和/或特征同义词关系对所述特征信息进行泛化处理;对泛化处理后的所述特征信息进行聚类处理,用以获取所述初始语料的聚类结果;融合所述聚类结果得到所述初始语料的分类结果,基于所述分类结果建立所述分类规则。
11.如权利要求10所述的装置,其特征在于,
所述样本训练单元,还用于获取验证语料集合,使用所述机器学习模型对所述验证语料集合进行分类检验,获取所述验证语料集合中验证语料的所述类别;确定所述分类检验的成功率,判断所述成功率是否低于预设的阈值;如果是,则提示用户输入新的初始语料集合,将所述新的初始语料作为新的训练样本,用以继续对所述机器学习模型进行训练。
12.如权利要求11所述的装置,其特征在于,
所述样本训练单元,还用于如果所述成功率高于所述阈值,则停止对所述机器学习模型进行训练;接收用户设置的与所述类别相对应的应答信息,并在所述机器学习模型中设置所述类别与所述应答信息的对应关系。
13.如权利要求12所述的装置,其特征在于,
所述运行控制模块,还包括:
文本处理单元,用于对所述文字信息进行纠错处理,并对所述文字信息进行分词处理,对进行所述分词处理后的文字信息进行特征词提取,构造所述文字信息的语义向量;
应答生成单元,用于将所述语义向量输入所述机器人对话入口对应的所述机器学习模型,以使所述机器学习模型基于所述语义向量确定所述文字信息的类别,获取与所述类别相对应的应答信息。
14.一种对话机器人自动生成装置,其特征在于,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至7中任一项所述的对话机器人自动生成方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行如权利要求1至7中任一项所述的对话机器人自动生成方法。
CN201710270940.6A 2017-04-24 2017-04-24 一种对话机器人自动生成方法及装置 Active CN108733722B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710270940.6A CN108733722B (zh) 2017-04-24 2017-04-24 一种对话机器人自动生成方法及装置
PCT/CN2018/083836 WO2018196684A1 (zh) 2017-04-24 2018-04-20 对话机器人生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710270940.6A CN108733722B (zh) 2017-04-24 2017-04-24 一种对话机器人自动生成方法及装置

Publications (2)

Publication Number Publication Date
CN108733722A CN108733722A (zh) 2018-11-02
CN108733722B true CN108733722B (zh) 2020-07-31

Family

ID=63918049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710270940.6A Active CN108733722B (zh) 2017-04-24 2017-04-24 一种对话机器人自动生成方法及装置

Country Status (2)

Country Link
CN (1) CN108733722B (zh)
WO (1) WO2018196684A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111435449B (zh) * 2018-12-26 2024-04-02 深圳市优必选科技有限公司 模型的自训练方法、装置、计算机设备及存储介质
CN111382569B (zh) * 2018-12-27 2024-05-03 深圳市优必选科技有限公司 对话语料中实体的识别方法、装置和计算机设备
CN111477231B (zh) * 2019-01-24 2023-12-01 科沃斯商用机器人有限公司 人机交互方法、装置和存储介质
CN111680514B (zh) * 2019-02-25 2024-03-01 北京猎户星空科技有限公司 信息处理和模型训练方法、装置、设备及存储介质
CN109977202A (zh) * 2019-03-06 2019-07-05 北京西屋信维科技发展有限公司 一种智能客服系统及其控制方法
CN110020889B (zh) * 2019-03-15 2022-12-27 创新先进技术有限公司 用户接入方法、装置及设备
CN111859096B (zh) * 2019-04-19 2024-04-19 北京嘀嘀无限科技发展有限公司 信息推送装置、方法、电子设备及计算机可读存储介质
CN110209811B (zh) * 2019-04-30 2023-09-22 上海艾瑞数科商务咨询有限公司 一种商品自动分类方法及系统
CN111767737A (zh) * 2019-05-30 2020-10-13 北京京东尚科信息技术有限公司 文本意图相似度确定方法、装置、电子设备和存储介质
CN110472008B (zh) * 2019-07-04 2023-04-18 创新先进技术有限公司 智能交互方法以及装置
CN110347797A (zh) * 2019-07-10 2019-10-18 广州市百果园信息技术有限公司 文本信息的侦测方法、系统、设备及存储介质
CN110674129A (zh) * 2019-08-14 2020-01-10 平安科技(深圳)有限公司 异常事件处理方法、系统、计算机设备及存储介质
EP4017688A1 (en) * 2019-09-30 2022-06-29 Siemens Aktiengesellschaft Machine learning enabled visual servoing with dedicated hardware acceleration
CN110765776B (zh) * 2019-10-11 2024-05-10 阳光财产保险股份有限公司 回访标注样本数据的生成方法及装置
CN110889268B (zh) * 2019-10-30 2024-04-23 中盈优创资讯科技有限公司 报表生成方法及装置
CN112749565A (zh) * 2019-10-31 2021-05-04 华为终端有限公司 基于人工智能的语义识别方法、装置和语义识别设备
CN110889070B (zh) * 2019-11-14 2023-06-30 深圳小蛙出海科技有限公司 一种内容推送方法、计算机装置及系统
CN110941701B (zh) * 2019-11-27 2023-02-28 珠海格力电器股份有限公司 语义分析样本集的优化方法、存储介质和计算设备
CN111178489B (zh) * 2019-12-30 2021-02-19 深圳集智数字科技有限公司 一种对话机器人引擎流量分配方法及装置
CN111400466A (zh) * 2020-03-05 2020-07-10 中国工商银行股份有限公司 一种基于强化学习的智能对话方法及装置
CN111428023B (zh) * 2020-03-26 2023-07-14 支付宝(杭州)信息技术有限公司 话术推荐方法、装置和电子设备
CN111508488A (zh) * 2020-04-13 2020-08-07 江苏止芯科技有限公司 一种机器人智能对话系统
CN111538810B (zh) * 2020-04-22 2024-04-09 斑马网络技术有限公司 数据生成方法、装置、电子设备及存储介质
CN113761136A (zh) * 2020-06-02 2021-12-07 阿里巴巴集团控股有限公司 对话处理、信息处理、模型训练方法、设备及存储介质
CN112035659A (zh) * 2020-08-12 2020-12-04 北京字节跳动网络技术有限公司 数据处理方法及装置
CN112035650A (zh) * 2020-09-07 2020-12-04 贝壳技术有限公司 信息处理方法、装置、计算机可读存储介质及电子设备
CN112036156A (zh) * 2020-09-25 2020-12-04 北京小米松果电子有限公司 文本对话方法、装置及存储介质
CN112131368B (zh) * 2020-09-27 2024-02-09 深圳平安智慧医健科技有限公司 对话生成方法、装置、电子设备及存储介质
CN112686674A (zh) * 2020-12-25 2021-04-20 科讯嘉联信息技术有限公司 一种客服对话工单总结方法
CN113012788B (zh) * 2021-02-08 2024-02-13 浙江连信科技有限公司 用于戒毒人员的心理干预方法及装置
CN112951429A (zh) * 2021-03-25 2021-06-11 浙江连信科技有限公司 用于中小学生心理危机筛查的信息处理方法及装置
CN113300939A (zh) * 2021-04-26 2021-08-24 国家计算机网络与信息安全管理中心 即时通讯软件交互机器人的开发方法
CN113641807B (zh) * 2021-07-28 2024-05-24 北京百度网讯科技有限公司 对话推荐模型的训练方法、装置、设备和存储介质
CN117592489B (zh) * 2023-11-30 2024-05-17 北京快牛智营科技有限公司 一种利用大语言模型实现电商商品信息交互的方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105550746A (zh) * 2015-12-08 2016-05-04 北京旷视科技有限公司 机器学习模型的训练方法和训练装置
CN105787560A (zh) * 2016-03-18 2016-07-20 北京光年无限科技有限公司 基于循环神经网络的对话数据交互处理方法及装置
CN106297789A (zh) * 2016-08-19 2017-01-04 北京光年无限科技有限公司 智能机器人的个性化交互方法及交互系统
CN106294726A (zh) * 2016-08-09 2017-01-04 北京光年无限科技有限公司 基于机器人角色交互的处理方法及装置
CN106295792A (zh) * 2016-08-05 2017-01-04 北京光年无限科技有限公司 基于多模型输出的对话数据交互处理方法及装置
CN106469212A (zh) * 2016-09-05 2017-03-01 北京百度网讯科技有限公司 基于人工智能的人机交互方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105550746A (zh) * 2015-12-08 2016-05-04 北京旷视科技有限公司 机器学习模型的训练方法和训练装置
CN105787560A (zh) * 2016-03-18 2016-07-20 北京光年无限科技有限公司 基于循环神经网络的对话数据交互处理方法及装置
CN106295792A (zh) * 2016-08-05 2017-01-04 北京光年无限科技有限公司 基于多模型输出的对话数据交互处理方法及装置
CN106294726A (zh) * 2016-08-09 2017-01-04 北京光年无限科技有限公司 基于机器人角色交互的处理方法及装置
CN106297789A (zh) * 2016-08-19 2017-01-04 北京光年无限科技有限公司 智能机器人的个性化交互方法及交互系统
CN106469212A (zh) * 2016-09-05 2017-03-01 北京百度网讯科技有限公司 基于人工智能的人机交互方法和装置

Also Published As

Publication number Publication date
CN108733722A (zh) 2018-11-02
WO2018196684A1 (zh) 2018-11-01

Similar Documents

Publication Publication Date Title
CN108733722B (zh) 一种对话机器人自动生成方法及装置
CN110717514A (zh) 会话意图识别方法、装置、计算机设备和存储介质
CN109101537B (zh) 基于深度学习的多轮对话数据分类方法、装置和电子设备
CN106571140B (zh) 一种基于语音语义的电器智能控制方法及系统
US10970493B1 (en) Systems and methods for slot relation extraction for machine learning task-oriented dialogue systems
CN110008319B (zh) 基于对话模板的模型训练方法和装置
CN112732911A (zh) 基于语义识别的话术推荐方法、装置、设备及存储介质
CN109948160B (zh) 短文本分类方法及装置
CN111737989A (zh) 一种意图识别方法、装置、设备及存储介质
CN107291775B (zh) 错误样本的修复语料生成方法和装置
US20210193127A1 (en) Systems and methods for automatically categorizing unstructured data and improving a machine learning-based dialogue system
CN110223134B (zh) 基于语音识别的产品推荐方法及相关设备
CN112732871A (zh) 一种机器人催收获取客户意向标签的多标签分类方法
Surana et al. Intelligent chatbot for requirements elicitation and classification
CN111159417A (zh) 文本内容关键信息的提取方法、装置、设备及存储介质
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN110377733A (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN116595150A (zh) 一种对话推荐方法、装置、设备及存储介质
CN114398881A (zh) 基于图神经网络的交易信息识别方法、系统及介质
US20200202068A1 (en) Computing apparatus and information input method of the computing apparatus
CN117521675A (zh) 基于大语言模型的信息处理方法、装置、设备及存储介质
CN109693244B (zh) 优化对话机器人的方法及装置
CN108984777B (zh) 客户服务方法、装置和计算机可读存储介质
US20230351121A1 (en) Method and system for generating conversation flows
CN113806501A (zh) 意图识别模型的训练方法、意图识别方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant