CN113569021B - 用户分类的方法、计算机设备和可读存储介质 - Google Patents

用户分类的方法、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN113569021B
CN113569021B CN202110727552.2A CN202110727552A CN113569021B CN 113569021 B CN113569021 B CN 113569021B CN 202110727552 A CN202110727552 A CN 202110727552A CN 113569021 B CN113569021 B CN 113569021B
Authority
CN
China
Prior art keywords
question
features
dialogue
round
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110727552.2A
Other languages
English (en)
Other versions
CN113569021A (zh
Inventor
高鹏
郝少春
袁兰
吴飞
周伟华
高峰
潘晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Mjoys Big Data Technology Co ltd
Original Assignee
Hangzhou Mjoys Big Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Mjoys Big Data Technology Co ltd filed Critical Hangzhou Mjoys Big Data Technology Co ltd
Priority to CN202110727552.2A priority Critical patent/CN113569021B/zh
Publication of CN113569021A publication Critical patent/CN113569021A/zh
Application granted granted Critical
Publication of CN113569021B publication Critical patent/CN113569021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种用户分类的方法、计算机设备和可读存储介质,其中,该用户分类的方法包括:获取对话内容,并将对话特征对话内容转换成语音文本;对对话特征语音文本进行纠错,输入纠错后的对话特征语音文本至预训练模型中,得到文本特征;输入对话特征至梯度迭代决策树中,得到用户分类标签,其中,对话特征对话特征包括对话特征文本特征,通过本申请,解决了相关技术中智能对话系统的用户分类结果不准确的问题,提高了智能对话系统的用户分类结果的准确性。

Description

用户分类的方法、计算机设备和可读存储介质
技术领域
本申请涉及机器学习技术领域,特别是涉及一种用户分类的方法、计算机设备和可读存储介质。
背景技术
在视频网站、购物网站等电商领域,用户画像系统已经非常成熟且足够强大,在该领域进行用户分类时,可以依托用户画像系统,得到静态画像特征,根据静态画像特征完成用户分类。
随着人工智能技术的飞速发展,智能对话系统应运而生,在相关技术中,智能对话系统也是根据用户的静态画像特征进行用户分类,然而,目前智能对话系统的用户画像系统内容较为单薄,直接依托用户画像系统完成智能对话系统的用户分类,用户分类结果很多时候是不准确的。
针对相关技术中,智能对话系统的用户分类结果不准确的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种用户分类的方法、计算机设备和可读存储介质,以至少解决相关技术中智能对话系统的用户分类结果不准确的问题。
第一方面,本申请实施例提供了一种用户分类的方法,应用于智能对话系统,所述方法包括:
获取对话内容,并将所述对话内容转换成语音文本;
对所述语音文本进行纠错,输入纠错后的所述语音文本至预训练模型中,得到文本特征;
输入对话特征至梯度迭代决策树中,得到用户分类标签,其中,所述对话特征包括所述文本特征。
在其中一些实施例中,所述对话特征还包括轮次特征,所述轮次特征包括行为特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:
在同一个对话轮次下,获取行为记录,并提取所述行为记录中的行为,得到各轮次的所述行为特征,其中,所述行为包括静音、打断或挂断;
用one-hot表征同一个对话轮次下的所有轮次特征。
在其中一些实施例中,所述轮次特征还包括问句类型特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:
在同一个对话轮次下,确定纠错后的所述语音文本中的问句,得到原始问句,输入所述原始问句至分类模型中,所述分类模型根据意图相似度召回问句,得到多个召回问句;
确定概率最大的召回问句,得到目标问句,并根据目标问句与问句类型特征的关联关系,确定各轮次的所述目标问句的问句类型特征,其中,所述问句类型特征包括正向、负向或中性;
用one-hot表征同一个对话轮次下的所有轮次特征。
在其中一些实施例中,在所述分类模型的训练过程中,意图相同的问句间的相似度为1,并且意图不同的问句间的相似度为:问句间的编辑距离相似度与预设概率的乘积。
在其中一些实施例中,所述得到原始问句之后,所述方法还包括:
确定所述原始问句是否存在于问法句式的列表中,若是,根据所述问法句式与问句类型特征的关联关系,确定所述原始问句的问句类型特征;
若否,输入所述原始问句至所述分类模型中。
在其中一些实施例中,所述问法句式设置有词槽,所述确定所述原始问句是否存在于问法句式的列表中之前,所述方法包括:识别出所述原始问句中的实体词,并将所述实体词填入所述词槽。
在其中一些实施例中,所述对话特征还包括轮次特征,所述轮次特征包括语态特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:
在同一个对话轮次下,输入纠错后的所述语音文本至分类模型中,得到各轮次的所述语态特征,其中,所述语态特征包括肯定、否定、中性、重复或无法识别;
用one-hot表征同一个对话轮次下的所有轮次特征。
在其中一些实施例中,所述对话特征还包括整体特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:获取行为记录,根据所述行为记录,抽取所述整体特征,其中,所述整体特征包括流程轨迹、主流程完成度、通话时长、轮次或振铃时长,
所述流程轨迹的确定过程包括:确定所述对话内容各个部分归属的流程节点,并根据所述流程节点,生成所述对话内容的流程轨迹,
所述主流程完成度为所述流程轨迹经过的节点的数目占总节点数的比例。
第二方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述用户分类的方法。
第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现所述用户分类的方法。
相比于相关技术,本申请实施例提供的用户分类的方法,通过获取对话内容,并将对话特征对话内容转换成语音文本;对对话特征语音文本进行纠错,输入纠错后的对话特征语音文本至预训练模型中,得到文本特征;输入对话特征至梯度迭代决策树中,得到用户分类标签,其中,对话特征对话特征包括对话特征文本特征,解决了相关技术中智能对话系统的用户分类结果不准确的问题,提高了智能对话系统的用户分类结果的准确性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的用户分类的方法的应用环境示意图;
图2是根据本申请第一实施例的用户分类的方法的流程图;
图3是根据本申请第二实施例的提取行为特征的流程图;
图4是根据本申请第三实施例的提取问句类型特征的流程图;
图5是根据本申请第四实施例的提取问句类型特征的流程图;
图6是根据本申请第五实施例的提取问句类型特征的流程图;
图7是根据本申请第六实施例的提取语态特征的流程图;
图8是根据本申请第七实施例的提取整体特征的流程图;
图9是根据本申请第八实施例的用户分类的方法的流程图;
图10是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请提供的用户分类的方法,可以应用于如图1所示的应用环境中,图1是根据本申请实施例的用户分类的方法的应用环境示意图,如图1所示,终端101部署有智能对话系统,服务器102通过网络获取终端101的对话内容,并运行用户分类的方法,得到用户分类结果,该终端101可以但不限于是各种对话机器人、个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,该服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本实施例提供了一种用户分类的方法,应用于智能对话系统,图2是根据本申请第一实施例的用户分类的方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取对话内容,并将对话内容转换成语音文本,例如,在机器人与用户对话时,实时将对话语音流录制为wav格式的语音文件,再利用ASR技术对语音文件进行文本识别,得到语音文本;
步骤S202,对语音文本进行纠错,输入纠错后的语音文本至预训练模型中,得到文本特征,例如,在对语音文本纠错时,可以使用N-gram模型,在N-gram模型的训练过程中,先人工筛选出正确的句子,将句子切分成子句,并对每个子句进行分词处理,输入至N-gram模型,N-gram模型计算概率时使用对数概率和来代替概率积,同时使用加1平滑,防止未登录词导致的数据溢出问题,推理时,先将语音文本拆分成子句,并对每个子句进行分词处理,输入至该N-gram模型中,N-gram模型使用滑动窗口逐词检查,在滑动窗口内的词串的共现概率低于阈值时,根据同音和近音返回所有可能的替换结果,并计算出替换结果中概率最高的词,用概率最高的词替换原句中的词,完成纠错,输入纠错后的语音文本至预训练模型中,得到文本特征,可选的,该预训练模型可以是BERT模型;
步骤S203,输入对话特征至梯度迭代决策树(Gradient Boosting DecisionTree,简称GBDT)中,得到用户分类标签,其中,对话特征包括该文本特征,例如,输入文本特征至GBDT模型中,GBDT模型输出0或1,0代表无意向的用户,1代表有意向的用户,可选的,可以使用LightGBM算法训练GBDT模型,并使用贝叶斯方法对参数进行调优,调优后的参数及调整范围如下:num_leaves的范围为10至200,max_depth的范围为3至20,min_data_in_leaf的范围为10至100,min_sum_hessian_in_leaf的范围为0至10,feature_fraction的范围为0.5至1.0,bagging_fraction的范围为0.5至1.0,bagging_freq的范围为0至100,lambda_l1的范围为0.0至10.0,lambda_l2的范围为0.0至10.0,cat_smooth的范围为0.0至20.0,min_gain_to_split的范围为0.0至1.0,并使用PMMLPipeline工具导出模型,以便在Java中使用。
通过步骤S201至步骤S203,相对于相关技术中智能对话系统是根据用户的静态画像特征进行用户分类,用户分类结果不准确的问题,本实施例通过获取智能对话系统中的对话内容,将对话内容转换成语音文本,输入纠错后的语音文本至预训练模型中,得到文本特征,最后输入文本特征至梯度迭代决策树中,得到用户分类标签(即用户分类结果),充分利用了对话过程中产生的对话内容,并从该对话内容中提取对话特征,该对话内容中的特征信息是相关技术中单靠用户的静态画像特征进行用户分类的强有力的补充,使得本实施例得到的用户分类结果更准确,并且由于用户自身处于不断的变化当中,相比于静态画像特征,对话过程反映了用户的最新情况,实时性更强,从而用户的分类结果更加贴近用户的现状,解决了相关技术中智能对话系统的用户分类结果不准确的问题,提高了智能对话系统的用户分类结果的准确性。
同时,由于本实施例对用户的分类结果较为准确,通过本实施例,公司在产品推荐和营销活动时,有准确的用户分类结果作为参考依据,从而公司可以针对不同用户提供不同的策略,提升了公司的服务质量和运营效率。
考虑到除了用户的语言可以体现对话特征,若在一轮对话过程中,用户发生静音、打断或挂断等行为,也能反映该用户很可能是无意向的用户,因此,该行为特征也可以作为用户分类的重要参考依据,在其中一些实施例中,对话特征还包括轮次特征,轮次特征包括行为特征,图3是根据本申请第二实施例的提取行为特征的流程图,如图3所示,输入对话特征至梯度迭代决策树中之前,该流程包括如下步骤:
步骤S301,在同一个对话轮次下,获取行为记录,并提取行为记录中的行为,得到各轮次的行为特征,其中,该行为包括静音、打断或挂断;
步骤S302,用one-hot表征同一个对话轮次下的所有轮次特征,通过将轮次特征从文本格式转化为数值格式,使得轮次特征的格式符合梯度迭代决策树模型对输入数据的格式要求。
通过步骤S301至步骤S302,本实施例将文本特征和各轮次的行为特征均输入梯度迭代决策树中,丰富了用户分类的参考依据,使得用户分类结果更加准确。
考虑到用户在沟通过程中提的问题的类型也能反映该用户是否是有意向的用户,从而有助于用户分类,在其中一些实施例中,轮次特征还包括问句类型特征,图4是根据本申请第三实施例的提取问句类型特征的流程图,如图4所示,输入对话特征至梯度迭代决策树中之前,该流程包括如下步骤:
步骤S401,在同一个对话轮次下,确定纠错后的语音文本中的问句,得到原始问句,输入原始问句至分类模型中,分类模型根据意图相似度召回问句,得到多个召回问句,例如,分类模型可以是Sentence-BERT,根据意图相似度召回问句时,可以使用Sentence-BERT计算句子的向量表征,并用Cosine相似度作为评估方法,损失函数采用最小二乘损失,得到5个召回问句;
步骤S402,确定概率最大的召回问句,得到目标问句,并根据目标问句与问句类型特征的关联关系,确定各轮次的目标问句的问句类型特征,其中,问句类型特征包括正向、负向或中性,例如,可以采用二分类模型确定召回问句的概率,训练该二分类模型时,分别获取每个句子的表征,计算两个句子表征差的绝对值,将张量拼接后作为特征喂入二分类的全连接网络,使用该二分类模型时,将召回问句和原始问句组成句子对,使用二分类模型判断该句子对是否相似,按相似概率的高低从大到小排序后,选择第一个结果作为概率最大的召回问句,得到目标问句,并根据目标问句与问句类型特征的关联关系,确定各轮次的目标问句的问句类型特征;
步骤S403,用one-hot表征同一个对话轮次下的所有轮次特征,通过将轮次特征从文本格式转化为数值格式,使得轮次特征的格式符合梯度迭代决策树模型对输入数据的格式要求。
通过步骤S401至步骤S403,本实施例将文本特征以及各轮次的行为特征和问句类型特征均输入梯度迭代决策树中,丰富了用户分类的参考依据,使得用户分类结果更加准确。
进一步的,在分类模型的训练过程中,意图相同的问句间的相似度为1,并且意图不同的问句间的相似度为:问句间的编辑距离相似度与预设概率的乘积。这样设置的原因是,若将意图相同的问句间的相似度设置为1,并且直接将意图不同的问句间的相似度设置为0,由于意图不相同的问句包括了意图相近的问句,直接将所有意图不同的问句间的相似度设置都设置为0后得到的结果与实际情况可能会存在较大的误差,由于是否属于意图相近的问句无法直接确定,可以通过问句间的编辑距离相似度来反映,一般情况下,句子间的编辑距离相似度越高,问句的含义或意图就越接近,但也存在一些特殊情况,例如,两个句子,仅有一个“不”字之别,含义可能就相去甚远,因此,需要适当降低问句间的编辑距离相似度的比重,降低比重的实现方式可以是预先设置比重(即预设概率),并让问句间的编辑距离相似度与该预设概率的乘积作为意图不同的问句间的相似度,例如,意图不同的问句间的相似度可以是问句间的编辑距离相似度乘以0.5。
考虑到用相似度召回的方式得到的问句可能与原始句子存在误差,为了提高问句匹配的精确度,在其中一些实施例中,可以预先梳理行业常用意图,对针对每种意图配备多个不同的问法句式,图5是根据本申请第四实施例的提取问句类型特征的流程图,如图5所示,得到原始问句之后,该流程包括如下步骤:
步骤S501,确定原始问句是否存在于问法句式的列表中,若是,根据问法句式与问句类型特征的关联关系,确定原始问句的问句类型特征;若否,输入原始问句至分类模型中。
通过步骤S501,本实施例在得到原始问句之后,先确定原始问句是否存在于问法句式的列表中,若是,根据问法句式与问句类型特征的关联关系,确定原始问句的问句类型特征,从而提高了问句匹配的精确度,同时,由于梳理的行业常用意图的问法句式有限,且处于不断的完善之中,无法实现全部问法句式覆盖,本实施例在原始问句不在问法句式的列表中的情况下,输入原始问句至分类模型中,进行问句匹配,从而可以按照相似度召回已关联好问句类型特征的问句,为原始问句提取到问句类型特征结果提供了保障。
进一步的,实体词一般指文本中具有特定意义的名词,主要包括人名、地名、机构名、时间、位置、数字等,考虑到更换问法句式中的实体词不影响该问法句式的问句类型特征,例如,问法句式为“XX还剩几个?”,不管实体词XX为哪个产品,问句“XX还剩几个?”的问句类型都是“正向”,因此,在其中一些实施例中,问法句式设置有词槽,图6是根据本申请第五实施例的提取问句类型特征的流程图,如图6所示,确定原始问句是否存在于问法句式的列表中之前,该流程包括如下步骤:
步骤S601,识别出原始问句中的实体词,并将实体词填入词槽,可选的,在进行实体词的识别时,可以使用行业词库和模型相结合的方式,行业词库主要基于具体业务收集整理,与业务有很强的关联,模型可以采用LSTM和CRF相结合的架构,标注采用BIO法,推理时,先使用行业词库进行匹配,在无结果返回(即在行业词库中匹配不到实体词)的情况下,使用模型做进一步的识别。
通过步骤S601,可以精简问法句式的数量,同时不影响问句类型特征的判定。
考虑到不仅仅是问句,用户在沟通过程中讲话的语态也能反映该用户是否是有意向的用户,从而有助于用户分类,在其中一些实施例中,轮次特征还包括语态特征,具体地,可以定义五种语态:肯定、否定、中性、重复或无法识别,其中,肯定表示用户认同机器人的说法,否定表示不认同或反对,中性表示机器人可以继续说话,重复表示用户需要机器人重新描述一遍之前说的话,无法识别则表示语态无法判断或不明显,图7是根据本申请第六实施例的提取语态特征的流程图,如图7所示,输入对话特征至梯度迭代决策树中之前,该流程包括如下步骤:
步骤S701,在同一个对话轮次下,输入纠错后的语音文本至分类模型中,得到各轮次的语态特征,例如,分类模型可以是TextCNN,在建模时,token使用字粒度,并采用交叉熵损失函数;
步骤S702,用one-hot表征同一个对话轮次下的所有轮次特征,通过将轮次特征从文本格式转化为数值格式,使得轮次特征的格式符合梯度迭代决策树模型对输入数据的格式要求。
通过步骤S701至步骤S702,本实施例将文本特征以及各轮次的行为特征、问句类型特征和语态特征均输入梯度迭代决策树中,丰富了用户分类的参考依据,使得用户分类结果更加准确。
需要说明的是,由于每种特征的类型总数是固定的(例如,问句类型特征有三种,语态特征有五种),所以每一轮对话都可以产生一个one-hot表征。
考虑到除了文本特征和轮次特征,整个对话过程中的流程轨迹、主流程完成度、通话时长、轮次和振铃时长,都可以反映该用户是否是有意向的用户,从而有助于用户分类,例如,流程轨迹越长、主流程完成度越高、通话时长越长、轮次越多、振铃时长越短,可以反映该用户很可能是有意向的用户,在其中一些实施例中,对话特征还包括整体特征,图8是根据本申请第七实施例的提取整体特征的流程图,如图8所示,输入对话特征至梯度迭代决策树中之前,该流程包括如下步骤:
步骤S801,获取行为记录,根据行为记录,抽取整体特征,其中,整体特征包括流程轨迹、主流程完成度、通话时长、轮次或振铃时长,流程轨迹的确定过程包括:确定对话内容各个部分归属的流程节点,并根据流程节点,生成对话内容的流程轨迹,主流程完成度为流程轨迹经过的节点的数目占总节点数的比例。
通过步骤S801,本实施例将文本特征、整体特征以及各轮次特征均输入梯度迭代决策树中,丰富了用户分类的参考依据,使得用户分类结果更加准确。
在其中一些实施例中,图9是根据本申请第八实施例的用户分类的方法的流程图,如图9所示,该流程包括如下步骤:
获取对话内容后,进行对话序列提取,其中,对话序列是机器人与用户通话的过程记录,对话序列提取包括两个方面,第一,从对话内容中提取语音文本,第二,从对话内容中提取行为记录;
对语音文本进行解析,包括文本纠错,以及对纠错后的语音文本进行进一步解析,该进一步解析包括两个方面,第一,进行实体识别、意图识别,在意图识别过程中,若无法在行业常用意图中匹配到相同问法句式,则继续进行问句匹配,第二,进行语态识别;
构建对话特征,具体地,根据行为记录,构建行为特征和整体特征,根据意图识别和问句匹配结果,构建问句类型特征,根据语态识别结果,构建语态特征,其中,行为特征、语态特征和问句类型特征构成时序特征,用one-hot表征该时序特征;
输入对话特征至梯度迭代决策树中,得到用户分类结果。
在一个实施例中,图10是根据本申请实施例的电子设备的内部结构示意图,如图10所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的数据库用于存储数据。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户分类的方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种用户分类的方法,应用于智能对话系统,其特征在于,所述方法包括:
获取对话内容,并将所述对话内容转换成语音文本;
对所述语音文本进行纠错,输入纠错后的所述语音文本至预训练模型中,得到文本特征;
输入对话特征至梯度迭代决策树中,得到用户分类标签,其中,所述对话特征包括所述文本特征;
所述对话特征还包括轮次特征,用one-hot表征同一个对话轮次下的所有轮次特征;所述轮次特征包括行为特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:
在同一个对话轮次下,获取行为记录,并提取所述行为记录中的行为,得到各轮次的所述行为特征,其中,所述行为包括静音、打断或挂断;
所述轮次特征包括问句类型特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:
在同一个对话轮次下,确定纠错后的所述语音文本中的问句,得到原始问句,输入所述原始问句至第一分类模型中,所述第一分类模型根据意图相似度召回问句,得到多个召回问句;
确定概率最大的召回问句,得到目标问句,并根据目标问句与问句类型特征的关联关系,确定各轮次的所述目标问句的问句类型特征,其中,所述问句类型特征包括正向、负向或中性;
所述轮次特征包括语态特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:
在同一个对话轮次下,输入纠错后的所述语音文本至第二分类模型中,得到各轮次的所述语态特征,其中,所述语态特征包括肯定、否定、中性、重复或无法识别;
所述对话特征还包括整体特征,所述输入对话特征至梯度迭代决策树中之前,所述方法包括:获取行为记录,根据所述行为记录,抽取所述整体特征,其中,所述整体特征包括流程轨迹、主流程完成度、通话时长、轮次或振铃时长,
所述流程轨迹的确定过程包括:确定所述对话内容各个部分归属的流程节点,并根据所述流程节点,生成所述对话内容的流程轨迹,
所述主流程完成度为所述流程轨迹经过的节点的数目占总节点数的比例。
2.根据权利要求1所述的方法,其特征在于,在所述第一分类模型的训练过程中,意图相同的问句间的相似度为1,并且意图不同的问句间的相似度为:问句间的编辑距离相似度与预设概率的乘积。
3.根据权利要求2所述的方法,其特征在于,所述得到原始问句之后,所述方法还包括:
确定所述原始问句是否存在于问法句式的列表中,若是,根据所述问法句式与问句类型特征的关联关系,确定所述原始问句的问句类型特征;
若否,输入所述原始问句至所述第一分类模型中。
4.根据权利要求3所述的方法,其特征在于,所述问法句式设置有词槽,所述确定所述原始问句是否存在于问法句式的列表中之前,所述方法包括:识别出所述原始问句中的实体词,并将所述实体词填入所述词槽。
5.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的用户分类的方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至4中任一项所述的用户分类的方法。
CN202110727552.2A 2021-06-29 2021-06-29 用户分类的方法、计算机设备和可读存储介质 Active CN113569021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110727552.2A CN113569021B (zh) 2021-06-29 2021-06-29 用户分类的方法、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110727552.2A CN113569021B (zh) 2021-06-29 2021-06-29 用户分类的方法、计算机设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN113569021A CN113569021A (zh) 2021-10-29
CN113569021B true CN113569021B (zh) 2023-08-04

Family

ID=78163003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110727552.2A Active CN113569021B (zh) 2021-06-29 2021-06-29 用户分类的方法、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN113569021B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293138B (zh) * 2022-08-03 2023-06-09 北京中科智加科技有限公司 一种文本纠错方法及计算机设备
CN115982657B (zh) * 2023-01-06 2023-10-31 杭州健海科技有限公司 一种智能外呼客服系统的录音审核分类方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011215742A (ja) * 2010-03-31 2011-10-27 Nec Corp 対話システム、対話フローの更新方法およびプログラム
WO2016127550A1 (zh) * 2015-02-13 2016-08-18 百度在线网络技术(北京)有限公司 人机语音交互方法和装置
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110458599A (zh) * 2019-07-05 2019-11-15 深圳壹账通智能科技有限公司 测试方法、测试装置及相关产品
CN111653262A (zh) * 2020-08-06 2020-09-11 上海荣数信息技术有限公司 一种智能语音交互系统及方法
CN111949777A (zh) * 2020-07-24 2020-11-17 北京奇保信安科技有限公司 一种基于人群分类的智能语音对话方法、装置及电子设备
CN112818086A (zh) * 2021-02-04 2021-05-18 上海畅圣计算机科技有限公司 一种机器人催收获取客户意向标签的多标签分类方法
CN112819245A (zh) * 2021-02-24 2021-05-18 阳光保险集团股份有限公司 用户投诉行为预测方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US20100293234A1 (en) * 2009-05-18 2010-11-18 Cbs Interactive, Inc. System and method for incorporating user input into filter-based navigation of an electronic catalog
US11289085B2 (en) * 2019-11-26 2022-03-29 Microsoft Technology Licensing, Llc Automatic turn delineation in multi-turn dialogue

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011215742A (ja) * 2010-03-31 2011-10-27 Nec Corp 対話システム、対話フローの更新方法およびプログラム
WO2016127550A1 (zh) * 2015-02-13 2016-08-18 百度在线网络技术(北京)有限公司 人机语音交互方法和装置
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110458599A (zh) * 2019-07-05 2019-11-15 深圳壹账通智能科技有限公司 测试方法、测试装置及相关产品
CN111949777A (zh) * 2020-07-24 2020-11-17 北京奇保信安科技有限公司 一种基于人群分类的智能语音对话方法、装置及电子设备
CN111653262A (zh) * 2020-08-06 2020-09-11 上海荣数信息技术有限公司 一种智能语音交互系统及方法
CN112818086A (zh) * 2021-02-04 2021-05-18 上海畅圣计算机科技有限公司 一种机器人催收获取客户意向标签的多标签分类方法
CN112819245A (zh) * 2021-02-24 2021-05-18 阳光保险集团股份有限公司 用户投诉行为预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113569021A (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
CN110765244B (zh) 获取应答话术的方法、装置、计算机设备及存储介质
CN110096570B (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN110444198B (zh) 检索方法、装置、计算机设备和存储介质
CN110021308B (zh) 语音情绪识别方法、装置、计算机设备和存储介质
WO2021042503A1 (zh) 信息分类抽取方法、装置、计算机设备和存储介质
CN113420113B (zh) 语义召回模型训练、召回问答方法、装置、设备及介质
US20180150455A1 (en) Method and apparatus for processing semantic analysis result based on artificial intelligence
CN113297366B (zh) 多轮对话的情绪识别模型训练方法、装置、设备及介质
CN113569021B (zh) 用户分类的方法、计算机设备和可读存储介质
CN111191032B (zh) 语料扩充方法、装置、计算机设备和存储介质
CN113192516B (zh) 语音角色分割方法、装置、计算机设备及存储介质
CN115599901B (zh) 基于语义提示的机器问答方法、装置、设备及存储介质
CN112992125B (zh) 一种语音识别方法、装置、电子设备、可读存储介质
CN111223476B (zh) 语音特征向量的提取方法、装置、计算机设备和存储介质
CN114120978A (zh) 情绪识别模型训练、语音交互方法、装置、设备及介质
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN115495553A (zh) 查询文本排序方法、装置、计算机设备及存储介质
CN115455982A (zh) 对话处理方法、装置、电子设备及存储介质
CN112183051A (zh) 智能语音随访方法、系统、计算机设备、存储介质及程序产品
CN110377618B (zh) 裁决结果分析方法、装置、计算机设备和存储介质
TW202032534A (zh) 語音辨識方法、語音辨識裝置、電子設備、電腦可讀存儲介質及電腦程式產品
CN112151019A (zh) 文本处理方法、装置及计算设备
CN114328899A (zh) 一种文本纪要生成方法、装置、设备及存储介质
CN110362592B (zh) 裁决指引信息推送方法、装置、计算机设备和存储介质
TWI734085B (zh) 使用意圖偵測集成學習之對話系統及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant