CN111178067B - 信息获取模型生成方法、装置及信息获取方法、装置 - Google Patents

信息获取模型生成方法、装置及信息获取方法、装置 Download PDF

Info

Publication number
CN111178067B
CN111178067B CN201911318523.XA CN201911318523A CN111178067B CN 111178067 B CN111178067 B CN 111178067B CN 201911318523 A CN201911318523 A CN 201911318523A CN 111178067 B CN111178067 B CN 111178067B
Authority
CN
China
Prior art keywords
sales
key sentences
processed
information acquisition
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911318523.XA
Other languages
English (en)
Other versions
CN111178067A (zh
Inventor
罗华刚
张�杰
李犇
于皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201911318523.XA priority Critical patent/CN111178067B/zh
Publication of CN111178067A publication Critical patent/CN111178067A/zh
Application granted granted Critical
Publication of CN111178067B publication Critical patent/CN111178067B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种信息获取模型生成方法、装置及信息获取方法、装置,包括:获取样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题;将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型。由于采用训练样本训练了神经网络模型,并生成了用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,因此能够用于后续关键语句、非关键语句以及关键语句的所属主题的自动获取。

Description

信息获取模型生成方法、装置及信息获取方法、装置
技术领域
本文涉及信息处理技术,尤指一种信息获取模型生成方法、装置及信息获取方法、装置。
背景技术
随着经济的高速发展,人们对于消费的诉求逐渐增强,零售行业也随之蓬勃发展,然而零售行业需要面对的一个难题就是销售,如何高效的提升销售人员的销售水平,进而提高商品成单率,是一个亟待解决的问题。
相关技术中,业务专家往往通过听取销售录音以获取销售对话,从而根据自身经验对销售对话中的关键语句和非关键语句进行提取,并且对关键语句的所属主题进行分析,然后基于销售人员对于这两方面的把握对销售人员开展有针对性的培训。
然而,这种信息获取方法完全依靠人工方式开展,因此十分耗费人力成本,且信息获取效率低下。
发明内容
本申请提供了一种信息获取模型生成、装置及信息获取方法、装置,能够用于后续关键语句、非关键语句以及关键语句的所属主题的自动获取,从而节省人力成本的耗费,且提高信息获取效率。
本申请提供了一种信息获取模型生成方法,包括:
获取样本销售对话、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题;
将所述样本销售对话、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及所述关键语句的所属主题的信息获取模型。
所述将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,包括:
将所述样本销售对话划分为若干个销售对话语段,作为样本销售对话语段;其中,每个所述样本销售对话语段由两段不同角色的连续对话组成;
将所述样本销售对话语段、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为训练样本集迭代训练所述神经网络模型,以得到所述信息获取模型。
所述将样本销售对话语段、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型,包括:
将样本销售对话语段进行分词;
将进行分词处理后的样本销售对话语段、所述销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为所述训练样本集迭代训练所述神经网络模型,以得到所述信息获取模型。
所述将进行分词处理后的样本销售对话语段、销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型,包括:
将所述进行分词处理后的样本销售对话语段输入至所述神经网络模型的输入层,并将所述销售对话中的关键语句、非关键语句以及所述关键语句的所属主题输入至所述神经网络模型的输出层迭代训练所述神经网络模型,以得到所述信息获取模型。
所述关键语句的所属主题包括:迎宾主题、需求沟通主题、商品推荐主题、询价主题、完成交易主题和送宾主题。
所述神经网络模型包括:长短期记忆网络(Long Short-Term Memory,LSTM)。
本申请还提供了一种信息获取方法,包括:
获取待处理销售对话;
将所述待处理销售对话输入至如上述任一项所述的信息获取模型生成方法生成的信息获取模型中,得到所述待处理销售对话中的关键语句、非关键语句以及所述关键语句的所属主题。
所述将待处理销售对话输入至如上述任一项所述的信息获取模型生成方法生成的信息获取模型中,包括:
将所述待处理对话划分为若干个销售对话语段,作为待处理销售对话语段;其中,每个所述待处理销售对话语段由两段不同角色的连续对话组成;
将所述待处理销售对话语段输入至如上述任一项所述的信息获取模型生成方法生成的信息获取模型中。
所述将待处理销售对话语段输入至如上述任一项所述的信息获取模型生成方法生成的信息获取模型中,包括:
将待处理销售对话语段进行分词;
将进行分词处理后的待处理销售对话语段输入至如上述任一项所述的信息获取模型生成方法生成的信息获取模型中。
所述得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题之后,还包括:
将所述待处理销售对话中每两个相邻的关键语句之间的销售对话划分为一个待处理销售对话环节;
获取每个待处理销售对话环节的关键词。
所述获取每个待处理销售对话环节的关键词,包括:
获取每个待处理销售对话环节,并每当获得一个待处理销售对话环节执行以下操作:
计算获得的待处理销售对话环节中所有词语的信息检索数据挖掘的常用加权技术(Term Frequency–Inverse Document Frequency,TF-IDF)值;
将TF-IDF值最大的词语作为获得的待处理销售对话环节的关键词。
所述计算获得的待处理销售对话环节中所有词语的TF-IDF值,包括:
统计获得的待处理销售对话环节的总词语数;
统计获得的待处理销售对话中的总环节数;
获取获得的待处理销售对话环节中每个词语,并每当获得一个词语执行以下操作:
统计获得的词语在获得的待处理销售对话环节中出现的次数;
统计包含获得的词语的待处理销售对话环节的个数;
计算(获得的词语在获得的待处理销售对话环节中出现的次数/获得的待处理销售对话环节的总词语数)*log(所述待处理销售对话中的总环节数/包含获得的词语的待处理销售对话环节的个数),以得到获得的词语在获得的待处理销售对话环节中的TF-IDF值。
本申请还提供了一种信息获取模型生成装置,包括:
第一获取模块,用于获取样本销售对话、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题;
第一处理模块,用于将所述样本销售对话、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及所述关键语句的所属主题的信息获取模型。
本申请还提供了一种信息获取装置,包括:
第二获取模块,用于获取待处理销售对话;
第二处理模块,用于将所述待处理销售对话输入至如上述信息获取模型生成装置生成的信息获取模型中,得到所述待处理销售对话中的关键语句、非关键语句以及所述关键语句的所属主题。
与相关技术相比,本申请包括:获取样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题;将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型。由于采用训练样本训练了神经网络模型,并生成了用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,因此能够用于后续关键语句、非关键语句以及关键语句的所属主题的自动获取,从而节省了人力成本的耗费,且提高了信息获取效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例提供的一种信息获取模型生成方法的流程示意图;
图2为本申请实施例提供的一种信息获取方法的流程示意图;
图3为本申请实施例提供的一种信息获取模型生成装置的结构示意图;
图4为本申请实施例提供的一种信息获取装置的结构示意图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
本申请实施例提供一种信息获取模型生成方法,如图1所示,包括:
步骤101、获取样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题。
在一种示例性实例中,样本销售对话可以是通过录音设备采集的销售录音获取的,当获取到销售录音后可以通过语音识别(Automatic Speech Recognition,ASR)技术将销售对话识别出来作为样本销售对话。
在一种示例性实例中,样本销售对话中的关键语句和非关键语句可以以标注的形式显示在样本销售对话中,也可以以独立形式显示在样本销售对话外,本发明对此不作限制。
步骤102、将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型。
在一种示例性实例中,神经网络模型包括:LSTM。
在一种示例性实例中,关键语句的所属主题包括:迎宾主题、需求沟通主题、商品推荐主题、询价主题、完成交易主题和送宾主题。
在一种示例性实例中,当样本销售对话中的关键语句和非关键语句以标注的形式显示在样本销售对话中,样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题可以如下所示:
销售员:王女士,您来了--关键句,主题“迎宾”
顾客:嗯嗯–非关键句
销售员:今天想买点什么--关键句,主题“需求沟通”
顾客:最近有什么新的产品--非关键句
销售员:有的,您看看这款产品,XXXX–关键句,主题“商品推荐”
……--非关键句
顾客:看起来不错,这个多少钱啊--关键句,主题“询价”
……--非关键句
顾客:就这个吧,帮我包起来--关键句,主题“完成交易”
……--非关键句
销售员:王女士慢走,欢迎下次光临--关键句,主题“送宾”
在一种示例性实例中,将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,包括:
首先、将样本销售对话划分为若干个销售对话语段,作为样本销售对话语段;其中,每个样本销售对话语段由两段不同角色的连续对话组成。
在一种示例性实例中,以上述样本销售对话为例,其中一个样本销售对话语段为:
销售员:“王女士,您来了”顾客:“嗯嗯”
两段不同角色的连续对话组合后为:
[B]王女士您来了[C]嗯嗯
其中,[B]、[C]标识两段不同角色的连续对话的开始。
其次、将样本销售对话语段、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型。
在一种示例性实例中,将样本销售对话语段、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型,包括:
首先、将样本销售对话语段进行分词。
在一种示例性实例中,将将样本销售对话语段进行分词是为了将样本销售对话语段转换为向量以输入神经网络模型。
其次、将进行分词处理后的样本销售对话语段、销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型。
在一种示例性实例中,将进行分词处理后的样本销售对话语段、销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型,包括:
将进行分词处理后的样本销售对话语段输入至神经网络模型的输入层,并将销售对话中的关键语句、非关键语句以及关键语句的所属主题输入至神经网络模型的输出层迭代训练神经网络模型,以得到信息获取模型。
本申请实施例提供的信息获取模型生成方法,由于采用训练样本训练了神经网络模型,并生成了用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,因此能够用于后续关键语句、非关键语句以及关键语句的所属主题的自动获取,从而节省了人力成本的耗费,且提高了信息获取效率。
本申请实施例还提供一种信息获取方法,如图2所示,包括:
步骤201、获取待处理销售对话。
步骤202、将待处理销售对话输入至如上述任意一种实施例描述的信息获取模型生成方法生成的信息获取模型中,得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题。
在一种示例性实例中,将待处理销售对话输入至如上述任意一种实施例描述的信息获取模型生成方法生成的信息获取模型中,包括:
首先、将待处理对话划分为若干个销售对话语段,作为待处理销售对话语段;其中,每个待处理销售对话语段由两段不同角色的连续对话组成。
其次、将待处理销售对话语段输入至如上述任意一种实施例描述的信息获取模型生成方法生成的信息获取模型中。
在一种示例性实例中,将待处理销售对话语段输入至如权利要求1-6任一项的信息获取模型生成方法生成的信息获取模型中,包括:
首先、将待处理销售对话语段进行分词。
其次、将进行分词处理后的待处理销售对话语段输入至如上述任意一种实施例描述的信息获取模型生成方法生成的信息获取模型中。
在一种示例性实例中,得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题之后,还包括:
首先、将待处理销售对话中每两个相邻的关键语句之间的销售对话划分为一个待处理销售对话环节。
其次、获取每个待处理销售对话环节的关键词。
在一种示例性实例中,获取每个待处理销售对话环节的关键词,包括:
获取每个待处理销售对话环节,并每当获得一个待处理销售对话环节执行以下操作:
首先、计算获得的待处理销售对话环节中所有词语的TF-IDF值。
其次、将TF-IDF值最大的词语作为获得的待处理销售对话环节的关键词。
在一种示例性实例中,计算获得的待处理销售对话环节中所有词语的TF-IDF值,包括:
首先、统计获得的待处理销售对话环节的总词语数。
其次、统计获得的待处理销售对话中的总环节数。
最后、获取获得的待处理销售对话环节中每个词语,并每当获得一个词语执行以下操作:
统计获得的词语在获得的待处理销售对话环节中出现的次数;统计包含获得的词语的待处理销售对话环节的个数;计算(获得的词语在获得的待处理销售对话环节中出现的次数/获得的待处理销售对话环节的总词语数)*log(待处理销售对话中的总环节数/包含获得的词语的待处理销售对话环节的个数),以得到获得的词语在获得的待处理销售对话环节中的TF-IDF值。
在一种示例性实例中,假设获得的词语为词语A,获得的待处理销售对话环节为环节B,则A的TF-IDF值计算方法如下:
TF-IDF(A)=(A在环节B中出现的次数/环节B的总词语数)*log(总环节数/有A出现的环节数),对环节B中所有的词语,计算上述TF-IDF值,取其中TF-IDF值最大的词语作为环节B的关键词。
本申请实施例提供的信息获取模型生成方法,由于采用训练样本训练了神经网络模型,并生成了用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,因此实现了关键语句、非关键语句以及关键语句的所属主题的自动获取,从而极大程度地节省了人力成本的耗费,且提高了信息获取效率。
本申请实施例还提供一种信息获取模型生成装置,如图3所示,包括:
第一获取模块31,用于获取样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题.
第一处理模块32,用于将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型。
在一种示例性实例中,第一处理模块32具体用于:
将样本销售对话划分为若干个销售对话语段,作为样本销售对话语段;其中,每个样本销售对话语段由两段不同角色的连续对话组成。
将样本销售对话语段、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型。
在一种示例性实例中,第一处理模块32具体还用于:
将样本销售对话语段进行分词。
将进行分词处理后的样本销售对话语段、销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型。
在一种示例性实例中,第一处理模块32具体还用于:
将进行分词处理后的样本销售对话语段输入至神经网络模型的输入层,并将销售对话中的关键语句、非关键语句以及关键语句的所属主题输入至神经网络模型的输出层迭代训练神经网络模型,以得到信息获取模型。
在一种示例性实例中,关键语句的所属主题包括:迎宾主题、需求沟通主题、商品推荐主题、询价主题、完成交易主题和送宾主题。
在一种示例性实例中,神经网络模型包括:长短期记忆网络LSTM。
本申请实施例提供的信息获取模型生成装置,由于采用训练样本训练了神经网络模型,并生成了用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,因此能够用于后续关键语句、非关键语句以及关键语句的所属主题的自动获取,从而节省了人力成本的耗费,且提高了信息获取效率。
在实际应用中,所述第一获取模块31和第一处理模块32由位于信息获取模型生成装置中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro ProcessorUnit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。
本申请实施例还提供一种信息获取装置,如图4所示,包括:
第二获取模块41,用于获取待处理销售对话。
第二处理模块42,用于将待处理销售对话输入至上述任意一种实施例描述的信息获取模型生成装置生成的信息获取模型中,得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题。
在一种示例性实例中,第二处理模块42具体用于:
将待处理对话划分为若干个销售对话语段,作为待处理销售对话语段;其中,每个待处理销售对话语段由两段不同角色的连续对话组成。
将待处理销售对话语段输入至上述任意一种实施例描述的信息获取模型生成方法生成的信息获取模型中。
在一种示例性实例中,第二处理模块42具体用于:
将待处理销售对话语段进行分词。
将进行分词处理后的待处理销售对话语段输入至上述任意一种实施例描述的信息获取模型生成方法生成的信息获取模型中。
在一种示例性实例中,第二处理模块42,还用于将待处理销售对话中每两个相邻的关键语句之间的销售对话划分为一个待处理销售对话环节。
第二获取模块41,还用于获取每个待处理销售对话环节的关键词。
在一种示例性实例中,第二获取模块41具体用于:
获取每个待处理销售对话环节,并每当获得一个待处理销售对话环节执行以下操作:
计算获得的待处理销售对话环节中所有词语的信息检索数据挖掘的常用加权技术TF-IDF值。
将TF-IDF值最大的词语作为获得的待处理销售对话环节的关键词。
在一种示例性实例中,第二获取模块41具体还用于:
统计获得的待处理销售对话环节的总词语数。
统计获得的待处理销售对话中的总环节数。
获取获得的待处理销售对话环节中每个词语,并每当获得一个词语执行以下操作:
统计获得的词语在获得的待处理销售对话环节中出现的次数。
统计包含获得的词语的待处理销售对话环节的个数。
计算(获得的词语在获得的待处理销售对话环节中出现的次数/获得的待处理销售对话环节的总词语数)*log(待处理销售对话中的总环节数/包含获得的词语的待处理销售对话环节的个数),以得到获得的词语在获得的待处理销售对话环节中的TF-IDF值。
本申请实施例提供的信息获取模型生成装置,由于采用训练样本训练了神经网络模型,并生成了用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,因此实现了关键语句、非关键语句以及关键语句的所属主题的自动获取,从而极大程度地节省了人力成本的耗费,且提高了信息获取效率。
在实际应用中,所述第二获取模块41和第二处理模块42由位于信息获取模型生成装置中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro ProcessorUnit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。
本申请实施例还提供一种信息处理装置,包括:处理器和存储器,其中,存储器中存储有计算机程序,计算机程序被处理器执行时实现如上述任意一种的方法的处理。
本申请实施例还提供一种存储介质,存储介质上存储有计算机可执行命令,计算机可执行命令用于执行如上述任意一种的方法的处理。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (12)

1.一种信息获取模型生成方法,其特征在于,包括:
获取样本销售对话、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题;
其中,所述关键语句的所属主题包括:迎宾主题、需求沟通主题、商品推荐主题、询价主题、完成交易主题和送宾主题;
将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,包括:
将所述样本销售对话划分为若干个销售对话语段,作为样本销售对话语段;其中,每个所述样本销售对话语段由两段不同角色的连续对话组成;
将所述样本销售对话语段、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为训练样本集迭代训练所述神经网络模型,以得到所述信息获取模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述样本销售对话语段、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为训练样本集迭代训练所述神经网络模型,以得到所述信息获取模型,还包括:
将样本销售对话语段进行分词;
将进行分词处理后的样本销售对话语段、所述销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为所述训练样本集迭代训练所述神经网络模型,以得到所述信息获取模型。
3.根据权利要求2所述的方法,其特征在于,所述将进行分词处理后的样本销售对话语段、销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练神经网络模型,以得到信息获取模型,包括:
将所述进行分词处理后的样本销售对话语段输入至所述神经网络模型的输入层,并将所述销售对话中的关键语句、非关键语句以及所述关键语句的所属主题输入至所述神经网络模型的输出层迭代训练所述神经网络模型,以得到所述信息获取模型。
4.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括:长短期记忆网络LSTM。
5.一种信息获取方法,其特征在于,包括:
获取待处理销售对话;
将待处理销售对话输入至如权利要求1-4任一项所述的信息获取模型生成方法生成的信息获取模型中,得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题。
6.根据权利要求5所述的方法,其特征在于,所述将待处理销售对话输入至如权利要求1-4任一项所述的信息获取模型生成方法生成的信息获取模型中,包括:
将所述待处理销售对话划分为若干个销售对话语段,作为待处理销售对话语段;其中,每个所述待处理销售对话语段由两段不同角色的连续对话组成;
将所述待处理销售对话语段输入至如权利要求1-4任一项所述的信息获取模型生成方法生成的信息获取模型中。
7.根据权利要求6所述的方法,其特征在于,所述将所述待处理销售对话语段输入至如权利要求1-4任一项所述的信息获取模型生成方法生成的信息获取模型中,还包括:
将待处理销售对话语段进行分词;
将进行分词处理后的待处理销售对话语段输入至如权利要求1-4任一项所述的信息获取模型生成方法生成的信息获取模型中。
8.根据权利要求5所述的方法,其特征在于,所述得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题之后,还包括:
将所述待处理销售对话中每两个相邻的关键语句之间的销售对话划分为一个待处理销售对话环节;
获取每个待处理销售对话环节的关键词。
9.根据权利要求8所述的方法,其特征在于,所述获取每个待处理销售对话环节的关键词,包括:
获取每个待处理销售对话环节,并每当获得一个待处理销售对话环节时执行以下操作:
计算获得的待处理销售对话环节中所有词语的TF-IDF值;
将TF-IDF值最大的词语作为获得的待处理销售对话环节的关键词。
10.根据权利要求9所述的方法,其特征在于,所述计算获得的待处理销售对话环节中所有词语的TF-IDF值,包括:
统计获得的待处理销售对话环节的总词语数;
统计获得的待处理销售对话中的总环节数;
获取获得的待处理销售对话环节中每个词语,并每当获得一个词语时执行以下操作:
统计获得的词语在获得的待处理销售对话环节中出现的次数;统计包含获得的词语的待处理销售对话环节的个数;
计算(获得的词语在获得的待处理销售对话环节中出现的次数/获得的待处理销售对话环节的总词语数)*log(所述待处理销售对话中的总环节数/包含获得的词语的待处理销售对话环节的个数),以得到获得的词语在获得的待处理销售对话环节中的TF-IDF值。
11.一种信息获取模型生成装置,其特征在于,包括:
第一获取模块,用于获取样本销售对话、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题;
其中,所述关键语句的所属主题包括:迎宾主题、需求沟通主题、商品推荐主题、询价主题、完成交易主题和送宾主题;
第一处理模块,用于将样本销售对话、样本销售对话中的关键语句、非关键语句以及关键语句的所属主题作为训练样本集迭代训练预先构建的神经网络模型,以得到用于获取关键语句、非关键语句以及关键语句的所属主题的信息获取模型,包括:
将所述样本销售对话划分为若干个销售对话语段,作为样本销售对话语段;其中,每个所述样本销售对话语段由两段不同角色的连续对话组成;
将所述样本销售对话语段、所述样本销售对话中的关键语句、非关键语句以及所述关键语句的所属主题作为训练样本集迭代训练所述神经网络模型,以得到所述信息获取模型。
12.一种信息获取装置,其特征在于,包括:
第二获取模块,用于获取待处理销售对话;
第二处理模块,用于将待处理销售对话输入至如权利要求11所述的信息获取模型生成装置生成的信息获取模型中,得到待处理销售对话中的关键语句、非关键语句以及关键语句的所属主题。
CN201911318523.XA 2019-12-19 2019-12-19 信息获取模型生成方法、装置及信息获取方法、装置 Active CN111178067B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911318523.XA CN111178067B (zh) 2019-12-19 2019-12-19 信息获取模型生成方法、装置及信息获取方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911318523.XA CN111178067B (zh) 2019-12-19 2019-12-19 信息获取模型生成方法、装置及信息获取方法、装置

Publications (2)

Publication Number Publication Date
CN111178067A CN111178067A (zh) 2020-05-19
CN111178067B true CN111178067B (zh) 2023-05-26

Family

ID=70651996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911318523.XA Active CN111178067B (zh) 2019-12-19 2019-12-19 信息获取模型生成方法、装置及信息获取方法、装置

Country Status (1)

Country Link
CN (1) CN111178067B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113240473A (zh) * 2021-05-20 2021-08-10 北京明略昭辉科技有限公司 服务场景销售行为计数方法、系统、计算机及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120514A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 対話要約システムおよび対話要約プログラム
CN106815194A (zh) * 2015-11-27 2017-06-09 北京国双科技有限公司 模型训练方法及装置和关键词识别方法及装置
CN108763284A (zh) * 2018-04-13 2018-11-06 华南理工大学 一种基于深度学习和主题模型的问答系统实现方法
JP2019204117A (ja) * 2019-07-31 2019-11-28 日本電信電話株式会社 対話破壊特徴量抽出装置、対話破壊特徴量抽出方法、プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120514A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 対話要約システムおよび対話要約プログラム
CN106815194A (zh) * 2015-11-27 2017-06-09 北京国双科技有限公司 模型训练方法及装置和关键词识别方法及装置
CN108763284A (zh) * 2018-04-13 2018-11-06 华南理工大学 一种基于深度学习和主题模型的问答系统实现方法
JP2019204117A (ja) * 2019-07-31 2019-11-28 日本電信電話株式会社 対話破壊特徴量抽出装置、対話破壊特徴量抽出方法、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王彬,江铭虎.口语对话系统中的语句主题提取.计算机工程与应用.2005,(18),第58-60、98页. *

Also Published As

Publication number Publication date
CN111178067A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
US11615422B2 (en) Automatically suggesting completions of text
JP6671020B2 (ja) 対話行為推定方法、対話行為推定装置及びプログラム
CN110648163B (zh) 一种基于用户评论的推荐算法
US11138978B2 (en) Topic mining based on interactionally defined activity sequences
US10965812B1 (en) Analysis and classification of unstructured computer text for generation of a recommended conversation topic flow
US20090112571A1 (en) Method for segmenting communication transcripts using unsupervised and semi-supervised techniques
US11804216B2 (en) Generating training datasets for a supervised learning topic model from outputs of a discovery topic model
CN111932296B (zh) 一种产品推荐方法及装置、服务器、存储介质
US11397952B2 (en) Semi-supervised, deep-learning approach for removing irrelevant sentences from text in a customer-support system
US9036806B1 (en) Predicting the class of future customer calls in a call center
US11973725B2 (en) Systems and methods generating conversational responses using machine learning models
US12001797B2 (en) System and method of automatic topic detection in text
CN111178067B (zh) 信息获取模型生成方法、装置及信息获取方法、装置
CN111126038B (zh) 信息获取模型生成方法、装置及信息获取方法、装置
CN116166771A (zh) 一种基于行为文本处理的语音服务内容识别方法
US20130243207A1 (en) Analysis system and method for audio data
Zong et al. Multi-channel auto-encoder for speech emotion recognition
CN115733925A (zh) 业务语音意图呈现方法、装置、介质及电子设备
CN113066506A (zh) 音频数据分离方法、装置、电子设备以及存储介质
CN111476641A (zh) 一种移动设备上语音自动下单的方法、系统及存储介质
Peng et al. Toward predicting communication effectiveness
US11934439B1 (en) Similar cases retrieval in real time for call center agents
CN115114907A (zh) 文本处理方法及装置
CN115203381A (zh) 营销话术推荐系统、方法、装置及设备
CN115905502A (zh) 一种话术挖掘与推荐方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant