CN110489556A - 关于跟进记录的质量评价方法、装置、服务器及存储介质 - Google Patents
关于跟进记录的质量评价方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN110489556A CN110489556A CN201910779899.4A CN201910779899A CN110489556A CN 110489556 A CN110489556 A CN 110489556A CN 201910779899 A CN201910779899 A CN 201910779899A CN 110489556 A CN110489556 A CN 110489556A
- Authority
- CN
- China
- Prior art keywords
- follow
- quality
- record
- target
- sorted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims description 41
- 238000012549 training Methods 0.000 claims description 20
- 238000002372 labelling Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 11
- 238000013441 quality evaluation Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000012706 support-vector machine Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 10
- 238000007726 management method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- UTRLJOWPWILGSB-UHFFFAOYSA-N 1-[(2,5-dioxopyrrol-1-yl)methoxymethyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1COCN1C(=O)C=CC1=O UTRLJOWPWILGSB-UHFFFAOYSA-N 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000036449 good health Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种关于跟进记录的质量评价方法、装置、服务器及存储介质,利用训练好的SVM分类器对待分类跟进记录进行分类;对于有效的待分类跟进记录,统计其文字数量;根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对目标跟进质量进行存储展示;通过分析置业顾问跟进记录的情况,判断其记录质量,从而精确把握有效信息,进而充分掌控客户态度,能及时监控置业顾问的工作态度,同时还能帮助置业顾问下次接见该客户能更有针对性的推荐。
Description
技术领域
本发明涉及房地产数据处理技术领域,尤其涉及一种关于跟进记录的质量评价方法、装置、服务器及存储介质。
背景技术
房地产开发是一个资金投入需求巨大、风险极高的行业,为了保证有效的流动资金,必须加快销售效率,提高客户成交率。针对当前通过电话、现场等方式,获取的可能有意向购买的客户,需要置业顾问及时跟进,尽可能了解客户需求,进而提供更有针对性的产品和建议,让客户满意和认可,只有这样才能提高客户转化率,提高销售效率,为企业发展提供良好的驱动力。
目前,关于置业顾问对意向购房客户的跟进记录进行有效性评价的方法较少,也无法让管理层及时了解置业顾问的工作态度,也不能充分利用客户的信息,从而导致无法及时监控有效客户,导致平台价值难以转化。
发明内容
本发明提供的关于跟进记录的质量评价方法、装置、服务器及存储介质,主要解决的技术问题是:如何对置业顾问跟进记录进行质量评价,以方便管理层及时了解置业顾问的工作态度,统筹销售业务的管理。
为解决上述技术问题,本发明提供一种关于跟进记录的质量评价方法,包括:
接收并存储对意向购房客户的跟进记录;所述跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的;
接收对部分跟进记录的标注操作,所述标注操作包括有效、无效;
将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词;
利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;
根据各目标跟进记录对应的句子向量,训练SVM分类器;
利用训练好的SVM分类器对待分类跟进记录进行分类;
对于有效的待分类跟进记录,统计其文字数量;
根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对所述目标跟进质量进行存储展示。
可选的,所述根据文字数量与跟进质量的对应关系,确定待分类跟进记录对应的目标跟进质量包括:
对于有效的待分类跟进记录,当其文字数量小于4时,确定该待分类跟进记录对应的目标跟进质量为低质量;当其文字数量大于等于4,且小于10时,确定该待分类跟进记录对应的目标跟进质量为中质量;当其文字数量大于等于10时,确定该待分类跟进记录对应的目标跟进质量为高质量。
可选的,所述方法还包括:
按照跟进质量与评分值之间的预设对应关系,计算各置业顾问工作情况的目标评分值,并对各置业顾问的目标评分值进行存储展示。
可选的,所述对各置业顾问的目标评分值进行存储展示包括:
按照目标评分值由大到小的顺序,依次对各置业顾问的目标评分值进行存储展示。
可选的,所述利用结巴分词工具对各目标跟进记录进行分词包括:
加入自定义词典,自定义词典的内容包括相关楼盘名称以及相关房地产专业术语。
本发明还提供一种关于跟进记录的质量评价装置,包括:
存储模块,用于接收并存储对意向购房客户的跟进记录;所述跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的;
接收模块,用于接收对部分跟进记录的标注操作,所述标注操作包括有效、无效;
分词模块,用于将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词;
向量确定模块,用于利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;
训练模块,用于根据各目标跟进记录对应的句子向量,训练SVM分类器;
分类模块,用于利用训练好的SVM分类器对待分类跟进记录进行分类;
计算模块,用于对于有效的待分类跟进记录,统计其文字数量;
处理模块,用于根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对所述目标跟进质量进行存储展示。
可选的,所述处理模块用于:对于有效的待分类跟进记录,当其文字数量小于4时,确定该待分类跟进记录对应的目标跟进质量为低质量;当其文字数量大于等于4,且小于10时,确定该待分类跟进记录对应的目标跟进质量为中质量;当其文字数量大于等于10时,确定该待分类跟进记录对应的目标跟进质量为高质量。
可选的,所述处理模块还用于:按照跟进质量与评分值之间的预设对应关系,计算各置业顾问工作情况的目标评分值,并对各置业顾问的目标评分值进行存储展示。
本发明还提供一种服务器,所述服务器包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的一个或者多个程序,以实现如上任一项所述的关于跟进记录的质量评价方法的步骤。
本发明还提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的关于跟进记录的质量评价方法的步骤。
本发明的有益效果是:
根据本发明提供的关于跟进记录的质量评价方法、装置、服务器及存储介质,通过接收并存储对意向购房客户的跟进记录;跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的;接收对部分跟进记录的标注操作,标注操作包括有效、无效;将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词;利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;根据各目标跟进记录对应的句子向量,训练SVM(支持向量机,Support Vector Machine)分类器;利用训练好的SVM分类器对待分类跟进记录进行分类;对于有效的待分类跟进记录,统计其文字数量;根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对目标跟进质量进行存储展示;通过分析置业顾问跟进记录的情况,判断其记录质量,从而精确把握有效信息,进而充分掌控客户态度,能及时监控置业顾问的工作态度,同时还能帮助置业顾问下次接见该客户能更有针对性的推荐。
附图说明
图1为本发明实施例一的关于跟进记录的质量评价方法流程示意图;
图2为本发明实施例一的关于跟进记录的质量评价方法流程示意图;
图3为本发明实施例一的关于跟进记录的质量评价方法流程示意图;
图4为本发明实施例二的关于跟进记录的质量评价装置结构示意图;
图5为本发明实施例三的服务器结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一:
为了解决如何对置业顾问跟进记录进行质量评价的问题,以方便管理层及时了解置业顾问的工作态度,统筹销售业务的管理,本实施例提供一种关于跟进记录的质量评价方法,通过分析置业顾问跟进记录的情况,判断其记录质量,从而精确把握有效信息,进而充分掌控客户态度,能及时监控置业顾问的工作态度,同时还能帮助置业顾问下次接见该客户能更有针对性的推荐。
请参见图1,该方法主要包括如下步骤:
S101、接收并存储对意向购房客户的跟进记录;所述跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的。
置业顾问在接待客户之后,记录客户需求以及其他相关信息(例如客户家庭信息、工作信息等),可以通过手机端APP填写意向购房客户的上述信息,作为跟进记录,发送到服务器端存储。存储过程可以关联置业顾问身份信息,包括但不限于姓名、工号、电话等信息,还可以包括接待时间、记录时间以及客户身份信息,包括客户姓名、住址以及电话等。
S102、接收对部分跟进记录的标注操作,所述标注操作包括有效、无效。
同一开发商下,通常开发有多个楼盘,每一个楼盘通常都配置有多个置业顾问负责销售业务,每个客户每天所接待的客户几十甚至上百人,所以跟进记录数量较大,通过人为一个一个标注,哪些跟进记录是有效的,哪些跟进记录是无效的,显然不太理想,需要投入较大的工作量。
本方案选择其中一小部分数据进行人工标注,训练SVM分类器,实现自动处理,可以极大降低分类工作量,提高工作效率,便于管理层对销售任务的统筹管理。
S103、将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词。
例如,选择1000条跟进记录进行人工标注,分为有效的跟进记录和无效的跟进记录。
本方案利用python的中文分词工具jieba结巴中的精确模式来分词,此模式试图将句子最精确地切开。结巴工具中自带有词典dict.txt,包含常用的词语,为了提高分类准确性,本方案还加入了自定义词典,其中自定义词典内容包括所需分析的开发商的所有楼盘名称以及相关房地产专业术语等词。
其中,相关房地产专业术语包括但不限于:高层、小高层、洋房、叠拼、别墅、总价、单价、得房率、绿化率、期房、准现房、现房、容积率、建筑间距、楼层净高、跃层、复式、标准层、大平层、塔式、板式、墙式、全款、按揭、公积金、三无等等。
具体的,Jieba中文分词的基本步骤:
1、基于trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(Directed Acyclic Graph,简称DAG)。Jieba分词自带了一个叫dict.txt的词典,里面有2万多条词语,包含了词条出现的次数和词性,本方案再自定义另外一个词典,包含了房地产行业的相关术语以及待分析开发商所有楼盘的名称。所谓的词图扫描就是把这两个词典中的内容放到一个trie树中,只要一个词语的前面几个字相同就代表它们有相同的前缀,则可以使用trie树来存储,具有查找速度快的优势。DAG有向无环图就是对待分词句子,根据给定的词典进行查词典操作,生成几种可能的句子切分。
2、采用动态规划查找最大概率路径,找出基于词频的最大切分组合。在得到所有可能的切分方式构成的有向无环图后,从起点到终点存在多条路径,多条路径也就意味着存在多种分词结果,因此需要计算最大概率路径。动态规划中,先查找待分词句子中已经切分好的词语,对该词语查找该词语出现的频率(次数/总数),然后根据动态规划查找最大概率路径的方法,对句子从右往左反向计算最大概率(反向是因为汉语句子的重心经常落在右边,因为通常情况下形容词太多,后面的才是主干),依次类推,最后得到最大概率路径,得到最大概率的切分组合。
3、对于未登录词,采用了基于汉字成词能力的HMM(Hidden Markov Model,隐马尔科夫链模型)模型,使用了维特比算法。未登录词,就是词典dict.txt和自定义词典中没有记录的词,例如可能包括人名、地名、企业名、缩写词、新增词汇等等。要对这些词进行分词,本方案采用HMM模型。中文词汇按照BEMS四个状态来标记,B是开始begin位置,E是end,是结束位置,M是middle,是中间位置,S是singgle,单独成词的位置,没有前,也没有后。也就是说,所有未登录词采用状态为(B,E,M,S)这四种状态来标记。例如“楼盘”可以标注为BE,即楼/B,盘/E,表示“楼”是开始位置,“盘”是结束位置;同理,“置业顾问”可以标注为BMME。所以要统计的主要有3个概率表。
1)位置转换概率,即B、M、E、S四种状态的转移概率;2)位置到单字的发射概率,比如P(“和”|M)表示一个词的中间出现“和”这个字的概率;3)词语以某种状态开头的概率,只有两种,要么是B,要么是S。通过这3个概率表和维特比(viterbi)算法,就可以得到一个概率最大的BEMS序列,按照B打头,E结尾的方式,对待分词的句子重新组合,就得到了分词结果。例如,“客户有强烈意愿购买山顶别墅”,对应的BEMS序列为:【B,E,S,B,E,B,E,B,E,B,E,B,E】(此序列仅为例子,为众多可能中的一种,不一定是最正确的,还要根据维特比算法找出最大概率路径),根据BEMS序列,通过把连续的BE凑合到一起得到一个词,单独的S放单,就得到一个分词结果了:BE客户/S有/BE强烈/BE意愿/BE购买/BE山顶/BE别墅/。
其中维特比算法原理可以概括为三步:
1)如果概率最大的路径(或者说最短路径)经过某个点,那么这条路径上的起始点到该点的子路径Q,一定是起点到该点之间的最短路径。否则,用起点到另一点的最短路径R替代Q,满足局部最优性原理。
2)从起点到终点的路径必定经过第i个时刻的某个状态,假定第i个时刻有k个状态,那么如果记录了从起点到第i个状态的所有k个节点的最短路径,最终的最短路径必经过其中一条,这样,在任意时刻,只要考虑非常有限的最短路即可。
3)结合以上两点,假定当我们从状态i进入状态i+1时,从起点到状态i上各个节的最短路径已经找到,并且记录在这些节点上,那么在计算从起点到第i+1状态的某个节点Xi+1的最短路径时,只要考虑从起点到前一个状态i所有的k个节点的最短路径,以及从这个节点到Xi+1,j的距离即可。
在本发明的其他实施例中,为了避免跟进记录中,标点符号以及无任何含义的词对分类过程所带来的数据处理难度的增加,可以对其中这些词、符号进行删除。例如,可以增加无效词库,其中包括但不限于一些连接词、感叹词等,例如“的”、“或”、“再”、“至于”、“因为”“哎”、“呀”、“哈”、“啊”等等。对于跟进记录中分词后的这些无效词,予以删除。其中,标点符号包括句号、逗号、分号、引号、感叹号、问号等等。
S104、利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量。
利用word2vc中的CBOW方法将词语转化成向量。Word2vc是词嵌入的一种方式,类似于one-hot(一个向量只含有1,其他都是0的向量来唯一表示词语),Word2vec本质上是一种降维的操作,CBOW模型是利用中心词周围的词来预测中心词,CBOW分为输入层、隐藏层、输出层,模型结构请参见图2所示。
CBOW具体的计算流程如下:
1、将句子分词后转化为one-hot向量,将中心词前后的词向量作为Word2vec的输入I1。
2、所有one-hot分别乘以共享的输入权重矩阵W1(初始化自定义权重矩阵),得到隐藏层的输入I2。
3、将得到的I2输入隐藏层的激活函数,并通过隐藏层权重W2得到输出O。
权值是计算P(I/O),即是当前输入词向量得到真实输出词的概率,借助反向传播过程对输入层和隐藏层权值进行更新。权值更新具体方法如下:
(1)隐藏层权值W2的更新,以最小化损失函数为目标,使用随机梯度下降的方法进行权重的更新。
(2)输入层权值W1的更新,输出层真实单词wj作为预测单词的概率被高估,那么调整输入向量趋向于远离wj输出向量,反之预测单词的概率被低估则调整输入向量趋向于靠近输出向量,如果预测单词刚好与真实值相等,那么不需要对输入权值进行调整。
S105、根据各目标跟进记录对应的句子向量,训练SVM分类器。
SVM分类的思想是,给定给一个包含正例和反例的样本集合,目的是寻找一个超平面来对样本根据正例和反例进行分割。(超平面即为不关注空间的维数,对线性函数的统称)。本方案中,样本集合为1000条已经标注有效或者无效的置业顾问跟进记录,作为整个模型的测试集。
样本分为线性可分和线性不可分。线性可分是指,在二维空间中可以利用一条直线把两类型的样本分开,在高维空间中可以被一个曲面分开的样本。反之,不能被直线或曲面分开的则为线性不可分样本。本方案中,置业顾问跟进记录的有效性的判别是线性不可分样本(实际上,现实生活中大多数样本都是线性不可分)所以要引进核函数。核函数的原理是:将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使样本可分,其基本思想是寻找一个函数,这个函数在低维空间进行计算的结果和映射到高维空间中的计算内积的结果是同的。这样就避开直接在高维空间中计算,而最后结果是等价的。令表示将映射后的特征向量,于是在特征空间中划分超平面所对应的模型为:
g(x)=wTx+b=0;
其中w=(w1;w2;…wd)为法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。显然,划分超平面可被法向量w和位移b确定,所以用(w,b)来表示超平面。在本方案中,是要将样本分为两类(有效、无效),对应的标签为(+1,-1)。那么对于分类器来说,g(x)>0和g(x)<0就可以分别代表两个不同的类别,+1和-1。但光是分开是不够的,SVM的核心思想是尽最大努力使分开的两个类别有最大间隔,这样才使得分隔具有更高的可信度。而且对于未知的新样本才有很好的分类预测能力,即泛化能力。所以SVM的办法是:让离分隔面最近的数据点具有最大的距离。
为了描述离分隔超平面最近的数据点,需要找到两个和这个超平面平行和距离相等的超平面:
H1:y=wTx+b=+1和H2:y=wTx+b=-1;
在这两个超平面上的样本点也就是理论上离分隔超平面最近的点,是它们的存在决定了和的位置,支撑起了分界线,它们就是所谓的支持向量,这就是支持向量机的由来。
两条平行线间的距离公式为:
(假设两条平行线为ax+by=c1和ax+by=c2);
所以可以得出H1与H2之间的距离为即现在的目的是要最大化这个间隔。等价于最小化||w||,为了之后的求导和计算方便,进一步等价于最小化是我们的目标函数,希望它越小越好,则损失就必然是一个能使之变大的量。为了衡量损失,我们定义现在这个问题就变成了一个最优化问题:
其中C为惩罚因子,决定了该分类方法有多重视离群点带来的损失,是一个大于0的常数。I为样本数量。ι0/1为损失函数。
由于损失函数ι0/1非凸、非连续、数学性质不好,为了便于求解,通常用hinge函数作为替代损失函数,hinge损失:
ιhinge(z)=max(0,1-z);
所以可以变为:
yi=1或-1;
进一步引入松弛变量,则可重写为:
这就是支持向量机(SVM)的基本型。显然,上式中每个样本都有一个对应的松弛变量,用以表示该样本不满足约束的程度。要求解此模型,使用拉格朗日乘子法可得到其"对偶问题",对上式的每条约束添加拉格朗日乘子αi≥0,则该问题的拉格朗日函数可写为:
令w,b,ζ的偏导为零:
并代入,可以得到原问题的对偶问题为:
0≤αi≤C,i=1,2,…I;
对于b的求解,现实任务中常采用一种简单高效的做法:使用所有支持向量求解的平均值:
其中S={i|αi>0,i=1,2,…I};解出α后,即可求出w和b得到最终模型。
得出分类后,再计算其精确率和召回率,本方案中无效样本的精确率为0.96,召回率为0.94;有效样本的精确率为0.97,召回率为0.98。请参见图3,分类效果较好,可以用于其他的待分类跟进记录有效性的分类。
S106、利用训练好的SVM分类器对待分类跟进记录进行分类。
S107、对于有效的待分类跟进记录,统计其文字数量。
S108、根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对所述目标跟进质量进行存储展示。
参见如下表1,文字数量与跟进质量之间的预设对应关系:
表1
文字数量 | 跟进质量 |
<4 | 低质量 |
4≤x<10 | 中质量 |
X≥10 | 高质量 |
对于有效的待分类跟进记录,当其文字数量小于4时,确定该待分类跟进记录对应的目标跟进质量为低质量;当其文字数量大于等于4,且小于10时,确定该待分类跟进记录对应的目标跟进质量为中质量;当其文字数量大于等于10时,确定该待分类跟进记录对应的目标跟进质量为高质量。
按照跟进质量与评分值之间的预设对应关系,计算各置业顾问工作情况的目标评分值,并对各置业顾问的目标评分值进行存储展示。
参见如下表2,跟进质量与评分值之间的预设对应关系:
表2
跟进质量 | 评分值 |
低质量 | 1 |
中质量 | 2 |
高质量 | 3 |
对跟进质量以及目标评分值进行展示,参见如下表3所示:
表3
按照目标评分值由大到小的顺序,依次对各置业顾问的目标评分值进行存储展示。
本实施例提供的关于跟进记录的质量评价方法,通过接收并存储对意向购房客户的跟进记录;跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的;接收对部分跟进记录的标注操作,标注操作包括有效、无效;将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词;利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;根据各目标跟进记录对应的句子向量,训练SVM(支持向量机,Support Vector Machine)分类器;利用训练好的SVM分类器对待分类跟进记录进行分类;对于有效的待分类跟进记录,统计其文字数量;根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对目标跟进质量进行存储展示;通过分析置业顾问跟进记录的情况,判断其记录质量,从而精确把握有效信息,进而充分掌控客户态度,能及时监控置业顾问的工作态度,同时还能帮助置业顾问下次接见该客户能更有针对性的推荐。
实施例二:
本实施例在上述实施例一的基础上,提供一种关于跟进记录的质量评价装置,主要用于实现上述实施例一中所述关于跟进记录的质量评价方法的步骤,请参见图4,该装置主要包括如下模块:
存储模块41,用于接收并存储对意向购房客户的跟进记录;跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的。
接收模块42,用于接收对部分跟进记录的标注操作,标注操作包括有效、无效。
分词模块43,用于将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词。
向量确定模块44,用于利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;
训练模块45,用于根据各目标跟进记录对应的句子向量,训练SVM分类器;
分类模块46,用于利用训练好的SVM分类器对待分类跟进记录进行分类;
计算模块47,用于对于有效的待分类跟进记录,统计其文字数量;
处理模块48,用于根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对所述目标跟进质量进行存储展示。
可选的,处理模块48用于:对于有效的待分类跟进记录,当其文字数量小于4时,确定该待分类跟进记录对应的目标跟进质量为低质量;当其文字数量大于等于4,且小于10时,确定该待分类跟进记录对应的目标跟进质量为中质量;当其文字数量大于等于10时,确定该待分类跟进记录对应的目标跟进质量为高质量。
可选的,处理模块还用于按照跟进质量与评分值之间的预设对应关系,计算各置业顾问工作情况的目标评分值,并对各置业顾问的目标评分值进行存储展示。
具体可参加上述实施例一中的描述,在此不在赘述。
实施例三:
本实施例在上述实施例一和/或实施例二的基础上,提供一种服务器,请安参加图5,该服务器包括处理器51、存储器52及通信总线53;
其中,通信总线53用于实现处理器51和存储器52之间的连接通信;
处理器51用于执行存储器52中存储的一个或者多个程序,以实现如实施例一所述的关于跟进记录的质量评价方法的步骤。具体可参加上述实施例一中的描述,在此不在赘述。
本实施例还提供一种存储介质,该存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如实施例一中所述的关于跟进记录的质量评价方法的步骤。具体可参加上述实施例一中的描述,在此不在赘述。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种关于跟进记录的质量评价方法,其特征在于,包括
接收并存储对意向购房客户的跟进记录;所述跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的;
接收对部分跟进记录的标注操作,所述标注操作包括有效、无效;
将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词;
利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;
根据各目标跟进记录对应的句子向量,训练SVM分类器;
利用训练好的SVM分类器对待分类跟进记录进行分类;
对于有效的待分类跟进记录,统计其文字数量;
根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对所述目标跟进质量进行存储展示。
2.如权利要求1所述的关于跟进记录的质量评价方法,其特征在于,所述根据文字数量与跟进质量的对应关系,确定待分类跟进记录对应的目标跟进质量包括:
对于有效的待分类跟进记录,当其文字数量小于4时,确定该待分类跟进记录对应的目标跟进质量为低质量;当其文字数量大于等于4,且小于10时,确定该待分类跟进记录对应的目标跟进质量为中质量;当其文字数量大于等于10时,确定该待分类跟进记录对应的目标跟进质量为高质量。
3.如权利要求1所述的关于跟进记录的质量评价方法,其特征在于,所述方法还包括:
按照跟进质量与评分值之间的预设对应关系,计算各置业顾问工作情况的目标评分值,并对各置业顾问的目标评分值进行存储展示。
4.如权利要求3所述的关于跟进记录的质量评价方法,其特征在于,所述对各置业顾问的目标评分值进行存储展示包括:
按照目标评分值由大到小的顺序,依次对各置业顾问的目标评分值进行存储展示。
5.如权利要求1-4任一项所述的关于跟进记录的质量评价方法,其特征在于,所述利用结巴分词工具对各目标跟进记录进行分词包括:
加入自定义词典,自定义词典的内容包括相关楼盘名称以及相关房地产专业术语。
6.一种关于跟进记录的质量评价装置,其特征在于,包括:
存储模块,用于接收并存储对意向购房客户的跟进记录;所述跟进记录是接待所述意向购房客户的置业顾问通过移动端填写的;
接收模块,用于接收对部分跟进记录的标注操作,所述标注操作包括有效、无效;
分词模块,用于将已标注的目标跟进记录作为训练集,利用结巴分词工具对各目标跟进记录进行分词;
向量确定模块,用于利用Word2vc求出分词后的每个词对应的词向量,进而得到每条目标跟进记录对应的句子向量;
训练模块,用于根据各目标跟进记录对应的句子向量,训练SVM分类器;
分类模块,用于利用训练好的SVM分类器对待分类跟进记录进行分类;
计算模块,用于对于有效的待分类跟进记录,统计其文字数量;
处理模块,用于根据文字数量与跟进质量之间的预设对应关系,确定待分类跟进记录对应的目标跟进质量,并对所述目标跟进质量进行存储展示。
7.如权利要求6所述的关于跟进记录的质量评价装置,其特征在于,所述处理模块用于:对于有效的待分类跟进记录,当其文字数量小于4时,确定该待分类跟进记录对应的目标跟进质量为低质量;当其文字数量大于等于4,且小于10时,确定该待分类跟进记录对应的目标跟进质量为中质量;当其文字数量大于等于10时,确定该待分类跟进记录对应的目标跟进质量为高质量。
8.如权利要求6所述的关于跟进记录的质量评价装置,其特征在于,所述处理模块还用于:按照跟进质量与评分值之间的预设对应关系,计算各置业顾问工作情况的目标评分值,并对各置业顾问的目标评分值进行存储展示。
9.一种服务器,其特征在于,所述服务器包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的一个或者多个程序,以实现如权利要求1至5中任一项所述的关于跟进记录的质量评价方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的关于跟进记录的质量评价方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910779899.4A CN110489556A (zh) | 2019-08-22 | 2019-08-22 | 关于跟进记录的质量评价方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910779899.4A CN110489556A (zh) | 2019-08-22 | 2019-08-22 | 关于跟进记录的质量评价方法、装置、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110489556A true CN110489556A (zh) | 2019-11-22 |
Family
ID=68552859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910779899.4A Pending CN110489556A (zh) | 2019-08-22 | 2019-08-22 | 关于跟进记录的质量评价方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110489556A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445123A (zh) * | 2020-03-25 | 2020-07-24 | 重庆锐云科技有限公司 | 一种客户回访管理系统 |
CN111639299A (zh) * | 2020-05-20 | 2020-09-08 | 重庆锐云科技有限公司 | 置业顾问客户跟进绩效评估方法、系统及存储介质 |
CN111855961A (zh) * | 2020-07-24 | 2020-10-30 | 中南大学 | 一种岩体钻进质量检测方法、钻机、服务器、存储介质 |
CN112365122A (zh) * | 2020-10-10 | 2021-02-12 | 长沙格力暖通制冷设备有限公司 | 一种生产线质量问题监控方法及系统 |
CN115795289A (zh) * | 2022-12-01 | 2023-03-14 | 北京淘友天下技术有限公司 | 特征识别方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090287621A1 (en) * | 2008-05-15 | 2009-11-19 | Eyal Krupka | Forward feature selection for support vector machines |
CN105893350A (zh) * | 2016-03-31 | 2016-08-24 | 重庆大学 | 一种电子商务中文本评论质量的评价方法与系统 |
CN107291780A (zh) * | 2016-04-12 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN108804512A (zh) * | 2018-04-20 | 2018-11-13 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
-
2019
- 2019-08-22 CN CN201910779899.4A patent/CN110489556A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090287621A1 (en) * | 2008-05-15 | 2009-11-19 | Eyal Krupka | Forward feature selection for support vector machines |
CN105893350A (zh) * | 2016-03-31 | 2016-08-24 | 重庆大学 | 一种电子商务中文本评论质量的评价方法与系统 |
CN107291780A (zh) * | 2016-04-12 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN108804512A (zh) * | 2018-04-20 | 2018-11-13 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445123A (zh) * | 2020-03-25 | 2020-07-24 | 重庆锐云科技有限公司 | 一种客户回访管理系统 |
CN111639299A (zh) * | 2020-05-20 | 2020-09-08 | 重庆锐云科技有限公司 | 置业顾问客户跟进绩效评估方法、系统及存储介质 |
CN111855961A (zh) * | 2020-07-24 | 2020-10-30 | 中南大学 | 一种岩体钻进质量检测方法、钻机、服务器、存储介质 |
CN111855961B (zh) * | 2020-07-24 | 2021-10-26 | 中南大学 | 一种岩体钻进质量检测方法、钻机、服务器、存储介质 |
CN112365122A (zh) * | 2020-10-10 | 2021-02-12 | 长沙格力暖通制冷设备有限公司 | 一种生产线质量问题监控方法及系统 |
CN115795289A (zh) * | 2022-12-01 | 2023-03-14 | 北京淘友天下技术有限公司 | 特征识别方法、装置、电子设备及存储介质 |
CN115795289B (zh) * | 2022-12-01 | 2024-05-28 | 北京淘友天下技术有限公司 | 特征识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489556A (zh) | 关于跟进记录的质量评价方法、装置、服务器及存储介质 | |
Swathi et al. | An optimal deep learning-based LSTM for stock price prediction using twitter sentiment analysis | |
US20210350382A1 (en) | Machine learning system for transaction reconciliation | |
US7328218B2 (en) | Constrained tree structure method and system | |
US9015083B1 (en) | Distribution of parameter calculation for iterative optimization methods | |
CN109189904A (zh) | 个性化搜索方法及系统 | |
CN108320171A (zh) | 热销商品预测方法、系统及装置 | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
CN112288455B (zh) | 标签生成方法及装置、计算机可读存储介质、电子设备 | |
CN106445988A (zh) | 一种大数据的智能处理方法和系统 | |
CN110490625A (zh) | 用户偏好确定方法及装置、电子设备、存储介质 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN113704389A (zh) | 一种数据评估方法、装置、计算机设备及存储介质 | |
CN116663938B (zh) | 基于企业数据中台系统的信息化管理方法及其相关装置 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN111369294B (zh) | 软件造价估算方法及装置 | |
CN114254615A (zh) | 组卷方法、装置、电子设备和存储介质 | |
CN116362790A (zh) | 客户类型预测方法、装置、电子设备、介质和程序产品 | |
Salian et al. | Analysis of telecom churn using machine learning techniques | |
TWI752367B (zh) | 基於自然語言處理的智能對話管理方法及系統 | |
CN112231299A (zh) | 一种特征库动态调整的方法和装置 | |
CN116701658A (zh) | 业务意向的确定方法、装置及计算机设备 | |
CN115439180A (zh) | 一种目标对象确定方法、装置、电子设备及存储介质 | |
CN110162747A (zh) | 一种基于特征的预处理及推荐方法 | |
CN115660695A (zh) | 客服人员标签画像构建方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191122 |
|
RJ01 | Rejection of invention patent application after publication |