CN113449001B - 一种知识处理方法、装置及电子设备 - Google Patents

一种知识处理方法、装置及电子设备 Download PDF

Info

Publication number
CN113449001B
CN113449001B CN202110784130.9A CN202110784130A CN113449001B CN 113449001 B CN113449001 B CN 113449001B CN 202110784130 A CN202110784130 A CN 202110784130A CN 113449001 B CN113449001 B CN 113449001B
Authority
CN
China
Prior art keywords
knowledge
target
probability
sharing
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110784130.9A
Other languages
English (en)
Other versions
CN113449001A (zh
Inventor
申亚坤
刘烨敏
周慧婷
陶威
谭莹坤
丁锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202110784130.9A priority Critical patent/CN113449001B/zh
Publication of CN113449001A publication Critical patent/CN113449001A/zh
Application granted granted Critical
Publication of CN113449001B publication Critical patent/CN113449001B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种知识处理方法、装置及电子设备,在获取包括权重和被调用次数满足预设知识筛选规则的目标知识的初始知识共享集合之后,能够根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,并展示所述知识共享集合。进而就能够在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。也就是说,本发明中,可以基于知识共享概率更新知识共享集合,以得到知识共享概率较高的知识,并可以通过点击方式进行知识的选择,相比于输入检索关键字的方式,能够提高知识的检索效率,进而缩短用户的检索等待时间。

Description

一种知识处理方法、装置及电子设备
技术领域
本发明涉及数据处理领域,更具体的说,涉及一种知识处理方法、装置及电子设备。
背景技术
为了便于用户对知识的获取,可以设置存储有大量知识的知识库,用户可以通过在检索框中输入检索关键词的方式在知识库中进行知识检索。
上述这种检索方式,每次检索时都需要用户输入检索关键词,检索效率较低,提高用户检索等待时间。
发明内容
有鉴于此,本发明提供一种知识处理方法、装置及电子设备,以解决检索效率较低,提高用户检索等待时间的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种知识处理方法,包括:
获取初始知识共享集合,所述初始知识共享集合包括权重和被调用次数满足预设知识筛选规则的目标知识;
根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率;
基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率;
根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合;
展示所述知识共享集合,以在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。
可选地,获取初始知识共享集合,包括:
获取历史服务记录;所述历史服务记录包括被调用的各个知识的属性信息以及在各个计算周期的被调用次数;
根据所述知识的属性信息,确定所述知识在各个所述计算周期的权重;
从所述各个知识中,筛选出各个所述计算周期的权重和被调用次数满足预设知识筛选规则的目标知识,并将筛选出的目标知识构建得到初始知识共享集合。
可选地,根据所述知识的属性信息,确定所述知识在各个所述计算周期的权重,包括:
获取所述知识的属性信息中的时间信息,并根据所述时间信息,确定每一计算周期的权重。
可选地,从所述各个知识中,筛选出各个所述计算周期的权重和被调用次数满足预设知识筛选规则的目标知识,包括:
对于每一计算周期,计算所述计算周期内的权重值和被调用次数的乘积;
将所述乘积求和,得到总次数,并按照总次数由大到小的顺序对各个知识进行排序,得到排序结果;
按照排序结果,筛选出预设数量的知识,并作为目标知识。
可选地,根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率,包括:
获取除所述目标知识以外的其他非目标知识的历史调用数据,所述历史调用数据至少包括知识搜索次数、知识分享次数、知识搜索时间、知识分享时间、知识纠偏次数、以及知识对话时长;
调用预设数据处理模型对所述非目标知识的历史调用数据进行处理,得到所述非目标知识的知识共享概率;
所述预设数据处理模型基于训练样本训练得到;所述训练样本包括知识样本的历史调用数据以及知识共享概率。
可选地,基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率,包括:
获取初始知识共享概率;
获取所述目标知识的当前操作数据,并确定所述当前操作数据对应的概率减少值;
基于所述初始知识共享概率和所述概率减少值,确定所述目标知识的知识共享概率。
可选地,根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,包括:
确定知识共享概率大于第一预设概率值的非目标知识的第一个数,以及知识共享概率不大于第二预设概率值的目标知识的第二个数;
确定所述第一个数和所述第二个数的大小关系;
在所述大小关系为所述第一个数和所述第二个数相等的情况下,将知识共享概率不大于第二预设概率值的目标知识替换为知识共享概率大于第一预设概率值的非目标知识,得到知识共享集合;
在所述大小关系为所述第一个数大于所述第二个数的情况下,按照所述非目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第二个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识,得到知识共享集合。
可选地,在所述大小关系为所述第一个数小于所述第二个数的情况下,还包括:
按照所述非目标知识和目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第一个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识;
确定知识共享概率不大于第一预设概率值的非目标知识中,知识共享概率排名前预设数量的非目标知识;所述预设数量为与知识共享概率不大于第二预设概率值、且未被替换的目标知识的数量;
计算确定出的非目标知识的使用频率;
在所述确定出的非目标知识的使用频率大于指定知识的使用频率的情况下,将所述指定知识替换为确定出的非目标知识,得到知识共享集合;所述指定知识为知识共享概率不大于第二预设概率值中未被替换的目标知识。
一种知识处理装置,包括:
集合获取模块,用于获取初始知识共享集合,所述初始知识共享集合包括权重和被调用次数满足预设知识筛选规则的目标知识;
第一概率计算模块,用于根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率;
第二概率计算模块,用于基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率;
知识更新模块,用于根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合;
知识展示模块,用于展示所述知识共享集合,以在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。
一种电子设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行上述的知识处理方法。
相较于现有技术,本发明具有以下有益效果:
本发明提供了一种知识处理方法、装置及电子设备,在获取包括权重和被调用次数满足预设知识筛选规则的目标知识的初始知识共享集合之后,能够根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,并展示所述知识共享集合。进而就能够在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。也就是说,本发明中,可以基于知识共享概率更新知识共享集合,以得到知识共享概率较高的知识,并可以通过点击方式进行知识的选择,相比于输入检索关键字的方式,能够提高知识的检索效率,进而缩短用户的检索等待时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种知识处理方法的方法流程图;
图2为本发明实施例提供的另一种知识处理方法的方法流程图;
图3为本发明实施例提供的再一种知识处理方法的方法流程图;
图4为本发明实施例提供的又一种知识处理方法的方法流程图;
图5为本发明实施例提供的一种知识处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于用户对知识的获取,可以设置存储有大量知识的知识库,用户可以通过在检索框中输入检索关键词的方式在知识库中进行知识检索。
上述这种检索方式,每次检索时都需要用户输入检索关键词,若是第一次检索关键词输入的不准确,还需要再次调整关键词,检索效率较低,提高用户检索等待时间。
为了解决这一技术问题,发明人经过研究发现,若是能够将经常使用的知识(即热点知识)筛选出来,直接展示,若是用户需要检索热点知识,直接点击该热点知识对应的显示标识,即可观看该知识,提高了检索效率,进而降低用户检索等待时间。
更具体的,在获取包括权重和被调用次数满足预设知识筛选规则的目标知识的初始知识共享集合之后,能够根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,并展示所述知识共享集合。进而就能够在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。也就是说,本发明中,可以基于知识共享概率更新知识共享集合,以得到知识共享概率较高的知识,并可以通过点击方式进行知识的选择,相比于输入检索关键字的方式,能够提高知识的检索效率,进而缩短用户的检索等待时间。
在上述内容的基础上,本发明实施例提供了一种知识处理方法,参照图1,可以包括:
S11、获取初始知识共享集合,所述初始知识共享集合包括权重和被调用次数满足预设知识筛选规则的目标知识。
本实施例中,初始知识共享集合包括的目标知识是通过知识的历史(如近一年)使用情况确定的。
筛选出的目标知识可以是近一年中使用频率较高的知识,此外,还可以是根据知识在每个月的使用情况筛选出来的。
需要说明的是,本实施例中的初始知识共享集合可以按照技能组进行设定,即每一技能组对应一初始知识共享集合。其中,技能组可以是呼入、呼出、文本等。
具体的,参照图2,步骤S11可以包括:
S21、获取历史服务记录。
其中,所述历史服务记录包括被调用的各个知识的属性信息以及在各个计算周期的被调用次数。
本实施例中,可以筛选出近一年被调用的知识,然后获取被调用的知识的属性信息,属性信息可以是被调用的时间信息,如计算周期,其中,计算周期可以是月,即统计每一被调用的知识在过去的12个月中哪一个月中被调用。
此外,还需要统计该知识在各个计算周期的被调用次数,如在过去第12个月,调用了5次,在过去第11个月,被调用了3次,在过去第1个月,被调用了2次。
S22、根据所述知识的属性信息,确定所述知识在各个所述计算周期的权重。
具体的,获取所述知识的属性信息中的时间信息,并根据所述时间信息,确定每一计算周期的权重。
其中,时间信息已经在步骤S21中进行了解释说明。
详细来说,以计算周期为月为例,对最近各个月的权重采用折扣率的方式进行计算,如最近一个月的系数为r的0次方,上上个月的系数为r的1次方,上上上个月的系数为r的2次方……,以此类推,直至到过去的第12个月。
其中,r可以是技术人员根据实际应用场景设定的(0,1)的正数,如0.65。
S23、从所述各个知识中,筛选出各个所述计算周期的权重和被调用次数满足预设知识筛选规则的目标知识,并将筛选出的目标知识构建得到初始知识共享集合。
具体的,步骤S23可以包括:
1)对于每一计算周期,计算所述计算周期内的权重值和被调用次数的乘积。
2)将所述乘积求和,得到总次数,并按照总次数由大到小的顺序对各个知识进行排序,得到排序结果。
本实施例中,对于一被调用的知识,将其在每个计算周期的权重值和被调用次数的乘积之和,作为该知识在过去一年被调用的总次数。
按照总次数由大到小的顺序排序,排序在前的知识为较长使用的知识。
3)按照排序结果,筛选出预设数量的知识,并作为目标知识。
本实施例中,可以筛选出预设数量,如5个知识,在具体筛选时,可以筛选出前5个知识,并作为目标知识,5个目标知识组成了初始知识共享集合。
本实施例中,在筛选目标知识时,除了考虑知识在各个计算周期内被调用的次数,还会考虑计算周期接近当前时间的时间距离,并根据时间距离设置各个计算周期的权重,进而使得确定出的目标知识的准确度较高。
S12、根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率。
由于步骤S11中确定出的目标知识是根据近一年的使用情况确定,可能确定出的目标知识不是很符合当前的知识使用情况,所以需要对确定出的目标知识进行调整和修正。
此时需要预测未位于该初始知识共享集合中的非目标知识的知识共享概率。
具体的,本实施例中,预测非目标知识的知识共享概率可以使用神经网络模型实现,神经网络模型可以是三层全连接神经网络,本实施例中的神经网络模型称为预设数据处理模型。
预设数据处理模型基于训练样本训练得到,所述训练样本包括知识样本的历史调用数据以及知识共享概率。其中,知识共享概率为打的标签。
其中,历史调用数据至少包括知识搜索次数、知识分享次数、知识搜索时间、知识分享时间、知识纠偏次数、以及知识对话时长。
在实际应用中,获取各个知识样本的历史调用数据,此外,还需要获取知识样本的知识共享概率,其中,作为标签的知识共享概率来源于系统获取和人工打标两种方式,系统获取是自动从知识库系统中根据共享次数最高Topm(m为正整数)的知识,并获取该知识的共享概率,人工打标是人为根据知识的性质对知识进行是否共享,以及共享概率进行打标,进而可以通过系统获取和人工打标这两种方式确定知识共享概率。
在获取了知识样本的历史调用数据以及知识共享概率之后,可以使用这些数据对神经网络模型进行训练,直至模型的损失函数值小于预设阈值时停止。
在训练得到预设数据处理模型之后,可以获取除所述目标知识以外的其他非目标知识的历史调用数据,所述历史调用数据至少包括知识搜索次数、知识分享次数、知识搜索时间、知识分享时间、知识纠偏次数、以及知识对话时长。
然后,调用预设数据处理模型对所述非目标知识的历史调用数据进行处理,得到所述非目标知识的知识共享概率。
本实施例中,预设数据处理模型使用大量的训练样本训练得到,进而预设数据处理模型的准确度较高,使用该模型进行知识共享概率的预测的准确度也会较高。
S13、基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率。
具体的,位于初始知识共享集合的目标数据的实时操作情况会发生改变,进而可以根据实时操作情况,确定该目标数据是继续位于初始知识共享集合中,还是移除出初始知识共享集合中。本实施例中,对初始知识共享集合中的知识进行监控,计算知识共享概率的变化。
具体的,参照图3,步骤S13可以包括:
S31、获取初始知识共享概率。
本实施例中的初始知识共享概率K是技术人员根据具体使用场景设定的。
S32、获取所述目标知识的当前操作数据,并确定所述当前操作数据对应的概率减少值。
本实施例中的当前操作数据可以是1小时内的操作数据,操作数据包括知识检索次数(具体可以为N次)、知识纠偏次数(具体可以为M次)、知识是否被融合(具体可以为是或否)等。
对于知识检索次数(具体可以为N次),可以在N小于10次,设定概率减少值为第一减少值,如5,在N不小于10次,设定概率减少值为第二减少值,如2。
对于知识纠偏次数(具体可以为M次),可以在M小于5次,设定概率减少值为第三减少值,如3,在N不小于5次,设定概率减少值为第四减少值,如7。
对于知识是否被融合(具体可以为是或否),在被融合时,设定概率减少值为第五减少值,如3,在未被融合时,设定概率减少值为第六减少值,如2。
S33、基于所述初始知识共享概率和所述概率减少值,确定所述目标知识的知识共享概率。
具体的,可以将初始知识共享概率与概率减少值的差值,作为目标知识的知识共享概率。
若是目标知识的知识共享概率不大于第二预设概率值(具体可以根据实际场景设定),则说明该目标知识的使用情况较差,满足失效条件,可被替换掉。
S14、根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合。
具体的,若是非目标知识的知识共享概率较高,目标知识的知识共享概率较低,可以将目标知识替换为非目标知识,得到知识共享集合,保证知识共享集合中的知识为较常使用的知识,即保存的是热门知识。
具体的,参照图4,步骤S14可以包括:
S41、确定知识共享概率大于第一预设概率值的非目标知识的第一个数,以及知识共享概率不大于第二预设概率值的目标知识的第二个数。
具体的,在根据上述的方案确定出非目标知识的知识共享概率以及所述目标知识的知识共享概率后,确定知识共享概率大于第一预设概率值的非目标知识的第一个数,以及知识共享概率不大于第二预设概率值的目标知识的第二个数。
本实施例中的第一预设概率值和第二预设概率值依据实际场景设定,第一个数和第二个数为大于等于零的数值。
S42、确定所述第一个数和所述第二个数的大小关系。
本实施例中的大小关系分为三种,分别为:
1)大小关系为所述第一个数和所述第二个数相等;
2)大小关系为所述第一个数大于所述第二个数;
3)大小关系为所述第一个数小于所述第二个数。
针对上述三种情况,会有相应的知识替换方案。
S43、按照所述非目标知识和目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第一个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识。
具体的,在所述大小关系为所述第一个数小于所述第二个数的情况下,执行步骤S43。
假设第一个数为3,第二个数为5,则分别按照知识共享概率对非目标知识和目标知识进行排序,在排序时,按照知识共享概率由大到小的顺序排序。
然后将前3个非目标知识替换后3个目标知识。
S44、确定知识共享概率不大于第一预设概率值的非目标知识中,知识共享概率排名前预设数量的非目标知识。
其中,所述预设数量为与知识共享概率不大于第二预设概率值、且未被替换的目标知识的数量。
具体的,上述5个目标知识中,被替换了3个,还剩余2个目标知识,则与知识共享概率不大于第二预设概率值、且未被替换的目标知识的数量为2。
此时,可以将这2个目标知识存储到待观察队列中,若是存在使用频率高于目标知识的使用频率的非目标知识,则对目标知识执行替换操作。若是不存在,则不执行替换操作,此时,可以在下一周期,如下一小时后,重新确定知识共享集合中的知识的内容,或者是,在有满足的使用频率高于目标知识的使用频率的非目标知识时,立即执行替换操作。
S45、计算确定出的非目标知识的使用频率。
具体的,可以统计1小时内的使用频率,如5分钟使用1次,1小时使用12次。
S46、在所述确定出的非目标知识的使用频率大于指定知识的使用频率的情况下,将所述指定知识替换为确定出的非目标知识,得到知识共享集合。
其中,所述指定知识为知识共享概率不大于第二预设概率值中未被替换的目标知识。
对于上述的2个未被替换的目标知识,若是存在2个使用频率大于目标知识的使用频率的非目标知识,则将知识共享概率不大于第一预设概率值的非目标知识中,使用频率最高和次高的两个非目标知识替换上述的2个未被替换的目标知识。
若是存在1个使用频率大于目标知识的使用频率的非目标知识,则将该目标知识替换了使用上述的2个未被替换的目标知识中,使用频率较低的目标知识。
若是不存在使用频率大于目标知识的使用频率的非目标知识,则不进行替换操作,上述的2个未被替换的目标知识保留在待观察队列中。
S47、将知识共享概率不大于第二预设概率值的目标知识替换为知识共享概率大于第一预设概率值的非目标知识,得到知识共享集合。
在所述大小关系为所述第一个数和所述第二个数相等的情况下,执行步骤S47。
具体的,由于确定出的目标知识的个数和非目标知识的个数相同,则直接将确定出的非目标知识替换了目标知识即可。
S48、按照所述非目标知识和目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第二个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识,得到知识共享集合。
其中,在所述大小关系为所述第一个数大于所述第二个数的情况下,执行步骤S48。
具体的,本步骤中,确定出的非目标知识的个数多于确定出的目标知识的个数,此时可以按照知识共享概率由大到小的顺序对非目标知识进行排序,然后将前第二个数的非目标知识替换了确定出的目标知识,得到知识共享集合。
S15、展示所述知识共享集合,以在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。
本实施例中,在确定出知识共享集合后,可以在知识检索界面的指定位置,如右侧,展示该知识共享集合。对于每一技能组,均展示其对应的知识共享集合。
其中,知识共享集合中的每一知识可以以显示标识的方式展示,其中,显示图标可以是知识的名称,若是用户点击该显示图标,则会跳转至该知识的详细介绍界面,用户可以在该界面详细了解该知识。
本实施例中,在获取包括权重和被调用次数满足预设知识筛选规则的目标知识的初始知识共享集合之后,能够根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,并展示所述知识共享集合。进而就能够在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。也就是说,本发明中,可以基于知识共享概率更新知识共享集合,以得到知识共享概率较高的知识,并可以通过点击方式进行知识的选择,相比于输入检索关键字的方式,能够提高知识的检索效率,进而缩短用户的检索等待时间。
另外,本实施例中,能够基于统计获取初始知识共享集合的目标知识,在知识服务过程中对知识库中的知识进行实时监控,当目标知识使用较少时,及时对初始知识共享集合中的内容进行热门知识替换,保证知识共享集合的知识高命中率和高可靠性,该方法能够有效监控当前知识库的知识应用趋势,降低客户检索的时间开销,有效提升客户的客服体验。
可选地,在上述知识处理方法的实施例的基础上,本发明的另一实施例提供了一种知识处理装置,参照图5,包括:
集合获取模块11,用于获取初始知识共享集合,所述初始知识共享集合包括权重和被调用次数满足预设知识筛选规则的目标知识;
第一概率计算模块12,用于根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率;
第二概率计算模块13,用于基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率;
知识更新模块14,用于根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合;
知识展示模块15,用于展示所述知识共享集合,以在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。
进一步,集合获取模块11包括:
记录获取子模块,用于获取历史服务记录;所述历史服务记录包括被调用的各个知识的属性信息以及在各个计算周期的被调用次数;
权重确定子模块,用于根据所述知识的属性信息,确定所述知识在各个所述计算周期的权重;
筛选子模块,用于从所述各个知识中,筛选出各个所述计算周期的权重和被调用次数满足预设知识筛选规则的目标知识,并将筛选出的目标知识构建得到初始知识共享集合。
进一步,权重确定子模块具体用于:
获取所述知识的属性信息中的时间信息,并根据所述时间信息,确定每一计算周期的权重。
进一步,筛选子模块具体用于:
对于每一计算周期,计算所述计算周期内的权重值和被调用次数的乘积;
将所述乘积求和,得到总次数,并按照总次数由大到小的顺序对各个知识进行排序,得到排序结果;
按照排序结果,筛选出预设数量的知识,并作为目标知识。
进一步,第一概率计算模块12具体用于:
获取除所述目标知识以外的其他非目标知识的历史调用数据,调用预设数据处理模型对所述非目标知识的历史调用数据进行处理,得到所述非目标知识的知识共享概率;
所述预设数据处理模型基于训练样本训练得到;所述训练样本包括知识样本的历史调用数据以及知识共享概率。所述历史调用数据至少包括知识搜索次数、知识分享次数、知识搜索时间、知识分享时间、知识纠偏次数、以及知识对话时长。
进一步,第二概率计算模块13具体用于:
获取初始知识共享概率,获取所述目标知识的当前操作数据,并确定所述当前操作数据对应的概率减少值,基于所述初始知识共享概率和所述概率减少值,确定所述目标知识的知识共享概率。
进一步,知识更新模块14包括:
个数确定子模块,用于确定知识共享概率大于第一预设概率值的非目标知识的第一个数,以及知识共享概率不大于第二预设概率值的目标知识的第二个数;
关系确定子模块,用于确定所述第一个数和所述第二个数的大小关系;
第一替换子模块,用于在所述大小关系为所述第一个数和所述第二个数相等的情况下,将知识共享概率不大于第二预设概率值的目标知识替换为知识共享概率大于第一预设概率值的非目标知识,得到知识共享集合;
第二替换子模块,用于在所述大小关系为所述第一个数大于所述第二个数的情况下,按照所述非目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第二个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识,得到知识共享集合。
进一步,知识更新模块14还包括:
第三替换子模块,用于在所述大小关系为所述第一个数小于所述第二个数的情况下,按照所述非目标知识和目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第一个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识;
数据确定子模块,用于确定知识共享概率不大于第一预设概率值的非目标知识中,知识共享概率排名前预设数量的非目标知识;所述预设数量为与知识共享概率不大于第二预设概率值、且未被替换的目标知识的数量;
频率计算子模块,用于计算确定出的非目标知识的使用频率;
第四替换子模块,用于在所述确定出的非目标知识的使用频率大于指定知识的使用频率的情况下,将所述指定知识替换为确定出的非目标知识,得到知识共享集合;所述指定知识为知识共享概率不大于第二预设概率值中未被替换的目标知识。
本实施例中,在获取包括权重和被调用次数满足预设知识筛选规则的目标知识的初始知识共享集合之后,能够根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,并展示所述知识共享集合。进而就能够在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。也就是说,本发明中,可以基于知识共享概率更新知识共享集合,以得到知识共享概率较高的知识,并可以通过点击方式进行知识的选择,相比于输入检索关键字的方式,能够提高知识的检索效率,进而缩短用户的检索等待时间。
需要说明的是,本实施例中的各个模块和子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选地,在上述知识处理方法及装置的实施例的基础上,本发明的另一实施例提供了一种电子设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行上述的知识处理方法。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种知识处理方法,其特征在于,包括:
获取初始知识共享集合,所述初始知识共享集合包括权重和被调用次数满足预设知识筛选规则的目标知识;
根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率,其中,包括:获取除所述目标知识以外的其他非目标知识的历史调用数据,所述历史调用数据至少包括知识搜索次数、知识分享次数、知识搜索时间、知识分享时间、知识纠偏次数、以及知识对话时长;调用预设数据处理模型对所述非目标知识的历史调用数据进行处理,得到所述非目标知识的知识共享概率;所述预设数据处理模型基于训练样本训练得到;所述训练样本包括知识样本的历史调用数据以及知识共享概率;
基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率;
根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合;
展示所述知识共享集合,以在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。
2.根据权利要求1所述的知识处理方法,其特征在于,获取初始知识共享集合,包括:
获取历史服务记录;所述历史服务记录包括被调用的各个知识的属性信息以及在各个计算周期的被调用次数;
根据所述知识的属性信息,确定所述知识在各个所述计算周期的权重;
从所述各个知识中,筛选出各个所述计算周期的权重和被调用次数满足预设知识筛选规则的目标知识,并将筛选出的目标知识构建得到初始知识共享集合。
3.根据权利要求2所述的知识处理方法,其特征在于,根据所述知识的属性信息,确定所述知识在各个所述计算周期的权重,包括:
获取所述知识的属性信息中的时间信息,并根据所述时间信息,确定每一计算周期的权重。
4.根据权利要求3所述的知识处理方法,其特征在于,从所述各个知识中,筛选出各个所述计算周期的权重和被调用次数满足预设知识筛选规则的目标知识,包括:
对于每一计算周期,计算所述计算周期内的权重值和被调用次数的乘积;
将所述乘积求和,得到总次数,并按照总次数由大到小的顺序对各个知识进行排序,得到排序结果;
按照排序结果,筛选出预设数量的知识,并作为目标知识。
5.根据权利要求1所述的知识处理方法,其特征在于,基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率,包括:
获取初始知识共享概率;
获取所述目标知识的当前操作数据,并确定所述当前操作数据对应的概率减少值;
基于所述初始知识共享概率和所述概率减少值,确定所述目标知识的知识共享概率。
6.根据权利要求1所述的知识处理方法,其特征在于,根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合,包括:
确定知识共享概率大于第一预设概率值的非目标知识的第一个数,以及知识共享概率不大于第二预设概率值的目标知识的第二个数;
确定所述第一个数和所述第二个数的大小关系;
在所述大小关系为所述第一个数和所述第二个数相等的情况下,将知识共享概率不大于第二预设概率值的目标知识替换为知识共享概率大于第一预设概率值的非目标知识,得到知识共享集合;
在所述大小关系为所述第一个数大于所述第二个数的情况下,按照所述非目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第二个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识,得到知识共享集合。
7.根据权利要求6所述的知识处理方法,其特征在于,在所述大小关系为所述第一个数小于所述第二个数的情况下,还包括:
按照所述非目标知识和目标知识的知识共享概率的大小,将知识共享概率不大于第二预设概率值、且个数为第一个数的目标知识替换为知识共享概率大于第一预设概率值的同等数量的非目标知识;
确定知识共享概率不大于第一预设概率值的非目标知识中,知识共享概率排名前预设数量的非目标知识;所述预设数量为与知识共享概率不大于第二预设概率值、且未被替换的目标知识的数量;
计算确定出的非目标知识的使用频率;
在所述确定出的非目标知识的使用频率大于指定知识的使用频率的情况下,将所述指定知识替换为确定出的非目标知识,得到知识共享集合;所述指定知识为知识共享概率不大于第二预设概率值中未被替换的目标知识。
8.一种知识处理装置,其特征在于,包括:
集合获取模块,用于获取初始知识共享集合,所述初始知识共享集合包括权重和被调用次数满足预设知识筛选规则的目标知识;
第一概率计算模块,用于根据除所述目标知识以外的其他非目标知识的历史调用数据,预测所述非目标知识的知识共享概率,其中,包括:获取除所述目标知识以外的其他非目标知识的历史调用数据,所述历史调用数据至少包括知识搜索次数、知识分享次数、知识搜索时间、知识分享时间、知识纠偏次数、以及知识对话时长;调用预设数据处理模型对所述非目标知识的历史调用数据进行处理,得到所述非目标知识的知识共享概率;所述预设数据处理模型基于训练样本训练得到;所述训练样本包括知识样本的历史调用数据以及知识共享概率;
第二概率计算模块,用于基于所述目标知识的当前操作数据,计算所述目标知识的知识共享概率;
知识更新模块,用于根据所述非目标知识的知识共享概率以及所述目标知识的知识共享概率,对所述初始知识共享集合中包括的知识进行更新,得到知识共享集合;
知识展示模块,用于展示所述知识共享集合,以在接收到对所述知识共享集合中的知识的显示标识的点击操作的情况下,对点击的显示标识对应的知识进行展示。
9.一种电子设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行如权利要求1-7任一项所述的知识处理方法。
CN202110784130.9A 2021-07-12 2021-07-12 一种知识处理方法、装置及电子设备 Active CN113449001B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110784130.9A CN113449001B (zh) 2021-07-12 2021-07-12 一种知识处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110784130.9A CN113449001B (zh) 2021-07-12 2021-07-12 一种知识处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN113449001A CN113449001A (zh) 2021-09-28
CN113449001B true CN113449001B (zh) 2024-02-20

Family

ID=77815827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110784130.9A Active CN113449001B (zh) 2021-07-12 2021-07-12 一种知识处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113449001B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111897944A (zh) * 2020-08-17 2020-11-06 哈尔滨工业大学 基于语义空间共享的知识图谱问答系统
CN112528010A (zh) * 2020-12-15 2021-03-19 建信金融科技有限责任公司 知识推荐方法、装置、计算机设备及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111897944A (zh) * 2020-08-17 2020-11-06 哈尔滨工业大学 基于语义空间共享的知识图谱问答系统
CN112528010A (zh) * 2020-12-15 2021-03-19 建信金融科技有限责任公司 知识推荐方法、装置、计算机设备及可读存储介质

Also Published As

Publication number Publication date
CN113449001A (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CN110149540B (zh) 多媒体资源的推荐处理方法、装置、终端及可读介质
CN110503206A (zh) 一种预测模型更新方法、装置、设备及可读介质
EP3133537A1 (en) Method and device for forecasting changes of feature information
CN108460082A (zh) 一种推荐方法及装置,电子设备
CN110162292A (zh) 语音播报方法及装置
US20190114711A1 (en) Financial analysis system and method for unstructured text data
US20220261591A1 (en) Data processing method and apparatus
CN110910201B (zh) 信息推荐的控制方法、装置、计算机设备及存储介质
CN108509499A (zh) 一种搜索方法及装置,电子设备
CN109376873A (zh) 运维方法、装置、电子设备及计算机可读存储介质
US9940361B2 (en) Intelligent presence server systems and methods
CN111080417A (zh) 用于提高预订顺畅率的处理方法、模型训练方法及系统
CN110766184A (zh) 订单量预测方法和装置
US9870403B1 (en) Estimating social content interactions
CN111178537A (zh) 一种特征提取模型训练方法及设备
CN108268357A (zh) 实时数据处理方法和装置
CN111314790A (zh) 一种视频播放记录的排序方法、装置和电子设备
JP6978582B2 (ja) 予測業務支援装置および予測業務支援方法
CN113449001B (zh) 一种知识处理方法、装置及电子设备
CN117522132A (zh) 供应商风险评估系统及应用方法
CN112860672A (zh) 标签权重的确定方法和装置
CN112070564A (zh) 广告拉取方法、装置、系统与电子设备
CN114064445A (zh) 一种测试方法、装置、设备及计算机可读存储介质
CN111046156A (zh) 奖励数据的确定方法、装置和服务器
CN113537631B (zh) 药品需求量的预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant