CN110390002A - 通话资源配置方法、装置、计算机可读存储介质及服务器 - Google Patents
通话资源配置方法、装置、计算机可读存储介质及服务器 Download PDFInfo
- Publication number
- CN110390002A CN110390002A CN201910525488.2A CN201910525488A CN110390002A CN 110390002 A CN110390002 A CN 110390002A CN 201910525488 A CN201910525488 A CN 201910525488A CN 110390002 A CN110390002 A CN 110390002A
- Authority
- CN
- China
- Prior art keywords
- word
- corpus
- request information
- call
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
Abstract
本发明属于计算机技术领域,尤其涉及一种通话资源配置方法、装置、计算机可读存储介质及服务器。所述方法接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值;根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种通话资源配置方法、装置、计算机可读存储介质及服务器。
背景技术
目前,各类答疑及咨询类系统在人们的日常生活及工作中已得到了广泛的应用,当用户遇到问题时,这些系统可以为用户配置通话资源,并使用该通话资源为用户建立起与专业人员之间的通话连接,以帮助用户解决其问题。但在实际应用中,初始状态下为用户配置的通话资源往往是随机分配的,适配性较低,常常需要经过频繁的通话切换才能为用户找到合适的通话资源,这一过程耗时较长,效率十分低下。
发明内容
有鉴于此,本发明实施例提供了一种通话资源配置方法、装置、计算机可读存储介质及服务器,以解决现有的通话资源配置方法耗时较长,效率十分低下的问题。
本发明实施例的第一方面提供了一种通话资源配置方法,可以包括:
接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
本发明实施例的第二方面提供了一种通话资源配置装置,可以包括:
切词处理模块,用于接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
分值向量查询模块,用于在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
类型概率计算模块,用于根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
通话资源配置模块,用于选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
本发明实施例的第四方面提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例在接收到用户通过终端设备发送的通话请求信息之后,对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语,然后在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由多个维度的分量组成,每个维度均对应于一种通话请求类型的分值,接着根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值,最后选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。通过本发明实施例,事先将通话资源分为多个类型,每类通话资源只配置给对应的通话请求类型,当接收到用户发送的通话请求信息后,首先对该信息进行分析,为其匹配到最合适的通话资源,并将该通话资源配置给用户的终端设备,从而避免了因通话资源配置不当而导致的频繁通话切换的情况,节省了用户时间,大大提高了通话资源的配置效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种通话资源配置方法的一个实施例流程图;
图2为分值数据库的设置过程的示意流程图;
图3为语料库中各个语料子库的示意图;
图4为在分值数据库中分别查询组成通话请求信息的各个词语的分值向量的示意流程图;
图5为本发明实施例中一种通话资源配置装置的一个实施例结构图;
图6为本发明实施例中一种服务器的示意框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种通话资源配置方法的一个实施例可以包括:
步骤S101、接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语。
当用户需要进行咨询或沟通时,可以通过其终端设备向服务器发送通话请求信息,该通话请求信息为用户所要咨询问题的自然语言表述,例如:“甲产品的具体性能参数有哪些?”,“乙产品的质量有问题,请给我退货”等等。服务器在接收到所述通话请求信息,会对其进行切词处理,得到组成所述通话请求信息的各个词语。
切词处理是指将一个语句文本切分成一个一个单独的词语,在本实施例中,可以根据通用词典对语句文本进行切分,保证分出的词语都是正常词汇,如词语不在词典内则分出单字。当前后方向都可以成词时,例如“ABC”,会根据统计词频的大小划分,如“AB”词频高则分出“AB/C”,如“BC”词频高则分出“A/BC”。
步骤S102、在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量。
其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数。在本实施例中,可以将用户所有的通话请求信息划分为:售前商品咨询类,营销活动类,品牌类,售后订单相关类,退货类,维权类等等通话请求类型,并将所有的通话资源也进行相应的分类,每类通话资源只对应某一特定的通话请求类型,本实施例中的通话资源包括但不限于通话信道、通话带宽等资源。
用户在进行不同类型的通话请求时,其发送的通话请求信息中的用词往往会存在较大的差异,某些词语会在某一通话请求类型中频繁出现,而在其它的通话请求类型中极少出现,本实施例利用这一特性,预先通过如图2所示的大数据分析过程设置建立所述分值数据库:
步骤S201、对预设的语料库中的各条语料进行切词处理,得到组成所述语料库的各个词语。
所述语料库中包括与各种通话请求类型分别对应的语料子库。在所述语料库中尽可能多的包含某一统计时间段内的所有的通话请求信息,每条通话请求信息即为一条语料。该统计时间段可以根据实际情况进行设置,例如,可以将其设置为距离当前时刻一周、一个月、一个季度或者一年内的时间段。
每个通话请求信息在被处理之后,对接的专业人员会为其添加一个类型标签(即进行人工标注),例如,某一用户的通话请求信息经过处理后,对接的专业人员认为其属于退货类的通话请求,则为该通话请求信息的类型标签标注为退货类型,标注完成后,该通话请求信息会被存储在语料库中。
如图3所示,语料库中的所有通话请求信息根据其类型标签会被划分为若干个语料子库,每个语料子库均对应于一种类型标签,例如,可以将语料库划分为售前商品咨询子库,营销活动子库,品牌子库,售后订单子库,退货子库,维权子库等等。
切词处理的过程与步骤S101中的过程类似,具体可参照步骤S101中的叙述,此处不再赘述。
步骤S202、分别统计组成所述语料库的各个词语在各个语料子库中出现的频次。
在本实施例中,可以将组成所述语料库的各个词语在各个语料子库中出现的频次记为如下所示的序列形式:
WNSeqw=(WordNumw,1,WordNumw,2,......,WordNumw,c,......,WordNumw,CN)
其中,c为各种通话请求类型的序号(也即语料子库的序号),1≤c≤CN,CN为通话请求类型的总数(也即语料子库的总数),w为组成所述语料库的各个词语的序号,1≤w≤WN,WN组成所述语料库的词语的总数,WordNumw,c为组成所述语料库的第w个词语在与第c种通话请求类型对应的语料子库中出现的次数,WNSeqw为第w个词语在各个语料子库中出现的次数序列。
步骤S203、分别计算组成所述语料库的各个词语与各种通话请求类型对应的分值。
具体地,可以根据下式分别计算组成所述语料库的各个词语与各种通话请求类型对应的分值:
其中,ln为自然对数函数,Scorew,c为组成所述语料库的第w个词语与第c种通话请求类型对应的分值。
由该式可以看出,Scorew,c与WordNumw,c正相关,即某一词语在某个通话请求类型对应的语料子库中出现的次数越多,则该词语与该通话请求类型对应的分值也越高。
当某一词语在某个通话请求类型对应的语料子库中出现的次数较为适中时,即满足:时,其分值取值为0;
当某一词语在某个通话请求类型对应的语料子库中出现的次数较多时,即满足:时,其分值为正数;
当某一词语在某个通话请求类型对应的语料子库中出现的次数较少时,即满足:时,其分值为负数。
步骤S204、构造组成所述语料库的各个词语的分值向量。
具体地,可以根据下式构造组成所述语料库的各个词语的分值向量:
ScoreVecw=(Scorew,1,Scorew,2,......,Scorew,c,......,Scorew,CN)
其中,ScoreVecw为组成所述语料库的第w个词语的分值向量。
步骤S205、将组成所述语料库的各个词语的分值向量构造为所述分值数据库。
通过图2所示的过程,即可完成对所述分值数据库的设置过程,为后续的通话资源配置提供依据。
在本实施例中,所述分值数据库可以为K级树状分片存储结构,则步骤S102可以包括如图4所示的步骤:
步骤S1021、使用多个相互独立的哈希函数对当前词语进行哈希运算。
所述当前词语为组成所述通话请求信息的任意一个词语,具体地,可以根据下式分别使用K个相互独立的哈希函数对所述当前词语进行哈希运算:
HashKeyk=HASHk(BasicWord)
其中,BasicWord为所述当前词语,HASHk为序号为k的哈希函数,HashKeyk为运算得到的序号为k的哈希值,1≤k≤K,K为大于1的整数。
步骤S1022、计算所述当前词语所属的各级存储分片的序号。
具体地,可以根据下式计算所述当前词语所属的第k级存储分片的序号:
其中,MaxHashKeyk为哈希函数HASHk的最大取值,FragNumk为第k级子树的存储分片的数目,Ceil为向上取整函数,Floor为向下取整函数,WordRoute为记录存储路径的数组,WordRoute[k-1]为所述当前词语所属的第k级分片的序号,且为WordRoute的第k个元素。
步骤S1023、在记录的存储路径下查找所述当前词语的分值向量。
具体地,即在数组WordRoute所记录的存储路径下查找所述当前词语的分值向量。例如,若数组WordRoute=[1,2,1,3,5],则存储路径为:第1级子树序号为1的存储分片—>第2级子树序号为2的存储分片—>第3级子树序号为1的存储分片—>第4级子树序号为3的存储分片—>第5级子树序号为5的存储分片,在该存储路径下查找所述当前词语的分值向量。
步骤S103、根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值。
首先,可以根据下式计算所述通话请求信息与各种通话请求类型对应的分值:
其中,cw为组成所述通话请求信息的各个词语的序号,1≤cw≤CWN,CWN为组成所述通话请求信息的词语总数,Scorecw,c为组成所述通话请求信息的第cw个词语与第c种通话请求类型对应的分值,TypeScorec为所述通话请求信息与第第c种通话请求类型对应的分值。
然后,可以根据下式分别计算所述通话请求信息为各种通话请求类型的概率值:
其中,HsWeightc为所述用户在第c种通话请求类型上的权重,且:HsNumc为在预设的历史记录中所述用户的通话请求信息为第c种通话请求类型的次数,TypeProbc为所述通话请求信息为第c种通话请求类型的概率值。
步骤S104、选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
具体地,可以根据下式选取出所述优选通话请求类型:
SelType=Argmax(TypeProbSq)
=Argmax(TypeProb1,TypeProb2,......,TypeProbc,......,TypeProbCN)
其中,Argmax为最大自变量函数,TypeProbSq为所述通话请求信息的概率值序列,且:TypeProbSq=(TypeProb1,TypeProb2,......,TypeProbc,......,TypeProbCN),SelType为选取出的优选通话请求类型的序号。
最后,为所述终端设备配置与所述优选通话请求类型对应的通话资源,并使用该通话资源为用户建立起与专业人员之间的通话连接,以帮助用户解决其问题。
优选地,在步骤S104之前,还可以先判断以下判定条件是否成立:
其中,Max为求最大值函数,SdTypeProbSq为从TypeProbSq中去除掉最大取值后剩余的序列,即:SdTypeProbSq=TypeProbSq-Max(TypeProbSq),ProbThresh为预设的概率阈值,可以根据实际情况将其设置为0.5、0.6、0.7或者其它取值,ScaleThresh为预设的比例阈值,可以根据实际情况将其设置为2、3、5或者其它取值。
若所述判定条件成立,则执行步骤S104,若所述判定条件不成立,则说明仅从当前的通话请求信息来看,并无法准确得知其所属的通话请求类型,此时可以向用户发送消息提醒,例如:“请问您要咨询什么问题?”等等,并再次获取用户发送的通话请求信息,重复以上过程,直至为其匹配到合适的通话请求类型为止。特殊地,如果多次(可以根据实际情况设置为3次、5次等)均未匹配成功,则由指定的通话资源分配专员介入处理,为用户提供人工指导服务。
综上所述,本发明实施例在接收到用户通过终端设备发送的通话请求信息之后,对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语,然后在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由多个维度的分量组成,每个维度均对应于一种通话请求类型的分值,接着根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值,最后选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。通过本发明实施例,事先将通话资源分为多个类型,每类通话资源只配置给对应的通话请求类型,当接收到用户发送的通话请求信息后,首先对该信息进行分析,为其匹配到最合适的通话资源,并将该通话资源配置给用户的终端设备,从而避免了因通话资源配置不当而导致的频繁通话切换的情况,节省了用户时间,大大提高了通话资源的配置效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种通话资源配置方法,图5示出了本发明实施例提供的一种通话资源配置装置的一个实施例结构图。
本实施例中,一种通话资源配置装置可以包括:
切词处理模块501,用于接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
分值向量查询模块502,用于在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
类型概率计算模块503,用于根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
通话资源配置模块504,用于选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
进一步地,所述通话资源配置装置还可以包括:
语料切词模块,用于对预设的语料库中的各条语料进行切词处理,得到组成所述语料库的各个词语,所述语料库中包括与各种通话请求类型分别对应的语料子库;
频次统计模块,用于分别统计组成所述语料库的各个词语在各个语料子库中出现的频次;
词语分值计算模块,用于根据下式分别计算组成所述语料库的各个词语与各种通话请求类型对应的分值:
其中,ln为自然对数函数,c为各种通话请求类型的序号,1≤c≤CN,CN为通话请求类型的总数,w为组成所述语料库的各个词语的序号,1≤w≤WN,WN组成所述语料库的词语的总数,WordNumw,c为组成所述语料库的第w个词语在与第c种通话请求类型对应的语料子库中出现的次数,Scorew,c为组成所述语料库的第w个词语与第c种通话请求类型对应的分值;
分值向量构造模块,用于根据下式构造组成所述语料库的各个词语的分值向量:
ScoreVecw=(Scorew,1,Scorew,2,......,Scorew,c,......,Scorew,CN)
其中,ScoreVecw为组成所述语料库的第w个词语的分值向量;
分值数据库构造模块,用于将组成所述语料库的各个词语的分值向量构造为所述分值数据库。
进一步地,所述分值向量查询模块可以包括:
哈希运算单元,用于根据下式分别使用K个相互独立的哈希函数对当前词语进行哈希运算,所述当前词语为组成所述通话请求信息的任意一个词语:
HashKeyk=HASHk(BasicWord)
其中,BasicWord为所述当前词语,HASHk为序号为k的哈希函数,HashKeyk为运算得到的序号为k的哈希值,1≤k≤K,K为大于1的整数;
分片查询单元,用于根据下式计算所述当前词语所属的第k级存储分片的序号:
其中,MaxHashKeyk为哈希函数HASHk的最大取值,FragNumk为第k级子树的存储分片的数目,Ceil为向上取整函数,Floor为向下取整函数,WordRoute为记录存储路径的数组,WordRoute[k-1]为所述当前词语所属的第k级分片的序号,且为WordRoute的第k个元素;
分值向量查找单元,用于在数组WordRoute所记录的存储路径下查找所述当前词语的分值向量。
进一步地,所述类型概率计算模块可以包括:
信息分值计算单元,用于根据下式计算所述通话请求信息与各种通话请求类型对应的分值:
其中,cw为组成所述通话请求信息的各个词语的序号,1≤cw≤CWN,CWN为组成所述通话请求信息的词语总数,Scorecw,c为组成所述通话请求信息的第cw个词语与第c种通话请求类型对应的分值,TypeScorec为所述通话请求信息与第第c种通话请求类型对应的分值;
类型概率计算单元,用于根据下式分别计算所述通话请求信息为各种通话请求类型的概率值:
其中,HsWeightc为所述用户在第c种通话请求类型上的权重,且:HsNumc为在预设的历史记录中所述用户的通话请求信息为第c种通话请求类型的次数,TypeProbc为所述通话请求信息为第c种通话请求类型的概率值。
进一步地,所述通话资源配置装置还可以包括:
条件判断模块,用于判断以下判定条件是否成立:
其中,Max为求最大值函数,TypeProbSq为所述通话请求信息的概率值序列,且:TypeProbSq=(TypeProb1,TypeProb2,......,TypeProbc,......,TypeProbCN),SdTypeProbSq为从TypeProbSq中去除掉最大取值后剩余的序列,即:SdTypeProbSq=TypeProbSq-Max(TypeProbSq),ProbThresh为预设的概率阈值,ScaleThresh为预设的比例阈值。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图6示出了本发明实施例提供的一种服务器的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本实施例中,所述服务器6可以包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机可读指令62,例如执行上述的通话资源配置方法的计算机可读指令。所述处理器60执行所述计算机可读指令62时实现上述各个通话资源配置方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器60执行所述计算机可读指令62时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块501至504的功能。
示例性的,所述计算机可读指令62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令62在所述服务器6中的执行过程。
所述处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述服务器6的内部存储单元,例如服务器6的硬盘或内存。所述存储器61也可以是所述服务器6的外部存储设备,例如所述服务器6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述服务器6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述服务器6所需的其它指令和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种通话资源配置方法,其特征在于,包括:
接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
2.根据权利要求1所述的通话资源配置方法,其特征在于,所述分值数据库的设置过程包括:
对预设的语料库中的各条语料进行切词处理,得到组成所述语料库的各个词语,所述语料库中包括与各种通话请求类型分别对应的语料子库;
分别统计组成所述语料库的各个词语在各个语料子库中出现的频次;
根据下式分别计算组成所述语料库的各个词语与各种通话请求类型对应的分值:
其中,ln为自然对数函数,c为各种通话请求类型的序号,1≤c≤CN,CN为通话请求类型的总数,w为组成所述语料库的各个词语的序号,1≤w≤WN,WN组成所述语料库的词语的总数,WordNumw,c为组成所述语料库的第w个词语在与第c种通话请求类型对应的语料子库中出现的次数,Scorew,c为组成所述语料库的第w个词语与第c种通话请求类型对应的分值;
根据下式构造组成所述语料库的各个词语的分值向量:
ScoreVecw=(Scorew,1,Scorew,2,......,Scorew,c,......,Scorew,CN)
其中,ScoreVecw为组成所述语料库的第w个词语的分值向量;
将组成所述语料库的各个词语的分值向量构造为所述分值数据库。
3.根据权利要求1所述的通话资源配置方法,其特征在于,所述分值数据库为K级树状分片存储结构,所述在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量包括:
根据下式分别使用K个相互独立的哈希函数对当前词语进行哈希运算,所述当前词语为组成所述通话请求信息的任意一个词语:
HashKeyk=HASHk(BasicWord)
其中,BasicWord为所述当前词语,HASHk为序号为k的哈希函数,HashKeyk为运算得到的序号为k的哈希值,1≤k≤K,K为大于1的整数;
根据下式计算所述当前词语所属的第k级存储分片的序号:
其中,MaxHashKeyk为哈希函数HASHk的最大取值,FragNumk为第k级子树的存储分片的数目,Ceil为向上取整函数,Floor为向下取整函数,WordRoute为记录存储路径的数组,WordRoute[k-1]为所述当前词语所属的第k级分片的序号,且为WordRoute的第k个元素;
在数组WordRoute所记录的存储路径下查找所述当前词语的分值向量。
4.根据权利要求1所述的通话资源配置方法,其特征在于,所述根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值包括:
根据下式计算所述通话请求信息与各种通话请求类型对应的分值:
其中,cw为组成所述通话请求信息的各个词语的序号,1≤cw≤CWN,CWN为组成所述通话请求信息的词语总数,Scorecw,c为组成所述通话请求信息的第cw个词语与第c种通话请求类型对应的分值,TypeScorec为所述通话请求信息与第第c种通话请求类型对应的分值;
根据下式分别计算所述通话请求信息为各种通话请求类型的概率值:
其中,HsWeightc为所述用户在第c种通话请求类型上的权重,且:HsNumc为在预设的历史记录中所述用户的通话请求信息为第c种通话请求类型的次数,TypeProbc为所述通话请求信息为第c种通话请求类型的概率值。
5.根据权利要求1至4中任一项所述的通话资源配置方法,其特征在于,在选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型之前,还包括:
判断以下判定条件是否成立:
其中,Max为求最大值函数,TypeProbSq为所述通话请求信息的概率值序列,且:TypeProbSq=(TypeProb1,TypeProb2,......,TypeProbc,......,TypeProbCN),SdTypeProbSq为从TypeProbSq中去除掉最大取值后剩余的序列,即:SdTypeProbSq=TypeProbSq-Max(TypeProbSq),ProbThresh为预设的概率阈值,ScaleThresh为预设的比例阈值;
若所述判定条件成立,则执行所述选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型的步骤。
6.一种通话资源配置装置,其特征在于,包括:
切词处理模块,用于接收用户通过终端设备发送的通话请求信息,并对所述通话请求信息进行切词处理,得到组成所述通话请求信息的各个词语;
分值向量查询模块,用于在预设的分值数据库中分别查询组成所述通话请求信息的各个词语的分值向量,其中,每个词语的分值向量均由CN个维度的分量组成,每个维度均对应于一种通话请求类型的分值,CN为大于1的整数;
类型概率计算模块,用于根据组成所述通话请求信息的各个词语的分值向量分别计算所述通话请求信息为各种通话请求类型的概率值;
通话资源配置模块,用于选取概率值最大的通话请求类型作为所述通话请求信息的优选通话请求类型,并为所述终端设备配置与所述优选通话请求类型对应的通话资源。
7.根据权利要求6所述的通话资源配置装置,其特征在于,还包括:
语料切词模块,用于对预设的语料库中的各条语料进行切词处理,得到组成所述语料库的各个词语,所述语料库中包括与各种通话请求类型分别对应的语料子库;
频次统计模块,用于分别统计组成所述语料库的各个词语在各个语料子库中出现的频次;
词语分值计算模块,用于根据下式分别计算组成所述语料库的各个词语与各种通话请求类型对应的分值:
其中,ln为自然对数函数,c为各种通话请求类型的序号,1≤c≤CN,CN为通话请求类型的总数,w为组成所述语料库的各个词语的序号,1≤w≤WN,WN组成所述语料库的词语的总数,WordNumw,c为组成所述语料库的第w个词语在与第c种通话请求类型对应的语料子库中出现的次数,Scorew,c为组成所述语料库的第w个词语与第c种通话请求类型对应的分值;
分值向量构造模块,用于根据下式构造组成所述语料库的各个词语的分值向量:
ScoreVecw=(Scorew,1,Scorew,2,......,Scorew,c,......,Scorew,CN)
其中,ScoreVecw为组成所述语料库的第w个词语的分值向量;
分值数据库构造模块,用于将组成所述语料库的各个词语的分值向量构造为所述分值数据库。
8.根据权利要求6所述的通话资源配置装置,其特征在于,所述分值向量查询模块包括:
哈希运算单元,用于根据下式分别使用K个相互独立的哈希函数对当前词语进行哈希运算,所述当前词语为组成所述通话请求信息的任意一个词语:
HashKeyk=HASHk(BasicWord)
其中,BasicWord为所述当前词语,HASHk为序号为k的哈希函数,HashKeyk为运算得到的序号为k的哈希值,1≤k≤K,K为大于1的整数;
分片查询单元,用于根据下式计算所述当前词语所属的第k级存储分片的序号:
其中,MaxHashKeyk为哈希函数HASHk的最大取值,FragNumk为第k级子树的存储分片的数目,Ceil为向上取整函数,Floor为向下取整函数,WordRoute为记录存储路径的数组,WordRoute[k-1]为所述当前词语所属的第k级分片的序号,且为WordRoute的第k个元素;
分值向量查找单元,用于在数组WordRoute所记录的存储路径下查找所述当前词语的分值向量。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的通话资源配置方法的步骤。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的通话资源配置方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910525488.2A CN110390002A (zh) | 2019-06-18 | 2019-06-18 | 通话资源配置方法、装置、计算机可读存储介质及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910525488.2A CN110390002A (zh) | 2019-06-18 | 2019-06-18 | 通话资源配置方法、装置、计算机可读存储介质及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110390002A true CN110390002A (zh) | 2019-10-29 |
Family
ID=68285729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910525488.2A Pending CN110390002A (zh) | 2019-06-18 | 2019-06-18 | 通话资源配置方法、装置、计算机可读存储介质及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110390002A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160357855A1 (en) * | 2015-06-02 | 2016-12-08 | International Business Machines Corporation | Utilizing Word Embeddings for Term Matching in Question Answering Systems |
WO2017107518A1 (zh) * | 2015-12-25 | 2017-06-29 | 乐视控股(北京)有限公司 | 一种解析语音内容的方法及装置 |
CN108009228A (zh) * | 2017-11-27 | 2018-05-08 | 咪咕互动娱乐有限公司 | 一种内容标签的设置方法、装置及存储介质 |
CN108717852A (zh) * | 2018-04-28 | 2018-10-30 | 湖南师范大学 | 一种基于白光通信和类脑认知的智能机器人语义交互系统和方法 |
CN108733644A (zh) * | 2018-04-09 | 2018-11-02 | 平安科技(深圳)有限公司 | 一种文本情感分析方法、计算机可读存储介质及终端设备 |
KR20190059828A (ko) * | 2017-11-23 | 2019-05-31 | 숙명여자대학교산학협력단 | 한국어 어순 기반 단어 임베딩 장치 및 그 방법 |
-
2019
- 2019-06-18 CN CN201910525488.2A patent/CN110390002A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160357855A1 (en) * | 2015-06-02 | 2016-12-08 | International Business Machines Corporation | Utilizing Word Embeddings for Term Matching in Question Answering Systems |
WO2017107518A1 (zh) * | 2015-12-25 | 2017-06-29 | 乐视控股(北京)有限公司 | 一种解析语音内容的方法及装置 |
KR20190059828A (ko) * | 2017-11-23 | 2019-05-31 | 숙명여자대학교산학협력단 | 한국어 어순 기반 단어 임베딩 장치 및 그 방법 |
CN108009228A (zh) * | 2017-11-27 | 2018-05-08 | 咪咕互动娱乐有限公司 | 一种内容标签的设置方法、装置及存储介质 |
CN108733644A (zh) * | 2018-04-09 | 2018-11-02 | 平安科技(深圳)有限公司 | 一种文本情感分析方法、计算机可读存储介质及终端设备 |
CN108717852A (zh) * | 2018-04-28 | 2018-10-30 | 湖南师范大学 | 一种基于白光通信和类脑认知的智能机器人语义交互系统和方法 |
Non-Patent Citations (2)
Title |
---|
李蓉;: "基于支持向量机的汉语歧义切分算法", 计算机仿真, no. 07 * |
王婷婷;韩满;王宇;: "LDA模型的优化及其主题数量选择研究――以科技文献为例", 数据分析与知识发现, no. 01 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2017329098B2 (en) | Method and device for processing question clustering in automatic question and answering system | |
CN106777232A (zh) | 问答抽取方法、装置及终端 | |
US20170109431A1 (en) | Method and apparatus for grouping network service users | |
US11334758B2 (en) | Method and apparatus of data processing using multiple types of non-linear combination processing | |
CN111339277A (zh) | 基于机器学习的问答交互方法及装置 | |
CN109033277A (zh) | 基于机器学习的类脑系统、方法、设备及存储介质 | |
US11461317B2 (en) | Method, apparatus, system, device, and storage medium for answering knowledge questions | |
US11762879B2 (en) | Information traceability method and system based on blockchain | |
Zhang et al. | Providing consistent opinions from online reviews: A heuristic stepwise optimization approach | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN112463930A (zh) | 一种基于人工智能的电销ai机器人 | |
CN105574112A (zh) | 一种通信过程的评论信息处理方法及系统 | |
CN117195046A (zh) | 异常文本识别方法及相关设备 | |
CN108572949A (zh) | 一种房屋信息搜索处理方法及装置 | |
CN107528969A (zh) | 电话拨打时间的管理方法、管理装置及终端设备 | |
CN110390002A (zh) | 通话资源配置方法、装置、计算机可读存储介质及服务器 | |
CN110210884A (zh) | 确定用户特征数据的方法、装置、计算机设备及存储介质 | |
CN108959327B (zh) | 一种业务处理方法、装置及计算机可读存储介质 | |
CN109450963A (zh) | 消息推送方法及终端设备 | |
CN113449210B (zh) | 基于时空特征的个性化推荐方法、装置、电子设备及存储介质 | |
CN113095073B (zh) | 语料标签生成方法、装置、计算机设备和存储介质 | |
CN111523034B (zh) | 一种应用程序的处理方法、装置、设备及介质 | |
CN112307075B (zh) | 用户关系识别方法及装置 | |
CN114268625A (zh) | 特征选择方法、装置、设备及存储介质 | |
CN111143558A (zh) | 基于单个分层多任务模型的消息识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |