CN109947927A - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN109947927A
CN109947927A CN201910254404.6A CN201910254404A CN109947927A CN 109947927 A CN109947927 A CN 109947927A CN 201910254404 A CN201910254404 A CN 201910254404A CN 109947927 A CN109947927 A CN 109947927A
Authority
CN
China
Prior art keywords
information
user
classification
weight
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910254404.6A
Other languages
English (en)
Other versions
CN109947927B (zh
Inventor
朱砡赐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201910254404.6A priority Critical patent/CN109947927B/zh
Publication of CN109947927A publication Critical patent/CN109947927A/zh
Application granted granted Critical
Publication of CN109947927B publication Critical patent/CN109947927B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种信息处理方法、装置及电子设备,应用于问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息,包括:获取第一用户输入的第一信息,确定出符合第一预设条件的多条第二信息,根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率,按照所述展示顺序输出所述多条第二信息。所述信息处理方法,首先依据第一预设条件筛选出多条第二信息,然后能够依据第二信息在历史数据中的解决效率确定多条第二信息的展示顺序,从多个角度综合考虑最终展示出的第二信息的准确性,有利于提升用户的使用体验。

Description

一种信息处理方法及装置
技术领域
本发明涉及智能服务技术,更具体的说,是涉及一种信息处理方法及装置。
背景技术
智能问答技术现已广泛应用于各服务行业,其能够帮助企业、商家节省人工,并及时快速响应用户问题,受到广大用户喜爱。
目前,智能问答服务通常是预先配置好问题库,其中存储有海量标准问句和对应的标准答案,用户使用过程中,系统根据用户输入自动匹配最接近的标准问句,或者根据用户输入推荐出多个标准问句,由用户选择确定最符合真实意思的标准问句,然后给出对应的标准答案。
然而,在实际应用中,智能问答服务针对用户输入的问题推荐出的标准问句以及标准问句的排序,常常与用户的真实意思存在偏差,智能服务系统理解精度偏低。
发明内容
有鉴于此,本发明提供如下技术方案:
一种信息处理方法,应用于一问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息,包括:
获取第一用户输入的第一信息;
依据所述第一信息确定出符合第一预设条件的多条第二信息;
根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率;
按照所述展示顺序输出所述多条第二信息。
可选的,在所述确定出符合第一预设条件的多条第二信息前,还包括:
在预先划分的多个分类中确定所述第一信息所属的分类信息;
则所述依据所述第一信息确定出符合第一预设条件的多条第二信息,包括:
从所述分类信息中确定出符合第一预设条件的多条第二信息。
可选的,还包括:
预先对历史数据进行特征提取,并对提取的特征进行聚类,产生多个聚类主题,其中,每一个所述聚类主题代表一个分类。
可选的,所述在预先划分的多个分类中确定所述第一信息所属的分类信息,包括:
对所述第一信息进行特征提取,得到第一特征数据;
在预先划分的多个分类中确定与所述第一特征数据距离最近的聚类主题为目标主题。
可选的,所述第一预设条件为转人工率小于第一阈值,则所述从所述分类信息中确定出符合第一预设条件的多条第二信息,包括:
从所述分类信息下的标准信息中确定出转人工率小于所述第一阈值的标准问句作为第二信息。
可选的,所述解决效率包括转人工率、平均解决效率、平均解决率和平均历史评分中的至少两项,所述根据第一预设规则确定所述多条第二信息的展示顺序,包括:
确定第一用户在所述分类信息下的用户选择权重;
基于所述用户选择权重,加权计算每一个所述第二信息的平均解决效率和平均解决率;
确定所述第一用户对每一个所述第二信息的平均历史评分,其中,若所述第一用户对所述第二信息没有历史评分,则将历史用户对所述第二信息的的平均历史评分作为所述第一用户对所述第二信息的平均历史评分;
基于历史数据和卷积神经网络模型确定各个属性信息的权重,所述属性信息包括转人工率、所述平均解决效率、所述平均解决率和所述平均历史评分;
基于确定的各个属性信息及其对应的权重,计算确定所述多个第二信息的展示顺序。
可选的,所述确定第一用户在所述分类信息下的用户选择权重,包括:
在所述分类信息下,确定历史用户选择各个所述第二信息的第一占比;
确定所述第一用户在历史上选择各个所述第二信息的第二占比;
将每一个所述第二信息的第一占比与第二占比的乘积相加得到所述第一用户的用户选择权重;
其中,在所述第一用户在所述分类信息下没有历史数据时,则将所述分类信息下的平均用户选择权重作为所述第一用户的用户选择权重。
可选的,所述基于所述用户选择权重,加权计算所述第二信息的平均解决效率和平均解决率,包括:
基于所述用户选择权重,加权计算所述第二信息的平均解决时间和平均解决轮数;
确定解决时间和解决轮数的权重;
基于确定的所述平均解决时间和所述平均解决轮数,以及确定的解决时间和解决轮数的权重,加总计算所述平均解决效率;
基于所述用户选择权重和所述第二信息的历史解决率计算确定所述第二信息的平均解决率。
一种信息处理装置,应用于一问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息,包括:
信息获取模块,用于获取第一用户输入的第一信息;
信息确定模块,用于确定出符合第一预设条件的多条第二信息;
顺序确定模块,用于根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率;
结果输出模块,用于按照所述展示顺序输出所述多条第二信息。
一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为执行所述可执行指令来执行权利要求1-8任一项所述的信息处理方法。
经由上述的技术方案可知,与现有技术相比,本发明实施例公开了一种信息处理方法、装置及电子设备,应用于问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息,包括:获取第一用户输入的第一信息,确定出符合第一预设条件的多条第二信息,根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率,按照所述展示顺序输出所述多条第二信息。所述信息处理方法,首先依据第一预设条件筛选出多条第二信息,然后能够依据第二信息在历史数据中的解决效率确定多条第二信息的展示顺序,从多个角度综合考虑最终展示出的第二信息的准确性,有利于提升用户的使用体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种信息处理方法的流程图;
图2为本发明实施例公开的另一种信息处理方法的流程图;
图3为本发明实施例公开的确定第一信息的分类信息的流程图;
图4为本发明实施例公开的确定第二信息展示顺序的流程图;
图5为本发明实施例公开的确定第一用户选择权重的流程图;
图6为本发明实施例公开的一种信息处理装置的结构示意图;
图7为本发明实施例公开的另一种信息处理装置的结构示意图;
图8为本发明实施例公开的分类确定模块的结构示意图;
图9为本发明实施例公开的顺序确定模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例公开的一种信息处理方法的流程图,图1所示方法可应用于一问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息。参见图1所示,信息处理方法可以包括:
步骤101:获取第一用户输入的第一信息。
本实施例中,所述第一信息可以是用户在问答系统输入的问题信息。其中所述第一用户输入所述第一信息的方式可以有多种实现方式,例如,第一用户可以通过语音输入的方式输入所述第一信息,对应的,系统通过语音采集及识别装置获取所述第一信息;再如,第一用户可以通过输入装置,如键盘,完成所述第一信息的输入,对应的,系统可以直接输入装置获取用户输入的所述第一信息。
步骤102:依据所述第一信息确定出符合第一预设条件的多条第二信息。
其中,所述第一预设条件也可以有不同的实现方式,例如,所述第一预设条件可以包括转人工率满足预设阈值要求或与所述第一信息的特征距离小于预设值。所述转人工率是指用户根据问答系统推荐选择了一个第二信息后,最终还是没能解决用户问题,用户又由智能问答系统转换到人工服务的事件在用户选择所述第二信息的事件中所占的比例。
经过步骤102,已经从大量的信息中初步筛选确定了少量的数据,即所述多条第二信息。
步骤103:根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率。
其中,所述多条第二信息在历史数据库中的解决效率,可以包括多个参考指标,例如可以包括转人工率、平均解决效率、平均解决率和平均历史评分中的任意一种或多种的组合;而其中每一个参考指标的确定也需要依据历史数据经过一定的分析计算才能够确定。在下面的实施例中,将对根据第一预设规则确定所述多条第二信息的展示顺序的具体实现做详细介绍,在此不再过多说明。
步骤104:按照所述展示顺序输出所述多条第二信息。
在根据第一预设规则确定了所述多条第二信息的展示顺序后,可以将所述多条第二信息按照确定的展示顺序输出展示给所述第一用户。
本实施例中,首先采用第一预设条件初步筛选出符合要求的多条第二信息,然后依据所述多条第二信息在历史数据中的解决效率进一步确定所述多条第二信息的展示顺序,从多个角度综合考虑最终展示出的第二信息的准确性,有利于提升用户的使用体验。
在上述公开的实施例的基础上,图2为本发明实施例公开的另一种信息处理方法的流程图,如图2所示,信息处理方法可以包括:
步骤201:获取第一用户输入的第一信息。
步骤202:在预先划分的多个分类中确定所述第一信息所属的分类信息。
其中,所述预先划分的多个分类,可以是依据已有的信息分类技术对海量信息进行分类的分类结果。在依据所述第一预设条件筛选出多条第二信息前,可以先从所述预先划分的多个分类中确定出所述第一信息所属的分类信息,缩小信息筛选范围。
步骤203:从所述分类信息中确定出符合第一预设条件的多条第二信息。
在确定了所述第一信息所属的分类后,在确定的这个分类下的多条信息中,依据所述第一预设条件筛选出所述多条第二信息,保证最终确定的所述多条第二信息的精确度。例如,现在需要找到符合条件的目标群体为女学生,结合本实施例公开的技术内容,先从已知的男性和女性的分类中确定出女性的分类,然后依据“学生”的第一预设条件,从女性分类下的多个群体,如医生、运动员、销售员、学生、教师等群体中确定出“学生”这个群体。后续进一步的,可以对锁定的目标群体中包括的具体人员信息进行排序等后续处理。
步骤204:根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率。
步骤205:按照所述展示顺序输出所述多条第二信息。
本实施例中,在依据所述第一预设条件确定出符合第一预设条件的多条第二信息前,还可以先确定所述第一信息的分类信息,这样,对系统中的海量信息分多个层次进行筛选,保证了最终确定的所述多条第二信息的精准度。
在其他的实施例中,信息处理方法还可以包括:预先对历史数据进行特征提取,并对提取的特征进行聚类,产生多个聚类主题,其中,每一个所述聚类主题代表一个分类。
这样,预先对历史数据进行分类,后续可以直接根据所述分类确定与所述第一信息相似度最高的分类作为目标分类,并在所述目标分类下确定最终需要展示输出的所述多条第二信息。
具体的,产生聚类主题的过程可以包括:对历史用户输入的问题信息进行TF-IDF(一种用于信息检索与数据挖掘的常用加权技术)提取特征值,然后采用kmeans聚类算法,设定阈值产生主题及主题重心。
基于上述内容,所述在预先划分的多个分类中确定所述第一信息所属的分类信息的具体过程可以参见图3,图3为本发明实施例公开的确定第一信息的分类信息的流程图,如图3所示,确定所述第一信息的分类信息可以包括:
步骤301:对所述第一信息进行特征提取,得到第一特征数据。
由于预先划分多个分类是基于特征提取及特征聚类的过程实现的,对应的,确定所述第一信息的分类信息也需要参照上述处理过程,以保证确定结果的参考标准的一致性和确定结果的准确性。本实施例中,确定所述第一信息的分类信息,先对所述第一信息进行特征提取,得到第一特征数据。
步骤302:在预先划分的多个分类中确定与所述第一特征数据距离最近的聚类主题为目标主题。
得到所述第一特征数据后,确定与所述第一特征数据距离最近的聚类主题为目标主题,即确定重心与所述第一特征数据距离最近的聚类主题为目标主题。
上述实施例中,所述第一预设条件可以为转人工率小于第一阈值;转人工率越小,代表该第二信息被用户认可的程度越高。则所述所述从所述分类信息中确定出符合第一预设条件的多条第二信息,可以包括:从所述分类信息下的标准信息中确定出转人工率小于所述第一阈值的标准问句作为第二信息。这里确定出的第二信息,可以包括多个。
在一个实施例中,所述解决效率包括转人工率、平均解决效率、平均解决率和平均历史评分中的至少两项。则所述根据第一预设规则确定所述多条第二信息的展示顺序的具体过程可以参见图4,如图4所述,可以包括:
步骤401:确定第一用户在所述分类信息下的用户选择权重。
其中,用户选择权重,代表用户在某个聚类主题上的不同代表能力;换个角度理解,可以是用户选择标准问,与他人选择标准问一致性的程度,代表用户于该主题,能代表此主题的选择程度。
图5为本发明实施例公开的确定第一用户选择权重的流程图,参见图5 所示,可以包括:
步骤501:在所述分类信息下,确定历史用户选择各个所述第二信息的第一占比。
步骤502:确定所述第一用户在历史上选择各个所述第二信息的第二占比。
步骤503:将每一个所述第二信息的第一占比与第二占比的乘积相加得到所述第一用户的用户选择权重。
在所述第一用户在所述分类信息下没有历史数据时,则将所述分类信息下的平均用户选择权重作为所述第一用户的用户选择权重。
回到图4,步骤401后,进入步骤402。
步骤402:基于所述用户选择权重,加权计算每一个所述第二信息的平均解决效率和平均解决率。
步骤402具体可以包括:基于所述用户选择权重,加权计算所述第二信息的平均解决时间和平均解决轮数;确定解决时间和解决轮数的权重;基于确定的所述平均解决时间和所述平均解决轮数,以及确定的解决时间和解决轮数的权重,加总计算所述平均解决效率;基于所述用户选择权重和所述第二信息的历史解决率计算确定所述第二信息的平均解决率。
步骤403:确定所述第一用户对每一个所述第二信息的平均历史评分。
其中,若所述第一用户对所述第二信息没有历史评分,则将历史用户对所述第二信息的的平均历史评分作为所述第一用户对所述第二信息的平均历史评分。
步骤404:基于历史数据和卷积神经网络模型确定各个属性信息的权重,所述属性信息包括转人工率、所述平均解决效率、所述平均解决率和所述平均历史评分。
步骤405:基于确定的各个属性信息及其对应的权重,计算确定所述多个第二信息的展示顺序。
为了便于理解,举例说明如下:
例如:A主题下,有1、2、3共3个标准问,历史资料中,所有用户选标准问1的占60%,选标准问2的占30%,选标准问3的占10%,则A主题下,选1得0.6分,选2得0.3分,选3得0.1分。现假设大明输入一个句子被判定是A主题,假设过去历史资料上,大明在A主题下共10次,选标准问1次数占30%(3次),选2占50%(5次),选3次数占20%(2次),则大明在A主题的用户选择权重=(选1)0.3*0.6分+(选2)0.5*0.3分+(选 3)0.2*0.1分=0.18+0.15+0.02=0.35分。
假设现确定大明的用户选择权重为0.35分,张三的用户选择权重为0.25 分,现在大明和张三同时来到问题A,假设两人在问题A本次都选了标准问 1;
假设大明在A主题下,本次这个问题选了标准问1,大明从进来开始,到离开,共花了4分钟,则大明本次在A主题下的加权解决时间:0.35*4=1.4;假设张三在A主题下,本次这个问题选了标准问1,张三从进来开始,到离开,共花了10分钟,则张三本次在A主题下的加权解决时间:0.25*10=2.5。
此外,大明从进来开始,到解决问题,用了5轮,则大明加权解决轮数为0.35*5=1.75;本次张三从进来开始,到解决问题,用了10轮,则张三加权解决轮数为0.25*10=0.25。
其中,任何没有历史数据的参数,都可以以历史全体平均值代替。
对于加权解决时间和加权解决轮数,可以以德菲法设定两者权重,加总即为加权问题解决效率。假设确定:0.3加权解决时间+0.7解劝解决轮数=问题解决效率,则大明的加权问题解决效率=0.3*0.35*4+0.7*0.35*5=1.645;张三的加权问题解决效率=0.3*0.25*10+0.7*0.25*10=2.5。
主题下,以用户选择权重,加权计算用户在标准问上解决率,即为加权问题解决率。沿用上述例子,假设A主题下,于标准问1,历史上解决率40%,已知大明用户权重是0.35分,则本次大明A主题下,于标准问1,加权问题解决率=0.35*0.4;A主题下,于标准问1,已知张三用户权重是0.25分,则本次张三A主题下,于标准问1,加权问题解决率=025*0.4。
主题下,用户过去于各标准问平均评分,如果某个标准问缺乏此用户历史评分,则以整体用户平均评分取代,为用户评分。
例如:A主题下,过去历史数据上,大明于标准问1的评分0.1分,大明于标准问2的评分0.2,于标准问3的评分0.3;
如果A主题下,张三历史上没有问题1的评分,我们假设,整体用户平均在A主题问题1的评分是0.2分,那就以0.2分作为张三A主题下问题1 的评分。
本实施例中,第二信息的排序总评分可以是先以转人工调节调节因子过滤后,综合转人工率、加权问题解决效率、加权问题解决率及用户评分,抽取部分数据做专家人工总评分,以CNN模型算出各属性权重,然后输入前述计算确定的各参数,可得整体排名评分,排序评分即得标准问排序。
上述实施例中,所述信息处理方法,首先依据转人工率筛选出多条第二信息,然后能够依据第二信息在历史数据中的解决效率确定多条第二信息的展示顺序,从多个角度综合考虑最终展示出的第二信息的准确性,有利于提升用户的使用体验。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。
图6为本发明实施例公开的一种信息处理装置的结构示意图,图6所示信息处理装置可应用于一问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息。如图6所示,所述信息处理装置60可以包括:
信息获取模块601,用于获取第一用户输入的第一信息。
本实施例中,所述第一信息可以是用户在问答系统输入的问题信息。其中所述第一用户输入所述第一信息的方式可以有多种实现方式,例如,第一用户可以通过语音输入的方式输入所述第一信息,对应的,系统通过语音采集及识别装置获取所述第一信息;再如,第一用户可以通过输入装置,如键盘,完成所述第一信息的输入,对应的,系统可以直接输入装置获取用户输入的所述第一信息。
信息确定模块602,用于确定出符合第一预设条件的多条第二信息。
其中,所述第一预设条件也可以有不同的实现方式,例如,所述第一预设条件可以包括转人工率满足预设阈值要求或与所述第一信息的特征距离小于预设值。所述转人工率是指用户根据问答系统推荐选择了一个第二信息后,最终还是没能解决用户问题,用户又由智能问答系统转换到人工服务的事件在用户选择所述第二信息的事件中所占的比例。
顺序确定模块603,用于根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率。
其中,所述多条第二信息在历史数据库中的解决效率,可以包括多个参考指标,例如可以包括转人工率、平均解决效率、平均解决率和平均历史评分中的任意一种或多种的组合;而其中每一个参考指标的确定也需要依据历史数据经过一定的分析计算才能够确定。在下面的实施例中,将对根据第一预设规则确定所述多条第二信息的展示顺序的具体实现做详细介绍,在此不再过多说明。
结果输出模块604,用于按照所述展示顺序输出所述多条第二信息。
在根据第一预设规则确定了所述多条第二信息的展示顺序后,可以将所述多条第二信息按照确定的展示顺序输出展示给所述第一用户。
本实施例中,首先采用第一预设条件初步筛选出符合要求的多条第二信息,然后依据所述多条第二信息在历史数据中的解决效率进一步确定所述多条第二信息的展示顺序,从多个角度综合考虑最终展示出的第二信息的准确性,有利于提升用户的使用体验。
图7为本发明实施例公开的另一种信息处理装置的结构示意图,参见图7 所示,信息处理装置70可以包括:
信息获取模块601,用于获取第一用户输入的第一信息。
分类确定模块701,用于在预先划分的多个分类中确定所述第一信息所属的分类信息。
其中,所述预先划分的多个分类,可以是依据已有的信息分类技术对海量信息进行分类的分类结果。在依据所述第一预设条件筛选出多条第二信息前,可以先从所述预先划分的多个分类中确定出所述第一信息所属的分类信息,缩小信息筛选范围。
信息确定模块602,用于从所述分类信息中确定出符合第一预设条件的多条第二信息。
在确定了所述第一信息所属的分类后,在确定的这个分类下的多条信息中,依据所述第一预设条件筛选出所述多条第二信息,保证最终确定的所述多条第二信息的精确度。
顺序确定模块603,用于根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率。
结果输出模块604,用于按照所述展示顺序输出所述多条第二信息。
本实施例中,在依据所述第一预设条件确定出符合第一预设条件的多条第二信息前,还可以先确定所述第一信息的分类信息,这样,对系统中的海量信息分多个层次进行筛选,保证了最终确定的所述多条第二信息的精准度。
在其他的实施例中,信息处理装置还可以包括数据分类模块,用于预先对历史数据进行特征提取,并对提取的特征进行聚类,产生多个聚类主题,其中,每一个所述聚类主题代表一个分类。
这样,预先对历史数据进行分类,后续可以直接根据所述分类确定与所述第一信息相似度最高的分类作为目标分类,并在所述目标分类下确定最终需要展示输出的所述多条第二信息。
其中,所述分类确定模块701的具体结构可以参见图8,如图8所示,分类确定模块701可以包括:
特征提取模块801,用于对所述第一信息进行特征提取,得到第一特征数据。
由于预先划分多个分类是基于特征提取及特征聚类的过程实现的,对应的,确定所述第一信息的分类信息也需要参照上述处理过程,以保证确定结果的参考标准的一致性和确定结果的准确性。本实施例中,确定所述第一信息的分类信息,先对所述第一信息进行特征提取,得到第一特征数据。
主题确定模块802,用于在预先划分的多个分类中确定与所述第一特征数据距离最近的聚类主题为目标主题。
得到所述第一特征数据后,确定与所述第一特征数据距离最近的聚类主题为目标主题,即确定重心与所述第一特征数据距离最近的聚类主题为目标主题。
上述实施例中,所述信息确定模块502具体可用于:从所述分类信息下的标准信息中确定出转人工率小于所述第一阈值的标准问句作为第二信息。这里确定出的第二信息,可以包括多个。
在一个实施例中,所述解决效率包括转人工率、平均解决效率、平均解决率和平均历史评分中的至少两项。所述顺序确定模块603的具体结构可以参见图9,如图8所示,顺序确定模块603可以包括:
用户权重确定模块901,用于确定第一用户在所述分类信息下的用户选择权重。
其中,用户选择权重,代表用户在某个聚类主题上的不同代表能力;换个角度理解,可以是用户选择标准问,与他人选择标准问一致性的程度,代表用户于该主题,能代表此主题的选择程度。
所述用户权重确定模块901具体可用于:在所述分类信息下,确定历史用户选择各个所述第二信息的第一占比;确定所述第一用户在历史上选择各个所述第二信息的第二占比;将每一个所述第二信息的第一占比与第二占比的乘积相加得到所述第一用户的用户选择权重。在所述第一用户在所述分类信息下没有历史数据时,则将所述分类信息下的平均用户选择权重作为所述第一用户的用户选择权重。
第一参数确定模块902,用于基于所述用户选择权重,加权计算每一个所述第二信息的平均解决效率和平均解决率。
所述第一参数确定模块902具体可用于:基于所述用户选择权重,加权计算所述第二信息的平均解决时间和平均解决轮数;确定解决时间和解决轮数的权重;基于确定的所述平均解决时间和所述平均解决轮数,以及确定的解决时间和解决轮数的权重,加总计算所述平均解决效率;基于所述用户选择权重和所述第二信息的历史解决率计算确定所述第二信息的平均解决率。
第二参数确定模块903,用于确定所述第一用户对每一个所述第二信息的平均历史评分。
其中,若所述第一用户对所述第二信息没有历史评分,则将历史用户对所述第二信息的的平均历史评分作为所述第一用户对所述第二信息的平均历史评分。
属性权重确定模块904,用于基于历史数据和卷积神经网络模型确定各个属性信息的权重,所述属性信息包括转人工率、所述平均解决效率、所述平均解决率和所述平均历史评分。
顺序确定子模块905,用于基于确定的各个属性信息及其对应的权重,计算确定所述多个第二信息的展示顺序。
上述实施例中,所述信息处理装置,首先依据转人工率筛选出多条第二信息,然后能够依据第二信息在历史数据中的解决效率确定多条第二信息的展示顺序,从多个角度综合考虑最终展示出的第二信息的准确性,有利于提升用户的使用体验。
上述实施例中的所述的任意一种票据识别装置包括处理器和存储器,上述实施例中的信息获取模块、信息确定模块、顺序确定模块、结果输出模块、分类确定模块、特征提取模块、主题确定模块、用户权重确定模块模块、第一参数确定模块、第二参数确定模块、顺序确定子模块等均作为程序模块存储在存储器中,由处理器执行存储在所述存储器中的上述程序模块来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序模块。内核可以设置一个或多个,通过调整内核参数来实现回访数据的处理。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述实施例中所述的信息处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述实施例中所述的信息处理方法。
进一步,本实施例提供了一种电子设备,包括处理器以及存储器。其中存储器用于存储所述处理器的可执行指令,所述处理器配置为经由执行所述可执行指令来执行上述实施例中所述的信息处理方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种信息处理方法,应用于一问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息,包括:
获取第一用户输入的第一信息;
依据所述第一信息确定出符合第一预设条件的多条第二信息;
根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率;
按照所述展示顺序输出所述多条第二信息。
2.根据权利要求1所述的信息处理方法,在所述确定出符合第一预设条件的多条第二信息前,还包括:
在预先划分的多个分类中确定所述第一信息所属的分类信息;
则所述依据所述第一信息确定出符合第一预设条件的多条第二信息,包括:
从所述分类信息中确定出符合第一预设条件的多条第二信息。
3.根据权利要求2所述的信息处理方法,还包括:
预先对历史数据进行特征提取,并对提取的特征进行聚类,产生多个聚类主题,其中,每一个所述聚类主题代表一个分类。
4.根据权利要求3所述的信息处理方法,所述在预先划分的多个分类中确定所述第一信息所属的分类信息,包括:
对所述第一信息进行特征提取,得到第一特征数据;
在预先划分的多个分类中确定与所述第一特征数据距离最近的聚类主题为目标主题。
5.根据权利要求2所述的信息处理方法,所述第一预设条件为转人工率小于第一阈值,则所述从所述分类信息中确定出符合第一预设条件的多条第二信息,包括:
从所述分类信息下的标准信息中确定出转人工率小于所述第一阈值的标准问句作为第二信息。
6.根据权利要求2-5任一项所述的信息处理方法,所述解决效率包括转人工率、平均解决效率、平均解决率和平均历史评分中的至少两项,所述根据第一预设规则确定所述多条第二信息的展示顺序,包括:
确定第一用户在所述分类信息下的用户选择权重;
基于所述用户选择权重,加权计算每一个所述第二信息的平均解决效率和平均解决率;
确定所述第一用户对每一个所述第二信息的平均历史评分,其中,若所述第一用户对所述第二信息没有历史评分,则将历史用户对所述第二信息的的平均历史评分作为所述第一用户对所述第二信息的平均历史评分;
基于历史数据和卷积神经网络模型确定各个属性信息的权重,所述属性信息包括转人工率、所述平均解决效率、所述平均解决率和所述平均历史评分;
基于确定的各个属性信息及其对应的权重,计算确定所述多个第二信息的展示顺序。
7.根据权利要求6所述的信息处理方法,所述确定第一用户在所述分类信息下的用户选择权重,包括:
在所述分类信息下,确定历史用户选择各个所述第二信息的第一占比;
确定所述第一用户在历史上选择各个所述第二信息的第二占比;
将每一个所述第二信息的第一占比与第二占比的乘积相加得到所述第一用户的用户选择权重;
其中,在所述第一用户在所述分类信息下没有历史数据时,则将所述分类信息下的平均用户选择权重作为所述第一用户的用户选择权重。
8.根据权利要求6所述的信息处理方法,所述基于所述用户选择权重,加权计算所述第二信息的平均解决效率和平均解决率,包括:
基于所述用户选择权重,加权计算所述第二信息的平均解决时间和平均解决轮数;
确定解决时间和解决轮数的权重;
基于确定的所述平均解决时间和所述平均解决轮数,以及确定的解决时间和解决轮数的权重,加总计算所述平均解决效率;
基于所述用户选择权重和所述第二信息的历史解决率计算确定所述第二信息的平均解决率。
9.一种信息处理装置,应用于一问答系统,所述问答系统能够接收输入信息,并输出反馈信息以响应所述输入信息,包括:
信息获取模块,用于获取第一用户输入的第一信息;
信息确定模块,用于确定出符合第一预设条件的多条第二信息;
顺序确定模块,用于根据第一预设规则确定所述多条第二信息的展示顺序,所述第一预设规则包括:所述多条第二信息在历史数据中的解决效率;
结果输出模块,用于按照所述展示顺序输出所述多条第二信息。
10.一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为执行所述可执行指令来执行权利要求1-8任一项所述的信息处理方法。
CN201910254404.6A 2019-03-31 2019-03-31 一种信息处理方法及装置 Active CN109947927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910254404.6A CN109947927B (zh) 2019-03-31 2019-03-31 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910254404.6A CN109947927B (zh) 2019-03-31 2019-03-31 一种信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN109947927A true CN109947927A (zh) 2019-06-28
CN109947927B CN109947927B (zh) 2021-09-14

Family

ID=67013246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910254404.6A Active CN109947927B (zh) 2019-03-31 2019-03-31 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN109947927B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4808565B2 (ja) * 2006-08-03 2011-11-02 財団法人電力中央研究所 アンケート評価システム
CN106897334A (zh) * 2016-06-24 2017-06-27 阿里巴巴集团控股有限公司 一种问题推送方法和设备
CN107153965A (zh) * 2017-04-05 2017-09-12 芜湖恒天易开软件科技股份有限公司 一种多终端的智能客服解决方法
CN107688667A (zh) * 2017-09-30 2018-02-13 平安科技(深圳)有限公司 智能机器人客服方法、电子装置及计算机可读存储介质
CN108345644A (zh) * 2018-01-15 2018-07-31 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN108595695A (zh) * 2018-05-08 2018-09-28 和美(深圳)信息技术股份有限公司 数据处理方法、装置、计算机设备和存储介质
CN108628908A (zh) * 2017-03-24 2018-10-09 北京京东尚科信息技术有限公司 分类用户提问-回答界限的方法、装置和电子设备
CN109543020A (zh) * 2018-11-27 2019-03-29 科大讯飞股份有限公司 问询处理方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4808565B2 (ja) * 2006-08-03 2011-11-02 財団法人電力中央研究所 アンケート評価システム
CN106897334A (zh) * 2016-06-24 2017-06-27 阿里巴巴集团控股有限公司 一种问题推送方法和设备
CN108628908A (zh) * 2017-03-24 2018-10-09 北京京东尚科信息技术有限公司 分类用户提问-回答界限的方法、装置和电子设备
CN107153965A (zh) * 2017-04-05 2017-09-12 芜湖恒天易开软件科技股份有限公司 一种多终端的智能客服解决方法
CN107688667A (zh) * 2017-09-30 2018-02-13 平安科技(深圳)有限公司 智能机器人客服方法、电子装置及计算机可读存储介质
CN108345644A (zh) * 2018-01-15 2018-07-31 阿里巴巴集团控股有限公司 一种数据处理的方法及装置
CN108595695A (zh) * 2018-05-08 2018-09-28 和美(深圳)信息技术股份有限公司 数据处理方法、装置、计算机设备和存储介质
CN109543020A (zh) * 2018-11-27 2019-03-29 科大讯飞股份有限公司 问询处理方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GREG KRUDYSZ等: ""Question Review Model for Q&A systems"", 《2015 IEEE SIGNAL PROCESSING AND SIGNAL PROCESSING EDUCATION WORKSHOP (SP/SPE》 *
刘明博: ""基于分布式的智能问答系统的设计与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN109947927B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
US20230043174A1 (en) Method for pushing anchor information, computer device, and storage medium
Schneider et al. Personalization of deep learning
CN105956150B (zh) 一种生成用户发型及妆容搭配建议的方法及装置
CN107292785A (zh) 一种出题方法及系统
WO2020181911A1 (zh) 一种风险识别方法及装置
CN106874355A (zh) 同时融入社交关系和用户相似度的协同过滤方法
CN104599084A (zh) 一种群体计算的质量控制方法及装置
Bamakan et al. A novel feature selection method based on an integrated data envelopment analysis and entropy model
Carballal et al. Distinguishing paintings from photographs by complexity estimates
CN107025228A (zh) 一种问题推荐方法及设备
CN101339619B (zh) 用于模式分类的动态特征选择方法
Bazmara et al. Bank customer credit scoring by using fuzzy expert system
Tavallali et al. A systematic training procedure for viola-jones face detector in heterogeneous computing architecture
Koskela et al. Comparison of techniques for content-based image retrieval
Blasi Scheduling food industry system using fuzzy logic
CN109947927A (zh) 一种信息处理方法及装置
CN109992592B (zh) 基于校园消费卡流水数据的高校贫困生识别方法
Žunić et al. Decission support system for candidates classification in the employment process based on ANFIS method
CN108595669A (zh) 一种无序分类变量处理方法及装置
CN107203916B (zh) 一种用户信用模型建立方法及装置
CN108920624A (zh) 基于进化多目标算法提取系统关键用户的推荐方法
CN107169571A (zh) 一种特征筛选方法及装置
Chede et al. Fuzzy logic analysis based on inventory considering demand and stock quantity on hand
CN112508608B (zh) 一种推广活动配置方法、系统、计算机设备及存储介质
Gumanti et al. Decision Support System To Determine Quality Traditional Spice for Making Turmeric Acid Using Weight Product Method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant