CN111400471A - 问题推荐方法、系统、电子设备和存储介质 - Google Patents
问题推荐方法、系统、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111400471A CN111400471A CN202010177953.0A CN202010177953A CN111400471A CN 111400471 A CN111400471 A CN 111400471A CN 202010177953 A CN202010177953 A CN 202010177953A CN 111400471 A CN111400471 A CN 111400471A
- Authority
- CN
- China
- Prior art keywords
- question
- user
- similarity
- label
- questions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Human Computer Interaction (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,提供一种问题推荐方法、系统、电子设备和存储介质。其中问题推荐方法包括:自历史提问数据中,获得多个业务标签及每个业务标签的问题集;在每个业务标签的问题集中,通过相似度计算获得多个关键问题,并根据关键问题生成每个业务标签的提问标签;基于各业务标签及其提问标签,计算两两用户之间的相似度,根据两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集;以及根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。本发明通过业务标签和提问标签分析用户之间的相似度,并基于相似用户的提问数据对用户进行个性化、针对性的问题推荐。
Description
技术领域
本发明涉及人工智能技术领域,具体地说,涉及一种问题推荐方法、系统、电子设备和存储介质。
背景技术
在线平台每天会接收到大量用户提问,随着业务领域的拓展,人工客服量渐渐无法支撑用户问题体量,因此诞生出智能客服技术。智能客服技术通常会基于用户的历史行为记录,例如购买信息、操作信息,预测该用户的提问意图,在用户提问前推荐相关问题,以引导用户提出符合系统设定的问题,从而能够快速响应用户的提问。
对于在线物流平台,用户的历史行为记录比较单一,主要是车货匹配场景下司机找货的行为数据,例如司机搜索某一种类货物信息、某条路线上的货物信息等。但是货物信息、司机偏好信息并不能全面地反映用户在使用软件的过程中碰到的软件使用情况、运单状态信息等问题,导致现有的智能客服技术应用到在线物流平台时,无法准确地识别用户的提问意图,不仅无法给用户推送其想问的问题,还会给用户造成困扰,影响用户的使用体验。
需要说明的是,在上述背景技术部分申请的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种问题推荐方法、系统、电子设备和存储介质,可以通过基于所有用户的历史提问数据提取的业务标签和提问标签,分析用户之间的相似度,并基于相似用户的提问数据对用户进行个性化、针对性的问题推荐。
本发明的一个方面提供一种问题推荐方法,包括步骤:自历史提问数据中,获得多个业务标签及每个业务标签的问题集;在每个所述业务标签的问题集中,通过相似度计算获得多个关键问题,并根据所述关键问题生成每个所述业务标签的提问标签;基于各所述业务标签及其提问标签,计算两两用户之间的相似度,根据所述两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集;以及根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。
在一些实施例中,所述通过相似度计算获得多个关键问题的步骤包括:在一所述业务标签的问题集中,计算两两问题之间的相似度,生成所述问题集的相似度矩阵;根据所述相似度矩阵获得与每个问题的相似度最高的多个问题,形成每个问题的关联问题集;以及计算各所述关联问题集的相似度之和,筛选相似度之和最大的一组关联问题集,作为所述业务标签的多个关键问题。
在一些实施例中,所述计算两两问题之间的相似度的步骤包括:对所述问题集中的每个问题进行分词,获得每个问题的分词词组;计算每个问题的分词词组的词向量,并根据每个问题的分词词组的词向量获得每个问题的句向量;以及根据每个问题的句向量计算两两问题之间的相似度。
在一些实施例中,所述根据所述关键问题生成每个所述业务标签的提问标签的步骤包括:在所述业务标签的多个关键问题中,对每个所述关键问题进行分词,获得每个所述关键问题的分词词组;计算每个分词词组在所述业务标签的所有分词词组中的概率;以及筛选概率最高的多个分词词组,作为所述业务标签的多个提问标签。
在一些实施例中,所述计算两两用户之间的相似度的步骤包括:自所述历史提问数据中获得两用户之间的相同问题,所述相同问题是相同业务标签下具有至少一相同提问标签的问题;以及根据该两用户的相同问题的提问次数和所述相同问题的总提问次数,获得该两用户之间的相似度。
在一些实施例中,当该两用户之间具有一相同问题时,以该两用户对所述相同问题的提问次数在所述相同问题的总提问次数中的概率为该两用户之间的相似度;以及当该两用户之间具有多个相同问题时,以该两用户对每个所述相同问题的提问次数在每个所述相同问题的总提问次数中的概率之和为该两用户之间的相似度。
在一些实施例中,所述根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题的步骤包括:判断所述用户的实时提问数据是否有对应的业务标签;若是则自所述用户的推荐问题集中,选择该业务标签下所述用户未提问过的问题进行推荐;若否则向所述用户推荐其推荐问题集的各业务标签,并根据所述用户选中的业务标签向所述用户推荐该业务标签下未提问过的问题。
本发明的另一个方面提供一种问题推荐系统,包括:第一标签生成模块,用于自历史提问数据中,获得多个业务标签及每个业务标签的问题集;第二标签生成模块,用于在每个所述业务标签的问题集中,通过相似度计算获得多个关键问题,并根据所述关键问题生成每个所述业务标签的提问标签;推荐问题集生成模块,用于基于各所述业务标签及其提问标签,计算两两用户之间的相似度,根据所述两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集;以及问题推荐模块,用于根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。
本发明的再一个方面提供一种电子设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意实施例所述的问题推荐方法的步骤。
本发明的又一个方面提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述任意实施例所述的问题推荐方法的步骤。
本发明与现有技术相比的有益效果至少包括:
本发明基于所有用户的历史提问数据提取业务标签和提问标签,实现对海量历史提问数据进行标识;
通过业务标签和提问标签分析用户之间的相似度,获得提问意图相似的关联用户;并根据关联用户的历史提问数据向用户推荐问题,实现对用户进行个性化、针对性的符合其提问意图的问题推荐。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明实施例中问题推荐方法的步骤示意图;
图2示出本发明实施例中获得关键问题的步骤示意图;
图3示出本发明实施例中生成提问标签的步骤示意图;
图4示出本发明实施例中计算两用户之间相似度的步骤示意图;
图5示出本发明实施例中问题推荐系统的模块示意图;
图6示出本发明实施例中电子设备的结构示意图;以及
图7示出本发明实施例中计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
图1示出实施例中问题推荐方法的主要步骤,参照图1所示,本实施例中问题推荐方法主要包括:在步骤S10中,自历史提问数据中,获得多个业务标签及每个业务标签的问题集;在步骤S20中,在每个业务标签的问题集中,通过相似度计算获得多个关键问题,并根据关键问题生成每个业务标签的提问标签;在步骤S30中,基于各业务标签及其提问标签,计算两两用户之间的相似度,根据两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集;以及在步骤S40中,根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。
上述实施例的问题推荐方法基于所有用户的历史提问数据提取业务标签和提问标签,实现对海量历史提问数据进行标识,为后续的计算用户相似度提供数据依据;通过业务标签和提问标签分析用户之间的相似度,获得提问意图相似的关联用户;并根据关联用户的历史提问数据向用户推荐问题,实现对用户进行个性化、针对性的符合其提问意图的问题推荐。
步骤S10中,历史提问数据是平台所有用户的历史提问数据,可以选择合适的时间窗口内的历史提问数据作为数据源。业务标签是根据平台业务场景构造的标签数据,可以解决人力有限的问题。例如,业务标签包括软件使用业务、订单业务、ETC业务等等。每个历史提问数据都是在对应的业务场景下提出的,因此可以方便地根据历史提问数据获得业务标签和问题集。
步骤S20使用聚类的思路,从每个业务标签的包括成千上万个问题的问题集中寻找相似度和最大的几个问题,作为每个业务标签的最具代表性的关键问题。具体来说,参照图2所示,通过相似度计算获得关键问题的过程包括:在步骤S2202中,在一业务标签的问题集中,计算两两问题之间的相似度,生成问题集的相似度矩阵;在步骤S2204中,根据相似度矩阵获得与每个问题的相似度最高的多个问题,形成每个问题的关联问题集;以及在步骤S2206中,计算各关联问题集的相似度之和,筛选相似度之和最大的一组关联问题集,作为业务标签的多个关键问题。
在一个实施例中,以业务标签A为例,该业务标签A的问题集中包括100个问题。通过步骤S2202计算这100个问题中两两问题的相似度,生成一个100行、100列的相似度矩阵。该相似度矩阵的每一行分别是该业务标签A的问题集中,每一问题与包括其自身的100个问题之间的相似度数值。接着通过步骤S2204获得与每个问题的相似度最高的10个问题,也即选出每行中最大的10个相似度数值对应的问题,形成每个问题的关联问题集。之后通过步骤S2206计算每个关联问题集的相似度之和,即将每个关联问题集中10个问题对应的相似度数值相加,并从各个关联问题集的相似度之和中筛选出相似度之和最大的一组关联问题集,以该筛选出的关联问题集中的10个问题作为业务标签A的10个关键问题。同理,可以获得每个业务标签的最具代表性的多个关键问题。
步骤S2202可以利用Word2vec算法或Sentence2vec算法计算两两问题的相似度。在一个实施例中,以Word2vec算法为例,计算两两问题之间的相似度的过程具体包括:对问题集中的每个问题进行分词,获得每个问题的分词词组;计算每个问题的分词词组的词向量,并根据每个问题的分词词组的词向量获得每个问题的句向量;以及根据每个问题的句向量计算两两问题之间的相似度。其中,Word2vec算法是成熟的算法模型,因此不再展开说明。
进一步的,步骤S20继续对每个业务标签的关键问题进行分词和频率统计,获得每个业务标签中提问概率最高的关键词组作为提问标签。具体来说,参照图3所示,根据关键问题生成每个业务标签的提问标签的过程包括:在步骤S2402中,在业务标签的多个关键问题中,对每个关键问题进行分词,获得每个关键问题的分词词组;在步骤S2404中,计算每个分词词组在业务标签的所有分词词组中的概率;以及在步骤S2406中,筛选概率最高的多个分词词组,作为业务标签的多个提问标签。通过上述方法,在每个业务标签的关键问题的分词词组集合中,筛选出提问频率最高的分词词组,形成每个业务标签的提问标签。
通过步骤S10和步骤S20,形成了作为一级标签的业务标签和作为二级标签的提问标签,实现对海量历史提问数据进行标识,这些标签是用户提问概率最高,最具有代表性的标识数据,可以为后续的计算用户相似度提供数据基础。
步骤S30基于业务标签和提问标签计算用户相似度,实现基于协同过滤为用户推荐问题。具体来说,参照图4所示,计算两两用户之间的相似度的过程包括:在步骤S302中,自历史提问数据中获得两用户之间的相同问题,其中相同问题是相同业务标签下具有至少一相同提问标签的问题;以及在步骤S304中,根据该两用户对相同问题的提问次数和相同问题的总提问次数,获得该两用户之间的相似度。同一个业务标签下,当两个以上问题具有相同的提问标签,则可认为该些问题相同。例如,在业务标签为“软件使用业务”的业务场景下,用户U1的问题Q1“登录没有成功怎么办”和问题Q2“登录不成功怎么办”,以及用户U2的问题Q3“登录失败怎么办”均包含提问标签“登录”,可认为问题Q1、问题Q2和问题Q3是相同问题;为方便阐述,下文将问题Q1、问题Q2和问题Q3称为第一组相同问题。当然,在其他实施例中,提问标签可以是更细粒度的划分,不以此处列举为限。例如,可以将“登录成功”和“登录失败”作为两个提问标签。以及,在其他实施例中,符合相同问题的标准可以更高,例如将相同业务标签下具有至少两相同提问标签的问题视为相同问题。获得两用户的相同问题的提问次数后,根据该相同问题的提问次数与所有历史提问数据中该相同问题的总提问次数,可以获得该两用户之间的相似度。
具体来说,继续参照图4,计算两用户之间的相似度的过程还包括:步骤S3402,当该两用户之间具有一相同问题时,以该两用户对该相同问题的提问次数在该相同问题的总提问次数中的概率为该两用户之间的相似度。例如,用户U1和用户U2的历史提问数据中,相同问题就是上述的第一组相同问题,用户U1和用户U2对该第一组相同问题的提问次数是三次。则以用户U1和用户U2对该第一组相同问题的提问次数与该第一组相同问题在所有历史提问数据中(所有历史提问数据中符合该第一组相同问题的问题不限于问题Q1、问题Q2和问题Q3,只要问题中包含业务标签“软件使用业务”和提问标签“登录”即可)的总提问次数的概率,作为用户U1与用户U2之间的相似度。以及步骤S3044,当该两用户之间具有多个相同问题时,以该两用户对每个相同问题的提问次数在每个相同问题的总提问次数中的概率之和为该两用户之间的相似度。例如,用户U1和用户U2的历史提问数据中,除上述的第一组相同问题外,还包括“软件使用业务”的业务标签下“升级”提问标签的第二组相同问题和“ETC”业务标签下“扣费”提问标签的第三组相同问题,则分别计算用户U1和用户U2对第一组相同问题的提问次数与该第一组相同问题在所有历史提问数据中的总提问次数的第一概率、用户U1和用户U2对第二组相同问题的提问次数与该第二组相同问题在所有历史提问数据中的总提问次数的第二概率、以及用户U1和用户U2对第三组相同问题的提问次数与该第三组相同问题在所有历史提问数据中的总提问次数的第三概率,以第一概率、第二概率和第三概率的和作为用户U1与和用户U2之间的相似度。在概率计算时,可以乘上一定的次数,使计算结果的准确度和可信度更高。
计算用户之间的相似度后,可以获得每个用户的相似用户,即取与一用户的相似度值最高的几个用户作为该用户的关联用户。这些关联用户的历史提问数据可以用来拟合该用户的提问场景,即将该用户的关联用户的历史提问数据作为该用户的推荐问题集,其中可以去掉该用户已经提问过的问题,实现基于该用户未提问的问题进行符合其提问意图的个性化和针对性推荐。具体来说,步骤S40根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题的过程包括:判断用户的实时提问数据是否有对应的业务标签;例如以用户目前所在的提问入口获得对应的业务标签,每个提问入口会绑定业务标签。若用户已进入某一提问入口,则可以获得对应的业务标签,并自该用户的推荐问题集中选择该业务标签下用户未提问过的问题进行推荐。若用户尚未进入提问入口,则向该用户推荐其推荐问题集的各业务标签供用户选择,并根据用户选中的业务标签向噶用户推荐该业务标签下其未提问过的问题。从而实现即时在信息过少场景下,也能根据业务标签和提问标签,基于协同过滤向用户智能推荐符合其提问意图的问题。
本发明的问题推荐方法基于历史提问数据提取业务标签和提问标签,实现对海量历史提问数据的准确标识,为用户相似度计算提供数据基础;通过业务标签和提问标签分析用户之间的相似度,获得提问意图相似的关联用户;并根据关联用户的历史提问数据向用户推荐问题,实现对用户进行个性化、针对性的符合其提问意图的问题的智能推荐。采用本发明的问题推荐方法可以准确识别用户的提问意图,进行符合用户提问意图的问题的智能推荐,解决因用户问题逐渐增多导致客服应答不及时的问题,提高用户的使用体验。
本发明实施例还提供一种问题推荐系统,参照图5所示,该问题推荐系统5包括:第一标签生成模块510,用于自历史提问数据中,获得多个业务标签及每个业务标签的问题集。在一些实施例中,第一标签生成模块510可用于实现上述问题推荐方法中的步骤S10。第二标签生成模块520,用于在每个业务标签的问题集中,通过相似度计算获得多个关键问题,并根据关键问题生成每个业务标签的提问标签。在一些实施例中,第二标签生成模块520可用于实现上述问题推荐方法中的步骤S20。推荐问题集生成模块530,用于基于各业务标签及其提问标签,计算两两用户之间的相似度,根据两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集。在一些实施例中,推荐问题集生成模块530可用于实现上述问题推荐方法中的步骤S30。以及问题推荐模块540,用于根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。在一些实施例中,问题推荐模块540可用于实现上述问题推荐方法中的步骤S40。
本发明的问题推荐系统5通过第一标签生成模块510和第二标签生成模块520提取业务标签和提问标签,实现对海量历史提问数据的准确标识,为用户相似度计算提供数据基础;通过推荐问题集生成模块530和问题推荐模块540分析用户之间的相似度,获得提问意图相似的关联用户,并根据关联用户的历史提问数据向用户推荐问题,实现对用户进行个性化、针对性的符合其提问意图的问题的智能推荐。采用本发明的问题推荐系统5可以准确识别用户的提问意图,进行符合用户提问意图的问题的智能推荐,解决因用户问题逐渐增多导致客服应答不及时的问题,提高用户的使用体验。
本发明实施例还提供一种电子设备,包括处理器和存储器,存储器中存储有可执行指令,处理器被配置为经由执行可执行指令来执行上述实施例中的问题推荐方法的步骤。
如上所述,本发明的电子设备能够基于历史提问数据提取业务标签和提问标签,实现对海量历史提问数据的准确标识,为用户相似度计算提供数据基础;通过业务标签和提问标签分析用户之间的相似度,获得提问意图相似的关联用户;并根据关联用户的历史提问数据向用户推荐问题,实现对用户进行个性化、针对性的符合其提问意图的问题的智能推荐。采用本发明的电子设备可以准确识别用户的提问意图,进行符合用户提问意图的问题的智能推荐,解决因用户问题逐渐增多导致客服应答不及时的问题,提高用户的使用体验。
图6是本发明实施例中电子设备的结构示意图,应当理解的是,图6仅仅是示意性地示出各个模块,这些模块可以是虚拟的软件模块或实际的硬件模块,这些模块的合并、拆分及其余模块的增加都在本发明的保护范围之内。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
下面参照图6来描述本发明的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行上述实施例中描述的问题推荐方法的步骤。例如,处理单元610可以执行如图1至图4所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述实施例描述的问题推荐方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行上述实施例描述的问题推荐方法的步骤。
如上所述,本发明的计算机可读存储介质能够基于历史提问数据提取业务标签和提问标签,实现对海量历史提问数据的准确标识,为用户相似度计算提供数据基础;通过业务标签和提问标签分析用户之间的相似度,获得提问意图相似的关联用户;并根据关联用户的历史提问数据向用户推荐问题,实现对用户进行个性化、针对性的符合其提问意图的问题的智能推荐。采用本发明的计算机可读存储介质可以准确识别用户的提问意图,进行符合用户提问意图的问题的智能推荐,解决因用户问题逐渐增多导致客服应答不及时的问题,提高用户的使用体验。
图7是本发明的计算机可读存储介质的结构示意图。参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种问题推荐方法,其特征在于,包括步骤:
自历史提问数据中,获得多个业务标签及每个业务标签的问题集;
在每个所述业务标签的问题集中,通过相似度计算获得多个关键问题,并根据所述关键问题生成每个所述业务标签的提问标签;
基于各所述业务标签及其提问标签,计算两两用户之间的相似度,根据所述两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集;以及
根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。
2.如权利要求1所述的问题推荐方法,其特征在于,所述通过相似度计算获得多个关键问题的步骤包括:
在一所述业务标签的问题集中,计算两两问题之间的相似度,生成所述问题集的相似度矩阵;
根据所述相似度矩阵获得与每个问题的相似度最高的多个问题,形成每个问题的关联问题集;以及
计算各所述关联问题集的相似度之和,筛选相似度之和最大的一组关联问题集,作为所述业务标签的多个关键问题。
3.如权利要求2所述的问题推荐方法,其特征在于,所述计算两两问题之间的相似度的步骤包括:
对所述问题集中的每个问题进行分词,获得每个问题的分词词组;
计算每个问题的分词词组的词向量,并根据每个问题的分词词组的词向量获得每个问题的句向量;以及
根据每个问题的句向量计算两两问题之间的相似度。
4.如权利要求2所述的问题推荐方法,其特征在于,所述根据所述关键问题生成每个所述业务标签的提问标签的步骤包括:
在所述业务标签的多个关键问题中,对每个所述关键问题进行分词,获得每个所述关键问题的分词词组;
计算每个分词词组在所述业务标签的所有分词词组中的概率;以及
筛选概率最高的多个分词词组,作为所述业务标签的多个提问标签。
5.如权利要求1所述的问题推荐方法,其特征在于,所述计算两两用户之间的相似度的步骤包括:
自所述历史提问数据中获得两用户之间的相同问题,所述相同问题是相同业务标签下具有至少一相同提问标签的问题;以及
根据该两用户的相同问题的提问次数和所述相同问题的总提问次数,获得该两用户之间的相似度。
6.如权利要求5所述的问题推荐方法,其特征在于,当该两用户之间具有一相同问题时,以该两用户对所述相同问题的提问次数在所述相同问题的总提问次数中的概率为该两用户之间的相似度;以及
当该两用户之间具有多个相同问题时,以该两用户对每个所述相同问题的提问次数在每个所述相同问题的总提问次数中的概率之和为该两用户之间的相似度。
7.如权利要求1所述的问题推荐方法,其特征在于,所述根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题的步骤包括:
判断所述用户的实时提问数据是否有对应的业务标签;
若是则自所述用户的推荐问题集中,选择该业务标签下所述用户未提问过的问题进行推荐;以及
若否则向所述用户推荐其推荐问题集的各业务标签,并根据所述用户选中的业务标签向所述用户推荐该业务标签下未提问过的问题。
8.一种问题推荐系统,其特征在于,包括:
第一标签生成模块,用于自历史提问数据中,获得多个业务标签及每个业务标签的问题集;
第二标签生成模块,用于在每个所述业务标签的问题集中,通过相似度计算获得多个关键问题,并根据所述关键问题生成每个所述业务标签的提问标签;
推荐问题集生成模块,用于基于各所述业务标签及其提问标签,计算两两用户之间的相似度,根据所述两两用户之间的相似度获得每个用户的关联用户,并根据每个用户的关联用户的历史提问数据生成每个用户的推荐问题集;以及
问题推荐模块,用于根据一用户的实时提问数据,向该用户推荐其推荐问题集中的问题。
9.一种电子设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的问题推荐方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7任一项所述的问题推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010177953.0A CN111400471B (zh) | 2020-03-13 | 2020-03-13 | 问题推荐方法、系统、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010177953.0A CN111400471B (zh) | 2020-03-13 | 2020-03-13 | 问题推荐方法、系统、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111400471A true CN111400471A (zh) | 2020-07-10 |
CN111400471B CN111400471B (zh) | 2022-09-27 |
Family
ID=71428831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010177953.0A Active CN111400471B (zh) | 2020-03-13 | 2020-03-13 | 问题推荐方法、系统、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400471B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148860A (zh) * | 2020-09-29 | 2020-12-29 | 中国银行股份有限公司 | 文本机器人的问题推荐方法及装置 |
CN112434140A (zh) * | 2020-11-10 | 2021-03-02 | 杭州博联智能科技股份有限公司 | 一种答复信息处理方法及系统 |
CN112667790A (zh) * | 2020-12-18 | 2021-04-16 | 平安科技(深圳)有限公司 | 智能问答方法、装置、设备及存储介质 |
CN113064986A (zh) * | 2021-04-30 | 2021-07-02 | 中国平安人寿保险股份有限公司 | 模型的生成方法、系统、计算机设备和存储介质 |
CN115659058A (zh) * | 2022-12-30 | 2023-01-31 | 杭州远传新业科技股份有限公司 | 问题生成的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793476A (zh) * | 2014-01-08 | 2014-05-14 | 西安电子科技大学 | 基于网络社区的协同过滤推荐方法 |
CN108595695A (zh) * | 2018-05-08 | 2018-09-28 | 和美(深圳)信息技术股份有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
CN109299399A (zh) * | 2018-12-17 | 2019-02-01 | 广东小天才科技有限公司 | 一种学习内容的推荐方法及终端设备 |
-
2020
- 2020-03-13 CN CN202010177953.0A patent/CN111400471B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793476A (zh) * | 2014-01-08 | 2014-05-14 | 西安电子科技大学 | 基于网络社区的协同过滤推荐方法 |
CN108595695A (zh) * | 2018-05-08 | 2018-09-28 | 和美(深圳)信息技术股份有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
CN109299399A (zh) * | 2018-12-17 | 2019-02-01 | 广东小天才科技有限公司 | 一种学习内容的推荐方法及终端设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148860A (zh) * | 2020-09-29 | 2020-12-29 | 中国银行股份有限公司 | 文本机器人的问题推荐方法及装置 |
CN112148860B (zh) * | 2020-09-29 | 2024-05-24 | 中国银行股份有限公司 | 文本机器人的问题推荐方法及装置 |
CN112434140A (zh) * | 2020-11-10 | 2021-03-02 | 杭州博联智能科技股份有限公司 | 一种答复信息处理方法及系统 |
CN112667790A (zh) * | 2020-12-18 | 2021-04-16 | 平安科技(深圳)有限公司 | 智能问答方法、装置、设备及存储介质 |
WO2022126965A1 (zh) * | 2020-12-18 | 2022-06-23 | 平安科技(深圳)有限公司 | 智能问答方法、装置、设备及存储介质 |
CN112667790B (zh) * | 2020-12-18 | 2024-05-10 | 平安科技(深圳)有限公司 | 智能问答方法、装置、设备及存储介质 |
CN113064986A (zh) * | 2021-04-30 | 2021-07-02 | 中国平安人寿保险股份有限公司 | 模型的生成方法、系统、计算机设备和存储介质 |
CN113064986B (zh) * | 2021-04-30 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 模型的生成方法、系统、计算机设备和存储介质 |
CN115659058A (zh) * | 2022-12-30 | 2023-01-31 | 杭州远传新业科技股份有限公司 | 问题生成的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111400471B (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111400471B (zh) | 问题推荐方法、系统、电子设备和存储介质 | |
CN111859960B (zh) | 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质 | |
CN109684543B (zh) | 用户行为预测和信息投放方法、装置、服务器和存储介质 | |
EP3696746A1 (en) | Method and apparatus for determining description information, electronic device and computer storage medium | |
US11222286B2 (en) | Target document template generation | |
CN111143226B (zh) | 自动化测试方法及装置、计算机可读存储介质、电子设备 | |
CN112069801A (zh) | 基于依存句法的句子主干抽取方法、设备和可读存储介质 | |
CN110555451A (zh) | 信息识别方法和装置 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN111190946A (zh) | 报告生成方法、装置、计算机设备和存储介质 | |
CN113781246B (zh) | 基于预设标签的策略生成方法、装置及存储介质 | |
CN113220854B (zh) | 机器阅读理解的智能对话方法及装置 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN114418398A (zh) | 场景任务开发方法、装置、设备及存储介质 | |
CN114357195A (zh) | 基于知识图谱的问答对生成方法、装置、设备及介质 | |
CN108830302B (zh) | 一种图像分类方法、训练方法、分类预测方法及相关装置 | |
CN110782128A (zh) | 一种用户职业标签生成方法、装置和电子设备 | |
CN111190967A (zh) | 用户多维度数据处理方法、装置及电子设备 | |
US11599801B2 (en) | Method for solving problem, computing system and program product | |
CN115147020A (zh) | 装修数据处理方法、装置、设备及存储介质 | |
CN114897183A (zh) | 问题数据处理方法、深度学习模型的训练方法和装置 | |
CN111309990B (zh) | 一种语句应答方法及装置 | |
CN111753548A (zh) | 信息获取方法及装置、计算机存储介质、电子设备 | |
CN111949776A (zh) | 一种用户标签评估的方法、装置和电子设备 | |
CN110969208B (zh) | 多个模型结果的融合方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |