CN105095357A - 一种用于咨询数据处理的方法和装置 - Google Patents

一种用于咨询数据处理的方法和装置 Download PDF

Info

Publication number
CN105095357A
CN105095357A CN201510354129.7A CN201510354129A CN105095357A CN 105095357 A CN105095357 A CN 105095357A CN 201510354129 A CN201510354129 A CN 201510354129A CN 105095357 A CN105095357 A CN 105095357A
Authority
CN
China
Prior art keywords
data
user
search
representation
associated data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510354129.7A
Other languages
English (en)
Inventor
闫婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510354129.7A priority Critical patent/CN105095357A/zh
Publication of CN105095357A publication Critical patent/CN105095357A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于咨询数据处理的方法和装置。该方法包括:根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据;将预测得到的咨询意图关联数据向所述第一用户优先展示。根据本发明的方法和装置,能够提高咨询数据处理的效率,缩短用户搜索途径,从而节省用户和提供者双方的时间成本和经济成本。

Description

一种用于咨询数据处理的方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种用于咨询数据处理的方法和装置。
背景技术
在现有的搜索引擎的检索或搜索结果中,用户需要通过标题、描述或统一资源定位符(UniformResourceLocator,URL)等找到感兴趣的网站,进入该网站后,点击在线咨询的按钮,通过沟通提问才能了解该网站能否提供自己需求的服务。例如,对于一位牙齿不适的用户,向寻找位置、价位、疗法都合适的口腔医院。这个过程中,该用户需要经过搜索、点击搜索结果、进入搜索结果对应的网页咨询等复杂的过程,才能最终决策哪家口腔医院合适。目前这样的检索咨询过程,用户和为用户提供服务和/或产品的提供者或供应商(例如,商家)等都需要花费额外的时间成本。也就是说,现有的解决方案,用户和提供者双方都需要花费较多的时间了解对方的要求或需求,咨询过程比较复杂,对咨询数据的处理效率较低。
发明内容
为解决上述技术问题,本发明提供了一种用于咨询数据处理的方法和装置。
根据本发明实施方式的第一方面,提供了一种用于咨询数据处理的方法,该方法可包括:根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据;将预测得到的咨询意图关联数据向所述第一用户优先展示。
在本发明进一步的实施方式中,所述预先形成的需求预估数据是根据用户与提供者的在线沟通记录数据、用户的搜索行为关联数据和用户的画像数据通过机器学习形成。
在本发明进一步的实施方式中,所述在线沟通记录数据包括下述的一个或多个数据:咨询时间、咨询者、咨询问题、针对所述咨询问题的回答;所述搜索行为关联数据包括下述的一个或多个数据:搜索用户的标识、搜索时间、搜索词、搜索后的点击结果数据、在所述点击结果数据的停留时间;以及所述画像数据包括下述的一个或多个数据:性别、年龄、家庭状况、消费习惯、兴趣点。
在本发明进一步的实施方式中,所述预先形成的需求预估数据包括:与所述搜索行为关联数据和/或所述画像数据的关联程度大于预设阈值的所述在线沟通记录数据中的一个或多个数据,其中,所述关联程度通过概率表征。
在本发明进一步的实施方式中,所述根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据的步骤包括:根据第一用户的搜索意图关联数据和所述第一用户的画像数据在所述需求预估数据中查找与所述搜索意图关联数据和/或所述画像数据的关联程度大于所述预设阈值的所述在线沟通记录数据中的一个或多个数据作为所述第一用户本次搜索的咨询意图关联数据。
根据本发明实施方式的第二方面,提供了一种用于咨询数据处理的装置,该装置可包括:预测模块,用于根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据;展示模块,用于将预测得到的咨询意图关联数据向所述第一用户优先展示。
在本发明进一步的实施方式中,所述预先形成的需求预估数据是根据用户与提供者的在线沟通记录数据、用户的搜索行为关联数据和用户的画像数据通过机器学习形成。
在本发明进一步的实施方式中,所述在线沟通记录数据包括下述的一个或多个数据:咨询时间、咨询者、咨询问题、针对所述咨询问题的回答;所述搜索行为关联数据包括下述的一个或多个数据:搜索用户的标识、搜索时间、搜索词、搜索后的点击结果数据、在所述点击结果数据的停留时间;以及所述画像数据包括下述的一个或多个数据:性别、年龄、家庭状况、消费习惯、兴趣点。
在本发明进一步的实施方式中,所述预先形成的需求预估数据包括:与所述搜索行为关联数据和/或所述画像数据的关联程度大于预设阈值的所述在线沟通记录数据中的一个或多个数据,其中,所述关联程度通过概率表征。
在本发明进一步的实施方式中,所述预测模块,还用于根据第一用户的搜索意图关联数据和所述第一用户的画像数据在所述需求预估数据中查找与所述搜索意图关联数据和/或所述画像数据的关联程度大于所述预设阈值的所述在线沟通记录数据中的一个或多个数据作为所述第一用户本次搜索的咨询意图关联数据。
本发明实施方式提供的用于咨询数据处理的方法和装置,利用多个用户与提供者(例如,商家)的在线沟通记录数据、多个用户的搜索行为关联数据和多个用户的画像数据等大量历史数据通过机器学习算法获得包含与搜索行为关联数据和画像数据具有强关联的咨询沟通记录数据作为需求预估数据,通过上述大数据形成的需求预估数据,结合用户的搜索意图数据和用户的画像数据能够较好地预测出用户本次搜索的咨询意图关联数据,并且将预测的咨询意图关联数据优先向用户展示,大大提高了咨询数据处理的效率,节省了用户和提供者双方的时间成本和经济成本。
附图说明
图1图示了根据本发明一种实施方式的用于咨询数据处理的方法的流程示意图。
图2图示了根据本发明一种实施方式的用于咨询数据处理的方法的流程示意图。
图3图示了根据本发明一种实施方式的用于咨询数据处理的方法的流程示意图。
图4图示了根据本发明一种实施方式的用于咨询数据处理的装置的结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
参见图1,图示了根据本发明一种实施方式的用于咨询数据处理的方法的流程示意图,该方法可包括下述步骤:
S101,根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据;
S102,将预测得到的咨询意图关联数据向所述第一用户优先展示。
在本发明的实施方式中,用于咨询数据处理的方法可包括执行步骤S101,根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据。其中,第一用户可以是已经进行过相关咨询的用户,也可以是首次咨询的用户。该预先形成的需求预估数据是根据多个用户(例如,大于或等于2个)与提供者(例如,提供产品或服务的商家等机构)的在线沟通记录数据、多个用户的搜索行为关联数据和多个用户的画像数据等大量的历史数据通过机器学习形成。
本发明实施方式中的用户与提供者的在线沟通记录数据可包括大量用户与大量提供者(例如,商家)就某一个或某一些问题咨询的聊天记录数据,例如,可包括,但不限于下述的一个或多个(例如,大于或等于2个)数据:咨询时间、咨询者、咨询问题、针对所述咨询问题的回答。其中,上述的大量用户可包括本次搜索的第一用户。也就是说,需求预估数据中的在线沟通记录数据可包括本次搜索的第一用户与其他的多个商家的沟通记录。用户的搜索行为关联数据可包括与用户的搜索行为具有关联的数据,这些关联的数据能够从一个或多个层面上表征用户的搜索行为。这些搜索行为关联数据可从搜索引擎存储的大量搜索数据获得,还可以从搜索引擎之外的数据源获得,例如,百科性质的网页数据等。本发明实施方式的搜索行为关联数据包括,但不限于下述的一个或多个数据:搜索用户的标识、搜索时间、搜索词、搜索后的点击结果数据。用户的画像数据可包括表征用户的一个或多个层面信息的数据。本发明实施方式中的画像数据可包括,但不限于下述的一个或多个数据:性别、年龄、家庭状况(例如,家庭构成等)、消费习惯(例如,消费水平处于低等水平、中等水平或高等水平等)、兴趣点(例如,对体育、娱乐、服饰搭配等信息有兴趣)等。这些画像数据也可通过搜索引擎存储的数据获得,例如,可通过在网络上的一些注册数据(例如,可包括性别、年龄等数据)和搜索记录数据(例如,对搜索词的记录数据),还可以通过搜索引擎之外的其他数据源获得,例如,百科性质的网页数据等。下面举例说明通过搜索记录数据获取用户画像数据的处理过程,在用户以诸如婴儿用品、奶粉、喂养等为搜索词进行搜索的数据较多且频率较高时,可以推测该用户的家庭构成中包括孩子。在形成需求预估数据的过程中,需要对上述的在线沟通记录数据、搜索行为关联数据和画像数据进行一些预处理,例如,过滤掉捕捉不完全的信息,对同类信息进行合并(例如,对具有相同搜索用户的标识id的数据进行合并)。
对上述获得的在线沟通记录数据、搜索行为关联数据和画像数据等大量数据进行预处理后,通过机器学习进行统计归纳,得到具有强关联(例如,关联程度大于预定阈值,其中关联程度通过概率表征)的归纳特征,作为需求预估数据。具体而言,需求预估数据可包括与搜索行为关联数据和/或画像数据的关联程度大于预设阈值(即强关联)的在线沟通记录数据中的一个或多个数据,例如,可以是与搜索行为关联数据中的一个或多个数据(例如,搜索词)和画像数据中的一个或多个数据(例如,性别)具有强关联的在线沟通记录数据中的一个或多个数据(例如,咨询问题和对于这个或这些咨询问题的回答)。也就是说,强关联是指对于具有某一些或某一个搜索行为关联数据和某一些或某一个画像数据的用户而言发生在沟通记录数据某一些咨询问题的概率较高。换句话说,需求预估数据可包括对于具有某一些搜索行为关联数据和/或某一些用户画像数据的用户而言在咨询过程中很可能会问的咨询问题。例如,对于消费水平较低的学生人群,他们在咨询过程很可能会咨询价格方面的问题,与较低价格区间的产品或服务具有强关联。
通过上述数据形成需求预估数据之后,步骤S101根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测该第一用户本次搜索的咨询意图关联数据可包括:根据第一用户的搜索意图关联数据和该第一用户的画像数据在需求预估数据中查找与该第一用户的搜索意图关联数据和/或该用户的画像数据的关联程度大于所述预设阈值(例如,强关联)的上述在线沟通记录数据中的一个或多个数据作为该第一用户本次搜索的咨询意图关联数据。需要说明的是,本发明实施方式的搜索意图关联数据可包括用户的搜索意图具有关联的数据,能够表征用户搜索意图的数据。具体而言,搜索意图关联数据可包括,但不限于下述的一个或多个数据:搜索词、搜索后的点击结果数据和未点击结果数据、在点击结果的停留时间以及与搜索词相关的百科性质的网页浏览记录等。本领域技术人员会理解,用户的搜索意图可以通过用户的搜索行为体现,因而用户搜索意图关联数据可包括用户搜索行为关联数据中的一个或多个数据。
对于已经就某一问题咨询过商家的用户而言,该用户的搜索意图关联数据不仅包括本次搜索输入的搜索词,还包括该用户在先输入的搜索词历史以及对这些搜索的点击结果数据和未点击结果数据、点击结果的停留时间以及与历史搜索词相关的百科性质的网页浏览记录等。用户的画像数据可以通过上述描述的方式由其他的数据源获得。需求预估数据中包含该用户的就该问题的沟通记录数据和搜索行为关联数据,因而基于这样的需求预估数据预测获得咨询意图关联数据的准确率更高。
对于首次咨询的用户,也就是说,该用户没有就某一问题咨询的历史记录。在这样的情形下,该用户的搜索意图关联数据可包括本次搜索输入的关键词。首次咨询用户的画像数据可通过上面描述的方式由其他数据源获得。需求预估数据中不包含该用户的沟通记录数据。
无论对于已经咨询过的用户,还是对于首次咨询的用户,所述查找与第一用户的搜索意图关联数据和/或该第一用户的画像数据的关联程度大于预设阈值的沟通记录数据的步骤均可包括:将该用户的搜索意图关联数据和/或该用户的画像数据通过学习归纳逐渐形成需求预估数据中的归纳特征,然后在在需求预估数据中查找与这些归纳特征具有强关联的沟通记录数据。在本发明的实施方式中通过需求预估数据预测获得的数据为在线沟通记录数据中的一个或多个作为本次搜索的咨询意图关联数据,例如,可以是在线沟通记录数据中的咨询问题,对咨询问题的回答,或者咨询问题及其回答作为咨询意图关联数据。对于已经咨询过的用户,预测的咨询意图关联数据可包括与该用户的历史的沟通记录数据密切联系的咨询问题和/或回答等。对于首次咨询的用户,预测的咨询意图关联数据可包括与该用户具有相似画像数据的同类用户的沟通记录数据中的咨询问题和/或回答等。其中,画像数据相似可包括各元素数据相同或相近(例如,相差不超过10%),例如性别相同、年龄相近(例如,相差小于2岁)、家庭构成相同、消费水平基本相同、兴趣点重叠等。
根据本发明的需求预估数据,能够较为精确地预测用户咨询意图,缩短用户搜索路径,满足用户个性化需求。
接下来,执行步骤S102,将步骤S101预测得到的咨询意图关联数据(例如,在线沟通记录数据中的咨询问题以及对所述咨询问题的回答)向本次咨询的第一用户优先展示。具体而言,在搜索结果中,可以在用户打开咨询按钮与商家进行沟通之前,向用户前置展示上述预测得到的咨询意图关联数据,其中,咨询意图关联数据的个数可以是1个、2个、3个或更多个,也就是说,向用户前置展示的咨询问题和/或对所述咨询问题的回答个数可以是1个,也可以是多个。
步骤S102将预测得到的咨询意图关联数据(例如,咨询问题和对咨询问题的回答)优先向用户展示,这些问题是用户很可能咨询的问题,用户可以根据预测的很可能咨询的问题咨询进一步的问题,这样的咨询数据处理方式缩短了用户搜索途径,也有利于更精准地匹配用户和商家。而且,在用户打开咨询节目与提供者(例如,商家)沟通时,自动给出预测的咨询意图关联数据,节省了用户和提供者(例如,商家)双方的时间。本发明的咨询意图关联数据处理的方法在步骤S102之后,还可包括将用户在预测的咨询意图关联数据基础上的新的在线沟通记录数据纳入需求预估数据的数据源,从而为下一次搜索行为更好地服务。
下面结合一个具体的例子说明本发明实施方式的用于咨询数据处理的方法。参见图2,图示了根据本发明一种实施方式的用于咨询数据处理的方法的示意图。首先,根据用户与商家的在线沟通记录(例如,与商家的聊天记录)、用户的画像数据和用户的搜索行为关联数据通过机器学习获取需求预估数据。其中,用户与商家的在线沟通记录数据可包括用户1的沟通记录、用户2的沟通记录等n个用户的沟通记录(其中,n为大于或等于2的整数),可以从这些沟通记录数据中提取属性1(例如,咨询问题1)和该属性1的取值1(例如,对该咨询问题1的回答)以及属性2和属性2对应的取值。从不同的沟通记录中可提取不同的属性和属性对应的取值,例如,从用户1的沟通记录数据中,可提取属性1、2、3和对应的取值,从用户2的沟通记录数据中,可提取属性2、4和对应的取值,从用户n的沟通记录数据中,可提取属性3、5和对应的取值。用户的画像数据可包括性别、年龄、家庭(例如,家庭构成)、消费(例如,消费习惯等)、兴趣(例如,对体育、娱乐等有兴趣)等多个数据。用户的搜索行为关联数据可包括标识id、搜索时间、搜索词和对搜索词的搜索结果的点击数据(例如,点击的数据、未点击的数据以及在点击的数据的停留时间等)。通过对上述的这些数据进行机器学习可获得需求预估数据。在新的搜索中,基于用户的搜索意图、用户的画像数据,和机器学习获得的需求预估数据可得到预测的属性(例如,咨询问题)和预测的取值(例如,对咨询问题的回答),预测的属性和取值可以是n个,其中n为大于或等于1的整数。并且在新的沟通记录中,可优先展示预测的属性和取值,缩短用户与商家就咨询问题的沟通效率。例如,以一个双眼皮手术为例,具体的咨询数据的处理过程可以如图3所示。
尽管在上述的实施例中,是在用户开始咨询问题之前自动给出预测的问题以及对问题的问题,但本发明的实施方式并不限于上述优先展示的方式和展示的咨询意图关联数据,本领域技术人员还可根据应用需要选择其他优先展示的方式和展示的内容,例如,可结合对咨询问题的关联图片或动画,以便用户更直观地查看预测的咨询意图关联数据。
上面结合具体的实施方式描述了本发明的用于咨询数据处理的方法,下面将结合具体实施实施方式描述应用上述用户咨询数据处理的方法的装置。
参见图4,图示了根据本发明一种实施方式的用于咨询数据处理的装置的结构示意图,该装置200可包括:
预测模块201,用于根据第一用户的搜索意图关联数据、该第一用户的画像数据和预先形成的需求预估数据预测该第一用户本次搜索的咨询意图关联数据;
展示模块202,用于将预测得到的咨询意图关联数据向该第一用户优先展示。
本发明的用于咨询数据处理的装置200可包括预测模块201和展示模块202,这些模块可设置于搜索引擎上,并且还可以与搜索引擎的其他模块进行通信,从而调用搜索引擎中存储的数据(例如,搜索日志等),或者可供搜索引擎的其他模块调用。
预测模块201根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据。其中,第一用户可以是已经进行过相关咨询的用户,也可以是首次咨询的用户。该预先形成的需求预估数据是根据多个用户(例如,大于或等于2个)与提供者(例如,提供产品或服务的商家等机构)的在线沟通记录数据、多个用户的搜索行为关联数据和多个用户的画像数据等大量的历史数据通过机器学习形成。
本发明实施方式中的用户与提供者的在线沟通记录数据可包括大量用户与大量提供者(例如,商家)就某一个或某一些问题咨询的聊天记录数据,例如,可包括,但不限于下述的一个或多个(例如,大于或等于2个)数据:咨询时间、咨询者、咨询问题、针对所述咨询问题的回答。其中,上述的大量用户可包括本次搜索的第一用户。也就是说,需求预估数据中的在线沟通记录数据可包括本次搜索的第一用户与其他的多个商家的沟通记录。用户的搜索行为关联数据可包括与用户的搜索行为具有关联的数据,这些关联的数据能够从一个或多个层面上表征用户的搜索行为。这些搜索行为关联数据可从搜索引擎存储的大量搜索数据获得,还可以从搜索引擎之外的数据源获得,例如,百科性质的网页数据等。本发明实施方式的搜索行为关联数据包括,但不限于下述的一个或多个数据:搜索用户的标识、搜索时间、搜索词、搜索后的点击结果数据。用户的画像数据可包括表征用户的一个或多个层面信息的数据。本发明实施方式中的画像数据可包括,但不限于下述的一个或多个数据:性别、年龄、家庭状况(例如,家庭构成等)、消费习惯(例如,消费水平处于低等水平、中等水平或高等水平等)、兴趣点(例如,对体育、娱乐、服饰搭配等信息有兴趣)等。这些画像数据也可通过搜索引擎存储的数据获得,例如,可通过在网络上的一些注册数据(例如,可包括性别、年龄等数据)和搜索记录数据(例如,对搜索词的记录数据),还可以通过搜索引擎之外的其他数据源获得,例如,百科性质的网页数据等。下面举例说明通过搜索记录数据获取用户画像数据的处理过程,在用户以诸如婴儿用品、奶粉、喂养等为搜索词进行搜索的数据较多且频率较高时,可以推测该用户的家庭构成中包括孩子。在形成需求预估数据的过程中,需要对上述的在线沟通记录数据、搜索行为关联数据和画像数据进行一些预处理,例如,过滤掉捕捉不完全的信息,对同类信息进行合并(例如,对具有相同搜索用户的标识id的数据进行合并)。
对上述获得的在线沟通记录数据、搜索行为关联数据和画像数据等大量数据进行预处理后,通过机器学习进行统计归纳,得到具有强关联(例如,关联程度大于预定阈值,其中关联程度通过概率表征)的归纳特征,作为需求预估数据。具体而言,需求预估数据可包括与搜索行为关联数据和/或画像数据的关联程度大于预设阈值(即强关联)的在线沟通记录数据中的一个或多个数据,例如,可以是与搜索行为关联数据中的一个或多个数据(例如,搜索词)和画像数据中的一个或多个数据(例如,性别)具有强关联的在线沟通记录数据中的一个或多个数据(例如,咨询问题和对于这个或这些咨询问题的回答)。也就是说,强关联是指对于具有某一些或某一个搜索行为关联数据和某一些或某一个画像数据的用户而言发生在沟通记录数据某一些咨询问题的概率较高。换句话说,需求预估数据可包括对于具有某一些搜索行为关联数据和/或某一些用户画像数据的用户而言在咨询过程中很可能会问的咨询问题。例如,对于消费水平较低的学生人群,他们在咨询过程很可能会咨询价格方面的问题,与较低价格区间的产品或服务具有强关联。
通过上述数据形成需求预估数据之后,预测模块201还可用于根据第一用户的搜索意图关联数据和该第一用户的画像数据在需求预估数据中查找与该第一用户的搜索意图关联数据和/或该用户的画像数据的关联程度大于所述预设阈值(例如,强关联)的上述在线沟通记录数据中的一个或多个数据作为该第一用户本次搜索的咨询意图关联数据。需要说明的是,本发明实施方式的搜索意图关联数据可包括用户的搜索意图具有关联的数据,能够表征用户搜索意图的数据。具体而言,搜索意图关联数据可包括,但不限于下述的一个或多个数据:搜索词、搜索后的点击结果数据和未点击结果数据、在点击结果的停留时间以及与搜索词相关的百科性质的网页浏览记录等。本领域技术人员会理解,用户的搜索意图可以通过用户的搜索行为体现,因而用户搜索意图关联数据可包括用户搜索行为关联数据中的一个或多个数据。
对于已经就某一问题咨询过商家的用户而言,该用户的搜索意图关联数据不仅包括本次搜索输入的搜索词,还包括该用户在先输入的搜索词历史以及对这些搜索的点击结果数据和未点击结果数据、点击结果的停留时间以及与历史搜索词相关的百科性质的网页浏览记录等。用户的画像数据可以通过上述描述的方式由其他的数据源获得。需求预估数据中包含该用户的就该问题的沟通记录数据和搜索行为关联数据,因而基于这样的需求预估数据预测获得咨询意图关联数据的准确率更高。
对于首次咨询的用户,也就是说,该用户没有就某一问题咨询的历史记录。在这样的情形下,该用户的搜索意图关联数据可包括本次搜索输入的关键词。首次咨询用户的画像数据可通过上面描述的方式由其他数据源获得。需求预估数据中不包含该用户的沟通记录数据。
无论对于已经咨询过的用户,还是对于首次咨询的用户,所述查找与第一用户的搜索意图关联数据和/或该第一用户的画像数据的关联程度大于预设阈值的沟通记录数据的步骤均可包括:将该用户的搜索意图关联数据和/或该用户的画像数据通过学习归纳逐渐形成需求预估数据中的归纳特征,然后在在需求预估数据中查找与这些归纳特征具有强关联的沟通记录数据。在本发明的实施方式中通过需求预估数据预测获得的数据为在线沟通记录数据中的一个或多个作为本次搜索的咨询意图关联数据,例如,可以是在线沟通记录数据中的咨询问题,对咨询问题的回答,或者咨询问题及其回答作为咨询意图关联数据。对于已经咨询过的用户,预测的咨询意图关联数据可包括与该用户的历史的沟通记录数据密切联系的咨询问题和/或回答等。对于首次咨询的用户,预测的咨询意图关联数据可包括与该用户具有相似画像数据的同类用户的沟通记录数据中的咨询问题和/或回答等。其中,画像数据相似可包括各元素数据相同或相近(例如,相差不超过10%),例如性别相同、年龄相近(例如,相差小于2岁)、家庭构成相同、消费水平基本相同、兴趣点重叠等。
根据本发明的需求预估数据,能够较为精确地预测用户咨询意图,缩短用户搜索路径,满足用户个性化需求。
展示模块202将预测模块201预测得到的咨询意图关联数据(例如,在线沟通记录数据中的咨询问题以及对所述咨询问题的回答)向本次咨询的第一用户优先展示。具体而言,在搜索结果中,可以在用户打开咨询按钮与商家进行沟通之前,向用户前置展示上述预测得到的咨询意图关联数据,其中,咨询意图关联数据的个数可以是1个、2个、3个或更多个,也就是说,向用户前置展示的咨询问题和/或对所述咨询问题的回答个数可以是1个,也可以是多个。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。

Claims (10)

1.一种用于咨询数据处理的方法,其特征在于,包括:
根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据;
将预测得到的咨询意图关联数据向所述第一用户优先展示。
2.根据权利要求1所述的方法,其特征在于,所述预先形成的需求预估数据是根据用户与提供者的在线沟通记录数据、用户的搜索行为关联数据和用户的画像数据通过机器学习形成。
3.根据权利要求2所述的方法,其特征在于,
所述在线沟通记录数据包括下述的一个或多个数据:咨询时间、咨询者、咨询问题、针对所述咨询问题的回答;
所述搜索行为关联数据包括下述的一个或多个数据:搜索用户的标识、搜索时间、搜索词、搜索后的点击结果数据、在所述点击结果数据的停留时间;以及
所述画像数据包括下述的一个或多个数据:性别、年龄、家庭状况、消费习惯、兴趣点。
4.根据权利要求3所述的方法,其特征在于,所述预先形成的需求预估数据包括:与所述搜索行为关联数据和/或所述画像数据的关联程度大于预设阈值的所述在线沟通记录数据中的一个或多个数据,其中,所述关联程度通过概率表征。
5.根据权利要求4所述的方法,其特征在于,所述根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据的步骤包括:
根据第一用户的搜索意图关联数据和所述第一用户的画像数据在所述需求预估数据中查找与所述搜索意图关联数据和/或所述画像数据的关联程度大于所述预设阈值的所述在线沟通记录数据中的一个或多个数据作为所述第一用户本次搜索的咨询意图关联数据。
6.一种用于咨询数据处理的装置,其特征在于,包括:
预测模块,用于根据第一用户的搜索意图关联数据、所述第一用户的画像数据和预先形成的需求预估数据预测所述第一用户本次搜索的咨询意图关联数据;
展示模块,用于将预测得到的咨询意图关联数据向所述第一用户优先展示。
7.根据权利要求6所述的装置,其特征在于,所述预先形成的需求预估数据是根据用户与提供者的在线沟通记录数据、用户的搜索行为关联数据和用户的画像数据通过机器学习形成。
8.根据权利要求7所述的装置,其特征在于,所述在线沟通记录数据包括下述的一个或多个数据:咨询时间、咨询者、咨询问题、针对所述咨询问题的回答;
所述搜索行为关联数据包括下述的一个或多个数据:搜索用户的标识、搜索时间、搜索词、搜索后的点击结果数据、在所述点击结果数据的停留时间;以及
所述画像数据包括下述的一个或多个数据:性别、年龄、家庭状况、消费习惯、兴趣点。
9.根据权利要求8所述的装置,其特征在于,所述预先形成的需求预估数据包括:与所述搜索行为关联数据和/或所述画像数据的关联程度大于预设阈值的所述在线沟通记录数据中的一个或多个数据,其中,所述关联程度通过概率表征。
10.根据权利要求9所述的装置,其特征在于,所述预测模块,还用于根据第一用户的搜索意图关联数据和所述第一用户的画像数据在所述需求预估数据中查找与所述搜索意图关联数据和/或所述画像数据的关联程度大于所述预设阈值的所述在线沟通记录数据中的一个或多个数据作为所述第一用户本次搜索的咨询意图关联数据。
CN201510354129.7A 2015-06-24 2015-06-24 一种用于咨询数据处理的方法和装置 Pending CN105095357A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510354129.7A CN105095357A (zh) 2015-06-24 2015-06-24 一种用于咨询数据处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510354129.7A CN105095357A (zh) 2015-06-24 2015-06-24 一种用于咨询数据处理的方法和装置

Publications (1)

Publication Number Publication Date
CN105095357A true CN105095357A (zh) 2015-11-25

Family

ID=54575794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510354129.7A Pending CN105095357A (zh) 2015-06-24 2015-06-24 一种用于咨询数据处理的方法和装置

Country Status (1)

Country Link
CN (1) CN105095357A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018000270A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种基于用户画像的个性化回答生成方法及系统
WO2018000271A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种基于用户画像的意图场景识别方法及系统
CN108537644A (zh) * 2018-04-23 2018-09-14 吉林亿联银行股份有限公司 一种客服推荐产品的方法和装置
CN109658296A (zh) * 2018-08-31 2019-04-19 北京沃达新创国际教育科技有限公司 一种智能留学服务平台
CN110032628A (zh) * 2019-02-21 2019-07-19 北京奥鹏远程教育中心有限公司 一种用户在线咨询系统和方法
CN110096577A (zh) * 2018-01-31 2019-08-06 国际商业机器公司 从异常简档数据预测用户的意图

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208730A1 (en) * 2006-03-02 2007-09-06 Microsoft Corporation Mining web search user behavior to enhance web search relevance
CN101329674A (zh) * 2007-06-18 2008-12-24 北京搜狗科技发展有限公司 一种提供个性化搜索的系统和方法
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
CN102779193A (zh) * 2012-07-16 2012-11-14 哈尔滨工业大学 自适应个性化信息检索系统及方法
CN103208092A (zh) * 2013-05-03 2013-07-17 闻静波 基于互联网提供咨询信息的系统
CN104679771A (zh) * 2013-11-29 2015-06-03 阿里巴巴集团控股有限公司 一种个性化数据搜索方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208730A1 (en) * 2006-03-02 2007-09-06 Microsoft Corporation Mining web search user behavior to enhance web search relevance
CN101329674A (zh) * 2007-06-18 2008-12-24 北京搜狗科技发展有限公司 一种提供个性化搜索的系统和方法
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
CN102779193A (zh) * 2012-07-16 2012-11-14 哈尔滨工业大学 自适应个性化信息检索系统及方法
CN103208092A (zh) * 2013-05-03 2013-07-17 闻静波 基于互联网提供咨询信息的系统
CN104679771A (zh) * 2013-11-29 2015-06-03 阿里巴巴集团控股有限公司 一种个性化数据搜索方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018000270A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种基于用户画像的个性化回答生成方法及系统
WO2018000271A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种基于用户画像的意图场景识别方法及系统
CN110096577A (zh) * 2018-01-31 2019-08-06 国际商业机器公司 从异常简档数据预测用户的意图
CN110096577B (zh) * 2018-01-31 2023-05-30 国际商业机器公司 数据处理系统中的方法、程序产品、装置和系统
CN108537644A (zh) * 2018-04-23 2018-09-14 吉林亿联银行股份有限公司 一种客服推荐产品的方法和装置
CN109658296A (zh) * 2018-08-31 2019-04-19 北京沃达新创国际教育科技有限公司 一种智能留学服务平台
CN110032628A (zh) * 2019-02-21 2019-07-19 北京奥鹏远程教育中心有限公司 一种用户在线咨询系统和方法

Similar Documents

Publication Publication Date Title
US10482521B2 (en) Intent prediction based recommendation system using data combined from multiple channels
Wu A comparative study of using grey relational analysis in multiple attribute decision making problems
CN107679217B (zh) 基于数据挖掘的关联内容提取方法和装置
CN105095357A (zh) 一种用于咨询数据处理的方法和装置
US11188830B2 (en) Method and system for user profiling for content recommendation
US20190347287A1 (en) Method for screening and injection of media content based on user preferences
US20140129331A1 (en) System and method for predicting momentum of activities of a targeted audience for automatically optimizing placement of promotional items or content in a network environment
US9256692B2 (en) Clickstreams and website classification
Kanetkar et al. Web-based personalized hybrid book recommendation system
US20130036121A1 (en) System and method for recommending blog
CN102298612A (zh) 基于用户社交简档调整搜索结果
WO2014116835A2 (en) Method and apparatus for building a user profile, for personalization using interaction data, and for generating, identifying, and capturing user data across interactions using unique user identification
US9069880B2 (en) Prediction and isolation of patterns across datasets
US10482142B2 (en) Information processing device, information processing method, and program
JP6728178B2 (ja) 検索データを処理するための方法及び装置
US20140279730A1 (en) Identifying salient items in documents
US20160379270A1 (en) Systems and methods for customized internet searching and advertising
CN107977678A (zh) 用于输出信息的方法和装置
CN107103028A (zh) 一种信息处理方法及装置
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN107908616A (zh) 预测趋势词的方法和装置
CN111723280B (zh) 信息的处理方法、装置、存储介质及电子设备
US20200081930A1 (en) Entity-based search system using user engagement
US20200073925A1 (en) Method and system for generating a website from collected content
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125