CN105556514B - 一种基于用户搜索行为进行数据挖掘的方法和装置 - Google Patents

一种基于用户搜索行为进行数据挖掘的方法和装置 Download PDF

Info

Publication number
CN105556514B
CN105556514B CN201480038221.6A CN201480038221A CN105556514B CN 105556514 B CN105556514 B CN 105556514B CN 201480038221 A CN201480038221 A CN 201480038221A CN 105556514 B CN105556514 B CN 105556514B
Authority
CN
China
Prior art keywords
financial
user
users
search
search behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480038221.6A
Other languages
English (en)
Other versions
CN105556514A (zh
Inventor
刘成
杨骏
贾云飞
张驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of CN105556514A publication Critical patent/CN105556514A/zh
Application granted granted Critical
Publication of CN105556514B publication Critical patent/CN105556514B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Abstract

本发明提供了一种基于用户搜索行为进行数据挖掘的方法。根据本发明的一个方面,提供一种用于提供金融数据挖掘的方法,其中,该方法包括以下步骤:获取多个用户的搜索行为信息;基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金融实体;其中,该方法还包括:基于所确定的所述多个用户的每次搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。根据本发明的另一方面,提供了一种用于为用户提供金融实体信息的方法,其中,该方法包括:获取多个用户的搜索行为信息;基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征;根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群,每个用户群具有相应的金融需求相关特征;其中,该方法还包括:通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,确定每个用户群对应的金融实体。与现在技术比,本发明通过利用用户搜索行为的数据挖掘,获得用户所关注的金融实体信息,可以为金融机构提供符合用户需求的金融实体来提供准确、客观的数据支持,也可为用户提供符合其实际需求的金融实体。

Description

一种基于用户搜索行为进行数据挖掘的方法和装置
技术领域
本发明涉及对数据分析领域,尤其涉及基于用户搜索行为来进行数据挖掘的方法。
背景技术
大数据挖掘是当前辄待发展的前沿技术。如何通过对大量用户的行为数据,尤其是海量用户的搜索行为,进行挖掘分析以确定用户的需求是当前计算机领域的难题。
发明内容
本发明的目的是提供一种基于用户搜索行为进行数据挖掘的方法。
根据本发明的一个方面,提供一种用于提供金融数据挖掘的方法,其中,该方法包括以下步骤:
-获取多个用户的搜索行为信息;
-基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金融实体;
其中,该方法还包括:
-基于所确定的所述多个用户的每次搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。
根据本发明的另一方面,提供了一种用于为用户提供金融实体信息的方法,其中,该方法包括:
-获取多个用户的搜索行为信息;
-基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征;
-根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群,每个用户群具有相应的金融需求相关特征;
其中,该方法还包括:
-通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,确定每个用户群对应的金融实体。
根据本发明的另一方面,提供了一种用于进行金融数据挖掘的装置,其中,包括:
用于获取多个用户的搜索行为信息;
用于基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金融实体的装置;
其中,还包括:
用于基于所确定的所述多个用户的每次搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息的装置。
根据本发明的另一个方面,提供了一种用于为用户提供金融实体信息的装置,其中,包括:
用于获取多个用户的搜索行为信息的装置;
用于基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征的装置;
用于根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群的装置,其中,每个用户群具有相应的金融需求相关特征;
用于通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,来确定每个用户群对应的金融实体的装置。
与现在技术比,本发明通过利用用户搜索行为的数据挖掘,获得用户所关注的金融实体信息,可以为金融机构提供符合用户需求的金融实体来提供准确、客观的数据支持,也可为用户提供符合其实际需求的金融实体信息。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出据本发明一个实施例的基于用户搜索行为来进行数据挖掘以确定各个金融实体的用户关注度信息的方法流程图;
图2示出根据本发明一个实施例的基于用户搜索行为来为用户提供金融实体信息的方法流程图;
图3示出示出根据本发明另一个实施例的基于用户搜索行为来为用户提供金融实体信息的方法流程图;
图4示出据本发明一个实施例的基于用户搜索行为来进行数据挖掘以确定各个金融实体的用户关注度信息的装置示意图;
图5示出根据本发明一个实施例的基于用户搜索行为来为用户提供金融实体信息的装置示意图;
图6示出示出根据本发明另一个实施例的基于用户搜索行为来为用户提供金融实体信息的装置示意图。
附图中相同或相似的附图表示相同的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
名称定义
“金融机构”指与金融业务有关的机构或企业,如银行、金融中介机构(券商、金融服务公司)、投资机构(如公募基金、私募基金)、保险公司、金融租赁机构等;
“金融实体”指特定的金融产品或金融信息,例如,银行理财产品信息、二级市场的上市公司股票信息、保险公司的特定保险产品等等。
“用户设备”指由用户使用的终端设备,包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。
“网络设备“指连接在网络上并可基于网络发送或接收信息的计算机设备,包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于去计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
“网络“指连接不同计算机设备并提供数据传输的网络,包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
本领域技术人员应理解上述用户设备、网络设备和网络仅为举例,其他现有的或今后可能出现的计算设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此;
图1示出根据本发明一个实施例的基于用户搜索行为来进行数据挖掘以确定各个金融实体的用户关注度信息的方法流程图。
下面参照图1来对所述实施例进行描述:
如图1所示,在步骤S101中,网络设备2获取多个用户的搜索行为信息。
其中,多个用户的搜索行为信息包括以下至少任一项:各个用户的查询序列、各个用户对于响应于查询序列所获得的搜索结果的点击、访问等操作信息、各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行交互的网络设备预先获取并存储于一存储设备中。网络设备通过访问该存储设备来读取所述多个用户的搜索行为信息。其中,该存储设备可以是与该网络设备成一体或独立于该网络设备。
在步骤S102中,网络设备基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金融实体。
具体地,对于各个用户的每次搜索行为,网络设备2可以通过对各个用户的查询序列、各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面进行分析,来确定该次搜索行为对应的金融实体。
随后,在步骤S103中,网络设备基于所确定的所述多个用户的每次搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。其中,用户关注度信息包括但不限于以下至少任一项:用户关注总次数、在一定时间周期内的用户关注度次数或用户关注频度、用户关注频度随时间的变化曲线等。
具体地,网络设备可以基于步骤S102中对于各个用户的每次搜索行为的确定结果,来进行统计,从而获得在步骤S102中所确定的各个金融实体的所对应的用户关注度信息。
可选地,在步骤S104中,网络设备可通过网络,在诸如网站、BBS、微信群、微博等各种信息发布平台上,发布在步骤S203中所确定的每个金融实体所对应的用户关注度信息,或提供给金融机构做进一步数据分析或生成其他金融信息。
在一个优选实施例中,在步骤S102中,网络设备基于所述多个的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体。以下通过两个实例对此进行说明:
实例1:
在步骤S1021(未示出)中,网络设备2通过对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为。
其中,对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为的步骤包括以下至少任一种方式:
1)通过对所述多个用户的每次搜索行为中查询序列进行语义分析,来确定该次搜索行为是否具有金融需求;
具体地,当发现查询序列中包含某些语义与金融需求相关的关键词,则可以确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的关键词的数量和/或级别来确定第一金融需求数值D1;
2)通过对所述多个用户的每次搜索行为中所开启的页面中内容进行分析,来确定该次搜索行为是否具有金融需求;
具体地,当对于所开启页面的内容进行分析,发现其中包含某些语义与金融属性有关的词语或句子,则可已确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的词语或句子的数量和/或级别来确定第二金融需求数值D2
3)通过对所述多个用户的每次搜索行为中所开启的网络站点的属性,来确定该次搜索行为是否具有金融需求;
具体地,当确定该等网络站点具有金融属性,则可推导出该次搜索行文具有金融需求;或根据所述站点的金融属性级别来确定第三金融需求数值。
具体地,网络设备可基于以下公式来通过上述方式确定搜索行为是否具有金融需求:
D(n)=a*D1(n)+b*D2(n)+c*D3(n) (1)
其中,n指一个用户的第n次搜索行为,a,b,c为上述三种方式的权重数值,D(n)为该用户第n次搜索行为的金融需求数值。
基于以上公式(1),网络设备可以确定第n次搜索行为:
-具有金融需求,当D(n-1)≥预定阈值T;
-不具有金融需求,当D(n-1)<预定阈值T;
优选地,网络设备还可基于所述多个用户的每次搜索行为,结合该搜索行为的在先搜索行为,来确定该次搜索行为是否具有金融需求。简言之,如果一个用户的在先搜索行为被确定具有金融需求且达到一定比例或根据公式(1)所确定的金融需求数值超过预定阈值,则其后续的搜索行为具有金融需求的可能性也较大。具体地,网络设备可以基于以下公式来基于一个用户的在先搜索行为来确定当前搜索行为是否具有金融需求:
D(n)’=(1+f(D(n-1))*a)*D(n) (2)
其中:
D(n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-1)=1,当D(n-1)≥预定阈值T;
f(D(n-1)=0,当D(n-1)<预定阈值T;
上述公式仅为例举而非限制性,本领域技术人员应理解还有其他基于本发明构思的公式可用于确定用户搜索行为是否具有金融需求,其也应落入本发明保护范围,并以引用方式包含于此。另外,本领域技术人员应可基于本发明上述构思,通过统计分析并结合实际情况来确定合适的预定阈值T。
随后,在步骤S1022(未示出),网络设备通过对在步骤S1021中所确定的多个用户的具有金融需求的用户搜索行为信息进行分析,来确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
实例2:
在步骤S1021’(未示出)中,网络设备2通过对所述多个用户的用户搜索行为信息进行分析,来确定所述多个用户的每次搜索行为对应的金融实体;
随后,在步骤S1022’(未示出)中,网络设备2通过对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为,从而确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
同样地,其中,对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为的步骤包括以下至少任一种方式:
1)通过对所述多个用户的每次搜索行为中查询序列进行语义分析,来确定该次搜索行为是否具有金融需求;
具体地,当发现查询序列中包含某些语义与金融需求相关的关键词,则可以确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的关键词的数量和/或级别来确定第一金融需求数值D1;
2)通过对所述多个用户的每次搜索行为中所开启的页面中内容进行分析,来确定该次搜索行为是否具有金融需求;
具体地,当对于所开启页面的内容进行分析,发现其中包含某些语义与金融属性有关的词语或句子,则可已确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的词语或句子的数量和/或级别来确定第二金融需求数值D2
3)通过对所述多个用户的每次搜索行为中所开启的网络站点的属性,来确定该次搜索行为是否具有金融需求;
具体地,当确定该等网络站点具有金融属性,则可推导出该次搜索行文具有金融需求;或根据所述站点的金融属性级别来确定第三金融需求数值。
具体地,网络设备基于以下公式来通过上述方式确定搜索行为是否具有金融需求:
D(n)=a*D1(n)+b*D2(n)+c*D3(n) (1)
其中,n指一个用户的第n次搜索行为,a,b,c为上述三种方式的权重数值,D(n)为该用户第n次搜索行为的金融需求数值。
基于以上公式(1),网络设备2可以确定第n次搜索行为:
-具有金融需求,当D(n-1)≥预定阈值T;
-不具有金融需求,当D(n-1)<预定阈值T;
优选地,网络设备还可基于所述多个用户的每次搜索行为,结合该搜索行为的在先搜索行为,来确定该次搜索行为是否具有金融需求。简言之,如果一个用户的在先搜索行为被确定具有金融需求且达到一定比例或根据公式(1)所确定的金融需求数值超过预定阈值,则其后续的搜索行为具有金融需求的可能性也较大。具体地,网络设备可以基于以下公式来基于一个用户的在先搜索行为来确定当前搜索行为是否具有金融需求:
D(n)’=(1+f(D(n-1))*a)*D(n) (2)
其中:
D(n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-1)=1,当D(n-1)≥预定阈值T;
f(D(n-1)=0,当D(n-1)<预定阈值T;
上述公式仅为例举而非限制性,本领域技术人员应理解还可有其他基于本发明构思的公式可用于确定用户搜索行为是否具有金融需求,其也应落入本发明保护范围,并以引用方式包含于此。另外,本领域技术人员基于本发明上述构思,通过统计分析并结合实际情况来确定合适的预定阈值T。
接着,在步骤S103中,网络设备2基于所确定的所述多个用户的每次具有金融需求的搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。
具体地,网络设备可以基于步骤S102中对于各个用户的每次具有金融需求的搜索行为的确定结果,来进行统计,从而获得在步骤S102中所确定的各个金融实体的所对应的用户关注度信息。
可选地,在步骤S104中,网络设备可通过网络,在诸如网站、BBS、微信群、微博等各种信息发布平台上,发布在步骤S103中所确定的每个金融实体所对应的用户关注度信息,或提供给金融机构做进一步数据分析或生成其他金融信息。
图2示出根据本发明一个实施例的基于用户搜索行为来为用户提供金融实体信息的方法流程图。
下面参照图2来对该实施例进行描述:
在步骤S201中,网络设备获取多个用户的搜索行为信息。
其中,多个用户的搜索行为信息包括以下至少任一项:各个用户的查询序列、各个用户对于响应于查询序列所获得的搜索结果的点击、访问等操作信息、各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行交互的网络设备预先获取并存储于一存储设备中。网络设备通过访问该存储设备来读取所述多个用户的搜索行为信息。其中,该存储设备可以是与该网络设备成一体或独立于该网络设备2。
在步骤S202中,网络设备基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征。其中,用户的金融需求相关特征包括以下至少任一项:用户所关注的金融细分领域F、用户的金融需求强度S、用户的金融需求级别P。具体地:
对于用户所关注的金融细分领域,网络设备可以通过对各个用户的查询序列、和/或各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户关注的金融细分领域。例如,当发现查询序列、和/或用户点击的搜索结果、和/或页面内容中包含某些语义与金融细分领域相关的关键词,则可确定用户关注的金融细分领域F(1),F(2),F(3)…。
对于用户的金融需求强度,网络设备可以通过对各个用户的查询序列、和/或各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户的金融需求强度。例如,根据查询序列、和/或用户点击的搜索结果、和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求强度S。
对于用户的金融需求级别,网络设备可以通过对各个用户的查询序列、和/或各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户的金融需求级别。例如,根据查询序列、和/或用户点击的搜索结果和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求级别P。
优选地,步骤S202包括子步骤S2021(未示出)与S2022(未示出)。
其中,在子步骤S2021中,网络设备通过对所述多个用户的搜索行为信息进行初始需求分析来筛选具有金融需求的多个用户,其中,对用户的搜索行为进行初始需求分析的方式与前面参照图1描述的实施例中确定用户搜索行为是否具有金融需求的方式相同,为简明起见,以引用方式包含于此,而不做赘述;
随后,在子步骤S2022中,网络设备基于所述具有金融需求的各个用户的搜索行为来确定各个具有金融需求的用户的金融需求相关特征,其中,确定各个具有金融需求的用户的金融需求相关特征的方式与前面步骤S202中确定各个用户的金融需求相关特征的方式相同,为简明起见,以引用方式包含于此,而不做赘述。
优选地,网络设备可基于各个用户的搜索行为,并结合各个用户的自然属性,来确定各个用户的金融需求相关特征。
其中,用户的自然属性包括以下至少任一项:所述用户的年龄;所述用户的性别;所述用户的职业;所述用户的消费水平;所述用户所处地域。
在步骤S203中,网络设备根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群,每个用户群具有相应的金融需求相关特征。
在步骤S204中,网络设备通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,确定每个用户群对应的金融实体。其中,本领域技术人员应理解,步骤S203与步骤S204在时间上是独立的,也即步骤S204无需在时间上紧跟步骤S203。
可选地,在步骤S205(未示出),网络设备可通过网络,在诸如网站、BBS、微信群、微博等各种信息发布平台上,发布在步骤S204中所确定的每个用户群对应的金融实体信息,或提供给金融机构做进一步数据分析或生成其他金融信息。
图3示出根据本发明另一个实施例的基于用户搜索行为来为用户提供金融实体信息的方法流程图。
下面参照图3对该实施例进行描述:
其中,图3中步骤S301至S304(未示出)与图3中所示步骤S201至S204相同,未简明起见,以引用方式包含于此,而不做赘述。
在步骤S305中,网络设备获取一个用户的搜索行为信息。
其中,该用户的搜索行为信息包括以下至少任一项:该用户的查询序列、该用户对于响应于查询序列所获得的搜索结果的点击、访问等操作信息、该用户通过点击搜索结果后访问的页面。
该用户的搜索行为信息是由网络设备通过与该用户的用户设备进行交互而实时获取;或者是由网络设备或其他与该用户的用户设备进行交互的网络设备预先获取并存储于一存储设备中,网络设备通过访问该存储设备来读取该用户的搜索行为信息。其中,该存储设备可以是与该网络设备成一体或独立于该网络设备。
在步骤S306中,网络设备基于该用户的搜索行为信息来确定该用户的金融需求相关特征。其中,用户的金融需求相关特征包括以下至少任一项:用户所关注的金融细分领域F、用户的金融需求强度S、用户的金融需求级别P。具体地:
对于该用户所关注的金融细分领域,网络设备2可以通过对于对该用户的查询序列、和/或该用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或该用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户关注的金融细分领域。例如,当发现查询序列、和/或该用户点击的搜索结果、和/或页面内容中包含某些语义与金融细分领域相关的关键词,则可确定该用户关注的金融细分领域F(1),F(2),F(3)…。
对于该用户的金融需求强度,网络设备可以通过对该用户的查询序列、和/或该用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或该用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定该用户的金融需求强度。例如,根据查询序列、和/或该用户点击的搜索结果、和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求强度S。
对于该用户的金融需求级别,网络设备可以通过对该用户的查询序列、和/或该用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或该用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定该用户的金融需求级别。例如,根据查询序列、和/或该用户点击的搜索结果、和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求级别P。
随后,在步骤S307中,网络设备基于该用户的金融需求相关特征及所确定的多个用户群的金融需求相关特征,来确定该用户所归属的用户群,从而确定该用户对应的金融实体。
具体地,通过将步骤S306中确定的该用户的金融需求相关特征的各项与各个用户群的金融需求相关特征的各项进行对比,如果发现该用户与某一用户群的金融需求相关特征的各项之差均在预定范围内,则可确定该用户属于该用户群,从而可将该用户群对应的金融实体作为该用户对应的金融实体。
除上述方式以外,本领域技术人员应理解还可由其他基于本发明构思的用于确定该用户所归属用户群的方式,其也应落入本发明保护范围,并以引用方式包含于此。
本领域技术人员应理解上述步骤S305-S307与步骤S301-S304之间是时间上独立的,也即步骤S305-S307无需在时间上紧跟步骤S301-S304的操作。
图4示出根据本发明一个实施例的基于用户搜索行为来进行数据挖掘以确定各个金融实体的用户关注度信息的装置示意图。
下面参照图4来对该实施例进行描述:
如图4所示,网络设备的装置401,以下简称“获取装置“,获取多个用户的搜索行为信息。
其中,多个用户的搜索行为信息包括以下至少任一项:各个用户的查询序列、各个用户对于响应于查询序列所获得的搜索结果的点击、访问等操作信息、各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行交互的网络设备预先获取并存储于一存储设备中。获取装置501通过访问该存储设备来读取所述多个用户的搜索行为信息。其中,该存储设备可以是与该网络设备成一体或独立于该网络设备。
随后,网络设备的装置402,以下简称“第一确定装置”,基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金融实体。
具体地,对于各个用户的每次搜索行为,第一确定装置402可以通过对各个用户的查询序列、各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面进行分析,来确定该次搜索行为对应的金融实体。
随后,网络设备的装置403,以下简称“第二确定装置”,基于所确定的所述多个用户的每次搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。其中,用户关注度信息包括但不限于以下至少任一项:用户关注总次数、在一定时间周期内的用户关注度次数或用户关注频度、用户关注频度随时间的变化曲线等。
具体地,第二确定装置403可以基于第一确定装置402对于各个用户的每次搜索行为的确定结果,来进行统计,从而获得第一确定装置402所确定的各个金融实体的所对应的用户关注度信息。
可选地,网络设备的装置404,以下简称“发布装置”,可通过网络,在诸如网站、BBS、微信群、微博等各种信息发布平台上,发布由第二确定装置403所确定的每个金融实体所对应的用户关注度信息,或提供给金融机构做进一步数据分析或生成其他金融信息。
在一个优选实施例中,网络设备的第一确定装置402基于所述多个的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体。以下通过两个实例对此进行说明:
实例1:
第一确定装置402包括第一确定模块4021(未示出)与第二确定模块4022(未示出)。
第一确定模块4021通过对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为。
其中,第一确定模块4021通过以下至少任一种方式对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为:
1)通过对所述多个用户的每次搜索行为中查询序列进行语义分析,来确定该次搜索行为是否具有金融需求;
具体地,当发现查询序列中包含某些语义与金融需求相关的关键词,则可以确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的关键词的数量和/或级别来确定第一金融需求数值D1;
2)通过对所述多个用户的每次搜索行为中所开启的页面中内容进行分析,来确定该次搜索行为是否具有金融需求;
具体地,当对于所开启页面的内容进行分析,发现其中包含某些语义与金融属性有关的词语或句子,则可已确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的词语或句子的数量和/或级别来确定第二金融需求数值D2
3)通过对所述多个用户的每次搜索行为中所开启的网络站点的属性,来确定该次搜索行为是否具有金融需求;
具体地,当确定该等网络站点具有金融属性,则可推导出该次搜索行文具有金融需求;或根据所述站点的金融属性级别来确定第三金融需求数值。
具体地,第一确定模块4021可基于以下公式来通过上述方式确定搜索行为是否具有金融需求:
D(n)=a*D1(n)+b*D2(n)+c*D3(n) (1)
其中,n指一个用户的第n次搜索行为,a,b,c为上述三种方式的权重数值,D(n)为该用户第n次搜索行为的金融需求数值。
基于以上公式(1),第一确定模块4021可以确定第n次搜索行为:
-具有金融需求,当D(n-1)≥预定阈值T;
-不具有金融需求,当D(n-1)<预定阈值T;
优选地,第一确定模块4021还可基于所述多个用户的每次搜索行为,结合该搜索行为的在先搜索行为,来确定该次搜索行为是否具有金融需求。简言之,如果一个用户的在先搜索行为被确定具有金融需求且达到一定比例或根据公式(1)所确定的金融需求数值超过预定阈值,则其后续的搜索行为具有金融需求的可能性也较大。具体地,第一确定模块4021可以基于以下公式来基于一个用户的在先搜索行为来确定当前搜索行为是否具有金融需求:
D(n)’=(1+f(D(n-1))*a)*D(n) (2)
其中:
D(n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-1)=1,当D(n-1)≥预定阈值T;
f(D(n-1)=0,当D(n-1)<预定阈值T;
上述公式仅为例举而非限制性,本领域技术人员应理解还有其他基于本发明构思的公式可用于确定用户搜索行为是否具有金融需求,其也应落入本发明保护范围,并以引用方式包含于此。另外,本领域技术人员应可基于本发明上述构思,通过统计分析并结合实际情况来确定合适的预定阈值T。
随后,第二确定模块4022通过对在第一确定模块4021所确定的多个用户的具有金融需求的用户搜索行为信息进行分析,来确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
实例2:
第一确定装置402包括第三确定模块4021’(未示出)与第四确定模块4022‘(未示出)
第三确定模块4021’通过对所述多个用户的用户搜索行为信息进行分析,来确定所述多个用户的每次搜索行为对应的金融实体;
随后,第四确定模块4022’通过对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为,从而确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
同样地,其中,第四确定模块4022’可通过以下至少任一种方式对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为:
1)通过对所述多个用户的每次搜索行为中查询序列进行语义分析,来确定该次搜索行为是否具有金融需求;
具体地,当发现查询序列中包含某些语义与金融需求相关的关键词,则可以确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的关键词的数量和/或级别来确定第一金融需求数值D1;
2)通过对所述多个用户的每次搜索行为中所开启的页面中内容进行分析,来确定该次搜索行为是否具有金融需求;
具体地,当对于所开启页面的内容进行分析,发现其中包含某些语义与金融属性有关的词语或句子,则可已确定该次搜索行为具有金融需求;或者也可根据该等语义与金融需求相关的词语或句子的数量和/或级别来确定第二金融需求数值D2
3)通过对所述多个用户的每次搜索行为中所开启的网络站点的属性,来确定该次搜索行为是否具有金融需求;
具体地,当确定该等网络站点具有金融属性,则可推导出该次搜索行文具有金融需求;或根据所述站点的金融属性级别来确定第三金融需求数值。
具体地,第四确定模块4022’基于以下公式来通过上述方式确定搜索行为是否具有金融需求:
D(n)=a*D1(n)+b*D2(n)+c*D3(n) (1)
其中,n指一个用户的第n次搜索行为,a,b,c为上述三种方式的权重数值,D(n)为该用户第n次搜索行为的金融需求数值。
基于以上公式(1),第四确定模块4022’可以确定第n次搜索行为:
-具有金融需求,当D(n-1)≥预定阈值T;
-不具有金融需求,当D(n-1)<预定阈值T;
优选地,第四确定模块4022’还可基于所述多个用户的每次搜索行为,结合该搜索行为的在先搜索行为,来确定该次搜索行为是否具有金融需求。简言之,如果一个用户的在先搜索行为被确定具有金融需求且达到一定比例或根据公式(1)所确定的金融需求数值超过预定阈值,则其后续的搜索行为具有金融需求的可能性也较大。具体地,第四确定模块4022’可以基于以下公式来基于一个用户的在先搜索行为来确定当前搜索行为是否具有金融需求:
D(n)’=(1+f(D(n-1))*a)*D(n) (2)
其中:
D(n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-1)=1,当D(n-1)≥预定阈值T;
f(D(n-1)=0,当D(n-1)<预定阈值T;
上述公式仅为例举而非限制性,本领域技术人员应理解还有其他基于本发明构思的公式可用于确定用户搜索行为是否具有金融需求,其也应落入本发明保护范围,并以引用方式包含于此。另外,本领域技术人员基于本发明上述构思,通过统计分析并结合实际情况来确定合适的预定阈值T。
接着,第二确定装置403基于所确定的所述多个用户的每次具有金融需求的搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。
具体地,第二确定装置403可以基于第一确定装置402对于各个用户的每次具有金融需求的搜索行为的确定结果,来进行统计,从而获得第一确定装置402所确定的各个金融实体的所对应的用户关注度信息。
可选地,网络设备的发布装置404可通过网络,在诸如网站、BBS、微信群、微博等各种信息发布平台上,发布由第二确定装置403所确定的每个金融实体所对应的用户关注度信息,或提供给金融机构做进一步数据分析或生成其他金融信息。
本领域技术人员应理解上述参照图4描述的实施例中网络设备中的各个装置或模块可以是各自分离的模块,也可全部或部分地集成在单个装置中。
图5示出根据本发明一个实施例的基于用户搜索行为来为用户提供金融实体信息的方法流程图。
下面参照图5来对该实施例进行描述:
网络设备中的装置501,以下简称“第一获取装置”,获取多个用户的搜索行为信息。
其中,多个用户的搜索行为信息包括以下至少任一项:各个用户的查询序列、各个用户对于响应于查询序列所获得的搜索结果的点击、访问等操作信息、各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行交互的网络设备预先获取并存储于一存储设备中。获取装置501网络设备通过访问该存储设备来读取所述多个用户的搜索行为信息。其中,该存储设备可以是与该网络设备成一体或独立于该网络设备2。
网络设备的装置502,以下检查“第三确定装置”,基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征。其中,用户的金融需求相关特征包括以下至少任一项:用户所关注的金融细分领域F、用户的金融需求强度S、用户的金融需求级别P。具体地:
对于用户所关注的金融细分领域,第三确定装置502可以通过对各个用户的查询序列、和/或各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户关注的金融细分领域。例如,当发现查询序列、和/或用户点击的搜索结果和/或页面内容中包含某些语义与金融细分领域相关的关键词,则可确定用户关注的金融细分领域F(1),F(2),F(3)…。
对于用户的金融需求强度,第三确定模块502可以通过对各个用户的查询序列、和/或各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户的金融需求强度。例如,根据查询序列、和/或用户点击的搜索结果、和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求强度S。
对于用户的金融需求级别,第三确定模块502可以通过对各个用户的查询序列、和/或各个用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或各个用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户的金融需求级别。例如,根据查询序列、和/或用户点击的搜索结果和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求级别P。
优选地,第三确定模块502包含筛选模块5021(未示出)与确定模块5022(未示出)。
其中,筛选模块5021通过对所述多个用户的搜索行为信息进行初始需求分析来筛选具有金融需求的多个用户,该初始需求分析的方式与前面参照图4描述的实施例中确定用户搜索行为是否具有金融需求的方式相同,为简明起见,以引用方式包含于此,而不做赘述;
随后,确定模块5022基于所述具有金融需求的各个用户的搜索行为来确定各个用户的金融需求相关特征,其中,确定各个具有金融需求的用户的金融需求相关特征的方式与前面步骤S202中确定各个用户的金融需求相关特征的方式相同,为简明起见,以引用方式包含于此,而不做赘述。
优选地,第三确定模块502可基于各个用户的搜索行为,并结合各个用户的自然属性,来确定各个用户的金融需求相关特征。
其中,用户的自然属性包括以下至少任一项:所述用户的年龄;所述用户的性别;所述用户的职业;所述用户的消费水平;所述用户所处地域。
网络设备的装置503,以下简称“划分装置”,根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群,每个用户群具有相应的金融需求相关特征。
网络设备的装置504,以下检查“匹配装置”,通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,确定每个用户群对应的金融实体。其中,本领域技术人员应理解,匹配装置504的操作与划分装置503的操作在时间上是独立的,也即匹配装置504的操作无需在时间上紧跟划分装置503的操作。
可选地,网络设备的发布装置510(未示出)可通过网络,在诸如网站、BBS、微信群、微博等各种信息发布平台上,发布由匹配装置504所确定的每个用户群对应的金融实体信息,或提供给金融机构做进一步数据分析或生成其他金融信息。
本领域技术人员应理解上述参照图6描述的实施例中网络设备中的各个装置或模块可以是各自分离的模块,也可全部或部分地集成在单个装置中。
图6示出根据本发明另一个实施例的基于用户搜索行为来为用户提供金融实体信息的方法流程图。
下面参照图6对该实施例进行描述:
其中,图6中装置601至604及610(未示出)与图5中所示装置501至504及510所执行的操作相同,未简明起见,以引用方式包含于此,而不做赘述。
网络设备的第二获取装置605获取一个用户的搜索行为信息。其中,本领域技术人员应理解第一获取装置601与第二获取装置605可以是同一装置或不同装置。
其中,该用户的搜索行为信息包括以下至少任一项:该用户的查询序列、该用户对于响应于查询序列所获得的搜索结果的点击、访问等操作信息、该用户通过点击搜索结果后访问的页面。
该用户的搜索行为信息是由网络设备通过与该用户的用户设备进行交互而实时获取;或者是由网络设备或其他与该用户的用户设备进行交互的网络设备预先获取并存储于一存储设备中,第二获取装置605网络设备通过访问该存储设备来读取该用户的搜索行为信息。其中,该存储设备可以是与该网络设备成一体或独立于该网络设备。
网络设备的装置606,以下简称“第四确定装置”,基于该用户的搜索行为信息来确定该用户的金融需求相关特征。本领域技术人员应理解第三确定装置601与第二获取装置605可以是同一装置或不同装置。其中,用户的金融需求相关特征包括以下至少任一项:用户所关注的金融细分领域F、用户的金融需求强度S、用户的金融需求级别P。具体地:
对于该用户所关注的金融细分领域,第四确定装置606可以通过对该用户的查询序列、和/或该用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或该用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定用户关注的金融细分领域。例如,当发现查询序列、和/或该用户点击的搜索结果、和/或页面内容中包含某些语义与金融细分领域相关的关键词,则可确定该用户关注的金融细分领域F(1),F(2),F(3)…。
对于该用户的金融需求强度,第四确定装置606可以通过对该用户的查询序列、和/或该用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或该用户通过点击搜索结果后访问的页面等搜索行为信息进行分析,来确定该用户的金融需求强度。例如,根据查询序列、和/或该用户点击的搜索结果、和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求强度S。
对于该用户的金融需求级别,第四确定装置606可以通过对该用户的查询序列、和/或该用户对响应查询序列反馈的搜索结果中的一个或多个搜索结果的诸如点击或访问等操作、和/或该用户通过点击搜索结果后访问的页面进行分析,来确定该用户的金融需求级别。例如,根据查询序列、和/或该用户点击的搜索结果、和/或页面内容中包含的与金融需求强度相关的关键词的数量和/或级别,可以确定该用户的金融需求级别P。
随后,网络设备的装置607,以下简称“第五确定装置”,基于该用户的金融需求相关特征及所确定的多个用户群的金融需求相关特征,来确定该用户所归属的用户群,从而确定该用户对应的金融实体,用于提供给该用户。
具体地,第五确定装置607通过将第四确定装置606所确定的该用户的金融需求相关特征的各项与各个用户群的金融需求相关特征的各项进行对比,如果发现该用户与某一用户群的金融需求相关特征的各项之差均在预定范围内,则可确定该用户属于该用户群,从而可将该用户群对应的金融实体作为该用户对应的金融实体。
除上述方式以外,本领域技术人员应理解还可由其他基于本发明构思的用于确定该用户所归属用户群的方式,其也应落入本发明保护范围,并以引用方式包含于此。
本领域技术人员应理解上述装置605-607与装置601-604之间是时间上独立的,也即装置605-607所执行的操作无需在时间上紧跟装置601-604的操作。
本领域技术人员应理解上述参照图6描述的实施例中网络设备中的各个装置或模块可以是各自分离的模块,也可全部或部分地集成在单个装置中。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (24)

1.一种用于进行金融数据挖掘的方法,其中,该方法包括以下步骤:
-获取多个用户的搜索行为信息;
-基于所述多个用户的搜索行为信息来确定所述多个用户的搜索行为对应的金融实体,包括:基于所述多个用户的搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体;
其中,该方法还包括:
-基于所确定的所述多个用户的每次具有金融需求的搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息;
所述基于所述多个用户的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的步骤包括:
-对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为。
2.根据权利要求1所述的方法,其中,所述基于所述多个用户的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的步骤还包括:
-通过对所确定的多个用户的具有金融需求的用户搜索行为信息进行分析,来确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
3.根据权利要求1所述的方法,其中,所述基于所述多个用户的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的步骤还包括:
-通过对所述多个用户的用户搜索行为信息进行分析,来确定所述多个用户的每次搜索行为对应的金融实体,从而确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
4.根据权利要求2或3所述的方法,其中,所述对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为的步骤包括以下至少任一种方式:
-通过对所述多个用户的每次搜索行为中查询序列进行语义分析,来确定该次搜索行为是否具有金融需求;
-通过对所述多个用户的每次搜索行为中所开启的页面中内容进行分析,来确定该次搜索行为是否具有金融需求;
-通过对所述多个用户的每次搜索行为中所开启的网络站点的属性,来确定该次搜索行为是否具有金融需求。
5.根据权利要求4所述的方法,其中,所述对所述多个用户的搜索行为信息进行初始需求分析来筛选所述多个用户的具有金融需求的搜索行为的步骤包括:
-基于所述多个用户的每次搜索行为,结合该搜索行为的在先搜索行为,来确定该次搜索行为是否具有金融需求。
6.根据权利要求1至5中任一项所述的方法,还包括:
-发布确定所确定的金融实体的每一个所对应的用户关注度信息。
7.一种用于为用户提供金融实体信息的方法,其中,该方法包括:
-获取多个用户的搜索行为信息;
-基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征,包括:通过对所述多个用户的搜索行为信息进行初始需求分析来筛选具有金融需求的多个用户,基于所述具有金融需求的各个用户的搜索行为来确定各个用户的金融需求相关特征;
-根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群,每个用户群具有相应的金融需求相关特征;
其中,该方法还包括:
-通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,确定每个用户群对应的金融实体。
8.根据权利要求7所述的方法,其中,还包括:
-获取一个用户的搜索行为信息;
-基于该用户的搜索行为信息来确定该用户的金融需求相关特征;
-基于该用户的金融需求相关特征及所确定的多个用户群的金融需求相关特征,来确定该用户所归属的用户群,从而确定该用户对应的金融实体。
9.根据权利要求7或8所述的方法,其中,所述基于各个用户的搜索行为来确定各个用户的金融需求相关特征的步骤包括:
-基于各个用户的搜索行为,并结合各个用户的自然属性,来确定各个用户的金融需求相关特征。
10.根据权利要求9所述的方法,其中,所述用户的自然属性包括以下至少任一项:所述用户的年龄;所述用户的性别;所述用户的职业;所述用户的消费水平;所述用户所处地域。
11.根据权利要求7至10中任一项所述的方法,其中,还包括:
-发布所确定的每个用户群对应的金融实体。
12.一种用于进行金融数据挖掘的装置,其中,包括:
用于获取多个用户的搜索行为信息的装置;
用于基于所述多个的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的装置;
其中,还包括:
用于基于所确定的所述多个用户的每次具有金融需求的搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息的装置;
所述基于所述多个用户的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的装置包括:
第一确定模块,用于通过对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为。
13.根据权利要求12所述的装置,其中,所述基于所述多个用户的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的装置还包括:
第一确定模块,用于通过对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为;
第二确定模块,用于通过对所确定的多个用户的具有金融需求的用户搜索行为信息进行分析,来确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
14.根据权利要求12所述的装置,其中,所述基于所述多个用户的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为对应的金融实体的装置还包括:
第三确定模块,用于通过对所述多个用户的用户搜索行为信息进行分析,来确定所述多个用户的每次搜索行为对应的金融实体,从而确定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
15.根据权利要求13或14所述的装置,其中,所述对所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜索行为的装置通过以下至少任一种方式来确定每次搜索行为是否具有金融需求:
-通过对所述多个用户的每次搜索行为中查询序列进行语义分析,来确定该次搜索行为是否具有金融需求;
-通过对所述多个用户的每次搜索行为中所开启的页面中内容进行分析,来确定该次搜索行为是否具有金融需求;
-通过对所述多个用户的每次搜索行为中所开启的网络站点的属性,来确定该次搜索行为是否具有金融需求。
16.根据权利要求15所述的装置,其中,所述对所述多个用户的搜索行为信息进行初始需求分析来筛选所述多个用户的具有金融需求的搜索行为的装置还用于:
-基于所述多个用户的每次搜索行为,结合该搜索行为的在先搜索行为,来确定该次搜索行为是否具有金融需求。
17.根据权利要求12至16中任一项所述的装置,还包括:
用于发布确定所确定的金融实体的每一个所对应的用户关注度信息的装置。
18.一种用于为用户提供金融实体信息的装置,其中,包括:
用于获取多个用户的搜索行为信息的装置;
用于基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征的装置;
用于根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群的装置,其中,每个用户群具有相应的金融需求相关特征;
用于通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,来确定每个用户群对应的金融实体的装置;
其中,所述基于所述多个用户的搜索行为信息来确定每个用户的金融需求相关特征的装置包括:
筛选模块,用于通过对所述多个用户的搜索行为信息进行初始需求分析来筛选具有金融需求的多个用户;
确定模块,用于基于所述具有金融需求的各个用户的搜索行为来确定各个用户的金融需求相关特征。
19.根据权利要求18所述的装置,其中,还包括:
用于获取一个用户的搜索行为信息的装置;
用于基于该用户的搜索行为信息来确定该用户的金融需求相关特征的装置;
用于基于该用户的金融需求相关特征及所确定的多个用户群的金融需求相关特征,来确定该用户所归属的用户群,从而确定该用户对应的金融实体的装置。
20.根据权利要求18或19所述的装置,其中,所述基于各个用户的搜索行为来确定各个用户的金融需求相关特征的装置还用于:
基于各个用户的搜索行为,并结合各个用户的自然属性,来确定各个用户的金融需求相关特征。
21.根据权利要求20所述的装置,其中,所述用户的自然属性包括以下至少任一项:所述用户的年龄;所述用户的性别;所述用户的职业;所述用户的消费水平;所述用户所处地域。
22.根据权利要求18-21中任一项所述的装置,其中,还包括:
用于发布所确定的每个用户群对应的金融实体的装置。
23.一种计算机设备,包括如权利要求12至17中任一项所述的用于进行金融数据挖掘的装置,和/或,如权利要求18至22中任一项所述的用于为用户提供金融实体信息的装置。
24.一种计算机可读取介质,其上存储有指令代码,当所述指令代码被计算机设备执行时,可使得计算机设备执行如权利要求1至6中任一项所述的方法,和/或,如权利要求7至11中任一项所述的方法。
CN201480038221.6A 2014-06-25 2014-06-25 一种基于用户搜索行为进行数据挖掘的方法和装置 Active CN105556514B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/080757 WO2015196397A1 (zh) 2014-06-25 2014-06-25 一种基于用户搜索行为进行数据挖掘的方法和装置

Publications (2)

Publication Number Publication Date
CN105556514A CN105556514A (zh) 2016-05-04
CN105556514B true CN105556514B (zh) 2020-11-20

Family

ID=54936464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480038221.6A Active CN105556514B (zh) 2014-06-25 2014-06-25 一种基于用户搜索行为进行数据挖掘的方法和装置

Country Status (5)

Country Link
US (1) US10896461B2 (zh)
EP (1) EP3163465A4 (zh)
JP (1) JP6173586B2 (zh)
CN (1) CN105556514B (zh)
WO (1) WO2015196397A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862532B (zh) * 2016-09-22 2021-11-26 腾讯科技(深圳)有限公司 一种用户特征提取方法及相关装置
CN113535813B (zh) * 2021-06-30 2023-07-28 北京百度网讯科技有限公司 一种数据挖掘方法、装置、电子设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101420313A (zh) * 2007-10-22 2009-04-29 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN102354385A (zh) * 2011-09-07 2012-02-15 宇龙计算机通信科技(深圳)有限公司 移动终端、服务器和证券信息推送方法
CN103020843A (zh) * 2012-12-05 2013-04-03 南京财汇智集网络科技发展有限公司 一种金融信息交互及推送方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6981040B1 (en) 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US8301535B1 (en) * 2000-09-29 2012-10-30 Power Financial Group, Inc. System and method for analyzing and searching financial instrument data
JP3635260B2 (ja) * 2001-12-28 2005-04-06 株式会社野村総合研究所 キーワード分析システム
JP2004185220A (ja) * 2002-12-02 2004-07-02 Nri & Ncc Co Ltd キーワード抽出システム
US8232962B2 (en) * 2004-06-21 2012-07-31 Trading Technologies International, Inc. System and method for display management based on user attention inputs
CN1967579A (zh) * 2006-02-13 2007-05-23 湖南大学 金融风险管理辅助挖掘分析系统
US20070260597A1 (en) * 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US8442973B2 (en) * 2006-05-02 2013-05-14 Surf Canyon, Inc. Real time implicit user modeling for personalized search
US7752201B2 (en) 2007-05-10 2010-07-06 Microsoft Corporation Recommendation of related electronic assets based on user search behavior
US20100082434A1 (en) * 2008-09-29 2010-04-01 Yahoo! Inc. Personalized search results to multiple people
CA2764496C (en) * 2009-06-05 2018-02-27 Wenhui Liao Feature engineering and user behavior analysis
US20110137913A1 (en) * 2009-12-08 2011-06-09 Shahzad Bhatti Systems and Methods for Interest-Driven Stock market Segmentation and Stock Trading
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备
JP5467061B2 (ja) * 2011-01-06 2014-04-09 日本電信電話株式会社 バースト情報検索装置及びバースト情報検索プログラム
JP5451673B2 (ja) * 2011-03-28 2014-03-26 ヤフー株式会社 検索ランキング生成装置及び方法
CN102903047A (zh) * 2011-07-26 2013-01-30 阿里巴巴集团控股有限公司 一种商品信息投放方法和设备
JP5831204B2 (ja) * 2011-12-21 2015-12-09 大日本印刷株式会社 情報提供システム、情報提供方法及びプログラム
JP5805548B2 (ja) * 2012-01-20 2015-11-04 日立マクセル株式会社 情報処理装置、及び、情報処理方法
CN103778553A (zh) * 2012-10-26 2014-05-07 腾讯科技(深圳)有限公司 一种商品属性推荐方法及系统
US20140172564A1 (en) * 2012-12-17 2014-06-19 Facebook, Inc. Targeting objects to users based on queries in an online system
CN103399883B (zh) * 2013-07-19 2017-02-08 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN103473354A (zh) 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101420313A (zh) * 2007-10-22 2009-04-29 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN102354385A (zh) * 2011-09-07 2012-02-15 宇龙计算机通信科技(深圳)有限公司 移动终端、服务器和证券信息推送方法
CN103020843A (zh) * 2012-12-05 2013-04-03 南京财汇智集网络科技发展有限公司 一种金融信息交互及推送方法

Also Published As

Publication number Publication date
JP2016526747A (ja) 2016-09-05
CN105556514A (zh) 2016-05-04
US20170109816A1 (en) 2017-04-20
EP3163465A4 (en) 2018-03-14
US10896461B2 (en) 2021-01-19
WO2015196397A1 (zh) 2015-12-30
JP6173586B2 (ja) 2017-08-02
EP3163465A1 (en) 2017-05-03

Similar Documents

Publication Publication Date Title
Zhao et al. Reducing quantity hallucinations in abstractive summarization
Alam et al. Processing social media images by combining human and machine computing during crises
CN106940705B (zh) 一种用于构建用户画像的方法与设备
Mohammadi et al. M endeley readership altmetrics for the social sciences and humanities: Research evaluation and knowledge flows
KR102102013B1 (ko) 사용자 제출물들에 기초한 컨텐트 배달의 조절
US8543576B1 (en) Classification of clustered documents based on similarity scores
CN110489558B (zh) 文章聚合方法和装置、介质和计算设备
Guo et al. LDA-based online topic detection using tensor factorization
CN105677844A (zh) 一种移动广告大数据的定向推送及用户跨屏识别方法
US8423551B1 (en) Clustering internet resources
US9177554B2 (en) Time-based sentiment analysis for product and service features
Armann-Keown et al. Content analysis in library and information research: An analysis of trends
DE102016125767A1 (de) Entdeckung einer verbundenen Entität
Lee et al. Leveraging microblogging big data with a modified density-based clustering approach for event awareness and topic ranking
US11755663B2 (en) Search activity prediction
Helles et al. Infrastructures of tracking: Mapping the ecology of third-party services across top sites in the EU
CN104615723B (zh) 查询词权重值的确定方法和装置
US9613012B2 (en) System and method for automatically generating keywords
CN105556514B (zh) 一种基于用户搜索行为进行数据挖掘的方法和装置
Araújo et al. Tensorcast: forecasting time-evolving networks with contextual information
US9317871B2 (en) Mobile classifieds search
Nguyen et al. Estimating county health indices using graph neural networks
Gao et al. Twitter hyperlink recommendation with user-tweet-hyperlink three-way clustering
Xu et al. Generating risk maps for evolution analysis of societal risk events
US20220004718A1 (en) Ontology-Driven Conversational Interface for Data Analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20191122

Address after: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer 2

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Address before: 100085 B building, block 5, building 10, ten Street, Haidian District, Beijing,

Applicant before: BEIJING BAIDUPAY SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20160504

Assignee: BEIJING BAIDUPAY SCIENCE AND TECHNOLOGY Co.,Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: X2020990000187

Denomination of invention: Method and device for data mining based on user's search behaviour

License type: Common License

Record date: 20200417

EE01 Entry into force of recordation of patent licensing contract
GR01 Patent grant
GR01 Patent grant