CN105556514A - 一种基于用户搜索行为进行数据挖掘的方法和装置 - Google Patents

一种基于用户搜索行为进行数据挖掘的方法和装置 Download PDF

Info

Publication number
CN105556514A
CN105556514A CN201480038221.6A CN201480038221A CN105556514A CN 105556514 A CN105556514 A CN 105556514A CN 201480038221 A CN201480038221 A CN 201480038221A CN 105556514 A CN105556514 A CN 105556514A
Authority
CN
China
Prior art keywords
user
financial
search behavior
demands
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480038221.6A
Other languages
English (en)
Other versions
CN105556514B (zh
Inventor
刘成
杨骏
贾云飞
张驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidupay Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidupay Science And Technology Co ltd filed Critical Beijing Baidupay Science And Technology Co ltd
Publication of CN105556514A publication Critical patent/CN105556514A/zh
Application granted granted Critical
Publication of CN105556514B publication Critical patent/CN105556514B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Abstract

本发明提供了一种基于用户搜索行为进行数据挖掘的方法。根据本发明的一个方面,提供一种用于提供金融数据挖掘的方法,其中,该方法包括以下步骤:获取多个用户的搜索行为信息;基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金融实体;其中,该方法还包括:基于所确定的所述多个用户的每次搜索行为对应的金融实体,来确定所确定的金融实体的每一个所对应的用户关注度信息。根据本发明的另一方面,提供了一种用于为用户提供金融实体信息的方法,其中,该方法包括:获取多个用户的搜索行为信息;基于所述各个用户的搜索行为信息来确定各个用户的金融需求相关特征;根据所述确定的各个用户的金融需求相关特征,来将所述多个用户分为多个用户群,每个用户群具有相应的金融需求相关特征;其中,该方法还包括:通过将每个用户群的金融需求相关特征与多个金融实体的实体特征进行匹配,确定每个用户群对应的金融实体。与现在技术比,本发明通过利用用户搜索行为的数据挖掘,获得用户所关注的金融实体信息,可以为金融机构提供符合用户需求的金融实体来提供准确、客观的数据支持,也可为用户提供符合其实际需求的金融实体。

Description

一种基于用户搜索行为进行数据挖掘的方法和装置
技术领域
本发明涉及对数据分析领域, 尤其涉及基于用户搜索行为来进行 数据挖掘的方法。 背景技术
大数据挖掘是当前辄待发展的前沿技术。 如何通过对大量用户的 行为数据, 尤其是海量用户的搜索行为, 进行挖掘分析以确定用户的 需求是当前计算机领域的难题。 发明内容
本发明的目的是提供一种基于用户搜索行为进行数据挖掘的方法。 根据本发明的一个方面, 提供一种用于提供金融数据挖掘的方 法, 其中, 该方法包括以下步骤:
- 获取多个用户的搜索行为信息;
-基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行 为对应的金融实体;
其中, 该方法还包括:
-基于所确定的所述多个用户的每次搜索行为对应的金融实体, 来 确定所确定的金融实体的每一个所对应的用户关注度信息。 根据本发明的另一方面, 提供了一种用于为用户提供金融实体信 息的方法, 其中, 该方法包括:
- 获取多个用户的搜索行为信息;
-基于所述各个用户的搜索行为信息来确定各个用户的金融需求相 关特征;
-根据所述确定的各个用户的金融需求相关特征, 来将所述多个用 户分为多个用户群, 每个用户群具有相应的金融需求相关特征; 其中, 该方法还包括:
- 通过将每个用户群的金融需求相关特征与多个金融实体的实体特 征进行匹配, 确定每个用户群对应的金融实体。 根据本发明的另一方面, 提供了一种用于进行金融数据挖掘的装 置, 其中, 包括:
用于获取多个用户的搜索行为信息;
用于基于所述多个的用户搜索行为信息来确定所述多个用户的搜索 行为对应的金融实体的装置;
其中, 还包括:
用于基于所确定的所述多个用户的每次搜索行为对应的金融实体, 来确定所确定的金融实体的每一个所对应的用户关注度信息的装置。 根据本发明的另一个方面, 提供了一种用于为用户提供金融实体 信息的装置, 其中, 包括:
用于获取多个用户的搜索行为信息的装置;
用于基于所述各个用户的搜索行为信息来确定各个用户的金融需求 相关特征的装置;
用于根据所述确定的各个用户的金融需求相关特征, 来将所述多个 用户分为多个用户群的装置, 其中, 每个用户群具有相应的金融需求 相关特征;
用于通过将每个用户群的金融需求相关特征与多个金融实体的实体 特征进行匹配, 来确定每个用户群对应的金融实体的装置。 与现在技术比, 本发明通过利用用户搜索行为的数据挖掘, 获得 用户所关注的金融实体信息, 可以为金融机构提供符合用户需求的金 融实体来提供准确、 客观的数据支持, 也可为用户提供符合其实际需 求的金融实体信息。 附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述, 本发明的其它特征、 目的和优点将会变得更明显:
图 1示出据本发明一个实施例的的基于用户搜索行为来进行数据挖 掘以确定各个金融实体的用户关注度信息的方法流程图;
图 2示出根据本发明一个实施例的基于用户搜索行为来为用户提供 金融实体信息的方法流程图;
图 3示出示出根据本发明另一个实施例的基于用户搜索行为来为用 户提供金融实体信息的方法流程图;
图 4示出据本发明一个实施例的的基于用户搜索行为来进行数据挖 掘以确定各个金融实体的用户关注度信息的装置示意图;
图 5示出根据本发明一个实施例的基于用户搜索行为来为用户提供 金融实体信息的装置示意图;
图 6示出示出根据本发明另一个实施例的基于用户搜索行为来为用 户提供金融实体信息的装置示意图。
附图中相同或相似的附图表示相同的部件。 具体实施方式
下面结合附图对本发明作进一步详细描述。
名称定义
"金融机构"指与金融业务有关的机构或企业, 如银行、 金融中介 机构 (券商、 金融服务公司)、 投资机构 (如公募基金、 私募基金)、 保险公司、 金融租赁机构等;
"金融实体"指特定的金融产品或金融信息, 例如, 银行理财产品 信息、二级市场的上市公司股票信息、保险公司的特定保险产品等等。
"用户设备"指由用户使用的终端设备, 包括但不限于 PC机、 平 板电脑、 智能手机、 PDA, IPTV等。
"网络设备"指连接在网络上并可基于网络发送或接收信息的计 算机设备, 包括但不限于单个网络服务器、 多个网络服务器组成的服 务器组或基于去计算(Cloud Computing )的由大量计算机或网络服务 器构成的云, 其中, 云计算是分布式计算的一种, 由一群松散耦合的 计算机集组成的一个超级虚拟计算机。
"网络"指连接不同计算机设备并提供数据传输的网络, 包括但不 限于互联网、 广域网、 城域网、 局域网、 VPN网络等。
本领域技术人员应理解上述用户设备、 网络设备和网络仅为举 例, 其他现有的或今后可能出现的计算设备或网络如可适用于本发 明, 也应包含在本发明保护范围以内, 并以引用方式包含于此; 图 1示出根据本发明一个实施例的基于用户搜索行为来进行数据 挖掘以确定各个金融实体的用户关注度信息的方法流程图。
下面参照图 1来对所述实施例进行描述:
如图 1所示, 在步骤 S101 中, 网络设备 2获取多个用户的搜索 行为信息。
其中, 多个用户的搜索行为信息包括以下至少任一项: 各个用 户的查询序列、 各个用户对于响应于查询序列所获得的搜索结果的 点击、 访问等操作信息、 各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行 交互的网络设备预先获取并存储于一存储设备中。 网络设备通过访 问该存储设备来读取所述多个用户的搜索行为信息。 其中, 该存储 设备可以是与该网络设备成一体或独立于该网络设备。 在步骤 S102中, 网络设备基于所述多个的用户搜索行为信息来确 定所述多个用户的搜索行为对应的金融实体。
具体地, 对于各个用户的每次搜索行为, 网络设备 2可以通过对各 个用户的查询序列、 各个用户对响应查询序列反馈的搜索结果中的一 个或多个搜索结果的诸如点击或访问等操作、 和 /或各个用户通过点击 搜索结果后访问的页面进行分析, 来确定该次搜索行为对应的金融实 随后, 在步骤 S103 中, 网络设备基于所确定的所述多个用户的每 次搜索行为对应的金融实体, 来确定所确定的金融实体的每一个所对 应的用户关注度信息。 其中, 用户关注度信息包括但不限于以下至少 任一项: 用户关注总次数、 在一定时间周期内的用户关注度次数或用 户关注频度、 用户关注频度随时间的变化曲线等。
具体地, 网络设备可以基于步骤 S102 中对于各个用户的每次搜索 行为的确定结果, 来进行统计, 从而获得在步骤 S102 中所确定的各个 金融实体的所对应的用户关注度信息。 可选地, 在步骤 S104 中, 网络设备可通过网络, 在诸如网站、 BBS, 微信群、 微博等各种信息发布平台上, 发布在步骤 S203 中所确 定的每个金融实体所对应的用户关注度信息, 或提供给金融机构做进 一步数据分析或生成其他金融信息。 在一个优选实施例中, 在步骤 S102 中, 网络设备基于所述多个的 用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行 为对应的金融实体。 以下通过两个实例对此进行说明:
实例 1 :
在步骤 S1021(未示出)中, 网络设备 2通过对所述多个用户的搜索 行为信息进行初始需求分析来确定所述多个用户的具有金融需求的搜 索行为。
其中, 对所述多个用户的搜索行为信息进行初始需求分析来确定 所述多个用户的具有金融需求的搜索行为的步骤包括以下至少任一种 方式:
1 )通过对所述多个用户的每次搜索行为中查询序列进行语义分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当发现查询序列中包含某些语义与金融需求相关的关键 词, 则可以确定该次搜索行为具有金融需求; 或者也可根据该等语义 与金融需求相关的关键词的数量和 /或级别来确定第一金融需求数值
D1 ;
2 )通过对所述多个用户的每次搜索行为中所开启的页面中内容进行 分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当对于所开启页面的内容进行分析, 发现其中包含某些语 义与金融属性有关的词语或句子, 则可已确定该次搜索行为具有金融 需求; 或者也可根据该等语义与金融需求相关的词语或句子的数量和 / 或级别来确定第二金融需求数值 D2
3) 通过对所述多个用户的每次搜索行为中所开启的网络站点的属 性, 来确定该次搜索行为是否具有金融需求;
具体地, 当确定该等网络站点具有金融属性, 则可推导出该次搜 索行文具有金融需求; 或根据所述站点的金融属性级别来确定第三金 融需求数值。
具体地, 网络设备可基于以下公式来通过上述方式确定搜索行为 是否具有金融需求:
D(n)=a*Dl(n)+b*D2(n)+c*D3(n) (1)
其中, n指一个用户的第 n次搜索行为, a, b, c为上述三种方式的权 重数值, D(n)为该用户第 n次搜索行为的金融需求数值。
基于以上公式(1 ) , 网络设备可以确定第 n次搜索行为:
- 具有金融需求, 当 0(1 -1)≥预定阈值 T;
- 不具有金融需求, 当 0(1 -1) <预定阈值 T; 优选地, 网络设备还可基于所述多个用户的每次搜索行为, 结合该 搜索行为的在先搜索行为, 来确定该次搜索行为是否具有金融需求。 简言之, 如果一个用户的在先搜索行为被确定具有金融需求且达到一 定比例或根据公式 (1 ) 所确定的金融需求数值超过预定阈值, 则其后 续的搜索行为具有金融需求的可能性也较大。 具体地, 网络设备可以 基于以下公式来基于一个用户的在先搜索行为来确定当前搜索行为是 否具有金融需求:
D(n)'=(l+f(D(n-l))*a)*D(n) (2)
其中:
D (n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-l)=l , 当 D(n-l)≥i¾定阈值 T;
f(D(n-l)=0, 当 D(n-l) <预定阈值 T; 上述公式仅为例举而非限制性, 本领域技术人员应理解还有其他基 于本发明构思的公式可用于确定用户搜索行为是否具有金融需求, 其 也应落入本发明保护范围, 并以引用方式包含于此。 另外, 本领域技 术人员应可基于本发明上述构思, 通过统计分析并结合实际情况来确 定合适的预定阈值 T。 随后, 在步骤 S1022(未示出), 网络设备通过对在步骤 S1021 中所 确定的多个用户的具有金融需求的用户搜索行为信息进行分析, 来确 定所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
实例 2:
在步骤 S 1021 '(未示出)中, 网络设备 2通过对所述多个用户的用户 搜索行为信息进行分析, 来确定所述多个用户的每次搜索行为对应的 金融实体;
随后, 在步骤 S1022' (未示出)中, 网络设备 2通过对所述多个用户 的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需 求的搜索行为, 从而确定所述多个用户的具有金融需求的每次搜索行 为对应的金融实体。
同样地, 其中, 对所述多个用户的搜索行为信息进行初始需求分 析来确定所述多个用户的具有金融需求的搜索行为的步骤包括以下至 少任一种方式: 1 )通过对所述多个用户的每次搜索行为中查询序列进行语义分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当发现查询序列中包含某些语义与金融需求相关的关键 词, 则可以确定该次搜索行为具有金融需求; 或者也可根据该等语义 与金融需求相关的关键词的数量和 /或级别来确定第一金融需求数值
D1 ;
2 )通过对所述多个用户的每次搜索行为中所开启的页面中内容进行 分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当对于所开启页面的内容进行分析, 发现其中包含某些语 义与金融属性有关的词语或句子, 则可已确定该次搜索行为具有金融 需求; 或者也可根据该等语义与金融需求相关的词语或句子的数量和 / 或级别来确定第二金融需求数值 D2
3) 通过对所述多个用户的每次搜索行为中所开启的网络站点的属 性, 来确定该次搜索行为是否具有金融需求;
具体地, 当确定该等网络站点具有金融属性, 则可推导出该次搜 索行文具有金融需求; 或根据所述站点的金融属性级别来确定第三金 融需求数值。
具体地, 网络设备基于以下公式来通过上述方式确定搜索行为是 否具有金融需求:
D(n)=a*Dl(n)+b*D2(n)+c*D3(n) (1)
其中, n指一个用户的第 n次搜索行为, a, b, c为上述三种方式的权 重数值, D(n)为该用户第 n次搜索行为的金融需求数值。
基于以上公式(1 ) , 网络设备 2可以确定第 n次搜索行为:
- 具有金融需求, 当 0(1 -1)≥预定阈值 T;
- 不具有金融需求, 当 0(1 -1) <预定阈值 T; 优选地, 网络设备还可基于所述多个用户的每次搜索行为, 结合该 搜索行为的在先搜索行为, 来确定该次搜索行为是否具有金融需求。 简言之, 如果一个用户的在先搜索行为被确定具有金融需求且达到一 定比例或根据公式 (1 ) 所确定的金融需求数值超过预定阈值, 则其后 续的搜索行为具有金融需求的可能性也较大。 具体地, 网络设备可以 基于以下公式来基于一个用户的在先搜索行为来确定当前搜索行为是 否具有金融需求:
D(n)'=(l+f(D(n-l))*a)*D(n) (2)
其中:
D (n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-l)=l , 当 D(n-l)≥i¾定阈值 T;
f(D(n-l)=0, 当 D(n-l) <预定阈值 T;
上述公式仅为例举而非限制性, 本领域技术人员应理解还可有其他 基于本发明构思的公式可用于确定用户搜索行为是否具有金融需求, 其也应落入本发明保护范围, 并以引用方式包含于此。 另外, 本领域 技术人员基于本发明上述构思, 通过统计分析并结合实际情况来确定 合适的预定阈值丁。 接着, 在步骤 S103中, 网络设备 2基于所确定的所述多个用户的 每次具有金融需求的搜索行为对应的金融实体, 来确定所确定的金融 实体的每一个所对应的用户关注度信息。
具体地, 网络设备可以基于步骤 S102 中对于各个用户的每次具有 金融需求的搜索行为的确定结果, 来进行统计, 从而获得在步骤 S102 中所确定的各个金融实体的所对应的用户关注度信息。 可选地, 在步骤 S104 中, 网络设备可通过网络, 在诸如网站、 BBS, 微信群、 微博等各种信息发布平台上, 发布在步骤 S103 中所确 定的每个金融实体所对应的用户关注度信息, 或提供给金融机构做进 一步数据分析或生成其他金融信息。 图 2示出根据本发明一个实施例的基于用户搜索行为来为用户提供 金融实体信息的方法流程图。
下面参照图 2来对该实施例进行描述:
在步骤 S201中, 网络设备获取多个用户的搜索行为信息。
其中, 多个用户的搜索行为信息包括以下至少任一项: 各个用 户的查询序列、 各个用户对于响应于查询序列所获得的搜索结果的 点击、 访问等操作信息、 各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行 交互的网络设备预先获取并存储于一存储设备中。 网络设备通过访 问该存储设备来读取所述多个用户的搜索行为信息。 其中, 该存储 设备可以是与该网络设备成一体或独立于该网络设备 2。 在步骤 S202 中, 网络设备基于所述各个用户的搜索行为信息来确 定各个用户的金融需求相关特征。 其中, 用户的金融需求相关特征包 括以下至少任一项: 用户所关注的金融细分领域 F、 用户的金融需求强 度 S、 用户的金融需求级别 P。 具体地:
对于用户所关注的金融细分领域, 网络设备可以通过对各个用户 的查询序列、 和 /或各个用户对响应查询序列反馈的搜索结果中的一个 或多个搜索结果的诸如点击或访问等操作、 和 /或各个用户通过点击搜 索结果后访问的页面等搜索行为信息进行分析, 来确定用户关注的金 融细分领域。 例如, 当发现查询序列、 和 /或用户点击的搜索结果、 和 / 或页面内容中包含某些语义与金融细分领域相关的关键词, 则可确定 用户关注的金融细分领域 F(l), F(2), F(3) ...。
对于用户的金融需求强度, 网络设备可以通过对各个用户的查询 序列、 和 /或各个用户对响应查询序列反馈的搜索结果中的一个或多个 搜索结果的诸如点击或访问等操作、 和 /或各个用户通过点击搜索结果 后访问的页面等搜索行为信息进行分析, 来确定用户的金融需求强 度。 例如, 根据查询序列、 和 /或用户点击的搜索结果、 和 /或页面内容 中包含的与金融需求强度相关的关键词的数量和 /或级别, 可以确定该 用户的金融需求强度 S。 对于用户的金融需求级别, 网络设备可以通过对各个用户的查询 序列、 和 /或各个用户对响应查询序列反馈的搜索结果中的一个或多个 搜索结果的诸如点击或访问等操作、 和 /或各个用户通过点击搜索结果 后访问的页面等搜索行为信息进行分析, 来确定用户的金融需求级 别。 例如, 根据查询序列、 和 /或用户点击的搜索结果和 /或页面内容中 包含的与金融需求强度相关的关键词的数量和 /或级别, 可以确定该用 户的金融需求级别 P。 优选地, 步骤 S202包括子步骤 S202K未示出)与 S2022(未示出)。 其中, 在子步骤 S2021中, 网络设备通过对所述多个用户的搜索行 为信息进行初始需求分析来筛选具有金融需求的多个用户, 其中, 对 用户的搜索行为进行初始需求分析的方式与前面参照图 1描述的实施例 中确定用户搜索行为是否具有金融需求的方式相同, 为简明起见, 以 引用方式包含于此, 而不做赞述;
随后, 在子步骤 S2022中, 网络设备基于所述具有金融需求的各个 用户的搜索行为来确定各个具有金融需求的用户的金融需求相关特 征, 其中, 确定确定各个具有金融需求的用户的金融需求相关特征的 方式与前面步骤 S202 中确定各个用户的金融需求相关特征的方式相 同, 为简明起见, 以引用方式包含于此, 而不做赞述。 优选地, 网络设备可基于各个用户的搜索行为, 并结合各个用户 的自然属性, 来确定各个用户的金融需求相关特征。
其中, 用户的自然属性包括以下至少任一项: 所述用户的年龄; 所述用户的性别; 所述用户的职业; 所述用户的消费水平; 所述用户 所处地域。 在步骤 S203 中, 网络设备根据所述确定的各个用户的金融需求相 关特征, 来将所述多个用户分为多个用户群, 每个用户群具有相应的 金融需求相关特征。 在步骤 S204 中, 网络设备通过将每个用户群的金融需求相关特征 与多个金融实体的实体特征进行匹配, 确定每个用户群对应的金融实 体。 其中, 本领域技术人员应理解, 步骤 S203与步骤 S204在时间上是 独立的, 也即步骤 S204无需在时间上紧跟步骤 S203。 可选地, 在步骤 S205(未示出), 网络设备可通过网络, 在诸如网 站、 BBS、 微信群、 微博等各种信息发布平台上, 发布在步骤 S204 中 所确定的每个用户群对应的金融实体信息, 或提供给金融机构做进一 步数据分析或生成其他金融信息。 图 3示出根据本发明另一个实施例的基于用户搜索行为来为用户提 供金融实体信息的方法流程图。
下面参照图 3对该实施例进行描述:
其中, 图 3中步骤 S301至 S304(未示出)与图 3中所示步骤 S201至 S204相同, 未简明起见, 以引用方式包含于此, 而不丈赞述。
在步骤 S305中, 网络设备获取一个用户的搜索行为信息。
其中, 该用户的搜索行为信息包括以下至少任一项: 该用户的 查询序列、 该用户对于响应于查询序列所获得的搜索结果的点击、 访问等操作信息、 该用户通过点击搜索结果后访问的页面。
该用户的搜索行为信息是由网络设备通过与该用户的用户设备 进行交互而实时获取; 或者是由网络设备或其他与该用户的用户设 备进行交互的网络设备预先获取并存储于一存储设备中, 网络设备 通过访问该存储设备来读取该用户的搜索行为信息。 其中, 该存储 设备可以是与该网络设备成一体或独立于该网络设备。 在步骤 S306中, 网络设备基于该用户的搜索行为信息来确定该用 户的金融需求相关特征。 其中, 用户的金融需求相关特征包括以下至 少任一项: 用户所关注的金融细分领域 F、 用户的金融需求强度 S、 用 户的金融需求级别 P。 具体地:
对于该用户所关注的金融细分领域, 网络设备 2可以通过通过对于 对该用户的查询序列、 和 /或该用户对响应查询序列反馈的搜索结果中 的一个或多个搜索结果的诸如点击或访问等操作、 和 /或该用户通过点 击搜索结果后访问的页面等搜索行为信息进行分析, 来确定用户关注 的金融细分领域。 例如, 当发现查询序列、 和 /或该用户点击的搜索结 果、 和 /或页面内容中包含某些语义与金融细分领域相关的关键词, 则 可确定该用户关注的金融细分领域 F(l), F(2), F(3) ...。
对于该用户的金融需求强度, 网络设备可以通过对该用户的查询 序列、 和 /或该用户对响应查询序列反馈的搜索结果中的一个或多个搜 索结果的诸如点击或访问等操作、 和 /或该用户通过点击搜索结果后访 问的页面等搜索行为信息进行分析, 来确定该用户的金融需求强度。 例如, 根据查询序列、 和 /或该用户点击的搜索结果、 和 /或页面内容中 包含的与金融需求强度相关的关键词的数量和 /或级别, 可以确定该用 户的金融需求强度 S。
对于该用户的金融需求级别, 网络设备可以通过对该用户的查询 序列、 和 /或该用户对响应查询序列反馈的搜索结果中的一个或多个搜 索结果的诸如点击或访问等操作、 和 /或该用户通过点击搜索结果后访 问的页面等搜索行为信息进行分析, 来确定该用户的金融需求级别。 例如, 根据查询序列、 和 /或该用户点击的搜索结果、 和 /或页面内容中 包含的与金融需求强度相关的关键词的数量和 /或级别, 可以确定该用 户的金融需求级别 P。 随后, 在步骤 S307中, 网络设备基于该用户的金融需求相关特征 及所确定的多个用户群的金融需求相关特征, 来确定该用户所归属的 用户群, 从而确定该用户对应的金融实体。
具体地, 通过将步骤 S306 中确定的该用户的金融需求相关特征的 各项与各个用户群的金融需求相关特征的各项进行对比, 如果发现该 用户与某一用户群的金融需求相关特征的各项之差均在预定范围内, 则可确定该用户属于该用户群, 从而可将该用户群对应的金融实体作 为该用户对应的金融实体。
除上述方式以外, 本领域技术人员应理解还可由其他基于本发明构 思的用于确定该用户所归属用户群的方式, 其也应落入本发明保护范 围, 并以引用方式包含于此。
本领域技术人员应理解上述步骤 S305-S307与步骤 S301-S304之间 是时间上独立的, 也即步骤 S305-S307 无需在时间上紧跟步骤 S301-S304的操作。 图 4示出根据本发明一个实施例的基于用户搜索行为来进行数据 挖掘以确定各个金融实体的用户关注度信息的装置示意图。
下面参照图 4来对该实施例进行描述:
如图 4所示, 网络设备的装置 401 , 以下简称"获取装置", 获取 多个用户的搜索行为信息。
其中, 多个用户的搜索行为信息包括以下至少任一项: 各个用 户的查询序列、 各个用户对于响应于查询序列所获得的搜索结果的 点击、 访问等操作信息、 各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行 交互的网络设备预先获取并存储于一存储设备中。 获取装置 501通过 访问该存储设备来读取所述多个用户的搜索行为信息。 其中, 该存 储设备可以是与该网络设备成一体或独立于该网络设备。 随后, 网络设备的装置 402 , 以下简称"第一确定装置", 基于所 述多个的用户搜索行为信息来确定所述多个用户的搜索行为对应的金 融实体。
具体地, 对于各个用户的每次搜索行为, 第一确定装置 402可以通 过对各个用户的查询序列、 各个用户对响应查询序列反馈的搜索结果 中的一个或多个搜索结果的诸如点击或访问等操作、 和 /或各个用户通 过点击搜索结果后访问的页面进行分析, 来确定该次搜索行为对应的 金融实体。 随后, 网络设备的装置 403 , 以下简称"第二确定装置", 基于所确 定的所述多个用户的每次搜索行为对应的金融实体, 来确定所确定的 金融实体的每一个所对应的用户关注度信息。 其中, 用户关注度信息 包括但不限于以下至少任一项: 用户关注总次数、 在一定时间周期内 的用户关注度次数或用户关注频度、 用户关注频度随时间的变化曲线 等。
具体地, 第二确定装置 403 可以基于第一确定装置 402对于各个用 户的每次搜索行为的确定结果, 来进行统计, 从而获得第一确定装置 402所确定的各个金融实体的所对应的用户关注度信息。 可选地, 网络设备的装置 404 , 以下简称"发布装置", 可通过网 络, 在诸如网站、 BBS、 微信群、 微博等各种信息发布平台上, 发布由 第二确定装置 403所确定的每个金融实体所对应的用户关注度信息, 或 提供给金融机构做进一步数据分析或生成其他金融信息。 在一个优选实施例中, 网络设备的第一确定装置 402基于所述多个 的用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索 行为对应的金融实体。 以下通过两个实例对此进行说明:
实例 1 :
第一确定装置 402包括第一确定模块 4021 (未示出)与第二确定模块 4022 (未示出 ) 。
第一确定模块 4021 通过对所述多个用户的搜索行为信息进行初始 需求分析来确定所述多个用户的具有金融需求的搜索行为。
其中, 第一确定模块 4021 通过以下至少任一种方式对所述多个用 户的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融 需求的搜索行为:
1 )通过对所述多个用户的每次搜索行为中查询序列进行语义分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当发现查询序列中包含某些语义与金融需求相关的关键 词, 则可以确定该次搜索行为具有金融需求; 或者也可根据该等语义 与金融需求相关的关键词的数量和 /或级别来确定第一金融需求数值
D1 ;
2 )通过对所述多个用户的每次搜索行为中所开启的页面中内容进行 分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当对于所开启页面的内容进行分析, 发现其中包含某些语 义与金融属性有关的词语或句子, 则可已确定该次搜索行为具有金融 需求; 或者也可根据该等语义与金融需求相关的词语或句子的数量和 / 或级别来确定第二金融需求数值 D2
3) 通过对所述多个用户的每次搜索行为中所开启的网络站点的属 性, 来确定该次搜索行为是否具有金融需求;
具体地, 当确定该等网络站点具有金融属性, 则可推导出该次搜 索行文具有金融需求; 或根据所述站点的金融属性级别来确定第三金 融需求数值。
具体地, 第一确定模块 4021 可基于以下公式来通过上述方式确定 搜索行为是否具有金融需求:
D(n)=a*Dl(n)+b*D2(n)+c*D3(n) (1)
其中, n指一个用户的第 n次搜索行为, a, b, c为上述三种方式的权 重数值, D(n)为该用户第 n次搜索行为的金融需求数值。
基于以上公式( 1 ), 第一确定模块 4021可以确定第 n次搜索行为:
- 具有金融需求, 当 0(1 -1)≥预定阈值 T;
- 不具有金融需求, 当 0(1 -1) <预定阈值 T; 优选地, 第一确定模块 4021 还可基于所述多个用户的每次搜索行 为, 结合该搜索行为的在先搜索行为, 来确定该次搜索行为是否具有 金融需求。 简言之, 如果一个用户的在先搜索行为被确定具有金融需 求且达到一定比例或根据公式 (1 ) 所确定的金融需求数值超过预定阈 值, 则其后续的搜索行为具有金融需求的可能性也较大。 具体地, 第 一确定模块 4021 可以基于以下公式来基于一个用户的在先搜索行为来 确定当前搜索行为是否具有金融需求:
D(n)'=(l+f(D(n-l))*a)*D(n) (2)
其中:
D (n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-l)=l , 当 D(n-l)≥i¾定阈值 T;
f(D(n-l)=0, 当 D(n-l) <预定阈值 T; 上述公式仅为例举而非限制性, 本领域技术人员应理解还有其他基 于本发明构思的公式可用于确定用户搜索行为是否具有金融需求, 其 也应落入本发明保护范围, 并以引用方式包含于此。 另外, 本领域技 术人员应可基于本发明上述构思, 通过统计分析并结合实际情况来确 定合适的预定阈值 T。 随后, 第二确定模块 4022通过对在第一确定模块 4021所确定的多 个用户的具有金融需求的用户搜索行为信息进行分析, 来确定所述多 个用户的具有金融需求的每次搜索行为对应的金融实体。 实例 2:
第一确定装置 402包括第三确定模块 4021,(未示出)与第四确定模块 4022' (未示出 )
第三确定模块 4021,通过对所述多个用户的用户搜索行为信息进行 分析, 来确定所述多个用户的每次搜索行为对应的金融实体;
随后, 第四确定模块 4022,通过对所述多个用户的搜索行为信息进 行初始需求分析来确定所述多个用户的具有金融需求的搜索行为, 从 而确定所述多个用户的具有金融需求的每次搜索行为对应的金融实 同样地, 其中, 第四确定模块 4022' 可通过以下至少任一种方式对 所述多个用户的搜索行为信息进行初始需求分析来确定所述多个用户 的具有金融需求的搜索行为:
1 )通过对所述多个用户的每次搜索行为中查询序列进行语义分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当发现查询序列中包含某些语义与金融需求相关的关键 词, 则可以确定该次搜索行为具有金融需求; 或者也可根据该等语义 与金融需求相关的关键词的数量和 /或级别来确定第一金融需求数值 D1 ;
2 )通过对所述多个用户的每次搜索行为中所开启的页面中内容进行 分析, 来确定该次搜索行为是否具有金融需求;
具体地, 当对于所开启页面的内容进行分析, 发现其中包含某些语 义与金融属性有关的词语或句子, 则可已确定该次搜索行为具有金融 需求; 或者也可根据该等语义与金融需求相关的词语或句子的数量和 / 或级别来确定第二金融需求数值 D2
3) 通过对所述多个用户的每次搜索行为中所开启的网络站点的属 性, 来确定该次搜索行为是否具有金融需求;
具体地, 当确定该等网络站点具有金融属性, 则可推导出该次搜 索行文具有金融需求; 或根据所述站点的金融属性级别来确定第三金 融需求数值。
具体地, 第四确定模块 4022,基于以下公式来通过上述方式确定搜 索行为是否具有金融需求:
D(n)=a*Dl(n)+b*D2(n)+c*D3(n) (1)
其中, n指一个用户的第 n次搜索行为, a, b, c为上述三种方式的权 重数值, D(n)为该用户第 n次搜索行为的金融需求数值。
基于以上公式( 1 ), 第四确定模块 4022,可以确定第 n次搜索行为:
- 具有金融需求, 当 0(1 -1)≥预定阈值 T;
- 不具有金融需求, 当 0(1 -1) <预定阈值 T; 优选地, 第四确定模块 4022, 还可基于所述多个用户的每次搜索 行为, 结合该搜索行为的在先搜索行为, 来确定该次搜索行为是否具 有金融需求。 简言之, 如果一个用户的在先搜索行为被确定具有金融 需求且达到一定比例或根据公式 (1 ) 所确定的金融需求数值超过预定 阈值, 则其后续的搜索行为具有金融需求的可能性也较大。 具体地, 第四确定模块 4022,可以基于以下公式来基于一个用户的在先搜索行为 来确定当前搜索行为是否具有金融需求:
D(n)'=(l+f(D(n-l))*a)*D(n) (2)
其中:
D (n-1)为该用户前一次搜索行为的金融需求数值;
D(n)为基于该用户的本次搜索行为所获得金融需求数值;
f(D(n-l)=l , 当 D(n-l)≥i¾定阈值 T;
f(D(n-l)=0, 当 D(n-l) <预定阈值 T;
上述公式仅为例举而非限制性, 本领域技术人员应理解还有其他基 于本发明构思的公式可用于确定用户搜索行为是否具有金融需求, 其 也应落入本发明保护范围, 并以引用方式包含于此。 另外, 本领域技 术人员基于本发明上述构思, 通过统计分析并结合实际情况来确定合 适的预定阈值 T。 接着, 第二确定装置 403基于所确定的所述多个用户的每次具有金 融需求的搜索行为对应的金融实体, 来确定所确定的金融实体的每一 个所对应的用户关注度信息。
具体地, 第二确定装置 403 可以基于第一确定装置 402对于各个用 户的每次具有金融需求的搜索行为的确定结果, 来进行统计, 从而获 得第一确定装置 402 所确定的各个金融实体的所对应的用户关注度信 自、
可选地, 网络设备的发布装置 404 可通过网络, 在诸如网站、 BBS, 微信群、 微博等各种信息发布平台上, 发布由第二确定装置 403 所确定的每个金融实体所对应的用户关注度信息, 或提供给金融机构 做进一步数据分析或生成其他金融信息。 本领域技术人员应理解上述参照图 4描述的实施例中网络设备中 的各个装置或模块可以是各自分离的模块, 也可全部或部分地集成 在单个装置中。 图 5示出根据本发明一个实施例的基于用户搜索行为来为用户提供 金融实体信息的方法流程图。
下面参照图 5来对该实施例进行描述:
网络设备中的装置 501 , 以下简称"第一获取装置", 获取多个用户 的搜索行为信息。
其中, 多个用户的搜索行为信息包括以下至少任一项: 各个用 户的查询序列、 各个用户对于响应于查询序列所获得的搜索结果的 点击、 访问等操作信息、 各个用户通过点击搜索结果后访问的页面。
该等搜索行为信息可以由网络设备或其他与各个用户设备进行 交互的网络设备预先获取并存储于一存储设备中。 获取装置 501网络 设备通过访问该存储设备来读取所述多个用户的搜索行为信息。 其 中, 该存储设备可以是与该网络设备成一体或独立于该网络设备 2。 网络设备的装置 502, 以下检查"第三确定装置", 基于所述各个用 户的搜索行为信息来确定各个用户的金融需求相关特征。 其中, 用户 的金融需求相关特征包括以下至少任一项: 用户所关注的金融细分领 域?、 用户的金融需求强度 S、 用户的金融需求级别 P。 具体地:
对于用户所关注的金融细分领域, 第三确定装置 502 可以通过对 各个用户的查询序列、 和 /或各个用户对响应查询序列反馈的搜索结果 中的一个或多个搜索结果的诸如点击或访问等操作、 和 /或各个用户通 过点击搜索结果后访问的页面等搜索行为信息进行分析, 来确定用户 关注的金融细分领域。 例如, 当发现查询序列、 和 /或用户点击的搜索 结果和 /或页面内容中包含某些语义与金融细分领域相关的关键词, 则 可确定用户关注的金融细分领域 F(l), F(2), F(3) …。
对于用户的金融需求强度, 第三确定模块 502可以通过对各个用户 的查询序列、 和 /或各个用户对响应查询序列反馈的搜索结果中的一个 或多个搜索结果的诸如点击或访问等操作、 和 /或各个用户通过点击搜 索结果后访问的页面等搜索行为信息进行分析, 来确定用户的金融需 求强度。 例如, 根据查询序列、 和 /或用户点击的搜索结果、 和 /或页面 内容中包含的与金融需求强度相关的关键词的数量和 /或级别, 可以确 定该用户的金融需求强度 S。
对于用户的金融需求级别, 第三确定模块 502 可以通过对各个用 户的查询序列、 和 /或各个用户对响应查询序列反馈的搜索结果中的一 个或多个搜索结果的诸如点击或访问等操作、 和 /或各个用户通过点击 搜索结果后访问的页面等搜索行为信息进行分析, 来确定用户的金融 需求级别。 例如, 根据查询序列、 和 /或用户点击的搜索结果和 /或页面 内容中包含的与金融需求强度相关的关键词的数量和 /或级别, 可以确 定该用户的金融需求级别 P。 优选地, 第三确定模块 502 包含筛选模块 5021 (未示出)与确定模 块 5022 (未示出) 。
其中, 筛选模块 5021 通过对所述多个用户的搜索行为信息进行初 始需求分析来筛选具有金融需求的多个用户, 该初始需求分析的方式 与前面参照图 4描述的实施例中确定用户搜索行为是否具有金融需求的 方式相同, 为简明起见, 以引用方式包含于此, 而不做赞述;
随后, 确定模块 5022基于所述具有金融需求的各个用户的搜索行 为来确定各个用户的金融需求相关特征, 其中, 确定确定各个具有金 融需求的用户的金融需求相关特征的方式与前面步骤 S202 中确定各个 用户的金融需求相关特征的方式相同, 为简明起见, 以引用方式包含 于此, 而不做赘述。 优选地, 第三确定模块 502 可基于各个用户的搜索行为, 并结合 各个用户的自然属性, 来确定各个用户的金融需求相关特征。
其中, 用户的自然属性包括以下至少任一项: 所述用户的年龄; 所述用户的性别; 所述用户的职业; 所述用户的消费水平; 所述用户 所处地域。 网络设备的装置 503 , 以下简称"划分装置", 根据所述确定的各个 用户的金融需求相关特征, 来将所述多个用户分为多个用户群, 每个 用户群具有相应的金融需求相关特征。
网络设备的装置 504, 以下检查"匹配装置", 通过将每个用户群的 金融需求相关特征与多个金融实体的实体特征进行匹配, 确定每个用 户群对应的金融实体。 其中, 本领域技术人员应理解, 匹配装置 504的 操作与划分装置 503的操作在时间上是独立的, 也即匹配装置 504的操 作无需在时间上紧跟划分装置 503的操作。 可选地, 网络设备的发布装置 510(未示出)可通过网络, 在诸如网 站、 BBS、 微信群、 微博等各种信息发布平台上, 发布由匹配装置 504 所确定的每个用户群对应的金融实体信息, 或提供给金融机构做进一 步数据分析或生成其他金融信息。 本领域技术人员应理解上述参照图 6描述的实施例中网络设备中 的各个装置或模块可以是各自分离的模块, 也可全部或部分地集成 在单个装置中。 图 6示出根据本发明另一个实施例的基于用户搜索行为来为用户提 供金融实体信息的方法流程图。
下面参照图 6对该实施例进行描述:
其中, 图 6中装置 601至 604及 610(未示出)与图 5中所示装置 501 至 504及 510所执行的操作相同, 未简明起见, 以引用方式包含于此, 而不做赞述。
网络设备的第二获取装置 605 获取一个用户的搜索行为信息。 其 中, 本领域技术人员应理解第一获取装置 601与第二获取装置 605可 以是同一装置或不同装置。
其中, 该用户的搜索行为信息包括以下至少任一项: 该用户的 查询序列、 该用户对于响应于查询序列所获得的搜索结果的点击、 访问等操作信息、 该用户通过点击搜索结果后访问的页面。
该用户的搜索行为信息是由网络设备通过与该用户的用户设备 进行交互而实时获取; 或者是由网络设备或其他与该用户的用户设 备进行交互的网络设备预先获取并存储于一存储设备中, 第二获取 装置 605 网络设备通过访问该存储设备来读取该用户的搜索行为信 息。 其中, 该存储设备可以是与该网络设备成一体或独立于该网络 设备。 网络设备的装置 606, 以下简称"第四确定装置", 基于该用户的 搜索行为信息来确定该用户的金融需求相关特征。 本领域技术人员应 理解第三确定装置 601与第二获取装置 605可以是同一装置或不同装 置。 其中, 用户的金融需求相关特征包括以下至少任一项: 用户所关 注的金融细分领域 F、 用户的金融需求强度 S、 用户的金融需求级别 P。 具体地:
对于该用户所关注的金融细分领域, 第四确定装置 606可以通过对 该用户的查询序列、 和 /或该用户对响应查询序列反馈的搜索结果中的 一个或多个搜索结果的诸如点击或访问等操作、 和 /或该用户通过点击 搜索结果后访问的页面等搜索行为信息进行分析, 来确定用户关注的 金融细分领域。 例如, 当发现查询序列、 和 /或该用户点击的搜索结 果、 和 /或页面内容中包含某些语义与金融细分领域相关的关键词, 则 可确定该用户关注的金融细分领域 F(l), F(2), F(3) ...。
对于该用户的金融需求强度, 第四确定装置 606 可以通过对该用 户的查询序列、 和 /或该用户对响应查询序列反馈的搜索结果中的一个 或多个搜索结果的诸如点击或访问等操作、 和 /或该用户通过点击搜索 结果后访问的页面等搜索行为信息进行分析, 来确定该用户的金融需 求强度。 例如, 根据查询序列、 和 /或该用户点击的搜索结果、 和 /或页 面内容中包含的与金融需求强度相关的关键词的数量和 /或级别, 可以 确定该用户的金融需求强度 s。
对于该用户的金融需求级别, 第四确定装置 606 可以通过对该用 户的查询序列、 和 /或该用户对响应查询序列反馈的搜索结果中的一个 或多个搜索结果的诸如点击或访问等操作、 和 /或该用户通过点击搜索 结果后访问的页面进行分析, 来确定该用户的金融需求级别。 例如, 根据查询序列、 和 /或该用户点击的搜索结果、 和 /或页面内容中包含的 与金融需求强度相关的关键词的数量和 /或级别, 可以确定该用户的金 融需求级别 P。 随后, 网络设备的装置 607 , 以下简称"第五确定装置", 基于该 用户的金融需求相关特征及所确定的多个用户群的金融需求相关特 征, 来确定该用户所归属的用户群, 从而确定该用户对应的金融实 体, 用于提供给该用户。
具体地, 第五确定装置 607通过将第四确定装置 606所确定的该用 户的金融需求相关特征的各项与各个用户群的金融需求相关特征的各 项进行对比, 如果发现该用户与某一用户群的金融需求相关特征的各 项之差均在预定范围内, 则可确定该用户属于该用户群, 从而可将该 用户群对应的金融实体作为该用户对应的金融实体。
除上述方式以外, 本领域技术人员应理解还可由其他基于本发明构 思的用于确定该用户所归属用户群的方式, 其也应落入本发明保护范 围, 并以引用方式包含于此。 本领域技术人员应理解上述装置 605-607与装置 601-604之间是时 间上独立的, 也即装置 605-607 所执行的操作无需在时间上紧跟装置 601-604的操作。 本领域技术人员应理解上述参照图 6描述的实施例中网络设备中 的各个装置或模块可以是各自分离的模块, 也可全部或部分地集成 在单个装置中。 需要注意的是, 本发明可在软件和 /或软件与硬件的组合体中被实 施, 例如, 可采用专用集成电路(ASIC )、 通用目的计算机或任何其他 类似硬件设备来实现。 在一个实施例中, 本发明的软件程序可以通过 处理器执行以实现上文所述步骤或功能。 同样地, 本发明的软件程序 (包括相关的数据结构)可以被存储到计算机可读记录介质中, 例如, RAM存储器, 磁或光驱动器或软磁盘及类似设备。 另外, 本发明的一 些步骤或功能可采用硬件来实现, 例如, 作为与处理器配合从而执行 各个步骤或功能的电路。
另外, 本发明的一部分可被应用为计算机程序产品, 例如计算机程 序指令, 当其被计算机执行时, 通过该计算机的操作, 可以调用或提 供根据本发明的方法和 /或技术方案。 而调用本发明的方法的程序指 令, 可能被存储在固定的或可移动的记录介质中, 和 /或通过广播或其 他信号承载媒体中的数据流而被传输, 和 /或被存储在根据所述程序指 令运行的计算机设备的工作存储器中。 在此, 根据本发明的一个实施 例包括一个装置, 该装置包括用于存储计算机程序指令的存储器和用 于执行程序指令的处理器, 其中, 当该计算机程序指令被该处理器执 行时, 触发该装置运行基于前述根据本发明的多个实施例的方法和 /或 技术方案。
对于本领域技术人员而言, 显然本发明不限于上述示范性实施例的 细节, 而且在不背离本发明的精神或基本特征的情况下, 能够以其他 的具体形式实现本发明。 因此, 无论从哪一点来看, 均应将实施例看 作是示范性的, 而且是非限制性的, 本发明的范围由所附权利要求而 不是上述说明限定, 因此旨在将落在权利要求的等同要件的含义和范 围内的所有变化涵括在本发明内。 不应将权利要求中的任何附图标记 视为限制所涉及的权利要求。 此外, 显然"包括"一词不排除其他单元或 步骤, 单数不排除复数。 系统权利要求中陈述的多个单元或装置也可 以由一个单元或装置通过软件或者硬件来实现。 第一, 第二等词语用 来表示名称, 而并不表示任何特定的顺序。

Claims (28)

  1. 权 利 要 求 书
    1. 一种用于进行金融数据挖掘的方法, 其中, 该方法包括以下步 骤:
    - 获取多个用户的搜索行为信息;
    -基于所述多个的用户搜索行为信息来确定所述多个用户的搜索行 为对应的金融实体;
    其中, 该方法还包括:
    -基于所确定的所述多个用户的每次搜索行为对应的金融实体, 来 确定所确定的金融实体的每一个所对应的用户关注度信息。
  2. 2. 根据权利要求 1所述的方法, 其中, 所述基于所述多个的用户搜 索行为信息来确定所述多个用户的每次搜索行为对应的金融实体的步 骤包括:
    -基于所述多个的用户搜索行为信息来确定所述多个用户的每次具 有金融需求的搜索行为对应的金融实体;
    其中, 所述基于所确定的所述多个用户的每次搜索行为对应的金融 实体, 来确定所确定的金融实体的每一个所对应的用户关注度信息的 步骤包括:
    -基于所确定的所述多个用户的每次具有金融需求的搜索行为对应 的金融实体, 来确定所确定的金融实体的每一个所对应的用户关注度
    Ί^- 。
  3. 3. 根据权利要求 2所述的方法, 其中, 所述基于所述多个用户的用 户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为 对应的金融实体的步骤包括:
    - 通过对所述多个用户的搜索行为信息进行初始需求分析来确定所 述多个用户的具有金融需求的搜索行为;
    -通过对所确定的多个用户的具有金融需求的用户搜索行为信息进 行分析, 来确定所述多个用户的具有金融需求的每次搜索行为对应的 金融实体。
  4. 4. 根据权利要求 2所述的方法, 其中, 所述基于所述多个用户的用 户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行为 对应的金融实体的步骤包括:
    - 通过对所述多个用户的用户搜索行为信息进行分析, 来确定所述 多个用户的每次搜索行为对应的金融实体;
    - 通过对所述多个用户的搜索行为信息进行初始需求分析来确定所 述多个用户的具有金融需求的搜索行为, 从而确定所述多个用户的具 有金融需求的每次搜索行为对应的金融实体。
  5. 5.根据权利要求 3或 4所述的方法, 其中, 所述对所述多个用户的 搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需求 的搜索行为的步骤包括以下至少任一种方式:
    - 通过对所述多个用户的每次搜索行为中查询序列进行语义分析, 来确定该次搜索行为是否具有金融需求;
    - 通过对所述多个用户的每次搜索行为中所开启的页面中内容进行 分析, 来确定该次搜索行为是否具有金融需求;
    - 通过对所述多个用户的每次搜索行为中所开启的网络站点的属 性, 来确定该次搜索行为是否具有金融需求。
  6. 6. 根据权利要求 5所述的方法, 其中, 所述对所述多个用户的搜索 行为信息进行初始需求分析来筛选所述多个用户的具有金融需求的搜 索行为的步骤包括:
    -基于所述多个用户的每次搜索行为, 结合该搜索行为的在先搜索 行为, 来确定该次搜索行为是否具有金融需求。
  7. 7. 根据权利要求 1至 6中任一项所述的方法, 还包括: -发布确定所确定的金融实体的每一个所对应的用户关注度信息。
  8. 8. 一种用于为用户提供金融实体信息的方法, 其中, 该方法包 括:
    - 获取多个用户的搜索行为信息;
    -基于所述各个用户的搜索行为信息来确定各个用户的金融需求相 关特征;
    -根据所述确定的各个用户的金融需求相关特征, 来将所述多个用 户分为多个用户群, 每个用户群具有相应的金融需求相关特征;
    其中, 该方法还包括:
    - 通过将每个用户群的金融需求相关特征与多个金融实体的实体特 征进行匹配, 确定每个用户群对应的金融实体。
  9. 9. 根据权利要求 8所述的方法, 其中, 还包括:
    - 获取一个用户的搜索行为信息;
    -基于该用户的搜索行为信息来确定该用户的金融需求相关特征; -基于该用户的金融需求相关特征及所确定的多个用户群的金融需 求相关特征, 来确定该用户所归属的用户群, 从而确定该用户对应的 金融实体。
  10. 10. 根据权利要求 8或 9所述的方法, 其中, 所述基于所述多个用 户的搜索行为信息来确定每个用户的金融需求相关特征的步骤包括:
    - 通过对所述多个用户的搜索行为信息进行初始需求分析来筛选具 有金融需求的多个用户;
    -基于所述具有金融需求的各个用户的搜索行为来确定各个用户的 金融需求相关特征。
  11. 11. 根据权利要求 8至 10中任一项所述的方法, 其中, 所述基于各 个用户的搜索行为来确定各个用户的金融需求相关特征的步骤包括: -基于各个用户的搜索行为, 并结合各个用户的自然属性, 来确定 各个用户的金融需求相关特征。
  12. 12. 根据权利要求 11所述的方法, 其中, 所述用户的自然属性包括 以下至少任一项: 所述用户的年龄; 所述用户的性别; 所述用户的职 业; 所述用户的消费水平; 所述用户所处地域。
  13. 13. 根据权利要求 8至 12中任一项所述的方法, 其中, 还包括: -发布所确定的每个用户群对应的金融实体。
  14. 14. 一种用于进行金融数据挖掘的装置, 其中, 包括:
    用于获取多个用户的搜索行为信息;
    用于基于所述多个的用户搜索行为信息来确定所述多个用户的搜索 行为对应的金融实体的装置;
    其中, 还包括:
    用于基于所确定的所述多个用户的每次搜索行为对应的金融实体, 来确定所确定的金融实体的每一个所对应的用户关注度信息的装置。
  15. 15. 根据权利要求 14所述的装置, 其中, 所述用于基于所述多个的 用户搜索行为信息来确定所述多个用户的每次搜索行为对应的金融实 体的装置还用于:
    -基于所述多个的用户搜索行为信息来确定所述多个用户的每次具 有金融需求的搜索行为对应的金融实体;
    其中, 所述基于所确定的所述多个用户的每次搜索行为对应的金融 实体, 来确定所确定的金融实体的每一个所对应的用户关注度信息的 装置还用于:
    -基于所确定的所述多个用户的每次具有金融需求的搜索行为对应 的金融实体, 来确定所确定的金融实体的每一个所对应的用户关注度
    Ί^- 。
  16. 16. 根据权利要求 15所述的装置, 其中, 所述基于所述多个用户的 用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行 为对应的金融实体的装置包括:
    第一确定模块, 用于通过对所述多个用户的搜索行为信息进行初始 需求分析来确定所述多个用户的具有金融需求的搜索行为;
    第二确定模块, 用于通过对所确定的多个用户的具有金融需求的用 户搜索行为信息进行分析, 来确定所述多个用户的具有金融需求的每 次搜索行为对应的金融实体。
  17. 17. 根据权利要求 15所述的装置, 其中, 所述基于所述多个用户的 用户搜索行为信息来确定所述多个用户的每次具有金融需求的搜索行 为对应的金融实体的装置包括:
    第三确定模块, 用于通过对所述多个用户的用户搜索行为信息进行 分析, 来确定所述多个用户的每次搜索行为对应的金融实体;
    第四确定模块, 用于通过对所述多个用户的搜索行为信息进行初始 需求分析来确定所述多个用户的具有金融需求的搜索行为, 从而确定 所述多个用户的具有金融需求的每次搜索行为对应的金融实体。
  18. 18.根据权利要求 16或 17所述的装置, 其中, 所述对所述多个用户 的搜索行为信息进行初始需求分析来确定所述多个用户的具有金融需 求的搜索行为的装置通过以下至少任一种方式来确定每次搜索行为是 否具有金融需求:
    - 通过对所述多个用户的每次搜索行为中查询序列进行语义分析, 来确定该次搜索行为是否具有金融需求;
    - 通过对所述多个用户的每次搜索行为中所开启的页面中内容进行 分析, 来确定该次搜索行为是否具有金融需求;
    - 通过对所述多个用户的每次搜索行为中所开启的网络站点的属 性, 来确定该次搜索行为是否具有金融需求。
  19. 19. 根据权利要求 18所述的装置, 其中, 所述对所述多个用户的搜 索行为信息进行初始需求分析来筛选所述多个用户的具有金融需求的 搜索行为的装置还用于:
    -基于所述多个用户的每次搜索行为, 结合该搜索行为的在先搜索 行为, 来确定该次搜索行为是否具有金融需求。
  20. 20. 根据权利要求 14至 19中任一项所述的装置, 还包括: 用于发布确定所确定的金融实体的每一个所对应的用户关注度信息 的装置。
  21. 21. 一种用于为用户提供金融实体信息的装置, 其中, 包括: 用于获取多个用户的搜索行为信息的装置;
    用于基于所述各个用户的搜索行为信息来确定各个用户的金融需求 相关特征的装置;
    用于根据所述确定的各个用户的金融需求相关特征, 来将所述多个 用户分为多个用户群的装置, 其中, 每个用户群具有相应的金融需求 相关特征;
    用于通过将每个用户群的金融需求相关特征与多个金融实体的实体 特征进行匹配, 来确定每个用户群对应的金融实体的装置。
  22. 22. 根据权利要求 21所述的装置, 其中, 还包括:
    用于获取一个用户的搜索行为信息的装置;
    用于基于该用户的搜索行为信息来确定该用户的金融需求相关特征 的装置;
    用于基于该用户的金融需求相关特征及所确定的多个用户群的金融 需求相关特征, 来确定该用户所归属的用户群, 从而确定该用户对应 的金融实体的装置。
  23. 23. 根据权利要求 21或 22所述的装置, 其中, 所述基于所述多个 用户的搜索行为信息来确定每个用户的金融需求相关特征的装置包 括:
    筛选模块, 用于通过对所述多个用户的搜索行为信息进行初始需求 分析来筛选具有金融需求的多个用户;
    确定模块, 用于基于所述具有金融需求的各个用户的搜索行为来确 定各个用户的金融需求相关特征。
  24. 24. 根据权利要求 21至 23中任一项所述的装置, 其中, 所述基于 各个用户的搜索行为来确定各个用户的金融需求相关特征的装置还用 于:
    基于各个用户的搜索行为, 并结合各个用户的自然属性, 来确定各 个用户的金融需求相关特征。
  25. 25. 根据权利要求 24所述的装置, 其中, 所述用户的自然属性包括 以下至少任一项: 所述用户的年龄; 所述用户的性别; 所述用户的职 业; 所述用户的消费水平; 所述用户所处地域。
  26. 26. 根据权利要求 21至 25中任一项所述的装置, 其中, 还包括: 用于发布所确定的每个用户群对应的金融实体的装置。
  27. 27. 一种计算机设备, 包括如权利要求 14至 20中任一项所述的用 于进行金融数据挖掘的装置, 和 /或, 如权利要求 21至 26中任一项所述 的用于为用户提供金融实体信息的装置。
  28. 28. 一种计算机可读取介质, 其上存储有指令代码, 当所述指令代 码被计算机设备执行时, 可使得计算机设备执行如权利要求 1至 7中任 一项所述的方法, 和 /或, 如权利要求 8至 13中任一项所述的方法。
CN201480038221.6A 2014-06-25 2014-06-25 一种基于用户搜索行为进行数据挖掘的方法和装置 Active CN105556514B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/080757 WO2015196397A1 (zh) 2014-06-25 2014-06-25 一种基于用户搜索行为进行数据挖掘的方法和装置

Publications (2)

Publication Number Publication Date
CN105556514A true CN105556514A (zh) 2016-05-04
CN105556514B CN105556514B (zh) 2020-11-20

Family

ID=54936464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480038221.6A Active CN105556514B (zh) 2014-06-25 2014-06-25 一种基于用户搜索行为进行数据挖掘的方法和装置

Country Status (5)

Country Link
US (1) US10896461B2 (zh)
EP (1) EP3163465A4 (zh)
JP (1) JP6173586B2 (zh)
CN (1) CN105556514B (zh)
WO (1) WO2015196397A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862532B (zh) * 2016-09-22 2021-11-26 腾讯科技(深圳)有限公司 一种用户特征提取方法及相关装置
CN113535813B (zh) * 2021-06-30 2023-07-28 北京百度网讯科技有限公司 一种数据挖掘方法、装置、电子设备以及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US20080281808A1 (en) * 2007-05-10 2008-11-13 Microsoft Corporation Recommendation of related electronic assets based on user search behavior
CN101420313A (zh) * 2007-10-22 2009-04-29 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备
CN102354385A (zh) * 2011-09-07 2012-02-15 宇龙计算机通信科技(深圳)有限公司 移动终端、服务器和证券信息推送方法
CN103020843A (zh) * 2012-12-05 2013-04-03 南京财汇智集网络科技发展有限公司 一种金融信息交互及推送方法
CN103399883A (zh) * 2013-07-19 2013-11-20 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN103473354A (zh) * 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301535B1 (en) * 2000-09-29 2012-10-30 Power Financial Group, Inc. System and method for analyzing and searching financial instrument data
JP3635260B2 (ja) * 2001-12-28 2005-04-06 株式会社野村総合研究所 キーワード分析システム
JP2004185220A (ja) * 2002-12-02 2004-07-02 Nri & Ncc Co Ltd キーワード抽出システム
US8232962B2 (en) * 2004-06-21 2012-07-31 Trading Technologies International, Inc. System and method for display management based on user attention inputs
CN1967579A (zh) 2006-02-13 2007-05-23 湖南大学 金融风险管理辅助挖掘分析系统
US8442973B2 (en) * 2006-05-02 2013-05-14 Surf Canyon, Inc. Real time implicit user modeling for personalized search
US20070260597A1 (en) * 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US20100082434A1 (en) * 2008-09-29 2010-04-01 Yahoo! Inc. Personalized search results to multiple people
CA2764496C (en) * 2009-06-05 2018-02-27 Wenhui Liao Feature engineering and user behavior analysis
US20110137913A1 (en) * 2009-12-08 2011-06-09 Shahzad Bhatti Systems and Methods for Interest-Driven Stock market Segmentation and Stock Trading
JP5467061B2 (ja) * 2011-01-06 2014-04-09 日本電信電話株式会社 バースト情報検索装置及びバースト情報検索プログラム
JP5451673B2 (ja) 2011-03-28 2014-03-26 ヤフー株式会社 検索ランキング生成装置及び方法
CN102903047A (zh) * 2011-07-26 2013-01-30 阿里巴巴集团控股有限公司 一种商品信息投放方法和设备
JP5831204B2 (ja) * 2011-12-21 2015-12-09 大日本印刷株式会社 情報提供システム、情報提供方法及びプログラム
JP5805548B2 (ja) * 2012-01-20 2015-11-04 日立マクセル株式会社 情報処理装置、及び、情報処理方法
CN103778553A (zh) 2012-10-26 2014-05-07 腾讯科技(深圳)有限公司 一种商品属性推荐方法及系统
US20140172564A1 (en) * 2012-12-17 2014-06-19 Facebook, Inc. Targeting objects to users based on queries in an online system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US20080281808A1 (en) * 2007-05-10 2008-11-13 Microsoft Corporation Recommendation of related electronic assets based on user search behavior
CN101420313A (zh) * 2007-10-22 2009-04-29 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备
CN102354385A (zh) * 2011-09-07 2012-02-15 宇龙计算机通信科技(深圳)有限公司 移动终端、服务器和证券信息推送方法
CN103020843A (zh) * 2012-12-05 2013-04-03 南京财汇智集网络科技发展有限公司 一种金融信息交互及推送方法
CN103399883A (zh) * 2013-07-19 2013-11-20 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN103473354A (zh) * 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法

Also Published As

Publication number Publication date
WO2015196397A1 (zh) 2015-12-30
CN105556514B (zh) 2020-11-20
US10896461B2 (en) 2021-01-19
JP2016526747A (ja) 2016-09-05
US20170109816A1 (en) 2017-04-20
EP3163465A4 (en) 2018-03-14
JP6173586B2 (ja) 2017-08-02
EP3163465A1 (en) 2017-05-03

Similar Documents

Publication Publication Date Title
Dennis et al. Computational aspects of N‐mixture models
CN105989004B (zh) 一种信息投放的预处理方法和装置
US9589025B2 (en) Correlated information recommendation
CN104090919B (zh) 推荐广告的方法及广告推荐服务器
CN109299994B (zh) 推荐方法、装置、设备及可读存储介质
Lu et al. BizSeeker: a hybrid semantic recommendation system for personalized government‐to‐business e‐services
CN102262647B (zh) 信息处理装置、信息处理方法和程序
US9798820B1 (en) Classification of keywords
US20130157234A1 (en) Storyline visualization
US20130080428A1 (en) User-Centric Opinion Analysis for Customer Relationship Management
EP3126940A1 (en) Systems and methods for optimizing content layout using behavior metrics
Armann-Keown et al. Content analysis in library and information research: An analysis of trends
CN111723260B (zh) 推荐内容的获取方法、装置、电子设备及可读存储介质
JP6663005B2 (ja) インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体
CN105556514A (zh) 一种基于用户搜索行为进行数据挖掘的方法和装置
US20130198205A1 (en) Dynamic influence tracking engine and method
CN106484762A (zh) 利用网页浏览行为来进行性别预测的方法
CN108241699B (zh) 用于推送信息的方法和装置
US20130325834A1 (en) Link allocation for search engine optimization
US20210117825A1 (en) Method and system for processing a search result of a search engine system
US20210304253A1 (en) Content Interest from Interaction Information
GB2608112A (en) System and method for providing media content
US20110208738A1 (en) Method for Determining an Enhanced Value to Keywords Having Sparse Data
Michayluk et al. Do lead articles signal higher quality in the digital age? Evidence from finance journals
CN112182414A (zh) 文章推荐方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191122

Address after: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer 2

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Address before: 100085 B building, block 5, building 10, ten Street, Haidian District, Beijing,

Applicant before: BEIJING BAIDUPAY SCIENCE AND TECHNOLOGY Co.,Ltd.

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20160504

Assignee: BEIJING BAIDUPAY SCIENCE AND TECHNOLOGY Co.,Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: X2020990000187

Denomination of invention: Method and device for data mining based on user's search behaviour

License type: Common License

Record date: 20200417

GR01 Patent grant
GR01 Patent grant