CN111192155A - 一种基于saas的社媒询盘识别及推荐方法 - Google Patents

一种基于saas的社媒询盘识别及推荐方法 Download PDF

Info

Publication number
CN111192155A
CN111192155A CN201911360823.4A CN201911360823A CN111192155A CN 111192155 A CN111192155 A CN 111192155A CN 201911360823 A CN201911360823 A CN 201911360823A CN 111192155 A CN111192155 A CN 111192155A
Authority
CN
China
Prior art keywords
data
inquiry
social media
recommendation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911360823.4A
Other languages
English (en)
Inventor
梁敏全
倪长春
李菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Longxi Network Technology Co Ltd
Original Assignee
Hangzhou Longxi Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Longxi Network Technology Co Ltd filed Critical Hangzhou Longxi Network Technology Co Ltd
Priority to CN201911360823.4A priority Critical patent/CN111192155A/zh
Publication of CN111192155A publication Critical patent/CN111192155A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于SAAS的社媒询盘识别及推荐方法,包括如下步骤:S1:添加群组;S2:采集任务;S3:贴子数据采集;S4:数据清洗;根据采集的贴子数据进行整合处理,识别过滤出询盘数据;S5:询盘数据入库;将获得询盘数据进行入库;S6:询盘数据推荐:根据用户设置,通过DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据;S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理;本发明系统核心功能是侦听海量社媒群组中的各种交流信息,通过AI技术识别出潜在客户需求,并根据推荐算法将社媒询盘推荐给最匹配的用户。本发明使得跨境贸易企业用户提供了直接获取潜在客户实时需求的新途径,尤其适用于中小型外贸企业获得新客户的需求场景。

Description

一种基于SAAS的社媒询盘识别及推荐方法
技术领域
本发明涉及社媒询盘识别及推荐技术领域,具体为一种基于SAAS的社媒询盘识别及推荐方法。
背景技术
企业通过社媒发布消息、寻找客户进行交流,需要在海量的信息中找到线索,用户难以实时跟踪到社媒上大量的信息,难以精准定位到所关心的信息,投入大量的精力而获取的有用信息不多,并难以有效转化到实际业务中。
发明内容
本发明的目的在于提供一种基于SAAS的社媒询盘识别及推荐方法,用以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于SAAS的社媒询盘识别及推荐方法,包括如下步骤:
S1:添加群组:用户在用户界面的输入模块中添加社媒群组;
S2:采集任务;根据用户设置的群组生成数据采集任务,推送到分布式队列中;
S3:贴子数据采集;分布在多台计算机的业务逻辑,从队列中取得任务,根据任务访问相关的社媒群组,获取最新的数据,保存到库中;
S4:数据清洗;根据采集的贴子数据进行整合处理,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,过滤出询盘数据;
S5:询盘数据入库;将获得询盘数据进行入库;
S6:询盘数据推荐:根据用户设置,通过DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据;
S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理。
优选的,步骤S3中采用分布式计算技术以及分布式NOSQL数据库技术。其中,采用分布式计算技术可提高业务的处理能力及业务可用性;采用分布式NOSQL数据库技术集群部署,多分片存取,高并发快速写入到库中,提高可用性。
优选的,步骤S3中贴子数据采集的方法,包括如下步骤:
C1:取得相关的社媒群组链接;
C2:爬取贴子、跟贴、用户;通过访问群组,取得页面数据,分析贴子、跟贴及用户数据;
C3:贴子数据保存;保存贴子数据到库中。
优选的,步骤C2中采用代理技术及终端模拟技术,多任务、多并发访问社媒群组,达到有效访问。
优选的,步骤S4中数据清洗的方法,包括如下步骤:
D1:取得原始贴子数据:从库中取得用户未处理的原始贴子数据;
D2:取得评论数据:从原始贴子中取得评论的数据;
D3:识别询盘:根据评论数据内容,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,识别出询盘数据内容;
D4:生成询盘数据:整合询盘数据,生成询盘数据。
优选的,步骤D3中,采用TF-IDF、Word2Vec等文本挖掘及特征向量化方法,确定询盘数据。
优选的,步骤S4中通过DeepFM算法和TwoCNNTextRelation方法,过滤出询盘数据。
优选的,步骤S6中询盘数据推荐的方法,包括如下步骤:
F1:获取新询盘数据:根据用户及设置的群组,从库中取得对应用户的新询盘数据;
F2:推荐算法确定是否推荐:根据用户设定的关键字,通过DeepFM算法和TwoCNNTextRelation方法,达到一定的阈值的数据,生成用户询盘推荐数据;
F3:推荐数据入库:推荐的数据进入到用户的询盘推荐库中。
优选的,步骤S7中询盘数据业务操作的方法,包括如下步骤:
H1:询盘设置:设置询盘的关键词、群组;
H2:数据推荐查询:根据条件查询询盘推荐数据;
H3:数据详情:查看询盘贴子的详细信息;
H4:数据加入CRM:推荐的数据跟贴的用户及其社媒信息加入到CRM系统中。
与现有技术相比,本发明的有益效果是:
本发明系统核心功能是侦听海量社媒群组中的各种交流信息,通过AI技术识别出潜在客户需求(即社媒询盘),并根据推荐算法将社媒询盘推荐给最匹配的用户。本发明使得跨境贸易企业用户提供了直接获取潜在客户实时需求的新途径,尤其适用于中小型外贸企业获得新客户的需求场景。
附图说明
图1为本发明的流程框架结构示意图;
图2为本发明贴子数据采集的方法的流程示意图;
图3为本发明数据清洗的方法的流程示意图;
图4为本发明询盘数据推荐的方法的流程示意图;
图5为本发明询盘数据业务操作的方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-5,本发明提供一种技术方案:一种基于SAAS的社媒询盘识别及推荐方法,包括如下步骤:
S1:添加群组:用户在用户界面的输入模块中添加社媒群组;
S2:采集任务;根据用户设置的群组生成数据采集任务,推送到分布式队列中;
S3:贴子数据采集;分布在多台计算机的业务逻辑,从队列中取得任务,根据任务访问相关的社媒群组,获取最新的数据,保存到库中;
S4:数据清洗;根据采集的贴子数据进行整合处理,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,过滤出询盘数据;
S5:询盘数据入库;将获得询盘数据进行入库;
S6:询盘数据推荐:根据用户设置,通过DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据;
S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理。
其中,步骤S3中采用分布式计算技术以及分布式NOSQL数据库技术。其中,采用分布式计算技术可提高业务的处理能力及业务可用性;采用分布式NOSQL数据库技术集群部署,多分片存取,高并发快速写入到库中,提高可用性。
具体的:步骤S3中贴子数据采集的方法,包括如下步骤:
C1:取得相关的社媒群组链接;C2:爬取贴子、跟贴、用户;通过访问群组,取得页面数据,分析贴子、跟贴及用户数据;C3:贴子数据保存;保存贴子数据到库中。其中,步骤C2中采用代理技术及终端模拟技术,多任务、多并发访问社媒群组,达到有效访问。
步骤S4中数据清洗的方法,包括如下步骤:
D1:取得原始贴子数据:从库中取得用户未处理的原始贴子数据;D2:取得评论数据:从原始贴子中取得评论的数据;D3:识别询盘:根据评论数据内容,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,识别出询盘数据内容;D4:生成询盘数据:整合询盘数据,生成询盘数据。其中,步骤D3中,采用TF-IDF、Word2Vec等文本挖掘及特征向量化方法,确定询盘数据。
步骤S4中通过DeepFM算法和TwoCNNTextRelation方法,过滤出询盘数据。
步骤S6中询盘数据推荐的方法,包括如下步骤:F1:获取新询盘数据:根据用户及设置的群组,从库中取得对应用户的新询盘数据;F2:推荐算法确定是否推荐:根据用户设定的关键字,通过DeepFM算法和TwoCNNTextRelation方法,达到一定的阈值的数据,生成用户询盘推荐数据;F3:推荐数据入库:推荐的数据进入到用户的询盘推荐库中。
步骤S6中通过基于用户的DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据,步骤S7中询盘数据业务操作的方法,包括如下步骤:H1:询盘设置:设置询盘的关键词、群组,H2:数据推荐查询:根据条件查询询盘推荐数据,H3:数据详情:查看询盘贴子的详细信息,H4:数据加入CRM:推荐的数据跟贴的用户及其社媒信息加入到CRM系统中。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:包括如下步骤:
S1:添加群组:用户在用户界面的输入模块中添加社媒群组;
S2:采集任务;根据用户设置的群组生成数据采集任务,推送到分布式队列中;
S3:贴子数据采集;分布在多台计算机的业务逻辑,从队列中取得任务,根据任务访问相关的社媒群组,获取最新的数据,保存到库中;
S4:数据清洗;根据采集的贴子数据进行整合处理,过滤出询盘数据;
S5:询盘数据入库;将获得询盘数据进行入库;
S6:询盘数据推荐:根据用户设置,生成用户询盘推荐数据;
S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理。
2.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S3中采用分布式计算技术以及分布式NOSQL数据库技术。
3.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S3中贴子数据采集的方法,包括如下步骤:
C1:取得相关的社媒群组链接;
C2:爬取贴子、跟贴、用户;通过访问群组,取得页面数据,分析贴子、跟贴及用户数据;
C3:贴子数据保存;保存贴子数据到库中。
4.根据权利要求3所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤C2中采用代理技术及终端模拟技术,多任务、多并发访问社媒群组,达到有效访问。
5.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S4中数据清洗的方法,包括如下步骤:
D1:取得原始贴子数据:从库中取得用户未处理的原始贴子数据;
D2:取得评论数据:从原始贴子中取得评论的数据;
D3:识别询盘:根据评论数据内容,识别出询盘数据内容;
D4:生成询盘数据:整合询盘数据,生成询盘数据。
6.根据权利要求5所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤D3中,采用TF-IDF、Word2Vec等文本挖掘及特征向量化方法,确定询盘数据。
7.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S4中通过DeepFM算法和TwoCNNTextRelation方法,过滤出询盘数据。
8.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S6中询盘数据推荐的方法,包括如下步骤:
F1:获取新询盘数据:根据用户及设置的群组,从库中取得对应用户的新询盘数据;
F2:推荐算法确定是否推荐:根据用户设定的关键字,通过DeepFM算法和TwoCNNTextRelation方法,达到一定的阈值的数据,生成用户询盘推荐数据;
F3:推荐数据入库:推荐的数据进入到用户的询盘推荐库中。
9.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S6中通过基于用户的DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据。
10.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S7中询盘数据业务操作的方法,包括如下步骤:
H1:询盘设置:设置询盘的关键词、群组;
H2:数据推荐查询:根据条件查询询盘推荐数据;
H3:数据详情:查看询盘贴子的详细信息;
H4:数据加入CRM:推荐的数据跟贴的用户及其社媒信息加入到CRM系统中。
CN201911360823.4A 2019-12-25 2019-12-25 一种基于saas的社媒询盘识别及推荐方法 Pending CN111192155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360823.4A CN111192155A (zh) 2019-12-25 2019-12-25 一种基于saas的社媒询盘识别及推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360823.4A CN111192155A (zh) 2019-12-25 2019-12-25 一种基于saas的社媒询盘识别及推荐方法

Publications (1)

Publication Number Publication Date
CN111192155A true CN111192155A (zh) 2020-05-22

Family

ID=70709388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360823.4A Pending CN111192155A (zh) 2019-12-25 2019-12-25 一种基于saas的社媒询盘识别及推荐方法

Country Status (1)

Country Link
CN (1) CN111192155A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886487A (zh) * 2014-03-28 2014-06-25 焦点科技股份有限公司 基于分布式的b2b平台的个性化推荐方法与系统
CN104715047A (zh) * 2015-03-26 2015-06-17 浪潮集团有限公司 一种社交网络数据采集与分析系统
CN104933163A (zh) * 2015-06-26 2015-09-23 广西中烟工业有限责任公司 一种基于社群的产品定制系统及方法
CN107992513A (zh) * 2017-10-25 2018-05-04 中兴通讯股份有限公司 一种信息处理系统及其实现信息处理的方法
CN108491420A (zh) * 2018-02-06 2018-09-04 平安科技(深圳)有限公司 网页爬取的配置方法、应用服务器及计算机可读存储介质
CN110457556A (zh) * 2019-07-04 2019-11-15 重庆金融资产交易所有限责任公司 分布式爬虫系统架构、爬取数据的方法和计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886487A (zh) * 2014-03-28 2014-06-25 焦点科技股份有限公司 基于分布式的b2b平台的个性化推荐方法与系统
CN104715047A (zh) * 2015-03-26 2015-06-17 浪潮集团有限公司 一种社交网络数据采集与分析系统
CN104933163A (zh) * 2015-06-26 2015-09-23 广西中烟工业有限责任公司 一种基于社群的产品定制系统及方法
CN107992513A (zh) * 2017-10-25 2018-05-04 中兴通讯股份有限公司 一种信息处理系统及其实现信息处理的方法
CN108491420A (zh) * 2018-02-06 2018-09-04 平安科技(深圳)有限公司 网页爬取的配置方法、应用服务器及计算机可读存储介质
CN110457556A (zh) * 2019-07-04 2019-11-15 重庆金融资产交易所有限责任公司 分布式爬虫系统架构、爬取数据的方法和计算机设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨成平;: "电子商务中外贸询盘有效性的分析方法" *
金鹏;: "大数据背景下物流企业CRM系统应用" *

Similar Documents

Publication Publication Date Title
Zakir et al. Big data analytics.
CN103838867A (zh) 日志处理方法和装置
US10467636B2 (en) Implementing retail customer analytics data model in a distributed computing environment
CN105893526A (zh) 多源数据融合系统和方法
CN102902775B (zh) 互联网实时计算的方法和系统
JP2016532199A (ja) 選択性用データビットインターリーブによるリレーショナルデータベースのマルチカラムインデックスの生成
US20190050435A1 (en) Object data association index system and methods for the construction and applications thereof
CN105550375A (zh) 一种异构数据的整合方法及系统
CN107977678A (zh) 用于输出信息的方法和装置
CN114461644A (zh) 一种数据采集方法、装置、电子设备及存储介质
CN113326261B (zh) 数据血缘关系提取方法、装置及电子设备
GB2603609A (en) Ranking datasets based on data attributes
CN106919566A (zh) 一种基于海量数据的查询统计方法及系统
Gaurav et al. An outline on big data and big data analytics
US9286349B2 (en) Dynamic search system
CN111192155A (zh) 一种基于saas的社媒询盘识别及推荐方法
CN111611056A (zh) 数据处理方法、装置、计算机设备及存储介质
CN113779239A (zh) 一种热点信息获取方法和装置
Baruti Analysis and Implementation of a Business Intelligence QlikView application for logistic and procurement management. Sews Cabind case for the shortage problem.
Tashkova Big data-the new challenge facing business
CN111368550A (zh) 一种舆情信息管理系统
CN113515494B (zh) 基于分布式文件系统的数据库处理方法和电子设备
Panian Delivering business intelligence and value from Big Data
Chokkalingam et al. Research challenges in big data analytics
CN116910352A (zh) 基于人工智能的报表推荐方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination