CN111192155A - 一种基于saas的社媒询盘识别及推荐方法 - Google Patents
一种基于saas的社媒询盘识别及推荐方法 Download PDFInfo
- Publication number
- CN111192155A CN111192155A CN201911360823.4A CN201911360823A CN111192155A CN 111192155 A CN111192155 A CN 111192155A CN 201911360823 A CN201911360823 A CN 201911360823A CN 111192155 A CN111192155 A CN 111192155A
- Authority
- CN
- China
- Prior art keywords
- data
- inquiry
- social media
- recommendation
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于SAAS的社媒询盘识别及推荐方法,包括如下步骤:S1:添加群组;S2:采集任务;S3:贴子数据采集;S4:数据清洗;根据采集的贴子数据进行整合处理,识别过滤出询盘数据;S5:询盘数据入库;将获得询盘数据进行入库;S6:询盘数据推荐:根据用户设置,通过DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据;S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理;本发明系统核心功能是侦听海量社媒群组中的各种交流信息,通过AI技术识别出潜在客户需求,并根据推荐算法将社媒询盘推荐给最匹配的用户。本发明使得跨境贸易企业用户提供了直接获取潜在客户实时需求的新途径,尤其适用于中小型外贸企业获得新客户的需求场景。
Description
技术领域
本发明涉及社媒询盘识别及推荐技术领域,具体为一种基于SAAS的社媒询盘识别及推荐方法。
背景技术
企业通过社媒发布消息、寻找客户进行交流,需要在海量的信息中找到线索,用户难以实时跟踪到社媒上大量的信息,难以精准定位到所关心的信息,投入大量的精力而获取的有用信息不多,并难以有效转化到实际业务中。
发明内容
本发明的目的在于提供一种基于SAAS的社媒询盘识别及推荐方法,用以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于SAAS的社媒询盘识别及推荐方法,包括如下步骤:
S1:添加群组:用户在用户界面的输入模块中添加社媒群组;
S2:采集任务;根据用户设置的群组生成数据采集任务,推送到分布式队列中;
S3:贴子数据采集;分布在多台计算机的业务逻辑,从队列中取得任务,根据任务访问相关的社媒群组,获取最新的数据,保存到库中;
S4:数据清洗;根据采集的贴子数据进行整合处理,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,过滤出询盘数据;
S5:询盘数据入库;将获得询盘数据进行入库;
S6:询盘数据推荐:根据用户设置,通过DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据;
S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理。
优选的,步骤S3中采用分布式计算技术以及分布式NOSQL数据库技术。其中,采用分布式计算技术可提高业务的处理能力及业务可用性;采用分布式NOSQL数据库技术集群部署,多分片存取,高并发快速写入到库中,提高可用性。
优选的,步骤S3中贴子数据采集的方法,包括如下步骤:
C1:取得相关的社媒群组链接;
C2:爬取贴子、跟贴、用户;通过访问群组,取得页面数据,分析贴子、跟贴及用户数据;
C3:贴子数据保存;保存贴子数据到库中。
优选的,步骤C2中采用代理技术及终端模拟技术,多任务、多并发访问社媒群组,达到有效访问。
优选的,步骤S4中数据清洗的方法,包括如下步骤:
D1:取得原始贴子数据:从库中取得用户未处理的原始贴子数据;
D2:取得评论数据:从原始贴子中取得评论的数据;
D3:识别询盘:根据评论数据内容,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,识别出询盘数据内容;
D4:生成询盘数据:整合询盘数据,生成询盘数据。
优选的,步骤D3中,采用TF-IDF、Word2Vec等文本挖掘及特征向量化方法,确定询盘数据。
优选的,步骤S4中通过DeepFM算法和TwoCNNTextRelation方法,过滤出询盘数据。
优选的,步骤S6中询盘数据推荐的方法,包括如下步骤:
F1:获取新询盘数据:根据用户及设置的群组,从库中取得对应用户的新询盘数据;
F2:推荐算法确定是否推荐:根据用户设定的关键字,通过DeepFM算法和TwoCNNTextRelation方法,达到一定的阈值的数据,生成用户询盘推荐数据;
F3:推荐数据入库:推荐的数据进入到用户的询盘推荐库中。
优选的,步骤S7中询盘数据业务操作的方法,包括如下步骤:
H1:询盘设置:设置询盘的关键词、群组;
H2:数据推荐查询:根据条件查询询盘推荐数据;
H3:数据详情:查看询盘贴子的详细信息;
H4:数据加入CRM:推荐的数据跟贴的用户及其社媒信息加入到CRM系统中。
与现有技术相比,本发明的有益效果是:
本发明系统核心功能是侦听海量社媒群组中的各种交流信息,通过AI技术识别出潜在客户需求(即社媒询盘),并根据推荐算法将社媒询盘推荐给最匹配的用户。本发明使得跨境贸易企业用户提供了直接获取潜在客户实时需求的新途径,尤其适用于中小型外贸企业获得新客户的需求场景。
附图说明
图1为本发明的流程框架结构示意图;
图2为本发明贴子数据采集的方法的流程示意图;
图3为本发明数据清洗的方法的流程示意图;
图4为本发明询盘数据推荐的方法的流程示意图;
图5为本发明询盘数据业务操作的方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-5,本发明提供一种技术方案:一种基于SAAS的社媒询盘识别及推荐方法,包括如下步骤:
S1:添加群组:用户在用户界面的输入模块中添加社媒群组;
S2:采集任务;根据用户设置的群组生成数据采集任务,推送到分布式队列中;
S3:贴子数据采集;分布在多台计算机的业务逻辑,从队列中取得任务,根据任务访问相关的社媒群组,获取最新的数据,保存到库中;
S4:数据清洗;根据采集的贴子数据进行整合处理,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,过滤出询盘数据;
S5:询盘数据入库;将获得询盘数据进行入库;
S6:询盘数据推荐:根据用户设置,通过DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据;
S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理。
其中,步骤S3中采用分布式计算技术以及分布式NOSQL数据库技术。其中,采用分布式计算技术可提高业务的处理能力及业务可用性;采用分布式NOSQL数据库技术集群部署,多分片存取,高并发快速写入到库中,提高可用性。
具体的:步骤S3中贴子数据采集的方法,包括如下步骤:
C1:取得相关的社媒群组链接;C2:爬取贴子、跟贴、用户;通过访问群组,取得页面数据,分析贴子、跟贴及用户数据;C3:贴子数据保存;保存贴子数据到库中。其中,步骤C2中采用代理技术及终端模拟技术,多任务、多并发访问社媒群组,达到有效访问。
步骤S4中数据清洗的方法,包括如下步骤:
D1:取得原始贴子数据:从库中取得用户未处理的原始贴子数据;D2:取得评论数据:从原始贴子中取得评论的数据;D3:识别询盘:根据评论数据内容,通过TF-IDF、Word2Vec等文本挖掘及特征向量化方法,识别出询盘数据内容;D4:生成询盘数据:整合询盘数据,生成询盘数据。其中,步骤D3中,采用TF-IDF、Word2Vec等文本挖掘及特征向量化方法,确定询盘数据。
步骤S4中通过DeepFM算法和TwoCNNTextRelation方法,过滤出询盘数据。
步骤S6中询盘数据推荐的方法,包括如下步骤:F1:获取新询盘数据:根据用户及设置的群组,从库中取得对应用户的新询盘数据;F2:推荐算法确定是否推荐:根据用户设定的关键字,通过DeepFM算法和TwoCNNTextRelation方法,达到一定的阈值的数据,生成用户询盘推荐数据;F3:推荐数据入库:推荐的数据进入到用户的询盘推荐库中。
步骤S6中通过基于用户的DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据,步骤S7中询盘数据业务操作的方法,包括如下步骤:H1:询盘设置:设置询盘的关键词、群组,H2:数据推荐查询:根据条件查询询盘推荐数据,H3:数据详情:查看询盘贴子的详细信息,H4:数据加入CRM:推荐的数据跟贴的用户及其社媒信息加入到CRM系统中。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:包括如下步骤:
S1:添加群组:用户在用户界面的输入模块中添加社媒群组;
S2:采集任务;根据用户设置的群组生成数据采集任务,推送到分布式队列中;
S3:贴子数据采集;分布在多台计算机的业务逻辑,从队列中取得任务,根据任务访问相关的社媒群组,获取最新的数据,保存到库中;
S4:数据清洗;根据采集的贴子数据进行整合处理,过滤出询盘数据;
S5:询盘数据入库;将获得询盘数据进行入库;
S6:询盘数据推荐:根据用户设置,生成用户询盘推荐数据;
S7:询盘数据业务操作;用户根据推荐的询盘数据进行进一步业务处理。
2.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S3中采用分布式计算技术以及分布式NOSQL数据库技术。
3.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S3中贴子数据采集的方法,包括如下步骤:
C1:取得相关的社媒群组链接;
C2:爬取贴子、跟贴、用户;通过访问群组,取得页面数据,分析贴子、跟贴及用户数据;
C3:贴子数据保存;保存贴子数据到库中。
4.根据权利要求3所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤C2中采用代理技术及终端模拟技术,多任务、多并发访问社媒群组,达到有效访问。
5.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S4中数据清洗的方法,包括如下步骤:
D1:取得原始贴子数据:从库中取得用户未处理的原始贴子数据;
D2:取得评论数据:从原始贴子中取得评论的数据;
D3:识别询盘:根据评论数据内容,识别出询盘数据内容;
D4:生成询盘数据:整合询盘数据,生成询盘数据。
6.根据权利要求5所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤D3中,采用TF-IDF、Word2Vec等文本挖掘及特征向量化方法,确定询盘数据。
7.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S4中通过DeepFM算法和TwoCNNTextRelation方法,过滤出询盘数据。
8.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S6中询盘数据推荐的方法,包括如下步骤:
F1:获取新询盘数据:根据用户及设置的群组,从库中取得对应用户的新询盘数据;
F2:推荐算法确定是否推荐:根据用户设定的关键字,通过DeepFM算法和TwoCNNTextRelation方法,达到一定的阈值的数据,生成用户询盘推荐数据;
F3:推荐数据入库:推荐的数据进入到用户的询盘推荐库中。
9.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S6中通过基于用户的DeepFM算法和TwoCNNTextRelation方法,生成用户询盘推荐数据。
10.根据权利要求1所述的一种基于SAAS的社媒询盘识别及推荐方法,其特征在于:步骤S7中询盘数据业务操作的方法,包括如下步骤:
H1:询盘设置:设置询盘的关键词、群组;
H2:数据推荐查询:根据条件查询询盘推荐数据;
H3:数据详情:查看询盘贴子的详细信息;
H4:数据加入CRM:推荐的数据跟贴的用户及其社媒信息加入到CRM系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911360823.4A CN111192155A (zh) | 2019-12-25 | 2019-12-25 | 一种基于saas的社媒询盘识别及推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911360823.4A CN111192155A (zh) | 2019-12-25 | 2019-12-25 | 一种基于saas的社媒询盘识别及推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111192155A true CN111192155A (zh) | 2020-05-22 |
Family
ID=70709388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911360823.4A Pending CN111192155A (zh) | 2019-12-25 | 2019-12-25 | 一种基于saas的社媒询盘识别及推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111192155A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886487A (zh) * | 2014-03-28 | 2014-06-25 | 焦点科技股份有限公司 | 基于分布式的b2b平台的个性化推荐方法与系统 |
CN104715047A (zh) * | 2015-03-26 | 2015-06-17 | 浪潮集团有限公司 | 一种社交网络数据采集与分析系统 |
CN104933163A (zh) * | 2015-06-26 | 2015-09-23 | 广西中烟工业有限责任公司 | 一种基于社群的产品定制系统及方法 |
CN107992513A (zh) * | 2017-10-25 | 2018-05-04 | 中兴通讯股份有限公司 | 一种信息处理系统及其实现信息处理的方法 |
CN108491420A (zh) * | 2018-02-06 | 2018-09-04 | 平安科技(深圳)有限公司 | 网页爬取的配置方法、应用服务器及计算机可读存储介质 |
CN110457556A (zh) * | 2019-07-04 | 2019-11-15 | 重庆金融资产交易所有限责任公司 | 分布式爬虫系统架构、爬取数据的方法和计算机设备 |
-
2019
- 2019-12-25 CN CN201911360823.4A patent/CN111192155A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886487A (zh) * | 2014-03-28 | 2014-06-25 | 焦点科技股份有限公司 | 基于分布式的b2b平台的个性化推荐方法与系统 |
CN104715047A (zh) * | 2015-03-26 | 2015-06-17 | 浪潮集团有限公司 | 一种社交网络数据采集与分析系统 |
CN104933163A (zh) * | 2015-06-26 | 2015-09-23 | 广西中烟工业有限责任公司 | 一种基于社群的产品定制系统及方法 |
CN107992513A (zh) * | 2017-10-25 | 2018-05-04 | 中兴通讯股份有限公司 | 一种信息处理系统及其实现信息处理的方法 |
CN108491420A (zh) * | 2018-02-06 | 2018-09-04 | 平安科技(深圳)有限公司 | 网页爬取的配置方法、应用服务器及计算机可读存储介质 |
CN110457556A (zh) * | 2019-07-04 | 2019-11-15 | 重庆金融资产交易所有限责任公司 | 分布式爬虫系统架构、爬取数据的方法和计算机设备 |
Non-Patent Citations (2)
Title |
---|
杨成平;: "电子商务中外贸询盘有效性的分析方法" * |
金鹏;: "大数据背景下物流企业CRM系统应用" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zakir et al. | Big data analytics. | |
CN103838867A (zh) | 日志处理方法和装置 | |
US10467636B2 (en) | Implementing retail customer analytics data model in a distributed computing environment | |
CN105893526A (zh) | 多源数据融合系统和方法 | |
CN102902775B (zh) | 互联网实时计算的方法和系统 | |
JP2016532199A (ja) | 選択性用データビットインターリーブによるリレーショナルデータベースのマルチカラムインデックスの生成 | |
US20190050435A1 (en) | Object data association index system and methods for the construction and applications thereof | |
CN105550375A (zh) | 一种异构数据的整合方法及系统 | |
CN107977678A (zh) | 用于输出信息的方法和装置 | |
CN114461644A (zh) | 一种数据采集方法、装置、电子设备及存储介质 | |
CN113326261B (zh) | 数据血缘关系提取方法、装置及电子设备 | |
GB2603609A (en) | Ranking datasets based on data attributes | |
CN106919566A (zh) | 一种基于海量数据的查询统计方法及系统 | |
Gaurav et al. | An outline on big data and big data analytics | |
US9286349B2 (en) | Dynamic search system | |
CN111192155A (zh) | 一种基于saas的社媒询盘识别及推荐方法 | |
CN111611056A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN113779239A (zh) | 一种热点信息获取方法和装置 | |
Baruti | Analysis and Implementation of a Business Intelligence QlikView application for logistic and procurement management. Sews Cabind case for the shortage problem. | |
Tashkova | Big data-the new challenge facing business | |
CN111368550A (zh) | 一种舆情信息管理系统 | |
CN113515494B (zh) | 基于分布式文件系统的数据库处理方法和电子设备 | |
Panian | Delivering business intelligence and value from Big Data | |
Chokkalingam et al. | Research challenges in big data analytics | |
CN116910352A (zh) | 基于人工智能的报表推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |