CN108182595A - 一种制定运营策略方法及装置 - Google Patents
一种制定运营策略方法及装置 Download PDFInfo
- Publication number
- CN108182595A CN108182595A CN201711376425.2A CN201711376425A CN108182595A CN 108182595 A CN108182595 A CN 108182595A CN 201711376425 A CN201711376425 A CN 201711376425A CN 108182595 A CN108182595 A CN 108182595A
- Authority
- CN
- China
- Prior art keywords
- crawled
- data
- target data
- cleaning
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种制定运营策略方法及装置,该方法包括:获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;利用所述至少一个目标数据建立至少一个分析模型;利用所述至少一个分析模型,制定所述用户的运营策略。因此,本发明提供的方案可以提高制定运营策略的效率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种制定运营策略方法及装置。
背景技术
随着信息技术和互联网的不断迅速发展,互联网信息在社会和生活中的地位越来越显著。且随着电子商务的迅猛发展,人们的消费趋势也逐渐由线下转为线上,通过在电商网站进行日常消费品的选购。
目前,各个企业通常从网站中获取数据,并根据所获取的数据制定出符合自身发展的运营策略。制定运营策略的方法通常为:采用人工手动的方式从各大网站中获取自己需要的数据,然后根据所获取的数据制定出运营策略。采用人工的方式获取数据以及制定运营策略,由于人工个体上的差异,导致获取数据以及制定运营策略的速度较慢,且容易出错。因此,现有的方式,制定运营策略的效率较低。
发明内容
本发明实施例提供了一种制定运营策略方法及装置,可以提高制定运营策略的效率。
第一方面,本发明实施例提供了制定运营策略方法,该方法包括:
获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;
利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;
利用所述至少一个目标数据建立至少一个分析模型;
利用所述至少一个分析模型,制定所述用户的运营策略。
优选地,
所述利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据,包括:
将每一个所述待爬取网站依次作为当前待爬取网站,均执行:
确定所述当前待爬取网站包括的至少一个地址层;
确定每一个所述地址层包括的至少一个种子地址;
从所确定的种子地址中爬取所述至少一个待爬取信息对应的至少一个目标数据。
优选地,
进一步包括:
设置至少一个业务主题以及每一个所述业务主题对应的至少一个主题参数;
所述利用所述至少一个目标数据建立至少一个分析模型,包括:
对所述至少一个目标数据进行清洗过滤;
在所述至少一个业务主题中确定至少一个目标业务主题;
针对每一个所述目标业务主题均执行:根据所述目标业务主题对应的至少一个主题参数,从清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用所述至少一个主题数据建立所述目标业务主题对应的分析模型。
优选地,
所述对所述至少一个目标数据进行清洗过滤,包括:
确定至少一个清洗过滤项目以及每一个所述清洗过滤项目对应的至少一个清洗过滤条件参数;
将每一个所述目标数据依次作为当前目标数据,均执行:
在所述当前目标数据中抽取每一个所述清洗过滤项目对应的待清洗数据;
针对于每一个所述清洗过滤项目均执行:比较所述清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤所述当前目标数据。
优选地,
所述利用所述至少一个分析模型,制定所述用户的运营策略,包括:
获取所述用户确定的至少一个运营限定参数;
在所述至少一个分析模型中,获取所述至少一个运营限定参数对应的至少一个运营限定数据;
整合所述至少一个运营限定数据,形成所述运营策略。
第二方面,本发明实施例提供了制定运营策略装置,该装置包括:
获取模块,用于获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;
爬取模块,用于利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;
建立模块,用于利用所述爬取模块爬取的所述至少一个目标数据建立至少一个分析模型;
制定模块,用于利用所述建立模块建立的所述至少一个分析模型,制定所述用户的运营策略。
优选地,
所述爬取模块,用于将每一个所述待爬取网站依次作为当前待爬取网站,均执行:确定所述当前待爬取网站包括的至少一个地址层;确定每一个所述地址层包括的至少一个种子地址;从所确定的种子地址中爬取所述至少一个待爬取信息对应的至少一个目标数据。
优选地,
进一步包括:
设置模块,用于设置至少一个业务主题以及每一个所述业务主题对应的至少一个主题参数;
则,所述建立模块,包括:清洗过滤子模块以及建立子模块;
所述清洗过滤子模块,用于对所述至少一个目标数据进行清洗过滤;
所述建立子模块,用于在所述至少一个业务主题中确定至少一个目标业务主题;针对每一个所述目标业务主题均执行:根据所述目标业务主题对应的至少一个主题参数,从所述清洗过滤子模块清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用所述至少一个主题数据建立所述目标业务主题对应的分析模型。
优选地,
所述清洗过滤子模块,用于确定至少一个清洗过滤项目以及每一个所述清洗过滤项目对应的至少一个清洗过滤条件参数;将每一个所述目标数据依次作为当前目标数据,均执行:在所述当前目标数据中抽取每一个所述清洗过滤项目对应的待清洗数据;针对于每一个所述清洗过滤项目均执行:比较所述清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤所述当前目标数据。
优选地,
所述制定模块,包括:获取子模块以及获取整合子模块;
所述获取子模块,用于获取所述用户确定的至少一个运营限定参数;
所述获取整合子模块,用于在所述至少一个分析模型中,获取所述至少一个运营限定参数对应的至少一个运营限定数据;整合所述至少一个运营限定数据,形成所述运营策略。
本发明实施例提供了一种制定运营策略方法及装置,首先利用网络爬虫从用户指定的各个待爬取网站中,爬取用户指定的各个待爬取信息对应的目标数据。然后利用所爬取的目标数据建立分析模型(该分析模型的数量可以为至少一个)。最后利用所建立的分析模型制定出用户的运营策略。通过上述可知,本方案中建立分析模型的目标数据是从用户指定的待爬取网站中爬取的指定数据,使得分析模型可以最大限度的满足用户的需求。因此根据分析模型制定出的运营策略是有利于用户的运营。因此,本发明实施例提供的方案可以提高制定运营策略的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种制定运营策略方法的流程图;
图2是本发明另一个实施例提供的一种制定运营策略方法的流程图;
图3是本发明一个实施例提供的一种制定运营策略装置所在设备的一种硬件结构图;
图4是本发明一个实施例提供的一种制定运营策略装置的结构示意图;
图5是本发明另一个实施例提供的一种制定运营策略装置的结构示意图;
图6是本发明一个实施例提供的一种包括获取子模块以及获取整合子模块的制定运营策略装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种制定运营策略方法,该方法可以包括以下步骤:
步骤101:获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;
步骤102:利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;
步骤103:利用所述至少一个目标数据建立至少一个分析模型;
步骤104:利用所述至少一个分析模型,制定所述用户的运营策略。
根据图1所示的实施例,首先利用网络爬虫从用户指定的各个待爬取网站中,爬取用户指定的各个待爬取信息对应的目标数据。然后利用所爬取的目标数据建立分析模型(该分析模型的数量可以为至少一个)。最后利用所建立的分析模型制定出用户的运营策略。通过上述可知,本方案中建立分析模型的目标数据是从用户指定的待爬取网站中爬取的指定数据,使得分析模型可以最大限度的满足用户的需求。因此根据分析模型制定出的运营策略是有利于用户的运营。因此,本发明实施例提供的方案可以提高制定运营策略的效率。
在本发明一个实施例中,至少一个待爬取网站以及至少一个待爬取信息均可以为用户指定的。比如,在用户需要制定应用于手机销售的运营策略时,指定的至少一个待爬取网站可以为购物网站(比如京东、苏宁)。至少一个待爬取信息可以包括手机名称、销售价格、销售数量。
在本发明一个实施例中,上述图1所示流程图中的步骤102利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据,可以包括:
将每一个所述待爬取网站依次作为当前待爬取网站,均执行:
确定所述当前待爬取网站包括的至少一个地址层;
确定每一个所述地址层包括的至少一个种子地址;
从所确定的种子地址中爬取所述至少一个待爬取信息对应的至少一个目标数据。
在本实施例中,网络爬虫可以根据业务要求进行预先确定。网络爬虫的具体型式以及爬取规则均可以根据业务要求确定。比如网络爬虫的系统框架中包括控制器、解析器以及资源库。其中,控制器可以负责给多线程中的各个爬虫线程分配爬取任务。解析器可以根据种子地址下载网页,并对页面进行处理(处理可以包括但不限于将一些JS脚本标签、层叠样式表CSS代码内容、空格字符、HTML标签等内容处理掉),利用处理结果爬取到待爬取信息对应的目标数据。资源库用来存放爬取到的目标数据(优选地,资源库还可建立已存放目标数据的索引)。
在本实施例中,在确定出当前待爬取网站包括的至少一个地址层之后,可以根据如下过程进行爬取操作:
将每一个地址层依次作为当前地址层均执行:将当前地址层对应的至少一个种子地址(统一资源定位符URL)放入到待爬取队列中。然后确定每一个种子地址对应的网页,下载网页对应的内容,并从所下载的内容中爬取至少一个待爬取信息对应的至少一个目标数据。
根据上述实施例,在利用网络爬虫从待爬取网站中爬取目标数据时,可以先确定出待爬取网站包括的地址层以及每一个地址层包括的各个种子地址。并从每一个种子地址中爬取出目标数据。由于确定出待爬取网站包括的全部种子地址,并根据种子地址爬取数据,因此可以对待爬取网站进行全面的爬取操作,以使爬取得到的目标数据较为全面。
在本发明一个实施例中,制定运营策略方法可以进一步包括:设置至少一个业务主题以及每一个所述业务主题对应的至少一个主题参数;
则,上述图1所示流程图中的步骤103利用所述至少一个目标数据建立至少一个分析模型,可以包括:
对所述至少一个目标数据进行清洗过滤;
在所述至少一个业务主题中确定至少一个目标业务主题;
针对每一个所述目标业务主题均执行:根据所述目标业务主题对应的至少一个主题参数,从清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用所述至少一个主题数据建立所述目标业务主题对应的分析模型。
在本实施例中,业务主题的数量以及每一个业务主题的型式均可以根据业务要求确定。比如,业务主题均为销售的业务主题,包括爆款商品主题、新上架主题。爆款商品主题对应的主题参数可以包括:商品名称、价格、购买人群。新上架主题对应的主题参数可以包括:商品名称、价格、上架时间、销售量。
在本实施例中,获取的目标数据中可能存在错误和不规范等异常数据,如果利用存在异常的目标数据建立模型时,可能会使分析模型中存在错误,根据这些分析模型制定出的运营策略也不准确,因此,需要对目标数据进行清洗过滤。
在本实施例中,下面以目标业务主题为新上架主题为例进行说明:在清洗过滤后的各个目标数据中,分别获取商品名称对应的至少一个主题数据包括商品AA、价格100、上架时间2017年10月20日、销售量50;商品BB、价格90、上架时间2017年10月25日、销售量100。然后根据获取到的主题数据建立目标业务主题对应的分析模型。
在本实施例中,利用所获取的主题数据建立目标业务主题对应的分析模型的方法可以为:预先建立每一个业务主题对应的分析模板,将所述获取的主题数据添加到目标业务主题对应的分析模板中,形成目标业务主题对应的分析模型。分析模型的具体型式可以根据业务要求确定。比如,可以为表格型式。
根据上述实施例,由于分析模型是根据目标业务主题对应的主题数据建立的,因此,分析模型可以体现出用户确定的主题需求。
在本发明一个实施例中,上一个实施例中的步骤对所述至少一个目标数据进行清洗过滤,可以包括:
确定至少一个清洗过滤项目以及每一个所述清洗过滤项目对应的至少一个清洗过滤条件参数;
将每一个所述目标数据依次作为当前目标数据,均执行:
在所述当前目标数据中抽取每一个所述清洗过滤项目对应的待清洗数据;
针对于每一个所述清洗过滤项目均执行:比较所述清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤所述当前目标数据。
在本实施例中,可以根据业务要求确定至少一个清洗过滤项目以及每一个清洗过滤项目对应的清洗过滤条件参数。比如至少一个清洗过滤项目可以包括但不限于数据长度、合法状态、格式状态、重复状态、完整性中的任意一个或多个。其中,数据长度对应的清洗过滤条件参数为长度阈值、合法状态对应的清洗过滤条件参数为非法字符串、格式状态对应的清洗过滤条件参数为预设格式、重复状态对应的清洗过滤条件参数为标题字符串、完整性对应的清洗过滤条件参数为尾标字符串。
在本实施例中,当清洗过滤项目包括数据长度时,比较清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤当前目标数据,包括:比较数据长度对应的长度阈值与待清洗数据,当待清洗数据大于长度阈值时,按照长度阈值拆分目标数据,待拆分完成后得到清洗过滤当前目标数据。
在本实施例中,当清洗过滤项目包括合法情况时,比较清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤当前目标数据,包括:比较合法情况对应的非法字符串与待清洗数据,当待清洗数据中包括非法字符串时,将包括非法字符串的待清洗数据过滤掉,得到清洗过滤当前目标数据。
在本实施例中,当清洗过滤项目包括格式状态时,比较清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤当前目标数据,包括:比较格式状态对应的预设格式与待清洗数据,当待清洗数据与预设格式不一致时,将待清洗数据过滤掉,得到清洗过滤当前目标数据。
在本实施例中,当清洗过滤项目包括重复状态时,比较清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤当前目标数据,包括:比较重复状态对应的标题字符串与待清洗数据,当待清洗数据与标题字符串一致时,将待清洗数据过滤掉,得到清洗过滤当前目标数据。
在本实施例中,当清洗过滤项目包括完整性时,比较清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤当前目标数据,包括:比较完整性对应的尾标字符串与待清洗数据,当待清洗数据不包括尾标字符串致时,将待清洗数据过滤掉,得到清洗过滤当前目标数据。
根据上述实施例,可以根据确定的清洗过滤项目,对各个目标数据进行清洗过滤,以提高目标数据的正确性和规范性。
在本发明一个实施例中,上述图1所示流程图中的步骤104利用所述至少一个分析模型,制定所述用户的运营策略,可以包括:
获取所述用户确定的至少一个运营限定参数;
在所述至少一个分析模型中,获取所述至少一个运营限定参数对应的至少一个运营限定数据;
整合所述至少一个运营限定数据,形成所述运营策略。
在本实施例中,运营限定参数可以根据业务需求确定。比如在运营策略为应用于销售的运营策略时,至少一个运营限定参数可以包括但不限于:设定时间段、销售量阈值。然后在各个分析模型中获取至少一个运营限定数据,其中,每一个运营限定数据均为销售时间在设定时间段内,且销售量大于销售量阈值的数据。然后将所获取到的数据进行整合,比如以销售量为基准对各个运营限定数据进行优先级排序,提取优先级位于前三位的运营限定数据,利用所提取的数据形成运营策略,以告知用户现在市场上哪些产品销售量大,以便用户根据运营策略对自身的运营进行调整。
根据上述实施例,根据用户确定的运营限定参数在各个分析模型中获取运营限定数据,并对所获取的运营限定数据进行整合。根据整合后的运营限定数据形成运营策略。由于形成运营策略的运营限定数据是针对于用户确定的运营限定参数获取的,因此可以有针对性对用户制定运营策略。
下面以为用户A制定应用于手机销售的运营策略为例。展开说明制定运营策略方法,如图2所示,该制定运营策略方法可以包括如下步骤:
步骤201:获取用户指定的至少一个待爬取网站以及至少一个待爬取信息。
在本步骤中,获取用户A指定的网站1和网站2。用户A指定的待爬取信息包括手机名称、销售价格、销售数量、购买人群、上架时间。
步骤202:设置至少一个业务主题以及每一个业务主题对应的至少一个主题参数。
在本步骤中,根据用户A的需求设置的业务主题包括:爆款商品主题、新上架主题。爆款商品主题对应的主题参数可以包括:商品名称、价格、购买人群。新上架主题对应的主题参数可以包括:商品名称、价格、上架时间、销售量。
步骤203:确定至少一个清洗过滤项目以及每一个清洗过滤项目对应的至少一个清洗过滤条件参数。
在本步骤中,清洗过滤项目可以包括数据长度、合法状态、格式状态、重复状态、完整性。其中,数据长度对应的清洗过滤条件参数为长度阈值、合法状态对应的清洗过滤条件参数为非法字符串、格式状态对应的清洗过滤条件参数为预设格式、重复状态对应的清洗过滤条件参数为标题字符串、完整性对应的清洗过滤条件参数为尾标字符串。
步骤204:将每一个待爬取网站依次作为当前待爬取网站。
步骤205:确定当前待爬取网站包括的至少一个地址层。
在本步骤中,以网站1作为当前待爬取网站为例进行说明:确定网站1包括3个地址层。
步骤206:确定每一个地址层包括的至少一个种子地址。
在本步骤中,以网站1作为当前待爬取网站为例进行说明:确定每一个地址层均包括3个种子地址。
步骤207:从所确定的种子地址中爬取至少一个待爬取信息对应的至少一个目标数据。
在本步骤中,从所确定的9个种子地址中爬取出待爬取信息包括手机名称、销售价格、销售数量、购买人群、上架时间对应的各个目标数据。比如,以一个目标数据为例进行说明:获取的目标数据中包括手机AA、价格100、销售数量50、购买人群25岁至40岁、上架时间2017年10月20日。
步骤208:判断当前待爬取网站是否为最后一个待爬取网站,如果是,执行步骤209;否则,执行步骤204。
步骤209:将每一个目标数据依次作为当前目标数据。
步骤210:在当前目标数据中抽取每一个清洗过滤项目对应的待清洗数据。
步骤211:针对于每一个清洗过滤项目均执行:比较清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤当前目标数据。
步骤212:判断当前目标数据是否为最后一个目标数据,如果是,执行步骤213;否则,执行步骤209。
步骤213:在至少一个业务主题中确定至少一个目标业务主题。
在本步骤中,确定的目标业务主题为新上架主题。
步骤214:针对每一个目标业务主题均执行:根据目标业务主题对应的至少一个主题参数,从清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用至少一个主题数据建立目标业务主题对应的分析模型。
在本步骤中,在清洗过滤后的各个目标数据中,分别获取商品名称对应的至少一个主题数据。其中,以一个主题数据为例进行说明:该主题数据包括手机AA、价格100、上架时间2017年10月20日、销售量50。
在本步骤中,根据获取到的主题数据建立目标业务主题对应的分析模型。
步骤215:获取用户确定的至少一个运营限定参数。
在本步骤中,获取用户A确定的运营限定参数包括:设定时间段、销售量阈值。
步骤216:在至少一个分析模型中,获取至少一个运营限定参数对应的至少一个运营限定数据。
在本步骤中,在分析模型中获取设定时间段、销售量阈值对应的运营限定数据。运营限定数据均为销售时间在设定时间段内,且销售量大于销售量阈值的数据。
步骤217:整合至少一个运营限定数据,形成运营策略。
在本步骤中,将所获取到的数据进行整合,比如以销售数量为基准对各个运营限定数据进行优先级排序,提取优先级位于前三位的运营限定数据,利用所提取的数据形成运营策略,以告知用户现在市场上哪些产品销售量大,以便用户根据运营策略对自身的运营进行调整。
如图3、图4所示,本发明实施例提供了一种制定运营策略装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的制定运营策略装置所在设备的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的制定运营策略装置,包括:
获取模块401,用于获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;
爬取模块402,用于利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;
建立模块403,用于利用所述爬取模块402爬取的所述至少一个目标数据建立至少一个分析模型;
制定模块404,用于利用所述建立模块403建立的所述至少一个分析模型,制定所述用户的运营策略。
根据图4所示的实施例,本方案中建立模块建立分析模型的目标数据是从用户指定的待爬取网站中爬取的指定数据,使得分析模型可以最大限度的满足用户的需求。因此制定模块根据分析模型制定出的运营策略是有利于用户的运营。因此,本发明实施例提供的方案可以提高制定运营策略的效率。
在本发明一个实施例中,所述爬取模块402,用于将每一个所述待爬取网站依次作为当前待爬取网站,均执行:确定所述当前待爬取网站包括的至少一个地址层;确定每一个所述地址层包括的至少一个种子地址;从所确定的种子地址中爬取所述至少一个待爬取信息对应的至少一个目标数据。
在本发明一个实施例中,如图5所示,制定运营策略装置可以进一步包括:
设置模块501,用于设置至少一个业务主题以及每一个所述业务主题对应的至少一个主题参数;
则,所述建立模块403可以包括:清洗过滤子模块4031以及建立子模块4032;
所述清洗过滤子模块4031,用于对所述至少一个目标数据进行清洗过滤;
所述建立子模块4032,用于在所述至少一个业务主题中确定至少一个目标业务主题;针对每一个所述目标业务主题均执行:根据所述目标业务主题对应的至少一个主题参数,从所述清洗过滤子模块4031清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用所述至少一个主题数据建立所述目标业务主题对应的分析模型。
在本发明一个实施例中,所述清洗过滤子模块4031,用于确定至少一个清洗过滤项目以及每一个所述清洗过滤项目对应的至少一个清洗过滤条件参数;将每一个所述目标数据依次作为当前目标数据,均执行:在所述当前目标数据中抽取每一个所述清洗过滤项目对应的待清洗数据;针对于每一个所述清洗过滤项目均执行:比较所述清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤所述当前目标数据。
在本发明一个实施例中,如图6所示,所述制定模块404可以包括:获取子模块4041以及获取整合子模块4042;
所述获取子模块4041,用于获取所述用户确定的至少一个运营限定参数;
所述获取整合子模块4042,用于在所述至少一个分析模型中,获取所述至少一个运营限定参数对应的至少一个运营限定数据;整合所述至少一个运营限定数据,形成所述运营策略。
在本发明一个实施例提供了一种可读介质,该可读介质包括:执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行上述任一项所述的制定运营策略方法。
在本发明一个实施例提供了一种存储控制器,该存储控制器包括:处理器、存储器和总线;所述存储器用于存储执行指令;所述处理器与所述存储器通过所述总线连接;当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行上述任一项所述的制定运营策略方法。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上所述,本发明各个实施例至少可以实现如下有益效果:
1、在本发明实施例中,首先利用网络爬虫从用户指定的各个待爬取网站中,爬取用户指定的各个待爬取信息对应的目标数据。然后利用所爬取的目标数据建立分析模型(该分析模型的数量可以为至少一个)。最后利用所建立的分析模型制定出用户的运营策略。通过上述可知,本方案中建立分析模型的目标数据是从用户指定的待爬取网站中爬取的指定数据,使得分析模型可以最大限度的满足用户的需求。因此根据分析模型制定出的运营策略是有利于用户的运营。因此,本发明实施例提供的方案可以提高制定运营策略的效率。
2、在本发明实施例中,在利用网络爬虫从待爬取网站中爬取目标数据时,可以先确定出待爬取网站包括的地址层以及每一个地址层包括的各个种子地址。并从每一个种子地址中爬取出目标数据。由于确定出待爬取网站包括的全部种子地址,并根据种子地址爬取数据,因此可以对待爬取网站进行全面的爬取操作,以使爬取得到的目标数据较为全面。
3、在本发明实施例中,由于分析模型是根据目标业务主题对应的主题数据建立的,因此,分析模型可以体现出用户确定的主题需求。
4、在本发明实施例中,可以根据确定的清洗过滤项目,对各个目标数据进行清洗过滤,以提高目标数据的正确性和规范性。
5、在本发明实施例中,根据用户确定的运营限定参数在各个分析模型中获取运营限定数据,并对所获取的运营限定数据进行整合。根据整合后的运营限定数据形成运营策略。由于形成运营策略的运营限定数据是针对于用户确定的运营限定参数获取的,因此可以有针对性对用户制定运营策略。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种制定运营策略方法,其特征在于,包括:
获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;
利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;
利用所述至少一个目标数据建立至少一个分析模型;
利用所述至少一个分析模型,制定所述用户的运营策略。
2.根据权利要求1所述的方法,其特征在于,
所述利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据,包括:
将每一个所述待爬取网站依次作为当前待爬取网站,均执行:
确定所述当前待爬取网站包括的至少一个地址层;
确定每一个所述地址层包括的至少一个种子地址;
从所确定的种子地址中爬取所述至少一个待爬取信息对应的至少一个目标数据。
3.根据权利要求1所述的方法,其特征在于,
进一步包括:
设置至少一个业务主题以及每一个所述业务主题对应的至少一个主题参数;
所述利用所述至少一个目标数据建立至少一个分析模型,包括:
对所述至少一个目标数据进行清洗过滤;
在所述至少一个业务主题中确定至少一个目标业务主题;
针对每一个所述目标业务主题均执行:根据所述目标业务主题对应的至少一个主题参数,从清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用所述至少一个主题数据建立所述目标业务主题对应的分析模型。
4.根据权利要求3所述的方法,其特征在于,
所述对所述至少一个目标数据进行清洗过滤,包括:
确定至少一个清洗过滤项目以及每一个所述清洗过滤项目对应的至少一个清洗过滤条件参数;
将每一个所述目标数据依次作为当前目标数据,均执行:
在所述当前目标数据中抽取每一个所述清洗过滤项目对应的待清洗数据;
针对于每一个所述清洗过滤项目均执行:比较所述清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤所述当前目标数据。
5.根据权利要求1所述的方法,其特征在于,
所述利用所述至少一个分析模型,制定所述用户的运营策略,包括:
获取所述用户确定的至少一个运营限定参数;
在所述至少一个分析模型中,获取所述至少一个运营限定参数对应的至少一个运营限定数据;
整合所述至少一个运营限定数据,形成所述运营策略。
6.一种制定运营策略装置,其特征在于,包括:
获取模块,用于获取用户指定的至少一个待爬取网站以及至少一个待爬取信息;
爬取模块,用于利用网络爬虫从所述至少一个待爬取网站中,爬取所述至少一个待爬取信息对应的至少一个目标数据;
建立模块,用于利用所述爬取模块爬取的所述至少一个目标数据建立至少一个分析模型;
制定模块,用于利用所述建立模块建立的所述至少一个分析模型,制定所述用户的运营策略。
7.根据权利要求6所述的装置,其特征在于,
所述爬取模块,用于将每一个所述待爬取网站依次作为当前待爬取网站,均执行:确定所述当前待爬取网站包括的至少一个地址层;确定每一个所述地址层包括的至少一个种子地址;从所确定的种子地址中爬取所述至少一个待爬取信息对应的至少一个目标数据。
8.根据权利要求6所述的装置,其特征在于,
进一步包括:
设置模块,用于设置至少一个业务主题以及每一个所述业务主题对应的至少一个主题参数;
则,所述建立模块,包括:清洗过滤子模块以及建立子模块;
所述清洗过滤子模块,用于对所述至少一个目标数据进行清洗过滤;
所述建立子模块,用于在所述至少一个业务主题中确定至少一个目标业务主题;针对每一个所述目标业务主题均执行:根据所述目标业务主题对应的至少一个主题参数,从所述清洗过滤子模块清洗过滤后的至少一个目标数据中获取至少一个主题数据,利用所述至少一个主题数据建立所述目标业务主题对应的分析模型。
9.根据权利要求8所述的装置,其特征在于,
所述清洗过滤子模块,用于确定至少一个清洗过滤项目以及每一个所述清洗过滤项目对应的至少一个清洗过滤条件参数;将每一个所述目标数据依次作为当前目标数据,均执行:在所述当前目标数据中抽取每一个所述清洗过滤项目对应的待清洗数据;针对于每一个所述清洗过滤项目均执行:比较所述清洗过滤项目对应的待清洗数据和清洗过滤条件参数,根据比较结果,清洗过滤所述当前目标数据。
10.根据权利要求6所述的装置,其特征在于,
所述制定模块,包括:获取子模块以及获取整合子模块;
所述获取子模块,用于获取所述用户确定的至少一个运营限定参数;
所述获取整合子模块,用于在所述至少一个分析模型中,获取所述至少一个运营限定参数对应的至少一个运营限定数据;整合所述至少一个运营限定数据,形成所述运营策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711376425.2A CN108182595A (zh) | 2017-12-19 | 2017-12-19 | 一种制定运营策略方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711376425.2A CN108182595A (zh) | 2017-12-19 | 2017-12-19 | 一种制定运营策略方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108182595A true CN108182595A (zh) | 2018-06-19 |
Family
ID=62546468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711376425.2A Pending CN108182595A (zh) | 2017-12-19 | 2017-12-19 | 一种制定运营策略方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182595A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472648A (zh) * | 2018-11-20 | 2019-03-15 | 四川长虹电器股份有限公司 | 销量预测方法及服务器 |
CN110096531A (zh) * | 2019-04-24 | 2019-08-06 | 上海易点时空网络有限公司 | 用于网店运营的数据分析方法及装置 |
CN112862227A (zh) * | 2019-11-27 | 2021-05-28 | 珠海格力电器股份有限公司 | 产品停产评价方法、装置、系统及计算机存储介质 |
CN113987146A (zh) * | 2021-10-22 | 2022-01-28 | 国网江苏省电力有限公司镇江供电分公司 | 一种电力内网专用的新型智能问答系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102355488A (zh) * | 2011-08-15 | 2012-02-15 | 北京星网锐捷网络技术有限公司 | 爬虫种子获取方法与设备及爬虫爬取方法与设备 |
CN106934023A (zh) * | 2017-03-13 | 2017-07-07 | 山东浪潮云服务信息科技有限公司 | 一种数据管理方法及装置 |
CN107038190A (zh) * | 2016-10-28 | 2017-08-11 | 厦门大学 | 一种应用于淘宝网的智能促销方案建模方法 |
CN107346502A (zh) * | 2017-08-24 | 2017-11-14 | 四川长虹电器股份有限公司 | 一种基于大数据的迭代产品销售预测方法 |
-
2017
- 2017-12-19 CN CN201711376425.2A patent/CN108182595A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102355488A (zh) * | 2011-08-15 | 2012-02-15 | 北京星网锐捷网络技术有限公司 | 爬虫种子获取方法与设备及爬虫爬取方法与设备 |
CN107038190A (zh) * | 2016-10-28 | 2017-08-11 | 厦门大学 | 一种应用于淘宝网的智能促销方案建模方法 |
CN106934023A (zh) * | 2017-03-13 | 2017-07-07 | 山东浪潮云服务信息科技有限公司 | 一种数据管理方法及装置 |
CN107346502A (zh) * | 2017-08-24 | 2017-11-14 | 四川长虹电器股份有限公司 | 一种基于大数据的迭代产品销售预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472648A (zh) * | 2018-11-20 | 2019-03-15 | 四川长虹电器股份有限公司 | 销量预测方法及服务器 |
CN110096531A (zh) * | 2019-04-24 | 2019-08-06 | 上海易点时空网络有限公司 | 用于网店运营的数据分析方法及装置 |
CN112862227A (zh) * | 2019-11-27 | 2021-05-28 | 珠海格力电器股份有限公司 | 产品停产评价方法、装置、系统及计算机存储介质 |
CN113987146A (zh) * | 2021-10-22 | 2022-01-28 | 国网江苏省电力有限公司镇江供电分公司 | 一种电力内网专用的新型智能问答系统 |
CN113987146B (zh) * | 2021-10-22 | 2023-01-31 | 国网江苏省电力有限公司镇江供电分公司 | 一种电力内网专用的智能问答系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182595A (zh) | 一种制定运营策略方法及装置 | |
CN110060090A (zh) | 推荐商品组合的方法、装置、电子设备及可读存储介质 | |
CN109816321A (zh) | 一种服务管理方法、装置、设备和计算机可读存储介质 | |
CN109242553A (zh) | 一种用户行为数据推荐方法、服务器及计算机可读介质 | |
CN104574124B (zh) | 确定广告数据的展示效果的方法及装置 | |
CN104182225B (zh) | 一种通用移动信息系统适配方法与装置 | |
CN107729475A (zh) | 网页元素采集方法、装置、终端与计算机可读存储介质 | |
CN111652654A (zh) | 销量预测及神经网络构建的方法、装置、设备、存储介质 | |
CN109815381A (zh) | 用户画像构建方法、系统、计算机设备及存储介质 | |
CN112613938B (zh) | 模型训练方法、装置及计算机设备 | |
CN110308946A (zh) | 基于人工智能的跑批处理方法、设备、存储介质及装置 | |
CN109636497A (zh) | 一种产品推荐方法和装置 | |
CN111507673A (zh) | 对商品库存进行管理的方法和装置 | |
CN109962975A (zh) | 基于物体识别的信息推送方法、装置、电子设备及系统 | |
CN106993202A (zh) | 首页推荐方法及装置 | |
CN110717801A (zh) | 一种商品信息推送方法及装置 | |
CN106934023A (zh) | 一种数据管理方法及装置 | |
CN107844867A (zh) | 数据处理方法、装置及设备 | |
CN110515606A (zh) | 一种基于区块的组件开发方法 | |
CN104915440A (zh) | 一种商品排重方法和系统 | |
CN110414926A (zh) | 台账管理方法、装置及计算机可读存储介质 | |
CN104572932B (zh) | 一种兴趣标签的确定方法及装置 | |
CN104182226B (zh) | 一种通用移动信息系统适配方法与装置 | |
CN107623666A (zh) | 信息搜索的方法、装置和系统 | |
CN110032731A (zh) | 企业经营范围判断方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200814 Address after: 250100 Room 3110, S01 Building, Tidal Building, 1036 Tidal Road, Jinan High-tech Zone, Shandong Province Applicant after: Shandong Aicheng Network Information Technology Co.,Ltd. Address before: 250100 Ji'nan science and technology zone, Shandong high tide Road, No. 1036 wave of science and Technology Park, building S06 Applicant before: SHANDONG INSPUR CLOUD SERVICE INFORMATION TECHNOLOGY Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180619 |
|
RJ01 | Rejection of invention patent application after publication |