CN112417073A - 空气质量状况自动播报方法、装置、电子设备及存储介质 - Google Patents

空气质量状况自动播报方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112417073A
CN112417073A CN202011299970.8A CN202011299970A CN112417073A CN 112417073 A CN112417073 A CN 112417073A CN 202011299970 A CN202011299970 A CN 202011299970A CN 112417073 A CN112417073 A CN 112417073A
Authority
CN
China
Prior art keywords
target webpage
rendering
data
crawling
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011299970.8A
Other languages
English (en)
Inventor
于鹏程
陈生园
卓流艺
秦东明
张燕青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3Clear Technology Co Ltd
Original Assignee
3Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3Clear Technology Co Ltd filed Critical 3Clear Technology Co Ltd
Priority to CN202011299970.8A priority Critical patent/CN112417073A/zh
Publication of CN112417073A publication Critical patent/CN112417073A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种空气质量状况自动播报方法、装置、电子设备及存储介质。该方法包括:根据预先设定的登录周期,周期性地登录目标网页;渲染所登录的目标网页;爬取渲染后的目标网页,获取目标网页数据并保存至数据库;根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值;按照预设发布时间发布计算得到的各空气污染物浓度均值。本申请的方法能够实现自动从不同网站的目标网页上获取空气质量数据,计算各空气污染物浓度平均值,然后自动将平均值数据发送给用户端,克服了现有技术中通过人工获取网站网页查询空气质量情况、人工汇总统计分析时所存在的工作繁琐易出错、人工成本较高以及工作效率低下的技术缺陷。

Description

空气质量状况自动播报方法、装置、电子设备及存储介质
技术领域
本申请涉及环境监测技术领域,具体涉及一种空气质量状况自动播报方法、装置、电子设备及存储介质。
背景技术
在环境监测领域一项重要的工作是获取当前环境情况并为政府的环境治理提供决策支持,但是由于目前各种信息展示在不同网站上,需要人工访问网站网页查询空气质量情况,然后手动复制到Excel中进行汇总统计作图分析,非常繁琐且容易出错,人工成本较高,工作效率低下。
发明内容
本申请的目的是提供一种空气质量状况自动播报方法、装置、电子设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本申请实施例的一个方面,提供一种空气质量状况自动播报方法,包括:
根据预先设定的登录周期,周期性地登录目标网页;
根据预设的渲染方式渲染所登录的目标网页;
爬取渲染后的目标网页,获取目标网页数据并保存至数据库;
根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值;
按照预设发布时间发布计算得到的各空气污染物浓度均值。
进一步地,所述根据预设的渲染方式渲染所登录的目标网页,包括:
采集控件属性集,将所述控件属性集加载到静态页面内置的外壳对象;控件属性集用于渲染所登录的目标网页的页面控件;
在所述控件属性集加载完成后,为在所登录的目标网页配置时生成的页面文件独立一个内置对象,以使所述页面文件中的各个控件相互独立;
检测所述控件是否进行加载,并在检测到所述各个控件进行加载后,加载与所述控件相对应的所述控件属性集,对目标网页的页面进行渲染。
进一步地,所述爬取渲染后的目标网页,包括:
根据目标网页的网页地址,选取与目标网页对应的爬取配置文件;
根据所选取的爬取配置文件中的目标网页数据的位置,爬取目标网页中的目标网页数据。
进一步地,所述根据预设的渲染方式渲染所登录的目标网页,包括:
调用phantomjs对所登录的目标网页进行渲染,或者选取jxbrowser对所登录的目标网页进行渲染。
进一步地,所述登录目标网页,包括:
根据所述目标网页的网页地址,获取到所述目标网页的身份验证信息,利用所述身份验证信息进行验证,验证成功后登入所述目标网页。
根据本申请实施例的另一个方面,提供一种空气质量状况自动播报装置,其特征在于,包括:
登录模块,用于根据预先设定的登录周期,周期性地登录目标网页;
渲染模块,用于根据预设的渲染方式渲染所登录的目标网页;
爬取模块,用于爬取渲染后的目标网页,获取目标网页数据并保存至数据库;
计算模块,用于根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值;
发布模块,用于按照预设发布时间发布计算得到的各空气污染物浓度均值。
进一步地,所述渲染模块,包括:
采集单元,用于采集控件属性集,将所述控件属性集加载到静态页面内置的外壳对象;控件属性集用于渲染所登录的目标网页的页面控件;
设置单元,用于在所述控件属性集加载完成后,为在所登录的目标网页配置时生成的页面文件独立设置一个内置对象,以使所述页面文件中的各个控件相互独立;
渲染单元,用于检测所述控件是否进行加载,并在检测到所述各个控件进行加载后,加载与所述控件相对应的所述控件属性集,对目标网页的页面进行渲染。
进一步地,所述爬取模块,包括:
选取单元,用于根据目标网页的网页地址,选取与目标网页对应的爬取配置文件;
爬取单元,用于根据所选取的爬取配置文件中的目标网页数据的位置,爬取目标网页中的目标网页数据。
根据本申请实施例的另一个方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的空气质量状况自动播报方法。
根据本申请实施例的另一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的空气质量状况自动播报方法。
本申请实施例的其中一个方面提供的技术方案可以包括以下有益效果:
本申请实施例提供的空气质量状况自动播报方法,能够实现自动从不同网站的目标网页上获取空气质量数据,计算各空气污染物浓度平均值,然后自动将平均值数据发送给用户端,克服了现有技术中通过人工获取网站网页查询空气质量情况、人工汇总统计分析时所存在的工作繁琐易出错、人工成本较高以及工作效率低下的技术缺陷。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,部分特征和优点可以从说明书中推知或毫无疑义地确定,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请的一个实施例的空气质量状况自动播报方法流程图;
图2示出了图1所对应实施例中步骤S20的流程图;
图3示出了图1所对应实施例中步骤S30的流程图;
图4示出了本申请的一个实施例的空气质量状况自动播报装置结构框图;
图5示出了图4所对应实施例中渲染模块102的结构框图;
图6示出了图4所对应实施例中爬取模块103的结构框图;
图7示出了本申请的一个实施例的电子设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本申请做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
如图1所示,本申请的一个实施例提供了一种空气质量状况自动播报方法,包括:
S10、根据预先设定的登录周期,周期性地登录目标网页。
例如,预先设定的登录周期为1小时,则每隔一小时即登录一次目标网页。目标网页也是预先设定的,可以为若干空气质量数据发布网站的网页,例如可以为五个空气质量数据发布网站的网页。
在某些实施方式中,步骤S10包括:根据所述目标网页的网页地址,获取到所述目标网页的身份验证信息,利用所述身份验证信息进行验证,验证成功后登入所述目标网页。
在登录网页时,需要提供身份验证信息;例如,身份验证信息可以是账号和密码等,且一般情况下,身份验证信息可以存储在cookies中,cookies可以是从用户终端中获取。目标网页即预先设定的发布空气质量数据的网页,在现有技术中,用户需要主动访问这些网页来查询空气质量情况。
根据目标网页的网页地址,获取到目标网页的身份验证信息。例如,需要将目标网页“空气质量监测网”的用户账号的相关提示信息显示到用户终端,则网页数据爬取平台获取到该目标网页“空气质量监测网”的网页地址,根据该网页地址,网页数据爬取平台获取该目标网页“空气质量监测网”的cookies,该cookies中存储有身份验证信息,身份验证信息为账号和密码。网页地址即URL地址。
采用正确的账号和密码,即可登录网页。例如,网页数据爬取平台获取到目标网页“空气质量监测网”的账号和密码,则通过该账号和密码通过验证,登录网页。
网页数据爬取平台向目标网页的网站服务器发送身份验证信息,当目标网页的网站服务器验证该身份验证信息与预存的身份验证信息匹配,则认为该身份验证信息有效,可以登入该目标网页。例如,当网页数据爬取平台获取目标网页“空气质量监测网”的身份验证信息,当IP地址与身份验证信息经“空气质量监测网”的网站服务器验证后,即可登入“空气质量监测网”。
S20、根据预设的渲染方式渲染所登录的目标网页。
网页渲染引擎的作用是将资源文件转化为可见的数据。例如将HTML或CSS或JavaScript文本及相应的资源文件转换成图像数据等。
如图2所示,在某些实施方式中,步骤S20包括:
S201、采集控件属性集,将所述控件属性集加载到静态页面内置的外壳对象。控件属性集用于渲染所登录的目标网页的页面控件。
控件属性集包括用于定义网页内容的一个控件数据、用于定义控件数据行为的多个属性数据,以及与控件数据对应的控件权限数据和业务数据。采集控件数据和多个属性数据,将控件数据和多个属性数据加载到静态页面内置的外壳对象后,采集控件权限数据并加载到静态页面内置的外壳对象。
S202、在所述控件属性集加载完成后,为在所登录的目标网页配置时生成的页面文件独立设置一个内置对象,以使所述页面文件中的各个控件相互独立。
当检测到控件属性集加载完成后,通过动态注册控制器为页面文件独立一个内置对象,使页面文件中各个控件相互独立,与其他控件不产生任何关系。动态注册控制器是由第三方的插件angular来实现的,在启动目标网页的页面时自动执行。
S203、检测所述控件是否进行加载,并在检测到所述各个控件进行加载后,加载与所述控件相对应的所述控件属性集,对目标网页的页面进行渲染。
检测各个控件是否进行加载,当检测到各个控件进行加载后,查找静态页面内置的外壳对象中是否存在与控件对应的控件属性集。若存在,则加载对应的控件属性集对目标网页的页面进行渲染;否则,隐藏控件。
具体地,以JavaScript为例,HTML解析器解析网页内容,然后构建DOM树,在这期间如果遇到JavaScript代码则交给JavaScript引擎处理。WebKit根据URL调用资源加载器加载相应资源;加载器依赖网络模块建立连接,发送请求并接收答复;WebKit接收各种网页或者资源数据,其中某些资源可能同步或异步获取;网页交给HTML解析器转变为词语;解析器根据词语构建节点,形成DOM树;如果节点是JavaScript代码,调用JavaScript引擎解析并执行;JavaScript代码可能会修改DOM树结构;如果节点依赖其他资源,如图片\css、视频等,调用资源加载器加载它们,但这些是异步加载的,不会阻碍当前DOM树继续创建;如果是JavaScript资源URL(没有标记异步方式),则需要停止当前DOM树创建,直到JavaScript加载并被JavaScript引擎执行后才继续DOM树的创建。绘图上下文是一个抽象类,用于将每个绘图操作桥接到不同的具体实现类,也就是绘图具体实现类;绘图实现类也可能有简单的实现,也可能有复杂的实现,软件渲染、硬件渲染、合成渲染等;绘图实现类将图形库绘制结果保存。
在某些实施方式中,渲染目标网页的方式包括:调用phantomjs(无界面浏览器)对目标网页进行渲染,或者选取jxbrowser(浏览器组件)对目标网页进行渲染等。
例如,调用phantomjs或者jxbrowser渲染目标网页“空气质量监测网”。
S30、爬取渲染后的目标网页,获取目标网页数据并保存至数据库。目标网页数据包括各空气污染物浓度和各空气污染物浓度检测时间。
具体地,目标网页数据是指存储在目标网站服务器上可以在目标网页上显示的内容等,目标网页数据可以是文字数据、图片数据或数字数据等。当目标网页上的数据完全显示时,则认为目标网页渲染完成,进而网页数据平台获取到目标网页数据,例如,当目标网页“空气质量监测网”上的“今日空气监测数据”完全显示,则“空气质量监测网”的网页渲染完成,网页数据平台可以爬取到“空气质量监测网”上的“今日空气监测数据”。
在某些实施方式中,如图3所示,步骤S30中的爬取渲染后的目标网页包括:
S301:根据目标网页的网页地址,选取与目标网页对应的爬取配置文件。
爬取配置文件是指在对目标网页进行爬取时根据所执行的数据爬取规则,爬取配置文件中存储有目标网页的地址的起始部分,还存储有目标网页上的目标网页数据的位置。目标网页数据的位置可以是目标网页数据中的数据行数,还可以是目标网页数据所在网页的显示区域的坐标等。根据目标网页的网页地址,与配置文件中存储的网页地址的起始部分匹配,从存储配置文件的数据库中正确选择目标网页的爬取配置文件。
S302:根据所选取的爬取配置文件中的目标网页数据的位置,爬取目标网页中的目标网页数据。
爬取配置文件中可以存储有目标网页数据的位置,可选地,目标网页数据的位置可以是目标网页数据所在网页的显示区域的坐标,可以是目标网页数据的行数等。例如,爬取配置文件中可以存储目标网页位置为在目标网页上显示“今日空气监测数据”的区域的坐标,可以存储目标网页数据的位置为目标网页上第十行的数据,可以存储目标网页数据的位置为第一行至第五行的数据,也可以存储目标网页数据的位置为整个页面的数据等。网页数据爬取平台根据爬取配置文件中存储的目标网页数据的位置,爬取目标网页中的目标网页数据。
在某些实施方式中,可以使用Jsoup抓取网页数据并保存至数据库。
网页数据爬取平台可以获取目标网页的身份验证信息,利用身份验证信息登录到目标网页,根据目标网页对应的渲染方式渲染目标网页,当目标网页渲染完成后,则爬取目标网页的数据。
S40、根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值。
例如,每隔一小时登录一次目标网页,目标网页共五个,分别为A网页、B网页、C网页、D网页和E网页,则每一登录周期会获得该五个目标网页的数据,计算出每一登录周期中该五个目标网页中发布的各空气污染物浓度的均值。
例如,A网页、B网页、C网页、D网页和E网页五个目标网页所公布的PM浓度、PM.5浓度、O浓度和SO2浓度如下表所示:
Figure BDA0002786489000000081
求五个目标网页所公布数据的平均值,则PM浓度、PM.5浓度、O浓度和SO2浓度的平均值分别为72μg/m3、28.6μg/m3、92.6μg/m3、26μg/m3
S50、按照预设发布时间发布计算得到的各空气污染物浓度均值。
具体地,例如可以设定每一登录周期中计算出各空气污染物浓度均值即发布。可以将各空气污染物浓度均值的数据转换为图片或文字形式进行发布。发布方式例如可以为调用微信公众平台提供的接口向关注的用户推送消息、向用户手机发送短信、向客户邮箱发送邮件等。
另外,还可以对不同地区的各空气污染物浓度均值进行排名,将排名信息一并发布。例如:20时,我市空气质量为良,AQI为62,全省排第8位;首要污染物为PM,浓度为73微克/立方米,全省排第10位;PM.5浓度为28微克/立方米,全省排第5位;O浓度为94微克/立方米,全省排第14位。
如图4所示,本申请的另一个实施例提供了一种空气质量状况自动播报装置,包括:
登录模块101,用于根据预先设定的登录周期,周期性地登录目标网页;
渲染模块102,用于根据预设的渲染方式渲染所登录的目标网页;
爬取模块103,用于爬取渲染后的目标网页,获取目标网页数据并保存至数据库;
计算模块104,用于根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值;
发布模块105,用于按照预设发布时间发布计算得到的各空气污染物浓度均值。
如图5所示,在某些实施方式中,所述渲染模块102,包括:
采集单元1021,用于采集控件属性集,将所述控件属性集加载到静态页面内置的外壳对象;控件属性集用于渲染所登录的目标网页的页面控件;
设置单元1022,用于在所述控件属性集加载完成后,为在所登录的目标网页配置时生成的页面文件独立设置一个内置对象,以使所述页面文件中的各个控件相互独立;
渲染单元1023,用于检测所述控件是否进行加载,并在检测到所述各个控件进行加载后,加载与所述控件相对应的所述控件属性集,对目标网页的页面进行渲染。
如图6所示,在某些实施方式中,所述爬取模块103,包括:
选取单元1031,用于根据目标网页的网页地址,选取与目标网页对应的爬取配置文件;
爬取单元1032,用于根据所选取的爬取配置文件中的目标网页数据的位置,爬取目标网页中的目标网页数据。
本申请的另一个实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的空气质量状况自动播报方法。如图7所示,所述电子设备20可以包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的空气质量状况自动播报方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还可以包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述空气质量状况自动播报方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,可以包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请的另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的空气质量状况自动播报方法。
需要说明的是:
术语“模块”并非意图受限于特定物理形式。取决于具体应用,模块可以实现为硬件、固件、软件和/或其组合。此外,不同的模块可以共享公共组件或甚至由相同组件实现。不同模块之间可以存在或不存在清楚的界限。
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例仅表达了本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种空气质量状况自动播报方法,其特征在于,包括:
根据预先设定的登录周期,周期性地登录目标网页;
根据预设的渲染方式渲染所登录的目标网页;
爬取渲染后的目标网页,获取目标网页数据并保存至数据库;
根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值;
按照预设发布时间发布计算得到的各空气污染物浓度均值。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的渲染方式渲染所登录的目标网页,包括:
采集控件属性集,将所述控件属性集加载到静态页面内置的外壳对象;控件属性集用于渲染所登录的目标网页的页面控件;
在所述控件属性集加载完成后,为在所登录的目标网页配置时生成的页面文件独立一个内置对象,以使所述页面文件中的各个控件相互独立;
检测所述控件是否进行加载,并在检测到所述各个控件进行加载后,加载与所述控件相对应的所述控件属性集,对目标网页的页面进行渲染。
3.根据权利要求1所述的方法,其特征在于,所述爬取渲染后的目标网页,包括:
根据目标网页的网页地址,选取与目标网页对应的爬取配置文件;
根据所选取的爬取配置文件中的目标网页数据的位置,爬取目标网页中的目标网页数据。
4.根据权利要求1所述的方法,其特征在于,所述根据预设的渲染方式渲染所登录的目标网页,包括:
调用phantomjs对所登录的目标网页进行渲染,或者选取jxbrowser对所登录的目标网页进行渲染。
5.根据权利要求1所述的方法,其特征在于,所述登录目标网页,包括:
根据所述目标网页的网页地址,获取到所述目标网页的身份验证信息,利用所述身份验证信息进行验证,验证成功后登入所述目标网页。
6.一种空气质量状况自动播报装置,其特征在于,包括:
登录模块,用于根据预先设定的登录周期,周期性地登录目标网页;
渲染模块,用于根据预设的渲染方式渲染所登录的目标网页;
爬取模块,用于爬取渲染后的目标网页,获取目标网页数据并保存至数据库;
计算模块,用于根据每一登录周期获取的目标网页数据,计算每一登录周期中各空气污染物浓度均值;
发布模块,用于按照预设发布时间发布计算得到的各空气污染物浓度均值。
7.根据权利要求6所述的方法,其特征在于,所述渲染模块,包括:
采集单元,用于采集控件属性集,将所述控件属性集加载到静态页面内置的外壳对象;控件属性集用于渲染所登录的目标网页的页面控件;
设置单元,用于在所述控件属性集加载完成后,为在所登录的目标网页配置时生成的页面文件独立设置一个内置对象,以使所述页面文件中的各个控件相互独立;
渲染单元,用于检测所述控件是否进行加载,并在检测到所述各个控件进行加载后,加载与所述控件相对应的所述控件属性集,对目标网页的页面进行渲染。
8.根据权利要求1所述的方法,其特征在于,所述爬取模块,包括:
选取单元,用于根据目标网页的网页地址,选取与目标网页对应的爬取配置文件;
爬取单元,用于根据所选取的爬取配置文件中的目标网页数据的位置,爬取目标网页中的目标网页数据。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-5中任一所述的空气质量状况自动播报方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-5中任一所述的空气质量状况自动播报方法。
CN202011299970.8A 2020-11-18 2020-11-18 空气质量状况自动播报方法、装置、电子设备及存储介质 Pending CN112417073A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011299970.8A CN112417073A (zh) 2020-11-18 2020-11-18 空气质量状况自动播报方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011299970.8A CN112417073A (zh) 2020-11-18 2020-11-18 空气质量状况自动播报方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112417073A true CN112417073A (zh) 2021-02-26

Family

ID=74773513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011299970.8A Pending CN112417073A (zh) 2020-11-18 2020-11-18 空气质量状况自动播报方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112417073A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462566A (zh) * 2014-12-26 2015-03-25 中科宇图天下科技有限公司 一种环保信息网格抓取方法
CN107517263A (zh) * 2017-09-01 2017-12-26 海南师范大学 基于实景环境和信息抽取为一体的环境质量监测系统
CN107704497A (zh) * 2017-08-25 2018-02-16 上海壹账通金融科技有限公司 网页数据爬取方法、装置、网页数据爬取平台及存储介质
CN108304498A (zh) * 2018-01-12 2018-07-20 深圳壹账通智能科技有限公司 网页数据采集方法、装置、计算机设备和存储介质
CN108519984A (zh) * 2018-02-07 2018-09-11 平安科技(深圳)有限公司 天气数据处理方法、服务器及计算机可读存储介质
CN109710329A (zh) * 2018-12-17 2019-05-03 浩云科技股份有限公司 网页页面渲染方法、装置及终端设备
CN110134841A (zh) * 2018-02-09 2019-08-16 鼎复数据科技(北京)有限公司 自定义实时获取网站数据的方法
CN110347895A (zh) * 2019-06-11 2019-10-18 重庆工商大学融智学院 基于Web的生态空间数据爬取方法
CN110659190A (zh) * 2019-08-19 2020-01-07 深圳市彬讯科技有限公司 质量报告生成方法、装置、设备及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462566A (zh) * 2014-12-26 2015-03-25 中科宇图天下科技有限公司 一种环保信息网格抓取方法
CN107704497A (zh) * 2017-08-25 2018-02-16 上海壹账通金融科技有限公司 网页数据爬取方法、装置、网页数据爬取平台及存储介质
CN107517263A (zh) * 2017-09-01 2017-12-26 海南师范大学 基于实景环境和信息抽取为一体的环境质量监测系统
CN108304498A (zh) * 2018-01-12 2018-07-20 深圳壹账通智能科技有限公司 网页数据采集方法、装置、计算机设备和存储介质
CN108519984A (zh) * 2018-02-07 2018-09-11 平安科技(深圳)有限公司 天气数据处理方法、服务器及计算机可读存储介质
CN110134841A (zh) * 2018-02-09 2019-08-16 鼎复数据科技(北京)有限公司 自定义实时获取网站数据的方法
CN109710329A (zh) * 2018-12-17 2019-05-03 浩云科技股份有限公司 网页页面渲染方法、装置及终端设备
CN110347895A (zh) * 2019-06-11 2019-10-18 重庆工商大学融智学院 基于Web的生态空间数据爬取方法
CN110659190A (zh) * 2019-08-19 2020-01-07 深圳市彬讯科技有限公司 质量报告生成方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108829597B (zh) 软件众测方法及装置、计算机装置及可读存储介质
CN107133180B (zh) 动态页面的测试方法、测试装置及存储介质
CN109981653B (zh) 一种web漏洞扫描方法
CN111343168B (zh) 一种身份验证的方法、装置、计算机设备及可读存储介质
CN110990233A (zh) 一种利用甘特图展示soar的方法和系统
CN112817867A (zh) 一种接口测试脚本生成方法、装置、计算机设备和介质
CN111106899A (zh) 物联网中的数据校验方法、装置、计算机设备及存储介质
CN110708360A (zh) 一种信息处理方法、系统和电子设备
CN111309743A (zh) 报表推送方法及装置
CN111694550A (zh) 一种页面显示控制方法、装置及系统
CN108650123B (zh) 故障信息记录方法、装置、设备和存储介质
CN111984520A (zh) 埋点测试方法、计算机设备及计算机可读存储介质
CN112437148B (zh) 业务请求的处理方法、装置、业务服务器及系统
CN107844515B (zh) 数据合规检查方法及装置
CN112346944A (zh) 一种监控网页用户操作体验的方法、设备及存储介质
CN111859077A (zh) 数据处理方法、装置、系统、计算机可读存储介质
CN111901180A (zh) 教育系统的多租户终端生成方法、装置、设备和存储介质
CN109815083B (zh) 一种应用崩溃的监控方法、装置、电子设备及介质
CN112417073A (zh) 空气质量状况自动播报方法、装置、电子设备及存储介质
CN117113430A (zh) 网页违规图片检测方法和装置、电子设备、存储介质
CN112083925A (zh) 基于h5页面开发的数据获取方法、装置、设备及存储介质
CN112650684B (zh) 网页取证的验证方法、装置、设备及存储介质
CN112380415B (zh) 空气质量信息的自动生成及发送方法、装置、设备及介质
CN111368231B (zh) 一种异构冗余架构网站的测试方法及装置
CN112579956A (zh) 网站账号的管理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210226

RJ01 Rejection of invention patent application after publication