CN109948075B - 网页数据的标记方法及装置 - Google Patents

网页数据的标记方法及装置 Download PDF

Info

Publication number
CN109948075B
CN109948075B CN201710875976.7A CN201710875976A CN109948075B CN 109948075 B CN109948075 B CN 109948075B CN 201710875976 A CN201710875976 A CN 201710875976A CN 109948075 B CN109948075 B CN 109948075B
Authority
CN
China
Prior art keywords
target
webpage
data content
static data
marking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710875976.7A
Other languages
English (en)
Other versions
CN109948075A (zh
Inventor
张鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710875976.7A priority Critical patent/CN109948075B/zh
Publication of CN109948075A publication Critical patent/CN109948075A/zh
Application granted granted Critical
Publication of CN109948075B publication Critical patent/CN109948075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种网页数据的标记方法及装置,涉及信息处理技术领域,主要目的在于解决在对截图的内容进行标记时,由于截图不清晰会增加直观定位到截图中特定元素的复杂度的问题。本发明的技术方案包括:根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;在所述目标静态数据内容处根据预设标记样式添加标记;对添加所述预设标记样式的目标网页进行截图。本发明应用于对网页数据进行标记的过程中。

Description

网页数据的标记方法及装置
技术领域
本发明涉及信息处理技术领域,特别是涉及一种网页数据的标记方法及装置。
背景技术
随着信息技术的快速发展,人们获取数据的方式越来越多,例如从网页上获取需要的数据,这种获取数据的方式大大减少了人们日常工作的负荷。
为了获取网页中的原始数据,可通过截图的方式将网页中的数据进行截图,还可以对截取后的图片进行标记、截取、框选等标记操作。发明人在实现上述发明过程中,发现现有技术中在对截图进行标记操作时,标记操作受限于截取图片的清晰度、像素偏移量等,难以对定位到截图中的特定元素。
发明内容
有鉴于此,本发明提供的一种网页数据的标记方法及装置,主要目的在于解决在对截图的内容进行标记时,难以定位到截图中特定元素的问题。
为了解决上述问题,本发明主要提供如下技术方案:
第一方面,本发明实施例提供一种网页数据的标记方法,包括:
根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;
根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;
在所述目标静态数据内容处根据预设标记样式添加标记;
对添加所述预设标记样式的目标网页进行截图。
可选的,在所述目标静态数据内容处根据预设标记样式添加标记包括:
在所述目标网页中添加自定义层叠样式表CSS,所述自定义层叠样式表CSS中记录有多种预设标记样式;
在所述目标静态数据内容处添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式;
基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式,并将所述至少一种标记样式添加至所述目标静态数据内容处。
可选的,基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式包括:
若预先配置所述预设关键字与标记样式之间的对应关系,则根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式;
或者,显示所述自定义层叠样式表CSS中的所有标记样式,基于所述JS脚本接收对所述标记样式的选择指令,根据所述选择指令确定标记样式,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生。
可选的,根据预设关键字在所述目标网页中查找匹配的目标静态数据内容包括:
获取所述目标网页的源代码;
在所述目标网页的源代码中,遍历与所述预设关键字匹配的所述目标静态数据内容。
可选的,所述方法还包括:
在所述目标网页的源代码中对所述目标静态数据内容处执行添加标记;
将目标网页的源代码中添加的标记,同步到目标网页显示界面中的目标静态数据内容处。
第二方面,本发明提供一种网页数据的标记装置,包括:
生成单元,用于根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;
查找单元,用于根据预设关键字在所述生成单元生成的所述目标网页中查找匹配的目标静态数据内容;
第一添加单元,用于在所述查找单元查找的所述目标静态数据内容处根据预设标记样式添加标记;
截图单元,用于对所述第一添加单元添加所述预设标记样式的目标网页进行截图。
可选的,所述第一添加单元包括:
第一添加模块,用于在所述目标网页中添加自定义层叠样式表CSS,所述自定义层叠样式表CSS中记录有多种预设标记样式;
第二添加模块,用于在所述目标静态数据内容处添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式;
确定模块,用于基于所述第二添加模块添加的所述JS脚本从所述第一添加模块添加的所述自定义层叠样式表CSS中确定至少一种标记样式;
第三添加模块,用于将所述确定模块确定的所述至少一种标记样式添加至所述目标静态数据内容处。
可选的,所述确定模块包括:
第一确定子模块,用于当预先配置所述预设关键字与标记样式之间的对应关系时,根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式;
显示子模块,用于显示所述自定义层叠样式表CSS中的所有标记样式;
接收子模块,用于基于所述JS脚本接收对所述标记样式的选择指令,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生;
第二确定子模块,用于根据所述选择指令确定标记样式。
可选的,所述查找单元包括:
获取模块,用于获取所述目标网页的源代码;
遍历模块,用于在所述获取模块获取的所述目标网页的源代码中,遍历与所述预设关键字匹配的所述目标静态数据内容。
可选的,所述装置还包括:
第二添加单元,用于在所述目标网页的源代码中对所述目标静态数据内容处执行添加标记;
同步单元,用于将所述第二添加单元添加的目标网页的源代码中添加的标记,同步到目标网页显示界面中的目标静态数据内容处。
为了实现上述目的,根据本发明的第三方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上所述的网页数据的标记方法。
为了实现上述目的,根据本发明的第四方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行如上所述的网页数据的标记方法。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供的网页数据的标记方法及装置,根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;在所述目标静态数据内容处根据预设标记样式添加标记;对添加所述预设标记样式的目标网页进行截图;与现有技术相比,本发明采用将待截取网页的数据内容,完全转移至新生成的目标网页,在目标网页中执行标记的添加、截图等操作,不受图片的清晰度、像素偏移量的影响,能够快速定位到目标静态数据内容。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网页数据的标记方法的流程图;
图2示出了本发明实施例提供的一种在目标静态数据内容处根据预设标记样式添加标记的流程图;
图3示出了本发明实施例提供的一种网页数据的标记装置的组成框图;
图4示出了本发明实施例提供的另一种网页数据的标记装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种网页数据的标记方法,该方法应用于非本地的网页中,如图1所示,所述方法包括:
101、根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容。
用户在浏览网页,由于该网页为非本地网页,用户无法直接对网页内容进行编辑。若用户想要截取网页中的某些内容,可以通过两种方式进行截图,一个是通过触发网页中的截图按键执行截图操作,另一个是通过使用快捷键执行截图操作。
假设,用户使用触发待截取网页中的截图按键执行截图操作,根据待截取网页重新生成一个目标网页,该目标网页中包含有待截取网页中的所有静态数据,即目标网页相当于完全复制了待截取网页中的数据内容,目标网页与待截取网页不同的是,待截取网页中可执行链接的跳转,而目标网页中不能执行基于链接的跳转,但是目标网页与待截取网页中包含的内容是一致的,目标网页包含了待截取网页的超文本标记语言(HyperTextMarkup Language,Html)元素、javascript Js内容等等。
102、根据预设关键字在所述目标网页中查找匹配的目标静态数据内容。
需要强调的是从步骤102到步骤104的执行过程是针对目标网页进行的操作。
本步骤所述的预设关键字是用户根据实际需求设置的,从技术层面讲,使用预设关键字在所述目标网页的源代码中查找与预设关键字匹配的目标静态数据内容。作为本发明实施例的另一种实现方式,用户可以在目标网页中通过用户的眼睛人工查找目标静态数据内容。具体的,本发明实施例对查找目标静态数据内容的方式不做限定。
103、在所述目标静态数据内容处根据预设标记样式添加标记。
对于在原代码中查找目标静态数据内容的方式,在对目标静态数据内容添加标记时,也是在源代码中添加,添加完成后,目标网页中会同步显示标记。
对于用户人工查找目标静态数据内容的方式而言,通过触发目标网页中的添加标记的控制按键,在目标静态数据内容出显示一些可选择的标记,供用户选择,该种方式中,强调与用户的交互性。
不管采用哪种添加标记的方式,在添加标记时,可以对目标静态数据内容本身添加标记,如标记为高亮显示、下划线、字体颜色、字体大小、删除线、字体加粗、添加边框等等,还可以对目标静态数据内容后的空格添加标记,如批注框、标注等等。本发明实施例对添加标记的位置、样式不做限定。
104、对添加所述预设标记样式的目标网页进行截图。
在对目标网页添加完标记后,可触发目标网页中的截图按键,或者通过触发截图快捷键的方式完成对目标网页的截图,该截图中的像素、清晰度与待截取网页的像素、清晰度相同。
需要说明的是,本次截图后,无法对截图后的图片进行再次编辑,若用户想要对截图进行重新编辑或者修改,需要在目标网页中再次执行步骤103以及本步骤,完成截图的编辑或修改。
本发明提供的网页数据的标记方法,根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;在所述目标静态数据内容处根据预设标记样式添加标记;对添加所述预设标记样式的目标网页进行截图;与现有技术相比,本发明采用将待截取网页的数据内容,完全转移至新生成的目标网页,在目标网页中执行标记的添加、截图等操作,不受图片的清晰度、像素偏移量的影响,能够快速定位到目标静态数据内容。
作为对上述实施例的细化及扩展,在步骤103执行在所述目标静态数据内容处根据预设标记样式添加标记时,可以采用但不局限于以下方式,如图2所示,所述方法包括:
201、在所述目标网页中添加自定义层叠样式表CSS。
通过修改待截取网页的文档对象模型(Document Object Model,DOM)内容节点,在目标网页中添加自定义层叠样式表(Cascading Style Sheets,CSS),所述自定义层叠样式表CSS中记录有多种预设标记样式,所述预设标记样式请参考步骤103中所述的标记种类。
在自定义CSS样式中,每种标记对应一对class属性值和class标签,当class属性值变化时,class标签随之变化,例如,当某标记的class属性值为0时,class标签为未选中,当某标记的class属性值为1时,标记的class标签为选中。
202、在所述目标静态数据内容处添加JS脚本。
与添加自定义CSS样式类似,在添加JS脚本时,修改待截取网页的DOM内容节点,在目标网页中添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式,除此之外,JS脚本还能够将选择的标记样式记录于目标网页中,使得目标网页保留添加标记后的状态。
203、基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式,并将所述至少一种标记样式添加至所述目标静态数据内容处。
在具体执行过程中,JS脚本根据步骤203中的class标签对目标静态数据内容进行标记。需要说明的是,在对目标静态数据内容进行标记时,可以同时执行多种标记方式,例如,对目标静态数据内容同时进行高亮、下划线、加粗标记,本发明实施例对同一目标静态数据内容添加标记的数量不做限定。
在具体应用过程中,在JS脚本执行从自定义CSS中确定至少一种标记样式时,可以通过以下两种方式:
方式一:
若预先配置所述预设关键字与标记样式之间的对应关系,则根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式。
该种方式能够实现截图操作的模板化,即将预先配置的预设关键字与标记样式之间的对应关系作为一个模板,在对同一类型的目标网页进行截图时,均可采用本方式去确定至少一个标记样式,减少了用户配置目标静态数据内容与标记样式的工作消耗。
该种操作方式一般会在目标网页的源代码侧执行。首先,获取所述目标网页的源代码,其次,在所述目标网页的源代码中,遍历与所述预设关键字匹配的所述目标静态数据内容,最后,根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式,将所述至少一种标记样式添加至所述目标静态数据内容处,完成对目标静态数据内容添加标记。
由于该种方式的截图方式是在目标网页的源代码侧执行的,为了增强截图的灵活性,会将目标网页的源代码中添加的标记,同步到目标网页显示界面中的目标静态数据内容处,可以实时预览添加标记的结果,若不符合用户需求,可重新添加标记。
在所述目标网页的源代码中对所述目标静态数据内容处执行添加标记;
方式二:
显示所述自定义层叠样式表CSS中的所有标记样式,基于所述JS脚本接收对所述标记样式的选择指令,根据所述选择指令确定标记样式,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生。
该种实现方式一般在目标网页的显示界面中执行,当用户手动查找到目标静态数据内容时,通过触发目标网页中的添加标记控制按键,会在目标网页中显示自定义CSS样式中的所有标记样式,用户可以根据显示的标记样式进行选择、触发标记样式,基于所述JS脚本接收用户对所述标记样式的选择指令,根据所述选择指令确定标记样式,所述选择指令用户从所述自定义层叠样式表CSS中选择至少一种标记样式,将所述至少一种标记样式添加至所述目标静态数据内容处。
在实际应用过程中,该种方式是由用户的个人意愿去选择的标记样式,添加标记的灵活性更大。
需要说明的是,上述实施例详细描述了两种确定标记样式的方式,上述两种方式可以独立使用,也可以两者结合使用,具体的,本发明实施例对此不做限定。
进一步的,作为对上述图1及图2所示方法的实现,本发明另一实施例还提供了一种网页数据的标记装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。
本发明实施例提供一种网页数据的标记装置,如图3所示,包括:
生成单元31,用于根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;
查找单元32,用于根据预设关键字在所述生成单元31生成的所述目标网页中查找匹配的目标静态数据内容;
第一添加单元33,用于在所述查找单元32查找的所述目标静态数据内容处根据预设标记样式添加标记;
截图单元34,用于对所述第一添加单元33添加所述预设标记样式的目标网页进行截图。
进一步的,如图4所示,所述第一添加单元33包括:
第一添加模块331,用于在所述目标网页中添加自定义层叠样式表CSS,所述自定义层叠样式表CSS中记录有多种预设标记样式;
第二添加模块332,用于在所述目标静态数据内容处添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式;
确定模块333,用于基于所述第二添加模块332添加的所述JS脚本从所述第一添加模块331添加的所述自定义层叠样式表CSS中确定至少一种标记样式;
第三添加模块334,用于将所述确定模块333确定的所述至少一种标记样式添加至所述目标静态数据内容处。
进一步的,如图4所示,所述确定模块333包括:
第一确定子模块3331,用于当预先配置所述预设关键字与标记样式之间的对应关系时,根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式;
显示子模块3332,用于显示所述自定义层叠样式表CSS中的所有标记样式;
接收子模块3333,用于基于所述JS脚本接收对所述标记样式的选择指令,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生;
第二确定子模块3334,用于根据所述选择指令确定标记样式。
进一步的,如图4所示,所述查找单元包括:
获取模块,用于获取所述目标网页的源代码;
遍历模块,用于在所述获取模块获取的所述目标网页的源代码中,遍历与所述预设关键字匹配的所述目标静态数据内容。
进一步的,如图4所示,所述装置还包括:
第二添加单元35,用于在所述目标网页的源代码中对所述目标静态数据内容处执行添加标记;
同步单元36,用于将所述第二添加单元35添加的目标网页的源代码中添加的标记,同步到目标网页显示界面中的目标静态数据内容处。
本发明提供的网页数据的标记装置,根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;在所述目标静态数据内容处根据预设标记样式添加标记;对添加所述预设标记样式的目标网页进行截图;与现有技术相比,本发明采用将待截取网页的数据内容,完全转移至新生成的目标网页,在目标网页中执行标记的添加、截图等操作,不受图片的清晰度、像素偏移量的影响,能够快速定位到目标静态数据内容。
所述网页数据的标记装置包括处理器和存储器,上述生成单元、查找单元、第一添加单元、截图单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决在对截图的内容进行标记时,由于截图不清晰会增加直观定位到截图中特定元素的复杂度的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述网页数据的标记方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述网页数据的标记方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;
根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;
在所述目标静态数据内容处根据预设标记样式添加标记;
对添加所述预设标记样式的目标网页进行截图。
可选的,在所述目标静态数据内容处根据预设标记样式添加标记包括:
在所述目标网页中添加自定义层叠样式表CSS,所述自定义层叠样式表CSS中记录有多种预设标记样式;
在所述目标静态数据内容处添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式;
基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式,并将所述至少一种标记样式添加至所述目标静态数据内容处。
可选的,基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式包括:
若预先配置所述预设关键字与标记样式之间的对应关系,则根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式;
或者,显示所述自定义层叠样式表CSS中的所有标记样式,基于所述JS脚本接收对所述标记样式的选择指令,根据所述选择指令确定标记样式,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生。
可选的,根据预设关键字在所述目标网页中查找匹配的目标静态数据内容包括:
获取所述目标网页的源代码;
在所述目标网页的源代码中,遍历与所述预设关键字匹配的所述目标静态数据内容。
可选的,所述方法还包括:
在所述目标网页的源代码中对所述目标静态数据内容处执行添加标记;
将目标网页的源代码中添加的标记,同步到目标网页显示界面中的目标静态数据内容处。
本文中的设备可以是PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:根据待截图网页,生成目标网页,所述目标网页中包含所述待截图网页中的静态数据内容;根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;在所述目标静态数据内容处根据预设标记样式添加标记;对添加所述预设标记样式的目标网页进行截图。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种网页数据的标记方法,其特征在于,包括:
根据待截图网页,生成目标网页,所述目标网页与所述待截图网页存在区别在于所述目标网页中包含所述待截图网页中的静态数据内容且所述目标网页中不执行基于链接的跳转;
根据预设关键字在所述目标网页中查找匹配的目标静态数据内容;
在所述目标静态数据内容处根据预设标记样式添加标记,得到所述目标页面同步显示所述标记;
对添加所述预设标记样式的目标网页进行截图,所述截图中像素、清晰度与所述待截取网页的像素、清晰度相同。
2.根据权利要求1所述的方法,其特征在于,在所述目标静态数据内容处根据预设标记样式添加标记包括:
在所述目标网页中添加自定义层叠样式表CSS,所述自定义层叠样式表CSS中记录有多种预设标记样式;
在所述目标静态数据内容处添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式;
基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式,并将所述至少一种标记样式添加至所述目标静态数据内容处。
3.根据权利要求2所述的方法,其特征在于,基于所述JS脚本从自定义层叠样式表CSS中确定至少一种标记样式包括:
若预先配置所述预设关键字与标记样式之间的对应关系,则根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式;
或者,显示所述自定义层叠样式表CSS中的所有标记样式,基于所述JS脚本接收对所述标记样式的选择指令,根据所述选择指令确定标记样式,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生。
4.根据权利要求1-3中任一项所述的方法,其特征在于,根据预设关键字在所述目标网页中查找匹配的目标静态数据内容包括:
获取所述目标网页的源代码;
在所述目标网页的源代码中,遍历与所述预设关键字匹配的所述目标静态数据内容。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在所述目标网页的源代码中对所述目标静态数据内容处执行添加标记;
将目标网页的源代码中添加的标记,同步到目标网页显示界面中的目标静态数据内容处。
6.一种网页数据的标记装置,其特征在于,包括:
生成单元,用于根据待截图网页,生成目标网页,所述目标网页与所述待截图网页存在区别在于所述目标网页中包含所述待截图网页中的静态数据内容且所述目标网页中不执行基于链接的跳转;
查找单元,用于根据预设关键字在所述生成单元生成的所述目标网页中查找匹配的目标静态数据内容;
第一添加单元,用于在所述查找单元查找的所述目标静态数据内容处根据预设标记样式添加标记,得到所述目标页面同步显示所述标记;
截图单元,用于对所述第一添加单元添加所述预设标记样式的目标网页进行截图,所述截图中像素、清晰度与所述待截取网页的像素、清晰度相同。
7.根据权利要求6所述的装置,其特征在于,所述第一添加单元包括:
第一添加模块,用于在所述目标网页中添加自定义层叠样式表CSS,所述自定义层叠样式表CSS中记录有多种预设标记样式;
第二添加模块,用于在所述目标静态数据内容处添加JS脚本,所述JS脚本用于选择自定义层叠样式表CSS中的至少一种标记样式;
确定模块,用于基于所述第二添加模块添加的所述JS脚本从所述第一添加模块添加的所述自定义层叠样式表CSS中确定至少一种标记样式;
第三添加模块,用于将所述确定模块确定的所述至少一种标记样式添加至所述目标静态数据内容处。
8.根据权利要求7所述的装置,其特征在于,所述确定模块包括:
第一确定子模块,用于当预先配置所述预设关键字与标记样式之间的对应关系时,根据已配置的标记样式的标签,从所述自定义层叠样式表CSS中确定对应的至少一种标记样式;
显示子模块,用于显示所述自定义层叠样式表CSS中的所有标记样式;
接收子模块,用于基于所述JS脚本接收对所述标记样式的选择指令,所述选择指令为用户从所述自定义层叠样式表CSS中选择至少一种标记样式后触发产生;
第二确定子模块,用于根据所述选择指令确定标记样式。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求5中任意一项所述的网页数据的标记方法。
10.一种电子设备,其特征在于,包括处理器,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求5中任意一项所述的网页数据的标记方法。
CN201710875976.7A 2017-09-25 2017-09-25 网页数据的标记方法及装置 Active CN109948075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710875976.7A CN109948075B (zh) 2017-09-25 2017-09-25 网页数据的标记方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710875976.7A CN109948075B (zh) 2017-09-25 2017-09-25 网页数据的标记方法及装置

Publications (2)

Publication Number Publication Date
CN109948075A CN109948075A (zh) 2019-06-28
CN109948075B true CN109948075B (zh) 2021-06-08

Family

ID=67003930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710875976.7A Active CN109948075B (zh) 2017-09-25 2017-09-25 网页数据的标记方法及装置

Country Status (1)

Country Link
CN (1) CN109948075B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112596833B (zh) * 2020-12-21 2024-08-20 三六零数字安全科技集团有限公司 网页截图生成方法、装置、设备以及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9396279B1 (en) * 2009-02-17 2016-07-19 Jpmorgan Chase Bank, Na Collaborative virtual markup
CN102779173A (zh) * 2012-06-25 2012-11-14 北京奇虎科技有限公司 网页文本高亮显示方法及系统
CN104462125B (zh) * 2013-09-18 2019-09-17 腾讯科技(深圳)有限公司 生成网页截图的方法及装置
CN104281671A (zh) * 2014-09-28 2015-01-14 百度在线网络技术(北京)有限公司 一种对搜索结果的详情页进行处理的方法和装置
CN104536729B (zh) * 2014-11-28 2019-02-22 北京奇虎科技有限公司 一种实现在浏览器页面中进行截图的方法和装置
CN106610829B (zh) * 2015-10-26 2020-06-16 北京国双科技有限公司 网页截图方法和装置
CN105468672B (zh) * 2015-11-12 2019-04-09 广州视睿电子科技有限公司 截取网页局部区域css样式的方法和系统
CN106960062A (zh) * 2017-04-12 2017-07-18 四川九鼎瑞信软件开发有限公司 网页截图方法及系统

Also Published As

Publication number Publication date
CN109948075A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN110058856B (zh) 页面配置方法及装置
CN106933887B (zh) 一种数据可视化方法及装置
CN110069683B (zh) 一种基于浏览器爬取数据的方法及装置
CN107729475B (zh) 网页元素采集方法、装置、终端与计算机可读存储介质
CN111752557A (zh) 一种展示方法及装置
CN106610774B (zh) 网页表格编辑方法及装置
US10049095B2 (en) In-context editing of output presentations via automatic pattern detection
CN109614601A (zh) 基于web的表格处理方法、装置、设备及可读介质
CN107015903B (zh) 一种界面测试程序的生成方法、装置及电子设备
CN109426415B (zh) 一种生成级联选择器的方法及装置
CN106155654B (zh) 屏蔽网页操作的方法、装置及电子设备
CN109857964B (zh) 一种页面操作的热力图绘制方法、装置、存储介质及处理器
CN110941428A (zh) 一种网站创建方法和装置
CN113655999A (zh) 一种页面控件的渲染方法、装置、设备及存储介质
CN112052038A (zh) 一种生成前端接口的方法及装置
CN116881353A (zh) 金融数据的展示方法及装置、存储介质和电子设备
CN110968314A (zh) 一种页面生成方法及装置
CN109948075B (zh) 网页数据的标记方法及装置
CN106155754B (zh) 一种显示模板的处理方法及装置
CN104461310B (zh) 一种页面比对方法及系统
CN117032666A (zh) 基于编辑器的页面编辑方法、装置、终端设备及存储介质
CN115618144B (zh) 基于网页的动态布局方法、系统、设备及介质
CN107391116B (zh) 一种组件帮助弹窗渲染方法及装置
CN110955813A (zh) 一种数据爬取方法及装置
CN113971253A (zh) 网页文件生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant