CN103778140B - 一种基于应用流程操作模式的可视化数据采集方法 - Google Patents

一种基于应用流程操作模式的可视化数据采集方法 Download PDF

Info

Publication number
CN103778140B
CN103778140B CN201210403118.XA CN201210403118A CN103778140B CN 103778140 B CN103778140 B CN 103778140B CN 201210403118 A CN201210403118 A CN 201210403118A CN 103778140 B CN103778140 B CN 103778140B
Authority
CN
China
Prior art keywords
application
data
list
attribute
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210403118.XA
Other languages
English (en)
Other versions
CN103778140A (zh
Inventor
张延良
韩宏波
叶军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Xinyi Software Co. Ltd.
Original Assignee
SUZHOU XUNTAI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU XUNTAI INFORMATION TECHNOLOGY Co Ltd filed Critical SUZHOU XUNTAI INFORMATION TECHNOLOGY Co Ltd
Priority to CN201210403118.XA priority Critical patent/CN103778140B/zh
Publication of CN103778140A publication Critical patent/CN103778140A/zh
Application granted granted Critical
Publication of CN103778140B publication Critical patent/CN103778140B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于应用流程操作模式的可视化数据采集方法,包括以下步骤:首先添加应用,在应用文本框中输入“应用1”,点击“添加应用”按钮;然后点击应用列表中的“应用1”,在属性窗口可以设置应用;接着设置查询流程;最后设定结果操作。本发明通过可视化配置使得企业可以自行配置精准搜索应该,并根据需求进行改动,达到及时获取精准信息的目的。

Description

一种基于应用流程操作模式的可视化数据采集方法
技术领域
本发明涉及网络数据精准搜索,具体涉及一种基于应用流程操作模式的可视化数据采集方法。
背景技术
随着企业业务类型的细分,通用搜索引擎进行信息获取已经不能满足数据更加精准的要求,如网络卖家要及时获取各大电商的同一产品的价格信息,通过通用搜索引擎就无法实现,必须进行精准搜索。本技术即是解决网络(互联网或专有网络)数据精准搜索而设计的,企业可通过此技术在网络上获取满足要求的数据,但要获取精准数据必须进行配置,通过配置去截取想要的数据,以此来实现精准搜索。所以简单快捷的配置在精准搜索中占有重要的位置,使得精准搜索更加容易实现,并能根据需求动态设置。
通过将此技术嵌入到软件中,可设置精准搜索任务,并通过定时获取及时掌握信息。
发明内容
本发明的目的在于克服现有技术存在的以上问题,提供一种基于应用流程操作模式的可视化数据采集方法,本发明通过可视化配置使得企业可以自行配置精准搜索,并根据需求进行改动,达到及时获取精准信息的目的。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种基于应用流程操作模式的可视化数据采集方法,包括如下步骤:
步骤1)添加应用,在应用文本框中输入“应用1”,点击“添加应用”按钮;
步骤2)点击应用列表中的“应用1”,在属性窗口可以设置如下属性:应用的属性包括以下内容:
标题:指应用名称;
指令码:指引用此应用的标识码,在查询终端中执行各类查询,批查软件都会将查询信息转换为以指令码开头的查询指令,指令码在批查软件中是唯一的,与应用一一对应;
Silent:此属性设定在网页中是否忽略弹出窗口,如果选中,则忽略;不选中不忽略则弹出窗口;
用例:用例是该应用的一条查询指令,做示例和测试用,当应用的所有流程都配置好之后,可以点击“执行应用”按钮进行测试,测试时使用的查询指定就是此用例;
结果是否在弹出框中:如果此应用的结果是在弹出框中,请选中;否则不选;
重复次数:此属性表示执行此应用查询时是否进行多次,一般设定为1;
时间间隔:此属性取默认值,用户不处理;
步骤3)设置查询流程,流程即查询步骤的设置按照下面的步骤进行设置,每个流程必须属于一个流程类别,本技术支持的流程类别如下:
直接跳转:直接跳转到一个网址;
点击跳转:点击一个对象,然后进行跳转;
表单赋值:对表单中的文本框、下拉框、复选框、单选框进行赋值;
表格分析:对单个表格数据进行分析,通过行、列值来获取数据;
执行脚本函数:执行网页中的javascript脚本函数;
延时:延时操作,单位毫秒,对于Ajax页面有效;
表格数据循环解析:对多行数据表格数据进行获取,可以指定起始行;
正则表达式解析:通过正则表达式匹配来获取网页中的数据;
文件下载:下载指定的文件,包括图片、文档及其他文件;
步骤4)设定结果操作,查询结果支持以下格式:
属性-值对(key-value),通过属性名获取值;
表格数据,获取一个表格中的若干数据;
表格列表,获取多条记录,通过数据集来获取结果;
图片、文件,结果保存为图片或文件格式。
优选的,在上述一种基于应用流程操作模式的可视化数据采集方法中,步骤4)中的所述表格列表包括div列表。
本发明的有益效果是:
本发明通过可视化配置使得企业可以自行配置精准搜索,并根据需求进行改动,达到及时获取精准信息的目的。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施例方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是可视化配置步骤图;
图2是可视化采集配置界面示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
参照图1所示,一种基于应用流程操作模式的可视化数据采集方法,其特征在于,包括如下步骤:
步骤1)添加应用,在应用文本框中输入“应用1”,点击“添加应用”按钮;
步骤2)点击应用列表中的“应用1”,在属性窗口可以设置如下属性:应用的属性包括以下内容:
标题:指应用名称;
指令码:指引用此应用的标识码,在查询终端中执行各类查询,批查软件都会将查询信息转换为以指令码开头的查询指令,指令码在批查软件中是唯一的,与应用一一对应;
Silent:此属性设定在网页中是否忽略弹出窗口,如果选中,则忽略;不选中不忽略则弹出窗口
用例:用例是该应用的一条查询指令,做示例和测试用,当应用的所有流程都配置好之后,可以点击“执行应用”按钮进行测试,测试时使用的查询指定就是此用例;
结果是否在弹出框中:如果此应用的结果是在弹出框中,请选中;否则不选;
重复次数:此属性表示执行此应用查询时是否进行多次,设定为1;
时间间隔:此属性取默认值,用户不处理;
步骤3)设置查询流程,流程即查询步骤的设置按照下面的步骤进行设置,每个流程必须属于一个流程类别,本技术支持的流程类别如下:
直接跳转:直接跳转到一个网址;
点击跳转:点击一个对象,然后进行跳转;
表单赋值:对表单中的文本框、下拉框、复选框、单选框进行赋值;
表格分析:对单个表格数据进行分析,通过行、列值来获取数据;
执行脚本函数:执行网页中的javascript脚本函数;
延时:延时操作,单位毫秒,对于Ajax页面有效;
表格数据循环解析:对多行数据表格数据进行获取,可以指定起始行;
正则表达式解析:通过正则表达式匹配来获取网页中的数据;
文件下载:下载指定的文件,包括图片、文档及其他文件;
步骤4)设定结果操作,查询结果支持以下格式:
属性-值对(key-value),通过属性名获取值;
表格数据,获取一个表格中的若干数据;
表格列表,获取多条记录,通过数据集来获取结果;
图片、文件,结果保存为图片或文件格式。
为了进一步优化上述技术方案,步骤4)中的表格列表包括div列表。
以上所述仅为本发明的优选实施例而已,并不限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于应用流程操作模式的可视化数据采集方法,其特征在于,包括如下步骤:
步骤1)添加应用,在应用文本框中输入“应用1”,点击“添加应用”按钮;
步骤2)点击应用列表中的“应用1”,在属性窗口可以设置如下属性:应用的属性包括以下内容:
标题:指应用名称;
指令码:指引用此应用的标识码,在查询终端中执行各类查询,批查软件都会将查询信息转换为以指令码开头的查询指令,指令码在批查软件中是唯一的,与应用一一对应;
Silent:此属性设定在网页中是否忽略弹出窗口,如果选中,则忽略;不选中不忽略则弹出窗口;
用例:用例是该应用的一条查询指令,做示例和测试用,当应用的所有流程都配置好之后,可以点击“执行应用”按钮进行测试,测试时使用的查询指定就是此用例;
结果是否在弹出框中:如果此应用的结果是在弹出框中,请选中;否则不选;
重复次数:此属性表示执行此应用查询时是否进行多次,设定为1;
时间间隔:此属性取默认值,用户不处理;
步骤3)设置查询流程,流程即查询步骤的设置按照下面的步骤进行设置,每个流程必须属于一个流程类别,本技术支持的流程类别如下:
直接跳转:直接跳转到一个网址;
点击跳转:点击一个对象,然后进行跳转;
表单赋值:对表单中的文本框、下拉框、复选框、单选框进行赋值;
表格分析:对单个表格数据进行分析,通过行、列值来获取数据;
执行脚本函数:执行网页中的javascript脚本函数;
延时:延时操作,单位毫秒,对于Ajax页面有效;
表格数据循环解析:对多行数据表格数据进行获取,可以指定起始行;
正则表达式解析:通过正则表达式匹配来获取网页中的数据;
文件下载:下载指定的文件,包括图片、文档及其他文件;
步骤4)设定结果操作,查询结果支持以下格式:
属性-值对(key-value),通过属性名获取值;
表格数据,获取一个表格中的若干数据;
表格列表,获取多条记录,通过数据集来获取结果;
图片、文件,结果保存为图片或文件格式。
2.根据权利要求1所述的一种基于应用流程操作模式的可视化数据采集方法,其特征在于,步骤4)中的所述表格列表包括div列表。
CN201210403118.XA 2012-10-22 2012-10-22 一种基于应用流程操作模式的可视化数据采集方法 Expired - Fee Related CN103778140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210403118.XA CN103778140B (zh) 2012-10-22 2012-10-22 一种基于应用流程操作模式的可视化数据采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210403118.XA CN103778140B (zh) 2012-10-22 2012-10-22 一种基于应用流程操作模式的可视化数据采集方法

Publications (2)

Publication Number Publication Date
CN103778140A CN103778140A (zh) 2014-05-07
CN103778140B true CN103778140B (zh) 2017-04-05

Family

ID=50570383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210403118.XA Expired - Fee Related CN103778140B (zh) 2012-10-22 2012-10-22 一种基于应用流程操作模式的可视化数据采集方法

Country Status (1)

Country Link
CN (1) CN103778140B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388429A (zh) * 2018-02-08 2018-08-10 成都东谷信息技术有限公司 一种通过Web客户端自动化操作实现数据直通集成的系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576881A (zh) * 2008-05-07 2009-11-11 万德洪 一种数据可视化系统及实现方法
CN101622619A (zh) * 2007-04-10 2010-01-06 丁行俊 用于导航和可视化关系数据库和/或多维数据库中的数据的方法和系统
EP2411956A2 (en) * 2009-03-27 2012-02-01 Mimos Berhad A method and system for ontology navigation and visualization

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7996786B2 (en) * 2007-03-05 2011-08-09 Microsoft Corporation Dynamically rendering visualizations of data sets
CN101925896B (zh) * 2008-01-23 2016-05-11 初世先 信息的可视化表达方法和装置、及其可视人机交互表达界面

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101622619A (zh) * 2007-04-10 2010-01-06 丁行俊 用于导航和可视化关系数据库和/或多维数据库中的数据的方法和系统
CN101576881A (zh) * 2008-05-07 2009-11-11 万德洪 一种数据可视化系统及实现方法
EP2411956A2 (en) * 2009-03-27 2012-02-01 Mimos Berhad A method and system for ontology navigation and visualization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于工作流技术的web应用流程建模;韩淑贞;《煤矿现代化》;20091231;全文 *

Also Published As

Publication number Publication date
CN103778140A (zh) 2014-05-07

Similar Documents

Publication Publication Date Title
US11113343B2 (en) Systems and methods for enabling a user to operate on displayed web content via a web browser plug-in
CN106919635B (zh) 一种群聊天记录查询方法、装置及电子设备
CN103577597B (zh) 基于当前浏览页面的关键词搜索系统
JP5721818B2 (ja) 検索におけるモデル情報群の使用
CN106919625B (zh) 一种互联网用户属性识别方法和装置
CN102117320A (zh) 一种结构化数据搜索的方法和装置
CN103631887A (zh) 浏览器侧进行网络搜索的方法与浏览器
US11755651B2 (en) Method, apparatus, and computer-readable medium for generating categorical and criterion-based search results from a search query
US10339222B2 (en) Information providing system, information providing method, non-transitory recording medium, and data structure
WO2007071143A1 (fr) Procédé et appareil destinés à émettre des informations réseau
CN102768685A (zh) 一种基于关键字匹配的内容推荐方法
US20200026802A1 (en) Image quality independent searching of screenshots of web content
CN110737706A (zh) 数据管理方法、装置、设备及计算机可读存储介质
CN105488205A (zh) 页面生成方法和装置
WO2016007178A1 (en) System and method for providing contextual analytics data
CN103617241A (zh) 搜索信息处理方法、浏览器终端与服务器
CN110909133A (zh) 一种智能问答的测试方法、装置、电子设备及存储介质
US20100274889A1 (en) Automated feed reader indexing
CN103778140B (zh) 一种基于应用流程操作模式的可视化数据采集方法
CN106202357A (zh) 一种网站浏览数据分析方法和装置
CN105320738B (zh) 信息推荐方法和装置
CN109684156B (zh) 基于混合模式应用的监控方法、装置、终端及存储介质
KR101229130B1 (ko) 웹브라우저 분석을 이용한 실시간 맞춤형 정보제공 방법
CN105138704B (zh) 一种搜索结果控制方法及电子设备
CN104750823B (zh) 推广情况数据的查询方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
DD01 Delivery of document by public notice

Addressee: SUZHOU XUNTAI INFORMATION TECHNOLOGY CO., LTD.

Document name: the First Notification of an Office Action

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170807

Address after: No. 99 Suzhou Road, science and Technology Park, Li Jiangsu province Wuzhong District 215000 building 503 room 5

Patentee after: Jiangsu Xinyi Software Co. Ltd.

Address before: 215000, building 103, building C, Pioneer Park, 31 Soochow Road, Suzhou, Jiangsu, Wuzhong District

Patentee before: SUZHOU XUNTAI INFORMATION TECHNOLOGY CO., LTD.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170405

Termination date: 20191022

CF01 Termination of patent right due to non-payment of annual fee