CN105160209A - 一种实现区域企业软件著作权公告摸底与管理的系统 - Google Patents
一种实现区域企业软件著作权公告摸底与管理的系统 Download PDFInfo
- Publication number
- CN105160209A CN105160209A CN201510539860.7A CN201510539860A CN105160209A CN 105160209 A CN105160209 A CN 105160209A CN 201510539860 A CN201510539860 A CN 201510539860A CN 105160209 A CN105160209 A CN 105160209A
- Authority
- CN
- China
- Prior art keywords
- information
- software copyright
- information code
- code
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 238000007781 pre-processing Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/105—Arrangements for software license management or administration, e.g. for managing licenses at corporate level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种实现区域企业软件著作权公告摸底与管理的系统。本发明公开了一种基于软件著作权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的软件著作权状态监控、详细情况等监控与管理的系统,本系统无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。
Description
技术领域
本发明主要涉及一种实现区域企业软件著作权公告摸底与管理的系统,尤其是通过软件著作权公布网站的页面信息抓取、分析、整理、建档和运用以实现待查的区域的企业的软件著作权拥有情况摸底及运用的系统。
背景技术
目前,一个地区,或者说一定区域的企业,想查询所有企业各自的软件著作权拥有情况,尤其是广谱式的全民式查底,目前的方法相对难以实现,其不但需要到每个部门将软件著作权等数据归库,并且需要对每个地区数以百万计的企业与数以百万计的数据进行比对,这样不但成本高,而且数据源相对敏感而难以实现。
然而,一个地区的企业的知识产权状况,对于地方知识产权政策的制定与实施,以及地方政府对企业知识产权的管理等具有极强的基础性需求。
发明内容
为了解决上述问题,本发明提出了一种基于软件著作权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的软件著作权情况等监控与管理的系统,此系统无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。
一种实现区域企业软件著作权公告摸底与管理的系统,其主要包含以下结构:
企业信息库、第一软件著作权信息采集模块、第一比对信息库、第二比对信息库、第二软件著作权信息采集模块、第一企业知识产权信息库和第二企业知识产权信息库;其中企业信息库包含企业名称字段,第一比对信息库含企业名称字段;第一软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给第一软件著作权信息采集模块进行getHTTPPage方式访问生成的URL生成HTML代码后进行标记识别获取各信息码,各信息码根据对应的值判断,对应写入第一比对信息库和第二比对信息库;其中,第二比对信息库是汇总的比对信息库,写入第二比对信息库的数据同步写入第一企业知识产权信息库;第一比对信息库是通过参数对比成功的信息,即拥有软件著作权的企业数据,进行数据合并后存入第一比对信息库,然后对应地通过第二软件著作权信息采集模块进行第二次详细软件著作权信息的采集,第二软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块,与第一软件著作权信息采集模块不同的是,第二软件著作权信息采集模块的采集程序中的标记信息及生成的URL的不同,其中第二知识产权信息采集模块生成URL时,同时采用所采集到的页码信息码作为参数,通过FOR循环生成URL集;经第二软件著作权信息采集模块采集到具体的知识产权信息集合后存入第二企业知识产权信息库。
所述的第一软件著作权信息采集模块均包含第一信息码:通过以“<title>”标记开始和“</title>”标记结束生成;通过截取如下标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2”;获取第三信息码,其开始标记为“中国”,结束标记为“<tdclass=”;第四信息码通过开始标记为“[总数”,结束标记为“]”获取生成。
所述的SQL语句管理模块,包括企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。
所述的第一比对信息库包含第一信息码、第二信息码、第三信息码、第四信息码、第五信息码、第六信息码、第七信息码、第八信息码和第九信息码,其截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码对应的起止标记分别如下:
软件著作权:开始标记:“页/共”,结束标记:“页”。
所述的编码管理模块,当官方机构公布的数据对应的编码发生变更时,将根据实际所发生的变化变更编码方式;所述的URL中,当官方机构公布时采用的URL进行加密发布时,本方法将根据实际情况进行数据加密编码;所述的URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密。
所述的第一比对信息库,还包含第八信息码和第十三信息码,当第八信息码的值大于1时,通过获取软件著作权的条数的统计数据第十三信息码与现有的第二企业知识产权信息库中的数据对比,当第十三信息码不大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,不必进行第二页及后面的读取;当第十三信息码大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,根据超出的数量进行增量更新。
附图说明
图1一种实现区域企业软件著作权公告摸底与管理的系统的总体流程图。
图2一种实现区域企业软件著作权公告摸底与管理的系统第一组步骤集合的流程图。
图3一种实现区域企业软件著作权公告摸底与管理的方法的实现流程图。
具体实施方式
一种实现区域企业软件著作权公告摸底与管理的系统,其主要包含以下步骤:
企业信息库、第一软件著作权信息采集模块、第一比对信息库、第二比对信息库、第二软件著作权信息采集模块、第一企业知识产权信息库和第二企业知识产权信息库;其中企业信息库包含企业名称字段,第一比对信息库含企业名称字段;第一软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给第一软件著作权信息采集模块进行getHTTPPage方式访问生成的URL生成HTML代码后进行标记识别获取各信息码,各信息码根据对应的值判断,对应写入第一比对信息库和第二比对信息库;其中,第二比对信息库是汇总的比对信息库,写入第二比对信息库的数据同步写入第一企业知识产权信息库;第一比对信息库是通过参数对比成功的信息,即拥有软件著作权的企业数据,进行数据合并后存入第一比对信息库,然后对应地通过第二软件著作权信息采集模块进行第二次详细软件著作权信息的采集,第二软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块,与第一软件著作权信息采集模块不同的是,第二软件著作权信息采集模块的采集程序中的标记信息及生成的URL的不同,其中第二知识产权信息采集模块生成URL时,同时采用所采集到的页码信息码作为参数,通过FOR循环生成URL集;经第二软件著作权信息采集模块采集到具体的知识产权信息集合后存入第二企业知识产权信息库。
所述的第一软件著作权信息采集模块均包含第一信息码:通过以“<title>”标记开始和“</title>”标记结束生成;通过截取如下标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2”;获取第三信息码,其开始标记为“中国”,结束标记为“<tdclass=”;第四信息码通过开始标记为“[总数”,结束标记为“]”获取生成。
所述的SQL语句管理模块,包括企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。
所述的第一比对信息库包含第一信息码、第二信息码、第三信息码、第四信息码、第五信息码、第六信息码、第七信息码、第八信息码和第九信息码,其截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码对应的起止标记分别如下:
软件著作权:开始标记:“页/共”,结束标记:“页”。
所述的编码管理模块,当官方机构公布的数据对应的编码发生变更时,将根据实际所发生的变化变更编码方式;所述的URL中,当官方机构公布时采用的URL进行加密发布时,本方法将根据实际情况进行数据加密编码;所述的URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密。
所述的第一比对信息库,还包含第八信息码和第十三信息码,当第八信息码的值大于1时,通过获取软件著作权的条数的统计数据第十三信息码与现有的第二企业知识产权信息库中的数据对比,当第十三信息码不大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,不必进行第二页及后面的读取;当第十三信息码大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,根据超出的数量进行增量更新。
具体实现方法如下:
步骤S101,进行企业信息查询中,进行企业类型等条件检索筛选出所需要检索的数据。
步骤S102,在企业信息库中读出企业名称的待查数据,设变量为“aa”。
步骤S103,根据三种类别将步骤S102所读出的企业名称通过函数转为下列所列的对应数据编码,设变量为“bb”:软件著作权公告信息对应编码方式为GB2312。
其中读取URL的页面需要在文件头加入以下代码段:
<head>
<metahttp-equiv="Content-Type"content="text/html;charset=gb2312">
</head>
步骤S104,以上述“bb”变量作为对应的URL的对应参数值生成第一URL,使用ASP开发语言表达如下:“bb”变量假设为cname:
http://www.ccopyright.com.cn/cpcc/RRegisterAction.do?method=list&no=fck&sql_name=&sql_regnum=&sql_author=<%=cname%>&curPage=1&count=10&sortOrder=&sortLabel=。
步骤S105,通过getHTTPPage方式访问步骤S104生成的第一URL,获得第一URL对应的页面的HTML格式的数据源码供步骤S106进行标记截取。
步骤S106,通过S105获得的HTML格式的数据源码,通过以“<title>”标记开始和“</title>”标记结束生成第一信息码;通过如下标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2”;通过如下标记获取第三信息码:开始标记为“中国”,结束标记为“<tdclass=”。
当第一信息码的值为空时,返回S102步骤,同时检查网络是否正常;当第二信息码为空时,跳过步骤S107和步骤S108,并设置第四信息码的值为“0”;当第二信息码不为空时,执行步骤S107。
步骤S107,生成第四信息码:当第二信息码不为空,并且第三信息码为空时,第四信息码通过开始标记为“[总数”,结束标记为“]”获取生成,第二信息码不为空并且第三信息码不为空时,第四信息码的值为“1”;第二信息码不为空时,第四信息码通过第二信息码去杂质后剩下数字。
步骤S108,当第二信息码不为空时,将第一信息码、第二信息码和第四信息码的信息,以及相应的辅助数据对应存贮在拥有软件著作权的企业信息库中,辅助数据包括通过步骤S102所读出的企业名称传递而获得企业名称,通过步骤S106和步骤S107追加获取当前的系统时间。
将所有数据执行步骤S109存入软件著作权的企业信息总表,同时返回步骤S101将已经成功检索的记录的进行已执行的标记然后,返回步骤S102循环执行,直至所有符合条件的企业数据检索完成为止。
在执行步骤S102前,通过设置一定数量的采样数据进行采样,采样数据包括企业拥有三种软件著作权类别的一种、两种、三种及上述组合的一定量的企业,以及没有任何软件著作权的一定量的企业,采样走完整个流程,查看相关采集是否正常,此步骤确定网络是否正常,官方公布数据格式是否发生变化和确定所设置的数据编码方式是否正确。
当全部待查的企业信息库中符合条件的数据均已被正确执行,并存入第一比对信息库后,第一比对信息库里的信息即为拥有软件著作权的企业,接下来执行步骤S201获取详细的软件著作权数据;
步骤S201从第一比对信息库中获取企业名称,将编码方式设置为GB2312后生成符合规范的企业名称数据,并设置为第二变量;
步骤S202,生成对应的带第二变量的第二URL,并通过getHTTPPage方式访问第二URL,将结果HTML静态化,供步骤S203分别进行标记截取;
步骤S203,根据进行不同的标记进行HTML内容截取获得第五信息码、第六信息码、第七信息码和第八信息码;当第五信息码为空时,对应的企业的软件著作权公告信息截取出错,返回步骤S201,并检查网络连接状态、第一信息库连接情况和对应的软件著作权公告信息发布网站的URL是否发生变化;
当第五信息码不为空,第六信息码为空时,表明该企业软件著作权公布页面中显示只有一页,不需要翻页,程序依次标记并截取生成如下字段:企业名称、软件名称、软件著作权登记日期、软件著作权编号和软件著作权公开时间,同时与第二辅助信息存贮到第一企业知识产权信息库;
当第五信息码和第六信息码同时不为空,并且第七信息码为空时,第八信息码即为页码,将第八信息码去杂余数字后加入URL的页码参数,生成第三URL,以第三URL中的第八信息码为结束码,0为开始码生成FOR循环列出第三URL的子URL,并且依次执行步骤S203步骤,直至FOR循环结束;
步骤S204,通过步骤S203,软件著作权的基本信息存入第一企业知识产权信息库;
步骤S301,上述所有步骤完成后,分别对第一组步骤S101、S102、S103、S104、S105、S106、S107、S108和S109,第二组步骤S201、S202、S203和S204分别设定下一次的执行时间以定期检索,并且可以对S101的企业信息库中新增的企业进行增量的检索;
步骤S302,上述所有步骤完成后,结束全部步骤。
所述的第一信息码:通过以“<title>”标记开始和“</title>”标记结束生成;标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2”;软件著作权类型时获取第三信息码,其开始标记为“中国”,结束标记为“<tdclass=”;第四信息码通过开始标记为“[总数”,结束标记为“]”获取生成。
执行步骤S102前执行步骤S101进行企业信息查询中,进行企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。
步骤S109所述的辅助数据包括通过步骤S102所读出的企业名称传递而获得企业名称,通过步骤S107和步骤S108追加获取当前的系统时间。
在执行步骤S102前,通过设置一定数量的采样数据进行采样,采样数据包括企业拥有软件著作权的一定量的企业,以及没有任何软件著作权的一定量的企业,采样走完整个流程,查看相关采集是否正常,此步骤确定网络是否正常,官方公布数据格式是否发生变化和确定所设置的数据编码方式是否正确。
步骤S203所述的第五信息码截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码起止标记分别如下:
软件著作权:开始标记:“页/共”,结束标记:“页”。
步骤S103所述的编码方式,当官方机构公布的数据对应的编码发生变更时,本方法将根据实际所发生的变化变更编码方式;步骤S104所述的URL中,当官方机构公布时采用的URL进行加密发布时,本方法将根据实际情况进行数据加密编码;步骤S104所述的URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密。
步骤S203中,当第八信息码的值大于1时,通过获取软件著作权的条数的统计数据第十三信息码与现有的第二企业知识产权信息库中的数据对比,当第十三信息码不大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,不必进行第二页及后面的读取;当第十三信息码大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,根据超出的数量进行增量更新。
上述实施方式仅仅为本发明的其中实施方式之一。
Claims (6)
1.一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,其主要包含以下结构:
企业信息库、第一软件著作权信息采集模块、第一比对信息库、第二比对信息库、第二软件著作权信息采集模块、第一企业知识产权信息库和第二企业知识产权信息库;其中企业信息库包含企业名称字段,第一比对信息库含企业名称字段;第一软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块;企业信息库包含企业信息数据和SQL语句管理模块,其通过SQL语句条件检索后返回值给第一软件著作权信息采集模块进行getHTTPPage方式访问生成的URL生成HTML代码后进行标记识别获取各信息码,各信息码根据对应的值判断,对应写入第一比对信息库和第二比对信息库;其中,第二比对信息库是汇总的比对信息库,写入第二比对信息库的数据同步写入第一企业知识产权信息库;第一比对信息库是通过参数对比成功的信息,即拥有软件著作权的企业数据,进行数据合并后存入第一比对信息库,然后对应地通过第二软件著作权信息采集模块进行第二次详细软件著作权信息的采集,第二软件著作权信息采集模块包含编码方式管理程序、信息码管理模块和软件著作权公布数据采集管理模块,与第一软件著作权信息采集模块不同的是,第二软件著作权信息采集模块的采集程序中的标记信息及生成的URL的不同,其中第二知识产权信息采集模块生成URL时,同时采用所采集到的页码信息码作为参数,通过FOR循环生成URL集;经第二软件著作权信息采集模块采集到具体的知识产权信息集合后存入第二企业知识产权信息库。
2.根据权利要求1所述的一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,所述的第一软件著作权信息采集模块均包含第一信息码:通过以“<title>”标记开始和“</title>”标记结束生成;通过截取如下标记生成第二信息码:开始标记为“登记日期”,结束标记为“>2”;获取第三信息码,其开始标记为“中国”,结束标记为“<tdclass=”;第四信息码通过开始标记为“[总数”,结束标记为“]”获取生成。
3.根据权利要求1所述的一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,所述的SQL语句管理模块,包括企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。
4.根据权利要求1所述的一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,所述的第一比对信息库包含第一信息码、第二信息码、第三信息码、第四信息码、第五信息码、第六信息码、第七信息码、第八信息码和第九信息码,其截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码对应的起止标记分别如下:
软件著作权:开始标记:“页/共”,结束标记:“页”。
5.根据权利要求1所述的一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,所述的编码管理模块,当官方机构公布的数据对应的编码发生变更时,将根据实际所发生的变化变更编码方式;所述的URL中,当官方机构公布时采用的URL进行加密发布时,本方法将根据实际情况进行数据加密编码;所述的URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密。
6.根据权利要求1所述的一种实现区域企业软件著作权公告摸底与管理的系统,其特征包括,所述的第一比对信息库,还包含第八信息码和第十三信息码,当第八信息码的值大于1时,通过获取软件著作权的条数的统计数据第十三信息码与现有的第二企业知识产权信息库中的数据对比,当第十三信息码不大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,不必进行第二页及后面的读取;当第十三信息码大于第二企业知识产权信息库中对应的企业的软件著作权的总计数值时,根据超出的数量进行增量更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510539860.7A CN105160209A (zh) | 2015-08-31 | 2015-08-31 | 一种实现区域企业软件著作权公告摸底与管理的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510539860.7A CN105160209A (zh) | 2015-08-31 | 2015-08-31 | 一种实现区域企业软件著作权公告摸底与管理的系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105160209A true CN105160209A (zh) | 2015-12-16 |
Family
ID=54801065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510539860.7A Pending CN105160209A (zh) | 2015-08-31 | 2015-08-31 | 一种实现区域企业软件著作权公告摸底与管理的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105160209A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563740A (zh) * | 2018-04-12 | 2018-09-21 | 苏州市铜钱草科技有限公司 | 一种企业软件著作权公告信息抓取方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320244A (zh) * | 1999-07-21 | 2001-10-31 | 三摩特株式会社 | 著作权信息管理系统 |
US20120239661A1 (en) * | 2007-12-07 | 2012-09-20 | Patrick Giblin | Method and System for Meta-Tagging Media Content and Distribution |
CN102982161A (zh) * | 2012-12-05 | 2013-03-20 | 北京奇虎科技有限公司 | 网页信息的获取方法和装置 |
CN103294732A (zh) * | 2012-03-05 | 2013-09-11 | 富士通株式会社 | 网页抓取方法及爬虫 |
CN104317948A (zh) * | 2014-11-05 | 2015-01-28 | 北京中科辅龙信息技术有限公司 | 页面数据抓取方法和系统 |
CN104572874A (zh) * | 2014-12-19 | 2015-04-29 | 北京锐安科技有限公司 | 一种网页信息的抽取方法及装置 |
CN104866517A (zh) * | 2014-12-30 | 2015-08-26 | 智慧城市信息技术有限公司 | 一种抓取网页内容的方法及装置 |
-
2015
- 2015-08-31 CN CN201510539860.7A patent/CN105160209A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1320244A (zh) * | 1999-07-21 | 2001-10-31 | 三摩特株式会社 | 著作权信息管理系统 |
US20120239661A1 (en) * | 2007-12-07 | 2012-09-20 | Patrick Giblin | Method and System for Meta-Tagging Media Content and Distribution |
CN103294732A (zh) * | 2012-03-05 | 2013-09-11 | 富士通株式会社 | 网页抓取方法及爬虫 |
CN102982161A (zh) * | 2012-12-05 | 2013-03-20 | 北京奇虎科技有限公司 | 网页信息的获取方法和装置 |
CN104317948A (zh) * | 2014-11-05 | 2015-01-28 | 北京中科辅龙信息技术有限公司 | 页面数据抓取方法和系统 |
CN104572874A (zh) * | 2014-12-19 | 2015-04-29 | 北京锐安科技有限公司 | 一种网页信息的抽取方法及装置 |
CN104866517A (zh) * | 2014-12-30 | 2015-08-26 | 智慧城市信息技术有限公司 | 一种抓取网页内容的方法及装置 |
Non-Patent Citations (2)
Title |
---|
FENG2112: "《https://blog.csdn.net/feng2112/article/details/4443603》", 13 August 2009 * |
JIANGE_ZH: "《https://blog.csdn.net/jiange_zh/article/details/47361555》", 8 August 2015 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563740A (zh) * | 2018-04-12 | 2018-09-21 | 苏州市铜钱草科技有限公司 | 一种企业软件著作权公告信息抓取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Oliveira et al. | Open government data portals analysis: the Brazilian case | |
CN101753350A (zh) | 一种信息审核方法、装置及系统 | |
CN103729479A (zh) | 基于分布式文件存储的网站页面内容统计的方法和系统 | |
CN106372504A (zh) | 一种安全威胁数据整合方法、装置及系统 | |
CN108681568A (zh) | 一种搜索排序方法、装置、设备及计算机可读存储介质 | |
CN105160471A (zh) | 一种实现区域企业专利信息摸底与管理的方法 | |
CN103593344A (zh) | 一种信息采集方法和装置 | |
WO2014182419A1 (en) | Offline searching of encrypted content | |
CN111882368B (zh) | 一种在线广告dpi加密埋点及透传跟踪的方法 | |
CN105426492A (zh) | 一种知识产权信息抓取与管理的方法 | |
CN105160209A (zh) | 一种实现区域企业软件著作权公告摸底与管理的系统 | |
Hansford et al. | Mapping and monitoring tick (Acari, Ixodida) distribution, seasonality, and host associations in the United Kingdom between 2017 and 2020 | |
CN105005881A (zh) | 一种实现区域企业知识产权摸底与管理的系统 | |
CN105427213A (zh) | 一种企业知识产权预警的实现方法 | |
CN105139308A (zh) | 一种实现区域企业专利信息摸底与管理的系统 | |
CN100437740C (zh) | 站点点击与网页上链接的关联 | |
CN105184704A (zh) | 一种实现区域企业商标信息摸底与管理的系统 | |
CN105183821A (zh) | 一种实现区域企业软件著作权公告摸底与管理的方法 | |
CN105184705A (zh) | 一种实现区域企业知识产权摸底与管理的方法 | |
CN105447787A (zh) | 一种企业知识产权的预警系统 | |
CN105138334A (zh) | 一种实现区域企业商标信息摸底与管理的方法 | |
CN105117848A (zh) | 一种企业知识产权信息抓取与管理系统 | |
CN105139309A (zh) | 一种企业软件著作权公告信息抓取与管理的方法 | |
CN105488137A (zh) | 一种实现专利证券化的方法 | |
CN105160472A (zh) | 一种企业软件著作权公告信息抓取与管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151216 |
|
WD01 | Invention patent application deemed withdrawn after publication |