CN112149063B - 一种网络图片侵权在线监测方法 - Google Patents
一种网络图片侵权在线监测方法 Download PDFInfo
- Publication number
- CN112149063B CN112149063B CN202010961065.8A CN202010961065A CN112149063B CN 112149063 B CN112149063 B CN 112149063B CN 202010961065 A CN202010961065 A CN 202010961065A CN 112149063 B CN112149063 B CN 112149063B
- Authority
- CN
- China
- Prior art keywords
- website
- priority
- infringement
- picture
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012544 monitoring process Methods 0.000 title claims abstract description 36
- 230000003993 interaction Effects 0.000 claims abstract description 8
- 239000003086 colorant Substances 0.000 claims description 4
- 238000005096 rolling process Methods 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 230000006399 behavior Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 241000282376 Panthera tigris Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Library & Information Science (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及版权保护技术领域,具体涉及一种网络图片侵权在线监测方法,包括以下步骤:使用爬虫抓取网络上的网页,保存网页URL和网页代码;根据网站的访问量、历史侵权情况以及交互类型,设定网站的优先度,网站访问量大、历史侵权多以及交互程度高的网站的优先度高;按网站优先度顺序抓取网站上的图片及图片URL,以图片URL为索引存储;将抓取到的图片与用户登记侵权监测的版权图片比对,若相似度超过设定阈值,则将图片及图片URL提供给用户。本发明的实质性效果是:提供了高效的网络图片监控技术方案,能够自动对全网进行侵权监测,维护保护版权所有者的权益;通过优先度的区分,有效应对了网络信息量大给侵权监测带来的效率影响。
Description
技术领域
本发明涉及版权保护技术领域,具体涉及一种网络图片侵权在线监测方法。
背景技术
版权又称著作权,是创作者在作品完成后,自然获得的对作品拥有的所有权。版权不登记亦不需要申请,在作品完成时就自然获得,并受法律的保护。互联网的快速发展,给互联网用户带来了丰富了文化娱乐享受,但也给版权保护也带来了严峻的挑战。互联网具有虚拟和开放的特性,且互联网发展至今,其信息体量也十分巨大。导致用户的版权权益,尤其是图片的版权权益在遭遇互联网侵权时,难以及时的被发现。给用户的版权权益带来了极大的风险。加之,图片的检索相对文字的检索要更为复杂和困难。因而需要研制一种能够自动为用户进行版权侵权监测的技术方案。
北京奇虎科技有限公司申请的中国专利CN111382394A,其公开日为2020年7月7日,提供了一种图片的侵权监控方法及装置,该方法包括获取用户上传的图片,从网络中检索与用户上传图片相同的图片,得到检索结果;若依据检索结果判断网络中存在与用户上传图片相同的图片,进一步分析用户上传图片是否为版权图片;若是,则对与用户上传图片相同的图片进行跟踪监测,当监测到与用户上传图片相同的图片产生侵权行为时,查找与侵权图片相关的侵权数据信息。由此,其技术方案通过对用户上传的图片做全网检索扫描,可以更加全面、有效地找出可能存在侵权行为的图片。但其并没有提供如何进行图片全网检索,在当前全网图片资源的体量下,其图片全网检索的部分难以被有效实现,因而其技术方案并没有解决图片侵权监测的最主要的技术问题。
发明内容
本发明要解决的技术问题是:目前缺乏网络图片侵权难以被发现的技术问题。提出了一种网络图片侵权在线监测方法,本方法通过爬虫抓取网络图片信息,与版权图像对比获得网络图片侵权结果,能够及时和自动的发现侵权图片,维护版权所有者的利益。
为解决上述技术问题,本发明所采取的技术方案为:一种网络图片侵权在线监测方法,包括以下步骤:使用爬虫抓取网络上的网页,保存网页URL和网页代码,从网页URL获取网页域名,相同域名的网页纳入同一网站;根据网站的访问量、历史侵权情况以及交互类型,设定网站的优先度,网站访问量大、历史侵权多以及交互程度高的网站的优先度高;按网站优先度顺序抓取网站上的图片及图片URL,判断是否已存储相同URL的图片,若已存储则跳过该图片,反之,则下载该图片并以图片URL为索引存储;将抓取到的图片与用户登记侵权监测的版权图片比对,若相似度超过设定阈值,则将图片及图片URL提供给用户。通过爬虫抓取网络上的网页,根据网站的访问量以及网页代码信息,判断网站侵权的可能性和侵权带来的严重性,根据侵权严重性和可能性对网站进行排序,对排序后的网站进行图片抓取和相似度对比,能够提高网络监控的效率。在当前网络信息体量下,该方法是实现网络侵权监测的可行度最高的在线监测方法。
作为优选,设定网站的优先度的方法包括:将优先度分为高优先度、普通优先度和低优先度,设定网站日均访问量的阈值Vref,H和阈值Vref,L,Vref,H>Vref,L,若网站i的日均访问量Vi超过阈值Vref,H,则将网站i纳入高优先度集合,若网站i的日均访问量Vi低于阈值Vref,L,则将网站i纳入低优先度集合;将历史侵权数量超过设定阈值的网站i纳入高优先度集合;将排版版式数量Ci超过设定阈值Cref的网站i纳入高优先度集合;将允许用户上传并展示图片且网站日均访问量Vi超过阈值σ·Vref,H的网站纳入高优先度集合,其中σ为小于1的正数;将未被纳入高优先度集合或低优先度集合的网站纳入普通优先度集合。日均访问量Vi表征侵权带来的后果严重程度,允许用户自行上传和展示图片的网站容易造成侵权,因而应提高其优先度。作为优选,抓取网页的爬虫和抓取图片的爬虫为两个同时工作的独立爬虫,抓取网页的爬虫不断获得新的网站并设定优先度,并将已有网站以一定周期重新视为新网站重新加入待监测网站并设定优先度,抓取图片的爬虫在高优先度集合内网站数量超过设置上限数量时,抓取高优先度集合内的网站内包含的未被下载过的图片,并将抓取完成的网站移出,当高优先度集合内网站数量为0时,抓取图片的爬虫抓取普通优先度内的网站,直到由于抓取网页的爬虫不断获得新的网站导致高优先度集合内网站数量再次超过设置上限数量。以设定的周期抓取设定个数的低优先度集合内网站数量内的图片。
作为优选,设定网站的优先度pi的方法包括:将网站日均访问量Vi归一化为V′i,pi=(1+V′i)(σBBi+σCCi+σDyDyi+σWWi)
其中,Bi为网站i历史侵权数量,Ci为网站i的排版版式数量,Dyi为网站i是否允许用户上传并展示图片,若是则Dyi取值为1,若否则Dyi取值为0,Wi为网站i在搜索引擎的权重等级,Wi越大表示在搜索引擎的权重等级越高,σB、σC、σDy以及σW分别为各项的系数。通过计算每个网站的优先度pi能够提供最为优化的抓取顺序,经过反馈迭代后,能够进一步提高图片侵权的监测效率。
作为优选,获得排版版式数量的方法包括:读取网站i下的全部网页的网页代码,为每个网页建立DIV索引Indexp,所述DIV索引Indexp为网页p包含的每个DIV标签建立属性条目AtD,所述属性条目AtD记录DIV标签D引用的CSS标签名和style字段,其中style字段仅保留宽度、垂直偏移量和水平偏移量;DIV索引Indexp之间进行比较,获得属性条目AtD的值在不同的DIV索引Indexp中出现的次数A.AtD,在同一个DIV索引Indexp中多次出现相同的属性条目AtD的值仅计1次;从DIV索引Indexp中,将N.AtD小于设定阈值的DIV标签D删除,再次在DIV索引Indexp之间进行比较,若DIV索引Indexp1和Indexp2的相似度超过阈值,则将网页p1和网页p2视为同排版版式,获得网站i的排版版式数量。网页中DIV的高度可能会随内容变化,但DIV的宽度通常不会变化,筛选出相似DIV组合,即为表征网页排版版式的特征,进而能够借助计算机程序自动的计算出网站排版版式的数量。
作为优选,获取网站i的类型,将落入预设类型集合的网站i纳入高优先度集合;获取网站i的更新频率,将更新频率超过设定阈值的网站i纳入高优先度集合。高优先度集合包括图片素材类网站、图片兴趣分享类网站、图文式网文分享类网站以及图片分享论坛。
作为优选,判断网站i中网页的平均广告数量和最大广告数量,将平均广告数量超过设定阈值或最大广告数量超过设定阈值的网站i纳入高优先度集合,获得网页p的广告数量Adp的方法包括:建立广告域名列表,识别网页p中全部链接,将包含广告域名列表中域名的链接作为广告链接,统计广告链接的数量;判断网站i中网页的平均字体大小种类数和最大字体大小种类数,平均字体大小种类数超过设定阈值或最大字体大小种类数超过设定阈值的网站i纳入高优先度集合。广告较多的网站表示网站的盈利需求较大,一定程度上表示容易产生侵权违法行为。
作为优选,读取网站i的所有CSS代码,获取其中的颜色标签的值,获得网站i的色彩集合,计算色彩集合的和谐度hari,hari=ncon+nnear+nsimilar-k·nrest,其中ncon、nnear以及nsimilar分别为色彩集合中构成对比色、邻近色以及同种色的色彩对的数量,nrest为未参与构成对比色、邻近色或同种色的色彩数量,k为系数,k>1。色彩具有其和谐的规律,网站的色彩使用若符合和谐规律,则表明运营主体对色彩、图片类作品有一定知识积累,更加能够理解原创图片的创造难度,对版权侵权一定程度上更为抵制。相应的,色彩不和谐的网站,其优先度应当提高。
作为优选,读取网站i的运营主体,获取运营主体的涉法律纠纷信息,若运营主体涉侵权类法律纠纷,则网站i的优先度高。涉及版权侵权的法律纠纷,则表明其曾经存在侵权行为,应当提高优先度。
作为优选,所述历史侵权数量以设定周期滚动更新统计获得。以设定周期滚动更新使得历史侵权数量更具有参考价值。
作为优选,人工为σB、σC、σDy以及σW设初值;获得预设数量的侵权数据后,将全部网站分别按Bi、Ci、Dyi以及Wi降序排列,若侵权网站在某个降序排列中平均排名大于预设阈值,则以设定步长增大相应降序排列对应的系数。通过迭代更新,能够提高系数设定的可靠性,提高网络侵权监测的效率。
本发明的实质性效果是:提供了高效的网络图片监控技术方案,能够自动对全网进行侵权监测,维护保护版权所有者的权益;通过优先度的区分,有效应对了网络信息量大给侵权监测带来的效率影响。
附图说明
图1为实施例一网络图片侵权在线监测方法流程框图。
图2为实施例一设定网站的优先度的方法流程框图。
图3为实施例一获得排版版式数量的方法流程框图。
具体实施方式
下面通过具体实施例,并结合附图,对本发明的具体实施方式作进一步具体说明。
实施例一:
一种网络图片侵权在线监测方法,如图1所示,包括以下步骤:使用爬虫抓取网络上的网页,保存网页URL和网页代码,从网页URL获取网页域名,相同域名的网页纳入同一网站;根据网站的访问量、历史侵权情况以及交互类型,设定网站的优先度,网站访问量大、历史侵权多以及交互程度高的网站的优先度高;按网站优先度顺序抓取网站上的图片及图片URL,判断是否已存储相同URL的图片,若已存储则跳过该图片,反之,则下载该图片并以图片URL为索引存储;将抓取到的图片与用户登记侵权监测的版权图片比对,若相似度超过设定阈值,则将图片及图片URL提供给用户。历史侵权数量以设定周期滚动更新统计获得。
如图2所示,设定网站的优先度的方法包括:将优先度分为高优先度、普通优先度和低优先度,设定网站日均访问量的阈值Vref,H和阈值Vref,L,Vref,H>Vref,L,若网站i的日均访问量Vi超过阈值Vref,H,则将网站i纳入高优先度集合,若网站i的日均访问量Vi低于阈值Vref,L,则将网站i纳入低优先度集合;将历史侵权数量超过设定阈值的网站i纳入高优先度集合;将排版版式数量Ci超过设定阈值Cref的网站i纳入高优先度集合;将允许用户上传并展示图片且网站日均访问量Vi超过阈值σ·Vref,H的网站纳入高优先度集合,其中σ为小于1的正数;将未被纳入高优先度集合或低优先度集合的网站纳入普通优先度集合。日均访问量Vi表征侵权带来的后果严重程度,允许用户自行上传和展示图片的网站容易造成侵权,因而应提高其优先度。抓取网页的爬虫和抓取图片的爬虫为两个同时工作的独立爬虫,抓取网页的爬虫不断获得新的网站并设定优先度,并将已有网站以一定周期重新视为新网站重新加入待监测网站并设定优先度,抓取图片的爬虫在高优先度集合内网站数量超过设置上限数量时,抓取高优先度集合内的网站内包含的未被下载过的图片,并将抓取完成的网站移出,当高优先度集合内网站数量为0时,抓取图片的爬虫抓取普通优先度内的网站,直到由于抓取网页的爬虫不断获得新的网站导致高优先度集合内网站数量再次超过设置上限数量。
获得排版版式数量的方法包括:如图3所示,读取网站i下的全部网页的网页代码,为每个网页建立DIV索引Indexp,DIV索引Indexp为网页p包含的每个DIV标签建立属性条目AtD,属性条目AtD记录DIV标签D引用的CSS标签名和style字段,其中style字段仅保留宽度、垂直偏移量和水平偏移量;DIV索引Indexp之间进行比较,获得属性条目AtD的值在不同的DIV索引Indexp中出现的次数N.AtD,在同一个DIV索引Indexp中多次出现相同的属性条目AtD的值仅计1次;从DIV索引Indexp中,将N.AtD小于设定阈值的DIV标签D删除,再次在DIV索引Indexp之间进行比较,若DIV索引Indexp1和Indexp2的相似度超过阈值,则将网页p1和网页p2视为同排版版式,获得网站i的排版版式数量。网页中DIV的高度可能会随内容变化,但DIV的宽度通常不会变化,筛选出相似DIV组合,即为表征网页排版版式的特征,进而能够借助计算机程序自动的计算出网站排版版式的数量。
获取网站i的类型,将落入预设类型集合的网站i纳入高优先度集合;获取网站i的更新频率,将更新频率超过设定阈值的网站i纳入高优先度集合。高优先度集合包括图片素材类网站、图片兴趣分享类网站、图文式网文分享类网站以及图片分享论坛。读取网站i的运营主体,获取运营主体的涉法律纠纷信息,若运营主体涉侵权类法律纠纷,则网站i的优先度高。
判断网站i中网页的平均广告数量和最大广告数量,将平均广告数量超过设定阈值或最大广告数量超过设定阈值的网站i纳入高优先度集合,获得网页p的广告数量Adp的方法包括:建立广告域名列表,识别网页p中全部链接,将包含广告域名列表中域名的链接作为广告链接,统计广告链接的数量;判断网站i中网页的平均字体大小种类数和最大字体大小种类数,平均字体大小种类数超过设定阈值或最大字体大小种类数超过设定阈值的网站i纳入高优先度集合。
读取网站i的所有CSS代码,获取其中的颜色标签的值,获得网站i的色彩集合,计算色彩集合的和谐度hari,hari=ncon+nnear+nsimilar-k·nrest,其中ncon、nnear以及nsimilar分别为色彩集合中构成对比色、邻近色以及同种色的色彩对的数量,nrest为未参与构成对比色、邻近色或同种色的色彩数量,k为系数,k>1。色彩具有其和谐的规律,网站的色彩使用若符合和谐规律,色彩不和谐的网站,其优先度应当提高。
本实施例的有益技术效果是:提供了高效的网络图片监控技术方案,能够自动对全网进行侵权监测,维护保护版权所有者的权益;通过优先度的区分,有效应对了网络信息量大给侵权监测带来的效率影响。
实施例二:
一种网络图片侵权在线监测方法,本实施例在实施例一的基础上,优选度pi的设定提供了新的技术方案,设定网站的优先度pi的方法包括:将网站日均访问量Vi归一化为Vi′,pi=(1+V′i)(σBBi+σCCi+σDyDyi+σWWi)
其中,Bi为网站i历史侵权数量,Ci为网站i的排版版式数量,Dyi为网站i是否允许用户上传并展示图片,若是则Dyi取值为1,若否则Dyi取值为0,Wi为网站i在搜索引擎的权重等级,Wi越大表示在搜索引擎的权重等级越高,σB、σC、σDy以及σW分别为各项的系数。人工为σB、σC、σDy以及σW设初值;获得预设数量的侵权数据后,将全部网站分别按Bi、Ci、Dyi以及Wi降序排列,若侵权网站在某个降序排列中平均排名大于预设阈值,则以设定步长增大相应降序排列对应的系数。其余步骤同实施例一。相对于实施例一,本实施例通过计算每个网站的优先度pi能够提供最为优化的抓取顺序,经过反馈迭代后,能够进一步提高图片侵权的监测效率。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
Claims (9)
1.一种网络图片侵权在线监测方法,其特征在于,
包括以下步骤:
使用爬虫抓取网络上的网页,保存网页URL和网页代码,从网页URL获取网页域名,相同域名的网页纳入同一网站;
根据网站的访问量、历史侵权情况以及交互类型,设定网站的优先度,网站访问量大、历史侵权多以及交互程度高的网站的优先度高;
按网站优先度顺序抓取网站上的图片及图片URL,判断是否已存储相同URL的图片,若已存储则跳过该图片,反之,则下载该图片并以图片URL为索引存储;
将抓取到的图片与用户登记侵权监测的版权图片比对,若相似度超过设定阈值,则将图片及图片URL提供给用户;
设定网站的优先度的方法包括:
将优先度分为高优先度、普通优先度和低优先度,
设定网站日均访问量的阈值Vref,H和阈值Vref,L,Vref,H>Vref,L,若网站i的日均访问量Vi超过阈值Vref,H,则将网站i纳入高优先度集合,若网站i的日均访问量Vi低于阈值Vref,L,则将网站i纳入低优先度集合;
将历史侵权数量Hi超过设定阈值Href的网站i纳入高优先度集合;
将排版版式数量Ci超过设定阈值Cref的网站i纳入高优先度集合;
将允许用户上传并展示图片且网站日均访问量Vi超过阈值σ·Vref,H的网站纳入高优先度集合,其中σ为小于1的正数;
将未被纳入高优先度集合或低优先度集合的网站纳入普通优先度集合。
2.根据权利要求1所述的一种网络图片侵权在线监测方法,其特征在于,
设定网站的优先度pi的方法包括:
将网站日均访问量Vi归一化为V′i,
pi=(1+V′i)(aBBi+σCCi+σDyDyi+σWWi)
其中,Bi为网站i历史侵权数量,Ci为网站i的排版版式数量,Dyi为网站i是否允许用户上传并展示图片,若是则Dyi取值为1,若否则Dyi取值为0,Wi为网站i在搜索引擎的权重等级,Wi越大表示在搜索引擎的权重等级越高,σB、σC、σDy以及σW分别为各项的系数。
3.根据权利要求1或2所述的一种网络图片侵权在线监测方法,其特征在于,
获得排版版式数量的方法包括:
读取网站i下的全部网页的网页代码,为每个网页建立DIV索引Indexp,所述DIV索引Indexp为网页p包含的每个DIV标签建立属性条目AtD,所述属性条目AtD记录DIV标签D引用的CSS标签名和style字段,其中style字段仅保留宽度、垂直偏移量和水平偏移量;
DIV索引Indexp之间进行比较,获得属性条目AtD的值在不同的DIV索引Indexp中出现的次数N.AtD,在同一个DIV索引Indexp中多次出现相同的属性条目AtD的值仅计1次;
从DIV索引Indexp中,将N.AtD小于设定阈值的DIV标签D删除,再次在DIV索引Indexp之间进行比较,若DIV索引Indexp1和Indexp2的相似度超过阈值,则将网页p1和网页p2视为同排版版式,获得网站i的排版版式数量。
4.根据权利要求1所述的一种网络图片侵权在线监测方法,其特征在于,
获取网站i的类型,将落入预设类型集合的网站i纳入高优先度集合;
获取网站i的更新频率,将更新频率超过设定阈值的网站i纳入高优先度集合。
5.根据权利要求1所述的一种网络图片侵权在线监测方法,其特征在于,
判断网站i中网页的平均广告数量和最大广告数量,将平均广告数量超过设定阈值或最大广告数量超过设定阈值的网站i纳入高优先度集合,
获得网页p的广告数量Adp的方法包括:
建立广告域名列表,识别网页p中全部链接,将包含广告域名列表中域名的链接作为广告链接,统计广告链接的数量;
判断网站i中网页的平均字体大小种类数和最大字体大小种类数,平均字体大小种类数超过设定阈值或最大字体大小种类数超过设定阈值的网站i纳入高优先度集合。
6.根据权利要求1所述的一种网络图片侵权在线监测方法,其特征在于,
读取网站i的所有CSS代码,获取其中的颜色标签的值,获得网站i的色彩集合,计算色彩集合的和谐度hari,hari=ncon+nnear+nsimilar-k·nrest,其中ncon、nnear以及nsimilar分别为色彩集合中构成对比色、邻近色以及同种色的色彩对的数量,nrest为未参与构成对比色、邻近色或同种色的色彩数量,k为系数,k>1。
7.根据权利要求1或2所述的一种网络图片侵权在线监测方法,其特征在于,
读取网站i的运营主体,获取运营主体的涉法律纠纷信息,若运营主体涉侵权类法律纠纷,则网站i的优先度高。
8.根据权利要求1或2所述的一种网络图片侵权在线监测方法,其特征在于,
所述历史侵权数量以设定周期滚动更新统计获得。
9.根据权利要求2所述的一种网络图片侵权在线监测方法,其特征在于,
人工为σB、σC、σDy以及σw设初值;
获得预设数量的侵权数据后,将全部网站分别按Bi、Ci、Dyi以及Wi降序排列,若侵权网站在某个降序排列中平均排名大于预设阈值,则以设定步长增大相应降序排列对应的系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010961065.8A CN112149063B (zh) | 2020-09-14 | 2020-09-14 | 一种网络图片侵权在线监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010961065.8A CN112149063B (zh) | 2020-09-14 | 2020-09-14 | 一种网络图片侵权在线监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112149063A CN112149063A (zh) | 2020-12-29 |
CN112149063B true CN112149063B (zh) | 2022-06-24 |
Family
ID=73892202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010961065.8A Active CN112149063B (zh) | 2020-09-14 | 2020-09-14 | 一种网络图片侵权在线监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112149063B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116611033B (zh) * | 2023-07-17 | 2023-09-15 | 中信联合云科技有限责任公司 | 基于ai数字作品版权的风控方法、系统、装置及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017124884A1 (zh) * | 2016-01-22 | 2017-07-27 | 中国互联网络信息中心 | 一种针对新增域名自动检测网络钓鱼的方法与系统 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6023726A (en) * | 1998-01-20 | 2000-02-08 | Netscape Communications Corporation | User configurable prefetch control system for enabling client to prefetch documents from a network server |
US7181459B2 (en) * | 1999-05-04 | 2007-02-20 | Iconfind, Inc. | Method of coding, categorizing, and retrieving network pages and sites |
CN1952947A (zh) * | 2005-10-17 | 2007-04-25 | 左其其 | 一种网站反克隆的系统和方法 |
CN101093485A (zh) * | 2006-06-22 | 2007-12-26 | 上海新纳广告传媒有限公司 | 一种网页重复内容过滤方法 |
US20130117190A1 (en) * | 2011-11-07 | 2013-05-09 | Singularis, Inc. | Copyright infringement management system, apparatus, and method |
CN103530390B (zh) * | 2013-10-22 | 2018-09-04 | 北京奇虎科技有限公司 | 网页抓取的方法及设备 |
US10521824B1 (en) * | 2014-01-02 | 2019-12-31 | Outbrain Inc. | System and method for personalized content recommendations |
CN108664489B (zh) * | 2017-03-29 | 2022-12-23 | 腾讯科技(深圳)有限公司 | 网站内容监控方法和装置 |
CN107800679A (zh) * | 2017-05-22 | 2018-03-13 | 湖南大学 | 假冒学术期刊网站的检测方法 |
CN107832384A (zh) * | 2017-10-28 | 2018-03-23 | 北京安妮全版权科技发展有限公司 | 侵权检测方法、装置、存储介质和电子设备 |
CN108153880A (zh) * | 2017-12-26 | 2018-06-12 | 北京非斗数据科技发展有限公司 | 一种关于网络图片的多策略自适应爬取技术 |
CN108664584A (zh) * | 2018-05-07 | 2018-10-16 | 秦德玉 | 侵权网站搜索识别方法及装置 |
CN110535806B (zh) * | 2018-05-24 | 2022-04-01 | 中国移动通信集团重庆有限公司 | 监测异常网站的方法、装置、设备和计算机存储介质 |
CN109002487A (zh) * | 2018-06-25 | 2018-12-14 | 百度在线网络技术(北京)有限公司 | 一种基于版权登记信息的后处理方法、装置、设备和介质 |
CN109344570A (zh) * | 2018-09-30 | 2019-02-15 | 真相网络科技(北京)有限公司 | 一种互联网音乐侵权行为的判定方法及系统 |
CN111382394A (zh) * | 2018-12-29 | 2020-07-07 | 北京奇虎科技有限公司 | 一种图片的侵权监控方法及装置 |
CN110096639B (zh) * | 2019-01-25 | 2021-04-06 | 重庆易保全网络科技有限公司 | 一种侵权监测取证方法、装置及终端设备 |
CN111061983B (zh) * | 2019-12-17 | 2024-01-09 | 上海冠勇信息科技有限公司 | 一种侵权数据抓取优先级的评估方法及其网络监控系统 |
CN111460255A (zh) * | 2020-03-26 | 2020-07-28 | 第一曲库(北京)科技有限公司 | 一种音乐作品信息数据采集及存储方法 |
-
2020
- 2020-09-14 CN CN202010961065.8A patent/CN112149063B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017124884A1 (zh) * | 2016-01-22 | 2017-07-27 | 中国互联网络信息中心 | 一种针对新增域名自动检测网络钓鱼的方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112149063A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8630972B2 (en) | Providing context for web articles | |
US10572565B2 (en) | User behavior models based on source domain | |
CN106202475B (zh) | 一种视频推荐列表的推送方法及装置 | |
KR101385700B1 (ko) | 동영상 관련 광고를 제공하는 방법 및 그 장치 | |
Teyssou et al. | The InVID plug-in: web video verification on the browser | |
US20110246462A1 (en) | Method and System for Prompting Changes of Electronic Document Content | |
CN106383887A (zh) | 一种环保新闻数据采集和推荐展示的方法及系统 | |
CN104866554B (zh) | 一种基于社会化标注的个性化搜索方法及系统 | |
JP2014502753A (ja) | ウェブページ情報の検出方法及びシステム | |
KR20150077492A (ko) | 내용기반의 검색엔진을 이용한 개인 콘텐츠 저작권 관리 시스템 및 방법 | |
CN110889045A (zh) | 标签分析方法、装置及计算机可读存储介质 | |
CN112149063B (zh) | 一种网络图片侵权在线监测方法 | |
CN108319628A (zh) | 一种用户兴趣确定方法及装置 | |
KR100611097B1 (ko) | 인터넷 검색 내역과 tv 시청 내역을 이용한 방송프로그램 추천 장치 및 그 방법 | |
CN112269906B (zh) | 网页正文的自动抽取方法及装置 | |
US20160371725A1 (en) | Campaign optimization system | |
WO2019227705A1 (zh) | 图片录入方法、服务器及计算机存储介质 | |
CN103605742A (zh) | 识别网络资源实体目录页的方法及装置 | |
CN110110219A (zh) | 根据网络行为确定用户偏好的方法及装置 | |
CN112685618A (zh) | 用户特征识别方法、装置、计算设备及计算机存储介质 | |
CN115965439A (zh) | 数据召回方法、数据召回装置、电子设备及存储介质 | |
JP2007188427A (ja) | 話題画像選出方法及び装置及プログラム | |
KR102062832B1 (ko) | 웹 기반 논문 큐레이션 서비스 시스템 및 방법 | |
Yamasaki et al. | Power of tags: Predicting popularity of social media in geo-spatial and temporal contexts | |
JP2022073872A (ja) | 侵害情報抽出システム、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: An online monitoring method for network image infringement Effective date of registration: 20220825 Granted publication date: 20220624 Pledgee: Bank of Beijing Limited by Share Ltd. Hangzhou branch Pledgor: ZHEJIANG SHUQIN TECHNOLOGY CO.,LTD. Registration number: Y2022330001899 |