CN108108982A - 一种授权信息的识别方法及装置 - Google Patents

一种授权信息的识别方法及装置 Download PDF

Info

Publication number
CN108108982A
CN108108982A CN201611055160.1A CN201611055160A CN108108982A CN 108108982 A CN108108982 A CN 108108982A CN 201611055160 A CN201611055160 A CN 201611055160A CN 108108982 A CN108108982 A CN 108108982A
Authority
CN
China
Prior art keywords
predetermined
logo information
website
logo
authorization message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611055160.1A
Other languages
English (en)
Inventor
邓玥琳
焦大原
高光明
刘辉
丁飞
章霖超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201611055160.1A priority Critical patent/CN108108982A/zh
Publication of CN108108982A publication Critical patent/CN108108982A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提出了一种授权信息的识别方法及装置,其中的方法包括:通过解析获取预定网站的内容;识别所述预定网站的内容中的徽标信息;根据预定授权信息和所述徽标信息确定所述预定网站的合法性。该方法根据网络商户的网站的内容识别其使用的徽标信息,并根据预定授权信息和徽标信息确定该网站的合法性,从而以较高的检测效率对平台中的所有网络商户的网站进行巡查,并能够较准确地检测出非法使用未授权徽标信息的网站,从而减少推广中的侵权风险。

Description

一种授权信息的识别方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种授权信息的识别方法及装置。
背景技术
在现有的网络商户的网站中,存在一些利用无授权的知名品牌的LOGO图像吸引消费者、仿冒官网或者代理商等进行诈骗的行为,损害了品牌厂商和消费者的利益。
对于仿冒官网、品牌侵权等违规风险,LOGO是最重要的特征。而在本领域的现有技术中,针对风险高发行业,通常采用人工标准主动挖掘知名品牌LOGO的方式建立数据库,然后在网络商户的网站上主动识别品牌LOGO。如果某个网络商户的网站使用了品牌LOGO但却不是该品牌持有方或授权方,则发送人工处理。这种方法虽然能够检测仿冒及侵权等行为,但检测的效率较低且准确性较差,难以满足在互联网行业中防止仿冒官网及品牌侵权等违规行为的要求。
发明内容
本发明解决的技术问题之一是现有的对存在违规行为的网络商户的网站的检测效率较低及准确性较差。
根据本发明一方面的一个实施例,提供了一种授权信息的识别方法,包括:
通过解析获取预定网站的内容;
识别所述预定网站的内容中的徽标信息;
根据预定授权信息和所述徽标信息确定所述预定网站的合法性。
根据本发明另一方面的一个实施例,提供了一种授权信息的识别装置,包括:
用于通过解析获取预定网站的内容的装置;
用于识别所述预定网站的内容中的徽标信息的装置;
用于根据预定授权信息和所述徽标信息确定所述预定网站的合法性的装置。
由于本实施例根据网络商户的网站的内容识别其使用的徽标信息,并根据预定授权信息和徽标信息确定该网站的合法性,从而以较高的检测效率对平台中的所有网络商户的网站进行巡查,并能够较准确地检测出非法使用未授权徽标信息的网站,从而减少推广中的侵权风险。
本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出了根据本发明提出的授权信息的识别方法的流程图。
图2示出了本发明的对预定网站的内容进行解析的流程图。
图3示出了本发明的根据所述解析的结果确定所述预定网站的网页内容的流程示意图。
图4示出了本发明的识别所述预定网站的内容中的徽标信息的流程图。
图5示出了本发明的一种确定所述徽标信息所属的商标类别的流程图。
图6示出了本发明的又一种确定所述徽标信息所属的商标类别的流程图。
图7示出了本发明的根据预定授权信息和所述徽标信息确定所述预定网站的合法性的流程图。
图8示出了本发明的根据预定授权信息建立知识图谱的流程图。
图9示出了本发明的实施例一提出的又一授权信息的识别方法的流程图。
图10示出了本发明的实施例二提出的又一授权信息的识别方法的流程图。
图11示出了根据本发明提出的授权信息的识别装置的框图。
图12示出了本发明的实施例三提出的又一授权信息的识别装置的框图。
图13示出了本发明的实施例四提出的又一授权信息的识别装置的框图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1是根据本发明一个实施例的授权信息的识别方法的流程图。
结合图1中所示,本实施例所述的授权信息的识别方法,包括如下步骤:
S110、通过解析获取预定网站的内容;
S120、识别所述预定网站的内容中的徽标信息;
S130、根据预定授权信息和所述徽标信息确定所述预定网站的合法性。
下面对各步骤做进一步详细介绍。
步骤S110中,可首先对预定网站的内容进行解析,以获取网页上所有文字以及图片的位置,并对这些图片进行子链解析与抓取。
可选的,结合图2所示,对预定网站的内容进行解析的过程可以包括:
S210、对所述预定网站的网页源码和网页结构进行解析;
S220、根据所述解析的结果确定所述预定网站的网页内容。
其中,对于如何确定预定网站的网页内容,结合图3所示,本实施例可采用但不限于以下的过程:
S310、确定所述网页内容中的图片和文字在所述网页中的位置;
S320、根据所述网页中的位置确定所述图片和文字为侵权商标的概率。
步骤S120中,可对抓取的图片中是否存在被保护的徽标进行判断。
可选的,结合图4所示,识别所述预定网站的内容中的徽标信息的步骤包括:
S410、通过预定检测模型检测所述预定网站的内容中的徽标信息;
S420、确定所述徽标信息所属的商标类别。
其中,对于如何确定所述徽标信息所属的商标类别,结合图5所示,本实施例可采用以下的过程:
S510、将所述徽标信息所在区域的图像代入预定卷积神经网络;
S520、通过所述预定卷积神经网络确定所述徽标信息所属的商标类别;
或者,结合图6所示,也可采用以下的过程:
S610、通过预定卷积神经网络获取所述徽标信息的徽标特征;
S620、将所述徽标特征与预定保护商标库进行匹配;
S630、根据所述匹配的结果确定所述徽标信息所属的商标类别。
步骤S130中,利用已有的授权信息对预定网站的合法性进行判断。
可选的,结合图7所示,根据预定授权信息和所述徽标信息确定所述预定网站的合法性的步骤包括:
S710、根据预定授权信息建立知识图谱;
S720、通过所述知识图谱确定所述预定网站的合法性。
其中,对于如何建立知识图谱的过程,结合图8所示,本实施例可采用但不限于以下的过程:
S810、获取官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系;
S820、根据所述对应关系建立所述知识图谱。
采用本实施例提出的技术方案,根据网络商户的网站的内容识别其使用的徽标信息,并根据预定授权信息和徽标信息确定该网站的合法性,从而以较高的检测效率对平台中的所有网络商户的网站进行巡查,并能够较准确地检测出非法使用未授权徽标信息的网站,从而减少推广中的侵权风险。
实施例一
在本实施例中提出了又一授权信息的识别方法,结合图9中所示,包括如下步骤:
S910、通过解析获取预定网站的内容。
该解析的过程可以包括对网页源码的解析,例如查看预定网页的HTMI源代码等。
而对于网页结构的解析则可以包括确定网页包括的文字和图片的内容及位置,并对这些图片进行子链接解析与抓取。
例如,当预定网站的一个图片来自企业A的官方网站,则表示该预定网站使用了企业A的官方网站的图片。
或者,当预定网站的一个词组为企业B的官方名称,则表示该预定网站使用了企业B的官方名称。
S920、通过预定检测模型检测所述预定网站的内容中的徽标信息。
该预定检测模型包括但不限于采用faster-rcnn、显著性检测或图像分割算法,并判断解析出的图片中的徽标信息可能位于的区域。
S930、将所述徽标信息所在区域的图像代入预定卷积神经网络。
基于分类的模型,可将该徽标信息所在区域的图像代入CNN(ConvolutionalNeural Network,卷积神经网络),例如采用但不限于AlexNet、VGG等类型的CNN。
S940、通过所述预定卷积神经网络确定所述徽标信息所属的商标类别。
通过该卷积神经网络,可以确定一个被保护商标的分类结果并输出。例如将企业A的商标确定为被保护的商标。
S950、根据预定授权信息建立知识图谱。
可利用官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系等内容建立知识图谱。
S960、通过所述知识图谱确定所述预定网站的合法性。
根据该知识图谱即可判断使用该徽标的主体是否为合法使用。
例如该预定网站使用了企业A的图形商标,但该预定网站并未在该知识图谱中与企业A存在合作关系,则可以确定该预定网站非法使用企业A的图形商标。
实施例二
在本实施例中提出了又一授权信息的识别方法,结合图10中所示,包括如下步骤:
S1010、通过解析获取预定网站的内容。
该解析的过程可以包括对网页源码,例如查看预定网页的HTMI源代码等。
而对于网页结构的解析则可以包括确定网页包括的文字和图片的内容及位置,并对这些图片进行子链接解析与抓取。
例如,当预定网站的一个图片来自企业A的官方网站,则表示该预定网站使用了企业A的官方网站的图片。
或者,当预定网站的一个词组为企业B的官方名称,则表示该预定网站使用了企业B的官方名称。
S1020、通过预定检测模型检测所述预定网站的内容中的徽标信息。
该预定检测模型包括但不限于采用faster-rcnn、显著性检测或图像分割算法判断解析出的图片中的徽标信息可能位于的区域。
S1030、通过预定卷积神经网络获取所述徽标信息的徽标特征。
基于检索的模型,可将该徽标信息所在区域的图像代入CNN进行特征抽取,以获取该徽标信息所在区域的特征。
例如,该徽标信息所在区域的特征为若干个字母的组合。
S1040、将所述徽标特征与预定保护商标库进行匹配。
将该徽标信息所在区域的特征与预定保护商标库进行匹配。例如将该若干个字母的组合与预定保护商标库中的每一个商标进行匹配。
S1050、根据所述匹配的结果确定所述徽标信息所属的商标类别。
在进行匹配的过程中可根据距离的阈值判断是否为被保护的商标,例如可采用的距离度量方式包括但不仅限于欧式距离等。最终确定所有与该若干个字母的组合相同或相近似的商标
S1060、根据预定授权信息建立知识图谱。
可利用官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系等内容建立知识图谱。
S1070、通过所述知识图谱确定所述预定网站的合法性。
根据该知识图谱即可判断使用该徽标的主体是否为合法使用。
例如该预定网站使用了企业B的文字商标,但该预定网站并未在该知识图谱中与企业B存在合作关系,则可以确定该预定网站非法使用企业B的文字商标。
结合图11中所示,本实施例所述的授权信息的识别装置可以包括如下的装置:
用于通过解析获取预定网站的内容的装置(以下简称“解析装置”)1110;
用于识别所述预定网站的内容中的徽标信息的装置(以下简称“识别装置”)1120;
用于根据预定授权信息和所述徽标信息确定所述预定网站的合法性的装置(以下简称“合法性确定装置”)1130。
下面对各装置做进一步详细介绍。
可首先通过解析装置1110对预定网站的内容进行解析,以获取网页上所有文字以及图片的位置,并对这些图片进行子链解析与抓取。
可选的,在解析装置110中可以包括如下的装置:
用于对所述预定网站的网页源码和网页结构进行解析的装置;
用于根据所述解析的结果确定所述预定网站的网页内容的装置。
其中,用于根据所述解析的结果确定所述预定网站的网页内容的装置可以包括如下的装置:
用于确定所述网页内容中的图片和文字在所述网页中的位置的装置;
用于根据所述网页中的位置确定所述图片和文字为侵权商标的概率的装置。
然后,可通过识别装置1120对抓取的图片中是否存在被保护的徽标进行判断。
可选的,在识别装置1120中可以包括如下的装置:
用于通过预定检测模型检测所述预定网站的内容中的徽标信息的装置;
用于确定所述徽标信息所属的商标类别的装置。
其中,在用于确定所述徽标信息所属的商标类别的装置中可以包括如下的装置:
用于将所述徽标信息所在区域的图像代入预定卷积神经网络的装置;
用于通过所述预定卷积神经网络确定所述徽标信息所属的商标类别的装置;
或者,也可以包括如下的装置:
用于通过预定卷积神经网络获取所述徽标信息的徽标特征的装置;
用于将所述徽标特征与预定保护商标库进行匹配的装置;
用于根据所述匹配的结果确定所述徽标信息所属的商标类别的装置。
最后,通过合法性确定装置1130利用已有的授权信息对预定网站的合法性进行判断。
可选的,在合法性确定装置1130中可以包括如下的装置:
用于根据预定授权信息建立知识图谱的装置;
用于通过所述知识图谱确定所述预定网站的合法性的装置。
其中,在用于根据预定授权信息建立知识图谱的装置中可以包括如下的装置:
用于获取官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系的装置;
用于根据所述对应关系建立所述知识图谱的装置。
采用本实施例提出的技术方案,根据网络商户的网站的内容识别其使用的徽标信息,并根据预定授权信息和徽标信息确定该网站的合法性,从而以较高的检测效率对平台中的所有网络商户的网站进行巡查,并能够较准确地检测出非法使用未授权徽标信息的网站,从而减少推广中的侵权风险。
实施例三
在本实施例中提出了又一授权信息的识别装置,结合图12中所示,包括如下的装置:
用于通过解析获取预定网站的内容的装置(以下简称“内容获取装置”)1210;
用于通过预定检测模型检测所述预定网站的内容中的徽标信息的装置(以下简称“徽标检测装置”)1220;
用于将所述徽标信息所在区域的图像代入预定卷积神经网络的装置(以下简称“徽标代入装置”)1230;
用于通过所述预定卷积神经网络确定所述徽标信息所属的商标类别的装置(以下简称“第一徽标类别确定装置”)1240;
用于根据预定授权信息建立知识图谱的装置(以下简称“图谱建立装置”)1250;
用于通过所述知识图谱确定所述预定网站的合法性的装置(以下简称“确定装置”)1260。
首先,该解析的过程可以包括通过内容获取装置1210对网页源码的解析,例如查看预定网页的HTMI源代码等。
而对于网页结构的解析则可以包括通过内容获取装置1210确定网页包括的文字和图片的内容及位置,并对这些图片进行子链接解析与抓取。
例如,当预定网站的一个图片来自企业A的官方网站,则表示该预定网站使用了企业A的官方网站的图片。
或者,当预定网站的一个词组为企业B的官方名称,则表示该预定网站使用了企业B的官方名称。
然后,在徽标检测装置1210中采用的预定检测模型包括但不限于采用faster-rcnn、显著性检测或图像分割算法,并通过在徽标检测装置1210判断解析出图片中的徽标信息可能位于的区域。
基于分类的模型,可通过徽标代入装置1230将该徽标信息所在区域的图像代入CNN,例如采用但不限于AlexNet、VGG等类型的CNN。
其次,通过该卷积神经网络,可以由第一徽标类别确定装置1240确定一个被保护商标的分类结果并输出。例如将企业A的商标确定为被保护的商标。
并且,可通过图谱建立装置1250利用官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系等内容建立知识图谱。
最后,由确定装置1260根据该知识图谱即可判断使用该徽标的主体是否为合法使用。
例如该预定网站使用了企业A的图形商标,但该预定网站并未在该知识图谱中与企业A存在合作关系,则可以确定该预定网站非法使用企业A的图形商标。
实施例四
在本实施例中提出了又一授权信息的识别装置,结合图13中所示,包括如下装置:
用于通过解析获取预定网站的内容的装置(以下简称“内容获取装置”)1210;
用于通过预定检测模型检测所述预定网站的内容中的徽标信息的装置(以下简称“徽标检测装置”)1220;
用于通过预定卷积神经网络获取所述徽标信息的徽标特征(以下简称“特征获取装置”)1270;
用于将所述徽标特征与预定保护商标库进行匹配的装置(以下简称“匹配装置”)1280;
用于根据所述匹配的结果确定所述徽标信息所属的商标类别的装置(以下简称“第二徽标类别确定装置”)1290;
用于根据预定授权信息建立知识图谱的装置(以下简称“图谱建立装置”)1250;
用于通过所述知识图谱确定所述预定网站的合法性的装置(以下简称“确定装置”)1260。
首先,该解析的过程可以包括通过内容获取装置1210对网页源码的解析,例如查看预定网页的HTMI源代码等。
而对于网页结构的解析则可以包括通过内容获取装置1210确定网页包括的文字和图片的内容及位置,并对这些图片进行子链接解析与抓取。
例如,当预定网站的一个图片来自企业A的官方网站,则表示该预定网站使用了企业A的官方网站的图片。
或者,当预定网站的一个词组为企业B的官方名称,则表示该预定网站使用了企业B的官方名称。
然后,在徽标检测装置1210中采用的预定检测模型包括但不限于采用faster-rcnn、显著性检测或图像分割算法,并通过在徽标检测装置1210判断解析出图片中的徽标信息可能位于的区域。
基于检索的模型,可通过特征获取装置1270将该徽标信息所在区域的图像代入CNN进行特征抽取,以获取该徽标信息所在区域的特征。
例如,该徽标信息所在区域的特征为若干个字母的组合。
其次,通过匹配装置1280将该徽标信息所在区域的特征与预定保护商标库进行匹配。例如将该若干个字母的组合与预定保护商标库中的每一个商标进行匹配。
在进行匹配的过程中可由第二徽标类别确定装置1290根据距离的阈值判断是否为被保护的商标,例如可采用的距离度量方式包括但不仅限于欧式距离等。最终确定所有与该若干个字母的组合相同或相近似的商标
并且,可通过图谱建立装置1250利用官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系等内容建立知识图谱。
最后,由确定装置1260根据该知识图谱即可判断使用该徽标的主体是否为合法使用。
例如该预定网站使用了企业B的文字商标,但该预定网站并未在该知识图谱中与企业B存在合作关系,则可以确定该预定网站非法使用企业B的文字商标。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
虽然前面特别示出并且描述了示例性实施例,但是本领域技术人员将会理解的是,在不背离权利要求书的精神和范围的情况下,在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。

Claims (16)

1.一种授权信息的识别方法,包括:
通过解析获取预定网站的内容;
识别所述预定网站的内容中的徽标信息;
根据预定授权信息和所述徽标信息确定所述预定网站的合法性。
2.根据权利要求1所述的方法,其中,通过解析获取预定网站的内容的步骤包括:
对所述预定网站的网页源码和网页结构进行解析;
根据所述解析的结果确定所述预定网站的网页内容。
3.根据权利要求2所述的方法,其中,根据所述解析的结果确定所述预定网站的网页内容的步骤包括:
确定所述网页内容中的图片和文字在所述网页中的位置;
根据所述网页中的位置确定所述图片和文字为侵权商标的概率。
4.根据权利要求1所述的方法,其中,识别所述预定网站的内容中的徽标信息的步骤包括:
通过预定检测模型检测所述预定网站的内容中的徽标信息;
确定所述徽标信息所属的商标类别。
5.根据权利要求4所述的方法,其中,确定所述徽标信息所属的商标类别的步骤包括:
将所述徽标信息所在区域的图像代入预定卷积神经网络;
通过所述预定卷积神经网络确定所述徽标信息所属的商标类别。
6.根据权利要求4所述的方法,其中,确定所述徽标信息所属的商标类别的步骤还包括:
通过预定卷积神经网络获取所述徽标信息的徽标特征;
将所述徽标特征与预定保护商标库进行匹配;
根据所述匹配的结果确定所述徽标信息所属的商标类别。
7.根据权利要求1所述的方法,其中,根据预定授权信息和所述徽标信息确定所述预定网站的合法性的步骤包括:
根据预定授权信息建立知识图谱;
通过所述知识图谱确定所述预定网站的合法性。
8.根据权利要求7所述的方法,其中,根据预定授权信息建立知识图谱的步骤包括:
获取官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系;
根据所述对应关系建立所述知识图谱。
9.一种授权信息的识别装置,包括:
用于通过解析获取预定网站的内容的装置;
用于识别所述预定网站的内容中的徽标信息的装置;
用于根据预定授权信息和所述徽标信息确定所述预定网站的合法性的装置。
10.根据权利要求9所述的装置,其中,所述用于通过解析获取预定网站的内容的装置包括:
用于对所述预定网站的网页源码和网页结构进行解析的装置;
用于根据所述解析的结果确定所述预定网站的网页内容的装置。
11.根据权利要求10所述的装置,其中,所述用于根据所述解析的结果确定所述预定网站的网页内容的装置包括:
用于确定所述网页内容中的图片和文字在所述网页中的位置的装置;
用于根据所述网页中的位置确定所述图片和文字为侵权商标的概率的装置。
12.根据权利要求9所述的装置,其中,所述用于识别所述预定网站的内容中的徽标信息的装置包括:
用于通过预定检测模型检测所述预定网站的内容中的徽标信息的装置;
用于确定所述徽标信息所属的商标类别的装置。
13.根据权利要求12所述的装置,其中,所述用于确定所述徽标信息所属的商标类别的装置包括:
用于将所述徽标信息所在区域的图像代入预定卷积神经网络的装置;
用于通过所述预定卷积神经网络确定所述徽标信息所属的商标类别的装置。
14.根据权利要求12所述的装置,其中,所述用于确定所述徽标信息所属的商标类别的装置还包括:
用于通过预定卷积神经网络获取所述徽标信息的徽标特征的装置;
用于将所述徽标特征与预定保护商标库进行匹配的装置;
用于根据所述匹配的结果确定所述徽标信息所属的商标类别的装置。
15.根据权利要求9所述的装置,其中,所述用于根据预定授权信息和所述徽标信息确定所述预定网站的合法性的装置包括:
用于根据预定授权信息建立知识图谱的装置;
用于通过所述知识图谱确定所述预定网站的合法性的装置。
16.根据权利要求15所述的装置,其中,所述用于根据预定授权信息建立知识图谱的装置包括:
用于获取官方数据信息、已公开的授权认证书和/或所述预定网站的用户提供的授权信息确定所述徽标信息、所述徽标信息的持有方及授权方之间的对应关系的装置;
用于根据所述对应关系建立所述知识图谱的装置。
CN201611055160.1A 2016-11-25 2016-11-25 一种授权信息的识别方法及装置 Pending CN108108982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611055160.1A CN108108982A (zh) 2016-11-25 2016-11-25 一种授权信息的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611055160.1A CN108108982A (zh) 2016-11-25 2016-11-25 一种授权信息的识别方法及装置

Publications (1)

Publication Number Publication Date
CN108108982A true CN108108982A (zh) 2018-06-01

Family

ID=62204323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611055160.1A Pending CN108108982A (zh) 2016-11-25 2016-11-25 一种授权信息的识别方法及装置

Country Status (1)

Country Link
CN (1) CN108108982A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583910A (zh) * 2018-10-26 2019-04-05 阿里巴巴集团控股有限公司 一种商品授权鉴定方法、装置及设备
CN110674678A (zh) * 2019-08-07 2020-01-10 国家计算机网络与信息安全管理中心 视频中敏感标志的识别方法及装置
CN112037088A (zh) * 2020-11-02 2020-12-04 北京梦知网科技有限公司 商标侵权确定方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950337A (zh) * 2010-09-08 2011-01-19 乔永清 用于网站真实数据监控的系统及方法
CN104077399A (zh) * 2014-07-02 2014-10-01 成都市卓睿科技有限公司 网络商品侵权监测系统及方法
CN104978586A (zh) * 2015-06-29 2015-10-14 百度在线网络技术(北京)有限公司 商标识别方法和装置
CN105095195A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950337A (zh) * 2010-09-08 2011-01-19 乔永清 用于网站真实数据监控的系统及方法
CN104077399A (zh) * 2014-07-02 2014-10-01 成都市卓睿科技有限公司 网络商品侵权监测系统及方法
CN104978586A (zh) * 2015-06-29 2015-10-14 百度在线网络技术(北京)有限公司 商标识别方法和装置
CN105095195A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 基于知识图谱的人机问答方法和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583910A (zh) * 2018-10-26 2019-04-05 阿里巴巴集团控股有限公司 一种商品授权鉴定方法、装置及设备
CN110674678A (zh) * 2019-08-07 2020-01-10 国家计算机网络与信息安全管理中心 视频中敏感标志的识别方法及装置
CN112037088A (zh) * 2020-11-02 2020-12-04 北京梦知网科技有限公司 商标侵权确定方法及装置

Similar Documents

Publication Publication Date Title
CN106384273B (zh) 恶意刷单检测系统及方法
US20200195667A1 (en) Url attack detection method and apparatus, and electronic device
Delalandre et al. Generation of synthetic documents for performance evaluation of symbol recognition & spotting systems
US20140122294A1 (en) Determining a characteristic group
US9721259B2 (en) Rules-based selection of counterfeit detection techniques
CN112507160A (zh) 商标侵权的自动化判定方法、装置、电子设备和存储介质
US10769270B2 (en) Password protection question setting method and device
CN110197389A (zh) 一种用户识别方法及装置
US11323245B2 (en) Method for linking block-chain using hyper-chain, and apparatus therefor
CN108108982A (zh) 一种授权信息的识别方法及装置
US20180314715A1 (en) Content Based Image Management and Selection
CN106933878B (zh) 一种信息处理方法及装置
CN109493259A (zh) 一种用于通过计算设备处理侵权案件的方法与设备
CN112016138A (zh) 一种车联网自动化安全建模的方法、装置和电子设备
CN113362162A (zh) 基于网络行为数据的风控识别方法、装置、电子设备及介质
CN115238688A (zh) 电子信息数据关联关系分析方法、装置、设备和存储介质
CN113032775A (zh) 情报处理方法和情报处理系统
CN115603926A (zh) 钓鱼邮件识别方法、系统、设备及存储介质
CN112883725A (zh) 一种文案生成方法、装置、电子设备、存储介质
CN115239442B (zh) 一种互联网金融产品推广的方法及系统和存储介质
CN107995167A (zh) 一种设备识别方法及服务器
CN106648308A (zh) 界面显示方法、信息输入方法和装置
CN108920700B (zh) 一种虚假图片识别方法及装置
CN106357603A (zh) 网页安全检测处理方法及装置
Carver E-fencing detection: mining online classified ad websites for stolen property.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601