CN112348104A - 仿冒程序的识别方法、装置、设备及存储介质 - Google Patents

仿冒程序的识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112348104A
CN112348104A CN202011283519.7A CN202011283519A CN112348104A CN 112348104 A CN112348104 A CN 112348104A CN 202011283519 A CN202011283519 A CN 202011283519A CN 112348104 A CN112348104 A CN 112348104A
Authority
CN
China
Prior art keywords
program
interface
name
attribute
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011283519.7A
Other languages
English (en)
Other versions
CN112348104B (zh
Inventor
吴月升
王洋
吕中厚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011283519.7A priority Critical patent/CN112348104B/zh
Publication of CN112348104A publication Critical patent/CN112348104A/zh
Application granted granted Critical
Publication of CN112348104B publication Critical patent/CN112348104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种仿冒程序的识别方法、装置、设备及存储介质,涉及人工智能、信息安全、云计算领域。具体实现方案为:确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,第二程序为合法程序;获取第一程序的界面特征,以及第二程序的界面特征;若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序,通过上述过程,提高了仿冒程序的识别效率。

Description

仿冒程序的识别方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域中的人工智能、信息安全、云计算技术,尤其涉及一种仿冒程序的识别方法、装置、设备及存储介质。
背景技术
随着网络技术的发展,信息发布者可以通过网络程序(例如:公众号、小程序等)向用户发布信息或者提供服务。
目前,一些用户在网络上注册仿冒程序,并通过仿冒程序向用户发布虚假信息或者提供虚假服务。例如,有些仿冒程序冒充招生机构,向用户提供“报名、招生”等虚假信息。这些仿冒程序伤害了用户利益,并损害了合法程序的信誉。
现有技术中主要通过人工方式来识别仿冒程序。然而,上述识别方式的效率较低。
发明内容
本申请提供了一种仿冒程序的识别方法、装置、设备以及存储介质,用以提高仿冒程序的识别效率。
第一方面,本申请提供一种仿冒程序的识别方法,包括:
确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,所述第二程序为合法程序;
获取所述第一程序的界面特征,以及所述第二程序的界面特征;
若所述第一程序的界面特征与所述第二程序的界面特征之间的相似度大于第二阈值,则确定所述第一程序为所述第二程序的仿冒程序。
第二方面,本申请提供一种仿冒程序的识别装置,包括:
第一确定模块,用于确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,所述第二程序为合法程序;
获取模块,用于获取所述第一程序的界面特征,以及所述第二程序的界面特征;
第二确定模块,用于若所述第一程序的界面特征与所述第二程序的界面特征之间的相似度大于第二阈值,则确定所述第一程序为所述第二程序的仿冒程序。
第三方面,本申请提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的方法。
第四方面,本申请提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面中任一项所述的方法。
本申请提供的仿冒程序的识别方法、装置、设备及存储介质,该方法包括:确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,第二程序为合法程序;获取第一程序的界面特征,以及第二程序的界面特征;若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序,通过上述过程,提高了仿冒程序的识别效率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1A为一种合法公众号的界面示意图;
图1B为一种仿冒公众号的界面示意图;
图2为本申请提供的一种仿冒程序的识别方法的流程示意图;
图3为本申请提供的另一种仿冒程序的识别方法的流程示意图;
图4为本申请提供的又一种仿冒程序的识别方法的流程示意图;
图5为本申请提供的一种仿冒程序的识别装置的结构示意图;
图6为本申请提供的另一种仿冒程序的识别装置的结构示意图;
图7为本申请提供的电子设备的结构示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
为了便于理解,首先对本申请中合法程序和仿冒程序进行说明。本申请中的程序是指在终端设备中运行的、用于向用户提供信息或者提供服务的载体。本申请中的程序包括但不限于:公众号、小程序等。合法程序由合法用户申请注册,并向网络中的其他用户提供真实信息或者真实服务。仿冒程序是冒充合法程序向用户提供虚假信息或者虚假服务的程序,仿冒程序通常由不法分子申请注册。
下面以公众号为例,结合图1A和图1B对合法公众号和仿冒公众号的界面进行示例。
图1A为一种合法公众号的界面示意图。如图1A所示,该界面示例的是“第一学校招生办”的公众号界面。第一学校可以通过该公众号向用户发布关于招生、报名等方面的信息。示例性的,第一学校通过该公众号发布了如下信息:“于2020年5月5日开始现场报名,地址:XXXXXX”。
实际应用中,一些不法分子可能会在网络注册仿冒公众号“第一学校招生处”。图1B为一种仿冒公众号的界面示意图。如图1B所示,不法分子通过该公众号发布虚假信息“于2020年5月5日开始网络报名,链接:XXXXXX”。
由于图1B所示的仿冒公众号与图1A所示的合法公众号很相似,导致用户难以分辨,使得用户会对仿冒公众号发布的信息信以为真,进而伤害用户利益。同时,还会损害合法公众号的信誉。
需要说明的是,本申请中的仿冒公众号可以是仿冒个人公众号,还可以是仿冒机构公众号、企业公众号等。
需要说明的是,图1A和图1B是以公众号的界面进行示例,本申请同样适用于小程序等网络程序。
现有技术中主要通过人工方式来识别仿冒程序,然而,该识别方式的效率较低。
为了解决上述技术问题,本申请提供一种仿冒程序的识别方法,应用于计算机技术领域中的人工智能、信息安全、云计算技术,以提高仿冒程序的识别效率。
根据图1A和图1B所示举例,不法分子在注册仿冒程序时,会将仿冒程序的名称、界面等尽量设计得与合法程序类似,从而使用户难以分辨真假,使用户更容易上当受骗。
因此本申请中,在已知第二程序为合法程序,并且确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值的情况下,获取第一程序的界面特征,以及第二程序的界面特征,若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序。通过上述过程,提高了仿冒程序的识别效率。
下面结合几个具体的实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请提供的一种仿冒程序的识别方法的流程示意图。本实施例的方法可以由终端设备执行,还可以由云端服务器执行。如图2所示,本实施例的方法包括:
S201:确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,第二程序为合法程序。
其中,本实施例中程序包括但不限于:公众号、小程序等。程序的名称可以是用于指示发布信息所属领域或类型的相关信息,或者用于指示信息发布主体的相关信息。
示例性的,当程序为公众号时,程序的名称可以为公众号的名称。例如,图1A所示公众号的名称为“第一学校招生办”,图1B所示公众号的名称为“第一学校招生处”。
示例性的,当程序为小程序时,程序的名称可以为小程序的名称。
本实施例中,第一程序的名称与第二程序的名称之间的相似度可以采用多种计算方式。例如,可以获取到第一程序的名称中包含的关键词,并获取到第二程序的名称中包含的关键词,通过对这两个程序的名称所包含的关键词进行语义匹配,确定第一程序的名称与第二程序的名称之间的相似度。
例如,假设第一程序的名称为“第一学校招生处”,第二程序的名称为“第一学校招生办”。第一程序的名称包括关键词“第一学校”和“招生处”,第二程序的名称包括关键词“第一学校”和“招生办”。上述两个程序的名称所包含的关键词语义相同或相似,因此,第一程序的名称与第二程序的名称之间的相似度较高。
又例如,假设第一程序的名称为“第一学校招生处”,第二程序的名称为“第二学校招生办”,上述两个程序的名称所包含的关键词语义不同或不相似,则第一程序的名称与第二程序的名称之间的相似度较低。
又例如,假设第一程序的名称为“第一学校招生处”,第二程序的名称为“第一学校财务办”,上述两个程序的名称所包含的关键词语义不同或不相似,则第一程序的名称与第二程序的名称之间的相似度较低。
本实施例中,在计算第一程序的名称与第二程序的名称之间的相似度时,还可以采用机器学习算法实现。例如,将第一程序的名称和第二程序的名称输入预先训练好的判别模型中,该判别模型用于对两个名称之间的相似度进行度量,并输出两个名称之间的相似度。
不难理解,当一个机构或者企业注册某个领域的程序时,通常不会注册多个名称很相似的程序,因此,当第一程序的名称与第二程序的名称之间的相似度较高(大于第一阈值)时,说明第一程序很可能是第二程序的仿冒程序。因此,该情况下,可以继续执行后续的S202和S203,对两个程序的界面特征进行匹配,从而确定出第一程序是否为第二程序的仿冒程序。
S202:获取第一程序的界面特征,以及第二程序的界面特征。
本实施例中的程序具有展示界面。界面特征是指用于描述程序的展示界面的相关信息。应理解,第一程序的界面特征的获取方式与第二程序的界面特征的获取方式相同,后续仅以第一程序的界面特征为例进行描述。
展示界面中包括一个或者多个标签。其中,本实施例的标签是指展示界面的组成元素,包括但不限于:菜单、按钮、图标、窗口、对话框、滚动条等。本实施例中的标签也可以称为超文本标记语言(Hyper Text Markup Language,HTML)标签。例如,图1A示例的是公众号“第一学校招生办”的展示界面,图1B示例的是公众号“第一学校招生处”的展示界面。上述展示界面中均包括“学校信息”、“联系我们”、“招生公告”等标签。
不同的应用场景中,程序展示界面中所包括的标签的数量以及类型均不相同。图1A和图1B仅以公众号界面为例进行示例。有些程序的展示界面中可能包括更多数量或者更多类型的标签。
一种可能的实施方式中,可以根据第一程序的展示界面,获取该展示界面中所包括的标签的属性;进而根据标签的属性,获取第一程序的界面特征。其中,标签的属性可以是用于描述该标签的任意信息,包括但不限于:位置属性、尺寸属性、颜色属性、形状属性、内容属性等。
可选的,可以采用图像处理方法对第一程序的展示界面进行处理,识别出展示界面中所包括的标签,进而获取到各个标签的属性。
可选的,还可以根据第一程序的类型,确定出第一程序的展示界面对应的开发框架;其中,第一程序的类型包括但不限于:公众号类型、小程序类型等。进一步的,根据该开发框架,将展示界面转换为HTML文件;进而根据HTML文件获取展示界面中所包括的标签以及标签的属性。
一种可能的实施方式中,在获取到第一程序的展示界面所包括的标签的属性之后,可以采用如下可行的方式获取第一程序的界面特征:
根据标签的结构属性,获取第一程序的界面结构特征,其中,结构属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性。根据标签的内容属性,获取第一程序的界面内容特征,其中内容属性可以是指标签上的标题等信息。进而,根据界面结构特征和界面内容特征,确定出第一程序的界面特征。
该方式中,由于确定出的界面特征既包括了界面结构特征,又包括了界面内容特征,因此,确定出的界面特征更加准确,能够提高仿冒程序的识别结果的准确性。
S203:若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序。
能够理解,由于不法分子在注册仿冒程序时,为了使用户更容易相信仿冒程序,会将仿冒程序的名称、界面设计的与合法程序尽可能相似。因此,本实施例中,在确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值的情况下,若进一步确定出第一程序的界面特征与第二程序的界面特征之间的相似性大于第二阈值,则说明第一程序是第二程序的仿冒程序。
本实施例中,可以通过计算第一程序的界面特征与第二程序的界面特征之间距离,从而得到二者的相似度。
本实施例中,在确定第一程序的界面特征与第二程序的界面特征之间的相似度时,还可以采用机器学习算法实现。例如,将第一程序的界面特征和第二程序的界面特征输入预先训练好的判别模型中,该判别模型用于对两个界面特征之间的相似度进行度量,并输出两个界面特征之间的相似度。
可选的,在确定第一程序是第二程序的仿冒程序之后,还可以包括如下步骤:在检测到终端设备显示第一程序的展示界面时,向终端设备发送提醒消息,该提醒消息用于提醒用户第一程序是第二程序的仿冒程序。
例如,可以向用户发送如下提醒消息“您当前浏览的第一程序是第二程序的仿冒程序,第一程序中展示的信息的真实性无法保证,请您注意分辨!”
本实施例中,通过向终端设备发送提醒消息,能够避免用户轻信第一程序提供的虚假信息,避免伤害用户利益。
本实施例提供的仿冒程序的识别方法,包括:确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,第二程序为合法程序;获取第一程序的界面特征,以及第二程序的界面特征;若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序。通过上述过程,提高了仿冒程序的识别效率。同时,由于在确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,并且确定第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值的情况下,将第一程序识别为第二程序的仿冒程序,还保证了识别结果的准确性。
在上述任意实施例的基础上,下面结合两种可能的应用场景对仿冒程序的识别过程进行描述。
图3为本申请提供的另一种仿冒程序的识别方法的流程示意图。本实施例的方法可适用于识别第一程序是否为仿冒程序的场景。如图3所示,本实施例的方法包括:
S301:在接收到第一操作请求消息时,获取第一程序的名称。
其中,第一操作请求消息用于请求识别第一程序是否为仿冒程序。第一操作请求消息可以为下述中的任意一种:
(1)用于请求注册第一程序的消息。以公众号或者小程序为例,该消息可以为公众号上线消息,或者小程序上线消息。
该方式中,在仿冒程序一上线时即可被识别出,从而能够提高仿冒程序识别的及时性,最大程度的避免仿冒程序对用户造成伤害。
(2)用于举报第一程序的消息。例如,当用户发现第一程序中发布的不实信息时,可以举报该第一程序。当接收到举报消息后,可以采用本实施例的方法识别第一程序是否是仿冒程序。
(3)用于投诉第一程序的消息。例如,当第一程序发布的信息或者提供的服务伤害到用户利益时,用户可以投诉该第一程序。当接收到该投诉消息后,可以采用本实施例的方法识别第一程序是否是仿冒程序。
通过结合举报消息或者投诉消息对仿冒程序进行识别,能够进一步提高仿冒程序的识别效率。
S302:从数据库中获取第二程序的名称,并确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,第二程序为合法程序。
其中,数据库用于存储多个合法程序的信息。示例性的,数据库中可以存储合法程序的名称、界面特征等信息。
S303:获取第一程序的界面特征,以及第二程序的界面特征。
其中,获取第一程序的界面特征的方式可以参见图2所示实施例,此处不作赘述。
可选的,数据库中可以存储多个合法程序的界面特征,这样,可以从数据库中获取第二程序的界面特征。
S304:若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序。
具体实施过程中,确定第一程序的名称之后,从数据库中依次获取每个合法程序的名称,计算第一程序的名称与该合法程序的名称之间的相似度。若第一程序的名称与该合法程序的名称之间的相似度大于第一阈值,则继续将第一程序的界面特征与该合法程序的界面特征进行比对。若第一程序的名称与该合法程序的名称之间的相似度小于或者等于第一阈值,则继续从数据库中获取下一个合法程序,重复执行S302至S304。
一些应用场景中,第一程序的名称可能与数据库中的多个第二程序的名称之间的相似度均大于第一阈值,该场景中,可以将第一程序的界面特征与该多个第二程序的界面特征均进行比对,若第一程序的界面特征与多个第二程序的界面特征之间的相似度均大于第二阈值,则将第一程序确定为最大相似度对应的第二程序的仿冒程序。
本实施例中,通过将第一程序与数据库中的合法程序进行比对,在确定第一程序的名称与数据库中第二程序的名称之间的相似度大于第一阈值,并且,确定第一程序的界面特征与该第二程序的界面特征之间的相似度大于第二阈值的情况下,将第一程序确定为第二程序的仿冒程序,能够提高仿冒程序的识别效率,并同时保证识别结果的准确性。
图4为本申请提供的又一种仿冒程序的识别方法的流程示意图。本实施例的方法适用于检测某个合法程序是否存在仿冒程序的场景。如图4所示,本实施例的方法包括:
S401:在接收到第二操作请求消息时,获取第二程序的名称,第二程序为合法程序。
其中,第二操作请求消息用于请求检测是否存在第二程序的仿冒程序。
S402:通过对网络中的程序进行检测,获取第一程序的名称,并确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值。
本实施例中,将在网络中检测到的程序作为第一程序。
S403:获取第一程序的界面特征,以及第二程序的界面特征。
其中,获取第一程序的界面特征、获取第二程序的界面特征的方式可以参见图2所示实施例,此处不作赘述。
S404:若第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值,则确定第一程序为第二程序的仿冒程序。
具体实施过程中,在确定第二程序的名称之后,对网络中已注册的程序进行检测,将检测到的每个程序作为第一程序,并确定该第一程序的名称。计算该第一程序的名称与第二程序的名称之间的相似度。若该第一程序的名称与第二程序的名称之间的相似度大于第一阈值,则继续将该第一程序的界面特征与第二程序的界面特征进行比对。若该第一程序的名称与第二程序的名称之间的相似度小于或者等于第一阈值,则继续从网络中进行检测,将检测到的程序作为第一程序,重复执行S402至S404。
可选的,本实施例的方法还可以定期触发执行,例如,每隔预设时间段触发执行本实施例的方法,以识别网络中是否存在某个合法程序的仿冒程序,从而尽可能早的检测出仿冒程序,避免仿冒程序对用户造成伤害。
本实施例中,将合法的第二程序与从网络中检测到的第一程序进行比对,在确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,并且,确定第一程序的界面特征与第二程序的界面特征之间的相似度大于第二阈值的情况下,将第一程序确定为第二程序的仿冒程序。通过上述过程,能够检测出某个合法程序是否存在仿冒程序,并提高仿冒程序的识别效率,同时保证识别结果的准确性。
图5为本申请提供的一种仿冒程序的识别装置的结构示意图。本实施例的装置可以为软件和/或硬件的形式,本实施例的装置可以集成在终端设备中,还可以集成在云端服务器中。如图5所示,本实施例提供的仿冒程序的识别装置10,包括:第一确定模块11、获取模块12和第二确定模块13。
其中,第一确定模块11,用于确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,所述第二程序为合法程序;
获取模块12,用于获取所述第一程序的界面特征,以及所述第二程序的界面特征;
第二确定模块13,用于若所述第一程序的界面特征与所述第二程序的界面特征之间的相似度大于第二阈值,则确定所述第一程序为所述第二程序的仿冒程序。
图6为本申请提供的另一种仿冒程序的识别装置的结构示意图。在图5所示实施例的基础上,获取模块12可以包括:标签属性获取单元121和界面特征获取单元122。
其中,标签属性获取单元121,用于根据所述第一程序的展示界面,获取所述展示界面中所包括的标签的属性;
界面特征获取单元122,用于根据所述标签的属性,获取所述第一程序的界面特征。
一种可能的实施方式中,所述标签的属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性、内容属性。
一种可能的实施方式中,所述界面特征获取单元122具体用于:
根据所述标签的结构属性,获取所述第一程序的界面结构特征;其中,所述结构属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性;
根据所述标签的内容属性,获取所述第一程序的界面内容特征;
根据所述界面结构特征和所述界面内容特征,确定所述第一程序的界面特征。
一种可能的实施方式中,所述标签属性获取单元121具体用于:
根据所述第一程序的类型,确定所述第一程序的展示界面对应的开发框架;
根据所述开发框架,将所述展示界面转换为超文本标记语言文件;
根据所述超文本标记语言文件,获取所述展示界面中所包括的标签的属性。
一种可能的实施方式中,所述第一确定模块11还用于:在接收到第一操作请求消息时,获取所述第一程序的名称;
其中,所述第一操作请求消息为下述中的任一:
用于请求注册所述第一程序的消息;
用于举报所述第一程序的消息;
用于投诉所述第一程序的消息。
一种可能的实施方式中,所述第一确定模块11具体用于:
从数据库中获取第二程序的名称,并确定所述第一程序的名称与所述第二程序的名称之间的相似度大于所述第一阈值;其中,所述数据库用于存储多个合法程序的信息。
一种可能的实施方式中,所述第一确定模块11还用于:
在接收到第二操作请求消息时,获取所述第二程序的名称;其中,所述第二操作请求消息用于请求检测所述第二程序的仿冒程序。
一种可能的实施方式中,所述第一确定模块11具体用于:
通过对网络中的程序进行检测,获取所述第一程序的名称,并确定所述第一程序的名称与所述第二程序的名称之间的相似度大于所述第一阈值。
一种可能的实施方式中,所述第二确定模块13还用于:
在检测到终端设备显示所述第一程序的展示界面时,向所述终端设备发送提醒消息,所述提醒消息用于提醒用户所述第一程序为所述第二程序的仿冒程序。
本实施例提供的仿冒程序的识别装置,可用于执行上述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不作赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的仿冒程序的识别方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器101、存储器102,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器101为例。
存储器102即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的仿冒程序的识别方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的仿冒程序的识别方法。
存储器102作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的仿冒程序的识别方法对应的程序指令/模块(例如,附图5所示的第一确定模块11、获取模块12和第二确定模块13)。处理器101通过运行存储在存储器102中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的仿冒程序的识别方法。
存储器102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据仿冒程序的识别方法的电子设备的使用所创建的数据等。此外,存储器102可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器102可选包括相对于处理器101远程设置的存储器,这些远程存储器可以通过网络连接至仿冒程序的识别方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
仿冒程序的识别方法的电子设备还可以包括:输入装置103和输出装置104。处理器101、存储器102、输入装置103和输出装置104可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置103可接收输入的数字或字符信息,以及产生与仿冒程序的识别方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置104可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算机程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种仿冒程序的识别方法,包括:
确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,所述第二程序为合法程序;
获取所述第一程序的界面特征,以及所述第二程序的界面特征;
若所述第一程序的界面特征与所述第二程序的界面特征之间的相似度大于第二阈值,则确定所述第一程序为所述第二程序的仿冒程序。
2.根据权利要求1所述的方法,其中,获取所述第一程序的界面特征,包括:
根据所述第一程序的展示界面,获取所述展示界面中所包括的标签以及所述标签的属性;
根据所述标签的属性,获取所述第一程序的界面特征。
3.根据权利要求2所述的方法,其中,所述标签的属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性、内容属性。
4.根据权利要求2或3所述的方法,其中,根据所述标签的属性,获取所述第一程序的界面特征,包括:
根据所述标签的结构属性,获取所述第一程序的界面结构特征;其中,所述结构属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性;
根据所述标签的内容属性,获取所述第一程序的界面内容特征;
根据所述界面结构特征和所述界面内容特征,确定所述第一程序的界面特征。
5.根据权利要求2至4任一项所述的方法,其中,根据所述第一程序的展示界面,获取所述展示界面中所包括的标签以及所述标签的属性,包括:
根据所述第一程序的类型,确定所述第一程序的展示界面对应的开发框架;
根据所述开发框架,将所述展示界面转换为超文本标记语言文件;
根据所述超文本标记语言文件,获取所述展示界面中所包括的标签以及所述标签的属性。
6.根据权利要求1至5任一项所述的方法,确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值之前,还包括:
在接收到第一操作请求消息时,获取所述第一程序的名称;
其中,所述第一操作请求消息为下述中的任一:
用于请求注册所述第一程序的消息;
用于举报所述第一程序的消息;
用于投诉所述第一程序的消息。
7.根据权利要求6所述的方法,其中,确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,包括:
从数据库中获取第二程序的名称,并确定所述第一程序的名称与所述第二程序的名称之间的相似度大于所述第一阈值;其中,所述数据库用于存储多个合法程序的信息。
8.根据权利要求1至5任一项所述的方法,确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值之前,还包括:
在接收到第二操作请求消息时,获取所述第二程序的名称;其中,所述第二操作请求消息用于请求检测所述第二程序的仿冒程序。
9.根据权利要求8所述的方法,其中,确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,包括:
通过对网络中的程序进行检测,获取所述第一程序的名称,并确定所述第一程序的名称与所述第二程序的名称之间的相似度大于所述第一阈值。
10.根据权利要求1至9任一项所述的方法,在确定所述第一程序为所述第二程序的仿冒程序之后,还包括:
在检测到终端设备显示所述第一程序的展示界面时,向所述终端设备发送提醒消息,所述提醒消息用于提醒用户所述第一程序为所述第二程序的仿冒程序。
11.一种仿冒程序的识别装置,包括:
第一确定模块,用于确定第一程序的名称与第二程序的名称之间的相似度大于第一阈值,所述第二程序为合法程序;
获取模块,用于获取所述第一程序的界面特征,以及所述第二程序的界面特征;
第二确定模块,用于若所述第一程序的界面特征与所述第二程序的界面特征之间的相似度大于第二阈值,则确定所述第一程序为所述第二程序的仿冒程序。
12.根据权利要求11所述的装置,其中,所述获取模块包括:
标签属性获取单元,用于根据所述第一程序的展示界面,获取所述展示界面中所包括的标签以及所述标签的属性;
界面特征获取单元,用于根据所述标签的属性,获取所述第一程序的界面特征。
13.根据权利要求12所述的装置,其中,所述标签的属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性、内容属性。
14.根据权利要求12或13所述的装置,其中,所述界面特征获取单元具体用于:
根据所述标签的结构属性,获取所述第一程序的界面结构特征;其中,所述结构属性包括下述中的至少一种:位置属性、尺寸属性、颜色属性、形状属性;
根据所述标签的内容属性,获取所述第一程序的界面内容特征;
根据所述界面结构特征和所述界面内容特征,确定所述第一程序的界面特征。
15.根据权利要求12至14任一项所述的装置,其中,所述标签属性获取单元具体用于:
根据所述第一程序的类型,确定所述第一程序的展示界面对应的开发框架;
根据所述开发框架,将所述展示界面转换为超文本标记语言文件;
根据所述超文本标记语言文件,获取所述展示界面中所包括的标签以及所述标签的属性。
16.根据权利要求11至15任一项所述的装置,所述第一确定模块还用于:在接收到第一操作请求消息时,获取所述第一程序的名称;
其中,所述第一操作请求消息为下述中的任一:
用于请求注册所述第一程序的消息;
用于举报所述第一程序的消息;
用于投诉所述第一程序的消息。
17.根据权利要求16所述的装置,其中,所述第一确定模块具体用于:
从数据库中获取第二程序的名称,并确定所述第一程序的名称与所述第二程序的名称之间的相似度大于所述第一阈值;其中,所述数据库用于存储多个合法程序的信息。
18.根据权利要求11至15任一项所述的装置,所述第一确定模块还用于:
在接收到第二操作请求消息时,获取所述第二程序的名称;其中,所述第二操作请求消息用于请求检测所述第二程序的仿冒程序。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至10中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1至10中任一项所述的方法。
CN202011283519.7A 2020-11-17 2020-11-17 仿冒程序的识别方法、装置、设备及存储介质 Active CN112348104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011283519.7A CN112348104B (zh) 2020-11-17 2020-11-17 仿冒程序的识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011283519.7A CN112348104B (zh) 2020-11-17 2020-11-17 仿冒程序的识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112348104A true CN112348104A (zh) 2021-02-09
CN112348104B CN112348104B (zh) 2023-08-18

Family

ID=74362940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011283519.7A Active CN112348104B (zh) 2020-11-17 2020-11-17 仿冒程序的识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112348104B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113014591A (zh) * 2021-03-08 2021-06-22 中国工商银行股份有限公司 假冒公众号的检测方法和装置、电子设备、及介质
CN114612118A (zh) * 2022-03-17 2022-06-10 杭州云深科技有限公司 仿冒app识别系统
CN115659340A (zh) * 2022-12-09 2023-01-31 支付宝(杭州)信息技术有限公司 一种仿冒小程序识别方法、装置、存储介质及电子设备

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100963A1 (en) * 2008-10-21 2010-04-22 Flexilis, Inc. System and method for attack and malware prevention
US20140082646A1 (en) * 2012-09-19 2014-03-20 Google Inc. Using OCR to Detect Currently Playing Television Programs
US20140082647A1 (en) * 2012-09-19 2014-03-20 Michael Verrilli Identification and Presentation of Internet-Accessible Content Associated with Currently Playing Television Programs
CN103959247A (zh) * 2011-10-03 2014-07-30 思科技术公司 虚拟化计算机程序中的安全
CN105119909A (zh) * 2015-07-22 2015-12-02 国家计算机网络与信息安全管理中心 一种基于页面视觉相似性的仿冒网站检测方法和系统
CN105446741A (zh) * 2015-12-10 2016-03-30 北京邮电大学 一种基于api比对的移动应用程序辨识方法
CN105959330A (zh) * 2016-07-20 2016-09-21 广东世纪网通信设备股份有限公司 虚假链接拦截方法、装置以及系统
CN107038173A (zh) * 2016-02-04 2017-08-11 腾讯科技(深圳)有限公司 应用查询方法和装置、相似应用检测方法和装置
CN107273546A (zh) * 2017-07-14 2017-10-20 北京邮电大学 仿冒应用检测方法以及系统
CN108154031A (zh) * 2018-01-17 2018-06-12 腾讯科技(深圳)有限公司 伪装应用程序的识别方法、装置、存储介质和电子装置
CN108229131A (zh) * 2016-12-14 2018-06-29 中国移动通信集团设计院有限公司 仿冒app识别方法及装置
CN108920909A (zh) * 2018-06-30 2018-11-30 平安科技(深圳)有限公司 仿冒移动应用程序判别方法及系统
CN109446753A (zh) * 2018-09-10 2019-03-08 平安科技(深圳)有限公司 检测盗版应用程序的方法、装置、计算机设备及存储介质
CN110677384A (zh) * 2019-08-26 2020-01-10 奇安信科技集团股份有限公司 钓鱼网站的检测方法及装置、存储介质、电子装置
CN110688626A (zh) * 2018-07-04 2020-01-14 中国移动通信集团有限公司 一种盗版应用的检测方法、装置、电子设备及存储介质
CN110704104A (zh) * 2019-10-14 2020-01-17 北京智游网安科技有限公司 一种应用仿冒检测方法、智能终端及存储介质
CN111083141A (zh) * 2019-12-13 2020-04-28 广州市百果园信息技术有限公司 一种仿冒账号的识别方法、装置、服务器和存储介质
CN111400132A (zh) * 2020-03-09 2020-07-10 北京版信通技术有限公司 上架app的自动监测方法及系统

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100963A1 (en) * 2008-10-21 2010-04-22 Flexilis, Inc. System and method for attack and malware prevention
CN103959247A (zh) * 2011-10-03 2014-07-30 思科技术公司 虚拟化计算机程序中的安全
US20140082646A1 (en) * 2012-09-19 2014-03-20 Google Inc. Using OCR to Detect Currently Playing Television Programs
US20140082647A1 (en) * 2012-09-19 2014-03-20 Michael Verrilli Identification and Presentation of Internet-Accessible Content Associated with Currently Playing Television Programs
CN105119909A (zh) * 2015-07-22 2015-12-02 国家计算机网络与信息安全管理中心 一种基于页面视觉相似性的仿冒网站检测方法和系统
CN105446741A (zh) * 2015-12-10 2016-03-30 北京邮电大学 一种基于api比对的移动应用程序辨识方法
CN107038173A (zh) * 2016-02-04 2017-08-11 腾讯科技(深圳)有限公司 应用查询方法和装置、相似应用检测方法和装置
CN105959330A (zh) * 2016-07-20 2016-09-21 广东世纪网通信设备股份有限公司 虚假链接拦截方法、装置以及系统
CN108229131A (zh) * 2016-12-14 2018-06-29 中国移动通信集团设计院有限公司 仿冒app识别方法及装置
CN107273546A (zh) * 2017-07-14 2017-10-20 北京邮电大学 仿冒应用检测方法以及系统
CN108154031A (zh) * 2018-01-17 2018-06-12 腾讯科技(深圳)有限公司 伪装应用程序的识别方法、装置、存储介质和电子装置
CN108920909A (zh) * 2018-06-30 2018-11-30 平安科技(深圳)有限公司 仿冒移动应用程序判别方法及系统
CN110688626A (zh) * 2018-07-04 2020-01-14 中国移动通信集团有限公司 一种盗版应用的检测方法、装置、电子设备及存储介质
CN109446753A (zh) * 2018-09-10 2019-03-08 平安科技(深圳)有限公司 检测盗版应用程序的方法、装置、计算机设备及存储介质
CN110677384A (zh) * 2019-08-26 2020-01-10 奇安信科技集团股份有限公司 钓鱼网站的检测方法及装置、存储介质、电子装置
CN110704104A (zh) * 2019-10-14 2020-01-17 北京智游网安科技有限公司 一种应用仿冒检测方法、智能终端及存储介质
CN111083141A (zh) * 2019-12-13 2020-04-28 广州市百果园信息技术有限公司 一种仿冒账号的识别方法、装置、服务器和存储介质
CN111400132A (zh) * 2020-03-09 2020-07-10 北京版信通技术有限公司 上架app的自动监测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱红梅;孙未;王鲁;张亮;: "基于单词的源程序相似度度量方法", 科技广场, no. 11, pages 10 - 16 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113014591A (zh) * 2021-03-08 2021-06-22 中国工商银行股份有限公司 假冒公众号的检测方法和装置、电子设备、及介质
CN114612118A (zh) * 2022-03-17 2022-06-10 杭州云深科技有限公司 仿冒app识别系统
CN114612118B (zh) * 2022-03-17 2024-05-28 杭州云深科技有限公司 仿冒app识别系统
CN115659340A (zh) * 2022-12-09 2023-01-31 支付宝(杭州)信息技术有限公司 一种仿冒小程序识别方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN112348104B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN112348104B (zh) 仿冒程序的识别方法、装置、设备及存储介质
CA2896819C (en) Identifying business type using public information
US20220335223A1 (en) Automated generation of chatbot
CN106022349B (zh) 用于设备类型确定的方法和系统
US20130304454A1 (en) Mediation computing device and associated method for generating semantic tags
CN113011856B (zh) 能源企业线上入驻方法、装置、电子设备和介质
CN111708938A (zh) 用于信息处理的方法、装置、电子设备和存储介质
CN115883187A (zh) 网络流量数据中的异常信息识别方法、装置、设备和介质
CN115099239A (zh) 一种资源识别方法、装置、设备以及存储介质
CN109409419B (zh) 用于处理数据的方法和装置
CN107885872B (zh) 用于生成信息的方法和装置
CN107291923B (zh) 信息处理方法和装置
US10440144B2 (en) Near real time notifications distribution platform
CN115759100A (zh) 数据处理方法、装置、设备及介质
JP5068343B2 (ja) 記事管理装置
CN114329164A (zh) 用于处理数据的方法、装置、设备、介质和产品
CN113360672A (zh) 用于生成知识图谱的方法、装置、设备、介质和产品
US11258845B2 (en) Browser management system, browser management method, browser management program, and client program
US10936683B2 (en) Content generation and targeting
CN113469732A (zh) 基于内容理解的审核方法、装置及电子设备
US10832350B2 (en) Sybil identification mechanism for fraudulent document detection through a cognitive based personal encryption key
CN111125514A (zh) 用户行为分析的方法、装置、电子设备和存储介质
US20180011622A1 (en) System and method for dynamic visual representation and analysis of a website traffic
CN114329230B (zh) 信息生成方法和装置
US9430802B2 (en) Method and process for collaboratively built content filtering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant