CN107766481B - 一种发现互联网金融平台的方法和系统 - Google Patents

一种发现互联网金融平台的方法和系统 Download PDF

Info

Publication number
CN107766481B
CN107766481B CN201710951000.3A CN201710951000A CN107766481B CN 107766481 B CN107766481 B CN 107766481B CN 201710951000 A CN201710951000 A CN 201710951000A CN 107766481 B CN107766481 B CN 107766481B
Authority
CN
China
Prior art keywords
internet financial
financial platform
internet
platform
suspected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710951000.3A
Other languages
English (en)
Other versions
CN107766481A (zh
Inventor
李焱余
云晓春
吴震
唐积强
毛洪亮
王琨
刘刚
胡晓光
周洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Surfilter Technology Development Co ltd
National Computer Network and Information Security Management Center
Original Assignee
Shenzhen Surfilter Technology Development Co ltd
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Surfilter Technology Development Co ltd, National Computer Network and Information Security Management Center filed Critical Shenzhen Surfilter Technology Development Co ltd
Priority to CN201710951000.3A priority Critical patent/CN107766481B/zh
Publication of CN107766481A publication Critical patent/CN107766481A/zh
Application granted granted Critical
Publication of CN107766481B publication Critical patent/CN107766481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种发现互联网金融平台的方法和系统。所述方法包括:根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台。本发明通过从多个数据渠道,采集疑似互联网金融平台,包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性,通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,还通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。

Description

一种发现互联网金融平台的方法和系统
技术领域
本发明涉及互联网金融监管技术领域,特别涉及一种发现互联网金融平台的方法和系统。
背景技术
近些年互联网金融平台和运营的网站数量暴增,给国家相关管理机构的有效监督管理带来了极大困难和挑战。发现新增互联网金融网站,成为监管的核心前提工作。
对于传统的发现金融平台方法,一是通过金融企业主动上报,二是通过搜索引擎进行人工搜索这两种手段实现,其具有以下不足:一是,企业主动上报备案是基于企业相对规模较大且运营正规,但对于一大部分非法集资形式、虚拟货币形式、违规P2P网贷形式的平台,都不会主动上报备案,但这些平台恰恰是管理部门重点关注的对象。二是,通过搜索引擎搜索发现金融平台网站的手段,需要投入大量的人力,效率低下,且发现金融平台数量及其有限。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种发现互联网金融平台的方法和系统。所述技术方案如下:
一方面,本发明实施例提供了一种发现互联网金融平台的方法,所述方法包括:
根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;
提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,所述互联网金融平台特征数据库是采集已知互联网金融平台的特征数据建立的。
在本发明实施例上述的发现互联网金融平台的方法中,所述数据渠道包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、网络内容服务商(Internet Content Provider,简称“ICP”)渠道、互联网数据中心(Internet DataCenter,简称“IDC”)渠道。
在本发明实施例上述的发现互联网金融平台的方法中,所述根据金融平台的金融特点,从多个数据渠道,采集疑似金融平台,包括:
根据预设的去重原则,对从多个预设数据渠道,采集的疑似互联网金融平台进行整体去重。
在本发明实施例上述的发现互联网金融平台的方法中,所述提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,包括:
采用关键词匹配和SVM(支持向量机)分类算法,来确定疑似互联网金融平台是否为互联网金融平台。
在本发明实施例上述的发现互联网金融平台的方法中,所述方法还包括:
采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库。
另一方面,本发明实施例提供了一种发现互联网金融平台的系统,包括:
采集模块,用于根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;
处理模块,用于提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,所述互联网金融平台特征数据库是采集已知互联网金融平台的特征数据建立的。
在本发明实施例上述的发现互联网金融平台的系统中,所述数据渠道包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道。
在本发明实施例上述的发现互联网金融平台的系统中,所述采集模块,还用于根据预设的去重原则,对从多个预设数据渠道,采集的疑似互联网金融平台进行整体去重。
在本发明实施例上述的发现互联网金融平台的系统中,所述处理模块,还用于采用关键词匹配和SVM分类算法,来确定疑似互联网金融平台是否为互联网金融平台。
在本发明实施例上述的发现互联网金融平台的系统中,还包括:
更新模块,用于采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库。
本发明实施例提供的技术方案带来的有益效果是:
通过根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台,疑似互联网金融平台的采集过程包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性、全面性。然后提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,这样通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,为监督管理部门提供了高效、准确、全面的金融网站发现和监管手段,提高金融管理部门获取金融平台网站信息的工作效率。此外,采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库,这样通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种发现互联网金融平台的方法流程图;
图2是本发明实施例二提供的一种发现互联网金融平台的系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
本发明实施例提供了一种发现互联网金融平台的方法,参见图1,该方法可以包括:
步骤S11,根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台,该数据渠道可以包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道。
在本实施例中,互联网金融平台主要是指互联网金融网站、互联网金融APP(即应用程序)、互联网金融微盘等从事互联网金融的各类平台。数据渠道可以包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道,其中,金融门户网站是指涉及到金融平台或存有金融服务分类的门户网站,可以从中获取到疑似的互联网金融平台;搜索引擎是指如百度、搜狗、360、必应、谷歌等等信息检索平台,可以根据金融关键字词来检索到疑似的互联网金融平台;已知互联网金融平台的外链网站是指已经确认为互联网金融平台中所展示的外链网站,这些外链网站一般也与互联网金融相关,容易为疑似的互联网金融平台;ICP可以提供备案的网站首页源码,可根据金融平台的特点获取到疑似的互联网金融平台;IDC可以提供备案的统一资源定位符(Uniform ResourceLocator,简称“URL”)网页源码,可根据金融平台的特点获取到疑似的互联网金融平台。通过上述多个数据渠道来采集疑似互联网金融平台,能有效覆盖互联网金融平台的扩散渠道,进而保障了互联网金融平台发现范围的完整性。
具体地,为了有效提高互联网金融平台发现效率,对从多个预设数据渠道,采集的疑似互联网金融平台进行整体去重(即去掉重复的疑似互联网金融平台),其去重原则可以根据数据渠道的重要程度来排列,例如:去重优先级如下:金融门户网站渠道>搜索引擎渠道>已知互联网金融平台的外链网站渠道>ICP渠道>IDC渠道。当然,上述去重原则也可以根据实际需求设定,这里不做限制。
步骤S12,提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,该互联网金融平台特征数据库是采集已知互联网金融平台的特征数据建立的。
具体地,在本实施例中,上述步骤S12可以通过如下方式实现:
采用关键词匹配和SVM分类算法,来确定疑似互联网金融平台是否为互联网金融平台。
在本实施例中,通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,为监督管理部门提供了高效、准确、全面的金融网站发现和监管手段,提高金融管理部门获取金融平台网站信息的工作效率。
步骤S13,采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库。
在本实施例中,通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
下面以发现互联网金融平台网站为例,对上述方法进行说明:
首先,依次从金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道等多渠道获取疑似互联网金融平台,例如:采用搜索引擎搜索关键词包括人工整理关键词(我要投资、我要借钱、我要贷款、年化收益率……),以及确认为疑似的互联网金融网站。在实际应用中,可以采集基于selenium webdriver实现,使用phantomjs浏览器引擎,完全模拟了用户使用浏览器的行为,解决了采集过程中互联网金融门户反爬取对抗的技术难题。
然后,将获取的疑似互联网金融网站按照去重优先级进行整体去重。
然后,采集去重后的疑似互联网金融网站的网页文本内容,采用关键词匹配和SVM分类算法相结合的方式进行分类判定。具体地,关键词来源于人工总结,从以下几个位置提取:网页title、网页keywords、网页description、网页body。
网页title:金融、投资、理财、贷、钱、资产、P2P、众筹、支付等。
网页keywords:投资、理财、借钱、借贷、P2P、资产管、众筹、支付等。
网页description:投资、理财、借钱、借贷、P2P、资产管、众筹、支付等。
网页body:包含以上关键词,另外包括投资总额、投资人数、赚取、年化收益、项目进度等。
判定公式为:R=sgn(K)|SVM,表示关键词命中结果判定为互联网金融网站或SVM分类器判定为互联网金融网站。当R=1时表示为互联网金融网站,R=0时为不是互联网金融网站。
其中,sgn为阶跃函数,
Figure BDA0001432859200000061
K为命中关键词的得分,为title、keywords、description、body中关键词的命中次数C乘以各自权重W的加和,公式表示为:
Figure BDA0001432859200000062
Ci为命中关键词次数
在实际应用中,SVM分类算法训练模型初步采用金融门户采集的网站首页文本内容作为训练集。当金融网站增量大于100个时,重新对SVM进行特征训练。
需要说明的是,互联网金融平台除了互联网金融网站外,还包括其他互联网金融APP、互联网金融微盘等从事互联网金融的各类平台,关于互联网金融APP,可以从应用商店金融理财分类中获取相关的APP信息,例如:APP名称、开发者名称、版本、下载数、应用介绍、软件大小、更新时间,来获取疑似的互联网金融APP,进一步地通过获取APP的内容文字信息,通过关键词匹配和SVM分类算法,来确认其是否为互联网金融APP。互联网金融微盘等与其类似,这里就不做重复说明了。
本发明实施例通过根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台,疑似互联网金融平台的采集过程包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性、全面性。然后提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,这样通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,为监督管理部门提供了高效、准确、全面的金融网站发现和监管手段,提高金融管理部门获取金融平台网站信息的工作效率。此外,采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库,这样通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
实施例二
本发明实施例提供了一种发现互联网金融平台的系统,实施了实施例一所述的方法,参见图2,该系统可以包括:采集模块100、处理模块200、更新模块300。
采集模块100,用于根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台,该数据渠道可以包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道。
在本实施例中,互联网金融平台主要是指互联网金融网站、互联网金融APP、互联网金融微盘等从事互联网金融的各类平台。数据渠道可以包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道,其中,金融门户网站是指涉及到金融平台或存有金融服务分类的门户网站,可以从中获取到疑似的互联网金融平台;搜索引擎是指如百度、搜狗、360、必应、谷歌等等信息检索平台,可以根据金融关键字词来检索到疑似的互联网金融平台;已知互联网金融平台的外链网站是指已经确认为互联网金融平台中所展示的外链网站,这些外链网站一般也与互联网金融相关,容易为疑似的互联网金融平台;ICP可以提供备案的网站首页源码,可根据金融平台的特点获取到疑似的互联网金融平台;IDC可以提供备案的URL网页源码,可根据金融平台的特点获取到疑似的互联网金融平台。通过上述多个数据渠道来采集疑似互联网金融平台,能有效覆盖互联网金融平台的扩散渠道,进而保障了互联网金融平台发现范围的完整性。
具体地,为了有效提高互联网金融平台发现效率,对从多个预设数据渠道,采集的疑似互联网金融平台进行整体去重(即去掉重复的疑似互联网金融平台),其去重原则可以根据数据渠道的重要程度来排列,例如:去重优先级如下:金融门户网站渠道>搜索引擎渠道>已知互联网金融平台的外链网站渠道>ICP渠道>IDC渠道。当然,上述去重原则也可以根据实际需求设定,这里不做限制。
处理模块200,用于提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,该互联网金融平台特征数据库是采集已知互联网金融平台的特征数据建立的。
具体地,处理模块200,还用于采用关键词匹配和SVM分类算法,来确定疑似互联网金融平台是否为互联网金融平台。
在本实施例中,通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,为监督管理部门提供了高效、准确、全面的金融网站发现和监管手段,提高金融管理部门获取金融平台网站信息的工作效率。
更新模块300,还用于采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库。
在本实施例中,通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
本发明实施例通过根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台,疑似互联网金融平台的采集过程包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性、全面性。然后提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台,这样通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,为监督管理部门提供了高效、准确、全面的金融网站发现和监管手段,提高金融管理部门获取金融平台网站信息的工作效率。此外,采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库,这样通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是:上述实施例提供的发现互联网金融平台的系统在实现发现互联网金融平台的方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的发现互联网金融平台的系统与发现互联网金融平台的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种发现互联网金融平台的方法,其特征在于,所述方法包括:
根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;
采集疑似互联网金融平台的网页文本内容,并与预设的互联网金融平台特征数据库进行匹配,采用关键词匹配和SVM分类算法相结合的方式进行分类判定,以确定疑似互联网金融平台是否为互联网金融平台,所述互联网金融平台特征数据库是采集已知互联网金融平台的特征数据建立的,其中,网页文本内容从疑似互联网金融平台的网页title、网页keywords、网页description、网页body位置处提取,SVM分类算法的判定公式为:R=sgn(K)|SVM,表示关键词命中结果判定为互联网金融平台或SVM分类器判定为互联网金融平台,当R=1时表示为互联网金融平台,R=0时为不是互联网金融平台,其中,sgn为阶跃函数,
Figure FDA0002448589530000011
其中,K为命中关键词的得分,为title、keywords、description、body中关键词的命中次数C乘以各自权重W的加和,公式表示为
Figure FDA0002448589530000012
其中,Ci为命中关键词次数,Wt、Wk、Wd、Wb分别为title、keywords、description、body对应的权重。
2.根据权利要求1所述的方法,其特征在于,所述数据渠道包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道。
3.据权利要求2所述的方法,其特征在于,在所述根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台之后,还包括:
根据预设的去重原则,对所述疑似互联网金融平台进行整体去重。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库。
5.一种发现互联网金融平台的系统,其特征在于,包括:
采集模块,用于根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;
处理模块,用于采集疑似互联网金融平台的网页文本内容,并与预设的互联网金融平台特征数据库进行匹配,采用关键词匹配和SVM分类算法相结合的方式进行分类判定,以确定疑似互联网金融平台是否为互联网金融平台,所述互联网金融平台特征数据库是采集已知互联网金融平台的特征数据建立的,其中,网页文本内容从疑似互联网金融平台的网页title、网页keywords、网页description、网页body位置处提取,SVM分类算法的判定公式为:R=sgn(K)|SVM,表示关键词命中结果判定为互联网金融平台或SVM分类器判定为互联网金融平台,当R=1时表示为互联网金融平台,R=0时为不是互联网金融平台,其中,sgn为阶跃函数,
Figure FDA0002448589530000021
其中,K为命中关键词的得分,为title、keywords、description、body中关键词的命中次数C乘以各自权重W的加和,公式表示为
Figure FDA0002448589530000022
其中,Ci为命中关键词次数,Wt、Wk、Wd、Wb分别为title、keywords、description、body对应的权重。
6.根据权利要求5所述的系统,其特征在于,所述数据渠道包括:金融门户网站渠道、搜索引擎渠道、已知互联网金融平台的外链网站渠道、ICP渠道、IDC渠道。
7.根据权利要求6所述的系统,其特征在于,所述采集模块,还用于根据预设的去重原则,对所述疑似互联网金融平台进行整体去重。
8.根据权利要求5-7任一项所述的系统,其特征在于,还包括:
更新模块,用于采集新发现的互联网金融平台的特征数据,并据此更新互联网金融平台特征数据库。
CN201710951000.3A 2017-10-13 2017-10-13 一种发现互联网金融平台的方法和系统 Active CN107766481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710951000.3A CN107766481B (zh) 2017-10-13 2017-10-13 一种发现互联网金融平台的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710951000.3A CN107766481B (zh) 2017-10-13 2017-10-13 一种发现互联网金融平台的方法和系统

Publications (2)

Publication Number Publication Date
CN107766481A CN107766481A (zh) 2018-03-06
CN107766481B true CN107766481B (zh) 2020-08-07

Family

ID=61268099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710951000.3A Active CN107766481B (zh) 2017-10-13 2017-10-13 一种发现互联网金融平台的方法和系统

Country Status (1)

Country Link
CN (1) CN107766481B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210964A (zh) * 2019-06-04 2019-09-06 广州秒钛科技有限公司 一种带有风险分析的通用金融平台
CN111104579A (zh) * 2019-12-31 2020-05-05 北京神州绿盟信息安全科技股份有限公司 一种公网资产的识别方法、装置及存储介质
CN111552857B (zh) * 2020-05-06 2023-09-19 支付宝(杭州)信息技术有限公司 特征事件的识别方法及装置、电子设备、存储介质
CN112256988A (zh) * 2020-10-19 2021-01-22 中国互联网金融协会 监测跨境购房网站的方法及装置、电子设备及存储介质
CN112256987A (zh) * 2020-10-19 2021-01-22 中国互联网金融协会 监测境外股票交易网站的方法及装置、设备及存储介质
CN112256986A (zh) * 2020-10-19 2021-01-22 中国互联网金融协会 监测虚拟货币网站的方法及装置、电子设备及存储介质
CN112417329A (zh) * 2020-10-19 2021-02-26 中国互联网金融协会 监测非法互联网外汇保证金交易平台的方法及装置
CN113240241A (zh) * 2021-04-14 2021-08-10 北京蓝光讯智科技有限责任公司 基于微信数据的互联网金融线索分析方法、系统及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853300B (zh) * 2010-05-26 2013-01-30 中国科学技术大学 一种视频下载服务网站的识别、评估方法及系统
CN102833233B (zh) * 2012-08-06 2015-07-01 北京奇虎科技有限公司 一种识别网站页面的方法和装置
CN105281973A (zh) * 2015-08-07 2016-01-27 南京邮电大学 一种针对特定网站类别的网页指纹识别方法
CN106254510A (zh) * 2016-08-30 2016-12-21 孟玲 互联网金融资源整合共享系统

Also Published As

Publication number Publication date
CN107766481A (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
CN107766481B (zh) 一种发现互联网金融平台的方法和系统
US10452691B2 (en) Method and apparatus for generating search results using inverted index
CN111339427B (zh) 一种图书信息推荐方法、装置、系统及存储介质
WO2017097231A1 (zh) 话题处理方法及装置
CN110321466B (zh) 一种基于语义分析的证券资讯查重方法及系统
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN107657048A (zh) 用户识别方法及装置
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
CN110543595A (zh) 一种站内搜索系统及方法
CN112559682B (zh) 基于GitHub软件仓库数据集的开源项目个性化检索推荐方法
CN103729365A (zh) 一种搜索方法和系统
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN106919576A (zh) 利用二级类目下的关键词库搜索应用程序的方法及装置
CN111062736A (zh) 模型训练、线索排序方法、装置及设备
CN113590811A (zh) 文本摘要生成方法、装置、电子设备及存储介质
CN107590233A (zh) 一种文件管理方法及装置
CN116049243A (zh) 企业知识产权大数据情报分析系统、方法及存储介质
CN108920492B (zh) 一种网页分类方法、系统、终端及存储介质
CN107402886B (zh) 堆栈分析方法及相关装置
JP2020071678A (ja) 情報処理装置、制御方法、プログラム
CN110019659A (zh) 裁判文书的检索方法及装置
CN111242494B (zh) 一种基于博弈论的专利侵权检测方法及系统
Sanjana Ad service detection-a comparative study using machine learning techniques
CN113138977A (zh) 交易转化分析方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant