CN109064067A - 基于互联网的金融风险运营主体判定方法及装置 - Google Patents
基于互联网的金融风险运营主体判定方法及装置 Download PDFInfo
- Publication number
- CN109064067A CN109064067A CN201811083925.1A CN201811083925A CN109064067A CN 109064067 A CN109064067 A CN 109064067A CN 201811083925 A CN201811083925 A CN 201811083925A CN 109064067 A CN109064067 A CN 109064067A
- Authority
- CN
- China
- Prior art keywords
- subject
- financial risks
- list
- suspicious degree
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种基于互联网的金融风险运营主体判定方法及装置,涉及信息安全技术领域,方法包括:基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;根据多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。本发明能够通过基于互联网网站内容的多维度分析,快速、准确地确定出可疑金融风险运营主体,并基于各运营主体的可疑度确定出目标金融风险运营主体,提高金融风险运营主体的判定效率。
Description
技术领域
本发明涉及信息安全技术领域,尤其是涉及一种基于互联网的金融风险运营主体判定方法及装置。
背景技术
在国内金融风险监管意识薄弱,监管力度、监管方式等都存在很多不足,即使在发现了金融风险目标名称的情况下,各监管单位很难去确定出最有风险的运营主体,如果此问题不予解决,分辨金融风险主体速度远远跟不上金融风险爆发速度,将会导致中国互联网金融风险“雷暴式”崩溃,对监管单位,对人民群众,对国家都将造成巨大危害。
目前,对金融风险的监管通常是采用传统的人为收集线索方式进行,一方面,人为收集线索的效率很低,另一方面,通过对人为既定收集的线索,进行后期相关数据采集及分析,无法做到相关网站挖掘,发现,更无法确定出金融风险运营主体。由于短时间内无法落地查案,所以容易引发大范围金融风险。
发明内容
有鉴于此,本发明的目的在于提供一种基于互联网的金融风险运营主体判定方法及装置,能够通过基于互联网网站内容的多维度分析,快速、准确地确定出可疑金融风险运营主体,并基于各运营主体的可疑度确定出目标金融风险运营主体,提高金融风险运营主体的判定效率。
第一方面,本发明实施例提供了一种基于互联网的金融风险运营主体判定方法,包括:
基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,所述多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;所述多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;
根据所述多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,基于互联网网站内容,进行网站维度分析,得到基于网站页面的金融风险运营主体可疑度列表的步骤,包括:
基于互联网网站内容,获取金融风险目标名称对应的高相关度网站;
对所述高相关度网站进行信息提取和分析,得到所述基于网站页面的金融风险运营主体可疑度列表。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述基于互联网网站内容,获取金融风险目标名称对应的高相关度网站的步骤,包括:
获取金融风险目标名称及靶向词;
基于所述金融风险目标名称及所述靶向词进行搜索,得到搜索结果;
获取所述搜索结果所对应的网址;
过滤所述搜索结果所对应的网址中网页内容与所述金融风险目标名称关联度低于预设阈值的网址;
将所述过滤处理后的网址,作为所述金融风险目标对应的高相关度网站。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述对所述高相关度网站进行信息提取和分析,得到所述基于网站页面的金融风险运营主体可疑度列表的步骤,包括:
从所述高相关度网站中提取网站备案公司信息、域名whois注册信息及第一网页内容;
对所述第一网页内容进行语义分析,确定出第一运营主体列表;
分别计算所述网站备案公司信息、所述域名whois注册信息及所述第一运营主体列表的可疑度;
基于所述网站备案公司信息、所述域名whois注册信息、所述第一运营主体列表的可疑度及第二预设权重,得到所述基于网站页面的金融风险运营主体可疑度列表。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,基于互联网网站内容,进行舆情维度分析,得到基于舆情的金融风险运营主体可疑度列表的步骤,包括:
基于互联网网站内容,获取金融风险目标名称;
以所述金融风险目标名称为关键词,在搜索引擎中进行查询,得到查询结果;
获取所述查询结果所对应的第二网页内容;
对所述第二网页内容进行语义分析,确定出第二运营主体列表;
基于所述第二运营主体列表及第三预设权重,确定所述基于舆情的金融风险运营主体可疑度列表。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,基于互联网网站内容,进行企业维度分析,得到基于企业的金融风险运营主体可疑度列表的步骤,包括:
基于互联网网站内容,获取企业工商信息、商标注册信息及金融风险目标名称;
从所述企业工商信息及所述商标注册信息中,分别查询与所述金融风险目标名称对应的运营主体,得到第三运营主体列表和第四运营主体列表;
基于所述第三运营主体列表、所述第四运营主体列表及第四预设权重,确定所述基于企业的金融风险运营主体可疑度列表。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述根据所述多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体的步骤,包括:
根据所述基于网站页面的金融风险运营主体可疑度列表、所述基于舆情的金融风险运营主体可疑度列表、所述基于企业的金融风险运营主体可疑度列表及第一预设权重,对多个列表中的运营主体进行可疑度排名;
将排名在所述预设范围内的运营主体确定为所述目标金融风险运营主体。
第二方面,本发明实施例还提供一种基于互联网的金融风险运营主体判定装置,包括:
多维度分析模块,基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,所述多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;所述多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;
运营主体确定模块,用于根据所述多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面及第一方面的任一种可能的实施方式所述的方法的步骤。
第四方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行第一方面及第一方面的任一种可能的实施方式所述的方法。
本发明实施例带来了以下有益效果:
本发明实施例提供的基于互联网的金融风险运营主体判定方法中,首先基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;然后根据多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。本发明能够通过基于互联网网站内容的多维度分析,快速、准确地确定出可疑金融风险运营主体,并基于各运营主体的可疑度确定出目标金融风险运营主体,提高金融风险运营主体的判定效率。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种基于互联网的金融风险运营主体判定方法的流程图;
图2为本发明实施例一提供的另一种基于互联网的金融风险运营主体判定方法的流程图;
图3为本发明实施例一提供的一种基于互联网的金融风险运营主体判定方法中高相关度网站获取工作流程图;
图4为本发明实施例一提供的一种基于互联网的金融风险运营主体判定方法中基于网站页面的金融风险运营主体分析工作流程图;
图5为本发明实施例一提供的一种基于互联网的金融风险运营主体判定方法中基于舆情的金融风险运营主体分析工作流程图;
图6为本发明实施例一提供的一种基于互联网的金融风险运营主体判定方法中基于企业的金融风险运营主体分析工作流程图;
图7为本发明实施例二提供的一种基于互联网的金融风险运营主体判定装置的示意图;
图8为本发明实施例三提供的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,对金融风险的监管通常是采用传统的人为收集线索方式进行,不仅效率很低,而且很难确定出金融风险运营主体,容易引发大范围金融风险。基于此,本发明实施例提供一种基于互联网的金融风险运营主体判定方法及装置,能够通过基于互联网网站内容的多维度分析,快速、准确地确定出可疑金融风险运营主体,并基于各运营主体的可疑度确定出目标金融风险运营主体,提高金融风险运营主体的判定效率。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于互联网的金融风险运营主体判定方法进行详细介绍。
实施例一:
本发明实施例提供了一种基于互联网的金融风险运营主体判定方法,参见图1所示,该方法包括以下步骤:
S101:基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表。
其中,多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种。
上述多维度分析,均是基于互联网网站内容进行的,具体的内容获取或分析过程可以采用搜索引擎技术、网络爬虫技术、正则表达式技术、评分卡技术等来实现。
其中,搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。搜索引擎在大量分析用户数据的情况下,会计算用户最新最关注的内容,最相关的内容,互联网搜索最多的内容来满足用户的扩展搜索。
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。实现网络爬虫使用的编程语言多样,也衍生出了大量插件可供使用。
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。格式化文本内容经常以此类方式批量获取关注目标。
评分卡有多种实现方法和优化手段,是机器学习的雏形。用以优化样本群,淘汰低命中率特征,提高高命中率特征权重的技术。
本实施例仅列举三种维度分析过程,如网站维度分析、舆情维度分析及企业维度分析,分别可以得到基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表,每个列表中包括多个高可疑度金融风险运营主体。需要说明的是,本发明实施例包括但不限于这三种情况。后面会对三种维度分析进行展开说明。
S102:根据多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
具体的,包括以下步骤:
(1)根据基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表、基于企业的金融风险运营主体可疑度列表及第一预设权重,对多个列表中的运营主体进行可疑度排名。其中,第一预设权重计算方法按需求而定,本发明实施例中,暂定舆情主体运营主体权重最高,网站金融风险运营主体其次,企业金融风险运营主体最后。
(2)将排名在预设范围内的运营主体确定为目标金融风险运营主体。在实际应用中,可以对筛选范围进行预设,比如:可疑度最高的、可疑度排名前三的、可疑度排名前十的等等,根据不同的预设范围,确定出所需要的不同的目标金融风险运营主体。
本发明实施例能够通过基于互联网网站内容的多维度分析,快速、准确地确定出可疑金融风险运营主体,并基于各运营主体的可疑度确定出目标金融风险运营主体,提高金融风险运营主体的判定效率。
下面分别详细阐述三种维度分析的过程:
第一种:基于互联网网站内容,进行网站维度分析,得到基于网站页面的金融风险运营主体可疑度列表,具体包括以下步骤,参见图2所示:
S201:基于互联网网站内容,获取金融风险目标名称对应的高相关度网站。
具体的,获取高相关度网站的流程示意图如图3所示:
(1)获取金融风险目标名称及靶向词。一方面,通过人为提供,或是通过其余手段获取到金融风险目标名称,组成金融风险目标名称库。另一方面,通过人为设置,或者利用机器学习后提取一些协助找到相关性网站的靶向词,有且不局限于“官网”,“会员系统”,“注册地址”,“关于我们”等等,组成靶向词典。金融风险目标名称库和靶向词典为后续搜索提供依据。
(2)基于金融风险目标名称及靶向词进行搜索,得到搜索结果。具体的,通过随机组合“金融风险目标名称库”,“靶向词典”内容,向搜索引擎提交参数,用以搜索出结果。
(3)获取搜索结果所对应的网址。具体的,通过代码实现结果爬取,并通过正则公式对搜索结果的网站进行获取,获取相关网址,实现方式多样,其功能相当于一个网站提取器。进一步,还可以对获取到的网址进行存储,得到相关网站列表。
(4)过滤搜索结果所对应的网址中网页内容与金融风险目标名称关联度低于预设阈值的网址。具体的,通过页面多层爬取,分析内容与金融风险目标名称关联度,设置阈值排除底关联度的网站。实现方法多样,此处使用python实现网站页面三层深度爬取,并统计金融风险目标名称在页面中出现次数达到10次及以上的网站才认为高相关度。其中,排除国家行政机关,特定机关等网址后缀,例如“gov,edu”等后缀,并排除常见黄页网站、行业门户网站、广告网站等,此类网站列表由人工维护。
(5)将过滤处理后的网址,作为金融风险目标对应的高相关度网站。并将过滤后得到的高相关度的网站,进行网址存储,得到高相关度网站列表。
S202:对高相关度网站进行信息提取和分析,得到基于网站页面的金融风险运营主体可疑度列表。
具体的,确定基于网站页面的金融风险运营主体可疑度列表的流程示意图如图4所示:
(1)从高相关度网站中提取网站备案公司信息、域名whois注册信息及第一网页内容。
具体的,通过网站域名从高相关度网站列表中的高相关度网站,查询ICP备案信息(网络内容服务商备案),此信息在互联网上有一些网站可以免费获取,也可以通过通管局等有关部门合作协商,本发明实施例默认通过其中一种手段获取此信息,从中提取出网站备案公司或备案人等信息。
另外,通过网站域名查询域名whois注册信息,此信息为国际公认协议,有多种方法可以获取,本发明实施例默认通过其中一种手段获取信息,从中提取域名注册公司或注册人信息。
此外,还可以通过编程语言,不限于python、java等,此处以python为例,将网站当前页面、深层页面信息爬取下来,层数视需求而定,本发明实施例暂定三层,将页面内容(即第一网页内容,如图4中的网站页面数据)存储在内存中用作下一步处理使用,此功能相当于网站页面提取器。
(2)对第一网页内容进行语义分析,确定出第一运营主体列表。具体的,通过编程语言,不限于python、java等,此处以python为例,通过中文语义分析算法,剥离出运营主体企业或人,此处以最简单的实现方法为例,判断中文字串中包含“公司”等信息进行判断分割,确定出第一运营主体列表,该功能相当于一个网站页面分析器。
(3)分别计算网站备案公司信息、域名whois注册信息及第一运营主体列表的可疑度。具体的,综合评估网站备案公司、域名whois注册信息、网站页面分析结果中的目标运营主体列表,即第一运营主体列表,分别计算其可疑度,该计算过程可以通过机器学习、模型预测的方式来实现。此功能相当于一个运营主体可疑度判定器。
(4)基于网站备案公司信息、域名whois注册信息、第一运营主体列表的可疑度及第二预设权重,得到基于网站页面的金融风险运营主体可疑度列表。其中,第二预设权重在本实施例中为以下逻辑:网站备案主体优先度最高,网站页面分析结果主体其次,域名whois注册信息主体最后。通过上述可疑度和第二预设权重的双重影响,可以得到可疑度由高到低排列的运营主体可疑度列表。
第二种:基于互联网网站内容,进行舆情维度分析,得到基于舆情的金融风险运营主体可疑度列表,其具体过程如图5所示:
(1)基于互联网网站内容,获取金融风险目标名称。具体的,通过人为提供,或是通过其余手段获取到金融风险目标名称,组成金融风险目标名称库。金融风险目标名称库为后续搜索提供依据。
(2)以金融风险目标名称为关键词,在搜索引擎中进行查询,得到搜索引擎查询结果。具体的,通过对金融风险目标名称库中名称在搜索引擎中一一查询,得到查询结果。其中,搜索引擎不仅仅局限于百度,google,360等搜索引擎厂家。
(3)获取查询结果所对应的第二网页内容。具体的,通过编程语言,不限于python、java等,此处以python为例,将搜索引擎的查询结果网站的页面信息爬取下来,并将页面内容,即第二网页内容存储在内存中用作下一步处理使用。上述功能相当于一个搜索结果提取器。
(4)对第二网页内容进行语义分析,确定出第二运营主体列表。具体的,通过编程语言,不限于python、java等,此处以python为例,通过中文语义分析算法,剥离出运营主体企业或人,此处以最简单的实现方法为例,判断中文字串中包含“公司”等信息进行判断分割,得到第二运营主体列表。上述功能相当于一个网页页面分析器。
(5)基于第二运营主体列表及第三预设权重,确定基于舆情的金融风险运营主体可疑度列表。本实施例中,将运营主体根据权重进行从高到低排序,而第三预设权重算法视需求而定,此处暂定通过同一个运营主体出现的次数,来决定出现的多个运营主体的各自权重。从而得到一个按可疑度进行排名的运营主体可疑度列表。
第三种:基于互联网网站内容,进行企业维度分析,得到基于企业的金融风险运营主体可疑度列表,具体实现过程参见图6所示:
(1)基于互联网网站内容,获取企业工商信息、商标注册信息及金融风险目标名称。一方面,可以在互联网上下载、查询、合作等方式获取到此类信息,并存储于企业工商信息、商标注册信息库中。另一方面,通过人为提供,或是通过其余手段获取到金融风险目标名称,组成金融风险目标名称库。企业工商信息、商标注册信息库和金融风险目标名称库为后续计算提供依据。
(2)从企业工商信息及商标注册信息中,分别查询与金融风险目标名称对应的运营主体,得到第三运营主体列表和第四运营主体列表。具体的,基于各类互联网上成熟的模糊查询算法实现,此处不一一列举,在企业工商信息、商标注册信息库中查询金融风险目标名称,并将其对应公司名称记录下来,得到第三运营主体列表和第四运营主体列表。
(3)基于第三运营主体列表、第四运营主体列表及第四预设权重,确定基于企业的金融风险运营主体可疑度列表。其中,第四预设权重排序算法多样,本实施例中暂定从商标全匹配查询到的运营主体权重高,企业名称模糊匹配到的权重低。基于第三运营主体列表、第四运营主体列表及第四预设权重,确定出基于企业的金融风险运营主体可疑度列表。
本发明实施例通过金融风险目标名称,获取高度相关网站,通过网站维度、企业维度、舆情维度等多个方面,依据可疑度与权重等方法,计算运营主体梯度可疑度,并选取可疑度最高或者相对较高的运营主体为金融风险目标运营主体,能够较为准确、全面地确定出目标金融风险运营主体。
另外,本发明实施例可以对目标的经营网站进行较为精准的挖掘,减少人工搜索成本,解决人力分辨金融风险能力远远跟不上金融风险爆发速度的问题,并对运营主体进行较为精准判断,提高金融监管效率,减少大范围金融风险爆发可能,为金融监管、处置部门提供高效的监管工具。
实施例二:
本发明实施例还提供一种基于互联网的金融风险运营主体判定装置,参见图7所示,该装置包括:多维度分析模块71和运营主体确定模块72。
其中,多维度分析模块71,基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种。运营主体确定模块72,用于根据多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
本发明实施例所提供的基于互联网的金融风险运营主体判定装置中,各个模块与基于互联网的金融风险运营主体判定方法具有相同的技术特征,因此,同样可以实现上述功能。本装置中各个模块的具体工作过程参见上述方法实施例,在此不再赘述。
实施例三:
本发明实施例提供一种电子设备,参见图8所示,该电子设备包括:处理器80,存储器81,总线82和通信接口83,所述处理器80、通信接口83和存储器81通过总线82连接;处理器80用于执行存储器81中存储的可执行模块,例如计算机程序。处理器执行计算机程序时实现如方法实施例所述的方法的步骤,比如:
基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;根据多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
其中,存储器81可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口83(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线82可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器81用于存储程序,所述处理器80在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器80中,或者由处理器80实现。
处理器80可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器80中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器80可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器81,处理器80读取存储器81中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的基于云防护日志的网站可用性检测方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置及电子设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
附图中的流程图和框图显示了根据本发明的多个实施例方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种基于互联网的金融风险运营主体判定方法,其特征在于,包括:
基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,所述多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;所述多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;
根据所述多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
2.根据权利要求1所述的方法,其特征在于,基于互联网网站内容,进行网站维度分析,得到基于网站页面的金融风险运营主体可疑度列表的步骤,包括:
基于互联网网站内容,获取金融风险目标名称对应的高相关度网站;
对所述高相关度网站进行信息提取和分析,得到所述基于网站页面的金融风险运营主体可疑度列表。
3.根据权利要求2所述的方法,其特征在于,所述基于互联网网站内容,获取金融风险目标名称对应的高相关度网站的步骤,包括:
获取金融风险目标名称及靶向词;
基于所述金融风险目标名称及所述靶向词进行搜索,得到搜索结果;
获取所述搜索结果所对应的网址;
过滤所述搜索结果所对应的网址中网页内容与所述金融风险目标名称关联度低于预设阈值的网址;
将所述过滤处理后的网址,作为所述金融风险目标对应的高相关度网站。
4.根据权利要求2所述的方法,其特征在于,所述对所述高相关度网站进行信息提取和分析,得到所述基于网站页面的金融风险运营主体可疑度列表的步骤,包括:
从所述高相关度网站中提取网站备案公司信息、域名whois注册信息及第一网页内容;
对所述第一网页内容进行语义分析,确定出第一运营主体列表;
分别计算所述网站备案公司信息、所述域名whois注册信息及所述第一运营主体列表的可疑度;
基于所述网站备案公司信息、所述域名whois注册信息、所述第一运营主体列表的可疑度及第二预设权重,得到所述基于网站页面的金融风险运营主体可疑度列表。
5.根据权利要求1所述的方法,其特征在于,基于互联网网站内容,进行舆情维度分析,得到基于舆情的金融风险运营主体可疑度列表的步骤,包括:
基于互联网网站内容,获取金融风险目标名称;
以所述金融风险目标名称为关键词,在搜索引擎中进行查询,得到查询结果;
获取所述查询结果所对应的第二网页内容;
对所述第二网页内容进行语义分析,确定出第二运营主体列表;
基于所述第二运营主体列表及第三预设权重,确定所述基于舆情的金融风险运营主体可疑度列表。
6.根据权利要求1所述的方法,其特征在于,基于互联网网站内容,进行企业维度分析,得到基于企业的金融风险运营主体可疑度列表的步骤,包括:
基于互联网网站内容,获取企业工商信息、商标注册信息及金融风险目标名称;
从所述企业工商信息及所述商标注册信息中,分别查询与所述金融风险目标名称对应的运营主体,得到第三运营主体列表和第四运营主体列表;
基于所述第三运营主体列表、所述第四运营主体列表及第四预设权重,确定所述基于企业的金融风险运营主体可疑度列表。
7.根据权利要求1所述的方法,其特征在于,所述根据所述多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体的步骤,包括:
根据所述基于网站页面的金融风险运营主体可疑度列表、所述基于舆情的金融风险运营主体可疑度列表、所述基于企业的金融风险运营主体可疑度列表及第一预设权重,对多个列表中的运营主体进行可疑度排名;
将排名在所述预设范围内的运营主体确定为所述目标金融风险运营主体。
8.一种基于互联网的金融风险运营主体判定装置,其特征在于,包括:
多维度分析模块,基于互联网网站内容,进行多维度分析,得到多种金融风险运营主体可疑度列表;其中,所述多维度分析至少包括网站维度分析、舆情维度分析及企业维度分析中的多种;所述多种金融风险运营主体可疑度列表至少包括基于网站页面的金融风险运营主体可疑度列表、基于舆情的金融风险运营主体可疑度列表及基于企业的金融风险运营主体可疑度列表中的多种;
运营主体确定模块,用于根据所述多种金融风险运营主体可疑度列表及第一预设权重,确定目标金融风险运营主体。
9.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811083925.1A CN109064067B (zh) | 2018-09-17 | 2018-09-17 | 基于互联网的金融风险运营主体判定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811083925.1A CN109064067B (zh) | 2018-09-17 | 2018-09-17 | 基于互联网的金融风险运营主体判定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109064067A true CN109064067A (zh) | 2018-12-21 |
CN109064067B CN109064067B (zh) | 2021-09-28 |
Family
ID=64762879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811083925.1A Active CN109064067B (zh) | 2018-09-17 | 2018-09-17 | 基于互联网的金融风险运营主体判定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109064067B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245986A (zh) * | 2019-06-14 | 2019-09-17 | 哈尔滨工业大学(威海) | 一种获取互联网金融广告发布机构的方法 |
CN111026984A (zh) * | 2019-11-07 | 2020-04-17 | 国家计算机网络与信息安全管理中心 | 互联网金融公司的经营状态检测方法及装置 |
CN111967802A (zh) * | 2020-09-25 | 2020-11-20 | 杭州安恒信息安全技术有限公司 | 一种企业金融风险定量分析和预警方法、装置及设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140351166A1 (en) * | 2013-05-24 | 2014-11-27 | Assured Concepts Group Ltd. | Streamlined portfolio allocation method, apparatus, and computer-readable medium |
US20150294005A1 (en) * | 2012-12-27 | 2015-10-15 | Tencent Technology (Shenzhen) Company Limited | Method and device for acquiring information |
CN107404495A (zh) * | 2017-09-01 | 2017-11-28 | 北京亚鸿世纪科技发展有限公司 | 一种基于ip地址画像的装置 |
CN107547552A (zh) * | 2017-09-07 | 2018-01-05 | 杭州安恒信息技术有限公司 | 一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置 |
CN107945024A (zh) * | 2017-12-12 | 2018-04-20 | 厦门市美亚柏科信息股份有限公司 | 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质 |
CN108009219A (zh) * | 2017-11-21 | 2018-05-08 | 国家计算机网络与信息安全管理中心 | 一种发现互联网金融舆情监管目标的方法 |
CN108229806A (zh) * | 2017-12-27 | 2018-06-29 | 中国银行股份有限公司 | 一种分析企业风险的方法以及系统 |
-
2018
- 2018-09-17 CN CN201811083925.1A patent/CN109064067B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150294005A1 (en) * | 2012-12-27 | 2015-10-15 | Tencent Technology (Shenzhen) Company Limited | Method and device for acquiring information |
US20140351166A1 (en) * | 2013-05-24 | 2014-11-27 | Assured Concepts Group Ltd. | Streamlined portfolio allocation method, apparatus, and computer-readable medium |
CN107404495A (zh) * | 2017-09-01 | 2017-11-28 | 北京亚鸿世纪科技发展有限公司 | 一种基于ip地址画像的装置 |
CN107547552A (zh) * | 2017-09-07 | 2018-01-05 | 杭州安恒信息技术有限公司 | 一种基于网站特征识别和关系拓扑的网站信誉度评估方法及装置 |
CN108009219A (zh) * | 2017-11-21 | 2018-05-08 | 国家计算机网络与信息安全管理中心 | 一种发现互联网金融舆情监管目标的方法 |
CN107945024A (zh) * | 2017-12-12 | 2018-04-20 | 厦门市美亚柏科信息股份有限公司 | 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质 |
CN108229806A (zh) * | 2017-12-27 | 2018-06-29 | 中国银行股份有限公司 | 一种分析企业风险的方法以及系统 |
Non-Patent Citations (1)
Title |
---|
王雪: "基于企业画像的公示数据查询系统设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245986A (zh) * | 2019-06-14 | 2019-09-17 | 哈尔滨工业大学(威海) | 一种获取互联网金融广告发布机构的方法 |
CN111026984A (zh) * | 2019-11-07 | 2020-04-17 | 国家计算机网络与信息安全管理中心 | 互联网金融公司的经营状态检测方法及装置 |
CN111967802A (zh) * | 2020-09-25 | 2020-11-20 | 杭州安恒信息安全技术有限公司 | 一种企业金融风险定量分析和预警方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109064067B (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103914478B (zh) | 网页训练方法及系统、网页预测方法及系统 | |
CN104965905B (zh) | 一种网页分类的方法和装置 | |
CN103544255B (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN106815263B (zh) | 法律条文的搜索方法及装置 | |
CN103823824B (zh) | 一种借助互联网自动构建文本分类语料库的方法及系统 | |
CN103873601B (zh) | 一种寻址类查询词的挖掘方法及系统 | |
CN104636465A (zh) | 网页摘要生成方法、展示方法及相应装置 | |
CN107437038A (zh) | 一种网页篡改的检测方法及装置 | |
CN109064067A (zh) | 基于互联网的金融风险运营主体判定方法及装置 | |
CN109104421B (zh) | 一种网站内容篡改检测方法、装置、设备及可读存储介质 | |
CN102495892A (zh) | 一种网页信息抽取方法 | |
CN102542061B (zh) | 一种产品的智能分类方法 | |
CN105302815B (zh) | 网页的统一资源定位符url的过滤方法和装置 | |
CN104618132A (zh) | 一种应用程序识别规则生成方法和装置 | |
CN110427628A (zh) | 基于神经网络算法的web资产分类检测方法及装置 | |
CN104391978A (zh) | 用于浏览器的网页收藏处理方法及装置 | |
CN106844482B (zh) | 一种基于搜索引擎的检索信息匹配方法及装置 | |
CN110334343A (zh) | 一种合同中个人隐私信息抽取的方法和系统 | |
CN108228546A (zh) | 一种文本特征提取方法、装置、设备及可读存储介质 | |
CN109657114A (zh) | 一种抽取网页半结构化数据的方法 | |
CN117473512B (zh) | 基于网络测绘的漏洞风险评估方法 | |
KR20170043365A (ko) | 빅데이터를 이용한 중요 판례 추출 및 정리 방법 | |
CN107493275A (zh) | 异构网络安全日志信息的自适应提取和分析方法及系统 | |
CN105095400B (zh) | 个人主页的查找方法 | |
CN109471934A (zh) | 基于互联网的金融风险线索发掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |