CN116823508B - 基于大数据分析的尽职调查与资信评估系统 - Google Patents
基于大数据分析的尽职调查与资信评估系统 Download PDFInfo
- Publication number
- CN116823508B CN116823508B CN202310781734.7A CN202310781734A CN116823508B CN 116823508 B CN116823508 B CN 116823508B CN 202310781734 A CN202310781734 A CN 202310781734A CN 116823508 B CN116823508 B CN 116823508B
- Authority
- CN
- China
- Prior art keywords
- data
- module
- determining
- analysis
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011835 investigation Methods 0.000 title claims abstract description 76
- 238000007405 data analysis Methods 0.000 title claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 93
- 238000011156 evaluation Methods 0.000 claims abstract description 42
- 238000004806 packaging method and process Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 48
- 230000003068 static effect Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000007726 management method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000000547 structure data Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 12
- 230000009286 beneficial effect Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012797 qualification Methods 0.000 description 3
- 238000010224 classification analysis Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
Abstract
本发明提供一种基于大数据分析的尽职调查与资信评估系统,包括:接收模块,用于接收用户端发送的请求信息;第一确定模块,用于对所述请求信息进行解析,基于解析结果进行大数据查找,确定目标数据;第二确定模块,用于对所述目标数据进行大数据分析,确定尽职调查数据及资信评估数据;第三确定模块,用于对所述尽职调查数据进行数据解析,确定尽职调查结果;第四确定模块,用于对资信评估数据进行数据解析,确定资信评估结果;打包模块,用于将尽职调查结果及资信评估结果进行数据打包,并返回至用户端;在生成尽职调查分析报告的同时还能生成资信评估报告信息,极大的缩短了企业获取两份报告的时间周期,提高准确性。
Description
技术领域
本发明涉及大数据分析技术领域,特别涉及一种基于大数据分析的尽职调查与资信评估系统。
背景技术
尽职调查,指在收购过程中收购者对目标公司的资产和负债情况、经营和财务情况、法律关系以及目标企业所面临的机会与潜在的风险进行的一系列调查;企业资信评估是指从资产、负债和盈利等方面对企业信誉、地位等进行的估价与评定;企业在经营活动中通常会面对签订购销合同、参加招投标、申请资质、参加项目评审等机会,如果拥有一份良好的信用评估报告,就能取得对方的信任,从而赢得商机。
目前,企业在经营过程中对于尽职调查和资信评估报告的需求日益增多,传统方式对于尽职调查与资信评估报告的出具更多依靠专业的背调工作人员或者公司,无法满足当下大数据信息时代企业对效率的追求,申请号 201711253325 .0的发明专利公开了一种项目尽职调查自动分析系统及自动分析方法,系统公开了该项目尽职调查自动分析系统包括项目法律信息存储器、项目财务信息存储器、项目管理信息存储器、项目人事信息存储器、项目规划战略信息存储器、尽职调查法律风险存储器、尽职调查财务风险存储器、尽职调查管理风险存储器、尽职调查人事风险存储器、尽职调查规划战略信息存储器、用语阐释扩展存储器、若干个调查终端。解决现有技术中所存在的没有专设数据分析工具和手段能够给尽职调查进行分析使用,给出一种能够具有针对性和专业性的项目尽职调查自动分析系统。
企业之间在进行初次合作时,为了能了解合作企业的经营情况,往往会进行尽职调查,但是单纯的尽职调查只能更多的了解企业内部经营的情况,企业与其他企业之间合作信用怎么样,往往需要更专业的资信评估才能更深入的了解,这时资信评估报告成为必不可缺的一部分,因此尽职调查与资信评估需要配合才能帮助企业获取更专业的投资建议,单纯的尽职调查报告已经不能满足企业的需求,现有技术中虽然公开了一种尽职调查的文件管理系统及自动分析方法,却只能给出尽职调查报告分析,并不能同时给出尽职调查与资信评估报告,其次是该系统中用于置信度评价的若干个调查终端需要获取至少500-2000项以上的有效调查问卷才能做出尽职调查增补报告,过多依赖用户做出问卷调查,不能快速的出具尽职调查数据分析报告,也无法满足当下对尽职调查与资信评估同时生成的需求。
鉴于此,亟需一种基于大数据分析的尽职调查与资信评估系统。
发明内容
本发明旨在至少一定程度上解决上述技术中的技术问题之一。为此,本发明的目的在于提出一种基于大数据分析的尽职调查与资信评估系统,在生成尽职调查分析报告的同时还能生成资信评估报告信息,极大的缩短了企业获取两份报告的时间周期,弥补了资信评估这块需求的缺失;并将报告结果及时的传送给用户,极大的提高了数据传送的效率,让用户获得更好的系统体验。
为达到上述目的,本发明实施例提出了一种基于大数据分析的尽职调查与资信评估系统,包括:
接收模块,用于接收用户端发送的请求信息;
第一确定模块,用于对所述请求信息进行解析,基于解析结果进行大数据查找,确定目标数据;
第二确定模块,用于对所述目标数据进行大数据分析,确定尽职调查数据及资信评估数据;
第三确定模块,用于对所述尽职调查数据进行数据解析,确定尽职调查结果;
第四确定模块,用于对资信评估数据进行数据解析,确定资信评估结果;
打包模块,用于将尽职调查结果及资信评估结果进行数据打包,并返回至用户端。
优选的,第一确定模块,包括:
转换模块,用于对所述请求信息进行转换处理,得到转换文本;
提取模块,用于对转换文本进行关键词提取,得到若干个关键词;
判断模块,用于在若干个关键词中任意选取一个关键词,作为目标关键词,确定目标关键词与若干个关键词中除目标关键词外的其他关键词的关联度,并判断是否大于预设关联度;
筛选模块,用于筛选出关联度大于预设关联度的关键词,作为关联关键词;
设置模块,用于设置组合数量;
建立模块,用于:
根据所述目标关键词、关联关键词及组合数量,确定若干种组合序列,根据每种组合序列建立一条请求信息索引;
基于以上方法,确定若干个关键词中每个关键词对应的组合序列,并分别建立对应的请求信息索引;
查找模块,用于基于所有的请求信息索引进行大数据查找,确定目标数据。
优选的,第二确定模块,包括:
分割模块,用于对目标数据进行数据分割,得到若干个子数据;
特征提取模块,用于对若干个子数据分别进行特征提取,得到特征向量并进行数值化处理,得到特征值;
计算模块,用于:
计算特征值与第一预设特征值的第一差值;
计算特征值与第二预设特征值的第二差值;
在确定第一差值小于第一预设差值且第二差值大于第二预设差值时,将特征值对应的子数据作为尽职调查数据;
在确定第一差值大于第一预设差值且第二差值小于第二预设差值时,将特征值对应的子数据作为资信评估数据。
优选的,尽职调查数据或资信评估数据的数据形式包括文字文档记录、视频音频内容记录、图片识别记录中的至少一种。
优选的,尽职调查数据包括财务信息数据及法律信息数据;
所述资信评估数据包括企业注册登记数据、股权结构数据、人力资源数据、经营业绩数据、管理水平数据、行业声誉数据及历史信用数据。
优选的,第三确定模块,包括:
第一解析模块,用于根据财务信息数据,确定第一解析结果;其中,第一解析结果包括资产负债率、财务状况变动表、财务利润及利润分配表;
第二解析模块,用于根据法律信息数据,确定第二解析结果;其中,第二解析结果包括外部风险、内部风险、税务风险、被诉案件、质押案件及被执行人;
第一生成模块,用于根据第一解析结果及第二解析结果生成尽职调查结果。
优选的,第一解析模块确定资产负债率的方法,包括:
根据财务信息数据确定负债总额及资产总额;
根据负债总额及资产总额计算出资产负债率;
资产负债率=负债总额/资产总额×100%。
优选的,第四确定模块,包括:
第三解析模块,用于对企业注册登记数据、股权结构数据及人力资源数据进行解析,确定第三解析结果;
第四解析模块,用于对经营业绩数据及管理水平数据进行解析,确定第四解析结果;
第五解析模块,用于对行业声誉数据、历史信用数据进行解析,确定第五解析结果;
第二生成模块,用于根据第三解析结果、第四解析结果及第五解析结果生成资信评估结果。
优选的,打包模块,包括:
第一划分单元,用于对尽职调查结果进行数据划分,得到第一静态数据包和第一动态数据包;
第二划分单元,用于对资信评估结果进行数据划分,得到第二静态数据包和第二动态数据包;
压缩单元,用于将具有相同的时间戳的第一静态数据包与第二静态数据包进行打包处理,得到固定数据包并进行压缩处理,得到压缩包;
动态数据包单元,用于确定具有相同的序列号的第一动态数据包与第二动态数据包,并构建可扩展长度的动态数据包;动态数据包包括固定部和动态部,固定部位于动态数据包的头部,动态部的数据长度可变化;
第一数据量单元,用于获取压缩包的第一数据量;
第二数据量单元,用于获取动态数据包的第二数据量及动态数据刷新率;
第三数据量单元,用于根据第二数据量及动态数据刷新率,计算出第三数据量;
传输通道单元,用于获取传输通道的总数;
通道分配单元,用于计算第一数据量与第三数据量的比值,根据比值及传输通道的总数,确定传输压缩包的传输通道的数量及传输动态数据包的传输通道的数量,将压缩包及动态数据包基于分配的传输通道返回至用户端。
本发明的有益效果是在生成尽职调查分析报告的同时还能生成资信评估报告信息,极大的缩短了企业获取两份报告的时间周期,弥补了资信评估这块需求的缺失;同时本系统可以利用大数据网络强大的信息查询获取功能,快速全面获取尽职调查与资信评估相关的数据,可以避免人为因素导致的数据偏差,极大的提高了数据收集的效率,并基于大数据强大的分析能力,可以精准的生成尽职调查与资信评估报告,避免人为因素根据经验判断过多的干预尽职调查与资信评估结果;最后本系统作出的分析报告能基于大数据技术及时的传送给用户,极大的提高了数据传送的效率,让用户获得更好的系统体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据本发明一个实施例的基于大数据分析的尽职调查与资信评估系统的框图;
图2是根据本发明一个实施例的第一确定模块的框图;
图3是根据本发明一个实施例的第三确定模块的框图;
图4是根据本发明一个实施例的第四确定模块的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明提供了一种基于大数据分析的尽职调查与资信评估系统,参考图1,包括:
接收模块,用于接收用户端发送的请求信息;
第一确定模块,用于对所述请求信息进行解析,基于解析结果进行大数据查找,确定目标数据;
第二确定模块,用于对所述目标数据进行大数据分析,确定尽职调查数据及资信评估数据;
第三确定模块,用于对所述尽职调查数据进行数据解析,确定尽职调查结果;
第四确定模块,用于对资信评估数据进行数据解析,确定资信评估结果;
打包模块,用于将尽职调查结果及资信评估结果进行数据打包,并返回至用户端。
该实施例中,接收模块即为接收用户端发送的要实现尽职调查与资信评估的企业信息。
该实施例中,第一确定模块即为对接收模块收到的请求信息作解析。
该实施例中,解析结果即为第一确定模块对请求信息做解析得到的结果。
该实施例中,大数据查找即为通过解析结果进行大数据全面查找企业信息,包括企业在互联网大数据中的所有信息。
该实施例中,目标数据即为大数据查找、筛选以后得到的企业所有信息。
该实施例中,大数据分析即为对获取到的所有企业信息按照信息的类别进行数据整理。
该实施例中,确定尽职调查数据即为在目标数据中筛选出用于做尽职调查的数据。
该实施例中,确定资信评估数据即为在目标数据中筛选出用于做资信评估的数据。
该实施例中,第三确定模块进行数据解析即为对尽职调查数据中的信息进行分类分析,包括对财务信息数据及法律信息数据。
该实施例中,尽职调查结果即为系统分析以后作出的关于尽职调查的分析报告。
该实施例中,第四确定模块进行数据解析即为对资信评估数据中的信息进行分类分析。
该实施例中,资信评估结果即为系统分析以后作出的关于资信评估的分析报告。
该实施例中,数据打包即为对生成的结果进行整理发送。
以上技术的有益效果为:在生成尽职调查分析报告的同时还能生成资信评估报告信息,极大的缩短了企业获取两份报告的时间周期,弥补了资信评估这块需求的缺失;同时本系统可以利用大数据网络强大的信息查询获取功能,快速全面获取尽职调查与资信评估相关的数据,可以避免人为因素导致的数据偏差,极大的提高了数据收集的效率,并基于大数据强大的分析能力,可以精准的生成尽职调查与资信评估报告,避免人为因素根据经验判断过多的干预尽职调查与资信评估结果;最后本系统作出的分析报告能基于大数据技术及时的传送给用户,极大的提高了数据传送的效率,让用户获得更好的系统体验。。
实施例2:
在实施例1的基础上,参考图2,第一确定模块,包括:
转换模块,用于对所述请求信息进行转换处理,得到转换文本;
提取模块,用于对转换文本进行关键词提取,得到若干个关键词;
判断模块,用于在若干个关键词中任意选取一个关键词,作为目标关键词,确定目标关键词与若干个关键词中除目标关键词外的其他关键词的关联度,并判断是否大于预设关联度;
筛选模块,用于筛选出关联度大于预设关联度的关键词,作为关联关键词;
设置模块,用于设置组合数量;
建立模块,用于:
根据所述目标关键词、关联关键词及组合数量,确定若干种组合序列,根据每种组合序列建立一条请求信息索引;
基于以上方法,确定若干个关键词中每个关键词对应的组合序列,并分别建立对应的请求信息索引;
查找模块,用于基于所有的请求信息索引进行大数据查找,确定目标数据。
该实施例中,转换文本即为请求信息中完整的企业信息名称。
该实施例中,关键词提取即为完整的企业信息名称中分割为若干个词语,即得到若干个关键词。
该实施例中,目标关键词即为在若干个关键词中任意选取一个关键词。
该实施例中,关联度即为语义距离。
该实施例中,预设关联度即为提前设置好的语义距离。
该实施例中,组合的数量取决于关联关键词的数量。
该实施例中,请求信息索引即为关联关键词组合完成的信息。
该实施例中,根据所述目标关键词、关联关键词及组合数量,确定若干种组合序列,根据每种组合序列建立一条请求信息索引;例如:转化文本为ABCDEF,提取模块进行关键词提取得到若干个关键词A、B、C、D、E、F,选取A作为目标关键词,假设与B的关联度为90%,与C的关联度为80%,与D的关联度为70%,与E的关联度为30%,与F的关联度为20%,预设关联度为60%,组合数量为2,基于A的组合序列为AB、AC、AD建立请求信息索引;每次选取目标关键词时要重新判断关联度。
以上技术的有益效果为:基于第一确定模块对于请求数据的进行预处理通过转换模块得到转换文本,这样便于后面提取模块提取关键词,基于提取模块提取到的关键词通过判断模块,判断目标关键词与若干个关键词中除目标关键词外的其他关键词的关联度,这样有利于排除与请求信息关联性比较差的关键词,提高数据结果的关联性;基于筛选模块筛选出关联关键词,设置模块通过关联关键词的数量决定组合数量,通过组合数量提高目标数据的信息来源范围,扩大搜索的范围;基于目标关键词、关联关键词及组合数量构建若干种组合序列建议请求信息索引,方便大数据服务器条理性查找数据,确保每一条数据有据可查,实现目标数据的准确性;建立请求信息索引,若干条信息索引可以极大的丰富对于资料的获取,获取更全面的数据信息,提高尽职调查与资信评估数据结果的准确度。
实施例3:
在实施例1的基础上,第二确定模块,包括:
分割模块,用于对目标数据进行数据分割,得到若干个子数据;
特征提取模块,用于对若干个子数据分别进行特征提取,得到特征向量并进行数值化处理,得到特征值;
计算模块,用于:
计算特征值与第一预设特征值的第一差值;
计算特征值与第二预设特征值的第二差值;
在确定第一差值小于第一预设差值且第二差值大于第二预设差值时,将特征值对应的子数据作为尽职调查数据;
在确定第一差值大于第一预设差值且第二差值小于第二预设差值时,将特征值对应的子数据作为资信评估数据。
该实施例中,数据分割即为把得到的目标数据碎片化处理,例如把成篇幅的数据分割成一段一段的语句。
该实施例中,特征提取即为提取若干个子数据中的核心关键词。
该实施例中,特征向量即为核心关键词。
该实施例中,数值化处理即为明确数值化的意图,然后通过对数据的分解和分析来获取必要的数据特征,再通过这些特征数据的数学计算来完成数值化的转换。
该实施例中,特征值即为特征向量进行数值化处理的结果。
该实施例中,第一预设特征值即为尽职调查预设特征值。
该实施例中,第二预设特征值即为资信评估预设特征值。
以上技术的有益效果为:基于第二确定模块对于目标数据的分割处理,将数据分成若干个子数据,这样便于后面特征提取;通过特征提取模块得到特征向量,然后下一步数值化处理得到特征值,为进一步数据分类提供了参考的依据,系统中预设了第一预设特征值及第二预设特征值,作为数据分类考察的依据,分别计算第一差值及第二差值,实现了对目标数据的分类,可以有效的把数据分为尽职调查数据及资信评估数据,合理的利用大数据云计算并通过科学的计算,提高数据的准确性。
实施例4:
在实施例1的基础上,尽职调查数据及资信评估数据的数据形式包括文字文档记录、视频音频内容记录、图片识别记录中的至少一种。
该实施例中,数据形式即为获取数据时数据的展现形式。
该实施例中,文字文档记录即为文字形式的数据信息归类集合。
该实施例中,视频音频内容记录即为可视化或者声音获取的数据信息归类的集合。
该实施例中,图片识别记录即为图片中的信息识别并保存图片作为辅助的数据信息归类集合。
以上技术的有益效果为:基于获取的尽职调查数据及资信评估数据按照数据的形式进行分类,各种数据形式分类标识,提升数据的细分更有助于系统对数据的处理,合理的利用大数据云计算并行处理数据,提高对数据的处理速度,让用户获得更好的体验。
实施例5:
在实施例1的基础上,尽职调查数据包括财务信息数据及法律信息数据;
所述资信评估数据包括企业注册登记数据、股权结构数据、人力资源数据、经营业绩数据、管理水平数据、行业声誉数据及历史信用数据。
该实施例中,财务信息数据即为企业资产负债表、利润表、现金流量表;
该实施例中,法律信息数据即为企业设立、变更、合并、分立、解散、税务、破产、诉讼、仲裁等;
该实施例中,企业设立、变更、合并、分立、解散、破产等有可能涉及到相关法律规定统一归类到法律信息数据里面。
以上技术的有益效果为:基于提供尽职调查数据和资信评估数据中各个维度具体信息可以更全面的分析企业,从专业的角度,分析各类数据产生的积极或者消极方面的影响,以便于后期出具专业的尽职调查与资信评估报告,提高尽职调查与资信评估结果的准确性,实现报告的权威性,获取用户对系统的认可。
实施例6:
在实施例5的基础上,第三确定模块,参考图3,包括:
第一解析模块,用于根据财务信息数据,确定第一解析结果;其中,第一解析结果包括资产负债率、财务状况变动表、财务利润及利润分配表;
第二解析模块,用于根据法律信息数据,确定第二解析结果;其中,第二解析结果包括外部风险、内部风险、税务风险、被诉案件、质押案件及被执行人;
第一生成模块,用于根据第一解析结果及第二解析结果生成尽职调查结果。
该实施例中,外部风险即为社会文化风险及市场风险等。
该实施例中,内部风险即为战略风险、操作风险及运营风险。
该实施例中,税务风险即为企业的纳税行为不符合税收法律法规的规定及企业经营行为适用税法不准确。
以上技术的有益效果为:基于第一解析模块确定第一解析结果,基于第二解析模块确定第二解析结果,基于第一解析结果及第二解析结果生成尽职调查结果,通过对企业的财务信息数据及法律信息数据分析得出相应的结论,针对性的确定尽职调查结果,提高结果的准确性,得到用户的认可。
实施例7:
在实施例6的基础上,第一解析模块确定资产负债率的方法,包括:
根据财务信息数据确定负债总额及资产总额;
根据负债总额及资产总额计算出资产负债率;
资产负债率=负债总额/资产总额×100%。
以上技术的有益效果为:基于第一解析模块确定资产负债率的方法,具体通过公式更准确的计算出资产负债率,这可以进一步地提高后续第一解析结果的准确度。
实施例8:
在实施例5的基础上,参考图4,第四确定模块,包括:
第三解析模块,用于对企业注册登记数据、股权结构数据及人力资源数据进行解析,确定第三解析结果;
第四解析模块,用于对经营业绩数据及管理水平数据进行解析,确定第四解析结果;
第五解析模块,用于对行业声誉数据、历史信用数据进行解析,确定第五解析结果;
第二生成模块,用于根据第三解析结果、第四解析结果及第五解析结果生成资信评估结果。
该实施例中,第三解析结果基于企业注册登记数据、股权结构数据及人力资源数据得出,这三类数据在维度上更符合企业资质信息以及员工信息,用第三解析模块进行解析,可以更准确的获取企业内部真实的情况。
该实施例中,第四解析结果基于对经营业绩数据及管理水平数据进行解析,经营业绩数据偏向于财务方向,管理水平数据偏向于对费用的把控,两者都倾向于企业财务方面的数据。
该实施例中,第五解析结果基于行业声誉数据、历史信用数据进行解析,行业声誉数据即为企业相互合作过程中相互的评价数据,相当于信用标签;历史信用数据即为企业在与银行合作过程中贷款、质押、及时还款等信息记录的信用资料,两者都是关于信用方面的信息。
以上技术的有益效果为:基于第三解析模块确定第三解析结果,基于第四解析模块确定第四解析结果,基于第五解析模块确定第五解析结果,基于第二生成模块生成资信评估结果,通过不同的模块对企业各类数据分类评估,从企业资质、财务信息、信用信息等专业的方向进行评估,可以整体把控企业资信报告的准确性,更高效的去作出评估,针对性的生成资信评估结果。
实施例9:
在实施例1的基础上,所述的基于大数据分析的尽职调查与资信评估系统,所述打包模块,包括:
第一划分单元,用于对尽职调查结果进行数据划分,得到第一静态数据包和第一动态数据包;
第二划分单元,用于对资信评估结果进行数据划分,得到第二静态数据包和第二动态数据包;
压缩单元,用于将具有相同的时间戳的第一静态数据包与第二静态数据包进行打包处理,得到固定数据包并进行压缩处理,得到压缩包;
动态数据包单元,用于确定具有相同的序列号的第一动态数据包与第二动态数据包,并构建可扩展长度的动态数据包;动态数据包包括固定部和动态部,固定部位于动态数据包的头部,动态部的数据长度可变化;
第一数据量单元,用于获取压缩包的第一数据量;
第二数据量单元,用于获取动态数据包的第二数据量及动态数据刷新率;
第三数据量单元,用于根据第二数据量及动态数据刷新率,计算出第三数据量;
传输通道单元,用于获取传输通道的总数;
通道分配单元,用于计算第一数据量与第三数据量的比值,根据比值及传输通道的总数,确定传输压缩包的传输通道的数量及传输动态数据包的传输通道的数量,将压缩包及动态数据包基于分配的传输通道返回至用户端。
该实施例中,静态数据包即为包含时间戳的数据集合。
该实施例中,动态数据包即为包含序列号的数据集合。
该实施例中,尽职调查结果划分为第一静态数据包和第一动态数据包,将数据细分处理,有助于数据后期按照不同的数据属性进行分类传输,提高传输的效率。
该实施例中,资信评估结果划分为第二静态数据包和第二动态数据包,将数据细分处理,有助于数据后期按照不同的数据属性进行分类传输,提高传输的效率。
该实施例中,时间戳是指数据包的生成时间。
该实施例中,第一静态数据包与第二静态数据包中包含的数据信息在传输过程中不会发生改变,所以可以直接进行压缩处理得到压缩包。
该实施例中,序列号是指动态数据包中包含序列关系的号码,储存在动态信息包的固定部。
该实施例中,在确定具有相同的序列号的第一动态数据包与第二动态数据包前,包括:
为第一动态数据包进行序列号编码,建立第一排队队列;
为第二动态数据包进行序列号编码,建立第二排队队列;
确定第一排队队列与第二排队队列中序列号相同的对应关系。
该实施例中,第一动态数据包与第二动态数据包中包含的数据信息在传输过程中会记录传输的状态信息,可动态调整数据包的大小、内容,动态部的数据长度根据传输信息的改变而变化。
该实施例中,由于传输过程中记录状态的信息不确定性,动态部的数据长度可变化,所以构建可扩展长度的动态信息包,可以实现动态调整。
该实施例中,动态数据刷新率是指特定时间间隔内,对动态数据进行刷新的次数,获取动态数据刷新率可以实时的对传输数据分配整体把控,便于后期数据传输过程动态调整。
该实施例中,传输通道的总数是通过数据传送前对具体的需求和环境分析决定的,及时获取传输通道的总数有助于实时做出传送分配调整。
该实施例中,动态数据包动态部用于记录数据传输过程中根据应用程序需求和网络条件动态调整数据包的大小、内容及传输过程中记录状态的信息。
该实施例中,第三数据量指特定时间间隔内第二数据量与动态数据刷新的次数的乘积。
该实施例中,传输压缩包的传输通道的数量分配公式:
;
其中,为第一数据量,/>为第三数据量,/>为传输通道的总数,/>为传输压缩包的传输通道的数量。
该实施例中,传输动态数据包的传输通道的数量分配公式:
;
其中,为第一数据量,/>为第三数据量,/>为传输通道的总数,/>为传输动态数据包的传输通道的数量。
以上技术的有益效果为:系统在进行打包数据传输之前,把生成的数据报告作出精准的分类,按照数据包携带的信息不同,从时间戳和序列号两个方向将数据分类,分类打包后根据第一数据量、第三数据量以及传输通道的总数,合理的分配数据传输通道,这样做的有益效果是,各类数据产生的时间、携带信息不同,复杂的数据结果分类传送,合理的分配传送通道,实现数据传送效率的最大化,提升传送的效率,及时的将尽职调查与资信评估结果反馈给客户,让用户能更好的感受到大数据带来的便捷。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种基于大数据分析的尽职调查与资信评估系统,其特征在于,包括:
接收模块,用于接收用户端发送的请求信息;
第一确定模块,用于对所述请求信息进行解析,基于解析结果进行大数据查找,确定目标数据;
第二确定模块,用于对所述目标数据进行大数据分析,确定尽职调查数据及资信评估数据;
第三确定模块,用于对所述尽职调查数据进行数据解析,确定尽职调查结果;
第四确定模块,用于对资信评估数据进行数据解析,确定资信评估结果;
打包模块,用于将尽职调查结果及资信评估结果进行数据打包,并返回至用户端;
所述第一确定模块,包括:
转换模块,用于对所述请求信息进行转换处理,得到转换文本;
提取模块,用于对转换文本进行关键词提取,得到若干个关键词;
判断模块,用于在若干个关键词中任意选取一个关键词,作为目标关键词,确定目标关键词与若干个关键词中除目标关键词外的其他关键词的关联度,并判断是否大于预设关联度;
筛选模块,用于筛选出关联度大于预设关联度的关键词,作为关联关键词;
设置模块,用于设置组合数量;
建立模块,用于:
根据所述目标关键词、关联关键词及组合数量,确定若干种组合序列,根据每种组合序列建立一条请求信息索引;
基于所述请求信息索引的建立方法,确定若干个关键词中每个关键词对应的组合序列,并分别建立对应的请求信息索引;
查找模块,用于基于所有的请求信息索引进行大数据查找,确定目标数据;
所述第二确定模块,包括:
分割模块,用于对目标数据进行数据分割,得到若干个子数据;
特征提取模块,用于对若干个子数据分别进行特征提取,得到特征向量并进行数值化处理,得到特征值;
计算模块,用于:
计算特征值与第一预设特征值的第一差值;
计算特征值与第二预设特征值的第二差值;
在确定第一差值小于第一预设差值且第二差值大于第二预设差值时,将特征值对应的子数据作为尽职调查数据;
在确定第一差值大于第一预设差值且第二差值小于第二预设差值时,将特征值对应的子数据作为资信评估数据;
所述打包模块,包括:
第一划分单元,用于对尽职调查结果进行数据划分,得到第一静态数据包和第一动态数据包;
第二划分单元,用于对资信评估结果进行数据划分,得到第二静态数据包和第二动态数据包;
压缩单元,用于将具有相同的时间戳的第一静态数据包与第二静态数据包进行打包处理,得到固定数据包并进行压缩处理,得到压缩包;
动态数据包单元,用于确定具有相同的序列号的第一动态数据包与第二动态数据包,并构建可扩展长度的动态数据包;动态数据包包括固定部和动态部,固定部位于动态数据包的头部,动态部的数据长度可变化;
第一数据量单元,用于获取压缩包的第一数据量;
第二数据量单元,用于获取动态数据包的第二数据量及动态数据刷新率;
第三数据量单元,用于根据第二数据量及动态数据刷新率,计算出第三数据量;
传输通道单元,用于获取传输通道的总数;
通道分配单元,用于计算第一数据量与第三数据量的比值,根据比值及传输通道的总数,确定传输压缩包的传输通道的数量及传输动态数据包的传输通道的数量,将压缩包及动态数据包基于分配的传输通道返回至用户端。
2.如权利要求1所述的基于大数据分析的尽职调查与资信评估系统,其特征在于,所述尽职调查数据及资信评估数据的数据形式包括文字文档记录、视频音频内容记录、图片识别记录中的至少一种。
3.如权利要求1所述的基于大数据分析的尽职调查与资信评估系统,其特征在于,所述尽职调查数据包括财务信息数据及法律信息数据;
所述资信评估数据包括企业注册登记数据、股权结构数据、人力资源数据、经营业绩数据、管理水平数据、行业声誉数据及历史信用数据。
4.如权利要求3所述的基于大数据分析的尽职调查与资信评估系统,其特征在于,第三确定模块,包括:
第一解析模块,用于根据财务信息数据,确定第一解析结果;其中,第一解析结果包括资产负债率、财务状况变动表、财务利润及利润分配表;
第二解析模块,用于根据法律信息数据,确定第二解析结果;其中,第二解析结果包括外部风险、内部风险、税务风险、被诉案件、质押案件及被执行人;
第一生成模块,用于根据第一解析结果及第二解析结果生成尽职调查结果。
5.如权利要求4所述的基于大数据分析的尽职调查与资信评估系统,其特征在于,第一解析模块确定资产负债率的方法,包括:
根据财务信息数据确定负债总额及资产总额;
根据负债总额及资产总额计算出资产负债率;
资产负债率=负债总额/资产总额×100%。
6.如权利要求3所述的基于大数据分析的尽职调查与资信评估系统,其特征在于,第四确定模块,包括:
第三解析模块,用于对企业注册登记数据、股权结构数据及人力资源数据进行解析,确定第三解析结果;
第四解析模块,用于对经营业绩数据及管理水平数据进行解析,确定第四解析结果;
第五解析模块,用于对行业声誉数据、历史信用数据进行解析,确定第五解析结果;
第二生成模块,用于根据第三解析结果、第四解析结果及第五解析结果生成资信评估结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310781734.7A CN116823508B (zh) | 2023-06-28 | 2023-06-28 | 基于大数据分析的尽职调查与资信评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310781734.7A CN116823508B (zh) | 2023-06-28 | 2023-06-28 | 基于大数据分析的尽职调查与资信评估系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116823508A CN116823508A (zh) | 2023-09-29 |
CN116823508B true CN116823508B (zh) | 2024-02-20 |
Family
ID=88128891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310781734.7A Active CN116823508B (zh) | 2023-06-28 | 2023-06-28 | 基于大数据分析的尽职调查与资信评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116823508B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737421A (zh) * | 2020-08-07 | 2020-10-02 | 杭州六棱镜知识产权科技有限公司 | 一种知识产权大数据情报检索系统及存储介质 |
CN111737477A (zh) * | 2020-08-07 | 2020-10-02 | 杭州六棱镜知识产权科技有限公司 | 一种基于知识产权大数据的情报调查方法、系统和存储介质 |
CN112950346A (zh) * | 2021-03-26 | 2021-06-11 | 申静 | 一种企业财务报表自动分析系统及方法 |
CN114757497A (zh) * | 2022-03-24 | 2022-07-15 | 中国建设银行股份有限公司 | 科技企业技术增信方法及其装置、设备、介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150294406A1 (en) * | 2014-04-15 | 2015-10-15 | Mela Capital Group, Inc. | System and method for integrated due diligence and credit risk management analytics and quality control |
-
2023
- 2023-06-28 CN CN202310781734.7A patent/CN116823508B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737421A (zh) * | 2020-08-07 | 2020-10-02 | 杭州六棱镜知识产权科技有限公司 | 一种知识产权大数据情报检索系统及存储介质 |
CN111737477A (zh) * | 2020-08-07 | 2020-10-02 | 杭州六棱镜知识产权科技有限公司 | 一种基于知识产权大数据的情报调查方法、系统和存储介质 |
CN112950346A (zh) * | 2021-03-26 | 2021-06-11 | 申静 | 一种企业财务报表自动分析系统及方法 |
CN114757497A (zh) * | 2022-03-24 | 2022-07-15 | 中国建设银行股份有限公司 | 科技企业技术增信方法及其装置、设备、介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116823508A (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20100228595A1 (en) | System and method for scoring target lists for advertising | |
CN116433052B (zh) | 一种基于智能化的招标信息采集数据分析评价系统 | |
CN111383094A (zh) | 产品服务全链驱动方法、设备及可读存储介质 | |
Huo | Information technology and the performance of the restaurant firms | |
CN112256762A (zh) | 基于产业地图的企业画像方法、系统、设备及介质 | |
Freitag et al. | Lean office and digital transformation: a case study in a services company | |
Li et al. | Revealing customer satisfaction with hotels through multi-site online reviews: A method based on the evidence theory | |
Chmielarz et al. | The selection and comparison of the methods used to evaluate the quality of e-banking websites: The perspective of individual clients | |
Weinzierl et al. | Predictive business process monitoring with context information from documents | |
CN113628024A (zh) | 基于大数据平台系统的财务数据智能稽核系统及方法 | |
Wu et al. | The influence of E-marketing on performance of real estate enterprises: based on super-efficiency DEA and grey entropy methods | |
von Rimscha | It’s not the economy, stupid! External effects on the supply and demand of cinema entertainment | |
Rep et al. | The role of firm characteristics in voluntary disclosure of IC information and its importance for high-tech companies | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN116823508B (zh) | 基于大数据分析的尽职调查与资信评估系统 | |
EP4357941A1 (en) | Information exchange method, apparatus and device, and storage medium | |
CN114398562B (zh) | 一种店铺数据管理方法、装置、设备及存储介质 | |
CN114707091A (zh) | 一种页面展示方法、装置、电子设备及存储介质 | |
Latypova | Reviewer assignment decision support in an academic journal based on multicriteria assessment and text mining | |
CN114707835A (zh) | 一种数据处理方法、装置、电子设备及计算机可读介质 | |
Zhang et al. | Dynamic time warp-based clustering: Application of machine learning algorithms to simulation input modelling | |
CN114493686A (zh) | 一种运营内容生成推送方法及装置 | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
Boujelbene et al. | Managers’ perceptions of intellectual capital: An empirical study in the Tunisian context | |
Met et al. | Branch efficiency and location forecasting: Application of Ziraat bank |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |