CN107369081B - 用数据来源的动态影响因子确定数据有效性的系统及方法 - Google Patents
用数据来源的动态影响因子确定数据有效性的系统及方法 Download PDFInfo
- Publication number
- CN107369081B CN107369081B CN201710592343.5A CN201710592343A CN107369081B CN 107369081 B CN107369081 B CN 107369081B CN 201710592343 A CN201710592343 A CN 201710592343A CN 107369081 B CN107369081 B CN 107369081B
- Authority
- CN
- China
- Prior art keywords
- data
- source
- value
- data item
- influence factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用数据来源的动态影响因子确定数据有效性的系统:包括采集模块、预处理模块、选择模块、处理模块一、输入模块二和输出模块。方法为获取数据项多个来源的数据值;将该数据项每个数据值的来源的影响因子分别相加,得出数据项每个数据值的总影响因子;取数据项每个数据值的总影响因子最大的值为有效值;有效值的每个数据值的来源的历史有效个数+1;数据项的历史有效值个数+1;更新数据项每个来源的影响因子为新影响因子,新影响因子等于数据项该来源的历史有效个数/数据项历史有效值个数;新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。保证企业信用评估数据的真实性以及全面性,提高评估结果的可信度。
Description
技术领域
本发明涉及企业征信技术领域,尤其涉及一种用数据来源的动态影响因子确定数据有效性的系统及方法。
背景技术
随着社会的发展进步,企业信用与企业经济利益的相互关联度越来越密切。企业信用可以由征信机构通过企业信用评估手段得出,即提供信用信息服务的企业,按一定规则合法采集企业、个人的信用信息后,加工整理形成企业、个人的信用报告等征信产品。有偿提供给经济活动中的贷款方、赊销方、招标方、出租方、保险方等有合法需求的信用使用者,为其了解交易对方的信用状况提供便利。征信服务既可为防范信用风险,保障交易安全创造条件,又可使具有良好信用记录的企业和个人得以较低的交易成本获得较多的交易机会,而缺乏良好信用记录的企业或个人则相反,从而促进形成"诚信受益,失信惩戒"的社会环境。
征信业在促进信用经济发展和社会信用体系建设中发挥着重要的基础性作用。目前大多数的征信机构,用来评估企业信用的数据没有可信性,信用信息的可信性在一定程度可以由企业信用信息的来源决定,企业信用信息的来源有很多,例如,基于交易平台的数据,基于社交数据、基于互联网公开数据等。企业信用信息的真实性以及全面性,对企业信用的评估结果有很大的影响,但是,通过上述途径获取的企业信用信息的真实性及全面性没有保证,从而不能对企业进行全面可信的评价,如何保证企业信用评估数据的真实性以及全面性,从而提高企业信用评估结果的可信度,是本领域亟待解决的问题。
发明内容
为解决现在技术存在的问题,本发明提供一种用数据来源的动态影响因子确定数据有效性的方法。
为实现上述目的,本发明采用的技术方案是:一种用数据来源的动态影响因子确定数据有效性的方法,包括:
Step1:获取数据项多个来源的数据值;
Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;
Step3:取该数据项每个数据值的总影响因子最大的值为有效值;
Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;
Step5:更新该数据项每个来源的影响因子为新影响因子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;
Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。
一种用数据来源的动态影响因子确定数据有效性的系统,包括:
数据采集模块:获取数据项多个来源的数据值;
数据预处理模块:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;
数据选择模块:取该数据项每个数据值的总影响因子最大的值为有效值;
数据处理模块一:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;
数据输入模块二:嵌套在数据处理模块一内,更新该数据项每个来源的影响因子为新影响影子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;
数据输出模块:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性后输出结论。
采用本发明的技术方案后,1、改变了现有技术采用的静态确定单一来源法,即对每一个企业信用信息项,通过影响因子的动态变化来指定一个可信来源,该项的所有数据均只以该来源的数据为准,其余来源的该数据项数据不在丢弃,而当成基数作为判定总影响因子最大的值为有效值的条件。2、现有技术中对每一个企业信用信息项,单纯地指定一个来源优先级列表,依次按照优先级顺序选择来源,如果高优先级来源为空,则选择次优先级来源的数据,其余来源数据丢弃。本方案改变了上述模式,将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;取该数据项每个数据值的总影响因子最大的值为有效值;该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;所有的数据作为一个整体来分析和判断最终数据项的影响因子,来决定该数据的有效性。影响因子自动适应每个数据项各来源质量的动态变化,保障最终数据的有效性,无需人工干预。
附图说明
图1是利用数据来源的动态影响因子确定数据有效性的方法的流程框图。
具体实施方式
下面结合附图对本发明优选的技术方案做进一步的阐述:
如图1所示,一种用数据来源的动态影响因子确定数据有效性的方法,包括:
Step1:获取数据项多个来源的数据值;其中数据项的获取包括:网络爬虫实时采集、政府各数据单位的专线实时对接、第三方数据交易平台定期批量提供、人工收集整理录入。数据项包括:企业的工商注册信息;企业的法人、高管信息;企业的行政审批、处罚信息;企业的税务信息;企业的金融借贷信息;企业的知识产权信息;企业的供应商、客户信息。数据项主要来源为:政府各主管部门:工商、税务、海关等;银行机构:中国人民银行、中国工商银行、中国农业银行、中国建设银行、中国银行;类金融机构:担保、小贷;第三方数据交易平台:如贵阳大数据交易中心;人工实地调查采集。
Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以确定以哪个版本为准。一个数据项多个数据值,有些数据值来自于一个来源,有些数据值来自于两个或多个来源;每个数据值各自来源的影响因子相加得出该数据值的总影响因子。
Step3:取该数据项每个数据值的总影响因子最大的值为有效值;
Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;具体为设定各个来源的该数据项的影响因子的初始值,经过Step3的不断自动优化调整,总影响因子最大的值即确定为最终有效值。
Step5:更新该数据项每个来源的影响因子为新影响影子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;
Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。
一种用数据来源的动态影响因子确定数据有效性的系统,包括:
数据采集模块:获取数据项多个来源的数据值;数据预处理模块:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;数据选择模块:取该数据项每个数据值的总影响因子最大的值为有效值;数据处理模块一:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;数据输入模块二:嵌套在数据处理模块一内,更新该数据项每个来源的影响因子为新影响影子,新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;数据输出模块:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性后输出结论。
其中,影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以确定以哪个版本为准。一个数据项多个数据值,有些数据值来自于一个来源,有些数据值来自于两个或多个来源;每个数据值各自来源的影响因子相加得出该数据值的总影响因子。
以上实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所做的等效变化或修饰,都应涵盖在本发明的保护范围内。
Claims (10)
1.一种用数据来源的动态影响因子确定数据有效性的方法,其特征在于:包括:
Step1:获取数据项多个来源的数据值;
Step2:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;
Step3:取该数据项每个数据值的总影响因子最大的值为有效值;
Step4:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;
Step5:更新该数据项每个来源的影响因子为新影响因子;新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;
Step6:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性。
2.根据权利要求1所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:数据项的获取包括:网络爬虫实时采集、政府各数据单位的专线实时对接、第三方数据交易平台定期批量提供、人工收集整理录入。
3.根据权利要求1所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:数据项包括:企业的工商注册信息;企业的法人、高管信息;企业的行政审批、处罚信息;企业的税务信息;企业的金融借贷信息;企业的知识产权信息;企业的供应商、客户信息。
4.根据权利要求3所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:数据项主要来源为:政府各主管部门:工商、税务、海关;银行机构:中国人民银行、中国工商银行、中国农业银行、中国建设银行、中国银行;类金融机构:担保、小贷;第三方数据交易平台:贵阳大数据交易中心;人工实地调查采集。
5.根据权利要求1所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以确定以哪个版本为准。
6.根据权利要求5所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:一个数据项多个数据值,有些数据值来自于一个来源,有些数据值来自于两个或多个来源;每个数据值各自来源的影响因子相加得出该数据值的总影响因子。
7.根据权利要求6所述的用数据来源的动态影响因子确定数据有效性的方法,其特征在于:设定各个来源的该数据项的影响因子的初始值,经过STEP4,STEP5自动调整优化,自动适应各数据来源的数据质量的动态变化。
8.一种用数据来源的动态影响因子确定数据有效性的系统,其特征在于:包括:
数据采集模块:获取数据项多个来源的数据值;
数据预处理模块:将该数据项每个数据值的来源的影响因子分别相加,得出该数据项每个数据值的总影响因子;
数据选择模块:取该数据项每个数据值的总影响因子最大的值为有效值;
数据处理模块一:该有效值的每个数据值的来源的历史有效个数+1;该数据项的历史有效值个数+1;
数据输入模块二:嵌套在数据处理模块一内,更新该数据项每个来源的影响因子为新影响因子;新影响因子等于该数据项该来源的历史有效个数/该数据项历史有效值个数;
数据输出模块:根据新影响因子确定该数据项各个数据来源新的数据值到来时的有效性后输出结论。
9.根据权利要求8所述的用数据来源的动态影响因子确定数据有效性的系统,其特征在于:影响因子:是确定该数据项哪个版本是有效的依据;数据来源有很多,同一个数据项有多个来自于不同来源的版本,影响因子最终以确定以哪个版本为准。
10.根据权利要求8所述的用数据来源的动态影响因子确定数据有效性的系统,其特征在于:一个数据项多个数据值,有些数据值来自于一个来源,有些数据值来自于两个或多个来源;每个数据值各自来源的影响因子相加得出该数据值的总影响因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710592343.5A CN107369081B (zh) | 2017-07-19 | 2017-07-19 | 用数据来源的动态影响因子确定数据有效性的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710592343.5A CN107369081B (zh) | 2017-07-19 | 2017-07-19 | 用数据来源的动态影响因子确定数据有效性的系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107369081A CN107369081A (zh) | 2017-11-21 |
CN107369081B true CN107369081B (zh) | 2021-07-27 |
Family
ID=60308334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710592343.5A Active CN107369081B (zh) | 2017-07-19 | 2017-07-19 | 用数据来源的动态影响因子确定数据有效性的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107369081B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861734B (zh) * | 2020-07-31 | 2024-05-03 | 重庆富民银行股份有限公司 | 三方数据源的测试评估系统及方法 |
CN117611395A (zh) * | 2023-09-15 | 2024-02-27 | 南京邮电大学 | 一种基于大数据的智慧旅游决策方法及系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080221971A1 (en) * | 2005-10-24 | 2008-09-11 | Megdal Myles G | Using commercial share of wallet to rate business prospects |
CN101770505B (zh) * | 2008-12-31 | 2013-03-13 | 财团法人工业技术研究院 | 信息撷取方法与撷取器重建方法及其系统 |
CN103413242A (zh) * | 2013-07-24 | 2013-11-27 | 通联支付网络服务股份有限公司 | 一种非面对面交易中小企业信誉及融资信用标准系统 |
CN104572956B (zh) * | 2014-12-29 | 2016-10-12 | 深圳市奇虎智能科技有限公司 | 确定poi信息有效性的系统及方法 |
CN105005738A (zh) * | 2015-06-17 | 2015-10-28 | 广东电网有限责任公司信息中心 | 一种多属性决策的信息安全效用提升方法 |
CN106611375A (zh) * | 2015-10-22 | 2017-05-03 | 北京大学 | 一种基于文本分析的信用风险评估方法及装置 |
CN105550809A (zh) * | 2015-12-08 | 2016-05-04 | 安徽融信金模信息技术有限公司 | 一种用于企业信用评估的征信系统 |
CN105654374A (zh) * | 2015-12-24 | 2016-06-08 | 安徽融信金模信息技术有限公司 | 一种中小企业信用评估系统 |
CN105719073A (zh) * | 2016-01-18 | 2016-06-29 | 苏州汇誉通数据科技有限公司 | 一种企业信用评价系统及方法 |
US9438619B1 (en) * | 2016-02-29 | 2016-09-06 | Leo M. Chan | Crowdsourcing of trustworthiness indicators |
CN106649453A (zh) * | 2016-09-22 | 2017-05-10 | 上海市数字证书认证中心有限公司 | 一种企业信用查询与展示的方法及系统 |
CN106790025B (zh) * | 2016-12-15 | 2020-03-10 | 微梦创科网络科技(中国)有限公司 | 一种对链接进行恶意性检测的方法及装置 |
CN106779457A (zh) * | 2016-12-29 | 2017-05-31 | 深圳微众税银信息服务有限公司 | 一种企业信用评估方法及系统 |
-
2017
- 2017-07-19 CN CN201710592343.5A patent/CN107369081B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107369081A (zh) | 2017-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pacelli | Corporate culture and analyst catering | |
Dedman et al. | The demand for audit in private firms: recent large-sample evidence from the UK | |
Al-Sartawi | Shariah disclosure and the performance of Islamic financial institutions | |
Amin et al. | Auditors’ perceptions of the impact of continuous auditing on the quality of Internet reported financial information in Egypt | |
Downing et al. | Audit exemptions and compliance with tax and accounting regulations | |
Fahlevi et al. | Blockchain technology in corporate governance and future potential solution for agency problems in Indonesia | |
Mshelia et al. | Political risk assessment by multinational corporations in African markets: A Nigerian perspective | |
Vo | Patents and Early‐Stage Financing: Matching versus Signaling | |
Ahsan et al. | How does violence affect exporters? Evidence from political strikes in Bangladesh | |
Al-Waeli et al. | The Impact of Environmental Costs on the Financial Performance of Industrial Companies in Iraq | |
HA et al. | Determinants of voluntary audit of small and medium sized enterprises: Evidence from Vietnam | |
CN107369081B (zh) | 用数据来源的动态影响因子确定数据有效性的系统及方法 | |
Salehi et al. | The relationship between audit components and audit market adaptability | |
Botes et al. | How accountants responded to the financial fallout owing to the COVID-19 pandemic | |
Harper et al. | Managerial ability and bond rating changes | |
Greer et al. | Decreasing improper payments in a complex federal program | |
Quaranta et al. | Impairment of intangible assets and disclosure by Italian banks | |
Eutsler | Risky business: Assessing the generalizability of the PCAOB's risk-based inspection reports for annually inspected audit firms | |
Yusuf et al. | State transportation planning: Linking quantifiable performance measures and infrastructure condition outcomes | |
Adamikova et al. | Possibility to reveal creative accounting when determining the value of the forwarding company’s assets | |
Cowx | Investment and tax incentive uncertainty: Evidence from the R&D tax credit | |
Baugh et al. | The effect of SEC reviewers on comment letters and financial reporting quality | |
Nichita | Enhancing quality of information through risk reporting in financial statements | |
Koehler | Estimating the benefits of R&D subsidies for Germany | |
Lessambo et al. | Audit Evidence and Documentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |