CN109815480A - 一种数据处理方法和装置、及存储介质 - Google Patents
一种数据处理方法和装置、及存储介质 Download PDFInfo
- Publication number
- CN109815480A CN109815480A CN201811536854.6A CN201811536854A CN109815480A CN 109815480 A CN109815480 A CN 109815480A CN 201811536854 A CN201811536854 A CN 201811536854A CN 109815480 A CN109815480 A CN 109815480A
- Authority
- CN
- China
- Prior art keywords
- data
- credential
- credential data
- standardized
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种数据处理方法和装置、及存储介质。一方面,本发明实施例通过获取目标企业的凭证数据,其中,凭证数据为用于表示目标企业的凭证内容的数据;对凭证数据执行标准化数据处理,得到标准化数据,其中,标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值。解决了相关技术中获取企业评价指标的数据处理方法主观影响因素较大的技术问题,进而达到了能够得到更准确客观的企业评价指标的技术效果。
Description
【技术领域】
本发明涉及数据处理领域,尤其涉及一种数据处理方法和装置、及存储介质。
【背景技术】
由于经济逐渐全球化,一家企业为了应对市场的迅速发展,可能会寻求银行贷款、融资上市、其它合作伙伴等等各种投资手段来扩大自身规模,提高竞争力。随着市场信息的透明化,不同平台提供了多种多样的评价体系,以对企业各方面的运营情况进行评价和分级,例如,通过信用等级、风险评估等指标评价该企业的运营状况。
但是在现有技术中,现有的评价算法中一些参数主要依赖于人为设定,通过对评价算法的参数进行赋值来得到信用等级,如数学规划法、模糊决策法等,得到这些评价指标的方法通常主观因素较大,而参数的细微变化可能会给评价结果带来较大的影响,使得评价结果不够客观准确。
针对获取企业评价指标的数据处理方法主观影响因素较大的技术问题,目前尚未提出有效的解决方案。
【发明内容】
有鉴于此,本发明实施例提供了一种数据处理方法和装置、及存储介质,用以解决相关技术中获取企业评价指标的数据处理方法主观影响因素较大的技术问题。
一方面,本发明实施例提供了一种数据处理方法,包括:获取目标企业的凭证数据,其中,凭证数据为用于表示目标企业的凭证内容的数据;对凭证数据执行标准化数据处理,得到标准化数据,其中,标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,对凭证数据执行标准化数据处理,得到标准化数据,包括:确定凭证数据所表示的凭证内容;根据凭证数据所表示的凭证内容,确定凭证数据对应的标准表达规则;基于标准表达规则,对凭证数据进行转换,得到标准化数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在凭证数据包括自然语言的情况下,基于标准表达规则,对凭证数据进行转换,得到标准化数据,包括:对凭证数据中的自然语言进行分词处理,得到至少一个分词;将至少一个分词与预设关键词库中的关键词进行模糊匹配,得到符合标准表达规则的标准化数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,将至少一个分词与预设关键词库中的关键词进行模糊匹配,包括:将至少一个分词输入预设模型,得到至少一个分词匹配的关键词,其中,预设模型为预先采用目标样本对对神经网络模型进行机器学习训练得到的模型,目标样本对包括用于作为训练输入数据的至少一个样本分词和用于作为训练目标的样本关键词,其中,样本关键词为预设关键词库中的关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在凭证数据包括数值的情况下,基于标准表达规则,对凭证数据进行转换,得到标准化数据,包括:确定标准表达规则定义的数值单位;确定凭证数据采用的数值单位;确定标准表达规则定义的数值单位与凭证数据采用的数值单位之间的转换关系;基于转换关系对凭证数据进行转换,得到标准化数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在确定凭证数据所表示的凭证内容之前,该方法还包括:对凭证数据执行数据清洗处理,得到清洗后的凭证数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值之前,该方法还包括:在多个候选的参数中确定目标评价参数;在多个候选的算法中选择目标评价参数对应的算法,得到目标算法。
上述技术方案中的一个技术方案具有如下有益效果:
通过对凭证数据进行标准化数据处理,能够充分利用企业的凭证数据,如物品发票数据、货物运输单的数据、物品交易数据等,进而通过预设的算法对标准化数据进行计算,得到企业的评价参数,例如,企业的信用等级、贷款风险、运营能力指标、市场份额变化等等。
另一方面,本发明实施例提供了一种数据处理装置,包括:获取单元,用于获取目标企业的凭证数据,其中,凭证数据为用于表示目标企业的凭证内容的数据;第一处理单元,用于对凭证数据执行标准化数据处理,得到标准化数据,其中,标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;第二处理单元,用于根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,第一处理单元包括:第一确定模块,用于确定凭证数据所表示的凭证内容;第二确定模块,用于根据凭证数据所表示的凭证内容,确定凭证数据对应的标准表达规则;转换模块,用于基于标准表达规则,对凭证数据进行转换,得到标准化数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在凭证数据包括自然语言的情况下,转换模块包括:分词模块,用于对凭证数据中的自然语言进行分词处理,得到至少一个分词;匹配模块,用于将至少一个分词与预设关键词库中的关键词进行模糊匹配,得到符合标准表达规则的标准化数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,匹配模块包括:第一执行模块,用于将至少一个分词输入预设模型,得到至少一个分词匹配的关键词,其中,预设模型为预先采用目标样本对对神经网络模型进行机器学习训练得到的模型,目标样本对包括用于作为训练输入数据的至少一个样本分词和用于作为训练目标的样本关键词,其中,样本关键词为预设关键词库中的关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在凭证数据包括数值的情况下,转换模块包括:第三确定模块,用于确定标准表达规则定义的数值单位;第四确定模块,用于确定凭证数据采用的数值单位;第五确定模块,用于确定标准表达规则定义的数值单位与凭证数据采用的数值单位之间的转换关系;第二执行模块,用于基于转换关系对凭证数据进行转换,得到标准化数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,该装置还包括:清洗单元,用于在确定凭证数据所表示的凭证内容之前,对凭证数据执行数据清洗处理,得到清洗后的凭证数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,该装置还包括:确定单元,用于在根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值之前,在多个候选的参数中确定目标评价参数;选择单元,用于在多个候选的算法中选择目标评价参数对应的算法,得到目标算法。
上述技术方案中的一个技术方案具有如下有益效果:
通过对凭证数据进行标准化数据处理,能够充分利用企业的凭证数据,如物品发票数据、货物运输单的数据、物品交易数据等,进而通过预设的算法对标准化数据进行计算,得到企业的评价参数,例如,企业的信用等级、贷款风险、运营能力指标、市场份额变化等等。
另一方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明实施例的数据处理方法。
再一方面,本发明实施例提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明的数据处理方法。
上述技术方案中的一个技术方案具有如下有益效果:
通过对凭证数据进行标准化数据处理,能够充分利用企业的凭证数据,如物品发票数据、货物运输单的数据、物品交易数据等,进而通过预设的算法对标准化数据进行计算,得到企业的评价参数,例如,企业的信用等级、贷款风险、运营能力指标、市场份额变化等等。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例所提供的一种可选的数据处理方法的流程示意图;
图2是本发明实施例所提供的一种可选的数据处理装置的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
需要说明的是,尽管在本发明的权利要求书、说明书和附图中可能采用术语第一、第二、第三等来用于区别类似的对象XXX,应当理解,术语第一、第二、第三等不必用于描述特定的顺序或先后次序,仅用来将这些类似的对象XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
针对现有技术中所存在的获取企业评价指标的数据处理方法主观影响因素较大的技术问题,本发明实施例提供了如下解决思路:获取目标企业的凭证数据,其中,凭证数据为用于表示目标企业的凭证内容的数据;对凭证数据执行标准化数据处理,得到标准化数据,其中,标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值。
在该思路的引导下,本方案实施例提供了以下可行的实施方案。
本发明实施例提供了一种数据处理方法。
具体的,请参考图1,其为本发明实施例所提供的一种可选的数据处理方法的流程示意图,如图1所示,该方法包括以下步骤:
步骤101,获取目标企业的凭证数据,其中,凭证数据为用于表示目标企业的凭证内容的数据。
凭证内容可以是物品发票、货物运输单、物品交易账目等任意凭证的内容,凭证数据是用于表示凭证内容的数据,凭证数据可以是以任意类型或格式的计算机能够识别的数据,例如,凭证数据可以是自然语言的文字、字符,也可以是数值,每个凭证数据能够用于表示至少一种凭证内容,例如,物品名称、物品数量、物品单价、物品处理(如交易、运输等处理)时间。
企业的凭证数据可以是人工根据纸质的凭证输入的数据,也可以是通过图像识别纸质凭证中的文本字符,还可以是直接接收人工向计算机输入的数据,本发明实施例获取凭证数据的具体方式不做限定。
步骤102,对凭证数据执行标准化数据处理,得到标准化数据,其中,标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则。
由于企业的凭证数据数量较多,且凭证内容的数据不一定是标准数据,例如,企业与不同的交易对象进行交易时可能会采用不同的物品计量单位、或不同的货币单位,在不同时间段企业的物品名称可能会发生变化,等等,因此,在现有技术中企业的凭证数据并未得到充分利用。
为了能够充分利用企业的凭证数据提供的信息,本发明实施例提供的数据处理方法对凭证数据进行标准化数据处理。标准化数据处理用于使执行了标准化数据处理之后的数据符合待处理数据所对应的标准表达规则,例如,物品单价采用人民币“元”作为单位,物品数量以“千克”作为单位,相同类型的物品名称统一为相同的文字。在对凭证数据执行标准化数据处理之后,得到的标准化数据符合凭证数据所对应的标准表达规则。
可选的,在执行步骤102之前,还可以对凭证数据执行数据清洗处理,得到清洗后的凭证数据,其中,数据清洗处理用于对缺失值、无效值进行过滤、补充或修改,例如,按照预定的规则去除空格、数字、字母和/或特殊符号等。进而,在执行步骤102时,对清洗后的凭证数据执行标准化数据处理。
可选的,在执行步骤102时,可以先确定凭证数据对应的标准表达规则,进而基于标准表达规则对凭证数据进行转换,得到标准化数据。具体的,可以根据凭证数据所表示的凭证内容,确定凭证数据对应的标准表达规则。
例如,以凭证数据包括数值的情况为例,凭证数据为500克,凭证数据采用的数值单位为“克”,凭证数据所表示的凭证内容为物品数量,物品数量对应的标准表达规则定义以“千克”作为物品数量的数值单位,进而,基于“克”与“千克”之间的转换关系,将500克转换为0.5千克,得到标准化数据。
可选的,在凭证数据包括自然语言的情况下,可以对凭证数据中的自然语言进行分词处理,得到至少一个分词,然后将至少一个分词与预设关键词库中的关键词进行模糊匹配,得到符合标准表达规则的标准化数据。其中,预设关键词库中的每个关键词均符合标准表达规则。
需要说明的是,在凭证数据用于表示凭证内容中的物品名称的情况下,预设关键词库中的每个关键词可以用于表示一个物品分类。
例如,获取到的物品名称为“瑞士莲160g套装”,进行分词之后得到“瑞士莲”、“160g”“套装”,将分词与词库中的关键词进行模糊匹配,得到物品分类“糖果”。
进一步可选的,可以通过预设模型执行模糊匹配,在将至少一个分词输入预设模型之后,得到至少一个分词匹配的关键词。其中,预设模型为预先采用目标样本对对神经网络模型进行机器学习训练得到的模型。每个目标样本对包括用于作为训练输入数据的至少一个样本分词和用于作为训练目标的样本关键词,其中,样本关键词为预设关键词库中的关键词,例如,在一个目标样本对中,样本分词包括“xxx型号”、“空气”、“调节”、“设备”,样本关键词为“空调”。可选的,预设模型在被训练好之后,还可以采用新的目标样本对进行定时的更新。
如果对千万级别的中小企业发票数据执行上述标准化数据处理的步骤,能够通过解析发票物品、单价、数量、金额等,充分挖掘发票数据在企业风控和营销中的应用价值。经过对复杂冗余的非标准化物品名称进行清洗加工、规则过滤,运用自然语言处理技术提取物品关键信息,模糊匹配物品关键词库,将物品名称进行标准化并进行分类检索等步骤,能够实现物品名称自动识别及归类。此外,在非标准化的发票数据中,同一种物品可能对应多种单位表述,通过转化为标准化单位,统一同一物品计量单位,进而从金额和计量单位对物品进行标准化处理,能够便于后续分析应用。
步骤103,根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值。
利用对凭证数据进行标准化数据处理后得到的标准化数据,可以计算企业的评价参数。举例而言,通过对企业的发票内容进行识别,并通过对应的算法得到对应的评价参数,例如,通过纳税数据等评价企业的信用等级、通过物品交易金额计算企业的运营健康情况和贷款风险等;或者,对销售异常进行预警,具体的,通过发票内容识别,丰富企业贷前审核及贷后监控报告,分析企业物品销售金额分布,监控企业各类物品的销售金额变化趋势,对销售异常进行及时预警;又如,计算企业发展指标,具体的,对比企业和整个行业在某一物品类别上的销售金额走势,判断企业在行业中的竞争力变化和市场份额占比变化,丰富企业发展水平及生命周期指标;再如,还可以预测物品单价趋势,具体的,通过识别过滤合并物品标准单位,对具有标准单位的发票数据计算物品单价,对比分析企业及行业相关物品单价及销量走势关系,以用于企业定制营销策略和营销时间点。
需要说明的是,本发明实施例对目标算法的具体算法不做限定,可以根据具体情况而定。但是,由于存在不同种类的评价参数,因此,在根据目标算法对标准化数据进行处理之前,可以通过用户的选择等方式在多个候选的参数中确定目标评价参数,进而在多个候选的算法中选择目标评价参数对应的算法,得到目标算法。
需要说明的是,步骤101~步骤103的执行主体可以为数据处理装置,该装置可以位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,本发明实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本发明实施例对此不进行限定。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
本发明实施例的数据处理方法至少具有以下有益效果:
通过对凭证数据进行标准化数据处理,能够充分利用企业的凭证数据,如物品发票数据、货物运输单的数据、物品交易数据等,进而通过预设的算法对标准化数据进行计算,得到企业的评价参数,例如,企业的信用等级、贷款风险、运营能力指标、市场份额变化等等。
基于本发明实施例所提供的数据处理方法,本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图2,其为本发明实施例所提供的一种可选的数据处理装置的功能方块图。如图2所示,该装置包括:获取单元10,第一处理单元20和第二处理单元30,其中,获取单元10用于获取目标企业的凭证数据,其中,凭证数据为用于表示目标企业的凭证内容的数据;第一处理单元20用于对凭证数据执行标准化数据处理,得到标准化数据,其中,标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;第二处理单元30用于根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值。
作为上述实施例的一种可选的实施方式,第一处理单元包括:第一确定模块,用于确定凭证数据所表示的凭证内容;第二确定模块,用于根据凭证数据所表示的凭证内容,确定凭证数据对应的标准表达规则;转换模块,用于基于标准表达规则,对凭证数据进行转换,得到标准化数据。
作为上述实施例的一种可选的实施方式,在凭证数据包括自然语言的情况下,转换模块包括:分词模块,用于对凭证数据中的自然语言进行分词处理,得到至少一个分词;匹配模块,用于将至少一个分词与预设关键词库中的关键词进行模糊匹配,得到符合标准表达规则的标准化数据。
作为上述实施例的一种可选的实施方式,匹配模块包括:第一执行模块,用于将至少一个分词输入预设模型,得到至少一个分词匹配的关键词,其中,预设模型为预先采用目标样本对对神经网络模型进行机器学习训练得到的模型,目标样本对包括用于作为训练输入数据的至少一个样本分词和用于作为训练目标的样本关键词,其中,样本关键词为预设关键词库中的关键词。
作为上述实施例的一种可选的实施方式,在凭证数据包括数值的情况下,转换模块包括:第三确定模块,用于确定标准表达规则定义的数值单位;第四确定模块,用于确定凭证数据采用的数值单位;第五确定模块,用于确定标准表达规则定义的数值单位与凭证数据采用的数值单位之间的转换关系;第二执行模块,用于基于转换关系对凭证数据进行转换,得到标准化数据。
作为上述实施例的一种可选的实施方式,该装置还包括:清洗单元,用于在确定凭证数据所表示的凭证内容之前,对凭证数据执行数据清洗处理,得到清洗后的凭证数据。
作为上述实施例的一种可选的实施方式,该装置还包括:确定单元,用于在根据目标算法对标准化数据进行处理,得到目标企业的目标评价参数的值之前,在多个候选的参数中确定目标评价参数;选择单元,用于在多个候选的算法中选择目标评价参数对应的算法,得到目标算法。
由于本实施例中的各单元能够执行图1所示的数据处理方法,本实施例未详细描述的部分,可参考对图1对应实施例的相关说明。
本发明实施例的数据处理装置至少具有以下有益效果:
通过对凭证数据进行标准化数据处理,能够充分利用企业的凭证数据,如物品发票数据、货物运输单的数据、物品交易数据等,进而通过预设的算法对标准化数据进行计算,得到企业的评价参数,例如,企业的信用等级、贷款风险、运营能力指标、市场份额变化等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所属领域的技术人员可以理解,实现上述实施例方法中的全部或部分步骤可以是通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,计算机通过读取存储介质中的程序进而能够执行本发明实施例提供的数据处理方法。
相应的,本发明实施例还提供了一种存储介质,本发明实施例的存储介质包括存储的程序,其中,在程序运行时,控制存储介质所在设备执行本发明实施例提供的数据处理方法。本实施例未详细描述的部分,可参考对本发明实施例提供的数据处理方法实施例的相关说明。
本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明实施例的数据处理方法。本实施例未详细描述的部分,可参考对本发明实施例提供的数据处理方法实施例的相关说明。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标企业的凭证数据,其中,所述凭证数据为用于表示所述目标企业的凭证内容的数据;
对所述凭证数据执行标准化数据处理,得到标准化数据,其中,所述标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;
根据目标算法对所述标准化数据进行处理,得到所述目标企业的目标评价参数的值。
2.根据权利要求1所述的方法,其特征在于,所述对所述凭证数据执行标准化数据处理,得到标准化数据,包括:
确定所述凭证数据所表示的凭证内容;
根据所述凭证数据所表示的凭证内容,确定所述凭证数据对应的标准表达规则;
基于所述标准表达规则,对所述凭证数据进行转换,得到所述标准化数据。
3.根据权利要求2所述的方法,其特征在于,在所述凭证数据包括自然语言的情况下,所述基于所述标准表达规则,对所述凭证数据进行转换,得到所述标准化数据,包括:
对所述凭证数据中的自然语言进行分词处理,得到至少一个分词;
将所述至少一个分词与预设关键词库中的关键词进行模糊匹配,得到符合所述标准表达规则的所述标准化数据。
4.根据权利要求3所述的方法,其特征在于,所述将所述至少一个分词与预设关键词库中的关键词进行模糊匹配,包括:
将所述至少一个分词输入预设模型,得到所述至少一个分词匹配的关键词,其中,所述预设模型为预先采用目标样本对对神经网络模型进行机器学习训练得到的模型,所述目标样本对包括用于作为训练输入数据的至少一个样本分词和用于作为训练目标的样本关键词,其中,所述样本关键词为所述预设关键词库中的关键词。
5.根据权利要求2所述的方法,其特征在于,在所述凭证数据包括数值的情况下,所述基于所述标准表达规则,对所述凭证数据进行转换,得到所述标准化数据,包括:
确定所述标准表达规则定义的数值单位;
确定所述凭证数据采用的数值单位;
确定所述标准表达规则定义的数值单位与所述凭证数据采用的数值单位之间的转换关系;
基于所述转换关系对所述凭证数据进行转换,得到所述标准化数据。
6.根据权利要求2所述的方法,其特征在于,在所述确定所述凭证数据所表示的凭证内容之前,所述方法还包括:
对所述凭证数据执行数据清洗处理,得到清洗后的凭证数据。
7.根据权利要求1所述的方法,其特征在于,在所述根据目标算法对所述标准化数据进行处理,得到所述目标企业的目标评价参数的值之前,所述方法还包括:
在多个候选的参数中确定目标评价参数;
在多个候选的算法中选择所述目标评价参数对应的算法,得到所述目标算法。
8.一种数据处理装置,其特征在于,所述装置包括:
获取单元,用于获取目标企业的凭证数据,其中,所述凭证数据为用于表示所述目标企业的凭证内容的数据;
第一处理单元,用于对所述凭证数据执行标准化数据处理,得到标准化数据,其中,所述标准化数据处理用于使处理后的数据符合待处理数据对应的标准表达规则;
第二处理单元,用于根据目标算法对所述标准化数据进行处理,得到所述目标企业的目标评价参数的值。
9.根据权利要求8所述的装置,其特征在于,所述第一处理单元包括:
第一确定模块,用于确定所述凭证数据所表示的凭证内容;
第二确定模块,用于根据所述凭证数据所表示的凭证内容,确定所述凭证数据对应的标准表达规则;
转换模块,用于基于所述标准表达规则,对所述凭证数据进行转换,得到所述标准化数据。
10.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811536854.6A CN109815480B (zh) | 2018-12-14 | 2018-12-14 | 一种数据处理方法和装置、及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811536854.6A CN109815480B (zh) | 2018-12-14 | 2018-12-14 | 一种数据处理方法和装置、及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109815480A true CN109815480A (zh) | 2019-05-28 |
CN109815480B CN109815480B (zh) | 2022-08-12 |
Family
ID=66601979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811536854.6A Active CN109815480B (zh) | 2018-12-14 | 2018-12-14 | 一种数据处理方法和装置、及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109815480B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110688363A (zh) * | 2019-09-02 | 2020-01-14 | 中国平安人寿保险股份有限公司 | 一种数据的标准化处理方法及系统、电子设备及存储介质 |
CN110852800A (zh) * | 2019-11-07 | 2020-02-28 | 深圳前海点金保理有限公司 | 贸易信息的整合方法、终端设备以及存储介质 |
CN112037015A (zh) * | 2020-08-27 | 2020-12-04 | 中国建设银行股份有限公司 | 业务代理凭证处理方法、装置、电子设备和存储介质 |
WO2022179441A1 (en) * | 2021-02-24 | 2022-09-01 | International Business Machines Corporation | Standardization in the context of data integration |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110153851A1 (en) * | 2009-12-17 | 2011-06-23 | American Express Travel Related Services Company, Inc. | System and method for adjusting intake based on intellectual property asset data |
CN106980988A (zh) * | 2016-12-29 | 2017-07-25 | 中国银联股份有限公司 | 商户价值评价方法 |
CN108268645A (zh) * | 2018-01-23 | 2018-07-10 | 广州南方人才资讯科技有限公司 | 大数据处理方法与系统 |
CN108415930A (zh) * | 2018-01-19 | 2018-08-17 | 大象慧云信息技术有限公司 | 一种数据解析方法及装置 |
CN108898480A (zh) * | 2018-06-29 | 2018-11-27 | 重庆富民银行股份有限公司 | 用于授信贷款的贷款等级评估系统及方法 |
-
2018
- 2018-12-14 CN CN201811536854.6A patent/CN109815480B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110153851A1 (en) * | 2009-12-17 | 2011-06-23 | American Express Travel Related Services Company, Inc. | System and method for adjusting intake based on intellectual property asset data |
CN106980988A (zh) * | 2016-12-29 | 2017-07-25 | 中国银联股份有限公司 | 商户价值评价方法 |
CN108415930A (zh) * | 2018-01-19 | 2018-08-17 | 大象慧云信息技术有限公司 | 一种数据解析方法及装置 |
CN108268645A (zh) * | 2018-01-23 | 2018-07-10 | 广州南方人才资讯科技有限公司 | 大数据处理方法与系统 |
CN108898480A (zh) * | 2018-06-29 | 2018-11-27 | 重庆富民银行股份有限公司 | 用于授信贷款的贷款等级评估系统及方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110688363A (zh) * | 2019-09-02 | 2020-01-14 | 中国平安人寿保险股份有限公司 | 一种数据的标准化处理方法及系统、电子设备及存储介质 |
CN110688363B (zh) * | 2019-09-02 | 2023-07-21 | 中国平安人寿保险股份有限公司 | 一种数据的标准化处理方法及系统、电子设备及存储介质 |
CN110852800A (zh) * | 2019-11-07 | 2020-02-28 | 深圳前海点金保理有限公司 | 贸易信息的整合方法、终端设备以及存储介质 |
CN112037015A (zh) * | 2020-08-27 | 2020-12-04 | 中国建设银行股份有限公司 | 业务代理凭证处理方法、装置、电子设备和存储介质 |
WO2022179441A1 (en) * | 2021-02-24 | 2022-09-01 | International Business Machines Corporation | Standardization in the context of data integration |
US11550813B2 (en) | 2021-02-24 | 2023-01-10 | International Business Machines Corporation | Standardization in the context of data integration |
GB2618956A (en) * | 2021-02-24 | 2023-11-22 | Ibm | Standardization in the context of data integration |
Also Published As
Publication number | Publication date |
---|---|
CN109815480B (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815480A (zh) | 一种数据处理方法和装置、及存储介质 | |
CN108648074A (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
CN108776922A (zh) | 基于大数据的理财产品推荐方法及装置 | |
Alden et al. | Detection of financial statement fraud using evolutionary algorithms | |
CN109191282A (zh) | 一种基于行为模型的贷中监测评分方法以及系统 | |
CN107633030A (zh) | 基于数据模型的信用评估方法及装置 | |
CN105760957A (zh) | 一种证券软流失客户的预测方法 | |
Berdiyeva et al. | Artificial intelligence in accounting and finance: Meta-analysis | |
CN109859052A (zh) | 一种投资策略的智能推荐方法、装置、存储介质和服务器 | |
CN107633455A (zh) | 基于数据模型的信用评估方法及装置 | |
CN107516246A (zh) | 用户类型的确定方法、确定装置、介质及电子设备 | |
CN111882420A (zh) | 响应率的生成方法、营销方法、模型训练方法及装置 | |
CN111783829A (zh) | 一种基于多标签学习的财务异常检测方法及装置 | |
CN105631783A (zh) | 一种客观量化的中国发明专利评估系统及方法 | |
CN110096681A (zh) | 合同条款分析方法、装置、设备及可读存储介质 | |
CN110147389A (zh) | 帐号处理方法和装置、存储介质及电子装置 | |
CN109412839A (zh) | 一种异常账户的识别方法、装置、设备及存储介质 | |
CN107766500A (zh) | 固定资产卡片的审计方法 | |
CN110348902A (zh) | 一种烟草零售终端销售信息的获取设备及方法 | |
CN110109902A (zh) | 一种基于集成学习方法的电商平台推荐系统 | |
Hu | Predicting and improving invoice-to-cash collection through machine learning | |
JP6955287B2 (ja) | 不正株取引検出プログラム | |
US20200364537A1 (en) | Systems and methods for training and executing a recurrent neural network to determine resolutions | |
CN110909050A (zh) | 一种数据统计分析系统 | |
CN109685328A (zh) | 一种在建工程转固定资产的风险评分方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |