CN110705307A - 信息变更指标监控方法、装置、计算机设备和存储介质 - Google Patents

信息变更指标监控方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110705307A
CN110705307A CN201910814720.4A CN201910814720A CN110705307A CN 110705307 A CN110705307 A CN 110705307A CN 201910814720 A CN201910814720 A CN 201910814720A CN 110705307 A CN110705307 A CN 110705307A
Authority
CN
China
Prior art keywords
information
information change
change
feature
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910814720.4A
Other languages
English (en)
Inventor
林国胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910814720.4A priority Critical patent/CN110705307A/zh
Publication of CN110705307A publication Critical patent/CN110705307A/zh
Priority to PCT/CN2020/087556 priority patent/WO2021036317A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种信息变更指标监控方法、装置、计算机设备和存储介质,该方法包括:构建信息变更语义特征词库;基于信息变更语义特征词库中的信息变更语义特征,对源信息进行信息变更分析;在分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与信息变更中包含的变更明细相匹配的指标明细,如果否,则确定信息变更指标存在问题。本发明提供的方案对信息变更相关指标进行智能监控。

Description

信息变更指标监控方法、装置、计算机设备和存储介质
技术领域
本发明涉及通信领域,特别是涉及信息变更指标监控方法、装置、计算机设备和存储介质。
背景技术
在很多情况下,信息变更会引起相应的一些相关指标的变化,而监控信息变更相关指标可更好地满足用户的需求,避免一些不必要的流程或工序。比如,对体检信息变更相关的指标如体脂率、身体健康状况等进行监控能够直观的展示身体状况。又比如,企业主等高净值人群的股权变更如股权转让、股权减持等相关的缴税指标,由于股权变更如股权转让、股权减持等是在工商管理信息中体现。而不同地区的工商管理信息格式均有差异,另外工商管理信息往往以文本的形式存在,导致高净值人群的股权变更比较难以统计。因此,与股权转让或股权减持相关的缴税指标税款,主要是企业主等高净值人群主动缴纳。
目前,信息变更相关指标监控主要是对数据类的信息变更进行监控,对于文本样式的信息变更引起的相关指标变化,则通过人工核对的方式统计。比如,税务缴纳监控主要是对数据类型的缴税款项进行追踪和监控。对于文本样式的股权变更引起的缴税款项,则通过人工核对工商管理信息中与高净值人员相关的股权变更以及该高净值人员的缴税情况是否匹配,以确定该高净值人员在股权变更过程中是否存在偷税漏税的行为。因此,对信息变更指标进行智能监控则显得十分重要。
发明内容
基于此,有必要针对信息变更相关的指标进行智能监控,从而完善对信息变更相关的指标问题的监控,提供一种信息变更指标监控方法、装置、计算机设备和存储介质。
一种信息变更指标监控方法,所述信息变更指标监控方法包括:
构建信息变更语义特征词库;
基于所述信息变更语义特征词库中的信息变更语义特征,对源信息进行信息变更分析;
在分析结果为所述源信息中包含指标项相关的信息变更时,根据所述信息变更中包含的对象名称,搜索与所述对象名称相匹配的指标项信息;
在所述指标项信息中,搜索是否存在与所述信息变更中包含的变更明细相匹配的指标明细,如果否,则确定所述信息变更指标存在问题。
在其中一个实施例中,所述方法还包括:
利用训练数据集和测试数据集,构建分类器;
利用所述分类器提取信息变更语义特征,将提取出的所述信息变更语义特征存储到所述信息变更语义特征词库。
在其中一个实施例中,所述利用训练数据集和测试数据集,构建分类器,包括:
从所述训练数据集中,抽提出文档样本的特征词,通过下述特征向量权值计算公式,计算所述文档样本中特征词的特征向量权值;
所述特征向量权值计算公式:
Figure BDA0002186027270000021
其中,ci表征文档样本中的第i个特征词,dj表示第j个文档样本,fij表示第i个特征词在第j个文档样本中出现的频度,ni表示训练数据集中包含特征词ci的文档样本数,M表示训练数据集中的文档样本总数;
基于所述特征向量权值,训练分类器;
通过测试样本,测试训练后的分类器;
在测试结果的准确率达到预设的准确率阈值时,则确定该训练后的分类器有效,否则,更新所述分类器。
在其中一个实施例中,所述基于所述特征向量权值,训练分类器,包括:
将提取出的至少两个特征词组合成特征向量;
根据所述特征向量以及所述特征向量中包含的特征词的特征向量权值,利用下述训练公式,训练分类器;
所述训练公式:
其中,
Figure BDA0002186027270000032
其中,Y所对应的Ki即为所述特征向量所对应的类别;
Figure BDA0002186027270000033
表征特征向量中第j个特征词cj属于类别Ki的概率;表征特征向量中第j个特征词cj的特征向量权值;N(Ki)表征类别Ki中包含的训练样本数量;M表征训练样本集中特征词的总数量,Ki∈{K1,K2},K1,K2分别表征属于信息变更类别以及不属于信息变更类别。
在其中一个实施例中,所述信息变更语义特征词库中的股权变更语义特征,对源信息进行信息变更分析,包括:
将源信息与信息变更语义特征词库中的信息变更语义特征进行对比;
对包含有信息变更语义特征的文本语句进行语义分析,并按照语义分析结果,提取信息变更相关信息;
将信息变更相关信息转换为结构化的数据;
基于结构化的数据,对于同一类的信息变更进行分类;
根据分类结果,确定指标项相关的信息变更。
在其中一个实施例中,所述基于结构化的数据,对同一类的信息变更进行分类,包括:
在设定时间段内,将所述结构化的数据中信息变更前的对象名称与信息变更后的对象名称进行对比,
当对比结果为所述对象名称中至少一个对象的姓名消失时,确定消失的对象对应的信息变更类型为第一类,并对消失的对象的指标项信息进行第一类特征标记,
当对比结果为变更前的对象名称中的所有对象的姓名全部存在于变更后的对象名称中,且信息变更包含被动项,利用下述计算公式组,计算对象的信息变更结果,根据计算出的信息变更结果,确定对象对应的信息变更类型,
所述计算公式组:
其中,Ek表征第k次信息变更后的主动项数值,k≥0;Ek+1表征第k+1次信息变更后的主动项数值;ei表征第i个对象的数值变更结果;ωi(k+1)表征第k+1次信息变更后第i个对象的被动项数值;ωik表征第k次股权变更后第i个对象的被动项数值,
其中,
若ei<0,则确定对象对应的信息变更类型属于第二类,并对第i个对象的指标项信息进行第二类特征标记,
若ei≥0,则确定对象对应的信息变更类型属于第三类,对第i个对象的指标项信息进行第三类特征标记。
在其中一个实施例中,该方法还包括:
在接收到携带有对象信息的检索请求时,基于所述结构化的数据,检索并提供与所述对象信息相关的其它信息。
一种信息变更指标监控装置,所述信息变更指标监控装置包括:
特征词库构建单元,用于构建信息变更语义特征词库;
信息变更分析单元,用于基于所述构建单元构建出的所述信息变更语义特征词库中的信息变更语义特征,对源信息进行股权变更分析;
指标监控单元,用于在所述信息变更分析单元的分析结果为所述源信息中包含指标项相关的信息变更时,根据所述信息变更中包含的对象名称,搜索与所述对象名称相匹配的指标项信息;在所述指标项信息中,搜索是否存在与所述信息变更中包含的变更明细相匹配的指标明细,如果否,则确定所述信息变更指标存在问题。
在其中一个实施例中,该信息变更指标监控装置进一步包括:特征提取单元,其中,
所述特征提取单元,用于利用训练数据集和测试数据集,构建分类器,利用所述分类器提取信息变更语义特征,将提取出的所述信息变更语义特征存储到所述特征词库构建单元构建出的所述信息变更语义特征词库。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如上述任一项实施例所述信息变更指标监控方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述任一项实施例所述信息变更指标监控方法的步骤。
上述信息变更指标监控方法、装置、计算机设备和存储介质,通过构建信息变更语义特征词库;基于信息变更语义特征词库中的股权变更语义特征,对源信息进行信息变更分析;在分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与所述信息变更中包含的变更明细相匹配的指标明细,如果否,则确定所述信息变更指标存在问题。由于信息变更语义特征对源信息进行信息变更分析,能够筛选出涉及信息变更的源信息,而在涉及信息变更的源信息中还可进一步筛选出包含指标项相关的信息变更,根据该包含指标项相关的信息变更对应的对象名称,搜索与对象名称相匹配的指标项信息;进一步搜索指标项信息中是否包含与股权变更明细相匹配的指标明细,即可确定出信息变更指标是否存在问题,实现了智能监控信息变更相关的指标。比如,对于源信息为工商信息,信息变更为股权变更,信息变更相关指标项为缴税项,则通过股权变更语义特征对工商信息进行股权变更分析,能够筛选出涉及股权变更的工商信息,而在涉及股权变更的工商信息中还可进一步筛选出包含需缴纳税款的股权变更信息的工商信息,根据该包含需缴纳税款的股权变更信息对应的对象名称,搜索与对象名称相匹配的缴税信息;进一步搜索缴税信息中是否包含与股权变更明细相匹配的缴税项,即可确定出股权变更相关缴税项是否存在问题,即确定出是否存在偷税漏税的问题,实现了智能监控股权变更相关的缴税。
附图说明
图1为一个实施例中提供的隐藏通信号码方法的实施环境图;
图2为一个实施例中计算机设备的内部结构框图;
图3为一个实施例中信息变更指标监控方法的流程图;
图4为另一个实施例中信息变更指标监控方法的流程图;
图5为又一个实施例中信息变更指标监控方法的流程图;
图6为另一个实施例中信息变更指标监控方法的流程图;
图7为一个实施例中信息变更指标监控装置的结构框图;
图8为另一个实施例中信息变更指标监控装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一类股权减持类型称为第二类股权减持类型,且类似地,可将第二类股权减持类型称为第一类股权减持类型。
图1为一个实施例中提供的信息变更指标监控方法的实施环境图,如图1所示,在该实施环境中,包括计算机设备110以及终端120。
计算机设备110为信息变更指标监控的设备,例如为缴税系统中心配置的服务器等计算机设备,其还可为云服务器等。计算机设备110上安装有为将源信息如工商信息转换为结构化数据的工具,使文本等各种格式存在的源信息如工商信息转换为结构化数据,以方便对结构化数据的分析和监控。终端120上安装有能够与计算机设备110通信的应用,终端120可通过安装的能够与计算机设备110通信的应用,发送检索请求或者监控请求等给计算机设备110。当需要检索某一对象关于信息变更指标情况时,业务人员可以通过终端120上安装有能够与计算机设备110通信的应用,发送检索请求给计算机设备110,计算机设备110基于信息变更语义特征词库中的信息变更语义特征,对源信息进行股权变更分析;在分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与信息变更中包含的变更明细相匹配的指标明细,如果否,则确定信息变更指标存在问题。计算机设备110将存在问题的信息变更指标发送给终端120,同时,还可把该对象具体的情况一并发送给终端120。
需要说明的是,终端120可为智能手机、平板电脑、笔记本电脑、台式计算机等;计算机设备110可以为信息维护系统中心中的服务器如缴税系统中心中的服务器等,但并不局限于此。计算机设备110与终端120可以通过蓝牙、USB(Universal Serial Bus,通用串行总线)或者其他通讯连接方式进行连接,本发明在此不做限制。
图2为一个实施例中计算机设备的内部结构示意图。如图2所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种信息变更指标监控方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令以及存储股权变更语义特征词库中的股权变更语义特征,该计算机可读指令被处理器执行时,可使得处理器执行一种信息变更指标监控方法。该计算机设备的网络接口可用于与终端连接通信。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
如图3所示,在一个实施例中,提出了一种信息变更指标监控方法,该信息变更指标监控方法可以应用于由至少一个上述计算机设备110组成的信息维护系统中心中,具体可以包括以下步骤:
步骤301:构建信息变更语义特征词库;
该步骤构建信息变更语义特征词库的过程可以为,在计算机设备110内的存储空间划分出一个区域作为信息变更语义特征词库,将信息变更语义特征存储到该信息变更语义特征词库内。该信息变更语义特征可以通过人工筛选获得,也可以通过分类器筛选获得。其中,通过分类器筛选的过程,可将分类器设置于计算机设备110上。信息变更语义特征具体体现形式可以为几个特征词的组合,比如关于股权变更语义特征可为“股权变更比例减小”,“股权转让减少”等。
步骤302:基于信息变更语义特征词库中的股权变更语义特征,对源信息进行信息变更分析;
该步骤具体实施过程可以为,将源信息利用现有的分词技术进行分词,将分出来的特征词与信息变更语义特征词库中的信息变更语义特征进行对比,如果分出的特征词组合包含一个完整的信息变更语义特征,则说明该源信息中包含指标项相关的信息变更;如果分出的特征词组合与任意的信息变更语义特征均不相同,则说明该源信息不中包含指标项相关的信息变更。上述源信息可为工商信息,上述信息变更为股权变更,则上述指标项可为缴纳税款项。即如果分出的特征词组合包含一个完整的股权变更语义特征,则说明该工商信息中包含需缴纳税款项的股权变更;如果分出的特征词组合与任意的股权变更语义特征均不相同,则说明该工商信息不中包含需缴纳税款项的股权变更。
步骤303:在分析结果为源信息中包含指标项相关的信息变更时,根据所述信息变更中包含的对象名称,搜索与所述对象名称相匹配的指标项信息;
例如,源信息为工商信息,指标项为缴纳税款项,信息变更为股权变更,则该对象名称主要是指股东/自然人姓名等,如果该工商信息以表格的形式存在,则在缴税系统中可根据该对象名称搜索对应的缴税信息。
步骤304:在指标项信息中,搜索是否存在与信息变更中包含的变更明细相匹配的指标明细,如果是,则执行步骤305,否则,执行步骤306;
对于缴纳税款项来说,其内部为缴税信息,该步骤可搜索是否存在与股权变更信息中包含的股权变更明细相匹配的缴税明细,其中,股权变更信息中包含的股权变更明细可以为变更前股份占比,变更后股份占比;还可以为变更前投资金额,变更后投资金额等。由于缴税信息中对各种税款均有明确的记录,通过搜索的方式即可查找出是否存在与股权变更明细相匹配的缴税款项。
步骤305:确认该对象名称对应的对象不存在信息变更指标问题,并结束当前流程;
步骤306:确定对象名称对应的对象存在信息变更指标问题。
在图3所示的实施例中,针对工商信息中的股权变更,分析股权变更相关的缴税项,以监控缴税项中与股权变更相关的缴税信息,实现监控缴税漏税情况。即通过股权变更语义特征对工商信息进行股权变更分析,能够筛选出涉及股权变更的工商信息,而在涉及股权变更的工商信息中还可进一步筛选出包含需缴纳税款的股权变更信息的工商信息,根据该包含需缴纳税款的股权变更信息对应的对象名称,搜索与对象名称相匹配的缴税信息;进一步搜索缴税信息中是否包含与股权变更明细相匹配的缴税项,即可确定出是否存在偷税漏税的问题,实现了智能监控股权变更相关的缴税。
其中,构建信息变更语义特征词库的方式可以有两种实现方式。
方式一:人工直接从各种样本中筛选出信息变更语义特征,并将该筛选出的信息变更语义特征存储到信息变更语义特征词库中。比如,人工直接从各种样本中筛选出股权变更语义特征,并将该筛选出的股权变更语义特征存储到股权变更语义特征词库中。
方式二:通过分类器智能提取信息变更语义特征,并将提取出的信息变更语义特征存储到信息变更语义特征词库中。比如,通过分类器智能提取股权变更语义特征,并将提取出的股权变更语义特征存储到股权变更语义特征词库中。
如图4所示,在本发明一个实施例中,上述方法还可包括:
步骤401:利用训练数据集和测试数据集,构建分类器;
该步骤是在上述步骤301之前完成的,比如,该训练数据集中包含有标记有涉及股权变更特征词的样本和标记有股权变更以外的其他工商变更特征词的样本,在一个训练数据集中可以一半为标记有涉及股权变更特征词的样本,一半为其他工商变更特征词的样本。比如,一个训练数据集中有1000个样本,则标记有涉及股权变更特征词的样本和其他工商变更特征词的样本则各占500个。优选地,为了能够保证分类器的准确性,训练数据集中的样本个数不小于1000个。
测试数据集主要是为了对分类器的准确性进行测试。
步骤402:利用分类器提取信息变更语义特征,将提取出的信息变更语义特征存储到信息变更语义特征词库。
该步骤可以在上述301之后进行,也可作为上述301的一部分。在实际应用过程中,该信息变更语义特征词库还可被扩充。
值得说明的是,上述两个方案用户可以按照自己的需求进行选择,有效地提高了使用灵户性和实用性。
其中,
上述步骤401的具体实施方式,如图5所示,可具体包括如下步骤:
步骤501:从训练数据集中,抽提出文档样本的特征词,计算特征词的特征向量权值;
可以理解地,上述特征词去重后的特征词,另外,上述特征词不包含“的”、“地”、“得”等无意义词。
该步骤计算特征词的特征向量权值,可通过下述特征向量权值计算公式进行计算。
特征向量权值计算公式:
Figure BDA0002186027270000101
其中,ci表征文档样本中的第i个特征词,dj表示第j个文档样本,fij表示第i个特征词在第j个文档样本中出现的频度,ni表示训练数据集中包含特征词ci的文档样本数,M表示训练数据集中的文档样本总数;其中,j不大于训练数据集中样本总数;频度是指一个特征词在文档样本中出现的次数或者特征词在文档样本中出现的次数与特征词总个数的比值,在对各个特征词的特征向量权值进行计算过程中,需保证特征词频度取值标准的一致性。针对训练数据集中包含1000个样本来说,j的取值则不大于1000。
步骤502:基于特征向量权值,训练分类器;
该步骤的具体实施方式可为,将提取出的至少两个特征词组合成特征向量;根据特征向量以及特征向量中包含的特征词的特征向量权值,利用下述训练公式,训练分类器;
训练公式:
Figure BDA0002186027270000111
其中,
Figure BDA0002186027270000112
其中,Y所对应的Ki即为特征向量所对应的类别;表征特征向量中第j个特征词cj属于类别Ki的概率;
Figure BDA0002186027270000114
表征特征向量中第j个特征词cj的特征向量权值;N(Ki)表征类别Ki中包含的训练样本数量;M表征训练样本集中特征词的总数量,Ki∈{K1,K2},K1,K2分别表征属于信息变更类别以及不属于信息变更类别。其中,对于K1可以赋值为1;对于K2可以赋值为0。
通过设计上述
Figure BDA0002186027270000115
一方面可以避免出现y=0的情况,另一方面,该设计能够获得比较准确的分类器。
另外,上述至少两个特征词组合成特征向量,在通过上述训练公式得出一个特征向量的类别为属于信息变更类别,则该属于信息变更类别的特征向量可作为信息变更语义特征存储到信息变更语义特征词库。比如,上述至少两个特征词组合成特征向量,在通过上述训练公式得出一个特征向量的类别为属于股权变更类别,则该属于股权变更类别的特征向量可作为股权变更语义特征存储到股权变更语义特征词库。
步骤503:通过测试样本,测试训练后的分类器;
该测试的具体过程是,通过分类器对测试样本进行分类,如果分类结果与测试样本标记的类别一致,则说明分类器对该测试样本分类正确。测试数据集中的测试样本的个数越多,则对分类器测试的准确性越高。一般测试数据集中测试样本个数不小于200个。
步骤504:判断测试结果的准确率是否达到预设的准确率阈值,如果是,则执行步骤505;否则,执行步骤506;
在本发明实施例中,为了保证分类器能够比较准确的提取出股权变更语义特征,则该准确率阈值一般不小于85%。比如,如果设置准确率阈值为85%,即准确率达到85%,则确定该分类器有效;如果准确率低于85%,则更新分类器,直至准确率达到85%以上。
步骤505:确定该训练后的分类器有效,并结束当前流程;
步骤506:更新分类器。
该更新分类器的方式可以为,为训练数据集增加新的训练样本,并用增加的训练样本继续训练分类器,还可以为以测试样本作为训练样本添加到训练数据集,继续训练分类器,并重新为测试数据集增加新的测试样本。另外,与测试数据集中的测试样本总数相比,训练数据集中训练样本与测试数据集中的测试样本重复率需不高于5%。
另外,上述步骤302的一种实现方式可如图6所示,具体包括如下步骤:
步骤601:将源信息与信息变更语义特征词库中的信息变更语义特征进行对比;
比如,上述源信息为工商信息,信息变更为股权变更,则该步骤具体实施方式可为,利用现有的分词工具或装置对工商信息进行分词,并将得到的各个特征词进行不同形式的组合,得到多个待对比的特征,将待对比的特征与股权变更语义特征词库中的各个股权变更语义特征进行对比,如果在股权变更语义特征词库中能够找到与一个股权变更语义特征完全一致的待对比的特征,则确定该工商信息包含涉及到股权减持的股权变更信息。其中,股权变更语义特征与待对比的特征完全一致是指,股权变更语义特征中包含的特征词与待对比的特征中的特征词完全一样,但是特征词之间的顺序并不影响股权变更语义特征与待对比的特征之间的一致性,比如:工商信息中包含的一个待对比的特征为“股权变更减小投资”与股权变更语义特征为“股权减小投资变更”完全一致,则该工商信息涉及股权减持的股权变更信息。
另外,对于多个工商信息来说,如对比结果为工商信息涉及股权减持的股权变更信息,则为该工商信息标记为“有股权变更记录”;如对比结果为工商信息不涉及股权减持的股权变更信息,则为该工商信息标记为“其他工商变更记录”。
步骤602:对包含有信息变更语义特征的文本语句进行语义分析,并按照语义分析结果,提取信息变更相关信息;
对于源信息为工商信息来说,该步骤的语义分析过程主要是,识别工商信息中的关键信息如对象名称、投资金额(原投资金额、变更后投资金额)、股权分配比例(原股权分配比例、变更后股权分配比例)等,则截取关键信息以及从关键信息到第一个出现的分隔符(逗号、空白符、分号和冒号等)之间的数据。
比如,工商信息记载:二零一九年三月对某某公司的股权进行了变更,变更信息为:对象名称张三,将原投资金额一百万,减少至五十万。则提取出的关键信息以及对应的数据为对象名称张三,原投资金额一百万,减少至五十万。
步骤603:将信息变更转换为结构化的数据;
比如,对于工商信息中股权变更来说,该步骤的结果化的数据即将投资金额或者投资比例转换为数值型。
另外,对于工商信息中股权变更来说,在该步骤中,还可通过将提取出的股权变更相关信息填充到预先构建的结构化的表格中,以方便统计和管理。具体实现方式:构建股权变更监控表,并为该监控表设置对象名称项、原投资金额项、变更后投资金额项、原股权分配比例项、变更后股权分配比例项,将截取的信息存储到对应的项中(比如:截取的为对象名称张某,则将张某存储到对象名称项所对应的列中),在为原投资金额项、变更后投资金额项、原股权分配比例项、变更后股权分配比例项存储对应的数据时,需要将相应的投资金额、原股权分配比例、变更后股权分配比例转换为统一的数值型数据。
步骤604:基于结构化的数据,对于涉及到同一类信息变更进行分类;
分类形式一:针对只有主动项数值变化,而并未给出从动项的结构化数据。
可以直接对比主动项数值变化,当信息变更后的主动项数值小于信息变更前的主动项数值,则说明该信息变更涉及减少类,则对该对象及其相关的数据进行减少特征标记;当对象的信息变更后的主动项数值大于信息变更前的主动项数值,则说明该信息变更不涉及减少类,则对该对象及其相关的数据不进行特征标记;当对象的主动项数值一直维持不变,则说明该主动项数值不涉及减少类,则对该对象及其相关的数据不进行特征标记。
比如,针对信息变更为股权变更来说,针对只有投资金额变化,而并未给出股权占比的结构化数据。可以直接对比对象的原投资金额与股权变更后的投资金额,当股权变更后的投资金额小于原投资金额,则说明该股权变更涉及股权减持,则对该对象及其相关的数据进行缴税特征标记;当对象的股权变更后的投资金额大于原投资金额,则说明该股权变更不涉及股权减持,则对该对象及其相关的数据进行非缴税特征标记;当对象的投资金额一直维持不变,则说明该股权变更不涉及股权减持,则对该对象及其相关的数据进行非缴税特征标记。
分类形式二:针对从动项数值发生变化的结构化数据。
在设定时间段内,将所述结构化的数据中信息变更前的对象名称与信息变更后的对象名称进行对比,
当对比结果为所述对象名称中至少一个对象的姓名消失时,确定消失的对象对应的信息变更类型为第一类,并对消失的对象的指标项信息进行第一类特征标记,
当对比结果为变更前的对象名称中的所有对象的姓名全部存在于变更后的对象名称中,且信息变更包含被动项,利用下述计算公式组,计算对象的信息变更结果,根据计算出的信息变更结果,确定对象对应的信息变更类型,
所述计算公式组:
Figure BDA0002186027270000151
其中,Ek表征第k次信息变更后的主动项数值,k≥0;Ek+1表征第k+1次信息变更后的主动项数值;ei表征第i个对象的数值变更结果;ωi(k+1)表征第k+1次信息变更后第i个对象的被动项数值;ωik表征第k次股权变更后第i个对象的被动项数值,
其中,
若ei<0,则确定对象对应的信息变更类型属于第二类,并对第i个对象的指标项信息进行第二类特征标记,
若ei≥0,则确定对象对应的信息变更类型属于第三类,对第i个对象的指标项信息进行第三类特征标记;
比如,针对信息变更为股权变更来说,在设定时间段内,将结构化的数据中股权变更前的对象名称与股权变更后的对象名称进行对比,当对比结果为对象名称中至少一个股东/自然人姓名消失时,确定消失的股东/自然人对应的股权减持类型为第一类,并对消失的股东/自然人进行第一类缴税特征标记;
当对比结果为变更前的对象名称中的所有股东/自然人全部存在于变更后的对象名称中,且股权变更信息包含股权占比,利用下述计算公式组,计算股东/自然人的投资金额,根据计算结果,确定股东/自然人对应的股权减持类型;
计算公式组:
Figure BDA0002186027270000152
其中,Ek表征第k次股权变更后的投资总额,k≥0;Ek+1表征第k+1次股权变更后的投资总额;ei表征第i个股东/自然人的投资变更额;ωi(k+1)表征第k+1次股权变更后第i个股东/自然人的股权占比;ωik表征第k次股权变更后第i个股东/自然人的股权占比;
其中,
若ei<0,则确定第i个股东/自然人的股权减持类型属于第二类,并对第i个股东/自然人进行第二类缴税特征标记;
若ei≥0,则确定第i个股东/自然人的股权减持类型属于第三类,对第i个股东/自然人进行第三类非缴税特征标记。
上述设定时间段可以为任意选定的时间段如12个月、6个月、3个月等。设定时间段一方面可有针对性的搜索用户所需要的内容,另一方面尽可能的避免在一个工商信息中包含有多次股权变更的情况,即一般在一个设定时间段内,只统计一次股权变更涉及的股权减少类型。
上述股权减持类型为第一类以及股权减持类型为第二类均为减少投资,因此需要针对回收资金缴税。股权减持类型为第三类只是因为总投资金额的增加引起的股权占比,而对象实际的投资金额并未减少,因此不涉及回收资金,也无需缴税。
上述非缴税特征标记和缴税特征标记能够直观的给出需要缴纳税款的对象,方便对需缴纳税款的对象的统计。
步骤605:根据分类结果,确定指标项相关的信息变更。
比如,针对信息变更为股权变更来说,该步骤可以直接将标记有缴税特征标记对应的信息如变更前股权占比、变更后股权占比等作为包含需缴纳税款的股权变更信息。
另外,在上述方法还可包括:在接收到携带有对象信息的检索请求时,基于所述结构化的数据,检索并提供与所述对象信息相关的其它信息。比如,基于结构化的数据,检索并提供与对象信息对应的股权相关信息。该股权相关信息可为投资金额、投资企业、股权变更情况、与股权变更相关的缴税情况等。
如图7所示,在一个实施例中,提供了一种信息变更指标监控装置,该信息变更指标监控装置可以集成于上述的计算机设备110中,也可集成于由上述至少两个计算机设备110组成的信息维护系统中心中,具体可以包括特征词库构建单元701、信息变更分析单元702以及指标监控单元703。
特征词库构建单元701,用于构建信息变更语义特征词库;
信息变更分析单元702,用于基于特征词库构建单元701构建出的信息变更语义特征词库中的信息变更语义特征,对源信息进行股权变更分析;
指标监控单元703,用于在信息变更分析单元702的分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与信息变更中包含的变更明细相匹配的指标明细,如果否,则确定信息变更指标存在问题。
如图8所示,在一个实施例中,该装置还包括:特征提取单元801,其中,特征提取单元801,用于利用训练数据集和测试数据集,构建分类器,利用分类器提取信息变更语义特征,将提取出的信息变更语义特征存储到特征词库构建单元701构建出的信息变更语义特征词库。
在一个实施例中,特征提取单元801,用于从所述训练数据集中,抽提出文档样本的特征词,通过下述特征向量权值计算公式,计算文档样本中特征词的特征向量权值;
特征向量权值计算公式:
Figure BDA0002186027270000171
其中,ci表征文档样本中的第i个特征词,dj表示第j个文档样本,fij表示第i个特征词在第j个文档样本中出现的频度,ni表示训练数据集中包含特征词ci的文档样本数,M表示训练数据集中的文档样本总数;基于特征向量权值,训练分类器;通过测试样本,测试训练后的分类器;在测试结果的准确率达到预设的准确率阈值时,则确定该训练后的分类器有效,否则,更新分类器。
在一个实施例中,特征提取单元801,用于将提取出的至少两个特征词组合成特征向量;根据特征向量以及特征向量中包含的特征词的特征向量权值,利用下述训练公式,训练分类器;
训练公式:
Figure BDA0002186027270000172
其中,
Figure BDA0002186027270000181
其中,Y所对应的Ki即为所述特征向量所对应的类别;
Figure BDA0002186027270000182
表征特征向量中第j个特征词cj属于类别Ki的概率;
Figure BDA0002186027270000183
表征特征向量中第j个特征词cj的特征向量权值;N(Ki)表征类别Ki中包含的训练样本数量;M表征训练样本集中特征词的总数量,Ki∈{K1,K2},K1,K2分别表征属于信息变更类别以及不属于信息变更类别。
在一个实施例中,信息变更分析单元702,用于将源信息与信息变更语义特征词库中的信息变更语义特征进行对比;对包含有信息变更语义特征的文本语句进行语义分析,并按照语义分析结果,提取信息变更相关信息;将信息变更相关信息转换为结构化的数据;基于结构化的数据,对同一类的信息变更进行分类;根据分类结果,确定指标项相关的信息变更。
在一个实施例中,信息变更分析单元702,用于在设定时间段内,将所述结构化的数据中信息变更前的对象名称与信息变更后的对象名称进行对比,
当对比结果为所述对象名称中至少一个对象的姓名消失时,确定消失的对象对应的信息变更类型为第一类,并对消失的对象的指标项信息进行第一类特征标记,
当对比结果为变更前的对象名称中的所有对象的姓名全部存在于变更后的对象名称中,且信息变更包含被动项,利用下述计算公式组,计算对象的信息变更结果,根据计算出的信息变更结果,确定对象对应的信息变更类型,
所述计算公式组:
Figure BDA0002186027270000184
其中,Ek表征第k次信息变更后的主动项数值,k≥0;Ek+1表征第k+1次信息变更后的主动项数值;ei表征第i个对象的数值变更结果;ωi(k+1)表征第k+1次信息变更后第i个对象的被动项数值;ωik表征第k次股权变更后第i个对象的被动项数值,
其中,
若ei<0,则确定对象对应的信息变更类型属于第二类,并对第i个对象的指标项信息进行第二类特征标记,
若ei≥0,则确定对象对应的信息变更类型属于第三类,对第i个对象的指标项信息进行第三类特征标记。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:构建信息变更语义特征词库;基于信息变更语义特征词库中的信息变更语义特征,对源信息进行信息变更分析;在分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与信息变更中包含的变更明细相匹配的指标明细,如果否,则确定信息变更指标存在问题。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:构建信息变更语义特征词库;基于信息变更语义特征词库中的信息变更语义特征,对源信息进行信息变更分析;在分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与信息变更中包含的变更明细相匹配的指标明细,如果否,则确定信息变更指标存在问题。
综上所述,上述各个实施例至少能够达到如下有益效果:
1.通过构建信息变更语义特征词库;基于信息变更语义特征词库中的股权变更语义特征,对源信息进行信息变更分析;在分析结果为源信息中包含指标项相关的信息变更时,根据信息变更中包含的对象名称,搜索与对象名称相匹配的指标项信息;在指标项信息中,搜索是否存在与所述信息变更中包含的变更明细相匹配的指标明细,如果否,则确定所述信息变更指标存在问题。由于信息变更语义特征对源信息进行信息变更分析,能够筛选出涉及信息变更的源信息,而在涉及信息变更的源信息中还可进一步筛选出包含指标项相关的信息变更,根据该包含指标项相关的信息变更对应的对象名称,搜索与对象名称相匹配的指标项信息;进一步搜索指标项信息中是否包含与股权变更明细相匹配的指标明细,即可确定出信息变更指标是否存在问题,实现了智能监控信息变更相关的指标。
2.通过构建股权变更语义特征词库;基于股权变更语义特征词库中的股权变更语义特征,对工商信息进行股权变更分析;在分析结果为工商信息中包含需缴纳税款的股权变更信息时,根据股权变更信息中包含的对象名称,搜索与对象名称相匹配的缴税信息;在缴税信息中,搜索是否存在与股权变更信息中包含的股权变更明细相匹配的缴税项,如果否,则确定对象名称对应的对象存在偷税漏税问题。由于股权变更语义特征对工商信息进行股权变更分析,能够筛选出涉及股权变更的工商信息,而在涉及股权变更的工商信息中还可进一步筛选出包含需缴纳税款的股权变更信息的工商信息,根据该包含需缴纳税款的股权变更信息对应的对象名称,搜索与对象名称相匹配的缴税信息;进一步搜索缴税信息中是否包含与股权变更明细相匹配的缴税项,即可确定出是否存在偷税漏税的问题,实现了智能监控股权变更相关的缴税。
3.利用训练数据集和测试数据集,构建分类器;利用分类器提取股权变更语义特征,将提取出的股权变更语义特征存储到股权变更语义特征词库,实现了智能提取股权变更语义特征,从而保证了提取股权变更语义特征提取效率。
4.通过计算所述文档样本中特征词的特征向量权值,基于所述特征向量权值、类别样本数以及训练样本集中特征词的总数量,训练分类器,通过测试样本,测试训练后的分类器;在测试结果的准确率达到预设的准确率阈值时,则确定该训练后的分类器有效,否则,更新分类器。能够有效地提高分类器的准确性。
5.通过对同一类信息变更进行分类,能够将涉及指标项的信息变更和不涉及指标项的信息变更进行区分,并通过涉及指标项特征标记和非涉及指标项特征标记,方便查找涉及指标项的信息变更。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种信息变更指标监控方法,其特征在于,所述信息变更指标监控方法包括:
构建信息变更语义特征词库;
基于所述信息变更语义特征词库中的信息变更语义特征,对源信息进行信息变更分析;
在分析结果为所述源信息中包含指标项相关的信息变更时,根据所述信息变更中包含的对象名称,搜索与所述对象名称相匹配的指标项信息;
在所述指标项信息中,搜索是否存在与所述信息变更中包含的变更明细相匹配的指标明细,如果否,则确定所述信息变更指标存在问题。
2.根据权利要求1所述的信息变更指标监控方法,其特征在于,所述方法还包括:
利用训练数据集和测试数据集,构建分类器;
利用所述分类器提取信息变更语义特征,将提取出的所述信息变更语义特征存储到所述信息变更语义特征词库。
3.根据权利要求2所述的信息变更指标监控方法,其特征在于,所述利用训练数据集和测试数据集,构建分类器,包括:
从所述训练数据集中,抽提出文档样本的特征词,通过下述特征向量权值计算公式,计算所述文档样本中特征词的特征向量权值;
所述特征向量权值计算公式:
Figure FDA0002186027260000011
其中,ci表征文档样本中的第i个特征词,dj表示第j个文档样本,fij表示第i个特征词在第j个文档样本中出现的频度,ni表示训练数据集中包含特征词ci的文档样本数,M表示训练数据集中的文档样本总数;
基于所述特征向量权值,训练分类器;
通过测试样本,测试训练后的分类器;
在测试结果的准确率达到预设的准确率阈值时,则确定该训练后的分类器有效,否则,更新所述分类器。
4.根据权利要求3所述的信息变更指标监控方法,其特征在于,所述基于所述特征向量权值,训练分类器,包括:
将提取出的至少两个特征词组合成特征向量;
根据所述特征向量以及所述特征向量中包含的特征词的特征向量权值,利用下述训练公式,训练分类器;
所述训练公式:
Figure FDA0002186027260000021
其中,
Figure FDA0002186027260000022
其中,Y所对应的Ki即为所述特征向量所对应的类别;表征特征向量中第j个特征词cj属于类别Ki的概率;表征特征向量中第j个特征词cj的特征向量权值;N(Ki)表征类别Ki中包含的训练样本数量;M表征训练样本集中特征词的总数量,Ki∈{K1,K2},K1,K2分别表征属于信息变更类别以及不属于信息变更类别。
5.根据权利要求1所述的信息变更指标监控方法,其特征在于,所述基于所述信息变更语义特征词库中的股权变更语义特征,对源信息进行信息变更分析,包括:
将源信息与信息变更语义特征词库中的信息变更语义特征进行对比;
对包含有信息变更语义特征的文本语句进行语义分析,并按照语义分析结果,提取信息变更相关信息;
将信息变更相关信息转换为结构化的数据;
基于结构化的数据,对同一类的信息变更进行分类;
根据分类结果,确定指标项相关的信息变更。
6.根据权利要求5所述的信息变更指标监控方法,其特征在于,
所述基于结构化的数据,对同一类的信息变更进行分类,包括:
在设定时间段内,将所述结构化的数据中信息变更前的对象名称与信息变更后的对象名称进行对比,
当对比结果为所述对象名称中至少一个对象的姓名消失时,确定消失的对象对应的信息变更类型为第一类,并对消失的对象的指标项信息进行第一类特征标记,
当对比结果为变更前的对象名称中的所有对象的姓名全部存在于变更后的对象名称中,且信息变更包含被动项,利用下述计算公式组,计算对象的信息变更结果,根据计算出的信息变更结果,确定对象对应的信息变更类型,
所述计算公式组:
Figure FDA0002186027260000031
其中,Ek表征第k次信息变更后的主动项数值,k≥0;Ek+1表征第k+1次信息变更后的主动项数值;ei表征第i个对象的数值变更结果;ωi(k+1)表征第k+1次信息变更后第i个对象的被动项数值;ωik表征第k次股权变更后第i个对象的被动项数值,
其中,
若ei<0,则确定对象对应的信息变更类型属于第二类,并对第i个对象的指标项信息进行第二类特征标记,
若ei≥0,则确定对象对应的信息变更类型属于第三类,对第i个对象的指标项信息进行第三类特征标记;
和/或,
该方法还包括:
在接收到携带有对象信息的检索请求时,基于所述结构化的数据,检索并提供与所述对象信息相关的其它信息。
7.一种信息变更指标监控装置,其特征在于,所述信息变更指标监控装置包括:
特征词库构建单元,用于构建信息变更语义特征词库;
信息变更分析单元,用于基于所述特征词库构建单元构建出的所述信息变更语义特征词库中的信息变更语义特征,对源信息进行股权变更分析;
指标监控单元,用于在所述信息变更分析单元的分析结果为所述源信息中包含指标项相关的信息变更时,根据所述信息变更中包含的对象名称,搜索与所述对象名称相匹配的指标项信息;在所述指标项信息中,搜索是否存在与所述信息变更中包含的变更明细相匹配的指标明细,如果否,则确定所述信息变更指标存在问题。
8.根据权利要求7所述的信息变更指标监控装置,其特征在于,该信息变更指标监控装置进一步包括:特征提取单元,其中,
所述特征提取单元,用于利用训练数据集和测试数据集,构建分类器,利用所述分类器提取信息变更语义特征,将提取出的所述信息变更语义特征存储到所述特征词库构建单元构建出的所述信息变更语义特征词库。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项权利要求所述信息变更指标监控方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至6中任一项权利要求所述信息变更指标监控方法的步骤。
CN201910814720.4A 2019-08-30 2019-08-30 信息变更指标监控方法、装置、计算机设备和存储介质 Pending CN110705307A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910814720.4A CN110705307A (zh) 2019-08-30 2019-08-30 信息变更指标监控方法、装置、计算机设备和存储介质
PCT/CN2020/087556 WO2021036317A1 (zh) 2019-08-30 2020-04-28 信息变更指标监控方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910814720.4A CN110705307A (zh) 2019-08-30 2019-08-30 信息变更指标监控方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110705307A true CN110705307A (zh) 2020-01-17

Family

ID=69193914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910814720.4A Pending CN110705307A (zh) 2019-08-30 2019-08-30 信息变更指标监控方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN110705307A (zh)
WO (1) WO2021036317A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460139A (zh) * 2020-03-02 2020-07-28 广州高新工程顾问有限公司 一种基于智慧管理的工程监理知识服务系统及方法
CN112131292A (zh) * 2020-09-16 2020-12-25 北京金堤征信服务有限公司 一种变更数据的结构化处理方法和装置
WO2021036317A1 (zh) * 2019-08-30 2021-03-04 深圳壹账通智能科技有限公司 信息变更指标监控方法、装置、计算机设备和存储介质
CN112768039A (zh) * 2020-12-31 2021-05-07 平安国际智慧城市科技股份有限公司 基于人工智能的信息监控方法、装置、计算机设备及介质
CN113191905A (zh) * 2021-04-23 2021-07-30 北京金堤征信服务有限公司 股东数据处理方法及装置、电子设备和可读存储介质
CN112131292B (zh) * 2020-09-16 2024-05-14 北京金堤征信服务有限公司 一种变更数据的结构化处理方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182463A (zh) * 2014-07-21 2014-12-03 安徽华贞信息科技有限公司 一种基于语义的文本分类方法
CN105975518B (zh) * 2016-04-28 2019-01-29 吴国华 基于信息熵的期望交叉熵特征选择文本分类系统及方法
CN109800600B (zh) * 2019-01-23 2020-11-24 中国海洋大学 面向保密需求的海洋大数据敏感度评估系统及防范方法
CN110705307A (zh) * 2019-08-30 2020-01-17 深圳壹账通智能科技有限公司 信息变更指标监控方法、装置、计算机设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021036317A1 (zh) * 2019-08-30 2021-03-04 深圳壹账通智能科技有限公司 信息变更指标监控方法、装置、计算机设备和存储介质
CN111460139A (zh) * 2020-03-02 2020-07-28 广州高新工程顾问有限公司 一种基于智慧管理的工程监理知识服务系统及方法
CN112131292A (zh) * 2020-09-16 2020-12-25 北京金堤征信服务有限公司 一种变更数据的结构化处理方法和装置
CN112131292B (zh) * 2020-09-16 2024-05-14 北京金堤征信服务有限公司 一种变更数据的结构化处理方法和装置
CN112768039A (zh) * 2020-12-31 2021-05-07 平安国际智慧城市科技股份有限公司 基于人工智能的信息监控方法、装置、计算机设备及介质
CN113191905A (zh) * 2021-04-23 2021-07-30 北京金堤征信服务有限公司 股东数据处理方法及装置、电子设备和可读存储介质

Also Published As

Publication number Publication date
WO2021036317A1 (zh) 2021-03-04

Similar Documents

Publication Publication Date Title
CN110705307A (zh) 信息变更指标监控方法、装置、计算机设备和存储介质
Kettenring The practice of cluster analysis
US7930242B2 (en) Methods and systems for multi-credit reporting agency data modeling
US9646077B2 (en) Time-series analysis based on world event derived from unstructured content
US20110106743A1 (en) Method and system to predict a data value
CN111767716A (zh) 企业多级行业信息的确定方法、装置及计算机设备
EP3608802A1 (en) Model variable candidate generation device and method
CN111666304A (zh) 数据处理装置、数据处理方法、存储介质与电子设备
CN112052396A (zh) 课程匹配方法、系统、计算机设备和存储介质
CN110968664A (zh) 一种文书检索方法、装置、设备及介质
US20180068017A1 (en) Providing known distribution patterns associated with specific measures and metrics
CN115063035A (zh) 基于神经网络的客户评估方法、系统、设备及存储介质
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
CN108734021B (zh) 一种基于去隐私数据的金融贷款大数据风险评估方法与系统
CN110389963A (zh) 基于大数据的渠道效果识别方法、装置、设备和存储介质
CN115204881A (zh) 一种数据处理方法、装置、设备及存储介质
US20210117448A1 (en) Iterative sampling based dataset clustering
CN107844874A (zh) 企业营运问题分析系统及其方法
CN109446318A (zh) 一种确定汽车维修文档主题的方法及相关设备
CN110737749B (zh) 创业计划评价方法、装置、计算机设备及存储介质
CN113505117A (zh) 基于数据指标的数据质量评估方法、装置、设备及介质
Olszak et al. Big Data Approach to Analyzing the IT Job Market
CN112734210A (zh) 一种智能分案方法及系统
Yang et al. Evaluation and assessment of machine learning based user story grouping: A framework and empirical studies
CN112950392A (zh) 信息展示方法、后验信息确定方法及装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination