CN111078828A - 一种企业历史信息抽取方法及系统 - Google Patents
一种企业历史信息抽取方法及系统 Download PDFInfo
- Publication number
- CN111078828A CN111078828A CN201911350383.4A CN201911350383A CN111078828A CN 111078828 A CN111078828 A CN 111078828A CN 201911350383 A CN201911350383 A CN 201911350383A CN 111078828 A CN111078828 A CN 111078828A
- Authority
- CN
- China
- Prior art keywords
- change
- items
- enterprise
- positions
- changed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 19
- 230000008859 change Effects 0.000 claims abstract description 172
- 238000012216 screening Methods 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000004075 alteration Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims 2
- 230000007717 exclusion Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 5
- 230000008520 organization Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种企业历史信息抽取方法及系统,该方法包括:对获取的企业变更信息进行合并;确定变更项的关键词;根据所述关键词从合并后的企业变更信息中筛选变更项;从筛选得到的变更项的变更内容中抽取企业历史信息。本发明利用企业变更信息中的数据,对企业的历史信息进行抽取,补充了企业知识图谱中的企业知识维度;不依赖于实时从互联网中采集数据,很好的解决了对于采集过程较短或没有保存每个采集时间片数据的项目中对于历史数据的需求问题。
Description
技术领域
本发明涉及企业知识图谱领域,具体涉及一种企业历史信息抽取方法及系统。
背景技术
在企业信息的分析中,企业历史数据是一个比较重要的衡量维度,而工商网站往往只会公布企业的部分变更记录,而不会公布其他维度的历史信息。如果不能对互联网上企业数据进行实时监控,或者采集启动时间较晚,很难获取到企业其他维度的历史数据。而如今大部分历史数据都是对企业数据进行实时监控,保存每个时间片上的数据,将历史时间上的股东、法人、高管直接保存得到企业历史数据。但是采集并保存每个时间片的企业数据会消耗大量的资源,对实时采集要求较高,且这种方法不适用于采集启动较晚的情景,或者中间采集一旦产生中断,这部分的历史数据都会永久丢失,因此该方法有局限性,不能广泛的适用。
发明内容
针对上述技术问题,本发明提供一种企业历史信息抽取方法及系统。
本发明解决上述技术问题的技术方案如下:一种企业历史信息抽取方法,包括:
对获取的企业变更信息进行合并;
确定变更项的关键词;
根据所述关键词从合并后的企业变更信息中筛选变更项;
从筛选得到的变更项的变更内容中抽取企业历史信息。。
本发明的有益效果是:利用企业变更信息中的数据,对企业的历史信息进行抽取,补充了企业知识图谱中的企业知识维度;不依赖于实时从互联网中采集数据,很好的解决了对于采集过程较短或没有保存每个采集时间片数据的项目中对于历史数据的需求问题。
为实现上述发明目的,本发明还提供一种企业历史信息抽取系统,包括:
信息合并模块,用于对获取的企业变更信息进行合并;
关键词确定模块,用于确定变更项的关键词;
变更项筛选模块,用于根据所述关键词从合并后的企业变更信息中筛选变更项;
信息抽取模块,用于从筛选得到的变更项的变更内容中抽取企业历史信息。
附图说明
图1为本发明实施例提供的一种企业历史信息抽取方法的流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的一种企业历史信息抽取方法的流程图,如图1所示,该方法包括:
S1、对获取的企业变更信息进行合并;
具体的,企业变更信息包括以下内容:变更日期,变更项,变更前内容和变更后内容,其内容在互联网上有公布出来。一般来说,该信息是只增不减的,但是互联网上的信息由于其不可控性,部分条目的数据可能会被删除,导致互联网上公布的数据可能并不是所有的变更信息数据。但是在抽取历史数据的时候,这些被删掉的,不再公布的数据也是有意义的,所以,在本地必须对这些数据进行保存,不能直接用互联网上公布的最新变更信息进行覆盖。那么,就有必要对本地保存的和互联网上公布的变更信息数据进行去重合并并保留在本地。
本方法使用变更日期+变更项作为主键进行合并去重。一般来说,排除部分特殊情况(经调研,这部分的数据一般是无意义的),同一日的同一中变更项只会出现一条变更信息。比如一家企业的变更日期为“2019-11-01”,变更项为“法定代表人变更”一般只会出现一条,不会在这一日连续发生两次法定代表人变更。首先对变更日期进行规范化,将各种类型的日期格式统一转化为“YYYY-mm-dd”类型的字符串,无法转化的直接置空。然后将变更日期+变更项拼接起来作为键,对相同键的内容进行去重保存即可。
S2、确定变更项的关键词;
具体的,例如,要从变更信息中分别抽取企业历史股东、法人及高管等信息,首先要知道哪些条信息中包含这些信息。一般来说,这些信息在变更项中会有提及,变更信息的变更项内容一般为“地址变更(住所地址、经营场所、驻在地址等变更)”、“企业类型变更”、“投资人变更(包括出资额、出资方式、出资日期、投资人名称等)”、“股东变更”、“负责人变更”等内容,但是属于较为规整的信息,其中还会有一些不太规范的信息,因此需要从这些信息中通过关键字找到需要的变更条目。
企业股东、法人、高管的变更一般会有各自的关键词,比如股东的变更项里可能会包含“股东”、“投资人”等关键词,同理法人和高管变更项也会各自的关键词。
首先,需要人工分别筛选出股东、法人和高管变更项种子词。
通过训练得到词向量模型(Word Embedding),遍历所有变更项,找到所有包含种子词的变更项,通过同位词找到种子词的近义词,确定与种子词互为近义词的相似度边界。
然后,再度遍历所有变更项,找到所有种子词的近义词,经过人工筛选,找到最终代表股东、法人及高管的关键词集合。
最后,再次遍历所有变更项,查找包含关键词集合的变更项,人工选出无用变更项,比如“股东电话变更”,“主管部门法人变更”,再筛选出非关键词集合。
S3、根据所述关键词从合并后的企业变更信息中筛选变更项;
具体的,获取到变更项关键词后,就可以从企业的变更信息的条目中找到与企业股东、法人及高管变更相关的条目。主要的方法如下:
首先,要对变更项进行预处理,同时对变更前内容和变更后内容进行预处理方便下一步的提取。包括剔除出变更项中的部分乱码及多余的空格,抽取出有效的中英文字符及标点。
然后,对变更项进行解析,使用上一步提取的关键词集合和非关键词集合判断是否为股东、法人及高管变更的变更项。具体步骤是:分别判断这三种类型的变更,这里以股东为例,如果变更项中出现了股东非关键字集合中的任何一个词,则该条变更不属于股东变更;如果变更项中没有出现股东非关键字结合中的任何一个词,并且至少也只要出现一个股东关键字集合中的词,则该条变更数据股东变更;当然,如果变更项中没有出现股东关键字集合中的任何一个词,则也不属于股东变更。法人及高管变更同理,且同一条变更项可能属于股东、法人及高管变更中的一项或多项。例:如果一条变更的变更项为“新增投资人及高管”,则该条变更既属于股东变更,也属于高管变更。
S4、从筛选得到的变更项的变更内容中抽取企业历史信息。
具体的,该步骤包括以下两方面的内容:
(1)历史信息实体抽取:
从众多变更条目中抽取出要处理的股东、法人及高管的变更条目后,就要对变更条目中的变更前内容和变更后内容进行解析,抽取出变更前后分别对应哪些自然人或组织。实体识别系统有较为成熟的解决方案,可以使用基于条件随机场、隐马尔可夫模型和支持向量机等方法进行抽取,不属于本发明范围内,不再赘述。
(2)高管职位抽取:
特殊的,对于历史高管的抽取,如果能识别出高管对应的职位或角色(以下统称职位),则还要对高管职位进行抽取。这里的高管含义较为广泛,包括董事、监事、其他高级管理人员等。
首先,要从高管变更内容中筛选出所有可能包括的职位,以下筛选出了变更内容中可能会出现的职位:董事长兼总经理,董事长或执行董事成员,执行董事兼总经理,董事长,执行董事,董事成员,董事,总经理,董监事,监事,高级管理人员,管理人员,高管,联合管理委员会委员,法定代表人。
然后,分别对变更前和变更后内容分别进行抽取。职位信息的出现通常有两种形式,一种是与职位对应的人或组织成对出现,比如:“张三,董事;李四,总经理;赵武,监事;王文,董事”;另一种是出现在变更项信息中,比如:变更项为“董事变更”,变更前后内容都只有一个人或者组织名。
已知要抽取的内容content和已经在上一步得到的人和组织的实体列表entities。如果entities列表中只有一个元素,那么是相对简单的,只要抽取该人或组织对应的职位即可。将变更项和content进行拼接,从拼接后的内容中搜索关键字得到所有职位,然后将这些职位用逗号连接起来作为这个人或组织的职位即可。如果entities列表中有大于1个的元素,则使用标点符号对content进行分割,得到内容列表content_list,判断分割后列表的元素中有多少包含职位信息。分为以下几种情况:
a)如果没有元素为职位信息,则有可能是上述的后一种情况,即职位信息包含在变更项中,则将变更项和content进行拼接。从拼接后的内容中得到所有职位,然后将这些职位用逗号连接起来作为所有实体列表中实体的对应职位即可。
b)如果只有一个元素为职位信息,则将实体列表中所有的实体都给定该职位即可。
c)复杂的是多个实体对应多个职位的情况。较为严格的做法是,如果实体数量和职位数量不同,则认为职位识别失败,不给定职位;当实体数量与职位数量相同时:
i.对content_list进行遍历,得到每个元素的属性,P代表该元素为职位,N代表该元素为实体,O代表该元素既不是职位也不是实体。则上述“张三,董事;李四,总经理;赵武,监事;王文,董事”经过分割得到的列表为[N,P,N,P,N,P]。
ii.如果第一个N出现在第一个P之前,每个N的职位为其后面最近的一个P,如果后面没有元素则往前取;反之依旧,每个N的职位为其前面最近的一个P。
d)较为不严格的做法是,不判断实体数量与职位数量是否相同,直接对content_list进行遍历,得到NPO列表。然后同上,如果第一个N出现在第一个P之前,每个N的职位为其后面最近的一个P,如果后面没有元素则往前取;反之,每个N的职位为其前面最近的一个P。这种方法识别率高,同时识别的错误率也较高,两种方法看使用场景而定。
c)和d)的方法实际是依次将筛选得到的变更项的变更内容中相邻的职位和实体一一对应。
到此,高管的对应职位即抽取完毕。
本发明实施例提供一种企业历史信息抽取系统,包括:
信息合并模块,用于对获取的企业变更信息进行合并;
关键词确定模块,用于确定变更项的关键词;
变更项筛选模块,用于根据所述关键词从合并后的企业变更信息中筛选变更项;
信息抽取模块,用于从筛选得到的变更项的变更内容中抽取企业历史信息。
本发明利用企业变更信息中的数据,对企业的历史数据,主要是历史股东,法人及高管数据进行抽取,补充了企业知识图谱中的企业知识维度。本发明不依赖于实时从互联网中采集数据,很好的解决了对于采集过程较短或没有保存每个采集时间片数据的项目中对于历史数据的需求问题。本发明首先阐述了一种企业变更信息合并的方法,然后从获取到的所有变更信息中对变更项进行抽取,获取到企业股东、法人及高管的关键字,然后利用实体识别功能对历史信息中变更前后的自然人及组织(企业)进行识别,获得变更前后的股东、法人及高管,其中还会对历史高管进行一次职位的识别。本发明不依赖于大量的历史时间片数据,便可以抽取到有效的历史数据信息。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述系统实施例中的模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种企业历史信息抽取方法,其特征在于,包括:
对获取的企业变更信息进行合并;
确定变更项的关键词;
根据所述关键词从合并后的企业变更信息中筛选变更项;
从筛选得到的变更项的变更内容中抽取企业历史信息。
2.根据权利要求1所述的一种企业历史信息抽取方法,其特征在于,所述对获取的企业变更信息进行合并,具体包括:
将变更日期和变更项拼接起来作为键;
对获取的企业变更信息中相同键的内容进行去重合并。
3.根据权利要求1所述的一种企业历史信息抽取方法,其特征在于,所述确定变更项的关键词,具体包括:
通过训练得到词向量模型,遍历所有变更项,找到所有包含预设的种子词的变更项,通过同位词找到所述种子词的近义词,确定与种子词互为近义词的相似度边界;
遍历所有变更项,通过所述相似度边界找到所有所述种子词的近义词,得到关键词集合;
遍历所有变更项,查找包含所述关键词集合中的关键词的变更项,从查找到的变更项中选出无用变更项,再从所述无用变更项中筛选出非关键词集合。
4.根据权利要求3所述的一种企业历史信息抽取方法,其特征在于,所述根据所述关键词从合并后的企业变更信息中筛选变更项,具体包括:
如果变更项中出现了非关键字集合中的任何一个词或者没有出现关键词集合中的任何一个词,则排除该变更项;
如果变更项中没有出现非关键字集合中的任何一个词,并且至少出现一个关键字集合中的词,则选择该变更项。
5.根据权利要求1至4任一项所述的一种企业历史信息抽取方法,其特征在于,所述从筛选得到的变更项的变更内容中抽取企业历史信息,具体包括:
对筛选得到的变更项中的变更内容进行解析,抽取出变更前后分别对应的自然人和组织的实体列表;
当所述实体列表中的实体的数量为1时,根据预设的职位关键词筛选出所述筛选得到的变更项及其变更内容中的所有职位,将筛选得到的所有职位作为所述实体列表中实体的对应职位;
当所述实体列表中的实体的数量大于1时,根据预设的职位关键词筛选所述筛选得到的变更项的变更内容中的职位,其中,
当所述筛选得到的变更项的变更内容中的职位的数量为0时,根据预设的职位关键词筛选出所述筛选得到的变更项中的职位,将筛选得到的职位作为所述实体列表中所有实体的对应职位;
当所述筛选得到的变更项的变更内容中的职位的数量为1时,将筛选得到的职位作为所述实体列表中所有实体的对应职位;
当所述筛选得到的变更项的变更内容中的职位的数量大于1且与实体的数量相同时,依次将所述筛选得到的变更项的变更内容中相邻的职位和实体一一对应。
6.一种企业历史信息抽取系统,其特征在于,包括:
信息合并模块,用于对获取的企业变更信息进行合并;
关键词确定模块,用于确定变更项的关键词;
变更项筛选模块,用于根据所述关键词从合并后的企业变更信息中筛选变更项;
信息抽取模块,用于从筛选得到的变更项的变更内容中抽取企业历史信息。
7.根据权利要求6所述的一种企业历史信息抽取系统,其特征在于,所述信息合并模块,具体包括:
拼接单元,用于将变更日期和变更项拼接起来作为键;
合并单元,用于对获取的企业变更信息中相同键的内容进行去重合并。
8.根据权利要求6所述的一种企业历史信息抽取系统,其特征在于,所述关键词确定模块,具体包括:
边界确定单元,用于通过训练得到词向量模型,遍历所有变更项,找到所有包含预设的种子词的变更项,通过同位词找到所述种子词的近义词,确定与种子词互为近义词的相似度边界;
关键词确定单元,用于遍历所有变更项,通过所述相似度边界找到所有所述种子词的近义词,得到关键词集合;
非关键词确定单元,用于遍历所有变更项,查找包含所述关键词集合中的关键词的变更项,从查找到的变更项中选出无用变更项,再从所述无用变更项中筛选出非关键词集合。
9.根据权利要求8所述的一种企业历史信息抽取方法,其特征在于,所述变更项筛选模块,具体包括:
变更项排除单元,用于如果变更项中出现了非关键字集合中的任何一个词或者没有出现关键词集合中的任何一个词,则排除该变更项;
变更项选择单元,用于如果变更项中没有出现非关键字集合中的任何一个词,并且至少出现一个关键字集合中的词,则选择该变更项。
10.根据权利要求6至9任一项所述的一种企业历史信息抽取系统,其特征在于,所述信息抽取模块,具体包括:
实体抽取单元,用于对筛选得到的变更项中的变更内容进行解析,抽取出变更前后分别对应的自然人和组织的实体列表;
职位抽取单元,用于当所述实体列表中的实体的数量为1时,根据预设的职位关键词筛选出所述筛选得到的变更项及其变更内容中的所有职位,将筛选得到的所有职位作为所述实体列表中实体的对应职位;
当所述实体列表中的实体的数量大于1时,根据预设的职位关键词筛选所述筛选得到的变更项的变更内容中的职位,其中,
当所述筛选得到的变更项的变更内容中的职位的数量为0时,根据预设的职位关键词筛选出所述筛选得到的变更项中的职位,将筛选得到的职位作为所述实体列表中所有实体的对应职位;
当所述筛选得到的变更项的变更内容中的职位的数量为1时,将筛选得到的职位作为所述实体列表中所有实体的对应职位;
当所述筛选得到的变更项的变更内容中的职位的数量大于1且与实体的数量相同时,依次将所述筛选得到的变更项的变更内容中相邻的职位和实体一一对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911350383.4A CN111078828A (zh) | 2019-12-24 | 2019-12-24 | 一种企业历史信息抽取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911350383.4A CN111078828A (zh) | 2019-12-24 | 2019-12-24 | 一种企业历史信息抽取方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111078828A true CN111078828A (zh) | 2020-04-28 |
Family
ID=70317349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911350383.4A Pending CN111078828A (zh) | 2019-12-24 | 2019-12-24 | 一种企业历史信息抽取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111078828A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592274A (zh) * | 2021-07-23 | 2021-11-02 | 新奥数能科技有限公司 | 一种企业扩展方法和装置 |
CN114154495A (zh) * | 2021-12-03 | 2022-03-08 | 海南港航控股有限公司 | 一种基于关键词匹配的实体抽取方法及系统 |
CN114896423A (zh) * | 2022-06-17 | 2022-08-12 | 哈尔滨工业大学 | 一种企业基本信息知识图谱的构建方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004192246A (ja) * | 2002-12-10 | 2004-07-08 | T & T Ltd | 履歴情報公開システム |
US20070100712A1 (en) * | 2005-10-28 | 2007-05-03 | Bank Of America Corporation | System and method for facilitating the implementation of changes to the configuration of resources in an enterprise |
US20070136396A1 (en) * | 2005-12-13 | 2007-06-14 | International Business Machines Corporation | Apparatus, system, and method for synchronizing change histories in enterprise applications |
CN106021369A (zh) * | 2016-05-11 | 2016-10-12 | 上海佳依佳信息科技有限公司 | 一种用于数据变更管理的方法与设备 |
CN108399240A (zh) * | 2018-02-28 | 2018-08-14 | 北京金堤科技有限公司 | 企业变更信息数据挖掘方法和系统 |
CN109271400A (zh) * | 2018-09-13 | 2019-01-25 | 江苏站企动网络科技有限公司 | 一种企业信息查询追踪系统 |
-
2019
- 2019-12-24 CN CN201911350383.4A patent/CN111078828A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004192246A (ja) * | 2002-12-10 | 2004-07-08 | T & T Ltd | 履歴情報公開システム |
US20070100712A1 (en) * | 2005-10-28 | 2007-05-03 | Bank Of America Corporation | System and method for facilitating the implementation of changes to the configuration of resources in an enterprise |
US20070136396A1 (en) * | 2005-12-13 | 2007-06-14 | International Business Machines Corporation | Apparatus, system, and method for synchronizing change histories in enterprise applications |
CN106021369A (zh) * | 2016-05-11 | 2016-10-12 | 上海佳依佳信息科技有限公司 | 一种用于数据变更管理的方法与设备 |
CN108399240A (zh) * | 2018-02-28 | 2018-08-14 | 北京金堤科技有限公司 | 企业变更信息数据挖掘方法和系统 |
CN109271400A (zh) * | 2018-09-13 | 2019-01-25 | 江苏站企动网络科技有限公司 | 一种企业信息查询追踪系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592274A (zh) * | 2021-07-23 | 2021-11-02 | 新奥数能科技有限公司 | 一种企业扩展方法和装置 |
CN114154495A (zh) * | 2021-12-03 | 2022-03-08 | 海南港航控股有限公司 | 一种基于关键词匹配的实体抽取方法及系统 |
CN114896423A (zh) * | 2022-06-17 | 2022-08-12 | 哈尔滨工业大学 | 一种企业基本信息知识图谱的构建方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460014B (zh) | 企业实体的识别方法、装置、计算机设备及存储介质 | |
CN108399240B (zh) | 企业变更信息数据挖掘方法和系统 | |
US11663254B2 (en) | System and engine for seeded clustering of news events | |
Quick et al. | Big forensic data reduction: digital forensic images and electronic evidence | |
US10417265B2 (en) | High performance parallel indexing for forensics and electronic discovery | |
CN110851598B (zh) | 文本分类方法、装置、终端设备及存储介质 | |
US10169730B2 (en) | System and method to present a summarized task view in a case management system | |
KR101681109B1 (ko) | 대표 색인어와 유사도를 이용한 문서 자동 분류 방법 | |
CN111078828A (zh) | 一种企业历史信息抽取方法及系统 | |
US20130006996A1 (en) | Clustering E-Mails Using Collaborative Information | |
CN114911917B (zh) | 资产元信息搜索方法、装置、计算机设备及可读存储介质 | |
CN110110325B (zh) | 一种重复案件查找方法和装置、计算机可读存储介质 | |
US10585869B2 (en) | System and method for generating, maintaining, and querying a database for computer investigations | |
US20170300561A1 (en) | Associating insights with data | |
CN111078839A (zh) | 一种用于裁判文书的结构化处理方法及处理装置 | |
CN111813898A (zh) | 基于语义搜索的专家推荐方法、装置、设备及存储介质 | |
US11941565B2 (en) | Citation and policy based document classification | |
US20120254166A1 (en) | Signature Detection in E-Mails | |
CN112364603A (zh) | 指标编码生成方法、装置、设备及存储介质 | |
CN110705297A (zh) | 一种企业曾用名识别方法、系统、介质及设备 | |
CN107169065B (zh) | 一种特定内容的去除方法和装置 | |
US10824803B2 (en) | System and method for logical identification of differences between spreadsheets | |
CN115858470A (zh) | 政策法规文件的匹配方法、系统、服务器及存储介质 | |
CN106528590B (zh) | 一种查询方法及设备 | |
CN111428037B (zh) | 一种分析行为政策匹配性的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200428 |