CN107291812A - 一种对企业信息中自然语义的专家学习拟合方法及系统 - Google Patents
一种对企业信息中自然语义的专家学习拟合方法及系统 Download PDFInfo
- Publication number
- CN107291812A CN107291812A CN201710354038.2A CN201710354038A CN107291812A CN 107291812 A CN107291812 A CN 107291812A CN 201710354038 A CN201710354038 A CN 201710354038A CN 107291812 A CN107291812 A CN 107291812A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- vocabulary
- company information
- feature
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种对企业信息中自然语义的专家学习拟合方法及系统,包括:爬取互联网上的企业名称和企业信息;对获取的企业信息进行分词操作;建立企业搜索网站,允许用户输入企业名称或关键词进行搜索,检测用户点击的词汇,并自动启动对该词汇的搜索;统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典;将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图;根据企业之间的关联关系图,搜索出与该企业相关的业务关联企业。本发明引入专家交互学习系统,学习到有关产业链结构的知识,进而自动拟合出相关企业之间的产业链结构。
Description
技术领域
本发明涉及计算机网络技术领域,特别涉及一种对企业信息中自然语义的专家学习拟合方法及系统。
背景技术
现有的企业信息综合网站,大都是对企业信息的简单罗列,并且是主要针对单一企业的信息汇总和分析。现有技术的缺点是存在缺少一种对企业之间的相互关系进行分析的方式。其中,如何分析各个企业的基本信息,然后通过自然语义的方式对企业信息的含义进行识别,以实现计算机自动化对该企业关系分析,是当前需要解决的技术问题。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的目的在于提出一种对企业信息中自然语义的专家学习拟合方法及系统。
为了实现上述目的,本发明的实施例提供一种对企业信息中自然语义的专家学习拟合方法,包括:
步骤S1,爬取互联网上的企业名称和企业信息;
步骤S2,对获取的企业信息进行分词操作;
步骤S3,建立企业搜索网站,允许用户输入企业名称或关键词进行搜索,在向用户显示企业时,将分词信息嵌入到企业介绍中,以在接收到用户的点击操作时,检测用户点击的词汇,并自动启动对该词汇的搜索;
步骤S4,统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,所述字典记录有该企业的产业链特征词汇;
步骤S5,将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图;
步骤S6,根据所述企业之间的关联关系图,搜索出与该企业相关的业务关联企业。
进一步,在所述步骤S1中,爬取的数据源包括:企业官网、广告黄页、行业门户。
进一步,在所述步骤S2中,采用字典匹配法、词频统计法进行分词操作。
进一步,在所述步骤S4中,将点击频率高的词汇以特殊标记进行突出显示。
进一步,在所述步骤S5中,所述企业之间共同的特征包括:多个企业的特征词汇中的相同词汇或近义词。
本发明实施例还提供一种对企业信息中自然语义的专家学习拟合系统,包括:爬取模块,用于爬取互联网上的企业名称和企业信息;分词模块,用于爬取的企业信息进行分词操作;词汇搜索模块,用于建立企业搜索网站,并运行用户输入企业名称或关键词进行搜索,在向用户显示企业时,将分词信息嵌入到企业介绍中,并在接收到用户的点击操作时,检测用户点击的词汇,自动启动对该词汇的搜索;过滤及字典建立模块,用于统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,其中,所述字典记录有该企业的产业链特征词汇;关联关系图建立模块,用于将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图;关联企业搜索模块,用于根据所述企业之间的关联关系图,搜索出与该企业相关的业务关联企业。
进一步,所述爬取模块爬取的数据源包括:企业官网、广告黄页、行业门户。
进一步,所述过滤及字典建立模块用于采用字典匹配法、词频统计法进行分词操作。
进一步,所述过滤及字典建立模块用于将点击频率高的词汇以特殊标记进行突出显示。
进一步,在所述步骤S5中,所述企业之间共同的特征包括:多个企业的特征词汇中的相同词汇或近义词。
根据本发明实施例的对企业信息中自然语义的专家学习拟合方法及系统,通过建立计算机和专家交互学习系统,使得计算机能够以较高的准确率从企业介绍文本中识别出描述该企业特征的词汇,进而根据这些特征词汇构造企业与企业之间的关联关系,然后再次引入专家交互学习系统,使得计算机能够学习到有关产业链结构的知识,进而自动拟合出相关企业之间的产业链结构,即上下游关系和竞争关系。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的对企业信息中自然语义的专家学习拟合方法的流程图;
图2为根据本发明实施例的对企业信息中自然语义的专家学习拟合系统的结构图;
图3为根据本发明实施例的新的搜索的示意图;
图4为根据本发明实施例的业务关联企业的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
如图1所示,本发明实施例的对企业信息中自然语义的专家学习拟合方法,包括如下步骤:
步骤S1,爬取互联网上的企业名称和企业信息。
在本发明的一个实施例中,爬取的数据源包括:企业官网、广告黄页、行业门户等。需要说明的是,爬取的数据源不限于上述举例,还可以为其他数据源,在此不再赘述。
步骤S2,对获取的企业信息进行分词操作。在本步骤中,采用字典匹配法、词频统计法进行分词操作。
下面分别对两种分词方法进行说明。
(1)字典匹配法:字典法是根据字典中的词汇逐个到文本中查找,查找命中就记录为一个词。
(2)词频统计法:词频法不依赖字典,而是计算文本中任意两个字同时出现的频率进行统计,频率计算以大量自然文本为语料库,同时出现频率高的字成为词的可能性较大。分词完成后需要去除助词、副词、连接词等等无意义词,依赖现有通用字典完成。另外还需要建立自己的自定义词典,将在企业搜索环境中意义不大的词也去除掉,例如“有限”、“公司”、“创新”等词。
步骤S3,建立企业搜索网站,允许用户输入企业名称或关键词进行搜索。网站能够无广告干扰地、清晰明确地输出相关企业的介绍以及官方网站。这个应用对关注企业创新和产业链形势的专家来说是非常有意义的,可以节约大量时间。
在向用户显示企业时,将分词信息嵌入到企业介绍中,以在接收到用户的点击操作时,检测用户点击的词汇,并自动启动对该词汇的搜索。即,用户可以点击介绍文本中的词汇发起一个新的搜索。
如图3所示,显示分词界面,包括多个分词信息。如果用户(专家)点击“移动通讯”则系统会自动发起一个新的搜索,这个操作方便了专家发起新的查询,查询与当前企业相关的其它企业。
步骤S4,统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,字典记录有该企业的产业链特征词汇。
在本步骤中,将点击频率高的词汇以特殊标记进行突出显示。
如图3所示,对于分词中有些显然不属于企业特征,例如“统一”、“开放”、“创新奖”等等,专家们点击这些词发起新的查询的概率显然比较低。而“移动通讯”、“数码电子”、“照明”、“手机制造商”等等词汇被点击的概率会比较高。因此通过统计专家点击词的频率就可以过滤出该企业的特征词汇,当点击次数足够多时就可以建立出一个新的字典,这个字典列举出了产业链特征词汇,并且会被不断丰富完善。计算机在分词之后可以把这个字典中出现的词以较高的亮度显示出来,甚至只显示字典中出现的词。
步骤S5,将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图。
需要说明的是,企业之间共同的特征包括:多个企业的特征词汇中的相同词汇或近义词。即,共同特征不限于完全相同的企业特征词汇,还可以为意义较为相近的特征词汇,具体如何判断是否为近义词可以通过现有的查找近义词的算法获取,在此不再赘述。
步骤S6,根据企业之间的关联关系图,搜索出与该企业相关的业务关联企业。
在本步骤中,将企业之间共同的特征词作为连接点连接不同的企业,形成企业之间的关联关系。如图4所示,通过查询该图可以帮助专家快速搜索到业务关联企业。
参考图4,公司1包括特征词1、2、3、6、9;公司2包括特征词2、3、4、5、6、7;公司3包括特征词6、7、8、9。从图中,可以清楚的看出,公司1与公司2的特征词交集为特征词2和3,公司1和公司3的特征词交集为特征词6和9,公司2和3的特征词交集为特征词7。从上述公司之间的特征词关系,可以快速判断出企业之间的相互关系,并进而通过结构化加工就可以更加清晰地显示竞争关系和上下游关系。
如图2所示,本发明实施例的对企业信息中自然语义的专家学习拟合系统,包括:爬取模块1、分词模块2、词汇搜索模块3、过滤及字典建立模块4、关联关系图建立模块5和关联企业搜索模块6。
具体的,爬取模块1用于爬取互联网上的企业名称和企业信息。
在本发明的一个实施例中,爬取模块1爬取的数据源包括:企业官网、广告黄页、行业门户。需要说明的是,爬取的数据源不限于上述举例,还可以为其他数据源,在此不再赘述。
分词模块2用于爬取的企业信息进行分词操作。下面分别对两种分词方法进行说明。
(1)字典匹配法:字典法是根据字典中的词汇逐个到文本中查找,查找命中就记录为一个词。
(2)词频统计法:词频法不依赖字典,而是计算文本中任意两个字同时出现的频率进行统计,频率计算以大量自然文本为语料库,同时出现频率高的字成为词的可能性较大。分词完成后需要去除助词、副词、连接词等等无意义词,依赖现有通用字典完成。另外还需要建立自己的自定义词典,将在企业搜索环境中意义不大的词也去除掉,例如“有限”、“公司”、“创新”等词。
词汇搜索模块3用于建立企业搜索网站,允许用户输入企业名称或关键词进行搜索。网站能够无广告干扰地、清晰明确地输出相关企业的介绍以及官方网站。这个应用对关注企业创新和产业链形势的专家来说是非常有意义的,可以节约大量时间。
词汇搜索模块3在向用户显示企业时,将分词信息嵌入到企业介绍中,以在接收到用户的点击操作时,检测用户点击的词汇,并自动启动对该词汇的搜索。即,用户可以点击介绍文本中的词汇发起一个新的搜索。
词汇搜索模块3用于统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,其中,字典记录有该企业的产业链特征词汇。
如图3所示,显示分词界面,包括多个分词信息。如果用户(专家)点击“移动通讯”则系统会自动发起一个新的搜索,这个操作方便了专家发起新的查询,查询与当前企业相关的其它企业。
具体地,过滤及字典建立模块4用于统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,字典记录有该企业的产业链特征词汇。
在本发明的一个实施例中,过滤及字典建立模块4用于将点击频率高的词汇以特殊标记进行突出显示。
如图3所示,对于分词中有些显然不属于企业特征,例如“统一”、“开放”、“创新奖”等等,专家们点击这些词发起新的查询的概率显然比较低。而“移动通讯”、“数码电子”、“照明”、“手机制造商”等等词汇被点击的概率会比较高。因此通过统计专家点击词的频率就可以过滤出该企业的特征词汇,当点击次数足够多时就可以建立出一个新的字典,这个字典列举出了产业链特征词汇,并且会被不断丰富完善。计算机在分词之后可以把这个字典中出现的词以较高的亮度显示出来,甚至只显示字典中出现的词。
关联关系图建立模块5用于将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图。
需要说明的是,企业之间共同的特征包括:多个企业的特征词汇中的相同词汇或近义词。即,共同特征不限于完全相同的企业特征词汇,还可以为意义较为相近的特征词汇,具体如何判断是否为近义词可以通过现有的查找近义词的算法获取,在此不再赘述。
关联企业搜索模块6用于根据企业之间的关联关系图,搜索出与该企业相关的业务关联企业。
关联企业搜索模块6将企业之间共同的特征词作为连接点连接不同的企业,形成企业之间的关联关系。如图4所示,通过查询该图可以帮助专家快速搜索到业务关联企业。
参考图4,公司1包括特征词1、2、3、6、9;公司2包括特征词2、3、4、5、6、7;公司3包括特征词6、7、8、9。从图中,可以清楚的看出,公司1与公司2的特征词交集为特征词2和3,公司1和公司3的特征词交集为特征词6和9,公司2和3的特征词交集为特征词7。从上述公司之间的特征词关系,可以快速判断出企业之间的相互关系,并进而通过结构化加工就可以更加清晰地显示竞争关系和上下游关系。
根据本发明实施例的对企业信息中自然语义的专家学习拟合方法及系统,通过建立计算机和专家交互学习系统,使得计算机能够以较高的准确率从企业介绍文本中识别出描述该企业特征的词汇,进而根据这些特征词汇构造企业与企业之间的关联关系,然后再次引入专家交互学习系统,使得计算机能够学习到有关产业链结构的知识,进而自动拟合出相关企业之间的产业链结构,即上下游关系和竞争关系。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。
Claims (10)
1.一种对企业信息中自然语义的专家学习拟合方法,其特征在于,包括如下步骤:
步骤S1,爬取互联网上的企业名称和企业信息;
步骤S2,对获取的企业信息进行分词操作;
步骤S3,建立企业搜索网站,允许用户输入企业名称或关键词进行搜索,在向用户显示企业时,将分词信息嵌入到企业介绍中,以在接收到用户的点击操作时,检测用户点击的词汇,并自动启动对该词汇的搜索;
步骤S4,统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,所述字典记录有该企业的产业链特征词汇;
步骤S5,将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图;
步骤S6,根据所述企业之间的关联关系图,搜索出与该企业相关的业务关联企业。
2.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法,其特征在于,在所述步骤S1中,爬取的数据源包括:企业官网、广告黄页、行业门户。
3.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法,其特征在于,在所述步骤S2中,采用字典匹配法、词频统计法进行分词操作。
4.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法,其特征在于,在所述步骤S4中,将点击频率高的词汇以特殊标记进行突出显示。
5.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法,其特征在于,在所述步骤S5中,所述企业之间共同的特征包括:多个企业的特征词汇中的相同词汇或近义词。
6.一种对企业信息中自然语义的专家学习拟合系统,其特征在于,包括:
爬取模块,用于爬取互联网上的企业名称和企业信息;
分词模块,用于爬取的企业信息进行分词操作;
词汇搜索模块,用于建立企业搜索网站,并运行用户输入企业名称或关键词进行搜索,在向用户显示企业时,将分词信息嵌入到企业介绍中,并在接收到用户的点击操作时,检测用户点击的词汇,自动启动对该词汇的搜索;
过滤及字典建立模块,用于统计用户对各个词语的点击频率,过滤出点击频率高的多个词汇作为该企业的特征词汇,并利用上述词汇创立一个新型的字典,其中,所述字典记录有该企业的产业链特征词汇;
关联关系图建立模块,用于将企业之间共同的特征作为连接点,连接不同的企业,以形成企业之间的关联关系图;
关联企业搜索模块,用于根据所述企业之间的关联关系图,搜索出与该企业相关的业务关联企业。
7.如权利要求6所述的对企业信息中自然语义的专家学习拟合系统,其特征在于,所述爬取模块爬取的数据源包括:企业官网、广告黄页、行业门户。
8.如权利要求6所述的对企业信息中自然语义的专家学习拟合系统,其特征在于,所述过滤及字典建立模块用于采用字典匹配法、词频统计法进行分词操作。
9.如权利要求6所述的对企业信息中自然语义的专家学习拟合系统,其特征在于,所述过滤及字典建立模块用于将点击频率高的词汇以特殊标记进行突出显示。
10.如权利要求6所述的对企业信息中自然语义的专家学习拟合系统,其特征在于,所述关联关系图建立模块定位所述企业之间共同的特征包括:多个企业的特征词汇中的相同词汇或近义词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710354038.2A CN107291812A (zh) | 2017-05-18 | 2017-05-18 | 一种对企业信息中自然语义的专家学习拟合方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710354038.2A CN107291812A (zh) | 2017-05-18 | 2017-05-18 | 一种对企业信息中自然语义的专家学习拟合方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107291812A true CN107291812A (zh) | 2017-10-24 |
Family
ID=60094090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710354038.2A Pending CN107291812A (zh) | 2017-05-18 | 2017-05-18 | 一种对企业信息中自然语义的专家学习拟合方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107291812A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764775A (zh) * | 2018-04-18 | 2018-11-06 | 济南数据时光信息科技有限公司 | 一种基于地理位置的上下游供应链显示系统 |
CN109299362A (zh) * | 2018-09-21 | 2019-02-01 | 平安科技(深圳)有限公司 | 相似企业推荐方法、装置、计算机设备及存储介质 |
CN109376280A (zh) * | 2018-09-28 | 2019-02-22 | 苏州朗动网络科技有限公司 | 企业关系的查询方法、装置、计算机设备及存储介质 |
CN110321351A (zh) * | 2019-07-05 | 2019-10-11 | 云南电网有限责任公司电力科学研究院 | 一种基于模糊匹配的厂家名称规范方法 |
CN111104791A (zh) * | 2019-11-14 | 2020-05-05 | 北京金堤科技有限公司 | 行业信息获取方法和装置、电子设备和介质 |
CN112632357A (zh) * | 2020-12-28 | 2021-04-09 | 中金数据(武汉)超算技术有限公司 | 一种基于云平台的海量数据关联管理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1079315A3 (en) * | 1999-08-26 | 2003-02-12 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
CN103699645A (zh) * | 2013-12-26 | 2014-04-02 | 中国人民银行征信中心 | 企业关联关系识别系统及其识别方法 |
CN105512245A (zh) * | 2015-11-30 | 2016-04-20 | 青岛智能产业技术研究院 | 一种基于回归模型建立企业画像的方法 |
CN105912579A (zh) * | 2016-04-01 | 2016-08-31 | 东软集团股份有限公司 | 一种人物关系图谱的生成方法及装置 |
CN105975491A (zh) * | 2016-04-26 | 2016-09-28 | 重庆誉存企业信用管理有限公司 | 企业新闻分析方法及系统 |
-
2017
- 2017-05-18 CN CN201710354038.2A patent/CN107291812A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1079315A3 (en) * | 1999-08-26 | 2003-02-12 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
CN103699645A (zh) * | 2013-12-26 | 2014-04-02 | 中国人民银行征信中心 | 企业关联关系识别系统及其识别方法 |
CN105512245A (zh) * | 2015-11-30 | 2016-04-20 | 青岛智能产业技术研究院 | 一种基于回归模型建立企业画像的方法 |
CN105912579A (zh) * | 2016-04-01 | 2016-08-31 | 东软集团股份有限公司 | 一种人物关系图谱的生成方法及装置 |
CN105975491A (zh) * | 2016-04-26 | 2016-09-28 | 重庆誉存企业信用管理有限公司 | 企业新闻分析方法及系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764775A (zh) * | 2018-04-18 | 2018-11-06 | 济南数据时光信息科技有限公司 | 一种基于地理位置的上下游供应链显示系统 |
CN109299362A (zh) * | 2018-09-21 | 2019-02-01 | 平安科技(深圳)有限公司 | 相似企业推荐方法、装置、计算机设备及存储介质 |
CN109299362B (zh) * | 2018-09-21 | 2023-04-14 | 平安科技(深圳)有限公司 | 相似企业推荐方法、装置、计算机设备及存储介质 |
CN109376280A (zh) * | 2018-09-28 | 2019-02-22 | 苏州朗动网络科技有限公司 | 企业关系的查询方法、装置、计算机设备及存储介质 |
CN109376280B (zh) * | 2018-09-28 | 2021-04-06 | 企查查科技有限公司 | 企业关系的查询方法、装置、计算机设备及存储介质 |
CN110321351A (zh) * | 2019-07-05 | 2019-10-11 | 云南电网有限责任公司电力科学研究院 | 一种基于模糊匹配的厂家名称规范方法 |
CN111104791A (zh) * | 2019-11-14 | 2020-05-05 | 北京金堤科技有限公司 | 行业信息获取方法和装置、电子设备和介质 |
CN111104791B (zh) * | 2019-11-14 | 2024-02-20 | 北京金堤科技有限公司 | 行业信息获取方法和装置、电子设备和介质 |
CN112632357A (zh) * | 2020-12-28 | 2021-04-09 | 中金数据(武汉)超算技术有限公司 | 一种基于云平台的海量数据关联管理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107291812A (zh) | 一种对企业信息中自然语义的专家学习拟合方法及系统 | |
CN110765257B (zh) | 一种知识图谱驱动型的法律智能咨询系统 | |
CN104598535B (zh) | 一种基于最大熵的事件抽取方法 | |
CN106874378B (zh) | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 | |
CN103605665B (zh) | 一种基于关键词的评审专家智能检索与推荐方法 | |
CN104572958B (zh) | 一种基于事件抽取的敏感信息监控方法 | |
CN106055541B (zh) | 一种新闻内容敏感词过滤方法及系统 | |
CN104615767B (zh) | 搜索排序模型的训练方法、搜索处理方法及装置 | |
CN104636465B (zh) | 网页摘要生成方法、展示方法及相应装置 | |
CN102708096B (zh) | 一种基于语义的网络智能舆情监测系统及其工作方法 | |
CN104462057B (zh) | 用于产生语言分析的词汇资源的方法和系统 | |
CN102750316B (zh) | 基于语义共现模型的概念关系标签抽取方法 | |
CN104035975B (zh) | 一种利用中文在线资源实现远程监督人物关系抽取的方法 | |
CN104298658B (zh) | 获取搜索结果的方法和装置 | |
CN107515873A (zh) | 一种垃圾信息识别方法及设备 | |
CN106126619A (zh) | 一种基于视频内容的视频检索方法及系统 | |
CN103970733B (zh) | 一种基于图结构的中文新词识别方法 | |
CN106095759A (zh) | 一种基于启发式规则的发票货物归类方法 | |
CN103064984B (zh) | 垃圾网页的识别方法及系统 | |
CN108509409A (zh) | 一种自动生成语义相近句子样本的方法 | |
CN106933800A (zh) | 一种金融领域的事件句抽取方法 | |
CN104298683B (zh) | 主题挖掘方法和设备、以及查询扩展方法和设备 | |
CN106033462A (zh) | 一种新词发现方法及系统 | |
CN107943514A (zh) | 一种软件文档中核心代码元素的挖掘方法及系统 | |
CN101101599A (zh) | 一种从网页中提取广告主信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171024 |
|
RJ01 | Rejection of invention patent application after publication |