CN112733005B - 一种基于微平台实时推送全域信息的系统及方法 - Google Patents
一种基于微平台实时推送全域信息的系统及方法 Download PDFInfo
- Publication number
- CN112733005B CN112733005B CN202110344656.5A CN202110344656A CN112733005B CN 112733005 B CN112733005 B CN 112733005B CN 202110344656 A CN202110344656 A CN 202110344656A CN 112733005 B CN112733005 B CN 112733005B
- Authority
- CN
- China
- Prior art keywords
- unit
- keyword
- file
- information
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于微平台实时推送全域信息的系统及方法,涉及信息分析、处理和推送技术领域,该系统包括:一进行全域信息分析和推送的微平台;一用于接收微平台所推送信息的企业终端;所述企业终端还用于向微平台输入想要获取的全域信息的关键词信息;一用于为微平台提供网络文件的互联网。本发明科学合理,使用安全方便,本发明通过将互联网公开文件与企业关键词进行比对分析,一方面,可以帮助企业进行网络信息池的分类筛选,为企业外界信息获取做精准定位;另一方面,可以为企业实时获取有益的对口信息,避免企业对于某一信息的重复植入,间接起到对标找差的作用;最后,还可以从其他方面为企业提供信息源支持,为企业后续发展铺平道路。
Description
技术领域
本发明涉及信息分析、处理和推送技术领域,具体是一种基于微平台实时推送全域信息的系统及方法。
背景技术
现有的企业从技术、市场、人事、财务和行政等多个方面来共同促进企业的发展,多方面的相互协作才能让企业不断的强大,随着互联网平台的不断发展,信息的获取基本上都来源于网络,但是,网络上的信息繁杂,企业想要从网络上获取有用信息,通常需要花费较多的时间,例如:企业技术部门在研发新产品时,无法及时的获取信息,在研发阶段发现正在研发的产品已经被他人提前申请了专利,将会浪费企业大量的研发精力;企业人事部门在招聘时,需要筛选成千上万份简历才能挑选出合适的人选,使得人事招聘的效率降低;
上述问题的原因都是因为企业被网络上繁杂的信息所迷惑,无法及时的获取有用信息,那么,为企业实时推送全域信息,促进企业的快速发展,将会是急需解决的问题;
所以,人们急需一种基于微平台实时推送全域信息的系统及方法来解决上述问题。
发明内容
本发明的目的在于提供一种基于微平台实时推送全域信息的系统及方法,以解决现有技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于微平台实时推送全域信息的系统,该系统包括一进行全域信息分析、处理和推送的微平台;
一用于接收微平台所推送信息的企业终端;
所述企业终端还用于向微平台输入想要获取的全域信息的关键词信息;
一用于为微平台提供网络文件的互联网。
根据上述技术方案,所述微平台包括关键词分类模块、星图生成模块、坐标赋予模块、文件获取模块、比对分析模块和信息推送模块;
所述关键词分类模块用于对企业终端的历史搜索关键词信息进行梯度的划分,以便于区别不同关键词对于企业的重要程度,使得可以根据重要程度确定企业所期望获取的公开文件,所述星图生成模块用于根据关键词分类模块所划分的关键词梯度进行星图的生成,使得可以对不同梯度的关键词进行数字化分析,使得对于企业全域信息的推送更加的精准,使得推送的全域信息确实是企业希望获取的,提高企业满意度,所述坐标赋予模块用于赋予生成的星图以坐标系,使得每一个关键词都可以有相应的坐标,方便进行公开文件与关键词之间比对值的计算和分析,所述文件获取模块用于从互联网上获取最近时间段的公开文件,避免企业之后从互联网上获取公开文件,导致被互联网上繁杂的公开文件所迷惑而无法获取真正的有用文件,所述比对分析模块将从互联网上获取的最近时间段的公开文件与企业终端的历史搜索关键词信息进行比对和分析,确定比对值,所述信息推送模块将比对分析模块分析之后的与企业终端的历史搜索关键词信息比对值最高的信息推送给企业终端;
企业终端输出关键词信息至关键词分类模块,所述关键词分类模块和坐标赋予模块的输出端连接星图生成模块的输入端,所述文件获取模块获取互联网上的网络文件,所述文件获取模块和星图生成模块的输出端连接比对分析模块的输入端,所述比对分析模块的输出端连接信息推送模块的输入端,所述信息推送模块向企业终端推送全域信息。
根据上述技术方案,所述关键词分类模块包括关键词获取单元、频率分析单元、梯度划分单元和近似词挖掘单元;
所述关键词获取单元用于获取企业终端的历史搜索关键词信息,所述频率分析单元用于对关键词获取单元所获取的关键词信息中每个关键词出现的频率进行分析,以此来确定每一个关键词对于企业来说的重要程度,所述梯度划分单元用于根据频率分析单元所分析的每个关键词出现的频率对企业终端的历史搜索关键词信息进行梯度的划分,所述近似词挖掘单元用于根据他人的搜索记录挖掘与企业终端历史搜索的关键词信息近似的近似词,使得对于公开文件的筛选更加的全面,避免出现漏选的情况;
所述关键词获取单元的输出端连接近似词挖掘单元和频率分析单元的输入端,所述频率分析单元的输出端连接梯度划分单元的输入端;
所述星图生成模块包括关键词填入单元、近似词填入单元和框架生成单元;
所述框架生成单元用于生成星图的框架模型,所述关键词填入单元用于根据梯度划分单元所划分的关键词梯度将每个关键词分别填入星图的框架模型中,星图的框架模型上的关键词由中心点向外围重要程度逐渐增加,所述近似词填入单元用于将近似词挖掘单元所挖掘的与关键词近似的近似词填入星图的框架模型中,与关键词近似度越高的近似词越靠近关键词所在位置,生成星图;
所述近似词挖掘单元的输出端连接近似词填入单元的输入端,所述梯度划分单元的输出端连接关键词填入单元的输入端,所述关键词填入单元和近似词填入单元的输出端连接框架生成单元的输入端,所述框架生成单元的输出端连接比对分析模块的输入端;
所述坐标赋予模块包括坐标系建立单元和坐标值标注单元;
所述坐标系建立单元用于以星图的中心为圆心建立星图的二维直角坐标系,所述坐标值标注单元用于对星图上的每一个关键词和近似词进行坐标值的标注。
所述坐标系建立单元的输出端连接框架生成单元的输入端,所述坐标值标注单元的输出端连接坐标系建立单元的输入端。
根据上述技术方案,所述文件获取模块包括文件筛选单元、文件分类单元和类别标注单元;
所述文件筛选单元用于对互联网上的公开文件进行筛选,判断是否为最近时间段文件,如若是非最近时间段文件则抛弃,如若是最近时间段文件则将其传输至文件分类单元,所述文件分类单元所公开文件的类别进行划分,所述类别标注单元用于对文件分类单元所分类之后的公开文件进行类别的标注,使得后期进行全域信息推送时,可以根据企业缺少的领域信息进行对应领域信息的推送,以解企业的燃眉之急;
所述文件筛选单元的输出端连接文件分类单元的输入端,所述类别标注单元的输出端连接文件分类单元的输入端,所述文件分类单元的输出端连接比对分析模块的输入端;
所述比对分析模块包括关键词提取单元、星图比对单元、坐标获取单元和比对值计算单元;
所述关键词获取单元用于从文件分类单元分类的之后的单篇公开文件中获取关键词,所述星图比对单元用于将关键词获取单元获取的关键词与框架生成单元所生成的星图进行比对,确定关键词获取单元所获取的关键词是否在星图中出现,如若星图中不存在与关键词提取单元所提取的相同的关键词,则对关键词获取单元获取的该关键词进行抛弃,如若星图中存在与关键词提取单元所提取的相同的关键词,则利用所述坐标获取单元获取该关键词在星图中的坐标值,使得可以通过关键词比对的方式来对公开文件进行筛选,使得可以筛选出对企业有帮助的公开文件,所述比对值计算单元用于计算该公开文件中的关键词与星图中的关键词的比对值,通过比对值来确定是否为企业希望获取的公开文件,使用数字化的方式来进行筛选,使得筛选的结果更加具备参考价值,使得可以真实的帮助企业解决问题;
所述文件分类单元的输出端连接关键词获取单元的输入端,所述关键词获取单元和框架生成单元的输出端连接星图比对单元的输入端,所述星图比对单元的输出端连接坐标获取单元的输入端,所述坐标获取单元的输出端连接比对值计算单元的输入端,所述比对值计算单元的输出端连接信息推送模块的输入端。
根据上述技术方案,所述信息推送模块包括类别提取单元和排序发送单元;
所述类别提取单元用于对每一篇公开文件的类别进行提取和划分,以便于针对企业缺失的不同领域的公开文件进行相应类别的公开文件的推送,所述排序发送单元用于将同一类别的公开文件进行比对值的排序,用于将同一类别中比对值最高的公开文件发送至企业终端;
所述比对值计算单元的输出端连接类别提取单元的输入端,所述类别提取单元的输出端连接排序发送单元的输入端,所述排序发送单元的输出端连接企业终端的输入端。
一种基于微平台实时推送全域信息的方法,该方法包括以下步骤:
S1、利用微平台获取企业终端的历史搜索关键词信息,并将关键词信息按照梯度生成星图;
S2、利用微平台获取互联网上的网络文件,并对网络文件的关键词进行提取;
S3、利用微平台分析每一篇网络文件与企业历史搜索关键词信息之间的比对值;
S4、利用微平台将比对值最高的公开文件推送至企业终端。
根据上述技术方案,在步骤S1中:
利用关键词分类模块根据企业终端的历史搜索关键词信息的搜索频率进行关键词梯度的划分,利用近似词挖掘单元挖掘出不同梯度的关键词的近似词;
利用框架生成单元生成星图的框架模型,利用关键词填入单元按照划分的关键词梯度将每一个关键词填入星图的框架模型,所述关键词填入星图框架模型的顶角处,因为星图的顶角距离星图中心点距离最远,方便后期根据距离值来判断比对值的大小,利用近似词填入单元将每一个近似词填入星图的框架模型,所述近似词填入单元将不同关键词的近似词填入对应的关键词两侧,生成星图;
利用坐标系建立单元建立星图的二维直角坐标系,利用坐标值标注单元对每一个关键词和近似词进行坐标值的标注;
根据上述技术方案,在步骤S2中:
利用文件筛选单元对互联网上的网络文件进行筛选,抛弃非最近时间段文件,最近时间段是指T±a时间段,其中,T表示当前时间点,a表示设定的范围时间阈值,因为根据企业的发展,企业基本上对之前现存的公开文件都已经进行了查询,那么,只有最近时间段的公开文件才对企业的具有参考价值,将最近时间段文件输送至文件分类单元,利用文件分类单元对从互联网上筛选的最近时间段文件进行分类,并利用类别标注单元对分类之后的文件类别进行标注,方便后期对不同领域的公开文件进行区分,使得可以对同领域的公开文件的比对值进行比较,选取比对值最大的公开文件推送至企业终端;
所述文件分类单元将分类之后的单篇公开文件发送至关键词提取单元,利用所述关键词提取单元对单篇公开文件中的每一个词语进行提取,方便与企业历史搜索关键词信息进行比对。
根据上述技术方案,在步骤S3中,利用星图比对单元将关键词提取的单篇公开文
件中的每一个关键词与星图中的关键词和近似词进行比对,当单篇公开文件中的一个关键
词在星图中出现时,利用坐标获取单元获取该关键词在星图中的坐标值信息或,表示该关键词为企业终端历史搜索关键词信息的第k个关键词或者是第k个关
键词的第s个近似词;
所述坐标获取单元获取单篇公开文件的所有关键词在星图的坐标位置之后,组成
该单篇公开文件中关键词的坐标集合,或者是还包括近似词
的坐标值,其中,p表示第p篇公开文件,利用比对值计算单元根据下列公式计算该单篇公开
文件与企业终端搜索关键词信息之间的比对值Lp;
其中,u表示集合Qp中的第u个坐标值。
通过上述计算公式,计算集合Qp中的每一个关键词与星图中心点之间的距离之和,因为星图在生成时,按照企业终端搜索关键词信息的梯度,越重要的关键词距离星图的中心点越远,所以,越重要的关键词,比对值越大,因此,通过上述公式计算每一篇公开文件的比对值,就可以在公开文件之间比较,选取比对值最大的公开文件发送给企业终端。
根据上述技术方案,在步骤S4中,利用类别提取单元对比对值计算的公开文件的类别进行提取并暂存,待同一类别的公开文件比对完成之后,利用排序发送单元将同一类别中比对值最高的公开文件推送至企业终端。
与现有技术相比,本发明的有益效果是:
1、本发明通过对企业历史搜索关键词的梯度划分,生成星图,并对网络公开文件进行关键词的提取,将网络公开文件中提取的关键词与星图中的关键词进行比对,分析网络公开文件是否与想要的公开文件相似,进而对比对值最高的公开文件进行推送,减少企业在繁杂的网络上寻找公开文件所花费的时间,帮助企业进行网络信息的筛选,协助企业不断壮大,可以为企业实时获取有关研发信息,避免企业对于某一产品的重复研发,浪费科研精力。
2、本发明通过近似词的挖掘,使得可以对企业关键词进行扩充,增加网络文件筛选的范围,避免出现漏选的现象,使得对于公开文件的筛选尽可能的全面,并且,不同关键词的近似词在星图上都是位于关键词的两侧,使得比对值计算时更加的具有参考价值。
3、本发明通过对网络公开文件的类别进行区分,在比对完成之后对类别进行提取,使得可以对企业不同领域的公开文件进行筛选,实现了全域信息的推送。
4、通过建立二维直角坐标系,使得可以以数字化的形式来计算企业需要的公开文件的类型,使得筛选出来的公开文件更加贴合企业当前的发展状态,对企业起到了协助发展的作用。
附图说明
图1为本发明一种基于微平台实时推送全域信息的系统及方法微平台与企业终端和互联网之间的关系结构示意图;
图2为本发明一种基于微平台实时推送全域信息的系统及方法的微平台模块组成结构示意图;
图3为本发明一种基于微平台实时推送全域信息的系统及方法的微平台内部的模块连接结构示意图;
图4为本发明一种基于微平台实时推送全域信息的系统及方法的全域信息推送过程的结构示意图;
图5为本发明一种基于微平台实时推送全域信息的系统及方法的星图的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1~5所示,本发明提供以下技术方案,一种基于微平台实时推送全域信息的系统,该系统包括一进行全域信息分析、处理和推送的微平台;
一用于接收微平台所推送信息的企业终端;
所述企业终端还用于向微平台输入想要获取的全域信息的关键词信息;
一用于为微平台提供网络文件的互联网。
所述微平台包括关键词分类模块、星图生成模块、坐标赋予模块、文件获取模块、比对分析模块和信息推送模块;
所述关键词分类模块用于对企业终端的历史搜索关键词信息进行梯度的划分,以便于区别不同关键词对于企业的重要程度,使得可以根据重要程度确定企业所期望获取的公开文件,所述星图生成模块用于根据关键词分类模块所划分的关键词梯度进行星图的生成,使得可以对不同梯度的关键词进行数字化分析,使得对于企业全域信息的推送更加的精准,使得推送的全域信息确实是企业希望获取的,提高企业满意度,所述坐标赋予模块用于赋予生成的星图以坐标系,使得每一个关键词都可以有相应的坐标,方便进行公开文件与关键词之间比对值的计算和分析,所述文件获取模块用于从互联网上获取最近时间段的公开文件,避免企业之后从互联网上获取公开文件,导致被互联网上繁杂的公开文件所迷惑而无法获取真正的有用文件,所述比对分析模块将从互联网上获取的最近时间段的公开文件与企业终端的历史搜索关键词信息进行比对和分析,确定比对值,所述信息推送模块将比对分析模块分析之后的与企业终端的历史搜索关键词信息比对值最高的信息推送给企业终端;
企业终端输出关键词信息至关键词分类模块,所述关键词分类模块和坐标赋予模块的输出端连接星图生成模块的输入端,所述文件获取模块获取互联网上的网络文件,所述文件获取模块和星图生成模块的输出端连接比对分析模块的输入端,所述比对分析模块的输出端连接信息推送模块的输入端,所述信息推送模块向企业终端推送全域信息。
所述关键词分类模块包括关键词获取单元、频率分析单元、梯度划分单元和近似词挖掘单元;
所述关键词获取单元用于获取企业终端的历史搜索关键词信息,所述频率分析单元用于对关键词获取单元所获取的关键词信息中每个关键词出现的频率进行分析,以此来确定每一个关键词对于企业来说的重要程度,所述梯度划分单元用于根据频率分析单元所分析的每个关键词出现的频率对企业终端的历史搜索关键词信息进行梯度的划分,所述近似词挖掘单元用于根据他人的搜索记录挖掘与企业终端历史搜索的关键词信息近似的近似词,例如:企业搜索的关键词为“车辆”,他人的搜索记录中在同一时刻进行了“车辆”、“轿车”、“货车”、“汽车”的搜索,那么,确定“轿车”、“货车”、“汽车”为“车辆”的近似词,使得对于公开文件的筛选更加的全面,避免出现漏选的情况;
所述关键词获取单元的输出端连接近似词挖掘单元和频率分析单元的输入端,所述频率分析单元的输出端连接梯度划分单元的输入端;
所述星图生成模块包括关键词填入单元、近似词填入单元和框架生成单元;
所述框架生成单元用于生成星图的框架模型,所述关键词填入单元用于根据梯度划分单元所划分的关键词梯度将每个关键词分别填入星图的框架模型中,星图的框架模型上的关键词由中心点向外围重要程度逐渐增加,所述近似词填入单元用于将近似词挖掘单元所挖掘的与关键词近似的近似词填入星图的框架模型中,与关键词近似度越高的近似词越靠近关键词所在位置,例如:“汽车”与“车辆”之间的比对值最高,则“汽车”在星图的框架模型上位于“车辆”的一侧,生成星图;
所述近似词挖掘单元的输出端连接近似词填入单元的输入端,所述梯度划分单元的输出端连接关键词填入单元的输入端,所述关键词填入单元和近似词填入单元的输出端连接框架生成单元的输入端,所述框架生成单元的输出端连接比对分析模块的输入端;
所述坐标赋予模块包括坐标系建立单元和坐标值标注单元;
所述坐标系建立单元用于以星图的中心为圆心建立星图的二维直角坐标系,所述坐标值标注单元用于对星图上的每一个关键词和近似词进行坐标值的标注,例如:“车辆”的坐标值为(0,45),“汽车”的坐标值为(5,40)。
所述坐标系建立单元的输出端连接框架生成单元的输入端,所述坐标值标注单元的输出端连接坐标系建立单元的输入端。
所述文件获取模块包括文件筛选单元、文件分类单元和类别标注单元;
所述文件筛选单元用于对互联网上的公开文件进行筛选,判断是否为最近时间段文件,如若是非最近时间段文件则抛弃,如若是最近时间段文件则将其传输至文件分类单元,所述文件分类单元所公开文件的类别进行划分,例如:可以将公开文件划分为科研类文件、人力资源类文件、财务信息文件等,所述类别标注单元用于对文件分类单元所分类之后的公开文件进行类别的标注,使得后期进行全域信息推送时,可以根据企业缺少的领域信息进行对应领域信息的推送,以解企业的燃眉之急;
所述文件筛选单元的输出端连接文件分类单元的输入端,所述类别标注单元的输出端连接文件分类单元的输入端,所述文件分类单元的输出端连接比对分析模块的输入端;
所述比对分析模块包括关键词提取单元、星图比对单元、坐标获取单元和比对值计算单元;
所述关键词获取单元用于从文件分类单元分类的之后的单篇公开文件中获取关键词,所述星图比对单元用于将关键词获取单元获取的关键词与框架生成单元所生成的星图进行比对,确定关键词获取单元所获取的关键词是否在星图中出现,如若星图中不存在与关键词提取单元所提取的相同的关键词,则对关键词获取单元获取的该关键词进行抛弃,如若星图中存在与关键词提取单元所提取的相同的关键词,则利用所述坐标获取单元获取该关键词在星图中的坐标值,使得可以通过关键词比对的方式来对公开文件进行筛选,使得可以筛选出对企业有帮助的公开文件,例如:关键词获取单元从文件分类单元分类之后的单片公开文件中获取了“自行车”、“汽车”、“摩托车”、“电动车”等关键词信息,逐一将上述关键词星图中的关键词进行比对,发送“自行车”、 “摩托车”、“电动车”均未在星图中出现,则对“自行车”、 “摩托车”、“电动车”进行抛弃,而“汽车”在星图中出现了,则确定“汽车”这个关键词在星图中的坐标值,所述比对值计算单元用于计算该公开文件中的关键词与星图中的关键词的比对值,通过比对值来确定是否为企业希望获取的公开文件,使用数字化的方式来进行筛选,使得筛选的结果更加具备参考价值,使得可以真实的帮助企业解决问题;
所述文件分类单元的输出端连接关键词获取单元的输入端,所述关键词获取单元和框架生成单元的输出端连接星图比对单元的输入端,所述星图比对单元的输出端连接坐标获取单元的输入端,所述坐标获取单元的输出端连接比对值计算单元的输入端,所述比对值计算单元的输出端连接信息推送模块的输入端。
所述信息推送模块包括类别提取单元和排序发送单元;
所述类别提取单元用于对每一篇公开文件的类别进行提取和划分,以便于针对企业缺失的不同领域的公开文件进行相应类别的公开文件的推送,所述排序发送单元用于将同一类别的公开文件进行比对值的排序,用于将同一类别中比对值最高的公开文件发送至企业终端;
所述比对值计算单元的输出端连接类别提取单元的输入端,所述类别提取单元的输出端连接排序发送单元的输入端,所述排序发送单元的输出端连接企业终端的输入端。
一种基于微平台实时推送全域信息的方法,该方法包括以下步骤:
S1、利用微平台获取企业终端的历史搜索关键词信息,并将关键词信息按照梯度生成星图;
S2、利用微平台获取互联网上的网络文件,并对网络文件的关键词进行提取;
S3、利用微平台分析每一篇网络文件与企业历史搜索关键词信息之间的比对值;
S4、利用微平台将比对值最高的公开文件推送至企业终端。
在步骤S1中:
利用关键词分类模块根据企业终端的历史搜索关键词信息的搜索频率进行关键词梯度的划分,利用近似词挖掘单元挖掘出不同梯度的关键词的近似词;
利用框架生成单元生成星图的框架模型,利用关键词填入单元按照划分的关键词梯度将每一个关键词填入星图的框架模型,所述关键词填入星图框架模型的顶角处,因为星图的顶角距离星图中心点距离最远,方便后期根据距离值来判断比对值的大小,利用近似词填入单元将每一个近似词填入星图的框架模型,所述近似词填入单元将不同关键词的近似词填入对应的关键词两侧,生成星图;
利用坐标系建立单元建立星图的二维直角坐标系,利用坐标值标注单元对每一个关键词和近似词进行坐标值的标注;
在步骤S2中:
利用文件筛选单元对互联网上的网络文件进行筛选,抛弃非最近时间段文件,最近时间段是指T±a时间段,其中,T表示当前时间点,a表示设定的范围时间阈值,例如:当前时间T为2021年03月27日,a设定为7天,那么,在2021年03月21日至2021年04月02日之间的网络文件为最近时间段文件,因为根据企业的发展,企业基本上对之前现存的公开文件都已经进行了查询,那么,只有最近时间段的公开文件才对企业的具有参考价值,将最近时间段文件输送至文件分类单元,利用文件分类单元对从互联网上筛选的最近时间段文件进行分类,并利用类别标注单元对分类之后的文件类别进行标注,方便后期对不同领域的公开文件进行区分,使得可以对同领域的公开文件的比对值进行比较,选取比对值最大的公开文件推送至企业终端;
所述文件分类单元将分类之后的单篇公开文件发送至关键词提取单元,利用所述关键词提取单元对单篇公开文件中的每一个词语进行提取,方便与企业历史搜索关键词信息进行比对。
在步骤S3中,利用星图比对单元将关键词提取的单篇公开文件中的每一个关键词
与星图中的关键词和近似词进行比对,当单篇公开文件中的一个关键词在星图中出现时,
利用坐标获取单元获取该关键词在星图中的坐标值信息或,表示该
关键词为企业终端历史搜索关键词信息的第k个关键词或者是第k个关键词的第s个近似
词;
所述坐标获取单元获取单篇公开文件的所有关键词在星图的坐标位置之后,组成
该单篇公开文件中关键词的坐标集合,或者是还包括近似词
的坐标值,其中,p表示第p篇公开文件,利用比对值计算单元根据下列公式计算该单篇公开
文件与企业终端搜索关键词信息之间的比对值Lp;
其中,u表示集合Qp中的第u个坐标值。
通过上述计算公式,计算集合Qp中的每一个关键词与星图中心点之间的距离之和,因为星图在生成时,按照企业终端搜索关键词信息的梯度,越重要的关键词距离星图的中心点越远,所以,越重要的关键词,比对值越大,因此,通过上述公式计算每一篇公开文件的比对值,就可以在公开文件之间比较,选取比对值最大的公开文件发送给企业终端。
在步骤S4中,利用类别提取单元对比对值计算的公开文件的类别进行提取并暂存,待同一类别的公开文件比对完成之后,利用排序发送单元将同一类别中比对值最高的公开文件推送至企业终端。
实施例:
领域:汽车车灯科研;
互联网前后14天内有关汽车车灯的公开文件6篇;
企业终端的历史搜索关键词排序:车灯、大灯、近光灯、远光灯、前照灯、卤素灯;
第一篇公开文件关键词:车灯、卤素灯
第二篇公开文件关键词:近光灯、远光灯
第三篇公开文件关键词:大灯、前照灯
第四篇公开文件关键词:车灯、前照灯
第五篇公开文件关键词:卤素灯、车灯、前照灯、大灯
第六篇公开文件关键词:前照灯
根据下列公式计算每一篇公开文件的关键词与星图中的关键词的比对值Li,i表示第i篇公开文件;
通过排序发送单元的排序,第五篇公开文件与企业终端历史搜索关键词信息的比对值最高,将第五篇公开文件发送至企业终端。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (4)
1.一种基于微平台实时推送全域信息的系统,其特征在于:该系统包括一进行全域信息分析、处理和推送的微平台;
一用于接收微平台所推送信息的企业终端;
所述企业终端还用于向微平台输入想要获取的全域信息的关键词信息;
一用于为微平台提供网络文件的互联网;
所述微平台包括关键词分类模块、星图生成模块、坐标赋予模块、文件获取模块、比对分析模块和信息推送模块;
所述关键词分类模块用于对企业终端的历史搜索关键词信息进行梯度的划分,所述星图生成模块用于根据关键词分类模块所划分的关键词梯度进行星图的生成,所述坐标赋予模块用于赋予生成的星图以坐标系,所述文件获取模块用于从互联网上获取最近时间段的公开文件,所述比对分析模块将从互联网上获取的最近时间段的公开文件与企业终端的历史搜索关键词信息进行比对和分析,确定比对值,所述信息推送模块将比对分析模块分析之后的与企业终端的历史搜索关键词信息比对值最高的信息推送给企业终端;
企业终端输出关键词信息至关键词分类模块,所述关键词分类模块和坐标赋予模块的输出端连接星图生成模块的输入端,所述文件获取模块获取互联网上的网络文件,所述文件获取模块和星图生成模块的输出端连接比对分析模块的输入端,所述比对分析模块的输出端连接信息推送模块的输入端,所述信息推送模块向企业终端推送全域信息;
所述关键词分类模块包括关键词获取单元、频率分析单元、梯度划分单元和近似词挖掘单元;
所述关键词获取单元用于获取企业终端的历史搜索关键词信息,所述频率分析单元用于对关键词获取单元所获取的关键词信息中每个关键词出现的频率进行分析,所述梯度划分单元用于根据频率分析单元所分析的每个关键词出现的频率对企业终端的历史搜索关键词信息进行梯度的划分,所述近似词挖掘单元用于根据他人的搜索记录挖掘与企业终端历史搜索的关键词信息近似的近似词;
所述关键词获取单元的输出端连接近似词挖掘单元和频率分析单元的输入端,所述频率分析单元的输出端连接梯度划分单元的输入端;
所述星图生成模块包括关键词填入单元、近似词填入单元和框架生成单元;
所述框架生成单元用于生成星图的框架模型,所述关键词填入单元用于根据梯度划分单元所划分的关键词梯度将每个关键词分别填入星图的框架模型中,所述近似词填入单元用于将近似词挖掘单元所挖掘的与关键词近似的近似词填入星图的框架模型中,生成星图;
所述近似词挖掘单元的输出端连接近似词填入单元的输入端,所述梯度划分单元的输出端连接关键词填入单元的输入端,所述关键词填入单元和近似词填入单元的输出端连接框架生成单元的输入端,所述框架生成单元的输出端连接比对分析模块的输入端;
所述坐标赋予模块包括坐标系建立单元和坐标值标注单元;
所述坐标系建立单元用于以星图的中心为圆心建立星图的二维直角坐标系,所述坐标值标注单元用于对星图上的每一个关键词和近似词进行坐标值的标注;
所述坐标系建立单元的输出端连接框架生成单元的输入端,所述坐标值标注单元的输出端连接坐标系建立单元的输入端;
所述文件获取模块包括文件筛选单元、文件分类单元和类别标注单元;
所述文件筛选单元用于对互联网上的公开文件进行筛选,判断是否为最近时间段文件,如若是非最近时间段文件则抛弃,如若是最近时间段文件则将其传输至文件分类单元,所述文件分类单元所公开文件的类别进行划分,所述类别标注单元用于对文件分类单元所分类之后的公开文件进行类别的标注;
所述文件筛选单元的输出端连接文件分类单元的输入端,所述类别标注单元的输出端连接文件分类单元的输入端,所述文件分类单元的输出端连接比对分析模块的输入端;
所述比对分析模块包括关键词提取单元、星图比对单元、坐标获取单元和比对值计算单元;
所述关键词获取单元用于从文件分类单元分类的之后的单篇公开文件中获取关键词,所述星图比对单元用于将关键词获取单元获取的关键词与框架生成单元所生成的星图进行比对,确定关键词获取单元所获取的关键词是否在星图中出现,如若星图中不存在与关键词提取单元所提取的相同的关键词,则对关键词获取单元获取的该关键词进行抛弃,如若星图中存在与关键词提取单元所提取的相同的关键词,则利用所述坐标获取单元获取该关键词在星图中的坐标值,所述比对值计算单元用于计算该公开文件中的关键词与星图中的关键词的比对值;
所述文件分类单元的输出端连接关键词获取单元的输入端,所述关键词获取单元和框架生成单元的输出端连接星图比对单元的输入端,所述星图比对单元的输出端连接坐标获取单元的输入端,所述坐标获取单元的输出端连接比对值计算单元的输入端,所述比对值计算单元的输出端连接信息推送模块的输入端。
2.根据权利要求1所述的一种基于微平台实时推送全域信息的系统,其特征在于:所述信息推送模块包括类别提取单元和排序发送单元;
所述类别提取单元用于对每一篇公开文件的类别进行提取和划分,所述排序发送单元用于将同一类别的公开文件进行比对值的排序,用于将同一类别中比对值最高的公开文件发送至企业终端;
所述比对值计算单元的输出端连接类别提取单元的输入端,所述类别提取单元的输出端连接排序发送单元的输入端,所述排序发送单元的输出端连接企业终端的输入端。
3.一种基于微平台实时推送全域信息的方法,其特征在于:该方法包括以下步骤:
S1.利用微平台获取企业终端的历史搜索关键词信息,并将关键词信息按照梯度生成星图;
S2.利用微平台获取互联网上的网络文件,并对网络文件的关键词进行提取;
S3.利用微平台分析每一篇网络文件与企业历史搜索关键词信息之间的比对值;
S4.利用微平台将比对值最高的公开文件推送至企业终端;
在步骤S1中:
利用关键词分类模块根据企业终端的历史搜索关键词信息的搜索频率进行关键词梯度的划分,利用近似词挖掘单元挖掘出不同梯度的关键词的近似词;
利用框架生成单元生成星图的框架模型,利用关键词填入单元按照划分的关键词梯度将每一个关键词填入星图的框架模型,所述关键词填入星图框架模型的顶角处,利用近似词填入单元将每一个近似词填入星图的框架模型,所述近似词填入单元将不同关键词的近似词填入对应的关键词两侧,生成星图;
利用坐标系建立单元建立星图的二维直角坐标系,利用坐标值标注单元对每一个关键词和近似词进行坐标值的标注;
在步骤S2中:
利用文件筛选单元对互联网上的网络文件进行筛选,抛弃非最近时间段文件,最近时间段是指T±a时间段,其中,T表示当前时间点,a表示设定的范围时间阈值,将最近时间段文件输送至文件分类单元,利用文件分类单元对从互联网上筛选的最近时间段文件进行分类,并利用类别标注单元对分类之后的文件类别进行标注;
所述文件分类单元将分类之后的单篇公开文件发送至关键词提取单元,利用所述关键词提取单元对单篇公开文件中的每一个词语进行提取;
在步骤S3中,利用星图比对单元将关键词提取的单篇公开文件中的每一个关键词与星
图中的关键词和近似词进行比对,当单篇公开文件中的一个关键词在星图中出现时,利用
坐标获取单元获取该关键词在星图中的坐标值信息或,表示该关键
词为企业终端历史搜索关键词信息的第k个关键词或者是第k个关键词的第s个近似词;
所述坐标获取单元获取单篇公开文件的所有关键词在星图的坐标位置之后,组成该单
篇公开文件中关键词的坐标集合,或者是还包括近似词
的坐标值,其中,p表示第p篇公开文件,利用比对值计算单元根据下列公式计算该单篇公开
文件与企业终端搜索关键词信息之间的比对值Lp;
其中,u表示集合Qp中的第u个坐标值。
4.根据权利要求3所述的一种基于微平台实时推送全域信息的方法,其特征在于:在步骤S4中,利用类别提取单元对比对值计算的公开文件的类别进行提取并暂存,待同一类别的公开文件比对完成之后,利用排序发送单元将同一类别中比对值最高的公开文件推送至企业终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110344656.5A CN112733005B (zh) | 2021-03-31 | 2021-03-31 | 一种基于微平台实时推送全域信息的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110344656.5A CN112733005B (zh) | 2021-03-31 | 2021-03-31 | 一种基于微平台实时推送全域信息的系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733005A CN112733005A (zh) | 2021-04-30 |
CN112733005B true CN112733005B (zh) | 2021-06-25 |
Family
ID=75596157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110344656.5A Active CN112733005B (zh) | 2021-03-31 | 2021-03-31 | 一种基于微平台实时推送全域信息的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733005B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378055A (zh) * | 2021-06-24 | 2021-09-10 | 上海微问家信息技术有限公司 | 基于访客信息的企业推送方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897380B (zh) * | 2017-01-20 | 2020-01-14 | 浙江大学 | 一种面向设计知识动态推送的自适应需求模型构建方法 |
US11514411B2 (en) * | 2018-10-10 | 2022-11-29 | Pontoro Inc. | Multi-tier tokenization platform |
CN110175328B (zh) * | 2019-05-16 | 2023-02-17 | 镇江市高等专科学校 | 一种基于关键词序列结构的文档相似度度量方法及系统 |
CN112269796B (zh) * | 2020-10-23 | 2023-12-22 | 北京浪潮数据技术有限公司 | 一种数据检索方法及相关装置 |
-
2021
- 2021-03-31 CN CN202110344656.5A patent/CN112733005B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112733005A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112733005B (zh) | 一种基于微平台实时推送全域信息的系统及方法 | |
CN105224658A (zh) | 一种大数据的实时查询方法和系统 | |
US10970645B1 (en) | Method for explainable active learning, to be used for object detector, by using Bayesian dual autoencoder and active learning device using the same | |
CN104615986A (zh) | 利用多检测器对场景变化的视频图像进行行人检测的方法 | |
CN112579921B (zh) | 基于倒排序索引及前缀树的轨迹索引和查询方法及系统 | |
CN114495029A (zh) | 一种基于改进YOLOv4的交通目标检测方法及系统 | |
EP3907655A1 (en) | Method for explainable active learning, to be used for object detector, by using deep encoder and active learning device using the same | |
CN108491828B (zh) | 一种基于层次的成对相似性PVAnet的停车位检测系统及方法 | |
CN103886609B (zh) | 基于粒子滤波和lbp特征的车辆跟踪方法 | |
CN111126327B (zh) | 车道线检测方法、系统、车载系统及车辆 | |
CN109581444B (zh) | 一种gps轨迹分段及语义标注方法 | |
CN117593685B (zh) | 真值数据的构建方法和装置、存储介质 | |
Karim et al. | A system of vision sensor based deep neural networks for complex driving scene analysis in support of crash risk assessment and prevention | |
BARODI et al. | Improved deep learning performance for real-time traffic sign detection and recognition applicable to intelligent transportation systems | |
Li et al. | Pixdet: Prohibited items x-ray image detection in complex background | |
CN114822684B (zh) | 一种化合物-靶蛋白绑定关系预测方法及系统 | |
Nguyen et al. | Robust vehicle detection under adverse weather conditions using auto-encoder feature | |
CN105469095A (zh) | 一种基于车型图像的模式集直方图的车型识别方法 | |
CN114564579A (zh) | 一种基于海量知识图谱及图嵌入的实体分类方法与系统 | |
CN114185875A (zh) | 一种基于云计算的大数据统一分析处理系统 | |
Ying et al. | A data annotation and recognition method based on zero statistical hypothesis test and multi variable binary classification theory | |
Afdhal et al. | Evaluation of benchmarking pre-trained cnn model for autonomous vehicles object detection in mixed traffic | |
Montero et al. | Bev object tracking for lidar-based ground truth generation | |
Liliana et al. | Multi-type Vehicle Detection and Classification Using YOLOV5 | |
Asy'Ari et al. | Parking Space Detection in Different Weather Conditions Based on YOLOv5 Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |