CN117453903A - 信息推送方法、终端设备及可读存储介质 - Google Patents
信息推送方法、终端设备及可读存储介质 Download PDFInfo
- Publication number
- CN117453903A CN117453903A CN202311777008.4A CN202311777008A CN117453903A CN 117453903 A CN117453903 A CN 117453903A CN 202311777008 A CN202311777008 A CN 202311777008A CN 117453903 A CN117453903 A CN 117453903A
- Authority
- CN
- China
- Prior art keywords
- declaration
- document
- formatted
- information
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012549 training Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种信息推送方法、终端设备及可读存储介质,所述方法包括:将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,所述GPT模型用于从所述项目申报说明文档中,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成格式化申报条件文档;获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业;将所述格式化申报条件文档发送至所述目标企业。通过采用预先训练的GPT模型对项目申报说明文档进行解读,可直接生成格式化申报条件文档,从而将格式化申报条件文档立即推送至满足格式化申报条件文档的目标企业,能够提高信息解读效率。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种信息推送方法、终端设备及可读存储介质。
背景技术
为扶持企业的发展,相关机构或部门每年都会发布多项扶持企业的扶持项目,这些扶持项目不仅数量众多,而且扶持内容差异也较大,如何高效准确的解读扶持项目对应的项目申报说明文档,精准推送给满足申报条件的企业,是相关机构或部门极度重视的事情。
在相关技术中,参照图1,图1为项目申报说明文档的解读流程图。项目申报说明文档的解读需要经历分词计算、词向量计算、TF-IDF(Term Frequency-Inverse DocumentFrequency,词频-逆文档频率)值计算,聚类分析等流程,从而提取对应的关键词,并将于项目申报说明文档提取到的关键词以及企业信息对应的企业关键词进行相似度匹配,确定满足申报条件的目标企业,从而将扶持项目的项目申报说明文档主动推送给目标企业。然而,上述项目申报说明文档的解读过程复杂,且需要投入大量的人力进行修改和调整,导致项目申报说明文档解读的效率低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明实施例通过提供一种信息推送方法、终端设备及计算机可读存储介质,旨在解决项目申报说明文档解读的效率低技术问题。
为实现上述目的,本发明实施例提供一种信息推送方法,所述信息推送方法包括以下:
将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,所述GPT模型用于从所述项目申报说明文档中,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成格式化申报条件文档;
获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业;
将所述格式化申报条件文档发送至所述目标企业。
可选地,所述将项目申报说明文档以及申报条件模板输入预先训练的GPT模型的步骤,包括:
在接收到与所述申报条件模板对应字段的提示词时,将所述项目申报说明文档以及所述申报条件模板和所述提示词输入预先训练的所述GPT模型,所述GPT模型用于从所述项目申报说明文档中,根据所述申报条件模板中各个字段和/或各个字段对应的提示词,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成所述格式化申报条件文档。
可选地,所述获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业的步骤,包括:
将所述格式化申报条件文档以及所述企业信息库的各个企业信息输入双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业。
可选地,所述根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业的步骤,还包括:
在所述相似度大于第一相似度阈值时,将所述第二特征向量对应的企业作为所述目标企业;
执行所述将所述格式化申报条件文档发送至所述目标企业的步骤;
在所述相似度大于第二相似度阈值,且小于所述第一相似度阈值时,确定所述第二特征向量对应的企业的缺失信息和/或未满足申报条件,其中,所述第二相似度阈值小于所述第一相似度阈值;
将所述格式化申报条件文档以及所述缺失信息和/或所述未满足申报条件,发送至所述企业。
可选地,所述信息推送方法还包括:
在检测到所述企业对应的所述企业信息更新时,将所述格式化申报条件文档以及所述企业对应的所述企业信息输入所述双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
继续执行所述根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业的步骤。
可选地,所述将所述格式化申报条件文档发送至所述目标企业的步骤,包括:
根据所述格式化申报条件文档,获取所述目标企业对应的目标企业信息;
根据所述格式化申报条件文档以及所述目标信息生成申报文件,并将所述格式化申报条件文档和所述申报文件发送至所述目标企业。
可选地,所述将项目申报说明文档以及申报条件模板输入预先训练的GPT模型的步骤之前,还包括:
基于预设途径,获取历史项目申报说明文档;
将所述历史项目申报说明文档输入所述GPT模型进行训练,并根据训练结果调整所述GPT模型的模型参数,直至所述GPT模型收敛。
可选地,所述将所述格式化申报条件文档发送至所述目标企业的步骤之前,还包括:
获取所述目标企业对应的信息关注列表;
确定所述信息关注列表是否包括所述项目申报说明文档对应的申报类型,若包括则将所述格式化申报条件文档发送至所述目标企业,若不包括则不将所述格式化申报条件文档发送至所述目标企业。
此外,本发明为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息推送程序,所述信息推送程序被所述处理器执行时实现如上所述的信息推送方法的步骤。
此外,本发明为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息推送程序,所述信息推送程序被处理器执行时实现如上所述的信息推送方法的步骤。
本发明一实施例提出的一种信息推送方法,终端设备及计算机可读存储介质,通过将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,GPT模型用于从项目申报说明文档中,提取申报条件模板中各个字段对应的目标信息,并填充至申报条件模板中,生成格式化申报条件文档,然后获取GPT模型输出的格式化申报条件文档,并确定企业信息库中,与格式化申报条件文档匹配的目标企业,从而将格式化申报条件文档发送至目标企业。本发明通过采用预先训练的GPT模型对项目申报说明文档进行解读,可直接生成格式化申报条件文档,从而将格式化申报条件文档立即推送至满足格式化申报条件文档的目标企业,能够提高信息解读效率。
附图说明
图1为项目申报说明文档的解读流程图
图2为本发明信息推送方法的一实施例的流程示意图;
图3为本发明信息推送方法的第二实施例中步骤S20的细化流程示意图;
图4为本发明信息推送方法的第三实施例中步骤S10的细化流程示意图;
图5为本发明涉及的信息推送的架构图;
图6是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于在相关技术中,项目申报说明文档的解读需要经历分词计算、词向量计算、TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文档频率)值计算,聚类分析等流程,从而提取对应的关键词,并将于项目申报说明文档提取到的关键词以及企业信息对应的企业关键词进行相似度匹配,确定满足申报条件的目标企业,并将扶持项目的项目申报说明文档主动推送给目标企业。然而,上述项目申报说明文档的解读过程复杂,且需要投入大量的人力进行修改和调整,导致项目申报说明文档解读的效率低的技术问题。
为解决相关技术中的上述缺陷,本发明提出一种信息推送方法,其主要解决步骤包括以下:
通过将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,GPT模型用于从项目申报说明文档中,提取申报条件模板中各个字段对应的目标信息,并填充至申报条件模板中,生成格式化申报条件文档,然后获取GPT模型输出的格式化申报条件文档,并确定企业信息库中,与格式化申报条件文档匹配的目标企业,从而将格式化申报条件文档发送至目标企业。本发明通过采用预先训练的GPT模型对项目申报说明文档进行解读,可直接生成格式化申报条件文档,从而将格式化申报条件文档立即推送至满足格式化申报条件文档的目标企业,能够提高信息解读效率。
为了更好地理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整地传达给本领域的技术人员。
参照图2,在本发明信息推送方法的一实施例中,所述一种信息推送方法包括以下步骤:
步骤S10:将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,所述GPT模型用于从所述项目申报说明文档中,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成格式化申报条件文档;
官方下发的项目申报说明文档,不仅记载有项目申报条件的说明信息,还记载有与说明信息不相关的其他信息。例如,提出项目申报的背景信息、项目申报制定的法律依据信息、项目申报带来的影响和效果等。而对于项目申报的申报对象来说,其只关注自身是否符合项目申报的申报条件,从而进行后续的申报工作。若直接将项目申报说明文档发送至各个申报对象,申报对象需要花费大量时间对项目申报说明文档进行解读,且项目申报说明文档解读流程复杂,导致解读效率低。
在本实施例中,执行主体为终端设备。终端设备可以是手机、电脑,本实施例对此不做具体限定。项目申报说明文档为官方下发,且未经过滤的原始文档。项目申报条件模板存储有申报条件对应的字段,用于从项目申报说明文档中提取项目申报条件相关的目标信息。
本发明在获取到项目申报说明文档后,确定与项目申报说明文档对应的申报条件模板,并将项目申报说明文档和申报条件模板输入预先训练的GPT(Generative Pre-trained Transformer,生成式预训练变换器模型)模型,GPT模型根据申报条件模型中的各个字段,从项目申报说明文档中提取对应的目标信息,并将提取到的目标信息填充至申报条件模板中对应字段关联的位置,从而生成格式化申报条件文档。
可以理解的是,格式化申报条件文档记录的目标信息即对应为项目申报的各个申报条件。本发明采用预先训练的GPT模型可直接解读获得项目申报说明文档中的项目申报条件信息,无需经历一系列复杂的解读流程,且无需人工参与解读,能够大大的提高项目申报说明文档的解读效率。
可选地,所述将项目申报说明文档以及申报条件模板输入预先训练的GPT模型的步骤之前,包括:对负责项目申报说明文档的制定和下发的官方网站进行实时监控,在检测到官方网站发布新的项目申报说明文档时,自动下载项目申报说明文档,并确定与项目申报说明文档的申报条件模板,从而将项目申报说明文档和申报条件模板输入预先训练的GPT模型进行解读。
可选地,在另一可选实施方式中,可通过订阅项目申报说明文档的官方网站,并设置官方网站发布新内容时,发送对应的通知信息。终端设备在接收到通知信息时,可访问官方网站,自动下载新发布的项目申报说明文档,进行解读。
可选地,为提高项目申报说明文档解读的准确率,所述将项目申报说明文档以及申报条件模板输入预先训练的GPT模型的步骤,包括:在接收到与申报条件模板对应字段的提示词时,将项目申报说明文档以及申报条件模板和提示词输入预先训练的GPT模型,GPT模型用于从项目申报说明文档中,根据申报条件模板中各个字段和/或各个字段对应的提示词,提取申报条件模板中各个字段对应的目标信息,并填充至申报条件模板中,生成格式化申报条件文档。
步骤S20:获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业;
在本实施例中,GPT模型根据申报条件模板的各个字段和/或各个字段的提示词,于项目申报说明文档中提取目标信息后,将目标信息填充至申报条件模板中,从而生成并输出格式化申报条件文档。终端设备获取到GPT模型输出的格式化申报条件文档后,从企业信息库中获取各个企业存储的企业信息,根据企业信息确定对应企业是否与格式化申报条件文档中的申报条件匹配,若匹配则表征该企业满足项目申报条件,可以进行项目申报,并将该企业作为目标企业。企业信息可包括企业的经营信息以及项目信息。例如,企业法人、企业注册资本、企业拥有高级工程师数量、企业项目数量以及项目相关信息等。
步骤S30:将所述格式化申报条件文档发送至所述目标企业。
在本实施例中,在确定符合项目申报条件的目标企业之后,将格式化申报条件文档发送至目标企业对应的终端,从而使得目标企业能够及时获知可申报的项目,并根据项目申报条件文档着手准备申报材料进行申报,能够提高信息推送的有效性。
可选地,在另一可选实施方式中,为提高企业的申报意愿,降低企业申报难度,所述将所述格式化申报条件文档发送至所述目标企业的步骤,包括:根据格式化申报条件文档,获取目标企业对应的目标企业信息,根据格式化申报条件文档以及目标信息生成申报文件,并将格式化申报条件文档和申报文件发送至目标企业。
在本实施例中,申报文件可以是申报请求书,申报材料书面说明等,本实施例对此不做具体限定。可通过根据格式化申报条件文档,从企业信息中获取与目标信息对应的目标企业信息,从而按照格式化申报文件文档中的申报条件或者申报类型,获取关联的申报文件模板,并将对应的目标企业信息自动填充至申报文件模板,从而生成申报文件,并发送至目标企业,目标企业只需在申报请求书上补充对应内容,以及打印申报文件进行盖章,从而提高企业的申报意愿,降低申报难度。
需要说明的是,官方网站发布项目申报说明文档时,会同步发布相关的申报文件模板。因此可直接从官方网站中下载项目申报说明文档对应的申报文件模板,若官方网站并未发布申报文件模板,可按照格式化申报文件文档中的申报条件或者申报类型,获取关联的申报文件模板,本实施例对此不做具体限定。
可选地,在另一可选实施方式中,所述将所述格式化申报条件文档发送至所述目标企业的步骤之前,还包括:获取目标企业对应的信息关注列表,确定信息关注列表是否包括项目申报说明文档对应的申报类型,若包括则将格式化申报条件文档发送至目标企业,若不包括则不将格式化申报条件文档发送至目标企业,从而避免干扰目标企业。
在本实施例提供的技术方案中,通过将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,GPT模型用于从项目申报说明文档中,提取申报条件模板中各个字段对应的目标信息,并填充至申报条件模板中,生成格式化申报条件文档,然后获取GPT模型输出的格式化申报条件文档,并确定企业信息库中,与格式化申报条件文档匹配的目标企业,从而将格式化申报条件文档发送至目标企业。本发明通过采用预先训练的GPT模型对项目申报说明文档进行解读,可直接生成格式化申报条件文档,从而将格式化申报条件文档立即推送至满足格式化申报条件文档的目标企业,能够提高信息解读效率。
参照图3,在第二实施例中,基于上述第一实施例,所述步骤S20,包括:
步骤S21:将所述格式化申报条件文档以及所述企业信息库的各个企业信息输入双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
在本实施例中,为提高匹配的准确率,本发明采用预先训练的双塔模型(DeepStructured Semantic Models,深层结构语义模型)对格式化申报条件文档和企业信息库中各个企业的企业信息进行匹配,确定符合项目申报条件的目标企业。可预先设置双塔模型的编码方式,从而通过对格式化申报条件文档中的目标信息按照预设的编码方式进行编码,提取第一特征向量,以及对从企业信息库获取的企业信息按照预设的编码方式进行编码,提取第二特征向量。需要说明的是,本发明并不限定采用何种编码方式对双塔模型的输入信息进行编码,开发人员可自行根据格式化申报条件模板的重要性或者重点关注内容选择对应的编码方式,并根据预设的编码方式配置双塔模型的编码模型,例如,word2vec,DNN或者LSTM、CNN等,本实施例对此不做具体限定。
可选地,在另一可选实施方式中,为提高匹配效率,所述将所述格式化申报条件文档以及所述企业信息库的各个企业信息输入双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量的步骤之前包括:根据格式化申报条件文档中各个字段,粗略的对企业信息进行筛选,以将与申报条件无关的企业信息过滤,之后再将格式化申报条件文档和筛选后的企业信息输入双塔模型,进行匹配。
步骤S22:根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业。
在本实施例中,本发明通过双塔模型采用预设的相似度计算方法,计算第一特征向量和第二特征向量之间的相似度,在相似度大于第一相似度阈值时,将第二特征向量对应的企业作为目标企业,从而执行所述将所述格式化申报条件文档发送至所述目标企业的步骤。在相似度小于第一相似度阈值时,表征第二特征向量对应的企业并不符合项目申报条件,从而继续从企业信息库中获取企业信息,进行匹配。
可选地,在另一可选实施方式中,在相似度大于第二相似度阈值,且小于第一相似度阈值时,确定第二特征向量对应的企业的缺失信息和/或未满足申报条件,其中,第二相似度阈值小于第一相似度阈值,然后将格式化申报条件文档以及缺失信息和/或未满足申报条件,发送至企业。
在本实施例中,为提高项目申报的企业数量,可额外设置第二相似度阈值,且第二相似度阈值小于第一相似度阈值。在第一特征向量和第二特征向量之间的相似度大于第二相似度阈值,且小于第一相似度阈值时,表征第二特征向量对应的企业不满足所有的项目申报条件,但仅不满足少数几条项目申报条件。而导致这种结果的原因可能是由于企业信息不足或者企业事实上的确不满足所有的项目申报条件。因此本发明为提高项目申报的企业数量,在相似度大于第二相似度阈值,且小于第一相似度阈值时,进一步确定企业是否存在企业信息缺失,若存在则获取双塔模型输出的未满足申报条件,根据未满足申报条件反推企业的缺失信息,从而将格式化申报条件文档以及缺失信息和未满足申报条件一同发送至该企业,以使该企业于企业信息库中补充缺失信息,继续进行匹配。和/或企业可自行查看未满足申报条件,确定自身实际情况是否与未满足申报条件一致,若不一致可向终端设备进行反馈,或者查看在企业信息库中留存的企业信息是否过期或填写错误,从而针对性进行修改,继续进行匹配。
可选地,所述根据未满足申报条件反推企业的缺失信息的步骤之后包括:将所述缺失信息与企业信息库中的企业信息进行比对,确定企业信息是否存在该缺失信息,若存在该缺失信息,则将格式化申报条件文档以及缺失信息和未满足申报条件一同发送至该企业,以使该企业于企业信息库中补充缺失信息,继续进行匹配。若存在该缺失信息,则将格式化申报条件文档以及未满足申报条件一同发送至该企业,以使该企业根据未满足申报条件制定发展计划,从而使得企业能够在项目申报结束前满足所有项目申报条件,从而进行项目申报。
在本实施例提供的技术方案中,通过将格式化申报条件文档以及企业信息库的各个企业信息输入双塔模型,基于双塔模型提取格式化申报条件文档对应的第一特征向量,以及提取企业信息对应的第二特征向量,进而根据第一特征向量和第二特征向量之间的相似度,确定与格式化申报条件文档匹配的目标企业,从而将格式化申报条件文档发送至目标企业,使得目标企业能够及时获知可申报的项目,并根据项目申报条件文档着手准备申报材料进行申报,能够提高信息推送的有效性。
参照图4,在第三实施例中,基于上述任一实施例,所述步骤S10之前,包括:
步骤S40:基于预设途径,获取历史项目申报说明文档;
在本实施例中,为提高GPT模型的解读准确率,本发明基于预设途径收集各种类型的历史项目申报说明文档,构建项目申报说明文档库。从而从项目申报说明文档库中依次获取历史项目申报说明文档输入GPT模型,以使GPT模型根据输入的历史项目申报说明文档进行学习,逐渐适应项目申报说明文档的数据特点和分布,提高GPT模型的性能表现。
可选地,所述预设途径可以是访问各类用于制定或发布项目申报说明文档的官方网站,并从官方网站下载所有发布过的历史项目申报说明文档。
步骤S50:将所述历史项目申报说明文档输入所述GPT模型进行训练,并根据训练结果调整所述GPT模型的模型参数,直至所述GPT模型收敛。
在本实施例中,可在训练过程中,对GPT输出的格式化申报条件文档中的字段以及字段对应的目标信息进行反向传播和/或进行梯度下降优化GPT模型的算法,使得GPT模型自动调整模型参数,直至GPT模型收敛。
可选地,可在训练GPT模型的过程中,获取历史项目申报说明文档对应的验证格式化申报条件文档,将验证格式化申报条件文档与GPT输出的格式化申报条件文档进行验证对比,并根据验证结果调整GPT模型的超参数,提高GPT模型的性能表现。可根据验证结果来选择最优的超参数组合。并尝试不同的超参数组合,训练GPT模型并进行评估,选择验证结果最好的超参数组合作为GPT模型的超参数。
可选地,在GPT模型训练完毕后,将其部署至终端设备,以便终端设备通过预先训练的GPT模型对项目申报说明文档进行解读。可参照图5,图5为本发明涉及的信息推送的架构图。
在本实施例提供的技术方案中,通过基于预设途径,获取历史项目申报说明文档,并将历史项目申报说明文档输入GPT模型进行训练,并根据训练结果调整GPT模型的模型参数,直至GPT模型收敛,然后再将新发布的项目申报说明文档以及申报条件模板输入预先训练的GPT模型,通过GPT模型从项目申报说明文档中,提取申报条件模板中各个字段对应的目标信息,并填充至申报条件模板中,生成格式化申报条件文档,提高GPT模型的解读准确率。
参照图6,图6为本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是手机、电脑,本实施例对此不做具体限定。
如图6所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)、鼠标等,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
本领域技术人员可以理解,图6中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及信息推送程序。
在图6所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的信息推送程序,并执行以下操作:
将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,所述GPT模型用于从所述项目申报说明文档中,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成格式化申报条件文档;
获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业;
将所述格式化申报条件文档发送至所述目标企业。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
在接收到与所述申报条件模板对应字段的提示词时,将所述项目申报说明文档以及所述申报条件模板和所述提示词输入预先训练的所述GPT模型,所述GPT模型用于从所述项目申报说明文档中,根据所述申报条件模板中各个字段和/或各个字段对应的提示词,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成所述格式化申报条件文档。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
将所述格式化申报条件文档以及所述企业信息库的各个企业信息输入双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
在所述相似度大于第一相似度阈值时,将所述第二特征向量对应的企业作为所述目标企业;
执行所述将所述格式化申报条件文档发送至所述目标企业的步骤;
在所述相似度大于第二相似度阈值,且小于所述第一相似度阈值时,确定所述第二特征向量对应的企业的缺失信息和/或未满足申报条件,其中,所述第二相似度阈值小于所述第一相似度阈值;
将所述格式化申报条件文档以及所述缺失信息和/或所述未满足申报条件,发送至所述企业。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
在检测到所述企业对应的所述企业信息更新时,将所述格式化申报条件文档以及所述企业对应的所述企业信息输入所述双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
继续执行所述根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业的步骤。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
根据所述格式化申报条件文档,获取所述目标企业对应的目标企业信息;
根据所述格式化申报条件文档以及所述目标信息生成申报文件,并将所述格式化申报条件文档和所述申报文件发送至所述目标企业。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
基于预设途径,获取历史项目申报说明文档;
将所述历史项目申报说明文档输入所述GPT模型进行训练,并根据训练结果调整所述GPT模型的模型参数,直至所述GPT模型收敛。
进一步地,处理器1001可以调用存储器1005中存储的信息推送程序,还执行以下操作:
获取所述目标企业对应的信息关注列表;
确定所述信息关注列表是否包括所述项目申报说明文档对应的申报类型,若包括则将所述格式化申报条件文档发送至所述目标企业,若不包括则不将所述格式化申报条件文档发送至所述目标企业。
此外,本发明为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息推送程序,所述信息推送程序被所述处理器执行时实现如上所述的信息推送方法的步骤。
此外,本发明为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息推送程序,所述信息推送程序被处理器执行时实现如上所述的信息推送方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机、电脑)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种信息推送方法,其特征在于,所述信息推送方法包括:
将项目申报说明文档以及申报条件模板输入预先训练的GPT模型,所述GPT模型用于从所述项目申报说明文档中,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成格式化申报条件文档;
获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业;
将所述格式化申报条件文档发送至所述目标企业。
2.如权利要求1所述的信息推送方法,其特征在于,所述将项目申报说明文档以及申报条件模板输入预先训练的GPT模型的步骤,包括:
在接收到与所述申报条件模板对应字段的提示词时,将所述项目申报说明文档以及所述申报条件模板和所述提示词输入预先训练的所述GPT模型,所述GPT模型用于从所述项目申报说明文档中,根据所述申报条件模板中各个字段和/或各个字段对应的提示词,提取所述申报条件模板中各个字段对应的目标信息,并填充至所述申报条件模板中,生成所述格式化申报条件文档。
3.如权利要求1所述的信息推送方法,其特征在于,所述获取所述GPT模型输出的所述格式化申报条件文档,并确定企业信息库中,与所述格式化申报条件文档匹配的目标企业的步骤,包括:
将所述格式化申报条件文档以及所述企业信息库的各个企业信息输入双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业。
4.如权利要求3所述的信息推送方法,其特征在于,所述根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业的步骤,还包括:
在所述相似度大于第一相似度阈值时,将所述第二特征向量对应的企业作为所述目标企业;
执行所述将所述格式化申报条件文档发送至所述目标企业的步骤;
在所述相似度大于第二相似度阈值,且小于所述第一相似度阈值时,确定所述第二特征向量对应的企业的缺失信息和/或未满足申报条件,其中,所述第二相似度阈值小于所述第一相似度阈值;
将所述格式化申报条件文档以及所述缺失信息和/或所述未满足申报条件,发送至所述企业。
5.如权利要求4所述的信息推送方法,其特征在于,所述信息推送方法还包括:
在检测到所述企业对应的所述企业信息更新时,将所述格式化申报条件文档以及所述企业对应的所述企业信息输入所述双塔模型,基于所述双塔模型提取所述格式化申报条件文档对应的第一特征向量,以及提取所述企业信息对应的第二特征向量;
继续执行所述根据所述第一特征向量和所述第二特征向量之间的相似度,确定与所述格式化申报条件文档匹配的目标企业的步骤。
6.如权利要求1所述的信息推送方法,其特征在于,所述将所述格式化申报条件文档发送至所述目标企业的步骤,包括:
根据所述格式化申报条件文档,获取所述目标企业对应的目标企业信息;
根据所述格式化申报条件文档以及所述目标信息生成申报文件,并将所述格式化申报条件文档和所述申报文件发送至所述目标企业。
7.如权利要求1所述的信息推送方法,其特征在于,所述将项目申报说明文档以及申报条件模板输入预先训练的GPT模型的步骤之前,还包括:
基于预设途径,获取历史项目申报说明文档;
将所述历史项目申报说明文档输入所述GPT模型进行训练,并根据训练结果调整所述GPT模型的模型参数,直至所述GPT模型收敛。
8.如权利要求1所述的信息推送方法,其特征在于,所述将所述格式化申报条件文档发送至所述目标企业的步骤之前,还包括:
获取所述目标企业对应的信息关注列表;
确定所述信息关注列表是否包括所述项目申报说明文档对应的申报类型,若包括则将所述格式化申报条件文档发送至所述目标企业,若不包括则不将所述格式化申报条件文档发送至所述目标企业。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的终端设备的信息推送程序,所述终端设备的信息推送程序被所述处理器执行时实现如权利要求1至8中任一项所述的信息推送方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有终端设备的信息推送程序,所述终端设备的信息推送程序被处理器执行时实现如权利要求1至8中任一项所述的信息推送方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311777008.4A CN117453903B (zh) | 2023-12-22 | 2023-12-22 | 信息推送方法、终端设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311777008.4A CN117453903B (zh) | 2023-12-22 | 2023-12-22 | 信息推送方法、终端设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117453903A true CN117453903A (zh) | 2024-01-26 |
CN117453903B CN117453903B (zh) | 2024-04-12 |
Family
ID=89589501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311777008.4A Active CN117453903B (zh) | 2023-12-22 | 2023-12-22 | 信息推送方法、终端设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117453903B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800354A (zh) * | 2021-01-12 | 2021-05-14 | 深圳市中博科创信息技术有限公司 | 政策发布与智能推送方法、系统、设备和介质 |
CN115564276A (zh) * | 2022-10-21 | 2023-01-03 | 遵义强大博信知识产权服务有限公司 | 项目统计储备管理系统、方法及存储介质 |
CN116775872A (zh) * | 2023-06-19 | 2023-09-19 | 中国电信股份有限公司 | 一种文本处理方法、装置、电子设备及存储介质 |
CN116862263A (zh) * | 2023-07-17 | 2023-10-10 | 企知道科技有限公司 | 一种知产与政策融合规划方法、装置及存储介质 |
CN117057866A (zh) * | 2023-07-26 | 2023-11-14 | 中国平安人寿保险股份有限公司 | 业务推荐方法和装置、电子设备及存储介质 |
CN117194632A (zh) * | 2023-09-11 | 2023-12-08 | 平安银行股份有限公司 | 从文档中抽取结构化知识的方法、装置、设备及介质 |
-
2023
- 2023-12-22 CN CN202311777008.4A patent/CN117453903B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800354A (zh) * | 2021-01-12 | 2021-05-14 | 深圳市中博科创信息技术有限公司 | 政策发布与智能推送方法、系统、设备和介质 |
CN115564276A (zh) * | 2022-10-21 | 2023-01-03 | 遵义强大博信知识产权服务有限公司 | 项目统计储备管理系统、方法及存储介质 |
CN116775872A (zh) * | 2023-06-19 | 2023-09-19 | 中国电信股份有限公司 | 一种文本处理方法、装置、电子设备及存储介质 |
CN116862263A (zh) * | 2023-07-17 | 2023-10-10 | 企知道科技有限公司 | 一种知产与政策融合规划方法、装置及存储介质 |
CN117057866A (zh) * | 2023-07-26 | 2023-11-14 | 中国平安人寿保险股份有限公司 | 业务推荐方法和装置、电子设备及存储介质 |
CN117194632A (zh) * | 2023-09-11 | 2023-12-08 | 平安银行股份有限公司 | 从文档中抽取结构化知识的方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117453903B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695439B (zh) | 图像结构化数据提取方法、电子装置及存储介质 | |
US11238312B2 (en) | Automatically generating labeled synthetic documents | |
US10423410B1 (en) | Source code rules verification method and system | |
CN111858913A (zh) | 一种自动生成文本摘要的方法和系统 | |
US11340871B1 (en) | Software-development tool with feedback notifications for improving software specifications | |
CN112966486A (zh) | 一种工程量清单智能生成方法、装置、终端及存储介质 | |
CN115562656A (zh) | 页面的生成方法、装置、存储介质及计算机设备 | |
CN115357699A (zh) | 文本抽取方法、装置、设备及存储介质 | |
CN112418813B (zh) | 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质 | |
CN114580346A (zh) | 结合rpa和ai的信息生成方法、装置、电子设备及存储介质 | |
CN116721713B (zh) | 一种面向化学结构式识别的数据集构建方法和装置 | |
CN117453903B (zh) | 信息推送方法、终端设备及可读存储介质 | |
CN111949697B (zh) | 基于搜索引擎的数据处理方法、装置、终端及介质 | |
WO2021004118A1 (zh) | 一种相关值确定方法及装置 | |
CN109657710B (zh) | 数据筛选方法、装置、服务器及存储介质 | |
EP4145361A1 (en) | Augmentation of machine learning pipeline corpus for synthesizing new machine learning pipelines | |
US20220366344A1 (en) | Determining section conformity and providing recommendations | |
CN114218462A (zh) | 基于lstm的数据分类方法、装置、设备及存储介质 | |
CN113868210A (zh) | 一种导入数据的有效性验证方法、系统、设备及存储介质 | |
CN113254612A (zh) | 知识问答处理方法、装置、设备及存储介质 | |
US11830081B2 (en) | Automated return evaluation with anomoly detection | |
US11669681B2 (en) | Automated calculation predictions with explanations | |
CN114817526B (zh) | 文本分类方法及装置、存储介质、终端 | |
CN117891531B (zh) | 用于saas软件的系统参数配置方法、系统、介质及电子设备 | |
US20230394327A1 (en) | Generating datasets for scenario-based training and testing of machine learning systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |