CN117556822A - 基于文本的智能研判方法及装置、设备、存储介质 - Google Patents
基于文本的智能研判方法及装置、设备、存储介质 Download PDFInfo
- Publication number
- CN117556822A CN117556822A CN202311447545.2A CN202311447545A CN117556822A CN 117556822 A CN117556822 A CN 117556822A CN 202311447545 A CN202311447545 A CN 202311447545A CN 117556822 A CN117556822 A CN 117556822A
- Authority
- CN
- China
- Prior art keywords
- text
- information
- transfer function
- judgment
- research
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011160 research Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000012546 transfer Methods 0.000 claims abstract description 64
- 238000000227 grinding Methods 0.000 claims abstract description 40
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 65
- 239000011159 matrix material Substances 0.000 claims description 60
- 239000013598 vector Substances 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 9
- 230000000903 blocking effect Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000007621 cluster analysis Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012098 association analyses Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种基于文本的智能研判方法及装置、设备、存储介质,包括:获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度,根据多个文本信息以及预设的传递函数关系,得到对待研判对象在目标时间段的研判结果,预设的传递函数关系是根据待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。能够通过多维度信息获取、预设的传递函数关系,提供准确、全面的研判结果,从而具有实用的优势。
Description
技术领域
本申请实施例涉及语义分析技术,涉及但不限于一种基于文本的智能研判方法及装置、设备、存储介质。
背景技术
现有技术在对文本语义进行分析、研判时,会对数据源背景进行的分析,从而实现文本的研判,但是在对数据源背景进行的分析时,数据来源比较单一,因此会存在分析不全的问题,现有技术还提出了基于大数据的信息数据汇聚的研判方法,但是基于大数据的信息数据汇聚的研判,文本与文本之间无法构成相关联的分析,且很大程度上是人工凭数据加上人的主观经验进行研判,会导致产生的研判分析带有很大的主观性。
因此,如何通过大数据信息进行关联分析,保证研判结果的准确性和可靠性,是一个亟待解决的问题。
发明内容
有鉴于此,本申请实施例提供的基于文本的智能研判方法及装置、设备、存储介质,能够过大数据信息进行关联分析,保证研判结果的准确性。本申请实施例提供的基于文本的智能研判方法及装置、设备、存储介质是这样实现的:
本申请实施例提供的一种基于文本的智能研判方法,包括:
获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,所述多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度;
根据所述多个文本信息以及预设的传递函数关系,得到对所述待研判对象在目标时间段的研判结果,所述预设的传递函数关系是根据所述待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。
在一些实施例中,所述根据所述多个文本信息以及预设的传递函数关系,得到对所述待研判对象在目标时间段的研判结果,包括:
对所述多个文本信息进行分类,获取分类后的多个文本信息,所述多个文本信息中来源相同的文本信息为同一类;
根据所述分类后的多个文本信息生成所述多个文本信息对应的多个特征向量;
根据所述多个特征向量,生成信息矩阵;
将所述信息矩阵输入到所述预设的传递函数关系中,生成所述待研判对象在目标时间段的研判结果。
在一些实施例中,所述对所述多个文本信息进行分类,获取分类后的多个文本信息,包括:
抽取所述多个文本信息中每个文本信息的关键信息,所述关键信息为与研判结果相关的文本信息;
根据多个所述关键信息的内容和来源,生成分块矩阵。
在一些实施例中,所述根据所述多个特征向量,生成信息矩阵,包括:
计算所述分块矩阵中多个所述关键信息,获取所述分块矩阵中多个所述关键信息对应的多个特征向量;
根据所述多个特征向量在所述分块矩阵中的位置,获取所述多个特征向量中每个特征向量对应的权重;
根据所述多个特征向量以及与每个特征向量对应的权重,生成信息矩阵。
在一些实施例中,所述在得到对所述待研判对象在目标时间段的研判结果后,还包括:
得到所述待研判对象在所述目标时间段的实际结果;
根据所述实际结果对所述预设的传递函数关系进行更新,以采用更新后的传递函数关系得到所述待研判对象的研判结果。
在一些实施例中,所述根据所述实际结果对所述预设的传递函数关系进行更新,包括:
根据所述实际结果对所述信息矩阵进行更新,生成包含实际结果的信息矩阵;
根据所述包含实际结果的信息矩阵对所述预设的传递函数关系进行训练,得到更新后的传递函数关系。
在一些实施例中,所述抽取所述多个文本信息中每个文本信息的关键信息,包括:
采用基于注意力机制的抽取机制,抽取每个文本信息的关键信息。
本申请实施例提供的基于文本的智能研判装置,包括:
获取模块,用于获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,所述多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度;
生成模块,用于根据所述多个文本信息以及预设的传递函数关系,得到对所述待研判对象在目标时间段的研判结果,所述预设的传递函数关系是根据所述待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。
本申请实施例提供的计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请实施例所述的方法。
本申请实施例提供的计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请实施例提供的所述的方法。
本申请实施例所提供的基于文本的智能研判方法、装置、计算机设备和计算机可读存储介质,通过获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度,根据多个文本信息以及预设的传递函数关系,得到对待研判对象在目标时间段的研判结果,预设的传递函数关系是根据待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。这样,能够通过多维度信息获取、预设的传递函数关系,提供准确、全面的研判结果,从而具有实用的优势。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1是本申请实施例公开的一种基于文本的智能研判方法的应用场景图;
图2是本申请实施例公开的一种基于文本的智能研判方法的流程示意图;
图3是本申请实施例公开的一种基于文本的智能研判方法的总体流程图;
图4是本申请实施例公开的一种基于文本的智能研判装置的结构示意图;
图5是本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
需要指出,本申请实施例所涉及的术语“第一\第二\第三”用以区别类似或不同的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
有鉴于此,本申请实施例提供一种基于文本的智能研判方法,该方法应用于智能电子设备。图1为一个实施例中通过的基于文本的智能研判方法的应用场景图。如图1所示,用户可携带、佩戴或使用电子设备10,该电子设备10可包括但不限于手机、可穿戴设备(如智能手表、智能手环、智能眼镜等)、平板电脑,笔记本电脑、车载终端、PC(PersonalComputer,个人计算机)等。该方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。
图2为本申请实施例提供的基于文本的智能研判方法的实现流程示意图。
如图2所示,该方法可以包括以下步骤201至步骤202:
步骤201,获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度。
在本申请实施例中,收集待研判对象在当前研判时间段的多个维度对应的多个文本信息:包括政策维度,如政策文件、官方声明等,当前状态描述维度如相关报道、数据指标等,走势预测维度,如市场分析、专家意见等,以及研判规则维度,如先前建立的研判规则。
步骤202,根据多个文本信息以及预设的传递函数关系,得到对待研判对象在目标时间段的研判结果,预设的传递函数关系是根据待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。
在本申请实施例中,基于历史的研判结果,通过聚类分析得到预设的传递函数关系。可选的,这些函数关系可以是各个维度数据之间的权重或者是数学模型,用于将文本信息转化为研判结果。
根据预设的传递函数关系,将多个文本信息进行处理和转换,以获得待研判对象在目标时间段的研判结果。这可能涉及到数据清洗、特征提取、文本分析等过程。
根据处理后的文本信息,应用预设的传递函数关系,得到待研判对象在目标时间段的研判结果。可选的,这个结果可以是定量的得分、概率值,或者是定性的分类标签等形式。
作为一种示例,根据多个文本信息以及预设的传递函数关系,得到对待研判对象在目标时间段的研判结果,包括:对多个文本信息进行分类,获取分类后的多个文本信息,多个文本信息中来源相同的文本信息为同一类。可选的,收集待研判对象在当前研判时间段的多个维度对应的文本信息。使用文本分类算法(如朴素贝叶斯分类器、支持向量机等)对文本进行分类,将同一来源的文本信息划分为同一类别。对于政策维度、当前状态描述维度、走势预测维度和研判规则维度,可以分别使用不同的分类模型进行分类。
进一步的,根据分类后的多个文本信息生成多个文本信息对应的多个特征向量。可选的,针对每个分类后的文本信息,使用文本特征提取方法,如词袋模型、TF-IDF、词嵌入等,将文本信息转化为数值特征向量。
进一步的,将生成的特征向量组合成信息矩阵。其中每一行表示一个文本信息的特征向量,每一列表示特征向量的一个维度。
进一步的,将信息矩阵输入到预设的传递函数关系中,生成待研判对象在目标时间段的研判结果。可选的,根据历史研判时间段的多个历史研判结果,进行聚类分析,将待研判对象划分为不同的簇。
对于每个簇,可以使用机器学习算法,可选的,如线性回归、支持向量机等建立传递函数关系模型,将信息矩阵作为输入,预测目标时间段的研判结果。
可选的,将目标时间段的文本信息进行分类,并生成对应的特征向量。
可选的,将特征向量输入相应的传递函数关系模型,得到对待研判对象在目标时间段的研判结果。
作为一种示例,对多个文本信息进行分类,获取分类后的多个文本信息,包括:抽取多个文本信息中每个文本信息的关键信息,关键信息为与研判结果相关的文本信息。可选的,对于分类后的与研判结果相关的文本信息,使用信息抽取技术来提取出其中的关键信息。可以使用自然语言处理技术,如命名实体识别、关键词提取、句法分析等方法来识别和抽取关键信息。
进一步的,根据多个关键信息的内容和来源,生成分块矩阵。可选的根据抽取得到的关键信息的内容和来源,将文本信息按照不同的块进行划分。
可以根据关键信息的内容属性,如时间、地点、行业等,和来源属性,如文档类型、数据源等,来进行分块。
将每个分块的文本信息整理为矩阵的形式,其中每一行表示一个文本信息的特征向量,每一列表示特征向量的一个维度,生成分块矩阵。
作为一种示例,根据多个特征向量,生成信息矩阵,包括:计算分块矩阵中多个关键信息,获取分块矩阵中多个关键信息对应的多个特征向量。可选的,对于每个关键信息,进行文本预处理,包括去除停用词、标点符号等,并进行分词处理。进一步的,选择合适的特征提取方法,如词袋模型(Bag-of-Words)、TF-IDF、词嵌入(Word Embedding)等。
对于词袋模型,可以将每个文本信息表示为一个向量,其中每个维度代表一个词,值表示该词在文本中出现的次数或频率。
对于TF-IDF,可以计算每个词在文本中的词频和逆文档频率,然后将它们相乘,得到每个词的TF-IDF权重作为该词的特征值。
对于词嵌入,可以使用预训练的词向量模型(如Word2Vec、GloVe等),将每个词表示为一个固定长度的稠密向量。
进一步的,根据多个特征向量在分块矩阵中的位置,获取多个特征向量中每个特征向量对应的权重。可选的,可以根据特征在分块矩阵中的重要性来计算特征权重。可选的,使用词频作为特征权重,即某个特征的词频越高,其权重越大。
可选的,也可以使用TF-IDF来计算特征权重,该权重可以同时考虑词频和词在整个数据集中的重要性。
进一步的,根据多个特征向量以及与每个特征向量对应的权重,生成信息矩阵。可选的,对于每个分块,将该分块中的特征向量按照一定的顺序组合成一个向量。进一步的,选择按照关键信息的出现顺序或特征权重的大小来确定向量的顺序。将每个分块生成的向量依次串联起来,形成信息矩阵。
作为一种示例,在得到对待研判对象在目标时间段的研判结果后,还包括:得到待研判对象在目标时间段的实际结果。可选的,确定收集的实际结果数据的来源和获取方式,可以包括人工标注、数据监测、调查问卷等方法。确定实际结果数据的时间范围和精度,确保与待研判对象在目标时间段的情况匹配。
基于已有的研判结果和实际结果数据,进行对比分析。可以使用混淆矩阵、精确度-召回率曲线等评估指标来度量研判结果的准确性和可靠性。
分析研判结果和实际结果之间的差异和一致性,并识别出可能存在的偏差和误差。
根据对比分析的结果,确定矫正研判结果的方法。可选的,通过改变权重或系数来调整预设的传递函数关系,使其更加符合实际情况。
可选的,使用统计分析方法,如回归分析、异常检测等,对研判结果进行修正。
可选的,利用机器学习算法,如分类、回归、集成学习等,根据实际结果数据进行模型修正和更新。
可选的,结合领域专业知识和经验,对研判结果进行人工调整和修正。
进一步的,根据实际结果对预设的传递函数关系进行更新,以采用更新后的传递函数关系得到待研判对象的研判结果。可选的,根据矫正方法的选择和实施,更新预设的传递函数关系。进一步的,根据矫正结果,对预设的传递函数关系中的权重或系数进行调整,使其更加贴近实际情况。
使用实际结果数据重新训练模型,以提高研判结果的准确性和可信度。
根据矫正结果,对传递函数关系中的算法参数进行调整和优化,以提高预测性能。
作为一种示例,根据实际结果对预设的传递函数关系进行更新,包括:根据实际结果对信息矩阵进行更新,生成包含实际结果的信息矩阵。可选的,根据实际结果确定需要更新的信息矩阵中的相关数据部分。进一步的,修改信息矩阵中与实际结果相关的数据,将其更新为实际结果所对应的值。
进一步的,根据包含实际结果的信息矩阵对预设的传递函数关系进行训练,得到更新后的传递函数关系。可选的,将更新后的信息矩阵作为输入,结合历史数据和已有的传递函数模型进行聚类分析。
根据聚类分析的结果,重新生成传递函数关系,例如通过机器学习算法训练出一个新的模型或调整原有模型的参数。
利用已更新的传递函数关系和待研判对象在目标时间段的多个维度对应的多个文本信息。
对多个文本信息进行分类,获取分类后的文本信息,以确保相同来源的文本信息被归类到一起。
生成每个分类文本信息的特征向量,并组成信息矩阵。
将信息矩阵输入到新的传递函数关系中,得到待研判对象在目标时间段的新研判结果。
对研判结果进行校正和验证,比较实际结果与研判结果的差异。
根据差异进行调整和修正,例如通过加权平均或其他算法来矫正研判结果,使其更接近实际结果。
将校正后的实际结果反馈回传递函数关系,用于更新模型参数、优化算法或改进预设的传递函数关系。可选的,使用监督学习算法对传递函数关系进行训练,利用实际结果和预测结果之间的差异来调整模型参数,提高研判准确性。
进一步的,抽取多个文本信息中每个文本信息的关键信息,包括:采用基于注意力机制的抽取机制,抽取每个文本信息的关键信息。可选的,对于待抽取关键信息的每个文本信息,首先进行必要的预处理步骤,如分词、去除停用词、词性标注等。使用基于注意力机制的模型来抽取每个文本信息的关键信息。常见的基于注意力机制的模型包括Transformer模型和BERT模型等,可以根据具体任务和需求选择适合的模型。对于每个文本信息,通过模型计算每个词或句子的注意力分数。注意力分数反映了每个词或句子在文本中的重要性,通常通过将输入的文本信息输入到注意力模型中,得到输出的注意力分布。根据计算得到的注意力分数,选择具有较高分数的词或句子作为关键信息。可以采用固定阈值的方式进行筛选,也可以选择前N个分数最高的词或句子。将提取得到的关键信息作为结果输出,可以是关键词、关键短语或者关键句子的形式。这些关键信息反映了每个文本信息的重要特征,有助于后续的研判和分析。
本申请通过获取待研判对象在当前时间段的多个维度对应的文本信息,包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度。通过综合多个维度的信息,可以获得全面的研判依据。利用预设的传递函数关系,结合多个文本信息,对待研判对象在目标时间段进行研判。传递函数关系是通过对待研判对象历史研判结果的聚类分析得到的,能够提高研判的准确性和稳定性。对多个文本信息进行分类,并生成分类后的特征向量和信息矩阵。可以提取文本信息中与研判结果相关的关键信息,进而构建信息矩阵作为研判的输入。在得到待研判对象在目标时间段的研判结果后,还可以对结果进行矫正,得到实际结果。根据实际结果对预设的传递函数关系进行更新,可以提高研判方法的准确性和可靠性。
下面将说明本申请实施例在一个实际的应用场景中的示例性应用。
图3为本申请实施例提供的基于文本的智能研判方法的总体流程。如图3所示,该方法包括如下步骤301至步骤307:
步骤301,获取不同维度的相关文本信息,不同维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度;
步骤302,对获取到的不同维度的相关文本信息进行内容提取,获取到与研判结果相关的文本信息;
步骤303,根据获取到的文本信息构建信息矩阵,信息矩阵包括所有提取到的文本信息,且按照类型和维度进行分块;
步骤304,获取信息矩阵中的文本信息的权重,根据文本信息的权重和文本信息,获取文本信息对应的特征向量;
步骤305,计算特征向量,获取特征参数,特征参数即表征研判结果;
步骤306,获取实际结果,实际结果为历史研判最准确的结果;
步骤307,根据实际结果对研判结果进行调整,获取调整后的研判结果,调整后的研判结果可以作为参数继续输入信息矩阵中,从而生成新的研判结果。
应该理解的是,虽然上述各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
基于前述的实施例,本申请实施例提供一种基于文本的智能研判装置,该装置包括所包括的各模块、以及各模块所包括的各单元,可以通过处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。
图4为本申请实施例提供的基于文本的智能研判装置的结构示意图,如图4所示,所述装置400包括获取模块401和生成模块402,其中:
获取模块401,用于获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度;
生成模块402,用于根据多个文本信息以及预设的传递函数关系,得到对待研判对象在目标时间段的研判结果,预设的传递函数关系是根据待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。
在一些实施例中,获取模块401,还用于对多个文本信息进行分类,获取分类后的多个文本信息,多个文本信息中来源相同的文本信息为同一类;
进一步的,生成模块402,还用于根据分类后的多个文本信息生成多个文本信息对应的多个特征向量;
进一步的,生成模块402,还用于根据多个特征向量,生成信息矩阵;
进一步的,生成模块402,还用于将信息矩阵输入到预设的传递函数关系中,生成待研判对象在目标时间段的研判结果。
在一些实施例中,获取模块401,还用于抽取多个文本信息中每个文本信息的关键信息,关键信息为与研判结果相关的文本信息;
进一步的,生成模块402,还用于根据多个关键信息的内容和来源,生成分块矩阵。
在一些实施例中,获取模块401,还用于计算分块矩阵中多个关键信息,获取分块矩阵中多个关键信息对应的多个特征向量;
进一步的,获取模块401,还用于根据多个特征向量在分块矩阵中的位置,获取多个特征向量中每个特征向量对应的权重;
进一步的,生成模块402,还用于根据多个特征向量以及与每个特征向量对应的权重,生成信息矩阵。
在一些实施例中,获取模块401,还用于得到待研判对象在目标时间段的实际结果;
进一步的,生成模块402,还用于根据实际结果对预设的传递函数关系进行更新,以采用更新后的传递函数关系得到待研判对象的研判结果。
在一些实施例中,生成模块402,还用于根据实际结果对信息矩阵进行更新,生成包含实际结果的信息矩阵;
进一步的,生成模块402,还用于根据包含实际结果的信息矩阵对预设的传递函数关系进行训练,得到更新后的传递函数关系。
在一些实施例中,获取模块401,还用于采用基于注意力机制的抽取机制,抽取每个文本信息的关键信息。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中图4所示的基于文本的智能研判装置对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。也可以采用软件和硬件结合的形式实现。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得电子设备执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
本申请实施例提供一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述方法。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的方法中的步骤。
本申请实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法实施例提供的方法中的步骤。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的基于文本的智能研判装置可以实现为一种计算机程序的形式,计算机程序可在如图5所示的计算机设备上运行。计算机设备的存储器中可存储组成上述装置的各个程序模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的方法中的步骤。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质、存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”或“一些实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”或“在一些实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如对象A和/或对象B,可以表示:单独存在对象A,同时存在对象A和对象B,单独存在对象B这三种情况。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个模块或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或模块的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的模块可以是、或也可以不是物理上分开的,作为模块显示的部件可以是、或也可以不是物理模块;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部模块来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能模块可以全部集成在一个处理单元中,也可以是各模块分别单独作为一个单元,也可以两个或两个以上模块集成在一个单元中;上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得电子设备执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于文本的智能研判方法,其特征在于,所述方法包括:
获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,所述多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度;
根据所述多个文本信息以及预设的传递函数关系,得到对所述待研判对象在目标时间段的研判结果,所述预设的传递函数关系是根据所述待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个文本信息以及预设的传递函数关系,得到对所述待研判对象在目标时间段的研判结果,包括:
对所述多个文本信息进行分类,获取分类后的多个文本信息,所述多个文本信息中来源相同的文本信息为同一类;
根据所述分类后的多个文本信息生成所述多个文本信息对应的多个特征向量;
根据所述多个特征向量,生成信息矩阵;
将所述信息矩阵输入到所述预设的传递函数关系中,生成所述待研判对象在目标时间段的研判结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述多个文本信息进行分类,获取分类后的多个文本信息,包括:
抽取所述多个文本信息中每个文本信息的关键信息,所述关键信息为与研判结果相关的文本信息;
根据多个所述关键信息的内容和来源,生成分块矩阵。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述多个特征向量,生成信息矩阵,包括:
计算所述分块矩阵中多个所述关键信息,获取所述分块矩阵中多个所述关键信息对应的多个特征向量;
根据所述多个特征向量在所述分块矩阵中的位置,获取所述多个特征向量中每个特征向量对应的权重;
根据所述多个特征向量以及与每个特征向量对应的权重,生成信息矩阵。
5.根据权利要求2所述的方法,其特征在于,所述在得到对所述待研判对象在目标时间段的研判结果后,还包括:
得到所述待研判对象在所述目标时间段的实际结果;
根据所述实际结果对所述预设的传递函数关系进行更新,以采用更新后的传递函数关系得到所述待研判对象的研判结果。
6.根据权利要求5所所述的方法,其特征在于,所述根据所述实际结果对所述预设的传递函数关系进行更新,包括:
根据所述实际结果对所述信息矩阵进行更新,生成包含实际结果的信息矩阵;
根据所述包含实际结果的信息矩阵对所述预设的传递函数关系进行训练,得到更新后的传递函数关系。
7.根据权利要求3所述的方法,其特征在于,所述抽取所述多个文本信息中每个文本信息的关键信息,包括:
采用基于注意力机制的抽取机制,抽取每个文本信息的关键信息。
8.一种基于文本的智能研判装置,其特征在于,包括:
获取模块,用于获取待研判对象在当前研判时间段的多个维度对应的多个文本信息,所述多个维度包括政策维度、当前状态描述维度、走势预测维度以及研判规则维度;
生成模块,用于根据所述多个文本信息以及预设的传递函数关系,得到对所述待研判对象在目标时间段的研判结果,所述预设的传递函数关系是根据所述待研判对象的在历史研判时间段的多个历史研判结果进行聚类分析得到的。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311447545.2A CN117556822A (zh) | 2023-11-01 | 2023-11-01 | 基于文本的智能研判方法及装置、设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311447545.2A CN117556822A (zh) | 2023-11-01 | 2023-11-01 | 基于文本的智能研判方法及装置、设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117556822A true CN117556822A (zh) | 2024-02-13 |
Family
ID=89815679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311447545.2A Pending CN117556822A (zh) | 2023-11-01 | 2023-11-01 | 基于文本的智能研判方法及装置、设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117556822A (zh) |
-
2023
- 2023-11-01 CN CN202311447545.2A patent/CN117556822A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110021439B (zh) | 基于机器学习的医疗数据分类方法、装置和计算机设备 | |
US20230013306A1 (en) | Sensitive Data Classification | |
US10521734B2 (en) | Machine learning predictive labeling system | |
CN111639516B (zh) | 基于机器学习的分析平台 | |
US10387784B2 (en) | Technical and semantic signal processing in large, unstructured data fields | |
US10853697B2 (en) | System and method for monitoring online retail platform using artificial intelligence and fixing malfunction | |
CN112085565B (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
CN117453921B (zh) | 一种大语言模型的数据信息标签处理方法 | |
US11481734B2 (en) | Machine learning model for predicting litigation risk on construction and engineering projects | |
CN112818218B (zh) | 信息推荐方法、装置、终端设备及计算机可读存储介质 | |
US11615361B2 (en) | Machine learning model for predicting litigation risk in correspondence and identifying severity levels | |
CN112287672A (zh) | 文本意图识别方法及装置、电子设备、存储介质 | |
Loyola et al. | UNSL at eRisk 2021: A Comparison of Three Early Alert Policies for Early Risk Detection. | |
CN116610592A (zh) | 基于自然语言处理技术的可定制软件测试评价方法及系统 | |
US11803797B2 (en) | Machine learning model to identify and predict health and safety risks in electronic communications | |
Anese et al. | Impact of public news sentiment on stock market index return and volatility | |
CN113420153B (zh) | 一种基于话题库和事件库的专题制作方法、装置及设备 | |
US20190377784A1 (en) | Automated nonparametric content analysis for information management and retrieval | |
CN115098619A (zh) | 资讯去重方法、装置、电子设备及计算机可读取存储介质 | |
CN117556822A (zh) | 基于文本的智能研判方法及装置、设备、存储介质 | |
Manivannan | Semi-supervised imbalanced classification of wafer bin map defects using a Dual-Head CNN | |
KR102215259B1 (ko) | 주제별 단어 또는 문서의 관계성 분석 방법 및 이를 구현하는 장치 | |
CN111199170B (zh) | 配方文件识别方法及装置、电子设备、存储介质 | |
KR20210023453A (ko) | 리뷰 광고 매칭 장치 및 방법 | |
Ye et al. | Data Preparation and Engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |