CN110674257B - 评估网络空间中文本信息真实性的方法 - Google Patents
评估网络空间中文本信息真实性的方法 Download PDFInfo
- Publication number
- CN110674257B CN110674257B CN201910911775.7A CN201910911775A CN110674257B CN 110674257 B CN110674257 B CN 110674257B CN 201910911775 A CN201910911775 A CN 201910911775A CN 110674257 B CN110674257 B CN 110674257B
- Authority
- CN
- China
- Prior art keywords
- entity
- text information
- relationship
- authenticity
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 44
- 238000012512 characterization method Methods 0.000 claims abstract description 32
- 238000011156 evaluation Methods 0.000 claims abstract description 19
- 238000003062 neural network model Methods 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 230000007704 transition Effects 0.000 description 5
- 235000015197 apple juice Nutrition 0.000 description 2
- 235000015203 fruit juice Nutrition 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种评估网络空间中文本信息真实性的方法,包括:对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体‑关系规则,建立实体‑关系数据库,再计算各实体‑关系得分;结合实体‑关系得分,构建单条文本信息的实体‑关系网络,从而获得每一单条文本信息的表征向量;利用单条文本信息的表征向量构建文本信息的真实性评估网络,从而对待确定真实性的单条文本信息进行真实性评估。
Description
技术领域
本发明涉及计算机、人工智能、自然语言处理技术领域,尤其涉及一种评估网络空间中文本信息真实性的方法。
背景技术
网络空间中的海量文本信息具有碎片化、社会化、即时性等特点,且由于网络空间中信息真假难辨,因此为了能够更好地提取文本信息中的有效内容,需要一种有效评估文本信息真实性的方法。评估文本信息的真实性是为了表示信息为真实的可能性,真实性大则表示该信息为有效信息的可能性越高,这一评估方法的优劣影响了信息处理过程中对海量信息的利用率。对于文本信息的处理与分类,已经有较多的解决方案,例如CN2018104591390提出一种文本的情感分类方法,CN2017113465570提出一种对短信文本根据内容进行分类的方法。
但是,目前对于文本信息中所反映的内容是否为客观真实的评估,目前还没有较为有效的方案。
发明内容
本发明的目的是提供一种评估网络空间中文本信息真实性的方法,可以准确评估文本信息真实性,填补现有技术的空白。
本发明的目的是通过以下技术方案实现的:
一种评估网络空间中文本信息真实性的方法,包括:
对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体-关系规则,建立实体-关系数据库,再计算各实体-关系得分;
结合实体-关系得分,构建单条文本信息的实体-关系网络,从而获得每一单条文本信息的表征向量;
利用单条文本信息的表征向量构建文本信息的真实性评估网络,从而对待确定真实性的单条文本信息进行真实性评估。
由上述本发明提供的技术方案可以看出,可以抽取文本信息中的实体和实体之间的关系,并对其进行建模成关系网络的形式,在关系网络上运用网络表征学习方法学习文本信息的特征,并准确地评估信息与信息中涉及的实际事件的相关性以及其为真实的可能性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种评估网络空间中文本信息真实性的方法的流程图;
图2为本发明实施例提供的由海量文本信息形成实体-关系库流程图;
图3为本发明实施例提供的神经网络模型的结构示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种评估网络空间中文本信息真实性的方法,如图1所示,其主要包括:
1、对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体-关系规则,建立实体-关系数据库,再计算各实体-关系得分。
本领域技术人员可以理解,单条文本信息也即文本信息库中任一条单独的文本信息,它是指对于特定事件的发生、发展、结局等变化中事实的描述文本,对于推动与特定事件相关的决策具有至关重要的作用。示例性的,被告人焦某挪用公款360万元用于归还欠款,这条信息描述的事实可以作为有关部门判决被告人是否违法的依据。
所述文本信息数量满足要求是指文本信息数量足够多,从而能够建立丰富的实体-关系数据库,具体的数量要求可以根据实际情况设定。
本步骤主要包括三个部分:抽取命名实体、建立实体-关系数据库、计算实体-关系得分。前两个部分的主要过程如图2所示。各阶段的优选实施方式如下:
1)抽取命名实体。
首先,分词处理:对于文本信息中的每一句话,使用四标记B、O、M、E,为一句话中的每个字进行标记,四标记分别表示相应字是:词语开始的字、单独成词、词语中间的字、词语结束的字;对一句话分词的目标是最大化句子结束的字的分数,对于每一个字的每一种标记的权重,计算方法为寻找路径的最大化;得到结束的字的最大得分后,回溯经过的路径,从而完成一个句子的分词。
示例性的,命名实体可以是人名、地名、机构名等。
以具体示例展示如何为一句话进行分词:假设存在一句话“一二三四五”,可以计算得到每一个字对应四种标记的权重WiB,WiO,WiM,WiE和对应四种标记的分数SiB,SiO,SiM,SiE,Wi是一个待训练的权值,Si指的是第i个字作为B,O,M,E的得分。这一步的目标是通过迭代收敛最终使句子中最后一个字的得分最高,然后可以通过这个式子回溯经过的路径,从而确定整个句子中的每个字是属于B,O,M,E中的哪一种,从而实现分词。
对于每一个字的每一种标记的权重,计算方法为寻找路径的最大化,比如如果需要计算“二”字作为词语开始的字的得分,也就是计算:
S2B=max((v(BB)+S1B),(v(OB)+S1O),(v(MB)+S1M),(v(EB)+S1E))+W2B)
其中,v(BB)、v(OB)、v(MB)、v(EB)分别表示,以标记B转移为标记B的概率、以标记O转移为标记B的概率、以标记M转移为标记B的概率、以标记E转移为标记B的概率;S1B、S2B、S1O、S1M、S1E分别表示,第1个字作为标记B的得分、第2个字作为标记B的得分、第1个字作为标记O的得分、第1个字作为标记M的得分、第1个字作为标记E的得分;W2B表示第2个字为标记B的权值;
转移概率v和权重W都可以通过训练得到,得到句子中最后一个字“五”的最大得分后,回溯经过的路径,就可以完成句子的分词。
然后,通过引入字典和专家知识,为分词得到的词语标注词性从而识别并抽取出命名实体。
2)建立实体-关系数据库。
本发明实施例中,通过经验规则设计实体-关系规则,利用抽取到的命名实体,在相应文本信息中进行命名实体X→关系→命名实体Y三元组的抽取,这一三元组体现了两个命名实体X与Y的关系,构成一个实体-关系。
再使用以下规则对建立实体-关系数据库:将出现次数超出阈值的实体-关系加入实体-关系数据库、将根据专家意见设定的实体-关系加入实体-关系数据库、以及由已有的实体-关系逻辑复合生成实体-关系加入实体-关系数据库,最终得到实体-关系数据库。
以一个简单的逻辑复合为例,A包含B,B包含C,则A包含C。其中ABC是命名实体,“包含”是两个命名实体之间的关系。例如,液体(A)包含果汁(B),果汁(B)包含苹果汁(C),则液体(A)包含苹果汁(C)。
3)计算实体-关系得分。
本发明实施例中,通过不同角度对实体-关系进行评估,并所有评估结果计算实体-关系的最终得分;
计算支持度,支持度是两个命名实体X与Y在文本信息中被同时提及的概率:
式中,N表示文本信息总量,Freq(X∩Y)表示出现了X∩Y的文本信息的数量;
计算置信度,置信度是文本信息中含有命名实体X的条件下同时含有命名实体Y的概率:
式中,Freq(X)表示出现了命名实体X的文本信息的数量;
计算提升度,提升度是含有命名实体X的条件下同时含有命名实体Y的概率,与只有命名实体Y的概率之比,体现两个命名实体X与Y的相关性:
式中,Freq(Y)表示出现了命名实体Y的文本信息的数量;
综合以上评估结果计算两个命名实体X与Y的所构成的实体-关系的最终得分:
Score=(αSupport*Lift+βConfidence)*100%
其中,α,β是可自由调节的参数。
2、结合实体-关系得分,构建单条文本信息的实体-关系网络,从而获得每一单条文本信息的表征向量。
本步骤分为主要分为两个部分:构建单条文本信息的实体-关系网络、计算表征向量。各部分的优选实施方式如下:
1)构建单条文本信息的实体-关系网络。
首先,对单条文本信息的命名实体进行抽取,并结合设计的实体-关系规则,获得若干实体-关系的合集。具体的可以采用前文步骤1所述的方式。
然后,将其中的命名实体作为网络的节点,命名实体之间的关系作为网络中相应节点的连边,连边的权值则通过将查询实体-关系得分,并使用softmax进行归一化得到。
2)计算表征向量。
使用神经网络模型来计算实体-关系网络表征向量,神经网络模型中步骤t处的状态更新使用以下公式表示:
其中,表示第t步时节点i的状态,表示第t-1步时节点i的状态,表示利用计算出的中间量,U是神经网络模型中待训练的参数;表示第t-1步时节点i的邻居节点j的状态,N(i)是节点i的邻居集合,表示节点i在第t步时的邻居节点的表征向量集合;g为一种非线性激活函数,W和U是待训练的参数,表示第t步节点i的门结构参数
利用得到的节点的状态获得相应节点的表征向量,最终将所有节点的表征向量求均值,从而得到表示单条文本信息的网络的表征向量。
神经网络模型结构如图3所示。图3左侧表示例的“实体-关系”网络结构,右侧代表形成的神经网络模型,神经网络模型中每一行三个神经网络单元视为一个“行结构”,每一行结构与上一行的连接方式与原网络结构的连边一一对应,节点默认视为与自身存在一条连边。值得注意的是,神经网络模型的规模可根据实际情况来调整,图3所示规模仅为示例,并非构成限制。
3、利用单条文本信息的表征向量构建文本信息的真实性评估网络,从而对待确定真实性的单条文本信息进行真实性评估。
本步骤分为主要分为两个部分:构建文本信息的真实性评估网络、真实性评估。各部分的优选实施方式如下:
1)构建文本信息的真实性评估网络。
生成两个节点,记为节点真和节点假,并取出文本信息库中带有真实标签的文本信息;
将所有标记为真的文本信息与节点真连接,将所有标记为假的文本信息节点与节点假连接,得到真实性评估网络拓扑结构;
之后,计算节点真和节点假各自邻居的表征向量的均值,各自作为这两个节点本身的表征向量;其中,节点真邻居的表征向量也即各个标记为真的文本信息网络的表征向量;节点假邻居的表征向量也即各个标记为假的文本信息网络的表征向量;这些表征向量都可通过上一步骤计算得到。
示例性的,以节点真为例,假设它连接了10个标记为真的文本信息,则将10个文本信息的表征向量(通过前述步骤2得到)的均值作为节点真的表征向量。
2)真实性评估。
计算待确定真实性的单条文本信息的表征向量,具体的可以采用前述步骤1~2中的方式来计算。
分别计算待确定真实性的单条文本信息的表征向量与节点真和节点假表征向量的欧氏距离,计算结果记为D真与D假;
利用欧氏距离计算结果计算真实性评估得分:P真=D真/(D真+D假)。
另一方面,计算得到真实性之后,使待确定真实性的单条文本信息分别与节点真和节点假连边,连边权值分别为P真和(1-P真),并更新节点真和节点假的表征向量。同时,还将计算到的真实性评估得分作为相应单条文本信息的标签,更新实体关系库。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (8)
1.一种评估网络空间中文本信息真实性的方法,其特征在于,包括:
对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体-关系规则,建立实体-关系数据库,再计算各实体-关系得分;
结合实体-关系得分,构建单条文本信息的实体-关系网络,从而获得每一单条文本信息的表征向量;
利用单条文本信息的表征向量构建文本信息的真实性评估网络,从而对待确定真实性的单条文本信息进行真实性评估。
2.根据权利要求1所述的一种评估网络空间中文本信息真实性的方法,其特征在于,对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取的方式包括:
分词处理:对于文本信息中的每一句话,使用四标记B、O、M、E,为一句话中的每个字进行标记,四标记分别表示相应字是:词语开始的字、单独成词、词语中间的字、词语结束的字;对一句话分词的目标是最大化句子中最后一个字的分数,对于每一个字的每一种标记的权重,计算方法为寻找路径的最大化;得到结束的字的最大得分后,回溯经过的路径,从而完成一个句子的分词;
通过引入字典和专家知识,为分词得到的词语标注词性从而识别并抽取出命名实体。
3.根据权利要求1所述的一种评估网络空间中文本信息真实性的方法,其特征在于,建立实体-关系数据库的方式包括:
通过经验规则设计实体-关系规则,利用抽取到的命名实体,在相应文本信息中进行命名实体X→关系→命名实体Y三元组的抽取,这一三元组体现了两个命名实体X与Y的关系,构成一个实体-关系;
再使用以下规则建立实体-关系数据库:将出现次数超出阈值的实体-关系加入实体-关系数据库、将根据专家意见设定的实体-关系加入实体-关系数据库、以及由已有的实体-关系逻辑复合生成实体-关系加入实体-关系数据库库,最终得到实体-关系数据库。
4.根据权利要求1或2或3所述的一种评估网络空间中文本信息真实性的方法,其特征在于,计算各实体-关系得分的方式包括:
通过不同角度对实体-关系进行评估,并所有评估结果计算实体-关系的最终得分;
计算支持度,支持度是两个命名实体X与Y在文本信息中被同时提及的概率:
式中,N表示文本信息总量,Freq(X∩Y)表示出现了X∩Y的文本信息的数量;
计算置信度,置信度是文本信息中含有命名实体X的条件下同时含有命名实体Y的概率:
式中,Freq(X)表示出现了命名实体X的文本信息的数量;
计算提升度,提升度是含有命名实体X的条件下同时含有命名实体Y的概率,与只有命名实体Y的概率之比,体现两个命名实体X与Y的相关性:
式中,Freq(Y)表示出现了命名实体Y的文本信息的数量;
综合以上评估结果计算两个命名实体X与Y的所构成的实体-关系的最终得分:
Score=(αSupport*Lift+βConfidence)*100%
其中,α,β是可自由调节的参数。
5.根据权利要求1或2或3所述的一种评估网络空间中文本信息真实性的方法,其特征在于,所述构建单条文本信息的实体-关系网络包括:
对单条文本信息的命名实体进行抽取,并结合设计的实体-关系规则,获得若干实体-关系的合集;将其中的命名实体作为网络的节点,命名实体之间的关系作为网络中相应节点的连边,连边的权值则通过将查询实体-关系得分,并使用softmax进行归一化得到。
6.根据权利要求1所述的一种评估网络空间中文本信息真实性的方法,其特征在于,获得每一单条文本信息的表征向量的方式包括:
使用神经网络模型来计算实体-关系网络表征向量,神经网络模型中步骤t处的状态更新使用以下公式表示:
其中,表示第t步时节点i的状态,表示第t-1步时节点i的状态,表示利用计算出的中间量,U是神经网络模型中待训练的参数;表示第t-1步时节点i的邻居节点j的状态,N(i)是节点i的邻居集合,表示节点i在第t步时的邻居节点的表征向量集合;g为一种非线性激活函数,W和U是待训练的参数,表示第t步节点i的门结构参数
利用得到的节点的状态获得相应节点的表征向量,最终将所有节点的表征向量求均值,从而得到表示单条文本信息的网络的表征向量。
7.根据权利要求1所述的一种评估网络空间中文本信息真实性的方法,其特征在于,利用单条文本信息的表征向量构建文本信息的真实性评估网络的方式包括:
生成两个节点,记为节点真和节点假,并取出文本信息库中带有真实标签的文本信息;
将所有标记为真的文本信息与节点真连接,将所有标记为假的文本信息节点与节点假连接,得到真实性评估网络拓扑结构;
之后,计算节点真和节点假各自邻居的表征向量的均值,各自作为这两个节点本身的表征向量;其中,节点真邻居的表征向量也即各个标记为真的文本信息网络的表征向量;节点假邻居的表征向量也即各个标记为假的文本信息网络的表征向量。
8.根据权利要求7所述的一种评估网络空间中文本信息真实性的方法,其特征在于,对待确定真实性的单条文本信息进行真实性评估的方式包括:
计算待确定真实性的单条文本信息的表征向量;
分别计算待确定真实性的单条文本信息的表征向量与节点真和节点假表征向量的欧氏距离,计算结果记为D真与D假;
利用欧氏距离计算结果计算真实性评估得分:P真=D真/(D真+D假)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910911775.7A CN110674257B (zh) | 2019-09-25 | 2019-09-25 | 评估网络空间中文本信息真实性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910911775.7A CN110674257B (zh) | 2019-09-25 | 2019-09-25 | 评估网络空间中文本信息真实性的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110674257A CN110674257A (zh) | 2020-01-10 |
CN110674257B true CN110674257B (zh) | 2022-10-28 |
Family
ID=69078990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910911775.7A Active CN110674257B (zh) | 2019-09-25 | 2019-09-25 | 评估网络空间中文本信息真实性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674257B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933164A (zh) * | 2015-06-26 | 2015-09-23 | 华南理工大学 | 互联网海量数据中命名实体间关系提取方法及其系统 |
CN108416535A (zh) * | 2018-03-27 | 2018-08-17 | 中国科学技术大学 | 基于深度学习的专利价值评估的方法 |
WO2019015269A1 (zh) * | 2017-07-18 | 2019-01-24 | 中译语通科技股份有限公司 | 基于最大熵和神经网络模型的韩语命名实体识别方法 |
-
2019
- 2019-09-25 CN CN201910911775.7A patent/CN110674257B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933164A (zh) * | 2015-06-26 | 2015-09-23 | 华南理工大学 | 互联网海量数据中命名实体间关系提取方法及其系统 |
WO2019015269A1 (zh) * | 2017-07-18 | 2019-01-24 | 中译语通科技股份有限公司 | 基于最大熵和神经网络模型的韩语命名实体识别方法 |
CN108416535A (zh) * | 2018-03-27 | 2018-08-17 | 中国科学技术大学 | 基于深度学习的专利价值评估的方法 |
Non-Patent Citations (2)
Title |
---|
基于类内分布信息的文本特征提取方法;毛大鹏;《信息与电脑(理论版)》;20171023(第20期);全文 * |
结合实体共现信息与句子语义特征的关系抽取方法;马语丹等;《中国科学:信息科学》;20181121(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110674257A (zh) | 2020-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159395B (zh) | 基于图神经网络的谣言立场检测方法、装置和电子设备 | |
CN108415953B (zh) | 一种基于自然语言处理技术的不良资产经营知识管理方法 | |
CN112417099B (zh) | 一种基于图注意力网络的欺诈用户检测模型构建方法 | |
CN110502626B (zh) | 一种基于卷积神经网络的方面级情感分析方法 | |
Chang et al. | Research on detection methods based on Doc2vec abnormal comments | |
CN110929034A (zh) | 一种基于改进lstm的商品评论细粒度情感分类方法 | |
Lin et al. | A post-processing method for detecting unknown intent of dialogue system via pre-trained deep neural network classifier | |
CN106611375A (zh) | 一种基于文本分析的信用风险评估方法及装置 | |
CN112199608A (zh) | 基于网络信息传播图建模的社交媒体谣言检测方法 | |
CN107577665B (zh) | 文本情感倾向的判别方法 | |
CN108304479A (zh) | 一种基于图结构过滤的快速密度聚类双层网络推荐方法 | |
CN111651606B (zh) | 一种文本处理方法、装置及电子设备 | |
CN113742733B (zh) | 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置 | |
CN114492423A (zh) | 基于特征融合及筛选的虚假评论检测方法、系统及介质 | |
Meoli et al. | Machine-learning forecasting of successful ICOs | |
CN110659948A (zh) | 一种进销商品匹配度计算方法及虚开发票风险发现方法 | |
CN113919440A (zh) | 一种融合双重注意力机制和图卷积社交网络谣言检测系统 | |
CN113887214B (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
Mahdin et al. | Sentiment analysis on COVID-19 vaccine tweets using machine learning and deep learning algorithms | |
CN114462673A (zh) | 用于预测未来事件的方法、系统、计算设备和可读介质 | |
CN111859925B (zh) | 一种基于概率情感词典的情感分析系统及方法 | |
Baboo et al. | Sentiment analysis and automatic emotion detection analysis of twitter using machine learning classifiers | |
CN113297387A (zh) | 一种基于nkd-gnn的图文不匹配新闻检测方法 | |
CN110674257B (zh) | 评估网络空间中文本信息真实性的方法 | |
US20170293863A1 (en) | Data analysis system, and control method, program, and recording medium therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |