CN113158646B - 一种基于区块链的自动合成新闻的检测方法及系统 - Google Patents
一种基于区块链的自动合成新闻的检测方法及系统 Download PDFInfo
- Publication number
- CN113158646B CN113158646B CN202110035612.4A CN202110035612A CN113158646B CN 113158646 B CN113158646 B CN 113158646B CN 202110035612 A CN202110035612 A CN 202110035612A CN 113158646 B CN113158646 B CN 113158646B
- Authority
- CN
- China
- Prior art keywords
- news
- sample
- synthesized
- machine
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 20
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000013145 classification model Methods 0.000 claims abstract description 46
- 238000007477 logistic regression Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 17
- 230000007246 mechanism Effects 0.000 claims abstract description 12
- 230000005284 excitation Effects 0.000 claims abstract 2
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于区块链的自动合成新闻的检测方法及系统,其方法包括:步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;步骤S2:利用激励机制对新闻样本集进行纠错;步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,并生成近似真实新闻的机器合成新闻样本;步骤S4:计算合成新闻样本和真实新闻样本的比例,当超过阈值,将机器合成新闻样本加入新闻样本集,进行增量训练,得到更新后的新闻分类结果。本发明可以提高样本集的质量,均衡新闻正负样本,防止过度拟合,并使用智能合约来增量训练逻辑回归分类模型,解决逻辑回归分类模型容易过时的问题。
Description
技术领域
本发明涉及区块链和机器学习领域,具体涉及一种基于区块链的自动合成新闻的检测方法及系统。
背景技术
目前,检测自动合成新闻的方法主要分为两种:事实核查以及机器学习。事实核查通过参考可信赖的网站进行比对。基于机器学习方法需要人工构造特征,通过对人工标注的数据集进行特征提取和学习来构建分类模型。然而,深度预训练语言模型能力的提高颠覆了过往的假设,自动合成新闻在“风格”和“结构”上与真实新闻越发相似。
因此,对于机器学习模型而言,自动合成新闻的特征提取和选择是十分困难的,这决定机器学习模型的上限。并且,当模型被部署到平台上并实际使用后,若不及时获取足够多的最新数据并重新训练,它们将很快会过时。此外,目前自动合成新闻的数量远小于真实新闻的数量,所以构建分类模型时存在正负样本不均衡的问题,这将严重降低模型的泛化能力,从而导致模型失效。
发明内容
为了解决上述技术问题,本发明提供一种基于区块链的自动合成新闻的检测方法及系统。
本发明技术解决方案为:一种基于区块链的自动合成新闻的检测方法,包括:
步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;
步骤S2:根据所述新闻分类结果,利用激励机制对所述新闻样本集进行纠错;
步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到所述生成网络生成近似真实新闻特征分布的机器合成新闻样本;
步骤S4:计算新闻样本集中所述机器合成新闻样本和所述真实新闻样本的比例,如果所述比例超过预设的阈值,则将所述机器合成新闻样本加入所述新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
本发明与现有技术相比,具有以下优点:
1、本发明公开了一种基于区块链的自动合成新闻的检测方法,利用n-gram特征和TF-IDF算法对逻辑回归分类模型进行改进,使该模型能获得到部分时序信息缓解时间序列预测问题,从而捕捉自动合成新闻过程中的抽样方案留下的“伪影”。
2、本发明利用区块链技术对新闻样本集进行纠错,供参与者协作构建新闻样本集。通过激励机制惩罚提交不良数据的贡献者,鼓励贡献者提交能够提高逻辑回归分类模型准确性的新闻样本,以提高样本集的质量。
3、本发明利用生成网络和判别网络进行博弈训练,从而生成机器合成新闻样本,使得新闻样本集的正负样本均衡,防止比例过大的样本造成过拟合,即预测偏向样本数较多的分类,从而实现大幅度提高增量式分类模型的泛化能力。同时,使用智能合约来增量训练逻辑回归分类模型,解决已发布的逻辑回归分类模型若不获取更多数据并对其进行重新训练将很快变得过时的问题。
附图说明
图1为本发明实施例中一种基于区块链的自动合成新闻的检测方法的流程图;
图2为本发明实施例中一种基于区块链的自动合成新闻的检测方法的结构示意图;
图3为本发明实施例中一种基于区块链的自动合成新闻的检测方法中步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果的流程图;
图4本发明实施例中一种基于区块链的自动合成新闻的检测方法中步骤S2:根据新闻分类结果,利用激励机制对新闻样本集进行纠错的流程图;
图5本发明实施例中激励机制的流程图;
图6本发明实施例中一种基于区块链的自动合成新闻的检测方法中步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到生成网络生成近似真实新闻特征分布的机器合成新闻样本的流程图;
图7本发明实施例中生成式对抗网络的结构示意图;
图8本发明实施例中一种基于区块链的自动合成新闻的检测方法中步骤S4:计算新闻样本集中机器合成新闻样本和真实新闻样本的比例,如果所述比例超过预设的阈值,则将机器合成新闻样本加入新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果的流程图;
图9本发明实施例中一种智能排序候选框的目标跟踪系统的结构框图。
具体实施方式
本发明提供了一种基于区块链的自动合成新闻的检测方法及系统,通过对逻辑回归分类模型进行改进,提高样本集的质量,以及通过生成机器合成新闻样本,使得新闻样本集的正负样本均衡,防止比例过大的样本造成过拟合,即预测偏向样本数较多的分类,从而实现大幅度提高增量式分类模型的泛化能力。同时,使用智能合约来增量训练逻辑回归分类模型,解决已发布的逻辑回归分类模型若不获取更多数据并对其进行重新训练将很快变得过时的问题。
为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
实施例一
如图1、图2所示,在一个实施例中,本发明实施例提供的一种基于区块链的自动合成新闻的检测方法,包括下述步骤:
步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;
步骤S2:根据新闻分类结果,利用激励机制对新闻样本集进行纠错;
步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到生成网络生成近似真实新闻特征分布的机器合成新闻样本;
步骤S4:计算新闻样本集中机器合成新闻样本和真实新闻样本的比例,如果比例超过预设的阈值,则将机器合成新闻样本加入新闻样本集,输入逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
如图3所示,在一个实施例中,上述步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果,具体包括;
步骤S11:按照下述公式(1),在新闻样本集中加入n-gram特征;
其中,P(w1,w2,···,wm)表示为长度为m的语句出现概率;P(wi|wi-n-1,···,wi-1)表示词wi与前面n个词相关。本发明实施例中采用了unigram和bigram,即一元模型和二元模型。
步骤S12:按照下述公式(2),利用TF-IDF算法对新闻样本集进行过滤;
其中,count(w)为词w的出现次数,|Di|为新闻Di中所有词的数量,N为所有的新闻样本的总数,I(w,Di)表示新闻Di是否包含词w。
步骤S13:将过滤后的新闻样本集,输入逻辑回归分类模型进行训练,得到新闻的初始分类结果。
本发明实施例通过上述步骤S11和S12分别利用unigram、bigram特征和TF-IDF 算法对现有的逻辑回归分类模型进行改进,并使用智能合约来训练逻辑回归分类模型,使得该模型能获得到部分时序信息缓解时间序列预测问题,从而捕捉自动合成新闻过程中的抽样方案留下的“伪影”。
如图4所示,在一个实施例中,上述步骤S2:根据新闻分类结果,利用激励机制对新闻样本集进行纠错,包括:
步骤S21:在区块链中,每个贡献者提交新闻数据(x,y)时,需要支付押金d;其中,x为新闻数据,y为该新闻数据的标签;
步骤S22:经过预设时间t后,如果逻辑回归分类模型h的分类结果还是h(x)==y,则退还全部押金d;如果h(x)≠y,且其他贡献者提交(x,y′),其中,y′是正确的标签,则对该纠正样本的贡献者按照下述公式(3)退还部分押金:
其中,r(cr,d)为纠正样本的贡献者的退还押金,n(c)为原始的贡献者c提交的不正确或无效新闻样本的数量,n(cr)为更正数据的贡献者cr的数量;
如图5所示,在本步骤中,每个贡献者向区块链提交带有数据x和标签y的新闻样本数据(x,y)时,需要支付押金d。假设(x,y)是带有正确标签的数据,当一定时间t过后,若逻辑回归分类模型h仍然同意最初提交的分类h(x)==y,那么该贡献者就可以被退还全部押金d。如果提交的样本(x,y)不正确或无效,那么在时间t内其他贡献者应该提交 (x,y′),其中y′是正确的标签。在退款阶段已经更正数据的其他贡献者可以找出满足 h(x)==y的数据点(x,y),并请求获取最初在提交(x,y)时提交的一部分押金,可通过上述公式(3)计算可退还的部分押金。
步骤S23:将纠错后的新闻样本更新至新闻样本集。
本发明利用区块链技术对新闻样本集进行纠错,供参与者协作构建新闻样本集。通过激励机制惩罚提交不良数据的贡献者,鼓励贡献者提交能够提高逻辑回归分类模型准确性的新闻样本,以提高样本集的质量。
但是,由于此时新闻样本集中自动合成新闻的数量远小于真实新闻的数量,所以训练逻辑回归分类模型时存在正负样本严重不均衡的问题,这将严重降低模型的泛化能力,从而导致模型失效。因此,通过下述步骤,可以生成近似真实新闻的机器合成新闻,添加到新闻样本集供逻辑回归分类模型进行增量训练。
如图6所示,在一个实施例中,上述步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到生成网络生成近似真实新闻特征分布的机器合成新闻样本,包括:
步骤S31:将随机的噪声样本输入生成网络G,得到机器合成新闻样本;
在本步骤中,将随机的噪声样本,即随机生成的样本,输入生成网络G,由生成网络G根据真实新闻的特征分布,将该随机样本生成机器合成新闻。
步骤S32:将机器合成新闻样本和真实新闻样本一起输入判别网络D,进行判别训练;生成网络G和判别网络D按照下述GAN公式(4),进行判别训练;直到生成网络G 生成近似真实新闻特征分布的机器合成新闻样本,判别训练结束;
其中,GAN的目标优化函数为minGmaxDV(D,G);x为真实新闻样本;z为随机样本;pdata(x)为真实新闻样本服从的分布;pz(z)为随机样本服从的分布;G(z)为由生成网络G生成的尽可能服从真实新闻样本分布pdata(x)的样本,即机器合成新闻样本;E 为计算期望值。
如图7所述,在本发明实施例中,生成网络G和判别网络D构成了生成式对抗网络,在整个训练过程中生成网络G和判别网络D为“博弈”的双方。生成网络G捕捉真实新闻样本的数据的分布,并生成机器合成新闻样本。判别网络D是一个二分类器,用于判断输入的样本来自于生成网络G的概率。生成网络G和判别网络D均为非线性映射函数,是多层感知机或神经网络。在训练过程中,生成网络G的目标是尽量生成与真实新闻样本接近的结果去欺骗判别网络D;而判别网络D的目标是尽量把生成网络G 生成的机器合成新闻样本和真实新闻样本区分开来,因此,生成网络G和判别网络D 形成了一个动态的“博弈过程”。举例来说,判别网络D判断输入的样本是来自于生成网络G的概率为0.9,那么说明判别网络D很容易将输入样本识别为机器合成新闻样本,则由生成网络G继续生成机器合成新闻样本,并由判别网络D继续进行判断。直到生成网络G生成近似真实新闻特征分布的机器合成新闻样本,使得判别网络D无法区分输入样本是机器合成新闻样本和真实新闻样本,比如,此时判别网络D判断输入样本是来自于生成网络G的概率为0.5,说明判别网络D无法判断输入样本是否为合成新闻样本,则训练结束。
本发明利用生成网络和判别网络进行博弈训练,从而生成机器合成新闻样本,使得新闻样本集中的正负样本均衡,防止比例过大的样本造成过拟合,即预测偏向样本数较多的分类,从而实现大幅度提高增量式分类模型的泛化能力。
如图8所示,在一个实施例中,上述步骤S4:计算新闻样本集中机器合成新闻样本和真实新闻样本的比例,如果所述比例超过预设的阈值,则将机器合成新闻样本加入新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果,包括:
步骤S41:计算区块链上新闻样本集中机器合成新闻样本和真实新闻样本的比例,若二者比例超过预设的阈值,则将步骤S32中生成的机器合成新闻样本加入区块链中新闻样本集;
在本步骤中,计算区块链上新闻样本集中机器合成新闻样本和真实新闻样本的比例,若二者数量不均衡,比例超过预设的阈值,则将步骤S32中由生成网络G生成的机器合成新闻样本附加“合成”标签后,加入区块链中新闻样本集。
步骤S42:将更新后的新闻样本集输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
本发明实施例采用随机梯度下降算法对逻辑回归分类模型进行增量更新,即通过小批量的数据迭代更新模型的权重。增量学习定义和SGD算法如下述公式(5)和(6):
hi=hi-1(si,si-1,…,si-p) (5)
其中,si为带标签的训练数据si=(xi,yi),hi是仅取决于hi-1和最近p个例子 si,si-1,…,si-p的模型函数。其中η是学习率,J(θ)为最小化可微目标函数,选取数据样本 i,计算作为目标函数梯度的估计,反方向调整函数自变量θ使函数趋近于其极小值。
本发明使用智能合约来增量训练逻辑回归分类模型,可解决已发布的逻辑回归分类模型若不获取更多数据并对其进行重新训练将很快变得过时的问题。
实施例二
如图9所示,本发明实施例提供了一种基于区块链的自动合成新闻的检测系统,包括下述模块:
初始新闻分类模块41,用于将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;
新闻样本纠错模块42,用于根据新闻分类结果,利用激励机制对新闻样本集进行纠错;
机器合成新闻样本生成模块,用于通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到生成网络生成近似真实新闻特征分布的机器合成新闻样本;
更新新闻分类模块,用于计算新闻样本集中机器合成新闻样本和真实新闻样本的比例,如果比例超过预设的阈值,则将机器合成新闻样本加入新闻样本集,输入逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。
Claims (5)
1.一种基于区块链的自动合成新闻的检测方法,其特征在于,包括:
步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果,具体包括:
步骤S11:按照下述公式(1),在所述新闻样本集中加入n-gram特征;
其中,P(w1,w2,···,wm)表示为长度为m的语句出现概率;P(wi|wi-n-1,···,wi-1)表示词wi与前面n个词相关;
步骤S12:按照下述公式(2),利用TF-IDF算法对所述新闻样本集进行过滤;
其中,count(w)为词w的出现次数,|Di|为新闻Di中所有词的数量,N为所有的新闻样本的总数,I(w,Di)表示新闻Di是否包含词w;
步骤S13:将过滤后的所述新闻样本集,输入所述逻辑回归分类模型进行训练,得到初始的新闻分类结果;
步骤S2:根据所述新闻分类结果,利用激励机制对所述新闻样本集进行纠错;
步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到所述生成网络生成近似真实新闻特征分布的机器合成新闻样本;
步骤S4:计算所述新闻样本集中所述机器合成新闻样本和所述真实新闻样本的比例,如果所述比例超过预设的阈值,则将所述机器合成新闻样本加入所述新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
2.根据权利要求1所述的基于区块链的自动合成新闻的检测方法,其特征在于,所述步骤S2:根据所述新闻分类结果,利用激励机制对所述新闻样本集进行纠错,包括:
步骤S21:在区块链中,每个贡献者提交新闻数据(x,y)时,需要支付押金d;其中,x为新闻数据,y为所述新闻数据的标签;
步骤S22:经过预设时间t后,如果所述逻辑回归分类模型h的分类结果还是h(x)==y,则退还全部押金d;如果h(x)≠y,且其他贡献者提交(x,y'),其中,y'是正确的标签,则对纠正样本的贡献者按照下述公式(3)退还部分押金:
其中,r(cr,d)为纠正样本的贡献者的退还押金,n(c)为原始的贡献者c提交的不正确或无效新闻样本的数量,n(cr)为更正数据的贡献者cr的数量;
步骤S23:将纠错后的新闻样本更新至所述新闻样本集。
3.根据权利要求1所述的基于区块链的自动合成新闻的检测方法,其特征在于,所述步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到所述生成网络生成近似真实新闻特征分布的机器合成新闻样本,包括:
步骤S31:将随机的噪声样本输入生成网络G,得到机器合成新闻样本;
步骤S32:将所述机器合成新闻样本和真实新闻样本一起输入判别网络D,进行判别训练;其中,所述生成网络G和所述判别网络D按照下述GAN公式(4),进行判别训练;直到所述生成网络生成近似真实新闻特征分布的机器合成新闻样本,判别训练结束;
其中,GAN的目标优化函数为minGmaxDV(D,G);x为真实新闻样本;z为随机样本;Pdata(x)为真实新闻样本服从的分布;pz(z)为随机样本服从的分布;G(z)为所述生成网络G生成的尽可能服从真实新闻样本分布Pdata(x)的样本;E为计算期望值。
4.根据权利要求3所述的基于区块链的自动合成新闻的检测方法,其特征在于,所述步骤S4:计算所述新闻样本集中所述机器合成新闻样本和所述真实新闻样本的比例,如果所述比例超过预设的阈值,则将所述机器合成新闻样本加入所述新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果,包括:
步骤S41:计算区块链上所述新闻样本集中所述机器合成新闻样本和所述真实新闻样本数量的比例,若二者比例超过预设的阈值,则将步骤S32中得到的所述机器合成新闻样本加入区块链中所述新闻样本集;
步骤S42:将更新后的所述新闻样本集输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
5.一种基于区块链的自动合成新闻的检测系统,其特征在于,包括下述模块:
初始新闻分类模块,用于将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果,具体包括:
步骤S11:按照下述公式(1),在所述新闻样本集中加入n-gram特征;
其中,P(w1,w2,···,wm)表示为长度为m的语句出现概率;P(wi|wi-n-1,···,wi-1)表示词wi与前面n个词相关;
步骤S12:按照下述公式(2),利用TF-IDF算法对所述新闻样本集进行过滤;
其中,count(w)为词w的出现次数,|Di|为新闻Di中所有词的数量,N为所有的新闻样本的总数,I(w,Di)表示新闻Di是否包含词w;
步骤S13:将过滤后的所述新闻样本集,输入所述逻辑回归分类模型进行训练,得到初始的新闻分类结果;
新闻样本纠错模块,用于根据所述新闻分类结果,利用激励机制对所述新闻样本集进行纠错;
机器合成新闻样本生成模块,用于通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到所述生成网络生成近似真实新闻特征分布的所述机器合成新闻样本;
更新新闻分类模块,用于计算所述新闻样本集中所述机器合成新闻样本和所述真实新闻样本的比例,如果所述比例超过预设的阈值,则将所述机器合成新闻样本加入所述新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110035612.4A CN113158646B (zh) | 2021-01-12 | 2021-01-12 | 一种基于区块链的自动合成新闻的检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110035612.4A CN113158646B (zh) | 2021-01-12 | 2021-01-12 | 一种基于区块链的自动合成新闻的检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113158646A CN113158646A (zh) | 2021-07-23 |
CN113158646B true CN113158646B (zh) | 2023-10-27 |
Family
ID=76878470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110035612.4A Active CN113158646B (zh) | 2021-01-12 | 2021-01-12 | 一种基于区块链的自动合成新闻的检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113158646B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008428A (zh) * | 2019-03-29 | 2019-07-12 | 深圳市元征科技股份有限公司 | 新闻数据处理方法、装置、区块链节点设备及存储介质 |
KR20190107832A (ko) * | 2018-03-13 | 2019-09-23 | 국민대학교산학협력단 | 불신지수 벡터 기반의 가짜뉴스 탐지 장치 및 방법, 이를 기록한 기록매체 |
CN110334263A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目舆情监控方法以及装置 |
CN110704533A (zh) * | 2019-09-24 | 2020-01-17 | 东北大学 | 一种基于区块链和投票机制的假新闻监测方法 |
KR20200081790A (ko) * | 2018-12-28 | 2020-07-08 | 주식회사 이르테크 | 언어분석과 블록체인을 이용한 문서의 변조율 측정 및 변조 항목 추적 장치 |
KR20200106231A (ko) * | 2019-02-22 | 2020-09-14 | 글로벌사이버대학교 산학협력단 | 정성적 가짜 뉴스 판단 시스템, 판단 방법 및 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 |
CN112131347A (zh) * | 2020-09-25 | 2020-12-25 | 天津大学 | 一种基于多模态融合的假新闻检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188194B (zh) * | 2019-04-26 | 2020-12-01 | 哈尔滨工业大学(深圳) | 一种基于多任务学习模型的假新闻检测方法及系统 |
-
2021
- 2021-01-12 CN CN202110035612.4A patent/CN113158646B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190107832A (ko) * | 2018-03-13 | 2019-09-23 | 국민대학교산학협력단 | 불신지수 벡터 기반의 가짜뉴스 탐지 장치 및 방법, 이를 기록한 기록매체 |
KR20200081790A (ko) * | 2018-12-28 | 2020-07-08 | 주식회사 이르테크 | 언어분석과 블록체인을 이용한 문서의 변조율 측정 및 변조 항목 추적 장치 |
KR20200106231A (ko) * | 2019-02-22 | 2020-09-14 | 글로벌사이버대학교 산학협력단 | 정성적 가짜 뉴스 판단 시스템, 판단 방법 및 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 |
CN110008428A (zh) * | 2019-03-29 | 2019-07-12 | 深圳市元征科技股份有限公司 | 新闻数据处理方法、装置、区块链节点设备及存储介质 |
CN110334263A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目舆情监控方法以及装置 |
CN110704533A (zh) * | 2019-09-24 | 2020-01-17 | 东北大学 | 一种基于区块链和投票机制的假新闻监测方法 |
CN112131347A (zh) * | 2020-09-25 | 2020-12-25 | 天津大学 | 一种基于多模态融合的假新闻检测方法 |
Non-Patent Citations (2)
Title |
---|
Unsupervised rumor detection based on users’behaviors using neural networks;Chen W,Zhang Y,Yeo C K,et al.;Pattern Recognition Letters;第105卷;全文 * |
基于改进生成对抗网络的谣言检测方法;李奥;但志平;董方敏;刘龙文;冯阳;;中文信息学报(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113158646A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310814A (zh) | 利用不平衡正负样本对业务预测模型训练的方法及装置 | |
US8676731B1 (en) | Data extraction confidence attribute with transformations | |
CN111477247B (zh) | 基于gan的语音对抗样本生成方法 | |
CN113657993B (zh) | 信用风险识别方法、装置、设备及存储介质 | |
CN108509492B (zh) | 基于房地产行业的大数据处理及系统 | |
CN111008898B (zh) | 评估模型解释工具的方法和装置 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN114663002A (zh) | 一种自动化匹配绩效考核指标的方法及设备 | |
CN113537200A (zh) | 基于图像识别的信息回填方法、装置、设备及介质 | |
CN111091809B (zh) | 一种深度特征融合的地域性口音识别方法及装置 | |
CN107392217A (zh) | 计算机实现的信息处理方法及装置 | |
CN117333290B (zh) | 一种一体化多尺度风控模型构建方法 | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN111047092A (zh) | 纠纷案件胜率预测方法、装置、计算机设备及存储介质 | |
CN113158646B (zh) | 一种基于区块链的自动合成新闻的检测方法及系统 | |
CN101266793B (zh) | 通过对话回合间上下文关系来减少辨识错误的装置与方法 | |
CN111915312A (zh) | 风险识别方法及装置和电子设备 | |
CN116361488A (zh) | 一种基于知识图谱挖掘风险对象的方法及装置 | |
US20210326645A1 (en) | Robust correlation of vehicle extents and locations when given noisy detections and limited field-of-view image frames | |
US11508051B2 (en) | Image and data analystics model compatibility regulation methods | |
CN110852854B (zh) | 一种量化收益模型的生成方法和风险控制策略的评价方法 | |
Abbas et al. | From Good Ideas to Practical Solutions: The Changing Nature of Participation in Our Evolving Digital Landscape [Guest Editorial] | |
CN114926272B (zh) | 基于端到端模型的行为逾期预测方法、系统、设备和介质 | |
CN116843432B (zh) | 一种基于地址文本信息的反欺诈方法和装置 | |
Altınçay et al. | An information theoretic framework for weight estimation in the combination of probabilistic classifiers for speaker identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |