CN114880540A - 一种基于智慧金融文本评论的智能提醒方法 - Google Patents

一种基于智慧金融文本评论的智能提醒方法 Download PDF

Info

Publication number
CN114880540A
CN114880540A CN202210596599.4A CN202210596599A CN114880540A CN 114880540 A CN114880540 A CN 114880540A CN 202210596599 A CN202210596599 A CN 202210596599A CN 114880540 A CN114880540 A CN 114880540A
Authority
CN
China
Prior art keywords
user
financial
comments
intelligent
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210596599.4A
Other languages
English (en)
Inventor
熊常春
王敬贵
李国元
沈之锐
吴江川
李苗
熊桥峰
张富耕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jilian Technology Co ltd
Original Assignee
Shenzhen Jilian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jilian Technology Co ltd filed Critical Shenzhen Jilian Technology Co ltd
Priority to CN202210596599.4A priority Critical patent/CN114880540A/zh
Publication of CN114880540A publication Critical patent/CN114880540A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本申请提供一种基于智慧金融文本评论的智能提醒方法,包括:本申请提供一种基于智慧金融文本评论的智能提醒方法,包括:获取用户在不同网络平台发表过的智慧金融文本评论;对用户智慧金融文本评论进行分级,标注最高级别用户;获取金融文章允许评论的用户级别,限制低于允许评论的级别的用户评论,具体包括:对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒;对新的智慧金融文本评论进行分级,对用户发出智能提醒;判断评论信息是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护;对最高级别智慧金融评论智能关联法律案件、法律法规进行预警。

Description

一种基于智慧金融文本评论的智能提醒方法
技术领域
本发明涉及信息技术领域,尤其涉及一种基于智慧金融文本评论的智能提醒方法。
背景技术
本发明涉及计算机应用技术领域,尤其设计一种基于智慧金融文本评论的智能提醒系统。
基于智慧金融文本评论的智能提醒技术是智能提醒技术的一种新的尝试。智慧金融作为金融信息化的进一步延伸正在深刻改变着金融行业生态,并渗入用户的衣食住行方面,每个人都是智慧金融红利的享有者,而在媒体平台迅速发展的当下,智慧金融作为热点话题,在各大网络平台都有大量的媒体文章,用户通过各大网络媒体平台阅读与智慧金融相关的媒体文章,并针对媒体文章发表个人评论,这些网络平台也各自采用个性化推荐算法为用户提供更为智能化的媒体文章板块。但对于网络上存在的不当评论,甚至违法评论平台却并没有及时给出警醒,用户在不知情的情况下甚至违法违规后才知道该行为不当。
发明内容
本发明提供了一种基于智慧金融文本评论的智能提醒方法,主要包括:
获取用户在不同网络平台发表过的智慧金融文本评论;对用户智慧金融文本评论进行分级,标注最高级别用户;获取金融文章允许评论的用户级别,限制低于允许评论的级别的用户评论;对新的智慧金融文本评论进行分级,对用户发出智能提醒;判断评论信息是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护;推送智慧金融评论有关联的媒体文章;对最高级别智慧金融评论智能关联法律案件、法律法规进行预警;
进一步可选地,所述获取用户在不同网络平台发表过的智慧金融文本评论包括:
在用户允许本系统抓取用户本人发表过的评论时,通过Scrapy爬虫工具抓取用户在不同网络平台发表过的智慧金融文本评论;将用户的智慧金融文本评论作为事先定义的主题目标,将时间范围作为循环结束的条件,通过URL队列抓取网页数据,并利用定义的主题过滤无用的网页数据,将最后留下的网页数据上传到用户的云盘中,获取用户在不同网络平台发表过的智慧金融文本评论。
进一步可选地,所述对用户智慧金融文本评论进行分级,标注最高级别用户包括:
加载敏感词词典,将敏感词典中的敏感词匹配获取到的用户在不同网络平台发表过的智慧金融文本评论,确定用户在不同网络平台发表过的智慧金融文本评论中敏感词出现的次数和敏感词所属类别,并通过敏感词出现的次数计算智慧金融文本评论敏感词分数,根据智慧金融文本评论敏感词分数对用户进行分级,用户被分成多个级别;其中,敏感词分数大于最高级别阈值的用户会被标注为最高级别用户,并且将用户在不同网络平台发表过的智慧金融文本评论中敏感词的所属类别作为最高级别用户的类别属性。
进一步可选地,所述获取金融文章允许评论的用户级别,限制低于允许评论的级别的用户评论包括:
系统获取金融文章作者对金融文章允许评论的用户级别的设置,级别高于允许评论的用户级别的用户,系统限制其对金融文章发表智慧金融评论;级别低于或者等于允许评论的用户级别的用户,系统允许其对金融文章发表智慧金融评论;当系统获取金融文章作者对金融文章允许评论的用户级别的设置是最高级别,系统允许所有用户对金融文章发表智慧金融文本评论,系统对最高级别的用户在其发表智慧金融评论前根据最高级别用户类别属性进行预提醒;包括:对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒;
所述对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒。,具体包括:
系统捕获被标注为最高级别的用户在金融文章的界面上点击评论框的操作,系统查询最高级别的用户的类别属性,根据最高级别用户的类别属性,发送预提醒窗口,预提醒窗口内容与最高级别用户的类别属性相互匹配。最高级别用户完成预提醒的阅读,对金融文章发表智慧金融评论。
进一步可选地,所述对新的智慧金融文本评论进行分级,对用户发出智能提醒包括:
系统通过Scrapy爬虫工具自动检测用户在网络平台上是否发表了新的智慧金融文本评论;当系统检测出用户在网络平台新的智慧金融文本评论并且捕获用户发表的新的智慧金融文本内容,系统加载敏感词词典,将敏感词典中的敏感词匹配获取到的用户在网络平台发表的新的智慧金融文本评论,确定敏感词分数,对用户发表的新的智慧金融文本评论进行分级;系统根据新的智慧金融文本评论所处的等级,对用户发出智能提醒,告知用户发表新的智慧金融文本评论所处级别。
进一步可选地,所述判断评论信息是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护包括:
判断智慧金融文本评论是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护;在用户在文本评论框输入智慧金融文本评论准备进行发布之前,本系统预先检测其中存在的涉密信息(包括金融隐私或商业秘密信息),在涉密信息泄露之前,截断涉密信息的传播升级;本系统获取用户在网络上发布过的智慧金融文本评论,设定初始涉密特征,通过对涉密关键词,涉密文档资料进行训练得到涉密特征;通过获取用户在文本评论框输入的智慧金融文本评论,将其作为输入,给出涉密度打分结果,当分数超过涉密阈值分数,本系统对用户进行预警,并指出涉密信息所处的位置;最后通过K-匿名模型,对涉密文本进行泛化,降低其涉密度,达到差分隐私保护的目的。
进一步可选地,所述推送智慧金融评论有关联的媒体文章包括:
当用户对金融文章发表的智慧金融评论没有被系统检测为最高级别,系统通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章,系统对搜索到的与智慧金融评论相关度高的媒体文章进行审核,分析搜索到的媒体文章是否含有涉密的金融信息;审核完成后,将与智慧金融评论相关度高的媒体文章推送给该用户;包括:通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章;对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核;
所述通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章,具体包括:
系统提取用户的智慧金融评论中的关键词作为搜索引擎的输入,搜索引擎搜索出与关键词有关联的媒体文章。系统根据关键词是否在搜索出的媒体文章的标题出现以及在文章中出现的次数分析出媒体文章与关键词的关联度,系统将与关键词的关联度超过预设阈值的媒体文章进行审核。
所述对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核,具体包括:
系统对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核,分析搜索到的媒体文章是否允许向大众公开以及是否涉及私密的金融信息。系统通过计算推送内容所包含文本的涉密特征值,判断推送内容中涉密信息是否达到预警,若达到预警,将进一步分析推送内容,借助自然语言处理的实体名识别,语义分析,指代关系消解辅助分析信息的手段找到涉密信息所在,最后去除媒体文章中除涉密信息或者通过K-匿名模型手段降低其敏感度,完成审核。
一种基于智慧金融文本评论的智能提醒方法其特征在于,所述系统包括:
当用户发表的智慧金融评论被系统判断为最高级别,系统分析智慧金融评论是否违反金融相关法律法规,同时通过搜索引擎,在网络平台上自动搜索相关法律法规,根据关键词向用户进行相应法律案件、法律法规的推送,若用户违反了法律法规,通过发送提醒信息提醒用户删除文本评论,减少后续带来的影响;若用户尚未违反法律法规,则通过推送法律案件、法律法规提醒用户理智评论。
本发明实施例提供的技术方案可以包括以下有益效果:
当前的网络平台无法做到对用户的智能化提醒,无法对违法违规、不当的用户评论提前告知与警醒。本系统针对上述问题,提供了更加智能化的提醒方法:它可以在用户针对某一网络平台的智慧金融相关文章发表一般文本评论时给予普通级别提示,同时通过搜索引擎技术关联推送其他平台的不同媒体文章,帮助用户全面了解智慧金融知识,进行合理评价;当用户在网络上文本评论达到最高级别时,及时给予警示提醒,关联对应法律法规,让用户及时撤销文本评论,避免带来更为严重的后果,帮助用户做出理性的评论。
【附图说明】
图1为本发明的一种基于智慧金融文本评论的智能提醒方法
的流程图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的一种基于智慧金融文本评论的智能提醒方法流程图。如图1所示,本实施例一种基于智慧金融文本评论的智能提醒方法具体可以包括:
步骤101,获取用户在不同网络平台发表过的智慧金融文本评论。
在用户允许本系统抓取用户本人发表过的评论时,通过Scrapy爬虫工具抓取用户在不同网络平台发表过的智慧金融文本评论。将用户的智慧金融文本评论作为事先定义的主题目标,将时间范围作为循环结束的条件,通过URL队列抓取网页数据,并利用定义的主题过滤无用的网页数据,将最后留下的网页数据上传到用户的云盘中,获取用户在不同网络平台发表过的智慧金融文本评论。
步骤102,对用户智慧金融文本评论进行分级,标注最高级别用户。
加载敏感词词典,将敏感词典中的敏感词匹配获取到的用户在不同网络平台发表过的智慧金融文本评论,确定用户在不同网络平台发表过的智慧金融文本评论中敏感词出现的次数和敏感词所属类别,并通过敏感词出现的次数计算智慧金融文本评论敏感词分数,根据智慧金融文本评论敏感词分数对用户进行分级,用户被分成多个级别。其中,敏感词分数大于最高级别阈值的用户会被标注为最高级别用户,并且将用户在不同网络平台发表过的智慧金融文本评论中敏感词的所属类别作为最高级别用户的类别属性。
步骤103,获取金融文章允许评论的用户级别,限制低于允许评论的级别的用户评论。
系统获取金融文章作者对金融文章允许评论的用户级别的设置,级别高于允许评论的用户级别的用户,系统限制其对金融文章发表智慧金融评论;级别低于或者等于允许评论的用户级别的用户,系统允许其对金融文章发表智慧金融评论。当系统获取金融文章作者对金融文章允许评论的用户级别的设置是最高级别,系统允许所有用户对金融文章发表智慧金融文本评论,系统对最高级别的用户在其发表智慧金融评论前根据最高级别用户类别属性进行预提醒。例如,在用户允许本系统的使用权限后,本系统会获取用户在各大网络平台的使用的ID,输入用户的ID后,利用写好的用户页面文本评论爬取函数,输入用户ID,就可以获得该用户在此平台上的所有个人信息,之后再根据主题定义过滤无效数据,直到满足循环终止条件,停止抓取,最后将获得的用户发表过的关于智慧金融文本评论的网页数据,上传到用户的云盘中进行存储。
对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒。。
系统捕获被标注为最高级别的用户在金融文章的界面上点击评论框的操作,系统查询最高级别的用户的类别属性,根据最高级别用户的类别属性,发送预提醒窗口,预提醒窗口内容与最高级别用户的类别属性相互匹配。最高级别用户完成预提醒的阅读,对金融文章发表智慧金融评论。例如在读取用户在不同网络平台发表过的智慧金融文本评论后,加载敏感词词典,词典包括暴力,政治,色情相关的敏感词,如果用户的智慧金融文本存在词语与敏感词词典中的敏感词匹配,就会将匹配次数加一,并且根据最终的匹配次数计算出用户的敏感词分数,假设一个用户最终的敏感词分数是121,并且被匹配的敏感词多次出现与暴力相关词汇,敏感词的所属类别是暴力。存在ABCDEF六个等级,A等级是0-20分,B等级是20-40分,C等级是40-60分,D等级是60-80分,E等级是80-100分,F等级是大于100分,这位用户就会被分级到最高级别F级,并且其所属类别属性是暴力。
步骤104,对新的智慧金融文本评论进行分级,对用户发出智能提醒。
系统通过Scrapy爬虫工具自动检测用户在网络平台上是否发表了新的智慧金融文本评论。当系统检测出用户在网络平台新的智慧金融文本评论并且捕获用户发表的新的智慧金融文本内容,系统加载敏感词词典,将敏感词典中的敏感词匹配获取到的用户在网络平台发表的新的智慧金融文本评论,确定敏感词分数,对用户发表的新的智慧金融文本评论进行分级。系统根据新的智慧金融文本评论所处的等级,对用户发出智能提醒,告知用户发表新的智慧金融文本评论所处级别。例如当金融文章作者对金融文章设置的允许评论的用户级别是最低级别,系统获取到该设置,只允许用户级别是最低级别的用户对该金融进行评论。其他高于最低级别的用户系统都不允许其对对该金融文章进行评论。当金融文章作者对金融文章设置的允许评论的用户级别是最高级别,系统允许用户对文章进行评论,但是对最高级别用户根据其类别属性进行预提醒。
步骤105,判断评论信息是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护。
判断智慧金融文本评论是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护。在用户在文本评论框输入智慧金融文本评论准备进行发布之前,本系统预先检测其中存在的涉密信息(包括金融隐私或商业秘密信息),在涉密信息泄露之前,截断涉密信息的传播升级。本系统获取用户在网络上发布过的智慧金融文本评论,设定初始涉密特征,通过对涉密关键词,涉密文档资料进行训练得到涉密特征;通过获取用户在文本评论框输入的智慧金融文本评论,将其作为输入,给出涉密度打分结果,当分数超过涉密阈值分数,本系统对用户进行预警,并指出涉密信息所处的位置;最后通过K-匿名模型,对涉密文本进行泛化,降低其涉密度,达到差分隐私保护的目的。例如当类别属性是暴力的最高级别的用户在阅读王金融文章后,准备进行评论。用户首先会点击金融文章底部的评论框准备进行评论。系统捕获到最高级别用户这个动作,系统查询到最高级别用户的类别属性是暴力,根据其暴力的属性,发送预提醒的窗口,窗口的内容是提醒最高级别用户请勿发表与暴力相关内容,如“您曾经发表过暴力内容已被系统捕获,请勿再次发表与暴力相关内容”。最高级别用户完成了预提醒的阅读后,并且点击已完成阅读,才可以在金融文章底部的评论框进行打字,对金融文章发表智慧金融评论。
步骤106,推送智慧金融评论有关联的媒体文章。
当用户对金融文章发表的智慧金融评论没有被系统检测为最高级别,系统通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章,系统对搜索到的与智慧金融评论相关度高的媒体文章进行审核,分析搜索到的媒体文章是否含有涉密的金融信息。审核完成后,将与智慧金融评论相关度高的媒体文章推送给该用户。例如,当用户在微博上发表个人对于智慧金融文章的文本评论后,系统就可以自动通过scrapy爬虫工具实时抓取用户在网络上发表的文本评论数据,对文本进行评级。当用户发表的文本被评为最高级别,系统会对用户发送智能提醒,告知用户刚刚发表新的智慧金融文本评论的所处级别是最高级别,评论内容有敏感内容出现。
通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章。
系统提取用户的智慧金融评论中的关键词作为搜索引擎的输入,搜索引擎搜索出与关键词有关联的媒体文章。系统根据关键词是否在搜索出的媒体文章的标题出现以及在文章中出现的次数分析出媒体文章与关键词的关联度,系统将与关键词的关联度超过预设阈值的媒体文章进行审核。例如当用户在微博上发表了一篇与金融文章相关的文本评论,本系统将会实时检测用户发表的文本评论信息,根据用户以往发布的文档,训练得出敏感特征,根据敏感特征,对本次文本信息的敏感度打分判断,当敏感度得分与用户设定的敏感度特征相差不到3%时,本系统会对用户做出信息提示预警,并高亮标记处敏感文本所在,提示用户可以通过对敏感文本进行泛化,如对省份保留,具体地名去处等方式,降低敏感度,从而达到差分隐私保护的目的。
对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核。
系统对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核,分析搜索到的媒体文章是否允许向大众公开以及是否涉及私密的金融信息。系统通过计算推送内容所包含文本的涉密特征值,判断推送内容中涉密信息是否达到预警,若达到预警,将进一步分析推送内容,借助自然语言处理的实体名识别,语义分析,指代关系消解辅助分析信息的手段找到涉密信息所在,最后去除媒体文章中除涉密信息或者通过K-匿名模型手段降低其敏感度,完成审核。例如,当用户对于微博上关于小额贷款的媒体报道做出关于“小额贷款的风险程度到底有多高”的智慧金融评论,系统实时检测出该条智慧金融文本评论尚未达到最高级别,本系统将会通过搜索引擎,搜索“小额贷款的风险程度到底有多高”的关联度超过阈值的媒体文章,系统对搜索到的媒体文章进行审核,分析是否含有涉密的金融信息。审核完成后,系统向用户推送不同平台与“小额贷款的风险程度到底有多高”相关度高的媒体文章,帮助用户更全面地认识到小额贷款的风险程度到底有多高。
步骤107,对最高级别智慧金融评论智能关联法律案件、法律法规进行预警。
当用户发表的智慧金融评论被系统判断为最高级别,系统分析智慧金融评论是否违反金融相关法律法规,同时通过搜索引擎,在网络平台上自动搜索相关法律法规,根据关键词向用户进行相应法律案件、法律法规的推送,若用户违反了法律法规,通过发送提醒信息提醒用户删除文本评论,减少后续带来的影响;若用户尚未违反法律法规,则通过推送法律案件、法律法规提醒用户理智评论。例如,当用户对于微博上关于小额贷款的媒体报道做出关于“小额贷款的风险程度到底有多高”的智慧金融评论,系统提取的关键词是“小额贷款的风险程度”,系统搜索与“小额贷款的风险程度”有关联的媒体文章。搜索到的媒体文章,如果媒体文章的标题出现“小额贷款的风险程度”的关键词,说明该文章的主题就是“小额贷款的风险程度”,其关联度会超过预设阈值;如果媒体文章的标题没有出现“小额贷款的风险程度”,但是文章内容多次出现“小额贷款的风险程度”的关键词,说明该文章也是讨论“小额贷款的风险程度”,其关联度也会超过预设阈值。

Claims (8)

1.一种基于智慧金融文本评论的智能提醒方法,其特征在于,所述方法包括:
获取用户在不同网络平台发表过的智慧金融文本评论;对用户智慧金融文本评论进行分级,标注最高级别用户;获取金融文章允许评论的用户级别,限制低于允许评论的级别的用户评论,具体包括:对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒;对新的智慧金融文本评论进行分级,对用户发出智能提醒;判断评论信息是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护;推送智慧金融评论有关联的媒体文章,所述推送智慧金融评论有关联的媒体文章,具体包括:通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章,对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核;对最高级别智慧金融评论智能关联法律案件、法律法规进行预警。
2.根据权利要求1所述的方法,其中,所述获取用户在不同网络平台发表过的智慧金融文本评论,包括:
在用户允许本系统抓取用户本人发表过的评论时,通过Scrapy爬虫工具抓取用户在不同网络平台发表过的智慧金融文本评论;将用户的智慧金融文本评论作为事先定义的主题目标,将时间范围作为循环结束的条件,通过URL队列抓取网页数据,并利用定义的主题过滤无用的网页数据,将最后留下的网页数据上传到用户的云盘中,获取用户在不同网络平台发表过的智慧金融文本评论。
3.根据权利要求1所述的方法,其中,所述对用户智慧金融文本评论进行分级,标注最高级别用户,包括:
加载敏感词词典,将敏感词典中的敏感词匹配获取到的用户在不同网络平台发表过的智慧金融文本评论,确定用户在不同网络平台发表过的智慧金融文本评论中敏感词出现的次数和敏感词所属类别,并通过敏感词出现的次数计算智慧金融文本评论敏感词分数,根据智慧金融文本评论敏感词分数对用户进行分级,用户被分成多个级别;其中,敏感词分数大于最高级别阈值的用户会被标注为最高级别用户,并且将用户在不同网络平台发表过的智慧金融文本评论中敏感词的所属类别作为最高级别用户的类别属性。
4.根据权利要求1所述的方法,其中,所述获取金融文章允许评论的用户级别,限制低于允许评论的级别的用户评论,包括:
系统获取金融文章作者对金融文章允许评论的用户级别的设置,级别高于允许评论的用户级别的用户,系统限制其对金融文章发表智慧金融评论;级别低于或者等于允许评论的用户级别的用户,系统允许其对金融文章发表智慧金融评论;当系统获取金融文章作者对金融文章允许评论的用户级别的设置是最高级别,系统允许所有用户对金融文章发表智慧金融文本评论,系统对最高级别的用户在其发表智慧金融评论前根据最高级别用户类别属性进行预提醒;包括:对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒;
所述对最高级别的用户在其发表智慧金融评论前根据最高级别用户的类别属性进行预提醒,具体包括:
系统捕获被标注为最高级别的用户在金融文章的界面上点击评论框的操作,系统查询最高级别的用户的类别属性,根据最高级别用户的类别属性,发送预提醒窗口,预提醒窗口内容与最高级别用户的类别属性相互匹配;最高级别用户完成预提醒的阅读,对金融文章发表智慧金融评论。
5.根据权利要求1所述的方法,其中,所述对新的智慧金融文本评论进行分级,对用户发出智能提醒,包括:
系统通过Scrapy爬虫工具自动检测用户在网络平台上是否发表了新的智慧金融文本评论;当系统检测出用户在网络平台新的智慧金融文本评论并且捕获用户发表的新的智慧金融文本内容,系统加载敏感词词典,将敏感词典中的敏感词匹配获取到的用户在网络平台发表的新的智慧金融文本评论,确定敏感词分数,对用户发表的新的智慧金融文本评论进行分级;系统根据新的智慧金融文本评论所处的等级,对用户发出智能提醒,告知用户发表新的智慧金融文本评论所处级别。
6.根据权利要求1所述的方法,其中,所述判断评论信息是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护,包括:
判断智慧金融文本评论是否涉及金融隐私或商业秘密信息,并对涉及的内容进行差分隐私保护;在用户在文本评论框输入智慧金融文本评论准备进行发布之前,本系统预先检测其中存在的涉密信息(包括金融隐私或商业秘密信息),在涉密信息泄露之前,截断涉密信息的传播升级;本系统获取用户在网络上发布过的智慧金融文本评论,设定初始涉密特征,通过对涉密关键词,涉密文档资料进行训练得到涉密特征;通过获取用户在文本评论框输入的智慧金融文本评论,将其作为输入,给出涉密度打分结果,当分数超过涉密阈值分数,本系统对用户进行预警,并指出涉密信息所处的位置;最后通过K-匿名模型,对涉密文本进行泛化,降低其涉密度,达到差分隐私保护的目的。
7.根据权利要求1所述的方法,其中,所述推送智慧金融评论有关联的媒体文章,包括:
当用户对金融文章发表的智慧金融评论没有被系统检测为最高级别,系统通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章,系统对搜索到的与智慧金融评论相关度高的媒体文章进行审核,分析搜索到的媒体文章是否含有涉密的金融信息;审核完成后,将与智慧金融评论相关度高的媒体文章推送给该用户;包括:通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章;对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核;
所述通过搜索引擎搜索与智慧金融评论的关联度超过阈值的媒体文章,具体包括:
系统提取用户的智慧金融评论中的关键词作为搜索引擎的输入,搜索引擎搜索出与关键词有关联的媒体文章;系统根据关键词是否在搜索出的媒体文章的标题出现以及在文章中出现的次数分析出媒体文章与关键词的关联度,系统将与关键词的关联度超过预设阈值的媒体文章进行审核;
所述对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核,具体包括:
系统对搜索到的与智慧金融评论关联度超过阈值的媒体文章进行审核,分析搜索到的媒体文章是否允许向大众公开以及是否涉及私密的金融信息;系统通过计算推送内容所包含文本的涉密特征值,判断推送内容中涉密信息是否达到预警,若达到预警,将进一步分析推送内容,借助自然语言处理的实体名识别,语义分析,指代关系消解辅助分析信息的手段找到涉密信息所在,最后去除媒体文章中除涉密信息或者通过K-匿名模型手段降低其敏感度,完成审核。
8.根据权利要求1所述的方法,其中,所述对最高级别智慧金融评论智能关联法律案件、法律法规进行预警,包括:
当用户发表的智慧金融评论被系统判断为最高级别,系统分析智慧金融评论是否违反金融相关法律法规,同时通过搜索引擎,在网络平台上自动搜索相关法律法规,根据关键词向用户进行相应法律案件、法律法规的推送,若用户违反了法律法规,通过发送提醒信息提醒用户删除文本评论,减少后续带来的影响;若用户尚未违反法律法规,则通过推送法律案件、法律法规提醒用户理智评论。
CN202210596599.4A 2022-05-30 2022-05-30 一种基于智慧金融文本评论的智能提醒方法 Withdrawn CN114880540A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210596599.4A CN114880540A (zh) 2022-05-30 2022-05-30 一种基于智慧金融文本评论的智能提醒方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210596599.4A CN114880540A (zh) 2022-05-30 2022-05-30 一种基于智慧金融文本评论的智能提醒方法

Publications (1)

Publication Number Publication Date
CN114880540A true CN114880540A (zh) 2022-08-09

Family

ID=82679323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210596599.4A Withdrawn CN114880540A (zh) 2022-05-30 2022-05-30 一种基于智慧金融文本评论的智能提醒方法

Country Status (1)

Country Link
CN (1) CN114880540A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117354065A (zh) * 2023-12-05 2024-01-05 国网四川省电力公司电力科学研究院 一种基于大数据的工控网络威胁情报分析方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117354065A (zh) * 2023-12-05 2024-01-05 国网四川省电力公司电力科学研究院 一种基于大数据的工控网络威胁情报分析方法及系统

Similar Documents

Publication Publication Date Title
Urvoy et al. Tracking web spam with html style similarities
CN103544255B (zh) 基于文本语义相关的网络舆情信息分析方法
CN101593200B (zh) 基于关键词频度分析的中文网页分类方法
US8190621B2 (en) Method, system, and computer readable recording medium for filtering obscene contents
US20190332602A1 (en) Method of data query based on evaluation and device
CN103309862B (zh) 一种网页类型识别方法和系统
US20170185680A1 (en) Chinese website classification method and system based on characteristic analysis of website homepage
CN110637316B (zh) 用于预期对象识别的系统和方法
WO2009096523A1 (ja) 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
Carterette et al. Dynamic test collections for retrieval evaluation
CN103914478A (zh) 网页训练方法及系统、网页预测方法及系统
US11874882B2 (en) Extracting key phrase candidates from documents and producing topical authority ranking
Lai et al. High-order concept associations mining and inferential language modeling for online review spam detection
Nizamani et al. CEAI: CCM-based email authorship identification model
Dutta et al. PNRank: Unsupervised ranking of person name entities from noisy OCR text
Liu et al. Detecting web spam based on novel features from web page source code
CN114880540A (zh) 一种基于智慧金融文本评论的智能提醒方法
CN107908749B (zh) 一种基于搜索引擎的人物检索系统及方法
Yin et al. Research of integrated algorithm establishment of a spam detection system
CN115048483A (zh) 信息管理系统
Santoso et al. An Ontological Crawling Approach for Improving Information Aggregation over eGovernment Websites.
US10579660B2 (en) System and method for augmenting search results
KR101614551B1 (ko) 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법
Yu et al. Friend recommendation mechanism for social media based on content matching
US11593415B1 (en) Decision making analysis engine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220809