CN108536757B - 一种基于用户历史网络潜在有害主题引导方法 - Google Patents

一种基于用户历史网络潜在有害主题引导方法 Download PDF

Info

Publication number
CN108536757B
CN108536757B CN201810224888.5A CN201810224888A CN108536757B CN 108536757 B CN108536757 B CN 108536757B CN 201810224888 A CN201810224888 A CN 201810224888A CN 108536757 B CN108536757 B CN 108536757B
Authority
CN
China
Prior art keywords
information
user
users
weight
historical network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810224888.5A
Other languages
English (en)
Other versions
CN108536757A (zh
Inventor
刘金硕
刘泽军
邓娟
章岚昕
杨广益
陈煜森
李晨曦
李扬眉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201810224888.5A priority Critical patent/CN108536757B/zh
Publication of CN108536757A publication Critical patent/CN108536757A/zh
Application granted granted Critical
Publication of CN108536757B publication Critical patent/CN108536757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于用户历史网络潜在有害主题引导方法。流程如下:1.根据有害信息的传播方式(如评论、转发等)构建分级评估指标体系,再利用情感倾向性算法构建危害分级模型。2.对危害信息进行主题分类并确定信息的危害级别,然后标记浏览过这些信息的用户。3.根据1中算法去获取每个级别下各个类别的无危害信息,构建分级推荐模型。4.分离出浏览过危害信息的所有用户,并对这些用户进行一段时间的网络浏览痕迹跟踪,并通过预警,查封,推荐,释放四种种方式来干预和释放用户。通过本发明可以渐渐的改变危害信息受众用户的阅读取向,从而间接的净化互联网环境,还可以加强相关部门对危害信息发布人的打击力度和准确度。

Description

一种基于用户历史网络潜在有害主题引导方法
技术领域
本发明涉及计算机科学中的在线社交网络数据挖掘、信息安全、机器学习等技术,尤其是基于关键词分析法和层次分析法构建的用户历史网络浏览信息危害分级模型以及基于TextRank算法的关键词提取技术。
背景技术
随着网络信息技术的日益发展和人们利益诉求的日趋多元化,使得互联网已经成为各基层利益表达、情感宣泄、思想碰撞的重要舆论渠道,很多不法分子通过网络散步许多虚假及影响公众身心健康甚至危害社会的信息,比如近期一伙不法分子开发的网络游戏--蓝鲸,已经让世界许多正直叛逆期的青少年的身心受到了严重的影响,甚至很多人因此失去了生命,因此,在对这些不法分子采取果断措施的同时,还必须要对这些信息进行干扰,并且要给这些有可能会受到危害的人群及时的推送一些对个人身心健康及社会安全有益的消息,这也间接的净化了互联网环境,综上,对互联网舆情挖掘进行深入研究具有重要意义。
发明内容
本发明主要解决的问题是在互联网环境下存在许多的不法分子,他们无时不刻的不在散布着虚假和危险信息,因此,制定一种算法,一方面能对这些信息进行一定程度的干预以及加强有关部门对这些不法分子的打击准确度和力度,一方面又能够主动及时的为用户推送一些正面且和当前信息所对应的主题相似的信息,这样既能一定程度净化互联网环境,也能使用户的阅读取向变得越来越好。首先通过分析网络信息的传播特点、权衡多种决策方法并结合机器学习的方法进行主题分类和情感态度分析等,实现了基于用户历史网络浏览信息的危害分级模型,然后在对应的级别中将信息进行分类,评估每一条信息对应的级别,标记每个级别,并统计各个级别下包含的所有主题类别信息,按照类别去网络上获取对用户无害的文本信息,并将文本信息进行关键词提取,构成关键词链接推送出去,从而构建基于用户历史网络浏览信息的分级推荐模型,主要技术方案如下:
一种基于用户历史网络潜在有害主题引导方法,其特征在于,包括以下步骤:步骤1:根据用户历史浏览网络信息的传播方式(如评论、转发等);
构建分级评估指标体系,再利用情感倾向性算法,进而构建基于用户历史网络浏览信息的危害分级模型,具体方式是:步骤1.1:根据用户历史网络浏览信息的构成要素(如发布者、信息内容)、传播扩散(如网络地理区域分布、传播渠道)、历史网络浏览信息热度(如信息的点击数、浏览数、转发数等)和历史网络浏览信息活性(前三者因素的变化率)建立四维网络分级评估指标体系,每一个维度都包含三级指标(如构成要素包括发布者和信息内容,而发布者又包括主题署名度、发布时间、作者影响力等因素,信息内容又包括信息的敏感程度和信息的类别和情感倾向性等因素)。
步骤1.2:对用户历史网络浏览信息进行主题分类。
步骤1.3:根据计数、分类数、百分比等方法计算每条历史网络浏览信息三级指标的权重从而实现分级评估体系的数据化。
步骤1.4:在对用户历史网络浏览信息按照评估体系数据化以后,根据步骤1.3中计算的权值完成多级评判,得到每条历史信息对应的级别,任一历史信息的评判计算模型可以表示为:W=∑(Ai*∑(Bj*∑(Ck*w)))其中Ai表示一级指标权重,Bj为二级指标权重,CK为三级指标权重,w为某三级指标的计算值,多级评判的结果W表现为一个数字,数字越大表示该信息越重要,最后为此信息定级;
步骤2:对获取到的信息进行主题分类,并评估所有信息在分级模型中对应的级别。
步骤3:标记每个级别,并分别统计步骤1中分级模型下的每一个主题类别,并根据对应类别去网络上获取对用户无害的信息,进而构建基于用户历史网络浏览信息的分级推荐模型,将该模型中保存的信息进行关键词的提取,然后以链接的形式推荐给用户,其中,关键词的提取是基于TextRank关键词或摘要提取算法,包括以下步骤:
步骤3.1:预处理,首先进行分词和词性标注,将单个word作为结点添加到图中;
步骤3.2:设置语法过滤器,将通过语法过滤器的词汇添加到图中;出现在一个窗口中的词汇之间相互形成一条边;
步骤3.3:基于上述公式,迭代直至收敛;一般迭代20-30次迭代阈值设置为0.0001。TextRank算法的迭代公式为:
Figure GDA0003501435790000041
节点i的权重取决于节点i的邻居节点中i-j这条边的权重/j的所有出度的边的权重*节点j的权重,将这些邻居节点计算的权重相加,再乘上一定的阻尼系数,就是节点i的权重;阻尼系数d一般取0.85;
步骤3.4:根据顶点的分数降序排列,并输出指定个数的词汇作为可能的关键词;
步骤3.5:后处理,如果两个词汇在文本中前后连接,那么就将这两个词汇连接在一起,作为关键短语。类似于PageRank的思想,将文本中的语法单元视作图中的节点,如果两个语法单元存在一定语法关系(例如共现),则这两个语法单元在图中就会有一条边相互连接,通过一定的迭代次数,最终不同的节点会有不同的权重,权重高的语法单元可以作为关键词。
步骤4:分离出浏览过当前危害信息的所有用户,并对浏览过当前危害信息的所有用户进行设定时间的网络浏览痕迹跟踪,根据用户的浏览记录通过预警(发邮件),或查封IP(封ip并通知有关部门),或推荐用户喜好(根据用户喜好推荐相关信息)三种方式来干预用户,直到用户形成良好的阅读习惯,才能释放该用户,也即不再关注。
附图说明
图1是本发明的整体流程图。
图2是本发明中用户历史网络浏览信息危害级别评估流程图。
图3是本发明中基于TextRank算法的关键词提取流程图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
本发明算法的整体流程如图1所示,在分级模型构建成功以后,当互联网的用户点击任意一个主题的信息时,系统获取该用户的id号,并对该用户点击的信息进行分级评估,如果该用户点击的信息被后台认定为是比较正面的信息,那下次为该用户推荐的将是第二个分级模型中同一个相关主题的信息,反之也一样。这样做到了不管用户点击的信息是好是坏,最后为该用户推荐的信息都是正面的。
具体包括:
步骤1:根据用户历史网络浏览信息的构成要素(如发布者、信息内容)、传播扩散(如网络地理区域分布、传播渠道)、历史网络浏览信息热度(如信息的点击数、浏览数、转发数等)和历史网络浏览信息活性(前三者因素的变化率)建立四维网络分级评估指标体系,每一个维度都包含三级指标(如构成要素包括发布者和信息内容,而发布者又包括主题署名度、发布时间、作者影响力等因素,信息内容又包括信息的敏感程度和信息的类别和情感倾向性等因素)。
步骤2:对用户历史网络浏览信息进行主题分类。
步骤3:根据计数、分类数、百分比等方法计算每条历史网络浏览信息三级指标的权重从而实现分级评估体系的数据化。
步骤4:在对用户历史网络浏览信息按照评估体系数据化以后,根据步骤3中计算的权值完成多级评判,得到每条历史信息对应的级别,任一历史信息的评判计算模型可以表示为:W=∑(Ai*∑(Bj*∑(Ck*w)))其中Ai表示一级指标权重,Bj为二级指标权重,CK为三级指标权重,w为某三级指标的计算值,多级评判的结果W表现为一个数字,数字越大表示该信息越重要,最后为此信息定级。
其中,
步骤1.1:根据用户历史网络浏览信息的构成要素(如发布者、信息内容)、传播扩散(如网络地理区域分布、传播渠道)、历史网络浏览信息热度(如信息的点击数、浏览数、转发数等)和历史网络浏览信息活性(前三者因素的变化率)建立四维网络分级评估指标体系,每一个维度都包含三级指标(如构成要素包括发布者和信息内容,而发布者又包括主题署名度、发布时间、作者影响力等因素,信息内容又包括信息的敏感程度和信息的类别和情感倾向性等因素)。
步骤1.2:对用户历史网络浏览信息进行主题分类。
步骤1.3:根据计数、分类数、百分比等方法计算每条历史网络浏览信息三级指标的权重从而实现分级评估体系的数据化。
步骤1.4:在对用户历史网络浏览信息按照评估体系数据化以后,根据步骤1.3中计算的权值完成多级评判,得到每条历史信息对应的级别,任一历史信息的评判计算模型可以表示为:W=∑(Ai*∑(Bj*∑(Ck*w)))其中Ai表示一级指标权重,Bj为二级指标权重,CK为三级指标权重,w为某三级指标的计算值,多级评判的结果W表现为一个数字,数字越大表示该信息越重要,最后为此信息定级;
步骤3中,关键词的提取是一种基于TextRank关键词或摘要提取算法,包括以下步骤:
步骤3.1:预处理,首先进行分词和词性标注,将单个word作为结点添加到图中;
步骤3.2:设置语法过滤器,将通过语法过滤器的词汇添加到图中;出现在一个窗口中的词汇之间相互形成一条边;
步骤3.3:基于上述公式,迭代直至收敛;一般迭代20-30次迭代阈值设置为0.0001。TextRank算法的迭代公式为:WS(Vi)=(1-d)+d*∑Vj∈ln(Vi)wji∑Vk∈Out(Vj)wjk*WS(Vj)节点i的权重取决于节点i的邻居节点中i-j这条边的权重/j的所有出度的边的权重*节点j的权重,将这些邻居节点计算的权重相加,再乘上一定的阻尼系数,就是节点i的权重;阻尼系数d一般取0.85;
步骤3.4:根据顶点的分数降序排列,并输出指定个数的词汇作为可能的关键词;
步骤3.5:后处理,如果两个词汇在文本中前后连接,那么就将这两个词汇连接在一起,作为关键短语。类似于PageRank的思想,将文本中的语法单元视作图中的节点,如果两个语法单元存在一定语法关系(例如共现),则这两个语法单元在图中就会有一条边相互连接,通过一定的迭代次数,最终不同的节点会有不同的权重,权重高的语法单元可以作为关键词。节点的权重不仅依赖于它的入度结点,还依赖于这些入度结点的权重,入度结点越多,入度结点的权重越大,说明这个结点的权重越高。
图2主要是阐述了分级评估体系下三级指标的计算,比如历史浏览信息的热度、活性,传播方式等等。对其每一项指标进行量化计算,得到最终的危害级别。
图3是推荐过程主要用到的算法,它是PageTank算法的变种,首先定义一个无向有权图,然后对句子进行分词;依次遍历分词结果,如果某个词i满足过滤条件(词性在词性过滤集合中,并且词的长度大于等于2,并且词不是停用词),然后将这个词之后窗口范围内的词j(这些词也需要满足过滤条件),将它们两两(词i和词j)作为key,出现的次数作为value,添加到共现词典中;然后,依次遍历共现词典,将词典中的每个元素,key=(词i,词j),value=词i和词j出现的次数,其中词i,词j作为一条边起始点和终止点,共现的次数作为边的权重,添加到之前定义的无向有权图中。然后对这个无向有权图进行迭代运算textrank算法,最终经过若干次迭代后,算法收敛,每个词都对应一个指标值;如果设置了权重标志位,则根据指标值值对无向有权图中的词进行降序排序,最后输出topK个词作为关键词。执行textrank算法迭代是在rank函数中完成的。首先对每个结点赋予相同的权重,以及计算出该结点的所有出度的次数之和;然后迭代若干次,以确保得到稳定的结果;在每一次迭代中依次遍历每个结点;对于结点n,首先根据无向有权图得到结点n的所有入度结点(对于无向有权图,入度结点与出度结点是相同的,都是与结点n相连的结点),在前面我们已经计算出这个入度结点的所有出度的次数,而它对于结点n的权值的贡献等于它本身的权值乘以它与结点n的共现次数/这个结点的所有出度的次数,将各个入度结点得到的权值相加,再乘以一定的阻尼系数,即可得到结点n的权值;迭代完成后,对权值进行归一化,并返回各个结点及其对应的权值。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的数据方案得出的实施方式,同样属于本发明的保护范围。

Claims (1)

1.一种基于用户历史网络潜在有害主题引导方法,其特征在于,包括以下步骤:
步骤1:根据用户历史浏览网络信息的传播方式构建分级评估指标体系,再利用情感倾向性算法,进而构建基于用户历史网络浏览信息的危害分级模型,具体方式是:
步骤1.1:根据用户历史网络浏览信息的构成要素、传播扩散、历史网络浏览信息热度和历史网络浏览信息活性建立四维网络分级评估指标体系,每一个维度都包含三级指标,历史网络浏览信息活性指的是用户历史网络浏览信息的构成要素、传播扩散、历史网络浏览信息热度的变化率;
步骤1.2:对用户历史网络浏览信息进行主题分类;
步骤1.3:根据计数、分类数、百分比方法计算每条历史网络浏览信息三级指标的权重从而实现分级评估体系的数据化;
步骤1.4:在对用户历史网络浏览信息按照评估体系数据化以后,根据步骤1.3中计算的权值完成多级评判,得到每条历史信息对应的级别,任一历史信息的评判计算模型可以表示为:W=∑(Ai*∑(Bj*∑(Ck*w)))其中Ai表示一级指标权重,Bj为二级指标权重,Ck为三级指标权重,w为某三级指标的计算值,多级评判的结果W表现为一个数字,数字越大表示该信息越重要,最后为此信息定级;
步骤2:对获取到的信息进行主题分类,并评估所有信息在分级模型中对应的级别;
步骤3:标记每个级别,并分别统计步骤1中分级模型下的每一个主题类别,并根据对应类别去网络上获取对用户无害的信息,进而构建基于用户历史网络浏览信息的分级推荐模型,将该模型中保存的信息进行关键词的提取,然后以链接的形式推荐给用户,其中,关键词的提取是基于TextRank关键词或摘要提取算法,包括以下步骤:
步骤3.1:预处理,首先进行分词和词性标注,将单个word作为结点添加到图中;
步骤3.2:设置语法过滤器,将通过语法过滤器的词汇添加到图中;出现在一个窗口中的词汇之间相互形成一条边;
步骤3.3:迭代直至收敛;迭代20-30次迭代阈值设置为0.0001;TextRank算法的迭代公式为:
Figure FDA0003501435780000021
节点i的权重取决于节点i的邻居节点中i-j这条边的权重/j的所有出度的边的权重*节点j的权重,将这些邻居节点计算的权重相加,再乘上一定的阻尼系数,就是节点i的权重;阻尼系数d取0.85;
步骤3.4:根据顶点的分数降序排列,并输出指定个数的词汇作为可能的关键词;
步骤3.5:后处理,如果两个词汇在文本中前后连接,那么就将这两个词汇连接在一起,作为关键短语;类似于PageRank的思想,将文本中的语法单元视作图中的节点,如果两个语法单元存在一定语法关系,则这两个语法单元在图中就会有一条边相互连接,通过一定的迭代次数,最终不同的节点会有不同的权重,权重高的语法单元可以作为关键词;
步骤4:分离出浏览过当前危害信息的所有用户,并对浏览过当前危害信息的所有用户进行设定时间的网络浏览痕迹跟踪,根据用户的浏览记录通过预警,或查封IP,或推荐用户喜好来干预用户,直到用户形成良好的阅读习惯,才能释放该用户,也即不再关注。
CN201810224888.5A 2018-03-19 2018-03-19 一种基于用户历史网络潜在有害主题引导方法 Active CN108536757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810224888.5A CN108536757B (zh) 2018-03-19 2018-03-19 一种基于用户历史网络潜在有害主题引导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810224888.5A CN108536757B (zh) 2018-03-19 2018-03-19 一种基于用户历史网络潜在有害主题引导方法

Publications (2)

Publication Number Publication Date
CN108536757A CN108536757A (zh) 2018-09-14
CN108536757B true CN108536757B (zh) 2022-04-01

Family

ID=63484687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810224888.5A Active CN108536757B (zh) 2018-03-19 2018-03-19 一种基于用户历史网络潜在有害主题引导方法

Country Status (1)

Country Link
CN (1) CN108536757B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684644A (zh) * 2018-12-27 2019-04-26 南京大学 基于语境的依存句法树的构建方法
CN109710937A (zh) * 2018-12-27 2019-05-03 南京大学 依存句法树构建系统
CN111241288A (zh) * 2020-01-17 2020-06-05 烟台海颐软件股份有限公司 一种大集中电力客户服务中心的突发事件感知系统以及构建方法
CN116245555B (zh) * 2023-03-09 2023-12-08 张家口巧工匠科技服务有限公司 一种基于大数据的用户信息收集分析系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853261A (zh) * 2009-11-23 2010-10-06 电子科技大学 一种基于社会网络的网络舆情行为分析方法
CN105159879A (zh) * 2015-08-26 2015-12-16 北京理工大学 一种网络个体或群体价值观自动判别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676830B2 (en) * 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853261A (zh) * 2009-11-23 2010-10-06 电子科技大学 一种基于社会网络的网络舆情行为分析方法
CN105159879A (zh) * 2015-08-26 2015-12-16 北京理工大学 一种网络个体或群体价值观自动判别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"融合LDA与TextRank的关键词抽取研究";顾益军等;《现代图书情报技术》;20140825;第41-47页 *

Also Published As

Publication number Publication date
CN108536757A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
Zhou et al. Fake news early detection: A theory-driven model
Alsubari et al. Data analytics for the identification of fake reviews using supervised learning
Del Vigna12 et al. Hate me, hate me not: Hate speech detection on facebook
CN105740228B (zh) 一种互联网舆情分析方法及系统
CN108536757B (zh) 一种基于用户历史网络潜在有害主题引导方法
Huang et al. Detecting suicidal ideation in Chinese microblogs with psychological lexicons
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
Chaovalit et al. Movie review mining: A comparison between supervised and unsupervised classification approaches
Barbieri et al. Automatic Detection of Irony and Humour in Twitter.
US20160357854A1 (en) Scenario generating apparatus and computer program therefor
US10095685B2 (en) Phrase pair collecting apparatus and computer program therefor
CN108399241B (zh) 一种基于多类特征融合的新兴热点话题检测系统
CN103793503A (zh) 一种基于web文本的观点挖掘与分类的方法
CN104820629A (zh) 一种智能的舆情突发事件应急处理系统及方法
EP3086240A1 (en) Complex predicate template gathering device, and computer program therefor
CN108363784A (zh) 一种基于文本机器学习的舆情走向预测方法
Hannan et al. Data Mining and Natural Language Processing Methods for Extracting Opinions from Customer Reviews
CN107305545A (zh) 一种基于文本倾向性分析的网络意见领袖的识别方法
Jusoh et al. Applying fuzzy sets for opinion mining
CN104794209A (zh) 基于马尔科夫逻辑网络的中文微博情绪分类方法及系统
Park et al. Constructing a User-Centered Fake News Detection Model by Using Classification Algorithms in Machine Learning Techniques (Jan 2023)
Pasarate et al. Comparative study of feature extraction techniques used in sentiment analysis
Sheshadri et al. No (privacy) news is good news: An analysis of New York Times and Guardian Privacy News from 2010–2016
JP5477910B2 (ja) 検索キーワード辞書及び係り受けキーワード辞書を用いた文章検索プログラム、装置、サーバ及び方法
Zhong et al. Identification of opinion spammers using reviewer reputation and clustering analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant