CN108197113A - 文章资讯转换方法、装置、设备及计算机可读介质 - Google Patents

文章资讯转换方法、装置、设备及计算机可读介质 Download PDF

Info

Publication number
CN108197113A
CN108197113A CN201810054254.XA CN201810054254A CN108197113A CN 108197113 A CN108197113 A CN 108197113A CN 201810054254 A CN201810054254 A CN 201810054254A CN 108197113 A CN108197113 A CN 108197113A
Authority
CN
China
Prior art keywords
article
article information
type
theme
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810054254.XA
Other languages
English (en)
Other versions
CN108197113B (zh
Inventor
王润泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810054254.XA priority Critical patent/CN108197113B/zh
Publication of CN108197113A publication Critical patent/CN108197113A/zh
Application granted granted Critical
Publication of CN108197113B publication Critical patent/CN108197113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Probability & Statistics with Applications (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种文章资讯转换方法,包括:根据所述文章资讯的内容确定所述文章资讯的主题;以及根据所述文章资讯的主题将所述文章资讯转化为视图形式。本发明实施例可以提高资讯类文章被受众的读取效率和接受程度,提高用户体验,使得资讯文章更好地服务于用户,满足用户更高效地获取外界信息的需求。

Description

文章资讯转换方法、装置、设备及计算机可读介质
技术领域
本发明涉及资讯推送技术领域,尤其涉及一种文章资讯转换方法及装置、设备和计算机可读介质。
背景技术
随着互联网技术的发展,越来越多的新闻资讯会推送到用户的终端。因此,用户每天都能接收到大量的新鲜资讯和文章。然而,用户每天所拥有的时间有限,不可能逐一查看,这导致了大量的资讯充斥在用户的列表中。
其中,由于有的文章写得很长,根本没时间去看,同时也迫使人们放弃阅读的欲望,有可能让用户错过了重要的新闻资讯。因此,如何提高资讯文章被阅读的效率是急需解决问题。
发明内容
本发明实施例提供一种文章资讯转换方法、装置、设备及计算机可读介质,以解决或缓解以上现有技术中的技术问题。
第一方面,本发明实施例提供了一种文章资讯转换方法,包括:
根据所述文章资讯的内容确定所述文章资讯的主题;以及
根据所述文章资讯的主题将所述文章资讯转化为视图形式。
结合第一方面,本发明在第一方面的第一种实现方式中,所述获取文章资讯的主题内容的步骤中,包括:
识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;
根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型。
结合第一方面的第一种实现方式,本发明在第一方面的第二种实现方式中,所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章;以及
所述根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型的步骤包括:
当数字出现次数达到设定第一阈值时,则判断为数据类的文章;
当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;以及
当数字出现次数未达到第一阈值,且情感词出现次数未达到第二阈值时,则判断为说明性质类型的文章
结合第一方面的第二种实现方式,本发明在第一方面的第三种实现方式中,当文章类型为数据类型的文章时,所述根据所述文章资讯的主题将所述文章资讯转化为视图形式的步骤中,包括:
将文章中的数据转化为表格或曲线图形式,并将所述文章资讯的主题作为图表的标题。
结合第一方面的第二种实现方式,本发明在第一方面的第四种实现方式中,当文章类型为带情感色彩类型的文章时,所述根据所述文章资讯的主题将所述文章资讯转化为视图形式的步骤中,包括:
根据文章中的主题情感词搜索相匹配的图片作为文章的配图。
结合第一方面的第二种实现方式,本发明在第一方面的第五种实现方式中,当文章类型为说明性质类型的文章时,所述根据所述文章资讯的主题将所述文章资讯转化为视图形式的步骤中,包括:
概括文章中每个段落的主题;
将获得的段落主题以流程图形式进行展示。
第二方面,本发明实施例提供了一种文章资讯转换装置,包括:
获取模块,用于根据所述文章资讯的内容确定所述文章资讯的主题;以及
转换模块,用于根据所述文章资讯的主题将所述文章资讯转化为视图形式。
结合第二方面,本发明在第二方面第一种实现方式中,所述获取模块包括:
识别子模块,用于识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;
类别判断子模块,用于根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型。
结合第二方面的第一种实现方式,本发明在第二方面的第二种实现方式中,所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章;以及
所述类别判断子模块用于,当数字出现次数达到设定第一阈值时,则判断为数据类的文章;当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;以及当数字出现次数未达到第一阈值,且情感词出现次数未达到第二阈值时,则判断为说明性质类型的文章。
结合第二方面的第二种实现方式,本发明在第二方面的第三种实现方式中,所述转换模块包括:
数据转换子模块,用于将文章中的数据转化为表格或曲线图形式,并将所述文章资讯的主题作为图表的标题。
结合第二方面的第二种实现方式,本发明在第二方面的第四种实现方式中,所述转化模块包括:
情感词转换子模块,用于根据文章中的主题情感词搜索相匹配的图片作为文章的配图。
结合第二方面的第二种实现方式,本发明在第二方面的第五种实现方式中,所述转化模块包括:
主题概括子模块,用于概括文章中每个段落的主题;
流程图生成模块,用于将获得的段落主题以流程图形式进行展示。
所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,文章资讯转换装置的结构中包括处理器和存储器,所述存储器用于存储支持文章资讯转换装置执行上述第一方面中文章资讯转换方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述文章资讯转换装置还可以包括通信接口,用于文章资讯转换装置与其他设备或通信网络通信。
第三方面,本发明实施例提供了一种计算机可读介质,用于存储文章资讯转换装置所用的计算机软件指令,其包括用于执行上述第一方面的文章资讯转换方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:本发明实施例可以提高资讯类文章被受众的读取效率和接受程度,提高用户体验,使得资讯文章更好地服务于用户,满足用户更高效地获取外界信息的需求。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为实施例一的文章资讯转换方法的步骤流程图;
图2为实施例一的步骤S110的具体步骤流程图;
图3为实施例三的步骤S120的具体步骤流程图;
图4为实施例四的文章资讯转换装置的链接框图;
图5为实施例五的文章资讯转换装置的连接框图;
图6为实施例六的文章资讯转换装置的连接框图;
图7为实施例七的文章资讯转换设备连接框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例旨在解决现有技术中资讯文章展现的形式不方便用户快速获取其信息的技术问题,本发明实施例主要提供了一种文章资讯转换方法及装置,下面分别通过以下实施例进行技术方案的展开描述。
实施例一
请参阅图1,其为本发明实施例一的文章资讯转换方法的步骤流程图。本实施例一提供了一种文章资讯转换方法,包括以下步骤:
S110:根据所述文章资讯的内容确定所述文章资讯的主题。
首先,在对文章资讯进行转换之前,需要先确定文章资讯的主要内容。如图2所示,在本步骤S110中,可以包括:
S111:识别并统计文章资讯中的数字出现的次数以及情感词出现的次数。
先对文章资讯中的数字和情感词数量进行统计,可以通过统计到的文章资讯的数字和情感词数量进行判断文章的类型。
S112:根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型。
所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章。当数字出现次数达到设定第一阈值时,则判断为数据类文章,比如:统计类的文章。当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章。当数字出现次数未达到第一阈值,且情感词出现次数都未达到第二阈值时,则判断为说明性质类型文章。比如,若文章中其他的叙述类的文字较多时,则文章资讯可能为说明类的文章。具体的,在判断文章类型时,可以通过训练大数据模型,利用主题模型、NLP,以及图像识别模型等技术进行判断文章类型。在本实施例中,所述第一阈值和第二阈值可以根据实现情况进行设定。另外,假设文章中的数字出现次数和情感词出现次数同时达到第一阈值和第二阈值,则该文章资讯中具备两种属性,即为数据类和带情感色彩类型的文章。
S120:根据所述文章资讯的主题将所述文章资讯转化为视图形式。
在本实施例一中,主要用于对数据类型的文章进行处理。比如:当文章类型为数据类型的文章时,可以将文章中的数据转化为表格或曲线图形式,并将所述文章资讯的主题作为图表的标题。其中,如果文章中具备多个段落,可以分别将每个段落转换为表格或曲线图形式,通过LDA主题模型概括段落的核心主题作为图表的标题。
在本发明实施例中,可以将文章转化为视图后与文字一同展示,也可以仅展示视图。另外,也可以将转化后的视图链接到对应的文章中,用户可以通过点击视图跳转至对应的文章中。具体的展现形式可以根据不同的应用场景进行调整。
实施例二
与实施例一的区别在于:本实施例二主要针对带感情色彩类型的文章进行转化,具体的方案如下:
当经过文章类型的判断,当文章类型判断为带情感色彩类型的文章时,则所述步骤S120中,可以采用的方案为:根据文章中的主题情感词搜索相匹配的图片作为文章的配图。假设文章中主要描述父爱的,可以通过搜索相关的图片,比如可以采用朱自清的《背影》的图片作为这个文章的插图,也可以采用其他图片。如果文章中具备多个段落,可以针对每个段落配上对应的插图。
在本实施例二中,可以结合插图和文章的文字描述进行结合展示,也可以单独以插图和文章主题作为标题的方式进行展示。具体的展示形式可以根据实际的需要进行调整。若文章资讯同时具备两种属性,则对文章资讯分别进行转化。例如,若同时具备数据类型和带情感色彩类型,可以针对数据部分转化为图表,然后再配上对应的插图。
实施例三
与实施例一的区别在于:本实施例三主要针对说明性质类型的文章进行转化,具体的方案如下:
当文章类型为说明性质类型的文章时,如图3所示,所述步骤S120中可以采用以下步骤:
S121:概括文章中每个段落的主题。
在本实施例中,在概括文章中每个段落的主题时可以采用以段落中的句号为粒度,概括每句话的关键词,然后根据每句话的关键词概括这段话的主题。
S122:将获得的段落主题以流程图形式进行展示。
当获取到每个段落的主题后,以流程图的形式进行串联展示,以方便用户快速获取文章的脉络。
实施例四
本实施例四对应于实施例一,提供了一种文章资讯转换装置。请参阅图4,其为本实施例四的文章资讯转换装置的连接框图。
本发明实施例四提供了一种文章资讯转换装置,包括:
获取模块110,用于根据所述文章资讯的内容确定所述文章资讯的主题。其中,所述获取模块110中包括:
识别子模块111,用于识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;
类别判断子模块112,用于根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型;所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章。当数字出现次数达到设定第一阈值时,则判断为数据类文章;当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;当数字出现次数未达到第一阈值,且情感词出现次数都未达到第二阈值时,则判断为说明性质类型文章。
转换模块120,用于根据所述文章资讯的主题将所述文章资讯转化为视图形式。
在本实施例四中,所述转换模块120包括:数据转换子模块121,用于将文章中的数据转化为表格或曲线图形式,并将所述文章资讯的主题作为图表的标题。
本实施例四与实施例一的原理相同,故不再赘述。
实施例五
本实施例五与实施例二对应,提供了一种文章资讯转换装置,具体如下:
如图5所示,为本实施例五的文章资讯转换装置的连接框图。本发明实施例五提供了一种文章资讯转换装置,包括:
获取模块210,用于根据所述文章资讯的内容确定所述文章资讯的主题。其中,所述获取模块210中包括:
识别子模块211,用于识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;
类别判断子模块212,用于根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型;所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章。当数字出现次数达到设定第一阈值时,则判断为数据类文章。当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;当数字出现次数未达到第一阈值,且情感词出现次数都未达到第二阈值时,则判断为说明性质类型文章。
转换模块220,用于根据所述文章资讯的主题将所述文章资讯转化为视图形式。
在本实施例五中,所述转化模块220包括:情感词转换子模块221,用于根据文章中的主题情感词搜索相匹配的图片作为文章的配图。
本实施例五的应用方式与原理与实施例二相同,故不再赘述。
实施例六
本实施例六与实施例三对应,提供了一种文章资讯转换装置,具体如下:
如图6所示,为本实施例六的文章资讯转换装置的连接框图。本发明实施例六提供了一种文章资讯转换装置,包括:
获取模块310,用于根据所述文章资讯的内容确定所述文章资讯的主题。其中,所述获取模块310中包括:
识别子模块311,用于识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;
类别判断子模块312,用于根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型;所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章。当数字出现次数达到设定第一阈值时,则判断为数据类文章;当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;当数字出现次数未达到第一阈值,且情感词出现次数都未达到第二阈值时,则判断为说明性质类型文章。
转换模块320,用于根据所述文章资讯的主题将所述文章资讯转化为视图形式。
在本实施例六中,所述转换模块320包括:
主题概括子模块321,用于概括文章中每个段落的主题。
流程图生成模块322,用于将获得的段落主题以流程图形式进行展示。
本实施例六的应用方式与原理与实施例三相同,故不再赘述。
实施例七
本发明实施例七提供一种文章资讯转换设备,如图7所示,该设备包括:存储器410和处理器420,存储器410内存储有可在处理器420上运行的计算机程序。所述处理器420执行所述计算机程序时实现上述实施例中的文章资讯转换方法。所述存储器410和处理器420的数量可以为一个或多个。
该设备还包括:
通信接口430,用于与外界设备进行通信,进行数据交互传输。
存储器410可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器410、处理器420和通信接口430独立实现,则存储器410、处理器420和通信接口430可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器410、处理器420及通信接口430集成在一块芯片上,则存储器410、处理器420及通信接口430可以通过内部接口完成相互间的通信。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
本发明实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质的更具体的示例至少(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
在本发明实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于指令执行系统、输入法或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
综上所述,本发明实施例可以提高资讯类文章被受众的读取效率和接受程度,提高用户体验,使得资讯文章更好地服务于用户,满足用户更高效地获取外界信息的需求。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (14)

1.一种文章资讯转换方法,其特征在于,包括:
根据所述文章资讯的内容确定所述文章资讯的主题;以及
根据所述文章资讯的主题将所述文章资讯转化为视图形式。
2.根据权利要求1所述文章资讯转换方法,其特征在于,所述根据所述文章资讯的内容确定所述文章资讯的主题,包括:
识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;以及
根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型。
3.根据权利要求2所述文章资讯转换方法,其特征在于,所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章;以及
所述根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型的步骤包括:
当数字出现次数达到设定第一阈值时,则判断为数据类的文章;
当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;以及
当数字出现次数未达到第一阈值,且情感词出现次数未达到第二阈值时,则判断为说明性质类型的文章。
4.根据权利要求3所述文章资讯转换方法,其特征在于,当文章类型为数据类型的文章时,所述根据所述文章资讯的主题将所述文章资讯转化为视图形式的步骤中,包括:
将文章中的数据转化为表格或曲线图形式,并将所述文章资讯的主题作为图表的标题。
5.根据权利要求3所述文章资讯转换方法,其特征在于,当文章类型为带情感色彩类型的文章时,所述根据所述文章资讯的主题将所述文章资讯转化为视图形式的步骤中,包括:
根据文章中的主题情感词搜索相匹配的图片作为文章的配图。
6.根据权利要求3所述文章资讯转换方法,其特征在于,当文章类型为说明性质类型的文章时,所述根据所述文章资讯的主题将所述文章资讯转化为视图形式的步骤中,包括:
概括文章中每个段落的主题;以及
将获得的段落主题以流程图形式进行展示。
7.一种文章资讯转换装置,其特征在于,包括:
获取模块,用于根据所述文章资讯的内容确定所述文章资讯的主题;以及
转换模块,用于根据所述文章资讯的主题将所述文章资讯转化为视图形式。
8.根据权利要求7所述文章资讯转换装置,其特征在于,所述获取模块包括:
识别子模块,用于识别并统计文章资讯中的数字出现的次数以及情感词出现的次数;以及
类别判断子模块,用于根据文章资讯中的数字出现的次数和情感词出现的次数判断文章的类型。
9.根据权利要求8所述文章资讯转换装置,其特征在于,所述文章资讯的类型包括:数据类型的文章、带感情色彩类型的文章和说明性质类型的文章;以及
所述类别判断子模块用于,当数字出现次数达到设定第一阈值时,则判断为数据类的文章;当情感词出现的次数达到设定第二阈值时,则判断为带感情色彩类型的文章;以及当数字出现次数未达到第一阈值,且情感词出现次数未达到第二阈值时,则判断为说明性质类型的文章。
10.根据权利要求9所述文章资讯转换装置,其特征在于,所述转换模块包括:
数据转换子模块,用于将文章中的数据转化为表格或曲线图形式,并将所述文章资讯的主题作为图表的标题。
11.根据权利要求9所述文章资讯转换装置,其特征在于,所述转化模块包括:
情感词转换子模块,用于根据文章中的主题情感词搜索相匹配的图片作为文章的配图。
12.根据权利要求9所述文章资讯转换装置,其特征在于,所述转化模块包括:
主题概括子模块,用于概括文章中每个段落的主题;以及
流程图生成模块,用于将获得的段落主题以流程图形式进行展示。
13.一种文章资讯转换设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-6中任一所述的文章资讯转换方法。
14.一种计算机可读介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的文章资讯转换方法。
CN201810054254.XA 2018-01-19 2018-01-19 文章资讯转换方法、装置、设备及计算机可读介质 Active CN108197113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810054254.XA CN108197113B (zh) 2018-01-19 2018-01-19 文章资讯转换方法、装置、设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810054254.XA CN108197113B (zh) 2018-01-19 2018-01-19 文章资讯转换方法、装置、设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN108197113A true CN108197113A (zh) 2018-06-22
CN108197113B CN108197113B (zh) 2021-04-20

Family

ID=62590326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810054254.XA Active CN108197113B (zh) 2018-01-19 2018-01-19 文章资讯转换方法、装置、设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN108197113B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792230A (zh) * 2021-08-24 2021-12-14 北京百度网讯科技有限公司 服务链接方法、装置、电子设备和存储介质
CN114036949A (zh) * 2021-11-08 2022-02-11 中国银行股份有限公司 基于资讯信息分析的投资策略确定方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774738A (zh) * 2003-04-14 2006-05-17 夏普株式会社 能够适当地显示文本数据的文本数据显示设备
CN104166681A (zh) * 2014-07-15 2014-11-26 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774738A (zh) * 2003-04-14 2006-05-17 夏普株式会社 能够适当地显示文本数据的文本数据显示设备
CN104166681A (zh) * 2014-07-15 2014-11-26 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马创新 等: "文本的可视化知识表示", 《情报科学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792230A (zh) * 2021-08-24 2021-12-14 北京百度网讯科技有限公司 服务链接方法、装置、电子设备和存储介质
CN113792230B (zh) * 2021-08-24 2024-04-09 北京百度网讯科技有限公司 服务链接方法、装置、电子设备和存储介质
CN114036949A (zh) * 2021-11-08 2022-02-11 中国银行股份有限公司 基于资讯信息分析的投资策略确定方法及装置

Also Published As

Publication number Publication date
CN108197113B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN104462364B (zh) 搜索推荐方法及装置
CN108280155B (zh) 基于短视频的问题检索反馈方法、装置及其设备
CN103902697B (zh) 组合搜索方法、客户端和服务器
CN109189991A (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
CN108536803A (zh) 歌曲推荐方法、装置、设备及计算机可读介质
CN107609186A (zh) 信息处理方法及装置、终端设备及计算机可读存储介质
CN109688469A (zh) 一种广告展示方法及展示装置
CN108052597A (zh) 新闻推送的方法、装置、设备及计算机可读介质
CN108038506A (zh) 一种图书自动分类方法
CN108197113A (zh) 文章资讯转换方法、装置、设备及计算机可读介质
CN107592399A (zh) 一种联系人的显示方法及移动终端
CN111125314A (zh) 书籍查询页面的展示方法、电子设备及计算机存储介质
Aytekin et al. NOSTALGIA IN ADVERTISING: A SEMIOTICAL ANALYSIS OF NOSTALGIA-THEMED AND NONNOSTALGIA-THEMED PRINT ADS.
CN109657043B (zh) 自动生成文章的方法、装置、设备及存储介质
CN107885875A (zh) 检索词的同义变换方法、装置及服务器
CN106169065A (zh) 一种信息处理方法及电子设备
JP5455232B2 (ja) 画像選定装置、方法及びプログラム
CN109976622B (zh) 书籍标签确定方法、电子设备及计算机存储介质
CN105574112A (zh) 一种通信过程的评论信息处理方法及系统
CN107748801A (zh) 新闻推荐方法、装置、终端设备及计算机可读存储介质
WO2021092803A1 (zh) 推送用户确定方法、装置、服务器以及存储介质
CN103995881A (zh) 搜索结果的展现方法及装置
CN116702749A (zh) 多媒体内容分析方法、装置、设备及存储介质
CN104461224B (zh) 一种信息处理方法及电子设备
CN104657480B (zh) 漫画搜索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant