CN108733635B - 一种文本信息展示方法及装置 - Google Patents

一种文本信息展示方法及装置 Download PDF

Info

Publication number
CN108733635B
CN108733635B CN201710272598.3A CN201710272598A CN108733635B CN 108733635 B CN108733635 B CN 108733635B CN 201710272598 A CN201710272598 A CN 201710272598A CN 108733635 B CN108733635 B CN 108733635B
Authority
CN
China
Prior art keywords
information
text
content
display form
text display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710272598.3A
Other languages
English (en)
Other versions
CN108733635A (zh
Inventor
周显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Guangzhou Kingsoft Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd, Guangzhou Kingsoft Mobile Technology Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201710272598.3A priority Critical patent/CN108733635B/zh
Priority to EP18791089.8A priority patent/EP3617910A4/en
Priority to PCT/CN2018/082569 priority patent/WO2018196607A1/zh
Priority to JP2019557425A priority patent/JP7116744B2/ja
Priority to US16/607,071 priority patent/US20200210640A1/en
Publication of CN108733635A publication Critical patent/CN108733635A/zh
Application granted granted Critical
Publication of CN108733635B publication Critical patent/CN108733635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种文本信息展示方法及装置,该方法包括:获取原始文本信息;通过语义分析算法,提取所述原始文本信息的信息特征和信息内容,所述信息特征用于表征所述原始文本信息描述的内容的类别,所述信息内容为所述原始文本信息表达的信息的具体内容;使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,所述文本展示形式包括文本信息内容的排版形式或结构格式;从而提高创建文本信息的效率和用户体验,并且使得文本信息能够通过优选的文本展示形式进行展示,提高了文本信息的表现力。

Description

一种文本信息展示方法及装置
技术领域
本发明涉及文字处理技术领域,特别是涉及一种文本信息展示方法及装置。
背景技术
随着各种终端设备技术及互联网技术的不断发展,人们可以在各种终端设备上记录各种各样的文本信息,还可以在各种终端设备上通过文本信息进行交流。例如,用户可以通过手机上的便签功能,记录各种文字信息;在电脑上创作文章等等。在终端设备上进行文本信息的展示,已经是不可或缺的功能。
终端设备在进行文本信息的展示时,可以有很多不同的文本展示形式。例如,一篇文字可以直接进行显示,也可以将其划分为不同部分,对每一部分添加标题或项目序号;或者当一篇文字描述的信息内容可以通过图表进行描述时,也可以通过图表的形式进行文本信息的展示;也可以将一篇文字通过思维导图的形式进行展示等等,在实际应用中,可以根据文本信息的内容进行选择。通过不同的文本展现形式,可以使得文本信息更加具有表现力,易于理解。
现有技术中,在创建文本信息之前,需要从现有的很多种文本展示形式中选择一种,并按照所选择的文本展示形式创建文本信息。例如:用户可以选择图表、思维导图等展现形式来创建文本信息。在选择文本展示形式时,文本信息没有被创建从而并不存在,所以用户在创建文本信息之前所选择的文本展示形式,并不一定适合所要创建的文本信息,进而导致用户可能需要重复进行文本展示形式的选择和文本信息的创建,降低了创建文本信息的效率,也降低了用户体验。
发明内容
本发明实施例的目的在于提供一种文本信息展示方法及装置,以实现根据已经创建的文本信息,自动或协助用户选择出合适的文本展示形式,并以该文本展示形式进行文本信息的展示,提高创建文本信息的效率和用户体验。具体技术方案如下:
本发明实施例提供了一种文本信息展示方法,包括:
获取原始文本信息;
通过语义分析算法,提取所述原始文本信息的信息特征和信息内容,所述信息特征用于表征所述原始文本信息描述的内容的类别,所述信息内容为所述原始文本信息表达的信息的具体内容;
使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,所述文本展示形式包括文本信息内容的排版形式或结构格式。
可选的,所述信息特征包括行为类型,所述行为类型为所述原始文本信息所描述的具有时间顺序的动作类型;
相应的,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
使用与所述行为类型相匹配的文本展示形式,展示具有所述行为类型的信息内容。
可选的,所述信息特征包括结构类型,所述结构类型为所述原始文本信息所描述的内容的结构形式;
相应的,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
使用与所述结构类型相匹配的文本展示形式,展示具有所述结构类型的信息内容。
可选的,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
根据所述信息特征,从预设的多种文本展示形式中确定出与所述信息特征相匹配的文本展示形式集合;
显示所述文本展示形式集合;
接收用户发送的选择指令,所述选择指令用于所述用户从所述文本展示形式集合中选择的文本展示形式;
使用所述选择指令中的文本展示形式,展示所述信息内容。
可选的,所述使用所述选择指令中的文本展示形式,展示所述信息内容之后,所述方法还包括:
记录每一个用户针对所述信息特征所选择的文本展示形式;
根据所述每一个用户针对所述信息特征所选择的文本展示形式,建立所述信息特征与所述文本展示形式的对应关系;
相应的,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
根据所述对应关系,确定与所述信息特征相匹配的文本展示形式;
使用与所述信息特征相匹配的文本展示形式,展示所述信息内容。
本发明实施例还提供了一种文本信息展示装置,包括:
获取模块,用于获取原始文本信息;
提取模块,用于通过语义分析算法,提取所述原始文本信息的信息特征和信息内容,所述信息特征用于表征所述原始文本信息描述的内容的类别,所述信息内容为所述原始文本信息表达的信息的具体内容;
展示模块,用于使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,所述文本展示形式包括文本信息内容的排版形式或结构格式。
可选的,所述提取模块所提取的所述信息特征包括行为类型,所述行为类型为所述原始文本信息所描述的具有时间顺序的动作类型;
相应的,所述展示模块,具体用于,使用与所述行为类型相匹配的文本展示形式,展示具有所述行为类型的信息内容。
可选的,所述提取模块所提取的所述信息特征包括结构类型,所述结构类型为所述原始文本信息所描述的内容的结构形式;
相应的,所述展示模块,具体用于:使用与所述结构类型相匹配的文本展示形式,展示具有所述结构类型的信息内容。
可选的,所述展示模块,具体用于,根据所述信息特征,从预设的多种文本展示形式中确定出与所述信息特征相匹配的文本展示形式集合;显示所述文本展示形式集合;接收用户发送的选择指令,所述选择指令用于所述用户从所述文本展示形式集合中选择的文本展示形式;使用所述选择指令中的文本展示形式,展示所述信息内容。
可选的,所述装置还包括:
记录模块,用于记录每一个用户针对所述信息特征所选择的文本展示形式;
对应模块,用于根据所述每一个用户针对所述信息特征所选择的文本展示形式,建立所述信息特征与所述文本展示形式的对应关系;
相应的,所述展示模块,具体用于:
根据所述对应关系,确定与所述信息特征相匹配的文本展示形式;
使用与所述信息特征相匹配的文本展示形式,展示所述信息内容。
本发明实施例提供的一种文本信息展示方法及装置,可以根据已有的文本信息,从文本信息中提取信息特征和信息内容,根据信息特征自动或协助用户选择出与信息特征相匹配的文本展示形式,并以该文本展示形式展示文本信息中的信息内容,避免了在创建文本信息之前所选择的文本展示形式并不适合所创建的文本信息的问题,从而提高创建文本信息的效率和用户体验,并且使得文本信息能够通过优选的文本展示形式进行展示,提高了文本信息的表现力。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文本信息展示方法的流程图;
图2为本发明实施例提供的对应出行安排的文本展示形式示意图;
图3为本发明实施例提供的结构化数据示意图;
图4为本发明实施例提供的对应树形结构的文本展示形式示意图;
图5为本发明实施例提供的文本信息展示装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例提供的文本信息展示方法的流程图,包括
步骤101,获取原始文本信息。
本发明实施例可以应用于电子设备,电子设备可以包括手机、电脑以及其他具有数据处理能力的终端设备。
原始文本信息可以是已经存在于电子设备上的文本信息,也可以是正在电子设备上创建的文本信息。文本信息的格式可以有很多种,例如TXT格式、Word格式等等。在本发明实施例中,只要是电子设备可以识别的文字格式都可以应用本发明实施例。原始文本信息可以是一段文字,也可以是多段文件,具体的排版形式在此不作限定。
电子设备获取原始文本信息的方式可以有很多种,例如,可以获取用户已经或正在输入的原始文本信息,还可以从存储设备中直接获取现有的原始文本信息。
步骤102,通过语义分析算法,提取原始文本信息的信息特征和信息内容,信息特征用于表征原始文本信息描述的内容的类别,信息内容为原始文本信息表达的信息的具体内容。
在获取了原始文本信息之后,就可以通过语义分析算法对该原始文本信息进行处理,从原始文本信息提取信息特征和信息内容。
原始文本信息可以认为是文字的集合,通过将文字按一定规则顺序排列,从而能够描述具体事物、行为动作、事物之间的关系或者其他的抽象概念等内容。信息特征就是用来表征原始文本信息所描述的内容的类别,例如,原始文本文件为:“明天要去A地旅游,先飞到城市B,然后再去城市C玩一下,然后坐车去城市D,估计一天时间就很满了”。通过语义分析算法对原始文本信息进行处理,可以确定出该原始文本信息所描述的内容的类别为出行安排。
在实际应用中,可以预设多种信息特征,例如出行安排、逻辑推导过程、组织结构、统计数据等等。通过语义分析算法对原始文本信息进行处理,可以将原始文本信息所描述的内容的类别,划分为预设的多种信息特征中的一种。从而实现在原始文本信息中提取出信息特征。
信息内容为原始文本信息表达的信息的具体的核心内容,信息内容可以不包括原始本文信息中的用来连接语句的连词、语气词等没有具体含义的词语。例如,在上面的例子中,信息内容可以为“去A地旅游”、“飞到城市B”、“去城市C玩一下”、“坐车去城市D”以及“估计一天时间就很满了”。
语义分析算法可以通过软件或硬件或软硬件结合的方法进行实现,通过对原始文本信息中文字含义以及文字之间连接关系的分析,能够获得原始文本信息的信息特征和信息内容。在现有技术中,存在多种语义分析算法,例如目前较为主流的算法模型:PLSA(probabilistic latent semantic analysis,概率语义分析算法),NMF(Non-negativeMatrix Factorization,非负矩阵分解算法),LDA(Latent Dirichlet Allocation,贝叶斯概率模型)等等。在实际应用中可以根据需要进行选择,在此不再进行赘述。
步骤103,使用与信息特征相匹配的文本展示形式,展示信息内容,文本展示形式包括文本信息内容的排版形式或结构格式。
当获取了原始文本信息的信息特征和信息内容之后,就可以根据信息特征匹配出与该信息特征相匹配的文本展示形式。
实际应用中,可以为文本展示形式添加相应的标识,该标识可以表示文本展示形式的不同类型。从而可以根据该标识来进行与信息特征的匹配。
通过信息特征匹配出对应的文本展示形式后,就可以将所提取的原始文件的信息内容,填写进匹配出的文本展示形式中,并通过该文本展示形式展示出信息内容。
例如:在上面的例子中,已经提取出原始文本信息的信息特征为出行安排。根据该信息特征,可以在预设的文本展示形式中进行匹配,并可以匹配出对应出行安排的文本展示形式。然后将已经提取出原始文本信息的信息内容,填充至对应出行安排的文本展示形式中。填充信息内容后的文本展示形式,如图2所示,图2为本发明实施例提供的对应出行安排的文本展示形式示意图。
信息内容还可以被转换为终端设备可以识别的结构化数据,结构化数据能够用数据或统一的结构加以表示,更加有利于对将信息内容按文本展示形式进行展示。
例如,在上面的例子中,提取了原始文本信息中的信息内容后,可以将该信息内容转化为如图3所示的结构化数据。参见图3,图3为本发明实施例提供的结构化数据示意图。
在本发明实施例中,通过语义分析算法,可以根据所获取的原始文本信息中提取信息特征和信息内容,根据信息特征选择出与信息特征相匹配的文本展示形式,并以该文本展示形式展示文本信息中的信息内容,从而可以避免在创建文本信息之前所选择的文本展示形式并不适合所创建的文本信息的问题,避免了用户进行重复工作。进而提高创建文本信息的效率和用户体验,并且使得文本信息能够通过优选的文本展示形式进行展示,提高了文本信息的表现力。
可选的,本发明实施例提供的文本信息展示方法中,信息特征可以包括行为类型,行为类型为原始文本信息所描述的具有时间顺序的动作类型。
在通过语义分析算法提取原始文本信息中的信息特征时,如果原始文本信息所描述的内容为具有时间顺序的动作,则可以将这一类型的信息特征称为行为类型。例如,上面例子中所提到的出行安排就是一种典型的行为类型。
行为类型还可以有很多种,例如日程安排、会议议程等其他动作或者行为。
相应的,使用与信息特征相匹配的文本展示形式,展示信息内容,包括:
使用与行为类型相匹配的文本展示形式,展示具有行为类型的信息内容。
当原始文本信息中的信息特征为行为特征时,就可以通过行为特征来匹配对应的文本展示形式,可以针对不同类型的行为特征预设多种不同的文本展示形式,例如,针对出行安排这一行为特征,可以预设有行程安排或地图导航标注等文本展示形式;针对会议安排这一行为特征,可以预设会议进度表等文本展示形式。
通过行为特征匹配文本展示形式,可以使得文本展示形式更加具有针对性,可以更具表现力的表达出信息内容。
可选的,本发明实施例提供的文本信息展示方法中,信息特征包括结构类型,结构类型为原始文本信息所描述的内容的结构形式。
当原始文本信息所描述的内容不是具有时间顺序的动作或行为时,信息特征还可以通过原始文本信息所描述的内容的结构类型来进行分类。
例如,原始文本信息所描述的内容的结构类型可以为树形结构、一维流式结构、一维平铺结构、二维结构、三维结构、多维结构等。
当原始文本信息描述的内容为组织关系结构、相互并列的条款或者逻辑推导过程等具有多分支结构的内容时,则原始文本信息所描述的内容的结构类型可以认为是树形结构。
当原始文本信息描述的内容为事物的流程等不具有分支结构的内容时,则原始文本信息所描述的内容的结构类型可以认为是一维流式结构。
当原始文本信息描述的内容具有相互包含或相互影响的结构时,例如描述的内容涉及交集、并集等概念时,则原始文本信息所描述的内容的结构类型可以认为是一维平铺结构。
当原始文本信息描述的内容存在两个维度的信息时,例如,当原始文本信息描述的内容为12个月的工资统计数据。则在该原始文本信息具有两个维度的信息内容,分别是月份,和对应月份的工资。这样的内容结构类型可以认为是二维结构。
以此类推,三维结构、多维结构等结构类型与二维结构类似,再次不再进行详细说明。
需要说明的是,上述所列举的结构类型不能穷尽所有的结构类型,在实际应用中可以根据需要定义或创建各种结构类型。
相应的,在本发明实施例中,使用与信息特征相匹配的文本展示形式,展示信息内容,包括:
使用与结构类型相匹配的文本展示形式,展示具有结构类型的信息内容。
每一种结构类型都可以对应一种或多种文本展示形式。例如,树形结构的文本展示形式可以为具有项目符号的多段式文字、思维导图以及组织结构图等。
一维流式结构的文本展示形式可以为流程图、价值链图、事件链图等。
一维平铺结构的文本展示形式可以为韦恩图。
二维结构的文本展示形式可以为表格。
三维结构的文本展示形式可以为表格透视图。
多维结构的文本展示形式可以为UML(UML-Unified Model Language,统一建模语言)图。
当确定了原始文本信息所描述的内容的结构形式后,就可以确定出该结构形式所匹配的文本展示形式,并且使用该文本展示形式展示原始文本信息的内容信息。
例如,原始文本信息为:“公司A下设市场部、生产管理部、行政管理部;其中市场部下设销售处和投资管理处两个处室,生产管理部下设技术处、检验处、质量管理处这三个处室,并且技术处根据所负责产品不同分为产品1组和产品2组,行政管理部下设人力资源处和财务处。”
通过语义分析算法,可以提取出该原始文本信息的信息内容,并且可以确定出该原始文本信息的结构类型为树形结构。并且可以根据该结构类型匹配出对应树形结构的文本展示形式,如组织结构图等,用来进行原始文本信息的内容信息的展示。参见图4,图4为本发明实施例提供的对应树形结构的文本展示形式示意图。
从图4中可以看出,原始文本信息中的信息内容通过组织结构图这一文本展示形式进行展示。使得可以更加清楚的表现出原始文本信息想要表述的具体内容。
在本发明实施例中,确定原始文本信息所描述的内容的结构形式,并对应具体的结构形式匹配文本展示形式,使得能够提高匹配的准确度,所匹配的文本展示形式更加适合展示文本信息所描述的内容。
可选的,本发明实施例提供的文本信息展示方法中,使用与信息特征相匹配的文本展示形式,展示信息内容,包括:
第一步,根据信息特征,从预设的多种文本展示形式中确定出与信息特征相匹配的文本展示形式集合。
在实际应用中,可以针对各种不同的信息类型,预设多种文本展示形式,当需要进行匹配时,可以根据信息特征,从预设的多种文本展示形式中进行选择,从而更加快速的确定出与信息特征相匹配的文本展示形式。
然而在很多情况下,一个信息特征往往可以匹配多个文本展示形式,在这种情况下,终端设备往往不能确定出最优的文本展示形式,所以,可以将与信息特征相匹配的多种文本展示形式放入一个文本展示形式集合中,该集合可以包括与信息特征相匹配的多种文本展示形式,或者可以包括与信息特征相匹配的多种文本展示形式的标识。
第二步,显示文本展示形式集合。
当确定出与信息特征相匹配的多种文本展示形式所组成的文本展示形式集合后,终端设备可以向用户显示该文本展示形式集合,以使用户可以从该文本展示形式集合中选择出最为适合的文本展示形式。
第三步,接收用户发送的选择指令,选择指令用于用户从文本展示形式集合中选择的文本展示形式。
第四步,使用选择指令中的文本展示形式,展示所述信息内容。
当用户进行选择后,终端设备可以接收到用户的选择指令,用户的选择指令可以用户对终端设备的操作信号。例如,鼠标的点击操作或者其他的选择方式。终端设备根据用户的操作,可以确定出与信息特征相匹配的文本展示形式。并使用该文本展示形式展示原始文本信息的内容信息。
在本发明实施例中,匹配文本展示形式的过程中,用户可以直接参与,不仅提高了匹配的准确性,同时可以使得最后的结果更加符合用户的期望,进一步提高了用户体验。
可选的,本发明实施例提供的文本信息展示方法中,使用选择指令中的文本展示形式,展示信息内容之后,该方法还包括:
记录每一个用户针对信息特征所选择的文本展示形式。
根据每一个用户针对信息特征所选择的文本展示形式,建立信息特征与文本展示形式的对应关系。
每一次用户从与信息特征相匹配的多个文本展示形式中选择了最适合该信息特征的文本展示形式后,终端设备都可以记录下对应该信息特征用户所选择的文本展示形式。从而终端设备可以记录下不同用户大量的针对各种信息特征所选择的文本展示信息的选择结构。
通过对大量数据的累积,可以建立信息特征与文本展示形式的对应关系,例如针对一种信息特征,有90%用户都选择了文本展示形式A,有10%的用户选择了文本展示形式B。则可以认为针对该信息特征,文本展示形式A为最优的文本展示形式,从而可以建立起该信息特征与文本展示形式A的对应关系。对应关系是指文本展示形式与信息特征的联系,例如可以通过表格的形式实现,参见表1所示的文本展示形式与信息特征对照表。利用表格可以清楚的记录文本展示形式与信息特征相互对应的情况。
表1
第一信息特征 第二信息特征 第三信息特征 第四信息特征
文本展示形式A 文本展示形式C 文本展示形式D 文本展示形式B
相应的,使用与信息特征相匹配的文本展示形式,展示信息内容,包括:
根据对应关系,确定与信息特征相匹配的文本展示形式。
使用与信息特征相匹配的文本展示形式,展示信息内容。
当通过大量用户的选择结果,确定出各种文本展示形式与不同的信息特征的对应关系后,就可以利用该对应关系,更加迅速准确的匹配出与信息特征相匹配的文本展示形式。并通过该文本展示形式展示原始文本文件的信息内容。从而更进一步的提高了匹配的效率,对应关系是根据大量用户的选择结果得到的,所以根据对应关系进行匹配的匹配结果,能够更加符合用户的需求。
参见图5,图5为本发明实施例所提供的文本信息展示装置的结构图,其中包括:
获取模块501,用于获取原始文本信息;
提取模块502,用于通过语义分析算法,提取所述原始文本信息的信息特征和信息内容,所述信息特征用于表征所述原始文本信息描述的内容的类别,所述信息内容为所述原始文本信息表达的信息的具体内容;
展示模块503,用于使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,所述文本展示形式包括文本信息内容的排版形式或结构格式。
在本发明实施例中,通过语义分析算法,可以根据所获取的原始文本信息中提取信息特征和信息内容,根据信息特征选择出与信息特征相匹配的文本展示形式,并以该文本展示形式展示文本信息中的信息内容,从而提高创建文本信息的效率和用户体验,并且使得文本信息能够通过优选的文本展示形式进行展示,提高了文本信息的表现力。
可选的,本发明实施例提供的文本信息展示装置中,所述提取模块502所提取的所述信息特征包括行为类型,所述行为类型为所述原始文本信息所描述的具有时间顺序的动作类型;
相应的,所述展示模块503,具体用于,使用与所述行为类型相匹配的文本展示形式,展示具有所述行为类型的信息内容。
可选的,本发明实施例提供的文本信息展示装置中,所述提取模块402所提取的所述信息特征包括结构类型,所述结构类型为所述原始文本信息所描述的内容的结构形式;
相应的,所述展示模块503,具体用于:使用与所述结构类型相匹配的文本展示形式,展示具有所述结构类型的信息内容。
可选的,本发明实施例提供的文本信息展示装置中,所述展示模块503,
具体用于,根据所述信息特征,从预设的多种文本展示形式中确定出与所述信息特征相匹配的文本展示形式集合;显示所述文本展示形式集合;接收用户发送的选择指令,所述选择指令用于所述用户从所述文本展示形式集合中选择的文本展示形式;使用所述选择指令中的文本展示形式,展示所述信息内容。
可选的,本发明实施例提供的文本信息展示装置中,所述装置还包括:
记录模块,用于记录每一个用户针对所述信息特征所选择的文本展示形式;
对应模块,用于根据所述每一个用户针对所述信息特征所选择的文本展示形式,建立所述信息特征与所述文本展示形式的对应关系;
相应的,所述展示模块503,具体用于:
根据所述对应关系,确定与所述信息特征相匹配的文本展示形式;使用与所述信息特征相匹配的文本展示形式,展示所述信息内容。
本发明实施例的装置是应用上述文本信息展示方法的装置,则上述文本信息展示方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种文本信息展示方法,其特征在于,包括:
获取原始文本信息;
通过语义分析算法,提取所述原始文本信息的信息特征和信息内容,所述信息特征用于表征所述原始文本信息描述的内容的类别,所述信息内容为所述原始文本信息表达的信息的具体的核心内容,所述信息特征包括结构类型,所述结构类型为所述原始文本信息所描述的内容的结构形式;
使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,所述文本展示形式包括文本信息内容的排版形式或结构格式。
2.根据权利要求1所述的方法,其特征在于,所述信息特征包括行为类型,所述行为类型为所述原始文本信息所描述的具有时间顺序的动作类型;
相应的,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
使用与所述行为类型相匹配的文本展示形式,展示具有所述行为类型的信息内容。
3.根据权利要求1所述的方法,其特征在于,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
使用与所述结构类型相匹配的文本展示形式,展示具有所述结构类型的信息内容。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
根据所述信息特征,从预设的多种文本展示形式中确定出与所述信息特征相匹配的文本展示形式集合;
显示所述文本展示形式集合;
接收用户发送的选择指令,所述选择指令用于所述用户从所述文本展示形式集合中选择的文本展示形式;
使用所述选择指令中的文本展示形式,展示所述信息内容。
5.根据权利要求4所述的方法,其特征在于,所述使用所述选择指令中的文本展示形式,展示所述信息内容之后,所述方法还包括:
记录每一个用户针对所述信息特征所选择的文本展示形式;
根据所述每一个用户针对所述信息特征所选择的文本展示形式,建立所述信息特征与所述文本展示形式的对应关系;
相应的,所述使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,包括:
根据所述对应关系,确定与所述信息特征相匹配的文本展示形式;
使用与所述信息特征相匹配的文本展示形式,展示所述信息内容。
6.一种文本信息展示装置,其特征在于,包括:
获取模块,用于获取原始文本信息;
提取模块,用于通过语义分析算法,提取所述原始文本信息的信息特征和信息内容,所述信息特征用于表征所述原始文本信息描述的内容的类别,所述信息内容为所述原始文本信息表达的信息的具体的核心内容,所述信息特征包括结构类型,所述结构类型为所述原始文本信息所描述的内容的结构形式;
展示模块,用于使用与所述信息特征相匹配的文本展示形式,展示所述信息内容,所述文本展示形式包括文本信息内容的排版形式或结构格式。
7.根据权利要求6所述的装置,其特征在于,所述提取模块所提取的所述信息特征包括行为类型,所述行为类型为所述原始文本信息所描述的具有时间顺序的动作类型;
相应的,所述展示模块,具体用于,使用与所述行为类型相匹配的文本展示形式,展示具有所述行为类型的信息内容。
8.根据权利要求6所述的装置,其特征在于,所述展示模块,具体用于:使用与所述结构类型相匹配的文本展示形式,展示具有所述结构类型的信息内容。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述展示模块,具体用于,根据所述信息特征,从预设的多种文本展示形式中确定出与所述信息特征相匹配的文本展示形式集合;显示所述文本展示形式集合;接收用户发送的选择指令,所述选择指令用于所述用户从所述文本展示形式集合中选择的文本展示形式;使用所述选择指令中的文本展示形式,展示所述信息内容。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
记录模块,用于记录每一个用户针对所述信息特征所选择的文本展示形式;
对应模块,用于根据所述每一个用户针对所述信息特征所选择的文本展示形式,建立所述信息特征与所述文本展示形式的对应关系;
相应的,所述展示模块,具体用于:
根据所述对应关系,确定与所述信息特征相匹配的文本展示形式;
使用与所述信息特征相匹配的文本展示形式,展示所述信息内容。
CN201710272598.3A 2017-04-24 2017-04-24 一种文本信息展示方法及装置 Active CN108733635B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201710272598.3A CN108733635B (zh) 2017-04-24 2017-04-24 一种文本信息展示方法及装置
EP18791089.8A EP3617910A4 (en) 2017-04-24 2018-04-10 TEXT INFORMATION DISPLAY METHOD AND APPARATUS
PCT/CN2018/082569 WO2018196607A1 (zh) 2017-04-24 2018-04-10 一种文本信息展示方法及装置
JP2019557425A JP7116744B2 (ja) 2017-04-24 2018-04-10 テキスト情報を表示する方法および装置
US16/607,071 US20200210640A1 (en) 2017-04-24 2018-04-10 Method and apparatus for displaying textual information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710272598.3A CN108733635B (zh) 2017-04-24 2017-04-24 一种文本信息展示方法及装置

Publications (2)

Publication Number Publication Date
CN108733635A CN108733635A (zh) 2018-11-02
CN108733635B true CN108733635B (zh) 2021-12-03

Family

ID=63918778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710272598.3A Active CN108733635B (zh) 2017-04-24 2017-04-24 一种文本信息展示方法及装置

Country Status (5)

Country Link
US (1) US20200210640A1 (zh)
EP (1) EP3617910A4 (zh)
JP (1) JP7116744B2 (zh)
CN (1) CN108733635B (zh)
WO (1) WO2018196607A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728129B (zh) * 2019-09-03 2023-06-23 北京字节跳动网络技术有限公司 对图片中的文本内容进行排版的方法、装置、介质和设备
CN110765754B (zh) * 2019-09-16 2024-05-03 平安科技(深圳)有限公司 文本数据排版方法、装置、计算机设备及存储介质
CN112784555B (zh) * 2019-11-08 2024-03-12 珠海金山办公软件有限公司 一种生成数据透视图的方法及装置
CN112036128A (zh) * 2020-08-21 2020-12-04 百度在线网络技术(北京)有限公司 一种文本内容处理方法、装置、设备以及存储介质
CN112199467B (zh) * 2020-09-08 2023-12-08 深圳价值在线信息科技股份有限公司 函件显示页面的配置方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110497A (ja) * 2007-10-12 2009-05-21 Ricoh Co Ltd 情報処理装置、画像形成装置、プログラム、文書データ構成方法
JP2014053040A (ja) * 2013-11-20 2014-03-20 Canon Inc 情報処理装置、情報処理方法及びプログラム
CN104835031A (zh) * 2014-01-21 2015-08-12 郑暎教 用于使日程安排信息与思维导图相关联的方法以及服务器
CN105701083A (zh) * 2014-11-28 2016-06-22 国际商业机器公司 文本表示方法和装置
CN105701082A (zh) * 2016-01-13 2016-06-22 刘敏 演示文档的自动排版方法及系统
CN106294666A (zh) * 2016-08-04 2017-01-04 上海汽笛生网络科技有限公司 一种实现文本形象化动态展示的方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160690A (ja) * 1993-12-10 1995-06-23 Ricoh Co Ltd 定型文書処理装置
US5887120A (en) * 1995-05-31 1999-03-23 Oracle Corporation Method and apparatus for determining theme for discourse
JP2002116983A (ja) * 2000-10-02 2002-04-19 Hewlett Packard Co <Hp> ウェブコンテンツの変換方法およびシステム
JP2006065508A (ja) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
EP1866810A1 (en) * 2005-04-04 2007-12-19 MOR(F) Dynamics Pty Ltd Method for transforming language into a visual form
US20060277060A1 (en) * 2005-05-05 2006-12-07 Antognini Walter G Dynamic authoring of transaction display
US8438486B2 (en) * 2006-02-09 2013-05-07 Microsoft Corporation Automatically converting text to business graphics
US8356248B1 (en) * 2008-09-29 2013-01-15 Amazon Technologies, Inc. Generating context-based timelines
US8775918B2 (en) * 2008-10-07 2014-07-08 Visual Software Systems Ltd. System and method for automatic improvement of electronic presentations
US8245135B2 (en) * 2009-09-08 2012-08-14 International Business Machines Corporation Producing a visual summarization of text documents
US8996984B2 (en) * 2010-04-29 2015-03-31 International Business Machines Corporation Automatic visual preview of non-visual data
US9275482B1 (en) * 2011-04-01 2016-03-01 The Mathworks, Inc. Display selection based on data format recognition
US9128581B1 (en) * 2011-09-23 2015-09-08 Amazon Technologies, Inc. Providing supplemental information for a digital work in a user interface
US9135233B2 (en) * 2011-10-13 2015-09-15 Microsoft Technology Licensing, Llc Suggesting alternate data mappings for charts
US9514257B1 (en) * 2011-10-30 2016-12-06 Lockheed Martin Corporation Event visualization based on unstructured data
US20130275904A1 (en) * 2012-04-11 2013-10-17 Secondprism Inc. Interactive data visualization and manipulation
US9721321B1 (en) * 2012-04-12 2017-08-01 Farshad Nayeri Automated interactive dynamic audio/visual performance with integrated data assembly system and methods
CN103678273A (zh) * 2012-09-14 2014-03-26 安徽华贞信息科技有限公司 互联网段落级话题识别系统
US20140101542A1 (en) * 2012-10-09 2014-04-10 Microsoft Corporation Automated data visualization about selected text
US9588941B2 (en) * 2013-03-07 2017-03-07 International Business Machines Corporation Context-based visualization generation
US9311297B2 (en) * 2013-03-14 2016-04-12 Prateek Bhatnagar Method and system for outputting information
CN103236163B (zh) * 2013-04-28 2015-01-07 北京航空航天大学 一种基于群智网络的交通拥堵规避提示系统
US9460199B2 (en) * 2013-05-01 2016-10-04 International Business Machines Corporation Application of text analytics to determine provenance of an object
US9665259B2 (en) * 2013-07-12 2017-05-30 Microsoft Technology Licensing, Llc Interactive digital displays
US20150039592A1 (en) * 2013-07-30 2015-02-05 Haiku Deck, Inc. Apparatus and Method for Automatically Creating a Multimedia Presentation from Evaluated Content
US20150074127A1 (en) * 2013-09-10 2015-03-12 Microsoft Corporation Creating Visualizations from Data in Electronic Documents
US20150077419A1 (en) * 2013-09-19 2015-03-19 International Business Machines Corporation Visualization of data related to unstructured text
US10089407B2 (en) * 2013-09-20 2018-10-02 Salesforce.Com, Inc. Systems, methods, and apparatuses for implementing analytics on demand functionality
CN103488608A (zh) * 2013-09-27 2014-01-01 杨昕吉 可视化样式电子名片快速构建的方法和系统
US10572473B2 (en) * 2013-10-09 2020-02-25 International Business Machines Corporation Optimized data visualization according to natural language query
US20150186806A1 (en) * 2013-12-30 2015-07-02 International Business Machines Corporation Pattern-based analysis recommendation
US9542363B2 (en) * 2014-01-31 2017-01-10 Konica Minolta Laboratory U.S.A., Inc. Processing of page-image based document to generate a re-targeted document for different display devices which support different types of user input methods
US20150278214A1 (en) * 2014-04-01 2015-10-01 Tableau Software, Inc. Systems and Methods for Ranking Data Visualizations Using Different Data Fields
US9424318B2 (en) * 2014-04-01 2016-08-23 Tableau Software, Inc. Systems and methods for ranking data visualizations
US9613102B2 (en) * 2014-04-01 2017-04-04 Tableau Software, Inc. Systems and methods for ranking data visualizations
US10007708B2 (en) * 2014-10-31 2018-06-26 Business Objects Software Ltd. System and method of providing visualization suggestions
US10607139B2 (en) * 2015-09-23 2020-03-31 International Business Machines Corporation Candidate visualization techniques for use with genetic algorithms
US9633048B1 (en) * 2015-11-16 2017-04-25 Adobe Systems Incorporated Converting a text sentence to a series of images
US20170139899A1 (en) * 2015-11-18 2017-05-18 Le Holdings (Beijing) Co., Ltd. Keyword extraction method and electronic device
CN106503191A (zh) * 2016-10-26 2017-03-15 冯村 一种数据管理设备和方法
US10380778B2 (en) * 2016-12-09 2019-08-13 Dropbox, Inc. Automated chart generation within a document generation application using heuristic model with predefined data types
US10628978B2 (en) * 2017-02-23 2020-04-21 Wipro Limited Method and system for processing input data for display in an optimal visualization format
US11132541B2 (en) * 2017-09-29 2021-09-28 The Mitre Corporation Systems and method for generating event timelines using human language technology

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110497A (ja) * 2007-10-12 2009-05-21 Ricoh Co Ltd 情報処理装置、画像形成装置、プログラム、文書データ構成方法
JP2014053040A (ja) * 2013-11-20 2014-03-20 Canon Inc 情報処理装置、情報処理方法及びプログラム
CN104835031A (zh) * 2014-01-21 2015-08-12 郑暎教 用于使日程安排信息与思维导图相关联的方法以及服务器
CN105701083A (zh) * 2014-11-28 2016-06-22 国际商业机器公司 文本表示方法和装置
CN105701082A (zh) * 2016-01-13 2016-06-22 刘敏 演示文档的自动排版方法及系统
CN106294666A (zh) * 2016-08-04 2017-01-04 上海汽笛生网络科技有限公司 一种实现文本形象化动态展示的方法

Also Published As

Publication number Publication date
JP2020524833A (ja) 2020-08-20
EP3617910A4 (en) 2020-04-29
JP7116744B2 (ja) 2022-08-10
US20200210640A1 (en) 2020-07-02
EP3617910A1 (en) 2020-03-04
WO2018196607A1 (zh) 2018-11-01
CN108733635A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN108733635B (zh) 一种文本信息展示方法及装置
Burnap et al. COSMOS: Towards an integrated and scalable service for analysing social media on demand
US20180309807A1 (en) Apparatus and Method for Acquiring, Managing, Sharing, Monitoring, Analyzing and Publishing Web-Based Time Series Data
US20210081759A1 (en) Deep neural network based user segmentation
CN109446509B (zh) 一种对话语料意图分析方法、系统及电子设备
US20130204822A1 (en) Tools and methods for determining relationship values
WO2021175302A1 (zh) 一种数据采集方法和系统
Bygstad et al. Social media as CRM? How two airline companies used Facebook during the “Ash crisis” in 2010
KR102156442B1 (ko) 소셜 미디어 이슈 처리 방법과 이를 지원하는 장치
CN107784033A (zh) 一种基于会话进行推荐的方法和装置
CN114077705A (zh) 一种对社交平台上的媒体账号进行画像的方法和系统
JP6494977B2 (ja) サポート装置、サポート方法及びサポートプログラム
CN114722789B (zh) 数据报表集成方法、装置、电子设备及存储介质
US11134045B2 (en) Message sorting system, message sorting method, and program
CN111292010B (zh) 一种定向进行数据采集的方法及系统
CN112700093B (zh) 一种项目进展甘特图构建方法、终端设备及存储介质
Williford et al. Literature themes from five decades of agricultural communications publications
CN115017200A (zh) 搜索结果的排序方法、装置、电子设备和存储介质
TWI744343B (zh) 問卷產生平台
JP2016035688A (ja) テキスト分析装置、テキスト分析方法、テキスト分析プログラムおよび記録媒体
Hansmann Empirical development and evaluation of a maturity model for big data applications
WO2013119798A1 (en) Tools and methods for determining relationship values
CN116823508B (zh) 基于大数据分析的尽职调查与资信评估系统
CN116795899A (zh) 调查问卷的汇总方法、装置、服务器及存储介质
Takhar-Lail et al. Market research methodologies: Multi-method and qualitative

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant