CN112036159B - 一种词云数据生成方法以及装置 - Google Patents
一种词云数据生成方法以及装置 Download PDFInfo
- Publication number
- CN112036159B CN112036159B CN202010907156.3A CN202010907156A CN112036159B CN 112036159 B CN112036159 B CN 112036159B CN 202010907156 A CN202010907156 A CN 202010907156A CN 112036159 B CN112036159 B CN 112036159B
- Authority
- CN
- China
- Prior art keywords
- phrase
- word cloud
- display layer
- target word
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000012216 screening Methods 0.000 claims abstract description 15
- 230000002093 peripheral effect Effects 0.000 claims description 364
- 238000012545 processing Methods 0.000 claims description 28
- 230000011218 segmentation Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005065 mining Methods 0.000 claims description 7
- 238000012552 review Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 208000025174 PANDAS Diseases 0.000 description 4
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 4
- 240000004718 Panda Species 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开的实施例公开了一种词云数据生成方法以及装置。该方法包括:获取资讯信息;根据资讯信息,获取指定对象标识对应的词云短语候选集;根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语;展示指定对象标识以及对应的目标词云短语。本公开的实施例能够有效地降低用户查阅感兴趣的内容的时间成本,从而能够提高用户体验。
Description
技术领域
本公开涉及信息处理技术领域,尤其涉及一种词云数据生成方法以及装置。
背景技术
目前,用户通过手机等电子设备能够收到大量的资讯信息,用户需要对资讯信息的所有内容进行查看,才能成功查阅感兴趣的内容,这样会导致用户查阅感兴趣的内容的时间成本非常高,从而会给用户带来非常不好的使用体验。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种词云数据生成方法、装置、计算机可读存储介质以及电子设备。
根据本公开实施例的一个方面,提供了一种词云数据生成方法,包括:
获取资讯信息;
根据所述资讯信息,获取指定对象标识对应的词云短语候选集;
根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;
展示所述指定对象标识以及对应的目标词云短语。
在一个可选示例中,
所述根据所述资讯信息,获取指定对象标识对应的词云短语候选集,包括:
从所述资讯信息中,获取与所述指定对象标识关联的语料;
对所述语料进行分词处理,以得到分词处理结果;
对所述分词处理结果进行挖掘处理,以得到词云短语候选集;
所述根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语,包括:
根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语。
在一个可选示例中,所述根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语,包括:
根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数;
根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数;
根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数;
从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。
在一个可选示例中,所述根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数,包括:
确定组成第一词云短语的每个词语在所述词云短语候选集中的真实出现次数,以及根据所述语料的统计数据,确定所述语料中的词语总数量和组成所述第一词云短语的每个词语在所述语料中的真实出现次数;其中,所述第一词云短语为所述词云短语候选集中的任一词云短语;
分别计算组成所述第一词云短语的每个词语在所述词云短语候选集中的真实出现次数与在所述语料中的真实出现次数的比值,以得到组成所述第一词云短语的每个词语对应的比值;
计算组成所述第一词云短语的各个词语对应的比值的乘积;
根据所计算的乘积和所述语料中的词语总数量,确定所述第一词云短语在所述语料中的期望出现次数。
在一个可选示例中,所述根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数,包括:
计算第二词云短语在所述语料中的真实出现次数和期望出现次数的差值;其中,所述第二词云短语为所述词云短语候选集中的任一词云短语;
计算所述第二词云短语在所述语料中的真实出现次数的开方结果;
计算所述差值与所述开方结果的比值,并将所计算的比值作为所述第二词云短语的重要性分数。
在一个可选示例中,所述从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语,包括:
在重要性分数大于或等于预设分数的词云短语中删除满足预设条件的词云短语,并将剩余的词云短语作为待展示的目标词云短语;
其中,任一词云短语满足所述预设条件是指满足以下至少一项:
词云短语以日期结尾;
词云短语的数字占比大于预设比例;
词云短语包含重复词语;
重要性分数大于或等于预设分数的词云短语中存在与当前词云短语具有指定重复性关系且长于当前词云短语的词云短语。
在一个可选示例中,所述展示所述指定对象标识以及对应的目标词云短语,包括:
展示画布;其中,所述画布上具有中心展示层以及围绕所述中心展示层的外围展示层;
在所述中心展示层上展示所述指定对象标识;
根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,并在所述外围展示层的展示位置展示所述目标词云短语。
在一个可选示例中,所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的尺寸信息;
根据所述外围展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的尺寸信息;
从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的区域信息、所述目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
在一个可选示例中,所述中心展示层呈半圆盘状,所述外围展示层呈扇环状,所述中心展示层与所述外围展示层同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层半径以及外围展示层半径;
所述所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
根据所述中心展示层半径、所述外围展示层半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,根据所述中心展示层半径、所述外围展示层半径以及所述占位圆半径确定的坐标范围条件为:
所述目标词云短语的占位圆圆心与所述中心展示层圆心的距离大于所述中心展示层半径与所述占位圆半径的和值,小于所述外围展示层半径与所述占位圆半径的差值。
在一个可选示例中,当存在多个目标词云短语时,则有:
任意两个目标词云短语的占位圆圆心的距离大于所述任意两个目标词云短语的占位圆半径和值;或者,
任意两个目标词云短语的占位圆圆心的距离大于所述任意两个目标词云短语中的一者的占位圆半径的预设倍数。
在一个可选示例中,当存在多个目标词云短语时,所述根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据所述坐标范围条件,确定所述目标词云短语的占位圆的随机旋转半径;
计算所述目标词云短语的占位圆的随机旋转角度;
将所述目标词云短语的占位圆以所述随机旋转角度以及所述随机旋转半径围绕所述中心展示层圆心旋转;
根据对所述目标词云短语的占位圆的旋转,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,所述计算所述目标词云短语的占位圆的随机旋转角度,包括:
采用公式MINangle=arccos[(a*a+b*b-c*c)/(2.0*a*b)],计算最小旋转角度;其中,MINangle为所述最小旋转角度,a为所述中心展示层半径与所述占位圆半径的和值,b与a相等,c为所述占位圆半径的2倍;
获取所述外围展示层所对应的已旋转角度;
计算所述最小旋转角度与所述已旋转角度的和值,并确定大于所计算的和值的随机旋转角度;
所述确定大于所计算的和值的随机旋转角度之后,所述方法还包括:
将所述已旋转角度更新为所述随机旋转角度。
在一个可选示例中,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层,所述中心展示层呈半圆盘状,所述N个外围展示层中的每个外围展示层呈扇环状且与所述中心展示层同为一个圆心,所述中心展示层和每个外围展示层的区域信息包括中心展示层半径以及每个外围展示层各自的外围展示层半径;
所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的外围展示层半径、所述目标词云短语待展示的外围展示层的指定相邻展示层的展示层半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
根据所述坐标范围条件,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
在一个可选示例中,所述外围展示层的外切圆与所述中心展示层的外切圆同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层外切圆半径以及外围展示层外切圆半径;
所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
根据所述中心展示层外切圆半径、所述外围展示层外切圆半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的重要度等级;
根据所述重要度等级,从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的区域信息,确定所述目标词云短语在待展示的外围展示层的展示位置。
根据本公开实施例的另一个方面,提供了一种词云数据生成装置,包括:
第一获取模块,用于获取资讯信息;
第二获取模块,用于根据所述资讯信息,获取指定对象标识对应的词云短语候选集;
确定模块,用于根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;
展示模块,用于展示所述指定对象标识以及对应的目标词云短语。
在一个可选示例中,
所述第二获取模块,包括:
第一获取子模块,用于从所述资讯信息中,获取与所述指定对象标识关联的语料;
第二获取子模块,用于对所述语料进行分词处理,以得到分词处理结果;
第三获取子模块,用于对所述分词处理结果进行挖掘处理,以得到词云短语候选集;
所述确定模块,具体用于:
根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语。
在一个可选示例中,所述确定模块,包括:
第一确定子模块,用于根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数;
第二确定子模块,用于根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数;
第三确定子模块,用于根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数;
第四确定子模块,用于从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。
在一个可选示例中,所述第二确定子模块,包括:
第一确定单元,用于确定组成第一词云短语的每个词语在所述词云短语候选集中的真实出现次数,以及根据所述语料的统计数据,确定所述语料中的词语总数量和组成所述第一词云短语的每个词语在所述语料中的真实出现次数;其中,所述第一词云短语为所述词云短语候选集中的任一词云短语;
第一获得单元,用于分别计算组成所述第一词云短语的每个词语在所述词云短语候选集中的真实出现次数与在所述语料中的真实出现次数的比值,以得到组成所述第一词云短语的每个词语对应的比值;
第一计算单元,用于计算组成所述第一词云短语的各个词语对应的比值的乘积;
第二确定单元,用于根据所计算的乘积和所述语料中的词语总数量,确定所述第一词云短语在所述语料中的期望出现次数。
在一个可选示例中,所述第三确定子模块,包括:
第二计算单元,用于计算第二词云短语在所述语料中的真实出现次数和期望出现次数的差值;其中,所述第二词云短语为所述词云短语候选集中的任一词云短语;
第三计算单元,用于计算所述第二词云短语在所述语料中的真实出现次数的开方结果;
第三确定单元,用于计算所述差值与所述开方结果的比值,并将所计算的比值作为所述第二词云短语的重要性分数。
在一个可选示例中,所述第四确定子模块,具体用于:
在重要性分数大于或等于预设分数的词云短语中删除满足预设条件的词云短语,并将剩余的词云短语作为待展示的目标词云短语;
其中,任一词云短语满足所述预设条件是指满足以下至少一项:
词云短语以日期结尾;
词云短语的数字占比大于预设比例;
词云短语包含重复词语;
重要性分数大于或等于预设分数的词云短语中存在与当前词云短语具有指定重复性关系且长于当前词云短语的词云短语。
在一个可选示例中,所述展示模块,包括:
第一展示子模块,用于展示画布;其中,所述画布上具有中心展示层以及围绕所述中心展示层的外围展示层;
第二展示子模块,用于在所述中心展示层上展示所述指定对象标识;
第三展示子模块,用于根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,并在所述外围展示层的展示位置展示所述目标词云短语。
在一个可选示例中,所述第三展示子模块,包括:
第四确定单元,用于确定所述目标词云短语的尺寸信息;
第五确定单元,用于根据所述外围展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述第三展示子模块,包括:
第六确定单元,用于确定所述目标词云短语的尺寸信息;
第七确定单元,用于从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
第八确定单元,用于根据所述目标词云短语待展示的外围展示层的区域信息、所述目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
在一个可选示例中,所述中心展示层呈半圆盘状,所述外围展示层呈扇环状,所述中心展示层与所述外围展示层同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层半径以及外围展示层半径;
所述第三展示子模块,包括:
第九确定单元,用于根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
第十确定单元,用于根据所述中心展示层半径、所述外围展示层半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
第十一确定单元,用于根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,根据所述中心展示层半径、所述外围展示层半径以及所述占位圆半径确定的坐标范围条件为:
所述目标词云短语的占位圆圆心与所述中心展示层圆心的距离大于所述中心展示层半径与所述占位圆半径的和值,小于所述外围展示层半径与所述占位圆半径的差值。
在一个可选示例中,当存在多个目标词云短语时,则有:
任意两个目标词云短语的占位圆圆心的距离大于所述任意两个目标词云短语的占位圆半径和值;或者,
任意两个目标词云短语的占位圆圆心的距离大于所述任意两个目标词云短语中的一者的占位圆半径的预设倍数。
在一个可选示例中,当存在多个目标词云短语时,所述第十一确定单元,包括:
第一确定子单元,用于根据所述坐标范围条件,确定所述目标词云短语的占位圆的随机旋转半径;
计算子单元,用于计算所述目标词云短语的占位圆的随机旋转角度;
旋转子单元,用于将所述目标词云短语的占位圆以所述随机旋转角度以及所述随机旋转半径围绕所述中心展示层圆心旋转;
第二确定子单元,用于根据对所述目标词云短语的占位圆的旋转,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,所述计算子单元,具体用于:
采用公式MINangle=arccos[(a*a+b*b-c*c)/(2.0*a*b)],计算最小旋转角度;其中,MINangle为所述最小旋转角度,a为所述中心展示层半径与所述占位圆半径的和值,b与a相等,c为所述占位圆半径的2倍;获取所述外围展示层所对应的已旋转角度;计算所述最小旋转角度与所述已旋转角度的和值,并确定大于所计算的和值的随机旋转角度;
所述装置还包括:
更新模块,用于在确定大于所计算的和值的随机旋转角度之后,将所述已旋转角度更新为所述随机旋转角度。
在一个可选示例中,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层,所述中心展示层呈半圆盘状,所述N个外围展示层中的每个外围展示层呈扇环状且与所述中心展示层同为一个圆心,所述中心展示层和每个外围展示层的区域信息包括中心展示层半径以及每个外围展示层各自的外围展示层半径;
所述第三展示子模块,包括:
第十二确定单元,用于根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
第十三确定单元,用于从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
第十四确定单元,用于根据所述目标词云短语待展示的外围展示层的外围展示层半径、所述目标词云短语待展示的外围展示层的指定相邻展示层的展示层半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
第十五确定单元,用于根据所述坐标范围条件,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
在一个可选示例中,所述外围展示层的外切圆与所述中心展示层的外切圆同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层外切圆半径以及外围展示层外切圆半径;
所述第三展示子模块,包括:
第十六确定单元,用于根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
第十七确定单元,用于根据所述中心展示层外切圆半径、所述外围展示层外切圆半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
第十八确定单元,用于根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置。
在一个可选示例中,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述第三展示子模块,包括:
第十九确定单元,用于确定所述目标词云短语的重要度等级;
第二十确定单元,用于根据所述重要度等级,从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
第二十一确定单元,用于根据所述目标词云短语待展示的外围展示层的区域信息,确定所述目标词云短语在待展示的外围展示层的展示位置。
根据本公开实施例的再一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述词云数据生成方法。
根据本公开实施例的又一个方面,提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述词云数据生成方法。
本公开的实施例中,在获取资讯信息之后,可以根据资讯信息,获取指定对象标识对应的词云短语候选集,并根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语,目标词云短语能够精短简要地对资讯信息中用户感兴趣的内容进行概括,之后,可以对应展示指定对象标识和目标词云短语,以将用户感兴趣的内容简洁明了直观地呈现给用户。可见,本公开的实施例中,即便接收到大量的资讯信息,通过词云短语候选集的获取操作,目标词云短语的确定操作,以及内容展示操作,最终呈现给用户的是经过概括的、用户感兴趣的内容,用户无需阅读全部的资讯信息,因此,与相关技术相比,本公开的实施例能够有效地降低用户查阅感兴趣的内容的时间成本,从而能够提高用户体验。
附图说明
图1是本公开一示例性实施例提供的词云数据生成方法的流程示意图。
图2是本公开的实施例中画布的示意图之一。
图3是本公开另一示例性实施例提供的词云数据生成方法的流程示意图。
图4是本公开再一示例性实施例提供的词云数据生成方法的流程示意图。
图5是本公开的实施例中画布的示意图之二。
图6是本公开的实施例中画布的示意图之三。
图7是本公开的实施例中画布的示意图之四。
图8是本公开一示例性实施例提供的词云数据生成装置的结构示意图。
图9是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,不代表特定技术含义,也不表示必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。本公开实施例中的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
为了便于描述,附图中各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
示例性方法
图1是本公开一示例性实施例提供的词云数据生成方法的流程示意图。图1所示方法包括步骤101、步骤102、步骤103和步骤104,下面对各步骤分别进行说明。
步骤101,获取资讯信息。
这里,电子设备可以接收新闻网站推送的信息,并将所接收的信息作为获取的资讯信息。可选地,资讯信息中可以包括多篇文章。
步骤102,根据资讯信息,获取指定对象标识对应的词云短语候选集。
这里,指定对象标识可以由用户预先通过触控方式、键盘方式等进行输入,指定对象标识可以是用户感兴趣的对象的标识,例如用户感兴趣的人物的名字、用户感兴趣的公司的名称、用户感兴趣的商品的名称等。具体地,指定对象标识既可以为“张三”、“李四”,也可以为图2中的“上海熊猫互娱文化有限公司”。
在步骤102中,可以从资讯信息中,筛选出与指定对象标识相关的信息,并基于所筛选的信息,获取指定对象标识对应的词云短语候选集,词云短语候选集中可以包括多个词云短语,词云短语候选集中的每个词云短语可以均是针对指定对象标识的资讯信息进行分析筛选处理后得到的,与指定对象标识相关的词云短语,例如,词云短语候选集中的每个词云短语可以与指定对象标识的舆情情况相关。可选地,词云短语候选集中的每个词云短语均可以用于描述指定对象标识的短语,例如,在指定对象标识为“上海熊猫互娱文化有限公司”的情况下,“资本股权遭法院冻结”、“20亿元巨额投资损失”、“关闭服务器”等均可以位于指定对象标识对应的词云短语候选集中,这种情况下,词云短语也可以称为描述性短语,词云短语候选集也可以称为描述性短语候选集。
可选地,指定对象标识对应的词云短语候选集中的每个词云短语所包含的词语数量可以均在2至5之间,以在保证各词云短语的语义完整的同时,尽量避免冗余。
步骤103,根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语。
这里,根据预设筛选策略,可以仅从词云短语候选集中筛选出部分词云短语,并将筛选出的每个词云短语均作为目标词云短语,这样,目标词云短语的数量可能为1、2、5、10、15等,在此不再一一列举。
步骤104,展示指定对象标识以及对应的目标词云短语。
这里,指定对象标识和目标词云短语可以对应展示,例如,目标词云短语可以展示于指定对象标识的正上方,正下方等,或者,指定对象标识和目标词云短语可以按照图2中所示的情况进行对应展示。
需要说明的是,本公开的实施例中涉及的指定对象标识和目标词云短语可以认为是通过本公开的实施例提供的词云数据生成方法生成的词云数据。
本公开的实施例中,在获取资讯信息之后,可以根据资讯信息,获取指定对象标识对应的词云短语候选集,并根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语,目标词云短语能够精短简要地对资讯信息中用户感兴趣的内容进行概括,之后,可以对应展示指定对象标识和目标词云短语,以将用户感兴趣的内容简洁明了直观地呈现给用户。可见,本公开的实施例中,即便接收到大量的资讯信息,通过词云短语候选集的获取操作,目标词云短语的确定操作,以及内容展示操作,最终呈现给用户的是经过概括的、用户感兴趣的内容,用户无需阅读全部的资讯信息,因此,与相关技术相比,本公开的实施例能够有效地降低用户查阅感兴趣的内容的时间成本,从而能够提高用户体验。
图3是本公开另一示例性实施例提供的词云数据生成方法的流程示意图。图3所示方法包括步骤301、步骤302、步骤303、步骤304、步骤305和步骤306,下面对各步骤分别进行说明。
步骤301,获取资讯信息。
需要说明的是,步骤301的具体实施过程参照对步骤101的说明即可,在此不再赘述。
步骤302,从资讯信息中,获取与指定对象标识关联的语料。
这里,可以提取资讯信息中的多篇文章中的每篇文章的标题,并提取多篇文章中的每篇文章中出现了指定对象标识的文本单元(文本单元可以为句子或段落,本公开的实施例仅以文本单元为段落的情况为例进行说明),提取到的所有标题和所有段落可以组成与指定对象标识关联的语料。需要说明的是,与指定对象标识关联的语料可以认为是从资讯信息中筛选出的与指定对象标识相关的信息。
步骤303,对语料进行分词处理,以得到分词处理结果。
这里,在获取到语料之后,可以先对语料进行停用词去除处理,然后采用分词工具,对经停用词去除处理后的语料进行分词处理,以得到分词处理结果;其中,分词工具可以是结巴(即jieba)。需要指出的是,在进行分词处理时,名称(例如全称、简称、产品名、品牌名等)、名字、成对符号内的内容(例如一对引号内的内容,一对书名号内的内容)等应该认为是一个词语,不再进行切割。
步骤304,对分词处理结果进行挖掘处理,以得到词云短语候选集。
这里,在得到分词处理结果之后,可以采用挖掘工具,对分词处理结果进行挖掘处理,以得到指定对象标识对应的词云短语候选集,指定对象标识对应的词云短语候选集中的每个词云短语可以由分词处理结果中相邻的2至5个短语组成;其中,挖掘工具可以是TopMine、Segphrase、AutoPhrase等开源工具。
步骤305,根据语料的统计数据,确定词云短语候选集中待展示的目标词云短语。
这里,语料的统计数据可以记载有语料中的词语出现情况信息、语料中的词云短语出现情况信息等,例如记载有多个词云短语在语料中的真实出现次数、出现位置等。
可选地,在步骤305中,可以基于语料的统计数据,对词云短语候选集进行精简处理,并将经精简处理后的词云短语候选集中的词云短语作为待展示的目标词云短语。
步骤306,展示指定对象标识以及对应的目标词云短语。
需要说明的是,步骤306的具体实施过程参照对步骤104的说明即可,在此不再赘述。
本公开的实施例中,在获取资讯信息之后,可以从资讯信息中获取与指定对象标识关联的语料,通过针对语料依次进行分词处理和挖掘处理,可以得到词云短语候选集。接下来,根据语料的统计数据,可以确定词云短语候选集中待展示的目标词云短语,目标词云短语能够精短简要地对资讯信息中用户感兴趣的内容进行概括,之后,可以对应展示指定对象标识和目标词云短语,以将用户感兴趣的内容简洁明了直观地呈现给用户。可见,本公开的实施例中,即便接收到大量的资讯信息,通过语料的获取和相关处理操作,再结合目标词云短语的确定操作,以及内容展示操作,最终呈现给用户的是经过概括的、用户感兴趣的内容,用户无需阅读全部的资讯信息,因此,与相关技术相比,本公开的实施例能够有效地降低用户查阅感兴趣的内容的时间成本,从而能够提高用户体验。
在一个可选示例中,步骤305,包括:
根据语料的统计数据,确定词云短语候选集中的每个词云短语在语料中的真实出现次数;
根据语料的统计数据,确定词云短语候选集中的每个词云短语在语料中的期望出现次数;
根据词云短语候选集中的每个词云短语在语料中的真实出现次数和期望出现次数,确定词云短语候选集中的每个词云短语的重要性分数;
从词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。
由于语料的统计数据可以记载有语料中的词云短语出现情况信息,根据语料的统计数据,可以便捷地确定出词云短语候选集中的每个词云短语在语料中的真实出现次数。另外,还可以根据语料的统计数据,确定词云短语候选集中的每个词云短语在语料中的期望出现次数。
在一种具体实施方式中,根据语料的统计数据,确定词云短语候选集中的每个词云短语在语料中的期望出现次数,包括:
确定组成第一词云短语的每个词语在词云短语候选集中的真实出现次数,以及根据语料的统计数据,确定语料中的词语总数量和组成第一词云短语的每个词语在语料中的真实出现次数;其中,第一词云短语为词云短语候选集中的任一词云短语;
分别计算组成第一词云短语的每个词语在词云短语候选集中的真实出现次数与在语料中的真实出现次数的比值,以得到组成第一词云短语的每个词语对应的比值;
计算组成第一词云短语的各个词语对应的比值的乘积,并将所计算的乘积与语料中的词语总数量的乘积作为第一词云短语在语料中的期望出现次数。
假设第一词云短语由3个词语组成,这3个词语分别表示为W1、W2、W3,则可以通过对词云短语候选集涉及的所有词语进行统计,分别确定W1、W2、W3在词云短语候选集中的真实出现次数,W1在词云短语候选集中的真实出现次数可以表示为ZC11,W2在词云短语候选集中的真实出现次数可以表示为ZC12,W3在词云短语候选集中的真实出现次数可以表示为ZC13。另外,由于语料的统计数据可以记载有语料中的词语出现情况信息,根据语料的统计数据,可以便捷地确定出语料中的词语总数量,以及分别确定出W1、W2、W3在语料中的真实出现次数,W1在语料中的真实出现次数可以表示为ZC21,W2在语料中的真实出现次数可以表示为ZC22,W3在语料中的真实出现次数可以表示为ZC23。
接下来,可以分别计算W1、W2、W3在词云短语候选集中的真实出现次数与在语料中的真实出现次数的比值,很明显,W1对应的比值为ZC11/ZC21,W2对应的比值为ZC12/ZC22,W3对应的比值为ZC13/ZC23。
之后,可以计算W1、W2、W3这3者对应的3个比值的乘积,并根据所计算的乘积和语料中的词语总数量,确定第一词云短语在语料中的期望出现次数。可选地,可以将所计算的乘积和语料中的词语总数量的乘积作为第一词云短语在语料中的期望出现次数;或者,可以在语料中的词语总数量的基础上,减去通过停用词去除处理所去除的停用词的数量,得到剩下的数量,并将所计算的乘积和剩下的数量的乘积作为第一词云短语在语料中的期望出现次数。
这种实施方式中,结合语料的统计数据,能够便捷可靠地确定出词云短语候选集中的每个词云短语在语料中的期望出现次数。
在得到词云短语候选集中的每个词云短语在语料中的期望出现次数之后,可以根据词云短语候选集中的每个词云短语在语料中的真实出现次数和期望出现次数,确定词云短语候选集中的每个词云短语的重要性分数。
之后,可以获取预设分数,并将词云短语候选集中的每个词云短语的重要性分数与预设分数进行比较,以筛选出词云短语候选集中重要性分数大于或等于预设分数的词云短语。
可选地,预设分数的数值越大,语料中包括的语料单元的数量越小。这里,语料中的每个标题、每个段落均可以作为一个语料单元,在语料中包括的语料单元的数量大于10的情况下,预设分数可以为0.1,在语料中包括的语料单元的数量不大于10的情况下,预设分数可以为0.5。
在筛选出重要性分数大于或等于预设分数的词云短语之后,可以从重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。可选地,可以直接将重要性分数大于或等于预设分数的每个词云短语均作为目标词云短语;或者,可以对重要性分数大于或等于预设分数的所有词云短语进行过滤处理,并将经过滤处理后剩下的每个词云短语均作为目标词云短语。
本公开的实施例中,基于语料的统计数据,可以准确可靠地确定出词云短语候选集中的每个词云短语在语料中的真实出现次数和期望出现次数,以便据此确定重要性分数满足需求的词云短语,并仅从确定出的这些词云短语中确定待展示的目标词云短语,这样能够尽量减少展示给用户的目标词云短语的数量,从而减少用户需要查阅的词云短语的数量,以进一步降低用户查阅感兴趣的内容的时间成本,且保证展示给用户的是用户真正感兴趣的内容。
可选地,在执行根据词云短语候选集中的每个词云短语在语料中的真实出现次数和期望出现次数,确定词云短语候选集中的每个词云短语的重要性分数的操作之前,可以先从词云短语候选集中删除在语料中的真实出现次数小于预设次数的词云短语,之后再针对删除了在语料中的真实出现次数小于预设次数的词云短语的词云短语候选集,执行该操作。
在一个可选示例中,根据词云短语候选集中的每个词云短语在语料中的真实出现次数和期望出现次数,确定词云短语候选集中的每个词云短语的重要性分数,包括:
计算第二词云短语在语料中的真实出现次数和期望出现次数的差值;其中,第二词云短语为词云短语候选集中的任一词云短语;
计算第二词云短语在语料中的真实出现次数的开方结果;
计算差值与开方结果的比值,并将所计算的比值作为第二词云短语的重要性分数。
这里,开方结果可以为开平方根结果。
假设第二词云短语在语料中的真实出现次数表示为ZC31,第二词云短语在语料中的期望出现次数表示为QC31,则第二词云短语在语料中的真实出现次数和期望出现次数的差值可以表示为ZC31-QC31,第二词云短语在语料中的真实出现次数的开方结果可以表示为差值与开方结果的比值可以表示为/>该比值即可作为第二词云短语的重要性分数。
本公开的实施例中,根据词云短语在语料中的真实出现次数和期望出现次数,再结合减法运算、开方运算、除法运算等简单的运算操作,能够便捷可靠地计算出词云短语的重要性分数。
当然,计算重要性分数的方式并不局限于此,例如,在得到差值与开方结果的比值之后,可以将该比值映射至一个设定的区间,例如映射至0-1这个区间,或者0-5这个区间,并将映射值作为求得的重要性分数,这也是可行的。
在一个可选示例中,从词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语,包括:
在重要性分数大于或等于预设分数的词云短语中删除满足预设条件的词云短语,并将剩余的词云短语作为待展示的目标词云短语;
其中,任一词云短语满足预设条件是指满足以下至少一项:
词云短语以日期结尾;
词云短语的数字占比大于预设比例;
词云短语包含重复词语;
重要性分数大于或等于预设分数的词云短语中存在与当前词云短语具有指定重复性关系且长于当前词云短语的词云短语。
这里,预设比例可以用百分数进行表征,具体地,预设比例可以为60%、70%、80%或者其他取值,在此不再一一列举。
这里,任意两个词云短语具有指定重复性关系可以是指以下情况中的一种:(1)其中一个词云短语的尾部与另一个词云短语的头部重复的内容较多,例如其中一个词云短语为“传出拖欠薪资资金链”,另一个词云短语为“资金链断裂”;(2)其中一个词云短语完整地位于另一个词云短语中,例如其中一个词云短语为“传出拖欠薪资资金链”,另一个词云短语为“传出拖欠薪资”;(3)两个词云短语中相同的词语数量大于设定数量,例如其中一种词云短语为“20亿元巨额投资损失”,另一个词云短语为“数亿元的投资损失”。需要指出的是,无论任意两个词云短语具有指定重复性关系是指以上何种情况,在任意两个词云短语具有指定重复性关系的情况下,这两个词云短语之间的重复度一般超过设定重复度。
本公开的实施例中,在筛选出重要性分数大于或等于预设分数的词云短语之后,可以对重要性分数大于或等于预设分数的所有词云短语进行遍历。如果通过遍历,在这些词云短语中查找到了以日期结尾的词云短语,数字占比大于预设比例的词云短语,包含重复词语的词云短语,由于这些词云短语一般并不包括有用的信息,可以认为这些词云短语是无效短语,故可以判定查找到的词云短语满足预设条件并删除查找到的词云短语。如果通过遍历,确定出任意两个词云短语具有指定重复性关系(例如某一词云短语的尾部与另一词云短语的头部重合内容较多),则可以从这两个词云短语中,筛选出更长的那个词云短语,剩下的那个词云短语可以认为是非必要的词云短语,故可以判定剩下的那个词云短语满足预设条件并删除剩下的那个词云短语。
可见,本公开的实施例中,在筛选出重要性分数大于或等于预设分数的词云短语之后,可以从中删除无效或者非必要的词云短语,这样能够尽量减少用户需要查阅的词云短语数量,从而能够进一步降低用户查阅感兴趣的内容的时间成本。
图4是本公开再一示例性实施例提供的词云数据生成方法的流程示意图。图4所示方法包括步骤401、步骤402、步骤403、步骤404、步骤405和步骤406,下面对各步骤分别进行说明。
步骤401,获取资讯信息。
步骤402,根据资讯信息,获取指定对象标识对应的词云短语候选集。
步骤403,根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语。
需要说明的是,步骤401至步骤403的具体实施过程参照对步骤101至步骤103的说明即可,在此不再赘述。
步骤404,展示画布;其中,画布上具有中心展示层以及围绕中心展示层的外围展示层。
这里,可以在电子设备的屏幕上展示画布,画布上具有中心展示层和围绕中心展示层的外围展示层;其中,中心展示层与外围展示层可以紧邻设置;或者,中心展示层与外围展示层之间可以有一定间隔。
可选地,画布的大小可以根据屏幕的大小进行调整。具体地,在屏幕较大时,画布可以进行放大,画布上具有的各个展示层可以按比例进行放大;在屏幕较小时,画布可以具有最小尺寸。
步骤405,在中心展示层上展示指定对象标识。
这里,指定对象标识可以在中心展示层上居中展示。
步骤406,根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,并在外围展示层的展示位置展示目标词云短语。
这里,外围展示层的区域信息包括但不限于外围展示层的尺寸信息、外围展示层与中心展示层的相对位置信息、外围展示层的形状信息等。
在步骤406中,根据外围展示层的区域信息,可以合理确定目标词云短语在外围展示层的展示位置,由于具体确定方式多样,为了布局清楚,后续进行举例介绍。之后,可以在外围展示层的展示位置展示目标词云短语。可选地,在进行目标词云短语的展示时,可以对应展示一圆形标识,以图2为例,在目标词云短语为“失信被执行人名单”的情况下,可以在“失信被执行人名单”上方展示圆形标识200,当然,圆形标识200也可以展示于“失信被执行人名单”下方、左方、右方等,在此不再一一列举。
本公开的实施例中,在获取资讯信息之后,可以根据资讯信息,获取指定对象标识对应的词云短语候选集,并根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语,目标词云短语能够精短简要地对资讯信息中用户感兴趣的内容进行概括,之后,可以在画布的中心展示层上展示指定对象标识,并在围绕中心展示层的外围展示层上展示目标词云短语,这样能够将用户感兴趣的内容简洁明了直观地呈现给用户。可见,本公开的实施例中,即便接收到大量的资讯信息,通过词云短语候选集的获取操作,目标词云短语的确定操作,以及画布上的内容展示操作,最终呈现给用户的是经过概括的、用户感兴趣的内容,用户无需阅读全部的资讯信息,因此,与相关技术相比,本公开的实施例能够有效地降低用户查阅感兴趣的内容的时间成本,从而能够提高用户体验。
在一个可选示例中,根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,包括:
确定目标词云短语的尺寸信息;
根据外围展示层的区域信息以及目标词云短语的尺寸信息,确定目标词云短语在外围展示层的展示位置。
这里,目标词云短语的尺寸信息可以基于目标词云短语包括的文字数量、目标词云短语的排布形式以及单个文字的尺寸确定。具体地,在目标词云短语为图2中的“熊猫直播倒闭”的情况下,由于“熊猫直播倒闭”仅排布为一行,且这一行包括6个文字,目标词云短语的尺寸信息可以表示为:长度为6r字号,高度为r字号;在目标词云短语为图2中的“失信被执行人名单”的情况下,由于“失信被执行人名单”排布为两行,且第一行包括6个文字,第二行包括2个文字,目标词云短语的尺寸信息可以表示为:长度为6r字号,高度为2r字号。
在得到目标词云短语的尺寸信息之后,可以基于外围展示层的区域信息以及目标词云短语的尺寸信息,在外围展示层上进行位置搜索,以搜索出能够保证不出现目标词云短语部分落入中心展示层或者部分位于画布之外的情况的位置,该位置即可作为目标词云短语在外围展示层的展示位置。可选地,在目标词云短语为图2中的“熊猫直播倒闭”的情况下,目标词云短语占据的区域可以看做是长度为6r字号,高度为r字号的矩形区域,在外围展示层上进行位置搜索时,只需保证该矩形区域的四个端点都位于外围展示层上,即可认为搜索出了所需的位置。
可见,本公开的实施例中,结合外围展示层的区域信息以及目标词云短语的尺寸信息,能够便捷可靠地为目标词云短语确定出合适的展示位置。
在一个可选示例中,围绕中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,包括:
确定目标词云短语的尺寸信息;
从N个外围展示层中确定目标词云短语待展示的外围展示层;
根据目标词云短语待展示的外围展示层的区域信息、目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及目标词云短语的尺寸信息,确定目标词云短语在待展示的外围展示层的展示位置。
这里,N的取值可以为2、3、4、5或者大于5的任意整数,在此不再一一列举。以图2为例,layer0可以作为中心展示层,layer1、layer2和layer3可以分别作为一个外围展示层,也即,N的取值为3。
本公开的实施例中,可以先确定目标词云短语的尺寸信息,确定方式参照上文中的说明即可,在此不再赘述。接下来,可以从N个外围展示层中确定目标词云短语待展示的外围展示层,具体地,可以按照设定规则,从N个外围展示层中确定目标词云短语待展示的外围展示层,或者,可以直接从N个外围展示层中随机选择一个外围展示层作为目标词云短语待展示的外围展示层。之后,可以根据目标词云短语待展示的外围展示层的区域信息、目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及目标词云短语的尺寸信息,确定目标词云短语在待展示的外围展示层的展示位置。
需要说明的是,任一外围展示层的指定相邻展示层为:位于该外围展示层内,且与该外围展示层相邻的展示层。以图2为例,layer1的指定相邻展示层为layer0,layer2的指定相邻展示层为layer1,layer3的指定相邻展示层为layer2。这样,在目标词云短语待展示的外围展示层为layer2的情况下,可以基于layer2的区域信息、layer1的区域信息以及目标词云短语的尺寸信息,在layer2上进行位置搜索,以搜索出能够保证不出现目标词云短语部分落入除了layer2之外的其他展示层或者部分位于画布之外的情况的位置,该位置即可作为目标词云短语在layer2的展示位置。可选地,在目标词云短语为图2中的“失信被执行人名单”的情况下,目标词云短语占据的区域可以看做是长度为6r字号,高度为2r字号的矩形区域,在layer2上进行位置搜索时,只需保证该矩形区域的四个端点都位于layer2上,即可认为搜索出了所需的位置。
可见,本公开的实施例中,通过为目标词云短语确定待展示的外围展示层,并结合待展示的外围展示层的区域信息、待展示的外围展示层的指定相邻展示层的区域信息以及目标词云短语的尺寸信息,能够便捷可靠地为目标词云短语确定出合适的外围展示层上的合适的展示位置。
在一个可选示例中,中心展示层呈半圆盘状,外围展示层呈扇环状,中心展示层与外围展示层同为一个圆心,中心展示层和外围展示层的区域信息包括中心展示层半径以及外围展示层半径;
根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径;
根据中心展示层半径、外围展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件;
根据坐标范围条件,确定目标词云短语在外围展示层的展示位置。
这里,以图5为例,画布上可以具有layer4和layer5;其中,layer4作为中心展示层,layer4呈半圆盘状,layer4的区域信息可以包括中心展示层半径;layer5作为唯一的外围展示层,layer5呈扇环状且与layer4同圆心,layer5具体可以为呈圆心角为180度的完整扇环去除部分区域后的剩余扇环,layer5的区域信息可以包括外围展示层半径。需要指出的是,这里的外围展示层半径具体是layer5的扇环外环半径,中心展示层半径可以作为layer5的扇环内环半径。
这里,预设词云短语尺寸信息可以包括预先设定的词云短语平均文字数量和预先设定的词云短语最大排列行数。假设该平均文字数量为6,该最大排列行数为2,单个文字的长度固定为r字号,单个圆形标识(其用于对应于目标词云短语展示)的半径为r小圆,目标词云短语的占位圆半径为r占位圆半径,则根据预设词云短语尺寸信息,确定占位圆半径采用的公式可以为:
接下来,可以根据中心展示层半径、外围展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件。在一种具体实施方式中,根据中心展示层半径、外围展示层半径以及占位圆半径确定的坐标范围条件为:
目标词云短语的占位圆圆心与中心展示层圆心的距离大于中心展示层半径与占位圆半径的和值,小于外围展示层半径与占位圆半径的差值。
假设目标词云短语的占位圆圆心与中心展示层圆心的距离等于中心展示层半径与占位圆半径的和值,则对应的是图5中占位圆501正好与作为中心展示层的layer4外切的极端情况;假设目标词云短语的占位圆圆心与中心展示层圆心的距离等于外围展示层半径与占位圆半径的差值,则对应的是图5中占位圆502正好与作为外围展示层的layer5内切的极端情况。需要指出的是,以上两种极端情况各自对应的占位圆均位于layer5上,这样,根据中心展示层半径、外围展示层半径以及占位圆半径确定的坐标范围条件相当于限定了占位圆圆心的位置,并通过占位圆圆心的限定,保证占位圆能够完整位于layer5上。
之后,可以根据坐标范围条件,确定目标词云短语在外围展示层的展示位置。由于坐标范围条件能够保证目标词云短语的占位圆完整位于layer5上,只需保证目标词云短语位于占位圆内,即可保证目标词云短语位于layer5上。
可见,本公开的实施例中,结合目标词云短语的占位圆半径,中心展示层半径,以及外围展示层半径,能够合理确定目标词云短语的坐标范围条件,从而能够可靠地保证目标词云短语最终展示在外围展示层上。
在一个可选示例中,当存在多个目标词云短语时,则有:
任意两个目标词云短语的占位圆圆心的距离大于任意两个目标词云短语的占位圆半径和值;或者,
任意两个目标词云短语的占位圆圆心的距离大于任意两个目标词云短语中的一者的占位圆半径的预设倍数。
这里,预设倍数可以为2倍、3倍或者3倍以上,在此不再一一列举。
需要说明的是,当存在多个目标词云短语时,每个目标词云短语都可以具有对应的占位圆,各目标词云短语对应的占位圆半径可以相同。由于任意两个目标词云短语的占位圆圆心的距离大于这两个目标词云短语的占位圆半径和值,或者任意两个目标词云短语的占位圆圆心的距离大于任意两个目标词云短语中的一者的占位圆半径的预设倍数,这说明这两个目标词云短语的占位圆圆心的距离足够远,足以保证这两个目标词云短语不发生重叠,因此,本公开的实施例能够在存在多个目标词云短语时,保证多个目标词云短语之间不发生碰撞,从而能够保证展示效果。
在一个可选示例中,当存在多个目标词云短语时,根据坐标范围条件,确定目标词云短语在外围展示层的展示位置,包括:
根据坐标范围条件,确定目标词云短语的占位圆的随机旋转半径;
计算目标词云短语的占位圆的随机旋转角度;
将目标词云短语的占位圆以随机旋转角度以及随机旋转半径围绕中心展示层圆心旋转;
根据对目标词云短语的占位圆的旋转,确定目标词云短语在外围展示层的展示位置。
这里,可以先根据坐标范围条件,确定目标词云短语的占位圆的随机旋转半径,确定出的随机旋转半径可以位于中心展示层半径与占位圆半径的和值,以及外围展示层半径与占位圆半径的差值之间。假设图5中作为中心展示层的layer4的半径为r0,作为外围展示层的layer5的半径为r1,占位圆半径为r占位圆半径,中心展示层半径r0与占位圆半径r占位圆半径的和值用r「最小半径」表示,外围展示层半径r1与占位圆半径r占位圆半径的差值用r「最大半径」表示,那么,可以在r「最小半径」与r「最大半径」之间随机选择一个半径作为随机旋转半径。
这里,还可以计算目标词云短语的占位圆的随机旋转角度。在一种具体实施方式中,计算目标词云短语的占位圆的随机旋转角度,可以包括:
采用公式MINangle=arccos[(a*a+b*b-c*c)/(2.0*a*b)],计算最小旋转角度;其中,MINangle为最小旋转角度,a为中心展示层半径与占位圆半径的和值,b与a相等,c为占位圆半径的2倍;
获取外围展示层所对应的已旋转角度;
计算最小旋转角度与已旋转角度的和值,并确定大于所计算的和值的随机旋转角度;
确定大于所计算的和值的随机旋转角度之后,该方法还包括:
将已旋转角度更新为随机旋转角度。
这里,最小旋转角度MINangle的计算公式对应的是图5中占位圆503和占位圆504分别与layer4外切,且占位圆503与占位圆504外切的情况下,计算占位圆503圆心和layer4圆心的连线与占位圆504圆心和layer4圆心的连线的夹角α的场景,计算出的α即可作为MINangle。实际计算时,使用的参数为:a=b=r0+r占位圆半径,c=2r占位圆半径。
这里,已旋转角度的初始值可以根据实际情况进行设定,该初始值不能设定得太小。
在计算出最小旋转角度之后,可以计算最小旋转角度与当前的已旋转角度的和值,并在计算出的和值的基础上随机增加0至15度,以便捷地得到随机旋转角度。在确定随机旋转角度之后,还可以将当前的已旋转角度更新为随机旋转角度,这样,下一次确定的随机旋转角度与本次确定的随机旋转角度之间能够间隔一定角度。
在确定出随机旋转半径和随机旋转角度之后,可以将目标词云短语的占位圆以随机旋转角度以及随机旋转半径围绕layer4圆心旋转,并根据对目标词云短语的占位圆的旋转,确定词云短语在layer5的展示位置。需要指出的是,假设随机旋转半径表示为r「随机旋转半径」,随机旋转角度表示为angle「随机旋转角度」,在目标词云短语的占位圆经旋转后,目标词云短语的占位圆圆心的坐标为(x,y),x和y满足:
x=r「随机旋转半径」*cos(angle「随机旋转角度」*PI/180)
y=r「随机旋转半径」*sin(angle「随机旋转角度」*PI/180)
之后,将目标词云短语展示于经旋转后的占位圆内部即可。可选地,可以在经旋转后的占位圆的中心展示圆形标识,并在经旋转后的占位圆中圆形标识的设定位置(例如正下方)展示目标词云短语。
本公开的实施例中,针对存在多个目标词云短语的情况,在确定目标词云短语在外围展示层的展示位置时,通过引入随机旋转角度和随机旋转半径,能够尽可能使目标词云短语分布均匀,避免目标词云短语扎堆展示的情况,从而能够进一步保证展示效果。
可选地,在对目标词云短语的占位圆进行旋转之后,可以判断经旋转后的占位圆是否位于画布上,如果位于,则可以根据对目标词云短语的占位圆的旋转,确定目标词云短语在外围展示层的展示位置。具体实施时,可以获取经旋转后的占位圆的外接正方形的端点坐标,获取画布的端点坐标,并根据外接正方形的端点坐标和画布的端点坐标,判断经旋转后的占位圆是否位于画布上。
仍以图5为例,画布的端点坐标可以包括矩形510的左上端点坐标(x1,y1)以及矩形510的右下端点坐标(x2,y2);假设经旋转后的占位圆为“失信被执行人名单”对应的占位圆520,则占位圆520的外接正方形可以为正方形530,占位圆520的外接正方形的端点坐标可以包括正方形530的左上端点坐标(x3,y3)以及正方形530的右下端点坐标(x4,y4)。这里,正方形530横向的边可以与画布横向的边平行。之后,可以将x1与x3进行比较,y1与y3进行比较,x2与x4进行比较,y2和y4进行比较。如果x1<x3,y1>y3,x2>x4,y2<y4,则可以判定经旋转后的占位圆位于画布内;否则,可以判定经旋转后的占位圆不位于画布内。
在一个可选示例中,围绕中心展示层的外围展示层为由内向外邻接设置的N个外围展示层,中心展示层呈半圆盘状,N个外围展示层中的每个外围展示层呈扇环状且与中心展示层同为一个圆心,中心展示层和每个外围展示层的区域信息包括中心展示层半径以及每个外围展示层各自的外围展示层半径;
根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径;
从N个外围展示层中确定目标词云短语待展示的外围展示层;
根据目标词云短语待展示的外围展示层的外围展示层半径、目标词云短语待展示的外围展示层的指定相邻展示层的展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件;
根据坐标范围条件,确定目标词云短语在待展示的外围展示层的展示位置。
这里,以图2为例,画布上可以具有layer0、layer1、layer2和layer3;其中,layer0作为中心展示层,layer0呈圆盘状,layer0的区域信息可以包括中心展示层半径;layer1、layer2和layer3分别作为一个外围展示层,layer1、layer2和layer3均呈扇环状且与layer0同圆心,layer1、layer2和layer3均可以为呈圆心角为180度的完整扇环去除部分区域后的剩余扇环,layer1、layer2和layer3各自的区域信息可以分别包括外围展示层半径。需要指出的是,layer1、layer2和layer3中的任一者的外围展示层半径具体是其的扇环外环半径。
需要说明的是,根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径,以及从N个外围展示层中确定目标词云短语待展示的外围展示层的具体实施方式参照上文中的说明即可,在此不再赘述。在确定目标词云短语的占位圆半径和目标词云短语待展示的外围展示层之后,可以根据目标词云短语待展示的外围展示层的外围展示层半径、目标词云短语待展示的外围展示层的指定相邻展示层的展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件。具体地,在目标词云短语待展示的外围展示层为图2中的layer1的情况下,可以根据layer1的外围展示层半径、layer0的中心展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件,具体确定过程参照上文中针对图5的相关部分的说明即可,在此不再赘述。在目标词云短语待展示的外围展示层为图2中的layer2的情况下,可以根据layer2的外围展示层半径、layer1的外围展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件,虽然layer2和layer1均为外围展示层,但确定过程与根据layer1的外围展示层半径、layer0的中心展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件的原理是类似的,在此不再赘述。
本公开的实施例中,在画布上具有多个外围展示层的情况下,可以为目标词云短语确定合适的待展示的外围展示层,之后结合目标词云短语的占位圆半径,确定出的外围展示层的外围展示层半径,以及外围展示层的指定相邻展示层的展示层半径,能够合理确定目标词云短语的坐标范围条件,从而能够可靠地保证目标词云短语最终展示在合适的外围展示层的合适位置。
在一个可选示例中,外围展示层的外切圆与中心展示层的外切圆同为一个圆心,中心展示层和外围展示层的区域信息包括中心展示层外切圆半径以及外围展示层外切圆半径;
根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径;
根据中心展示层外切圆半径、外围展示层外切圆半径以及占位圆半径,确定目标词云短语的坐标范围条件;
根据坐标范围条件,确定目标词云短语在外围展示层的展示位置。
这里,与上述实施例不同的是,中心展示层并不局限于半圆盘状,外围展示层并不局限于扇环状,例如,在图5的基础上,作为外围展示层的layer5的形状可以不变,作为中心展示层的layer4可以变化为图6所示的矩形状或者其他形状;或者,在图5的基础上,作为中心展示层的layer4的形状不变,作为外围展示层的layer5可以变化为图7所示的梯形状或者其他形状。
需要说明的是,本公开的实施例中,虽然中心展示层和/或外围展示层的形状可以与上述实施例中不同,但是根据外围展示层的区域信息,确定指定对象标识的词云短语在外围展示层的展示位置的过程与上述实施例可以是类似的,只需将上述实施例中计算时使用的中心展示层半径以及外围展示层半径替换为中心展示层外切圆半径以及外围展示层外切圆半径即可,这样,本公开的实施例中,结合目标词云短语的占位圆半径,中心展示层外切圆半径以及外围展示层外切圆半径,能够合理确定目标词云短语的坐标范围条件,从而能够可靠地保证目标词云短语最终展示在外围展示层上。
在一个可选示例中,围绕中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,包括:
确定目标词云短语的重要度等级;
根据重要度等级,从N个外围展示层中确定目标词云短语待展示的外围展示层;
根据目标词云短语待展示的外围展示层的区域信息,确定目标词云短语在待展示的外围展示层的展示位置。
这里,在获取目标词云短语之后,可以确定目标词云短语的重要度等级。可选地,可以基于目标词云短语的重要性分数,确定目标词云短语的重要度等级,例如,可以预先设置重要性分数范围与重要度等级之间的对应关系,在得到目标词云短语的重要性分数之后,可以确定目标词云短语的重要性分数属于哪个重要性分数范围,该重要性分数范围对应的重要度等级即可作为目标词云短语的重要度等级。需要指出的是,目标词云短语的重要度等级越高,目标词云短语的重要性分数越高。
当然,确定目标词云短语的重要度等级的方式并不局限于此,例如,可以由用户来指定目标词云短语的重要度等级。
在确定出目标词云短语的重要度等级之后,可以根据重要度等级,从N个外围展示层中确定目标词云短语待展示的外围展示层,可选地,目标词云短语的重要度等级越高,为其确定的待展示的外围展示层可以越靠近中心展示层。以图2为例,假设“20亿债务”的重要度等级高于“失信被执行人名单”,则用于展示“失信被执行人名单”的外围展示层可以为layer2,用于展示“20亿债务”的外围展示层可以为layer1。
本公开的实施例中,通过结合目标词云短语的重要度等级来选择目标词云短语待展示的外围展示层,能够保证目标词云短语展示在合适的外围展示层。
综上,本公开的实施例中,画布上的中心展示层可以用于指定对象标识的展示,画布上的外围展示层可以用于指定对象标识对应的目标词云短语的展示,通过随机旋转半径和随机旋转角度的计算,能够通过简单的计算,使展示的各目标词云短语间隔一定距离,不发生碰撞,从而能够较好地保证展示效果。
本公开的实施例提供的任一种词云数据生成方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种词云数据生成方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种词云数据生成方法。下文不再赘述。
示例性装置
图8是本公开一示例性实施例提供的词云数据生成装置的结构示意图,图8所示装置包括第一获取模块801、第二获取模块802、确定模块803、展示模块804。
第一获取模块801,用于获取资讯信息;
第二获取模块802,用于根据资讯信息,获取指定对象标识对应的词云短语候选集;
确定模块803,用于根据预设筛选策略,确定词云短语候选集中待展示的目标词云短语;
展示模块804,用于展示指定对象标识以及对应的目标词云短语。
在一个可选示例中,
第二获取模块802,包括:
第一获取子模块,用于从资讯信息中,获取与指定对象标识关联的语料;
第二获取子模块,用于对语料进行分词处理,以得到分词处理结果;
第三获取子模块,用于对分词处理结果进行挖掘处理,以得到词云短语候选集;
确定模块803,具体用于:
根据语料的统计数据,确定词云短语候选集中待展示的目标词云短语。
在一个可选示例中,确定模块803,包括:
第一确定子模块,用于根据语料的统计数据,确定词云短语候选集中的每个词云短语在语料中的真实出现次数;
第二确定子模块,用于根据语料的统计数据,确定词云短语候选集中的每个词云短语在语料中的期望出现次数;
第三确定子模块,用于根据词云短语候选集中的每个词云短语在语料中的真实出现次数和期望出现次数,确定词云短语候选集中的每个词云短语的重要性分数;
第四确定子模块,用于从词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。
在一个可选示例中,第二确定子模块,包括:
第一确定单元,用于确定组成第一词云短语的每个词语在词云短语候选集中的真实出现次数,以及根据语料的统计数据,确定语料中的词语总数量和组成第一词云短语的每个词语在语料中的真实出现次数;其中,第一词云短语为词云短语候选集中的任一词云短语;
第一获得单元,用于分别计算组成第一词云短语的每个词语在词云短语候选集中的真实出现次数与在语料中的真实出现次数的比值,以得到组成第一词云短语的每个词语对应的比值;
第一计算单元,用于计算组成第一词云短语的各个词语对应的比值的乘积;
第二确定单元,用于根据所计算的乘积和语料中的词语总数量,确定第一词云短语在语料中的期望出现次数。
在一个可选示例中,第三确定子模块,包括:
第二计算单元,用于计算第二词云短语在语料中的真实出现次数和期望出现次数的差值;其中,第二词云短语为词云短语候选集中的任一词云短语;
第三计算单元,用于计算第二词云短语在语料中的真实出现次数的开方结果;
第三确定单元,用于计算差值与开方结果的比值,并将所计算的比值作为第二词云短语的重要性分数。
在一个可选示例中,第四确定子模块,具体用于:
在重要性分数大于或等于预设分数的词云短语中删除满足预设条件的词云短语,并将剩余的词云短语作为待展示的目标词云短语;
其中,任一词云短语满足预设条件是指满足以下至少一项:
词云短语以日期结尾;
词云短语的数字占比大于预设比例;
词云短语包含重复词语;
重要性分数大于或等于预设分数的词云短语中存在与当前词云短语具有指定重复性关系且长于当前词云短语的词云短语。
在一个可选示例中,展示模块804,包括:
第一展示子模块,用于展示画布;其中,画布上具有中心展示层以及围绕中心展示层的外围展示层;
第二展示子模块,用于在中心展示层上展示指定对象标识;
第三展示子模块,用于根据外围展示层的区域信息,确定目标词云短语在外围展示层的展示位置,并在外围展示层的展示位置展示目标词云短语。
在一个可选示例中,第三展示子模块,包括:
第四确定单元,用于确定目标词云短语的尺寸信息;
第五确定单元,用于根据外围展示层的区域信息以及目标词云短语的尺寸信息,确定目标词云短语在外围展示层的展示位置。
在一个可选示例中,围绕中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;第三展示子模块,包括:
第六确定单元,用于确定目标词云短语的尺寸信息;
第七确定单元,用于从N个外围展示层中确定目标词云短语待展示的外围展示层;
第八确定单元,用于根据目标词云短语待展示的外围展示层的区域信息、目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及目标词云短语的尺寸信息,确定目标词云短语在待展示的外围展示层的展示位置。
在一个可选示例中,中心展示层呈半圆盘状,外围展示层呈扇环状,中心展示层与外围展示层同为一个圆心,中心展示层和外围展示层的区域信息包括中心展示层半径以及外围展示层半径;
第三展示子模块,包括:
第九确定单元,用于根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径;
第十确定单元,用于根据中心展示层半径、外围展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件;
第十一确定单元,用于根据坐标范围条件,确定目标词云短语在外围展示层的展示位置。
在一个可选示例中,根据中心展示层半径、外围展示层半径以及占位圆半径确定的坐标范围条件为:
目标词云短语的占位圆圆心与中心展示层圆心的距离大于中心展示层半径与占位圆半径的和值,小于外围展示层半径与占位圆半径的差值。
在一个可选示例中,当存在多个目标词云短语时,则有:
任意两个目标词云短语的占位圆圆心的距离大于任意两个目标词云短语的占位圆半径和值;或者,
任意两个目标词云短语的占位圆圆心的距离大于任意两个目标词云短语中的一者的占位圆半径的预设倍数。
在一个可选示例中,当存在多个目标词云短语时,第十一确定单元,包括:
第一确定子单元,用于根据坐标范围条件,确定目标词云短语的占位圆的随机旋转半径;
计算子单元,用于计算目标词云短语的占位圆的随机旋转角度;
旋转子单元,用于将目标词云短语的占位圆以随机旋转角度以及随机旋转半径围绕中心展示层圆心旋转;
第二确定子单元,用于根据对目标词云短语的占位圆的旋转,确定目标词云短语在外围展示层的展示位置。
在一个可选示例中,计算子单元,具体用于:
采用公式MINangle=arccos[(a*a+b*b-c*c)/(2.0*a*b)],计算最小旋转角度;其中,MINangle为最小旋转角度,a为中心展示层半径与占位圆半径的和值,b与a相等,c为占位圆半径的2倍;获取外围展示层所对应的已旋转角度;计算最小旋转角度与已旋转角度的和值,并确定大于所计算的和值的随机旋转角度;
该装置还包括:
更新模块,用于在确定大于所计算的和值的随机旋转角度之后,将已旋转角度更新为随机旋转角度。
在一个可选示例中,围绕中心展示层的外围展示层为由内向外邻接设置的N个外围展示层,中心展示层呈半圆盘状,N个外围展示层中的每个外围展示层呈扇环状且与中心展示层同为一个圆心,中心展示层和每个外围展示层的区域信息包括中心展示层半径以及每个外围展示层各自的外围展示层半径;
第三展示子模块,包括:
第十二确定单元,用于根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径;
第十三确定单元,用于从N个外围展示层中确定目标词云短语待展示的外围展示层;
第十四确定单元,用于根据目标词云短语待展示的外围展示层的外围展示层半径、目标词云短语待展示的外围展示层的指定相邻展示层的展示层半径以及占位圆半径,确定目标词云短语的坐标范围条件;
第十五确定单元,用于根据坐标范围条件,确定目标词云短语在待展示的外围展示层的展示位置。
在一个可选示例中,外围展示层的外切圆与中心展示层的外切圆同为一个圆心,中心展示层和外围展示层的区域信息包括中心展示层外切圆半径以及外围展示层外切圆半径;
第三展示子模块,包括:
第十六确定单元,用于根据预设词云短语尺寸信息,确定目标词云短语的占位圆半径;
第十七确定单元,用于根据中心展示层外切圆半径、外围展示层外切圆半径以及占位圆半径,确定目标词云短语的坐标范围条件;
第十八确定单元,用于根据坐标范围条件,确定目标词云短语在外围展示层的展示位置。
在一个可选示例中,围绕中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;第三展示子模块,包括:
第十九确定单元,用于确定目标词云短语的重要度等级;
第二十确定单元,用于根据重要度等级,从N个外围展示层中确定目标词云短语待展示的外围展示层;
第二十一确定单元,用于根据目标词云短语待展示的外围展示层的区域信息,确定目标词云短语在待展示的外围展示层的展示位置。
示例性电子设备
下面,参考图9来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图9图示了根据本公开实施例的电子设备900的框图。
如图9所示,电子设备900包括一个或多个处理器901和存储器902。
处理器901可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他处理单元,且可控制电子设备900中的其他组件以执行期望的功能。
存储器902可以包括一个或多个计算机程序产品,计算机程序产品可包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器901可以运行程序指令,以实现上文的本公开的各个实施例的词云数据生成方法。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备900还可以包括:输入装置903和输出装置904,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在电子设备900是第一设备或第二设备时,输入装置903可是麦克风或麦克风阵列。在电子设备900是单机设备时,输入装置903可是通信网络连接器,用于从第一设备和第二设备接收所采集的输入信号。
输入装置903还可以包括例如键盘、鼠标等。输出装置904可以向外部输出各种信息。输出装置904可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出装置等等。
为了简化,图9中仅示出了电子设备900中与本公开有关的组件中的一些,省略了其他组件。根据具体情况,电子设备900还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备外,本公开的实施例还可是计算机程序产品,其包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述“示例性方法”部分中的根据本公开各种实施例的词云数据生成方法中的步骤。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的词云数据生成方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (19)
1.一种词云数据生成方法,其特征在于,包括:
获取资讯信息;
根据所述资讯信息,获取指定对象标识对应的词云短语候选集;
根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;
展示所述指定对象标识以及对应的目标词云短语;
所述根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语,包括:
从所述资讯信息中,获取与所述指定对象标识关联的语料,并根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语;
所述展示所述指定对象标识以及对应的目标词云短语,包括:
展示画布;其中,所述画布上具有中心展示层以及围绕所述中心展示层的外围展示层;
在所述中心展示层上展示所述指定对象标识;
根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,并在所述外围展示层的展示位置展示所述目标词云短语。
2.根据权利要求1所述的方法,其特征在于,所述根据所述资讯信息,获取指定对象标识对应的词云短语候选集,包括:
从所述资讯信息中,获取与所述指定对象标识关联的语料;
对所述语料进行分词处理,以得到分词处理结果;
对所述分词处理结果进行挖掘处理,以得到词云短语候选集。
3.根据权利要求1所述的方法,其特征在于,所述根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语,包括:
根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数;
根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数;
根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数;
从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。
4.根据权利要求3所述的方法,其特征在于,所述根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数,包括:
确定组成第一词云短语的每个词语在所述词云短语候选集中的真实出现次数,以及根据所述语料的统计数据,确定所述语料中的词语总数量和组成所述第一词云短语的每个词语在所述语料中的真实出现次数;其中,所述第一词云短语为所述词云短语候选集中的任一词云短语;
分别计算组成所述第一词云短语的每个词语在所述词云短语候选集中的真实出现次数与在所述语料中的真实出现次数的比值,以得到组成所述第一词云短语的每个词语对应的比值;
计算组成所述第一词云短语的各个词语对应的比值的乘积;
根据所计算的乘积和所述语料中的词语总数量,确定所述第一词云短语在所述语料中的期望出现次数。
5.根据权利要求3所述的方法,其特征在于,所述根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数,包括:
计算第二词云短语在所述语料中的真实出现次数和期望出现次数的差值;其中,所述第二词云短语为所述词云短语候选集中的任一词云短语;
计算所述第二词云短语在所述语料中的真实出现次数的开方结果;
计算所述差值与所述开方结果的比值,并将所计算的比值作为所述第二词云短语的重要性分数。
6.根据权利要求3所述的方法,其特征在于,所述从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语,包括:
在重要性分数大于或等于预设分数的词云短语中删除满足预设条件的词云短语,并将剩余的词云短语作为待展示的目标词云短语;
其中,任一词云短语满足所述预设条件是指满足以下至少一项:
词云短语以日期结尾;
词云短语的数字占比大于预设比例;
词云短语包含重复词语;
重要性分数大于或等于预设分数的词云短语中存在与当前词云短语具有指定重复性关系且长于当前词云短语的词云短语。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的尺寸信息;
根据所述外围展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述外围展示层的展示位置。
8.根据权利要求1至6中任一项所述的方法,其特征在于,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的尺寸信息;
从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的区域信息、所述目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
9.根据权利要求1至6中任一项所述的方法,其特征在于,所述中心展示层呈半圆盘状,所述外围展示层呈扇环状,所述中心展示层与所述外围展示层同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层半径以及外围展示层半径;
所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
根据所述中心展示层半径、所述外围展示层半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置。
10.根据权利要求9所述的方法,其特征在于,根据所述中心展示层半径、所述外围展示层半径以及所述占位圆半径确定的坐标范围条件为:
所述目标词云短语的占位圆圆心与所述中心展示层圆心的距离大于所述中心展示层半径与所述占位圆半径的和值,小于所述外围展示层半径与所述占位圆半径的差值。
11.根据权利要求10所述的方法,其特征在于,当存在多个目标词云短语时,则有:
任意两个目标词云短语的占位圆圆心的距离大于所述任意两个目标词云短语的占位圆半径和值;或者,
任意两个目标词云短语的占位圆圆心的距离大于所述任意两个目标词云短语中的一者的占位圆半径的预设倍数。
12.根据权利要求10所述的方法,其特征在于,当存在多个目标词云短语时,所述根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据所述坐标范围条件,确定所述目标词云短语的占位圆的随机旋转半径;
计算所述目标词云短语的占位圆的随机旋转角度;
将所述目标词云短语的占位圆以所述随机旋转角度以及所述随机旋转半径围绕所述中心展示层圆心旋转;
根据对所述目标词云短语的占位圆的旋转,确定所述目标词云短语在所述外围展示层的展示位置。
13.根据权利要求12所述的方法,其特征在于,所述计算所述目标词云短语的占位圆的随机旋转角度,包括:
采用公式MINangle=arccos[(a*a+b*b-c*c)/(2.0*a*b)],计算最小旋转角度;其中,MINangle为所述最小旋转角度,a为所述中心展示层半径与所述占位圆半径的和值,b与a相等,c为所述占位圆半径的2倍;
获取所述外围展示层所对应的已旋转角度;
计算所述最小旋转角度与所述已旋转角度的和值,并确定大于所计算的和值的随机旋转角度;
所述确定大于所计算的和值的随机旋转角度之后,所述方法还包括:
将所述已旋转角度更新为所述随机旋转角度。
14.根据权利要求1至6中任一项所述的方法,其特征在于,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层,所述中心展示层呈半圆盘状,所述N个外围展示层中的每个外围展示层呈扇环状且与所述中心展示层同为一个圆心,所述中心展示层和每个外围展示层的区域信息包括中心展示层半径以及每个外围展示层各自的外围展示层半径;
所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的外围展示层半径、所述目标词云短语待展示的外围展示层的指定相邻展示层的展示层半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
根据所述坐标范围条件,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
15.根据权利要求1至6中任一项所述的方法,其特征在于,所述外围展示层的外切圆与所述中心展示层的外切圆同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层外切圆半径以及外围展示层外切圆半径;
所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
根据预设词云短语尺寸信息,确定所述目标词云短语的占位圆半径;
根据所述中心展示层外切圆半径、所述外围展示层外切圆半径以及所述占位圆半径,确定所述目标词云短语的坐标范围条件;
根据所述坐标范围条件,确定所述目标词云短语在所述外围展示层的展示位置。
16.根据权利要求1至6中任一项所述的方法,其特征在于,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的重要度等级;
根据所述重要度等级,从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的区域信息,确定所述目标词云短语在待展示的外围展示层的展示位置。
17.一种词云数据生成装置,其特征在于,包括:
第一获取模块,用于获取资讯信息;
第二获取模块,用于根据所述资讯信息,获取指定对象标识对应的词云短语候选集;
确定模块,用于根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;
展示模块,用于展示所述指定对象标识以及对应的目标词云短语;
所述确定模块,具体用于从所述资讯信息中,获取与所述指定对象标识关联的语料,并根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语;
所述展示模块,包括:
第一展示子模块,用于展示画布;其中,所述画布上具有中心展示层以及围绕所述中心展示层的外围展示层;
第二展示子模块,用于在所述中心展示层上展示所述指定对象标识;
第三展示子模块,用于根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,并在所述外围展示层的展示位置展示所述目标词云短语。
18.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序用于执行上述权利要求1至16中任一项所述的词云数据生成方法。
19.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1至16中任一项所述的词云数据生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010907156.3A CN112036159B (zh) | 2020-09-01 | 2020-09-01 | 一种词云数据生成方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010907156.3A CN112036159B (zh) | 2020-09-01 | 2020-09-01 | 一种词云数据生成方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112036159A CN112036159A (zh) | 2020-12-04 |
CN112036159B true CN112036159B (zh) | 2023-11-03 |
Family
ID=73592243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010907156.3A Active CN112036159B (zh) | 2020-09-01 | 2020-09-01 | 一种词云数据生成方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112036159B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1021043A (ja) * | 1996-04-01 | 1998-01-23 | Ricoh Co Ltd | アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー |
CN107003874A (zh) * | 2014-12-04 | 2017-08-01 | 微软技术许可有限责任公司 | 用以提高用户效率和交互性能的多任务工作流组件的主动呈现 |
CN107767195A (zh) * | 2016-08-16 | 2018-03-06 | 阿里巴巴集团控股有限公司 | 描述信息的展示系统和展示、生成方法及电子设备 |
CN107783983A (zh) * | 2016-08-24 | 2018-03-09 | 北京国双科技有限公司 | 信息展示方法及装置 |
CN110309303A (zh) * | 2019-05-22 | 2019-10-08 | 浙江工业大学 | 一种基于加权tf-idf的司法纠纷数据可视分析方法 |
CN110704603A (zh) * | 2019-09-12 | 2020-01-17 | 武汉灯塔之光科技有限公司 | 一种通过资讯发掘当前热点事件的方法和装置 |
CN110737591A (zh) * | 2019-09-16 | 2020-01-31 | 腾讯音乐娱乐科技(深圳)有限公司 | 网页性能评估方法、装置、服务器及存储介质 |
CN111026981A (zh) * | 2019-12-05 | 2020-04-17 | 中国银行股份有限公司 | 热点话题的可视化展示方法、装置和设备 |
CN111401039A (zh) * | 2020-03-05 | 2020-07-10 | 中国平安人寿保险股份有限公司 | 基于二元互信息的词语检索方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10693743B2 (en) * | 2015-09-21 | 2020-06-23 | Splunk Inc. | Displaying interactive topology maps of cloud computing resources |
-
2020
- 2020-09-01 CN CN202010907156.3A patent/CN112036159B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1021043A (ja) * | 1996-04-01 | 1998-01-23 | Ricoh Co Ltd | アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー |
CN107003874A (zh) * | 2014-12-04 | 2017-08-01 | 微软技术许可有限责任公司 | 用以提高用户效率和交互性能的多任务工作流组件的主动呈现 |
CN107767195A (zh) * | 2016-08-16 | 2018-03-06 | 阿里巴巴集团控股有限公司 | 描述信息的展示系统和展示、生成方法及电子设备 |
CN107783983A (zh) * | 2016-08-24 | 2018-03-09 | 北京国双科技有限公司 | 信息展示方法及装置 |
CN110309303A (zh) * | 2019-05-22 | 2019-10-08 | 浙江工业大学 | 一种基于加权tf-idf的司法纠纷数据可视分析方法 |
CN110704603A (zh) * | 2019-09-12 | 2020-01-17 | 武汉灯塔之光科技有限公司 | 一种通过资讯发掘当前热点事件的方法和装置 |
CN110737591A (zh) * | 2019-09-16 | 2020-01-31 | 腾讯音乐娱乐科技(深圳)有限公司 | 网页性能评估方法、装置、服务器及存储介质 |
CN111026981A (zh) * | 2019-12-05 | 2020-04-17 | 中国银行股份有限公司 | 热点话题的可视化展示方法、装置和设备 |
CN111401039A (zh) * | 2020-03-05 | 2020-07-10 | 中国平安人寿保险股份有限公司 | 基于二元互信息的词语检索方法、装置、设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
Context preserving dynamic word cloud visualization;Cui Weiwei 等;《2010 IEEE Pacific Visualization Symposium (PacificVis)》;121-128 * |
Enabling secure and efficient ranked keyword search over outsourced cloud data;Wang Cong 等;《IEEE Transactions on parallel and distributed systems》;第23卷(第8期);1467-1479 * |
基于文本挖掘的用户画像系统的设计与实现;刘星辰;《中国优秀硕士学位论文全文数据库信息科技辑》(第11期);I138-638 * |
大规模非结构数据索引和可视化的研究;曹磊;《中国优秀硕士学位论文全文数据库信息科技辑》(第08期);I138-887 * |
Also Published As
Publication number | Publication date |
---|---|
CN112036159A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8497863B2 (en) | Graph scalability | |
US11880382B2 (en) | Systems and methods for generating tables from print-ready digital source documents | |
CN107315779A (zh) | 日志分析方法和系统 | |
US9916286B2 (en) | Reformatting multiple paragraphs of text using the formatting of a sample object by creating multiple candidate combinations and selecting a closest match | |
US11256383B2 (en) | Graphically representing content relationships on a surface of graphical object | |
EP3617910A1 (en) | Method and apparatus for displaying textual information | |
US11037356B2 (en) | System and method for executing non-graphical algorithms on a GPU (graphics processing unit) | |
CN107609131B (zh) | 一种报表文件生成方法及装置 | |
CN111787409A (zh) | 影视评论数据处理方法及装置 | |
CN112036158B (zh) | 词云数据分布处理方法及装置 | |
CN112036159B (zh) | 一种词云数据生成方法以及装置 | |
CN112231468A (zh) | 信息生成方法、装置、电子设备及存储介质 | |
US20220335070A1 (en) | Method and apparatus for querying writing material, and storage medium | |
KR102464509B1 (ko) | 작문을 위한 콘텐츠를 추천하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 | |
CN114722112A (zh) | 一种可视化列表数据展示方法及其装置 | |
CN114299525A (zh) | 图片处理方法、装置及电子设备 | |
WO2021072776A1 (zh) | 数据合并方法、装置、电子设备及存储介质 | |
CN110263303B (zh) | 文本修改历史的追溯方法及装置 | |
CN115104092A (zh) | 数据同步方法及相关装置 | |
CN111782333B (zh) | 游戏中的界面显示方法、装置、存储介质与终端设备 | |
CN111368553A (zh) | 智能词云图数据处理方法、装置、设备及存储介质 | |
CN110647574B (zh) | 一种社交网络数据展示方法、终端设备及存储介质 | |
CN113297273B (zh) | 查询元数据的方法、装置和电子设备 | |
US11474975B2 (en) | Identity represented assets in a content management system | |
JP2018165875A (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |