CN113987374A - 词云展示方法、装置、电子设备、介质及产品 - Google Patents
词云展示方法、装置、电子设备、介质及产品 Download PDFInfo
- Publication number
- CN113987374A CN113987374A CN202111256319.7A CN202111256319A CN113987374A CN 113987374 A CN113987374 A CN 113987374A CN 202111256319 A CN202111256319 A CN 202111256319A CN 113987374 A CN113987374 A CN 113987374A
- Authority
- CN
- China
- Prior art keywords
- word
- keyword
- candidate
- text
- related word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000011218 segmentation Effects 0.000 claims abstract description 57
- 238000004590 computer program Methods 0.000 claims abstract description 11
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000004044 response Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及计算机技术领域,具体涉及一种词云展示方法及装置、电子设备介质以及计算机程序产品,上述方法包括:获取文本以及所述文本对应的分词结果,根据所述文本对应的分词结果确定所述文本对应的关键词;根据所述关键词确定所述关键词对应的多个第一关联文本;在所述关键词与所述关键词的第一候选关联词之间具有关联关系时,根据所述第一候选关联词确定所述关键词的第一关联词;展示所述关键词以及所述关键词的第一关联词。通过本公开实施例的技术方案,可以解决现有技术中词云展示形式单一的问题。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种词云展示方法、词云展示装置、电子设备、计算机可读存储介质以及计算机程序产品。
背景技术
相关技术中,词云可以通过形成关键词云层或关键词渲染,对网络文本中出现频率较高的关键词以视觉上的突出。即词云可以过滤掉大量的文本信息,使得读者快速了解文本的主要内容。
在相关技术的方案中,可以将文本中的句子或者段落划分成词,再根据划分得到的词生成词云。具体的,可以根据划分得到的词的出现频次对词进行排序,对排名靠前的词进行突出显示。然而,相关技术中的词云展示方案,词云的展示形式只取决于词在文本中的出现频次,展示形式较为单一,且词云中包含的信息较少,难以通过词云了解文本的简略内容。
发明内容
本公开提供一种词云展示方法、词云展示装置、电子设备、计算机可读存储介质及计算机程序产品,以至少解决相关技术中词云展示形式单一的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种词云展示方法,包括获取文本以及文本对应的分词结果,根据文本对应的分词结果确定文本对应的关键词;根据关键词确定关键词对应的多个第一关联文本;其中,第一关联文本包括关键词与关键词的第一候选关联词;在关键词与关键词的第一候选关联词之间具有关联关系时,根据第一候选关联词确定关键词的第一关联词;展示关键词以及关键词的第一关联词。
可选的,根据文本对应的分词结果确定文本对应的关键词的步骤包括:获取文本对应的分词结果中多个候选分词的关联信息;根据关联信息在多个候选分词中确定文本对应的关键词。
可选的,关键词与关键词的第一候选关联词之间具有关联关系的步骤包括:获取关键词与第一候选关联词在第一关联文本中的文本位置;在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系。
可选的,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系的步骤包括:在关键词与第一候选关联词处于相邻位置且关键词位于第一候选关联词之前时,第一候选关联词具有针对关键词的关联关系。
可选的,根据第一候选关联词确定关键词的第一关联词的步骤包括:根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序得到排序结果;根据排序结果在第一候选关联词中确定关键词的第一关联词。
可选的,关键词的关联词包括第一关联词与第二关联词,其中,第二关联词为第一关联词的关联词,根据排序结果在候选关联词中确定关键词的第一关联词的步骤包括:根据第一关联词确定第一关联词对应的多个第二关联文本;其中,第二关联文本中包括第一关联词与第一关联词的第二候选关联词;在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词。
可选的,根据第二候选关联词确定第一关联词的第二关联词的步骤包括:根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序得到排序结果;根据排序结果在第二候选关联词中确定第一关联词的第二关联词。
可选的,展示关键词以及关键词的第一关联词的步骤包括:响应作用于关键词对应的关联位置的第一词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的外层展示位置展示关键词的第一关联词;其中,关键词与第一关联词通过标识线连接。
可选的,响应作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合;其中,第一文本集合包括多个第一关联文本的相关信息以及第一关联文本的跳转标识;响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本。
可选的,展示关键词以及关键词的第一关联词的步骤包括:响应作用于关键词对应的关联位置的第二词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的次外层展示位置展示关键词的第一关联词,在词云画布的外层展示位置展示第二关联词;其中,关键词与第一关联词通过标识线连接,第一关联词与第二关联词通过标识线连接。
可选的,响应作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合;其中,第二文本集合包括多个第二关联文本的相关信息以及第二关联文本的跳转标识;响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本。
根据本公开实施例的第二方面,提供一种词云展示装置,包括关键词确定单元,被配置为执行获取文本以及文本对应的分词结果,根据文本对应的分词结果确定文本对应的关键词;第一关联文本确定单元,被配置为执行根据关键词确定关键词对应的多个第一关联文本;其中,第一关联文本包括关键词与关键词的第一候选关联词;第一关联词确定单元,被配置为执行在关键词与关键词的第一候选关联词之间具有关联关系时,根据第一候选关联词确定关键词的第一关联词;关联词展示单元,被配置为执行展示关键词以及关键词的第一关联词。
可选的,根据文本对应的分词结果确定文本对应的关键词,词云展示装置还包括:关联信息获取单元,被配置为获取文本对应的分词结果中多个候选分词的关联信息;关键词确定单元,被配置为根据关联信息在多个候选分词中确定文本对应的关键词。
可选的,关键词与关键词的第一候选关联词之间具有关联关系,词云展示装置还包括:文本位置获取单元,被配置为获取关键词与第一候选关联词在第一关联文本中的文本位置;第一关联关系确定单元,被配置为在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系。
可选的,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系,词云展示装置还包括:第二关联关系确定单元,被配置为在关键词与第一候选关联词处于相邻位置且关键词位于第一候选关联词之前时,第一候选关联词具有针对关键词的关联关系。
可选的,根据第一候选关联词确定关键词的第一关联词,词云展示装置还包括:第一候选关联词排序单元,被配置为根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序得到排序结果;第一关联词确定子单元,被配置为根据排序结果在第一候选关联词中确定关键词的第一关联词。
可选的,关键词的关联词包括第一关联词与第二关联词,其中,第二关联词为第一关联词的关联词,根据排序结果在候选关联词中确定关键词的第一关联词,词云展示装置还包括:第二关联文本确定单元,被配置为根据第一关联词确定第一关联词对应的多个第二关联文本;其中,第二关联文本中包括第一关联词与第一关联词的第二候选关联词;第二关联词确定单元,被配置为在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词。
可选的,根据第二候选关联词确定第一关联词的第二关联词,词云展示装置还包括:第二候选关联词排序单元,被配置为根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序得到排序结果;第二关联词确定子单元,被配置为根据排序结果在第二候选关联词中确定第一关联词的第二关联词。
可选的,展示关键词以及关键词的第一关联词,词云展示装置还包括:第一词云查看操作响应单元,被配置为响应作用于关键词对应的关联位置的第一词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的外层展示位置展示关键词的第一关联词;其中,关键词与第一关联词通过标识线连接。
可选的,词云展示装置还包括:第一集合查看操作响应单元,被配置为响应作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合;其中,第一文本集合包括多个第一关联文本的相关信息以及第一关联文本的跳转标识;第一文本查看操作响应单元,被配置为响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本。
可选的,展示关键词以及关键词的第一关联词,词云展示装置还包括:第二词云查看操作响应单元,被配置为响应作用于关键词对应的关联位置的第二词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的次外层展示位置展示关键词的第一关联词,在词云画布的外层展示位置展示第二关联词;其中,关键词与第一关联词通过标识线连接,第一关联词与第二关联词通过标识线连接。
可选的,词云展示装置还包括:第二集合查看操作响应单元,被配置为响应作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合;其中,第二文本集合包括多个第二关联文本的相关信息以及第二关联文本的跳转标识;第二文本查看操作响应单元,被配置为响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为执行可执行指令,以实现如上述任一项的词云展示方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述任一项的词云展示方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,计算机程序/指令,其特征在于,计算机程序/指令被处理器执行时实现上述任一项的词云展示方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开的一种实施例提供的词云展示方法中,可以在关键词与第一候选关键词之间具有关联关系时,确定关键词的第一关联词,并进行展示。一方面,对词云进行展示时,考虑了词之间的关联关系,避免仅考虑词在文本中的出现频次而导致词云展示形式单一的问题,增加了词云的展示形式;另一方面,由于在展示的词云中包含关键词与关键词对应的第一关联词,即可以通过词云了解与关键词具有关联关系的关联词,增加词云的信息容量,能够通过该词云了解文本的简略内容,提高了词云的使用效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种词云展示方法的流程图;
图2是根据一示例性实施例示出的一种根据关联信息在多个候选分词中确定关键词的流程图;
图3是根据一示例性实施例示出的一种在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系的流程图;
图4是根据一示例性实施例示出的一种根据第一关联文本确定关键词的关联词的流程图;
图5是根据一示例性实施例示出的一种在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词的流程图;
图6是根据一示例性实施例示出的一种根据排序结果在第二候选关联词中确定第一关联词的第二关联词的流程图;
图7是根据一示例性实施例示出的一种词云展示的示意图;
图8是根据一示例性实施例示出的一种响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本的流程图;
图9是根据一示例性实施例示出的一种显示第一关联文本的示意图;
图10是根据一示例性实施例示出的另一种词云展示的示意图;
图11是根据一示例性实施例示出的一种响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本的流程图;
图12是根据一示例性实施例示出的一种显示第一关联文本的示意图;
图13是根据一示例性实施例示出的一种词云展示过程的示意图;
图14是根据一示例性实施例示出的一种词云展示装置的组成示意图;
图15是根据一示例性实施例示出了适于用来实现本公开示例性实施例的电子设备的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
相关技术中,词云可以通过形成关键词云层或关键词渲染,对网络文本中出现频率较高的关键词以视觉上的突出。即词云可以过滤掉大量的文本信息,使得读者快速了解文本的主要内容。
在相关技术的方案中,可以将文本中的句子或者段落划分成词,再根据划分得到的词生成词云。具体的,可以根据划分得到的词的出现频次对词进行排序,对排名靠前的词进行突出显示。然而,相关技术中的词云展示方案,词云的展示形式只取决于词在文本中的出现频次,展示形式较为单一,且词云中包含的信息较少,难以通过词云了解文本的简略内容。
图1是根据一示例性实施例示出的一种词云展示方法的流程图,如图1所示,词云展示方法,包括以下步骤。
在步骤S110中,获取文本以及文本对应的分词结果,根据文本对应的分词结果确定文本对应的关键词;
在步骤S120中,根据关键词确定关键词对应的多个第一关联文本;其中,第一关联文本包括关键词与关键词的第一候选关联词;
在步骤S130中,在关键词与关键词的第一候选关联词之间具有关联关系时,根据第一候选关联词确定关键词的第一关联词;
在步骤S140中,展示关键词以及关键词的第一关联词。
本公开的一种实施例提供的词云展示方法中,可以在关键词与第一候选关键词之间具有关联关系时,确定关键词的第一关联词,并进行展示。一方面,对词云进行展示时,考虑了词之间的关联关系,避免仅考虑词在文本中的出现频次而导致词云展示形式单一的问题,增加了词云的展示形式;另一方面,由于在展示的词云中包含关键词与关键词对应的第一关联词,即可以通过词云了解与关键词具有关联关系的关联词,增加词云的信息容量,能够通过该词云了解文本的简略内容,提高了词云的使用效率。
下面,将结合图1及实施例对本示例性实施例中的词云展示方法的步骤S110~S140进行更详细的说明。
步骤S110,获取文本以及文本对应的分词结果,根据文本对应的分词结果确定文本对应的关键词;
在本公开的一种示例实施例中,可以获取文本以及文本对应的分词结果,并根据文本对应的分词结果确定文本对应的关键词。具体的,关键词是指文本中能够更大程度上体现文本含义的词。在获取文本对应的分词结果时,可以通过分词算法进行处理。具体而言,可以采用基于词表的分词方法(正向最大匹配法、逆向最大匹配法、N-最短路径方法等),还可以采用基于统计模型的分词方法(基于N-gram语言模型的分词方法等),还可以采用基于序列标注的分词方法(基于HMM的分词方法、基于CRF的分词方法、基于词感知机的分词方法、基于深度学习的端到端的分词方法等)。需要说明的是,本公开对于获取文本对应的分词算法的具体类型并不做特殊限定。
在通过上述步骤得到文本对应的分词结果之后,可以在多个分词中确定文本对应的关键词。具体的,可以创建关键词词库与通用词库,将上述步骤中得到的分词在关键词词库与通用词库中的词进行检索,若上述分词在关键词词库中,则将该分词确定为关键词,若上述分词在通用词库中,则将该分词抛弃。
举例而言,获取到的文本为“我该如何关闭青少年模式”,通过分词处理后得到“我”“该”“如何”“关闭”“青少年”“模式”,其中,“关闭”“青少年”“模式”都存在于关键词词库中,此时,文本中的关键词可以包括“关闭”“青少年”“模式”;或者,获取到的文本为“我点击了视频页面中的播放按钮,显示无法播放”,通过分词处理后得到“我”“点击”“了”“视频”“页面”“中”“的”“播放”“按钮”“显示”“无法”,其中,“视频”“页面”“播放”“按钮”“显示”都存在与关键词词库中,此时,文本中的关键词可以包括“视频”“页面”“播放”“按钮”“显示”。
需要说明的是,本公开对于确定文本中的关键词的方式并不做特殊限定。
在本公开的一种示例实施例中,可以获取分词结果中多个候选分词的关联信息,并根据关联信息在多个候选分词中确定关键词。参照图2所示,根据关联信息在多个候选分词中确定关键词,可以包括以下步骤S210~S220:
步骤S210,获取分词结果中多个候选分词的关联信息;
在本公开的一种示例实施例中,在通过上述步骤获取到文本对应的分词结果之后,可以获取分词结果中的多个候选分词,并获取多个候选分词的关联信息。具体的,候选分词的关联信息是指词与文本的关联程度信息。举例而言,候选分词的关联信息可以包括词性、词频、位置信息、互信息、词跨度等。需要说明的是,本公开对于关联信息的具体类型以及获取关联信息的具体方式并不做特殊限定。
步骤S220,根据关联信息在多个候选分词中确定关键词。
在本公开的一种示例实施例中,在获取到候选分词的关联信息之后,可以根据关联信息在多个候选分词中确定关键词。具体的,上述关联信息可以用于指示候选分词对文本的重要程度,因此,可以根据候选分词的关联信息确定关键词。举例而言,候选分词的关联信息为词性,可以通过语法分析得到候选分词的词性为名词,名词与其他词性的词相比,更能体现文本的主要内容,因此,可以将词性为名词的候选分词作为文本的关键词;或者,候选分词的关联信息为词频,可以对候选分词进行数学统计得到各个候选分词的数量,若一个候选分词在文本中的出现次数越多,则越有可能作为文本的关键词,因此,可以将词频较大的候选分词作为文本的关键词。需要说明的是,本公开对于根据关联信息在多个候选分词中确定关键词的具体方式并不做特殊限定。
通过上述步骤S210~S220,可以获取分词结果中多个候选分词的关联信息,并根据关联信息在多个候选分词中确定关键词。
步骤S120,根据关键词确定关键词对应的多个第一关联文本;其中,第一关联文本包括关键词与关键词的第一候选关联词;
在本公开的一种示例实施例中,在通过上述步骤确定关键词之后,可以根据关键词确定关键词对应的多个第一关联文本。具体的,第一关联文本中包括关键词,可以在词云数据库中查找包括关键词的第一关联文本。举例而言,通过上述步骤确定的关键词为“直播”,可以通过关键词查找第一关联文本,得到多个第一关联文本:“我的直播页面不能关闭”、“直播界面无法切换线路”、“不能参与直播活动”等,这些第一关联文本中都包括关键词“直播”。
此外,第一关联文本中还包括关键词的第一候选关联词。具体的,第一候选关联词可以为第一关联文本经过分词处理之后得到的除关键词之外的所有分词,举例而言,上述步骤得到的第一关联文本为“我的直播页面不能关闭”,经过分词处理之后得到“我的”“直播”“页面”“不能”“关闭”,此时去除掉关键词“直播”,即剩余分词“我的”“页面”“不能”“关闭”为第一候选关联词。
或者,第一候选关联词可以为第一关联文本经过分词处理得到除关键词之外的多个分词,且对上述多个分词经过关键词提取之后得到的分词,举例而言,上述步骤得到的第一关联文本为“我的直播页面不能关闭”,经过分词处理之后得到“我的”“直播”“页面”“不能”“关闭”,此时去除掉关键词“直播”,得到“我的”“页面”“不能”“关闭”,对这些分词进行关键词提取,得到“页面”“不能”“关闭”,即“页面”“不能”“关闭”为第一候选关联词。
需要说明的是,本公开对于确定第一候选关联词的具体方法并不做特殊限定。
进一步的,在根据关键词确定关键词对应的多个第一关联文本时,可以设置查询时间范围。举例而言,可以设置查询时间范围为2021年1月1日至2021年10月1日之间,即此时根据关键词确定的第一关联文本是2021年1月1日至2021年10月1日之间上传或生成的第一关联文本。需要说明的是,本公开对于查询时间范围的具体数值并不做特殊限定。
在本公开的一种示例实施例中,可以获取关键词与第一候选关联词在第一关联文本中的文本位置,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系。参照图3所示,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系,可以包括以下步骤S310~S320:
步骤S310,获取关键词与第一候选关联词在第一关联文本中的文本位置;
在本公开的一种示例实施例中,在通过上述步骤得到关键词与第一候选关联词之后,可以根据关键词在第一关联文本中的文本位置确定关键词与第一候选关联词之间的关联关系。具体的,关键词在文本中的文本位置是指关键词在第一关联文本中的位置信息,即可以通过该位置信息了解关键词在第一关联文本中的具体位置;第一候选关联词在文本中的文本位置是指第一候选关联词在第一关联文本中的位置信息,即可以通过该位置信息了解第一候选关联词在第一关联文本中的具体位置。
举例而言,关键词/第一候选关联词在文本中的文本位置可以包括关键词/第一候选关联词是文本中的第几个字,如第一关联文本为:“我该如何关闭青少年模式”中的“青少年”在第一关联文本中的文本位置为“7-9”;或者,关键词/第一候选关联词在第一关联文本中的文本位置可以包括关键词/第一候选关联词在第一关联文本中的结构位置,例如,如第一关联文本为:“我该如何关闭青少年模式”中的“模式”在第一关联文本中的文本位置为句尾。需要说明的是,本公开对于关键词/第一候选关联词在第一关联文本中的文本位置的确定方法并不做特殊限定。
步骤S320,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系。
在本公开的一种示例实施例中,在得到关键词在文本中的文本位置以及第一候选关联词在第一关联文本中的文本位置之后,可以判断第一关键词在第一关联文本中的文本位置以及第一候选关联词在第一关联文本中的文本位置是否相邻。在第一关键词在第一关联文本中的文本位置以及第一候选关联词在第一关联文本中的文本位置相邻时,则关键词与第一候选关联词具有关联关系。举例而言,第一关联文本为:“我该如何关闭青少年模式”,其中,“青少年”为关键词,此时,关键词“青少年”与第一候选关联词“模式”在文本中处于相邻位置,则第一关键词“青少年”与第一候选关联词“模式”具有关联关系。
通过上述步骤S310~S320,可以获取关键词与第一候选关联词在第一关联文本中的文本位置,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系。
在本公开的一种示例实施例中,在通过上述步骤得到关键词在第一关联文本中的文本位置以及第一候选关联词在第一关联文本中的文本位置之后,可以判断关键词与第一候选关联词的相对顺序,在关键词与第一候选关联词处于相邻位置且关键词位于第一候选关联词之前时,第一候选关联词具有针对关键词的关联关系,在此种情况下,关键词不具有针对第一候选关联词的关联关系,举例而言,第一关联文本为“如何关闭青少年模式”,其中,关键词为“青少年”,第一候选关联词为“模式”,此时关键词与第一候选关联词相邻且关键词位于第一候选关联词之前,第一候选关联词具有针对关联词的关联关系,而关键词不具有针对第一候选关联词的关联关系;在关键词与第一候选关联词处于相邻位置且关键词位于第一候选关联词之后时,关键词具有针对第一候选关联词的关联关系,在此种情况下,第一候选关联词不具有针对关键词的关联关系。
步骤S130,在关键词与第一候选关联词之间具有关联关系时,根据第一候选关联词确定关键词的第一关联词;
在本公开的一种示例实施例中,在通过上述步骤确定关键词与第一候选关联词之后,可以确定关键词与第一候选关联词之间的关联关系。具体的,可以根据关键词与第一候选关联词在第一关联文本中的文本位置确定关键词与第一候选关联词之间的关联关系。举例而言,可以设置当关键词与第一候选关联词之间不超过2个字符时,关键词与第一候选关联词之间具有关联关系;或者,可以设置关联关系表,若关联关系表中存储了关键词与第一候选关联词的关联关系,则可以确定关键词与第一候选关联词之间具有关联关系。需要说明的是,本公开对于确定关键词与第一候选关联词之间是否具有关联关系的具体方式并不做特殊限定。
在通过上述步骤确定关键词与第一候选关联词之间具有关联关系时,可以根据第一候选关联词确定关键词的第一关联词。具体的,可以将所有的第一候选关联词确定为关键词的第一关联词,举例而言,通过上述步骤得到的第一候选关联词为“页面”“不能”“关闭”,此时,可以将“页面”“不能”“关闭”作为关键词的关联词;或者,也可以设置第一关联词确定条件,将满足第一关联词确定条件的第一候选关联词确定为关键词的第一关联词,举例而言,可以将第一关联词确定条件设置为名词词性,即只将词性为名词的第一候选关联词确定为关键词的第一关联词。需要说明的是,本公开对于根据第一候选关联词确定关键词的第一关联词的具体方式并不做特殊限定。
在本公开的一种示例实施例中,可以根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序得到排序结果,根据排序结果在第一候选关联词中确定关键词的第一关联词。参照图4所示,根据第一关联文本确定关键词的关联词,可以包括以下步骤S410~S420:
步骤S410,根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序得到排序结果;
在本公开的一种示例实施例中,在通过上述步骤得到关键词对应的多个第一关联文本之后,可以获取第一候选关联词在多个第一关联文本中的出现频次。具体的,第一候选关联词在多个第一关联文本中的出现频次是指同一个第一候选关联词在不同第一关联文本中出现的次数。
举例而言,通过上述步骤确定第一候选关联词为“关闭”、“青少年”、“模式”,得到的所有第一关联文本有48条,其中,出现第一候选关联词“关闭”的第一关联文本有24条,出现第一候选关联词“青少年”的第一关联文本有14条,出现第一候选关联词“模式”的第一关联文本有10条,即第一候选关联词“关闭”在第一关联文本中的出现频次为24,第一候选关联词“青少年”在第一关联文本中的出现频次为14,第一候选关联词“模式”在第一关联文本中的出现频次为10,此时,可以根据第一候选关联词在第一关联文本中的出现频次逐渐减少的顺序对第一候选关联词进行排序得到排序结果:1“关闭”、2“青少年”、3“模式”。
需要说明的是,在确定某第一候选关联词在多个第一关联文本中的出现频次时,若在某一个第一关联文本中出现了两次或两次以上该第一候选关联词时,需要将超出一次的频次计算在出现频次中。
需要说明的是,本公开对于根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序的具体方式并不做特殊限定,此外,对于排序结果的展示形式也不做特殊限定。
步骤S420,根据排序结果在第一候选关联词中确定关键词的第一关联词。
在本公开的一种示例实施例中,在通过上述步骤确定排序结果之后,可以根据排序结果在第一候选关联词中确定关键词的第一关联词。具体的,可以选择在排序结果中选择预设排名的第一候选关联词作为关键词的第一关联词。举例而言,通过上述步骤得到的排序结果为:1“关闭”、2“青少年”、3“模式”,预设排名为前2名,则此时可以将“关闭”、“青少年”确定为关键词的第一关联词。需要说明的是,本公开对于根据排序结果在第一候选关联词中确定关键词的第一关联词的具体方式并不做特殊限定。
进一步的,在通过上述步骤确定第一关联词之后,还可以在热词数据库中查找仅包含第一关联词的文本,在词云展示界面,可以通过查询操作查看第一关联文本的数量以及上述仅包含第一关联词的文本的数量。具体的,若仅包含第一关联词的文本的数量与第一关联文本的数量差异大于预设阈值时,表示第一关联词的可参考程度较低,此时可以将该第一关联词抛弃。
步骤S410~S420,可以根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序得到排序结果,根据排序结果在第一候选关联词中确定关键词的第一关联词。
在本公开的一种示例实施例中,可以根据第一关联词确定第一关联词对应的多个第二关联文本,在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词。参照图5所示,在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词,可以包括以下步骤S510~S520:
步骤S510,根据第一关联词确定第一关联词对应的多个第二关联文本;
在本公开的一种示例实施例中,在通过上述步骤确定第一关联词之后,可以根据第一关联词确定第一关联词对应的多个第二关联文本。具体的,第二关联文本中包括第一关联词,可以在词云数据库中查找包括第一关联词的第二关联文本。举例而言,通过上述步骤确定的第一关联词为“红包”,可以通过第一关联词查找第二关联文本,得到多个第二关联文本:“无法领取红包”、“不能参加红包活动”、“如何快速领取新用户红包”等,这些第二关联文本中都包括第一关联词“红包”。
此外,第二关联文本中还包括第一关联词的第二候选关联词。具体的,第二候选关联词可以为第二关联文本经过分词处理之后得到的除第一关联词之外的所有分词,举例而言,上述步骤得到的第二关联文本为“我如何快速领取新用户红包”,经过分词处理之后得到“我”“如何”“快速”“领取”“新用户”“红包”,此时去除掉第一关联词“红包”,即剩余分词“我”“如何”“快速”“领取”“新用户”为第二候选关联词。
或者,第二候选关联词可以为第二关联文本经过分词处理得到除第一关联词之外的多个分词,且对上述多个分词经过关键词提取之后得到的分词,举例而言,上述步骤得到的第二关联文本为“无法领取红包”,经过分词处理之后得到“无法”“领取”“红包”,此时去除掉第一关联词“红包”,得到“无法”“领取”,对这些分词进行关键词提取,得到“领取”,即“领取”为第二候选关联词。
需要说明的是,本公开对于确定第二候选关联词的具体方法并不做特殊限定。
进一步的,在根据第一关联词确定第一关联词对应的多个第二关联文本时,可以设置查询时间范围。举例而言,可以设置查询时间范围为2021年1月1日至2021年10月1日之间,即此时根据第一关联词确定的第二关联文本是2021年1月1日至2021年10月1日之间上传或生成的第二关联文本。需要说明的是,本公开对于查询时间范围的具体数值并不做特殊限定。
步骤S520,在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词。
在本公开的一种示例实施例中,在通过上述步骤确定第一关联词与第二候选关联词之后,可以确定第一关联词与第二候选关联词之间的关联关系。具体的,可以根据第一关联词与第二候选关联词在第二关联文本中的文本位置确定第一关联词与第二候选关联词之间的关联关系。举例而言,可以设置当第一关联词与第二候选关联词之间不超过2个字符时,第一关联词与第二候选关联词之间具有关联关系;或者,可以设置关联关系表,若关联关系表中存储了第一关联词与第二候选关联词的关联关系,则可以确定第一关联词与第二候选关联词之间具有关联关系。需要说明的是,本公开对于确定第一关联词与第二候选关联词之间是否具有关联关系的具体方式并不做特殊限定。
在通过上述步骤确定第一关联词与第二候选关联词之间具有关联关系时,可以根据第二候选关联词确定第一关联词的第二关联词。具体的,可以将所有的第二候选关联词确定为第一关联词的第二关联词,举例而言,通过上述步骤得到的第二候选关联词为“快速”“领取”“新用户”,此时,可以将“快速”“领取”“新用户”作为第一关联词的关联词;或者,也可以设置第一关联词确定条件,将满足第一关联词确定条件的第二候选关联词确定为第一关联词的第二关联词,举例而言,可以将第一关联词确定条件设置为名词词性,即只将词性为名词的第二候选关联词确定为第一关联词的第二关联词。需要说明的是,本公开对于根据第二候选关联词确定第一关联词的第二关联词的具体方式并不做特殊限定。
通过上述步骤S510~S520,可以根据第一关联词确定第一关联词对应的多个第二关联文本,在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词。
在本公开的一种示例实施例中,可以根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序得到排序结果,并根据排序结果在第二候选关联词中确定第一关联词的第二关联词。参照图6所示,根据排序结果在第二候选关联词中确定第一关联词的第二关联词,可以包括以下步骤S610~S620:
步骤S610,根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序得到排序结果;
在本公开的一种示例实施例中,在通过上述步骤得到第一关联词对应的多个第二关联文本之后,可以获取第二候选关联词在多个第二关联文本中的出现频次。具体的,第二候选关联词在多个第二关联文本中的出现频次是指同一个第二候选关联词在不同的第二关联文本中出现的次数。
举例而言,通过上述步骤确定第二候选关联词为“快速”、“领取”、“新用户”,得到的所有第二关联文本有96条,其中,出现第二候选关联词“快速”的第二关联文本有50条,出现第二候选关联词“领取”的第二关联文本有26条,出现第二候选关联词“新用户”的第二关联文本有20条,即第二候选关联词“快速”在第二关联文本中的出现频次为50,第二候选关联词“领取”在第二关联文本中的出现频次为26,第二候选关联词“新用户”在第二关联文本中的出现频次为20,此时,可以根据第二候选关联词在第二关联文本中的出现频次逐渐减少的顺序对第二候选关联词进行排序得到排序结果:1“快速”、2“领取”、3“新用户”。
需要说明的是,在确定某第二候选关联词在多个第二关联文本中的出现频次时,若在某一个第二关联文本中出现了两次或两次以上该第二候选关联词时,需要将超出一次的频次计算在第二候选关联词在多个第二关联文本中的出现频次中。
需要说明的是,本公开对于根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序的具体方式并不做特殊限定,此外,对于排序结果的形式也不做特殊限定。
步骤S620,根据排序结果在第二候选关联词中确定第一关联词的第二关联词。
在本公开的一种示例实施例中,在通过上述步骤确定排序结果之后,可以根据排序结果在第二候选关联词中确定第一关联词的第二关联词。具体的,可以选择在排序结果中选择预设排名的第二候选关联词作为第一关联词的第二关联词。举例而言,通过上述步骤得到的排序结果为:1“快速”、2“领取”、3“新用户”,预设排名为前2名,则此时可以将“快速”、“领取”确定为第一关联词的第二关联词。需要说明的是,本公开对于根据排序结果在第二候选关联词中确定第一关联词的第二关联词的具体方式并不做特殊限定。
进一步的,在通过上述步骤确定第二关联词之后,还可以在热词数据库中查找仅包含第二关联词的文本,在词云展示界面,可以通过查询操作查看第二关联文本的数量以及上述仅包含第二关联词的文本的数量。具体的,若仅包含第二关联词的文本的数量与第二关联文本的数量差异大于预设阈值时,表示第一关联词的可参考程度较低,此时可以将该第二关联词抛弃。
通过上述步骤S610~S620,可以根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序得到排序结果,并根据排序结果在第二候选关联词中确定第一关联词的第二关联词。
在本公开的一种示例实施例中,可以响应作用于关键词对应的关联位置的第一词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的外层展示位置展示关键词的第一关联词。其中,关键词与第一关联词通过标识线连接。举例而言,如图7所示,可以在词云画布700中心展示位置710展示关键词“红包”730,在词云画布700外层展示位置720展示第一关联词740“快速”“领取”“用户”“活动”,并通过标识线750将关键词与第一关联词进行连接。需要说明的是,本公开对于词云画布的中心展示位置以及外层展示位置的形状和位置并不做特殊限定。
在本公开的一种示例实施例中,可以响应作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合,响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本。参照图8所示,响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本,可以包括以下步骤S810~S820:
步骤S810,响应作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合;
步骤S820,响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本。
在本公开的一种示例实施例中,可以接收作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合。其中,第一文本集合包括多个第一关联文本的相关信息。具体的,第一关联文本的相关信息可以包括第一关联文本标签、第一关联文本所属用户ID、第一关联文本的生成/创建时间、第一关联文本的资源标识等信息。需要说明的是,本公开对于第一关联文本的相关信息的具体内容并不做特殊限定。
此外,第一文本集合还包括各第一关联文本对应的跳转标识,可以通过上述跳转标识查看第一关联文本的详细内容。
进一步的,在显示第一关联文本时,还可以展示与第一关联文本相关的内容,如上下文内容等。
其中,第一集合查看操作/第一文本查看操作可以包括按键操作、触控操作、语音控制等方式,其中,触控操作可以包括滑动触控操作、按压触控操作、手势触控操作、长按触控操作、点击触控操作、拖动触控操作等。需要说明的是,本公开对于第一集合查看操作/第一文本查看操作的具体形式并不做特殊限定。
举例而言,如图9所示,响应作用于第一关联词“领取”对应的关联位置910的第一集合查看操作,显示第一关联词对应的第一文本集合920,响应作用于第一关联文本的跳转标识9210的第一文本查看操作,显示跳转标识对应的第一关联文本930“为什么不能领取活动红包?”以及与第一关联文本相关的内容“有什么可以帮助您的呢?”。
通过上述步骤S810~S820,可以响应作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合,响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本。
在本公开的一种示例实施例中,可以响应作用于关键词对应的关联位置的第二词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的次外层展示位置展示关键词的第一关联词,在词云画布的外层展示位置展示第二关联词。其中,关键词与第一关联词通过标识线连接,第一关联词与第二关联词通过标识线连接。
举例而言,如图10所示,在词云画布1000中心展示位置1010展示关键词“红包”1030,在词云画布1000的次外层展示位置1020展示第一关联词1040“快速”“领取”“用户”“活动”,词云画布1000的外层展示位置1050展示第二关联词1060“奖励”“参与”“关闭”“打开”“现金”“优惠”“活跃”“页面”,并通过标识线将关键词与第一关联词进行连接,以及通过标识线将第一关联词与第二关联词进行连接。。需要说明的是,本公开对于词云画布的中心展示位置、次外层展示位置以及外层展示位置的具体形状和具体位置并不做特殊限定。
在本公开的一种示例实施例中,可以响应作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合,响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本。参照图11所示,响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本,可以包括以下步骤S1110~S1120:
步骤S1110,响应作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合;
步骤S1120,响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本。
在本公开的一种示例实施例中,可以接收作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合。其中,第二文本集合包括多个第二关联文本的相关信息。具体的,第二关联文本的相关信息可以包括第二关联文本标签、第二关联文本所属用户ID、第二关联文本的生成/创建时间、第二关联文本的资源标识等信息。需要说明的是,本公开对于第二关联文本的相关信息的具体内容并不做特殊限定。
此外,第二文本集合还包括各第二关联文本对应的跳转标识,可以通过上述跳转标识查看第二关联文本的详细内容。
进一步的,在显示第二关联文本时,还可以展示与第二关联文本相关的内容,如上下文内容等。
其中,第二集合查看操作/第二文本查看操作可以包括按键操作、触控操作、语音控制等方式,其中,触控操作可以包括滑动触控操作、按压触控操作、手势触控操作、长按触控操作、点击触控操作、拖动触控操作等。需要说明的是,本公开对于第二集合查看操作/第二文本查看操作的具体形式并不做特殊限定。
举例而言,如图12所示,响应作用于第二关联词“奖励”对应的关联位置1210的第二集合查看操作,显示第二关联词对应的第二文本集合1220,响应作用于第二关联文本的跳转标识12210的第二文本查看操作,显示跳转标识对应的第二关联文本1230“用户页面中的昵称如何修改?”以及与第二关联文本相关的内容“有什么可以帮助您的呢?”。
通过上述步骤S1110~S1120,可以响应作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合,响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本。
随着软硬件的快速发展,智能客服的应用也逐渐普及。具体的,智能客服是在大规模知识处理的基础上发展的应用,其包括大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段。例如,在一些电子商务平台中,用户在提出问题之后,可以由智能客服对用户的问题进行解答,快速解决用户问题,提高用户体验。
在本公开的一种示例实施例中,如图13所示,可以获取用户输入的用户问题,并将用户问题输入kafka消息队列,kafka消费者获取kafka消息队列中的用户问题,通过远程过程调用服务调用算法分词服务,通过算法分词服务对用户问题进行分词处理,将分词结果以及分词之间的关联关系存入ElasticSearch(es,一个基于Lucene的搜索服务器);运营人员在获取到新的用户问题之后,可以对用户问题进行分词处理得到关键词,并针对关键词向词云管理后台请求查看词云,词云管理后台获取ElasticSearch中与上述关键词对应的第一关联词与第二关联词(在获取第一关联词与第二关联词时,通过多个线程分别处理),将每个线程的结果进行组装后返回给词云管理后台,对组装后的词云在前端进行渲染后进行展示。
运营人员可以根据关键词以及关键词对应的第一关联词与第二关联词定位用户问题,更好的配置智能客服知识库。举例而言,关键词为“关注”,第一关联词为“页面”“按钮”“点击”,第二关联词为“无法”“打不开”“访问”,此时可以看出用户关注的问题是“关注页面无法打开”的问题,此时可以针对该问题配置只能客服知识库,提升智能客服运营人员的效率,此外,还能够提升智能客服的服务效果。
图14是根据一示例性实施例示出的一种词云展示装置框图。参照图14,该装置包括关键词确定单元1410,第一关联文本确定单元1420、第一关联词确定单元1430和关联词展示单元1440。
其中,关键词确定单元,被配置为执行获取文本以及文本对应的分词结果,根据文本对应的分词结果确定文本对应的关键词;第一关联文本确定单元,被配置为执行根据关键词确定关键词对应的多个第一关联文本;其中,第一关联文本包括关键词与关键词的第一候选关联词;第一关联词确定单元,被配置为执行在关键词与关键词的第一候选关联词之间具有关联关系时,根据第一候选关联词确定关键词的第一关联词;关联词展示单元,被配置为执行展示关键词以及关键词的第一关联词。
在本公开的一种示例性实施例中,基于前述方案,根据文本对应的分词结果确定文本对应的关键词,词云展示装置还包括:关联信息获取单元,被配置为获取文本对应的分词结果中多个候选分词的关联信息;关键词确定单元,被配置为根据关联信息在多个候选分词中确定文本对应的关键词。
在本公开的一种示例性实施例中,基于前述方案,关键词与关键词的第一候选关联词之间具有关联关系,词云展示装置还包括:文本位置获取单元,被配置为获取关键词与第一候选关联词在第一关联文本中的文本位置;第一关联关系确定单元,被配置为在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系。
在本公开的一种示例性实施例中,基于前述方案,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系,词云展示装置还包括:第二关联关系确定单元,被配置为在关键词与第一候选关联词处于相邻位置且关键词位于第一候选关联词之前时,第一候选关联词具有针对关键词的关联关系。
在本公开的一种示例性实施例中,基于前述方案,在关键词与第一候选关联词处于相邻位置时,关键词与第一候选关联词具有关联关系,词云展示装置还包括:第三关联关系确定单元,被配置为在关键词与第一候选关联词处于相邻位置且关键词位于第一候选关联词之后时,关键词具有针对第一候选关联词的关联关系。
在本公开的一种示例性实施例中,基于前述方案,根据第一候选关联词确定关键词的第一关联词,词云展示装置还包括:第一候选关联词排序单元,被配置为根据第一候选关联词在第一关联文本中的出现频次对第一候选关联词进行排序得到排序结果;第一关联词确定子单元,被配置为根据排序结果在第一候选关联词中确定关键词的第一关联词。
在本公开的一种示例性实施例中,基于前述方案,关键词的关联词包括第一关联词与第二关联词,其中,第二关联词为第一关联词的关联词,根据排序结果在候选关联词中确定关键词的第一关联词,词云展示装置还包括:第二关联文本确定单元,被配置为根据第一关联词确定第一关联词对应的多个第二关联文本;其中,第二关联文本中包括第一关联词与第一关联词的第二候选关联词;第二关联词确定单元,被配置为在第一关联词与第一关联词的第二候选关联词之间具有关联关系时,根据第二候选关联词确定第一关联词的第二关联词。
在本公开的一种示例性实施例中,基于前述方案,根据第二候选关联词确定第一关联词的第二关联词,词云展示装置还包括:第二候选关联词排序单元,被配置为根据第二候选关联词在第二关联文本中的出现频次对第二候选关联词进行排序得到排序结果;第二关联词确定子单元,被配置为根据排序结果在第二候选关联词中确定第一关联词的第二关联词。
在本公开的一种示例性实施例中,基于前述方案,展示关键词以及关键词的第一关联词,词云展示装置还包括:第一词云查看操作响应单元,被配置为响应作用于关键词对应的关联位置的第一词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的外层展示位置展示关键词的第一关联词;其中,关键词与第一关联词通过标识线连接。
在本公开的一种示例性实施例中,基于前述方案,词云展示装置还包括:第一集合查看操作响应单元,被配置为响应作用于第一关联词对应的关联位置的第一集合查看操作,显示第一关联词对应的第一文本集合;其中,第一文本集合包括多个第一关联文本的相关信息以及第一关联文本的跳转标识;第一文本查看操作响应单元,被配置为响应作用于第一关联文本的跳转标识的第一文本查看操作,显示跳转标识对应的第一关联文本。
在本公开的一种示例性实施例中,基于前述方案,展示关键词以及关键词的第一关联词,词云展示装置还包括:第二词云查看操作响应单元,被配置为响应作用于关键词对应的关联位置的第二词云查看操作,在词云画布的中心展示位置展示关键词,在词云画布的次外层展示位置展示关键词的第一关联词,在词云画布的外层展示位置展示第二关联词;其中,关键词与第一关联词通过标识线连接,第一关联词与第二关联词通过标识线连接。
在本公开的一种示例性实施例中,基于前述方案,词云展示装置还包括:第二集合查看操作响应单元,被配置为响应作用于第二关联词对应的关联位置的第二集合查看操作,显示第二关联词对应的第二文本集合;其中,第二文本集合包括多个第二关联文本的相关信息以及第二关联文本的跳转标识;第二文本查看操作响应单元,被配置为响应作用于第二关联文本的跳转标识的第二文本查看操作,显示跳转标识对应的第二关联文本。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
下面参照图15来描述根据本公开的这种实施例的电子设备1500。图15显示的电子设备1500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图15所示,电子设备1500以通用计算设备的形式表现。电子设备1500的组件可以包括但不限于:上述至少一个处理单元1510、上述至少一个存储单元1520、连接不同系统组件(包括存储单元1520和处理单元1510)的总线1530、显示单元1540。
其中,存储单元存储有程序代码,程序代码可以被处理单元1510执行,使得处理单元1510执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,处理单元1510可以执行如图1中所示的步骤S110,获取文本以及文本对应的分词结果,根据文本对应的分词结果确定文本对应的关键词;步骤S120,根据关键词确定关键词对应的多个第一关联文本;其中,第一关联文本包括关键词与关键词的第一候选关联词;步骤S130,在关键词与关键词的第一候选关联词之间具有关联关系时,根据第一候选关联词确定关键词的第一关联词;步骤S140,展示关键词以及关键词的第一关联词。
又如,电子设备可以实现如图1所示的各个步骤。
存储单元1520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1521和/或高速缓存存储单元1522,还可以进一步包括只读存储单元(ROM)1523。
存储单元1520还可以包括具有一组(至少一个)程序模块1525的程序/实用工具1524,这样的程序模块1525包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1500也可以与一个或多个外部设备1570(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1500交互的设备通信,和/或与使得该电子设备1500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1550进行。并且,电子设备1500还可以通过网络适配器1560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1560通过总线1530与电子设备1500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器,上述指令可由装置的处理器执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述实施例中的词云展示方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种词云展示方法,其特征在于,包括:
获取文本以及所述文本对应的分词结果,根据所述文本对应的分词结果确定所述文本对应的关键词;
根据所述关键词确定所述关键词对应的多个第一关联文本;其中,所述第一关联文本包括关键词与所述关键词的第一候选关联词;
在所述关键词与所述关键词的第一候选关联词之间具有关联关系时,根据所述第一候选关联词确定所述关键词的第一关联词;
展示所述关键词以及所述关键词的第一关联词。
2.根据权利要求1所述的词云展示方法,其特征在于,所述关键词与所述关键词的第一候选关联词之间具有关联关系的步骤包括:
获取所述关键词与所述第一候选关联词在所述第一关联文本中的文本位置;
在所述关键词与所述第一候选关联词处于相邻位置时,所述关键词与所述第一候选关联词具有关联关系。
3.根据权利要求2所述的词云展示方法,其特征在于,所述在所述关键词与所述第一候选关联词处于相邻位置时,所述关键词与所述第一候选关联词具有关联关系的步骤包括:
在所述关键词与所述第一候选关联词处于相邻位置且所述关键词位于所述第一候选关联词之前时,所述第一候选关联词具有针对所述关键词的关联关系。
4.根据权利要求1所述的词云展示方法,其特征在于,所述根据所述第一候选关联词确定所述关键词的第一关联词的步骤包括:
根据所述第一候选关联词在所述第一关联文本中的出现频次对所述第一候选关联词进行排序得到排序结果;
根据所述排序结果在所述第一候选关联词中确定所述关键词的第一关联词。
5.根据权利要求4所述的词云展示方法,其特征在于,所述关键词的关联词包括第一关联词与第二关联词,其中,所述第二关联词为所述第一关联词的关联词,所述根据所述排序结果在所述候选关联词中确定所述关键词的第一关联词的步骤包括:
根据所述第一关联词确定所述第一关联词对应的多个第二关联文本;其中,所述第二关联文本中包括第一关联词与所述第一关联词的第二候选关联词;
在所述第一关联词与所述第一关联词的第二候选关联词之间具有关联关系时,根据所述第二候选关联词确定所述第一关联词的第二关联词。
6.根据权利要求5所述的词云展示方法,其特征在于,所述根据所述第二候选关联词确定所述第一关联词的第二关联词的步骤包括:
根据所述第二候选关联词在所述第二关联文本中的出现频次对所述第二候选关联词进行排序得到排序结果;
根据所述排序结果在所述第二候选关联词中确定所述第一关联词的第二关联词。
7.一种词云展示装置,其特征在于,包括:
关键词确定单元,被配置为执行获取文本以及所述文本对应的分词结果,根据所述文本对应的分词结果确定所述文本对应的关键词;
第一关联文本确定单元,被配置为执行根据所述关键词确定所述关键词对应的多个第一关联文本;其中,所述第一关联文本包括关键词与所述关键词的第一候选关联词;
第一关联词确定单元,被配置为执行在所述关键词与所述关键词的第一候选关联词之间具有关联关系时,根据所述第一候选关联词确定所述关键词的第一关联词;
关联词展示单元,被配置为执行展示所述关键词以及所述关键词的第一关联词。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令,以实现如权利要求1至6中任一项所述的词云展示方法。
9.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的词云展示方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至6任一项所述的词云展示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111256319.7A CN113987374A (zh) | 2021-10-27 | 2021-10-27 | 词云展示方法、装置、电子设备、介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111256319.7A CN113987374A (zh) | 2021-10-27 | 2021-10-27 | 词云展示方法、装置、电子设备、介质及产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113987374A true CN113987374A (zh) | 2022-01-28 |
Family
ID=79742631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111256319.7A Pending CN113987374A (zh) | 2021-10-27 | 2021-10-27 | 词云展示方法、装置、电子设备、介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113987374A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009086771A (ja) * | 2007-09-27 | 2009-04-23 | Nomura Research Institute Ltd | 検索サービス装置 |
KR20100068532A (ko) * | 2008-12-15 | 2010-06-24 | 한국전자통신연구원 | 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법 |
CN105760508A (zh) * | 2016-02-23 | 2016-07-13 | 北京搜狗科技发展有限公司 | 一种信息推送方法、装置及电子设备 |
CN106227735A (zh) * | 2016-07-11 | 2016-12-14 | 苏州天梯卓越传媒有限公司 | 一种用于出版行业的词云选题方法及系统 |
CN109815479A (zh) * | 2018-12-14 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 标签展示方法、装置、计算机设备及存储介质 |
CN109933805A (zh) * | 2019-03-26 | 2019-06-25 | 深圳Tcl数字技术有限公司 | 文本解析方法、系统及计算机可读存储介质 |
CN110704578A (zh) * | 2019-10-09 | 2020-01-17 | 精硕科技(北京)股份有限公司 | 关联关系确定方法、装置、电子设备及可读存储介质 |
CN111046135A (zh) * | 2019-11-04 | 2020-04-21 | 智器云南京信息科技有限公司 | 非结构文本处理方法、装置、计算机设备、存储介质 |
CN111694946A (zh) * | 2020-05-27 | 2020-09-22 | 平安银行股份有限公司 | 文本关键词可视化显示方法、装置及计算机设备 |
CN112070550A (zh) * | 2020-09-11 | 2020-12-11 | 汉海信息技术(上海)有限公司 | 基于搜索平台的关键词确定方法、装置、设备及存储介质 |
CN112579912A (zh) * | 2020-12-29 | 2021-03-30 | 湖北亿咖通科技有限公司 | 一种搜索方法、电子设备及计算机存储介质 |
CN112732893A (zh) * | 2021-01-13 | 2021-04-30 | 上海明略人工智能(集团)有限公司 | 文本信息的提取方法和装置、存储介质和电子设备 |
CN113221004A (zh) * | 2021-05-21 | 2021-08-06 | 珠海金山网络游戏科技有限公司 | 一种关键词展示方法及装置 |
-
2021
- 2021-10-27 CN CN202111256319.7A patent/CN113987374A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009086771A (ja) * | 2007-09-27 | 2009-04-23 | Nomura Research Institute Ltd | 検索サービス装置 |
KR20100068532A (ko) * | 2008-12-15 | 2010-06-24 | 한국전자통신연구원 | 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법 |
CN105760508A (zh) * | 2016-02-23 | 2016-07-13 | 北京搜狗科技发展有限公司 | 一种信息推送方法、装置及电子设备 |
CN106227735A (zh) * | 2016-07-11 | 2016-12-14 | 苏州天梯卓越传媒有限公司 | 一种用于出版行业的词云选题方法及系统 |
CN109815479A (zh) * | 2018-12-14 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 标签展示方法、装置、计算机设备及存储介质 |
CN109933805A (zh) * | 2019-03-26 | 2019-06-25 | 深圳Tcl数字技术有限公司 | 文本解析方法、系统及计算机可读存储介质 |
CN110704578A (zh) * | 2019-10-09 | 2020-01-17 | 精硕科技(北京)股份有限公司 | 关联关系确定方法、装置、电子设备及可读存储介质 |
CN111046135A (zh) * | 2019-11-04 | 2020-04-21 | 智器云南京信息科技有限公司 | 非结构文本处理方法、装置、计算机设备、存储介质 |
CN111694946A (zh) * | 2020-05-27 | 2020-09-22 | 平安银行股份有限公司 | 文本关键词可视化显示方法、装置及计算机设备 |
CN112070550A (zh) * | 2020-09-11 | 2020-12-11 | 汉海信息技术(上海)有限公司 | 基于搜索平台的关键词确定方法、装置、设备及存储介质 |
CN112579912A (zh) * | 2020-12-29 | 2021-03-30 | 湖北亿咖通科技有限公司 | 一种搜索方法、电子设备及计算机存储介质 |
CN112732893A (zh) * | 2021-01-13 | 2021-04-30 | 上海明略人工智能(集团)有限公司 | 文本信息的提取方法和装置、存储介质和电子设备 |
CN113221004A (zh) * | 2021-05-21 | 2021-08-06 | 珠海金山网络游戏科技有限公司 | 一种关键词展示方法及装置 |
Non-Patent Citations (6)
Title |
---|
HONGJIANG YUE: "Visualization the Subject Structure of Internatioanal Management Science by Co-word Analysis", 2011 INTERNATIONAL CONFERENCE ON INFORMATION MANAGEMENT, INNOVATION MANAGEMENT AND INDUSTRIAL ENGINEERING, 27 November 2011 (2011-11-27), pages 129 - 132, XP032083746, DOI: 10.1109/ICIII.2011.314 * |
刘爱琴;王友林;尚珊;: "基于爬虫技术的关键词关联推荐算法优化与实现", 情报理论与实践, no. 04, 27 April 2018 (2018-04-27), pages 134 - 138 * |
周杰;刘玉琴;曾建勋;: "学术研究主体与研究内容间的关联关系可视化方法", 现代图书情报技术, no. 11, 25 November 2012 (2012-11-25), pages 92 - 97 * |
张琦: "专利地图服务系统的研究与应用", 《中国优秀硕士学位论文全文数据库·信息科技辑》, 15 September 2021 (2021-09-15), pages 1 - 59 * |
石丹;高彩丽;: "基于Citespace的普惠金融可视化分析", 财会月刊, no. 36, 11 December 2017 (2017-12-11), pages 115 - 123 * |
程铭: "智能制造文献分析系统的研究与实现", 《中国优秀硕士学位论文全文数据库·信息科技辑》, 15 January 2019 (2019-01-15), pages 1 - 57 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595494B (zh) | 答复信息的获取方法及装置 | |
US10360305B2 (en) | Performing linguistic analysis by scoring syntactic graphs | |
CN102163198B (zh) | 提供新词或热词的方法及系统 | |
US9275042B2 (en) | Semantic clustering and user interfaces | |
WO2018224034A1 (zh) | 智能问答方法、服务器、终端及存储介质 | |
US8676565B2 (en) | Semantic clustering and conversational agents | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
WO2017036047A1 (zh) | 信息提取方法和信息提取装置 | |
CN110364146A (zh) | 语音识别方法、装置、语音识别设备及存储介质 | |
CN106126524B (zh) | 信息推送方法和装置 | |
CN108133058B (zh) | 一种视频检索方法 | |
EP2569716A1 (en) | Semantic clustering | |
CN110334268B (zh) | 一种区块链项目热词生成方法以及装置 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN109819015A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN111400473A (zh) | 意图识别模型的训练方法及装置、存储介质及电子设备 | |
CN111881283A (zh) | 一种业务关键词库创建方法、智能聊天引导方法及装置 | |
CN113704507A (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN112231554A (zh) | 一种搜索推荐词生成方法、装置、存储介质和计算机设备 | |
CN114254158A (zh) | 视频生成方法及其装置、神经网络的训练方法及其装置 | |
CN111931034A (zh) | 数据搜索方法、装置、设备及存储介质 | |
CN113987374A (zh) | 词云展示方法、装置、电子设备、介质及产品 | |
CN115269961A (zh) | 内容搜索方法以及相关设备 | |
CN112507214B (zh) | 基于用户名的数据处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |