一种对信息进行处理的方法及装置
技术领域
本发明涉及互联网通信领域,特别涉及一种对信息进行处理的方法及装置。
背景技术
应用商店是一种用于发布、下载应用的平台,技术人员可以将自己开发的应用发布到应用商店上,用户可以从应用商店上下载应用开发商发布的应用。应用商店还提供一个用户评论功能,用户可以通过该用户评论功能对自己下载的应用进行评论。
目前应用开发商为了能准确地把握用户的需求,应用开发商从应用商店中获取用户对其自己应用进行评论的评论信息;然后,应用开发商安排技术人员去查看获取的这些评论信息,并从这些评论信息中分析出用户对其应用提出的观点和问题;其次,应用开发商可以根据用户提出的问题和观点,不断地对其自己应用进行改进并产生新版本的应用;最后,将新版本的应用发布到应用商店,供用户下载或更新。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
目前由人工对用户的评论信息进行处理,对信息处理的效率低下,在大数据时代每天都产生几百几千甚至上万条用户的评论信息,人工处理方式已无法满足需求。
发明内容
为了提高对信息处理的效率,本发明提供了一种对信息处理的方法及装置。所述技术方案如下:
一种对信息进行处理的方法,所述方法包括:
获取目标信息集合;
根据所述目标信息集合中的各网络信息的信息内容,对所述目标信息集合中的网络信息进行聚类得到信息聚类,所述信息聚类包括信息内容满足预设相似性条件的网络信息;
对所述信息聚类包括的各网络信息进行文本语义分析,得到所述信息聚类对应的至少一个标签信息,所述至少一个标签信息用于描述所述信息聚类中的网络信息所表达的语义;
显示所述信息聚类对应的标签信息;
获取用户选择的标签信息,以及获取所述用户选择的标签信息对应的信息聚类;
显示所述获取的信息聚类。
一种对信息进行处理的装置,所述装置包括:
第一获取模块,用于获取目标信息集合;
聚类模块,用于根据所述目标信息集合中的各网络信息的信息内容,对所述目标信息集合中的网络信息进行聚类得到信息聚类,所述信息聚类包括信息内容满足预设相似性条件的网络信息;
分析模块,用于对所述信息聚类包括的各网络信息进行文本语义分析,得到所述信息聚类对应的至少一个标签信息,所述至少一个标签信息用于描述所述信息聚类中的网络信息所表达的语义;
第一显示模块,用于显示所述信息聚类对应的标签信息;
第二获取模块,用于获取用户选择的标签信息,以及获取所述用户选择的标签信息对应的信息聚类;
第二显示模块,用于显示所述获取的信息聚类。
在本发明实施例中,通过对该信息聚类包括的各网络信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,而该至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义,即通过该至少一个标签信息来反应用户对应用等所表达的问题和观点,如此可以自动地对网络信息进行分析,得到用户反应的评价、问题和观点,提高了对网络信息进行处理的效率,满足大数据时代对信息处理效率的需求。
附图说明
图1是本发明实施例1提供的一种对信息进行处理的方法流程图;
图2-1是本发明实施例2提供的一种对信息进行处理的方法流程图;
图2-2是本发明实施例2提供的一种评论界面示意图;
图2-3是本发明实施例2提供的一种设置界面示意图;
图2-4是本发明实施例2提供的用于显示标签信息的饼状图;
图2-5是本发明实施例2提供的用于显示标签信息的云状图;
图3是本发明实施例3提供的一种对信息进行处理的方法流程图;
图4是本发明实施例4提供的一种对信息进行处理的装置结构示意图;
图5是本发明实施例5提供的终端结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图1,本发明实施例提供了一种对信息进行处理的方法,包括:
步骤101:获取目标信息集合。
步骤102:根据目标信息集合中的各网络信息的信息内容,对目标信息集合中的网络信息进行聚类得到信息聚类,信息聚类包括信息内容满足预设相似性条件的网络信息。
步骤103:对该信息聚类包括的各网络信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义。
步骤104:显示该信息聚类对应的标签信息。
步骤105:获取用户选择的标签信息,以及获取用户选择的标签信息对应的信息聚类。
步骤106:显示获取的信息聚类。
在本发明实施例中,通过对该信息聚类包括的各网络信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,而该至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义,即通过该至少一个标签信息来反应用户对应用等所表达的问题和观点,如此可以自动地对网络信息进行分析,得到用户反应的评价、问题和观点,提高了对网络信息进行处理的效率,满足大数据时代对信息处理效率的需求。
实施例2
本发明实施例提供了一种对信息进行处理的方法。在本发明实施例中,信息为应用推广平台中存储的用户对应用的评论信息,参见图2-1,通过本发明实施例提供的方法可以对某个应用的评论信息进行处理,该方法包括:
步骤201:从应用推广平台中获取应用的目标信息集合,该目标信息集合中包括用户对该应用进行评论的评论信息。
应用推广平台是应用发布和下载的平台,各应用开发商将自己开发的应用发布到应用推广平台,用户可以在该应用推广平台上下载应用开发商发布的应用,例如,在目前应用推广平台可以为应用商店,像像ios操作系统的App store、安卓系统的应用宝等。应用推广平台还为每个应用提供一个评论接口,用户可以通过该评论接口来评论该应用,应用推广平台获取用户对该应用进行评论的评论信息,然后存储该评论信息。用户的评论信息可以包括该应用的应用标识、评论内容、该应用的版本、评论时间、评分、该用户所在的国家和该评论信息的来源等。
目前的应用推广平台包括多种,像ios操作系统的App store、安卓系统的应用宝等。如果用户在App store上评论某个应用,该用户的评论信息包括的该评论信息的来源为App store;同样,如果用户在应用宝上评论某个应用,该用户的评论信息中包括的该评论信息的来源为应用宝。
例如,参见图2-2,用户可以利用App store提供的评论接口对应用进行评论,具体过程为:App store为该应用提供的一个界面,该界面中包括三个按钮,分别为“详细信息”、“评论”和“相关信息”;用户可以在移动终端上显示该界面,然后点击该界面中“评论”按钮,移动终端便打开评论界面,该评论界面中包括“撰写评论”和其他用户评论的评论信息;如果用户想对该应用进行评论,用户可以点击“撰写评论”的按钮,然后移动终端打开该按钮对应的界面,用户可以在该界面中撰写评论内容;App store可以获取该应用的应用标识、用户评论的评论内容、评论时间等评论信息,然后将该评论信息存储起来。
本步骤可以为:向应用推广平台发送获取请求消息,该获取请求消息携带应用的应用标识,使应用推广平台根据该应用的应用标识,从自身存储的各应用的评论信息中获取该应用的评论信息,即从自身存储的各应用的评论信息中获取包括该应用的应用标识的评论信息,包括该应用的应用标识的评论信息为该应用的评论信息,接收应用推广平台发送的该应用的评论信息并将接收的评论信息组成目标信息集合。
步骤202:对目标信息集合中的评论信息中的各信息字段进行划分,存储各信息字段中的信息。
从应用推广平台获取得到的评论信息包括应用标识、评论内容、应用版本、评论时间、评分、用户所在的国家和该评论信息的来源等信息字段;从应用推广平台直接获取到的评论信息是一条整体字符串,该字符串中整合了各信息字段,在该字符串中各信息字段之间可以用预设符号隔开,预设符号可以为空格等。例如,对于某条评论信息“A应用我替A应用说句公道话,A应用已经很好了,收过一分线吗?V5.0 2015-5-19 80分中国App store”,从应用推广平台中获取到该条该评论信息为一个整体字符串,各信息字段中用空格符号隔开。
在本步骤中,可以将目标信息集合中的评论信息分配给多个预处理服务器,由每个预处理服务器分别对分配的评论信息中的各信息字段进行划分,然后将划分的各信息字段存储在信息列表中。
其中,对于每条评论信息,由于在该评论信息中各信息字段用预设符号隔开,所以预处理服务器在对评论信息进行划分时,预处理服务器可以从该评论信息中找出预设符号,在预设符号处对该评论信息进行划分,得到该评论信息包括的信息字段。
在信息列表中每列对应一个信息字段,每个信息字段中的信息分别存储在每个信息字段对应的列中,且信息列表中的每一行的信息为一条评论信息。例如,对于评论信息“A应用我替A应用说句公道话,A应用已经很好了,收过一分线吗?V5.0 2015-5-19 80分中国App store”,对该评论信息划分出的信息字段包括应用标识“A应用”、评论内容“A应用我替A应用说句公道话,A应用已经很好了,收过一分线吗?”、应用版本“V5.0”、评论时间“2015-5-19”、评分“80分”、用户的国家“中国”和来源“App store”,然后在如表1所示的信息列表中,将划分的各信息字段的信息存储在各信息字段对应的列中。
表1
由于从应用推广平台中获取的评论信息都为整条字符串,如果不对评论信息中的各信息字段进行划分分开存储,在后续对评论信息进行处理时会带来很多不便,降低处理信息的效率。而在本步骤中,对评论信息的各信息字段进行划分,在后续对评论信息中的各信息字段进行处理时,可以直接从信息列表中读取相应信息,从而可以提高处理信息的效率。另外,在本步骤中,可以将目标信息集合中的评论信息分配给多个预处理服务器,由各预处理服务器并行的对各个评论信息进行划分,可以提高划分评论信息的效率。
进一步地,在本发明实施例中,由于将评论信息中各信息字段中的信息分开存储在信息列表中,所以技术人员可以设置一个或多个查询条件,利用设置的查询条件从信息列表中查询相关的评论信息。
例如,参见图2-3所示的设置界面,在该设置界面中技术人员可以设置一个或多个查询件。例如,参见图2-3,可以设置来源为“App store”、国家为“中国”、起始时间为“2015-3-15”、结束时间为“2015-5-19”、版本为“V5.0”,然后点击查询按钮,触发查询命令给终端。
终端当检测到查询按钮触发的查询命令时,从如图2-3所示的设置界面中获取查询条件,包括来源“App store”、国家“中国”、起始时间“2015-3-15”、结束时间“2015-5-19”、版本“V5.0”,根据获取的查询条件,从如表1所示的信息列表中查询出满足该查询条件的评论信息,显示查询出的评论信息。
步骤203:根据存储的各评论信息中的评论内容,对各评论信息进行聚类,得到至少一个信息聚类,信息聚类包括评论内容满足预设相似性条件的评论信息。
在本步骤中,可以采用LDA(Latent Dirichlet Allocation,文档主题生成模型)聚类算法对信息列表中的各评论信息进行聚类。预设相似性条件可以为将涉及同一功能模块的评论信息聚类为一信息聚类。
其中,需要说明的是:应用中包括一个或多个功能模块,用户在对应用进行评论时,经常会对该应用中的某个或某些功能模块进行评论,所以这些评论信息都涉及该应用中的一个或多个功能模块。在采用LDA算法对各评论信息进行聚类时,LDA算法可以自动地将评论内容高度相似的评论信息聚类为一个信息聚类,且LDA算法聚类的信息聚类中的各评论信息基本上对同一功能模块进行评论。
对于每个功能模块,LDA算法可能为该功能模块聚类出多个信息聚类,原因在于:对于每条评论信息,该评论信息表达用户对该评论信息对应的功能模块的评价,例如,用户对某个功能模块的评价可以为“不错”、“方便”、“好用”、“快捷”等,对于涉及同一功能模块的两个评论信息,该两个评论信息对该功能模块所表达的评价可能相差很大,所以该条评论信息的评论内容所表达的语义相差很大,LDA算法在对该两条评论信息进行聚类时,可能将该两条信息聚类在不同的信息聚类中。
例如,假设A应用是一个社交应用,该社交应用中包括的功能模块分别为“短信息”、“朋友圈”、“附近的人”;对于功能模块“短信息”,LDA算法可以将涉及“短信息”以及评论内容所表达的语义高度相似的各评论信息聚为一个信息聚类。例如,存在多条涉及“短信息”的评论信息,该多条评论信息所表达用户的评价可能为“不错”、“好用”、“方便”,由于该多条评论信息都涉及“短信息”且所表达的语义高度相似,所以LDA算法可以将该多条评论信息聚类为一个信息聚类。
在本实施例中,表达语义相似且涉及同一功能模块的评论信息聚类为一个信息聚类,这样可以方便技术人员去查询。例如,技术人员想查看用户对“短信息”的评价为“不错”的评论信息时,终端就可以快速获取“短信息”和“不错”对应的信息聚类,将获取的信息聚类中的信息显示给技术人员,极大地方便技术人员使用。
步骤204:对各信息聚类包括的各评论信息进行文本语义分析,得到各信息聚类对应的至少一个标签信息,信息聚类对应的至少一个标签信息用于描述该信息聚类中的评论信息所表达的语义。
具体地,对于每个信息聚类,通过预设的关键词提取算法从该信息聚类包括的评论信息中提取使用频率满足预设频率条件的关键词;将获取的关键词设置为信息聚类对应的标签信息。
其中,预设的关键词提取算法可以对该信息聚类中的各评论信息的评论内容进行分词,从每条评论内容中获取句子成分为谓语或宾语的分词并将获取的分词作为该信息聚类的关键词,从该信息聚类的关键词中统计获取的每个关键词的数目,即得到每个关键词的使用频率,从该信息聚类的关键词中获取使用频率超过预设频率阈值的关键词或获取使用频率最大的预设数目个关键词。
用户对应用某个功能模块进行评论,该评论信息中用于对功能模块进行评价类的分词最能表达该评论信息所表达的语义,所以对功能模块进行评价类的分词被用户频繁使用,并且可以将对功能模块进行评价类的分词作为信息聚类的关键词,例如,像“不错”、“好用”、“方便”等评价类的分词被用户频繁使用。因此,在本步骤中,可以将信息聚类中的各评论信息中使用频率满足预设频率条件的分词设置为该信息聚类的标签信息。
研究发现,评论内容中的谓语和宾语成分表达了用户对应用的功能模块进行的评价,例如对于评论内容“短信息这个功能不错!”,在该评论内容中“不错”是宾语成分,表达了用户对“短信息”的评价。而用户的评价能够反应出用户对应用提出的问题和观点,所以为了提高关键词提取算法的处理效率,可以设置关键词提取算法仅对评论内容的谓语和宾语进行分析。
步骤205:分别关联各信息聚类和各信息聚类对应的至少一个标签信息。
具体地,可以将各信息聚类和各信息聚类对应的至少一个标签信息存储在信息聚类与标签信息的对应关系中,以实现分别关联各信息聚类和各信息聚类对应的至少一个标签信息。
可以将各信息聚类对应的标签信息显示给技术人员,技术人员可以显示的这些标签信息进行分类,例如,可以将标签信息为正面口碑词和负面口碑词两类。这样终端可以存储一个为正面口碑词的第一标签信息集合和为负面口碑词的第二标签信息集合。
得到各信息聚类的标签信息后,可以保存各信息聚类的标签信息,当技术人员需要标签信息时,可以显示标签信息,如果技术人员想某个标签信息对应的评论信息,可以直接点击该标签信息即可,具体实现过程如下:
步骤206:显示各信息聚类对应的标签信息,接收用户选择的标签信息,获取与该标签信息关联的信息聚类并显示获取的信息聚类中的评论信息。
其中,终端可以根据用户点击的标签信息,从信息聚类与标签信息的对应关系中获取对应的信息聚类。
将各信息聚类对应的标签信息显示给技术人员,这样技术人员可以查看到这些标签信息,根据这些标签信息分析出应用存在的问题。如果详细了解某个问题的评论信息,则可以点击相应的标签信息以请求终端。
其中,终端可以将正面口碑词的第一标签信息集合和负面口碑词的第二标签信息集合分开显示。终端采用图形化的方式显示各信息聚类对应的标签信息,每个标签信息与一图形块相对应,标签信息的使用频率越大,与该标签信息相对应的图形块大小越大。例如,参见图2-4所示的通过饼状图的显示方式进行显示,在饼状图中显示出各标签信息和各标签信息的使用频率,以及在饼状图中每个标签信息对应一个扇形的图形块,标签信息的使用频率越大,与该标签信息相对应的扇形图形块大小越大。或者,参见图2-5所示的通过云状图的显示方式进行显示,在云状图中每个图形块中包含一个标签信息,标签信息的使用频率越大,该标签信息对应的图形块就越大。
在本发明实施例中,通过对该信息聚类包括的各评论信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,而该至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义,即通过该至少一个标签信息来反应用户对应用所表达的问题和观点,如此可以自动地对评论信息进行分析,得到用户反应的评价、问题和观点,提高了对评论信息进行处理的效率,满足大数据时代对信息处理效率的需求。
实施例3
本发明实施例提供了一种对信息进行处理的方法。在本发明实施例中,信息为求职网站中存储的简历信息,参见图3,通过本发明实施例提供的方法可以对简历信息进行处理,该方法包括:
步骤301:从求职网站中获取应用的目标信息集合,该目标信息集合中包括求职网站中存储的简历信息。
本步骤可以为:向求职网站发送获取请求消息,使求职网站获取存储的简历信息,接收求职网站发送的简历信息并将接收的简历信息组成目标信息集合。
步骤302:对目标信息集合中的简历信息中的各信息字段进行划分,存储各信息字段中的信息。
从求职网站获取得到的简历信息包括信息来源、求职的职业、毕业院校、专业、工作过的岗位等信息字段;从求职网站直接获取到的简历信息是一条整体字符串,该字符串中整合了各信息字段,在该字符串中各信息字段之间可以用预设符号隔开,预设符号可以为空格等。
在本步骤中,可以将目标信息集合中的简历信息分配给多个预处理服务器,由每个预处理服务器分别对分配的简历信息中的各信息字段进行划分,然后将划分的各信息字段存储在信息列表中。
其中,对于每条简历信息,由于在该简历信息中各信息字段用预设符号隔开,所以预处理服务器在对简历信息进行划分时,预处理服务器可以从该简历信息中找出预设符号,在预设符号处对该简历信息进行划分,得到该简历信息包括的信息字段。
由于从求职网站中获取的简历信息都为整条字符串,如果不对简历信息中的各信息字段进行划分分开存储,在后续对简历信息进行处理时会带来很多不便,降低处理信息的效率。而在本步骤中,对简历信息的各信息字段进行划分,在后续对简历信息中的各信息字段进行处理时,可以直接从信息列表中读取相应信息,从而可以提高处理信息的效率。另外,在本步骤中,可以将目标信息集合中的简历信息分配给多个预处理服务器,由各预处理服务器并行的对各个简历信息进行划分,可以提高划分简历信息的效率。
进一步地,在本发明实施例中,由于将简历信息中各信息字段中的信息分开存储在信息列表中,所以各招聘公司的人事可以设置一个或多个查询条件,利用设置的查询条件从信息列表中查询相关的简历信息。
例如,人事可以设置毕业院校为“清华大学”、求职职业为“程序员”、触发查询命令给终端。终端当检测到查询命令时,获取查询条件,包括来毕业院校为“清华大学”、求职职业为“程序员”,根据获取的查询条件,从信息列表中查询出满足该查询条件的简历信息,显示查询出的简历信息。
步骤303:根据存储的各简历信息,对各简历信息进行聚类,得到至少一个信息聚类,信息聚类包括信息内容满足预设相似性条件的简历信息。
在本步骤中,可以采用LDA聚类算法对信息列表中的各简历信息进行聚类。预设相似性条件可以为将涉及同一求职职业的简历信息聚类为一信息聚类。
其中,需要说明的是:在采用LDA算法对各简历信息进行聚类时,LDA算法可以自动地将信息内容高度相似的简历信息聚类为一个信息聚类,且LDA算法聚类的信息聚类中的各简历信息基本上对同一求职职业的简历信息。
在本实施例中,对同一求职职业的简历信息聚类为一个信息聚类,这样招骋公司的人事去查询。例如,人事想查看求职职业为“程序员”的简历信息时,终端就可以快速获取“程序员”对应的信息聚类,将获取的信息聚类中的信息显示给人事,极大地方便人事使用。
步骤304:对各信息聚类包括的各简历信息进行文本语义分析,得到各信息聚类对应的至少一个标签信息,信息聚类对应的至少一个标签信息用于描述该信息聚类中的简历信息所表达的语义。
具体地,对于每个信息聚类,通过预设的关键词提取算法从该信息聚类包括的简历信息中提取使用频率满足预设频率条件的关键词;将获取的关键词设置为信息聚类对应的标签信息。
其中,预设的关键词提取算法可以对该信息聚类中的各简历信息进行分词,得到该信息聚类的关键词,从该信息聚类的关键词中统计获取的每个关键词的数目,即得到每个关键词的使用频率,从该信息聚类的关键词中获取使用频率超过预设频率阈值的关键词或获取使用频率最大的预设数目个关键词。
对于简历信息,简历信息中的求职职业、毕业院校、已工作过的岗位等词语在各用户简历中频繁出现,而这些词语都是用于表达简历的内容,因此,在本步骤中,可以将信息聚类中的各简历信息中使用频率满足预设频率条件的词语设置为该信息聚类的标签信息。
步骤305:分别关联各信息聚类和各信息聚类对应的至少一个标签信息。
具体地,可以将各信息聚类和各信息聚类对应的至少一个标签信息存储在信息聚类与标签信息的对应关系中,以实现分别关联各信息聚类和各信息聚类对应的至少一个标签信息。
步骤306:显示各信息聚类对应的标签信息,接收用户选择的标签信息,获取与该标签信息关联的信息聚类并显示获取的信息聚类中的简历信息。
其中,终端可以根据用户点击的标签信息,从信息聚类与标签信息的对应关系中获取对应的信息聚类。
将各信息聚类对应的标签信息显示给人事,这样人事可以查看到这些标签信息,如果详细了解某个标签信息对应的简历信息,则可以点击相应的标签信息以请求终端。例如,人事想详细了解“程序员”这个职业的简历信息,可以点击“程序员”这个标签信息,然后终端将“程序员”对应的信息聚类中的简历信息显示给人事。
在本发明实施例中,通过对该信息聚类包括的各简历信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,而该至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义,即通过该至少一个标签信息来反应求职人员的求职情况,如此可以自动地对简历信息进行分析,得到求职人员的求职情况,方便人事人员进行查询,提高了对信息进行处理的效率,满足大数据时代对信息处理效率的需求。
实施例4
参见图4,本发明实施例提供了一种对信息进行处理的装置,所述装置包括:
第一获取模块401,用于获取目标信息集合;
聚类模块402,用于根据所述目标信息集合中的各网络信息的信息内容,对所述目标信息集合中的网络信息进行聚类得到信息聚类,所述信息聚类包括信息内容满足预设相似性条件的网络信息;
分析模块403,用于对所述信息聚类包括的各网络信息进行文本语义分析,得到所述信息聚类对应的至少一个标签信息,所述至少一个标签信息用于描述所述信息聚类中的网络信息所表达的语义;
第一显示模块404,用于显示所述信息聚类对应的标签信息;
第二获取模块405,用于获取用户选择的标签信息,以及获取所述用户选择的标签信息对应的信息聚类;
第二显示模块406,用于显示所述获取的信息聚类。
可选的,所述分析模块403包括:
提取单元,用于通过预设的关键词提取算法从所述信息聚类包括的网络信息中提取使用频率满足预设频率条件的关键词;
设置单元,用于将所述获取的关键词设置为所述信息聚类对应的标签信息。
可选的,所述提取单元,用于通过预设的关键词提取算法从所述信息聚类包括的网络信息中提取使用频率最大的预设数目个关键词或使用频率超过预设阈值的关键词。
可选的,所述第一显示模块404,用于采用图形化的方式显示所述信息聚类对应的标签信息,所述标签信息与一图形块相对应,所述标签信息的使用频率越大,与所述标签信息相对应的图形块大小越大。
进一步地,所述所述装置还包括:
划分模块,用于对所述信息集合中的各网络信息包括的信息字段进行划分,将所述各网络信息包括的各信息字段存储在信息列表中,且所述各信息字段分别对应所述信息列表中的一列;
第三获取模块,用于获取用户设置的查询条件,根据所述查询条件,从所述信息列表中查询满足所述查询条件的网络信息;
第三显示模块,用于显示所述查询的网络信息。
在本发明实施例中,通过对该信息聚类包括的各网络信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,而该至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义,即通过该至少一个标签信息来反应用户对应用等所表达的问题和观点,如此可以自动地对网络信息进行分析,得到用户反应的评价、问题和观点,提高了对网络信息进行处理的效率,满足大数据时代对信息处理效率的需求。
实施例5
参见图5,其示出了本发明实施例所涉及的终端结构示意图,该终端可以为上述客户端提供硬件运行环境,用于实施上述实施例中提供的防护数据库的方法。具体来讲:
终端900可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WiFi(wireless fidelity,无线保真)模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图5中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,RF电路110包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband CodeDivision Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。
存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端900的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端900的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图5中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端900还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端900移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端900还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端900之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端900的通信。
WiFi属于短距离无线传输技术,终端900通过WiFi模块170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块170,但是可以理解的是,其并不属于终端900的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端900的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端900的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端900还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端900还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端900的显示单元是触摸屏显示器,终端900还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行述一个或者一个以上程序包含用于进行以下操作的指令:
获取目标信息集合;
根据所述目标信息集合中的各网络信息的信息内容,对所述目标信息集合中的网络信息进行聚类得到信息聚类,所述信息聚类包括信息内容满足预设相似性条件的网络信息;
对所述信息聚类包括的各网络信息进行文本语义分析,得到所述信息聚类对应的至少一个标签信息,所述至少一个标签信息用于描述所述信息聚类中的网络信息所表达的语义;
显示所述信息聚类对应的标签信息;
获取用户选择的标签信息,以及获取所述用户选择的标签信息对应的信息聚类;
显示所述获取的信息聚类。
可选的,所述对所述信息聚类包括的各网络信息进行文本语义分析,得到所述信息聚类对应的至少一个标签信息,包括:
通过预设的关键词提取算法从所述信息聚类包括的网络信息中提取使用频率满足预设频率条件的关键词;
将所述获取的关键词设置为所述信息聚类对应的标签信息。
可选的,所述通过预设的关键词提取算法从所述信息聚类包括的网络信息中提取使用频率满足预设频率条件的关键词,包括:
通过预设的关键词提取算法从所述信息聚类包括的网络信息中提取使用频率最大的预设数目个关键词或使用频率超过预设阈值的关键词。
可选的,所述显示所述信息聚类对应的标签信息,包括:
采用图形化的方式显示所述信息聚类对应的标签信息,所述标签信息与一图形块相对应,所述标签信息的使用频率越大,与所述标签信息相对应的图形块大小越大。
进一步地,所述获取目标目标信息集合之后,还包括:
对所述信息集合中的各网络信息包括的信息字段进行划分,将所述各网络信息包括的各信息字段存储在信息列表中,且所述各信息字段分别对应所述信息列表中的一列;
获取用户设置的查询条件,根据所述查询条件,从所述信息列表中查询满足所述查询条件的网络信息;
显示所述查询的网络信息。
在本发明实施例中,通过对该信息聚类包括的各网络信息进行文本语义分析,得到该信息聚类对应的至少一个标签信息,而该至少一个标签信息用于描述该信息聚类中的网络信息所表达的语义,即通过该至少一个标签信息来反应用户对应用等所表达的问题和观点,如此可以自动地对网络信息进行分析,得到用户反应的评价、问题和观点,提高了对网络信息进行处理的效率,满足大数据时代对信息处理效率的需求。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。