CN107609062A - 应用于终端的信息处理方法及装置 - Google Patents

应用于终端的信息处理方法及装置 Download PDF

Info

Publication number
CN107609062A
CN107609062A CN201710755679.9A CN201710755679A CN107609062A CN 107609062 A CN107609062 A CN 107609062A CN 201710755679 A CN201710755679 A CN 201710755679A CN 107609062 A CN107609062 A CN 107609062A
Authority
CN
China
Prior art keywords
information
content
same nature
queue
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710755679.9A
Other languages
English (en)
Other versions
CN107609062B (zh
Inventor
窦方钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koubei Shanghai Information Technology Co Ltd
Original Assignee
Koubei Shanghai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koubei Shanghai Information Technology Co Ltd filed Critical Koubei Shanghai Information Technology Co Ltd
Priority to CN201710755679.9A priority Critical patent/CN107609062B/zh
Publication of CN107609062A publication Critical patent/CN107609062A/zh
Application granted granted Critical
Publication of CN107609062B publication Critical patent/CN107609062B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种应用于终端的信息处理方法及装置,方法包括:获取至少一条待处理的信息;从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则将该条信息存入内容队列中同质信息的相似信息列表中;若否,则将该条信息存入内容队列中。重复上述对获取的待处理的信息的操作,直至至少一条待处理的信息处理完毕。本发明通过将信息进行比较,判断同质信息,以便对信息进行处理的同时,不影响其它信息的正常处理。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。

Description

应用于终端的信息处理方法及装置
技术领域
本发明涉及软件领域,具体涉及一种应用于终端的信息处理方法及装置。
背景技术
应用软件中提供了用户交互功能,很多应用软件中可以显示用户提交的信息。如口碑、大众点评、知乎等平台的应用软件中可以显示用户对各个店铺评价信息、问答信息等,及聊天类应用软件中可以显示多个用户的群聊信息等。这些信息可能由不同的用户提交,使得显示时就有可能显示多条内容存在重复、同质的信息,使得用户在阅读时造成多条信息内容重复的阅读干扰,如当前页面显示的多条信息均是重复、同质的信息,用户需要多次翻页、下拉等操作才能阅读到不同的信息等。
现有技术一般采用在服务端对同质的信息内容进行处理的方式。通过根据信息包含的内容的同质化数据,对信息进行排序,合理调整其显示分布位置。如对店铺的评论信息内容通过算法进行干预,调整评论信息的显示位置,可以将同质的评论信息分别设置在不同的位置进行显示。但这样处理对于服务端及算法花费的成本较高。同时用户在提交评论信息后,由于其信息同质内容可能被降低排名,导致用户投诉等情况。另外,对于一些实时场景如聊天类应用软件,这种处理方式得到服务器承受巨大的压力,无法实现在服务端进行同质信息的处理。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的应用于终端的信息处理方法及装置。
根据本发明的一个方面,提供了一种应用于终端的信息处理方法,其包括:
步骤S1,获取至少一条待处理的信息;
步骤S2,从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则执行步骤S3;若否,则执行步骤S4;其中,内容队列建立在终端,用于保存信息;
步骤S3,将该条信息存入内容队列中同质信息的相似信息列表中;
步骤S4,将该条信息存入内容队列中;
重复执行以上步骤S2、S3和S4,直至至少一条待处理的信息处理完毕。
可选地,将该条信息存入内容队列中同质信息的相似信息列表中进一步包括:
将该条信息的附加信息存入内容队列中同质信息的相似信息列表中;
在将该条信息的附加信息存入内容队列中同质信息的相似信息列表中之后,方法还包括:在终端界面同质信息的显示条目中追加显示该条信息的附加信息;
在步骤S4之后,方法还包括:生成该条信息的显示条目并在终端界面进行显示。
可选地,在步骤S2之前,方法还包括:
判断用户是否设置去重选项,若是,则执行步骤S2;否则,按照顺序从待处理的信息中依次读取信息,生成信息的显示条目并在终端界面进行显示。
可选地,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息进一步包括:
将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则判定内容队列中存在该条信息的同质信息。
可选地,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息进一步包括:
分别将该条信息的信息内容和内容队列中已保存信息的信息内容进行分词及转化向量处理,得到该条信息的文本向量和内容队列中已保存信息的文本向量;
计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数;
若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则判定内容队列中存在该条信息的同质信息。
可选地,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息进一步包括:
使用编辑距离算法和/或最大公共序列算法计算该条信息的信息内容与内容队列中已保存信息的信息内容的相似度;
若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则判定内容队列中存在该条信息的同质信息。
可选地,获取至少一条待处理的信息进一步包括:
从服务器侧一次性拉取全部待处理的信息;
或者,根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。
可选地,附加信息包括信息的发送方用户信息。
可选地,在步骤S4之前,方法还包括:
判断内容队列是否已存满,若是,则删除内容队列中最早存入的信息。
根据本发明的另一方面,提供了一种应用于终端的信息处理装置,其包括:
获取模块,适于获取至少一条待处理的信息;
比较模块,适于从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则执行第一存储模块;若否,则执行第二存储模块;其中,内容队列建立在终端,用于保存信息;
第一存储模块,适于将该条信息存入内容队列中同质信息的相似信息列表中;
第二存储模块,适于将该条信息存入内容队列中;
循环模块,适于重复执行以上比较模块、第一存储模块和第二存储模块,直至至少一条待处理的信息处理完毕。
可选地,第一存储模块进一步适于:将该条信息的附加信息存入内容队列中同质信息的相似信息列表中;
装置还包括:
第一显示模块,适于在终端界面同质信息的显示条目中追加显示该条信息的附加信息;
第二显示模块,适于生成该条信息的显示条目并在终端界面进行显示。
可选地,装置还包括:
第三显示模块,适于按照顺序从待处理的信息中依次读取信息,生成信息的显示条目并在终端界面进行显示;
选项判断模块,适于判断用户是否设置去重选项,若是,则执行比较模块;否则,执行第三显示模块。
可选地,比较模块进一步包括:
全匹配单元,适于将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则判定内容队列中存在该条信息的同质信息。
可选地,比较模块进一步包括:
向量比较单元,适于分别将该条信息的信息内容和内容队列中已保存信息的信息内容进行分词及转化向量处理,得到该条信息的文本向量和内容队列中已保存信息的文本向量;计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数;若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则判定内容队列中存在该条信息的同质信息。
可选地,比较模块进一步包括:
相似比较单元,适于使用编辑距离算法和/或最大公共序列算法计算该条信息的信息内容与内容队列中已保存信息的信息内容的相似度;若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则判定内容队列中存在该条信息的同质信息。
可选地,获取模块进一步包括:
一次获取单元,适于从服务器侧一次性拉取全部待处理的信息;
一条获取单元,适于根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。
可选地,附加信息包括信息的发送方用户信息。
可选地,装置还包括:
删除模块,适于判断内容队列是否已存满,若是,则删除内容队列中最早存入的信息。
根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述应用于终端的信息处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述应用于终端的信息处理方法对应的操作。
根据本发明提供的应用于终端的信息处理方法及装置,获取至少一条待处理的信息;从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则将该条信息存入内容队列中同质信息的相似信息列表中;若否,则将该条信息存入内容队列中。重复上述对获取的待处理的信息的操作,直至至少一条待处理的信息处理完毕。本发明通过将信息进行比较,判断同质信息,以便对信息进行处理的同时,不影响其它信息的正常处理,进一步,可以提升用户的阅读体验。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的应用于终端的信息处理方法的流程图;
图2示出了根据本发明另一个实施例的应用于终端的信息处理方法的流程图;
图3a和图3b示出了终端界面信息显示画面的示意图;
图4示出了根据本发明一个实施例的应用于终端的信息处理装置的功能框图;
图5示出了根据本发明另一个实施例的应用于终端的信息处理装置的功能框图;
图6示出了根据本发明一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的应用于终端的信息处理方法的流程图。如图1所示,应用于终端的信息处理方法具体包括如下步骤:
步骤S101,获取至少一条待处理的信息。
从服务器侧去获取待处理的信息,这些待处理的信息为还没有在终端进行显示的信息。获取待处理的信息时,除获取待处理的信息的信息内容外,还可以获取待处理信息的发送方用户信息、发送时间等信息。信息的信息内容即显示给用户阅读的主要内容。
步骤S102,从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息。
同质信息即两条或多条信息的信息内容完全匹配或相似度较高。两条或多条信息的信息内容对于用户而言,用户阅读其中任一条信息的信息内容即可。
按照顺序从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较。此处的比较是将该条信息的信息内容与内容队列中已保存的所有信息的信息内容均进行比较,来判断内容队列中是否已存在该条信息的同质信息。若是,则执行步骤S103。若否,则执行步骤S104。若当前内容队列中没有保存信息,则不需要在进行信息内容的比较,直接执行步骤S104。
其中,内容队列建立在终端,其可以保存信息。当用户开启终端的某个应用程序时,为该应用程序在终端建立一个内容队列。在应用程序存活的整个过程中,内容队列也一直存在。
步骤S103,将该条信息存入内容队列中同质信息的相似信息列表中。
若内容队列中已存在该条信息的同质信息,将该条信息存入内容队列中同质信息的相似信息列表中,以便将该条信息作为同质信息的相似信息。具体的,将该条消息的附件信息存入相似信息列表中。附加信息用于满足不同应用程序的不同需求,以供后续在终端进行显示时可以根据不同应用程序的不同需求提供对应的显示效果。
步骤S104,将该条信息存入内容队列中。
若内容队列中不存在该条信息的同质信息时,将该条信息直接存入内容队列中。
步骤S105,判断获取的待处理的信息是否处理完毕。
判断已经获取到的待处理的信息是否已经全部出来完毕,若处理完毕,则该方法结束。否则,重复执行以上步骤S102、S103和/或S104,直至将获取的至少一条待处理的信息处理完毕为止。
根据本发明提供的应用于终端的信息处理方法,获取至少一条待处理的信息;从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则将该条信息存入内容队列中同质信息的相似信息列表中;若否,则将该条信息存入内容队列中。重复上述对获取的待处理的信息的操作,直至至少一条待处理的信息处理完毕。本发明通过将信息进行比较,判断同质信息,以便对信息进行处理的同时,不影响其它信息的正常处理,进一步,可以提升用户的阅读体验。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。
图2示出了根据本发明另一个实施例的应用于终端的信息处理方法的流程图。如图2所示,应用于终端的信息处理方法具体包括如下步骤:
步骤S201,获取至少一条待处理的信息。
在从服务器侧去获取待处理的信息时,可以通过以下两种方式获取。如从服务器侧一次性拉取全部待处理的信息。这种方式适用于评论、问答类等应用程序,比如大众点评提供的用户对店铺的评价信息、知乎提供的用户对提问的回答信息等。由于这些信息在应用程序启动时已经存在于服务器侧,因此,可以从服务器侧一次性的拉取到这些全部待处理的信息。或者,如还可以根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。这种方式适用于聊天类等应用程序,比如群聊时,由于多个用户均是实时的发送发言信息,因此,可以根据用户发送信息的时间(待处理信息的生成时间),从服务器侧依次拉取待处理的信息。
步骤S202,判断用户是否设置去重选项。
考虑到不同用户有不同的阅读需求,因此,通过判断用户是否设置去重选项,满足不同用户的不同需求。若用户设置了去重选项,即用户需要将同质信息进行处理,则执行步骤S204;否则,用户不需要将同质信息进行处理,直接执行步骤S203。
步骤S203,按照顺序从待处理的信息中依次读取信息,生成信息的显示条目并在终端界面进行显示。
在获取到待处理的信息后,按照顺序依次读取其中的信息,生成信息的对应的显示条目,并在终端界面进行显示。
该步骤直接将信息生成对应的显示条目进行显示,而不对信息的信息内容进行其他处理。
步骤S204,按照顺序从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息。
在将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较时,可以采用如下几种比较方式:
如全匹配比较,即将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则判定内容队列中存在该条信息的同质信息。同质信息即与该条信息的信息内容完全匹配的内容队列中的已保存信息。
或者,如相似匹配比较。首先分别将该条信息的信息内容和内容队列中已保存信息的信息内容进行分词处理及转化向量处理,分别得到该条信息的文本向量和内容队列中已保存信息的文本向量。计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数。若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则判定内容队列中存在该条信息的同质信息。同质信息即与该条信息的文本向量的夹角度数小于或等于预设度数阈值的内容队列中的已保存信息。
或者,如使用相似度算法,如使用编辑距离算法、最大公共序列算法等计算该条信息的信息内容与内容队列中已保存信息的信息内容的相似度。若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则判定内容队列中存在该条信息的同质信息。同质信息即与该条信息的信息内容相似度大于或等于预设相似度阈值的内容队列中的已保存信息。
在比较时,可以根据实际情况选择以上一种或多种的比较方式进行比较。实施时,采用的相似度算法不仅限于以上几种,可以实现信息内容相似度比较的算法均可采用。
进一步,在实施时,根据用户的阅读习惯,可以由用户预先设置在判断信息是否为同质信息时使用的预设度数阈值或预设相似度阈值。当用户需求为全部信息内容完全相同时才判断为同质信息,可以使用全匹配比较;当用户需求为大部分信息内容相同时才判断为同质信息,可以将预设相似度阈值设置为80%或更高;当用户需求为一部分信息内容相同时判断为同质信息,可以将预设相似度阈值设置为50%或更低等。具体数值可以由不同用户根据自身的阅读习惯自由设定,避免了在服务器端进行同质信息判断时,只能使用一个统一的阈值或标准进行判断,使得在终端执行时更加灵活多样,更符合用户的实际需求,同时能够减少在服务器端处理不同用户的不同阈值设置而导致的系统运行压力。
为方便用户阅读,减少用户手动设置的麻烦,还可以通过机器学习等算法,根据用户日常阅读同质信息时所花费的时间,得到用户对于同质信息的阅读习惯,如用户在阅读同质信息时花费时间较少或迅速翻页等情况时,可以认为用户在阅读时,当信息内容有一部分相同时会习惯的认为其为同质信息,不会再去仔细阅读同质信息,此时可以自动将预设相似度阈值设置为50%或更低等,方便将大量的同质信息进行处理,使得用户在阅读时可以阅读到更多不同的信息内容。或者还可以根据用户对不同类别的信息的阅读习惯,在显示不同类别的信息时,终端根据用户对不同类别的信息的阅读习惯使用不同的同质信息判断标准。如用户在阅读评论类的信息时,会花费较多阅读,可以将同质信息的判断标准如预设相似度阈值设置为80%或更高。用户在阅读实时聊天群中的信息时,对于“收到”、“收到,谢谢”、“收到,好的”等这种信息时,可以将同质信息的判断标准如预设相似度阈值设置为50%或更低等。
在按照顺序从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较后,根据比较的结果,判断内容队列中是否存在该条信息的同质信息。若是,则执行步骤S205;若否,则执行步骤S207。
其中,内容队列建立在终端,其可以保存信息。当用户开启终端的某个应用程序时,为该应用程序在终端建立一个内容队列。在应用程序存活的整个过程中,内容队列也一直存在。通过在终端建立内容队列判断信息是否为同质信息,加快了同质信息的判断速度。在终端通过建立内容队列进行同质信息的比较时,信息仅需要对内容队列中已保存的信息一一进行比较后即可用于显示,比较的数量有限,处理速度快。但服务器端在判断同质信息时往往需要将服务器端接收到的所有信息进行比较,比较的数量较多,速度慢。服务器端先判断是否同质信息再下发到终端进行显示,与终端直接进行比较后显示相比,效率低。且服务器端判断是否同质信息是往往还需要进行语义分析等更细致的判断,需要消费大量的资源和时间,而在终端判断是否同质信息时可以更加简便,节省了资源和时间。
步骤S205,将该条信息的附加信息存入内容队列中同质信息的相似信息列表中。
若内容队列中已存在该条信息的同质信息,将该条信息的附加信息存入内容队列中同质信息的相似信息列表中,以便将该条信息作为同质信息的相似信息。附加信息用于满足不同应用程序的不同需求,以供后续在终端进行显示时可以根据不同应用程序的不同需求提供对应的显示效果。附加信息可以包括该条信息的发送者用户信息,以便在后续显示时,可以使用户很清楚的了解到同质信息的不同发送者。
进一步,若用户需要查看其它附加信息如发送时间、地址等时,还可以将这些信息也保存在附件信息中。
步骤S206,在终端界面同质信息的显示条目中追加显示该条信息的附加信息。
在终端界面已经显示的同质信息的显示条目中追加显示该条信息的附件信息。具体的效果可以参照附图3a和3b所示。图3a为未经处理的同质信息的显示画面,从图3a中可以看到终端界面显示了多条同质信息,用户在阅读时会阅读多条重复的同质信息,阅读体验不佳。图3b使用应用于终端的信息处理方法进行处理后的显示画面。其中,如附加信息为用户A的信息已经显示在终端界面后,对于该同质信息的相似信息列表中的附加信息为用户B的信息,在终端界面显示时,直接在其同质信息的显示条目中追加显示该条信息的附加信息。即在终端界面显示的用户A后追加用户B进行显示。同理,对于该同质信息的相似信息列表中的附加信息为用户C的信息,在终端界面显示时,直接在其同质信息的显示条目中追加显示该条信息的附加信息。即在终端界面显示的用户A和用户B后追加用户C进行显示,得到如图3b所示的画面。这样使得用户在阅读时可以一目了然的了解到用户A、用户B和用户C均发送了该条信息或与该条信息内容同质的信息内容,且整体的阅读体验友好,减少用户在阅读多条同质信息时需要上下滑动终端界面或翻页等操作。
步骤S207,判断内容队列是否已存满。
若内容队列中不存在该条信息的同质信息,即该条信息为与内容队列中已保存信息不同的信息,需要将该条信息存在内容队列中。但由于内容队列设置在终端,其大小受限。因此,需要先判断内容队列是否已经存满,如判断内容队列的已存储信息的大小,若超过内容队列预设的最大限度,执行步骤S208,否则,执行步骤S209。
步骤S208,删除内容队列中最早存入的信息。
当内容队列已存满时,删除内容队列中最早存入的信息。由于内容队列中已存储的信息在后续都已经在终端界面进行了显示,此时删除最早存入的信息不影响终端界面的显示。且删除的是最早存入的信息,即使待处理的信息中还有其同质的信息,但由于两者之间还存在其他信息,在终端界面显示时,不会呈现多条同质信息显示在一起刷屏的情况,也改善了用户的阅读体验。进一步,删除内容队列中最早存入的信息时,如果最早存入的信息有相似信息列表时,将相似信息列表一并删除。
步骤S209,将该条信息存入内容队列中。
将内容队列中不存在同质信息的该条信息存入内容队列中。
步骤S210,生成该条信息的显示条目并在终端界面进行显示。
生成该条信息的显示条目,显示条目可以包括该条信息的发送者信息、该条信息的信息内容等。并在终端设备将显示条目进行显示。
步骤S211,判断获取的待处理的信息是否处理完毕。
判断已经获取到的待处理的信息是否已经全部出来完毕,若处理完毕,则该方法结束。否则,重复执行以上步骤S204-步骤S210,直至将获取的至少一条待处理的信息处理完毕为止。
根据本发明提供的应用于终端的信息处理方法,在获取至少一条待处理的信息后,判断用户是否设置去重选项,根据用户选择,对信息进行相应的处理,使得处理灵活,满足用户不同需求。在对判断是否同质信息时,依次按照顺序从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息。比较的方式灵活多样,有效的对同质信息进行辨别。若已存在同质信息时,将该条信息的附加信息存入内容队列中同质信息的相似信息列表中,在终端界面同质信息的显示条目中仅追加显示该条信息的附加信息。显示效果使用户一目了然的看到与同质信息相关的各信息内容及附加信息,也减少了用户在阅读多条同质信息时需要上下滑动终端界面或翻页等操作,提升用户的阅读体验。若不存在同质信息时,将该条信息存入内容队列中,为其生成该条信息的显示条目并在终端界面进行显示,不影响其正常的显示。进一步,考虑到内容队列设置在终端,其大小受限的情况,还对内容队列的存储情况进行判断,以避免出现存储溢出等问题。本发明在不影响其它信息的正常显示的情况下,在终端将信息进行比较后,对同质信息的显示进行了处理,大大提升了用户的阅读体验。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。
图4示出了根据本发明一个实施例的应用于终端的信息处理装置的功能框图。如图4所示,应用于终端的信息处理装置包括如下模块:
获取模块4010,适于获取至少一条待处理的信息。
获取模块4010从服务器侧去获取待处理的信息,这些待处理的信息为还没有在终端进行显示的信息。获取模块4010获取待处理的信息时,除获取待处理的信息的信息内容外,还可以获取待处理信息的发送方用户信息、发送时间等信息。信息的信息内容即显示给用户阅读的主要内容。
比较模块4020,适于从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则执行第一存储模块4030;若否,则执行第二存储模块4040。
同质信息即两条或多条信息的信息内容完全匹配或相似度较高。两条或多条信息的信息内容对于用户而言,用户阅读其中任一条信息的信息内容即可。
比较模块4020按照顺序从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较。此处比较模块4020的比较是将该条信息的信息内容与内容队列中已保存的所有信息的信息内容均进行比较,来判断内容队列中是否已存在该条信息的同质信息。若是,则执行第一存储模块4030。若否,则执行第二存储模块4040。若当前内容队列中没有保存信息,则比较模块4020不需要在进行信息内容的比较,直接执行第二存储模块4040。
其中,比较模块4020的内容队列建立在终端,其可以保存信息。当用户开启终端的某个应用程序时,比较模块4020为该应用程序在终端建立一个内容队列。在应用程序存活的整个过程中,内容队列也一直存在。比较模块4020通过在终端建立内容队列判断信息是否为同质信息,加快了同质信息的判断速度。比较模块4020在终端通过建立内容队列进行同质信息的比较时,信息仅需要对内容队列中已保存的信息一一进行比较后即可用于显示,比较的数量有限,处理速度快。但服务器端在判断同质信息时往往需要将服务器端接收到的所有信息进行比较,比较的数量较多,速度慢。服务器端先判断是否同质信息再下发到终端进行显示,与比较模块4020在终端直接进行比较后显示相比,效率低。且服务器端判断是否同质信息是往往还需要进行语义分析等更细致的判断,需要消费大量的资源和时间,而比较模块4020在终端判断是否同质信息时可以更加简便,节省了资源和时间。
第一存储模块4030,适于将该条信息存入内容队列中同质信息的相似信息列表中。
若比较模块4020判断内容队列中已存在该条信息的同质信息,第一存储模块4030将该条信息存入内容队列中同质信息的相似信息列表中,以便将该条信息作为同质信息的相似信息。具体的,第一存储模块4030将该条消息的附件信息存入相似信息列表中。附加信息用于满足不同应用程序的不同需求,以供后续在终端进行显示时可以根据不同应用程序的不同需求提供对应的显示效果。
第二存储模块4040,适于将该条信息存入内容队列中。
若比较模块4020判断内容队列中不存在该条信息的同质信息时,第二存储模块4040将该条信息直接存入内容队列中。
循环模块4050,适于重复执行以上比较模块4020、第一存储模块4030和第二存储模块4040,直至至少一条待处理的信息处理完毕。
循环模块4050判断已经获取到的待处理的信息是否已经全部出来完毕,若处理完毕,则该执行过程结束。否则,循环模块4050重复执行以上比较模块4020、第一存储模块4030和第二存储模块4040,直至将获取的至少一条待处理的信息处理完毕为止。
根据本发明提供的应用于终端的信息处理装置,获取至少一条待处理的信息;从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则将该条信息存入内容队列中同质信息的相似信息列表中;若否,则将该条信息存入内容队列中。重复上述对获取的待处理的信息的操作,直至至少一条待处理的信息处理完毕。本发明通过将信息进行比较,判断同质信息,以便对信息进行处理的同时,不影响其它信息的正常处理,进一步,可以提升用户的阅读体验。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。
图5示出了根据本发明另一个实施例的应用于终端的信息处理装置的功能框图。如图5所示,与图4相比,应用于终端的信息处理装置还包括如下模块:
第一显示模块4060,适于在终端界面同质信息的显示条目中追加显示该条信息的附加信息。
第一显示模块4060在终端界面已经显示的同质信息的显示条目中追加显示该条信息的附件信息。具体的效果可以参照附图3a和3b所示。图3a为未经处理的同质信息的显示画面,从图3a中可以看到终端界面显示了多条同质信息,用户在阅读时会阅读多条重复的同质信息,阅读体验不佳。图3b为对信息进行处理后的显示画面。其中,如附加信息为用户A的信息已经显示在终端界面后,对于该同质信息的相似信息列表中的附加信息为用户B的信息,在终端界面显示时,第一显示模块4060直接在其同质信息的显示条目中追加显示该条信息的附加信息。即在终端界面显示的用户A后追加用户B进行显示。同理,对于该同质信息的相似信息列表中的附加信息为用户C的信息,在终端界面显示时,第一显示模块4060直接在其同质信息的显示条目中追加显示该条信息的附加信息。即在终端界面显示的用户A和用户B后追加用户C进行显示,得到如图3b所示的画面。这样使得用户在阅读时可以一目了然的了解到用户A、用户B和用户C均发送了该条信息或与该条信息内容同质的信息内容,且整体的阅读体验友好,减少用户在阅读多条同质信息时需要上下滑动终端界面或翻页等操作。
第二显示模块4070,适于生成该条信息的显示条目并在终端界面进行显示。
第二显示模块4070生成该条信息的显示条目,显示条目可以包括该条信息的发送者信息、该条信息的信息内容等。且第二显示模块4070在终端设备将显示条目进行显示。
选项判断模块4080,适于判断用户是否设置去重选项,若是,则执行比较模块4020;否则,执行第三显示模块4090。
考虑到不同用户有不同的阅读需求,因此,选项判断模块4080通过判断用户是否设置去重选项,满足不同用户的不同需求。若选项判断模块4080判断用户设置了去重选项,即用户需要将同质信息进行处理,则执行比较模块4020;否则,用户不需要将同质信息进行处理,直接执行第三显示模块4090。
第三显示模块4090,适于按照顺序从待处理的信息中依次读取信息,生成信息的显示条目并在终端界面进行显示。
在获取模块4010获取到待处理的信息后,第三显示模块4090按照顺序依次读取其中的信息,生成信息的对应的显示条目,并在终端界面进行显示。
该第三显示模块4090直接将信息生成对应的显示条目进行显示,而不对信息的信息内容进行其他处理。
获取模块4010还包括了一次获取单元4011和/或一条获取单元4012。
一次获取单元4011,适于从服务器侧一次性拉取全部待处理的信息。
一次获取单元4011从服务器侧一次性拉取全部待处理的信息。这种方式适用于评论、问答类等应用程序,比如大众点评提供的用户对店铺的评价信息、知乎提供的用户对提问的回答信息等。由于这些信息在应用程序启动时已经存在于服务器侧,因此,一次获取单元4011可以从服务器侧一次性的拉取到这些全部待处理的信息。
一条获取单元4012,适于根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。
一条获取单元4012根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。这种方式适用于聊天类等应用程序,比如群聊时,由于多个用户均是实时的发送发言信息,因此,一条获取单元4012可以根据用户发送信息的时间(待处理信息的生成时间),从服务器侧依次拉取待处理的信息。
比较模块4020还包括了全匹配单元4021、向量比较单元4022和/或相似比较单元4023。
全匹配单元4021,适于将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则判定内容队列中存在该条信息的同质信息。
全匹配单元4021将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则全匹配单元4021判定内容队列中存在该条信息的同质信息。同质信息即与该条信息的信息内容完全匹配的内容队列中的已保存信息。
向量比较单元4022,适于分别将该条信息的信息内容和内容队列中已保存信息的信息内容进行分词及转化向量处理,得到该条信息的文本向量和内容队列中已保存信息的文本向量;计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数;若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则判定内容队列中存在该条信息的同质信息。
向量比较单元4022首先分别将该条信息的信息内容和内容队列中已保存信息的信息内容进行分词处理及转化向量处理,分别得到该条信息的文本向量和内容队列中已保存信息的文本向量。向量比较单元4022计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数。若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则向量比较单元4022判定内容队列中存在该条信息的同质信息。同质信息即与该条信息的文本向量的夹角度数小于或等于预设度数阈值的内容队列中的已保存信息。
相似比较单元4023,适于使用编辑距离算法和/或最大公共序列算法计算该条信息的信息内容与内容队列中已保存信息的信息内容的相似度;若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则判定内容队列中存在该条信息的同质信息。
相似比较单元4023使用编辑距离算法、最大公共序列算法等计算该条信息的信息内容与内容队列中已保存信息的信息内容的相似度。若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则相似比较单元4023判定内容队列中存在该条信息的同质信息。同质信息即与该条信息的信息内容相似度大于或等于预设相似度阈值的内容队列中的已保存信息。
在实施时,可以根据实际情况选择以上一个或多个单元进行比较。实施时,各单元采用的相似度算法不仅限于以上几种,可以实现信息内容相似度比较的算法均可采用。进一步,在实施时,根据用户的阅读习惯,比较模块4020可以由用户预先设置在判断信息是否为同质信息时使用的预设度数阈值或预设相似度阈值。当用户需求为全部信息内容完全相同时才判断为同质信息,比较模块4020可以使用全匹配单元4021;当用户需求为大部分信息内容相同时才判断为同质信息,比较模块4020可以将预设相似度阈值设置为80%或更高;当用户需求为一部分信息内容相同时判断为同质信息,比较模块4020可以将预设相似度阈值设置为50%或更低等。比较模块4020的具体数值可以由不同用户根据自身的阅读习惯自由设定,避免了在服务器端进行同质信息判断时,只能使用一个统一的阈值或标准进行判断,使得在终端执行时更加灵活多样,更符合用户的实际需求,同时能够减少在服务器端处理不同用户的不同阈值设置而导致的系统运行压力
为方便用户阅读,减少用户手动设置的麻烦,比较模块4020还可以通过机器学习等算法,根据用户日常阅读同质信息时所花费的时间,得到用户对于同质信息的阅读习惯,如用户在阅读同质信息时花费时间较少或迅速翻页等情况时,可以认为用户在阅读时,当信息内容有一部分相同时会习惯的认为其为同质信息,不会再去仔细阅读同质信息,此时比较模块4020可以自动将预设相似度阈值设置为50%或更低等,方便将大量的同质信息进行处理,使得用户在阅读时可以阅读到更多不同的信息内容。或者比较模块4020还可以根据用户对不同类别的信息的阅读习惯,在显示不同类别的信息时,比较模块4020根据用户对不同类别的信息的阅读习惯使用不同的同质信息判断标准。如用户在阅读评论类的信息时,会花费较多阅读,比较模块4020可以将同质信息的判断标准如预设相似度阈值设置为80%或更高。用户在阅读实时聊天群中的信息时,对于“收到”、“收到,谢谢”、“收到,好的”等这种信息时,比较模块4020将同质信息的判断标准如预设相似度阈值设置为50%或更低等。
删除模块4100,适于判断内容队列是否已存满,若是,则删除内容队列中最早存入的信息。
若比较模块4020判断内容队列中不存在该条信息的同质信息,即该条信息为与内容队列中已保存信息不同的信息,第二存储模块4040需要将该条信息存在内容队列中。但由于内容队列设置在终端,其大小受限。因此,需要删除模块4100先判断内容队列是否已经存满,如删除模块4100判断内容队列的已存储信息的大小,若超过内容队列预设的最大限度,删除模块4100删除内容队列中最早存入的信息。由于内容队列中已存储的信息在后续由第一显示模块4060或第二显示模块4070都已经在终端界面进行了显示,此时删除模块4100删除最早存入的信息不影响终端界面的显示。且删除模块4100删除的是最早存入的信息,即使待处理的信息中还有其同质的信息,但由于两者之间还存在其他信息,在终端界面显示时,不会呈现多条同质信息显示在一起刷屏的情况,也改善了用户的阅读体验。进一步,删除模块4100删除内容队列中最早存入的信息时,如果最早存入的信息有相似信息列表时,删除模块4100将相似信息列表一并删除。
根据本发明提供的应用于终端的信息处理装置,在获取至少一条待处理的信息后,判断用户是否设置去重选项,根据用户选择,对信息进行相应的处理,使得处理灵活,满足用户不同需求。在对判断是否同质信息时,依次按照顺序从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息。比较的方式灵活多样,有效的对同质信息进行辨别。若已存在同质信息时,将该条信息的附加信息存入内容队列中同质信息的相似信息列表中,在终端界面同质信息的显示条目中仅追加显示该条信息的附加信息。显示效果使用户一目了然的看到与同质信息相关的各信息内容及附加信息,也减少了用户在阅读多条同质信息时需要上下滑动终端界面或翻页等操作,提升用户的阅读体验。若不存在同质信息时,将该条信息存入内容队列中,为其生成该条信息的显示条目并在终端界面进行显示,不影响其正常的显示。进一步,考虑到内容队列设置在终端,其大小受限的情况,还对内容队列的存储情况进行判断,以避免出现存储溢出等问题。本发明在不影响其它信息的正常显示的情况下,在终端将信息进行比较后,对同质信息的显示进行了处理,大大提升了用户的阅读体验。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。
本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的应用于终端的信息处理方法。
图6示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图6所示,该电子设备可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:
处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。
通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器602,用于执行程序610,具体可以执行上述应用于终端的信息处理方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行以下操作:
在一种可选的实施方式中,程序610用于使得处理器602
步骤S1,获取至少一条待处理的信息;
步骤S2,从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则执行步骤S3;若否,则执行步骤S4;其中,内容队列建立在终端,用于保存信息;
步骤S3,将该条信息存入内容队列中同质信息的相似信息列表中;
步骤S4,将该条信息存入内容队列中;
重复执行以上步骤S2、S3和S4,直至至少一条待处理的信息处理完毕。
在一种可选的实施方式中,程序610用于使得处理器602将该条信息的附加信息存入内容队列中同质信息的相似信息列表中;在将该条信息的附加信息存入内容队列中同质信息的相似信息列表中之后,程序610用于使得处理器602在终端界面同质信息的显示条目中追加显示该条信息的附加信息;在步骤S4之后,程序610用于使得处理器602生成该条信息的显示条目并在终端界面进行显示。
在一种可选的实施方式中,程序610用于使得处理器602判断用户是否设置去重选项,若是,则执行步骤S2;否则,按照顺序从待处理的信息中依次读取信息,生成信息的显示条目并在终端界面进行显示。
在一种可选的实施方式中,程序610用于使得处理器602将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则判定内容队列中存在该条信息的同质信息。
在一种可选的实施方式中,程序610用于使得处理器602分别将该条信息的信息内容和内容队列中已保存信息的信息内容进行分词及转化向量处理,得到该条信息的文本向量和内容队列中已保存信息的文本向量;计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数;若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则判定内容队列中存在该条信息的同质信息。
在一种可选的实施方式中,程序610用于使得处理器602使用编辑距离算法和/或最大公共序列算法计算该条信息的信息内容与内容队列中已保存信息的信息内容的相似度;若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则判定内容队列中存在该条信息的同质信息。
在一种可选的实施方式中,程序610用于使得处理器602从服务器侧一次性拉取全部待处理的信息;或者,根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。
在一种可选的实施方式中,附加信息包括信息的发送方用户信息。
在一种可选的实施方式中,程序610用于使得处理器602判断内容队列是否已存满,若是,则删除内容队列中最早存入的信息。
程序610中各步骤的具体实现可以参见上述应用于终端的信息处理实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例提供的方案,获取至少一条待处理的信息;从待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则将该条信息存入内容队列中同质信息的相似信息列表中;若否,则将该条信息存入内容队列中。重复上述对获取的待处理的信息的操作,直至至少一条待处理的信息处理完毕。本发明通过将信息进行比较,判断同质信息,以便对信息进行处理的同时,不影响其它信息的正常处理,进一步,可以提升用户的阅读体验。并且在终端对信息进行处理,降低了服务器侧的压力及处理的难度,也节省了处理的成本。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的应用于终端的信息处理装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种应用于终端的信息处理方法,其包括:
步骤S1,获取至少一条待处理的信息;
步骤S2,从所述待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则执行步骤S3;若否,则执行步骤S4;其中,所述内容队列建立在终端,用于保存信息;
步骤S3,将该条信息存入内容队列中所述同质信息的相似信息列表中;
步骤S4,将该条信息存入内容队列中;
重复执行以上步骤S2、S3和S4,直至所述至少一条待处理的信息处理完毕。
2.根据权利要求1所述的方法,其中,所述将该条信息存入内容队列中所述同质信息的相似信息列表中进一步包括:
将该条信息的附加信息存入内容队列中所述同质信息的相似信息列表中;
在所述将该条信息的附加信息存入内容队列中所述同质信息的相似信息列表中之后,所述方法还包括:在终端界面所述同质信息的显示条目中追加显示该条信息的附加信息;
在所述步骤S4之后,所述方法还包括:生成该条信息的显示条目并在终端界面进行显示。
3.根据权利要求1或2所述的方法,其中,在所述步骤S2之前,所述方法还包括:
判断用户是否设置去重选项,若是,则执行步骤S2;否则,按照顺序从所述待处理的信息中依次读取信息,生成信息的显示条目并在终端界面进行显示。
4.根据权利要求1-3中任一项所述的方法,其中,所述将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息进一步包括:
将该条信息的信息内容与内容队列中所述已保存信息的信息内容进行比较,若内容队列中存在与该条信息的信息内容完全匹配的已保存信息,则判定内容队列中存在该条信息的同质信息。
5.根据权利要求1-3中任一项所述的方法,其中,所述将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息进一步包括:
分别将该条信息的信息内容和内容队列中所述已保存信息的信息内容进行分词及转化向量处理,得到该条信息的文本向量和内容队列中所述已保存信息的文本向量;
计算该条信息的文本向量与内容队列中任一条已保存信息的文本向量的夹角度数;
若内容队列中存在已保存信息的文本向量与该条信息的文本向量的夹角度数小于或等于预设度数阈值,则判定内容队列中存在该条信息的同质信息。
6.根据权利要求1-3中任一项所述的方法,其中,所述将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息进一步包括:
使用编辑距离算法和/或最大公共序列算法计算该条信息的信息内容与内容队列中所述已保存信息的信息内容的相似度;
若内容队列中存在已保存信息的信息内容与该条信息的信息内容相似度大于或等于预设相似度阈值,则判定内容队列中存在该条信息的同质信息。
7.根据权利要求1-6中任一项所述的方法,其中,所述获取至少一条待处理的信息进一步包括:
从服务器侧一次性拉取全部待处理的信息;
或者,根据待处理信息的生成时间,从服务器侧依次拉取至少一条待处理的信息。
8.一种应用于终端的信息处理装置,其包括:
获取模块,适于获取至少一条待处理的信息;
比较模块,适于从所述待处理的信息中读取一条信息,将该条信息的信息内容与内容队列中已保存信息的信息内容进行比较,判断内容队列中是否存在该条信息的同质信息,若是,则执行第一存储模块;若否,则执行第二存储模块;其中,所述内容队列建立在终端,用于保存信息;
第一存储模块,适于将该条信息存入内容队列中所述同质信息的相似信息列表中;
第二存储模块,适于将该条信息存入内容队列中;
循环模块,适于重复执行以上比较模块、第一存储模块和第二存储模块,直至所述至少一条待处理的信息处理完毕。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的应用于终端的信息处理方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的应用于终端的信息处理方法对应的操作。
CN201710755679.9A 2017-08-29 2017-08-29 应用于终端的信息处理方法及装置 Active CN107609062B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710755679.9A CN107609062B (zh) 2017-08-29 2017-08-29 应用于终端的信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710755679.9A CN107609062B (zh) 2017-08-29 2017-08-29 应用于终端的信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN107609062A true CN107609062A (zh) 2018-01-19
CN107609062B CN107609062B (zh) 2020-07-10

Family

ID=61056206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710755679.9A Active CN107609062B (zh) 2017-08-29 2017-08-29 应用于终端的信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN107609062B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543614A (zh) * 2018-11-22 2019-03-29 厦门商集网络科技有限责任公司 一种全文本差异比对方法及设备
CN110856040A (zh) * 2019-11-07 2020-02-28 网易(杭州)网络有限公司 客户端中监控数据的处理方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068217A (zh) * 2006-06-16 2007-11-07 腾讯科技(深圳)有限公司 一种简化电子邮件操作的方法及装置
CN101727500A (zh) * 2010-01-15 2010-06-09 清华大学 一种基于流聚类的中文网页文本分类方法
CN101826099A (zh) * 2010-02-04 2010-09-08 蓝盾信息安全技术股份有限公司 一种相似文档识别、文档扩散度确定的方法及系统
CN106446148A (zh) * 2016-09-21 2017-02-22 中国运载火箭技术研究院 一种基于聚类的文本查重方法
CN106911687A (zh) * 2017-02-20 2017-06-30 深圳国泰安教育技术股份有限公司 一种页面构建控制方法和装置
GB2547313A (en) * 2016-02-12 2017-08-16 Adobe Systems Inc Accurate tag relevance prediction for image search

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068217A (zh) * 2006-06-16 2007-11-07 腾讯科技(深圳)有限公司 一种简化电子邮件操作的方法及装置
CN101727500A (zh) * 2010-01-15 2010-06-09 清华大学 一种基于流聚类的中文网页文本分类方法
CN101826099A (zh) * 2010-02-04 2010-09-08 蓝盾信息安全技术股份有限公司 一种相似文档识别、文档扩散度确定的方法及系统
GB2547313A (en) * 2016-02-12 2017-08-16 Adobe Systems Inc Accurate tag relevance prediction for image search
CN106446148A (zh) * 2016-09-21 2017-02-22 中国运载火箭技术研究院 一种基于聚类的文本查重方法
CN106911687A (zh) * 2017-02-20 2017-06-30 深圳国泰安教育技术股份有限公司 一种页面构建控制方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543614A (zh) * 2018-11-22 2019-03-29 厦门商集网络科技有限责任公司 一种全文本差异比对方法及设备
CN110856040A (zh) * 2019-11-07 2020-02-28 网易(杭州)网络有限公司 客户端中监控数据的处理方法和装置

Also Published As

Publication number Publication date
CN107609062B (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN104933084B (zh) 一种用于获得答案信息的方法、装置和设备
CN104951456B (zh) 一种用于获得答案信息的方法、装置和设备
CN109597965B (zh) 基于深度神经网络的数据处理方法、系统、终端及介质
CN105391622B (zh) 即时通信或社交网络应用中分享资源的方法和系统
CN107277615A (zh) 直播风格化处理方法、装置、计算设备及存储介质
CN105376148A (zh) 聊天信息整理方法及装置
CN107273406A (zh) 任务对话系统中的对话处理方法及装置
CN108958922A (zh) 用于执行任务的方法和装置
CN110060663A (zh) 一种应答服务的方法、装置及系统
CN103942282B (zh) 一种样本数据获取方法、装置及系统
US20130347004A1 (en) Correlating messages
CN107608795A (zh) 云计算方法和装置
CN107369055A (zh) 订单消息的取货分配方法及装置
CN112561081B (zh) 深度学习模型的转换方法、装置、电子设备和存储介质
CN107609062A (zh) 应用于终端的信息处理方法及装置
CN109597882A (zh) 一种场景会话业务处理方法和装置
CN109241247A (zh) 多方协作项目的问题处理方法、系统及服务器
JP2018049478A (ja) テキスト分析方法、テキスト分析装置、及びプログラム
CN104579926B (zh) 显示邮件的方法和邮件客户端
CN117492743A (zh) 基于大语言模型的目标应用生成方法、装置及存储介质
CN109189897B (zh) 一种基于数据内容匹配的聊天方法及聊天装置
CN110378717B (zh) 用于输出信息的方法和装置
CN107800616A (zh) 一种邮件列表显示方法、介质、装置和计算设备
CN112817463A (zh) 输入法获取音频数据的方法、设备和存储介质
CN111340264A (zh) 基于升级多差树模型的投诉升级预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant