CN109977176B - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN109977176B CN109977176B CN201910229644.0A CN201910229644A CN109977176B CN 109977176 B CN109977176 B CN 109977176B CN 201910229644 A CN201910229644 A CN 201910229644A CN 109977176 B CN109977176 B CN 109977176B
- Authority
- CN
- China
- Prior art keywords
- data
- stored
- identifier
- determining
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种数据处理方法及装置,包括:接收终端设备发送的待存储数据,所述待存储数据中包括时间标识和传播声量标识;确定所述待存储数据对应的数据类型;根据所述数据类型、所述时间标识和所述传播声量标识,确定所述待存储数据对应的数据集合;将所述待存储数据存储到所述数据集合中。本发明提供的数据处理方法,使得服务器中的数据可以按照数据之间的关联性进行存储,该存储形式可以以结构化的形式展现事件发展过程。
Description
技术领域
本发明涉及网络技术领域,尤其涉及一种数据处理方法及装置。
背景技术
当发生新闻事件时,通常会产生大量的文字、图片、视频和音频等新闻数据。对于同一个新闻事件产生的数据,通常会保存在同一个服务器中,以便后续对该新闻事件产生的新闻数据进行整理、查阅和分析。
现有的数据的处理方法中,当服务器接收到新产生的新闻数据后,通常会对其进行识别,确定该新闻数据对应的事件或类型标识,随后根据事件或类型标识将其存放到对应的存储位置。
然而,现有的数据的处理方法,对于同一个新闻事件产生的数据,只是杂乱地将该数据按照时间顺序存储在服务器其中的同一个位置,在存储过程中并未对数据进行必要的划分。
发明内容
本发明提供一种数据处理方法及装置,以使得服务器中的数据可以按照数据之间的关联性进行分类存储。
本发明第一个方面提供一种数据处理方法,包括:
接收终端设备发送的待存储数据,所述待存储数据中包括时间标识和传播声量标识;
确定所述待存储数据对应的数据类型;
根据所述数据类型、所述时间标识和所述传播声量标识,确定所述待存储数据对应的数据集合;
将所述待存储数据存储到所述数据集合中。
可选的,所述确定所述待存储数据对应的数据类型,包括:
从所述待存储数据中提取第一关键词,所述第一关键词为所述待存储数据的标题;
根据所述第一关键词,确定所述待存储数据对应的数据类型。
可选的,所述根据所述数据类型标识、所述时间标识和所述传播声量标识,确定所述待存储数据对应的数据集合,包括:
根据所述数据类型,确定所述待存储数据对应的存储区域,所述存储区域中包含有多个数据集合;
根据所述时间标识和传播声量标识,从所述存储区域中确定所述待存储数据对应的数据集合。
可选的,所述将所述待存储数据存储到所述数据集合中,包括:
分别确定所述待存储数据和所述数据集合中所有数据子集的相似值,所述相似值用于表征所述待存储数据和所述数据子集中的数据的相似程度,所述数据子集中的数据间的相似值均大于预设的阈值;
根据所述相似值,确定所述待存储数据在所述数据集合中对应的数据子集;
将所述待存储数据存储到所述数据子集中。
可选的,在所述将所述待存储数据存储到所述数据子集中之后,还包括:
获取用户输入的发送请求,所述发送请求中包括数据子集标识、网络标识和终端标识;
根据预设的第二关键词,提取所述数据子集标识对应的数据子集中的待发送信息,所述第二关键词用于在所述数据子集中定位所述待发送信息,所述待发送信息为所述数据子集中的内容摘要信息;
将所述待发送信息按照所述网络标识对应的发送形式发送给所述终端标识对应的终端。
本发明第二个方面提供一种数据处理装置,包括:
第一获取模块,用于接收终端设备发送的待存储数据,所述待存储数据中包括时间标识和传播声量标识;
数据类型确定模块,用于确定所述待存储数据对应的数据类型;
数据集合确定模块,用于根据所述数据类型、所述时间标识和所述传播声量标识,确定所述待存储数据对应的数据集合;
存储模块,用于将所述待存储数据存储到所述数据集合中。
可选的,所述数据类型确定模块,包括:
提取单元,用于从所述待存储数据中提取第一关键词,所述第一关键词为所述待存储数据的标题;
匹配单元,用于根据所述第一关键词,确定所述待存储数据对应的数据类型。
可选的,所述数据集合确定模块,包括:
初次确定单元,用于根据所述数据类型,确定所述待存储数据对应的存储区域,所述存储区域中包含有多个数据集合;
二次确定单元,用于根据所述时间标识和传播声量标识,从所述存储区域中确定所述待存储数据对应的数据集合。
可选的,所述存储模块,包括:
相似值确定单元,用于分别确定所述待存储数据和所述数据集合中所有数据子集的相似值,所述相似值用于表征所述待存储数据和所述数据子集中的数据的相似程度,所述数据子集中的数据间的相似值均大于预设的阈值;
数据子集确定单元,用于根据所述相似值,确定所述待存储数据在所述数据集合中对应的数据子集;
地址确定单元,用于将所述待存储数据存储到所述数据子集中。
可选的,还包括:
第二获取模块,用于获取用户输入的发送请求,所述发送请求中包括数据子集标识、网络标识和终端标识;
信息确定模块,用于根据预设的第二关键词,提取所述数据子集标识对应的数据子集中的待发送信息,所述第二关键词用于在所述数据子集中定位所述待发送信息,所述待发送信息为所述数据子集中的内容摘要信息;
发送模块,用于将所述待发送信息按照所述网络标识对应的发送形式发送给所述终端标识对应的终端。
本发明的第三方面提供一种电子设备,包括:存储器与处理器;
所述存储器,用于存储所述处理器的可执行指令;
所述处理器配置为经由执行所述可执行指令来执行第一方面及其可选方案涉及的方法。
本发明的第四方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面及其可选方案涉及的方法。
本发明提供的数据处理方法及装置,当服务器接收到终端设备待存储数据后,可以确定待存储数据对应数据类型,随后根据待存储数据对应的数据类型、时间标识、传播声量标识,从而确定待存储数据对应的数据集合并将待存储数据存储到对应的数据集合中,进而使得服务器中的数据可以按照数据之间的关联性进行分类存储,从而以结构化的形式展现数据对应的事件的发展过程。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据处理方法的应用场景示意图;
图2为本发明实施例提供的一种数据处理方法的流程示意图;
图3为本发明实施例提供的一种数据处理方法的流程示意图;
图4为本发明实施例提供的一种数据处理方法的流程示意图;
图5为本发明实施例提供的一种数据处理方法的流程示意图;
图6为本发明实施例提供的一种数据处理方法的流程示意图;
图7为本发明实施例提供的一种数据处理装置的结构示意图;
图8为本发明实施例提供的一种数据处理装置的结构示意图;
图9为本发明实施例提供的一种数据处理装置的结构示意图;
图10为本发明实施例提供的一种数据处理装置的结构示意图;
图11为本发明实施例提供的一种数据处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例提供的一种数据处理方法的应用场景示意图。
请参考图1,本发明实施例可适用的场景中,以新闻事件为例,用户可以将新闻事件产生的待存储数据通过终端设备12发送给服务器11。服务器11接收到待存储数据后,首先确定待存储数据的数据类型,再根据待存储数据的数据类型以及待存储数据中包括的时间标识和传播声量标识确定待存储数据对应的数据集合,最后将待存储数据存储到服务器11中待存储数据对应的数据集合中。当用户需要再次查阅待存储数据或获取某个集合中待存储数据的摘要内容时,可以向服务器11输入发送请求,以使服务器11根据发送请求中包括的子集标识、网络标识和终端标识,以对应的发送形式将待发送内容发送给对应的终端设备13。
此外,该数据处理方法不但可以应用于新闻事件,还可以应用到其他领域,例如:音乐、视频、学术论文等。
其中,终端设备11和终端设备13,可例如:手机、平板电脑、计算机等设备。
图2为本发明实施例提供的一种数据处理方法的流程示意图,该方法的执行主体可以为服务器,如图2所示,该数据处理方法,可以包括步骤S21-S24,具体如下:
S21:接收终端设备发送的待存储数据,待存储数据中包括时间标识和传播声量标识。
待存储数据,具体可以为图片、视频、音频、文章或链接等。
终端设备,可以是手机、平板电脑、计算机等设备。
时间标识,可以用来表示生成待存储数据的时间。
传播声量标识,可以用来表示待存储数据的传播度,具体可以表现为点击量。
以新闻事件为例,在实际应用中,当用户需要存储新闻数据时,可以将待存储的新闻数据通过终端设备发送给服务器,发送的新闻数据可以附带有时间标识和传播声量标识。
S22:确定待存储数据对应的数据类型。
数据类型,可以按照类别对待存储数据进行分类,例如可以分为政策法规类、行业事件类、上市新闻类、产品历史类、成功案例类等;或者,在另一种可实施方式中,也可以按照具体的新闻事件进行划分。
以按照具体的新闻事件划分为例,在实际应用中,当服务器接收到终端设备发送的待存储数据后,若待存储数据的内容中存在标题,服务器可以提取待存储数据的标题,并从待存储数据的标题中确定出待存储数据的数据类型。
或者,在终端设备向服务器发送待存储数据时,用户还可以手动添加标签信息,该标签信息与待存储数据的数据类型相对应,以使服务器可以通过识别标签信息来确定待存储数据的数据类型。
在另一种可实施方式中,服务器还可以提取待存储数据的文件名,通过识别文件名来确定待存储数据的数据类型。
S23:根据数据类型、时间标识和传播声量标识,确定待存储数据对应的数据集合。
在实际应用中,服务器首先可以根据数据类型确定该待存储数据对应的存储区域,随后从存储区域中确定同时与传播声量标识和时间标识相匹配的数据集合,作为待存储数据对应的数据集合。
具体的,服务器中的存储区域可以按照数据类型进行划分,每个数据类型对应一个存储区域,从而确保同一个存储区域中存储有相同类型的数据。进一步的,每个存储区域中包括了多个数据集合。以新闻事件为例,每个新闻事件随着发展往往都包含有多个进程,例如可以包括起因、第一次转折、第二次转折、结束等多个进程,上述进程具体可以通过时间和传播声量进行划分。具体的,可以以时间为基础,将一段时间内传播声量超过预设阈值的新闻数据划为同一进程,随后将同一进程中产生的数据存储到同一数据集合中。
在现有技术中,只是单纯根据数据类型将数据进行分类存储,以新闻事件为例,同一个类型的数据之间的进程不同,会导致数据之间的差异和关联系较低;而本实施例中,按照时间和传播声量,将同一个数据类型的数据划分为不同的数据集合,提高了每一个数据集合中数据之间的关联性。
S24:将待存储数据存储到数据集合中。
在实际应用中,当服务器确定待存储数据对应的数据集合后,可以将其存储到该进程对应的数据集合中。
本实施例提供的数据处理方法,当服务器接收到终端设备待存储数据后,可以确定待存储数据对应数据类型,随后根据待存储数据对应的数据类型、时间标识、传播声量标识,从而确定待存储数据对应的数据集合并将待存储数据存储到对应的数据集合中,进而使得服务器中的数据可以按照数据关联性进行存储,从而以结构化的形式展现数据对应的事件的发展过程。
图3为本发明实施例提供的一种数据处理方法的流程示意图,在上述实施例的基础上,下面结合图3对本发明的提供的数据处理方法进一步说明,具体的,本实施例是在图2实施例的基础上对于上述步骤S22确定待存储数据对应的数据类型的具体说明。
请参照如图3,数据处理方法,步骤S22,包括:
S31:从待存储数据中提取第一关键词,第一关键词为待存储数据的标题。
S32:根据第一关键词,确定待存储数据对应的数据类型。
在实际应用中,服务器可以从待存储数据的内容中提取标题作为第一关键词,并通过第一关键词确定待存储数据对应的数据类型。上述标题可以在待存储数据的内容中提取,也可以从待存储数据的文件名中的提取。
在另一种可实施方式中,若服务器中不存在对应的数据类型,也可以在服务器中创建新的数据类型。
本实施例提供的数据处理方法,通过从待存储数据中提取第一关键词,更根据第一关键词确定待存储数据对应的数据类型,进而使待存储数据可以存储到与数据类型对应的存储区域中,实现了待存储数据的分类存储。
图4为本发明实施例提供的一种数据处理方法的流程示意图,在上述实施例的基础上,下面结合图4对本发明的提供的数据处理方法进一步说明,具体的,本实施例是在图2实施例的基础上对于上述步骤S23根据数据类型、时间标识和传播声量标识,确定待存储数据对应的数据集合的具体说明。
请参照如图4,数据处理方法,步骤S23,包括:
S41:根据数据类型,确定待存储数据对应的存储区域,存储区域中包含有多个数据集合。
在实际应用中,每个数据类型对应了一个存储区域,当服务器确定待存储数据对应的数据类型,可以通过数据类型确定出该待存储数据对应的存储区域。
S42:根据时间标识和传播声量标识,从存储区域中确定待存储数据对应的数据集合。
在实际应用中,每个存储区域中可以包括多个数据集合,每个数据集合中可以对应时间范围和传播声量范围,当该待存储数据中包括的时间标识和传播声量标识和数据集合对应的时间范围和传播声量范围相匹配时,可以从存储区域中确定待存储数据对应的数据集合。
本实施例提供的数据处理方法,通过时间标识和传播声量标识,从存储区域中确定待存储数据对应的数据集合,进而使得服务器可以进一步确定待存储数据对应的数据集合,进而使得服务器中的数据可以按照数据关联性进行存储。
图5为本发明实施例提供的一种数据处理方法的流程示意图,在上述实施例的基础上,下面结合图5对本发明的提供的数据处理方法进一步说明,具体的,本实施例是在图2实施例的基础上对于上述步骤S24将待存储数据存储到数据集合中的具体说明。
请参照如图5,数据处理方法,步骤S24,包括:
S51:分别确定待存储数据和数据集合中所有数据子集的相似值,相似值用于表征待存储数据和数据子集中的数据的相似程度,数据子集中的数据间的相似值均大于预设的阈值。
S52:根据相似值,确定待存储数据在数据集合中对应的数据子集。
在实际应用中,服务器可以对数据内容进行分析,计算出数据之间的相似值。具体的,计算相似值的方法可以提取数据中的文字,确定各组数据之间文字的相似程度,并将其数据的相似程度;或者,利用语义分析软件确定各组数据之间的语义相似程度,并将其数据的相似程度。
当服务器确定待存储数据对应的数据集合后,可以分别确定待存储数据和数据集合中的数据子集之间的相似度,若待存储数据和某个数据子集的相似度超过预设的阈值,则将待存储数据存储在该数据子集中。
S53:将待存储数据存储到所述数据子集中。
本实施例提供的数据处理方法,通过分别确定待存储数据和数据集合中所有数据子集的相似值,来确定待存储数据在数据集合中对应的数据子集,进而将相似度超过阈值的数据进一步存放在同一个数据子集中,从而可以进一步提高数据存放的关联性。
图6为本发明实施例提供的一种数据处理方法的流程示意图,在上述步骤S24之后,还包括对于数据子集的内容摘要信息进行发送。
请参照如图5,数据处理方法,还包括:
S65:获取用户输入的发送请求,发送请求中包括数据子集标识、网络标识和终端标识。
发送请求,可以是用户通过任一终端设备发送的用于获取数据摘要的发送请求。
数据子集标识,可以用于指向数据子集;网络标识,可以用于表示发送请求的终端设备的所有网络;终端标识,用于指向接收待发送信息的终端设备。
在实际应用中,当用户想要查阅某个数据类型对应的数据子集的摘要信息时,可以通过任一终端设备发送发送请求,在发送发送请求时可以在发送请求中附带数据子集标识、网络标识和终端标识,从而使得服务器可以接收到该用户输入的发送请求。
S66:根据预设的第二关键词,提取数据子集标识对应的数据子集中的待发送信息,第二关键词用于在数据子集中定位待发送信息,待发送信息为数据子集中的内容摘要信息。
在实际应用中,当获取发送请求后,服务器可以根据预设的第二关键词从数据子集中获取待发送信息。
结合具体例子举例来说,若获取待发送请求中包含第一数据集合的标识,则服务器可以定位第一数据集合。随后,服务器可以根据预设的第二关键词提取数据子集中的待发送内容。第二关键词,可以例如“标题”、“时间”等关键词。根据实际情况,可以确定具体定位出待发送内容,从而确定对应的第二关键词。
S67:将待发送信息按照网络标识对应的发送形式发送给终端标识对应的终端。
在实际应用中,不同的网络标识对应了不同的终端设备,进而按照适宜的发送形式进行发送。具体的,上述的终端设备可以包括手机、平板电脑、计算机。针对计算机具体可以通过、WEB端、办公软件(PPT/Word/PDF/邮件等)来展现接收到的待发送信息。具体举例来说,如监测到的网络标识为4G网络,则可以确定用户使用的终端设备为手机。进而,服务器可以发送符合手机查阅的待发送内容。此外,在发送待发送内容时,还可以根据终端标识来确定待发送内容发送至的终端。进而,当用户需要查看服务器某一子集中存储的数据摘要信息时可以快速找到该数据。
在另一种可实施方式中,终端还可以从服务器中获取同一个数据类型的所有存储数据的内容脉络图。具体的,服务器可以从每个数据集合中提取该数据集合对应的关键词以及从每个数据子集中提取该数据子集对应的关键词,随后,将所有关键词组合成该数据类型的存储数据的内容脉络图。结合实际情况举例来说,服务器可以从一个新闻事件的存储数据的集合中提取关键词作为该事件的若干进展,服务器还可以从该新闻事件的数据子集中提取关键词作为该数据子集的话题,进一步地,该数据子集中的数据即为该话题下的事实和观点。最后,服务器将提取出的进展、话题等关键词以及事实、观点等数据制作成内容脉络图,并发送给对应终端,从而使终端可以以结构化的形式展现事件发展过程。
本实施例提供的数据处理方法,服务器将待发送信息按照网络标识对应的发送形式发送给终端标识对应的终端,从而使用户可以快速获取需要的信息。
图7为本发明实施例提供的一种数据处理装置的结构示意图。该数据处理装置可以通过软件、硬件或者两者的结合实现服务器的部分或者全部。
请参照如图7,数据处理装置,包括:
第一获取模块71,用于接收终端设备发送的待存储数据,待存储数据中包括时间标识和传播声量标识。
数据类型确定模块72,用于确定待存储数据对应的数据类型。
数据集合确定模块73,用于根据数据类型、时间标识和传播声量标识,确定待存储数据对应的数据集合。
存储模块74,用于将待存储数据存储到数据集合中。
本实施例提供的数据处理装置,可以执行上述方法实施例中服务器的动作,其实现原理和技术效果类似,在此不再赘述。
图8为本发明实施例提供的一种数据处理装置的结构示意图。在上述图7所示的框图的基础上,上述数据处理装置还可以包括:
第二获取模块85,用于获取用户输入的发送请求,发送请求中包括数据子集标识、网络标识和终端标识;
信息确定模块86,用于根据预设的第二关键词,提取数据子集标识对应的数据子集中的待发送信息,第二关键词用于在数据子集中定位待发送信息,待发送信息为数据子集中的内容摘要信息;
发送模块87,用于将待发送信息按照网络标识对应的发送形式发送给终端标识对应的终端。
可选的,图9为本发明实施例提供的一种数据处理装置的结构示意图。
请参照如图9,在上述图7所示的框图的基础上,数据类型确定模块,包括:
提取单元91,用于从待存储数据中提取第一关键词,第一关键词为待存储数据的标题。
匹配单元92,用于根据第一关键词,确定待存储数据对应的数据类型。
图10为本发明实施例提供的一种数据处理装置的结构示意图。
请参照如图10,在上述图7所示的框图的基础上,数据集合确定模块,包括:
初次确定单元101,用于根据数据类型,确定待存储数据对应的存储区域,存储区域中包含有多个数据集合;
二次确定单元102,用于根据时间标识和传播声量标识,从存储区域中确定待存储数据对应的数据集合。
图11为本发明实施例提供的一种数据处理装置的结构示意图。
请参照如图11,在上述图7所示的框图的基础上,存储模块,包括:
相似值确定单元111,用于分别确定待存储数据和数据集合中所有数据子集的相似值,相似值用于表征待存储数据和数据子集中的数据的相似程度,数据子集中的数据间的相似值均大于预设的阈值;
数据子集确定单元112,用于根据相似值,确定待存储数据在数据集合中对应的数据子集;
地址确定单元113,用于将待存储数据存储到数据子集中。
本实施例提供的数据处理装置,可以执行上述方法实施例中服务器的动作,其实现原理和技术效果类似,在此不再赘述。
本发明的还提供一种电子设备,包括:存储器与处理器;
存储器,用于存储处理器的可执行指令;
处理器配置为经由执行可执行指令来执行图2-图6所涉及的数据处理方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application SpecificIntegrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。
本发明还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现图2-图6的数据处理方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (6)
1.一种数据处理方法,其特征在于,包括:
接收终端设备发送的待存储数据,所述待存储数据中包括时间标识和传播声量标识;
确定所述待存储数据对应的数据类型;
根据所述数据类型,确定所述待存储数据对应的存储区域,所述存储区域中包含有多个数据集合;
根据所述时间标识和传播声量标识,从所述存储区域中确定所述待存储数据对应的数据集合;
分别确定所述待存储数据和所述数据集合中所有数据子集的相似值,所述相似值用于表征所述待存储数据和所述数据子集中的数据的相似程度,所述数据子集中的数据间的相似值均大于预设的阈值;
根据所述相似值,确定所述待存储数据在所述数据集合中对应的数据子集;
将所述待存储数据存储到所述数据子集中。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待存储数据对应的数据类型,包括:
从所述待存储数据中提取第一关键词,所述第一关键词为所述待存储数据的标题;
根据所述第一关键词,确定所述待存储数据对应的数据类型。
3.根据权利要求1所述的方法,其特征在于,在所述将所述待存储数据存储到所述数据子集中之后,还包括:
获取用户输入的发送请求,所述发送请求中包括数据子集标识、网络标识和终端标识;
根据预设的第二关键词,提取所述数据子集标识对应的数据子集中的待发送信息,所述第二关键词用于在所述数据子集中定位所述待发送信息,所述待发送信息为所述数据子集中的内容摘要信息;
将所述待发送信息按照所述网络标识对应的发送形式发送给所述终端标识对应的终端。
4.一种数据处理装置,其特征在于,包括:
第一获取模块,用于接收终端设备发送的待存储数据,所述待存储数据中包括时间标识和传播声量标识;
数据类型确定模块,用于确定所述待存储数据对应的数据类型;
数据集合确定模块,用于根据所述数据类型、所述时间标识和所述传播声量标识,确定所述待存储数据对应的数据集合;
存储模块,用于将所述待存储数据存储到所述数据集合中;
所述数据集合确定模块,包括:初次确定单元,用于根据所述数据类型,确定所述待存储数据对应的存储区域,所述存储区域中包含有多个数据集合;二次确定单元,用于根据所述时间标识和传播声量标识,从所述存储区域中确定所述待存储数据对应的数据集合;
所述存储模块,包括:
相似值确定单元,用于分别确定所述待存储数据和所述数据集合中所有数据子集的相似值,所述相似值用于表征所述待存储数据和所述数据子集中的数据的相似程度,所述数据子集中的数据间的相似值均大于预设的阈值;
数据子集确定单元,用于根据所述相似值,确定所述待存储数据在所述数据集合中对应的数据子集;
地址确定单元,用于将所述待存储数据存储到所述数据子集中。
5.根据权利要求4所述的装置,其特征在于,所述数据类型确定模块,包括:
提取单元,用于从所述待存储数据中提取第一关键词,所述第一关键词为所述待存储数据的标题;
匹配单元,用于根据所述第一关键词,确定所述待存储数据对应的数据类型。
6.根据权利要求4所述的装置,其特征在于,还包括:
第二获取模块,用于获取用户输入的发送请求,所述发送请求中包括数据子集标识、网络标识和终端标识;
信息确定模块,用于根据预设的第二关键词,提取所述数据子集标识对应的数据子集中的待发送信息,所述第二关键词用于在所述数据子集中定位所述待发送信息,所述待发送信息为所述数据子集中的内容摘要信息;
发送模块,用于将所述待发送信息按照所述网络标识对应的发送形式发送给所述终端标识对应的终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910229644.0A CN109977176B (zh) | 2019-03-25 | 2019-03-25 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910229644.0A CN109977176B (zh) | 2019-03-25 | 2019-03-25 | 数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109977176A CN109977176A (zh) | 2019-07-05 |
CN109977176B true CN109977176B (zh) | 2022-02-22 |
Family
ID=67080451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910229644.0A Active CN109977176B (zh) | 2019-03-25 | 2019-03-25 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977176B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965823A (zh) * | 2015-07-30 | 2015-10-07 | 成都鼎智汇科技有限公司 | 一种基于大数据的观点抽取方法 |
CN106649602A (zh) * | 2016-11-25 | 2017-05-10 | 掌阅科技股份有限公司 | 业务对象数据处理方法、装置和服务器 |
CN107357847A (zh) * | 2017-06-26 | 2017-11-17 | 北京京东尚科信息技术有限公司 | 数据处理方法及其装置 |
CN108874298A (zh) * | 2017-05-15 | 2018-11-23 | 深圳市奇辉电气有限公司 | 一种数据存储的方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8554799B2 (en) * | 2005-07-01 | 2013-10-08 | Microsoft Corporation | Blocks of time with metadata |
-
2019
- 2019-03-25 CN CN201910229644.0A patent/CN109977176B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965823A (zh) * | 2015-07-30 | 2015-10-07 | 成都鼎智汇科技有限公司 | 一种基于大数据的观点抽取方法 |
CN106649602A (zh) * | 2016-11-25 | 2017-05-10 | 掌阅科技股份有限公司 | 业务对象数据处理方法、装置和服务器 |
CN108874298A (zh) * | 2017-05-15 | 2018-11-23 | 深圳市奇辉电气有限公司 | 一种数据存储的方法及装置 |
CN107357847A (zh) * | 2017-06-26 | 2017-11-17 | 北京京东尚科信息技术有限公司 | 数据处理方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109977176A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107657048B (zh) | 用户识别方法及装置 | |
CN109634698B (zh) | 菜单显示方法、装置、计算机设备及存储介质 | |
CN110083789B (zh) | 一种小程序页面获取方法、服务器、客户端及电子设备 | |
CN103136228A (zh) | 一种图片搜索方法以及图片搜索装置 | |
CN106534268B (zh) | 一种数据共享方法及装置 | |
CN107239701B (zh) | 识别恶意网站的方法及装置 | |
CN108287854B (zh) | 一种流计算中数据持久化的方法和系统 | |
CN109840120B (zh) | 解耦微服务发布方法、电子装置及计算机可读存储介质 | |
CN107748772B (zh) | 一种商标识别方法及装置 | |
CN111314063A (zh) | 一种基于物联网大数据信息管理方法、系统及装置 | |
CN111563382A (zh) | 文本信息的获取方法、装置、存储介质及计算机设备 | |
CN111708942A (zh) | 多媒体资源推送方法、装置、服务器及存储介质 | |
CN111126071B (zh) | 提问文本数据的确定方法、装置和客服群的数据处理方法 | |
CN111737443A (zh) | 答案文本的处理方法和装置、关键文本的确定方法 | |
WO2021103594A1 (zh) | 一种默契度检测方法、设备、服务器及可读存储介质 | |
CN111858966B (zh) | 知识图谱的更新方法、装置、终端设备及可读存储介质 | |
CN106599082B (zh) | 一种检索方法、相关装置及电子设备 | |
CN110336731B (zh) | 一种群组中的用户匹配方法及设备 | |
US20170161322A1 (en) | Method and electronic device for searching resource | |
CN109977176B (zh) | 数据处理方法及装置 | |
CN110674383A (zh) | 舆情查询方法、装置及设备 | |
CN114528321A (zh) | 数据检索方法及装置、电子设备及可读存储介质 | |
US11423109B2 (en) | Information processing method, server and computer program product | |
CN110147488B (zh) | 页面内容的处理方法、处理装置、计算设备及存储介质 | |
CN112015773A (zh) | 知识库的检索方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |