CN112905574A - 评级系统中的信息处理方法、设备、可读存储介质 - Google Patents

评级系统中的信息处理方法、设备、可读存储介质 Download PDF

Info

Publication number
CN112905574A
CN112905574A CN202110158837.9A CN202110158837A CN112905574A CN 112905574 A CN112905574 A CN 112905574A CN 202110158837 A CN202110158837 A CN 202110158837A CN 112905574 A CN112905574 A CN 112905574A
Authority
CN
China
Prior art keywords
information
media information
processed
rating
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110158837.9A
Other languages
English (en)
Inventor
胡哲文
吴海山
殷磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202110158837.9A priority Critical patent/CN112905574A/zh
Publication of CN112905574A publication Critical patent/CN112905574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种评级系统中的信息处理方法、设备、计算机可读存储介质及程序产品,应用于信息处理节点,评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,其中,所述方法,包括:获取至少一个待处理媒体信息;基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。本申请,提升了系统处理媒体信息的效率,降低因为媒体信息重复统计导致的数据记录错误进而导致评级效果夸大。

Description

评级系统中的信息处理方法、设备、可读存储介质
技术领域
本申请涉及信息技术领域,涉及但不限于一种评级系统中的信息处理方法、设备、计算机可读存储介质及程序产品。
背景技术
环境、社会和公司治理(Environment、Social Responsibility、CorporateGovernance,ESG)评级系统在需要计算较长时间段的评级时,需要读取较长时间段内的新闻数据,这样存在处理新闻速度慢,且重复处理新闻入库的隐患。
发明内容
本申请实施例提供一种评级系统中的信息处理方法、设备、计算机可读存储介质及计算机程序产品,能够高效处理较长时间段内的评级系统中的媒体信息,并解决重复处理待处理媒体信息入库的问题。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种评级系统中的信息处理方法,应用于信息处理节点,所述评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,所述方法包括:获取至少一个待处理媒体信息;基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
本申请实施例提供一种评级系统中的信息处理装置,应用于信息处理节点,所述评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,所述装置包括:第一获取模块,用于获取至少一个待处理媒体信息;去重模块,用于基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;确定模块,用于当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;评级模块,用于存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
本申请实施例提供一种计算机设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的方法。
本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的方法。
本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例提供的方法。
在本申请实施例提供的评级系统中的信息处理方法中,评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,首先,获取至少一个待处理媒体信息;然后基于共享的目标数据库对待处理媒体信息进行去重处理,得到处理结果。这样,由于目标数据库中存储的媒体信息处理节点都能够共享查询,所以可以实现多个信息处理节点并行处理,将待处理媒体信息的标识与目标数据库中存储的媒体信息进行比对,确定新闻是否已经被处理,以实现媒体信息去重。利用共享的目标数据库可以完成有效待处理媒体信息的去重,降低因为媒体信息重复统计导致的数据记录错误进而导致评级效果夸大,解决了重复处理媒体信息入库的隐患。
当处理结果表征目标数据库中未存储待处理媒体信息时,确定待处理媒体信息的评级标签;最后,存储携带评级标签的待处理媒体信息,以基于评级标签,对待处理媒体信息关联的目标实体进行评级。这样,利用信息处理节点并行处理待处理媒体信息极大提升了系统处理媒体信息的效率,解决了处理媒体信息速度慢的问题。
附图说明
图1为本申请实施例提供的一种评级系统中的信息处理方法系统架构示意图;
图2为本申请实施例提供的一种评级系统中的信息处理方法实现流程示意图;
图3为本申请实施例提供的一种评级系统中的信息处理方法实现流程示意图;
图4为本申请实施例提供的另一种评级系统中的信息处理方法的实现流程示意图;
图5为本申请实施例提供的一种评级系统中的信息处理装置的组成结构示意图;
图6为本申请实施例提供的一种硬件实体示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)ESG是一种关注企业环境、社会和治理绩效的投资理念。这是投资者在投资时用于衡量企业的可持续性和环境、社会影响所关注的三个核心因素,这种策略也被成为责任投资。环境、社会及管治报告(ESG报告)是企业在其环境、社会及管治等方面政策和表现,及其有重大影响定期向投资者等利益相关方进行披露的沟通方式。企业通过定期发布ESG报告可以加强风险管理、改善集资能力、满足供应链需求、提升声誉、缩减成本及提供利润率、鼓励创新、保留人才和获得社会认可。
2)远程字典服务(Remote Dictionary Server,Redis),是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、键值(Key-Value)存储数据库,并提供多种语言的应用程序接口。
图1为本申请实施例提供的一种评级系统中的信息处理方法的系统架构示意图,如图1所示,在该系统架构中至少包括:信息分发节点101、至少两个信息处理节点102和目标数据库103。其中,
信息分发节点101,用于将获取的待处理媒体信息下发给至少两个信息处理节点102;
信息处理节点102,用于接收信息分发节点101分发的待处理媒体信息,处理内容包括媒体信息去重、确定媒体信息的评级标签等;
目标数据库103,用于接收信息处理节点102发送的待处理媒体信息标识,与目标数据库中存储的已处理媒体信息标识进行比对,确定待处理媒体信息是否已经处理过,并将用于表征所述待处理媒体信息是否被处理过的处理结果返回信息处理节点102。
这里,评级系统中的信息处理系统可以为分布式系统,其中,分布式系统是多个计算节点通过通信线路互联而构成的松散耦合的系统。具有以下四个特征:特征一、分布性,分布式系统由多台计算节点组成,这些计算节点在地域上是分散的,可以散布在一个单位、一个城市、一个国家,甚至全球范围内。整个系统的功能是分散在各个计算节点上实现的,因而分布式系统具有数据处理的分布性。特征二、自治性,分布式系统中的各个计算节点都包含独立的处理机和内存,各自具有独立的处理数据的功能。通常,彼此在地位上是平等的,无主次之分,既能自治地进行工作,又能利用共享的通信线路来传送信息,协调信息处理。特征三、并行性,一个大的任务可以划分为若干个子任务,分别在不同的计算节点执行。特征四、全局性,分布式系统中必须存在一个单一的、全局的进程通信机制,使得任何一个进程都能与其他进程通信,并且不区分本地通信与远程通信。同时,还应当有全局的保护机制。系统中所有机器上有统一的系统调用集合,必须适应分布式的环境。
图2为本申请实施例提供一种评级系统中的信息处理方法的实现流程示意图,应用于图1所示评级系统中的信息处理系统中的每一信息处理节点,如图2所示,该方法包括:
步骤S201、获取至少一个待处理媒体信息;
在一些实施例中,如图1所示,信息处理节点从信息分发节点接收待处理媒体信息,其中,待处理媒体信息可以来自不同的新闻媒体、组织机构、企业公司政府等,例如某公司网站、某协会报纸等。在实施过程中,待处理媒体信息还可以是由数据源供应商根据ESG评级提供对应的海量待处理媒体信息,以满足评级需求。
在一些实施例中,首先,待处理媒体信息由数据源供应商推送到系统前置机上,然后在计算ESG评级时,如图1所示,任务分发节点101可以在系统前置机上下载对应时间段的待处理媒体信息。这里,系统前置机属于网络架构中的前端机器,网络架构的设置从安全角度考虑,可以为两层网络,第一层网络直接暴露于公网,第二层网络才是业务真正部署的区域,系统前置机属于第一层网络。
在另一些实施例中,待处理媒体信息可以是系统前置机批量推送给信息处理节点的,例如,可以将一小时的待处理媒体信息汇总推送。
步骤S202、基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;
在实施过程中,目标数据库可以是远程字典服务,其中,远程字典服务是一个高性能的键值存储数据库。
远程字典服务中可以存储媒体信息的标识。在一些实施例中,待处理媒体信息的标识可以是新闻媒体或新闻网站提供的新闻自带的标识(Identity document,ID)。其中,媒体信息标识可以是根据新闻发布的媒体或网站、新闻时间和新闻正文生成的。
如图1所示,目标数据库103为每台参与计算的信息处理节点102提供一个共享的超大内存,任意一个信息处理节点102在这个超大内存上的存储结果,其他信息处理节点102都可以查询到。例如,任意一个信息处理节点102在远程字典服务中记录了已入库媒体信息的标识或正在处理的媒体信息的标识,那么其他信息处理节点102都可以查询到该已入库媒体信息的标识或正在处理的媒体信息的标识。
在一些实施例中,目标数据库通过比对待处理媒体信息的标识,与已经记录在目标数据库中的已入库媒体信息的标识(或正在处理的媒体信息的标识)来确定待处理媒体信息是否被处理过。在处理结果为待处理媒体信息的标识与任意一个已入库媒体信息的标识达到匹配条件的情况下,确定待处理媒体信息已经处理过;在处理结果为待处理媒体信息的标识与每一个已入库媒体信息的标识没有达到匹配条件的情况下,确定待处理媒体信息没有处理过。
步骤S203、当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;
在实施过程中,目标数据库中未存储所述待处理媒体信息,可以说明该待处理媒体信息为被处理。如图1所示,当处理结果表征所述目标数据库中未存储所述待处理媒体信息时,多个信息处理节点102可以并行为多个未存储的待处理媒体信息确定待处理媒体信息的评级标签。
在实施过程中,存在待处理媒体信息被多个媒体或网站转发的情况。在新闻被转发的情况下,因为发布新闻的平台不同,所以新闻对应不同的标识,可以确定多条关键词相同或满足预设条件的新闻为被引用的新闻。
在一些实施例中,例如,ESG评级时,需要获取待处理媒体信息的被引用次数作为评级的参考;如果某条新闻的被引用次数多,那么表明该条新闻比较重要,如果设置权重的话,被引用次数多的新闻,权重就设置的大一些;被引用次数少的新闻,权重就设置的小一些。
步骤S204、存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
目标实体可以是参与评级的参与方。例如,参与ESG评级的公司等。从待处理的媒体信息中可以提取得到媒体信息的播报对象,即目标实体。这里,目标实体也可以体现在在评级标签中。这样,评级系统中的信息处理节点可以存储携带评级标签的待处理媒体信息,然后基于评级标签,对所述待处理媒体信息关联的目标实体进行评级。
在实施过程中,如图1所示,多个信息处理节点102可以并行处理,将携带所述评级标签的待处理媒体信息进行存储。
在一些实施例中,存储携带评级标签的待处理媒体信息的数据库可以是区别与目标数据库103的一种关系型数据库,指采用了关系模型来组织数据的数据库。
关系型数据库具有以下优点:1、安全:因为存储在磁盘中,不会因为突然断电,导致数据丢失;2、容易理解:关系型数据库中采用的是二维表结构,二维表结构是非常贴近逻辑世界的一个关系模型,关系模型相对网状、层次等其他模型来说更容易理解;3、使用方便:关系型数据库中采用通用的结构化查询语言(Structured Query Language,SQL)使得操作关系型数据库非常方便;4、易于维护,丰富的完整性(实体完整性、参照完整性和用户定义的完整性),大大减低了数据冗余和数据不一致的概率。
本发明实施例具有以下有益效果:
与相关技术中评级系统处理新闻公告无法在处理过程中对重复新闻公告进行去重处理的方式相比,本申请实施例中,评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,首先,获取至少一个待处理媒体信息;然后基于共享的目标数据库对待处理媒体信息进行去重处理,得到处理结果。这样,由于目标数据库中存储的媒体信息处理节点都能够共享查询,所以可以实现多个信息处理节点并行处理,将待处理媒体信息的标识与目标数据库中存储的媒体信息进行比对,确定新闻是否已经被处理,以实现媒体信息去重。利用共享的目标数据库可以完成有效待处理媒体信息的去重,降低因为媒体信息重复统计导致的数据记录错误进而导致评级效果夸大,解决了重复处理媒体信息入库的隐患。
与相关技术中评级系统处理新闻公告为多个处理节点串行处理的方式相比,本申请实施例中,当处理结果表征目标数据库中未存储待处理媒体信息时,确定待处理媒体信息的评级标签;最后,存储携带评级标签的待处理媒体信息,以基于评级标签,对待处理媒体信息关联的目标实体进行评级。这样,利用信息处理节点并行处理待处理媒体信息极大提升了系统处理媒体信息的效率,解决了处理媒体信息速度慢的问题。
基于前述的实施例,本申请实施例提供一种评级系统中的信息处理方法,应用于信息处理节点,所述评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,所述评级系统还包括信息调度节点和用于下发待处理媒体信息的信息分发节点,该方法包括:
步骤S211、获取至少一个待处理媒体信息;
在实施过程中,提供二种获取至少一个待处理媒体信息的方法,包括方法一和方法二:
方法一、接收所述信息调度节点发送的至少一个待处理媒体信息;其中,所述至少一个待处理媒体信息,为所述信息调度节点对所述至少两个信息处理节点进行负载均衡后所发送。
在实施过程中,可以利用信息调度节点进行负载均衡,设置一个虚拟互联网协议地址(Internet Protocol Address,IP),系统前置机可以首先定时向有虚拟IP的负载均衡器发送至少两条待处理媒体信息,然后有虚拟IP的负载均衡器再利用负载均衡的方式想分布式系统中的多个信息处理节点分发待处理媒体信息。
方法二、按照先入先出的顺序,从消息队列中读取所述至少一个待处理媒体信息;其中,所述消息队列,用于存储所述信息分发节点下发的待处理媒体信息。
在实施过程中,可以通过消息队列的方式,在信息分发节点和信息处理节点建立管道。这里的管道即信息处理队列。“消息”是在信息分发节点和信息处理节点之间传送的数据单位。消息可以非常简单,例如只包含文本字符串;也可以更复杂,可能包含嵌入对象。消息被发送到队列中。“消息队列”是在消息的传输过程中保存消息的容器。设置消息队列的主要目的是提供路由并保证消息的传递;如果发送消息时接收者不可用,消息队列会保留消息,直到可以成功地传递该消息。如图1所示,信息分发节点101将待处理媒体信息下发至信息处理队列中,信息处理节点102从信息处理队列中读取所述待处理媒体信息。
步骤S212、基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;
步骤S213、存储所述待处理媒体信息至所述目标数据库,以当再次获取到所述待处理媒体信息时,对所述待处理媒体信息进行丢弃处理;
在实施过程中,任意一个信息处理节点每读取到一条待处理媒体信息,需要利用目标数据库查询该待处理媒体信息是否有已经记录在目标数据库中。这样,如果查询到目标数据库中记录有该待处理媒体信息,说明该待处理媒体信息已经处理过或正在处理,那么信息处理节点就跳过该待处理媒体信息,对所述待处理媒体信息进行丢弃处理;如果查询到目标数据库中没有记录该待处理媒体信息,说明该待处理媒体信息没有处理过,那么就将该待处理媒体信息记录到目标数据库中。以实现基于共享的所述目标数据库对所述待处理媒体信息进行去重处理。
步骤S214、接收到所述信息分发节点发送的信息删除消息,所述信息删除消息,用于指示删除所述目标数据库中存储的所述待处理媒体信息;其中,所述信息删除消息为,所述信息分发节点检测到所述待处理媒体信息存在处理异常时发送;
在信息分发节点检测到所述待处理媒体信息存在处理异常时,发送信息删除消息给信息处理节点,用于指示删除目标数据库中存储的所述待处理媒体信息。
在一些实施例中,信息分发节点可以维持一个列表,以记录哪些媒体信息已经被正常处理,并存入目标数据库,在接收到已存入的目标数据库的新闻标识后,可以对列表中的新闻进行标记,以记录该条媒体信息是否被正常处理完。如果在预设的时段内未接收到所述信息处理节点返回的已分发媒体信息的标识(已分发媒体信息的标识是相对信息分发节点来说的),那么说明之前处理该媒体信息的信息处理节点已经出现异常,例如系统崩溃等,然后执行步骤S215。
在实施过程中,可以根据实际处理媒体信息的情况设置一个预设的时间段。在信息处理节点正常处理已分发媒体信息的情况下,在预设的时间段内信息分发节点是可以收到信息处理节点返回的已分发媒体信息的标识;在信息处理节点处理已分发媒体信息异常的情况下,在预设的时间段内信息分发节点无法收到信息处理节点返回的已分发媒体信息的标识,这样,可以确定信息处理节点未处理已分发新闻。
步骤S215、基于所述信息删除消息,删除所述目标数据库中存储的所述待处理媒体信息;
在实施过程中,因为信息分发节点下发给信息处理节点的待处理媒体信息已经记录在目标数据库中,但该待处理媒体信息由于信息处理节点异常无法处理,所以需要信息分发节点通知所述目标数据库删除所述已分发媒体信息的标识。以使得信息分发节点重新分发媒体信息时,可以正常处理该媒体信息,不会因为重新处理媒体信息时,因为目标数据库已经记录了该媒体信息的标识而出现漏掉该媒体信息的情况。
步骤S216、发送用于指示所述待处理媒体信息已删除的信息删除提示至所述信息分发节点,以使所述信息分发节点重新下发所述待处理媒体信息;
在实施过程中,信息分发节点接收到用于指示所述待处理媒体信息已删除的信息删除提示,可以重新下发所述待处理媒体信息给评级系统中可以正常处理媒体信息的信息处理节点,以完成该媒体信息的处理。
步骤S217、当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;
步骤S218、存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
本申请实施例中,评级系统中的多个信息处理节点通过信息调度节点利用负载均衡接收待处理媒体信息,可以实现多个信息处理节点并行多条处理待处理媒体信息的效果,有效提升系统处理新闻的效率。
本发明实施例具有以下有益效果:
与相关技术中评级系统处理新闻公告为多个处理节点串行处理的方式相比,本申请实施例中,评级系统中的多个信息处理节点并行从信息处理队列中读取所述待处理媒体信息,可以实现将信息分发节点和信息处理节点解耦,有效避免信息分发节点和信息处理节点任意一方出现问题导致另一方无法正常工作的问题。
与相关技术中在评级系统处理新闻公告处理中出现异常影响新闻处理的方式相比,本申请实施例中,在某个信息处理节点在处理过程出了异常的情况下,需要首先将该待处理媒体信息去重信息去掉,然后将该待处理媒体信息分发给其他信息处理节点进行处理。这样,可以在任意一个信息处理节点无法正常处理待处理媒体信息的情况下实现待处理媒体信息的重新分配处理,不会影响待处理媒体信息的有效处理。
图3为本申请实施例提供一种评级系统中的信息处理方法的实现流程示意图,应用于图1所示评级系统中的信息处理系统中的每一信息处理节点,如图3所示,该方法包括:
步骤S301、获取至少一个待处理媒体信息;
步骤S302、基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;
步骤S303、当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,对所述待处理媒体信息进行关键内容提取;
在实施过程中,在确定所述待处理媒体信息未被处理的情况下,需要对待处理的媒体信息进行处理。这里,处理媒体信息包括提取所述待处理媒体信息的关键词,关键词可以是从媒体信息标题、媒体信息正文内容等处提取的。
步骤S304、将提取得到的关键内容与至少两个候选评级标签所关联的内容进行匹配,得到匹配结果;
在实施过程中,候选评级标签可以以待评级参与方的业务为依据确定。例如ESG评级系统是对每个参与评级的参与方从环境、社会和公司治理三个维度进行评级,根据不同参与方的业务确定对应的候选评级标签。然后将提取得到的关键内容与至少两个候选评级标签所关联的内容进行匹配,得到匹配结果。这里,可以使用行业字典和语义分析法进行关联内容的匹配。
步骤S305、根据所述匹配结果,确定所述待处理媒体信息的评级标签;
在实施过程中,可以根据关键内容和候选评级标签确定待处理媒体信息的评级标签。
以统计媒体信息的热度为例,在一些实施例中,在确定待处理媒体信息的关键词和数据库中已入库新闻的关键词满足预设条件的情况下,需要对之前统计的已入库新闻的条数更新。在实施过程中,例如数据库中已入库的某某主管离职新闻的被引用次数为10,在确定待处理媒体信息的关键词和数据库中某某主管离职新闻的关键词满足预设条件的情况下,将某某主管离职新闻的被引用次数增加1次,修改为11次。在一些实施例中,在确定待处理媒体信息的关键词和数据库中已入库处理新闻的关键词不满足条件的情况下,确定待处理媒体信息的被引用次数为1。
在确定待处理媒体信息的关键词和数据库中已入库媒体信息的关键词满足预设条件的情况下,通过确定满足所述预设条件的已入库媒体信息的条数来确定所述待处理媒体信息的被引用次数。这样,每次有相同或相似媒体信息入库时,可以有效统计出该媒体信息的被引用次数。
步骤S306、确定所述评级标签归属的评级维度;
在实施过程中,可以根据评级标签的内容确定评级维度。例如:评级维度为环境、社会和公司治理,可以将污染物排放相关的评级标签归属于环境,将大量公司员工离职的评级标签归属于公司治理,将参与社会福利捐助的评级标签归属于社会。
步骤S307、基于确定的评级维度,存储携带所述评级标签的待处理媒体信息,以基于所述评级标签确定所述目标实体针对所述评级维度的评分,并基于所述目标实体在至少两个评级维度的评分,对所述目标实体进行评级;
在一些实施例中,例如ESG评级系统,最后根据分析媒体信息得到的评级标签可以以评分的形式体现。例如,某某公司在环境维度得到5分,在社会维度得到6分,在公司治理维度得到10分,那么某某公司的总评分为21分。
步骤S308、获取未确定评级标签的待处理媒体信息的数量;
在实施过程中,每次评级标签的待处理媒体信息的数量是不同的,所以需要获取未确定评级标签的待处理媒体信息的数量。
步骤S309、上报所述数量信息,以结合至少两个所述信息处理节点上报的数量信息,对所述评级系统中信息处理节点的数量进行调整。
在一些实施例中,获取待处理媒体信息数量大于第一阈值的情况下,可以通过增加信息处理节点的数量来实现系统在一定时间内能够完成待处理媒体信息的处理。这里,第一阈值可以指信息处理节点的数量。
在实施过程中,每次获取的待处理媒体信息的数量是不同的,在获取待处理媒体信息数量小于第一阈值的情况下,可以通过减少信息处理节点的数量来实现系统在一定时间内完成待处理媒体信息的处理。这里,第二阈值也可以指信息处理节点的数量。根据实际情况,第一阈值可以等于第二阈值,也可以大于第二阈值。
本发明实施例具有以下有益效果:
与相关技术中评级系统处理新闻公告为多个处理节点串行处理,对新闻公告进行打标签的方式相比,本申请实施例中,首先提取所述待处理媒体信息的关键内容,然后将提取得到的关键内容与至少两个候选评级标签所关联的内容进行匹配,确定待确定所述待处理媒体信息的评级标签,最后基于所述评级标签确定所述目标实体针对所述评级维度的评分,并基于所述目标实体在至少两个评级维度的评分,对所述目标实体进行评级。这样,根据提取所述待处理媒体信息的关键内容,为ESG评级系统提供了评级的参考,完成对目标实体的评级。
与相关技术中级系统处理新闻公告为多个处理节点串行处理,处理新闻公告无法在处理过程中对重复新闻公告进行去重处理的方式相比,本申请实施例中,当某一时段需要处理能力很高时,系统可以通过添加信息处理节点的数量来加速该过程,当不需要这么高处理能力时系统可以缩减信息处理节点的数量。这样,评级系统中的信息处理可以实现并行化,处理能力可伸缩整的效果,并行在伸缩资源过程中对数据正确性完全没有影响。
ESG为一个评级系统,就类似穆迪、标普一样,而且每个人每个机构都可以有自己的评级系统。对于ESG评级来说最重要的就是消息源,消息源里面目前最重要的就是新闻,因为新闻数量庞大,对ESG评级有深远影响。
目前的ESG系统处理新闻和公告,采用单台机器串行执行,是靠外界数据源供应商推送到系统前置机上,计算评级时相应的机器再去系统前置机上下载对应时间段的文件,读取并打上标签然后入库。当需要计算较长时间段的评级时,意味着读取较大时间段的新闻数据,由于处理过程是串行的,处理新闻效率低下。但如果并行处理新闻,由于新闻有重复,所以会存在重复处理新闻入库的隐患,并带数据记录错误进而导致评级效果夸大的问题。
基于前述的实施例,本申请实施例以待处理媒体信息为新闻为例,提供的评级系统中的信息处理方法的另一种实现流程示意图,如图4所示,所述评级系统中的信息处理方法包括以下步骤:
步骤S401、信息分发节点下发待处理媒体信息给至少两个信息处理节点;
下发待处理媒体信息给至少两个信息处理节点有两种自动化程度较高的方案:
方案一、所有信息处理节点共享一个虚拟IP,该虚拟IP对应一个负载均衡器。每次系统前置机发送任务时都向有虚拟IP的负载均衡器发送请求,然后由负载均衡器将待处理媒体信息均匀的分到每个信息处理节点。这里,有虚拟IP的负载均衡器的作用可以是实现平均分配待处理媒体信息的负载均衡,以使得每个信息处理节点都可以高效工作。
方案二、通过消息队列的方式,在信息分发节点和信息处理节点建立管道;这样,可以现在将信息分发节点和信息处理节点解耦,二者本来属于不同角色,但因为上下游的关系,一方出问题都将导致对方无法正常工作,采用消息队列能有效避免这种状况。处理能力的提高,在方案二中,信息分发节点的产出任务的能力远远大于信息处理节点处理任务的能力,假设二者处理能力是1比10的关系,那么理论上部署1个信息分发节点、10个信息处理节点将能充分发挥消息队列的能力,也就是说能将原先的新闻公告处理能力提高到10倍。
步骤S402、信息处理节点利用远程字典服务确定所述待处理媒体信息是否被处理过;
在一些实施例中,可以维护一个新闻已处理记录表,实现新闻去重。在实施过程中,不同机器本地缓存同步问题,可以采用云远程字典服务解决,即每台参与计算的信息处理节点都拥有一个共享的超大内存,在这个超大内存上的记录和查询,其他信息处理节点都能感知到。这样,信息处理节点每读取到一条新闻,先去远程字典服务上查询是否有重复,如果无重复就信息处理节点将该新闻提交到远程字典服务上,如果有重复,信息处理节点则跳过该新闻不做处理。
步骤S403、在确定所述待处理媒体信息未被处理过的情况下,信息处理节点完成所述待处理媒体信息的处理。
使用以上两种方案处理新闻的优势还包括可伸缩性,当某一时段需要处理能力很高时,可以添加资源来加速该过程,当不需要这么高处理能力时可以缩减资源,整个过程对数据正确性完全没有影响。
在一些实施例中,基于一些异常状况的考虑,如果某个信息处理节点在处理新闻过程出了异常,这种架构也是可以支持重跑某个批任务的,但中间需要注意处理某个新闻的过程中出现异常时一定要将该新闻去重信息去掉,这样重跑时才能不漏掉这个新闻,尤其是处理某个重要新闻出现异常时。在实施过程中,可以由该信息处理节点强制上报。
本发明实施例具有以下有益效果:
与相关技术中评级系统处理新闻公告为多个处理节点串行处理,对新闻公告进行打标签的方式相比,本申请实施例中,使用布式系统的信息处理节点处理新闻,系统处理新闻的能力不仅可以提高很多,而且从结构上具有伸缩性,当新闻量少时,可以用少量机器支持,当新闻量多时,可以用大量机器资源支持。采用第三方内存远程字典服务有效解决了新闻去重的问题。
基于前述的实施例,本申请实施例提供一种评级系统中的信息处理装置,该装置包括所包括的各模块、以及各模块所包括的各子模块,各子模块包括的各单元,可以通过计算机设备中的处理器来实现;当然也可通过具体的逻辑电路实现。
图5为本申请实施例提供的一种评级系统中的信息处理装置的组成结构示意图,应用于信息处理节点,所述评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,如图5所示,评级系统中的信息处理装置500包括:
第一获取模块501,用于获取至少一个待处理媒体信息;
去重模块502,用于基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;
确定模块503,用于当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;
评级模块504,用于存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
在一些实施例中,所述评级系统还包括信息调度节点,所述第一获取模块501还用于接收所述信息调度节点发送的至少一个待处理媒体信息;其中,所述至少一个待处理媒体信息,为所述信息调度节点对所述至少两个信息处理节点进行负载均衡后所发送。
在一些实施例中,所述评级系统还包括信息分发节点,所述第一获取模块501还用于按照先入先出的顺序,从消息队列中读取所述至少一个待处理媒体信息;其中,所述消息队列,用于存储所述信息分发节点下发的待处理媒体信息。
在一些实施例中,所述装置还包括存储模块,用于存储所述待处理媒体信息至所述目标数据库,以当再次获取到所述待处理媒体信息时,对所述待处理媒体信息进行丢弃处理。
在一些实施例中,所述评级系统还包括用于下发待处理媒体信息的信息分发节点,所述装置还包括接收模块和删除模块,其中,所述接收模块,用于接收到所述信息分发节点发送的信息删除消息,所述信息删除消息,用于指示删除所述目标数据库中存储的所述待处理媒体信息;其中,所述信息删除消息为,所述信息分发节点检测到所述待处理媒体信息存在处理异常时发送;所述删除模块,用于基于所述信息删除消息,删除所述目标数据库中存储的所述待处理媒体信息。
在一些实施例中,所述装置还包括发送模块,用于发送用于指示所述待处理媒体信息已删除的信息删除提示至所述信息分发节点,以使所述信息分发节点重新下发所述待处理媒体信息。
在一些实施例中,所述去重模块502包括确定子模块,评级子模块,其中,所述确定子模块,用于确定所述评级标签归属的评级维度;所述评级子模块,用于基于确定的评级维度,存储携带所述评级标签的待处理媒体信息,以基于所述评级标签确定所述目标实体针对所述评级维度的评分,并基于所述目标实体在至少两个评级维度的评分,对所述目标实体进行评级。
在一些实施例中,所述确定模块503包括提取子模块,匹配子模块和确定子模块,其中,所述提取子模块,用于对所述待处理媒体信息进行关键内容提取;所述匹配子模块,用于将提取得到的关键内容与至少两个候选评级标签所关联的内容进行匹配,得到匹配结果;所述确定子模块,用于根据所述匹配结果,确定所述待处理媒体信息的评级标签。
在一些实施例中,所述装置还包括第二获取模块和上报模块,其中,所述第二获取模块,用于获取未确定评级标签的待处理媒体信息的数量;所述上报模块,用于上报所述数量信息,以结合至少两个所述信息处理节点上报的数量信息,对所述评级系统中信息处理节点的数量进行调整。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述评级系统中的信息处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机存储介质中,包括若干指令用以使得一台计算机设备执行本申请各个实施例所述方法的全部或部分。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述评级系统中的信息处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得计算机设备(可以是笔记本电脑、台式计算机、服务器等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
对应地,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的评级系统中的信息处理方法中的步骤。
对应地,本申请实施例提供一种计算机设备,图6为本申请实施例提供的一种硬件实体示意图,如图6所示,该设备600的硬件实体包括:包括存储器601和处理器602,所述存储器601存储有可在处理器602上运行的计算机程序,所述处理器602执行所述程序时实现上述实施例中提供的方法中的步骤。
存储器601配置为存储由处理器602可执行的指令和应用,还可以缓存待处理器602以及设备600中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random Access Memory,RAM)实现。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得计算机设备执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (13)

1.一种评级系统中的信息处理方法,其特征在于,应用于信息处理节点,所述评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,所述方法包括:
获取至少一个待处理媒体信息;
基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;
当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;
存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
2.如权利要求1所述的方法,其特征在于,所述评级系统还包括信息调度节点,所述获取至少一个待处理媒体信息,包括:
接收所述信息调度节点发送的至少一个待处理媒体信息;
其中,所述至少一个待处理媒体信息,为所述信息调度节点对所述至少两个信息处理节点进行负载均衡后所发送。
3.如权利要求1所述的方法,其特征在于,所述评级系统还包括信息分发节点,所述获取至少一个待处理媒体信息,包括:
按照先入先出的顺序,从消息队列中读取所述至少一个待处理媒体信息;
其中,所述消息队列,用于存储所述信息分发节点下发的待处理媒体信息。
4.如权利要求1所述的方法,其特征在于,所述确定所述待处理媒体信息的评级标签之前,所述方法还包括:
存储所述待处理媒体信息至所述目标数据库,以当再次获取到所述待处理媒体信息时,对所述待处理媒体信息进行丢弃处理。
5.如权利要求4所述的方法,其特征在于,所述评级系统还包括用于下发待处理媒体信息的信息分发节点,所述方法还包括:
接收到所述信息分发节点发送的信息删除消息,所述信息删除消息,用于指示删除所述目标数据库中存储的所述待处理媒体信息;
其中,所述信息删除消息为,所述信息分发节点检测到所述待处理媒体信息存在处理异常时发送;
基于所述信息删除消息,删除所述目标数据库中存储的所述待处理媒体信息。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
发送用于指示所述待处理媒体信息已删除的信息删除提示至所述信息分发节点,以使所述信息分发节点重新下发所述待处理媒体信息。
7.如权利要求1所述的方法,其特征在于,所述存储携带所述评级标签的待处理媒体信息,包括:
确定所述评级标签归属的评级维度;
基于确定的评级维度,存储携带所述评级标签的待处理媒体信息,以基于所述评级标签确定所述目标实体针对所述评级维度的评分,并基于所述目标实体在至少两个评级维度的评分,对所述目标实体进行评级。
8.如权利要求1所述的方法,其特征在于,所述确定所述待处理媒体信息的评级标签,包括:
对所述待处理媒体信息进行关键内容提取;
将提取得到的关键内容与至少两个候选评级标签所关联的内容进行匹配,得到匹配结果;
根据所述匹配结果,确定所述待处理媒体信息的评级标签。
9.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取未确定评级标签的待处理媒体信息的数量;
上报所述数量信息,以结合至少两个所述信息处理节点上报的数量信息,对所述评级系统中信息处理节点的数量进行调整。
10.一种评级系统中的信息处理装置,其特征在于,应用于信息处理节点,所述评级系统包括至少两个所述信息处理节点,所述至少两个信息处理节点共享目标数据库,所述装置包括:
第一获取模块,用于获取至少一个待处理媒体信息;
去重模块,用于基于共享的所述目标数据库对所述待处理媒体信息进行去重处理,得到处理结果;其中,所述目标数据库用于存储所述评级系统的媒体信息;
确定模块,用于当所述处理结果表征所述目标数据库中未存储所述待处理媒体信息时,确定所述待处理媒体信息的评级标签;
评级模块,用于存储携带所述评级标签的待处理媒体信息,以基于所述评级标签,对所述待处理媒体信息关联的目标实体进行评级。
11.一种计算机设备,其特征在于,所述设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至9任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有可执行指令,用于引起处理器执行时,实现权利要求1至9任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9任一项所述的方法。
CN202110158837.9A 2021-02-04 2021-02-04 评级系统中的信息处理方法、设备、可读存储介质 Pending CN112905574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110158837.9A CN112905574A (zh) 2021-02-04 2021-02-04 评级系统中的信息处理方法、设备、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110158837.9A CN112905574A (zh) 2021-02-04 2021-02-04 评级系统中的信息处理方法、设备、可读存储介质

Publications (1)

Publication Number Publication Date
CN112905574A true CN112905574A (zh) 2021-06-04

Family

ID=76122583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110158837.9A Pending CN112905574A (zh) 2021-02-04 2021-02-04 评级系统中的信息处理方法、设备、可读存储介质

Country Status (1)

Country Link
CN (1) CN112905574A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872937A (zh) * 2021-08-26 2021-12-31 湖南快乐阳光互动娱乐传媒有限公司 一种媒资注入方法及装置
CN116028235A (zh) * 2021-10-26 2023-04-28 腾讯科技(深圳)有限公司 自媒体信息处理方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872937A (zh) * 2021-08-26 2021-12-31 湖南快乐阳光互动娱乐传媒有限公司 一种媒资注入方法及装置
CN116028235A (zh) * 2021-10-26 2023-04-28 腾讯科技(深圳)有限公司 自媒体信息处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US10223431B2 (en) Data stream splitting for low-latency data access
CN109254966B (zh) 数据表查询方法、装置、计算机设备及存储介质
US10176225B2 (en) Data processing service
US9798831B2 (en) Processing data in a MapReduce framework
US8458203B2 (en) Optimizing data processing using dynamic schemas
US12032525B2 (en) Systems and computer implemented methods for semantic data compression
US20080140684A1 (en) Systems and methods for information categorization
CN112905574A (zh) 评级系统中的信息处理方法、设备、可读存储介质
US11100152B2 (en) Data portal
CN111858760B (zh) 一种异构数据库的数据处理方法及装置
KR20140096936A (ko) Dlp 시스템의 빅데이터 처리 시스템 및 방법
CN112307122A (zh) 一种基于数据湖的数据管理系统及方法
US11848907B2 (en) Automated email legal hold
US20210374339A1 (en) Generating sentiment analysis of content
US20110264628A1 (en) Data collector
CN113360500A (zh) 数据处理方法及装置、存储介质、电子设备
CN111753019B (zh) 一种应用于数据仓库的数据分区方法和装置
US20190251201A1 (en) Information searching system and information searching method
US12038979B2 (en) Metadata indexing for information management using both data records and associated metadata records
CN112052259A (zh) 数据处理方法、装置、设备及计算机存储介质
US10628466B2 (en) Smart exchange database index
CN116307980A (zh) 一种基于规则引擎的订单匹配方法、装置以及规则引擎
CN113704222A (zh) 一种处理业务请求的方法和装置
Yao et al. MEMoMR: Accelerate MapReduce via reuse of intermediate results
CN110597802B (zh) 消息处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination