CN114462417A - 一种应用于大数据的评论文本处理方法及存储介质 - Google Patents
一种应用于大数据的评论文本处理方法及存储介质 Download PDFInfo
- Publication number
- CN114462417A CN114462417A CN202111647860.0A CN202111647860A CN114462417A CN 114462417 A CN114462417 A CN 114462417A CN 202111647860 A CN202111647860 A CN 202111647860A CN 114462417 A CN114462417 A CN 114462417A
- Authority
- CN
- China
- Prior art keywords
- comment
- text
- commerce
- integration
- semantic feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开的应用于大数据的评论文本处理方法及存储介质,能够根据预存的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识确定电商对象反馈评论对应的分治整合的目标语义特征区分标识,基于目标语义特征区分标识对电商对象反馈评论进行分治整合并进行文本表达性修正处理。如此,能够将评论倾向中相似的文本进行整理从而形成语义特征,这样既能确保电商对象反馈评论的文本表达意图,又能提供进行文本校正参考的语义特征。此外,通过进行文本表达性修正处理,能够优先基于电商对象真实表达意图的角度进行修正处理,也即在真实表达意图和文本准确性存在矛盾时,能倾向于真实表达意图角度的文本表达性修正处理。
Description
技术领域
本申请涉及大数据和文本处理技术领域,特别涉及一种应用于大数据的评论文本处理方法及存储介质。
背景技术
随着电子信息产业的快速发展,互联网的数据量呈几何倍数增长,现代社会正处于大数据时代。面对数据量规模达PB甚至EB级以上的数据,不仅在数据存储上,也在数据处理上带来了巨大的压力。当个别计算机设备难以存储或者处理如此庞大的数据时,可以采用多台计算机设备来协同处理,大数据技术和云计算概念应运而生。
所谓大数据,并不是定量地规定数据量达到多少TB、多少PB或者多少EB。对于大数据的概念而言,需要从数据的“质量”方面进行考虑。一般而言,大数据是指无法在可承受的时间范围内通过常规工具进行捕捉、管理和处理的数据集合。
现目前,大数据的应用近乎涉及方方面面,比如信息检索与大数据搜索、汉语分词、文本分类与聚类、话题发现、情感分析、电商用户画像分析等。以电商用户画像分析为例,大数据技术通常可以基于电商用户的相关评论进行画像分析。然而一些电商用户在进行反馈评论输出时,由于各自的遣词造句能力的差异,可能导致反馈评论存在一些文本瑕疵,在这种情况下,需要对反馈评论进行文本校正,然而在采用相关技术进行文本校正时可能会改变电商用户真实的评论意图。
发明内容
本申请实施例之一提供一种应用于大数据的评论文本处理方法,所述方法包括:确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识;根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识;基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理。
本申请实施例之一提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述的方法。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本发明的一些实施例所示的一种示例性应用于大数据的评论文本处理方法和/或过程的流程图;
图2是根据本发明的一些实施例所示的一种示例性应用于大数据的评论文本处理方法和/或过程的另一流程图;
图3是根据本发明的一些实施例所示的一种示例性应用于大数据的评论文本处理装置的框图,以及
图4是根据本发明的一些实施例所示的一种示例性大数据评论文本处理服务器中硬件和软件组成的示意图。
具体实施方式
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
为改善如背景技术所述的技术问题,发明人针对性地提出了一种应用于大数据的评论文本处理方法及存储介质,能够将评论倾向中相似的文本进行整理从而形成语义特征,这样既能确保电商对象反馈评论的文本表达意图,又能提供进行文本校正参考的语义特征,从而在一定程度上确保适当程度下的文本校正的顺利实施。下面分别基于方法实施例、装置实施例以及系统实施例进行进一步说明。
首先,对应用于大数据的评论文本处理方法进行示例性的说明,请参阅图1,是根据本发明的一些实施例所示的一种示例性应用于大数据的评论文本处理方法和/或过程的流程图,应用于大数据的评论文本处理方法可以包括以下步骤S110-步骤S130所描述的技术方案。
以下S110-S130可以应用于与电商互动端通信的大数据评论文本处理服务器。
S110,大数据评论文本处理服务器确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识。
在一些可能的实施例中,评论文本修正处理可以理解为对相关的文本字段或者关键词进行替换或者笔误校正,从而避免这些文本字段或者关键词被被曲解,进而确保电商对象反馈评论的表达质量,避免电商对象反馈评论在信息表达上出现偏差。
电商对象反馈评论可以是电商互动端上传给大数据评论文本处理服务器的,大数据评论文本处理服务器可以根据一定程度上的文本校正工序,对电商对象反馈评论进行文本输出或者公开。而为了确保公开电商对象反馈评论时能够尽可能真实地表达电商对象的真实表达意图,同时又能够满足一定程度上的文本校正工序,需要进行适当的评论文本修正处理。
在实际处理过程中,通常需要对评论倾向对应的评论文本进行着重分析,而对于语义特征而言,由于语义特征包含了许多评论文本共有的文本描述,因此相关的意图分析技术可以基于语义特征得到不同电商对象的相关评论文本。为此,在进行修正处理之前,需要确定出评论倾向整合方式的语义特征区分标识。举例而言,评论倾向整合方式可以用于指示对相关的评论倾向进行融合从而得到语义特征,也即,评论倾向整合方式可以实现评论倾向朝语义特征的变换。而语义特征区分标识则可以用于区分存在差异的语义特征。
示例性地,评论倾向可以为“好评”、“差评”、“中评”等,评论倾向可以精准地反映出电商对象(电商用户)的相关评论文本,因而评论倾向对应的相关评论文本可能需要进行修正。语义特征可以为“对某个物品的使用体验不是很好”、“对某次购物体验非常满意”等,语义特征反映的是一部分电商对象的存在共性的语义表达,通过这些语义表达可以模糊地得出个别电商对象的评论文本,因此,对于语义特征而言,一般不需要进行大幅度修改。而本方案正是实现将评论倾向中相似的文本进行整理从而形成语义特征,这样既可以确保电商对象反馈评论的文本表达意图,又能够提供进行文本校正参考的语义特征。
在在一些可能的实施例中,步骤“确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识”,可以通过以下步骤实现:针对一组待进行评论文本修正处理的电商对象反馈评论,确定该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识。
在本方案中,待进行评论文本修正处理的电商对象反馈评论一般可以为多个,而通过对存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识进行确定,能够确保后续的文本表达性修正处理的整体层面的相关性,避免一些文本信息在被修正处理之后导致整体文本语义出现缺失或者偏差。其中,确定语义特征区分标识的方式可以通过提取相关的标识信息或者基于事先完成训练的人工智能网络实现,本申请实施例不作限制。
S120,大数据评论文本处理服务器根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识。
在在一些可能的实施例中,分治整合的语义特征区分标识可以理解为存在语义误解可能的语义特征区分标识,通俗地讲,在基于评论倾向整合方式进行语义特征处理时,可能会由于执行参量的误差而导致得到的语义特征仍然包含个别电商对象的评论文本,因此,为了将这类语义特征加以区分,可以确定每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,也即分治整合的语义特征区分标识对应的语义特征中包括一些个别电商对象的评论文本。
在这一基础上,通过确定所述电商对象反馈评论对应的分治整合(局部融合)的目标语义特征区分标识,能够为后续的文本表达性修正处理提供决策依据,从而在后续进行语义特征处理时避免上述可能存在的评论文本出现较大个体显著性的问题。
基于此,步骤“根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识”,可以包括以下内容:根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识。
在上述方案中,在确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识时,同样可以考虑存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,这样能够确保确定出的该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识之间存在一定的订单优化,进而确保后续修正处理时能够从整体层面出现,既可以确保评论文本的尽可能语义保留,又可以确保语义特征尽可能为文本修正提供正确的参考。
在在一些可能的实施例中,在执行上述步骤“根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识”之前,还可以包括以下内容:判断该组待进行评论文本修正处理的电商对象反馈评论中的每个待进行评论文本修正处理的电商对象反馈评论中是否均包含热门订单专题,如果否,则进行后续步骤;如果是,则判断该热门订单专题是否符合设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,如果否,则进行后续步骤。
举例而言,热门订单专题可以是与电商对象的订单交互相关的电商主题,比如与业务对象用户的在线支付行为相关的电商主题,与业务对象用户的商品浏览行为相关的电商主题,本申请实施例不作限制。
在执行上述步骤“根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识”之前进行热门订单专题的确定并进行热门订单激活指标的判断,能够提高确定得到的该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识的置信系数。
进一步地,设定的每种语义特征区分标识的分治整合对应的热门订单激活指标可以理解为针对热门订单的文本曲解检测条件,该条件可以根据历史文本误解记录进行配置,本申请实施例不作限制。
可以理解的时,如果对于热门订单相关的判断均为否,则可以理解为在“根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识”之前不存在意图误解激活指标,因而可以继续执行相关步骤。
相应地,在上述实施例的基础上,当该热门订单专题符合设定的每种语义特征区分标识的分治整合对应的热门订单激活指标时,所述方法还可以包括:根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,以及设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识。
如此设计,在确定待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识时,能够将热门订单专题和热门订单激活指标考虑在内,从而确保待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识的置信系数。
比如,在确定待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识时,可以基于热门订单专题和热门订单激活指标对应的目标订单文本进行分治整合条件或者策略的调整,从而得到对应的目标语义特征区分标识的挑选标准,这样可以根据该挑选标准确定对应的目标语义特征区分标识。
当然,在上述内容的基础上,可以继续实施以下步骤S130所对应的根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理。其中关于步骤“根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理”的说明将在后续进行展开说明。
在上述内容的基础上,为了准确、可靠地确定待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识,上述步骤“根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,以及设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识”,进一步可以通过以下方式实现:根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,确定该组待进行评论文本修正处理的电商对象反馈评论对应的热门订单的文本误解可能性,其中所述文本误解可能性为该组待进行评论文本修正处理的电商对象反馈评论对应的热门订单的买卖方沟通情况与存在异常的文本理解事件的测评结果;如果所述文本误解可能性大于设定的第一文本误解可能性阈值,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为文本歧义性标识;如果所述文本误解可能性小于设定的第二文本误解可能性阈值,则根据设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识,其中,所述第一文本误解可能性阈值大于所述第二文本误解可能性阈值。
举例而言,存在异常的文本理解事件可以是一些存在理解偏差的文本理解事件。通过将文本误解可能性与对应的文本误解可能性阈值进行比较分析,能够确定出不同情况下的目标语义特征区分标识,比如,文本歧义性标识用于表达文本描述对应的表达性误解度较高。又比如,设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识可以根据存在订单优化的电商对象反馈评论得到,这样可以确保在文本误解可能性较小时仍然能够根据关联语义特征区分标识准确可靠地确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识。如此,可以准确、可靠地确定待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识。
基于上述内容,步骤“根据设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识”,可以包括:判断该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的关联语义特征区分标识是否均为全局相关性语义描述;如果是,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为可调语义标识;如果否,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为不可调语义标识。举例而言,全局相关性语义描述可以用于表达存在关联的语义特征之间是随着时间或者文本逻辑复杂度的变化而变化的,这样以来,能够基于全局相关性语义描述的存在与否确定目标语义特征区分标识为可调语义标识还是不可调语义标识。
在另外的一些实施例中,上述步骤“根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识”,可以包括以下内容:根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识;挑选该组待进行评论文本修正处理的电商对象反馈评论对应的数量最多的分治整合的语义特征区分标识,将数量最多的分治整合的语义特征区分标识确定为该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识。
可以理解的是,在确定出存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识之后,通过对电商对象反馈评论的数量进行分析,能够将数量最多的分治整合的语义特征区分标识确定为该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识,从而确保目标语义特征区分标识具有较大的数据基础支撑,进而确保目标语义特征区分标识的准确性和可信度。
进一步地,上述步骤“根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识”,可以通过以下三种实施方式实现,当然,在实际实施过程中,并不限于以下三种实施方式。
第一种实施方式:当存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为顺序整合情况时,则该存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识为可调语义标识。在本实施方式中,顺序整合情况为根据时序先后顺序形成的文本语义整合情况,顺序整合情况具有可灵活调整和变换的特点,因此,在确定出存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为顺序整合情况时,可以确定对应的语义特征区分标识为可调语义标识。
第二种实施方式:当存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为分布式整合情况时,则该存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识为不可调语义标识。在本实施方式中,分布式整合情况为用于记录基于不同融合指示的并行整合情况,分布式整合情况不具有可灵活调整和变换的特点,因此,在确定出存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为分布式整合情况时,可以确定对应的语义特征区分标识为不可调语义标识。
第三种实施方式:当存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为图形化整合情况时,则该存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识为文本歧义性标识。在本实施方式中,图形化(Graphic Data)能够用于进行相关信息的图示化展示,一般而言,在需要进行文本歧义程度展示时,可以采用图形化进行展示,因此,在确定出存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为图形化整合情况时,可以确定对应的语义特征区分标识为文本歧义性标识。
如此设计,通过以上三个实施方式,能够根据整合情况的不同类型确定出存在差异的语义特征区分标识,从而完整、全面、准确地确定对应的语义特征区分标识。
S130,大数据评论文本处理服务器基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理。
在在一些可能的实施例中,文本表达性修正处理可以理解为多语语义算法,对于本申请实施例而言,可以先对电商对象反馈评论进行分治整合以筛分出个别电商对象的差异化信息,然后通过文本表达性对差异化信息进行修正处理,能够在尽可能确保得到的语义特征的内容正确性的前提下确保电商对象反馈评论的文本表达意图的准确性。
为实现这一目的,上述步骤“基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理”可以通过以下实施方式实现:根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理。在进一步的实施例中,上述步骤“根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理”,可以通过图2所示的步骤S210-S250实现。
S210,从确定的分治整合的目标语义特征区分标识中获取存在文本误解度子标签的待处理语义特征区分标识,基于所述待处理语义特征区分标识确定待进行评论文本测评的目标文本分词描述。
其中,分治整合的目标语义特征区分标识可以是多层次标识,而文本误解度子标签可以是用于表达不同标签对应的文本误解度,相应地,待处理语义特征区分标识可以是目标语义特征区分标识中的一部分标识,进一步地,通过待处理语义特征区分标识确定出的目标文本分词描述可以用于对电商对象反馈评论的文本表达性修正处理提供参考。
S220,对所述目标文本分词描述中的多个文本分词描述内容分别进行积极类评论文本识别和消极类评论文本识别,得到积极类评论文本识别结果集和消极类评论文本识别结果集。
比如,积极类评论文本可以是存在多端交互的评论文本比如购物交互或者产品质保交互,消极类评论文本可以是电商对象单方面输出的吐槽信息,本申请实施例不作限制。通过对这两类信息进行识别,能够为后续的文本校正处理提供完整准确的信息依据。
S230,采用第一设定文本修正模式,对所述积极类评论文本识别结果集进行第一文本修正,得到包括有积极类评论文本的第一文本分词描述修正结果;以及通过第二设定文本修正模式,对所述消极类评论文本识别结果集进行第二文本修正,得到包括有消极类评论文本的第二文本分词描述修正结果。
在相关实施中,设定文本修正模式可以是神经网络模型,关于神经网络模型的训练为现有技术,在此不作赘述。进一步地,文本修正可以是对相关信息设置文本校正执行指数标识,而文本校正执行指数标识可以用于表达对相关信息进行文本校正处理的可实施程度。
S240,基于所述第一文本分词描述修正结果和所述第二文本分词描述修正结果进行特征挑选操作,得到所述目标文本分词描述中与目标评论文本相适配的目标文本分词描述修正结果;所述目标评论文本包括积极类评论文本和消极类评论文本中的至少一种,所述目标文本分词描述修正结果用于对所述目标文本分词描述以及该组待进行评论文本修正处理的电商对象反馈评论进行评论文本测评。基于S230,能够实现对应的特征挑选操作,从而得到目标文本分词描述修正结果,这样可以基于目标文本分词描述修正结果对目标文本分词描述以及该组待进行评论文本修正处理的电商对象反馈评论进行评论文本测评。
S250,根据所述目标文本分词描述修正结果对所述目标文本分词描述以及该组待进行评论文本修正处理的电商对象反馈评论进行评论文本测评,得到意图输出测评结果;通过所述意图输出测评结果对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理。
在在一些可能的实施例中,对所述目标文本分词描述以及该组待进行评论文本修正处理的电商对象反馈评论进行评论文本测评可以理解为确定电商对象意图的文本曲解可能性,相应地,意图输出测评结果可以记载这一内容,基于此,通过意图输出测评结果对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理,能够优先基于电商对象真实表达意图的角度进行修正处理,也即在真实表达意图和文本准确性存在矛盾时,能够倾向于真实表达意图角度的文本表达性修正处理。
在一些选择性的实施例中,在上述步骤S110-步骤S130的基础上,还可以包括以下内容:对完成所述分治整合并完成所述文本表达性修正处理的电商对象反馈评论对应的电商互动端进行跨境信息安防机制的确定。进一步地,关于跨境信息安防机制的确定可以通过以下内容实现:对目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息;通过所述可视化订单处理信息创建所述目标电商互动端的数字化订单队列对应的整体性订单行为画像,并结合事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,从所述多个存在差异的电子商务安防项目中挑选与所述目标电商互动端相适配的电子商务安防项目;根据与所述目标电商互动端相适配的电子商务安防项目,确定针对所述目标电商互动端的跨境信息安防机制。
在在一些可能的实施例中,关于上述步骤“对目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息;通过所述可视化订单处理信息创建所述目标电商互动端的数字化订单队列对应的整体性订单行为画像,并结合事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,从所述多个存在差异的电子商务安防项目中挑选与所述目标电商互动端相适配的电子商务安防项目;根据与所述目标电商互动端相适配的电子商务安防项目,确定针对所述目标电商互动端的跨境信息安防机制”的进一步说明可以参阅以下内容。
S1,对目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息。
例如,电商互动端可以是具有电子商务处理能力的智能电子设备,诸如手机、平板电脑、个人计算机等小型设备,亦或者智能计算机和云计算服务器等大型设备,本申请实施例不作限制。进一步地,数字化订单队列可以是电商互动端与大数据评论文本处理服务器进行电商业务互动时电商互动端的相关订单业务执行动作所对应的订单队列。比如电商业务处理设备在相关的订单处理场景下的订单创建动作和订单验证动作。可以理解的是,数字化订单队列可以按照业务执行动作的时间先后顺序进行表达,举例而言,数字化订单队列可以包括以下成员:{(可视化订单处理信息message1,订单创建,触发时刻t1);(可视化订单处理信息message2,订单验证,触发时刻t2);(可视化订单处理信息message3,订单转发,触发时刻t3);(可视化订单处理信息message4,订单创建,触发时刻t4);...;(可视化订单处理信息message-n,订单撤销,触发时刻tn)}。
进一步地,行为描述分析可以通过设定的特征分类模型比如K均值分析模型进行,行为描述分析后的可视化订单处理信息可以包括相同类型或者类似动作倾向的可视化订单处理信息,或者包括存在跨境业务交叉的可视化订单处理信息。对于本申请实施例而言,上述步骤“对目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息”,可以包括以下内容:获取目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息,所述可视化订单处理信息中包括多个用于表达所述目标电商互动端的行为倾向性的订单处理记录信息;对获取的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息。
举例而言,产品倾向标签可以是电商互动端事先录入的比如“倾向买乌龟”、“经常浏览健身器械”、“化妆品达人”等,产品倾向标签可以是文本标签也可以是量化标签,存在差异的量化标签可以通过设定对应关系得到对应文本标签。行为倾向性可以表征电商互动端对应的业务对象用户的动作意图倾向,比如一些业务对象用户倾向使用人脸支付,一些业务对象用户习惯密码支付,一些业务对象用户喜欢网银U盾支付。又比如,一些业务对象用户倾向语音化的交互场景,一些业务对象用户图形化的交互场景。订单处理记录信息可以是业务对象用户通过电商互动端输入的,订单处理记录信息包括但不限于手动处理记录和语音处理记录。
从一些角度来看,行为倾向性具有不间断性和互相干扰性,因此,为了确保后续跨境信息安防机制部署的精准性,需要实现准确、全面的行为描述分析,为实现这一目的,上述步骤所描述的“对获取的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息”,可以通过以下内容实现:以所述目标电商互动端的数字化订单队列中每个设定产品倾向标签作为行为描述分析集,对获取的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息。可以理解的是,存在差异的产品倾向标签可以对应一些列的不间断的业务执行动作,因此,通过以所述目标电商互动端的数字化订单队列中每个设定产品倾向标签作为行为描述分析集的划分约束,能够实现对一些列的不间断的业务执行动作对应的可视化订单处理信息的分组分析,避免个别可视化订单处理信息的缺失。
比如,以每个设定产品倾向标签作为行为描述分析集的意思可以理解为以每个设定产品倾向标签作为分组归纳标识,从而实现不同可视化订单处理信息的循环分组,在循环分组过程中,每次分组之后会基于存在差异的产品倾向标签对当前分组结果中的相关可视化订单处理信息之间的相关性进行计算分析,从而实现对当前分组结果的调整。
比如,在第一次分组之后,产品倾向标签tag1对应的行为描述分析后的可视化订单处理信息为{h1、h2、h3、h4},产品倾向标签tag2对应的行为描述分析后的可视化订单处理信息为{h6、h10、h24、h32},产品倾向标签tag3对应的行为描述分析后的可视化订单处理信息为{h66、h78、h99},在进行相关性进行计算分析之后,对上述分组结果进行调整,也即实现第二次分组,得到的结果可以为:产品倾向标签tag1对应的行为描述分析后的可视化订单处理信息为{h1、h2、h78、h99},产品倾向标签tag2对应的行为描述分析后的可视化订单处理信息为{h3、h4、h6},产品倾向标签tag3对应的行为描述分析后的可视化订单处理信息为{h10、h24、h32、h66}。如此设计,能够通过多轮循环实现准确、全面的行为描述分析,从而为后续的跨境信息安防机制部署提供决策依据。
在一些可选的实施例中,步骤“获取目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息”之后,还可以包括以下内容:基于所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息的用户行为活跃指数,以及所述目标电商互动端的数字化订单队列所对应的订单事件的事件类别和事件内容,对所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行订单优化处理,得到订单优化后的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息。举例而言,用户行为活跃指数可以是业务对象用户的执行动作密集性,订单事件包括以多种方式输出的跨境服务,进一步地,通过进行订单优化处理,能够将业务对象用户的执行动作密集性考虑在内,从而确保得到的可视化订单处理信息能够响应于业务对象用户的密集性动作而产生关联。
在上述内容的基础上,步骤“对获取的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息”,可以包括以下内容:对订单优化后的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息。当然,对订单优化后的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息进行相关实施方式可以参阅上述类似的描述,在此不作更多说明。
在上述内容的基础上,还可以包括以下内容:如果所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息的用户行为活跃指数未处于设定的用户行为活跃指数判断范围内,则基于设定的偏移修正方式对所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息的用户行为活跃指数进行偏移修正,得到偏移修正后的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息的用户行为活跃指数。
其中,用户行为活跃指数判断范围可以是数值区间,当所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息的用户行为活跃指数未处于设定的用户行为活跃指数判断范围内时,无法进行后续的用户行为活跃指数处理,为此,需要进行用户行为活跃指数的调整,因而通过设定的偏移修正方式能够实现偏移修正,从而确保偏移修正后的所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息的用户行为活跃指数处于设定的用户行为活跃指数判断范围内,以便后续进行相关的用户行为活跃指数处理和分析。
在在一些可能的实施例中,所述偏移修正方式可以是偏移修正网络,可以包括以下方式中的一个或多个:第一种偏移修正方式,所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息偏移修正后的用户行为活跃指数通过所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息对应的可调订单操作内容的用户行为活跃指数,以及所述目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息中的,所述目标电商互动端的在线意图倾向性内容的可视化订单处理信息,离线意图倾向性内容的可视化订单处理信息组成的订单项目主题与所述可视化订单处理信息的用户行为活跃指数对应的订单行为事理图谱的图谱要素之间的关联情况确定;第二个偏移修正方式,采用预定的偏移修正场景指示和设定的偏移修正迁移指示创建,所述偏移修正方式为基于分类器的偏移修正方式;第三个偏移修正方式,所述偏移修正方式为基于深度学习神经网络创建的方式。
S2,通过所述可视化订单处理信息创建所述目标电商互动端的数字化订单队列对应的整体性订单行为画像,并结合事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,从所述多个存在差异的电子商务安防项目中挑选与所述目标电商互动端相适配的电子商务安防项目。
例如,整体性订单行为画像可以通过图谱元素点(行为节点)的形式进行表达,也即可以通过图形化或者流式列表的形式表达,这样可以提高整体性订单行为画像的输出质量,并且整体性订单行为画像能够从全局电商业务过程方面确定目标电商互动端的相关业务执行动作的前后顺承关系或者前后扰动关系,从而尽可能不间断地反映出相关业务对象用户的动作意图倾向,便于后续进行对应的跨境信息安防机制。
进一步地,上述步骤“通过所述可视化订单处理信息创建所述目标电商互动端的数字化订单队列对应的整体性订单行为画像,并结合事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,从所述多个存在差异的电子商务安防项目中挑选与所述目标电商互动端相适配的电子商务安防项目”,可以包括以下内容:针对每个行为描述分析集的可视化订单处理信息,确定每个行为描述分析集的可视化订单处理信息对应的电子订单流式描述,并基于确定的每个行为描述分析集的可视化订单处理信息对应的电子订单流式描述创建所述目标电商互动端的数字化订单队列对应的整体性订单行为画像;基于所述目标电商互动端的数字化订单队列对应的整体性订单行为画像和事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度,并基于确定的匹配度,从所述多个存在差异的电子商务安防项目中挑选与所述目标电商互动端相适配的电子商务安防项目。
举例而言,电子订单流式描述可以通过特征向量或者特征图的形式进行表示,其中,每个行为描述分析集的每个可视化订单处理信息可以对应一个电子订单流式描述,从某种意义上来讲,是将存在差异的可视化订单处理信息进行压缩处理,从而能够通过流程节点和流程状态的关系完整地确定出整体性订单行为画像,比如,整体性订单行为画像Persona可以为(P3--P5--P2--P4--P8--P1--P7--P6),当然,整体性订单行为画像Persona的表达方式还可以是图形化表达方式,本申请实施例不作限制。
事先获得的多个存在差异的电子商务安防项目可以是根据历史信息防护记录所确定出的电子商务安防项目,其中,电子商务安防项目可以包括存在差异的行为拦截项目,比如一些权限验证项目,访问隐藏项目,访问隐藏项目等,本申请实施例不作限制。
可以理解的是,通过确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度,能够量化多个存在差异的电子商务安防项目与目标电商互动端的适配关系,从而准确确定出与所述目标电商互动端相适配的电子商务安防项目。
在实际实施过程中,为了精准地确定出不同整体性订单行为画像之间的匹配度,上述步骤“基于所述目标电商互动端的数字化订单队列对应的整体性订单行为画像和事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度”,可以通过以下方式实现:基于所述目标电商互动端的数字化订单队列对应的整体性订单行为画像和事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,通过设定的匹配度分析网络,确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度。
可以理解的是,设定的匹配度分析网络可以通过训练样本集进行训练,并通过测试样本集进行测试以实现网络参数的调整。一般而言,可以根据真实的业务需求选择训练样本集和测试样本集的比例,比如训练样本集和测试样本集的比例可以为4:1或者9:1,本申请实施例不作限制。
进一步地,所述匹配度分析网络包括以下中的一种或多种:皮尔森相关系数网络、余弦匹配度分析网络、明科夫斯基动态网络、欧几里得动态网络、曼哈顿动态网络或Jaccard匹配度分析网络等,本申请实施例不作限制。
可以理解的是,通过引入人工智能网络,能够精准地确定出不同整体性订单行为画像之间的匹配度。
在上述内容的基础上,在确定不同整体性订单行为画像之间的匹配度时,需要考虑业务动作热度变化,从而将真实的数字化订单情况和业务对象用户的突发因素考虑在内,为实现这一目的,上述步骤“基于所述目标电商互动端的数字化订单队列对应的整体性订单行为画像和事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度”,可以包括以下内容:基于所述目标电商互动端的数字化订单队列对应的整体性订单行为画像和事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像与多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的最大匹配度和最小匹配度;基于所述目标电商互动端的数字化订单队列对应的整体性订单行为画像与多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的最大匹配度和最小匹配度,以及设定的操作活跃性评价,确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度。
举例而言,匹配度的取值范围可以为[0,1],或者[0,100],亦或者[0,1000],本申请实施例不作限制。比如最大匹配度为V-max,最小匹配度为V-min,那么在确定出最大匹配度和最小匹配度的过程中,可能会受到业务动作热度变化的影响,因此,为了确保所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度的可信度,需要进行一定的干扰清洗或者偏差校正,而干扰清洗和偏差校正可以基于操作活跃性评价进行,其中,操作活跃性评价的取值一般可以是0~1,操作活跃性评价用于表达业务对象用户的突发因素情况和实时数字化订单变化情况,可以理解的是,通过将最大匹配度、最小匹配度以及操作活跃性评价进行综合考虑,能够确保所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度的可信度。
比如,操作活跃性评价为comment,那么可以确定出全局校正系数ratio=comment*(V-max-V-min)/V-max,这样一来,在确定所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度时,可以引入全局校正系数进行校正,从而提高所述目标电商互动端的数字化订单队列对应的整体性订单行为画像分别与所述多个存在差异的电子商务安防项目对应的整体性订单行为画像之间的匹配度的可信度。
在实际实施过程中,为了确保电子订单流式描述的完整性和互相关联性,上述步骤“针对每个行为描述分析集的可视化订单处理信息,确定每个行为描述分析集的可视化订单处理信息对应的电子订单流式描述”,可以包括以下内容:基于第一行为描述分析集的可视化订单处理信息、所述第一行为描述分析集的可视化订单处理信息中每个可视化订单处理信息的第一关联可视化订单信息和每个可视化订单处理信息的第二关联可视化订单信息,确定所述第一行为描述分析集的可视化订单处理信息所确定的订单流程拓扑的流程环节关联情况,以及所述第一行为描述分析集的可视化订单处理信息中每个可视化订单处理信息与其第一关联可视化订单信息确定的订单主题变化轨迹与每个可视化订单处理信息与其第二关联可视化订单信息确定的订单主题变化轨迹之间的相关度;基于所述第一行为描述分析集的可视化订单处理信息所确定的订单流程拓扑的流程环节关联情况,确定所述第一行为描述分析集的可视化订单处理信息对应的可变电子订单流式描述,并基于所述相关度,确定所述第一行为描述分析集的可视化订单处理信息对应的关联电子订单流式描述,进而确定每个行为描述分析集的可视化订单处理信息对应的可变电子订单流式描述,以及每个行为描述分析集的可视化订单处理信息对应的关联电子订单流式描述,所述第一行为描述分析集为所述行为描述分析集中的任意行为描述分析集。
举例而言,每个可视化订单处理信息的第一关联可视化订单信息用于表达该个可视化订单处理信息的前一个可视化订单处理信息,每个可视化订单处理信息的第二关联可视化订单信息用于表达该个可视化订单处理信息的后一个可视化订单处理信息。订单流程拓扑可以用于汇总存在差异的可视化订单处理信息对应的动作执行节点(或者可以理解为图谱元素点(行为节点)),不同动作执行节点之间可以通过节点连接线连接,可以理解的是,由于第一关联可视化订单信息和第二关联可视化订单信息分别用于表达前一个可视化订单处理信息以及后一个可视化订单处理信息,因而可以通过前后顺序关系确定出流程环节关联情况,也即不同动作执行节点之间的行为顺承关系。
进一步地,所述第一行为描述分析集的可视化订单处理信息中每个可视化订单处理信息与其第一关联可视化订单信息确定的订单主题变化轨迹与每个可视化订单处理信息与其第二关联可视化订单信息确定的订单主题变化轨迹之间的相关度可以理解为,对于相同的可视化订单处理信息而言,可以根据可视化订单处理信息及其第一关联可视化订单信息确定订单主题变化轨迹trail1,并根据可视化订单处理信息及其第二关联可视化订单信息确定订单主题变化轨迹trail2,这样一来,可以确定出订单主题变化轨迹trail1和订单主题变化轨迹trail2之间的相关度,其中,订单主题变化轨迹之间的相关度可以通过比较存在差异的订单主题变化轨迹的轨迹特征或者轨迹相似度得到,比如可以将订单主题变化轨迹投影至统一的映射空间中,然后通过统一的计算标准进行计算。
在上述基础上,基于所述第一行为描述分析集的可视化订单处理信息所确定的订单流程拓扑的流程环节关联情况,确定所述第一行为描述分析集的可视化订单处理信息对应的可变电子订单流式描述可以理解为通过流程环节关联情况确定出存在变化的可变电子订单流式描述,这样可以确保将动作执行节点变化过程中的电子订单流式描述的变化考虑在内,进一步地,基于所述相关度,确定所述第一行为描述分析集的可视化订单处理信息对应的关联电子订单流式描述,能够将动作执行节点变化过程中的不同电子订单流式描述的关联性考虑在内,以便确定每个行为描述分析集的可视化订单处理信息对应的可变电子订单流式描述,以及每个行为描述分析集的可视化订单处理信息对应的关联电子订单流式描述。
可以理解的是,“确定每个行为描述分析集的可视化订单处理信息对应的电子订单流式描述”中的电子订单流式描述可以包括上述的可变电子订单流式描述和关联电子订单流式描述,当然也可以包括其他类型的电子订单流式描述,本申请实施例不作限制。在在一些可能的实施例中,第一行为描述分析集为所述行为描述分析集中的任意行为描述分析集。
S3,根据与所述目标电商互动端相适配的电子商务安防项目,确定针对所述目标电商互动端的跨境信息安防机制。
例如,跨境信息安防机制可以用于指示大数据评论文本处理服务器对目标电商互动端执行的跨境业务的跨境互动时段、跨境互动区域或者跨境互动方式进行针对性的防火墙设置,从而满足不同的电商业务处理设备的实际业务情况,确保跨境信息安防机制尽可能匹配电商业务处理设备的用户行为和跨境电商环境,从而减少额外的安防机制配置开销和安防机制配置误差,进而保障电商业务设备在处理跨境电商业务时的信息安全性,避免出现信息安全风险。
为实现这一目的,上述步骤“根据与所述目标电商互动端相适配的电子商务安防项目,确定针对所述目标电商互动端的跨境信息安防机制”,进一步可以通过以下步骤S41-步骤S48所描述的内容实现。
S41,根据与所述目标电商互动端相适配的电子商务安防项目获取至少两个跨境业务行为兴趣分布,所述至少两个跨境业务行为兴趣分布用于记录目标业务执行动作倾向。
比如,至少两个跨境业务行为兴趣分布可以包括即兴兴趣和非即兴兴趣,跨境业务行为兴趣可以通过文本进行表达,也可以通过图形进行表达,本申请实施例不作限制。业务执行动作倾向可以用于表达不同业务对象用户的业务执行动作的意图信息,业务执行动作倾向可以是特征向量或特征图。
S42,对所述至少两个跨境业务行为兴趣分布中的第二跨境业务行为兴趣分布内的动作突变数据进行拆解,得到多个动作突变数据,所述第二跨境业务行为兴趣分布为所述至少两个跨境业务行为兴趣分布中除最后一个跨境业务行为兴趣分布以外的跨境业务行为兴趣分布。
比如,动作突变数据用于表达业务对象用户在不同业务执行动作之间的变换的记录信息,比如业务对象用户在业务执行动作act1和业务执行动作act2之间的动作突变数据可以为Change12。
S43,对每个动作突变数据进行数字化订单引导描述提取,得到所述每个动作突变数据的数字化订单引导描述。
比如,数字化订单引导描述可以是大数据评论文本处理服务器向电商互动端发送的订单处理提示对应的特征,进一步地,数字化订单引导描述提取可以通过事先训练得到的长短期记忆神经网络实现,本申请实施例在此不详细展开说明。
S44,根据第一预设数目和第二预设数目,获取所述第一预设数目的动作突变数据集,所述第一预设数目用于指示一次数字化订单引导评价确定过程所采用的动作突变数据集的数目。
比如,数字化订单引导评价可以用于评价大数据评论文本处理服务器和电商互动端之间的多端互动安全指数。
S45,基于所述第一预设数目的动作突变数据集中每个动作突变数据集的数字化订单引导描述,确定所述每个动作突变数据的数字化订单引导评价。
比如,可以基于数字化订单引导描述的特征描述值确定每个动作突变数据的数字化订单引导评价。
S46,根据所述每个动作突变数据的数字化订单引导评价,确定所述每个动作突变数据的业务执行动作激活信息。
比如,每个动作突变数据的业务执行动作激活信息可以用于表达不同业务执行动作之间切换激活信息。
在一些可能的实施例中,所述根据所述每个动作突变数据的数字化订单引导评价,确定所述每个动作突变数据的业务执行动作激活信息,包括:对于每个动作突变数据,根据所述每个动作突变数据的数字化订单引导评价,从所述每个动作突变数据的至少两个关联业务执行动作激活信息中挑选出数字化订单引导评价最大的关联业务执行动作激活信息,作为所述每个动作突变数据的业务执行动作激活信息,每个动作突变数据的数字化订单引导评价包括对应的至少两个关联业务执行动作激活信息,以及每个关联业务执行动作激活信息的数字化订单引导评价。
S47,根据所述多个动作突变数据的至少两个业务执行动作激活信息,确定所述多个动作突变数据对应的信息安防测评结果或信息安防测评结果集合。
比如,信息安防测评结果可以用于表达对应的业务对象用户的动作习惯、倾向习惯或者其他用于评估业务对象用户的业务信息防护记录的标签信息。
在一些可能的实施例中,所述根据所述多个动作突变数据的至少两个业务执行动作激活信息,确定所述多个动作突变数据对应的信息安防测评结果或信息安防测评结果集合,包括:确定所述多个动作突变数据对应的业务切换消息以及业务切换消息的消息关联情况;根据所述业务切换消息的消息关联情况,从第一个动作突变数据对应的活跃业务切换消息进行遍历,直到最后一个动作突变数据对应的边缘业务切换消息,遍历出多条安防动作更新记录;将所述多条安防动作更新记录中消息关联情况对应的整体信息防护相关度最大的安防动作更新记录,作为目标安防动作更新记录;根据所述目标安防动作更新记录中各个业务切换消息对应的业务执行动作激活信息,作为所述第二跨境业务行为兴趣分布的至少两个业务执行动作激活信息;当所述至少两个业务执行动作激活信息满足第四激活指标时,基于设定评价输出模型,识别出所述至少两个业务执行动作激活信息对应的至少两个关联信息安防测评结果的数字化订单引导评价,所述第四激活指标为所述至少两个业务执行动作激活信息组成一个激活事件;根据所述至少两个关联信息安防测评结果的数字化订单引导评价,确定出所述多个动作突变数据对应的信息安防测评结果或信息安防测评结果集合。
进一步地,所述确定所述多个动作突变数据对应的业务切换消息以及业务切换消息的消息关联情况,包括:对于每个动作突变数据,根据所述每个动作突变数据的前一个动作突变数据对应的第一业务切换消息,获取所述第一业务切换消息的至少两个延时业务切换消息,每个延时业务切换消息用于指示所述每个动作突变数据的一个关联业务执行动作激活信息;从所述每个动作突变数据的数字化订单引导评价中,获取每个关联业务执行动作激活信息的数字化订单引导评价;根据每个关联业务执行动作激活信息的数字化订单引导评价,从所述至少两个延时业务切换消息中确定出第二业务切换消息;将所述第二业务切换消息作为所述每个动作突变数据的业务切换消息,所述第二业务切换消息的消息关联情况为对应关联业务执行动作激活信息的数字化订单引导评价。
S48,根据所述第二跨境业务行为兴趣分布对应的信息安防测评结果,确定所述目标业务执行动作倾向对应的目标信息安防测评结果集合,通过所述目标信息安防测评结果集合确定针对所述目标电商互动端的跨境信息安防机制。
可以理解的是,通过所述第二跨境业务行为兴趣分布对应的信息安防测评结果,确定所述目标业务执行动作倾向对应的目标信息安防测评结果集合,能够确保目标信息安防测评结果集合与业务对象用户的实时数字化订单情况适配,从而确保得到的跨境信息安防机制的实时性和服务适配性。
在一些可选的实施例中,步骤“根据所述第二跨境业务行为兴趣分布对应的信息安防测评结果,确定所述目标业务执行动作倾向对应的目标信息安防测评结果集合”之前,还可以包括以下内容:基于每个跨境业务行为兴趣分布所记录业务执行动作倾向的兴趣热度描述,确定所述至少两个跨境业务行为兴趣分布中第一跨境业务行为兴趣分布的动态响应反馈,所述动态响应反馈用于指示所述第一跨境业务行为兴趣分布记录实时业务执行动作倾向的检测精度,所述实时业务执行动作倾向是指除延时业务执行动作倾向以外的业务执行动作倾向,所述第一跨境业务行为兴趣分布为所述至少两个跨境业务行为兴趣分布中最后一个跨境业务行为兴趣分布。
所述根据所述第二跨境业务行为兴趣分布对应的信息安防测评结果,确定所述目标业务执行动作倾向对应的目标信息安防测评结果集合,包括:当所述第一跨境业务行为兴趣分布的动态响应反馈满足第一激活指标时,根据所述第二跨境业务行为兴趣分布对应的信息安防测评结果,确定所述目标业务执行动作倾向对应的目标信息安防测评结果集合;其中,所述第一激活指标包括:所述动态响应反馈指示所述第一跨境业务行为兴趣分布未记录实时业务执行动作倾向,和,所述动态响应反馈对应的信息反馈时效值小于第一设定阈值中的至少一项。
基于此,步骤“基于每个跨境业务行为兴趣分布所记录业务执行动作倾向的兴趣热度描述,确定所述至少两个跨境业务行为兴趣分布中第一跨境业务行为兴趣分布的动态响应反馈”还包括:基于所述第一跨境业务行为兴趣分布与所述第二跨境业务行为兴趣分布所包括每个动作突变数据的关注点切换信息,确定所述第一跨境业务行为兴趣分布所记录业务执行动作倾向的第一兴趣热度描述和所述第二跨境业务行为兴趣分布所记录业务执行动作倾向的第二兴趣热度描述;基于所述第一兴趣热度描述与所述第二兴趣热度描述之间的分析结果,确定所述第一跨境业务行为兴趣分布的动态响应反馈。如此设计,可以对业务执行动作倾向进行相关的量化处理,从而确保得到的跨境信息安防机制的可靠性。
在一些可选的实施例中,在上述步骤S1-S3的基础上,还可以包括以下内容:将挑选的与所述目标电商互动端相适配的电子商务安防项目的项目配置指示内容下发给所述目标电商互动端,以使所述目标电商互动端基于所述项目配置指示内容配置与所述目标电商互动端相适配的电子商务安防项目的数字化订单反欺诈检测线程,所述电子商务安防项目为跨境电商服务的安防项目。
举例而言,项目配置指示内容可以是大数据评论文本处理服务器事先配置的,这样可以使得目标电商互动端基于所述项目配置指示内容事先进行数字化订单反欺诈检测线程的配置,由于电子商务安防项目为跨境电商服务的安防项目,因而通过对数字化订单反欺诈检测线程进行配置,能够便于大数据评论文本处理服务器进行后续的动作意图倾向的采集和分析
在相关的实施例中,所述挑选的与所述目标电商互动端相适配的电子商务安防项目的项目配置指示内容中包括挑选的与所述目标电商互动端相适配的电子商务安防项目对应的订单处理引导信息。其中,订单处理引导信息可以是S1中提到的相关操作,本申请实施例不作限制。
因此,通过实施上述S1-S3所描述的内容,能够对电商互动端的可视化订单处理信息进行行为倾向性解析,并结合事先获取的电子商务安防项目对应的整体性订单行为画像实现电子商务安防项目的适配,这样可以确定出针对目标电商互动端的跨境信息安防机制,从而为存在差异的电商互动端提供针对性的信息安防措施,以确保跨境信息安防机制尽可能符合电商互动端的相关业务执行动作习惯,从而减少额外的安防机制配置开销和安防机制配置误差,进而提高与大数据评论文本处理服务器的业务数字化订单效率。
综上,通过执行上述步骤S110-S130,首先确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,其次根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识确定电商对象反馈评论对应的分治整合的目标语义特征区分标识,最后基于目标语义特征区分标识对电商对象反馈评论进行分治整合并进行文本表达性修正处理。如此设计,能够将评论倾向中相似的文本进行整理从而形成语义特征,这样既可以确保电商对象反馈评论的文本表达意图,又能够提供进行文本校正参考的语义特征。此外,通过进行文本表达性修正处理,能够优先基于电商对象真实表达意图的角度进行修正处理,也即在真实表达意图和文本准确性存在矛盾时,能够倾向于真实表达意图角度的文本表达性修正处理。
针对上述应用于大数据的评论文本处理方法,本发明实施例还提出了一种示例性的应用于大数据的评论文本处理装置,如图3所示,应用于大数据的评论文本处理装置300可以包括以下的功能模块。
标识确定模块310,用于确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识。
分治整合模块320,用于根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识。
文本校正模块330,用于基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理。
可以理解的是,关于上述标识确定模块310、分治整合模块320以及文本校正模块330的说明可以参阅对图1和图2所示的方法的说明,在此不作赘述。
在上述内容的基础上,请结合参阅图4,大数据评论文本处理服务器100可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。
处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central ProcessingUnit,CPU)、专用集成电路(Application-Specific Integrated Circuit,ASIC)、专用指令集处理器(Application-Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、精简指令集计算机(Reduced Instruction-Set Computer,RISC)、微处理器等或其任意组合。
网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone SwitchedNetwork,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入点。例如,网络模块120可以包括有线或无线网路接入点,如基站和/或网路接入点。
存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。
可以理解的是,图4所示的结构仅为示意,大数据评论文本处理服务器100还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以保留在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解的是,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
Claims (10)
1.一种应用于大数据的评论文本处理方法,其特征在于,所述方法包括:
确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识;
根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识;
基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理。
2.如权利要求1所述的方法,其特征在于,所述确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,包括:
针对一组待进行评论文本修正处理的电商对象反馈评论,确定该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识。
3.如权利要求2所述的方法,其特征在于,所述根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识,包括:
根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识;
所述基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理,包括:
根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理。
4.如权利要求3所述的方法,其特征在于,在根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识之前,所述方法还包括:
判断该组待进行评论文本修正处理的电商对象反馈评论中的每个待进行评论文本修正处理的电商对象反馈评论中是否均包含热门订单专题,如果否,则进行后续步骤;
如果是,则判断该热门订单专题是否符合设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,如果否,则进行后续步骤。
5.如权利要求4所述的方法,其特征在于,当该热门订单专题符合设定的每种语义特征区分标识的分治整合对应的热门订单激活指标时,所述方法还包括:
根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,以及设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识;
根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理;
所述根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,以及设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识包括:
根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,确定该组待进行评论文本修正处理的电商对象反馈评论对应的热门订单的文本误解可能性,其中所述文本误解可能性为该组待进行评论文本修正处理的电商对象反馈评论对应的热门订单的买卖方沟通情况与存在异常的文本理解事件的测评结果;
如果所述文本误解可能性大于设定的第一文本误解可能性阈值,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为文本歧义性标识;
如果所述文本误解可能性小于设定的第二文本误解可能性阈值,则根据设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识,其中,所述第一文本误解可能性阈值大于所述第二文本误解可能性阈值;
所述根据设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识包括:
判断该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的关联语义特征区分标识是否均为全局相关性语义描述;
如果是,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为可调语义标识;
如果否,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为不可调语义标识。
6.如权利要求3或4所述的方法,其特征在于,所述根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识包括:
根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识;
挑选该组待进行评论文本修正处理的电商对象反馈评论对应的数量最多的分治整合的语义特征区分标识,将数量最多的分治整合的语义特征区分标识确定为该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识;
所述根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识包括:
当存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为顺序整合情况时,则该存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识为可调语义标识;
当存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为分布式整合情况时,则该存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识为不可调语义标识;
当存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识的整合情况为图形化整合情况时,则该存在订单优化的两个待进行评论文本修正处理的电商对象反馈评论对应的分治整合的语义特征区分标识为文本歧义性标识。
7.如权利要求3所述的方法,其特征在于,根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理,包括:
从确定的分治整合的目标语义特征区分标识中获取存在文本误解度子标签的待处理语义特征区分标识,基于所述待处理语义特征区分标识确定待进行评论文本测评的目标文本分词描述;
对所述目标文本分词描述中的多个文本分词描述内容分别进行积极类评论文本识别和消极类评论文本识别,得到积极类评论文本识别结果集和消极类评论文本识别结果集;
采用第一设定文本修正模式,对所述积极类评论文本识别结果集进行第一文本修正,得到包括有积极类评论文本的第一文本分词描述修正结果;以及通过第二设定文本修正模式,对所述消极类评论文本识别结果集进行第二文本修正,得到包括有消极类评论文本的第二文本分词描述修正结果;
基于所述第一文本分词描述修正结果和所述第二文本分词描述修正结果进行特征挑选操作,得到所述目标文本分词描述中与目标评论文本相适配的目标文本分词描述修正结果;所述目标评论文本包括积极类评论文本和消极类评论文本中的至少一种,所述目标文本分词描述修正结果用于对所述目标文本分词描述以及该组待进行评论文本修正处理的电商对象反馈评论进行评论文本测评;
根据所述目标文本分词描述修正结果对所述目标文本分词描述以及该组待进行评论文本修正处理的电商对象反馈评论进行评论文本测评,得到意图输出测评结果;通过所述意图输出测评结果对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
对完成所述分治整合并完成所述文本表达性修正处理的电商对象反馈评论对应的电商互动端进行跨境信息安防机制的确定。
9.如权利要求8所述的方法,其特征在于,对完成所述分治整合并完成所述文本表达性修正处理的电商对象反馈评论对应的电商互动端进行跨境信息安防机制的确定,包括:
对目标电商互动端的数字化订单队列中设定产品倾向标签的可视化订单处理信息进行行为描述分析,得到行为描述分析后的可视化订单处理信息;
通过所述可视化订单处理信息创建所述目标电商互动端的数字化订单队列对应的整体性订单行为画像,并结合事先获得的多个存在差异的电子商务安防项目对应的整体性订单行为画像,从所述多个存在差异的电子商务安防项目中挑选与所述目标电商互动端相适配的电子商务安防项目;
根据与所述目标电商互动端相适配的电子商务安防项目,确定针对所述目标电商互动端的跨境信息安防机制。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行时实现权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111647860.0A CN114462417A (zh) | 2021-12-29 | 2021-12-29 | 一种应用于大数据的评论文本处理方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111647860.0A CN114462417A (zh) | 2021-12-29 | 2021-12-29 | 一种应用于大数据的评论文本处理方法及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114462417A true CN114462417A (zh) | 2022-05-10 |
Family
ID=81407138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111647860.0A Withdrawn CN114462417A (zh) | 2021-12-29 | 2021-12-29 | 一种应用于大数据的评论文本处理方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114462417A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115757793A (zh) * | 2022-11-29 | 2023-03-07 | 石家庄赞润信息技术有限公司 | 基于人工智能的话题分析预警方法、系统及云平台 |
-
2021
- 2021-12-29 CN CN202111647860.0A patent/CN114462417A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115757793A (zh) * | 2022-11-29 | 2023-03-07 | 石家庄赞润信息技术有限公司 | 基于人工智能的话题分析预警方法、系统及云平台 |
CN115757793B (zh) * | 2022-11-29 | 2023-09-05 | 海南达润丰企业管理合伙企业(有限合伙) | 基于人工智能的话题分析预警方法、系统及云平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645554B2 (en) | Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN107256428B (zh) | 数据处理方法、数据处理装置、存储设备及网络设备 | |
CN112329816A (zh) | 数据分类方法、装置、电子设备和可读存储介质 | |
CN111324739B (zh) | 一种文本情感分析方法及系统 | |
CN112948671A (zh) | 基于大数据和人工智能的业务处理方法及业务处理系统 | |
CN111125658A (zh) | 识别欺诈用户的方法、装置、服务器和存储介质 | |
CN112434086A (zh) | 基于云计算和大数据的信息流挖掘方法及云计算互动中心 | |
CN114661994B (zh) | 基于人工智能的用户兴趣数据处理方法、系统及云平台 | |
CN110458600A (zh) | 画像模型训练方法、装置、计算机设备及存储介质 | |
CN114155860A (zh) | 摘要记录方法、装置、计算机设备和存储介质 | |
CN117409419A (zh) | 图像检测方法、设备及存储介质 | |
CN114175063A (zh) | 用于处理文本数据的机器学习系统的自适应训练的系统和方法 | |
CN114462417A (zh) | 一种应用于大数据的评论文本处理方法及存储介质 | |
CN113472860A (zh) | 大数据和数字化环境下的业务资源分配方法及服务器 | |
CN112579755A (zh) | 基于人工智能和云计算的信息应答方法及信息互动平台 | |
CN112163415A (zh) | 针对反馈内容的用户意图识别方法、装置及电子设备 | |
Lahann et al. | LSTM-based anomaly detection of process instances: Benchmark and tweaks | |
CN114463086A (zh) | 结合大数据的电子商务信息安防方法及可读存储介质 | |
CN112613072B (zh) | 基于档案大数据的信息管理方法、管理系统及管理云平台 | |
CN115599891B (zh) | 一种确定异常对话数据方法、装置、设备及可读存储介质 | |
CN116883181B (zh) | 基于用户画像的金融服务推送方法、存储介质及服务器 | |
CN112465075B (zh) | 元数据管理方法及系统 | |
US11973832B2 (en) | Resolving polarity of hosted data streams | |
Ramu et al. | Applying Deep Learning Methods on Spam Review Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220510 |