CN113901195A - 风险控制方法、装置、计算设备及计算机存储介质 - Google Patents

风险控制方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN113901195A
CN113901195A CN202111240098.4A CN202111240098A CN113901195A CN 113901195 A CN113901195 A CN 113901195A CN 202111240098 A CN202111240098 A CN 202111240098A CN 113901195 A CN113901195 A CN 113901195A
Authority
CN
China
Prior art keywords
text
risk score
disassembled
matching
score value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111240098.4A
Other languages
English (en)
Inventor
王燕来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shumao Technology Beijing Co ltd
Original Assignee
Shumao Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shumao Technology Beijing Co ltd filed Critical Shumao Technology Beijing Co ltd
Priority to CN202111240098.4A priority Critical patent/CN113901195A/zh
Publication of CN113901195A publication Critical patent/CN113901195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种风险控制方法、装置、计算设备及计算机存储介质。该方法通过对待检测物品的物品描述信息进行文本拆解处理,得到多个拆解文本;对多个拆解文本进行随机组合,得到组合文本;对多个拆解文本进行单个字符或单个文字的过滤处理,得到过滤后的拆解文本;对组合文本和过滤后的拆解文本进行文本解析、词语检索匹配、核对匹配,得到解析维度风险评分值、检索维度风险评分值、核对维度风险评分值;根据解析维度风险评分值、检索维度风险评分值、核对维度风险评分值确定待检测物品的风险控制方案,实现了复杂风控的简单化,实现主观违规的自动发现,减少了机审的错判率,减轻了资源消耗、计算能力消耗、电能消耗。

Description

风险控制方法、装置、计算设备及计算机存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种风险控制方法、装置、计算 设备及计算机存储介质。
背景技术
随着互联网技术的发展,各种电商运营平台应运而生,电商运营平台向 商家提供平台渠道售卖物品,然而,各类的物品违规事件层出不穷,导致各 电商运营平台对此不胜其烦,只能通过形形色色的风控算法和手段对商家售 卖的物品进行审查。
传统的风控识别主要涉及:针对图片方面的logo识别,相似图识别,错 放类目识别,图片侵权识别等,针对文字方面的审查却仅仅停留在,类目审 查或者单个文本描述的涉品牌审查,但是文字识别目前仅仅停留在文字本身 的识别上完全没有引入文字内容的理解和综合性的对文本进行分析。传统风 控识别在时效性上存在较大的问题,一方面对服务器资源消耗较大另一方面 还因为大量的计算量和跨服务器的调用导致运行缓慢,电量消耗交大,对节 能减排造成的不良影响逐渐变大。
人工手段对文字内容进行系统的理解比较精准,但是效率极低,因此, 亟需一种能够高效、准确地风险控制方案。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分 地解决上述问题的风险控制方法、装置、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种风险控制方法,包括:
获取待检测物品对应的物品描述信息;
对物品描述信息进行文本拆解处理,得到多个拆解文本;
对多个拆解文本进行随机组合,得到组合文本;
对多个拆解文本进行单个字符或单个文字的过滤处理,得到过滤后的拆 解文本;
对组合文本和过滤后的拆解文本进行文本解析,根据文本解析结果计算 解析维度风险评分值;
根据组合文本和过滤后的拆解文本进行词语检索匹配,根据匹配结果计 算检索维度风险评分值;
将组合文本和过滤后的拆解文本与同类型物品词库进行核对匹配,根据 匹配结果计算核对维度风险评分值;
根据解析维度风险评分值、检索维度风险评分值、核对维度风险评分值 确定待检测物品的风险控制方案。
根据本发明的另一方面,提供了一种风险控制装置,包括:
获取模块,适于获取待检测物品对应的物品描述信息;
拆解模块,适于对物品描述信息进行文本拆解处理,得到多个拆解文本;
处理模块,适于对多个拆解文本进行随机组合,得到组合文本;以及, 对所述多个拆解文本进行单个字符或单个文字的过滤处理,得到过滤后的拆 解文本;
文本解析模块,适于对组合文本和过滤后的拆解文本进行文本解析,根 据文本解析结果计算解析维度风险评分值;
词语检索匹配模块,适于根据组合文本和过滤后的拆解文本进行词语检 索匹配,根据匹配结果计算检索维度风险评分值;
核对匹配模块,适于将组合文本和过滤后的拆解文本与同类型物品词库 进行核对匹配,根据匹配结果计算核对维度风险评分值;
确定模块,适于根据解析维度风险评分值、检索维度风险评分值、核对 维度风险评分值确定待检测物品的风险控制方案。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、 通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间 的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述风险 控制方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储 有至少一可执行指令,可执行指令使处理器执行如上述风险控制方法对应的 操作。
本发明提供的方案通过对物品文字描述进行智能化的分析研究,给出风 控处理意见或者送人审,最终实现复杂风控的简单化,实现主观违规的自动 发现,减少了机审的错判率,减轻了资源消耗、计算能力消耗、电能消耗。 解决了电商运营平台因为传统的风控方法无法对物品最终售卖目的做出理解 和管控,导致的电商运营平台出现一些异常物品,所售卖的实际标的和悬挂 的图片、标题、一级部分文字描述毫无关联,甚至完全没有关系,而之所以 这样做,就是为了通过这样的欺骗举动,实现逃过机器审核和传统的风控筛 查,最终实现对目标标的的售卖或者交易的目的,最终因为实际标的不同, 电商平台要因此承担不必要的法律连带责任的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技 术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它 目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本 领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的, 而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示 相同的部件。在附图中:
图1示出了根据本发明一个实施例的风险控制方法的流程示意图;
图2示出了根据本发明一个实施例的风险控制装置的结构示意图;
图3示出了根据本发明一个实施例的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示 了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不 应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地 理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的风险控制方法的流程示意图。如图1 所示,该方法包括以下步骤:
步骤S101,获取待检测物品对应的物品描述信息。
本实施例所提供的风险控制方法可以用于对电商运营平台上所售卖的物 品进行风险控制,降低电商运营平台售卖有问题的物品的风险率。
物品描述信息是针对物品而设置的描述信息,包括物品的标题、图片中 的文本、物品介绍信息等,物品描述信息是商家在电商运营平台上售卖物品 时,所需要提供的信息,主要用来描述所售卖的是什么样的物品。
步骤S102,对物品描述信息进行文本拆解处理,得到多个拆解文本。
在获取到物品描述信息后,对物品描述信息进行文本拆解处理,例如, 可以基于空格、英文字符、标点符号等进行拆解,例如,对“ping很好么, pang哈哈qiu”进行拆解,得到如下拆解文本“ping”、“pang”、“qiu”、 “很好么”、“哈哈”。这里仅是举例说明,不具有任何限定作用。
步骤S103,对多个拆解文本进行随机组合,得到组合文本。
在得到多个拆解文本后,可以将多个拆解文本进行随机组合,例如,两 个拆解文本进行组合或者三个拆解文本进行组合,更具体地,可以是三个字 符类的拆解文本组合,或者,两个文字类的拆解文本进行组合,继续上面举 例,通过进行随机组合可以得到如下组合文本“pingpangqiu”,“pingqiupang”, “pangpingqiu”,“pangqiuping”,“qiupingpang”,“qiupangping”,“很 好么哈哈”,“哈哈很好么”,这里仅是举例说明,不具有任何限定作用。
步骤S104,对多个拆解文本进行单个字符或单个文字的过滤处理,得到 过滤后的拆解文本。
这里主要是为了过滤掉单个字符或单个文字,通过过滤掉单个字符和单 个文字能够提升风险控制的准确率,避免将好的物品错误的划分为坏物品而 给出错误的风险控制方案。举例说明,“p”为单个字符,“粉”为单个文字, 本步骤就是将上述字符或文字过滤掉。
步骤S105,对组合文本和过滤后的拆解文本进行文本解析,根据文本解 析结果计算解析维度风险评分值。
本步骤主要是对文本的本质含义进行解读,通过对文本内容进行理解, 来准确地评估风险。
具体地,主要对组合文本和过滤后的拆解文本进行如下三个维度的解析:
本步骤主要是做语音识别处理,通过语音作为媒介,实现对中英文,以 及中文、英文与所在国家语言之间的转化。具体实现时,可以调用已开发完 成的语音发音并进行语言转化的外部接口,来对组合文本和过滤后的拆解文 本,执行语音转化。比如:“pingpangqiu”可以变种成为“乒乓球”,“平 球胖”等10多种语音变种词。而“哈哈很好么”则可以语音变种成“hey heyHenham”。针对语音转化后的词语,也需要进行词语含义的解析,具体地, 将转化文本与第一词库进行匹配,根据匹配结果计算第三解析维度风险评分值。当发现转化文本与第一词库中的某个违禁词或某个禁销词匹配时,则执 行扣分逻辑,例如,第三维度总分为4分,当匹配数量小于3时,扣减当前 纬度的总计4分中的2分,当出现3个(含)以上不同的违禁词或禁销词时, 则扣掉4分。
例如,通过语音转化得到“乒乓球”,对“乒乓球”这类词语的识别, 发现商家没有乒乓球产品售卖资质,则认为商家存在违规行为。
步骤S106,根据组合文本和过滤后的拆解文本进行词语检索匹配,根据 匹配结果计算检索维度风险评分值。
具体地,对组合文本和过滤后的拆解文本进行语义分析,筛选得到语义 不明确的文本,其中,语义不明确具体指文本含义不明确,无法确定文本想 要表达的含义,将语义不明确的文本与第二词库进行词语检索匹配,确定语 义不明确的文本与第二词库相匹配的第一匹配数量;或者,根据语义不明确 的文本进行网络词语检索匹配,确定语义不明确的文本为预设类型词语的第 二匹配数量;将第一匹配数量及第二匹配数量的总和与检索维度风险评分值 对应的数量区间进行匹配,得到检索维度风险评分值。
第二词库记录的是一些生僻、网红的违禁词语,是通过语义分析而纳入 到第二词库的,针对语义不明确的文本,将该语义不明确的文本与第二词库 进行匹配,若未匹配上,则执行网络引申检索,对于第二词库和网络都检索 不到的词语,反馈给业务人员进行生僻词语、网红词语的判断,例如“奇趣 蛋”,“胖陀螺”等词语可以人工进行判定后,纳入第二词库。这里预先设 置了检索维度风险评分值对应的数量区间的对应关系,例如,10分~数量0, 4分~数量区间[1,3],2分~数量区间[4,6],0分~数量区间[7,∞),这里仅是举 例说明,不具有任何限定作用。
这里可以理解为对新型网红词汇的重新识别和判定逻辑,防止“好词语” 和“坏词语”之间因为时间变化,出现转化问题。
步骤S107,将组合文本和过滤后的拆解文本与同类型物品词库进行核对 匹配,根据匹配结果计算核对维度风险评分值。
同类型物品词库是与待检测物品是同一品类或同一品牌的物品对应的词 库,该词库中归纳了同一品类或同一品牌的物品所共有的一些特征标识词语, 以乒乓球这类物品为例,同类型物品词库包含:直径、弹性、抗风、防风、 质地、尺寸、标准、国际通用等几十个特征标识词语。
将组合文本和过滤后的拆解文本与同类型物品词库中的词语进行核对匹 配,统计组合文本及过滤后的拆解文本与同类型物品词库中词语相匹配的第 三匹配数量,将第三匹配数量与核对维度风险评分值对应的数量区间进行匹 配,得到核对维度风险评分值。例如,做如下规定:匹配数量大于或等于3 时,认为与同类型物品没有差异,核对维度风险评分值被设置为10;匹配数 量大于或等于1且小于3时,认为与同类型物品存在差异较小,核对维度风 险评分值被设置为5;匹配数量等于0时,认为与同类型物品存在差异较大, 核对维度风险评分值被设置为0。
如果待检测物品对应的组合文本和过滤后的拆解文本与同类型物品词库 中的词语进行核对匹配后,所匹配的数量为2个,则可以确定核对维度风险 评分值为5。
本实施例不限定步骤S105-步骤S107的执行顺序,可以同时执行,也可 以先后执行。
步骤S108,根据解析维度风险评分值、检索维度风险评分值、核对维度 风险评分值确定待检测物品的风险控制方案。
具体地,解析维度风险评分值、检索维度风险评分值、核对维度风险评 分值分别是从三个不同的维度对待检测物品进行风险评分,因此,可以根据 解析维度风险评分值、检索维度风险评分值、核对维度风险评分值确定待检 测物品的风险控制方案,例如,对解析维度风险评分值、检索维度风险评分 值、核对维度风险评分值进行加权求和处理,得到待检测物品对应的风控评 分值;每个风险控制方案对应有一风控匹配分区间,因此,在得到待检测物 品对应的风控评分值之后,可以将风控评分值与风险控制方案对应的风控匹配分区间进行匹配,确定待检测物品对应的风控评分值所落入的风控匹配分 区间,根据映射关系确定待检测物品对应的风险控制方案。
例如,解析维度、检索维度及核对维度分别设定10分的风险评分,当待 检测物品对应的风控评分值总分低于10分时直接认定违规,提出警告并限制 买家查询浏览该商品,当总分高于10分低于20分时候需要送交人审环节, 由人工进一步审核,当总分高于20分时候直接通过审查。
本发明就是一种能够通过模拟人类智慧对事物的理解,实现对物品文本 的综合性智能审查的机制,通过本发明可以实现对物品文字的实际意义和目 的做出科学动态的管控和处置,例如:某文本为30mm,通过分析,可以对这 类具有特定标志的数据理解为,长度单位,3cm,0.3m,3厘米,0.3米,然 后通过把这些信息和物品要素信息进行比较得出物品是否违规的判定结果, 或者是否得分的结果,反观传统风控方法则不能对长度单位进行更多的理解, 甚至只能理解其为一串普通字符串。
本发明提供的方案通过对物品文字描述进行智能化的分析研究,例如, 多个维度的词汇组合,转移,对比,不明词汇的网络舆情探索等来实现,给 出风控处理意见或者送人审,最终实现复杂风控的简单化,实现为逃避常规 风控环节的主观违规问题的自动识别和处置,减少了机审的错判率,减轻了 资源消耗、计算能力消耗、电能消耗。解决了电商运营平台因为传统的风控 方法无法对物品最终售卖目的做出理解和管控,导致的电商运营平台出现一 些异常物品,所售卖的实际标的和悬挂的图片、标题、一级部分文字描述毫 无关联,甚至完全没有关系,而之所以这样做,就是为了通过这样的欺骗举 动,实现逃过机器审核和传统的风控筛查,最终实现对目标标的的售卖或者 交易的目的,最终因为实际标的不同,电商平台要因此承担不必要的法律连 带责任的问题。
图2示出了根据本发明一个实施例的风险控制装置的结构示意图。如图2 所示,该装置包括:
获取模块201,适于获取待检测物品对应的物品描述信息;
拆解模块202,适于对物品描述信息进行文本拆解处理,得到多个拆解文 本;
处理模块203,适于对多个拆解文本进行随机组合,得到组合文本;以及, 对所述多个拆解文本进行单个字符或单个文字的过滤处理,得到过滤后的拆 解文本;
文本解析模块204,适于对组合文本和过滤后的拆解文本进行文本解析, 根据文本解析结果计算解析维度风险评分值;
词语检索匹配模块205,适于根据组合文本和过滤后的拆解文本进行词语 检索匹配,根据匹配结果计算检索维度风险评分值;
核对匹配模块206,适于将组合文本和过滤后的拆解文本与同类型物品词 库进行核对匹配,根据匹配结果计算核对维度风险评分值;
确定模块207,适于根据解析维度风险评分值、检索维度风险评分值、核 对维度风险评分值确定待检测物品的风险控制方案。
可选地,文本解析模块进一步适于:将组合文本和过滤后的拆解文本与 物品要素文本信息进行比对,根据比对结果计算第一解析维度风险评分值。
可选地,文本解析模块进一步适于:将组合文本和过滤后的拆解文本与 第一词库进行匹配,根据匹配结果计算第二解析维度风险评分值。
可选地,文本解析模块进一步适于:对组合文本和过滤后的拆解文本进 行语音识别处理,得到转化文本;
将转化文本与第一词库进行匹配,根据匹配结果计算第三解析维度风险 评分值。
可选地,词语检索匹配模块进一步适于:对组合文本和过滤后的拆解文 本进行语义分析,筛选得到语义不明确的文本;
将语义不明确的文本与第二词库进行词语检索匹配,确定语义不明确的 文本与第二词库相匹配的第一匹配数量;或者,根据语义不明确的文本进行 网络词语检索匹配,确定语义不明确的文本为预设类型词语的第二匹配数量;
将第一匹配数量及第二匹配数量的总和与检索维度风险评分值对应的数 量区间进行匹配,得到检索维度风险评分值。
可选地,核对匹配模块进一步适于:统计组合文本及过滤后的拆解文本 与同类型物品词库中词语相匹配的第三匹配数量;
将第三匹配数量与核对维度风险评分值对应的数量区间进行匹配,得到 核对维度风险评分值。
可选地,确定模块进一步适于:对解析维度风险评分值、检索维度风险 评分值、核对维度风险评分值进行加权求和处理,得到待检测物品对应的风 控评分值;
将风控评分值与风险控制方案对应的风控匹配分区间进行匹配,得到待 检测物品对应的风险控制方案。
本发明提供的方案通过对物品文字描述进行智能化的分析研究,给出风 控处理意见或者送人审,最终实现复杂风控的简单化,实现主观违规的自动 发现,减少了机审的错判率,减轻了资源消耗、计算能力消耗、电能消耗。 解决了电商运营平台因为传统的风控方法无法对物品最终售卖目的做出理解 和管控,导致的电商运营平台出现一些异常物品,所售卖的实际标的和悬挂 的图片、标题、一级部分文字描述毫无关联,甚至完全没有关系,而之所以 这样做,就是为了通过这样的欺骗举动,实现逃过机器审核和传统的风控筛 查,最终实现对目标标的的售卖或者交易的目的,最终因为实际标的不同, 电商平台要因此承担不必要的法律连带责任的问题。
本申请实施例还提供了一种非易失性计算机存储介质,所述计算机存储 介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实 施例中的风险控制方法。
图3示出了本发明实施例提供的计算设备的结构示意图,本发明具体实 施例并不对计算设备的具体实现做限定。
如图3所示,该计算设备可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。
其中:处理器、通信接口、以及存储器通过通信总线完成相互间的通信。 通信接口,用于与其它设备比如客户端或其它服务器等的网元通信。处理器, 用于执行程序,具体可以执行上述用于计算设备的风险控制方法实施例中的 相关步骤。
具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。
处理器可能是中央处理器CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明实施例的一个或多个 集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器, 如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一 个或多个ASIC。
存储器,用于存放程序。存储器可能包含高速RAM存储器,也可能还包 括非易失性存储器(non-volatile memory),例如多个磁盘存储器。
程序具体可以用于使得处理器执行上述任意方法实施例中的风险控制方 法。程序中各步骤的具体实现可以参见上述风险控制实施例中的相应步骤和 单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到, 为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前 述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固 有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述, 构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任 何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明 的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本 发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未 详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个 或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特 征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将 该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权 利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书 所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个 权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自 适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以 把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可 以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者 单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴 随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或 者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴 随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相 似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实 施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意 味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要 求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理 器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当 理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本 发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为 用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如, 计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算 机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从 因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制, 并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实 施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要 求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件 之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括 有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干 装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具 体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单 词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行 顺序的限定。

Claims (10)

1.一种风险控制方法,包括:
获取待检测物品对应的物品描述信息;
对所述物品描述信息进行文本拆解处理,得到多个拆解文本;
对多个拆解文本进行随机组合,得到组合文本;
对所述多个拆解文本进行单个字符或单个文字的过滤处理,得到过滤后的拆解文本;
对所述组合文本和所述过滤后的拆解文本进行文本解析,根据文本解析结果计算解析维度风险评分值;
根据所述组合文本和所述过滤后的拆解文本进行词语检索匹配,根据匹配结果计算检索维度风险评分值;
将所述组合文本和所述过滤后的拆解文本与同类型物品词库进行核对匹配,根据匹配结果计算核对维度风险评分值;
根据解析维度风险评分值、检索维度风险评分值、核对维度风险评分值确定所述待检测物品的风险控制方案。
2.根据权利要求1所述的方法,其中,所述对所述组合文本和所述过滤后的拆解文本进行文本解析,根据文本解析结果计算解析维度风险评分值进一步包括:
将所述组合文本和所述过滤后的拆解文本与物品要素文本信息进行比对,根据比对结果计算第一解析维度风险评分值。
3.根据权利要求2所述的方法,其中,所述对所述组合文本和所述过滤后的拆解文本进行文本解析,根据文本解析结果计算解析维度风险评分值进一步包括:
将所述组合文本和所述过滤后的拆解文本与第一词库进行匹配,根据匹配结果计算第二解析维度风险评分值。
4.根据权利要求2或3所述的方法,其中,所述对所述组合文本和所述过滤后的拆解文本进行文本解析,根据文本解析结果计算解析维度风险评分值进一步包括:
对所述组合文本和所述过滤后的拆解文本进行语音识别处理,得到转化文本;
将所述转化文本与第一词库进行匹配,根据匹配结果计算第三解析维度风险评分值。
5.根据权利要求1-3中任一项所述的方法,其中,所述根据所述组合文本和所述过滤后的拆解文本进行词语检索匹配,根据匹配结果计算检索维度风险评分值进一步包括:
对所述组合文本和所述过滤后的拆解文本进行语义分析,筛选得到语义不明确的文本;
将语义不明确的文本与第二词库进行词语检索匹配,确定语义不明确的文本与第二词库相匹配的第一匹配数量;或者,根据语义不明确的文本进行网络词语检索匹配,确定语义不明确的文本为预设类型词语的第二匹配数量;
将第一匹配数量及第二匹配数量的总和与检索维度风险评分值对应的数量区间进行匹配,得到检索维度风险评分值。
6.根据权利要求1-3中任一项所述的方法,其中,所述根据匹配结果计算核对维度风险评分值进一步包括:
统计组合文本及过滤后的拆解文本与同类型物品词库中词语相匹配的第三匹配数量;
将第三匹配数量与核对维度风险评分值对应的数量区间进行匹配,得到核对维度风险评分值。
7.根据权利要求1-3中任一项所述的方法,其中,所述根据解析维度风险评分值、检索维度风险评分值、核对维度风险评分值确定所述待检测物品的风险控制方案进一步包括:
对解析维度风险评分值、检索维度风险评分值、核对维度风险评分值进行加权求和处理,得到待检测物品对应的风控评分值;
将风控评分值与风险控制方案对应的风控匹配分区间进行匹配,得到待检测物品对应的风险控制方案。
8.一种风险控制装置,包括:
获取模块,适于获取待检测物品对应的物品描述信息;
拆解模块,适于对所述物品描述信息进行文本拆解处理,得到多个拆解文本;
处理模块,适于对多个拆解文本进行随机组合,得到组合文本;以及,对所述多个拆解文本进行单个字符或单个文字的过滤处理,得到过滤后的拆解文本;
文本解析模块,适于对所述组合文本和所述过滤后的拆解文本进行文本解析,根据文本解析结果计算解析维度风险评分值;
检索匹配模块,适于根据所述组合文本和所述过滤后的拆解文本进行词语检索匹配,根据匹配结果计算检索维度风险评分值;
核对匹配模块,适于将所述组合文本和所述过滤后的拆解文本与同类型物品词库进行核对匹配,根据匹配结果计算核对维度风险评分值;
确定模块,适于根据解析维度风险评分值、检索维度风险评分值、核对维度风险评分值确定所述待检测物品的风险控制方案。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的风险控制方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的风险控制方法对应的操作。
CN202111240098.4A 2021-10-25 2021-10-25 风险控制方法、装置、计算设备及计算机存储介质 Pending CN113901195A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111240098.4A CN113901195A (zh) 2021-10-25 2021-10-25 风险控制方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111240098.4A CN113901195A (zh) 2021-10-25 2021-10-25 风险控制方法、装置、计算设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN113901195A true CN113901195A (zh) 2022-01-07

Family

ID=79026750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111240098.4A Pending CN113901195A (zh) 2021-10-25 2021-10-25 风险控制方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113901195A (zh)

Similar Documents

Publication Publication Date Title
Ahmed et al. Detection of online fake news using n-gram analysis and machine learning techniques
CN106919661B (zh) 一种情感类型识别方法及相关装置
US20170053213A1 (en) Method and system for filtering goods evaluation information
CN110263248A (zh) 一种信息推送方法、装置、存储介质和服务器
CN108550054B (zh) 一种内容质量评估方法、装置、设备和介质
CN112015721A (zh) 一种基于大数据的电商平台存储数据库的优化方法
CN110737821B (zh) 相似事件查询的方法、装置、存储介质和终端设备
CN111242318B (zh) 基于异构特征库的业务模型训练方法及装置
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
US20170011480A1 (en) Data analysis system, data analysis method, and data analysis program
Radovanović et al. Review spam detection using machine learning
CN111475651B (zh) 文本分类方法、计算设备及计算机存储介质
CN115018588A (zh) 产品推荐方法、装置、电子设备及可读存储介质
CN109522275B (zh) 基于用户生产内容的标签挖掘方法、电子设备及存储介质
CN105095203B (zh) 同义词的确定、搜索方法及服务器
CN108399545B (zh) 电子商务平台质量检测方法和装置
KR102299525B1 (ko) 제품 평가 마이닝 방법 및 이를 수행하는 장치
CN107291686B (zh) 情感标识的辨识方法和情感标识的辨识系统
CN109472025B (zh) 菜品名称提取方法及装置
CN113901195A (zh) 风险控制方法、装置、计算设备及计算机存储介质
US11748573B2 (en) System and method to quantify subject-specific sentiment
CN113988059A (zh) 一种会话数据类型识别方法、系统、设备及存储介质
CN114417860A (zh) 一种信息检测方法、装置及设备
US9922352B2 (en) Multidimensional synopsis generation
CN110990558B (zh) 电子书内容展示方法、计算设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination