CN115392341A - 信息审核方法、装置及存储介质 - Google Patents

信息审核方法、装置及存储介质 Download PDF

Info

Publication number
CN115392341A
CN115392341A CN202210834609.3A CN202210834609A CN115392341A CN 115392341 A CN115392341 A CN 115392341A CN 202210834609 A CN202210834609 A CN 202210834609A CN 115392341 A CN115392341 A CN 115392341A
Authority
CN
China
Prior art keywords
information
resource information
auditing
resource
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210834609.3A
Other languages
English (en)
Inventor
孙振江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baiwu Tech Co ltd
Original Assignee
Beijing Baiwu Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baiwu Tech Co ltd filed Critical Beijing Baiwu Tech Co ltd
Priority to CN202210834609.3A priority Critical patent/CN115392341A/zh
Publication of CN115392341A publication Critical patent/CN115392341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种信息审核方法、装置及存储介质,涉及通信技术领域。该方法包括:获取第一待审核信息;将第一待审核信息中至少一种类型的资源信息分别与对应的资源库进行信息匹配,各资源库中分别存储有对应类型的预设资源信息,以及与预设资源信息对应的审核标签,审核标签用于标记预设资源信息是否能够审核通过;根据各资源库中的预设资源信息以及与预设资源信息对应的审核标签,确定至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息;将第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。本申请可以在确保能够顺利完成信息审核工作的前提下,提高信息审核效率。

Description

信息审核方法、装置及存储介质
技术领域
本申请涉及通信技术领域,尤其涉及一种信息审核方法、装置及存储介质。
背景技术
随着5G技术的发展,在进行信息传输的时候,所能够传输的信息类型越来越多,如文本、图片、声音、链接等。但信息类型的多样化,也给信息的审核工作带来了巨大挑战。
在相关技术中,不同类型信息的审核方式不同,若审核方式不佳,则会直接影响审核效率以及用户的使用体验。并且,相关技术中存在大量的人工审核,效率较低。
发明内容
本申请的多个方面提供一种信息审核方法、装置及存储介质,以至少解决相关技术中信息审核效率较低的问题。本申请的技术方案如下:
本申请实施例提供一种信息审核方法,包括:
获取第一待审核信息,所述第一待审核信息中包含至少一种类型的资源信息;
将所述至少一种类型的资源信息分别与对应的资源库进行信息匹配,各所述资源库中分别存储有对应类型的预设资源信息,以及与所述预设资源信息对应的审核标签,所述审核标签用于标记所述预设资源信息是否能够审核通过;
根据各所述资源库中的预设资源信息以及与所述预设资源信息对应的审核标签,确定所述至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息;
将所述第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。
在一些实施例中,所述第一待审核信息中包括以下至少一种类型的资源信息:图片资源信息、音频资源信息、统一资源定位符资源信息和文本资源信息。
在一些实施例中,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述将所述第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果,包括:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果;
根据所述第一审核结果、所述第二审核结果和所述第三审核结果,确定最终审核结果。
在一些实施例中,所述根据所述第一审核结果、所述第二审核结果和所述第三审核结果,确定最终审核结果,包括:
基于所述第一审核结果、所述第二审核结果和所述第三审核结果分别对应的预设权重,确定所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值;
若所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值之和超过预设分值,则确定最终审核结果为审核通过。
在一些实施例中,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述将所述第二待审核信息中至少一种类型的资源信息分别输入至对应的信息审核模型中,输出审核结果,包括:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
若所述第一审核结果和所述第二审核结果均为审核通过,则将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果。
在一些实施例中,若所述第二待审核信息中还包括统一资源定位符资源信息,则所述对所述图片资源信息进行文字提取处理,得到第一文本信息之前,所述方法还包括:
确定统一资源定位符资源信息对应的以下至少一种类型的资源信息:图片资源信息、音频资源信息、和文本资源信息。
在一些实施例中,所述将所述至少一种类型的资源信息分别与对应的资源库进行信息匹配之后,所述方法还包括:
若目标资源信息与对应的资源库中资源信息的相似度高于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配成功,根据所述资源库确定审核结果;或,
若目标资源信息与对应的资源库中资源信息的相似度低于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配失败;
其中,所述目标资源信息为所述至少一种类型的资源信息之一。
本申请实施例还提供一种信息审核装置,包括:
获取模块,用于获取第一待审核信息,所述第一待审核信息中包含至少一种类型的资源信息;
匹配模块,用于将所述至少一种类型的资源信息分别与对应的资源库进行信息匹配,各所述资源库中分别存储有对应类型的预设资源信息,以及与所述预设资源信息对应的审核标签,所述审核标签用于标记所述预设资源信息是否能够审核通过;
第一确定模块,用于根据各所述资源库中的预设资源信息以及与所述预设资源信息对应的审核标签,确定所述至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息;
审核模块,用于将所述第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。
在一些实施例中,所述第一待审核信息中包括以下至少一种类型的资源信息:图片资源信息、音频资源信息、统一资源定位符资源信息和文本资源信息。
在一些实施例中,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述审核模块还用于:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果;
根据所述第一审核结果、所述第二审核结果和所述第三审核结果,确定最终审核结果。
在一些实施例中,所述审核模块还用于:
基于所述第一审核结果、所述第二审核结果和所述第三审核结果分别对应的预设权重,确定所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值;
若所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值之和超过预设分值,则确定最终审核结果为审核通过。
在一些实施例中,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述审核模块还用于:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
若所述第一审核结果和所述第二审核结果均为审核通过,则将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果。
在一些实施例中,所述装置还包括:
第二确定模块,用于确定统一资源定位符资源信息对应的以下至少一种类型的资源信息:图片资源信息、音频资源信息、和文本资源信息。
在一些实施例中,所述装置还包括:
第三确定模块,用于若目标资源信息与对应的资源库中资源信息的相似度高于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配成功,根据所述资源库确定审核结果;或,
若目标资源信息与对应的资源库中资源信息的相似度低于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配失败;
其中,所述目标资源信息为所述至少一种类型的资源信息之一。
本申请实施例还提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述信息审核方法。
本申请实施例还提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述信息审核方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述信息审核方法。
在本申请实施例中,通过获取第一待审核信息,并将第一待审核信息中至少一种类型的资源信息分别与对应的资源库进行信息匹配,可以利用资源库中已存储的预设资源信息完成快速审核,提高了信息审核效率。而根据各资源库中的预设资源信息以及与预设资源信息对应的审核标签,可以确定至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息,也就是资源库中没有存储的资源信息,将该第二待审核信息中的资源信息分别输入至对应的信息审核模型中,即可输出审核结果,全程无需人工参与,在确保能够顺利完成信息审核工作的前提下,提高了信息审核效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种信息审核方法的流程示意图;
图2为本申请实施例提供的一种对第二待审核信息进行信息审核的流程示意图;
图3为本申请实施例提供的另一种对第二待审核信息进行信息审核的流程示意图;
图4为本申请实施例提供的一种信息审核装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种信息审核方法的流程示意图。如图1所示,该方法包括以下步骤:
步骤101、获取第一待审核信息,第一待审核信息中包含至少一种类型的资源信息。
步骤102、将至少一种类型的资源信息分别与对应的资源库进行信息匹配,各资源库中分别存储有对应类型的预设资源信息,以及与预设资源信息对应的审核标签,审核标签用于标记预设资源信息是否能够审核通过。
步骤103、根据各资源库中的预设资源信息以及与预设资源信息对应的审核标签,确定至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息。
步骤104、将第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。
在本申请实施例中,第一待审核信息和第二待审核信息中均包含了至少一种类型的资源信息,该至少一种类型的资源信息包括:图片资源信息、音频资源信息、统一资源定位符资源信息(Uniform Resource Locator,简称URL)和文本资源信息等。其中,第一待审核信息和第二待审核信息可以为4G资源信息、5G资源信息等,在此不作限定。
实际应用中,以传输5G消息为例,当需要对5G消息进行传输时,首先会对其进行审核,若审核通过,则可以正常发送,而若审核失败,则进行信息退回处理。本申请为了提高审核效率,会将待审核的5G消息先与预先建立的资源库进行匹配比对,如果通过该资源库的匹配比对就能够得到审核结果(通过或不通过),那么审核结束,而如果通过该资源库的匹配比对无法得到审核结果,即匹配失败,则将匹配失败的资源信息输入到对应类型的信息审核模型中,输出审核结果。具体审核过程如下:
获取5G消息(即第一待审核信息),该5G消息中可能包含图片、音频、文本、URL等一种或多种资源信息。
将图片、音频、文本、URL等一种或多种资源信息分别与对应的资源库进行信息匹配,以该5G消息中只包含文本资源信息为例,将该文本资源信息与文本资源信息对应的资源库进行信息匹配,该文本资源信息对应的资源库中包含了文本类型的预设资源信息,以及与预设资源信息对应的审核标签,根据该审核标签即可确定预设资源信息是否能够审核通过,举例来说,假设文本资源信息为“苹果”,那就去文本资源信息对应的资源库查找“苹果”对应的审核标签,若审核标签显示“苹果”对应的审核结果为审核通过,则审核结束,若审核标签显示“苹果”对应的审核结果为审核失败,则直接将该消息退回,而若从文本资源信息对应的资源库查询不到“苹果”,则确定该文本资源信息与其对应的资源库进行信息匹配失败,将信息匹配失败的资源信息(即苹果)作为第二待审核信息。并将该第二待审核信息中的资源信息(即苹果)输入至对应的信息审核模型中,输出用于反映该文本资源信息是否通过审核的审核结果。
此外,应理解,在将至少一种类型的资源信息分别与对应的资源库进行信息匹配的过程中,容易出现一种情况:目标资源信息并未与其对应的资源库中的预设资源信息完全一致,但是可以将其视为一种资源信息进行审核,其中,目标资源信息为至少一种类型的资源信息之一。举例来说,目标资源信息为绿色的苹果图片,而与其对应的资源库中的预设资源信息只存储了红色的苹果图片,那么,为了提高审核效率,可以将两者视为一种资源信息。基于此,本申请将至少一种类型的资源信息分别与对应的资源库进行信息匹配之后,该方法还包括:
若目标资源信息与对应的资源库中资源信息的相似度高于预设阈值,则确定目标资源信息与对应的资源库中资源信息匹配成功,根据资源库确定审核结果;或,若目标资源信息与对应的资源库中资源信息的相似度低于预设阈值,则确定目标资源信息与对应的资源库中资源信息匹配失败。其中,目标资源信息为至少一种类型的资源信息之一。
具体实施时,举例来说,假设预设阈值为90%,但不以此为限,那么,如果目标资源信息与对应的资源库中资源信息的相似度高于90%,则确定目标资源信息与对应的资源库中资源信息匹配成功,此时,用资源录对该目标资源信息进行审核即可。而如果目标资源信息与对应的资源库中资源信息的相似度低于90%,则确定目标资源信息与对应的资源库中资源信息匹配失败,此时,则可以使用对应的信息审核模型对该目标资源信息进行审核。
本申请实施例提供的信息审核方法,通过获取第一待审核信息,并将第一待审核信息中至少一种类型的资源信息分别与对应的资源库进行信息匹配,可以利用资源库中已存储的预设资源信息完成快速审核,提高了信息审核效率。而根据各资源库中的预设资源信息以及与预设资源信息对应的审核标签,可以确定至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息,也就是资源库中没有存储的资源信息,将该第二待审核信息中的资源信息分别输入至对应的信息审核模型中,即可输出审核结果,全程无需人工参与,在确保能够顺利完成信息审核工作的前提下,提高了信息审核效率。
实际应用中,第二待审核信息中也会包括图片、音频、文本、URL等一种或多种资源信息。下面提供两个实施例,对第二待审核信息的审核过程进行说明:
图2为本申请实施例提供的一种对第二待审核信息进行信息审核的方法,在本实施例中,第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,此时,如图2所示,对第二待审核信息审核的步骤包括:
步骤201、对图片资源信息进行文字提取处理,得到第一文本信息。
步骤202、对音频资源信息进行音频转文字处理,得到第二文本信息。
步骤203、将图片资源信息输入图片审核模型,输出用于反映图片资源信息是否通过审核的第一审核结果。
步骤204、将音频资源信息输入音频审核模型,输出用于反映音频资源信息是否通过审核的第二审核结果。
步骤205、将第一文本信息、第二文本信息和文本资源信息输入文本审核模型,输出用于反映第一文本信息、第二文本信息和文本资源信息是否通过审核的第三审核结果。
步骤206、根据第一审核结果、第二审核结果和第三审核结果,确定最终审核结果。
在本实施例中,第二待审核信息中同时包括了图片资源信息、音频资源信息和文本资源信息。而图片资源信息中也有可能会有文本信息,为了便于后续针对文本信息进行统一审核,本申请会对图片资源信息进行文字提取处理,得到第一文本信息,举例来说,一个食品宣传图片中插入了“生产日期”、“保质期”等文字信息,那么此时,就可以使用光学字符识别(Optical Character Recognition,简称OCR)技术,将图片中的“生产日期”、“保质期”等文字信息识别并提取出来,作为第一文本信息。同理,在音频资源信息中,为了更加准确了解该音频资源信息所表达的语义,提高审核精度,也可以使用音频转文字技术,将音频资源信息转换为文字信息,作为第二文本信息。
具体实施时,将图片资源信息输入图片审核模型,即可输出用于反映图片资源信息是否通过审核的第一审核结果。若图片资源信息审核通过,则该图片审核模型则可以直接输出图片资源信息,若图片资源信息审核不通过,则该图片审核模型直接输出不通过。
同理,将音频资源信息输入音频审核模型,即可输出用于反映音频资源信息是否通过审核的第二审核结果。若音频资源信息审核通过,则该音频审核模型则可以直接输出音频资源信息,若音频资源信息审核不通过,则该音频审核模型直接输出不通过。
将第一文本信息、第二文本信息和文本资源信息输入文本审核模型,输出用于反映第一文本信息、第二文本信息和文本资源信息是否通过审核的第三审核结果。若第一文本信息、第二文本信息和文本资源信息审核通过,则该文本审核模型则可以直接输出第一文本信息、第二文本信息和文本资源信息,若第一文本信息、第二文本信息和文本资源信息审核不通过,则该文本审核模型直接输出不通过。
需要说明的是,上述图片审核模型、音频审核模型和文本审核模型可以采用相同的模型训练方法,具体步骤如下:
获取样本数据,以及与样本数据对应的监督信息。
根据该样本数据,以及与样本数据对应的监督信息,对预设神经网络模型进行训练。
基于该模型训练方法,对于图片审核模型来说,其样本数据可以为若干图片,监督信息可以为与若干图片对应的审核结果。对于音频审核模型来说,其样本数据可以为若干音频,监督信息可以为与若干音频对应的审核结果。对于文本审核模型来说,其样本数据可以为若干文本,监督信息可以为与若干文本,以及使用自然语言处理(Natural LanguageProcessing,简称NLP)技术和语义理解技术对若干文本进行处理后的文本对应的审核结果。
在得到第一审核结果、第二审核结果和第三审核结果后,可以采用如下方法得到最终审核结果:
基于第一审核结果、第二审核结果和第三审核结果分别对应的预设权重,确定第一审核结果、第二审核结果和第三审核结果各自对应的审核分值。
若第一审核结果、第二审核结果和第三审核结果各自对应的审核分值之和超过预设分值,则确定最终审核结果为审核通过。
具体实施时,可以分别为第一审核结果、第二审核结果和第三审核结果配置一个预设权重,根据该预设权重,例如,第一审核结果的预设权重为0.3,第二审核结果的预设权重为0.7,第三审核结果的预设权重为0.9,假设第一审核结果为不通过,第二审核结果和第三审核结果为通过,则第一审核结果对应的审核分值为0分,第二审核结果对应的审核分值为70分,第三审核结果对应的审核分值为90分,假设预设分值为170分,那个其最终审核结果即为审核不通过(因为70+90<170),而如果假设预设分值为150分,那个其最终审核结果即为审核通过(因为70+90>150),此仅为一具体示例,并不以此为限。
通过采用上述方法得到最终审核结果,降低了对权重值较低的资源信息的审核力度,重点审核权重值较高的资源信息,提高了用户体验。
图3为本申请实施例提供的另一种对第二待审核信息进行信息审核的方法,在本实施例中,第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,此时,如图3所示,对第二待审核信息审核的步骤包括:
步骤301、对图片资源信息进行文字提取处理,得到第一文本信息。
步骤302、对音频资源信息进行音频转文字处理,得到第二文本信息。
步骤303、将图片资源信息输入图片审核模型,输出用于反映图片资源信息是否通过审核的第一审核结果。
步骤304、将音频资源信息输入音频审核模型,输出用于反映音频资源信息是否通过审核的第二审核结果。
步骤305、若第一审核结果和第二审核结果均为审核通过,则将第一文本信息、第二文本信息和文本资源信息输入文本审核模型,输出用于反映第一文本信息、第二文本信息和文本资源信息是否通过审核的第三审核结果。
本实施例中步骤301-步骤305与上述图2实施例相同的部分均可以参照图2中的实现方式执行,在此不再赘述。而本实施例与上述图2实施例的主要区别在于:本实施例需要先对图片资源信息和音频资源信息进行审核,进而得到第一审核结果和第二审核结果,在第一审核结果和第二审核结果均为审核通过的情况下,再对文本类资源信息进行审核,得到第三审核结果(也就是最终审核结果)。应理解,除了第二待审核信息中自带的文本资源信息外,图片资源信息和音频资源信息中均会涉及到文本信息,可见,文本信息在第二待审核信息中占比较大,因此,文本审核相对于图片审核和音频审核来说更为重要,本实施例通过上述方法,相当于进行了两轮筛选(图片和音频的审核相当于初筛,文本审核相当于复筛),提高了审核效率。
在上述图2实施例或图3实施例的基础上,若第二待审核信息中还包括统一资源定位符资源信息,则对图片资源信息进行文字提取处理,得到第一文本信息之前,该方法还包括:
确定统一资源定位符资源信息对应的以下至少一种类型的资源信息:图片资源信息、音频资源信息、和文本资源信息。
实际应用中,统一资源定位符资源信息可能会对应网页、应用程序等资源,如果第二待审核信息中包括统一资源定位符资源信息,则确定其对应的网页、应用程序等资源,并从该网页、应用程序等资源中提取图片资源信息、音频资源信息、和文本资源信息中的至少一种,并使用相当于的模型进行信息审核。需要说明的是,在利用资源库对统一资源定位符资源信息进行审核的阶段,该资源库中存储的预设资源信息即为网页、应用程序等。
图4为本申请实施例提供的一种信息审核装置的结构示意图,如图4所示,该装置包括:获取模块401、匹配模块402、第一确定模块403和审核模块404。
该获取模块401用于获取第一待审核信息,第一待审核信息中包含至少一种类型的资源信息。
匹配模块402用于将至少一种类型的资源信息分别与对应的资源库进行信息匹配,各资源库中分别存储有对应类型的预设资源信息,以及与预设资源信息对应的审核标签,审核标签用于标记预设资源信息是否能够审核通过。
第一确定模块403用于根据各资源库中的预设资源信息以及与预设资源信息对应的审核标签,确定至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息。
审核模块404用于将第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。
在本申请的一些实施例中,第一待审核信息中包括以下至少一种类型的资源信息:图片资源信息、音频资源信息、统一资源定位符资源信息和文本资源信息。
在本申请的一些实施例中,若第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则审核模块404还用于:对图片资源信息进行文字提取处理,得到第一文本信息;对音频资源信息进行音频转文字处理,得到第二文本信息;将图片资源信息输入图片审核模型,输出用于反映图片资源信息是否通过审核的第一审核结果;将音频资源信息输入音频审核模型,输出用于反映音频资源信息是否通过审核的第二审核结果;将第一文本信息、第二文本信息和文本资源信息输入文本审核模型,输出用于反映第一文本信息、第二文本信息和文本资源信息是否通过审核的第三审核结果;根据第一审核结果、第二审核结果和第三审核结果,确定最终审核结果。以及,基于第一审核结果、第二审核结果和第三审核结果分别对应的预设权重,确定第一审核结果、第二审核结果和第三审核结果各自对应的审核分值;若第一审核结果、第二审核结果和第三审核结果各自对应的审核分值之和超过预设分值,则确定最终审核结果为审核通过。
在本申请的一些实施例中,若第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则审核模块404还用于:对图片资源信息进行文字提取处理,得到第一文本信息;对音频资源信息进行音频转文字处理,得到第二文本信息;将图片资源信息输入图片审核模型,输出用于反映图片资源信息是否通过审核的第一审核结果;将音频资源信息输入音频审核模型,输出用于反映音频资源信息是否通过审核的第二审核结果;若第一审核结果和第二审核结果均为审核通过,则将第一文本信息、第二文本信息和文本资源信息输入文本审核模型,输出用于反映第一文本信息、第二文本信息和文本资源信息是否通过审核的第三审核结果。
在本申请的一些实施例中,该装置还包括:第二确定模块,用于确定统一资源定位符资源信息对应的以下至少一种类型的资源信息:图片资源信息、音频资源信息、和文本资源信息。
在本申请的一些实施例中,该装置还包括:第三确定模块,用于若目标资源信息与对应的资源库中资源信息的相似度高于预设阈值,则确定目标资源信息与对应的资源库中资源信息匹配成功,根据资源库确定审核结果;或,若目标资源信息与对应的资源库中资源信息的相似度低于预设阈值,则确定目标资源信息与对应的资源库中资源信息匹配失败;其中,目标资源信息为至少一种类型的资源信息之一。
为了实现上述目的,根据本申请的另一方面,还提供了一种电子设备。如图5所示,该电子设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本申请上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的微控制单元以产生一个机器,使得通过计算机或其他可编程数据处理设备的微控制单元执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个微控制单元(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (17)

1.一种信息审核方法,其特征在于,包括:
获取第一待审核信息,所述第一待审核信息中包含至少一种类型的资源信息;
将所述至少一种类型的资源信息分别与对应的资源库进行信息匹配,各所述资源库中分别存储有对应类型的预设资源信息,以及与所述预设资源信息对应的审核标签,所述审核标签用于标记所述预设资源信息是否能够审核通过;
根据各所述资源库中的预设资源信息以及与所述预设资源信息对应的审核标签,确定所述至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息;
将所述第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。
2.根据权利要求1所述的方法,其特征在于,所述第一待审核信息中包括以下至少一种类型的资源信息:图片资源信息、音频资源信息、统一资源定位符资源信息和文本资源信息。
3.根据权利要求1所述的方法,其特征在于,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述将所述第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果,包括:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果;
根据所述第一审核结果、所述第二审核结果和所述第三审核结果,确定最终审核结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一审核结果、所述第二审核结果和所述第三审核结果,确定最终审核结果,包括:
基于所述第一审核结果、所述第二审核结果和所述第三审核结果分别对应的预设权重,确定所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值;
若所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值之和超过预设分值,则确定最终审核结果为审核通过。
5.根据权利要求1所述的方法,其特征在于,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述将所述第二待审核信息中至少一种类型的资源信息分别输入至对应的信息审核模型中,输出审核结果,包括:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
若所述第一审核结果和所述第二审核结果均为审核通过,则将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果。
6.根据权利要求3或5所述的方法,其特征在于,若所述第二待审核信息中还包括统一资源定位符资源信息,则所述对所述图片资源信息进行文字提取处理,得到第一文本信息之前,所述方法还包括:
确定统一资源定位符资源信息对应的以下至少一种类型的资源信息:图片资源信息、音频资源信息、和文本资源信息。
7.根据权利要求1所述的方法,其特征在于,所述将所述至少一种类型的资源信息分别与对应的资源库进行信息匹配之后,所述方法还包括:
若目标资源信息与对应的资源库中资源信息的相似度高于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配成功,根据所述资源库确定审核结果;或,
若目标资源信息与对应的资源库中资源信息的相似度低于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配失败;
其中,所述目标资源信息为所述至少一种类型的资源信息之一。
8.一种信息审核装置,其特征在于,包括:
获取模块,用于获取第一待审核信息,所述第一待审核信息中包含至少一种类型的资源信息;
匹配模块,用于将所述至少一种类型的资源信息分别与对应的资源库进行信息匹配,各所述资源库中分别存储有对应类型的预设资源信息,以及与所述预设资源信息对应的审核标签,所述审核标签用于标记所述预设资源信息是否能够审核通过;
第一确定模块,用于根据各所述资源库中的预设资源信息以及与所述预设资源信息对应的审核标签,确定所述至少一种类型的资源信息中与对应资源库进行信息匹配失败的资源信息作为第二待审核信息;
审核模块,用于将所述第二待审核信息中的资源信息分别输入至对应的信息审核模型中,输出审核结果。
9.根据权利要求8所述的装置,其特征在于,所述第一待审核信息中包括以下至少一种类型的资源信息:图片资源信息、音频资源信息、统一资源定位符资源信息和文本资源信息。
10.根据权利要求8所述的装置,其特征在于,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述审核模块还用于:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果;
根据所述第一审核结果、所述第二审核结果和所述第三审核结果,确定最终审核结果。
11.根据权利要求10所述的装置,其特征在于,所述审核模块还用于:
基于所述第一审核结果、所述第二审核结果和所述第三审核结果分别对应的预设权重,确定所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值;
若所述第一审核结果、所述第二审核结果和所述第三审核结果各自对应的审核分值之和超过预设分值,则确定最终审核结果为审核通过。
12.根据权利要求8所述的装置,其特征在于,若所述第二待审核信息中包括图片资源信息、音频资源信息和文本资源信息,则所述审核模块还用于:
对所述图片资源信息进行文字提取处理,得到第一文本信息;
对所述音频资源信息进行音频转文字处理,得到第二文本信息;
将所述图片资源信息输入图片审核模型,输出用于反映所述图片资源信息是否通过审核的第一审核结果;
将所述音频资源信息输入音频审核模型,输出用于反映所述音频资源信息是否通过审核的第二审核结果;
若所述第一审核结果和所述第二审核结果均为审核通过,则将所述第一文本信息、所述第二文本信息和所述文本资源信息输入文本审核模型,输出用于反映所述第一文本信息、所述第二文本信息和所述文本资源信息是否通过审核的第三审核结果。
13.根据权利要求10或12所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于确定统一资源定位符资源信息对应的以下至少一种类型的资源信息:图片资源信息、音频资源信息、和文本资源信息。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第三确定模块,用于若目标资源信息与对应的资源库中资源信息的相似度高于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配成功,根据所述资源库确定审核结果;或,
若目标资源信息与对应的资源库中资源信息的相似度低于预设阈值,则确定所述目标资源信息与对应的资源库中资源信息匹配失败;
其中,所述目标资源信息为所述至少一种类型的资源信息之一。
15.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的信息审核方法。
16.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至7中任一项所述的信息审核方法。
17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的信息审核方法。
CN202210834609.3A 2022-07-14 2022-07-14 信息审核方法、装置及存储介质 Pending CN115392341A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210834609.3A CN115392341A (zh) 2022-07-14 2022-07-14 信息审核方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210834609.3A CN115392341A (zh) 2022-07-14 2022-07-14 信息审核方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115392341A true CN115392341A (zh) 2022-11-25

Family

ID=84116570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210834609.3A Pending CN115392341A (zh) 2022-07-14 2022-07-14 信息审核方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115392341A (zh)

Similar Documents

Publication Publication Date Title
CN109960815B (zh) 一种神经机器翻译nmt模型的创建方法及系统
CN110569502A (zh) 一种违禁广告语的识别方法、装置、计算机设备及存储介质
CN110968689A (zh) 罪名及法条预测模型的训练方法以及罪名及法条预测方法
CN110765235A (zh) 训练数据的生成方法、装置、终端及可读介质
US10755171B1 (en) Hiding and detecting information using neural networks
CN111143551A (zh) 文本预处理方法、分类方法、装置及设备
CN113010638A (zh) 实体识别模型生成方法及装置、实体提取方法及装置
CN112149386A (zh) 一种事件抽取方法、存储介质及服务器
US20230244878A1 (en) Extracting conversational relationships based on speaker prediction and trigger word prediction
CN111258905B (zh) 缺陷定位方法、装置和电子设备及计算机可读存储介质
CN115134660A (zh) 视频剪辑方法、装置、计算机设备及存储介质
CN114036283A (zh) 一种文本匹配的方法、装置、设备和可读存储介质
CN117409419A (zh) 图像检测方法、设备及存储介质
CN108255891B (zh) 一种判别网页类型的方法及装置
CN110347921B (zh) 一种多模态数据信息的标签抽取方法及装置
CN116028626A (zh) 文本匹配方法、装置、存储介质以及电子设备
CN114254588B (zh) 数据标签处理方法和装置
CN115392341A (zh) 信息审核方法、装置及存储介质
CN113704452B (zh) 基于Bert模型的数据推荐方法、装置、设备及介质
CN116304014A (zh) 训练实体类型识别模型的方法、实体类型识别方法及装置
CN115510192A (zh) 一种新闻事件脉络关系检测方法及装置
CN111783453B (zh) 文本的情感信息处理方法及装置
CN113744724A (zh) 一种语音转换方法、装置、设备及存储介质
CN107977360B (zh) 一种影视剧本中人物阵营的识别和划分方法
CN114861640B (zh) 文本摘要模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination