CN111159572A - 推荐内容的审核方法、装置、电子设备及存储介质 - Google Patents

推荐内容的审核方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111159572A
CN111159572A CN201911312515.4A CN201911312515A CN111159572A CN 111159572 A CN111159572 A CN 111159572A CN 201911312515 A CN201911312515 A CN 201911312515A CN 111159572 A CN111159572 A CN 111159572A
Authority
CN
China
Prior art keywords
content
page
user
quality
recommended content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911312515.4A
Other languages
English (en)
Other versions
CN111159572B (zh
Inventor
王学兵
杜英豪
熊超
李琳科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911312515.4A priority Critical patent/CN111159572B/zh
Publication of CN111159572A publication Critical patent/CN111159572A/zh
Application granted granted Critical
Publication of CN111159572B publication Critical patent/CN111159572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种推荐内容的审核方法、装置、电子设备及存储介质,涉及信息推荐领域。具体实现方案为:获取用户申请推荐的推荐内容的标识信息;根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求;若符合质量要求,将所述推荐内容标识为优质内容。本申请的技术方案,能够克服现有技术中优质内容仅能够通过线下人工团队审核,费时费力的技术问题,本申请的技术方案,能够全程线上对推荐内容进行审核,得到优质内容,与现有技术相比,优质内容审核过程省时省力,能够有效地提高优质内容的审核效率。

Description

推荐内容的审核方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及信息推荐技术领域,具体涉及一种推荐内容的审核方法、装置、电子设备及存储介质。
背景技术
用户生产内容(User-Generated Content;UGC),也可以称为用户生成内容(User-Created Content;UCC),均表示用户所提供的内容,比如一个网站所生成的页面和新闻等,均可以由用户提供,这样的内容便是用户提供的内容。
在互联网中,以UGC为代表的社区如各大论坛、贴吧、博客和微博客站点,其内容均由用户自行创作,管理人员只是协调和维护秩序。这些社区平台中的内容均是由用户自己生产自己消费。而且,还可以根据用户的使用习惯和喜欢偏好,利用机器算法进行个性化的内容推荐,满足用户个性化的信息需求。这种个性化关注定制好处是不用社区平台内容运营人员的干涉,可以满足用户自己的个性化需求,但坏处在于平台上内容属于UGC内容,若未经过任何审核,质量良莠不齐。若某些被多次推荐的内容由于推荐次数较多,被作为优质内容,作为热点而置顶,会被更多的用户关注,但是若其未经任何审核,质量较差,会严重影响社区平台的形象。因此,现有技术中需要通过线下人工团队对UGC社区平台上适于推荐的优质内容进行人工审核,并将审核通过的优质内容通过excel表的方式推荐给UGC社区平台的服务器,在UGC社区平台侧再进行人工审核,只有通过审核的内容才能在社区平台中被作为优质内容。
但是,线下人工团队对优质内容进行审核的过程,全程由人工来实现,费时、费力,导致现有的适用于推荐的优质内容审核的效率较低。
发明内容
为了解决上述技术问题,本申请提供一种推荐内容的审核方法、装置、电子设备及存储介质,用于提高内容审核的效率。
一方面,本申请提供一种推荐内容的审核方法,包括:
获取用户申请推荐的推荐内容的标识信息;
根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求;
若符合质量要求,将所述推荐内容标识为优质内容。
进一步可选地,如上所述的方法中,获取用户申请推荐的推荐内容的标识信息,包括:
检测所述用户是否触发推荐按钮;
若检测到,获取所述触发按钮所在的页面的地址信息。
进一步可选地,如上所述的方法中,获取用户申请推荐的推荐内容的标识信息之前,所述方法还包括:
检测所述用户是否具有推荐权限;
若具有,在向所述用户展示的所述页面中添加所述推荐按钮。
进一步可选地,如上所述的方法中,检测所述用户是否具有推荐权限,包括:
检测所述用户在当前的社区平台中发表内容的次数大于预设数量阈值、检测所述用户在当前的社区平台中交互的次数是否大于预设次数阈值、检测所述用户在当前的社区平台中的在线时长是否达到预设时长阈值、以及检测所述用户是否浏览完当前所述页面中的至少一个;
若均为是时,确定所述用户具有所述推荐权限。
进一步可选地,如上所述的方法中,根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求,包括:
根据所述页面的地址信息,获取所述页面的内容;
根据所述页面的内容,判断所述页面的标题是否大于预设标题长度、判断所述页面的正文的文字总数是否大于预设字数要求、判断所述页面的文字内容是否未涉及预设的敏感词语、判断所述页面的图片是否未涉及预设的敏感主题以及判断所述页面的图片的清晰度是否达到预设清晰度要求中的至少一个;
在满足上述所有要求时,确定所述推荐内容符合质量要求。
进一步可选地,如上所述的方法中,获取用户申请推荐的推荐内容的标识信息,还包括:
获取所述用户当前浏览的页面所属的分类标签。
进一步可选地,如上所述的方法中,将所述推荐内容标识为优质内容之后,所述方法还包括:
根据所述分类标签,向对应的审核平台发送所述页面的地址信息,以供所述分类标签对应的审核人员基于所述审核平台对所述优质内容进行二级审核。
另一方面,本申请还提供了一种推荐内容的审核装置,包括:
获取模块,用于获取用户申请推荐的推荐内容的标识信息;
审核模块,用于根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求;
标识模块,标识若符合质量要求,将所述推荐内容标识为优质内容。
再一方面,本申请还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上任一项所述的方法。
又一方面,本申请还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上任一项所述的方法。
上述申请中的一个实施例具有如下优点或有益效果:通过获取用户申请推荐的推荐内容的标识信息;根据预设的质量检测策略和推荐内容的标识信息,审核推荐内容是否符合质量要求;若符合质量要求,将推荐内容标识为优质内容。本申请的技术方案,能够克服现有技术中优质内容仅能够通过线下人工团队审核,费时费力的技术问题,本申请的技术方案,能够全程线上对推荐内容进行审核,得到优质内容,与现有技术相比,优质内容审核过程省时省力,能够有效地提高优质内容的审核效率。
进一步地,还可以对具有推荐权限的用户设置推荐按钮,可以从推荐内容的源头对推荐内容的质量进行把关,有效地保证推荐内容的质量;而且能够有效减少审核的工作量。
进一步地,还可以通过审核平台进行二级审核,进一步确保最终得到的优质内容的质量。与现有技术相比,整个审核过程省时省力,能够有效地提高优质内容的审核效率。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的示意图;
图2是根据本申请第二实施例的示意图;
图3是根据本申请第三实施例的示意图;
图4是用来实现本申请实施例的推荐内容的审核方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1为本申请第一实施例的示意图。如图1所示,本实施例的推荐内容的审核方法,具体可以包括如下步骤:
S101、获取用户申请推荐的推荐内容的标识信息;
S102、根据预设的质量检测策略和推荐内容的标识信息,审核推荐内容是否符合质量要求;若符合质量要求,执行步骤S103;否则,暂不执行任何操作,结束。
S103、将推荐内容标识为优质内容。
本实施例的优质内容为质量好、可以作为用户推荐内容被推荐的内容的一种标记。例如,经过本实施例筛选出来的优质内容在用户在被多次推荐后,可以作为热点内容,被更多用户关注,甚至也可以作为UGC社区平台的精华内容,被推荐至其他应用或者社区平台中。
本实施例的推荐内容的审核方法的执行主体推荐内容的审核装置,该推荐内容的审核装置可以设置在UGC社区平台的服务器侧中,用于对UGC社区平台中的用户申请推荐的推荐内容进行质量审核。
本实施例的技术方案的应用场景中,用户可以在UGC社区平台如微博、贴吧、天涯、知乎等等各种论坛上浏览感兴趣的各种信息,若用户浏览到自认为较为优质的内容,可以申请推荐给UGC社区平台的服务器中,由UGC社区平台的服务器中的推荐内容的审核装置,对用户的推荐内容进行质量审核。
例如,该步骤S101获取用户申请推荐的推荐内容的标识信息的具体步骤可以包括:检测用户是否触发推荐按钮;若检测到,获取触发按钮所在的页面的地址信息。也就是说,推荐内容的审核装置是通过检测到用户触发了推荐按钮,进而获取该推荐按钮所在页面的地址信息。此时推荐内容的标识信息包括推荐的该页面的地址信息,即页面的统一资源定位符(Uniform Resource Locator;URL)。
由上述实施例可知,本实施例的审核的前提必须是基于用户的推荐触发。但是每个UGC社区平台的注册用户数量非常庞大,用户的知识文化水平也是参差不齐。因此,本实施例中,也不能为每个用户开启推荐权限,以避免劣质用户推荐的所有推荐内容均不会作为优质内容,反而会增加推荐内容的审核装置的审核工作量。因此,本实施例中,可以仅对优质的用户开通推荐权限。也就是说,在该步骤S101之前,可选地,还可以包括如下步骤:检测用户是否具有推荐权限;若具有,在向用户展示的页面中添加推荐按钮。
例如,本实施例中,检测用户是否具有推荐权限具体可以从如下几个方面来检测:检测用户在当前的社区平台中发表内容的次数大于预设数量阈值、检测用户在当前的社区平台中交互的次数是否大于预设次数阈值、检测用户在当前的社区平台中的在线时长是否达到预设时长阈值、以及检测用户是否浏览完当前页面中的至少一个;若均为是时,确定用户具有推荐权限。
其中,检测用户在当前的社区平台中发表内容的次数大于预设数量阈值具体指的是该用户在该社区平台能够发表一些内容,表征该用户具有一定的思想、对任何问题具有自己的判断能力、能够独立的分析问题和解决问题的能力,属于较为优质的用户。
检测用户在当前的社区平台中交互的次数是否大于预设次数阈值中的交互可以包括用户对他人提出的问题解答次数、以及用户对他人发表的内容进行评论的次数。若某个用户在该社区平台的交互次数达到一定数值如100、200或者其他数值,此时可以认为该用户该UGC社区平台的优质用户。
检测用户在当前的社区平台中的在线时长是否达到预设时长阈值,主要用于检测某些不喜欢发表信息,也不喜欢和别人交互,但是在该社区平台的在线时长达到预设时长阈值如200h、300h或者其他时长,此时认为该用户也为该社区平台的成熟用户,该用户通过长时间在该社区平台浏览信息,具有一定的知识积累,也能够具备推荐优质内容的能力。
检测用户是否浏览完当前页面是检测用户是否具有推荐权限的一个最低的要求,也就是说,用户在推荐一个内容的时候,为了保证推荐的内容的质量,首先自己必须浏览完当前页面的内容。本实施例中,检测用户是否浏览完当前页面的内容可以通过用户浏览该页面的时长是否达到浏览完当前页面的最长时长,例如该最长时长可以根据该页面包括的文字总数和实验中得出的浏览页面文字的最慢速度得出。或者用户在浏览页面过程中,不断地通过鼠标移动页面焦点,还可以通过检测当前页面的焦点是否达到页面结尾,来判断用户是否浏览完当前页面。
上述检测用户是否具有推荐权限的几种检测方式仅为本实施例的几种举例,实际应用中,还可以根据实际需求,扩展出更多地检测方式,这些检测方式可以单独实施,也可以根据实际需求联合使用,在此不做限定。
根据本实施例的上述处理,同一平台上两个不同的用户A和B,若A用户具有推荐权限,则A用户浏览的页面上显示有推荐按钮,而B用户不具有推荐权限,则B用户浏览的页面上不显示推荐按钮。从而可以基于用户的不同,选择高品质的用户开通推荐权限。由于高品质的用户的知识水平较高,能够推荐较为优质内容,进而可以节省推荐内容的审核装置的审核工作量,提高优质内容的获取效率。
例如,本实施例的步骤S102根据预设的质量检测策略和推荐内容的标识信息,审核推荐内容是否符合质量要求,具体可以包括如下步骤:
(a)根据页面的地址信息,获取页面的内容;
(b)根据页面的内容,判断页面的标题是否大于预设标题长度、判断页面的正文的文字总数是否大于预设字数要求、判断页面的文字内容是否未涉及预设的敏感词语、判断页面的图片是否未涉及预设的敏感主题以及判断页面的图片的清晰度是否达到预设清晰度要求中的至少一个;
(c)在满足上述所有要求时,确定推荐内容符合质量要求。
本实施例中,页面的内容要符合质量要求,必须页面的标题、文字内容、图片等所有信息都符合质量要求。例如,在实际的UGC社区平台中,每一页面的标题信息通常情况下都足够丰富,能够表征页面的正文大体是关于哪方面的信息,因此标题的字数不能太少。因此,本实施例中可以预先设置有预设标题长度如可以为3个字、5个字等长度,通过检测页面的标题是否大于预设标题长度来判断页面的标题是否符合质量要求。
另外,优质内容必然包括丰富的信息,则必然包括一定的字数。因此,本实施例中也可以预先为正文的文字总数设置预设字数要求,如100字、200字或者其他字数。为了保证用户推荐的推荐内容为优质内容,还需要判断页面的正文的文字总数是否大于预设字数要求,对于符合预设字数要求的,才认为该页面符合质量要求。
再者,为了保证推荐内容中的文字内容是健康的,能够被允许传播的。本实施例中,还需要判断页面的文字内容是否未涉及预设的敏感词语。例如,本实施例的敏感词语可以为涉及政治、暴力、恐怖、涉黄等不健康、不允许被传播的词语。如页面的文字内容涉及到预设的敏感词语,则不符合质量要求。
进一步地,本实施例中,不仅需要对文字检测,还需要判断页面的图片是否未涉及预设的敏感主题,同样,这里的敏感主题包括政治、暴力、恐怖、涉黄等不健康、不允许被传播的主题。具体地,本实施例中,可以通过预先训练图片分类模型对每一张图片进行分类,若涉及政治、暴力、恐怖、涉黄等不健康、不允许被传播的主题的分类,则该页面不符合质量要求。
而且,为了保证页面的图片的质量,在保证图片不涉及政治、暴力、恐怖、涉黄等不健康、不允许被传播的主题后,还需要确保图片的清晰度达到一定的要求,避免优质内容的图片模糊不清。具体地,可以计算页面的图片的清晰度,然后判断页面的图片的清晰度是否达到预设清晰度要求,符合该预设清晰度要求的,才认为该页面符合质量要求。
本实施例中以质量检测策略包括如上几种中至少一种为例,实际应用中,还可以根据需求来设置和调整质量检测策略。例如有些UGC社区平台中不允许优质内容的图片中携带有花边;或者不允许图片的尺寸小于预设的第一尺寸阈值,也不允许图片的尺寸大于预设的第二尺寸阈值;或者每个UGC社区平台还可以根据自身需求,设置符合自身要求的其他质量检测策略,在此不再一一举例赘述。
本实施例中,对于符合质量检测要求的推荐内容,可以标识为优质内容,例如,在UGC社交平台的服务器中可以基于该页面的URL,记录相应的优质标识,表示该页面进过检测,后续若在其他用户间推荐分享时可以正常显示。而且在推荐次数达到一定阈值,达到一定热度,此时可以将该优质内容置于该UGC社区平台的热点区域。并且如果被引用或者被评价足够多的次数,还可以作为精华帖,至于精华区域。或者该UGC社区平台还可以将优质内容推送到其他应用或者社区平台中,以进行宣传和推广。
需要说明的是,为了保证优质内容的质量,本实施例中,还可以进一步在向审核平台发送审核后的优质内容,以供审核平台进行二级审核。具体地,也可以向审核平台发送该优质内容的标识信息如页面的URL,这样,审核平台侧的审核人员可以根据该优质内容的标识信息打开对应的页面,继续人工对该优质内容进行审核。本实施例中,还可以设置必须经过二级审核的优质内容才能被列为精华内容或者热点内容。
在审核平台进行二级审核时,审核平台可以基于预先训练的主题生成模型基于页面的文字内容生成一个主题,然后判断页面的主题与生成的主题的相似度是否达到预设阈值,若未达到,在审核平台上弹出主题修改提示,并在提示中建议修改为生成的主题,并由人工审核,若审核人员认为没有必要修改,则结束,若需要修改,则审核平台自动将优质内容的页面中的主题修改为生成的主题,重新保存页面信息,以便于该页面在下次被请求打开时显示更改后的主题。
当然实际应用中,审核平台在对优质内容二级审核时,还可以进行其他审核工作,如段落过长的审核、标点符号的审核等等,并在段落过长时,根据经验进行切分。并在标点符号使用不规范的时候,如段落末尾不是句号等,对不规范的标点符号进行修改。总之,本实施例的审核平台的二级审核,可以进一步提升优质内容的质量。
本实施例的推荐内容的审核方法,通过获取用户申请推荐的推荐内容的标识信息;根据预设的质量检测策略和推荐内容的标识信息,审核推荐内容是否符合质量要求;若符合质量要求,将推荐内容标识为优质内容。本实施例的技术方案,能够克服现有技术中优质内容仅能够通过线下人工团队审核,费时费力的技术问题,本实施例的技术方案,能够全程线上对推荐内容进行审核,得到优质内容,与现有技术相比,优质内容审核过程省时省力,能够有效地提高优质内容的审核效率。
进一步地,本实施例中,还可以对具有推荐权限的用户设置推荐按钮,可以从推荐内容的源头对推荐内容的质量进行把关,有效地保证推荐内容的质量;而且能够有效减少审核的工作量。
图2为本申请第二实施例的示意图。如图2所示,本实施例的推荐内容的审核方法,在上述图1所示实施例的技术方案的基础上,进一步更加详细地描述本发明的技术方案。本实施例的推荐内容的审核方法,具体可以包括如下步骤:
S201、推荐内容的审核装置检测注册的各用户是否具有推荐权限;并记录各用户的推荐权限;
具体地检测方式可以参考上述图1所示实施例的相关记载,在此不再赘述。具体记录各用户的推荐权限的记录方式可以采用便于记录的方式来记录,例如,可以在用户属性信息的推荐权限字段中采用1标识具有推荐权限,0标识没有推荐权限。
S202、对于具有推荐权限的用户,推荐内容的审核装置在用户请求浏览页面时,在向用户展示的页面上添加推荐按钮;
S203、推荐内容的审核装置检测用户是否触发推荐按钮;若是,执行步骤S204;否则,继续检测;
S204、推荐内容的审核装置获取触发的该推荐按钮所在页面的地址信息和页面的分类标签;
本实施例的应用场景为UGC社区平台,而实际应用中UGC社区平台中设置有无数个分类,例如实际应用中可以分为体育、音乐、游戏、星座、明星等等各种分类标签,而且进一步地,还可以在体育下面分为羽毛球、篮球、乒乓球、足球等等二级分类,明星下面分类具体地的明星名字或者内地明星、港澳台明星,日韩明星以及欧美明星等等二级分类。也就是说,用户在生成UGC和发布UGC的时候,会为该UGC打上分类标签。对应地,其他用户在浏览时可以在该分类标签下看到该内容。因此,对于每一个页面,推荐内容的审核装置还可以获取到该页面当前的分类标签。具体地,本实施例中获取的该页面的分类标签可以为一级分类标签,或者也可以为二级分类标签,在此不做限定。
S205、推荐内容的审核装置根据页面的地址信息,获取页面的内容;
S206、推荐内容的审核装置根据页面的内容和预设的质量检测策略,检测页面的内容是否符合质量要求;若符合,执行步骤S207;否则不符合,暂不对该推荐的页面做任何处理,结束。
具体地,该步骤的实施可以参考上述图1所示实施例的相关记载,在此不再赘述。
S207、推荐内容的审核装置将推荐内容标识为疑似优质内容;
此时,可认为仅完成优质内容的初级审核。
S208、推荐内容的审核装置根据页面的分类标签向对应地审核平台发送优质内容的地址信息;
本实施例中的审核平台和推荐内容的审核装置一样,都设置在UGC社区平台的服务器侧。审核平台用于实现对优质内容进行二级审核。具体地,审核平台需要审核人员人工参与,而由于每个人在各个领域的认知是有限的,所以审核平台在审核时,会发挥各个审核人员的特长,让熟知该领域的审核人员对熟知的领域进行审核。这样的话,可以基于不同的分类标签设置不同的审核平台,且由熟知该分类标签领域的多个审核人员构成一个审核团队来维护该审核平台。
S209、审核平台根据优质内容的地址信息打开优质内容的页面,对优质内容进行二级审核,并在二级审核通过后,将疑似优质内容标识为优质内容。
具体地二级审核的内容可以参考上述图1所示实施例的相关记载,在此不再赘述。
实际应用中,二级审核不仅包括审核平台的审核,还包括维护该审核平台的审核人员对该打开的优质内容的页面进行的人工审核,若有明显的形式错误,可以直接进行修改并保存。
本实施例的推荐内容的审核方法,还可以通过审核平台进行二级审核,进一步确保最终得到的优质内容的质量。与现有技术相比,整个审核过程省时省力,能够有效地提高优质内容的审核效率。
图3为本申请第一实施例的示意图。如图3所示,本实施例的推荐内容的审核装置300,包括:
获取模块301用于获取用户申请推荐的推荐内容的标识信息;
审核模块302用于根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求;
标识模块303标识若符合质量要求,将所述推荐内容标识为优质内容。
进一步可选地,本实施例的推荐内容的审核装置300中,获取模块301用于:
检测用户是否触发推荐按钮;
若检测到,获取触发按钮所在的页面的地址信息。
进一步可选地,本实施例的推荐内容的审核装置300中,还包括:
检测模块304用于检测用户是否具有推荐权限;
添加模块305用于若具有,在向用户展示的页面中添加推荐按钮。
进一步可选地,本实施例的推荐内容的审核装置300中,检测模块304用于:
检测用户在当前的社区平台中发表内容的次数大于预设数量阈值、检测用户在当前的社区平台中交互的次数是否大于预设次数阈值、检测用户在当前的社区平台中的在线时长是否达到预设时长阈值、以及检测用户是否浏览完当前页面中的至少一个;
若均为是时,确定用户具有推荐权限。
进一步可选地,本实施例的推荐内容的审核装置300中,审核模块302,用于:
根据页面的地址信息,获取页面的内容;
根据页面的内容,判断页面的标题是否大于预设标题长度、判断页面的正文的文字总数是否大于预设字数要求、判断页面的文字内容是否未涉及预设的敏感词语、判断页面的图片是否未涉及预设的敏感主题以及判断页面的图片的清晰度是否达到预设清晰度要求中的至少一个;
在满足上述所有要求时,确定推荐内容符合质量要求。
进一步可选地,本实施例的推荐内容的审核装置300中,获取模块301还用于:
获取用户当前浏览的页面所属的分类标签。
进一步可选地,本实施例的推荐内容的审核装置300中,还包括:
发送模块306用于根据分类标签,向对应的审核平台发送页面的地址信息,以供分类标签对应的审核人员基于审核平台对优质内容进行二级审核。
本实施例的推荐内容的审核装置300,通过采用上述模块实现推荐内容的审核的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图4所示,是根据本申请实施例的实现推荐内容的审核方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,该电子设备包括:一个或多个处理器401、存储器402,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图4中以一个处理器401为例。
存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的推荐内容的审核方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的推荐内容的审核方法。
存储器402作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的推荐内容的审核方法对应的程序指令/模块(例如,附图3所示的相关模块)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的推荐内容的审核方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现推荐内容的审核方法的电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至实现推荐内容的审核方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现推荐内容的审核方法的电子设备还可以包括:输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接,图4中以通过总线连接为例。
输入装置403可接收输入的数字或字符信息,以及产生与实现推荐内容的审核方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过获取用户申请推荐的推荐内容的标识信息;根据预设的质量检测策略和推荐内容的标识信息,审核推荐内容是否符合质量要求;若符合质量要求,将推荐内容标识为优质内容。本实施例的技术方案,能够克服现有技术中优质内容仅能够通过线下人工团队审核,费时费力的技术问题,本申请的技术方案,能够全程线上对推荐内容进行审核,得到优质内容,与现有技术相比,优质内容审核过程省时省力,能够有效地提高优质内容的审核效率。
根据本申请实施例的技术方案,还可以对具有推荐权限的用户设置推荐按钮,可以从推荐内容的源头对推荐内容的质量进行把关,有效地保证推荐内容的质量;而且能够有效减少审核的工作量。
根据本申请实施例的技术方案,还可以通过审核平台进行二级审核,进一步确保最终得到的优质内容的质量。与现有技术相比,整个审核过程省时省力,能够有效地提高优质内容的审核效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种推荐内容的审核方法,其特征在于,包括:
获取用户申请推荐的推荐内容的标识信息;
根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求;
若符合质量要求,将所述推荐内容标识为优质内容。
2.根据权利要求1所述的方法,其特征在于,获取用户申请推荐的推荐内容的标识信息,包括:
检测所述用户是否触发推荐按钮;
若检测到,获取所述触发按钮所在的页面的地址信息。
3.根据权利要求2所述的方法,其特征在于,获取用户申请推荐的推荐内容的标识信息之前,所述方法还包括:
检测所述用户是否具有推荐权限;
若具有,在向所述用户展示的所述页面中添加所述推荐按钮。
4.根据权利要求3所述的方法,其特征在于,检测所述用户是否具有推荐权限,包括:
检测所述用户在当前的社区平台中发表内容的次数大于预设数量阈值、检测所述用户在当前的社区平台中交互的次数是否大于预设次数阈值、检测所述用户在当前的社区平台中的在线时长是否达到预设时长阈值、以及检测所述用户是否浏览完当前所述页面中的至少一个;
若均为是时,确定所述用户具有所述推荐权限。
5.根据权利要求2-4任一所述的方法,其特征在于,根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求,包括:
根据所述页面的地址信息,获取所述页面的内容;
根据所述页面的内容,判断所述页面的标题是否大于预设标题长度、判断所述页面的正文的文字总数是否大于预设字数要求、判断所述页面的文字内容是否未涉及预设的敏感词语、判断所述页面的图片是否未涉及预设的敏感主题以及判断所述页面的图片的清晰度是否达到预设清晰度要求中的至少一个;
在满足上述所有要求时,确定所述推荐内容符合质量要求。
6.根据权利要求5所述的方法,其特征在于,获取用户申请推荐的推荐内容的标识信息,还包括:
获取所述用户当前浏览的页面所属的分类标签。
7.根据权利要求6所述的方法,其特征在于,将所述推荐内容标识为优质内容之后,所述方法还包括:
根据所述分类标签,向对应的审核平台发送所述页面的地址信息,以供所述分类标签对应的审核人员基于所述审核平台对所述优质内容进行二级审核。
8.一种推荐内容的审核装置,其特征在于,包括:
获取模块,用于获取用户申请推荐的推荐内容的标识信息;
审核模块,用于根据预设的质量检测策略和所述推荐内容的标识信息,审核所述推荐内容是否符合质量要求;
标识模块,标识若符合质量要求,将所述推荐内容标识为优质内容。
9.根据权利要求8所述的装置,其特征在于,所述获取模块,用于:
检测所述用户是否触发推荐按钮;
若检测到,获取所述触发按钮所在的页面的地址信息。
10.根据权利要求9所述的装置,其特征在于,还包括:
检测模块,用于检测所述用户是否具有推荐权限;
添加模块,用于若具有,在向所述用户展示的所述页面中添加所述推荐按钮。
11.根据权利要求10所述的装置,其特征在于,所述检测模块,用于:
检测所述用户在当前的社区平台中发表内容的次数大于预设数量阈值、检测所述用户在当前的社区平台中交互的次数是否大于预设次数阈值、检测所述用户在当前的社区平台中的在线时长是否达到预设时长阈值、以及检测所述用户是否浏览完当前所述页面中的至少一个;
若均为是时,确定所述用户具有所述推荐权限。
12.根据权利要求9-11任一所述的装置,其特征在于,所述审核模块,用于:
根据所述页面的地址信息,获取所述页面的内容;
根据所述页面的内容,判断所述页面的标题是否大于预设标题长度、判断所述页面的正文的文字总数是否大于预设字数要求、判断所述页面的文字内容是否未涉及预设的敏感词语、判断所述页面的图片是否未涉及预设的敏感主题以及判断所述页面的图片的清晰度是否达到预设清晰度要求中的至少一个;
在满足上述所有要求时,确定所述推荐内容符合质量要求。
13.根据权利要求12所述的装置,其特征在于,所述获取模块,还用于:
获取所述用户当前浏览的页面所属的分类标签。
14.根据权利要求13所述的装置,其特征在于,还包括:
发送模块,用于根据所述分类标签,向对应的审核平台发送所述页面的地址信息,以供所述分类标签对应的审核人员基于所述审核平台对所述优质内容进行二级审核。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
CN201911312515.4A 2019-12-18 2019-12-18 推荐内容的审核方法、装置、电子设备及存储介质 Active CN111159572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911312515.4A CN111159572B (zh) 2019-12-18 2019-12-18 推荐内容的审核方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911312515.4A CN111159572B (zh) 2019-12-18 2019-12-18 推荐内容的审核方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111159572A true CN111159572A (zh) 2020-05-15
CN111159572B CN111159572B (zh) 2023-05-23

Family

ID=70557319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911312515.4A Active CN111159572B (zh) 2019-12-18 2019-12-18 推荐内容的审核方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111159572B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611973A (zh) * 2020-06-01 2020-09-01 广州市百果园信息技术有限公司 目标用户识别的方法、装置及存储介质
CN111985760A (zh) * 2020-06-30 2020-11-24 北京百度网讯科技有限公司 数据内容的评价方法、装置、电子设备及存储介质
CN112650934A (zh) * 2021-01-18 2021-04-13 北京小川在线网络技术有限公司 一种基于用户高度参与的内容上推方法及其电子设备
CN112738567A (zh) * 2020-12-22 2021-04-30 北京百度网讯科技有限公司 平台内容处理方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262451B1 (en) * 2013-07-01 2016-02-16 Amazon Technologies, Inc. Data quality checking and automatic correction
CN106993202A (zh) * 2017-03-31 2017-07-28 武汉斗鱼网络科技有限公司 首页推荐方法及装置
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
US20180144052A1 (en) * 2016-11-21 2018-05-24 Comcast Cable Communications, Llc Content recommendation system with weighted metadata annotations
CN108108966A (zh) * 2017-12-08 2018-06-01 五八有限公司 一种文章的付费阅读方法、终端及存储介质
CN108304379A (zh) * 2018-01-15 2018-07-20 腾讯科技(深圳)有限公司 一种文章识别方法、装置及存储介质
CN108510237A (zh) * 2018-03-05 2018-09-07 兴义市点石文化传播有限责任公司 一种文学创作审核系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262451B1 (en) * 2013-07-01 2016-02-16 Amazon Technologies, Inc. Data quality checking and automatic correction
US20180144052A1 (en) * 2016-11-21 2018-05-24 Comcast Cable Communications, Llc Content recommendation system with weighted metadata annotations
CN106993202A (zh) * 2017-03-31 2017-07-28 武汉斗鱼网络科技有限公司 首页推荐方法及装置
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
CN108108966A (zh) * 2017-12-08 2018-06-01 五八有限公司 一种文章的付费阅读方法、终端及存储介质
CN108304379A (zh) * 2018-01-15 2018-07-20 腾讯科技(深圳)有限公司 一种文章识别方法、装置及存储介质
CN108510237A (zh) * 2018-03-05 2018-09-07 兴义市点石文化传播有限责任公司 一种文学创作审核系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611973A (zh) * 2020-06-01 2020-09-01 广州市百果园信息技术有限公司 目标用户识别的方法、装置及存储介质
CN111985760A (zh) * 2020-06-30 2020-11-24 北京百度网讯科技有限公司 数据内容的评价方法、装置、电子设备及存储介质
CN111985760B (zh) * 2020-06-30 2024-02-13 北京百度网讯科技有限公司 数据内容的评价方法、装置、电子设备及存储介质
CN112738567A (zh) * 2020-12-22 2021-04-30 北京百度网讯科技有限公司 平台内容处理方法、装置、电子设备和存储介质
CN112650934A (zh) * 2021-01-18 2021-04-13 北京小川在线网络技术有限公司 一种基于用户高度参与的内容上推方法及其电子设备

Also Published As

Publication number Publication date
CN111159572B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
US10567329B2 (en) Methods and apparatus for inserting content into conversations in on-line and digital environments
US10693981B2 (en) Provisioning personalized content recommendations
US10713066B2 (en) Generating content objects using an integrated development environment
CN108604315B (zh) 使用深度学习模型识别实体
CN104718541B (zh) 一种用于生成数字杂志的方法
CN111159572A (zh) 推荐内容的审核方法、装置、电子设备及存储介质
US10467282B2 (en) Suggesting tags on online social networks
US8712789B2 (en) People engine optimization
US20170250930A1 (en) Interactive content recommendation personalization assistant
US11310338B1 (en) Method and system for topic disambiguation and classification
US20170142044A1 (en) Ranking and Filtering Comments Based on Impression Calculations
US9152625B2 (en) Microblog summarization
CN108369709A (zh) 基于网络的广告数据业务时延减小
US8965867B2 (en) Measuring and altering topic influence on edited and unedited media
US20150287069A1 (en) Personal digital engine for user empowerment and method to operate the same
CN103853822A (zh) 一种在浏览器中推送新闻信息的方法和装置
CN104636373A (zh) 一种信息推送方法及装置
US9331973B1 (en) Aggregating content associated with topics in a social network
US20140108132A1 (en) Preserving electronic advertisements identified during a computing session
US9965812B2 (en) Generating a supplemental description of an entity
CN111783013A (zh) 评论信息发布的方法、装置、设备及计算机可读存储介质
US9734248B2 (en) Interest-based message-aggregation alteration
US10929450B2 (en) Customizing digital content with editorial content
CN106575418A (zh) 建议的关键词
US10546027B1 (en) Data search queries for descriptive semantics extracted from item reviews

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant