CN110765302A - 一种对海量用户生产内容进行自动内容管控的方法 - Google Patents

一种对海量用户生产内容进行自动内容管控的方法 Download PDF

Info

Publication number
CN110765302A
CN110765302A CN201910894929.6A CN201910894929A CN110765302A CN 110765302 A CN110765302 A CN 110765302A CN 201910894929 A CN201910894929 A CN 201910894929A CN 110765302 A CN110765302 A CN 110765302A
Authority
CN
China
Prior art keywords
user
content
server
risk
risk level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910894929.6A
Other languages
English (en)
Inventor
李森和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Original Assignee
GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD filed Critical GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Priority to CN201910894929.6A priority Critical patent/CN110765302A/zh
Publication of CN110765302A publication Critical patent/CN110765302A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results

Abstract

本发明提供了一种对海量用户生产内容进行自动内容管控的方法,包括如下的步骤:步骤1)用户输入内容,点击发送至客户端,客户端提示包含敏感词的窗口命令,是否进行确认修改;步骤2)客户端根据其内设置的本地敏感词库验证,查看是否存在敏感词;如过包含敏感词,返回至步骤1),如果不包含敏感词进入下一步骤;步骤3)客户端将用户ID以及发送的内容推送至服务器端;步骤4)服务器端接收用户ID以及发送的内容,通过敏感词系统判断风险,步骤5)依据步骤4)的结果判断是否存在高风险,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

Description

一种对海量用户生产内容进行自动内容管控的方法
技术领域
本发明提供了计算机技术领域,涉及一种内容发布管控技术,尤其涉及一种对海量用户生产内容进行自动内容管控的方法。
背景技术
“内容”一词,源于出版媒体业,书报杂志、唱片影带里的创作,叫做内容,所以早期的内容管理CM(Content Management),偏向出版产品的管理,以储存、流程、元数据(Metadata)为要件来制作系统。内容管理是指对组织机构内部多种格式和媒体类型的信息资源(通常称为信息资产)的组织、分类、管理等有序化过程,常常作为数字图书馆或企业知识管理的一个组成部分。
随着网络的普遍使用,内容管理呈现大数据管理的趋势,现有的内容管理仅是对发布的内容进行关键敏感词进行过滤,关键敏感词进行过滤不能完全的过滤一些例如谐音字、藏头字等,也不能进行语义分析,获取内容中的风险因素。
发明内容
有鉴于此,本发明提供了一种对海量用户生产内容进行自动内容管控的方法。
本发明采用的技术方案为:
一种对海量用户生产内容进行自动内容管控的方法,包括如下的步骤:
步骤1)用户输入内容,点击发送至客户端,客户端提示包含敏感词的窗口命令,是否进行确认修改;
步骤2)客户端根据其内设置的本地敏感词库验证,查看是否存在敏感词;如过包含敏感词,返回至步骤1),如果不包含敏感词进入下一步骤;
步骤3)客户端将用户ID以及发送的内容推送至服务器端;
步骤4)服务器端接收用户ID以及发送的内容,通过敏感词系统以及大数据语义分析判断风险,具体包括:
在风险判断之前,先将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端;
一:通过敏感词系统判断风险,包括
服务器设置一扫描窗口模块,扫描窗口模块用于识别可读格式的图片的边界,在扫描窗口模块内嵌入一驱动模块,该驱动模块驱动滑动模板在扫描窗口模块识别的边界内滑动,识别可读格式的图片上的文字信息,并对识别的文字信息与服务器设置的敏感词库进行比对,查看是否存在敏感词,并遍历整个边界,判断并汇总敏感词风险结果;
二:大数据语义分析判断风险,包括
服务器设置一扫描窗口模块,扫描窗口模块用于识别可读格式的图片的边界,在扫描窗口模块内嵌入一驱动模块,该驱动模块驱动一浮动窗口模块在扫描窗口模块识别的边界内滑动,浮动窗口模块依据识别的特殊字段进行断句,并将获取的断句发送至语义分析模块,语义分析模块对断句进行处理,记录语句表达的情绪等级,并遍历整个边界,判断并汇总语句表达的情绪等级风险结果;
步骤5)依据步骤4)的结果判断是否存在高风险,如果存在高风险,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;如果不存在高风险,根据用户ID下的历史数据等级判断用户的风险等级并记录,若用户的风险等级超过设定的阈值,则服务器发送至人工审查客户端进行人工审查,若用户的风险等级未超过设定的阈值,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
在步骤5)中,若人工审查存在高风险,人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;若人工审查未存在高风险,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
在步骤5)中,判断频道风险等级,若频道风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
在步骤5)中,判断文章风险等级,若文章风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
本发明的有益效果为:
与传统的技术相比,通过敏感词进行扫描,将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端,扫描窗口模块用于识别可读格式的图片的边界,扫描窗口模块识别的边界内滑动,识别可读格式的图片上的文字信息,并对识别的文字信息与服务器设置的敏感词库进行比对,查看是否存在敏感词,并遍历整个边界,判断并汇总敏感词风险结果;该扫描窗口模块可以在识别的边界内进行横向、纵向以及按照某一角度斜向滑动,因此其可以对整个内容进行全方位的敏感词查看。
与传统的技术相比,通过大数据语义分析判断风险,将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端,浮动窗口模块在扫描窗口模块识别的边界内滑动,浮动窗口模块依据识别的特殊字段进行断句,并将获取的断句发送至语义分析模块,语义分析模块对断句进行处理,记录语句表达的情绪等级,并遍历整个边界,判断并汇总语句表达的情绪等级风险结果;语句表达的情绪等级包括是否包含愤怒情绪,是否包含谐音词汇语句等。
说明书附图
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图。
具体实施例
下面将结合附图以及具体实施例来详细说明本发明,在此本发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
实施例1
参照图1,一种对海量用户生产内容进行自动内容管控的方法,包括如下的步骤:
步骤1)用户输入内容,点击发送至客户端,客户端提示包含敏感词的窗口命令,是否进行确认修改;
步骤2)客户端根据其内设置的本地敏感词库验证,查看是否存在敏感词;如过包含敏感词,返回至步骤1),如果不包含敏感词进入下一步骤;
步骤3)客户端将用户ID以及发送的内容推送至服务器端;
步骤4)服务器端接收用户ID以及发送的内容,通过敏感词系统判断风险,具体包括:
在风险判断之前,先将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端;
服务器设置一扫描窗口模块,扫描窗口模块用于识别可读格式的图片的边界,在扫描窗口模块内嵌入一驱动模块,该驱动模块驱动滑动模板在扫描窗口模块识别的边界内滑动,识别可读格式的图片上的文字信息,并对识别的文字信息与服务器设置的敏感词库进行比对,查看是否存在敏感词,并遍历整个边界,判断并汇总敏感词风险结果;
步骤5)依据步骤4)的结果判断是否存在高风险,如果存在高风险,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;如果不存在高风险,根据用户ID下的历史数据等级判断用户的风险等级并记录,若用户的风险等级超过设定的阈值,则服务器发送至人工审查客户端进行人工审查,若用户的风险等级未超过设定的阈值,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
在步骤5)中,若人工审查存在高风险,人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;若人工审查未存在高风险,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
在步骤5)中,判断频道风险等级,若频道风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
在步骤5)中,判断文章风险等级,若文章风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
与传统的技术相比,通过敏感词进行扫描,将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端,扫描窗口模块用于识别可读格式的图片的边界,扫描窗口模块识别的边界内滑动,识别可读格式的图片上的文字信息,并对识别的文字信息与服务器设置的敏感词库进行比对,查看是否存在敏感词,并遍历整个边界,判断并汇总敏感词风险结果;该扫描窗口模块可以在识别的边界内进行横向、纵向以及按照某一角度斜向滑动,因此其可以对整个内容进行全方位的敏感词查看。
实施例2
参照图1,一种对海量用户生产内容进行自动内容管控的方法,包括如下的步骤:
步骤1)用户输入内容,点击发送至客户端,客户端提示包含敏感词的窗口命令,是否进行确认修改;
步骤2)客户端根据其内设置的本地敏感词库验证,查看是否存在敏感词;如过包含敏感词,返回至步骤1),如果不包含敏感词进入下一步骤;
步骤3)客户端将用户ID以及发送的内容推送至服务器端;
步骤4)服务器端接收用户ID以及发送的内容,通过敏感词系统以及大数据语义分析判断风险,具体包括:
在风险判断之前,先将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端;
服务器设置一扫描窗口模块,扫描窗口模块用于识别可读格式的图片的边界,在扫描窗口模块内嵌入一驱动模块,该驱动模块驱动一浮动窗口模块在扫描窗口模块识别的边界内滑动,浮动窗口模块依据识别的特殊字段进行断句,并将获取的断句发送至语义分析模块,语义分析模块对断句进行处理,记录语句表达的情绪等级,并遍历整个边界,判断并汇总语句表达的情绪等级风险结果;
步骤5)依据步骤4)的结果判断是否存在高风险,如果存在高风险,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;如果不存在高风险,根据用户ID下的历史数据等级判断用户的风险等级并记录,若用户的风险等级超过设定的阈值,则服务器发送至人工审查客户端进行人工审查,若用户的风险等级未超过设定的阈值,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
在步骤5)中,若人工审查存在高风险,人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;若人工审查未存在高风险,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
在步骤5)中,判断频道风险等级,若频道风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
在步骤5)中,判断文章风险等级,若文章风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
与传统的技术相比,通过大数据语义分析判断风险,将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端,浮动窗口模块在扫描窗口模块识别的边界内滑动,浮动窗口模块依据识别的特殊字段进行断句,并将获取的断句发送至语义分析模块,语义分析模块对断句进行处理,记录语句表达的情绪等级,并遍历整个边界,判断并汇总语句表达的情绪等级风险结果;语句表达的情绪等级包括是否包含愤怒情绪,是否包含谐音词汇语句等。
以上对本发明实施例所公开的技术方案进行了详细介绍,本文中应用了具体实施例对本发明实施例的原理以及实施方式进行了阐述,以上实施例的说明只适用于帮助理解本发明实施例的原理;同时,对于本领域的一般技术人员,依据本发明实施例,在具体实施方式以及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种对海量用户生产内容进行自动内容管控的方法,其特征在于,包括如下的步骤:
步骤1)用户输入内容,点击发送至客户端,客户端提示包含敏感词的窗口命令,是否进行确认修改;
步骤2)客户端根据其内设置的本地敏感词库验证,查看是否存在敏感词;如过包含敏感词,返回至步骤1),如果不包含敏感词进入下一步骤;
步骤3)客户端将用户ID以及发送的内容推送至服务器端;
步骤4)服务器端接收用户ID以及发送的内容,通过敏感词系统以及大数据语义分析判断风险,具体包括:
在风险判断之前,先将接收到的用户发送的内容预存为至少一种可读格式的图片,将该可读格式的图片缓存至服务器端;
一:通过敏感词系统判断风险,包括
服务器设置一扫描窗口模块,扫描窗口模块用于识别可读格式的图片的边界,在扫描窗口模块内嵌入一驱动模块,该驱动模块驱动滑动模板在扫描窗口模块识别的边界内滑动,识别可读格式的图片上的文字信息,并对识别的文字信息与服务器设置的敏感词库进行比对,查看是否存在敏感词,并遍历整个边界,判断并汇总敏感词风险结果;
二:大数据语义分析判断风险,包括
服务器设置一扫描窗口模块,扫描窗口模块用于识别可读格式的图片的边界,在扫描窗口模块内嵌入一驱动模块,该驱动模块驱动一浮动窗口模块在扫描窗口模块识别的边界内滑动,浮动窗口模块依据识别的特殊字段进行断句,并将获取的断句发送至语义分析模块,语义分析模块对断句进行处理,记录语句表达的情绪等级,并遍历整个边界,判断并汇总语句表达的情绪等级风险结果;
步骤5)依据步骤4)的结果判断是否存在高风险,如果存在高风险,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;如果不存在高风险,根据用户ID下的历史数据等级判断用户的风险等级并记录,若用户的风险等级超过设定的阈值,则服务器发送至人工审查客户端进行人工审查,若用户的风险等级未超过设定的阈值,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
2.根据权利要求1所述的对海量用户生产内容进行自动内容管控的方法,其特征在于,在步骤5)中,若人工审查存在高风险,人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理;若人工审查未存在高风险,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。
3.根据权利要求1或2所述的对海量用户生产内容进行自动内容管控的方法,其特征在于,在步骤5)中,判断频道风险等级,若频道风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
4.根据权利要求1或2所述的对海量用户生产内容进行自动内容管控的方法,其特征在于,在步骤5)中,判断文章风险等级,若文章风险等级不在正常范围内,服务器屏蔽其发送的内容并记录用户的ID,并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。
CN201910894929.6A 2019-09-20 2019-09-20 一种对海量用户生产内容进行自动内容管控的方法 Pending CN110765302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910894929.6A CN110765302A (zh) 2019-09-20 2019-09-20 一种对海量用户生产内容进行自动内容管控的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910894929.6A CN110765302A (zh) 2019-09-20 2019-09-20 一种对海量用户生产内容进行自动内容管控的方法

Publications (1)

Publication Number Publication Date
CN110765302A true CN110765302A (zh) 2020-02-07

Family

ID=69330831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910894929.6A Pending CN110765302A (zh) 2019-09-20 2019-09-20 一种对海量用户生产内容进行自动内容管控的方法

Country Status (1)

Country Link
CN (1) CN110765302A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103490978A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 终端、服务器和消息监视方法
CN103763124A (zh) * 2013-12-26 2014-04-30 孙伟力 一种互联网用户行为分析预警系统及方法
CN104850574A (zh) * 2015-02-15 2015-08-19 博彦科技股份有限公司 一种面向文本信息的敏感词过滤方法
CN107918633A (zh) * 2017-03-23 2018-04-17 广州思涵信息科技有限公司 基于语义分析技术的敏感舆情内容识别方法和预警系统
CN108452525A (zh) * 2017-12-25 2018-08-28 福建省天奕网络科技有限公司 一种游戏中聊天信息的监控方法及系统
CN109525484A (zh) * 2018-11-20 2019-03-26 阿里巴巴集团控股有限公司 风险识别处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103490978A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 终端、服务器和消息监视方法
CN103763124A (zh) * 2013-12-26 2014-04-30 孙伟力 一种互联网用户行为分析预警系统及方法
CN104850574A (zh) * 2015-02-15 2015-08-19 博彦科技股份有限公司 一种面向文本信息的敏感词过滤方法
CN107918633A (zh) * 2017-03-23 2018-04-17 广州思涵信息科技有限公司 基于语义分析技术的敏感舆情内容识别方法和预警系统
CN108452525A (zh) * 2017-12-25 2018-08-28 福建省天奕网络科技有限公司 一种游戏中聊天信息的监控方法及系统
CN109525484A (zh) * 2018-11-20 2019-03-26 阿里巴巴集团控股有限公司 风险识别处理方法和装置

Similar Documents

Publication Publication Date Title
US10606831B1 (en) Method and system for identifying entities
US6055495A (en) Speech segmentation
EP1345394B1 (en) Voice message processing system and method
US8452132B2 (en) Automatic file name generation in OCR systems
US20080066136A1 (en) System and method for detecting topic shift boundaries in multimedia streams using joint audio, visual and text cues
US20190258706A1 (en) Slide tagging and filtering
US20040015775A1 (en) Systems and methods for improved accuracy of extracted digital content
US7934264B2 (en) Methods, systems, and computer program products for detecting alteration of audio or image data
CN114297439B (zh) 一种短视频标签确定方法、系统、装置及存储介质
CN110866110A (zh) 基于人工智能的会议纪要生成方法、装置、设备及介质
US7602972B1 (en) Method and apparatus for identifying white space tables within a document
US20170344625A1 (en) Obtaining of candidates for a relationship type and its label
US10127442B2 (en) Non-sequential comparison of documents
KR101021070B1 (ko) 콘텐트-기반 콘텐트 표를 생성하기 위한 방법, 시스템, 및 프로그램 제품
CN110765302A (zh) 一种对海量用户生产内容进行自动内容管控的方法
CN106991083A (zh) 一种电子文档处理的方法及装置
CN116055825A (zh) 一种生成视频标题的方法及装置
CN110276001B (zh) 盘点页识别方法、装置、计算设备和介质
Vilain et al. Entity extraction is a boring solved problem—or is it?
KR101545273B1 (ko) 클러스터링 및 해싱을 이용하여 빅데이터 텍스트의 중복여부를 검출하는 중복문서 검출장치 및 방법
CN113923479A (zh) 音视频剪辑方法和装置
CN113468377A (zh) 一种视频与文献关联整合方法
US9535884B1 (en) Finding an end-of-body within content
KR102080910B1 (ko) 콘텐츠의 토픽 유사도를 결정하는 시스템 및 방법
US20230419018A1 (en) Automatic state assignment to documents based on phrase occurrence in text

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination