CN111353294B - 不良户外广告标语的检测与过滤方法与户外广告播放系统 - Google Patents

不良户外广告标语的检测与过滤方法与户外广告播放系统 Download PDF

Info

Publication number
CN111353294B
CN111353294B CN202010175265.0A CN202010175265A CN111353294B CN 111353294 B CN111353294 B CN 111353294B CN 202010175265 A CN202010175265 A CN 202010175265A CN 111353294 B CN111353294 B CN 111353294B
Authority
CN
China
Prior art keywords
slogans
slogan
detected
character
illegal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010175265.0A
Other languages
English (en)
Other versions
CN111353294A (zh
Inventor
陈叶旺
颜明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN202010175265.0A priority Critical patent/CN111353294B/zh
Publication of CN111353294A publication Critical patent/CN111353294A/zh
Application granted granted Critical
Publication of CN111353294B publication Critical patent/CN111353294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0248Avoiding fraud

Abstract

本发明涉及一种不良户外广告标语的检测与过滤方法与户外广告播放系统,在播放前利用标语黑名单对户外广告的广告标语进行检测并过滤,以保证户外广告的合法合规。本发明通过拼音的形式进行待检测标语与标语黑名单的对比,实现对同音字、谐音字的识别,能够克服不良标语试图利用同音字、谐音字的手段以躲避检测的问题;本发明将待检测标语与标语黑名单中的违规标语进行逐字两两对比,实现对乱序词字的识别,能够克服不良标语试图利用打乱词字固有顺序的手段以躲避检测的问题。本发明先利用效率更高的匹配方法先过滤出合格标语,直接进行播放;对于无法匹配合法标语的待检测标语,再进行标语黑名单对比,以提高本发明整体的检测与过滤的效率。

Description

不良户外广告标语的检测与过滤方法与户外广告播放系统
技术领域
本发明涉及广告展示的技术领域,更具体地说,涉及一种不良户外广告标语的检测与过滤方法,以及一种户外广告播放系统。
背景技术
近年来,户外电子屏成为一种重要的宣传与广告工具,在人群密集处,其受众面广,广告与宣传价值高。然而,不良广告,特别是反动政治口号在户外广告标语中屡有出现,对社会造成极其不良影响。
为躲避检测,此类广告常以不同手段进行示出,如转换同/谐音字、近形字、顺序调换或藏头藏尾等,难以准确识别与实时监控。
发明内容
本发明的目的在于克服现有技术的不足,提供一种不良户外广告标语的检测与过滤方法,以及一种户外广告播放系统,实现对广告标语进行内容识别,以实现对不良广告进行检测的目的。
本发明的技术方案如下:
一种不良户外广告标语的检测与过滤方法,建立标语黑名单,标语黑名单中的违规标语以拼音的形式进行存储;获取户外广告的待检测标语,并转化为拼音的形式;以拼音为对象,比较待检测标语与标语黑名单中的违规标语,获得待检测标语与每个违规标语的整句相似度;如果待检测标语与某个违规标语的整句相似度高于预设的判定阈值,则判定待检测标语为不良标语,禁止播放;否则待检测标语为合格标语,直接进行播放。
作为优选,比较待检测标语与标语黑名单中的违规标语的方法如下:
逐句读取标语黑名单中的违规标语,与待检测标语进行比较,直至待检测标语与某个违规标语的整句相似度高于预设的判定阈值,结束比较;如果待检测标语与所有违规标语的整句相似度均低于预设的判定阈值,则判定待检测标语为合格标语。
作为优选,获得整句相似度的方法如下:
逐个读取违规标语的字符对应的拼音,与待检测标语的每个字符对应的拼音进行比较,获得字符相似度;如果字符相似度高于预设的字符阈值,则相似字符数加1;直至完成违规标语的每个字符与对待检测标语的每个字符进行比较,统计相似字符数,计算整句相似度。
作为优选,获得字符相似度的方法如下:
逐个读取违规标语的字符对应的拼音的字母,与待检测标语的字符对应的拼音的每个字母进行比较,如果字母相同,则相同字母数加1;直至完成违规标语的字符对应的拼音的每个字母与待检测标语的字符对应的拼音的每个字母进行比较,统计相同字母数,计算字符相似度。
作为优选,建立标语白名单,在比较待检测标语与标语黑名单中的违规标语之前,先将待检测标语与标语白名单中的合法标语进行比较,获得待检测标语与合法标语的字符匹配度;如果待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,则判定待检测标语为合格标语,直接进行播放;否则将待检测标语与标语黑名单中的违规标语进行比较。
作为优选,比较待检测标语与标语白名单中的合法标语的方法如下:
逐句读取标语白名单中的合法标语,与待检测标语进行比较,直至待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,结束比较;如果待检测标语与所有合法标语的字符匹配度均低于预设的匹配阈值,则将待检测标语与标语黑名单中的违规标语进行比较。
作为优选,获得字符匹配度的方法如下:
逐个读取合法标语的字符,与待检测标语的每个字符进行比较,如果字符相同,则相同字符数加1;直至完成合法标语的每个字符与待检测标语的每个字符进行比较,统计相同字符数,计算字符匹配度。
作为优选,如果户外广告为图像,则通过OCR识别图像中的字符,得到待检测标语;如果户外广告为文本,则读取文本中的字符,得到待检测标语。
作为优选,进一步地,当户外广告的待检测标语被判定为不良标语后,输出不良标语与对应的违规标语,进行人工审核,确定判定结果是否正确;如果人工审核将判定结果由不良标语个性为合法标语,则直接进入播放,否则禁止播放。
一种户外广告播放系统,包括检测过滤服务器、屏幕,检测过滤服务器接收待播放的户外广告后,通过所述的检测与过滤方法对待播放的户外广告进行不良户外广告标语的检测与过滤;待播放的户外广告包括不良标语,则禁止播放,否则通过屏幕进行播放。
本发明的有益效果如下:
本发明所述的不良户外广告标语的检测与过滤方法与户外广告播放系统,在播放前利用标语黑名单对户外广告的广告标语进行检测并过滤,以保证户外广告的合法合规。本发明通过拼音的形式进行待检测标语与标语黑名单的对比,实现对同音字、谐音字的识别,能够克服不良标语试图利用同音字、谐音字的手段以躲避检测的问题;本发明将待检测标语与标语黑名单中的违规标语进行逐字两两对比,实现对乱序词字的识别,能够克服不良标语试图利用打乱词字固有顺序的手段以躲避检测的问题。
本发明在进行标语黑名单对比前,先进行标语白名单匹配,利用效率更高的匹配方法先过滤出匹配于合法标语的待检测标语,直接进行播放;对于无法匹配合法标语的待检测标语,再进行标语黑名单对比,以提高本发明整体的检测与过滤的效率。
附图说明
图1是本发明的流程示意图。
具体实施方式
以下结合附图及实施例对本发明进行进一步的详细说明。
本发明为了解决现有技术存在的不足,提供一种不良户外广告标语的检测与过滤方法,并基于所述的检测与过滤方法,提供一种户外广告播放系统,以实现对户外广告的检测与过滤,保证户外广告中包含的标语合法合规。
本发明所述的不良户外广告标语的检测与过滤方法,如图1所示,收集不良标语(包括反动口号、违法广告、谣言等对社会存在负面影响的字词句),基于收集的不良标语,建立标语黑名单,标语黑名单中的违规标语以拼音的形式进行存储。进行检测与过滤时,先获取户外广告的待检测标语,并转化为拼音的形式;其中,如果户外广告为图像,则通过OCR识别图像中的字符,得到待检测标语;如果户外广告为文本,则读取文本中的字符,得到待检测标语。
本发明以拼音为对象,比较待检测标语与标语黑名单中的违规标语,获得待检测标语与每个违规标语的整句相似度;如果待检测标语与某个违规标语的整句相似度高于预设的判定阈值,则判定待检测标语为不良标语,禁止播放;否则待检测标语为合格标语,直接进行播放。本发明以拼音的形式进行比较,通过对读音的识别,能够有效地识别同音字、谐音字。
本发明的主要诉求为尽可能地实现不良标语的检测与过滤,进而不允许将疑似不良标语的待检测标语直接进行播放,但一些疑似不良标语的待检测标语实际上为合法标语,需要进行筛选确定。进而,本实施例进一步地,当户外广告的待检测标语被判定为不良标语后,输出不良标语与对应的违规标语,进行人工审核,确定判定结果是否正确;如果人工审核将判定结果由不良标语个性为合法标语,则直接进入播放,否则禁止播放。
本发明中,比较待检测标语与标语黑名单中的违规标语的方法如下:
逐句读取标语黑名单中的违规标语,与待检测标语进行比较,直至待检测标语与某个违规标语的相似度高于预设的判定阈值,结束比较;即判定待检测标语为不良标语后,不再将待检测标语与剩余的未进行比较违规标语进行比较。如果待检测标语与所有违规标语的整句相似度均低于预设的判定阈值,则判定待检测标语为合格标语。
其中,获得整句相似度的方法如下:
逐个读取违规标语的字符对应的拼音,与待检测标语的每个字符对应的拼音进行比较,获得字符相似度;如果字符相似度高于预设的字符阈值,则相似字符数加1;直至完成违规标语的每个字符与对待检测标语的每个字符进行比较,统计相似字符数,计算整句相似度。由于一定程度的乱序,对阅读对影响近乎为零,不影响词字本意的表达,为了防止不良标语试图利用打乱词字固有顺序的手段以躲避检测的问题,对于每一条违规标语的对比,本发明将违规标语的每个字符对应的拼音均与待检测标语的全部字符进行对比,进而,即使待检测标语中将本应该一前一后的固定顺序的两个字符对换位置,或者中间插入另外的字,本发明均可全部进行识别。例如,违规标语为A1A2,待检测标语为B1B2B3,先用A1与B1进行对比,如果相似,则停止本轮对比,如果不相似,则与B2进行比较,以此类推;再用A2与B1进行对比,如果相似,则停止本轮对比,如果不相似,则与B2进行比较,以此类推。假如B2与A2相似,B3与A1相似,则可识别出待检测标语B1B2B3实际为B1A2A1,即待检测标语B1B2B3覆盖了A1A2。
其中,获得字符相似度的方法如下:
逐个读取违规标语的字符对应的拼音的字母,与待检测标语的字符对应的拼音的每个字母进行比较,如果字母相同,则相同字母数加1;直至完成违规标语的字符对应的拼音的每个字母与待检测标语的字符对应的拼音的每个字母进行比较,统计相同字母数,计算字符相似度。与获得整句相似度的方法同理,本发明进行相同字母的识别时,也实现了乱序识别,特别适用于英文单词的识别(英文单词存在一定程度的乱序,对阅读的影响度较低)。进而,本实施例中,如果待检测标语中包含英文,则保留英文,并以一个英文单词作为一个字符,与上述获得字符相似度的方法同理,对英文进行识别。
具体实施时,本实施例中,将收集到的不良标语转化为拼音形式,每一条不良标语存储于字符串数组slogan[n],(n=1,2,...,k)。
对于无法匹配标语白名单中的合法标语的待检测标语,对其每个汉字进行拼音转化,英文单词进行保留,并且输入变量InputText中。
从程序算法实现的角度,以伪代码的形式进行描述,具体如下:
设置变量:SimCounti用来记录输入字符文本InputText和标语黑名单中的第i个不良标语slogani的相似字符数;S用来计算InputText中与不良标语的字符相似度;预设的字符阈值pyThr:=80%,预设的判定阈值sentenceThr:=50%;
具体算法:
1)输入InputText中的内容与不良标语slogani进行对比,获得字符相似度,步骤如下:
1.1)将slogani的字符数保存下来,每个拼音视为一个汉字;
1.2)L:=InputText的字符数;
1.3)初始化i:=1,SimCounti=0;
1.4)LS:=slogani的字符数;
1.5)对slogani和InputText进行拼音比较,计算SimCounti,具体算法如下:
1.5.1)设置计数器j:=1;
1.5.2)sloganPY:=slogani的第j个字符对应的拼音;
1.5.3)设置计数器k:=1;
1.5.4)inPY:=inputText的第k个字符拼音;
1.5.5)通过拼音相似度比较算法simPY:=PYCompare(sloganPY,inPY)计算sloganPY和inPY的字符相似度;
1.5.6)如果simPY>pyThr,处理slogani的下一个字符对应的拼音
SimCounti:=SimCounti+1;
j:=j+1,
如果j≤slogani的字符个数,跳转至代码行1.5.2)
否则,处理下一个inputText的下一个字符对应的拼音
k:=k+1,
如果k≤InputText的字符个数,跳转至代码行1.5.4)
1.5.7)j:=j+1,如果j<slogani的字符个数,跳转至代码行1.5.2);
2)输出最相似的不良标语slogani及字符相似度:
Figure BDA0002410603310000061
其中,拼音相似度比较算法PYCompare过程描述如下:
算法PYCompare
输入1:拼音1 PY1
输入2:拼音2 PY2
1)NUM_PY1:=PY1的字母位数,NUM_PY2:=PY2的字母位数,设两个拼音的字符相似度SPY:=0,设置计数器count:=0
2)设置计数器m:=1
3)LPY1:=PY1的第m个字母
4)设置计数器n:=1
5)LPY2:=PY2的第n个字母
6)如果n≤NUM_PY2
如果LPY1和LPY2相同,
count:=count+1
否则n:=n+1,跳转至代码行5)
7)如果m<NUM_PY1,则n:=1,m:=m+1,跳转至代码行3)
8)返回
Figure BDA0002410603310000071
为了提高整体的检测与过滤效率,以使本发明应用于需要进行大量检测与过滤的场景时能够高效执行,本实施例中,在比较待检测标语与标语黑名单中的违规标语之前,先判断待检测标语是否为正面的标语,即合法标语。具体地,建立标语白名单,在比较待检测标语与标语黑名单中的违规标语之前,先将待检测标语与标语白名单中的合法标语进行比较,获得待检测标语与合法标语的字符匹配度;如果待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,则判定待检测标语为合格标语,直接进行播放;否则将待检测标语与标语黑名单中的违规标语进行比较。
本发明中,比较待检测标语与标语白名单中的合法标语的方法如下:
与标语黑名单的逐句对比同理,逐句读取标语白名单中的合法标语,与待检测标语进行比较,直至待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,结束比较;如果待检测标语与所有合法标语的字符匹配度均低于预设的匹配阈值,则将待检测标语与标语黑名单中的违规标语进行比较。
其中,获得字符匹配度的方法如下:
逐个读取合法标语的字符,与待检测标语的每个字符进行比较,如果字符相同,则相同字符数加1;直至完成合法标语的每个字符与待检测标语的每个字符进行比较,统计相同字符数,计算字符匹配度。由于正面的标语通常不存在刻意躲避检测的情况,进而,为了提高检测效率,进行标语白名单对比时,以字符为对象进行对比,以实现快速检测的目的。
从程序算法实现的角度,以伪代码的形式进行描述,具体如下:
设置变量:WhiteListi,(i=1,2,...,n)为标语白名单中的一条合法标语,InputText为输入标语,countW用来记录输入字符文本InputText和标语白名单中的第i个合法标语WhiteListi的相同字符数;
具体算法:
输入InputText的内容与标语白名单中的WhiteListi进行对比,使用字符比较方法,步骤如下:
1)初始化i:=1;
2)L:=InputText的字符数;
3)LSW:=的字符数;
4)对WhiteListi和InputText进行字符比较,具体算法如下:
4.1)设置计数器j:=1;
4.2)WhiteListLE:=WhiteListi的第j个字符;
4.3)设置计数器k:=1;
4.4)inLE:=InputText的第k个字符;
4.5)如果WhiteListLE=inLE,且k≤L,则countW:=countW+1,j:=j+1,跳转至代码行2)
如果WhiteListLE≠inLE,且k≤L,则k:=k+1,跳转至代码行4)
如果j≤LSW,则j:=j+1,跳转至代码行2)
否则i:=i+1,跳转至代码行1),对下一条合法标语WhiteListi进行处理。
基于所述的不良户外广告标语的检测与过滤方法,本发明还提供一种户外广告播放系统,包括检测过滤服务器、屏幕,检测过滤服务器接收待播放的户外广告后,通过所述的检测与过滤方法对待播放的户外广告进行不良户外广告标语的检测与过滤;待播放的户外广告包括不良标语,则禁止播放,否则通过屏幕进行播放。
上述实施例仅是用来说明本发明,而并非用作对本发明的限定。只要是依据本发明的技术实质,对上述实施例进行变化、变型等都将落在本发明的权利要求的范围内。

Claims (7)

1.一种不良户外广告标语的检测与过滤方法,其特征在于,建立标语黑名单,标语黑名单中的违规标语以拼音的形式进行存储;获取户外广告的待检测标语,并转化为拼音的形式;以拼音为对象,比较待检测标语与标语黑名单中的违规标语,获得待检测标语与每个违规标语的整句相似度;如果待检测标语与某个违规标语的整句相似度高于预设的判定阈值,则判定待检测标语为不良标语,禁止播放;否则待检测标语为合格标语,直接进行播放;
比较待检测标语与标语黑名单中的违规标语的方法如下:
逐句读取标语黑名单中的违规标语,与待检测标语进行比较,直至待检测标语与某个违规标语的整句相似度高于预设的判定阈值,结束比较;如果待检测标语与所有违规标语的整句相似度均低于预设的判定阈值,则判定待检测标语为合格标语;
获得整句相似度的方法如下:
逐个读取违规标语的字符对应的拼音,与待检测标语的每个字符对应的拼音进行比较,获得字符相似度;如果字符相似度高于预设的字符阈值,则相似字符数加1;直至完成违规标语的每个字符与对待检测标语的每个字符进行比较,统计相似字符数,计算整句相似度;
获得字符相似度的方法如下:
逐个读取违规标语的字符对应的拼音的字母,与待检测标语的字符对应的拼音的每个字母进行比较,如果字母相同,则相同字母数加1;直至完成违规标语的字符对应的拼音的每个字母与待检测标语的字符对应的拼音的每个字母进行比较,统计相同字母数,计算字符相似度。
2.根据权利要求1所述的不良户外广告标语的检测与过滤方法,其特征在于,建立标语白名单,在比较待检测标语与标语黑名单中的违规标语之前,先将待检测标语与标语白名单中的合法标语进行比较,获得待检测标语与合法标语的字符匹配度;如果待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,则判定待检测标语为合格标语,直接进行播放;否则将待检测标语与标语黑名单中的违规标语进行比较。
3.根据权利要求2所述的不良户外广告标语的检测与过滤方法,其特征在于,比较待检测标语与标语白名单中的合法标语的方法如下:
逐句读取标语白名单中的合法标语,与待检测标语进行比较,直至待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,结束比较;如果待检测标语与所有合法标语的字符匹配度均低于预设的匹配阈值,则将待检测标语与标语黑名单中的违规标语进行比较。
4.根据权利要求3所述的不良户外广告标语的检测与过滤方法,其特征在于,获得字符匹配度的方法如下:
逐个读取合法标语的字符,与待检测标语的每个字符进行比较,如果字符相同,则相同字符数加1;直至完成合法标语的每个字符与待检测标语的每个字符进行比较,统计相同字符数,计算字符匹配度。
5.根据权利要求1所述的不良户外广告标语的检测与过滤方法,其特征在于,如果户外广告为图像,则通过OCR识别图像中的字符,得到待检测标语;如果户外广告为文本,则读取文本中的字符,得到待检测标语。
6.根据权利要求1所述的不良户外广告标语的检测与过滤方法,其特征在于,进一步地,当户外广告的待检测标语被判定为不良标语后,输出不良标语与对应的违规标语,进行人工审核,确定判定结果是否正确;如果人工审核将判定结果由不良标语个性为合法标语,则直接进入播放,否则禁止播放。
7.一种户外广告播放系统,其特征在于,包括检测过滤服务器、屏幕,检测过滤服务器接收待播放的户外广告后,通过权利要求1至6任一项所述的检测与过滤方法对待播放的户外广告进行不良户外广告标语的检测与过滤;待播放的户外广告包括不良标语,则禁止播放,否则通过屏幕进行播放。
CN202010175265.0A 2020-03-13 2020-03-13 不良户外广告标语的检测与过滤方法与户外广告播放系统 Active CN111353294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010175265.0A CN111353294B (zh) 2020-03-13 2020-03-13 不良户外广告标语的检测与过滤方法与户外广告播放系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010175265.0A CN111353294B (zh) 2020-03-13 2020-03-13 不良户外广告标语的检测与过滤方法与户外广告播放系统

Publications (2)

Publication Number Publication Date
CN111353294A CN111353294A (zh) 2020-06-30
CN111353294B true CN111353294B (zh) 2023-03-10

Family

ID=71197425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010175265.0A Active CN111353294B (zh) 2020-03-13 2020-03-13 不良户外广告标语的检测与过滤方法与户外广告播放系统

Country Status (1)

Country Link
CN (1) CN111353294B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114440524A (zh) * 2022-01-26 2022-05-06 海信(山东)冰箱有限公司 一种冰箱以及冰箱食材数据的处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876968A (zh) * 2010-05-06 2010-11-03 复旦大学 对网络文本与手机短信进行不良内容识别的方法
CN109299471A (zh) * 2018-11-05 2019-02-01 广州百田信息科技有限公司 一种文本匹配的方法、装置及终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7587308B2 (en) * 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876968A (zh) * 2010-05-06 2010-11-03 复旦大学 对网络文本与手机短信进行不良内容识别的方法
CN109299471A (zh) * 2018-11-05 2019-02-01 广州百田信息科技有限公司 一种文本匹配的方法、装置及终端

Also Published As

Publication number Publication date
CN111353294A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN111178345A (zh) 一种票据分析方法、分析装置、计算机设备和介质
CN108108732A (zh) 字符辨识系统及其字符辨识方法
CN109147340A (zh) 违法停车案件的鉴别方法、装置和计算机设备
US20120224765A1 (en) Text region detection system and method
CN112287914B (zh) Ppt视频段提取方法、装置、设备及介质
CN101359373B (zh) 退化字符的识别方法和装置
CN106951832A (zh) 一种基于手写字符识别的验证方法及装置
CN112347244A (zh) 基于混合特征分析的涉黄、涉赌网站检测方法
CN111428593A (zh) 一种文字识别方法、装置、电子设备及存储介质
CN103761221B (zh) 用于识别敏感文本信息的系统和方法
Hassaïne et al. ICFHR 2012 competition on writer identification challenge 2: Arabic scripts
Halima et al. Nf-savo: Neuro-fuzzy system for arabic video ocr
CN111353491A (zh) 一种文字方向确定方法、装置、设备及存储介质
CN109933648A (zh) 一种真实用户评论的区分方法和区分装置
CN111353294B (zh) 不良户外广告标语的检测与过滤方法与户外广告播放系统
CN114881698A (zh) 广告合规审核方法、装置、电子设备及存储介质
KR100243350B1 (ko) 뉴스 비디오 자막 추출 및 인식 방법
CN116645683A (zh) 基于提示学习的签名笔迹鉴别方法、系统及存储介质
Kumar et al. Line based robust script identification for indianlanguages
CN112818984B (zh) 标题生成方法、装置、电子设备和存储介质
Wang et al. Handwritten Chinese address recognition
CN111723651A (zh) 一种人脸识别方法、人脸识别装置及终端设备
CN111476028A (zh) 一种汉语短语识别方法、系统、存储介质及电子设备
CN114117533B (zh) 一种图片数据分类的方法和系统
CN111597906B (zh) 一种结合文字信息的快速绘本识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant