CN112381038B - 一种基于图像的文本识别方法、系统和介质 - Google Patents

一种基于图像的文本识别方法、系统和介质 Download PDF

Info

Publication number
CN112381038B
CN112381038B CN202011348515.2A CN202011348515A CN112381038B CN 112381038 B CN112381038 B CN 112381038B CN 202011348515 A CN202011348515 A CN 202011348515A CN 112381038 B CN112381038 B CN 112381038B
Authority
CN
China
Prior art keywords
text
word
segmentation
image
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011348515.2A
Other languages
English (en)
Other versions
CN112381038A (zh
Inventor
郭永金
韦正现
郝燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSSC Systems Engineering Research Institute
Original Assignee
CSSC Systems Engineering Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSSC Systems Engineering Research Institute filed Critical CSSC Systems Engineering Research Institute
Priority to CN202011348515.2A priority Critical patent/CN112381038B/zh
Publication of CN112381038A publication Critical patent/CN112381038A/zh
Application granted granted Critical
Publication of CN112381038B publication Critical patent/CN112381038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于图像的文本识别方法、系统和介质。其中方法包括:步骤S1、识别图像中的文本,以获得第一文本集;步骤S2、对第一文本集中的文本进行预处理,以获得第二文本集,其中预处理包括屏蔽词处理和分词处理;步骤S3、对第二文本集中的文本建立索引,索引为key‑value形式的键值对,其中key表示索引关键词,value表示索引关键词在第二文本集中的文本位置;步骤S4、从预先训练好的模型中获取语料关键词库,计算索引关键词与语料关键词库中的预料关键词的相似度,其中语料关键词库由模型预先训练语料库获得;以及步骤S5、基于相似度确定图像中的关键元素,作为图像的检索要素。

Description

一种基于图像的文本识别方法、系统和介质
技术领域
本发明涉及图像识别领域,尤其是涉及一种基于图像的文本识别方法、系统和介质。
背景技术
从自然场景图像中识别出的文本内容往往是杂乱无序的,为了能够将识别出的文本内容作为图像关键元素进行检索,需要对图像中的文本内容进行分析,找出与检索词相似的文本元素。对于文本元素的检索,目前已有的方法是根据关键词库对检索对象进行匹配:首先将待检索文本进行图像分割提取关键词;然后对关键词进行遍历检索,如果关键词库中的关键词与待检文本的关键词相同,即认为该图像中包含此文本元素(图像关键元素)。这种方法只能对给定关键词进行识别,对于和给定关键词词义相近或者语义相近的关键词,计算机无法进行精确识别。在实际应用中,基于语义的文本检索能够更加准确地捕捉用户的检索意图,返回更符合检索要求的检索结果。在当前的文本检索技术中,基于同义词库进行相关词汇检索的技术已经发展成熟,但对于一个同义词库中尚未包含且又可以作为当前文本关键元素的关键词,该方法无法做到准确检索,即在包含复杂语义的文本中,该方法的识别精准度较低。
发明内容
考虑到上述问题,本发明设计了一种基于图像的文本识别方案,以解决上述技术问题。该方案能够计算不同语义环境中待检文本与输入关键词之间的关联度,结合上下文语境给出检索关键词与待检图像关键元素的匹配结果,以配合基于内容的图像检索方法,提高图像搜索效率。
在第一方面,提供了一种基于图像的文本识别方法,所述所述方法包括:步骤S1、识别所述图像中的文本,以获得第一文本集;步骤S2、对所述第一文本集中的文本进行预处理,以获得第二文本集,其中所述预处理包括屏蔽词处理和分词处理;步骤S3、对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,value表示所述索引关键词在所述第二文本集中的文本位置;步骤S4、从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得;以及步骤S5、基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素。
具体地,所述屏蔽词处理为利用屏蔽词库过滤所述第一文本集。
具体地,所述分词处理包括:基于Trie树加在文本字典,对经过所述屏蔽词处理的第一文本集进行切分,以生成第一切分词和对应的第一切分位置;对于所述第一文本集中未包含在所述文本字典中的文本,利用马尔科夫模型和Viterbi算法计算最优状态序列,以获得第二切分词和对应的第二切分位置;以及整合所述第一切分词、第二切分词、第一切分位置、第二切分位置作为所述第二文本集。
具体地,所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。
在第二方面,提供了一种基于图像的文本识别系统,所述所述系统包括:识别单元,被配置为:识别所述图像中的文本,以获得第一文本集;预处理单元,被配置为:对所述第一文本集中的文本进行屏蔽词处理和分词处理,以获得第二文本集;索引建立单元,被配置为:对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,value表示所述索引关键词在所述第二文本集中的文本位置;匹配单元,被配置为:从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得;以及确定单元,被配置为:基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素。
具体地,所述预处理单元进一步被配置为:所述屏蔽词处理为利用屏蔽词库过滤所述第一文本集。
具体地,所述预处理单元进一步被配置为,所述分词处理包括:基于Trie树加在文本字典,对经过所述屏蔽词处理的第一文本集进行切分,以生成第一切分词和对应的第一切分位置;对于所述第一文本集中未包含在所述文本字典中的文本,利用马尔科夫模型和Viterbi算法计算最优状态序列,以获得第二切分词和对应的第二切分位置;以及整合所述第一切分词、第二切分词、第一切分位置、第二切分位置作为所述第二文本集。
具体地,所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。
在第三方面,提供了一种存储有指令的非暂时性计算机可读介质,当所述指令由处理器执行时,执行第一方面中的各个步骤。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的基于图像的文本识别方法的流程示意图;以及
图2为根据本发明实施例的基于图像的文本识别系统的结构示意图;
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明第一方面提供了一种基于图像的文本识别方法,图1为根据本发明实施例的基于图像的文本识别方法的流程示意图;如图1所示,所述方法包括:步骤S1、识别所述图像中的文本,以获得第一文本集;步骤S2、对所述第一文本集中的文本进行预处理,以获得第二文本集,其中所述预处理包括屏蔽词处理和分词处理;步骤S3、对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,value表示所述索引关键词在所述第二文本集中的文本位置;步骤S4、从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得;以及步骤S5、基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素。
在步骤S1,识别所述图像中的文本,以获得第一文本集。具体地,通过对图像进行分析和识别,提取出图像中的文本作为第一文本集。
在步骤S2,对所述第一文本集中的文本进行预处理,以获得第二文本集,其中所述预处理包括屏蔽词处理和分词处理。
具体地,所述屏蔽词处理为利用屏蔽词库过滤所述第一文本集。设置屏蔽词库,屏蔽词库中包含与语义无关的标点以及与后续模型训练无关的特殊文字符号。通过正则表达式算法在待检文本中依次检索屏蔽词库元素出现的位置,并将相应位置设置为空。
具体地,所述分词处理包括:(1)基于Trie树加在文本字典,对经过所述屏蔽词处理的第一文本集进行切分,以生成第一切分词和对应的第一切分位置;(2)对于所述第一文本集中未包含在所述文本字典中的文本,利用马尔科夫模型和Viterbi算法计算最优状态序列,以获得第二切分词和对应的第二切分位置;以及(3)整合所述第一切分词、第二切分词、第一切分位置、第二切分位置作为所述第二文本集。
具体地,基于Trie树加载文本字典,将待检文本根据Trie树进行切分,生成若干切分位置提议,此位置为分词词语相对于原文本的位置,取值范围为(0,n-1),n为文本长度。根据上述切分位置,构造有向无环图;通过动态规划算法,计算得到最大概率路径,也就得到了最终的切分形式。对于文本字典中没有的切分词,可将分词问题视为序列标注问题,其中,待分词文本为观测序列,分词结果为状态序列。通过隐马尔科夫模型,利用Viterbi算法进行求解,最终得到最优的状态序列,然后再根据状态序列,输出分词结果。
在步骤S3,对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,value表示所述索引关键词在所述第二文本集中的文本位置。
具体地,需要对文本的分词结果建立反向索引,通过建立key-value形式的键值对作为索引信息。其中key为分词后的关键词,value为链表形式的数据结构,用于存储对应文本位置。对于一个新的索引信息,首先搜索已有索引信息集合,通过遍历集合中的key元素,查找索引词是否存在集合中,如果存在,则在value链表的末尾添加新的位置信息,如果不存在则将新的key-value形式的索引信息存入此集合,直至所有的索引词都加入到索引集合中。
在步骤S4,从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得。所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。
具体地,所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。所述训练过程,例如,人工选取语料库,对语料库去除屏蔽词库中的屏蔽词后,基于前缀词典及动态规划实现分词,分词后的文本结果作为Word2Vec算法的输入进行模型训练,其中词向量的维度size设置为400,词向量上下文最大距离window设置为5,模型类型sg为Skip-Gram,计算词向量最小词频min_count为5,随机梯度下降中迭代步长alpha设置为0.025,随迭代次数衰减的最小步长min_alpha为0.0001,迭代次数iter为5。训练结束后得到词语的向量表示形式,为方便二次加载与搜索,将向量矩阵存储于二进制文件中。
从词向量数据库中查询索引关键词的词向量,若查询成功,则返回词向量,若查询失败则设置词向量默认值为1*n维全0矩阵。从词向量数据库中查询语料关键词的词向量,若查询成功,则返回词向量,若查询失败则设置词向量默认值为1*n维全0矩阵。基于索引关键词的词向量A=(a1,a2,……an)与预料关键词的词向量B=(b1,b2,……bn)来计算相似度,计算公式为:
结果为A和B两向量夹角的cosine值,cosine值越接近1,表示两向量夹角越小,语义越接近。比较相似度值与设定阈值的大小关系,如果超过阈值,则视为检出;如果小于阈值,则视为两个关键词间不具备相似关系。
在步骤S5,基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素。具体地,利用建立好的待检文本关键词索引,遍历上一步检出集合中的关键词搜索列表,根据对应文本关键词在索引关系得到索引位置。将索引位置上的分词作为所述图像的关键元素以用于实现对所述图像的检索。
本发明第二方面提供了一种基于图像的文本识别系统,所述所述系统包括:识别单元201,被配置为:识别所述图像中的文本,以获得第一文本集;预处理单元202,被配置为:对所述第一文本集中的文本进行屏蔽词处理和分词处理,以获得第二文本集;索引建立单元203,被配置为:对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,value表示所述索引关键词在所述第二文本集中的文本位置;匹配单元204,被配置为:从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得;以及确定单元205,被配置为:基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素。
具体地,所述预处理单元202进一步被配置为:所述屏蔽词处理为利用屏蔽词库过滤所述第一文本集。
具体地,所述预处理单元202进一步被配置为,所述分词处理包括:基于Trie树加在文本字典,对经过所述屏蔽词处理的第一文本集进行切分,以生成第一切分词和对应的第一切分位置;对于所述第一文本集中未包含在所述文本字典中的文本,利用马尔科夫模型和Viterbi算法计算最优状态序列,以获得第二切分词和对应的第二切分位置;以及整合所述第一切分词、第二切分词、第一切分位置、第二切分位置作为所述第二文本集。
具体地,所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。
在第三方面,提供了一种存储有指令的非暂时性计算机可读介质,当所述指令由处理器执行时,执行第一方面中的各个步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (7)

1.一种基于图像的文本识别方法,其特征在于,所述方法包括:
步骤S1、识别所述图像中的文本,以获得第一文本集;
步骤S2、对所述第一文本集中的文本进行预处理,以获得第二文本集,其中所述预处理包括屏蔽词处理和分词处理;
步骤S3、对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,va lue表示所述索引关键词在所述第二文本集中的文本位置;
步骤S4、从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得;以及
步骤S5、基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素;
其中,所述分词处理包括:
基于Trie树加在文本字典,对经过所述屏蔽词处理的第一文本集进行切分,以生成第一切分词和对应的第一切分位置;
对于所述第一文本集中未包含在所述文本字典中的文本,利用马尔科夫模型和Viterbi算法计算最优状态序列,以获得第二切分词和对应的第二切分位置;以及
整合所述第一切分词、第二切分词、第一切分位置、第二切分位置作为所述第二文本集。
2.根据权利要求1所述的基于图像的文本识别方法,其特征在于,所述屏蔽词处理为利用屏蔽词库过滤所述第一文本集。
3.根据权利要求1所述的基于图像的文本识别方法,其特征在于,所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。
4.一种基于图像的文本识别系统,其特征在于,所述系统包括:
识别单元,被配置为:识别所述图像中的文本,以获得第一文本集;
预处理单元,被配置为:对所述第一文本集中的文本进行屏蔽词处理和分词处理,以获得第二文本集;
索引建立单元,被配置为:对所述第二文本集中的文本建立索引,所述索引为key-value形式的键值对,其中key表示索引关键词,value表示所述索引关键词在所述第二文本集中的文本位置;
匹配单元,被配置为:从预先训练好的模型中获取语料关键词库,计算所述索引关键词与所述语料关键词库中的预料关键词的相似度,其中所述语料关键词库由所述模型预先训练语料库获得;以及
确定单元,被配置为:基于所述相似度确定所述图像中的关键元素,作为所述图像的检索要素;
其中,所述分词处理包括:
基于Trie树加在文本字典,对经过所述屏蔽词处理的第一文本集进行切分,以生成第一切分词和对应的第一切分位置;
对于所述第一文本集中未包含在所述文本字典中的文本,利用马尔科夫模型和Viterbi算法计算最优状态序列,以获得第二切分词和对应的第二切分位置;以及
整合所述第一切分词、第二切分词、第一切分位置、第二切分位置作为所述第二文本集。
5.根据权利要求4所述的基于图像的文本识别系统,其特征在于,所述预处理单元进一步被配置为:所述屏蔽词处理为利用屏蔽词库过滤所述第一文本集。
6.根据权利要求4所述的基于图像的文本识别系统,其特征在于,所述模型为Word2Vec算法中的Skip-Gram模型,所述语料关键词库中的预料关键词以词向量矩阵的形式存储在二进制文件中。
7.一种存储有指令的非暂时性计算机可读介质,当所述指令由处理器执行时,执行根据权利要求1-3中任一项所述的基于图像的文本识别方法中的步骤。
CN202011348515.2A 2020-11-26 2020-11-26 一种基于图像的文本识别方法、系统和介质 Active CN112381038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011348515.2A CN112381038B (zh) 2020-11-26 2020-11-26 一种基于图像的文本识别方法、系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011348515.2A CN112381038B (zh) 2020-11-26 2020-11-26 一种基于图像的文本识别方法、系统和介质

Publications (2)

Publication Number Publication Date
CN112381038A CN112381038A (zh) 2021-02-19
CN112381038B true CN112381038B (zh) 2024-04-19

Family

ID=74588427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011348515.2A Active CN112381038B (zh) 2020-11-26 2020-11-26 一种基于图像的文本识别方法、系统和介质

Country Status (1)

Country Link
CN (1) CN112381038B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966583A (zh) * 2021-02-26 2021-06-15 深圳壹账通智能科技有限公司 图像处理方法、装置、计算机设备和存储介质
CN113779297A (zh) * 2021-09-01 2021-12-10 北京橙色云科技有限公司 基于图片的信息搜索方法、装置以及存储介质
CN114170482B (zh) * 2022-02-11 2022-05-17 阿里巴巴达摩院(杭州)科技有限公司 一种文档预训练模型训练方法、装置、设备及介质
CN115243062B (zh) * 2022-06-16 2024-06-07 科大讯飞股份有限公司 场景展示方法、装置、屏显设备、电子设备和存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571875A (zh) * 2009-05-05 2009-11-04 程治永 一种基于图像识别的图像搜索系统的实现方法
CN101582083A (zh) * 2008-05-15 2009-11-18 株式会社理光 基于万维网的图像内容的检测、提取以及识别
CN104636334A (zh) * 2013-11-06 2015-05-20 阿里巴巴集团控股有限公司 一种关键词推荐方法和装置
CN106874443A (zh) * 2017-02-09 2017-06-20 北京百家互联科技有限公司 基于视频文本信息提取的信息查询方法以及装置
CN107122413A (zh) * 2017-03-31 2017-09-01 北京奇艺世纪科技有限公司 一种基于图模型的关键词提取方法及装置
CN108197315A (zh) * 2018-02-01 2018-06-22 中控技术(西安)有限公司 一种建立分词索引库的方法和装置
CN108509521A (zh) * 2018-03-12 2018-09-07 华南理工大学 一种自动生成文本索引的图像检索方法
CN108536678A (zh) * 2018-04-12 2018-09-14 腾讯科技(深圳)有限公司 文本关键信息提取方法、装置、计算机设备和存储介质
CN109635808A (zh) * 2018-11-01 2019-04-16 中国科学院信息工程研究所 一种在自然场景图像中对中文关键词及上下文的提取方法
CN109948141A (zh) * 2017-12-21 2019-06-28 北京京东尚科信息技术有限公司 一种提取特征词的方法和装置
CN110309278A (zh) * 2019-05-23 2019-10-08 泰康保险集团股份有限公司 关键词检索方法、装置、介质及电子设备
CN110349568A (zh) * 2019-06-06 2019-10-18 平安科技(深圳)有限公司 语音检索方法、装置、计算机设备及存储介质
CN110555372A (zh) * 2019-07-22 2019-12-10 深圳壹账通智能科技有限公司 数据录入方法、装置、设备及存储介质
CN110795911A (zh) * 2019-09-16 2020-02-14 中国平安人寿保险股份有限公司 在线文本标签的实时添加方法、装置及相关设备
CN110990563A (zh) * 2019-11-18 2020-04-10 北京信息科技大学 一种基于人工智能的传统文化素材库构建方法及系统
CN110991180A (zh) * 2019-11-28 2020-04-10 同济人工智能研究院(苏州)有限公司 一种基于关键词和Word2Vec的命令识别方法
CN111694946A (zh) * 2020-05-27 2020-09-22 平安银行股份有限公司 文本关键词可视化显示方法、装置及计算机设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809722B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
CN110019867A (zh) * 2017-10-10 2019-07-16 阿里巴巴集团控股有限公司 图像搜索方法、系统和索引构建方法和介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582083A (zh) * 2008-05-15 2009-11-18 株式会社理光 基于万维网的图像内容的检测、提取以及识别
CN101571875A (zh) * 2009-05-05 2009-11-04 程治永 一种基于图像识别的图像搜索系统的实现方法
CN104636334A (zh) * 2013-11-06 2015-05-20 阿里巴巴集团控股有限公司 一种关键词推荐方法和装置
CN106874443A (zh) * 2017-02-09 2017-06-20 北京百家互联科技有限公司 基于视频文本信息提取的信息查询方法以及装置
CN107122413A (zh) * 2017-03-31 2017-09-01 北京奇艺世纪科技有限公司 一种基于图模型的关键词提取方法及装置
CN109948141A (zh) * 2017-12-21 2019-06-28 北京京东尚科信息技术有限公司 一种提取特征词的方法和装置
CN108197315A (zh) * 2018-02-01 2018-06-22 中控技术(西安)有限公司 一种建立分词索引库的方法和装置
CN108509521A (zh) * 2018-03-12 2018-09-07 华南理工大学 一种自动生成文本索引的图像检索方法
CN108536678A (zh) * 2018-04-12 2018-09-14 腾讯科技(深圳)有限公司 文本关键信息提取方法、装置、计算机设备和存储介质
CN109635808A (zh) * 2018-11-01 2019-04-16 中国科学院信息工程研究所 一种在自然场景图像中对中文关键词及上下文的提取方法
CN110309278A (zh) * 2019-05-23 2019-10-08 泰康保险集团股份有限公司 关键词检索方法、装置、介质及电子设备
CN110349568A (zh) * 2019-06-06 2019-10-18 平安科技(深圳)有限公司 语音检索方法、装置、计算机设备及存储介质
CN110555372A (zh) * 2019-07-22 2019-12-10 深圳壹账通智能科技有限公司 数据录入方法、装置、设备及存储介质
CN110795911A (zh) * 2019-09-16 2020-02-14 中国平安人寿保险股份有限公司 在线文本标签的实时添加方法、装置及相关设备
CN110990563A (zh) * 2019-11-18 2020-04-10 北京信息科技大学 一种基于人工智能的传统文化素材库构建方法及系统
CN110991180A (zh) * 2019-11-28 2020-04-10 同济人工智能研究院(苏州)有限公司 一种基于关键词和Word2Vec的命令识别方法
CN111694946A (zh) * 2020-05-27 2020-09-22 平安银行股份有限公司 文本关键词可视化显示方法、装置及计算机设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Toward Improving Content-Based Image Retrieval Systems by means of Text Detection;C. Perez Lara 等;2014 International Conference on Mechatronics, Electronics and Automotive Engineering;20150629;全文 *
一种基于本体与描述文本的网络图像语义标注方法;陈叶旺;钟必能;王靖;李海波;;计算机科学;20120615(S1);全文 *
文本提取和相似反馈的互联网图像检索研究;詹恒飞;杨岳湘;方宏;;计算机工程与应用;20111120(32);全文 *

Also Published As

Publication number Publication date
CN112381038A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN112381038B (zh) 一种基于图像的文本识别方法、系统和介质
CN113011533B (zh) 文本分类方法、装置、计算机设备和存储介质
CN109933785B (zh) 用于实体关联的方法、装置、设备和介质
CN111324784B (zh) 一种字符串处理方法及装置
CN107341143B (zh) 一种句子连贯性判断方法及装置和电子设备
CN111709243A (zh) 一种基于深度学习的知识抽取方法与装置
US10970488B2 (en) Finding of asymmetric relation between words
CN111859921A (zh) 文本纠错方法、装置、计算机设备和存储介质
CN113076739A (zh) 一种实现跨领域的中文文本纠错方法和系统
CN110858217A (zh) 微博敏感话题的检测方法、装置及可读存储介质
CN114416979A (zh) 一种文本查询方法、设备和存储介质
CN112613293A (zh) 摘要生成方法、装置、电子设备及存储介质
CN111209373A (zh) 基于自然语义的敏感文本识别方法和装置
CN111325033B (zh) 实体识别方法、装置、电子设备及计算机可读存储介质
CN110795942B (zh) 基于语义识别的关键词确定方法、装置和存储介质
Chen et al. Integrating natural language processing with image document analysis: what we learned from two real-world applications
CN109189907A (zh) 一种基于语义匹配的检索方法及装置
CN117520485B (zh) 基于知识图谱集成的大语言模型向量检索方法
CN115221332A (zh) 一种危化品事故事理图谱的构建方法与系统
CN118212641A (zh) 一种基于cor误差处理的包装盒文本信息精准校验方法及系统
CN115858773A (zh) 适用于长文档的关键词挖掘方法、装置及介质
CN111814781B (zh) 用于对图像块识别结果进行校正的方法、设备和存储介质
CN113330430B (zh) 语句结构向量化装置、语句结构向量化方法及记录有语句结构向量化程序的记录介质
CN109902162B (zh) 基于数字指纹的文本相似性的识别方法、存储介质及装置
CN108564086B (zh) 一种字符串的识别校验方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant