CN109272440A - 一种联合文本和图像内容的缩略图生成方法及系统 - Google Patents
一种联合文本和图像内容的缩略图生成方法及系统 Download PDFInfo
- Publication number
- CN109272440A CN109272440A CN201810919504.1A CN201810919504A CN109272440A CN 109272440 A CN109272440 A CN 109272440A CN 201810919504 A CN201810919504 A CN 201810919504A CN 109272440 A CN109272440 A CN 109272440A
- Authority
- CN
- China
- Prior art keywords
- image
- region
- text
- matrix
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000000463 material Substances 0.000 title claims abstract description 14
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 46
- 238000010191 image analysis Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000012876 topography Methods 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
- G06T3/053—Detail-in-context presentations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种联合文本与图像内容的图像缩略方法及系统。该方法包括:对原始图像进行显著性检测以及图像内容结构化分析以提取局部图像信息,对与原始图像相关的文本信息进行关键词分析与统计,结合所提取到的局部图像信息与关键词信息进行信息融合处理以确定最终缩略图的区域。本发明提供的图像缩略方法,在图文并存的场景下,所产生的缩略图能够准确地与文本的关联内容相映衬,兼顾了图像和文本的关联性,从而经本发明提供的方法产生的缩略图区域更为合理。
Description
技术领域
本发明公开了一种联合文本和图像内容的缩略图生成方法,涉及图像提取/缩略领域。在图文并茂的场景下,通过本发明提供方法及系统基于原始图像产生的缩略图,能够准确地兼顾图像和文本的关联性,给出更为合理的缩略图区域。
背景技术
图像缩略图广泛存在于互联网领域,用于快速传输及预览图像信息。本发明的处理对象是广泛存在于互联网络领域的图文配合内容,比如同时包含文字和图像的文章、帖子等。这类内容同时包含了非结构化的文本信息和图像,且文本和图像通常存在相关性。
目前图像的缩略图主要是通过显著性检测以获取图像的显著性区域;计算包含所述的显著性区域的最大矩形区域;根据所述的最大矩形区域进行图像截取,得到待处理图像的缩略图。这样获取的缩略图可能无法准确将原始图像中需要用户重点关注的区域展示出来。例如、原始图像中需要用户重点关注的包含有丰富信息的背景/远景常常被缩略图漏掉,特别是网络环境下,图文并茂的场景大量存在,与原始图像关联的文本内容包含大量描述所述原始图像的文字信息以及说明需要用户侧重关注/发现的原始图像区域的指示/暗示信息,目前的图像缩略方法由于没有兼顾与原始图像相关的文本内容,所产生的缩略图无法准确地呈现与关联的文本内容契合。
发明内容
为了解决上述现存的缩略图生产方法的缺点,本发明提供一种联合文本与图像内容的图像缩略方法,该方法包括:基于现有的显著性分析算法对原始图像进行显著性检测,输出人可能感兴趣的图像区域作为图像显著性区域;结合多种图像分析算法对所述原始图像进行内容结构化分析,确定所述原始图像中的目标区域、所述目标区域对应的区域类别标签以及其他信息内容;采用关键词提取算法对所述原始图像相关的文本提取关键词并统计相应关键词在所述文本中出现的次数,输出包括相应的关键词及其出现在文本中的次数;基于通用知识图谱对所述区域类别标签、所述关键词进行信息融合,根据信息融合的结果以及所述图像显著性区域在所述原始图像中确定出缩略图区域,并根据所述缩略图区域以及原始图像产生缩略图。
进一步地、所述的多种图像分析算法包括:用于检测物体的深度神经网络目标检测算法、人脸检测与识别算法、以及图像文字检测与识别算法。所述目标区域包括原始图像中的物体区域、人脸区域以及文字区域。
进一步地、所述基于通用知识图谱对所述区域类别标签、所述关键词进行信息融合,具体为:采用通用知识图谱的距离模型,将所述关键词构建成文本关键词矩阵,将所述图像区域类别标签构建成图像区域类别标签矩阵;计算文本关键词矩阵与图像区域类别标签矩阵的关系距离矩阵D,并对所述关系距离举证元素进行加权化处理。所述根据信息融合的结果以及所述图像显著性区域确定出缩略图在所述图像中的区域作为缩略图区域,具体包括:分别计算图像中各所述目标区域与所述图像显著性区域的重合面积并去重,判断所述去重后的重合面积占显著性区域的面积的百分比是否大于或等于预设的阈值,若是、则选择显著性区域作为缩略图输出;否则、根据经过加权处理后的关系距离矩阵D*的元素,选择对应的所述目标区域进行重复合并处理,直到合并处理后的区域达到指定的缩略图大小时将其作为缩略图区域。
相应地,本发明还提供一种联合文本与图像内容的图像缩略系统,该系统包括:
图像分析模块,用于对原始图像进行显著性检测,输出人可能感兴趣的图像区域作为图像显著性区域,同时结合多种图像分析算法对所述原始图像进行内容结构化分析,确定所述原始图像中的目标区域、所述目标区域对应的区域类别标签以及其他信息内容;
文本关键词提取模块,基于预设的关键词提取算法对所述原始图像相关的文本提取关键词并统计相应关键词在所述文本中出现的次数,输出包括相应的关键词及其出现在文本中的次数;
信息融合模块,基于通用知识图谱对图像分析模块输出的所述区域类别标签、文本关键词提取模块提取的所述关键词进行信息融合;
缩略图产生模块,用于根据信息融合的结果以及图像分析模块输出的所述图像显著性区域,在原始图像中确定出缩略图区域,并根据所述缩略图区域产生缩略图。
附图说明
图1为本发明提供的联合文本与图像内容的图像缩略方案技术框架图;
图2为本发明中根据关系距离矩阵确定缩略图区域的示意图。
具体实施方式
为了使本发明所解决的技术问题、技术方案以及有益效果更加清楚明白,以下结合附图对本发明进行进一步详细说明。应该理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照附图1,一种联合文本与图像内容的图像缩略方法,该方法包括以下步骤:a.对原始图像进行显著性检测,输出人可能感兴趣的图像区域作为图像显著性区域;结合多种图像分析算法对所述原始图像进行内容结构化分析,确定所述原始图像中的目标区域、所述目标区域对应的区域类别标签以及其他信息内容;采用关键词提取算法对所述原始图像相关的文本提取关键词并统计相应关键词在所述文本中出现的次数,输出包括相应的关键词及其出现在文本中的次数;b.基于通用知识图谱对所述区域类别标签、所述关键词进行信息融合,根据信息融合的结果以及所述图像显著性区域,在所述原始图像中确定出缩略图区域;c.根据所述缩略图区域以及原始图像产生缩略图。
图像显著性检测是图像处理领域常规的技术性手段。在图像分析与处理领域存在着丰富的图像显著性检测算法。在上述方法的步骤a中对原始图像进行显著性检测可以采用目前现有的图像显著性算法来实现。对图像内容结构化分析具体包括物体检测、文字检测与识别、人脸检测与识别:
物体检测:使用深度神经网络目标检测方法,对常用物体进行检测输出图像中的物体区域、所属类别标签及置信度。物体的类别标签包括常见的物体,如:桌子、椅子、房屋、汽车等。
图像文字检测与识别:检测图像中的文本位置并进行文字识别输出图像中的文字区域、识别对应的文字内容并标签化及置信度。文字内容的标签形式可以是图像中文本的文字内容,或者对所述文字内容提取的关键词。
人脸检测与识别:基于现有的人脸识别算法检测并识别图像中的人脸信息。输出人脸图像区域、人脸信息及置信度。人脸信息可以包括根据预设的人脸特征库来识别出对应的人脸ID。无法识别人脸时,仅输出人脸图像区域及置信度。通过以上对原始图像多个维度的分析,得到该图像中的以上各类目标区域(由一定坐标构成的范围)以及对应的区域类别标签以及置信度。
其中、步骤b中综合文本关键词、图像显著性区域、以及图像内容结构化信息,进行信息融合,确定最终的缩略图在原始图像中的区域。示意图如图2,具体说明如下:
1.将提取到的文本关键词的按照词频从高到低进行排序组织成元素个数为M的矩阵,记为F1={key1,…keyM};
2.将图像内容分析中的物体标签及人脸标签组织成元素个数为N的区域类别标签矩阵,记为{label1,…labelN}。如果图像中识别出了文字,对图像文字识别结果进行关键词抽取,添加到图像区域类别标签矩阵中,得到F2={label1,…labelK},其中K为大于N的整数。如果图像中没有识别出文字,跳过本步。
3.分别计算图像中各所述目标区域与所述图像显著性区域的重合面积并去重,判断所述去重后的重合面积占显著性区域的面积的百分比是否大于或等于预设的阈值。若是、则选择显著性区域作为缩略图输出;否则、基于现有的通用知识图谱构建的关系型查找数据库,计算图像区域类型标签与文本关键词的关系距离矩阵D,大小为M*K,其中关系距离矩阵中的元素Dij为根据关键词矩阵F1中的第i个元素keyi以及区域类别标签矩阵F2的第j个元素labelj查找到的数值。进一步地,对关系距离矩阵按照文本关键词的出现次数及图像区域类别标签的出现数目进行加权处理:按照文本关键词keyi的出现次数A及图像区域类别标签labelj的出现数目B进行以下加权处理后得到加权关系距离矩阵D*:1≤i≤M、1≤J≤K i、j为整数。调整后关系距离矩阵同时反映了关键词与图像区域标签的实体关系距离、以及关键词的词频和图像区域标签的出现频率。根据经过加权处理后的关系距离矩阵D*的元素,选择对应的所述目标区域进行重复合并处理,直到合并处理后的区域达到指定的缩略图大小时将其作为缩略图区域。如图2所述示,从关系距离矩阵D*的元素中,从小到大依次选择图像标签区域,当区域有重合时进行合并,直到合并区域达到指定的缩略图大小作为缩略图区域。如图2所示从小到大选择D*中的6个元素对应的目标区域合并后即达到指定的缩略图大小。
与上述方法对应,本发明还提供一种联合文本与图像内容的图像缩略系统,该系统包括:图像分析模块,用于对原始图像进行显著性检测,输出人可能感兴趣的图像区域作为图像显著性区域,同时结合多种图像分析算法对所述原始图像进行内容结构化分析,确定所述原始图像中的目标区域、所述目标区域对应的区域类别标签以及其他信息内容;文本关键词提取模块,基于预设的关键词提取算法对所述原始图像相关的文本提取关键词并统计相应关键词在所述文本中出现的次数,输出包括相应的关键词及其出现在文本中的次数;信息融合模块,基于通用知识图谱对图像分析模块输出的所述区域类别标签、文本关键词提取模块提取的所述关键词进行信息融合;缩略图产生模块,用于根据信息融合的结果以及图像分析模块输出的所述图像显著性区域,在原始图像中确定出缩略图区域,并根据所述缩略图区域产生缩略图。
进一步地,所述信息融合模块对所述区域类别标签、所述关键词进行信息融合,具体包括:基于通用知识图谱的距离模型,将所述关键词按照其文本中出现的次数从高到低进行排列构建成包含M个元素的文本关键词矩阵、M为关键词的个数,将所述图像区域类别标签构建成包含K个元素的图像区域类别标签矩阵;计算文本关键词矩阵与图像区域类别标签矩阵的关系距离矩阵D,其中D的大小为M*K;根据关系距离矩阵D的元素。缩略图产生模块具体实现为:分别计算图像中各所述目标区域与所述图像显著性区域的重合面积并去重,判断所述去重后的重合面积占显著性区域的面积的百分比是否大于或等于预设的阈值,若是、则选择显著性区域作为缩略图输出;否则、将关系距离矩阵D中每个元素Dij,按照对应文本关键词的出现次数A及图像区域类别标签的出现数目B进行以下加权处理后得到加权关系距离矩阵D*:1≤i≤M、1≤J≤K i、j为整数;按照从小到大依次选择矩阵D*的元素对应的所述目标区域进行重复合并处理,直到合并处理后的区域达到指定的缩略图大小时将其作为缩略图区域。
本发明采用了多种维度解析文本及图像内容,对多维度内容信息进行标签信息融合算法,相比于简单缩略图生成规则,给出的缩略图区域更为合理。通过本发明方法生成的图像缩略图,能够兼顾图像和文本的关联性,在图文并存的场景下,缩略图也能反映文本的关联内容。
Claims (7)
1.一种联合文本与图像内容的图像缩略方法,该方法包括:
a.对原始图像进行显著性检测,输出人可能感兴趣的图像区域作为图像显著性区域;结合多种图像分析算法对所述原始图像进行内容结构化分析,确定所述原始图像中的目标区域、所述目标区域对应的区域类别标签以及其他信息内容;采用关键词提取算法对所述原始图像相关的文本提取关键词并统计相应关键词在所述文本中出现的次数,输出包括相应的关键词及其出现在文本中的次数;
b.基于通用知识图谱对所述区域类别标签、所述关键词进行信息融合,根据信息融合的结果以及所述图像显著性区域,在所述原始图像中确定出缩略图区域;
c.根据所述缩略图区域以及原始图像产生缩略图。
2.如权利要求所述的方法,其中步骤a中所述的多种图像分析算法包括:用于检测物体的深度神经网络目标检测算法、人脸检测与识别算法、以及图像文字检测与识别算法;所述目标区域类别包括物体区域、人脸区域以及文字区域。
3.如权利要求1或2所述的方法,其中步骤b具体为:分别计算图像中各所述目标区域与所述图像显著性区域的重合面积并去重,判断所述去重后的重合面积占显著性区域的面积的百分比是否大于或等于预设的阈值,若是、则选择显著性区域作为缩略图输出;否则、将所述关键词按照其文本中出现的次数从高到低进行排列构建成包含M个元素的文本关键词矩阵、M为关键词的个数,将所述图像区域类别标签构建成包含K个元素的图像区域类别标签矩阵;基于通用知识图谱的距离模型构建的关系型查找数据库得到文本关键词矩阵与图像区域类别标签矩阵的关系距离矩阵D,其中D的大小为M*K;根据关系距离矩阵D的元素,选择对应的所述目标区域进行重复合并处理,当合并处理后的区域达到指定的缩略图大小时将其作为缩略图区域。
4.如权利要求3所述的方法,其中、根据关系距离矩阵D的元素,选择对应的目标区域进行重复合并处理具体为:将关系距离矩阵D中每个元素Dij,按照对应文本关键词的出现次数A及图像区域类别标签的出现数目B进行以下加权处理后得到加权关系距离矩阵D*:Dij *=Dij/(A+B),1≤i≤M、1≤J≤K i、j为整数;按照从小到大依次选择矩阵D*的元素对应的所述目标区域进行重复合并处理,直到合并处理后的区域达到指定的缩略图大小时将其作为缩略图区域。
5.一种联合文本与图像内容的图像缩略系统,该系统包括:
图像分析模块,用于对原始图像进行显著性检测,输出人可能感兴趣的图像区域作为图像显著性区域,同时结合多种图像分析算法对所述原始图像进行内容结构化分析,确定所述原始图像中的目标区域、所述目标区域对应的区域类别标签以及其他信息内容;
文本关键词提取模块,基于预设的关键词提取算法对所述原始图像相关的文本提取关键词并统计相应关键词在所述文本中出现的次数,输出包括相应的关键词及其出现在文本中的次数;
信息融合模块,基于通用知识图谱对图像分析模块输出的所述区域类别标签、文本关键词提取模块提取的所述关键词进行信息融合;
缩略图产生模块,用于根据信息融合的结果以及图像分析模块输出的所述图像显著性区域,在原始图像中确定出缩略图区域,并根据所述缩略图区域产生缩略图。
6.如权利要求5所述的系统,其中信息融合模块对所述区域类别标签、所述关键词进行信息融合,具体包括:基于通用知识图谱的距离模型,将所述关键词按照其文本中出现的次数从高到低进行排列构建成包含M个元素的文本关键词矩阵、M为关键词的个数,将所述图像区域类别标签构建成包含K个元素的图像区域类别标签矩阵;计算文本关键词矩阵与图像区域类别标签矩阵的关系距离矩阵D,其中D的大小为M*K;根据关系距离矩阵D的元素。
7.如权利要求6所述的系统,其中缩略图产生模块具体实现为:分别计算图像中各所述目标区域与所述图像显著性区域的重合面积并去重,判断所述去重后的重合面积占显著性区域的面积的百分比是否大于或等于预设的阈值,若是、则选择显著性区域作为缩略图输出;否则、将关系距离矩阵D中每个元素Dij,按照对应文本关键词的出现次数A及图像区域类别标签的出现数目B进行以下加权处理后得到加权关系距离矩阵D*:Dij *=Dij/(A+B),1≤i≤M、1≤J≤K i、j为整数;按照从小到大依次选择矩阵D*的元素对应的所述目标区域进行重复合并处理,直到合并处理后的区域达到指定的缩略图大小时将其作为缩略图区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810919504.1A CN109272440B (zh) | 2018-08-14 | 2018-08-14 | 一种联合文本和图像内容的缩略图生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810919504.1A CN109272440B (zh) | 2018-08-14 | 2018-08-14 | 一种联合文本和图像内容的缩略图生成方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109272440A true CN109272440A (zh) | 2019-01-25 |
CN109272440B CN109272440B (zh) | 2023-11-03 |
Family
ID=65153838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810919504.1A Active CN109272440B (zh) | 2018-08-14 | 2018-08-14 | 一种联合文本和图像内容的缩略图生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109272440B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210387A (zh) * | 2019-05-31 | 2019-09-06 | 华北电力大学(保定) | 基于知识图谱的绝缘子目标检测方法、系统、装置 |
CN112418199A (zh) * | 2021-01-25 | 2021-02-26 | 北京明略昭辉科技有限公司 | 多模态信息提取方法、装置、电子设备及存储介质 |
CN112634123A (zh) * | 2019-10-08 | 2021-04-09 | 北京京东尚科信息技术有限公司 | 一种图像处理方法和装置 |
CN113157194A (zh) * | 2021-03-15 | 2021-07-23 | 合肥讯飞读写科技有限公司 | 文本显示方法以及电子设备、存储装置 |
CN115471831A (zh) * | 2021-10-15 | 2022-12-13 | 中国矿业大学 | 一种基于文本增强学习的图像显著性检测方法 |
CN115983199A (zh) * | 2023-03-16 | 2023-04-18 | 山东天成书业有限公司 | 一种移动数字出版系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102984417A (zh) * | 2011-07-14 | 2013-03-20 | 柯尼卡美能达商用科技株式会社 | 图像处理装置及基于该装置的缩略图像生成方法 |
WO2016057161A1 (en) * | 2014-10-10 | 2016-04-14 | Qualcomm Incorporated | Text-based thumbnail generation |
-
2018
- 2018-08-14 CN CN201810919504.1A patent/CN109272440B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102984417A (zh) * | 2011-07-14 | 2013-03-20 | 柯尼卡美能达商用科技株式会社 | 图像处理装置及基于该装置的缩略图像生成方法 |
WO2016057161A1 (en) * | 2014-10-10 | 2016-04-14 | Qualcomm Incorporated | Text-based thumbnail generation |
CN107077832A (zh) * | 2014-10-10 | 2017-08-18 | 高通股份有限公司 | 基于文本的缩略图产生 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210387A (zh) * | 2019-05-31 | 2019-09-06 | 华北电力大学(保定) | 基于知识图谱的绝缘子目标检测方法、系统、装置 |
CN112634123A (zh) * | 2019-10-08 | 2021-04-09 | 北京京东尚科信息技术有限公司 | 一种图像处理方法和装置 |
CN112418199A (zh) * | 2021-01-25 | 2021-02-26 | 北京明略昭辉科技有限公司 | 多模态信息提取方法、装置、电子设备及存储介质 |
CN113157194A (zh) * | 2021-03-15 | 2021-07-23 | 合肥讯飞读写科技有限公司 | 文本显示方法以及电子设备、存储装置 |
CN113157194B (zh) * | 2021-03-15 | 2023-08-08 | 合肥讯飞读写科技有限公司 | 文本显示方法以及电子设备、存储装置 |
CN115471831A (zh) * | 2021-10-15 | 2022-12-13 | 中国矿业大学 | 一种基于文本增强学习的图像显著性检测方法 |
CN115471831B (zh) * | 2021-10-15 | 2024-01-23 | 中国矿业大学 | 一种基于文本增强学习的图像显著性检测方法 |
CN115983199A (zh) * | 2023-03-16 | 2023-04-18 | 山东天成书业有限公司 | 一种移动数字出版系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109272440B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109272440A (zh) | 一种联合文本和图像内容的缩略图生成方法及系统 | |
CN111858954B (zh) | 面向任务的文本生成图像网络模型 | |
Jiang et al. | Cross-modal video moment retrieval with spatial and language-temporal attention | |
CN102629261B (zh) | 由钓鱼网页查找目标网页的方法 | |
Cao et al. | A low-cost pedestrian-detection system with a single optical camera | |
Qiu et al. | Hierarchical context features embedding for object detection | |
CN111191695A (zh) | 一种基于深度学习的网站图片篡改检测方法 | |
CN112541476B (zh) | 一种基于语义特征提取的恶意网页识别方法 | |
JP5012078B2 (ja) | カテゴリ作成方法、カテゴリ作成装置、およびプログラム | |
Maigrot et al. | Mediaeval 2016: A multimodal system for the verifying multimedia use task | |
CN113537206B (zh) | 推送数据检测方法、装置、计算机设备和存储介质 | |
Paul et al. | Extraction of facial feature points using cumulative histogram | |
Zhang et al. | Retargeting semantically-rich photos | |
CN113761235A (zh) | 一种多媒体内容的识别方法、相关装置、设备及存储介质 | |
CN104915399A (zh) | 基于新闻标题的推荐数据处理方法及系统 | |
CN106529492A (zh) | 面向网络查询基于多图融合视频主题分类与描述方法 | |
Cheng et al. | A global and local context integration DCNN for adult image classification | |
CN106326451B (zh) | 一种基于视觉特征提取的网页传感信息块判决方法 | |
Li et al. | Multi-label pattern image retrieval via attention mechanism driven graph convolutional network | |
CN116975340A (zh) | 信息检索方法、装置、设备、程序产品及存储介质 | |
CN114915468A (zh) | 基于知识图谱的网络犯罪智能分析检测方法 | |
Han et al. | 3d shape temporal aggregation for video-based clothing-change person re-identification | |
CN108595466B (zh) | 一种互联网信息过滤以及互联网用户信息和网帖结构分析方法 | |
CN114359132A (zh) | 利用文本描述生成图像进行行人搜索的方法 | |
CN109508660A (zh) | 一种基于视频的au检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |