CN104903892A - 基于对象的影像检索系统及检索方法 - Google Patents
基于对象的影像检索系统及检索方法 Download PDFInfo
- Publication number
- CN104903892A CN104903892A CN201380067598.XA CN201380067598A CN104903892A CN 104903892 A CN104903892 A CN 104903892A CN 201380067598 A CN201380067598 A CN 201380067598A CN 104903892 A CN104903892 A CN 104903892A
- Authority
- CN
- China
- Prior art keywords
- image
- retrieval
- information
- classification
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 33
- 238000000605 extraction Methods 0.000 claims description 111
- 239000000284 extract Substances 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 238000012790 confirmation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000013011 mating Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/434—Query formulation using image data, e.g. images, photos, pictures taken by a user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/289—Object oriented databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Abstract
本发明涉及一种基于对象的影像检索系统及检索方法,其能够有效地检索通过用户输入的信息与基于对象的信息的构成类似的注册图像或视频或与其有关的信息。根据本发明的基于对象的影像检索系统,将注册的图像或视频根据特征点及特征点的属性,基于对象进行分类或聚类,检索用户通过PC、平板电脑、移动电话及联网电视等用户终端设备上传图像、视频,或以声音、文本检索时简单地匹配的注册图像或注册视频,并向用户终端设备提供相应结果或关联信息。
Description
技术领域
本发明涉及一种基于对象的影像检索系统及检索方法,其能够有效地检索通过用户输入的信息与基于对象的信息的构成类似的注册图像或视频或与其有关的信息。
背景技术
一般而言,网络给众多电脑用户提供有效而适宜的通信及信息检索工具。尤其,最近陆续开发了一种用户上传图像或视频时,比较提供与其对应的图像或视频的检索方法,从而,在网络上检索文本或影像信息方面获得了很大的进步。
但,上述的检索方法无法反应对于用户提出的图像或视频内多个对象的信息,并且,因在检索类似影像的过程中伴随的应用信息的不足或错误认知等而无法提供正确反应用户的最初意图的结果。
并且,为了在大容量的图像或视频DB内最小化信息损失并快速检索,而适用了很多信息的摘要方法,但,通常与DB的量正比地检索速度也变得缓慢,并且,为了在特定单位的存储器使用量内处理更多的图像信息,伴随与其正比的信息的损失。
为了克服上述情况,将由图像或视频构成的DB以色彩、模样、质感、图案等一维性要素分类时,使得使用繁琐或严重损害检索的正确度。
发明内容
发明要解决的问题
本发明要解决的问题在于提供一种基于对象的影像检索系统及检索方法,其将为了能够应对用户的各种搜索工具所包含的复合型信息而注册的各个图像或视频的对象信息反应于检索。
本发明的另一解决课题在于提供一种基于对象的影像检索系统及检索方法,其基于对象将注册的图像或视频聚类,从而,使得信息的损失最小化的状态下,在特定单位的存储器使用量内,迅速地处理更多的图像和视频信息。
本发明的又另一课题在于提供一种基于对象的影像检索系统及检索方法,作为单一的检索系统,不仅能够识别相同的对象,而且,应用对象的构成信息,检索与肉眼相似的基准的类似图像或视频或或与其有关的信息。
解决问题的方案
根据本发明的第1实施例的基于对象的影像检索系统,包括:第1注册影像管理模块202,存储并管理作为检索对象而注册的各种图像或视频;第1注册影像信息提取模块203,从注册的图像或视频提取特征点或特征点的视觉属性作为影像信息;类别生成模块209,根据通过第1注册影像信息提取模块203提取的影像信息的类似性,生成或分类为一个以上的类别;第1类别信息管理模块210,存储并管理有关通过类别生成模块209生成的类别的信息;第1检索内容信息提取模块211,从通过用户终端设备接收的图像或视频或声音或文本提取检索内容信息,以便进行检索;第1注册影像检索模块216,将通过第1检索内容信息提取模块211提取的检索内容信息与类别信息进行比较,检索相同或类似地匹配的类别或注册影像;第1检索结果显示模块219,将在第1注册影像检索模块216检索的类别的信息或注册影像的信息提供给用户终端设备,以作为检索结果,其中,第1检索内容信息提取模块211包括第1检索图像处理部212或第1检索视频处理部213,所述第1检索图像处理部212,提取从用户接收的检索图像中包含的影像信息;第1检索视频处理部213,分析检索视频,以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的一个以上的帧选定为代表帧,并且,从选定的代表帧提取影像信息。
优选地,从第1注册影像信息提取模块203以影像信息提取的特征点为根据图像或视频中包括的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)而生成的信息,特征点的视觉属性为特征点周边的影像所具有的亮度信息或色彩信息或图案信息。
优选地,第1注册影像信息提取模块203,包括:第1注册图像影像信息提取部204,提取注册的图像中包含的特征点或特征点的视觉属性作为影像信息,并存储提取的影像信息;第1注册视频影像信息提取部205,由第1镜头分隔部206、第1代表帧选定部207、第1代表帧影像信息提取部208构成,所述第1镜头分隔部206分析注册的视频,以视觉要素变换的地点为基准,将前后的视频的区间分隔为镜头,所述第1代表帧选定部207将在各个镜头中代表的一个以上的帧选定为代表帧,所述第1代表帧影像信息提取部208从选定的代表帧提取特征点或特征点的视觉属性作为影像信息。
第1镜头分隔部206将视频内容的各个帧制作成HSV(色彩/色度/亮度)的频数图表,比较以往帧和目前帧的图表,如果超过既定的图表之间距离值,则判断为帧发生变化,确认为镜头。
优选地,类别生成模块209,如果作为影像信息的特征点或特征点的视觉属性与注册图像或注册视频内的影像信息相互类似,将其群集化,并生成或分类为一个以上的类别,并且,如果此时生成的类别具有与以往生成的类别类似的影像信息,分类为相同或类似的类别。
优选地,第1类别信息管理模块210的类别信息包括各个类别的影像信息、类目信息、说明类别的文本信息、专业化信息中的一个以上。
优选地,第1检索内容信息提取模块211,包括:第1检索声音处理部214,分析从用户终端设备提供的声音,将声音转换为文本;第1检索文本处理部215,分析从用户终端设备提供的检索文本或从第1检索声音处理部214转换的文本。
优选地,第1注册影像检索模块216,包括:第1影像检索部217,将从通过用户接收的检索图像或检索视频提取的影像信息与类别内的各个类别的影像信息进行比较,检索相同或类似地匹配的类别,检索包括检索的类别的一部分或全部注册图像或注册视频;第1文本检索部218,将通过用户接收的文本或从声音提取或转换的文本信息与类别内的文本信息进行比较,检索相同或类似地匹配的类别,并检索包括检索的类别的一部分或全部的注册图像或注册视频。
并且,根据本发明的第2实施例的基于对象的影像检索系统,包括:对象图像管理模块301,存储注册的包括一个以上的对象的对象图像,并从注册的对象图像提取影像信息一同存储;第2类别信息管理模块302,将通过对象图像管理模块301提取的对象图像的影像信息根据类似性生成或分类为一个以上的类别;第2注册影像管理模块303,存储作为检索对象的注册的各种图像或视频并进行管理;第2注册影像信息提取模块304,从注册的图像或视频提取特征点或特征点的视觉属性作为影像信息;注册影像分类模块310,将通过第2注册影像信息提取模块304提取的影像信息与类别的影像信息进行比较,将有关具有相同或类似的影像信息的类别的信息与注册的图像或视频一同存储;第2检索内容信息提取模块311,从通过用户终端设备接收的图像或视频或声音或文本提取用于检索的信息;第2注册影像检索模块316,将通过第2检索内容信息提取模块216提取的检索内容信息与类别的影像信息进行比较,检索相同或类似地匹配的类别,并检索包括检索的类别的全部或一部分的注册图像或注册视频;第2检索结果显示模块319,将从第2注册影像检索模块316检索的类别的信息或注册影像的信息提供给用户终端设备作为检索结果,
第2检索内容信息提取模块311包括第2检索图像处理部312、第2检索视频处理部313、第2检索声音处理部314、第2检索文本处理部315中的一个以上,所述第2检索图像处理部312提取从用户接收的检索图像中包含的影像信息,所述第2检索视频处理部313分析检索视频,以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的一个以上的帧选定为代表帧,从选定的代表帧提取影像信息,所述第2检索声音处理部314分析从用户终端设备提供的声音,将声音转换为文本,所述第2检索文本处理部315分析从用户终端设备提供的检索文本或从第2检索声音处理部314转换的文本。
发明效果
根据本发明的基于对象的影像检索系统,利用从图像或视频提取的多个基于对象的信息,从而,能够有效地应对通过各种搜索工具输入的复杂信息。
并且,具有如下优点:基于对象将注册的图像或视频聚类,从而,使得信息的损失最小化的状态下,在特定单位的存储器使用量内,迅速地处理更多的图像和视频信息。
并且,具有如下优点:不仅能够识别相同的对象,而且,应用对象的构成信息,在单一系统中检索与肉眼相似的基准的类似图像或视频或或与其有关的信息,而能够提供符合用户意图的立体的检索方法。
附图说明
图1为根据本发明的第1实施例的基于对象的影像检索系统的框图;
图2为根据本发明的第1实施例的利用基于对象的影像检索系统的影像内容检索过程的流程图;
图3为根据本发明的第1实施例生成类别的示例图;
图4为利用根据本发明的第1实施例的基于对象的影像检索系统的声音或文本的检索过程的流程图;
图5为根据本发明的第2实施例的基于对象的影像检索系统的框图;
图6为根据本发明的第2实施例的利用基于对象的影像检索系统的影像内容检索过程的流程图。
具体实施方式
以下,参照附图详细说明本发明的基于对象的影像检索系统。
根据本发明的第1实施例的影像内容检索系统的基本概念是将注册的图像或视频根据特征点及特征点的属性,基于对象进行分类或聚类,检索用户通过PC、平板电脑、移动电话及联网电视等用户终端设备上传图像、视频,或以声音、文本检索时简单地匹配的注册图像或注册视频,并向用户终端设备提供相应结果或关联信息。
参照图1,详细说明影像内容检索系统,影像内容检索系统包括:第1注册影像管理模块202、第1注册影像信息提取模块203、类别生成模块209、第1类别信息管理模块210、第1检索内容信息提取模块211、第1注册影像检索模块216、第1检索结果显示模块219。
第1注册影像管理模块202将成为检索对象的注册的各种图像或视频存储于第1注册影像DB221并进行管理。此时,第1注册影像管理模块202将成为检索对象的图像或视频存储为注册图像或注册视频,或实时地使用网络检索。并且,在第1注册影像管理模块202注册图像和视频时,可将包括注册的图像或视频的名字、版权所有者的关联信息一同存储。
第1注册影像信息提取模块203从注册的图像或视频提取特征点或特征点的视觉属性作为影像信息。以影像信息提取的特征点为通过图像或视频中包含的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)而生成的信息,特征点的视觉属性是指特征点周边的影像具有的亮度信息或色彩信息或图案信息等。
此类第1注册影像信息提取模块203由从注册的图像提取影像信息的第1注册图像影像信息提取部204和从注册的视频提取影像信息的第1注册视频影像信息提取部205构成。
第1注册图像影像信息提取部204提取注册的图像中包含的一个以上的特征点或特征点的视觉属性作为影像信息,并将提取的影像信息与注册图像一同存储。通过上述的第1注册图像影像信息提取部204能够将注册的各个的图像所包含的影像信息全部提取。
第1注册视频影像信息提取部205,包括:第1镜头分隔部206,分析注册的视频,以视觉要素变换的地点为基准,将前后的视频区间分隔为镜头;第1代表帧选定部207,将各个镜头中代表的一个以上的帧选定为代表帧;第1代表帧影像信息提取部208,从选定的代表帧提取一个以上的特征点或特征点的视觉属性作为影像信息,并与注册视频一同存储。此时,优选地,第1镜头分隔部206将视频内容的各个帧制作成HSV(色彩/色度/亮度)的频数图表,比较以往帧和目前帧的图表,如果超过规定的图表之间的距离值,判断为帧发生变化,确认镜头,并且,确认的各个镜头赋予固有ID。此时,优选地,开始变化的帧以S(Start)表示,结束变化的帧以E(End)表示进行区分。并且,在第1代表帧选定部207选定的表帧构成镜头的帧几乎都相似,因此,选定前端、中间或后端的任何帧均可。通过上述的第1注册影像信息提取模块203不仅能够提取注册的图像的影像信息,而且也能够提取注册的视频中包含的影像信息。
类别生成模块209将通过第1注册影像信息提取模块203提取的注册图像或注册视频的特征点或有关特征点的视觉属性的影像信息相互比较,如果相同或类似时,将其群集化,并生成一个以上的类别,或与以往生成的类别相同时,与以往的类别一同分类。例如,类别可以分类为自然>>山、海、天空、大地>>天空>>蓝天、夜晚天空等。
第1类别信息管理模块210将通能过类别生成模块209生成的类别的类别信息存储在类别信息DB222并进行管理。此时,类别信息DB222中存储的类别信息包括各个类别的影像信息、类目信息、有关类别的说明的文本信息、专业化信息中的一个以上而构成。影像信息包括通过第1类别生成模块209生成的各个类别的特征点或特征点的视觉属性,类目信息是指根据各个类别之间的上下位概念、从属性、关联性等而区分的类别信息。例如,如图2所示,根据上下位概念的类目信息,从图像的影像信息中以蓝天(sky)、有人行横道的道路(street)、室内高层建筑物(building)、LG、Pepsi、人们(people)、车辆(car)等类别进行分类。并且,对于蓝天的类别以自然>天空>蓝天的类目根据上下位概念进行区分。并且,根据从属性的类目信息,包括按各个类别包括相应类别及包含与其和类似的类别的DB内的其他注册图像或注册视频的信息,根据关联性的类目信息包括按各个类别与相应类别类似的DB内的其他类别的信息。文本信息包括说明各个类别或表示的关键字或文本,此类信息由将注册的图像或视频的名字、版权所有人信息等一同存储的第1注册影像管理模块202或管理人提供。
第1检索内容信息提取模块211为了进行检索从通过用户终端设备接收的图像或视频或声音或文本提取有关检索内容的关联信息。用户终端设备包括PC、平板电脑、移动手机及联网电视等终端设备,检索影像接收从用户终端设备提供的播放或拍摄中的影像或存储的图像文件或影像。
第1检索内容信息提取模块211包括:第1检索图像处理部212、第1检索视频处理部213、第1检索声音处理部214、第1检索文本处理部215。
第1检索图像处理部212从通过用户接收的检索图像提取影像信息。从上述的第1检索图像处理部212提取的影像信息与从第1注册图像影像信息提取部204提取影像信息的方法相同地,包括有关在检索图像中包含的对象的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)的特征点信息和特征点周边的影像所具有的亮度信息或色彩信息或图案信息等视觉信息。通过上述的第1检索图像处理部212能够提取从用户所接收的检索图像中包含的影像信息。
第1检索视频处理部213对检索视频进行分析,以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的帧选定为代表帧,并从选定的代表帧提取影像信息。从上述的第1检索视频处理部213中提取的影像信息通过与上述的第1注册视频影像信息提取部205的第1镜头分隔部206、第1代表帧选定部207、第1代表帧影像信息提取部208相同的过程,从检索视频提取对于代表帧的影像信息。由此,通过第1检索视频处理部213能够提取从用户接收的检索视频中包含的影像信息。
第1检索声音处理部214接收从用户终端设备提供的声音进行分析并将声音转换为文本。上述的第1检索声音处理部214利用声音识别机将声音转换为文本。例如,为"请找一下有人和车辆、大厦的城市影像,但排除在夜间拍摄的影像"的内容时,将其变换为文本。
第1检索文本处理部215分析从用户终端设备提供的检索文本或从第1检索声音处理部214变换的文本。
第1注册影像检索模块216将通过第1检索内容信息提取模块211提取的检索内容的信息与已分类的类别信息进行比较,并检索相同或类似地匹配的一个以上的类别,检索包括全部相应类别或包括一部分的注册图像或注册视频。第1注册影像检索模块216由检索影像信息的第1影像检索部217和比较文本的第1文本检索部218构成。
第1影像检索部217将从通过用户接收的检索图像或从检索视频提取的影像信息与类别内的各个类别影像信息进行比较,检索相同或类似地匹配的类别,或检索包括一部分检索的类别或全部包括的注册图像或注册视频。此时,从检索图像或检索视频的影像信息1次检索与各个影像信息对应的一个以上的类别,并2次检索包括检索的一个以上的类别的全部或一部分的注册图像或注册视频。
第1文本检索部218将通过用户接收的文本或从声音中提取或转换的文本信息与类别信息内的文本进行比较,检索相同或类似地匹配的类别,检索包括检索的类别的一部分或全部的注册图像或注册视频。此时,第1文本检索部2181次检索相同或类似的类别,并2次检索包括相应类别的全部或一部分的注册图像或注册视频。例如,第1文本检索部218分析的文本信息为”请找一下有人和车辆、大厦的城市影像,但排除在夜间拍摄的影像”时,将有关人和车辆、大厦的文本信息与已类别信息存储的文本进行比较,检索匹配的类别,并反映从类别的影像信息提取的色彩的文本信息,排除红色系列的类别。如上述地检索包括与通过选择和控制检索的类别相同类似的类别的全部或一部分的注册图像或注册视频。
第1检索结果显示模块219将从第1注册影像检索模块216检索的类别的信息或注册影像的信息作为检索结果提供至用户终端设备。
以下,参照图3的流程图,详细说明根据本发明的第1实施例的基于对象的影像检索系统的检索过程。
首先,通过第1注册影像信息提取模块203提取作为检索对象的注册图像的特征点或特征点的视觉属性作为影像信息(步骤S101),并从注册视频提取各个代表帧的特征点或特征点的视觉属性作为影像信息(步骤S102)。此时,以影像信息提取的特征点为通过图像或视频中包含的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)而生成的信息,特征点的视觉属性是指特征点周边的影像所具有的亮度信息或色彩信息或图案信息等。并且,注册视频以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将在各个镜头代表的帧选定为代表帧,并且,从选定的代表帧提取特征点或特征点的视觉属性作为影像信息。通过上述过程从注册图像或代表帧提取有关特征点或特征点的视觉属性的影像信息。
并且,类别生成模块209根据提取的影像信息的相同性或类似群集化,生成一个以上的类别或分类,并以使得注册的图像或视频和注册的图像或视频内的各个类别信息相互容易传唤的形态一同联动或存储(步骤S103)。此时,具有与以往生成的类别相似的影像信息的新生成的类别分类为相同于往生成的类别或类似的类别。
并且,第1类别信息管理模块210将通过类别生成模块209生成的类别的类别信息存储在类别信息DB222(步骤S104)。类别信息包括各个类别影像信息、类目信息、文本信息、专业化信息中的一个以上,并且,通过将注册的图像或视频的名称、版权所有人信息等一同存储的第1注册影像管理模块202或由第1注册影像管理模块202提供的数据,通过网络接收2次检索的结果或管理者接收上述信息。从而,即使注册图像或注册视频中包括多个类别,通过一同存储类别信息,而能够简单地确认包含何种类别。
并且,从用户终端设备接收要检索的图像、检索视频等检索内容时(步骤S105),第1检索内容信息提取模块211提取从用户接收的检索内容的影像信息。
即,从用户终端设备接收的检索图像或检索视频,在检索影像信息提取模块的第1检索图像处理部212从检索图像提取特征点或特征点的视觉属性作为影像信息(步骤S106),并在第1检索视频处理部213从检索视频提取代表帧中包含的特征点或特征点的视觉属性作为影像信息(步骤S107)。通过上述的过程,能够从检索图像及检索视频的特征点及特征点的视觉属性提取影像信息。
并且,第1注册影像检索模块216将从检索图像或检索视频提取的特征点或特征点的视觉属性等影像信息与类别的影像信息进行比较,检索相同或类似的类别(步骤S108),并且,检索包括检索的类别的全部或一部分的注册图像或注册视频(步骤S109)。
并且,检索的类别信息或注册影像的信息被表格化,通过第1检索结果显示模块219向用户终端设备提供检索结果(步骤S110)。
并且,如图4所示,通过检索内容接收模块从用户终端设备接收要检索的声音及文本等检索内容时(步骤S202),第1检索内容信息提取模块211的第1检索声音处理部214将接收的声音通过声音识别机等转换为文本(步骤S203)。
并且,第1注册影像检索模块216的第1文本检索部218将从声音转换的文本或从用户终端设备直接以文本提供接收的检索文本与类别信息的文本进行比较,检索具有相同或类似地匹配的文本的类别(步骤S204),并检索包括检索的类别全部或一部分的注册图像或注册视频(步骤S205)。从而,从说明图像或视频的声音或文本检索有关的注册图像或注册视频。
并且,关于检索的类别信息或注册影像的信息被表格化,通过第1检索结果显示模块219向用户终端设备提供检索结果(步骤S206)。
根据本发明的第2实施例的影像内容检索系统的基本概念是,向影像内容检索系统输入包括一个以上的对象的对象图像,并由此提取影像信息,根据影像信息的类似性或相同性,生成或分类为一个以上的类别后,将生成的类别的影像信息与成为检索对象的注册图像或注册视频的影像信息进行匹配的状态下,当用户以图像、视频、声音或文本的检索内容邀请影像检索时,从检索内容提取检索内容信息,并检索与其匹配的类别信息后,检索与检索的结果类似或共享相同的一个以上的类别的注册图像或注册视频。
参照图6,说明根据本发明的第2实施例的影像内容检索系统,影像内容检索系统包括:对象图像管理模块301、第2类别信息管理模块302、第2注册影像管理模块303、第2注册影像信息提取模块304、第2检索内容信息提取模块311、第2注册影像检索模块316、第2检索结果显示模块319。
对象图像管理模块301接收注册的包括天空、人、大厦、街道等各种对象中的一个以上的对象图像,并存储在对象图像DB320,从注册的对象图像提取影像信息后,根据影像信息的相同性或类似性群集化,并生成或分类为一个以上的类别,一同存储在对象图像DB320。此时,对象图像的影像信息可根据图像中包括的有关对象的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)的特征点信息和特征点的视觉属性(特征点周边的影像所具有的亮度信息或色彩信息或图案信息等)提取。并根据提取的对象图像的影像信息的类似性群集化,生成或分类为一个以上的类别,并且,具有与以往生成的类别相似的影像信息的新生成的类别,可分类为相同或类似的类别。
第2类别信息管理模块302将通过对象图像管理模块301生成的类别的信息存储在对象图像DB320。此时,类别可分别赋予固有ID,类别信息包括各个类别的影像信息、类目信息、文本信息、专业化信息中的一个以上。
第2注册影像管理模块303与实施例1的第1注册影像管理模块202相同地,将作为检索对象的注册的各种图像或视频存储在第2注册影像DB321并进行管理。在第2注册影像管理模块303注册图像和视频时,可将包括注册的图像或视频的名称、版权所有人等的关联信息一同存储。
第2注册影像信息提取模块304与实施例1的第1注册影像信息提取模块203相同地,提取注册的图像或视频的特征点或特征点的视觉属性作为影像信息。第2注册影像信息提取模块304由从注册的图像提取影像信息的第2注册图像影像信息提取部305和从注册的视频提取影像信息的第2注册视频影像信息提取部306构成,并且,注册视频影像信息提取部306由第2镜头分隔部307、第2代表帧选定部308、第2代表帧影像信息提取部309构成。第2注册图像影像信息提取部305和第2注册视频影像信息提取部306与实施例1的第1注册图像影像信息提取部204和第1注册视频影像信息提取部205相同,因此,省略对其的说明。
注册影像分类模块310从通过第2注册影像信息提取模块304注册的图像或注册的视频提取各个影像信息时,将影像信息与存储在对象图像DB320的各个类别的影像信息进行比较,并存储具有相同或类似的影像信息的类别的信息。此时,注册影像分类模块310将与各个注册影像匹配的类别的ID信息一同存储并记录。
第2检索内容信息提取模块311与实施例1的第1检索内容信息提取模块211相同地,从通过用户终端设备接收的图像或视频或声音或文本提取检索内容的信息,以便进行搜索。第2检索内容信息提取模块311与第1检索内容信息提取模块211相同地,由第2检索图像处理部312、第2检索视频处理部313、第2检索声音处理部314、第2检索文本处理部315构成。
第2注册影像检索模块316将通过第2检索内容信息提取模块311提取的检索内容的影像信息与存储在对象图像DB320的类别的影像信息进行比较,检索相同或类似地匹配的一个以上的类别,并检索包括相应类别的全部或一部分的注册图像或注册视频。第2注册影像检索模块316由检索影像信息的第2影像检索部317和比较文本的第2文本检索部318构成。
第2影像检索部317将从通过用户接收的检索图像或检索视频提取的影像信息与类别的影像信息进行比较,检索相同或类似地匹配的类别,检索包括检索的类别的一部分或全部的注册图像或注册视频。此时,对与检索图像或检索视频的影像信息对应的一个以上的类别进行一次检索,并对包括相应类别全部或一部分的注册图像或注册视频进行2次检索。
第2文本检索部318将从通过用户接收的文本或声音提取或转换的文本信息与类别信息内的文本进行比较,检索相同或类似地匹配的类别,并检索包括检索的类别的一部分或全部的注册图像或注册视频。此时,第2文本检索部318对相同或类似的类别进行1次检索,并对注册图像或注册视频进行2次检索。
第2检索结果显示模块319向用户终端设备提供由第2注册影像检索模块316检索的类别的信息或注册影像的信息作为检索结果。
以下,参照图5的流程图,详细说明根据本发明的影像内容检索过程。
首先,对象图像管理模块301接收注册的包括天空、大厦、人、街道等各种对象中的一个以上的图像,并存储在对象图像DB320,提取注册的对象图像的影像信息之后,根据影像信息的相同性或类似性群集化,而生成或分类为一个以上的类别(步骤S301)。此时,对象图像根据图像中包含的有关对象的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)的特征点信息和特征点的视觉属性的类似性进行群集化,而生成或分类为类别。
并且,第2类别信息管理模块302将类别的影像信息和有关类别的信息一同存储于对象图像DB320(步骤S302)。此时,类别可分别赋予固有ID,有关类别的信息由说明类别的文本信息、类目信息、专业化信息中的一个以上构成。
并且,成为检索对象的注册图像或注册视频通过第2注册影像管理模块303接收注册并存储(步骤S303),注册的注册图像或注册视频通过第2注册影像信息提取模块304从注册图像提取影像信息(步骤S304),从注册视频提取各个代表帧的影像信息(步骤S305)。
并且,将通过第2注册影像管理模块303提取的注册图像或视频的影像信息与类别内的影像信息进行比较,确认相同或类似地匹配的类别(步骤S306),并将有关匹配的类别的信息一同存储在注册影像中(步骤S307)。因此,即使在注册图像或注册视频中包含多个对象,如果将匹配的类别的ID一同存储,即能够简便地确认包含何种对象。
并且,接收从用户终端设备提供的要检索的图像、检索视频的检索内容时(步骤S308),第2检索内容信息提取模块311提取由用户提供的检索内容的影像信息,以便检索。
即,从用户终端设备提供的检索图像提取特征点或特征点的视觉属性作为影像信息(步骤S309),从检索视频提取代表帧中包含的特征点或特征点的视觉属性作为影像信息(步骤S310)。通过上述过程,能够从检索图像及检索视频提取影像信息。
并且,第2注册影像检索模块316将从通过用户终端设备输入的检索图像或检索视频提取的影像信息与类别的影像信息进行比较,检索匹配的类别(步骤S311),并检索包括检索的类别的全部或一部分的注册图像或注册视频(步骤S312)。
有关检索的类别信息或注册影像的信息被表格化,通过第2检索结果显示模块319提供给用户终端设备作为检索结果(步骤S313)。
并且,检索内容为声音或文本时利用实施例2的基于对象的影像检索系统进行检索的过程与实施例1相同,因此,省略对其详细说明。
如上所述,本发明虽然通过限定的实施例和附图进行了说明,但,本发明并非限定于此,本发明的技术领域的普通技术人员在不脱离本发明的技术思想和权利要求的均等范围的前提下,可进行各种修改及变形。
Claims (20)
1.一种基于对象的影像检索系统,其特征在于,
包括:
第1注册影像管理模块(202),存储并管理作为检索对象而注册的各种图像或视频;
第1注册影像信息提取模块(203),从注册的图像或视频提取特征点或特征点的视觉属性作为影像信息;
类别生成模块(209),根据通过第1注册影像信息提取模块(203)提取的影像信息的类似性,生成或分类为一个以上的类别;
第1类别信息管理模块(210),存储并管理有关通过类别生成模块(209)生成的类别的信息;
第1检索内容信息提取模块(211),从通过用户终端设备接收的图像或视频或声音或文本提取检索内容信息,以便进行检索;
第1注册影像检索模块(216),将通过第1检索内容信息提取模块(211)提取的检索内容信息与类别信息进行比较,检索相同或类似地匹配的类别或注册影像;
第1检索结果显示模块(219),将在第1注册影像检索模块(216)检索的类别的信息或注册影像的信息提供给用户终端设备,以作为检索结果,
其中,第1检索内容信息提取模块(211)包括第1检索图像处理部(212)或第1检索视频处理部(213),
所述第1检索图像处理部(212),提取从用户接收的检索图像中包含的影像信息;
第1检索视频处理部(213),分析检索视频,以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的一个以上的帧选定为代表帧,并且,从选定的代表帧提取影像信息。
2.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
第1注册影像管理模块(202)将成为检索对象的图像或视频存储为注册图像或注册视频,或实时使用网络检索。
3.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
从第1注册影像信息提取模块(203)以影像信息提取的特征点为根据图像或视频中包括的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)而生成的信息,特征点的视觉属性为特征点周边的影像所具有的亮度信息或色彩信息或图案信息。
4.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
第1注册影像信息提取模块(203),包括:
第1注册图像影像信息提取部(204),提取注册的图像中包含的特征点或特征点的视觉属性作为影像信息,并存储提取的影像信息;
第1注册视频影像信息提取部(205),由第1镜头分隔部(206)、第1代表帧选定部(207)、第1代表帧影像信息提取部(208)构成,所述第1镜头分隔部(206)分析注册的视频,以视觉要素变换的地点为基准,将前后的视频的区间分隔为镜头,所述第1代表帧选定部(207)将在各个镜头中代表的一个以上的帧选定为代表帧,所述第1代表帧影像信息提取部(208)从选定的代表帧提取特征点或特征点的视觉属性作为影像信息。
5.根据权利要求4所述的基于对象的影像检索系统,其特征在于,
第1镜头分隔部(206)将视频内容的各个帧制作成HSV(色彩/色度/亮度)的频数图表,比较以往帧和目前帧的图表,如果超过既定的图表之间距离值,则判断为帧发生变化,确认为镜头,并且,确认的各个镜头赋予固有ID。
6.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
类别生成模块(209),如果作为影像信息的特征点或特征点的视觉属性与注册图像或注册视频内的影像信息相互类似,将其群集化,并生成或分类为一个以上的类别,并且,如果此时生成的类别具有与以往生成的类别类似的影像信息,分类为相同或类似的类别。
7.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
第1类别信息管理模块(210)的类别信息包括各个类别的影像信息、类目信息、说明类别的文本信息、专业化信息中的一个以上。
8.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
第1检索内容信息提取模块(211),包括:
第1检索声音处理部(214),分析从用户终端设备提供的声音,将声音转换为文本;
第1检索文本处理部(215),分析从用户终端设备提供的检索文本或从第1检索声音处理部(214)转换的文本。
9.根据权利要求1所述的基于对象的影像检索系统,其特征在于,
第1注册影像检索模块(216),包括:
第1影像检索部(217),将从通过用户接收的检索图像或检索视频提取的影像信息与类别内的各个类别的影像信息进行比较,检索相同或类似地匹配的类别,检索包括检索的类别的一部分或全部注册图像或注册视频;
第1文本检索部(218),将通过用户接收的文本或从声音提取或转换的文本信息与类别内的文本信息进行比较,检索相同或类似地匹配的类别,并检索包括检索的类别的一部分或全部的注册图像或注册视频。
10.一种基于对象的影像检索系统,其特征在于,
包括:
对象图像管理模块(301),存储注册的包括一个以上的对象的对象图像,并从注册的对象图像提取影像信息一同存储;
第2类别信息管理模块(302),将通过对象图像管理模块(301)提取的对象图像的影像信息根据类似性生成或分类为一个以上的类别;
第2注册影像管理模块(303),存储作为检索对象的注册的各种图像或视频并进行管理;
第2注册影像信息提取模块(304),从注册的图像或视频提取特征点或特征点的视觉属性作为影像信息;
注册影像分类模块(310),将通过第2注册影像信息提取模块(304)提取的影像信息与类别的影像信息进行比较,将有关具有相同或类似的影像信息的类别的信息与注册的图像或视频一同存储;
第2检索内容信息提取模块(311),从通过用户终端设备接收的图像或视频或声音或文本提取用于检索的信息;
第2注册影像检索模块(316),将通过第2检索内容信息提取模块(216)提取的检索内容信息与类别的影像信息进行比较,检索相同或类似地匹配的类别,并检索包括检索的类别的全部或一部分的注册图像或注册视频;
第2检索结果显示模块(319),将从第2注册影像检索模块(316)检索的类别的信息或注册影像的信息提供给用户终端设备作为检索结果,
第2检索内容信息提取模块(311)包括第2检索图像处理部(312)、第2检索视频处理部(313)、第2检索声音处理部(314)、第2检索文本处理部(315)中的一个以上,所述第2检索图像处理部(312)提取从用户接收的检索图像中包含的影像信息,所述第2检索视频处理部(313)分析检索视频,以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的一个以上的帧选定为代表帧,从选定的代表帧提取影像信息,所述第2检索声音处理部(314)分析从用户终端设备提供的声音,将声音转换为文本,所述第2检索文本处理部(315)分析从用户终端设备提供的检索文本或从第2检索声音处理部(314)转换的文本。
11.根据权利要求10所述的基于对象的影像检索系统,其特征在于,
对象图像的影像信息根据对于轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)的特征点信息和特征点的视觉属性而生成,并根据类似性将影像信息群集化而生成或分类为一个以上的类别。
12.根据权利要求10所述的基于对象的影像检索系统,其特征在于,
类别分别赋予固有ID,类别信息包括各个类别的影像信息、类目信息、说明类别的文本信息、专业化信息中的一个以上。
13.根据权利要求10所述的基于对象的影像检索系统,其特征在于,
第2注册影像信息提取模块(304)由从注册的图像提取影像信息的第2注册图像影像信息提取部(305)和从注册的视频提取影像信息的第2注册视频影像信息提取部(306)构成。
14.根据权利要求10所述的基于对象的影像检索系统,其特征在于,
第2注册影像检索模块(316)由检索影像信息的第2影像检索部(317)和比较文本的第2文本检索部(318)构成。
15.一种基于对象的影像检索方法,其特征在于,
包括如下步骤:
通过第1注册影像信息提取模块(203)提取作为检索对象的注册图像的特征点或特征点的视觉属性作为影像信息;
类别生成模块(209)根据提取的影像信息的相同性或类似性,将其群集化,生成或分类为一个以上的类别;
接收有关通过第1类别信息管理模块(210)生成的类别的信息,存储为类别信息;
第1检索内容信息提取模块(211)从用户终端设备接收要检索的图像、检索视频、声音或文本中选择的某一个检索内容时,提取接收的检索内容的影像信息;
第1注册影像检索模块(216)将从检索内容提取的影像信息与类别的影像信息进行比较,检索相同或类似的类别和包括检索的类别的全部或一部分的注册图像或注册视频;及
将有关检索的类别信息或注册影像的信息表格化,通过第1检索结果显示模块(219)提供给用户终端设备作为检索结果;及
如果检索内容为声音时,将接收的声音转换为文本,
并且,将从声音转换的文本或从用户终端设备直接以文本接收的检索文本与类别信息的文本进行比较,检索具有相同或类似地匹配的文本的类别。
16.根据权利要求15所述的基于对象的影像检索方法,其特征在于,
作为注册图像或检索图像的影像信息提取的特征点为根据图像或视频中包含的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)而生成的信息,特征点的视觉属性为特征点周边的影像所具有的亮度信息或色彩信息或图案信息。
17.根据权利要求15所述的基于对象的影像检索方法,其特征在于,
注册视频或检索视频以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的帧选定为代表帧,从选定的代表帧提取特征点或特征点的视觉属性作为影像信息,通过上述的过程从注册图像或代表帧提取有关特征点或特征点的视觉属性的影像信息。
18.一种基于对象的影像检索方法,其特征在于,
包括如下步骤:
通过对象图像管理模块(301)接收并存储注册的包括各种对象的一个以上的图像,并提取注册的对象图像的影像信息之后,根据影像信息的相同性或类似性群集化,生成或分类为一个以上的类别;
接收有关通过第2类别信息管理模块(302)生成的类别的信息,存储为类别信息;
接收注册的作为检索对象的图像或视频时,通过第2注册影像信息提取模块(304)从注册的注册图像或注册视频提取影像信息;
将从第2注册影像管理模块(303)提取的注册的图像或视频的影像信息与类别内的影像信息进行比较,确认相同或类似地匹配的类别,将有关匹配的类别的信息与注册影像一同存储;
从用户终端设备接收要检索的图像、检索视频、声音或文本中选择的某一个检索内容时,第2检索内容信息提取模块(311)提取接收的检索内容的影像信息;
第2注册影像检索模块(316)将从检索内容提取的影像信息与类别的影像信息进行比较,检索相同或类似地匹配的类别和包括检索的类别的全部或一部分的注册图像或注册视频;
将有关检索的类别信息或注册影像的信息表格化,通过第2检索结果显示模块(319)提供给用户终端设备作为检索结果;及
检索内容为声音时,将接收的声音转换为文本,
并且,将从声音转换的文本或从用户终端设备直接以文本接收的检索文本与类别信息的文本进行比较,检索具有相同或类似地匹配的文本的类别。
19.根据权利要求18所述的基于对象的影像检索方法,其特征在于,
作为注册图像或检索图像的影像信息提取的特征点为根据图像或视频中包含的轮廓线或棱角或极点(比周边亮度较暗或较亮的部分)而生成的信息,特征点的视觉属性为特征点周边的影像所具有的亮度信息或色彩信息或图案信息。
20.根据权利要求18所述的基于对象的影像检索方法,其特征在于,
注册视频或检索视频以视觉要素变换的地点为基准将前后的视频的区间分隔为镜头,并将各个镜头中代表的帧选定为代表帧,从选定的代表帧提取特征点或特征点的视觉属性作为影像信息,通过上述的过程从注册图像或代表帧提取有关特征点或特征点的视觉属性的影像信息。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20120144059 | 2012-12-12 | ||
KR10-2012-0144059 | 2012-12-12 | ||
KR1020130002728A KR101289085B1 (ko) | 2012-12-12 | 2013-01-10 | 객체 기반 영상 검색시스템 및 검색방법 |
KR10-2013-0002728 | 2013-01-10 | ||
PCT/KR2013/011451 WO2014092446A1 (ko) | 2012-12-12 | 2013-12-11 | 객체 기반 영상 검색시스템 및 검색방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104903892A true CN104903892A (zh) | 2015-09-09 |
CN104903892B CN104903892B (zh) | 2018-02-02 |
Family
ID=48997925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380067598.XA Expired - Fee Related CN104903892B (zh) | 2012-12-12 | 2013-12-11 | 基于对象的影像检索系统及检索方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150310012A1 (zh) |
KR (1) | KR101289085B1 (zh) |
CN (1) | CN104903892B (zh) |
WO (1) | WO2014092446A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372607A (zh) * | 2016-09-05 | 2017-02-01 | 努比亚技术有限公司 | 一种从视频中提取图片的方法及移动终端 |
CN106550268A (zh) * | 2016-12-26 | 2017-03-29 | Tcl集团股份有限公司 | 视频处理方法和视频处理装置 |
CN110019938A (zh) * | 2017-11-29 | 2019-07-16 | 深圳Tcl新技术有限公司 | 基于rgb分类的视频信息检索方法、装置及存储介质 |
CN112019789A (zh) * | 2019-05-31 | 2020-12-01 | 杭州海康威视数字技术股份有限公司 | 录像回放方法及装置 |
CN112397180A (zh) * | 2019-08-19 | 2021-02-23 | 台北医学大学 | 手术影像的智慧标记系统及其方法 |
CN114741557A (zh) * | 2022-03-31 | 2022-07-12 | 慧之安信息技术股份有限公司 | 视图数据库管理分类方法 |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102085036B1 (ko) * | 2013-08-22 | 2020-03-05 | 에스케이 텔레콤주식회사 | 시간 기준을 이용한 영상 검색장치, 방법 및 컴퓨터로 읽을 수 있는 기록매체 |
KR101664400B1 (ko) * | 2014-07-14 | 2016-10-10 | 장수진 | 온라인을 이용한 오프라인 매장의 상품을 검색하기 위한 시스템 및 그 처리 방법 |
KR101724143B1 (ko) * | 2014-09-05 | 2017-04-06 | 네이버 주식회사 | 검색 서비스 제공 장치, 시스템, 방법 및 컴퓨터 프로그램 |
CN104580802A (zh) * | 2014-12-20 | 2015-04-29 | 佛山市海科知识产权服务有限公司 | 一种移动智能终端的图像传送系统及其实现方法 |
KR102565485B1 (ko) * | 2016-01-11 | 2023-08-14 | 한국전자통신연구원 | 도시 거리 검색 서비스 제공 서버 및 방법 |
US20170235828A1 (en) * | 2016-02-12 | 2017-08-17 | Microsoft Technology Licensing, Llc | Text Digest Generation For Searching Multiple Video Streams |
US9984314B2 (en) | 2016-05-06 | 2018-05-29 | Microsoft Technology Licensing, Llc | Dynamic classifier selection based on class skew |
KR101859050B1 (ko) * | 2016-06-02 | 2018-05-21 | 네이버 주식회사 | 내용 기반의 지도 이미지 탐색 방법 및 시스템 |
KR20180024200A (ko) | 2016-08-29 | 2018-03-08 | 오드컨셉 주식회사 | 영상 검색 정보 제공 방법, 장치 및 컴퓨터 프로그램 |
KR102055733B1 (ko) * | 2017-02-24 | 2019-12-13 | 권오민 | 이미지광고 온라인 제공 방법 |
US10423659B2 (en) | 2017-06-30 | 2019-09-24 | Wipro Limited | Method and system for generating a contextual audio related to an image |
CN108710653B (zh) * | 2018-05-09 | 2021-05-07 | 北京儒博科技有限公司 | 一种绘本朗读点播方法、装置及系统 |
KR102639278B1 (ko) * | 2018-07-02 | 2024-02-22 | 주식회사 넥슨코리아 | 게임 제공 장치 및 방법 |
KR102592463B1 (ko) | 2018-08-01 | 2023-10-23 | 삼성전자 주식회사 | 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치 |
CN111368106B (zh) * | 2018-12-26 | 2024-04-26 | 中兴通讯股份有限公司 | 野广告处理方法、装置以及计算机可读存储介质 |
CN110134830A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 视频信息数据处理方法、装置、计算机设备和存储介质 |
KR102252083B1 (ko) * | 2019-10-17 | 2021-05-14 | 주식회사 지오비전 | 이벤트의 등장 객체간 관련성 파악이 용이한 비디오 서머리방법 |
KR102110894B1 (ko) * | 2019-11-27 | 2020-05-14 | 주식회사 종달랩 | 의류 원단을 촬영한 동영상을 이용하여 유사한 원단을 검색하고 추천하는 인공지능 원단 검색 시스템 |
US10771965B1 (en) * | 2020-01-09 | 2020-09-08 | Lexisnexis Risk Solutions Inc. | Systems and methods for photo recognition-based identity authentication |
CN111524518B (zh) * | 2020-04-01 | 2023-04-18 | Oppo广东移动通信有限公司 | 增强现实处理方法及装置、存储介质和电子设备 |
CN111916065A (zh) * | 2020-08-05 | 2020-11-10 | 北京百度网讯科技有限公司 | 用于处理语音的方法和装置 |
CN115278326A (zh) * | 2021-04-29 | 2022-11-01 | 腾讯科技(深圳)有限公司 | 视频展示方法、装置、计算机可读介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050028194A1 (en) * | 1998-01-13 | 2005-02-03 | Elenbaas Jan Hermanus | Personalized news retrieval system |
US7013051B2 (en) * | 1999-01-29 | 2006-03-14 | Mitsubishi Denki Kabushiki Kaisha | Method of image feature coding and method of image search |
WO2005101188A3 (en) * | 2004-04-07 | 2007-07-12 | Seth Haberman | Method and system for display guide for video selection |
CN101064846A (zh) * | 2007-05-24 | 2007-10-31 | 上海交通大学 | 结合节目内容元数据和内容分析的时移电视视频匹配方法 |
CN102207966A (zh) * | 2011-06-01 | 2011-10-05 | 华南理工大学 | 基于对象标签的视频内容快速检索方法 |
CN102663015A (zh) * | 2012-03-21 | 2012-09-12 | 上海大学 | 基于特征袋模型和监督学习的视频语义标注方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6263507B1 (en) * | 1996-12-05 | 2001-07-17 | Interval Research Corporation | Browser for use in navigating a body of information, with particular application to browsing information represented by audiovisual data |
US6100900A (en) * | 1997-12-11 | 2000-08-08 | Synopsys, Inc. | Displaying numerical data in various colors based upon their relative contribution to the whole |
KR100547370B1 (ko) * | 2001-06-30 | 2006-01-26 | 주식회사 케이티 | 객체 형상 정보를 이용한 요약영상 추출 장치 및 그방법과 그를 이용한 동영상 요약 및 색인 시스템 |
JP2004280254A (ja) * | 2003-03-13 | 2004-10-07 | Sanyo Electric Co Ltd | コンテンツ分類方法および装置 |
US7657126B2 (en) * | 2005-05-09 | 2010-02-02 | Like.Com | System and method for search portions of objects in images and features thereof |
KR100706389B1 (ko) * | 2005-07-15 | 2007-04-10 | (주)첫눈 | 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치 |
KR20070058927A (ko) * | 2005-12-05 | 2007-06-11 | 주식회사 대우일렉트로닉스 | Pvr 장치가 내장된 텔레비전의 녹화방법 |
JP5072415B2 (ja) * | 2007-04-10 | 2012-11-14 | 三菱電機株式会社 | 音声検索装置 |
US8719288B2 (en) * | 2008-04-15 | 2014-05-06 | Alexander Bronstein | Universal lookup of video-related data |
-
2013
- 2013-01-10 KR KR1020130002728A patent/KR101289085B1/ko active IP Right Grant
- 2013-12-11 CN CN201380067598.XA patent/CN104903892B/zh not_active Expired - Fee Related
- 2013-12-11 WO PCT/KR2013/011451 patent/WO2014092446A1/ko active Application Filing
- 2013-12-11 US US14/649,840 patent/US20150310012A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050028194A1 (en) * | 1998-01-13 | 2005-02-03 | Elenbaas Jan Hermanus | Personalized news retrieval system |
US7013051B2 (en) * | 1999-01-29 | 2006-03-14 | Mitsubishi Denki Kabushiki Kaisha | Method of image feature coding and method of image search |
WO2005101188A3 (en) * | 2004-04-07 | 2007-07-12 | Seth Haberman | Method and system for display guide for video selection |
CN101064846A (zh) * | 2007-05-24 | 2007-10-31 | 上海交通大学 | 结合节目内容元数据和内容分析的时移电视视频匹配方法 |
CN102207966A (zh) * | 2011-06-01 | 2011-10-05 | 华南理工大学 | 基于对象标签的视频内容快速检索方法 |
CN102663015A (zh) * | 2012-03-21 | 2012-09-12 | 上海大学 | 基于特征袋模型和监督学习的视频语义标注方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372607A (zh) * | 2016-09-05 | 2017-02-01 | 努比亚技术有限公司 | 一种从视频中提取图片的方法及移动终端 |
CN106550268A (zh) * | 2016-12-26 | 2017-03-29 | Tcl集团股份有限公司 | 视频处理方法和视频处理装置 |
CN106550268B (zh) * | 2016-12-26 | 2020-08-07 | Tcl科技集团股份有限公司 | 视频处理方法和视频处理装置 |
CN110019938A (zh) * | 2017-11-29 | 2019-07-16 | 深圳Tcl新技术有限公司 | 基于rgb分类的视频信息检索方法、装置及存储介质 |
CN112019789A (zh) * | 2019-05-31 | 2020-12-01 | 杭州海康威视数字技术股份有限公司 | 录像回放方法及装置 |
CN112019789B (zh) * | 2019-05-31 | 2022-05-31 | 杭州海康威视数字技术股份有限公司 | 录像回放方法及装置 |
CN112397180A (zh) * | 2019-08-19 | 2021-02-23 | 台北医学大学 | 手术影像的智慧标记系统及其方法 |
CN112397180B (zh) * | 2019-08-19 | 2024-05-07 | 台北医学大学 | 手术影像的智能标记系统及其方法 |
CN114741557A (zh) * | 2022-03-31 | 2022-07-12 | 慧之安信息技术股份有限公司 | 视图数据库管理分类方法 |
Also Published As
Publication number | Publication date |
---|---|
KR101289085B1 (ko) | 2013-07-30 |
WO2014092446A1 (ko) | 2014-06-19 |
US20150310012A1 (en) | 2015-10-29 |
CN104903892B (zh) | 2018-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104903892A (zh) | 基于对象的影像检索系统及检索方法 | |
US11281712B2 (en) | System, apparatus, method, program and recording medium for processing image | |
US20070216709A1 (en) | Display control apparatus, display control method, computer program, and recording medium | |
US20070195344A1 (en) | System, apparatus, method, program and recording medium for processing image | |
CN103069415B (zh) | 用于图像处理的计算机实施的方法、计算机程序产品和计算机系统 | |
CN104754413B (zh) | 基于图像搜索识别电视信号并推荐信息的方法和设备 | |
CN107103316A (zh) | 基于智能手机的方法和系统 | |
CN103384883B (zh) | 利用Top-K处理使语义丰富 | |
CN113766296B (zh) | 直播画面的展示方法和装置 | |
WO2017080173A1 (zh) | 基于自然信息识别的推送系统和方法及一种客户端 | |
CN102486793A (zh) | 一种搜索目标用户的方法和系统 | |
CN104598127A (zh) | 一种在对话界面插入表情的方法及装置 | |
CN104331515A (zh) | 一种自动生成旅游日记的方法和系统 | |
US20060182347A1 (en) | Image retrieval method and apparatus independent of illumination change | |
CN104253981B (zh) | 一种用于视频侦查的运动目标按颜色排序的方法 | |
CN102055932A (zh) | 电视节目搜索的方法及采用该方法的电视机 | |
JP6109118B2 (ja) | 画像処理装置および方法、情報処理装置および方法、並びにプログラム | |
CN113012220A (zh) | 一种果实计数方法、装置及电子设备 | |
CN111163170A (zh) | 照片分享方法、系统及服务器 | |
CN109977246A (zh) | 一种基于用户行程归类照片的方法及系统 | |
CN110879849B (zh) | 一种基于图像转文字的相似度比较方法及装置 | |
CN115861177A (zh) | 基于域适应的摄影图片价值评估方法及相关装置 | |
Glotin et al. | Profil Entropic Visual Features for Visual Concept Detection in CLEF 2008 Campaign. | |
Kaneko et al. | Department of Informatics, The University of Electro-Communications, Tokyo | |
CN105243059A (zh) | 在电子装置上根据环境照明推荐相关内容的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180202 |