CN106528800A - 一种基于真实场景的影像生成方法及装置 - Google Patents
一种基于真实场景的影像生成方法及装置 Download PDFInfo
- Publication number
- CN106528800A CN106528800A CN201610997818.4A CN201610997818A CN106528800A CN 106528800 A CN106528800 A CN 106528800A CN 201610997818 A CN201610997818 A CN 201610997818A CN 106528800 A CN106528800 A CN 106528800A
- Authority
- CN
- China
- Prior art keywords
- image
- scene
- user
- core information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供的基于真实场景的影像生成方法及装置,当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;并根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。本发明实施例提供的方案可以快速准确的查找到同一场景的图像,并将上述图像拼接成连续的一个或多个平面图像序列,并匹配相应的文字交互呈现给用户,可以实现真实场景与用户的交互回放或直播,提升了用户的使用体验。
Description
技术领域
本发明涉及一种基于真实场景的影像生成方法及装置。
背景技术
目前,图像搜索引擎通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务,通过输入与图片名称或内容相似的关键字来进行检索,另一种通过上传与搜索结果相似的图片或图片URL进行搜索。但是图像搜素技术针对同一事件的图像,没有关于它们是同一个场景的认知,检索过程也不关心拍摄图像的主体。
在社交网站中,用户上传影像,系统有选择地推出影像流到相关用户。但是系统推出影像流到用户时会考虑到不同的影像流的来源(上载影像者,或拍摄者)信息,也知道来自不同拍摄者的影像流可能拍摄的是同一个场景。但一般只是针对单一拍摄主体的影像进行处理,不会对拍摄者拍摄的不同的流进行拼接再现场景。
电视转播播放经过人工编辑剪接的真实事件的影像,用户被动接收。用户能看到的是经过人工编辑剪接的真实事件的影像。用户只能被动观看,而不可能选择不同形式的拼接再现场景。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于真实场景的影像生成方法及装置。
根据本公开实施例的第一方面,提供的一种基于真实场景的影像生成方法,包括:当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
在一个实施例中,所述图像为拍摄真实场景获得。
在一个实施例中,所述影像数据库的数据通过以下方式获得:
获取所有图像以及图像的相关信息;所述相关信息包括:图像外部的信息和图像内容的描述信息;
根据所述图像的相关信息,生成图像的核心信息;所述核心信息包括拍摄时间、地点、场景、主体和客体;所述主体为拍摄图像的至少一个人或物,所述客体为图像中被识别的人和物;
修正图像的核心信息,根据图像的核心信息,并为图像相对应的场景生成主标题和副标题。
在一个实施例中,所述修正图像的核心信息,包括:
将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。
在一个实施例中,所述进行反复推导修正所有的图像的各自的核心信息,包括:
每一个图像核心信息的自身迭代推导;
所有的图像核心信息的相互修正。
在一个实施例中,所述每一个图像核心信息的自身迭代推导包括:
固定m1、m2、m3、m4推导出m5′;
固定m1、m2、m3、m5′推导出m4′;
固定m1、m2、m4′、m5′推导出m3′;
固定m1、m3′、m4′、m5′推导出m2′;
固定m2′、m3′、m4′、m5′推导出m1′;
当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停所述迭代推导;否则,继续重复迭代推导过程;
所述m1、m2、m3、m4分别为拍摄时间、地点、场景、主体;
所述m1′、m2′、m3′、m4′、m5′分别为推导出的拍摄时间、地点、场景、主体、客体。
在一个实施例中,当暂停所述迭代推导后,还包括:接收用户输入的核心信息参数时或获取到新的图像的核心信息参数时,继续重复迭代推导过程。
在一个实施例中,所述生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户,包括:
在同一场景中,根据用户选择的预设条件,返回与所述预设条件关联的多个图像;
将所返回的所述多个图像按照当前输入计算出的顺序呈现给用户;
接收用户发出的选择指令,从一个平面图像序列中的任意图像节点切出或切入到另外一个平面图像序列中的相应图像的节点,并呈现切换后的平面图像序列给用户。
根据本公开实施例的第二方面,提供一种基于真实场景的影像生成装置,包括:
检索模块,用于当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
呈现模块,用于根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
在一个实施例中,所述图像为拍摄真实场景获得。
在一个实施例中,所述检索模块包括:
获取子模块,用于获取所有图像以及图像的相关信息;所述相关信息包括:图像外部的信息和图像内容的描述信息;
生成子模块,用于根据所述图像的相关信息,生成图像的核心信息;所述核心信息包括拍摄时间、地点、场景、主体和客体;所述主体为拍摄图像的至少一个人或物,所述客体为图像中被识别的人和物;
修正子模块,用于修正图像的核心信息,根据图像的核心信息,并为图像相对应的场景生成主标题和副标题。
在一个实施例中,所述修正子模块,还用于将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。
在一个实施例中,所述修正子模块,还用于每一个图像核心信息的自身迭代推导;所有的图像核心信息的相互修正。
在一个实施例中,所述修正子模块,还用于固定m1、m2、m3、m4推导出m5′;
固定m1、m2、m3、m5′推导出m4′;
固定m1、m2、m4′、m5′推导出m3′;
固定m1、m3′、m4′、m5′推导出m2′;
固定m2′、m3′、m4′、m5′推导出m1′;
当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停所述迭代推导;否则,继续重复迭代推导过程;
所述m1、m2、m3、m4分别为拍摄时间、地点、场景、主体;
所述m1′、m2′、m3′、m4′、m5′分别为推导出的拍摄时间、地点、场景、主体、客体。
在一个实施例中,所述修正子模块,还用于当暂停所述迭代推导后,还包括:接收用户输入的核心信息参数时或获取到新的图像的核心信息参数时,继续重复迭代推导过程。
在一个实施例中,所述呈现模块,还用于在同一场景中,根据用户选择的预设条件,返回与所述预设条件关联的多个图像;将所返回的所述多个图像按照当前输入计算出的顺序呈现给用户;接收用户发出的选择指令,从一个平面图像序列中的任意图像节点切出或切入到另外一个平面图像序列中的相应图像的节点,并呈现切换后的平面图像序列给用户。
根据本公开实施例的第三方面,提供一种基于真实场景的影像生成装置,包括:
处理器;
用于存储处理器可执行命令的存储器;
其中,所述处理器被配置为:
当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
本发明实施例至少实现了如下技术效果:
本发明实施例提供的基于真实场景的影像生成方法及装置,当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;并根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。本发明实施例提供的方案可以快速准确的查找到同一场景的图像,并将上述图像拼接成连续的一个或多个平面图像序列,并匹配相应的文字交互呈现给用户,可以实现真实场景与用户的交互回放或直播,提升了用户的使用体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其它优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的基于真实场景的影像生成方法的流程图;
图2为本发明实施例提供的影像数据库的数据获得方法的流程图;
图3为本发明实施例提供的步骤S23反复推导修正所有的图像的各自的核心信息的流程图;
图4为本发明实施例提供的步骤S12生成连续的平面图像序列呈现给用户的流程图;
图5为本发明实施例提供的基于真实场景的影像生成装置的结构图;
图6为本发明实施例提供的检索模块51的结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本公开实施例提供的一种基于真实场景的影像生成方法,参照图1所示,具体包括以下步骤:
S11、当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
S12、根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
下面对上述步骤作进一步详细的说明。
在上述步骤S11中,查看指令例如可以包括时间、地点、主题的关键词,指定的场景,比如可以是一场比赛,根据上述关键词对应的场景在预设的影像数据库中检索与之关联的所有图像,其中预设的影像数据库存储海量的场景以及与场景相关联的图像。
例如还可以在预设的影像数据库中存储海量的场景以及与场景相关联的图像索引的映射关系。使用图像索引可快速访问到特定的图像文件,在上述影像数据库中,图像索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。当有大量图像文件时,若要对图像进行查询,第一种搜索信息方式是全图像文件搜索,是将所有图像文件一一取出,和查询条件进行一一对比,然后返回满足条件的图像文件,这样做会消耗大量时间,并造成大量磁盘I/O操作;第二种就是给大量图像文件建立图像索引,然后在图像索引中找到符合查询条件的索引值,最后通过保存在图像索引中的ROWID(相当于页码)快速找到图像索引对应的图像文件。
上述影像数据库存储场景和图像索引的映射关系,可以大大加快检索图像文件数据的检索速度;并且通过图像索引,例如可以是创建唯一性索引,保证数据库表中每一行数据的唯一性。
在上述步骤S12中,根据数据库返回的与指定的场景相关联的所有的图像,快递准确的查找到同一场景的图像,并对所有图像进行筛选和处理,比如可以是筛选操作,拼接处理、图片优化等,生成一个或多个平面图像序列并匹配相应的文字交互呈现给用户。其中相应的文字可以是对场景的描述,比如:“2015北京女子马拉松”、“奔跑中的强者冒雨前行”等等。上述的图像序列例如:采用一定顺序(比如相同的角度)生成一个或多个平面图像序列,实现与用户交互,可以实现真实场景的交互回放或直播,并将生成一个或多个平面图像序列呈现给用户。所谓的序列也就是排序的意思,即图像的排序的顺序可以按照多种条件进行排列。
本公开实施例提供的上述基于真实场景的影像生成方法,当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;并根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。本发明实施例提供的方案可以快速准确的查找到同一场景的图像,并将上述图像拼接成连续的一个或多个平面图像序列,并匹配相应的文字交互呈现给用户,可以实现真实场景的交互回放或直播,提升了用户的使用体验。
在一个实施例中,上述的图像均为拍摄的真实场景。
在一个实施例中,参照图2所示,上述影像数据库的数据可以通过以下方式获得:
S21、获取所有图像以及图像的相关信息;所述相关信息包括:图像外部的信息和图像内容的描述信息;
S22、根据图像的相关信息,生成图像的核心信息;所述核心信息包括拍摄时间、地点、场景、主体和客体;所述主体为拍摄图像的至少一个人或物,所述客体为图像中被识别的人和物;
S23、修正图像的核心信息,根据图像的核心信息,并为图像相对应的场景生成主标题和副标题。
在本实施例中,影像数据库的数据可以是包括一系列的数据表,这些一系列的数据表彼此之间通过主键或其他属性相关联;
影像数据库的结构例如:主事件包括若干子事件,每一个子事件包括若干场景,每一个场景包括若干子场景,每一个子场景包括与子场景所对应的相关联的所有图像的核心信息以及图像和图像索引等。
其中,步骤S21,获取所有图像以及图像的相关信息,其中图像文件以及图像的相关信息的来源,比如互联网上可以读取的图片,一些社交网站及其它网站可以接触到的图片均可,采集上述所有的图片文件、图像文本或者视觉特征等。所用到的采集方式和算法,可以参考相关技术中的Spider(一种计算机程序,抓取网页内容的机器人)爬取方式,本公开实施例对此不做限定。
上述步骤S21中所说的相关信息包括:图像外部的信息和图像内容的描述信息;
图像外部的信息:即图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息。在找出图像文件后,图像搜索引擎通过查看文件名或路径名可以确定文件内容,当然这取决于文件名或路径名的描述程度。
图像内容的描述信息:是一种语义层次的匹配。比如采用人工对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类,给出描述词,还可以根据图像识别技术,识别出对象,比如采用轮廓提取、采用模式匹配或通过与在预设的数据库中存储的对象图像特征进行比对,上述方式都是基于图像识别相关技术中的统计模式识别、结构模式识别、模糊模式识别,从而可以识别各种不同模式的对象,从而来确定图像内容的描述信息。
在步骤S22中,根据上述图像的相关信息,比如图像的文件名、目录名、标签或图像内容的描述信息(物体、背景、构成、颜色),以此来生成图像的核心信息;上述核心信息可以包括拍摄时间、地点、场景、主体(比如通常为图像的拍摄者,也可以是提供图像核心信息的提供者或是上传者;还可以是物,比如航拍器,监控摄像头,主体在数量上可以为一个或多个)和客体(客体为图片内容,被识别的人和物,可以是被拍摄者,比如一个人,一个物,几个人,几个物),还可以包括其它辅助信息例如视角,焦距,光圈等。
在步骤S23中,修正所有图像的核心信息,比如生成的图像核心信息有些时候是错误的,那么需要更正这些错误的核心信息,然后再建立场景和图像,以及图像索引的映射关系,并为图像相对应的场景生成主标题和副标题。上述更正信息的过程和建立映射关系的过程可以同时进行,在执行上没有先后顺序之分,本公开实施例对此也不做限定。
上述匹配相应的文字可以为“主标题+副标题”,也可以有一个或几个副标题。例如主标题是一个复合词,如“2015北京女子马拉松”,副标题为一个符合短语或短句,如“奔跑中的强者冒雨前行”。其中标题的生成,例如可以结合上述的核心信息,利用语义分析来自动生成,本公开实施例对上述标题生成方式不做限定。
在一个实施例中,上述步骤S23中,修正图像的核心信息,可以实施为:
将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。
在本实施例中,通过迭代算法不断用图像的核心信息变量的旧值递推新值,使新的核心信息的参数不断地精确化,直到满足预设的条件为止,停止迭代;上述方式进行反复推导从修正所有的图像的各自的核心信息,实现了所有的图像的各自的核心信息的精确化。
在本实施例中,修正图像的核心信息,还可以实施为:利用其他的算法,比如参考图像的相关信息或辅助信息(比如视角,焦距,光圈,时间,地点),代入算法,将图像的核心信息中存在错误的记录或空白记录进行修正或填充,本公开实施例对此算法不做限定,其他可以实现精确化数据的算法均可。
在一个实施例中,参照图3所示,上述进行反复推导修正所有的图像的各自的核心信息,可以进一步实施为:
S231、每一个图像核心信息的自身迭代推导;
S232、所有的图像核心信息的相互修正。
在一个实施例中,上述每一个图像核心信息的自身迭代推导,过程如下:固定m1、m2、m3、m4推导出m5′;
固定m1、m2、m3、m5′推导出m4′;
固定m1、m2、m4′、m5′推导出m3′;
固定m1、m3′、m4′、m5′推导出m2′;
固定m2′、m3′、m4′、m5′推导出m1′;
当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停所述迭代推导;否则,继续重复迭代推导过程;
上述m1、m2、m3、m4分别为拍摄时间、地点、场景、主体;
上述m1′、m2′、m3′、m4′、m5′分别为推导出的拍摄时间、地点、场景、主体、客体。
上述迭代的过程会参考其他图像的核心信息的参数值,也会通过识别图像内容来精确化拍摄的客体的参数,通过人工智能学习,反复迭代推导,不断的精确化初始比较粗糙的所有图像的核心信息,以便可以通过算法组合提取作为反映图像主观意义的子场景标题。
在一个实施例中,上述迭代过程,当暂停迭代推导后,例如还可以包括:接收用户输入的核心信息参数时或获取到新的图像的核心信息参数时,继续重复迭代推导过程,直到当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停迭代推导。
在本实施例中,接收人工干预,是为了更好的精确化核心信息的参数值,比如赋予某个图像的核心信息的某个参数新值,从而开始新一轮的迭代计算。
在一个实施例中,所有的图像核心信息的相互修正,可以包括:
所有的图像核心信息固定拍摄时间、地点推导出场景;
再固定拍摄时间、地点、推导出的场景,所有的图像相互进行修正主体或客体。
下面举例说明:
参考表一(精确化的数据)和表二(粗糙的数据)所示,其中表一是最终的影像数据库中数据库表。
表一
ID | 时间 | 地点 | 场景 | 主体 | 客体 | |
1 | -30:00 | 等候区 | 等候 | A | B | |
2 | +00:00 | 起跑线 | C | A、B | ||
3 | +30:00 | 5KM | D | B | ||
4 | +70:00 | 21KM | 冲线 | E | F | |
5 | +150:00 | 30KM | 过极点 | G | B | |
6 | +180:00 | 35KM | A | A | ||
7 | +200:00 | 42KM | 冲线 | C | B | |
8 | +210:00 | 休息区 | A | A、B | ||
9 | +240:00 | 领奖台 | 冠军 | A | F |
表二
ID | 时间 | 地点 | 场景 | 主体 | 客体 | |
1 | -30:00 | 等候区 | 等候→等候区 | I→A | Q→X→B | |
…… | ||||||
…… | ||||||
…… | ||||||
…… | ||||||
10 | -30:00 | 起跑线 | H | X | ||
11 | -30:00 | 起跑线 | K | I | ||
12 | -30:00 | 等候区 | 等候 | |||
13 | -30:00 | 等候区 | 等候 |
将上述表格中每一条数据使用P1~Pn表示,使用m1、m2、m3、m4、m5分别代表上述拍摄时间、地点、场景、主体、客体。将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。对属于同一场景的图像的核心信息有2个主体或者多于2个主体,需要进行反复推导修正,当然对于图像的核心信息只有1个主体的情况也会进行推导修正。其过程如下:
迭代1:
其中表二中P1的m1、m2、m3、m4固定,客体识别为X,可信度为70%;通过自身迭代主体识别为I;
迭代2:将新图片P10代入算法,
P10的m1、m2、m3、m4固定,客体识别为X,可信度为90%(例如可以通过图片内容如运动员衣服编号识别);
迭代3:由于P10与P1的客体相同,但地点不同,P1被更正;然后P1的m1、m2、m3、m4固定,推导出m5排除X,被识别为B;
迭代4:
新图片P11、P12、P13代入算法,其识别结果跟初始值一样;
P1的m1、m2、m3、m5固定,主体m4被从I更新为A(因为P11的客体是I,I在不同的地点);
P1的m1、m2、m4、m5固定,场景m3被从“冲线”更新为“等候”(时间和地点固定,可以得出场景);
这样反复迭代后,例如观众G拍了B,很想知道B在比赛中自始至终的表现,期望通过搜索找到图片P1、P2、P3、P5、P7、P8,G也希望看到最后结果,可以加入P9。
还比如A是运动员想看自己的全程,希望检索找到P1、P2、P6、P8、P9.选择P1、P9是因为A是P1、P9的主体。
在一个实施例中,上述步骤S12中,参照图4所示,生成一个或多个平面图像,并匹配相应的文字交互呈现给用户,包括:
S121、在同一场景中,根据用户选择的预设条件,返回与所述预设条件关联的多个图像;
S122、将所返回的所述多个图像按照当前输入计算出的顺序呈现给用户;
S123、接收用户发出的选择指令,从一个平面图像序列中的任意图像节点切出或切入到另外一个平面图像序列中的相应图像的节点,并呈现切换后的平面图像序列给用户。
在本实施例中,通过用户查看的关键词,影像数据库返回与场景相关联的所有的图像索引或图像,并将同一场景与图像索引映射的图像,根据用户选择的视角,生成选择一个或多个平面图像序列,从而可以建立多种浏览方式,供用户选择。
例如:用户可以选择以任何一张图像p作为起始点,另一张关联的图像q作为终点进行浏览,用户可以选择从p到q的不同路径。获得不同的视角场景体验。
比如一场网球比赛,图像p是球员x发球,图像q是球员y接回。介于两图中间可以选择三种方式浏览:
第一种:可以选择x面向的观众拍摄的一系列图片d;
第二种:可以选择y面向的观众拍摄的一系列图片e;
第三种:可以选择x和y中间的观众拍摄的一系列图片f。
最终根据用户选择的多个图像按照预设条件呈现给用户。预设的条件例如可以是时间顺序,还可以是按照相同的地点、场景、主体或者客体等顺序。
在本实施例中,生成一个或多个平面图像序列,筛选和处理属于同一场景的图像,并匹配相应的文字推荐给用户(比如按照拍摄的地点、主体、客体),可以在生成序列中指定一些节点(比如单个图像),用户可以选择从任一指定的节点进入浏览,增强交互性,还可根据用户指定的节点生成动态图像序列呈现给用户多种观感,比如用户可以选择以不同主体的角度来回顾场景等。其中图像序列可以按照时间、地点、场景、主体和客体等来区分,也可以按照除此之外的其他属性进行区分,比如视角等等,本公开实施例对此不做限定。
基于同一发明构思,本公开实施例还提供了一种基于真实场景的影像生成装置,由于该装置所解决问题的原理与前述实施例一种基于真实场景的影像生成方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。
根据本公开实施例的第二方面,提供一种基于真实场景的影像生成装置,参照图5所示,包括:
检索模块51,用于当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
呈现模块52,用于根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
在一个实施例中,所述图像为拍摄真实场景获得。
在一个实施例中,参照图6所示,上述检索模块51包括:
获取子模块511,用于获取所有图像以及图像的相关信息;所述相关信息包括:图像外部的信息和图像内容的描述信息;
生成子模块512,用于根据所述图像的相关信息,生成图像的核心信息;所述核心信息包括拍摄时间、地点、场景、主体和客体;所述主体为拍摄图像的至少一个人或物,所述客体为图像中被识别的人和物;
修正子模块513,用于修正图像的核心信息,根据图像的核心信息,并为图像相对应的场景生成主标题和副标题。
在一个实施例中,所述修正子模块513,还用于将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。
在一个实施例中,所述修正子模块513,还用于每一个图像核心信息的自身迭代推导;所有的图像核心信息的相互修正。
在一个实施例中,所述修正子模块513,还用于固定m1、m2、m3、m4推导出m5′;
固定m1、m2、m3、m5′推导出m4′;
固定m1、m2、m4′、m5′推导出m3′;
固定m1、m3′、m4′、m5′推导出m2′;
固定m2′、m3′、m4′、m5′推导出m1′;
当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停所述迭代推导;否则,继续重复迭代推导过程;所述m1、m2、m3、m4分别为拍摄时间、地点、场景、主体;所述m1′、m2′、m3′、m4′、m5′分别为推导出的拍摄时间、地点、场景、主体、客体。
在一个实施例中,所述修正子模块513,还用于当暂停所述迭代推导后,还包括:接收用户输入的核心信息参数时或获取到新的图像的核心信息参数时,继续重复迭代推导过程。
在一个实施例中,上述呈现模块51还用于在同一场景中,根据用户选择的预设条件,返回与所述预设条件关联的多个图像;将所返回的所述多个图像按照当前输入计算出的顺序呈现给用户;接收用户发出的选择指令,从一个平面图像序列中的任意图像节点切出或切入到另外一个平面图像序列中的相应图像的节点,并呈现切换后的平面图像序列给用户。
根据本公开实施例的第三方面,提供一种基于真实场景的影像生成装置,包括:
处理器;
用于存储处理器可执行命令的存储器;
其中,所述处理器被配置为:
当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
本发明实施例提供的基于真实场景的影像生成方法及装置,当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;并根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。本发明实施例提供的方案可以快速准确的查找到同一场景的图像,并将上述图像拼接成连续的一个或多个平面图像序列,并匹配相应的文字交互呈现给用户,可以实现真实场景的交互回放或直播,提升了用户的使用体验。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (17)
1.一种基于真实场景的影像生成方法,其特征在于,包括:
当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
2.如权利要求1所述的方法,其特征在于,所述图像为拍摄真实场景获得。
3.如权利要求1所述的方法,其特征在于,所述影像数据库的数据通过以下方式获得:
获取所有图像以及图像的相关信息;所述相关信息包括:图像外部的信息和图像内容的描述信息;
根据所述图像的相关信息,生成图像的核心信息;所述核心信息包括拍摄时间、地点、场景、主体和客体;所述主体为拍摄图像的至少一个人或物,所述客体为图像中被识别的人和物;
修正图像的核心信息,根据图像的核心信息,并为图像相对应的场景生成主标题和副标题。
4.如权利要求3所述的方法,其特征在于,所述修正图像的核心信息,包括:
将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。
5.如权利要求4所述的方法,其特征在于,所述进行反复推导修正所有的图像的各自的核心信息,包括:
每一个图像核心信息的自身迭代推导;
所有的图像核心信息的相互修正。
6.如权利要求5所述的方法,其特征在于,所述每一个图像核心信息的自身迭代推导包括:
固定m1、m2、m3、m4推导出m5′;
固定m1、m2、m3、m5′推导出m4′;
固定m1、m2、m4′、m5′推导出m3′;
固定m1、m3′、m4′、m5′推导出m2′;
固定m2′、m3′、m4′、m5′推导出m1′;
当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停所述迭代推导;否则,继续重复迭代推导过程;
所述m1、m2、m3、m4分别为拍摄时间、地点、场景、主体;
所述m1′、m2′、m3′、m4′、m5′分别为推导出的拍摄时间、地点、场景、主体、客体。
7.如权利要求6所述的方法,其特征在于,当暂停所述迭代推导后,还包括:接收用户输入的核心信息参数时或获取到新的图像的核心信息参数时,继续重复迭代推导过程。
8.如权利要求1所述的方法,其特征在于,所述生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户,包括:
在同一场景中,根据用户选择的预设条件,返回与所述预设条件关联的多个图像;
将所返回的所述多个图像按照当前输入计算出的顺序呈现给用户;
接收用户发出的选择指令,从一个平面图像序列中的任意图像节点切出或切入到另外一个平面图像序列中的相应图像的节点,并呈现切换后的平面图像序列给用户。
9.一种基于真实场景的影像生成装置,其特征在于,包括:
检索模块,用于当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
呈现模块,用于根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
10.如权利要求9所述的装置,其特征在于,所述图像为拍摄真实场景获得。
11.如权利要求9所述的装置,其特征在于,所述检索模块包括:
获取子模块,用于获取所有图像以及图像的相关信息;所述相关信息包括:图像外部的信息和图像内容的描述信息;
生成子模块,用于根据所述图像的相关信息,生成图像的核心信息;所述核心信息包括拍摄时间、地点、场景、主体和客体;所述主体为拍摄图像的至少一个人或物,所述客体为图像中被识别的人和物;
修正子模块,用于修正图像的核心信息,根据图像的核心信息,并为图像相对应的场景生成主标题和副标题。
12.如权利要求11所述的装置,其特征在于,所述修正子模块,还用于将所有的图像的核心信息通过迭代推导算法,进行反复推导修正所有的图像的各自的核心信息。
13.如权利要求12所述的装置,其特征在于,所述修正子模块,还用于每一个图像核心信息的自身迭代推导;所有的图像核心信息的相互修正。
14.如权利要求13所述的装置,其特征在于,所述修正子模块,还用于固定m1、m2、m3、m4推导出m5′;
固定m1、m2、m3、m5′推导出m4′;
固定m1、m2、m4′、m5′推导出m3′;
固定m1、m3′、m4′、m5′推导出m2′;
固定m2′、m3′、m4′、m5′推导出m1′;
当推导出的m1′、m2′、m3′、m4′分别与m1、m2、m3、m4相比较,均小于或等于预设的阀值,暂停所述迭代推导;否则,继续重复迭代推导过程;
所述m1、m2、m3、m4分别为拍摄时间、地点、场景、主体;
所述m1′、m2′、m3′、m4′、m5′分别为推导出的拍摄时间、地点、场景、主体、客体。
15.如权利要求14所述的装置,其特征在于,所述修正子模块,还用于当暂停所述迭代推导后,还包括:接收用户输入的核心信息参数时或获取到新的图像的核心信息参数时,继续重复迭代推导过程。
16.如权利要求9所述的装置,其特征在于,所述呈现模块,还用于在同一场景中,根据用户选择的预设条件,返回与所述预设条件关联的多个图像;将所返回的所述多个图像按照当前输入计算出的顺序呈现给用户;接收用户发出的选择指令,从一个平面图像序列中的任意图像节点切出或切入到另外一个平面图像序列中的相应图像的节点,并呈现切换后的平面图像序列给用户。
17.一种基于真实场景的影像生成装置,其特征在于,包括:
处理器;
用于存储处理器可执行命令的存储器;
其中,所述处理器被配置为:
当接收到用户的查看指令时,根据所述查看指令指定的场景在预设的影像数据库中检索与所述指定的场景相关联的所有的图像;
根据数据库返回的与所述指定的场景相关联的所有的图像,对所有图像进行筛选和处理,生成一个或多个平面图像序列,并匹配相应的文字交互呈现给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610997818.4A CN106528800B (zh) | 2016-11-11 | 2016-11-11 | 一种基于真实场景的影像生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610997818.4A CN106528800B (zh) | 2016-11-11 | 2016-11-11 | 一种基于真实场景的影像生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106528800A true CN106528800A (zh) | 2017-03-22 |
CN106528800B CN106528800B (zh) | 2019-10-08 |
Family
ID=58351457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610997818.4A Active CN106528800B (zh) | 2016-11-11 | 2016-11-11 | 一种基于真实场景的影像生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106528800B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704514A (zh) * | 2017-08-31 | 2018-02-16 | 努比亚技术有限公司 | 一种照片管理方法、装置及计算机可读存储介质 |
CN109272444A (zh) * | 2018-10-07 | 2019-01-25 | 朱钢 | 一种改善Ai智慧摄影场景优化策略的实现方法 |
CN110068328A (zh) * | 2018-01-22 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 导航路线生成方法、装置、计算机可读存储介质和计算机设备 |
CN115146103A (zh) * | 2022-09-01 | 2022-10-04 | 太平金融科技服务(上海)有限公司深圳分公司 | 图像检索方法、装置、计算机设备、存储介质和程序产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5724499A (en) * | 1994-01-07 | 1998-03-03 | Fujitsu Limited | Image generating apparatus |
CN101373483A (zh) * | 2007-08-20 | 2009-02-25 | 索尼株式会社 | 数据处理装置和数据处理方法 |
CN102054166A (zh) * | 2010-10-25 | 2011-05-11 | 北京理工大学 | 一种新的用于户外增强现实系统的场景识别技术 |
CN104794219A (zh) * | 2015-04-28 | 2015-07-22 | 杭州电子科技大学 | 一种基于地理位置信息的场景检索方法 |
-
2016
- 2016-11-11 CN CN201610997818.4A patent/CN106528800B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5724499A (en) * | 1994-01-07 | 1998-03-03 | Fujitsu Limited | Image generating apparatus |
CN101373483A (zh) * | 2007-08-20 | 2009-02-25 | 索尼株式会社 | 数据处理装置和数据处理方法 |
CN102054166A (zh) * | 2010-10-25 | 2011-05-11 | 北京理工大学 | 一种新的用于户外增强现实系统的场景识别技术 |
CN104794219A (zh) * | 2015-04-28 | 2015-07-22 | 杭州电子科技大学 | 一种基于地理位置信息的场景检索方法 |
Non-Patent Citations (1)
Title |
---|
SUN先生SHINEE: "图像检索:基于内容的图像检索技术", 《HTTPS://BLOG.CSDN.NET/U013087984/ARTICLE/DETAILS/52038980》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704514A (zh) * | 2017-08-31 | 2018-02-16 | 努比亚技术有限公司 | 一种照片管理方法、装置及计算机可读存储介质 |
CN110068328A (zh) * | 2018-01-22 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 导航路线生成方法、装置、计算机可读存储介质和计算机设备 |
CN110068328B (zh) * | 2018-01-22 | 2022-08-26 | 腾讯科技(深圳)有限公司 | 导航路线生成方法、装置、计算机可读存储介质和计算机设备 |
CN109272444A (zh) * | 2018-10-07 | 2019-01-25 | 朱钢 | 一种改善Ai智慧摄影场景优化策略的实现方法 |
CN109272444B (zh) * | 2018-10-07 | 2023-05-02 | 朱钢 | 一种改善Ai智慧摄影场景优化策略的实现方法 |
CN109272444B9 (zh) * | 2018-10-07 | 2023-06-30 | 朱钢 | 一种改善Ai智慧摄影场景优化策略的实现方法 |
CN115146103A (zh) * | 2022-09-01 | 2022-10-04 | 太平金融科技服务(上海)有限公司深圳分公司 | 图像检索方法、装置、计算机设备、存储介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN106528800B (zh) | 2019-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Plummer et al. | Enhancing video summarization via vision-language embedding | |
CN106331778B (zh) | 视频推荐方法和装置 | |
KR101382499B1 (ko) | 영상 태깅 방법 및 이를 사용하는 영상 재생 장치. | |
US11076206B2 (en) | Apparatus and method for manufacturing viewer-relation type video | |
CN100501742C (zh) | 表示图像组的方法和装置 | |
US8107689B2 (en) | Apparatus, method and computer program for processing information | |
CN102792680B (zh) | 媒体内容空间导航 | |
CN106528800A (zh) | 一种基于真实场景的影像生成方法及装置 | |
JP2003348559A (ja) | メディアコンテンツ記述をサポートする方法、システムおよびコンピュータ可読媒体 | |
US20180292956A1 (en) | Methods, systems, and media for creating and updating a group of media content items | |
US10891019B2 (en) | Dynamic thumbnail selection for search results | |
CN112507163B (zh) | 时长预测模型训练方法、推荐方法、装置、设备及介质 | |
KR101593991B1 (ko) | 컨텐트 추천 방법 및 그 장치 | |
CN103984778B (zh) | 一种视频检索方法及系统 | |
CN112000024B (zh) | 用于控制家电设备的方法及装置、设备 | |
US20170300502A1 (en) | Use of depth perception as indicator of search, user interest or preference | |
WO2016206035A1 (zh) | 一种信息推荐方法及用户终端 | |
US20050076055A1 (en) | Automatic question formulation from a user selection in multimedia content | |
US20160048595A1 (en) | Filtering Content Suggestions for Multiple Users | |
EP1357746A2 (en) | Describing media content in terms of degrees | |
JP2007318688A (ja) | 映像情報交換方法、サーバ装置、及びクライアント装置 | |
US20200092444A1 (en) | Playback method, playback device and computer-readable storage medium | |
CN104699832B (zh) | 一种相关信息确定方法及装置 | |
CN115665508A (zh) | 视频摘要生成的方法、装置、电子设备及存储介质 | |
Ejaz et al. | Video summarization by employing visual saliency in a sufficient content change method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |