CN118939823B - 一种面向文物数据的高效采集存储方法 - Google Patents
一种面向文物数据的高效采集存储方法 Download PDFInfo
- Publication number
- CN118939823B CN118939823B CN202410986106.7A CN202410986106A CN118939823B CN 118939823 B CN118939823 B CN 118939823B CN 202410986106 A CN202410986106 A CN 202410986106A CN 118939823 B CN118939823 B CN 118939823B
- Authority
- CN
- China
- Prior art keywords
- image
- shooting angle
- cultural relic
- display end
- description text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Image Processing (AREA)
Abstract
本发明涉及数据存储技术领域,具体公开了一种面向文物数据的高效采集存储方法,所述方法包括获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像;基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;接收展示端发送的备份请求,获取展示端信息,根据展示端信息在特征集中选取图像,发送至展示端;本发明获取文物在不同拍摄角度下的图像,并对图像进行下采样,得到多种不同精度的图像,根据展示端的游客数量发送不同精度的图像,可以有效地降低资源消耗量,在成本固定的前提下,展示了更多的图像,提高了展示完整度。
Description
技术领域
本发明涉及数据存储技术领域,具体是一种面向文物数据的高效采集存储方法。
背景技术
随着社会水平的提高,人们的精神需求越来越多,观赏文物就是其中一种满足精神需求的方式,现有的文物观赏过程一般是线下观赏,随着网络的普及,线上观赏逐渐成为了一种主流方式。
现有的线上观赏架构其实未做区分,对于一些独立的小展示端,如果小展示端的服务器性能不够,便会降低其展示内容,这会影响小展示端的展示完整度,实际上,这种展示完整度不够,非常影响用户观赏体验。
发明内容
本发明的目的在于提供一种面向文物数据的高效采集存储方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种面向文物数据的高效采集存储方法,所述方法包括:
获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像;所述拍摄角度由向量表示;
基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;同一特征集中不同图像的清晰度不同;
接收展示端发送的备份请求,获取展示端信息,根据展示端信息在特征集中选取图像,发送至展示端;其中,每个特征集中至少选取一张图像;
接收展示端反馈的需求信息,根据需求信息更新图像选取过程;其中,所述需求信息用于表征展示端的游客对文物的需求,需求包括拍摄角度和清晰度。
作为本发明进一步的方案:所述获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像的步骤包括:
获取文物的含有拍摄角度的图像及其描述文本;
对描述文本进行噪音剔除,对噪音剔除后的描述文本进行分词;
统计所有描述文本的分词结果,根据预设的排列规则对词语进行排序;
根据统计的词语总数确定赋值步长,基于赋值步长确定排序后的每个词语的值;其中,每个词语的值由三个参数确定,三个参数的取值范围均为0至255;
基于每个词语的值对每个描述文本进行转换,得到图层,插入图像,作为文物的以拍摄角度为索引的特征图像。
作为本发明进一步的方案:所述基于每个词语的值对每个描述文本进行转换,得到图层,插入图像,作为文物的以拍摄角度为索引的特征图像的步骤包括:
读取噪音剔除后的描述文本的分词结果,按照描述文本的行文顺序依次查询每个词语的值;
按照中心插值方式创建图层,当图层创建完成后,将图层插入图像,得到特征图像;
读取描述文本对应的图像的拍摄角度,作为所述特征图像的索引。
作为本发明进一步的方案:中心插值方式为:
以预设的原点为中心,按照顺时针顺序,绕原点对像素点位进行旋转编号;
在需要插值时,查询当前词语是分词后的文本中的第几个词,确定词序;
根据词序匹配对应编号,将值插入对应编号处。
作为本发明进一步的方案:所述基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集的步骤包括:
对每一个文物,在预设的文物备案表中查询文物级别;
读取文物的特征图像,根据拍摄角度和文物级别确定下采样步长;
基于所述下采样步长和预设的顶层图像尺寸对特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;
其中,下采样步长的确定过程为:
式中,D为下采样步长,α和β为预设的修正系数,为求取拍摄角度与标准六视图的法向量之间的向量差的模长的最小值;表示拍摄角度,表示标准六视图的法向量,共有六个;l为文物级别。
作为本发明进一步的方案:所述接收展示端发送的备份请求,获取展示端信息,根据展示端信息在特征集中选取图像,发送至展示端的步骤包括:
接收展示端发送的备份请求,向展示端发送信息查询请求,获取展示端反馈的游客数量;
根据所述游客数量确定最小图像清晰度;
基于最小图像清晰度在每个特征集中匹配基准图像,在清晰度大于所述基准图像的清晰度的图像中随机选取图像,发送至展示端;
其中,所述最小图像清晰度与游客数量呈正比。
作为本发明进一步的方案:所述接收展示端反馈的需求信息,根据需求信息更新图像选取过程的步骤包括:
向展示端发送评价信息获取请求,接收展示端反馈的对不同图像的评分;
当所述评分大于预设的第一阈值时,查询该图像对应的特征集,提高在该特征集中选取图像时的最小图像清晰度;
当所述评分小于预设的第二阈值时,查询该图像对应的特征集,提高在该特征集中选取图像时的图像选取数量。
作为本发明进一步的方案:所述方法还包括:
在与向任一展示端发送图像的过程中,发送端与接收端均实时获取传输参数和传输进度;
当所述传输进度达到预设的第一进度阈值时,暂停传输进程,根据所述传输参数确定加密码,基于所述加密码对图像进行加密,恢复传输进程;
当用户终端接收到加密后的目标文件时,基于传输参数和传输进度确定解密码,基于所述解密码对加密后的目标文件进行解密。
作为本发明进一步的方案:发送端与接收端均实时获取传输参数和传输进度的过程包括:
获取连接通道的网络带宽;
根据选取到的图像的大小和所述网络带宽计算预测传输速度;
根据所述预测传输速度和预设的采样点位数,确定采样节点;所述采样节点含有标号;
基于所述采样节点实时获取传输参数,根据所述标号对所述传输参数进行排序,生成参数表;所述参数表中含有标号项和传输参数项;
根据所述参数表中的标号项生成传输进度项。
作为本发明进一步的方案:根据所述传输参数确定加密码的步骤包括:
读取参数表,根据预设的加密矩阵库依次将所述参数表转换为加密参数表;
根据所述加密参数表生成拟合曲线组;
将所述拟合曲线组转换为曲线图像,根据预设的提取指标对所述曲线图像进行特征提取,得到特征区域;所述提取指标为时间的函数;
将所述特征区域输入训练好的加密码生成模型,得到加密码。
与现有技术相比,本发明的有益效果是:本发明获取文物在不同拍摄角度下的图像,并对图像进行下采样,得到多种不同精度的图像,根据展示端的游客数量发送不同精度的图像,可以有效地降低资源消耗量,使得成本固定的前提下,能够展示更多的图像,提高了展示完整度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为面向文物数据的高效采集存储方法的流程框图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为面向文物数据的高效采集存储方法的流程框图,本发明实施例中,一种面向文物数据的高效采集存储方法,所述方法包括:
步骤S100:获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像;所述拍摄角度由向量表示;
文物指的是某一个文物,对每个需要进行展示的文物,都需要进行同样的操作;获取文物的图像以及描述文本,在获取图像时,需要记录拍摄角度,所述拍摄角度顾名思义,表示从哪个角度拍摄文物,拍摄角度以向量进行表示。
关于拍摄角度,需要先确定一个笛卡尔三维坐标系,此时,每个面,都可以用一个法向量(三维向量)进行表示,拍摄图像时,镜头的中心线也可以用一个三维向量表示,这个向量就是拍摄角度。
进一步的,每个文物大都具有最基本的介绍信息,如果没有,就会采用默认文本,比如:“本文物未描述”,在本发明技术方案的架构下,将描述文本转换为一个图层,插入图像,每个拍摄角度的图像都对应一个描述文本,含有图层的拍摄到的图像称为特征图像。
步骤S200:基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;同一特征集中不同图像的清晰度不同;
由上述内容可以得知,拍摄角度表示了从哪个方向上拍摄文物,拍摄角度其实有很多,不同拍摄角度的重要性其实是不同的,像标准六视图(仰视图很少)对应的图像的重要性就会高一些,结合文物级别,可以得到每一张特征图像的重要程度,拍摄角度越接近标准六视图,重要程度越高,文物级别越高,重要程度越高。
基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,下采样过程是对图像进行简化的过程,下采样步长大,图像组的图像数量越少,选取空间越小;在向展示端进行发送时,该拍摄角度下的图像,只能在较小的范围内进行选取。
其中,下采样后的图像组称为特征集,特征集以拍摄角度为索引。
步骤S300:接收展示端发送的备份请求,获取展示端信息,根据展示端信息在特征集中选取图像,发送至展示端;其中,每个特征集中至少选取一张图像;
展示端是需要展示文物的端口,它可以理解为文物管理方许可的展示站点,展示端需要从文物管理方获取图像,进而进行线上展示,对于展示端来说,其实不需要展示过于清晰的图像,尤其是线上展示环节,可以展示数量极多的文物,如果对这些文物的图像进行简化,可以极大地缓解资源压力。
具体的,当接收展示端发送的备份请求时,获取展示端信息,所述展示端信息主要是展示端面向的游客数量,游客越多,清晰度需求越高,根据展示端信息在文物对应的所有拍摄角度下的特征集中选取图像,发送至展示端即可。
由于已经根据图像的重要性对特征集进行了不同程度的下采集,越重要的图像,选取的空间越大。
步骤S400:接收展示端反馈的需求信息,根据需求信息更新图像选取过程;其中,所述需求信息用于表征展示端的游客对文物的需求,需求包括拍摄角度和清晰度;
进一步的,接收展示端反馈的需求信息,根据需求信息更新图像选取过程,更新的内容包括选取的图像数量以及图像清晰度,所述图像清晰度由下采样程度确定,下采样次数越多,图像清晰度越低;其中,展示端反馈的需求信息实际上是展示端面向的客户上传的需求信息。
作为本发明技术方案的一个优选实施例,所述获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像的步骤包括:
获取文物的含有拍摄角度的图像及其描述文本;
对描述文本进行噪音剔除,对噪音剔除后的描述文本进行分词;
统计所有描述文本的分词结果,根据预设的排列规则对词语进行排序;
根据统计的词语总数确定赋值步长,基于赋值步长确定排序后的每个词语的值;其中,每个词语的值由三个参数确定,三个参数的取值范围均为0至255;
基于每个词语的值对每个描述文本进行转换,得到图层,插入图像,作为文物的以拍摄角度为索引的特征图像。
在本发明技术方案的一个实例中,对特征图像的生成过程进行了限定,具体如下:
获取文物的含有拍摄角度的图像及其描述文本,这对本申请来说,属于现有数据,获取过程并不复杂,对描述文本进行噪音剔除,对噪音剔除后的描述文本进行分词,噪音剔除的过程为删除文本中的无用符号或字符,如标点符号、数字,对描述文本进行分词的过程可以采用现有的词性识别方案,只要能够将文本转换为词语集合即可。
统计所有描述文本的分词结果,根据预设的排列规则对词语进行排序,需要说明的是,所有描述文本是所有文物的所有拍摄角度下的图像的描述文本,这一过程的目的是统计描述文本中可能出现哪些词,为了使得这些词更加有序,可以采用首字笔划进行排序,也即,上述排列规则。
根据统计的词语总数确定赋值步长,基于赋值步长确定排序后的每个词语的值这一步骤的目的是将词语转换为像素点的色值,色值有三个参数,比如RGB值,每个参数的取值范围均为0至255,这就有256*256*256种情况,远大于词语总数,足以用于表示不同词语;由256*256*256除以词语总数,得到赋值步长,也即,相邻词语对应的色值之间的差异,相邻词语的差异仅是一个参数的差异,其他两个参数大概率是相同的;这一过程在原理上并不复杂,就是将256*256*256种情况平均分配给所有词语,使得任意两个词语对应的色值具有尽量大的差异。
最后,当每个词语都对应一个色值后,基于每个词语的值对每个描述文本进行转换,即可得到图层,将图层插入图像后,作为文物的以拍摄角度为索引的特征图像。
作为本发明技术方案的一个优选实施例,所述基于每个词语的值对每个描述文本进行转换,得到图层,插入图像,作为文物的以拍摄角度为索引的特征图像的步骤包括:
读取噪音剔除后的描述文本的分词结果,按照描述文本的行文顺序依次查询每个词语的值;
按照中心插值方式创建图层,当图层创建完成后,将图层插入图像,得到特征图像;
读取描述文本对应的图像的拍摄角度,作为所述特征图像的索引。
在本发明技术方案的一个实例中,对图层生成过程进行了具体的描述,读取噪音剔除后的描述文本的分词结果,按照描述文本的行文顺序依次查询每个词语的值,行文顺序就是文本的字词排列顺序,按照中心插值方式创建图层,当图层创建完成后,将图层插入图像,得到特征图像;在特征图像中插入拍摄角度,作为索引。
具体的,中心插值方式为:
以预设的原点为中心,按照顺时针顺序,绕原点对像素点位进行旋转编号;
在需要插值时,查询当前词语是分词后的文本中的第几个词,确定词序;
根据词序匹配对应编号,将值插入对应编号处。
作为本发明技术方案的一个优选实施例,所述基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集的步骤包括:
对每一个文物,在预设的文物备案表中查询文物级别;
读取文物的特征图像,根据拍摄角度和文物级别确定下采样步长;
基于所述下采样步长和预设的顶层图像尺寸对特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;
其中,下采样步长的确定过程为:
式中,D为下采样步长,α和β为预设的修正系数,为求取拍摄角度与标准六视图的法向量之间的向量差的模长的最小值;表示拍摄角度,表示标准六视图的法向量,共有六个;l为文物级别。
在本发明技术方案的一个实例中,对下采样过程进行了限定,对每一个文物,在预设的文物备案表中查询文物级别,假设文物越重要,文物级别越高;读取文物的特征图像,每个文档都对应很多特征图像(每个拍摄角度下都存在一张特征图像),根据拍摄角度和文物级别确定下采样步长,拍摄角度越接近标准六视图,对应的图像越重要,下采样步长越小,在向展示端发送时,图像的选择空间越大;文物级别越高,对应的图像越重要,下采样步长越小,在向展示端发送时,图像的选择空间越大。
基于所述下采样步长和预设的顶层图像尺寸对特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;最后,每一张特征图像都会对应多张下采样后的图像,以图像组的形式进行留存。
其中,顶层图像尺寸是一个预设的尺寸,防止图像过小,因为下采样过程是不断地删除图像的行和列,图像会越来越小,过小的图像,比如只有个位数个像素点,它本身不具备展示意义,因此,需要有一个下采样的边界,也即,上述顶层图像尺寸。
作为本发明技术方案的一个优选实施例,所述接收展示端发送的备份请求,获取展示端信息,根据展示端信息在特征集中选取图像,发送至展示端的步骤包括:
接收展示端发送的备份请求,向展示端发送信息查询请求,获取展示端反馈的游客数量;
根据所述游客数量确定最小图像清晰度;
基于最小图像清晰度在每个特征集中匹配基准图像,在清晰度大于所述基准图像的清晰度的图像中随机选取图像,发送至展示端;
其中,所述最小图像清晰度与游客数量呈正比。
接收展示端发送的备份请求,向展示端发送信息查询请求,获取展示端反馈的游客数量,在这一过程中,将展示端信息限定为了游客数量,根据所述游客数量确定最小图像清晰度,然后,基于最小图像清晰度在每个特征集中匹配基准图像,在清晰度大于所述基准图像的清晰度的图像中随机选取图像,发送至展示端,这一过程的含义是,最小清晰度确定后,在不低于最小清晰度的范围内,随机选取图像,选取的个数至少为一,发送至展示端。
需要说明的是,游客数量越多,说明对应的展示端的曝光度越高,此时,最小图像清晰度就要大一些,使得随机选取的图像更加清晰。
作为本发明技术方案的一个优选实施例,所述接收展示端反馈的需求信息,根据需求信息更新图像选取过程的步骤包括:
向展示端发送评价信息获取请求,接收展示端反馈的对不同图像的评分;
当所述评分大于预设的第一阈值时,查询该图像对应的特征集,提高在该特征集中选取图像时的最小图像清晰度;
当所述评分小于预设的第二阈值时,查询该图像对应的特征集,提高在该特征集中选取图像时的图像选取数量。
关于图像选取过程的更新阶段,向展示端发送评价信息获取请求,接收展示端反馈的对不同图像的评分,所述评分其实是展示端的游客对每张图像的评分,当所述评分大于预设的第一阈值时,表示该图像更加受到游客的欢迎,此时,查询该图像对应的特征集,提高在该特征集中选取图像时的最小图像清晰度,使得下一次选取的图像更加清晰。
当所述评分小于预设的第二阈值时,说明游客不喜欢这张图像,可能是不喜欢拍摄角度,也有可能是对清晰度不满意,此时,需要在该拍摄角度下多选几张图像,尽量让游客满意,具体操作过程为查询该图像对应的特征集,提高在该特征集中选取图像时的图像选取数量。
作为本发明技术方案的一个优选实施例,所述方法还包括:
在与向任一展示端发送图像的过程中,发送端与接收端均实时获取传输参数和传输进度;
当所述传输进度达到预设的第一进度阈值时,暂停传输进程,根据所述传输参数确定加密码,基于所述加密码对图像进行加密,恢复传输进程;
当用户终端接收到加密后的目标文件时,基于传输参数和传输进度确定解密码,基于所述解密码对加密后的目标文件进行解密。
文物数据在向展示端发送的过程中,需要进行加密,当传输进度达到一定程度时,比如达到90%的时候,根据文件传输参数对文件进行加密,这一加密过程是基于传输参数的,所述传输参数只有服务端和用户终端能够获取,安全性极高;加密过程与解密过程互为逆过程,在同一技术方案下,两者应该同时设计。
进一步的,发送端与接收端均实时获取传输参数和传输进度的过程包括:
获取连接通道的网络带宽;
根据选取到的图像的大小和所述网络带宽计算预测传输速度;
根据所述预测传输速度和预设的采样点位数,确定采样节点;所述采样节点含有标号;
基于所述采样节点实时获取传输参数,根据所述标号对所述传输参数进行排序,生成参数表;所述参数表中含有标号项和传输参数项;
根据所述参数表中的标号项生成传输进度项。
传输过程是实时变化的,采样的颗粒度越小,计算资源的需求越大,因此,需要对采样的颗粒度进行具体的设计;具体的方案为:根据需要传输的图像的大小和网络平均传输速度(连接通道的网络带宽)可以确定预测传输时长,再根据预设的采样点位的点位数量可以对所述预测传输时长进行切分,确定采样节点。
具体的,根据所述传输参数确定加密码的步骤包括:
读取参数表,根据预设的加密矩阵库依次将所述参数表转换为加密参数表;
根据所述加密参数表生成拟合曲线组;
将所述拟合曲线组转换为曲线图像,根据预设的提取指标对所述曲线图像进行特征提取,得到特征区域;所述提取指标为时间的函数;
将所述特征区域输入训练好的加密码生成模型,得到加密码。
上述内容对加密码的生成过程进行了具体的限定,首先,读取含有传输参数和传输进度的参数表,然后对参数表进行加密,加密的过程就是通过预设的加密矩阵对参数表中的数据进行转换;最后,根据转换后的参数表生成拟合曲线组;其中,所述拟合曲线组中包含特征信息。
然后,将拟合曲线组转换为一张曲线图像,借助图像处理技术,可以提取某些区域,提取的方式(提取指标)是预先设置的;然后,根据这些特征区域就可以生成一个加密码,这一过程包含多个步骤,每个步骤的计算量都不大,多个步骤保证了安全性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种面向文物数据的高效采集存储方法,其特征在于,所述方法包括:
获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像;所述拍摄角度由向量表示;
基于所述拍摄角度以及文物级别对每一特征图像进行下采样,得到图像组,作为文物的以拍摄角度为索引的特征集;同一特征集中不同图像的清晰度不同;
接收展示端发送的备份请求,获取展示端信息,根据展示端信息在特征集中选取图像,发送至展示端;其中,每个特征集中至少选取一张图像;
接收展示端反馈的需求信息,根据需求信息更新图像选取过程;其中,所述需求信息用于表征展示端的游客对文物的需求,需求包括拍摄角度和清晰度;
所述获取文物的含有拍摄角度的图像及其描述文本,将描述文本转换为图层,插入图像,作为文物的以拍摄角度为索引的特征图像的步骤包括:
获取文物的含有拍摄角度的图像及其描述文本;
对描述文本进行噪音剔除,对噪音剔除后的描述文本进行分词;
统计所有描述文本的分词结果,根据预设的排列规则对词语进行排序;
根据统计的词语总数确定赋值步长,基于赋值步长确定排序后的每个词语的值;其中,每个词语的值由三个参数确定,三个参数的取值范围均为0至255;
基于每个词语的值对每个描述文本进行转换,得到图层,插入图像,作为文物的以拍摄角度为索引的特征图像;
所述基于每个词语的值对每个描述文本进行转换,得到图层,插入图像,作为文物的以拍摄角度为索引的特征图像的步骤包括:
读取噪音剔除后的描述文本的分词结果,按照描述文本的行文顺序依次查询每个词语的值;
按照中心插值方式创建图层,当图层创建完成后,将图层插入图像,得到特征图像;
读取描述文本对应的图像的拍摄角度,作为所述特征图像的索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410986106.7A CN118939823B (zh) | 2024-07-23 | 2024-07-23 | 一种面向文物数据的高效采集存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410986106.7A CN118939823B (zh) | 2024-07-23 | 2024-07-23 | 一种面向文物数据的高效采集存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118939823A CN118939823A (zh) | 2024-11-12 |
CN118939823B true CN118939823B (zh) | 2025-04-25 |
Family
ID=93350930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410986106.7A Active CN118939823B (zh) | 2024-07-23 | 2024-07-23 | 一种面向文物数据的高效采集存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118939823B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473114A (zh) * | 2023-09-26 | 2024-01-30 | 易元数字(北京)科技集团有限公司 | 基于多模态表示学习模型的文物图像检索方法及装置 |
CN118154773A (zh) * | 2024-01-26 | 2024-06-07 | 深圳曜映科技有限公司 | 三维建模、三维场景显示方法、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670399A (zh) * | 2018-11-12 | 2019-04-23 | 万瞳(南京)科技有限公司 | 基于计算机视觉的博物馆展品图像识别方法及系统 |
US11610337B2 (en) * | 2019-02-17 | 2023-03-21 | Purdue Research Foundation | Calibration of cameras and scanners on UAV and mobile platforms |
CN113449135B (zh) * | 2021-08-31 | 2021-11-19 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像生成系统与方法 |
CN117911606A (zh) * | 2023-10-24 | 2024-04-19 | 北京浩宇天地测绘科技发展有限公司 | 一种基于三维模型的立体文物纹样提取方法、系统及设备 |
CN117331470B (zh) * | 2023-10-24 | 2024-06-18 | 北京蜂鸟映像电子商务有限公司 | 线上虚拟现实图像展示方法、系统、电子设备及存储介质 |
-
2024
- 2024-07-23 CN CN202410986106.7A patent/CN118939823B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473114A (zh) * | 2023-09-26 | 2024-01-30 | 易元数字(北京)科技集团有限公司 | 基于多模态表示学习模型的文物图像检索方法及装置 |
CN118154773A (zh) * | 2024-01-26 | 2024-06-07 | 深圳曜映科技有限公司 | 三维建模、三维场景显示方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN118939823A (zh) | 2024-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8385660B2 (en) | Mixed media reality indexing and retrieval for repeated content | |
US8868555B2 (en) | Computation of a recongnizability score (quality predictor) for image retrieval | |
CN104050247B (zh) | 实现海量视频快速检索的方法 | |
US20090074300A1 (en) | Automatic adaption of an image recognition system to image capture devices | |
US20090070415A1 (en) | Architecture for mixed media reality retrieval of locations and registration of images | |
CN108197265A (zh) | 一种基于短视频搜索完整视频的方法及系统 | |
CN112836509A (zh) | 一种专家系统知识库构建方法及系统 | |
CN101021855A (zh) | 基于内容的视频检索系统 | |
CN102737029A (zh) | 搜索方法及系统 | |
CN113343012B (zh) | 一种新闻配图方法、装置、设备及存储介质 | |
CN114972506B (zh) | 一种基于深度学习和街景图像的图像定位方法 | |
Dey et al. | Learning cross-modal deep embeddings for multi-object image retrieval using text and sketch | |
CN116244464A (zh) | 一种基于多模态数据融合的手绘图像实时检索方法 | |
CN109815199A (zh) | 一种图片压缩算法的选取方法及装置 | |
CN118097374A (zh) | 产品外观图像生成方法及装置,相似图像检索方法及装置 | |
CN116955707A (zh) | 内容标签的确定方法、装置、设备、介质及程序产品 | |
Kanzariya et al. | Coverless information hiding: a review | |
CN111324766A (zh) | 一种基于lbp特征的加密图像检索方法 | |
CN118939823B (zh) | 一种面向文物数据的高效采集存储方法 | |
CN111581421A (zh) | 图像检索方法、图像检索装置及图像检索系统 | |
JP6267830B2 (ja) | 画像処理を応用した文書構造解析装置 | |
CN115204436A (zh) | 检测业务指标异常原因的方法、装置、设备及介质 | |
JP2004192555A (ja) | 情報管理方法、情報管理装置及び情報管理プログラム | |
JP2001229382A (ja) | 情報蓄積装置,情報検索装置および情報蓄積方法,情報検索方法並びにこれらの方法を記録した記録媒体 | |
CN112989086B (zh) | 一种城市管理图像智能识别分类系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |