CN107766430B - 一种文件搜索方法及系统 - Google Patents
一种文件搜索方法及系统 Download PDFInfo
- Publication number
- CN107766430B CN107766430B CN201710841264.3A CN201710841264A CN107766430B CN 107766430 B CN107766430 B CN 107766430B CN 201710841264 A CN201710841264 A CN 201710841264A CN 107766430 B CN107766430 B CN 107766430B
- Authority
- CN
- China
- Prior art keywords
- private cloud
- storage device
- client
- module
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种文件搜索方法及系统,所述方法包括以下步骤:S1,私有云识别存储设备中的文件的内容或属性,并根据识别出的信息进行标注标签化;或者在将文件备份至存储设备中时,利用私有云识别文件的内容或属性,并根据识别出的信息进行标注标签化;其中,所述的存储设备和客户端上均运行有私有云平台;S2,将存储设备的ID与用户账号进行绑定;S3,客户端利用用户账号登陆私有云平台,通过所述的私有云平台访问存储设备,验证通过后,根据单个标签或标签的组合进行文件搜索。本发明通过利用私有云识别文件的内容或属性,并根据识别出的信息进行标注标签化,从而可以利用单个标签或标签的组合进行文件搜索,实现了利用私有云进行智能化的文件搜索,搜索效率和准确率均较高。
Description
技术领域
本发明涉及一种文件搜索方法及系统,属于图片搜索技术领域。
背景技术
存储设备通常会用来存储各种各样的文件,比如图片、文档、视频等,当存储的文件较多时,进行具体文件的查找时就比较麻烦。通常来说,只能手动对存储设备中的文件进行分类,不仅花费的时间较长,而且进行具体文件的查找时也比较麻烦,需要打开文件夹,逐个文件进行查找。无法实现智能化查找。
发明内容
本发明的目的在于,提供一种文件搜索方法及系统,可以实现智能化文件搜索,搜索准确率和效率较高。
为解决上述技术问题,本发明采用如下的技术方案:一种文件搜索方法,包括以下步骤:
S1,私有云(可以是存储设备中的私有云平台或者是私有云服务器)识别存储设备中的文件的内容或属性,并根据识别出的信息进行标注标签化;或者在将文件备份至存储设备中时,利用私有云(可以是客户端上的私有云平台或存储设备上的私有云平台或私有云服务器)识别文件的内容或属性,并根据识别出的信息进行标注标签化;其中,所述的存储设备和客户端上均运行有私有云平台;
S2,将存储设备的ID与用户账号进行绑定;
S3,客户端利用用户账号登陆私有云平台,通过所述的私有云平台访问存储设备,验证通过后,根据单个标签或标签的组合进行文件搜索。
步骤S2还包括:客户端通过私有云平台发送用户账号与存储设备ID的绑定请求,存储设备的私有云平台判断所述的存储设备ID是否被绑定过,如果已被绑定过,则拒绝该绑定请求;如果未被绑定过,则同意该绑定请求;用户账号与存储设备ID进行绑定后,客户端、存储设备保存该绑定关系;私有云服务器更新用户账号与存储设备ID的对应绑定关系列表,从而避免了非法访问存储设备的数据,保证了数据的安全性。
优选的,步骤S1包括:
私有云识别图片中的地点、人物、场景、文字,并对识别到的信息进行标注标签化,或手动设置标签,或与互联网上的已标记过的图片进行对比然后设置标签,从而使得搜索的时候可以更精确的搜到所需文件。
前述的文件搜索方法,步骤S1还包括:
S11,根据用户账号、存储设备ID及文件存储路径生成各个图片的MD5值;
S12,私有云对所述MD5值对应的图片进行识别并标注相应的标签。
通过以上方法,从而可以准确的识别每一张图片,并返回标签,避免了打错标签的现象发生。
优选的,进行场景识别时,私有云通过调用多个图片处理厂家的API对图片中的场景进行识别,然后采用少数服从多数的原则确定最终识别的场景,从而可以提高场景识别的准确率,进而提高图片搜索的准确率;另外,通过利用图片的MD5值,从而避免了多个厂家的API对图片的识别结果混淆,保证了图片场景识别的准确率。
本发明中,可以在拍照时开启定位功能,然后通过图片的exif区域快速准确的识别图片中的拍摄地点;也可以根据图片中的文字标识快速的识别图片的拍摄地点。
通过光学文字识别技术(即ORC技术)识别图片中的文字,从而可以实现对证件(如身份证、名片、行驶证、驾驶证、银行卡、营业执照等)类照片进行快速、准确的识别,进而标注标准的标签。
优选的,步骤S1还包括:根据人物相似度将图片进行分组;当存入一张新图片后,将该新图片与历史图片进行相似度对比,然后存入相应的分组中,从而方便进行查看。
步骤S1还包括:私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息,然后进行标注标签化。从而可以对存储设备中的视频文件进行准确的搜索。
优选的,步骤S1中还包括:对文件进行处理,分别生成相应的软链接和缩略图,并将所述的软链接和缩略图进行关联;当客户端进行文件搜索时,根据文件对应的标签,将所述的缩略图反馈至客户端,从而进行远程数据读取时,可以提高图片数据的读取效率。
优选的,步骤S1还包括,在将文件备份至存储设备中时,私有云服务器通过私有云平台获取客户端和存储设备的配置信息,并根据二者的性能和绑定关系,利用贝叶斯算法及决策数算法派发相应的任务给客户端或存储设备进行处理(比如对照片、视频进行标注标签化),从而可以根据客户端和存储设备的配置信息,自动分配处理任务,提高资源的利用效率。
优选的,步骤S2包括:客户端发出广播,处于同一局域网的存储设备反馈回自身的ID信息,客户端根据所述的ID信息,将存储设备的ID与客户端账号进行绑定;(相比于UPNP等方式)从而可以通过设定某些字段来进行搜索,搜索效率非常高,而且干扰较少,提高了绑定效率。
或者优选的,当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后将存储设备的ID与客户端账号进行绑定,从而可以实现客户端与存储设备简单、快捷的进行绑定。
或者优选的,利用LDAP技术建立多个独立账号并分别与存储设备的ID进行绑定,同时使得存储设备中分配与各个独立账号对应的独立的存储空间;或者通过设置主账号及子账号,分别建立所述主账号及子账号与存储设备ID的绑定关系,从而可以实现多人平等的或具有不同权限的对同一个存储设备的数据进行安全存取。
步骤S3还包括:通过NFC触发实现客户端与存储设备连接,具体包括:客户端通过NFC模块将客户端账号和存储设备ID的绑定关系及连接请求发送至存储设备,存储设备的私有云平台进行信息核实并同意连接后,将其WIFI信息反馈给客户端,其中,所述的存储设备上设有WIFI模块;从而实现了客户端与存储设备的WIFI连接,方便快捷。
上述的文件搜索方法中,步骤S3中,若客户端与存储设备处于不同的网络中,则通过以下方法进行远程文件读取和搜索:
S31,客户端利用账号登陆私有云平台,通过所述的私有云平台向私有云服务器发送数据访问请求;存储设备利用外部网络通过私有云平台将其域名发送至私有云服务器;
S32,私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;
S33,客户端根据所述的存储设备的域名通过私有云平台访问存储设备,进行远程数据读取和搜索。
通过以上方法,从而实现了远程文件的搜索和读取,方便快捷;而且同时保证了数据访问的安全性。
本发明中,若客户端与存储设备处于同一个局域网,则客户端直接访问存储设备的IP地址,实现对存储设备中的数据进行读取和搜索。
优选的,步骤S3中,当客户端搜索图片时,采用RTSP技术将图片打包成流媒体进行传输,使得传输高效且稳定。
一种文件搜索系统,包括:
第一内容或属性识别模块,用于私有云(可以是存储设备中的私有云平台或者是私有云服务器)识别存储设备中的文件的内容或属性;其中,存储设备上均运行有私有云平台;
第一标签标注模块,用于根据识别出的信息进行标注标签化;
或者包括:
第二内容或属性识别模块:用于在将文件备份至存储设备中时,利用私有云(可以是客户端上的私有云平台或存储设备上的私有云平台或私有云服务器)识别文件的内容或属性;
其中,存储设备和客户端上均运行有私有云平台;
第二标签标注模块,用于在将文件备份至存储设备中时,根据识别出的信息进行标注标签化;
还包括:
绑定模块,用于将存储设备的ID与用户账号进行绑定;
登录模块,用于客户端利用用户账号登陆私有云平台;
存储设备访问模块,用于客户端通过所述的私有云平台访问存储设备;
文件搜索模块,用于验证通过后,根据单个标签或标签的组合进行文件搜索。
优选的,还包括:
判断模块,用于当客户端通过私有云平台发送用户账号与存储设备ID的绑定请求时,存储设备的私有云平台判断所述的存储设备ID是否被绑定过;如果已被绑定过,则拒绝该绑定请求;如果未被绑定过,则同意该绑定请求;
绑定关系存储模块,用于用户账号与存储设备ID进行绑定后,客户端、存储设备保存该绑定关系;
绑定关系列表更新模块,用于用户账号与存储设备ID进行绑定后,私有云服务器更新用户账号与存储设备ID的对应绑定关系列表。
优选的,所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
MD5值生成模块,用于根据用户账号、存储设备ID及文件存储路径生成各个图片的MD5值;
图片识别及第一标签标注模块,用于私有云对所述MD5值对应的图片进行识别。
优选的,所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
API调用模块,用于进行场景识别时,私有云通过调用多个图片处理厂家的API对图片中的场景进行识别;
场景确定模块,用于采用少数服从多数的原则确定最终识别的场景。
上述的文件搜索系统中,所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
拆解及信息获取模块,用于私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息。
优选的,还包括:
软链接和缩略图生成模块,用于对文件进行处理,分别生成相应的软链接和缩略图;
数据关联模块,用于将所述的软链接和缩略图进行关联;
反馈模块,用于当客户端进行文件搜索时,根据文件对应的标签,将所述的缩略图反馈至客户端。
优选的,还包括:
配置信息获取模块,用于在将文件备份至存储设备中时,私有云服务器通过私有云平台获取客户端和存储设备的配置信息;
任务派发模块,用于根据客户端和存储设备的性能和绑定关系,利用贝叶斯算法及决策数算法派发相应的任务给客户端或存储设备进行处理。
优选的,所述的绑定模块包括:
广播发送模块,用于客户端发出广播;
ID信息反馈模块,用于处于同一局域网的存储设备反馈回自身的ID信息;
A绑定模块,用于客户端根据所述的ID信息,将存储设备的ID与客户端账号进行绑定;
或者所述的绑定模块包括:
B绑定模块,用于当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后将存储设备的ID与客户端账号进行绑定;
或者所述的绑定模块包括:
多账号绑定模块,用于利用LDAP技术建立多个独立账号并分别与存储设备的ID进行绑定;
存储空间分配模块,用于存储设备分配与各个独立账号对应的独立的存储空间;
或者所述的绑定模块包括:
主账号及子账号绑定模块,用于建立主账号及子账号与存储设备ID的绑定关系。
本发明还包括:
连接请求发送模块,用于客户端通过NFC模块将客户端账号和存储设备ID的绑定关系及连接请求发送至存储设备,
WIFI信息反馈模块,用于存储设备的私有云平台进行信息核实并同意连接后,将其WIFI信息反馈给客户端,实现客户端与存储设备的WIFI连接。
前述的文件搜索系统中,所述的存储设备访问模块包括:
客户端远程访问模块,用于若客户端与存储设备处于不同的网络中,客户端利用账号登陆私有云平台,通过所述的私有云平台向私有云服务器发送数据访问请求;
存储设备远程访问模块,用于存储设备利用外部网络通过私有云平台将其域名发送至私有云服务器;
域名反馈模块,用于私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;
远程数据读取和搜索模块,用于客户端根据所述的存储设备的域名通过私有云平台访问存储设备,进行远程数据读取和搜索。
优选的,所述的文件搜索模块包括:当客户端搜索图片时,采用RTSP技术将图片打包成流媒体进行传输。
与现有技术相比,本发明具有以下优点:
1、通过私有云(可以是存储设备中的私有云平台或者是私有云服务器)识别存储设备中的文件的内容或属性,并根据识别出的信息进行标注标签化,从而可以利用单个标签或标签的组合进行文件搜索,实现了利用私有云进行智能化的文件搜索,搜索效率和准确率均较高;
2、私有云通过调用多个图片处理厂家的API对图片中的场景进行识别,然后采用少数服从多数的原则确定最终识别的场景,从而可以提高场景识别的准确率,进而提高图片搜索的准确率;
3、通过生成MD5值,私有云对所述MD5值对应的图片进行识别并打相应的标签,从而可以准确的识别每一张图片,并返回标签,避免了打错标签的现象发生,尤其是采用多个图片处理厂家的API对图片中的场景进行识别时,通过利用各个图片的MD5值,从而可以避免打错标签的现象发生;
4、通过私有云服务器获取存储设备的域名,从而实现了远程文件的搜索和读取,方便快捷;而且同时保证了数据访问的安全性;
5、通过图片的exif区域快速准确的识别图片中的拍摄地点;也可以根据图片中的文字标识快速的识别图片的拍摄地点;
6、通过利用私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息,然后进行标注标签化。从而可以对存储设备中的视频文件进行准确的搜索;
7、通过利用客户端发出广播,处于同一局域网的存储设备反馈回自身的ID信息,客户端根据所述的ID信息,将存储设备与客户端进行绑定,从而提高了绑定效率;
8、当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后与存储设备进行绑定,实现了快捷、高效的绑定。
附图说明
图1是本发明的一种实施例的工作流程图。
下面结合附图和具体实施方式对本发明作进一步的说明。
具体实施方式
本发明的实施例:一种文件搜索方法,如图1所示,包括以下步骤:
S1,私有云(可以是存储设备中的私有云平台或者是私有云服务器)识别存储设备中的文件的内容或属性,并根据识别出的信息进行标注标签化;或者在将文件备份至存储设备中时,利用私有云(可以是客户端上的私有云平台或存储设备上的私有云平台或私有云服务器)识别文件的内容或属性,并根据识别出的信息进行标注标签化;其中,所述的存储设备和客户端上均运行有私有云平台;
S2,将存储设备的ID与用户账号进行绑定;
S3,客户端利用用户账号登陆私有云平台,通过所述的私有云平台访问存储设备,验证通过后,根据单个标签或标签的组合进行文件搜索。
为了对图片进行标签化,步骤S1可以包括:
私有云识别图片中的地点、人物、场景、文字,并对识别到的信息进行标注标签化,或手动设置标签,或与互联网上的已标记过的图片进行对比然后设置标签。
为了避免图片混淆,步骤S1还可以包括:
S11,根据用户账号、存储设备ID及文件存储路径生成各个图片的MD5值;
S12,私有云对所述MD5值对应的图片进行识别并标注相应的标签。
为了提高场景识别的准确率,进行场景识别时,私有云可以通过调用多个图片处理厂家的API对图片中的场景进行识别,然后采用少数服从多数的原则确定最终识别的场景;通过图片的exif区域识别图片中的地点;通过光学文字识别技术(即ORC技术)识别图片中的文字。
为了提高视频搜索的准确率和效率,步骤S1还可以包括:私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息,然后进行标注标签化。
为了提高远程数据读取和搜索的效率,步骤S1中还包括:对文件进行处理,分别生成相应的软链接和缩略图,并将所述的软链接和缩略图进行关联;当客户端进行文件搜索时,根据文件对应的标签,将所述的缩略图反馈至客户端。
为了提高资源的利用率,步骤S1还包括,在将文件备份至存储设备中时,私有云服务器通过私有云平台获取客户端和存储设备的配置信息,并根据二者的性能和绑定关系,利用贝叶斯算法及决策数算法派发相应的任务给客户端或存储设备进行处理。
为了提高绑定的效率,,步骤S2包括:客户端发出广播,处于同一局域网的存储设备反馈回自身的ID信息,客户端根据所述的ID信息,将存储设备的ID与客户端账号进行绑定。
为了更方便、快捷的实现绑定,当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后将存储设备的ID与客户端账号进行绑定。
为了实现多人使用同一个存储设备并保证数据的安全性,可以利用LDAP技术建立多个独立账号并分别与存储设备的ID进行绑定,同时使得存储设备中分配与各个独立账号对应的独立的存储空间;或者通过设置主账号及子账号,分别建立所述主账号及子账号与存储设备ID的绑定关系。
为了实现文件的远程搜索及读取,步骤S3中,若客户端与存储设备处于不同的网络中,则通过以下方法进行远程文件读取和搜索:
S31,客户端利用账号登陆私有云平台,通过所述的私有云平台向私有云服务器发送数据访问请求;存储设备利用外部网络通过私有云平台将其域名发送至私有云服务器;
S32,私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;
S33,客户端根据所述的存储设备的域名通过私有云平台访问存储设备,进行远程数据读取和搜索。
为了实现图片稳定高效的传输,步骤S3中,当客户端搜索图片时,可以采用RTSP技术将图片打包成流媒体进行传输。
一种文件搜索系统,包括:
第一内容或属性识别模块,用于私有云(可以是存储设备中的私有云平台或者是私有云服务器)识别存储设备中的文件的内容或属性;其中,存储设备上均运行有私有云平台;
第一标签标注模块,用于根据识别出的信息进行标注标签化;
或者包括:
第二内容或属性识别模块:用于在将文件备份至存储设备中时,利用私有云(可以是客户端上的私有云平台或存储设备上的私有云平台或私有云服务器)识别文件的内容或属性;
其中,存储设备和客户端上均运行有私有云平台;
第二标签标注模块,用于在将文件备份至存储设备中时,根据识别出的信息进行标注标签化;
还包括:
绑定模块,用于将存储设备的ID与用户账号进行绑定;
登录模块,用于客户端利用用户账号登陆私有云平台;
存储设备访问模块,用于客户端通过所述的私有云平台访问存储设备;文件搜索模块,用于验证通过后,根据单个标签或标签的组合进行文件搜索。
所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
MD5值生成模块,用于根据用户账号、存储设备ID及文件存储路径生成各个图片的MD5值;
图片识别及第一标签标注模块,用于私有云对所述MD5值对应的图片进行识别。
所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
API调用模块,用于进行场景识别时,私有云通过调用多个图片处理厂家的API对图片中的场景进行识别;
场景确定模块,用于采用少数服从多数的原则确定最终识别的场景。
所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
拆解及信息获取模块,用于私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息。
本发明还包括:
软链接和缩略图生成模块,用于对文件进行处理,分别生成相应的软链接和缩略图;
数据关联模块,用于将所述的软链接和缩略图进行关联;
反馈模块,用于当客户端进行文件搜索时,根据文件对应的标签,将所述的缩略图反馈至客户端。
本发明还包括:
配置信息获取模块,用于在将文件备份至存储设备中时,私有云服务器通过私有云平台获取客户端和存储设备的配置信息;
任务派发模块,用于根据客户端和存储设备的性能和绑定关系,利用贝叶斯算法及决策数算法派发相应的任务给客户端或存储设备进行处理。
所述的绑定模块包括:
广播发送模块,用于客户端发出广播;
ID信息反馈模块,用于处于同一局域网的存储设备反馈回自身的ID信息;
A绑定模块,用于客户端根据所述的ID信息,将存储设备的ID与客户端账号进行绑定;
或者所述的绑定模块包括:
B绑定模块,用于当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后将存储设备的ID与客户端账号进行绑定;
或者所述的绑定模块包括:
多账号绑定模块,用于利用LDAP技术建立多个独立账号并分别与存储设备的ID进行绑定;
存储空间分配模块,用于存储设备分配与各个独立账号对应的独立的存储空间;
或者所述的绑定模块包括:
主账号及子账号绑定模块,用于建立主账号及子账号与存储设备ID的绑定关系。
所述的存储设备访问模块包括:
客户端远程访问模块,用于若客户端与存储设备处于不同的网络中,客户端利用账号登陆私有云平台,通过所述的私有云平台向私有云服务器发送数据访问请求;
存储设备远程访问模块,用于存储设备利用外部网络通过私有云平台将其域名发送至私有云服务器;
域名反馈模块,用于私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;
远程数据读取和搜索模块,用于客户端根据所述的存储设备的域名通过私有云平台访问存储设备,进行远程数据读取和搜索。
所述的文件搜索模块包括:当客户端搜索图片时,采用RTSP技术将图片打包成流媒体进行传输。
本发明的一种实施例的工作原理:
假设有AB两个存储设备,里面均存储有大量的图片,为了方便对图片进行搜索,利用本发明的技术进行处理。所述的AB两个存储设备中均运行有私有云平台。
假设A存储设备是张三的,B存储设备是李四的。那么可根据用户账号(也即张三李四登陆私有云平台的ID)、存储设备ID及文件存储路径生成各个图片的MD5值;私有云(可以是张三、李四的存储设备中的私有云平台或者单独的私有云服务器或者张三、李四的客户端中的私有云平台,根据设备的性能决定在哪个设备进行处理)对所述MD5值对应的图片中的地点、人物、场景、文字进行识别并打相应的标签(一个图片根据识别的地点、人物、场景、文字,可以对应的打多个标签)。具体的,进行场景识别时,为了提高识别的准确率,私有云通过调用多个图片处理厂家的API对图片中的场景进行识别,然后采用少数服从多数的原则确定最终识别的场景(比如有一张图片,3家API识别的是海,1家识别的是湖,则最终确定的场景就是海)。可通过光学文字识别技术(即ORC技术)识别图片中的文字(比如识别身份证、名片、行驶证、驾驶证、银行卡、营业执照等之类的证件),可以通过图片的exif区域识别图片中的地点。那么比如搜北海时,可以搜索出场景都是水的照片,再结合拍摄照片的地点即可准确的搜索到照片。如果某个地点还具有别称,则可设置多个标签。
为了方便查看,还可以根据人物相似度将图片进行分组;当存入新的图片后,私有云生成此图片的MD5,然后进行图片的人物识别,人物识别是将此图片上的人物和之前已经分组好的人物进行一一对比,找到相似度最高的一个,比如如果相似度大于80,则进行合并,如果小于80,则新建一个人物分类。然后进行场景识别,对多个图片处理厂家api数据的结果进行判断,以少数服从多数的原则确定最终的识别场景。然后进行文字识别,识别图片中是否有可识别的文字,进行内容标签化,还可以对照片的地点进行识别然后标签化。需要对以上的识别结果分别进行标签化。各步骤中没有识别到的内容则不打标签。还可以手动设置标签,比如对标签为宝宝的照片,可以手动标注大宝、二宝,私有云进行自动学习后,下次存入宝宝照片后,不仅可以具有宝宝的标签,还可以同时具有大宝、二宝的标签。
图片打标签后,客户端可根据单个标签或是标签的组合进行图片搜索(比如可以搜索标签海,或者搜索标签海+宝宝),若客户端与存储设备处于不同的网络中,则通过以下方法进行远程文件搜索和读取:客户端通过用户账号登陆私有云平台并向私有云服务器发送数据读取和搜索请求;存储设备通过外部网络访问私有云平台,并将其域名通过私有云平台发送至私有云服务器;私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;客户端根据所述的存储设备的域名访问存储设备,进行远程文件读取和搜索。
Claims (6)
1.一种文件搜索方法,其特征在于,包括以下步骤:
S1,私有云识别存储设备中的文件的内容或属性,并根据识别出的信息进行标注标签化;或者在将文件备份至存储设备中时,利用私有云识别文件的内容或属性,并根据识别出的信息进行标注标签化;其中,所述的存储设备和客户端上均运行有私有云平台;具体包括:
私有云识别图片中的地点、人物、场景、文字,并对识别到的信息进行标注标签化,或手动设置标签,或与互联网上的已标记过的图片进行对比然后设置标签;其中,通过图片的exif区域识别图片中的地点;通过光学文字识别技术识别图片中的文字;通过以下方式识别图片中的场景:
S11,根据用户账号、存储设备ID及文件存储路径生成各个图片的MD5值;
S12,私有云通过调用多个图片处理厂家的API对所述MD5值对应的图片中的场景进行识别;然后采用少数服从多数的原则确定最终识别的场景;
私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息,然后进行标注标签化;
S2,将存储设备的ID与用户账号进行绑定;
S3,客户端利用用户账号登陆私有云平台,通过所述的私有云平台访问存储设备,验证通过后,根据单个标签或标签的组合进行文件搜索;若客户端与存储设备处于不同的网络中,则通过以下方法进行远程文件读取和搜索:
S31,客户端利用账号登陆私有云平台,通过所述的私有云平台向私有云服务器发送数据访问请求;存储设备利用外部网络通过私有云平台将其域名发送至私有云服务器;
S32,私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;
S33,客户端根据所述的存储设备的域名通过私有云平台访问存储设备,进行远程数据读取和搜索。
2.根据权利要求1所述的文件搜索方法,其特征在于,步骤S1中还包括:对文件进行处理,分别生成相应的软链接和缩略图,并将所述的软链接和缩略图进行关联;当客户端进行文件搜索时,根据文件对应的标签,将所述的缩略图反馈至客户端。
3.根据权利要求1所述的文件搜索方法,其特征在于,步骤S2包括:客户端发出广播,处于同一局域网的存储设备反馈回自身的ID信息,客户端根据所述的ID信息,将存储设备的ID与客户端账号进行绑定;或者当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后将存储设备的ID与客户端账号进行绑定;或者利用LDAP技术建立多个独立账号并分别与存储设备的ID进行绑定,同时使得存储设备中分配与各个独立账号对应的独立的存储空间;或者通过设置主账号及子账号,分别建立所述主账号及子账号与存储设备ID的绑定关系。
4.一种文件搜索系统,其特征在于,包括:
第一内容或属性识别模块,用于私有云识别存储设备中的文件的内容或属性,具体的,私有云识别存储设备中图片中的地点、人物、场景、文字;其中,存储设备上均运行有私有云平台;
第一标签标注模块,用于根据识别出的信息进行标注标签化,或手动设置标签,或与互联网上的已标记过的图片进行对比然后设置标签;其中,通过图片的exif区域识别图片中的地点;通过光学文字识别技术识别图片中的文字;
或者包括:
第二内容或属性识别模块:用于在将文件备份至存储设备中时,利用私有云识别文件的内容或属性,具体的,私有云识别存储设备中图片中的地点、人物、场景、文字;其中,存储设备和客户端上均运行有私有云平台;
第二标签标注模块,用于在将文件备份至存储设备中时,根据识别出的信息进行标注标签化,或手动设置标签,或与互联网上的已标记过的图片进行对比然后设置标签;其中,通过图片的exif区域识别图片中的地点;通过光学文字识别技术识别图片中的文字;
还包括:
绑定模块,用于将存储设备的ID与用户账号进行绑定;
登录模块,用于客户端利用用户账号登陆私有云平台;
存储设备访问模块,用于客户端通过所述的私有云平台访问存储设备;
文件搜索模块,用于验证通过后,根据单个标签或标签的组合进行文件搜索;
所述的存储设备访问模块包括:
客户端远程访问模块,用于若客户端与存储设备处于不同的网络中,客户端利用账号登陆私有云平台,通过所述的私有云平台向私有云服务器发送数据访问请求;
存储设备远程访问模块,用于存储设备利用外部网络通过私有云平台将其域名发送至私有云服务器;
域名反馈模块,用于私有云服务器根据用户账号与存储设备的ID信息的对应绑定关系,将相应的存储设备的域名反馈给客户端;
远程数据读取和搜索模块,用于客户端根据所述的存储设备的域名通过私有云平台访问存储设备,进行远程数据读取和搜索;
其中,所述的第一内容或属性识别模块或第二内容或属性识别模块还包括:
MD5值生成模块,用于根据用户账号、存储设备ID及文件存储路径生成各个图片的MD5值;
图片识别及第一标签标注模块,用于私有云对所述MD5值对应的图片进行识别;
API调用模块,用于进行场景识别时,私有云通过调用多个图片处理厂家的API对图片中的场景进行识别;
场景确定模块,用于采用少数服从多数的原则确定最终识别的场景;
拆解及信息获取模块,用于私有云对视频内容的I帧进行拆解,识别获得视频内容的主要信息。
5.根据权利要求4所述的文件搜索系统,其特征在于,还包括:
软链接和缩略图生成模块,用于对文件进行处理,分别生成相应的软链接和缩略图;
数据关联模块,用于将所述的软链接和缩略图进行关联;
反馈模块,用于当客户端进行文件搜索时,根据文件对应的标签,将所述的缩略图反馈至客户端。
6.根据权利要求4所述的文件搜索系统,其特征在于,所述的绑定模块包括:
广播发送模块,用于客户端发出广播;
ID信息反馈模块,用于处于同一局域网的存储设备反馈回自身的ID信息;
A绑定模块,用于客户端根据所述的ID信息,将存储设备的ID与客户端账号进行绑定;或者所述的绑定模块包括:
B绑定模块,用于当客户端和存储设备接触时,通过存储设备中的NFC模块将存储设备的ID传输给客户端,客户端接收到所述ID后将存储设备的ID与客户端账号进行绑定;
或者所述的绑定模块包括:
多账号绑定模块,用于利用LDAP技术建立多个独立账号并分别与存储设备的ID进行绑定;
存储空间分配模块,用于存储设备分配与各个独立账号对应的独立的存储空间;
或者所述的绑定模块包括:
主账号及子账号绑定模块,用于建立主账号及子账号与存储设备ID的绑定关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710841264.3A CN107766430B (zh) | 2017-09-18 | 2017-09-18 | 一种文件搜索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710841264.3A CN107766430B (zh) | 2017-09-18 | 2017-09-18 | 一种文件搜索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107766430A CN107766430A (zh) | 2018-03-06 |
CN107766430B true CN107766430B (zh) | 2020-12-25 |
Family
ID=61265099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710841264.3A Active CN107766430B (zh) | 2017-09-18 | 2017-09-18 | 一种文件搜索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107766430B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804596B (zh) * | 2018-05-28 | 2022-05-06 | 北京小米移动软件有限公司 | 网络信息的推送方法、装置及服务器 |
CN109635628A (zh) * | 2018-10-23 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 身份证信息验证方法、装置、设备及计算机可读存储介质 |
CN109885730A (zh) * | 2018-12-27 | 2019-06-14 | 北京春鸿科技有限公司 | 在wifi存储设备中视频搜索方法 |
CN109889325B (zh) * | 2019-01-21 | 2023-06-02 | Oppo广东移动通信有限公司 | 校验方法、装置、电子设备及介质 |
CN112003893B (zh) * | 2020-07-17 | 2023-07-25 | 北京达佳互联信息技术有限公司 | 一种资源下载方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102497424A (zh) * | 2011-12-12 | 2012-06-13 | 创新科存储技术(深圳)有限公司 | 一种通过移动存储设备实现云存储的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI413001B (zh) * | 2010-05-18 | 2013-10-21 | Chunghwa Telecom Co Ltd | 用於遠端存取的資料整合方法與系統 |
US20130282857A1 (en) * | 2012-04-18 | 2013-10-24 | Ronald Allen STAMPER | Cloud Based Storage Synchronization Device |
CN104038514B (zh) * | 2013-03-05 | 2018-09-18 | 福建凯米网络科技有限公司 | 实现移动互联服务的方法、系统、数据中心和移动终端 |
WO2016149943A1 (zh) * | 2015-03-26 | 2016-09-29 | 北京旷视科技有限公司 | 图片管理方法以及图片同步方法 |
CN107066507B (zh) * | 2017-01-10 | 2019-09-17 | 中国人民解放军国防科学技术大学 | 一种基于云机器人混合云架构的语义地图构建方法 |
-
2017
- 2017-09-18 CN CN201710841264.3A patent/CN107766430B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102497424A (zh) * | 2011-12-12 | 2012-06-13 | 创新科存储技术(深圳)有限公司 | 一种通过移动存储设备实现云存储的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107766430A (zh) | 2018-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766430B (zh) | 一种文件搜索方法及系统 | |
US10121060B2 (en) | Automatic group formation and group detection through media recognition | |
WO2018006724A1 (zh) | 二维码信息查询方法、服务器、客户端及系统 | |
CN105701096A (zh) | 索引生成方法、数据查询方法、装置及系统 | |
KR101805731B1 (ko) | 문자 식별과 이미지 매칭을 결합시켜 명함 정보를 교환하는 방법 | |
US20170032188A1 (en) | Photo sharing method and device | |
US8185596B2 (en) | Location-based communication method and system | |
CN104572732A (zh) | 查询用户标识的方法及装置、获取用户标识的方法及装置 | |
CN102968430B (zh) | 用于在地址簿中自动产生和管理组的方法和设备 | |
TW201508520A (zh) | 設置背景圖像的方法及相關的伺服器和系統 | |
US11200402B2 (en) | Application execution based on object recognition | |
WO2014106384A1 (zh) | 一种监控录像信息提供方法、装置及视频监控系统 | |
US8861896B2 (en) | Method and system for image-based identification | |
US9277353B2 (en) | Methods and systems for locating peripheral devices | |
US20210019511A1 (en) | Systems and methods for extracting data from an image | |
CN105516296A (zh) | 群组标识图像的配置方法及装置 | |
US20210144197A1 (en) | Method for Presenting Schedule Reminder Information, Terminal Device, and Cloud Server | |
CN107506503A (zh) | 一种知识产权外观侵权分析管理系统 | |
US20200186668A1 (en) | Method and device for recommending watermark for electronic terminal | |
CN108021654A (zh) | 一种相册图像处理方法及装置 | |
US20130024470A1 (en) | System and method for providing electronic supplemental content associated with printed content in a printed publication | |
CN105592221A (zh) | 一种多媒体的发送方法及通信终端 | |
CN103716419B (zh) | 一种跨终端的域名处理方法及系统 | |
CN108268545B (zh) | 一种分级的用户标签库的创建的方法和装置 | |
US8560538B2 (en) | Information processing device, content management system, method, and computer readable medium for managing contents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right | ||
PP01 | Preservation of patent right |
Effective date of registration: 20220314 Granted publication date: 20201225 |