CN106407483A - 一种具有文字搜索功能的电子相册 - Google Patents
一种具有文字搜索功能的电子相册 Download PDFInfo
- Publication number
- CN106407483A CN106407483A CN201611117097.XA CN201611117097A CN106407483A CN 106407483 A CN106407483 A CN 106407483A CN 201611117097 A CN201611117097 A CN 201611117097A CN 106407483 A CN106407483 A CN 106407483A
- Authority
- CN
- China
- Prior art keywords
- face
- information
- picture
- text
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09F—DISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
- G09F9/00—Indicating arrangements for variable information in which the information is built-up on a support by selection or combination of individual elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
本公开涉及一种具有文字搜索功能的电子相册的系统,主要包括:自动图像文字识别模块、自动人脸识别模块、自动图像物体识别模块、文字数据库保存和搜索模块等;当用户使用智能设备的摄像头拍照后,系统对该照片的图像进行自动图像文字识别、自动人脸识别、自动图像物体识别,并将文字信息和对应的图片信息保存到文字数据库中;当用户要通过文字搜索图片的时候,系统通过文字搜索,返回给用户上述文字数据库中包含输入文字所对应的电子照片。
Description
技术领域
本发明涉及智能移动设备中具有文字搜索的电子相册技术领域,具体是一种具有文字搜索功能的电子相册的系统。
背景技术
随着智能移动设备(特别是智能手机)的发展,越来越多的人采用该类设备进行拍照、电子照片存储。当智能移动设备中的电子照片的数量越来越多的时候,快速准确地查找感兴趣的照片成为一种困难的事情。具体表现举例如下:
1)想找到有某些文字的照片,比如:护照、身份证等文字,目前智能移动设备的电子相册并不具备这种功能;
2)想找到有某个人的照片,比如:有张三在照片内的照片,目前智能移动设备的电子相册并不具备这种功能。
3)想找到有某些事物的照片,比如:有汽车的照片,目前智能移动设备的电子相册并不具备这种功能。
随着人工智能技术的发展,自动地进行图像文字识别、人脸识别和图像物体识别,已经是十分成熟的技术。如何将这些技术应用到智能移动设备的电子相册中的文字搜索中,是本发明所提出来的解决方案。
上述的自动图像文字识别(OCR)、自动人脸识别、自动图像物体识别的方法可采用公开的深度学习方法进行识别。例如:2015年Y. Sun, X. Wang, and X. Tang等人公开发表的文章《深度学习的人脸描述是稀疏的、可选择的和鲁棒的一种方法》(Deeply learnedface representations are sparse, selective, and robust),描述了一种详细的人脸识别方法,可以进行精准的人脸识别,其识别精度可以达到99.15%;2015年Y. Zhang, W.Wang, L. Wang等人公开发表的文章《用更深的卷积网络进行场景的文字识别》(Scenetext recognition with deeper convolutional neural networks),描述了一种详细的用深度卷积网络进行自然场景的文字识别,可以进行精准的文字识别,达到96%以上的识别精度;2015年K. M. He, X. Y. Zhang, S. Q. Ren, J. Sun等人公开发表的文章《图像识别的深度残差学习》(Deep Residual Learning for Image Recognition),描述了一种深度学习的残差网络进行1000种物体以上的图像物体识别,可以进行精准的物体识别,其识别精度可以达到96%以上。
发明内容
为了解决智能移动设备不能快速准确地查找感兴趣照片的困难,本发明设计一种可以进行文字搜索的电子相册的系统和方法,实现对智能移动设备中的照片进行快速、智能化地搜索,从而让用户能够快速准确地找到和某些文字信息相关的电子照片。
具有文字搜索功能的电子相册,主要包括:自动图像文字识别模块、自动人脸识别模块、自动图像物体识别模块、文字数据库保存和搜索模块等。
一种具有文字搜索功能的电子相册的系统流程包含如下:
(1)自动图像文字识别:用户使用智能设备的摄像头拍照后,系统对该照片的图像进行自动图像文字识别,提取图像中的文字,并将这些文字信息和对应的图片的信息保存到文字数据库中;
(2)自动人脸识别:用户使用智能设备的摄像头拍照后,系统对该照片的图像进行人脸识别,当自动识别得到新的人脸后,将新的人脸与系统保存的人脸数据库进行比对,若人脸数据库已经包含该人脸,则将已有的人名信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息;若人脸数据库未包含该人脸,则由用户输入新的人脸的人名,并将该人脸和人名信息相对应,且一同添加到人脸数据库中。
(3)自动图像物体识别:用户使用智能设备的摄像头拍照后,系统对该照片的图像进行物体识别,当自动识别到图像中的物体后,则将这些物体的文字信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息;
(4)系统将(1)(2)(3)所述步骤中得到的文字信息和对应的图片信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息。当用户要通过文字搜索图片的时候,用户输入要搜索的文字,例如:人名、身份证、汽车等等之类的文字;系统通过文字搜索,返回给用户上述文字数据库中包含输入文字所对应的电子照片。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施
例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的系统结构图。
图2是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的系统流程图。
图3是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的流程结构图。
图4是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的流程结构图。
图5是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的流程结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
图1是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的系统结构图,该系统包括:自动图像文字识别102、自动人脸识别104、自动图像物体识别103、文字数据库保存和搜索模块四个模块105。
图2是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的系统流程图,该系统应用于智能移动设备(特别是智能手机)的电子照片中,如图2所示,该系统包括以下步骤:
在202模块中,用户进行拍照后保存为图片,系统的203,204,205等模块分别启动,对该照片的进行自动识别。
当203模块自动识别到图像中的文字后,则将这些文字信息和对应的图片的信息保存到文字数据库206中,其中的图片信息主要包括图片保存地址信息。203模块采用技术背景中提到的《用更深的卷积网络进行场景的文字识别》所公开的方法进行识别,该方法仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。203模块的细节如图3所述。
当204模块自动识别到图像中的新的人脸后,将新的人脸与系统保存的人脸数据库进行比对识别,若人脸数据库已经包含该人脸,则将这些人名信息和对应的图片的信息保存到文字数据库206中,其中的图片信息主要包括图片保存地址信息;若人脸数据库未包含该人脸,则由用户输入新的人脸的人名,并将人脸和人名信息相对应,且一同添加到人脸数据库中。204模块采用技术背景中提到的《深度学习的人脸描述是稀疏的、可选择的和鲁棒的一种方法》所公开的方法进行识别,该方法仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。203模块的细节如图4所述。
当205模块自动识别到图像中的物体后,则将这些物体文字信息和对应的图片信息保存到文字数据库206中,其中的图片信息主要包括图片保存地址信息。205模块采用技术背景中提到的《图像识别的深度残差学习》所公开的方法进行识别,该方法仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。205模块的细节如图5所述。
当用户要通过文字搜索图片的时候,在207模块中输入要搜索的文字,例如:人名、身份证、汽车等等之类的文字,模块207和模块208通过文字搜索,返回给用户上述文字数据库中包含输入文字所对应的的电子照片。
图3是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的流程结构图,当301模块得到拍照保存后的照片后,302模块对图像进行扫描,自动识别到图像中的文字后,303模块则将这些文字信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息。302模块采用技术背景中提到的《用更深的卷积网络进行场景的文字识别》所公开的方法进行识别,该方法仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。
图4是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的流程结构图,当401模块得到拍照保存后的照片后,402模块对图像进行扫描,自动识别到图像中的新的人脸后,403模块将新的人脸与系统保存的人脸数据库407进行比对识别,若人脸数据库407已经包含该人脸,则将这些人名信息和对应的图片的信息保存到文字数据库406中,其中的图片信息主要包括图片保存地址信息;若人脸数据库未包含该人脸,则由用户输入新的人脸的人名,并人脸和人名信息添加到人脸数据库407中。402模块采用技术背景中提到的《深度学习的人脸描述是稀疏的、可选择的和鲁棒的一种方法》所公开的方法进行识别,该方法仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。
图5是根据一示例性实施例示出的一种具有文字搜索功能的电子相册的流程结构图,当501模块得到拍照保存后的照片后,502模块对图像进行扫描,自动识别到图像中的物体后,503模块则将这些物体文字信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息。502模块采用技术背景中提到的《图像识别的深度残差学习》所公开的方法进行识别,该方法仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。
Claims (5)
1.一种具有文字搜索功能的电子相册的系统,其特征在于包含以下4个模块:自动图像文字识别模块、自动人脸识别模块、自动图像物体识别模块、文字数据库保存和搜索模块等模块。
2.根据权利要求1所述的系统,其特征在于自动图像文字识别模块具备以下流程:用户使用智能设备的摄像头拍照后,系统对该照片的图像进行自动图像文字识别,提取图像中的文字,并将这些文字信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息。
3.根据权利要求1所述的系统,其特征在于自动人脸识别模块具备以下流程:用户使用智能设备的摄像头拍照后,系统对该照片的图像进行人脸识别,当自动识别得到新的人脸后,将新的人脸与系统保存的人脸数据库进行比对,若人脸数据库已经包含该人脸,则将已有的人名信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息;若人脸数据库未包含该人脸,则由用户输入新的人脸的人名,并将该人脸和人名信息相对应,且一同添加到人脸数据库中。
4.根据权利要求1所述的系统,其特征在于自动图像物体识别模块具备以下流程:用户使用智能设备的摄像头拍照后,系统对该照片的图像进行物体识别,当自动识别到图像中的物体后,则将这些物体的文字信息和对应的图片的信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息。
5.根据权利要求1所述的系统,其特征在于系统具备以下流程:系统将(2)(3)(4)所述步骤中得到的文字信息和对应的图片信息保存到文字数据库中,其中的图片信息主要包括图片保存地址信息;当用户要通过文字搜索图片的时候,用户输入要搜索的文字,例如:人名、身份证、汽车等等之类的文字;系统通过文字搜索,返回给用户上述文字数据库中包含输入文字所对应的电子照片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611117097.XA CN106407483A (zh) | 2016-12-07 | 2016-12-07 | 一种具有文字搜索功能的电子相册 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611117097.XA CN106407483A (zh) | 2016-12-07 | 2016-12-07 | 一种具有文字搜索功能的电子相册 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106407483A true CN106407483A (zh) | 2017-02-15 |
Family
ID=58084922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611117097.XA Pending CN106407483A (zh) | 2016-12-07 | 2016-12-07 | 一种具有文字搜索功能的电子相册 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106407483A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717464A (zh) * | 2018-05-31 | 2018-10-30 | 中国联合网络通信集团有限公司 | 照片处理方法、装置及终端设备 |
CN111061887A (zh) * | 2019-12-18 | 2020-04-24 | 广东智媒云图科技股份有限公司 | 一种新闻人物照片提取方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147815A (zh) * | 2011-04-21 | 2011-08-10 | 北京大学 | 图片搜索方法和图片搜索系统 |
CN102968473A (zh) * | 2012-11-14 | 2013-03-13 | 广东欧珀移动通信有限公司 | 基于人脸图像的信息检索方法及系统 |
CN103369049A (zh) * | 2013-07-22 | 2013-10-23 | 王雁林 | 移动终端和服务器交互方法及其系统 |
CN105243084A (zh) * | 2015-09-07 | 2016-01-13 | 广东欧珀移动通信有限公司 | 拍摄图像文件的保存方法和系统及其检索方法和系统 |
CN105518679A (zh) * | 2015-03-26 | 2016-04-20 | 北京旷视科技有限公司 | 图片管理方法以及图片同步方法 |
-
2016
- 2016-12-07 CN CN201611117097.XA patent/CN106407483A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147815A (zh) * | 2011-04-21 | 2011-08-10 | 北京大学 | 图片搜索方法和图片搜索系统 |
CN102968473A (zh) * | 2012-11-14 | 2013-03-13 | 广东欧珀移动通信有限公司 | 基于人脸图像的信息检索方法及系统 |
CN103369049A (zh) * | 2013-07-22 | 2013-10-23 | 王雁林 | 移动终端和服务器交互方法及其系统 |
CN105518679A (zh) * | 2015-03-26 | 2016-04-20 | 北京旷视科技有限公司 | 图片管理方法以及图片同步方法 |
CN105243084A (zh) * | 2015-09-07 | 2016-01-13 | 广东欧珀移动通信有限公司 | 拍摄图像文件的保存方法和系统及其检索方法和系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717464A (zh) * | 2018-05-31 | 2018-10-30 | 中国联合网络通信集团有限公司 | 照片处理方法、装置及终端设备 |
CN111061887A (zh) * | 2019-12-18 | 2020-04-24 | 广东智媒云图科技股份有限公司 | 一种新闻人物照片提取方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103631819B (zh) | 一种图片命名的方法及系统 | |
US9590944B2 (en) | Organizing messages in a messaging system using social network information | |
US10078781B2 (en) | Automatically organizing images | |
KR100641791B1 (ko) | 디지털 데이터에 대한 태깅 방법 및 시스템 | |
CN101636734B (zh) | 数字照片内容信息服务 | |
CN103870485B (zh) | 实现增强现实应用的方法及设备 | |
CN104239408B (zh) | 基于由移动设备记录的图像的内容的数据访问 | |
US20060251338A1 (en) | System and method for providing objectified image renderings using recognition information from images | |
WO2014197216A1 (en) | Photo and video search | |
KR101782590B1 (ko) | 이미지 분석기반의 관계형 태그생성 및 추천 방법 | |
CN105631051A (zh) | 基于文字识别的移动增强现实阅读方法及其阅读系统 | |
CN101287214A (zh) | 通过移动终端获取信息并应用的方法和系统 | |
US20240037142A1 (en) | Systems and methods for filtering of computer vision generated tags using natural language processing | |
CN105303449B (zh) | 基于相机指纹特征的社交网络用户的识别方法和系统 | |
CN104063444A (zh) | 缩略图的生成方法和装置 | |
CN104424187B (zh) | 一种向客户端用户推荐好友的方法及装置 | |
CN105956051A (zh) | 信息查找的方法、装置及系统 | |
KR20140066686A (ko) | 주소록에 추가하고자 하는 명함이 존재하는지 여부를 판단하는 방법 | |
CN106407483A (zh) | 一种具有文字搜索功能的电子相册 | |
KR101715708B1 (ko) | 이미지 분석기반의 자동화된 관계형 태그 생성 시스템과 이를 이용한 서비스 제공방법 | |
CN103294825B (zh) | 影像文件搜索系统及方法 | |
KR101786823B1 (ko) | Sns의 프로필 사진 제공 방법 | |
CN106022364B (zh) | 一种票据分类方法 | |
KR101089288B1 (ko) | 얼굴 색인 장치 및 방법 | |
CN105426925A (zh) | 图像标注方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 200127 1202, room 5, 99 lane, East embroidery Road, Pudong New Area, Shanghai. Applicant after: Lian Huicheng Address before: 200444 room 503, 375 lane, Wedi Road, Dachang Town, Baoshan District, Shanghai, 503 Applicant before: Lian Huicheng |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170215 |
|
RJ01 | Rejection of invention patent application after publication |