CN103065120A - 基于人机交互的图像识别方法及装置 - Google Patents
基于人机交互的图像识别方法及装置 Download PDFInfo
- Publication number
- CN103065120A CN103065120A CN2012105372393A CN201210537239A CN103065120A CN 103065120 A CN103065120 A CN 103065120A CN 2012105372393 A CN2012105372393 A CN 2012105372393A CN 201210537239 A CN201210537239 A CN 201210537239A CN 103065120 A CN103065120 A CN 103065120A
- Authority
- CN
- China
- Prior art keywords
- image
- body region
- images
- user
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于人机交互的图像识别方法及装置,其中方法包括:利用图像识别算法确定图像的边界信息;根据所述图像的边界信息,判断是否能区分图像中的主体区域;如果能区分图像中的主体区域,自动划分出区域并输出给用户确认;如果不能区分图像中的主体区域,提示用户进行主体区域的边界描绘。本发明可提高图像识别的召回率和准确率。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于人机交互的图像识别方法及装置。
背景技术
图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。
图像识别最基本的方法是基于图像边缘的识别,图像边缘的识别有拉帕拉斯算子,贝塞尔算子,平均值等方法。把边缘识别出来之后通过和数据库(图形或者文字等)进行对比扫描,就可以把图像识别出来了。
图像识别向来是计算机领域的难点,很难做到召回率和准确率兼顾。本发明通过简单的与用户交互很好的解决这个问题,基本保证100%的召回率和准确率。
发明内容
本发明提出一种基于人机交互的图像识别方法及装置,可提高召回率和准确率。
一种基于人机交互的图像识别方法,包括:利用图像识别算法确定图像的边界信息;根据所述图像的边界信息,判断是否能区分图像中的主体区域;如果能区分图像中的主体区域,自动划分出主体区域并输出给用户确认;如果不能区分图像中的主体区域,提示用户进行主体区域的边界描绘。
优选地,该方法还包括:如果图像中包括可被识别的二维码或/和统一资源定位符,则调取所述二维码或/和统一资源定位符对应的信息。
其中,所述图像识别算法包括拉帕拉斯算法,贝塞尔算法,和/或,平均值算法。
其中,所述用户通过鼠标或触屏在图像中进行边界描绘。
一种基于人机交互的图像识别装置,包括:确定单元,用于利用图像识别算法确定图像的边界信息;判断单元,用于根据所述图像的边界信息,判断是否能区分图像中的主体区域;自动划分单元,用于在判断单元能区分图像中的主体区域时,自动划分出主体区域并输出给用户确认;用户描绘指示单元,用于在判断单元补能区分图像中的主体区域时,提示用户进行主体区域的边界描绘。
优选地,该装置还包括:特殊处理单元,用于调取图像中包括的可被识别的二维码或/和统一资源定位符对应的信息。
另外,本发明还提供一种自动推荐相似商品的方法,包括:获取特定感兴趣商品的图像;抽取出所述图像中的物品区域信息;根据所述物品区域信息,在商品库中进行搜索,确定向用户推荐的相似商品;其中,所述抽取出所述图像中的物品区域信息的具体步骤包括:利用图像识别算法确定图像的边界信息;根据所述图像的边界信息,判断是否能区分图像中的物品区域;如果能区分图像中的物品区域,自动划分出物品区域信息并输出给用户确认;如果不能区分图像中的物品区域,提示用户进行物品区域信息的边界描绘。
上述自动推荐相似商品的方法还包括:如果图像中包括可被识别的二维码或/和统一资源定位符,则调取所述二维码或/和统一资源定位符对应的信息。
其中,所述图像识别算法包括拉帕拉斯算法,贝塞尔算法,和/或,平均值算法。
其中,所述用户通过鼠标或触屏在图像中进行边界描绘通过本发明提供的方法和装置,
通过本发明提供的方法和装置,通过将主体区域信息输出给用户进行确认或请用户进行边界描绘,借助人机交互改善图像识别的召回率和准确率。
上述图像识别方案可有各种应用,例如,应用到自动推荐相似商品的方案中。用户可以在手机上通过拍照等方式,极其便利的完成信息获取,并作为精确输入传递给其他第三方系统使用。这是以前所有其他图像处理类系统无法做到的。
附图说明
图1是本发明基于人机交互的图像识别方法的流程图;
图2是本发明基于人机交互的图像识别装置的结构示意图。
具体实施方式
很多情况下,用户希望从一副图像中提取出真正关心的部分。目前主流的图像识别方法大都不能完美解决这个问题。本发明通过简单的与用户交互,基本100%解决这个问题。
参见图1,为本发明提供的基于人机交互的图像识别方法的流程图,包括以下步骤:
S101:利用图像识别算法确定图像的边界信息;
S102:根据所述图像的边界信息,判断是否能区分图像中的主体区域;
S103:如果能区分图像中的主体区域,自动划分出主体区域并输出给用户确认;
S104:如果不能区分图像中的主体区域,提示用户进行主体区域的边界描绘。
进一步,如果图像中包括可被识别的二维码或/和统一资源定位符,则调取二维码或/和统一资源定位符对应的信息。
其中,图像识别算法包括但不限于现有和未来将出现的图像识别算法,例如:拉帕拉斯算法、贝塞尔算法、平均值算法等。
其中,用户通过鼠标或触屏在图像中进行边界描绘。
与上述方法相对应,本发明还提供一种基于人机交互的图像识别装置。本领域人员可以理解的是,该装置可以是通过软件、硬件或软硬件结合实现,可以是独立的设备,也可以是与计算机等现有设备嵌入或结合使用的设备。
参见图2,为该装置结构示意图。
该装置包括确定单元201、判断单元202、自动划分单元203和用户描绘指示单元204。
确定单元201用于利用图像识别算法确定图像的边界信息;
判断单元202用于根据确定单元201确定的图像的边界信息,判断是否能自动区分图像中的主体区域;
自动划分单元203,用于在判断单元202确定能区分图像中的主体区域时,自动划分出主体区域并输出给用户确认;
用户描绘指示单元204,用于在判断单元202取得不能区分图像中的主体区域时,提示用户进行主体区域的边界描绘。
优选地,该装置还包括特殊处理单元,用于调取图像中包括的可被识别的二维码或/和统一资源定位符对应的信息。
下面描述人机交互的图像识别方法的一个具体应用。
随着互联网的发展,电子商务应运而生。电子商务是利用计算机技术、网络技术和远程通信技术,实现电子化、数字化和网络化的整个商务过程。如今,越来越多的用户进行网购。通常,用户会登录电子商务网站,搜索特定商品,在显示的多个商品中进行比对、选择,最终完成购买。可见,现有网购过程对用户而言是被动的,即,用户被动浏览一些特定商品,而无法进行主动筛选。例如,用户想购买一件羽绒服,网站会显示所有羽绒服商品供用户选择,往往显示的商品众多,用户选择上存在一定难度。即使可以通过设定价格、好评度和/或销量进行排序显示,但是最优显示的羽绒服样式等仍不一定是用户中意的。
生活中经常碰到这样的场景:看电视、杂志或街头看到某人的打扮/物品,会觉得很喜欢,但是转眼错过。本应用从该需求出发,提出一种终端自动推荐相似商品的方案。
具体地,将图像识别应用在上述场景下,提出一种终端自动推荐相似商品的方法,包括以下步骤:
(1):获取特定感兴趣商品的图像;
(2):抽取出所述图像中的物品区域信息;
(3):根据所述物品信息,在商品库中进行搜索,确定向用户推荐的相似商品。
其中,步骤(2)具体实现为:
(2.1)利用图像识别算法确定图像的边界信息;
(2.2)根据所述图像的边界信息,判断是否能区分图像中的物品区域;
(2.3)如果能区分图像中的物品区域,自动划分出物品区域信息并输出给用户确认;
(2.4)如果不能区分图像中的物品区域,提示用户进行物品区域信息的边界描绘。
通过上述自动推荐相似商品的方法,当用户看到喜欢的商品时,只要终端获取到该商品图像,即可自动提取物品信息在商品库中进行搜索,推荐出同类或相似的商品。这样,用户可方便地购买到与心仪商品相似甚至相同的商品。
本领域人员可以理解的是,所述终端优选是具体拍照功能的手机或终端(例如带摄像头的ipad),这样,手机可随时拍下感兴趣的商品照片,并使用手机进行相似商品推荐,从而购买心仪商品。当然,终端也可以是传统的PC机或者笔记本电脑等,除了拍照得到图像外,还可以通过网络传输工具(例如QQ,emai,MSN等)获取商品图像。另外,也可以通过接口读取所述特定感兴趣商品的图像,例如通过USB接口读取照相机中的商品图像。另外,商品图像也可以是网络上的资源,例如当用户浏览网页时发现的一张显示商品外观的图像,可以直接利用这样的图像进行后续处理。
本领域人员可以理解的是,所述商品库是指,通过爬虫抓取或第三方接口方式而形成并维护的网上可购买到的各种商品库,包括但不限于现有各种电商的商品库。
本领域人员可以理解的是,所述根据所述物品信息在商品库中进行搜索,具体包括:根据与物品信息的相似度、商品成交数、商品好评率,和/或,商品品牌,在所述商品库中进行搜索。
综上,通过本发明提供的方法和装置,通过将主体区域信息输出给用户进行确认或请用户进行边界描绘,借助人机交互改善图像识别的召回率和准确率。上述图像识别方案可有各种应用,例如,用户可以在手机上通过拍照等方式,极其便利的完成信息获取,并作为精确输入传递给其他第三方系统使用。这是以前所有其他图像处理类系统无法做到的。
上文中提供了对本发明的具体描述以用于进行阐述和说明。但并非要穷举或者将本发明限于所公开的精确形式。根据以上教导,可实现很多修改和变型。上述实施例被选取用于最佳地解释本发明的原理及其实际应用,从而使得本领域技术人员能够以不同的实施例并利用适于特定预期用途的不同变型来最佳地利用本发明。本发明的范围要由所附权利要求来定义。
Claims (10)
1.一种基于人机交互的图像识别方法,其特征在于,包括:
利用图像识别算法确定图像的边界信息;
根据所述图像的边界信息,判断是否能区分图像中的主体区域;
如果能区分图像中的主体区域,自动划分出主体区域并输出给用户确认;
如果不能区分图像中的主体区域,提示用户进行主体区域的边界描绘。
2.根据权利要求1所述的方法,其特征在于,还包括:
如果图像中包括可被识别的二维码或/和统一资源定位符,则调取所述二维码或/和统一资源定位符对应的信息。
3.根据权利要求1所述的方法,其特征在于,所述图像识别算法包括拉帕拉斯算法,贝塞尔算法,和/或,平均值算法。
4.根据权利要求1所述的方法,其特征在于,所述用户通过鼠标或触屏在图像中进行边界描绘。
5.一种基于人机交互的图像识别装置,其特征在于,包括:
确定单元,用于利用图像识别算法确定图像的边界信息;
判断单元,用于根据所述图像的边界信息,判断是否能区分图像中的主体区域;
自动划分单元,用于在判断单元能区分图像中的主体区域时,自动划分出区域并输出给用户确认;
用户描绘指示单元,用于在判断单元补能区分图像中的主体区域时,提示用户进行主体区域的边界描绘。
6.根据权利要求5所述的装置,其特征在于,还包括:
特殊处理单元,用于调取图像中包括的可被识别的二维码或/和统一资源定位符对应的信息。
7.一种自动推荐相似商品的方法,其特征在于,包括:
获取特定感兴趣商品的图像;
抽取出所述图像中的物品区域信息;
根据所述物品区域信息,在商品库中进行搜索,确定向用户推荐的相似商品;
其中,所述抽取出所述图像中的物品区域信息的具体步骤包括:
利用图像识别算法确定图像的边界信息;
根据所述图像的边界信息,判断是否能区分图像中的物品区域;
如果能区分图像中的物品区域,自动划分出物品区域信息并输出给用户确认;
如果不能区分图像中的物品区域,提示用户进行物品区域信息的边界描绘。
8.根据权利要求7所述的方法,其特征在于,还包括:
如果图像中包括可被识别的二维码或/和统一资源定位符,则调取所述二维码或/和统一资源定位符对应的信息。
9.根据权利要求7所述的方法,其特征在于,所述图像识别算法包括拉帕拉斯算法,贝塞尔算法,和/或,平均值算法。
10.根据权利要求7所述的方法,其特征在于,所述用户通过鼠标或触屏在图像中进行边界描绘。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105372393A CN103065120A (zh) | 2012-12-13 | 2012-12-13 | 基于人机交互的图像识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105372393A CN103065120A (zh) | 2012-12-13 | 2012-12-13 | 基于人机交互的图像识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103065120A true CN103065120A (zh) | 2013-04-24 |
Family
ID=48107743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012105372393A Pending CN103065120A (zh) | 2012-12-13 | 2012-12-13 | 基于人机交互的图像识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103065120A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446185A (zh) * | 2016-09-28 | 2017-02-22 | 北京小米移动软件有限公司 | 产品推荐方法、装置以及服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5291560A (en) * | 1991-07-15 | 1994-03-01 | Iri Scan Incorporated | Biometric personal identification system based on iris analysis |
CN1475961A (zh) * | 2003-07-14 | 2004-02-18 | 中国科学院计算技术研究所 | 基于GaborEye模型的人眼定位方法 |
CN101211341A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 图像智能模式识别搜索方法 |
-
2012
- 2012-12-13 CN CN2012105372393A patent/CN103065120A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5291560A (en) * | 1991-07-15 | 1994-03-01 | Iri Scan Incorporated | Biometric personal identification system based on iris analysis |
CN1475961A (zh) * | 2003-07-14 | 2004-02-18 | 中国科学院计算技术研究所 | 基于GaborEye模型的人眼定位方法 |
CN101211341A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 图像智能模式识别搜索方法 |
Non-Patent Citations (1)
Title |
---|
王晓松: ""复杂背景下树木图像提取研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446185A (zh) * | 2016-09-28 | 2017-02-22 | 北京小米移动软件有限公司 | 产品推荐方法、装置以及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227326B2 (en) | Augmented reality recommendations | |
CN102982472A (zh) | 终端自动推荐相似商品的方法及装置 | |
US20140149845A1 (en) | Method for generating websites | |
US20140149240A1 (en) | Method for collecting point-of-sale data | |
US20120232987A1 (en) | Image-based search interface | |
US9881084B1 (en) | Image match based video search | |
US20150007022A1 (en) | Generating websites and business documents from seed input | |
CN102930263A (zh) | 一种信息处理方法及装置 | |
CN105335423B (zh) | 一种网页的用户反馈的收集处理方法及装置 | |
CN104268154A (zh) | 一种用于提供推荐信息的方法和装置 | |
CN106162355A (zh) | 视频交互方法及终端 | |
WO2017088496A1 (zh) | 一种搜索推荐方法、装置、设备及计算机存储介质 | |
CN105893613B (zh) | 一种图像标识信息搜索方法及装置 | |
JP2013167973A (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
CN103136206A (zh) | 信息展示方法和设备 | |
US9715701B2 (en) | Image-based listing using image of multiple items | |
CN105095446A (zh) | 药品的搜索处理方法、服务器及终端设备 | |
Pous et al. | Cricking: customer-product interaction in retail using pervasive technologies | |
CN111815404A (zh) | 虚拟物品分享方法及装置 | |
TWI451347B (zh) | 物品資料查詢系統及方法 | |
US9672436B1 (en) | Interfaces for item search | |
US20170013309A1 (en) | System and method for product placement | |
CN105868299A (zh) | 一种数据搜索方法和装置 | |
CN104156375A (zh) | 一种基于众包的信息投放方法和系统 | |
JP6295577B2 (ja) | サーバ装置、プログラム、及び、情報提供方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130424 |