CN103854031A - 用于识别图像内容的方法和装置 - Google Patents

用于识别图像内容的方法和装置 Download PDF

Info

Publication number
CN103854031A
CN103854031A CN201210519142.XA CN201210519142A CN103854031A CN 103854031 A CN103854031 A CN 103854031A CN 201210519142 A CN201210519142 A CN 201210519142A CN 103854031 A CN103854031 A CN 103854031A
Authority
CN
China
Prior art keywords
image
pairing
answer
user
image pairing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210519142.XA
Other languages
English (en)
Other versions
CN103854031B (zh
Inventor
钟钱杰
郭峰
陈齐彦
陈超
陈波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC Corp filed Critical EMC Corp
Priority to CN201210519142.XA priority Critical patent/CN103854031B/zh
Priority to US14/089,909 priority patent/US9436930B2/en
Publication of CN103854031A publication Critical patent/CN103854031A/zh
Application granted granted Critical
Publication of CN103854031B publication Critical patent/CN103854031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/36User authentication by graphic or iconic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Security & Cryptography (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的各实施方式涉及用于识别图像内容的方法和装置。在本发明的一个实施方式中,提供了一种用于识别图像内容的方法,包括:向用户提供至少第一图像配对和第二图像配对;获取来自用户的第一答案和第二答案,其中第一答案和第二答案分别指示用户针对第一图像配对和第二图像配对中的图像内容是否相同的判断;以及响应于第一答案符合预定答案,修改第二图像配对的权重。在本发明的另一实施方式中,提供了一种用于识别图像内容的装置。

Description

用于识别图像内容的方法和装置
技术领域
本发明的各实施方式涉及图像识别,更具体地,涉及利用集体智慧(Collective Intelligence)来用于识别图像内容的方法和装置。
背景技术
长期以来,图像识别一直是数字图像技术中的一个研究重点。目前已经开发出针对各种图像内容进行识别的算法。然而,识别图像内容的一个难题在于,由于拍摄角度、光照条件、或者抖动等因素的干扰,图像识别算法并不总是能够获得期望的结果。另外,例如当图像中的对象是随着年龄不断增长的人(或者随着日常使用逐渐磨损的物品)时,图像识别算法可能并不能正确识别出针对相同对象在不同时间拍摄的图像(例如,针对同一人物的、分别在3岁和10岁拍摄的照片)。
在识别图像内容方面,人类具有敏锐的观察力和判断力,目前的计算机还不能完全模拟人脑对于图像等信息的处理能力。例如,在判断两个图像的内容是否是针对相同人物/事物的图像时,人眼和人脑往往能抓住图像中的某些细节、或者将图像整体进行比较,即使在两个图像拍摄角度、光线和拍摄年代均不相同的情况下,也能够找到图像中的相似点,进而得出两个图像是针对相同人物/事务拍摄的图像这一结论。因而,期望将人类所特有的智慧引入图像识别技术中。
此外,个人计算设备(例如包括固定式和可移动计算设备)的发展向普通用户提供了强大的计算能力;并且随着网络技术的发展,个人计算设备的数据通信能力越来越强,几乎能够随时通过网络访问自己所需的各种资源。目前已经出现了可以在联网的个人计算设备处于空闲状态时,利用这些个人计算设备的处理能力的应用,并逐步开发出支持“云计算”、“运处理”等功能的应用。个人计算设备和网络技术的发展,为通过个人计算设备调用广大用户的集体智慧来辅助进行图像识别,提供了硬件上的可能性。
发明内容
因而,期望能够开发出一种基于广大用户的集体智慧来辅助进行图像识别的技术方案。并且期望该技术方案能够尽量不干扰普通用户对于个人计算设备的正常使用体验,并且在尽可能少地造成用户额外劳动的情况下,达到利用广大用户的集体智慧辅助进行图像识别的目的。
在本发明的一个实施方式中,提供了一种用于识别图像内容的方法,包括:向用户提供至少第一图像配对和第二图像配对;获取来自用户的第一答案和第二答案,其中第一答案和第二答案分别指示用户针对第一图像配对和第二图像配对中的图像内容是否相同的判断;以及响应于第一答案符合预定答案,修改第二图像配对的权重。
在本发明的一个实施方式中,进一步包括:响应于第二图像配对的权重到达预定权重,判断第二图像配对中的图像内容是相同的。
在本发明的一个实施方式中,第一图像配对选自其中存储已知图像内容是否相同的图像配对的第一数据库,以及第二图像配对选自其中存储未知图像内容是否相同的图像配对的第二数据库。
在本发明的一个实施方式中,提供了一种用于识别图像内容的装置,包括:提供模块,配置用于向用户提供至少第一图像配对和第二图像配对;获取模块,配置用于获取来自用户的第一答案和第二答案,其中第一答案和第二答案分别指示用户针对第一图像配对和第二图像配对中的图像内容是否相同的判断;以及修改模块,配置用于响应于第一答案符合预定答案,修改第二图像配对的权重。
在本发明的一个实施方式中,进一步包括:判断模块,配置用于响应于第二图像配对的权重到达预定权重,判断第二图像配对中的图像内容是相同的。
在本发明的一个实施方式中,第一图像配对选自其中存储已知图像内容是否相同的图像配对的第一数据库,以及第二图像配对选自其中存储未知图像内容是否相同的图像配对的第二数据库。
采用根据本发明的各实施方式提供的方法和装置,可以通过个人计算设备向用户提供图像配对,并获取用户针对该图像配对中的图像内容是否相同的判断,继而基于来自广大用户的判断来辅助图像识别。进一步,通过将提供图像配对并获得判断结果的方案来代替现有技术中进行安全登录时的验证码方案,在实现验证码功能的同时还可以适用于基于集体智慧识别图像内容。
附图说明
结合附图并参考以下详细说明,本发明各实施方式的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本发明的若干实施方式。在附图中:
图1示意性示出了适于实现本发明实施方式的示例性计算系统的框图;
图2示意性示出了根据一个解决方案的用户登录界面的示意图;
图3示意性示出了根据本发明一个实施方式的用户界面的示意图;
图4示意性示出了根据本发明一个实施方式的用于识别图像内容的方法的流程图;
图5示意性示出了根据本发明一个实施方式的用于识别图像内容的系统的架构图;
图6A和图6B分别示意性示出了根据本发明一个实施方式的图像节点和图像配对节点的数据结构的示意图;以及
图7示意性示出了根据本发明一个实施方式的用于识别图像内容的装置的框图。
具体实施方式
应当注意,在本发明上下文中所述的识别图像内容是指,识别两个图像中的对象是否是相同的人物或事物。例如,图像A包括一个3岁儿童的正面头像,而图像B包括一个10岁儿童的侧面半身像,此时尽管两个图像的像素内容并不一样,然而由于两个图像是针对同一名儿童在不同年代拍摄的照片,因而应当认为图像A和图像B的内容是相同的。又例如,相同物品在不同状态下的外观可能会发生显著变化(例如,一个图像包括撑开的雨伞,而另一图像包括被收起的雨伞),单纯采用数字图像处理技术很难识别出两个图像中内容的相似性。然而,人眼却可以通过雨伞的颜色和花纹等很容易地判断两个图像中的雨伞是否相同。
识别图像内容是否相同的应用范围广泛并且意义巨大,目前社会实践中存在需要判断图像内容是否相同的各种情况。例如,人们在遗失物品时可能会在失物招领论坛中张贴例如包括物品照片和自己联系方式的寻物启事,另一方面,论坛工作人员会在论坛中定期更新被捡到物品的照片列表。然而,由于失主可能不会逐一查看物品列表,因而没有发现自己所遗失的物品已经被送到了失物招领处。此时,如果能够识别出丢失物品和招领物品是否相同,则可以尽快通知失主。
另外,目前已经存在专门帮助走失儿童家长寻找孩子的机构,这些机构具有由大量的走失儿童家长提供的照片和普通群众拍摄的流浪儿童的照片,如何在这两类照片之间寻找联系也需要借助于图像内容识别。此外,图像内容识别对于搜索通缉犯、寻找走失宠物等方面也是有益的。应当注意,在本发明的各个实施方式中,认为全部图像的内容和来源都是合法的,图像中并不存在不易公开的信息,对于图像信息的使用也不违背使用本发明所述的技术方案的国家/地区的法律。
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了适于用来实现本发明实施方式的示例性计算系统100的框图。如图1所示,计算机系统100可以包括:CPU(中央处理单元)101、RAM(随机存取存储器)102、ROM(只读存储器)103、系统总线104、硬盘控制器105、键盘控制器106、串行接口控制器107、并行接口控制器108、显示控制器109、硬盘110、键盘111、串行外部设备112、并行外部设备113和触摸屏显示器114。在这些设备中,与系统总线104耦合的有CPU101、RAM102、ROM103、硬盘控制器105、键盘控制器106、串行控制器107、并行控制器108和显示控制器109。硬盘110与硬盘控制器105耦合,键盘111与键盘控制器106耦合,串行外部设备112与串行接口控制器107耦合,并行外部设备113与并行接口控制器108耦合,以及触摸屏显示器114与显示控制器109耦合。应当理解,图1所示的结构框图仅仅是为了示例的目的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况增加或减少某些设备。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施方式中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照本发明实施方式的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品(manufacture)。
也可以把计算机程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
图2示意性示出了根据一个解决方案的用户登录界面200的示意图。登录界面200包括:登录信息部分210,例如,账号“Alan”和密码“****”;验证码部分220,例如,可以包括用于输入验证码的文本框以及显示验证码的图像;以及登录按钮232和取消按钮234。
在登录界面中要求用户提供验证码,这可以较为有效地防止恶意应用等通过穷举来试图盗用用户账户的情况。目前已经由很多主流网站采用了通过验证码来提高安全性的技术方案,并且广大用户也已经认可将提供验证码作为登录网站的一部分。基于在网站中提供验证码的方案,本发明提出了一种在用户浏览网页期间来采集用户针对图像内容的判断进而辅助识别图像内容的技术方案。
图3示意性示出了根据本发明一个实施方式的用户界面300的示意图。例如,可以在用户浏览网页期间向用户提供类似于图3所示的用户界面。应当注意,在此并不限定仅在用户访问登录界面时提供该用户界面,在不影响用户体验的情况下,还可以在用户登录之前或者已经登录后提供该界面。此时,尽管该界面失去了替代现有登录界面中验证码以提高安全性的功能,然而可以通过该用户界面来采集用户针对图像内容的判断,进而实现利用集体智慧进行图像识别的目的。
如图3所示,可以向用户提供两个图像配对,例如第一图像配对(包括虚线上方的图像A-1310和图像A-2312)和第二图像配对(包括虚线下方的图像B-1320和图像B-2322),并提示用户通过例如复选框来输入针对每个图像配对中的图像内容是否相同的判断结果。例如,当用户认为图像配对中的两个图像是针对相同人物/事物的图像时,用户可以选中复选框;否则可以不进行选择。以此方式,用户仅通过点击鼠标即可实现输入,而不必像现有技术那样使用键盘输入验证码,进而避免了在鼠标和键盘之间切换时产生的诸多不便。
在此实施方式中,为了既能够实现验证码的目的又实现采集用户针对图像配对内容的判断,可以向用户提供一个已知是否匹配的图像配对,并且提供一个未知是否匹配的图像配对。基于已知是否匹配的图像配对,可以将已知的匹配情况与从用户采集的答案(例如,通过复选框输入的“相同”或“不同”)进行比较,如果匹配情况与采集的答案一致,则认为用户输入了正确的“验证码”;否则,认为用户输入了错误的“验证码”。基于未知是否匹配的图像配对,可以将从用户采集的答案用作进行图像内容识别的基础,以此达到利用集体智慧的目的。
在本发明的一个实施方式中,提出了一种用于识别图像内容的方法,包括:向用户提供至少第一图像配对和第二图像配对;获取来自用户的第一答案和第二答案,其中第一答案和第二答案分别指示用户针对第一图像配对和第二图像配对中的图像内容是否相同的判断;以及响应于第一答案符合预定答案,修改第二图像配对的权量。
在此实施方式中,图像配对的权重是用于描述图像配对中的两个图像的内容是否相同的数值;换言之,是描述图像配对中的两个图像内容为相同的可能性的数值。权重例如可以采用0至1之间的实数来表示,0表示两个图像内容不同,而1表示两个图像内容相同。
具体地,图4示意性示出了根据本发明一个实施方式的用于识别图像内容的方法的流程图400。在步骤S402中,向用户提供至少第一图像配对和第二图像配对。例如,可以采用图3所示的界面来向用户提供两个图像配对。备选地,还可以向用户提供多于两个的图像配对,例如可以提供三个图像配对,本领域技术人员可以基于图3的界面自行设计其他的界面来提供图像配对。
在步骤S404中,获取来自用户的第一答案和第二答案,其中第一答案和第二答案分别指示用户针对第一图像配对和第二图像配对中的图像内容是否相同的判断。为了便于用户操作,可以采用图3所示的复选框来接收用户的答案。此时最多仅需用户进行两次点击(当认为两个图像配对中的内容均相同时),或者根本不需要进行点击(当认为两个图像配对中的内容均不相同时),即可获得用户输入。或者,本领域技术人员还可以设置包括“相同”和“不相同”的一组单选框来接收用户的答案。在向用户提供三个图像配对的示例中,需要获取用户针对三个图像配对的答案。
在步骤S406中,响应于第一答案符合预定答案,修改第二图像配对的权重。应当注意,在此实施方式中,第一图像配对的作用类似于验证码,当第一答案符合预定答案时,表示用户针对第一图像配对中的图像内容的一致性的判断是正确的;另一方面,表示该用户对于图像内容的识别能力是可信的、和/或用户是经过认真辨别后才输入了答案而不是随意输入答案,因而可以在一定程度上相信用户针对第二图像配对给出的第二答案。在向用户提供三个图像配对的示例中,响应于第一答案符合预定答案,还可以修改第二图像配对和第三图像配对的权重。
在本发明的一个实施方式中,可以针对每个图像配对设置权重,权重的初始值可以设置为0。当用户认为该图像配对中两个图像的内容是相同时,则可以将权重增加一个量值;或者还可以将权重设置为认为相同的用户数量与参与评分的全部用户数量的比值。在后续步骤中,可以通过衡量权重的大小来确定图像配对中的两个图像内容是否相同。
在本发明的一个实施方式中,进一步包括:响应于第二图像配对的权重到达预定权重,判断第二图像配对中的图像内容是相同的。例如,当以比值为权重时,可以在80%的用户认为第二图像配对中的图像内容相同时,输出“相同”的识别结果。在此实施方式中,还可以定义需要获取多少个用户的答案,例如,可以采集1000个用户的答案,并且在其中80%的用户给出“相同”时,认为两个图像的内容是相同的。
应当注意,在此步骤之后还可以采用其他步骤来进一步验证识别结果的正确性,例如,可以采用图像识别算法进行处理,还可以采用例如精通人脸识别等技术的专家来做进一步的判断,进而消除根据本发明的实施方式的图像识别方案中出现的某些错误。
在本发明的一个实施方式中,第一图像配对选自其中存储已知图像内容是否相同的图像配对的第一数据库,以及第二图像配对选自其中存储未知图像内容是否相同的图像配对的第二数据库。在此实施方式中,第一数据库和第二数据库分别设置用于存储已知、未知图像内容是否相同的图像配对。从第一数据库中提供第一图像配对的目的在于提供类似于验证码的图像配对,当来自用户的第一答案与预定答案相匹配时,则认为用户针对第二图像配对的答案是有效的。
应当注意,在本发明的各个实施方式中可以随机地分别从第一数据库和第二数据库中选择第一图像配对和第二图像配对。第一数据库中包括的图像配对中的图像可以彼此不同,或者可以有所重叠。例如,在第一数据库的一个图像配对中包括图像A和图像B,而在另一图像配对中包括图像B和图像C。类似地,在第二数据库中包括的图像配对也可以彼此不同或者有所重叠。
例如,当第二数据库的一个图像配对中包括图像A和图像B,而在另一图像配对中包括图像B和图像C时,如果针对图像配对(A,B)和(B,C)的权重分别超过预定阈值,则在没有向用户提供图像配对(A,C)的情况下,也可以认为图像A和图像C的内容也是相同的。如果分别向用户提供了图像配对(A,B)、(B,C)和(A,C),并且在三个图像配对的权重彼此像差甚远的情况下,还可以对图像A、图像B和图像C进行其他的额外验证处理。
在本发明的一个实施方式中,第一图像配对和第二图像配对的显示顺序是随机的。随机显示的目的在于,用户应当认真对待两个图像配对。如果用户已知第一图像配对显示在前而第二图像配对显示在后、并且用户仅需要针对第一图像配对给出正确的答案即可,则有可能会出现用户仅认真分辨第一图像配对中的图像而随意提供针对第二配对的答案的情况,这将会有可能降低从用户收集的答案的准确性。在此实施方式中,由于第一图像配对和第二图像配对的显示顺序是随机的,用户必须认真分析两个图像配对的内容并且分别给出答案,否则将有可能会由于针对第一图像配对给出了错误答案而无法进入期望的页面,例如,无法登录。
在本发明的一个实施方式中,向用户提供至少第一图像配对和第二图像配对包括:响应于用户访问登录页面,向用户提供至少第一图像配对和第二图像配对。当用户访问登录页面时,利用根据本发明的第一图像配对和第二图像配对来代替现有技术中的验证码。具体地,例如可以利用如图3所示的界面来代替图2所示的登录界面中的验证码部分220,以便实现根据本发明所述的方法。
在此实施方式中,第一图像配对的功能对应于现有技术的验证码,而第二图像配对的功能在于向用户提供两个待识别图像,并且还可以通过与用户的交互,来获得用户针对第二图像配对中的两个图像内容是否相同的判断结果。以此方式,通过采集来自大量用户的判断结果,可以获得与一般大众的识别能力相符的判断结果。
在本发明的一个实施方式中,响应于第一答案符合预定答案,将用户引导至与登录页面相关联的另一页面。在本发明的一个实施方式中,响应于第一答案不符合预定答案,再次执行上文参见图4所述的方法。在此实施方式中,只要用户针对第一图像配对的第一答案符合预定答案,即可允许用户登录,并基于用户的第二答案来修改第二图像配对的权重。另外,当用户针对第一图像配对的第一答案不符合预定答案时,可以再次向用户提供另外的两个图像配对作为第一图像配对。在本发明的一个实施方式中,当存在一定数量(或者比例)的用户对于某特定的第一图像配对的答案为错误时,则可以认为该第一图像配对中的图像内容的一致性不足够明显,因不适合作为“验证码”而将其从第一数据库中删除。
在本发明的一个实施方式中,该方法独立于登录页面而提供。尽管在上文中结合登录界面描述了识别图像的方法,然而该方法的实现可以独立于登录页面,例如可以由不同于登录网站提供者的第三方机构来提供该方法。并且,还可以由独立的机构提供第一数据库和第二数据库。例如,可以由失物招领处、警察局等实体来提供第一数据库和第二数据库,或者仅提供其中存储有待被识别的图像配对的第二数据库。
在此实施方式中,网站的提供者仅需要在登录界面中嵌入少量代码以调用根据本发明的识别图像内容的方法的应用即可。以此方式,网站提供者可以将对“验证码”功能的开发和维护转移至其他方提供,并且还可以在不额外占用用户过多时间和精力的情况下,利用集体智慧来识别图像内容。
在本发明的一个实施方式中,响应于第二图像配对的权重到达预定权重,将第二图像配对从第二数据库中移除。当确定第二图像配对中的图像内容为相同时,不必再向其他用户提供第二图像配对,因而可以将其从第二数据库中移除,或者还可以将其移至第一数据库中。
在本发明的一个实施方式中,图像内容是以下中的任一项:物品、动物以及人像。在本发明的各个实施方式中,并不限定图像内容的范围,而是图像内容可以包括物品图像(例如,用于失物招领)、动物图像(例如,用于寻找走失宠物)或者包括人像/人脸(例如,用于搜索通缉罪犯或者用于寻找走失儿童等)。
图5示意性示出了根据本发明一个实施方式的用于识别图像内容的系统的架构图500。具体地,响应于用户510访问网站520(如箭头A所示),网站520可以调用识别装置530(如箭头B所示,例如通过调用提供本发明功能的应用进行)。继而,识别装置530分别访问第一数据库532和第二数据库534(分别如箭头C和D所示),并分别从中读取第一图像配对和第二图像配对,接着,在判断界面540中提供上述两个图像配对。用户510通过与判断界面进行交互(如箭头F所示),来输入针对两个图像配对的答案。当用户510针对第一图像配对的答案符合预定答案时,可以基于第二答案来修改针对第二图像配对的权重(如箭头G所示),并且允许用户登录(如箭头H所示)。
图6A和图6B分别示意性示出了根据本发明一个实施方式的数据结构的示意图600A和600B。在数据结构600A中,图像节点610A包括:图像ID612A,用于唯一地定义每个图像的标识符;图像属性614A,用于定义与图像相关联的各种信息(例如当图像是一名走失儿童的照片时,可以包括该儿童的姓名、出生日期、走失时间以及家长联系方式等);以及图像616A,用于存储图像的像素信息。在数据结构600B中,图像配对节点610B包括:第一图像ID612B、第二图像ID614B以及表示第一图像和第二图像的内容为相同的可能性的权重616B。
图7示意性示出了根据本发明一个实施方式的用于识别图像内容的装置的框图。具体地,提供了一种用于识别图像内容的装置,包括:提供模块710,配置用于向用户提供至少第一图像配对和第二图像配对;获取模块720,配置用于获取来自用户的第一答案和第二答案,其中第一答案和第二答案分别指示用户针对第一图像配对和第二图像配对中的图像内容是否相同的判断;以及修改模块730,配置用于响应于第一答案符合预定答案,修改第二图像配对的权重。
在本发明的一个实施方式中,进一步包括:判断模块,配置用于响应于第二图像配对的权重到达预定权重,判断第二图像配对中的图像内容是相同的。
在本发明的一个实施方式中,第一图像配对选自其中存储已知图像内容是否相同的图像配对的第一数据库,以及第二图像配对选自其中存储未知图像内容是否相同的图像配对的第二数据库。
在本发明的一个实施方式中,提供模块710包括:登录模块,配置用于响应于用户访问登录页面,向用户提供至少第一图像配对和第二图像配对。
在本发明的一个实施方式中,进一步包括:第一引导模块,配置用于响应于第一答案符合预定答案,将用户引导至与登录页面相关联的另一页面。
在本发明的一个实施方式中,进一步包括:第二引导模块,配置用于响应于第一答案不符合预定答案,再次调用上文所述的用于识别图像内容的装置。
在本发明的一个实施方式中,装置独立于登录页面而提供。
在本发明的一个实施方式中,第一图像配对和第二图像配对的显示顺序是随机的。
在本发明的一个实施方式中,进一步包括:移除模块,配置用于将第二图像配对从第二数据库中移除。
在本发明的一个实施方式中,图像内容是以下中的任一项:物品、动物以及人像。
附图中的流程图和框图显示了根据本发明的多个实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

Claims (20)

1.一种用于识别图像内容的方法,包括:
向用户提供至少第一图像配对和第二图像配对;
获取来自所述用户的第一答案和第二答案,其中所述第一答案和所述第二答案分别指示所述用户针对所述第一图像配对和所述第二图像配对中的图像内容是否相同的判断;以及
响应于所述第一答案符合预定答案,修改所述第二图像配对的权重。
2.根据权利要求1所述的方法,进一步包括:
响应于所述第二图像配对的权重到达预定权重,判断所述第二图像配对中的图像内容是相同的。
3.根据权利要求2所述的方法,其中:
所述第一图像配对选自其中存储已知图像内容是否相同的图像配对的第一数据库,以及所述第二图像配对选自其中存储未知图像内容是否相同的图像配对的第二数据库。
4.根据权利要求1-3中任一项所述的方法,其中向所述用户提供至少所述第一图像配对和所述第二图像配对包括:
响应于所述用户访问登录页面,向所述用户提供至少所述第一图像配对和所述第二图像配对。
5.根据权利要求4所述的方法,进一步包括:
响应于所述第一答案符合所述预定答案,将所述用户引导至与所述登录页面相关联的另一页面。
6.根据权利要求5所述的方法,进一步包括:
响应于所述第一答案不符合所述预定答案,再次执行根据权利要求1所述的方法。
7.根据权利要求4所述的方法,其中所述方法独立于所述登录页面而提供。
8.根据权利要求1-3中任一项所述的方法,其中:
所述第一图像配对和所述第二图像配对的显示顺序是随机的。
9.根据权利要求2所述的方法,进一步包括:
将所述第二图像配对从第二数据库中移除。
10.根据权利要求1-3中任一项所述的方法,其中所述图像内容是以下中的任一项:物品、动物以及人像。
11.一种用于识别图像内容的装置,包括:
提供模块,配置用于向用户提供至少第一图像配对和第二图像配对;
获取模块,配置用于获取来自所述用户的第一答案和第二答案,其中所述第一答案和所述第二答案分别指示所述用户针对所述第一图像配对和所述第二图像配对中的图像内容是否相同的判断;以及
修改模块,配置用于响应于所述第一答案符合预定答案,修改所述第二图像配对的权重。
12.根据权利要求11所述的装置,进一步包括:
判断模块,配置用于响应于所述第二图像配对的权重到达预定权重,判断所述第二图像配对中的图像内容是相同的。
13.根据权利要求12所述的装置,其中:
所述第一图像配对选自其中存储已知图像内容是否相同的图像配对的第一数据库,以及所述第二图像配对选自其中存储未知图像内容是否相同的图像配对的第二数据库。
14.根据权利要求11-13中任一项所述的装置,其中所述提供模块包括:
登录模块,配置用于响应于所述用户访问登录页面,向所述用户提供至少所述第一图像配对和所述第二图像配对。
15.根据权利要求14所述的装置,进一步包括:
第一引导模块,配置用于响应于所述第一答案符合所述预定答案,将所述用户引导至与所述登录页面相关联的另一页面。
16.根据权利要求15所述的装置,进一步包括:
第二引导模块,配置用于响应于所述第一答案不符合所述预定答案,再次调用根据权利要求11所述的装置。
17.根据权利要求14所述的装置,其中所述装置独立于所述登录页面而提供。
18.根据权利要求11-13中任一项所述的装置,其中:
所述第一图像配对和所述第二图像配对的显示顺序是随机的。
19.根据权利要求12所述的装置,进一步包括:
移除模块,配置用于将所述第二图像配对从第二数据库中移除。
20.根据权利要求11-13中任一项所述的装置,其中所述图像内容是以下中的任一项:物品、动物以及人像。
CN201210519142.XA 2012-11-28 2012-11-28 用于识别图像内容的方法和装置 Active CN103854031B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210519142.XA CN103854031B (zh) 2012-11-28 2012-11-28 用于识别图像内容的方法和装置
US14/089,909 US9436930B2 (en) 2012-11-28 2013-11-26 Method and apparatus for recognizing image content

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210519142.XA CN103854031B (zh) 2012-11-28 2012-11-28 用于识别图像内容的方法和装置

Publications (2)

Publication Number Publication Date
CN103854031A true CN103854031A (zh) 2014-06-11
CN103854031B CN103854031B (zh) 2016-12-28

Family

ID=50774529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210519142.XA Active CN103854031B (zh) 2012-11-28 2012-11-28 用于识别图像内容的方法和装置

Country Status (2)

Country Link
US (1) US9436930B2 (zh)
CN (1) CN103854031B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485261A (zh) * 2016-09-08 2017-03-08 北京小米移动软件有限公司 一种图像识别的方法和装置
CN109460652A (zh) * 2018-11-09 2019-03-12 连尚(新昌)网络科技有限公司 用于标注图像样本的方法、设备及计算机可读介质
CN109951431A (zh) * 2017-12-21 2019-06-28 北京京东尚科信息技术有限公司 验证方法、系统、电子设备及计算机可读介质
CN110005621A (zh) * 2018-06-13 2019-07-12 周超强 离心式防护型吹风机
CN113032542A (zh) * 2021-04-12 2021-06-25 腾讯科技(深圳)有限公司 一种直播数据处理方法、装置、设备及可读存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504316A (zh) * 2014-12-04 2015-04-08 英业达科技有限公司 整合验证码及密码的登入系统及其方法
CN106886707B (zh) * 2017-03-21 2020-06-09 广东网金控股股份有限公司 一种图像鉴权的方法及装置
CN109039990B (zh) * 2017-06-08 2020-07-07 腾讯科技(深圳)有限公司 基于验证码进行行为验证的方法及装置
US10388040B2 (en) * 2017-06-30 2019-08-20 Microsoft Technology Licensing, Llc Modeling actor and asset relationships
KR102210389B1 (ko) * 2019-06-24 2021-02-02 넷마블 주식회사 본인 인증 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159715A (zh) * 2007-11-16 2008-04-09 腾讯科技(深圳)有限公司 一种安全信息校验方法及安全信息校验装置以及客户端
US20080126478A1 (en) * 2004-12-16 2008-05-29 Renovo Limited Information Collection System
CN101291226A (zh) * 2008-05-19 2008-10-22 北京深思洛克数据保护中心 一种利用图片信息提高信息安全设备验证安全性的方法
WO2012148524A1 (en) * 2011-02-15 2012-11-01 Axon Sports, Llc Interactive cognitive recognition sports training system and methods

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2429094B (en) * 2005-08-09 2010-08-25 Royal Bank Of Scotland Group P Online transaction systems and methods
US8549651B2 (en) * 2007-02-02 2013-10-01 Facebook, Inc. Determining a trust level in a social network environment
US8413220B1 (en) * 2007-07-30 2013-04-02 Intuit Inc. System and method for user authentication
US8245277B2 (en) * 2008-10-15 2012-08-14 Towson University Universally usable human-interaction proof
US8483518B2 (en) * 2010-02-19 2013-07-09 Microsoft Corporation Image-based CAPTCHA exploiting context in object recognition
US8370926B1 (en) * 2010-04-27 2013-02-05 Symantec Corporation Systems and methods for authenticating users
US20130145441A1 (en) * 2011-06-03 2013-06-06 Dhawal Mujumdar Captcha authentication processes and systems using visual object identification
CN103581105B (zh) * 2012-07-18 2017-09-22 财付通支付科技有限公司 登录验证方法和登录验证系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080126478A1 (en) * 2004-12-16 2008-05-29 Renovo Limited Information Collection System
CN101159715A (zh) * 2007-11-16 2008-04-09 腾讯科技(深圳)有限公司 一种安全信息校验方法及安全信息校验装置以及客户端
CN101291226A (zh) * 2008-05-19 2008-10-22 北京深思洛克数据保护中心 一种利用图片信息提高信息安全设备验证安全性的方法
WO2012148524A1 (en) * 2011-02-15 2012-11-01 Axon Sports, Llc Interactive cognitive recognition sports training system and methods

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485261A (zh) * 2016-09-08 2017-03-08 北京小米移动软件有限公司 一种图像识别的方法和装置
CN106485261B (zh) * 2016-09-08 2020-06-02 北京小米移动软件有限公司 一种图像识别的方法和装置
CN109951431A (zh) * 2017-12-21 2019-06-28 北京京东尚科信息技术有限公司 验证方法、系统、电子设备及计算机可读介质
CN109951431B (zh) * 2017-12-21 2021-12-14 北京京东尚科信息技术有限公司 验证方法、系统、电子设备及计算机可读介质
CN110005621A (zh) * 2018-06-13 2019-07-12 周超强 离心式防护型吹风机
CN110005621B (zh) * 2018-06-13 2020-10-02 宁波瑞卡电器有限公司 离心式防护型吹风机
CN109460652A (zh) * 2018-11-09 2019-03-12 连尚(新昌)网络科技有限公司 用于标注图像样本的方法、设备及计算机可读介质
CN109460652B (zh) * 2018-11-09 2022-05-20 连尚(新昌)网络科技有限公司 用于标注图像样本的方法、设备及计算机可读介质
CN113032542A (zh) * 2021-04-12 2021-06-25 腾讯科技(深圳)有限公司 一种直播数据处理方法、装置、设备及可读存储介质
CN113032542B (zh) * 2021-04-12 2024-04-09 腾讯科技(深圳)有限公司 一种直播数据处理方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
US20140150057A1 (en) 2014-05-29
US9436930B2 (en) 2016-09-06
CN103854031B (zh) 2016-12-28

Similar Documents

Publication Publication Date Title
CN103854031B (zh) 用于识别图像内容的方法和装置
US10521505B2 (en) Cognitive mediator for generating blockchain smart contracts
CN106104555B (zh) 用于保护外围设备的行为分析
AU2014304803B2 (en) Systems and methods for image classification by correlating contextual cues with images
US10467308B2 (en) Method and system for processing social media data for content recommendation
CN111353091A (zh) 信息处理方法、装置、电子设备及可读存储介质
US10650133B2 (en) Systems and methods for providing image-based security measures
US20140007247A1 (en) Dynamic Security Question Compromise Checking Based on Incoming Social Network Postings
US11675928B2 (en) Electronic device for obfuscating and decoding data and method for controlling same
JP2018505462A (ja) アバター選択機構
WO2019109724A1 (zh) 一种推荐物品的方法和装置
US10755487B1 (en) Techniques for using perception profiles with augmented reality systems
US11514150B2 (en) Video display device and operating method therefor
US20140007242A1 (en) Notification of Security Question Compromise Level based on Social Network Interactions
Chaubey et al. Sentiment analysis of image with text caption using deep learning techniques
CN115081615A (zh) 一种神经网络的训练方法、数据的处理方法以及设备
US11756049B1 (en) Detection of evasive item listings
CN105653533B (zh) 一种更新分类关联词集合的方法和装置
Yang et al. A context-aware system in Internet of Things using modular Bayesian networks
JP2020004410A (ja) メディアベースのコンテンツシェアを容易にする方法、コンピュータプログラム及びコンピューティングデバイス
CN113761281B (zh) 虚拟资源处理方法、装置、介质及电子设备
CN107832690A (zh) 人脸识别的方法及相关产品
CN116610790B (zh) 应答数据的获取方法、装置、设备和介质
CN109446406A (zh) 一种数据处理方法、装置和用于数据处理的装置
US20230267373A1 (en) End-to-end artificial intelligence system with universal training and deployment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200408

Address after: Massachusetts, USA

Patentee after: EMC IP Holding Company LLC

Address before: Massachusetts, USA

Patentee before: EMC Corp.