CN106169064A - 一种现实增强系统的图像识别方法和系统 - Google Patents

一种现实增强系统的图像识别方法和系统 Download PDF

Info

Publication number
CN106169064A
CN106169064A CN201610479204.7A CN201610479204A CN106169064A CN 106169064 A CN106169064 A CN 106169064A CN 201610479204 A CN201610479204 A CN 201610479204A CN 106169064 A CN106169064 A CN 106169064A
Authority
CN
China
Prior art keywords
information
matrix
picture
article
photo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610479204.7A
Other languages
English (en)
Inventor
张梦石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610479204.7A priority Critical patent/CN106169064A/zh
Publication of CN106169064A publication Critical patent/CN106169064A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

提供了现实增强系统的图像识别方法和系统。通过识别图片或物体中隐藏的信息,来替代增强现实技术中的图像识别部分,提高了图像识别的准确度和效率。将图片嵌入隐藏信息。在隐藏信息中提供图片或物体的标识。用户通过终端的摄像头扫描提取隐藏的信息,然后终端将该隐藏信息和/或用户信息通过网络上传至服务器。当服务器收到信息后,根据隐藏的信息和/或用户信息来协助现实增强系统。

Description

一种现实增强系统的图像识别方法和系统
技术领域
本发明涉及图像识别技术。特别的,本发明涉及基于隐藏信息、智能手机及云计算的现实增强系统中的图像识别方法和系统。
背景技术
随着智能移动设备的普及,二维码成为了一种主流的信息获取方式并逐渐成为人们生活中不可或缺的一部分。现有的二维码技术主要通过某种特定的且按一定规律在平面分布的黑白相间的几何图形来记录数据符号信息。二维码在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理。常见的二维码有Data Matrix,MaxiCode,Qrcode,PDF417等。
二维码有着信息容量高,成本低的优点,但其也有着美观性与保密性差等缺点。首先,二维码是一种黑白相间的矩阵码,这种设计十分便于电子设备的读取,但是该设计与人类能够理解的自然图像有着巨大的差异,因此从美观性上讲,二维码增添了用户的视觉负担。同时,黑白色块这种显性设计便于分析以及破解二维码,这大大提高了二维码的使用风险。
随着信息技术的高速发展,商品等被仿造的现象越来越严重,这些假冒商品不仅损害了生产商的利益,同时也威胁着消费者的生命财产安全。其原因有二,第一,传统的防伪工具(如激光防伪,变温防伪)已经不足以抵抗犯罪分子的破解和仿造手段,第二,消费者参与防伪的成本过高,比如有些防伪工具需要专业的检测设备,或者需要消费者发短信发照片等。而随着数字印刷的崛起以及二维码的普及,基于“一物一码”的二维码防伪逐渐被大家接受和推崇,这一技术降低了检测的成本,但是也大大提高了消费者的风险。比如,不法分子可以通过设计伪造的信息检验平台来蒙骗消费者,更有甚者会将二维码中植入病毒,然后通过二维码防伪这一幌子诱导消费者中毒从而盗取其信息或钱财。
发明内容
本发明将提供一种全新的信息嵌入、提取方法以克服传统二维码美观性与保密性差的缺点。在不引起肉眼可感知的图像差异的前提下,将信息安全、可靠地 嵌入到包括电子显示图片、打印图片、照片、印刷品等多种图片中。并且在无需专用设备的情况下,利用普通的诸如摄像头、照相机等图像采集装置来获取图像并从图像中提取出所嵌入的信息。
本发明还将提供一种全新的防伪方法以克服传统防伪工具成本高与安全性差等缺点,即在不引起肉眼可感知的图像差异的前提下,将验证信息安全可靠的嵌入到产品的包装之中。并且在无需专用设备的情况下,利用普通的诸如手机摄像头等图像采集装置来获取图像并从其中提取出所嵌入的信息,随后通过上传验证信息至网络数据库获得验证结果。
根据本发明的一个实施方式,提供了一种记录第一信息方法,包括:对第一信息进行编码,得到第一信息矩阵Ic;从第一图片中的亮度色度色彩模型的3个通道中,选择其中高频成分少的第一通道;将信息矩阵Ic嵌入到第一通道。
根据本发明的又一个实施方式,提供了一种记录第一信息方法,包括:对第一信息进行编码,得到第一信息矩阵Ic;从第一图片中的亮度色度色彩模型的3个通道中,选择其中高频成分较少的第一通道与第二通道;将信息矩阵Ic嵌入到第一通道,将信息矩阵Ic嵌入到第二通道。
根据本发明的又一个实施方式,提供了一种记录第一信息的方法,包括:对第一信息进行容错编码,得到第一比特流;将第一定位符比特流与第一比特流以预定模式融合,得到第一矩阵;对第一矩阵加密(扩频),得到信息矩阵Ic;从第一图片中的亮度色度色彩模型的3个通道中,选择其中高频成分较少的第一通道与第二通道;将信息矩阵Ic嵌入到第一通道矩阵的一个或多个预定位置;
将信息矩阵Ic嵌入到第二通道矩阵的一个或多个预定位置。
根据本发明的又一个实施方式,提供了一种记录第一信息的方法,包括:对第一信息进行容错编码,得到第一比特流;将第一定位符比特流与第一比特流以预定模式融合,得到第一矩阵;对第一矩阵加密(扩频),得到信息矩阵Ic;从第一图片中的亮度色度色彩模型的3个通道中,选择其中高频成分较少的第一通道与第二通道;将信息矩阵Ic的第一多个预定部分嵌入到第一通道矩阵的第一多个预定位置;将信息矩阵Ic的第一多个预定部分嵌入到第二通道矩阵的第一多个预定位置。
根据本发明的又一个实施方式,提供了一种记录第一信息的方法,包括:对第一信息进行容错编码,得到第一比特流;将第一定位符比特流与第一比特流以预定模式融合,得到第一矩阵,使得定位符出现在第一矩阵的预定位置;对第一矩阵加密(扩频),得到信息矩阵Ic,其中在加密过程中使用第一模板矩阵替换第一矩阵中具有第一值的元素,使用第二模板矩阵替换第一矩阵中具有第二值的元素;从第一图片中的亮度色度色彩模型的3个通道中,选择其中高频成分较少 的第一通道与第二通道;修改第一通道,将信息矩阵Ic的第一多个预定部分嵌入到第一通道矩阵的第一多个预定位置;修改第二通道,将信息矩阵Ic的第一多个预定部分嵌入到第二通道矩阵的第一多个预定位置;基于修改后的第一通道、修改后的第二通道以及第三通道得到修改后的第一图片;以及记录修改后的第一图片或将修改后的第一图片印刷于物体表面。
根据本发明的上述实施方式之一,提供了记录第一信息的方法,其中将信息矩阵Ic的第一多个预定部分嵌入到第一通道矩阵的第一多个预定位置,包括:将信息矩阵Ic的第一多个预定部分的每个所对应的矩阵,与相对应的第一通道矩阵的第一多个预定位置之一所对应的矩阵相加。
根据本发明的上述实施方式提供了记录第一信息的方法,其中所述第一多个预定位置满足第一几何排布,使得所述第一多个预定位置彼此不会交叠。
根据本发明的上述实施方式提供了记录第一信息的方法,其中第一模板矩阵与第二模板矩阵的每个元素的值介于[-a,a],a是预定的较小的数。
根据本发明的上述实施方式提供了记录第一信息的方法,其中所述容错编码是RS码;以及其中将第一定位符比特流与第一比特流以预定模式融合,得到第一矩阵,使得定位符出现在第一矩阵的预定位置,包括:利用zig-zag编码将第一比特流编码为第一矩阵,用第一定位符填充第一矩阵中的空余位置。
根据本发明的上述实施方式之一提供了记录第一信息的方法,其中所述亮度色度色彩模型是CIE L*a*b*模型。
根据本发明又一方面的一个实施方式,提供了一种从图片或物体中提取第一信息的方法,包括:通过照相机或摄像头获取图片或物体的照片;从所述照片中提取亮度色度色彩模型的3个通道,选择其中高频成分少的第一通道;对第一通道的矩阵进行高通滤波,得到第一矩阵;从第一矩阵的预定位置提取信息矩阵;对信息矩阵进行解码提取出第一信息。
根据本发明又一方面的一个实施方式,提供了一种从图片或物体中提取第一信息的方法,包括:通过摄像头获取图片或物体的照片;从所述照片中提取亮度色度色彩模型的3个通道,选择其中高频成分较少的第一通道与第二通道;对第一通道的矩阵进行高通滤波,得到第一矩阵;对第二通道的矩阵进行高通滤波,得到第二矩阵;将第一矩阵与第二矩阵相加,得到(含有信息的)第三矩阵;对第三矩阵的预定位置提取信息矩阵;对信息矩阵进行解码提取出第一信息。
根据本发明又一方面的上述实施方式,提供了提取第一信息的方法,其中:从第三矩阵中基于缩放参数和/或旋转参数提取出多个信息矩阵;对所述多个信息矩阵进行容错解码,从解码成功的结果中提取出第一信息。
根据本发明又一方面的上述实施方式,提供了提取第一信息的方法,其中: 对信息矩阵进行解码提取出第一信息包括:对信息矩阵进行逆扩频得到一个或多个第四矩阵;对一个或多个第四矩阵的预定位置提取出一个或多个比特流;对所述一个或多个比特流进行容错解码,得到第一信息。
根据本发明依然又一方面的一个实施方式,提供了一种从图片或物体中提取第一信息的方法,包括:通过摄像头获取图片或物体的照片;从所述照片中提取亮度色度色彩模型的3个通道,选择其中高频成分较少的第一通道与第二通道;对第一通道的矩阵进行高通滤波,得到第一矩阵;对第二通道的矩阵进行高通滤波,得到第二矩阵;将第一矩阵与第二矩阵相加,得到(含有信息的)第三矩阵;从第三矩阵中提取出旋转参数和/或缩放参数;基于所述旋转参数和/或所述缩放参数对第三矩阵进行校正,得到第四矩阵;在第四矩阵中基于一个或多个预设的定位符确定一个或多个信息矩阵;对一个或多个信息矩阵逆扩频得到一个或多个第五矩阵;对一个或多个第五矩阵的预定位置提取出一个或多个比特流;对所述一个或多个比特流进行容错解码,得到第一信息。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,其中:所述从第三矩阵中提取出旋转参数和/或缩放参数包括:从第三矩阵中提取多个特征点;基于多个特征点的排布(如基于聚类算法得到的几何中心)确定所述照片的旋转参数和/或缩放参数。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,其中:所述从第三矩阵中提取出旋转参数和/或缩放参数包括:从第三矩阵中搜索预设定位符图样;基于索搜到的多个预设定位符图样的排布(如基于聚类算法得到的几何中心),确定所述照片的旋转参数和/或缩放参数。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,其中:所述从第三矩阵中提取出旋转参数和/或缩放参数包括:将预定定位符放置于第六矩阵的预定位置,获取第六矩阵的能量谱矩阵;获得第三矩阵的能量谱矩阵;比较第六矩阵的能量谱矩阵与第三矩阵的能量谱矩阵,确定所述照片的旋转参数和/或缩放参数。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,其中在第四矩阵中基于一个或多个预设的定位符确定一个或多个信息矩阵,包括:在第一矩阵中匹配预设的一个或多个定位符,基于定位符的位置确定一个或多个信息矩阵的位置,并提取出一个或多个信息矩阵。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,在通过摄像头获取物品的照片后,还包括:识别所述照片中图标;基于所述照片的图标与预定图标的差异,估计所述摄像头与所述物品的距离和/或角度;根据所述距离和/或角度校正所述照片。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,在通过摄像头获取物品的照片后,还包括:识别所述照片中图标;基于所述照片的图标与预定图标的差异,估计所述摄像头与所述物品的距离和/或角度;根据所述距离和/或角度提醒和/或指示用户调整所述摄像头与所述物品的距离和/或角度,并再次通过摄像头获取物品的照片。
根据本发明依然又一方面的实施方式,提供了提取第一信息的方法,在识别所述照片中图标后,还包括:基于所述照片或其中图标的亮度和/或色调与预设阈值间的差异,确定环境光照,并提示用户开启闪光灯或在手机应用中开启闪光灯来进行补光。
根据本发明的依然另一方面,提供了一种记录第一信息装置,包括:用于对第一信息进行编码,得到第一信息矩阵Ic的模块;用于从第一图片中的亮度色度色彩模型的3个通道中,选择其中高频成分少的第一通道的模块;以及用于将信息矩阵Ic嵌入到第一通道的模块。
根据本发明的依然另一方面,提供了一种从图片或物体中提取第一信息的装置,包括:用于通过照相机或摄像头获取图片或物体的照片的模块;用于从所述照片中提取亮度色度色彩模型的3个通道,选择其中高频成分少的第一通道的模块;用于对第一通道的矩阵进行高通滤波,得到第一矩阵的模块;用于从第一矩阵的预定位置提取信息矩阵的模块;以及用于对信息矩阵进行解码提取出第一信息的模块。
根据本发明的依然另一方面,提供了一种从图片或物体中提取第一信息的装置,包括:用于通过摄像头获取图片或物体的照片的模块;用于从所述照片中提取亮度色度色彩模型的3个通道,选择其中高频成分较少的第一通道与第二通道的模块;用于对第一通道的矩阵进行高通滤波,得到第一矩阵;对第二通道的矩阵进行高通滤波,得到第二矩阵的模块;用于将第一矩阵与第二矩阵相加,得到(含有信息的)第三矩阵的模块;用于从第三矩阵中提取出旋转参数和/或缩放参数的模块;用于基于所述旋转参数和/或所述缩放参数对第三矩阵进行校正,得到第四矩阵的模块;用于在第四矩阵中基于一个或多个预设的定位符确定一个或多个信息矩阵的模块;用于对一个或多个信息矩阵逆扩频得到一个或多个第五矩阵的模块;用于对一个或多个第五矩阵的预定位置提取出一个或多个比特流的模块;以及用于对所述一个或多个比特流进行容错解码,得到第一信息的模块。
根据本发明依然又一方面的实施方式,提供了从图片或物体提取第一信息的装置,在用于通过摄像头获取图片或物体的照片的模块后,还包括:用于识别所述照片中图标的模块;用于基于所述照片的图标与预定图标的差异,估计所述摄像头与所述物品的距离和/或角度的模块;以及用于根据所述距离和/或角度校正 所述照片的模块。
根据本发明依然又一方面的实施方式,提供了从图片或物体提取第一信息的装置,在用于通过摄像头获取图片或物体的照片的模块后,还包括:用于识别所述照片中图标的模块;用于基于所述照片的图标与预定图标的差异,估计所述摄像头与所述物品的距离和/或角度的模块;用于根据所述距离和/或角度提醒和/或指示用户调整所述摄像头与所述物品的距离和/或角度,并再次通过摄像头获取物品的照片的模块。
根据本发明依然又一方面的实施方式,提供了从图片或物体提取第一信息的装置,在用于通过摄像头获取图片或物体的照片的模块后,还包括:基于所述照片或其中图标的亮度和/或色调与预设阈值间的差异,确定环境光照,并提示用户开启闪光灯或在手机应用中开启闪光灯来进行补光的模块。
根据本发明的依然另一方面,提供了一种防伪方法,包括:如本发明前述实施例所述的从图片或物体中提取第一信息的方法;以及将提取到的第一信息发送到服务器;接收服务器返回的第二信息,其中服务器对第一信息进行校验,并根据校验结果返回第二信息,所述第二信息指示与所述第一信息相关联的物品的被伪造风险。根据本发明的依然另一方面提供的防伪方法,还包括:所述服务器对所述第一信息进行解密。
根据本发明的依然另一方面提供的防伪方法,其中:若服务器对第一信息校验失败,所述第二信息指示与所述第一信息相关联的物品存在被伪造的风险。
根据本发明的依然另一方面提供的防伪方法,其中:若服务器在数据库中未找到与第一信息相关联的信息,所述第二信息指示与所述第一信息相关联的物品存在被伪造的风险。
根据本发明的依然另一方面提供的防伪方法,其中:若服务器发现已多次接收所述第一信息,所述第二信息指示与多次接收所述第一信息相关联的信息。
根据本发明的依然另一方面,提供了一种计算机系统,包括处理器与存储器,所述处理器通过执行存储于存储器中的计算机程序而执行根据本发明上述实施方式中的记录第一信息的方法或提取第一信息的方法。
根据本发明的依然另一方面,提供了一种防伪装置,包括:如本发明前述实施例所述的提供了从图片或物体提取第一信息的装置;以及用于将提取到的第一信息发送到服务器的模块;用于接收服务器返回的第二信息的模块,其中服务器对第一信息进行校验,并根据校验结果返回第二信息,所述第二信息指示与所述第一信息相关联的物品的被伪造风险。
根据本发明的依然另一方面提供的防伪装置,其中,所述服务器对所述第一信息进行解密。
根据本发明的依然另一方面提供的防伪装置,其中:若服务器对第一信息校验失败,所述第二信息指示与所述第一信息相关联的物品存在被伪造的风险。
根据本发明的依然另一方面提供的防伪装置,其中:若服务器在数据库中未找到与第一信息相关联的信息,所述第二信息指示与所述第一信息相关联的物品存在被伪造的风险。
根据本发明的依然另一方面提供的防伪装置,其中:若服务器发现已多次接收所述第一信息,所述第二信息指示与多次接收所述第一信息相关联的信息。
根据本发明的又一方面,提供了一种实现现实增强的方法,包括:如本发明前述实施方式所述的从图片或物体中提取第一信息的方法;以及将提取到的第一信息和/或用户信息发送给服务器;接收服务器返回的第二信息,其中服务器根据第一信息获取物品的特征点信息与物品的3D模型信息,并根据获取的特征点信息与物品的3D模型信息返回第二信息;根据第二信息生成所述物品的增强现实图像。
根据本发明的又一方面提供的实现现实增强的方法,还包括:根据第二信息中的特征点信息,从所述物品的照片中识别所述物品的一个或多个特征点;根据所述一个或多个特征点,确定摄像头与所述物体的相对姿态,并生成空间变换矩阵;根据空间变换矩阵与3D模型信息生成所述物品的增强现实图像。
根据本发明的又一方面提供的实现现实增强的方法,其中所述服务器根据所述用户信息生成所述第二信息,以及所述用户信息指示了生成第二信息的方式或物品的权限。
根据本发明的又一方面,提供了一种实现现实增强的装置,包括:如本发明前述实施方式提供的从图片或物体提取第一信息的装置;以及发送模块,用于将提取到的第一信息和/或用户信息发送给服务器;接收模块,用于接收服务器返回的第二信息,其中服务器根据第一信息获取物品的特征点信息与物品的3D模型信息,并根据获取的特征点信息与物品的3D模型信息返回第二信息;图像生成模块,用于根据第二信息生成所述物品的增强现实图像。
根据本发明的依然另一方面,提供了一种程序,当被加载到计算机存储器中执行时,使得所述计算机执行根据本发明上述实施方式中的记录第一信息的方法、提取第一信息的方法、防伪方法或实现现实增强的方法。
根据本发明的依然另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有程序,当所述程序被加载到计算机存储器中执行时,使得计算机执行根据本发明上述实施方式中的记录第一信息的方法、提取第一信息的方法、防伪方法或实现现实增强的方法。
附图说明
图1是根据本发明实施例的信息记录方法的示意图;
图2是根据本发明又一实施例的信息记录方法的示意图;
图3是根据本发明实施例的信息记录方法的流程图;
图4展示了根据本发明实施例的码字与定位符;
图5是根据本发明实施例的信息提取过程的示意图;
图6是根据本发明又一实施例的信息提取过程的示意图;
图7是根据本发明实施例的信息提取方法的流程图;
图8是根据本发明又一实施例的信息提取方法的流程图;
图9是根据增强现实系统的示意图;
图10是根据本发明实施例的图像识别方法的流程图。
具体实施方式
参看图1,图1是根据本发明实施的信息记录方法的示意图。序列110是待记录的信息。信息可以是例如矩阵、字节序列、字符串等。对序列110编码得到矩阵120。在一个例子中,为了容错的目的对序列110进行容错编码,以得到矩阵120。多种容错编码可以被使用,例如,RS编码、LDPC编码、Turbo编码、BCH编码等。在另一个例子中,为了加密的目的对序列110或经容错编码得到的序列进行编码。在依然另一个例子中,对序列110进行扩频编码。在编码中,还可以在序列110中插入预定模式的标识符。
在根据本发明的实施例中,将信息记录在图像中。为了不在图像中引起肉眼可感知的差异,将信息记录在图像的亮度色度色彩模型的一个或两个通道中。亮度色度色彩模型有多种选择,例如CIE L*a*b*、HSV、YCbCr模型。选取亮度色度色彩模型的三个通道中,高频分量少的一个或两个通道。在图1中,通道130是从图片中选出的高频分量最少的通道。高频分量少,意味着待插入信息的图片的该通道中细节内容较少,因而,将信息“伪装”成噪声插入通道130,这种嵌入方式并不会让肉眼感知到两者的差异,观察者只是隐约觉得照片中多了一些噪点。继续参看图1,将矩阵120嵌入到通道130,得到嵌入了信息的图片140。需要说明的是,在图1中,为了清楚展示的目的,将矩阵120展示为具有明显特征的图案,在嵌入了信息的图片140中,也能够清晰地看到矩阵120。但应当理解的是,经编码后的矩阵120在图片140中更像稀疏的噪声点,而不会引起肉眼可明显感知的差异。为了便于信息提取的目的,将矩阵120嵌入到图片140的预定位置,从而在提取信息中,从图片140的预定位置能够找到包含有信息的矩阵120。
图2是根据本发明又一实施例的信息记录方法的示意图。为提高鲁棒性,在 图片240中嵌入矩阵220、矩阵222以及矩阵224。在一个例子中,矩阵220、矩阵222以及矩阵224是相同的矩阵,从而从图片240中提取出矩阵220、矩阵222以及矩阵224的任何一个,都能够提取出所记录的信息。在另一个例子中,矩阵220、矩阵222以及矩阵224是不同的矩阵,从而在图片240中能容纳更多的信息。图片240可以是平面印刷品,如海报、图书、小册子,也可以是在商品包装上印刷的图案,或者是商标表面纹理、图案的一部分,以及还可以是在电脑、手机等的显示器上展示的图片。
参看图2,矩阵220、矩阵222以及矩阵224被布置在预定的位置,并且共同构成预定的直角三角形图案。为了捕获图片240,而对图片240拍照。拍照得到的图片,同图片240相比,可能具有不同的缩放比例和/或旋转角度。从拍照得到的图片中,获取含有信息的三个矩阵所构成的三角形形状,并同图片240中矩阵220、矩阵222以及矩阵224构成的直角三角形相比较,确定拍照得到的图片相对于图片240的缩放比例和/或旋转角度。从而得到拍照得到的图片中,含有信息的矩阵的位置,并进一步地提取出含有信息的矩阵。显然,在根据本发明的实施例中,在图片中可嵌入其他数量的矩阵,以及可在图片的多个预定位置嵌入矩阵,所嵌入的矩阵可组成多种图案或图样。
图3是根据本发明实施例的信息记录方法的流程图。在步骤310,获得信息I,信息I是要记录在图片中的信息。信息I可以是比特序列、字符串、矩阵等多种形式。在步骤320,对信息I进行容错编码,得到码字C,从而提高信息I记录与提取过程的可靠性。在步骤330,在码字C中插入定位符,得到码字CI(参看图4,方阵420)。通过定位符,能够准确地确定码字CI在图片P中的位置,从而从图片P的准确位置提取出码字CI。
定位符可以有多种形式。参看图4,在一个例子中,经过容错编码后的码字C为n(n=5)比特的比特流{1,0,1,1,1}。利用Zig-Zag排序方法向比特流中插入定位符。n位的比特流{1,0,1,1,1}变成一个k*k的方阵(参看图4的方阵420)。其中k*k为大于n的最小完全平方数,在图4的例子中,k=3。在方阵420中,比特流未覆盖的位置用0填充,所填充的0作为定位符。在图4中,方阵420中,实线方块部分包括经过容错编码后的码字C的比特流{1,0,1,1,1},虚线方块部分包括定位符{0,0,0,0}。在图4中展示了在码字C中插入定位符以得到码字CI的一个例子。可使用多种不同方式在码字C中插入定位符。例如,可以在码字C的多种预定位置插入定位符。以及所得到的码字CI可具有多种形式,例如矩阵、比特流等。定位符的样式不限于全0的比特,还可以是其他易于识别且在信息编码中不会或很少出现的序列,例如全“1”序列“11111”、预定数量的“0、1”交织的序列等。
返回参看图3,在步骤340,对码字CI加密,得到码字Ce。在一个例子中,加密的目的在于信息安全,使得不掌握密钥或加密算法的第三方无法获知码字CI的内容。为此目的,可使用AES、3DES等多种加密算法。在另一个例子中,除了信息安全之外,还为了扩频的目的对码字CI加密,使得加密后的码字Ce的能量密度较低,从而肉眼难以察觉图片中被嵌入了码字Ce。
作为举例,为了对码字CI加密,码字CI中的1比特将被替换为8个数字。比特“1”用序列(1,0.2,-2,3.2,0,-1,0.4,0.8)替换,而对于码字CI中的比特“0”,用序列(0.2,-1.5,3,1,0.4,0.4,-1,0.3)替换。这样的扩频方法将窄且强的信号变成了宽但弱的信号。新产生的信号有三个优点,一是能量密度低,这样嵌入信息的不可见性好;二是鲁棒性强,在实际操作中,拍摄环境和摄像头将会带来大量的噪声(比如拍摄环境光线复杂,摄像头白平衡、曝光调节等),扩频能保证接收端成功解出嵌入的信息;三是扩频的具体方法是由嵌入端决定的,因此具有比较好的保密性。
在进一步的例子中,用于替换比特“0”的序列与用于替换比特“1”的序列是随机生成的,这样它们的相关性很差。在这个例子中,接收端收到了(假设是带有噪声的,模拟的)数据(0.7,0.2,-0.8,2,0.2,0.5,0,1),可以根据发送端的扩展方式对接收到的数据进行判定,数据和1对应序列的相关性为0.8606,和0对应序列的相关性为0.0021,因此接收端将这一串数据判定为1。而对于第三方的接收端,由于不知道发送端的扩展方式,它将无法计算相关性,因此无法解出数据。
继续参看图3,在步骤350,获得图片P。图片P用来承载待嵌入的信息I。在一个例子中,图片P将被制作为海报、平面广告,并被打印以向用户展示。用户通过对海报或平面广告商的图片P拍照并从图片P中提取信息I。
在根据本发明一个实施例中,将信息I嵌入到图片P中,而无须执行步骤320-步骤340。在根据本发明的又一个实施例中,选择执行步骤320-步骤340中的一个或多个,并将得到的结果嵌入到图片P中。图片P可用多种色彩模型表达。色彩模型的例子包括RGB色彩模型与诸如HSV、YCbCr、CIE L*a*b*的亮度-色度色彩模型。不同的色彩模型中,一般包括多个通道(例如,3个)。在步骤360,将图片P进行变换,用色彩模型的多个通道来表达图片P。对图片P的色彩模型的多个通道的表达进行分析,选择多个通道中高频成分少的一个或多个通道Ch。通道中高频成分少,意味着图片P在这个通道上的细节较少,在这样的通道上嵌入附加信息后,附加信息成为该通道的细节,并且肉眼不易察觉。
在一个例子中,用CIE L*a*b*模型表达图片P,并选取其中L、a、b通道中高频成分少的两个通道。在进一步的例子中,通过以下算法筛选低频色彩通道。首先对于每一条通道Ch,通过高通滤波器对其进行滤波(高通滤波器可选用尺 寸为3x3的拉普拉斯滤波器),然后将所得结果的每个值的绝对值进行加和得到高频度量值v。最后从中选取v最低的两个通道作为低频通道。下面是3x3的拉普拉斯滤波器的一个例子。
-1 -1 -1
-1 8 -1
-1 -1 -1
作为举例,a通道与b通道是所选择的通道。所属领域技术人员将意识到,可采用其他频域变换方法,获得每一通道Ch的频域特征,并选出高频成分少的通道。
在步骤370,将码字Ce按照一定的几何排布嵌入到通道Ch中。在一个例子中,a通道是图片P中高频成分最少的通道。在a通道的表达(例如,矩阵)的预定位置,嵌入码字Ce。在另一个例子中,a通道与b通道是图片P中高频成分较少的两个通道。在a通道与b通道的表达(例如,矩阵)的(相同)预定位置,嵌入相同的码字Ce。由于两个通道会彼此影响,当两通道的同样位置嵌入相同的信息时,有利于信息还原。
在一个例子中,将表达码字Ce的矩阵与通道a/b预定位置的子矩阵加和来将码字Ce嵌入到通道a/b中。在进一步的例子中,如果加和结果中的某些元素超过了通道元素取值的上/下限(例如1字节编码值上限为255),则将该元素的值设为上/下限。所属领域技术人员将意识到可利用多种方式将码字Ce嵌入到通道的表达中。例如,作为另一个例子,用表达码字Ce的矩阵替换通道a/b预定位置的子矩阵。
在另一个例子中,表达码字Ce的矩阵的多个副本以预定的几何排布嵌入到通道a/b中,从而在提取信息时,有更高的可靠性。作为举例,返回参看图2,将在低频通道a中嵌入表达码字Ce的矩阵的三个副本,这些副本在表达通道a/b的矩阵中的位置彼此不交叠,且这些副本的几何中心的排布方式满足图2所示的三角形几何排布,即三个副本的相对位置是预定且已知的。从而在提取信息中,可利用多个副本的预定相对位置,以及副本自身的特征,找到表达通道a/b的矩阵中嵌入副本的位置。
在步骤380,利用嵌入了码字Ce的色彩模型的多个通道的表达,得到修改后的图片P’。在一个例子中,将码字Ce嵌入到CIE L*a*b*色彩模型的两个通道中,并将CIE L*a*b*色彩模型表达的图片转换为RGB色彩模型表达的图片P’。在进一步的例子中,将图片P’打印或印刷到平面媒体、海报、书籍或杂志中。由于码字Ce经过加密或扩频,其信息矩阵能量很低,因此嵌入了码字Ce后的图 片与原始图片并没有很大的区别,人眼很难感知到图片被修改。从而不会影响图片P本身的展示效果。
上面已经描述了根据本发明实施例的将信息记录到图片中的方法。下面继续描述根据本发明实施例的从图片中提取信息的过程。
图5是根据本发明实施例的信息提取过程的示意图。在根据本发明的实施例中,用户通过手机、相机或其他图像采集装置获取图片510。图片510是例如采集到的海报、广告、杂志扉页、书刊插画的照片。图片510可以是平面印刷品,也可以是在商品包装上印刷的图案,或者是商标表面纹理、图案的一部分。在图片510的预定位置515中已经被嵌入了矩阵520。在一个例子中,矩阵520的位置515和/或编码方式是预定的。在另一个例子中,由于矩阵520中含有定位符,通过从图片510中提取出定位符,能够进一步提取出矩阵520。对矩阵520进行编码过程的逆变换,得到信息矩阵530。从而用户能够知晓在图片510中隐藏的信息。以此方式,将现有技术中利用二维码或条码所记录的信息以不为人眼所觉察的方式嵌入到图片中,不影响图片510的外观,又允许用户从图片510中提取现有技术中由二维码或条码等所承载的信息。
图6是根据本发明又一实施例的信息提取过程的示意图。在根据本发明的实施例中,用户通过手机、相机或其他图像采集装置获取图片610。图片610是例如采集到的海报、广告、杂志扉页、书刊插画的照片。在图片610的预定位置615、预定位置616与预定位置617中已经被嵌入了矩阵。在一个例子中,矩阵的位置615、位置616与位置617和/或编码方式是预定的。然而,由于用户获取图片610时,其拍摄角度、位置的不确定性,造成所采集的图片610不同于原始生成的图片。而是,图片610相对于原始生成图片存在尺寸、旋转角度和/或俯仰角度等方面的差异。为了从图片610中提取信息,需要确定预定位置615、预定位置616与预定位置617。
在根据本发明的实施例中,在信息中嵌入了定位符,定位符使得图片610呈现出已知的特征,通过提取已知的特征,确定预定位置615、预定位置616与预定位置617。在一个例子中,将图片610由预定色彩模型表达。例如由CIE L*a*b*模型的3个通道表达,并选择被嵌入了信息的1个或2个通道。嵌入了信息的通道可以是预先已知的,也可以是从图片610的多个通道中选择的高频分量少的通道a/b。在通道a/b中,定位符使得在通道a/b的表达中存在预定的特征点,例如经过高通滤波后,大于预定值的点,或者符合预定模式的点集。参看图6,示出了特征点群625、特征点群626以及特征点群627。通过聚类分组计算每组特征点群的几何中心(几何中心635、几何中心636与几何中心637),并且多组特征点群各自的几何中心呈现出几何排布。通过比较在信息嵌入时使用的几何排布 (参看图2的三角形排布)与从图片610中提取的几何排布,两个几何排布的差异体现了图片610相对于信息嵌入时生成的图片的缩放尺寸、旋转角度和/或俯仰角度。
依据所得到的缩放尺寸、旋转角度和/或俯仰角度对图片610的所选通道的预定位置615、预定位置616与预定位置617处的矩阵(例如矩阵650)进行校正,得到信息矩阵660。通过对信息矩阵660进行编码过程的逆运算,提取出嵌入图片610的信息。
图7是根据本发明实施例的信息提取方法的流程图。在步骤710,获取图片P。可通过手机、相机、摄像头等多种方式捕获图片P。在一个例子中,在捕获图片P时依据图片的轮廓、形状等确定图片P的位置,使得所捕获的图片P与原始图像具有相同的尺寸和方向。
在步骤720,选择图片P的高频成分少的通道Ch。在一个例子中,已知将信息嵌入图片的过程中,将信息嵌入CIE L*a*b*色彩模型的a通道。在步骤720中,将图片P变换为采用CIE L*a*b*色彩模型表达,并选择其中的a通道。在另一个例子中,已知将信息嵌入图片的过程中选择了高频分量较少的通道,相应地将图片P变换为采用CIE L*a*b*色彩模型表达,并选择高频分量较少的通道,例如通道a。在依然另一个例子中,由用户指定色彩模型中的通道。在另一个例子中,信息被嵌入到CIE L*a*b*色彩模型的两个通道,则选择图片P的CIEL*a*b*色彩模型的两个相应通道Ch1与Ch2。
在步骤730,对步骤720中选择的通道Ch进行高通滤波,得到信息矩阵Im。在根据本发明实施例的将信息记录到图片中的过程中,将信息作为高频成分记录到图片P中。因而在从图片P中提取信息的过程中,提取相应色彩模型的通道中的高频成分,得到矩阵Im。在一个例子中,在步骤720中已经对CIE L*a*b*色彩模型的每个通道的表达进行高通滤波,并选择出高通分量少的通道,在此情况下,步骤730中无需再进行高通滤波。在又一个例子中,在步骤720中,选择了两个通道a/b,相应地在步骤730,对两个通道a/b的每一个执行高通滤波,得到矩阵Im1与矩阵Im2,并将矩阵Im1与矩阵Im2相加,以得到含有信息的矩阵Im,并提高信息提取过程的可靠性。
在步骤740,从矩阵Im的预定位置提取出子矩阵Is,子矩阵Is依据信息记录过程的逆过程进行解码,得到记录在图片中的信息I。返回参看图5,已知信息被嵌入到图片的预定位置,并因而可确定信息在高通分量少的通道Ch中的位置。因而矩阵Im的预定位置的子矩阵Is为嵌入了信息的矩阵。为解码子矩阵,首先对子矩阵进行解密或解扩频。解密或解扩频的结果中包含了信息码字与定位符。由于信息码字与定位符是按预定模式生成信息矩阵(例如,Zig-Zag编码方 法),从包含信息码字与定位符的解密或解扩频结果中能够提取出信息码字。在进一步的例子中,记录信息I时,对信息I进行了错误校正编码,则对所提取的信息码字进行相应的错误校正解码,并得到所记录的信息I。由于对信息I进行了错误校正编码,即使由于图片P捕获时引入的采样噪声或位置偏差使得矩阵Im中存在若干错误,也能够在错误校正解码过程中得到正确的信息I,或者得到信息I中存在错误的指示。
在根据本发明的一个例子中,基于已知的信息记录过程中选择的编码方法、插入信息矩阵的位置、选择的色彩模型通道等从图片P中提取信息。在根据本发明另一个例子中,将信息记录过程中使用的编码方法、插入信息矩阵的位置、选择的色彩模型通道等元数据记录在图片P中,并在信息提取过程中从图片P获取元数据信息用于从图片中提取所记录的信息。在依然又一个例子中,在图片P中嵌入二维码等来记录元数据信息。即使图片P在尺寸、旋转角度/俯仰角度等方面相对于原始图片发生变化,从二维码中也能够提取出图片P相对于原始图片的缩放尺寸、旋转角度/俯仰角度等信息。
图8是根据本发明又一实施例的信息提取方法的流程图。在步骤810,获取图片P。可通过智能手机、相机、摄像头等多种方式捕获图片P。由于用户获取图片P时,其拍摄角度、位置的不确定性,造成所采集的图片P不同于原始生成的图片。因而,图片P相对于原始生成图片存在尺寸、旋转角度和/或俯仰角度等方面的差异。为了从图片P中获取信息,需要确定图片P相对于原始图片在尺寸、旋转角度和/或俯仰角度等方面的差异。
在步骤820,选择图片P的高频成分少的通道Ch。在步骤830,对步骤820中选择的通道Ch进行高通滤波,得到信息矩阵Im。
在步骤835,对信息矩阵Im进行校准,得到经校准的矩阵Ic。利用图片P相对于原始图片在尺寸、旋转角度和/或俯仰角度等方面的差异,对信息矩阵Im进行相对应的变换,得到经校准的矩阵Ic。
在一个例子中,在图片P中嵌入二维码等现有技术的可识别图形,通过识别二维码本身的缩放尺寸、旋转角度和/或俯仰角度等参数,作为对信息矩阵Im进行校准所需的参数。
在又一个例子中,从信息矩阵Im中提取特征点。返回参看图6,在通道a/b的表达中,插入的信息携带了丰富的高频分量,和/或具有预定特征的定位符使得在通道a/b的表达中存在预定的特征点,例如经过高通滤波后,大于预定值的点,或者符合预定模式的点集。从而在信息矩阵Im中找到特征点的集合(返回参看图6,示出了特征点群625、特征点群626以及特征点群627)。进一步地,计算每组特征点群的几何中心(几何中心635、几何中心636与几何中心637), 并且多组特征点群各自的几何中心呈现出几何排布。通过比较在信息嵌入时使用的几何排布(参看图2的三角形排布)与从图片610中提取的几何排布,两个几何排布的差异体现了图片610相对于信息嵌入时生成的图片的缩放尺寸、旋转角度和/或俯仰角度。依据所得到的缩放尺寸、旋转角度和/或俯仰角度对信息矩阵Im进行校准,得到经校准的矩阵Ic。作为一个例子,依据所得到的缩放尺寸、旋转角度和/或俯仰角度对图片P进行校准,并从校准后的图片中提取信息矩阵作为经校准的矩阵Ic。
在依然又一个例子中,通过在信息矩阵Im中搜索定位符图样,确定图片P的缩放尺寸、旋转角度和/或俯仰角度。由于定位符与编码过程是已知的,可从定位符与已知的编码过程中确定编码后的定位符的图样。以编码后的定位符图样可能的缩放尺寸、旋转角度和/或俯仰角度等参数对编码后的定位符图样进行变换,得到多个经变换的矩阵Ip。在信息矩阵Im中搜索多个经变换的矩阵Ip,寻找与信息矩阵Im的相关性最高的特定矩阵Ip,并确定特定矩阵Ip在信息矩阵Im中的位置pos。由于在图片P中插入了多个定位符,从信息矩阵Im中找到的与矩阵Ip最相关的子矩阵的位置pos有多个。多个子矩阵的位置构成了特征点群(参见图6,例如特征点群625、特征点群626以及特征点群627),基于特征点群,确定图片P(或信息矩阵Im)相对于信息嵌入时生成的图片的缩放尺寸、旋转角度和/或俯仰角度。
在依然又一个例子中,通过比较信息矩阵Im与标准定位符图样各自的二维傅里叶变换能量谱,确定图片P的缩放尺寸、旋转角度和/或俯仰角度。在信息插入过程中,将多个定位符编码后的图样插入到信息矩阵Im中。对信息矩阵Im进行二维傅里叶变换,得到二维傅里叶变换能量谱Fm。另一方面,对编码后的定位符图样进行扩展,在与原始图片P相同尺寸的矩阵的预定位置(例如左上角)放置编码后的定位符,而在该相同尺寸的矩阵的其他位置填充0。对扩展后的定位符图样进行二维傅里叶变化,得到能量谱Fp。
在能量谱Fm中存在与能量谱Fp相关的子图样。由于对定位符的旋转和缩放,在其能量谱中体现为对能量谱Fp围绕其中心相同角度的旋转缩放,因而按照定位符可能的缩放尺寸、旋转角度和/或俯仰角度等参数,对能量谱Fp进行变换,得到变换后的多个能量谱Fp’。寻找多个能量谱Fp’中与能量谱Fm最相关的能量谱,并据以确定定位符的缩放尺寸、旋转角度和/或俯仰角度等参数。
在步骤840,从经校准的矩阵Ic的预定位置提取出子矩阵Is,并子矩阵Is依据信息记录过程的逆过程进行解码,得到记录在图片中的信息I。已知信息被嵌入到图片P的预定位置,并因而可确定信息在高通分量少的通道Ch中的位置。因而矩阵Im的预定位置的子矩阵Is为嵌入了信息的矩阵。为解码子矩阵,首先 对子矩阵进行解密或解扩频。解密或解扩频的结果中包含了信息码字与定位符。由于信息码字与定位符是按预定模式生成信息矩阵(例如,Zig-Zag编码方法),从包含信息码字与定位符的解密或解扩频结果中能够提取出信息码字。在进一步的例子中,记录信息I时,对信息I进行了错误校正编码,则对所提取的信息码字进行相应的错误校正解码,并得到所记录的信息I。由于对信息I进行了错误校正编码,即使由于图片P捕获时引入的采样噪声或位置偏差使得矩阵Im中存在若干错误,也能够在错误校正解码过程中得到正确的信息I,或者得到信息I中存在错误的指示。
为进一步提高信息提取的准确性,从经校准的矩阵Ic中,对子矩阵Is定位。在一个例子中,在矩阵Ic中搜索编码/加密后的定位符序列(例如“10101010”序列),进而从定位符序列周围的预定位置获取子矩阵Is。在另一个例子中,在矩阵Ic中搜索与编码/加密后的定位符序列相似或相关的图样,以确定定位符在矩阵Ic中的位置,并进而提取子矩阵Is。对子矩阵Is解码,能够提取出在图片P中记录的信息I。
在根据本发明的又一个实施例中,提供了利用图案中隐藏的信息提供防伪鉴定的方法。在产品包装上印刷图案,根据本发明的实施例在图案中嵌入信息(参看图1至图4)。可选地,在产品包装图案上印制图标和/或名称,以指示用户在图案中嵌入了信息或者暗示用户可利用本发明实施例的信息提取方法或访问鉴定方法提取图案中的信息或对产品进行防伪鉴定。图案上印制的用于提醒用户扫描的图标和/或名称与手机上的应用的图标和/或名称有极强的关联性或相似性。同时图标可能附带其他的额外信息,比如防伪技术/应用的名称和/或诸如“本商品已被xx技术支持”等提示性的文字信息,或者也可能出现手机摄像头标志等图像信息。
商品图案中用于提醒用户扫描的图标可以通过专用程序对拍摄到的图片的空间姿态进行估算,这些估算的参数对于隐藏信息检测与提取提供帮助。
消费者在观察产品包装时发现印有支持本发明方法的手机应用图标和/或名称,然后打开对应的手机应用扫描产品包装。该应用通过使用本发明实施例提供的信息提取方法(参看图5-图8),从产品包装图案中提取出其中隐藏的已加密的验证信息,然后通过互联网将其上传到服务器。
由于产品形状、其所处的环境具有多样性,用手机扫描产品包装时,拍摄的角度、举例等存在较大差异,从而影响从产品包装图案中提取信息的速度或正确性。为解决此问题,在根据本发明的一个实施例中,用商品上印刷的图标提供辅助信息。由于图标具有已知的图样,从拍摄得到的图标的照片中,分析图标照片的特征,确定图标在照片中的姿态,从而确定手机与被拍摄产品的角度、距离等 参数。可选的方案为:分析图片中的SIFT特征点与标准图标中的SIFT特征点,通过匹配算法筛选出图片中图标的特征点,然后利用匹配的特征点计算空间变换矩阵以及空间姿态与/或距离等参数。另一方面,算法可以根据照片和/或其中的图标的亮度与色调,确定环境光照,并在环境光照不理想的情况下,提示用户开启闪光灯或在手机应用中开启闪光灯来进行补光,在一些例子中,手机应用开启闪光灯需要在用户授权的情况下才能进行。可选的方案为:当图片的平均亮度或色度高于或低于某一预设阈值时,算法将提示或自动打开闪光灯。
在一个例子中,用户发现了商品包装上面的图标,然后拿手机进行扫描,但是拍摄角度与距离不理想。通过分析照片中的图标的特征,估计拍摄角度与距离会影响信息提取,那么通过计算图标的姿态提醒并指引用户改变拍摄距离与角度。
在另一个例子中,拍摄角度与距离比较理想,则可以利用图标的姿态粗略估算出被拍摄产品相对手机或其摄像头的姿态参数,用来加速计算被拍摄的图片的准确的姿态参数的过程。
服务器在接收到验证信息后对其进行解密并校验:
1.如果校验失败,服务器则发送“验证信息有误,服务器无法解析该信息”至手机应用以提醒消费者该产品存在被伪造的风险。
2.如果校验成功,服务器将在数据库内搜索其对应的信息,如果未检索到该信息,则发送“该信息未录入数据库”至手机应用以提醒消费者该产品存在被伪造的风险。
3.如果校验成功,服务器将在数据库内搜索其对应的信息且搜索成功,则其对应信息发送至手机应用帮助消费者进行判断。其中“其对应的信息”可以包含产品名称、图片、说明书、条形码、厂家简介等基础信息,以及该物品被扫描的次数、地点和存储、运输、销售记录等附加信息。用户可通过以上信息评估产品被伪造的风险。如某一消费者在北京朝阳区的超市扫描了一盒饼干的包装,然后在返回的信息中发现其已经在上海黄浦区已被扫描多次,该用户知道每一物品的包装中被嵌有唯一的验证信息,因此放弃该买饼干。
零售商在结算商品时可通过支持本方法的手机应用扫描商品包装更改服务器端的信息。同时为了加速可以通过专用的硬件(如光电扫描仪)等对其进行扫描。
在根据本发明的又一个实施例中,提供了利用图案中隐藏的信息提供增强现实的方法。随着信息技术的高速发展,图像识别得到了广泛的应用,其中现实增强技术(Augmented Reality)就是一个典型的例子。现实增强是一种将真实世界信息和虚拟世界信息无缝集成的技术,它可以根据现实场景实时渲染3D数字模型,从而帮助人们更直观的获取信息。举个例子,用户通过智能手机摄像头扫描 一张的照片,如果这张照片被现实增强技术支持,那么用户手机的视野中会出现一个3D的模型。随着用户手机位置的变化,现实增强技术会实时的计算位置变化并改变模型的姿态,比如当用户远离照片时,视野中的模型会变小。图9是根据增强现实系统的示意图。在图9中,真实世界的场景包括一张桌子,以及在桌子上放置的图片,图片印制在纸张上。通过平板电脑的摄像头实时拍摄现实世界的图像或视频。而平板电脑中的增强现实(软件)系统则从拍摄的图像中识别出图片,并在平板电脑的显示器上绘制出显示世界中不存在的物体(在图9中,为便携式投影仪),以及将投影仪与融合到现实世界的图像或视频中。从而用户看到的是融合了虚拟投影仪的现实世界的图像或视频。平板电脑中的现实增强系统还依据纸张中图片的特征点实时计算平板电脑的显示器相对于纸张中图片的位置,并实时改变显示的物理(便携式投影仪),以提供身临其境的用户体验。
现实增强系统大致可以分为三个部分,即图像识别,目标跟踪和实时渲染。在上面的例子中,现实增强软件会提取视野中的特征点,然后将其与数据库中每张照片的特征点进行比对,如果结果大于某一阈值,图像识别器将判定这张照片出现在了视野中,并将该照片对应的3D模型告知渲染器。随后,跟踪器将视野中的特征点与图片中的特征点实时的进行匹配,然后通过其坐标计算空间变换矩阵。与此同时,渲染器根据变换矩阵实时渲染3D模型,以达到模型和场景的同步。
虽然现有技术的现实增强技术能够提供出色的用户体验,但是也存在着许多问题。
首先,图片数据库的容量较小。现实增强基于图像特征点对比,而对比算法非常耗时,如果数据库中目标照片太多,识别等待时间会很长,这将大大降低用户体验,因此现有的技术很难在百万量级的图片平台上进行识别。
第二,特征点无法保证图片内容唯一。比如图片A和B有着较为相似的特征点,当用户扫描A时,由于光照和角度等原因,程序将A识别为B并且渲染了与B相对应的3D模型,而这会使用户会感到困惑,从而降低了用户体验。
第三,现有的现实增强技术难以保护作品的版权。比如图片A被印刷在杂志B和C中,其中只有杂志B获得了相应的授权(可以通过显示增强软件扫描)。当用户扫描杂志C中的图片A时,现有的现实增强系统无法判断这张图片是否被授权,因此会显示/渲染出而图片A对应的3D模型,从而杂志B的权利受到侵害。
在本发明的实施例中,通过识别图片或物体中隐藏的信息,来替代增强现实技术中的图像识别部分,提高了图像识别的准确度和效率。将图片(或诸如产品 包装的物体)按根据本发明的实施例(参看如图1至图3展示的根据本发明的实施例)嵌入隐藏信息。在隐藏信息中提供图片或物体的标识(例如,唯一标识符、URL、名字、型号、知识产权信息等)。用户通过终端的摄像头扫描提取隐藏的信息,然后终端将该隐藏信息和/或用户信息通过网络上传至服务器。当服务器收到信息后,根据隐藏的信息和/或用户信息来协助现实增强系统。
在一个例子中,服务器根据用户信息来判断该用户是否能够访问服务器提供的服务和/或数据。如果不能,服务器将告知终端该用户没有权限访问与图片对应的数据信息。
在另一个例子中,服务器根据隐藏信息提供用于支持现实增强系统的信息。例如,服务器根据隐藏信息中的图片或物体的标识,获取该图片或物体的特征点信息和/或增强现实系统中使用的3D模型数据,并将该图片或物体的特征点信息和/或增强现实系统中使用的3D模型数据发送给终端。特征点信息指示了图片或物体中的一个或多个特征点。终端成功接收,将启动跟踪器和渲染器。其中跟踪器通过特征点匹配估算空间变换矩阵,渲染器根据空间变换矩阵与3D模型数据实时渲染在增强现实系统中展示给用户的3D模型。
在依然另一个例子中,服务器还识别用户信息与隐藏信息之间的关联性,来为不同用户提供访问权限、服务质量等的差异化。例如,不同用户对不同的图片或物体有不同的访问权限,或者就同一图片或物体,当为不同用户访问时,增强现实系统向用户展示不同的内容。在依然又一个例子中,用户信息包括用户的位置信息或其他信息,从而服务器/终端依据用户的此类其他信息确定向用户展示的增强现实的场景。
图10是根据本发明实施例的图像识别方法的流程图。在步骤910,获取图片P。可通过智能手机、相机、摄像头等多种方式捕获图片P。在步骤920,选择图片P的高频成分少的通道Ch。在步骤930,对步骤920中选择的通道Ch进行高通滤波,得到信息矩阵Im。在步骤940,从(可选地,经校准的)矩阵Ic的预定位置提取出子矩阵Is,并子矩阵Is依据信息记录过程的逆过程进行解码,得到记录在图片中的信息I。图10中的上述过程同上面结合图8所描述的实施方式相似,在此不再赘述。
在步骤950,将信息I发送给服务器S。信息I是图片P中的隐藏信息,可包含图片P的标识,或者图片P中的物体的标识。可选地,还将用户信息一并发送给服务器S。服务器S根据图片P的隐藏信息,获取图片P的用于增强现实系统的特征点信息和/或3D模型数据。服务器获取的图片P的用于增强现实系统的特征点信息和/或3D模型数据统称为信息I’。可选地,服务器还根据用户信息和/或隐藏信息确定与用户和/或图片P相关的权限,并根据权限确定生成的信 息I’。
在步骤960,服务器S返回信息I’。用户的终端可利用返回信息I’中的特征点和/或3D模型向用户展示与图片P相关的增强现实场景。其中,特征点信息用于指示图片P中的一个或多个特征点,利用特征点信息终端能够容易地从图片P中识别出一个或多个特征点。根据一个或多个特征点,确定智能手机、相机、摄像头与图片P中的物体的相对姿态,并生成空间变换矩阵;根据空间变换矩阵与3D模型信息生成图片P中的物品的增强现实图像。
所属领域技术人员将意识到可通过运行于计算机、服务器、手机、便携设备、嵌入式系统中的软件、硬件、固件或其组合来实现本发明实施例中的信息记录和提取的方法。
已经为了示出和描述的目的而展现了对本发明的描述,并且不旨在以所公开的形式穷尽或限制本发明。对所属领域技术人员,许多调整和变化是显而易见的。

Claims (10)

1.一种从物品中提取第一信息的方法,包括:
通过摄像头获取物品的照片;
从所述照片中提取中亮度色度色彩模型的3个通道,选择其中高频成分较少的第一通道与第二通道;
对第一通道的矩阵进行高通滤波,得到第一矩阵;对第二通道的矩阵进行高通滤波,得到第二矩阵;
将第一矩阵与第二矩阵相加,得到第三矩阵;
对第三矩阵的预定位置提取信息矩阵;
对信息矩阵进行解码提取出第一信息。
2.根据权利要求1所述的提取第一信息的方法,其中:
从第三矩阵中基于缩放参数和/或旋转参数提取出多个信息矩阵;
对所述多个信息矩阵进行容错解码,从解码成功的结果中提取出第一信息。
3.一种从物品中提取第一信息的方法,包括:
通过摄像头获取物品的照片;
从所述照片中提取中亮度色度色彩模型的3个通道,选择其中高频成分较少的第一通道与第二通道;
对第一通道的矩阵进行高通滤波,得到第一矩阵;对第二通道的矩阵进行高通滤波,得到第二矩阵;
将第一矩阵与第二矩阵相加,得到第三矩阵;
从第三矩阵中提取出旋转参数和/或缩放参数;
基于所述旋转参数和/或所述缩放参数对第三矩阵进行矫正,得到第四矩阵;
在第四矩阵中基于一个或多个预设的定位符确定一个或多个信息矩阵;
对一个或多个信息矩阵逆扩频得到一个或多个第五矩阵;
对一个或多个第五矩阵的预定位置提取出一个或多个比特流;
对所述一个或多个比特流进行容错解码,得到第一信息。
4.根据权利要求1-3之一所述的提取第一信息的方法,在通过摄像头获取物品的照片后,还包括:
识别所述照片中图标;
基于所述照片的图标与预定图标的差异,估计所述摄像头与所述物品的距离和/或角度;
根据所述距离和/或角度校正所述照片。
5.根据权利要求1-3之一所述的提取第一信息的方法,在通过摄像头获取物品的照片后,还包括:
识别所述照片中图标;
基于所述照片的图标与预定图标的差异,估计所述摄像头与所述物品的距离和/或角度;
根据所述距离和/或角度提醒和/或指示用户调整所述摄像头与所述物品的距离和/或角度,并再次通过摄像头获取物品的照片。
6.根据权利要求1-5之一所述的提取第一信息的方法,在识别所述照片中图标后,还包括:基于所述照片的图标与预定图标的亮度和/或色调的差异,确定环境光照,并提示用户开启闪光灯或在手机应用中开启闪光灯来进行补光。
7.一种实现现实增强的方法,包括:
如权利要求1-6所述的从物品中提取第一信息的方法;以及
将提取到的第一信息和/或用户信息发送给服务器;
接收服务器返回的第二信息,其中服务器根据第一信息获取物品的特征点信息与物品的3D模型信息,并根据获取的特征点信息与物品的3D模型信息返回第二信息;
根据第二信息生成所述物品的增强现实图像。
8.根据权利要求7所述的方法,还包括:
根据第二信息中的特征点信息,从所述物品的照片中识别所述物品的一个或多个特征点;根据所述一个或多个特征点,确定摄像头与所述物体的相对姿态,并生成空间变换矩阵;根据空间变换矩阵与3D模型信息生成所述物品的增强现实图像。
9.根据权利要求7或8所述的方法,其中所述服务器根据所述用户信息生成所述第二信息,以及所述用户信息指示了生成第二信息的方式或物品的权限。
10.一种实现现实增强的装置,包括:
图片采集模块,用于通过摄像头获取物品的照片;
通道选择模块,用于从所述照片中提取中亮度色度色彩模型的3个通道,选择其中高频成分较少的第一通道与第二通道;
滤波模块,用于对第一通道的矩阵进行高通滤波,得到第一矩阵;对第二通道的矩阵进行高通滤波,得到第二矩阵;
求和模块,用于将第一矩阵与第二矩阵相加,得到第三矩阵;
信息提取模块,用于对第三矩阵的预定位置提取信息矩阵;
解码模块,用于对信息矩阵进行解码提取出第一信息;
发送模块,用于将提取到的第一信息和/或用户信息发送给服务器;
接收模块,用于接收服务器返回的第二信息,其中服务器根据第一信息获取物品的特征点信息与物品的3D模型信息,并根据获取的特征点信息与物品的3D模型信息返回第二信息;
图像生成模块,用于根据第二信息生成所述物品的增强现实图像。
CN201610479204.7A 2016-06-27 2016-06-27 一种现实增强系统的图像识别方法和系统 Pending CN106169064A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610479204.7A CN106169064A (zh) 2016-06-27 2016-06-27 一种现实增强系统的图像识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610479204.7A CN106169064A (zh) 2016-06-27 2016-06-27 一种现实增强系统的图像识别方法和系统

Publications (1)

Publication Number Publication Date
CN106169064A true CN106169064A (zh) 2016-11-30

Family

ID=58064508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610479204.7A Pending CN106169064A (zh) 2016-06-27 2016-06-27 一种现实增强系统的图像识别方法和系统

Country Status (1)

Country Link
CN (1) CN106169064A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107894879A (zh) * 2017-11-16 2018-04-10 中国人民解放军信息工程大学 基于可见光隐式成像通信的增强现实方法、系统和终端
CN108053489A (zh) * 2017-12-08 2018-05-18 快创科技(大连)有限公司 基于ar技术的商品的商标展示系统
CN108564455A (zh) * 2018-01-05 2018-09-21 福建农林大学 一种基于增强现实技术的拍卖方法
CN109765514A (zh) * 2019-02-13 2019-05-17 李秀利 一种具有多种对比度的磁共振成像系统
CN109862268A (zh) * 2019-02-12 2019-06-07 杜都 一种可感应自动调节亮度的图像处理用打光方法
CN110942322A (zh) * 2018-09-21 2020-03-31 北京京东尚科信息技术有限公司 优惠券领取界面截图的防伪方法、系统、电子设备和介质
CN111126384A (zh) * 2019-12-12 2020-05-08 创新奇智(青岛)科技有限公司 基于特征融合的商品分类系统及分类方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107894879A (zh) * 2017-11-16 2018-04-10 中国人民解放军信息工程大学 基于可见光隐式成像通信的增强现实方法、系统和终端
CN108053489A (zh) * 2017-12-08 2018-05-18 快创科技(大连)有限公司 基于ar技术的商品的商标展示系统
CN108564455A (zh) * 2018-01-05 2018-09-21 福建农林大学 一种基于增强现实技术的拍卖方法
CN108564455B (zh) * 2018-01-05 2022-02-18 福建农林大学 一种基于增强现实技术的拍卖方法
CN110942322A (zh) * 2018-09-21 2020-03-31 北京京东尚科信息技术有限公司 优惠券领取界面截图的防伪方法、系统、电子设备和介质
CN109862268A (zh) * 2019-02-12 2019-06-07 杜都 一种可感应自动调节亮度的图像处理用打光方法
CN109765514A (zh) * 2019-02-13 2019-05-17 李秀利 一种具有多种对比度的磁共振成像系统
CN111126384A (zh) * 2019-12-12 2020-05-08 创新奇智(青岛)科技有限公司 基于特征融合的商品分类系统及分类方法

Similar Documents

Publication Publication Date Title
CN106169064A (zh) 一种现实增强系统的图像识别方法和系统
Korus Digital image integrity–a survey of protection and verification techniques
Walia et al. Digital image forgery detection: a systematic scrutiny
Bahrami et al. Blurred image splicing localization by exposing blur type inconsistency
Tralic et al. CoMoFoD—New database for copy-move forgery detection
Hsu et al. Detecting image splicing using geometry invariants and camera characteristics consistency
Hays et al. Scene completion using millions of photographs
TW416242B (en) An image capturing system and method for automatically watermarking recorded parameters for providing digital image verification
CN108288012B (zh) 一种基于手机实现的艺术品备案验证方法及其系统
Armas Vega et al. Copy-move forgery detection technique based on discrete cosine transform blocks features
Asghar et al. Edge–texture feature-based image forgery detection with cross-dataset evaluation
Sharma et al. Comprehensive analyses of image forgery detection methods from traditional to deep learning approaches: an evaluation
Farid Fake photos
CN112419165A (zh) 利用几何和光度变换进行图像修复
Liu et al. Overview of image inpainting and forensic technology
Kumar et al. Image forensics based on lighting estimation
Ren et al. ESRNet: Efficient search and recognition network for image manipulation detection
CN113642639B (zh) 活体检测方法、装置、设备和存储介质
CN106997366B (zh) 数据库构建方法、增强现实融合追踪方法及终端设备
CN105956503A (zh) 一种基于产品隐藏信息防伪认证的方法和系统
Peng et al. Identification of natural images and computer generated graphics based on hybrid features
CN104680515A (zh) 一种图像真实性鉴定方法
CN105760913B (zh) 信息记录方法与信息提取方法
Nataraj et al. Holistic image manipulation detection using pixel co-occurrence matrices
CN115526282A (zh) 水印加密方法、水印提取方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161130