CN109034002A

CN109034002A - 实体书检测方法及装置

Info

Publication number: CN109034002A
Application number: CN201810726248.4A
Authority: CN
Inventors: 王忍宝; 王晓斐; 高群; 钱云
Original assignee: Anhui Namoyun Technology Co Ltd
Current assignee: Anhui Toycloud Technology Co Ltd
Priority date: 2018-07-04
Filing date: 2018-07-04
Publication date: 2018-12-18
Anticipated expiration: 2038-07-04
Also published as: CN109034002B

Abstract

本发明实施例提供一种实体书检测方法及装置，属于计算机应用技术领域。该方法包括：获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像；若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据。由于本次实体书检测过程涉及到的待阅读实体书与上一次实体书检测过程涉及到的实体书为同一本书，从而跳过了对目标图像进行封面检测的过程，进而提高了检测效率。

Description

实体书检测方法及装置

技术领域

本发明实施例涉及计算机应用技术领域，更具体地，涉及一种实体书检测方法及装置。

背景技术

随着信息化及智能化的发展，用于阅读实体书的智能阅读设备越来越普及。智能阅读设备在阅读实体书时，需要确定该实体书是哪本书以及当前需要阅读该实体书的哪一页，也即需要对实体书进行检测。相关技术中提供了一种实体书检测方法，主要是由用户先将实体书翻至封面，获取由摄像头拍摄的封面图像，通过对封面图像进行封面检测，确定该实体书是哪本书。再由用户将实体书翻至内容页，获取由摄像头拍摄的内容页图像，通过对内容页图像进行内容检测，确定用户翻到了该实体书的哪一页。其中，每次阅读实体书之前，均需要先由用户将实体书翻至封面进行封面检测，再翻至内容页进行内容检测，以确定当前需要阅读哪本实体书以及哪一页，从而检测效率较低。

发明内容

为了解决上述问题，本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的实体书检测方法及装置。

根据本发明实施例的第一方面，提供了一种实体书检测方法，该方法包括：

获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像；

若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据；其中，目标图像为本次开启绘本识别功能后获得的，封面标识是在上一次开启绘本识别功能后存储在预设存储器中的。

本发明实施例提供的方法，通过获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像。若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据。由于本次实体书检测过程涉及到的待阅读实体书与上一次实体书检测过程涉及到的实体书为同一本书，从而跳过了对目标图像进行封面检测的过程，进而提高了检测效率。

根据本发明实施例的第二方面，提供了一种实体书检测装置，该装置包括：

第一检测模块，用于获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像；

播报模块，用于当在实体书内容资源中检测到与目标图像相匹配的内容页图像时，则播报与内容页图像对应的语音数据；其中，目标图像为本次开启绘本识别功能后获得的，封面标识是在上一次开启绘本识别功能后存储在预设存储器中的。

根据本发明实施例的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与处理器通信连接的至少一个存储器，其中：

存储器存储有可被处理器执行的程序指令，处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的实体书检测方法。

根据本发明的第四方面，提供了一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的实体书检测方法。

应当理解的是，以上的一般描述和后文的细节描述是示例性和解释性的，并不能限制本发明实施例。

附图说明

图1为本发明实施例的一种实体书检测方法的流程示意图；

图2为本发明实施例的一种实体书检测方法的流程示意图；

图3为本发明实施例的一种实体书检测方法的流程示意图；

图4为本发明实施例的一种实体书检测方法的流程示意图；

图5为本发明实施例的一种实体书检测方法的流程示意图；

图6为本发明实施例的一种实体书检测装置的框图；

图7为本发明实施例的一种电子设备的框图。

具体实施方式

下面结合附图和实施例，对本发明实施例的具体实施方式作进一步详细描述。以下实施例用于说明本发明实施例，但不用来限制本发明实施例的范围。

随着信息化及智能化的发展，用于阅读实体书的智能阅读设备越来越普及。智能阅读设备主要是通过预先存储一些实体书的讲解录音，以及实体书的封面图像及内容页图像，来实现智能阅读的。

具体地，智能阅读设备上通常会安装摄像头。用户可将待阅读的实体书封面放在摄像头下，通过摄像头对实体书进行拍照，智能阅读设备可获取到实体书的封面图像。通过将实体书的封面图像与预先存储的实体书封面图像进行比对，可确定用户放置在摄像头下的是哪本实体书。在确定用户放置在摄像头下是哪本实体书后，用户可将该实体书的内容页放置在摄像头下，通过将实体书的内容页图像与预先存储的实体书内容页图像进行比对，可确定用户当前翻到了哪一页。智能阅读设备在确定用户需要阅读的实体书以及用户需要阅读该实体书的哪一页后，可直接调取该页的讲解语音数据，从而为该用户进行阅读。

由上述应用场景可知，智能阅读设备需要对实体书进行检测，以确定用户当前拿出的实体书是哪本以及当前翻到了哪一页。相关技术中提供了一种实体书检测方法，主要是先由用户将实体书放置在摄像头下，通过对拍摄得到的图像进行封面检测后，可确定当前待阅读的实体书是哪本书，并将该实体书对应的封面标识存储在临时存储器中。再由用户将该实体书内容页放置在摄像头下，通过对拍摄得到的图像进行内容检测后，可确定当前待阅读的是该实体书的哪一页。

具体地，对于用户持续阅读一本实体书的场景，用户可将实体书放置在摄像头下，智能阅读设备可对拍摄得到的图像进行封面检测，从而确定当前待阅读的实体书是哪本书。此时，也即开启了本次的绘本识别功能。在开启本次的绘本识别功能后，用户每翻一页都会以封面标识对应的实体书内容资源为基础，对用户翻页后拍摄得到的图像进行内容检测。具体地，也即在封面标识对应的实体书内容资源中，检测与用户翻页后拍摄得到的图像相匹配的内容页图像，从而确定用户每次具体翻到了该实体书的哪一页。

需要说明的是，用户在本次开启绘本识别功能之后，若用户关闭智能阅读设备或者长时间不使用智能阅读设备导致其休眠，会关闭本次开启的绘本识别功能。与此同时，临时存储器中存储的封面标识，也即本次绘本识别功能所使用的封面标识，会自动清除掉。当用户再次开启绘本识别功能时，如重新开启智能阅读设备或使智能阅读设备从休眠状态中恢复，则需要重新将实体书放置在摄像头下以进行封面检测，并进行后续的内容检测。由于再次开启绘本识别功能后，用户希望阅读的实体书与上一次开启绘本识别功能对应的可能是同一本书，而用户每次开启绘本识别功能时，均需要重新进行封面检测，从而检测效率较低。

针对上述情形，本发明实施例提供了一种实体书检测方法。需要说明的是，本发明实施例涉及到的实体书可以为幼儿绘本、杂志及画报等不同读物类型，本发明实施例对此不作具体限定。另外，该方法对应的执行主体可以为带有阅读功能的智能阅读设备，或者为解耦出阅读功能，仅带有绘本识别功能的智能设备，本发明实施例对此也不作具体限定。

为了便于说明，本发明实施例以执行主体为智能阅读设备为例，对本发明实施例提供的实体书检测方法进行阐述。参见图1，该方法包括：

101、获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像。

在执行101之前，用户可将待阅读实体书的待阅读页放置在摄像头下，从而通过摄像头可对待阅读页进行拍照，也即开启本次绘本识别功能。相应地，可得到待阅读页对应的目标图像。另外，在上一次实体书检测过程中，可将上一次开启绘本识别功能时涉及到的待阅读实体书所对应的封面标识存储在预设存储器中。

需要说明的是，不同于相关技术中的临时存储器，在关闭上一次开启的绘本识别功能后，预设存储器中存储的封面标识并不会被清除掉，从而在101中可直接在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像，也即可跳过封面检测，直接执行内容检测。

例如，用户本次通过智能阅读设备阅读一本书，也即本次会开启绘本识别功能，从而会将本次涉及到的待阅读实体书对应的封面标识存储至预设存储器中。其中，在检测到用户关闭智能阅读设备时可确定用户关闭本次绘本识别功能，或者在检测到用户长时间不翻页后，即可认为用户暂停使用智能阅读设备，并可确定用户关闭本次绘本识别功能。在确定用户关闭本次绘本识别功能后，若检测到用户再次开启绘本识别功能，则本次开启绘本识别功能即变为了上一次开启绘本识别功能，而再次开启绘本识别功能即变为了本次开启绘本识别功能。此时，可获取本次开启绘本识别功能后，待阅读实体书的待阅读页所对应的目标图像。由于此时预设存储器中是存储有封面标识的，从而可在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像。

102、若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据。

若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则说明本次实体书检测过程涉及到的待阅读实体书与上一次实体书检测过程涉及到的实体书为同一本书。由于在上一次实体书检测过程中已经使用过该实体书的各项资源，从而可说明已预先存储有该实体书的资源。其中，实体书的资源可包括实体书封面资源、实体书内容资源及实体书的语音数据，本发明实施例对此不作具体限定。因此，可直接播报与内容页图像对应的语音数据。

需要说明的是，考虑到智能阅读设备的存储空间有限，从而上述在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像的过程，可以先在智能阅读设备侧执行，然后在服务器侧执行。也即，不由智能阅读设备存储所有实体书对应的各项资源，而是由智能阅读设备存储部分实体书对应的各项资源，并由服务器存储部分实体书对应的各项资源，从而在两侧执行上述内容检测过程。

具体地，可先确定本地(也即智能阅读设备侧)是否存储有封面标识对应的实体书内容资源，如果已存储，则可直接由智能阅读设备执行上述检测过程。若本地未存储，而在服务器侧存储有封面标识对应的实体书内容资源，则可由服务器执行上述检测过程。当然，还可以在确定本地未存储而服务器已存储的情况下，先从服务器侧将封面标识对应的实体书内容资源下载至本地，再由智能阅读设备执行上述检测过程，本发明实施例对此不作具体限定。

另外，还需要说明的是，由于智能阅读设备是在实时采集待阅读实体书的图像，从而可能会拍摄到用户正在翻阅该实体书时的图像。而这些图像是动态模糊的，也即无法应用于后续检测过程，从而作为一种可选实施例，在本发明实施例中，可在待阅读实体书处于稳定翻页状态时拍摄得到目标图像。

另外，由于上述检测过程可以在智能阅读设备侧执行，还可以在服务器侧执行，从而智能阅读设备侧只需存储部分实体书的资源，进而节省了智能阅读设备侧的存储空间。最后，由于目标图像是在待阅读实体书处于稳定翻页状态时所拍摄得到的，从而可提高后续检测成功率。

考虑到预设存储器中可能未存储封面标识，或者在实体书内容资源中未检测到与目标图像相匹配的内容页图像，从而此时可重新对目标图像进行封面检测。相应地，基于上述实施例的内容，作为一种可选实施例，该方法还包括：若满足预设条件，则在实体书封面资源中检测与目标图像相匹配的封面图像；其中，预设条件为预设存储器中未存储封面标识，或者在实体书内容资源中未检测到与目标图像相匹配的内容页图像。

具体地，若预设存储器中未存储封面标识，则表明用户之前可能没有使用过智能阅读设备。而在实体书内容资源中未检测到与目标图像相匹配的内容页图像，则表明上一次检测过程涉及到的实体书与本次检测过程中的待阅读实体书不是同一本书。因此，在上述两种情形下，需要对目标图像进行封面检测，以确定目标图像对应的是哪本实体书。

在对目标图像进行封面检测时，与上述内容检测过程同理，该封面检测过程可以先在智能阅读设备侧执行，然后在服务器侧执行。也即，不由智能阅读设备存储所有实体书对应的各项资源，而是由智能阅读设备存储部分实体书对应的各项资源，并由服务器存储部分实体书对应的各项资源，从而在两侧执行上述封面检测过程。

具体地，可先确定本地(也即智能阅读设备侧)存储的实体书封面资源中是否存储有与目标图像相匹配的封面图像，如果已存储，则可直接由智能阅读设备执行上述封面检测过程。若本地未存储，则可确定服务器侧是否存储有与目标图像相匹配的封面图像，如果服务器已存储，则上述封面检测过程由服务器执行。

本发明实施例提供的方法，通过在满足预设条件时，则在实体书封面资源中检测与目标图像相匹配的封面图像。由于可在预设存储器中未存储封面标识，或者在实体书内容资源中未检测到与目标图像相匹配的内容页图像时，对目标图像进行封面检测，从而保证了检测逻辑的完整性，进而提高了检测成功率。

对于待阅读实体书，可能会存在预先并没有存储该实体书对应资源的情形。而该实体书对应的资源可能短时间内无法上架，且用户有听书的需求。基于上述需求及上述实施例的内容，作为一种可选实施例，本发明实施例还提供了一种制作实体书资源的方法。具体地，在实体书封面资源中检测与目标图像相匹配的封面图像之后，还包括：若在实体书封面资源中未检测到与目标图像相匹配的封面图像，则提示用户录入待阅读实体书对应的资源。

由于在拍摄目标图像时，用户可能并未翻到待阅读实体书的封面，从而导致在实体书封面资源中检测与目标图像相匹配的封面图像时，即使实体书封面资源中存储有待阅读实体书对应的封面图像，但最终还是会检测失败。因此，在待阅读封面资源中检测与目标图像相匹配的封面图像之后，若在待阅读封面资源中未检测到与目标图像相匹配的封面图像，则可提示用户将待阅读实体书翻至封面，以重新获取目标图像，并按照上述实施例的过程，对重新获取到的目标图像进行封面检测。

对于重新获取到的目标图像，若在待阅读封面资源中未检测到与该目标图像相匹配的封面图像，则可提示用户录入待阅读实体书对应的资源。或者，不执行上述重新获取目标图像以及重新检测的过程，直接提示用户录入待阅读实体书对应的资源，本发明实施例对此不作具体限定。

在提示用户录入待阅读实体书对应的资源后，用户可通过每翻一页拍一次照，同时阅读每一页的内容的方式，以录入待阅读实体书对应的资源。其中，录入的各个环节可由智能阅读设备全程提示，提示的方式可以为语音提示，如语音提示用户翻页并阅读本页的内容，本发明实施例对此不作具体限定。用户在录入待阅读实体书对应的资源后，后续再对待阅读实体书进行检测时就可以被成功检测到。

本发明实施例提供的方法，通过在封面检测失败后，提示用户录入待阅读实体书对应的资源，从而可拓展实体书的资源，并可满足用户的听书需求。另外，由于在封面检测失败后，可提示用户将待阅读实体书翻至封面，以重新拍照并重新进行封面检测，从而能够避免因用户未翻到封面而导致封面检测失败，从而可提高检测成功率。

基于上述实施例的内容，作为一种可选实施例，本发明实施例不对在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像的方式作具体限定。参见图2，包括但不限于：

201、确定实体书内容资源中每一内容页图像与目标图像之间的相似度，对每一内容页图像对应的相似度按照从大到小进行排序，选取前第一预设数量个内容页图像，并作为指定内容页图像。

由上述实施例可知，每次在对目标图像进行内容检测时，可能会检测成功，也可能会检测失败。而对所有检测成功对应的情形进行统计，总有些内容页图像会多次与目标图像匹配成功，而在对再一次获取到的目标图像进行内容检测时，这些内容页图像相较于其它内容页图像也具有更高的匹配成功率。因此，在本发明实施例中，在执行201之前，可先对实体书内容资源中的内容页图像进行筛选，也即从实体书内容资源中选取具有更高匹配成功率的内容页图像。

具体地，可对实体书内容资源中每一内容页图像的历史匹配成功次数按照从大到小进行排序，从而选取前第三预设数量个内容页图像。其中，第三预设数量可以在10至20之间取值，本发明实施例对此不作具体限定。

在对实体书内容资源中的内容页图像进行筛选后，可确定筛选后的每一内容页图像与目标图像之间的相似度。对于筛选后的每一内容页图像，本发明实施例不对确定每一内容页图像与目标图像之间的相似度的方式作具体限定，包括但不限于：计算每一内容页图像的词袋向量与目标图像的词袋向量之间的巴氏距离，并作为每一内容页图像与目标图像之间的相似度。其中，巴氏距离越小，则表明两者的词袋向量越接近，也即相似度反而越高。

在确定每一内容页图像与目标图像之间的相似度后，可根据相似度的大小，选取第一预设数量个内容页图像。其中，第三预设数量可以取值为10，而第一预设数量可以取值为4，本发明实施例对此不作具体限定。

202、从第一预设数量个指定内容页图像中确定与目标图像相匹配的内容页图像。

在选取第一预设数量个指定内容页图像后，可继续从第一预设数量个指定内容页图像中确定与目标图像相匹配的内容页图像，如采用随机选取的方式，本发明实施例对此不作具体限定。

本发明实施例提供的方法，通过确定实体书内容资源中每一内容页图像与目标图像之间的相似度，对每一内容页图像对应的相似度按照从大到小进行排序，选取前第一预设数量个内容页图像，并作为指定内容页图像。从第一预设数量个指定内容页图像中确定与目标图像相匹配的内容页图像。由于在确定相似度之前，可按照历史匹配成功次数预先对实体书内容资源中的内容页图像进行筛选，以使得后续不需要对实体书内容资源中的每一内容页图像进行相似度计算，从而可提高检测效率。

另外，由于内容页图像的词袋向量与目标图像的词袋向量之间的巴氏距离越小，则表明该内容页图像与目标图像越近似，从而基于上述筛选过程，可确定与目标图像比较近似的内容页图像，并作为指定内容页图像，进而可提高检测准确率。

基于上述实施例的内容，作为一种可选实施例，本发明实施例不对从第一预设数量个指定内容页图像中确定与目标图像相匹配的内容页图像的方式作具体限定。参见图3，包括但不限于：

301、基于每一指定内容页图像中与目标图像相匹配的特征点，计算每一指定内容页图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像。

在301中，特征点具体可以为SIFT(Scale-invariant feature transform，尺度不变特征变换)特征点，本发明实施例对此不作具体限定。对于内容页图像以及目标图像，图像中的SIFT特征点指的是色差变化比较明显的点，具体可通过SIFT算法提取。对于任一指定内容页图像，可通过将该指定内容页图像中的SIFT特征点与目标图像中的SIFT特征点进行SIFT特征匹配，从而可确定该指定内容页图像中与目标图像相匹配的SIFT特征点。

在将指定内容页图像与目标图像进行特征匹配过程中，对于任一指定内容页图像及目标图像中的任一待匹配的特征点，该指定内容页图像中通常会存在两个与该待匹配的特征点相匹配的特征点，可分别记为(bestP，betterP)。其中，bestP表示与该待匹配的特征点相匹配的最佳匹配特征点，betterP表示次佳匹配的特征点。基于bestP与该待匹配的特征点之间的欧式距离DEBest，以及betterP与该待匹配的特征点之间的欧式距离DEBetter，可计算两个欧式距离之间的差值(DEBetter-DEBest)。按照上述过程，可计算得到该指定内容页图像中所有特征点对应的差值，将所有差值求和即可得到该指定内容页图像对应的特征欧式距离差值。

对于任一指定内容页图像，若该指定内容页图像对应的特征欧式距离差值越大，则表明该指定内容页图像在与目标图像进行特征匹配时，最佳特征点与次佳特征点差距也越大，也即最佳匹配结果与次佳匹配结果差距较大，从而可从侧面反映该指定内容页图像与目标图像进行特征匹配时准确率较高。反之，若该指定内容页图像对应的特征欧式距离差值越小，则表明该指定内容页图像在与目标图像进行特征匹配时，最佳特征点与次佳特征点差距也越小，也即最佳匹配结果与次佳匹配结果差距较小，从而可从侧面反映该指定内容页图像与目标图像进行特征匹配时准确率不高。

基于上述说明，从而在上述401中，可选取最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像。按照上述定义，最大特征欧式距离差值对应的指定内容页图像即为第一预设数量个指定内容页图像中匹配准确率最高的指定内容页图像。

302、若最大特征欧式距离差值大于第一预设阈值且目标内容页图像与目标图像相匹配的特征点数量大于第二预设阈值，则将目标内容页图像作为与目标图像相匹配的内容页图像。

考虑到即使按照上述过程，还是会出现匹配错误的情形，而特征欧式距离差值的大小以及指定内容图像与目标图像相匹配的特征点的多少，均可以反映指定内容页图像的匹配准确率。因此，在得到目标内容页图像后，可进一步判断最大特征欧式距离差值是否大于第一预设阈值，且目标内容页图像与目标图像相匹配的特征点数量是否大于第二预设阈值，从而在满足上述两个条件后，再将目标内容页图像作为与目标图像相匹配的内容页图像。

本发明实施例提供的方法，通过基于每一指定内容页图像中与目标图像相匹配的特征点，计算每一指定内容页图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像。若最大特征欧式距离差值大于第一预设阈值且目标内容页图像与目标图像相匹配的特征点数量大于第二预设阈值，则将目标内容页图像作为与目标图像相匹配的内容页图像。由于可选取最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像，从而可提高检测准确率。另外，由于在得到目标内容页图像后还会对目标内容页图像进行二层条件的筛选，从而进步提高了检测准确率。

基于上述实施例的内容，作为一种可选实施例，本发明实施例不对在实体书封面资源中检测与目标图像相匹配的封面图像的方式作具体限定。参见图4，包括但不限于：

401、确定实体书封面资源中每一封面图像与目标图像之间的相似度，对每一封面图像对应的相似度按照从大到小进行排序，选取前第二预设数量个封面图像，并作为指定封面图像。

由上述实施例可知，每次在对目标图像进行封面检测时，可能会检测成功，也可能会检测失败。而对所有检测成功对应的情形进行统计，总有些封面图像会多次与目标图像匹配成功，而在对再一次获取到的目标图像进行封面检测时，这些封面图像相较于其它封面图像也具有更高的匹配成功率。因此，在执行401之前，可先对实体书封面资源中的封面图像进行筛选。具体地，可对实体书封面资源中每一封面图像的历史匹配成功次数按照从大到小进行排序，从而选取前第四预设数量个封面图像。其中，第四预设数量可以在10至20之间取值，本发明实施例对此不作具体限定。

在对实体书封面资源中的封面图像进行筛选后，可确定筛选后的每一封面图像与目标图像之间的相似度。对于筛选后的每一封面图像，本发明实施例不对确定每一封面图像与目标图像之间的相似度的方式作具体限定，包括但不限于：计算每一封面图像的词袋向量与目标图像的词袋向量之间的巴氏距离，并作为每一封面图像与目标图像之间的相似度。其中，巴氏距离越小，则表明两者的词袋向量越接近，也即相似度反而越高。

在确定每一封面图像与目标图像之间的相似度后，可根据相似度的大小，选取第二预设数量个封面图像。其中，第二预设数量可以取值为4，而第四预设数量可以取值为10，本发明实施例对此不作具体限定。

402、从第二预设数量个指定封面图像中确定与目标图像相匹配的封面图像。

在从实体书封面资源中选取第二预设数量个指定封面图像后，可继续从第二预设数量个指定封面图像中确定与目标图像相匹配的封面图像，如采用随机选取的方式，本发明实施例对此不作具体限定。

本发明实施例提供的方法，通过确定实体书封面资源中每一封面图像与目标图像之间的相似度，对每一封面图像对应的相似度按照从大到小进行排序，选取前第二预设数量个封面图像，并作为指定封面图像。从第二预设数量个指定封面图像中确定与目标图像相匹配的封面图像。由于在确定相似度之前，可按照历史匹配成功次数预先对封面内容资源中的封面图像进行筛选，以使得后续不需要对封面内容资源中的每一封面图像进行相似度计算，从而可提高检测效率。

另外，由于封面图像的词袋向量与目标图像的词袋向量之间的巴氏距离越小，则表明该封面图像与目标图像越近似，从而基于上述筛选过程，可确定与目标图像比较近似的封面图像，并作为指定封面图像，进而可提高检测准确率。

基于上述实施例的内容，作为一种可选实施例，本发明实施例不对从第二预设数量个指定封面图像中确定与目标图像相匹配的封面图像的方式作具体限定。参见图5，包括但不限于：

501、基于每一指定封面图像中与目标图像相匹配的特征点，计算每一指定封面图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定封面图像作为目标封面图像。

在501中，特征点具体可以为SIFT特征点，本发明实施例对此不作具体限定。对于封面图像以及目标图像，图像中的SIFT特征点指的是色差变化比较明显的点，具体可通过SIFT算法提取。对于任一指定封面图像，可通过将该指定封面图像中的SIFT特征点与目标图像中的SIFT特征点进行SIFT特征匹配，从而可确定该指定封面图像中与目标图像相匹配的SIFT特征点。

在将指定封面图像与目标图像进行特征匹配过程中，对于任一指定封面图像及目标图像中的任一待匹配的特征点，该指定封面图像中通常会存在两个与该待匹配的特征点相匹配的特征点，可分别记为(bestP，betterP)。其中，bestP表示与该待匹配的特征点相匹配的最佳匹配特征点，betterP表示次佳匹配的特征点。基于bestP与该待匹配的特征点之间的欧式距离DEBest，以及betterP与该待匹配的特征点之间的欧式距离DEBetter，可计算两个欧式距离之间的差值(DEBetter-DEBest)。按照上述过程，可计算得到该指定封面图像中所有特征点对应的差值，将所有差值求和即可得到该指定封面图像对应的特征欧式距离差值。

对于任一指定封面图像，若该指定封面图像对应的特征欧式距离差值越大，则表明该指定封面图像在与目标图像进行特征匹配时，最佳特征点与次佳特征点差距也越大，也即最佳匹配结果与次佳匹配结果差距较大，从而可从侧面反映该指定封面图像与目标图像进行特征匹配时准确率较高。反之，若该指定封面图像对应的特征欧式距离差值越小，则表明该指定封面图像在与目标图像进行特征匹配时，最佳特征点与次佳特征点差距也越小，也即最佳匹配结果与次佳匹配结果差距较小，从而可从侧面反映该指定封面图像与目标图像进行特征匹配时准确率不高。

基于上述说明，从而在上述501中，可选取最大特征欧式距离差值对应的指定封面图像作为目标封面图像。按照上述定义，最大特征欧式距离差值对应的指定封面图像即为第二预设数量个指定封面图像中匹配准确率最高的指定封面图像。

502、若最大特征欧式距离差值大于第三预设阈值，则将目标封面图像作为与目标图像相匹配的封面图像。

考虑到即使按照上述过程，还是会出现匹配错误的情形，而特征欧式距离差值的大小，可以反映指定封面图像的匹配准确率。因此，在得到目标封面图像后，可进一步判断最大特征欧式距离差值是否大于第三预设阈值，从而在满足上述条件后，再将目标封面图像作为与目标图像相匹配的封面图像。

本发明实施例提供的方法，通过基于每一指定封面图像中与目标图像相匹配的特征点，计算每一指定封面图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定封面图像作为目标封面图像。若最大特征欧式距离差值大于第三预设阈值，则将目标封面图像作为与目标图像相匹配的封面图像。由于可选取最大特征欧式距离差值对应的指定封面图像作为目标封面图像，从而可提高检测准确率。另外，由于在得到目标封面图像后还会对目标封面图像进行筛选，从而进步提高了检测准确率。

需要说明的是，上述所有可选实施例，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

基于上述实施例的内容，本发明实施例提供了一种实体书检测装置，该装置用于执行上述方法实施例中的实体书检测方法。参见图6，该装置包括：

第一检测模块601，用于获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像；

播报模块602，用于当在实体书内容资源中检测到与目标图像相匹配的内容页图像时，则播报与内容页图像对应的语音数据。

作为一种可选实施例，该装置还包括：

第二检测模块，用于在满足预设条件时，则在实体书封面资源中检测与目标图像相匹配的封面图像；其中，预设条件为预设存储器中未存储封面标识，或者在实体书内容资源中未检测到与目标图像相匹配的内容页图像。

作为一种可选实施例，该装置还包括：

提示模块，用于当在实体书封面资源中未检测到与目标图像相匹配的封面图像时，则提示用户录入待阅读实体书对应的资源。

作为一种可选实施例，第一检测模块601，包括：

第一选取单元，用于确定实体书内容资源中每一内容页图像与目标图像之间的相似度，对每一内容页图像对应的相似度按照从大到小进行排序，选取前第一预设数量个内容页图像，并作为指定内容页图像；

第一确定单元，用于从第一预设数量个指定内容页图像中确定与目标图像相匹配的内容页图像。

作为一种可选实施例，第一确定单元，用于基于每一指定内容页图像中与目标图像相匹配的特征点，计算每一指定内容页图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像；若最大特征欧式距离差值大于第一预设阈值且目标内容页图像与目标图像相匹配的特征点数量大于第二预设阈值，则将目标内容页图像作为与目标图像相匹配的内容页图像。

作为一种可选实施例，第二检测模块，包括：

第二选取单元，用于确定实体书封面资源中每一封面图像与目标图像之间的相似度，对每一封面图像对应的相似度按照从大到小进行排序，选取前第二预设数量个封面图像，并作为指定封面图像；

第二确定单元，用于从第二预设数量个指定封面图像中确定与目标图像相匹配的封面图像。

作为一种可选实施例，第二确定单元，用于基于每一指定封面图像中与目标图像相匹配的特征点，计算每一指定封面图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定封面图像作为目标封面图像；若最大特征欧式距离差值大于第三预设阈值，则将目标封面图像作为与目标图像相匹配的封面图像。

作为一种可选实施例，目标图像是在待阅读实体书处于稳定翻页状态时拍摄得到的。

本发明实施例提供的装置，通过获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像。若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据。由于本次实体书检测过程涉及到的待阅读实体书与上一次实体书检测过程涉及到的实体书为同一本书，从而跳过了对目标图像进行封面检测的过程，进而提高了检测效率。

第二，由于上述检测过程可以在智能阅读设备侧执行，还可以在服务器侧执行，从而智能阅读设备侧只需存储部分实体书的资源，进而节省了智能阅读设备侧的存储空间。最后，由于目标图像是在待阅读实体书处于稳定翻页状态时所拍摄得到的，从而可提高后续检测成功率。

第三，通过在满足预设条件时，则在实体书封面资源中检测与目标图像相匹配的封面图像。由于可在预设存储器中未存储封面标识，或者在实体书内容资源中未检测到与目标图像相匹配的内容页图像时，对目标图像进行封面检测，从而保证了检测逻辑的完整性，进而提高了检测成功率。

第四，通过在封面检测失败后，提示用户录入待阅读实体书对应的资源，从而可拓展实体书的资源，并可满足用户的听书需求。另外，由于在封面检测失败后，可提示用户将待阅读实体书翻至封面，以重新拍照并重新进行封面检测，从而能够避免因用户未翻到封面而导致封面检测失败，从而可提高检测成功率。

第五，通过确定实体书内容资源中每一内容页图像与目标图像之间的相似度，对每一内容页图像对应的相似度按照从大到小进行排序，选取前第一预设数量个内容页图像，并作为指定内容页图像。从第一预设数量个指定内容页图像中确定与目标图像相匹配的内容页图像。由于在确定相似度之前，可按照历史匹配成功次数预先对实体书内容资源中的内容页图像进行筛选，以使得后续不需要对实体书内容资源中的每一内容页图像进行相似度计算，从而可提高检测效率。

第六，由于内容页图像的词袋向量与目标图像的词袋向量之间的巴氏距离越小，则表明该内容页图像与目标图像越近似，从而基于上述筛选过程，可确定与目标图像比较近似的内容页图像，并作为指定内容页图像，进而可提高检测准确率。

第七，通过基于每一指定内容页图像中与目标图像相匹配的特征点，计算每一指定内容页图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像。若最大特征欧式距离差值大于第一预设阈值且目标内容页图像与目标图像相匹配的特征点数量大于第二预设阈值，则将目标内容页图像作为与目标图像相匹配的内容页图像。由于可选取最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像，从而可提高检测准确率。另外，由于在得到目标内容页图像后还会对目标内容页图像进行二层条件的筛选，从而进步提高了检测准确率。

第八，通过确定实体书封面资源中每一封面图像与目标图像之间的相似度，对每一封面图像对应的相似度按照从大到小进行排序，选取前第二预设数量个封面图像，并作为指定封面图像。从第二预设数量个指定封面图像中确定与目标图像相匹配的封面图像。由于在确定相似度之前，可按照历史匹配成功次数预先对封面内容资源中的封面图像进行筛选，以使得后续不需要对封面内容资源中的每一封面图像进行相似度计算，从而可提高检测效率。

第九，由于封面图像的词袋向量与目标图像的词袋向量之间的巴氏距离越小，则表明该封面图像与目标图像越近似，从而基于上述筛选过程，可确定与目标图像比较近似的封面图像，并作为指定封面图像，进而可提高检测准确率。

第十，通过基于每一指定封面图像中与目标图像相匹配的特征点，计算每一指定封面图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定封面图像作为目标封面图像。若最大特征欧式距离差值大于第三预设阈值，则将目标封面图像作为与目标图像相匹配的封面图像。由于可选取最大特征欧式距离差值对应的指定封面图像作为目标封面图像，从而可提高检测准确率。另外，由于在得到目标封面图像后还会对目标封面图像进行筛选，从而进步提高了检测准确率。

本发明实施例提供了一种电子设备。参见图7，该设备包括：处理器(processor)701、存储器(memory)702和总线703；

其中，处理器701及存储器702分别通过总线703完成相互间的通信；

处理器701用于调用存储器702中的程序指令，以执行上述实施例所提供的实体书检测方法，例如包括：获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像；若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据；其中，目标图像为本次开启绘本识别功能后获得的，封面标识是在上一次开启绘本识别功能后存储在预设存储器中的。

本发明实施例提供一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令使计算机执行上述实施例所提供的实体书检测方法，例如包括：获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在封面标识对应的实体书内容资源中检测与目标图像匹配的内容页图像；若在实体书内容资源中检测到与目标图像相匹配的内容页图像，则播报与内容页图像对应的语音数据；其中，目标图像为本次开启绘本识别功能后获得的，封面标识是在上一次开启绘本识别功能后存储在预设存储器中的。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的电子设备等实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分方法。最后，本申请的方法仅为较佳的实施方案，并非用于限定本发明实施例的保护范围。凡在本发明实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明实施例的保护范围之内。

Claims

1.一种实体书检测方法，其特征在于，包括：

获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在所述封面标识对应的实体书内容资源中检测与所述目标图像匹配的内容页图像；

若在所述实体书内容资源中检测到与所述目标图像相匹配的内容页图像，则播报与所述内容页图像对应的语音数据；其中，所述目标图像为本次开启绘本识别功能后获得的，所述封面标识是在上一次开启绘本识别功能后存储在所述预设存储器中的。

2.根据权利要求1所述的方法，其特征在于，还包括：

若满足预设条件，则在实体书封面资源中检测与所述目标图像相匹配的封面图像；其中，所述预设条件为所述预设存储器中未存储封面标识，或者在所述实体书内容资源中未检测到与所述目标图像相匹配的内容页图像。

3.根据权利要求2所述的方法，其特征在于，所述在实体书封面资源中检测与所述目标图像相匹配的封面图像之后，还包括：

若在所述实体书封面资源中未检测到与所述目标图像相匹配的封面图像，则提示用户录入所述待阅读实体书对应的资源。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述在所述封面标识对应的实体书内容资源中检测与所述目标图像匹配的内容页图像，包括：

确定所述实体书内容资源中每一内容页图像与所述目标图像之间的相似度，对每一内容页图像对应的相似度按照从大到小进行排序，选取前第一预设数量个内容页图像，并作为指定内容页图像；

从所述第一预设数量个指定内容页图像中确定与所述目标图像相匹配的内容页图像。

5.根据权利要求4所述的方法，其特征在于，所述从所述第一预设数量个指定内容页图像中确定与所述目标图像相匹配的内容页图像，包括：

基于每一指定内容页图像中与所述目标图像相匹配的特征点，计算每一指定内容页图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定内容页图像作为目标内容页图像；

若所述最大特征欧式距离差值大于第一预设阈值，且所述目标内容页图像与所述目标图像相匹配的特征点数量大于第二预设阈值，则将所述目标内容页图像作为与所述目标图像相匹配的内容页图像。

6.根据权利要求2或3所述的方法，其特征在于，所述在实体书封面资源中检测与所述目标图像相匹配的封面图像，包括：

确定所述实体书封面资源中每一封面图像与所述目标图像之间的相似度，对每一封面图像对应的相似度按照从大到小进行排序，选取前第二预设数量个封面图像，并作为指定封面图像；

从所述第二预设数量个指定封面图像中确定与所述目标图像相匹配的封面图像。

7.根据权利要求6所述的方法，其特征在于，所述从所述第二预设数量个指定封面图像中确定与所述目标图像相匹配的封面图像，包括：

基于每一指定封面图像中与所述目标图像相匹配的特征点，计算每一指定封面图像对应的特征欧式距离差值，并将最大特征欧式距离差值对应的指定封面图像作为目标封面图像；

若所述最大特征欧式距离差值大于第三预设阈值，则将所述目标封面图像作为与所述目标图像相匹配的封面图像。

8.根据权利要求1至3中任一项所述的方法，其特征在于，所述目标图像是在所述待阅读实体书处于稳定翻页状态时拍摄得到的。

9.一种实体书检测装置，其特征在于，包括：

第一检测模块，用于获取待阅读实体书的待阅读页对应的目标图像，若预设存储器中存储有封面标识，则在所述封面标识对应的实体书内容资源中检测与所述目标图像匹配的内容页图像；

播报模块，用于当在所述实体书内容资源中检测到与所述目标图像相匹配的内容页图像时，则播报与所述内容页图像对应的语音数据；其中，所述目标图像为本次开启绘本识别功能后获得的，所述封面标识是在上一次开启绘本识别功能后存储在所述预设存储器中的。

10.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至8任一所述的方法。

11.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至8任一所述的方法。