CN111008295A - 书页检索方法、装置、电子设备和存储介质 - Google Patents
书页检索方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111008295A CN111008295A CN201911108498.2A CN201911108498A CN111008295A CN 111008295 A CN111008295 A CN 111008295A CN 201911108498 A CN201911108498 A CN 201911108498A CN 111008295 A CN111008295 A CN 111008295A
- Authority
- CN
- China
- Prior art keywords
- page
- image
- cover
- data
- vector data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Abstract
本申请实施例公开了一种书页检索方法、装置、电子设备和存储介质,该方法包括:获取封面图像和当前书页图像;确定封面图像的矢量数据和当前书页图像的矢量数据,其中,封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页。提高了书页检索的检索速度、准确率和应用范围。
Description
技术领域
本申请实施例涉及图像识别和处理技术,尤其涉及一种书页检索方法、装置、电子设备和存储介质。
背景技术
随着科技的进步和人们生活水平的提高,越来越多的电子设备走入人们的生活,给人们的生活带来极大便利。例如,当孩子阅读纸质书籍时,遇到不懂的问题或者想要更深一步了解某部分知识时,可以通过电子设备找到该页,并进行后续的查询。
对于纸质书籍,一般是在智能手机的相关软件上手工选择相应的书籍、章节或页码,或者直接识别书页上的页码,但是,该方法对数字页面的识别精度要求很高;而对于图画类书籍,通过机器学习的方式训练分类器,然后通过识别分类器中对应的图片,找到对应的页码,但是这种方式一方面数据处理量大,另一方面识别的准确率较低,而且应用范围有限。
发明内容
本申请提供了一种书页检索方法、装置、电子设备和存储介质,以解决现有技术中书页检索准确率低、数据处理量大以及应用范围有限的问题。
本发明采用如下技术方案:
第一方面,本申请实施例提供了一种书页检索方法,该方法包括:
获取封面图像和当前书页图像;
确定所述封面图像的矢量数据和所述当前书页图像的矢量数据,其中,所述封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,所述当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;
将所述封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;
将所述当前书页图像的矢量数据输入至预先存储的所述目标书籍对应的书页数据库进行检索,以确定目标书页。
第二方面,本申请实施例提供了一种书页检索装置,该装置包括:
图像获取模块,用于获取封面图像和当前书页图像;
矢量数据确定模块,用于确定所述封面图像的矢量数据和所述当前书页图像的矢量数据,其中,所述封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,所述当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;
目标书籍确定模块,用于将所述封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;
目标书页确定模块,用于将所述当前书页图像的矢量数据输入至预先存储的所述目标书籍对应的书页数据库进行检索,以确定目标书页。
第三方面,本申请实施例提供了一种电子设备,包括存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的书页检索方法。
第四方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的书页检索方法。
本发明采用的技术方案中有如下有益效果:通过获取封面图像和当前书页图像,来确定封面图像的封面全局特征数据和封面局部特征数据,以及,当前书页图像的书页全局特征数据和书页局部特征数据,这样,应用图像数据,综合考虑了全局特征数据和局部特征数据,提高了书页检索准确率以及应用范围;将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页,这样,先确定目标书籍,然后只在目标书籍对应的书页数据库进行检索,降低了计算量,提高了检索速度。因此,应用本申请实施例的技术方案提高了书页检索的检索速度和准确率,扩大了应用范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例提供的一种书页检索方法的流程图;
图2是本申请实施例提供的另一种书页检索方法的流程图;
图3是本申请实施例提供的一种书页检索装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
首先对本申请实施例的可应用场景进行说明。本申请实施例可应用在图像检索中,例如教育场景中的点读场景,也即,通过检索书页返回对应的内容,以辅助学生学习。
图1给出了本申请实施例提供的一种书页检索方法的流程图,本实施例提供的书页检索方法可以由书页检索装置来执行,该书页检索装置可通过硬件和/或软件的方式实现。参考图1,该方法具体可以包括:
S101、获取封面图像和当前书页图像。
具体的,将学生正看的书页称为当前书页,当学生有检索书页的需求时,应用集成本申请实施例中书页检索功能的电子设备对当前书页进行拍照,同时,再对当前书籍的封面进行拍照,以获取封面图像和当前书页图像。另外,还可以用其他具备拍照功能的终端对当前书页和封面分别进行拍照后,将封面图像和当前书页图像发送至电子设备。
在一个具体的例子中,在书页检索之前,可以打开电子设备的“绘本阅读”功能,以进入书页检索状态,此时,可以对封面图像和当前书页图像进行拍摄。
S102、确定封面图像的矢量数据和当前书页图像的矢量数据,其中,封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据。
其中,全局特征是指能表示整幅图像上的特征,也即,图像的整体属性,全局特征是相对于局部特征而言的,用于描绘图像或目标的颜色和形状等整体特征,常见的全局特征包括颜色特征、纹理特征和形状特征,比如强度直方图等。全局特征是像素级的低层可视特征,因此,全局特征具有良好的不变性、计算简单、表示直观等特点,但特征维数高、计算量大。
另外,局部特征是图像特征的局部表达,它反映了图像上具有的局部特性,适合于对图像进行匹配、检索等应用,例如,局部特征则是从图像局部区域中抽取的特征,包括边缘、角点、线、曲线和特别属性的区域等。常见的局部特征包括角点类和区域类两大类描述方式。与线特征、纹理特征、结构特征等全局图像特征相比,局部图像特征具有在图像中蕴含数量丰富、特征间相关度小、遮挡情况下不会因为部分特征的消失而影响其他特征的检测和匹配等特点。
因此,本申请实施例中合理应用全局特征和局部特征,充分利用各自优点,在获取到封面图像和当前书页图像后,确定封面图像的封面全局特征数据和封面局部特征数据,以及,书页全局特征数据和书页局部特征数据。在一个具体的例子中,上述全局特征数据和局部特征数据均可以是二进制流的形式。
S103、将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍。
可选的,电子设备中预先储存有封面数据库,该封面数据库中存储有若干封面数据,其存储形式可以是矢量数据的形式。其中,每一本书对应一组封面数据,比如,《三字经》对应一组封面数据、《百家姓》对应一组封面数据等。在实际应用中,家长可以通过电子设备预先存储孩子经常看的书的封面数据,还可以在每次买来新书后,对封面数据库进行更新,将该新书的封面的封面数据添加至封面数据库。需要说明的是,封面数据库的更新过程可以由电子设备提供相应的选项供家长进行选择,家长也可以手动进行更新。
具体的,将当前书页所属的封面的矢量数据输入至预先存储的封面数据库进行匹配,例如,可以按照设定的匹配规则来计算匹配度,然后将匹配度最高的封面数据对应的书籍作为目标书籍。该过程中,首先进行了一定程度的数据筛选,筛选出当前书页所属书籍对应的全部书页数据供检索使用,提高了减速速度和准确率。
S104、将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页。
其中,每个书籍均对应一组书页数据,该组书页数据中包括该书籍下的全部书页的矢量数据。而每组书页数据可以单独存储在一个数据库中,还可以一起存储在一个共同的书页数据库中。具体的,将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库中进行检索,无需输入至全部数据对应的每个书页数据库中进行检索,按书籍不同对书页数据进行分类存储,节约了计算量,提高了处理速度。
另外,检索过程可以是计算当前书页图像的矢量数据与预先存储的目标书籍对应的书页数据库中存储的每个书页数据的匹配度,然后将匹配度最高的作为目标书页展示给用户,还可以将匹配度排名比较靠前的前几组书页数据对应的书页作为目标书页展示给用户,例如可以是5个,这样,给用户提供更多的选择,可以避免由于匹配失误造成的用户体验差的问题。
本发明采用的技术方案中有如下有益效果:通过获取封面图像和当前书页图像,来确定封面图像的封面全局特征数据和封面局部特征数据,以及,当前书页图像的书页全局特征数据和书页局部特征数据,这样,应用图像数据,综合考虑了全局特征数据和局部特征数据,提高了书页检索准确率以及应用范围;将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页,这样,先确定目标书籍,然后只在目标书籍对应的书页数据库进行检索,降低了计算量,提高了检索速度。因此,应用本申请实施例的技术方案提高了书页检索的检索速度和准确率,扩大了应用范围。
在上述实施例的基础上,图2给出了本申请实施例提供的另一种书页检索方法的流程图。该书页检索方法是对上述书页检索的具体化。参考图2,该书页检索方法包括:
S201、对拍摄封面得到的图像和拍摄当前书页得到的图像按照预设剪裁规则进行剪裁,确定封面图像和当前书页图像。
在实际的应用过程中,通常是孩子自己应用电子设备进行书页检索,而部分孩子可能拿不稳电子设备导致拍摄得到的图像包括了过多的外围区域,比如,一张图像中四周是桌子的图像区域较大。因此,对电子设备拍摄得到的封面图像和拍摄当前是书页得到的图像安全预设规则进行剪裁,这样可以将无关的图像部分去除,确定封面图像和当前书页图像。示例性的,预设剪裁规则可以是通过识别明显颜色变化或者明显图像变化剪裁的规则。这样,一方面降低了数据处理量,另一方面也提高了检索精度。
S2021、将封面图像输入预先训练的第一模型,得到封面全局特征数据。
其中,预先训练的第一模型可以是深度学习模型,还可以是其他可以实现本申请技术方案的机器模型,例如可以是MGN(Multiple Granularity Network,多粒度网络)模型。示例性的,预先训练是指,用大量的训练样本来训练预先构建的深度学习模型,然后当训练结果满足收敛条件时,得到训练好的深度学习模型,称为预先训练的第一模型。
具体的,将封面图像输入至预先训练的模型,根据输出结果得到该封面图像的封面全局特征数据,例如,输出结果的标签为1,则根据该标签1查找对应的全局特征数据为对应的封面图像的封面全局特征数据。
S2022、对封面图像进行分块,将分块后的封面图像输入至预先训练的第一模型,得到封面水平局部特征数据和封面垂直局部特征数据。
在一个具体的例子中,分块包括垂直二等分和水平二等分,这样就可以将封面图像分为上、下、左和右四块,称为分块后的封面图像。将分块后的封面图像输入至预先训练的第一模型,得到封面水平局部特征数据和封面垂直局部特征数据。其中,第一模型的训练样本包括分块前的封面图像和分块后的封面图像。
S2023、将封面全局特征数据、封面水平局部特征数据和封面垂直局部特征数据合并成封面图像的矢量数据。
具体的,按照设定的数据合成规则,将封面全局特征数据、封面水平特征数据和封面局部特征数据合并成封面图像的矢量数据。示例性的,设定的数据合成规则可以是将全局特征数据设置在低维,将局部特征数据设置在高维等。
S2031、将当前书页图像输入预先训练的第二模型,得到书页全局特征数据。
其中,预先训练的第一模型可以是深度学习模型,还可以是其他可以实现本申请技术方案的机器模型,例如可以是MGN(Multiple Granularity Network,多粒度网络)模型。示例性的,预先训练是指,用大量的训练样本来训练预先构建的深度学习模型,然后当训练结果满足收敛条件时,得到训练好的深度学习模型,称为预先训练的第二模型。在一个具体的例子中,第二模型的类型可以与第一模型的类型相同,也可以与第二模型的类型不同,比如当第一模型为MGN模型时,第二模型可以是卷积神经网络模型。
具体的,将当前书页图像输入至预先训练的第二模型,根据输出结果得到该当前书页图像的书页全局特征数据,例如,输出结果的标签为2,则根据该标签2查找对应的全局特征数据为对应的封面图像的书页全局特征数据。
S2032、对当前书页图像进行分块,将分块后的当前书页图像输入至预先训练的第二模型,得到书页水平局部特征数据和书页垂直局部特征数据。
在一个具体的例子中,分块包括垂直二等分和水平二等分,这样就可以将当前书页图像分为上、下、左和右四块,称为分块后的当前书页图像。将分块后的当前书页图像输入至预先训练的第二模型,得到书页水平局部特征数据和书页垂直局部特征数据。其中,第二模型的训练样本为分块前的书页图像和分块后的书页图像。
S2033、将书页全局特征数据、书页水平局部特征数据和书页垂直局部特征数据合并成当前书页图像的矢量数据。
具体的,按照设定的数据合成规则,将书页全局特征数据、书页水平特征数据和书页局部特征数据合并成书页图像的矢量数据。示例性的,设定的数据合成规则可以是将全局特征数据设置在低维,将局部特征数据设置在高维等。
在一个具体的例子中,上述全局特征数据和局部特征数据均可以是二进制流的形式,而在合成封面图像的矢量数据以及合成当前书页图像的矢量数据之前,可以对二进制流的全局特征数据和局部特征数据进行编码并解码,这样,通过加密处理,提高了书页检索过程的安全等级。
S204、将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍标识。
其中,封面数据库中的每组封面数据对应一本书籍,该书籍可以用唯一标识来标记,比如是数字和字母的组合等。具体的,将封面图像的矢量数据输入至预先存储的封面数据库中,根据匹配度确定目标书籍标识比如是178_ag。
S205、根据目标书籍标识确定目标书籍。
由于书籍的数据标识和书籍具有一一对应性,则可以根据目标书籍标识进行查找,确定目标书籍。在一个具体的例子中,目标书籍可以是《唐诗三百首》。
S206、在预先存储的书页数据库中筛选目标书籍对应的书页数据作为待检索书页数据。
具体的,当确定了目标书籍后,只需要在目标书籍对应的书页数据库中进行检索,也即,将目标书籍对应的书页数据作为待检索书页数据。在上述具体的例子中,只需将《唐诗三百首》对应的书页数据作为待检索书页数据,无需将其他无关的书页数据作为待检索数据,以降低计算量,提高检索速度和准确率。
S207、将当前书页的矢量数据与待检索书页数据进行检索匹配。
具体的,待检索书页数据在存储之前可以经过相应的数据处理,其存在形式可以是矢量数据,这样,将当前书页的矢量数据与待检索书页数据进行检索匹配。
S208、根据匹配度确定书页数据的目标标识,以确定目标书页。
示例性的,根据匹配度不同,可以确定匹配度最高的书页数据的目标标识,还可以确定匹配度前5名的书页数据的目标标识,这样确定的目标书页可以是一个,也可以是多个,在这个例子中为5个。确定多个目标书页可以避免其他偶然性因素造成的检索误差,以提高检索准确率。
S209、将目标书页、目标书页的页码和目标书页所属的目标书籍的书籍名称显示在当前显示页面的预设区域。
具体的,将目标书页、目标书页的页码和目标书页所属的目标书籍的书籍名称显示在当前页面的预设区域。其中,可以显示一个目标书页的上述相关信息,还可以显示多个目标书页的上述相关信息,同时,将每个目标书页的上述相关信息中附带显示书页匹配过程中的匹配度,以供用户进行参考。可选的,预设区域可以是电子设备当前显示页面的右上角等,以不影响用户阅读体验为佳。
需要说明的是,S2021-S2023为封面图像的矢量数据的确定过程,S2031-S2033为当前书页图像的矢量数据的确定过程,这两个过程之间并无明显的先后关系,图2中只是用来示例。
本申请实施例中,通过对拍摄封面得到的图像和拍摄当前书页得到的图像进行剪裁,避免了对图像中的不属于封面和当前书页的图像部分进行处理,降低了计算量,提高了书页检索精度;针对封面图像和当前书页图像,均应用深度学习模型进行处理,得到封面全局特征数据、封面水平局部特征数据和封面垂直局部特征数据,以及,书页全局特征数据、书页水平局部特征数据和书页垂直局部特征数据,然后将相应的特征数据进行合成得到相应的矢量数据,再根据矢量数据确定的目标标识来确定目标书籍,只在目标书籍对应的书页数据中进行检索来确定目标书页,降低了计算量,提高了书页检索精度;最后将目标书页、目标书页的页码和目标书页所属的目标书籍的书籍名称显示在当前显示页面的预设区域,用户可以直观的获取到上述信息,提高了交互体验。
另外,应用本申请实施例的技术方案,尤其克服了相关技术中在两张相似度较高的页面或者纯文字页面的检索准确率低的问题。本申请实施例中的建所以方法不仅适用于孩子课外学习中,还可以适用于教学中,不限于语文、英文以及数学等科目。
在上述实施例的基础上,图3为本申请实施例提供的一种书页检索装置的结构示意图。参考图3,本实施例提供的书页检索装置具体包括:图像获取模块301、矢量数据确定模块302、目标书籍确定模块303和目标书页确定模块304。
其中,图像获取模块301,用于获取封面图像和当前书页图像;矢量数据确定模块302,用于确定封面图像的矢量数据和当前书页图像的矢量数据,其中,封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;目标书籍确定模块303,用于将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;目标书页确定模块304,用于将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页。
本发明采用的技术方案中有如下有益效果:通过获取封面图像和当前书页图像,来确定封面图像的封面全局特征数据和封面局部特征数据,以及,当前书页图像的书页全局特征数据和书页局部特征数据,这样,应用图像数据,综合考虑了全局特征数据和局部特征数据,提高了书页检索准确率以及应用范围;将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页,这样,先确定目标书籍,然后只在目标书籍对应的书页数据库进行检索,降低了计算量,提高了检索速度。因此,应用本申请实施例的技术方案提高了书页检索的检索速度和准确率,扩大了应用范围。
进一步的,矢量数据确定模块302具体用于:
将封面图像输入预先训练的第一模型,得到封面全局特征数据;
对封面图像进行分块,将分块后的封面图像输入至预先训练的第一模型,得到封面水平局部特征数据和封面垂直局部特征数据;
将封面全局特征数据、封面水平局部特征数据和封面垂直局部特征数据合并成封面图像的矢量数据。
进一步的,矢量数据确定模块302具体用于:
将当前书页图像输入预先训练的第二模型,得到书页全局特征数据;
对当前书页图像进行分块,将分块后的当前书页图像输入至预先训练的第二模型,得到书页水平局部特征数据和书页垂直局部特征数据;
将书页全局特征数据、书页水平局部特征数据和书页垂直局部特征数据合并成当前书页图像的矢量数据。
进一步的,目标书籍确定模块303具体用于:
将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍标识;
根据目标书籍标识确定目标书籍。
进一步的,目标书页确定模块304具体用于:
在预先存储的书页数据库中筛选目标书籍对应的书页数据作为待检索书页数据;
将当前书页的矢量数据与待检索书页数据进行检索匹配;
根据匹配度确定书页数据的目标标识,以确定目标书页。
进一步的,还包括显示模块,用于在将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页之后,将目标书页、目标书页的页码和目标书页所属的目标书籍的书籍名称显示在当前显示页面的预设区域。
进一步的,图像获取模块301具体用于:
对拍摄封面得到的图像和拍摄当前书页得到的图像按照预设剪裁规则进行剪裁,确定封面图像和当前书页图像。
本申请实施例提供的书页检索装置可以用于执行上述实施例提供的书页检索方法,具备相应的功能和有益效果。
本申请实施例提供了一种电子设备,且该电子设备中可集成本申请实施例提供的书页检索装置。图4是本申请实施例提供的一种电子设备的结构示意图。参考图4,该电子设备包括:处理器40、存储器41。该电子设备中处理器40的数量可以是一个或者多个,图4中以一个处理器40为例。该电子设备中存储器41的数量可以是一个或者多个,图4中以一个存储器41为例。该电子设备的处理器40和存储器41可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的书页检索方法对应的程序指令/模块(例如,书页检索装置中的图像获取模块301、矢量数据确定模块302、目标书籍确定模块303和目标书页确定模块304)。存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的书页检索方法,该书页检索方法包括:获取封面图像和当前书页图像;确定封面图像的矢量数据和当前书页图像的矢量数据,其中,封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页。
上述提供的电子设备可用于执行上述实施例提供的书页检索方法,具备相应的功能和有益效果。
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种书页检索方法,该书页检索方法包括:获取封面图像和当前书页图像;确定封面图像的矢量数据和当前书页图像的矢量数据,其中,封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;将封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;将当前书页图像的矢量数据输入至预先存储的目标书籍对应的书页数据库进行检索,以确定目标书页。
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的书页检索方法,还可以执行本申请任意实施例所提供的书页检索方法中的相关操作。
上述实施例中提供的书页检索装置、存储介质及电子设备可执行本申请任意实施例所提供的书页检索方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的书页检索方法。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。
Claims (10)
1.一种书页检索方法,其特征在于,包括:
获取封面图像和当前书页图像;
确定所述封面图像的矢量数据和所述当前书页图像的矢量数据,其中,所述封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,所述当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;
将所述封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;
将所述当前书页图像的矢量数据输入至预先存储的所述目标书籍对应的书页数据库进行检索,以确定目标书页。
2.根据权利要求1所述的方法,其特征在于,所述确定所述封面图像的矢量数据包括:
将所述封面图像输入预先训练的第一模型,得到封面全局特征数据;
对所述封面图像进行分块,将分块后的封面图像输入至所述预先训练的第一模型,得到封面水平局部特征数据和封面垂直局部特征数据;
将所述封面全局特征数据、所述封面水平局部特征数据和所述封面垂直局部特征数据合并成封面图像的矢量数据。
3.根据权利要求1所述的方法,其特征在于,所述确定所述当前书页图像的矢量数据包括:
将所述当前书页图像输入预先训练的第二模型,得到书页全局特征数据;
对所述当前书页图像进行分块,将分块后的当前书页图像输入至所述预先训练的第二模型,得到书页水平局部特征数据和书页垂直局部特征数据;
将所述书页全局特征数据、所述书页水平局部特征数据和所述书页垂直局部特征数据合并成当前书页图像的矢量数据。
4.根据权利要求1所述的方法,其特征在于,所述将所述封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍,包括:
将所述封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍标识;
根据所述目标书籍标识确定目标书籍。
5.根据权利要求1所述的方法,其特征在于,所述将所述当前书页图像的矢量数据输入至预先存储的所述目标书籍对应的书页数据库进行检索,以确定目标书页,包括:
在所述预先存储的书页数据库中筛选所述目标书籍对应的书页数据作为待检索书页数据;
将所述当前书页的矢量数据与所述待检索书页数据进行检索匹配;
根据匹配度确定书页数据的目标标识,以确定目标书页。
6.根据权利要求1所述的方法,其特征在于,所述将所述当前书页图像的矢量数据输入至预先存储的所述目标书籍对应的书页数据库进行检索,以确定目标书页,之后,还包括:
将所述目标书页、所述目标书页的页码和所述目标书页所属的目标书籍的书籍名称显示在当前显示页面的预设区域。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述获取封面图像和当前书页图像包括:
对拍摄封面得到的图像和拍摄当前书页得到的图像按照预设剪裁规则进行剪裁,确定封面图像和当前书页图像。
8.一种书页检索装置,其特征在于,包括:
图像获取模块,用于获取封面图像和当前书页图像;
矢量数据确定模块,用于确定所述封面图像的矢量数据和所述当前书页图像的矢量数据,其中,所述封面图像的矢量数据包括封面全局特征数据和封面局部特征数据,所述当前书页图像的矢量数据包括书页全局特征数据和书页局部特征数据;
目标书籍确定模块,用于将所述封面图像的矢量数据输入至预先存储的封面数据库确定目标书籍;
目标书页确定模块,用于将所述当前书页图像的矢量数据输入至预先存储的所述目标书籍对应的书页数据库进行检索,以确定目标书页。
9.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一所述的书页检索方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一所述的书页检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911108498.2A CN111008295A (zh) | 2019-11-13 | 2019-11-13 | 书页检索方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911108498.2A CN111008295A (zh) | 2019-11-13 | 2019-11-13 | 书页检索方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111008295A true CN111008295A (zh) | 2020-04-14 |
Family
ID=70113415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911108498.2A Pending CN111008295A (zh) | 2019-11-13 | 2019-11-13 | 书页检索方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008295A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132127A (zh) * | 2020-08-10 | 2020-12-25 | 北京网梯科技发展有限公司 | 点读中实现图书自动切换的方法及装置 |
CN112270760A (zh) * | 2020-11-03 | 2021-01-26 | 北京百度网讯科技有限公司 | 一种定位方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020062358A1 (en) * | 2000-05-31 | 2002-05-23 | Etsuo Kori | Review data retrieval system |
JP2007174202A (ja) * | 2005-12-21 | 2007-07-05 | Canon Inc | 動きベクトル検出装置およびその方法 |
US20080082426A1 (en) * | 2005-05-09 | 2008-04-03 | Gokturk Salih B | System and method for enabling image recognition and searching of remote content on display |
CN104778458A (zh) * | 2015-04-17 | 2015-07-15 | 浙江理工大学 | 一种基于纹理特征的纺织品花纹检索方法 |
US20180260479A1 (en) * | 2017-03-09 | 2018-09-13 | Beijing Ling Technology Co.,Ltd. | Method, apparatus, system and electronic device for picture book recognition |
CN109255346A (zh) * | 2018-08-31 | 2019-01-22 | 深圳闳宸科技有限公司 | 点读方法、装置及电子设备 |
CN109558559A (zh) * | 2018-11-30 | 2019-04-02 | 掌阅科技股份有限公司 | 书架页面的展示方法、电子设备及计算机存储介质 |
CN109857889A (zh) * | 2018-12-19 | 2019-06-07 | 苏州科达科技股份有限公司 | 一种图像检索方法、装置、设备及可读存储介质 |
US20190179499A1 (en) * | 2017-10-20 | 2019-06-13 | Qurika Inc. | Systems and methods for providing a digital content reader and collection display application implementing 3d graphical user interfaces and interactions |
CN110263187A (zh) * | 2019-06-19 | 2019-09-20 | 深圳市沃特沃德股份有限公司 | 绘本识别方法、装置、存储介质及计算机设备 |
-
2019
- 2019-11-13 CN CN201911108498.2A patent/CN111008295A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020062358A1 (en) * | 2000-05-31 | 2002-05-23 | Etsuo Kori | Review data retrieval system |
US20080082426A1 (en) * | 2005-05-09 | 2008-04-03 | Gokturk Salih B | System and method for enabling image recognition and searching of remote content on display |
JP2007174202A (ja) * | 2005-12-21 | 2007-07-05 | Canon Inc | 動きベクトル検出装置およびその方法 |
CN104778458A (zh) * | 2015-04-17 | 2015-07-15 | 浙江理工大学 | 一种基于纹理特征的纺织品花纹检索方法 |
US20180260479A1 (en) * | 2017-03-09 | 2018-09-13 | Beijing Ling Technology Co.,Ltd. | Method, apparatus, system and electronic device for picture book recognition |
US20190179499A1 (en) * | 2017-10-20 | 2019-06-13 | Qurika Inc. | Systems and methods for providing a digital content reader and collection display application implementing 3d graphical user interfaces and interactions |
CN109255346A (zh) * | 2018-08-31 | 2019-01-22 | 深圳闳宸科技有限公司 | 点读方法、装置及电子设备 |
CN109558559A (zh) * | 2018-11-30 | 2019-04-02 | 掌阅科技股份有限公司 | 书架页面的展示方法、电子设备及计算机存储介质 |
CN109857889A (zh) * | 2018-12-19 | 2019-06-07 | 苏州科达科技股份有限公司 | 一种图像检索方法、装置、设备及可读存储介质 |
CN110263187A (zh) * | 2019-06-19 | 2019-09-20 | 深圳市沃特沃德股份有限公司 | 绘本识别方法、装置、存储介质及计算机设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132127A (zh) * | 2020-08-10 | 2020-12-25 | 北京网梯科技发展有限公司 | 点读中实现图书自动切换的方法及装置 |
CN112270760A (zh) * | 2020-11-03 | 2021-01-26 | 北京百度网讯科技有限公司 | 一种定位方法、装置、电子设备及存储介质 |
CN112270760B (zh) * | 2020-11-03 | 2023-07-25 | 北京百度网讯科技有限公司 | 一种定位方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113283551B (zh) | 多模态预训练模型的训练方法、训练装置及电子设备 | |
RU2668717C1 (ru) | Генерация разметки изображений документов для обучающей выборки | |
CN110446063B (zh) | 视频封面的生成方法、装置及电子设备 | |
CN111191067A (zh) | 绘本识别方法、终端设备及计算机可读存储介质 | |
CN110232340B (zh) | 建立视频分类模型以及视频分类的方法、装置 | |
CN103988202A (zh) | 基于索引和搜索的图像吸引力 | |
CN110851641A (zh) | 跨模态检索方法、装置和可读存储介质 | |
KR20190108378A (ko) | 이미지 캡션 자동 생성 방법 및 시스템 | |
CN107644105A (zh) | 一种搜题方法及装置 | |
CN111610901B (zh) | 一种基于ai视觉下的英语课文辅助教学方法及系统 | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
CN111008295A (zh) | 书页检索方法、装置、电子设备和存储介质 | |
CN110807472B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN114357206A (zh) | 基于语义分析的教育类视频彩色字幕生成方法及系统 | |
CN112800177B (zh) | 基于复杂数据类型的faq知识库自动生成方法和装置 | |
CN111582281B (zh) | 一种图片显示优化的方法、装置、电子设备和存储介质 | |
CN113805977B (zh) | 测试取证方法及模型训练方法、装置、设备、存储介质 | |
CN116434253A (zh) | 图像处理方法、装置、设备、存储介质及产品 | |
CN111881338A (zh) | 一种基于社交软件轻应用小程序的印刷品内容检索方法 | |
CN113591857A (zh) | 字符图像处理方法、装置及古代汉籍图像的识别方法 | |
CN116612466B (zh) | 基于人工智能的内容识别方法、装置、设备及介质 | |
Lu et al. | Complementary pseudolabel based on global-and-channel information for unsupervised person reidentification | |
CN113392756A (zh) | 图本识别方法及装置 | |
CN117690192B (zh) | 多视图实例-语义共识挖掘的异常行为识别方法和设备 | |
US20230326046A1 (en) | Application matching method and application matching device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |