CN108304562B - 一种搜题方法、搜题装置及智能终端 - Google Patents
一种搜题方法、搜题装置及智能终端 Download PDFInfo
- Publication number
- CN108304562B CN108304562B CN201810128798.6A CN201810128798A CN108304562B CN 108304562 B CN108304562 B CN 108304562B CN 201810128798 A CN201810128798 A CN 201810128798A CN 108304562 B CN108304562 B CN 108304562B
- Authority
- CN
- China
- Prior art keywords
- selected frame
- question
- type
- current
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000004590 computer program Methods 0.000 claims description 17
- 238000009432 framing Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 235000013559 Schnittsellerie Nutrition 0.000 description 1
- 244000169997 Schnittsellerie Species 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种搜题方法、搜题装置、智能终端及计算机可读存储介质。其中,所述搜题方法,包括:获取包含待搜索题目的图片;通过选定框对所述图片中的每一行文本内容进行框选;基于各个选定框中起始字符的字符类型以及预设的对应关系信息,确定各个选定框的标签类型;将所述图片中面积最大的选定框确定为当前选定框;判断当前选定框的标签类型是否为题干类型;若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与第一选定框集合中各选定框的文本内容生成目标题目;将目标题目发送至云端服务器,并接收云端服务器返回的搜题结果。本申请可自动对题目进行框选,提高了用户体验以及搜题效率。
Description
技术领域
本申请属于信息识别技术领域,尤其涉及一种搜题方法、搜题装置、智能终端及计算机可读存储介质。
背景技术
目前,市场上有许多解决学生作业难题的搜题类应用程序(后续简称搜题APP),比如:阿凡题、火影搜题、作业超人等,这些搜题APP均需要用户对题目进行拍照,由于拍照时可能会拍到其它不需要搜索的题目,所以拍照后需要用户对想要搜索的题目进行手动框选。这会使得用户的操作步骤比较复杂,尤其对于年龄比较小的用户,很难准确框选题目,手动操作十分不方便。
目前,行业内已经存在一种搜题方法,可以实现智能终端自动地对用户想要搜索的题目进行选择,然而,这种方法需要用户在拍照之前,在书本上对想要搜索的题目用高光笔进行标记,或者用不规则线条对题目进行框选,显然,这种方法只是将用户手动框选的步骤放置在了拍照之前,本质上依然需要用户对题目进行手动框选,并不能非常好的提高用户体验并且也不利于保持书本的洁净。
发明内容
有鉴于此,本申请提供了一种搜题方法、搜题装置、智能终端及计算机可读存储介质,不需要用户在书本上对题目进行标记,可实现对题目的智能选择。
本申请第一方面提供了一种搜题方法,包括:
获取包含待搜索题目的图片;
通过选定框对所述图片中的每一行文本内容进行框选;
基于各个选定框中起始字符的字符类型以及预设的对应关系信息,分别确定各个选定框的标签类型,其中,所述对应关系信息指示字符类型与标签类型的对应关系,所述标签类型分为题干类型和非题干类型;
将所述图片中面积最大的选定框确定为当前选定框;
判断当前选定框的标签类型是否为题干类型;
若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与所述第一选定框集合中各选定框的文本内容生成目标题目,其中,所述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成;
将所述目标题目发送至云端服务器,并接收所述云端服务器基于所述目标题目进行搜题后返回的搜题结果。
本申请第二方面提供了一种搜题装置,包括:
图片获取单元,用于获取包含待搜索题目的图片;
框选单元,用于通过选定框对所述图片中的每一行文本内容进行框选;
类型确定单元,用于基于各个选定框中起始字符的字符类型以及预设的对应关系信息,分别确定各个选定框的标签类型,其中,所述对应关系信息指示字符类型与标签类型的对应关系,所述标签类型分为题干类型和非题干类型;
当前选定框确定单元,用于将所述图片中面积最大的选定框确定为当前选定框;
题干判断单元,用于判断当前选定框的标签类型是否为题干类型;
第一目标题目单元,用于若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与所述第一选定框集合中各选定框的文本内容生成目标题目,其中,所述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成;
通信单元,用于将所述目标题目发送至云端服务器,并接收所述云端服务器基于所述目标题目进行搜题后返回的搜题结果。
本申请第三方面提供了一种智能终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述方法的步骤。
由上可见,本申请提供了一种搜题方法,首先获取包含待搜索题目的图片;其次,对图片中的每一行文本内容进行框选,获取各个选定框中文本内容的起始字符的字符类型,并根据预先存储的对应关系信息,来获取各个选定框的标签类型,上述对应关系信息指示字符类型与标签类型的对应关系,上述标签类型分为题干类型和非题干类型,比如,若某个选定框的起始字符的字符类型为数字类型,则认为该选定框中的文本内容为题干,其标签类型为题干类型,否则认为为非题干类型;通常情况下,待搜索的题目往往占据较大的面积,因此,选取面积最大的框作为当前选定框,并寻找与该当前选定框属于同一道题的其他内容,若当前选定框的标签类型为题干类型,则需要在当前选定框下方寻找与当前选定框属于同一道题的其他内容,若在当前选定框下方存在标签类型不是题干类型的连续的一个或两个以上的选定框,则该一个或两个以上连续的选定框应与当前选定框属于同一道题,因此,若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与上述第一选定框集合中各选定框的文本内容生成目标题目,其中,上述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成;最后将上述目标题目发送至云端服务器,并接收该云端服务器返回的搜题结果。通过本申请的技术方案,智能终端可以通过面积最大的选定框来找寻用户想要搜索的题目,将上述面积最大的选定框作为当前选定框,并当该当前选定框为题干类型时,自动识别与该当前选定框属于同一道题的其他选定框,避免了用户的手动操作,并且也不需要用户对题目进行任何标记,提高了用户体验以及搜题效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例一提供的搜题方法的实现流程示意图;
图2是本申请实施例一提供的对每一行文本内容进行框选后的示意图;
图3是本申请实施例一提供的根据像素值对每一行文本内容进行框选后的示意图;
图4是本申请实施例一提供的另一对每一行文本内容进行框选后的示意图;
图5是本申请实施例一提供的又一对每一行文本内容进行框选后的示意图;
图6是本申请实施例一提供的再一对每一行文本内容进行框选后的示意图;
图7是本申请实施例二提供的搜题方法的实现流程示意图;
图8是本申请实施例二提供的对每一行文本内容进行框选后的示意图;
图9是本申请实施例二提供的另一对每一行文本内容进行框选后的示意图;
图10是本申请实施例三提供的搜题装置的结构示意图;
图11是本申请实施例四提供的智能终端的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
本申请实施例提供的搜题方法适用于智能终端,示例性地,上述智能终端包括但不限于:手机终端、平板电脑、台式电脑等。
为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。
实施例一
下面对本申请实施例一提供的搜题方法进行描述,请参阅附图1。本申请实施例的搜题方法包括:
步骤S101,获取包含待搜索题目的图片;
在本申请实施例中,智能终端需要首先获取包含待搜索题目的图片,上述图片可以为用户想要搜题时,通过智能终端的摄像头拍摄的图片;或者也可以为预先存储在智能终端中的图片。
步骤S102,通过选定框对上述图片中的每一行文本内容进行框选;
在本申请实施例中,智能终端获取到包含待搜索题目的图片后,会对上述图片中的每一行文本内容进行框选,以便于后续判断哪些文本内容是属于同一道题,如图2所示,为本申请实施例提供的一种对上述图片中的每一行文本内容进行框选后的示意图,其中,该选定框可以为矩形框,还可以为椭圆形框或者其他形状框,此处不作限定。此外,该选定框可以在智能终端的屏幕上显示,也可以不在智能终端的屏幕上显示。
具体的,对上述图片中的每一行文本内容进行框选,可以为:
首先,遍历上述图片中的各个像素点的像素值,根据各个像素点的像素值判断各个像素点是否为组成文本内容的一部分,比如,若某个像素点的R、G、B值均比较小,则可认为该像素点是组成文本内容的一部分(由于R、G、B的值均较小时,该像素点的颜色较深,因此,可认为该像素点为某个汉字、公式或图形的一部分),若某个像素点的R、G、B值均比较大,则可认为该像素点为背景部分,不是组成文本内容的一部分(由于R、G、B的值均较大时,该像素点的颜色较浅,因此,可认为该像素点为背景部分,不属于组成文本内容的一部分);
其次,若连续的一行或两行以上的像素点中均包含组成文本内容的像素点,则将上述一行或两行以上的像素点中组成文本内容的像素点用一个矩形框框选出来,该矩形框的最左列、最右列、最上行以及最下行均至少包含一个是组成文本内容的像素点。
如图3所示,为本申请实施例提供的根据像素值对每一行文本内容进行框选后的示意图。附图3包含11*8个像素点,附图中R/G/B=225,代表R、G、B值均为225,附图中R/G/B=0,代表R、G、B值均为0,如图3所示,可根据各个像素点的像素值对组成文本内容的像素点进行框选,从而实现对每一行文本内容的框选。
优选地,由于步骤S102的执行,并不需要上述图片具有较多的灰度信息和彩色信息,因此,还可以在步骤S102之前对上述图片进行二值化,从而可以不需要分别保存每个像素点的R、G、B值,只需要保存每个像素点的一个灰度值即可,进而可以减少上述图片所占用的存储空间。
S103,基于各个选定框中起始字符的字符类型以及预设的对应关系信息,分别确定各个选定框的标签类型;
在本申请实施例中,在对每一行文本内容框选之后,需要对选定框中的图片进行文字识别,获取该选定框的起始字符的字符类型,并根据预设的对应关系信息,来确定各个选定框的标签类型,其中,上述对应关系信息指示字符类型与标签类型的对应关系,上述标签类型分为题干类型和非题干类型。
可以预先设定上述字符类型包括数字类型和非数字类型,上述题干类型用以表示该选定框中的文本内容为题干的起始部分,上述非题干类型用以表示该选定框中的文本内容不是题干的起始部分。若选定框的起始字符的字符类型为数字类型,则上述对应关系信息指示该选定框的标签类型为题干类型,若选定框的起始字符的字符类型为非数字类型,则上述对应关系信息指示该选定框的标签类型为非题干类型。比如,若某个选定框的起始字符为“4”,则可得到该选定框的起始字符类型为数字类型,然后依据对应关系信息,获得该选定框的标签类型为题干类型。
然而,仅仅根据起始字符并不能非常准确的识别选定框中的文本内容是否为题干的起始部分,因此,为了更加精确确定选定框的标签类型是否为题干类型,可以识别选定框中的起始的两个字符或两个以上字符的字符类型。可以预先定义字符类型还包括标点类型,只有当起始的两个字符的字符类型为数字类型和标点类型时,才认为该选定框的标签类型为题干类型。比如,若某个选定框的起始的两个字符为“4、”,则认为该选定框的标签类型为题干类型。
如图2所示,智能终端可以根据起始字符的字符类型确定从上到下四个选定框的标签类型分别为:非题干类型、题干类型、非题干类型、非题干类型。
S104,将上述面积最大的选定框确定为当前选定框;
通常情况下,待搜索的题目往往占据较大的面积,因此,在一定程度上,面积最大的选定框为用户想要搜索的题目的概率比较大,因此,在本申请实施例中,选取面积最大的选定框作为当前选定框,以便于后续寻找与该面积最大的选定框属于同一道题的其他内容。
若存在多个面积相同,且均大于其余选定框面积的选定框,则可以选取其中任意一选定框作为当前选定框。
如图2所示,智能终端会将第二行的选定框确定为当前选定框。
S105,判断当前选定框的标签类型是否为题干类型;
在本申请实施例中,需要首先判断当前选定框中的文本内容是否是题干的起始部分,以便于后续可以精确寻找与该当前选定框属于同一道题的其他内容。
如图2所示,智能终端根据步骤S103的结果,可以确定该当前选定框为题干类型。
S106,若当前选定框的标签类型为题干类型,且当前选定框下方邻近位置存在第一选定框集合,则基于当前选定框与上述第一选定框集合中各选定框的文本内容生成目标题目;
在本申请实施例中,上述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成。若当前选定框中的文本内容是题干的起始部分,则需要在当前选定框下方寻找与当前选定框属于同一道题的其他内容,若在当前选定框下方存在标签类型不是题干类型的连续的一个或两个以上的选定框,则该一个或两个以上连续的选定框应与当前选定框属于同一道题。如图2所示,智能终端可以确定第三行与第四行的选定框为第一选定框集合,将当前选定框、第三行的选定框以及第四行的选定框中的文本内容确定为目标题目。
此外,若用户拍照得到的图片如图4所示,由于第五行并没有将完整的题目拍摄出来,因此,智能终端无法识别第五行的选定框为题干类型,反而会将该选定框识别为非题干类型,在这种情况下,智能终端会将第三行、第四行以及第五行的选定框作为第一选定框集合,与当前选定框中的文本内容一起生成目标题目,发送至云端服务器。但是,第五行的选定框中的文本内容并不完整,会导致云端服务器无法识别目标题目,进而造成无法正确返回搜题结果。因此,在这种情况下,可以在步骤S102之前,事先判断上述图片的下边缘是否存在组成文本内容的像素点,若是,则重新截取上述图片以使得上述图片的下边缘为空白部分,不存在组成文本内容的像素点。
在本申请实施例中,还可以在步骤S102之前,事先判断上述图片的上边缘是否存在组成文本内容的像素点,若是,则重新截取上述图片以使得上述图片的上边缘为空白部分。若一张图片的上边缘存在组成文本内容的像素点,则可以断定用户并未把该道题完整的拍下来,因此,该道题必然不是用户想要搜索的题目,因此,可以在步骤S102之前,对图片进行重新截取,以使得图片上边缘为空白部分,不存在组成文本内容的像素点。
进一步地,若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置不存在上述第一选定框集合,则基于当前选定框的文本内容生成目标题目。如图5所示,根据本申请实施例的技术方案,智能终端会将第二行的选定框设置为当前选定框,该当前选定框下方并不存在第一选定框集合,则智能终端直接根据该当前选定框中的文本内容生成目标题目。
S107,将上述目标题目发送至云端服务器,并接收上述云端服务器基于上述目标题目进行搜题后返回的搜题结果;
最后将上述目标题目发送至云端服务器,云端服务器会接收该目标题目,并返回的该目标题目的搜题结果至智能终端。
本申请上述提供的技术方案,可以非常好的实现对题目的框选,然而,有时候智能终端框选出的题目与用户想要搜索的题目并不一样,如图6所示,根据本申请上述所提供的技术方案,智能终端会选择第四行的选定框作为当前选定框,又由于该当前选定框下方不存在第一选定框集合,则智能终端直接根据该当前选定框中的文本内容生成目标题目,然而,显然用户想要搜索的题目并不是第12题,而是第11题,在这种情况下,为避免服务器返回的搜题结果不是用户想要的,可以在将目标题目发送给云端服务器之前,事先将生成的目标题目在智能终端的显示屏上进行显示,以使得用户对该目标题目进行确认,若接收到用户发送的确认信息,则将上述目标题目发送至云端服务器,并接收上述云端服务器基于上述目标题目进行搜题后返回的题目结果,若接收到用户发送的否认信息,则选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行上述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。
在本申请实施例中,智能终端可以通过面积最大的选定框来找寻用户想要搜索的题目,将上述面积最大的选定框设置为当前选定框,并当该当前选定框为题干类型时,自动识别与该当前选定框属于同一道题的其他选定框,避免了用户的手动操作,并且也不需要用户对题目进行任何标记,提高了用户体验以及搜题效率。
实施例二
下面对本申请实施例二提供的另一种搜题方法进行描述,请参阅附图7。本申请实施例中的搜题方法包括步骤S201-S220:
S201,获取包含待搜索题目的图片;
S202,对上述图片进行二值化;
S203,对上述二值化后的图片进行截取,以使得所述图片的上下边缘均为空白部分;
S204,通过选定框对上述截取后的图片中的每一行文本内容进行框选;
S205,基于各个选定框中起始字符的字符类型以及预设的对应关系,分别确定各个选定框的标签类型;
S206,将上述面积最大的选定框确定为当前选定框;
S207,判断当前选定框的标签类型是否为题干类型,若是,则执行S208,若否,则执行S211;
S208,判断当前选定框下方邻近位置是否存在第一选定框集合,若存在,则执行S209,否则,则执行S210;
S209,基于当前选定框与所述第一选定框集合中各选定框的文本内容生成目标题目;
S210,基于当前选定框的文本内容生成目标题目;
在本申请实施例中,上述步骤S201-S210已经在实施例一中进行过描述,具体可参见实施例一的记载,此处不再赘述。
S211,判断是否存在题干选定框,若存在,执行S212,否则,执行S213;
在本申请实施例中,若最大面积的选定框中的文本内容不是题干的起始部分,则需要寻找与该当前选定框属于同一道题的题干以及其余的内容,因此,首先判断是否存在题干选定框,该题干选定框为位于当前选定框上方,距离当前选定框最近且文本内容为题干起始部分的选定框。
S212,判断是否存在第一选定框集合,若存在,执行S214,否则,执行S215;
S214:判断是否存在第二选定框集合,若存在,执行步骤S216,否则执行步骤S217;
S215:判断是否存在第二选定框集合,若存在,执行步骤S218,否则执行S219;
S216:基于上述题干选定框、上述第二选定框集合、当前选定框以及上述第一选定框集合中各选定框的文本内容生成目标题目;
S217:基于上述题干选定框、当前选定框以及上述第一选定框集合中各选定框的文本内容生成目标题目;
S218:基于上述题干选定框、当前选定框以及上述第二选定框集合中各选定框的文本内容生成目标题目;
S219:基于上述题干选定框、当前选定框中各选定框的文本内容生成目标题目;
若存在题干选定框,则进一步判断是否存在第二选定框集合以及第一选定框集合,上述第二选定框集合由位于该题干选定框下方,且位于当前选定框上方的一个或两个以上的选定框构成。
若存在第二选定框集合以及第一选定框集合,则基于上述题干选定框、上述第二选定框集合、当前选定框以及上述第一选定框集合中各选定框的文本内容生成目标题目;若不存在第二选定框集合,存在第一选定框集合,则基于上述题干选定框、当前选定框以及上述第一选定框集合中各选定框的文本内容生成目标题目;若存在第二选定框集合,不存在第一选定框集合,则基于上述题干选定框、当前选定框以及上述第二选定框集合中各选定框的文本内容生成目标题目;若不存在第二选定框集合且不存在第一选定框集合,则基于上述题干选定框、当前选定框中各选定框的文本内容生成目标题目。
如图8所示,根据本申请实施例二的技术方案,智能终端会将第三行的选定框作为当前选定框,然而,该当前选定框的起始字符的字符类型是非数字类型,因此,可确定该当前选定框为非题干类型,在这种情况下,智能终端首先向上寻找题干类型的选定框,也即是会将第一行的选定框作为题干选定框,然后将第二行的选定框作为第二选定框集合,将第四行的选定框作为第一选定框集合,根据上述题干选定框、当前选定框、上述第二选定框集合以及上述第一选定框集合的文本内容生成目标题目。
S213:选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行步骤S207;
若不存在题干选定框,则选取另外的选定框作为当前选定框,优选地,选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行上述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。如图9所示,根据本申请实施例二的技术方案,智能终端会将第一行的选定框作为当前选定框,然而,该当前选定框上方不存在题干选定框,则说明用户并未把当前选定框中的完整题目拍下来,用户不想搜索该当前选定框所对应的题目,则智能终端可选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行上述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。
S220,将上述目标题目发送至云端服务器,并接收上述云端服务器基于上述目标题目进行搜题后返回的搜题结果;
上述步骤S220与实施例一中的步骤S107实施方式相同,具体可参见实施例一的描述,此处不再赘述。
在本申请实施例中,智能终端首先对获取的图片进行二值化,并对上述图片中上下边缘处未拍完整的题目进行截取,通过面积最大的选定框来找寻用户想要搜索的题目,将上述面积最大的选定框设置为当前选定框,自动识别与该当前选定框属于同一道题的其他选定框,避免了用户的手动操作,并且也不需要用户对题目进行任何标记,提高了用户体验以及搜题效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例三
本申请实施例三提供了一种搜题装置,为了便于说明,仅示出与本申请相关的部分,如图10所示,上述搜题装置300包括:
图片获取单元301,用于获取包含待搜索题目的图片;
框选单元302,用于通过选定框对上述图片中的每一行文本内容进行框选;
类型确定单元303,用于基于各个选定框中起始字符的字符类型以及预设的对应关系信息,分别确定各个选定框的标签类型,其中,上述对应关系信息指示字符类型与标签类型的对应关系,上述标签类型分为题干类型和非题干类型;
当前选定框确定单元304,用于将上述图片中面积最大的选定框确定为当前选定框;
题干判断单元305,用于判断当前选定框的标签类型是否为题干类型;
第一目标题目单元306,用于若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与上述第一选定框集合中各选定框的文本内容生成目标题目,其中,上述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成;
通信单元307,用于将上述目标题目发送至云端服务器,并接收上述云端服务器基于上述目标题目进行搜题后返回的搜题结果。
进一步地,上述搜题装置300还可以包括集合判断单元以及第二目标题目单元。
集合判断单元,用于在当前选定框的标签类型为非题干类型,且存在题干选定框时,则判断是否存在第二选定框集合以及第一选定框集合,其中,所述题干选定框为位于当前选定框上方,且距离当前选定框最近的标签类型为题干类型的选定框,所述第二选定框集合由位于所述题干选定框下方,且位于当前选定框上方的一个或两个以上连续的选定框构成;
第二目标题目单元,用于当所述集合判断单元判断出存在所述第二选定框集合以及所述第一选定框集合时,基于所述题干选定框、所述第二选定框集合、当前选定框以及所述第一选定框集合中各选定框的文本内容生成目标题目;当所述集合判断单元判断出不存在所述第二选定框集合且存在所述第一选定框集合时,基于所述题干选定框、当前选定框以及所述第一选定框集合中各选定框的文本内容生成目标题目;当所述集合判断单元判断出存在所述第二选定框集合且不存在所述第一选定框集合时,基于所述题干选定框、当前选定框以及所述第二选定框集合中各选定框的文本内容生成目标题目;当所述集合判断单元判断出不存在所述第二选定框集合且不存在所述第一选定框集合时,基于所述题干选定框、当前选定框中各选定框的文本内容生成目标题目。
进一步地,上述搜题装置300还可以包括第三目标题目单元以及第四目标题目单元。
第三目标题目单元,用于在当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置不存在上述第一选定框集合时,基于当前选定框的文本内容生成目标题目。
第四目标题目单元,用于在当前选定框的标签类型为非题干类型,且不存在题干选定框时,选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行上述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。
优选地,上述通信单元307具体用于:
将上述目标题目显示在屏幕上,以使得用户对上述目标题目进行确认;
若接收到用户发送的确认信息,则将上述目标题目发送至云端服务器,并接收上述云端服务器基于上述目标题目进行搜题后返回的题目结果;
若接收到用户发送的否认信息,则选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行上述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
实施例四
图11是本申请实施例四提供的智能终端的示意图。如图11所示,该实施例的智能终端4包括:处理器40、存储器41以及存储在上述存储器41中并可在上述处理器40上运行的计算机程序42。上述处理器40执行上述计算机程序42时实现上述各个方法实施例中的步骤,例如图1所示的步骤S101至S107。或者,上述处理器40执行上述计算机程序42时实现上述各装置实施例中各单元的功能,例如图10所示单元301至单元307的功能。
上述智能终端4可以是手机终端、平板电脑、台式电脑等计算设备。上述智能终端可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图11仅仅是智能终端4的示例,并不构成对智能终端4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如上述智能终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述存储器41可以是上述智能终端4的内部存储单元,例如智能终端4的硬盘或内存。上述存储器41也可以是上述智能终端4的外部存储设备,例如上述智能终端4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述存储器41还可以既包括上述智能终端4的内部存储单元也包括外部存储设备。上述存储器41用于存储上述计算机程序以及智能终端所需的其它程序和数据。上述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤申请上述。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种搜题方法,其特征在于,包括:
获取包含待搜索题目的图片;
若所述图片下边缘存在组成文本内容的像素点,则截取所述图片使得截取后的所述图片的下边缘为空白部分;
通过选定框对所述图片中的每一行文本内容进行框选;
基于各个选定框中起始字符的字符类型以及预设的对应关系信息,分别确定各个选定框的标签类型,其中,所述对应关系信息指示字符类型与标签类型的对应关系,所述标签类型分为题干类型和非题干类型;
将所述图片中面积最大的选定框确定为当前选定框;
判断当前选定框的标签类型是否为题干类型;
若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与所述第一选定框集合中各选定框的文本内容生成目标题目,其中,所述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成;
将所述目标题目发送至云端服务器,并接收所述云端服务器基于所述目标题目进行搜题后返回的搜题结果。
2.如权利要求1所述的搜题方法,其特征在于,在所述判断当前选定框的标签类型是否为题干类型之后,还包括:
若当前选定框的标签类型为非题干类型,且存在题干选定框,则判断是否存在第二选定框集合以及第一选定框集合,所述题干选定框为位于当前选定框上方,且距离当前选定框最近的标签类型为题干类型的选定框,所述第二选定框集合由位于所述题干选定框下方,且位于当前选定框上方的一个或两个以上连续的选定框构成;
若存在所述第二选定框集合以及所述第一选定框集合,则基于所述题干选定框、所述第二选定框集合、当前选定框以及所述第一选定框集合中各选定框的文本内容生成目标题目;
若不存在所述第二选定框集合且存在所述第一选定框集合,则基于所述题干选定框、当前选定框以及所述第一选定框集合中各选定框的文本内容生成目标题目;
若存在所述第二选定框集合且不存在所述第一选定框集合,则基于所述题干选定框、当前选定框以及所述第二选定框集合中各选定框的文本内容生成目标题目;
若不存在所述第二选定框集合且不存在所述第一选定框集合,则基于所述题干选定框、当前选定框中各选定框的文本内容生成目标题目。
3.如权利要求1所述的搜题方法,其特征在于,在所述判断当前选定框的标签类型是否为题干类型之后,还包括:
若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置不存在所述第一选定框集合,则基于当前选定框的文本内容生成目标题目。
4.如权利要求2所述的搜题方法,其特征在于,在所述判断当前选定框的标签类型是否为题干类型之后,还包括:
若当前选定框的标签类型为非题干类型,且不存在题干选定框,则选取除当前选定框之外的面积最大的选定框作为当前选定框,并返回执行所述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。
5.如权利要求1至4中任一项所述的搜题方法,其特征在于,所述将所述目标题目发送至云端服务器,并接收所述云端服务器基于所述目标题目进行搜题后返回的搜题结果,包括:
将所述目标题目显示在屏幕上,以使得用户对所述目标题目进行确认;
若接收到用户发送的确认信息,则将所述目标题目发送至云端服务器,并接收所述云端服务器基于所述目标题目进行搜题后返回的题目结果;
若接收到用户发送的否认信息,则选取除当前选定框之外的面积最大的选定框作为当前选定框,返回执行所述判断当前选定框的标签类型是否为题干类型的步骤以及后续步骤。
6.一种搜题装置,其特征在于,包括:
图片获取单元,用于获取包含待搜索题目的图片;
截取单元,用于若所述图片下边缘存在组成文本内容的像素点,则截取所述图片使得截取后的所述图片的下边缘为空白部分;
框选单元,用于通过选定框对所述图片中的每一行文本内容进行框选;
类型确定单元,用于基于各个选定框中起始字符的字符类型以及预设的对应关系信息,分别确定各个选定框的标签类型,其中,所述对应关系信息指示字符类型与标签类型的对应关系,所述标签类型分为题干类型和非题干类型;
当前选定框确定单元,用于将所述图片中面积最大的选定框确定为当前选定框;
题干判断单元,用于判断当前选定框的标签类型是否为题干类型;
第一目标题目单元,用于若当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置存在第一选定框集合,则基于当前选定框与所述第一选定框集合中各选定框的文本内容生成目标题目,其中,所述第一选定框集合由标签类型为非题干类型的一个或两个以上连续的选定框构成;
通信单元,用于将所述目标题目发送至云端服务器,并接收所述云端服务器基于所述目标题目进行搜题后返回的搜题结果。
7.如权利要求6所述的搜题装置,其特征在于,还包括:
集合判断单元,用于在当前选定框的标签类型为非题干类型,且存在题干选定框时,则判断是否存在第二选定框集合以及第一选定框集合,其中,所述题干选定框为位于当前选定框上方,且距离当前选定框最近的标签类型为题干类型的选定框,所述第二选定框集合由位于所述题干选定框下方,且位于当前选定框上方的一个或两个以上连续的选定框构成;
第二目标题目单元,用于当所述集合判断单元判断出存在所述第二选定框集合以及所述第一选定框集合时,基于所述题干选定框、所述第二选定框集合、当前选定框以及所述第一选定框集合中各选定框的文本内容生成目标题目;当所述集合判断单元判断出不存在所述第二选定框集合且存在所述第一选定框集合时,基于所述题干选定框、当前选定框以及所述第一选定框集合中各选定框的文本内容生成目标题目;当所述集合判断单元判断出存在所述第二选定框集合且不存在所述第一选定框集合时,基于所述题干选定框、当前选定框以及所述第二选定框集合中各选定框的文本内容生成目标题目;当所述集合判断单元判断出不存在所述第二选定框集合且不存在所述第一选定框集合时,基于所述题干选定框、当前选定框中各选定框的文本内容生成目标题目。
8.如权利要求6所述的搜题装置,其特征在于,还包括:
第三目标题目单元,用于在当前选定框的标签类型为题干类型,且当前选定框的下方邻近位置不存在所述第一选定框集合时,基于当前选定框的文本内容生成目标题目。
9.一种智能终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810128798.6A CN108304562B (zh) | 2018-02-08 | 2018-02-08 | 一种搜题方法、搜题装置及智能终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810128798.6A CN108304562B (zh) | 2018-02-08 | 2018-02-08 | 一种搜题方法、搜题装置及智能终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108304562A CN108304562A (zh) | 2018-07-20 |
CN108304562B true CN108304562B (zh) | 2020-09-25 |
Family
ID=62865053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810128798.6A Active CN108304562B (zh) | 2018-02-08 | 2018-02-08 | 一种搜题方法、搜题装置及智能终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108304562B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723231B (zh) * | 2019-03-20 | 2023-10-17 | 北京百舸飞驰科技有限公司 | 一种题目预测方法和装置 |
CN110263792B (zh) * | 2019-06-12 | 2021-10-22 | 广东小天才科技有限公司 | 图像识读及数据处理方法、智能笔、系统及存储介质 |
CN111553365B (zh) * | 2020-04-30 | 2023-11-24 | 广东小天才科技有限公司 | 一种题目选取的方法、装置、电子设备及存储介质 |
CN112270295A (zh) * | 2020-11-13 | 2021-01-26 | 广东小天才科技有限公司 | 学生作业场景下的框题方法及装置、终端设备及存储介质 |
CN113836905B (zh) * | 2021-09-24 | 2023-08-08 | 网易(杭州)网络有限公司 | 一种主题提取方法、装置、终端及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105487754A (zh) * | 2015-11-27 | 2016-04-13 | 北京华云天一科技有限公司 | 基于云端的试卷生成方法和装置 |
CN106599275A (zh) * | 2016-12-23 | 2017-04-26 | 广东小天才科技有限公司 | 拍照搜索的方法及装置 |
CN107609546A (zh) * | 2017-08-29 | 2018-01-19 | 北京奇艺世纪科技有限公司 | 一种文字标题识别方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9208173B1 (en) * | 2014-06-13 | 2015-12-08 | Globalfoundries Inc. | Techniques for medical image retreival |
CN105426518A (zh) * | 2015-12-03 | 2016-03-23 | 广东小天才科技有限公司 | 一种拍照搜题的方法及系统 |
CN106250518A (zh) * | 2016-08-03 | 2016-12-21 | 广东小天才科技有限公司 | 智能搜题方法及装置 |
CN106372126A (zh) * | 2016-08-24 | 2017-02-01 | 广东小天才科技有限公司 | 一种拍照搜题的方法及装置 |
CN107578659A (zh) * | 2017-09-27 | 2018-01-12 | 广东小天才科技有限公司 | 电子题目的生成方法、生成装置及终端 |
-
2018
- 2018-02-08 CN CN201810128798.6A patent/CN108304562B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105487754A (zh) * | 2015-11-27 | 2016-04-13 | 北京华云天一科技有限公司 | 基于云端的试卷生成方法和装置 |
CN106599275A (zh) * | 2016-12-23 | 2017-04-26 | 广东小天才科技有限公司 | 拍照搜索的方法及装置 |
CN107609546A (zh) * | 2017-08-29 | 2018-01-19 | 北京奇艺世纪科技有限公司 | 一种文字标题识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
Deep Multimodal Reinforcement Network with Contextually Guided Recurrent Attention for Image Question Answering;Jiang, Ai-Wen等;《OURNAL OF COMPUTER SCIENCE AND TECHNOLOGY》;20170731;第32卷(第4期);第738-748页 * |
计算机考试系统题库导入引擎的设计与实现;毕少敏;《景德镇学院学报》;20170630;第32卷(第3期);第41-44页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108304562A (zh) | 2018-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304562B (zh) | 一种搜题方法、搜题装置及智能终端 | |
CN110008944A (zh) | 基于模板匹配的ocr识别方法及装置、存储介质 | |
JP2016201126A (ja) | 画像からのラベルの検出 | |
CN112749696B (zh) | 一种文本检测方法及装置 | |
CN104573675A (zh) | 作业图像的展示方法和装置 | |
CN113391779B (zh) | 类纸屏幕的参数调节方法、装置及设备 | |
CN105094975A (zh) | 一种调用应用程序的方法及装置 | |
CN114792283A (zh) | 一种图像处理方法、装置、设备及计算机可读存储介质 | |
CN115526160A (zh) | 富文本处理方法、装置、设备及存储介质 | |
CN108021654A (zh) | 一种相册图像处理方法及装置 | |
CN107122785B (zh) | 文本识别模型建立方法和装置 | |
CN106407383A (zh) | 一种图片排列方法及装置 | |
CN111049735B (zh) | 群组头像显示方法、装置、设备及存储介质 | |
CN107798070A (zh) | 一种网页数据获取方法及终端设备 | |
CN113159029A (zh) | 一种图片中局部信息精准抓取的方法和系统 | |
CN108804652B (zh) | 封面图片的生成方法、装置、存储介质和电子装置 | |
EP3564833A1 (en) | Method and device for identifying main picture in web page | |
CN105791503A (zh) | 一种将名片信息存储到通讯录的方法及装置 | |
CN107451277A (zh) | 图像文件处理方法及装置 | |
CN108270973B (zh) | 一种拍照处理方法、移动终端及计算机可读存储介质 | |
CN110414497A (zh) | 对象电子化的方法、装置、服务器及存储介质 | |
CN114429464A (zh) | 终端的碎屏识别方法和相关设备 | |
CN110390323B (zh) | 信息处理装置以及计算机可读介质 | |
CN108021648B (zh) | 一种搜题的方法、装置及智能终端 | |
CN108491175B (zh) | 内容自动排布方法、装置、电子装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |