CN104657407A - 检索装置以及方法 - Google Patents

检索装置以及方法 Download PDF

Info

Publication number
CN104657407A
CN104657407A CN201410664506.2A CN201410664506A CN104657407A CN 104657407 A CN104657407 A CN 104657407A CN 201410664506 A CN201410664506 A CN 201410664506A CN 104657407 A CN104657407 A CN 104657407A
Authority
CN
China
Prior art keywords
ingredient
hand
written
fragment
object content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410664506.2A
Other languages
English (en)
Inventor
柴田智行
山地雄土
三原功雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN104657407A publication Critical patent/CN104657407A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

根据一个实施例,提供一种检索装置以及方法。检索装置包括获取控制器、检索控制器以及显示控制器。获取控制器获取指示目标内容片段的组成部分的位置的手写数据。检索装置基于手写数据从其中存储一个以上的内容片段的存储器中检索目标内容片段。显示控制器在显示器上显示搜索结果。

Description

检索装置以及方法
相关申请的交叉引用
本申请基于2013年11月20日提交的日本第2013-240279号专利申请并要求其优先权的利益,其全部内容通过引用被结合于此。
技术领域
在此描述的实施例大体上涉及检索装置以及检索方法。
背景技术
通常,已知一种用于基于由用户输入的手写查询来检索文档的技术。
然而,在如上所述的现有技术中,无非是通过进行字符识别来以字符代替已经被输入的手写数据,并检索具有与代替手写数据的字符相同的或者类似的字符的多个内容片段。
由于这个原因,在这样的现有技术中,不可以通过指定目标内容片段的组成部分的位置来检索目标内容片段。
发明内容
在此描述的实施例的目标是提供能够通过指定组成部分的位置来检索目标内容片段的检索装置和检索方法。
根据实施例,一种检索装置包括获取控制器、检索控制器以及显示控制器。获取控制器获取指示目标内容片段的组成部分的位置的手写数据。检索控制器基于手写数据从其中存储一个以上的内容片段的存储器中检索目标内容片段。显示控制器在显示器上显示搜索结果。
根据以上描述的检索装置,目标内容片段可以通过指定组成部分的位置被检索。
附图说明
图1是图解根据实施例的检索装置的实例的配置的图;
图2是图解根据实施例的目标内容片段的实例的图;
图3是图解根据实施例的手写数据的实例的图;
图4是图解根据实施例的搜索结果的实例的图;
图5是图解根据实施例的目标内容片段的实例的图;
图6是图解根据实施例的手写数据的实例的图;
图7是图解根据实施例的手写数据的实例的图;
图8是图解根据实施例的手写数据的实例的图;
图9是图解根据实施例的手写数据的实例的图;
图10是图解根据实施例的手写数据的实例的图;
图11是用于说明在根据实施例的检索装置中进行的检索操作期间的典型的操作顺序的流程图;
图12是图解根据变形例的目标内容片段的实例的图;
图13是图解根据变形例的手写数据的实例的图;以及
图14是图解根据实施例和变形例的检索装置的典型的硬件配置的图。
具体实施方式
下面参考附图详细描述实施例。
图1是图解根据实施例的检索装置10的实例的配置图。如图1所示,检索装置10包括存储单元11、分配单元13、输入单元15、获取单元17、生成单元19、检索单元21、显示控制单元23以及显示单元25。
存储单元11可以利用诸如硬盘驱动器(HDD)、固态驱动器(SSD)、存储卡、光盘、只读存储器(ROM)或者随机存取存储器(RAM)的存储装置来实现,其中,信息可以以磁、光或者电的方式被存储在存储装置中。分配单元13、获取单元17、生成单元19、检索单元21以及显示控制单元23可以通过在诸如中央处理单元(CPU)的处理装置中执行计算机程序来实现,也就是说,可以利用软件来实施;或者可以利用诸如集成电路(IC)的硬件来实现;或者可以利用软件和硬件的组合来实现。输入装置15可以利用能够实现手写输入的诸如触敏面板、触摸板、鼠标或者电子笔的输入装置来实现。显示单元25可以利用诸如触敏面板显示器或者液晶显示器的显示装置来实现。
存储单元11被用于存储一个以上的内容片段。在实施例中,假设内容片段是以下内容中的一个:利用文档准备软件、电子表格软件、演示软件或者文档浏览软件创建的文档,诸如网页的数字文档,以及由用户通过输入手写数据而准备的手写文档。然而,这些不是仅有的可能的情况。另外,内容片段可以由静态图像或者动态图像组成。
分配单元13分析存储在存储单元11中的每一个内容片段,生成指示该内容片段的多个组成部分中的每一个组成部分的位置、这些组成部分之间的相对位置关系以及每一个组成部分的类型的结构信息,以及将结构信息分配给该内容片段。
在此,内容片段的组成部分代表可由用户识别的区域。组成部分的位置可以是,例如,页面上的坐标信息的形式。两个组成部分之间的相对位置关系可从这两个组成部分的位置(坐标信息)来识别。
组成部分的类型可以是,例如,“字符”、“图形形式”、“表格”、“图像”以及“图片”中的至少一个。如果组成部分是“字符”类型的,那么该类型可以进一步被细分为段落、行、单词、单个字符以及部首。此外,如果组成部分是“图形形式”的,那么该类型可以被进一步细分为直线、三角形、四边形以及圆形。进一步,如果组成部分是“图像”类型的,那么该类型可被进一步细分为在图像中采集的对象和边缘。为了识别在图像中采集的对象,可以实施在Jim Mutch and David G.Lowe.Multiclass ObjectRecognition with Sparse,Localized Features.IEEE Conference on Computer Visionand Pattern Recognition(CVPR),pp.11-18,New York,June 2006上公开的对象识别技术。图像的边缘代表以可识别的方式经历亮度值或者颜色的变化的线。同时,例如,也可以具有“颜色”,例如红色、蓝色以及绿色作为组成部分的类型。此外,例如,也可以具有“密度”,例如浓和稀,作为组成部分的类型。
当内容片段代表数字文档,那么文档信息包含组成部分的位置、组成部分之间的相对位置关系以及能够识别组成部分的类型的信息。因此,分配单元13可以通过分析该内容片段来生成结构信息。
在内容片段代表手写文档的情况下,可以对组成手写数据的每个笔划所属于的类以及该笔划的位置进行分析,并且识别组成部分的位置、组成部分之间的相对位置关系以及组成部分的类型。在此,类可以是,例如,“字符”、“图形形式”、“表格”、“图像”以及“图片”中的至少一个。因此,同样在内容片段代表手写数据的情况下,分配单元13可以通过分析该内容片段来生成结构信息。
同时,为了判定笔划所属于的类,可以实现以下技术:一种技术,其中,笔划的集合在空间或者时间凝聚力方面经历结构化,并且在作为结构化结果获得的每一个结构单元,归于该结构单元的笔划所属于的类被判定;或者一种技术,其中,对于每一个笔划,出现在该笔划周围的一个以上的相邻的笔划被提取,与有关笔划和被提取的一个以上的相邻的笔划的组合的特征量有关的组合特征量被计算,并且根据组合特征量,有关笔划所属于的类被判定。
组合特征量包括第一类型特征量,第一类型特征量指示有关笔划与一个以上相邻的笔划中的至少一个笔划之间的关系。此外,组合特征量包括第二类型特征量,利用与有关笔划的形状有关的特征量和与一个以上的相邻的笔划中的每一个笔划的形状有关的特征量的总值,来获得第二类型特征量。
第一类型特征量是以下两个内容中的至少一个:有关笔划与一个以上的相邻的笔划中的至少一个笔划之间的形状相似度;以及能够识别有关笔划与一个以上的相邻的笔划中的至少一个笔划之间的位置关系的特定值。
在此,有关笔划与一个以上相邻的笔划中的至少一个笔划之间的形状相似度指示,例如,在长度、曲率和、主要组件方向、外接矩形面积、外接矩形长度、外接矩形长宽比、起点/终点距离、方向密度直方图以及折点数中的至少一个以上的相似度。因此,例如,形状相似度可以被认为是有关笔划的笔划特征量与一个以上相邻的笔划中的至少一个笔划的笔划特征量之间的相似度。
特定值是,例如,目标笔划与一个以上相邻的笔划中的至少一个笔划的外接矩形的重叠百分比、这两个笔划之间的重力点距离、这两个笔划之间的重力点距离的方向、这两个笔划之间的端点距离、这两个笔划之间的端点距离的方向以及这两个笔划之间的交叉点数中的至少一个。
第二类型特征量是,例如,以下内容中的至少一个:相对于组合的外接矩形长度的有关笔划的长度与相对于组合的外接矩形长度的一个以上相邻的笔划中的每一个笔划的长度的和比;有关笔划与一个以上相邻的笔划中的至少一个笔划的方向密度直方图的总值;以及相对于组合的外接矩形面积的有关笔划的外接矩形面积与一个以上相邻的笔划中的每一个笔划的外接矩形面积的和的比。
输入单元15接收指定目标内容片段的组成部分的位置的手写数据的输入。更具体地,除了指定目标内容片段的多个组成部分中的每一个组成部分的位置,手写数据同样指定组成部分之间的相对位置关系。此外,手写数据可以进一步指定多个组成部分中的每一个组成部分的类型。同时,手写数据由多个笔划组成。
在实施例中,假设目标内容片段的多个组成部分出现在相同页面上并且多个组成部分中的每一个组成部分的位置是在该相同页面上的位置。然而,这不是仅有的可能的情况。
在实施例中,假设输入单元15为触敏面板,并且用户通过使用记录笔或者手指在触敏面板上用手写入图形形式、图片以及字符中的至少一个来输入手写数据。然而,这不是仅有的可能的情况。另外,例如,输入单元15可以使用触摸板、鼠标或者电子笔来实现。
笔划指向由用户通过手写的图形形式、图片或者字符的笔划,并且代表从记录笔或者手指与触敏面板的输入屏进行接触时开始直到其从输入屏抬起的轨迹数据(即,从落笔动作到抬笔动作的轨迹)。例如,笔划可以表示为记录笔或者手指和输入屏之间的接触点的时间序列坐标值。
获取单元17获取从输入单元15输入的手写数据。
生成单元19通过格式化由获取单元17获取的手写数据,来生成搜索查询。更具体地,生成单元19通过对于由获取单元17获取的手写数据进行符号识别、图形识别、表格识别以及图像识别,来生成搜索查询。
检索单元21基于由获取单元17获取的手写数据,从存储单元11中检索目标内容片段。在实施例中,检索单元21参照存储在存储单元11中的一个以上的内容片段中的每一个内容片段的结构信息,并检索目标内容片段。
更具体地,检索单元21将由生成单元19生成的搜索查询与存储在存储单元11中的一个以上的内容片段中的每一个内容片段的结构信息进行比较,并检索目标内容片段。例如,检索单元21在存储在存储单元11中的一个以上中内容片段中,检索其结构信息与搜索查询的相似度超过阈值的这种内容片段,作为目标内容片段。在此,结构信息相似度可以被设置为,例如,一致的组成部分之间的范围的一致率。
同时,存储在存储单元11中的一个以上的内容片段中的每一个内容片段被配置成能够导出多个相应的组成部分中的每一个组成部分的位置、那些组成部分之间的相对位置关系、以及每个组成部分的类型。因此,检索单元21分析存储在存储单元11中的每个内容片段,导出该内容片段的多个组成部分中的每一个组成部分的位置、那些组成部分之间的相对位置关系、以及这些组成部分中的每一个组成部分的类型,将由生成单元19生成的搜索查询与导出的信息进行比较,以及检索目标内容片段。以这种方式,即使分配单元13没有将结构信息分配到内容片段,也可以检索目标内容片段。
显示控制单元23在显示器25上显示检索单元21的搜索结果。
以下参考图2到图4说明的是根据实施例进行的典型的搜索。图2是图解根据实施例的目标内容片段31的图。图3是图解根据实施例的手写数据的实例的图。图4是图解根据实施例的搜索结果的实例的图。
如图2所示,假设在目标内容片段31中,用于图像(照片)的区域32被提供在右下角部分。在这种情况下,如图3所示,检索装置10的输入装置15接收指定区域33的手写数据的输入,区域33是“图像”类型的,并且位于页面右下角部分。然后,生成单元19通过格式化已被输入的手写数据,生成搜索查询。随后,检索单元21将生成的搜索查询与存储在存储单元11中的一个以上的内容片段中的每一个内容片段的结构信息进行比较,并检索其结构信息与搜索查询的相似度超过阈值的这种内容片段。也就是说,检索单元21检索用于图像的区域位于页面的右下角部分的这种内容片段。因此,如图4所示,通过检索单元21获取的搜索结果包括目标内容片段31、内容片段36以及内容片段38。因此,可以检索目标内容片段31。
以下参考图5到10说明根据实施例的手写数据(搜索查询)的具体的实例。图5是图解根据实施例的目标内容片段41的实例的图。图6到10是图解根据实施例的手写数据的实例的图。
如图5所示,在目标内容片段41的上部的左侧,提供用于字符的区域42。在目标内容片段41的上部的右侧,提供用于图像(照片)的区域43。在目标内容片段41的中间部分提供用于图形形式的区域。在目标内容片段41的下部提供用于表格的区域45。
在这种情况下,作为用于搜索目标内容片段41的目的的手写数据,可以想到,例如,图6到10所示的手写数据片段。
在图6所示的手写数据中,手写字符被写在目标内容片段的多个组成部分中的每一个组成部分的位置。因此,利用手写字符,以下内容被指定:目标内容片段的多个组成部分中的每一个组成部分的位置,组成部分之间的相对位置关系以及每个组成部分的类型。
更具体地,在图6所示的手写数据中,词“字符”51被手写在页面50的左上角部分。因此,指定字符区域在左上角部分。进一步,词“照片”52被手写在页面50的右上角部分。因此,指定照片区域在右上角部分。此外,词“图形”53被手写在页面50的中间部分。因此,指定图形区域在中间部分。此外,词“表格”54被手写在页面50的下部。因此,指定表格区域在下部。
因此,使用如图6所示的手写数据,可以容易地指定目标内容片段的多个组成部分中的每一个组成部分的位置、组成部分之间的相对位置关系以及每个组成部分的类型。因此,易于进行输入操作。此外,同样可以处理用户只具有目标内容片段41的配置的模糊记忆的情况。然而,在如图6所示的手写数据中,由于组成部分的类型是利用手写字符来识别的,所以生成单元19需要在生成搜索查询时对于手写字符进行字符识别。同时,在如图6所示的实例中,字符被手写在目标内容片段的多个组成部分中的每一个组成部分的位置。然而,另外,也可以利用指示组成部分的类型的图标或者印章。
在图7所示的手写数据中,为了指定目标内容片段的多个组成部分中的每一个组成部分的位置、组成部分之间的相对位置关系以及每个组成部分的类型,手写标记(图形形式)被写在目标内容片段的多个组成部分中的每一个组成部分的位置。
更具体地,在图7所示的手写数据中,被手写在页面60的左上角部分的水平线61代表概念化字符的标记。因此,指定字符区域在左上角部分。进一步,被手写在页面60的右上角部分的矩形62代表概念化照片(图像)的标记。因此,指定照片区域在右上角部分。此外,被手写在页面60的中间部分的椭圆63代表概念化图形形式的标记。因此,指定图形区域在中间部分。此外,被手写在页面60的下部的四矩形设计64代表概念化表格的标记。因此,指定表格区域在下部。同时,在水平线61中的水平线的数目可以或者可以不与在字符区域的行数匹配。
因此,同样使用图7所示的手写数据,可以容易地指定目标内容片段的多个组成部分中的每一个组成部分的位置、组成部分之间的相对位置关系以及每个组成部分的类型。因此,易于进行输入操作。此外,同样可以处理用户只具有目标内容片段41的配置的模糊记忆的情况。同时,在图7所示的实例中,水平线被用作为概念化字符的标记,矩形被用作为概念化照片(图像)的标记,椭圆被用作为概念化图形形式的标记,以及表格设计被用作为概念化表格的标记。然而,另外,同样可以通过额外的学习来增加或者改变概念化标记。
在图8所示的手写数据中,为了指定目标内容片段的多个组成部分中的每一个组成部分的位置、组成部分之间的相对位置关系以及每个组成部分的类型,手写圆形或者手写多边形被绘制在目标内容片段的每个组成部分的位置,或者手写字符被写在手写圆形或者手写多边形的内部。
更具体地,在图8所示的手写数据中,在其中写有“字符”的多边形71被手绘在页面70的左上角部分。因此,指定字符区域在左上角部分。此外,在其中写有“照片”的多边形72被手绘在页面70的右上角部分。因此,指定照片区域在右上角部分。进一步,在其中写有“图形”的多边形73被手绘在页面70的中间部分。因此,指定图形区域在中间部分。此外,在其中写有“表格”的多边形74被手绘在页面70的下部。因此,指定表格区域在下部。
因此,使用图8所示的手写数据,可以具体地指定目标内容片段的多个组成部分中的每一个组成部分的位置,组成部分之间的相对位置关系,并且每个组成部分的类型可以被具体化指定。因此,易于进行检索操作。然而,在图8所示的手写数据中,由于组成部分的类型利用手写字符来识别,因而生成单元19需要在生成搜索查询时,对于手写字符进行字符识别。
在图9所示的手写数据中,为了指定目标内容片段的多个组成部分中的每一个组成部分的位置、组成部分之间的相对位置关系以及每个组成部分的类型,手写笔划在目标内容片段的每个组成部分的位置被填充有颜色。
更具体地,在图9所示的手写数据中,页面80的左上角部分被填入具有代表字符的颜色的笔划81。因此指定字符区域在左上角部分。此外,页面80的右上角部分被填入具有代表照片(图像)的颜色的笔划82。因此,指定照片区域在右上角部分。此外,页面80的中间部分被填入具有代表图形形式的颜色的笔划83。因此,指定图形区域在中间部分。此外,页面80的下部被填入具有代表表格的颜色的笔划84。因此,指定表格区域在下部。
在图9所示的手写数据中,可以容易地指定目标内容片段的多个组成部分中的每一个组成部分的位置、组成部分之间的相对位置关系以及每个组成部分的类型。因此,易于进行输入操作。此外,同样可以处理用户只具有目标内容片段41的配置的模糊记忆的情况。同时,可以增加笔划的粗细,以简化填充颜色的任务。此外,颜色填充的密度可以或者可以不与目标内容片段41匹配。
在图10所示的手写数据中,为了指定目标内容片段的多个组成部分中的每一个组成部分的位置以及组成部分之间的相对位置关系,手写圆形或者手写多边形被写在目标内容片段的多个组成部分中的每一个组成部分的位置。除此之外,为了指定目标字符和目标图形形式中的至少一个,手写字符和手写图形形式中的至少一个被写在手写圆形或者手写多边形中。
在这种情况下,检索单元21在存储在存储单元11中的一个以上的内容片段中,检索其结构信息与搜索查询的相似度超过阈值的这种内容片段,作为目标内容片段,并且在这样的内容片段中,手写字符和手写图形形式中的至少一个出现在由在其中写入手写字符和手写图形形式中的至少一个的手写圆形或者手写多边形指定的位置。
更具体地,在图10所示的手写数据中,多边形91被手写在页面90的左上角部分。因此,指定区域在左上角部分。进一步,多边形92被手写在页面90的右上角部分。因此,指定区域在右上角部分。此外,多边形93被手写在页面90的中间部分。因此,指定区域在中间部分。此外,多边形94被手写在页面90的下部。因此,指定区域在下部。
除此之外,“系统”被手写在多边形91中。因此,指定关键词“系统”在左上角部分的区域。类似地,圆柱体被手绘在多边形93中。因此,指定圆柱体在中间部分的区域。此外,“内部”被手写在多边形94中。因此,指定关键词“内部”在下部的区域。
因此,在图10所示的手写数据中,除了指定目标内容片段的多个组成部分中的每一个组成部分的位置和组成部分之间的相对位置关系,也结合进行传统的关键词搜索。由于这个原因,与传统的关键词搜索相比,可以缩小搜索结果的范围。然而,在图10所示的手写数据中,由于组成部分的类型利用手写字符来识别,因而生成单元19需要在生成搜索查询时于手写字符进行字符识别。
同时,在图6到10所示的实例中,由于手写数据可以以交互式的方式输入,因而参考图6到10所说明的详细信息不需要立刻输入。相反地,输入可以在检查搜索结果的同时以分阶段的方式进行。
图11是用于说明在根据实施例的检索装置10中进行的检索操作期间的典型的操作顺序的流程图。
首先,分配单元13分析存储在存储单元11中的每个内容片段,生成指示该内容片段的多个组成部分中的每一个组成部分的位置、这些组成部分之间的相对位置关系、和每一个组成部分的类型的结构信息,以及将结构信息分配到该内容片段(步骤S101)。
然后,获取单元17获取从输入单元15输入的手写数据(步骤S103),以及显示控制单元23在显示单元25上显示获取的手写数据。
随后,生成单元19格式化由获取单元17获取的手写数据,并生成搜索查询(步骤S105)。
然后,检索单元21将通过生成单元19生成的搜索查询与存储在存储单元11中的一个以上内容片段中的每一个内容片段的结构信息进行比较,并检索目标内容片段(步骤S107)。
之后,显示控制单元23在显示单元25上显示检索单元21的搜索结果(步骤S109)。
在此,没有必要连续地进行从步骤S101到步骤S109的操作。另外,步骤S101的操作可以预先进行一次。此外,手写显示的显示和搜索结果的显示可以同时进行。此外,获取单元17完成获取手写数据的时间,即,抬笔动作进行的时间可被用作用于开始步骤S105之后的操作的触发。
以这种方式,根据实施例,通过指定目标内容片段的组成部分的位置,可以检索目标内容片段。特别地,在实施例中,只需要指定目标内容片段的组成部分的位置。由于该原因,即使在用户只具有目标内容片段的配置的模糊记忆的情况下,也可以检索目标内容片段。
第一变形例
在如上所述的实施例中,也可以将电子健康记录视为目标内容片段。
图12是图解根据第一变形例的目标内容片段100的实例的图。图13是图解根据第一变形例的手写数据的实例的图。
如图12所示,在目标内容片段100的左上角部分提供用于图式的区域101。此外,在图式的中间部分,提供用于指示患部的图片区域,且提供用于书写关于患部的评述的区域102。在此,图式是人体图的模板,且具有患部的位置和其中写入的关于患部的评述。
在这种情况下,作为将被用于搜索目标内容片段100的手写数据,可以想到,例如,图13所示的手写数据。
在图13所示的手写数据中,目标内容片段的组成部分的位置和类型通过绘制在目标内容的组成部分的位置的手写图片(草图)被指定。
更具体地,在图13所示的手写数据中,图式的草图111被手绘在页面110的左上角部分。因此,指定图式区域在左上角部分。
在第一变形例的情况下,分配单元13生成进一步包含图式信息的结构信息,然后将结构信息分配到内容片段。在此,图式信息包含图式区域的位置和图式模板的类型。
检索单元21可以被配置成进一步检索与手写数据的草图的形状匹配的图式。在这种情况下,只要涉及到用于画线的匹配方法,就可以使用被称为倒角匹配的技术,在倒角匹配的技术中,生成图像,其中,像素越靠近来自画线的线,该像素的像素值越大,并且根据生成的图像之间的欧几里德距离获得画线之间的距离。然后,利用获取的距离,检索单元21可以检索最接近已被绘制的画线的图式的模板。
第二变形例
在如上所述的实施例中,所有组成部分被包括在检索装置10中的实例被给予说明。然而,那不是仅有的可能的情况。另外,例如,组成部分中的一些组成部分可以存在于检索装置10的外部。例如,组成部分中的一些组成部分可以存在于云端。
硬件配置
图14是图解根据如上所述的实施例和变形例的检索装置10的典型的硬件配置的图。根据如上所述的实施例和变形例的检索装置10具有通常的计算机的硬件配置,包括诸如中央处理单元(CPU)的控制装置901、诸如只读存储器(ROM)或者随机存取存储器(RAM)的存储装置902、诸如硬盘驱动器(HDD)的外部存储装置903、诸如显示器的显示装置904、诸如键盘或者鼠标的输入装置905、以及诸如通信接口的通信装置906。
同时,在根据如上所述的实施例和变形例的检索装置10中执行的计算机程序以安装型或者可执行文件的形式被记录在诸如只读光盘(CD-ROM)、可读光盘(CD-R)、存储卡、数字通用磁盘(DVD)或者软磁盘(FD)的计算机可读记录介质中。
另外,在根据如上所述的实施例和变形例的检索装置10中执行的计算机程序可以在被连接到因特网的计算机上保存为可下载的文件或者可以通过诸如因特网的网络进行分配可用。另外,在根据如上所述的实施例和变形例的检索装置10中执行的计算机程序可以预先被存储在ROM等等中。
在根据如上所述的实施例和变形例的检索装置10中执行的计算机程序包含用于在计算机中实现每一个上述组成元件的模块。实际上,例如,CPU从HDD中加载计算机程序并运行计算机程序,以使得计算机程序被装载在RAM中。因此,用于每个组成元件的模块在计算机中生成。
例如,除非有相反的性质,根据如上所述的实施例的流程图的步骤可以具有不同的执行顺序,可以同时执行多个步骤,或者可以每次以不同的顺序执行。
以这种方式,根据如上所述的实施例和变形例,目标内容片段可以通过指定组成部分的位置被检索。
虽然某些实施例已被描述,但是这些实施例只是通过实例的方式被呈现,并不意欲限制本发明的范围。实际上,在此描述的新颖的实施例可以以各种其他形式被体现;此外,在不背离本发明的精神的情况下,可以对在此描述的实施例的形式进行各种省略、替换以及改变。所附权利要求及其等同物旨在覆盖为将落入本发明的范围和精神内的这些形式或修改。

Claims (16)

1.一种检索装置,其特征在于,包括:
获取控制器,所述获取控制器被配置成获取指示目标内容片段的组成部分的位置的手写数据;
检索控制器,所述检索控制器被配置成基于所述手写数据,从其中存储一个以上的内容片段的存储器中检索所述目标内容片段;以及
显示控制器,所述显示控制器被配置成在显示器上显示搜索结果。
2.如权利要求1所述的装置,其特征在于,
除了指定所述目标内容片段的多个组成部分中的每一个组成部分的位置之外,所述手写数据进一步指定所述多个组成部分之间的相对位置关系。
3.如权利要求2所述的装置,其特征在于,
所述手写数据进一步指定所述多个组成部分中的每一个组成部分的类型。
4.如权利要求3所述的装置,其特征在于,
所述一个以上的内容片段中的每一个内容片段被配置成能够导出所述一个以上的内容片段中的相应的一个内容片段的所述多个组成部分中的每一个组成部分的位置、所述多个组成部分之间的相对位置关系、以及所述多个组成部分中的每一个组成部分的类型。
5.如权利要求4所述的装置,其特征在于,进一步包括:
分配控制器,所述分配控制器被配置成
分析所述一个以上的内容片段中的每一个内容片段,
生成结构信息,所述结构信息指示所述多个组成部分中的每一个组成部分的所述位置、所述相对位置关系以及所述多个组成部分中的每一个组成部分的所述类型,以及
将所述结构信息分配到所述一个以上的内容片段中的每一个内容片段,其中
所述检索控制器参照所述一个以上的内容片段中的每一个内容片段的所述结构信息,并检索所述目标内容片段。
6.如权利要求5所述的装置,其特征在于,进一步包括:
生成控制器,所述生成控制器被配置成格式化所述手写数据并生成搜索查询,其中
所述检索控制器被配置成将所述搜索查询与所述一个以上的内容片段中的每一个内容片段的所述结构信息进行比较,并检索所述目标内容片段。
7.如权利要求6所述的装置,其特征在于,
所述检索控制器被配置成在所述一个以上内容片段中,检索其所述结构信息与所述搜索查询的相似度大于阈值的内容片段,作为所述目标内容片段。
8.如权利要求7所述的装置,其特征在于
所述手写数据利用写在所述多个组成部分中的每一个组成部分的所述位置的手写字符,来指定所述目标内容片段的所述组成部分中的每一个组成部分的所述位置,指定所述相对位置关系,以及指定所述组成部分中的每一个组成部分的所述类型。
9.如权利要求7所述的装置,其特征在于,
所述手写数据利用写在所述多个组成部分中的每一个组成部分的所述位置的手写标记,来指定所述目标内容片段的所述组成部分中的每一个组成部分的所述位置,指定所述相对位置关系,以及指定所述多个组成部分中的每一个组成部分的所述类型。
10.如权利要求7所述的装置,其特征在于,
所述手写数据利用绘制在所述多个组成部分中的每一个组成部分的所述位置的手写圆形或手写多边形或者利用写在所述手写圆形或所述手写多边形中的手写字符,来指定所述目标内容片段的所述组成部分中的每一个组成部分的所述位置,指定所述相对位置关系,以及指定所述组成部分中的每一个组成部分的所述类型。
11.如权利要求7所述的装置,其特征在于,
所述手写数据利用绘制在所述多个组成部分中的每一个组成部分的所述位置的手写笔划以及利用所述手写笔画的颜色,来指定所述目标内容片段的所述组成部分中的每一个组成部分的所述位置,指定所述相对位置关系,以及指定所述组成部分中的每一个组成部分的所述类型。
12.如权利要求7所述的装置,其特征在于,
所述手写数据利用绘制在所述多个组成部分中的每一个组成部分的所述位置的手写圆形或手写多边形,来指定所述目标内容片段的所述组成部分中的每一个组成部分的所述位置和指定所述相对位置关系,以及利用写在所述手写圆形或所述手写多边形中的手写字符和手写图形形式中的至少一个来指定目标字符和目标图形形式中的至少一个,以及
所述检索控制器被配置成在所述一个以上的内容片段中,检索所述结构信息与所述搜索查询的相似度超过阈值、且所述手写字符和所述手写图形形式中的至少一个出现在利用具有在其中写入所述手写字符和所述手写图形形式中的至少一个的所述手写圆形或所述手写多变形所指定的所述位置的内容片段,作为所述目标内容片段。
13.如权利要求3所述的装置,其特征在于,
所述类型是字符、图形形式、表格、图像以及图片中的至少一个。
14.如权利要求7所述的装置,其特征在于,
所述手写数据利用在所述位置绘制的手写图片,来指定所述目标内容片段的所述组成部分的所述位置,以及指定所述组成部分的所述类型。
15.如权利要求2所述的装置,其特征在于,
所述目标内容片段的所述多个组成部分出现在同一页面上,以及
所述多个组成部分中的每一个组成部分的所述位置在所述同一页面上。
16.一种检索装置的检索方法,其特征在于,包括:
获取指定目标内容片段的组成部分的位置的手写数据;
基于所述手写数据,从其中存储一个以上的内容片段的存储器中检索所述目标内容片段;以及
在显示器上显示搜索结果。
CN201410664506.2A 2013-11-20 2014-11-19 检索装置以及方法 Pending CN104657407A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013240279A JP2015099567A (ja) 2013-11-20 2013-11-20 検索装置、方法及びプログラム
JP2013-240279 2013-11-20

Publications (1)

Publication Number Publication Date
CN104657407A true CN104657407A (zh) 2015-05-27

Family

ID=53174375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410664506.2A Pending CN104657407A (zh) 2013-11-20 2014-11-19 检索装置以及方法

Country Status (3)

Country Link
US (1) US20150142784A1 (zh)
JP (1) JP2015099567A (zh)
CN (1) CN104657407A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108206259B (zh) 2016-12-19 2020-10-16 莫仕连接器(成都)有限公司 液态电池连接模块及电池装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020029376A1 (en) * 1998-11-30 2002-03-07 Jesse Ambrose Development tool, method, and system for client server applications
US6400853B1 (en) * 1997-03-19 2002-06-04 Canon Kabushiki Kaisha Image retrieval apparatus and method
CN1716253A (zh) * 2004-07-02 2006-01-04 佳能株式会社 检索数据的方法和装置
CN1779681A (zh) * 2004-11-22 2006-05-31 株式会社日立制作所 基于内容图像的文档检索方法以及装置
JP2007213416A (ja) * 2006-02-10 2007-08-23 Canon Inc 手書き文字列検索装置、手書き文字列検索方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400853B1 (en) * 1997-03-19 2002-06-04 Canon Kabushiki Kaisha Image retrieval apparatus and method
US20020029376A1 (en) * 1998-11-30 2002-03-07 Jesse Ambrose Development tool, method, and system for client server applications
CN1716253A (zh) * 2004-07-02 2006-01-04 佳能株式会社 检索数据的方法和装置
CN1779681A (zh) * 2004-11-22 2006-05-31 株式会社日立制作所 基于内容图像的文档检索方法以及装置
JP2007213416A (ja) * 2006-02-10 2007-08-23 Canon Inc 手書き文字列検索装置、手書き文字列検索方法及びプログラム

Also Published As

Publication number Publication date
JP2015099567A (ja) 2015-05-28
US20150142784A1 (en) 2015-05-21

Similar Documents

Publication Publication Date Title
Borji et al. Salient object detection: A benchmark
CN113010080B (zh) 一种在显示屏上画线的方法、装置和终端设备
US20130125069A1 (en) System and Method for Interactive Labeling of a Collection of Images
US20160171764A1 (en) Rendering hierarchical visualizations of data sets
JP5774558B2 (ja) 手書き文書処理装置、方法及びプログラム
US20150032708A1 (en) Database analysis apparatus and method
US20140351718A1 (en) Information processing device, information processing method, and computer-readable medium
JP5717691B2 (ja) 手書き文字検索装置、方法及びプログラム
JP2018005462A (ja) 認識装置及び認識方法
CN103389873A (zh) 电子装置和手写文档显示方法
CN104834677A (zh) 一种基于属性类别的表情图片显示方法、装置和终端
US10067926B2 (en) Image processing system and methods for identifying table captions for an electronic fillable form
CN104424161A (zh) 手写文档处理装置,手写文档处理方法,和手写文档处理程序
JP6674094B2 (ja) 領域抽出プログラム、領域抽出方法、および領域抽出装置
CN110866378B (zh) 一种在显示屏上进行批注的方法及其系统
CN104077268B (zh) 整形装置
CN110688995B (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN104657407A (zh) 检索装置以及方法
CN103970473B (zh) 字符显示装置以及字符显示方法
CN111414728B (zh) 数值数据展示方法、装置、计算机设备和存储介质
JP6201838B2 (ja) 情報処理装置及び情報処理プログラム
JP7331551B2 (ja) 情報処理装置及び情報処理プログラム
CN103547982A (zh) 利用空间和时间特征识别触摸传感器数据中的接触和接触属性
JP2016031721A (ja) 検索装置、方法及びプログラム
CN104463086B (zh) 一种信息处理方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150527