CN102609606A - 标识元件的方法及系统 - Google Patents

标识元件的方法及系统 Download PDF

Info

Publication number
CN102609606A
CN102609606A CN201110026918XA CN201110026918A CN102609606A CN 102609606 A CN102609606 A CN 102609606A CN 201110026918X A CN201110026918X A CN 201110026918XA CN 201110026918 A CN201110026918 A CN 201110026918A CN 102609606 A CN102609606 A CN 102609606A
Authority
CN
China
Prior art keywords
number designation
image
identified
word segment
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110026918XA
Other languages
English (en)
Inventor
肖伟清
李忠一
叶建发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN201110026918XA priority Critical patent/CN102609606A/zh
Priority to US13/339,188 priority patent/US20120191733A1/en
Publication of CN102609606A publication Critical patent/CN102609606A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种标识元件的方法,该方法包括步骤:载入要读取的文件;从文字部分中提取所有元件的数字标号及其对应的元件名称,创建一个元件表;识别图像部分中每个元件的数字标号的值及其在图像中的位置;在用户移动鼠标过程中侦测光标的位置信息;判断当前光标的位置是否在所识别出的数字标号位置范围内;若光标的位置在所识别出的数字标号位置范围内,从所述元件表中查找到该数字标号对应的元件名称,并显示在该数字标号旁边。本发明还提供一种标识元件的系统。本发明可以实时显示出图档文件中元件的数字标号所对应的元件名称。

Description

标识元件的方法及系统
技术领域
本发明涉及一种标识元件的方法及系统。
背景技术
一般而言,带有图档的文件,如专利文件,其图像中标识的通常是每个元件的数字标号。如果用户需要查看一个数字标号对应的元件名称,需要切换到说明书中,通过专利文字描述来获取。这样既费时又费力,尤其是当一幅图中的元件数字标号数量很多时,会给用户阅读专利图像带来很大的不便。
发明内容
鉴于以上内容,有必要提供一种标识元件的方法,可以实时显示出图档文件中元件的数字标号所对应的元件名称。
鉴于以上内容,还有必要提供一种标识元件的系统,可以实时显示出图档文件中元件的数字标号所对应的元件名称。
所述标识元件的方法包括:载入步骤:载入要读取的文件;提取步骤:从该文件的文字部分中提取所有元件的数字标号及每个数字标号对应的元件名称,创建一个元件表;识别步骤:识别该文件的图像部分中每个元件的数字标号的值及其在图像中的位置;侦测步骤:当用户阅读该文件的图像部分时,在鼠标移动过程中侦测光标的位置信息;判断步骤:判断当前光标的位置是否在所识别出的数字标号位置范围内,若光标的位置不在所识别出的数字标号位置范围内,则重复执行所述侦测步骤,若光标的位置在所识别出的数字标号位置范围内,则执行显示步骤;显示步骤:从所述元件表中查找到该数字标号对应的元件名称,并将该元件名称显示在该数字标号旁边。
所述标识元件的系统包括:载入模块,用于载入要读取的文件;提取模块,用于从该文件的文字部分中提取所有元件的数字标号及每个数字标号对应的元件名称,创建一个元件表;识别模块,用于识别该文件的图像部分中每个元件的数字标号的值及其在图像中的位置;侦测模块,用于当用户阅读该文件的图像部分时,在鼠标移动过程中侦测光标的位置信息;判断模块,用于判断当前光标的位置是否在所识别出的数字标号位置范围内,当光标的位置不在所识别出的数字标号位置范围内时,触发所述侦测模块继续侦测光标的位置信息;显示模块,用于当光标的位置在所识别出的数字标号位置范围内时,从所述元件表中查找到该数字标号对应的元件名称,并将该元件名称显示在该数字标号旁边。
相较于现有技术,所述的标识元件的方法及系统,能够预先从文件的文字部分中提取每个元件的数字标号及其对应的元件名称,当用户将光标放置于图像中一个元件的数字标号上时,将实时显示出该数字标号所对应的元件名称。
附图说明
图1是本发明标识元件的系统较佳实施例的架构图。
图2是本发明较佳实施例中元件表的示意图。
图3是本发明标识元件的方法较佳实施例的流程图。
图4是图3中步骤S12的具体流程图。
图5是图3中步骤S14的具体流程图。
主要元件符号说明
  服务器   1
  输入设备   2
  显示设备   3
  标识元件的系统   10
  载入模块   100
  提取模块   200
  识别模块   300
  侦测模块   400
  判断模块   500
  显示模块   600
具体实施方式
如图1所示,是本发明标识元件的系统较佳实施例的架构图。所述标识元件的系统10运行于服务器1中,所述服务器1连接于输入设备2及显示设备3。
本实施例以在专利文件的图像中标识元件为例进行说明。
所述输入设备2用于输入用户设置的各种数据(如光标移动数据等)。在本实施例中该输入设备为鼠标。
所述显示设备3用于显示专利文件相关资料。
所述标识元件的系统10包括载入模块100、提取模块200、识别模块300、侦测模块400、判断模块500及显示模块600。
所述载入模块100用于载入要读取的专利文件。所述专利文件包括文字部分和图像部分,包括但不限于Word、PDF、JPG、TIF等格式。所述文字部分主要指所述专利文件的说明书部分。
所述提取模块200用于从专利文件说明书部分提取所有元件的数字标号及每个数字标号对应的元件名称,创建一个元件表(参阅图2所示)。具体过程包括:
读取说明书步骤:所述提取模块200读取所述专利文件的说明书部分。
查找数字标号步骤:所述提取模块200在所述说明书部分中查找所有的数字标号,并记录下每个数字标号在该说明书中的位置。具体查找过程为:
(a1)根据该说明书全文的长度依次读取每个字符。
(a2)判断该读取的字符是否为结束符。在本实施例中,所述结束符为EOF(End of File)标志。当该读取的字符是结束符时,结束查找。
(a3)当该读取的字符不是结束符时,判断该读取的字符是否为有效数字。在本实施例中,如果该读取的字符满足下列条件之一,则判定该读取的字符为无效数字:(1)该读取的字符以0开头;(2)该读取的字符包括百分号“%”;(3)该读取的字符为小数;(4)该读取的字符前面包括字符“FIG.”、“FIGS.”、简体的“图”或繁体的“圖”等。在其它实施例中,用户也可以根据不同类型的文件,添加或修改上述规则。当该读取的字符为无效数字时,继续根据该说明书全文的长度依次读取每个字符。
(a4)当该读取的字符为有效数字时,记录该有效数字为数字标号,同时记录下该数字标号在说明书中的位置,然后读取说明书中的下一个字符,直到整个说明书读取完毕。在本实施例中,所述数字标号的位置等于当前读取的字符的序号。举例而言,假设当前读取的是第100个字符,如果当前字符是有效数字,则该有效数字对应的数字标号在说明书中的位置为100。
提取元件名称步骤:所述提取模块200根据每个数字标号在该说明书中的位置,从该说明书全文中提取每个数字标号对应的元件名称,并创建一个元件表。具体提取过程为:
(b1)根据数字标号的位置依次读取每个数字标号。
(b2)从该数字标号的位置向前提取预设数量的字符串,并对所述提取的字符进行倒排序,得到一个排序后的字符串,并将读取的数字标号、提取的字符串及倒排序后的字符串存储在所述服务器1的暂存器中。在本实施例中,所述预设数量为10。
(b3)当所有数字标号读取完毕后,根据数字标号对排序后的字符串进行分组。在每个数字标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该数字标号对应的元件名称。举例而言,假设数字标号为20的分组中包括两个数据:a connector body20及the connector body 20,则最长的相同字符串为“connectorbody”。所以,将“connector body”作为数字标号20对应的元件名称。
在本实施例中,如果某一数字标号的分组中只有一个数据,则从该数字标号的位置向前,在排序后的字符串中寻找第一个预设的修饰词,然后将该第一个预设的修饰词与该数字标号之间的字符提取出来,作为该数字标号对应的元件名称。如果没有找到预设的修饰词,则判定该数字标号无效。对于英文专利说明书而言,所述预设的修饰词可以是a,an或the。对于简体中文专利说明书而言,所述预设的修饰词可以是“一”,“第一”等。举例而言,假设数字标号为60的分组只有一个数据:receive a friction reducing device,suchas an O-ring 60,则从60开始往前寻找到第一修饰词“an”,然后将“an”与“60”之间的字符“O-ring”提取出来,作为数字标号60对应的元件名称。
(b4)根据每个数字标号及该数字标号对应的元件名称,创建一个元件表。
所述识别模块300用于识别专利文件图像部分每个元件的数字标号的值及其在图像中的位置。所述位置为每个元件的数字标号在该图像显示区域中的坐标。具体过程包括:
读取专利图像步骤:所述识别模块300读取所述专利文件的图像部分。
处理专利图像步骤:所述识别模块300根据该图像部分的图像注释对每个图像进行校正,使图像按正确的方向显示。在本实施例中,所述对每个图像进行校正是指将横向排版的图像旋转为竖向排版,以便识别其中的数字标号。
识别数字标号步骤:所述识别模块300从所述图像部分中识别每个元件的数字标号的值及其在图像中的位置。在本实施例中,可以采用OCR(Optical Character Recognition,光学字符识别)技术,识别出所述数字标号的值以及在所述图像部分中的位置。
记录识别结果步骤:所述识别模块300记录所识别出的每个数字标号的值及其在图像中的位置。
所述侦测模块400用于当用户阅读专利文件的图像部分时,在鼠标移动过程中侦测光标的位置信息。
所述判断模块500用于判断当前光标的位置是否在所识别出的数字标号位置范围内。在本实施例中,所述数字标号位置范围为该专利文件图像部分中所识别出的任一元件的数字标号坐标位置及向其四周延展3mm的矩形区域。当光标的位置不在所识别出的数字标号位置范围内时,触发所述侦测模块400继续侦测光标的位置信息。
所述显示模块600用于当光标的位置在所识别出的数字标号位置范围内时,从所述元件表中查找到该数字标号对应的元件名称,并将该元件名称显示在该数字标号旁边。
如果是在浏览器中阅读专利文件的图像部分,则所述侦测模块400可通过浏览器鼠标事件侦测到光标在图像显示区域的坐标位置。当该坐标位置在所识别出的数字标号位置范围内时,所述显示模块600从所述元件表中查找到该数字标号对应的元件名称,并创建一个浏览器组件(如DIV组件),将该浏览器组件的坐标值设为所述光标的坐标,从而将该元件名称显示在该数字标号旁边。
如果是在Windows图像界面中阅读专利文件的图像部分,则所述侦测模块400同样可通过鼠标事件侦测到光标在图像显示区域的坐标位置。当该坐标位置在所识别出的数字标号位置范围内时,所述显示模块600从所述元件表中查找到该数字标号对应的元件名称,并通过Windows所提供的图形界面接口,创建一个显示区域,将该显示区域的坐标值设为所述光标的坐标,从而将该元件名称显示在该数字标号旁边。
所述判断模块500还用于判断用户是否关闭所述专利文件。当还未关闭该专利文件时,触发所述侦测模块400继续侦测光标的位置信息。当已经关闭该专利文件时,操作结束。
如图3所示,是本发明标识元件的方法较佳实施例的流程图。
步骤S10,所述载入模块100载入要读取的专利文件。所述专利文件包括文字部分和图像部分,包括但不限于Word、PDF、JPG、TIF等格式。所述文字部分主要指所述专利文件的说明书部分。
步骤S12,所述提取模块200从专利文件说明书部分提取所有元件的数字标号及每个数字标号对应的元件名称,创建一个元件表(参阅图2所示及图4中的描述)。
步骤S14,所述识别模块300识别专利文件图像部分每个元件的数字标号的值及其在图像中的位置(参阅图5的描述)。所述位置为每个元件的数字标号在该图像显示区域中的坐标。
步骤S16,当用户阅读专利文件的图像部分时,所述侦测模块400在鼠标移动过程中侦测光标的位置信息。
步骤S18,所述判断模块500判断当前光标的位置是否在所识别出的数字标号位置范围内。在本实施例中,所述数字标号位置范围为该专利文件图像部分中所识别出的任一元件的数字标号坐标位置及向其四周延展3mm的矩形区域。若光标的位置不在所识别出的数字标号位置范围内,则返回执行步骤S16;若光标的位置在所识别出的数字标号位置范围内,则执行步骤S20。
步骤S20,所述显示模块600从所述元件表中查找到该数字标号对应的元件名称,并将该元件名称显示在该数字标号旁边。
步骤S22,所述判断模块500判断用户是否关闭所述专利文件。若还未关闭该专利文件,则返回执行步骤S16;若已经关闭该专利文件,则流程结束。
如图4所示,是图3中步骤S12的具体流程图。
步骤S200,所述提取模块200读取所述专利文件的说明书部分。
步骤S202,所述提取模块200在所述说明书部分中查找所有的数字标号,并记录下每个数字标号在该说明书中的位置。
步骤S204,所述提取模块200根据每个数字标号在该说明书中的位置,从该说明书全文中提取每个数字标号对应的元件名称,并创建一个元件表。
如图5所示,是图3中步骤S14的具体流程图。
步骤S400,所述识别模块300读取所述专利文件的图像部分。
步骤S402,所述识别模块300根据该图像部分的图像注释对每个图像进行校正,使图像按正确的方向显示。在本实施例中,所述对每个图像进行校正是指将横向排版的图像旋转为竖向排版,以便识别其中的数字标号。
步骤S404,所述识别模块300从所述图像部分中识别每个元件的数字标号的值及其在图像中的位置。在本实施例中,可以采用OCR(Optical Character Recognition,光学字符识别)技术,识别出所述数字标号的值及其在图像中的位置。
步骤S406,所述识别模块300记录所识别出的每个数字标号的值及其在图像中的位置。
可以理解,本发明并不局限于在专利文件的图像中标识元件,本领域技术人员可以很容易将本发明所述方法移植到其它文件中标识元件名称,如专业期刊资料和学术论文资料等。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (8)

1.一种标识元件的方法,其特征在于,该方法包括:
载入步骤:载入要读取的文件;
提取步骤:从该文件的文字部分中提取所有元件的数字标号及每个数字标号对应的元件名称,创建一个元件表;
识别步骤:识别该文件的图像部分中每个元件的数字标号的值及其在图像中的位置;
侦测步骤:当用户阅读该文件的图像部分时,在鼠标移动过程中侦测光标的位置信息;
判断步骤:判断当前光标的位置是否在所识别出的数字标号位置范围内,若光标的位置不在所识别出的数字标号位置范围内,则重复执行所述侦测步骤,若光标的位置在所识别出的数字标号位置范围内,则执行显示步骤;
显示步骤:从所述元件表中查找到该数字标号对应的元件名称,并将该元件名称显示在该数字标号旁边。
2.如权利要求1所述的标识元件的方法,其特征在于,该方法在所述显示步骤之后还包括:
判断用户是否关闭所述文件;
若还未关闭该文件,则重复执行所述侦测步骤;
若已经关闭该文件,则流程结束。
3.如权利要求1所述的标识元件的方法,其特征在于,所述提取步骤具体包括:
读取所述文件的文字部分;
在所述文字部分中查找所有的数字标号,并记录下每个数字标号在该文字部分中的位置;
根据每个数字标号在该文字部分中的位置,从该文字部分全文中提取每个数字标号对应的元件名称,并创建一个元件表。
4.如权利要求1所述的标识元件的方法,其特征在于,所述识别步骤具体包括:
读取所述文件的图像部分;
根据该图像部分的图像注释对每个图像进行校正,使图像竖向显示;
从所述图像部分中识别每个元件的数字标号的值及其在图像中的位置;
记录所识别出的每个数字标号的值及其在图像中的位置。
5.一种标识元件的系统,其特征在于,该系统包括:
载入模块,用于载入要读取的文件;
提取模块,用于从该文件的文字部分中提取所有元件的数字标号及每个数字标号对应的元件名称,创建一个元件表;
识别模块,用于识别该文件的图像部分中每个元件的数字标号的值及其在图像中的位置;
侦测模块,用于当用户阅读该文件的图像部分时,在鼠标移动过程中侦测光标的位置信息;
判断模块,用于判断当前光标的位置是否在所识别出的数字标号位置范围内,当光标的位置不在所识别出的数字标号位置范围内时,触发所述侦测模块继续侦测光标的位置信息;
显示模块,用于当光标的位置在所识别出的数字标号位置范围内时,从所述元件表中查找到该数字标号对应的元件名称,并将该元件名称显示在该数字标号旁边。
6.如权利要求5所述的标识元件的系统,其特征在于,所述判断模块还用于判断用户是否关闭所述文件,当还未关闭该文件时,触发所述侦测模块继续侦测光标的位置信息。
7.如权利要求5所述的标识元件的系统,其特征在于,所述提取模块通过下述步骤提取数字标号及其对应的元件名称:
读取所述文件的文字部分;
在所述文字部分中查找所有的数字标号,并记录下每个数字标号在该文字部分中的位置;
根据每个数字标号在该文字部分中的位置,从该文字部分全文中提取每个数字标号对应的元件名称,并创建一个元件表。
8.如权利要求5所述的标识元件的系统,其特征在于,所述识别模块通过下述步骤识别数字标号及其在图像中的位置:
读取所述文件的图像部分;
根据该图像部分的图像注释对每个图像进行校正,使图像竖向显示;
从所述图像部分中识别每个元件的数字标号的值及其在图像中的位置;
记录所识别出的每个数字标号的值及其在图像中的位置。
CN201110026918XA 2011-01-25 2011-01-25 标识元件的方法及系统 Pending CN102609606A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110026918XA CN102609606A (zh) 2011-01-25 2011-01-25 标识元件的方法及系统
US13/339,188 US20120191733A1 (en) 2011-01-25 2011-12-28 Computing device and method for identifying components in figures

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110026918XA CN102609606A (zh) 2011-01-25 2011-01-25 标识元件的方法及系统

Publications (1)

Publication Number Publication Date
CN102609606A true CN102609606A (zh) 2012-07-25

Family

ID=46526974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110026918XA Pending CN102609606A (zh) 2011-01-25 2011-01-25 标识元件的方法及系统

Country Status (2)

Country Link
US (1) US20120191733A1 (zh)
CN (1) CN102609606A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103677504A (zh) * 2012-09-19 2014-03-26 鸿富锦精密工业(深圳)有限公司 文件阅读器及文件信息显示方法
US9430720B1 (en) 2011-09-21 2016-08-30 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
CN111126334A (zh) * 2019-12-31 2020-05-08 南京酷朗电子有限公司 技术资料的快速阅读和处理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102455997A (zh) * 2010-10-27 2012-05-16 鸿富锦精密工业(深圳)有限公司 元件名称提取系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216828A1 (en) * 2004-03-26 2005-09-29 Brindisi Thomas J Patent annotator
CN1912868A (zh) * 2005-08-08 2007-02-14 腾讯科技(深圳)有限公司 一种用户标识识别方法
CN101527104A (zh) * 2008-03-04 2009-09-09 鲁欣 利用电子地图附加商标和商家信息的广告推广方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442742A (en) * 1990-12-21 1995-08-15 Apple Computer, Inc. Method and apparatus for the manipulation of text on a computer display screen
JP3507611B2 (ja) * 1996-03-01 2004-03-15 富士通株式会社 Cadシステム
US8321457B2 (en) * 2000-09-08 2012-11-27 Oracle International Corporation Techniques for automatically developing a web site
US20030098862A1 (en) * 2001-11-06 2003-05-29 Smartequip, Inc. Method and system for building and using intelligent vector objects
US6976249B1 (en) * 2001-11-12 2005-12-13 Apple Computer, Inc. Method for embedding object codes in source codes
EP1351156A1 (en) * 2002-03-14 2003-10-08 Universita' Degli Studi di Firenze System and method for automatically performing functional analyses of technical texts
US7397464B1 (en) * 2004-04-30 2008-07-08 Microsoft Corporation Associating application states with a physical object
US20060230333A1 (en) * 2005-04-07 2006-10-12 Microsoft Corporation Creating associated content for a region of a document in response to a user selecting the region
US8910038B2 (en) * 2008-04-04 2014-12-09 Canon Kabushiki Kaisha Apparatus and method for image separation, layout, and templating
JP5188260B2 (ja) * 2008-05-08 2013-04-24 キヤノン株式会社 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体
TW201113821A (en) * 2009-10-01 2011-04-16 Univ Nat Taiwan Platform for co-drafting patent specifications online by a plurality of drafters
JP2011123697A (ja) * 2009-12-11 2011-06-23 Fujifilm Corp ウェブ・ページ変換システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216828A1 (en) * 2004-03-26 2005-09-29 Brindisi Thomas J Patent annotator
CN1912868A (zh) * 2005-08-08 2007-02-14 腾讯科技(深圳)有限公司 一种用户标识识别方法
CN101527104A (zh) * 2008-03-04 2009-09-09 鲁欣 利用电子地图附加商标和商家信息的广告推广方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9430720B1 (en) 2011-09-21 2016-08-30 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US9508027B2 (en) 2011-09-21 2016-11-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US9558402B2 (en) 2011-09-21 2017-01-31 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US9953013B2 (en) 2011-09-21 2018-04-24 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US10311134B2 (en) 2011-09-21 2019-06-04 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US10325011B2 (en) 2011-09-21 2019-06-18 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US11232251B2 (en) 2011-09-21 2022-01-25 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US11830266B2 (en) 2011-09-21 2023-11-28 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
CN103677504A (zh) * 2012-09-19 2014-03-26 鸿富锦精密工业(深圳)有限公司 文件阅读器及文件信息显示方法
CN111126334A (zh) * 2019-12-31 2020-05-08 南京酷朗电子有限公司 技术资料的快速阅读和处理方法
CN111126334B (zh) * 2019-12-31 2020-10-16 南京酷朗电子有限公司 技术资料的快速阅读和处理方法

Also Published As

Publication number Publication date
US20120191733A1 (en) 2012-07-26

Similar Documents

Publication Publication Date Title
US20130124513A1 (en) Extracting principal content from web pages
CN105631393A (zh) 信息识别方法及装置
US20220222292A1 (en) Method and system for ideogram character analysis
CN110674814A (zh) 一种图片识别翻译方法、终端及介质
JP2008276766A (ja) フォーム自動埋込方法及び装置
CN113961794A (zh) 一种书籍推荐方法、装置、计算机设备及存储介质
US10261987B1 (en) Pre-processing E-book in scanned format
CN102609606A (zh) 标识元件的方法及系统
Hsiao et al. Screenqa: Large-scale question-answer pairs over mobile app screenshots
CN104102704A (zh) 系统控件展示方法和装置
CN111078915B (zh) 一种点读模式下的点读内容获取方法及电子设备
CN113806472A (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
EP2565798A1 (en) Document processing device and program
US20120109638A1 (en) Electronic device and method for extracting component names using the same
CN111079777B (zh) 一种基于书页定位的点读方法及电子设备
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
KR20210127637A (ko) 특허 도면 부호 설명 출력 방법 및 이를 위한 장치, 시스템
US20150095314A1 (en) Document search apparatus and method
GB2473228A (en) Segmenting Document Images
JP6759955B2 (ja) 地名抽出プログラム、地名抽出装置および地名抽出方法
CN112001150B (zh) 一种文档格式转换的方法、装置、计算机存储介质及终端
CN104102686B (zh) 管理图像的方法及其电子设备
US11481447B2 (en) Information processing device and non-transitory computer readable medium
US11943415B2 (en) Repurposing a document

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120725