CN102455997A - 元件名称提取系统及方法 - Google Patents

元件名称提取系统及方法 Download PDF

Info

Publication number
CN102455997A
CN102455997A CN2010105214564A CN201010521456A CN102455997A CN 102455997 A CN102455997 A CN 102455997A CN 2010105214564 A CN2010105214564 A CN 2010105214564A CN 201010521456 A CN201010521456 A CN 201010521456A CN 102455997 A CN102455997 A CN 102455997A
Authority
CN
China
Prior art keywords
element numbers
character
text document
reads
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105214564A
Other languages
English (en)
Inventor
肖伟清
李忠一
叶建发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2010105214564A priority Critical patent/CN102455997A/zh
Priority to US13/049,908 priority patent/US20120109638A1/en
Publication of CN102455997A publication Critical patent/CN102455997A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种元件名称提取系统及方法,该方法包括步骤:从存储器中读取一个文本文档的全文;在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。利用本发明可以预先从专利文件的说明书中提取所有元件标号及每个元件标号所对应的元件名称。

Description

元件名称提取系统及方法
技术领域
本发明涉及一种元件名称提取系统及方法。
背景技术
一般而言,带有图档的文件,如专利文件,其图档中只会标注每个元件的标号,如果用户需要查看一个元件标号对应的元件名称,需要切换到说明书中去查找。这样既费时又费力,尤其是当一幅图中的元件标号数量很多时,会给用户阅览专利图档带来很大的不便。
发明内容
鉴于以上内容,有必要提供一种元件名称提取系统及方法,其可预先从文件的文字说明书中提取图档的所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称。
在一个实施例中,该方法包括如下步骤:
从存储器中读取一个文本文档的全文;
在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及
根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
前述方法可以由电子设备(如电脑)执行,其中该电子设备具有附带了图形用户界面(GUI)的显示屏幕、一个或多个处理器、存储器以及保存在存储器中用于执行这些方法的一个或多个模块、程序或指令集。在某些实施例中,该电子设备提供了包括无线通信在内的多种功能。
用于执行前述方法的指令可以包含在被配置成由一个或多个处理器执行的计算机程序产品中。
相较于现有技术,所述的元件名称提取系统及方法,其可预先从文件的文字说明书中提取图档的所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称,极大地方便了用户浏览文件的图档。
附图说明
图1是本发明元件名称提取系统较佳实施例的应用环境示意图。
图2是元件名称提取系统的功能模块图。
图3是本发明元件名称提取方法的较佳实施例的流程图。
图4是图3中步骤S2的具体流程图。
图5是图3中步骤S3的具体流程图。
图6是本发明中元件表的示意图。
主要元件符号说明
  控制电脑  2
  显示设备  20
  输入设备  22
  存储器  23
  元件名称提取系统  24
  处理器  25
  元件表  30
  文档读取模块  201
  元件标号查找模块  202
  元件名称提取模块  203
  元件名称显示模块  204
具体实施方式
如图1所示,是本发明元件名称提取系统较佳实施例的应用环境示意图。本实施例以专利元件名称的提取为例进行说明,该元件名称提取系统24运行于控制电脑2中。该控制电脑2还包括通过数据总线相连的显示设备20、输入设备22、存储器23和处理器25。
所述存储器23用于存储专利文件的说明书及对应的图档资料,所述显示设备20用于显示说明书及对应的图档资料,所述输入设备22用于输入用户设置的各种数据(如光标移动数据等)。
所述元件名称提取系统24用于预先从专利文件的说明书中提取所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于专利图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称,具体过程以下描述。
在本实施例中,所述元件名称提取系统24可以被分割成一个或多个模块,所述一个或多个模块被存储在所述存储器23中并被配置成由一个或多个处理器(本实施例为一个处理器25)执行,以完成本发明。例如,参阅图2所示,所述元件名称提取系统24被分割成文档读取模块201、元件标号查找模块202、元件名称提取模块203和元件名称显示模块204。本发明所称的模块是完成一特定功能的程序段,比程序更适合于描述软件在控制电脑2中的执行过程。
如图3所示,是本发明元件名称提取方法的较佳实施例的流程图。
步骤S1,文档读取模块201从存储器23中读取一个专利文件的说明书全文。在本实施例中,所述说明书全文为文本文档格式,包括但不限于,Word、PDF、JPG、TIFF等格式中的文本文档。举例而言,如果说明书是一个PDF文件,则文档读取模块201从该PDF文件中读取所有的文本内容。
步骤S2,元件标号查找模块202在该说明书全文中查找所有的元件标号,并记录下每个元件标号在该说明书中的位置。具体流程参阅图4的说明。
步骤S3,元件名称提取模块203根据每个元件标号在该说明书中的位置,从该说明书全文中提取每个元件标号对应的元件名称,并创建一个元件表30(参阅图6所示)。具体流程参阅图5的说明。
在其它实施例中,该方法还进一步包括如下步骤:当用户将光标放置于专利图档的一个元件标号上时,元件名称显示模块204将从元件表30中查找该元件标号对应的元件名称,并将该元件名称显示在该元件标号旁边。
如图4所示,是图3中步骤S2的具体流程图。
步骤S20,元件标号查找模块202根据该说明书全文的长度依次读取每个字符。
步骤S21,元件标号查找模块202判断该读取的字符是否为结束符。如果该读取的字符是结束符,则流程结束。如果该读取的字符不是结束符,则执行步骤S22。在本实施例中,所述结束符为EOF(End of File)标志。
步骤S22,元件标号查找模块202判断该读取的字符是否为有效数字。如果该读取的字符为有效数字,则执行步骤S23;如果该读取的字符为无效数字,则返回步骤S20。在本实施例中,如果该读取的字符满足下列条件之一,则元件标号查找模块202判定该读取的字符为无效数字:(1)该读取的字符以0开头;(2)该读取的字符包括百分号“%”;(3)该读取的字符为小数;(4)该读取的字符前面包括字符“FIG.”、“FIGS.”、简体的“图”或繁体的“圖”等。在其它实施例中,用户也可以根据不同类型的文本文档,添加或修改上述规则。
步骤S23,元件标号查找模块202记录该数字为元件标号,同时记录下该元件标号在说明书中的位置,然后读取说明书中的下一个字符,直到整个说明书读取完毕。在本实施例中,所述元件标号的位置等于当前读取的字符的序号。举例而言,假设当前读取的是第100个字符,如果当前字符是有效数字,则该有效数字对应的元件标号在说明书中的位置为100。
如图5所示,是图3中步骤S3的具体流程图。
步骤S30,元件名称提取模块203根据元件标号的位置依次读取每个元件标号。
步骤S31,元件名称提取模块203从该元件标号的位置向前提取预设数量的字符串,并对所述提取的字符进行倒排序,得到一个排序后的字符串,并将读取的元件标号、提取的字符串及倒排序后的字符串存储在控制电脑2的暂存器中。在本实施例中,所述预设数量为10。
步骤S32,当所有元件标号读取完毕后,元件名称提取模块203根据元件标号对排序后的字符串进行分组。
在本实施例中,如果排序后的字符串包括预先设定格式的字符串,则将该排序后的字符串拆分成两个或两个以上的字符串,并根据元件标号进行分组。举例而言,对于英文专利说明书而言,如果排序后的字符串包括如下预先设定格式的字符串:xxx xx,yyyy yy68,70或xxx xx and yyyy yy 68,70,则将排序后的字符串拆分成:xxx xx 68,yyyy yy 70。例如,将a first flat surface and a second flatsurface,68,70拆分成a first flat surface 68,a second flat surface 70。
对于简体中文专利说明书而言,如果排序后的字符串包括如下预先设定格式的字符串:xxx xx和/与yyyy yy 68,70,则将排序后的字符串拆分成:xxx xx 68,yyyy yy 70。例如,将第一平面和第二平面68,70拆分成第一平面68和第二平面70。
步骤S33,元件名称提取模块203在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称。举例而言,假设元件标号为20的分组中包括两个数据:a connector body 20,the connector body 20,则最长的相同字符串为“connector body”。所以,元件名称提取模块203将“connectorbody”作为元件标号20对应的元件名称。
在本实施例中,如果某一元件标号的分组中只有一个数据,则从该元件标号的位置向前,在排序后的字符串中寻找第一个预设的修饰词,然后将该第一个预设的修饰词与该元件标号之间的字符提取出来,作为该元件标号对应的元件名称。如果没有找到预设的修饰词,则判定该元件标号无效。对于英文专利说明书而言,所述预设的修饰词可以是a,an,或the。对于简体中文专利说明书而言,所述修饰词可以是“一”,“第一”等。
举例而言,假设元件标号为60的分组只有一个数据:receive afriction reducing device,such as an O-ring 60,则元件名称提取模块203从60开始往前寻找到第一修饰词“an”,然后将“an”与“60”之间的字符“O-ring”提取出来,作为元件标号60对应的元件名称。
步骤S34,元件名称提取模块203根据每个元件的标号及该元件标号对应的元件名称创建一个元件表30(参阅图6所示)。
可以理解,本发明并不局限于在专利文件的说明书中提取元件名称,本领域技术人员可以很容易将本发明所述方法移植到在其它文本文档中提取元件名称,如专业期刊资料和学术论文资料等。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种元件名称提取方法,其特征在于,该方法包括如下步骤:
从存储器中读取一个文本文档的全文;
在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及
根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
2.如权利要求1所述的元件名称提取方法,其特征在于,所述元件标号在该文本文档中的位置等于当前读取的字符的序号。
3.如权利要求1所述的元件名称提取方法,其特征在于,所述在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置的步骤包括:
根据该文本文档全文的长度依次读取每个字符;
如果该读取的字符不是结束符,则判断该读取的字符是否为有效数字,如果该读取的字符为无效数字,则读取该文本文档的下一个字符;及
如果该读取的字符为有效数字,记录该数字为元件标号,同时记录下该元件标号在该文本文档中的位置,然后读取该文本文档的下一个字符,直到整个文本文档读取完毕。
4.如权利要求3所述的元件名称提取方法,其特征在于,如果该读取的字符满足下列条件之一,则判定该读取的字符为无效数字:(1)该读取的字符以0开头;(2)该读取的字符包括百分号“%”;(3)该读取的字符为小数;(4)该读取的字符前面包括字符“FIG.”、“FIGS.”或“图”。
5.如权利要求1所述的元件名称提取方法,其特征在于,所述从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表的步骤包括:
根据元件标号在该文本文档中的位置依次读取每个元件标号;
从该元件标号的位置向前提取预设数量的字符串,并对所述提取的字符进行倒排序,得到一个排序后的字符串;
当所有元件标号读取完毕后,根据元件标号对排序后的字符串进行分组;
在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称;及
根据每个元件的标号及该元件标号对应的元件名称创建一个元件表。
6.如权利要求5所述的元件名称提取方法,其特征在于,所述根据元件标号对排序后的字符串进行分组的步骤包括:如果排序后的字符串包括预先设定格式的字符串,则将该排序后的字符串拆分成两个或两个以上的字符串,并根据元件标号进行分组。
7.如权利要求5所述的元件名称提取方法,其特征在于,所述在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称的步骤包括:
如果一个元件标号的分组中只有一个数据,则从该元件标号的位置向前,在该元件标号排序后的字符串中寻找第一个预设的修饰词;
将该第一个预设的修饰词与该元件标号之间的字符提取出来,作为该元件标号对应的元件名称;及
如果没有找到预设的修饰词,则判定该元件标号无效。
8.如权利要求7所述的元件名称提取方法,其特征在于,如果该文本文档为英文,所述预设的修饰词为a,an,或the,如果该文本文档为简体中文,则所述修饰词为“一”或“第一”。
9.一种电脑,包括:
存储器;
一个或多个处理器;以及
一个或多个模块,所述一个或多个模块被存储在所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括:
文档读取模块,用于从存储器中读取一个文本文档的全文;
元件标号查找模块,用于在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及
元件标号提取模块,用于根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
10.如权利要求9所述的电脑,其特征在于,所述元件标号在该文本文档中的位置等于当前读取的字符的序号。
CN2010105214564A 2010-10-27 2010-10-27 元件名称提取系统及方法 Pending CN102455997A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010105214564A CN102455997A (zh) 2010-10-27 2010-10-27 元件名称提取系统及方法
US13/049,908 US20120109638A1 (en) 2010-10-27 2011-03-17 Electronic device and method for extracting component names using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105214564A CN102455997A (zh) 2010-10-27 2010-10-27 元件名称提取系统及方法

Publications (1)

Publication Number Publication Date
CN102455997A true CN102455997A (zh) 2012-05-16

Family

ID=45997642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105214564A Pending CN102455997A (zh) 2010-10-27 2010-10-27 元件名称提取系统及方法

Country Status (2)

Country Link
US (1) US20120109638A1 (zh)
CN (1) CN102455997A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514303A (zh) * 2013-10-29 2014-01-15 苏州利驰电子商务有限公司 电气元件接线图识别方法及系统
CN109445900A (zh) * 2018-11-13 2019-03-08 江苏省舜禹信息技术有限公司 用于图片显示的翻译方法和装置
CN109598649A (zh) * 2018-12-20 2019-04-09 江苏省舜禹信息技术有限公司 一种专利文件的处理方法、装置及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
CN104408269B (zh) * 2014-12-17 2017-09-29 上海天华建筑设计有限公司 设计图纸拆分方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774833A (en) * 1995-12-08 1998-06-30 Motorola, Inc. Method for syntactic and semantic analysis of patent text and drawings
US20050210382A1 (en) * 2002-03-14 2005-09-22 Gaetano Cascini System and method for performing functional analyses making use of a plurality of inputs
US7716581B2 (en) * 2000-02-29 2010-05-11 Tran Bao Q Patent optimizer

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5182709A (en) * 1986-03-31 1993-01-26 Wang Laboratories, Inc. System for parsing multidimensional and multidirectional text into encoded units and storing each encoded unit as a separate data structure
US4965763A (en) * 1987-03-03 1990-10-23 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
US5442742A (en) * 1990-12-21 1995-08-15 Apple Computer, Inc. Method and apparatus for the manipulation of text on a computer display screen
US5475587A (en) * 1991-06-28 1995-12-12 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US6339767B1 (en) * 1997-06-02 2002-01-15 Aurigin Systems, Inc. Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing
US5793381A (en) * 1995-09-13 1998-08-11 Apple Computer, Inc. Unicode converter
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
JP3507611B2 (ja) * 1996-03-01 2004-03-15 富士通株式会社 Cadシステム
US5778362A (en) * 1996-06-21 1998-07-07 Kdl Technologies Limted Method and system for revealing information structures in collections of data items
US5819265A (en) * 1996-07-12 1998-10-06 International Business Machines Corporation Processing names in a text
US6049811A (en) * 1996-11-26 2000-04-11 Petruzzi; James D. Machine for drafting a patent application and process for doing same
JPH11134399A (ja) * 1997-10-24 1999-05-21 Nec Informatec Systems Ltd 特許出願用明細書作成システム、特許出願用明細書作成方法および特許出願用明細書作成用プログラムを記録した記録媒体
JP3429184B2 (ja) * 1998-03-19 2003-07-22 シャープ株式会社 テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US8095581B2 (en) * 1999-02-05 2012-01-10 Gregory A Stobbs Computer-implemented patent portfolio analysis method and apparatus
US7890851B1 (en) * 1999-03-19 2011-02-15 Milton Jr Harold W System for facilitating the preparation of a patent application
US6601026B2 (en) * 1999-09-17 2003-07-29 Discern Communications, Inc. Information retrieval by natural language querying
US7389239B1 (en) * 1999-12-30 2008-06-17 At&T Delaware Intellectual Property, Inc. System and method for managing intellectual property
GB2364141A (en) * 2000-06-28 2002-01-16 Peter David Hudson System for producing a patent specification and application
US6778986B1 (en) * 2000-07-31 2004-08-17 Eliyon Technologies Corporation Computer method and apparatus for determining site type of a web site
US20020107896A1 (en) * 2001-02-02 2002-08-08 Abraham Ronai Patent application drafting assistance tool
US7289962B2 (en) * 2001-06-28 2007-10-30 International Business Machines Corporation Compressed list presentation for speech user interfaces
US8041739B2 (en) * 2001-08-31 2011-10-18 Jinan Glasgow Automated system and method for patent drafting and technology assessment
US7197449B2 (en) * 2001-10-30 2007-03-27 Intel Corporation Method for extracting name entities and jargon terms using a suffix tree data structure
US20030098862A1 (en) * 2001-11-06 2003-05-29 Smartequip, Inc. Method and system for building and using intelligent vector objects
US7447624B2 (en) * 2001-11-27 2008-11-04 Sun Microsystems, Inc. Generation of localized software applications
JP2003167914A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd マルチメディア情報検索方法、プログラム、記録媒体及びシステム
US7315810B2 (en) * 2002-01-07 2008-01-01 Microsoft Corporation Named entity (NE) interface for multiple client application programs
US7536297B2 (en) * 2002-01-22 2009-05-19 International Business Machines Corporation System and method for hybrid text mining for finding abbreviations and their definitions
US7003516B2 (en) * 2002-07-03 2006-02-21 Word Data Corp. Text representation and method
US20040163034A1 (en) * 2002-10-17 2004-08-19 Sean Colbath Systems and methods for labeling clusters of documents
US20060107201A1 (en) * 2002-11-08 2006-05-18 Hon Hai Precision Ind. Co., Ltd. System and method for displaying patent classification information
US7102509B1 (en) * 2003-01-11 2006-09-05 Global Tel★Link Corporation Computer interface system for tracking of radio frequency identification tags
US20050005239A1 (en) * 2003-07-03 2005-01-06 Richards James L. System and method for automatic insertion of cross references in a document
US7720675B2 (en) * 2003-10-27 2010-05-18 Educational Testing Service Method and system for determining text coherence
US8046212B1 (en) * 2003-10-31 2011-10-25 Access Innovations Identification of chemical names in text-containing documents
WO2005048055A2 (en) * 2003-11-07 2005-05-26 Spore, Inc. Patent claims analysis system and method
US7587309B1 (en) * 2003-12-01 2009-09-08 Google, Inc. System and method for providing text summarization for use in web-based content
US20050216828A1 (en) * 2004-03-26 2005-09-29 Brindisi Thomas J Patent annotator
US7397464B1 (en) * 2004-04-30 2008-07-08 Microsoft Corporation Associating application states with a physical object
US7933763B2 (en) * 2004-04-30 2011-04-26 Mdl Information Systems, Gmbh Method and software for extracting chemical data
US7823061B2 (en) * 2004-05-20 2010-10-26 Wizpatent Pte Ltd System and method for text segmentation and display
US20060059413A1 (en) * 2004-09-10 2006-03-16 Tran Bao Q Systems and methods for generating intellectual property
US7996208B2 (en) * 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation
US7444589B2 (en) * 2004-12-30 2008-10-28 At&T Intellectual Property I, L.P. Automated patent office documentation
US7509318B2 (en) * 2005-01-28 2009-03-24 Microsoft Corporation Automatic resource translation
US7672833B2 (en) * 2005-09-22 2010-03-02 Fair Isaac Corporation Method and apparatus for automatic entity disambiguation
US8209201B1 (en) * 2005-12-08 2012-06-26 Hewlett-Packard Development Company, L.P. System and method for correlating objects
US8245136B2 (en) * 2006-02-23 2012-08-14 Olivier Fischer Updating inserted text in a graphic file
JP4872079B2 (ja) * 2006-05-19 2012-02-08 国立大学法人長岡技術科学大学 文章更新量評価プログラム
US8046364B2 (en) * 2006-12-18 2011-10-25 Veripat, LLC Computer aided validation of patent disclosures
US8606606B2 (en) * 2007-01-03 2013-12-10 Vistaprint Schweiz Gmbh System and method for translation processing
US7881937B2 (en) * 2007-05-31 2011-02-01 International Business Machines Corporation Method for analyzing patent claims
US20090019041A1 (en) * 2007-07-11 2009-01-15 Marc Colando Filename Parser and Identifier of Alternative Sources for File
US9058337B2 (en) * 2007-10-22 2015-06-16 Apple Inc. Previewing user interfaces and other aspects
US8612853B2 (en) * 2007-11-15 2013-12-17 Harold W. Milton, Jr. System for automatically inserting reference numerals in a patent application
US8135574B2 (en) * 2007-11-15 2012-03-13 Weikel Bryan T Creating and displaying bodies of parallel segmented text
US8412516B2 (en) * 2007-11-27 2013-04-02 Accenture Global Services Limited Document analysis, commenting, and reporting system
US8521512B2 (en) * 2008-04-30 2013-08-27 Deep Sky Concepts, Inc Systems and methods for natural language communication with a computer
US8117024B2 (en) * 2008-05-01 2012-02-14 My Perfect Gig, Inc. System and method for automatically processing candidate resumes and job specifications expressed in natural language into a normalized form using frequency analysis
JP5188260B2 (ja) * 2008-05-08 2013-04-24 キヤノン株式会社 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体
US8682646B2 (en) * 2008-06-04 2014-03-25 Microsoft Corporation Semantic relationship-based location description parsing
US8135580B1 (en) * 2008-08-20 2012-03-13 Amazon Technologies, Inc. Multi-language relevance-based indexing and search
US8489388B2 (en) * 2008-11-10 2013-07-16 Apple Inc. Data detection
WO2010105115A2 (en) * 2009-03-11 2010-09-16 The Board Of Regents Of The University Of Texas System Audience response system
US8073718B2 (en) * 2009-05-29 2011-12-06 Hyperquest, Inc. Automation of auditing claims
US8271525B2 (en) * 2009-10-09 2012-09-18 Verizon Patent And Licensing Inc. Apparatuses, methods and systems for a smart address parser
US8515969B2 (en) * 2010-02-19 2013-08-20 Go Daddy Operating Company, LLC Splitting a character string into keyword strings
US8626236B2 (en) * 2010-10-08 2014-01-07 Blackberry Limited System and method for displaying text in augmented reality
US8620836B2 (en) * 2011-01-10 2013-12-31 Accenture Global Services Limited Preprocessing of text
CN102609606A (zh) * 2011-01-25 2012-07-25 鸿富锦精密工业(深圳)有限公司 标识元件的方法及系统
CN102737012B (zh) * 2011-04-06 2015-09-30 赛恩倍吉科技顾问(深圳)有限公司 文本信息对比方法及系统
US20130085745A1 (en) * 2011-10-04 2013-04-04 Salesforce.Com, Inc. Semantic-based approach for identifying topics in a corpus of text-based items
CN103136187A (zh) * 2011-12-01 2013-06-05 鸿富锦精密工业(深圳)有限公司 专利核驳信息提取方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774833A (en) * 1995-12-08 1998-06-30 Motorola, Inc. Method for syntactic and semantic analysis of patent text and drawings
US7716581B2 (en) * 2000-02-29 2010-05-11 Tran Bao Q Patent optimizer
US20050210382A1 (en) * 2002-03-14 2005-09-22 Gaetano Cascini System and method for performing functional analyses making use of a plurality of inputs

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514303A (zh) * 2013-10-29 2014-01-15 苏州利驰电子商务有限公司 电气元件接线图识别方法及系统
CN103514303B (zh) * 2013-10-29 2017-08-11 苏州利驰电子商务有限公司 电气元件接线图识别方法及系统
CN109445900A (zh) * 2018-11-13 2019-03-08 江苏省舜禹信息技术有限公司 用于图片显示的翻译方法和装置
CN109445900B (zh) * 2018-11-13 2021-12-10 江苏省舜禹信息技术有限公司 用于图片显示的翻译方法和装置
CN109598649A (zh) * 2018-12-20 2019-04-09 江苏省舜禹信息技术有限公司 一种专利文件的处理方法、装置及存储介质
CN109598649B (zh) * 2018-12-20 2021-12-10 江苏省舜禹信息技术有限公司 一种专利文件的处理方法、装置及存储介质

Also Published As

Publication number Publication date
US20120109638A1 (en) 2012-05-03

Similar Documents

Publication Publication Date Title
CN109062874B (zh) 财政数据的获取方法、终端设备及介质
US20090265313A1 (en) Automatically Extracting Data From Semi-Structured Documents
CN103455475B (zh) 排版方法、设备及系统
CN102270206A (zh) 一种有效网页内容的抓取方法及装置
CN102455997A (zh) 元件名称提取系统及方法
CN102959538B (zh) 给文档编索引
WO2020056977A1 (zh) 知识点推送方法、装置及计算机可读存储介质
EP3016003A1 (en) Search method, apparatus and device and non-volatile computer storage medium
CN109408777A (zh) 基于快速浏览的文档处理方法、装置和文档服务器
CN115687655A (zh) 一种基于pdf文档的知识图谱构建方法、系统、设备及存储介质
CN105404677A (zh) 一种基于树形结构的检索方法
CN104102704A (zh) 系统控件展示方法和装置
CN109670129A (zh) 一种将html网页转为适配mip格式的方法及装置
KR100912288B1 (ko) 문서 내 목차정보를 이용한 검색 시스템
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN102110108B (zh) 一种对小样文件的处理方法及装置
CN107451168B (zh) 基于词汇统计的档案分类系统及方法
CN104090875A (zh) 信息检索系统及方法
CN105426490A (zh) 一种基于树形结构的索引方法
CN102609606A (zh) 标识元件的方法及系统
CN105320716A (zh) 数字出版物的自动标注方法
CN101840401A (zh) 词典辅助查询系统及其方法
US20150095314A1 (en) Document search apparatus and method
CN115934884B (zh) 一种医保目录药品快速对照方法、装置、设备及存储介质
CN101089850A (zh) 利用比对单字位置关系进行全文检索的系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120516