CN102455997A - 元件名称提取系统及方法 - Google Patents
元件名称提取系统及方法 Download PDFInfo
- Publication number
- CN102455997A CN102455997A CN2010105214564A CN201010521456A CN102455997A CN 102455997 A CN102455997 A CN 102455997A CN 2010105214564 A CN2010105214564 A CN 2010105214564A CN 201010521456 A CN201010521456 A CN 201010521456A CN 102455997 A CN102455997 A CN 102455997A
- Authority
- CN
- China
- Prior art keywords
- element numbers
- character
- text document
- reads
- title
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种元件名称提取系统及方法,该方法包括步骤:从存储器中读取一个文本文档的全文;在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。利用本发明可以预先从专利文件的说明书中提取所有元件标号及每个元件标号所对应的元件名称。
Description
技术领域
本发明涉及一种元件名称提取系统及方法。
背景技术
一般而言,带有图档的文件,如专利文件,其图档中只会标注每个元件的标号,如果用户需要查看一个元件标号对应的元件名称,需要切换到说明书中去查找。这样既费时又费力,尤其是当一幅图中的元件标号数量很多时,会给用户阅览专利图档带来很大的不便。
发明内容
鉴于以上内容,有必要提供一种元件名称提取系统及方法,其可预先从文件的文字说明书中提取图档的所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称。
在一个实施例中,该方法包括如下步骤:
从存储器中读取一个文本文档的全文;
在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及
根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
前述方法可以由电子设备(如电脑)执行,其中该电子设备具有附带了图形用户界面(GUI)的显示屏幕、一个或多个处理器、存储器以及保存在存储器中用于执行这些方法的一个或多个模块、程序或指令集。在某些实施例中,该电子设备提供了包括无线通信在内的多种功能。
用于执行前述方法的指令可以包含在被配置成由一个或多个处理器执行的计算机程序产品中。
相较于现有技术,所述的元件名称提取系统及方法,其可预先从文件的文字说明书中提取图档的所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称,极大地方便了用户浏览文件的图档。
附图说明
图1是本发明元件名称提取系统较佳实施例的应用环境示意图。
图2是元件名称提取系统的功能模块图。
图3是本发明元件名称提取方法的较佳实施例的流程图。
图4是图3中步骤S2的具体流程图。
图5是图3中步骤S3的具体流程图。
图6是本发明中元件表的示意图。
主要元件符号说明
控制电脑 | 2 |
显示设备 | 20 |
输入设备 | 22 |
存储器 | 23 |
元件名称提取系统 | 24 |
处理器 | 25 |
元件表 | 30 |
文档读取模块 | 201 |
元件标号查找模块 | 202 |
元件名称提取模块 | 203 |
元件名称显示模块 | 204 |
具体实施方式
如图1所示,是本发明元件名称提取系统较佳实施例的应用环境示意图。本实施例以专利元件名称的提取为例进行说明,该元件名称提取系统24运行于控制电脑2中。该控制电脑2还包括通过数据总线相连的显示设备20、输入设备22、存储器23和处理器25。
所述存储器23用于存储专利文件的说明书及对应的图档资料,所述显示设备20用于显示说明书及对应的图档资料,所述输入设备22用于输入用户设置的各种数据(如光标移动数据等)。
所述元件名称提取系统24用于预先从专利文件的说明书中提取所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于专利图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称,具体过程以下描述。
在本实施例中,所述元件名称提取系统24可以被分割成一个或多个模块,所述一个或多个模块被存储在所述存储器23中并被配置成由一个或多个处理器(本实施例为一个处理器25)执行,以完成本发明。例如,参阅图2所示,所述元件名称提取系统24被分割成文档读取模块201、元件标号查找模块202、元件名称提取模块203和元件名称显示模块204。本发明所称的模块是完成一特定功能的程序段,比程序更适合于描述软件在控制电脑2中的执行过程。
如图3所示,是本发明元件名称提取方法的较佳实施例的流程图。
步骤S1,文档读取模块201从存储器23中读取一个专利文件的说明书全文。在本实施例中,所述说明书全文为文本文档格式,包括但不限于,Word、PDF、JPG、TIFF等格式中的文本文档。举例而言,如果说明书是一个PDF文件,则文档读取模块201从该PDF文件中读取所有的文本内容。
步骤S2,元件标号查找模块202在该说明书全文中查找所有的元件标号,并记录下每个元件标号在该说明书中的位置。具体流程参阅图4的说明。
步骤S3,元件名称提取模块203根据每个元件标号在该说明书中的位置,从该说明书全文中提取每个元件标号对应的元件名称,并创建一个元件表30(参阅图6所示)。具体流程参阅图5的说明。
在其它实施例中,该方法还进一步包括如下步骤:当用户将光标放置于专利图档的一个元件标号上时,元件名称显示模块204将从元件表30中查找该元件标号对应的元件名称,并将该元件名称显示在该元件标号旁边。
如图4所示,是图3中步骤S2的具体流程图。
步骤S20,元件标号查找模块202根据该说明书全文的长度依次读取每个字符。
步骤S21,元件标号查找模块202判断该读取的字符是否为结束符。如果该读取的字符是结束符,则流程结束。如果该读取的字符不是结束符,则执行步骤S22。在本实施例中,所述结束符为EOF(End of File)标志。
步骤S22,元件标号查找模块202判断该读取的字符是否为有效数字。如果该读取的字符为有效数字,则执行步骤S23;如果该读取的字符为无效数字,则返回步骤S20。在本实施例中,如果该读取的字符满足下列条件之一,则元件标号查找模块202判定该读取的字符为无效数字:(1)该读取的字符以0开头;(2)该读取的字符包括百分号“%”;(3)该读取的字符为小数;(4)该读取的字符前面包括字符“FIG.”、“FIGS.”、简体的“图”或繁体的“圖”等。在其它实施例中,用户也可以根据不同类型的文本文档,添加或修改上述规则。
步骤S23,元件标号查找模块202记录该数字为元件标号,同时记录下该元件标号在说明书中的位置,然后读取说明书中的下一个字符,直到整个说明书读取完毕。在本实施例中,所述元件标号的位置等于当前读取的字符的序号。举例而言,假设当前读取的是第100个字符,如果当前字符是有效数字,则该有效数字对应的元件标号在说明书中的位置为100。
如图5所示,是图3中步骤S3的具体流程图。
步骤S30,元件名称提取模块203根据元件标号的位置依次读取每个元件标号。
步骤S31,元件名称提取模块203从该元件标号的位置向前提取预设数量的字符串,并对所述提取的字符进行倒排序,得到一个排序后的字符串,并将读取的元件标号、提取的字符串及倒排序后的字符串存储在控制电脑2的暂存器中。在本实施例中,所述预设数量为10。
步骤S32,当所有元件标号读取完毕后,元件名称提取模块203根据元件标号对排序后的字符串进行分组。
在本实施例中,如果排序后的字符串包括预先设定格式的字符串,则将该排序后的字符串拆分成两个或两个以上的字符串,并根据元件标号进行分组。举例而言,对于英文专利说明书而言,如果排序后的字符串包括如下预先设定格式的字符串:xxx xx,yyyy yy68,70或xxx xx and yyyy yy 68,70,则将排序后的字符串拆分成:xxx xx 68,yyyy yy 70。例如,将a first flat surface and a second flatsurface,68,70拆分成a first flat surface 68,a second flat surface 70。
对于简体中文专利说明书而言,如果排序后的字符串包括如下预先设定格式的字符串:xxx xx和/与yyyy yy 68,70,则将排序后的字符串拆分成:xxx xx 68,yyyy yy 70。例如,将第一平面和第二平面68,70拆分成第一平面68和第二平面70。
步骤S33,元件名称提取模块203在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称。举例而言,假设元件标号为20的分组中包括两个数据:a connector body 20,the connector body 20,则最长的相同字符串为“connector body”。所以,元件名称提取模块203将“connectorbody”作为元件标号20对应的元件名称。
在本实施例中,如果某一元件标号的分组中只有一个数据,则从该元件标号的位置向前,在排序后的字符串中寻找第一个预设的修饰词,然后将该第一个预设的修饰词与该元件标号之间的字符提取出来,作为该元件标号对应的元件名称。如果没有找到预设的修饰词,则判定该元件标号无效。对于英文专利说明书而言,所述预设的修饰词可以是a,an,或the。对于简体中文专利说明书而言,所述修饰词可以是“一”,“第一”等。
举例而言,假设元件标号为60的分组只有一个数据:receive afriction reducing device,such as an O-ring 60,则元件名称提取模块203从60开始往前寻找到第一修饰词“an”,然后将“an”与“60”之间的字符“O-ring”提取出来,作为元件标号60对应的元件名称。
步骤S34,元件名称提取模块203根据每个元件的标号及该元件标号对应的元件名称创建一个元件表30(参阅图6所示)。
可以理解,本发明并不局限于在专利文件的说明书中提取元件名称,本领域技术人员可以很容易将本发明所述方法移植到在其它文本文档中提取元件名称,如专业期刊资料和学术论文资料等。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种元件名称提取方法,其特征在于,该方法包括如下步骤:
从存储器中读取一个文本文档的全文;
在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及
根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
2.如权利要求1所述的元件名称提取方法,其特征在于,所述元件标号在该文本文档中的位置等于当前读取的字符的序号。
3.如权利要求1所述的元件名称提取方法,其特征在于,所述在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置的步骤包括:
根据该文本文档全文的长度依次读取每个字符;
如果该读取的字符不是结束符,则判断该读取的字符是否为有效数字,如果该读取的字符为无效数字,则读取该文本文档的下一个字符;及
如果该读取的字符为有效数字,记录该数字为元件标号,同时记录下该元件标号在该文本文档中的位置,然后读取该文本文档的下一个字符,直到整个文本文档读取完毕。
4.如权利要求3所述的元件名称提取方法,其特征在于,如果该读取的字符满足下列条件之一,则判定该读取的字符为无效数字:(1)该读取的字符以0开头;(2)该读取的字符包括百分号“%”;(3)该读取的字符为小数;(4)该读取的字符前面包括字符“FIG.”、“FIGS.”或“图”。
5.如权利要求1所述的元件名称提取方法,其特征在于,所述从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表的步骤包括:
根据元件标号在该文本文档中的位置依次读取每个元件标号;
从该元件标号的位置向前提取预设数量的字符串,并对所述提取的字符进行倒排序,得到一个排序后的字符串;
当所有元件标号读取完毕后,根据元件标号对排序后的字符串进行分组;
在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称;及
根据每个元件的标号及该元件标号对应的元件名称创建一个元件表。
6.如权利要求5所述的元件名称提取方法,其特征在于,所述根据元件标号对排序后的字符串进行分组的步骤包括:如果排序后的字符串包括预先设定格式的字符串,则将该排序后的字符串拆分成两个或两个以上的字符串,并根据元件标号进行分组。
7.如权利要求5所述的元件名称提取方法,其特征在于,所述在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称的步骤包括:
如果一个元件标号的分组中只有一个数据,则从该元件标号的位置向前,在该元件标号排序后的字符串中寻找第一个预设的修饰词;
将该第一个预设的修饰词与该元件标号之间的字符提取出来,作为该元件标号对应的元件名称;及
如果没有找到预设的修饰词,则判定该元件标号无效。
8.如权利要求7所述的元件名称提取方法,其特征在于,如果该文本文档为英文,所述预设的修饰词为a,an,或the,如果该文本文档为简体中文,则所述修饰词为“一”或“第一”。
9.一种电脑,包括:
存储器;
一个或多个处理器;以及
一个或多个模块,所述一个或多个模块被存储在所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括:
文档读取模块,用于从存储器中读取一个文本文档的全文;
元件标号查找模块,用于在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及
元件标号提取模块,用于根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
10.如权利要求9所述的电脑,其特征在于,所述元件标号在该文本文档中的位置等于当前读取的字符的序号。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105214564A CN102455997A (zh) | 2010-10-27 | 2010-10-27 | 元件名称提取系统及方法 |
US13/049,908 US20120109638A1 (en) | 2010-10-27 | 2011-03-17 | Electronic device and method for extracting component names using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105214564A CN102455997A (zh) | 2010-10-27 | 2010-10-27 | 元件名称提取系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102455997A true CN102455997A (zh) | 2012-05-16 |
Family
ID=45997642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105214564A Pending CN102455997A (zh) | 2010-10-27 | 2010-10-27 | 元件名称提取系统及方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120109638A1 (zh) |
CN (1) | CN102455997A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514303A (zh) * | 2013-10-29 | 2014-01-15 | 苏州利驰电子商务有限公司 | 电气元件接线图识别方法及系统 |
CN109445900A (zh) * | 2018-11-13 | 2019-03-08 | 江苏省舜禹信息技术有限公司 | 用于图片显示的翻译方法和装置 |
CN109598649A (zh) * | 2018-12-20 | 2019-04-09 | 江苏省舜禹信息技术有限公司 | 一种专利文件的处理方法、装置及存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9223769B2 (en) | 2011-09-21 | 2015-12-29 | Roman Tsibulevskiy | Data processing systems, devices, and methods for content analysis |
CN104408269B (zh) * | 2014-12-17 | 2017-09-29 | 上海天华建筑设计有限公司 | 设计图纸拆分方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774833A (en) * | 1995-12-08 | 1998-06-30 | Motorola, Inc. | Method for syntactic and semantic analysis of patent text and drawings |
US20050210382A1 (en) * | 2002-03-14 | 2005-09-22 | Gaetano Cascini | System and method for performing functional analyses making use of a plurality of inputs |
US7716581B2 (en) * | 2000-02-29 | 2010-05-11 | Tran Bao Q | Patent optimizer |
Family Cites Families (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5182709A (en) * | 1986-03-31 | 1993-01-26 | Wang Laboratories, Inc. | System for parsing multidimensional and multidirectional text into encoded units and storing each encoded unit as a separate data structure |
US4965763A (en) * | 1987-03-03 | 1990-10-23 | International Business Machines Corporation | Computer method for automatic extraction of commonly specified information from business correspondence |
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
US5442742A (en) * | 1990-12-21 | 1995-08-15 | Apple Computer, Inc. | Method and apparatus for the manipulation of text on a computer display screen |
US5475587A (en) * | 1991-06-28 | 1995-12-12 | Digital Equipment Corporation | Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms |
US6339767B1 (en) * | 1997-06-02 | 2002-01-15 | Aurigin Systems, Inc. | Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing |
US5793381A (en) * | 1995-09-13 | 1998-08-11 | Apple Computer, Inc. | Unicode converter |
US6076088A (en) * | 1996-02-09 | 2000-06-13 | Paik; Woojin | Information extraction system and method using concept relation concept (CRC) triples |
JP3507611B2 (ja) * | 1996-03-01 | 2004-03-15 | 富士通株式会社 | Cadシステム |
US5778362A (en) * | 1996-06-21 | 1998-07-07 | Kdl Technologies Limted | Method and system for revealing information structures in collections of data items |
US5819265A (en) * | 1996-07-12 | 1998-10-06 | International Business Machines Corporation | Processing names in a text |
US6049811A (en) * | 1996-11-26 | 2000-04-11 | Petruzzi; James D. | Machine for drafting a patent application and process for doing same |
JPH11134399A (ja) * | 1997-10-24 | 1999-05-21 | Nec Informatec Systems Ltd | 特許出願用明細書作成システム、特許出願用明細書作成方法および特許出願用明細書作成用プログラムを記録した記録媒体 |
JP3429184B2 (ja) * | 1998-03-19 | 2003-07-22 | シャープ株式会社 | テキスト構造解析装置および抄録装置、並びにプログラム記録媒体 |
US6167370A (en) * | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
US8095581B2 (en) * | 1999-02-05 | 2012-01-10 | Gregory A Stobbs | Computer-implemented patent portfolio analysis method and apparatus |
US7890851B1 (en) * | 1999-03-19 | 2011-02-15 | Milton Jr Harold W | System for facilitating the preparation of a patent application |
US6601026B2 (en) * | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US7389239B1 (en) * | 1999-12-30 | 2008-06-17 | At&T Delaware Intellectual Property, Inc. | System and method for managing intellectual property |
GB2364141A (en) * | 2000-06-28 | 2002-01-16 | Peter David Hudson | System for producing a patent specification and application |
US6778986B1 (en) * | 2000-07-31 | 2004-08-17 | Eliyon Technologies Corporation | Computer method and apparatus for determining site type of a web site |
US20020107896A1 (en) * | 2001-02-02 | 2002-08-08 | Abraham Ronai | Patent application drafting assistance tool |
US7289962B2 (en) * | 2001-06-28 | 2007-10-30 | International Business Machines Corporation | Compressed list presentation for speech user interfaces |
US8041739B2 (en) * | 2001-08-31 | 2011-10-18 | Jinan Glasgow | Automated system and method for patent drafting and technology assessment |
US7197449B2 (en) * | 2001-10-30 | 2007-03-27 | Intel Corporation | Method for extracting name entities and jargon terms using a suffix tree data structure |
US20030098862A1 (en) * | 2001-11-06 | 2003-05-29 | Smartequip, Inc. | Method and system for building and using intelligent vector objects |
US7447624B2 (en) * | 2001-11-27 | 2008-11-04 | Sun Microsystems, Inc. | Generation of localized software applications |
JP2003167914A (ja) * | 2001-11-30 | 2003-06-13 | Fujitsu Ltd | マルチメディア情報検索方法、プログラム、記録媒体及びシステム |
US7315810B2 (en) * | 2002-01-07 | 2008-01-01 | Microsoft Corporation | Named entity (NE) interface for multiple client application programs |
US7536297B2 (en) * | 2002-01-22 | 2009-05-19 | International Business Machines Corporation | System and method for hybrid text mining for finding abbreviations and their definitions |
US7003516B2 (en) * | 2002-07-03 | 2006-02-21 | Word Data Corp. | Text representation and method |
US20040163034A1 (en) * | 2002-10-17 | 2004-08-19 | Sean Colbath | Systems and methods for labeling clusters of documents |
US20060107201A1 (en) * | 2002-11-08 | 2006-05-18 | Hon Hai Precision Ind. Co., Ltd. | System and method for displaying patent classification information |
US7102509B1 (en) * | 2003-01-11 | 2006-09-05 | Global Tel★Link Corporation | Computer interface system for tracking of radio frequency identification tags |
US20050005239A1 (en) * | 2003-07-03 | 2005-01-06 | Richards James L. | System and method for automatic insertion of cross references in a document |
US7720675B2 (en) * | 2003-10-27 | 2010-05-18 | Educational Testing Service | Method and system for determining text coherence |
US8046212B1 (en) * | 2003-10-31 | 2011-10-25 | Access Innovations | Identification of chemical names in text-containing documents |
WO2005048055A2 (en) * | 2003-11-07 | 2005-05-26 | Spore, Inc. | Patent claims analysis system and method |
US7587309B1 (en) * | 2003-12-01 | 2009-09-08 | Google, Inc. | System and method for providing text summarization for use in web-based content |
US20050216828A1 (en) * | 2004-03-26 | 2005-09-29 | Brindisi Thomas J | Patent annotator |
US7397464B1 (en) * | 2004-04-30 | 2008-07-08 | Microsoft Corporation | Associating application states with a physical object |
US7933763B2 (en) * | 2004-04-30 | 2011-04-26 | Mdl Information Systems, Gmbh | Method and software for extracting chemical data |
US7823061B2 (en) * | 2004-05-20 | 2010-10-26 | Wizpatent Pte Ltd | System and method for text segmentation and display |
US20060059413A1 (en) * | 2004-09-10 | 2006-03-16 | Tran Bao Q | Systems and methods for generating intellectual property |
US7996208B2 (en) * | 2004-09-30 | 2011-08-09 | Google Inc. | Methods and systems for selecting a language for text segmentation |
US7444589B2 (en) * | 2004-12-30 | 2008-10-28 | At&T Intellectual Property I, L.P. | Automated patent office documentation |
US7509318B2 (en) * | 2005-01-28 | 2009-03-24 | Microsoft Corporation | Automatic resource translation |
US7672833B2 (en) * | 2005-09-22 | 2010-03-02 | Fair Isaac Corporation | Method and apparatus for automatic entity disambiguation |
US8209201B1 (en) * | 2005-12-08 | 2012-06-26 | Hewlett-Packard Development Company, L.P. | System and method for correlating objects |
US8245136B2 (en) * | 2006-02-23 | 2012-08-14 | Olivier Fischer | Updating inserted text in a graphic file |
JP4872079B2 (ja) * | 2006-05-19 | 2012-02-08 | 国立大学法人長岡技術科学大学 | 文章更新量評価プログラム |
US8046364B2 (en) * | 2006-12-18 | 2011-10-25 | Veripat, LLC | Computer aided validation of patent disclosures |
US8606606B2 (en) * | 2007-01-03 | 2013-12-10 | Vistaprint Schweiz Gmbh | System and method for translation processing |
US7881937B2 (en) * | 2007-05-31 | 2011-02-01 | International Business Machines Corporation | Method for analyzing patent claims |
US20090019041A1 (en) * | 2007-07-11 | 2009-01-15 | Marc Colando | Filename Parser and Identifier of Alternative Sources for File |
US9058337B2 (en) * | 2007-10-22 | 2015-06-16 | Apple Inc. | Previewing user interfaces and other aspects |
US8612853B2 (en) * | 2007-11-15 | 2013-12-17 | Harold W. Milton, Jr. | System for automatically inserting reference numerals in a patent application |
US8135574B2 (en) * | 2007-11-15 | 2012-03-13 | Weikel Bryan T | Creating and displaying bodies of parallel segmented text |
US8412516B2 (en) * | 2007-11-27 | 2013-04-02 | Accenture Global Services Limited | Document analysis, commenting, and reporting system |
US8521512B2 (en) * | 2008-04-30 | 2013-08-27 | Deep Sky Concepts, Inc | Systems and methods for natural language communication with a computer |
US8117024B2 (en) * | 2008-05-01 | 2012-02-14 | My Perfect Gig, Inc. | System and method for automatically processing candidate resumes and job specifications expressed in natural language into a normalized form using frequency analysis |
JP5188260B2 (ja) * | 2008-05-08 | 2013-04-24 | キヤノン株式会社 | 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体 |
US8682646B2 (en) * | 2008-06-04 | 2014-03-25 | Microsoft Corporation | Semantic relationship-based location description parsing |
US8135580B1 (en) * | 2008-08-20 | 2012-03-13 | Amazon Technologies, Inc. | Multi-language relevance-based indexing and search |
US8489388B2 (en) * | 2008-11-10 | 2013-07-16 | Apple Inc. | Data detection |
WO2010105115A2 (en) * | 2009-03-11 | 2010-09-16 | The Board Of Regents Of The University Of Texas System | Audience response system |
US8073718B2 (en) * | 2009-05-29 | 2011-12-06 | Hyperquest, Inc. | Automation of auditing claims |
US8271525B2 (en) * | 2009-10-09 | 2012-09-18 | Verizon Patent And Licensing Inc. | Apparatuses, methods and systems for a smart address parser |
US8515969B2 (en) * | 2010-02-19 | 2013-08-20 | Go Daddy Operating Company, LLC | Splitting a character string into keyword strings |
US8626236B2 (en) * | 2010-10-08 | 2014-01-07 | Blackberry Limited | System and method for displaying text in augmented reality |
US8620836B2 (en) * | 2011-01-10 | 2013-12-31 | Accenture Global Services Limited | Preprocessing of text |
CN102609606A (zh) * | 2011-01-25 | 2012-07-25 | 鸿富锦精密工业(深圳)有限公司 | 标识元件的方法及系统 |
CN102737012B (zh) * | 2011-04-06 | 2015-09-30 | 赛恩倍吉科技顾问(深圳)有限公司 | 文本信息对比方法及系统 |
US20130085745A1 (en) * | 2011-10-04 | 2013-04-04 | Salesforce.Com, Inc. | Semantic-based approach for identifying topics in a corpus of text-based items |
CN103136187A (zh) * | 2011-12-01 | 2013-06-05 | 鸿富锦精密工业(深圳)有限公司 | 专利核驳信息提取方法及系统 |
-
2010
- 2010-10-27 CN CN2010105214564A patent/CN102455997A/zh active Pending
-
2011
- 2011-03-17 US US13/049,908 patent/US20120109638A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774833A (en) * | 1995-12-08 | 1998-06-30 | Motorola, Inc. | Method for syntactic and semantic analysis of patent text and drawings |
US7716581B2 (en) * | 2000-02-29 | 2010-05-11 | Tran Bao Q | Patent optimizer |
US20050210382A1 (en) * | 2002-03-14 | 2005-09-22 | Gaetano Cascini | System and method for performing functional analyses making use of a plurality of inputs |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514303A (zh) * | 2013-10-29 | 2014-01-15 | 苏州利驰电子商务有限公司 | 电气元件接线图识别方法及系统 |
CN103514303B (zh) * | 2013-10-29 | 2017-08-11 | 苏州利驰电子商务有限公司 | 电气元件接线图识别方法及系统 |
CN109445900A (zh) * | 2018-11-13 | 2019-03-08 | 江苏省舜禹信息技术有限公司 | 用于图片显示的翻译方法和装置 |
CN109445900B (zh) * | 2018-11-13 | 2021-12-10 | 江苏省舜禹信息技术有限公司 | 用于图片显示的翻译方法和装置 |
CN109598649A (zh) * | 2018-12-20 | 2019-04-09 | 江苏省舜禹信息技术有限公司 | 一种专利文件的处理方法、装置及存储介质 |
CN109598649B (zh) * | 2018-12-20 | 2021-12-10 | 江苏省舜禹信息技术有限公司 | 一种专利文件的处理方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20120109638A1 (en) | 2012-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109062874B (zh) | 财政数据的获取方法、终端设备及介质 | |
US20090265313A1 (en) | Automatically Extracting Data From Semi-Structured Documents | |
CN103455475B (zh) | 排版方法、设备及系统 | |
CN102270206A (zh) | 一种有效网页内容的抓取方法及装置 | |
CN102455997A (zh) | 元件名称提取系统及方法 | |
CN102959538B (zh) | 给文档编索引 | |
WO2020056977A1 (zh) | 知识点推送方法、装置及计算机可读存储介质 | |
EP3016003A1 (en) | Search method, apparatus and device and non-volatile computer storage medium | |
CN109408777A (zh) | 基于快速浏览的文档处理方法、装置和文档服务器 | |
CN115687655A (zh) | 一种基于pdf文档的知识图谱构建方法、系统、设备及存储介质 | |
CN105404677A (zh) | 一种基于树形结构的检索方法 | |
CN104102704A (zh) | 系统控件展示方法和装置 | |
CN109670129A (zh) | 一种将html网页转为适配mip格式的方法及装置 | |
KR100912288B1 (ko) | 문서 내 목차정보를 이용한 검색 시스템 | |
CN114297143A (zh) | 一种搜索文件的方法、显示文件的方法、装置及移动终端 | |
CN102110108B (zh) | 一种对小样文件的处理方法及装置 | |
CN107451168B (zh) | 基于词汇统计的档案分类系统及方法 | |
CN104090875A (zh) | 信息检索系统及方法 | |
CN105426490A (zh) | 一种基于树形结构的索引方法 | |
CN102609606A (zh) | 标识元件的方法及系统 | |
CN105320716A (zh) | 数字出版物的自动标注方法 | |
CN101840401A (zh) | 词典辅助查询系统及其方法 | |
US20150095314A1 (en) | Document search apparatus and method | |
CN115934884B (zh) | 一种医保目录药品快速对照方法、装置、设备及存储介质 | |
CN101089850A (zh) | 利用比对单字位置关系进行全文检索的系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120516 |