CN106021197B - Dwg格式文件的翻译系统及翻译方法 - Google Patents

Dwg格式文件的翻译系统及翻译方法 Download PDF

Info

Publication number
CN106021197B
CN106021197B CN201610361626.4A CN201610361626A CN106021197B CN 106021197 B CN106021197 B CN 106021197B CN 201610361626 A CN201610361626 A CN 201610361626A CN 106021197 B CN106021197 B CN 106021197B
Authority
CN
China
Prior art keywords
translated
formatted file
text data
translation
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610361626.4A
Other languages
English (en)
Other versions
CN106021197A (zh
Inventor
席斌
李明
王兴强
张马成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Ue Information Technology Co ltd
Original Assignee
CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd filed Critical CHENGDU URELITE INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610361626.4A priority Critical patent/CN106021197B/zh
Publication of CN106021197A publication Critical patent/CN106021197A/zh
Application granted granted Critical
Publication of CN106021197B publication Critical patent/CN106021197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了DWG格式文件的数据解析系统及解析方法,该系统直接转换DWG格式文件为DXF格式文件,利用DXF格式文件的编码特性,对DXF格式文件内的文本信息完成自动抽取,而翻译人员仅仅需要完成的工作是直接对文本信息进行翻译即可,无需其他复杂操作,设备也不需要安装Auto CAD软件,避免Auto CAD软件的付费,降低翻译成本。

Description

DWG格式文件的翻译系统及翻译方法
技术领域
本发明涉及文档翻译领域技术,尤其涉及一种DWG格式文件的翻译系统及翻译方法。
背景技术
DWG格式文件是AutoCAD创立的一种图纸保存格式,已经成为二维CAD的标准格式,很多其他CAD为了兼容AutoCAD,也直接使用DWG作为默认工作文件。在人们制作图纸时除了图形外还设置有很多标注性或说明性的文本信息在图纸中,在信息交互时,往往由于语言的差异,需要对DWG格式文件内的文本信息进行翻译处理后重新导出,现有技术对DWG格式文件的翻译处理方式为:翻译人员需要安装Auto CAD软件,然后导入需要翻译的DWG格式文件,然后使用该软件从DWG格式文件中把需要翻译的文本数据摘取出来,再对文字进行翻译,在翻译完成后使用Auto CAD软件对对应的译文回填至图纸中。整个工序对用户的生产成本和生产时间有着较大的影响,尤其是译前文本数据的摘取和译后回填的过程操作非常繁琐,占用大量人力资源,还会增加错误产生的概率,给DWG图纸的翻译工作带来不便。
发明内容
本发明的目的在于提供DWG格式文件的翻译系统及翻译方法,该系统直接转换DWG格式文件为DXF格式文件,利用DXF格式文件的编码特性,对DXF格式文件内的文本信息完成自动抽取,而翻译人员仅仅需要完成的工作是直接对文本信息进行翻译即可,无需其他复杂操作,设备也不需要安装Auto CAD软件,避免Auto CAD软件的付费,降低翻译成本。
本发明通过下述技术方案实现:
DWG格式文件的翻译系统及翻译方法,
包括:用于接收DWG格式文件的装置,
用于将DWG格式文件转换为DXF格式文件的装置,
用于识别和提取DXF格式文件中待翻译文本数据的装置,
用于识别和提取DXF文件中待翻译文本数据的位置信息的装置,
用于存储待翻译文本数据和待翻译文本数据的位置信息的装置。
所述解析系统的工作原理为:DXF 格式文件是Autodesk公司开发的用于AutoCAD与其它软件之间进行CAD数据交换的CAD数据文件格式,可以通过现有技术直接将DWG格式文件转换为DXF格式文件,DXF是一种开放的矢量数据格式,DXF格式文件为ASCII格式,DXF格式文件是由很多的“代码”和“值”组成的“数据对”构造而成,这里的代码称为“组码”(group code),指定其后的值的类型和用途。每个组码和值必须为单独的一行的。DXF文件被组织成为多个“段”(section),每个段以组码“0”和字符串开头,紧接着是组码和表示段名的字符串。段的中间,可以使用组码和值定义段中的元素。本发明通过DXF 格式文件中的“组码”和“组码值”来识别哪些是待翻译文本数据,然后可以抽取里面的待翻译文本数据及待翻译文本数据的位置信息及其他信息(其他信息是指:例如文本数据的大小、字体类型、颜色等,其他信息不做强制要求而抽取),达到利用机器抽取待翻译文本数据的目的,降低人工成本,降低抽取数据出错概率。
在完成上述对解析DWG格式文件后,我们只需要根据解析出的待翻译文本数据,对这些待翻译文本数据进行翻译形成与待翻译文本数据对应的译文数据,最终再利用待翻译文本数据的位置信息将译文数据回填到DXF格式文件中,再对具有译文数据的DXF格式文件进行转换形成具有译文数据的CAD数据文件格式导出。
优选的,所述DXF格式文件为ACS II码形式的DXF格式文件。
优选的,所述DWG格式文件为具有文本信息的DWG格式文件。一般的,针对于已经将文本信息做过转曲处理的图纸(将文本信息转换成图形信息),本方法和系统不能做出识别和随后的操作,针对转曲处理后的图纸可以将这类图纸转为具备文本信息的DWG格式文件。
优选的,还包括用于将DWG格式文件转换成SVG格式文件供在web页中预览图纸使用的预览图纸装置。可以通过调用DWG to SVG Converter的方式将DWG格式文件转换成SVG格式供在翻译过程中预览图纸使用。
优选的,预览图纸装置将SVG格式文件嵌入HTML页面用以实现在web预览图纸。
所述DWG格式文件为具有文本信息的DWG格式文件。
识别和提取DXF格式文件中待翻译文本数据的方式为:逐行扫描DXF格式文件中的组码及组码对应的组码值,在扫描过程中识别和提取表示待翻译文本数据的组码值。
识别和提取DXF文件中待翻译文本数据的位置信息的方式为:逐行扫描DXF格式文件中的组码及组码对应的组码值,在扫描过程中识别和提取表示待翻译文本数据的位置信息的组码值。
DWG格式文件中待翻译文本数据的解析方法,包括以下步骤:
调取DWG格式文件的步骤;
将DWG格式文件转换为DXF格式文件的格式转换步骤;
逐行扫描DXF格式文件中的组码及组码对应的组码值的步骤,在扫描过程中识别和提取表示待翻译文本数据的组码值,同时识别和提取表示与待翻译文本数据对应的位置信息的组码值,以此获得待翻译文本数据、待翻译文本数据的位置信息;
将待翻译文本数据和待翻译文本数据的位置信息存储的步骤。
还包括以下步骤:获得待翻译文本数据时,同时将待翻译文本数据在DXF格式文件中的位置做上标记并标记待翻译文本数据的文本数据类型。
根据上述解析系统,我们还设计了DWG格式文件翻译数据的处理系统,
包括:用于接收DWG格式文件的装置,
用于将DWG格式文件转换为DXF格式文件的装置,
用于识别和提取DXF格式文件中待翻译文本数据的装置,
用于识别和提取DXF文件中待翻译文本数据的位置信息的装置,
用于存储待翻译文本数据和待翻译文本数据的位置信息的装置,
还包括:用于调用待翻译文本数据至翻译装置的装置,
用于翻译的翻译装置,翻译装置接收到待翻译文本数据后通过人工翻译或机器翻译生成与待翻译文本数据对应的译文数据,
用于存储译文数据的装置,
还包括:用于获取待翻译文本数据、待翻译文本数据的位置信息、与待翻译文本数据对应的译文数据、DXF格式文件、并将待翻译文本数据对应的译文数据依据待翻译文本数据的位置信息写入DXF格式文件中的装置,
用于将写入译文数据的DXF格式文件转换成具有译文数据的DWG格式文件的装置,
用于导出具有译文数据的DWG格式文件的装置。
本发明上述DWG格式文件翻译数据的处理系统的设计原理为:利用DXF格式文件,完成对DWG格式文件中的待翻译文本数据的抽取工作,DXF 格式文件是Autodesk公司开发的用于AutoCAD与其它软件之间进行CAD数据交换的CAD数据文件格式,DXF是一种开放的矢量数据格式,DXF 格式文件分为ASCII格式和二进制格式,DXF 格式文件是由很多的“代码”和“值”组成的“数据对”构造而成,这里的代码称为“组码”(group code),指定其后的值的类型和用途。每个组码和值必须为单独的一行的。DXF文件被组织成为多个“段”(section),每个段以组码“0”和字符串开头,紧接着是组码和表示段名的字符串。段的中间,可以使用组码和值定义段中的元素。
本发明通过DXF 格式文件中的“组码”和“组码值”来识别哪些是待翻译文本数据,然后可以抽取里面的待翻译文本数据及待翻译文本数据的位置信息及其他信息(例如文本数据的大小、字体类型、颜色等,其他信息不做强制要求而抽取),然后对这些待翻译文本数据进行翻译形成与待翻译文本数据对应的译文数据,最终再利用待翻译文本数据的位置信息将译文数据回填到DXF格式文件中,再对具有译文数据的DXF格式文件进行转换形成具有译文数据的CAD数据文件格式导出。
优选的,导出具有译文数据的DWG格式文件的装置输出两种具有译文数据的DWG格式文件,第一种是具有纯译文的DWG格式文件,第二种是具有译文和具有待翻译文本数据的DWG格式文件。
DWG格式文件翻译数据的处理方法,包括以下步骤:
解析步骤:将DWG格式文件转换为DXF格式文件后,提取DXF格式文件中的待翻译文本数据和待翻译文本数据的位置信息;
翻译步骤:将待翻译文本数据调用到预定翻译装置中,通过人工翻译或机器翻译生成与待翻译文本数据对应的译文数据;
译文写入步骤:将译文数据依据对应的待翻译文本数据的位置信息写入DXF格式文件中对应的位置,使得DXF格式文件为具有译文数据的DXF格式文件;
译后DWG格式文件导出步骤:将具有译文数据的DXF格式文件转换成具有译文数据的DWG格式文件并导出。
优选的,译文写入步骤具体为:采用替换法,将待翻译文本数据直接替换成译文数据。
优选的,译文写入步骤具体为:保留待翻译文本数据,以待翻译文本数据的位置信息为参考值采用分行写入法,将译文写入。
本发明与现有技术相比,具有如下的优点和有益效果:能提高对DWG格式文件的翻译效率,不需要打开Auto CAD软件,降低翻译成本,无需人工提取待翻译文本数据,降低了劳动强度,避免提取待翻译文本数据出错。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1是提取翻译文本数据和待翻译文本数据的位置信息的流程示意图。
图2是DXF格式文件的组码和组码值的示例图。
图3是翻译过程的流程示意图。
图4是生成翻译后DWG格式文件的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1:
DWG格式文件的翻译系统及翻译方法,
包括:用于接收DWG格式文件的装置,
用于将DWG格式文件转换为DXF格式文件的装置,
用于识别和提取DXF格式文件中待翻译文本数据的装置,
用于识别和提取DXF文件中待翻译文本数据的位置信息的装置,
用于存储待翻译文本数据和待翻译文本数据的位置信息的装置。
所述解析系统的工作原理为:DXF 格式文件是Autodesk公司开发的用于AutoCAD与其它软件之间进行CAD数据交换的CAD数据文件格式,可以通过现有技术直接将DWG格式文件转换为DXF格式文件,DXF是一种开放的矢量数据格式,DXF格式文件为ASCII格式,DXF格式文件是由很多的“代码”和“值”组成的“数据对”构造而成,这里的代码称为“组码”(group code),指定其后的值的类型和用途。每个组码和值必须为单独的一行的。DXF文件被组织成为多个“段”(section),每个段以组码“0”和字符串开头,紧接着是组码和表示段名的字符串。段的中间,可以使用组码和值定义段中的元素。本发明通过DXF 格式文件中的“组码”和“组码值”来识别哪些是待翻译文本数据,然后可以抽取里面的待翻译文本数据及待翻译文本数据的位置信息及其他信息(其他信息是指:例如文本数据的大小、字体类型、颜色等,其他信息不做强制要求而抽取),达到利用机器抽取待翻译文本数据的目的,降低人工成本,降低抽取数据出错概率。
在完成上述对解析DWG格式文件后,我们只需要根据解析出的待翻译文本数据,对这些待翻译文本数据进行翻译形成与待翻译文本数据对应的译文数据,最终再利用待翻译文本数据的位置信息将译文数据回填到DXF格式文件中,再对具有译文数据的DXF格式文件进行转换形成具有译文数据的CAD数据文件格式导出。
优选的,所述DXF格式文件为ACS II码形式的DXF格式文件。
优选的,所述DWG格式文件为具有文本信息的DWG格式文件。一般的,针对于已经将文本信息做过转曲处理的图纸(将文本信息转换成图形信息),本方法和系统不能做出识别和随后的操作,针对转曲处理后的图纸可以将这类图纸转为具备文本信息的DWG格式文件。
优选的,还包括用于将DWG格式文件转换成SVG格式文件供在web页中预览图纸使用的预览图纸装置。可以通过调用DWG to SVG Converter的方式将DWG格式文件转换成SVG格式供在翻译过程中预览图纸使用。
优选的,预览图纸装置将SVG格式文件嵌入HTML页面用以实现在web预览图纸。
所述DWG格式文件为具有文本信息的DWG格式文件。
识别和提取DXF格式文件中待翻译文本数据的方式为:逐行扫描DXF格式文件中的组码及组码对应的组码值,在扫描过程中识别和提取表示待翻译文本数据的组码值。
识别和提取DXF文件中待翻译文本数据的位置信息的方式为:逐行扫描DXF格式文件中的组码及组码对应的组码值,在扫描过程中识别和提取表示待翻译文本数据的位置信息的组码值。
实施例2:
如图1所示,DWG格式文件中待翻译文本数据的解析方法,包括以下步骤:
调取DWG格式文件的步骤;
将DWG格式文件转换为DXF格式文件的格式转换步骤;
逐行扫描DXF格式文件中的组码及组码对应的组码值的步骤,在扫描过程中识别和提取表示待翻译文本数据的组码值,同时识别和提取表示与待翻译文本数据对应的位置信息的组码值,以此获得待翻译文本数据、待翻译文本数据的位置信息;
将待翻译文本数据和待翻译文本数据的位置信息存储的步骤。
如图1和图2,在解析过程中,将DWG格式文件转换为DXF格式文件后,而DXF格式文件的由组码和组码值构成,如图2所示:图2中的代码展示了DXF格式文件如何组织一个单行文本的数据(组码和组码值)。在解析DXF格式文件时,逐行扫描DXF格式文件内容,如图2所示,当读取到“0,TEXT”这对组码和组码值时,可以判定正在读取的数据是表示一个单行文本,当读取到 “1”这个组码时得知该组码的值“MINISTERIO DE PLANIFICACI??N FEDERAL,INVERSI??N”为程序需要提取的待翻译文本数据,在提取待翻译文本数据的同时在系统中的特定数据结构中保存原文数据的在整个DXF文件的位置信息,从图2中可以获得所示待翻译文本数据的位置信息为“坐标为(-153.5092862294951,579.433621858247)、(-153.5092862294951,581.4336218582471)”,以此获得待翻译文本数据及待翻译文本数据的位置信息。最后在遇到第二个100,AcDbText组码和组码值时结束这段单行文本的读取操作。需要时可以也可以获取待翻译文本数据的类型信息。类型信息一般指待翻译文本数据的大小、颜色、字体等文本特性。最后,还包括以下步骤:获得待翻译文本数据时,同时将待翻译文本数据在DXF格式文件中的位置做上标记并标记待翻译文本数据的文本数据类型,即将从DXF文件中获取的待翻译文本数据、待翻译文本数据的位置信息保存至数据库。上述操作完成即完成解析步骤。
实施例3:
根据实施例1实现DWG格式文件翻译数据的处理系统,
包括:用于接收DWG格式文件的装置,
用于将DWG格式文件转换为DXF格式文件的装置,
用于识别和提取DXF格式文件中待翻译文本数据的装置,
用于识别和提取DXF文件中待翻译文本数据的位置信息的装置,
用于存储待翻译文本数据和待翻译文本数据的位置信息的装置,
还包括:用于调用待翻译文本数据至翻译装置的装置,
用于翻译的翻译装置,翻译装置接收到待翻译文本数据后通过人工翻译或机器翻译生成与翻译文本数据对应的译文数据,
用于存储译文数据的装置,
还包括:用于获取待翻译文本数据、待翻译文本数据的位置信息、与待翻译文本数据对应的译文数据、DXF格式文件、并将待翻译文本数据对应的译文数据依据待翻译文本数据的位置信息写入DXF格式文件中的装置,
用于将写入译文数据的DXF格式文件转换成具有译文数据的DWG格式文件的装置,
用于导出具有译文数据的DWG格式文件的装置。
本发明上述方案的设计原理为:利用DXF格式文件,完成对DWG格式文件中的待翻译文本数据的抽取工作,DXF 格式文件是Autodesk公司开发的用于AutoCAD与其它软件之间进行CAD数据交换的CAD数据文件格式,DXF是一种开放的矢量数据格式,DXF 格式文件分为ASCII格式和二进制格式,DXF 格式文件是由很多的“代码”和“值”组成的“数据对”构造而成,这里的代码称为“组码”(group code),指定其后的值的类型和用途。每个组码和值必须为单独的一行的。DXF文件被组织成为多个“段”(section),每个段以组码“0”和字符串开头,紧接着是组码和表示段名的字符串。段的中间,可以使用组码和值定义段中的元素。
本发明通过DXF 格式文件中的“组码”和“组码值”来识别哪些是待翻译文本数据,然后可以抽取里面的待翻译文本数据及待翻译文本数据的位置信息及其他信息(例如文本数据的大小、字体类型、颜色等,其他信息不做强制要求而抽取),然后对这些待翻译文本数据进行翻译形成与待翻译文本数据对应的译文数据,最终再利用待翻译文本数据的位置信息将译文数据回填到DXF格式文件中,再对具有译文数据的DXF格式文件进行转换形成具有译文数据的CAD数据文件格式导出。
优选的,所述DXF格式文件为ACS II码形式的DXF格式文件。
优选的,所述DWG格式文件为具有文本信息的DWG格式文件。一般的,针对于已经将文本信息做过转曲处理的图纸(将文本信息转换成图形信息),本方法和系统不能做出识别和随后的操作,针对转曲处理后的图纸可以将这类图纸转为具备文本信息的DWG格式文件。
优选的,还包括用于将DWG格式文件转换成SVG格式文件供在web页中预览图纸使用的预览图纸装置。可以通过调用DWG to SVG Converter的方式将DWG格式文件转换成SVG格式供在翻译过程中预览图纸使用。
优选的,预览图纸装置将SVG格式文件嵌入HTML页面用以实现在web预览图纸。
优选的,所述的翻译装置的翻译过程都是在web上进行。
优选的,导出具有译文数据的DWG格式文件的装置输出两种具有译文数据的DWG格式文件,第一种是具有纯译文的DWG格式文件,第二种是具有译文和具有待翻译文本数据的DWG格式文件。
实施例4:
如图1-图4所示,DWG格式文件翻译数据的处理方法,包括以下步骤:
解析步骤:将DWG格式文件转换为DXF格式文件后,提取DXF格式文件中的待翻译文本数据和待翻译文本数据的位置信息;
翻译步骤:将待翻译文本数据调用到预定翻译装置中,通过人工翻译或机器翻译生成与待翻译文本数据对应的译文数据;
译文写入步骤:将译文数据依据对应的待翻译文本数据的位置信息写入DXF格式文件中对应的位置,使得DXF格式文件为具有译文数据的DXF格式文件;
译后DWG格式文件导出步骤:将具有译文数据的DXF格式文件转换成具有译文数据的DWG格式文件并导出。
具体的来说:
如图1、图2所示,
在解析步骤中,将DWG格式文件转换为DXF格式文件后,而DXF格式文件的由组码和组码值构成,如图2所示:图2中的代码展示了DXF格式文件如何组织一个单行文本的数据(组码和组码值)。
在解析DXF格式文件时,逐行扫描DXF格式文件内容,如图2所示,当读取到“0,TEXT”这对组码和组码值时,可以判定正在读取的数据是表示一个单行文本,当读取到 “1”这个组码时得知该组码的值“MINISTERIO DE PLANIFICACI??N FEDERAL, INVERSI??N”为程序需要提取的待翻译文本数据,在提取待翻译文本数据的同时在系统中的特定数据结构中保存原文数据的在整个DXF文件的位置信息,从图2中可以获得所示待翻译文本数据的位置信息为“坐标为(-153.5092862294951,579.433621858247)、(-153.5092862294951,581.4336218582471)”,以此获得待翻译文本数据及待翻译文本数据的位置信息。最后在遇到第二个100,AcDbText组码和组码值时结束这段单行文本的读取操作。需要时可以也可以获取待翻译文本数据的类型信息。类型信息一般指待翻译文本数据的大小、颜色、字体等文本特性。
最后,将从DXF文件中获取的待翻译文本数据、待翻译文本数据的位置信息保存至数据库。上述操作完成即完成解析步骤。
如图3所示,接着进行翻译操作,将待翻译文本数据,即“MINISTERIO DEPLANIFICACI??N FEDERAL, INVERSI??N”调取出来至到预定翻译装置中,通过人工翻译或机器翻译生成与待翻译文本数据对应的译文数据;该待翻译文本数据对应的译文数据为“联邦卫生部规划,投资”(这里是中文译文数据,也可以翻译成其他语种)。最终存储上述译文数据,同时也建立好上述译文数据与对应待翻译文本数据的关系。至此即可完成翻译操作。
如图4所示,首先获得待翻译文本数据-“MINISTERIO DE PLANIFICACI??NFEDERAL, INVERSI??N”、译文数据-“联邦卫生部规划,投资”、待翻译文本数据的位置信息-“坐标为(-153.5092862294951,579.433621858247)、(-153.5092862294951,581.4336218582471)”,将译文数据-“联邦卫生部规划,投资”依照待翻译文本数据的位置信息-“坐标为(-153.5092862294951,579.433621858247)、(-153.5092862294951,581.4336218582471)”填入到DXF格式文件中,获得了具有“联邦卫生部规划,投资”的DXF格式文件,最终将具有“联邦卫生部规划,投资”的DXF格式文件转换成具有“联邦卫生部规划,投资”的DWG格式文件并导出。至此就完成了译文的写入和导出。
实施例5:本实施例与实施例4的区别在于:优选的,译文写入步骤具体为:采用替换法,将待翻译文本数据直接替换成译文数据。举例说明:替换法是指将译文数据直接按照待翻译文本数据的位置信息写入到DXF格式文件中,在DXF格式文件中没有待翻译文本数据,最终导出的的DWG格式文件中也没有待翻译文本数据。
实施例6:本实施例与实施例4的区别在于:优选的,译文写入步骤具体为:保留待翻译文本数据,以待翻译文本数据的位置信息为参考值采用分行写入法,将译文写入。上述操作的说明:分行写入法是指先按照待翻译文本数据的位置信息计算分行后的位置信息,将译文数据直接按照分行后的位置信息写入到DXF格式文件中,在DXF格式文件中有待翻译文本数据、也有译文数据,最终导出的DWG格式文件中有待翻译文本数据、也有译文数据。举例说明,以待翻译文本数据“China”为例,“China”的位置信息为“起始坐标(X1,Y1),终点坐标(X2,Y2)”,我们可以先计算分行后的位置信息为“起始坐标(Xf1,Yf1),终点坐标(Xf2,Yf2)”,然后我们将译文数据“中国”按照上述分行后的位置信息写到DXF格式文件中,这样就完成了上述译文的写入,而原有的待翻译文本数据的依旧在DXF格式文件中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.DWG格式文件的翻译系统,其特征在于,
包括:用于调用待翻译文本数据至翻译装置的装置;
用于翻译的翻译装置,翻译装置接收到待翻译文本数据后通过人工翻译或机器翻译生成与待翻译文本数据对应的译文数据;
用于存储译文数据的装置,还包括用于获取待翻译文本数据、待翻译文本数据的位置信息、与待翻译文本数据对应的译文数据、DXF格式文件、并将待翻译文本数据对应的译文数据依据待翻译文本数据的位置信息写入DXF格式文件中的装置;
上述翻译装置生成web界面,将待翻译文本数据在web界面显示,根据与待翻译文本数据一一映射关系生成译文数据写入界面,在译文数据写入界面输入译文数据后,获得与待翻译文本数据形成一一映射关系的译文数据。
2.根据权利要求1所述的DWG格式文件的翻译系统,其特征在于,待翻译文本数据来源于解析装置,
上述解析装置包括:
用于接收DWG格式文件的装置,
用于将DWG格式文件转换为DXF格式文件的装置,
用于识别和提取DXF格式文件中待翻译文本数据的装置,
用于识别和提取DXF文件中待翻译文本数据的位置信息的装置,
用于存储待翻译文本数据和待翻译文本数据的位置信息的装置。
3.根据权利要求2所述的DWG格式文件的翻译系统,其特征在于,所述DXF格式文件为ACS II码形式的DXF格式文件。
4.根据权利要求2所述DWG格式文件的翻译系统,其特征在于,所述DWG格式文件为具有文本信息的DWG格式文件。
5.根据权利要求2所述的DWG格式文件的翻译系统,其特征在于,还包括用于将DWG格式文件转换成SVG格式文件供在web页中预览图纸使用的预览图纸装置。
6.根据权利要求5所述的DWG格式文件的翻译系统,其特征在于,预览图纸装置将SVG格式文件嵌入HTML页面用以实现在web预览图纸。
7.根据权利要求2所述的DWG格式文件的翻译系统,其特征在于,识别和提取DXF格式文件中待翻译文本数据的方式为:逐行扫描DXF格式文件中的组码及组码对应的组码值,在扫描过程中识别和提取表示待翻译文本数据的组码值。
8.根据权利要求2所述的DWG格式文件的翻译系统,其特征在于,识别和提取DXF文件中待翻译文本数据的位置信息的方式为:逐行扫描DXF格式文件中的组码及组码对应的组码值,在扫描过程中识别和提取表示待翻译文本数据的位置信息的组码值。
9.DWG格式文件的翻译系统的翻译方法,其特征在于:包括以下步骤:
调取DWG格式文件的步骤;
将DWG格式文件转换为DXF格式文件的格式转换步骤;
逐行扫描DXF格式文件中的组码及组码对应的组码值的步骤,在扫描过程中识别和提取表示待翻译文本数据的组码值,同时识别和提取表示与待翻译文本数据对应的位置信息的组码值,以此获得待翻译文本数据、待翻译文本数据的位置信息;
将待翻译文本数据和待翻译文本数据的位置信息存储的步骤;
翻译的步骤,将待翻译文本数据调用到预定翻译装置中,通过人工翻译或机器翻译生成与待翻译文本数据对应的译文数据;
译文写入的步骤,将译文数据依据对应的待翻译文本数据的位置信息写入DXF格式文件中对应的位置,使得DXF格式文件为具有译文数据的DXF格式文件。
CN201610361626.4A 2016-05-27 2016-05-27 Dwg格式文件的翻译系统及翻译方法 Active CN106021197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610361626.4A CN106021197B (zh) 2016-05-27 2016-05-27 Dwg格式文件的翻译系统及翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610361626.4A CN106021197B (zh) 2016-05-27 2016-05-27 Dwg格式文件的翻译系统及翻译方法

Publications (2)

Publication Number Publication Date
CN106021197A CN106021197A (zh) 2016-10-12
CN106021197B true CN106021197B (zh) 2019-04-23

Family

ID=57094171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610361626.4A Active CN106021197B (zh) 2016-05-27 2016-05-27 Dwg格式文件的翻译系统及翻译方法

Country Status (1)

Country Link
CN (1) CN106021197B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273366A (zh) * 2017-05-25 2017-10-20 深圳市比邻软件有限公司 一种翻译物理设备程序界面的方法及系统
CN112347794B (zh) * 2020-10-27 2023-06-09 深圳前海微众银行股份有限公司 数据翻译方法、装置、设备及计算机存储介质
KR102686029B1 (ko) * 2023-11-30 2024-07-17 메이크웍스(주) Dxf 형식 파일의 안정적인 파싱을 위한 파서 구조

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334351A (ja) * 1992-05-28 1993-12-17 Matsushita Electric Ind Co Ltd 機械翻訳装置
CN101539910A (zh) * 2009-01-15 2009-09-23 传神联合(北京)信息技术有限公司 一种用于计算机辅助翻译的取句方法及其系统
CN102193914A (zh) * 2011-05-26 2011-09-21 中国科学院计算技术研究所 计算机辅助翻译的方法及系统
CN104679814A (zh) * 2014-12-05 2015-06-03 沈阳航空航天大学 基于dwg、dxf文件格式图形的管理方法
CN104933041A (zh) * 2015-06-25 2015-09-23 武汉传神信息技术有限公司 一种利于翻译工作的文件抽取和还原方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334351A (ja) * 1992-05-28 1993-12-17 Matsushita Electric Ind Co Ltd 機械翻訳装置
CN101539910A (zh) * 2009-01-15 2009-09-23 传神联合(北京)信息技术有限公司 一种用于计算机辅助翻译的取句方法及其系统
CN102193914A (zh) * 2011-05-26 2011-09-21 中国科学院计算技术研究所 计算机辅助翻译的方法及系统
CN104679814A (zh) * 2014-12-05 2015-06-03 沈阳航空航天大学 基于dwg、dxf文件格式图形的管理方法
CN104933041A (zh) * 2015-06-25 2015-09-23 武汉传神信息技术有限公司 一种利于翻译工作的文件抽取和还原方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
使用AutoCAD读取Ovation组态图参数;黄洋;《东北电力技术》;20040830;第1.1节
刘冲亚;刘冲亚;《科技视界》;20150115;第3节

Also Published As

Publication number Publication date
CN106021197A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106021242B (zh) Dwg格式图纸翻译数据回写系统及其回写方法
CN102855232B (zh) 一种表格分析编改加工方法
CN100511225C (zh) 翻译文档图像生成装置和翻译文档图像生成方法
CN105975461B (zh) 在dwg格式文件中新增译文的方法
CN106021197B (zh) Dwg格式文件的翻译系统及翻译方法
CN101996160B (zh) 一种字体数据的处理方法及系统
US20090171653A1 (en) System and method for distributing multilingual documents
CN108399064B (zh) 基于Qt开发的多语言词条生成方法
CN108491199A (zh) 一种自动生成接口的方法及终端
CN105975451B (zh) Dwg格式文件翻译数据的处理系统及其处理方法
CN111767732A (zh) 基于图注意力模型的文档内容理解方法及系统
CN109492199A (zh) 一种基于ocr预判断的pdf文件转换方法
CN105426350B (zh) Scd文件中提取电压等级、间隔及ied信息的方法
CN108038093A (zh) Pdf文字提取方法和装置
CN109800750A (zh) 一种基于图像形态学用于规则排版的文本的文字区域标注方法
CN106055529B (zh) Dwg格式文件中待翻译文本数据的解析系统及其解析方法
CN106599818A (zh) 一种基于图片生成笔迹格式的文件的方法及装置
CN106649271A (zh) 一种基于翻译的word文档解析方法
CN101859295A (zh) 具标记提示的简繁字词转换系统及其方法
CN117274969A (zh) 一种印章识别方法、装置、设备及介质
CN104331665B (zh) 一种可追溯目标码的生成方法及可追溯目标码生成器
CN110083843A (zh) 一种cad图纸翻译方法
CN115481643A (zh) 一种互联网在线翻译工具中译稿高度还原文档样式的方法
CN102521359B (zh) 界面数据文件的比较方法及装置
CN207037679U (zh) 一种快捷扫描发票信息的系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 610000 Chengdu City, Sichuan Province, China (Sichuan) Free Trade Pilot Zone No. 401, No. 5, No. 599, South Century Road, Chengdu High-tech Zone, Chengdu

Patentee after: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

Address before: 610000, No. 1, building 107, 1 West Bauhinia Road, Chengdu hi tech Zone, Sichuan, 6

Patentee before: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Translation system and method of DWG format file

Effective date of registration: 20210927

Granted publication date: 20190423

Pledgee: Bank of Chengdu science and technology branch of Limited by Share Ltd.

Pledgor: CHENGDU UE INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2021510000236

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230508

Granted publication date: 20190423

Pledgee: Bank of Chengdu science and technology branch of Limited by Share Ltd.

Pledgor: CHENGDU UE INFORMATION TECHNOLOGY CO.,LTD.

Registration number: Y2021510000236