CN106598956A - 一种语言转换服务器系统 - Google Patents

一种语言转换服务器系统 Download PDF

Info

Publication number
CN106598956A
CN106598956A CN201611086529.5A CN201611086529A CN106598956A CN 106598956 A CN106598956 A CN 106598956A CN 201611086529 A CN201611086529 A CN 201611086529A CN 106598956 A CN106598956 A CN 106598956A
Authority
CN
China
Prior art keywords
language
translation
character
module
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611086529.5A
Other languages
English (en)
Other versions
CN106598956B (zh
Inventor
罗翔勇
柴晓冬
郑树彬
张瑞珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Engineering Science
Original Assignee
Shanghai University of Engineering Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai University of Engineering Science filed Critical Shanghai University of Engineering Science
Priority to CN201611086529.5A priority Critical patent/CN106598956B/zh
Publication of CN106598956A publication Critical patent/CN106598956A/zh
Application granted granted Critical
Publication of CN106598956B publication Critical patent/CN106598956B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种语言转换服务器系统,包括:获取页面排版格式模块;正确排版原始页面模块;获取排版板块内容模块;多种翻译软件处理模块,用于获得不同翻译软件对各版块文件的翻译结果;获取目标语言领域模块,用于获取用户输入的目标语言的语言领域,在目标语言的语言领域对应的特征库内,获取目标语言的语言特征信息;智能算法处理模块,用于将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,选取匹配度最高的最优翻译结果;输出最优结果模块。与现有技术相比,本发明为人们生活提供了便利,为科学技术传播提供渠道,节约了社会资源,具有技术前瞻性,其实现对现代社会发展,世界各国间的更深入交流发挥重大的意义。

Description

一种语言转换服务器系统
技术领域
本发明涉及计算机应用领域,尤其是涉及一种语言转换服务器系统。
背景技术
目前各个国家和地区投入了大量的人力、物力、财力在非本国语言的学习和培训上,在中国情况尤为明显。在社会生活领域,近年来各个地区的外语辅导班如天上繁星般,不仅有学校的官方外语课程,越来越多的学生参加课外辅导班以提高自己掌握外语的能力,投入了大量的财力。在科学技术领域,每年国内各个学校花费大量财力在购买外语类物品,特别地,在对于最新的科学技术前沿发展方面,对于非本国语言的其他语言学者而言,由于语言的障碍,加大了对前沿问题的理解难度,加大了最新技术的实现和运用以及思想在全球范围内的传播。且目前市场上存在的各种翻译软件也很多,但各个翻译软件的语种局限性和翻译结果的最佳匹配性不佳等,无法满足不同国家不同需求的人群对于翻译结果的要求。鉴于此,本发明提出一种语言转换服务器系统,通过各种内处理模块,能够实现任意原始语言对目标语言相应语言领域的最佳翻译,在一定程度上促进了不同语言种类国家间的交流,可以为社会节约一定程度上的人力物力和财力资源,同时为人们在不同语言间的日常生活和学习提供了一个便利的交流工具。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种语言转换服务器系统,为人们生活提供了便利,为科学技术传播提供一种渠道,节约了社会资源,具有技术前瞻性,其实现对现代社会发展,世界各国间的更深入交流发挥重大的意义。
本发明的目的可以通过以下技术方案来实现:
一种语言转换服务器系统包括:
获取页面排版格式模块,用于获取输入文件的页面排版格式;
正确排版原始页面模块,用于将输入文件按页面排版格式分割为各板块文件;
获取排版板块内容模块,用于识别获取各版块文件内的字符内容;
多种翻译软件处理模块,用于利用多种翻译软件对字符内容进行翻译,获得不同翻译软件对各版块文件的翻译结果;
获取目标语言领域模块,用于获取用户输入的目标语言的语言领域,在目标语言的语言领域对应的特征库内,获取目标语言的语言特征信息;
智能算法处理模块,用于将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,选取匹配度最高的最优翻译结果;
输出最优结果模块,用于按页面排版格式输出最优翻译结果。
所述语言领域包括基础科学领域、工程技术领域、医学领域、农林领域、社会科学领域、网络模糊语言领域。
所述语言特征信息包括语言组句方式和语言文字使用习惯。
所述输入文件包括网页页面和扫描图片。
所述获取页面排版格式模块具体用于:
若输入文件为网页页面,根据网页页面的链接获取网页页面的代码,再由网页页面的代码获取得到页面排版格式。
所述获取页面排版格式模块具体用于:
若输入文件为扫描图片,先采用图像自动识别技术识别出字符区域、图像区域和空白区域,然后根据字符区域设计获取字符排版空间,该字符排版空间用于自适应放入翻译结果,则获取的页面排版格式包括字符排版空间、图像区域和空白区域。
所述获取排版板块内容模块具体用于:
首先通过OCR技术对各个版块的内容进行字符扫描;
其次,将扫描得到的字符与建立的各个国家的语言文字库中的原始字符进行最佳相似化对比,若最佳相似化对比获取的最相似原始字符与扫描得到的字符一致,则保留原扫描得到的字符,若最佳相似化对比获取的最相似原始字符与扫描得到的字符不一致,则将扫描得到的字符自动更改为最相似原始字符;
最后,输出得到的各版块文件内的字符内容。
所述智能算法处理模块具体用于:
根据将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,选取匹配度最高的翻译结果,并对匹配度最高的翻译结果进行语句连贯性和错误修改,输出最优翻译结果。
与现有技术相比,本发明具有以下优点:
1、本发明通过各种内处理模块,实现了由原始语言对目标语言的最优化的语言转化,降低了语言交流的障碍,缩短了世界各个语种间人们交流的距离,同时针对目前对于非本国语言的学习所投入的大量人力物力,该语言转换器系统可以有效节约社会资源。尤其地,对于科学文献的最优转换,可以使最新最全面的科技动向和成果不因语言障碍而不能有效传播得到应用,拓展了科学技术的传播,缩短了科学应用的周期。
2、本发明中获取页面排版格式模块针对扫描文件和网页页面进行分别处理,利用网页页面的内部代码可以直接获取排版格式,效果直接有效,另一方面利用图像处理软件实现扫描文件的页面区域划分,根据划分的字符区域设计获取字符排版空间,该字符排版空间用于自适应放入翻译结果,有利于最后按按页面排版格式输出最优翻译结果,防止出现翻译字数过多无法匹配原字符区域的问题。
3、本发明中获取排版板块内容模块应用到了OCR(Optical CharacterRecognition,光学字符识别)技术。在服务器内部建立了全球各个国家的语言文字库,应用先进的OCR字符识别技术对各个板块的的字符进行扫描识别,再运用自适应图像对比与相应国家语言库中的字符对比,较好地解决了目前该模块处理由于没有相应的文字库而从大数据搜寻导致识别率不高且时间长的缺点,从而达到准确高效地获取各版块的内容的优点。
4、本发明中多种翻译软件处理模块将识别的原语言通过目前已有的各种翻译软件进行同时翻译,将翻译的结果每行依次排列,采用多种翻译软件进行同时翻译对比集各家之长,使翻译结果有了参考依据,更具有说服力,为后续智能算法处理模块获取最优翻译结果提供翻译基础。
5、本发明中获取目标语言领域模块选择多目标语言翻译对应的语言领域,建立一个语言领域表达的数据库,分为六大种类,用户通过自己的需求选择适合的语言领域,这样减少了自动搜寻时间,提高了翻译效率,同时增加了翻译结果的匹配度。
6、本发明中智能算法处理模块利用选择的语音领域,实现对翻译的内容与数据库语言分析对比,以获取最适合该语言领域的翻译结果,最终将结果按照原排版模式输出。
附图说明
图1为语言转换服务器系统处理关系图;
图2为语言转换服务器的操作流程框架图;
图3为获取排版板块内容模块处理流程图;
图4为语言领域分类数据库图;
图5为智能算法处理模块流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1和图2所示,一种语言转换服务器系统包括依次连接的获取页面排版格式模块、正确排版原始页面模块、获取排版板块内容模块、多种翻译软件处理模块、获取目标语言领域模块、智能算法处理模块和输出最优结果模块,利用机器视觉、模式识别、自然语言处理技术,语言转换服务器系统实现任意原始语言对目标语言相应语言领域的最佳翻译的步骤包括:
S1:获取页面排版格式模块获取输入文件的页面排版格式;
S2:正确排版原始页面模块将输入文件按页面排版格式分割为各板块文件;
S3:获取排版板块内容模块识别获取各版块文件内的字符内容;
S4:多种翻译软件处理模块利用多种翻译软件对字符内容进行翻译,获得不同翻译软件对各版块文件的翻译结果;
S5:获取目标语言领域模块获取用户输入的目标语言的语言领域,在目标语言的语言领域对应的特征库内,获取目标语言的语言特征信息;
S6:智能算法处理模块将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,选取匹配度最高的最优翻译结果;
S7:输出最优结果模块按页面排版格式输出最优翻译结果。
在获取对应页面的排版格式的时候,有四种输入方式,分别为:1、通过打开的相应链接网页;2、扫描输入;3、人工输入;4、语音输入。相应地,语音输入和人工输入其实现的功能相对简单,即对输入信息的最优化翻译。网页链接打开的网页页面和扫描输入的扫描文件将通过内部图像处理软件进行识别划分,最后得到原始页面的排版格式。获取页面排版格式模块具体处理过程包括:
若输入文件为网页页面,根据网页页面的链接获取网页页面的代码(例如Java代码),再由网页页面的代码获取得到页面排版格式:
若输入文件为扫描图片(例如PDF文件等不可直接获取的文件),先采用图像自动识别技术识别出字符区域、图像区域和空白区域(例如对划分区域的直线进行识别,以及配合对输入文件进行相应区域的功能信息获取),然后根据字符区域设计获取用于自适应放入翻译结果的字符排版空间,最后将识别出的线段按照原输入文件的排版位置排列,从而获取原页面排版格式,获取的页面排版格式包括字符排版空间、图像区域和空白区域。
对应字符排版空间的自适应放入翻译结果具体地,字符排版空间保存字符区域的空间尺寸,若最优翻译结果所占的空间小于等于原始字符区域的空间尺寸,则以原始字符区域的空间尺寸进行排版显示最优翻译结果,若最优翻译结果所占的空间大于原始字符区域的空间尺寸,则优先将最优翻译结果的字体顺序按字体大小降序进行缩小,知道满足字体缩小后的最优翻译结果所占的空间小于等于原始字符区域的空间尺寸,且缩小后的字体大于等于预设的最小分辨率字体大小,上述优先条件无法满足,则首先将最优翻译结果的字体缩小为预设的最小分辨率字体大小,再将字符排版空间按输入文件的排版方向(横纵向)扩展字符区域的空间尺寸,例如:若为纵向输入文件,则保持横向上尺寸不变,从纵向上增大字符区域的空间尺寸,以满足字体缩小后的最优翻译结果所占的空间小于等于原始字符区域的空间尺寸。
正确排版原始页面模块还包括:对于多个输入文件的页面顶部和页面尾部的字符排版空间拼接技术,具体为:若相邻的输入文件中,前一页的输入文件页面尾部和后一页的输入文件页面顶部均为字符排版空间,则将两个字符排版空间合并为一个,且对应将分割的两个板块文件合并为一个。
获取页面排版格式模块和正确排版原始页面模块分别应用到了内部优化的图像处理软件,Photoshop是内嵌在服务器系统内部的图像处理软件之一,同时内部处理软件也包括excel等对原始页面排版进行组合,从而正确排版原始页面。
如图3所示,获取排版板块内容模块在服务器内部建立了全球各个国家的语言文字库,具体处理过程包括:
首先通过OCR技术对各个版块的内容进行字符扫描;
其次,运用自适应图像对比,将扫描得到的字符与建立的各个国家的语言文字库中的原始字符进行最佳相似化对比,若最佳相似化对比获取的最相似原始字符与扫描得到的字符一致,则保留原扫描得到的字符,若最佳相似化对比获取的最相似原始字符与扫描得到的字符不一致,则将扫描得到的字符自动更改为最相似原始字符,从而正确有效地获取各版块的内容;
最后,输出得到的各版块文件内的字符内容。
多种翻译软件处理模块对识别的原始语言通过多种翻译软件同时在各个版块单独翻译,将按照不同版块把各个翻译软件对该版块的翻译结果集中,以备智能算法处理模块操作。具体地,各翻译软件包括:Trados、Omega T、Bing翻译、Pootle、Google翻译、OpenLanguage Tools、Deja Vu X、Transmate、Worldfast、Flitto、Lingoes、Tmxmall、Arkhosic、Engkoo、CNKI、Baidu翻译、Youdao翻译、芝麻翻译等,运用目前存在的各个语言翻译软件并行处理的模式,对特定版块的同一语句进行翻译,对翻译的结果按顺序排列,每一个页面的板块之间的翻译结果区分处理,储存在临时数据库中等待操作。
获取目标语言领域模块将语言领域分为基础科学领域、工程技术领域、医学领域、农林领域、社会科学领域、网络模糊语言领域,以上六个领域构成了目标语言表达的特征库。确定目标语言的语言领域后,在目标语言的语言领域对应的特征库中搜索目标语言的语言组句方式和语言文字使用习惯,作为语言特征信息。
如图4所示,具体地,1、基础科学领域包含:大气科学、地理学、地球物理学、地质学、动物学、古生物学、化学、昆虫学、力学、生理学、生态学、生物化学与分子生物学、生物物理学、数学、天文学、微生物学、物理学、细胞生物学、心理学、遗传学、植物学。2、工程技术领域包含:材料科学技术、测绘学、船舶工程、地理信息系统、电工学、电力、电子学、公路科技、海洋科技、航海科技、航空科技、航天科技、化学工程、机械工程、计算机科学技术、建筑与园林及城市规划、煤炭科技、石油学、水利科技、铁道科技、通信科技、冶金学、资源科技、自动化。3、医学领域包括:免疫学、胚胎学、人体解剖学、药学、医学、中医药学、人体组织学。4、农学领域包括:林学、农学、水产学、土壤学。5、社会科学领域包括:自然辩证法。6、网络模糊语言领域包括:网络细胞词库和网络基础词库组成。
如图5所示,智能算法处理模块具体处理过程包括:
根据将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,具体地从字、词和语句表达等方面,自动筛选出匹配度最高的翻译结果,并对匹配度最高的翻译结果进行语句连贯性和错误修改,输出最优翻译结果。语言连贯性和错误修改部分的实现具体是对于翻译的结果进行最后的检验过程,前一步骤得到按照原语言表达的语序的翻译结果,但可能存在着符合语言习惯但不符合句法要求,在这里是对整个句子进行最后的语法正确性检验。
智能算法处理模块所包含的算法具体包含:神经网络算法、粒子群算法、遗传算法、模糊逻辑控制算法、免疫算法、蚁群算法、层次分析法算法、模糊综合评价算法、SVM算法、支持向量机、自适应算法等多种算法的共同运用。
输出最优结果模块将各个版块翻译的最优翻译结果分别排版在相应字符排版空间的位置,则语言转换服务器显示不改变原来排版格式的最优化语言翻译。
综上所述,种语言转换服务器系统,通过各种内处理模块,能够实现任意原始语言对目标语言相应语言领域的最佳翻译,降低了语言交流的障碍,缩短了世界各个语种间人们交流的距离,在一定程度上促进了不同语言种类国家间的交流,为人们在不同语言间的日常生活和学习提供了一个便利的交流工具,同时针对目前对于非本国语言的学习所投入的大量人力物力,该语言转换器系统可以有效节约社会资源。尤其地,对于科学文献的最优转换,可以使最新最全面的科技动向和成果不因语言障碍而不能有效传播得到应用,拓展了科学技术的传播,缩短了科学应用的周期。

Claims (8)

1.一种语言转换服务器系统,其特征在于,包括:
获取页面排版格式模块,用于获取输入文件的页面排版格式;
正确排版原始页面模块,用于将输入文件按页面排版格式分割为各板块文件;
获取排版板块内容模块,用于识别获取各版块文件内的字符内容;
多种翻译软件处理模块,用于利用多种翻译软件对字符内容进行翻译,获得不同翻译软件对各版块文件的翻译结果;
获取目标语言领域模块,用于获取用户输入的目标语言的语言领域,在目标语言的语言领域对应的特征库内,获取目标语言的语言特征信息;
智能算法处理模块,用于将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,选取匹配度最高的最优翻译结果;
输出最优结果模块,用于按页面排版格式输出最优翻译结果。
2.根据权利要求1所述的一种语言转换服务器系统,其特征在于,所述语言领域包括基础科学领域、工程技术领域、医学领域、农林领域、社会科学领域、网络模糊语言领域。
3.根据权利要求1所述的一种语言转换服务器系统,其特征在于,所述语言特征信息包括语言组句方式和语言文字使用习惯。
4.根据权利要求1所述的一种语言转换服务器系统,其特征在于,所述输入文件包括网页页面和扫描图片。
5.根据权利要求4所述的一种语言转换服务器系统,其特征在于,所述获取页面排版格式模块具体用于:
若输入文件为网页页面,根据网页页面的链接获取网页页面的代码,再由网页页面的代码获取得到页面排版格式。
6.根据权利要求4所述的一种语言转换服务器系统,其特征在于,所述获取页面排版格式模块具体用于:
若输入文件为扫描图片,先采用图像自动识别技术识别出字符区域、图像区域和空白区域,然后根据字符区域设计获取字符排版空间,该字符排版空间用于自适应放入翻译结果,则获取的页面排版格式包括字符排版空间、图像区域和空白区域。
7.根据权利要求1所述的一种语言转换服务器系统,其特征在于,所述获取排版板块内容模块具体用于:
首先通过OCR技术对各个版块的内容进行字符扫描;
其次,将扫描得到的字符与建立的各个国家的语言文字库中的原始字符进行最佳相似化对比,若最佳相似化对比获取的最相似原始字符与扫描得到的字符一致,则保留原扫描得到的字符,若最佳相似化对比获取的最相似原始字符与扫描得到的字符不一致,则将扫描得到的字符自动更改为最相似原始字符;
最后,输出得到的各版块文件内的字符内容。
8.根据权利要求1所述的一种语言转换服务器系统,其特征在于,所述智能算法处理模块具体用于:
根据将各个翻译软件对各版块文件的翻译结果与目标语言的语音特征信息进行对比,选取匹配度最高的翻译结果,并对匹配度最高的翻译结果进行语句连贯性和错误修改,输出最优翻译结果。
CN201611086529.5A 2016-11-30 2016-11-30 一种语言转换服务器系统 Expired - Fee Related CN106598956B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611086529.5A CN106598956B (zh) 2016-11-30 2016-11-30 一种语言转换服务器系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611086529.5A CN106598956B (zh) 2016-11-30 2016-11-30 一种语言转换服务器系统

Publications (2)

Publication Number Publication Date
CN106598956A true CN106598956A (zh) 2017-04-26
CN106598956B CN106598956B (zh) 2019-09-06

Family

ID=58594423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611086529.5A Expired - Fee Related CN106598956B (zh) 2016-11-30 2016-11-30 一种语言转换服务器系统

Country Status (1)

Country Link
CN (1) CN106598956B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256234A (zh) * 2017-05-18 2017-10-17 腾讯科技(深圳)有限公司 一种网页文本调整方法及其设备
CN107491442A (zh) * 2017-08-08 2017-12-19 山东中创软件工程股份有限公司 一种语言的转换方法及装置
CN107908625A (zh) * 2017-12-04 2018-04-13 上海互盾信息科技有限公司 一种pdf文档内容原位置多语言翻译方法
CN108959606A (zh) * 2018-07-16 2018-12-07 商洛学院 一种英语单词查询系统
CN110245356A (zh) * 2019-06-24 2019-09-17 付金龙 离线翻译机
CN111245460A (zh) * 2020-03-25 2020-06-05 广州锐格信息技术科技有限公司 一种具有人工智能翻译的无线对讲机
CN113553524A (zh) * 2021-06-30 2021-10-26 上海硬通网络科技有限公司 一种网页的文字排版方法、装置、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006084234A2 (en) * 2005-02-03 2006-08-10 John Mount Systems and methods for converting a classifier in one language to another language
CN102456003A (zh) * 2010-10-27 2012-05-16 王博 一种翻译结果的显示方法和设备
CN102650988A (zh) * 2011-02-25 2012-08-29 北京百度网讯科技有限公司 一种基于目标语言复述资源的机器翻译方法及装置
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译系统及图像翻译方法
US8898052B2 (en) * 2006-05-22 2014-11-25 Facebook, Inc. Systems and methods for training statistical speech translation systems from speech utilizing a universal speech recognizer
CN105930321A (zh) * 2016-04-21 2016-09-07 京东方科技集团股份有限公司 一种语言转换装置、方法、可穿戴设备及电子显示牌

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006084234A2 (en) * 2005-02-03 2006-08-10 John Mount Systems and methods for converting a classifier in one language to another language
US8898052B2 (en) * 2006-05-22 2014-11-25 Facebook, Inc. Systems and methods for training statistical speech translation systems from speech utilizing a universal speech recognizer
CN102456003A (zh) * 2010-10-27 2012-05-16 王博 一种翻译结果的显示方法和设备
CN102650988A (zh) * 2011-02-25 2012-08-29 北京百度网讯科技有限公司 一种基于目标语言复述资源的机器翻译方法及装置
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译系统及图像翻译方法
CN105930321A (zh) * 2016-04-21 2016-09-07 京东方科技集团股份有限公司 一种语言转换装置、方法、可穿戴设备及电子显示牌

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256234A (zh) * 2017-05-18 2017-10-17 腾讯科技(深圳)有限公司 一种网页文本调整方法及其设备
CN107256234B (zh) * 2017-05-18 2018-12-07 腾讯科技(深圳)有限公司 一种网页文本调整方法及其设备
CN107491442A (zh) * 2017-08-08 2017-12-19 山东中创软件工程股份有限公司 一种语言的转换方法及装置
CN107908625A (zh) * 2017-12-04 2018-04-13 上海互盾信息科技有限公司 一种pdf文档内容原位置多语言翻译方法
CN108959606A (zh) * 2018-07-16 2018-12-07 商洛学院 一种英语单词查询系统
CN110245356A (zh) * 2019-06-24 2019-09-17 付金龙 离线翻译机
CN111245460A (zh) * 2020-03-25 2020-06-05 广州锐格信息技术科技有限公司 一种具有人工智能翻译的无线对讲机
CN111245460B (zh) * 2020-03-25 2020-10-27 广州锐格信息技术科技有限公司 一种具有人工智能翻译的无线对讲机
CN113553524A (zh) * 2021-06-30 2021-10-26 上海硬通网络科技有限公司 一种网页的文字排版方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN106598956B (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN106598956B (zh) 一种语言转换服务器系统
Naz et al. Urdu Nastaliq recognition using convolutional–recursive deep learning
Rusinol et al. Field extraction from administrative documents by incremental structural templates
US20070003147A1 (en) Grammatical parsing of document visual structures
CN110134954B (zh) 一种基于Attention机制的命名实体识别方法
CN111782769B (zh) 基于关系预测的知识图谱智能问答方法
CN107193807A (zh) 基于人工智能的语言转换处理方法、装置及终端
CN112101031B (zh) 一种实体识别方法、终端设备及存储介质
WO2019227581A1 (zh) 兴趣点识别方法、装置、终端设备及存储介质
CN113239153B (zh) 一种基于实例遮掩的文本与图像互检索方法
Cheng et al. M6doc: A large-scale multi-format, multi-type, multi-layout, multi-language, multi-annotation category dataset for modern document layout analysis
Lin et al. Radical-based extract and recognition networks for Oracle character recognition
CN113821663A (zh) 图像处理方法、装置、设备及计算机可读存储介质
Wang et al. Image captioning using region-based attention joint with time-varying attention
CN116822634A (zh) 一种基于布局感知提示的文档视觉语言推理方法
Murali et al. Remote sensing image captioning via multilevel attention-based visual question answering
CN114842982B (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN113868389B (zh) 基于自然语言文本的数据查询方法、装置及计算机设备
Zhu et al. Real-time traffic sign detection based on YOLOv2
Xuanjing et al. Language-independent Text Categorization
Scius-Bertrand et al. Annotation-free character detection in historical Vietnamese stele images
KR101005786B1 (ko) 차량용 네비게이션 단말기의 음성인식 방법
Liang et al. Implementing word retrieval in handwritten documents using a small dataset
KR20210057983A (ko) 포인트 네트워크를 이용한 트리플 추출방법 및 그 추출장치
Kononova et al. Gamification Study: Review and Retrieval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190906