CN116911321B - 一种前端自动翻译字典值的方法及组件 - Google Patents
一种前端自动翻译字典值的方法及组件 Download PDFInfo
- Publication number
- CN116911321B CN116911321B CN202310740070.XA CN202310740070A CN116911321B CN 116911321 B CN116911321 B CN 116911321B CN 202310740070 A CN202310740070 A CN 202310740070A CN 116911321 B CN116911321 B CN 116911321B
- Authority
- CN
- China
- Prior art keywords
- information
- data
- dictionary
- sub
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013519 translation Methods 0.000 title claims description 118
- 230000000977 initiatory effect Effects 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims description 89
- 238000004140 cleaning Methods 0.000 claims description 54
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 230000001502 supplementing effect Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 11
- 230000000052 comparative effect Effects 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种前端自动翻译字典值的方法及组件包括:获取待翻译信息,并将待翻译信息划分为若干个子信息,在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在字典数据库中获取每条第一子信息对应的第一字典数据,提取在字典数据库中查找失败的第二子信息,在服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据,根据编码数据建立第二字典数据,将第二字典数据输入到预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为待翻译信息建立字典值信息,这样一来可以减缓服务器的请求压力,提高了翻译的速度,大大减小了服务器崩溃的几率。
Description
技术领域
本发明涉及前端开发技术领域,特别涉及一种前端自动翻译字典值的方法及组件。
背景技术
在前端开发中,字典是一种存储在数据库的以key-value形式存在的数据对,在许多场景下需要前端调用接口来将数据key翻译成value值。当前实现字典值自动翻译的前端组件在大规模使用时容易发起大量多余请求,甚至有概率导致浏览器崩溃,例如在填报表格这种单页具有大量重复组件的场景下,需要在短时间内发起多个请求,字典需要大量的时间响应请求并做相应的操作,工作效率低。
因此,本发明提供了一种前端自动翻译字典值的方法及组件。
发明内容
本发明一种前端自动翻译字典值的方法及组件,通过提前建立预设字典数据库来翻译常用信息,在实际使用过程中如果预设字典数据库中查找不到某一信息时建立一个查找请求,然后根据查找请求想服务器发送请求,这样一来可以减缓服务器的请求压力,提高了翻译的速度,大大减小了服务器崩溃的几率。
本发明提供了一种前端自动翻译字典值的方法,包括:
步骤1:获取待翻译信息,并将所述待翻译信息划分为若干个子信息;
步骤2:在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在所述预设字典数据库中获取每条第一子信息对应的第一字典数据;
步骤3:提取在预设字典数据库中查找失败的第二子信息,在预设服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据;
步骤4:根据所述编码数据建立第二字典数据,将所述第二字典数据输入到所述预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为所述待翻译信息建立字典值信息。
在一种可实施的方式中,
包括:
在预设字典数据库中分别为每一个字典数据建立一个字典值;
当生成第二字典数据时,根据所述第二字典数据的数据特征,为所述第二字典数据建立字典值,并将建立后的字典值存储到所述预设字典数据库中。
在一种可实施的方式中,
所述步骤1,包括:
步骤11:获取前端采集的待翻译信息;
步骤12:解析所述待翻译信息,得到所述待翻译信息的资源定位符;
步骤13:根据所述资源定位符确定所述待翻译信息的信息来源,根据所述信息来源在预设来源-规则列表中查找对应的目标划分规则;
步骤14:利用所述目标划分规则将所述待翻译信息划分为若干个子信息。
在一种可实施的方式中,
所述步骤2,包括:
步骤21:分别获取每一子信息在所述待翻译信息中的信息位置,根据所述信息位置的先后顺序对所述子信息进行排序,得到子信息序列;
步骤22:在所述子信息序列中依次提取每一子信息,并在所述预设字典数据库中查找被提取的子信息,得到每一子信息与不同预设字典信息的相似度,利用预设相似度样本对所述预设字典信息进行筛选,得到每一子信息对应的目标预设字典信息,建立信息匹配组;
步骤23:根据所述信息匹配组建立对应子信息与不同目标预设字典信息之间的相似权重,以及在所述预设字典数据库中查找每一目标预设字典信息对应的目标字典数据;
步骤24:根据同一子信息与不同有目标预设字典信息之间的相似权重对对应的目标字典数据进行数据训练生成第一字典数据,并根据每一子信息在所述子信息序列中的排序方式对所述第一字典数据进行排序,生成数据序列。
在一种可实施的方式中,
所述步骤3,包括:
步骤31:获取并解析数据序列,得到所述数据序列中的空白序列位对应的子信息,记作第二子信息;
步骤32:分别将每条第二子信息划分为若干个单位信息,剔除干扰信息建立第二信息串,基于所述第二信息串结合预设查找指令建立查找请求指令,将所述查找请求指令输入到预设服务器中分别查找每一单位信息,得到若干个反馈信息;
步骤33:获取同一第二字信息串中不同单位信息之间的逻辑关系建立逻辑树,将对应的反馈信息输入到逻辑树的叶节点上,得到信息逻辑树;
步骤34:根据所信息逻辑树生成反馈数据,将所述反馈数据转换为预设数据格式,得到第二子信息对应的编码数据。
在一种可实施的方式中,
所述步骤4,包括:
步骤41:对所述编码数据进行数据清洗,将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储;
步骤42:利用所述第二字典数据替换对应的编码数据,根据第一子信息与第二子信息在所述待翻译信息中的信息位置对所述第一字典数据和第二字典数据进行排序,得到数据列表,将所述数据列表中的字典数据记作翻译数据;
步骤43:分别获取每一翻译数据对应的翻译语义,根据所述翻译语义为相邻的翻译数据补充关联数据,得到翻译数据链;
步骤44:获取所述翻译数据链中的有用信息,得到对应待翻译信息的字典值信息。
在一种可实施的方式中,
所述步骤41,包括:
步骤411:将所述编码数据进行完整性评价、合法性评价和唯一性评价,得到对应的第一评价结果、第二评价结果和第三评价结果;
步骤412:根据所述第一评价结果、第二评价结果和第三评价结果建立对应的第一清洗数据、第二清洗数据和第三清洗数据,结合所述预设规则对所述编码数据进行数据清洗;
步骤413:对清洗后的编码数据进行完整性评价、合法性评价和唯一性评价,得到对应的第四评价结果、第五评价结果和第六评价结果,将第四评价结果与第一评价结果进行对比,将第五评价结果与第二评价结果进行对比,将第六评价结果与第三评价结果进行对比,得到对应的第一对比结果、第二对比结果、第三对比结果,当所述第一对比结果、第二对比结果和第三对比结果均在预设对比结果范围内时,确定所述编码数据完成清洗;
步骤414:将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储。
在一种可实施的方式中,
还包括:
当第一对比结果、第二对比结果、第三对比结果中一个或多个对比结果在预设对比结果范围外时,根据第四评价结果、第五评价结果和第六评价结果生成第四清洗数据、第五清洗数据和第六清洗数据;
根据所述第四清洗数据、第五清洗数据和第六清洗数据结合所述预设规则对所述编码数据进行数据清洗。
本发明提供了一种前端自动翻译字典值的组件,包括:
获取模块,用于获取待翻译信息,并将所述待翻译信息划分为若干个子信息;
第一查找模块,用于在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在所述预设字典数据库中获取每条第一子信息对应的第一字典数据;
第二查找模块,用于提取在预设字典数据库中查找失败的第二子信息,在预设服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据;
执行模块,用于根据所述编码数据建立第二字典数据,将所述第二字典数据输入到所述预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为所述待翻译信息建立字典值信息。
在一种可实施的方式中,
所述执行模块,包括:
数据清洗单元,用于对所述编码数据进行数据清洗,将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储;
数字处理单元,用于利用所述第二字典数据替换对应的编码数据,根据第一子信息与第二子信息在所述待翻译信息中的信息位置对所述第一字典数据和第二字典数据进行排序,得到数据列表,将所述数据列表中的字典数据记作翻译数据;
数据翻译单元,用于分别获取每一翻译数据对应的翻译语义,根据所述翻译语义为相邻的翻译数据补充关联数据,得到翻译数据链;
翻译执行单元,用于获取所述翻译数据链中的有用信息,得到对应待翻译信息的字典值信息。
本发明可以实现的有益效果为:为了避免在同一时间向服务器发出多个请求指令导致浏览器崩溃,首先将待翻译信息划分为若干个子信息,然后在字典数据库中查找子信息得,到其对应的第一字典数据,若此时还未完成查找,在服务器中查找剩余的子信息,得到其对应的编码数据从而结合第一字典数据得到待翻译信息的字典值信息,同时为了减轻服务器的压力根据编码数据更新预设字典数据库,这样一来可以实现字典的自动翻译同时防止了单页面多组件场景下同时重复请求与多页面单组件重复请求的情况,且随时更新预设字典数据库,提高了下一次自动翻译的效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种前端自动翻译字典值的方法的工作流程示意图;
图2为本发明实施例中一种前端自动翻译字典值的组件的组成示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
本实施例提供了一种前端自动翻译字典值的方法,如图1所示,包括:
步骤1:获取待翻译信息,并将所述待翻译信息划分为若干个子信息;
步骤2:在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在所述预设字典数据库中获取每条第一子信息对应的第一字典数据;
步骤3:提取在预设字典数据库中查找失败的第二子信息,在预设服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据;
步骤4:根据所述编码数据建立第二字典数据,将所述第二字典数据输入到所述预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为所述待翻译信息建立字典值信息。
该实例中,在预设字典数据库中查找成功的子信息为第一子信息,在预设字典数据库中查找失败的子信息为第二子信息;
该实例中,预设字典数据库中包含多个信息与字典数据的对应关系,记作key-value组,key表示信息,value表示字典数据,且每一key-value组中定义的信息是唯一的;
该实例中,第一字典数据表示已经在预设字典数据库中存储的字典数据;
该实例中,预设服务器可以为与前端具有连接关系的任何服务器;
该实例中,编码数据表示在服务器中查找到的用来翻译第二子信息的数据;
该实例中,第二字典数据表示第一次出现在预设字典数据库中的字典数据;
该实例中,字典值信息表示由多个字典值表示待翻译信息的结果。
上述技术方案的工作原理以及有益效果:为了避免在同一时间向服务器发出多个请求指令导致浏览器崩溃,首先将待翻译信息划分为若干个子信息,然后在字典数据库中查找子信息得,到其对应的第一字典数据,若此时还未完成查找,在服务器中查找剩余的子信息,得到其对应的编码数据从而结合第一字典数据得到待翻译信息的字典值信息,同时为了减轻服务器的压力根据编码数据更新预设字典数据库,这样一来可以实现字典的自动翻译同时防止了单页面多组件场景下同时重复请求与多页面单组件重复请求的情况,且随时更新预设字典数据库,提高了下一次自动翻译的效率。
实施例2
在实施例1的基础上,所述一种前端自动翻译字典值的方法,还包括:
在预设字典数据库中分别为每一个字典数据建立一个字典值;
当生成第二字典数据时,根据所述第二字典数据的数据特征,为所述第二字典数据建立字典值,并将建立后的字典值存储到所述预设字典数据库中。
上述技术方案的工作原理以及有益效果:为了建立一个有效的预设字典数据库,为字典数据建立字典值,为查找子信息做基础。
实施例3
在实施例1的基础上,所述一种前端自动翻译字典值的方法,所述步骤1,包括:
步骤11:获取前端采集的待翻译信息;
步骤12:解析所述待翻译信息,得到所述待翻译信息的资源定位符;
步骤13:根据所述资源定位符确定所述待翻译信息的信息来源,根据所述信息来源在预设来源-规则列表中查找对应的目标划分规则;
步骤14:利用所述目标划分规则将所述待翻译信息划分为若干个子信息。
该实例中,资源定位符表示它包含的信息指出文件的位置;
该实例中,预设来源-规则列表中包含了多个信息来源与划分规则的列表;
该实例中,目标划分规则表示用来划分翻译信息的规则。
上述技术方案的工作原理以及有益效果:在获取到待翻译信息后,获取待翻译信息的资源定位符,从而确定了待翻译信息的信息来源,根据信息来源确定目标划分规则,进而根据目标划分规则将待翻译信息划分为若干个子信息,这样一来可以针对不同类型的待翻译信息执行不同的划分方式,避免了子信息中出现断裂信息。
实施例4
在实施例1的基础上,所述一种前端自动翻译字典值的方法,所述步骤2,包括:
步骤21:分别获取每一子信息在所述待翻译信息中的信息位置,根据所述信息位置的先后顺序对所述子信息进行排序,得到子信息序列;
步骤22:在所述子信息序列中依次提取每一子信息,并在所述预设字典数据库中查找被提取的子信息,得到每一子信息与不同预设字典信息的相似度,利用预设相似度样本对所述预设字典信息进行筛选,得到每一子信息对应的目标预设字典信息,建立信息匹配组;
步骤23:根据所述信息匹配组建立对应子信息与不同目标预设字典信息之间的相似权重,以及在所述预设字典数据库中查找每一目标预设字典信息对应的目标字典数据;
步骤24:根据同一子信息与不同有目标预设字典信息之间的相似权重对对应的目标字典数据进行数据训练生成第一字典数据,并根据每一子信息在所述子信息序列中的排序方式对所述第一字典数据进行排序,生成数据序列。
该实例中,信息位置表示子信息在待翻译信息中的位置,且一个信息位置对应一个子信息;
该实例中,子信息列表表示将子信息按照原有顺序进行排序的结果;
该实例中,预设字典信息表示预设字典数据库原有的数据;
该实例中,预设相似度样本可以为85%;
该实例中,利用预设相似度样本对所述预设字典信息进行筛选的过程表示提取与子信息相似的大于85%的预设字典信息;
该实例中,信息匹配组中包含一个子信息以及一个或一个以上预设字典信息;
该实例中,相似权重表示一个子信息与不同预设字典信息之间的相似度的大小,相似度越大,相似权重越大;
该实例中,数据序列中可以包含空白数据;
该实例中,数据序列中仅含有第一字典数据。
上述技术方案的工作原理以及有益效果:根据子信息在待翻译信息中的信息位置建立一个子信息序列,然后根据子信息序列中的顺序依次在预设字典数据库中进行查找工作,从而得到一个子信息与不同预设字典信息之间的相似度,然后筛选预设相似度范围内的目标预设字典信息,为了避免信息紊乱为每一个子信息建立信息匹配组,然后利用信息匹配组来分析一个子信息与不同目标预设字典信息之间的相似权重和目标字典数据,从而将二者进行训练生成了第一字典数据,为了保证数据的条理性,根据子信息序列的排序方式对第一字典数据进行排序生成另一个数据序列,通过数据序列的方式来展示第一字典数据,可以避免数据紊乱,同时也便于后续进行翻译。
实施例5
在实施例1的基础上,所述一种前端自动翻译字典值的方法,所述步骤3,包括:
步骤31:获取并解析数据序列,得到所述数据序列中的空白序列位对应的子信息,记作第二子信息;
步骤32:分别将每条第二子信息划分为若干个单位信息,剔除干扰信息建立第二信息串,基于所述第二信息串结合预设查找指令建立查找请求指令,将所述查找请求指令输入到预设服务器中分别查找每一单位信息,得到若干个反馈信息;
步骤33:获取同一第二字信息串中不同单位信息之间的逻辑关系建立逻辑树,将对应的反馈信息输入到逻辑树的叶节点上,得到信息逻辑树;
步骤34:根据所信息逻辑树生成反馈数据,将所述反馈数据转换为预设数据格式,得到第二子信息对应的编码数据。
该实例中,空白序列位表示不含有第一字典数据的序列位;
该实例中,第二信息串与自第二子信息不同,第二信息串表示将单位信息进行排序后的结果;
该实例中,单位信息表示信息量为1的信息;
该实例中,逻辑树可以为二叉树;
该实例中,逻辑树表示表示不同单位信息之间的逻辑的二叉树;
该实例中,反馈信息表示预设服务器中所查找到的第二信息串的翻译信息;
该实例中,信息逻辑树表示不同反馈信息之间的逻辑关系;
该实例中,反馈数据表示将反馈信息进行逻辑分析后生成的数据;
该实例中,预设数据格式表示与字典数据格式一致的数据格式。
上述技术方案的工作原理以及有益效果:为了减缓服务器查找的工作量,先根据数据序列的空白序列位确定需要进服务器查找的第二子信息,然后将第二子信息划分为多个单位信息,在剔除干扰信息后建立第二信息串,进而及案例查找请求指令,在预设服务器中查找每一单位信息得到了多个反馈信息,为了保证编码数据的有效性,根据不同单位信息之间的逻辑关系及案例逻辑树,然后将反馈信息输入到逻辑树上生成了反馈数据,最后将反馈数据转换为预设数据格式,从而得到了编码数据,这样一来在服务器上查找第二子信息时可以分别查找每一个单位信息,然后得到了对应的反馈信息,通过建立逻辑树的方式来分析不同反馈信息之间的逻辑关系,从而建立一个反馈数据,最后可以得到一个编码数据,通过这样的方式所建立的的编码数据不仅可以对第二子信息进行翻译,而且其逻辑与第二子信息一致,可以保证翻译结果的可理解性。
实施例6
在实施例1的基础上,所述一种前端自动翻译字典值的方法,所述步骤4,包括:
步骤41:对所述编码数据进行数据清洗,将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储;
步骤42:利用所述第二字典数据替换对应的编码数据,根据第一子信息与第二子信息在所述待翻译信息中的信息位置对所述第一字典数据和第二字典数据进行排序,得到数据列表,将所述数据列表中的字典数据记作翻译数据;
步骤43:分别获取每一翻译数据对应的翻译语义,根据所述翻译语义为相邻的翻译数据补充关联数据,得到翻译数据链;
步骤44:获取所述翻译数据链中的有用信息,得到对应待翻译信息的字典值信息。
该实例中,翻译语义表示翻译数据所表达的含义;
该实例中,关联数据表示关联词语所对应的数据;
该实例中,有用信息表示翻译数据链中的非空白信息。
上述技术方案的工作原理以及有益效果:为减少翻译工作量,在进行翻译前先对编码数据进行数据清洗,然后将清洗后生成的第二字典数据与第二子信息进行配对,将配对的结果存储到预设字典数据库中,为了继续进行翻译工作,利用第二字典数据调换对应的编码数据,然后将第一字典数据和第二字典数据进行排序得到了翻译数据,然后对翻译数据进行语义分析,得到其对应的翻译语义,为了使数据更加完整,根据翻译语义为翻译数据补充关联数据,从而生成了一个翻译数据链,在翻译数据链中获取有用信息,最后得到了翻译信息对应的字典值信息,不仅实现了自动翻译工作,还是提高了翻译效率。
实施例7
在实施例6的基础上,所述一种前端自动翻译字典值的方法,所述步骤41,包括:
步骤411:将所述编码数据进行完整性评价、合法性评价和唯一性评价,得到对应的第一评价结果、第二评价结果和第三评价结果;
步骤412:根据所述第一评价结果、第二评价结果和第三评价结果建立对应的第一清洗数据、第二清洗数据和第三清洗数据,结合所述预设规则对所述编码数据进行数据清洗;
步骤413:对清洗后的编码数据进行完整性评价、合法性评价和唯一性评价,得到对应的第四评价结果、第五评价结果和第六评价结果,将第四评价结果与第一评价结果进行对比,将第五评价结果与第二评价结果进行对比,将第六评价结果与第三评价结果进行对比,得到对应的第一对比结果、第二对比结果、第三对比结果,当所述第一对比结果、第二对比结果和第三对比结果均在预设对比结果范围内时,确定所述编码数据完成清洗;
步骤414:将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储。
该实例中,完整性评价表示判断编码数据中是否存在空白数据、不完整数据的过程;
该实例中,合法性评价表示判断编码数据的类型、内容以及其他数据特征是否满足常理的过程,例如:人类的身高是100米,显然是不对的,不合法的;
该实例中,唯一性评价表示判断编码数据中每一个数据段是否多次重复出现;
该实例中,预设规则表示:将编码数据中的空白数据进行补充、剔除不合法数据以及剔除重复数据的规则;
该实例中,第一评价结果和第四评价结果与完整性评价对应,第二评价结果和第五评价结果与合法性评价对应,第三评价结果和第六评价结果与唯一评价对应;
该实例中,第一对比结果表示第四评价结果与第一评价结果之间的对比关系,第二对比结果表示第五评价结果与第二评价结果之间的对比关系,第三对比结果表示第六评价结果与第三评价结果之间的对比关系。
上述技术方案的工作原理以及有益效果:为了提高数据清洗的有效性和实用性,在数据清洗前先从完整性、合法性和唯一性三个方面对编码数据进行评价,得到了三个评价结果,然后建立清洗数据结合预设规则对编码数据进行清洗,并在清洗后进行清洗效果评价,确定编码数据完成清洗后将第二子信息对第二字典数据进行配对,最后输入到预设字典数据库中,通过数据清洗保证了第二字典信息的有效性。
实施例8
在实施例7的基础上,所述一种前端自动翻译字典值的方法,还包括:
当第一对比结果、第二对比结果、第三对比结果中一个或多个对比结果在预设对比结果范围外时,根据第四评价结果、第五评价结果和第六评价结果生成第四清洗数据、第五清洗数据和第六清洗数据;
根据所述第四清洗数据、第五清洗数据和第六清洗数据结合所述预设规则对所述编码数据进行数据清洗。
上述技术方案的工作原理以及有益效果:当数据清洗不彻底时,生成新的清洗数据对编码数据进行新一轮的清洗工作,由此可以保证后续生成的第二字典数据的有效性。
实施例9
本实施例提供了一种前端自动翻译字典值的组件,如图2所示,包括:
获取模块,用于获取待翻译信息,并将所述待翻译信息划分为若干个子信息;
第一查找模块,用于在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在所述预设字典数据库中获取每条第一子信息对应的第一字典数据;
第二查找模块,用于提取在预设字典数据库中查找失败的第二子信息,在预设服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据;
执行模块,用于根据所述编码数据建立第二字典数据,将所述第二字典数据输入到所述预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为所述待翻译信息建立字典值信息。
该实例中,在预设字典数据库中查找成功的子信息为第一子信息,在预设字典数据库中查找失败的子信息为第二子信息;
该实例中,预设字典数据库中包含多个信息与字典数据的对应关系,记作key-value组,key表示信息,value表示字典数据,且每一key-value组中定义的信息是唯一的;
该实例中,第一字典数据表示已经在预设字典数据库中存储的字典数据;
该实例中,预设服务器可以为与前端具有连接关系的任何服务器;
该实例中,编码数据表示在服务器中查找到的用来翻译第二子信息的数据;
该实例中,第二字典数据表示第一次出现在预设字典数据库中的字典数据;
该实例中,字典值信息表示由多个字典值表示待翻译信息的结果。
上述技术方案的工作原理以及有益效果:为了避免在同一时间向服务器发出多个请求指令导致浏览器崩溃,首先将待翻译信息划分为若干个子信息,然后在字典数据库中查找子信息得,到其对应的第一字典数据,若此时还未完成查找,在服务器中查找剩余的子信息,得到其对应的编码数据从而结合第一字典数据得到待翻译信息的字典值信息,同时为了减轻服务器的压力根据编码数据更新预设字典数据库,这样一来可以实现字典的自动翻译同时防止了单页面多组件场景下同时重复请求与多页面单组件重复请求的情况,且随时更新预设字典数据库,提高了下一次自动翻译的效率。
实施例10
在实施例9的基础上,所述一种前端自动翻译字典值的组件,所述执行模块,包括:
数据清洗单元,用于对所述编码数据进行数据清洗,将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储;
数字处理单元,用于利用所述第二字典数据替换对应的编码数据,根据第一子信息与第二子信息在所述待翻译信息中的信息位置对所述第一字典数据和第二字典数据进行排序,得到数据列表,将所述数据列表中的字典数据记作翻译数据;
数据翻译单元,用于分别获取每一翻译数据对应的翻译语义,根据所述翻译语义为相邻的翻译数据补充关联数据,得到翻译数据链;
翻译执行单元,用于获取所述翻译数据链中的有用信息,得到对应待翻译信息的字典值信息。
该实例中,翻译语义表示翻译数据所表达的含义;
该实例中,关联数据表示关联词语所对应的数据;
该实例中,有用信息表示翻译数据链中的非空白信息。
上述技术方案的工作原理以及有益效果:为减少翻译工作量,在进行翻译前先对编码数据进行数据清洗,然后将清洗后生成的第二字典数据与第二子信息进行配对,将配对的结果存储到预设字典数据库中,为了继续进行翻译工作,利用第二字典数据调换对应的编码数据,然后将第一字典数据和第二字典数据进行排序得到了翻译数据,然后对翻译数据进行语义分析,得到其对应的翻译语义,为了使数据更加完整,根据翻译语义为翻译数据补充关联数据,从而生成了一个翻译数据链,在翻译数据链中获取有用信息,最后得到了翻译信息对应的字典值信息,不仅实现了自动翻译工作,还是提高了翻译效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种前端自动翻译字典值的方法,其特征在于,包括:
步骤1:获取待翻译信息,并将所述待翻译信息划分为若干个子信息;
步骤2:在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在所述预设字典数据库中获取每条第一子信息对应的第一字典数据;
步骤3:提取在预设字典数据库中查找失败的第二子信息,在预设服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据;
步骤4:根据所述编码数据建立第二字典数据,将所述第二字典数据输入到所述预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为所述待翻译信息建立字典值信息;
所述步骤4,包括:
步骤41:对所述编码数据进行数据清洗,将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储;
步骤42:利用所述第二字典数据替换对应的编码数据,根据第一子信息与第二子信息在所述待翻译信息中的信息位置对所述第一字典数据和第二字典数据进行排序,得到数据列表,将所述数据列表中的字典数据记作翻译数据;
步骤43:分别获取每一翻译数据对应的翻译语义,根据所述翻译语义为相邻的翻译数据补充关联数据,得到翻译数据链;
步骤44:获取所述翻译数据链中的有用信息,得到对应待翻译信息的字典值信息。
2.如权利要求1所述的一种前端自动翻译字典值的方法,其特征在于,还包括:
在预设字典数据库中分别为每一个字典数据建立一个字典值;
当生成第二字典数据时,根据所述第二字典数据的数据特征,为所述第二字典数据建立字典值,并将建立后的字典值存储到所述预设字典数据库中。
3.如权利要求1所述的一种前端自动翻译字典值的方法,其特征在于,所述步骤1,包括:
步骤11:获取前端采集的待翻译信息;
步骤12:解析所述待翻译信息,得到所述待翻译信息的资源定位符;
步骤13:根据所述资源定位符确定所述待翻译信息的信息来源,根据所述信息来源在预设来源-规则列表中查找对应的目标划分规则;
步骤14:利用所述目标划分规则将所述待翻译信息划分为若干个子信息。
4.如权利要求1所述的一种前端自动翻译字典值的方法,其特征在于,所述步骤2,包括:
步骤21:分别获取每一子信息在所述待翻译信息中的信息位置,根据所述信息位置的先后顺序对所述子信息进行排序,得到子信息序列;
步骤22:在所述子信息序列中依次提取每一子信息,并在所述预设字典数据库中查找被提取的子信息,得到每一子信息与不同预设字典信息的相似度,利用预设相似度样本对所述预设字典信息进行筛选,得到每一子信息对应的目标预设字典信息,建立信息匹配组;
步骤23:根据所述信息匹配组建立对应子信息与不同目标预设字典信息之间的相似权重,以及在所述预设字典数据库中查找每一目标预设字典信息对应的目标字典数据;
步骤24:根据同一子信息与不同有目标预设字典信息之间的相似权重对对应的目标字典数据进行数据训练生成第一字典数据,并根据每一子信息在所述子信息序列中的排序方式对所述第一字典数据进行排序,生成数据序列。
5.如权利要求1所述的一种前端自动翻译字典值的方法,其特征在于,所述步骤3,包括:
步骤31:获取并解析数据序列,得到所述数据序列中的空白序列位对应的子信息,记作第二子信息;
步骤32:分别将每条第二子信息划分为若干个单位信息,剔除干扰信息建立第二信息串,基于所述第二信息串结合预设查找指令建立查找请求指令,将所述查找请求指令输入到预设服务器中分别查找每一单位信息,得到若干个反馈信息;
步骤33:获取同一第二子信息串中不同单位信息之间的逻辑关系建立逻辑树,将对应的反馈信息输入到逻辑树的叶节点上,得到信息逻辑树;
步骤34:根据所信息逻辑树生成反馈数据,将所述反馈数据转换为预设数据格式,得到第二子信息对应的编码数据。
6.如权利要求1所述的一种前端自动翻译字典值的方法,其特征在于,所述步骤41,包括:
步骤411:将所述编码数据进行完整性评价、合法性评价和唯一性评价,得到对应的第一评价结果、第二评价结果和第三评价结果;
步骤412:根据所述第一评价结果、第二评价结果和第三评价结果建立对应的第一清洗数据、第二清洗数据和第三清洗数据,结合预设规则对所述编码数据进行数据清洗;
步骤413:对清洗后的编码数据进行完整性评价、合法性评价和唯一性评价,得到对应的第四评价结果、第五评价结果和第六评价结果,将第四评价结果与第一评价结果进行对比,将第五评价结果与第二评价结果进行对比,将第六评价结果与第三评价结果进行对比,得到对应的第一对比结果、第二对比结果、第三对比结果,当所述第一对比结果、第二对比结果和第三对比结果均在预设对比结果范围内时,确定所述编码数据完成清洗;
步骤414:将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储。
7.如权利要求6所述的一种前端自动翻译字典值的方法,其特征在于,还包括:
当第一对比结果、第二对比结果、第三对比结果中一个或多个对比结果在预设对比结果范围外时,根据第四评价结果、第五评价结果和第六评价结果生成第四清洗数据、第五清洗数据和第六清洗数据;
根据所述第四清洗数据、第五清洗数据和第六清洗数据结合所述预设规则对所述编码数据进行数据清洗。
8.一种前端自动翻译字典值的组件,其特征在于,包括:
获取模块,用于获取待翻译信息,并将所述待翻译信息划分为若干个子信息;
第一查找模块,用于在预设字典数据库中分别查找每一子信息,提取查找成功的第一子信息,并在所述预设字典数据库中获取每条第一子信息对应的第一字典数据;
第二查找模块,用于提取在预设字典数据库中查找失败的第二子信息,在预设服务器中发起查找请求分别查找每条第二子信息,得到每条第二子信息对应的编码数据;
执行模块,用于根据所述编码数据建立第二字典数据,将所述第二字典数据输入到所述预设字典数据库中进行存储,以及根据每条第一子信息对应的第一字典数据和每条第二子信息对应的编码数据为所述待翻译信息建立字典值信息;
所述执行模块,包括:
数据清洗单元,用于对所述编码数据进行数据清洗,将清洗后的编码数据记作第二字典数据,并将所述第二子信息与第二字典数据进行配对,输入到所述预设字典数据库中进行存储;
数字处理单元,用于利用所述第二字典数据替换对应的编码数据,根据第一子信息与第二子信息在所述待翻译信息中的信息位置对所述第一字典数据和第二字典数据进行排序,得到数据列表,将所述数据列表中的字典数据记作翻译数据;
数据翻译单元,用于分别获取每一翻译数据对应的翻译语义,根据所述翻译语义为相邻的翻译数据补充关联数据,得到翻译数据链;
翻译执行单元,用于获取所述翻译数据链中的有用信息,得到对应待翻译信息的字典值信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310740070.XA CN116911321B (zh) | 2023-06-21 | 2023-06-21 | 一种前端自动翻译字典值的方法及组件 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310740070.XA CN116911321B (zh) | 2023-06-21 | 2023-06-21 | 一种前端自动翻译字典值的方法及组件 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116911321A CN116911321A (zh) | 2023-10-20 |
CN116911321B true CN116911321B (zh) | 2024-05-14 |
Family
ID=88350179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310740070.XA Active CN116911321B (zh) | 2023-06-21 | 2023-06-21 | 一种前端自动翻译字典值的方法及组件 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116911321B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5991713A (en) * | 1997-11-26 | 1999-11-23 | International Business Machines Corp. | Efficient method for compressing, storing, searching and transmitting natural language text |
US6278967B1 (en) * | 1992-08-31 | 2001-08-21 | Logovista Corporation | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis |
US6789057B1 (en) * | 1997-01-07 | 2004-09-07 | Hitachi, Ltd. | Dictionary management method and apparatus |
WO2009026850A1 (en) * | 2007-08-23 | 2009-03-05 | Google Inc. | Domain dictionary creation |
CN110990406A (zh) * | 2019-11-28 | 2020-04-10 | 中国建设银行股份有限公司 | 一种模糊查询方法、装置、设备和介质 |
CN115906878A (zh) * | 2022-10-31 | 2023-04-04 | 北京中科智加科技有限公司 | 一种基于提示的机器翻译方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2487798B1 (en) * | 2004-12-07 | 2016-08-10 | Nippon Telegraph And Telephone Corporation | Information compression-coding device, its decoding device, method thereof, program thereof and recording medium storing the program |
-
2023
- 2023-06-21 CN CN202310740070.XA patent/CN116911321B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6278967B1 (en) * | 1992-08-31 | 2001-08-21 | Logovista Corporation | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis |
US6789057B1 (en) * | 1997-01-07 | 2004-09-07 | Hitachi, Ltd. | Dictionary management method and apparatus |
US5991713A (en) * | 1997-11-26 | 1999-11-23 | International Business Machines Corp. | Efficient method for compressing, storing, searching and transmitting natural language text |
WO2009026850A1 (en) * | 2007-08-23 | 2009-03-05 | Google Inc. | Domain dictionary creation |
CN110990406A (zh) * | 2019-11-28 | 2020-04-10 | 中国建设银行股份有限公司 | 一种模糊查询方法、装置、设备和介质 |
CN115906878A (zh) * | 2022-10-31 | 2023-04-04 | 北京中科智加科技有限公司 | 一种基于提示的机器翻译方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116911321A (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3968245A1 (en) | Automatically generating a pipeline of a new machine learning project from pipelines of existing machine learning projects stored in a corpus | |
CN113656547B (zh) | 文本匹配方法、装置、设备及存储介质 | |
CN106372053B (zh) | 句法分析的方法和装置 | |
CN111651198A (zh) | 代码摘要自动化生成方法及装置 | |
CN1629837A (zh) | 电子文档的处理、浏览及分类查询的方法、装置及其系统 | |
CN115576840B (zh) | 基于机器学习的静态程序插桩检测方法及装置 | |
CN118211941B (zh) | 基于rpa的社区工单自动流转方法及系统 | |
CN116719520A (zh) | 代码生成方法及装置 | |
CN111831624A (zh) | 数据表创建方法、装置、计算机设备及存储介质 | |
CN116911321B (zh) | 一种前端自动翻译字典值的方法及组件 | |
CN118051581A (zh) | 一种基于深度学习的专利检索方及系统 | |
CN117708282A (zh) | 一种基于大语言模型的知识问答方法及系统 | |
CN110413757B (zh) | 一种词语释义确定方法、装置及系统 | |
EP4254279A1 (en) | Machine learning pipeline augmented with explanation | |
CN106776590A (zh) | 一种获取词条译文的方法及系统 | |
CN112115362B (zh) | 一种基于相似代码识别的编程信息推荐方法及装置 | |
CN112925874B (zh) | 基于案例标记的相似代码搜索方法及系统 | |
CN110543622A (zh) | 文本相似度检测方法、装置、电子设备及可读存储介质 | |
CN114969131B (zh) | 一种信息的查询方法、装置及设备 | |
CN118396250B (zh) | 生产制作指示的生成方法、装置、设备及存储介质 | |
CN113919371B (zh) | 一种翻译语料库的匹配方法 | |
EP4053759A1 (en) | Machine learning pipeline skeleton instantiation | |
EP4050525A2 (en) | Machine learning pipeline skeleton instantiation | |
EP4050524A2 (en) | Machine learning pipeline skeleton instantiation | |
CN117010019B (zh) | 一种基于nlp语言模型的数据脱敏方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |