CN116090442A - 一种语言差异分析方法、系统、终端及存储介质 - Google Patents

一种语言差异分析方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN116090442A
CN116090442A CN202211307368.3A CN202211307368A CN116090442A CN 116090442 A CN116090442 A CN 116090442A CN 202211307368 A CN202211307368 A CN 202211307368A CN 116090442 A CN116090442 A CN 116090442A
Authority
CN
China
Prior art keywords
target
character
word class
structural formula
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211307368.3A
Other languages
English (en)
Other versions
CN116090442B (zh
Inventor
袁伟菡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202211307368.3A priority Critical patent/CN116090442B/zh
Publication of CN116090442A publication Critical patent/CN116090442A/zh
Application granted granted Critical
Publication of CN116090442B publication Critical patent/CN116090442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及语言学技术领域,尤其涉及一种语言差异分析方法、系统、终端及存储介质;其方法包括:获取目标字符,基于目标字符,获取目标语种,基于目标语种,获取目标语法,判断目标字符是否满足目标语法,若目标字符满足目标语法,则判断目标字符中是否存在目标词类构式,若目标字符中存在目标词类构式,则将目标字符输入到预设的语言学习模型中,将目标字符翻译成对比字符,基于对比字符,获取对比词类构式,判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,则获取差异因素,对差异因素进行分析,生存并保存分析结果。本申请有助于增强对不同语种之间的表达差异性研究,明确造成表达差异的差异因素。

Description

一种语言差异分析方法、系统、终端及存储介质
技术领域
本申请涉及语言学技术领域,尤其涉及一种语言差异分析方法、系统、终端及存储介质。
背景技术
语言既是一种社会现象,也是一种文化现象。语言与文化是相互依存,相互影响的,它们之间有着千丝万缕的联系,是紧密交织在一起的。语言是文化的产物,又是文化的媒介,它的形成与发展离不开民族的社会历史和文化。没有语言,就没有文化。从另一个方面看,语言又受文化的影响,并反映一个民族的特征,同时反映出该民族的历史和文化背景,而且蕴藏着该民族对人生的看法,生活方式和思维方式。
由于不同文化之间存在差异,因此通过不同语言进行表达时,也存在着差异,这不仅体现在语法结构上,也体现在语言使用环境上,例如,对不同语种进行互译时,若对不同语种的语法结构以及使用环境不甚了解,则很容易出现结构和用词错误。
发明内容
为了有助于增强对不同语种之间的表达差异性研究,明确造成表达差异的差异因素,本申请提供一种语言差异分析方法、系统、终端及存储介质。
第一方面本申请提供的一种语言差异分析方法,采用如下的技术方案:
一种语言差异分析方法,包括:
获取目标字符;
基于所述目标字符,获取目标语种;
基于所述目标语种,获取目标语法;
判断所述目标字符是否满足所述目标语法;
若所述目标字符满足所述目标语法,则判断所述目标字符中是否存在目标词类构式;
若所述目标字符中存在所述目标词类构式,则将所述目标字符输入到预设的语言学习模型中;
将所述目标字符翻译成对比字符;
基于所述对比字符,获取对比词类构式;
判断所述目标词类构式与所述对比词类构式是否存在差异;
若所述目标词类构式与所述对比词类构式存在差异,则获取差异因素;
对所述差异因素进行分析,生存并保存分析结果。
通过采用上述技术方案,基于目标字符获取目标语种,在确定目标语种后,获取与目标语种相对应的目标语法,对目标字符进行分析,并判断目标字符是否满足目标语法,若目标字符满足目标语法,再判断目标字符中是否存在目标词类构式,最后判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,则对造成差异的原因进行分析,增强对不同语种之间的表达差异性研究,有助于明确造成表达差异的差异因素,对差异因素进行分析后,生存并保存分析结果,有助于在下次翻译时根据该分析结果更加准确的进行目标语种之间的互译。
可选的,所述判断所述目标字符是否满足所述目标语法的具体步骤包括:
对所述目标字符进行分析;
判断所述目标字符是否符合预设的句式标准;
若所述目标字符符合预设的句式标准,则判定所述目标字符满足所述目标语法;
若所述目标字符不合法所述句式标准,则判定所述目标字符不满足所述目标语法。
通过采用上述技术方案,先判断目标字符是否符合预设的句式标准,若目标字符符合预设的句式标准,则判定目标字符满足目标语法,若目标字符不合法句式标准,则判定目标字符不满足目标语法,有助于排除乱码字符干扰,从而有助于更加精准的对不同语种之间进行表达差异性研究。
可选的,所述将所述目标字符翻译成对比字符的具体步骤包括:
判断所述语言学习模型中是否存在历史翻译记录;
若所述语言学习模型中存在历史翻译记录,则判断所述历史翻译记录中是否存在目标翻译记录;
若所述历史翻译记录中存在目标翻译记录,则基于所述目标翻译记录将所述目标字符翻译成对比字符;
若所述历史翻译记录中不存在目标翻译记录,则获取目标语义;
基于所述目标语义,将所述目标字符翻译成对比字符。
通过采用上述技术方案,先判断语言学习模型中是否存在历史翻译记录,再判断历史翻译记录中是否存在目标翻译记录,若历史翻译记录中存在目标翻译记录,则根据目标翻译记录将目标字符翻译成对比字符,不仅有助于提高翻译效率,还有助于提高翻译准确性。
可选的,所述判断所述目标词类构式与所述对比词类构式是否存在差异的具体步骤包括:
对所述目标词类构式进行分析,并生成第一分析结果;
对所述对比词类构式进行分析,并生成第二分析结果;
判断所述第一分析结果与所述第二分析结果是否相符合;
若所述第一分析结果与所述第二分析结果相符合,则判定所述目标词类构式与所述对比词类构式不存在差异;
若所述第一分析结果与所述第二分析结果不相符合,则判定所述目标词类构式与所述对比词类构式存在差异。
通过采用上述技术方案,判断第一分析结果与第二分析结果是否相符合,从而判定目标词类构式与对比词类构式是否存在差异,有助于明确造成表达差异的差异因素。
可选的,所述差异因素包括容纳维度;所述若所述目标词类构式与所述对比词类构式存在差异,则获取差异因素的具体步骤包括:
若所述目标词类构式与所述对比词类构式存在差异,则基于所述目标字符和/或所述对比字符,获取目标空间;
判断所述目标空间是否为实体空间;
若所述目标空间为实体空间,则基于所述目标空间以及所述语言学习模型,分别获取所述目标空间在不同所述目标语种所对应的所述容纳维度;
判断不同所述目标语种所对应的容纳维度是否一致;
若不同所述目标语种所对应的容纳维度不一致,则将所述容纳维度作为差异因素。
通过采用上述技术方案,根据目标字符和/或对比字符,获取目标空间,判断目标空间是否为实体空间,若目标空间为实体空间,分别获取目标空间在不同目标语种所对应的容纳维度,最后通过判断不同目标语种所对应的容纳维度是否一致来判定差异因素,通过对实体空间属性进行分析,有助于更加精准的明确造成表达差异的差异因素。
可选的,所述差异因素包括;还包括:
若所述目标空间不是实体空间,则获取意象图式;
将所述作为所述差异因素。
通过采用上述技术方案,当目标空间不是实体空间时,通过对意象图式进行分析,有助于更加精准的明确造成表达差异的差异因素。
第二方面,本申请还公开了一种语言差异分析系统,采用如下的技术方案:
一种语言差异分析系统,包括:
第一获取模块,用于获取目标字符;
第二获取模块,用于基于所述目标字符,获取目标语种;
第三获取模块,用于基于所述目标语种,获取目标语法;
第一判断模块,用于判断所述目标字符是否满足所述目标语法;
第二判断模块,若所述目标字符满足所述目标语法,第二判断模块用于判断所述目标字符中是否存在目标词类构式;
输入模块,若所述目标字符中存在所述目标词类构式,则所述输入模块用于将所述目标字符输入到预设的语言学习模型中;
翻译模块,用于将所述目标字符翻译成对比字符;
第四获取模块,用于基于所述对比字符,获取对比词类构式;
第三判断模块,用于判断所述目标词类构式与所述对比词类构式是否存在差异;
第五获取模块,若所述目标词类构式与所述对比词类构式存在差异,则第五获取模块用于获取差异因素;
分析模块,用于对所述差异因素进行分析,生存并保存分析结果。
通过采用上述技术方案,基于目标字符获取目标语种,在确定目标语种后,获取与目标语种相对应的目标语法,对目标字符进行分析,并判断目标字符是否满足目标语法,若目标字符满足目标语法,再判断目标字符中是否存在目标词类构式,最后判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,则对造成差异的原因进行分析,增强对不同语种之间的表达差异性研究,有助于明确造成表达差异的差异因素,对差异因素进行分析后,生存并保存分析结果,有助于在下次翻译时根据该分析结果更加准确的进行目标语种之间的互译。
第三方面,本申请提供的一种计算机装置,采用如下的技术方案:
一种智能终端,包括存储器、处理器,所述存储器中用于存储能够在所述处理器上运行的计算机程序,所述处理器加载计算机程序时,执行第一方面的方法。
通过采用上述技术方案,基于第一方面的方法生成计算机程序,并存储于存储器中,以被处理器加载执行,从而,根据存储器及处理器制作智能终端,方便使用者使用。
第四方面,本申请提供的一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器加载时,执行第一方面的方法。
通过采用上述技术方案,基于第一方面的方法生成计算机程序,并存储于计算机可读存储介质中,以被处理器加载并执行,通过计算机可读存储介质,方便计算机程序的可读及存储。
综上所述,本申请包括以下有益技术效果:
基于目标字符获取目标语种,在确定目标语种后,获取与目标语种相对应的目标语法,对目标字符进行分析,并判断目标字符是否满足目标语法,若目标字符满足目标语法,再判断目标字符中是否存在目标词类构式,最后判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,则对造成差异的原因进行分析,增强对不同语种之间的表达差异性研究,有助于明确造成表达差异的差异因素,对差异因素进行分析后,生存并保存分析结果,有助于在下次翻译时根据该分析结果更加准确的进行目标语种之间的互译。
附图说明
图1是本申请实施例一种语言差异分析方法的主要流程图;
图2是步骤S201至步骤S204的具体步骤流程图;
图3是步骤S301至步骤S305的具体步骤流程图;
图4是步骤S401至步骤S405的具体步骤流程图;
图5是步骤S501至步骤S505的步骤流程图;
图6是步骤S601至步骤S602的步骤流程图;
图7是本申请实施例一种语言差异分析系统的模块图。
附图标记说明:
1、第一获取模块;2、第二获取模块;3、第三获取模块;4、第一判断模块;5、第二判断模块;6、输入模块;7、翻译模块;8、第四获取模块;9、第三判断模块;10、第五获取模块;11、分析模块。
具体实施方式
第一方面,本申请公开了一种语言差异分析方法。
参照图1,一种语言差异分析方法,包括步骤S101至步骤S111:
步骤S101:获取目标字符。
具体的,本实施例中,目标字符可以为任意字符或字符段,可以从网络上直接获取,也可以是通过扫描或人工输入获取。
步骤S102:基于目标字符,获取目标语种。
具体的,本实施例中,目标语种即与目标字符所对应的语种。
步骤S103:基于目标语种,获取目标语法。
具体的,本实施例中,目标语法即与目标语种所对应的语法,目标语法可以从数据库进行调取,也可以直接从网络上获取。
步骤S104:判断目标字符是否满足目标语法。
具体的,本实施例中,通过对目标字符进行分析,判断其是否满足目标语法的要求。
步骤S105:若目标字符满足目标语法,则判断目标字符中是否存在目标词类构式。
具体的,本实施例中,目标词类构式即由某种词类或词类短语组成的构式,本实施例中,可以是介词短语组成的构式,例如(介词+)NP+方位词等,其中,介词可以根据实际情况省略;此外,当目标字符不满足目标语法时,则提示用户对目标字符进行修改或重新获取目标字符。
步骤S106:若目标字符中存在目标词类构式,则将目标字符输入到预设的语言学习模型中。
具体的,本实施例中,预设的语言学习模型中收录有大量语种以及相对应的语法,还收录有大量文字,包括中文、法语以及英语等。
步骤S107:将目标字符翻译成对比字符。
具体的,本实施例中,对比字符为与目标字符进行差异性研究的语种所对应的字符。
步骤S108:基于对比字符,获取对比词类构式。
具体的,本实施例中,对比词类构式即目标词类构式翻译成对比字符后的构式。
步骤S109:判断目标词类构式与对比词类构式是否存在差异;
具体的,本实施例中,目标词类构式与对比词类构式是否存在差异指目标词类构式所表达的意思与对比词类构式所表达的意思是否一致,例如,在法语与汉语空间介词差异性研究中心,法语表述为:Il dort dans son lit;而汉语表述为:他在床上睡觉;很显然法语着重表述为在…里,而汉语着重于在…上。
步骤S110:若目标词类构式与对比词类构式存在差异,则获取差异因素。
具体的,本实施例中,差异因素指造成不同语言表达形式存在差异的因素;此外当目标词类构式与对比词类构式不存在差异,则可以不进行任何操作,也可以将该目标字符以及对比字符作为不存在差异示例保存于语言学习模型中。
步骤S111:对差异因素进行分析,生存并保存分析结果。
具体的,本实施例中,将分析结果保存至语言学习模型中。
本实施例提供的语言差异分析方法,基于目标字符获取目标语种,在确定目标语种后,获取与目标语种相对应的目标语法,对目标字符进行分析,并判断目标字符是否满足目标语法,若目标字符满足目标语法,再判断目标字符中是否存在目标词类构式,最后判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,则对造成差异的原因进行分析,增强对不同语种之间的表达差异性研究,有助于明确造成表达差异的差异因素,对差异因素进行分析后,生存并保存分析结果,有助于在下次翻译时根据该分析结果更加准确的进行目标语种之间的互译。
参照图2,在本实施例的其中一种实施方式中,步骤S104判断目标字符是否满足目标语法的具体步骤包括步骤S201至步骤S204:
步骤S201:对目标字符进行分析。
具体的,本实施例中,对目标字符的结构进行分析。
步骤S202:判断目标字符是否符合预设的句式标准。
具体的,预设的句式标准即目标语法所允许的一切构式,本实施例中,指目标语法所允许的由空间介词组成的构式。
步骤S203:若目标字符符合预设的句式标准,则判定目标字符满足目标语法。
步骤S204:若目标字符不合法句式标准,则判定目标字符不满足目标语法。
本实施方式提供的语言差异分析方法,先判断目标字符是否符合预设的句式标准,若目标字符符合预设的句式标准,则判定目标字符满足目标语法,若目标字符不合法句式标准,则判定目标字符不满足目标语法,有助于排除乱码字符干扰,从而有助于更加精准的对不同语种之间进行表达差异性研究。
参照图3,在本实施例的其中一种实施方式中,步骤S107将目标字符翻译成对比字符的具体步骤包括步骤S301至步骤S305:
步骤S301:判断语言学习模型中是否存在历史翻译记录。
具体的,本实施例中,历史翻译记录包括本次翻译之前所有的翻译记录。
步骤S302:若语言学习模型中存在历史翻译记录,则判断历史翻译记录中是否存在目标翻译记录。
具体的,本实施例中,目标翻译记录指与本次翻译内容或形式一致的翻译记录。
步骤S303:若历史翻译记录中存在目标翻译记录,则基于目标翻译记录将目标字符翻译成对比字符。
具体的,本实施例中,若历史翻译记录中存在目标翻译记录,则根据目标翻译记录的翻译方式进行翻译,例如,如果存在与本次翻译内容一致的翻译记录,则可完全按照目标翻译记录对目标字符进行翻译,如果存在与本次翻译形式一致的翻译记录,则根据目标翻译记录的翻译方式对目标字符进行翻译。
步骤S304:若历史翻译记录中不存在目标翻译记录,则获取目标语义。
具体的,本实施例中,目标语义即目标字符所想要表达的实际意义。
步骤S305:基于目标语义,将目标字符翻译成对比字符。
本实施方式提供的语言差异分析方法,先判断语言学习模型中是否存在历史翻译记录,再判断历史翻译记录中是否存在目标翻译记录,若历史翻译记录中存在目标翻译记录,则根据目标翻译记录将目标字符翻译成对比字符,不仅有助于提高翻译效率,还有助于提高翻译准确性。
参照图4,在本实施例的其中一种实施方式中,步骤S109判断目标词类构式与对比词类构式是否存在差异的具体步骤包括步骤S401至步骤S405:
步骤S401:对目标词类构式进行分析,并生成第一分析结果。
具体的,本实施例中,第一分析结果中包含目标词类构式的表达方式以及其所表达的意思。
步骤S402:对对比词类构式进行分析,并生成第二分析结果。
具体的,本实施例中,第二分析结果中包含对比词类构式的表达方式以及其所表达的意思。
步骤S403:判断第一分析结果与第二分析结果是否相符合。
具体的,本实施例中,通过判断第一分析结果中目标词类构式所表达的意思和第二分析结果中对比词类构式所表达的意思是否一致,来判断第一分析结果与第二分析结果是否相符合。
步骤S404:若第一分析结果与第二分析结果相符合,则判定目标词类构式与对比词类构式不存在差异。
步骤S405:若第一分析结果与第二分析结果不相符合,则判定目标词类构式与对比词类构式存在差异。
本实施方式提供的语言差异分析方法,判断第一分析结果与第二分析结果是否相符合,从而判定目标词类构式与对比词类构式是否存在差异,有助于明确造成表达差异的差异因素。
参照图5,在本实施例的其中一种实施方式中,步骤S110若目标词类构式与对比词类构式存在差异,则获取差异因素的具体步骤包括步骤S501至步骤S505:
步骤S501:若目标词类构式与对比词类构式存在差异,则基于目标字符和/或对比字符,获取目标空间。
具体的,本实施例中,目标空间是目标字符和/或对比字符中空间名词所对应的空间,目标空间包括实体空间和抽象空间,现实空间可以是房间,汽车等,抽象空间则可以是某段历史以及某件事情等。
步骤S502:判断目标空间是否为实体空间。
步骤S503:若目标空间为实体空间,则基于目标空间以及语言学习模型,分别获取目标空间在不同目标语种所对应的容纳维度。
具体的,本实施例中,差异因素包括容纳维度,容纳维度指目标空间的维度。
步骤S504:判断不同目标语种所对应的容纳维度是否一致。
步骤S505:若不同目标语种所对应的容纳维度不一致,则将容纳维度作为差异因素。
本实施方式提供的语言差异分析方法,根据目标字符和/或对比字符,获取目标空间,判断目标空间是否为实体空间,若目标空间为实体空间,分别获取目标空间在不同目标语种所对应的容纳维度,最后通过判断不同目标语种所对应的容纳维度是否一致来判定差异因素,通过对实体空间属性进行分析,有助于更加精准的明确造成表达差异的差异因素。
参照图6,在本实施例的其中一种实施方式中,还包括步骤S601至步骤S602:
步骤S601:若目标空间不是实体空间,则获取意象图式。
具体的,本实施例中,差异因素包括意象图式。
步骤S602:将意象图式作为差异因素。
本实施方式提供的语言差异分析方法,当目标空间不是实体空间时,通过对意象图式进行分析,有助于更加精准的明确造成表达差异的差异因素;意象图式指人类在与客观外界进行互动性体验过程中反复出现的常规性样式,它们主要起意象性抽象结构的功能。
本申请实施例一种语言差异分析方法的实施原理为:获取目标字符,基于目标字符,获取目标语种,基于目标语种,获取目标语法,判断目标字符是否满足目标语法,若目标字符满足目标语法,则判断目标字符中是否存在目标词类构式,若目标字符中存在目标词类构式,则将目标字符输入到预设的语言学习模型中,将目标字符翻译成对比字符,基于对比字符,获取对比词类构式,判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,则获取差异因素,对差异因素进行分析,生存并保存分析结果。
第二方面,本申请还公开了一种语言差异分析系统。
参照图7,一种语言差异分析系统,包括:
第一获取模块1,用于获取目标字符;
第二获取模块2,用于基于目标字符,获取目标语种;
第三获取模块3,用于基于目标语种,获取目标语法;
第一判断模块4,用于判断目标字符是否满足目标语法;
第二判断模块5,若目标字符满足目标语法,第二判断模块5用于判断目标字符中是否存在目标词类构式;
输入模块6,若目标字符中存在目标词类构式,则输入模块6用于将目标字符输入到预设的语言学习模型中;
翻译模块7,用于将目标字符翻译成对比字符;
第四获取模块8,用于基于对比字符,获取对比词类构式;
第三判断模块9,用于判断目标词类构式与对比词类构式是否存在差异;
第五获取模块10,若目标词类构式与对比词类构式存在差异,则第五获取模块10用于获取差异因素;
分析模块11,用于对差异因素进行分析,生存并保存分析结果。
本申请实施例一种语言差异分析系统的实施原理为:第一获取模块1获取目标字符并将目标字符发送至第二获取模块2,第二获取模块2基于目标字符,获取目标语种,并将目标语种发送至第三获取模块3,第三获取模块3基于目标语种,获取目标语法,并将目标语法发送至第一判断模块4,第一判断模块4判断目标字符是否满足目标语法,若目标字符满足目标语法,第一判断模块4将第一判断结果发送至第二判断模块5;
第二判断模块5判断目标字符中是否存在目标词类构式,若目标字符中存在目标词类构式,则第二判断模块5将第二判断结果发送至输入模块6,输入模块6将目标字符输入到预设的语言学习模型中,翻译模块7,将目标字符翻译成对比字符,并将对比字符发送至第四获取模块8,第四获取模块8基于对比字符,获取对比词类构式,并将对比词类构式发送至第三判断模块9,第三判断模块9判断目标词类构式与对比词类构式是否存在差异,若目标词类构式与对比词类构式存在差异,第三判断模块9将第三判断结果发送至第五获取模块10,第五获取模块10获取差异因素,并将获取差异因素发送至分析模块11,分析模块11对差异因素进行分析,生存并保存分析结果,从而达到与前述一种语言差异分析方法同样的技术效果。
第三方面,本申请实施例公开一种智能终端,包括存储器、处理器,存储器中用于存储能够在处理器上运行的计算机程序,处理器加载计算机程序时,执行上述实施例的一种语言差异分析方法。
第四方面,本申请实施例公开一种计算机可读存储介质,并且,计算机可读存储介质中存储有计算机程序,其中,计算机程序被处理器加载时,执行上述实施例的一种语言差异分析方法。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

Claims (9)

1.一种语言差异分析方法,其特征在于,包括:
获取目标字符;
基于所述目标字符,获取目标语种;
基于所述目标语种,获取目标语法;
判断所述目标字符是否满足所述目标语法;
若所述目标字符满足所述目标语法,则判断所述目标字符中是否存在目标词类构式;
若所述目标字符中存在所述目标词类构式,则将所述目标字符输入到预设的语言学习模型中;
将所述目标字符翻译成对比字符;
基于所述对比字符,获取对比词类构式;
判断所述目标词类构式与所述对比词类构式是否存在差异;
若所述目标词类构式与所述对比词类构式存在差异,则获取差异因素;
对所述差异因素进行分析,生存并保存分析结果。
2.根据权利要求1所述的一种语言差异分析方法,其特征在于,所述判断所述目标字符是否满足所述目标语法的具体步骤包括:
对所述目标字符进行分析;
判断所述目标字符是否符合预设的句式标准;
若所述目标字符符合预设的句式标准,则判定所述目标字符满足所述目标语法;
若所述目标字符不合法所述句式标准,则判定所述目标字符不满足所述目标语法。
3.根据权利要求2所述的一种语言差异分析方法,其特征在于,所述将所述目标字符翻译成对比字符的具体步骤包括:
判断所述语言学习模型中是否存在历史翻译记录;
若所述语言学习模型中存在历史翻译记录,则判断所述历史翻译记录中是否存在目标翻译记录;
若所述历史翻译记录中存在目标翻译记录,则基于所述目标翻译记录将所述目标字符翻译成对比字符;
若所述历史翻译记录中不存在目标翻译记录,则获取目标语义;
基于所述目标语义,将所述目标字符翻译成对比字符。
4.根据权利要求1所述的一种语言差异分析方法,其特征在于,所述判断所述目标词类构式与所述对比词类构式是否存在差异的具体步骤包括:
对所述目标词类构式进行分析,并生成第一分析结果;
对所述对比词类构式进行分析,并生成第二分析结果;
判断所述第一分析结果与所述第二分析结果是否相符合;
若所述第一分析结果与所述第二分析结果相符合,则判定所述目标词类构式与所述对比词类构式不存在差异;
若所述第一分析结果与所述第二分析结果不相符合,则判定所述目标词类构式与所述对比词类构式存在差异。
5.根据权利要求1所述的一种语言差异分析方法,其特征在于,所述差异因素包括容纳维度;所述若所述目标词类构式与所述对比词类构式存在差异,则获取差异因素的具体步骤包括:
若所述目标词类构式与所述对比词类构式存在差异,则基于所述目标字符和/或所述对比字符,获取目标空间;
判断所述目标空间是否为实体空间;
若所述目标空间为实体空间,则基于所述目标空间以及所述语言学习模型,分别获取所述目标空间在不同所述目标语种所对应的所述容纳维度;
判断不同所述目标语种所对应的容纳维度是否一致;
若不同所述目标语种所对应的容纳维度不一致,则将所述容纳维度作为差异因素。
6.根据权利要求5所述的一种语言差异分析方法,其特征在于,所述差异因素包括;还包括:
若所述目标空间不是实体空间,则获取意象图式;
将所述作为所述差异因素。
7.一种语言差异分析系统,其特征在于,包括:
第一获取模块(1),用于获取目标字符;
第二获取模块(2),用于基于所述目标字符,获取目标语种;
第三获取模块(3),用于基于所述目标语种,获取目标语法;
第一判断模块(4),用于判断所述目标字符是否满足所述目标语法;
第二判断模块(5),若所述目标字符满足所述目标语法,第二判断模块(5)用于判断所述目标字符中是否存在目标词类构式;
输入模块(6),若所述目标字符中存在所述目标词类构式,则所述输入模块(6)用于将所述目标字符输入到预设的语言学习模型中;
翻译模块(7),用于将所述目标字符翻译成对比字符;
第四获取模块(8),用于基于所述对比字符,获取对比词类构式;
第三判断模块(9),用于判断所述目标词类构式与所述对比词类构式是否存在差异;
第五获取模块(10),若所述目标词类构式与所述对比词类构式存在差异,则第五获取模块(10)用于获取差异因素;
分析模块(11),用于对所述差异因素进行分析,生存并保存分析结果。
8.一种智能终端,包括存储器、处理器,其特征在于,所述存储器中用于存储能够在所述处理器上运行的计算机程序,所述处理器加载计算机程序时,执行权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器加载时,执行权利要求1-6中任一项所述的方法。
CN202211307368.3A 2022-10-24 2022-10-24 一种语言差异分析方法、系统、终端及存储介质 Active CN116090442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211307368.3A CN116090442B (zh) 2022-10-24 2022-10-24 一种语言差异分析方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211307368.3A CN116090442B (zh) 2022-10-24 2022-10-24 一种语言差异分析方法、系统、终端及存储介质

Publications (2)

Publication Number Publication Date
CN116090442A true CN116090442A (zh) 2023-05-09
CN116090442B CN116090442B (zh) 2023-09-22

Family

ID=86185632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211307368.3A Active CN116090442B (zh) 2022-10-24 2022-10-24 一种语言差异分析方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN116090442B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040064456A1 (en) * 2002-09-27 2004-04-01 Fong Joseph Shi Piu Methods for data warehousing based on heterogenous databases
WO2010102559A1 (zh) * 2009-03-11 2010-09-16 Lin Xunzhun 一种机器翻译方法及系统
JP2013254473A (ja) * 2012-05-10 2013-12-19 Takashi Kinoshita 中国文を日本文に自動翻訳する方法
US20150178271A1 (en) * 2013-12-19 2015-06-25 Abbyy Infopoisk Llc Automatic creation of a semantic description of a target language
US20170060854A1 (en) * 2015-08-25 2017-03-02 Alibaba Group Holding Limited Statistics-based machine translation method, apparatus and electronic device
US20180165279A1 (en) * 2014-03-28 2018-06-14 Adventor Management Limited Machine translation system and method
WO2019123854A1 (ja) * 2017-12-18 2019-06-27 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
CN111008524A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 语言翻译的处理方法和装置
US20200243076A1 (en) * 2019-01-27 2020-07-30 Min Ku Kim Multi-Dimensional Parsing Method and System for Natural Language Processing
CN114757211A (zh) * 2022-03-16 2022-07-15 广州华多网络科技有限公司 文本翻译方法及其装置、设备、介质、产品
CN114925707A (zh) * 2022-05-16 2022-08-19 浙江伟星实业发展股份有限公司 一种多语言翻译方法、装置、设备、存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040064456A1 (en) * 2002-09-27 2004-04-01 Fong Joseph Shi Piu Methods for data warehousing based on heterogenous databases
WO2010102559A1 (zh) * 2009-03-11 2010-09-16 Lin Xunzhun 一种机器翻译方法及系统
JP2013254473A (ja) * 2012-05-10 2013-12-19 Takashi Kinoshita 中国文を日本文に自動翻訳する方法
US20150178271A1 (en) * 2013-12-19 2015-06-25 Abbyy Infopoisk Llc Automatic creation of a semantic description of a target language
US20180165279A1 (en) * 2014-03-28 2018-06-14 Adventor Management Limited Machine translation system and method
US20170060854A1 (en) * 2015-08-25 2017-03-02 Alibaba Group Holding Limited Statistics-based machine translation method, apparatus and electronic device
WO2019123854A1 (ja) * 2017-12-18 2019-06-27 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
US20200243076A1 (en) * 2019-01-27 2020-07-30 Min Ku Kim Multi-Dimensional Parsing Method and System for Natural Language Processing
CN111008524A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 语言翻译的处理方法和装置
CN114757211A (zh) * 2022-03-16 2022-07-15 广州华多网络科技有限公司 文本翻译方法及其装置、设备、介质、产品
CN114925707A (zh) * 2022-05-16 2022-08-19 浙江伟星实业发展股份有限公司 一种多语言翻译方法、装置、设备、存储介质

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
丁晶;: "浅议英汉副词对比", 农家参谋, no. 02, pages 160 *
刘明莉;杨玲;: "中国英语学习者对动介搭配的习得研究", 蚌埠学院学报, no. 05, pages 120 - 124 *
刘菲菲;: "基于意象图式理论的介词教学研究综述", 大众标准化, no. 08, pages 123 - 124 *
周雷;李颖;石崇德;: "汉语科技词汇构词过程影响因素研究", 情报工程, no. 01, pages 114 - 122 *
张丽丽;戴卫平;: "Goldberg构式语法的"功"与"过"", 西南农业大学学报(社会科学版), no. 03, pages 89 - 93 *
张阳;余正涛;周珂;: "词汇化调序模型中融合语言特性的层次短语翻译方法研究", 计算机与数字工程, no. 12, pages 2389 - 2392 *
王笑盈;冯志伟;张丹;瞿云华;: "现代汉语句子的扩展模式语法模型的构建", 厦门大学学报(自然科学版), no. 06, pages 859 - 866 *
祁坤钰;: "基于语料库的藏语名词分类与统计研究", 西北民族大学学报(自然科学版), no. 03, pages 44 - 49 *
蒋盛益;李珊珊;符斯慧;林楠铠;: "印尼语、马来语自然语言处理研究综述", 模式识别与人工智能, no. 06, pages 530 - 541 *
许冰超;: "论极性程度构式"X得不行"与"X得不要不要的"", 淮阴工学院学报, no. 04, pages 62 - 66 *

Also Published As

Publication number Publication date
CN116090442B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
KR101968102B1 (ko) 논팩토이드형 질의 응답 시스템 및 컴퓨터 프로그램
US20170177563A1 (en) Methods and systems for automated text correction
KR101768852B1 (ko) 트리플 데이터의 생성 방법 및 시스템
CN101131706A (zh) 一种查询修正方法及系统
CN101329666A (zh) 基于语料库及树型结构模式匹配的汉语句法自动分析方法
CN116821103B (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN113987199B (zh) 一种规范自动解译的bim智能审图方法、系统和介质
CN109840255A (zh) 答复文本生成方法、装置、设备及存储介质
CN111737541B (zh) 一种支持多语言的语义识别评估方法
CN109918494A (zh) 基于图的上下文关联回复生成方法、计算机及介质
CN112395871A (zh) 一种搭配构式的自动获取方法和系统、可视化方法
CN114547274A (zh) 多轮问答的方法、装置及设备
CN114896382A (zh) 人工智能问答模型生成方法、问答方法、装置及存储介质
CN114970506A (zh) 基于多粒度语法错误模板学习微调的语法纠错方法和系统
CN114861673A (zh) 一种语义分析方法、装置及设备
CN116090442B (zh) 一种语言差异分析方法、系统、终端及存储介质
US8577924B2 (en) Determining base attributes for terms
US7613601B2 (en) Method for predicting negative example, system for detecting incorrect wording using negative example prediction
CN113255374B (zh) 问答管理方法及系统
CN114997173A (zh) 话题引导方法、装置、电子设备及存储介质
CN115408419A (zh) 一种数据抽取方法及相关装置
CN114021589A (zh) 样本的生成方法、装置、计算机设备和存储介质
CN113408302A (zh) 一种机器翻译结果的评估方法、装置、设备及存储介质
CN113553416A (zh) 基于语义相似度的问答方法、系统和可读存储介质
CN111178096A (zh) 一种基于语义相似度的cameo字典翻译方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant