CN110008468B - 语言系统管理方法、信息转换方法、服务器以及存储介质 - Google Patents

语言系统管理方法、信息转换方法、服务器以及存储介质 Download PDF

Info

Publication number
CN110008468B
CN110008468B CN201910161018.2A CN201910161018A CN110008468B CN 110008468 B CN110008468 B CN 110008468B CN 201910161018 A CN201910161018 A CN 201910161018A CN 110008468 B CN110008468 B CN 110008468B
Authority
CN
China
Prior art keywords
language
information
text
language text
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910161018.2A
Other languages
English (en)
Other versions
CN110008468A (zh
Inventor
周应良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201910161018.2A priority Critical patent/CN110008468B/zh
Publication of CN110008468A publication Critical patent/CN110008468A/zh
Application granted granted Critical
Publication of CN110008468B publication Critical patent/CN110008468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

本申请提供了一种语言系统管理方法、信息转换方法、服务器以及存储介质。该语言系统管理方法包括:接收第一语言编码,计算第一语言编码和语言系统中多个第二语言文本的多个第一相似度;获取多个第一相似度中数值最大的第一相似度,并获取数值最大的第一相似度对应的转换路径;根据转换路径得到对应的第二语言文本,利用对应的第二语言文本进行翻译,获得第一语言编码对应的第一语言文本,并存储在语言系统。本申请的语言系统管理方法能够根据输入的第一语言编码和对应的转换路径得到第二语言文本,并通过第二语言文本翻译出第一语言文本,从而提高语言系统的管理精确度和管理效率。

Description

语言系统管理方法、信息转换方法、服务器以及存储介质
技术领域
本申请涉及直播应用技术领域,特别是涉及一种语言系统管理方法、信息转换方法、服务器以及存储介质。
背景技术
现代生活中,互联网与人们的生活密不可分。通过互联网,用户可以通过直播观看喜欢的明星或者路人的生活和表演。
随着直播国际化,直播信息有可能来自不同的国家或者不同语言,对于处于这些直播信息的服务器而言,服务器需要将来自不同的国家或者不同语言转换为统一的语言,以便于管理。
现有的语言系统的管理方式一般采用机器转换加人工转换的直译模式,但由于语言的种类和用法多种多样,机器转换难以完成高质量的直译工作;若采用人工进行转换,对转换人员的要求很高,并且受到转换人员转换水平和转换速度的限制,影响语言系统的管理精确度和管理效率。
发明内容
本申请提供了一种语言系统管理方法、信息转换方法、服务器以及存储介质,主要解决的技术问题是如何提高语言系统的管理精确度和管理效率。
为解决上述技术问题,本申请提供了一种语言系统管理方法,所述语言系统管理方法包括:
接收第一语言编码,计算所述第一语言编码和所述语言系统中多个第二语言文本的多个第一相似度;
获取所述多个第一相似度中数值最大的第一相似度,并获取所述数值最大的第一相似度对应的转换路径;
根据所述转换路径得到对应的第二语言文本,利用所述对应的第二语言文本进行翻译,获得所述第一语言编码对应的第一语言文本,并存储在所述语言系统。
为解决上述技术问题,本申请还提供了一种信息转换方法,所述信息转换方法包括:
接收所述直播信息,并识别所述直播信息的第三语言文本;
提取语言系统中的所述第三语言文本和目标语言文本,并根据所述第三语言文本和所述目标语言文本之间的转换路径对所述直播信息进行转换,得到所述目标语言文本对应的直播信息;
其中,所述语言系统为上述的语言系统。
为解决上述技术问题,本申请还提供了一种服务器,所述服务器包括存储器和处理器,其中,存储器和处理器耦接;
其中,存储器用于存储程序数据,处理器用于执行程序数据以实现上述的语言系统管理方法和/或上述的信息转换方法。
为解决上述技术问题,本申请还提供了一种计算机存储介质,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现上述的语言系统管理方法和/或上述的信息转换方法。
与现有技术相比,本申请的有益效果是:服务器接收第一语言编码,并计算第一语言编码和语言系统中的所有的第二语言文本的第一相似度;其中,通过上述第一相似度可以获取第一语言编码和第二语言文本之间的转换路径,第一相似度的数值越大,对应的转换路径越短;比较并得到多个第一相似度中数值最大的第一相似度,并获取数值最大的第一相似度对应的转换路径;根据上述转换路径得到对应的第二语言文本,并利用对应的第二语言文本进行翻译,得到第一语言编码对应的第一语言文本,并将第一语言文本存储在语言系统。通过本申请的语言系统管理方法能够根据输入的第一语言编码和对应的转换路径得到第二语言文本,并通过第二语言文本翻译出第一语言文本,从而提高语言系统的管理精确度和管理效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请语言系统管理方法第一实施例的流程示意图;
图2是本申请语言系统管理方法第二实施例的流程示意图;
图3是本申请语言系统管理方法第三实施例的流程示意图;
图4是本申请信息转换方法第一实施例的流程示意图;
图5是本申请信息转换方法第二实施例的流程示意图;
图6是本申请服务器一实施例的结构示意图;
图7是本申请服务器另一实施例的结构示意图;
图8是本申请计算机存储介质一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提出了一种语言系统管理方法,通过本申请的语言系统管理方法可以实现来自不同国家或者不同地区的不同语言的管理,例如,管理的多种语言包括英语、日语、汉语和韩语等,语言系统管理方法还可以管理多种语言之间的直译和/或转译的转换路径。
具体请参见图1,图1是本申请语言系统管理方法第一实施例的流程示意图。本实施例的语言系统管理方法应用于服务器,其中,服务器可以为中央管理服务器。中央管理服务器用于管理来自不同国家或者不同地区的不同语言的管理,以将不同语言存储在同一语言有向图,方便管理和使用。
如图1所示,服务器实现的语言系统管理方法具体包括以下步骤:
S101:接收第一语言编码,计算第一语言编码和语言系统中的多个第二语言文本的多个第一相似度。
其中,服务器接收外部输入的第一语言编码。服务器预先存储有语言有向图和多个第二语言文本,所述语言有向图指示各个语言之间的相似关系。具体地,服务器提取存储的语言有向图,其中,语言有向图中包括多个第二语言文本。
服务器分别计算第一语言编码和每个第二语言文本的第一相似度,其中,相似度表征为第一语言编码和第二语言文本之间在音义和语法上的接近程度。相似度数值越大,说明第一语言编码和第二语言文本之间相互翻译的准确度越高。
具体地,服务器分别提取第一语言编码和第二语言文本的常用音义、音和语法。其中,音义为字或词语的同源词,音为音节构成和演变规律,语法为众多的语法单位里抽象出其中共同的组合方式、类型及如何表达语义的规则。
通过分别比较第一语言编码和第二语言文本的常用音义、音和语法,服务器计算得到第一语言编码和每个第二语言文本的第一相似度。
S102:获取多个第一相似度中数值最大的第一相似度,并获取数值最大的第一相似度对应的转换路径。
其中,服务器将步骤S101获取的多个第一相似度根据相似度数值从大到小进行排序,并获取数值最大的第一相似度对应的转换路径。
进一步地,服务器还可以预设一个相似度范围,例如,预设的相似度范围设置为60%~100%。服务器先从多个第一相似度中筛选出相似度大于或等于60%的第一相似度,然后对该部分第一相似度进行排序,以获取数值最大的第一相似度对应的转换路径,能够有效减少获取转换路径的运算量。
若多个第一相似度中不存在满足60%~100%的预设相似度范围时,服务器停止获取转换路径,并检查第一语言编码是否有误或重新接收新的第一语言编码。
S103:根据转换路径得到对应的第二语言文本,利用对应的第二语言文本进行翻译,获得第一语言编码对应的第一语言文本,并存储在语言系统。
其中,服务器获取数值最大的第一相似度对应的转换路径,根据该转换路径的起点或终点获得语言有向图中已存在的第二语言文本。具体地,当转换路径的起点为第一语言编码对应的第一语言文本时,则服务器根据转换路径的终点获得第二语言文本。
获取第二语言文本后,服务器调用预设的翻译服务接口对第二语言文本进行翻译,从而得到第一语言编码对应的国际化文本,即第一语言文本。其中,预设的翻译服务接口可以为第三方厂商提供的网络翻译服务接口。
在本实施例中,服务器根据语言有向图筛选出第一语言编码和多个第二语言文本之间相似度最大的转换路径,并根据该转换路径得到对应的第二语言文本;然后对第二语言文本进行翻译,获得第一语言编码对应的第一语言文本,并存储在语言有向图中。通过对相似度最大的第二语言文本进行翻译,能够提高获取第一语言文本的准确性,进而提高语言系统的管理精确度和管理效率。
对于图1所示实施例中的步骤S101和步骤S102,本申请进一步提出另一种具体的方法。具体请参阅图2,图2是本申请语言系统管理方法第二实施例的流程示意图。
具体在上述步骤S101和步骤S102中,第一相似度为第一语言编码对应的第一语言文本与第二语言文本之间的接近程度,可以用于表征第一语言文本与第二语言文本之间直译的准确性。但在实际的语言有向图中,还包括第一语言文本和多个第二语言文本的转换路径,即第一语言文本与目标语言文本之间还包括至少一个第二语言文本,第一语言文本通过第二语言文本进行转译,从而得到目标语言文本。具体地的步骤如下:
S201:计算每个第二语言文本与其余第二语言文本的第二相似度。
其中,服务器在语言有向图中获取多个第二语言文本,并计算每个第二语言文本与其余第二语言文本的第二相似度,计算方法与上述步骤S101中计算第一相似度的方法相同,在此不再赘述。
进一步地,在语言有向图中,已存在的第二语言文本与其余第二语言文本的第二相似度并非固定不变,例如,当某一第二语言文本中删除、增加或替换了语言功能时,该第二语言文本与其余第二语言文本的第二相似度就会发生改变。因此,在获取转换路径时,需要对语言有向图中的语言文本之间的相似度进行重新计算,以保证计算转换路径的准确性。
S202:计算多个第一相似度和第二相似度的多个加权值,并获取多个加权值中最大的加权值对应的转换路径。
其中,服务器分别获取第一语言编码与第二语言文本的第一相似度、多个第二语言文本之间的第二相似度,并给以上两个相似度数值分配对应的权值;最后,根据不同的权值将以上两个相似度计算合并得到第一相似度和第二相似度的加权值。
具体地,上述权值的分配可以根据不同的比例进行分配,例如,第一语言编码与第二语言文本的第一相似度分配的权值为60%,则第二语言文本之间的第二相似度分配的权值为40%,在其它实施例中,权值分配比例也可以是其它不同的组合情况,在此不再赘述。其中,加权值的具体数值可以为第一相似度数值和第二相似度数值分别乘上各自分配的权值的结果之和。
进一步地,第二语言文本之间的第二相似度可以包括至少两个第二语言文本之间的相似度的平均值。例如,当转换路径上包括三个第二语言文本时,根据转换路径的方向计算相邻两个第二语言文本的相似度,并将计算得到的相似度求平均值,以获得第二语言文本之间的第二相似度。
在本实施例中,服务器进一步计算语言有向图中多个第二语言文本之间的第二相似度,结合上述实施例获得的第一相似度,计算出包括至少一个第二语言文本的转换路径的相似度加权值,然后获取相似度加权值最大的转换路径,以获取与第一语言编码最接近的第二语言文本,进一步提高获取第一语言文本的准确性。
在图1所示实施例中的语言系统管理方法的基础上,本申请进一步提出另一种具体的方法。具体请参阅图3,图3是本申请语言系统管理方法第三实施例的流程示意图。
具体在图1的步骤S103之后,语言系统管理方法还可以包括以下步骤:
S301:获得第一语言编码对应的第一语言文本,将第一语言文本和转换路径存储在语言有向图中,其中,语言有向图还包括多个第二语言文本。
其中,在将翻译获得的第一语言文本存储在语言有向图的基础上,服务器还可以将上述步骤S102和/或步骤S202的转换路径对应第一语言文本存储在语言有向图,其中,语言有向图还包括语言系统中存储的多个第二语言文本。第一语言文本和第二语言文本在语言有向图中表示为语言节点,转换路径在语言有向图中表示为语言节点之间连接的方向线段。转换路径在后续的信息转换方法中能够直接作为直播信息转换中的处理路径,或者直播信息转换中部分的处理路径。
进一步地,服务器还可以存储计算过程中不同语言文本之间的相似度数值,在后续的信息转换方法中,可以从语言有向图中直接提取不同语言文本之间的相似度,能够有效减少信息转换方法的数据处理量。
S302:更新语言服务缓存,以使语言系统的接口支持第一语言文本。
其中,服务器将第一语言文本保存到数据库中,并通知国际化服务更新缓存,以使服务器的所有接口支持第一语言文本的国际化翻译。
具体地,服务器进一步使用缓存+数据库持久化的模式,能够有效提高语言系统的吞吐量;并且服务器还支持热部署技术,即在语言系统运行过程中,新增加第一语言文本或者升级语言系统均不需要重启服务器的国际化服务,提高语言系统的稳定性。
进一步地,服务器还可以将存储模型转换为存储区域中的数据模型或者将存储区域中的数据模型转换为存储模型,实现数据库持久化,保证直播信息的管理质量,其中,数据模型可以是任何数据结构或对象模型,存储模型可以是关系模型、XML、二进制流等。同时,服务器还支持热部署功能,在创建和存储转换路径后,服务器需要对软件、应用或者接口进行国际化服务更新缓存,以使得所有接口都能够支持新语言文本的国际化服务。
在本实施例中,服务器根据第一语言文本更新语言服务缓存,以使语言系统的所有接口均能支持第一语言文本;进一步地,服务器采用数据库持久化的模式和热部署技术,能够进一步提高语言系统的稳定性。
上述实施例的语言系统管理方法管理的语言系统可以用于实现直播信息的国际化管理,例如,管理不同国家或者不同地区的直播信息时,将不同语言的直播信息统一翻译为目标语言文本,以方便用户查看和管理直播信息。具体地,本申请提出了一种信息转换方法,请参阅图4,图4是本申请信息转换方法第一实施例的流程示意图。
如图4所示,本实施例的信息转换方法包括以下步骤:
S401:接收直播信息,并识别直播信息的第三语言文本。
其中,服务器接收来自不同国家或者不同地区的直播信息。主播的客户端可以将直播信息直接发送至服务器,或者相同国家或相同地区的主播客户端可以将直播信息发送至本区域的区域管理服务器,再由区域管理服务器将直播信息统一发送至服务器。
直播信息为主播在直播过程中产生的信息,例如,主播在直播中收到观众赠送的礼物,主播可以获取赠送礼物价值中一定比例的金钱作为提成,在这个过程中,主播客户端或区域管理服务器生成对应的佣金信息。
服务器接收到直播信息后,识别直播信息的第三语言文本。具体地,服务器可以通过以下识别语言的方法:
首先将直播信息译码为通用表示编码,然后编码后的直播信息拆分为纯文本内容部分;该部分被识别并被分配权重,其中具有较多信息的部分被给予较高的权重,具有较少信息的部分被给予较少的权重;确定该部分中每一个词、短语或字符n元语法模型的语言似然性评分,以为每一种语言组合部分内的语言似然性评分;然后将被组合的部分评分相加到一起以获得每一种语言的总文档评分,如此产生每一种语言的文档评分,该文档评分能够被排序以确定文档的主要语言,即直播信息的第三语言文本。
通过上述识别语言的方法,服务器可以快速识别出直播信息的第三语言文本;还可以在直播信息包括多个语言文本的情况下识别出比例最大的主要语言文本,作为直播信息的第三语言文本。
S402:提取语言系统中的第三语言文本和目标语言文本,并根据第三语言文本和目标语言文本之间的转换路径对直播信息进行转换,得到目标语言文本对应的直播信息。
其中,服务器预设一目标语言文本,该目标语言文本可以为服务器所属国家或所属地区的常用语言文本,或者世界上流通性较强的其中一个语言文本。目标语言文本的设置是为了将不同语言文本的直播信息转换为统一语言文本的直播信息,例如转换为本实施例的目标语言文本,可以提高信息转换方法的转换效率。
进一步地,服务器在语言系统的语言有向图中提取第三语言文本和目标语言文本,并提取第三语言文本和目标语言文本之间的所有转换路径。服务器直接提取或重新计算所有转换路径的相似度加权值,计算方法请参见上述语言系统管理方法中步骤S202中的相似度加权值计算方法,在此不再赘述。
服务器比较多个相似度加权值,以获取相似度加权值最大的转换路径作为目标转换路径。服务器进一步根据目标转换路径将直播信息进行翻译,以获取目标语言文本对应的直播信息。
对于图4中的步骤S401,本申请进一步提出另一种具体的方法,具体请参阅图5,图5是本申请信息转换方法第二实施例的流程示意图。
具体在上述步骤S401中,服务器通过上述识别语言的方法识别出直播信息的第三语言文本,该识别语言的方法具有较高的准确性,但服务器执行该识别语言方法的过程复杂,需要大量的运算量。因此本实施例为解决该问题,提出另一种信息转换方法,具体步骤如下:
S501:接收主播信息,其中,主播信息包括主播国籍信息和主播地区信息。
其中,服务器在接收主播的直播信息时,进一步还可以接收对应的主播信息。主播信息可以包括主播ID、主播国籍信息和主播地区信息,其中,主播国籍信息可以为主播注册时输入的国籍信息或者根据主播籍贯识别出主播的国籍信息;主播地区信息可以为主播注册时输入的详细地址或者主播的客户端最常登陆的地区服务器。
S502:根据主播国籍信息和主播地区信息识别直播信息的第三语言文本。
其中,服务器可以根据主播国籍信息或/和主播地区信息识别出直播信息的第三语言文本。
例如,当识别出某一主播的国籍为中国时,服务器定义该主播对应的直播信息的第三语言文本为汉语;进一步地,服务器识别出主播的地区信息为中国台湾,则定义该主播对应的直播信息的第三语言文本为闽南语或繁体中文。
在本实施例中,服务器可以根据主播国籍信息或/和主播地区信息快速定义直播信息的第三语言文本,可以有效提高信息转换方法的运行效率;进一步地,服务器还可以根据主播国籍信息或/和主播地区信息快速选择可能属于直播信息的第三语言文本的多种语言文本,例如,当服务器识别出主播的地区信息为台湾时,提取闽南语语言文本或繁体中文语言文本,并根据直播信息的具体文本内容区分直播信息的第三语言文本为闽南语语言文本或繁体中文语言文本,可以有效减少第三语言文本的识别难度,提高信息转换方法的运行精确度。
为实现上述实施例的方法,本申请还提供了一种服务器,具体请参见图6,图6是本申请服务器一实施例的结构示意图。
服务器600可以为上述语言系统管理方法和/或信息转换方法实施例所揭示的服务器,在此不再赘述;其中,服务器600可以与多个主播客户端或/和多个区域管理服务器建立通信连接。
如图6所示,服务器600包括通信模块61和处理模块62,其中,通信模块61与处理模块62耦接。
其中,通信模块61用于接收第一语言编码;
处理模块62用于:计算第一语言编码和语言系统中的多个第二语言文本的多个第一相似度;
获取多个第一相似度中数值最大的第一相似度,并获取数值最大的第一相似度对应的转换路径;
根据转换路径得到对应的第二语言文本,利用对应的第二语言文本进行翻译,获得第一语言编码对应的第一语言文本,并存储在语言系统。
为实现上述实施例的方法,本申请还提供了另一种服务器,具体请参见图7,图7是本申请服务器另一实施例的结构示意图。
服务器700可以为上述语言系统管理方法和/或信息转换方法实施例所揭示的服务器,在此不再赘述;其中,服务器700可以与多个主播客户端或/和多个区域管理服务器建立通信连接。
如图7所示,服务器700包括存储器71和处理器72,其中,存储器71与处理器72建立连接。
其中,存储器71用于存储程序数据,处理器72用于执行程序数据以实现上述语言系统管理方法和/或信息转换方法实施例中所述的方法。
在本实施例中,处理器72还可以称为CPU(Central Processing Unit,中央处理单元)。处理器72可能是一种集成电路芯片,具有信号的处理能力。处理器72还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器72也可以是任何常规的处理器等。
本申请还提供一种计算机存储介质,如图8所示,计算机存储介质800用于存储程序数据,程序数据在被处理器执行时,用以实现如本申请语言系统管理方法和/或信息转换方法实施例中所述的方法。
本申请直播信息管理方法实施例中所涉及到的方法,在实现时以软件功能单元的形式存在并作为独立的产品销售或使用时,可以存储在装置800中,例如一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种语言系统管理方法,其特征在于,所述语言系统管理方法包括:
接收第一语言编码,计算所述第一语言编码和所述语言系统中多个第二语言文本的多个第一相似度;
获取所述多个第一相似度中数值最大的第一相似度,并获取所述数值最大的第一相似度对应的转换路径;
根据所述转换路径得到对应的第二语言文本,利用所述对应的第二语言文本进行翻译,获得所述第一语言编码对应的第一语言文本,并存储在所述语言系统;
所述计算所述第一语言编码和所述语言系统中多个第二语言文本的多个第一相似度的步骤,进一步包括:
计算每个第二语言文本与其余第二语言文本的第二相似度;
获取所述多个第一相似度中数值最大的第一相似度,并获取所述数值最大的第一相似度对应的转换路径的步骤,进一步包括:
计算所述多个第一相似度和所述第二相似度的多个加权值,并获取所述多个加权值中最大的加权值对应的转换路径。
2.根据权利要求1所述的语言系统管理方法,其特征在于,所述获得所述第一语言编码对应的第一语言文本,并存储在所述语言系统的步骤进一步包括:
获得所述第一语言编码对应的第一语言文本,将所述第一语言文本和所述转换路径存储在语言有向图中,其中,所述语言有向图还包括所述多个第二语言文本。
3.根据权利要求1所述的语言系统管理方法,其特征在于,所述获得所述第一语言编码对应的第一语言文本,并存储在所述语言系统的步骤之后,所述语言系统管理方法还包括:
更新语言服务缓存,以使所述语言系统的接口支持所述第一语言文本。
4.根据权利要求1所述的语言系统管理方法,其特征在于,所述计算所述第一语言编码和所述语言系统中多个第二语言文本的多个第一相似度的步骤包括:
比较所述第一语言编码的音义和语法与所述多个第二语言文本的音义和语法,确定所述第一语言编码和所述多个第二语言文本的多个第一相似度。
5.一种信息转换方法,其特征在于,所述信息转换方法包括:
接收直播信息,并识别所述直播信息的第三语言文本;
提取语言系统中的所述第三语言文本和目标语言文本,并根据所述第三语言文本和所述目标语言文本之间的转换路径对所述直播信息进行转换,得到所述目标语言文本对应的直播信息;
其中,所述语言系统为权利要求1~4中任一项所述的语言系统。
6.根据权利要求5所述的信息转换方法,其特征在于,所述根据所述第三语言文本和所述目标语言文本之间的转换路径对所述直播信息进行转换的步骤,包括:
根据所述第三语言文本和所述目标语言文本之间的目标转换路径对所述直播信息进行转换,其中,所述目标转换路径为所述转换路径中至少一个相似度加权值最大的转换路径。
7.根据权利要求5所述的信息转换方法,其特征在于,所述识别所述直播信息的第三语言文本的步骤,进一步包括:
接收主播信息,其中,所述主播信息包括主播国籍信息和主播地区信息;
根据所述主播国籍信息和所述主播地区信息识别所述直播信息的第三语言文本。
8.根据权利要求5所述的信息转换方法,其特征在于,所述直播信息包括佣金信息。
9.一种服务器,其特征在于,所述服务器包括存储器和处理器,其中,所述存储器与所述处理器耦接;
其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如权利要求1~4中任一项所述的语言系统管理方法和/或权利要求5~8中任一项所述的信息转换方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现如权利要求1~4中任一项所述的语言系统管理方法和/或权利要求5~8中任一项所述的信息转换方法。
CN201910161018.2A 2019-03-04 2019-03-04 语言系统管理方法、信息转换方法、服务器以及存储介质 Active CN110008468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910161018.2A CN110008468B (zh) 2019-03-04 2019-03-04 语言系统管理方法、信息转换方法、服务器以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910161018.2A CN110008468B (zh) 2019-03-04 2019-03-04 语言系统管理方法、信息转换方法、服务器以及存储介质

Publications (2)

Publication Number Publication Date
CN110008468A CN110008468A (zh) 2019-07-12
CN110008468B true CN110008468B (zh) 2023-08-01

Family

ID=67166381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910161018.2A Active CN110008468B (zh) 2019-03-04 2019-03-04 语言系统管理方法、信息转换方法、服务器以及存储介质

Country Status (1)

Country Link
CN (1) CN110008468B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112162813A (zh) * 2020-09-27 2021-01-01 北京恒华伟业科技股份有限公司 一种系统国际化配置方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1307591C (en) * 1988-09-30 1992-09-15 Bruce Tolin Method of using a created international language as an intermediate pathway in translation between two nation languages
US8914277B1 (en) * 2011-09-20 2014-12-16 Nuance Communications, Inc. Speech and language translation of an utterance
WO2018080228A1 (ko) * 2016-10-27 2018-05-03 주식회사 네오픽시스 번역을 위한 서버 및 번역 방법

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000077609A1 (en) * 1999-06-14 2000-12-21 The Thomson Corporation System for converting data to a markup language
JP2002269085A (ja) * 2001-03-13 2002-09-20 Atr Onsei Gengo Tsushin Kenkyusho:Kk 機械翻訳装置及び方法
JP2008084078A (ja) * 2006-09-28 2008-04-10 Fujitsu Ltd 和英規格変換方法及びシステム並びに和英規格変換プログラム
CN101686234A (zh) * 2008-09-24 2010-03-31 北京市西区邮电局 实现多语种信息交流的系统
CN201255881Y (zh) * 2008-09-24 2009-06-10 北京市西区邮电局 实现多语种信息交流的系统
TW201346597A (zh) * 2012-05-08 2013-11-16 Ying-Huang Lee 多語言即時翻譯系統
KR20140121580A (ko) * 2013-04-08 2014-10-16 한국전자통신연구원 자동 번역 및 통역 장치 및 그 방법
US9218341B2 (en) * 2013-08-26 2015-12-22 Lingua Next Technologies Pvt. Ltd. Method and system for language translation
US9928236B2 (en) * 2015-09-18 2018-03-27 Mcafee, Llc Systems and methods for multi-path language translation
KR101827773B1 (ko) * 2016-08-02 2018-02-09 주식회사 하이퍼커넥트 통역 장치 및 방법
JP7000671B2 (ja) * 2016-10-05 2022-01-19 株式会社リコー 情報処理システム、情報処理装置、及び情報処理方法
CN107391500A (zh) * 2017-08-21 2017-11-24 阿里巴巴集团控股有限公司 文本翻译方法、装置及设备
CN108519963B (zh) * 2018-03-02 2021-12-03 山东科技大学 一种将流程模型自动转换为多语言文本的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1307591C (en) * 1988-09-30 1992-09-15 Bruce Tolin Method of using a created international language as an intermediate pathway in translation between two nation languages
US8914277B1 (en) * 2011-09-20 2014-12-16 Nuance Communications, Inc. Speech and language translation of an utterance
WO2018080228A1 (ko) * 2016-10-27 2018-05-03 주식회사 네오픽시스 번역을 위한 서버 및 번역 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多语种翻译词汇的在线自动抽取;原双庆,李芳,盛焕烨;计算机研究与发展(第05期);843-847 *

Also Published As

Publication number Publication date
CN110008468A (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
US11113234B2 (en) Semantic extraction method and apparatus for natural language, and computer storage medium
US8612206B2 (en) Transliterating semitic languages including diacritics
US8626486B2 (en) Automatic spelling correction for machine translation
US20190251165A1 (en) Conversational agent
JP6484236B2 (ja) オンライン音声翻訳方法及び装置
US20170124064A1 (en) Reply information recommendation method and apparatus
US9002696B2 (en) Data security system for natural language translation
US11295092B2 (en) Automatic post-editing model for neural machine translation
JP2020505643A (ja) 音声認識方法、電子機器、及びコンピュータ記憶媒体
JP6817556B2 (ja) 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム
KR20130038959A (ko) 문자 변환 처리 장치, 기록 매체 및 방법
US10853569B2 (en) Construction of a lexicon for a selected context
TWI223165B (en) Japanese virtual dictionary
EP4276677A1 (en) Cross-language data enhancement-based word segmentation method and apparatus
CN110008468B (zh) 语言系统管理方法、信息转换方法、服务器以及存储介质
RU2628202C1 (ru) Адаптивный контекстно-тематический машинный перевод
JP2018045686A (ja) 機械翻訳装置及び機械翻訳方法
KR101740671B1 (ko) 다국어 번역 방법
CN114860233A (zh) 一种页面生成方法、装置、设备、存储介质及产品
CN102597985B (zh) 因特网域名超级变体
US20200089774A1 (en) Machine Translation Method and Apparatus, and Storage Medium
WO2006101287A1 (en) System and method for providing translated font image data using multi-language font servers
CN110442696B (zh) 查询处理方法及装置
CN115455981B (zh) 一种多语种语句的语义理解方法、装置、设备及存储介质
CN115936021A (zh) 数据增强方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant