CN115244525A - 用于数据分析和商业智能的模型本地化 - Google Patents

用于数据分析和商业智能的模型本地化 Download PDF

Info

Publication number
CN115244525A
CN115244525A CN202180019798.2A CN202180019798A CN115244525A CN 115244525 A CN115244525 A CN 115244525A CN 202180019798 A CN202180019798 A CN 202180019798A CN 115244525 A CN115244525 A CN 115244525A
Authority
CN
China
Prior art keywords
translation
translatable
term
model
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180019798.2A
Other languages
English (en)
Inventor
安德鲁·莱希
史蒂芬·塔尔博特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN115244525A publication Critical patent/CN115244525A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

一种用于模型本地化的方法(301)包括:解析(320)模型(200)以识别可翻译词项,生成(340)将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换(330)模型(200)中的每个可翻译词项的种子文件(140、290B),并且将可翻译词项中的每个可翻译词项提交(350)到目标语言的机器翻译(150)以产生不同翻译文件(160、290A),该不同翻译文件(160、290A)将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射。该方法还包括使用不同翻译文件来将模型部署(370)在数据分析应用(100、270)中以在数据分析应用的用户界面(232)内将每个可翻译词项动态地翻译成对应翻译词项。

Description

用于数据分析和商业智能的模型本地化
技术领域
本公开涉及计算机程序中的内容的本地化的领域。
背景技术
在计算机领域中,国际化和本地化是指计算机软件对目标地区的不同语言、区域特点和技术要求的适应。在过去,本地化要求以期望地区的语言对用户界面以及在合适的情况下底层编程变量的人工代码化。最近,计算机程序的表示层已经被抽象以包括占位符,这些占位符然后可以被映射到存储在表中的本地特定词项。以这种方式,仅需要指定计算机程序的表示层的单一抽象形式,同时针对相应不同地区的一系列不同表可以被提供以按需使表示层本地化。
尽管用于表示层的本地化的前述技术能够是相当高效的,但是使数据库本地化实质上更加复杂。用于使数据库本地化的一种技术是将以不同语言或不同地区习俗的存储数据的不同版本存储在每个记录的不同列中。在另一技术中,数据库的一个表仅包括地区无关数据,而地区特定数据被分离到不同表或一个表的不同行中。但是,在所有情况下,如此明显,就数据库大小而言具有成本。用于以数据库实现的数据模型的本地化还能够以与使数据库本身本地化的方式类似的方式来实现,伴随着类似的结果。
值得注意的是,在本地化的所有实例中,都难以逃脱为每个通用占位符选择相关翻译词项的要求。因此,翻译者的人工干预仍然是至关重要的。而且,在这么多实例中,词项可以具有取决于词项已经被使用在其中的上下文的不同翻译。而且,一旦模型已经使用一系列翻译词项以本地化方式被指定,就不存在随时间在其认识到在数据库模型中针对特定词项存在更好的翻译时校正不同翻译的简单方式。因此,模型本地化仍然不完美。
发明内容
本公开的一个方面提供一种用于数据分析中的模型本地化的计算机实现的方法。用于模型本地化的计算机实现的方法当在数据处理硬件上执行时使数据处理硬件执行包括以下的操作:解析模型以识别可翻译词项;生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件;以及将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。操作还包括使用不同翻译文件来将模型部署在数据分析应用中以在对数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
本公开的各方面可以包括以下可选特征中的一个或多个。在一些实施方式中,操作还包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;以及从授权翻译者接收对应翻译词项的接受或拒绝。在这些实施方式中,针对由授权翻译者拒绝的每个对应翻译词项,操作还包括从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
在一些示例中,操作还包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同翻译文件将模型重新部署在数据分析应用中。种子文件可以包括预先存在的种子文件的副本。
在本公开的另一方面中,一种数据分析数据处理系统被配置用于模型本地化。该系统包括:主机计算平台,其包括具有存储器和至少一个处理器的至少一个计算机;以及其中存储了数据库模型的固定储存器。该系统还包括:数据分析应用,其在主机计算平台中执行;以及机器翻译器,其在主机计算平台中执行。最后,该系统包括:模型本地化模块,其包括在主机计算平台中执行期间启用以执行包括以下的操作的计算机程序指令:解析模型以识别可翻译词项;以及生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件。操作还包括:将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译器以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。操作还包括使用不同翻译文件来将模型部署在数据分析应用中以在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
本公开的这个方面可以包括以下可选特征中的一个或多个。在一些示例中,操作进一步包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;从授权翻译者接收对于对应翻译词项的接受或拒绝;以及针对由授权翻译者拒绝的每个对应翻译词项,从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
在一些实施方式中,操作进一步包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同的翻译文件将模型重新部署在数据分析应用中。在一个示例中,种子文件是预先存在的种子文件的副本。
本公开的另一方面提供一种用于模型本地化的计算机程序产品。该计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,程序指令能由设备执行以使设备执行操作。操作包括:解析模型以识别可翻译词项;生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件;将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件;以及使用不同翻译文件来将模型部署在数据分析应用中以在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
本公开的这个方面可以包括以下可选特征中的一个或多个。在一些示例中,操作进一步包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;从授权翻译者接收对于对应翻译词项的接受或拒绝;以及针对由授权翻译者拒绝的每个对应翻译词项,从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
在一些实施方式中,操作进一步包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同翻译文件将模型重新部署在数据分析应用中。可选地,种子文件是预先存在的种子文件的副本。
在附图和下面的描述中阐述本公开的一个或多个实施方式的细节。其他方面、特征和优点将从说明书和附图以及从权利要求书显而易见。
附图说明
图1是用于模型本地化的图画图示;
图2是适于模型本地化的数据处理系统的示意性图示;以及
图3是图示用于模型本地化的过程的流程图。
各个附图中的相同附图标记指示相同的元件。
具体实施方式
本公开的示例提供用于模型本地化。根据本公开的示例,针对数据库生成数据模型并且将数据模型加载到存储器中以用于解析。在解析期间,识别不同可翻译词项并且每个可翻译词项用相关联的标签替换。然后将关联存储在将每个标签与对应可翻译词项映射的种子文件中。其后,将种子文件中的可翻译词项中的每个可翻译词项提交到目标语言的机器翻译器以便产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。最后,可以使用不同翻译文件将针对数据库的模型部署在数据分析应用中,以便在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项,而无需对数据模型或底层数据库的不期望膨胀,并且同时允许对翻译文件中的翻译的稍后的灵活的修改,而无需对底层数据库的修改。
在进一步图示中,图1是用于模型本地化的图画图示。如图1所示,数据分析应用100分析数据库110以产生数据库110的数据模型120。数据模型120包括不同词项,其中的一些可从一种语言翻译到另一种。数据模型120被提供到解析器130,解析器130解析数据模型120的词项并且用对应标签替换数据模型120中的每个可翻译词项。因此,通过将每个标签与从数据模型120移除的可翻译词项中的对应一个可翻译词项映射来生成种子文件140。可选地,种子文件140可以在先前针对数据模型120的先前版本被生成并且简单地修改以适应对数据模型120的更新。
种子文件140然后被提交到机器翻译器150,机器翻译器150将每个可翻译词项翻译成以目标语言的翻译词项。翻译文件160然后存储来自种子文件140的每个标签与对应机器翻译词项的映射。最后,当在数据分析应用100中处理数据模型120时,数据分析应用100用翻译文件160中映射到数据模型120中的每个标签的翻译词项替换该标签。
其后,被授权修改翻译文件160的数据分析应用100的终端用户可以在数据分析应用100的界面中提供与由机器翻译器150产生的翻译文件160中的翻译不同的针对数据模型120中的可翻译词项的推荐翻译。此外,针对标签的多个不同替代翻译词项可以连同由数据分析应用100的不同终端用户做出的评级一起被存储在翻译文件160中。替代翻译词项中最高评级的一个替代翻译词项因此由数据分析应用100在处理数据模型120中使用。
图1中示出的过程可以被实现在数据分析数据处理系统内。在进一步图示中,图2示意性示出适于模型本地化的数据处理系统201。系统201包括主机计算平台210,主机计算平台210包括存储器260和至少一个处理器212。主机计算平台210通过计算机通信网络220通信地耦合到包括用户界面232的不同客户端计算设备230。数据分析应用270在主机计算平台210的存储器260中执行并且在通过在主机计算平台210的存储器260中针对数据库250生成的数据模型200对数据库250执行数据分析中通过相应不同的数据分析接口240从不同终端用户接收指示并且向不同终端用户提供输出。
值得注意的是,系统201包括模型本地化模块300。模型本地化模块300包括在主机计算平台210的存储器260中执行期间启用的计算机程序指令,以解析存储器260中的数据模型200以识别其中的可翻译词项以及用独特标签替换模型200中的每个可翻译词项以及将每个独特标签与种子文件290B中的对应可翻译词项映射。程序指令进一步在存储器260中执行期间启用,以将种子文件290B提交到在主机计算平台210中执行的机器翻译器280以在翻译文件290A中产生针对种子文件290B中的每个可翻译词项的以目标语言的翻译。最后,模块300的程序指令被启用以部署翻译文件290A用于在数据分析应用270中使用。
在模型本地化模块300的操作的更进一步图示中,图3是图示用于模型本地化的方法301的流程图。从框310开始,在数据分析应用270中针对指定数据库250选择模型200。在框320中,然后解析模型200以识别可翻译词项,例如,参考可翻译词项的数据词典,使得存在于词典和模型两者中的词项被认为是可翻译的。在框330中,用标签替换每一个数据模型中的可翻译词项,并且在框340中,生成将数据模型200中替换的每个可翻译词项与对应指派标签映射的种子文件290B。
在框350中,将种子文件290B提交到机器翻译以产生针对种子文件290B中的每个可翻译词项的以目标语言的翻译。在框360中,生成将种子文件290B的每个标签映射到由机器翻译产生的对应翻译词项的翻译文件290A。
其后,将翻译文件290A部署用于由数据分析应用在用以目标语言的对应翻译词项动态地替换数据模型200中的每个标签中使用。值得注意的是,在判定框380中,可以确定数据模型200是否已经改变,例如,由于底层数据库的改变。如果是,则过程能够利用数据模型200的新解析返回到框320,以生成可以从其可生成新翻译文件290A的新种子文件290B。
此外,在判定框390中,可以确定是否已经针对在数据分析应用的用户界面232中呈现的一个或多个翻译词项接收到更新的翻译。在这一点上,数据分析应用的一个或多个被授权终端用户可以在用户界面232中被呈现翻译词项的指示并且被提供接受或确认翻译词项的翻译、输入翻译词项的新翻译或对翻译词项的翻译进行评级的机会。在翻译词项由于输入而改变的程度上,在框400中更新翻译文件并且将翻译文件重新部署到数据分析应用。以这种方式,数据模型的本地化可以随时间动态地更新,而无需数据模型本身的侵入式人工修改。
本公开可以被体现在一种系统、方法、计算机程序产品或其任何组合中。计算机程序产品可以包括其上具有用于使处理器执行本公开的各方面的计算机可读程序指令的计算机可读存储介质或媒介。计算机可读存储介质能够是能够保持并存储用于由指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光学存储设备、电磁存储设备、半导体存储设备、或前述的任何合适的组合。
本文中描述的计算机可读程序指令能够从计算机可读存储介质被下载到相应计算/处理设备或经由网络被下载到外部计算机或外部存储设备。计算机可读程序指令可以完全在用户的计算机上、部分在用户的计算上、作为独立软件包、部分在用户的计算上并且部分在远程计算机上或完全在远程计算机或服务器上执行。本文中参考根据本公开的示例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图来描述本公开的各方面。将理解,流程图图示和/或框图的每个框以及流程图图示和/或框图中的框的组合能够通过计算机可读程序指令来实现。
这些计算机可读程序指令可以被提供到通用计算机、专用计算机、或其他可编程数据处理装置的处理器以产生机器,使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图框或多个框中指定的功能/动作的模块。这些计算机可读程序指令还可以被存储在能够指示计算机、可编程数据处理装置和/或其他设备以特定方式运转的计算机可读存储介质中,使得具有存储在其中的指令的计算机可读存储介质包括包含实现流程图和/或框图框或多个框中指定的功能/动作的各方面的指令的制品。
计算机可读程序指令还可以被加载到计算机、其他可编程数据处理装置、或其他设备上以使一系列操作步骤在计算机、其他可编程装置或其他设备上执行以产生计算机实现的过程,使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图框或多个框中指定的功能/动作。
附图中的流程图和框图图示根据本公开的各个示例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这一点上,流程图或框图中的每个框可以表示指令的模块、片段、或部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。在一些替代实现中,框中指出的功能可以不按图中指出的次序发生。例如,连续示出的两个框可以实际上基本上同时被执行,或者框可以有时以相反次序执行,取决于所涉及的功能。还将指出,框图和/或流程图图示的每个框以及框图和/或流程图图示的框的组合能够由执行指定功能或动作或者执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。
最后,本文中使用的术语仅出于描述特定示例的目的并且不旨在为本公开的限制。如本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文另外清楚地指示。将进一步理解,术语“包括”和/或“包含”在本说明书中使用时指定所述特征、整数、步骤、操作、元件和/或组件的存在,但是不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。
下面的权利要求中的所有模块或步骤加功能元件的对应结构、材料、动作和等价物旨在包括用于结合其他要求保护的元件执行如具体要求保护的功能的任何结构、材料或动作。本公开的描述已经出于说明和描述的目的而被呈现,但是不旨在为穷尽的或者将本公开限于所公开的形式。在不脱离本公开的范围和精神的情况下,许多修改和变型将对本领域普通技术人员显而易见。选择和描述示例以便最好地说明本公开的原理和实际应用,并且使得本领域其他普通技术人员能够理解具有适于预期到的特定用途的各种修改的各个示例的公开内容。
已经描述了许多实施方式。然而,将理解,可以在不脱离本公开的精神和范围的情况下进行各种修改。因此,其他实施方式在随附权利要求的范围内。

Claims (12)

1.一种用于模型本地化的计算机实现的方法(301),所述方法在由数据处理硬件执行时使所述数据处理硬件执行操作,所述操作包括:
解析(320)模型(200)以识别可翻译词项;
生成(340)种子文件(140、290B),所述种子文件(140、290B)将所述可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换(330)所述模型(200)中的每个可翻译词项;
将所述可翻译词项中的每个可翻译词项提交(350)到目标语言的机器翻译(150)以产生不同翻译文件(160、290A),所述不同翻译文件(160、290A)将来自所述种子文件(140、290B)的每个标签与所述可翻译词项中的对应一个可翻译词项的处于所述目标语言的翻译词项进行映射;以及
使用所述不同翻译文件(160、290A)来将所述模型(200)部署(370)在数据分析应用(100、270)中,以在所述数据分析应用(100、270)的用户界面(232)内将每个可翻译词项动态地翻译成对应翻译词项。
2.根据权利要求1所述的方法(301),其中,所述操作进一步包括:
将所述数据分析应用(100、270)的终端用户指定为授权翻译者;
以视觉上有区别的方式在所述用户界面(232)中呈现(380)每个对应翻译词项;
从所述授权翻译者接收(390)对所述对应翻译词项的接受或拒绝;以及
针对由所述授权翻译者拒绝的每个对应翻译词项,从所述授权翻译者接收(400)替代翻译并且将所述替代翻译存储在所述不同翻译文件(160、290A)中。
3.根据权利要求1或权利要求2所述的方法(301),其中,所述操作进一步包括:
检测(380)所述模型(200)中的变化;
重新生成(340)所述种子文件(140、290B)以考虑所述可翻译词项中的变化;
将所述可翻译词项中的每个变化的可翻译词项重新提交(350)到所述目标语言的机器翻译,以产生更新的翻译文件(160、290A);以及
使用不同的所述更新的翻译文件(160、290A)将所述模型(200)重新部署(370)在所述数据分析应用(100、270)中。
4.根据权利要求1-3中的任一项所述的方法(301),其中,所述种子文件(140、290B)是预先存在的种子文件(140、290B)的副本。
5.一种被配置用于模型本地化的数据分析数据处理系统(201),包括:
主机计算平台(210),包括具有存储器(260)和至少一个处理器(212)的至少一个计算机;
存储有数据库模型(120、200)的固定储存器;
在所述主机计算平台(210)中执行的数据分析应用(100、270);
在所述主机计算平台(210)中执行的机器翻译器(150、280);
包括计算机程序指令的模型本地化模块(300),所述计算机程序指令在所述主机计算平台(210)中执行期间启用以执行操作,所述操作包括:
解析所述模型(200)以识别可翻译词项;
生成种子文件(140、290B),所述种子文件(140、290B)将所述可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换所述模型(200)中的每个可翻译词项;
将所述可翻译词项中的每个可翻译词项提交到目标语言的所述机器翻译器(150、280)以产生不同翻译文件(160、290A),所述不同翻译文件(160、290A)将来自所述种子文件(140、290B)的每个标签与所述可翻译词项中的对应一个可翻译词项的处于所述目标语言的翻译词项进行映射;以及
使用所述不同翻译文件(160、290A)来将所述模型(200)部署在所述数据分析应用(100、270)中,以在所述数据分析应用(100、270)的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
6.根据权利要求5所述的系统(201),其中,所述操作进一步包括:
将所述数据分析应用(100、270)的终端用户指定为授权翻译者;
以视觉上有区别的方式在所述用户界面中呈现每个对应翻译词项;
从所述授权翻译者接收对所述对应翻译词项的接受或拒绝;以及
针对由所述授权翻译者拒绝的每个对应翻译词项,从所述授权翻译者接收替代翻译并且将所述替代翻译存储在所述不同翻译文件(160、290A)中。
7.根据权利要求5或6权利要求所述的系统(201),其中,所述操作进一步包括:
检测(380)所述模型(200)中的变化;
重新生成(340)所述种子文件(140、290B)以考虑所述可翻译词项中的变化;
将所述可翻译词项中的每个变化的可翻译词项重新提交(350)到所述目标语言的机器翻译,以产生更新的翻译文件(160、290A);以及
使用不同的所述更新的翻译文件(160、290A)将所述模型(200)重新部署(370)在所述数据分析应用(100、270)中。
8.根据权利要求5-7中的任一项所述的系统,其中,所述种子文件(140、290B)是预先存在的种子文件(140、290B)的副本。
9.一种用于模型本地化的计算机程序产品,所述计算机程序产品包括具有体现在其中的程序指令的计算机可读存储介质,所述程序指令能由设备执行以使所述设备执行操作,所述操作包括:
解析(320)模型(200)以识别可翻译词项;
生成(340)种子文件(140、290B),所述种子文件(140、290B)将所述可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换所述模型(200)中的每个可翻译词项;
将所述可翻译词项中的每个可翻译词项提交(350)到目标语言的机器翻译以产生不同翻译文件(160、290A),所述不同翻译文件(160、290A)将来自所述种子文件(140、290B)的每个标签与所述可翻译词项中的对应一个可翻译词项的处于所述目标语言的翻译词项进行映射;以及
使用所述不同翻译文件(160、290A)来将所述模型(200)部署(370)在数据分析应用(100、270)中,以在所述数据分析应用(100、270)的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
10.根据权利要求9所述的计算机程序产品,其中,所述操作进一步包括:
将所述数据分析应用(100、270)的终端用户指定为授权翻译者;
以视觉上有区别的方式在所述用户界面(232)中呈现每个对应翻译词项;
从所述授权翻译者接收对所述对应翻译词项的接受或拒绝;以及
针对由所述授权翻译者拒绝的每个对应翻译词项,从所述授权翻译者接收替代翻译并且将所述替代翻译存储在所述不同翻译文件(160、290A)中。
11.根据权利要求9或权利要求10所述的计算机程序产品,其中,所述操作进一步包括:
检测(380)所述模型(200)中的变化;
重新生成(340)所述种子文件(140、290B)以考虑所述可翻译词项中的变化;
将所述可翻译词项中的每个变化的可翻译词项重新提交(350)到所述目标语言的机器翻译,以产生更新的翻译文件(160、290A);以及
使用不同的所述更新的翻译文件(160、290A)将所述模型(200)重新部署(370)在所述数据分析应用(100、270)中。
12.根据权利要求9-11中的任一项所述的计算机程序产品,其中,
所述种子文件(140、290B)是预先存在的种子文件(140、290B)的副本。
CN202180019798.2A 2020-03-20 2021-03-19 用于数据分析和商业智能的模型本地化 Pending CN115244525A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/824,902 US11354518B2 (en) 2020-03-20 2020-03-20 Model localization for data analytics and business intelligence
US16/824,902 2020-03-20
PCT/US2021/023051 WO2021188848A1 (en) 2020-03-20 2021-03-19 Model localization for data analytics and business intelligence

Publications (1)

Publication Number Publication Date
CN115244525A true CN115244525A (zh) 2022-10-25

Family

ID=75581613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180019798.2A Pending CN115244525A (zh) 2020-03-20 2021-03-19 用于数据分析和商业智能的模型本地化

Country Status (5)

Country Link
US (2) US11354518B2 (zh)
EP (1) EP4121865A1 (zh)
CN (1) CN115244525A (zh)
CA (1) CA3077291C (zh)
WO (1) WO2021188848A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11687732B2 (en) * 2020-04-06 2023-06-27 Open Text Holdings, Inc. Content management systems for providing automated translation of content items
CN114139560B (zh) * 2021-12-03 2022-12-09 山东诗语信息科技有限公司 基于人工智能翻译系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4419871B2 (ja) * 2005-03-02 2010-02-24 富士ゼロックス株式会社 翻訳依頼装置およびプログラム
US8954314B2 (en) 2012-03-01 2015-02-10 Google Inc. Providing translation alternatives on mobile devices by usage of mechanic signals
US10545958B2 (en) 2015-05-18 2020-01-28 Microsoft Technology Licensing, Llc Language scaling platform for natural language processing systems
WO2018198806A1 (ja) * 2017-04-27 2018-11-01 パナソニックIpマネジメント株式会社 翻訳装置
US11093110B1 (en) * 2017-07-17 2021-08-17 Amazon Technologies, Inc. Messaging feedback mechanism

Also Published As

Publication number Publication date
EP4121865A1 (en) 2023-01-25
WO2021188848A1 (en) 2021-09-23
US11354518B2 (en) 2022-06-07
CA3077291A1 (en) 2021-09-20
US20220277148A1 (en) 2022-09-01
US20210294987A1 (en) 2021-09-23
CA3077291C (en) 2023-03-28

Similar Documents

Publication Publication Date Title
US20220277148A1 (en) Model localization for data analytics and business intelligence
US10545920B2 (en) Deduplication by phrase substitution within chunks of substantially similar content
US20160163309A1 (en) Method of selecting training text for language model, and method of training language model using the training text, and computer and computer program for executing the methods
EP2317447B1 (en) In-context exact (ICE) matching
US9754242B2 (en) Deployment mechanism for non-versioning business process artifacts
US20160011868A1 (en) Software documentation generation with automated sample inclusion
CN109753976B (zh) 语料标注装置和方法
CN111831920A (zh) 用户需求分析方法、装置、计算机设备及存储介质
CN111046659A (zh) 上下文信息生成方法、上下文信息生成装置及计算机可读记录介质
Todd Librarian as data migrator: a functional pathway from Millennium to Koha
WO2010067119A1 (en) Data storage apparatus
US20220180290A1 (en) Using machine learning to assign developers to software defects
US20180032510A1 (en) Automated translation of source code
JP7074785B2 (ja) 曖昧箇所訂正支援装置及び方法
US20130124983A1 (en) System and/or method for document conversion
US10185706B2 (en) Generating web browser views for applications
CN111858963A (zh) 网页客服知识抽取方法及装置
JP6797038B2 (ja) ソフトウェア素材選定支援装置及びソフトウェア素材選定支援プログラム
CN112579466B (zh) 测试用例的生成方法、装置及计算机可读存储介质
JP6062735B2 (ja) ソフトウェア開発支援装置、ソフトウェア開発支援方法、ソフトウェア開発支援プログラム
CN117709435B (zh) 大语言模型的训练方法、代码生成方法、设备及存储介质
CN114741582A (zh) 基于标识解析的产品说明书获取方法及计算机存储介质
CN114817004B (zh) 测试用例生成方法、装置、设备及可读存储介质
JP6954806B2 (ja) 不具合検出装置、及び不具合検出方法
JPWO2021107142A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination