CN105051728B - 数据库查询翻译系统 - Google Patents

数据库查询翻译系统 Download PDF

Info

Publication number
CN105051728B
CN105051728B CN201380074248.6A CN201380074248A CN105051728B CN 105051728 B CN105051728 B CN 105051728B CN 201380074248 A CN201380074248 A CN 201380074248A CN 105051728 B CN105051728 B CN 105051728B
Authority
CN
China
Prior art keywords
translation
factor
instruction
document
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380074248.6A
Other languages
English (en)
Other versions
CN105051728A (zh
Inventor
T.姜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UpToDate Inc
Original Assignee
UpToDate Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UpToDate Inc filed Critical UpToDate Inc
Publication of CN105051728A publication Critical patent/CN105051728A/zh
Application granted granted Critical
Publication of CN105051728B publication Critical patent/CN105051728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/941Human sciences

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)

Abstract

在一种用于将医学数据库查询从第一语言翻译成第二语言的方法中,从医学数据库的使用接收要翻译的查询。从若干翻译引擎中的每一个获得用于查询的相应翻译,并且确定针对每一个所获得的翻译的相应排序得分。所确定的排序得分然后被用于从若干所获得的翻译选择翻译。所选翻译然后被提供给用户和/或被用于搜索医学数据库以获得针对查询的搜索结果,并且然后将所获得的搜索结果提供给用户。

Description

数据库查询翻译系统
技术领域
本申请一般涉及语言翻译,并且更具体地涉及用于翻译数据库查询的系统和方法。
背景技术
文献数据库是由用户可搜索以用于检索用户感兴趣的信息的诸如论文、文章、书籍等之类的文献作品的集合。一些文献数据库在性质上是通用的并且包含关于各种主题的文献作品,而其它文献数据库特定于涉及具体领域的一个或多个具体主题。例如,医学文献数据库是关于医学领域的文献作品的集合,诸如医学期刊文章、医学研究等。医学数据库例如由医生或其它医学从业人员用于检索可以在诊断和/或治疗患者中帮助医学从业人员的文献作品。作为另一示例,数据库还可以用作用于医学学生、医学患者或一般对获得关于具体医学条件或关于涉及医学领域的任何其它主题的信息感兴趣的人的学习工具。
为了搜索文献数据库,用户一般录入查询,其可以是描述用户感兴趣的一个或多个主题的词语或短语,并且查询然后可以用于搜索数据库以从数据库获得与查询有关的材料。一般而言的文献数据库和具体而言的医学文献数据库已经变得广泛可用于供全世界范围的用户访问。例如,用户可以能够通过利用允许用户将查询录入到网页中并且经由互联网接收基于查询获得的搜索结果的在线应用来访问文献数据库。因此,能够访问互联网的任何人可以能够搜索数据库并且利用从数据库获得的材料。作为结果,这样的数据库时常被不是包含在数据库中的文献的语言的母语者的用户利用。因此,在数据库中包括翻译能力以允许外语用户录入查询以用于搜索数据库并且将查询翻译成包含在数据库中的文献的语言是有益的。
附图说明
图1是依照本公开的实施例的利用翻译工具执行数据库查询语言翻译的示例数据库系统的框图。
图2是数据库查询翻译工具的示例实现的框图。
图3是用于从若干可能的翻译选择翻译的示例选择引擎的框图。
图4是包括用于增强翻译排序的机器学习能力的示例选择引擎的框图。
图5是用于将医学数据库查询从第一语言翻译成第二语言的示例方法的框图。
具体实施方式
图1是依照本公开的实施例的利用用于执行从第一语言到第二语言的数据库查询的翻译的翻译工具的示例数据库系统100的框图。数据库系统100包括数据库130,作为示例,其可以是包含关于涉及医学领域的各种主题的文献(例如医学期刊文章、医学论文等)的医学数据库。数据库系统100接受用于搜索数据库130的外语查询并且利用数据库130(例如包含在数据库130中的文献和/或由数据库系统100之前处理的母语查询的记录)提供用于外语查询到包含在数据库130中的文献的母语的精确翻译,如以下将更加详细地描述的那样。数据库系统100可以向用户提供经翻译的查询和或可以利用经翻译的查询从数据库130检索相关材料并且然后可以向用户提供经检索的材料。在一些实施例中,数据库130可以是以若干语言包含文献的多语言数据库。在这样的实施例中,数据库130可以用于产生用于外语查询到若干语言中的每一个的子集的翻译。
图1描绘了可以允许用户经由数字网络132与数据库系统100通信的若干网络使能设备114。网络使能设备114可以包括例如个人计算机、蜂窝电话、智能电话、网络使能电视和通过数字网络132通信连接到数据库系统100的其它合适的网络使能设备。数据库系统100的用户可以经由网络使能设备114访问数据库系统100,例如通过将查询录入到应用(诸如网络浏览器客户端)中,该应用提供用于访问数据库系统100的用户接口。一般而言,用户可以利用提供给用户以用于访问数据库系统100的任何类型的接口,包括专有接口,并且接口可以通过使用任何类型的协议提供与数据库系统100的通信,所述协议包括但不限于文件传输协议(FTP)、远程登录、超文本传输协议(HTTP)等。网络使能设备114不需要必然经由有线连接与网络132通信。在一些实例中,网络使能设备114可以经由无线信号并且使用任何合适的无线通信协议与网络132通信,并且在一些实例中,可以经由居间无线或有线设备(未示出)与网络130通信,所述居间无线或有线设备可以是无线路由器、无线中继器、移动电话提供商的基站收发器等。
如图1中图示的,数据库系统100包括经由连接131在操作上耦合到数据库130的控制器150。控制器150包括程序存储器120、处理器122(可以称为微控制器或微处理器)、随机存取存储器(RAM)124和输入/输出(I/O)电路126,其全部经由地址/数据总线128互连。程序存储器120包括可以包括在例如处理器122上可执行的计算机可读指令的翻译模块160。当在处理器122上运行时,计算机可读指令可以使处理器依照以下描述的各种实施例执行外语查询翻译。应当领会到,尽管仅示出一个处理器122,但是控制器150可以包括多个处理器122,并且若干处理器122可以用于运行翻译模块160。类似地,控制器150的存储器可以包括多个RAM 124和/或多个程序存储器120。另外,尽管I/O电路126被示出为单个块,但是应当领会到,I/O电路126可以包括数个不同类型的I/O电路。(多个)RAM 124和程序存储器(或多个存储器)120可以实现为例如半导体存储器、磁可读存储器和/或光学可读存储器。链路135可以在操作上通过I/O电路126将控制器150连接到数字网络132。应当领会到,尽管在图1中仅示出一个控制器150,但是数据库系统100可以包括多个控制器150,并且翻译模块160的运行可以分布在若干控制器150之上。
为了产生用于外语查询的翻译,翻译模块160可以操作成将外语查询提交到每一个翻译引擎140,其经由数字网络132通信耦合到数据库系统100。可替换地或此外,通过数字网络132将外语查询提交到翻译引擎140,翻译模块160可以操作成将外语查询提交到存储在控制器150内部的存储器中(例如在控制器150的程序存储器120中)的一个或若干翻译引擎(未示出),所述一个或若干翻译引擎可以在控制器150的一个或多个处理器122上运行。响应于将查询提交到翻译引擎140,翻译模块160可以从每一个翻译引擎140接收用于查询的相应翻译。翻译模块160然后可以操作成从接收自翻译引擎140的多个翻译选择“最精确的”翻译。依照一些实施例,以下更加详细地描述用于从多个所接收的翻译选择翻译的若干选择准则。翻译引擎140可以包括在线或者以另一合适的方式从各种翻译引擎提供商可得到的任何翻译服务。在图1中图示的示例实施例中,翻译引擎140a可以是由Google提供的在线翻译引擎,翻译引擎140b可以是由Microsoft提供的在线翻译工具(例如Bing),并且翻译引擎140c可以是由Babylon提供的在线翻译工具。然而,这些特定翻译引擎仅仅作为示例而提供,并且在其它实施例中数据库系统100可以利用其它合适的翻译工具。而且,尽管图1描绘了三个翻译引擎140,但是在其它实施例中,数据库系统100可以耦合到并且可以利用任何其它合适数目(例如2、4、5、6等)的翻译引擎140。
图2是可以作为图1的翻译模块160的示例实现的示例翻译工具200的框图。如图2中图示的,翻译工具200接收作为输入的查询202并且产生作为输出的翻译206。输入查询202可以是用户录入的外语词语或短语并且可以旨在搜索数据库(例如图1的数据库130)以从数据库检索相关信息,或者可以出于接收用于查询到包含在数据库中的文献的母语的翻译的目的而提供给数据库。参照图1,查询202可以由用户录入到网络使能设备114中并且可以经由数字网络132传输到数据库系统100。翻译工具200接收查询202并且使查询202传输(例如经由图1的数字网络132)到多个翻译引擎204(其对应于例如图1的翻译引擎144)。尽管图2中图示了三个翻译引擎204,但是在其它实施例中向其它合适数目(例如2、4、5、6等)的翻译引擎204传输查询202。响应于将查询202传输到翻译引擎204,翻译工具200可以从每一个翻译引擎204接收相应翻译206。将所接收的翻译206提供给选择引擎208,其可以操作成从多个所接收的翻译206选择最佳或最精确的翻译204。所选翻译204然后可以被传输给用户和/或可以用于搜索数据库(例如图1的数据库130),并且可以将使用所选翻译204获得的搜索结果传输给用户。
图3是根据一个实施例的用于从多个可能的翻译选择翻译的示例选择引擎300的框图。选择引擎300对应于图2的选择引擎208的一个示例实现。选择引擎300耦合到数据库304并且一般用于产生用于由用户录入以用于搜索数据库304的外语查询的翻译。一般而言,选择引擎300接收多个翻译302(例如从多个翻译引擎获得)并且从多个翻译302选择“最精确的”翻译。“最精确的”翻译可以例如定义为将最可能被源自数据库304的语言的母语者使用的翻译。因此,为了选择最佳翻译,翻译引擎300可以应用基于源自数据库304的语言的母语者使用翻译302的可能性的一个或多个选择准则。用于从多个可能的翻译302选择最精确的翻译的选择准则可以包括例如可以基于每一个翻译302在文献文集中(诸如在包含在数据库304中的文献中)出现的频率的“文献”准则。选择准则可以此外或可替换地包括可以基于(一个或多个)搜索日志306中或之前用于访问数据库304的另一查询记录中翻译302出现的频率的“搜索”准则。
为了确定文献选择准则和/或搜索日志选择准则,选择引擎300可以利用通信耦合到数据库304和/或(一个或多个)搜索日志306或者更特定地通信耦合到包含(一个或多个)搜索日志306的存储器的频率引擎303。例如,为了确定文献准则,频率引擎303可以利用每一个翻译302搜索数据库304以获得针对每一个翻译302的搜索结果306,其可以包含基于翻译302从数据库304检索的文献。频率引擎303然后可以确定每一个翻译302出现在由搜索结果306针对每一个翻译302提供的文献中的次数。在实施例中,频率引擎303确定或生成针对每一个翻译302的相应文献因子310。针对翻译302生成或确定的相应文献因子310指示翻译302出现在数据库304中包含的文献中的次数。在一些实施例中,基于翻译302在搜索结果306提供的文献的不同部分中的出现频率的加权和确定针对每一个翻译302的相应文献因子310。例如,频率引擎303可以确定翻译302出现在由搜索结果306提供的文献的若干部分(诸如在由搜索结果306提供的文章、书籍等的不同章节(例如标题、摘要、文本、关键词等)中)的每一个中的次数,并且可以将相应加权因子应用于所确定的文献的不同部分中的出现频率。作为实例,翻译在文章的标题或摘要中的出现频率可以具有不同的意义,并且因此可以被给出与文章的文本中的出现频率不同的权重。换言之,被视为或确定为具有对于对翻译排序的更重大的意义的文献部分可以被加权得高于被视为或确定为具有较少意义的文献部分。针对翻译302的文献因子310然后可以被确定成反映翻译在由搜索结果306提供的文献的不同部分中的出现频率的加权和或加权平均。
为了确定搜索准则,频率确定引擎303可以使用每一个翻译302来搜索搜索日志306并且确定每一个翻译302出现在搜索日志306中的次数。频率引擎303可以确定或生成指示每一个翻译302出现在搜索日志306中的次数的针对每一个翻译302的相应搜索因子311。频率引擎303然后可以向排序引擎310提供针对每一个翻译302确定的相应文献因子310和/或相应搜索因子311。
排序引擎310接收文献因子310和/或搜索因子311并且利用因子310和/或因子311来确定针对每一个翻译302的相应排序得分314。可以例如基于针对特定翻译302确定的文献因子确定针对翻译302的排序得分314。在该情况中,频率引擎303可以不需要生成搜索因子311,并且确定针对翻译302的搜索因子311的功能可以从频率引擎303省略。为了基于针对翻译302确定的文献因子310确定针对翻译302的排序得分314,排序引擎312可以对文献因子310归一化以获得对应于每一个文献因子310的0和1之间的相应值。可以关于针对其它翻译302的文献因子310归一化针对翻译302的文献因子310。例如,每一个文献因子310可以在算术上除以最大的文献因子310。可替换地,文献因子310可以以另一合适的方式归一化,诸如通过用每一个文献因子310除以预确定的值。一旦确定,针对翻译302的文献因子310的经归一化的值可以用作针对翻译302的排序得分314。
可替换地,针对每一个翻译302的相应排序得分314可以基于针对特定翻译302确定的搜索因子311确定。在该情况中,频率引擎303可以不需要生成针对翻译302的文献因子310,并且确定针对翻译302的文献因子的功能可以从频率引擎303省略。为了基于针对翻译302确定的搜索因子311确定针对翻译302的排序得分314,排序引擎310可以使对应于翻译302的搜索因子311归一化以获得针对搜索因子311的0和1之间的值,并且搜索因子311的经归一化的值可以用作针对翻译302的排序得分314。可以例如关于针对其它翻译302的搜索因子311归一化针对翻译302的搜索因子311。例如,每一个搜索因子311可以除以搜索因子311的最大值。可替换地,搜索因子311可以以另一合适的方式归一化,诸如通过用每一个搜索因子311除以预确定的值。
作为又一示例,针对每一个翻译302的相应排序得分314可以基于对应于特定翻译302的文献因子310和对应于所述翻译302的搜索因子311二者确定。为了基于针对翻译302确定的文献因子310和搜索因子311二者确定针对翻译302的排序得分314,排序引擎311可以执行对应于翻译302的文献因子310和搜索频率因子311的算术加和以确定针对翻译302的组合排序得分314。在一些实施例中,当确定针对每一个翻译302的相应组合排序得分324时,排序引擎310可以对组合排序得分归一化以产生针对每一个翻译302的相应经归一化的组合排序得分314或具有0和1之间的值的组合排序得分314。针对翻译302确定的组合排序得分314可以例如关于针对其它翻译302确定的组合排序得分314归一化。例如,每一个组合排序得分314可以除以组合排序得分314的最大值。可替换地,组合排序得分314可以以另一合适的方式归一化,诸如通过用每一个组合排序得分314除以预确定的值。在任何事件中,针对翻译302的组合排序得分314的经归一化的值然后可以用作针对翻译302的排序得分314。
如图3中图示的,排序得分314由排序引擎312提供给选择引擎314。选择引擎314可以接收针对每一个翻译302的相应排序得分314,并且可以基于所接收的排序得分314从可能的翻译302选择翻译318。例如,选择引擎314可以将翻译318选择为具有最高排序得分314的翻译302。
在一些实施例中,选择引擎300可以包括学习能力,其可以改进由排序引擎312执行的排序的精确性。例如,可以向用户提供所选翻译318,并且可以请求用户提供针对所选翻译318的反馈。用户可以通过指示例如所选翻译318是针对用户录入的查询的合适翻译还是不是针对用户录入的查询的合适翻译来提供反馈。当用户指示翻译不适合时,用户可以被给出提供针对查询的可替换翻译的选项,例如用户认为是针对查询的更合适的翻译的翻译。另外,在一些实施例中,如果用户指示所选翻译318不是针对用户录入的查询的合适翻译,选择引擎300可以从翻译302选择第二翻译,并且然后可以向用户呈现第二翻译。第二翻译可以例如是具有由排序引擎确定的次高排序314的翻译302。可以进一步请求用户提供关于第二所选翻译的合适性的反馈。
在一些实施例中,这样的用户反馈可以用于改进由排序引擎312产生的排序的精确性。例如,当基于对应于翻译302的文献因子310和搜索因子311二者确定针对翻译302的排序得分314时,排序得分314可以基于对应于翻译302的文献因子310和搜索因子311的加权和确定。在该情况中,应用于文献因子310和搜索因子311以用于产生针对提供给排序引擎312的后续翻译的排序得分的加权因子可以根据针对之前的翻译接收的用户反馈来确定和/或调节。例如,可以基于用户反馈确定相比于基于搜索准则接收较高排序得分的翻译,用户一般更喜欢基于文献准则接收较高排序得分的翻译。在该情况中,较高的加权因子可以应用于文献因子310,并且较低的加权因子可以应用于搜索因子311以用于排序引擎312后续执行的排序。以类似的方式,用户反馈可以用于确定或调节应用于文献的不同部分(例如标题、摘要、文本、关键词等)中的翻译的出现频率的加权因子。更进一步地,由用户提供的翻译可以用于增强选择引擎300后续产生的翻译。例如,由用户提供的翻译可以用作用于后续提供给选择引擎300的查询的可能翻译。在其它实施例中,用户反馈可以用于以其它适合的方式增强后续翻译的精确性。
图4是根据一个示例实施例的包括用于增强翻译排序的机器学习能力的示例选择引擎400的框图。选择引擎400一般类似于图3的选择引擎300并且包括相似编号的组件,为了简明的目的而不讨论所述组件。选择引擎400包括机器学习引擎402。机器学习引擎402可以经由用户反馈输入404接收用户反馈并且还可以经由“其它输入”406接收涉及选择引擎400处理的翻译的其它信息。用户反馈可以包括从用户接收的关于提供给用户的翻译的合适性的指示。此外或可替换地,用户反馈可以包括由用户提供的可替换翻译。输入406可以包括例如针对之前由排序引擎312排序的翻译生成的文献因子310和搜索因子311。机器学习引擎402可以在某个时间段内收集用户反馈,并且可以利用所收集的反馈增强后续由排序引擎312执行的排序的精确性。例如,机器学习引擎402可以分配和/或调节在排序引擎412执行的后续排序中分别应用于文献因子310和搜索因子311的加权因子408、409。例如,如以上讨论的,如果确定相比于基于搜索准则接收较高排序得分的翻译,用户一般更喜欢基于文献准则接收较高排序得分的翻译,则机器学习引擎402可以生成应用于文献因子310的较高加权因子408和应用于搜索因子311的较低加权因子409以用于排序引擎312执行的后续排序。
图5是根据实施例的用于将数据库查询从第一语言翻译成第二语言的示例方法500的流程图。参照图1,方法500可以至少部分地由数据库系统100实现。例如,翻译模块160在运行在处理器122上时,可以操作成执行全部或部分的方法500。现在参照图2,翻译引擎200可以至少部分地实现方法500。现在参照图3,选择引擎300可以执行方法500的至少一部分。
方法500在块502处开始,此处接收针对医学数据库的查询。查询可以由用户录入到例如网络使能设备中,并且可以在块502处经由数字网络接收查询。方法500一般产生用于块502处接收的查询的从第一语言到第二语言的翻译。第一语言是不对应于包含在医学数据库中的文献语言的外语,并且第二语言是对应于包含在医学数据库中的文献语言的语言。在块404处,将所接收的查询传输到多个翻译引擎。经由例如在块502处通过其接收查询的数字网络将查询传输到多个翻译引擎。多个翻译引擎可以包括由例如不同的在线翻译引擎提供商提供的翻译引擎。
在块506处,从查询在块504处传输到的每一个翻译引擎接收查询从第一语言到第二语言的相应翻译。所接收的翻译可以是不同的并且一个或多个所接收的翻译可以是比其它所接收的翻译更精确的查询翻译。方法500试图从块508处接收的翻译选择最精确的翻译。为此目的,在块508处的操作通过确定针对块506处接收的每一个翻译的相应排序得分来对块506处接收的翻译排序。根据一个或多个准则确定在块508处的排序,诸如以上描述的文献准则和/或搜索准则。在块510处,从块506处接收的多个翻译选择翻译。例如,在块510处选择具有在块508处确定的最高排序得分的翻译。
在块512处可以向用户传输在块510处选择的翻译。此外或可替换地,在块510处选择的翻译可以用于搜索医学数据库以获得来自医学数据库的针对查询的搜索结果,并且在块512处可以将搜索结果传输给用户。
有利地,如本文所描述的数据库系统和方法响应于以外语的搜索查询而以较少时间产生较好的搜索结果。因此,使用数据库系统和/或方法的一个技术效果在于用户和服务提供商之间的网络带宽减小,因为生成了较好的搜索结果。此外,由于生成了较好的结果,还有利地减少了处理器使用和功耗。
虽然本文以术语“模块”、“组件”、“引擎”或“工具”描述了数据库系统的各种操作,但是要指出的是,这些术语不限于单个单元或功能。而且,归因于本文描述的模块、组件、引擎或工具中的一些的功能可以组合并且归因于更少的模块、组件、引擎或工具。更进一步地,虽然参照特定示例描述了本发明,但是那些示例旨在仅仅是说明性的,并且不旨在限制本发明。对本领域普通技术人员将显而易见的是,可以对所公开的实施例做出改变、添加或删除而不脱离于本发明的精神和范围。例如,以上描述的方法的一个或多个部分可以以不同的次序(或者同时)执行并且仍实现合期望的结果。

Claims (21)

1.一种用于将医学数据库查询从第一语言翻译成第二语言的方法,方法由编程为执行该方法的一个或多个计算机处理器施行,方法包括:
在处理器处经由网络从用户接收针对医学数据库的查询,其中查询是以第一语言;
通过处理器向多个翻译引擎传输所接收的查询;
在处理器处接收用于查询的从第一语言到第二语言的多个翻译,其中相应翻译从多个翻译引擎中的每一个翻译引擎接收;
通过处理器确定针对多个所接收的翻译中的每一个所接收的翻译的相应排序得分;
通过处理器并且基于所确定的排序得分从多个翻译选择翻译;以及
执行以下中的一个或两个:
(i)通过处理器并且经由网络向用户传输所选翻译,以及
(ii)通过处理器利用所选翻译搜索医学数据库以获得针对查询的搜索结果,并且通过处理器并且经由网络向用户传输所获得的搜索结果;
其中确定针对每一个翻译的相应排序得分包括基于以下确定相应排序得分:(i)文献准则,文献准则指示翻译在包含在医学数据库中的文献主体中的出现频率,或者(ii)文献准则和搜索日志准则,搜索日志准则指示翻译在之前录入到医学数据库中的查询记录中的出现频率。
2.根据权利要求1所述的方法,其中当至少部分地基于文献准则确定相应排序得分时,确定相应排序得分包括基于以下中的一个确定针对翻译的文献因子:(i)翻译在包含在医学数据库中的文献的不同部分中的相应出现频率的加权和或(ii)翻译在包含在医学数据库中的文献的不同部分中的相应出现频率的加权平均。
3.根据权利要求1所述的方法,其中当基于文献准则确定相应排序得分时,确定针对每一个翻译的排序得分包括:
确定指示翻译在包含在医学数据库中的文献主体中的出现频率的相应文献因子;
关于针对多个翻译中的其它翻译确定的文献因子对相应文献因子归一化以产生针对翻译的相应经归一化的文献因子;以及
将针对翻译的相应经归一化的文献因子用作针对翻译的排序得分。
4.根据权利要求1所述的方法,其中当基于搜索日志准则确定相应排序得分时,确定针对每一个翻译的相应排序得分包括:
确定指示翻译在之前录入到医学数据库中的查询记录中的出现频率的相应搜索因子;
关于针对多个翻译中的其它翻译确定的搜索因子对相应搜索因子归一化以产生针对翻译的经归一化的搜索因子;以及
将针对翻译的经归一化的搜索因子用作针对翻译的排序得分。
5.根据权利要求1所述的方法,其中当基于文献准则和搜索日志准则二者确定相应排序得分时,确定相应排序得分包括:
确定指示翻译在文献主体中的出现频率的相应文献因子;
确定指示翻译在之前录入到医学数据库中的查询记录中的出现频率的相应搜索因子;
通过执行相应文献因子和相应搜索因子的算术加和确定相应组合因子;
关于针对多个翻译中的其它翻译确定的组合因子对相应组合因子归一化以产生针对翻译的相应经归一化的组合因子;以及
将针对翻译的相应经归一化的组合因子用作针对翻译的排序得分。
6.根据权利要求1所述的方法,其中当基于文献准则和搜索日志准则二者确定相应排序得分时,确定相应排序得分包括:
确定指示翻译在文献主体中的出现频率的相应文献因子;
确定指示翻译在之前录入到医学数据库中的查询记录中的出现频率的相应搜索因子;
确定应用于(i)文献因子和(ii)搜索日志因子的相应加权因子;
将对应的相应加权因子应用于相应文献因子和相应搜索因子以生成相应经加权的文献因子和相应经加权的搜索日志因子;
通过执行相应经加权的文献因子和相应经加权的搜索因子的算术加和确定相应组合因子;
关于针对其它翻译确定的组合因子对相应组合因子归一化以产生针对翻译的经归一化的组合因子;以及
将针对翻译的经归一化的组合因子用作针对翻译的排序得分。
7.根据权利要求6所述的方法,还包括:
请求用户通过指示翻译是(i)合适还是(ii)不合适来提供针对所呈现的翻译的反馈;
从用户接收所请求的反馈;以及
基于所接收的用户反馈调节针对后续翻译的排序得分。
8.根据权利要求7所述的方法,其中调节针对后续翻译的排序得分包括基于反馈调节应用于(i)文献准则和(ii)搜索日志准则二者的相应加权因子。
9.根据权利要求7所述的方法,还包括:
响应于接收到指示所选翻译不合适的用户反馈,执行以下中的一个或两个:(i)从多个翻译选择第二翻译并且请求用户提供针对第二翻译的反馈,以及(ii)请求用户提供针对查询的可替换的翻译。
10.根据权利要求9所述的方法,还包括基于用户反馈进一步调节针对后续翻译的排序得分。
11.一种具有存储在其上的由处理器可执行的指令集的非暂时性计算机可读存储介质,用于将医学数据库查询从第一语言翻译成第二语言,指令包括:
用于接收针对医学数据库的查询的指令,其中查询是以第一语言;
用于向多个翻译引擎传输所接收的查询的指令;
用于接收用于查询的从第一语言到第二语言的多个翻译的指令,其中相应翻译从多个翻译引擎中的每一个翻译引擎接收;
用于确定针对多个所接收的翻译中的每一个所接收的翻译的相应排序得分的指令;以及
用于基于所确定的排序得分从多个翻译选择翻译的指令;以及
用于执行以下中的一个或两个的指令:
(i)向用户传输所选翻译,以及
(ii)利用所选翻译搜索医学数据库以获得针对查询的搜索结果,并且向用户传输所获得的搜索结果;
其中用于确定针对每一个翻译的相应排序得分的指令包括用于基于以下确定相应排序得分的指令:(i)文献准则,文献准则指示翻译在包含在医学数据库中的文献主体中的出现频率,或者(ii)文献准则和搜索日志准则,搜索日志准则指示翻译在之前录入到医学数据库中的查询记录中的出现频率。
12.根据权利要求11所述的非暂时性计算机可读存储介质,其中当至少部分地基于文献准则确定相应排序得分时,确定相应排序得分的指令包括用于基于以下中的一个确定翻译的文献因子的指令:(i)翻译在包含在医学数据库中的文献的不同部分中的相应出现频率的加权和或(ii)翻译在包含在医学数据库中的文献的不同部分中的相应出现频率的加权平均。
13.根据权利要求11所述的非暂时性计算机可读存储介质,其中当基于文献准则确定相应得分时,用于确定相应排序得分的指令还包括:
用于确定指示翻译在包含在医学数据库中的文献主体中的出现频率的相应文献因子的指令;
用于关于针对多个翻译中的其它翻译确定的文献因子对相应文献因子归一化以产生针对翻译的相应经归一化的文献因子的指令;以及
用于将针对翻译的相应经归一化的文献因子用作针对翻译的排序得分的指令。
14.根据权利要求11所述的非暂时性计算机可读存储介质,其中当基于搜索日志准则确定相应得分时,用于确定相应排序得分的指令还包括:
用于确定指示翻译在之前录入到医学数据库中的查询记录中的出现频率的相应搜索因子的指令;
用于关于针对多个翻译中的其它翻译确定的搜索因子对相应搜索因子归一化以产生针对翻译的经归一化的搜索因子的指令;以及
用于将针对翻译的经归一化的搜索因子用作针对翻译的排序得分的指令。
15.根据权利要求11所述的非暂时性计算机可读存储介质,其中当基于文献准则和搜索日志准则二者确定相应得分时,用于确定相应排序得分的指令还包括:
用于确定指示翻译在文献主体中的出现频率的相应文献因子的指令;
用于确定指示翻译在之前录入到医学数据库中的查询记录中的出现频率的相应搜索因子的指令;
用于通过执行相应文献因子和相应搜索因子的算术加和确定相应组合因子的指令;
用于关于针对多个翻译中的其它翻译确定的组合因子对相应组合因子归一化以产生针对翻译的相应经归一化的组合因子的指令;以及
用于将针对翻译的相应经归一化的组合因子用作针对翻译的排序得分的指令。
16.根据权利要求11所述的非暂时性计算机可读存储介质,其中当基于文献准则和搜索日志准则二者确定相应得分时,用于确定相应排序得分的指令还包括:
用于确定指示翻译在文献主体中的出现频率的相应文献因子的指令;
用于确定指示翻译在之前录入到医学数据库中的查询记录中的出现频率的相应搜索因子的指令;
用于确定应用于(i)文献因子和(ii)搜索日志因子的相应加权因子的指令;
用于将对应的相应加权因子应用于相应文献因子和相应搜索因子以生成相应经加权的文献因子和相应经加权的搜索日志因子的指令;
用于通过执行相应经加权的文献因子和相应经加权的搜索因子的算术加和确定相应组合因子的指令;
用于关于针对其它翻译确定的组合因子对相应组合因子归一化以产生针对翻译的经归一化的组合因子的指令;以及
用于将针对翻译的经归一化的组合因子用作针对翻译的排序得分的指令。
17.根据权利要求14所述的非暂时性计算机可读存储介质,还包括用于以下的指令:
请求用户通过指示翻译是(i)合适还是(ii)不合适来提供针对所呈现的翻译的反馈;
从用户接收所请求的反馈;以及
基于所接收的用户反馈调节针对后续翻译的排序得分。
18.根据权利要求17所述的非暂时性计算机可读存储介质,其中用于调节针对后续翻译的排序得分的指令还包括基于反馈调节应用于(i)文献准则和(ii)搜索日志准则二者的相应加权因子。
19.根据权利要求17所述的非暂时性计算机可读存储介质,还包括用于以下的指令:
响应于接收到指示所选翻译不合适的用户反馈,执行以下中的一个或两个:(i)从多个翻译选择第二翻译并且请求用户提供针对第二翻译的反馈,以及(ii)请求用户提供针对查询的可替换的翻译。
20.根据权利要求19所述的非暂时性计算机可读存储介质,还包括用于基于用户反馈进一步调节针对后续翻译的排序得分的指令。
21.根据权利要求11所述的非暂时性计算机可读存储介质,其中用于确定针对每一个翻译的相应排序得分的指令包括用于仅基于(i)文献准则确定相应排序得分的指令。
CN201380074248.6A 2013-01-03 2013-12-31 数据库查询翻译系统 Active CN105051728B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/733,858 US8914395B2 (en) 2013-01-03 2013-01-03 Database query translation system
US13/733858 2013-01-03
PCT/US2013/078402 WO2014107444A1 (en) 2013-01-03 2013-12-31 Data base query translation system

Publications (2)

Publication Number Publication Date
CN105051728A CN105051728A (zh) 2015-11-11
CN105051728B true CN105051728B (zh) 2019-10-11

Family

ID=49998717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380074248.6A Active CN105051728B (zh) 2013-01-03 2013-12-31 数据库查询翻译系统

Country Status (9)

Country Link
US (1) US8914395B2 (zh)
EP (2) EP2941721A1 (zh)
JP (1) JP6448547B2 (zh)
KR (1) KR102140983B1 (zh)
CN (1) CN105051728B (zh)
BR (1) BR112015015984B1 (zh)
CA (1) CA2896273C (zh)
MX (1) MX354378B (zh)
WO (1) WO2014107444A1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9600473B2 (en) * 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US20160019291A1 (en) * 2014-07-18 2016-01-21 John R. Ruge Apparatus And Method For Information Retrieval At A Mobile Device
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
US20160246781A1 (en) * 2015-02-19 2016-08-25 Gary Cabot Medical interaction systems and methods
CN106776583A (zh) * 2015-11-24 2017-05-31 株式会社Ntt都科摩 机器翻译评价方法和设备及机器翻译方法和设备
US20170147791A1 (en) * 2015-11-24 2017-05-25 Bradley M. Dalton System and method for facilitating medical admissions
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
CN106021239B (zh) * 2016-04-29 2018-10-26 北京创鑫旅程网络技术有限公司 一种翻译质量实时评价方法
US10445356B1 (en) * 2016-06-24 2019-10-15 Pulselight Holdings, Inc. Method and system for analyzing entities
US9922029B1 (en) * 2016-06-30 2018-03-20 Facebook, Inc. User feedback for low-confidence translations
US10332628B2 (en) * 2016-09-30 2019-06-25 Sap Se Method and system for control of an electromechanical medical device
KR101719107B1 (ko) * 2016-10-27 2017-04-06 박성국 번역을 위한 서버 및 번역 방법
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
JP6534767B1 (ja) * 2018-08-28 2019-06-26 本田技研工業株式会社 データベース作成装置及び検索システム
CN110930208B (zh) * 2018-09-19 2023-05-05 阿里巴巴集团控股有限公司 对象搜索方法及装置
DE102018219867B4 (de) 2018-11-20 2020-10-29 Leica Microsystems Cms Gmbh Lernender Autofokus
CN114270450A (zh) * 2019-06-10 2022-04-01 株式会社岛津制作所 文献信息提供方法以及程序
US11074420B2 (en) 2019-06-25 2021-07-27 International Business Machines Corporation Self-learning input-driven brokering of language-translation engines
KR102282721B1 (ko) * 2019-11-18 2021-07-29 주식회사 메드올스 의료 기기 및 약품 정보 제공 시스템 및 방법
CN112287217B (zh) * 2020-10-23 2023-08-04 平安科技(深圳)有限公司 医学文献检索方法、装置、电子设备及存储介质
KR20230160619A (ko) 2022-05-17 2023-11-24 포스트에이아이 주식회사 외국어 병렬 말뭉치 원천데이터 구축방법 및 이를 실행시키기 위한 프로그램을 기록한 저장매체

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271461A (zh) * 2007-03-19 2008-09-24 株式会社东芝 跨语言检索请求的转换及跨语言信息检索方法和系统
CN101868797A (zh) * 2007-09-21 2010-10-20 谷歌公司 跨语言搜索

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5335434A (en) 1976-09-13 1978-04-01 Lexicon Corp Information processor
JPS57201958A (en) 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
US5675815A (en) 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5660176A (en) * 1993-12-29 1997-08-26 First Opinion Corporation Computerized medical diagnostic and treatment advice system
USH2098H1 (en) 1994-02-22 2004-03-02 The United States Of America As Represented By The Secretary Of The Navy Multilingual communications device
JPH09128396A (ja) 1995-11-06 1997-05-16 Hitachi Ltd 対訳辞書作成方法
US6085162A (en) 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
ITUD980032A1 (it) 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
JP2001101185A (ja) 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
US20020002452A1 (en) 2000-03-28 2002-01-03 Christy Samuel T. Network-based text composition, translation, and document searching
US7254531B2 (en) 2000-09-05 2007-08-07 Nir Einat H In-context analysis and automatic translation
US6885985B2 (en) 2000-12-18 2005-04-26 Xerox Corporation Terminology translation for unaligned comparable corpora using category based translation probabilities
JP3379090B2 (ja) 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US7860706B2 (en) 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US6999916B2 (en) 2001-04-20 2006-02-14 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
US20020188896A1 (en) 2001-06-07 2002-12-12 Filteau Sheila B. System and method for generating multi-lingual reports
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US20040102201A1 (en) 2002-11-22 2004-05-27 Levin Robert E. System and method for language translation via remote devices
US8050906B1 (en) 2003-06-01 2011-11-01 Sajan, Inc. Systems and methods for translating text
CA2554890A1 (en) * 2003-12-17 2005-06-30 Speechgear, Inc. Translation tool
US20070022134A1 (en) 2005-07-22 2007-01-25 Microsoft Corporation Cross-language related keyword suggestion
US20070094051A1 (en) * 2005-10-20 2007-04-26 Banks Catherine G Method for conducting business at a medical practice
US8249855B2 (en) 2006-08-07 2012-08-21 Microsoft Corporation Identifying parallel bilingual data over a network
US8645120B2 (en) * 2007-10-16 2014-02-04 Lockheed Martin Corporation System and method of prioritizing automated translation of communications from a first human language to a second human language
US8209164B2 (en) 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
JP5112116B2 (ja) * 2008-03-07 2013-01-09 株式会社東芝 機械翻訳する装置、方法およびプログラム
WO2010022866A2 (en) 2008-08-28 2010-03-04 Health Enterprise East Ltd Translation apparatus
US8775155B2 (en) * 2010-10-25 2014-07-08 Xerox Corporation Machine translation using overlapping biphrase alignments and sampling
JP2012118883A (ja) * 2010-12-02 2012-06-21 Nec Corp 翻訳装置、翻訳システム、翻訳方法および翻訳プログラム
KR101850124B1 (ko) * 2011-06-24 2018-04-19 구글 엘엘씨 교차-언어 쿼리 제안을 위한 쿼리 번역 평가
US8918308B2 (en) * 2012-07-06 2014-12-23 International Business Machines Corporation Providing multi-lingual searching of mono-lingual content
US9916306B2 (en) * 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271461A (zh) * 2007-03-19 2008-09-24 株式会社东芝 跨语言检索请求的转换及跨语言信息检索方法和系统
CN101868797A (zh) * 2007-09-21 2010-10-20 谷歌公司 跨语言搜索

Also Published As

Publication number Publication date
US20140188856A1 (en) 2014-07-03
US8914395B2 (en) 2014-12-16
EP3637278A1 (en) 2020-04-15
CA2896273C (en) 2021-03-23
WO2014107444A1 (en) 2014-07-10
JP6448547B2 (ja) 2019-01-09
KR20150103367A (ko) 2015-09-10
BR112015015984B1 (pt) 2022-08-23
JP2016505989A (ja) 2016-02-25
EP2941721A1 (en) 2015-11-11
BR112015015984A2 (pt) 2017-07-11
CN105051728A (zh) 2015-11-11
MX354378B (es) 2018-02-28
CA2896273A1 (en) 2014-07-10
KR102140983B1 (ko) 2020-08-04
MX2015008723A (es) 2016-03-09

Similar Documents

Publication Publication Date Title
CN105051728B (zh) 数据库查询翻译系统
US20220294748A1 (en) Conversational bot interaction with utterance ranking
CN102063453A (zh) 一种用于基于用户的需求进行搜索的方法和设备
CN106056209B (zh) 一种基于循环神经网络的查询词项权重学习方法
Bhatia Link analysis algorithms for web mining
WO2022081937A1 (en) Event-based semantic search and retrieval
CN109885651B (zh) 一种问题推送方法和装置
JP6388212B2 (ja) タグ付与方法、タグ付与装置、プログラム及び質問回答検索方法
US10643178B1 (en) Asynchronous real-time procurement system
AU2006204771A1 (en) Systems, methods, and software for retrieving information using multiple query languages
Kumar et al. Framework for distributed semantic web crawler
CN106294417A (zh) 一种数据排序方法、装置及电子设备
CN105354344A (zh) 搜索引擎优化系统及方法
CN105608183B (zh) 一种提供聚合类型回答的方法和装置
CN103067362B (zh) 资源信息的推送方法及系统
CN102968459A (zh) 网址处理方法及装置
Faqeeh et al. Topical search engine for Internet of Things
Bhadoriya et al. SARA (Smart AI Refrigerator Assistant)
Bauckhage et al. An intelligent knowledge sharing system for web communities
Patil et al. Implementation of enhanced web crawler for deep-web interfaces
Hu et al. PIXS: programmable intelligence for cross-platform socialization
Tang et al. Towards interactive qa: suggesting refinement for questions
Zaoui et al. A personalization layer for mediation systems.
Kumar et al. Study of Preference Based Page Ranking Algorithm
Venugopal et al. Reduction of Search Space in Restful Service Discovery

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant