CN104145270A - 使用产品信息的外语翻译 - Google Patents
使用产品信息的外语翻译 Download PDFInfo
- Publication number
- CN104145270A CN104145270A CN201380012055.8A CN201380012055A CN104145270A CN 104145270 A CN104145270 A CN 104145270A CN 201380012055 A CN201380012055 A CN 201380012055A CN 104145270 A CN104145270 A CN 104145270A
- Authority
- CN
- China
- Prior art keywords
- language
- translation
- search
- readable
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3337—Translation of the query language, e.g. Chinese to English
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
可利用产品信息来创建翻译词典。所述翻译词典随后可被利用来将搜索查询从外语翻译成利用来提供在线电子商务市场的主要语言。所述已翻译的搜索查询随后可被利用来执行由所述在线电子商务市场所维护的产品目录的搜索。用所述产品信息创建的所述翻译词典还可被利用来翻译资源,诸如网站资源,以验证对所述资源的翻译和执行其它功能。
Description
发明背景
商户可提供在线电子商务市场以供顾客购买各种产品。产品可包括直接送货给顾客的实体产品和/或顾客从电子商务市场下载的数字产品。操作电子商务市场的商户和/或第三方卖方可使产品可在市场上出售。第三方卖方可向提供电子商务市场的商户系统提供他们出售的产品的产品信息。利用产品信息生成有关电子商务市场上的产品的产品列表。
卖方提供的产品信息可能包括产品的各种属性的值,诸如产品的标识符,如库存单元(“SKU”)号;产品的名称或描述;产品的技术规格;产品价格;产品可供性,诸如产品是否“有存货”;送货参数和成本;顾客可获得产品的地理区域;卖方物流中心的设置区域;其它类型的产品细节。产品信息可随后利用于在产品目录中生成产品列表。可通过在线电子商务市场获得产品列表以供希望从卖方购买相应产品的顾客搜索和浏览。
在线电子商务市场提供的产品信息通常用适于市场的区域设置的人类可读语言来呈现。例如,美国的在线电子商务市场可提供英文的产品信息,而西班牙的在线电子商务市场可呈现西班牙语的产品信息。无论电子商务市场以何种语言呈现,电子商务市场接收以不同于市场的主要语言的语言(本文中称为“外语”)表达的搜索查询并非罕见的。例如,以英语呈现的美国电子商务市场可接收以西班牙语或其它非英语语言表达的查询。
在线电子商务市场所接收的使用外语表达的搜索查询可被利用来以标准方式搜索产品。因为此类搜索查询以不同于市场的主要语言的语言表达,所以使用此类搜索查询执行的搜索可能将不会返回有意义的搜索结果。这可能会让市场的顾客感到困惑和/或沮丧,并且可导致顾客到另一在线电子商务市场购物。
鉴于这些和其它考虑,呈现本文的公开内容。
附图简述
图1是示出本文公开的实施方案的包括用于提供在线电子商务市场的商户系统的示意性操作环境的系统图;
图2是示出本文公开的各种实施方案的一个操作环境的额外方面的系统图;
图3是示出根据本文公开的一个实施方案的用于使用产品信息创建翻译词典的一个机制的方面的软件架构图;
图4是示出根据本文公开的一个实施方案的本文呈现的用于翻译外语搜索查询的一个机制的方面的软件架构图;
图5是示出根据本文公开的一个实施方案的用于翻译外语搜索查询的一个示意性例程的流程图;
图6是示出根据本文公开的一个实施方案的本文呈现的用于翻译资源(诸如网站资源)的一个机制的方面的软件架构图;
图7是示出根据本文公开的一个实施方案的用于翻译资源(诸如网站资源)的一个示意性例程的流程图;
图8是示出根据本文公开的一个实施方案的用于验证对资源(例如网站资源)的翻译的一个示意性机制的流程图;
图9是示出根据本文公开的一个实施方案的用于验证对资源(诸如网站资源)的翻译的一个示意性例程的流程图;以及
图10是示出在被配置来在一个实施方案中实施本文公开的概念和技术的计算设备中使用的一个示意性计算机硬件架构的计算机架构图。
具体实施方式
以下详细描述涉及使用产品信息进行外语翻译的技术。通过本文公开的概念和技术的实施方式,利用从产品信息创建的词典,在线电子商务市场所接收的搜索查询可从外语翻译成被利用来提供市场的主要语言。已翻译的搜索查询随后可利用来搜索市场,从而可能比在没有翻译的情况下已经处理的外语搜索查询提供更好的搜索结果。
根据本文呈现的方面,公开了一种被配置来执行在线购物模块的商户系统,所述在线购物模块提供电子商务市场,诸如万维网(“Web”)站以用于在线购物。在线购物模块还被配置来维护并利用产品目录,该产品目录存储可通过电子商务市场购买的产品的产品列表。电子商务市场提供用于浏览和搜索产品目录中的产品,购买产品的功能,以及用于执行其它功能。
根据实施方案,商户系统还被配置来允许多个卖方通过电子商务市场出售产品。卖方可向商户系统提供产品信息,所述产品信息被利用来生成卖方提供出售的产品的产品列表。如上所述,卖方提供的产品信息可包括产品的各种属性的数据,诸如产品的标识符;产品的名称或描述;产品的技术规格;购买价格;有关产品可供性的数据;送货参数和成本;顾客可获得的产品的地理区域;卖方物流中心的设置区域;和其它类型的产品细节。产品信息可随后被利用来满足搜索查询,并生成产品目录中的产品的产品列表。
根据一个实施方案,商户系统还被配置来允许卖方以多种人类可读语言提供产品信息。例如,卖方可提供英文的产品描述,并对相同产品提供以西班牙语的产品描述。商户系统可存储并利用这个信息来用适于特定区域设置的语言提供在线电子商务市场的本地化版。例如,可利用西班牙语产品信息来向位于西班牙和/或讲西班牙语的国家的顾客提供在线电子商务市场的西班牙语版。
在一个实施方案中,商户系统还被配置来将使用不同于在线电子商务市场的主要语言的人类可读语言(本文称为“外语”)表达的搜索查询翻译成在线市场的主要语言。为了执行这个功能,在一个实施方案中,该商户系统被配置来从已经以多种语言接收的产品信息生成翻译词典。具体而言,可对已以多种语言提供的产品信息执行统计分析,以生成翻译词典。
根据一个实施方式,翻译词典包括在一种语言(例如,英语)的产品信息中找到的词。对于第一语言的每个词,翻译词典还包括来自外语产品信息(例如,西班牙语)的一个或多个词,和所述词为第一语言的词的翻译的相应概率。例如,翻译词典可包括英文词“shoe”。对于词“shoe”,翻译词典还可包括西班牙语词“zapato”和“herradura”。对于词“zapato”和“herradura”,翻译词典可表明西班牙语词“zapato”为英文词“shoe”的翻译的概率是85%,以及西班牙语词“herradura”为英文词“shoe”的翻译的概率是15%。
在一个实施方案中,使用来自多个产品目录的产品信息创建翻译词典。以这种方式创建的翻译词典可被利用来翻译不同产品目录中的产品的搜索查询。在另一实施方案中,使用仅来自单个产品目录的产品信息来为每个产品目录创建单独的翻译词典。随后使用翻译词典翻译对每个目录内的产品的搜索,所述翻译词典使用目录中的产品的产品信息而创建。
一旦已创建翻译词典,可利用词典来翻译搜索查询,诸如产品搜索。具体而言,当在商户系统处接收搜索查询查询时,商户系统首先检测查询的语言。如果查询是以外语进行的,那么商户系统可利用翻译词典将搜索查询翻译成由商户系统提供的在线电子商务市场所利用的主要语言。一旦搜索查询已被翻译,已翻译的搜索查询可被利用来以标准方式搜索在线电子商务市场的产品目录。随后可向提交外语搜索查询的用户返回搜索查询的结果。
翻译词典还可被利用来翻译其它信息。例如,翻译词典可利用来翻译在线电子商务市场提供或利用的资源。如本文利用的术语“资源”旨在涵盖以人类可读语言表达的任何文本信息。例如,可利用以上述方式创建的翻译词典翻译被提供为由商户系统(“网站资源”)提供的网站的一部分的文本信息。网站资源可在接收对资源的请求之前翻译,或可在接收对资源的请求时翻译。
在一个实施方案中,在线电子商务市场被配置来在执行搜索查询之后显示一个或多个“精炼”。精炼是用户界面控制,其允许用户精炼搜索查询的范围。例如,用户可在电子商务市场上搜索术语“鞋子”。响应于这种搜索,电子商务市场可导致各种搜索结果被显示。电子商务市场还可显示一个或多个精炼,以精炼搜索查询的范围。例如,市场可示出鞋子的各种大小、宽度、风格或品牌。如果用户选择精炼中的一个,那么搜索结果将被缩小到仅显示满足精炼查询的那些产品。
在一个实施方案中,翻译词典可被利用来将精炼从电子商务市场的主要语言翻译成另一语言。例如,如果电子商务市场的主要语言是英语,那么翻译词典可被利用来将电子商务市场提供的精炼翻译成西班牙语或另一语言。例如,这可响应于接收外语的搜索查询而执行。还可以类似方式翻译在线电子商务市场提供的其它类型的网站资源。
根据其它实施方案,翻译词典还可被利用来验证资源(诸如上述精炼)的翻译。具体而言,为了验证资源的翻译,首先以上述方式翻译资源。已翻译的资源随后被利用于在电子商务市场执行产品搜索。随后确定由已翻译资源生成的搜索结果的数量。随后可基于搜索结果的数量对已翻译资源进行批准或拒绝。例如,产生超过阈值数量的搜索结果的已翻译资源在用作搜索查询时可被批准,而产生少于阈值数量的搜索结果的已翻译资源可被拒绝。以这种方式,产生较少或没有搜索结果的劣质翻译可被拒绝。下文将关于图1-10提供有关翻译词典的创建和使用的额外方面。
应理解,本文公开的实施方案可与任何类型的计算机、计算系统、设备、网站、应用程序、操作系统或其它类型的系统或组件一起利用。因此,虽然本文公开的实施方案主要以商户系统的上下文而呈现,所述商户系统体现了本文公开的使用产品信息执行外语翻译的概念,但是本文呈现的公开内容不限于此类实施方式。
还应理解,本文呈现的主题可实施为计算机过程、计算机受控装置、计算系统或制品,诸如计算机可读存储介质。这些和各种其它特征将从阅读以下公开和查看相关附图变得显而易见。
虽然本文描述的主题以在一个或多个计算设备上执行的程序模块的普通上下文中呈现,但是本领域技术人员将明白,可结合其它类型的程序模块执行其它实施方式。通常,程序模块包括例程、程序、组件、数据结构,和执行特定任务或实施特定的抽象数据类型的其它类型的结构。
本领域技术人员将明白,本文描述的主题可在除下文描述的那些以外的其它计算机系统配置上实践或结合其它计算机系统配置实践,包括多重处理器系统、基于微处理器的或可编程消费电子设备、微型计算机、大型计算机、手持式计算机、个人数字助理、平板电脑、电子书阅读器、无线电话设备、专用硬件设备、网络设备或类似物。本文描述的实施方案还可在分布式计算环境中实践,其中由通过通信网络链接的远程处理设备执行任务。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备中。
在以下详细描述中,对形成其一部分且以说明的方式示出特定实施方案或实例的附图进行参考。本文的附图不一比例绘制。贯穿若干附图,相同数字表示相同元件。
图1和以下描述旨在提供可实施本文描述的实施方案的合适计算环境的简洁、大致的描述。具体而言,图1是示出根据本文提供的实施方案的示意性操作环境100的系统图,所述示意性操作环境100包括用于使用产品信息的外语翻译的若干硬件和软件组件。环境100仅为示意性的,并且本文公开的实施方案可利用于许多不同类型的环境中。
图1中示出的环境100包括提供电子商务市场118的商户系统108,顾客可通过所述电子商务市场118浏览、搜索且购买产品。在一个实施方案中,商户系统108包括将各种应用服务提供给卖方(诸如卖方102)的许多应用服务器110和通过电子商务市场118参与商业活动的顾客(诸如顾客128)。
应用服务器110可实施为标准服务器计算机、数据库服务器、网络服务器、网络设备、台式计算机、其它计算设备和/或其任何组合。应用服务器110可执行许多模块,以提供本文描述的各种服务。模块可在商户系统108中的单个应用服务器110上执行或跨多个应用服务器并行执行。此外,每个模块可由许多子组件组成,所述子组件在商户系统108中的不同应用服务器110或其它计算设备上执行。模块可实施为软件、硬件或两者的任何组合。
如图1所示,顾客128可利用客户端设备104B通过网络106访问商户系统108。网络106可以是局域网(“LAN”)、广域网(“WAN”)、互联网或本领域中已知的将客户端设备104B连接到商户系统108的任何其它网络拓扑。虽然在图1中仅图示了单个顾客128,但是应理解,许多顾客可同时利用电子商户市场118。
顾客128可以是希望从操作商户系统108的在线商户浏览、搜索、购买或已购买一个或多个产品的个人或实体。客户端设备104B可以是个人计算机(“PC”)、台式工作站、膝上型计算机、平板电脑、笔记本计算机、个人数字助理(“PDA”)、电子书阅读器、游戏控制台、机顶盒、消费电子设备、服务器计算机或能够连接到网络106且与商户系统108通信的任何其它类型的计算设备。顾客102还可以在本文中称为到商户系统108提供的电子商务市场118的“用户”或“访客”。
顾客128可使用在客户端设备104B上执行的客户端应用120来访问并利用由应用服务器110提供的在线购物服务。在一个实施方案中,客户端应用120是网络浏览器应用,诸如来自加利福尼亚的山景城的MOZILLA基金会的网络浏览器。客户端应用120使用超文本传输协议(“HTTP”)或另一合适的协议通过网络106与商户系统108中的应用服务器110交换数据。客户端应用120还可以是被配置来与应用服务器110通信的独立客户端应用。客户端应用还可利用本领域中已知的任何数量的通信方法来跨网络106与商户系统108和/或应用服务器110通信,所述通信方法包括远程过程调用、基于SOAP的网络服务、远程文件访问、专有客户端-服务器架构和类似物。
根据一个实施方案,应用服务器110执行在线购物模块112。在线购物模块112提供电子商务市场118,其包括用于允许顾客128浏览、搜索且购买可从操作商户系统108的在线商户和从其它卖方获得的产品的功能。例如,在线购物模块112可从产品目录122检索由在线商户或另一卖方提供用于出售的特定产品的产品列表,生成含有产品信息的网页,以及通过网络106将所述网页传输到在客户端设备104B上执行的客户端应用120以显示给顾客128。
在线购物模块112可利用预存储的或动态创建的资源来生成电子商务市场118。例如,可存储或动态生成网页、图像、文本文件、用于生成网页的程序代码、元数据、脚本、可执行代码和利用来创建和/或提供网页的其它类型的数据。其它类型的资源也可通过在线购物模块112存储或动态生成以提供电子商务市场118。在线购物模块112还可维护顾客档案数据存储,其包括关于商户系统108的顾客的信息,诸如其姓名、地址和其它联系信息、付款信息、偏好和其它数据。
根据实施方案,在线购物模块112还提供用于允许第三方卖方(诸如卖方102)在电子商务市场118上出售产品的功能。虽然在图1中仅图示了单个卖方102,但是应理解,可允许许多这样的卖方通过电子商务市场118的方式出售产品。
在一个实施方案中,为了促进卖方列出在电子商务市场118上出售的产品,应用服务器110执行列表处理模块130。列表处理模块130从卖方102接收卖方订阅(seller feed)116,其含有描述卖方102希望通过电子商务市场118可供出售的产品的产品信息。
卖方订阅116可以是含有表格数据的平面文件、可扩展标记语言(“XML”)文件或可囊括产品信息的任何其它数据容器。卖方订阅116可含有多个产品列表的数据,每个产品列表含有识别产品且描述产品的各种属性的许多字段。列表处理模块130可从客户端设备104A通过网络106接收卖方订阅116。
在一个实施方案中,卖方订阅116由在客户端设备104A上执行的存货加载器应用124而产生。存货加载器应用124可被配置来与由卖方102操作的存货管理系统(未示出)集成。应理解,可提供其它机制来使卖方102能够列出用于在电子商务市场118上出售的产品。例如,在线购物模块112可提供基于网络的界面,卖方102可通过所述界面,通过指定卖方102提供用于出售的产品的产品信息来创建产品列表。还可以利用其它机制。
基于在卖方订阅116中接收的产品信息,列表处理模块130在产品目录122中创建产品列表。如在图1中所示,每个产品列表可包括许多属性126,其用于存储对于相应产品指定的产品信息。在图1示出的实例中,例如,已在产品目录122中创建产品列表,其包括用于存储产品标识符的属性126A,用于存储产品名称的属性126B,用于存储产品描述的属性126C,用于存储产品价格的属性126D和用于存储产品的可供数量的属性126E。应理解,图1中示出的属性126仅为示意性的,且可在产品列表中指定更多属性。还应理解,每个产品列表的属性126可以不同。例如,每个产品目录中的产品可具有不同属性126。
如上文简要提及,商户系统108还可被配置来允许卖方102提供多种人类可读语言的产品信息。例如,卖方102可提供英文的产品描述,并对相同产品提供西班牙语的产品描述。商户系统108可将这个信息存储在产品目录122中,并利用这个信息来提供以适于特定区域设置的语言的电子商务市场118的本地化版。例如,西班牙语产品信息可利用来向位于西班牙和/或其它讲西班牙语的国家的顾客提供电子商务市场118的西班牙语版。应理解,还可从其它来源(诸如从产品的制造商)获取多种语言的产品信息。下文将关于图2提供关于多种语言的电子商务市场的供应的额外细节。
在一个实施方案中,商户系统108还被配置来将使用不同于电子商务市场118的主要语言的人类可读语言(本文中称为“外语”)表达的搜索查询翻译成电子商务市场118的主要语言。例如,电子商务市场118的主要语言可以是英语。当接收的搜索查询是非英语的语言(例如,西班牙语)时,这些搜索查询可从西班牙语翻译成英语,且随后以标准方式执行。
在各种实施方案中,可使用从存储在产品目录122中的产品信息创建的词典来翻译外语搜索查询。为了执行这个功能,商户系统108被配置有语言翻译系统114,其包括用于创建翻译词典、翻译搜索查询、翻译资源(诸如在线购物模块112提供的网站资源)并且用于验证对资源的翻译的组件。下文将关于图3-10提供有关语言翻译系统114的配置和操作的细节。
图2是示出本文公开的各种实施方案的一个操作环境的额外方面的系统图。具体而言,图2示出可以如何在地理上分布商户系统108的各种实例以将电子商务市场118提供给世界各地的顾客。例如,商户系统108A可位于美国,以向位于美国的顾客提供电子商户市场的英文版。类似地,商户系统108B可以位于欧洲以服务位于所述地区的顾客。同样地,商户系统108C、108D和108E可分别位于中国、日本和澳大利亚以服务位于那些区域的顾客。各种商户系统108A-108E可通过适当的WAN连接来连接。
如上文简要提及,电子商务市场118上的卖方102可上传多种语言的产品信息到商户系统108A-108E中的一个。例如,位于欧洲的卖方102可用可能由在欧洲的顾客所利用的各种语言(诸如,英语、法语、德语和西班牙语)将产品的相同产品信息提供给商户系统108B。这个产品信息随后可由商户系统108B存储。这个信息还可通过上述WAN与其它商户系统108A和108C-108E共享。
卖方提供的多语言产品信息可被利用来提供各种语言版本的电子商务市场118。例如,以西班牙语提供的产品信息可利用来将西班牙语版的电子商务市场118提供给在西班牙和其它讲西班牙语的国家的顾客。以其它语言提供的产品信息可利用来提供适用于不同地理区域的语言版本的电子商务市场118。
如上文简要提及,电子商务市场118接收用外语表达的搜索查询并非罕见。例如,由商户系统108A提供并用英语呈现的美国电子商务市场118可接收用西班牙语或其它非英语表达的查询。外语搜索查询可利用来以标准方式搜索产品。因为外语搜索查询用不同于市场118的主要语言的语言表达,然而,使用此类搜索查询执行的搜索可能将不会返回有意义的搜索结果。这可能会让市场118的顾客感到困惑和/或沮丧。
商户系统108的语言翻译系统114提供用于将外语查询翻译成电子商户市场118使用的主要语言的功能。已翻译的搜索查询可随后利用来以其本土语言搜索市场118,从而可能比在没有翻译的情况下已经处理外语搜索查询时提供更好的搜索结果。下文将相对于图3-9提供有关由语言翻译系统114提供的功能的结构的细节。
图3是示出根据本文公开的一个实施方案的用于使用产品信息创建翻译词典304的一个机制的方面的软件架构图。具体而言,图3示出翻译词典创建模块302的操作的方面,翻译词典创建模块302形成本文公开的一个实施方案中的语言翻译系统114的一部分。翻译词典创建模块302可在应用服务器110或另一计算机系统上执行。
翻译词典创建模块302被配置来生成可利用来翻译人类可读语言的翻译词典304。翻译词典创建模块302使用存储在商户市场产品目录122中的产品信息来创建翻译词典304。在图3示出的实例中,翻译词典创建模块302使用对于某一产品特定的英语的产品信息306A和对于相同产品特定的西班牙语的产品信息306B来创建翻译词典304。当使用英语和西班牙语产品信息来创建翻译词典304时,翻译词典304可利用来将词语从西班牙语翻译成英语。当使用用其它语言表达的产品信息来创建翻译词典304时,翻译词典304可利用于在其它语言之间翻译词语。例如,产品信息306A和306B可利用来创建翻译词典304,以用于从英语翻译成西班牙语或另一语言。
翻译词典创建模块302可使用来自多个产品目录中的产品的产品信息来创建翻译词典304。以这种方式创建的翻译词典304可利用来翻译对于不同产品目录中的产品的搜索查询。在另一实施方案中,翻译词典创建模块302为每个产品目录创建单独的翻译词典304。在这个实施方案中,仅使用来自产品目录的产品信息来创建所述产品目录的翻译词典304。随后使用用目录中的产品的产品信息创建的翻译词典304来翻译对每个目录内的产品的搜索。
为了创建翻译词典304,翻译词典创建模块302对已用不同语言表达的产品信息306A和306B执行统计分析。具体而言,在一个实施方案中,翻译词典创建模块302迭代地应用期望最大化(“EM”)算法来确定产品信息306A中的词是产品信息306B中的词的翻译的概率。如本领域技术人员已知,EM算法可用于对统计机器翻译系统的双语翻译词典的无监督式学习。开源工具GIZA和GIZA++是在实施方案中利用来创建翻译词典304的EM算法的实施方式。在其它实施方案中,可利用其它工具和/或组件实施EM算法。还可以利用其它机制从双语产品信息306创建翻译词典304。
如图3中示出,在一个实施方案中的翻译词典304包括字段308A,其存储在产品信息306A(即图3示出的实例中的英文产品信息)中找到的词。对于产品信息306A中的每个词,翻译词典304还包括字段308B中来自外语产品信息(即在图3示出的实例中的西班牙语的产品信息)的一个或多个词。
对于字段308B中的每个词,翻译词典304还在字段308B中包括字段308B中的词是字段308A中的词的翻译的相应概率。例如,翻译词典304可在栏308A中包括英文词“shoe”。对于词“shoe”,字段308B可包括西班牙语词“zapato”和“herradura”。对于词“zapato”和“herradura”,字段308C可表明西班牙语词“zapato”是英文词“shoe”的翻译的概率是85%,以及西班牙语词“herradura”是英文词“shoe”的翻译的概率是15%。应理解,图3中示出的结构仅为示意性的,且在其它实施方案中可以不同方式存储上述数据。下文将关于图4-9提供有关在翻译词典304中存储的数据的使用的细节。
图4是示出根据本文公开的一个实施方案的本文呈现的用于使用产品信息翻译外语搜索查询的一个机制的方面的软件架构图。具体而言,图4图示了形成本文公开的一个实施方案中的语言翻译系统114的一部分的翻译模块406的操作的方面。在一个实施方案中,应用服务器110执行翻译模块406。在其它实施方式中,其它计算机系统可执行翻译模块406。
如图4中图示,在商户系统108内执行的查询处理器模块404可被配置来接收搜索查询402。搜索查询402是由希望搜索可通过电子商务市场118获得的产品的用户所提供的一个或多个搜索项。可用电子商务市场118的主要语言或外语来指定搜索查询402。
在一个实施方案中,查询处理器模块404利用语言检测器模块406来确定搜索查询402的语言。语言检测器模块406还可在应用服务器110上或另一计算系统上执行。如果已用电子商务市场118的主要语言来指定搜索查询402,那么查询处理器模块404将搜索查询402直接提供给搜索引擎410而无需修改。搜索引擎410随后使用搜索查询402执行对产品目录122的搜索,并且由此产生搜索结果412。随后搜索结果412可提供给提交搜索查询402的用户。
如果语言检测器模块406确定已用外语提供搜索查询402,那么查询处理器模块404可开始用于将搜索查询402从外语翻译成电子商务市场118的主要语言的过程。具体而言,在一个实施方案中,查询处理器模块404首先利用标记器(tokenizer)模块408来标记化搜索查询402。标记化指的是将文本流断成词语、短语、符号或称为标记的其它有意义元素的过程。一旦搜索查询402已被分成标记,那么将标记化搜索项404提供到翻译模块406。
如上文关于图3的描述,翻译模块406利用翻译词典304来翻译标记化的搜索项404。具体而言,对于标记化搜索项404中的每一个,翻译模块406可识别字段308B中具有在字段308C中指定的最高概率的词。以此方式,生成已翻译的搜索查询408,其包括对于标记化的搜索项404中的每一个的翻译。
一旦已生成已翻译的搜索查询408,翻译模块406将已翻译的搜索查询408提交给搜索引擎410。搜索引擎410随后使用已翻译的搜索查询408执行对产品目录122的搜索,并且由此产生搜索结果412。搜索结果412可随后提供给提交搜索查询402的用户。以此方式,可使用翻译词典304将提交到电子商务市场118的外语的搜索查询402翻译成市场118的主要语言。下文将关于图5提供有关这个过程的额外细节。
现转到图5,将提供有关本文描述的用于使用产品信息翻译外语搜索查询的实施方案的额外细节。应理解,本文关于图5和其它图描述的逻辑操作实施为(1)运行于计算系统上的一系列计算机实施的动作或程序模块,和/或(2)计算系统内互连的机器逻辑电路或电路模块。所述实施方式是取决于计算系统的性能和其它要求的选择。因而,本文关于各个图描述的逻辑操作被不同地称为操作、结构设备、动作或模块。这些操作、结构设备、动作和模块可以用软件、固件、专用数字逻辑、以及其任意组合来实施。还应理解,可执行比图中示出的和本文描述的操作更多或更少的操作。这些操作还可并行执行,或以不同于本文描述的那些操作的顺序来执行。
图5是示出根据本文公开的一个实施方案的用于翻译外语搜索查询的一个示意性例程500的流程图。例程500开始于操作502,其中查询处理器模块404接收搜索查询402。例程500随后进行到操作504,其中作出是否已用电子商务市场118所利用的主要语言表达搜索查询402的确定。如上所述,语言检测器模块406可被利用来确定搜索查询402的语言。
如果已用电子商务市场118所利用的主要语言来表达搜索查询402,那么例程500从操作504进行到操作506。在操作506,将搜索查询402提供到搜索引擎410而不需要修改。以此方式,不会改变以电子商务市场118的本土语言提供到查询处理器模块404的搜索查询。搜索引擎410随后在操作520处理搜索查询402,且在操作522返回由搜索查询402产生的搜索结果。
如果在操作504,语言检测器模块406确定搜索查询402不是电子商务市场118所利用的主要语言,那么例程500从操作504进行到操作508。在操作508,标记器模块408利用来以上述方式标记化搜索查询402。一旦标记器模块408已经产生标记化的搜索项404,例程500从操作508进行到操作510。
在操作510,变量被初始化以跟踪当前正被翻译的标记化搜索项。一旦变量已被初始化,例程500从操作510进行到操作512,其中翻译模块使用翻译词典304翻译当前标记。如上所述,翻译模块304可通过在字段308B中识别当前标记,且随后在字段308B中识别具有在字段308C中指定的最高概率的相应词来翻译当前标记。以此方式,选择当前标记的最有可能的翻译。
一旦已翻译当前标记,例程500进行到操作514,其中翻译模块406确定是否有任何额外的标记仍将被翻译。如果有额外的标记仍将被翻译,那么例程500从操作514进行到操作516,其中增加利用来跟踪当前标记的变量来识别下一个标记化搜索项404。随后以上述方式翻译下一标记。重复这个过程,直到已翻译所有的标记化搜索项404。
一旦已翻译所有的标记化搜索项404,例程500从操作514进行到操作518。在操作518,翻译模块406将已翻译的搜索查询408提交到搜索引擎410。搜索引擎410随后在操作520处理已翻译的搜索查询408,并且在操作522返回由已翻译的搜索查询408产生的搜索结果。例程500从操作522进行到操作524,例程500结束于此。
图6是示出根据本文公开的一个实施方案的本文呈现的用于翻译资源(诸如网站资源)的一个机制的方面的软件架构图。如上文简述,翻译词典304还可利用于翻译其它信息。例如,翻译词典304可利用于翻译电子商务市场118提供或利用的资源。如本文利用的术语“资源”旨在涵盖用人类可读语言表达的任何文本信息。例如,可利用以上述方式创建的翻译词典304来翻译被提供作为由商户系统108提供的网站的一部分的文本信息(“网站资源”)。网站资源可在接收对商户系统108的资源的请求之前翻译,或可在接收对资源的请求时翻译。
同样如上所述,电子商务市场118可被配置来在执行搜索查询之后显示一个或多个“精炼”。精炼是允许用户精炼搜索查询的范围的用户界面控制。例如,用户可在电子商务市场118上搜索术语“鞋子”。响应于这种搜索,电子商务市场118可导致各种搜索结果被显示。电子商务市场118还可显示一个或多个精炼,用于精炼搜索查询的范围。例如,市场118可示出各种大小、宽度、风格或品牌的鞋子。如果用户选择精炼中的一个,那么搜索结果将被缩小到仅显示满足精炼查询的那些产品。
在一个实施方案中,翻译词典304可利用来将精炼从电子商务市场118的主要语言翻译成外语。例如,如果电子商务市场118的主要语言为英语,那么翻译词典304可利用来将电子商务市场118提供的精炼翻译成西班牙语或另一外语。例如,这可响应于接收以外语的搜索查询而执行。还可以相似方式翻译电子商务市场118提供的其它类型的网站资源。图6和图7更详细地图示了这个过程的额外方面。
如图6中示出,在一个实施方案中,应用服务器110执行用于将电子商务市场118提供给客户端设备(诸如客户端设备104B)的网络服务器模块602。如本领域中已知,网络服务器模块602是被配置来接收并响应对于网页和其它资源的请求的软件应用。资源可存储在网站资源数据库608中或动态地产生。
网络服务器模块602被配置来接收对于包括一个或多个资源(诸如上述精炼)的电子商务市场118的网页的网页请求604。响应于这种请求,网络服务器模块602或另一模块可确定所请求的资源是否需要翻译。例如,如果在接收外语搜索查询之后请求资源,那么网络服务器模块602可断定所请求的一个资源或多个资源应被翻译成外语的搜索查询。
如果资源将要翻译,那么网络服务器模块602将对于翻译的请求610传输到翻译模块406。请求610可包括待翻译的资源,表明资源为何种语言的数据,和识别应将资源翻译成何种语言的数据。响应于接收请求610,翻译模块406使用标记器模块408对资源进行标记化,并使用翻译词典304以上述方式翻译资源。
一旦翻译模块406已翻译资源,翻译模块406响应于请求610而将翻译资源612提供到网络服务器模块602。网络服务器模块602可随后生成对包括已翻译资源的网页请求604的响应614。以此方式,可响应于对资源的请求而动态地翻译资源。然而应理解,在其它实施方案中,可以上述方式翻译资源,并在接收对资源的请求之前存储资源。下文将关于图7提供图6中示出的用于翻译资源的过程的额外细节。
图7是示出根据本文公开的一个实施方案的用于翻译资源(诸如网站资源)的一个示意性例程700的流程图。例程700开始于操作702,其中网络服务器模块602接收对网站资源的请求,诸如网页请求604。例程700随后进行到操作704,其中作出所请求的资源是否需要翻译的确定。如上所述,可基于之前是否已接收外语搜索或其它因素来作出这个确定。
如果所请求的资源不需要翻译,那么例程700从操作704进行到操作706。在操作706,网络服务器模块602检索或生成请求的资源,并响应于所述请求而提供资源。例程700随后进行到操作720,例程700结束于此。
如果在操作704确定所请求的资源应被翻译,那么例程700从操作704进行到操作708。在操作708,标记器模块408可利用来对将以上述方式翻译的网站资源标记化。一旦标记器模块408已对网站资源标记化,例程700从操作708进行到操作710。
在操作710,变量被初始化以跟踪当前正被翻译的标记化资源。一旦变量已被初始化,例程700从操作710进行到操作712,其中翻译模块406使用翻译词典304来翻译当前标记化资源。如上所述,翻译模块304可通过在字段308B中识别当前标记且随后在字段308B中识别具有在字段308C中指定的最高概率的相应词来翻译当前标记。以此方式,选择当前标记的最有可能的翻译。
一旦已翻译当前标记,例程700进行到操作714,其中翻译模块406确定是否有任何额外标记仍将被翻译。如果有额外标记仍将被翻译,那么例程700从操作714进行到操作716,其中增加利用于跟踪当前标记的变量以识别待翻译的下一个标记化资源。随后以上述方式翻译下一标记。重复这个过程,直到已翻译所有的标记化资源。
一旦已翻译所有请求的资源,例程700从操作714进行到操作718。在操作718,网络服务器模块602响应于原始请求而返回已翻译资源。例如,网络服务器模块602可提供对包括已翻译资源的网页请求604的响应614。例程700从操作718进行到操作720,例程700结束于此。
图8是示出根据本文公开的一个实施方案的用于验证对资源(诸如网站资源)的翻译的一个示意性机制的软件架构图。如上文简述,在一个实施方案中,翻译词典304可利用来验证资源(诸如上述精炼)的翻译。图8图示了被配置来验证对资源的翻译的翻译验证模块802的操作的方面。在一个实施方案中,翻译验证模块802形成语言翻译系统114的一部分。
在一个实施方案中,翻译验证模块802在应用服务器110上执行,但在其它实施方式中可在其它计算系统上执行。翻译验证模块802被配置来通过首先当资源先前尚未被翻译时使资源被翻译来验证对资源(诸如上述网站资源)的翻译。为了翻译资源,翻译验证模块802可将对资源的翻译的请求610传输到翻译模块406。翻译模块406可随后利用标记器模块408和翻译词典304以用上述方式翻译资源。翻译模块406随后响应于请求610而将已翻译资源612提供给翻译验证模块802。
一旦翻译验证模块802已具有翻译的资源612,翻译验证模块802利用已翻译资源612在电子商务市场执行产品搜索。具体而言,翻译验证模块802可将搜索查询402提交到包括翻译的资源612的搜索引擎410。搜索引擎410随后使用已翻译资源612来执行对产品目录122的搜索,并且将搜索结果412返回到翻译验证模块802。
翻译验证模块802随后确定由已翻译资源612产生的搜索结果412的数量。翻译验证模块802可随后基于返回的搜索结果412的数量来批准或拒绝已翻译的资源612。例如,产生超过阈值数量的搜索结果412的已翻译资源612在作为搜索查询402使用时可被批准,而产生少于阈值数量的搜索结果412的已翻译资源612可被拒绝。以这种方式,翻译验证模块802可拒绝产生较少或没有搜索结果的翻译。下文将关于图9提供有关这个过程的额外细节。
图9是示出根据本文公开的一个实施方案的用于验证资源(诸如网站资源)的翻译的一个示意性例程900的流程图。例程900开始于操作902,其中以上述方式翻译待验证的网站资源。一旦已经翻译了待验证的资源,例程900进行到操作902,其中以包括已翻译资源612的搜索查询402的形式将已翻译资源612提交到搜索引擎410。搜索引擎410随后使用已翻译资源612执行对产品目录122的搜索,并将搜索结果412返回到翻译验证模块802。
例程900从操作904进行到操作906,其中翻译验证模块802确定由搜索查询402产生的搜索结果412的数量。例程900随后进行到操作908,其中翻译验证模块802确定搜索结果412的数量是否超过某一阈值。所述阈值可由电子商务市场的拥有者或操作者设定。
如果搜索结果412的数量超过阈值,那么例程900从操作908进行到操作910,其中翻译资源912被批准。如果搜索结果412的数量不超过阈值,那么例程900从操作908进行到操作912,其中已翻译资源612被拒绝且响应于对翻译的请求而可能不被提供。例程900从操作910和操作912进行到操作914,例程900结束于此。
图10示出能够执行本文描述的用于外语翻译的软件组件的计算机1000的示例性计算机架构。在图10中示出的计算机架构1000图示了常规的服务器计算机、工作站、台式计算机、膝上型计算机、PDA、电子书阅读器、数字无线电话、平板计算机、网络设备、机顶盒或其它计算设备,并可利用来执行在本文中呈现的被描述成在商户系统108、客户端设备104A-104B或在其它计算平台上执行的软件组件的任何方面。
计算机1000包括基板或“主板”,其为大量组件或设备可通过系统总线或其它电通信路径连接到的印刷电路板。在一个示意性实施方案中,一个或多个中央处理单元(“CPU”)1002与芯片组1004一起操作。CPU 1002为标准的可编程处理器,其执行计算机1000的操作所需的算术和逻辑操作。
CPU 1002通过从一个离散的物理状态转变到下一状态来执行操作,所述转变通过操纵区分并改变这些状态的开关元件。开关元件可通常包括维持两个二元状态中的一个的电子电路,诸如正反器,和基于一个或多个其它切换元件的状态的逻辑组合提供输出状态的电子电路,诸如逻辑门。这些基本的切换元件可组合来创建更复杂的逻辑电路,包括寄存器、加减器、算术逻辑单元、浮点单元或类似物。
芯片组1004在CPU 1002与基板上剩余的组件和设备之间提供接口。芯片组1004可提供到用作计算机1000中的主存储器的随机存取存储器(“RAM”)1006的接口。芯片组1004可进一步提供到计算机可读存储介质的接口,所述计算机可读存储介质诸如用于存储帮助启动计算机1000并在各种组件与设备之间传递信息的基本例程的只读存储器(“ROM”)1008或非易失性RAM(“NVRAM”)。根据本文描述的实施方案,ROM 1008或NVRAM还可存储计算机1000的操作所需的其它软件组件。
根据各种实施方案,计算机1000可操作于联网环境中,所述联网环境通过网络使用到远程计算设备和计算机系统的逻辑连接,所述网络诸如局域网(“LAN”)、广域网(“WAN”)、互联网或本领域已知的将计算机1000连接到远程计算机的任何其它网络拓扑。芯片组1004包括用于通过网络接口控制器(“NIC”)1010,诸如千兆位(gigabit)以太网适配器来提供网络连接的功能。
例如,NIC 1010可能能够通过上文关于图1描述的网络106将计算机1000连接到其它计算设备,诸如商户系统108中的应用服务器110、客户端设备104A-104B、数据存储系统和类似物。应理解,多个NIC 1010可存在于计算机1000中,其将计算机连接到其它类型的网络和远程计算机系统。
可将计算机1000连接到为计算机提供非易失性存储的大容量存储设备1012。大容量存储设备1012可存储已在本文中更详细描述的系统程序、应用程序、其它程序模块和数据。可通过连接到芯片组1004的存储控制器1014将大容量存储设备1012连接到计算机1000。大容量存储设备1012可由一个或多个物理存储单元组成。存储控制器1014可通过串行连接的SCSI(“SAS”)接口、串行高级技术附件(“SATA”)接口、光纤信道(“FC”)接口或用于物理连接且在计算机与物理存储设备之间传递数据的其它标准接口而与物理存储单元接口连接。
计算机1000可通过转换物理存储单元的物理状态以反映被存储的信息而将数据存储在大容量存储设备1012上。在本描述的不同实施方式中,物理状态的特定转换可取决于各种因素。这种因素的实例可包括但不限于用来实施物理存储单元的技术,大容量存储设备1012是否被表征为主存储或辅助存储或类似物。
例如,计算机1000可通过存储控制器1014发出指令以更改磁盘驱动单元内的特定位置的磁性特性,光学存储单元中的特定位置的反射或折射特性,或特定电容器、晶体管或固态存储单元中的其它分立组件的电特性而将信息存储到大容量存储设备1012。在不脱离本描述的范围和精神的情况下,物理介质的其它转换是可能的,其中提供前述实例仅为了便于进行本描述。计算机1000可进一步通过检测物理存储单元内的一个或多个特定位置的物理状态或特性而从大容量存储设备1012读取信息。
除了上述大容量存储设备1012外,计算机1000可访问其它计算机可读介质以存储和检索信息,诸如程序模块、数据结构或其它数据。本领域技术人员应理解,计算机可读介质可以是可由计算机1000访问的任何可用介质,包括计算机可读存储介质和通信介质。通信介质包括暂时信号。计算机可读存储介质包括以任何方法或技术实施的易失性和非易失性、可装卸和非可装卸存储介质。例如,计算机可读存储介质包括但不限于RAM、ROM、可擦除可编程ROM(“EPROM”)、电可擦除可编程ROM(“EEPROM”)、快闪存储器或其它固态存储器技术、紧凑磁盘ROM(“CD-ROM”)、数字通用光盘(“DVD”)、高清DVD(“HD-DVD”)、蓝光光碟(BLU-RAY)或其它光学存储装置、磁带盒、磁带、磁盘存储装置或其它磁性存储设备、或可用于存储所需信息的任何其它介质。计算机可读存储介质不包括暂时信号。
大容量存储设备1012可存储操作系统1016,其利用来控制计算机1000的操作。根据一个实施方案,操作系统包括LINUX操作系统。根据另一实施方案,操作系统包括来自华盛顿的雷德蒙德的微软公司的SERVER操作系统。根据进一步的实施方案,操作系统可包括UNIX或SOLARIS操作系统。应理解,还可利用其它操作系统。大容量存储设备1012可存储由计算机1000利用的其它系统或应用程序和数据。例如,当利用大容量存储设备来实施客户端设备104B时,其可存储客户端应用120。当利用大容量存储设备来实施一个或多个应用服务器110时,其可存储在线购物模块112、列表处理模块130和/或如上所述的语言翻译系统114的各种组件。
在一个实施方案中,大容量存储设备1012或其它计算机可读存储介质可编码有计算机可执行指令,所述计算机可执行指令在载入计算机1000时将计算机从通用计算系统转换成能够实施本文描述的实施方案的专用计算机。这些计算机可执行指令通过指定CPU 1002如何在状态间转变来转换计算机1000,如上所述。根据一个实施方案,计算机1000可访问存储计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被计算机执行时执行本文描述的各种例程和操作。
计算机1000还可以包括输入/输出控制器1018,其用于从许多输入设备,诸如键盘、鼠标、触摸板、触摸屏、电子笔或其它类型的输入设备接收并处理输入。类似地,输入/输出控制器1018可向显示设备,诸如计算机监视器、平板显示器、数字投影仪、打印机、绘图仪或其它类型的输出设备提供输出。将理解,计算机1000可能不包括图10所示的所有组件,但可包括没有在图10中明确示出的其它组件,或可利用与图10所示的架构完全不同的架构。
基于前文,应理解,本文已呈现用于使用产品信息的外语翻译的技术。虽然本文中呈现的主题已经以特定于计算机结构特征、方法行为和计算机可读介质的语言描述,但是应理解,在所附权利要求中定义的发明不一定限于本文描述的具体特征、行为或介质。相反,所述具体特性、行为和介质被公开为实施权利要求的实例形式。
上述主题仅通过说明的方式提供且不应被理解为限制性的。此外,所要求的主题不限于解决本公开的任何部分中提到的任何或全部缺点的实施方式。在不遵循所示和描述的实例实施方案和应用,且不脱离以下权利要求中所阐述的本发明的真实精神和范围的情况下,可对本文描述的主题作出各种修改和改变。
条款
本公开的实施方案可鉴于下述条款来描述:
条款1.一种用于翻译搜索查询的计算机实施的方法,所述计算机实施的方法包括在计算机系统中执行指令以执行以下操作:
存储以至少第一语言和以不同于所述第一语言的第二语言表达的产品信息;
执行所述第一语言和所述第二语言的所述产品信息的统计分析,以创建用于将以所述第二语言表达的术语翻译成所述第一语言的词典;
接收包括以所述第二语言表达的一个或多个搜索项的搜索查询;
使用所述词典将以所述第二语言表达的所述一个或多个搜索项翻译成所述第一语言;以及
导致对一个或多个搜索项执行产品搜索,其中使用所述翻译的搜索项以所述第一语言执行所述产品搜索。
条款2.根据条款1所述的计算机实施的方法,其中从在线电子商务市场的一个或多个第三方商户接收以所述第一语言和所述第二语言表达的所述产品信息。
条款3.根据条款1或2中任一项所述的计算机实施的方法,其中所述第一语言是利用来提供在线电子商务市场的主要语言。
条款4.根据条款1到3中任一项所述的计算机实施的方法,其进一步包括:
接收对于网站资源的请求;
使用所述词典将所述网站资源从所述第一语言翻译成所述第二语言;以及
响应于所述请求提供所述翻译的网站资源。
条款5.根据条款1到4中任一项所述的计算机实施的方法,其中所述产品信息是针对单一产品目录中的一个或多个产品,且其中所述搜索查询包括对所述产品目录中的产品的搜索。
条款6.一种具有存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被计算执行时导致所述计算机:
接收对于一个或多个资源的请求;以及
响应于接收所述请求,使用通过对以第一人类可读语言和第二人类可读语言存储的产品信息执行统计分析而生成的翻译词典来将所述请求的资源从所述第一人类可读语言翻译成所述第二人类可读语言,并且响应于所述请求而提供所述翻译资源。
条款7.根据条款6所述的计算机可读存储介质,其中所述资源包括网站资源。
条款8.根据条款6或7中任一项所述的计算机可读存储介质,其中所述翻译词典包括来自以所述第一人类可读语言的所述产品信息的一个或多个词,并且对于所述第一人类可读语言的每个词,来自以所述第二人类可读语言的所述产品信息的一个或多个词,和所述第二人类可读语言中的所述词为所述第一人类可读语言中的所述词的翻译的相应概率。
条款9.根据条款6到8中任一项所述的计算机可读存储介质,其中在线电子商务市场提供网站资源,且其中所述第一人类可读语言是所述在线电子商务市场所利用的主要语言。
条款10.根据条款6到9中任一项所述的计算机可读存储介质,其具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在被所述计算机执行时导致所述计算机:
接收包括以所述第二人类可读语言表达的一个或多个搜索项的搜索查询;
使用所述翻译词典将以所述第二人类可读语言表达的所述一个或多个搜索项翻译成所述第一人类可读语言;以及
导致产品搜索使用所述翻译的搜索项来以所述第一语言执行。
条款11.根据条款6到10中任一项所述的计算机可读存储介质,其具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在被所述计算机执行时导致所述计算机:
通过使用所述翻译的资源在在线电子商务市场执行产品搜索,确定所述产品搜索产生的搜索结果的数量以及批准对产生超过阈值数量的搜索结果的资源的翻译,来验证所述请求的资源从所述第一人类可读语言到所述第二人类可读语言的翻译。
条款12.一种用于翻译搜索查询的装置,所述装置包括:
至少一个处理器;和
计算机可读存储介质,其具有存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置通过对以第一人类可读语言和第二人类可读语言表达的产品信息执行统计分析来生成翻译词典,所述翻译词典用于将搜索查询从所述第二人类可读语言翻译成所述第一人类可读语言。
条款13.根据条款12所述的装置,其中所述翻译词典包括来自以所述第一人类可读语言的所述产品信息的一个或多个词,并且对于所述第一人类可读语言的每个词,来自以所述第二人类可读语言的所述产品信息的一个或多个对应词,和所述第二人类可读语言中的每个词的所述词为所述第一人类可读语言中的所述对应词的翻译的概率。
条款14.根据条款13所述的装置,其中使用所述翻译词典将搜索查询从所述第二人类可读语言翻译成所述第一人类可读语言包括:
将所述搜索查询标记化成所述第二人类可读语言的一个或多个词;以及
对于所述第二人类可读语言的每个词,在所述第一人类可读语言的所述翻译词典中识别翻译的词。
条款15.根据条款12到14中任一项所述的装置,其中所述计算机可读存储介质具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置使用所述已翻译的搜索查询来执行产品搜索。
条款16.根据条款12到15中任一项所述的装置,其中所述产品信息对应于单个产品目录中的一个或多个产品,且其中所述搜索查询是针对所述产品目录中的产品。
条款17.根据条款12到16中任一项所述的装置,其中所述计算机可读存储介质具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置:
接收对于所述一个或多个资源的请求;
使用所述翻译词典将所述请求的资源从所述第一人类可读语言翻译成所述第二人类可读语言;以及
响应于所述请求提供所述翻译的资源。
条款18.根据条款17所述的装置,其中所述资源包括网站资源。
条款19.根据条款18所述的装置,其中在线电子商务市场提供所述网站资源,且其中所述第一人类可读语言是所述在线电子商务市场所利用的主要语言。
条款20.根据条款19所述的装置,其中所述计算机可读存储介质具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置:
通过使用所述翻译的资源在所述在线电子商务市场执行产品搜索,确定由所述产品搜索产生的搜索结果的数量以及批准对产生超过阈值数量的搜索结果的资源的翻译,来验证所述请求的资源从所述第一人类可读语言到所述第二人类可读语言的翻译。
Claims (15)
1.一种用于翻译搜索查询的计算机实施的方法,所述计算机实施的方法包括在计算机系统中执行指令以执行以下操作:
存储以至少第一语言和以不同于所述第一语言的第二语言表达的产品信息;
执行所述第一语言和所述第二语言的所述产品信息的统计分析,以创建用于将以所述第二语言表达的术语翻译成所述第一语言的词典;
接收包括以所述第二语言表达的一个或多个搜索项的搜索查询;
使用所述词典将以所述第二语言表达的所述一个或多个搜索项翻译成所述第一语言;以及
导致对一个或多个搜索项执行产品搜索,其中使用所述经翻译的搜索项以所述第一语言执行所述产品搜索。
2.根据权利要求1所述的计算机实施的方法,其中从在线电子商务市场的一个或多个第三方商户接收以所述第一语言和所述第二语言表达的所述产品信息,且其中所述第一语言是被利用来提供所述在线电子商务市场的主要语言。
3.根据权利要求2所述的计算机实施的方法,其进一步包括:
接收对于网站资源的请求;
使用所述词典将所述网站资源从所述第一语言翻译成所述第二语言;以及
响应于所述请求而提供所述经翻译的网站资源。
4.一种具有存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被计算执行时导致所述计算机:
接收对于一个或多个资源的请求;以及
响应于接收所述请求,使用通过对以第一人类可读语言和第二人类可读语言存储的产品信息执行统计分析而生成的翻译词典来将所述被请求的资源从所述第一人类可读语言翻译成所述第二人类可读语言,并且响应于所述请求而提供所述经翻译的资源。
5.根据权利要求4所述的计算机可读存储介质,其中所述资源包括网站资源,其中在线电子商务市场提供所述网站资源,且其中所述第一人类可读语言是所述在线电子商务市场所利用的主要语言。
6.根据权利要求4所述的计算机可读存储介质,其中所述翻译词典包括来自所述产品信息的所述第一人类可读语言的一个或多个词,并且对于所述第一人类可读语言的每个词,包括来自所述产品信息的所述第二人类可读语言的的一个或多个词,和所述第二人类可读语言的所述词为所述第一人类可读语言的所述词的翻译的相应概率。
7.根据权利要求4所述的计算机可读存储介质,其具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在被所述计算机执行时导致所述计算机:
接收包括以所述第二人类可读语言表达的一个或多个搜索项的搜索查询;
使用所述翻译词典将以所述第二人类可读语言表达的所述一个或多个搜索项翻译成所述第一人类可读语言;以及
导致使用所述经翻译的搜索项来以所述第一语言执行产品搜索。
8.根据权利要求4所述的计算机可读存储介质,其具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在被所述计算机执行时导致所述计算机:
通过使用所述经翻译的资源在在线电子商务市场执行产品搜索,确定所述产品搜索产生的搜索结果的数量以及批准对产生超过阈值数量的搜索结果的资源的翻译,来验证所述被请求的资源从所述第一人类可读语言到所述第二人类可读语言的翻译。
9.一种用于翻译搜索查询的装置,所述装置包括:
至少一个处理器;和
计算机可读存储介质,其具有存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置通过对以第一人类可读语言和第二人类可读语言表达的产品信息执行统计分析来生成翻译词典,所述翻译词典用于将搜索查询从所述第二人类可读语言翻译成所述第一人类可读语言。
10.根据权利要求9所述的装置,其中所述翻译词典包括来自所述产品信息的所述第一人类可读语言的一个或多个词,并且对于所述第一人类可读语言的每个词,包括来自所述产品信息的所述第二人类可读语言的一个或多个对应词,和对于所述第二人类可读语言的每个词的所述词为所述第一人类可读语言的对应词的翻译的概率。
11.根据权利要求10所述的装置,其中使用所述翻译词典将搜索查询从所述第二人类可读语言翻译成所述第一人类可读语言包括:
将所述搜索查询标记化成所述第二人类可读语言的一个或多个词;以及
对于所述第二人类可读语言的每个词,在所述翻译词典中识别出所述第一人类可读语言的经翻译的词。
12.根据权利要求9所述的装置,其中所述计算机可读存储介质具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置使用所述经翻译的搜索查询来执行产品搜索,其中所述产品信息对应于单个产品目录中的一个或多个产品,且其中所述搜索查询是针对所述产品目录中的产品的。
13.根据权利要求9所述的装置,其中所述计算机可读存储介质具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置:
接收对于一个或多个资源的请求;
使用所述翻译词典将所述被请求的资源从所述第一人类可读语言翻译成所述第二人类可读语言;以及
响应于所述请求提供所述经翻译的资源。
14.根据权利要求13所述的装置,其中所述资源包括网站资源,其中在线电子商务市场提供所述网站资源,且其中所述第一人类可读语言是所述在线电子商务市场所利用的主要语言。
15.根据权利要求14所述的装置,其中所述计算机可读存储介质具有进一步的存储于其上的计算机可执行指令,所述计算机可执行指令在所述至少一个处理器上执行时导致所述装置:
通过使用所述经翻译的资源在所述在线电子商务市场执行产品搜索,确定由所述产品搜索产生的搜索结果的数量以及批准对产生超过阈值数量的搜索结果的资源的翻译,来验证所述被请求的资源从所述第一人类可读语言到所述第二人类可读语言的翻译。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/413,041 | 2012-03-06 | ||
US13/413,041 US9684653B1 (en) | 2012-03-06 | 2012-03-06 | Foreign language translation using product information |
PCT/US2013/029152 WO2013134284A1 (en) | 2012-03-06 | 2013-03-05 | Foreign language translation using product information |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104145270A true CN104145270A (zh) | 2014-11-12 |
CN104145270B CN104145270B (zh) | 2018-03-16 |
Family
ID=49117263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380012055.8A Active CN104145270B (zh) | 2012-03-06 | 2013-03-05 | 使用产品信息的外语翻译 |
Country Status (7)
Country | Link |
---|---|
US (2) | US9684653B1 (zh) |
EP (1) | EP2823415A4 (zh) |
JP (1) | JP5948445B2 (zh) |
CN (1) | CN104145270B (zh) |
CA (1) | CA2866261C (zh) |
IN (1) | IN2014DN06742A (zh) |
WO (1) | WO2013134284A1 (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11222362B2 (en) * | 2013-01-15 | 2022-01-11 | Motionpoint Corporation | Dynamic determination of localization source for web site content |
US9424597B2 (en) | 2013-11-13 | 2016-08-23 | Ebay Inc. | Text translation using contextual information related to text objects in translated language |
US20150235294A1 (en) * | 2014-02-20 | 2015-08-20 | Mogan Global Online Shopping Inc. | Network searching system and searching method thereof |
US20170075998A1 (en) * | 2015-09-14 | 2017-03-16 | Ebay Inc. | Assessing translation quality |
US20170177712A1 (en) * | 2015-12-21 | 2017-06-22 | Ebay Inc. | Single step cross-linguistic search using semantic meaning vectors |
US20170221118A1 (en) * | 2016-01-30 | 2017-08-03 | Wal-Mart Stores, Inc. | Systems and methods for understanding search queries |
US10599701B2 (en) | 2016-02-11 | 2020-03-24 | Ebay Inc. | Semantic category classification |
KR102357322B1 (ko) * | 2016-05-06 | 2022-02-08 | 이베이 인크. | 인공신경망 기계 번역시 메타 정보를 이용하는 기법 |
US10229220B2 (en) * | 2016-05-09 | 2019-03-12 | Coupa Software Incorporated | Automatic entry of suggested translated terms in an online application program |
US10635727B2 (en) | 2016-08-16 | 2020-04-28 | Ebay Inc. | Semantic forward search indexing of publication corpus |
US10223356B1 (en) | 2016-09-28 | 2019-03-05 | Amazon Technologies, Inc. | Abstraction of syntax in localization through pre-rendering |
US10261995B1 (en) * | 2016-09-28 | 2019-04-16 | Amazon Technologies, Inc. | Semantic and natural language processing for content categorization and routing |
US10229113B1 (en) | 2016-09-28 | 2019-03-12 | Amazon Technologies, Inc. | Leveraging content dimensions during the translation of human-readable languages |
US10275459B1 (en) | 2016-09-28 | 2019-04-30 | Amazon Technologies, Inc. | Source language content scoring for localizability |
US10235362B1 (en) | 2016-09-28 | 2019-03-19 | Amazon Technologies, Inc. | Continuous translation refinement with automated delivery of re-translated content |
JP7127965B2 (ja) * | 2017-02-27 | 2022-08-30 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム |
US10795799B2 (en) | 2017-04-18 | 2020-10-06 | Salesforce.Com, Inc. | Website debugger for natural language translation and localization |
US10489513B2 (en) | 2017-04-19 | 2019-11-26 | Salesforce.Com, Inc. | Web application localization |
US10437935B2 (en) * | 2017-04-18 | 2019-10-08 | Salesforce.Com, Inc. | Natural language translation and localization |
JP7034478B2 (ja) * | 2018-03-13 | 2022-03-14 | 株式会社イシダ | 検索システム、検索装置、及び検索プログラム |
US11698921B2 (en) | 2018-09-17 | 2023-07-11 | Ebay Inc. | Search system for providing search results using query understanding and semantic binary signatures |
EA202190407A1 (ru) | 2018-09-17 | 2021-09-24 | ЮНИЛЕВЕР АйПи ХОЛДИНГС Б.В. | Укупорочное средство с откидной верхней частью и ёмкость |
US20210295410A1 (en) * | 2020-03-23 | 2021-09-23 | Oath Inc. | Computerized system and method for applying transfer learning for generating a multi-variable based unified recommendation |
WO2022133799A1 (en) * | 2020-12-23 | 2022-06-30 | Citrix Systems, Inc. | Cross-language search |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007133625A2 (en) * | 2006-05-12 | 2007-11-22 | Eij Group Llc | Multi-lingual information retrieval |
CN101714144A (zh) * | 2008-10-07 | 2010-05-26 | 英业达股份有限公司 | 关联字词查询系统及其方法 |
US8140410B2 (en) * | 2004-09-27 | 2012-03-20 | International Business Machines Corporation | Method, system, and program for translating and interfacing between data pools and product information management (PIM) systems |
CN102770859A (zh) * | 2009-11-20 | 2012-11-07 | 谷歌公司 | 跨语言搜索选项 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7225199B1 (en) * | 2000-06-26 | 2007-05-29 | Silver Creek Systems, Inc. | Normalizing and classifying locale-specific information |
WO2002027534A2 (en) | 2000-09-29 | 2002-04-04 | Victor Hsieh | Online intelligent information comparison agent of multilingual electronic data sources over inter-connected computer networks |
US6952691B2 (en) | 2002-02-01 | 2005-10-04 | International Business Machines Corporation | Method and system for searching a multi-lingual database |
NZ592209A (en) * | 2005-01-04 | 2012-12-21 | Thomson Reuters Glo Resources | Method for for multilingual information retrieval |
US8997791B2 (en) | 2006-04-14 | 2015-04-07 | Mks Instruments, Inc. | Multiple-channel flow ratio controller |
US7949514B2 (en) | 2007-04-20 | 2011-05-24 | Xerox Corporation | Method for building parallel corpora |
US7774193B2 (en) * | 2006-12-05 | 2010-08-10 | Microsoft Corporation | Proofing of word collocation errors based on a comparison with collocations in a corpus |
US7933765B2 (en) * | 2007-01-25 | 2011-04-26 | Corbis Corporation | Cross-lingual information retrieval |
US20080189257A1 (en) | 2007-02-01 | 2008-08-07 | Microsoft Corporation | World-wide classified listing search with translation |
CN101271461B (zh) | 2007-03-19 | 2011-07-13 | 株式会社东芝 | 跨语言检索请求的转换及跨语言信息检索方法和系统 |
WO2008133051A1 (ja) | 2007-04-13 | 2008-11-06 | Babcock-Hitachi Kabushiki Kaisha | 微粉炭焚きボイラ |
US7917488B2 (en) * | 2008-03-03 | 2011-03-29 | Microsoft Corporation | Cross-lingual search re-ranking |
NL2002365C2 (en) | 2008-05-26 | 2011-04-05 | Avantium Holding B V | Flow splitter and reaction assembly. |
US20100070262A1 (en) * | 2008-09-10 | 2010-03-18 | Microsoft Corporation | Adapting cross-lingual information retrieval for a target collection |
JP5505028B2 (ja) | 2010-03-30 | 2014-05-28 | 富士通株式会社 | 翻訳支援装置、方法及びプログラム |
KR101850124B1 (ko) * | 2011-06-24 | 2018-04-19 | 구글 엘엘씨 | 교차-언어 쿼리 제안을 위한 쿼리 번역 평가 |
-
2012
- 2012-03-06 US US13/413,041 patent/US9684653B1/en active Active
-
2013
- 2013-03-05 CA CA2866261A patent/CA2866261C/en active Active
- 2013-03-05 JP JP2014561046A patent/JP5948445B2/ja active Active
- 2013-03-05 CN CN201380012055.8A patent/CN104145270B/zh active Active
- 2013-03-05 WO PCT/US2013/029152 patent/WO2013134284A1/en active Application Filing
- 2013-03-05 EP EP13757110.5A patent/EP2823415A4/en not_active Withdrawn
-
2014
- 2014-08-11 IN IN6742DEN2014 patent/IN2014DN06742A/en unknown
-
2017
- 2017-06-12 US US15/620,101 patent/US10699082B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8140410B2 (en) * | 2004-09-27 | 2012-03-20 | International Business Machines Corporation | Method, system, and program for translating and interfacing between data pools and product information management (PIM) systems |
WO2007133625A2 (en) * | 2006-05-12 | 2007-11-22 | Eij Group Llc | Multi-lingual information retrieval |
CN101443759B (zh) * | 2006-05-12 | 2010-08-11 | 北京乐图在线科技有限公司 | 多语言信息检索的方法和系统 |
CN101714144A (zh) * | 2008-10-07 | 2010-05-26 | 英业达股份有限公司 | 关联字词查询系统及其方法 |
CN102770859A (zh) * | 2009-11-20 | 2012-11-07 | 谷歌公司 | 跨语言搜索选项 |
Also Published As
Publication number | Publication date |
---|---|
US10699082B2 (en) | 2020-06-30 |
WO2013134284A1 (en) | 2013-09-12 |
US9684653B1 (en) | 2017-06-20 |
CN104145270B (zh) | 2018-03-16 |
EP2823415A4 (en) | 2015-10-28 |
CA2866261A1 (en) | 2013-09-12 |
JP2015515053A (ja) | 2015-05-21 |
US20170277683A1 (en) | 2017-09-28 |
IN2014DN06742A (zh) | 2015-05-22 |
CA2866261C (en) | 2020-03-24 |
EP2823415A1 (en) | 2015-01-14 |
JP5948445B2 (ja) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104145270A (zh) | 使用产品信息的外语翻译 | |
US20200250732A1 (en) | Method and apparatus for use in determining tags of interest to user | |
US11170063B2 (en) | User interface element for surfacing related results | |
US8959427B1 (en) | System and method for JavaScript based HTML website layouts | |
US8458054B1 (en) | Method, medium, and system for suggesting images for items without images in listings data | |
US20080147378A1 (en) | Online computer-aided translation | |
US9507480B1 (en) | Interface optimization application | |
US20080255967A1 (en) | System and method for comparison shopping | |
US10497041B1 (en) | Updating content pages with suggested search terms and search results | |
US20080228595A1 (en) | System for supporting electronic commerce in social networks | |
KR102225729B1 (ko) | 복수 온라인 쇼핑몰 상품 등록을 위한 상품정보 가공 장치 및 방법 | |
US20050216289A1 (en) | Method for a facilitator to assist an entrepreneur in creating an internet business | |
CN105830110A (zh) | 全球商户网络 | |
US9390168B1 (en) | Customer keyword-based item recommendations | |
US9355419B2 (en) | Metadata map repository | |
US10255249B1 (en) | Previewing electronic book content within third-party websites | |
US20050216288A1 (en) | Process for registering and trademarking domain names | |
CN111095335A (zh) | 单一视图中基于搜索结果的列表生成 | |
US20050216287A1 (en) | Method for integrating an entrepreneur's web site and a store front web site | |
US20150073923A1 (en) | System and method for providing interactive ebook content annotations and advertisements | |
CN115758016A (zh) | 网页内容静态化处理方法及系统 | |
US10853872B1 (en) | Advanced item associations in an item universe | |
US8413062B1 (en) | Method and system for accessing interface design elements via a wireframe mock-up | |
US10503372B2 (en) | Navigation among items in a network page | |
US20170124602A1 (en) | Demand matching method on network and workspace trading platform using such method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |