CN111737550A - 搜索结果处理方法及装置、存储介质和处理器 - Google Patents

搜索结果处理方法及装置、存储介质和处理器 Download PDF

Info

Publication number
CN111737550A
CN111737550A CN201910227199.4A CN201910227199A CN111737550A CN 111737550 A CN111737550 A CN 111737550A CN 201910227199 A CN201910227199 A CN 201910227199A CN 111737550 A CN111737550 A CN 111737550A
Authority
CN
China
Prior art keywords
search
word
search results
search candidate
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910227199.4A
Other languages
English (en)
Other versions
CN111737550B (zh
Inventor
张海波
赵宇
骆卫华
陈博兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910227199.4A priority Critical patent/CN111737550B/zh
Publication of CN111737550A publication Critical patent/CN111737550A/zh
Application granted granted Critical
Publication of CN111737550B publication Critical patent/CN111737550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种搜索结果处理方法及装置、存储介质和处理器。其中,该方法包括:在检索平台中获取用户输入的查询词,其中,查询词的语种与检索平台当前设置的默认语种不同;将查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为默认语种;基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果;对多个搜索结果进行排序,返回排序后的搜索结果。本发明解决了由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。

Description

搜索结果处理方法及装置、存储介质和处理器
技术领域
本发明涉及信息检索领域,具体而言,涉及一种搜索结果处理方法及装置、存储介质和处理器。
背景技术
跨语言搜索引擎通过将多语言查询翻译成某种语言,比如英文或者中文,然后搜索引擎通过英文或者中文进行检索商品。只有用户查询与商品标题中的词完全匹配时才能被召回。翻译后的查询词和商品的标题描述语言之间存在一些差异,可能导致一些满足用户原始查询意图的商品无法被召回。主要原因就是机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,最优的结果很多情况下难以真正是反应用户意图的结果,例如:多语言查询:свитеркосмос женский翻译最优1th-best结果:sweater space female,基于翻译最优的结果进行的搜索,召回的结果,难以真正是反应用户意图的结果,也即,召回的结果的准确率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种搜索结果处理方法及装置、存储介质和处理器,以至少解决由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。
根据本发明实施例的一个方面,提供了一种搜索结果处理方法,包括:在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;对所述多个搜索结果进行排序,返回排序后的搜索结果。
进一步地,所述多个搜索结果进行排序包括:基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定每个搜索结果所属的类目;基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
进一步地,所述方法还包括:基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序之后,计算所述多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
进一步地,所述第一目标搜索候选词和所述第二目标搜索词均是与所述查询词翻译最匹配的搜索候选词。
进一步地,所述第一目标搜索候选词是与所述查询词翻译最匹配的搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
进一步地,所述第一目标搜索候选词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
进一步地,所述方法还包括:在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与所述查询词相匹配的语种。
进一步地,所述检索平台为电商网站的检索平台。
根据本发明实施例的一个方面,提供了一种搜索结果处理装置,包括:获取单元,用于在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;第一翻译单元,用于将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;搜索单元,用于基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;第一排序单元,用于对所述多个搜索结果进行排序,返回排序后的搜索结果。
进一步地,所述第一排序单元包括:预测模块,用于基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定模块,用于确定每个搜索结果所属的类目;排序模块,用于基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
根据本发明实施例的一个方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的搜索结果处理方法。
根据本发明实施例的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的搜索结果处理方法。
在本发明实施例中,通过在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;对所述多个搜索结果进行排序,返回排序后的搜索结果,达到了基于对查询词翻译得到的多个搜索候选词进行搜索,避免了仅基于查询词最优翻译的搜索候选词进行搜索导致召回的搜索结果准确率较低目的,从而实现了提升召回的搜索结果准确率的技术效果,进而解决了由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的计算机终端的结构框图;
图2是根据本发明实施例的搜索结果处理方法的流程图;
图3是根据本发明实施例的搜索结果处理装置的示意图;以及
图4是根据本发明实施例的计算机终端的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
机器翻译:又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。
统计机器翻译:利用统计学的方法对大量的平行语料进行分析,构建机器翻译模型,进而利用此模型完成一种自然语言转变为另一种自然语言的过程。
跨语言检索(Cross Language Information Retrieval,CLIR),即可用一种提问语言检索出用另一种语言书写的信息,也就是一种跨越语言界限进行检索的问题。
翻译结果:对于同一个原文,机器翻译同时产生多个译文。
召回率(Recall Rate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。
实施例1
根据本发明实施例,提供了一种搜索结果处理的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现搜索结果处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的搜索结果处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的搜索结果处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的搜索结果处理方法的流程图,步骤如下:
步骤201,在检索平台中获取用户输入的查询词,其中,查询词的语种与检索平台当前设置的默认语种不同。
例如,检索平台当前设置的默认语种为英语,获取到的用户输入的查询词为俄语的查询词。
步骤202,将查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为默认语种。
例如,将获取到的俄语的查询词为:Последний мобильный телефон,
翻译为检索平台当前设置的英语后为:The latest mobile phone,The latesthandset,The latest cell phone,将The latest mobile phone,The latest handset,The latest cell phone作为多个搜索候选词。
步骤203,基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果。
例如,分别基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果。
步骤204,对多个搜索结果进行排序,返回排序后的搜索结果。
例如,得到1000个搜索结果,为了保证用户搜索体验,按照预设规则对搜索结果进行排序,将排序后的搜索结果返回值检索平台的界面。
可选地,根据本申请实施例提供的搜索结果处理方法,多个搜索结果进行排序包括:基于多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定每个搜索结果所属的类目;基于预测出的类目和每个搜索结果所属的类目的相关性,对多个搜索结果中搜索结果进行排序。
上述的第一目标搜索候选词可以是与查询词翻译最匹配的搜索候选词,基于第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目,例如,The latest mobile phone为第一目标搜索候选词,基于The latest mobile phone对查询词所查询的对象所属的类目进行预测,预测出所属类目为移动电话。然后确定每个搜索结果所属的类目,基于每个搜索结果所属的类目与移动电话的相关性,按照相关性大小进行排序。
上述的第一目标搜索候选词也可以是与查询词翻译最匹配的搜索候选词和至少一个除与查询词翻译最匹配的搜索候选词之外的其它搜索候选词,例如,The latestmobile phone和The latest cell phone为第一目标搜索候选词,基于The latest mobilephone和The latest cell phone对查询词所查询的对象所属的类目进行预测,预测出所属类目为移动电话和手机。然后确定每个搜索结果所属的类目,基于每个搜索结果所属的类目与移动电话和手机的相关性,按照相关性大小进行排序。
可选地,根据本申请实施例提供的搜索结果处理方法,该方法还包括:基于预测出的类目和每个搜索结果所属的类目的相关性,对多个搜索结果中搜索结果进行排序之后,计算多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
上述的第二目标搜索候选词可以是与查询词翻译最匹配的搜索候选词,计算多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度,例如,The latest mobile phone为第二目标搜索候选词,基于The latest mobile phone计算与排序后的搜索结果中每个搜索结果的匹配度,基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
上述的第二目标搜索候选词也可以是与查询词翻译最匹配的搜索候选词和至少一个除与查询词翻译最匹配的搜索候选词之外的其它搜索候选词,例如,The latestmobile phone和The latest cell phone为第二目标搜索候选词,基于The latest mobilephone和The latest cell phone计算与排序后的搜索结果中每个搜索结果的匹配度,基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
可选地,为了保证用户的搜索体验,根据本申请实施例提供的搜索结果处理方法,方法还包括:在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与查询词相匹配的语种。
例如,用户输入的是俄语的查询词,通过在检索平台进行搜索,得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译为俄语,以便显示给用户的搜索结果的语种为与查询词相匹配的语种,保证用户的搜索体验。
综上,根据本申请实施例提供的搜索结果处理方法,通过在检索平台中获取用户输入的查询词,其中,查询词的语种与检索平台当前设置的默认语种不同;将查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为默认语种;基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果;对多个搜索结果进行排序,返回排序后的搜索结果,达到了基于对查询词翻译得到的多个搜索候选词进行搜索,避免了仅基于查询词最优翻译的搜索候选词进行搜索导致召回的搜索结果准确率较低目的,从而实现了提升召回的搜索结果准确率的技术效果,进而解决了由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。
可选地,根据本申请实施例提供的搜索结果处理方法,检索平台为电商网站的检索平台。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述搜索结果处理方法的装置,如图3所示,该装置包括:获取单元301,第一翻译单元302,搜索单元303,第一排序单元304。
具体地,获取单元301,用于在检索平台中获取用户输入的查询词,其中,查询词的语种与检索平台当前设置的默认语种不同;
第一翻译单元302,用于将查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为默认语种;
搜索单元303,用于基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果;
第一排序单元304,用于对多个搜索结果进行排序,返回排序后的搜索结果。
综上,在根据本申请实施例提供的搜索结果处理装置中,通过获取单元301在检索平台中获取用户输入的查询词,其中,查询词的语种与检索平台当前设置的默认语种不同;第一翻译单元302将查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为默认语种;搜索单元303基于每个搜索候选词在检索平台中进行搜索,得到多个搜索结果;第一排序单元304对多个搜索结果进行排序,返回排序后的搜索结果。达到了基于对查询词翻译得到的多个搜索候选词进行搜索,避免了仅基于查询词最优翻译的搜索候选词进行搜索导致召回的搜索结果准确率较低目的,从而实现了提升召回的搜索结果准确率的技术效果,进而解决了由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。
可选地,在根据本申请实施例提供的搜索结果处理装置中,第一排序单元304包括:预测模块,用于基于多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定模块,用于确定每个搜索结果所属的类目;排序模块,用于基于预测出的类目和每个搜索结果所属的类目的相关性,对多个搜索结果中搜索结果进行排序。
可选地,在根据本申请实施例提供的搜索结果处理装置中,该装置还包括:计算单元,用于基于预测出的类目和每个搜索结果所属的类目的相关性,对多个搜索结果中搜索结果进行排序之后,计算多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;第二排序单元,用于基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
可选地,在根据本申请实施例提供的搜索结果处理装置中,第一目标搜索候选词和第二目标搜索词均是与查询词翻译最匹配的搜索候选词。
可选地,在根据本申请实施例提供的搜索结果处理装置中,第一目标搜索候选词是与查询词翻译最匹配的搜索候选词,第二目标搜索词中包括与查询词翻译最匹配的搜索候选词和至少一个除与查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
可选地,在根据本申请实施例提供的搜索结果处理装置中,第一目标搜索候选词中包括与查询词翻译最匹配的搜索候选词和至少一个除与查询词翻译最匹配的搜索候选词之外的其它搜索候选词,第二目标搜索词中包括与查询词翻译最匹配的搜索候选词和至少一个除与查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
可选地,在根据本申请实施例提供的搜索结果处理装置中,该装置还包括:第二翻译单元,用于在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与查询词相匹配的语种。
可选地,在根据本申请实施例提供的搜索结果处理装置中,检索平台为电商网站的检索平台。
此处需要说明的是,上述获取单元301,第一翻译单元302,搜索单元303,第一排序单元304对应于实施例1中的步骤S201至步骤S204,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例3
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;对所述多个搜索结果进行排序,返回排序后的搜索结果。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述多个搜索结果进行排序包括:基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定每个搜索结果所属的类目;基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述方法还包括:基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序之后,计算所述多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述第一目标搜索候选词和所述第二目标搜索词均是与所述查询词翻译最匹配的搜索候选词。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述第一目标搜索候选词是与所述查询词翻译最匹配的搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述第一目标搜索候选词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述方法还包括:在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与所述查询词相匹配的语种。
上述计算机终端还可以执行应用程序的搜索结果处理方法中以下步骤的程序代码:所述检索平台为电商网站的检索平台。
可选地,图4是根据本发明实施例的一种计算机终端的结构框图。如图4所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器、存储器。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的搜索结果处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的搜索结果处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;对所述多个搜索结果进行排序,返回排序后的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:所述多个搜索结果进行排序包括:基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定每个搜索结果所属的类目;基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
可选的,上述处理器还可以执行如下步骤的程序代码:所述方法还包括:基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序之后,计算所述多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:所述第一目标搜索候选词和所述第二目标搜索词均是与所述查询词翻译最匹配的搜索候选词。
可选的,上述处理器还可以执行如下步骤的程序代码:所述第一目标搜索候选词是与所述查询词翻译最匹配的搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
可选的,上述处理器还可以执行如下步骤的程序代码:所述第一目标搜索候选词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
可选的,上述处理器还可以执行如下步骤的程序代码:所述方法还包括:在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与所述查询词相匹配的语种。
可选的,上述处理器还可以执行如下步骤的程序代码:所述检索平台为电商网站的检索平台。
采用本发明实施例,提供了一种搜索结果处理方法的方案。通过在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;对所述多个搜索结果进行排序,返回排序后的搜索结果,达到了基于对查询词翻译得到的多个搜索候选词进行搜索,避免了仅基于查询词最优翻译的搜索候选词进行搜索导致召回的搜索结果准确率较低目的,从而实现了提升召回的搜索结果准确率的技术效果,进而解决了由于机器翻译通常只返回最优的翻译结果给搜索引擎进行检索,造成的召回的搜索结果的准确率较低的技术问题。
本领域普通技术人员可以理解,图4所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图4其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的搜索结果处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;对所述多个搜索结果进行排序,返回排序后的搜索结果。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述多个搜索结果进行排序包括:基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;确定每个搜索结果所属的类目;基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述方法还包括:基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序之后,计算所述多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述第一目标搜索候选词和所述第二目标搜索词均是与所述查询词翻译最匹配的搜索候选词。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述第一目标搜索候选词是与所述查询词翻译最匹配的搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述第一目标搜索候选词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述方法还包括:在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与所述查询词相匹配的语种。
存储介质还被设置为存储用于执行以下步骤的程序代码:所述检索平台为电商网站的检索平台。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种搜索结果处理方法,其特征在于,包括:
在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;
将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;
基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;
对所述多个搜索结果进行排序,返回排序后的搜索结果。
2.根据权利要求1所述的处理方法,其特征在于,所述多个搜索结果进行排序包括:
基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;
确定每个搜索结果所属的类目;
基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
3.根据权利要求2所述的处理方法,其特征在于,所述方法还包括:
基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序之后,计算所述多个搜索候选词中的第二目标搜索候选词与排序后的搜索结果中每个搜索结果的匹配度;
基于计算出的匹配度,对排序后的搜索结果再次进行排序,得到最终排序后的搜索结果。
4.根据权利要求3所述的处理方法,其特征在于,所述第一目标搜索候选词和所述第二目标搜索词均是与所述查询词翻译最匹配的搜索候选词。
5.根据权利要求3所述的处理方法,其特征在于,所述第一目标搜索候选词是与所述查询词翻译最匹配的搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
6.根据权利要求3所述的处理方法,其特征在于,所述第一目标搜索候选词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词,所述第二目标搜索词中包括与所述查询词翻译最匹配的搜索候选词和至少一个除与所述查询词翻译最匹配的搜索候选词之外的其它搜索候选词。
7.根据权利要求1所述的处理方法,其特征在于,所述方法还包括:
在得到最终排序后的搜索结果之后,将最终排序后的搜索结果进行翻译,以显示给用户的搜索结果的语种为与所述查询词相匹配的语种。
8.根据权利要求1所述的处理方法,其特征在于,所述检索平台为电商网站。
9.一种搜索结果处理装置,其特征在于,包括:
获取单元,用于在检索平台中获取用户输入的查询词,其中,所述查询词的语种与所述检索平台当前设置的默认语种不同;
第一翻译单元,用于将所述查询词进行翻译,得到多个搜索候选词,其中,每个搜索候选词的语种为所述默认语种;
搜索单元,用于基于每个搜索候选词在所述检索平台中进行搜索,得到多个搜索结果;
第一排序单元,用于对所述多个搜索结果进行排序,返回排序后的搜索结果。
10.根据权利要求9所述的处理装置,其特征在于,所述第一排序单元包括:
预测模块,用于基于所述多个搜索候选词中的第一目标搜索候选词对所查询词查询的对象所属的类目进行预测,得到预测出的类目;
确定模块,用于确定每个搜索结果所属的类目;
排序模块,用于基于预测出的类目和每个搜索结果所属的类目的相关性,对所述多个搜索结果中搜索结果进行排序。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述的搜索结果处理方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至8中任意一项所述的搜索结果处理方法。
CN201910227199.4A 2019-03-25 2019-03-25 搜索结果处理方法及装置、存储介质和处理器 Active CN111737550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910227199.4A CN111737550B (zh) 2019-03-25 2019-03-25 搜索结果处理方法及装置、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910227199.4A CN111737550B (zh) 2019-03-25 2019-03-25 搜索结果处理方法及装置、存储介质和处理器

Publications (2)

Publication Number Publication Date
CN111737550A true CN111737550A (zh) 2020-10-02
CN111737550B CN111737550B (zh) 2024-01-23

Family

ID=72646248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910227199.4A Active CN111737550B (zh) 2019-03-25 2019-03-25 搜索结果处理方法及装置、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN111737550B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271461A (zh) * 2007-03-19 2008-09-24 株式会社东芝 跨语言检索请求的转换及跨语言信息检索方法和系统
CN101868797A (zh) * 2007-09-21 2010-10-20 谷歌公司 跨语言搜索
CN101933017A (zh) * 2009-03-24 2010-12-29 三菱电机信息系统株式会社 文件检索装置、文件检索系统、文件检索程序和文件检索方法
CN103488648A (zh) * 2012-06-13 2014-01-01 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN105653562A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 一种文本内容与查询请求之间相关性的计算方法及装置
CN105787001A (zh) * 2007-05-16 2016-07-20 谷歌公司 跨语言信息检索
US20170221118A1 (en) * 2016-01-30 2017-08-03 Wal-Mart Stores, Inc. Systems and methods for understanding search queries
CN108304412A (zh) * 2017-01-13 2018-07-20 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271461A (zh) * 2007-03-19 2008-09-24 株式会社东芝 跨语言检索请求的转换及跨语言信息检索方法和系统
CN105787001A (zh) * 2007-05-16 2016-07-20 谷歌公司 跨语言信息检索
CN101868797A (zh) * 2007-09-21 2010-10-20 谷歌公司 跨语言搜索
CN101933017A (zh) * 2009-03-24 2010-12-29 三菱电机信息系统株式会社 文件检索装置、文件检索系统、文件检索程序和文件检索方法
CN103488648A (zh) * 2012-06-13 2014-01-01 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN105653562A (zh) * 2014-12-02 2016-06-08 阿里巴巴集团控股有限公司 一种文本内容与查询请求之间相关性的计算方法及装置
US20170221118A1 (en) * 2016-01-30 2017-08-03 Wal-Mart Stores, Inc. Systems and methods for understanding search queries
CN108304412A (zh) * 2017-01-13 2018-07-20 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置

Also Published As

Publication number Publication date
CN111737550B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN108334533B (zh) 关键词提取方法和装置、存储介质及电子装置
CN110413738A (zh) 一种信息处理方法、装置、服务器及存储介质
CN112749569A (zh) 文本的翻译方法和装置
CN109325146A (zh) 一种视频推荐方法、装置、存储介质和服务器
CN105404688A (zh) 搜索方法和搜索设备
CN110674365A (zh) 一种搜索方法、装置、设备及存储介质
CN113407785A (zh) 一种基于分布式储存系统的数据处理方法和系统
CN107885875B (zh) 检索词的同义变换方法、装置及服务器
CN110209781A (zh) 一种文本处理方法、装置以及相关设备
CN113849499A (zh) 数据的查询方法、装置、存储介质及电子装置
CN111858581A (zh) 一种分页查询的方法、装置、存储介质和电子设备
CN111737550A (zh) 搜索结果处理方法及装置、存储介质和处理器
KR20140115849A (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
CN116010670A (zh) 一种基于数据血缘关系的数据目录推荐方法、装置及应用
CN112749316A (zh) 翻译质量的确定方法、装置、存储介质和处理器
CN112988300A (zh) 页面中文本的显示方法及装置、存储介质、电子设备
CN112749258A (zh) 数据搜索的方法和装置、电子设备和存储介质
CN110956034B (zh) 词语的获取方法及装置、商品搜索方法
CN114741489A (zh) 文档检索方法、装置、存储介质以及电子设备
CN112836057B (zh) 知识图谱的生成方法、装置、终端以及存储介质
CN111898387A (zh) 翻译方法及装置、存储介质、计算机设备
CN113590792A (zh) 用户问题的处理方法、装置和服务器
CN111782958A (zh) 推荐词确定方法、装置、电子装置及存储介质
CN110728138A (zh) 新闻文本识别的方法、装置以及存储介质
CN113011182A (zh) 一种对目标对象进行标签标注的方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant