CN108829800A - 一种搜索数据处理方法、设备及计算机可读存储介质 - Google Patents

一种搜索数据处理方法、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN108829800A
CN108829800A CN201810571775.2A CN201810571775A CN108829800A CN 108829800 A CN108829800 A CN 108829800A CN 201810571775 A CN201810571775 A CN 201810571775A CN 108829800 A CN108829800 A CN 108829800A
Authority
CN
China
Prior art keywords
label
added
word
keyword
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810571775.2A
Other languages
English (en)
Other versions
CN108829800B (zh
Inventor
王秀琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201810571775.2A priority Critical patent/CN108829800B/zh
Publication of CN108829800A publication Critical patent/CN108829800A/zh
Application granted granted Critical
Publication of CN108829800B publication Critical patent/CN108829800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种搜索数据处理方法、设备及计算机可读存储介质,该方法包括:获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。该方法使得在对搜索对象创建标签时,可以使得标签与搜索对象相关联,进而在后续利用标签对搜索对象进行搜索时,可以提高搜索的准确性。

Description

一种搜索数据处理方法、设备及计算机可读存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种搜索数据处理方法、设备及计算机可读存储介质。
背景技术
近年来,随着Internet的迅速崛起,互联网已日益成为收集提供信息的最佳渠道并逐步进入传统的流通领域。于是电子商务开始流行起来,越来越多的商家在网上建起在线商店,向消费者展示一种新颖的购物理念。
为了便于用户可以在在线商店中快速找到所需的商品,目前很多在线商店都使用搜索推荐系统,搜索推荐系统(如淘宝、应用商店等等)中,搜索的目标对象为了引流,往往尽量多的为自身添加标签,这导致用户搜索到的结果集合中包含大量的非目标对象,降低了搜索的准确率,带来不好的用户体验。
例如:在某网上商城中,用户搜索“茂谷柑”,搜索的目标对象集合中,真正的茂谷柑商品竟然不到10%。而大量的非茂谷柑柑橘,也均在标题中加入了“茂谷柑”、“皇帝柑”等标签,导致搜索的准确率大大降低。另外,当搜索对象的标题中加入类似“非茂谷柑”、“非皇帝柑”、“比皇帝柑还甜”等,这导致在搜索关键词为“茂谷柑”时,这些“非XX”的对象也会匹配检索,降低了搜索准确性。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种搜索数据处理方法、设备及计算机可读存储介质。
有鉴于此,第一方面,本申请提供了一种搜索数据处理方法,其特征在于,包括:获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
可选地,所述确定所述待添加标签与所述搜索对象的关联度,包括:获取所述搜索对象的已添加标签列表;计算所述待添加标签与所述已添加标签列表的相容性;将所述待添加标签与所述已添加标签列表的相容性作为所述关联度。
可选地,所述计算所述待添加标签与所述已添加标签列表的相容性,包括:判断所述已添加标签列表中标签的数量是否为零;当所述已添加标签列表中标签的数量为零时,确定所述待添加标签与所述已添加标列表的相容性为1;
或者,当所述已添加标签列表中标签的数量不为零时,计算所述待添加标签中词语与已添加标签列表中每个标签中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述已添加标列表的相容性。
可选地,所述确定所述待添加标签与所述搜索对象的关联度,包括:从所述搜索对象相对应的详细描述语句提取的关键词,组成关键词列表;计算所述待添加标签与所述关键词列表的相容性;将所述待添加标签与所述关键词列表的相容性作为所述关联度。
可选地,所述计算所述待添加标签与所述关键词列表的相容性,包括:判断所述关键词列表中关键词的数量是否为零;当所述关键词列表中关键词的数量为零时,确定所述待添加标签与所述键词列表的相容性为1;
或者,当所述关键词列表中关键词的数量不为零时,计算所述待添加标签中词语与关键词列表中每个关键词中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述关键词列表的相容性。
可选地,所述计算所述待添加标签与词语的子相容性,包括:获取所述待添加标签中词语的词性;提取所述已添加标签列表中标签的词语,或关键词列表中关键词中的词语,作为参考词语,并确定所述参考词语的词性为参考词性;判断所述待添加标签中词语的词性与所述参考词性是否相同;当所述待添加标签中词语的词性与所述参考词性相同时,计算所述待添加标签中词语在预设词语向量模型中的单词向量;计算所述参考词语在预设词语向量模型中的单词向量;计算两个单词向量之间的相似度;当所述相似度大于或等于第一相似度阈值时,将所述相似度作为所述待添加标签与参考词语的相容性;当所述相似度小于或等于第二相似度阈值时,将所述相似度与1的差值作为所述待添加标签与参考词语的相容性,所述第一相似度阈值大于第二相似度阈值;当所述相似度位于所述相似度阈值之间时,将所述相似度作为所述待添加标签与参考词语的相容性。
可选地,当所述待添加标签中词语的词性与所述参考词性不相同时,所述方法还包括:关联所述待添加标签与所述搜索对象。
可选地,所述关联所述待添加标签与所述搜索对象,包括:获取所述待添加标签中的名词前是否包含修饰词;当所述待添加标签中的名词前没有包含修饰词,将所述待添加标签标记所述搜索对象的正向关键词;当所述待添加标签中的名词前包含修饰词,判断所述修饰词是否为预设否定词语;当所述修饰词为预设否定词语时,将所述待添加标签标记所述搜索对象的负向关键词,当所述修饰词不为预设否定词语时,将所述待添加标签标记所述搜索对象的正向关键词。
第二方面,本申请提供了一种搜索数据处理方法,包括:获取搜索关键词;查找与所述搜索关键词相对应的待搜索对象;获取所述待搜索对象的标签列表;根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度。
可选地,所述方法还包括:展示所有待搜索对象,并且在所述待搜索对象展示时标记所述匹配度;或者,判断匹配度是否大于匹配度阈值;若所述匹配度大于匹配度阈值,展示所述待搜索对象;若所述匹配度不大于匹配度阈值,不展示所述待搜索对象。
可选地,所述根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度,包括:获取所述标签列表中的正属性标签;计算所述搜索关键词与所有正属性标签的第一匹配值;将所述第一匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
可选地,所述根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度,包括:获取所述标签列表中的正属性标签和负属性标签;计算所述搜索关键词与所有正属性标签的第一匹配值;计算所述搜索关键词与所有负属性标签的第二匹配值;根据所述第一匹配值和第二匹配值计算第三匹配值;将所述第三匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
第三方面,本申请提供了一种搜索数据处理设备,包括:处理器和存储器;其中,所述处理器用于调用所述存储器中的程序指令,以执行所述第一方面任意一个实施例所述搜索数据处理方法。
第四方面,本申请提供了一种搜索数据处理设备,包括:处理器和存储器;其中,所述处理器用于调用所述存储器中的程序指令,以执行所述第二方面任意一个实施例所述搜索数据处理方法。
第五方面,本申请提供了一种计算机可存储介质,其特征在于,所述计算机可存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述第二方面任意一个实施例所述搜索数据处理方法。
第六方面,本申请提供了一种计算机可存储介质,所述计算机可存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述第二方面任意一个实施例所述搜索数据处理方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例中提供的该方法,在对搜索对象的标签创建时,首先获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,最终,关联所述待添加标签与所述搜索对象。这使得在对搜索对象创建标签时,可以使得标签与搜索对象相关联,进而在后续利用标签对搜索对象进行搜索时,可以提高搜索的准确性。
在利用前述创建的标签进行搜索时,由于搜索对象的每个标签都与搜索对象进行过关联,进而在根据标签对搜索对象进行搜索时,可以使得搜索出来的结果与用户输入的搜索关键词相匹配,即使得搜索准确性提高。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为实现本发明各个实施例提供的可选的移动终端的硬件结构示意图;
图2为如图1所示的移动终端的无线通信系统示意图;
图3为根据本发明第一实施例的搜索数据处理方法的流程图;
图4为根据本发明第二实施例的搜索数据处理方法的流程图;
图5为根据本发明第三实施例的搜索数据处理方法的流程图;
图6为根据本发明第四实施例的搜索数据处理方法的流程图;
图7为根据本发明实施例提供的一种搜索数据处理设备的结构图;
图8为根据本发明实施例提供的另一种搜索数据处理设备的结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图1为实现本发明各个实施例一可选的移动终端的硬件结构示意。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(Media FLO@)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。
移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂TM等等。
位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术,GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法,从而根据经度、纬度和高度准确地计算三维当前位置信息。当前,用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外,GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风122,相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送,可以根据移动终端的构造提供两个或更多相机121。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。
感测单元140检测移动终端100的当前状态,(例如,移动终端100的打开或关闭状态)、移动终端100的位置、用户对于移动终端100的接触(即,触摸输入)的有无、移动终端100的取向、移动终端100的加速或减速移动和方向等等,并且生成用于控制移动终端100的操作的命令或信号。例如,当移动终端100实施为滑动型移动电话时,感测单元140可以感测该滑动型电话是打开还是关闭。另外,感测单元140能够检测电源单元190是否提供电力或者接口单元170是否与外部装置耦接。
接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外,具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式,因此,识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。
另外,当移动终端100与外部底座连接时,接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示单元151、音频输出模块152、警报单元153等等。
显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
警报单元153可以提供输出以将事件的发生通知给移动终端100。典型的事件可以包括呼叫接收、消息接收、键信号输入、触摸输入等等。除了音频或视频输出之外,警报单元153可以以不同的方式提供输出以通知事件的发生。例如,警报单元153可以以振动的形式提供输出,当接收到呼叫、消息或一些其它进入通信(incoming communication)时,警报单元153可以提供触觉输出(即,振动)以将其通知给用户。通过提供这样的触觉输出,即使在用户的移动电话处于用户的口袋中时,用户也能够识别出各种事件的发生。警报单元153也可以经由显示单元151或音频输出模块152提供通知事件的发生的输出。
存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块181,多媒体模块181可以构造在控制器180内,或者可以构造为与控制器180分离。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
如图1中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。
现在将参考图2描述其中根据本发明的移动终端能够操作的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地,长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例,下面的描述涉及CDMA通信系统,但是这样的教导同样适用于其它类型的系统。
参考图2,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造,所述接口包括例如E1/T1、ATM,IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是,如图2中所示的系统可以包括多个BSC275。
每个BS270可以服务一个或多个分区(或区域),由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者,每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配,并且每个频率分配具有特定频谱(例如,1.25MHz,5MHz等等)。
分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下,术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者,特定BS270的各分区可以被称为多个蜂窝站。
如图2中所示,广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。如图1中所示的广播接收模块111被设置在移动终端100处以接收由BT295发送的广播信号。在图2中,示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。
在图2中,描绘了多个卫星300,但是理解的是,可以利用任何数目的卫星获得有用的定位信息。如图1中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外,可以使用可以跟踪移动终端的位置的其它技术。另外,至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。
作为无线通信系统的一个典型操作,BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280,其提供用于与PSTN290形成接口的额外的路由服务。类似地,PSTN290与MSC280形成接口,MSC与BSC275形成接口,并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。
基于上述移动终端硬件结构以及通信系统,提出本发明方法各个实施例。
实施例一
本实施例提供一种搜索数据处理方法。本实施例的执行主体可以是上述的移动终端,也可以是预设的服务器。
图3为本申请实施例提供的一种搜索数据处理方法的流程图。
如图3所示,该方法可以包括以下步骤:
步骤S310,获取搜索对象的待添加标签。
搜索对象,是指用户在浏览网络时所展示的内容,以文件类型划分,搜索对象可以为:图片、数据表、视频、文档或flash等,以内容类型划分,搜索对象可以为帖子、公示板、广告等等,当然在具体应用中,可以根据其它标准对搜索对象进行划分,只要是能够响应用户点击、按压、滑动操作等各种操作而可显示在页面中的,都可以称为搜索对象。
标签的作用是对搜索对象起到标记、说明,标签可以为:文字、图片、列表等,或者,标签还可以为数据库中一种特定格式的文件。
针对同一个搜索对象可以用一种类型的多个标签进行标记,也可以使用不同类型的标签进行标记。
给搜索对象加上标签,其目的是为了便于用户在网络上进行搜索时,可以根据标签快速找到搜索对象,提高搜索的效率,避免用户漫无目的地在网络上浏览内容。
本申请实施例中,对搜索对象添加标签的动作,可以由服务器来自动进行,也可以由用户(例如商户)手动添加。
步骤S320,确定所述待添加标签与所述搜索对象的关联度。
对于每个搜索对象而言,其必须是明确的,已知的。这样才能给搜索对象进行加标签的动作,例如:搜索对象可以为网上商城销售的一款商品,或者,搜索对象可以为图库中的一幅图片,再或者,搜索对象可以为视频库中的一段视频。
由于搜索对象是明确的,所以,针对每个搜索对象都有一些明确的内容,例如:搜索对象已有一些标签,通过这些标签可以对搜索对象进行画像,再或者,搜索对象中有一些关键词,例如:广告宣传语或产品介绍等,那么利用这些广告宣传语或产品介绍也可以对搜索对象进行画像。
在该步骤中,确定待添加标签与搜索对象的关联度,其通过的方式,就是将待添加的标签和搜索对象的已有标签进行关联,或者,将待添加的标签和搜索对象的关键词进行关联,进而可以判断出待添加标签和搜索对象是否关联。
在本申请实施例中,关联度可以用百分比来表示,另外,也可以用自定义打分标准来进行表示,无论那种方式,只有关联度满足要求,才能使得后续搜索更加准备。
步骤S330,当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
当待添加标签与所述搜索对象的关联度超过关联阈值,说明该待添加标签用来描述搜索对象比较准确,进而该待添加标签就可以作为搜索对象的真正标签来使用,所以在该步骤中,可以直接将待添加标签与搜索对象进行关联。
在本申请实施例中,将所述待添加标签与所述搜索对象进行关联的方式有多种,例如:一种直接建立待添加标签与搜索对象之间的对应关系,另一种,是对待添加标签进行处理,然后在建立搜索对象的对应关系,例如:对搜索对象的标签进行分组,例如:某一件商品可以设置有材料组、产地组、生产商组等,那么在建立对应关系时,可以将待添加标签加入到某一个组内。
在本申请实施例中,在进行关联时,还可以采用以下方式:
S01,获取所述待添加标签中的名词前是否包含修饰词。
修饰词通常是指带有效果描述的词语,例如:纯天然蔬菜,这一词语中,“纯天然”就是修饰词,“蔬菜”是标签中的名词。
S02,当所述待添加标签中的名词前没有包含修饰词,将所述待添加标签标记所述搜索对象的正向关键词;
在本申请实施例中,如果标签仅仅是名词,例如:“苹果”、“猕猴桃”等,那么说明该标签没有过多修饰,可以认为该标签为正向关键词,这里正向是指可以提高搜索准确率的词语,而反向则指降低搜索准确性的词语,反向通常是过渡修饰了。
S03,当所述待添加标签中的名词前包含修饰词,判断所述修饰词是否为预设否定词语。
预设否定词语,可以为“不”、“不是”、“非”等词语,含有预设否定词语,可以认为和原名词的意思完全相反。
S04,当所述修饰词为预设否定词语时,将所述待添加标签标记所述搜索对象的负向关键词。
通过前述预设否定词语的描述,可以看到对于一些意思相反的词语,由于会导致搜索准确性降低,所以定义为负向关键词。
S05,当所述修饰词不为预设否定词语时,将所述待添加标签标记所述搜索对象的正向关键词。
通常情况下,如果标签中的修饰词里面没有否定词语,那么就可以认为该标签为正向关键词。
本申请实施例中提供的该方法,在对搜索对象的标签创建时,首先获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,最终,关联所述待添加标签与所述搜索对象。这使得在对搜索对象创建标签时,可以使得标签与搜索对象相关联,进而在后续利用标签对搜索对象进行搜索时,可以提高搜索的准确性。
例如:用户在网上商场上架一件新的食品时,除了按照网上商场要求提供商品的基础信息外,还可以对商品进行加标签,例如:可以增加新上市、无公害、绿色、环保、野生等等各种标签,如果针对这些标签不加以甄别或区分,那么很显然加标签的意义就不大了,因为加的标签比较混乱,进而导致搜索效率、准确性大大降低。
所以,在用户对食品进行加标签时,会将标签和食品的基础信息进行关联,只有关联度超过关联阈值时,才会将标签作为真正的标签与商品进行绑定或关联。
实施例二:
图4为本申请实施例提供的另一种搜索数据处理方法的流程图。
如图4所示,该方法可以包括以下步骤:
步骤S410,获取搜索对象的待添加标签。
步骤S420,获取所述搜索对象的已添加标签列表。
已添加标签列表是指用户在之前系统维护过程中,已经对搜索对象加上的标签,已添加标签的关联度可以认为较高,例如:根据用户提供的一些证明文件,在系统中录入的内容,或者,系统管理员根据商品的特征,筛查后录入的内容。
为了便于管理,通常当搜索对象陆续有一些确定的已添加标签后,可以将这些已添加标签放到一个数据表中进行维护,在该步骤中,可以直接读取该数据表即可获取到搜索镀锡的已添加标签列表。
步骤S430,计算所述待添加标签与所述已添加标签列表的相容性。
在本申请实施例中,相容性是指两个内容的接近程度或者相似程度,通常来说,相容性越高,两个标签所买描述的搜索对象就月接近,在具体应用中,相容性可以为1,然后根据差异大小,可以在0到1之间进行取值,当相容性为1时,可以认为两个标签是对同一个搜索对象的不同称呼。例如:标签1为“猕猴桃”,标签2为“奇异果”,就可以认为两个标签的相容性较高,可以认为是相等的。
在本申请一个实施例中,在计算相容性时,为了提高计算效率,可以采用以下方式:
方式一:
S11,判断所述已添加标签列表中标签的数量是否为零;
S12,当所述已添加标签列表中标签的数量为零时,确定所述待添加标签与所述已添加标列表的相容性为1。
在该方式中,如果某一个搜索对象还没有任何已添加标签,那么当有新标签时,就可以认为该新标签就是该搜索对象的标签。
方式二:
S21,判断所述已添加标签列表中标签的数量是否为零;
S22,当所述已添加标签列表中标签的数量不为零时,计算所述待添加标签中词语与已添加标签列表中每个标签中词语的子相容性;
S23,将值最小的子相容性作为所述待添加标签与所述已添加标列表的相容性。
由于已添加标签的数量有多个,在进行词语相容型比较时,待添加标签可能会与多个词语都较相似,为了提高后续搜索的准确性,所以在该步骤中,为了避免出现错误,首选将值最小的子相容性作为所述待添加标签与所述已添加标列表的相容性。
已添加标签列表中标签的数量不为零,表示该搜索对象之前已经有一些标签,进而在该步骤中,可以利用这些已经有的标签作为参考依据,进行相容性比较。具体方式为:提取出待添加标签中的词语,然后将已添加标签列中的标签中的词语提取出来,然后针对两个词语计算相容性作为子相容性。
步骤S440,将所述待添加标签与所述已添加标签列表的相容性作为所述关联度。
无论那种方式,都可以将相容性作为关联度,直接用来对搜索对象进行评价。在具体应用中,相容性最大为1,可以在0到1之间进行取值,对应的,关联度最大也可以为1,并且在0到1之间进行取值。
步骤S450,当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
实施例三:
图5为本申请实施例提供的另一种搜索数据处理方法的流程图。
如图5所示,该方法可以包括以下步骤:
步骤S510,获取搜索对象的待添加标签。
步骤S520,从所述搜索对象相对应的详细描述语句提取的关键词,组成关键词列表。
关键词是指搜索对象的基础信息中的词语,例如:搜索对象为商品时,关键词可以为该商品中使用说明书、厂家解说、产品介绍,甚至产品评测等等。
针对搜索对象而言,往往描述语句中不仅仅有一个关键词,所以,当有多个关键词时,还可以将关键词放到一个数据表中进行维护。
步骤S530,计算所述待添加标签与所述关键词列表的相容性。
由于每个搜索对象有一个或多个关键词,进而在对待添加标签进行判断时,可以将待添加标签中的词语提取出来,计算两个词语的相容性。
在本申请一个实施例中,在计算相容性时,为了提高计算效率,可以采用以下方式:
方式一:
S31,判断所述关键词列表中关键词的数量是否为零;
S32,当所述关键词列表中关键词的数量为零时,确定所述待添加标签与所述键词列表的相容性为1。
在该方式中,如果某一个搜索对象还没有任何关键词,那么当有新标签时,就可以认为该新标签就是该搜索对象的标签。
方式二:
S41,判断所述关键词列表中关键词的数量是否为零;
S42,当所述关键词列表中关键词的数量不为零时,计算所述待添加标签中词语与关键词列表中每个关键词中词语的子相容性;
S43,将值最小的子相容性作为所述待添加标签与所述关键词列表的相容性。
步骤S540,将所述待添加标签与所述关键词列表的相容性作为所述关联度。
无论那种方式,都可以将相容性作为关联度,直接用来对搜索对象进行评价。在具体应用中,相容性最大为1,可以在0到1之间进行取值,对应的,关联度最大也可以为1,并且在0到1之间进行取值。
步骤S550,当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
实施例四:
在本申请实施例中,在针对两个词语的相容性进行计算时,可以采用以下方式,
S51,获取所述待添加标签中词语的词性;
S52,提取所述已添加标签列表中标签的词语,或关键词列表中关键词中的词语,作为参考词语,并确定所述参考词语的词性为参考词性;
S53,判断所述待添加标签中词语的词性与所述参考词性是否相同;
S54,当所述待添加标签中词语的词性与所述参考词性相同时,计算所述待添加标签中词语在预设词语向量模型中的单词向量;
S55,计算所述参考词语在预设词语向量模型中的单词向量;计算两个单词向量之间的相似度;
S56,当所述相似度大于或等于第一相似度阈值时,将所述相似度作为所述待添加标签与参考词语的相容性;
S57,当所述相似度小于或等于第二相似度阈值时,将所述相似度与1的差值作为所述待添加标签与参考词语的相容性,所述第一相似度阈值大于第二相似度阈值;
S58,当所述相似度位于所述相似度阈值之间时,将所述相似度作为所述待添加标签与参考词语的相容性。
在本申请另一实施例中,当所述待添加标签中词语的词性与所述参考词性不相同时,所述方法还包括:关联所述待添加标签与所述搜索对象。也即,此时待添加标签和已有的标签完全不同,进而可以作为新的标签进行添加。
实施例五:
前述实施例一至实施例五描述的均为如何对搜索对象进行增加标签的过程,增加的标签是为了后续对搜索对象进行搜索,为此,本实施例提供一种搜索数据处理方法,用于对搜索对象进行搜索。
本实施例的执行主体可以是上述的移动终端,也可以是预设的服务器。图6为本申请实施例提供的一种搜索数据处理方法的流程图。
如图6所示,该搜索数据处理方法可以包括以下步骤:
步骤S610,获取搜索关键词。
搜索关键词,可以为用户在浏览网络时在搜索栏所输入的词语,例如:用户在打开淘宝网站后,在搜索栏会输入想要浏览的商品,此时搜索栏中输入的内容就是搜索关键词。另外,为了便于对网站的商品进行分类,网站也会在左侧或顶部设置一些搜索分类,例如:食品、日用品、衣服、汽车用品等,用户可以点击这些分类的名词,跳转到相关类别商品所在的页面,此时,搜索关键词还可以为用户点击的这些分类名称。
此外,搜索关键词还可以为用户的历史浏览记录或购买记录中的商品名称,例如:当网站向用户推荐商品时,可以根据用户的历史浏览记录或购买记录中的商品名称,提取出一些词语作为搜索关键词,这样,当用户再次打开购物网站时,就可以直接根据这些提取到的搜索关键词,在后台进行搜索。
步骤S620,查找与所述搜索关键词相对应的待搜索对象。
当确定搜索关键词后,可以将所有和该搜索关键词相对应或相关联的对象都作为待搜索对象,例如:当用户在购物网站搜索“茂谷柑”时,所有包含有“茂谷柑”的商品,都可以作为待搜索对象,其中不仅包含仅有“茂谷柑”的商品,而且还包括“比茂谷柑还甜”,以及“非茂谷柑”等打擦边球的商品。
待搜索对象是一个初步的大集合,目的是将所有和搜索关键词有关系的对象都搜集到,虽然这个初步的集合中可能包含一些错误的或不准确的信息,那可以在后续的步骤中再进一步精确找到。
步骤S630,获取所述待搜索对象的标签列表。
参见前述实施例一至实施例四任意一个实施例所述的方法,由于已经预先给每个搜索对象添加了标签,并且这些标签可以以列表形式存储,并与搜索对象相关联。所以,在该步骤中,就可以直接读取每个搜索对象关联的标签列表。
步骤S640,根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度。
在本申请实施例中,由于已经获取到搜索关键词和标签列表,所以在确定待搜索对象与所述搜索关键词的匹配度,实际上就是接利用搜索关键词和标签列表中的标签进行匹配。
在本申请实施例中,由于每个待搜索对象都有设定好的标签列表,所以在用户进行搜索时,以搜索关键词为线索,可以先找到待搜索对象,然后再找到待搜索对象的标签列表,将搜索关键词和标签列表中的标签进行匹配,进而确定出待搜索对象与搜索关键词的匹配度,提高搜索的准确性。
在本申请一个实施例中,前述步骤S640还可以包括以下步骤:
S6411,获取所述标签列表中的正属性标签;
参见前述实施例一中的描述,正向关键词所对应的标签可以看做正属性标签。通常情况下正属性标签有两类,一种是叙述事实,例如:商品规格、重量、尺寸等,另一种是非否定性的描述,例如:纯天然、绿色等。与正属性标签相对应的是负属性标签,负属性标签通常是包含有否定性描述的,例如:非皇帝柑等,通过利用反向标签,想提高用户的吸引力。
S412,计算所述搜索关键词与所有正属性标签的第一匹配值;
S6413,将所述第一匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
在本申请另一实施例中,前述步骤S640还可以包括以下步骤:
S6421,获取所述标签列表中的正属性标签和负属性标签。
S6422,计算所述搜索关键词与所有正属性标签的第一匹配值;计算所述搜索关键词与所有负属性标签的第二匹配值。
S6423,根据所述第一匹配值和第二匹配值计算第三匹配值。
在本申请实施例中,在计算第三匹配值时,可以采用以下方式,对第一匹配值和第二匹配值,分别赋予不同的权重,然后在计算时,直接将第一匹配值乘以第一权重值,第二匹配值乘以第二权重值,并最终将两个乘积相加。其中,在设置权重值时,可以设置为与正属性标签对应的第一匹配值越大,第一权重值越高,相反,第一匹配值越小,第一权重值越低。而对于与负属性标签的第二匹配值,当第二匹配值越高,第二权重值越低,相反,第二匹配值越小,第二权重值越高。
S6424,将所述第三匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
实施例六:
在上述实施例五的基础上,本申请实施例还可以包括以下步骤:
S650,展示所有待搜索对象,并且在所述待搜索对象展示时标记所述匹配度。
当用户输入搜索关键词后,最终是需要给客户展示搜索对象,以便用户进行购买、选择或其它后续操作。但展示搜索对象时,需要将前面实施例五中的匹配度的信息加进去,以供用户参考。
为此,在本申请实施例中,在展示待搜索对象时,是展示全部的待搜索对象,为了便于用户区分,在展示每个待搜索对象时,在待搜索对象上标记匹配度。
匹配度在标记时,可以直接在商品上显示,例如:商品是图片,匹配度可以直接叠加到图片上,也可以在商品旁边进行显示,例如:在图片的周围以列表或图标等形式展示匹配度。
实施例七:
在上述实施例六中,虽然对在展示待搜索对象时标记了匹配度,但匹配度较差的待搜索对象仍然会显示,进而用户有可能还会在不注意的情况下,选择这些匹配度较差的待搜索对象。
为此,在实施例五的基础上,本申请实施例还可以包括以下步骤:
S660,判断匹配度是否大于匹配度阈值。
匹配度阈值可以由网站或网上商城的工作人员来设定,另外,也可以由用户来设置。
S670,若所述匹配度大于匹配度阈值,展示所述待搜索对象。
S680,若所述匹配度不大于匹配度阈值,不展示所述待搜索对象
匹配度阈值是关系到最终搜索结果的准确性高低,当匹配度较高时,最后得到的待搜索对象的数量较少,但搜索的准确性大大提高,而当匹配度较低时,最终得到的搜索对象的数量较多,相应地搜索的准确性也有些降低,但整体上搜索的准确性还是比现有技术要高。
实施例八
本申请实施例提供一种搜索数据处理设备,如图7所示,可以包括:处理器701、存储器702、通信接口703和总线704;
其中,所述处理器701、存储器702、通信接口703通过所述总线704完成相互间的通信;
所述通信接口703用于外部设备之间的信息传输;所述外部设备例如为用户设备UE;
所述处理器701用于调用所述存储器702中的程序指令,以执行如实施例一至实施例四所述的搜索数据处理方法。
具体而言,所述处理器用于执行存储器中存储的搜索数据处理程序,以实现以下步骤:获取搜索对象的待添加标签;确定所述待添加标签与所述搜索对象的关联度;当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
可选地,所述确定所述待添加标签与所述搜索对象的关联度,包括:获取所述搜索对象的已添加标签列表;计算所述待添加标签与所述已添加标签列表的相容性;将所述待添加标签与所述已添加标签列表的相容性作为所述关联度。
可选地,所述计算所述待添加标签与所述已添加标签列表的相容性,包括:判断所述已添加标签列表中标签的数量是否为零;当所述已添加标签列表中标签的数量为零时,确定所述待添加标签与所述已添加标列表的相容性为1;或者,当所述已添加标签列表中标签的数量不为零时,计算所述待添加标签中词语与已添加标签列表中每个标签中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述已添加标列表的相容性。
可选地,所述确定所述待添加标签与所述搜索对象的关联度,包括:从所述搜索对象相对应的详细描述语句提取的关键词,组成关键词列表;计算所述待添加标签与所述关键词列表的相容性;将所述待添加标签与所述关键词列表的相容性作为所述关联度。
可选地,所述计算所述待添加标签与所述关键词列表的相容性,包括:判断所述关键词列表中关键词的数量是否为零;当所述关键词列表中关键词的数量为零时,确定所述待添加标签与所述键词列表的相容性为1;或者,当所述关键词列表中关键词的数量不为零时,计算所述待添加标签中词语与关键词列表中每个关键词中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述关键词列表的相容性。
可选地,所述计算所述待添加标签与词语的子相容性,包括:获取所述待添加标签中词语的词性;提取所述已添加标签列表中标签的词语,或关键词列表中关键词中的词语,作为参考词语,并确定所述参考词语的词性为参考词性;判断所述待添加标签中词语的词性与所述参考词性是否相同;当所述待添加标签中词语的词性与所述参考词性相同时,计算所述待添加标签中词语在预设词语向量模型中的单词向量;计算所述参考词语在预设词语向量模型中的单词向量;计算两个单词向量之间的相似度;当所述相似度大于或等于第一相似度阈值时,将所述相似度作为所述待添加标签与参考词语的相容性;当所述相似度小于或等于第二相似度阈值时,将所述相似度与1的差值作为所述待添加标签与参考词语的相容性,所述第一相似度阈值大于第二相似度阈值;当所述相似度位于所述相似度阈值之间时,将所述相似度作为所述待添加标签与参考词语的相容性。
可选地,当所述待添加标签中词语的词性与所述参考词性不相同时,所述方法还包括:关联所述待添加标签与所述搜索对象。
可选地,所述关联所述待添加标签与所述搜索对象,包括:获取所述待添加标签中的名词前是否包含修饰词;当所述待添加标签中的名词前没有包含修饰词,将所述待添加标签标记所述搜索对象的正向关键词;当所述待添加标签中的名词前包含修饰词,判断所述修饰词是否为预设否定词语;当所述修饰词为预设否定词语时,将所述待添加标签标记所述搜索对象的负向关键词,当所述修饰词不为预设否定词语时,将所述待添加标签标记所述搜索对象的正向关键词。
实施例九:
本申请实施例提供一种搜索数据处理设备,如图8所示,可以包括:处理器801、存储器802、通信接口803和总线804;
其中,所述处理器801、存储器802、通信接口803通过所述总线804完成相互间的通信;
所述通信接口803用于外部设备之间的信息传输;所述外部设备例如为用户设备UE;
所述处理器801用于调用所述存储器802中的程序指令,以执行如实施例五至实施例七所提供搜索数据处理方法。
具体而言,所述处理器用于执行存储器中存储的搜索数据处理程序,以实现以下步骤:获取搜索关键词;查找与所述搜索关键词相对应的待搜索对象;获取所述待搜索对象的标签列表;根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度。
可选地,所述方法还包括:展示所有待搜索对象,并且在所述待搜索对象展示时标记所述匹配度;或者,判断匹配度是否大于匹配度阈值;若所述匹配度大于匹配度阈值,展示所述待搜索对象;若所述匹配度不大于匹配度阈值,不展示所述待搜索对象。
可选地,所述根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度,包括:获取所述标签列表中的正属性标签;计算所述搜索关键词与所有正属性标签的第一匹配值;将所述第一匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
可选地,所述根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度,包括:获取所述标签列表中的正属性标签和负属性标签;计算所述搜索关键词与所有正属性标签的第一匹配值;计算所述搜索关键词与所有负属性标签的第二匹配值;根据所述第一匹配值和第二匹配值计算第三匹配值;将所述第三匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
实施例十:
本申请提供了一种计算机可存储介质。这里的计算机可存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当计算机可存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述实施例一至实施例四所述的搜索数据处理方法。
实施例十一:
本申请提供了一种计算机可存储介质。这里的计算机可存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当计算机可存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述实施例五至实施例七所述的搜索数据处理方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种搜索数据处理方法,其特征在于,包括:
获取搜索对象的待添加标签;
确定所述待添加标签与所述搜索对象的关联度;
当所述待添加标签与所述搜索对象的关联度超过关联阈值时,关联所述待添加标签与所述搜索对象。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待添加标签与所述搜索对象的关联度,包括:
获取所述搜索对象的已添加标签列表;
计算所述待添加标签与所述已添加标签列表的相容性;
将所述待添加标签与所述已添加标签列表的相容性作为所述关联度。
3.根据权利要求2所述的方法,其特征在于,所述计算所述待添加标签与所述已添加标签列表的相容性,包括:
判断所述已添加标签列表中标签的数量是否为零;
当所述已添加标签列表中标签的数量为零时,确定所述待添加标签与所述已添加标列表的相容性为1;
或者,
当所述已添加标签列表中标签的数量不为零时,计算所述待添加标签中词语与已添加标签列表中每个标签中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述已添加标列表的相容性。
4.根据权利要求1所述的方法,其特征在于,所述确定所述待添加标签与所述搜索对象的关联度,包括:
从所述搜索对象相对应的详细描述语句提取的关键词,组成关键词列表;
计算所述待添加标签与所述关键词列表的相容性;
将所述待添加标签与所述关键词列表的相容性作为所述关联度。
5.根据权利要求4所述的方法,其特征在于,所述计算所述待添加标签与所述关键词列表的相容性,包括:
判断所述关键词列表中关键词的数量是否为零;
当所述关键词列表中关键词的数量为零时,确定所述待添加标签与所述键词列表的相容性为1;
或者,
当所述关键词列表中关键词的数量不为零时,计算所述待添加标签中词语与关键词列表中每个关键词中词语的子相容性;将值最小的子相容性作为所述待添加标签与所述关键词列表的相容性。
6.根据权利要求3或5所述的方法,其特征在于,所述计算所述待添加标签与词语的子相容性,包括:
获取所述待添加标签中词语的词性;
提取所述已添加标签列表中标签的词语,或关键词列表中关键词中的词语,作为参考词语,并确定所述参考词语的词性为参考词性;
判断所述待添加标签中词语的词性与所述参考词性是否相同;
当所述待添加标签中词语的词性与所述参考词性相同时,计算所述待添加标签中词语在预设词语向量模型中的单词向量;计算所述参考词语在预设词语向量模型中的单词向量;计算两个单词向量之间的相似度;当所述相似度大于或等于第一相似度阈值时,将所述相似度作为所述待添加标签与参考词语的相容性;当所述相似度小于或等于第二相似度阈值时,将所述相似度与1的差值作为所述待添加标签与参考词语的相容性,所述第一相似度阈值大于第二相似度阈值;当所述相似度位于所述相似度阈值之间时,将所述相似度作为所述待添加标签与参考词语的相容性。
7.根据权利要求6所述的方法,其特征在于,当所述待添加标签中词语的词性与所述参考词性不相同时,所述方法还包括:
关联所述待添加标签与所述搜索对象。
8.根据权利要求1所述的方法,其特征在于,所述关联所述待添加标签与所述搜索对象,包括:
获取所述待添加标签中的名词前是否包含修饰词;
当所述待添加标签中的名词前没有包含修饰词,将所述待添加标签标记所述搜索对象的正向关键词;
当所述待添加标签中的名词前包含修饰词,判断所述修饰词是否为预设否定词语;当所述修饰词为预设否定词语时,将所述待添加标签标记所述搜索对象的负向关键词,当所述修饰词不为预设否定词语时,将所述待添加标签标记所述搜索对象的正向关键词。
9.一种搜索数据处理方法,其特征在于,包括:
获取搜索关键词;
查找与所述搜索关键词相对应的待搜索对象;
获取所述待搜索对象的标签列表;
根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
展示所有待搜索对象,并且在所述待搜索对象展示时标记所述匹配度;
或者,
判断匹配度是否大于匹配度阈值;若所述匹配度大于匹配度阈值,展示所述待搜索对象;若所述匹配度不大于匹配度阈值,不展示所述待搜索对象。
11.根据权利要求9所述的方法,其特征在于,所述根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度,包括:
获取所述标签列表中的正属性标签;
计算所述搜索关键词与所有正属性标签的第一匹配值;
将所述第一匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
12.根据权利要求9所述的方法,其特征在于,所述根据所述搜索关键词和所述标签列表,确定所述待搜索对象与所述搜索关键词的匹配度,包括:
获取所述标签列表中的正属性标签和负属性标签;
计算所述搜索关键词与所有正属性标签的第一匹配值;计算所述搜索关键词与所有负属性标签的第二匹配值;
根据所述第一匹配值和第二匹配值计算第三匹配值;
将所述第三匹配值作为所述待搜索对象与所述搜索关键词的匹配度。
13.一种搜索数据处理设备,其特征在于,包括:处理器和存储器;
其中,所述处理器用于调用所述存储器中的程序指令,以执行所述权利要求1-8任一项所述搜索数据处理方法。
14.一种搜索数据处理设备,其特征在于,包括:处理器和存储器;
其中,所述处理器用于调用所述存储器中的程序指令,以执行所述权利要求9-12任一项所述搜索数据处理方法。
15.一种计算机可存储介质,其特征在于,所述计算机可存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述权利要求1-8任一项所述搜索数据处理方法。
16.一种计算机可存储介质,其特征在于,所述计算机可存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述权利要求9-12任一项所述搜索数据处理方法。
CN201810571775.2A 2018-05-29 2018-05-29 一种搜索数据处理方法、设备及计算机可读存储介质 Active CN108829800B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810571775.2A CN108829800B (zh) 2018-05-29 2018-05-29 一种搜索数据处理方法、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810571775.2A CN108829800B (zh) 2018-05-29 2018-05-29 一种搜索数据处理方法、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108829800A true CN108829800A (zh) 2018-11-16
CN108829800B CN108829800B (zh) 2021-11-16

Family

ID=64144134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810571775.2A Active CN108829800B (zh) 2018-05-29 2018-05-29 一种搜索数据处理方法、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108829800B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902100A (zh) * 2019-01-31 2019-06-18 平安科技(深圳)有限公司 报表查询方法、装置及存储介质
CN110222252A (zh) * 2019-06-14 2019-09-10 宜春宜联科技有限公司 信息检索方法、装置和设备
CN110222709A (zh) * 2019-04-29 2019-09-10 上海暖哇科技有限公司 一种多标签智能打标方法及系统
CN110764726A (zh) * 2019-10-18 2020-02-07 网易(杭州)网络有限公司 目标对象的确定方法及装置、终端设备、存储介质
CN111259058A (zh) * 2020-01-16 2020-06-09 北京百度网讯科技有限公司 数据挖掘方法、数据挖掘装置和电子设备
CN111353071A (zh) * 2018-12-05 2020-06-30 阿里巴巴集团控股有限公司 标签生成方法及装置
CN111611429A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 数据标注方法、装置、电子设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751405A (zh) * 2008-12-12 2010-06-23 国际商业机器公司 用于搜索文档的方法和系统
CN102693248A (zh) * 2011-04-14 2012-09-26 天脉聚源(北京)传媒科技有限公司 一种搜索网络信息的方法和系统
CN103177093A (zh) * 2013-03-13 2013-06-26 北京开心人信息技术有限公司 一种基于对象标签的通用推荐方法及系统
CN104462471A (zh) * 2014-12-17 2015-03-25 北京奇虎科技有限公司 提供细分搜索结果的方法和装置
CN105956008A (zh) * 2016-04-21 2016-09-21 深圳市金立通信设备有限公司 一种图片管理方法及终端
CN106886541A (zh) * 2015-12-16 2017-06-23 北京搜狗科技发展有限公司 一种数据搜索方法、装置以及一种用于数据搜索的装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751405A (zh) * 2008-12-12 2010-06-23 国际商业机器公司 用于搜索文档的方法和系统
CN102693248A (zh) * 2011-04-14 2012-09-26 天脉聚源(北京)传媒科技有限公司 一种搜索网络信息的方法和系统
CN103177093A (zh) * 2013-03-13 2013-06-26 北京开心人信息技术有限公司 一种基于对象标签的通用推荐方法及系统
CN104462471A (zh) * 2014-12-17 2015-03-25 北京奇虎科技有限公司 提供细分搜索结果的方法和装置
CN106886541A (zh) * 2015-12-16 2017-06-23 北京搜狗科技发展有限公司 一种数据搜索方法、装置以及一种用于数据搜索的装置
CN105956008A (zh) * 2016-04-21 2016-09-21 深圳市金立通信设备有限公司 一种图片管理方法及终端

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353071A (zh) * 2018-12-05 2020-06-30 阿里巴巴集团控股有限公司 标签生成方法及装置
CN109902100A (zh) * 2019-01-31 2019-06-18 平安科技(深圳)有限公司 报表查询方法、装置及存储介质
CN111611429A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 数据标注方法、装置、电子设备及计算机可读存储介质
CN111611429B (zh) * 2019-02-25 2023-05-12 北京嘀嘀无限科技发展有限公司 数据标注方法、装置、电子设备及计算机可读存储介质
CN110222709A (zh) * 2019-04-29 2019-09-10 上海暖哇科技有限公司 一种多标签智能打标方法及系统
CN110222709B (zh) * 2019-04-29 2022-01-25 上海暖哇科技有限公司 一种多标签智能打标方法及系统
CN110222252A (zh) * 2019-06-14 2019-09-10 宜春宜联科技有限公司 信息检索方法、装置和设备
CN110764726A (zh) * 2019-10-18 2020-02-07 网易(杭州)网络有限公司 目标对象的确定方法及装置、终端设备、存储介质
CN110764726B (zh) * 2019-10-18 2023-08-22 网易(杭州)网络有限公司 目标对象的确定方法及装置、终端设备、存储介质
CN111259058A (zh) * 2020-01-16 2020-06-09 北京百度网讯科技有限公司 数据挖掘方法、数据挖掘装置和电子设备
CN111259058B (zh) * 2020-01-16 2023-09-15 北京百度网讯科技有限公司 数据挖掘方法、数据挖掘装置和电子设备

Also Published As

Publication number Publication date
CN108829800B (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN108829800A (zh) 一种搜索数据处理方法、设备及计算机可读存储介质
CN101604521B (zh) 移动终端和用于识别其语音的方法
US20190294306A1 (en) Method and device for displaying application function information, and terminal
US8326354B2 (en) Portable terminal for explaining information of wine and control method thereof
CN104917896A (zh) 一种推送数据的方法和终端设备
CN104808945B (zh) 虚拟按键的显示方法及装置
CN106990889A (zh) 一种快捷操作实现方法及装置
CN106331145A (zh) 一种信息推荐方法、设备和系统
CN104809221A (zh) 音乐信息的推荐方法及装置
CN106682964A (zh) 一种确定应用标签的方法和装置
CN104766604A (zh) 语音数据的标记方法及装置
CN106504050A (zh) 一种信息比对装置及方法
CN108492836A (zh) 一种基于语音的搜索方法、移动终端及存储介质
CN108363817A (zh) 文件处理方法、装置、移动终端及计算机可读存储介质
CN106909681A (zh) 一种信息处理方法及其装置
CN106776906A (zh) 一种应用聚类方法及装置
CN106372607A (zh) 一种从视频中提取图片的方法及移动终端
CN105096962B (zh) 一种信息处理方法及终端
CN106024013A (zh) 语音数据搜索方法及系统
CN108829267A (zh) 一种词汇推荐方法、设备及计算机可存储介质
CN106469221A (zh) 图片查找方法、装置及终端
CN104915230B (zh) 应用控制方法及装置
CN105681604A (zh) 一种短信显示方法和装置
CN106487976B (zh) 移动终端拨号装置和方法
CN107220109A (zh) 一种界面显示的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant