CN103366003B - 基于用户反馈优化搜索结果的方法和设备 - Google Patents

基于用户反馈优化搜索结果的方法和设备 Download PDF

Info

Publication number
CN103366003B
CN103366003B CN201310304681.6A CN201310304681A CN103366003B CN 103366003 B CN103366003 B CN 103366003B CN 201310304681 A CN201310304681 A CN 201310304681A CN 103366003 B CN103366003 B CN 103366003B
Authority
CN
China
Prior art keywords
search results
user
feature
search
feedback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310304681.6A
Other languages
English (en)
Other versions
CN103366003A (zh
Inventor
殷磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310304681.6A priority Critical patent/CN103366003B/zh
Publication of CN103366003A publication Critical patent/CN103366003A/zh
Application granted granted Critical
Publication of CN103366003B publication Critical patent/CN103366003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

提供了一种基于用户反馈优化搜索结果的方法和设备。所述方法包括从客户端接收搜索词;根据搜索词进行搜索来获得搜索结果,并将搜索结果发送到客户端;从客户端接收用户对搜索结果的反馈列表;基于反馈列表中的反馈结果,修正搜索词;将修正的搜索词发送到客户端。根据本发明的方法和设备,可获得更加符合用户搜索意图的修正的搜索词,从而根据修正的搜索词能更有效地获得更准确的搜索结果。

Description

基于用户反馈优化搜索结果的方法和设备
技术领域
本发明涉及搜索引擎领域,更具体地说,涉及一种基于用户反馈来优化搜索结果的方法和设备。
背景技术
近年来,随着互联网技术的迅速发展,人们使用互联网搜索期望的数据也成为获取知识的重要途径。如何能够为用户提供更精确的搜索结果也成为搜索引擎开发商的重点研究课题之一。
现有的搜索引擎(包括移动终端上的搜索引擎)通常都是针对用户输入的搜索词直接给出搜索结果。当用户的搜索词有字面表达错误时,搜索引擎会根据当前词库对搜索词进行修正。例如,当用户搜索“大连猫”时,搜索引擎会根据词库提示将“大连猫”修正为“大脸猫”。这样得到的搜索结果更符合用户的真实需求。
然而,用户搜索词的不准确性往往不体现在字面错误上。例如,有些搜索词不符合用户要表达的意思,或者有些搜索词不符合搜索引擎的搜索词标准。这样当前的搜索引擎就无法确定用户的真实意图,这种情况下搜索结果很难满足用户需求。因此,如何让搜索引擎“明白”用户的真正意图是搜索结果是否能满足用户需求的关键。只有搜索引擎与用户进行交互才能让搜索引擎“明白”用户的真正意图。
目前,少数搜索引擎可以接收用户对搜索结果的反馈,并根据用户反馈,来优化搜索结果或优化搜索结果的排序。但是优化搜索结果的基础仍是原始输入的不符合用户意图或不符合搜索词标准的搜索词。这样,优化效率不高,优化结果也不够准确。
因此,需要一种基于用户反馈更有效更准确地优化搜索结果的方法和设备。
发明内容
提供本发明是为了至少解决上述问题,并至少提供以下优点。
本发明的一方面在于提供一种基于用户反馈优化搜索结果的方法和设备,所述方法和设备通过基于用户对搜索结果的反馈对从搜索结果提取的特征进行深度学习,获得更加符合用户搜索意图的修正的搜索词。
本发明的另一方面在于提供一种通过用户手势来输入用户反馈的方法,所述方法使用户能更方便地进行反馈。
本发明的另一方面在于提供一种选择是否使用修正的搜索词进行重新搜索的方法,使用户能根据自己的搜索意图获得更准确的搜索结果。
根据本发明的一方面,一种基于用户反馈优化搜索结果的方法,所述方法包括:从客户端接收搜索词;根据搜索词进行搜索来获得搜索结果,并将搜索结果发送到客户端;从客户端接收用户对搜索结果的反馈列表;基于反馈列表中的反馈结果,修正搜索词;将修正的搜索词发送到客户端。
用户对搜索结果的反馈可包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个。
所述反馈列表可包括搜索结果的标识符和用户对搜索结果的反馈值。
修正搜索词的步骤可包括:针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征;针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征;从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词。
特征分析的步骤可包括:(1)使用词频-反文档频率(TF-IDF)方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征;(2)根据基本特征的类型确定不同类型的网页样本库;(3)从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重;(4)分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征;(5)将学习到的高级特征作为基本特征,重复步骤(2)和(3);(6)针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大于第二预定值;(7)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值,则将最后学习到的高级特征作为特征分析结果;(8)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值,则从步骤(4)开始继续执行。
所述方法还可包括:从客户端接收是否根据修正的搜索词重新搜索的指令;如果接收到根据修正的搜索词重新搜索的指令,则根据修正的搜索词进行搜索来获得新的搜索结果,并将新的搜索结果发送到客户端;如果接收到不根据修正的搜索词重新搜索的指令,则根据反馈列表中的反馈结果对搜索结果进行重新排序,并将重新排序的搜索结果发送到客户端。
根据本发明的另一方面,提供了一种搜索方法,所述方法包括:接收用户输入的搜索词,将接收到的搜索词发送到服务器端;从服务器端接收搜索结果,并显示接收到的搜索结果;接收表示用户对各条搜索结果的反馈的用户手势;根据用户的反馈产生反馈列表;接收用户输入的用于发送产生的反馈列表的指令;将产生的反馈列表发送到服务器端;从服务器端接收修正的搜索词。
用户对各条搜索结果的反馈可包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个。
所述用户手势可以是客户端默认手势或由用户自定义的手势。
在搜索结果上从左向右快速划过的用户手势可表示用户对该搜索结果满意;在搜索结果上从右向左快速划过的用户手势表示用户对该搜索结果不满意。
所述反馈列表可包括所述各条搜索结果的标识符和用户对所述各条搜索结果的反馈值。
用户输入的用于发送产生的反馈列表的指令可以是用户在搜索结果显示页面中的翻页指令。
所述方法还可包括:选择是否根据修正的搜索词重新搜索并将选择结果发送到服务器端;如果选择根据修正的搜索词重新搜索,则从服务器端接收根据修正的搜索词重新搜索的新的搜索结果;如果选择不根据修正的搜索词重新搜索,则从服务器端接收根据用户的反馈重新排列顺序的搜索结果。
根据本发明的另一方面,提供了一种基于用户反馈优化搜索结果的设备,所述设备包括:接收单元,从客户端接收搜索词或用户对搜索结果的反馈列表;搜索单元,根据搜索词进行搜索来获得搜索结果;修正单元,基于反馈列表中的反馈结果,修正搜索词;发送单元,将搜索结果或修正的搜索词发送到客户端。
用户对搜索结果的反馈可包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个。
所述反馈列表可包括搜索结果的标识符和用户对搜索结果的反馈值。
修正单元可包括:特征分析单元,针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征,针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征;去除单元,从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词。
特征分析单元可通过执行以下步骤来进行特征分析:(1)使用词频-反文档频率(TF-IDF)方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征;(2)根据基本特征的类型确定不同类型的网页样本库;(3)从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重;(4)分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征;(5)将学习到的高级特征作为基本特征,重复步骤(2)和(3);(6)针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大于第二预定值;(7)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值,则将最后学习到的高级特征作为特征分析结果;(8)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值,则从步骤(4)开始继续执行。
所述设备还可包括:排序单元,根据反馈列表中的反馈结果对搜索结果进行重新排序;其中,接收单元从客户端接收是否根据修正的搜索词重新搜索的指令,如果接收单元接收到根据修正的搜索词重新搜索的指令,则搜索单元根据修正的搜索词进行搜索来获得新的搜索结果,并且发送单元将新的搜索结果发送到客户端;如果接收单元接收到不根据修正的搜索词重新搜索的指令,则排序单元根据反馈列表中的反馈结果对搜索结果进行重新排序,并且发送单元将重新排序的搜索结果发送到客户端。
根据本发明的另一方面,提供了一种搜索设备,所述设备包括:第一接收单元,从用户接收用户输入的搜索词、表示用户对各条搜索结果的反馈的用户手势或用户输入的用于发送反馈列表的指令;第二接收单元,从服务器端接收搜索结果或修正的搜索词;显示单元,显示接收到的搜索结果;列表产生单元,根据用户的反馈产生反馈列表;发送单元,将用户输入的搜索词或产生的反馈列表发送到服务器端。
用户对各条搜索结果的反馈可包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个。
所述用户手势可以是客户端默认手势或由用户自定义的手势。
在搜索结果上从左向右快速划过的用户手势可表示用户对该搜索结果满意;在搜索结果上从右向左快速划过的用户手势可表示用户对该搜索结果不满意。
所述反馈列表可包括所述各条搜索结果的标识符和用户对所述各条搜索结果的反馈值。
用户输入的用于发送产生的反馈列表的指令可以是用户在搜索结果显示页面中的翻页指令。
所述设备还可包括:选择单元,选择是否根据修正的搜索词重新搜索;其中,发送单元将选择结果发送到服务器端,如果选择单元选择根据修正的搜索词重新搜索,则第二接收单元从服务器端接收根据修正的搜索词重新搜索的新的搜索结果;如果选择单元选择不根据修正的搜索词重新搜索,则第二接收单元从服务器端接收根据用户的反馈重新排列顺序的搜索结果。
根据本发明的方法和设备,可获得更加符合用户搜索意图的修正的搜索词,从而根据修正的搜索词能更有效地获得更准确的搜索结果。此外,根据本发明的方法和设备,可使用户能更方便地进行反馈,提高了用户体验。此外,根据本发明的方法和设备,可使用户能根据自己的搜索意图获得更准确的搜索结果。
附图说明
通过结合附图,从实施例的下面描述中,本发明这些和/或其它方面及优点将会变得清楚,并且更易于理解,其中:
图1是根据本发明的示例性实施例的搜索设备和基于用户反馈优化搜索结果的设备的框图;
图2示出根据本发明的示例性实施例的反馈列表的示例;
图3是根据本发明的示例性实施例的特征分析示例的示图;
图4是根据本发明的示例性实施例的基于用户反馈优化搜索结果的方法的流程图;
图5是根据本发明的示例性实施例的特征分析方法的流程图。
具体实施方式
提供参照附图的以下描述以帮助对由权利要求及其等同物限定的本发明的实施例的全面理解。包括各种特定细节以帮助理解,但这些细节仅被视为是示例性的。因此,本领域的普通技术人员将认识到在不脱离本发明的范围和精神的情况下,可对描述于此的实施例进行各种改变和修改。此外,为了清楚和简洁,省略对公知的功能和结构的描述。
图1是根据本发明的示例性实施例的搜索设备100和基于用户反馈优化搜索结果的设备200的框图。本领域的技术人员容易理解,可通过移动终端(例如,智能电话、平板电脑等)或固定终端(例如,台式计算机等)来实现搜索设备100,可通过服务器(例如,搜索引擎)等来实现基于用户反馈优化搜索结果的设备200。下面,以移动终端作为搜索设备100,服务器作为基于用户反馈优化搜索结果的设备200为例来描述本发明,但本领域的技术人员容易理解,本发明不限于移动终端和服务器。
参照图1,移动终端100可包括第一接收单元110、发送单元120、第二接收单元130、显示单元140、列表产生单元150。服务器200可包括接收单元210、搜索单元220、发送单元230、修正单元240。
移动终端100的第一接收单元110可从用户接收用户输入的搜索词。在移动终端100的屏幕是触摸屏的情况下,可使用触摸屏来实现移动终端100的第一接收单元110。下面,使用触摸屏作为移动终端100的第一接收单元110为例来说明本发明。本领域的技术人员容易理解,移动终端100的第一接收单元110不限于触摸屏,例如可以是按钮等。
当移动终端100的第一接收单元110接收到用户输入的搜索词时,移动终端100的发送单元120可将用户输入的搜索词发送到服务器200。
服务器200的接收单元210接收从移动终端100发送的搜索词。
当服务器200的接收单元210接收到搜索词时,服务器200的搜索单元220根据接收到的搜索词进行搜索来获得搜索结果。
当服务器200的搜索单元220获得搜索结果时,服务器200的发送单元230将获得的搜索结果发送到移动终端100。
移动终端100的第二接收单元130从服务器200接收搜索结果。
当移动终端100的第二接收单元130接收到搜索结果时,移动终端100的显示单元140显示接收到的搜索结果。
用户可在查看搜索结果时在搜索结果显示页面上输入对各条搜索结果的反馈。例如,当某条搜索结果符合用户的搜索意图时,用户可输入对该条搜索结果表示满意的反馈,当某条搜索结果不符合用户的搜索意图时,用户可输入对该条搜索结果表示不满意的反馈。
本领域的技术人员容易理解,用户可通过多种方式输入对各条搜索结果的反馈。例如,在移动终端100的屏幕是触摸屏的情况下,用户可通过在搜索结果显示页面上的各种搜索结果处输入用户手势来输入对各种搜索结果的反馈。
本领域的技术人员容易理解,用户手势可以是客户端默认手势或由用户自定义的手势。例如,在搜索结果上从左向右快速划过的用户手势表示用户对该搜索结果满意;在搜索结果上从右向左快速划过的用户手势表示用户对该搜索结果不满意。
移动终端100的第一接收单元110可接收用户输入的表示用户对各条搜索结果的反馈。在示例性实施例中,移动终端100的第一接收单元110可接收用户输入的表示用户对各条搜索结果的反馈的用户手势。
当移动终端100的第一接收单元110接收到表示用户对各条搜索结果的反馈的用户手势时,移动终端100的列表产生单元150可根据用户的反馈产生反馈列表。这里,反馈列表可包括所述各条搜索结果的标识符和用户对所述各条搜索结果的反馈值。例如,所述各条搜索结果的标识符可以是各种搜索结果的ID或概要,用户对所述各条搜索结果的反馈值可以是0或1,其中,0表示用户对搜索结果表示不满意,1表示用户对搜索结果表示满意。
如图2所示,图2示出根据本发明的示例性实施例的反馈列表的示例。在图2示出的反馈列表中,用户对第一条搜索结果(ID为1)表示不满意,因此第一条搜索结果所对应的反馈值为0,用户对第二条搜索结果(ID为2)表示满意,因此第二条搜索结果所对应的反馈值为1,以此类推。
返回参照图1,当移动终端100的第一接收单元110接收到用户输入的用于发送反馈列表的指令时,移动终端100的发送单元120将反馈列表发送到服务器200。
服务器200的接收单元210从移动终端100接收反馈列表。
当服务器200的接收单元210接收到反馈列表时,服务器200的修正单元240可基于反馈列表中的反馈结果,修正搜索词。
具体地说,服务器200的修正单元240可包括特征分析单元241和去除单元242。
特征分析单元241可针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征,针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征。下面,将参照图3来详细描述特征分析单元241的特征分析方法。
图3是根据本发明的示例性实施例的特征分析示例的示图。
参照图3,特征分析单元241使用词频-反文档频率(TF-IDF)方法从搜索结果中提取特征,并从提取的特征中提取实体词(即,去除助词、语气词等无实质意义的词汇)作为基本特征TO(t01,t02,t03,…t0n)。其中,TO表示基本特征集,t01,t02,t03,…t0n表示TO中的各个基本特征,n表示等于或大于1的整数。
特征分析单元241可通过多次深度学习的方法来对基本特征T0进行特征分析。这里,深度学习是指分层认识事物,每进一步学习都能够学习到更高级(即,更准确描述事物)的特征。
具体地说,特征分析单元241首先进行第一次深度学习。特征分析单元241根据基本特征T0的类型确定用于深度学习的m个不同类型的网页样本库。其中,m表示等于或大于1的整数,通常m<n。这里,网页样本库可以是包含分类的文章的数据库,例如,网页样本库可以是包含关于建筑物的文章的数据库、或是包含关于食物的文章的数据库、或是包含关于动物的文章的数据库等等。在本示例性实施例中,可通过百度VIP网页库来实现网页样本库。
随后,特征分析单元241可从所述m个不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重A0(a01,a02,a03,…,a0n)。其中,A0表示基本特征T0的TF-IDF归一化权重向量,a01,a02,a03,…,a0n表示分别与基本特征t01,t02,t03,…t0n对应的TF-IDF归一化权重。也就是说,从所述m个不同类型的网页样本库中可分别计算出m组不同的TF-IDF归一化权重向量A0。
随后,特征分析单元241可分别通过使用从所述m不同类型的网页样本库中计算的TF-IDF归一化权重向量A0对基本特征T0计算线性加权和,从相应的网页样本库中学习到高级特征T1(t11,t12,t13,…t1m)。其中,T1表示高级特征集T1,t11,t12,t13,…t1m分别表示T1中的各个高级特征。
例如,当特征分析单元241从所述m个不同类型的网页样本库中的一个网页样本库中计算出每个基本特征的TF-IDF归一化权重A0(a01,a02,a03,…,a0n)时,特征分析单元241通过公式t11=a01×t01+a02×t02+a03×t03+…+a0n×t0n来计算线性加权和并从该网页样本库中学习到高级特征t11。例如,在该网页样本库中,高级特征t11=a01×北京+a02×烤鸭=全聚德。以此类推,可从所述m个不同类型的网页样本库中学习到m个高级特征T1(t11,t12,t13,…t1m)。
随后,特征分析单元241可确定所述m个高级特征T1是否可作为特征分析结果。
具体地说,特征分析单元241可根据所述m个高级特征T1的类型确定x个不同类型的网页样本库,并从所述x不同类型的网页样本库中分别计算每个高级特征的TF-IDF归一化权重A1(a11,a12,a13,…,a1m)。并且,从所述x个不同类型的网页样本库中可分别计算出x组TF-IDF归一化权重向量A1。
此时,特征分析单元241计算所述x组TF-IDF归一化权重向量A1中的每一组TF-IDF归一化权重向量A1中的每个TF-IDF归一化权重与第一预定值之差的平方和,即∑(a1i-a)2,其中,a1i表示每个TF-IDF归一化权重,i=1,2,…,m,a表示第一预定值。也就是说,从所述x组TF-IDF归一化权重向量A1中可计算出x个平方和。这里,第一预定值可根据经验来进行设置。
随后,特征分析单元241确定计算出的x个平方和是否均大于第二预定值。这里,第一预定值可根据经验来进行设置。
如果特征分析单元241确定计算出的x个平方和均大于第二预定值,则将所述m个高级特征T1作为特征分析结果。
如果特征分析单元241确定计算出的x个平方和没有都大于第二预定值,则特征分析单元241根据所述m个高级特征T1,从所述x不同类型的网页样本库中进行第二次深度学习,得到更高级特征T2(t21,…,t2x),其中,第二次深度学习的方法与第一次深度学习的方法相同。
以此类推,特征分析单元241可进行多次迭代的深度学习,直到最后一次学习到的特征能够满足所有∑(a1i-a)2均大于第二预定值的条件后,停止学习,将最后一次学习的特征作为特征分析结果。
返回参照图1,去除单元242可从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词。
当服务器200的修正单元240获得修正的搜索词时,服务器200的发送单元230将修正的搜索词发送到移动终端100。
移动终端100的第二接收单元130可从服务器200接收修正的搜索词。
此外,根据本发明的示例性实施例,移动终端100还可包括选择单元160。服务器200还可包括排序单元250。
移动终端100的416选择单元160可选择是否根据修正的搜索词重新搜索。例如,选择单元160可通过对话框的形式接收用户的选择。
当移动终端100的选择单元160接收到是否根据修正的搜索词重新搜索的选择时,移动终端100的发送单元120可将选择指令发送到服务器200。
服务器200的接收单元210可从移动终端100接收选择指令。
如果服务器200的接收单元210接收到根据修正的搜索词重新搜索的指令,则服务器200的搜索单元220根据修正的搜索词进行搜索来获得新的搜索结果,并且服务器200的发送单元230将新的搜索结果发送到移动终端100。移动终端100的第二接收单元130可从服务器200接收新的搜索结果,并且移动终端100的显示单元140可显示新的搜索结果。
如果服务器200的接收单元210接收到不根据修正的搜索词重新搜索的指令,则服务器200的排序单元250根据反馈列表中的反馈结果搜对索结果进行重新排序(例如,服务器200的排序单元250可将用户表示满意的搜索结果排列在所有搜索结果的最前面),并且服务器200的发送单元230将重新排序的搜索结果发送到移动终端100。移动终端100的第二接收单元130可从服务器200接收重新排序的搜索结果,并且移动终端100的显示单元140可显示重新排序的搜索结果。
图4是根据本发明的示例性实施例的基于用户反馈优化搜索结果的方法的流程图。
参照图4,在步骤401,移动终端100的第一接收单元110可从用户接收用户输入的搜索词。
在步骤402,移动终端100的发送单元120可将用户输入的搜索词发送到服务器200。
在步骤403,在服务器200的接收单元210接收到从移动终端100发送的搜索词时,服务器200的搜索单元220根据接收到的搜索词进行搜索来获得搜索结果。
在步骤404,服务器200的发送单元230将获得的搜索结果发送到移动终端100。
在步骤405,在移动终端100的第二接收单元130从服务器200接收到搜索结果时,移动终端100的显示单元140显示接收到的搜索结果。
在步骤406,移动终端100的第一接收单元110可接收用户输入的表示用户对各条搜索结果的反馈的用户手势。
在步骤407,移动终端100的列表产生单元150可根据用户的反馈产生反馈列表。
在步骤408,移动终端100的第一接收单元110接收用户输入的用于发送反馈列表的指令。
在步骤409,移动终端100的发送单元120将反馈列表发送到服务器200。
在步骤410,在服务器200的接收单元210从移动终端100接收到反馈列表时,服务器200的修正单元240可基于反馈列表中的反馈结果,修正搜索词。
具体地说,特征分析单元241可针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征,针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征。下面,将参照图5来详细描述特征分析单元241的特征分析方法的过程。随后,去除单元242可从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词。
在步骤411,服务器200的发送单元230将修正的搜索词发送到移动终端100。
此外,所述方法还可包括步骤412至420。本领域的技术人员容易理解,本发明也可不包括步骤412至420。
在步骤412,在移动终端100的第二接收单元130从服务器200接收到修正的搜索词,移动终端100的选择单元160可选择是否根据修正的搜索词重新搜索。
在步骤413,移动终端100的发送单元120可将选择指令发送到服务器200。
在步骤414,在服务器200的接收单元210从移动终端100接收到选择指令时,服务器200的搜索单元220需要判断接收到的选择指令是根据修正的搜索词重新搜索的指令还是不根据修正的搜索词重新搜索的指令。
如果服务器200的接收单元210接收到根据修正的搜索词重新搜索的指令,则在步骤415,服务器200的搜索单元220根据修正的搜索词进行搜索来获得新的搜索结果,并且在步骤416,服务器200的发送单元230将新的搜索结果发送到移动终端100。并且在步骤417,在移动终端100的第二接收单元130从服务器200接收到新的搜索结果时,移动终端100的显示单元140可显示新的搜索结果。
如果服务器200的接收单元210接收到不根据修正的搜索词重新搜索的指令,则在步骤418,服务器200的排序单元250根据反馈列表中的反馈结果对搜索结果进行重新排序(例如,服务器200的排序单元250可将用户表示满意的搜索结果排列在所有搜索结果的最前面),并且在步骤419,服务器200的发送单元230将重新排序的搜索结果发送到移动终端100。并且在步骤420,在移动终端100的第二接收单元130从服务器200接收到重新排序的搜索结果时,移动终端100的显示单元140可显示重新排序的搜索结果。
图5是根据本发明的示例性实施例的特征分析方法的流程图。特征分析单元241可通过多次深度学习的方法来进行特征分析。这里,深度学习是指分层认识事物,每进一步学习都能够学习到更高级(即,更准确描述事物)的特征。
参照图5,在步骤501,特征分析单元241使用词频-反文档频率(TF-IDF)方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征。
在步骤502,特征分析单元241根据基本特征的类型确定不同类型的网页样本库。
在步骤503,特征分析单元241从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重。
在步骤504,特征分析单元241分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征。
在步骤505,特征分析单元241将学习到的高级特征作为基本特征,重复步骤502和503。
在步骤506,特征分析单元241针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大于第二预定值。
如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值(步骤506的是),则在步骤507,特征分析单元241将特征分析单元241最后学习到的高级特征作为特征分析结果。
如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值(步骤506的否),则特征分析单元241从步骤504开始继续执行后续步骤。
本发明提供了一种基于用户反馈优化搜索结果的方法和设备。所述方法和设备通过基于用户对搜索结果的反馈对从搜索结果提取的特征进行深度学习,获得更加符合用户搜索意图的修正的搜索词,从而根据修正的搜索词能更有效地获得更准确的搜索结果。本发明还提供了一种通过用户手势来输入用户反馈的方法,使用户能更方便地进行反馈,提高了用户体验。本发明还提供了一种选择是否使用修正的搜索词进行重新搜索的方法,使用户能根据自己的搜索意图获得更准确的搜索结果。
可根据计算机程序指令来执行根据本发明的上述方法。由于这些程序指令可被包括在计算机、专用处理器或可编程或专用硬件中,因此在其中执行的指令可有利于上述的功能的执行。如本领域的技术人员所理解的,计算机、处理器或可编程硬件包括可存储或接收软件或计算机代码的存储器件,所述软件或计算机代码在被计算机、处理器或硬件访问和执行时实现在本发明中描述的方法。
虽然本发明是参照其示例性的实施例被显示和描述的,但是本领域的技术人员应该理解,在不脱离由权利要求及其等同物限定的本发明的精神和范围的情况下,可以对其形式和细节进行各种改变。

Claims (18)

1.一种基于用户反馈优化搜索结果的方法,所述方法包括:
从客户端接收搜索词;
根据搜索词进行搜索来获得搜索结果,并将搜索结果发送到客户端;
从客户端接收用户对搜索结果的反馈列表,其中,用户对搜索结果的反馈包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个;
基于反馈列表中的反馈结果,修正搜索词;
将修正的搜索词发送到客户端,
其中,修正搜索词的步骤包括:
针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征;
针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征;
从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词,
其中,特征分析的步骤包括:
(1)使用词频-反文档频率TF-IDF方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征;
(2)根据基本特征的类型确定不同类型的网页样本库;
(3)从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重;
(4)分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征;
(5)将学习到的高级特征作为基本特征,重复步骤(2)和(3);
(6)针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大于第二预定值;
(7)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值,则将最后学习到的高级特征作为特征分析结果;
(8)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值,则从步骤(4)开始继续执行。
2.如权利要求1所述的方法,其中,所述反馈列表包括搜索结果的标识符和用户对搜索结果的反馈值。
3.如权利要求1所述的方法,还包括:
从客户端接收是否根据修正的搜索词重新搜索的指令;
如果接收到根据修正的搜索词重新搜索的指令,则根据修正的搜索词进行搜索来获得新的搜索结果,并将新的搜索结果发送到客户端;
如果接收到不根据修正的搜索词重新搜索的指令,则根据反馈列表中的反馈结果对搜索结果进行重新排序,并将重新排序的搜索结果发送到客户端。
4.一种搜索方法,所述方法包括:
接收用户输入的搜索词,将接收到的搜索词发送到服务器端;
从服务器端接收搜索结果,并显示接收到的搜索结果;
接收表示用户对各条搜索结果的反馈的用户手势,其中,用户对搜索结果的反馈包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个;
根据用户的反馈产生反馈列表;
接收用户输入的用于发送产生的反馈列表的指令;
将产生的反馈列表发送到服务器端;
从服务器端接收修正的搜索词,
其中,修正的搜索词通过以下方式被确定:
针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征;
针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征;
从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词,其中,特征分析的步骤包括:
(1)使用词频-反文档频率TF-IDF方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征;
(2)根据基本特征的类型确定不同类型的网页样本库;
(3)从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF 归一化权重;
(4)分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征;
(5)将学习到的高级特征作为基本特征,重复步骤(2)和(3);
(6)针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大于第二预定值;
(7)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值,则将最后学习到的高级特征作为特征分析结果;
(8)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值,则从步骤(4)开始继续执行。
5.如权利要求4所述的方法,其中,所述用户手势是客户端默认手势或由用户自定义的手势。
6.如权利要求4所述的方法,其中,在搜索结果上从左向右快速划过的用户手势表示用户对该搜索结果满意;在搜索结果上从右向左快速划过的用户手势表示用户对该搜索结果不满意。
7.如权利要求4所述的方法,其中,所述反馈列表包括所述各条搜索结果的标识符和用户对所述各条搜索结果的反馈值。
8.如权利要求4所述的方法,其中,用户输入的用于发送产生的反馈列表的指令是用户在搜索结果显示页面中的翻页指令。
9.如权利要求4所述的方法,还包括:
选择是否根据修正的搜索词重新搜索并将选择结果发送到服务器端;
如果选择根据修正的搜索词重新搜索,则从服务器端接收根据修正的搜索词重新搜索的新的搜索结果;
如果选择不根据修正的搜索词重新搜索,则从服务器端接收根据用户的反馈重新排列顺序的搜索结果。
10.一种基于用户反馈优化搜索结果的设备,所述设备包括:
接收单元,从客户端接收搜索词或用户对搜索结果的反馈列表,其中,用户对搜索结果的反馈包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个;
搜索单元,根据搜索词进行搜索来获得搜索结果;
修正单元,基于反馈列表中的反馈结果,修正搜索词;
发送单元,将搜索结果或修正的搜索词发送到客户端,
其中,修正单元包括:
特征分析单元,针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征,针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征;
去除单元,从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词,
其中,特征分析单元通过执行以下步骤来进行特征分析:
(1)使用词频-反文档频率TF-IDF方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征;
(2)根据基本特征的类型确定不同类型的网页样本库;
(3)从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重;
(4)分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征;
(5)将学习到的高级特征作为基本特征,重复步骤(2)和(3);
(6)针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大于第二预定值;
(7)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值,则将最后学习到的高级特征作为特征分析结果;
(8)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值,则从步骤(4)开始继续执行。
11.如权利要求10所述的设备,其中,所述反馈列表包括搜索结果的标识符和用户对搜索结果的反馈值。
12.如权利要求10所述的设备,还包括:
排序单元,根据反馈列表中的反馈结果对搜索结果进行重新排序;
其中,接收单元从客户端接收是否根据修正的搜索词重新搜索的指令, 如果接收单元接收到根据修正的搜索词重新搜索的指令,则搜索单元根据修正的搜索词进行搜索来获得新的搜索结果,并且发送单元将新的搜索结果发送到客户端;如果接收单元接收到不根据修正的搜索词重新搜索的指令,则排序单元根据反馈列表中的反馈结果对搜索结果进行重新排序,并且发送单元将重新排序的搜索结果发送到客户端。
13.一种搜索设备,所述设备包括:
第一接收单元,从用户接收用户输入的搜索词、表示用户对各条搜索结果的反馈的用户手势或用户输入的用于发送反馈列表的指令,其中,用户对搜索结果的反馈包括用户对搜索结果表示满意的反馈和用户对搜索结果表示不满意的反馈中的至少一个;
第二接收单元,从服务器端接收搜索结果或修正的搜索词;
显示单元,显示接收到的搜索结果;
列表产生单元,根据用户的反馈产生反馈列表;
发送单元,将用户输入的搜索词或产生的反馈列表发送到服务器端,
其中,修正的搜索词通过以下方式被确定:
针对用户表示满意的搜索结果进行特征分析,并将特征分析结果作为满意特征;
针对用户表示不满意的搜索结果进行特征分析,并将特征分析结果作为不满意特征;
从满意特征中去除不满意特征,并将剩余的满意特征作为修正的搜索词,其中,通过执行以下步骤来进行特征分析:
(1)使用词频-反文档频率TF-IDF方法从搜索结果中提取特征,并从提取的特征中提取实体词作为基本特征;
(2)根据基本特征的类型确定不同类型的网页样本库;
(3)从所述不同类型的网页样本库中分别计算每个基本特征的TF-IDF归一化权重;
(4)分别通过使用从所述不同类型的网页样本库中计算的TF-IDF归一化权重对基本特征计算线性加权和,从相应的网页样本库中学习到高级特征;
(5)将学习到的高级特征作为基本特征,重复步骤(2)和(3);
(6)针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重,确定每个基本特征的TF-IDF归一化权重与第一预定值之差的平方和是否大 于第二预定值;
(7)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和均大于第二预定值,则将最后学习到的高级特征作为特征分析结果;
(8)如果针对从所述不同类型的网页样本库中计算的TF-IDF归一化权重的所述平方和没有都大于第二预定值,则从步骤(4)开始继续执行。
14.如权利要求13所述的设备,其中,所述用户手势是客户端默认手势或由用户自定义的手势。
15.如权利要求13所述的设备,其中,在搜索结果上从左向右快速划过的用户手势表示用户对该搜索结果满意;在搜索结果上从右向左快速划过的用户手势表示用户对该搜索结果不满意。
16.如权利要求13所述的设备,其中,所述反馈列表包括所述各条搜索结果的标识符和用户对所述各条搜索结果的反馈值。
17.如权利要求13所述的设备,其中,用户输入的用于发送产生的反馈列表的指令是用户在搜索结果显示页面中的翻页指令。
18.如权利要求13所述的设备,还包括:
选择单元,选择是否根据修正的搜索词重新搜索;
其中,发送单元将选择结果发送到服务器端,如果选择单元选择根据修正的搜索词重新搜索,则第二接收单元从服务器端接收根据修正的搜索词重新搜索的新的搜索结果;如果选择单元选择不根据修正的搜索词重新搜索,则第二接收单元从服务器端接收根据用户的反馈重新排列顺序的搜索结果。
CN201310304681.6A 2013-07-19 2013-07-19 基于用户反馈优化搜索结果的方法和设备 Active CN103366003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310304681.6A CN103366003B (zh) 2013-07-19 2013-07-19 基于用户反馈优化搜索结果的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310304681.6A CN103366003B (zh) 2013-07-19 2013-07-19 基于用户反馈优化搜索结果的方法和设备

Publications (2)

Publication Number Publication Date
CN103366003A CN103366003A (zh) 2013-10-23
CN103366003B true CN103366003B (zh) 2017-03-08

Family

ID=49367344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310304681.6A Active CN103366003B (zh) 2013-07-19 2013-07-19 基于用户反馈优化搜索结果的方法和设备

Country Status (1)

Country Link
CN (1) CN103366003B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102712A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 识别实体的方法和装置
CN105930505A (zh) * 2016-05-09 2016-09-07 广州神马移动信息科技有限公司 一种信息搜索方法及装置
CN107291900B (zh) * 2017-06-22 2020-06-05 美味不用等(上海)信息科技股份有限公司 信息反馈与跟踪系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102750280A (zh) * 2011-04-19 2012-10-24 国际商业机器公司 用于搜索的计算机处理方法及系统
CN102830940A (zh) * 2012-09-24 2012-12-19 深圳市宜搜科技发展有限公司 一种搜索结果处理方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
CN102750280A (zh) * 2011-04-19 2012-10-24 国际商业机器公司 用于搜索的计算机处理方法及系统
CN102830940A (zh) * 2012-09-24 2012-12-19 深圳市宜搜科技发展有限公司 一种搜索结果处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
江婕等.基于用户反馈的个性化搜索引擎的研究.《计算机与现代化》.2010,(第178期),全文. *

Also Published As

Publication number Publication date
CN103366003A (zh) 2013-10-23

Similar Documents

Publication Publication Date Title
US20200184146A1 (en) Techniques for combining human and machine learning in natural language processing
JP7343568B2 (ja) 機械学習のためのハイパーパラメータの識別および適用
CN107105031A (zh) 信息推送方法和装置
KR20180077267A (ko) 이모티콘 추천 방법 및 장치
JP6517352B2 (ja) 翻訳情報の提供方法及びシステム
US11768892B2 (en) Method and apparatus for extracting name of POI, device and computer storage medium
CN106469169A (zh) 信息处理方法及装置
CN104331295B (zh) 页面生成方法和系统
CN106777328B (zh) 一种移动终端的题目推荐方法及装置
RU2014126774A (ru) Ранжиратор результатов поиска
CN105138547B (zh) 一种数据搜索方法及装置
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
WO2016202214A2 (zh) 一种关键词的展示方法和装置
CN108628830A (zh) 一种语义识别的方法和装置
CN103366003B (zh) 基于用户反馈优化搜索结果的方法和设备
CN105893427A (zh) 资源搜索方法以及服务器
KR101346927B1 (ko) 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체
KR101334096B1 (ko) 높은 연관성을 가지는 아이템을 추천하는 아이템 기반의 추천 엔진
CN109075987A (zh) 优化数字组件分析系统
CN106802906A (zh) 信息查询方法、装置及服务器设备
CN105608183B (zh) 一种提供聚合类型回答的方法和装置
WO2014021824A1 (en) Search method
CN112182460B (zh) 资源的推送方法和装置、存储介质及电子装置
US20160171636A1 (en) Grouping support method and apparatus
JP2014174781A (ja) アイテム推薦システム、アイテム推薦方法およびアイテム推薦プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant