CN103106212A - 信息搜索方法及装置 - Google Patents

信息搜索方法及装置 Download PDF

Info

Publication number
CN103106212A
CN103106212A CN201110359566XA CN201110359566A CN103106212A CN 103106212 A CN103106212 A CN 103106212A CN 201110359566X A CN201110359566X A CN 201110359566XA CN 201110359566 A CN201110359566 A CN 201110359566A CN 103106212 A CN103106212 A CN 103106212A
Authority
CN
China
Prior art keywords
search information
information
historical search
degree
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110359566XA
Other languages
English (en)
Other versions
CN103106212B (zh
Inventor
凌俊民
刘晓峰
梁耿
陈阳
徐俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Guangxi Co Ltd
Original Assignee
China Mobile Group Guangxi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Guangxi Co Ltd filed Critical China Mobile Group Guangxi Co Ltd
Priority to CN201110359566.XA priority Critical patent/CN103106212B/zh
Publication of CN103106212A publication Critical patent/CN103106212A/zh
Application granted granted Critical
Publication of CN103106212B publication Critical patent/CN103106212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息搜索方法及装置,该信息搜索方法包括步骤:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。采用本发明技术方案,解决了采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低的问题。

Description

信息搜索方法及装置
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息搜索方法及装置。
背景技术
现有技术中,当用户需要解决某个问题时,可以在搜索引擎中输入该问题,搜索引擎搜索与该问题相关的问题,然后再查找这些相关的问题的答案,用户可以通过查找到的这些答案找到解决问题的途径。
在信息搜索技术领域中,将用户在搜索引擎中输入的问题称为当前搜索信息,搜索引擎中存储有之前各用户输入的搜索问题,这些问题称为历史搜索信息,每个历史搜索信息都对应至少一个反馈信息(即历史搜索信息的答案),搜索引擎接收到用户输入的当前搜索信息后,分别计算该当前搜索信息与存储的各历史搜索信息之间的相似度,然后选取出相似度较大的一些历史搜索信息,并将选取出的这些历史搜索信息提供给用户。
由上可见,现有技术是根据当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息的。用户输入的当前搜索信息一般为短文本,而短文本包含的词量较少,若用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,那么这个历史搜索信息的反馈信息很可能会对用户有帮助,但是如果当前搜索信息和这个历史搜索信息所共同具有的单词较少,那么搜索引擎计算出的相似度就较低,搜索引擎可能不会将该历史搜索信息提供给用户,例如,用户输入的当前搜索信息为“我如何在互联网上下载音乐”,而搜索引擎中存储有历史搜索信息“从网络获取MP3歌曲最便捷的途径”,这两个搜索信息的涵义非常接近,那么“从网络获取MP3歌曲最便捷的途径”这个历史搜索信息的反馈信息很可能会对用户解决问题有帮助,但是这两个搜索信息共同具有的单词只有一个“网”字,那么搜索引擎针对这两个搜索信息计算出的相似度就非常低,从而不会将该历史搜索信息提供给用户,用户也就无法通过该历史搜索信息的答案找到解决问题的途径。因此采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低。
发明内容
本发明实施例提供一种信息搜索方法及装置,用以解决采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低的问题。
本发明实施例技术方案如下:
一种信息搜索方法,该方法包括步骤:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。
一种信息搜索装置,包括:当前搜索信息获得单元,用于获得用户输入的当前搜索信息;关联度确定单元,用于针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;历史搜索信息选取单元,用于根据关联度确定单元确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;历史搜索信息提供单元,用于将历史搜索信息选取单元选取出的历史搜索信息提供给用户。
本发明实施例技术方案中,首先获得用户输入的当前搜索信息,然后针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,并将选取出的历史搜索信息提供给用户。由上可见,本发明实施例技术方案在为用户搜索信息时,不再根据用户输入的当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息,若当用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,即使共同具有的单词较少,那么该历史搜索信息对应的最佳反馈信息和当前搜索信息也是非常关联的,因此本发明实施例根据当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度来选取历史搜索信息,从而能够全面的为用户搜索历史搜索信息,且有效地提高了搜索的准确性。
附图说明
图1为本发明实施例一中,信息搜索方法流程示意图;
图2为本发明实施例一中,信息搜索方法原理示意图;
图3为本发明实施例三中,信息搜索装置结构示意图。
具体实施方式
下面结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
实施例一
如图1所示,为本发明实施例一提出的信息搜索方法流程示意图,其原理如图2所示,具体处理流程如下:
步骤11,获得用户输入的当前搜索信息。
用户输入的当前搜索信息一般为短文本信息。
步骤12,针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。
本发明实施例一提出,可以预先根据预设的各历史搜索信息及对应的反馈信息,对物理模型进行训练,得到该物理模型的模型参数矢量,后续可以直接根据该模型参数矢量,计算当前搜索信息和最佳反馈信息之间的关联度。
其中,搜索引擎中存储的每个历史搜索信息均对应至少一个反馈信息,但是只有一个反馈信息是历史搜索信息的最佳反馈信息,该最佳反馈信息与历史搜索信息之间的相关度为1,其他反馈信息与该历史搜索信息之间的相关度为0。历史搜索信息Qi的反馈信息Aj与该历史搜索信息Qi之间的相关度为Lij,当Lij=1时,确认反馈信息Aj为该历史搜索信息Qi的最佳反馈信息,该反馈信息Aj可以记为BAj,当Lij=0时,确认反馈信息Aj不为该历史搜索信息Qi的最佳反馈信息。
在对物理模型进行训练时,先选取一定数量具有最佳反馈信息的历史搜索信息以及对应的反馈信息作为训练信息集,针对每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别获取该历史搜索信息与该反馈信息之间的特征信息,然后根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量,根据确定出的各特征向量,对预设的物理模型进行训练。
本发明实施例一中,上述物理模型可以但不限于为贝叶斯逻辑回归模型。
下面以贝叶斯逻辑回归模型为例,来介绍根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练的过程。
将选取的历史搜索信息记为Qi,对应的反馈信息记为Aj,历史搜索信息Qi与其对应的反馈信息Aj之间的特征信息包含文本特征信息和非文本特征信息,其中,文本特征信息如表1所示,非文本特征信息如表2所示。
表1:
Figure BDA0000108317310000041
表2:
Figure BDA0000108317310000042
Figure BDA0000108317310000051
根据上述特征信息,确定历史搜索信息Qi与其对应的反馈信息Aj之间的K维特征向量,其中:
Fij=[Φ1(Qi,Aj),Φ2(Qi,Aj),...,ΦK(Qi,Aj)]
Φ表示如下映射:Q×A→ΦK
利用Fij对贝叶斯逻辑回归模型进行训练:
P ( L ij = 1 | F ij , Θ ) = 1 1 + exp ( Θ T F ij )
从中可以获得模型参数矢量Θ=[Θ1,Θ2,...,ΘK]。
设用户输入的当前搜索信息为qr,得到模型参数矢量后,可以通过下述方式确定当前搜索信息qr与其对应的最佳反馈信息BAj之间的关联度:
Rel ( qr , BA i ) = 1 1 + exp ( Θ T F B A i )
其中,Rel(qr,BAi)为当前搜索信息qr与最佳反馈信息BAi之间的关联度,
Figure BDA0000108317310000054
为当前搜索信息qr与最佳反馈信息BAi之间的特征向量。
步骤13,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息。
通过步骤12可以得到当前搜索信息和各最佳反馈信息之间的关联度,若最佳反馈信息与当前搜索信息非常相关,那么最佳反馈信息对应的历史搜索信息也与该当前搜索信息非常相关,为了将与当前搜索信息较相关的历史搜索信息提供给用户,本发明实施例一提出,在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息,然后将选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。
步骤14,将选取出的历史搜索信息提供给用户。
本发明实施例一提供下述两种将历史搜索信息提供给用户的方法,具体为:
第一种方法,直接利用当前搜索信息与最佳反馈信息之间的关联度来排序,若最佳反馈信息与当前搜索信息非常相关,那么最佳反馈信息对应的历史搜索信息也与该当前搜索信息非常相关,因此按照对应的最佳反馈信息的关联度由大到小的顺序,将选取的各历史搜索信息进行排序,然后将排序结果反馈给用户。
第二种方法,综合考虑当前搜索信息与最佳反馈信息之间的关联度以及历史搜索信息与最佳反馈信息之间的关联度,针对选取的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度,并根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度,因此按照相似度由大到小的顺序,将选取的各历史搜索信息进行排序,然后将排序结果反馈给用户。
其中,通过下述方式确定当前搜索信息qr与历史搜索信息Qi之间的相似度:
RelSim ( qr , Q i ) = Rel ( qr , BA i ) + Rel ( Q i , BA i ) 2 * Rel ( qr , BA i ) 2 + Rel ( Q i , BA i ) 2
其中,RelSim(qr,Qi)为当前搜索信息qr与历史搜索信息Qi之间的相似度,Rel(qr,Bai)为当前搜索信息qr与历史搜索信息Qi对应的最佳反馈信息BAi之间的关联度,Rel(Qi,BAi)为历史搜索信息Qi与对应的最佳反馈信息BAi之间的关联度。
由上述处理流程可知,本发明实施例技术方案中,首先获得用户输入的当前搜索信息,然后针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,并将选取出的历史搜索信息提供给用户。由上可见,本发明实施例技术方案在为用户搜索信息时,不再根据用户输入的当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息,若当用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,即使共同具有的单词较少,那么该历史搜索信息对应的最佳反馈信息和当前搜索信息也是非常关联的,因此本发明实施例根据当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度来选取历史搜索信息,从而能够全面的为用户搜索历史搜索信息,且有效地提高了搜索的准确性。
下面给出更为详细的实施方式。
实施例二
下面以问答系统中的问题搜索、论坛帖子搜索、微博搜索以及投诉业务处理为例,分别介绍本发明实施例提出的信息搜索方法。
(一)问答系统中的问题搜索
用户输入的当前问题q为“我如何在互联网上下载音乐”,而历史问题Q“从网络获取MP3歌曲最便捷的途径”为数据库中存储的问题,先选取一些有最佳答案的历史问题集作为训练集对贝叶斯逻辑回归模型进行训练,得到模型参数矢量,利用得到的模型参数矢量评估当前问题q与数据库中各最佳答案之间的关联度,在各历史问题中,根据关联度选取出若干历史问题(如“从网络获取MP3歌曲最便捷的途径”),然后对选取出的历史问题进行排序,将排序结果返回给用户。
一种排序方法为直接利用最佳答案与当前问题之间的关联度;另一种排序方法综合考虑最佳答案与当前问题之间的关联度,以及最佳答案与历史问题之间的关联度,得到当前问题和历史问题之间的相似度,然后根据相似度对选取出的历史问题进行排序。
(二)论坛帖子搜索
针对某一论坛,先选取数据库中一些有最佳回帖(回复或跟帖)的历史帖子集作为训练集对贝叶斯逻辑回归模型进行训练,得到模型参数矢量,利用得到的模型参数矢量评估用户请求搜索的帖子(可以称为当前帖子)与数据库中各最佳回帖之间的关联度,在各历史帖子中,根据关联度选取出若干历史帖子,然后对选取出的历史帖子进行排序,将排序结果返回给用户。
一种排序方法为直接利用最佳回帖与当前帖子之间的关联度;另一种排序方法综合考虑最佳回帖与当前帖子之间的关联度,以及最佳回帖与历史帖子之间的关联度,得到当前帖子和历史帖子之间的相似度,然后根据相似度对选取出的历史帖子进行排序。
(三)微博搜索
先选取数据库中一些有最佳回复(支持或转发最多次数的回复即为最佳回复)的历史微博集作为训练集对贝叶斯逻辑回归模型进行训练,得到模型参数矢量,利用得到的模型参数矢量评估用户请求搜索的微博(可以称为当前微博)与数据库中各最佳回复之间的关联度,在各历史微博中,根据关联度选取出若干历史微博,然后对选取出的历史微博进行排序,将排序结果返回给用户。
一种排序方法为直接利用最佳回复与当前微博之间的关联度;另一种排序方法综合考虑最佳回复与当前微博之间的关联度,以及最佳回复与历史微博之间的关联度,得到当前微博和历史微博之间的相似度,然后根据相似度对选取出的历史微博进行排序。
此外,也可以将本发明实施例技术方案应用于微博中的谣言源头定位,针对某一条谣言微博,首先利用本发明实施例技术方案搜索出与其相似的微博,然后根据发布时间排序,最早发布的微博即是谣言的源头。
(四)投诉业务处理
本发明实施例技术方案在处理投诉时也得到了较好的应用。由于通讯行业业务众多、业务流程繁杂,客户投诉的问题也千差万别,但通常许多客户的投诉问题虽然事件的描述差异很大,但是投诉问题的解答方案相同或相近,因此,可以采用本发明实施例技术方案,利用已有的投诉问题的解决方案来搜索相似的投诉问题。
首先利用数据库中有最佳解决方案的历史投诉问题集作为训练集对贝叶斯逻辑回归模型进行训练,得到模型参数矢量,利用得到的模型参数矢量评估最佳解决方案与当前投诉问题之间的关联度,在各历史投诉问题中,根据关联度选取出若干历史投诉问题,然后对选取出的历史投诉问题进行排序,将排序结果返回给用户,这就将一个新的投诉问题转为相关的典型投诉问题,使工作人员能够根据以往类似投诉的解答及回复情况更好更快的进行处理。
实施例三
与本发明实施例一提出的信息搜索方法对应,本发明实施例三提供一种信息搜索装置,其结构如图3所示,包括:
当前搜索信息获得单元31,用于获得用户输入的当前搜索信息;
关联度确定单元32,用于针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;
历史搜索信息选取单元33,用于根据关联度确定单元32确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;
历史搜索信息提供单元34,用于将历史搜索信息选取单元33选取出的历史搜索信息提供给用户。
较佳地,所述装置还包括:
模型训练单元,用于预先根据预设的各历史搜索信息及对应的各反馈信息,对物理模型进行训练,得到模型参数矢量;
关联度确定单元具体包括:
参数矢量获得子单元,用于获得模型训练单元得到的模型参数矢量;
关联度计算子单元,用于针对每个历史搜索信息,分别根据参数矢量获得子单元获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。
更佳地,模型训练单元具体包括:
特征信息获取子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别获取该历史搜索信息与该反馈信息之间的特征信息;
特征向量确定子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征信息获取子单元获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;
模型训练子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征向量确定子单元确定出的各特征向量,对预设的物理模型进行训练。
较佳地,历史搜索信息选取单元33具体包括:
反馈信息选取子单元,用于在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息;
历史搜索信息确认子单元,用于将反馈信息选取子单元选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。
较佳地,历史搜索信息提供单元34具体包括:
第一排序子单元,用于按照对应的最佳反馈信息的关联度由大到小的顺序,将历史搜索信息选取单元选取出的历史搜索信息进行排序;
第一提供子单元,用于将第一排序子单元排序后的结果提供给用户。
较佳地,历史搜索信息提供单元34具体包括:
关联度确定子单元,用于针对历史搜索信息选取单元33选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度;
相似度确定子单元,用于针对每个历史搜索信息,分别根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度;
第二排序子单元,用于按照相似度由大到小的顺序,将历史搜索信息选取单元33选取出的历史搜索信息进行排序;
第二提供子单元,用于将第二排序子单元排序后的结果提供给用户。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (15)

1.一种信息搜索方法,其特征在于,包括:
获得用户输入的当前搜索信息;
针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;
根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并
将选取出的历史搜索信息提供给用户。
2.如权利要求1所述的方法,其特征在于,针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,具体包括:
获得根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练得到的模型参数矢量;
针对每个历史搜索信息,分别根据获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。
3.如权利要求2所述的方法,其特征在于,根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练,具体包括:
针对预设的每个历史搜索信息以及该历史搜索信息的每个反馈信息,分别执行:
获取该历史搜索信息与该反馈信息之间的特征信息;并
根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;
根据确定出的各特征向量,对预设的物理模型进行训练。
4.如权利要求2所述的方法,其特征在于,所述物理模型为贝叶斯逻辑回归模型。
5.如权利要求2所述的方法,其特征在于,通过下述方式确定所述当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度:
Rel ( qr , BA i ) = 1 1 + exp ( Θ T F B A i )
其中,Rel(qr,BAi)为当前搜索信息qr与最佳反馈信息BAi之间的关联度;
Θ为所述模型参数矢量;
Figure FDA0000108317300000022
为当前搜索信息qr与最佳反馈信息BAi之间的特征向量。
6.如权利要求1所述的方法,其特征在于,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,具体包括:
在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息;
将选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。
7.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括:
按照对应的最佳反馈信息的关联度由大到小的顺序,将选取出的历史搜索信息进行排序;并
将排序后的结果提供给用户。
8.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括:
针对选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度,并根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度;
按照相似度由大到小的顺序,将选取出的历史搜索信息进行排序;并
将排序后的结果提供给用户。
9.如权利要求8所述的方法,其特征在于,通过下述方式确定当前搜索信息与历史搜索信息之间的相似度:
RelSim ( qr , Q i ) = Rel ( qr , BA i ) + Rel ( Q i , BA i ) 2 * Rel ( qr , BA i ) 2 + Rel ( Q i , BA i ) 2
其中,RelSim(qr,Qi)为当前搜索信息qr与历史搜索信息Qi之间的相似度;
Rel(qr,BAi)为当前搜索信息qr与历史搜索信息Qi对应的最佳反馈信息BAi之间的关联度;
Rel(Qi,BAi)为历史搜索信息Qi与对应的最佳反馈信息BAi之间的关联度。
10.一种信息搜索装置,其特征在于,包括:
当前搜索信息获得单元,用于获得用户输入的当前搜索信息;
关联度确定单元,用于针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;
历史搜索信息选取单元,用于根据关联度确定单元确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;
历史搜索信息提供单元,用于将历史搜索信息选取单元选取出的历史搜索信息提供给用户。
11.如权利要求10所述的装置,其特征在于,还包括:
模型训练单元,用于预先根据预设的各历史搜索信息及对应的各反馈信息,对物理模型进行训练,得到模型参数矢量;
关联度确定单元具体包括:
参数矢量获得子单元,用于获得模型训练单元得到的模型参数矢量;
关联度计算子单元,用于针对每个历史搜索信息,分别根据参数矢量获得子单元获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。
12.如权利要求11所述的装置,其特征在于,模型训练单元具体包括:
特征信息获取子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别获取该历史搜索信息与该反馈信息之间的特征信息;
特征向量确定子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征信息获取子单元获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量;
模型训练子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征向量确定子单元确定出的各特征向量,对预设的物理模型进行训练。
13.如权利要求10所述的装置,其特征在于,历史搜索信息选取单元具体包括:
反馈信息选取子单元,用于在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息;
历史搜索信息确认子单元,用于将反馈信息选取子单元选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。
14.如权利要求10所述的装置,其特征在于,历史搜索信息提供单元具体包括:
第一排序子单元,用于按照对应的最佳反馈信息的关联度由大到小的顺序,将历史搜索信息选取单元选取出的历史搜索信息进行排序;
第一提供子单元,用于将第一排序子单元排序后的结果提供给用户。
15.如权利要求10所述的装置,其特征在于,历史搜索信息提供单元具体包括:
关联度确定子单元,用于针对历史搜索信息选取单元选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度;
相似度确定子单元,用于针对每个历史搜索信息,分别根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度;
第二排序子单元,用于按照相似度由大到小的顺序,将历史搜索信息选取单元选取出的历史搜索信息进行排序;
第二提供子单元,用于将第二排序子单元排序后的结果提供给用户。
CN201110359566.XA 2011-11-14 2011-11-14 信息搜索方法及装置 Active CN103106212B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110359566.XA CN103106212B (zh) 2011-11-14 2011-11-14 信息搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110359566.XA CN103106212B (zh) 2011-11-14 2011-11-14 信息搜索方法及装置

Publications (2)

Publication Number Publication Date
CN103106212A true CN103106212A (zh) 2013-05-15
CN103106212B CN103106212B (zh) 2016-12-07

Family

ID=48314077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110359566.XA Active CN103106212B (zh) 2011-11-14 2011-11-14 信息搜索方法及装置

Country Status (1)

Country Link
CN (1) CN103106212B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699786A (zh) * 2015-03-17 2015-06-10 浪潮通信信息系统有限公司 一种语义智能搜索的通信网络投诉系统
WO2015109944A1 (en) * 2014-01-24 2015-07-30 Tencent Technology (Shenzhen) Company Limited Method and device for displaying search results
CN106803092A (zh) * 2015-11-26 2017-06-06 阿里巴巴集团控股有限公司 一种标准问题数据的确定方法及装置
CN109189890A (zh) * 2018-09-12 2019-01-11 张连祥 招商引资投诉协调智能办理系统及方法
CN109522464A (zh) * 2018-10-22 2019-03-26 西南石油大学 信息源检测方法及系统
CN111210827A (zh) * 2020-04-20 2020-05-29 成都派沃特科技股份有限公司 响应报警的方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1758248A (zh) * 2004-10-05 2006-04-12 微软公司 用于提供个性化搜索和信息访问的系统、方法和接口
JP2007004275A (ja) * 2005-06-21 2007-01-11 Sharp Corp 電子ファイル検索装置、電子ファイル検索方法、電子ファイル検索プログラム、およびこれを記録した記録媒体
CN101395604A (zh) * 2005-12-30 2009-03-25 谷歌公司 用于网页浏览器的动态搜索框
CN102214169A (zh) * 2010-04-02 2011-10-12 阿里巴巴集团控股有限公司 关键词信息与目标信息的提供方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1758248A (zh) * 2004-10-05 2006-04-12 微软公司 用于提供个性化搜索和信息访问的系统、方法和接口
JP2007004275A (ja) * 2005-06-21 2007-01-11 Sharp Corp 電子ファイル検索装置、電子ファイル検索方法、電子ファイル検索プログラム、およびこれを記録した記録媒体
CN101395604A (zh) * 2005-12-30 2009-03-25 谷歌公司 用于网页浏览器的动态搜索框
CN102214169A (zh) * 2010-04-02 2011-10-12 阿里巴巴集团控股有限公司 关键词信息与目标信息的提供方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015109944A1 (en) * 2014-01-24 2015-07-30 Tencent Technology (Shenzhen) Company Limited Method and device for displaying search results
CN104699786A (zh) * 2015-03-17 2015-06-10 浪潮通信信息系统有限公司 一种语义智能搜索的通信网络投诉系统
CN106803092A (zh) * 2015-11-26 2017-06-06 阿里巴巴集团控股有限公司 一种标准问题数据的确定方法及装置
CN106803092B (zh) * 2015-11-26 2020-07-10 阿里巴巴集团控股有限公司 一种标准问题数据的确定方法及装置
CN109189890A (zh) * 2018-09-12 2019-01-11 张连祥 招商引资投诉协调智能办理系统及方法
CN109522464A (zh) * 2018-10-22 2019-03-26 西南石油大学 信息源检测方法及系统
CN111210827A (zh) * 2020-04-20 2020-05-29 成都派沃特科技股份有限公司 响应报警的方法、装置、电子设备及可读存储介质
CN111210827B (zh) * 2020-04-20 2020-08-21 成都派沃特科技股份有限公司 响应报警的方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN103106212B (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
US8380697B2 (en) Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency
CN104199965B (zh) 一种语义信息检索方法
CN103106212A (zh) 信息搜索方法及装置
US9792356B2 (en) System and method for supporting natural language queries and requests against a user's personal data cloud
CN104598631B (zh) 分布式数据处理平台
CN107256267A (zh) 查询方法和装置
CN103425777B (zh) 一种基于改进贝叶斯分类的短信智能分类及搜索方法
CN103870505A (zh) 一种查询词推荐方法和查询词推荐系统
CN102456058A (zh) 类目信息提供方法及装置
CN103235812B (zh) 查询多意图识别方法和系统
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN103823893A (zh) 一种基于用户评论的产品检索方法及产品检索系统
CN104834651B (zh) 一种提供高频问题回答的方法和装置
CN104750705A (zh) 信息回复方法及装置
CN110134756A (zh) 会议记录生成方法、电子装置及存储介质
CN102063432A (zh) 一种检索方法和系统
CN102799587A (zh) 一种论坛搜索方法和装置
CN103425677A (zh) 关键词分类模型确定方法、关键词分类方法及装置
CN104077407A (zh) 一种智能数据搜索系统及方法
CN102609421A (zh) 数据查询方法及装置
CN104021125A (zh) 一种搜索引擎排序的方法、系统以及一种搜索引擎
CN102968419A (zh) 交互式互联网实体名称的消歧方法
CN105824915A (zh) 一种网购产品评论文摘生成方法及系统
CN105320714B (zh) 内容检索和标注信息主动服务的交互式检索方法
CN101149745A (zh) 一种呈现提示信息的方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant