CN103020049A - 搜索方法及搜索系统 - Google Patents
搜索方法及搜索系统 Download PDFInfo
- Publication number
- CN103020049A CN103020049A CN2011102784058A CN201110278405A CN103020049A CN 103020049 A CN103020049 A CN 103020049A CN 2011102784058 A CN2011102784058 A CN 2011102784058A CN 201110278405 A CN201110278405 A CN 201110278405A CN 103020049 A CN103020049 A CN 103020049A
- Authority
- CN
- China
- Prior art keywords
- key words
- information
- characteristic key
- degree
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种搜索方法和搜索系统。该搜索方法包括:接收用户输入的请求关键词;根据所述请求关键词从服务特征库中提取特征关键词,并提供给用户以供用户选择;响应于对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所提取的信息提供给用户。采用本发明的技术方案,能够根据用户的请求关键词自动提供更为准确合理的特征关键词。如果用户选择特征关键词进行搜索,可以方便快捷地找到目标信息,避免逐条翻页查找信息,有效节约了用户的搜索时间。
Description
技术领域
本发明涉及互联网领域,尤其涉及一种搜索方法和一种搜索系统。
背景技术
搜索引擎技术是随着互联网技术的发展而不断发展完善的,其作用是根据用户输入的请求关键词对海量信息进行搜索,帮助用户获取目标信息。
现有的搜索流程通常包括:根据用户提供的请求关键词进行分词等计算,返回一个与请求关键词相关的信息列表供用户筛选。
本发明的发明人对以上方法进行了深入研究,发现存在以下问题:
第一、现有搜索方法的搜索难度大,耗费用户的搜索时间较长。由于这种搜索方法根据用户的请求关键词提供一个信息列表,而信息列表的内容繁多,需要用户在筛选信息列表的过程中逐步理解搜索引擎的使用方法,理解关键词输入的技巧,通过调整请求关键词重新表达信息需求,增加了用户的搜索时间和搜索难度。
第二、当用户输入的请求关键词不准确时,难以为用户快速提供目标信息。例如,用户的目标信息是有关“长城饭店”的信息,但用户误将请求关键词输入为“长城饭馆”。由于现有的搜索方法是对请求关键词进行分词处理,即将请求关键词“长城饭馆”拆分为“长城”和“饭馆”,并提供每个词的相关信息列表。因此,即使分词准确,也会产生有关“长城”和“饭馆”的大量信息,使得用户难以在众多信息中发现“长城饭店”的信息。而分词错误所产生的干扰信息更多。虽然经过改良的搜索方法通过同义词、近义词处理能得到部分相关结果,但系统开发和维护量大,搜索计算的规则复杂。
发明内容
本发明的发明人发现上述现有技术中存在搜索难度大、用户搜索耗时长等问题,并因此针对所述问题中的至少一个问题提出了一种新的技术方案。
本发明的一个目的是提供一种搜索方法和搜索系统,用于为用户提高方便快速的搜索服务。本发明的另一个目的是把后台与用户搜索行为相关的业务数据或信息,通过特征提取和相关度计算的方法,在用户输入相似关键词时,第一时间反馈到用户搜索界面。
根据本发明的第一方面,提供了一种搜索方法,包括:
S101.接收用户输入的请求关键词;
S102.根据所述请求关键词从服务特征库中提取相关的特征关键词,并提供给用户以供用户选择;
S103.响应于用户对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所提取的信息提供给用户。
优选地,步骤S102包括:计算所述请求关键词与所述服务特征库中的特征关键词的关联度;判断所述关联度是否高于关联阈值,将高于关联阈值的特征关键词从服务特征库中提取。
优选地,所述关联度的计算是计算所述请求关键词和所述特征关键词的字符相似度和/或语意相似度。
优选地,步骤S103还包括计算所述特征关键词与信息的相关度。
优选地,所述特征关键词与信息的相关度的计算包括:
根据语意计算模型计算所述特征关键词与信息的第一相关度;
根据信息日志记录,计算所述特征关键词与信息的第二相关度;
根据所述特征关键词与信息的第一相关度和第二相关度计算出综合相关度。
优选地,所述从信息数据库中提取与所述特征关键词相对应的信息是根据所述特征关键词与信息的相关度进行的。
优选地,在步骤S102中,所述特征关键词为针对全部类别或者至少一个类别的特征关键词。
优选地,所述类别包括业务数据类别、用户信息需求数据类别(例如,可以是用户需求个性特征类别)、用户环境数据类别、用户信息需求时间数据类别和服务数据类别。
优选地,所述搜索方法还包括展现所述特征关键词的对应信息的内容摘要。
本发明还提供一种搜索系统,包括:
搜索请求接收单元,用于接收用户输入的请求关键词;
服务特征库,用于存储特征关键词;
特征关键词提取单元,用于根据所述请求关键词从服务特征库中提取特征关键词,并提供给用户以供用户选择;
信息提取单元,用于响应于用户对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所提取的信息提供给用户。
优选地,所述特征关键词提取单元包括:
关联度计算模块,用于计算所述请求关键词与所述服务特征库中的特征关键词的关联度;
关联度判断模块,用于判断所述关联度是否高于关联阈值;
特征关键词提取模块,用于从服务特征库中提取高于关联阈值的特征关键词。
优选地,所述关联度计算模块包括:
字符相似度计算子模块,用于计算所述请求关键词和所述特征关键词的字符相似度;和/或
语意相似度计算子模块,用于计算所述请求关键词和所述特征关键词的语意相似度。
优选地,所述搜索系统还包括信息相关度计算单元,用于计算所述特征关键词与信息的相关度,并将所述相关度存储于所述服务特征库中。所述信息提取单元包括:
第一相关度计算模块,用于根据语意计算模型计算所述特征关键词与信息的第一相关度;
第二相关度计算模块,用于根据信息日志记录,计算所述特征关键词与信息的第二相关度;
综合相关度计算模块,用于根据所述特征关键词与信息的第一相关度和第二相关度计算出综合相关度。
优选地,所述信息提取单元从所述信息数据库汇总提取与所述特征关键词对应的信息是根据所述特征关键词与信息的相关度进行的。
优选地,所述搜索系统还包括信息摘要提取单元,用于从信息数据库中提取与所述特征关键词相对应的信息摘要并进行展示。
本发明的一个优点在于,根据用户的请求关键词能够自动提供更加准确合理的特征关键词,如果用户选择特征关键词进行搜索,可以方便快捷地找到目标信息,避免逐条翻页查找信息,有效节约了搜索时间。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明的搜索方法的一个实施例的流程图;
图2为本发明的搜索方法的另一个实施例的流程图;
图3为本发明的搜索方法的又一个实施例的流程图;
图4为本发明的搜索系统的一个实施例的结构示意图;
图5为图4中的特征关键词提取单元的结构示意图;
图6为图5中的关联度计算模块的结构示意图;
图7为本发明的搜索系统的另一个实施例的结构示意图;
图8为图7中的信息相关度计算单元的结构示意图;
图9为本发明的搜索系统的又一个实施例的结构示意图;
图10为本发明的搜索系统的再一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为本发明的搜索方法的一个实施例的流程图。如图1所示,本发明的搜索方法包括:
S101.接收用户输入的请求关键词。
S102.根据所述请求关键词从服务特征库中提取与所述请求关键词相关的特征关键词,并提供给用户以供用户选择。在本实施例中,所提取的特征关键词为全部类别的特征关键词。
该步骤具体包括:首先,计算用户所输入的请求关键词与服务特征库中的特征关键词的关联度;然后,判断所计算的关联度是否高于关联阈值;最后根据判断结果,将所有高于关联阈值的特征关键词从服务特征库中提取。若存在多个高于关联阈值的特征关键词,则可以按照各自的相关度大小排列优先顺序。其中,所用到的关联阈值是预先设定并且可以根据实际需要进行调整。
关于关联度的计算,可以通过计算所述请求关键词和所述特征关键词的字符相似度;也可以通过计算所述请求关键词和所述特征关键词的语意相似度。当然,也可以采用本领域公知的其他算法计算关联度。
其中,特征关键词是根据数据库的信息建立的。一般采用分词技术、贝叶斯算法等方法,基于数据库的信息建立特征关键词。与采用PAGERANK技术的搜索方法不同,本发明的方法只提供系统看重的且能够提供的服务信息,而不提供用户输入最多但系统又难以提供信息的搜索词。例如,与“塘桥”有关的词包括“塘桥镇”、“塘桥公园”、“塘桥中学”、“塘桥街道”、“张家港塘桥”等多个词语。但是数据库信息中只有关于“塘桥公园”、“塘桥中学”的信息,则只建立“塘桥公园”和“塘桥中学”两个特征关键词。
优选地,根据数据类型建立特征关键词的索引,并存储在服务特征库中。通过采用索引,便于提取和计算,满足实时计算和实时提示的要求。
S103.响应于用户对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所示信息提供给用户。当用户未选择所述特征关键词时,按照所述请求关键词进行搜索。
一般地,信息数据库中的信息需要经过预处理,即使是互联网搜索引擎也是首先获得互联网的信息,之后进行各种处理。用户搜索到的信息均是经过处理后的信息,而不是实时的网上信息。
其中,所述从信息数据库中提取信息是根据与所述特征关键词的综合相关度进行信息提取。所述特征关键词与信息的相关度的具体计算可以为:首先,根据语意计算模型计算所述特征关键词与信息的第一相关度α1。然后,根据信息日志记录,计算所述特征关键词与信息的第二相关度α2。由于第二相关度α2的计算考虑了用户搜索的时间因素,可能存在这样两条信息,其通过语意计算模型得到的第一相关度α1数值相同,但在时间选择上存在差异,则这两条信息的第二相关度α2就会不同。最后,根据所得到的第一相关度α1和第二相关度α2计算出综合相关度α,并存储在特征服务库中。综合相关度的计算公式多种多样,在一个具体实施例中,可以采用如下计算公式:α=(α1+α2)/2。该计算可以是预先完成的,并将计算结果保存在特征服务库中。当提取信息时可以直接从特征服务库中调用相关度信息。
本发明还包括:当用户选择特征关键词后,记录该用户所选择的搜索结果,从而形成针对特征关键词的热点信息,用于在下次搜索时优先提供该信息。
另外,如果针对某个关键词,某个企业有特殊的排名需求,但这个关键词并没有在该企业的标准说明中而存储在该企业的附加信息中。此时系统可以自动设定从这些附加信息中提取特征关键词,并提示给客户。
本发明的搜索方法可以应用于手机客户端、手持设备、互联网设备、语音信息服务座席等搜索引擎服务系统。此外,本发明的搜索方法还可应用到服务资源调度系统等方面,可以判别用户信息需求的业务种类,并根据业务种类和当前信息服务的特点合理地调度后台资源,使得后台的服务能力最大化。
本发明的搜索方法是基于领域文本挖掘和自然语言理解,把经过整理的特征关键词存放在服务特征库中,当用户在搜索框等类似的输入接口输入关键词时,系统自动感知用户的输入,把合适的特征关键词展现在搜索框旁边的提示位置,供用户选择。特征关键词的数目可以是一个,也可以是多个。当有多个关键词时,按照与请求关键词的关联度顺序排列。此方法能够有效节约用户获取目标信息的时间。
图2为本发明的搜索方法的另一实施例的流程图。如图2所示,所述搜索方法包括:
S201.接收用户输入的请求关键词;
S202.根据所述请求关键词从服务特征库中提取至少一个类别的特征关键词,并提供给用户以供用户选择。
其中所述类别包括业务数据类别、用户信息需求数据类别(例如,可以是用户需求个性特征类别)、用户环境数据类别、用户信息需求时间数据类别和服务数据类别。其中,设定业务数据类别包括诸如系统的广告等业务;设定用户信息需求数据类别是考虑诸如老年人与儿童对相同关键词的信息取向差别;设定用户环境数据的类别是考虑与地理位置有关的搜索,或者系统感知到用户的搜索请求与地理位置相关时,提供基于POI的信息服务,或者服务结果计算时考虑用户所处的地理位置。设定时间因素类别是考虑信息需求和服务信息预时间的相关性,如信息的新旧程度、什么样的信息适合什么时间播报、什么样的信息适合第一时间告诉使用者等。设定服务数据类类别是考虑一个信息服务系统所专注的特定领域。例如,某个信息服务系统的服务是以提供餐饮信息为主,则其特定服务领域就是餐饮服务领域。当确定了服务领域,也就确定了这个领域的知识构成、问题表达、关键词提炼方法。
在实际应用中,既可以提供其中一个类别的特定关键词,也可以提供多个类别的特定关键词。
S203.响应于用户对特征关键词的选择,从信息数据库中提取与所述特征关键词相对应的信息,并将所述信息提供给用户。
该方法可用于多种类型的收费业务,可在满足用户基本的搜索需求的同时,还将业务相关领域的信息优先提示给用户。
图3为本发明的搜索方法的又一个实施例的流程图。如图3所示,该搜索方法包括:
S301.接收用户输入的请求关键词;
S302.根据所述请求关键词从服务特征库中提取特征关键词,并提供给用户以供用户选择。
S303.响应于用户对特征关键词的选择,从信息数据库中提取与特征关键词相对应的信息摘要并进行展示,供用户选择。
在用户输入关键词时,随时捕捉请求关键词的变化,把服务特征库中的合适的特征关键词及时展现在用户输入框附近的提示框中。可在展示特征关键词的同时,展现信息的简要内容,优选地,当存在多个特征关键词时,展现排序为第一的特征关键词所对应的信息的简要内容。此外,当信息数据库中出现较重要的业务信息且该业务信息符合用户信息需求的取向,则将该业务信息显示在用户输入的提示位置,从而为用户提供高质量的推送服务。
信息的摘要可以通过合适的方式进行展示,例如当鼠标移动到相应的关键词或者信息分类ID上时就会展示一条完整信息的摘要、一个网页、一段音乐或一段视频。
S304.响应于用户对信息摘要的选择,展示该信息的全部内容。
图4为一种搜索系统的结构图。如图4所示,包括搜索请求接收单元41、特征关键词提取单元42、信息提取单元43和服务特征库45。
其中,搜索请求接收单元41用于接收用户输入的请求关键词。特征关键词提取单元42根据所接收的请求关键词从服务特征库45中提取特征关键词,并提供给用户以供用户选择。当用户选择该特征关键词后,信息提取单元43响应于用户对该特征关键词的选择,从存储有信息数据的信息数据库46中提取与该特征关键词相对应的信息,并将所述信息提供给用户。
其中,特征关键词是根据数据库的信息建立的。一般是采用分词技术、贝叶斯算法等方法,基于数据库的信息建立特征关键词。优选地,根据数据类型建立特征关键词的索引,并存储在服务特征库中。通过采用索引,便于提取和计算,满足实时计算和实时提示的要求。
此外,当用户未选择所推荐的特征关键词时,信息提取单元43按照用户的请求关键词进行常规搜索。
图5为图4中的特征关键词提取单元42的结构示意图。如图5所示,特征关键词提取单元42包括:关联度计算模块421、关联度判断模块422和关联度判断模块422。
首先由关联度计算模块421计算用户输入的请求关键词与服务特征库45中的特征关键词的关联度。然后,关联度判断模块422判断计算得到的关联度是否高于预先设定的关联阈值。最后,由特征关键词提取模块423将所有高于关联阈值的特征关键词从服务特征库中提取。若通过判断,存在多个高于关联阈值的特征关键词,则可以按照各自的相关度的大小设定特征关键词的排列先后顺序。其中,所用到的关联阈值是预先设定并且可以根据实际需要进行调整。
其中,关联度计算模块421所进行的关联度的计算,既可以通过计算所述请求关键词和所述特征关键词的字符相似度,也可以通过计算所述请求关键词和所述特征关键词的语意相似度。当然,还可以根据需要按照其他公知方法进行关联度的计算。
图6为图5中的关联度计算模块的结构示意图。关联度计算模块421用于计算所述请求关键词与所述服务特征库中的特征关键词的关联度,并将所计算的关联度存储在服务特征库中。如图6所示,关联度计算模块421包括:字符相似度计算子模块4211和语意相似度计算子模块4212。
其中,字符相似度计算子模块4211可用于计算所述请求关键词和所述特征关键词的字符相似度;语意相似度计算子模块4212可用于计算所述请求关键词和所述特征关键词的语意相似度。
关联度计算模块421可以采用字符相似度或语意相似度两者之一来确定请求关键词与特征关键词的关联度。
关联度计算模块421也可以结合字符相似度和语意相似度两者来确定请求关键词与特征关键词的关联度。例如,可以用字符相似度和语意相似度中的最大值来表示关联度,也可以用字符相似度和语意相似度两者的加权平均值来表示关联度。
需要说明的是,根据实际需要,关联度计算模块也可只包括字符相似度计算子模块4211或者语意相似度计算子模块4212。当然,也可以包括采用其他算法的其他相似度计算子模块进行计算。
图7为搜索系统的另一个实施例的结构示意图。如图7所示,包括搜索请求接收单元41、特征关键词提取单元42、信息提取单元43、信息相关度计算单元44和服务特征库45。与图4所示的搜索系统相比,不同之处在于增加了信息相关度计算单元44。信息相关度计算单元44用于计算特征关键词与信息的相关度,并将相关度存储在服务特征库75中。
图8为图7中的信息相关度计算单元44的结构示意图。如图8所示,信息相关度计算单元44包括第一相关度计算模块441和第二相关度计算模块442。
首先,第一相关度计算模块441根据语意计算模型计算所述特征关键词与信息的第一相关度α1;然后,第二相关度计算模块442从服务日志数据库中调取信息日志记录,进行特征关键词与信息的第二相关度α2的计算。由于第二相关度α2的计算考虑了用户搜索的时间因素,可能存在这样两条信息,其通过语意计算模型得到的第一相关度α1数值相同,但在时间选择上存在差异,则这两条信息的第二相关度α2就会不同。服务日志数据库还可用于当用户选择特征关键词后,记录该用户所选择的搜索结果,从而形成针对特征关键词的热点信息,用于在下次搜索时优先提供该信息。最后,综合相关度计算模块443根据所得到的第一相关度α1和第二相关度α2计算出综合相关度α,并将综合相关度的数值存储在特征服务库中。综合相关度的计算公式多种多样,在一个具体实施例中,α=(α1+α2)/2。其中,所述特征关键词与信息的第一相关度、第二相关度和综合相关度的计算是预先完成并存储在服务特征库中,供信息提取单元直接调用。
图9为本发明的一种搜索系统的又一个实施例的结构示意图。
如图9所示,搜索系统包括搜索请求接收单元41、特征关键词提取单元42、信息提取单元43、信息相关度计算单元44和服务数据特征库451。与图7所示的搜索系统相比,不同之处在于设有服务数据特征库451,而服务数据特征库451是一个类别特征库。其中,服务数据特征库451主要用于存储特定服务领域的特征关键词。所谓特定服务领域是指一个信息服务系统所专注的服务领域。例如,某个信息服务系统的服务是以提供餐饮信息为主,则其特定服务领域就是餐饮服务领域。当确定了这个领域,也就确定了这个领域的知识构成、问题表达、关键词提炼方法。
类别特征库不限于服务数据特征库451,还可包括:业务数据特征库、用户信息需求数据特征库(例如,可以是用户需求个性特征库)、用户环境数据特征库和用户信息需求时间数据特征库。其中,业务数据类别包括诸如系统的广告等业务;设定用户信息需求数据类别是考虑诸如老年人与儿童对相同关键词的信息取向差别;设定用户环境数据的类别是考虑与地理位置有关的搜索,或者系统感知到用户的搜索请求与地理位置相关时,提供基于POI的信息服务,或者服务结果计算时考虑用户所处的地理位置。设定时间因素类别是考虑信息需求和服务信息预时间的相关性,如信息的新旧程度、什么样的信息适合什么时间播报、什么样的信息适合第一时间告诉使用者等。设定服务数据类类别是考虑一个信息服务系统所专注的特定领域。例如,某个信息服务系统的服务是以提供餐饮信息为主,则其特定服务领域就是餐饮服务领域。当确定了服务领域,也就确定了这个领域的知识构成、问题表达、关键词提炼方法。在实际应用中,既可以提供其中一个类别的特定关键词,也可以提供多个类别的特定关键词。
例如,现存在四个特征关键词“塘桥第一小学”、“塘桥中学”、“塘桥公园”和“塘桥饭店”。利用用户信息需求时间数据特征库,可在夜间检索期将“塘桥饭店”优先提供给用户。利用用户环境数据特征库,当感知用户为外地用户时,可将“塘桥公园”优先提示给用户。利用用户信息需求数据特征库,根据用户的年龄不同,调整“塘桥第一小学”与“塘桥中学”的提示顺序。
图10示出了本发明的搜索系统的又一个实施例的结构图。
如图8所示,该搜索系统包括:搜索请求接收单元41、特征关键词提取单元42、信息相关度计算单元44、服务特征库45和信息摘要提取单元47。
其中,搜索请求接收单元41、特征关键词提取单元42、信息相关度计算单元44、服务特征库45、信息数据库46与图7所示的系统的相关单元相同。不同之处在于增加了信息摘要提取单元47。信息摘要提取单元47用于根据特征关键词调用存储在服务特征库45中的信息与特征关键词的相关度,从信息数据库46中提取与相应的信息摘要并进行展示。优选地,当存在多个特征关键词时,展现排序为第一的特征关键词所对应的信息的简要内容。此外,当信息数据库中出现较重要的业务信息且该业务信息符合用户信息需求的取向,则将该业务信息显示在用户输入的提示位置,从而为用户提供高质量的推送服务。摘要可以通过合适的方式进行展示,例如当鼠标移动到相应的关键词或者信息分类ID上时就会展示一条完整信息的摘要、一个网页、一段音乐或一段视频。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。
Claims (15)
1.一种搜索方法,包括:
S101.接收用户输入的请求关键词;
S102.根据所述请求关键词从服务特征库中提取与所述请求关键词相关的特征关键词,并提供给用户以供用户选择;
S103.响应于用户对特征关键词的选择,从信息数据库中提取与所选特征关键词相对应的信息,并将所提取的信息提供给用户。
2.如权利要求1所述的搜索方法,其中步骤S102包括:
计算所述请求关键词与所述服务特征库中的特征关键词的关联度;
判断所述关联度是否高于关联阈值;
从服务特征库中提取高于关联阈值的特征关键词。
3.如权利要求2所述的搜索方法,其中所述关联度的计算是计算所述请求关键词和所述特征关键词的字符相似度和/或语意相似度。
4.如权利要求1所述的搜索方法,其中步骤S103还包括:计算所述特征关键词与信息的相关度。
5.如权利要求4所述的搜索方法,其中计算所述特征关键词与信息的相关度的步骤包括:
根据语意计算模型计算所述特征关键词与信息的第一相关度;
根据信息日志记录计算所述特征关键词与信息的第二相关度;
根据所述特征关键词与信息的第一相关度和第二相关度计算出综合相关度。
6.如权利要求4所述的搜索方法,其中在步骤S103中,所述从信息数据库中提取与所述特征关键词相对应的信息是根据所述特征关键词与信息的相关度进行的。
7.如权利要求1所述的搜索方法,其中在步骤S102中,所述特征关键词为针对全部类别或者至少一个类别的特征关键词。
8.如权利要求7所述的搜索方法,其中所述类别包括业务数据类别、用户信息需求数据类别、用户环境数据类别、用户信息需求时间数据类别和服务数据类别。
9.如权利要求1所述的搜索方法,还包括展现所述特征关键词的对应信息的内容摘要。
10.一种搜索系统,包括:
搜索请求接收单元,用于接收用户输入的请求关键词;
服务特征库,用于存储特征关键词;
特征关键词提取单元,用于根据所述请求关键词从服务特征库中提取相关的特征关键词,并提供给用户以供用户选择;
信息提取单元,用于响应于用户对特征关键词的选择,从信息数据库中提取与所选特征关键词相对应的信息,并将所提取的信息提供给用户。
11.如权利要求10所述的搜索系统,其中所述特征关键词提取单元包括:
关联度计算模块,用于计算所述请求关键词与所述服务特征库中的特征关键词的关联度;
关联度判断模块,用于判断所述关联度是否高于关联阈值;
特征关键词提取模块,用于从服务特征库中提取高于关联阈值的特征关键词。
12.如权利要求11所述的搜索系统,其中所述关联度计算模块包括:
字符相似度计算子模块,用于计算所述请求关键词和所述特征关键词的字符相似度;和/或
语意相似度计算子模块,用于计算所述请求关键词和所述特征关键词的语意相似度。
13.如权利要求12所述的搜索系统,还包括信息相关度计算单元,用于计算所述特征关键词与信息的相关度,并将所述相关度存储于所述服务特征库中,
其中,所述信息相关度计算单元包括:
第一相关度计算模块,用于根据语意计算模型计算所述特征关键词与信息的第一相关度;
第二相关度计算模块,用于根据信息日志记录,计算所述特征关键词与信息的第二相关度;
综合相关度计算模块,用于根据所述特征关键词与信息的第一相关度和第二相关度计算综合相关度。
14.如权利要求13所述的搜索系统,其中所述信息提取单元从所述信息数据库中提取与所述特征关键词对应的信息是根据所述特征关键词与信息的相关度进行的。
15.如权利要求10所述的搜索系统,还包括:
信息摘要提取单元,用于从信息数据库中提取与所述特征关键词相对应的信息摘要并进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102784058A CN103020049A (zh) | 2011-09-20 | 2011-09-20 | 搜索方法及搜索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102784058A CN103020049A (zh) | 2011-09-20 | 2011-09-20 | 搜索方法及搜索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103020049A true CN103020049A (zh) | 2013-04-03 |
Family
ID=47968666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102784058A Pending CN103020049A (zh) | 2011-09-20 | 2011-09-20 | 搜索方法及搜索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103020049A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218458A (zh) * | 2013-05-13 | 2013-07-24 | 百度在线网络技术(北京)有限公司 | 推荐方法及推荐服务器 |
CN104036045A (zh) * | 2014-07-01 | 2014-09-10 | 彩带网络科技(北京)有限公司 | 一种信息分析方法及服务平台 |
WO2016107491A1 (en) * | 2015-01-02 | 2016-07-07 | Huawei Technologies Co., Ltd. | Method and query suggestion server for providing alternate query suggestions for time bound results |
CN106294058A (zh) * | 2015-05-28 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 处理运营问题单据的目标策略确定方法及装置 |
WO2017167043A1 (zh) * | 2016-04-01 | 2017-10-05 | 阿里巴巴集团控股有限公司 | 一种基于用户的个性化数据搜索方法和装置 |
CN107341165A (zh) * | 2016-04-29 | 2017-11-10 | 上海京东到家元信信息技术有限公司 | 搜索框处进行提示显示的方法和装置 |
CN108107457A (zh) * | 2016-11-24 | 2018-06-01 | 百度在线网络技术(北京)有限公司 | 用于获取位置信息的方法和装置 |
CN108647355A (zh) * | 2018-05-16 | 2018-10-12 | 平安普惠企业管理有限公司 | 测试用例的展示方法、装置、设备及存储介质 |
CN109840468A (zh) * | 2018-12-14 | 2019-06-04 | 深圳壹账通智能科技有限公司 | 一种用户分析报告的生成方法及设备 |
CN110020172A (zh) * | 2017-12-29 | 2019-07-16 | 中国电信股份有限公司 | 搜索结果生成方法和装置 |
CN110929176A (zh) * | 2018-09-03 | 2020-03-27 | 北京搜狗科技发展有限公司 | 一种信息推荐方法、装置及电子设备 |
CN112015090A (zh) * | 2019-05-29 | 2020-12-01 | 珠海格力电器股份有限公司 | 一种电子设备控制方法及装置 |
CN113779363A (zh) * | 2021-09-14 | 2021-12-10 | 广州汇通国信科技有限公司 | 一种基于深度神经网络的搜索优化方法及装置 |
CN115689064A (zh) * | 2022-12-30 | 2023-02-03 | 中化现代农业有限公司 | 病害预测方法、装置、电子设备和存储介质 |
CN116628201A (zh) * | 2023-05-18 | 2023-08-22 | 浙江数洋科技有限公司 | 一种文本资料库的智能化分群和推送方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350027A (zh) * | 2007-07-19 | 2009-01-21 | 富士胶片株式会社 | 内容检索设备和内容检索方法 |
US20090083029A1 (en) * | 2007-09-25 | 2009-03-26 | Kabushiki Kaisha Toshiba | Retrieving apparatus, retrieving method, and computer program product |
CN102053977A (zh) * | 2009-11-04 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
CN102110174A (zh) * | 2011-04-11 | 2011-06-29 | 重庆大学 | 一种基于关键词的web服务器扩展检索方法 |
-
2011
- 2011-09-20 CN CN2011102784058A patent/CN103020049A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350027A (zh) * | 2007-07-19 | 2009-01-21 | 富士胶片株式会社 | 内容检索设备和内容检索方法 |
US20090083029A1 (en) * | 2007-09-25 | 2009-03-26 | Kabushiki Kaisha Toshiba | Retrieving apparatus, retrieving method, and computer program product |
CN102053977A (zh) * | 2009-11-04 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
CN102110174A (zh) * | 2011-04-11 | 2011-06-29 | 重庆大学 | 一种基于关键词的web服务器扩展检索方法 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218458A (zh) * | 2013-05-13 | 2013-07-24 | 百度在线网络技术(北京)有限公司 | 推荐方法及推荐服务器 |
CN104036045B (zh) * | 2014-07-01 | 2018-04-03 | 彩带网络科技(北京)有限公司 | 一种信息分析方法及服务平台 |
CN104036045A (zh) * | 2014-07-01 | 2014-09-10 | 彩带网络科技(北京)有限公司 | 一种信息分析方法及服务平台 |
WO2016107491A1 (en) * | 2015-01-02 | 2016-07-07 | Huawei Technologies Co., Ltd. | Method and query suggestion server for providing alternate query suggestions for time bound results |
CN106294058A (zh) * | 2015-05-28 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 处理运营问题单据的目标策略确定方法及装置 |
WO2017167043A1 (zh) * | 2016-04-01 | 2017-10-05 | 阿里巴巴集团控股有限公司 | 一种基于用户的个性化数据搜索方法和装置 |
CN107291753A (zh) * | 2016-04-01 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 一种基于用户的个性化数据搜索方法和装置 |
CN107341165A (zh) * | 2016-04-29 | 2017-11-10 | 上海京东到家元信信息技术有限公司 | 搜索框处进行提示显示的方法和装置 |
CN108107457A (zh) * | 2016-11-24 | 2018-06-01 | 百度在线网络技术(北京)有限公司 | 用于获取位置信息的方法和装置 |
CN110020172B (zh) * | 2017-12-29 | 2021-07-09 | 中国电信股份有限公司 | 搜索结果生成方法和装置 |
CN110020172A (zh) * | 2017-12-29 | 2019-07-16 | 中国电信股份有限公司 | 搜索结果生成方法和装置 |
CN108647355A (zh) * | 2018-05-16 | 2018-10-12 | 平安普惠企业管理有限公司 | 测试用例的展示方法、装置、设备及存储介质 |
CN110929176A (zh) * | 2018-09-03 | 2020-03-27 | 北京搜狗科技发展有限公司 | 一种信息推荐方法、装置及电子设备 |
CN109840468A (zh) * | 2018-12-14 | 2019-06-04 | 深圳壹账通智能科技有限公司 | 一种用户分析报告的生成方法及设备 |
CN112015090A (zh) * | 2019-05-29 | 2020-12-01 | 珠海格力电器股份有限公司 | 一种电子设备控制方法及装置 |
CN113779363A (zh) * | 2021-09-14 | 2021-12-10 | 广州汇通国信科技有限公司 | 一种基于深度神经网络的搜索优化方法及装置 |
CN113779363B (zh) * | 2021-09-14 | 2023-12-22 | 广州汇通国信科技有限公司 | 一种基于深度神经网络的搜索优化方法及装置 |
CN115689064A (zh) * | 2022-12-30 | 2023-02-03 | 中化现代农业有限公司 | 病害预测方法、装置、电子设备和存储介质 |
CN116628201A (zh) * | 2023-05-18 | 2023-08-22 | 浙江数洋科技有限公司 | 一种文本资料库的智能化分群和推送方法 |
CN116628201B (zh) * | 2023-05-18 | 2023-10-20 | 浙江数洋科技有限公司 | 一种文本资料库的智能化分群和推送方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103020049A (zh) | 搜索方法及搜索系统 | |
Hu et al. | Opinion mining from online hotel reviews–a text summarization approach | |
JP5984917B2 (ja) | 提案される語を提供するための方法および装置 | |
CN107924404B (zh) | 用于消除旅行查询的歧义的计算机实现方法和系统 | |
US10929409B2 (en) | Identifying local experts for local search | |
KR100898456B1 (ko) | 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템 | |
US9529915B2 (en) | Search results based on user and result profiles | |
CN110489558B (zh) | 文章聚合方法和装置、介质和计算设备 | |
US20100191740A1 (en) | System and method for ranking web searches with quantified semantic features | |
US20190034816A1 (en) | Methods and system for associating locations with annotations | |
EP2774061A1 (en) | Method and apparatus of ranking search results, and search method and apparatus | |
KR20180126577A (ko) | 관련 엔티티 탐색 | |
US9047278B1 (en) | Identifying and ranking attributes of entities | |
US20110208715A1 (en) | Automatically mining intents of a group of queries | |
US11789946B2 (en) | Answer facts from structured content | |
EP3129900A1 (en) | Ranking suggestions based on user attributes | |
CN103345489A (zh) | 一种事件查询请求处理方法及装置 | |
US20100161618A1 (en) | Method and system for providing keyword ranking using common affix | |
KR100954842B1 (ko) | 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체 | |
KR20130011557A (ko) | 지역별 자동완성 질의어 제공 시스템 및 방법 | |
KR101231438B1 (ko) | 외래어 발음 검색 서비스를 제공하는 검색결과 제공 시스템 및 방법 | |
CN103365915A (zh) | 基于搜索引擎和数据库查询系统的搜索结果排名方法 | |
US9251168B1 (en) | Determining information about a location based on travel related to the location | |
JP2018504686A (ja) | 検索データを処理するための方法及び装置 | |
JP5406794B2 (ja) | 検索クエリ推薦装置及び検索クエリ推薦プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130403 |