CN104778262B - 一种搜索方法及装置 - Google Patents

一种搜索方法及装置 Download PDF

Info

Publication number
CN104778262B
CN104778262B CN201510192299.XA CN201510192299A CN104778262B CN 104778262 B CN104778262 B CN 104778262B CN 201510192299 A CN201510192299 A CN 201510192299A CN 104778262 B CN104778262 B CN 104778262B
Authority
CN
China
Prior art keywords
searched
word
article
continuity
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510192299.XA
Other languages
English (en)
Other versions
CN104778262A (zh
Inventor
章杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Tvmining Juyuan Media Technology Co Ltd
Original Assignee
Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Tvmining Juyuan Media Technology Co Ltd filed Critical Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority to CN201510192299.XA priority Critical patent/CN104778262B/zh
Publication of CN104778262A publication Critical patent/CN104778262A/zh
Application granted granted Critical
Publication of CN104778262B publication Critical patent/CN104778262B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索方法及装置,用以使搜索结果更贴合用户的需求。所述方法包括:检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。该方案首先获取所述搜索词中各个字在待搜索文章中的位置,再通过检测搜索词中的各个字在所述待搜索文章中的位置是否符合预设的连续条件,确定所述待搜索文章是否为用户需要的搜索结果,并对该搜索结果进行打分后排序,从而将贴近用户需求的搜索结果展示在前端,以方便用户查看;该方案使搜索结果更符合用户的需求,同时使得搜索结果更为精确,提升了用户体验。

Description

一种搜索方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种搜索方法及装置。
背景技术
随着科学技术的发展,搜索引擎的出现起到了信息导航的作用,为用户进行信息搜索提供了便利。目前,可以针对待搜索文章中的每个字建立索引,并将每个字与所有包含该字的待搜索文章进行关联,比如,字1被包含在文章1与文章2之中;字2被包含在文章1和文章3之中;此时,如果搜索由字1和字2组成的搜索词,可以搜索到的搜索结果为文章1;但是,该方案的不足之处在于,如果字1和字2在文章1中的位置是分离的,也即,在文章1中,字1和字2并未形成一个完整的词时,此次的搜索结果其实是一个无用的搜索结果;但是,该方案中仍会将此次的搜索结果(也即文章1)作为有效的搜索结果呈现给用户,从而给用户提供了无效的搜索结果,使得搜索结果并不精准,降低了用户体验。
发明内容
本发明提供一种搜索方法及装置,用以使搜索结果更符合用户的需求,同时使得搜索结果更为精确,提升了用户体验。根据本发明实施例的第一方面,提供一种搜索方法,包括:
接收包含搜索词的搜索指令;
获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
在符合预设的连续条件时,将所述待搜索文章作为搜索结果;
在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。
在一个实施例中,预设的连续条件至少包括下列条件之一:
各个字在所述待搜索文章中存在位置连续的至少两个字;
各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中。
在一个实施例中,所述连续条件有多个;不同的连续条件对应不同的分值区间;
所述方法还包括:
根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
在一个实施例中,所述为所述待搜索文章打分,包括:
根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
在一个实施例中,获取所述搜索词中各个字在待搜索文章中的位置,包括:
根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
根据本发明实施例的第二方面,还提供一种搜索装置,包括:
指令接收模块,用于接收包含搜索词的搜索指令;
获取模块,用于获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
检测模块,用于检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
搜索结果确认模块,用于在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。
在一个实施例中,所述搜索结果确认模块包括连续条件设定子模块,所述连续条件设定模块用于将预设的连续条件设定为至少包括下列条件之一:
各个字在所述待搜索文章中存在位置连续的至少两个字;
各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中。
在一个实施例中,所述搜索结果确认模块还包括分值区间对应子模块,用于在所述连续条件有多个的情况下,设定不同的连续条件对应不同的分值区间;
所述装置还包括:
打分模块,用于根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
排序模块,用于在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
在一个实施例中,所述打分模块包括:
打分子模块,用于根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
在一个实施例中,所述获取模块还包括:
位置获取子模块,用于根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
本发明实施例提供的技术方案可产生以下有益效果:接收包含搜索词的搜索指令;获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。该方案首先获取所述搜索词中各个字在待搜索文章中的位置,再通过检测搜索词中的各个字在所述待搜索文章中的位置是否符合预设的连续条件,确定所述待搜索文章是否为用户需要的搜索结果,并对该搜索结果进行打分后排序,从而将贴近用户需求的搜索结果排列在搜索结果列表的前端,以方便用户查看;该方案使搜索结果更符合用户的需求,同时使得搜索结果更为精确,提升了用户体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1为本发明根据一示例性实施例示出的一种搜索方法的流程图;
图2为本发明根据一示例性实施例示出的另一种搜索方法的流程图;
图3为本发明根据一示例性实施例示出的一种搜索装置的框图;
图4为本发明根据一示例性实施例示出的一种搜索装置中的搜索结果确认模块64的框图;
图5为本发明根据一示例性实施例示出的另一种搜索装置中的搜索结果确认模块64的框图;
图6为本发明根据一示例性实施例示出的另一种搜索装置的框图;
图7为本发明根据一示例性实施例示出的一种搜索装置中的打分模块65的框图;
图8为本发明根据一示例性实施例示出的一种搜索装置中的获取模块66的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本公开实施例提供了一种搜索方法,用于使搜索结果更符合用户的需求,同时使得搜索结果更为精确。如图1所示,该方法包括步骤S10-S40:
在步骤S10中,接收包含搜索词的搜索指令;也即,本公开中,当用户输入搜索词时,即代表搜索引擎接收到包含该搜索词的搜索指令,该搜索指令可以由用户根据需要自行选择输入。
在步骤S20中,获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置。也即,在步骤S10中接收到用户输入的搜索词后,获取包括所述搜索词的待搜索文章,也即,只有当所述待搜索文章中包含所述搜索词的所有字,才能被获取;同时,还需要获取所述搜索词中各个字在待搜索文章中的具体的位置,并根据每个字在待搜索文章中的具体位置来确定所述待搜索文章是否为用户需要的搜索结果,并对该搜索结果进行打分后排序,从而将贴近用户需求的搜索结果排列在搜索结果列表的前端,以方便用户查看。
在一个实施例中,步骤S20中获取所述搜索词中各个字在待搜索文章中的位置,包括:
根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
其中,所述搜索词中各个字在待搜索文章中的字数序号具体可以以下方式来设定:将待搜索文章中各个字在所述待搜索文章中的具体位置关联,也即定位所述待搜索文章中的字的位置并为其设定字数的序号,所述序号设定的规则可以根据用户需求自行设定,比如,以所述待搜索文章中的每个字的行数与列数作为该字的坐标,从而定位其具体位置并为其标号,将重复的字进行去重后,将该字的所有坐标均与该字关联。
其中,所述搜索词中各个字在待搜索文章中的用于分隔句子的标点的位置具体可以以下方式来设定:按照预设句式规则标记并记录所述待搜索文章中所有标点的具体位置;其中,所述预设句式规则可以是将“待搜索文章中的同一个句子”定义为以任意一个标点符号为间隔的一句话,并将所有标点符号记录;也即,在该预设句式规则下逗号也可以作为一句话的间隔,在某句话的以逗号结尾时,该句话也算是该预设句式规则下的一句话;同时,所述预设句式规则也可以是设定只有当以句号、叹号、问号等通俗语句中表示一句完整的话的分隔时,才将其视为一句话并记录该标点符号的位置。
其中,所述搜索词中各个字在待搜索文章中的段落的分隔符号的位置具体可以以下方式来设定:按照预设段落规则标记并记录所述待搜索文章中所有段落的分隔位置;其中,所述预设段落规则是指将所述待搜索文章中所有分段的位置都进行标记和记录。
在步骤S30中,检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件。可理解的,所述预设的连续条件可以根据用户需要自行设定。
在步骤S40中,在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。
在一个实施例中,预设的连续条件至少包括下列条件之一:
在本实施例的一个方面,预设的连续条件为:各个字在所述待搜索文章中存在位置连续的至少两个字;也即,当所述搜索词中各个字在所述待搜索文章中存在至少两个连续的字时,可以将所述待搜索文章作为本次搜索的一个搜索结果。
在本实施例的另一个方面,预设的连续条件为:各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;也即,当各个字在所述待搜索文章中不存在位置连续的至少两个字,则检测是否有至少两个字出现在所述待搜索文章中同一句子中,如果存在该种情况,则可以将所述待搜索文章作为本次搜索的一个搜索结果。
在本实施例的又一个方面,预设的连续条件为:各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中。也即,当各个字在所述待搜索文章中均未出现在同一句子中时,则检测是否存在两个字出现在所述待搜索文章中的同一段落中,如果存在该种情况,则可以将所述待搜索文章作为本次搜索的一个搜索结果。
可理解的,当以上检测结果表明两个字出现在所述待搜索文章中的同一段落中的情况都不存在时,则可以将所述待搜索文章排除在本次搜索的搜索结果之外。
在一个实施例中,所述连续条件有多个;不同的连续条件对应不同的分值区间;也即,在上述实施例中,所述满足各个方面的连续条件的所述待搜索文章作为搜索结果,该搜索结果分别对应不同的分值区间,也即,将不同的搜索结果设定不同的分值,以便于利用该分值对搜索结果进行排序,将最贴近用户需求的搜索结果呈现给用户。
在一个实施例中,如图2所示,所述方法还包括步骤S50-S60:
在步骤S50中,根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间。
在一个实施例中,在所述搜索词中各个字在所述待搜索文章中存在位置连续的至少两个字时,将所述待搜索文章的分值设定为第一分值,并将所述待搜索文章增添至按照分值进行排序的搜索结果列表中。且所述第一分值应当大于在所述搜索词中各个字在所述待搜索文章中不存在位置连续的至少两个字的情况下所获得的分值。尤其是,可理解的,当所述搜索词中各个字在所述待搜索文章中的位置均连续时,那么应该将该连续的位置设定为排序分值最高的搜索结果;比如,在一个实施例中,可以设总得分为100分,直接将所述搜索词中各个字的位置均连续的所述待搜索文章的分值设定为100分,也即在该实施例中,所述第一分值为100分。
在一个实施例中,各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;由于相对于不属于同一个句子的字词来说,在同一句子中的字词往往相关度较高,此时可以检测各个字在所述待搜索文章中是否至少有两个字出现在同一句子。并在所述搜索词的各个字在所述待搜索文章中至少两个字出现在同一句子时,将所述待搜索文章的分值设定为第二分值,并将所述待搜索文章增添至按照分值进行排序的搜索结果列表中;其中,第一分值>第二分值。也即,当所述搜索词的各个字在所述待搜索文章中至少两个字出现在同一句子时,那么应该将该位置设定为排序分值第二高的搜索结果。
在一个实施例中,在所述搜索词的各个字在所述待搜索文章中并未出现至少两个字出现在同一句子时,检测所述搜索词的各个字在所述待搜索文章中是否至少有两个字出现在同一段落中;由于相对于不属于同一个段落的多个字词来说,在同一段落中出现的字词往往相关度较高,此时可以检测各个字在所述待搜索文章中是否至少有两个字出现在同一段落中在所述搜索词的各个字在所述待搜索文章中至少两个字出现在同一段落中时,将所述待搜索文章的分值设定为第三分值,并将所述待搜索文章增添至按照分值进行排序的搜索结果列表中;其中,第一分值>第二分值>第三分值。也即,当所述搜索词的各个字在所述待搜索文章中至少两个字出现在同一段落中时,那么应该将该位置设定为排序分值第三高的搜索结果。
在所述搜索词的各个字在所述待搜索文章中并不存在至少两个字出现在同一段落中时,确定所述待搜索文章不是本次搜索的搜索结果。也即,在待搜索文章中各个字在所述待搜索文章中不存在至少两个字出现在同一段落中时,该搜索词在所述待搜索文章中的含义很难是完整的并贴合用户需求的。更进一步地,确定所述待搜索文章不是本次搜索的搜索结果之后,可以将该待搜索文章不列入搜索结果列表中。
在步骤S60中,在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。也即,在多个搜索结果完全得出并按照其对应的分值进行排序,此后,可以直接呈现给客户排序后的搜索结果列表,以使得搜索结果更精准且贴近用户需求。
在一个实施例中,所述为所述待搜索文章打分,包括:
根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。也即,上述实施例中的打分的分值还可以根据各个字在待搜索文章中出现的次数为其设定一个权值,使得当各个字在待搜索文章中出现次数越多时,得到的分值越高,这样,呈现给用户的搜索结果会越贴近用户需求。
本发明实施例提供的上述方法,接收包含搜索词的搜索指令;获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。该方案首先获取所述搜索词中各个字在待搜索文章中的位置,再通过检测搜索词中的各个字在所述待搜索文章中的位置是否符合预设的连续条件,确定所述待搜索文章是否为用户需要的搜索结果,并对该搜索结果进行打分后排序,从而将贴近用户需求的搜索结果排列在搜索结果列表的前端,以方便用户查看;该方案使搜索结果更符合用户的需求,同时使得搜索结果更为精确,提升了用户体验。
对应本发明实施例提供的搜索方法,本发明还提供搜索装置,如图3所示,该装置可包括:
指令接收模块61,用于接收包含搜索词的搜索指令;
获取模块62,用于获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
检测模块63,用于检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
搜索结果确认模块64,用于在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。
在一个实施例中,如图4所示,所述搜索结果确认模块64包括连续条件设定子模块641,所述连续条件设定子模块641用于将预设的连续条件设定为至少包括下列条件之一:
各个字在所述待搜索文章中存在位置连续的至少两个字;
各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中。
在一个实施例中,如图5所示,所述搜索结果确认模块64还包括分值区间对应子模块642,用于在所述连续条件有多个的情况下,设定不同的连续条件对应不同的分值区间。
在一个实施例中,如图6所示,所述装置还包括:
打分模块65,用于根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
排序模块66,用于在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
在一个实施例中,如图7所示,所述打分模块65包括:
打分子模块651,用于根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
在一个实施例中,如图8所示,所述获取模块62还包括:
位置获取子模块661,用于根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种搜索方法,其特征在于,包括:
接收包含搜索词的搜索指令;
获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
在符合预设的连续条件时,将所述待搜索文章作为搜索结果;
在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外;
预设的连续条件至少包括下列条件之一:
各个字在所述待搜索文章中存在位置连续的至少两个字;
各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中;
所述连续条件有多个;不同的连续条件对应不同的分值区间;
所述方法还包括:
根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
2.如权利要求1所述的方法,其特征在于,所述为所述待搜索文章打分,包括:
根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
3.如权利要求1所述的方法,其特征在于,获取所述搜索词中各个字在待搜索文章中的位置,包括:
根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
4.一种搜索装置,其特征在于,包括:
指令接收模块,用于接收包含搜索词的搜索指令;
获取模块,用于获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
检测模块,用于检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
搜索结果确认模块,用于在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外;
所述搜索结果确认模块包括连续条件设定子模块,所述连续条件设定模块用于将预设的连续条件设定为至少包括下列条件之一:
各个字在所述待搜索文章中存在位置连续的至少两个字;
各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中;
所述搜索结果确认模块还包括分值区间对应子模块,用于在所述连续条件有多个的情况下,设定不同的连续条件对应不同的分值区间;
所述装置还包括:
打分模块,用于根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
排序模块,用于在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
5.如权利要求4所述的装置,其特征在于,所述打分模块包括:
打分子模块,用于根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
6.如权利要求4所述的装置,其特征在于,所述获取模块还包括:
位置获取子模块,用于根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
CN201510192299.XA 2015-04-21 2015-04-21 一种搜索方法及装置 Expired - Fee Related CN104778262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510192299.XA CN104778262B (zh) 2015-04-21 2015-04-21 一种搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510192299.XA CN104778262B (zh) 2015-04-21 2015-04-21 一种搜索方法及装置

Publications (2)

Publication Number Publication Date
CN104778262A CN104778262A (zh) 2015-07-15
CN104778262B true CN104778262B (zh) 2018-07-24

Family

ID=53619726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510192299.XA Expired - Fee Related CN104778262B (zh) 2015-04-21 2015-04-21 一种搜索方法及装置

Country Status (1)

Country Link
CN (1) CN104778262B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784123B (zh) * 2017-11-06 2021-01-01 北京中科智营科技发展有限公司 一种基于主题的搜索优化方法
CN109992647B (zh) * 2019-04-04 2021-11-12 鼎富智能科技有限公司 一种内容搜索方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1306258A (zh) * 2001-03-09 2001-08-01 北京大学 判断一组查询关键字或词在网页中位置相关性的方法
CN101923556A (zh) * 2010-02-09 2010-12-22 上海莱希信息科技有限公司 根据句子序列号进行网页搜索的方法和装置
CN102799586A (zh) * 2011-05-24 2012-11-28 北京百度网讯科技有限公司 一种用于搜索结果排序的转义度确定方法和装置
CN104346382A (zh) * 2013-07-31 2015-02-11 香港理工大学 使用语言查询的文本分析系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1306258A (zh) * 2001-03-09 2001-08-01 北京大学 判断一组查询关键字或词在网页中位置相关性的方法
CN101923556A (zh) * 2010-02-09 2010-12-22 上海莱希信息科技有限公司 根据句子序列号进行网页搜索的方法和装置
CN102799586A (zh) * 2011-05-24 2012-11-28 北京百度网讯科技有限公司 一种用于搜索结果排序的转义度确定方法和装置
CN104346382A (zh) * 2013-07-31 2015-02-11 香港理工大学 使用语言查询的文本分析系统和方法

Also Published As

Publication number Publication date
CN104778262A (zh) 2015-07-15

Similar Documents

Publication Publication Date Title
US10268758B2 (en) Method and system of acquiring semantic information, keyword expansion and keyword search thereof
CN105022840B (zh) 一种新闻信息处理方法、新闻推荐方法和相关装置
JP5449628B2 (ja) マルチステージを使用したカテゴリ情報の決定
US20160210352A1 (en) Information search method and system
US8161050B2 (en) Visualizing hyperlinks in a search results list
CN105404680A (zh) 一种搜索推荐方法及装置
US20120072406A1 (en) Search processing method and apparatus
WO2015073501A2 (en) Generating electronic summaries of online meetings
CA2764243A1 (en) Co-selected image classification
CN102184169A (zh) 用于确定字符串信息间相似度信息的方法、装置和设备
WO2009035108A1 (ja) 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム
WO2014080287A4 (en) Method and system for generating search results from a user-selected area
KR101638535B1 (ko) 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체
CN104778262B (zh) 一种搜索方法及装置
CN104408036B (zh) 关联话题的识别方法和装置
US9779140B2 (en) Ranking signals for sparse corpora
CN103389981A (zh) 网络标签自动识别方法及其系统
US9626435B2 (en) Using hierarchical scoring for disambiguation in an information retrieval system
CN104573132A (zh) 歌曲查找方法及装置
CN104077320A (zh) 一种用于生成待发布信息的方法和装置
CN104298786B (zh) 一种图像检索方法及装置
CN104090875A (zh) 信息检索系统及方法
JP5346991B2 (ja) コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム
KR20160145132A (ko) 카툰 검색 방법 및 장치
CN108959295B (zh) 一种原生对象的识别方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A search method and device

Effective date of registration: 20210104

Granted publication date: 20180724

Pledgee: Inner Mongolia Huipu Energy Co.,Ltd.

Pledgor: WUXI TVMINING MEDIA SCIENCE & TECHNOLOGY Co.,Ltd.

Registration number: Y2020990001517

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180724

Termination date: 20210421