CN102163228B - 用于确定资源候选项的排序结果的方法、装置及设备 - Google Patents
用于确定资源候选项的排序结果的方法、装置及设备 Download PDFInfo
- Publication number
- CN102163228B CN102163228B CN201110092452.3A CN201110092452A CN102163228B CN 102163228 B CN102163228 B CN 102163228B CN 201110092452 A CN201110092452 A CN 201110092452A CN 102163228 B CN102163228 B CN 102163228B
- Authority
- CN
- China
- Prior art keywords
- candidate item
- information
- resource candidate
- adjustment
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000000463 material Substances 0.000 claims description 46
- 238000004458 analytical method Methods 0.000 claims description 45
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 26
- 238000010586 diagram Methods 0.000 description 25
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 230000013011 mating Effects 0.000 description 6
- 230000003203 everyday effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 239000003607 modifier Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种计算机设备实现的用于确定资源候选项的排序结果的方法、装置及设备,可应用在检索领域。其中,排序确定装置先由来自用户的输入序列中获取检索信息及调整信息;接着,根据所述检索信息进行检索,以获得多个资源候选项;随后,根据所述调整信息,确定所述多个资源候选项的排序结果;最后再根据所述排序结果来生成展现信息,以提供给所述用户。本发明的优点包括:使用户在检索时获得更好的体验度。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种用于确定资源候选项的排序结果的方法、装置及设备。
背景技术
现有的检索技术中,当获取到来自用户输入的输入序列后,检索设备基于整个输入序列来进行检索,并对检索所得的各个资源候选项进行排序以获得排序结果后提供给用户。
然而,由于输入序列中往往包含用户重点关注的信息及非重点关注的信息,因此,现有技术中基于整个输入序列进行检索的方式难以区分用户希望检索的重点内容。
发明内容
本发明的目的是提供一种用于确定资源候选项的排序结果方法、装置及设备。
根据本发明的一个方面,提供一种计算机设备实现的用于确定资源候选项的排序结果的方法,其中,该方法包括以下步骤:
a由来自用户的输入序列中获取检索信息及调整信息;
b根据所述检索信息进行检索,以获得多个资源候选项;
c根据所述调整信息,确定所述多个资源候选项的排序结果;
d根据所述排序结果来生成展现信息,以提供给所述用户。
根据本发明的另一个方面,还提供了一种用于确定资源候选项的排序结果的排序确定装置,其中,该排序确定装置包括:
第一获取装置、用于由来自用户的输入序列中获取检索信息及调整信息;
检索装置、用于根据所述检索信息进行检索,以获得多个资源候选项;
排序装置、用于根据所述调整信息,确定所述多个资源候选项的排序结果;
提供装置、用于根据所述排序结果来生成展现信息,以提供给所述用户。
根据本发明的再一个方面,还提供一种计算机设备,该计算机设备包括所述排序确定装置。
与现有技术相比,本发明具有以下优点:1)根据本发明的方法,由输入序列中选择检索信息来进行检索,确保了重点关注的信息对检索结果的影响;2)根据本发明的方法,能够根据由输入序列中获得的调整信息来获得检索所得资源候选项的排序结果,进一步提高了用户获得所需资源候选项的可能性;3)根据本发明的方法,适用于各种根据用户输入序列来进行检索的场合,例如,在B2B/B2C网站中用于根据用户输入的输入序列来提供相应商品的资源候选项,在搜索引擎中用于根据用户输入的输入序列来提供相应的资源候选项等。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个方面的用于确定资源候选项的排序结果的对检索结果进行排序的方法的流程图;
图2为本发明另一个优选实施例的确定资源候选项的排序结果用于对检索结果进行排序的方法的流程图;
图3为本发明又另一个优选实施例的用于对检索结果进行排序确定资源候选项的排序结果的方法的流程图;
图4为本发明再一个优选实施例的用于对检索结果进行排序确定资源候选项的排序结果的方法的流程图;
图5为本发明一个方面的用于确定资源候选项的排序结果的排序确定装置示意图;
图6为本发明一个优选实施例的用于确定资源候选项的排序结果对检索结果进行排序的排序确定装置示意图;
图7为本发明另一个优选实施例的用于确定资源候选项的排序结果的排序确定装置示意图;
图8为本发明再一个优选实施例的用于确定资源候选项的排序结果的排序确定装置示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出了本发明一个方面的用于确定资源候选项的排序结果的方法流程图。其中,用户设备2可以是任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或声控设备进行人机交互的电子产品,包括但不限于计算机、智能手机、PDA、或IPTV等;计算机设备3可以是任何一种可与用户设备2进行通讯的电子产品,包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。根据本发明的用于对检索结果进行排序的方法主要由排序确定装置的操作系统或安装在其中的处理控制器完成,为简洁起见,以下将所述排序确定装置中的操作系统或处理控制器统称为排序确定装置。
在步骤S1中,用户设备2通过任何一种可与用户1进行人机交互的交互设备来输入输入序列,该交互设备可以是键盘、鼠标、遥控器、触摸板或声控设备等。以键盘为例,用户1通过键盘在用户设备2所显示的搜索页面中的信息输入栏中输入需要检索的信息,例如,输入“李弘基主演的电视剧”。
接着,在步骤S2中,所述用户设备2将用户1输入的输入序列,例如,“李弘基主演的电视剧”,发送至计算机设备3。其中,用户设备2可以通过网络向计算机设备3发送输入序列,该网络包括但不限于:互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。其中,所述用户设备2向计算机设备3发送输入序列的方式包括但不限于:1)通过网络直接将所述输入序列发送给所述计算机设备3;2)经由网络中的一个或多个设备将所述输入序列发送给所述计算机设备3等。
接着,在步骤S3中,所述排序确定装置由计算机设备3所接收的所述输入序列中获取检索信息及调整信息。
例如,所述排序确定装置根据所述输入序列在预定常用词库中进行查询,获得“电视剧”和“主演”为常用词,并分析输入序列,确定“的”为助词,则排序确定装置确定由所述输入序列“李弘基主演的电视剧”中所获得的检索信息包括“李弘基”,调整信息包括“主演”和“电视剧”。其中,所述预定常用词库中包括多个常用词。
接着,在步骤S4中,所述排序确定装置根据所述检索信息进行检索,以获得多个资源候选项。其中,一个资源候选项对应一个或多个链接,该资源候选项包含对该一个或多个链接所指向的一个或多个网站提供的资源的描述信息,该描述信息包括但不限于:资源的标题、资源的内容摘要、资源的全部文本内容等。
例如,所述排序确定装置根据检索信息“李弘基”和“电视剧”进行检索,获得的资源候选项包括:资源候选项A和资源候选项B。
接着,在步骤S6中,所述排序确定装置根据所述调整信息,确定所述多个资源候选项的排序结果。
例如,所述排序确定装置分析获得在资源候选项A包含调整信息“主演”,在资源候选项B中不包含调整信息“主演”,由此,排序确定装置将两个资源候选项排序如下:
资源候选项A;
资源候选项B。
接着,在步骤S7中,所述排序确定装置根据所述排序结果来生成展现信息,以提供给所述用户1。
例如,所述排序确定装置基于资源候选项A和资源候选项B的排序结果,确定资源候选项A所对应的展现信息A与资源候选项B所对应的展现信息B的排序如下所示,并通过用户设备2将排序后的展现信息提供给用户1:
展现信息A;
展现信息B。
需要说明的是,排序确定装置可根据实际情况,例如,用户设备2所请求的展现信息数量少于资源候选项数量等,选择部分资源候选项来生成展现信息,提供给用户1。
作为本发明的优选方案之一,前述步骤S3还包括所述排序确定装置先获取用于确定所述检索信息及所述调整信息的第一类型确定信息,进而再根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息的步骤。其中,所述第一类型确定信息包括但不限于:
1)根据所述输入序列在预定关键词类型库中查询所得的信息单元及其类型。其中,所述预定关键词类型库包括多个信息单元,且每个信息单元均对应一个类型。
例如,所述排序确定装置根据输入序列“李弘基主演的电视剧”来在预定关键词类型库中进行查询,获得的信息单元包括:“李弘基”、“主演”、及“电视剧”,其中,信息单元“李弘基”及“电视剧”的类型均为检索类型,而信息单元“主演”的类型为调整类型,则所述排序确定装置基于在预定关键词类型库中查询所得的信息单元及其类型的结果,确定输入序列“李弘基主演的电视剧”的检索信息包括“李弘基”与“电视剧”,调整信息包括“主演”。再例如,对于输入序列“李弘基主演的电视剧”,若所述排序确定装置在预定关键词类型库中查询所得的信息单元包括“李弘基主演”及“主演电视剧”,其中,信息单元“李弘基主演”的类型为检索类型,信息单元“主演电视剧”的类型为调整类型,则所述排序确定装置基于在预定关键词类型库中所得的信息单元及其类型查询的结果,确定输入序列“李弘基主演的电视剧”的检索信息包括“李弘基主演”,调整信息包括“主演电视剧”。
需要说明的是,检索信息和调整信息可部分重叠,如上例所示,上述检索信息:“李弘基主演”中的“主演”也出现在调整信息“主演电视剧”中。
2)根据所述输入序列来获得的语义分析结果。
其中,所述语义分析结果包括但不限于:
a)基于词性的语义分析结果。所述词性包括但不限于:名词、形容词、副词、动词等。例如,所述排序确定装置根据输入序列“李弘基主演的电视剧”进行切词所得的4个词“李弘基”、“主演”、“的”及“电视剧”进行分析,获得语义分析结果包括:“李弘基”及“电视剧”为名词,“主演”为动词,“的”为助词;则所述排序确定装置基于该语义分析结果,将名词作为检索信息,将动词作为调整信息,确定检索信息包括“李弘基”及“电视剧”,调整信息包括“主演”。
b)基于句型的语义分析结果。例如,对于输入序列“李弘基主演的电视剧”,所述排序确定装置基于句型将其分为3个部分:“李弘基”、“主演”、及“电视剧”,并基于“李弘基”在输入序列中位于句首来确定其为主语,基于“主演”在输入序列中位于句中来确定其为谓语,基于“电视剧”在输入序列中位于句尾来确定其为宾语;根据前述语义分析结果,所述排序确定装置将主语和宾语作为检索信息,将谓语作为调整信息,确定检索信息包括“李弘基”及“电视剧”,调整信息包括“主演”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取用于确定所述检索信息及所述调整信息的第一类型确定信息,并根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息的实现方式,均应包含在本发明的范围内。例如,综合词性和句型两者的语义分析结果,例如,“李弘基”为名词且位于句首,“主演”为动词且位于“李弘基”之后,“电视剧”为名词且位于“主演”之后等,来获取检索信息和调整信息;或者,所述基于句型的语义分析结果不仅包括主语、谓语、宾语,还进一步包括各个部件间的位置关系,例如,定语位于主语之前、定语位于宾语之前、状语位于谓语之前等;或者,所述排序确定装置仅将主语作为检索信息,将谓语和宾语作为调整信息等。
作为本发明的优选方案之一,根据本发明的方案还包括在获取来自用户的输入序列后,先去除所述输入序列中的无效信息,以获得可用信息,再由所述可用信息中获取所述检索信息及所述调整信息的步骤。其中,所述无效信息包括但不限于:1)助词;2)空格;3)标点符号;4)包含于预定无效词典中的信息单元等。
例如,对于所获取的输入序列“李弘基主演的电视剧”,所述排序确定装置先去除所述输入序列中的无效信息,例如,去除助词“的”,以获得可用信息“李弘基主演电视剧”,接着,再由所述可用信息中获取所述检索信息及所述调整信息。其中,由可用信息中获取所述检索信息及所述调整信息的方式与前述步骤S3中由输入序列中获取检索信息及调整信息的方式相同或相似,并以引用的方式包含于此,不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取用于确定所述检索信息及所述调整信息的第一类型确定信息,并根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息的实现方式,均应包含在本发明的范围内。
图2示出了本发明一个优选实施例的用于确定资源候选项的排序结果的方法流程图。
具体的,步骤S1和S2已在图1所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,在步骤S3’中,所述排序确定装置由计算机设备3所接收的输入序列中获取检索信息及调整信息。其中,所述检索信息包括一个或多个检索单元,所述调整信息包括一个或多个调整单元。
例如,对于输入序列“李弘基主演和参演的电视剧”,所述排序确定装置由该输入序列中获取的检索信息包括检索单元“李弘基”和检索单元“电视剧”,调整信息包括调整单元“主演”和调整单元“参演”。其中,所述排序确定装置由输入序列中获取检索信息及调整信息的方式已在参照图1所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,在步骤S4’中,排序确定装置根据所述检索信息进行检索,以获得多个资源候选项。
例如,排序确定装置根据检索信息“李弘基”和“电视剧”进行检索,获得的资源候选项包括:资源候选项C、资源候选项D、资源候选项E等等。
接着,在步骤S5中,所述排序确定装置获取用于辅助确定所述排序结果的第一排序辅助信息。其中,所述第一排序辅助信息包括但不限于以下至少一项:
1)各个调整单元的权重信息。
例如,排序确定装置3获取调整单元“主演”的权重信息,例如为5;获取调整单元“参演”的权重信息,例如为1。本领域技术人员应该理解,上述权重信息以数值来表示仅仅只是列示,而非用于限制本发明,事实上,权重信息也可以以其他方式来表示,例如,以等级来表示等等。
2)所述多个资源候选项中每个资源候选项的调整单元分布信息。其中所述调整单元分布信息包括但不限于以下至少一项:
a)该调整单元分布信息所对应的资源候选项中各个调整单元的出现次数。
例如,所述排序确定装置获得的资源候选项包括:资源候选项C、资源候选项D、及资源候选项E,并统计获得各资源候选项中调整单元的出现次数为:
资源候选项C:调整单元“主演”出现2次;调整单元“参演”出现0次;
资源候选项D:调整单元“主演”出现0次,调整单元“参演”出现1次;
资源候选项E:调整单元“主演”出现0次,调整单元“参演”出现0次。
b)该调整单元分布信息所对应的资源候选项中各个调整单元的出现位置。
其中,所述出现位置包括但不限于:标题、摘要、正文、诸如UGC等的多媒体资源说明性内容等,所述出现位置可通过资源候选项所对应信息的标签或所对应信息所包含的文本信息,例如,<title>、“摘要”等,来识别。
例如,排序确定装置所获得的资源候选项包括资源候选项F及资源候选项G,并根据资源候选项所对应信息的标签获得各个资源候选项中各个调整单元的出现位置为:
资源候选项F的标题中包含调整单元“主演”;
资源候选项G的摘要中包含调整单元“参演”。
c)该调整单元分布信息所对应的资源候选项中不同调整单元的数量。
例如,排序确定装置所获得的资源候选项包括资源候选项H和资源候选项I,并获得资源候选项H中包括调整单元“主演”和调整单元“参演”两个调整单元;资源候选项I中包括调整单元“参演”一个调整单元;则排序确定装置确定各资源候选项中不同调整单元的数量为:
资源候选项H:2;
资源候选项I:1。
3)所述多个资源候选项中每个资源候选项的预定质量信息。
其中,所述质量信息包括但不限于以下至少一项:
a)该质量信息所对应的资源候选项的权威性。
其中,所述排序确定装置获得资源候选项的权威性的方式包括但不限于以下至少一项:
i)获得预设的与资源候选项相对应的权威性;
ii)基于预存的权威网站信息来判断资源候选项的权威性;
iii)基于用户的点击率来判断资源候选项的权威性等。
例如,排序确定装置所获得的资源候选项包括资源候选项J和资源候选项K,其中,资源候选项J对应网站J,资源候选项K对应网站K,且排序确定装置获得网站J为预定权威网站,网站K为预定普通网站,则排序确定装置确定资源候选项J的权威性为“权威”级别,资源候选项K的权威性为“普通”级别。本领域技术人员应该理解,上述采用等级来表述质量信息的方式仅为例示,而非对本发明的限定,质量信息也可以以其他方式来表示,例如,以值来表示等等。
b)该质量信息所对应的资源候选项的优质度。
其中,所述排序确定装置获得各资源候选项的优质度的方式包括但不限于以下至少一项:
1)获得预设的与资源候选项相对应的优质度;
2)通过对该资源候选项所对应的网站所包含的内容信息进行分析,来获得所述优质度。其中,对所述内容信息进行分析时所参考的因素包括以下至少一项:i)是否包含广告信息;ii)网站所提供的资源质量,例如,图片清晰度、视频清晰度、歌曲音质等;iii)网站所提供的资源数量等。例如,对于所获得的资源候选项L和资源候选项M,其中资源候选项L对应网站L,资源候选项M对应网站M;排序确定装置获取资源候选项L所对应的网站所包含的内容信息,并分析得到该内容信息中不包含广告信息且该网站提供的图片平均像素高于第一预定阈值,则排序确定装置判断该网站L的优质度为优,并确定资源候选项L的优质度等级为“优”;并且,排序确定装置获取资源候选项M所对应的网站所包含的内容信息,并分析得到该内容信息中包含广告信息且该网站提供的音乐资源数量高于第二预定阈值,则排序确定装置判断该网站L的优质度为优,并确定资源候选项L的优质度等级为“优”。本领域技术人员应该理解,上述采用等级来表述优质度的实现方式仅为列示,而非对本发明的限定,事实上,优质度也可以以其他方式来表示,例如,以值来表示等等。
接着,在步骤S6’中,所述排序确定装置根据所有调整单元,并结合所述第一排序辅助信息,来确定所述多个资源候选项的排序结果。
具体地,排序确定装置确定所述排序结果的方式包括但不限于:
1)先根据所述第一排序辅助信息中的一项来确定所述多个资源候选项的初始排序结果,然后再根据所述第一排序辅助信息中的至少一项来调整该初始排序结果以获得所述排序结果;
2)仅根据所述第一排序辅助信息中的一项来确定所述多个资源候选项的排序结果;
3)根据所述第一排序辅助信息中的多项来直接确定所述多个资源候选项的排序结果等。
例如,所述排序确定装置根据所有调整单元,并结合所述第一排序辅助信息中的调整单元的权重信息,来确定各资源候选项的排序结果。例如,所述排序确定装置获得“主演”的权重信息为5,“参演”的权重信息为1,资源候选项C中包含调整信息单元“主演”,资源候选项D中包含调整信息单元“参演”,由此,排序确定装置根据各个调整单元的权重信息确定资源候选项C和资源候选项D的排序结果为:
资源候选项C;
资源候选项D。
再例如,所述排序确定装置根据所有调整单元,并结合所述第一排序辅助信息中的调整单元的权重信息及每个资源候选项的调整单元分布信息,来确定各资源候选项的排序结果。例如,所述排序确定装置获得“主演”的权重信息为5,“参演”的权重信息为1,资源候选项C的标题中包含调整信息单元“主演”,资源候选项D的摘要中包含调整信息单元“主演”,资源候选项E包含调整单元“参演”,由此,所述排序确定装置先根据各调整单元的权重信息将包含调整单元“主演”的资源候选项C和资源候选项D排序在包含调整单元“参演”的资源候选项E之前,再根据调整单元“主演”的出现位置信息,将标题中出现调整单元“主演”的资源候选项C排序在摘要中出现调整单元“主演”的资源候选项D之前,以获得如下排序结果:
资源候选项C;
资源候选项D;
资源候选项E。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所有调整单元,并结合所述第一排序辅助信息,来确定所述多个资源候选项的排序结果的实现方式,均应包含在本发明的范围内。例如:1)排序确定装置基于调整单元出现次数的由多至少来排序;2)排序确定装置基于调整单元的数量的由多至少来排序;3)排序确定装置根据资源候选项所对应网站的权威性或优质度由高至低进行排序;4)排序确定装置先基于调整单元出现的次数的由高至低来对各资源候选项进行排序,再基于优质度由高至低来对调整单元出现的次数相同的各资源候选项进行排序等等;5)当第一排序辅助信息中的每一项均采用值来表示,排序确定装置根据第一排序辅助信息中各项的值来获得各个资源候选项的评价值,并根据该评价值来对各个资源候选项进行排序等。
接着,在步骤S7’中,所述排序确定装置根据所述排序结果来生成展现信息,并通过用户设备2提供给所述用户1。
例如,所述排序确定装置根据资源候选项C、资源候选项D及资源候选项E的排序结果,确定资源候选项C对应的展现信息C、资源候选项D对应的展现信息D及资源候选项E对应的展现信息E的排序如下所示,并通过用户设备2将排序后的展现信息提供给所述用户1:
展现信息C;
展现信息D;
展现信息E。
需要说明的是,排序确定装置可根据实际情况,例如,用户设备2所请求的展现信息数量少于资源候选项数量等,选择部分资源候选项来生成展现信息,提供给用户1。
图3示出了本发明另一个优选实施例的用于确定资源候选项的排序结果的方法流程图。
具体的,步骤S1和S2已在参照图1所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,在步骤S3’’中,所述排序确定装置由计算机设备3所接收的所述输入序列中获取检索信息及调整信息。
例如,所述排序确定装置由计算机设备3所接收的输入序列“李弘基主演的电视剧”中获取检索信息“李弘基”与“电视剧”以及包调整信息“主演”。其中,所述排序确定装置由输入序列中获取检索信息及调整信息的方式已在参照图1所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,在步骤S4’’中,所述排序确定装置根据所述检索信息进行检索,以获得多个资源候选项。
例如,所述排序确定装置根据检索单元“李弘基”与检索单元“电视剧”进行检索,获得的资源候选项包括:资源候选项A1、资源候选项B1和资源候选项C1。
接着,在步骤S6’’中,所述排序确定装置根据所述调整信息及所述检索信息,确定所述多个资源候选项的排序结果。
例如,在前述步骤S4’’中,所述排序确定装置获得资源候选项A1、资源候选项B1和资源候选项C1,并获得资源候选项A1包含检索信息“李弘基”与“电视剧”及调整信息“主演”,资源候选项B1包含检索信息“李弘基”与“主演”,资源候选项C1包含检索信息“李弘基”,则所述排序确定装置确定同时包含检索信息和调整信息的资源候选项A1排序位于资源候选项B1和资源候选项C1之前,并对仅包含检索信息的资源候选项B1及资源候选项C1随机排序,获得排序结果如下:
资源候选项A1;
资源候选项B1;
资源候选项C1。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述调整信息及所述检索信息,确定所述多个资源候选项的排序结果的实现方式,均应包含在本发明的范围内。
接着,在步骤S7’’中,所述排序确定装置根据所述排序结果来生成展现信息以提供给所述用户1。其中,排序确定装置根据所述排序结果来生成展现信息以提供给所述用户1的方式已在参照图1所示实施例的步骤S7中予以详述,并以引用的方式包含于此,不再赘述。
图4示出了本发明再一个优选实施例的用于确定资源候选项的排序结果的方法流程图。
具体的,步骤S1和S2已在图1所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,在步骤S3’’’中,所述排序确定装置由计算机设备3所接收的输入序列中获取检索信息及调整信息。其中,所述调整信息包括一个或多个调整单元;所述检索信息包括一个或多个检索单元。
例如,所述排序确定装置由计算机设备3所接收的输入序列“李弘基主演和参演的电视剧”中获取包括检索单元“李弘基”与检索单元“电视剧”的检索信息以及包括调整单元“主演”与调整单元“参演”的调整信息。
上述所述排序确定装置由计算机设备3所接收的输入序列中获取检索信息及调整信息的方式与图1所示的步骤S3中获取检索信息及调整信息的方式相同或相似,并以引用的方式包含于此,不再赘述。
接着,在步骤S4’’’中,排序确定装置根据所述检索信息进行检索,以获得多个资源候选项。
例如,所述排序确定装置根据检索单元“李弘基”与检索单元“电视剧”进行检索,获得的资源候选项包括:资源候选项C1、资源候选项D1、资源候选项E1等等。
接着,在步骤S5’中,所述排序确定装置获取用于辅助确定所述排序结果的第二排序辅助信息。其中,所述第二排序辅助信息包括但不限于以下至少一项:
1)各个调整单元的权重信息。该内容已在图2所示的步骤S5中予以详述,并以引用的方式包含于此,不再赘述。
2)所述多个资源候选项中每个资源候选项的调整单元分布信息。该内容已在图2所示的步骤S5中予以详述,并以引用的方式包含于此,不再赘述。
3)各个检索单元的权重信息。例如,所述排序确定装置3获取检索单元“李弘基”的权重信息,例如为5,获取检索单元“电视剧”的权重,例如为1。本领域技术人员应该理解,上述采用数值来表示权重信息仅仅只是列示,而非对本发明的限定,事实上,权重信息也可以以其他方式来表示,例如,以等级来表示等等。
4)所述多个资源候选项中每个资源候选项的检索单元分布信息。其中,所述检索单元分布信息包括但不限于以下至少一项:
a)该检索单元分布信息所对应的资源候选项中各个检索单元的出现次数。
例如,所述排序确定装置获得的资源候选项包括资源候选项C1、资源候选项D1及资源候选项E1,并统计获得各资源候选项中调整单元的出现次数为:
资源候选项C1:检索单元“李弘基”出现2次,检索单元“电视剧”出现2次;
资源候选项D1:检索单元“李弘基”出现1次,检索单元“电视剧”出现1次;
资源候选项E1:检索单元“李弘基”出现1次,检索单元“电视剧”出现1次。
b)该检索单元分布信息所对应的资源候选项中各个检索单元的出现位置。
其中,所述出现位置包括但不限于:标题、摘要、正文、诸如UGC等的多媒体资源说明性内容等,所述位置可通过资源候选项所对应信息的标签或文本信息,例如,<title>、“摘要”等,来识别。
例如,所述排序确定装置所获得的资源候选项包括资源候选项F1及资源候选项G1,并根据资源候选项所对应信息的标签获得各个资源候选项中各个检索单元的出现位置为:
资源候选项F1的标题中包含检索单元“李弘基”与检索单元“电视剧”;
资源候选项G1的标题中包含检索单元“李弘基”,摘要中包含检索单元“电视剧”。
c)该检索单元分布信息所对应的资源候选项中不同检索单元的数量。
例如,所述排序确定装置所获得的资源候选项包括资源候选项H1和资源候选项I1,并获得资源候选项H1中包括检索单元“李弘基”和“电视剧”,资源候选项I1中包括检索单元“李弘基”;则排序确定装置确定各资源候选项中不同检索单元的数量为:
资源候选项H1:2;
资源候选项I1:1。
3)所述多个资源候选项中每个资源候选项的预定质量信息。该预定质量信息已在图2所示的实施例的步骤S5中予以详述,并以引用的方式包含于此,不再赘述。
接着,在步骤S6’’’中,所述排序确定装置根据所有调整单元及所有检索单元,并结合所述第二排序辅助信息,来确定所述多个资源候选项的排序结果。
具体地,排序确定装置根据所述第二排序辅助信息中的至少一项来确定所述多个资源候选项的排序结果。
具体地,排序确定装置确定所述排序结果的方式包括但不限于:
1)先根据所述第二排序辅助信息中的一项来确定所述多个资源候选项的初始排序结果,然后再根据所述第二排序辅助信息中的至少一项来调整该初始排序结果以获得所述排序结果;
2)仅根据所述第二排序辅助信息中的一项来确定所述多个资源候选项的排序结果;
3)根据所述第二排序辅助信息中的多项来直接确定所述多个资源候选项的排序结果等。
例如,所述排序确定装置在前述步骤S5’中获得检索单元“李弘基”在资源候选项C1中出现2次、在资源候选项D1中出现1次、在资源候选项E1中出现1次,且检索单元“电视剧”在资源候选项C1中出现2次、在资源候选项D1中出现1次、在资源候选项E1中出现1次,则所述排序确定装置确定两个检索单元在资源候选项C1中出现四次,两个检索单元在资源候选项D1中出现两次,两个检索单元在资源候选项E1中出现两次,且资源候选项D1包含2个调整单元,资源候选项E1包含一个调整单元的信息,则排序确定装置先根据检索单元的出现次数进行排序以获得初始排序结果,再根据调整单元数量来调整该初始排序结果,获得资源候选项C1、资源候选项D1与资源候选项E1的排序结果如下:
资源候选项C1;
资源候选项D1;
资源候选项E1。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所有调整单元及所有检索单元,并结合所述第二排序辅助信息,来确定所述多个资源候选项的排序结果的实现方式,均应包含在本发明的范围内。例如:1)所述排序确定装置基于检索单元在各资源候选项中的出现位置来排序,例如,将检索单元出现在标题位置的资源候选项排序在检索单元出现在摘要位置的资源候选项之前;2)所述排序确定装置基于各资源候选项中的不同检索单元的数量来排序,例如,将包含检索单元的数量多的资源候选项排序在包含检索单元的数量少的资源候选项之前;3)所述排序确定装置基于每个资源候选项的质量信息来排序,例如,将权威网站或者优质网站对应的资源候选项排序在前;4)所述排序确定装置同时基于检索单元和调整单元的权重信息来排序,例如,权重信息包括权重值,排序确定装置将各资源候选项中各自包含的检索单元权重值和调整单元权重值相乘获得总权重值,再基于总权重值来对各资源候选项排序;5)所述排序确定装置基于检索单元的的分布信息来对各资源候选项进行排序,对分布信息相同者,再基于调整单元的分布信息或者资源候选项的质量信息来排序等等。
接着,在步骤S7’’’中,所述排序确定装置根据所述排序结果来生成展现信息,并通过用户设备2提供给所述用户1。
其中,所述排序确定装置根据所述排序结果来生成展现信息,并通过用户设备2提供给所述用户1的方式已在前述步骤S7’中予以详述,并以引用的方式包含于此,不再赘述。
作为本发明的优选方案之一,根据本发明的方法还包括排序确定装置获取信息单元及其类型,并根据所述信息单元及其类型,建立或更新所述预定关键词类型库的步骤。
其中,所述排序确定装置获取信息单元及其类型的步骤进一步包括排序确定装置获取所述信息单元,获取用于确定所述信息单元类型的第二类型确定信息,并根据所述第二类型确定信息来确定该信息单元的类型的步骤。
在获取所述信息单元的步骤中,所述排序确定装置获取信息单元的方式包括但不限于:
1)由用户输入序列中获取。例如,排序确定装置由多个用户输入的输入序列中获得信息单元。例如,排序确定装置由计算机设备3所接收的用户A输入的输入序列“电视剧A”、用户B输入的输入序列“电视剧B”中获得两个输入序列中相同的部分“电视剧”,并将该相同部分“电视剧”作为信息单元。再例如,排序确定装置将输入序列“演员李弘基”进行切词,获得“演员”和“李弘基”,将“演员”和“李弘基”作为信息单元。
2)由输入法的词库中获取。例如,排序确定装置由输入法词库中获取“主演”和“参演”,并将“主演”和“参演”作为信息单元。
3)获取预设的信息单元等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述信息单元的实现方式,均应包含在本发明的范围内。
接着,排序确定装置获取用于确定所述信息单元类型的第二类型确定信息。其中,所述第二类型确定信息包括但不限于以下至少一项:
1)信息单元在预定语料库中的分布集中度。其中,所述预定预料库中包含多个语料。其中,所述分布集中度表示信息单元在预定语料库的多个语料中的分布集中程度,该分布集中度根据该信息单元在预定语料库中的出现信息及包含该信息单元的不同语料的数量信息来获得。
其中,所述出现信息以下至少一项:
1)该信息单元在预定语料库中的出现次数;
2)该信息单元在预定语料库中的出现次数占语料库中所有关键词数量的比例;
所述数量信息包括以下至少一项:
1)包含该信息单元的不同语料的数量;
2)包含该信息单元的不同语料的数量占所有语料的数量的比例。
例如,排序确定装置获得信息单元“李弘基”在所述预定语料库的各语料中共出现1000次,且预定语料库中包含信息单元“李弘基”的不同语料的数量为500,则分布集中度=1000/500=2等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据该信息单元在预定语料库中的出现信息及包含该信息单元的不同语料的数量信息来获得分布集中度的实现方式,均应包含在本发明的范围内。
2)根据该信息单元来获得的语义分析结果。其中,所述语义分析包括但不限于信息单元的词性,如名词、动词,形容词等等。例如,所述排序确定装置对信息单元“李弘基”进行词性分析获得语义分析结果为名词。
3)包含该信息单元且匹配同一语料的用户历史输入序列数量。
其中,所述匹配同一语料的用户历史输入序列为检索结果中包含同一语料的用户历史输入序列,例如,三个用户历史输入序列“iphone4签售”、“iphone4发售”、“iphone4开卖”的检索结果中均包含同一语料“iphone4的销售额已突破…”,则“iphone4签售”、“iphone4发售”及“iphone4开卖”为匹配同一语料的用户历史输入序列。
则对于信息单元“iphone4”,若包含其的用户历史输入序列包括“iphone4签售”、“iphone4发售”、“iphone4开卖”、“iphone4游戏”及“iphone4娱乐”,其中,“iphone4签售”、“iphone4发售”及“iphone4开卖”匹配同一语料,“iphone4游戏”及“iphone4娱乐”匹配同一语料,则包含该信息单元“iphone4”且匹配同一语料的用户历史输入序列数量为5。
接着,排序确定装置根据所述第二类型确定信息来确定该信息单元的类型。其中,所述类型包括:检索类型和调整类型等;优选地,还包括需要从输入序列中去除的无效类型等。
例如,所述排序确定装置获得该信息单元“李弘基”在预定预料库中的分布集中度为6.5,并判断该分布集中度6.5超过分布预定阈值4,则排序确定装置确定该信息单元“李弘基”的类型为检索类型。
又例如,所述排序确定装置获得信息单元“电视剧”的语义分析结果为名词,则排序确定装置基于该语义分析结果将该信息单元“电视剧”的类型确定为检索类型。再例如,所述排序确定装置获得信息单元“主演”的语义分析结果为动词,则排序确定装置基于语义分析结果将该信息单元“主演”确定为调整类型。再例如,所述排序确定装置获得信息单元“的”的语义分析结果为助词,则排序确定装置基于语义分析结果将该信息单元“的”确定为无效类型。
又例如,排序确定装置获得该信息单元“李弘基”且匹配同一语料的用户历史输入序列数量为1000,高于预定判断阈值,则排序确定装置确定将该信息单元“李弘基”的类型为检索类型。
又例如,排序确定装置获得该信息单元“李弘基”的语义分析结果为名词且匹配同一语料的用户历史输入序列数量为1000,则排序确定装置根据当名词的匹配同一语料的用户历史输入序列数量超所900时将其该名词定为检索类型的预定规则,确定该信息单元“李弘基”的类型为检索类型。
又例如,排序确定装置获得该信息单元“李弘基”的分布集中度为6.5且匹配同一语料的用户历史输入序列数量为1000,则排序确定装置先将分布集中度及匹配同一语料的用户历史输入序列数量归一化,然后相加以获得信息单元“李弘基”的综合评价值为1.2,高于综合预定阈值,则确定将该信息单元“李弘基”的类型为检索类型。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述第二类型确定信息来确定该信息单元的类型的实现方式,均应包含在本发明的范围内。
图5示出了本发明一个方面的用于确定资源候选项的排序结果的排序确定装置示意。其中,所述排序确定装置包括:第一获取装置31、检索装置32、排序装置33及提供装置34。
用户设备2通过任何一种可与用户1进行人机交互的交互设备来输入输入序列,该交互设备可以是键盘、鼠标、遥控器、触摸板或声控设备等。以键盘为例,用户1通过键盘在用户设备2所显示的搜索页面中的信息输入栏中输入需要检索的信息,例如,输入“李弘基主演的电视剧”。
接着,所述用户设备2将用户1输入的输入序列,例如,“李弘基主演的电视剧”,发送至计算机设备3。其中,用户设备2可以通过网络向计算机设备3发送输入序列,该网络包括但不限于:互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。其中,所述用户设备2向计算机设备3发送输入序列的方式包括但不限于:1)通过网络直接将所述输入序列发送给所述计算机设备3;2)经由网络中的一个或多个设备将所述输入序列发送给所述计算机设备3等。
接着,所述第一获取装置31由计算机设备所接收的所述输入序列中获取检索信息及调整信息。
例如,所述第一获取装置31根据所述输入序列在预定常用词库中进行查询,获得“电视剧”和“主演”为常用词,并分析输入序列,确定“的”为助词,则第一获取装置31确定由所述输入序列“李弘基主演的电视剧”中所获得的检索信息包括“李弘基”,调整信息包括“主演”和“电视剧”。其中,所述预定常用词库中包括多个常用词。
接着,所述检索装置32根据所述检索信息进行检索,以获得多个资源候选项。其中,一个资源候选项对应一个或多个链接,该资源候选项包含对该一个或多个链接所指向的一个或多个网站提供的资源的描述信息,该描述信息包括但不限于:资源的标题、资源的内容摘要、资源的全部文本内容等。
例如,所述检索装置32根据检索信息“李弘基”和“电视剧”进行检索,获得的资源候选项包括:资源候选项A和资源候选项B。
接着,所述排序装置33根据所述调整信息,确定所述多个资源候选项的排序结果。
例如,所述排序装置33分析获得在资源候选项A包含调整信息“主演”,在资源候选项B中不包含调整信息“主演”,由此,排序装置33将两个资源候选项排序如下:
资源候选项A;
资源候选项B。
接着,所述提供装置34根据所述排序结果来生成展现信息,以提供给所述用户1。
例如,所述提供装置34基于资源候选项A和资源候选项B的排序结果,确定资源候选项A所对应的展现信息A与资源候选项B所对应的展现信息B的排序如下所示,并通过用户设备2将排序后的展现信息提供给用户1:
展现信息A;
展现信息B。
需要说明的是,提供装置34可根据实际情况,例如,用户设备2所请求的展现信息数量少于资源候选项数量等,选择部分资源候选项来生成展现信息,提供给用户1。
作为本发明的优选方案之一,所述排序确定装置还包括第四获取装置(未予图示);所述第一获取装置31还包括第一子获取装置(未予图示)。其中,所述第四获取装置获取用于确定所述检索信息及所述调整信息的第一类型确定信息;所述第一子获取装置根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息。其中,所述第一类型确定信息包括但不限于:
1)根据所述输入序列在预定关键词类型库中查询所得的信息单元及其类型。其中,所述预定关键词类型库包括多个信息单元,且每个信息单元均对应一个类型。
例如,所述第四获取装置根据输入序列“李弘基主演的电视剧”在预定关键词类型库中进行查询,获得的信息单元包括:“李弘基”、“主演”、及“电视剧”,其中,信息单元“李弘基”及“电视剧”的类型均为检索类型,而信息单元“主演”的类型为调整类型,则所述第一子获取装置基于在预定关键词类型库中查询所得的信息单元及其类型的结果,确定输入序列“李弘基主演的电视剧”的检索信息包括“李弘基”与“电视剧”,调整信息包括“主演”。再例如,对于输入序列“李弘基主演的电视剧”,若所述第四获取装置在预定关键词类型库中查询所得的信息单元包括“李弘基主演”及“主演电视剧”,其中,信息单元“李弘基主演”的类型为检索类型,信息单元“主演电视剧”的类型为调整类型,则所述第一子获取装置基于在预定关键词类型库中所得的信息单元及其类型查询的结果,确定输入序列“李弘基主演的电视剧”的检索信息包括“李弘基主演”,调整信息包括“主演电视剧”。
需要说明的是,检索信息和调整信息可部分重叠,如上例所示,上述检索信息:“李弘基主演”中的“主演”也出现在调整信息“主演电视剧”中。
2)根据所述输入序列来获得的语义分析结果。
其中,所述语义分析结果包括但不限于:
a)基于词性的语义分析结果。所述词性包括但不限于:名词、形容词、副词、动词等。例如,所述第四获取装置根据输入序列“李弘基主演的电视剧”进行切词所得的4个词“李弘基”、“主演”、“的”及“电视剧”进行分析,获得语义分析结果包括:“李弘基”及“电视剧”为名词,“主演”为动词,“的”为助词;则所述第一子获取装置基于该语义分析结果,将名词作为检索信息,将动词作为调整信息,确定检索信息包括“李弘基”及“电视剧”,调整信息包括“主演”。
b)基于句型的语义分析结果。例如,对于输入序列“李弘基主演的电视剧”,所述第四获取装置基于句型将其分为3个部分:“李弘基”、“主演”、及“电视剧”,并基于“李弘基”在输入序列中位于句首来确定其为主语,基于“主演”在输入序列中位于句中来确定其为谓语,基于“电视剧”在输入序列中位于句尾来确定其为宾语;根据前述语义分析结果,所述第一子获取装置将主语和宾语作为检索信息,将谓语作为调整信息,确定检索信息包括“李弘基”及“电视剧”,调整信息包括“主演”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取用于确定所述检索信息及所述调整信息的第一类型确定信息,并根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息的实现方式,均应包含在本发明的范围内。例如,综合词性和句型两者的语义分析结果,例如,“李弘基”为名词且位于句首,“主演”为动词且位于“李弘基”之后,“电视剧”为名词且位于“主演”之后等,来获取检索信息和调整信息;或者,所述基于句型的语义分析结果不仅包括主语、谓语、宾语,还进一步包括各个部件间的位置关系,例如,定语位于主语之前、定语位于宾语之前、状语位于谓语之前等;或者,所述排序确定装置仅将主语作为检索信息,将谓语和宾语作为调整信息等。
作为本发明的优选方案之一,所述第一获取装置还包括输入序列获取装置(未予图示)、去除装置(未予图示)与第二子获取装置(未予图示)。其中,所述输入序列获取装置获取来自用户的输入序列;接着,所述去除装置去除所述输入序列中的无效信息,以获得可用信息;接着,所述第二子获取装置由所述可用信息中获取所述检索信息及所述调整信息。其中,所述无效信息包括但不限于:1)助词;2)空格;3)标点符号;4)包含于预定无效词典中的信息单元等。
例如,对于所述输入序列获取装置所获取的输入序列“李弘基主演的电视剧”,所述去除装置去除所述输入序列中的无效信息,例如,去除助词“的”,以获得可用信息“李弘基主演电视剧”,接着,第二子获取装置再由所述可用信息中获取所述检索信息及所述调整信息。其中,由可用信息中获取所述检索信息及所述调整信息的方式与前述步骤S3中由输入序列中获取检索信息及调整信息的方式相同或相似,并以引用的方式包含于此,不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取用于确定所述检索信息及所述调整信息的第一类型确定信息,并根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息的实现方式,均应包含在本发明的范围内。
图6示出了本发明一个优选实施例的用于确定资源候选项的排序结果的排序确定装置示意图。其中,所述排序确定装置包括:第一获取装置31、检索装置32、排序装置33、第二获取装置35及提供装置3,所述排序装置33还包括第一子排序装置331。
具体的,用户设备2将用户1输入的输入序列发送至计算机设备的过程已在图5所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,所述第一获取装置31由计算机设备所接收的输入序列中获取检索信息及调整信息。其中,所述检索信息包括一个或多个检索单元,所述调整信息包括一个或多个调整单元。
例如,对于输入序列“李弘基主演和参演的电视剧”,所述第一获取装置31由该输入序列中获取的检索信息包括检索单元“李弘基”和检索单元“电视剧”,调整信息包括调整单元“主演”和调整单元“参演”。其中,所述第一获取装置31由输入序列中获取检索信息及调整信息的方式已在参照图5所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,检索装置32根据所述检索信息进行检索,以获得多个资源候选项。
例如,检索装置32根据检索信息“李弘基”和“电视剧”进行检索,获得的资源候选项包括:资源候选项C、资源候选项D、资源候选项E等等。
接着,所述第二获取装置35获取用于辅助确定所述排序结果的第一排序辅助信息。其中,所述第一排序辅助信息包括但不限于以下至少一项:
1)各个调整单元的权重信息。
例如,第二获取装置35获取调整单元“主演”的权重信息,例如为5;获取调整单元“参演”的权重信息,例如为1。本领域技术人员应该理解,上述权重信息以数值来表示仅仅只是列示,而非用于限制本发明,事实上,权重信息也可以以其他方式来表示,例如,以等级来表示等等。
2)所述多个资源候选项中每个资源候选项的调整单元分布信息。其中所述调整单元分布信息包括但不限于以下至少一项:
a)该调整单元分布信息所对应的资源候选项中各个调整单元的出现次数。
例如,检索装置32所获得的资源候选项包括:资源候选项C、资源候选项D、及资源候选项E,第二获取装置35统计获得各资源候选项中调整单元的出现次数为:
资源候选项C:调整单元“主演”出现2次;调整单元“参演”出现0次;
资源候选项D:调整单元“主演”出现0次,调整单元“参演”出现1次;
资源候选项E:调整单元“主演”出现0次,调整单元“参演”出现0次。
b)该调整单元分布信息所对应的资源候选项中各个调整单元的出现位置。
其中,所述出现位置包括但不限于:标题、摘要、正文、诸如UGC等的多媒体资源说明性内容等,所述出现位置可通过资源候选项所对应信息的标签或所对应信息所包含的文本信息,例如,<title>、“摘要”等,来识别。
例如,检索装置32所获得的资源候选项包括资源候选项F及资源候选项G,第二获取装置35根据资源候选项所对应信息的标签获得各个资源候选项中各个调整单元的出现位置为:
资源候选项F的标题中包含调整单元“主演”;
资源候选项G的摘要中包含调整单元“参演”。
c)该调整单元分布信息所对应的资源候选项中不同调整单元的数量。
例如,检索装置32所获得的资源候选项包括资源候选项H和资源候选项I,第二获取装置35获得资源候选项H中包括调整单元“主演”和调整单元“参演”两个调整单元;资源候选项I中包括调整单元“参演”一个调整单元;则第二获取装置35确定各资源候选项中不同调整单元的数量为:
资源候选项H:2;
资源候选项I:1。
3)所述多个资源候选项中每个资源候选项的预定质量信息。
其中,所述质量信息包括但不限于以下至少一项:
a)该质量信息所对应的资源候选项的权威性。
其中,所述第二获取装置35获得资源候选项的权威性的方式包括但不限于以下至少一项:
i)获得预设的与资源候选项相对应的权威性;
ii)基于预存的权威网站信息来判断资源候选项的权威性;
iii)基于用户的点击率来判断资源候选项的权威性等。
例如,检索装置32所获得的资源候选项包括资源候选项J和资源候选项K,其中,资源候选项J对应网站J,资源候选项K对应网站K,且第二获取装置35获得网站J为预定权威网站,网站K为预定普通网站,则第二获取装置35确定资源候选项J的权威性为“权威”级别,资源候选项K的权威性为“普通”级别。本领域技术人员应该理解,上述采用等级来表述质量信息的方式仅为例示,而非对本发明的限定,质量信息也可以以其他方式来表示,例如,以值来表示等等。
b)该质量信息所对应的资源候选项的优质度。
其中,所述第二获取装置35获得各资源候选项的优质度的方式包括但不限于以下至少一项:
1)获得预设的与资源候选项相对应的优质度;
2)通过对该资源候选项所对应的网站所包含的内容信息进行分析,来获得所述优质度。其中,对所述内容信息进行分析时所参考的因素包括以下至少一项:i)是否包含广告信息;ii)网站所提供的资源质量,例如,图片清晰度、视频清晰度、歌曲音质等;iii)网站所提供的资源数量等。例如,对于所获得的资源候选项L和资源候选项M,其中资源候选项L对应网站L,资源候选项M对应网站M;第二获取装置35获取资源候选项L所对应的网站所包含的内容信息,并分析得到该内容信息中不包含广告信息且该网站提供的图片平均像素高于第一预定阈值,则第二获取装置35判断该网站L的优质度为优,并确定资源候选项L的优质度等级为“优”;并且,第二获取装置35获取资源候选项M所对应的网站所包含的内容信息,并分析得到该内容信息中包含广告信息且该网站提供的音乐资源数量高于第二预定阈值,则第二获取装置35判断该网站L的优质度为优,并确定资源候选项L的优质度等级为“优”。本领域技术人员应该理解,上述采用等级来表述优质度的实现方式仅为列示,而非对本发明的限定,事实上,优质度也可以以其他方式来表示,例如,以值来表示等等。
接着,所述第一子排序装置331根据所有调整单元,并结合所述第一排序辅助信息,来确定所述多个资源候选项的排序结果。
具体地,第一子排序装置331确定所述排序结果的方式包括但不限于:
1)先根据所述第一排序辅助信息中的一项来确定所述多个资源候选项的初始排序结果,然后再根据所述第一排序辅助信息中的至少一项来调整该初始排序结果以获得所述排序结果;
2)仅根据所述第一排序辅助信息中的一项来确定所述多个资源候选项的排序结果;
3)根据所述第一排序辅助信息中的多项来直接确定所述多个资源候选项的排序结果等。
例如,所述第一子排序装置331根据所有调整单元,并结合所述第一排序辅助信息中的调整单元的权重信息,来确定各资源候选项的排序结果。例如,所述第二获取装置35获得“主演”的权重信息为5,“参演”的权重信息为1,所述第一子排序装置331根据资源候选项C中包含调整信息单元“主演”,资源候选项D中包含调整信息单元“参演”,并根据各个调整单元的权重信息确定资源候选项C和资源候选项D的排序结果为:
资源候选项C;
资源候选项D。
再例如,所述第一子排序装置331根据所有调整单元,并结合所述第一排序辅助信息中的调整单元的权重信息及每个资源候选项的调整单元分布信息,来确定各资源候选项的排序结果。例如,所述第二获取装置35获得“主演”的权重信息为5,“参演”的权重信息为1,第一子排序装置331根据资源候选项C的标题中包含调整信息单元“主演”,资源候选项D的摘要中包含调整信息单元“主演”,资源候选项E包含调整单元“参演”,并根据各调整单元的权重信息将包含调整单元“主演”的资源候选项C和资源候选项D排序在包含调整单元“参演”的资源候选项E之前,再根据调整单元“主演”的出现位置信息,将标题中出现调整单元“主演”的资源候选项C排序在摘要中出现调整单元“主演”的资源候选项D之前,以获得如下排序结果:
资源候选项C;
资源候选项D;
资源候选项E。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所有调整单元,并结合所述第一排序辅助信息,来确定所述多个资源候选项的排序结果的实现方式,均应包含在本发明的范围内。例如:1)第一子排序装置331基于调整单元出现次数的由多至少来排序;2)第一子排序装置331基于调整单元的数量的由多至少来排序;3)第一子排序装置331根据资源候选项所对应网站的权威性或优质度由高至低进行排序;4)第一子排序装置331先基于调整单元出现的次数的由高至低来对各资源候选项进行排序,再基于优质度由高至低来对调整单元出现的次数相同的各资源候选项进行排序等等;5)当第一排序辅助信息中的每一项均采用值来表示,第一子排序装置331根据第一排序辅助信息中各项的值来获得各个资源候选项的评价值,并根据该评价值来对各个资源候选项进行排序等。
接着,所述提供装置34根据所述排序结果来生成展现信息,并通过用户设备2提供给所述用户1。
例如,所述提供装置34根据资源候选项C、资源候选项D及资源候选项E的排序结果,确定资源候选项C对应的展现信息C、资源候选项D对应的展现信息D及资源候选项E对应的展现信息E的排序如下所示,并通过用户设备2将排序后的展现信息提供给所述用户1:
展现信息C;
展现信息D;
展现信息E。
需要说明的是,提供装置34可根据实际情况,例如,用户设备2所请求的展现信息数量少于资源候选项数量等,选择部分资源候选项来生成展现信息,提供给用户1。
图7示出了本发明另一个优选实施例的用于确定资源候选项的排序结果的排序确定装置示意图。所述排序确定装置包括:第一获取装置31、检索装置32、排序装置33及提供装置34。所述排序装置33还包括第二子排序装置332。
具体的,用户设备2将用户1输入的输入序列发送至计算机设备3的过程已在参照图5所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,第一获取装置31由计算机设备所接收的所述输入序列中获取检索信息及调整信息。
例如,所述第一获取装置31由计算机设备所接收的输入序列“李弘基主演的电视剧”中获取检索信息“李弘基”与“电视剧”以及调整信息“主演”。其中,所述第一获取装置31由输入序列中获取检索信息及调整信息的方式已在参照图5所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,检索装置32根据所述检索信息进行检索,以获得多个资源候选项。
例如,所述检索装置32根据检索单元“李弘基”与检索单元“电视剧”进行检索,获得的资源候选项包括:资源候选项A1、资源候选项B1和资源候选项C1。
接着,第二子排序装置332根据所述调整信息及所述检索信息,确定所述多个资源候选项的排序结果。
例如,检索装置32获得资源候选项A1、资源候选项B1和资源候选项C1,第二子排序装置332获得资源候选项A1包含检索信息“李弘基”与“电视剧”及调整信息“主演”,资源候选项B1包含检索信息“李弘基”与“主演”,资源候选项C1包含检索信息“李弘基”,则所述第二子排序装置332确定同时包含检索信息和调整信息的资源候选项A1排序位于资源候选项B1和资源候选项C1之前,并对仅包含检索信息的资源候选项B1及资源候选项C1随机排序,获得排序结果如下:
资源候选项A1;
资源候选项B1;
资源候选项C1。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述调整信息及所述检索信息,确定所述多个资源候选项的排序结果的实现方式,均应包含在本发明的范围内。
接着,提供装置34根据所述排序结果来生成展现信息以提供给所述用户1。其中,提供装置34根据所述排序结果来生成展现信息以提供给所述用户1的方式已在参照图5所示实施例的提供装置34中予以详述,并以引用的方式包含于此,不再赘述。
图8示出了本发明另再一个方面优选实施例的用于确定资源候选项的排序结果对检索结果进行排序的方法的流程图。所述排序确定装置包括:第一获取装置31、检索装置32、排序装置33、第三获取装置36及提供装置34。所述排序装置33还包括:第二子排序装置332,所述第二子排序装置332还包括:第三子排序装置333。
具体的,用户设备2将用户1输入的输入序列发送至计算机设备3的过程已在图5所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
接着,第一获取装置31由计算机设备所接收的输入序列中获取检索信息及调整信息。其中,所述调整信息包括一个或多个调整单元;所述检索信息包括一个或多个检索单元。
例如,所述第一获取装置31由计算机设备所接收的输入序列“李弘基主演和参演的电视剧”中获取包括检索单元“李弘基”与检索单元“电视剧”的检索信息以及包括调整单元“主演”与调整单元“参演”的调整信息。
上述所述第一获取装置31由计算机设备3所接收的输入序列中获取检索信息及调整信息的方式与图5所示的第一获取装置31由输入序列中获取检索信息及调整信息的方式相同或相似,并以引用的方式包含于此,不再赘述。
接着,检索装置32根据所述检索信息进行检索,以获得多个资源候选项。
例如,所述检索装置32根据检索单元“李弘基”与检索单元“电视剧”进行检索,获得的资源候选项包括:资源候选项C1、资源候选项D1、资源候选项E1等等。
接着,第三获取装置36获取用于辅助确定所述排序结果的第二排序辅助信息。其中,所述第二排序辅助信息包括但不限于以下至少一项:
1)各个调整单元的权重信息。该内容已在对图6所示的第二获取装置35的说明中予以详述,并以引用的方式包含于此,不再赘述。
2)所述多个资源候选项中每个资源候选项的调整单元分布信息。该内容已在对图6所示的第二获取装置35的说明中予以详述,并以引用的方式包含于此,不再赘述。
3)各个检索单元的权重信息。例如,所述第三获取装置36获取检索单元“李弘基”的权重信息,例如为5,获取检索单元“电视剧”的权重,例如为1。本领域技术人员应该理解,上述采用数值来表示权重信息仅仅只是列示,而非对本发明的限定,事实上,权重信息也可以以其他方式来表示,例如,以等级来表示等等。
4)所述多个资源候选项中每个资源候选项的检索单元分布信息。其中,所述检索单元分布信息包括但不限于以下至少一项:
a)该检索单元分布信息所对应的资源候选项中各个检索单元的出现次数。
例如,所述检索装置32获得的资源候选项包括资源候选项C1、资源候选项D1及资源候选项E1,第三获取装置36统计获得各资源候选项中调整单元的出现次数为:
资源候选项C1:检索单元“李弘基”出现2次,检索单元“电视剧”出现2次;
资源候选项D1:检索单元“李弘基”出现1次,检索单元“电视剧”出现1次;
资源候选项E1:检索单元“李弘基”出现1次,检索单元“电视剧”出现1次。
b)该检索单元分布信息所对应的资源候选项中各个检索单元的出现位置。
其中,所述出现位置包括但不限于:标题、摘要、正文、诸如UGC等的多媒体资源说明性内容等,所述位置可通过资源候选项所对应信息的标签或文本信息,例如,<title>、“摘要”等,来识别。
例如,所述检索装置32所获得的资源候选项包括资源候选项F1及资源候选项G1,第三获取装置36根据资源候选项所对应信息的标签获得各个资源候选项中各个检索单元的出现位置为:
资源候选项F1的标题中包含检索单元“李弘基”与检索单元“电视剧”;
资源候选项G1的标题中包含检索单元“李弘基”,摘要中包含检索单元“电视剧”。
c)该检索单元分布信息所对应的资源候选项中不同检索单元的数量。
例如,所述检索装置32所获得的资源候选项包括资源候选项H1和资源候选项I1,第三获取装置36获得资源候选项H1中包括检索单元“李弘基”和“电视剧”,资源候选项I1中包括检索单元“李弘基”;则第三获取装置36确定各资源候选项中不同检索单元的数量为:
资源候选项H1:2;
资源候选项I1:1。
3)所述多个资源候选项中每个资源候选项的预定质量信息。该预定质量信息已在对图6所示的实施例的第二获取装置35的说明中予以详述,并以引用的方式包含于此,不再赘述。
接着,第三子排序装置333根据所有调整单元及所有检索单元,并结合所述第二排序辅助信息,来确定所述多个资源候选项的排序结果。
具体地,第三子排序装置333根据所述第二排序辅助信息中的至少一项来确定所述多个资源候选项的排序结果。
具体地,第三子排序装置333确定所述排序结果的方式包括但不限于:
1)先根据所述第二排序辅助信息中的一项来确定所述多个资源候选项的初始排序结果,然后再根据所述第二排序辅助信息中的至少一项来调整该初始排序结果以获得所述排序结果;
2)仅根据所述第二排序辅助信息中的一项来确定所述多个资源候选项的排序结果;
3)根据所述第二排序辅助信息中的多项来直接确定所述多个资源候选项的排序结果等。
例如,所述第三获取装置36获得检索单元“李弘基”在资源候选项C1中出现2次、在资源候选项D1中出现1次、在资源候选项E1中出现1次,且检索单元“电视剧”在资源候选项C1中出现2次、在资源候选项D1中出现1次、在资源候选项E1中出现1次,则所述第三子排序装置333确定两个检索单元在资源候选项C1中出现四次,两个检索单元在资源候选项D1中出现两次,两个检索单元在资源候选项E1中出现两次,且资源候选项D1包含2个调整单元,资源候选项E1包含一个调整单元的信息,则第三子排序装置333先根据检索单元的出现次数进行排序以获得初始排序结果,再根据调整单元数量来调整该初始排序结果,获得资源候选项C1、资源候选项D1与资源候选项E1的排序结果如下:
资源候选项C1;
资源候选项D1;
资源候选项E1。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所有调整单元及所有检索单元,并结合所述第二排序辅助信息,来确定所述多个资源候选项的排序结果的实现方式,均应包含在本发明的范围内。例如:1)所述第三子排序装置333基于检索单元在各资源候选项中的出现位置来排序,例如,将检索单元出现在标题位置的资源候选项排序在检索单元出现在摘要位置的资源候选项之前;2)所述第三子排序装置333基于各资源候选项中的不同检索单元的数量来排序,例如,将包含检索单元的数量多的资源候选项排序在包含检索单元的数量少的资源候选项之前;3)所述第三子排序装置333基于每个资源候选项的质量信息来排序,例如,将权威网站或者优质网站对应的资源候选项排序在前;4)所述第三子排序装置333同时基于检索单元和调整单元的权重信息来排序,例如,权重信息包括权重值,第三子排序装置333将各资源候选项中各自包含的检索单元权重值和调整单元权重值相乘获得总权重值,再基于总权重值来对各资源候选项排序;5)所述第三子排序装置333基于检索单元的的分布信息来对各资源候选项进行排序,对分布信息相同者,再基于调整单元的分布信息或者资源候选项的质量信息来排序等等。
接着,提供装置34根据所述排序结果来生成展现信息,并通过用户设备2提供给所述用户1。
其中,所述提供装置34根据所述排序结果来生成展现信息,并通过用户设备2提供给所述用户1的方式已在对图7所示的实施例的提供装置34的说明中予以详述,并以引用的方式包含于此,不再赘述。
作为本发明的优选方案之一,所述排序确定装置还包括第五获取装置(未予图示)与更新装置(未予图示)。其中,所述第五获取装置获取信息单元及其类型;接着,所述更新装置根据所述信息单元及其类型,建立或更新所述预定关键词类型库。
其中,第五获取装置进一步包括关键词获取装置(未予图示)、第六获取装置(未予图示)与类型确定装置(未予图示)。所述关键词获取装置获取所述信息单元;接着,所述第六获取装置获取用于确定所述信息单元类型的第二类型确定信息;接着,所述类型确定装置根据所述第二类型确定信息来确定该信息单元的类型。
其中,所述关键词获取装置获取信息单元的方式包括但不限于:
1)由用户输入序列中获取。例如,所述关键词获取装置由多个用户输入的输入序列中获得信息单元。例如,所述关键词获取装置由计算机设备3所接收的用户A输入的输入序列“电视剧A”、用户B输入的输入序列“电视剧B”中获得两个输入序列中相同的部分“电视剧”,并将该相同部分“电视剧”作为信息单元。再例如,所述关键词获取装置将输入序列“演员李弘基”进行切词,获得“演员”和“李弘基”,将“演员”和“李弘基”作为信息单元。
2)由输入法的词库中获取。例如,所述关键词获取装置由输入法词库中获取“主演”和“参演”,并将“主演”和“参演”作为信息单元。
3)获取预设的信息单元等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述信息单元的实现方式,均应包含在本发明的范围内。
接着,所述第六获取装置确定所述信息单元类型的第二类型确定信息。其中,所述第二类型确定信息包括但不限于以下至少一项:
1)信息单元在预定语料库中的分布集中度。其中,所述预定预料库中包含多个语料。其中,所述分布集中度表示信息单元在预定语料库的多个语料中的分布集中程度,该分布集中度根据该信息单元在预定语料库中的出现信息及包含该信息单元的不同语料的数量信息来获得。
其中,所述出现信息以下至少一项:
1)该信息单元在预定语料库中的出现次数;
2)该信息单元在预定语料库中的出现次数占语料库中所有关键词数量的比例;
所述数量信息包括以下至少一项:
1)包含该信息单元的不同语料的数量;
2)包含该信息单元的不同语料的数量占所有语料的数量的比例。
例如,所述第六获取装置获得信息单元“李弘基”在所述预定语料库的各语料中共出现1000次,且预定语料库中包含信息单元“李弘基”的不同语料的数量为500,则分布集中度=1000/500=2等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据该信息单元在预定语料库中的出现信息及包含该信息单元的不同语料的数量信息来获得分布集中度的实现方式,均应包含在本发明的范围内。
2)根据该信息单元来获得的语义分析结果。其中,所述语义分析包括但不限于信息单元的词性,如名词、动词,形容词等等。例如,所述第六获取装置对信息单元“李弘基”进行词性分析获得语义分析结果为名词。
3)包含该信息单元且匹配同一语料的用户历史输入序列数量。
其中,所述匹配同一语料的用户历史输入序列为检索结果中包含同一语料的用户历史输入序列,例如,三个用户历史输入序列“iphone4签售”、“iphone4发售”、“iphone4开卖”的检索结果中均包含同一语料“iphone4的销售额已突破…”,则“iphone4签售”、“iphone4发售”及“iphone4开卖”为匹配同一语料的用户历史输入序列。
则对于信息单元“iphone4”,若包含其的用户历史输入序列包括“iphone4签售”、“iphone4发售”、“iphone4开卖”、“iphone4游戏”及“iphone4娱乐”,其中,“iphone4签售”、“iphone4发售”及“iphone4开卖”匹配同一语料,“iphone4游戏”及“iphone4娱乐”匹配同一语料,则所述第六获取装置确定包含该信息单元“iphone4”且匹配同一语料的用户历史输入序列数量为5。
接着,类型确定装置根据所述第二类型确定信息来确定该信息单元的类型。其中,所述类型包括:检索类型和调整类型等;优选地,还包括需要从输入序列中去除的无效类型等。
例如,所述第六获取装置获得该信息单元“李弘基”在预定预料库中的分布集中度为6.5,则类型确定装置判断该分布集中度6.5超过分布预定阈值4,并确定该信息单元“李弘基”的类型为检索类型。
又例如,所述第六获取装置获得信息单元“电视剧”的语义分析结果为名词,则类型确定装置基于该语义分析结果将该信息单元“电视剧”的类型确定为检索类型。再例如,所述第六获取装置获得信息单元“主演”的语义分析结果为动词,则类型确定装置基于语义分析结果将该信息单元“主演”确定为调整类型。再例如,所述第六获取装置获得信息单元“的”的语义分析结果为助词,则类型确定装置基于语义分析结果将该信息单元“的”确定为无效类型。
又例如,第六获取装置获得该信息单元“李弘基”且匹配同一语料的用户历史输入序列数量为1000,高于预定判断阈值,则类型确定装置确定将该信息单元“李弘基”的类型为检索类型。
又例如,第六获取装置获得该信息单元“李弘基”的语义分析结果为名词且匹配同一语料的用户历史输入序列数量为1000,则类型确定装置根据当名词的匹配同一语料的用户历史输入序列数量超所900时将其该名词定为检索类型的预定规则,确定该信息单元“李弘基”的类型为检索类型。
又例如,第六获取装置获得该信息单元“李弘基”的分布集中度为6.5且匹配同一语料的用户历史输入序列数量为1000,则排序确定装置先将分布集中度及匹配同一语料的用户历史输入序列数量归一化,然后相加,信息单元“李弘基”的综合评价值为1.2,高于综合预定阈值,则确定将该信息单元“李弘基”的类型为检索类型。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述第二类型确定信息来确定该信息单元的类型的实现方式,均应包含在本发明的范围内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (24)
1.一种计算机设备实现的用于确定资源候选项的排序结果的方法,其中,该方法包括以下步骤:
a由来自用户的输入序列中获取检索信息及调整信息,其中,所述调整信息包含于所述输入序列中;
b仅根据所述检索信息进行检索,以获得多个资源候选项;
c根据所述调整信息,确定所述多个资源候选项的排序结果;
d根据所述排序结果来生成展现信息,以提供给所述用户;
其中,该方法还包括以下步骤:
-获取用于确定所述检索信息及所述调整信息的第一类型确定信息;
其中,所述步骤a包括以下步骤:
-根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息;
其中,所述第一类型确定信息包括以下至少一项:
-根据所述输入序列在预定关键词类型库中查询所得的信息单元及其类型;
-根据所述输入序列来获得的语义分析结果。
2.根据权利要求1所述的方法,其中,所述调整信息包括一个或多个调整单元,其中,该方法还包括:
-获取用于辅助确定所述排序结果的第一排序辅助信息;
其中,所述步骤c包括以下步骤:
-根据所有调整单元,并结合所述第一排序辅助信息,来确定所述多个资源候选项的排序结果。
3.根据权利要求2所述的方法,其中,所述第一排序辅助信息包括以下至少一项:
-各个调整单元的权重信息;
-所述多个资源候选项中每个资源候选项的调整单元分布信息;
-所述多个资源候选项中每个资源候选项的质量信息。
4.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤:
-根据所述调整信息及所述检索信息,确定所述多个资源候选项的排序结果。
5.根据权利要求4所述的方法,其中,所述调整信息包括一个或多个调整单元,所述检索信息包括一个或多个检索单元,其中,所述方法还包括:
-获取用于辅助确定所述排序结果的第二排序辅助信息;
其中,所述步骤c包括以下步骤:
-根据所有调整单元及所有检索单元,并结合所述第二排序辅助信息,来确定所述多个资源候选项的排序结果。
6.根据权利要求5所述的方法,其中,所述第二排序辅助信息包括以下至少一项:
-各个调整单元的权重信息;
-所述多个资源候选项中每个资源候选项的调整单元分布信息;
-各个检索单元的权重信息;
-所述多个资源候选项中每个资源候选项的检索单元分布信息;
-所述多个资源候选项中每个资源候选项的质量信息。
7.根据权利要求3或6所述的方法,其中,所述调整单元分布信息包括以下至少一项:
-该调整单元分布信息所对应的资源候选项中各个调整单元的出现次数;
-该调整单元分布信息所对应的资源候选项中各个调整单元的出现位置;
-该调整单元分布信息所对应的资源候选项中不同调整单元的数量。
8.根据权利要求6所述的方法,其中,所述检索单元分布信息包括以下至少一项:
-该检索单元分布信息所对应的资源候选项中各个检索单元的出现 次数;
-该检索单元分布信息所对应的资源候选项中各个检索单元的出现位置;
-该检索单元分布信息所对应的资源候选项中不同检索单元的数量。
9.根据权利要求3或6或8中任一项所述的方法,其中,所述质量信息包括以下至少一项:
-该质量信息所对应的资源候选项的权威性;
-该质量信息所对应的资源候选项的优质度。
10.根据权利要求1所述的方法,其中,该方法还包括以下步骤:
x获取信息单元及其类型;
y根据所述信息单元及其类型,建立或更新所述预定关键词类型库。
11.根据权利要求10所述的方法,其中,所述步骤x包括以下步骤:
-获取所述信息单元;
-获取用于确定所述信息单元类型的第二类型确定信息;
-根据所述第二类型确定信息来确定该信息单元的类型;
其中,所述第二类型确定信息包括以下至少一项:
-该信息单元在预定语料库中的分布集中度;
-根据该信息单元来获得的语义分析结果;
-包含该信息单元且匹配同一语料的用户历史输入序列数量。
12.根据权利要求1至6中任一项所述的方法,其中,所述步骤a包括以下步骤:
-获取来自用户的输入序列;
-去除所述输入序列中的无效信息,以获得可用信息;
-由所述可用信息中获取所述检索信息及所述调整信息。
13.一种用于确定资源候选项的排序结果的排序确定装置,其中,该排序确定装置包括:
第一获取装置,用于由来自用户的输入序列中获取检索信息及调整信息,其中,所述调整信息包含于所述输入序列中;
检索装置,用于仅根据所述检索信息进行检索,以获得多个资源候选项;
排序装置,用于根据所述调整信息,确定所述多个资源候选项的排序结果;
提供装置,用于根据所述排序结果来生成展现信息,以提供给所述用户;
其中,所述排序确定装置还包括:
第四获取装置,用于获取用于确定所述检索信息及所述调整信息的第一类型确定信息;
其中,所述第一获取装置包括:
第一子获取装置,用于根据所述第一类型确定信息,由来自用户的输入序列中获取所述检索信息及所述调整信息;
其中,所述第一类型确定信息包括以下至少一项:
-根据所述输入序列在预定关键词类型库中查询所得的信息单元及其类型;
-根据所述输入序列来获得的语义分析结果。
14.根据权利要求13所述的排序确定装置,其中,所述调整信息包括一个或多个调整单元,其中,所述排序确定装置还包括:
第二获取装置,用于获取用于辅助确定所述排序结果的第一排序辅助信息;
其中,所述排序装置包括:
第一子排序装置,用于根据所有调整单元,并结合所述第一排序辅助信息,来确定所述多个资源候选项的排序结果。
15.根据权利要求14所述的排序确定装置,其中,所述第一排序辅助信息包括以下至少一项:
-各个调整单元的权重信息;
-所述多个资源候选项中每个资源候选项的调整单元分布信息;
-所述多个资源候选项中每个资源候选项的质量信息。
16.根据权利要求13所述的排序确定装置,其中,所述排序装置包 括:
第二子排序装置,用于根据所述调整信息及所述检索信息,确定所述多个资源候选项的排序结果。
17.根据权利要求16所述的排序确定装置,其中,所述调整信息包括一个或多个调整单元,所述检索信息包括一个或多个检索单元,其中,所述排序确定装置还包括:
第三获取装置,用于获取用于辅助确定所述排序结果的第二排序辅助信息;
其中,所述第二子排序装置包括:
第三子排序装置,用于根据所有调整单元及所有检索单元,并结合所述第二排序辅助信息,来确定所述多个资源候选项的排序结果。
18.根据权利要求17所述的排序确定装置,其中,所述第二排序辅助信息包括以下至少一项:
-各个调整单元的权重信息;
-所述多个资源候选项中每个资源候选项的调整单元分布信息;
-各个检索单元的权重信息;
-所述多个资源候选项中每个资源候选项的检索单元分布信息;
-所述多个资源候选项中每个资源候选项的质量信息。
19.根据权利要求15或18所述的排序确定装置,其中,所述调整单元分布信息包括以下至少一项:
-该调整单元分布信息所对应的资源候选项中各个调整单元的出现次数;
-该调整单元分布信息所对应的资源候选项中各个调整单元的出现位置;
-该调整单元分布信息所对应的资源候选项中不同调整单元的数量。
20.根据权利要求18所述的排序确定装置,其中,所述检索单元分布信息包括以下至少一项:
-该检索单元分布信息所对应的资源候选项中各个检索单元的出现 次数;
-该检索单元分布信息所对应的资源候选项中各个检索单元的出现位置;
-该检索单元分布信息所对应的资源候选项中不同检索单元的数量。
21.根据权利要求15或18或20中任一项所述的排序确定装置,其中,所述质量信息包括以下至少一项:
-该质量信息所对应的资源候选项的权威性;
-该质量信息所对应的资源候选项的优质度。
22.根据权利要求13所述的排序确定装置,其中,所述排序确定装置还包括:
第五获取装置,用于获取信息单元及其类型;
更新装置,用于根据所述信息单元及其类型,建立或更新所述预定关键词类型库。
23.根据权利要求22所述的排序确定装置,其中,所述第五获取装置包括:
关键词获取装置,用于获取所述信息单元;
第六获取装置,用于获取用于确定所述信息单元类型的第二类型确定信息;
类型确定装置,用于根据所述第二类型确定信息来确定该信息单元的类型;
其中,所述第二类型确定信息包括以下至少一项:
-该信息单元在预定语料库中的分布集中度;
-根据该信息单元来获得的语义分析结果;
-包含该信息单元且匹配同一语料的用户历史输入序列数量。
24.根据权利要求13至18中任一项所述的排序确定装置,其中,所述第一获取装置包括:
输入序列获取装置,用于获取来自用户的输入序列;
去除装置,用于去除所述输入序列中的无效信息,以获得可用信息;
第二子获取装置,用于由所述可用信息中获取所述检索信息及所述调整信息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110092452.3A CN102163228B (zh) | 2011-04-13 | 2011-04-13 | 用于确定资源候选项的排序结果的方法、装置及设备 |
PCT/CN2011/083406 WO2012139394A1 (zh) | 2011-04-13 | 2011-12-02 | 用于确定资源候选项的排序结果的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110092452.3A CN102163228B (zh) | 2011-04-13 | 2011-04-13 | 用于确定资源候选项的排序结果的方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102163228A CN102163228A (zh) | 2011-08-24 |
CN102163228B true CN102163228B (zh) | 2014-10-08 |
Family
ID=44464455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110092452.3A Active CN102163228B (zh) | 2011-04-13 | 2011-04-13 | 用于确定资源候选项的排序结果的方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102163228B (zh) |
WO (1) | WO2012139394A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163228B (zh) * | 2011-04-13 | 2014-10-08 | 北京百度网讯科技有限公司 | 用于确定资源候选项的排序结果的方法、装置及设备 |
CN110096706A (zh) * | 2011-09-01 | 2019-08-06 | 上海触乐信息科技有限公司 | 便携式设备上基于地理位置动态调整候选词的系统及方法 |
CN102521717B (zh) * | 2011-12-30 | 2016-03-30 | 山东中创软件工程股份有限公司 | 一种配置管理资源库信息统计的方法与装置 |
CN102982137A (zh) * | 2012-11-16 | 2013-03-20 | 北京百度网讯科技有限公司 | 资源的搜索方法、系统和装置 |
CN103869998B (zh) * | 2012-12-11 | 2018-05-01 | 百度国际科技(深圳)有限公司 | 一种对输入法所产生的候选项进行排序的方法及装置 |
CN104035934B (zh) * | 2013-03-06 | 2019-01-15 | 腾讯科技(深圳)有限公司 | 一种多媒体信息推荐的方法及装置 |
CN103258023B (zh) * | 2013-05-07 | 2016-08-31 | 百度在线网络技术(北京)有限公司 | 搜索候选词的推荐方法及搜索引擎 |
CN103268310A (zh) * | 2013-05-14 | 2013-08-28 | 百度在线网络技术(北京)有限公司 | 基于推荐的自媒体信息编辑方法及装置 |
CN104462510B (zh) * | 2014-12-22 | 2018-09-11 | 北京奇虎科技有限公司 | 基于用户搜索意图的搜索方法及装置 |
CN105701155B (zh) * | 2015-12-30 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN108762804B (zh) * | 2018-04-24 | 2021-11-19 | 创新先进技术有限公司 | 灰度发布新产品的方法和装置 |
CN111522448B (zh) * | 2019-02-02 | 2024-04-30 | 北京搜狗科技发展有限公司 | 一种提供输入候选项的方法、装置和设备 |
TWI782710B (zh) * | 2021-09-17 | 2022-11-01 | 兆豐國際商業銀行股份有限公司 | 用於排序及顯示應用程式選項的電子裝置及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158971A (zh) * | 2007-11-15 | 2008-04-09 | 深圳市迅雷网络技术有限公司 | 一种基于搜索引擎的搜索结果排序方法及装置 |
CN101233513A (zh) * | 2005-07-29 | 2008-07-30 | 雅虎公司 | 对结果集进行重排序的系统和方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060200460A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | System and method for ranking search results using file types |
CN102163228B (zh) * | 2011-04-13 | 2014-10-08 | 北京百度网讯科技有限公司 | 用于确定资源候选项的排序结果的方法、装置及设备 |
-
2011
- 2011-04-13 CN CN201110092452.3A patent/CN102163228B/zh active Active
- 2011-12-02 WO PCT/CN2011/083406 patent/WO2012139394A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101233513A (zh) * | 2005-07-29 | 2008-07-30 | 雅虎公司 | 对结果集进行重排序的系统和方法 |
CN101158971A (zh) * | 2007-11-15 | 2008-04-09 | 深圳市迅雷网络技术有限公司 | 一种基于搜索引擎的搜索结果排序方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102163228A (zh) | 2011-08-24 |
WO2012139394A1 (zh) | 2012-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102163228B (zh) | 用于确定资源候选项的排序结果的方法、装置及设备 | |
CN104035966B (zh) | 一种提供扩展搜索项的方法与装置 | |
CN103279513B (zh) | 产生内容标签的方法、提供多媒体内容信息的方法及装置 | |
CN102822815B (zh) | 用于利用浏览器历史进行动作建议的方法和系统 | |
CN102368262B (zh) | 一种提供与查询序列相对应的搜索建议的方法与设备 | |
CN104111941B (zh) | 信息展示的方法及设备 | |
US10140366B2 (en) | Finding data in connected corpuses using examples | |
CN101984420B (zh) | 一种基于拆词处理进行图片搜索的方法与设备 | |
CN101446959A (zh) | 一种基于互联网的新闻推荐方法和系统 | |
CN105518661B (zh) | 经由挖掘的超链接文本的片段来浏览图像 | |
CN106415537A (zh) | 本地应用的触发和排名 | |
CN103886090A (zh) | 基于用户喜好的内容推荐方法及装置 | |
CN103631803A (zh) | 基于输入行为的进行广告定向的方法、装置及服务器 | |
CN104885081A (zh) | 搜索系统和相应方法 | |
CN104160712A (zh) | 计算媒体节目之间的相似度 | |
CN103034663A (zh) | 一种信息搜索方法和设备 | |
CN102184185A (zh) | 一种用于多媒体资源搜索的方法与设备 | |
CN103699700A (zh) | 一种搜索引导的生成方法、系统及相关服务器 | |
CN103092943A (zh) | 一种广告调度的方法和广告调度服务器 | |
CN102004772A (zh) | 一种用于根据检索词进行搜索结果排序的方法及设备 | |
CN103577405A (zh) | 基于兴趣分析的微博博主社区分类方法 | |
CN103744887A (zh) | 一种用于人物搜索的方法、装置和计算机设备 | |
CN106294358A (zh) | 一种信息的检索方法及系统 | |
CN104503988A (zh) | 搜索方法及装置 | |
CN107357911A (zh) | 一种文本输入方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |