CN107229624A - 一种页面提供方法和页面提供装置 - Google Patents

一种页面提供方法和页面提供装置 Download PDF

Info

Publication number
CN107229624A
CN107229624A CN201610170224.6A CN201610170224A CN107229624A CN 107229624 A CN107229624 A CN 107229624A CN 201610170224 A CN201610170224 A CN 201610170224A CN 107229624 A CN107229624 A CN 107229624A
Authority
CN
China
Prior art keywords
page
keyword
record
feature database
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610170224.6A
Other languages
English (en)
Inventor
袁洁
田丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610170224.6A priority Critical patent/CN107229624A/zh
Publication of CN107229624A publication Critical patent/CN107229624A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种页面提供方法和页面提供装置。所述页面提供方法包括:接收用户终端设备发送的检索信息;从特征库中筛选与所述检索信息匹配的记录;获取与所筛选出的记录对应的页面;以及向所述用户终端设备提供所获取的页面;其中,所述特征库中的每条记录为针对各页面所提取的O2O特征,所述O2O特征为与线下实体店的产品或服务相关的信息。根据本申请所述的页面提供方法和页面提供装置提高了用户检索的准确性并且减少了用户检索所花费的时间。

Description

一种页面提供方法和页面提供装置
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及基于线上到线下(O2O)模式的页面提供方法和页面提供装置。
背景技术
O2O(Online To Offline)是指将线下的实体店铺与互联网结合的一种技术。用户可以通过O2O模式的在线网络平台浏览线下实体店及其产品或服务,并查询满足自身需求的线下实体店及其产品或服务。
然而,当用户通过在线网络平台进行这种查询时,为了找到符合用户需求的线下实体店铺(或其产品、服务),通常需要用户在网页上设置各种筛选条件。作为这种查询的结果,通常会向用户呈现符合其需求的线下实体店铺(或其产品、服务)的列表,而不会直接向用户呈现其需要的线下实体店铺(或其产品、服务)的页面。
发明内容
本申请的目的在于提供一种页面提供方法和页面提供装置,来解决以上背景技术部分提到的问题。
在本申请的一个方面,提供了一种页面提供方法,所述方法包括:接收用户终端设备发送的检索信息;从特征库中筛选与所述检索信息匹配的记录;获取与所筛选出的记录对应的页面;以及向所述用户终端设备提供所获取的页面;其中,所述特征库中的每条记录为针对各页面所提取的O2O特征,所述O2O特征为与线下实体店的产品或服务相关的信息。
可选地,所述方法还包括:提取页面上的O2O特征;将针对所述页面所提取的O2O特征作为记录存储在所述特征库中。
可选地,所述提取页面上的O2O特征包括:通过HTML解析来提取所述页面上的O2O特征。
可选地,所述从特征库中筛选与所述检索信息匹配的记录,包括:提取所述检索信息中的关键词并建立关键词集;计算所述关键词集与所述特征库中的每条记录的相似度;以及基于所计算出的相似度选择与所述检索信息匹配的记录。
可选地,所述提取所述检索信息中的关键词并建立关键词集,包括:对所述检索信息进行分解,以提取所述检索信息中的所述关键词;对于所提取出的关键词进行扩展以生成扩展关键词;基于所提取出的关键词以及所生成的扩展关键词建立所述关键词集;其中,所述扩展关键词包括所提取出的关键词的同义词、所提取出的关键词的近义词或其组合。
可选地,所述计算所述关键词集与所述特征库中的每条记录的相似度,包括:对于所述特征库中的每条记录的相应特征分配权重;基于所述权重计算所述关键词集与所述特征库中的每条记录的相似度。
可选地,所述O2O特征包括与所述线下实体店的产品或服务的地理位置、价格、有效期、评价或其组合有关的信息。
在本申请的另一方面,提供了一种页面提供装置,所述页面提供装置包括:存储单元,被配置成存储特征库,所述特征库中的每条记录为针对各页面所提取的O2O特征;接收单元,被配置成接收从用户终端发送的检索信息;筛选单元,被配置成从所述特征库中筛选与所述检索信息匹配的记录;页面获取单元,用于获取与所筛选出的记录对应的页面;以及页面提供单元,被配置成向所述用户终端设备提供所获取的页面,其中,所述O2O特征为与线下实体店的产品或服务相关的信息。
可选地,所述的页面提供装置还包括提取单元,所述提取单元被配置成提取页面上的O2O特征。
可选地,所述提取单元通过执行HTML解析来提取所述页面上的特征。
可选地,所述筛选单元进一步被配置成包括:关键词提取模块,被配置成提取所述检索信息中的关键词并建立关键词集;相似度计算模块,用于计算所述关键词集与所述特征库中的每条记录之间的相似度;以及选择模块,用于基于所述相似度计算单元所计算出的相似度选择与所述检索信息匹配的记录。
可选地,所述关键词提取模块进一步被配置成:对所述检索信息进行分解,以提取出所述检索信息中的所述关键词;对于所提取出的关键词进行扩展以生成扩展关键词;基于所提取出的关键词以及所生成的扩展关键词建立所述关键词集;其中,所述扩展关键词包括所提取出的关键词的同义词、所提取出的关键词的近义词或其组合。
可选地,所述相似度计算模块进一步被配置成:对于所述特征库中的每条记录的相应特征分配权重,并基于所述权重计算所述关键词集与所述特征库中的每条记录的相似度。
可选地,所述O2O特征包括与所述线下实体店的产品或服务的地理位置、价格、有效期、评价或其组合有关的信息。
根据本申请所述的页面提供方法和页面提供装置通过将用户输入的检索信息与基于O2O页面特征建立的特征库中的每条记录进行比较来直接筛选出用户期望的页面,提高了用户检索的准确性并且减少了用户检索所花费的时间。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图。
图2示出了根据本申请的一个实施例的页面提供方法的流程图。
图3示出了图2所示的页面提供方法的子流程图。
图4示出了根据本申请的一个实施例的页面提供装置的示意图。
图5示出了图4所示的页面提供装置的筛选单元的配置图。
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的页面提供方法或页面提供装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持在线交易的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的网页提供支持的后台网页服务器。后台网页服务器可以对接收到的网页页面请求等数据进行分析等处理,并将处理结果(例如网页页面数据)反馈给终端设备。
需要说明的是,本申请实施例所提供的页面提供方法一般由服务器105执行,相应地,页面提供装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下参照图2描述根据本申请的一个实施例的页面提供方法。
在步骤201中,接收用户在终端设备的显示屏上的检索框内所输入的检索语句。
在步骤202中,从该页面提供方法运行于其上的电子设备(例如图1所示的服务器)的存储单元中所存储的特征库中筛选与所接收到的检索语句匹配的记录。该特征库中的每条记录为针对终端设备上所显示的各页面所提取的O2O特征,其中,O2O特征为与线下实体店的产品或服务相关的信息。
在本申请的一些实施例中,O2O特征包括与线下实体店的产品或服务的地理位置、价格、有效期、评价等有关的信息。例如,假设页面上显示的产品为“***店的双人套餐”,该页面上显示有如下信息:该产品所在店的地理位置为北京市海淀区五道口华联商城;该双人套餐的价格为RMB 200元;该双人套餐的使用期为2016年1月1日至2016年2月1日;98%的顾客对该双人套餐给出了好评等。因此,针对该页面所提取的O2O特征为{双人套餐、五道口华联商城、RMB200、2016/1/1~2016/2/1、98%好评}。
在本申请的一个实施例中,可以通过图3所示的流程来实现步骤202。
如图3所示,在步骤301中,提取用户输入的检索语句中所包括的关键词。
在本申请的一个实施例中,可以利用诸如全切分法对用户输入的检索语句进行分解,以提取该检索语句中所包括的所有关键词。例如,假设用户输入的检索语句为“五道口附近的最好的鲁菜馆”,则提取出的关键词包括“五道口”、“最好”和“鲁菜馆”。
可选地,可以对所提取出的关键词进行扩展以生成扩展关键词。例如,可以对所提取出的关键词进行同义词、近义词或关联词扩展。在如上所述的示例中,可以将关键词“鲁菜馆”扩展成为扩展关键词“山东菜馆”,将关键词“最好”扩展成为扩展关键词“最佳”。
然后,基于所提取出的关键词以及所生成的扩展关键词建立关键词集。例如,在上述示例中,关键词集为{五道口,最好,最佳,鲁菜馆,山东菜馆}。
接下来,在步骤302中,计算所建立的关键词集与特征库中的每条记录的相似度。
可以使用向量空间余弦法(Cosine Similarity)、皮尔森相关系数(Pearson Correlation Coefficient)法、Jaccard相似系数(JaccardCoefficient)法等计算关键词集与特征库中的每条记录的相似度。以下以Jaccard相似系数法为例计算关键词集与特征库中的每条记录的相似度。
假定特征库中存储有如表1中所示的n个特征F1,F2…,Fn-1,Fn,用户输入的检索语句为“五道口附近便宜的火锅”。在此情况下,在步骤301中所提取的关键词为“五道口”、“便宜”和“火锅”。对关键词“火锅”进行扩展,获得扩展关键词“涮肉”、“麻辣烫”。因此,针对用户输入的检索语句建立的关键词集为V{五道口,便宜,火锅,涮肉,麻辣烫}。
特征 店家名称 菜品 口味 地理位置 有效期 大众评点
F1 海底捞 火锅 家常 牡丹园 2016/1/1~2016/2/1 服务好
F2 东来顺 火锅 家常 五道口 2016/1/1~2016/2/1 好吃
Fn-1 阳坊 涮肉 家常 五道口 2016/1/1~2016/2/1 便宜
Fn 新辣道 鱼火锅 麻辣 回龙观 2016/1/1~2016/2/1 交通便利
表1
利用Jaccard相似系数法,特征F1与V之间的相似度S1=|F1∩V|/|F1∪V|=1/11;
特征F2与V之间的相似度S2=|F2∩V|/|F2∪V|=2/11;
特征Fn-1与V之间的相似度Sn-1=|Fn-1∩V|/|Fn-1∪V|=3/11;
特征Fn与V之间的相似度Sn=|Fn∩V|/|Fn∪V|=0/11。
接下来,在步骤303中,根据所计算出的相似度,选择特征库中与用户输入的检索语句匹配的记录。在本申请的一个实施例中,选择特征库中与关键词集相似度最高的特征。例如,在如上所示的示例中,选择特征Fn-1
可选地,在步骤302中,可以对于特征库中的每个特征的相应分量分配权重,并基于所分配的权重计算特征与关键词集之间的相似度。例如,对于“海底捞”、“东来顺”、“阳坊”、“新辣道”、“家常”、“麻辣”、“牡丹园”、“回龙观”、“服务好”、“便宜”、“好吃”、“交通便利”分配权重1,对于“火锅”、“五道口”分配权重5,则S1~Sn分别为5/15,10/19…,7/15,0。
返回参照图2,在步骤202中筛选出了与所接收到的检索语句匹配的记录之后,在步骤203中,获取与所筛选出的记录对应的页面。
在以上描述的示例中,获取与Fn-1(阳坊涮肉)匹配的页面。可以基于Fn-1的各分量(“阳坊”,“涮肉”,“家常”,“五道口”,“2016/1/1~2016/2/1”以及“便宜”)通过使用常用的搜索引擎(诸如,百度搜索引擎或谷歌搜索引擎等)来搜索与Fn-1匹配的页面。
可选地,为了提高处理速度,可以预先存储有对应于特征库中的各特征的页面,从而使得在筛选出与所接收到的检索语句匹配的记录之后,基于该记录的各分量从预先存储的页面中获取对应于该记录的页面。
在步骤204中,向用户终端设备提供所获取的页面。在上述示例中,向用户终端设备提供对应于Fn-1(阳坊涮肉)的页面,以供用户使用。
可选地,根据本申请的页面提供方法还可以包括提取页面上的O2O特征并将所提取的O2O特征存储在存储单元中所存储的特征库中。
在本申请的一个实施例中,通过HTML解析获得页面上的O2O特征。然而,应当注意,本领域的技术人员根据本申请公开的内容知道可以使用任何已知的页面内容抓取技术来提取页面上的O2O特征。
接下来,参照图4描述根据本申请的一个实施例的页面提供装置。
如图4所示,根据本申请的一个实施例的页面提供装置400包括:存储单元401、接收单元402、筛选单元403、页面获取单元404和页面提供单元405。
存储单元401被配置成存储特征库,该特征库中的每条记录为针对各页面所提取的O2O特征,其中,O2O特征为与线下实体店的产品或服务相关的信息,诸如以上表1中所示的特征F1,F2…,Fn-1,Fn
接收单元402被配置成接收用户输入的检索语句。筛选单元403被配置成从存储在存储单元401中的特征库中筛选与输入的检索语句匹配的记录,即筛选单元403用于执行图2中的步骤202。
在本申请的一个实施例中,筛选单元403可以被配置成执行如图3所示的流程。如图5所示,在这种情况下,筛选单元403被配置成包括关键词提取模块4031、相似度计算模块4032和选择模块4033。关键词提取模块4031用于提取用户输入的检索语句中所包括的关键词并建立关键词集。以上已经详细说明了关键词的提取方法和关键词集的建立方法,在此不再赘述。相似度计算模块4032用于计算关键词集与特征库中的每条记录之间的相似度。以上已经详细说明了相似度的计算方法,在此不再赘述。选择模块4033用于基于相似度计算单元4032所计算出的相似度,选择与所述检索信息匹配的记录。
返回图4,页面获取单元404被配置成基于筛选单元403所筛选出的记录,获取与所筛选出的记录对应的页面。即页面获取单元404用于执行图2中的步骤203。
页面提供单元405被配置成将所获取的页面提供给用户终端设备,即页面提供单元405用于执行图2中的步骤204。
可选地,根据本申请的页面提供装置400还可以包括用于提取页面上的O2O特征的提取单元406。提取单元406例如可以通过执行HTML解析来提取页面上的O2O特征。
根据以上说明可知,根据本申请的页面提供装置和页面提供方法通过将用户输入的检索信息与基于O2O页面特征建立的特征库中的每条记录进行比较来直接筛选出用户期望的页面,提高了用户检索的准确性并且减少了用户检索所花费的时间。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。CPU 601通过调用存储部分608中存储的上述计算机程序,来具体实现本申请的方法中限定的页面提供功能。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、筛选单元、页面提供单元等,其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收用户终端设备发送的检索信息;从特征库中筛选与所述检索信息匹配的记录;获取与所筛选出的记录对应的页面;以及向所述用户终端设备提供所获取的页面;其中,所述特征库中的每条记录为针对各页面所提取的O2O特征,所述O2O特征为与线下实体店的产品或服务相关的信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种页面提供方法,其特征在于,所述方法包括:
接收用户终端设备发送的检索信息;
从特征库中筛选与所述检索信息匹配的记录;
获取与所筛选出的记录对应的页面;以及
向所述用户终端设备提供所获取的页面;
其中,所述特征库中的每条记录为针对各页面所提取的O2O特征,所述O2O特征为与线下实体店的产品或服务相关的信息。
2.根据权利要求1所述的页面提供方法,其特征在于,所述方法还包括:
提取页面上的O2O特征;
将针对所述页面所提取的O2O特征作为记录存储在所述特征库中。
3.根据权利要求2所述的页面提供方法,其特征在于,所述提取页面上的O2O特征包括:通过HTML解析来提取所述页面上的O2O特征。
4.根据权利要求1所述的页面提供方法,其特征在于,所述从特征库中筛选与所述检索信息匹配的记录,包括:
提取所述检索信息中的关键词并建立关键词集;
计算所述关键词集与所述特征库中的每条记录的相似度;以及
基于所计算出的相似度选择与所述检索信息匹配的记录。
5.根据权利要求4所述的页面提供方法,其特征在于,所述提取所述检索信息中的关键词并建立关键词集,包括:
对所述检索信息进行分解,以提取所述检索信息中的所述关键词;
对于所提取出的关键词进行扩展以生成扩展关键词;
基于所提取出的关键词以及所生成的扩展关键词建立所述关键词集;
其中,所述扩展关键词包括所提取出的关键词的同义词、所提取出的关键词的近义词或其组合。
6.根据权利要求4所述的页面提供方法,其特征在于,所述计算所述关键词集与所述特征库中的每条记录的相似度,包括:
对于所述特征库中的每条记录的相应特征分配权重;
基于所述权重计算所述关键词集与所述特征库中的每条记录的相似度。
7.根据权利要求1-6中任意一项所述的页面提供方法,其特征在于,所述O2O特征包括与所述线下实体店的产品或服务的地理位置、价格、有效期、评价或其组合有关的信息。
8.一种页面提供装置,其特征在于,所述页面提供装置包括:
存储单元,被配置成存储特征库,所述特征库中的每条记录为针对各页面所提取的O2O特征;
接收单元,被配置成接收从用户终端设备发送的检索信息;
筛选单元,被配置成从所述特征库中筛选与所述检索信息匹配的记录;
页面获取单元,用于获取与所筛选出的记录对应的页面;以及
页面提供单元,被配置成向所述用户终端设备提供所获取的页面,
其中,所述O2O特征为与线下实体店的产品或服务相关的信息。
9.根据权利要求8所述的页面提供装置,还包括提取单元,所述提取单元被配置成提取页面上的O2O特征。
10.根据权利要求9所述的页面提供装置,其特征在于,所述提取单元通过执行HTML解析来提取所述页面上的特征。
11.根据权利要求8所述的页面提供装置,其特征在于,所述筛选单元进一步被配置成包括:
关键词提取模块,被配置成提取所述检索信息中的关键词并建立关键词集;
相似度计算模块,用于计算所述关键词集与所述特征库中的每条记录之间的相似度;以及
选择模块,用于基于所述相似度计算单元所计算出的相似度选择与所述检索信息匹配的记录。
12.根据权利要求11所述的页面提供装置,其特征在于,所述关键词提取模块进一步被配置成:
对所述检索信息进行分解,以提取出所述检索信息中的所述关键词;
对于所提取出的关键词进行扩展以生成扩展关键词;
基于所提取出的关键词以及所生成的扩展关键词建立所述关键词集;
其中,所述扩展关键词包括所提取出的关键词的同义词、所提取出的关键词的近义词或其组合。
13.根据权利要求11所述的页面提供装置,其特征在于,所述相似度计算模块进一步被配置成:对于所述特征库中的每条记录的相应特征分配权重,并基于所述权重计算所述关键词集与所述特征库中的每条记录的相似度。
14.根据权利要求8-13中任意一项所述的页面提供装置,其特征在于,所述O2O特征包括与所述线下实体店的产品或服务的地理位置、价格、有效期、评价或其组合有关的信息。
CN201610170224.6A 2016-03-23 2016-03-23 一种页面提供方法和页面提供装置 Pending CN107229624A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610170224.6A CN107229624A (zh) 2016-03-23 2016-03-23 一种页面提供方法和页面提供装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610170224.6A CN107229624A (zh) 2016-03-23 2016-03-23 一种页面提供方法和页面提供装置

Publications (1)

Publication Number Publication Date
CN107229624A true CN107229624A (zh) 2017-10-03

Family

ID=59931745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610170224.6A Pending CN107229624A (zh) 2016-03-23 2016-03-23 一种页面提供方法和页面提供装置

Country Status (1)

Country Link
CN (1) CN107229624A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763272A (zh) * 2018-04-08 2018-11-06 平安科技(深圳)有限公司 一种事件信息分析方法、计算机可读存储介质及终端设备
CN109670119A (zh) * 2018-12-29 2019-04-23 咪咕文化科技有限公司 一种数据处理方法、装置和计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246482A (zh) * 2007-02-16 2008-08-20 中国电信股份有限公司 基于结构化小文本的号码百事通搜索系统和方法
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
US20150095320A1 (en) * 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
CN104636346A (zh) * 2013-11-07 2015-05-20 腾讯科技(深圳)有限公司 网页数据查询方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246482A (zh) * 2007-02-16 2008-08-20 中国电信股份有限公司 基于结构化小文本的号码百事通搜索系统和方法
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
US20150095320A1 (en) * 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
CN104636346A (zh) * 2013-11-07 2015-05-20 腾讯科技(深圳)有限公司 网页数据查询方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763272A (zh) * 2018-04-08 2018-11-06 平安科技(深圳)有限公司 一种事件信息分析方法、计算机可读存储介质及终端设备
CN108763272B (zh) * 2018-04-08 2019-09-17 平安科技(深圳)有限公司 一种事件信息分析方法、计算机可读存储介质及终端设备
WO2019196209A1 (zh) * 2018-04-08 2019-10-17 平安科技(深圳)有限公司 事件信息分析方法、可读存储介质、终端设备及装置
CN109670119A (zh) * 2018-12-29 2019-04-23 咪咕文化科技有限公司 一种数据处理方法、装置和计算机存储介质

Similar Documents

Publication Publication Date Title
CN105320766B (zh) 信息推送方法和装置
CN108664513B (zh) 用于推送关键词的方法、装置以及设备
CN107105031A (zh) 信息推送方法和装置
CN108228906B (zh) 用于生成信息的方法和装置
CN107332910A (zh) 信息推送方法和装置
CN110111167A (zh) 一种确定推荐对象的方法和装置
CN107368493A (zh) 数据库查询方法和装置
CN105721629A (zh) 用户标识匹配方法和装置
CN104503988B (zh) 搜索方法及装置
CN107977678A (zh) 用于输出信息的方法和装置
CN106530017A (zh) 一种网店优惠券自动获取和购物组合推荐的方法
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN105894310A (zh) 一种个性化推荐方法
CN109190027A (zh) 多源推荐方法、终端、服务器、计算机设备、可读介质
CN112116426A (zh) 一种推送物品信息的方法和装置
JP5249415B2 (ja) データ統計を提供するための方法及び装置
CN106874368B (zh) 一种rtb竞价广告位价值分析方法及系统
CN107229624A (zh) 一种页面提供方法和页面提供装置
JP2007233584A (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
CN107153697A (zh) 一种商品交易网站中的商品搜索方法和装置
CN107346505A (zh) 信息推送方法和装置
CN108959289B (zh) 网站类别获取方法和装置
CN101201839A (zh) 一种互联网应用通用导航服务方法和系统
CN108319722A (zh) 数据访问方法、装置、电子设备及计算机可读存储介质
CN109426998A (zh) 信息推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171003