CN105824833A - 基于用户行为反馈的关键词推荐方法和系统 - Google Patents

基于用户行为反馈的关键词推荐方法和系统 Download PDF

Info

Publication number
CN105824833A
CN105824833A CN201510005745.1A CN201510005745A CN105824833A CN 105824833 A CN105824833 A CN 105824833A CN 201510005745 A CN201510005745 A CN 201510005745A CN 105824833 A CN105824833 A CN 105824833A
Authority
CN
China
Prior art keywords
key word
keyword
label
user
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510005745.1A
Other languages
English (en)
Inventor
沈海旺
张侦
曾敏锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Commerce Group Co Ltd
Original Assignee
Suning Commerce Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Commerce Group Co Ltd filed Critical Suning Commerce Group Co Ltd
Priority to CN201510005745.1A priority Critical patent/CN105824833A/zh
Publication of CN105824833A publication Critical patent/CN105824833A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于用户行为反馈的关键词推荐方法和系统,属于电子商务技术领域。该方法包括步骤获取用户搜索的关键词并对所述关键词进行预处理;记录针对所述关键词搜索结果的用户行为;解析所述用户行为页面的标签,为所述关键词添加标签;为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。本发明的技术方案通过记录并解析用户行为,为关键词添加适当的标签来扩展单一关键词的搜索范围,由于充分利用了用户行为进行反馈,可以及时适应关键词的衍生含义,准确把握搜索热点,此外还降低了人工维护更新词库的成本。

Description

基于用户行为反馈的关键词推荐方法和系统
技术领域
本发明涉及电子商务搜索引擎技术领域,特别涉及一种基于用户行为反馈的关键词推荐方法和系统。
背景技术
现有技术中,网络搜索的扩展多从语义分析处理方面进行优化,目前很多网站在关于相关搜索词计算方面主要考虑词和词之间的支持度。现有方案虽然可以尽量获得更多的相关搜索结果,但单纯的语义扩展只考虑了即成的文字联系,会导致推荐出来的搜索词过于死板,缺乏对新产品和新概念的实时理解,很难适应快速变化的流行趋势和网络热点;如果依赖人工对扩展词进行定期维护的话又会增加成本。
发明内容
针对现有技术的上述缺陷,本发明所要解决的技术问题是如何动态扩展关键词的搜索范围。
为实现上述目的,一方面,本发明提供一种基于用户行为反馈的关键词推荐方法,该方法包括步骤:
获取用户搜索的关键词并对所述关键词进行预处理;
记录针对所述关键词搜索结果的用户行为;
解析所述用户行为页面的标签,为所述关键词添加标签;
为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
优选地,所述方法中,将页面搜索信息表中的关键词获取为所述用户搜索的关键词。
优选地,所述预处理包括词语规整、去除特殊字符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换中的至少一种处理。
优选地,为所述关键词添加标签还包括步骤:
根据关键词的标签按照预定的规则进行合并组成以修正关键词。
优选地,所述按照分类推荐备选关键词还包括:
若同一分类中有多个备选关键词,将其全部推荐给用户、或将备选关键词按排序后的顺序优选推荐。
另一方面,本发明还提供一种基于用户行为反馈的关键词推荐系统,包括:
预处理模块,用于获取用户搜索的关键词并对所述关键词进行预处理;
行为记录模块,用于记录针对所述关键词搜索结果的用户行为;
解析模块,用于解析所述用户行为页面的标签,为所述关键词添加标签;
分类推荐模块,用于为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
优选地,所述预处理模块中还包括:获取模块,用于将页面搜索信息表中的关键词获取为所述用户搜索的关键词。
优选地,所述预处理包括词语规整、去除特殊字符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换中的至少一种处理。
优选地,所述解析模块还包括:关键词修正模块,用于根据关键词的标签按照预定的规则进行合并组成以修正关键词。
优选地,所述分类推荐模块中还包括:备选词筛选模块,用于在同一分类中有多个备选关键词时,将全部备选关键词推荐给用户、或将备选关键词按排序后的顺序优选推荐。
本发明的技术方案通过记录并解析用户行为,为关键词添加适当的标签来扩展单一关键词的搜索范围,由于充分利用了用户行为进行反馈,可以及时适应关键词的衍生含义,准确把握搜索热点,此外还降低了人工维护更新词库的成本。
附图说明
图1是本发明一个实施例中的基于用户行为反馈的关键词推荐方法的流程示意图;
图2是本发明另一个实施例中的基于用户行为反馈的关键词推荐系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例为实施本发明的较佳实施方式,所述描述是以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围应当以权利要求所界定者为准,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的语义扩展仅考虑了词义之间的联系,为进一步体现搜索词实际代表的含义,本发明中利用用户行为进行反馈,为搜索词或搜索词的组合添加对应标签,从而准确识别搜索词所表达的隐藏含义,为后续搜索推荐满足用户需求的结果。其中,图1是本发明一个实施例中的基于用户行为反馈的关键词推荐方法的流程示意图,如图1所示,该方法包括步骤:
S1、获取用户搜索的关键词并对所述关键词进行预处理;
S2、记录针对所述关键词搜索结果的用户行为;
S3、解析所述用户行为页面的标签,为所述关键词添加标签;
S4、为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
其中,获取用户搜索的关键词一般是将页面搜索信息表中的关键词作为搜索关键词。
对关键词进行的预处理包括但不限于词语规整、去除特殊字符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换等;以下仅作为示例说明常用的预处理形式,不应视作对本发明的具体限制:
(1)去掉仅由符号、数字、字母三者组成的关键词记录;
(2)去掉仅由符号组成的关键词记录;
(3)去掉仅由空格或回车符组成的关键词记录;
(4)去掉关键词首尾的空格,关键词内部空格保留一个;
(5)关键词中的全角字符均转换为半角字符;
(6)对于关键词首末含$%^&*()`~!+=|{}‘:¤è°¨§;’,\\[\\].<>/?~!(_)/\¥%……&*()——+|{}【】‘;:”“’。,、?`"⊙o╯︵‵□′*δ#$--_____及回车符等特殊字符的,去掉这些特殊字符;
(7)关键词中的小写字母统一用大写字母代替;
(8)仅保留关键词长度为2-20个字符的关键词;
(9)将汉语拼音转化为汉字;如关键词“shouji”转化为“手机”;“sanxing”转换为“三星”。
用户行为主要指用户对搜索结果页面的访问行为,包括鼠标停留查看、点击链接以及对链接页面中元素的进一步操作等动作。根据用户对关键词搜索结果的具体访问行为,解析行为对应的页面元素属性以提取为该关键词的标签。
优选地,本发明以电商搜索为例,搜索结果包括多个商品,用户行为包括查看摘要图、调整数量、加入购物车、直接购买、筛选、对比、点击链接、和/或对链接页面中的进一步操作。在该优选实施例中,行为对应的页面元素属性主要指商品属性,根据用户行为操作的对象在页面中找到商品名、目录(分类或品类)、品牌、厂商及型号等属性信息作为标签。上述标签既可以是系统本身为商品页面添加的分类标签,也可以是提取页面信息后自动挖掘归类的标签。
具体地,为关键词添加标签包括打上或更新标签等不同处理。根据关键词本身与解析得到的词类别、相似商品目录、相似品牌和相似型号/厂商能否匹配,找出关键词自身的商品目录、品牌和型号/厂商属性值,同时判断关键词自身的商品目录、品牌和型号/厂商属性值是否为空,若为空则为关键词打上得到的标签,若不为空则对关键词标签进行更新。词标签格式一般为:词类别_品牌_型号_商品目录;标签添加规则:以词类别开头,对品牌、型号/厂商、商品目录进行组合,词类别_品牌_厂商_商品目录,以“_”连接构成词标签。
比如,词标签主要包含:
CATALOG 类型
BRAND 品牌
AUTHOR/MODEL 型号
BRAND_CATALOG 品牌+类型
AUTHOR_CATALOG/MODEL_CATALOG 型号+类型
BRAND_AUTHOR/BRAND_MODEL 品牌+型号
BRAND_CATALOG_AUTHOR/BRAND_CATALOG_MODEL 品牌+类型+型号
在本发明的优选实施例中,还将关键词的标签,比如品牌、型号、商品目录等属性按照一定的规则进行合并组成以修正关键词。修正后的关键词由品牌、型号、商品目录等属性按顺序合并构成。当关键词的品牌、型号和商品目录都存在的情况下,修正后关键词的构成依次为品牌、商品目录和型号。其他情况下,修正后的关键词按照品牌、型号、商品目录的顺序进行重组。如,关键词“手机三星”应调整为“三星手机”;“手机NOTE3”调整为“NOTE3手机”。
随后,将具有相同标签的关键词进行分类,以便在后续搜索时,在一定的推荐规则下,优先推荐同一类的关键词。
以下是本发明的一个优选实施例中用户分别以“三星”和“海尔手机”为关键词进行搜索时的反馈和推荐过程,示例的详细流程为:
用“三星”进行搜索;
用户点击了搜索结果中的部分页面,其中一个页面包含“……三星……手机……优惠……”,标签解析模块解析后,系统为关键词“三星”打上标签“品牌+类型”;另一个页面中包含“……三星手机Note2……”,标签解析模块解析后,系统为关键词“三星”打上标签“品牌+类型+型号”;将关键词“三星”及相应标签保存于数据库中;
用“海尔手机”进行搜索;
用户点击了搜索结果中的部分页面,其中一个页面包含“……海尔……手机……0元购机……”,标签解析模块解析后,系统为关键词“海尔手机”打上标签“品牌+类型”;另一个页面中包含“……海尔手机5220……”,标签解析模块解析后,系统为关键词“海尔手机”打上标签“品牌+类型+型号”;将关键词“海尔手机”及相应标签保存于数据库中;
系统对“三星”的标签和“海尔手机”的标签进行比对,发现关键词“三星”和“海尔手机”的标签完全一致;将两关键词分为一类;
在下一次搜索“海尔手机”时,系统将优先推荐“三星”作为备选关键词。
优选地,若同一类中有多个备选关键词,可全部推荐给用户或将备选关键词按排序后的顺序优选推荐。排序可基于各种预定或自选规则进行,比如关键词间的潜在相关度,或按照关键词的搜索次数、点击量,或按关键词相关商品的关注度、销量、好评度等等信息单独或综合排序。
本领域相关技术人员应能理解,与本发明的方法相对应的,本发明还同时包括一种基于用户行为反馈的关键词推荐系统,与上述方法步骤一一对应,如图2所示,该系统包括:
预处理模块201,用于获取用户搜索的关键词并对所述关键词进行预处理;
行为记录模块202,用于记录针对所述关键词搜索结果的用户行为;
解析模块203,用于解析所述用户行为页面的标签,为所述关键词添加标签;
分类推荐模块204,用于为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
相应地,上述方法实施例中的各具体步骤在系统中同样存在对应的处理模块,各模块主要基于执行的步骤和/或实现的功能进行划分,在此不再一一赘述。
本发明的技术方案通过记录并解析用户行为,为关键词添加适当的标签来扩展单一关键词的搜索范围,由于充分利用了用户行为进行反馈,可以及时适应关键词的衍生含义,准确把握搜索热点,此外还降低了人工维护更新词库的成本。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (10)

1.一种基于用户行为反馈的关键词推荐方法,其特征在于,所述方法包括步骤:
获取用户搜索的关键词并对所述关键词进行预处理;
记录针对所述关键词搜索结果的用户行为;
解析所述用户行为页面的标签,为所述关键词添加标签;
为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
2.根据权利要求1所述的方法,其特征在于,将页面搜索信息表中的关键词获取为所述用户搜索的关键词。
3.根据权利要求1所述的方法,其特征在于,所述预处理包括词语规整、去除特殊字符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换中的至少一种处理。
4.根据权利要求1所述的方法,其特征在于,为所述关键词添加标签还包括步骤:
根据关键词的标签按照预定的规则进行合并组成以修正关键词。
5.根据权利要求1所述的方法,其特征在于,所述按照分类推荐备选关键词还包括:
若同一分类中有多个备选关键词,将其全部推荐给用户、或将备选关键词按排序后的顺序优选推荐。
6.一种基于用户行为反馈的关键词推荐系统,其特征在于,所述系统包括:
预处理模块,用于获取用户搜索的关键词并对所述关键词进行预处理;
行为记录模块,用于记录针对所述关键词搜索结果的用户行为;
解析模块,用于解析所述用户行为页面的标签,为所述关键词添加标签;
分类推荐模块,用于为具有相同标签的关键词分类,在后续搜索中按照分类推荐备选关键词。
7.根据权利要求6所述的系统,其特征在于,所述预处理模块中还包括:获取模块,用于将页面搜索信息表中的关键词获取为所述用户搜索的关键词。
8.根据权利要求6所述的系统,其特征在于,所述预处理包括词语规整、去除特殊字符、字符统一转换、拼写纠正、截取、拼音转汉字、中英文互换中的至少一种处理。
9.根据权利要求6所述的系统,其特征在于,所述解析模块还包括:关键词修正模块,用于根据关键词的标签按照预定的规则进行合并组成以修正关键词。
10.根据权利要求6所述的系统,其特征在于,所述分类推荐模块中还包括:备选词筛选模块,用于在同一分类中有多个备选关键词时,将全部备选关键词推荐给用户、或将备选关键词按排序后的顺序优选推荐。
CN201510005745.1A 2015-01-07 2015-01-07 基于用户行为反馈的关键词推荐方法和系统 Pending CN105824833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510005745.1A CN105824833A (zh) 2015-01-07 2015-01-07 基于用户行为反馈的关键词推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510005745.1A CN105824833A (zh) 2015-01-07 2015-01-07 基于用户行为反馈的关键词推荐方法和系统

Publications (1)

Publication Number Publication Date
CN105824833A true CN105824833A (zh) 2016-08-03

Family

ID=56513358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510005745.1A Pending CN105824833A (zh) 2015-01-07 2015-01-07 基于用户行为反馈的关键词推荐方法和系统

Country Status (1)

Country Link
CN (1) CN105824833A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649750A (zh) * 2016-12-26 2017-05-10 北京奇虎科技有限公司 针对多义项词条的搜索方法及装置
CN106991175A (zh) * 2017-04-06 2017-07-28 百度在线网络技术(北京)有限公司 一种客户信息挖掘方法、装置、设备以及存储介质
CN107016460A (zh) * 2017-03-27 2017-08-04 中国联合网络通信集团有限公司广西壮族自治区分公司 用户换机预测方法及装置
CN108170293A (zh) * 2017-12-29 2018-06-15 北京奇虎科技有限公司 输入联想的个性化推荐方法及装置
CN108287834A (zh) * 2017-01-09 2018-07-17 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置及计算设备
CN108491267A (zh) * 2018-03-13 2018-09-04 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109002477A (zh) * 2018-06-19 2018-12-14 深圳市元征科技股份有限公司 信息处理方法、装置、终端及介质
CN109145016A (zh) * 2018-09-10 2019-01-04 合肥科讯金服科技有限公司 一种金融用互联网大数据检索系统
CN109871483A (zh) * 2019-01-22 2019-06-11 珠海天燕科技有限公司 一种推荐信息的确定方法及装置
CN110502630A (zh) * 2019-07-31 2019-11-26 北京字节跳动网络技术有限公司 信息处理方法及设备
CN111199450A (zh) * 2018-11-20 2020-05-26 阿里巴巴集团控股有限公司 页面标签的处理方法及装置、存储介质和处理器
CN111259131A (zh) * 2020-01-09 2020-06-09 杭州网易再顾科技有限公司 信息处理方法、介质、装置和计算设备
CN111654516A (zh) * 2020-03-06 2020-09-11 厦门区块链云科技有限公司 一种区块链原创内容上链及分发系统
CN112784178A (zh) * 2021-01-18 2021-05-11 仙境文化传媒(武汉)有限公司 一种基于推荐系统的兴趣探索装置及方法
CN114756745A (zh) * 2022-03-29 2022-07-15 重庆义康鑫科技有限公司 一种基于大数据分析的智能信息推荐方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164521A (zh) * 2013-03-11 2013-06-19 亿赞普(北京)科技有限公司 一种基于用户浏览和搜索行为的关键词计算方法及装置
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN103997507A (zh) * 2013-02-20 2014-08-20 腾讯科技(深圳)有限公司 一种信息的推送方法及装置
CN104036045A (zh) * 2014-07-01 2014-09-10 彩带网络科技(北京)有限公司 一种信息分析方法及服务平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103997507A (zh) * 2013-02-20 2014-08-20 腾讯科技(深圳)有限公司 一种信息的推送方法及装置
CN103164521A (zh) * 2013-03-11 2013-06-19 亿赞普(北京)科技有限公司 一种基于用户浏览和搜索行为的关键词计算方法及装置
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN104036045A (zh) * 2014-07-01 2014-09-10 彩带网络科技(北京)有限公司 一种信息分析方法及服务平台

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649750A (zh) * 2016-12-26 2017-05-10 北京奇虎科技有限公司 针对多义项词条的搜索方法及装置
CN106649750B (zh) * 2016-12-26 2021-02-05 三六零科技集团有限公司 针对多义项词条的搜索方法及装置
CN108287834A (zh) * 2017-01-09 2018-07-17 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置及计算设备
CN107016460A (zh) * 2017-03-27 2017-08-04 中国联合网络通信集团有限公司广西壮族自治区分公司 用户换机预测方法及装置
CN106991175A (zh) * 2017-04-06 2017-07-28 百度在线网络技术(北京)有限公司 一种客户信息挖掘方法、装置、设备以及存储介质
CN106991175B (zh) * 2017-04-06 2020-08-11 百度在线网络技术(北京)有限公司 一种客户信息挖掘方法、装置、设备以及存储介质
CN108170293A (zh) * 2017-12-29 2018-06-15 北京奇虎科技有限公司 输入联想的个性化推荐方法及装置
CN108491267A (zh) * 2018-03-13 2018-09-04 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109002477A (zh) * 2018-06-19 2018-12-14 深圳市元征科技股份有限公司 信息处理方法、装置、终端及介质
CN109145016A (zh) * 2018-09-10 2019-01-04 合肥科讯金服科技有限公司 一种金融用互联网大数据检索系统
CN111199450A (zh) * 2018-11-20 2020-05-26 阿里巴巴集团控股有限公司 页面标签的处理方法及装置、存储介质和处理器
CN111199450B (zh) * 2018-11-20 2023-07-21 阿里巴巴华东有限公司 页面标签的处理方法及装置、存储介质和处理器
CN109871483A (zh) * 2019-01-22 2019-06-11 珠海天燕科技有限公司 一种推荐信息的确定方法及装置
CN110502630A (zh) * 2019-07-31 2019-11-26 北京字节跳动网络技术有限公司 信息处理方法及设备
CN110502630B (zh) * 2019-07-31 2022-04-15 北京字节跳动网络技术有限公司 信息处理方法及设备
CN111259131A (zh) * 2020-01-09 2020-06-09 杭州网易再顾科技有限公司 信息处理方法、介质、装置和计算设备
CN111259131B (zh) * 2020-01-09 2023-05-05 杭州网易再顾科技有限公司 信息处理方法、介质、装置和计算设备
CN111654516A (zh) * 2020-03-06 2020-09-11 厦门区块链云科技有限公司 一种区块链原创内容上链及分发系统
CN112784178A (zh) * 2021-01-18 2021-05-11 仙境文化传媒(武汉)有限公司 一种基于推荐系统的兴趣探索装置及方法
CN114756745A (zh) * 2022-03-29 2022-07-15 重庆义康鑫科技有限公司 一种基于大数据分析的智能信息推荐方法及装置

Similar Documents

Publication Publication Date Title
CN105824833A (zh) 基于用户行为反馈的关键词推荐方法和系统
CN109754233B (zh) 一种智能推荐职位信息的方法和系统
CN101061478B (zh) 用于识别web文档的方法和系统
US7831545B1 (en) Identifying the unifying subject of a set of facts
US9020950B2 (en) System and method for generating, updating, and using meaningful tags
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN103631948B (zh) 命名实体的识别方法
US20090125529A1 (en) Extracting information based on document structure and characteristics of attributes
KR101505858B1 (ko) 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템
US20150287047A1 (en) Extracting Information from Chain-Store Websites
CN102279894A (zh) 基于语义的查找、集成和提供评论信息的方法及搜索系统
US8359307B2 (en) Method and apparatus for building sales tools by mining data from websites
CN102722498A (zh) 搜索引擎及其实现方法
CN105320778A (zh) 一种适用于电子商务中文网站商品标签化的方法
Kochtchi et al. Networks of Names: Visual Exploration and Semi‐Automatic Tagging of Social Networks from Newspaper Articles
CN103258029A (zh) 信息检索方法及系统
CN102737021A (zh) 搜索引擎及其实现方法
US8266140B2 (en) Tagging system using internet search engine
CA3051919C (en) Machine learning (ml) based expansion of a data set
US8799256B2 (en) Incorporated web page content
Sorrentino et al. Schema normalization for improving schema matching
Zhang et al. TOB: Timely Ontologies for Business Relations.
CN109948015B (zh) 一种元搜索列表结果抽取方法及系统
Wanjari et al. Automatic news extraction system for Indian online news papers
Dejean Extracting structured data from unstructured document with incomplete resources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160803

RJ01 Rejection of invention patent application after publication