CN103745012A - 一种根据产品标题智能匹配显示网页推荐信息的方法和系统 - Google Patents
一种根据产品标题智能匹配显示网页推荐信息的方法和系统 Download PDFInfo
- Publication number
- CN103745012A CN103745012A CN201410041633.7A CN201410041633A CN103745012A CN 103745012 A CN103745012 A CN 103745012A CN 201410041633 A CN201410041633 A CN 201410041633A CN 103745012 A CN103745012 A CN 103745012A
- Authority
- CN
- China
- Prior art keywords
- product
- information
- recommendation information
- word
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种根据产品标题智能匹配显示网页推荐信息的方法和系统,首先提取网站页面上的产品标题;然后对产品标题进行中文分词,和产品词库中的产品词进行匹配,取出所有产品词;再获取产品词的字符串长度,取出字符串长度最长的产品词作为核心关键词;最后从信息库上匹配含有核心关键词的信息作为推荐信息,把推荐信息调取到页面显示界面上进行显示。本发明只要根据网页上的产品标题即可自动匹配显示出网站页面推荐信息,免去了过往依靠技术人员在后台手动设置推荐信息,操作简便,大大减轻了工作量,提高了工作效率;另外当信息库中的产品信息有更新时,因为本发明是自动匹配推荐信息的,免去了依靠技术人员手动去更新,提高了更新速度。
Description
技术领域
本发明涉及一种根据产品标题智能匹配显示网页推荐信息的方法和系统。
背景技术
很多B2B或B2C网站页面上在特定的区域内都有推荐信息显示给浏览的用户,目前把推荐信息显示在网站页面上方法有两种比较常用的方法,第一种是根据用户的输入信息确定推荐信息,这种方法只能根据用户输入的搜索信息,匹配出网页显示的推荐信息,即使用户在该网站上浏览不同的产品页面,只要用户没有更新输入的搜索信息,网页显示的推荐信息也不会改变,推荐信息单一,用户体验不佳;第二种方法是技术人员在网站后台手动设置推荐信息,这种方法依靠技术人员在网站后台手动设置推荐信息,同时给出超链接地址,工作量大且效率低,当后台的推荐信息有更新时,因为需人手在各个页面上进行更新设置,需要花费较长时间,难以有效及时的更新网站页面上的推荐信息。
发明内容
本发明的目的是提供一种操作简便、更新速度快的根据产品标题智能匹配显示网页推荐信息的方法和系统。
本发明所述的一种根据产品标题智能匹配显示网页推荐信息的方法包括以下步骤:
步骤1,提取网站页面上的产品标题;
步骤2,对产品标题进行中文分词,和产品词库中的产品词进行匹配,取出所有产品词;
步骤3,获取产品词的字符串长度,取出字符串长度最长的产品词作为核心关键词;
步骤4,从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。
同时本发明还同时给出了一种根据产品标题智能匹配显示网页推荐信息的系统,该系统包括,
产品词库,储存有各类产品词;
信息库,储存有各类产品的信息;
产品标题提取模块,用以提取网站页面上的产品标题;
分词和匹配模块,用以对产品标题进行中文分词,并与产品词库中的产品词进行匹配,取出所有产品词;
核心关键词确定模块,用以获取产品词的字符串长度,比较产品词字符串长度大小,取出字符串长度最长的产品词作为核心关键词;
页面显示模块,用以从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。
本发明所述的一种根据产品标题智能匹配显示网页推荐信息的方法和系统,首先提取网站页面上的产品标题;然后对产品标题进行中文分词,和产品词库中的产品词进行匹配,取出所有产品词;再获取产品词的字符串长度,取出字符串长度最长的产品词作为核心关键词;最后从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。本发明只要根据网页上的产品标题即可自动匹配显示出网站页面推荐信息,免去了过往依靠技术人员在后台手动设置推荐信息,操作简便,大大减轻了工作量,提高了工作效率;另外当信息库中的产品信息有更新时,因为本发明是自动匹配的,免去了依靠技术人员手动去更新,提高了更新速度,用户在浏览网页时,系统即可根据网页上的产品标题自动匹配出最新的推荐信息,提高用户体验。
优选地,本发明的方法,在步骤4中,推荐信息随机显示在页面显示界上。
相应地,本文所述的系统,页面显示模块还包括随机排列模块,用以将推荐信息随机排列后显示在页面显示界面上。
通过将推荐信息随机显示在页面显示界上,用户在不同时候,即使浏览同一个产品页面时,也能得到不同的推荐信息,让用户可以得到最大的信息量和最佳的体验。
附图说明
图1为本发明一种根据产品标题智能匹配显示网页推荐信息的方法流程示意图;
图2为本发明一种根据产品标题智能匹配显示网页推荐信息的系统结构示意图。
具体实施方式
如图1所示,一种根据产品标题智能匹配显示网页推荐信息的方法包括以下步骤:
步骤1,提取网站页面上的产品标题;
步骤2,对产品标题进行中文分词,和产品词库中的产品词进行匹配,取出所有产品词;
步骤3,获取产品词的字符串长度,取出字符串长度最长的产品词作为核心关键词;
步骤4,从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。
下面以网站页面的产品标题为“供应不锈钢内胆电热饭盒”为例做说明,首先提取“供应不锈钢内胆电热饭盒”的产品标题,左到右进行扫描,首先是“供”字,词典上没有匹配的,然后和第二个字“供应”组成个词,词典上有供应这个词,于是“供应”被切分为一个词,后面的词以此类推,在第一步的分词时会把其分成“供应”、“不锈钢”、“内胆”、“电热”、“饭盒”、“电热饭盒”这几个关键词。然后通过第二步和产品词库进行匹配,遍历分出来的6个关键词,在产品词库中查找是否有该关键词,有的话就保留该关键词,没有的话就删除,得出“不锈钢”、“饭盒”、“电热饭盒”这三个可能的产品词。再获取“不锈钢”、“饭盒”、“电热饭盒”产品词的字符串长度,比较这三个产品词的字符串长度,得出“电热饭盒”的字符串最长,作为核心关键词。然后在信息库中匹配出含有该“电热饭盒”核心关键词的信息作为推荐信息,调取到页面显示界面上进行显示。
步骤2中,分词采用正向最大匹配的方法,并由左到右按照词库里最长的词语进行拆分,可遍历产品标题中任意可能出现的词语,不遗漏其中一个可能出现的词语,提高该方法的准确率。
另外,在每个产品页面上均需预设置一个产品标题,产品标题的字数在2到15个字数之间为宜,可提高该方法匹配速度。
若在步骤3中,若最长的核心关键词同时存在多个时,按照核心关键词首拼音字母的排列做升序排列,取出排第一个的作为核心关键词。
通过将推荐信息随机显示在页面显示界上,用户在不同时候,即使浏览同一个产品页面时,也能得到不同的推荐信息,让用户可以得到最大的信息量和最佳的体验。
如图2所示,一种根据产品标题智能匹配显示网页推荐信息的系统,其特征在于:所述系统包括,
产品词库,储存有各类产品词;
信息库,储存有各类产品的信息;
产品标题提取模块,用以提取网站页面上的产品标题;
分词和匹配模块,用以对产品标题进行中文分词,并与产品词库中的产品词进行匹配,取出所有产品词;
核心关键词确定模块,用以获取产品词的字符串长度,比较产品词字符串长度大小,取出字符串长度最长的产品词作为核心关键词;
页面显示模块,用以从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。
本文同样以产品标题为“供应不锈钢内胆电热饭盒”为例做说明,产品词库,储存有各类产品词,例如有:“不锈钢”、“饭盒”、“电热饭盒”等等;产品标题提取模块提取网站页面上的产品标题“供应不锈钢内胆电热饭盒”;分词和匹配模块,首先对“供应不锈钢内胆电热饭盒”进行分词,得出“供应”、“不锈钢”、“内胆”、“电热”、“饭盒”、“电热饭盒”这几个关键词;与产品词库中的产品词进行匹配,取出所有产品词“不锈钢”、“饭盒”、“电热饭盒”;核心关键词确定模块获取“不锈钢”、“饭盒”、“电热饭盒”产品词的字符串长度,比较这三个产品词的字符串长度,得出“电热饭盒”的字符串最长,作为核心关键词;然后页面显示模块在信息库中匹配出含有该“电热饭盒”核心关键词的信息作为推荐信息,调取到页面显示界面上进行显示。
本实施例所述的一种根据产品标题智能匹配显示网页推荐信息的方法和系统,首先提取网站页面上的产品标题;然后对产品标题进行中文分词,和产品词库中的产品词进行匹配,取出所有产品词;再获取产品词的字符串长度,取出字符串长度最长的产品词作为核心关键词;最后从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。本发明只要根据网页上的产品标题即可自动匹配显示出网站页面推荐信息,免去了过往依靠技术人员在后台手动设置推荐信息,操作简便,大大减轻了工作量,提高了工作效率;另外当信息库中的产品信息有更新时,因为本发明是自动匹配的,免去了依靠技术人员手动去更新,提高了更新速度,用户在浏览网页时,系统即可根据网页上的产品标题自动匹配出最新的推荐信息,提高用户体验。
Claims (7)
1.一种根据产品标题智能匹配显示网页推荐信息的方法,其特征在于:所述的方法包括以下步骤,
步骤1,提取网站页面上的产品标题;
步骤2,对产品标题进行中文分词,和产品词库中的产品词进行匹配,取出所有产品词;
步骤3,获取产品词的字符串长度,取出字符串长度最长的产品词作为核心关键词;
步骤4,从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。
2.根据权利要求1所述的一种根据产品标题智能匹配显示网页推荐信息的方法,其特征在于:步骤2中,分词采用正向最大匹配的方法,并由左到右按照词库里最长的词语进行拆分。
3.根据权利要求1所述的一种根据产品标题智能匹配显示网页推荐信息的方法,其特征在于:在每个产品页面上均需预设置一个产品标题。
4.根据权利要求1所述的一种根据产品标题智能匹配显示网页推荐信息的方法,其特征在于:在步骤3中,若最长的核心关键词同时存在多个时,按照核心关键词首拼音字母的排列做升序排列,取出排第一个的作为核心关键词。
5.根据权利要求1所述的一种根据产品标题智能匹配显示网页推荐信息的方法,其特征在于:步骤4中,推荐信息随机显示在页面显示界面上。
6.一种根据产品标题智能匹配显示网页推荐信息的系统,其特征在于:所述系统包括,
产品词库,储存有各类产品词;
信息库,储存有各类产品的信息;
产品标题提取模块,用以提取网站页面上的产品标题;
分词和匹配模块,用以对产品标题进行中文分词,并与产品词库中的产品词进行匹配,取出所有产品词;
核心关键词确定模块,用以获取产品词的字符串长度,比较产品词字符串长度大小,取出字符串长度最长的产品词作为核心关键词;
页面显示模块,用以从信息库上匹配出含有该核心关键词的信息,作为推荐信息,把推荐信息调取到页面显示界面上进行显示。
7.根据权利要求6所述的一种根据产品标题智能匹配显示网页推荐信息的系统,其特征在于:页面显示模块还包括随机排列模块,用以将推荐信息随机排列后显示在页面显示界面上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410041633.7A CN103745012A (zh) | 2014-01-28 | 2014-01-28 | 一种根据产品标题智能匹配显示网页推荐信息的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410041633.7A CN103745012A (zh) | 2014-01-28 | 2014-01-28 | 一种根据产品标题智能匹配显示网页推荐信息的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103745012A true CN103745012A (zh) | 2014-04-23 |
Family
ID=50502030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410041633.7A Pending CN103745012A (zh) | 2014-01-28 | 2014-01-28 | 一种根据产品标题智能匹配显示网页推荐信息的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103745012A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408173A (zh) * | 2014-12-11 | 2015-03-11 | 焦点科技股份有限公司 | 一种基于b2b平台的核心关键词自动提取方法 |
CN104679731A (zh) * | 2015-03-12 | 2015-06-03 | 百度在线网络技术(北京)有限公司 | 提取页面中关键词的方法及装置 |
CN106649276A (zh) * | 2016-12-29 | 2017-05-10 | 北京京东尚科信息技术有限公司 | 标题中核心产品词的识别方法以及装置 |
CN107045529A (zh) * | 2017-01-16 | 2017-08-15 | 广州爱九游信息技术有限公司 | 网络内容获取方法、装置及服务终端 |
TWI647638B (zh) * | 2016-11-15 | 2019-01-11 | 財團法人工業技術研究院 | 互動式推薦系統與方法 |
CN109800036A (zh) * | 2017-11-15 | 2019-05-24 | 广州市动景计算机科技有限公司 | 信息流页面展示方法、装置、系统、计算设备和存储介质 |
CN110851595A (zh) * | 2019-10-08 | 2020-02-28 | 云知声智能科技股份有限公司 | 一种疾病术语核心词汇的标识方法及装置 |
WO2020073528A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于会话的信息推送方法、装置、计算机设备及存储介质 |
CN111931040A (zh) * | 2020-06-30 | 2020-11-13 | 深圳市世强元件网络有限公司 | 一种网络平台内部服务实体服务入口的推荐方法 |
CN113762678A (zh) * | 2020-10-30 | 2021-12-07 | 北京京东振世信息技术有限公司 | 确定产品的优选制造商的方法、装置、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079894A (zh) * | 2006-12-21 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种推送网络信息的系统及方法 |
JP4516809B2 (ja) * | 2004-06-23 | 2010-08-04 | 財団法人日本医薬情報センター | 添付文書適応症コード変換方法 |
CN102024065A (zh) * | 2011-01-18 | 2011-04-20 | 中南大学 | 基于simd优化的网页去重并行方法 |
CN102981709A (zh) * | 2012-11-15 | 2013-03-20 | 广东欧珀移动通信有限公司 | 一种基于搜索条的快速搜索方法、装置及终端 |
-
2014
- 2014-01-28 CN CN201410041633.7A patent/CN103745012A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4516809B2 (ja) * | 2004-06-23 | 2010-08-04 | 財団法人日本医薬情報センター | 添付文書適応症コード変換方法 |
CN101079894A (zh) * | 2006-12-21 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种推送网络信息的系统及方法 |
CN102024065A (zh) * | 2011-01-18 | 2011-04-20 | 中南大学 | 基于simd优化的网页去重并行方法 |
CN102981709A (zh) * | 2012-11-15 | 2013-03-20 | 广东欧珀移动通信有限公司 | 一种基于搜索条的快速搜索方法、装置及终端 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408173B (zh) * | 2014-12-11 | 2016-12-07 | 焦点科技股份有限公司 | 一种基于b2b平台的核心关键词自动提取方法 |
CN104408173A (zh) * | 2014-12-11 | 2015-03-11 | 焦点科技股份有限公司 | 一种基于b2b平台的核心关键词自动提取方法 |
CN104679731A (zh) * | 2015-03-12 | 2015-06-03 | 百度在线网络技术(北京)有限公司 | 提取页面中关键词的方法及装置 |
TWI647638B (zh) * | 2016-11-15 | 2019-01-11 | 財團法人工業技術研究院 | 互動式推薦系統與方法 |
CN106649276B (zh) * | 2016-12-29 | 2019-02-26 | 北京京东尚科信息技术有限公司 | 标题中核心产品词的识别方法以及装置 |
CN106649276A (zh) * | 2016-12-29 | 2017-05-10 | 北京京东尚科信息技术有限公司 | 标题中核心产品词的识别方法以及装置 |
CN107045529A (zh) * | 2017-01-16 | 2017-08-15 | 广州爱九游信息技术有限公司 | 网络内容获取方法、装置及服务终端 |
CN107045529B (zh) * | 2017-01-16 | 2021-01-22 | 阿里巴巴(中国)有限公司 | 网络内容获取方法、装置及服务终端 |
CN109800036A (zh) * | 2017-11-15 | 2019-05-24 | 广州市动景计算机科技有限公司 | 信息流页面展示方法、装置、系统、计算设备和存储介质 |
WO2020073528A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于会话的信息推送方法、装置、计算机设备及存储介质 |
CN110851595A (zh) * | 2019-10-08 | 2020-02-28 | 云知声智能科技股份有限公司 | 一种疾病术语核心词汇的标识方法及装置 |
CN111931040A (zh) * | 2020-06-30 | 2020-11-13 | 深圳市世强元件网络有限公司 | 一种网络平台内部服务实体服务入口的推荐方法 |
CN111931040B (zh) * | 2020-06-30 | 2024-01-12 | 深圳市世强元件网络有限公司 | 一种网络平台内部服务实体服务入口的推荐方法 |
CN113762678A (zh) * | 2020-10-30 | 2021-12-07 | 北京京东振世信息技术有限公司 | 确定产品的优选制造商的方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103745012A (zh) | 一种根据产品标题智能匹配显示网页推荐信息的方法和系统 | |
WO2019041521A1 (zh) | 用户关键词提取装置、方法及计算机可读存储介质 | |
JP2014518419A5 (zh) | ||
CN103226576A (zh) | 基于语义相似度的垃圾评论过滤方法 | |
WO2014005657A4 (en) | A system and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information | |
CN104820704A (zh) | 一种网络文本的行内标注式评论的新建方法及其浏览方法 | |
CN102841746A (zh) | 一种手机网页交互方法 | |
JP2013506936A (ja) | テンプレートに基づく出版物の組合せ用のシステムおよび方法 | |
CN104462547A (zh) | 一种可配置的网页数据采集的方法及系统 | |
CN104008186A (zh) | 从目标文本中确定关键词的方法和装置 | |
CN103927309A (zh) | 一种对业务对象标注信息标签的方法及装置 | |
US20150088491A1 (en) | Keyword extraction apparatus and method | |
CN103166981A (zh) | 一种无线网页转码方法及装置 | |
CN104715049A (zh) | 基于本体词库的商品评论属性词抽取方法 | |
US20170322984A1 (en) | Multi-dimensional search | |
CN105320734A (zh) | 一种网页核心内容提取方法 | |
CN103150331A (zh) | 一种提供搜索引擎标签的方法和装置 | |
CN102937994A (zh) | 一种基于停用词的相似文档查询方法 | |
CN103942274B (zh) | 一种基于lda的生物医疗图像的标注系统及方法 | |
CN106708813A (zh) | 一种标题处理方法及设备 | |
CN102591500B (zh) | 触控绘画处理系统及方法 | |
CN106897289A (zh) | 信息搜索的优化方法及装置 | |
CN101673263B (zh) | 视频内容的搜索方法 | |
JP2013033473A5 (zh) | ||
CN108255895A (zh) | 一种使用上下文环境规则的网页数据获取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140423 |