CN106959947A - 一种新型可排序反爬虫多领域垂直搜索网站的设计方法 - Google Patents

一种新型可排序反爬虫多领域垂直搜索网站的设计方法 Download PDF

Info

Publication number
CN106959947A
CN106959947A CN201610010711.6A CN201610010711A CN106959947A CN 106959947 A CN106959947 A CN 106959947A CN 201610010711 A CN201610010711 A CN 201610010711A CN 106959947 A CN106959947 A CN 106959947A
Authority
CN
China
Prior art keywords
module
page
protected
search
spin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610010711.6A
Other languages
English (en)
Inventor
刘挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610010711.6A priority Critical patent/CN106959947A/zh
Publication of CN106959947A publication Critical patent/CN106959947A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0245Surveys
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出了一种新型的多领域垂直搜索网站,该网站可以自动智能分析用户自然语言提出请求,然后将用户导入不同领域的搜索页面,同时该网站能够反爬虫。主要包括前端分析模块,结果展示模块和反爬虫模块。前端分析模块主要是自然语言处理模块,能够分析出用户使用自然语言提出的请求,判断出用户的搜索领域和关键信息,结果展示模块主要包括搜索框模块,选择条件模块,广告位模块,排序模块,搜索结果展示模块和翻页模块,能够根据用户需求展现出不同的搜索结果页面,同时防止爬虫抽取页面内容。而反爬虫模块主要包括选择条件模块,搜索结果展示模块和翻页模块,主要为设置反爬虫的一些方法。

Description

一种新型可排序反爬虫多领域垂直搜索网站的设计方法
技术领域
本发明提出了一种新型的,可以处理人工语言请求的,可以反爬虫的,可以对搜索结果进行排序的,多领域垂直搜索系统的网站设计方法。该领域主要包括计算机安全领域,主要是爬虫的数据抽取技术,数据库技术,主要是配置文件读取和排序技术,人工智能领域,主要是自然语言处理领域,能够分别出用户用自然语言提出的请求,并且做出分析和判断。
背景技术
本发明设计的背景技术主要包括爬虫技术,需要对爬虫技术进行深度的理解,方可知道如何反爬虫,同时需要服务器端编程技术,能够记录用户对广告位的点击情况,还有配置文件技术和数据库技术,方便根据配置文件从数据库中读取不同的内容,同时还有自然语言处理技术,该技术主要是能够处理用户使用自然语言提出的需求,对该需求进行分析,判断出用户的搜索领域。
发明内容
本网站主要包括前端处理模块,结果页面展示模块和反爬虫模块。主要使用的语言为php。前端处理模块主要是一个中文自然语言处理模块,它能够分析用户提出的中文请求,判断出用户的搜索领域。结果页面显示模块主要包括个四个子模块,按照页面顺序,从上到下分别是搜索框模块,选择条件模块,广告位模块,排序模块,搜索结果展示和翻页模块。搜索框模块提供到该页面的搜索,选择条件模块提供一些过滤条件供用户选择,广告位模块提供广告位给客户,同时记录用户对该广告位的行为,排序模块能够使得搜索结果页面按照预先制定的顺序进行展示,搜索结果展示和翻页模块将用户需要的结果展示出来,并且提供翻页。反爬虫模块包括两个子模块,一个是选择条件模块,另一个是搜索结果展示和翻页模块。通过两个模块的设计,使得爬虫无法抓取。
说明书附图。
图1为整个系统的架构图。
图2为结果展示页面的展示方式。
图3为网站首页。
具体实施方式。
前端处理模块能够分析出用户用自然语言提出的请求,并且分析出该请求的领域和关键词。主要包括一个自然语言处理模块,主要处理方式是,将用户用中文或者其他语言提交的请求,一般是“领域 关键词1 关键词2”或者“领域”模式。使用php语言对情况分别如下处理,方法如下。
1,对只有“领域”的用户请求,将“领域”与已经有的关键词词库进行匹配,每一个领域对应一个关键词词库。
1.1,如果“领域”,该词包含某一关键词词库的一个关键词,则判断该“领域”是属于包含该关键词的领域。
1.2,如果“领域”,该词不包含任意领域的关键词词库,则判断用户的搜索领域不在网站可以提供的搜索领域范围内。
2,对包含“领域 关键词1 关键词2”的用户请求,将“领域 关键词1 关键词2”进行分词。
2.1,对分词所得的第一个词,定为"领域”,将“领域”与已经有的关键词词库进行匹配,每一个领域对应一个关键词词库。
2.1.1,如果“领域”,该词包含某一关键词词库的一个关键词,则判断该“领域”是属于包含该关键词的领域。
2.1.2,如果“领域”,该词不包含任意领域的关键词词库,则判断用户的搜索领域不在网站可以提供的搜索领域范围内。
结果展示页面包括四个子模块,从上到下分别是搜索框模块,选择条件模块,广告位模块,搜索结果展示和翻页模块。
搜索框模块主要是搜索框,提供一个搜索框,同时提供一个提交的按钮,其对应的动作页面是controller.php。
选择条件模块主要提供用户的选择条件,根据这些调节对搜索结果进行选择性过滤,其对应的动作页面是result.php。
广告位模块是给客户提供的广告位,点击之后能够在数据库中记录用户的点击行为,其具体实施方式如下。
1,在选择条件模块下面,生成一个form表格。
2,该表格的方法为post。
3,对每个客户采用下面方法。
3.1,对每个客户,生成一个href记录,链接到客户的网址或者客户的网页,其target设为_blank,点击行为将触发javascript函数,该函数包含客户名称和搜索领域两个输入。
3.1.1,被触发的javascript函数使用xmlhttp.open和xmlhttp.send方式向服务器发送GET形式的请求,要求调用一个函数,该函数将客户名称和搜索领域以及访问时间存入数据库。
3.2,对每个客户,插入img,对应客户的logo。
排序模块主要采用预先配置的方法对搜索结果进行排序。
采用的方法如下。
1,采用config.xml配置文件存储好每个网站的名称,每页展示的条数。
2,在搜索结果展示的时候,对网站名单进行循环。
2.1,对每一个网站,使用该网站名和该网站展示的条数,从数据库中读取并且展示。
2.2,将读取的内容进行拼接从而达到读取内容的展示。
2.2.1,如果读取的网站没有内容了,显示为0.。
2.2.2,页数的选择为选择其中较大的页数为总页数。
搜索结果展示和翻页模块是将用户的请求,按照其条件选择之后呈现给用户的,同时实现了翻页的效果。
反爬虫模块主要包括两个子模块,选择条件模块,搜索结果展示和翻页模块。
选择条件模块是用户对需要搜索的结果进行条件选择。主要方法如下。
1,选择好所有需要进行设置的条件的类。
2,对每一类的条件采用表格的形式。
3,该表格使用post方法。
4,对应的动作页面为该领域的结果展示页面,假设为result.php。
4.1,该类条件里面的细分条件,采用submit的按钮形式替代一个条件。
4.2,value记录其所对应的条件。
4.3,name记录该条件的类别。
搜索结果展示和翻页模块主要是实现了用户请求的搜索结果展示和翻页,主要流程如下。
1,如果post形式接收到Submit请求。
1.1,$find赋值为post请求的find。
1.2,$parts_keywords_list为将$find分隔之后的列。
1.3,如果$parts_keywords_list大于1。
1.3.1取得搜索领域$part_domain。
1.3.2 取得搜索关键词$part_keyword。
1.3.3将$part_domain赋值给全局变量的search_domain。
1.3.4将$part_keyword赋值给全局变量的search_keyword。
1.4,将post形式的find 赋值给全局变量find。
1.5,将全局变量currentpage设为1。
1.6,将全局变量price_range设为无限。
2,如果收到post形式的pagination。
2.1,post形式变量currentpage赋值给全局变量currentpage。
3,如果收到post形式的pagination_next。
3.1,全局变量currentpage加1。
4,如果收到post形式pagination_final。
4.1,全局变量total_pages赋值给全局变量currentpage。
5,如果收到post形式pagination_prev。
5.1,全局变量currentpage减1。
6,如果收到post形式pagination_head。
6.1,全局变量currentpage为1。
7,如果收到post形式price_range。
7.1,post变量price_range赋值给全局变量price_range。
8,如果收到post形式original_website。
8.1,post变量original_website赋值给全局变量original_website。
9,全局变量search_keyword赋值给$search_keyword。
10,全局变量currentpage赋值给$currentpage。
11,将初始的sql查询设定,包含各个领域查询search_keyword。
12,将全局变量price_range赋值给$price_range。
13,对$price_range进行switch。
13.1,如果对应一个值,将$page_sql加上一段,条件,比如price>=0 and price<600。
13.2,如果没有对应,将其加上无限选择的一段条件,例如price>=0 and price<=100000。
14,将全局变量original_website赋值给$original_website。
15,将$only_one_site设为false。
16,对$original_website进行switch。
16.1,如果找到一个对应的,比如58同城,在$page_sql上加上website like '%58同城%',$only_one_site设为true。
16.2,如果没有找到,将$only_one_site 设为false。
16.3,如果是“无限”,将$only_one_site设为false。
17,从配置文件config.xml中得到初始条件下的每页应该展示的条数$default_per_page。
18,从配置文件config.xml中得到应该展示的网站的点$website_nodes。
19,如果$only_one_site是true。
19.1,$page_sql赋值给$page_sql_local。
19.2,$default_per_page赋值给$website_local_per_page。
19.3,将$page_sql_local进行查询后赋值给$total_result。
19.4,将$ total_result的行数赋值给$total_result_size。
19.5,将$total_pages赋值给全局变量$total_pages。
20,否则。
20.1,初始$total_pages为0。
20.2,对于每一个属于$website_nodes的网站$website_node_local。
20.2.1,将website_node_local的name赋值给website_local_name。
20.2.2,将$page_sql加上and website_name like '%"和$website_local_name。
20.2.3,将$website_node_local的perpage赋值给$website_local_per_page。
20.2.4,将$page_sql_local进行query后赋值给$total_result。
20.2.5,将$total_result的行数赋值给$total_result_size。
20.2.6,将$total_result_size除以$website_local_per_page赋值给$total_pages_local。
20.2.7,如果$total_pages_local大于$total_pages。
20.2.8,将$total_pages_local的值赋值给$total_pages。
20.3,将$total_pages赋值给全局变量total_pages。
21,如果$currentpage大于$total_pages。
21.1,将$total_pages赋值给$currentpage。
22,如果$currentpage小于1。
22.1,$currentpage赋值为1。
23,对每个$website_nodes中的$website_node_local。
23.1,将$website_node_local的name值赋值给$website_local_name。
23.2,如果$only_one_site是真。
23.2.1,将$default_per_page赋值给$website_local_per_page。
23.2.2,将$website_local_name赋值给$original_website。
23.2.3,如果$original_website包含$website_local_name。
23.2.3.1,$page_sql赋值给$page_sql_local。
23.2.3.2,将$currentpage减1乘以$website_local_per_page赋值给$offset_local。
23.2.3.3,$page_sql_local加上limit $offset_local, $sebsite_local_per_page。
23.2.3.4,将$page_sql_local搜索结果赋值给$page_result。
23.2.3.5,对搜索结果中的每一条,展示出来。
23.3,如果$only_one_site是否。
23.3.1,$website_node_local的perpage赋值给$website_local_per_page。
23.3.2,$page_sql加上对$website_local类似的模糊查询。
23.3.3,$offset_local为$currentpage-1乘以$website_local_per_page。
23.3.4,$page_sql_local加上limit $offset_local,$website_local_per_page。
23.3.5,搜索结果储存在$page_result。
23.3.6,对搜索结果中的每一条展示出来。
23.4,取得当时的系统时间$date。
23.5,将时间插入数据库。
23.6,如果没有匹配的搜索结果。
23.6.1,显示错误页面。
23.7,关闭数据库连接。
23.8,将$range赋值为3。
23.9,如果$currentpage大于1。
23.9.1,插入一个submit的按钮,name是pagination_head, value是“首页”,其border为0,background-color为transparent。
23.9.2,插入一个submit的按钮,name是pagination_prev, value是“前页”,其border为0,background-color为transparent。
23.10,对$x做循环,初始值为$currentpage-$range,最大值为$currentpage+$range+1,步长为1。
23.10.1,如果$x大于0并且$x小于$total_page。
23.10.1.1,如果$x的值等于$currentpage。
23.10.1.1.1,显示[$x]。
23.10.1.2,如果$x的值不等于$currentpage。
23.10.1.2.1,插入submit按钮,name为pagination, value为$x,其类型,background-color为Transparent, border为0。
23.11,如果$currentpage不等于$total_pages。
23.11.1,$currentpage加1赋值给$nextpage。
23.11.2,插入submit按钮,name为pagination_next, value为“下页”,其类型,background-color为Transparent, border为0。
23.11.3,插入submit按钮,name为pagination_final, value为“末页”,其类型,background-color为Transparent, border为0。
23.12,显示关闭表格模式。

Claims (8)

1.要求整个系统的构造及其衍生模式进行保护,其中包括前段处理模块,结果展示模块,其中包括搜索框模块,选择条件模块,广告位模块,排序模块,搜索结果展示及翻页模块五个子模块,反爬虫模块,其中将结果展示模块的五个子模块调换次序属于该结果展示模块的衍生模式,要求进行保护,具体的样式图,可以参照说明书附图中的图2,要求对该图的样式进行保护,同时对该图的衍生版本,比如调换各个子模块之间的顺序,也要求保护。
2.要求对该系统中的前端处理方式进行保护,其中包括中文自然语言处理方式,对包括“领域”,“领域 关键词1 关键词2”的分析模式进行保护,同时对其的衍生模式也申请保护,比如“领域 关键词1 关键词2 ...关键词n”将关键词复制了多次,属于衍生模式,而将各个关键词之间的空格替换为其他符号,比如“,”等,该模式也属于衍生模式,同时将一个空格或者其他分隔符换成多个,比如两个或者三个,也是属于衍生模式。
3. 要求对结果展示页面的几个模块及其排序方式进行保护,该搜索结果页面从上到下依次为,搜索框模块,条件选择模块,广告位模块,搜索结果展示和翻页模块,要求对该结果展示的主要内容及其衍生模式进行保护,比如类似的页面包括广告位模块,搜索结果展示和翻页模块,搜索框模块,条件选择模块,等调换次序的结果页面形式视为衍生形式,要求进行保护,同时对包含主要的几个页面,比如包含搜索框模块,广告位模块,搜索结果展示和翻页模块的结果页面,视为衍生模式,要求进行保护。
4. 要求对广告位模块进行保护,保护内容包括,该模块的生成方式及其衍生模式,其中包括但不限于,href的target为_blank,img对应客户的logo,点击行为触发javascript函数,并且进一步触发服务器端的函数,从而进行数据存储的整个流程,同时对其衍生模式要求保护,其中包括,使用href,链接到客户网站,点击行为触发javascript函数,该函数触发服务器端的存储功能,要求对这些衍生方法进行保护。
5.要求对反爬虫模块中的条件选择模式及其衍生模式进行保护,其中包括将不再使用GET方式向服务器传递参数,而是采用表格形式,对应的搜索结果页面为该页面本身,搜索条件全部改变成为submit类的请求,在该搜索结果页面本身的前端对提交的请求进行分析,得出搜索的关键词,同时对类似的衍生方法要求进行保护,比如其他的部分也需要使用GET进行搜索,使用类似的方法,比如使用表格形式,将需要传递的参数改为submit按钮提交,对应的动作页面也是该结果展示页面等,达到规避使用GET规避参数传递的效果的,这类方法属于本发明方法的衍生形式,也要进行保护。
6.要求对反爬虫模块中的搜索结果展示及其翻页模块以及基于该模块衍生出来的模式进行保护,其中包括将传统的翻页模块,需要采用GET方式向服务器发送参数,改为使用form表格形式,用post的形式提交,并且对应的搜索结果页面为该结果页面本身,其中前页,后页等,都采用submit的形式进行提交请求,并且在结果页面的前端加入分析模块,判断出该搜索达到的页面,从而达到规避GET形式的效果等,其衍生模式包括,使用form形式,包含该模块,使用submit的形式表示前页后页,其他页等的模式,同时包括使用form形式post形式,submit等方法规避GET的其他使用方法,要去对这些方法进行保护。
7. 要求对排序模块及其衍生模式进行保护,主要保护内容包括,使用配置文件存储网站名单及每个网站的展示条数,在结果页面中展示每个网站的搜索结果并且拼接起来的展示方式,搜索结果页面取所有网站中页数最大的哪一个等,其衍生形式包括但不限于,使用配置文件或者其他方式对不同的网站展示出不同的条数,而且其展示的内容和顺序由配置文件决定等。
8.要求对本设计方法涉及的技术方法及其衍生方法进行保护。
CN201610010711.6A 2016-01-08 2016-01-08 一种新型可排序反爬虫多领域垂直搜索网站的设计方法 Pending CN106959947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610010711.6A CN106959947A (zh) 2016-01-08 2016-01-08 一种新型可排序反爬虫多领域垂直搜索网站的设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610010711.6A CN106959947A (zh) 2016-01-08 2016-01-08 一种新型可排序反爬虫多领域垂直搜索网站的设计方法

Publications (1)

Publication Number Publication Date
CN106959947A true CN106959947A (zh) 2017-07-18

Family

ID=59480677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610010711.6A Pending CN106959947A (zh) 2016-01-08 2016-01-08 一种新型可排序反爬虫多领域垂直搜索网站的设计方法

Country Status (1)

Country Link
CN (1) CN106959947A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583730A (zh) * 2020-05-14 2020-08-25 安徽新华传媒股份有限公司 一种多功能文教展示系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070213457A1 (en) * 2005-02-11 2007-09-13 Invista North Amerca S.A R .L Solvent free aqueous polyurethane dispersions and adhesive films therefrom for stretch fabrics
CN103279516A (zh) * 2013-05-27 2013-09-04 百度在线网络技术(北京)有限公司 网络爬虫识别方法
CN104063523A (zh) * 2014-07-21 2014-09-24 焦点科技股份有限公司 一种电子商务搜索评分与排名的方法及系统
CN105187396A (zh) * 2015-08-11 2015-12-23 小米科技有限责任公司 识别网络爬虫的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070213457A1 (en) * 2005-02-11 2007-09-13 Invista North Amerca S.A R .L Solvent free aqueous polyurethane dispersions and adhesive films therefrom for stretch fabrics
CN103279516A (zh) * 2013-05-27 2013-09-04 百度在线网络技术(北京)有限公司 网络爬虫识别方法
CN104063523A (zh) * 2014-07-21 2014-09-24 焦点科技股份有限公司 一种电子商务搜索评分与排名的方法及系统
CN105187396A (zh) * 2015-08-11 2015-12-23 小米科技有限责任公司 识别网络爬虫的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘庆杰等: ""通过Filter抵御网页爬虫"", 《网络安全技术与应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583730A (zh) * 2020-05-14 2020-08-25 安徽新华传媒股份有限公司 一种多功能文教展示系统

Similar Documents

Publication Publication Date Title
EP2758900B1 (en) Providing topic based search guidance
Cafarella et al. Structured data on the web
CN102364473B (zh) 融合地理信息与视觉信息的网络新闻检索系统及方法
CN101223525B (zh) 关系网络
CN103023714B (zh) 基于网络话题的活跃度与集群结构分析系统及方法
CN102073725B (zh) 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
Irmak et al. Interactive wrapper generation with minimal user effort
CN102955848B (zh) 一种基于语义的三维模型检索系统和方法
US20120117500A1 (en) Method for the extraction, combination, synthesis and visualisation of multi-dimensional data from different sources
US20060161564A1 (en) Method and system for locating information in the invisible or deep world wide web
CN104699841A (zh) 提供搜索结果的列表摘要信息的方法和装置
CN105930469A (zh) 基于Hadoop的个性化旅游推荐系统及方法
Hassan et al. Task tours: helping users tackle complex search tasks
Hoeber Web information retrieval support systems: The future of web search
CN105138357A (zh) 一种移动应用操作助手的实现方法及其装置
WO2015198112A1 (en) Processing search queries and generating a search result page including search object related information
WO2015198113A1 (en) Processing search queries and generating a search result page including search object related information
Greene et al. The end of zero-hit queries: Query previews for NASA’s global change master directory
CN107807964B (zh) 数字内容排序方法、装置和计算机可读存储介质
KR20110050823A (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
Hoque et al. Combining conceptual query expansion and visual search results exploration for web image retrieval
CN106959947A (zh) 一种新型可排序反爬虫多领域垂直搜索网站的设计方法
Kolli et al. A Novel Nlp And Machine Learning Based Text Extraction Approach From Online News Feed
CN103312584A (zh) 一种在网络社区中发布信息的方法与设备
Kleppe et al. Polimedia-analysing media coverage of political debates by automatically generated links to radio newspaper items

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170718

RJ01 Rejection of invention patent application after publication