CN105956002A - 一种基于url分析的网页分类方法及装置 - Google Patents

一种基于url分析的网页分类方法及装置 Download PDF

Info

Publication number
CN105956002A
CN105956002A CN201610248482.1A CN201610248482A CN105956002A CN 105956002 A CN105956002 A CN 105956002A CN 201610248482 A CN201610248482 A CN 201610248482A CN 105956002 A CN105956002 A CN 105956002A
Authority
CN
China
Prior art keywords
url
webpage
classification
text
rough sort
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610248482.1A
Other languages
English (en)
Inventor
潘宇翔
李青海
简宋全
侯大勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jing Dian Computing Machine Science And Technology Ltd
Original Assignee
Guangzhou Jing Dian Computing Machine Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jing Dian Computing Machine Science And Technology Ltd filed Critical Guangzhou Jing Dian Computing Machine Science And Technology Ltd
Priority to CN201610248482.1A priority Critical patent/CN105956002A/zh
Publication of CN105956002A publication Critical patent/CN105956002A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于URL分析的网页分类方法及装置,该装置包括网页粗分类模块、网页文本分类模块和存储模块。与现有技术比较本发明的有益效果在于:本发明提供的一种基于URL分析的网页分类方法及装置,通过在进行网页文本分类之前增加URL分析,根据URL分析结果,对网页先进行一个粗分类,然后将无法粗分类的网页进行网页文本分类,从而实现对所有网页的快速有效分类,以帮助用户筛选出他们想要内容的网页。

Description

一种基于URL分析的网页分类方法及装置
技术领域
本发明涉及网页分类技术领域,尤其涉及一种基于URL分析的网页分类方法及装置。
背景技术
随着互联网2.0的到来,网页数量显海量级增长。面对Internet上日益膨胀的信息,如何快速、准确地从浩瀚的信息资源中寻找想要的内容成为一项重大问题。文本分类作为一项具有较大实用价值的关键技术可以有效解决以上问题,但是由于网页不仅仅包含文本,决定了网页分类方法比文本分类方法要更加丰富。现有的网页分类方法对网页的分类速度慢。
鉴于上述缺陷,本发明创作者经过长时间的研究和试验,最终获得了本发明。
发明内容
本发明的目的在于提供一种基于URL分析的网页分类方法及装置用以克服上述技术缺陷。
为实现上述目的,本发明采用的技术方案在于:
一方面提供了一种基于URL分析的网页分类方法,该方法包括以下步骤:
步骤S1,对完整的URL进行分块处理,并根据URL字典从URL块中筛选出特征词,根据所述URL字典和所述特征词对所述URL进行粗分类,得到可以粗分类的网页及其对应的类别;
步骤S2,对无法粗分类的网页中的网页文本进行预处理并转换成向量模型后,通过分类器进行分类,得到无法粗分类的网页及其对应的类别;
步骤S3,将所述完整的URL、所述可以粗分类的网页及其对应的类别和所述无法分类的网页及其对应的类别进行存储。
较佳的,所述步骤S1具体包括以下步骤:
步骤S11,对数据源传递过来的完整的URL,根据符号和数字将所述URL进行分块处理,形成URL块,去除对分类没有作用的URL块;
步骤S12,对照已建立好的URL字典,从URL块中筛选出对分类有意义的特征词,根据所述URL字典和这些筛选出的特征词URL进行粗分类,得到可以粗分类的网页及其对应的类别。
较佳的,所述步骤S2具体包括以下步骤:
步骤S21,对所述无法粗分类的网页的文本进行中文分词和去停用词;
步骤S22,根据一个已经被标注的训练文本集合,对该训练文本进行中文分词和去停用词后,从该训练文本中提取关键词并进行降维,然后将该训练文本转换为结构化的计算机可识别处理的空间向量模型,通过Rocchio算法找到文本特征和文本类别之间的分类器;
步骤S23,将已经进行中文分词和去停用词的无法粗分类的网页的文本表示成向量模型;
步骤S24,利用分类器将已经文本表示后的无法粗分类的网页进行分类,得到无法粗分类的网页及其对应的类别。
较佳的,所述中文分词采用最大匹配方法进行分词。
又一方面提供了一种基于URL分析的网页分类装置,该装置包括:
网页粗分类模块,用于对完整的URL进行分块处理,并根据URL字典从URL块中筛选出特征词,根据URL字典和特征词对URL进行粗分类,得到可以粗分类的网页及其对应的类别;
网页文本分类模块,用于对无法粗分类的网页中的网页文本进行预处理并转换成向量模型后,通过生成好的分类器进行分类,得到无法粗分类的网页及其对应的类别;
存储模块,用于存储完整的URL、可以粗分类的网页及其对应的类别和无法分类的网页及其对应的类别。
较佳的,所述网页粗分类模块包括:
URL预处理单元,用于对数据源传递过来的完整的URL,根据符号和数字将URL进行分块处理,形成URL块,去除对分类没有作用的URL块;
URL分析单元,对照已建立好的URL字典,从URL块中筛选出对分类有意义的特征词,根据URL字典和这些筛选出的特征词URL进行粗分类,得到可以粗分类的网页及其对应的类别。
较佳的,网页文本分类模块包括:
文本预处理单元,用于对无法粗分类的网页的文本进行中文分词和去停用词;
分类器生成单元,用于根据一个已经被标注的训练文本集合,对该训练文本进行中文分词和去停用词后,从该训练文本中提取关键词并进行降维,然后将该训练文本转换为结构化的计算机可识别处理的空间向量模型,通过Rocchio算法找到文本特征和文本类别之间的分类器;
文本表示单元,用于将已经进行中文分词和去停用词的无法粗分类的网页的文本表示成向量模型;
分类单元,用于利用分类器将已经文本表示后的无法粗分类的网页进行分类,得到无法粗分类的网页及其对应的类别。
较佳的,所述中文分词采用最大匹配方法进行分词。
与现有技术比较本发明的有益效果在于:本发明提供的一种基于URL分析的网页分类方法及装置,通过在进行网页文本分类之前增加URL分析,根据URL分析结果,对网页先进行一个粗分类,然后将无法粗分类的网页进行网页文本分类,从而实现对所有网页的快速有效分类,以帮助用户筛选出他们想要内容的网页。
附图说明
图1为本发明提供的一种基于URL分析的网页分类方法的流程图;
图2为步骤S1的流程示意图;
图3为步骤S2的流程示意图;
图4为本发明提供的一种基于URL分析的网页分类装置的功能框图;
图5为网页粗分类模块的功能框图;
图6为网页文本分类模块的功能框图。
具体实施方式
为便于进一步理解本发明的技术内容,下面结合附图对本发明作进一步说明。
实施例一
如图1所示,为本发明提供的一种基于URL分析的网页分类方法的流程图,该方法包括以下步骤:
步骤S1,对完整的URL进行分块处理,并根据URL字典从URL块中筛选出特征词,根据URL字典和特征词对URL进行粗分类,得到可以粗分类的网页及其对应的类别。
步骤S2,对无法粗分类的网页中的网页文本进行预处理并转换成向量模型后,通过生成好的分类器进行分类,得到无法粗分类的网页及其对应的类别。
步骤S3,将完整的URL、可以粗分类的网页及其对应的类别和无法分类的网页及其对应的类别进行存储。
如图2所示,为步骤S1的流程示意图,步骤S1具体包括以下步骤:
步骤S11,对数据源传递过来的完整的URL,根据符号和数字将URL进行分块处理,形成URL块,去除对分类没有作用的URL块。
步骤S12,对照已建立好的URL字典,从URL块中筛选出对分类有意义的特征词,根据URL字典和这些筛选出的特征词URL进行粗分类,得到可以粗分类的网页及其对应的类别。
例如:完整的一个URL:http://www.bilibili.com/video/av3431247/,按照:、//、.、/等符号对该URL进行分块,结果得到http、www、bilibili、com、video、av3431247等URL块;然后再去除http、www这些对分类没有作用的URL块;对照字典URL后筛选出的特征词是bilibili、video、av3431247;然后根据URL字典和这些筛选出的特征词,我们可以对该URL归类为教育类。
如图3所示,为步骤S2的流程示意图,步骤S2具体包括以下步骤:
步骤S21,对无法粗分类的网页的文本进行中文分词和去停用词。
具体的,中文分词采用最大匹配方法进行分词,即按照最大匹配的策略将待分析的字符串与一个机器词典中的词条进行匹配,若从词典中找到某个字符串,则匹配成功。
步骤S22,根据一个已经被标注的训练文本集合,对该训练文本进行中文分词和去停用词后,从该训练文本中提取关键词并进行降维,然后将该训练文本转换为结构化的计算机可识别处理的空间向量模型,通过Rocchio算法找到文本特征和文本类别之间的分类器。
其中,Rocchio算法,即类中心最近距离判别算法,它的基本思路是用简单的算术平均为每类中的训练集生成一个代表该类向量的中心向量,然后计算测试新向量与每类中心向量之间的相识度,最后判断文本属于与它最相似的类。
步骤S23,将已经进行中文分词和去停用词的无法粗分类的网页的文本表示成向量模型。
其中,向量空间模型基于如下假设:文章中词条出现的顺序无关紧要,它们之间是相互独立的而忽略其依赖性,把文本看作一系列无序词条的集合。在该模型中,每篇文本表示为特征空间的一个向量,向量中的每一维对应于文本中的一个词条,每一个词条称为一个特征项,每一个特征词的值为该向量维对应的特征在文本集中的权值。
步骤S24,利用分类器将已经文本表示后的无法粗分类的网页进行分类,得到无法粗分类的网页及其对应的类别。
实施例二
如图4所示,为本发明提供的一种基于URL分析的网页分类装置的功能框图,该装置包括:
网页粗分类模块10,用于对完整的URL进行分块处理,并根据URL字典从URL块中筛选出特征词,根据URL字典和特征词对URL进行粗分类,得到可以粗分类的网页及其对应的类别。
网页文本分类模块20,用于对无法粗分类的网页中的网页文本进行预处理并转换成向量模型后,通过生成好的分类器进行分类,得到无法粗分类的网页及其对应的类别。
存储模块30,用于存储完整的URL、可以粗分类的网页及其对应的类别和无法分类的网页及其对应的类别。
如图5所示,为网页粗分类模块的功能框图,网页粗分类模块10包括:URL预处理单元101和URL分析单元102。
URL预处理单元101,用于对数据源传递过来的完整的URL,根据符号和数字将URL进行分块处理,形成URL块,去除对分类没有作用的URL块。
URL分析单元102,对照已建立好的URL字典,从URL块中筛选出对分类有意义的特征词,根据URL字典和这些筛选出的特征词URL进行粗分类,得到可以粗分类的网页及其对应的类别。
如图6所示,为网页文本分类模块的功能框图,网页文本分类模块20包括:文本预处理单元201、分类器生成单元202、文本表示单元203和分类单元204。
文本预处理单元201,用于对无法粗分类的网页的文本进行中文分词和去停用词。中文分词采用最大匹配方法进行分词,即按照最大匹配的策略将待分析的字符串与一个机器词典中的词条进行匹配,若从词典中找到某个字符串,则匹配成功。
分类器生成单元202,用于根据一个已经被标注的训练文本集合,对该训练文本进行中文分词和去停用词后,从该训练文本中提取关键词并进行降维,然后将该训练文本转换为结构化的计算机可识别处理的空间向量模型,通过Rocchio算法找到文本特征和文本类别之间的分类器。Rocchio算法,即类中心最近距离判别算法,它的基本思路是用简单的算术平均为每类中的训练集生成一个代表该类向量的中心向量,然后计算测试新向量与每类中心向量之间的相识度,最后判断文本属于与它最相似的类。
文本表示单元203,用于将已经进行中文分词和去停用词的无法粗分类的网页的文本表示成向量模型。向量空间模型基于如下假设:文章中词条出现的顺序无关紧要,它们之间是相互独立的而忽略其依赖性,把文本看作一系列无序词条的集合。在该模型中,每篇文本表示为特征空间的一个向量,向量中的每一维对应于文本中的一个词条,每一个词条称为一个特征项,每一个特征词的值为该向量维对应的特征在文本集中的权值。
分类单元204,用于利用分类器将已经文本表示后的无法粗分类的网页进行分类,得到无法粗分类的网页及其对应的类别。
本发明提供的一种基于URL分析的网页分类方法及装置,通过在进行网页文本分类之前增加URL分析,根据URL分析结果,对网页先进行一个粗分类,然后将无法粗分类的网页进行网页文本分类,从而实现对所有网页的快速有效分类,以帮助用户筛选出他们想要内容的网页。
以上所述仅为本发明的较佳实施例,对本发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

Claims (8)

1.一种基于URL分析的网页分类方法,其特征在于,该方法包括以下步骤:
步骤S1,对完整的URL进行分块处理,并根据URL字典从URL块中筛选出特征词,根据所述URL字典和所述特征词对所述URL进行粗分类,得到可以粗分类的网页及其对应的类别;
步骤S2,对无法粗分类的网页中的网页文本进行预处理并转换成向量模型后,通过分类器进行分类,得到无法粗分类的网页及其对应的类别;
步骤S3,将所述完整的URL、所述可以粗分类的网页及其对应的类别和所述无法分类的网页及其对应的类别进行存储。
2.根据权利要求1所述的一种基于URL分析的网页分类方法,其特征在于,所述步骤S1具体包括以下步骤:
步骤S11,对数据源传递过来的完整的URL,根据符号和数字将所述URL进行分块处理,形成URL块,去除对分类没有作用的URL块;
步骤S12,对照已建立好的URL字典,从URL块中筛选出对分类有意义的特征词,根据所述URL字典和这些筛选出的特征词URL进行粗分类,得到可以粗分类的网页及其对应的类别。
3.根据权利要求1所述的一种基于URL分析的网页分类方法,其特征在于,所述步骤S2具体包括以下步骤:
步骤S21,对所述无法粗分类的网页的文本进行中文分词和去停用词;
步骤S22,根据一个已经被标注的训练文本集合,对该训练文本进行中文分词和去停用词后,从该训练文本中提取关键词并进行降维,然后将该训练文本转换为结构化的计算机可识别处理的空间向量模型,通过Rocchio算法找到文本特征和文本类别之间的分类器;
步骤S23,将已经进行中文分词和去停用词的无法粗分类的网页的文本表示成向量模型;
步骤S24,利用分类器将已经文本表示后的无法粗分类的网页进行分类,得到无法粗分类的网页及其对应的类别。
4.根据权利要求3所述的一种基于URL分析的网页分类方法,其特征在于,所述中文分词采用最大匹配方法进行分词。
5.一种基于URL分析的网页分类装置,其特征在于,该装置包括:
网页粗分类模块,用于对完整的URL进行分块处理,并根据URL字典从URL块中筛选出特征词,根据URL字典和特征词对URL进行粗分类,得到可以粗分类的网页及其对应的类别;
网页文本分类模块,用于对无法粗分类的网页中的网页文本进行预处理并转换成向量模型后,通过生成好的分类器进行分类,得到无法粗分类的网页及其对应的类别;
存储模块,用于存储完整的URL、可以粗分类的网页及其对应的类别和无法分类的网页及其对应的类别。
6.根据权利要求5所述的一种基于URL分析的网页分类装置,其特征在于,所述网页粗分类模块包括:
URL预处理单元,用于对数据源传递过来的完整的URL,根据符号和数字将URL进行分块处理,形成URL块,去除对分类没有作用的URL块;
URL分析单元,对照已建立好的URL字典,从URL块中筛选出对分类有意义的特征词,根据URL字典和这些筛选出的特征词URL进行粗分类,得到可以粗分类的网页及其对应的类别。
7.根据权利要求5所述的一种基于URL分析的网页分类装置,其特征在于,网页文本分类模块包括:
文本预处理单元,用于对无法粗分类的网页的文本进行中文分词和去停用词;
分类器生成单元,用于根据一个已经被标注的训练文本集合,对该训练文本进行中文分词和去停用词后,从该训练文本中提取关键词并进行降维,然后将该训练文本转换为结构化的计算机可识别处理的空间向量模型,通过Rocchio算法找到文本特征和文本类别之间的分类器;
文本表示单元,用于将已经进行中文分词和去停用词的无法粗分类的网页的文本表示成向量模型;
分类单元,用于利用分类器将已经文本表示后的无法粗分类的网页进行分类,得到无法粗分类的网页及其对应的类别。
8.根据权利要求7所述的一种基于URL分析的网页分类装置,其特征在于,所述中文分词采用最大匹配方法进行分词。
CN201610248482.1A 2016-04-20 2016-04-20 一种基于url分析的网页分类方法及装置 Pending CN105956002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610248482.1A CN105956002A (zh) 2016-04-20 2016-04-20 一种基于url分析的网页分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610248482.1A CN105956002A (zh) 2016-04-20 2016-04-20 一种基于url分析的网页分类方法及装置

Publications (1)

Publication Number Publication Date
CN105956002A true CN105956002A (zh) 2016-09-21

Family

ID=56917788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610248482.1A Pending CN105956002A (zh) 2016-04-20 2016-04-20 一种基于url分析的网页分类方法及装置

Country Status (1)

Country Link
CN (1) CN105956002A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291688A (zh) * 2017-05-22 2017-10-24 南京大学 基于主题模型的裁判文书相似度分析方法
CN107741960A (zh) * 2017-09-25 2018-02-27 厦门集微科技有限公司 Url的分类方法及装置
CN109284385A (zh) * 2018-10-15 2019-01-29 平安科技(深圳)有限公司 基于机器学习的文本分类方法及终端设备
CN109726341A (zh) * 2018-12-28 2019-05-07 四川新网银行股份有限公司 一种基于网页分类和聚类的网页信息自动抽取方法
CN113254595A (zh) * 2021-06-22 2021-08-13 北京沃丰时代数据科技有限公司 闲聊识别方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060265345A1 (en) * 2005-05-20 2006-11-23 Microsoft Corporation System and method for URL virtualization and mapping
CN103902703A (zh) * 2014-03-31 2014-07-02 辽宁四维科技发展有限公司 基于移动互联网访问的文本内容分类方法
CN105117436A (zh) * 2015-08-10 2015-12-02 上海晶赞科技发展有限公司 网站频道自动挖掘方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060265345A1 (en) * 2005-05-20 2006-11-23 Microsoft Corporation System and method for URL virtualization and mapping
CN103902703A (zh) * 2014-03-31 2014-07-02 辽宁四维科技发展有限公司 基于移动互联网访问的文本内容分类方法
CN105117436A (zh) * 2015-08-10 2015-12-02 上海晶赞科技发展有限公司 网站频道自动挖掘方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王立建等: "基于Web页面有效信息抽取的分类方法", 《电脑开发与应用》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291688A (zh) * 2017-05-22 2017-10-24 南京大学 基于主题模型的裁判文书相似度分析方法
CN107741960A (zh) * 2017-09-25 2018-02-27 厦门集微科技有限公司 Url的分类方法及装置
CN109284385A (zh) * 2018-10-15 2019-01-29 平安科技(深圳)有限公司 基于机器学习的文本分类方法及终端设备
CN109726341A (zh) * 2018-12-28 2019-05-07 四川新网银行股份有限公司 一种基于网页分类和聚类的网页信息自动抽取方法
CN113254595A (zh) * 2021-06-22 2021-08-13 北京沃丰时代数据科技有限公司 闲聊识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105956002A (zh) 一种基于url分析的网页分类方法及装置
CN102799647B (zh) 网页去重方法和设备
CN108182175B (zh) 一种文本质量指标获取方法及装置
CN103853834B (zh) 基于文本结构分析的Web文档摘要的生成方法
US20170185680A1 (en) Chinese website classification method and system based on characteristic analysis of website homepage
CN105279277A (zh) 知识数据的处理方法和装置
Chawla et al. Product opinion mining using sentiment analysis on smartphone reviews
CN102486791A (zh) 书签智能分类的方法和服务器
CN105528422A (zh) 一种主题爬虫处理方法及装置
CN105975478A (zh) 一种基于词向量分析的网络文章所属事件的检测方法和装置
CN106021383A (zh) 网页相似度计算方法及装置
CN103577755A (zh) 一种基于支持向量机的恶意脚本静态检测方法
CN107346433A (zh) 一种文本数据分类方法及服务器
CN103309862A (zh) 一种网页类型识别方法和系统
CN105183784A (zh) 一种基于内容的垃圾网页检测方法及其检测装置
CN103514279B (zh) 一种句子级情感分类方法及装置
CN110287409B (zh) 一种网页类型识别方法及装置
CN103177036A (zh) 一种标签自动提取方法和系统
CN110457579B (zh) 基于模板和分类器协同工作的网页去噪方法及系统
CN104503988A (zh) 搜索方法及装置
Geng et al. Evaluating web content quality via multi-scale features
Permana et al. Naive Bayes as opinion classifier to evaluate students satisfaction based on student sentiment in Twitter Social Media
CN104133870A (zh) 一种网页相似度计算方法及装置
CN113312476A (zh) 一种文本自动打标签方法及其装置和终端
CN104239285A (zh) 文章新章节的检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160921