CN112434491A - Html表格解析为json解析系统及其解析方法 - Google Patents

Html表格解析为json解析系统及其解析方法 Download PDF

Info

Publication number
CN112434491A
CN112434491A CN202011354765.7A CN202011354765A CN112434491A CN 112434491 A CN112434491 A CN 112434491A CN 202011354765 A CN202011354765 A CN 202011354765A CN 112434491 A CN112434491 A CN 112434491A
Authority
CN
China
Prior art keywords
html
json
json format
analyzing
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011354765.7A
Other languages
English (en)
Inventor
谢刚强
戴集荷
俞川
黄凌峰
邵展翔
王体斌
吴亚民
程丽京
朱群锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xinyada Fintech Technology Co ltd
Original Assignee
Hangzhou Xinyada Fintech Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xinyada Fintech Technology Co ltd filed Critical Hangzhou Xinyada Fintech Technology Co ltd
Priority to CN202011354765.7A priority Critical patent/CN112434491A/zh
Publication of CN112434491A publication Critical patent/CN112434491A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了HTML表格解析为JSON解析系统及其解析方法,HTML表格解析为JSON解析方法,包括步骤S0:在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式。本发明公开的HTML表格解析为JSON解析系统及其解析方法,在jsoup基础上,基于对HTML中table、tr、th、td等标签语义的理解,可以解析任何符合HTML规范的表格,无需逐个通过标签获取数据进行拼装,支持顶部多重标题头、左侧多重标题头以及相关组合标题头表格的解析工作。

Description

HTML表格解析为JSON解析系统及其解析方法
技术领域
本发明属于HTML表格解析技术领域,具体涉及一种HTML表格解析为JSON解析系统和一种HTML(Hyper Text Markup Language,超文本标记语言)表格解析为JSON(JavaScript Object Notation,JavaScript对象简谱)解析方法。
背景技术
征信,伴随每个人一生的信用记录者。个人信用报告可以体现个人的信用状况,被称为“经济身份证”,和每个人息息相关。如何系统性、完整性、有效性、可解释性利用征信数据仍然是金融行业需要破解的课题。
然而,中国目前还缺乏完备的征信数据服务。央行征信中心是唯一提供人工解读征信报告的机构。但现状是没有标准的机器解读的征信报告,也没有标准的征信变量,很多金融机构在获取征信数据用人工可视化读表作决策。这不仅对读取人员经验上有高要求,可能做不到公平一致的信贷决策,也造成了大量小额个人信贷的巨大成本。同时,缺乏机器可读的好的征信数据产品也障碍了向智能数据风控的转型。随着二代征信报告的即将推出,作为一代征信的升级版,新征信将重点解决循环贷、信用卡大额专项分期、共同借款人、企业为个人担保、个人为企业担保、逾期后还款信息等一代征信没有覆盖的信息。与“一代”相比,二代征信解决循环贷、信用卡大额专项分期、共同借款人、企业为个人担保、个人为企业担保、逾期后还款信息等一代征信无法覆盖的信息。信息量的增加会增加人工解读的难度,已采用智能数据风控的金融机构面临着重新解析征信报告,再次构造征信变量的课题。另外,还要考虑和一代征信变量兼容的问题,以满足风控分析、规则、模型的需求。在解决二代征信解析和变量过程中还会面临一代征信同样的问题,比如如何构建有效、完善、维护工作少的变量体系;频繁地发现变量的不足和错误造成频繁的升级改版,增加风控的试错成本。
缺乏完整的征信数据产品,以及各金融机构应用数据的能力参差不齐,造成个人信贷行业风控成本居高不下。
在征信报告中主要以XML报告、HTML报告和PDF报告为主,目前对于HTML解析,以jsoup为例,采用getElementsByTag等方法进行解析,可以在已知标签的情况下可以的方便解析出内容,但是没有针对table标签结构专门的解析方法。需要逐个子标签解析并进行拼装,非常不方便。
因此,针对上述问题,予以进一步改进。
发明内容
本发明的主要目的在于提供HTML表格解析为JSON解析系统及其解析方法,在jsoup基础上,基于对HTML中table、tr、th、td等标签语义的理解,可以解析任何符合HTML规范的表格,无需逐个通过标签获取数据进行拼装,支持顶部多重标题头、左侧多重标题头以及相关组合标题头表格的解析工作。
本发明的另一目的在于提供HTML表格解析为JSON解析系统及其解析方法,支持各类复杂的HTML表格,极大的便利了HTML表格的解析过程。
本发明的另一目的在于提供HTML表格解析为JSON解析系统及其解析方法,HTML解析和对应JSON展现的内容,遵循人类从上到下、从左到右的阅读习惯,并且解析出的JSON内容极大的保留了原有HTML表格里面展现的信息。
为达到以上目的,本发明提供一种HTML表格解析为JSON解析方法,包括以下步骤:
步骤S0:在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出(征信)基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式;
步骤S1:将HTML表格的第一标签(th)部分转换为键,将HTML表格的第二标签(td)部分转换为值,以形成键值对;
步骤S2:将HTML表格的顶部和左侧的第一标签(th)部分以第一符号(优选为“.”点号)进行分割,并且按照从上到下和从左到右的顺序进行排列,以确保HTML表格的每一格的第二标签(td)均正确解析和表述为JSON格式。
作为上述技术方案的进一步优选的技术方案,步骤S2.1:将HTML表格的顶部单标题头表格进行解析为JSON格式。
作为上述技术方案的进一步优选的技术方案,步骤S2还具体实施为以下步骤:
步骤S2.2:将HTML表格的顶部多重标题头表格进行解析为JSON格式。
作为上述技术方案的进一步优选的技术方案,步骤S2还具体实施为以下步骤:
步骤S2.3:将HTML表格的左侧标题头表格进行解析为JSON格式。
作为上述技术方案的进一步优选的技术方案,步骤S2还具体实施为以下步骤:
步骤S2.4:将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式。
作为上述技术方案的进一步优选的技术方案,步骤S2还具体实施为以下步骤:
步骤S2.5:将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式。
为达到以上目的,本发明还提供一种HTML表格解析为JSON系统,包括报文输入模块和报文解析模块,其中:
在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出(征信)基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式;
将HTML表格的第一标签(th)部分转换为键,将HTML表格的第二标签(td)部分转换为值,以形成键值对;
将HTML表格的顶部和左侧的第一标签(th)部分以第一符号(优选为“.”点号)进行分割,并且按照从上到下和从左到右的顺序进行排列,以确保HTML表格的每一格的第二标签(td)均正确解析和表述为JSON格式。
作为上述技术方案的进一步优选的技术方案,将HTML表格的顶部单标题头表格进行解析为JSON格式;
将HTML表格的顶部多重标题头表格进行解析为JSON格式;
将HTML表格的左侧标题头表格进行解析为JSON格式;
将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式;
将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式。
附图说明
图1是本发明的HTML表格解析为JSON系统及其解析方法的优选实施例的案例1的示意图。
图2是本发明的HTML表格解析为JSON系统及其解析方法的优选实施例的案例2的示意图。
图3是本发明的HTML表格解析为JSON系统及其解析方法的优选实施例的案例3的示意图。
图4是本发明的HTML表格解析为JSON系统及其解析方法的优选实施例的案例4的示意图。
图5是本发明的HTML表格解析为JSON系统及其解析方法的优选实施例的案例5的示意图。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
在本发明的优选实施例中,本领域技术人员应注意,本发明所涉及的HTML表格和JSON格式等可被视为现有技术。
优选实施例。
本发明公开了一种HTML表格解析为JSON解析方法,包括以下步骤:
步骤S0:在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出(征信)基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式;
步骤S1:将HTML表格的第一标签(th)部分转换为键,将HTML表格的第二标签(td)部分转换为值,以形成键值对;
步骤S2:将HTML表格的顶部和左侧的第一标签(th)部分以第一符号(优选为“.”点号)进行分割,并且按照从上到下和从左到右的顺序进行排列,以确保HTML表格的每一格的第二标签(td)均正确解析和表述为JSON格式。
具体的是,步骤S2具体实施为以下步骤:
步骤S2.1:将HTML表格的顶部单标题头表格进行解析为JSON格式。
更具体的是,步骤S2还具体实施为以下步骤:
步骤S2.2:将HTML表格的顶部多重标题头表格进行解析为JSON格式。
进一步的是,步骤S2还具体实施为以下步骤:
步骤S2.3:将HTML表格的左侧标题头表格进行解析为JSON格式。
更进一步的是,步骤S2还具体实施为以下步骤:
步骤S2.4:将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式。
优选地,步骤S2还具体实施为以下步骤:
步骤S2.5:将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式。
本发明还公开了一种HTML表格解析为JSON系统,包括报文输入模块和报文解析模块,其中:
在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出(征信)基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式;
将HTML表格的第一标签(th)部分转换为键,将HTML表格的第二标签(td)部分转换为值,以形成键值对;
将HTML表格的顶部和左侧的第一标签(th)部分以第一符号(优选为“.”点号)进行分割,并且按照从上到下和从左到右的顺序进行排列,以确保HTML表格的每一格的第二标签(td)均正确解析和表述为JSON格式。
具体的是,将HTML表格的顶部单标题头表格进行解析为JSON格式;
将HTML表格的顶部多重标题头表格进行解析为JSON格式;
将HTML表格的左侧标题头表格进行解析为JSON格式;
将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式;
将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式。
优选地,以下对本发明的解析进行举例:
案例1:将HTML表格的顶部单标题头表格进行解析为JSON格式:
对应HTML格式如下:
Figure BDA0002802262920000071
转换出的JSON格式如下:
Figure BDA0002802262920000081
案例2:将HTML表格的顶部多重标题头表格进行解析为JSON格式:
对应HTML格式如下:
Figure BDA0002802262920000082
转换出的JSON格式如下:
Figure BDA0002802262920000083
Figure BDA0002802262920000091
案例3:将HTML表格的左侧标题头表格进行解析为JSON格式:
对应HTML格式如下:
Figure BDA0002802262920000092
转换出的JSON格式如下:
Figure BDA0002802262920000093
Figure BDA0002802262920000101
案例4:将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式:
对应HTML格式如下:
Figure BDA0002802262920000102
转换出的JSON格式如下:
Figure BDA0002802262920000103
案例5:将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式:
对应HTML格式如下:
Figure BDA0002802262920000111
转换出的JSON格式如下:
Figure BDA0002802262920000112
本案例,也是顶部标题头跨列和左侧标题头跨行的情况。
值得一提的是,本发明专利申请涉及的HTML表格和JSON格式等技术特征应被视为现有技术,这些技术特征的具体结构、工作原理以及可能涉及到的控制方式、空间布置方式采用本领域的常规选择即可,不应被视为本发明专利的发明点所在,本发明专利不做进一步具体展开详述。
对于本领域的技术人员而言,依然可以对前述各实施例所记载的技术方案进行修改,或对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围。

Claims (8)

1.一种HTML表格解析为JSON解析方法,其特征在于,包括以下步骤:
步骤S0:在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式;
步骤S1:将HTML表格的第一标签部分转换为键,将HTML表格的第二标签部分转换为值,以形成键值对;
步骤S2:将HTML表格的顶部和左侧的第一标签部分以第一符号进行分割,并且按照从上到下和从左到右的顺序进行排列,以确保HTML表格的每一格的第二标签均正确解析和表述为JSON格式。
2.根据权利要求1所述的一种HTML表格解析为JSON解析方法,其特征在于,步骤S2具体实施为以下步骤:
步骤S2.1:将HTML表格的顶部单标题头表格进行解析为JSON格式。
3.根据权利要求2所述的一种HTML表格解析为JSON解析方法,其特征在于,步骤S2还具体实施为以下步骤:
步骤S2.2:将HTML表格的顶部多重标题头表格进行解析为JSON格式。
4.根据权利要求3所述的一种HTML表格解析为JSON解析方法,其特征在于,步骤S2还具体实施为以下步骤:
步骤S2.3:将HTML表格的左侧标题头表格进行解析为JSON格式。
5.根据权利要求4所述的一种HTML表格解析为JSON解析方法,其特征在于,步骤S2还具体实施为以下步骤:
步骤S2.4:将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式。
6.根据权利要求5所述的一种HTML表格解析为JSON解析方法,其特征在于,步骤S2还具体实施为以下步骤:
步骤S2.5:将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式。
7.一种HTML表格解析为JSON系统,其特征在于,包括报文输入模块和报文解析模块,其中:
在报文输入模块输入HTML表格,并且报文解析模块对输入的HTML表格进行报文解析,在报文解析的过程中对入HTML表格进行数据完整性校验,并且进行缺失值处理后提取出基础字段形成统一的报文对象,以转换为JAVA对象后生成JSON格式;
将HTML表格的第一标签部分转换为键,将HTML表格的第二标签部分转换为值,以形成键值对;
将HTML表格的顶部和左侧的第一标签部分以第一符号进行分割,并且按照从上到下和从左到右的顺序进行排列,以确保HTML表格的每一格的第二标签均正确解析和表述为JSON格式。
8.根据权利要求7所述的一种HTML表格解析为JSON系统,其特征在于,
将HTML表格的顶部单标题头表格进行解析为JSON格式;
将HTML表格的顶部多重标题头表格进行解析为JSON格式;
将HTML表格的左侧标题头表格进行解析为JSON格式;
将HTML表格的顶侧和左侧标题头共存表格进行解析为JSON格式;
将HTML表格的顶侧多重和左侧多重标题头共存表格进行解析为JSON格式。
CN202011354765.7A 2020-11-27 2020-11-27 Html表格解析为json解析系统及其解析方法 Pending CN112434491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011354765.7A CN112434491A (zh) 2020-11-27 2020-11-27 Html表格解析为json解析系统及其解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011354765.7A CN112434491A (zh) 2020-11-27 2020-11-27 Html表格解析为json解析系统及其解析方法

Publications (1)

Publication Number Publication Date
CN112434491A true CN112434491A (zh) 2021-03-02

Family

ID=74698916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011354765.7A Pending CN112434491A (zh) 2020-11-27 2020-11-27 Html表格解析为json解析系统及其解析方法

Country Status (1)

Country Link
CN (1) CN112434491A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970486A (zh) * 2022-07-13 2022-08-30 港胜技术服务(深圳)有限公司 用于为软件测试结果生成pdf报告的方法、设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620636A (zh) * 2009-08-21 2010-01-06 腾讯科技(北京)有限公司 一种显示表格数据的方法和装置
CN103853588A (zh) * 2012-12-05 2014-06-11 苏州精易会信息技术有限公司 一种通过浏览器内核解析html表格列操作的方法
CN104410667A (zh) * 2014-10-31 2015-03-11 北京思特奇信息技术股份有限公司 一种xml报文到json报文的转换方法及系统
CN107357817A (zh) * 2017-06-08 2017-11-17 长安大学 一种面向json的网页模块化设计及其异步加载方法
CN107463669A (zh) * 2017-08-03 2017-12-12 深圳市华傲数据技术有限公司 解析爬虫爬取的网页数据的方法及装置
CN107943465A (zh) * 2017-12-29 2018-04-20 北京奇虎科技有限公司 一种生成html表单的方法及装置
CN109597954A (zh) * 2018-11-28 2019-04-09 南京赛克蓝德网络科技有限公司 数据项展示方法、装置、计算设备和介质
CN109614424A (zh) * 2018-11-28 2019-04-12 南京赛克蓝德网络科技有限公司 页面布局生成方法、装置、计算设备和介质
CN111556039A (zh) * 2020-04-21 2020-08-18 南京行者易智能交通科技有限公司 一种通用微服务的web数据导出方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620636A (zh) * 2009-08-21 2010-01-06 腾讯科技(北京)有限公司 一种显示表格数据的方法和装置
CN103853588A (zh) * 2012-12-05 2014-06-11 苏州精易会信息技术有限公司 一种通过浏览器内核解析html表格列操作的方法
CN104410667A (zh) * 2014-10-31 2015-03-11 北京思特奇信息技术股份有限公司 一种xml报文到json报文的转换方法及系统
CN107357817A (zh) * 2017-06-08 2017-11-17 长安大学 一种面向json的网页模块化设计及其异步加载方法
CN107463669A (zh) * 2017-08-03 2017-12-12 深圳市华傲数据技术有限公司 解析爬虫爬取的网页数据的方法及装置
CN107943465A (zh) * 2017-12-29 2018-04-20 北京奇虎科技有限公司 一种生成html表单的方法及装置
CN109597954A (zh) * 2018-11-28 2019-04-09 南京赛克蓝德网络科技有限公司 数据项展示方法、装置、计算设备和介质
CN109614424A (zh) * 2018-11-28 2019-04-12 南京赛克蓝德网络科技有限公司 页面布局生成方法、装置、计算设备和介质
CN111556039A (zh) * 2020-04-21 2020-08-18 南京行者易智能交通科技有限公司 一种通用微服务的web数据导出方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ADAM: "Convert HTML table with a header to Json - Python", pages 5, Retrieved from the Internet <URL:https://stackoverflow.com/questions/59965892/convert-html-table-with-a-header-to-json-python> *
JOSHUA: "How to parse table with rowspan and colspan", pages 3 - 6, Retrieved from the Internet <URL:https://stackoverflow.com/questions/48393253/how-to-parse-table-with-rowspan-and-colspan> *
MILAD MOHAMMADI: "Parse HTML table to JSON using Jsoup in Java", pages 3, Retrieved from the Internet <URL:https://stackoverflow.com/questions/42446990/parse-html-table-to-json-using-jsoup-in-java> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970486A (zh) * 2022-07-13 2022-08-30 港胜技术服务(深圳)有限公司 用于为软件测试结果生成pdf报告的方法、设备和介质

Similar Documents

Publication Publication Date Title
US20060288268A1 (en) Method for extracting, interpreting and standardizing tabular data from unstructured documents
US20160328526A1 (en) Case management system using a medical event forecasting engine
CN108153729B (zh) 一种面向金融领域的知识抽取方法
US20230401828A1 (en) Method for training image recognition model, electronic device and storage medium
US20210357633A1 (en) Document processing using hybrid rule-based artificial intelligence (ai) mechanisms
CN110543475A (zh) 一种基于机器学习的财务报表数据自动识别和分析方法
CN112434491A (zh) Html表格解析为json解析系统及其解析方法
CN116453125A (zh) 基于人工智能的数据录入方法、装置、设备及存储介质
CN109933769A (zh) 一种基于Excel的报表数据快速解析方法
CN113298495A (zh) 简历筛选方法、简历筛选装置、终端设备及存储介质
CN116415562B (zh) 用于解析金融数据的方法、设备和介质
US11461616B2 (en) Method and system for analyzing documents
CN117724691A (zh) 一种表格组件开发方法、装置、设备及介质
US20210049133A1 (en) System and method for automated document generation
CN111581937A (zh) 文档生成方法、装置、计算机可读介质及电子设备
US11281901B2 (en) Document extraction system and method
CN111143337B (zh) 产品数据管理系统中提升数据质量的方法
Oswari et al. Extensible business report language (XBRL) implementation of financial reporting standard in Indonesian banking industry
CN111428724B (zh) 一种试卷手写统分方法、装置及存储介质
CN111667214B (zh) 基于二维码的货物信息获取方法、装置及电子设备
CN111652272A (zh) 图像处理方法及装置、计算机设备、存储介质
Goldfarb et al. Macro To Produce SAS®-Readable Table of Content From TLF Shells
Durante et al. How to build a better database: When python programming meets Bloomberg's Open API
CN114493829B (zh) 一种风险策略文档输入自动实现效果模拟的方法及系统
KR102384508B1 (ko) 전자점자 파일을 생성하는 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination