CN108564997A - 一种临床研究报告生成方法和装置 - Google Patents

一种临床研究报告生成方法和装置 Download PDF

Info

Publication number
CN108564997A
CN108564997A CN201810354981.8A CN201810354981A CN108564997A CN 108564997 A CN108564997 A CN 108564997A CN 201810354981 A CN201810354981 A CN 201810354981A CN 108564997 A CN108564997 A CN 108564997A
Authority
CN
China
Prior art keywords
title
text
target
default
list data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810354981.8A
Other languages
English (en)
Inventor
于�玲
李星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenzhen Zhi Yao Technology Co Ltd
Original Assignee
Beijing Shenzhen Zhi Yao Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenzhen Zhi Yao Technology Co Ltd filed Critical Beijing Shenzhen Zhi Yao Technology Co Ltd
Priority to CN201810354981.8A priority Critical patent/CN108564997A/zh
Publication of CN108564997A publication Critical patent/CN108564997A/zh
Priority to US16/201,110 priority patent/US20190326001A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/328Management therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明实施例提供一种临床研究报告生成方法和装置,所述方法包括:获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;根据所述目标模板生成所述目标临床研究报告。由此可见,可以利用目标临床研究报告的初始模板和所述目标文本自动生成所述目标临床研究报告,无需人工撰写临床研究报告,提高了生成临床研究报告的效率。

Description

一种临床研究报告生成方法和装置
技术领域
本发明涉及领域临床医学领域,特别是涉及一种临床研究报告生成方法和装置。
背景技术
在临床医学领域,往往需要对一些疾病或者药物进行研究,以确定疾病的治疗方法和药物的疗效。临床研究一般以患者为研究对象,以医疗服务机构为主要研究基地,以多学科人员共同参与组织实施的科学研究活动。
在进行临床研究之前,参与临床研究的研究人员一般需要撰写临床研究方案(英文:protocol),以及统计分析计划(statistical analysis plan,SAP)。其中,临床研究方案主要包括:研究背景、研究目的、整体方案设计以及方案的具体执行等内容;统计分析计划主要包含研究的研究终点以及对这些研究终点具体的统计分析方法等内容。在进行临床研究的过程中,需要根据临床研究方案和统计分析计划对临床数据进行统计,获得临床研究的临床数据图表。
临床研究结束之后,研究人员需要结合临床研究方案、统计分析计划以及数据图表,撰写临床研究报告,在现有技术中,往往需要人工撰写临床研究报告,耗费人力,且效率低。
发明内容
本发明所要解决的技术问题是,提供一种临床研究报告生成方法和装置,能够自动生成临床研究报告。
本发明实施例提供一种临床研究报告生成方法,包括:
获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;
将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;
根据所述目标模板生成所述目标临床研究报告。
可选的,所述将所述预设标题与所述目标标题进行标题匹配,包括:
获取所述预设标题的预设关键词;获取所述目标标题的目标关键词;
判断所述预设关键词与所述目标关键词是否相同。
可选的,若所述预设标题与所述目标标题匹配成功,所述方法还包括:
判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,若否,将所述预设标题的次级标题复制到所述初始模板中,作为所述预设标题的次级标题,生成所述目标临床研究报告的中间模板;
相应的,所述生成目标模板,还包括:
将所述目标标题的次级标题对应的正文复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分。
可选的,所述方法还包括:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,将所述中间模板的标题称为第一标题,所述第一标题包括预设标题和所述预设标题的次级标题,所述生成目标模板,还包括:
将所述第一标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述中间模板中与所述第一标题对应的正文填写部分。
可选的,所述方法还包括:获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,在所述将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分之前,还包括:
将所述目标标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中,使得所述目标标题对应的正文包括所述表格数据;
相应的,在所述将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分之前,还包括:
将所述目标标题的次级标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中,使得所述目标标题的次级标题对应的正文包括所述表格数据。
可选的,所述生成目标模板,还包括:
利用预先训练得到的文字生成模型将所述表格数据生成与所述表格数据对应的文字内容;所述文字内容用于表征所述表格数据表达的含义;
将所述生成获得的与所述表格数据对应的文字内容添加到所述表格数据在所述中间模板中对应的正文填写部分。
可选的,所述预先训练得到的文字生成模型通过如下方式获得:
基于历史临床研究报告中的表格数据和与所述历史临床研究报告中的表格数据对应的文字内容进行训练,获得所述文字生成模型。
本发明实施例提供一种临床研究报告生成装置,包括:
获取单元,用于获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;
匹配单元,用于将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;
生成单元,用于根据所述目标模板生成所述目标临床研究报告。
可选的,所述将所述预设标题与所述目标标题进行标题匹配,包括:
获取所述预设标题的预设关键词;获取所述目标标题的目标关键词;
判断所述预设关键词与所述目标关键词是否相同。
可选的,若所述预设标题与所述目标标题匹配成功,所述装置还包括判断单元,用于:
判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,若否,将所述预设标题的次级标题复制到所述初始模板中,作为所述预设标题的次级标题,生成所述目标临床研究报告的中间模板;
相应的,所述匹配单元,还用于:
将所述目标标题的次级标题对应的正文复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分。
可选的,所述获取单元,还用于:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,将所述中间模板的标题称为第一标题,所述第一标题包括预设标题和所述预设标题的次级标题,所述匹配单元,还用于:
将所述第一标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述中间模板中与所述第一标题对应的正文填写部分。
可选的,所述获取单元,还用于:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,在所述将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分之前,所述匹配单元,还用于:
将所述目标标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中,使得所述目标标题对应的正文包括所述表格数据;
相应的,在所述将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分之前,所述匹配单元,还用于:
将所述目标标题的次级标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中,使得所述目标标题的次级标题对应的正文包括所述表格数据。
可选的,所述匹配单元,还用于:
利用预先训练得到的文字生成模型将所述表格数据生成与所述表格数据对应的文字内容;所述文字内容用于表征所述表格数据表达的含义;
将所述生成获得的与所述表格数据对应的文字内容添加到所述表格数据在所述中间模板中对应的正文填写部分。
可选的,所述预先训练得到的文字生成模型通过如下方式获得:
基于历史临床研究报告中的表格数据和与所述历史临床研究报告中的表格数据对应的文字内容进行训练,获得所述文字生成模型。
与现有技术相比,本发明实施例具有以下优点:
本发明实施例提供一种临床研究报告生成方法和装置,所述方法包括:获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;根据所述目标模板生成所述目标临床研究报告。由此可见,利用本发明实施例提供的方法和装置,可以利用目标临床研究报告的初始模板和所述目标文本自动生成所述目标临床研究报告,无需人工撰写临床研究报告,提高了生成临床研究报告的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种临床研究报告生成方法的流程示意图;
图2为本发明实施例提供的一种临床研究报告生成装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图,详细说明本发明的各种非限制性实施方式。
方法实施例
参见图1,该图为本发明实施例提供的一种临床研究报告生成方法的流程示意图。
在本发明实施例中,所述方法例如可以通过以下步骤S101-S103实现。
S101:获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分。
需要说明的是,在本发明实施例中,将待生成的临床研究报告称为目标临床研究报告。
需要说明的是,本发明实施例不具体限定所述目标文本,所述目标文本可以包括生成所述目标临床研究报告所需要的部分或全部文本。
作为一种示例,所述目标文本可以包括与所述目标临床研究报告相关的临床研究方案。其中,临床研究方案主要包括研究背景、研究目的、整体方案设计以及方案的具体执行等内容。
作为另一种示例,所述目标文本可以包括与所述目标临床研究报告相关的统计分析计划。其中,统计分析计划主要包含研究的研究终点以及对这些研究终点具体的统计分析方法等内容。
作为又一种示例,所述目标文本也可以既包括上文提及的临床研究方案,又包括上文提及的统计分析计划。
需要说明的是,本发明实施例中提及的目标标题,可以包括主标题,还可以包括主标题的次级标题。其中,主标题可以是1级标题,也可以是2级标题或者3级标题。例如,目标标题可以包括主标题:“1研究背景”;目标标题可以包括次级标题:“1.1近五年发展情况”。又如,目标标题可以包括主标题:“1.1近五年发展情况”;目标标题可以包括次级标题:“1.1.1国内近五年发展情况”。
需要说明的是,与所述目标标题类似,所述预设标题,可以包括主标题,还可以包括主标题的次级标题。具体描述可以参考以上对于目标标题的描述部分,此处不再赘述。
S102:将所述预设标题和所述目标标题进行匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板。
需要说明的是,所述预设标题和所述目标标题匹配成功,表明所述预设标题表达的含义与所述目标标题表达的含义相同。因此,可以将目标文本中目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,作为所述预设标题对应的正文。
需要说明的是,在具体实现将目标文本中目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分时,可以有多种实现方式,在一种可能的实现方式中,可以将所述目标标题对应的正文,全部复制到所述预设标题对应的正文填写部分。在另一种可能的实现方式中,可以将所述目标标题对应的正文,部分复制到所述预设标题对应的正文填写部分,例如,可以将所述目标标题对应的正文的第一预设数目个段落对应的内容复制到所述预设标题对应的正文填写部分,又如,可以将所述目标标题对应的正文的第二预设数目个句子对应的内容复制到所述预设标题对应的正文填写部分。其中,第一预设数目和第二预设数目为正整数,本实施例不具体限定所述第一预设数目和所述第二预设数目。
需要说明的是,若所述目标文本中包含的文本为英文文本,则在将目标文本中目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分之后,还可以对所述预设标题对应的正文填写部分填写的正文进行时态的转换,例如,将一般过去时转换为一般将来时,或者,将一般过去时转换为完成时。
S103:根据所述目标模板生成所述目标临床研究报告。
可以理解的是,目标临床研究报告可以包括标题和标题对应的正文。所述目标模板中包括预设标题和预设标题对应的正文,因此,可以根据所述目标模板生成所述目标临床研究报告。
由此可见,利用本发明实施例提供的临床研究报告生成方法,可以利用目标临床研究报告的初始模板和所述目标文本自动生成所述目标临床研究报告,无需人工撰写临床研究报告,从而提高了生成临床研究报告的效率。
在一种可能的实现方式中,步骤S102中“将所述预设标题与所述目标标题进行标题匹配”在具体实现时,可以通过如下步骤A1-B1实现。
A1:获取所述预设标题的预设关键词;获取所述目标标题的目标关键词。
B1:判断所述预设关键词与所述目标关键词是否相同。
可以理解的是,由于目标文本与目标临床研究报告的撰写标准可能不同。因此,预设标题和目标标题可能并不是完全相同。因此,在本发明实施例中,可以分别获取预设标题的预设关键词以及目标标题的目标关键词,将所述预设关键词和所述目标关键词进行比对,若所述预设关键词与所述目标关键词相同,则认为所述预设标题与所述目标标题匹配成功。
需要说明的是,在实际应用中,所述预设标题的预设关键词的数目与所述目标标题的目标关键词的数目可能不同。因此,在本发明实施例中,若所述预设标题的预设关键词中,有第一预设数目个预设关键词出现在所述目标标题的目标关键词中,则认为所述预设关键词与所述目标关键词相同,所述预设标题与所述目标标题匹配成功。
例如,可参见下表1进行理解。
表1
其中,预设标题“1INTRODUCTION”与目标标题“1INTRODUCTION AND STUDYRATIONALE”进行标题匹配时,预设标题“1INTRODUCTION”的预设关键词为“INTRODUCTION”,目标标题的目标关键词为“INTRODUCTION”、“STUDY”和“RATIONALE”。预设标题的预设关键词中有一个预设关键词“INTRODUCTION”出现在目标标题的目标关键词中,故预设标题“1INTRODUCTION”与目标标题“1INTRODUCTION AND STUDY RATIONALE”匹配成功。
同理,预设标题“2STUDY OBJECTIVES”与目标标题“1.3Objectives”匹配成功;预设标题“2.1Primary Objective”与目标标题“1.3.1Primary Objective”匹配成功;预设标题“2.2Secondary Objectives”与目标标题“2.2Secondary Objectives”匹配成功;预设标题“3INVESTIGATIONAL PLAN”与目标标题“3INVESTIGATIONAL PLAN”匹配成功。
需要说明的是,在实际应用中,所述初始模板中的预设标题一般只包括一级标题和二级标题,并不包括二级标题的次级标题。而目标文本中的标题等级划分比较细致,其可能包含所述预设标题中不包括的次级标题。因此,在本发明实施例中,还可以根据目标标题生成所述预设标题中不包含的次级标题。具体地,若所述预设标题与所述目标标题匹配成功,则所述方法还包括:
判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,若否,将所述预设标题的次级标题复制到所述初始模板中,作为所述预设标题的次级标题,生成所述目标临床研究报告的中级模板。
需要说明的是,判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,可以将所述目标标题的次级标题与所述预设标题的次级标题进行标题匹配,若匹配成功,则说明所述目标标题的次级标题存在于所述预设标题的次级标题中,若匹配不成功,则说明所述目标标题的次级标题不存在于所述预设标题的次级标题中。
具体地,可以结合上表1和下表2进行理解。
表2
由于预设标题“2STUDY OBJECTIVES”与目标标题“1.3Objectives”匹配成功,而目标标题“1.3Objectives”的次级标题“1.3.3Exploratory Objectives”不存在于所述预设标题“2STUDY OBJECTIVES”的次级标题中,因此,将所述目标标题“1.3Objectives”的次级标题“1.3.3Exploratory Objectives”复制到初始模板中,作为预设标题“2STUDYOBJECTIVES”的次级标题“2.3Exploratory Objectives”。
如上文所述,目标临床研究报告可以包括标题和标题对应的正文。因此,生成所述预设标题的次级标题之后,还可以进一步将所述预设标题的次级标题对应的正文填写到所述预设标题的次级标题对应的正文填写部分。
也就是说,所述生成目标模板,还包括:
将所述目标标题的次级标题对应的正文复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分。
需要说明的是,生成所述预设标题的次级标题之后,所述中间模板包括所述预设标题的次级标题和所述预设标题的次级标题对应的正文填写部分。
需要说明的是,一般来讲,目标临床研究报告中还可以包括表格数据。因此,在生成所述目标模板时,还可以将所述表格数据加入到所述中间模板中的对应的正文填写部分。在具体实现将所述表格数据加入到所述中间模板中的对应的正文填写部分时,可以包括多种实现方式。
在一种可能的实现方式中,生成所述中间模板之后,还可以获取临床数据图表,所述临床数据图表包括表格标题和表格数据。相应的,为方便描述,将所述中间模板的标题称为第一标题,所述第一标题包括预设标题和所述预设标题的次级标题,在生成所述目标模板时,还可以将所述第一标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述中间模板中与所述第一标题对应的正文填写部分。
需要说明的是,本发明实施例不具体限定所述临床数据图表,作为一种示例,所述临床数据图表可以是统计部分出具的与所述目标文本相关的数据图表。
需要说明的是,对于将所述第一标题和所述表格标题进行匹配的具体实现方式,与将所述预设标题和所述目标标题进行匹配的实现方式相同,具体描述部分可以参考上文中关于将所述预设标题和所述目标标题进行匹配的具体描述部分,此处不再赘述。
在另一种可能的实现方式中,生成所述中间模板之后,还可以获取临床数据图表,所述临床数据图表包括表格标题和表格数据。
相应的,在步骤S102中“将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分”之前,还可以将所述目标标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中,使得所述目标标题对应的正文包括所述表格数据。
可以理解的是,若所述目标标题和所述表格标题匹配成功,那么将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中之后,可以使得所述目标标题对应的正文包括所述表格数据。这样一来,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分时,就可以将所述表格数据复制到所述预设标题对应的正文填写部分。
相应的,在所述将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分之前,还可以将所述目标标题的次级标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中,使得所述目标标题的次级标题对应的正文包括所述表格数据。
可以理解的是,若所述目标标题的次级标题和所述表格标题匹配成功,那么将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中之后,可以使得所述目标标题的次级标题对应的正文包括所述表格数据。这样一来,将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分时,就可以将所述表格数据复制到所述预设标题的次级标题对应的正文填写部分。
需要说明的是,在实际应用中,在目标临床研究报告中包括表格数据时,为了增强目标临床研究报告的可读性,还可以为所述表格数据配备相应的文字描述,用于说明所述表格数据的含义。
因此,本发明实施例提供的临场研究报告生成方法,还可以包括如下步骤B1-B2。
B1:利用预先训练得到的文字生成模型将所述表格数据生成与所述表格数据对应的文字内容,所述文字内容用于表征所述表格数据表达的含义。
需要说明的是,本发明实施例不具体限定所述文字生成模型。在一种可能的实现方式中,所述文字生成模型时基于历史临床研究报告中的表格数据和与所述历史临床研究报告中的表格数据对应的文字内容进行训练,所获得的。
需要说明的是,所述历史临床研究报告是指,已经存在的临床研究报告。历史研究报告中包含有表格数据以及表格数据对应的文字内容。因此,可以利用所述历史临床研究报告进行训练,获得表格数据与表格数据对应的文字内容之间的映射关系,获得所述文字生成模型。从而可以使得该文字生成模型可以将表格数据转换成对应的文字内容。
可以理解的是,表格数据中可能包含多种参数,各个参数对应的临床研究意义不同,在进行所述文字生成模型的训练时,可以基于多个历史临床研究报告,确定出临床研究意义比较大的参数,将对该参数的描述排在对所述表格数据对应的文字内容的比较靠前的位置。这样一来,利用该文字生成模型生成所述表格数据对应的文字内容时,可以将临床研究意义比较大的参数对应的文字内容放在整个文字内容中比较靠前的位置。
B2:将所述生成获得的与所述表格数据对应的文字内容添加到所述表格数据在所述中间模板中对应的正文填写部分。
需要说明的是,步骤B2在具体实现时,可以有多种实现方式,具体采用哪种实现方式可以根据实际情况确认,本发明实施例不做具体限定。
在一种可能实现方式中,可以将所述文字内容添加到中间模板中所述表格数据的前面,以便读者首先查看表格数据所表达的含义,再查看具体的表格数据。
在另一种可能的实现方式中,可以将所述文字内容添加到中间模板中所述表格数据的后面,以便读者首先查看具体的表格数据,再查看表格数据所表达的含义。
装置实施例
参见图2,该图为本发明实施例提供的一种临床研究报告生成装置的结构示意图。
本发明实施例提供的临床研究报告生成装置200,例如可以具体包括:获取单元210,匹配单元220和生成单元230。
所述获取单元210,用于获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;
所述匹配单元220,用于将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;
所述生成单元230,用于根据所述目标模板生成所述目标临床研究报告。
可选的,所述将所述预设标题与所述目标标题进行标题匹配,包括:
获取所述预设标题的预设关键词;获取所述目标标题的目标关键词;
判断所述预设关键词与所述目标关键词是否相同。
可选的,若所述预设标题与所述目标标题匹配成功,所述装置200还包括判断单元,用于:
判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,若否,将所述预设标题的次级标题复制到所述初始模板中,作为所述预设标题的次级标题,生成所述目标临床研究报告的中间模板;
相应的,所述匹配单元220,还用于:
将所述目标标题的次级标题对应的正文复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分。
可选的,所述获取单元210,还用于:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,将所述中间模板的标题称为第一标题,所述第一标题包括预设标题和所述预设标题的次级标题,所述匹配单元220,还用于:
将所述第一标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述中间模板中与所述第一标题对应的正文填写部分。
可选的,所述获取单元210,还用于:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,在所述将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分之前,所述匹配单元220,还用于:
将所述目标标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中,使得所述目标标题对应的正文包括所述表格数据;
相应的,在所述将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分之前,所述匹配单元220,还用于:
将所述目标标题的次级标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中,使得所述目标标题的次级标题对应的正文包括所述表格数据。
可选的,所述匹配单元220,还用于:
利用预先训练得到的文字生成模型将所述表格数据生成与所述表格数据对应的文字内容;所述文字内容用于表征所述表格数据表达的含义;
将所述生成获得的与所述表格数据对应的文字内容添加到所述表格数据在所述中间模板中对应的正文填写部分。
可选的,所述预先训练得到的文字生成模型通过如下方式获得:
基于历史临床研究报告中的表格数据和与所述历史临床研究报告中的表格数据对应的文字内容进行训练,获得所述文字生成模型。
需要说明的是,由于所述临床研究报告生成装置200是与以上方法实施例提供的方法对应的装置,因此,关于所述装置200的各个单元的具体实现,可以参考方法实施例中相关内容的描述,在此不再赘述。
由此可见,利用本发明实施例提供的临床研究报告生成装置,可以利用目标临床研究报告的初始模板和所述目标文本自动生成所述目标临床研究报告,无需人工撰写临床研究报告,从而提高了生成临床研究报告的效率。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种临床研究报告生成方法,其特征在于,包括:
获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;
将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;
根据所述目标模板生成所述目标临床研究报告。
2.根据权利要求1所述的方法,其特征在于,所述将所述预设标题与所述目标标题进行标题匹配,包括:
获取所述预设标题的预设关键词;获取所述目标标题的目标关键词;
判断所述预设关键词与所述目标关键词是否相同。
3.根据权利要求1所述的方法,其特征在于,若所述预设标题与所述目标标题匹配成功,所述方法还包括:
判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,若否,将所述预设标题的次级标题复制到所述初始模板中,作为所述预设标题的次级标题,生成所述目标临床研究报告的中间模板;
相应的,所述生成目标模板,还包括:
将所述目标标题的次级标题对应的正文复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,将所述中间模板的标题称为第一标题,所述第一标题包括预设标题和所述预设标题的次级标题,所述生成目标模板,还包括:
将所述第一标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述中间模板中与所述第一标题对应的正文填写部分。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,在所述将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分之前,还包括:
将所述目标标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中,使得所述目标标题对应的正文包括所述表格数据;
相应的,在所述将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分之前,还包括:
将所述目标标题的次级标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中,使得所述目标标题的次级标题对应的正文包括所述表格数据。
6.根据权利要求4或5所述的方法,其特征在于,所述生成目标模板,还包括:
利用预先训练得到的文字生成模型将所述表格数据生成与所述表格数据对应的文字内容;所述文字内容用于表征所述表格数据表达的含义;
将所述生成获得的与所述表格数据对应的文字内容添加到所述表格数据在所述中间模板中对应的正文填写部分。
7.根据权利要求6所述的方法,其特征在于,所述预先训练得到的文字生成模型通过如下方式获得:
基于历史临床研究报告中的表格数据和与所述历史临床研究报告中的表格数据对应的文字内容进行训练,获得所述文字生成模型。
8.一种临床研究报告生成装置,其特征在于,包括:
获取单元,用于获取目标文本和目标临床研究报告的初始模板;所述目标文本包括目标标题和与所述目标标题对应的正文;所述初始模板包括预设标题和与所述预设标题对应的正文填写部分;
匹配单元,用于将所述预设标题与所述目标标题进行标题匹配,若匹配成功,将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分,生成所述目标临床研究报告的目标模板;
生成单元,用于根据所述目标模板生成所述目标临床研究报告。
9.根据权利要求8所述的装置,其特征在于,若所述预设标题与所述目标标题匹配成功,所述装置还包括:
判断单元,用于判断所述目标标题的次级标题是否存在于所述预设标题的次级标题中,若否,将所述预设标题的次级标题复制到所述初始模板中,作为所述预设标题的次级标题,生成所述目标临床研究报告的中间模板;
相应的,所述匹配单元,还用于:
将所述目标标题的次级标题对应的正文复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分。
10.根据权利要求9所述的装置,其特征在于,所述获取单元,还用于:
获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,将所述中间模板的标题称为第一标题,所述第一标题包括预设标题和所述预设标题的次级标题,所述匹配单元,还用于:
将所述第一标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述中间模板中与所述第一标题对应的正文填写部分。
11.根据权利要求9所述的装置,其特征在于,所述获取单元还用于:获取临床数据图表,所述临床数据图表包括表格标题和表格数据;
相应的,在所述将所述匹配成功的目标标题对应的正文复制到所述初始模板中与所述预设标题对应的正文填写部分之前,所述匹配单元,还用于:
将所述目标标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题对应的正文中,使得所述目标标题对应的正文包括所述表格数据;
相应的,在所述将所述目标标题的次级标题对应的正文部分复制到所述中间模板中与所述预设标题的次级标题对应的正文填写部分之前,所述匹配单元,还用于:
将所述目标标题的次级标题和所述表格标题进行匹配,若匹配成功,将所述匹配成功的表格标题对应的表格数据复制到所述目标文本中与所述目标标题的次级标题对应的正文中,使得所述目标标题的次级标题对应的正文包括所述表格数据。
12.根据权利要求10或11所述的装置,其特征在于,所述匹配单元,还用于:
利用预先训练得到的文字生成模型将所述表格数据生成与所述表格数据对应的文字内容;所述文字内容用于表征所述表格数据表达的含义;
将所述生成获得的与所述表格数据对应的文字内容添加到所述表格数据在所述中间模板中对应的正文填写部分。
CN201810354981.8A 2018-04-19 2018-04-19 一种临床研究报告生成方法和装置 Pending CN108564997A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810354981.8A CN108564997A (zh) 2018-04-19 2018-04-19 一种临床研究报告生成方法和装置
US16/201,110 US20190326001A1 (en) 2018-04-19 2018-11-27 Method and Device for Generating Clinical Research Report

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810354981.8A CN108564997A (zh) 2018-04-19 2018-04-19 一种临床研究报告生成方法和装置

Publications (1)

Publication Number Publication Date
CN108564997A true CN108564997A (zh) 2018-09-21

Family

ID=63536038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810354981.8A Pending CN108564997A (zh) 2018-04-19 2018-04-19 一种临床研究报告生成方法和装置

Country Status (2)

Country Link
US (1) US20190326001A1 (zh)
CN (1) CN108564997A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147541A (zh) * 2019-05-23 2019-08-20 北京神州泰岳软件股份有限公司 一种经济报告的生成方法及装置
CN113076722A (zh) * 2021-03-10 2021-07-06 北京明略软件系统有限公司 报告生成方法、装置、计算机设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094498A (zh) * 2021-04-27 2021-07-09 中国美术学院 一种产品外观设计调研报告的生成方法和系统
CN113297345B (zh) * 2021-05-21 2021-12-03 深圳市智尊宝数据开发有限公司 分析报告生成方法、电子设备及相关产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023794A (ja) * 2004-07-06 2006-01-26 Ricoh Co Ltd 文書管理システム、文書管理方法、プログラムおよび記録媒体
CN103927296A (zh) * 2014-03-06 2014-07-16 广东电网公司电网规划研究中心 输变电工程word文档段落内容中工程特性指标的智能提取方法
CN104252444A (zh) * 2013-06-27 2014-12-31 腾讯科技(北京)有限公司 一种杂志应用的排版方法、模块和系统
CN105677622A (zh) * 2016-03-11 2016-06-15 郑州师范学院 大数据分析报告自动生成系统
CN106610919A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 Word报告的生成方法及装置
CN106886509A (zh) * 2017-03-06 2017-06-23 大连理工大学 一种学位论文格式自动检测方法
CN107193792A (zh) * 2017-05-18 2017-09-22 北京百度网讯科技有限公司 基于人工智能的生成文章的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060212452A1 (en) * 2005-03-18 2006-09-21 Cornacchia Louis G Iii System and method for remotely inputting and retrieving records and generating reports
CA2853627C (en) * 2011-10-25 2021-03-30 Clingenuity, Llc Automatic creation of clinical study reports

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023794A (ja) * 2004-07-06 2006-01-26 Ricoh Co Ltd 文書管理システム、文書管理方法、プログラムおよび記録媒体
CN104252444A (zh) * 2013-06-27 2014-12-31 腾讯科技(北京)有限公司 一种杂志应用的排版方法、模块和系统
CN103927296A (zh) * 2014-03-06 2014-07-16 广东电网公司电网规划研究中心 输变电工程word文档段落内容中工程特性指标的智能提取方法
CN106610919A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 Word报告的生成方法及装置
CN105677622A (zh) * 2016-03-11 2016-06-15 郑州师范学院 大数据分析报告自动生成系统
CN106886509A (zh) * 2017-03-06 2017-06-23 大连理工大学 一种学位论文格式自动检测方法
CN107193792A (zh) * 2017-05-18 2017-09-22 北京百度网讯科技有限公司 基于人工智能的生成文章的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘力: "科技文档信息抽取与格式化技术研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
潘若瑛: "多模板多格式论文综合校排系统的研究和实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147541A (zh) * 2019-05-23 2019-08-20 北京神州泰岳软件股份有限公司 一种经济报告的生成方法及装置
CN110147541B (zh) * 2019-05-23 2023-08-25 鼎富智能科技有限公司 一种经济报告的生成方法及装置
CN113076722A (zh) * 2021-03-10 2021-07-06 北京明略软件系统有限公司 报告生成方法、装置、计算机设备及存储介质
CN113076722B (zh) * 2021-03-10 2024-08-23 北京明略软件系统有限公司 报告生成方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
US20190326001A1 (en) 2019-10-24

Similar Documents

Publication Publication Date Title
CN108564997A (zh) 一种临床研究报告生成方法和装置
Güldemann Historical linguistics and genealogical language classification in Africa
McFarland Cervical cancer and Pap smear screening in Botswana: knowledge and perceptions
Kermani et al. psychometrics features of the Snyder Hope Scale
McNeil et al. Learning to account for the social determinants of health affecting homeless persons
Aringazina et al. Public health challenges and priorities for Kazakhstan
Fuchs Oxford Handbook of Auditory Science: The Ear
Campbell et al. Evaluating ChatGPT responses on thyroid nodules for patient education
Mugassa et al. Factors influencing the uptake of cervical cancer screening services in Tanzania: A health system perspective from national and district levels
Guan et al. Psychiatrists in Malaysia: the ratio and distribution
Wagner et al. The overview of the CLER program: CLER national report of findings 2016
Boyle et al. Clinical audit does not work, is quality improvement any better?
Schlaeger et al. Sensory pain characteristics of vulvodynia and their association with nociceptive and neuropathic pain: an online survey pilot study
Reverby “Special treatment”: BiDil, Tuskegee, and the logic of race
Hsu et al. Haptic and force feedback technology in dental education: a bibliometric analysis
Virro et al. Long-lasting, patient-controlled, procedure-free contraception: A review of Annovera with a pharmacist perspective
Kim et al. Evaluation of quality of life using a tablet PC-based survey in cancer patients treated with radiotherapy: a multi-institutional prospective randomized crossover comparison of paper and tablet PC-based questionnaires (KROG 12–01)
Morrison et al. Resident research projects: frequency of presentation and publication in a national forum
Samsi et al. Regulating physician associates (PAs) and anaesthesia associates (AAs): a rapid review
Harding et al. Measuring and improving palliative care in South Africa: multiprofessional clinical perspectives on development and application of appropriate outcome tools
Ferris et al. Colposcopy quality control for clinical trials: the positive effects from brief, intensive educational intervention
La Rosa et al. Funding community collaboration to develop effective therapies for neurofibromatosis type 1 tumors
Vahabzadeh Digital Psychiatry: Augmenting the Future of Mental Health Practice.
McGrath Development of the Healthy Addiction Treatment recovery model for nursing in addiction services.
Tuama et al. Evaluation of nurses’ knowledge toward breast self-examination at alhussien teaching hospital in thi-qar governorate

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180921