CN110765274A

CN110765274A - 语音输入甲状腺超声异常描述自动生成超声报告的方法

Info

Publication number: CN110765274A
Application number: CN201910957032.3A
Authority: CN
Inventors: 王梅; 董屹婕; 刘礼好; 陈德华; 潘乔; 李继云
Original assignee: Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd; Donghua University
Current assignee: Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd; Donghua University
Priority date: 2019-10-10
Filing date: 2019-10-10
Publication date: 2020-02-07
Anticipated expiration: 2039-10-10
Also published as: CN110765274B

Abstract

本发明提供了一种语音输入B超异常关键字生成甲状腺超声报告的方法。包括以下步骤：定义甲状腺超声语义树；根据甲状腺超声语义树生成子结构；B超异常关键字语音输入；定位描述范围；定位腺体背景描述部位并进行属性定位；定位局灶性病变描述结节并进行属性定位；补充必要属性；补充默认信息；生成文本。本发明使得B超医生在进行超声影像诊断的同时语音输入B超异常描述，无需额外医生手工录入超声文本报告，大大节约人力。在医生语音输入结束后可自动填充未提及属性的正常属性值，避免医生语音描述大量默认冗余信息，在尽可能少的语音输入情况下确保报告的完整性。最后，基于生成的样本树生成文本，解决报告歧义问题。

Description

语音输入甲状腺超声异常描述自动生成超声报告的方法

技术领域

本发明涉及一种语音输入甲状腺超声异常描述自动生成甲状腺超声报告的方法。

背景技术

B超等医学影像诊断是当前临床诊断的主要信息依据，提供准确、清晰、及时的影像诊断报告是对B超诊断的重要要求。而B超医生在诊断过程中，注意力需集中在对影像的观察、分析等方面,难以实时进行诊断报告的录入和输出。因此，现行B超检查模式一般需要两名操作者，一名进行影像观察，一名经过培训的文字输入者进行报告录入。此过程对本就紧缺的医院人力资源造成巨大浪费。另一方面，手工输入的方式不但影响报告生成的效率，同时易造成漏输、错输、歧义等问题的发生。

当前，语音识别技术日益成熟,将语音识别技术应用于B超诊断报告的录入过程，将大大减少报告生成和整个诊断的时间。现有基于语音识别的诊断报告生成主要包括按模板进行输入以及整个报告完整语音录入两种方式。很显然，按模板进行输入时模板如何产生将成为重要问题，此外该方式虽保证了超声报告的正确性，但欠缺对个体影像表现处理的灵活性。若对整个报告完整语音录入可解决该问题，但医生需语音描述大量默认或常规表现，对B超医生的临床工作带来不必要的负担。

发明内容

本发明的目的是：甲状腺B超医生进行B超诊断的同时，语音输入尽可能少的B超结果描述，自动生成语义完整、清晰的甲状腺超声报告。

为了达到上述目的，本发明的技术方案是提供了一种语音输入甲状腺超声异常描述自动生成超声报告的方法，其特征在于，包括以下步骤：

步骤1、将甲状腺超声文本组织为层次结构，甲状腺超声文本中的整个超声描述分为甲状腺、甲状旁腺区、颈部淋巴结，分别对应甲状腺、甲状旁腺区、颈部淋巴结样本子树；定义甲状腺超声语义树，甲状腺分支语义树包括范围层、属性名层及属性值层；

步骤2、根据甲状腺超声语义树，结合甲状腺实际超声报告，统计在异常及正常情况下，不同描述范围中各属性名及属性值出现的概率，获得甲状腺超声正常属性集合、必要属性集合及补充属性集合；

步骤3、B超异常描述语音输入，包括以下步骤：

步骤301、医生语音输入甲状腺部位及属性值，利用语音识别软件将语音转为字符型输入内容；

步骤302、对上一步得到的输入内容进行预处理，根据标点对输入内容进行划分；

步骤4、定位描述范围：

按照甲状腺超声语义树结构的树结构分支，将输入内容定位到具体描述范围，并为当前超声描述建立相应的样本树结点，包括以下步骤：

步骤401、判断输入内容为术前还是术后，依据判断结果将当前的超声文本标记为术后，并新增甲状腺超声术后结点，或新增甲状腺超声术前结点；

步骤402、取第一个还未被处理的子句，判断当前子句为腺体背景还是焗灶性病变，依据判断结果新增局灶性病变结点或新增腺体背景节点；若新增局灶性病变结点，则转到步骤6；在新增腺体背景节点时，先定位当前的甲状腺超声语义树中是否有腺体背景结点，若定位到腺体背景结点，则转至步骤5，若无腺体背景节点，则新增腺体背景节点后，转至步骤5；

步骤5、定位腺体背景描述部位并进行属性定位，包括以下步骤：

步骤501、定位腺体背景部位，腺体背景由右叶、左叶与峡部组成，包括以下步骤：

步骤5011、判断当前子句是否有部位说明：若包含关键字“右叶”、“左叶”、“峡部”或“左右叶”，则继续判断甲状腺超声语义树是否已有相应部位节点，若无节点，则新增相应部位的节点后转至步骤502，若相应部位的节点定位成功，则转至步骤502；

步骤5012、判断当前子句是否为对整个腺体背景进行说明：若包含关键字“双侧”，则继续判断甲状腺超声语义树是否已有右叶、左叶、峡部三个节点，若无节点，则新增三个部位节点，若三个部位节点定位成功，则转至步骤502；

步骤5013、判断当前子句是否为对残余甲状腺的说明：若包含关键字“残余”，则遍历之前已有的部位节点，筛选出未被标记为“已切除”的部位节点。若部位节点定位成功，则转至步骤502；

步骤5014、判断是否符合默认规则描述格式，若符合，则根据默认规则描述格式定位部位节点，若部位节点定位成功，则转至步骤502，具体格式如下：

(1)当无具体定位说明，且输入内容为数字时，默认部位输入顺序为：右叶->左叶->峡部；从右叶开始，若当前部位无节点或无大小/厚度属性节点，则该部位为定位部位，否则，继续判断下一部位；

(2)当无具体定位说明，输入内容非数字，且右叶、左叶、峡部的节点都没有时，默认为对整个腺体背景进行说明，新增右叶、左叶、峡部节点；若有右叶、左叶、峡部中一个及以上部位节点时，则根据上一阶段判断结果定位部位节点作为当前定位部位节点；

步骤5015、若未定位到部位节点，则与医生进行交互：给出选项“右叶”、“左叶”、“峡部”、“残余甲状腺内”、“共同属性”、“局灶性病变”供医生选择；

步骤502、属性定位：查找输入属性值所属属性，并在步骤501中定位到的部位节点后新增属性名-属性值节点，包括以下步骤：

步骤5021、判断当前子句是否包含关键字“已切除”，若包含，则将定位部位节点标记为“已切除”，转至步骤5024；

步骤5022、判断当前子句是否包含数字，若包含，则继续判断当前关键字与定位部位大小属性值格式是否匹配，若匹配则新建属性名及属性值节点，并将输入数值填入新增属性值节点中，转至步骤5024；

步骤5023、建立腺体背景属性值映射表，将语音输入的关键字映射至相应属性，从而根据该腺体背景属性值映射表进行属性定位，若当前子句已定位到属性，则新增定位属性节点，并填入识别属性值；否则与医生进行交互，请医生说明定位属性名后再进行属性定位；

步骤5024、判断是否退出腺体背景属性定位：若不符合退出条件，则取下一子句开始新一轮的属性定位，即重新开始步骤502；若符合，取下一子句并退出腺体背景属性定位，退出条件如下：

步骤50241、若无下一子句，则退出腺体背景属性定位，转至步骤7；

步骤50242、若下一子句包含关键字“右叶”、“左叶”、“峡部”、“左右叶”、“双侧”或“残余”，则退出腺体背景属性定位，转步骤402开始下一描述范围的定位；

步骤6、定位局灶性病变描述结节并进行属性定位，包括以下步骤：

步骤601、定位局灶性病变结节\非结节，焗灶性病变由一个或多个结节\非结节组成，包括以下步骤：

步骤6011、判断是否为双侧甲状腺结节共同属性：若包含关键字“双侧”+“回声”或“囊/实性”+“结节”，但不包含关键字“左/右侧”，则新增双侧结节节点后转至步骤602；

步骤6012：判断是否有结节定位说明：若包含关键字“左侧”、“右侧”、“峡部”或“结节”，则匹配关键字与已有结节节点关键字，若匹配成功，则关键字匹配成功的结节节点为定位结节节点转至步骤602，否则，新增一个结节节点，转至步骤602；

步骤602、属性定位：查找输入属性值所属属性，并在步骤601中定位到的结节节点后新增属性名-属性值节点，包括以下步骤：

步骤6021、建立局灶性病变属性值映射表，如若语音输入包括“回声、实性、囊性”，则映射至“内部回声”属性，从而根据该表进行属性定位，若当前子句已定位到属性，则新增定位属性节点，并填入识别属性值；否则与医生进行交互，请医生说明定位属性名后再进行属性定位；

步骤6022、判断是否退出局灶性病变属性定位：若不符合退出条件，则取下一子句开始新一轮的属性定位，即重新开始步骤602；若符合，取下一子句并退出当前结节节点属性定位，包括以下步骤：

步骤60221、若无下一子句，则退出局灶性病变属性定位，转至步骤7；

步骤60222、若下一子句有部位定位，即包含关键字“右侧/叶”、“左侧/叶”、“峡部”、“上极”或“下极”，则退出局灶性病变属性定位，转至步骤601开始下一结节的部位定位；

步骤7、检查必要属性：若当前样本树中缺少必要属性集合中某属性，则在相应分支中新增缺少的属性名节点，若超声报告输入未结束，则转至步骤3；

步骤8、补充默认信息：将已生成的树结构与正常属性集合进行对比，若分支节点中缺少正常属性集合中某属性，则在分支节点中新增缺少属性名-正常属性值节点；

步骤9：生成甲状腺样本子树，先序遍历已生成的样本子树，将树中内容依次输出，生成超声文本；按照相似的方法生成甲状旁腺区、颈部淋巴结对应子树及文本；整合各部位生成文本生成实际完整报告。

优选地，步骤302中，医生语音输入B超检查过程中出现异常的描述，进而对输入内容处理。

优选地，步骤401中，若当前的超声文本的包含关键字“术后”、“切除”、“残余”，则将当前的超声文本标记为术后，新增甲状腺超声术后结点；否则，新增甲状腺超声术前结点。

优选地，步骤402中，判断当前子句为腺体背景还是焗灶性病变的判断依据为：若当前子句包含关键字“双/左/右侧”+“回声”、“囊/实性”+“结节”，则当前子句为焗灶性病变，否则当前子句为腺体背景。

优选地，步骤7和步骤8中，可新增缺少的属性及属性描述，自动填充报告。

本发明针对甲状腺B超影像诊断，定义甲状腺超声语义结构树，医生仅需语音输入异常描述关键字，可自行填充语义结构并补充默认信息，最后将树结构转化为自然语言文本，从而可实时生成语义完整、清晰的B超检查报告，大大节约人力成本，并且提高工作效率。

附图说明

图1为甲状腺样本子树及文本生成流程图；

图2为甲状腺超声语义树结构图；

图3为样例结构图1；

图4为样例结构图2；

图5为样例结构图3；

图6为样例结构图4；

图7为样例结构图5；

图8为样例结构图6；

图9为样例结构图7；

图10为样例结构图8；

图11为界面示意图；

图12为样例结构图9；

图13为甲状腺超声文本。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

在本发明提供的一种语音输入甲状腺超声异常描述自动生成超声报告的方法中，对于给定患者，B超医生在B超过程中，语音给出超声异常描述，基于甲状腺超声语义树填充和扩展生成该患者对应的甲状腺、甲状旁腺区、颈部淋巴结样本子树，基于每个样本子树生成文本，最后整合文本生成实际报告。因此，采用本发明提供的方法后，医生仅需输入尽可能少的B超异常结果描述，根据语义树的结构自动对语音识别的结果进行填充和扩展，最后基于树结构自动生成甲状腺超声文本，在尽可能少的语音输入下获得语义完整且清晰的超声文本报告，如图1所示，具体而言包括以下步骤：

步骤1：定义甲状腺超声语义树。对2万余份甲状腺超声文本结构及内容进行统计分析以及甲状腺超声专家专业意见，将超声文本组织为层次结构。整个超声描述可分为甲状腺、甲状旁腺区、颈部淋巴结。甲状腺分支语义树结构如图2所示，前4层为描述范围层，第5层为属性名层，第6层为属性值层。对于给定患者，B超医生在B超过程中，语音给出超声异常描述，基于甲状腺超声语义树填充和扩展生成该患者对应的甲状腺、甲状旁腺区、颈部淋巴结样本子树，基于每个样本子树生成文本，最后整合文本生成实际报告。

步骤2：根据甲状腺超声语义树，结合甲状腺实际超声报告，统计在异常及正常情况下，不同描述范围如腺体背景、局灶性病变中各属性名及属性值出现的概率，获得甲状腺超声正常属性集合、必要属性集合及补充属性集合。

步骤3：B超异常描述语音输入。

步骤3.1：医生语音输入甲状腺部位及属性值，利用语音识别软件将语音转为字符。语音输入样例：右叶，7，6，左叶，7，7，峡部已切除。残余甲状腺不均匀，呈网络样改变。双侧可见几个混合性回声,左侧之一约26.5×15.6，右侧之一约13.0×7.2，椭圆形欠均匀尚清，左侧结节可见较丰血流信号。

步骤3.2：对输入内容进行预处理，将识别错误关键字进行纠正，标点未隔开的属性值用标点隔开，最后根据标点[，。；,；]对输入内容进行划分，存入数组。预处理后得到字符数组：A＝{右叶,7,6,左叶,7,7,峡部已切除,残余甲状腺不均匀,呈网络样改变,双侧可见几个混合性回声,左侧之一约26.5×15.6,右侧之一约13.0×7.2,椭圆形,欠均匀,尚清,左侧结节可见较丰血流信号}

步骤4：定位描述范围。按照语义树结构的树结构分支，将输入内容定位到具体描述范围，并为当前超声描述建立相应的样本树结点。

步骤4.1：判断输入内容为术前还是术后。若包含关键字“术后”、“切除”、“残余”，则将此条超声文本标记为术后，新增甲状腺超声术后结点；否则，新增甲状腺超声术前结点。当前字符数组中出现关键字“切除”，故新增术后节点，结构图如图3所示。

步骤4.2：取第一个还未被处理的子句，判断该子句为腺体背景还是焗灶性病变。若包含关键字“双/左/右侧”+“回声”、“囊/实性”+“结节”，则新增局灶性病变结点，转至步骤6；否则，定位到腺体背景结点，转至步骤5。若树中无腺体背景节点，则新增腺体背景节点后，转至步骤5。当前第一个还未被处理的子句为A[0]＝”右叶”，未出现关键字“双/左/右侧”+“回声”、“囊/实性”+“结节”，故新增腺体背景节点，进入步骤5，结构图如图4所示。

步骤5：定位腺体背景描述部位并进行属性定位。

步骤5.1：定位腺体背景部位。腺体背景由右叶、左叶与峡部组成。当前第一个还未被处理的子句为A[0]＝”右叶”。

步骤5.1.1：判断该子句是否有部位说明。若包含关键字“右叶”、“左叶”、“峡部”或“左右叶”，则继续判断样本树是否已有相应部位结点。若无节点，则新增该部位节点。若部位结点定位成功，则转至步骤5.2。当前子句包含关键字“右叶”，新增右叶节点，右叶节点为定位部位节点。结构图如图5所示。

步骤5.1.2：判断该子句是否为对整个腺体背景进行说明。若包含关键字“双侧”，则继续判断是否已有右叶、左叶、峡部三个节点。若无节点，则新增三个部位节点。若部位结点定位成功，则转至步骤5.2。

步骤5.1.3：判断该子句是否为对残余甲状腺(术后)的说明。若包含关键字“残余”，则遍历之前已有的部位节点，筛选出未被标记为“已切除”的部位节点。若部位结点定位成功，则转至步骤5.2。

步骤5.1.4：判断是否符合默认规则描述格式。若符合，则根据默认规则描述格式定位部位节点。若部位结点定位成功，则转至步骤5.2。具体格式如下：

(1)当无具体定位说明，且输入内容为数字时，默认部位输入顺序为：右叶->左叶->峡部。从右叶开始，若当前部位无节点或无大小(厚度)属性节点，则该部位为定位部位，否则，继续判断下一部位。

(2)当无具体定位说明，输入内容非数字，且三个部位节点都没有时，默认为对整个腺体背景进行说明，新增右叶、左叶、峡部节点。若有一个及以上部位节点时，则根据上一阶段判断结果定位部位节点作为当前定位部位节点。

步骤5.1.5：若未定位到部位节点，则与医生进行交互。给出选项“右叶”、“左叶”、“峡部”、“残余甲状腺内”、“共同属性”、“局灶性病变”供医生选择。

步骤5.2：属性定位。查找输入属性值所属属性，并在步骤5.1中定位到的部位节点后新增属性名-属性值节点。当前第一个还未被处理的子句为A[1]＝”7”。

步骤5.2.1：判断该子句是否包含关键字“已切除”。若包含，则将定位部位节点标记为“已切除”，转至步骤5.2.4。当前子句无关键字“已切除”。

步骤5.2.2：判断是否包含数字，若包含，则继续判断当前关键字与定位部位大小属性值格式是否匹配。若匹配则新建属性名及属性值节点，并将输入数值填入新增属性值节点中，转至步骤5.2.4。当前子句包含数字。右叶节点无前后径属性节点，新增前后径属性节点，将“7mm”填入前后径节点属性值。结构图如图6所示。

步骤5.2.3：根据腺体背景属性值映射表进行属性定位，若当前子句已定位到属性，则新增定位属性节点，并填入识别属性值。

步骤5.2.4：判断是否退出腺体背景属性定位。若不符合退出条件，则取下一子句开始新一轮的属性定位，即重新开始步骤5.2；若符合，则退出腺体背景属性定位。退出条件如下：

步骤5.2.4.1：若无下一子句，则退出腺体背景属性定位，转为步骤7。

步骤5.2.4.2：若下一子句包含关键字“右叶”、“左叶”、“峡部”、“左右叶”、“双侧”或“残余”，则退出腺体背景属性定位。转步骤4.2开始下一描述范围的定位。下一子句为A[2]＝”6”，不符合退出条件，重新开始步骤5.2。A[2:8]＝{6,左叶,7,7,峡部已切除,残余甲状腺不均匀,呈网络样改变}均为腺体背景内容，同A[1]处理过程一样，处理后的结构图如图7所示。

下一子句为A[9]＝”双侧可见几个混合性回声”，有部位定位——“双侧”，退出腺体背景属性定位，进入步骤4.2，新增局灶性病变结节，进入步骤6。

步骤6：定位局灶性病变描述结节并进行属性定位。

步骤6.1：定位局灶性病变结节\非结节。焗灶性病变由一个或多个结节\非结节组成。当前第一个还未被处理的子句为A[9]＝”双侧可见几个混合性回声”。

步骤6.1.1：判断是否为双侧甲状腺结节共同属性。若包含关键字“双侧”+“回声”或“囊/实性”+“结节”，但不包含关键字“左/右侧”，则新增双侧结节节点。若结节节点定位成功，则转为步骤6.2。当前子句有关键字“双侧”+“回声”，新增双侧结节节点，双侧结节节点为定位结节节点。结构图如图8所示。

步骤6.1.2：判断是否有结节定位说明。若包含关键字“左侧”、“右侧”、“峡部”或“结节”，则匹配关键字与已有结节节点关键字(部位、内部回声等属性值)。若匹配成功，则关键字匹配成功的结节节点为定位结节节点。否则，新增一个结节节点，转至步骤6.2。

步骤6.2：属性定位。查找输入属性值所属属性，并在步骤6.1中定位到的结节节点后新增属性名-属性值节点。当前第一个还未被处理的子句为A[9]＝“双侧可见几个混合性回声”。

步骤6.2.1：根据局灶性病变属性值映射表进行属性定位，若当前子句已定位到属性，则新增定位属性节点，并填入识别属性值。否则与医生进行交互，请医生说明定位属性名后再进行属性定位。当前子句“双侧可见几个混合性回声”根据属性值映射表匹配到“个”、“回声”，即定位属性名分别为结节数量、多发结节类型，属性值分别为几个、混合性回声，新增结节数量节点及几个属性值节点，多发结节类型节点及混合性回声属性值节点。结构图如图9所示。

步骤6.2.2：判断是否退出局灶性病变属性定位。若不符合退出条件，则取下一子句开始新一轮的属性定位，即重新开始步骤6.2；若符合，则退出当前结节节点属性定位。退出条件如下：

步骤6.2.2.1：若无下一子句，则退出局灶性病变属性定位，转至步骤7。

步骤6.2.2.2：若下一子句有部位定位，即包含关键字“右侧/叶”、“左侧/叶”、“峡部”、“上极”或“下极”，则退出局灶性病变属性定位，转至步骤6.1开始下一结节的部位定位。下一子句为A[10]＝“左侧之一约26.5×15.6”，有部位定位——“左侧”，退出局灶性病变属性定位，转至步骤6.1。

A[10:15]＝{左侧之一约26.5×15.6,右侧之一约13.0×7.2,椭圆形,欠均匀,尚清,左侧结节可见较丰血流信号}均为局灶性病变内容，同A[9]处理过程一样，处理后的结构图如图10所示。处理完毕后已无下一子句，退出焗灶性病变属性定位。

步骤7：检查必要属性，若当前样本树中缺少必要属性集合中某属性，则在相应分支中新增缺少的属性名节点。若超声报告输入未结束，则转为步骤3。已生成的树中包含所有必要属性，界面显示如图11所示。

步骤8：补充默认信息，将已生成的树结构与正常属性集合进行对比，若分支节点中缺少正常属性集合中某属性，则在分支节点中新增缺少属性名-正常属性值节点。补充完默认信息后，样例树结构如图12所示。

步骤9：生成甲状腺样本子树，先序遍历已生成的样本子树，将树中内容依次输出，生成超声文本。按照相似的方法生成甲状旁腺区、颈部淋巴结对应子树及文本。整合各部位生成文本生成实际完整报告。生成的甲状腺部分超声文本如图13所示。

Claims

1.一种语音输入甲状腺超声异常描述自动生成超声报告的方法，其特征在于，包括以下步骤：

步骤3、B超异常描述语音输入，包括以下步骤：

步骤301、医生语音输入B超检查过程中出现异常的甲状腺部位及属性值，利用语音识别软件将语音转为字符型输入内容；

步骤4、定位描述范围：

2.如权利要求1所述的一种语音输入甲状腺超声异常描述自动生成超声报告的方法，其特征在于，步骤302中，医生语音输入B超检查过程中出现异常的描述，进而对输入内容处理。

3.如权利要求1所述的一种语音输入甲状腺超声异常描述自动生成超声报告的方法，其特征在于，步骤401中，若当前的超声文本的包含关键字“术后”、“切除”、“残余”，则将当前的超声文本标记为术后，新增甲状腺超声术后结点；否则，新增甲状腺超声术前结点。

4.如权利要求1所述的一种语音输入甲状腺超声异常描述自动生成超声报告的方法，其特征在于，步骤402中，判断当前子句为腺体背景还是焗灶性病变的判断依据为：若当前子句包含关键字“双/左/右侧”+“回声”、“囊/实性”+“结节”，则当前子句为焗灶性病变，否则当前子句为腺体背景。

5.如权利要求1所述的一种语音输入甲状腺超声异常描述自动生成超声报告的方法，其特征在于，步骤7和步骤8中，可新增缺少的属性及属性描述，自动填充报告。