CN116306592A - 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质 - Google Patents

一种基于阅读理解的老年痴呆量表纠错方法、系统及介质 Download PDF

Info

Publication number
CN116306592A
CN116306592A CN202211492719.2A CN202211492719A CN116306592A CN 116306592 A CN116306592 A CN 116306592A CN 202211492719 A CN202211492719 A CN 202211492719A CN 116306592 A CN116306592 A CN 116306592A
Authority
CN
China
Prior art keywords
text
character
corrected
scale
error correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211492719.2A
Other languages
English (en)
Inventor
张美伟
崔秋实
余娟
吕洋
余维华
李文沅
王香霖
祝陈哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Chongqing Medical University
Original Assignee
Chongqing University
Chongqing Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University, Chongqing Medical University filed Critical Chongqing University
Priority to CN202211492719.2A priority Critical patent/CN116306592A/zh
Publication of CN116306592A publication Critical patent/CN116306592A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种基于阅读理解的老年痴呆量表纠错方法、系统及介质,方法步骤包括:1)获取测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本;2)检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;3)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;4)选择从候选字符列表中选择概率最大的字符作为字符的最终输出。系统包括:音频获取及转换模块、候选字符匹配模块、BERT处理模块、纠错模块;本发明结合神经心理量表的语言特点,提出了专有的纠错数据生成方法,弥补了训练数据欠缺的问题。

Description

一种基于阅读理解的老年痴呆量表纠错方法、系统及介质
技术领域
本发明涉及老年痴呆量表测试领域,具体是一种基于阅读理解的老年痴呆量表纠错方法、系统及介质。
背景技术
由于神经心理测试具有一定的主观性,因此痴呆从筛查到诊断难度大,多数综合医院、社区卫生中心、养老机构尚不具备测试能力,从而限制了老年痴呆的正确诊断率,亟待技术突破解决神经心理测试耗时长、主观臆断影响等难题。人工智能技术中的自动语音识别恰好可以从测试效率、准确性等方面解决上述问题,有望将神经心理量表测试在更多社区推广。
因此能精准识别重庆方言的自动语音识别技术,将有助推广痴呆病症的早筛,特别是阿尔兹海默症的早筛。临床研究表明,与老年痴呆和轻度认知障碍相关的可量化的认知下降迹象在患者语言中是可检测到的。机器学习模型已被证明可以成功地使用语音和语言变量检测痴呆,例如从语音识别到的文本中分析句子内容可以推测患者健康状况。由于转录本应该足够准确以正确表示句法和语言特征,因此当前的方法通常依赖于由受过训练的转录员做转录。但这将耗费大量的时间和精力,同时目前任何单一的语音识别算法也无法保证将患者在回答神经心理量表过程中的关键信息识别正确。中文是一个以音节为基本单位的语言,我们也发现了普通话和重庆方言在音节方面的差异,主要对比了声母和韵母的差异,同时,部分老年人的发音存在口齿不清等情况,这对服务于该类用户的语音识别模型提出了更高要求,单模型结构的语音识别模型将很难捕捉到字符的不同发音,在重庆方言的语音识别应用上,其准确率很有限。
输入数据的准确性是自然语言处理常见任务的基本前提,也是将人工智能技术应用在神经心理量表测试中的关键。在业界主流方案中,基于LSTM+CRF的检错技术因受限于依赖大量标注样本而难以普遍落地,而基于N-gram的检错技术也因“硬性”的判别规则造成算法性能低下。中文纠错技术是实现中文语句自动检查、自动纠错的一项重要技术,其目的是提高语言正确性的同时减少人工校验成本。纠错模块作为自然语言处理最基础的模块其重要程度不言而喻。
在通用领域中,中文文本纠错问题是从互联网起始时就一直在寻求解决的问题。在搜索引擎中,一个好的纠错系统能够用户输入的查询词进行纠错提示,或直接展示正确答案。当前由于用户输入随意及手写输入法易出错等原因,错误串在输入文本中占比高达10%-15%,这也使得中文文本纠错模块必要性凸显。而在垂直领域中,比如神经心理量表领域,由于患者的教育程度、说话习惯等原因,导致用户提问与回答存在大量的近隐或同音错误。
业界纠错主流方案一般包括错误检测→候选召回→候选排序三部分或者利用基于机器翻译模型的纠错方法的思想,将纠错任务类比于机器翻译任务,预想利用模型将错误语句翻译为正确语句,利用Seq2seq模型完成端到端的纠正过程。但这些技术都是基于开放领域的纠错。
综上看,针对神经心理量表的语音识别技术,语言模型上有待优化,总结如下:
基于统计的语言模型和语音识别中的语言模型受语料大小影响,效果有限,且统计信息在语义层面表达能力有限。
开放领域的纠错很难收集特定的语料,神经量表的文本领域比较特殊,构建专有的纠错训练数据相对容易。
3)在神经心理量表中,先验问题非常重要,现有发明在纠错中尚未将该信息利用起来。
发明内容
本发明的目的是提供一种基于阅读理解的老年痴呆量表纠错方法,包括以下步骤:
1)获取测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本;
2)在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;
3)建立BERT预训练模型;
4)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;
5)选择从候选字符列表中选择概率最大的字符作为字符的最终输出,重复步骤2)至步骤4),直到解码遇到end字符为止。
进一步,待纠错文本Text中的字符xi被替换为候选字符表中第j个字符的条件概率Pc(yi=j|text)如下所示:
Pc(yi=j|Text)=softmax(W*hi+b)[j] (1)
式中,W和b为权重和偏置参数,
Figure BDA0003964127250000021
是输入xi的embedding结果;softmat为激活函数;/>
Figure BDA0003964127250000031
为BERT预训练模型中最后一层隐状态。
进一步,所述BERT预训练模型包括多头注意力层、前向传播层、encoder输出层。
进一步,多头注意力层的输出MultiHead(Q,K,V)如下所示:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO (2)
式中,W0为权重;
其中,参数headi如下所示:
headi=Attention(QWi Q,KWi K,VWi V),i=1,2,...,h (3)
式中,Wi Q、Wi K、Wi V表示权重;Q=XWi Q、K=XWi K、V=XWi V表示查询向量、键向量和值向量;h为字符数量;
其中,注意力Attention(Q,K,V)如下所示:
Figure BDA0003964127250000032
式中,dk表示向量维度。
进一步,前向传播层的输出FFN(x)如下所示:
FFN(x)=max(0,xW1+b1)W2+b2 (5)
式中,W1、W2表示权重;b1、b2表示偏置;
其中,参数x如下所示:
x=norm(X+MultiHead(Q,K,V)) (6)
式中,X为输入。
进一步,encoder输出层的输出Y如下所示:
Y=FFN(x) (7)
式中,FFN(x)为前向传播层的输出。
进一步,BERT预训练模型的输入为:
X=CLS+Question+SEP+Text+End;其中,End表示结束字符;Text为待纠错文本;SEP、CLS为间隔符、句向量;
文本Question如下所示:
Question={w1,w2,...,wm}=encoder(E(w1),E(w2),...,E(wm)) (8)
式中,m表示question包含的字数,encoder表示BERT中的编码器,E表示encoder中对每个字符的处理函数。wm为字符。
应用基于阅读理解的老年痴呆量表纠错方法的系统,包括音频获取及转换模块、候选字符匹配模块、BERT处理模块、纠错模块;
所述音频获取及转换模块获取测试者关于老年痴呆量表的音频,将测试者音频转录为待纠错文本,并传输至候选字符匹配模块和BERT处理模块;
所述候选字符匹配模块存储有神经心理量表;
所述候选字符匹配模块在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符,并传输至BERT处理模块;
所述BERT处理模块存储有BERT预训练模型;
所述BERT处理模块将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率,并传输至纠错模块;
所述纠错模块选择从候选字符列表中选择概率最大的字符作为字符的最终输出,直到解码遇到end字符为止。
一种计算机可读存储介质,其上存储有计算机程序;
当该计算机程序被调用时,执行上述方法的步骤。
本发明的技术效果是毋庸置疑的,本发明针对神经心理量表中的语音识别问题提出了分段式的处理方式,即单独提出一个纠错模型充当语言模型,进而提高准确率
本发明首次提出将神经心理量表中的问题文本作为先验条件,并结合阅读理解模型完成文本纠错。
本发明结合神经心理量表的语言特点,提出了专有的纠错数据生成方法,弥补了训练数据欠缺的问题。
附图说明
图1为纠错流程图;
图2为语音数据处理流程;
图3为模型结构。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参见图1至图3,一种基于阅读理解的老年痴呆量表纠错方法,包括以下步骤:
1)获取测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本;
2)在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;
3)建立BERT预训练模型;
4)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;
5)选择从候选字符列表中选择概率最大的字符作为字符的最终输出,重复步骤2)至步骤4),直到解码遇到end字符为止。
待纠错文本Text中的字符xi被替换为候选字符表中第j个字符的条件概率Pc(yi=j|text)如下所示:
Pc(yi=j|Text)=softmax(W*hi+b)[j] (1)
式中,W和b为权重和偏置参数,
Figure BDA0003964127250000051
是输入xi的embedding结果;softmat为激活函数;/>
Figure BDA0003964127250000052
为BERT预训练模型中最后一层隐状态。
所述BERT预训练模型包括多头注意力层、前向传播层、encoder输出层。
多头注意力层的输出MultiHead(Q,K,V)如下所示:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO (2)
式中,W0为权重;
其中,参数headi如下所示:
headi=Attention(QWi Q,KWi K,VWi V),i=1,2,...,h (3)
式中,Wi Q、Wi K、Wi V表示权重;Q=XWi Q、K=XWi K、V=XWi V表示查询向量、键向量和值向量;h为字符数量;
其中,注意力Attention(Q,K,V)如下所示:
Figure BDA0003964127250000053
式中,dk表示向量维度。
前向传播层的输出FFN(x)如下所示:
FFN(x)=max(0,xW1+b1)W2+b2 (5)
式中,W1、W2表示权重;b1、b2表示偏置;
其中,参数x如下所示:
x=norm(X+MultiHead(Q,K,V)) (6)
式中,X为输入。
encoder输出层的输出Y如下所示:
Y=FFN(x) (7)
式中,FFN(x)为前向传播层的输出。
BERT预训练模型的输入为:
X=CLS+Question+SEP+Text+End;其中,End表示结束字符;Text为待纠错文本;SEP、CLS为间隔符、句向量;
文本Question如下所示:
Question={w1,w2,...,wm}=encoder(E(w1),E(w2),...,E(wm)) (8)
式中,m表示question包含的字数,encoder表示BERT中的编码器,E表示encoder中对每个字符的处理函数。wm为字符。
术语解释:
MRC:Machine Reading Comprehension阅读理解;
ASR:Automatic Speech Recognition语音识别技术;
NLP:Natural Language Processing自然语言处理;
BERT:预训练语言模型;
AI:Artificial Intelligence人工智能;
LSTM+CRF:长短记忆网络+条件随机场;
Seq2seq:序列到序列;
NLG:Natural Language Generation自然语言生成。
实施例2:
应用基于阅读理解的老年痴呆量表纠错方法的系统,包括音频获取及转换模块、候选字符匹配模块、BERT处理模块、纠错模块;
所述音频获取及转换模块获取测试者关于老年痴呆量表的音频,将测试者音频转录为待纠错文本,并传输至候选字符匹配模块和BERT处理模块;
所述候选字符匹配模块存储有神经心理量表;
所述候选字符匹配模块在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符,并传输至BERT处理模块;
所述BERT处理模块存储有BERT预训练模型;
所述BERT处理模块将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率,并传输至纠错模块;
所述纠错模块选择从候选字符列表中选择概率最大的字符作为字符的最终输出,直到解码遇到end字符为止。
实施例3:
一种计算机可读存储介质,其上存储有计算机程序;
当该计算机程序被调用时,执行实施例1所述方法的步骤。
实施例4:
一种基于阅读理解的老年痴呆量表纠错方法,包括以下步骤:
1)根据音频,利用语音识别模型,输出待纠错文本:
2)根据语音识别的文本,检索神经心理量表中与之匹配的文本,将两者组合成文本对,放入BERT预训练模型中。
其中问题处理为:
Question={w1,w2,...,wm}=encoder(E(w1),E(w2),...,E(wm))
其中m表示question包含的字数,encoder表示BERT中的编码器,E表示encoder中对每个字符的处理函数。
待纠错文本处理方式与Question一致,最终输入到BERT的X=CLS+Question+SEP+Text+End。通过引入三个矩阵完成embedding,具体过程如下,将输入转化为Q,K,V:
Q=XWQ,K=XWK,V=XWV
注意力计算公式:
Figure BDA0003964127250000071
多头注意力层:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO
其中:
headi=Attention(QWi Q,KWi K,VWi V),i=1,2,...,h
前向传播层:
FFN(x)=max(0,xW1+b1)W2+b2
其中:
x=norm(X+MultiHead(Q,K,V))
encoder的输出:
Y=FFN(x)
通过BERT预训练模型之后,对于待纠错文本Text中的字符xi被替换为候选字符表中第j个字符的条件概率为:
Pc(yi=j|Text)=softmax(W*hi+b)[j]
其中,W和b为参数,hi是输入X的embedding结果和BERT中最后一层隐状态
Figure BDA0003964127250000081
通过残差链接后得到的,即:/>
Figure BDA0003964127250000082
Figure BDA0003964127250000083
整个网络的最后一层采用softmax函数,从候选字符列表中选择概率最大的字符作为字符的最终输出,直到解码遇到end字符为止。yi表示待纠错文本Text中的字符xi被替换为候选字符表中第j个字符。
实施例5:
一种基于阅读理解的老年痴呆量表纠错方法,包括以下步骤:
1)获取所述测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本。
2)在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;
3)建立BERT预训练模型;
4)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;
5)选择从候选字符列表中选择概率最大的字符作为字符的最终输出,重复步骤2)至步骤4),直到解码遇到end字符为止。
实施例6:
一种基于阅读理解的老年痴呆量表纠错方法,主要内容见实施例5,其中,待纠错文本Text中的字符xi被替换为候选字符表中第j个字符的条件概率Pc(yi=j|text)如下所示:
Pc(yi=j|Text)=softmax(W*hi+b)[j] (1)
式中,W和b为权重和偏置参数,
Figure BDA0003964127250000091
是输入xi的embedding结果;softmat为激活函数;/>
Figure BDA0003964127250000092
为BERT预训练模型中最后一层隐状态。
实施例7:
一种基于阅读理解的老年痴呆量表纠错方法,主要内容见实施例5,其中,所述BERT预训练模型包括多头注意力层、前向传播层、encoder输出层。
实施例8:
一种基于阅读理解的老年痴呆量表纠错方法,主要内容见实施例5,其中,多头注意力层的输出MultiHead(Q,K,V)如下所示:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO (2)
式中,W0为权重;
其中,参数headi如下所示:
headi=Attention(QWi Q,KWi K,VWi V),i=1,2,...,h (3)
式中,Wi Q、Wi K、Wi V表示权重;Q=XWi Q、K=XWi K、V=XWi V表示查询向量、键向量和值向量;h为字符数量;
其中,注意力Attention(Q,K,V)如下所示:
Figure BDA0003964127250000093
式中,dk表示向量维度。
实施例9:
一种基于阅读理解的老年痴呆量表纠错方法,主要内容见实施例5,其中,前向传播层的输出FFN(x)如下所示:
FFN(x)=max(0,xW1+b1)W2+b2 (5)
式中,W1、W2表示权重;b1、b2表示偏置;
其中,参数x如下所示:
x=norm(X+MultiHead(Q,K,V)) (6)
式中,X为输入。
实施例10:
一种基于阅读理解的老年痴呆量表纠错方法,主要内容见实施例5,其中,encoder输出层的输出Y如下所示:
Y=FFN(x)(7)
式中,FFN(x)为前向传播层的输出。
实施例11:
一种基于阅读理解的老年痴呆量表纠错方法,主要内容见实施例5,其中,BERT预训练模型的输入X=CLS+Question+SEP+Text+End;其中,End表示结束字符;Text为待纠错文本;SEP、CLS为间隔符、句向量;
文本Question如下所示:
Question={w1,w2,...,wm}=encoder(E(w1),E(w2),...,E(wm)) (8)
式中,m表示question包含的字数,encoder表示BERT中的编码器,E表示encoder中对每个字符的处理函数;wm为字符。

Claims (9)

1.一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,包括以下步骤:
1)获取所述测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本。
2)在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;
3)建立BERT预训练模型;
4)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;
5)选择从候选字符列表中选择概率最大的字符作为字符的最终输出,重复步骤2)至步骤4),直到解码遇到end字符为止。
2.根据权利要求1所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,待纠错文本Text中的字符xi被替换为候选字符表中第j个字符的条件概率Pc(yi=j|text)如下所示:
Pc(yi=j|Text)=softmax(W*hi+b)[j] (1)
式中,W和b为权重和偏置参数,
Figure FDA0003964127240000011
是输入xi的embedding结果;softmat为激活函数;/>
Figure FDA0003964127240000012
为BERT预训练模型中最后一层隐状态。
3.根据权利要求1所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,所述BERT预训练模型包括多头注意力层、前向传播层、encoder输出层。
4.根据权利要求3所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,多头注意力层的输出MultiHead(Q,K,V)如下所示:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO (2)
式中,W0为权重;
其中,参数headi如下所示:
headi=Attention(QWi Q,KWi K,VWi V),i=1,2,...,h (3)
式中,Wi Q、Wi K、Wi V表示权重;Q=XWi Q、K=XWi K、V=XWi V表示查询向量、键向量和值向量;h为字符数量;
其中,注意力Attention(Q,K,V)如下所示:
Figure FDA0003964127240000021
式中,dk表示向量维度。
5.根据权利要求3所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,前向传播层的输出FFN(x)如下所示:
FFN(x)=max(0,xW1+b1)W2+b2 (5)
式中,W1、W2表示权重;b1、b2表示偏置;
其中,参数x如下所示:
x=norm(X+MultiHead(Q,K,V)) (6)
式中,X为输入。
6.根据权利要求3所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,encoder输出层的输出Y如下所示:
Y=FFN(x) (7)
式中,FFN(x)为前向传播层的输出。
7.根据权利要求1所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,BERT预训练模型的输入X=CLS+Question+SEP+Text+End;其中,End表示结束字符;Text为待纠错文本;SEP、CLS为间隔符、句向量;
文本Question如下所示:
Question={w1,w2,...,wm}=encoder(E(w1),E(w2),...,E(wm)) (8)
式中,m表示question包含的字数,encoder表示BERT中的编码器,E表示encoder中对每个字符的处理函数;wm为字符。
8.应用权利要求1至7任一项所述基于阅读理解的老年痴呆量表纠错方法的系统,其特征在于,包括音频获取及转换模块、候选字符匹配模块、BERT处理模块、纠错模块;
所述音频获取及转换模块获取测试者关于老年痴呆量表的音频,将测试者音频转录为待纠错文本,并传输至候选字符匹配模块和BERT处理模块;
所述候选字符匹配模块存储有神经心理量表;
所述候选字符匹配模块在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符,并传输至BERT处理模块;
所述BERT处理模块存储有BERT预训练模型;
所述BERT处理模块将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率,并传输至纠错模块;
所述纠错模块选择从候选字符列表中选择概率最大的字符作为字符的最终输出,直到解码遇到end字符为止。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序;
当该计算机程序被调用时,执行权利要求1至7所述方法的步骤。
CN202211492719.2A 2022-11-25 2022-11-25 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质 Pending CN116306592A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211492719.2A CN116306592A (zh) 2022-11-25 2022-11-25 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211492719.2A CN116306592A (zh) 2022-11-25 2022-11-25 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质

Publications (1)

Publication Number Publication Date
CN116306592A true CN116306592A (zh) 2023-06-23

Family

ID=86792931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211492719.2A Pending CN116306592A (zh) 2022-11-25 2022-11-25 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质

Country Status (1)

Country Link
CN (1) CN116306592A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116844720A (zh) * 2023-06-30 2023-10-03 石嘴山市第二人民医院 老年衰弱健康智能监控管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116844720A (zh) * 2023-06-30 2023-10-03 石嘴山市第二人民医院 老年衰弱健康智能监控管理系统
CN116844720B (zh) * 2023-06-30 2024-02-02 石嘴山市第二人民医院 老年衰弱健康智能监控管理系统

Similar Documents

Publication Publication Date Title
CN101740024B (zh) 基于广义流利的口语流利度自动评估方法
CN106782603B (zh) 智能语音评测方法及系统
CN101551947A (zh) 辅助口语语言学习的计算机系统
CN101650886B (zh) 一种自动检测语言学习者朗读错误的方法
CN117253576B (zh) 基于中文医疗大模型的门诊电子病历生成方法
CN109948144B (zh) 一种基于课堂教学情境的教师话语智能处理的方法
CN116306592A (zh) 一种基于阅读理解的老年痴呆量表纠错方法、系统及介质
Liu et al. AI recognition method of pronunciation errors in oral English speech with the help of big data for personalized learning
CN110675292A (zh) 一种基于人工智能的儿童语言能力评测方法
Gelin et al. Simulating reading mistakes for child speech Transformer-based phone recognition
CN111046663A (zh) 一种中文表单的智能校正方法
Shi et al. Construction of English Pronunciation Judgment and Detection Model Based on Deep Learning Neural Networks Data Stream Fusion
CN115440193A (zh) 一种基于深度学习的发音评测打分方法
Wang et al. Assessing phrase break of esl speech with pre-trained language models and large language models
CN111429886B (zh) 一种语音识别方法及系统
Zheng [Retracted] An Analysis and Research on Chinese College Students’ Psychological Barriers in Oral English Output from a Cross‐Cultural Perspective
Jiang et al. A sequence-to-sequence based error correction model for medical automatic speech recognition
Jambi et al. Speak-Correct: A Computerized Interface for the Analysis of Mispronounced Errors.
Lane et al. Local word discovery for interactive transcription
CN111063335A (zh) 一种基于神经网络的端到端声调识别方法
Huang et al. Detection of Mispronunciation in Non-native Speech Using Acoustic Model and Convolutional Recurrent Neural Networks
CN116386637B (zh) 雷达飞行指挥语音指令生成方法及系统
Yang et al. An GMM-HMM Based Intelligent Scoring Mechanism for Oral English Pronunciation
Bao et al. [Retracted] An Auxiliary Teaching System for Spoken English Based on Speech Recognition Technology
Shareef et al. Collaborative Training of Acoustic Encoder for Recognizing the Impaired Children Speech

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination