CN1764944A - 语音识别系统 - Google Patents

语音识别系统 Download PDF

Info

Publication number
CN1764944A
CN1764944A CNA2004800080443A CN200480008044A CN1764944A CN 1764944 A CN1764944 A CN 1764944A CN A2004800080443 A CNA2004800080443 A CN A2004800080443A CN 200480008044 A CN200480008044 A CN 200480008044A CN 1764944 A CN1764944 A CN 1764944A
Authority
CN
China
Prior art keywords
text
speech
error correction
speech recognition
replace dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800080443A
Other languages
English (en)
Other versions
CN100578615C (zh
Inventor
H·巴托西克
C·麦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1764944A publication Critical patent/CN1764944A/zh
Application granted granted Critical
Publication of CN100578615C publication Critical patent/CN100578615C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Abstract

在语音识别和纠错系统中,其包括至少一个可以向其馈送口述文本(GT)的语音识别装置(1),可以将所述口述文本转换成识别文本(ET),以及一个纠错装置(3),用于纠正由该至少一个语音识别装置(1)所识别的文本(ET),所述纠错装置通过一个数据网络(2)与该至少一个语音识别装置(1)相连接,用于传送该识别文本(ET)并且在合适的情况下也传送该口述文本(GT),该纠错装置(3)具有一个替换词典(23),其包括词的一部分、词和词序列,可以作为该识别文本的单独的词的一部分、词和词序列的替换项由该纠错装置(3)进行显示(22)。

Description

语音识别系统
技术领域
本发明涉及一种语音识别和纠错系统,其包括至少一个可以向其馈送口述文本的语音识别装置,可以将所述口述文本转换成识别文本,以及一个纠错装置,用于纠正由该至少一个语音识别装置所识别的文本,所述纠错装置通过数据网络与该至少一个语音识别装置相连接,所述数据网络用于传送该识别文本,并且在适当情况下传送该口述文本。
本发明进一步涉及一种纠错装置,其用于纠正由语音识别装置所识别的文本。
本发明进一步涉及一种创建替换词典的方法,用于为替换词典确定数据记录条目,以对由语音识别装置从口述文本所转换成的识别文本进行纠正。
背景技术
这种语音识别和纠错系统可从文献US5,864,805中获悉。该文献公开了一种语音识别系统,其可以连续地运作并可以在词和词序列中识别和纠正错误。为了纠正错误,数据被存储在该语音识别系统的内部存储器中,以便更新记录在该语音识别系统中的概率表。所述概率表用于产生替换表,以替换不正确识别的文本。
在所述公知的语音识别和纠错系统中,已证明其缺点在于它只能用作单机解决方案,也就是说该语音识别和纠错系统受限于个人电脑,其中该个人电脑存储着该语音识别和纠错系统所需要的所有数据。但是现代的语音识别系统常常被设计为分布式系统,其中许多具有语音识别软件的电脑,或是其中部分在其上运行的电脑通过数据网络彼此连接。在这些先进的系统中,也会将语音识别和纠错系统的任务分布在许多电脑上。作为这样的一个例子,可以提出一种在医院中用于临床诊断的语音识别系统。在那种情况下,由许多医生在不同的检查室将诊断结果口述到语音识别系统中,并且这些诊断结果由该语音识别系统转换成识别文本,并与该口述文本的音频记录一起集中地存储。但是该识别文本仍然只是粗略的版本,其不得不在纠错处理中清除每一个识别错误。该纠错通常由秘书完成,对单个的秘书来说,通常要纠正许多医生的口述文本。由于在这个语音识别系统中,无论是个人检查室中的医生还是办公室中的秘书,彼此都相距很远,并且还常常工作于不同的时间,因此在文献US5,864,805中所提议的解决方案并不能用于分布式语音识别系统。另一方面,这对于在语音识别系统的转换处理中所获得的并可用于编译用于纠错的替换表的信息来说也是不实际的,其中该纠错信息通过数据网络传送到在其上将对该识别文本进行纠错的计算机上,因为所获得的数据量非常的大。因此文献US5,864,805中所述的概率表的大小增加得太快以至于不能通过数据网络以连续更新的形式传送到纠错装置上,特别是如果所用的数据网络是具有很小带宽的数据网络的话。对于在该语音识别系统转换处理期间所获得的、要直接传送给该纠错装置的信息,以及在那里进行分析的信息来说,这实际上也是不可能的,因为同样在这种情况下特别是对于具有很小带宽的网络来说所需要的网络带宽将会非常大。特别地,应该考虑到现代语音识别系统典型地并行处理5000到8000个关于如何将口述文本转换成识别文本的可能性假设。但是,从该可能性假设中获得的信息对该纠错装置来说将是必须的。例如,如果存在一个识别结果,即1000个词以外的最好假设,并且每个词在原始的词图中出现10次,则在该极端的情况下,将需要传送由1000的10次幂个词构成的变量,并且其区别仅仅在于不同的时间分布。
另一方面,虽然语音识别系统的开发者正努力工作以改善他们的系统,但是在可预知的未来不能期望得到100%的识别率,这意味着对识别文本的纠错将仍然是必需的。因此需要通过在纠错处理期间使个人对该不正确识别的词执行纠错替换,使得他们可以快速的从所提供的替换中选择一个,而使该纠错更加容易。
发明内容
因此本发明一个目的在于提供一种如第一段所述类型的语音识别和纠错系统,一种如第二段所述类型的纠错装置和一种如第三段所述类型的创建替换词典的方法,其中可以避免上述的缺点。为了获得上述目的,在这种语音识别和纠错系统中,该纠错装置具有一个替换词典,其包括词的一部分、词和词序列,可以作为该识别文本的单独的词的一部分、词和词序列的替换项由纠错装置显示。
为了达到上述目的,在所提供的这种纠错装置中,替换词典存储在该纠错装置中,其中所述替换词典包括词的一部分、词和词序列,可以作为该识别文本的单独的词的一部分、词和词序列的替换项由纠错装置对它们进行显示。
应该了解术语“替换词典”意为其是以独立于语音识别装置的转换处理的信息为基础的。特别地,该替换词典并不基于由语音识别装置在转换处理期间所创建的替换识别假设,并且其在正确的概率方面,被认为比该识别文本中所反映的识别假设更糟。
为了达到上述目的,在这种创建替换词典的方法中,独立于该语音识别装置的知识来源,特别是特定应用领域的文本文件例如医学或法律文本,或是从大量纠错文本和由语音识别装置产生的相关识别文本(ET)编译的混淆统计,都相对于文本要素进行检查,例如可能相互混淆的词的一部分、词和词序列,并且这种可能相互混淆的文本要素被共同放在数据记录条目中作为替换项。
依靠根据本发明的特征,对由语音识别系统所识别的文本的纠错可以用比现今可能的方式更加简单和快速的方式执行,对本发明来说,其可以以特别有利的方式用于语音识别系统中,其中识别和纠错不在相同的计算机中执行。此外,由本发明带来的替换给出过程非常地有效、灵活和稳健,那即是说,独立于具体的识别错误。除了省略纠错操作期间在语音识别系统和纠错装置之间大量的数据传送,本发明还进一步提供的显著优点在于,从替换词典得到的替换建议独立于该语音识别装置各自的识别能力。相反地,现今公知的系统所具有的缺点在于,如果该语音识别装置具有很低的识别率,那么在很多情况下在纠错操作期间不能提供可用的替换项,因为这些替换项也是不正确的。
权利要求2的措施提供的优点在于,该纠错装置可以独立于在转换处理期间由该语音识别系统所获得的信息进行操作,因此,除了对该识别文本和在适当情况下的原始口述文本进行传送以外,在该语音识别系统和该纠错装置之间不需要进行数据通信。依靠根据本发明的解决方案的高度适应性,也可以很容易地适应新的口述环境或类型。在优选实施例中,该纠错装置可以基于用于分析该识别文本的所选文本段的分析装置,其中该分析装置优选通过字符串比较法或高级句法分析法从替换词典中确定该所选文本段的替换项。句法分析法例如包括:对句法要素的检测,如名词/动词对、名词性短语等等。
权利要求4的措施提供的优点在于,可以对用户显示已经处理了的识别文本段的替换项,例如通过在该纠错装置的键盘上定义热键。
权利要求5的措施提供的优点在于,通过在后台连续运行的分析装置,该纠错装置可以不断地向所选的文本段提供替换项。
权利要求7的措施提供的优点在于,该替换词典可以独立于语音识别系统,离线或是在线地可以进行编译和更新,因为所使用的信息源独立于那些在语音识别系统的转换处理期间通常或不断可用的信息。
权利要求8的措施提供的优点在于,用于确定数据记录条目的知识经常来自于对于由语音识别系统特别频繁地产生的混淆的认识和了解。作为例子,同音词,即发音相同但是写法不同的词,当然特别频繁地被语音识别系统混淆。通过使用该纠错信息来编译替换词典,语音识别系统的性能又可以额外得到提高,而不需要针对所产生的错误再次训练该语音识别系统。换句话说,该纠错系统通过该语音识别系统从所产生的错误中学习。
为了增加在替换词典中创建数据记录条目的方法的稳健性,可以有利地使用如权利要求8至10所述的统计方法。依靠这些统计方法,用于要被替换的词元素的替换表不用包含太多的条目,并且由此对用户来说也不用变得不实用,因为只有那些在纠错中十分频繁地出现的替换项才会被记录下来。另一方面,在纠错操作期间为替换频率引入一个上限值,以保证那些(几乎)总是用相同的词元素进行纠正的系统替换项,例如在口述中用“敬礼,Meyer先生(Regards,Mr Meyer)”替换指令“信件结束”,不会被提供作为仅有的替换项。这种情况应该由其它机制进行调节。
权利要求11的措施提供的优点在于,能识别所讨论的内容是否是“要被认真处理”的替换项,例如在德语的情况下,替换项“mein-dein”,“dem-den”等等。必要的语音相似性或者可以通过在这种情况下被传送到纠错装置的口述文本进行确定,或者可以从该纠错装置已知的正讨论的词的语音进行确定。
权利要求12的措施提供的优点在于,只有那些出现在口述文本中时期大约相同的点上的词才被记录在该替换表中。例如,如果文本中某些与口述文本无关的词或文本部分在纠错操作期间被用户系统地进行添加,或是随后不会出现在该纠错文本中的词被系统地省略,那么这不利于该使用替换表处理这种纠错。
替换词典中的数据记录条目可以具有变化的细节度。因此,不同的替换表可以根据口述文本中所使用的语音进行编译。此外,替换词典中的数据记录条目可以根据技术领域或是应用领域进行细分,或是根据原始的口述或纠错文本的创建者进行细分。上述细节度的组合也是可以的。
权利要求17的措施提供的优点在于,该替换词典可以在识别文本的纠错期间不断地进行改进,并因此可以进行自我培训。
附图说明
参考附图所示实施例,将对本发明作进一步描述,但是本发明并不局限于此。
图1示出了具有纠错系统的语音识别系统,所述纠错系统通过数据网络与语音识别系统连接。
具体实施方式
图1示出了用于转换口述文本GT的语音识别装置1。该语音识别装置1可以由运行语音识别软件应用程序的计算机构成。该语音识别装置1包括语音识别装置7、参数存储装置9、命令存储装置10和适应级11。表示口述文本GT的音频信号A可以通过麦克风5传送到A/D转换器6中,该A/D转换器将音频信号A转换成可以馈送给该语音识别装置7的数字音频数据AD。该数字音频数据AD由该语音识别装置7转换成识别文本ET,其通过数据网络2存储到存储装置8中。出于这个目的,可以考虑参数信息PI,其包含词汇(上下文)信息、语音模式信息和声学信息并被存储在该参数存储装置9中。
上下文信息包括可以由该语音识别装置7与联合音素序列一起所识别的所有的词。该上下文信息是通过分析与所设想的应用有关的大量文本获得的。作为例子,对用于放射学领域的语音识别系统来说,要分析由总数5千万到1亿个词组成的检查结果。语音模式信息包括关于通常在口述文本GT的语音中的词序列的统计信息,特别是词出现的概率以及它们与在其前后出现的词的连接。声学信息包括关于对该语音识别装置1的用户特定的语音类型的信息,以及关于该麦克风5和A/D转换器6的声学特性的信息。
文献US5,031,113的公开内容在此通过参考并入本文件的公开内容中,它公开了考虑这种参数信息PI的语音识别方法的实施,因此本文不再给出其进一步的细节。根据该语音识别方法,语音识别装置7可以将包含识别文本ET的文本数据存储在存储装置8中。此外,口述文本GT可以以数字形式存储在存储装置8中。另外,有关于所用语音14、应用15和创建者16的信息可以由该语音识别系统1通过数据网络2与该识别文本ET一起传送,并存储在该存储装置8中。
在命令存储装置10中,所存储的词序列由该语音识别装置7作为命令进行识别。这种命令包括,例如,可使得该识别文本ET中的下一个词成为粗体的词序列“下一个词粗体(next word bold)”。
为了与有关于原始口述文本GT的声学信息以及有关于语音14、应用(技术领域)15和创建者16的信息一起被读取,纠错装置3访问存储在该存储装置8中的识别文本ET,以使得该识别文本ET可以依靠文本处理系统进行纠错。特别是如下所述的先进语音识别软件应用程序的所有功能都可以在该识别文本ET上使用。该纠错装置3包括重放和纠错装置18,其与键盘19、监视器20和扩音器21相连接。该重放和纠错装置18被设计用于在监视器20上对该识别文本ET进行可视显示,以及用于对该口述文本GT经由扩音器21进行声学重放,以及用于当该重放和纠错装置18处于触发同步重放模式时,在该识别文本ET中对正被声学重放的口述文本的段进行同步可视标记。在这个重放模式下,该识别文本可以通过键盘输入的方式同时地进行纠错,并且在适当情况下也可以通过麦克风(未示)输入语音命令的方式。该纠错文本KT可以存储在存储装置17中。
重放和纠错装置18包括分析装置24,用于分析已经被选的识别文本ET的文本段,其目的在于从存储在该纠错装置3中的替换词典23中向该纠错装置的用户建议所选文本段的替换项。该替换项是以替换表22的形式显示在监视器上呈现给用户的,并且该用户可以由键盘19上的光标键或是鼠标(未示出)或是类似物来操纵该表,以便手动选择替换项或执行纠错。该分析装置24或者在后台连续运行,或者可由该纠错装置3的用户通过该用户对一个键或组合键(“热键”)的按压进行激活。该分析装置更优选地或者借助于字符串比较法,或者通过统计分析法分析该所选文本段。字符串比较可以基于单独的词,或是单独的词的组成部分,或是(要被检测的)短语进行。该比较可以进一步基于由大量句法要素构成的表述进行,例如名词/动词对、名词性短语等等。所有这些表述在本专利申请中一般也被称为“文本要素”。由该分析装置24所建议的替换表可以依次包括单独的词,或者其中的部分,或者整个短语。借助单独词的替换项的例子可以提及下面的识别文本:“腹上部的脉管在内部(interiorly)被看见,并且他有浮肿(edema)病史。”。以斜体字示出的词被不正确地识别。如果在这个识别文本的纠错期间,光标位于词“在内部(interiorly)”上,那么由一个或多个条目组成的替换表由该分析装置出于纠错目的进行提供,所述替换表包括在这种情况下将是正确的词的词“早期地(anteriorly)”。通过简单地选择该词“早期地(anteriorly)”,该用户可以通过所述词执行“在内部(interiorly)”的快速替换。该过程对词“浮肿(edema)”同样应用,所述词“浮肿”将由另一个替换表中所提供的词“贫血(anemia)”进行替换。因此用户可以通过仅仅按压少许的键来纠正该不正确的识别句,以给出“腹上部的脉管被早期看见,并且他有贫血病史。”在短语替换的一个例子中,可以提供正确的短语“没有升高的节奏(rhythm without lifts)”作为该识别短语“没有表的节奏(rhythm without lists)”的替换。应该注意到在这种情况下,虽然在替换期间该识别文本中只改变了一个字母,但是在该纠错装置的用户进行选择时,所引用的整个短语都要被检查、被提供作为替换项并被替换。有关替换的另一个例子具有大量要素。这些要素可以是技术表述、名词/动词对等等。在这种情况下该分析装置24可以使用运算法则,其是被首先执行的识别文本的标记以及对单独的词(要素)的可信度的计算。随后对于具有低可信度的名词确定名词/动词对或名词性短语。在那以后,依靠字符串比较对于互补要素(动词或名词)确定联合替换表的一致性,于是其它要素就以替换列表的形式被显示出来。依靠这个方法,例如,在不正确的识别句“体外腱的材料(materials)全都被清除了”中,在该分析装置24发现词“材料(materials)”的低可信度、鉴别该名词/动词对“材料被清除(materials debrided)”并且经由动词“被清除(debrided)”确定其中出现了条目“痕迹被清除(trails debrided)”的相关替换表的情况下,可以由替换表中所提供的“痕迹(trails)”对词“材料(materials)”进行纠错。如果这个条目是由用户选择的,则对名词和动词进行替换,即使在该文本中只有用“痕迹(trails)”对“材料(materials)”的替换是用户可见的。作为关于对具有大量要素的替换表进行确定的进一步的例子,可以提及不正确的识别短语“放电药物两个CCU(Discharge medications two CCU)”,而其实际上应该被识别为“部署到CCU(disposition to CCU)”。该分析装置24检测词“药物(medications)”的低可信度,并且鉴别该名词性短语“放电药物(Discharge medications)”。替换表中相关条目的确定是经由术语“CCU”以及读取“部署到CCU(dispositionto CCU)”执行的。这个条目可以由用户选择,并且替换上述全部不正确的识别短语。
分析装置24例如从用于纠正识别文本的文本处理程序的光标位置或是从口述文本段的时间位置及其与识别文本的相关性来确定识别文本ET的所选文本段。因此对该纠错装置3的用户来说,可以通过选择替换用语来有效地和快速地纠正该识别文本。
纠错装置3也包括评估装置4,用于创建替换词典23或者其中单独的条目。应该注意到的是为了从各种独立于该语音识别系统1的知识源中编译基础替换词典,评估装置也可以独立于该纠错装置3而被提供,这些基础替换词典随后可以出于使用的目的而被存储在该纠错装置3中。在所示实施例的例子中,该评估装置4经由该重放和纠错装置18访问存储在存储装置8中的口述和识别文本GT、ET,以及有关于语音14、应用15和创建者16的信息,在一个可选择实施例中该评估装置4也能够直接访问存储装置8。此外该评估装置4从存储装置17中读取纠错文本KT,以便将其与识别文本ET进行比较,并由此确定在该识别文本ET上执行的文本要素替换。对这些文本要素替换进行统计分析,并且如果它们满足下面更加详细讨论的特定条件,则作为该替换词典23的数据记录条目中的替换项进行记录。因此,在一个优选实施例中,将该识别文本ET与该纠错文本KT进行比较,并确定显示最低的整体偏差,即整个文本中错误数量最少的那些替换项。这个信息被用于编译替换表。为了改善系统的稳健性,即不给该替换表填充太多条目,对显示一个词要素被另一个替换有多频繁的统计量进行编译是很有用的。只有超过相关或是绝对频率的预定下限值时,作为替换的词要素才被记录在该替换表中。为一个词要素被另一个替换的频率引入上限值也可以是很有用的,只有没有达到所述上限值时,该词要素才被记录在替换表中。如果超越了该上限值,这或者表明该语音识别系统具有不能靠替换表进行纠正的系统错误,或者表明由于不正确识别的情况而不能执行文本部分的替换。
用于改善用其编译替换词典的稳健性的另一措施涉及对要被替换的术语以及作为替换的术语的语音相似性进行分析。因此可以保证那些词语对具有足够的语音相似度,例如德语里的mein-dein、dem-den,被认为是该语音识别系统不正确的识别的实例,而应该被记录在替换表中。
用于改善用其编译替换词典的稳健性的又一措施涉及对纠错文本要素所在的时间位置进行分析。因此,只有那些位于口述文本中时期大约相同的点上的文本要素才被记录在替换表中。因此可以防止,例如该纠错装置的用户出于格式或内容的原因已经添加到该识别文本中或是从那里删除的、但是与纠正该不正确识别情况无关的词,被输入到替换表中。
此外,替换词典中的数据记录可以根据所使用的语音、应用(技术领域)或创建者、或是这些的联合进行另外地细分。一旦识别文本ET被传送用于进行纠正,对于纠正可额外获知有关语音14、应用(技术领域)15和创建者16的信息,合适的替换表就从替换词典23中加载,并可用于替换的快速提出。
在所示实施例中,该评估装置4在后台连续运行,因此当其在线时,可以改进并培训该替换词典23。
除了出于创建替换词典23的目的而评估纠错文本KT以外,该评估装置4也可以另外或作为备选方案,出于这个目的而使用用于其它独立于语音识别系统1的知识源,特别是文本文件12,例如临床结果,以及合适情况下的混淆统计,其被分析以编译替换词典23中的数据记录条目。这些文件一方面可以存储在其上运行着该分析装置4的计算机的硬盘上;另一方面,这种文件也可以通过数据网络进行访问。有利地,也可以搜索因特网来分析合适的因特网文件13,这个过程特别适于自动操作-因为整个方法都用于确定替换词典中的数据记录条目。

Claims (16)

1.一种语音识别和纠错系统,其包括至少一个可以向其馈送口述文本(GT)的语音识别装置(1),可以将所述口述文本转换成识别文本(ET),以及一个纠错装置(3),用于纠正由该至少一个语音识别装置(1)所识别的文本(ET),所述纠错装置通过数据网络(2)与该至少一个语音识别装置(1)相连接,用于传送该识别文本(ET),并且在适当情况下也传送该口述文本(GT),其特征在于该纠错装置(3)具有一个替换词典(23),其包括词的一部分、词和词序列,可以作为该识别文本的单独的词的一部分、词和词序列的替换项由该纠错装置(3)对它们进行显示(22)。
2.一种纠错装置,用于纠正由语音识别装置所识别的文本,其特征在于一个替换词典(23)存储在该纠错装置(3)中,该替换词典包括词的一部分、词和词序列,可以作为该识别文本的单独的词的一部分、词和词序列的替换项由该纠错装置(3)对它们进行显示(22)。
3.如权利要求2所述的纠错装置,其特征在于包括分析装置(24),用于分析该识别文本的所选文本段,优选地借助于字符串比较或句法分析来进行,并且用于从该替换词典(23)中确定该所选文本段的替换项。
4.如权利要求3所述的纠错装置,其特征在于该分析装置(24)可以由该纠错装置的用户激活。
5.如权利要求3所述的纠错装置,其特征在于该分析装置(24)从文本处理程序的光标位置或是标记信息确定所选文本段。
6.如权利要求3所述的纠错装置,其特征在于该分析装置(24)从该口述文本的时间位置及其与识别文本的相关性来确定所选文本段。
7.一种创建替换词典的方法,用于确定替换词典(23)中的数据记录条目,以用于对由语音识别装置(1)从口述文本(GT)所转换的识别文本(ET)进行纠错,其特征在于独立于该语音识别装置(1)的知识源(12,13),特别是特定应用领域的文本文件,例如医学或法律文本,或是从大量纠错文本(KT)以及由语音识别装置产生的与之相关的识别文本(ET)编译的混淆统计,都针对文本要素进行检查,例如可能相互混淆的词的一部分、词或词序列,并且这种可能相互混淆的文本要素作为该替换词典(23)的数据记录条目中的替换项而被放置在一起。
8.如权利要求7所述的创建替换词典的方法,其特征在于在纠错文本(KT)中相对于语音识别装置转换的原始识别文本(ET)而进行的文本要素的替换被确定并作为替换项被记录在该替换词典的数据记录条目中。
9.如权利要求8所述的创建替换词典的方法,其特征在于对每个文本要素的替换频率进行统计评估,并且只有当超过频率的预定下限值时,才执行作为该替换词典的数据记录条目中的替换项的记录,该频率的预定下限值被表示为替换的绝对数量或是相对于被检查的词的总数的替换比率、或是相对于所给词的总的出现情况的替换比。
10.如权利要求9所述的创建替换词典的方法,其特征在于对每个文本要素的替换频率进行统计评估,并且只有当没有达到频率的预定上限值时,才执行作为该替换词典的数据记录条目中的替换项的记录,该频率的预定上限值被表示为替换的绝对数量或是相对于被检查的词的总数的替换比率。
11.如权利要求8所述的创建替换词典的方法,其特征在于执行对该文本要素替换的声学相似性的分析,并且只有当发现预定的语音相似度时,才执行作为该替换词典的数据记录条目中的替换项的记录。
12.如权利要求8所述的创建替换词典的方法,其特征在于执行对该文本要素替换的时间位置的分析,并且只有当对于在该原始口述文本(GT)中被替换的文本要素来说,具有在时间方面足够接近的相应文本要素时,才执行作为该替换词典的数据记录条目中的替换项的记录。
13.如权利要求7所述的创建替换词典的方法,其特征在于该替换词典的数据记录条目根据语音(14)进行细分。
14.如权利要求7所述的创建替换词典的方法,其特征在于该替换词典的数据记录条目根据技术领域(15)或是应用领域进行细分。
15.如权利要求7所述的创建替换词典的方法,其特征在于该替换词典的数据记录条目根据该原始口述或纠错文本的创建者(16)进行细分。
16.如权利要求7所述的创建替换词典的方法,其特征在于该替换词典(23)在识别文本的纠错期间进行在线改写。
CN200480008044A 2003-03-26 2004-03-22 语音识别系统 Expired - Fee Related CN100578615C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100782 2003-03-26
EP03100782.6 2003-03-26

Publications (2)

Publication Number Publication Date
CN1764944A true CN1764944A (zh) 2006-04-26
CN100578615C CN100578615C (zh) 2010-01-06

Family

ID=33041048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200480008044A Expired - Fee Related CN100578615C (zh) 2003-03-26 2004-03-22 语音识别系统

Country Status (7)

Country Link
US (1) US8447602B2 (zh)
EP (1) EP1611569B8 (zh)
JP (1) JP4994834B2 (zh)
CN (1) CN100578615C (zh)
AT (1) ATE417346T1 (zh)
DE (1) DE602004018290D1 (zh)
WO (1) WO2004086359A2 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831177A (zh) * 2012-07-31 2012-12-19 聚熵信息技术(上海)有限公司 语句纠错方法及其系统
CN102833633A (zh) * 2012-09-04 2012-12-19 深圳创维-Rgb电子有限公司 一种电视机语音控制系统及方法
CN102956231A (zh) * 2011-08-23 2013-03-06 上海交通大学 基于半自动校正的语音关键信息记录装置及方法
CN103140889A (zh) * 2010-09-29 2013-06-05 Nec卡西欧移动通信株式会社 语音转换装置、便携电话终端、语音转换方法和记录介质
CN103324609A (zh) * 2012-03-19 2013-09-25 富士通株式会社 文本校对装置和文本校对方法
CN105009151A (zh) * 2013-03-07 2015-10-28 日本电气方案创新株式会社 理解辅助系统、理解辅助服务器、理解辅助方法和计算机可读记录介质
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105513586A (zh) * 2015-12-18 2016-04-20 百度在线网络技术(北京)有限公司 语音识别结果的显示方法和装置
CN105654946A (zh) * 2014-12-02 2016-06-08 三星电子株式会社 用于语音识别的设备和方法
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
CN106340295A (zh) * 2015-07-06 2017-01-18 无锡天脉聚源传媒科技有限公司 一种语音识别结果的接受方法及装置
CN107293299A (zh) * 2017-06-16 2017-10-24 朱明增 一种提高调度员查找图纸效率的语音识别定位系统
CN108140384A (zh) * 2015-10-15 2018-06-08 雅马哈株式会社 信息管理系统和信息管理方法
CN108831473A (zh) * 2018-03-30 2018-11-16 联想(北京)有限公司 一种音频处理方法及装置
CN109841209A (zh) * 2017-11-27 2019-06-04 株式会社速录抓吧 语音识别设备和系统
CN110379214A (zh) * 2019-06-27 2019-10-25 武汉职业技术学院 一种基于语音识别的看图写话训练方法及装置
CN110534112A (zh) * 2019-08-23 2019-12-03 王晓佳 基于位置与时间的分布式语音识别纠错装置及方法
CN112272847A (zh) * 2019-05-08 2021-01-26 互动解决方案公司 错误转换词典制作系统

Families Citing this family (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8725505B2 (en) * 2004-10-22 2014-05-13 Microsoft Corporation Verb error recovery in speech recognition
US9821344B2 (en) 2004-12-10 2017-11-21 Ikan Holdings Llc Systems and methods for scanning information from storage area contents
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20090070109A1 (en) * 2007-09-12 2009-03-12 Microsoft Corporation Speech-to-Text Transcription for Personal Communication Devices
CN100592249C (zh) * 2007-09-21 2010-02-24 上海汉翔信息技术有限公司 快速输入相关词的方法
JP2009116075A (ja) * 2007-11-07 2009-05-28 Xanavi Informatics Corp 音声認識装置
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) * 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
JP2010066365A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 音声認識装置、方法、及びプログラム
US8515748B2 (en) * 2009-02-03 2013-08-20 International Business Machines Corporation Mobile phone communication gap recovery
US9280971B2 (en) * 2009-02-27 2016-03-08 Blackberry Limited Mobile wireless communications device with speech to text conversion and related methods
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
CA2799848A1 (en) * 2010-05-19 2011-11-24 Sanofi-Aventis Deutschland Gmbh Modification of operational data of an interaction and/or instruction determination process
US8738377B2 (en) 2010-06-07 2014-05-27 Google Inc. Predicting and learning carrier phrases for speech input
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US9904768B2 (en) 2011-02-18 2018-02-27 Nuance Communications, Inc. Methods and apparatus for presenting alternative hypotheses for medical facts
US10460288B2 (en) 2011-02-18 2019-10-29 Nuance Communications, Inc. Methods and apparatus for identifying unspecified diagnoses in clinical documentation
US8768723B2 (en) 2011-02-18 2014-07-01 Nuance Communications, Inc. Methods and apparatus for formatting text for clinical fact extraction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9569594B2 (en) 2012-03-08 2017-02-14 Nuance Communications, Inc. Methods and apparatus for generating clinical reports
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9064492B2 (en) 2012-07-09 2015-06-23 Nuance Communications, Inc. Detecting potential significant errors in speech recognition results
WO2014018039A1 (en) * 2012-07-26 2014-01-30 Nuance Communications, Inc. Text formatter with intuitive customization
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9147275B1 (en) 2012-11-19 2015-09-29 A9.Com, Inc. Approaches to text editing
RU2530268C2 (ru) 2012-11-28 2014-10-10 Общество с ограниченной ответственностью "Спиктуит" Способ обучения информационной диалоговой системы пользователем
US9043349B1 (en) 2012-11-29 2015-05-26 A9.Com, Inc. Image-based character recognition
US9224387B1 (en) * 2012-12-04 2015-12-29 Amazon Technologies, Inc. Targeted detection of regions in speech processing data streams
US10504622B2 (en) 2013-03-01 2019-12-10 Nuance Communications, Inc. Virtual medical assistant methods and apparatus
US11024406B2 (en) 2013-03-12 2021-06-01 Nuance Communications, Inc. Systems and methods for identifying errors and/or critical results in medical reports
US11183300B2 (en) 2013-06-05 2021-11-23 Nuance Communications, Inc. Methods and apparatus for providing guidance to medical professionals
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10496743B2 (en) 2013-06-26 2019-12-03 Nuance Communications, Inc. Methods and apparatus for extracting facts from a medical text
KR102305117B1 (ko) * 2014-04-30 2021-09-27 삼성전자주식회사 텍스트 입력 제어 방법 및 그 전자 장치
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10331763B2 (en) 2014-06-04 2019-06-25 Nuance Communications, Inc. NLU training with merged engine and user annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
US10366424B2 (en) 2014-06-04 2019-07-30 Nuance Communications, Inc. Medical coding system with integrated codebook interface
US10319004B2 (en) 2014-06-04 2019-06-11 Nuance Communications, Inc. User and engine code handling in medical coding system
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
FR3032574B1 (fr) * 2015-02-10 2017-01-13 Airbus Operations Sas Procede de communication d'un message vocal comprenant une etape de transcription d'une portion determinee d'un signal audio correspondant audit message vocal et dispositif pour sa mise en oeuvre
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10366687B2 (en) 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105550171B (zh) * 2015-12-31 2018-10-16 北京奇艺世纪科技有限公司 一种垂直搜索引擎的查询信息纠错方法和系统
US11152084B2 (en) 2016-01-13 2021-10-19 Nuance Communications, Inc. Medical report coding with acronym/abbreviation disambiguation
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US10553208B2 (en) * 2017-10-09 2020-02-04 Ricoh Company, Ltd. Speech-to-text conversion for interactive whiteboard appliances using multiple services
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
US11430435B1 (en) 2018-12-13 2022-08-30 Amazon Technologies, Inc. Prompts for user feedback
AR118332A1 (es) * 2019-03-18 2021-09-29 Evonik Operations Gmbh Conversión de habla a texto de lenguaje técnico sin soporte
US11093720B2 (en) * 2019-03-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Apparatus, method, and program product for converting multiple language variations
CN114223029A (zh) * 2019-08-13 2022-03-22 三星电子株式会社 支持装置进行语音识别的服务器及服务器的操作方法
CN111261166B (zh) * 2020-01-15 2022-09-27 云知声智能科技股份有限公司 一种语音识别方法及装置
US11776549B2 (en) * 2020-11-06 2023-10-03 Google Llc Multi-factor audio watermarking
CN112183073A (zh) * 2020-11-27 2021-01-05 北京擎盾信息科技有限公司 一种适用于法律热线语音识别的文本纠错和补全方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT390685B (de) * 1988-10-25 1990-06-11 Philips Nv System zur textverarbeitung
JPH07168915A (ja) 1993-12-16 1995-07-04 Matsushita Electric Ind Co Ltd 学習機能を備えたオンライン認識装置
US5794189A (en) * 1995-11-13 1998-08-11 Dragon Systems, Inc. Continuous speech recognition
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5999896A (en) 1996-06-25 1999-12-07 Microsoft Corporation Method and system for identifying and resolving commonly confused words in a natural language parser
GB2302199B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5864805A (en) * 1996-12-20 1999-01-26 International Business Machines Corporation Method and apparatus for error correction in a continuous dictation system
DE69937176T2 (de) * 1998-08-28 2008-07-10 International Business Machines Corp. Segmentierungsverfahren zur Erweiterung des aktiven Vokabulars von Spracherkennern
JP2000089786A (ja) 1998-09-08 2000-03-31 Nippon Hoso Kyokai <Nhk> 音声認識結果の修正方法および装置
US6278968B1 (en) * 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6314397B1 (en) * 1999-04-13 2001-11-06 International Business Machines Corp. Method and apparatus for propagating corrections in speech recognition software
US6507816B2 (en) * 1999-05-04 2003-01-14 International Business Machines Corporation Method and apparatus for evaluating the accuracy of a speech recognition system
US6618697B1 (en) * 1999-05-14 2003-09-09 Justsystem Corporation Method for rule-based correction of spelling and grammar errors
US6611802B2 (en) * 1999-06-11 2003-08-26 International Business Machines Corporation Method and system for proofreading and correcting dictated text
US6332122B1 (en) * 1999-06-23 2001-12-18 International Business Machines Corporation Transcription system for multiple speakers, using and establishing identification
US6374214B1 (en) * 1999-06-24 2002-04-16 International Business Machines Corp. Method and apparatus for excluding text phrases during re-dictation in a speech recognition system
US6418410B1 (en) * 1999-09-27 2002-07-09 International Business Machines Corporation Smart correction of dictated speech
WO2001031634A1 (en) * 1999-10-28 2001-05-03 Qenm.Com, Incorporated Proofreading system and method
JP2001195087A (ja) * 2000-01-06 2001-07-19 Mitsubishi Electric Corp 音声認識システム
US6963841B2 (en) * 2000-04-21 2005-11-08 Lessac Technology, Inc. Speech training method with alternative proper pronunciation database
JP2001343994A (ja) * 2000-06-01 2001-12-14 Nippon Hoso Kyokai <Nhk> 音声認識誤り検出装置および記憶媒体
US6859774B2 (en) * 2001-05-02 2005-02-22 International Business Machines Corporation Error corrective mechanisms for consensus decoding of speech

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103140889B (zh) * 2010-09-29 2015-01-07 Nec卡西欧移动通信株式会社 语音转换装置、便携电话终端、语音转换方法
CN103140889A (zh) * 2010-09-29 2013-06-05 Nec卡西欧移动通信株式会社 语音转换装置、便携电话终端、语音转换方法和记录介质
CN102956231A (zh) * 2011-08-23 2013-03-06 上海交通大学 基于半自动校正的语音关键信息记录装置及方法
CN102956231B (zh) * 2011-08-23 2014-12-31 上海交通大学 基于半自动校正的语音关键信息记录装置及方法
CN103324609A (zh) * 2012-03-19 2013-09-25 富士通株式会社 文本校对装置和文本校对方法
CN103324609B (zh) * 2012-03-19 2017-05-03 富士通株式会社 文本校对装置和文本校对方法
CN102831177B (zh) * 2012-07-31 2015-09-02 聚熵信息技术(上海)有限公司 语句纠错方法及其系统
CN102831177A (zh) * 2012-07-31 2012-12-19 聚熵信息技术(上海)有限公司 语句纠错方法及其系统
CN102833633A (zh) * 2012-09-04 2012-12-19 深圳创维-Rgb电子有限公司 一种电视机语音控制系统及方法
CN102833633B (zh) * 2012-09-04 2016-01-20 深圳创维-Rgb电子有限公司 一种电视机语音控制系统及方法
CN105009151A (zh) * 2013-03-07 2015-10-28 日本电气方案创新株式会社 理解辅助系统、理解辅助服务器、理解辅助方法和计算机可读记录介质
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105374356B (zh) * 2014-08-29 2019-07-30 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105654946A (zh) * 2014-12-02 2016-06-08 三星电子株式会社 用于语音识别的设备和方法
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
CN106340295A (zh) * 2015-07-06 2017-01-18 无锡天脉聚源传媒科技有限公司 一种语音识别结果的接受方法及装置
CN106340295B (zh) * 2015-07-06 2019-10-22 无锡天脉聚源传媒科技有限公司 一种语音识别结果的接受方法及装置
CN108140384A (zh) * 2015-10-15 2018-06-08 雅马哈株式会社 信息管理系统和信息管理方法
CN105513586A (zh) * 2015-12-18 2016-04-20 百度在线网络技术(北京)有限公司 语音识别结果的显示方法和装置
CN107293299A (zh) * 2017-06-16 2017-10-24 朱明增 一种提高调度员查找图纸效率的语音识别定位系统
CN109841209A (zh) * 2017-11-27 2019-06-04 株式会社速录抓吧 语音识别设备和系统
CN108831473A (zh) * 2018-03-30 2018-11-16 联想(北京)有限公司 一种音频处理方法及装置
CN108831473B (zh) * 2018-03-30 2021-08-17 联想(北京)有限公司 一种音频处理方法及装置
CN112272847A (zh) * 2019-05-08 2021-01-26 互动解决方案公司 错误转换词典制作系统
CN112272847B (zh) * 2019-05-08 2022-02-11 互动解决方案公司 错误转换词典制作系统及语音识别系统
CN110379214A (zh) * 2019-06-27 2019-10-25 武汉职业技术学院 一种基于语音识别的看图写话训练方法及装置
CN110534112A (zh) * 2019-08-23 2019-12-03 王晓佳 基于位置与时间的分布式语音识别纠错装置及方法

Also Published As

Publication number Publication date
JP2006521578A (ja) 2006-09-21
WO2004086359A3 (en) 2005-01-13
ATE417346T1 (de) 2008-12-15
WO2004086359A2 (en) 2004-10-07
US8447602B2 (en) 2013-05-21
EP1611569B8 (en) 2009-04-15
US20070033026A1 (en) 2007-02-08
DE602004018290D1 (de) 2009-01-22
JP4994834B2 (ja) 2012-08-08
EP1611569A2 (en) 2006-01-04
CN100578615C (zh) 2010-01-06
EP1611569B1 (en) 2008-12-10

Similar Documents

Publication Publication Date Title
CN100578615C (zh) 语音识别系统
EP1787288B1 (en) Automated extraction of semantic content and generation of a structured document from speech
US8666742B2 (en) Automatic detection and application of editing patterns in draft documents
JP2006521578A5 (zh)
KR101292404B1 (ko) 철자 제안을 생성하기 위한 방법 및 시스템
EP2506252B1 (en) Topic specific models for text formatting and speech recognition
US6292771B1 (en) Probabilistic method for natural language processing and for encoding free-text data into a medical database by utilizing a Bayesian network to perform spell checking of words
US20130304453A9 (en) Automated Extraction of Semantic Content and Generation of a Structured Document from Speech
CN1815471A (zh) 信息检索系统、方法和程序
CN1320499C (zh) 用来转录口述和检测人工动作的装置
WO2010117424A2 (en) Computer-assisted abstraction of data and document coding
JP2004534326A5 (zh)
US20160267912A1 (en) Language Dictation Recognition Systems and Methods for Using the Same
CN1667614A (zh) 语言数据日志的压缩
JP4653598B2 (ja) 構文・意味解析装置、音声認識装置、及び構文・意味解析プログラム
US11799891B2 (en) Computer-implemented method of detecting abnormal events in a telecommunication system and telecommunication system
Shah Addressing Clinical Documentation Challenges: The Role of AI-Powered Digital Scribes
Kuvač Kraljević et al. CroDA: Hrvatski diskursni korpus govornika s afazijom
Snow Automatic Detection and Correction of Errors in Video Tutorial Transcripts
CN117669583A (zh) 一种基于本地数据的多策略领域知识精准问答方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: DIFFERENTIAL COMMUNICATION AUSTRIA ROMPLAST-14

Free format text: FORMER OWNER: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Effective date: 20090731

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090731

Address after: Austria Vienna

Applicant after: Koninkl Philips Electronics NV

Address before: Holland Ian Deho Finn

Applicant before: Koninklijke Philips Electronics N.V.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100106

Termination date: 20210322