CN111081253B - 语音处理方法、装置及系统 - Google Patents
语音处理方法、装置及系统 Download PDFInfo
- Publication number
- CN111081253B CN111081253B CN201911357142.2A CN201911357142A CN111081253B CN 111081253 B CN111081253 B CN 111081253B CN 201911357142 A CN201911357142 A CN 201911357142A CN 111081253 B CN111081253 B CN 111081253B
- Authority
- CN
- China
- Prior art keywords
- voice
- service platform
- voice service
- recognition result
- professional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 128
- 230000003993 interaction Effects 0.000 claims description 56
- 238000003745 diagnosis Methods 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明实施例提供一种语音处理方法、装置及系统。本发明实施例通过获取待处理语音信息,从多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,将待处理语音信息发送给目标语音服务平台,以便目标语音服务平台对待处理语音信息进行识别,得到第一识别结果,根据目标语音服务平台返回的第一识别结果生成医学报告,通过从多个通用型语音服务平台中选择处理能力最大的平台进行智能调度,使得待处理语音信息能够及时得到处理,避免需要排队等待的情况,提高了处理效率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种语音处理方法、装置及系统。
背景技术
互联网+医疗的时代已经到来。利用互联网+医疗技术,将一系列医疗手段放于互联网上,使得大城市的大医院的专家能够为来自小城市或偏远地区的患者看病写报告,提升欠发达地区的医疗水平和效率,有效地缓解医疗资源分布不均衡的问题。
图1是相关技术中语音处理系统的结构图。如图1所示,医生专家通过手机等移动终端将有关医疗诊断的语音发送到诊断平台,诊断平台将该语音发送到购买的通用型语音服务平台,通用型语音服务平台将语音转换为文字后返回给诊断平台,诊断平台根据返回的文字内容生成医学报告。这种方式中,当通用型语音服务平台的业务吞吐量比较大时,会出现请求需要排队等待处理的情况,处理效率较低。
发明内容
为克服相关技术中存在的问题,本发明提供了一种语音处理方法、装置及系统,提高处理效率。
根据本发明实施例的第一方面,提供一种语音处理方法,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述方法包括:
获取待处理语音信息;
从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。
根据本发明实施例的第二方面,提供一种语音处理装置,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述装置包括:
获取模块,用于获取待处理语音信息;
确定模块,用于从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
识别模块,用于将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
生成模块,用于根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。
根据本发明实施例的第三方面,提供一种语音处理系统,包括诊断平台、语音交互调度平台以及多个通用型语音服务平台;
所述诊断平台,用于接收客户端发送的待处理语音信息,并将所述待处理语音信息发送给所述语音交互调度平台;
所述语音交互调度平台,用于获取待处理语音信息,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,所述通用型语音服务平台用于对语音进行通用识别,将所述待处理语音信息发送给所述目标语音服务平台,根据所述目标语音服务平台返回的所述第一识别结果生成医学报告,并将生成的医学报告返回给所述诊断平台;
所述通用型语音服务平台,用于接收所述语音交互调度平台发送的所述待处理语音信息,对所述待处理语音信息进行识别,得到第一识别结果并发送给所述语音交互调度平台。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明实施例,通过获取待处理语音信息,从多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,将待处理语音信息发送给目标语音服务平台,以便目标语音服务平台对待处理语音信息进行识别,得到第一识别结果,根据目标语音服务平台返回的第一识别结果生成医学报告,通过从多个通用型语音服务平台中选择处理能力最大的平台进行智能调度,使得待处理语音信息能够及时得到处理,避免需要排队等待的情况,提高了处理效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1是相关技术中语音处理系统的结构图。
图2是本发明实施例提供的语音处理系统的一个示例图。
图3是本发明实施例提供的语音处理方法的流程示例图。
图4是本发明实施例提供的语音处理系统的另一个示例图。
图5是本发明实施例提供的语音处理装置的功能方块图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明实施例的一些方面相一致的装置和方法的例子。
在本发明实施例使用的术语是仅仅出于描述特定本发明实施例的目的,而非旨在限制本发明实施例。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
诊断平台移动端的出现,解决了一些专家总要面临出差,不能在个人计算机PC机前工作的问题。同时,伴随着语音识别技术的发展,可以将医生的语音转化成文字填写在患者的报告中,以解决移动端文字输入速度落后于PC端键盘输入的劣势,又能提升医生的诊疗效率。
如图1所示,相关技术中,每个诊断平台的提供方通常只购买一个通用型语音服务平台的服务,因此,连接到该诊断平台的移动终端发出的语音信息只能通过一个通用型语音服务平台进行识别。
然而,提供通用型语音服务的服务提供商不止一个,不同的通用型语音服务提供商提供不同的通用型语音服务平台,这些通用型语音服务平台都能够提供通用语音识别服务。
相关技术中,诊断平台使用通用型语音服务平台提供的调用方式进行接口调用,将语音发送给通用型语音服务平台进行处理,并通过用轮询或回调的方式从通用型语音服务平台获取语音识别结果。
其中,回调是指语音处理结束后,语音服务平台调用诊断平台之前在请求时提供的回调地址将语音识别结果返回给诊断平台。这种处理方式的弊端是针对多实例的异步请求,容易同时将结果返回,造成雪崩的情况发生,加重诊断平台的负担,而且此种方式还容易造成请求超时。
其中,轮询是指用户端(指诊断平台)每隔一段时间向语音服务平台请求语音处理是否完成,若完成即返回语音识别结果,若没完成则用户端隔一段时间再继续请求。该种方式会浪费诊断平台的网络资源。
相关技术中,各通用型语音服务平台都只能对语音进行通用识别。这里,通用识别是指对语音按照通常的语义进行识别。但是,在医学方面,医生的诊断中通常会使用大量的医学专用术语,对于含有这些专用术语的语音进行通用识别,通常会导致识别结果的错误,导致语音识别的总体识别准确率较低。
下面通过实施例对本发明的语音处理方法进行详细说明。
图2是本发明实施例提供的语音处理系统的一个示例图。如图2所示,本实施例中,语音处理系统包括诊断平台、语音交互调度平台和多个通用型语音服务平台。诊断平台通过语音交互调度平台与多个通用型语音服务平台相连。该多个通用型语音服务平台可以分别属于不同的服务提供商。例如通用型语音服务平台1属于服务提供商A,通用型语音服务平台2属于服务提供商B,……。
基于图2所示的语音处理系统,本发明实施例提供了一种如图3所示的语音处理方法。
图3是本发明实施例提供的语音处理方法的流程示例图。如图3所示,本实施例中,语音处理方法应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;语音处理方法可以包括:
S301,获取待处理语音信息。
S302,从多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;通用型语音服务平台用于对语音进行通用识别。
S303,将待处理语音信息发送给目标语音服务平台,以便目标语音服务平台对待处理语音信息进行识别,得到第一识别结果。
S304,根据目标语音服务平台返回的第一识别结果生成医学报告。
本实施例中,语音交互调度平台可以部署于一个服务器上,也可以部署于由多个服务器组成的服务器集群上。
本实施例中,获取待处理语音信息的方式可以是:语音交互调度平台接收诊断平台发送的待处理语音信息。
在应用中,用户(例如专家医生)可以通过移动终端的语音输入机制将有关诊断信息以语音形式输入到移动终端,移动终端将接收到的语音信息发送给诊断平台。诊断平台接收各个移动终端发来的语音信息,然后按照预设的发送策略将接收到的语音信息发送给语音交互调度平台。诊断平台所使用的发送策略可以采用相关技术中的发送策略,此处不再赘述。
步骤S302中的多个通用型语音服务平台可以是不同服务商提供的通用型语音服务平台。
在一个示例中,语音服务平台的处理能力可以用对语音的处理速度来表示。下面列举语音服务平台的处理能力的两种获取方式。
在一个示例中,每个通用型语音服务平台都具有实时监控并记录自身处理能力的功能。在这种情况下,语音交互调度平台可以直接从各个通用型语音服务平台读取相应平台的处理能力。
因此,在一个示例性的实现过程中,步骤S302中,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,可以包括:
分别从多个通用型语音服务平台中读取处理能力值;
将读取的处理能力值中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
本实施例中,处理能力值可以为处理速度值。
在另一个示例中,通用型语音服务平台不具有实时监控并记录自身处理能力的功能。在这种情况下,语音交互调度平台可以对每个通用型语音服务平台,记录每段语音信息的处理时间(该处理时间可以等于语音交互调度平台发送语音信息的时间、与从通用型语音服务平台接收到该语音信息的识别结果的时间之间的时间差),并根据处理时间和语音信息的大小计算出处理速度,根据一个通用型语音服务平台对各个语音信息的处理速度形成一个处理速度趋势图。语音交互调度平台可以从各个通用型语音服务平台的处理速度趋势图中预测出各个通用型语音服务平台的当前处理速度。
因此,在一个示例性的实现过程中,步骤S302中,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,可以包括:
从当前的处理速度趋势图中获取所述多个通用型语音服务平台中各个通用型语音服务平台的处理速度;
将获取的处理速度中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
通过步骤S302,实现了对通用型语音服务平台的智能调度,可以避免出现请求需要排队等待处理的情况,提高了处理效率。
本实施例中,目标语音服务平台是语音交互调度平台从当前连接的所有通用型语音服务平台选出的处理能力最大的平台,语音交互调度平台将待处理语音信息发送给目标语音服务平台处理,能够使得待处理语音信息及时得到处理,避免需要排队等待的情况,从而提高了处理效率。
从通用型语音服务平台的角度来讲,通过语音交互调度平台的智能调度,可以避免出现某个或某些通用型语音服务平台的业务吞吐量很大、而其他通用型语音服务平台的业务吞吐量比较少的情况,造成某些通用型语音服务平台的资源闲置或使用不足而另一些通用型语音服务平台的资源却使用紧张,使得各个通用型语音服务平台的业务吞吐量与自身的处理能力相匹配,网络资源得到合理分配和使用,提高了网络资源利用率。
本实施例中,第一识别结果是对待处理语音信息进行通用识别后所得到的语音识别结果。
当语音交互调度平台接收到目标语音服务平台返回的第一识别结果后,就可以自动根据第一识别结果生成医学报告。至此,用户通过移动终端输入的语音,经由语音处理系统的处理,最终形成了可供阅读及打印的文字医学报告。该处理过程克服了相关技术中语音处理请求会出现排队等待的情况,更加流畅,效率高。
在一些使用场景中,例如医学领域,通常有一些专业术语,这些专业术语在使用通用型语音服务平台进行通用识别时,往往会存在识别不准确的问题。为了克服该问题,本发明实施例提供了图4所示的语音处理系统,并在图4所示的语音处理系统的基础上,提供了如下的语音处理方案。
图4是本发明实施例提供的语音处理系统的另一个示例图。如图4所示,本实施例提供的语音处理系统在图3所示语音处理系统的基础上,增加了一个专业语音服务平台。专业语音服务平台用于对语音进行专业识别,大大提高了对于专业术语的识别准确率。
在一个示例性的实现过程中,语音处理方法还可以包括:
将所述待处理语音信息发送给专业语音服务平台,以便所述专业语音服务平台对所述待处理语音信息进行专业识别,得到第二识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第二识别结果生成医学报告。
本实施例中,语音交互调度平台将待处理语音信息分别发送给目标语音服务平台进行通用识别和发送给专业语音服务平台进行专业识别,并根据两者的识别结果整合生成医学报告,有效提高了语音识别的准确率。
在一个示例性的实现过程中,所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置;
根据所述第一识别结果和所述第二识别结果生成医学报告,包括:
检测所述第一识别结果中与所述第一位置对应的第二位置处的词语是否为不通顺词语或存在歧义的词语;
若是,用所述专业词语代替所述第一识别结果中所述第二位置处的词语。
待处理语音信息中除了一部分专业术语外,其余的均为常规用语,对于常规用语,通用型语音服务平台的识别准确率足以满足要求,不需要专业语音服务平台进行识别。因此,将整个待处理语音信息发送给专业语音服务平台,需要专业语音服务平台从待处理语音信息中筛选出包含专业术语的语音片段进行处理,这样增加了专业语音服务平台的负担,并且由于语音服务平台通常是根据语音时长来计费的,会带来经济上的浪费。为了解决该问题,本发明提出了如下实施例。
在一个示例性的实现过程中,语音处理方法还可以包括:
确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语;
根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段;
将所述语音片段发送给专业语音服务平台,以便所述专业语音服务平台对所述语音片段进行专业识别,得到第三识别结果;所述专业语音服务平台用于识别语音中的医学用语;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第三识别结果生成医学报告。
本实施例中,语音交互调度平台根据第一识别结果从待处理语音信息中截取语音片段发送给专业语音服务平台进行专业识别,并根据目标语音服务平台和专业语音服务平台两者的识别结果整合生成医学报告,不仅提高了语音识别的准确率,还由于减少了发送给专业语音服务平台的语音时长,减轻了专业语音服务平台的负担,并且减少了待处理语音信息的计费,节省了经济成本。
在一个示例性的实现过程中,语音处理方法还可以包括:
根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;
从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。
本实施例中,根据待处理语音信息的处理时长进行监控轮询,而不是固定时间间隔向语音服务平台进行轮询,一方面可以避免出现雪崩的情况,另一方面还能减少轮询的次数,从而减少网络资源的浪费。
本发明实施例中,专业语音服务平台可以为医学用语语音转换平台。
需要说明的是,当本发明实施例用于除医学外的其他领域时,专业语音服务平台也可以为该其他领域专用的语音服务平台。
需要说明的是,尽管上述以医学中的使用场景进行了举例,但本领域技术人员可以理解,本发明实施例的方法也可以应用到医学领域之外的其他专业技术领域,而并不仅限于医学领域。
本发明实施例提供的语音处理方法,通过获取待处理语音信息,从多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,将待处理语音信息发送给目标语音服务平台,以便目标语音服务平台对待处理语音信息进行识别,得到第一识别结果,根据目标语音服务平台返回的第一识别结果生成医学报告,通过从多个通用型语音服务平台中选择处理能力最大的平台进行智能调度,使得待处理语音信息能够及时得到处理,避免需要排队等待的情况,提高了处理效率。
基于上述的方法实施例,本发明实施例还提供了相应的装置、系统及存储介质实施例。
图5是本发明实施例提供的语音处理装置的功能方块图。如图5所示,本实施例中,语音处理装置应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;语音处理装置可以包括:
获取模块510,用于获取待处理语音信息;
确定模块520,用于从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
识别模块530,用于将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
生成模块540,用于根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。
在一个示例性的实现过程中,所述装置还可以包括:
第一发送模块,用于将所述待处理语音信息发送给专业语音服务平台,以便所述专业语音服务平台对所述待处理语音信息进行专业识别,得到第二识别结果;
生成模块540在根据所述第一识别结果生成医学报告时,可以具体用于:根据所述第一识别结果和所述专业语音服务平台返回的所述第二识别结果生成医学报告。
在一个示例性的实现过程中,所述装置还可以包括:
第二发送模块,用于确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语;
根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段;
将所述语音片段发送给专业语音服务平台,以便所述专业语音服务平台对所述语音片段进行专业识别,得到第三识别结果;所述专业语音服务平台用于识别语音中的医学用语;
生成模块540在根据所述第一识别结果生成医学报告时,可以具体用于:根据所述第一识别结果和所述专业语音服务平台返回的所述第三识别结果生成医学报告。
在一个示例性的实现过程中,所述装置还可以包括:
时长确定模块,用于根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;
监控请求模块,用于从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。
在一个示例性的实现过程中,确定模块520可以具体用于:
分别从所述多个通用型语音服务平台中读取处理能力值;
将读取的处理能力值中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
在一个示例性的实现过程中,确定模块520可以具体用于:
从当前的处理速度趋势图中获取所述多个通用型语音服务平台中各个通用型语音服务平台的处理速度;
将获取的处理速度中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
在一个示例性的实现过程中,所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置;
根据所述第一识别结果和所述第二识别结果生成医学报告,包括:
检测所述第一识别结果中与所述第一位置对应的第二位置处的词语是否为不通顺词语或存在歧义的词语;
若是,用所述专业词语代替所述第一识别结果中所述第二位置处的词语。
在一个示例性的实现过程中,所述专业语音服务平台为医学用语语音转换平台。
本发明实施例还提供了一种语音处理系统,该系统可以包括诊断平台、语音交互调度平台以及多个通用型语音服务平台;
所述诊断平台,用于接收客户端发送的待处理语音信息,并将所述待处理语音信息发送给所述语音交互调度平台;
所述语音交互调度平台,用于获取待处理语音信息,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,所述通用型语音服务平台用于对语音进行通用识别,将所述待处理语音信息发送给所述目标语音服务平台,根据所述目标语音服务平台返回的所述第一识别结果生成医学报告,并将生成的医学报告返回给所述诊断平台;
所述通用型语音服务平台,用于接收所述语音交互调度平台发送的所述待处理语音信息,对所述待处理语音信息进行识别,得到第一识别结果并发送给所述语音交互调度平台。
在一个示例性的实现过程中,所述系统还可以包括专业语音服务平台;
所述语音交互调度平台,还用于将所述待处理语音信息发送给专业语音服务平台;以及用于根据所述第一识别结果和第二识别结果生成医学报告;
所述专业语音服务平台,用于对所述待处理语音信息进行识别,得到第二识别结果并发送给所述语音交互调度平台。
在一个示例性的实现过程中,所述系统还可以专业语音服务平台;
所述语音交互调度平台,还用于确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语,根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段,将所述语音片段发送给专业语音服务平台;以及用于根据所述第一识别结果和第三识别结果生成医学报告;
所述专业语音服务平台,用于对所述语音片段进行识别,得到第三识别结果并发送给所述语音交互调度平台。
本发明实施例提供的语音处理系统可以如图2或图4所示。本发明实施例提供的语音处理系统中,语音交互调度平台可以执行前述的任一种语音处理方法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如下操作:
获取待处理语音信息;
从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
根据所述目标语音服务平台返回的所述第一识别结果生成医学报告。
在一个示例性的实现过程中,所述程序被处理器执行时还实现如下操作:
将所述待处理语音信息发送给专业语音服务平台,以便所述专业语音服务平台对所述待处理语音信息进行专业识别,得到第二识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第二识别结果生成医学报告。
在一个示例性的实现过程中,所述程序被处理器执行时还实现如下操作:
确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语;
根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段;
将所述语音片段发送给专业语音服务平台,以便所述专业语音服务平台对所述语音片段进行专业识别,得到第三识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第三识别结果生成医学报告。
在一个示例性的实现过程中,所述程序被处理器执行时还实现如下操作:
根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;
从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。
在一个示例性的实现过程中,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,包括:
分别从所述多个通用型语音服务平台中读取处理能力值;
将读取的处理能力值中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
在一个示例性的实现过程中,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,包括:
从当前的处理速度趋势图中获取所述多个通用型语音服务平台中各个通用型语音服务平台的处理速度;
将获取的处理速度中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
在一个示例性的实现过程中,所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置;
根据所述第一识别结果和所述第二识别结果生成医学报告,包括:
检测所述第一识别结果中与所述第一位置对应的第二位置处的词语是否为不通顺词语或存在歧义的词语;
若是,用所述专业词语代替所述第一识别结果中所述第二位置处的词语。
在一个示例性的实现过程中,所述专业语音服务平台为医学用语语音转换平台。
对于装置和设备实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
Claims (6)
1.一种语音处理方法,其特征在于,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述方法包括:
获取待处理语音信息;
从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
根据所述目标语音服务平台返回的所述第一识别结果生成医学报告;
确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语;
根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段;
将所述语音片段发送给专业语音服务平台,以便所述专业语音服务平台对所述语音片段进行专业识别,得到第三识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第三识别结果生成医学报告;
或,将所述待处理语音信息发送给专业语音服务平台,以便所述专业语音服务平台对所述待处理语音信息进行专业识别,得到第二识别结果;
根据所述第一识别结果生成医学报告,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第二识别结果生成医学报告;
所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置,所述语音交互调度平台将待处理语音信息分别发送给目标语音服务平台和发送给专业语音服务平台,所述专业语音服务平台输出第二识别结果;
根据所述第一识别结果和所述第二识别结果生成医学报告,包括:
检测所述第一识别结果中与所述第一位置对应的第二位置处的词语是否为不通顺词语或存在歧义的词语;
若是,用所述专业词语代替所述第一识别结果中所述第二位置处的词语;
根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;
从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。
2.根据权利要求1所述的方法,其特征在于,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,包括:
分别从所述多个通用型语音服务平台中读取处理能力值;
将读取的处理能力值中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
3.根据权利要求1所述的方法,其特征在于,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,包括:
从当前的处理速度趋势图中获取所述多个通用型语音服务平台中各个通用型语音服务平台的处理速度;
将获取的处理速度中的最大值对应的通用型语音服务平台确定为目标语音服务平台。
4.根据权利要求1所述的方法,其特征在于,所述专业语音服务平台为医学用语语音转换平台。
5.一种语音处理装置,其特征在于,应用于语音交互调度平台,所述语音交互调度平台与多个通用型语音服务平台相连;所述装置包括:
获取模块,用于获取待处理语音信息;
确定模块,用于从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台;所述通用型语音服务平台用于对语音进行通用识别;
识别模块,用于将所述待处理语音信息发送给所述目标语音服务平台,以便所述目标语音服务平台对所述待处理语音信息进行识别,得到第一识别结果;
生成模块,用于根据所述目标语音服务平台返回的所述第一识别结果生成医学报告;
待校正词语确定模块,用于确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语;
截取模块,用于根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段;
专业识别模块,用于将所述语音片段发送给专业语音服务平台,以便所述专业语音服务平台对所述语音片段进行专业识别,得到第三识别结果;
所述生成模块,在用于根据所述第一识别结果生成医学报告时,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第三识别结果生成医学报告;
第二识别结果获取模块,用于将所述待处理语音信息发送给专业语音服务平台,以便所述专业语音服务平台对所述待处理语音信息进行专业识别,得到第二识别结果;
所述生成模块,在用于根据所述第一识别结果生成医学报告时,包括:
根据所述第一识别结果和所述专业语音服务平台返回的所述第二识别结果生成医学报告;
所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置,所述语音交互调度平台将待处理语音信息分别发送给目标语音服务平台和发送给专业语音服务平台,所述专业语音服务平台输出第二识别结果;
所述生成模块,在用于根据所述第一识别结果和所述第二识别结果生成医学报告时,包括:
检测所述第一识别结果中与所述第一位置对应的第二位置处的词语是否为不通顺词语或存在歧义的词语;
若是,用所述专业词语代替所述第一识别结果中所述第二位置处的词语;
处理时长确定模块,用于根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;
报告请求模块,用于从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。
6.一种语音处理系统,其特征在于,包括诊断平台、语音交互调度平台以及多个通用型语音服务平台;
所述诊断平台,用于接收客户端发送的待处理语音信息,并将所述待处理语音信息发送给所述语音交互调度平台;
所述语音交互调度平台,用于获取待处理语音信息,从所述多个通用型语音服务平台中确定当前处理能力最大的目标语音服务平台,所述通用型语音服务平台用于对语音进行通用识别,将所述待处理语音信息发送给所述目标语音服务平台,根据所述目标语音服务平台返回的第一识别结果生成医学报告,并将生成的医学报告返回给所述诊断平台;
所述通用型语音服务平台,用于接收所述语音交互调度平台发送的所述待处理语音信息,对所述待处理语音信息进行识别,得到第一识别结果并发送给所述语音交互调度平台;
所述系统还包括专业语音服务平台;
所述语音交互调度平台,还用于确定所述第一识别结果中的待校正词语,所述待校正词语为不通顺词语或存在歧义的词语,根据所述待校正词语在所述第一识别结果中的位置,从所述待处理语音信息中截取相应的语音片段,将所述语音片段发送给专业语音服务平台;以及用于根据所述第一识别结果和第三识别结果生成医学报告;
所述专业语音服务平台,用于对所述语音片段进行识别,得到第三识别结果并发送给所述语音交互调度平台;
所述语音交互调度平台,还用于将所述待处理语音信息发送给专业语音服务平台;以及用于根据所述第一识别结果和第二识别结果生成医学报告;
所述专业语音服务平台,还用于对所述待处理语音信息进行识别,得到第二识别结果并发送给所述语音交互调度平台;
所述语音交互调度平台,还用于将待处理语音信息分别发送给目标语音服务平台和发送给专业语音服务平台,所述专业语音服务平台输出第二识别结果,所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置;以及检测所述第一识别结果中与所述第一位置对应的第二位置处的词语是否为不通顺词语或存在歧义的词语;若是,用所述专业词语代替所述第一识别结果中所述第二位置处的词语;
所述专业语音服务平台,还用于对所述待处理语音信息进行识别,得到第二识别结果并发送给所述语音交互调度平台,所述第二识别结果包括专业词语和专业词语在所述待处理语音信息中所处的第一位置;
所述语音交互调度平台,还用于根据所述待处理语音信息的时长和所述目标语音服务平台的当前处理速度,确定处理时长;从发送所述待处理语音信息给所述目标语音服务平台的时刻开始计时,当计时时长达到所述处理时长时,向所述目标语音服务平台请求返回所述医学报告。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911357142.2A CN111081253B (zh) | 2019-12-25 | 2019-12-25 | 语音处理方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911357142.2A CN111081253B (zh) | 2019-12-25 | 2019-12-25 | 语音处理方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111081253A CN111081253A (zh) | 2020-04-28 |
CN111081253B true CN111081253B (zh) | 2023-07-28 |
Family
ID=70317665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911357142.2A Active CN111081253B (zh) | 2019-12-25 | 2019-12-25 | 语音处理方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111081253B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104795069A (zh) * | 2014-01-21 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
CN105931644A (zh) * | 2016-04-15 | 2016-09-07 | 广东欧珀移动通信有限公司 | 一种语音识别方法及移动终端 |
CN109410923A (zh) * | 2018-12-26 | 2019-03-01 | 中国联合网络通信集团有限公司 | 语音识别方法、装置、系统及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102437689B1 (ko) * | 2015-09-16 | 2022-08-30 | 삼성전자주식회사 | 음성 인식 서버 및 그 제어 방법 |
CN106356066A (zh) * | 2016-08-30 | 2017-01-25 | 孟玲 | 一种基于云计算的语音识别系统 |
CN110335595A (zh) * | 2019-06-06 | 2019-10-15 | 平安科技(深圳)有限公司 | 基于语音识别的插问对话方法、装置及存储介质 |
-
2019
- 2019-12-25 CN CN201911357142.2A patent/CN111081253B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104795069A (zh) * | 2014-01-21 | 2015-07-22 | 腾讯科技(深圳)有限公司 | 语音识别方法和服务器 |
CN105931644A (zh) * | 2016-04-15 | 2016-09-07 | 广东欧珀移动通信有限公司 | 一种语音识别方法及移动终端 |
CN109410923A (zh) * | 2018-12-26 | 2019-03-01 | 中国联合网络通信集团有限公司 | 语音识别方法、装置、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111081253A (zh) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109514586B (zh) | 实现智能客服机器人的方法及系统 | |
CN110008045B (zh) | 微服务的聚合方法、装置、设备及存储介质 | |
CN109104336B (zh) | 服务请求处理方法、装置、计算机设备及存储介质 | |
US20140301218A1 (en) | Statistical analysis and prompting method and system for mobile terminal internet traffic | |
CN110708212B (zh) | 分布式系统中调用链路的追踪方法及装置 | |
CN112486592B (zh) | 分布式数据处理方法、装置、服务器及可读存储介质 | |
CN112702228B (zh) | 服务限流响应方法、装置、电子设备及可读存储介质 | |
CN112382406A (zh) | 传染病的基本再生数的估算方法及装置、介质和设备 | |
CN112835632A (zh) | 一种端能力的调用方法、设备和计算机存储介质 | |
WO2022068183A1 (zh) | 配置生成方法、装置、电子设备及存储介质 | |
CN113823282A (zh) | 语音处理方法、系统和装置 | |
CN111081253B (zh) | 语音处理方法、装置及系统 | |
CN112732547B (zh) | 业务测试方法、装置、存储介质及电子设备 | |
CN111309407A (zh) | 集成第三方库的处理方法及装置 | |
CN111145033A (zh) | 服务项目的领取权限处理方法及装置、存储介质 | |
CN112783500B (zh) | 编译优化信息生成方法、装置及电子设备 | |
CN112817922A (zh) | 日志动态打印方法、装置、计算机设备及存储介质 | |
CN112131468A (zh) | 推荐系统中的数据处理方法、装置 | |
CN112104980B (zh) | 辅助终端定位的方法、装置 | |
CN117611205B (zh) | 基于大数据的数据分析方法、装置及存储介质 | |
CN111090485B (zh) | 面向多集群的帮助数据处理方法及装置、介质和设备 | |
CN117111829A (zh) | 文件存储方法、装置、存储介质及电子设备 | |
CN110716963A (zh) | 提供自适应配置的用户数据的方法及相关设备 | |
CN118226996A (zh) | 一种问卷数据获取方法、装置、计算机设备和存储介质 | |
CN113377501A (zh) | 数据处理方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240208 Address after: 110167 No. 177-1 Innovation Road, Hunnan District, Shenyang City, Liaoning Province Patentee after: Shenyang Neusoft Medical Systems Co.,Ltd. Country or region after: China Address before: Room 336, 177-1, Chuangxin Road, Hunnan New District, Shenyang City, Liaoning Province Patentee before: Shenyang advanced medical equipment Technology Incubation Center Co.,Ltd. Country or region before: China |
|
TR01 | Transfer of patent right |