CN112651854A - 语音调度方法、装置、电子设备和存储介质 - Google Patents
语音调度方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112651854A CN112651854A CN202011540140.XA CN202011540140A CN112651854A CN 112651854 A CN112651854 A CN 112651854A CN 202011540140 A CN202011540140 A CN 202011540140A CN 112651854 A CN112651854 A CN 112651854A
- Authority
- CN
- China
- Prior art keywords
- text
- scheduling
- candidate
- voice
- transcription
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 239000000463 material Substances 0.000 claims abstract description 262
- 238000013518 transcription Methods 0.000 claims abstract description 130
- 230000035897 transcription Effects 0.000 claims abstract description 130
- 239000012769 display material Substances 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种语音调度方法、装置、电子设备和存储介质,其中方法包括:确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;展示所述调度材料。本发明提供的方法、装置、电子设备和存储介质,实现了材料的自动调度,调度过程无需人工参与,省时省力,应用在庭审场景时可以有效提高证据出示效率。再者,基于文本的拼音信息匹配,具有更高的容错率,降低了语音调度的硬件成本需求,扩宽了语音调度的适用范围。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语音调度方法、装置、电子设备和存储介质。
背景技术
证据出示作为法庭辩论、案件判决的重要环节,在司法案件的开庭审理过程中频繁出现。
目前的证据出示,多是直接在法庭上传阅展示纸质材料,或者由工作人员通过电脑等展示设备对证据图片及试听材料进行查找和展示。频繁的证据查找和传阅出示,费时费力,容易打断庭审节奏,延长庭审时间,造成司法资源的浪费。如何提高证据出示效率,成为了亟待解决的问题。
发明内容
本发明提供一种语音调度方法、装置、电子设备和存储介质,用以解决现有技术中证据出示费时费力的缺陷。
本发明提供一种语音调度方法,包括:
确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;
将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;
展示所述调度材料。
根据本发明提供一种的语音调度方法,所述将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料,包括:
确定当前展示材料;
若所述转写文本与所述当前展示材料的文本拼音信息匹配失败,则将所述转写文本与除所述当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定所述调度材料;
否则确定所述当前展示材料为所述调度材料。
根据本发明提供一种的语音调度方法,所述将所述转写文本与除所述当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定所述调度材料,包括:
基于案件提纲中的目录,确定所述当前展示材料的下一展示材料;
若所述转写文本与所述下一展示材料的文本拼音信息匹配失败,则将所述转写文本分别与所述案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定所述调度材料;
否则确定所述下一展示材料为所述调度材料。
根据本发明提供一种的语音调度方法,所述将所述转写文本分别与所述案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定所述调度材料,包括:
若所述转写文本分别与所述案件提纲的内容文本和各候选材料的内容文本拼音信息匹配失败,则将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定所述调度文件;
若所述转写文本与所述案件提纲的内容文本拼音信息匹配成功,则确定与所述转写文本相匹配的所述案件提纲的内容文本所指示的候选材料为所述调度材料;
若所述转写文本与任一候选材料的内容文本拼音信息成功,则确定所述任一候选材料为所述调度材料。
根据本发明提供一种的语音调度方法,所述将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定所述调度文件,包括:
将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,得到若干个与所述转写文本相匹配的所述案件提纲的标题文本和/或若干个与所述转写文本相匹配的所述候选材料的标题文本作为候选标题文本;
基于各候选标题文本的来源权重和匹配度权重,确定各候选标题文本的匹配得分;
确定所述匹配得分最高的候选标题文本对应的候选材料为所述调度文本。
根据本发明提供一种的语音调度方法,所述基于各候选标题文本的来源权重和匹配度权重,确定各候选标题文本的匹配得分,包括:
基于各候选标题文本的来源权重和匹配度权重,以及各候选标题文本的调度权重,确定各候选标题文本的匹配得分;
所述调度权重是基于所述候选标题对应候选材料的历史调度频次确定的。
根据本发明提供一种的语音调度方法,拼音信息是对应文本的拼音首字母序列;
所述将所述转写文本与各候选材料的文本进行拼音信息匹配,包括:
对任一候选材料的文本进行拆分,得到若干段区间文本;
将所述转写文本与任一区间文本进行拼音首字母序列匹配;
若所述转写文本的拼音首字母序列与所述任一区间文本的拼音首字母序列的字母重合数大于预设阈值,且重合的拼音首字母顺序一致,则确定所述转写文本与所述任一候选材料的文本拼音信息匹配成功。
本发明还提供一种语音调度装置,包括:
语音转写单元,用于确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;
拼音匹配单元,用于将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;
调度单元,用于展示所述调度材料。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述语音调度方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音调度方法的步骤。
本发明提供的语音调度方法、装置、电子设备和存储介质,通过对调度语音进行语音转写所得的转写文本与各候选材料的文本进行匹配,从而实现材料的自动调度,调度过程无需人工参与,省时省力,应用在庭审场景时可以有效提高证据出示效率。再者,基于文本的拼音信息匹配,相较于通用的文本匹配,具有更高的容错率,能够减轻语音转写阶段引入的干扰对于材料匹配的影响,在提高语音调度的成功率降低了对于语音转写的准确性的要求,降低了语音调度的硬件成本需求,扩宽了语音调度的适用范围。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的语音调度方法的流程示意图之一;
图2是本发明提供的语音调度方法中步骤120的实施方式的流程示意图;
图3是本发明提供的语音调度方法中步骤122的实施方式的流程示意图;
图4是本发明提供的语音调度方法中步骤1222的实施方式的流程示意图;
图5是本发明提供的语音调度方法中步骤1222-1的实施方式的流程示意图;
图6是本发明提供的语音调度方法中拼音信息匹配的流程示意图;
图7是本发明提供的语音调度方法的流程示意图之二;
图8是本发明提供的语音调度装置的结构示意图;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着电子卷宗在政法机关内部的普及,进一步加强电子卷宗的深度应用,利用信息化、智能化手段服务司法工作成为必然趋势。运用自然语言处理技术,通过庭审现场检察官、律师等庭审参与者对于案件材料的口头宣读,实现语音内容的智能转化,提供了自动调度符合庭审进程的证据材料的可能。而目前已有的语音调度方案,是在默认语音转写结果绝对准确的前提下执行的,并未能考虑到离线场景下语音转写结果不准确的情况。
针对上述问题,本发明实施例提供了一种语音调度方法,该方法可以应用于庭审过程中的证据调度,也可以应用于其他需要通过语音进行材料调度的场景,例如讲座、课堂等。图1是本发明提供的语音调度方法的流程示意图之一,如图1所示,该方法包括:
步骤110,确定调度语音,对调度语音进行语音转写,得到调度语音的转写文本。
此处,调度语音即用于进行材料调度的语音,通常是由场景下的音频采集设备采集得到的。例如在庭审场景下,检察官或者律师可以同时作为证据出示发起人和材料调度操作者,通常可以携带便携式设备进入庭审现场并连接庭审大屏,通过便携式设备自带的麦克风进行调度语音的采集,此处的便携设备可以是平板电脑、笔记本电脑等;又例如,在庭审场景下,检察官或者律师作为证据出示发起人,法官或者书记员作为材料调度操作者,可以通过庭审现场的麦克风进行拾音,并将拾音所得的调度语音传输到庭审相关的电脑或者服务器中进行后续流程。
在得到调度语音后,即可对调度语音进行语音转写,此处语音转写的操作可以通过本地预先安装好的离线语音引擎实现,也可以是通过网络连接的方式将调度语音发送到具备语音转写功能的服务器上,由服务器对于调度语音进行语音转写,并返回调度语音的转写文本。
步骤120,将转写文本与各候选材料的文本进行拼音信息匹配,确定与转写文本相匹配的候选材料为调度材料。
考虑到庭审现场可用于语音转写的处理设备,例如平板电脑、笔记本电脑或者一体机等,普遍轻量化,仅能够支持占用资源较少的离线语音引擎,而由此得到的转写文本的准确率可能较低。如果按照通用的文本匹配方式直接进行匹配,极有可能由于转写文本本身不准确导致匹配失败,影响自动调度的成功率,对此,本发明实施例中通过拼音信息匹配的方式,为转写文本选取对应的调度材料。
此处,候选材料即可用于语音调度的材料,候选材料通常有多个,具体到庭审场景下,候选材料即需要示出的证据,可以是庭审案件的案件卷宗,例如言辞笔录、证人证言、鉴定意见等,也可以是庭审案件的多媒体证据,例如照片证据、音频证据、视频证据等。
对应于不同类型的候选材料,候选材料的文本也不相同,例如卷宗类的候选材料,其文本可以是卷宗的标题和/或卷宗的内容,多媒体类的候选材料,其文本可以是多媒体证据的标题和/或多媒体证据对应的描述类文本。
在针对转写文本和各候选材料的文本进行匹配时,具体应用了拼音信息匹配,此处的拼音信息可以是文本中各字的首字母组成的序列,也可以是文本中各字的全拼组成的序列等。相较于直接应用文本进行匹配,应用拼音信息从发音相似度的维度上进行匹配,具备了更高的容错率,能够减轻语音转写阶段引入的干扰对于材料匹配的影响,提高材料匹配的成功率。
在此基础上,拼音信息匹配成功的候选材料即可作为转写文本对应的调度材料,即调度语音实际上指示调度的材料。
步骤130,展示调度材料。
具体地,在确定调度材料后,即可展示调度材料,从而完成基于语音的材料自动调度。例如在庭审场景下,如果确定调度材料为案件卷宗,则可以直接展示案件卷宗,如果确定调度材料为多媒体证据,则可以展示多媒体证据的标题,或者展示多媒体证据的标题和描述文本,在接收到指示播放的语音指令后,再进行多媒体证据本身的展示。
本发明实施例提供的方法,通过对调度语音进行语音转写所得的转写文本与各候选材料的文本进行匹配,从而实现材料的自动调度,调度过程无需人工参与,省时省力,应用在庭审场景时可以有效提高证据出示效率。再者,基于文本的拼音信息匹配,相较于通用的文本匹配,具有更高的容错率,能够减轻语音转写阶段引入的干扰对于材料匹配的影响,在提高语音调度的成功率降低了对于语音转写的准确性的要求,降低了语音调度的硬件成本需求,扩宽了语音调度的适用范围。
基于上述实施例,图2是本发明提供的语音调度方法中步骤120的实施方式的流程示意图,如图2所示,步骤120包括:
步骤121,确定当前展示材料。
此处,当前展示材料即当前时刻正在展示的材料,当前展示材料同样属于各候选材料中的一个。
步骤122,若转写文本与当前展示材料的文本拼音信息匹配失败,则将转写文本与除当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定调度材料;
步骤123,否则确定当前展示材料为调度材料。
考虑到庭审过程中,证据出示发起人可能会在一段时间内对单个材料进行讲解说明,当时时刻采集所得的调度语音可能起到的是承上启下的作用,即用于指示下一个需要展示的材料,也可能是对于当前正在展示的材料的讲解说明。因此在将转写文本与各个候选材料的文本进行匹配的过程中,可以首先将转写文本与当前展示材料的文本进行拼音信息匹配,如果匹配成功,说明调度语音实际上是对当前展示材料的讲解说明,直接将当前展示材料作为调度材料持续展示,无需再对其余候选材料进行逐一匹配;如果匹配失败,说明调度语音指示的并非当前展示材料,需要从除当前展示材料之外的其他候选材料中选取调度材料。
本发明实施例提供的方法,在匹配过程中,首先将转写文本与当前展示材料的文本进行匹配,从而分析判断调度语音是否是针对当前展示材料的讲解说明,如果匹配成功则结束匹配流程,从最小范围入手进行匹配,能够在实际匹配过程中有效减少文本匹配占用的资源量,提高匹配效率,保证语音调度的及时性。
基于上述任一实施例,图3是本发明提供的语音调度方法中步骤122的实施方式的流程示意图,如图3所示,步骤122中,所述将转写文本与除当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定调度材料,包括:
步骤1221,基于案件提纲中的目录,确定当前展示材料的下一展示材料。
具体地,案件提纲是用于反映案件的庭审流程,包括庭审流程中涉及到的各个材料以及材料的展示顺序、相关描述等信息。案件提纲中的目录,反映的是预先设定好的各个候选材料的展示顺序。在确定当前展示材料后,即可通过目录直接定位下一展示材料,此处的下一展示材料即根据目录指示的顺序衔接在当前展示材料之后展示的材料,下一展示材料同样属于各候选材料中一个。
步骤1222,若转写文本与下一展示材料的文本拼音信息匹配失败,则将转写文本分别与案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定调度材料;
步骤1223,否则确定下一展示材料为调度材料。
具体地,案件提纲中的目录虽然反映了预先设定好的展示顺序,在当前展示材料展示结束后,存在较大概率继续展示下一展示材料。但是在实际庭审过程中,真实的展示顺序未必与案件提纲中目录指示的顺序完全一致。因此,在确定调度材料并非当前展示材料之后,可以优先将转写文本与下一展示材料的文本进行拼音信息匹配,如果匹配成功,则说明目前的庭审流程与案件提纲中的目录维持一致,可以将下一展示材料作为调度材料,无需再对其余候选材料进行逐一匹配;如果匹配失败,说明目前的庭审流程并未按照案件提供中的目标所指示的顺序执行,需要从其他候选材料中选取调度材料。
本发明实施例提供的方法,在明确当前展示材料并非调度材料的情况下,可以优先将转写文本与下一展示材料的文本进行匹配,如果匹配成功则结束匹配流程,从尽量小的范围入手进行匹配,能够在实际匹配过程中有效减少文本匹配占用的资源量,提高匹配效率,保证语音调度的及时性。
基于上述任一实施例,图4是本发明提供的语音调度方法中步骤1222的实施方式的流程示意图,如图4所示,步骤1222中,所述将转写文本分别与案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定调度材料,包括:
步骤1222-1,若转写文本分别与案件提纲的内容文本和各候选材料的内容文本拼音信息匹配失败,则将转写文本分别与案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定调度文件;
步骤1222-2,若转写文本与案件提纲的内容文本拼音信息匹配成功,则确定与转写文本相匹配的案件提纲的内容文本所指示的候选材料为调度材料;
步骤1222-3,若转写文本与任一候选材料的内容文本拼音信息成功,则确定该候选材料为调度材料。
具体地,案件提纲和各候选材料的文本,均可以划分为两个部分,一部分为标题文本,另一部分为内容文本。
其中,案件提纲的标题文本即案件提纲中涉及到的各类标题对应的文本,此处的标题可以是对于各候选材料进行分类所得的类型名称,案件提纲的内容文本即案件提纲中除标题文本以外的其他文本,例如案件提纲中涉及到的反映各个候选材料展示顺序、相关描述等信息对应的文本。候选材料的标题文本即候选材料的标题对应的文本,候选材料的内容文本即候选材料内包含的文本,例如案件卷宗类型的候选材料,其内容文本即卷宗内容,又例如多媒体证据类型的候选材料自身可能不包含文本,其内容文本可以为空,也可以是预先编辑的多媒体证据的描述性文本。
通常而言,内容文本包含有相比标题文本更加丰富、更细粒度的信息,在将转写文本分别与案件提纲的文本和各候选材料的文本进行拼音信息匹配时,可以优先将转写文本分别与案件提纲的内容文本和各候选材料的内容文本进行匹配,如果转写文本与任一候选材料的内容文本拼音信息匹配成功,则可以确定该候选材料即调度材料;如果转写文本与案件提纲的内容文本拼音信息匹配成功,则可以定位案件提纲的内容文本中与转写文本相匹配的文本,从而确定相匹配的文本所指示的候选材料为调度文本;如果转写文本与案件提纲的内容文本以及各候选材料的内容文本匹配均失败,则需要进一步将转写文本分别与案件提纲的标题文本以及各候选材料的标题文本进行匹配,以确定调度材料。
本发明实施例提供的方法,预先对案件提纲和各候选材料的文本进行了划分,将内容文本与标题文本进行区分匹配,并优先匹配转写文本与案件提纲和各候选材料的内容文本,从而保证匹配准确率,提高语音调度的成功率。
基于上述任一实施例,图5是本发明提供的语音调度方法中步骤1222-1的实施方式的流程示意图,如图5所示,步骤1222-1中,将转写文本分别与案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定调度文件,包括:
步骤1222-1-1,将转写文本分别与案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,得到若干个与转写文本相匹配的案件提纲的标题文本和/或若干个与转写文本相匹配的候选材料的标题文本作为候选标题文本;
步骤1222-1-2,基于各候选标题文本的来源权重和匹配度权重,确定各候选标题文本的匹配得分;
步骤1222-1-3,确定匹配得分最高的候选标题文本对应的候选材料为调度文本。
具体地,将转写文本分别与案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,可以得到若干个与转写文本相匹配的案件提纲的标题文本,或者得到若干个与转写文本相匹配的候选材料的标题文本,再或者得到若干个与转写文本相匹配的案件提纲的标题文本和若干个与转写文本相匹配的候选材料的标题文本。当与转写文本相匹配的标题文本的数量大于1时,可以将相匹配的标题文本均视为候选标题文本,需要多个候选标题文本中选取出一个作为最匹配的标题文本。
各候选标题文本的来源权重是基于各候选标题文本的来源确定的,此处候选标题文本的来源用于表示该候选标题文本是来自候选材料,还是来自案件提纲。考虑到案件提纲的标题文本较多情况下表示的各候选材料进行分类所得的类型名称,具有更高的概括性和更广的覆盖面,可以预先将来源是案件提纲的候选标题文本的来源权重设置得较来源是候选材料的候选标题文本的来源权重更高一点。
各候选标题文本的匹配度权重是基于各候选标题文本与转写文本的拼音信息匹配度确定的,匹配度越高,则对应地匹配度权重越高。
结合此两者,即可计算得到各个候选标题文本的匹配得分,例如可以将来源权重和匹配度权重的乘积作为匹配得分,或者将来源权重和匹配度权重之和作为匹配得分,本发明实施例对此不作具体限定。
在得到各个候选标题文本的匹配得分后,即可从中选取匹配得分最高的候选标题文本,并将该候选标题文本对应候选材料作为调度文本。
基于上述任一实施例,步骤1222-1-2包括:
基于各候选标题文本的来源权重和匹配度权重,以及各候选标题文本的调度权重,确定各候选标题文本的匹配得分;所述调度权重是基于所述候选标题对应候选材料的历史调度频次确定的。
具体地,在计算各候选标题文本的匹配得分时,不仅可以考虑各候选标题文本的来源权重和匹配度权重,还可以考虑各候选标题文本的调度权重。此处的调度权重用于表示标题文本对应的候选材料在之前的庭审场景下被调度的频率和次数等信息,即候选材料的历史调度频次。通常,历史调度频次越高,相对应的调度权重越高,该候选标题文本被选中的概率越高。
此处,历史调度频次的获取可以通过预先在庭审场景下应用的小型机或者服务处设置埋点数据,并定期回收,从而统计得到历次庭审时各个候选材料被调度的频次,进而得到历史调度频次以更新各个标题文本的调度权重,从而不断优化语音调度的匹配规则。
本发明实施例提供的方法,结合历史调度频次动态调整标题文本的调度权重,从而实现特定场景的针对性优化,定向提升调度效果。
基于上述任一实施例,拼音信息是对应文本的拼音首字母序列。
相应地,图6是本发明提供的语音调度方法中拼音信息匹配的流程示意图,如图6所示,步骤120中,将转写文本与各候选材料的文本进行拼音信息匹配,包括:
步骤610,对任一候选材料的文本进行拆分,得到若干段区间文本;
步骤620,将转写文本与任一区间文本进行拼音首字母序列匹配;
步骤630,若转写文本的拼音首字母序列与该区间文本的拼音首字母序列的字母重合数大于预设阈值,且重合的拼音首字母顺序一致,则确定转写文本与该候选材料的文本拼音信息匹配成功。
具体地,以下以任一候选材料的文本为例,说明转写文本与候选材料的文本进行拼音信息匹配的流程。针对任一候选材料的文本而言,文本本身可能比较长,可以基于预先设置好的拆分规则,对候选材料的文本进行拆分,从而使得较长的语段可以拆分为多个长度在预设长度阈值内的区间文本,例如可以以50个字为一段的规则对候选材料的文本进行拆分。
在得到若干段区间文本后,可以将转写文本分别与各段区间文本进行拼音首字母序列匹配。如果转写文本的拼音首字母序列与该区间文本的拼音首字母序列中重合的首字母数大于预设阈值,且重合的拼音首字母在对应序列中的顺序是一致的,则可以确定匹配成功。此处,不同类型的文本,可以对应不同的预设阈值。内容文本和标题文本可以对应不同的预设阈值,此外考虑到标题文本通常较短,可以不对标题文本进行拆分,直接应用标题文本进行匹配。例如,转写文本的拼音首字母序列与内容文本中区间文本的拼音首字母序列中重合的首字母数大于12个字,且顺序一致,则匹配成功,转写文本的拼音首字母序列与标题文本的拼音首字母序列中重合的首字母数大于4个字,且顺序一致,则匹配成功。
例如转写文本为“犯罪嫌疑人王对受害人实施了殴打”,相对应的拼音首字母序列为“FZXYRWDSHRSSLOD”,假设一段区间文本为“犯罪嫌疑人王某将受害人黄某拉出电影院实施了殴打……”,相对应的拼音首字母序列“FZXYRWMJSHRHMLCDYYSSLOD”中划线部分即为重合的首字母“FZXYRWMJSHRHMLCDYYSSLOD”,其中重合的首字母共14个,且顺序一致,可以确定转写文本与该区间文本所属的候选材料的文本拼音信息匹配成功。
基于上述任一实施例,图7是本发明提供的语音调度方法的流程示意图之二,如图7所示,一种庭审场景下的语音调度方法包括:
首先,实时获取庭审现场的调度语音。
随即,对调度语音进行语音转写,得到调度语音的转写文本。
在得到转写文本后,首先将转写文本的拼音首字母序列与当前展示材料的文本的拼音首字母序列进行匹配,如果匹配成功,则直接将当前展示材料作为调度材料,否则转而将转写文本的拼音首字母序列与下一展示材料的文本的拼音首字母序列进行匹配;
如果与下一展示材料的文本的拼音首字母序列匹配成功,则直接将下一展示材料作为调度材料,否则转而将转写文本的拼音首字母序列与各个候选材料的内容文本以及案件提纲的内容文本的拼音首字母序列进行匹配;
如果与任一候选材料的内容文本匹配成功,则将该候选材料作为调度文本,如果与案件提纲的内容文本匹配成功,则将相匹配的文本所指示的候选材料作为调度材料,如果均未匹配成功,转而将转写文本的拼音首字母序列与各个候选材料的标题文本以及案件提纲的标题文本的拼音首字母序列进行匹配;
如果与若干个候选材料的标题文本和/或若干个案件提纲的标题文本匹配成功,则结合相匹配的各个标题文本的来源权重、匹配度权重,以及预先统计好的调度权重,计算各个标题文本的匹配得分,进而选取匹配得分最高的标题文本对应的候选材料作为调度材料。
在确定调度材料之后,即可对调度材料进行展示。进一步地,针对与转写文本相匹配的是候选材料的标题文本,且该候选材料为案件卷宗的情况,可以直接展示案件卷宗的所有内容,当案件卷宗存在多个页面时,可以滚动展示所有页面;针对与转写文本相匹配的是候选材料的内容文本,且该候选材料为案件卷宗的情况,可以在展示该案卷卷宗的同时,高亮内容文本中与转写文本相匹配的部分;针对与转写文本相匹配的是案件提纲中的标题文本的情况,可以直接展示案件提纲中标题文本对应的内容,例如候选材料的分组标题、分组介绍等,也可以提示操作人员确认是否展示标题文本相对应的候选材料;针对与转写文本相匹配的是候选材料,且候选材料为多媒体证据的情况,可以展示多媒体证据的标题,并提示操作人员确认是否播放对应标题的多媒体证据。此外,针对需要操作人员确认的信息,操作人员可以直接通过语音的形式反馈确认信息,以控制具体候选材料的播放等,
下面对本发明提供的语音调度装置进行描述,下文描述的语音调度装置与上文描述的语音调度方法可相互对应参照。
图8是本发明提供的语音调度装置的结构示意图,如图8所示,该装置包括语音转写单元810、拼音匹配单元820和调度单元830;
其中,语音转写单元810用于确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;
拼音匹配单元820用于将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;
调度单元830用于展示所述调度材料。
本发明实施例提供的装置,通过对调度语音进行语音转写所得的转写文本与各候选材料的文本进行匹配,从而实现材料的自动调度,调度过程无需人工参与,省时省力,应用在庭审场景时可以有效提高证据出示效率。再者,基于文本的拼音信息匹配,相较于通用的文本匹配,具有更高的容错率,能够减轻语音转写阶段引入的干扰对于材料匹配的影响,在提高语音调度的成功率降低了对于语音转写的准确性的要求,降低了语音调度的硬件成本需求,扩宽了语音调度的适用范围。
基于上述任一实施例,拼音匹配单元820包括:
当前展示确定子单元,用于确定当前展示材料;
第一匹配子单元,用于若所述转写文本与所述当前展示材料的文本拼音信息匹配失败,则将所述转写文本与除所述当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定所述调度材料;
否则确定所述当前展示材料为所述调度材料。
基于上述任一实施例,第一匹配子单元包括:
下一展示确定子单元,用于基于案件提纲中的目录,确定所述当前展示材料的下一展示材料;
第二匹配子单元,用于若所述转写文本与所述下一展示材料的文本拼音信息匹配失败,则将所述转写文本分别与所述案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定所述调度材料;
否则确定所述下一展示材料为所述调度材料。
基于上述任一实施例,第二匹配子单元包括:
标题文本匹配子单元,用于若所述转写文本分别与所述案件提纲的内容文本和各候选材料的内容文本拼音信息匹配失败,则将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定所述调度文件;
内容文本匹配子单元,用于若所述转写文本与所述案件提纲的内容文本拼音信息匹配成功,则确定与所述转写文本相匹配的所述案件提纲的内容文本所指示的候选材料为所述调度材料;
若所述转写文本与任一候选材料的内容文本拼音信息成功,则确定所述任一候选材料为所述调度材料。
基于上述任一实施例,标题文本匹配子单元用于:
将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,得到若干个与所述转写文本相匹配的所述案件提纲的标题文本和/或若干个与所述转写文本相匹配的所述候选材料的标题文本作为候选标题文本;
基于各候选标题文本的来源权重和匹配度权重,确定各候选标题文本的匹配得分;
确定所述匹配得分最高的候选标题文本对应的候选材料为所述调度文本。
基于上述任一实施例,标题文本匹配子单元用于:
基于各候选标题文本的来源权重和匹配度权重,以及各候选标题文本的调度权重,确定各候选标题文本的匹配得分;
所述调度权重是基于所述候选标题对应候选材料的历史调度频次确定的。
基于上述任一实施例,拼音信息是对应文本的拼音首字母序列;
拼音匹配单元820用于:
对任一候选材料的文本进行拆分,得到若干段区间文本;
将所述转写文本与任一区间文本进行拼音首字母序列匹配;
若所述转写文本的拼音首字母序列与所述任一区间文本的拼音首字母序列的字母重合数大于预设阈值,且重合的拼音首字母顺序一致,则确定所述转写文本与所述任一候选材料的文本拼音信息匹配成功。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(Communications Interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行语音调度方法,该方法包括:确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;展示所述调度材料。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的语音调度方法,该方法包括:确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;展示所述调度材料。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的语音调度方法,该方法包括:确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;展示所述调度材料。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音调度方法,其特征在于,包括:
确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;
将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;
展示所述调度材料。
2.根据权利要求1所述的语音调度方法,其特征在于,所述将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料,包括:
确定当前展示材料;
若所述转写文本与所述当前展示材料的文本拼音信息匹配失败,则将所述转写文本与除所述当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定所述调度材料;
否则确定所述当前展示材料为所述调度材料。
3.根据权利要求2所述的语音调度方法,其特征在于,所述将所述转写文本与除所述当前展示材料之外的其他候选材料的文本进行拼音信息匹配,确定所述调度材料,包括:
基于案件提纲中的目录,确定所述当前展示材料的下一展示材料;
若所述转写文本与所述下一展示材料的文本拼音信息匹配失败,则将所述转写文本分别与所述案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定所述调度材料;
否则确定所述下一展示材料为所述调度材料。
4.根据权利要求3所述的语音调度方法,其特征在于,所述将所述转写文本分别与所述案件提纲的文本和各候选材料的文本进行拼音信息匹配,确定所述调度材料,包括:
若所述转写文本分别与所述案件提纲的内容文本和各候选材料的内容文本拼音信息匹配失败,则将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定所述调度文件;
若所述转写文本与所述案件提纲的内容文本拼音信息匹配成功,则确定与所述转写文本相匹配的所述案件提纲的内容文本所指示的候选材料为所述调度材料;
若所述转写文本与任一候选材料的内容文本拼音信息成功,则确定所述任一候选材料为所述调度材料。
5.根据权利要求4所述的语音调度方法,其特征在于,所述将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,确定所述调度文件,包括:
将所述转写文本分别与所述案件提纲的标题文本和各候选材料的标题文本进行拼音信息匹配,得到若干个与所述转写文本相匹配的所述案件提纲的标题文本和/或若干个与所述转写文本相匹配的所述候选材料的标题文本作为候选标题文本;
基于各候选标题文本的来源权重和匹配度权重,确定各候选标题文本的匹配得分;
确定所述匹配得分最高的候选标题文本对应的候选材料为所述调度文本。
6.根据权利要求5所述的语音调度方法,其特征在于,所述基于各候选标题文本的来源权重和匹配度权重,确定各候选标题文本的匹配得分,包括:
基于各候选标题文本的来源权重和匹配度权重,以及各候选标题文本的调度权重,确定各候选标题文本的匹配得分;
所述调度权重是基于所述候选标题对应候选材料的历史调度频次确定的。
7.根据权利要求1至6中任一项所述的语音调度方法,其特征在于,拼音信息是对应文本的拼音首字母序列;
所述将所述转写文本与各候选材料的文本进行拼音信息匹配,包括:
对任一候选材料的文本进行拆分,得到若干段区间文本;
将所述转写文本与任一区间文本进行拼音首字母序列匹配;
若所述转写文本的拼音首字母序列与所述任一区间文本的拼音首字母序列的字母重合数大于预设阈值,且重合的拼音首字母顺序一致,则确定所述转写文本与所述任一候选材料的文本拼音信息匹配成功。
8.一种语音调度装置,其特征在于,包括:
语音转写单元,用于确定调度语音,对所述调度语音进行语音转写,得到所述调度语音的转写文本;
拼音匹配单元,用于将所述转写文本与各候选材料的文本进行拼音信息匹配,确定与所述转写文本相匹配的候选材料为调度材料;
调度单元,用于展示所述调度材料。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述语音调度方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音调度方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011540140.XA CN112651854B (zh) | 2020-12-23 | 2020-12-23 | 语音调度方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011540140.XA CN112651854B (zh) | 2020-12-23 | 2020-12-23 | 语音调度方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112651854A true CN112651854A (zh) | 2021-04-13 |
CN112651854B CN112651854B (zh) | 2024-06-21 |
Family
ID=75359723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011540140.XA Active CN112651854B (zh) | 2020-12-23 | 2020-12-23 | 语音调度方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651854B (zh) |
Citations (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0696057A (ja) * | 1992-09-10 | 1994-04-08 | Sharp Corp | 仮名漢字変換処理装置 |
WO2001033324A2 (en) * | 1999-11-05 | 2001-05-10 | Microsoft Corporation | Language input user interface |
US20110300894A1 (en) * | 2010-06-02 | 2011-12-08 | R&L Carriers, Inc. | Intelligent wireless dispatch systems |
CN103793515A (zh) * | 2014-02-11 | 2014-05-14 | 安徽科大讯飞信息科技股份有限公司 | 一种客服语音智能搜索和分析系统及方法 |
CN103903619A (zh) * | 2012-12-28 | 2014-07-02 | 安徽科大讯飞信息科技股份有限公司 | 一种提高语音识别准确率的方法及系统 |
US20140257598A1 (en) * | 2013-03-06 | 2014-09-11 | The Boeing Company | Real-Time Adaptive Speed Scheduler |
US20150112675A1 (en) * | 2013-10-18 | 2015-04-23 | Via Technologies, Inc. | Speech recognition method and electronic apparatus |
US20150112679A1 (en) * | 2013-10-18 | 2015-04-23 | Via Technologies, Inc. | Method for building language model, speech recognition method and electronic apparatus |
CN106909628A (zh) * | 2017-01-24 | 2017-06-30 | 南京大学 | 一种基于区间的文本相似搜索方法 |
CN106971723A (zh) * | 2017-03-29 | 2017-07-21 | 北京搜狗科技发展有限公司 | 语音处理方法和装置、用于语音处理的装置 |
CN107193391A (zh) * | 2017-04-25 | 2017-09-22 | 北京百度网讯科技有限公司 | 一种上屏显示文本信息的方法和装置 |
WO2017195051A1 (en) * | 2016-05-13 | 2017-11-16 | Infocert S.P.A. | Method of remotely identifying a physical person in asynchronous mode, aimed at the release of an advanced electronic signature, qualified electronic signature or digital identity |
CN107679196A (zh) * | 2017-10-10 | 2018-02-09 | 中国移动通信集团公司 | 一种多媒体识别方法、电子设备及存储介质 |
CN109003608A (zh) * | 2018-08-07 | 2018-12-14 | 北京东土科技股份有限公司 | 庭审控制方法、系统、计算机设备及存储介质 |
CN109413135A (zh) * | 2018-08-31 | 2019-03-01 | 法信公证云(厦门)科技有限公司 | 一种司法辅助的电子送达公证系统及方法 |
CN109658938A (zh) * | 2018-12-07 | 2019-04-19 | 百度在线网络技术(北京)有限公司 | 语音与文本匹配的方法、装置、设备及计算机可读介质 |
CN110019923A (zh) * | 2017-07-18 | 2019-07-16 | 北京国双科技有限公司 | 语音消息的查找方法及装置 |
CN110135715A (zh) * | 2019-05-06 | 2019-08-16 | 江苏新视云科技股份有限公司 | 一种智能法庭管理方法 |
CN110175605A (zh) * | 2019-05-27 | 2019-08-27 | 北京市律典通科技有限公司 | 基于要素式的电子审判数据处理方法及装置 |
CN110415704A (zh) * | 2019-06-14 | 2019-11-05 | 平安科技(深圳)有限公司 | 庭审笔录数据处理方法、装置、计算机设备和存储介质 |
CN110704571A (zh) * | 2019-08-16 | 2020-01-17 | 平安科技(深圳)有限公司 | 庭审辅助处理方法、审判辅助处理方法、装置、设备及介质 |
CN111198936A (zh) * | 2018-11-20 | 2020-05-26 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
CN111210172A (zh) * | 2020-04-21 | 2020-05-29 | 成都派沃特科技股份有限公司 | 派遣警员的方法、装置、设备及存储介质 |
CN305836039S (zh) * | 2020-06-09 | |||
CN111259170A (zh) * | 2018-11-30 | 2020-06-09 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
CN111310413A (zh) * | 2020-02-20 | 2020-06-19 | 阿基米德(上海)传媒有限公司 | 一种基于节目串联单的广播节目音频智能拆条方法及装置 |
CN111462754A (zh) * | 2020-04-16 | 2020-07-28 | 深圳航天科创实业有限公司 | 一种电力系统调度控制语音识别模型建立方法 |
CN111739514A (zh) * | 2019-07-31 | 2020-10-02 | 北京京东尚科信息技术有限公司 | 一种语音识别方法、装置、设备及介质 |
CN111755001A (zh) * | 2020-05-07 | 2020-10-09 | 国网山东省电力公司信息通信公司 | 一种基于人工智能的电网快速调度指挥系统及方法 |
CN111813947A (zh) * | 2019-04-09 | 2020-10-23 | 北京国双科技有限公司 | 开庭询问提纲自动生成方法及装置 |
CN111882462A (zh) * | 2020-08-03 | 2020-11-03 | 安徽大学 | 一种面向多要素审查标准的中文商标近似检测方法 |
CN111898342A (zh) * | 2020-07-31 | 2020-11-06 | 升智信息科技(南京)有限公司 | 一种基于编辑距离的中文发音校验方法 |
-
2020
- 2020-12-23 CN CN202011540140.XA patent/CN112651854B/zh active Active
Patent Citations (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN305836039S (zh) * | 2020-06-09 | |||
JPH0696057A (ja) * | 1992-09-10 | 1994-04-08 | Sharp Corp | 仮名漢字変換処理装置 |
WO2001033324A2 (en) * | 1999-11-05 | 2001-05-10 | Microsoft Corporation | Language input user interface |
US20110300894A1 (en) * | 2010-06-02 | 2011-12-08 | R&L Carriers, Inc. | Intelligent wireless dispatch systems |
CN103903619A (zh) * | 2012-12-28 | 2014-07-02 | 安徽科大讯飞信息科技股份有限公司 | 一种提高语音识别准确率的方法及系统 |
US20140257598A1 (en) * | 2013-03-06 | 2014-09-11 | The Boeing Company | Real-Time Adaptive Speed Scheduler |
US20150112675A1 (en) * | 2013-10-18 | 2015-04-23 | Via Technologies, Inc. | Speech recognition method and electronic apparatus |
US20150112679A1 (en) * | 2013-10-18 | 2015-04-23 | Via Technologies, Inc. | Method for building language model, speech recognition method and electronic apparatus |
CN103793515A (zh) * | 2014-02-11 | 2014-05-14 | 安徽科大讯飞信息科技股份有限公司 | 一种客服语音智能搜索和分析系统及方法 |
WO2017195051A1 (en) * | 2016-05-13 | 2017-11-16 | Infocert S.P.A. | Method of remotely identifying a physical person in asynchronous mode, aimed at the release of an advanced electronic signature, qualified electronic signature or digital identity |
CN106909628A (zh) * | 2017-01-24 | 2017-06-30 | 南京大学 | 一种基于区间的文本相似搜索方法 |
CN106971723A (zh) * | 2017-03-29 | 2017-07-21 | 北京搜狗科技发展有限公司 | 语音处理方法和装置、用于语音处理的装置 |
CN107193391A (zh) * | 2017-04-25 | 2017-09-22 | 北京百度网讯科技有限公司 | 一种上屏显示文本信息的方法和装置 |
CN110019923A (zh) * | 2017-07-18 | 2019-07-16 | 北京国双科技有限公司 | 语音消息的查找方法及装置 |
CN107679196A (zh) * | 2017-10-10 | 2018-02-09 | 中国移动通信集团公司 | 一种多媒体识别方法、电子设备及存储介质 |
CN109003608A (zh) * | 2018-08-07 | 2018-12-14 | 北京东土科技股份有限公司 | 庭审控制方法、系统、计算机设备及存储介质 |
CN109413135A (zh) * | 2018-08-31 | 2019-03-01 | 法信公证云(厦门)科技有限公司 | 一种司法辅助的电子送达公证系统及方法 |
CN111198936A (zh) * | 2018-11-20 | 2020-05-26 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
CN111259170A (zh) * | 2018-11-30 | 2020-06-09 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
CN109658938A (zh) * | 2018-12-07 | 2019-04-19 | 百度在线网络技术(北京)有限公司 | 语音与文本匹配的方法、装置、设备及计算机可读介质 |
CN111813947A (zh) * | 2019-04-09 | 2020-10-23 | 北京国双科技有限公司 | 开庭询问提纲自动生成方法及装置 |
CN110135715A (zh) * | 2019-05-06 | 2019-08-16 | 江苏新视云科技股份有限公司 | 一种智能法庭管理方法 |
CN110175605A (zh) * | 2019-05-27 | 2019-08-27 | 北京市律典通科技有限公司 | 基于要素式的电子审判数据处理方法及装置 |
CN110415704A (zh) * | 2019-06-14 | 2019-11-05 | 平安科技(深圳)有限公司 | 庭审笔录数据处理方法、装置、计算机设备和存储介质 |
CN111739514A (zh) * | 2019-07-31 | 2020-10-02 | 北京京东尚科信息技术有限公司 | 一种语音识别方法、装置、设备及介质 |
CN110704571A (zh) * | 2019-08-16 | 2020-01-17 | 平安科技(深圳)有限公司 | 庭审辅助处理方法、审判辅助处理方法、装置、设备及介质 |
CN111310413A (zh) * | 2020-02-20 | 2020-06-19 | 阿基米德(上海)传媒有限公司 | 一种基于节目串联单的广播节目音频智能拆条方法及装置 |
CN111462754A (zh) * | 2020-04-16 | 2020-07-28 | 深圳航天科创实业有限公司 | 一种电力系统调度控制语音识别模型建立方法 |
CN111210172A (zh) * | 2020-04-21 | 2020-05-29 | 成都派沃特科技股份有限公司 | 派遣警员的方法、装置、设备及存储介质 |
CN111755001A (zh) * | 2020-05-07 | 2020-10-09 | 国网山东省电力公司信息通信公司 | 一种基于人工智能的电网快速调度指挥系统及方法 |
CN111898342A (zh) * | 2020-07-31 | 2020-11-06 | 升智信息科技(南京)有限公司 | 一种基于编辑距离的中文发音校验方法 |
CN111882462A (zh) * | 2020-08-03 | 2020-11-03 | 安徽大学 | 一种面向多要素审查标准的中文商标近似检测方法 |
Non-Patent Citations (4)
Title |
---|
张歆;: "智能文稿唱词实验系统的设计与应用", 现代电视技术, no. 02 * |
王煜;涂惠燕;: "基于内容的语音课件关键词检索系统:设计与实现", 计算机应用与软件, no. 04 * |
袁春杰: "人工智能技术在智慧法院建设中的应用", 《人工智能》, no. 04, pages 57 - 58 * |
贾毓杰, 郭景芳: "列车调度指挥信息系统应用语音技术的初步研究", 铁路技术创新, no. 04 * |
Also Published As
Publication number | Publication date |
---|---|
CN112651854B (zh) | 2024-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9582757B1 (en) | Scalable curation system | |
US7092496B1 (en) | Method and apparatus for processing information signals based on content | |
CN110020424B (zh) | 合同信息的提取方法、装置和文本信息的提取方法 | |
CN105931644B (zh) | 一种语音识别方法及移动终端 | |
CN109817210B (zh) | 语音写作方法、装置、终端和存储介质 | |
CN110164435A (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
US20120330662A1 (en) | Input supporting system, method and program | |
JP5123591B2 (ja) | 発想支援装置、発想支援システム、発想支援プログラム及び発想支援方法 | |
CN103607457B (zh) | 笔记处理方法、装置、终端、服务器及系统 | |
CN110750996B (zh) | 多媒体信息的生成方法、装置及可读存储介质 | |
CN110347866B (zh) | 信息处理方法、装置、存储介质及电子设备 | |
US10089898B2 (en) | Information processing device, control method therefor, and computer program | |
CN101326533A (zh) | 基于语音的文档的历史跟踪方法和系统 | |
CN112468665A (zh) | 一种会议纪要的生成方法、装置、设备及存储介质 | |
CN113011169B (zh) | 一种会议纪要的处理方法、装置、设备及介质 | |
EP3573051A1 (en) | Information processing device, information processing method, and program | |
CN112399269A (zh) | 视频分割方法、装置、设备及存储介质 | |
CN112382295A (zh) | 语音识别方法、装置、设备及可读存储介质 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
CN117421413A (zh) | 一种问答对生成方法、装置及电子设备 | |
CN110263135B (zh) | 一种数据交换匹配方法、装置、介质和电子设备 | |
CN111935552A (zh) | 信息标注方法、装置、设备及介质 | |
CN112116836A (zh) | 在线学习笔记与教学多媒体联动获取方法及系统 | |
CN112651854A (zh) | 语音调度方法、装置、电子设备和存储介质 | |
CN115640790A (zh) | 信息处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |