CN111523327B - 一种基于语音识别的文本确定方法及系统 - Google Patents

一种基于语音识别的文本确定方法及系统 Download PDF

Info

Publication number
CN111523327B
CN111523327B CN202010326878.XA CN202010326878A CN111523327B CN 111523327 B CN111523327 B CN 111523327B CN 202010326878 A CN202010326878 A CN 202010326878A CN 111523327 B CN111523327 B CN 111523327B
Authority
CN
China
Prior art keywords
text
entity
entities
tail
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010326878.XA
Other languages
English (en)
Other versions
CN111523327A (zh
Inventor
吕志坚
何余良
徐冠宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruobin Robot Technology Co ltd
Beijing Institute Of Science And Technology Information
Original Assignee
Beijing Ruobin Robot Technology Co ltd
Beijing Institute Of Science And Technology Information
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruobin Robot Technology Co ltd, Beijing Institute Of Science And Technology Information filed Critical Beijing Ruobin Robot Technology Co ltd
Priority to CN202010326878.XA priority Critical patent/CN111523327B/zh
Publication of CN111523327A publication Critical patent/CN111523327A/zh
Application granted granted Critical
Publication of CN111523327B publication Critical patent/CN111523327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于语音识别的文本确定方法及系统。该方法包括获取语音文件;根据所述语音文件生成第一文本;对所述第一文本进行预处理;采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合;对所述实体集合中的所有实体采用注意力模型确定多个三元组;对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本。本发明所提供得一种基于语音识别的文本确定方法及系统,能够提高通过语音识别生成的文本信息的可读性。

Description

一种基于语音识别的文本确定方法及系统
技术领域
本发明涉及语音识别技术领域,特别是涉及一种基于语音识别的文本确定方法及系统。
背景技术
基于语音识别的应用越来越广泛,已深入到人们生活的各个方面,并且语音识别技术日趋成熟,语音识别率高达98%以上,从而使得语音识别技术得到了广泛的应用。人们通过语音等多媒体方式来传播和存储信息。为了便于存储和传播,将语音内容识别成文本,即形成可读文本方式将更有利信息的快速传播和传承。
目前,业界采用深度学习等人工智能技术进行语音识别生成文本,但通过语音识别生成的文本信息,这些文本信息包含了大量的口语化词汇和重复性词汇,且语法结构混乱,影响了文本信息的可读性。
发明内容
本发明的目的是提供一种基于语音识别的文本确定方法及系统,能够提高通过语音识别生成的文本信息的可读性。
为实现上述目的,本发明提供了如下方案:
一种基于语音识别的文本确定方法,包括:
获取语音文件;
根据所述语音文件生成第一文本;所述第一文本包括口语化词汇、重复短语以及重复短句;所述第一文本为不符合语法结构的文本;
对所述第一文本进行预处理;其中,预处理后的第一文本为去除所述第一文本中口语化词汇、重复短语和重复短句的文本;
采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合;所述实体是对复合信息的抽象,所述实体包括时间、地点、人名或者组织机构;
对所述实体集合中的所有实体采用注意力模型确定多个三元组;所述三元组包括头实体、头实体和尾实体之间的实体关系以及尾实体;所述头实体的时间顺序先于尾实体的时间顺序;
对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本。
可选的,所述对所述第一文本进行预处理,具体包括:
采用正则表达式的方法去除所述第一文本中的口语化词汇和重复短语;
采用模板匹配的方法去除所述第一文本中的重复短句。
可选的,所述采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合,具体包括:
对预处理后的第一文本中进行分句处理,得到多个文本段落;
对每一个所述文本段落进行分词处理;
对分词后的文本段落采用BERT算法提取所述实体;
将所有所述实体按照时间顺序进行排序,得到实体集合。
可选的,所述对所述实体集合中的所有实体采用注意力模型确定多个三元组,之后还包括:
获取三元组tk=(h,r,f);h为头实体,f为尾实体,r为头实体和尾实体之间的实体关系;
根据知识库中的有向图确定头实体到达尾实体的多条路径;
获取从h到达f的第i条路径Pi,Pi={(h,r1,e1),(e1,r2,e2),...(ek-1,rk,ek),...(en-1,rn,f)};ek为从h到达f的第i条路径Pi中经过的第k个实体,e0=h,en=f,k=1,2..n;rk为第k-1个实体和第k个实体之间的实体关系;
利用公式计算r与Pi中所有实体关系的语义距离;d[Pi(rk),r]为r与Pi中所有实体关系的语义距离;
利用公式计算h与Pi中所有头实体之间的语义距离;d[Pi(ek-1),h]为h与Pi中所有头实体之间的语义距离;
利用公式计算f与Pi所有尾实体之间的语义距离;d[Pi(ek),f]为f与Pi所有尾实体之间的语义距离;
利用公式计算Pi的平均语义距离;
将平均语义距离最大的路径作为h到达f的最优路径;
根据最优路径优化三元组tk=(h,r,f)。
一种基于语音识别的文本确定系统,包括:
语音文件获取模块,用于获取语音文件;
第一文本生成模块,用于根据所述语音文件生成第一文本;所述第一文本包括口语化词汇、重复短语以及重复短句;所述第一文本为不符合语法结构的文本;
第一文本预处理模块,用于对所述第一文本进行预处理;其中,预处理后的第一文本为去除所述第一文本中口语化词汇、重复短语和重复短句的文本;
实体集确定模块,用于采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合;所述实体是对复合信息的抽象,所述实体包括时间、地点、人名或者组织机构;
多元组确定模块,用于对所述实体集合中的所有实体采用注意力模型确定多个三元组;所述三元组包括头实体、头实体和尾实体之间的实体关系以及尾实体;所述头实体的时间顺序先于尾实体的时间顺序;
第二文本确定模块,用于对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本。
可选的,所述第一文本预处理模块具体包括:
正则表达式预处理单元,用于采用正则表达式的方法去除所述第一文本中的口语化词汇和重复短语;
模板匹配预处理单元,用于采用模板匹配的方法去除所述第一文本中的重复短句。
可选的,所述实体集合确定模块具体包括:
文本段落确定单元,用于对预处理后的第一文本中进行分句处理,得到多个文本段落;
分词处理确定单元,用于对每一个所述文本段落进行分词处理;
实体提取单元,用于对分词后的文本段落采用BERT算法提取所述实体;
实体集合确定单元,用于将所有所述实体按照时间顺序进行排序,得到实体集合。
可选的,还包括:
三元组获取模块,用于获取三元组tk=(h,r,f);h为头实体,f为尾实体,r为头实体和尾实体之间的实体关系;
多个路径确定模块,用于根据知识库中的有向图确定头实体到达尾实体的多条路径;
第i条路径获取模块,用于获取从h到达f的第i条路径Pi,Pi={(h,r1,e1),(e1,r2,e2),...(ek-1,rk,ek),...(en-1,rn,f)};ek为从h到达f的第i条路径Pi中经过的第k个实体,e0=h,en=f,k=1,2..n;rk为第k-1个实体和第k个实体之间的实体关系;
第一语义距离确定模块,用于利用公式计算r与Pi中所有实体关系的语义距离;d[Pi(rk),r]为r与Pi中所有实体关系的语义距离;
第二语义距离确定模块,用于利用公式计算h与Pi中所有头实体之间的语义距离;d[Pi(ek-1),h]为h与Pi中所有头实体之间的语义距离;
第三语义距离确定模块,用于利用公式计算f与Pi所有尾实体之间的语义距离;d[Pi(ek),f]为f与Pi所有尾实体之间的语义距离;
平均语义距离确定模块,用于利用公式
计算Pi的平均语义距离;
最优路径确定模块,用于将平均语义距离最大的路径作为h到达f的最优路径;
优化模块,用于根据最优路径优化三元组tk=(h,r,f)。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种基于语音识别的文本确定方法及系统,先对所述语音文件生成第一文本进行预处理,去除第一文本中口语化词汇、重复的短语和重复的短句;再提取预处理后的所述第一文本中所有的实体,根据实体确定三元组,最后对所有三元组进行重组确定第二文本。通过根据实体确定三元组降低了因实信息残缺和混乱对信息理解的影响,避免了语法结构混乱现象的发生,进而提高了文本信息的可读性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种基于语音识别的文本确定方法流程示意图;
图2为本发明所提供的一种基于语音识别的文本确定系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于语音识别的文本确定方法及系统,能够提高通过语音识别生成的文本信息的可读性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明所提供的一种基于语音识别的文本确定方法流程示意图,如图1所示,本发明所提供的一种基于语音识别的文本确定方法,包括:
S101,获取语音文件。所述语音文件是通过待识别者利用录音设备进行录音得到;
S102,根据所述语音文件生成第一文本。所述语音文件通过语音识别系统生成第一文本。所述第一文本包括口语化词汇、重复短语以及重复短句;所述第一文本为不符合语法结构的文本。
例如所述第一文本含有大量的“嗯”、“啊”、“哦”、“对”等口语化词汇,也包含有比较多的“.....我认为”,“恩”,“我认为.....”等重复的短语或者短句。另外,生成的所述第一文本还会受不同声源的干扰,导致文本可读性差。
S103,对所述第一文本进行预处理。其中,预处理后的第一文本为去除所述第一文本中口语化词汇、重复短语和重复短句的文本。
采用正则表达式的方法去除所述第一文本中的口语化词汇和重复短语,
采用模板匹配的方法去除所述第一文本中的重复短句。
S104,采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合。所述实体是对复合信息的抽象,所述实体包括时间、地点、人名或者组织机构。预处理后的第一文本还存在大量的语法错误,如语法结构不完整,缺主语、宾语,指代不明等,往往需要借助上下文,才能理解文本所要表达的意思。因此,通过S104校正所述预处理后的第一文本中不符合语法规则的句子和段落。具体过程为:
对预处理后的第一文本中进行分句处理,得到多个文本段落。具体的按照标点符号进行分句处理。
对每一个所述文本段落进行分词处理。
对分词后的文本段落采用BERT算法提取所述实体。
将所有所述实体按照时间顺序进行排序,得到实体集合。
S105,对所述实体集合中的所有实体采用注意力模型确定多个三元组;所述三元组包括头实体、头实体和尾实体之间的实体关系以及尾实体;所述头实体的时间顺序先于尾实体的时间顺序。
获取三元组tk=(h,r,f);h为头实体,f为尾实体,r为头实体和尾实体之间的实体关系。
根据知识库中的有向图确定头实体到达尾实体的多条路径。
获取从h到达f的第i条路径Pi,Pi={(h,r1,e1),(e1,r2,e2),...(ek-1,rk,ek),...(en-1,rn,f)};ek为从h到达f的第i条路径Pi中经过的第k个实体,e0=h,en=f,k=1,2..n;rk为第k-1个实体和第k个实体之间的实体关系。
利用公式计算r与Pi中所有实体关系的语义距离;d[Pi(rk),r]为r与Pi中所有实体关系的语义距离。
利用公式计算h与Pi中所有头实体之间的语义距离;d[Pi(ek-1),h]为h与Pi中所有头实体之间的语义距离。
利用公式计算f与Pi所有尾实体之间的语义距离;d[Pi(ek),f]为f与Pi所有尾实体之间的语义距离。
利用公式计算Pi的平均语义距离。
将平均语义距离最大的路径作为h到达f的最优路径。
根据最优路径优化三元组tk=(h,r,f)。
S106,对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本。
本发明所提供的一种基于语音识别的文本确定方法通过从口语化文本提取实体及其三元组,降低了因实信息残缺和混乱对信息理解的影响。基于知识库,利用了的实体之间各种关系,包括隐性的和显性关系,对实体之间的关系进行推理,提升信息缺失的修复能力。本方法采用知识推理,与知识库的质量息息相关。因此,若知识库中的知识足够丰富、关系足够完本,它的应用也就越广泛。
图2为本发明所提供的一种基于语音识别的文本确定系统结构示意图,如图2所示,本发明所提供的一种基于语音识别的文本确定系统,包括:语音文件获取模块201、第一文本生成模块202、第一文本预处理模块203、实体集确定模块204、多元组确定模块205和第二文本确定模块206。
语音文件获取模块201用于获取语音文件。
第一文本生成模块202用于根据所述语音文件生成第一文本;所述第一文本包括口语化词汇、重复短语以及重复短句;所述第一文本为不符合语法结构的文本。
第一文本预处理模块203用于对所述第一文本进行预处理;其中,预处理后的第一文本为去除所述第一文本中口语化词汇、重复短语和重复短句的文本。
实体集确定模块204用于采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合;所述实体是对复合信息的抽象,所述实体包括时间、地点、人名或者组织机构。
多元组确定模块205用于对所述实体集合中的所有实体采用注意力模型确定多个三元组;所述三元组包括头实体、头实体和尾实体之间的实体关系以及尾实体;所述头实体的时间顺序先于尾实体的时间顺序。
第二文本确定模块206用于对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本。
所述第一文本预处理模块203具体包括:正则表达式预处理单元和模板匹配预处理单元。
正则表达式预处理单元用于采用正则表达式的方法去除所述第一文本中的口语化词汇和重复短语。
模板匹配预处理单元用于采用模板匹配的方法去除所述第一文本中的重复短句。
所述实体集合确定模块具体包括:文本段落确定单元、分词处理确定单元、实体提取单元和实体集合确定单元。
文本段落确定单元用于对预处理后的第一文本中进行分句处理,得到多个文本段落。
分词处理确定单元用于对每一个所述文本段落进行分词处理,
实体提取单元用于对分词后的文本段落采用BERT算法提取所述实体。
实体集合确定单元用于将所有所述实体按照时间顺序进行排序,得到实体集合。
本发明所提供的一种基于语音识别的文本确定系统还包括:三元组获取模块、多个路径确定模块、第i条路径获取模块、第一语义距离确定模块、第二语义距离确定模块、第三语义距离确定模块、平均语义距离确定模块、最优路径确定模块和优化模块。
三元组获取模块用于获取三元组tk=(h,r,f);h为头实体,f为尾实体,r为头实体和尾实体之间的实体关系。
多个路径确定模块用于根据知识库中的有向图确定头实体到达尾实体的多条路径。
第i条路径获取模块用于获取从h到达f的第i条路径Pi,Pi={(h,r1,e1),(e1,r2,e2),...(ek-1,rk,ek),...(en-1,rn,f)};ek为从h到达f的第i条路径Pi中经过的第k个实体,e0=h,en=f,k=1,2..n;rk为第k-1个实体和第k个实体之间的实体关系。
第一语义距离确定模块用于利用公式计算r与Pi中所有实体关系的语义距离;d[Pi(rk),r]为r与Pi中所有实体关系的语义距离。
第二语义距离确定模块用于利用公式计算h与Pi中所有头实体之间的语义距离;d[Pi(ek-1),h]为h与Pi中所有头实体之间的语义距离。
第三语义距离确定模块用于利用公式计算f与Pi所有尾实体之间的语义距离;d[Pi(ek),f]为f与Pi所有尾实体之间的语义距离。
平均语义距离确定模块用于利用公式
计算Pi的平均语义距离。
最优路径确定模块用于将平均语义距离最大的路径作为h到达f的最优路径。
优化模块用于根据最优路径优化三元组tk=(h,r,f)。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种基于语音识别的文本确定方法,其特征在于,包括:
获取语音文件;
根据所述语音文件生成第一文本;所述第一文本包括口语化词汇、重复短语以及重复短句;所述第一文本为不符合语法结构的文本;
对所述第一文本进行预处理;其中,预处理后的第一文本为去除所述第一文本中口语化词汇、重复短语和重复短句的文本;
采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合;所述实体是对复合信息的抽象,所述实体包括时间、地点、人名或者组织机构;
对所述实体集合中的所有实体采用注意力模型确定多个三元组;所述三元组包括头实体、头实体和尾实体之间的实体关系以及尾实体;所述头实体的时间顺序先于尾实体的时间顺序;
对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本;
所述对所述实体集合中的所有实体采用注意力模型确定多个三元组,之后还包括:
获取三元组tk=(h,r,f);h为头实体,f为尾实体,r为头实体和尾实体之间的实体关系;
根据知识库中的有向图确定头实体到达尾实体的多条路径;
获取从h到达f的第i条路径Pi
Pi={(h,r1,e1),(e1,r2,e2),...(ek-1,rk,ek),...(en-1,rn,f)};ek为从h到达f的第i条路径Pi中经过的第k个实体,e0=h,en=f,k=1,2..n;rk为第k-1个实体和第k个实体之间的实体关系;
利用公式计算r与Pi中所有实体关系的语义距离;d[Pi(rk),r]为r与Pi中所有实体关系的语义距离;
利用公式计算h与Pi中所有头实体之间的语义距离;d[Pi(ek-1),h]为h与Pi中所有头实体之间的语义距离;
利用公式计算f与Pi所有尾实体之间的语义距离;d[Pi(ek),f]为f与Pi所有尾实体之间的语义距离;
利用公式计算Pi的平均语义距离;
将平均语义距离最大的路径作为h到达f的最优路径;
根据最优路径优化三元组tk=(h,r,f)。
2.根据权利要求1所述的一种基于语音识别的文本确定方法,其特征在于,所述对所述第一文本进行预处理,具体包括:
采用正则表达式的方法去除所述第一文本中的口语化词汇和重复短语;
采用模板匹配的方法去除所述第一文本中的重复短句。
3.根据权利要求1所述的一种基于语音识别的文本确定方法,其特征在于,所述采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合,具体包括:
对预处理后的第一文本中进行分句处理,得到多个文本段落;
对每一个所述文本段落进行分词处理;
对分词后的文本段落采用BERT算法提取所述实体;
将所有所述实体按照时间顺序进行排序,得到实体集合。
4.一种基于语音识别的文本确定系统,其特征在于,包括:
语音文件获取模块,用于获取语音文件;
第一文本生成模块,用于根据所述语音文件生成第一文本;所述第一文本包括口语化词汇、重复短语以及重复短句;所述第一文本为不符合语法结构的文本;
第一文本预处理模块,用于对所述第一文本进行预处理;其中,预处理后的第一文本为去除所述第一文本中口语化词汇、重复短语和重复短句的文本;
实体集确定模块,用于采用BERT算法提取所述预处理后的第一文本中的所有实体,得到实体集合;所述实体是对复合信息的抽象,所述实体包括时间、地点、人名或者组织机构;
多元组确定模块,用于对所述实体集合中的所有实体采用注意力模型确定多个三元组;所述三元组包括头实体、头实体和尾实体之间的实体关系以及尾实体;所述头实体的时间顺序先于尾实体的时间顺序;
第二文本确定模块,用于对所有所述三元组进行重组,确定第二文本;所述第二文本为符合语法结构的文本;
三元组获取模块,用于获取三元组tk=(h,r,f);h为头实体,f为尾实体,r为头实体和尾实体之间的实体关系;
多个路径确定模块,用于根据知识库中的有向图确定头实体到达尾实体的多条路径;
第i条路径获取模块,用于获取从h到达f的第i条路径Pi,Pi={(h,r1,e1),(e1,r2,e2),…(ek-1,rk,ek),…(en-1,rn,f)};ek为从h到达f的第i条路径Pi中经过的第k个实体,e0=h,en=f,k=1,2..n;rk为第k-1个实体和第k个实体之间的实体关系;
第一语义距离确定模块,用于利用公式计算r与Pi中所有实体关系的语义距离;d[Pi(rk),r]为r与Pi中所有实体关系的语义距离;
第二语义距离确定模块,用于利用公式计算h与Pi中所有头实体之间的语义距离;d[Pi(ek-1),h]为h与Pi中所有头实体之间的语义距离;
第三语义距离确定模块,用于利用公式计算f与Pi所有尾实体之间的语义距离;d[Pi(ek),f]为f与Pi所有尾实体之间的语义距离;
平均语义距离确定模块,用于利用公式计算Pi的平均语义距离;
最优路径确定模块,用于将平均语义距离最大的路径作为h到达f的最优路径;
优化模块,用于根据最优路径优化三元组tk=(h,r,f)。
5.根据权利要求4所述的一种基于语音识别的文本确定系统,其特征在于,所述第一文本预处理模块具体包括:
正则表达式预处理单元,用于采用正则表达式的方法去除所述第一文本中的口语化词汇和重复短语;
模板匹配预处理单元,用于采用模板匹配的方法去除所述第一文本中的重复短句。
6.根据权利要求4所述的一种基于语音识别的文本确定系统,其特征在于,所述实体集合确定模块具体包括:
文本段落确定单元,用于对预处理后的第一文本中进行分句处理,得到多个文本段落;
分词处理确定单元,用于对每一个所述文本段落进行分词处理;
实体提取单元,用于对分词后的文本段落采用BERT算法提取所述实体;
实体集合确定单元,用于将所有所述实体按照时间顺序进行排序,得到实体集合。
CN202010326878.XA 2020-04-23 2020-04-23 一种基于语音识别的文本确定方法及系统 Active CN111523327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010326878.XA CN111523327B (zh) 2020-04-23 2020-04-23 一种基于语音识别的文本确定方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010326878.XA CN111523327B (zh) 2020-04-23 2020-04-23 一种基于语音识别的文本确定方法及系统

Publications (2)

Publication Number Publication Date
CN111523327A CN111523327A (zh) 2020-08-11
CN111523327B true CN111523327B (zh) 2023-08-22

Family

ID=71903650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010326878.XA Active CN111523327B (zh) 2020-04-23 2020-04-23 一种基于语音识别的文本确定方法及系统

Country Status (1)

Country Link
CN (1) CN111523327B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259100B (zh) * 2020-09-15 2024-04-09 科大讯飞华南人工智能研究院(广州)有限公司 语音识别方法及相关模型的训练方法和相关设备、装置
CN112559761B (zh) * 2020-12-07 2024-04-09 上海明略人工智能(集团)有限公司 基于图谱的文本生成方法、系统、电子设备及存储介质
CN112349290B (zh) * 2021-01-08 2021-04-20 北京海天瑞声科技股份有限公司 一种基于三元组的语音识别准确率计算方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150066361A (ko) * 2013-12-06 2015-06-16 주식회사 케이티 개체명 인식을 이용한 음성인식 띄어쓰기 보정 방법 및 시스템
CN107038163A (zh) * 2016-02-03 2017-08-11 常州普适信息科技有限公司 一种面向海量互联网信息的文本语义建模方法
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107403619A (zh) * 2017-06-30 2017-11-28 武汉泰迪智慧科技有限公司 一种应用于自行车环境的语音控制方法及系统
CN107871158A (zh) * 2016-09-26 2018-04-03 清华大学 一种结合序列文本信息的知识图谱表示学习方法及装置
CN109800407A (zh) * 2017-11-15 2019-05-24 腾讯科技(深圳)有限公司 意图识别方法、装置、计算机设备和存储介质
DE102018108947A1 (de) * 2017-12-07 2019-06-13 Hyundai Motor Company Vorrichtung zum Korrigieren eines Äußerungsfehlers eines Benutzers und Verfahren davon
CN110909172A (zh) * 2019-10-22 2020-03-24 中国船舶重工集团公司第七0九研究所 一种基于实体距离的知识表示学习方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150066361A (ko) * 2013-12-06 2015-06-16 주식회사 케이티 개체명 인식을 이용한 음성인식 띄어쓰기 보정 방법 및 시스템
CN107038163A (zh) * 2016-02-03 2017-08-11 常州普适信息科技有限公司 一种面向海量互联网信息的文本语义建模方法
CN107871158A (zh) * 2016-09-26 2018-04-03 清华大学 一种结合序列文本信息的知识图谱表示学习方法及装置
CN107403619A (zh) * 2017-06-30 2017-11-28 武汉泰迪智慧科技有限公司 一种应用于自行车环境的语音控制方法及系统
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN109800407A (zh) * 2017-11-15 2019-05-24 腾讯科技(深圳)有限公司 意图识别方法、装置、计算机设备和存储介质
DE102018108947A1 (de) * 2017-12-07 2019-06-13 Hyundai Motor Company Vorrichtung zum Korrigieren eines Äußerungsfehlers eines Benutzers und Verfahren davon
CN110909172A (zh) * 2019-10-22 2020-03-24 中国船舶重工集团公司第七0九研究所 一种基于实体距离的知识表示学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于生物实体语境的语音识别后文本纠错算法研究;姜俊;中国优秀硕士学位论文全文数据库 (基础科学辑);第信息科技辑卷;1-59 *

Also Published As

Publication number Publication date
CN111523327A (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
CN111523327B (zh) 一种基于语音识别的文本确定方法及系统
CN110717031B (zh) 一种智能会议纪要生成方法和系统
CN107741928B (zh) 一种基于领域识别的对语音识别后文本纠错的方法
CN111931506B (zh) 一种基于图信息增强的实体关系抽取方法
CN107832289A (zh) 一种基于lstm‑cnn的命名实体识别方法
CN111597350A (zh) 基于深度学习的轨道交通事件知识图谱构建方法
CN112364132A (zh) 基于依存句法的相似度计算模型和系统及搭建系统的方法
CN108257650A (zh) 一种应用于医技检查报告的智能纠错方法
CN114203177A (zh) 一种基于深度学习与情绪识别的智能语音问答方法和系统
CN115759119B (zh) 一种金融文本情感分析方法、系统、介质和设备
CN113221542A (zh) 一种基于多粒度融合与Bert筛选的中文文本自动校对方法
CN115658898A (zh) 一种中英文本实体关系抽取方法、系统及设备
CN111737424A (zh) 一种问题的匹配方法、装置、设备及存储介质
CN112686040B (zh) 一种基于图循环神经网络的事件事实性检测方法
CN112084319B (zh) 一种基于动作的关系网络视频问答系统及方法
CN112349294B (zh) 语音处理方法及装置、计算机可读介质、电子设备
CN113111639A (zh) 一种通顺模型训练方法及辅助语音识别方法
CN116522165B (zh) 一种基于孪生结构的舆情文本匹配系统及方法
CN117454898A (zh) 一种根据输入文本实现法人实体标准化输出的方法及装置
CN110738989B (zh) 一种利用多种语言模型的端到端网络学习解决基于地点的语音的自动识别任务的方法
CN117251562A (zh) 一种基于事实一致性增强的文本摘要生成方法
CN116705077A (zh) 一种ai分析语音识别情绪状态的方法
CN116665674A (zh) 基于语音和预训练模型的互联网智能化招聘发布方法
CN114880994B (zh) 一种直白文本到反讽文本的文本风格转换方法及装置
CN115048940B (zh) 基于实体词属性特征和回译的中文金融文本数据增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant