CN114090586A - 基于语音识别的文件导出方法、装置、设备和存储介质 - Google Patents

基于语音识别的文件导出方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN114090586A
CN114090586A CN202111438225.1A CN202111438225A CN114090586A CN 114090586 A CN114090586 A CN 114090586A CN 202111438225 A CN202111438225 A CN 202111438225A CN 114090586 A CN114090586 A CN 114090586A
Authority
CN
China
Prior art keywords
voice information
database table
file
table structure
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111438225.1A
Other languages
English (en)
Inventor
何辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111438225.1A priority Critical patent/CN114090586A/zh
Publication of CN114090586A publication Critical patent/CN114090586A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请适用于人工智能技术领域,提供一种基于语音识别的文件导出方法、装置、终端设备和存储介质。该方法包括:在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;从所述原始语音信息中提取所述业务人员发出的第一语音信息;对所述第一语音信息进行识别,得到第一语音识别结果;根据所述第一语音识别结果确定所述业务人员是否存在疑问;若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。由于导出的导图文件可以是鱼骨图、气泡图和逻辑图等业务人员容易理解的文件,因此能够协助业务人员对数据库表结构进行理解,从而缩短数据库表结构探讨会议所耗费的时间。

Description

基于语音识别的文件导出方法、装置、设备和存储介质
技术领域
本申请涉及人工智能技术领域,提供一种基于语音识别的文件导出方法、装置、终端设备和存储介质。
背景技术
目前,开发人员在进行数据库表结构的设计时,通常需要和业务人员开展会议进行探讨。在会议上,开发人员和业务人员需要对数据库表结构的字段名、字段长度和字段索引等设计进行讨论,以便开发人员能够开发出符合业务需求的数据库表结构。然而,对于非专业的业务人员来说,其一般难以理解数据库表结构中的专业术语,因此会议过程中可能需要开发人员多次答疑,这导致数据库表结构探讨会议所耗费的时间较长。
发明内容
有鉴于此,本申请提出一种基于语音识别的文件导出方法、装置、终端设备和存储介质,能够缩短数据库表结构探讨会议所耗费的时间。
第一方面,本申请实施例提供了一种基于语音识别的文件导出方法,包括:
在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
从所述原始语音信息中提取所述业务人员发出的第一语音信息;
对所述第一语音信息进行识别,得到第一语音识别结果;
根据所述第一语音识别结果确定所述业务人员是否存在疑问;
若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。
本申请实施例提出一种基于语音识别的文件导出方法,在业务人员和开发人员就数据库表结构进行讨论的过程中,实时采集讨论场地的原始语音信息,并从该原始语音信息中提取出业务人员发出的语音信息;然后,对业务人员发出的语音信息进行识别,得到语音识别结果,并根据该语音识别结果确定业务人员是否存在疑问;若确定业务人员存在疑问,则可以通过调用宏功能的方式导出数据库表结构对应的导图文件。由于最终导出的导图文件可以是鱼骨图、气泡图和逻辑图等业务人员容易理解的文件,因此能够协助业务人员对数据库表结构进行理解,从而减少开发人员的答疑次数,缩短数据库表结构探讨会议所耗费的时间。
在本申请的一个实施例中,所述从所述原始语音信息中提取所述业务人员发出的第一语音信息,可以包括:
获取预存储的所述业务人员的基准语音信息;
将所述原始语音信息包含的各个语音信息分别和所述基准语音信息进行声音特征匹配;
将所述各个语音信息中与所述基准语音信息声音特征匹配成功的语音信息确定为所述业务人员发出的第一语音信息。
在本申请的一个实施例中,在根据所述第一语音识别结果确定所述业务人员是否存在疑问之后,还可以包括:
若确定所述业务人员存在疑问,则根据所述第一语音识别结果确定所述疑问对应的数据表字段;
通过调用宏功能的方式导出与所述数据表字段对应的解释文件。
在本申请的一个实施例中,在获取所述讨论所处场地的原始语音信息之后,还可以包括:
从所述原始语音信息中提取所述开发人员发出的第二语音信息;
对所述第二语音信息进行识别,得到第二语音识别结果;
根据所述第二语音识别结果确定所述开发人员是否存在疑问;
若确定所述开发人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
进一步的,在得到所述第一语音识别结果和所述第二语音识别结果之后,还可以包括:
根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见;
若确定所述开发人员和所述业务人员就所述数据库表结构达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
更进一步的,在根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见之后,还可以包括:
若确定所述开发人员和所述业务人员就所述数据库表结构未达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件和项目文件;
为所述导图文件和所述项目文件中相互关联的内容元素添加对应的关联标记符;
在所述讨论所处场地的显示设备上并排展示已添加所述关联标记符的所述导图文件和所述项目文件。
在本申请的一个实施例中,所述通过调用宏功能的方式导出所述数据库表结构对应的导图文件,可以包括:
调用预先编写的宏功能代码,所述宏功能代码用于导出导图文件;
基于所述宏功能代码对与所述数据库表结构相关的数据表进行处理,从而导出所述数据库表结构对应的导图文件。
第二方面,本申请实施例提供了一种基于语音识别的文件导出装置,包括:
语音信息获取模块,用于在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
第一语音信息提取模块,用于从所述原始语音信息中提取所述业务人员发出的第一语音信息;
第一语音信息识别模块,用于对所述第一语音信息进行识别,得到第一语音识别结果;
第一疑问确定模块,用于根据所述第一语音识别结果确定所述业务人员是否存在疑问;
导图文件导出模块,用于若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例第一方面提出的基于语音识别的文件导出方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请实施例第一方面提出的基于语音识别的文件导出方法。
第五方面,本申请实施例提供了一种计算机程序产品,当该计算机程序产品在终端设备上运行时,使得该终端设备执行如本申请实施例第一方面提出的基于语音识别的文件导出方法。
上述第二方面至第五方面所能实现的有益效果,可以参照上述第一方面的相关说明。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于语音识别的文件导出方法的一个实施例的流程图;
图2是本申请实施例提供的一种基于语音识别的文件导出方法的另一个实施例的流程图;
图3是本申请实施例提供的一种基于语音识别的文件导出装置的一个实施例的结构图;
图4是本申请实施例提供的一种终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在多团队人员的沟通协作中,通过邮件或者即时聊天工具进行工作沟通居多,然而对于开发人员在进行数据库表结构设计这一块,如何更加友好的表现出表结构的设计字段却是值得探讨的一个问题。目前,开发人员和业务人员通常需要开展会议探讨数据库表结构的设计,可是对于非专业的业务人员来说,其一般难以理解数据库表结构中的专业术语,这导致会议过程中需要开发人员多次答疑,极大地增加了会议所耗费的时间。基于这个问题,本申请实施例提出一种基于语音识别的文件导出方法,能够缩短数据库表结构探讨会议所耗费的时间。关于该文件导出方法的具体说明和技术实现细节,可以参见下文所述的方法实施例。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应当理解,本申请实施例提供的基于语音识别的文件导出方法的执行主体可以是手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)、大屏电视等各种类型的终端设备或者服务器,本申请实施例对该终端设备和服务器的具体类型不作任何限制。这里的服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
请参阅图1,本申请实施例中一种基于语音识别的文件导出方法的一个实施例包括:
101、在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
在当前的应用场景中,开发人员和业务人员需要进行数据库表结构设计的讨论,这里的开发人员可以是一人或者多人,业务人员同样可以是一人或者多人。开发人员和业务人员可以在某个指定场地(例如某个会议室)开展会议,在该场地中设置有能够检测语音信号的终端设备,例如可以是处于会议室内的手机、笔记本电脑或者台式电脑等。
在业务人员和开发人员针对数据库表结构进行讨论的过程中,该终端设备可以通过语音检测装置获取到讨论所处场地的语音信息(即原始语音信息),该语音信息中可能包含开发人员发出的语句信息以及业务人员发出的语句信息,也即能够采集到两边人员的沟通内容。另一方面,该终端设备还可以连接指定的显示设备(例如某个大型显示屏),通过该显示设备展示与当前讨论的数据库表结构设计相关的数据表文件(例如某个excel表格)。
102、从所述原始语音信息中提取所述业务人员发出的第一语音信息;
在获取到原始语音信息之后,从该原始语音信息中提取出所述业务人员发出的第一语音信息。原始语音信息通常包含开发人员发出的语音信息和业务人员发出的语音信息,由于不同人员的声音特征一般不同,因此可以通过声音特征匹配的方式从该语音信息中识别出业务人员发出的语音信息和/或开发人员发出的语音信息。
在本申请实施例的一种实现方式中,所述从所述原始语音信息中提取所述业务人员发出的第一语音信息,可以包括:
(1)获取预存储的所述业务人员的基准语音信息;
(2)将所述原始语音信息包含的各个语音信息分别和所述基准语音信息进行声音特征匹配;
(3)将所述各个语音信息中与所述基准语音信息声音特征匹配成功的语音信息确定为所述业务人员发出的第一语音信息。
通常来说,执行会议的开发人员以及业务人员的身份都是已知的,因此可以预先收录每个与会人员的基准语音信息,在会议开展的过程中,可以将检测到的每个语音信息(例如检测到的每句话)分别和预存储的业务人员的基准语音信息进行声音特征的匹配,由于每个人员的声音特征都具有独特性,因此可以准确检测到哪些语音信息是由业务人员发出的。同理,也可以检测到哪些语音信息是由开发人员发出的,而若开发人员或者业务人员有多人,也可以进一步检测出某个语音信息是由哪个开发人员或者哪个业务人员发出的。
103、对所述第一语音信息进行识别,得到第一语音识别结果;
在提取出业务人员发出的第一语音信息之后,对该第一语音信息进行识别,得到第一语音识别结果。这个操作的实质是语音转文本,获得的第一语音识别结果可以是该第一语音信息对应的文本。其中,语音转文本的具体实现原理可以参照现有技术,这里不再赘述。
104、根据所述第一语音识别结果确定所述业务人员是否存在疑问;
在得到第一语音识别结果之后,可以根据该第一语音识别结果判断该业务人员是否存在疑问。具体的,可以根据该语音识别结果是否包含某些指定关键词(例如:吗、为什么、怎样、是什么、不懂、解释,等等)来判断该业务人员是否存在疑问,另外也可以通过检测该第一语音信息的语调特征是否与疑问句的语调特征匹配来判断该业务人员是否存在疑问。
在本申请实施例的一种实现方式中,步骤104可以包括:
1041、检测所述第一语音识别结果是否包含指定关键词;
1042、若所述第一语音识别结果包含所述指定关键词,则确定所述业务人员存在疑问;
1043、若所述第一语音识别结果不包含所述指定关键词,则确定所述业务人员不存在疑问。
例如,可以预先设置疑问语句对应的指定关键词,例如:吗、为什么、怎样、是什么、不懂、解释,等等。若某个第一语音识别结果为“我明白了”,由于其不含疑问语句对应的指定关键词,故可以确定该业务人员不存在疑问。而若某个第一语音识别结果为“字段名M为什么要设置X的字段长度”,由于其包含疑问语句对应的指定关键词“为什么”,故可以确定该业务人员存在疑问。
105、若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。
如果确定业务人员存在疑问,此时可以通过调用宏功能的方式导出与该数据库表结构对应的导图文件,该导图文件可以输出至场地内的某个显示设备上显示。这里的导图文件可以是表或者类的导图文件,形式上可以是鱼骨图、气泡图和逻辑图等业务人员容易理解的文件。通过该导图文件,使得业务人员可以直观地了解该数据库表结构的相关设计细节和原理,从而减少业务人员的疑问和开发人员的答疑次数,进而能够缩短数据库表结构探讨会议所耗费的时间。
在本申请实施例的一种实现方式中,所述通过调用宏功能的方式导出所述数据库表结构对应的导图文件,可以包括:
(1)调用预先编写的宏功能代码,所述宏功能代码用于导出导图文件;
(2)基于所述宏功能代码对与所述数据库表结构相关的数据表进行处理,从而导出所述数据库表结构对应的导图文件。
在实际操作中,可以使用VB(Visual Basic)或者VBA(Visual Basic forApplications,为Visual Basic的一种宏语言)语言编写导出相应导图文件的宏功能代码,例如可以分别编写导出鱼骨图的宏功能代码,导出气泡图的宏功能代码以及导出逻辑图的宏功能代码,等等。然后,调用该宏功能代码对该数据库表结构相关的数据表(主要记录用于描述表结构的相关数据)进行处理,从而导出相应类型的导图文件。
在本申请实施例的一种实现方式中,在根据所述第一语音识别结果确定所述业务人员是否存在疑问之后,还可以包括:
(1)若确定所述业务人员存在疑问,则根据所述第一语音识别结果确定所述疑问对应的数据表字段;
(2)通过调用宏功能的方式导出与所述数据表字段对应的解释文件。
若第一语音识别结果中包含字段名等关键词,则可以确定疑问对应的数据表字段是什么,进而可以通过调用宏功能的方式导出该数据表字段对应的解释文件。通过该解释文件,业务人员即可迅速理解存在疑问的数据表字段的含义和特性,从而进一步缩短会议耗费的时间。另外,可以使用VB或者VBA语言预先编写实现导出各个字段对应解释文件的宏功能代码,在确定数据表字段之后,通过调用该宏功能代码即可导出相应的解释文件,导出的解释文件同样可以输出至场地内的显示设备上显示。例如,若第一语音识别结果为“字段名M为什么要设置X的字段长度”,则可以确定疑问对应的数据表字段为字段M,接下来调用宏功能导出字段M对应的解释文件,以便业务人员理解字段M的含义和特性。
本申请实施例提出一种基于语音识别的文件导出方法,在业务人员和开发人员就数据库表结构进行讨论的过程中,实时采集讨论场地的原始语音信息,并从该原始语音信息中提取出业务人员发出的语音信息;然后,对业务人员发出的语音信息进行识别,得到语音识别结果,并根据该语音识别结果确定业务人员是否存在疑问;若确定业务人员存在疑问,则可以通过调用宏功能的方式导出数据库表结构对应的导图文件。由于最终导出的导图文件可以是鱼骨图、气泡图和逻辑图等业务人员容易理解的文件,因此能够协助业务人员对数据库表结构进行理解,从而减少开发人员的答疑次数,缩短数据库表结构探讨会议所耗费的时间。
请参阅图2,本申请实施例中一种基于语音识别的文件导出方法的另一个实施例包括:
201、在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
步骤201与步骤101相同,具体可参照步骤101的相关说明。
202、从所述原始语音信息中提取所述业务人员发出的第一语音信息以及所述开发人员发出的第二语音信息;
与步骤102相比,步骤202中还会从该原始语音信息中提取开发人员发出的第二语音信息,具体的语音信息提取方式可以参照步骤102中的相关说明。
203、对所述第一语音信息进行识别,得到第一语音识别结果,以及对所述第二语音信息进行识别,得到第二语音识别结果;
与步骤103相比,步骤203中还会对第二语音信息进行识别,得到第二语音识别结果,具体的语音信息识别方式可以参照步骤103中的相关说明。
在本申请实施例的一种实现方式中,在得到所述第一语音识别结果和所述第二语音识别结果之后,还可以包括:
(1)根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见;
(2)若确定所述开发人员和所述业务人员就所述数据库表结构达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
根据开发人员和业务人员的语音识别结果可以确定双方针对该数据库表结构是否达成一致意见,例如,若检测到两方的语音识别结果包含“确定、没问题、定稿、会议结束、同意”等特定关键词,则可以确定双方就该数据库表结构已达成一致意见,此时可以通过调用宏功能的方式导出确定的数据库表结构所对应的项目文件,以减少开发人员后续的开发工作量,提升开发效率。例如,可以使用VB或者VBA语言预先编写实现导出各种类型项目文件的宏功能代码,比如可以分别编写导出DDL文件的宏功能代码,导出mapper文件的宏功能代码以及导出dto文件的宏功能代码,等等。然后,调用宏功能代码导出相应的DDL文件、mapper文件和/或dto文件等项目文件,开发人员无需重复编写代码实现这部分功能,故能有效减少开发人员的工作量。
进一步的,在根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见之后,还可以包括:
(1)若确定所述开发人员和所述业务人员就所述数据库表结构未达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件和项目文件;
(2)为所述导图文件和所述项目文件中相互关联的内容元素添加对应的关联标记符;
(3)在所述讨论所处场地的显示设备上并排展示已添加所述关联标记符的所述导图文件和所述项目文件。
根据开发人员和业务人员的语音识别结果可以确定双方针对该数据库表结构是否达成一致意见,例如,若检测到两方的语音识别结果包含“不对、不同意、有问题、不是这样”等特定关键词,则可以确定双方就该数据库表结构未达成一致意见,此时可以通过调用宏功能的方式同时导出该数据库表结构所对应的项目文件以及导图文件。另一方面,还会为该项目文件和导图文件中相互关联的内容元素添加对应的关联标记符,例如,该项目文件和导图文件都包含数据表参数A和数据表参数B的描述,则可以用标记符“A”在该项目文件和导图文件中将与数据表参数A相关的描述内容标记出来,用标记符“B”在该项目文件和导图文件中将与数据表参数B相关的描述内容标记出来;最后,在场地内的显示设备上并排展示已添加该关联标记符的导图文件和项目文件。通过这样设置,开发人员和业务人员可以直观地查看该数据库表结构中的各个数据表参数分别在导图文件和项目文件中的描述,方便地进行对比分析,从而迅速解决疑问与争论,在最短的时间内使得双方人员达成一致意见。
204、根据所述第一语音识别结果确定所述业务人员是否存在疑问,以及根据所述第二语音识别结果确定所述开发人员是否存在疑问;
与步骤104相比,步骤204中还会根据所述第二语音识别结果确定所述开发人员是否存在疑问,具体的确定是否存在疑问的方式可以参照步骤104中的相关说明。
205、若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件,以及若确定所述开发人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
与步骤105相比,在步骤205中若确定所述开发人员存在疑问,还会通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
在会议讨论的过程中,针对某些业务需求,开发人员可能也会对已设计的数据库表结构产生疑问,此时需要导出并显示相应的项目文件(例如DDL文件),以便开发人员能够查看已定义的数据库对象、例如数据表和数据列等信息,从而迅速解决疑问。总的来说,这个过程中涉及的语音信息提取、语音识别以及人员疑问确定等具体的技术实现细节,可以参照前文所述的涉及业务人员的相关内容。
本申请实施例提出一种基于语音识别的文件导出方法,在业务人员和开发人员就数据库表结构进行讨论的过程中,实时采集讨论场地的原始语音信息,并从该原始语音信息中提取出业务人员发出的语音信息以及开发人员发出的语音信息;然后,对这些语音信息进行识别,得到语音识别结果,并根据该语音识别结果确定业务人员和/或开发人员是否存在疑问;若确定业务人员存在疑问,则可以通过调用宏功能的方式导出数据库表结构对应的导图文件;若确定开发人员存在疑问,则可以通过调用宏功能的方式导出数据库表结构对应的项目文件。与本申请的上一个实施例相比,本实施例能够同时协助解决业务人员和开发人员对数据库表结构的疑问,从而进一步缩短数据库表结构探讨会议所耗费的时间。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
综上所述,本申请实施例在会议的过程中通过语音检测的方式能够判断双方人员是否存在疑问,若存在疑问则可以通过调用宏功能的方式导出数据库表结构对应的导图文件或者项目文件,以协助双方人员对数据库表结构进行理解,从而有效缩短数据库表结构探讨会议所耗费的时间。
对应于上文实施例所述的基于语音识别的文件导出方法,图3示出了本申请实施例提供的一种基于语音识别的文件导出装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图3,该装置包括:
语音信息获取模块301,用于在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
第一语音信息提取模块302,用于从所述原始语音信息中提取所述业务人员发出的第一语音信息;
第一语音信息识别模块303,用于对所述第一语音信息进行识别,得到第一语音识别结果;
第一疑问确定模块304,用于根据所述第一语音识别结果确定所述业务人员是否存在疑问;
导图文件导出模块305,用于若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。
在本申请实施例的一种实现方式中,所述第一语音信息提取模块可以包括:
基准语音获取单元,用于获取预存储的所述业务人员的基准语音信息;
语音信息匹配单元,用于将所述原始语音信息包含的各个语音信息分别和所述基准语音信息进行声音特征匹配;
第一语音信息确定单元,用于将所述各个语音信息中与所述基准语音信息声音特征匹配成功的语音信息确定为所述业务人员发出的第一语音信息。
在本申请实施例的一种实现方式中,所述基于语音识别的文件导出装置还可以包括:
数据表字段确定模块,用于若确定所述业务人员存在疑问,则根据所述第一语音识别结果确定所述疑问对应的数据表字段;
解释文件导出模块,用于通过调用宏功能的方式导出与所述数据表字段对应的解释文件。
在本申请实施例的一种实现方式中,所述基于语音识别的文件导出装置还可以包括:
第二语音信息提取模块,用于从所述原始语音信息中提取所述开发人员发出的第二语音信息;
第二语音信息识别模块,用于对所述第二语音信息进行识别,得到第二语音识别结果;
第二疑问确定模块,用于根据所述第二语音识别结果确定所述开发人员是否存在疑问;
第一项目文件导出模块,用于若确定所述开发人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
进一步的,所述基于语音识别的文件导出装置还可以包括:
意见确定模块,用于根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见;
第二项目文件导出模块,用于若确定所述开发人员和所述业务人员就所述数据库表结构达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
更进一步的,所述基于语音识别的文件导出装置还可以包括:
双方文件导出模块,用于若确定所述开发人员和所述业务人员就所述数据库表结构未达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件和项目文件;
标记符添加模块,用于为所述导图文件和所述项目文件中相互关联的内容元素添加对应的关联标记符;
双方文件展示模块,用于在所述讨论所处场地的显示设备上并排展示已添加所述关联标记符的所述导图文件和所述项目文件。
在本申请实施例的一种实现方式中,所述导图文件导出模块可以包括:
宏功能代码调用单元,用于调用预先编写的宏功能代码,所述宏功能代码用于导出导图文件;
导图文件导出单元,用于基于所述宏功能代码对与所述数据库表结构相关的数据表进行处理,从而导出所述数据库表结构对应的导图文件。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如图1或图2表示的任意一种基于语音识别的文件导出方法。
本申请实施例还提供一种计算机程序产品,当该计算机程序产品在服务器上运行时,使得服务器执行实现如图1或图2表示的任意一种基于语音识别的文件导出方法。
图4是本申请一实施例提供的终端设备的示意图。如图4所示,该实施例的终端设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42。所述处理器40执行所述计算机可读指令42时实现上述各个基于语音识别的文件导出方法实施例中的步骤,例如图1所示的步骤101至105。或者,所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至305的功能。
示例性的,所述计算机可读指令42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令42在所述终端设备4中的执行过程。
所述终端设备4可以是智能手机、笔记本、掌上电脑及云端终端设备等计算设备。所述终端设备4可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的示例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备4还可以包括输入输出设备、网络接入设备、总线等。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(AppLication Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieLd-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于语音识别的文件导出方法,其特征在于,包括:
在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
从所述原始语音信息中提取所述业务人员发出的第一语音信息;
对所述第一语音信息进行识别,得到第一语音识别结果;
根据所述第一语音识别结果确定所述业务人员是否存在疑问;
若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。
2.如权利要求1所述的方法,其特征在于,所述从所述原始语音信息中提取所述业务人员发出的第一语音信息,包括:
获取预存储的所述业务人员的基准语音信息;
将所述原始语音信息包含的各个语音信息分别和所述基准语音信息进行声音特征匹配;
将所述各个语音信息中与所述基准语音信息声音特征匹配成功的语音信息确定为所述业务人员发出的第一语音信息。
3.如权利要求1所述的方法,其特征在于,在根据所述第一语音识别结果确定所述业务人员是否存在疑问之后,还包括:
若确定所述业务人员存在疑问,则根据所述第一语音识别结果确定所述疑问对应的数据表字段;
通过调用宏功能的方式导出与所述数据表字段对应的解释文件。
4.如权利要求1所述的方法,其特征在于,在获取所述讨论所处场地的原始语音信息之后,还包括:
从所述原始语音信息中提取所述开发人员发出的第二语音信息;
对所述第二语音信息进行识别,得到第二语音识别结果;
根据所述第二语音识别结果确定所述开发人员是否存在疑问;
若确定所述开发人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
5.如权利要求4所述的方法,其特征在于,在得到所述第一语音识别结果和所述第二语音识别结果之后,还包括:
根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见;
若确定所述开发人员和所述业务人员就所述数据库表结构达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的项目文件。
6.如权利要求5所述的方法,其特征在于,在根据所述第一语音识别结果和所述第二语音识别结果,确定所述开发人员和所述业务人员就所述数据库表结构是否达成一致意见之后,还包括:
若确定所述开发人员和所述业务人员就所述数据库表结构未达成一致意见,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件和项目文件;
为所述导图文件和所述项目文件中相互关联的内容元素添加对应的关联标记符;
在所述讨论所处场地的显示设备上并排展示已添加所述关联标记符的所述导图文件和所述项目文件。
7.如权利要求1至6中任一项所述的方法,其特征在于,所述通过调用宏功能的方式导出所述数据库表结构对应的导图文件,包括:
调用预先编写的宏功能代码,所述宏功能代码用于导出导图文件;
基于所述宏功能代码对与所述数据库表结构相关的数据表进行处理,从而导出所述数据库表结构对应的导图文件。
8.一种基于语音识别的文件导出装置,其特征在于,包括:
语音信息获取模块,用于在业务人员和开发人员针对数据库表结构进行讨论的过程中,获取所述讨论所处场地的原始语音信息;
第一语音信息提取模块,用于从所述原始语音信息中提取所述业务人员发出的第一语音信息;
第一语音信息识别模块,用于对所述第一语音信息进行识别,得到第一语音识别结果;
第一疑问确定模块,用于根据所述第一语音识别结果确定所述业务人员是否存在疑问;
导图文件导出模块,用于若确定所述业务人员存在疑问,则通过调用宏功能的方式导出所述数据库表结构对应的导图文件。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于语音识别的文件导出方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于语音识别的文件导出方法。
CN202111438225.1A 2021-11-30 2021-11-30 基于语音识别的文件导出方法、装置、设备和存储介质 Pending CN114090586A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111438225.1A CN114090586A (zh) 2021-11-30 2021-11-30 基于语音识别的文件导出方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111438225.1A CN114090586A (zh) 2021-11-30 2021-11-30 基于语音识别的文件导出方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN114090586A true CN114090586A (zh) 2022-02-25

Family

ID=80305652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111438225.1A Pending CN114090586A (zh) 2021-11-30 2021-11-30 基于语音识别的文件导出方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN114090586A (zh)

Similar Documents

Publication Publication Date Title
EP3816812A1 (en) Question answering method and language model training method, apparatus, device, and storgage medium
CN110929094B (zh) 一种视频标题处理方法和装置
CN114298121B (zh) 基于多模态的文本生成方法、模型训练方法和装置
CN104657346A (zh) 智能交互系统中的问题匹配方法和系统
US20220138217A1 (en) Data processing method, electronic equipment and storage medium
CN112699645B (zh) 语料标注方法、装置及设备
CN116882372A (zh) 文本生成方法、装置、电子设备以及存储介质
CN112801099B (zh) 一种图像处理方法、装置、终端设备及介质
CN110188180B (zh) 相似问题的确定方法、装置、电子设备及可读存储介质
CN111401854A (zh) 信息处理方法以及装置
CN114676705B (zh) 一种对话关系处理方法、计算机及可读存储介质
CN113111658B (zh) 校验信息的方法、装置、设备和存储介质
CN118035415A (zh) 问答方法、装置、设备以及存储介质
CN117349515A (zh) 搜索处理方法、电子设备和存储介质
CN110263346B (zh) 基于小样本学习的语意分析方法、电子设备及存储介质
CN110929519B (zh) 实体属性抽取方法及装置
CN114090586A (zh) 基于语音识别的文件导出方法、装置、设备和存储介质
CN113724738B (zh) 语音处理方法、决策树模型训练方法、装置、设备及存储介质
CN115623134A (zh) 会议音频处理方法、装置、设备及存储介质
CN113704452B (zh) 基于Bert模型的数据推荐方法、装置、设备及介质
CN114297380A (zh) 一种数据处理方法、装置、设备及存储介质
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN111198926B (zh) 业务办理管理方法、装置、电子设备及存储介质
CN111627461A (zh) 一种语音质检方法、装置、服务器及存储介质
CN111209348B (zh) 用于输出信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination