CN113793609A - 一种基于语音识别的文件上传方法 - Google Patents

一种基于语音识别的文件上传方法 Download PDF

Info

Publication number
CN113793609A
CN113793609A CN202111043225.1A CN202111043225A CN113793609A CN 113793609 A CN113793609 A CN 113793609A CN 202111043225 A CN202111043225 A CN 202111043225A CN 113793609 A CN113793609 A CN 113793609A
Authority
CN
China
Prior art keywords
file
uploading
module
voice
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111043225.1A
Other languages
English (en)
Inventor
禹成国
田永鑫
武豪
刘乐乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mimao Shanghai Digital Technology Co ltd
Original Assignee
Mimao Shanghai Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mimao Shanghai Digital Technology Co ltd filed Critical Mimao Shanghai Digital Technology Co ltd
Priority to CN202111043225.1A priority Critical patent/CN113793609A/zh
Publication of CN113793609A publication Critical patent/CN113793609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Abstract

本发明涉及计算机技术领域,具体公开了一种基于语音识别的文件上传方法,包括如下步骤:基于语音识别模块采集信息生成识别标识;利用文件检索模块根据识别标识检索目标文件;基于文件上传模块将检索到的目标文件进行上传至对象存储设施。以此能够在文件位置未知情况下快速定位目标文件,并将目标文件进行快速且准确的上传。

Description

一种基于语音识别的文件上传方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于语音识别的文件上传方法。
背景技术
现有上传文件方式是通过人工检索文件点击上传,或者拖拽文件上传。windows10系统的文件检索机制是通过文件树的形式层层人工检索,检索到目标文件后点击上传。百度网盘检索依赖于操作系统,其上传方式提供了点击和拖拽两种形式。
现有技术的缺陷和不足:人工检索点击上传和拖拽上传的基础是明确知晓文件位置,而在文件位置未知的情况下很难检索到目标文件上传。
发明内容
本发明的目的在于提供一种基于语音识别的文件上传方法,旨在解决现有技术中的在文件位置未知的情况下很难检索到目标文件上传的技术问题。
为实现上述目的,本发明采用的一种基于语音识别的文件上传方法,包括如下步骤:
语音输入;
基于语音识别模块采集信息生成识别标识;
利用文件检索模块根据识别标识检索目标文件;
基于文件上传模块将检索到的目标文件进行上传至对象存储设施。
其中,所述语音输入的具体方式为:
用户口述文件名。
其中,在基于语音识别模块采集信息生成识别标识的步骤中:
采集到的语音信息为未经压缩的数据裸流PCM格式,无需处理和转换。
其中,在采集到PCM格式的语音信息后:
调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,其中反馈结果为字符串文本;
利用MD5算法对字符串文本计算得到识别标识。
其中,识别标识是长度固定为32位数字字母混合码的字符串文本。
其中,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中。
其中,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识,从而获取目标文件路径。
本发明的一种基于语音识别的文件上传方法,语音输入;基于语音识别模块采集信息生成识别标识;利用文件检索模块根据识别标识检索目标文件;基于文件上传模块将检索到的目标文件进行上传至对象存储设施。通过在传统人工检索点击上传和拖拽上传的基础上,提供了在文件位置未知情况下的语音文件上传方法,能够快速找到目标文件并进行上传。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的基于语音识别的文件上传方法的原理图。
图2是本发明的基于语音识别的文件上传方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
请参阅图1和图2,本发明提供了一种基于语音识别的文件上传方法,包括如下步骤:
S1:语音输入;
S2:基于语音识别模块采集信息生成识别标识;
S3:利用文件检索模块根据识别标识检索目标文件;
S4:基于文件上传模块将检索到的目标文件进行上传至对象存储设施。
其中,所述语音输入的具体方式为:
用户口述文件名。
在基于语音识别模块采集信息生成识别标识的步骤中:
采集到的语音信息为未经压缩的数据裸流PCM格式,无需处理和转换。
在采集到PCM格式的语音信息后:
调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,其中反馈结果为字符串文本;
利用MD5算法对字符串文本计算得到识别标识。
识别标识是长度固定为32位数字字母混合码的字符串文本。
在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中。
在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识,从而获取目标文件路径。
在基于文件上传模块将检索到的目标文件进行上传至对象存储设施的步骤中:
在获取目标文件路径后,文件上传模块将目标路径文件进行上传,上传文件无需处理或格式转换。
语音识别模块收集用户语音信息的方式为主动式或被动式。
目标文件进行上传至对象存储设施步骤中:
文件上传的目标支持Amazon S3协议的对象存储设施。
具体为:用户口述文件名,语音识别模块采集语音信息生成识别标识,语音采集设备为麦克风,采集到的语音信息为未经压缩的数据裸流PCM(Pulse Code Modulation,脉冲编码调制)格式,无需处理和转换。随后调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,反馈结果的格式为字符串文本。例如语音内容为“北京.jpg”,结果字符串则为“北京.jpg”。利用MD5(Message-Digest Algorithm 5,信息-摘要算法5)对上述字符串文本计算得到识别标识,识别标识是长度固定为32位数字字母混合码的字符串文本。以“北京.jpg”为例,利用MD5计算它得到的识别标识为”6D5DFDA07D668ECEACD1ACAEBB0F8430“。文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,此MD5计算和上述MD5计算是完全一致的。并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中,散列表维护在内存中,这样做的目的是利用散列表查找时间复杂度为O(1)的特性,大幅缩短文件检索的时间。文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识从而获取目标文件路径,文件上传模块将目标路径文件进行上传,上传文件无需处理或格式转换。
上述的语音识别模块收集用户语音信息的方式是主动式或被动式的,可以由用户控制语音输入或者实时监听,实时监听由第三方语音识别对麦克风进行实时语音采集。
其中,第三方语音识别技术是由百度语音识别提供的,支持中英文双语且准确率达70%,不会对语音数据进行格式转换;另外上述文件上传的目标是支持Amazon S3协议的对象存储设施;此外上述检索散列表检索的时间复杂度是O(1)。与传统遍历查找的时间复杂度O(n)相比,数量级从线性缩减至常数。上述所有流程是可以跨平台(Windows、Linux)实施的。跨平台技术的实现基于跨平台的编程语言,如Java和C#这类本身就支持跨平台的语言。在跨平台技术的支持下可以实现一次编写多处运行的效果。
综上所述,本发明提供的一种基于语音识别的文件上传方法,能够在文件位置未知情况下轻松快速的找到目标文件,并将目标文件进行快速及准确的上传。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (7)

1.一种基于语音识别的文件上传方法,其特征在于,包括如下步骤:
语音输入;
基于语音识别模块采集信息生成识别标识;
利用文件检索模块根据识别标识检索目标文件;
基于文件上传模块将检索到的目标文件进行上传至对象存储设施。
2.如权利要求1所述的基于语音识别的文件上传方法,其特征在于,所述语音输入的具体方式为:
用户口述文件名。
3.如权利要求1所述的基于语音识别的文件上传方法,其特征在于,在基于语音识别模块采集信息生成识别标识的步骤中:
采集到的语音信息为未经压缩的数据裸流PCM格式,无需处理和转换。
4.如权利要求3所述的基于语音识别的文件上传方法,其特征在于,在采集到PCM格式的语音信息后:
调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,其中反馈结果为字符串文本;
利用MD5算法对字符串文本计算得到识别标识。
5.如权利要求4所述的基于语音识别的文件上传方法,其特征在于,
识别标识是长度固定为32位数字字母混合码的字符串文本。
6.如权利要求1所述的基于语音识别的文件上传方法,其特征在于,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中。
7.如权利要求6所述的基于语音识别的文件上传方法,其特征在于,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识,从而获取目标文件路径。
CN202111043225.1A 2021-09-07 2021-09-07 一种基于语音识别的文件上传方法 Pending CN113793609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111043225.1A CN113793609A (zh) 2021-09-07 2021-09-07 一种基于语音识别的文件上传方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111043225.1A CN113793609A (zh) 2021-09-07 2021-09-07 一种基于语音识别的文件上传方法

Publications (1)

Publication Number Publication Date
CN113793609A true CN113793609A (zh) 2021-12-14

Family

ID=78879698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111043225.1A Pending CN113793609A (zh) 2021-09-07 2021-09-07 一种基于语音识别的文件上传方法

Country Status (1)

Country Link
CN (1) CN113793609A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016160A1 (zh) * 2015-07-30 2017-02-02 北京奇虎科技有限公司 目标图片分类存储方法及其终端
CN107169075A (zh) * 2017-05-10 2017-09-15 深圳大普微电子科技有限公司 基于特征分析的数据存取方法、存储设备及存储系统
CN107220292A (zh) * 2017-04-25 2017-09-29 上海庆科信息技术有限公司 智能对话装置、反馈式智能语音控制系统及方法
CN107844483A (zh) * 2016-09-18 2018-03-27 腾讯科技(深圳)有限公司 文件管理方法及装置
CN110147350A (zh) * 2019-05-22 2019-08-20 深圳市网心科技有限公司 文件查找方法、装置、电子设备及存储介质
CN111787051A (zh) * 2020-05-15 2020-10-16 厦门快商通科技股份有限公司 基于语音识别的文件传输方法、系统及移动终端
CN112233666A (zh) * 2020-10-22 2021-01-15 中国科学院信息工程研究所 一种云存储环境下中文语音密文存储、检索方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016160A1 (zh) * 2015-07-30 2017-02-02 北京奇虎科技有限公司 目标图片分类存储方法及其终端
CN107844483A (zh) * 2016-09-18 2018-03-27 腾讯科技(深圳)有限公司 文件管理方法及装置
CN107220292A (zh) * 2017-04-25 2017-09-29 上海庆科信息技术有限公司 智能对话装置、反馈式智能语音控制系统及方法
CN107169075A (zh) * 2017-05-10 2017-09-15 深圳大普微电子科技有限公司 基于特征分析的数据存取方法、存储设备及存储系统
CN110147350A (zh) * 2019-05-22 2019-08-20 深圳市网心科技有限公司 文件查找方法、装置、电子设备及存储介质
CN111787051A (zh) * 2020-05-15 2020-10-16 厦门快商通科技股份有限公司 基于语音识别的文件传输方法、系统及移动终端
CN112233666A (zh) * 2020-10-22 2021-01-15 中国科学院信息工程研究所 一种云存储环境下中文语音密文存储、检索方法及系统

Similar Documents

Publication Publication Date Title
US10657325B2 (en) Method for parsing query based on artificial intelligence and computer device
US20180365489A1 (en) Automatically organizing images
CN102436513B (zh) 分布式检索方法和系统
BRPI1008402B1 (pt) Método e aparelho para gerenciamento de informação de texto
US11568018B2 (en) Utilizing machine-learning models to generate identifier embeddings and determine digital connections between digital content items
CN102457817B (zh) 一种手机报中新闻内容的抽取方法及系统
US9146981B2 (en) Automated electronic discovery collections and preservations
US9870422B2 (en) Natural language search
KR20240012245A (ko) 자연어처리 기반의 인공지능 모델을 이용한 faq를 자동생성하기 위한 방법 및 이를 위한 장치
US20140280010A1 (en) Shared media crawler database method and system
CN106570095B (zh) 一种xml数据的操作方法及设备
CN112364051B (zh) 一种数据查询方法及装置
CN113793609A (zh) 一种基于语音识别的文件上传方法
US20160335500A1 (en) Method of and system for generating metadata
CN112052248A (zh) 一种审计大数据处理方法及系统
CN116486812A (zh) 基于语料关系的多领域唇语识别样本自动生成方法及系统
JPWO2012053509A1 (ja) 入力支援プログラム、入力支援装置、及び入力支援方法
CN111651531B (zh) 数据导入方法、装置、设备及计算机存储介质
KR101471522B1 (ko) 콘텐츠의 생성 및 소비에 기반한 개인 정보 제공 시스템
CN112395292B (zh) 一种数据特征提取、匹配方法及装置
CN109492117A (zh) 专利数据分析系统
EP3273365B1 (en) Method for generating search index and server utilizing the same
CN112597220B (zh) 数据文件读取方法、装置、电子设备和介质
TW201441850A (zh) 文檔伺服器分壓系統及方法
CN107145530A (zh) 一种基于附加数据的文档检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination