CN113793609A - 一种基于语音识别的文件上传方法 - Google Patents
一种基于语音识别的文件上传方法 Download PDFInfo
- Publication number
- CN113793609A CN113793609A CN202111043225.1A CN202111043225A CN113793609A CN 113793609 A CN113793609 A CN 113793609A CN 202111043225 A CN202111043225 A CN 202111043225A CN 113793609 A CN113793609 A CN 113793609A
- Authority
- CN
- China
- Prior art keywords
- file
- uploading
- module
- voice
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
Abstract
本发明涉及计算机技术领域,具体公开了一种基于语音识别的文件上传方法,包括如下步骤:基于语音识别模块采集信息生成识别标识;利用文件检索模块根据识别标识检索目标文件;基于文件上传模块将检索到的目标文件进行上传至对象存储设施。以此能够在文件位置未知情况下快速定位目标文件,并将目标文件进行快速且准确的上传。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于语音识别的文件上传方法。
背景技术
现有上传文件方式是通过人工检索文件点击上传,或者拖拽文件上传。windows10系统的文件检索机制是通过文件树的形式层层人工检索,检索到目标文件后点击上传。百度网盘检索依赖于操作系统,其上传方式提供了点击和拖拽两种形式。
现有技术的缺陷和不足:人工检索点击上传和拖拽上传的基础是明确知晓文件位置,而在文件位置未知的情况下很难检索到目标文件上传。
发明内容
本发明的目的在于提供一种基于语音识别的文件上传方法,旨在解决现有技术中的在文件位置未知的情况下很难检索到目标文件上传的技术问题。
为实现上述目的,本发明采用的一种基于语音识别的文件上传方法,包括如下步骤:
语音输入;
基于语音识别模块采集信息生成识别标识;
利用文件检索模块根据识别标识检索目标文件;
基于文件上传模块将检索到的目标文件进行上传至对象存储设施。
其中,所述语音输入的具体方式为:
用户口述文件名。
其中,在基于语音识别模块采集信息生成识别标识的步骤中:
采集到的语音信息为未经压缩的数据裸流PCM格式,无需处理和转换。
其中,在采集到PCM格式的语音信息后:
调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,其中反馈结果为字符串文本;
利用MD5算法对字符串文本计算得到识别标识。
其中,识别标识是长度固定为32位数字字母混合码的字符串文本。
其中,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中。
其中,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识,从而获取目标文件路径。
本发明的一种基于语音识别的文件上传方法,语音输入;基于语音识别模块采集信息生成识别标识;利用文件检索模块根据识别标识检索目标文件;基于文件上传模块将检索到的目标文件进行上传至对象存储设施。通过在传统人工检索点击上传和拖拽上传的基础上,提供了在文件位置未知情况下的语音文件上传方法,能够快速找到目标文件并进行上传。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的基于语音识别的文件上传方法的原理图。
图2是本发明的基于语音识别的文件上传方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
请参阅图1和图2,本发明提供了一种基于语音识别的文件上传方法,包括如下步骤:
S1:语音输入;
S2:基于语音识别模块采集信息生成识别标识;
S3:利用文件检索模块根据识别标识检索目标文件;
S4:基于文件上传模块将检索到的目标文件进行上传至对象存储设施。
其中,所述语音输入的具体方式为:
用户口述文件名。
在基于语音识别模块采集信息生成识别标识的步骤中:
采集到的语音信息为未经压缩的数据裸流PCM格式,无需处理和转换。
在采集到PCM格式的语音信息后:
调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,其中反馈结果为字符串文本;
利用MD5算法对字符串文本计算得到识别标识。
识别标识是长度固定为32位数字字母混合码的字符串文本。
在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中。
在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识,从而获取目标文件路径。
在基于文件上传模块将检索到的目标文件进行上传至对象存储设施的步骤中:
在获取目标文件路径后,文件上传模块将目标路径文件进行上传,上传文件无需处理或格式转换。
语音识别模块收集用户语音信息的方式为主动式或被动式。
目标文件进行上传至对象存储设施步骤中:
文件上传的目标支持Amazon S3协议的对象存储设施。
具体为:用户口述文件名,语音识别模块采集语音信息生成识别标识,语音采集设备为麦克风,采集到的语音信息为未经压缩的数据裸流PCM(Pulse Code Modulation,脉冲编码调制)格式,无需处理和转换。随后调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,反馈结果的格式为字符串文本。例如语音内容为“北京.jpg”,结果字符串则为“北京.jpg”。利用MD5(Message-Digest Algorithm 5,信息-摘要算法5)对上述字符串文本计算得到识别标识,识别标识是长度固定为32位数字字母混合码的字符串文本。以“北京.jpg”为例,利用MD5计算它得到的识别标识为”6D5DFDA07D668ECEACD1ACAEBB0F8430“。文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,此MD5计算和上述MD5计算是完全一致的。并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中,散列表维护在内存中,这样做的目的是利用散列表查找时间复杂度为O(1)的特性,大幅缩短文件检索的时间。文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识从而获取目标文件路径,文件上传模块将目标路径文件进行上传,上传文件无需处理或格式转换。
上述的语音识别模块收集用户语音信息的方式是主动式或被动式的,可以由用户控制语音输入或者实时监听,实时监听由第三方语音识别对麦克风进行实时语音采集。
其中,第三方语音识别技术是由百度语音识别提供的,支持中英文双语且准确率达70%,不会对语音数据进行格式转换;另外上述文件上传的目标是支持Amazon S3协议的对象存储设施;此外上述检索散列表检索的时间复杂度是O(1)。与传统遍历查找的时间复杂度O(n)相比,数量级从线性缩减至常数。上述所有流程是可以跨平台(Windows、Linux)实施的。跨平台技术的实现基于跨平台的编程语言,如Java和C#这类本身就支持跨平台的语言。在跨平台技术的支持下可以实现一次编写多处运行的效果。
综上所述,本发明提供的一种基于语音识别的文件上传方法,能够在文件位置未知情况下轻松快速的找到目标文件,并将目标文件进行快速及准确的上传。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (7)
1.一种基于语音识别的文件上传方法,其特征在于,包括如下步骤:
语音输入;
基于语音识别模块采集信息生成识别标识;
利用文件检索模块根据识别标识检索目标文件;
基于文件上传模块将检索到的目标文件进行上传至对象存储设施。
2.如权利要求1所述的基于语音识别的文件上传方法,其特征在于,所述语音输入的具体方式为:
用户口述文件名。
3.如权利要求1所述的基于语音识别的文件上传方法,其特征在于,在基于语音识别模块采集信息生成识别标识的步骤中:
采集到的语音信息为未经压缩的数据裸流PCM格式,无需处理和转换。
4.如权利要求3所述的基于语音识别的文件上传方法,其特征在于,在采集到PCM格式的语音信息后:
调用第三方语音识别接口识别PCM格式的语音数据并反馈结果,其中反馈结果为字符串文本;
利用MD5算法对字符串文本计算得到识别标识。
5.如权利要求4所述的基于语音识别的文件上传方法,其特征在于,
识别标识是长度固定为32位数字字母混合码的字符串文本。
6.如权利要求1所述的基于语音识别的文件上传方法,其特征在于,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件自动检索模块在检索之前会对所有被检索文件的名称进行MD5计算,并将计算生成的识别标识和文件路径以键值对的形式保存于散列表中。
7.如权利要求6所述的基于语音识别的文件上传方法,其特征在于,在利用文件检索模块根据识别标识检索目标文件的步骤中:
所述文件检索模块根据语音识别模块产生的识别标识检索散列表,基于标识内的顺序进行依次匹配完全相同的识别标识,从而获取目标文件路径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111043225.1A CN113793609A (zh) | 2021-09-07 | 2021-09-07 | 一种基于语音识别的文件上传方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111043225.1A CN113793609A (zh) | 2021-09-07 | 2021-09-07 | 一种基于语音识别的文件上传方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113793609A true CN113793609A (zh) | 2021-12-14 |
Family
ID=78879698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111043225.1A Pending CN113793609A (zh) | 2021-09-07 | 2021-09-07 | 一种基于语音识别的文件上传方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113793609A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017016160A1 (zh) * | 2015-07-30 | 2017-02-02 | 北京奇虎科技有限公司 | 目标图片分类存储方法及其终端 |
CN107169075A (zh) * | 2017-05-10 | 2017-09-15 | 深圳大普微电子科技有限公司 | 基于特征分析的数据存取方法、存储设备及存储系统 |
CN107220292A (zh) * | 2017-04-25 | 2017-09-29 | 上海庆科信息技术有限公司 | 智能对话装置、反馈式智能语音控制系统及方法 |
CN107844483A (zh) * | 2016-09-18 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 文件管理方法及装置 |
CN110147350A (zh) * | 2019-05-22 | 2019-08-20 | 深圳市网心科技有限公司 | 文件查找方法、装置、电子设备及存储介质 |
CN111787051A (zh) * | 2020-05-15 | 2020-10-16 | 厦门快商通科技股份有限公司 | 基于语音识别的文件传输方法、系统及移动终端 |
CN112233666A (zh) * | 2020-10-22 | 2021-01-15 | 中国科学院信息工程研究所 | 一种云存储环境下中文语音密文存储、检索方法及系统 |
-
2021
- 2021-09-07 CN CN202111043225.1A patent/CN113793609A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017016160A1 (zh) * | 2015-07-30 | 2017-02-02 | 北京奇虎科技有限公司 | 目标图片分类存储方法及其终端 |
CN107844483A (zh) * | 2016-09-18 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 文件管理方法及装置 |
CN107220292A (zh) * | 2017-04-25 | 2017-09-29 | 上海庆科信息技术有限公司 | 智能对话装置、反馈式智能语音控制系统及方法 |
CN107169075A (zh) * | 2017-05-10 | 2017-09-15 | 深圳大普微电子科技有限公司 | 基于特征分析的数据存取方法、存储设备及存储系统 |
CN110147350A (zh) * | 2019-05-22 | 2019-08-20 | 深圳市网心科技有限公司 | 文件查找方法、装置、电子设备及存储介质 |
CN111787051A (zh) * | 2020-05-15 | 2020-10-16 | 厦门快商通科技股份有限公司 | 基于语音识别的文件传输方法、系统及移动终端 |
CN112233666A (zh) * | 2020-10-22 | 2021-01-15 | 中国科学院信息工程研究所 | 一种云存储环境下中文语音密文存储、检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10657325B2 (en) | Method for parsing query based on artificial intelligence and computer device | |
US20180365489A1 (en) | Automatically organizing images | |
CN102436513B (zh) | 分布式检索方法和系统 | |
BRPI1008402B1 (pt) | Método e aparelho para gerenciamento de informação de texto | |
US11568018B2 (en) | Utilizing machine-learning models to generate identifier embeddings and determine digital connections between digital content items | |
CN102457817B (zh) | 一种手机报中新闻内容的抽取方法及系统 | |
US9146981B2 (en) | Automated electronic discovery collections and preservations | |
US9870422B2 (en) | Natural language search | |
KR20240012245A (ko) | 자연어처리 기반의 인공지능 모델을 이용한 faq를 자동생성하기 위한 방법 및 이를 위한 장치 | |
US20140280010A1 (en) | Shared media crawler database method and system | |
CN106570095B (zh) | 一种xml数据的操作方法及设备 | |
CN112364051B (zh) | 一种数据查询方法及装置 | |
CN113793609A (zh) | 一种基于语音识别的文件上传方法 | |
US20160335500A1 (en) | Method of and system for generating metadata | |
CN112052248A (zh) | 一种审计大数据处理方法及系统 | |
CN116486812A (zh) | 基于语料关系的多领域唇语识别样本自动生成方法及系统 | |
JPWO2012053509A1 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
CN111651531B (zh) | 数据导入方法、装置、设备及计算机存储介质 | |
KR101471522B1 (ko) | 콘텐츠의 생성 및 소비에 기반한 개인 정보 제공 시스템 | |
CN112395292B (zh) | 一种数据特征提取、匹配方法及装置 | |
CN109492117A (zh) | 专利数据分析系统 | |
EP3273365B1 (en) | Method for generating search index and server utilizing the same | |
CN112597220B (zh) | 数据文件读取方法、装置、电子设备和介质 | |
TW201441850A (zh) | 文檔伺服器分壓系統及方法 | |
CN107145530A (zh) | 一种基于附加数据的文档检索方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |