CN111524511A - 一种农业技术咨询人机对话方法及系统 - Google Patents
一种农业技术咨询人机对话方法及系统 Download PDFInfo
- Publication number
- CN111524511A CN111524511A CN202010251474.9A CN202010251474A CN111524511A CN 111524511 A CN111524511 A CN 111524511A CN 202010251474 A CN202010251474 A CN 202010251474A CN 111524511 A CN111524511 A CN 111524511A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- data
- module
- agricultural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000005516 engineering process Methods 0.000 title claims description 17
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000004891 communication Methods 0.000 claims abstract description 18
- 238000012937 correction Methods 0.000 claims description 63
- 230000005236 sound signal Effects 0.000 claims description 44
- 238000012216 screening Methods 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 claims 1
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012271 agricultural production Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q9/00—Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于农业技术咨询技术领域,公开了一种农业技术咨询人机对话方法及系统,所述农业技术咨询人机对话系统包括:数据输入模块、声音采集模块、主控模块、网络通信模块、语音识别模块、检索模块、农业数据处理模块、显示模块。本发明通过语音识别模块在语音输入存在错误时,无需删除重新输入,有利于语音信息快速识别,提高工作效率;同时通过农业数据处理模块根据多个文件建立多条线程进行数据处理任务,对数据进行预处理,将不完整数据进行填充,比较完整数据文件中两两数据间的哈希值,删除冗余数据,从而解决了现有技术中农业物联网传感数据存在的数据缺失、数据错误、冗余数据等问题。
Description
技术领域
本发明属于农业技术咨询技术领域,尤其涉及一种农业技术咨询人机对话方法及系统。
背景技术
农业科技是农业发展的第一推动力。建国以来特别是改革开放以来,中国农业取得了长足的发展,其中农业科技发挥了巨大作用,为了加强农业技术推广工作,促使农业科研成果和实用技术尽快应用于农业生产,保障农业的发展,实现农业现代化,制定本法。然而,现有农业技术咨询人机对话方法对用户语音识别不准确,识别速度慢;同时,咨询的农业数据中含有大量冗余数据。
综上所述,现有技术存在的问题是:现有农业技术咨询人机对话方法对用户语音识别不准确,识别速度慢;同时,咨询的农业数据中含有大量冗余数据。
发明内容
针对现有技术存在的问题,本发明提供了一种农业技术咨询人机对话方法及系统。
本发明是这样实现的,一种农业技术咨询人机对话方法,所述农业技术咨询人机对话方法,包括:
步骤一,数据输入模块利用输入键盘输入咨询数据,声音采集模块利用声音采集器采集声音信号,经过信号数据的处理传递到主控模块;
步骤二,根据采集到的数据,语音识别模块利用音频识别器对采集的声音进行识别,通过农业数据处理模块利用数据处理程序对农业冗余数据进行清除处理;
步骤三,通过检索模块利用检索程序根据输入数据或声音,进行检索相关的农业信息;
步骤四,通过显示模块利用显示器显示检索农业信息,同时主控模块通过网络通信模块利用网卡接通网络,将信息传递到移动终端;
所述步骤二中,语音识别模块识别方法如下:
(1)通过语音识别程序获取用户输入的具有错误信息的语音信息和对所述语音信息进行纠错的语音纠错信息,并分别存储所述语音信息和语音纠错信息;
(2)对所述语音信息和语音纠错信息进行初步处理,并对处理后的语音信息和语音纠错信息提取特征信息并进行编码,获得语音信息编码和语音纠错信息编码;
(3)分别根据语音信息编码和语音纠错信息编码反推出对应的文字信息,并对比语音信息编码反推出的文字信息和语音纠错信息编码反推出的文字信息,获得第一识别结果;
(4)获取用户输入所述语音信息时所处的环境信息,根据所述环境信息获得第二识别结果;
(5)将所述第二识别结果与词典信息进行对比,获得最终的识别结果,并将所述最终的识别结果呈现给所述用户。
进一步,所述步骤(2)中对所述语音信息和语音纠错信息进行初步处理具体包括:
分别对所述语音信息和语音纠错信息进行滤波处理,并分别对滤波处理后的语音信息和语音纠错信息进行采样;
分别对采样后的语音信息和采样后的语音纠错信息进行编码,获得语音信息编码和语音纠错信息编码。
进一步,所述步骤(3)具体包括:
将所述语音信息编码与现有的声学模型和语音模型进行对比,获得所述语音信息编码与所述声学模型和语音模型的相似编码,并根据相似编码反推出所述语音信息编码对应的第一文字信息;
将所述语音纠错信息编码与现有的声学模型和语音模型进行对比,获得所述语音纠错信息编码与所述声学模型和语音模型的相似编码,并根据相似编码反推出所述语音纠错信息编码对应的第二文字信息;
将所述第一文字信息和所述第二文字信息进行对比,获取相似度最高的第一文字信息和第二文字信息,并用所述第二文字信息替换第一文字信息中与所述第二文字信息相似的部分,形成第一识别结果。
进一步,所述步骤一中,声音采集模块中声音信号采集的过程为:
采集相应的语音信号进行预处理,对信号的放大和增益进行控制,并且对语音信号中的噪声进行去除;
声音信号去噪完成后,按照相应的算法,提取声音信号中的语音识别特征;
根据语音识别特征进行语音识别和训练,同时识别完成后,语音信号进行压缩储存。
进一步,所述步骤一中,声音采集模块中声音信号去噪的方法,包括:
根据语音信号输出的要求,确定语音信号中的一个小波和语音信号中层次,进行分解;
计算出声音信号的小波系数,并且设定一个阈值,对计算出的声音信号的小波系数阈值量化;
根据计算出的层次和阈值量化的小波系数,进行信号的重构,得到不含有噪声的声音信号。
进一步,所述步骤二中,农业数据处理模块处理方法如下:
1)通过筛查程序对不同感测类型的传感器节点进行筛查,选择一个传感器节点作为该感测类型的主节点,所述主节点收集所述感测类型下的传感数据;
2)在每个所述感测类型下接收传感器实时传输的数据流,设定数据读取时间段N,在所述读取时间段N内截取M个归档时间段,将每个所述归档时间段中的小文件根据分布式文件系统的归档方法得到M个归档大文件,其中N、M为≥1的自然数;
3)建立和M个归档大文件数量相同的M条数据处理线程,每条数据处理线程对应一个数据处理任务;
4)每个数据处理任务进行对每个所述归档大文件中的数据块设置邻域半径的大小和邻域内最小值点的个数,对所述数据块划分成多个簇,根据所述簇的中心点与所述数据块中的数据的相似度的计算值进行数据填充,选择距离所述数据最近的所述中心点所属于的簇并把所述数据赋给该簇,得到所述感测类型的完整数据文件;
5)设定滑动窗口,通过对所述完整数据文件进行哈希值计算,根据得到的哈希值遍历已有的列表,确认是否有相同的哈希值;
6)如果有相同的哈希值,则代表记录已存在并在所述完整数据文件中删除。
进一步,所述选择一个传感器节点作为该感测类型的主节点包括:选择设定一个周期内使用频率最低的传感器节点作为该感测类型的主节点,或者,选择设定一个周期内具有最高准确度的传感器节点作为该感测类型的主节点。
进一步,所述确认是否有重复的哈希值,如果没有相同的哈希值,则保留该记录并继续遍历。
进一步,所述步骤三中,检索模块中信息匹配的过程为:
对所输入的关键数据或者语音,进行检测尺度空间极值,确定特征点在数据信息中的位置;同时特征点位置确定后,弱化周围数据的响应;
对输入的特征点进行描述,生成本地特征识别的特征点符号;
在本地数据库中提取响应的特征信息,通过欧式距离计算两者之间的相似度,进行特征的匹配。
本发明提供的另一目的在于提供一种实施所述的农业技术咨询人机对话方法的农业技术咨询人机对话系统,所述农业技术咨询人机对话系统包括:数据输入模块、声音采集模块、主控模块、网络通信模块、语音识别模块、检索模块、农业数据处理模块、显示模块;
数据输入模块,与主控模块连接,用于通过输入键盘输入咨询数据;
声音采集模块,与主控模块连接,用于通过声音采集器采集声音信号;声音采集模块中声音信号采集的过程为:采集相应的语音信号进行预处理,对信号的放大和增益进行控制,并且对语音信号中的噪声进行去除;声音信号去噪完成后,按照相应的算法,提取声音信号中的语音识别特征;根据语音识别特征进行语音识别和训练,同时识别完成后,语音信号进行压缩储存;
主控模块,与数据输入模块、声音采集模块、网络通信模块、语音识别模块、检索模块、农业数据处理模块、显示模块连接,用于通过单片机控制各个模块正常工作;
网络通信模块,与主控模块连接,用于通过网卡接通网络进行网络通信;
语音识别模块,与主控模块连接,用于通过音频识别器对采集的声音进行识别;语音识别模块识别方法如下:通过语音识别程序获取用户输入的具有错误信息的语音信息和对所述语音信息进行纠错的语音纠错信息,并分别存储所述语音信息和语音纠错信息;对所述语音信息和语音纠错信息进行初步处理,并对处理后的语音信息和语音纠错信息提取特征信息并进行编码,获得语音信息编码和语音纠错信息编码;分别根据语音信息编码和语音纠错信息编码反推出对应的文字信息,并对比语音信息编码反推出的文字信息和语音纠错信息编码反推出的文字信息,获得第一识别结果;获取用户输入所述语音信息时所处的环境信息,根据所述环境信息获得第二识别结果;将所述第二识别结果与词典信息进行对比,获得最终的识别结果,并将所述最终的识别结果呈现给所述用户;
检索模块,与主控模块连接,用于通过检索程序根据输入数据或声音进行检索相关的农业信息;
农业数据处理模块,与主控模块连接,用于通过数据处理程序对农业冗余数据进行清除处理,农业数据处理模块处理方法如下:通过筛查程序对不同感测类型的传感器节点进行筛查,选择一个传感器节点作为该感测类型的主节点,所述主节点收集所述感测类型下的传感数据;在每个所述感测类型下接收传感器实时传输的数据流,设定数据读取时间段N,在所述读取时间段N内截取M个归档时间段,将每个所述归档时间段中的小文件根据分布式文件系统的归档方法得到M个归档大文件,其中N、M为≥1的自然数;建立和M个归档大文件数量相同的M条数据处理线程,每条数据处理线程对应一个数据处理任务;每个数据处理任务进行对每个所述归档大文件中的数据块设置邻域半径的大小和邻域内最小值点的个数,对所述数据块划分成多个簇,根据所述簇的中心点与所述数据块中的数据的相似度的计算值进行数据填充,选择距离所述数据最近的所述中心点所属于的簇并把所述数据赋给该簇,得到所述感测类型的完整数据文件;设定滑动窗口,通过对所述完整数据文件进行哈希值计算,根据得到的哈希值遍历已有的列表,确认是否有相同的哈希值;如果有相同的哈希值,则代表记录已存在并在所述完整数据文件中删除;
显示模块,与主控模块连接,用于通过显示器显示检索农业信息。
本发明的优点及积极效果为:本发明通过语音识别模块对获取的语音信息和语音纠错信息进行编码,并根据语音信息编码和语音纠错信息编码分别获得反推文字信息,对比两者的反推文字信息,将相似度高的语音纠错信息编码对应的文字信息替换语音信息编码中的反推文字信息从而获得第一识别结果,获取用户输入语音信息所处的环境信息,并根据环境信息对第一识别结果进行筛选获得第二识别结果,通过将第二识别结果与词典信息进行对比从而获得最终的识别结果。本发明实施例的语音识别方法,在语音输入存在错误时,无需删除重新输入,有利于语音信息快速识别,提高工作效率;同时,通过农业数据处理模块选择农业物联网中最优传感节点收集同类型的传感数据,将预定时间段内的数据流中的小文件合并成归档大文件,并分割成多个文件,以及根据多个文件建立多条线程进行数据处理任务,对数据进行预处理,将不完整数据进行填充,比较完整数据文件中两两数据间的哈希值,删除冗余数据,从而解决了现有技术中农业物联网传感数据存在的数据缺失、数据错误、冗余数据等问题。
附图说明
图1是本发明实施例提供的农业技术咨询人机对话方法流程图。
图2是本发明实施例提供的农业技术咨询人机对话系统结构示意图。
图中:1、数据输入模块;2、声音采集模块;3、主控模块;4、网络通信模块;5、语音识别模块;6、检索模块;7、农业数据处理模块;8、显示模块。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的结构作详细的描述。
如图1所示,本发明提供的农业技术咨询人机对话方法包括以下步骤:
S101:数据输入模块利用输入键盘输入咨询数据,声音采集模块利用声音采集器采集声音信号,经过信号数据的处理传递到主控模块。
S102:根据采集到的数据,语音识别模块利用音频识别器对采集的声音进行识别,通过农业数据处理模块利用数据处理程序对农业冗余数据进行清除处理。
S103:通过检索模块利用检索程序根据输入数据或声音,进行检索相关的农业信息。
S104:通过显示模块利用显示器显示检索农业信息,同时主控模块通过网络通信模块利用网卡接通网络,将信息传递到移动终端。
如图2所示,本发明实施例提供的农业技术咨询人机对话系统包括:数据输入模块1、声音采集模块2、主控模块3、网络通信模块4、语音识别模块5、检索模块6、农业数据处理模块7、显示模块8。
数据输入模块1,与主控模块3连接,用于通过输入键盘输入咨询数据。
声音采集模块2,与主控模块3连接,用于通过声音采集器采集声音信号。
主控模块3,与数据输入模块1、声音采集模块2、网络通信模块4、语音识别模块5、检索模块6、农业数据处理模块7、显示模块8连接,用于通过单片机控制各个模块正常工作。
网络通信模块4,与主控模块3连接,用于通过网卡接通网络进行网络通信。
语音识别模块5,与主控模块3连接,用于通过音频识别器对采集的声音进行识别。
检索模块6,与主控模块3连接,用于通过检索程序根据输入数据或声音进行检索相关的农业信息。
农业数据处理模块7,与主控模块3连接,用于通过数据处理程序对农业冗余数据进行清除处理。
显示模块8,与主控模块3连接,用于通过显示器显示检索农业信息。
本发明提供的与主控模块3连接,用于通过声音采集器采集声音信号的声音采集模块2中声音信号采集的过程为:
采集相应的语音信号进行预处理,对信号的放大和增益进行控制,并且对语音信号中的噪声进行去除;
声音信号去噪完成后,按照相应的算法,提取声音信号中的语音识别特征;
根据语音识别特征进行语音识别和训练,同时识别完成后,语音信号进行压缩储存。
本发明提供的与主控模块3连接,用于通过声音采集器采集声音信号的声音采集模块2中声音信号去噪的方法,包括:
根据语音信号输出的要求,确定语音信号中的一个小波和语音信号中层次,进行分解;
计算出声音信号的小波系数,并且设定一个阈值,对计算出的声音信号的小波系数阈值量化;
根据计算出的层次和阈值量化的小波系数,进行信号的重构,得到不含有噪声的声音信号。
本发明提供的语音识别模块5识别方法如下:
(1)通过语音识别程序获取用户输入的具有错误信息的语音信息和对所述语音信息进行纠错的语音纠错信息,并分别存储所述语音信息和语音纠错信息;
(2)对所述语音信息和语音纠错信息进行初步处理,并对处理后的语音信息和语音纠错信息提取特征信息并进行编码,获得语音信息编码和语音纠错信息编码;
(3)分别根据语音信息编码和语音纠错信息编码反推出对应的文字信息,并对比语音信息编码反推出的文字信息和语音纠错信息编码反推出的文字信息,获得第一识别结果;
(4)获取用户输入所述语音信息时所处的环境信息,根据所述环境信息获得第二识别结果;
(5)将所述第二识别结果与词典信息进行对比,获得最终的识别结果,并将所述最终的识别结果呈现给所述用户。
本发明提供的步骤(2)中对所述语音信息和语音纠错信息进行初步处理具体包括:
分别对所述语音信息和语音纠错信息进行滤波处理,并分别对滤波处理后的语音信息和语音纠错信息进行采样;
分别对采样后的语音信息和采样后的语音纠错信息进行编码,获得语音信息编码和语音纠错信息编码。
本发明提供的步骤(3)具体包括:
将所述语音信息编码与现有的声学模型和语音模型进行对比,获得所述语音信息编码与所述声学模型和语音模型的相似编码,并根据相似编码反推出所述语音信息编码对应的第一文字信息;
将所述语音纠错信息编码与现有的声学模型和语音模型进行对比,获得所述语音纠错信息编码与所述声学模型和语音模型的相似编码,并根据相似编码反推出所述语音纠错信息编码对应的第二文字信息;
将所述第一文字信息和所述第二文字信息进行对比,获取相似度最高的第一文字信息和第二文字信息,并用所述第二文字信息替换第一文字信息中与所述第二文字信息相似的部分,形成第一识别结果。
本发明提供的与主控模块3连接,用于通过检索程序根据输入数据或声音进行检索相关的农业信息的检索模块6中信息匹配的过程为:
对所输入的关键数据或者语音,进行检测尺度空间极值,确定特征点在数据信息中的位置;同时特征点位置确定后,弱化周围数据的响应;
对输入的特征点进行描述,生成本地特征识别的特征点符号;
在本地数据库中提取响应的特征信息,通过欧式距离计算两者之间的相似度,进行特征的匹配。
本发明提供的农业数据处理模块7处理方法如下:
1)通过筛查程序对不同感测类型的传感器节点进行筛查,选择一个传感器节点作为该感测类型的主节点,所述主节点收集所述感测类型下的传感数据;
2)在每个所述感测类型下接收传感器实时传输的数据流,设定数据读取时间段N,在所述读取时间段N内截取M个归档时间段,将每个所述归档时间段中的小文件根据分布式文件系统的归档方法得到M个归档大文件,其中N、M为≥1的自然数;
3)建立和M个归档大文件数量相同的M条数据处理线程,每条数据处理线程对应一个数据处理任务;
4)每个数据处理任务进行对每个所述归档大文件中的数据块设置邻域半径的大小和邻域内最小值点的个数,对所述数据块划分成多个簇,根据所述簇的中心点与所述数据块中的数据的相似度的计算值进行数据填充,选择距离所述数据最近的所述中心点所属于的簇并把所述数据赋给该簇,得到所述感测类型的完整数据文件;
5)设定滑动窗口,通过对所述完整数据文件进行哈希值计算,根据得到的哈希值遍历已有的列表,确认是否有相同的哈希值;
6)如果有相同的哈希值,则代表记录已存在并在所述完整数据文件中删除。
本发明提供的选择一个传感器节点作为该感测类型的主节点包括:选择设定一个周期内使用频率最低的传感器节点作为该感测类型的主节点,或者,选择设定一个周期内具有最高准确度的传感器节点作为该感测类型的主节点。
本发明提供的确认是否有重复的哈希值,如果没有相同的哈希值,则保留该记录并继续遍历。
本发明的工作原理为:数据输入模块利用输入键盘输入咨询数据,声音采集模块2利用声音采集器采集声音信号,经过信号数据的处理传递到主控模块3。根据采集到的数据,语音识别模块5利用音频识别器对采集的声音进行识别,通过农业数据处理模块7利用数据处理程序对农业冗余数据进行清除处理。通过检索模块6利用检索程序根据输入数据或声音,进行检索相关的农业信息。通过显示模块8利用显示器显示检索农业信息,同时主控模块3通过网络通信模块利用网卡接通网络,将信息传递到移动终端。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。
Claims (10)
1.一种农业技术咨询人机对话方法,其特征在于,所述农业技术咨询人机对话方法,包括:
步骤一,数据输入模块利用输入键盘输入咨询数据,声音采集模块利用声音采集器采集声音信号,经过信号数据的处理传递到主控模块;
步骤二,根据采集到的数据,语音识别模块利用音频识别器对采集的声音进行识别,通过农业数据处理模块利用数据处理程序对农业冗余数据进行清除处理;
步骤三,通过检索模块利用检索程序根据输入数据或声音,进行检索相关的农业信息;
步骤四,通过显示模块利用显示器显示检索农业信息,同时主控模块通过网络通信模块利用网卡接通网络,将信息传递到移动终端;
所述步骤二中,语音识别模块识别方法如下:
(1)通过语音识别程序获取用户输入的具有错误信息的语音信息和对所述语音信息进行纠错的语音纠错信息,并分别存储所述语音信息和语音纠错信息;
(2)对所述语音信息和语音纠错信息进行初步处理,并对处理后的语音信息和语音纠错信息提取特征信息并进行编码,获得语音信息编码和语音纠错信息编码;
(3)分别根据语音信息编码和语音纠错信息编码反推出对应的文字信息,并对比语音信息编码反推出的文字信息和语音纠错信息编码反推出的文字信息,获得第一识别结果;
(4)获取用户输入所述语音信息时所处的环境信息,根据所述环境信息获得第二识别结果;
(5)将所述第二识别结果与词典信息进行对比,获得最终的识别结果,并将所述最终的识别结果呈现给所述用户。
2.如权利要求1所述的农业技术咨询人机对话方法,其特征在于,所述步骤(2)中对所述语音信息和语音纠错信息进行初步处理具体包括:
分别对所述语音信息和语音纠错信息进行滤波处理,并分别对滤波处理后的语音信息和语音纠错信息进行采样;
分别对采样后的语音信息和采样后的语音纠错信息进行编码,获得语音信息编码和语音纠错信息编码。
3.如权利要求1所述的农业技术咨询人机对话方法,其特征在于,所述步骤(3)具体包括:
将所述语音信息编码与现有的声学模型和语音模型进行对比,获得所述语音信息编码与所述声学模型和语音模型的相似编码,并根据相似编码反推出所述语音信息编码对应的第一文字信息;
将所述语音纠错信息编码与现有的声学模型和语音模型进行对比,获得所述语音纠错信息编码与所述声学模型和语音模型的相似编码,并根据相似编码反推出所述语音纠错信息编码对应的第二文字信息;
将所述第一文字信息和所述第二文字信息进行对比,获取相似度最高的第一文字信息和第二文字信息,并用所述第二文字信息替换第一文字信息中与所述第二文字信息相似的部分,形成第一识别结果。
4.如权利要求1所述的农业技术咨询人机对话方法,其特征在于,所述步骤一中,声音采集模块中声音信号采集的过程为:
采集相应的语音信号进行预处理,对信号的放大和增益进行控制,并且对语音信号中的噪声进行去除;
声音信号去噪完成后,按照相应的算法,提取声音信号中的语音识别特征;
根据语音识别特征进行语音识别和训练,同时识别完成后,语音信号进行压缩储存。
5.如权利要求1所述的农业技术咨询人机对话方法,其特征在于,所述步骤一中,声音采集模块中声音信号去噪的方法,包括:
根据语音信号输出的要求,确定语音信号中的一个小波和语音信号中层次,进行分解;
计算出声音信号的小波系数,并且设定一个阈值,对计算出的声音信号的小波系数阈值量化;
根据计算出的层次和阈值量化的小波系数,进行信号的重构,得到不含有噪声的声音信号。
6.如权利要求1所述的农业技术咨询人机对话方法,其特征在于,所述步骤二中,农业数据处理模块处理方法如下:
1)通过筛查程序对不同感测类型的传感器节点进行筛查,选择一个传感器节点作为该感测类型的主节点,所述主节点收集所述感测类型下的传感数据;
2)在每个所述感测类型下接收传感器实时传输的数据流,设定数据读取时间段N,在所述读取时间段N内截取M个归档时间段,将每个所述归档时间段中的小文件根据分布式文件系统的归档方法得到M个归档大文件,其中N、M为≥1的自然数;
3)建立和M个归档大文件数量相同的M条数据处理线程,每条数据处理线程对应一个数据处理任务;
4)每个数据处理任务进行对每个所述归档大文件中的数据块设置邻域半径的大小和邻域内最小值点的个数,对所述数据块划分成多个簇,根据所述簇的中心点与所述数据块中的数据的相似度的计算值进行数据填充,选择距离所述数据最近的所述中心点所属于的簇并把所述数据赋给该簇,得到所述感测类型的完整数据文件;
5)设定滑动窗口,通过对所述完整数据文件进行哈希值计算,根据得到的哈希值遍历已有的列表,确认是否有相同的哈希值;
6)如果有相同的哈希值,则代表记录已存在并在所述完整数据文件中删除。
7.如权利要求6所述的农业技术咨询人机对话方法,其特征在于,所述选择一个传感器节点作为该感测类型的主节点包括:选择设定一个周期内使用频率最低的传感器节点作为该感测类型的主节点,或者,选择设定一个周期内具有最高准确度的传感器节点作为该感测类型的主节点。
8.如权利要求6所述的农业技术咨询人机对话方法,其特征在于,所述确认是否有重复的哈希值,如果没有相同的哈希值,则保留该记录并继续遍历。
9.如权利要求1所述的农业技术咨询人机对话方法,其特征在于,所述步骤三中,检索模块中信息匹配的过程为:
对所输入的关键数据或者语音,进行检测尺度空间极值,确定特征点在数据信息中的位置;同时特征点位置确定后,弱化周围数据的响应;
对输入的特征点进行描述,生成本地特征识别的特征点符号;
在本地数据库中提取响应的特征信息,通过欧式距离计算两者之间的相似度,进行特征的匹配。
10.一种实施如权利要求1-9所述的农业技术咨询人机对话方法的农业技术咨询人机对话系统,其特征在于,所述农业技术咨询人机对话系统包括:数据输入模块、声音采集模块、主控模块、网络通信模块、语音识别模块、检索模块、农业数据处理模块、显示模块;
数据输入模块,与主控模块连接,用于通过输入键盘输入咨询数据;
声音采集模块,与主控模块连接,用于通过声音采集器采集声音信号;声音采集模块中声音信号采集的过程为:采集相应的语音信号进行预处理,对信号的放大和增益进行控制,并且对语音信号中的噪声进行去除;声音信号去噪完成后,按照相应的算法,提取声音信号中的语音识别特征;根据语音识别特征进行语音识别和训练,同时识别完成后,语音信号进行压缩储存;
主控模块,与数据输入模块、声音采集模块、网络通信模块、语音识别模块、检索模块、农业数据处理模块、显示模块连接,用于通过单片机控制各个模块正常工作;
网络通信模块,与主控模块连接,用于通过网卡接通网络进行网络通信;
语音识别模块,与主控模块连接,用于通过音频识别器对采集的声音进行识别;语音识别模块识别方法如下:通过语音识别程序获取用户输入的具有错误信息的语音信息和对所述语音信息进行纠错的语音纠错信息,并分别存储所述语音信息和语音纠错信息;对所述语音信息和语音纠错信息进行初步处理,并对处理后的语音信息和语音纠错信息提取特征信息并进行编码,获得语音信息编码和语音纠错信息编码;分别根据语音信息编码和语音纠错信息编码反推出对应的文字信息,并对比语音信息编码反推出的文字信息和语音纠错信息编码反推出的文字信息,获得第一识别结果;获取用户输入所述语音信息时所处的环境信息,根据所述环境信息获得第二识别结果;将所述第二识别结果与词典信息进行对比,获得最终的识别结果,并将所述最终的识别结果呈现给所述用户;
检索模块,与主控模块连接,用于通过检索程序根据输入数据或声音进行检索相关的农业信息;
农业数据处理模块,与主控模块连接,用于通过数据处理程序对农业冗余数据进行清除处理,农业数据处理模块处理方法如下:通过筛查程序对不同感测类型的传感器节点进行筛查,选择一个传感器节点作为该感测类型的主节点,所述主节点收集所述感测类型下的传感数据;在每个所述感测类型下接收传感器实时传输的数据流,设定数据读取时间段N,在所述读取时间段N内截取M个归档时间段,将每个所述归档时间段中的小文件根据分布式文件系统的归档方法得到M个归档大文件,其中N、M为≥1的自然数;建立和M个归档大文件数量相同的M条数据处理线程,每条数据处理线程对应一个数据处理任务;每个数据处理任务进行对每个所述归档大文件中的数据块设置邻域半径的大小和邻域内最小值点的个数,对所述数据块划分成多个簇,根据所述簇的中心点与所述数据块中的数据的相似度的计算值进行数据填充,选择距离所述数据最近的所述中心点所属于的簇并把所述数据赋给该簇,得到所述感测类型的完整数据文件;设定滑动窗口,通过对所述完整数据文件进行哈希值计算,根据得到的哈希值遍历已有的列表,确认是否有相同的哈希值;如果有相同的哈希值,则代表记录已存在并在所述完整数据文件中删除;
显示模块,与主控模块连接,用于通过显示器显示检索农业信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010251474.9A CN111524511A (zh) | 2020-04-01 | 2020-04-01 | 一种农业技术咨询人机对话方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010251474.9A CN111524511A (zh) | 2020-04-01 | 2020-04-01 | 一种农业技术咨询人机对话方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111524511A true CN111524511A (zh) | 2020-08-11 |
Family
ID=71902309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010251474.9A Pending CN111524511A (zh) | 2020-04-01 | 2020-04-01 | 一种农业技术咨询人机对话方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111524511A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102662949A (zh) * | 2012-02-27 | 2012-09-12 | 安科智慧城市技术(中国)有限公司 | 一种基于多特征融合的指定目标检索方法及系统 |
CN105550381A (zh) * | 2016-03-17 | 2016-05-04 | 北京工业大学 | 一种基于改进sift特征的高效图像检索方法 |
CN106780440A (zh) * | 2016-11-29 | 2017-05-31 | 北京邮电大学 | 爆炸电路板残片图像自动比对识别方法 |
CN206757503U (zh) * | 2017-06-04 | 2017-12-15 | 北京市农林科学院 | 一种桌面式农业技术智能咨询问答装置 |
CN107862000A (zh) * | 2017-10-22 | 2018-03-30 | 北京市农林科学院 | 一种农业技术咨询人机对话方法 |
CN109408466A (zh) * | 2018-11-01 | 2019-03-01 | 江苏农牧科技职业学院 | 一种农业物联网用冗余数据处理方法及装置 |
CN109686365A (zh) * | 2018-12-26 | 2019-04-26 | 深圳供电局有限公司 | 一种语音识别方法和语音识别系统 |
CN208880724U (zh) * | 2018-07-17 | 2019-05-21 | 北京市农林科学院 | 一种农业技术科普机器人 |
-
2020
- 2020-04-01 CN CN202010251474.9A patent/CN111524511A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102662949A (zh) * | 2012-02-27 | 2012-09-12 | 安科智慧城市技术(中国)有限公司 | 一种基于多特征融合的指定目标检索方法及系统 |
CN105550381A (zh) * | 2016-03-17 | 2016-05-04 | 北京工业大学 | 一种基于改进sift特征的高效图像检索方法 |
CN106780440A (zh) * | 2016-11-29 | 2017-05-31 | 北京邮电大学 | 爆炸电路板残片图像自动比对识别方法 |
CN206757503U (zh) * | 2017-06-04 | 2017-12-15 | 北京市农林科学院 | 一种桌面式农业技术智能咨询问答装置 |
CN107862000A (zh) * | 2017-10-22 | 2018-03-30 | 北京市农林科学院 | 一种农业技术咨询人机对话方法 |
CN208880724U (zh) * | 2018-07-17 | 2019-05-21 | 北京市农林科学院 | 一种农业技术科普机器人 |
CN109408466A (zh) * | 2018-11-01 | 2019-03-01 | 江苏农牧科技职业学院 | 一种农业物联网用冗余数据处理方法及装置 |
CN109686365A (zh) * | 2018-12-26 | 2019-04-26 | 深圳供电局有限公司 | 一种语音识别方法和语音识别系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6178396B1 (en) | Word/phrase classification processing method and apparatus | |
CN105374356B (zh) | 语音识别方法、语音评分方法、语音识别系统及语音评分系统 | |
CN103810998B (zh) | 基于移动终端设备的离线语音识别方法以及实现方法 | |
CN111462758A (zh) | 智能会议角色分类的方法、装置、设备及存储介质 | |
CN102236639A (zh) | 更新语言模型的系统和方法 | |
CN113806554A (zh) | 面向海量会议文本的知识图谱构建方法 | |
CN116150651A (zh) | 基于ai的深度合成检测方法和系统 | |
CN109686365B (zh) | 一种语音识别方法和语音识别系统 | |
CN116580706B (zh) | 一种基于人工智能的语音识别方法 | |
CN112035700B (zh) | 一种基于cnn的语音深度哈希学习方法及系统 | |
CN111524511A (zh) | 一种农业技术咨询人机对话方法及系统 | |
CN111460114A (zh) | 检索方法、装置、设备及计算机可读存储介质 | |
CN110619877A (zh) | 应用于激光笔的语音识别人机交互方法、装置、系统和存储介质 | |
CN116088796A (zh) | 一种软件开发数据采集分析系统 | |
Yu | Research on music emotion classification based on CNN-LSTM network | |
CN113779312B (zh) | 一种基于知识图谱的非结构化电网数据处理方法及装置 | |
CN111128191B (zh) | 一种在线端对端语音转写方法及系统 | |
CN113486208A (zh) | 一种基于人工智能的语音搜索设备及其搜索方法 | |
CN114117034B (zh) | 一种基于智能模型推送不同风格文本的方法和装置 | |
CN116612746B (zh) | 一种基于人工智能在声学库中进行语音编码识别方法 | |
CN112820274B (zh) | 一种语音信息识别校正方法和系统 | |
CN110888986B (zh) | 信息推送方法、装置、电子设备和计算机可读存储介质 | |
CN117891411B (zh) | 一种海量档案数据优化存储方法 | |
CN113643718B (zh) | 音频数据处理方法和装置 | |
CN115064152A (zh) | 语音识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200811 |