CN111597790B - 一种基于人工智能的自然语言处理系统 - Google Patents
一种基于人工智能的自然语言处理系统 Download PDFInfo
- Publication number
- CN111597790B CN111597790B CN202010449550.7A CN202010449550A CN111597790B CN 111597790 B CN111597790 B CN 111597790B CN 202010449550 A CN202010449550 A CN 202010449550A CN 111597790 B CN111597790 B CN 111597790B
- Authority
- CN
- China
- Prior art keywords
- module
- natural language
- analysis
- language processing
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003058 natural language processing Methods 0.000 title claims abstract description 40
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 74
- 238000013528 artificial neural network Methods 0.000 claims abstract description 45
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims description 53
- 230000001149 cognitive effect Effects 0.000 claims description 20
- 238000010801 machine learning Methods 0.000 claims description 20
- 238000013519 translation Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 230000001915 proofreading effect Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 6
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- CJDNEKOMKXLSBN-UHFFFAOYSA-N 1-chloro-3-(4-chlorophenyl)benzene Chemical compound C1=CC(Cl)=CC=C1C1=CC=CC(Cl)=C1 CJDNEKOMKXLSBN-UHFFFAOYSA-N 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012896 Statistical algorithm Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011960 computer-aided design Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于人工智能的自然语言处理系统,具体涉及自然语言处理领域,包括信息采集硬件设备和语言处理终端,信息采集硬件设备的内部设有信息采集模块和信息预处理模块,语言处理终端的内部设有语言处理模块和数据处理模块,语言处理模块由自然语言工具包构成,数据处理模块的内部设有深度神经网络。本发明通过基于人工智能的深度学习进行自然语言处理,利用检查和使用数据中的模式来改善程序的理解程度,通过变量赋值与算法优化构建神经网络,再通过神经网络预测和正确输出之间得差异做出记录,并且调谐输入的权重以提高其预测的准确性,待该自然语言处理随着使用时长得增加,使得自然语言处理智能化准确性逐渐提高。
Description
技术领域
本发明涉及自然语言处理技术领域,更具体地说,本发明具体为一种基于人工智能的自然语言处理系统。
背景技术
自然语言通常是指一种自然地随文化演化的语言,如英语、汉语、日语等,是人类交流和思维的主要工具,自然语言处理是计算机以一种聪明而有用的方式分析,理解和从人类语言中获取意义的一种方式,通过利用自然语言处理,开发者可以组织和构建知识来执行自动摘要,翻译,命名实体识别,关系提取,情感分析,语音识别和话题分割等任务。
在自然语言的处理研究中,一般对语义的处理只是在某范围内选定若干低级的原语,用这些原语的结构组织来解决高层次词条的语义,并且这些所需要原浯的语义必须清禁,这样可以解决一定范围的语义问题,实际仅仅是用一定范围的语法结构代替语义描述,并没有真正解决语义的表达问题,随着人工智能的研究取得一定进展计算机已从单纯的数值计算进人到知识处理阶段;从知识产业角度来看,自然语言处理软件占有重要的地位,专家系统、数据库、知识库,计算机辅助设计系统(CAD)、计算机辅助教学系统(Cal)、计算机辅助决策系统、办公室自动化管理系统、智能机器人等,全都需要自然语言做人机界面,长远看来,具有篇章理解能力的自然语言理解系统可用于机器自动翻译、情报检索、自动标引及自动文摘等领域,有着广阔的应用前景。
自然语言处理(NLP)是信息时代最重要的技术之一,理解复杂的语言也是人工智能的重要组成部分,自然语言处理的应用无处不在,因为人们用语言进行大部分沟通:网络搜索,广告,电子邮件,客户服务,语言翻译,发布学报告等等,目前,自然语言处理方法涉及更基于规则的方法,在这种方法中,简单的机器学习算法被告知要在文本中查找哪些单词和短语,并在这些短语出现时给出特定的响应,语言处理局限性较大,智能程度较低。
因此亟需提供一种基于人工智能的自然语言处理系统。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种基于人工智能的自然语言处理系统,通过基于人工智能的深度学习进行自然语言处理,利用检查和使用数据中的模式来改善程序的理解程度,通过变量赋值与算法优化构建神经网络,再通过神经网络预测和正确输出之间得差异做出记录,并且调谐输入的权重以提高其预测的准确性,待该自然语言处理随着使用时长得增加,各层级被不断优化,使得自然语言处理智能化准确性逐渐提高;另外,本发明通过利用目前技术成熟的自然语言工具包,使用集词性标注、处理文本、分类和解析等模块的Python库作为该自然语言处理系统的语言处理模块,帮助系统对语言进行快速处理,为人工智能的深度神经网络提供大量语言特征信息,降低深度神经网络的运算量,有利于自然语言处理的快速运行,提高处理效率,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于人工智能的自然语言处理系统,包括信息采集硬件设备和语言处理终端,所述信息采集硬件设备的内部设有信息采集模块和信息预处理模块,所述语言处理终端的内部设有语言处理模块和数据处理模块,所述信息采集模块包括摄像头和麦克风,所述信息预处理模块包括PCB板、RAM模块、ROM模块和处理器,所述RAM模块、ROM模块和处理器集成于PCB板的表面,所述PCB板的输出端电性连接有数据传输模块,所述信息采集硬件设备的输出端通过数据传输模块与语言处理终端的输入端电信号连接,所述语言处理模块由自然语言工具包构成,所述数据处理模块的内部设有深度神经网络。
在一个优选地实施方式中,所述信息采集硬件设备用于文本信息和语音信息的提取以及文本信息和语音信息的数字化转换,所述PCB板的内部集成有模数转换模块和数模转换模块。
在一个优选地实施方式中,所述语言处理终端用于对信息采集硬件设备的数据进行词性标注、句法分析、自然语言生成、文本分类、信息检索、信息抽取、文字校对、问答系统分析、机器翻译、自动摘要和文字蕴涵分析处理,所述深度神经网络用于干预访问问答系统分析、机器翻译、自动摘要和文字蕴涵分析。
在一个优选地实施方式中,所述数据处理模块包括人为赋值调控和算法分析,所述人为赋值调控和算法分析构成深度神经网络的执行框架,所述人为赋值调控和算法分析包括概率论算法、统计学算法、逼近论算法、凸分析算法和算法复杂度理论以及模拟预测。
在一个优选地实施方式中,所述深度神经网络包括传统逻辑研究、认知模型和理论分析,所述深度神经网络用于执行学习简单特征、建立复杂特征和学习映射并输出。
在一个优选地实施方式中,所述传统逻辑研究由辅助机器学习模型构成,所述传统逻辑研究被配置为将第一分数分配给未被标记的观察,所述认知模型由目标机器学习模型构成,所述认知模型被配置为将第二分数给所述未被标记的观察,所述传统逻辑研究和认知模型来自不同的机器学习模型类别,所述认知模型是有限容量的机器学习模型,所述理论分析由比较部件构成,所述理论分析被配置为比较所述第一分数和所述第二分数,以确定认知模型已经返回假肯定或假否定的结果的概率,所述第一分数和第二分数的比较部件还被配置为执行包括以下操作的比较:确定所述第一分数和所述第二分数之间的差的幅度;在所述幅度为负时,确定目标机器学习模型已经返回假肯定;以及在所述幅度为正时,确定目标机器学习模型已经返回假否定。
在一个优选地实施方式中,所述数据处理模块的内部集成有问答系统分析、机器翻译、自动摘要和文字蕴涵分析算法,所述数据处理模块的输出端电性连接有结果输出,所述结果输出为I/O通信协议接口。
在一个优选地实施方式中,所述自然语言工具包的内部集成有词性标注、句法分析、自然语言生成、文本分类、信息检索、信息抽取和文字校对算法,所述自然语言工具包为基于Chainer框架创建的Python数据库。
本发明的技术效果和优点:
1、本发明通过基于人工智能的深度学习进行自然语言处理,利用检查和使用数据中的模式来改善程序的理解程度,通过变量赋值与算法优化构建神经网络,再通过神经网络预测和正确输出之间得差异做出记录,并且调谐输入的权重以提高其预测的准确性,待该自然语言处理随着使用时长得增加,各层级被不断优化,使得自然语言处理智能化准确性逐渐提高;
2、本发明通过利用目前技术成熟的自然语言工具包,使用集词性标注、处理文本、分类和解析等模块的Python库作为该自然语言处理系统的语言处理模块,帮助系统对语言进行快速处理,为人工智能的深度神经网络提供大量语言特征信息,降低深度神经网络的运算量,有利于自然语言处理的快速运行,提高处理效率;
3、本发明通过设置分体式机构,利用信息采集硬件设备进语音和文字两种方式的信息采集,扩大该自然语言处理系统的适用范围,扩大使用场景,且利用独立的语言处理终端作为语言处理和数据处理的运算机构,分体式布置有利于语言处理终端的一对多联接,降低信息采集硬件设备的数据处理运算量,简化硬件结构,适用于大量推广与普及。
附图说明
图1为本发明的整体结构示意图。
图2为本发明的信息采集硬件结构示意图。
图3为本发明的深度神经网络的组成以及执行结构示意图。
图4为本发明的数据处理模块与深度神经网络的协同作用示意图。
图5为本发明的自然语言工具包执行结构示意图。
图6为本发明的数据处理模块执行结构示意图。
附图标记为:1、信息采集硬件设备;2、语言处理终端;3、信息采集模块;4、信息预处理模块;5、语言处理模块;6、数据处理模块;7、结果输出;8、自然语言工具包;9、深度神经网络;11、摄像头;12、麦克风;13、PCB板;14、RAM模块;15、ROM模块;16、处理器;17、数据传输模块;61、人为赋值调控;62、算法分析;91、传统逻辑研究;92、认知模型;93、理论分析。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如附图1-6所示的一种基于人工智能的自然语言处理系统,包括信息采集硬件设备1和语言处理终端2,信息采集硬件设备1的内部设有信息采集模块3和信息预处理模块4,语言处理终端2的内部设有语言处理模块5和数据处理模块6,信息采集模块3包括摄像头11和麦克风12,信息预处理模块4包括PCB板13、RAM模块14、ROM模块15和处理器16,RAM模块14、ROM模块15和处理器16集成于PCB板13的表面,PCB板13的输出端电性连接有数据传输模块17,信息采集硬件设备1的输出端通过数据传输模块17与语言处理终端2的输入端电信号连接,语言处理模块5由自然语言工具包8构成,数据处理模块6的内部设有深度神经网络9。
实施方式具体为:通过基于人工智能的深度学习进行自然语言处理,利用检查和使用数据中的模式来改善程序的理解程度,通过变量赋值与算法优化构建神经网络,再通过神经网络预测和正确输出之间得差异做出记录,并且调谐输入的权重以提高其预测的准确性,待该自然语言处理随着使用时长得增加,各层级被不断优化,使得自然语言处理智能化准确性逐渐提高;另外,本发明通过利用目前技术成熟的自然语言工具包8,使用集词性标注、处理文本、分类和解析等模块的Python库作为该自然语言处理系统的语言处理模块,帮助系统对语言进行快速处理,为人工智能的深度神经网络9提供大量语言特征信息,降低深度神经网络的运算量,有利于自然语言处理的快速运行,提高处理效率。
其中,信息采集硬件设备1用于文本信息和语音信息的提取以及文本信息和语音信息的数字化转换,PCB板13的内部集成有模数转换模块和数模转换模块,用于将收录的文本和语音信息转换为机器可识别的二进制信息。
其中,语言处理终端2用于对信息采集硬件设备1的数据进行词性标注、句法分析、自然语言生成、文本分类、信息检索、信息抽取、文字校对、问答系统分析、机器翻译、自动摘要和文字蕴涵分析处理,深度神经网络9用于干预访问问答系统分析、机器翻译、自动摘要和文字蕴涵分析,实现对文本和语音的二进制信息进行分析处理。
其中,数据处理模块6包括人为赋值调控61和算法分析62,人为赋值调控61和算法分析62构成深度神经网络9的执行框架,人为赋值调控61和算法分析62包括概率论算法、统计学算法、逼近论算法、凸分析算法和算法复杂度理论以及模拟预测,用于架构深度神经网络9,通过深度神经网络9实现不断优化的处理系统。
其中,深度神经网络9包括传统逻辑研究91、认知模型92和理论分析93,深度神经网络9用于执行学习简单特征、建立复杂特征和学习映射并输出,实现深度神经网络9的执行步骤,利用传统逻辑研究91、认知模型92和理论分析93作为深度神经网络9的算法控制链,保证深度神经网络9的反馈优化操作。
其中,传统逻辑研究91由辅助机器学习模型构成,传统逻辑研究91被配置为将第一分数分配给未被标记的观察,认知模型92由目标机器学习模型构成,认知模型92被配置为将第二分数给未被标记的观察,传统逻辑研究91和认知模型92来自不同的机器学习模型类别,认知模型92是有限容量的机器学习模型,理论分析93由比较部件构成,理论分析93被配置为比较第一分数和第二分数,以确定认知模型92已经返回假肯定或假否定的结果的概率,第一分数和第二分数的比较部件还被配置为执行包括以下操作的比较:确定第一分数和第二分数之间的差的幅度;在幅度为负时,确定目标机器学习模型已经返回假肯定;以及在幅度为正时,确定目标机器学习模型已经返回假否定,实现自动机器学习。
其中,数据处理模块6的内部集成有问答系统分析、机器翻译、自动摘要和文字蕴涵分析算法,数据处理模块6的输出端电性连接有结果输出7,结果输出7为I/O通信协议接口,用于数据信息的智能分析,提取信息更深层次的信息内容。
其中,自然语言工具包8的内部集成有词性标注、句法分析、自然语言生成、文本分类、信息检索、信息抽取和文字校对算法,自然语言工具包8为基于Chainer框架创建的Python数据库,通过现有的Chainer框架协同深度神经网络9的执行。
本发明工作原理:
第一步:信息采集和预处理即通过信息采集硬件设备1内的摄像头11和麦克风12对待提取的语言信息进行采集,并通过信息采集硬件设备1内部集成的处理器16模块的模数转换和数模转换将采集的语音或文本信息收录并进行“模-数”转换,“模-数”转换分别包括:预滤波、采样和量化,之后将量化后的数字信号编码成二进制信息,并将数据信息用ROM模块15存储并通过数据传输模块传递利至语言处理终端;
第二步:语言处理终端2收到的数据信息,利用自然语言工具包8,分布进行处理文本、分类、标记化、词法分析、标记和解析,作为该自然语言处理系统的语言处理模块,帮助系统对语言进行快速处理,为人工智能的深度神经网络9提供大量语言特征信息;之后在数据处理模块6和数据处理模块深度神经网络9的协同下进行词性标注、命名实体识别器、共识解析系统和情感分析,并利用检查和使用数据中的模式来改善程序的理解程度,通过变量赋值与算法优化构建神经网络,再通过神经网络预测和正确输出之间得差异做出记录,并且调谐输入的权重以提高其预测的准确性;
第三步:将语言处理终端2处理后的结果信息尽心输出供各种设备进行分析使用即可。
最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;
其次:本发明公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计,在不冲突情况下,本发明同一实施例及不同实施例可以相互组合;
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于人工智能的自然语言处理系统,其特征在于:包括信息采集硬件设备(1)和语言处理终端(2),所述信息采集硬件设备(1)的内部设有信息采集模块(3)和信息预处理模块(4),所述语言处理终端(2)的内部设有语言处理模块(5)和数据处理模块(6),所述信息采集模块(3)包括摄像头(11)和麦克风(12),所述信息预处理模块(4)包括PCB板(13)、RAM模块(14)、ROM模块(15)和处理器(16),所述RAM模块(14)、ROM模块(15)和处理器(16)集成于PCB板(13)的表面所述PCB板(13)的输出端电性连接有数据传输模块(17),所述信息采集硬件设备(1)的输出端通过数据传输模块(17)与语言处理终端(2)的输入端电信号连接,所述语言处理模块(5)由自然语言工具包(8)构成,所述数据处理模块(6)的内部设有深度神经网络(9);
所述数据处理模块(6)包括人为赋值调控(61)和算法分析(62),所述人为赋值调控(61)和算法分析(62)构成深度神经网络(9)的执行框架,所述人为赋值调控(61)和算法分析(62)包括概率论算法、统计学算法、逼近论算法、凸分析算法和算法复杂度理论以及模拟预测,所述数据处理模块(6)的内部集成有问答系统分析、机器翻译、自动摘要和文字蕴涵分析算法,所述数据处理模块(6)的输出端电性连接有结果输出(7),所述结果输出(7)为I/O通信协议接口;
所述深度神经网络(9)包括传统逻辑研究(91)、认知模型(92)和理论分析(93),所述深度神经网络(9)用于执行学习简单特征、建立复杂特征和学习映射并输出;
所述传统逻辑研究(91)由辅助机器学习模型构成,所述传统逻辑研究(91)被配置为将第一分数分配给未被标记的观察,所述认知模型(92)由目标机器学习模型构成,所述认知模型(92)被配置为将第二分数给所述未被标记的观察,所述传统逻辑研究(91)和认知模型(92)来自不同的机器学习模型类别,所述认知模型(92)是有限容量的机器学习模型,所述理论分析(93)由比较部件构成,所述理论分析(93)被配置为比较所述第一分数和所述第二分数,以确定认知模型(92)已经返回假肯定或假否定的结果的概率,所述第一分数和第二分数的比较部件还被配置为执行包括以下操作的比较:确定所述第一分数和所述第二分数之间的差的幅度;在所述幅度为负时,确定目标机器学习模型已经返回假肯定;以及在所述幅度为正时,确定目标机器学习模型已经返回假否定。
2.根据权利要求1所述的一种基于人工智能的自然语言处理系统,其特征在于:所述信息采集硬件设备(1)用于文本信息和语音信息的提取以及文本信息和语音信息的数字化转换,所述PCB板(13)的内部集成有模数转换模块和数模转换模块。
3.根据权利要求1所述的一种基于人工智能的自然语言处理系统,其特征在于:所述语言处理终端(2)用于对信息采集硬件设备(1)的数据进行词性标注、句法分析、自然语言生成、文本分类、信息检索、信息抽取、文字校对、问答系统分析、机器翻译、自动摘要和文字蕴涵分析处理,所述深度神经网络(9)用于干预访问问答系统分析、机器翻译、自动摘要和文字蕴涵分析。
4.根据权利要求3所述的一种基于人工智能的自然语言处理系统,其特征在于:所述自然语言工具包(8)的内部集成有词性标注、句法分析、自然语言生成、文本分类、信息检索、信息抽取和文字校对算法,所述自然语言工具包(8)为基于Chainer框架创建的Python数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010449550.7A CN111597790B (zh) | 2020-05-25 | 2020-05-25 | 一种基于人工智能的自然语言处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010449550.7A CN111597790B (zh) | 2020-05-25 | 2020-05-25 | 一种基于人工智能的自然语言处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111597790A CN111597790A (zh) | 2020-08-28 |
CN111597790B true CN111597790B (zh) | 2023-12-05 |
Family
ID=72187759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010449550.7A Active CN111597790B (zh) | 2020-05-25 | 2020-05-25 | 一种基于人工智能的自然语言处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111597790B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726392B (zh) * | 2018-12-13 | 2023-10-10 | 井冈山大学 | 一种基于大数据的智能语言认知信息处理系统及方法 |
CN115966206A (zh) * | 2022-11-23 | 2023-04-14 | 中创科技(广州)有限公司 | Ai语音识别的智能图片生成方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5794050A (en) * | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
CN106383835A (zh) * | 2016-08-29 | 2017-02-08 | 华东师范大学 | 一种基于形式语义推理和深度学习的自然语言知识挖掘系统 |
CN109034147A (zh) * | 2018-09-11 | 2018-12-18 | 上海唯识律简信息科技有限公司 | 基于深度学习和自然语言的光学字符识别优化方法和系统 |
CN109582777A (zh) * | 2018-12-06 | 2019-04-05 | 中国银行股份有限公司 | 一种人机智能处理方法及系统 |
CN110705296A (zh) * | 2019-09-12 | 2020-01-17 | 华中科技大学 | 一种基于机器学习和深度学习的中文自然语言处理工具系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190079739A1 (en) * | 2016-01-11 | 2019-03-14 | New Sapience, Inc. | Method and system for machine comprehension |
CN106055537B (zh) * | 2016-05-23 | 2019-03-12 | 王立山 | 一种自然语言机器识别方法及系统 |
US20190325300A1 (en) * | 2018-04-19 | 2019-10-24 | Siemens Healthcare Gmbh | Artificial intelligence querying for radiology reports in medical imaging |
-
2020
- 2020-05-25 CN CN202010449550.7A patent/CN111597790B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5794050A (en) * | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
CN106383835A (zh) * | 2016-08-29 | 2017-02-08 | 华东师范大学 | 一种基于形式语义推理和深度学习的自然语言知识挖掘系统 |
CN109034147A (zh) * | 2018-09-11 | 2018-12-18 | 上海唯识律简信息科技有限公司 | 基于深度学习和自然语言的光学字符识别优化方法和系统 |
CN109582777A (zh) * | 2018-12-06 | 2019-04-05 | 中国银行股份有限公司 | 一种人机智能处理方法及系统 |
CN110705296A (zh) * | 2019-09-12 | 2020-01-17 | 华中科技大学 | 一种基于机器学习和深度学习的中文自然语言处理工具系统 |
Non-Patent Citations (2)
Title |
---|
刘韫赫 ; 吕凝 ; 徐昊 ; .自然语言处理技术简述及在矿冶领域的应用展望.金属世界.2018,(05),全文. * |
王丁 ; .关于自然语言处理技术的分析与研究.科技创新导报.2020,(07),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111597790A (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110727779A (zh) | 基于多模型融合的问答方法及系统 | |
CN109460459B (zh) | 一种基于日志学习的对话系统自动优化方法 | |
Daelemans | Memory-based lexical acquisition and processing | |
CN110287482B (zh) | 半自动化分词语料标注训练装置 | |
CN116501306B (zh) | 一种基于自然语言描述生成接口文档代码的方法 | |
CN112541337B (zh) | 一种基于递归神经网络语言模型的文档模板自动生成方法及系统 | |
CN115858758A (zh) | 一种多非结构化数据识别的智慧客服知识图谱系统 | |
CN111597790B (zh) | 一种基于人工智能的自然语言处理系统 | |
CN113377897B (zh) | 基于深度对抗学习的多语言医疗术语规范标准化系统及方法 | |
CN110717045A (zh) | 一种基于信访信件概况的信件要素自动提取方法 | |
CN115203421A (zh) | 一种长文本的标签生成方法、装置、设备及存储介质 | |
CN116541533A (zh) | 基于多源异构数据的风力发电机多模态工艺图谱建模方法 | |
CN117313728A (zh) | 实体识别方法、模型训练方法、装置、设备和存储介质 | |
CN113065352B (zh) | 一种电网调度工作文本的操作内容识别方法 | |
CN110633468B (zh) | 一种关于对象特征提取的信息处理方法及装置 | |
CN117033579A (zh) | 一种基于llms的新型知识库系统及方法 | |
CN117094390A (zh) | 一种面向海洋工程领域的知识图谱构建及智能搜索方法 | |
CN115374765B (zh) | 一种基于自然语言处理的算力网络5g数据解析系统及方法 | |
CN114064897B (zh) | 一种情感文本数据标注方法、装置、系统及电子设备 | |
CN115619117A (zh) | 基于值班系统的电网智能调度方法 | |
CN115098687A (zh) | 面向电力sdh光传输系统调度运行的告警排查方法及装置 | |
CN111581339B (zh) | 基于树状lstm对生物医学文献的基因事件的抽取方法 | |
CN113822506A (zh) | 一种用于电力调控的多轮次语音交互智能检索系统及方法 | |
CN118113838A (zh) | 一种使用小样本lora微调预训练transformer用于自动客服问答的方法 | |
CN116702772A (zh) | 一种文本特征提取及辅助检索的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |