CN107563351A - 一种基于自然语言处理的图像识别方法 - Google Patents
一种基于自然语言处理的图像识别方法 Download PDFInfo
- Publication number
- CN107563351A CN107563351A CN201710867676.4A CN201710867676A CN107563351A CN 107563351 A CN107563351 A CN 107563351A CN 201710867676 A CN201710867676 A CN 201710867676A CN 107563351 A CN107563351 A CN 107563351A
- Authority
- CN
- China
- Prior art keywords
- information
- image
- natural language
- language processing
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于自然语言处理的图像识别方法,包括以下步骤:(1)相关因素收集;(2)可视化特征分析;(3)将以上两步提取的信息因素进行比较,分配权重,建立信息分量;(4)关键字转化;(5)语法分析解读;(6)关键信息输出。该基于自然语言处理的图像识别方法将自然语言的分析技术应用于图形识别,通过对图形的特征分析,收集关键信息并将信息转化为关键字处理,再利用自然语言分析方法对关键字进行解读,解析出用户需要的信息,进而将此信息应用于大数据收集或搜索引擎得到更详细反馈。
Description
技术领域
本发明涉及一种图像识别方法,具体是一种基于自然语言处理的图像识别方法。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。常用的识别方法主要通过以下三个特征提取实现:颜色特征,颜色的提取的优点在于对图片的大小和方向不敏感,且颜色是描述图片的最简单特征,利用RGB提供的颜色系统,通过统计三种颜色通道的强度及关联性进行特征提取;形状特征,形状为图像的一个重要可视化特征,形状特征描述通常有两种方式:基于边界的描述和基于区域的描述,基于边界的描述使用最多的是傅里叶方法,对形状外层边界进行傅里叶变换实现,基于区域描述通过不变矩实现,通过面积,周长等信息实现;纹理特征,利用图像表面的像素分布规律,通过对纹理结构的规律分析,像素的分布统计,波纹变换生产等实现。通过以上三个特征的提取,对应已有的图片信息模板,给出相应的图像识别信息。
目前应用于图像识别的方法主要是针对其可视化信息的提取,在进行信息提取时需对图像的特征进行分析,常用的分析特征有颜色、纹理和形状。通过特征分析得到不同图像的识别模型,这种模型必须在过去的经验中具备模板,通过模板对应达到图形识别。现有的图像识别方法主要包含以下缺点,使图像识别无法根据使用人的个性化需求反馈相应信息:
一、单一性:目前的图像识别方式,基于图片信息分析后并与已有模板比对实现识别,并未对图像特征与用户需求相结合,实现个性化信息收集与反馈;
二、干扰因素多:通过对图像识别的三个特征颜色、形状、纹理,所接受到的干扰因素较多,例如颜色在不同背景下或场合中差异较大,形状因拍摄角度不同,产生形状变形,纹理受到图像清晰度的影响,所以图像的正确识别率较低,无法通过比较分析,得到准确信息。
因此,本发明提供一种新型的基于自然语言处理的图像识别方法,本方法将自然语言的分析技术应用于图形识别,通过对图形的特征分析,收集关键信息,并将信息转化为关键字处理,再利用自然语言分析方法对关键字进行解读,解析出用户需要的信息,进而将此信息应用于大数据收集或搜索引擎得到更详细反馈。
发明内容
本发明的目的在于提供一种基于自然语言处理的图像识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于自然语言处理的图像识别方法,包括以下步骤:
(1)相关因素收集;
(2)可视化特征分析:对图像的可视化特征进行分析,提取相关图像因素信息;
(3)将以上两步提取的信息因素进行比较,分配权重,建立信息分量;
(4)关键字转化:对信息分量转化为关键字信息;
(5)语法分析解读:通过自然语言分析方法,对关键字进行排序组合,进行语法解读;
(6)关键信息输出:依据解读信息输出相应反馈结果。
作为本发明进一步的方案:所述相关因素包括图像来源及背景。
作为本发明进一步的方案:图像来源及背景具体包括图片的水印信息、网站信息、地点信息。
作为本发明进一步的方案:根据基于自然语言处理的图像识别方法用于大数据统计或互联网精确搜索系统。
与现有技术相比,本发明的有益效果是:
该基于自然语言处理的图像识别方法具有便捷性、准确性和延伸性,其中,便捷性:本方法使网络交流更加人性化,使信息检索变得更加方便、直接、高效;准确性:本方法可以充分理解用户的意图,使搜索范围的定位更加准确,搜索结果比过去有了更高的准确性、相关性和实用性,大大提高了检索效率;延伸性:本方法将图像个体与其相关因素进行联系,通过自然语言分析方法,使图像识别反馈具有个性化反馈。
附图说明
图1为基于自然语言处理的图像识别方法的流程图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
请参阅图1,一种基于自然语言处理的图像识别方法,包括以下步骤:
(1)相关因素收集:通过互联网大数据获取,利用匹配技术,分析图像来源及背景等相关因素信息,例如图片的水印信息,网站信息,地点等信息;对此类信息分配单独的类型空间,以便后期调用;
(2)可视化特征分析:对图像的可视化特征进行分析,提取相关图像因素信息;主要通过以下过程实现:图像的灰度转换;图像的平滑处理;图像的分割以及图像的特征提取;对提取的特征信息创建单独的分类存放空间,建立样本集,并为同类样本集建立关键字标签;
(3)将以上两步提取的信息因素进行比较,分配权重,建立信息分量;使用句法模式识别法,通过对不同类型空间的字段调用,建立简单的模式组合,将关键信息重复性高的信息作为子模式,在子模式下有可描述为更简单的子模式,最终得到一个树形的结构描述模型,根据所建立的树形模式,对信息进行权重分配;
(4)关键字转化:对信息分量转化为关键字信息;根据所建立的树形结构数据框架及信息的权重分配,将信息分类,同类信息组合后,结合大数据分析,转化为关键字;例如:图像中有一棵树,通过对大树轮廓的图像采集,树叶的颜色,以及图像拍摄地理位置等信息,得出几个关键字:树龄,夏天,北京等关键词;
(5)语法分析解读:通过自然语言分析方法,对关键字进行排序组合,进行语法解读;语法分析过程是关键字的筛选及排列组合过程;具体有风格法,使用人的风格与其性格、职业、身份、文化、出身都有直接关系,选择与其风格相近的关键词作为有用信息;境况选择法,具体与使用人目前的境况有关,通过前期背景信息收集,已经基本判断出使用人所处在处境,以上一步大树为例,可以分析使用人在旅游中,还是科学考察中,关注点不同,关键字的筛选重点不同;组合逻辑法,对语句的关键字组合,结合语言的逻辑性及关联性,选择正确的组合方式;
(6)关键信息输出:依据解读信息输出相应反馈结果;反馈结果将根据用户需求得到相应的信息,例如上文中的大树,若为科考人员则优先反馈树木的科目属性,若为摄影师,则优先反馈拍摄信息:光圈,曝光时间等。
通过本方法对图像信息识别输出关键信息,可以将信息提供于大数据统计或互联网精确搜索;例如,用户为旅游爱好者在旅游网站下载一副世界名画(蒙娜丽莎)图片,通过此方法进行图像识别,根据图片来源以及网站关键信息,结合图片识别,向用户反馈出此画现存于法国卢浮宫,并给出相关旅游航班信息,实现精准搜索及反馈。
本发明的工作原理是:该基于自然语言处理的图像识别方法将自然语言的分析技术应用于图形识别,通过对图形的特征分析,收集关键信息并将信息转化为关键字处理,再利用自然语言分析方法对关键字进行解读,解析出用户需要的信息,进而将此信息应用于大数据收集或搜索引擎得到更详细反馈。
该基于自然语言处理的图像识别方法具有便捷性、准确性和延伸性,其中,便捷性:本方法使网络交流更加人性化,使信息检索变得更加方便、直接、高效;准确性:本方法可以充分理解用户的意图,使搜索范围的定位更加准确,搜索结果比过去有了更高的准确性、相关性和实用性,大大提高了检索效率;延伸性:本方法将图像个体与其相关因素进行联系,通过自然语言分析方法,使图像识别反馈具有个性化反馈。
在本基于自然语言处理的图像识别方法的描述中,需要说明的是,除非另有明确的规定和限定,术语“设置”、“相连”及“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下做出各种变化。
Claims (4)
1.一种基于自然语言处理的图像识别方法,其特征在于,包括以下步骤:
(1)相关因素收集;
(2)可视化特征分析:对图像的可视化特征进行分析,提取相关图像因素信息;
(3)将以上两步提取的信息因素进行比较,分配权重,建立信息分量;
(4)关键字转化:对信息分量转化为关键字信息;
(5)语法分析解读:通过自然语言分析方法,对关键字进行排序组合,进行语法解读;
(6)关键信息输出:依据解读信息输出相应反馈结果。
2.根据权利要求1所述的基于自然语言处理的图像识别方法,其特征在于,所述相关因素包括图像来源及背景。
3.根据权利要求2所述的基于自然语言处理的图像识别方法,其特征在于,图像来源及背景具体包括图片的水印信息、网站信息、地点信息。
4.根据权利要求1-3任一所述的基于自然语言处理的图像识别方法用于大数据统计或互联网精确搜索系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710867676.4A CN107563351A (zh) | 2017-09-22 | 2017-09-22 | 一种基于自然语言处理的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710867676.4A CN107563351A (zh) | 2017-09-22 | 2017-09-22 | 一种基于自然语言处理的图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107563351A true CN107563351A (zh) | 2018-01-09 |
Family
ID=60981814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710867676.4A Pending CN107563351A (zh) | 2017-09-22 | 2017-09-22 | 一种基于自然语言处理的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107563351A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060080361A1 (en) * | 2004-09-21 | 2006-04-13 | Masaru Suzuki | Document information processing apparatus, document information processing method, and document information processing program |
CN103106239A (zh) * | 2012-12-10 | 2013-05-15 | 江苏乐买到网络科技有限公司 | 一种图像中对象的识别方法和装置 |
CN106446782A (zh) * | 2016-08-29 | 2017-02-22 | 北京小米移动软件有限公司 | 图像识别方法及装置 |
-
2017
- 2017-09-22 CN CN201710867676.4A patent/CN107563351A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060080361A1 (en) * | 2004-09-21 | 2006-04-13 | Masaru Suzuki | Document information processing apparatus, document information processing method, and document information processing program |
CN103106239A (zh) * | 2012-12-10 | 2013-05-15 | 江苏乐买到网络科技有限公司 | 一种图像中对象的识别方法和装置 |
CN106446782A (zh) * | 2016-08-29 | 2017-02-22 | 北京小米移动软件有限公司 | 图像识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102089100B1 (ko) | 이미지 데이터베이스 기반 상호인식차를 최소화하는 인테리어 서비스 제공 시스템 | |
CN109034159A (zh) | 图像信息提取方法和装置 | |
CN112200211B (zh) | 一种基于残差网络和迁移学习的小样本鱼识别方法及系统 | |
CN106203454B (zh) | 证件版式分析的方法及装置 | |
CN114862845B (zh) | 手机触摸屏的缺陷检测方法、装置、设备及存储介质 | |
CN109614508A (zh) | 一种基于深度学习的服装图像搜索方法 | |
CN102880729A (zh) | 基于人脸检测与识别的人物图片索引方法及装置 | |
CN110033007A (zh) | 基于深度姿态预估和多特征融合的行人衣着属性识别方法 | |
US20180232400A1 (en) | Sketch-based image searching system using cell-orientation histograms and outline extraction based on medium-level features | |
CN107633038A (zh) | 基于图像识别技术的茶叶识别方法及其系统 | |
CN109948429A (zh) | 图像分析方法、装置、电子设备及计算机可读介质 | |
CN111062441A (zh) | 基于自监督机制和区域建议网络的场景分类方法及装置 | |
CN105183950B (zh) | 一种基于移动终端查阅工程图纸的方法及系统 | |
CN116257877A (zh) | 一种面向隐私计算的数据分类分级方法 | |
JP5507962B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
Zhang et al. | A shell dataset, for shell features extraction and recognition | |
CN107239787A (zh) | 一种利用多来源数据具有隐私保护功能的图象分类方法 | |
CN116863327B (zh) | 一种基于双域分类器协同对抗的跨域小样本分类方法 | |
CN107563351A (zh) | 一种基于自然语言处理的图像识别方法 | |
Gong et al. | Generating text sequence images for recognition | |
CN110377790A (zh) | 一种基于多模态私有特征的视频自动标注方法 | |
CN113920127B (zh) | 一种训练数据集独立的单样本图像分割方法和系统 | |
CN107491459A (zh) | 三维立体图像的检索方法和装置 | |
Li et al. | Artpdgan: Creating artistic pencil drawing with key map using generative adversarial networks | |
Shinde et al. | Study on Fruit Recognization Using Image Processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180109 |
|
RJ01 | Rejection of invention patent application after publication |