CN105279266B - 一种基于移动互联网社交图片预测用户上下文信息的方法 - Google Patents
一种基于移动互联网社交图片预测用户上下文信息的方法 Download PDFInfo
- Publication number
- CN105279266B CN105279266B CN201510701199.5A CN201510701199A CN105279266B CN 105279266 B CN105279266 B CN 105279266B CN 201510701199 A CN201510701199 A CN 201510701199A CN 105279266 B CN105279266 B CN 105279266B
- Authority
- CN
- China
- Prior art keywords
- user
- picture
- image
- characteristic value
- contextual information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 12
- 230000000694 effects Effects 0.000 title abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000012360 testing method Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 7
- 241001269238 Data Species 0.000 claims 1
- 238000007619 statistical method Methods 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 abstract description 2
- 238000012706 support-vector machine Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 6
- 238000000605 extraction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 238000013145 classification model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明通过分析用户上传到移动互联网上的图片数据,预测图片的内容、用户的性别、天气状况以及活动场景等用户上下文信息。获取用户上传到移动互联网上的图片数据,对图片进行统计分析,并计算相应数字特征。将一张图片的所有数字特征作为图片特征向量,通过图片ID和用户ID将用户的上下文信息和图片特征向量关联起来,分析图片数据与用户上下文信息之间的关系,从而达到依据图片数据预测用户的上下文信息的目的。采用SVM和KNN模型实现对用户的上下文信息的分类预测。本发明将用户的性别、活动场景等作为二分类问题处理,天气状况、图片内容等作为多分类问题处理。本发明实施例的有益效果是,通过分析用用户上传到移动互联网上的图片数据可以对用户的性别、活动场景、图片内容、天气状况等上下文信息做出预测,经过实验能够获得有效的预测效果。
Description
技术领域
本发明涉及移动互联网技术,具体涉及一种基于移动互联网社交图片预测用户上下文信息的方法。
背景技术
在移动互联网时代,图片成为了人们日常生活的一部分,用户不再习惯于通过文字表达情感,而更倾向于把周围所发生的事以图片的形式展示出来。图片逐步取代文字,更多的内容创作将会向图片倾斜,图片更能符合移动互联网时代的时间碎片化、行为移动化以及体验极致等时代特性。
社交网上的图片与用户的上下文信息密切相关,用户的上下文信息在移动互联网应用中扮演着重要角色。目前用户上下文信息多数是静态感知的,通过移动终端的硬件设备来获取,而通过图片数据来获取的方法还是很少,本发明就提供了一种通过图片数据预测用户上下文信息的方法。用户上下文信息预测就是通过分析用户上传到移动互联网上的图片来预测用户的性别、爱好、职业、活动场景以及天气状等上下文信息。本发明对用户上下文信息的研究主要集中在用户上传到移动互联网的社交图片上。采取的分类方法主要是KNN(k-NearestNeighbor)算法和SVM(Support Vector Machine)算法。
发明内容
本发明的目的是提供一种基于移动互联网社交图片预测用户上下文信息的方法。使用本发明提供的实施例,可以通过分析用户上传到移动互联网上的图片对用户的上下文信息进行预测。
本发明通过分析用户上传到移动互联网上的图片,预测用户的性别和活动场景、天气状况等上下文信息。从用户智能手机安装的社交APP(Application)出发,根据社交APP提供的公共交流平台(如朋友圈),获取用户在移动互联上发表的图片数据,记录每张图片的发图用户信息、图片描述的内容信息,包括图片中的天气状况、活动场景、地理位置以及时间等。将获取到的图片进行预处理;然后通过灰度矩阵、颜色矩阵、灰度共生矩阵等提取图片的若干特征。由于不同类型的用户或者用户在不同场景下所发表的图片具有不同的数字特征,同一类型的用户在类似的场景下的图片具有类似的数字特征,故本发明以此为依据来预测用户的上下文信息。
具体计算过程如下:分别计算每张图片的灰度矩阵、灰度共生矩阵、颜色矩阵,并在每个矩阵上提取数学统计特征,得到一组数字特征。一张图片的所有数字特征组成图片特征向量。图片ID(Identity)对应该图片的特征向量,用户ID对应用户的上下文信息。关联用户ID和图片ID,可得到图片特征向量与用户上下文信息之间的关联关系。分析图片特征向量与用户上下文信息之间的关系,从而达到依据用户发表的图片预测用户上下文信息的目的。可采用SVM和KNN模型实现对用户的上下文信息的分类预测。本发明将用户的性别、活动场景等作为二分类问题处理,天气状况、图片内容等作为多分类问题处理。
该方法的步骤包括:
1、使用用户在移动终端安装的社交软件,通过社交软件提供的公共交流平台,获取用户上传到移动互联网上的图片,并记录图片和对应的用户上下文信息;
2、对图片预处理,构建提取特征所用的灰度矩阵、灰度共生矩阵和颜色矩阵;
3、在上述的各矩阵上统计分析,计算并提取图片的数字特征。每个矩阵提取若干个特征值,每张图片总共提取m个特征值,构成图片特征向量P(图片ID,特征值1,特征值2,…,特征值m)1×m;
4、每个用户发表p张图片,共n个用户,可得到特征值矩阵R(用户ID,图片特征向量P)(n*p)×m;
5、通过关键字图片ID和用户ID,将图片的特征值矩阵和用户的上下文信息关联,将用户的上下文信息设置为类标;
6、用训练数据分别训练SVM和KNN分类模型;
7、训练好的SVM和KNN模型分类预测测试样本;
8、输出对测试样本的测试结果,并比较得出最终结果。
最后,实施本发明具有以下有益效果:通过分析用户智上传到移动互联网上的图片可以对用户的性别、活动场景、图片内容等用户上下文信息做出预测,经过实验能够获得有效的预测效果。
附图说明
为清楚阐述本发明的内容,将使用如下附图作为辅助说明之用:
图1是获取用户上下文信息和图片特征数据集的流程图;
图2是数据集预测用户上下文信息的算法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本实施例中,如图1所示,提供本发明提出的方法的特征数据集获取的算法流程:
步骤101、通过社交软件获取用户上传到移动互联网上的图片。在测试用户的移动终端登录登陆社交软件,通过社交软件提供的公共交流平台,下载其好友在最近的一段时间内发到移动互联网上的照片。
步骤102、记录图片内容信息和图片对应的用户上下文信息。记录图片所描述的场景、天气状况以及是室内还是室外等内容信息,并记录发图用户的ID、爱好、职业、性别等基础信息。
步骤103、图片预处理,构建灰度、颜色等矩阵和灰度矩阵。将下载到的图片进行预处理操做,并把图片转换成基于像素点的灰度矩阵、颜色矩阵、灰度共生矩阵等形式,以便于计算。
步骤104、对各个矩阵统计分析,计算并提取数据特征。在上述各个矩阵上统计分析,计算并提取数字特征,每个矩阵提取若干个特征值,每张图片总共提取m个特征值,m个特征值和图片ID组成图片特征向量P(图片ID,特征值1,特征值2,…,特征值m)1×m。
步骤105、总共有n个用户,每个用户发p张图片,将所有图片向量和用户ID转化成图片特征值矩阵。每张图片得到的数字特征不同,所对应的用户上下文信息也不同。将所有的图片特征向量和用户ID组合,得到图片特征值矩阵R(用户ID,图片特征向量P)(n*p)×m。
步骤106、通过图片ID和用户ID,得到用户的上下文信息,将其设为类标。通过图片ID取得图片的内容信息,如图片上的天气、场景等,通过用户ID取得用户信息,如性别、爱好等,这些信息即是用户的上下文信息,每张图片对应一个用户上下文信息。将用户上下文信息设为类标,通过图片ID关联图片特征值矩阵,形成数据集。其中,用户上下文信息中的性别为男和女两类,用户的活动场景分为室内和室外两类,天气状况分为晴、阴、雨、雪四类,图片描述内容分为人物、景物、食物等多类。
在本实施例中,如图2所示,提供本发明提出的预测用户上下文信息方法的算法流程:
步骤201、将数据随机等分为训练集和测试集。数据随机分为训练集和测试集,训练集是测试集的4倍,训练集用于训练SVM和KNN分类模型。
步骤202、训练集用于训练SVM和KNN分类模型。对于不同的用户上下文信息分别训练出性别分类模型、活动场景分类模型和图片内容分类模型等,用于预测的时候使用。其中SVM采用Linear核函数。
步骤203、训练好的SVM模型和KNN模型分别预测测试集。用SVM训练出的分类模型使用对应的SVM预测算法测试测试集数据;KNN训练出的分类模型使用对应的KNN预测算法测试测试集数据。
步骤204、输出对测试样本的预测测试结果,并比较结果,得出最终预测的结果。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利求限定和确定的本发明精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (1)
1.基于移动互联网上社交图片的用户上下文信息预测方法,其特征在于:首先在用户所使用社交工具上,获取用户一段时间内上传到移动互联网上的图片数据;对发图用户的上下文信息进行标记;计算并提取图片的数字特征,得到特征向量(用户ID,图像ID,特征值1,特征值2,…,特征值n),将所有图片数据的特征向量(用户ID,图像ID,特征值1,特征值2,…,特征值n)转化为图片特征值矩阵;通过图像ID、用户ID关联图片特征向量和发图用户的上下文信息,将用户的上下文信息作为类标;将数据随机的分为训练集和测试集,使用SVM、kNN算法对训练集中发图用户的上下文信息训练预测模型,并对测试集中用户的上下文信息进行预测,最后输预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510701199.5A CN105279266B (zh) | 2015-10-26 | 2015-10-26 | 一种基于移动互联网社交图片预测用户上下文信息的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510701199.5A CN105279266B (zh) | 2015-10-26 | 2015-10-26 | 一种基于移动互联网社交图片预测用户上下文信息的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105279266A CN105279266A (zh) | 2016-01-27 |
CN105279266B true CN105279266B (zh) | 2018-07-10 |
Family
ID=55148280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510701199.5A Expired - Fee Related CN105279266B (zh) | 2015-10-26 | 2015-10-26 | 一种基于移动互联网社交图片预测用户上下文信息的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105279266B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503745A (zh) * | 2016-10-26 | 2017-03-15 | 郑州埃文计算机科技有限公司 | 基于社交图片sift特征的上下文信息预测方法 |
CN110187780B (zh) * | 2019-06-10 | 2023-07-21 | 北京百度网讯科技有限公司 | 长文本预测方法、装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902566A (zh) * | 2012-12-26 | 2014-07-02 | 中国科学院心理研究所 | 一种基于微博用户行为的人格预测方法 |
CN104281650A (zh) * | 2014-09-15 | 2015-01-14 | 南京锐角信息科技有限公司 | 一种基于兴趣分析的好友搜索推荐方法及系统 |
CN104573048A (zh) * | 2015-01-20 | 2015-04-29 | 电子科技大学 | 一种基于智能手机流量数据的用户基础属性预测方法 |
CN104991968A (zh) * | 2015-07-24 | 2015-10-21 | 成都云堆移动信息技术有限公司 | 基于文本挖掘的互联网媒体用户属性分析方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110110391A (ko) * | 2010-04-01 | 2011-10-07 | 가톨릭대학교 산학협력단 | 마이크로블로그에서의 비주얼 커뮤니케이션 방법 |
-
2015
- 2015-10-26 CN CN201510701199.5A patent/CN105279266B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902566A (zh) * | 2012-12-26 | 2014-07-02 | 中国科学院心理研究所 | 一种基于微博用户行为的人格预测方法 |
CN104281650A (zh) * | 2014-09-15 | 2015-01-14 | 南京锐角信息科技有限公司 | 一种基于兴趣分析的好友搜索推荐方法及系统 |
CN104573048A (zh) * | 2015-01-20 | 2015-04-29 | 电子科技大学 | 一种基于智能手机流量数据的用户基础属性预测方法 |
CN104991968A (zh) * | 2015-07-24 | 2015-10-21 | 成都云堆移动信息技术有限公司 | 基于文本挖掘的互联网媒体用户属性分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105279266A (zh) | 2016-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110533097B (zh) | 一种图像清晰度识别方法、装置、电子设备及存储介质 | |
CN110489453B (zh) | 基于大数据日志分析的用户游戏实时推荐方法及系统 | |
CN109271493B (zh) | 一种语言文本处理方法、装置和存储介质 | |
CN110198310A (zh) | 一种网络行为反作弊方法、装置及存储介质 | |
CN110147711A (zh) | 视频场景识别方法、装置、存储介质和电子装置 | |
WO2019144892A1 (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN110458165B (zh) | 一种引入注意力机制的自然场景文本检测方法 | |
CN111741330B (zh) | 一种视频内容评估方法、装置、存储介质及计算机设备 | |
CN109376696B (zh) | 视频动作分类的方法、装置、计算机设备和存储介质 | |
CN112749608A (zh) | 视频审核方法、装置、计算机设备和存储介质 | |
CN107798027A (zh) | 一种信息热度预测方法、信息推荐方法及装置 | |
CN109816758B (zh) | 一种基于神经网络的二维角色动画生成方法和装置 | |
CN115713715B (zh) | 一种基于深度学习的人体行为识别方法及识别系统 | |
CN113723530B (zh) | 基于视频分析和电子心理沙盘的智能心理评估系统 | |
CN111143615B (zh) | 一种短视频情感类别的识别装置 | |
CN109559362B (zh) | 一种图像主体脸部替换方法及装置 | |
CN111783712A (zh) | 一种视频处理方法、装置、设备及介质 | |
CN108108450B (zh) | 图像处理的方法及相关设备 | |
CN107392392A (zh) | 基于深度学习的微博转发预测方法 | |
CN105279266B (zh) | 一种基于移动互联网社交图片预测用户上下文信息的方法 | |
JP2018113002A (ja) | 商標情報処理装置及び方法、並びにプログラム | |
Wang et al. | Distortion recognition for image quality assessment with convolutional neural network | |
CN112101231A (zh) | 学习行为的监控方法、终端、小程序以及服务器 | |
CN112995690B (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN114302157A (zh) | 属性标签识别、代播事件检测方法及其装置、设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180710 Termination date: 20181026 |
|
CF01 | Termination of patent right due to non-payment of annual fee |