CN111047455A - 一种针对邮件的个人塑像方法及系统 - Google Patents
一种针对邮件的个人塑像方法及系统 Download PDFInfo
- Publication number
- CN111047455A CN111047455A CN201911422451.3A CN201911422451A CN111047455A CN 111047455 A CN111047455 A CN 111047455A CN 201911422451 A CN201911422451 A CN 201911422451A CN 111047455 A CN111047455 A CN 111047455A
- Authority
- CN
- China
- Prior art keywords
- mails
- account
- information
- private
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/42—Mailbox-related aspects, e.g. synchronisation of mailboxes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/101—Access control lists [ACL]
Abstract
本发明公开了一种针对邮件的个人塑像方法及系统,涉及信息安全领域,该方法包括选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件。遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件。遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱。遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱。匹配私人邮件中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱。遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
Description
技术领域
本发明涉及信息安全领域,具体涉及一种针对邮件的个人塑像方法及系统。
背景技术
在信息技术的快速发展的前景下,出现了用户画像分析技术,用户画像是客观、准确地描述目标用户的工具和方法。在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。
现有技术中,大部分用户画像的生成方法采用关键词提取方法来生成用户标签,这种画像方式简单迅速,但是对于复杂的数据类型,难以进行。
电子邮件作为用户的信息之一,是—种用电子手段提供信息交换的通信方式,是互联网应用最广的服务。通过网络的电子邮件系统,用户可以简单、高速、低成本的与世界上任何一个角落的网络用户联系。这些邮件内容可以很真实的反映出一个人的生活状体。但是电子邮件的数据为多层次、多级别、多种类型的数据,是难以通过简单的关键词提取的方式来画像的。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种针对邮件的个人塑像方法及系统,能够通过对取证后的邮件账户进行全方位的分析,塑造用户的身份画像。
为达到以上目的,第一方面,本发明实施例提供一种针对邮件的个人塑像方法,其包括:
选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;
遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;
遍历所有行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
作为一个优选的实施方案,遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件,包括:
匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。
作为一个优选的实施方案,提取所述全部邮件包括:
设置收件人和/或发件人的白名单,正文关键词的黑名单;
遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;
将得到的邮件作为全部邮件。
作为一个优选的实施方案,所述遍历所有带有账号邮件标签的邮件,提取邮件正文,并通过关键字匹配,得到私人账号信息包括:
设置邮件的发件人以及收件人的匹配名单,并与预设的格式匹配样式进行匹配;
筛选账号邮件中符合所述匹配名单的邮件,并对应所述格式匹配样式,提取所述邮件正文中的账户信息,所述账户信息包括:账户所属网址、账户名称。
作为一个优选的实施方案,所述设置数据还包括账户登录信息,所述登录信息包括登录时间,登录地点。
作为一个优选的实施方案,获取所述账户登录信息,绘制运动轨迹图谱。
作为一个优选的实施方案,所述设置数据包括所述邮箱账户的邮箱订阅数据、收藏夹数据、小标签数据、星标邮件数据、邮箱网盘数据。
第二方面,本发明实施例还提供一种针对邮件的个人塑像系统,其包括:
取证模块,用于选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
分类模块,用于遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
帐号信息模块,用于遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
社交模块,用于遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;
私人信息模块,用于遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;
行为模块,用于遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
作为一个优选的实施方案,所述分类模块包括:
第一标记模块,用于匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
第二标记模块,用于通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
第三标记模块,用于通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。
作为一个优选的实施方案,其还包括
过滤模块,所述过滤模块用于设置收件人和/或发件人的白名单,正文关键词的黑名单;遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;将得到的邮件作为全部邮件。与现有技术相比,本发明的优点在于:
本发明一种针对邮件的个人塑像方法及系统首先提取出一个邮件账号中可能使用的所有数据:设置数据和全部邮件,其中设置数据包括了个人对邮箱账号的各个偏好设置,拥有较强的个人偏好信息,而全部邮件为个人在生活中涉及的方方面面且与邮箱有关的信息。提取这些信息保证拥有该邮箱账号的个人的信息能够完整的使用。进一步的,本发明将该账号中的所有邮件进行了分类,器分类为私人邮件、行为邮件和账号邮件。通过这些邮件的分类,能够反映个人各个方面的信息,其中私人邮件反映了邮箱账户所有人与其他收件人、发件人的亲密关系,行为邮件反映了邮箱所有人在生活中各个方面行为,如在网校进行学习、在酒店进行住宿,且网校以及酒店向用户发送了邮件。账号邮件则是邮箱账户所有人将该邮箱设置为其各个账户的绑定邮箱、或者找回密码的邮箱时,该邮箱账号会收到关于账号信息的邮件,通过对这些邮件的中的账号信息提取,能够找出邮箱账户所有人的各个账户信息,进而绘制图谱。最终从身份、社交关系、行为体现了邮箱账户所有人的较为完整的信息。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对实施例对应的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种针对邮件的个人塑像方法实施例步骤流程图;
图2为本发明一种针对邮件的个人塑像系统实施例的结构示意图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细说明。
本发明实施例提供一种针对邮件的个人塑像方法及系统,其通过收集邮箱账户中的账户信息、行为信息以及社交关系,并进行图谱绘制,能够较为全面且深入的的进行个人信息绘制和挖掘。
为达到上述技术效果,本申请的总体思路如下:
在获得许可后:
选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱,同时匹配私人邮件中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,制定人物标签,绘制私人信息图谱;
遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
综上所述,针对目前用户网络信息,特别是大量的邮件信息,如果人工进行逐条信件的阅读和分析,然后进行记录和图谱绘制,
为了更好的理解上述技术方案,下面结合具体实施方式进行详细的说明。
参见图1所示,本发明实施例提供一种针对邮件的个人塑像方法,其包括:
S1:选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
S2:遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
S3:遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制帐号信息图谱;S4:遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;
S5:遍历所有私人邮件,匹配私人邮件中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,制定人物标签,绘制私人信息图谱;
S6:遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
在一个邮箱账户中,除了邮件,其还包括有账户所有人在使用该邮箱账户时候的个人设置痕迹,这些设置痕迹包括有邮箱订阅、收藏夹、小标签、星标邮件、邮箱网盘等等对于邮箱的调整、设置行为。因此,在获得许可后:提取选定邮箱账号的数据时候,除了对邮件进行提取,为了更加全面的进行个人身份塑像还需要提取关于邮箱账号的设置数据。
进一步的,个人邮箱来说,邮件可能会十分繁多,动辄上千件甚至上万件邮件,若直接进行提取和分析,其运行的效率将十分不理想。本案则将邮件分类为私人邮件、行为邮件、以及账号邮件,
在完成邮件的分类后,进一步的需要对邮件中的信息进行解析,本案对于账号邮件,通过关键字匹配来查找其私人账号信息。提取出帐号注册、登陆提醒等类别邮件中的网站名称、帐号、密码、登陆注册时间、登陆地点等信息,构建用户的虚拟账号图谱;具体来说,针对软件注册、验证、登陆提醒类邮件进行着重分析,根据不同的邮件内容添加特定的解析格式来进行匹配,提取出网站名称、帐号、密码、登陆注册时间、登陆地点等信息来构建虚拟账号图谱,例如邮件正文中出现:“恭喜你,你的帐号“qaz123456”在2017年8月8日8时8分注册成功,密码为“123456”,请牢记。”或是“你的帐号“qaz123456”在“湖北省武汉市”登陆,请确定账户安全。”,预研后可根据正则表达式或是关键词匹配提取出的帐号、密码、注册时间、登陆地等信息,并整理成结构化数据,构建成虚拟账号图谱。
同时,对于私人邮件,则首先着重提取邮件中关于收件人信息、发件人信息与邮件账号所有人的关系。记录用户与联系人的信息标签,并统计联系次数来分析亲密程度。进而得到关于邮箱账号所有人与其他人员的社交关系,根据该关系进行绘图,能够得出其社交信息图谱。
其次,还需要提取用户的设置信息,在用户的设置信息中还有邮箱账户所有人对邮箱账号的偏好选择和设置信息,如邮箱订阅、收藏夹、小标签、星标邮件、邮箱网盘等,这些信息能够反映出一个人的爱好、工作情况等。最后,在邮箱账户中会提及用户的相关偏好和行为,也可以进行提取和标记,例如,在用户网盘中,多次匹配到有羽毛球运动会林丹的信息,那么可以给用户的爱好上添加“羽毛球”标签,在备注中注明“林丹”,并在关联列表中添加:网盘-第3封-“我喜欢的运动员”;在用户的星标邮件中,多次定位到一些情感词汇,可以把发件人添加到亲密对象标签中,并统计与该联系人的联系次数;在邮箱订阅里面,匹配到互联网类的关键词很高,可以在用户的工作和爱好中添加互联网标签,并同时在标签备注中添加对应的关键词与发件人邮箱。在完成上述信息的提取和标记后,即完成了关于私人信息的相关数据分析、和标签标记,进而能够完成关于邮箱账户所有人的其关于喜好、爱好、话题关注点等等,私人信息,从完成私人信息图谱的绘制。
进一步的,对于行为邮件来说,本发明直接通过关键字匹配得出用户的生活行为信息。如用户在进行网络购物、交通、酒店预定、软件注册验证登陆等等时候,均可能用到该邮箱,通过对这些邮件的分析,能够得出用户在购物、交通、住宿等方面的信息。
具体的,根据不同的邮件内容添加特定的解析格式来进行匹配,提取出网站名称、帐号、密码、行为发生时间、行为发生地点等信息来构建虚拟账号图谱,例如出一封“12306@rails.com.cn”的火车票信息,解析正文内容得到:您于2017年8月8日在中国铁路客户服务中心网站(12306.cn)成功购买了1张车票,票款共计100元,订单号码E123456。所购车票信息如下:张三,2017年8月9日10:00开,上海—北京,D1234次列车,06车07B号,二等座,票价100元,检票口在二层3号。通过正则或者关键词匹配,可以提取出用户的姓名、出发时间、始发地、目的地、火车次号、票价、检票口等详细情况,并整理成结构化数据,构建成行为轨迹图谱。
作为一个优选的实施方案,遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件,包括:
匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。
进一步的,提取所述全部邮件包括:
设置收件人和/或发件人的白名单,正文关键词的黑名单;
遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;
将得到的邮件作为全部邮件。
将所有邮件进行分析时,还可以进一步的将邮箱账号中的无用信息进行剔除,减轻分析的复杂程度,加快分析的速度和效率。
进一步的,遍历所有带有账号邮件标签的邮件,提取邮件正文,并通过关键字匹配,得到私人账号信息包括:
设置邮件的发件人以及收件人的匹配名单,并与预设的格式匹配样式进行匹配;
筛选账号邮件中符合所述匹配名单的邮件,并对应所述格式匹配样式,提取所述邮件正文中的账户信息,所述账户信息包括:账户所属网址、账户名称。
作为一个优选的实施方案,设置数据还包括账户登录信息,所述登录信息包括登录时间,登录地点。优选的,获取所述账户登录信息,绘制运动轨迹图谱。
通过账户的登录地址,能够进一步的了解用户的所在地,以及活动地址。
如图2所示,本发明实施例还提供一种针对邮件的个人塑像系统,其包括:
取证模块,用于选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
分类模块,用于遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
帐号信息模块,用于遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
私人信息模块,用于遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱,同时匹配私人邮件中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,制定人物标签,绘制私人信息图谱;
行为模块,用于遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
作为一个优选的实施方案,所述分类模块包括:
第一标记模块,用于匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
第二标记模块,用于通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
第三标记模块,用于通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。
进一步的,个人塑像系统还包括
过滤模块,所述过滤模块用于设置收件人和/或发件人的白名单,正文关键词的黑名单;遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;将得到的邮件作为全部邮件。
前述方法实施例中的各种变化方式和具体实例同样适用于本实施例的系统,通过前述方法的详细描述,本领域技术人员可以清楚的知道本实施例中系统的实施方法,所以为了说明书的简洁,在此不再详述。
总体来说,本发明实施例提供的一种针对邮件的个人塑像方法及系统,通过收集邮箱账户中的账户信息、行为信息以及社交关系,并进行图谱绘制,能够较为全面且深入的的进行个人信息绘制和挖掘。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种针对邮件的个人塑像方法,其特征在于,其包括:
选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;
遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;
遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
2.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件,包括:
匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。
3.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,提取所述全部邮件包括:
设置收件人和/或发件人的白名单,正文关键词的黑名单;
遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;
将得到的邮件作为全部邮件。
4.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,所述遍历所有带有账号邮件标签的邮件,提取邮件正文,并通过关键字匹配,得到私人账号信息包括:
设置邮件的发件人以及收件人的匹配名单,并与预设的格式匹配样式进行匹配;
筛选账号邮件中符合所述匹配名单的邮件,并对应所述格式匹配样式,提取所述邮件正文中的账户信息,所述账户信息包括:账户所属网址、账户名称。
5.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于:所述设置数据还包括账户登录信息,所述登录信息包括登录时间,登录地点。
6.如权利要求5所述的一种针对邮件的个人塑像方法,其特征在于:获取所述账户登录信息,绘制运动轨迹图谱。
7.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,所述设置数据包括所述邮箱账户的邮箱订阅数据、收藏夹数据、小标签数据、星标邮件数据、邮箱网盘数据。
8.一种针对邮件的个人塑像系统,其特征在于,其包括:
取证模块,用于选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
分类模块,用于遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
帐号信息模块,用于遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
社交模块,用于遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;
私人信息模块,用于遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;
行为模块,用于遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。
9.如权利要求8所述的一种针对邮件的个人塑像系统,其特征在于所述分类模块包括:
第一标记模块,用于匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
第二标记模块,用于通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
第三标记模块,用于通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。
10.如权利要求8所述的一种针对邮件的个人塑像系统,其特征在于,其还包括
过滤模块,所述过滤模块用于设置收件人和/或发件人的白名单,正文关键词的黑名单;遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;将得到的邮件作为全部邮件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911422451.3A CN111047455A (zh) | 2019-12-31 | 2019-12-31 | 一种针对邮件的个人塑像方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911422451.3A CN111047455A (zh) | 2019-12-31 | 2019-12-31 | 一种针对邮件的个人塑像方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111047455A true CN111047455A (zh) | 2020-04-21 |
Family
ID=70243280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911422451.3A Pending CN111047455A (zh) | 2019-12-31 | 2019-12-31 | 一种针对邮件的个人塑像方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111047455A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111859131A (zh) * | 2020-07-21 | 2020-10-30 | 山东省科院易达科技咨询有限公司 | 一种多约束条件下的个性化信息推荐方法及信息推荐系统 |
CN113411253A (zh) * | 2021-06-30 | 2021-09-17 | 平安普惠企业管理有限公司 | 基于邮件的关系拓扑分析方法、装置、终端设备及介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1790399A (zh) * | 2004-12-17 | 2006-06-21 | 国际商业机器公司 | 电子邮件分类系统和方法 |
CN101364955A (zh) * | 2008-09-28 | 2009-02-11 | 杭州电子科技大学 | 一种分析和提取电子邮件客户端证据的方法 |
JP2012068906A (ja) * | 2010-09-24 | 2012-04-05 | Hitachi Solutions Ltd | 電子メール送受信者相関表示システム、方法及びプログラム |
US20140372446A1 (en) * | 2013-06-14 | 2014-12-18 | International Business Machines Corporation | Email content management and visualization |
JP2015069543A (ja) * | 2013-09-30 | 2015-04-13 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、情報処理装置、情報処理方法、プログラム |
CN106156105A (zh) * | 2015-04-02 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 电子邮件聚合分类方法和装置 |
CN108038189A (zh) * | 2017-12-11 | 2018-05-15 | 南京茂毓通软件科技有限公司 | 一种电子邮件的信息提取系统 |
CN108605009A (zh) * | 2016-11-25 | 2018-09-28 | 华为技术有限公司 | 邮件分组方法及装置 |
CN109446299A (zh) * | 2018-08-27 | 2019-03-08 | 中国科学院信息工程研究所 | 基于事件识别的搜索电子邮件内容的方法及系统 |
CN109643412A (zh) * | 2016-08-09 | 2019-04-16 | 微软技术许可有限责任公司 | 电子邮件个性化 |
-
2019
- 2019-12-31 CN CN201911422451.3A patent/CN111047455A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1790399A (zh) * | 2004-12-17 | 2006-06-21 | 国际商业机器公司 | 电子邮件分类系统和方法 |
CN101364955A (zh) * | 2008-09-28 | 2009-02-11 | 杭州电子科技大学 | 一种分析和提取电子邮件客户端证据的方法 |
JP2012068906A (ja) * | 2010-09-24 | 2012-04-05 | Hitachi Solutions Ltd | 電子メール送受信者相関表示システム、方法及びプログラム |
US20140372446A1 (en) * | 2013-06-14 | 2014-12-18 | International Business Machines Corporation | Email content management and visualization |
JP2015069543A (ja) * | 2013-09-30 | 2015-04-13 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、情報処理装置、情報処理方法、プログラム |
CN106156105A (zh) * | 2015-04-02 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 电子邮件聚合分类方法和装置 |
CN109643412A (zh) * | 2016-08-09 | 2019-04-16 | 微软技术许可有限责任公司 | 电子邮件个性化 |
CN108605009A (zh) * | 2016-11-25 | 2018-09-28 | 华为技术有限公司 | 邮件分组方法及装置 |
CN108038189A (zh) * | 2017-12-11 | 2018-05-15 | 南京茂毓通软件科技有限公司 | 一种电子邮件的信息提取系统 |
CN109446299A (zh) * | 2018-08-27 | 2019-03-08 | 中国科学院信息工程研究所 | 基于事件识别的搜索电子邮件内容的方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111859131A (zh) * | 2020-07-21 | 2020-10-30 | 山东省科院易达科技咨询有限公司 | 一种多约束条件下的个性化信息推荐方法及信息推荐系统 |
CN113411253A (zh) * | 2021-06-30 | 2021-09-17 | 平安普惠企业管理有限公司 | 基于邮件的关系拓扑分析方法、装置、终端设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9590944B2 (en) | Organizing messages in a messaging system using social network information | |
WO2018032937A1 (zh) | 一种文本信息分类方法及其装置 | |
CN107220899B (zh) | 社交网络构建、信息推荐方法、装置及服务器 | |
US8225413B1 (en) | Detecting impersonation on a social network | |
US20180349469A1 (en) | Event extraction systems and methods | |
CN108153824B (zh) | 目标用户群体的确定方法及装置 | |
US20110270937A1 (en) | Method and system of tagging email and providing tag clouds | |
EP2378475A1 (en) | Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction | |
CN107682332A (zh) | 一种家校互联的方法、系统和用户客户端 | |
CN106940732A (zh) | 一种面向微博的疑似水军发现方法 | |
CN104951542A (zh) | 识别社交短文本类别的方法、分类模型训练方法及装置 | |
CN109978020B (zh) | 一种基于多维特征的社交网络账号马甲身份辨识方法 | |
JP2014532934A (ja) | 電子メールタグ | |
CN106815588B (zh) | 垃圾图片过滤方法及装置 | |
CN103412930A (zh) | 一种互联网用户属性识别方法 | |
CN111047455A (zh) | 一种针对邮件的个人塑像方法及系统 | |
CN106156105A (zh) | 电子邮件聚合分类方法和装置 | |
CN115238688B (zh) | 电子信息数据关联关系分析方法、装置、设备和存储介质 | |
CN113268649A (zh) | 基于多元化数据融合的线索监测方法及系统 | |
CN102811177A (zh) | 网络信息的分享方法及系统 | |
CN107291774A (zh) | 错误样本识别方法和装置 | |
CN113450147A (zh) | 基于决策树的产品匹配方法、装置、设备及存储介质 | |
CN106022839B (zh) | 一种特定群体的识别方法、系统及终端 | |
TWI575391B (zh) | 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 | |
CN104639427B (zh) | 一种输出邮件信息的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |