CN101425984A - 一种建立邮件数据模型的方法 - Google Patents
一种建立邮件数据模型的方法 Download PDFInfo
- Publication number
- CN101425984A CN101425984A CNA2008103061995A CN200810306199A CN101425984A CN 101425984 A CN101425984 A CN 101425984A CN A2008103061995 A CNA2008103061995 A CN A2008103061995A CN 200810306199 A CN200810306199 A CN 200810306199A CN 101425984 A CN101425984 A CN 101425984A
- Authority
- CN
- China
- Prior art keywords
- data model
- thresholding
- content
- domain name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种建立邮件数据模型的方法。本发明针对现有技术中的邮件数据模型半结构化带来消耗系统资源大的不足,提出一种建立全结构化邮件数据模型的方法。其技术方案的要点是:a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。本发明的有益效果是:建立全结构化的邮件数据模型,使得邮件传输占用系统资源小。
Description
技术领域
本发明涉及一种建立邮件数据模型的方法。
背景技术
基于RFC822标准或RFC2822改进标准的电子邮件不能够支持非ASCII字符、二进制格式附件等多种格式的邮件,也不支持多媒体邮件(如音视频的应用),在非英语国家应用有限。MIME标准即RFC2045~RFC2049标准,扩展了电子邮件标准,使其能够满足现代电子邮件的各种需求,实现了非英语字符消息和二进制文件、图像、声音等非文字消息在电子邮件中的传输。MIME标准自1996年发布后获得极为广泛的应用。现有的MIME邮件数据结构是一种半结构化的数据模型,它基于文本格式,一封原始邮件就是一个文本文件。它以“行”为单位分隔邮件的每个域,包括以空行、空格来间隔每个域,以特殊文本字符包含正文数据。现有MIME邮件的编/解码要消耗大量的CUP资源,而且邮件中如果包含很大的附件程序,则会造成阅读邮件和发送邮件时会导致资源消耗太多而死机。有鉴于此,目前国内外大多数邮件服务器都对邮件附件的大小做了限制,比如新浪的邮件附件限制为15兆、搜狐的邮件附件限制为10兆。附件超出限制的大小则发送失败。造成以上现象的根源在于目前MIME邮件基于XML数据格式,存在半结构化的数据模型的特点,它语法结构比较松散、定义过于灵活,给邮件应用如邮件分析处理、垃圾邮件的筛选,甚至是邮件数据挖掘等带来很多困难,比如使得邮件的解析算法设计复杂,CPU需要进行大量运算才能把原始邮件转换为易读的邮件文本。也不利于邮件导入数据库保存,因为半结构化的数据转存入数据库同样需要大量的解析运算。
发明内容
本发明所要解决的技术问题是:针对现有技术中的邮件数据模型半结构化带来非常消耗系统资源的不足,提出一种建立全结构化邮件数据模型的方法。
本发明解决上述技术问题采用的技术方案是:一种建立邮件数据模型的方法,包括以下步骤:
a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;
b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;
c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;
d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。
本发明的有益效果是:建立全结构化的邮件数据模型,使得邮件传输占用系统资源小,也便于邮件的分析处理及垃圾邮件的筛选。
具体实施方式
针对现有技术中的邮件数据模型半结构化带来非常消耗系统资源的不足,提出一种建立全结构化邮件数据模型的方法,使得邮件传输占用系统资源小,也便于邮件的分析处理及垃圾邮件的筛选,该邮件数据模型的建立基于JSON数据交换格式,该数据交换格式可以克服现有技术采用XML数据格式带来的语法结构比较松散、定义过于灵活的不足。
在具体实施上,采用以下步骤实现:a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;
b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;例如邮件头中的Received域,表示方法如下:
Received:[{from:“value3_11”,by:“value3_12”,with:“value3_13”,id:“value3_14”},]
Received域是邮件在发送过程中由每个中继服务器自动添加的内容,用于帮助追踪传输中出现的错误。From表示发送的服务器名;By表示接收的主机名;With指示邮件传输使用的连接协议;Id用于标识邮件。
c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;由于邮件服务器市场有多家软件公司,故存在多种邮件服务器软件,这些软件并不完全统一,普遍在邮件头增加了自己的自定义域。所以,本数据模型对邮件头自定义域的域名和域值统一放入X-extends嵌套为对象处理,使得其结构更加紧凑。
d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象;邮件体包括邮件正文和邮件附件,附件可为多媒体文件,且可以有多个。本数据模型把邮件体所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。表示方法如下:
Content:[
{
Boundary:“value12_11”,
Content-Type:“value12_12”,
charset:“value12_13”,
Content-Transfer-Encoding:“value12_14”,
Content-Disposition:“value12_15”,
Content-ID:“value12_16”,
Content-Location:“value12_17”,
Content-Base:“value12_18”,
Content:“value12_19”
},
......
]
其中,Boundary属性和值定义了邮件的边界;Content-Type属性和值定义了邮件的类型;charset属性和值定义了邮件的字符集;Content-Transfer Encoding属性和值指定邮件消息体中的内容所采用的编码方式;Content-Disposition属性和值指定邮件阅读程序处理数据内容的方式;Content-ID属性和值用于为邮件正文的内嵌资源指定一个唯一标识号,在正文中可以使用这个唯一标识号来引用该内嵌资源;Content-Location属性和值用于为内嵌资源设置一个URI地址,这个URI地址可以是绝对或相对的;Content-Base属性和值用于为内嵌资源设置一个基准路径,这样Content-Location头字段中设置的URI才可以采用相对地址;Content属性和值定义了邮件的正文。
采用JSON数据交换格式来定义并建立一种新型的邮件数据模型,不仅可使邮件数据表示结构化,简化邮件内容数据的采集方式,促进垃圾邮件屏蔽、数据挖掘等应用,还使得邮件数据本身具有JSON的网络传输资源消耗小、数据精炼等优点。虽然没有彻底解决邮件系统的附件限制,但在一定程度上可以减轻这种附件大小的限制,据测试,采用此数据模型的邮件系统,附件可轻松突破200M。
Claims (1)
- 【权利要求1】一种建立邮件数据模型的方法,其特征在于:包括以下步骤:a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008103061995A CN101425984B (zh) | 2008-12-12 | 2008-12-12 | 一种建立邮件数据模型的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008103061995A CN101425984B (zh) | 2008-12-12 | 2008-12-12 | 一种建立邮件数据模型的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101425984A true CN101425984A (zh) | 2009-05-06 |
CN101425984B CN101425984B (zh) | 2011-06-22 |
Family
ID=40616326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008103061995A Expired - Fee Related CN101425984B (zh) | 2008-12-12 | 2008-12-12 | 一种建立邮件数据模型的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101425984B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567274A (zh) * | 2010-12-08 | 2012-07-11 | 比亚迪股份有限公司 | 实现邮件数据在移动终端和计算机之间转移的方法及系统 |
CN103036891A (zh) * | 2012-12-19 | 2013-04-10 | 北京时代凌宇科技有限公司 | 一种基于wi-fi接入物联网的方法及装置 |
CN109802883A (zh) * | 2018-12-27 | 2019-05-24 | 南京信息职业技术学院 | 一种邮件传输方法及其系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100483419C (zh) * | 2007-07-27 | 2009-04-29 | 华为技术有限公司 | 一种数据格式的校验方法及装置 |
CN101217507B (zh) * | 2007-12-29 | 2010-11-17 | 深圳市迅雷网络技术有限公司 | 提供及替换网页中数据的系统、方法及装置 |
-
2008
- 2008-12-12 CN CN2008103061995A patent/CN101425984B/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567274A (zh) * | 2010-12-08 | 2012-07-11 | 比亚迪股份有限公司 | 实现邮件数据在移动终端和计算机之间转移的方法及系统 |
CN103036891A (zh) * | 2012-12-19 | 2013-04-10 | 北京时代凌宇科技有限公司 | 一种基于wi-fi接入物联网的方法及装置 |
CN109802883A (zh) * | 2018-12-27 | 2019-05-24 | 南京信息职业技术学院 | 一种邮件传输方法及其系统 |
CN109802883B (zh) * | 2018-12-27 | 2021-07-30 | 南京信息职业技术学院 | 一种邮件传输方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101425984B (zh) | 2011-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6393456B1 (en) | System, method, and computer program product for workflow processing using internet interoperable electronic messaging with mime multiple content type | |
US9021035B2 (en) | Formatting rich text data into a JSON array | |
FI20002566A (fi) | Tiedonsiirto | |
EP2352269A1 (en) | Service access method and system | |
CN101425984B (zh) | 一种建立邮件数据模型的方法 | |
CN1889106B (zh) | 分离保存邮件附件的方法 | |
US7623741B2 (en) | System and method for transferring scanned imaging data to a personal imaging repository | |
CN105553818A (zh) | 一种基于xmpp协议实现电子公告的系统和方法 | |
CA2552651C (en) | A system and method for formatted inter-node communications over a computer network | |
US20050288044A1 (en) | System and method for using soap to invoke web services on handheld devices | |
CN101841514A (zh) | 邮件处理方法及设备 | |
Knight et al. | Framework for the definition of significant properties | |
CN102238098A (zh) | 一种信息合成方法、及对应的终端和即时通讯系统 | |
CN212516568U (zh) | 基于智慧物联网的云展厅系统 | |
CN115098567A (zh) | 一种基于bi平台的低代码平台数据传输方法 | |
CN113593569A (zh) | 一种电子面单生成方法、装置、电子设备及存储介质 | |
CN201465172U (zh) | 具有语音识别功能的物流系统 | |
KR20000058954A (ko) | 인터넷 전자메일과 게시판의 연동장치 | |
US20050063387A1 (en) | System and method of order reexamination in electronic data interchange | |
CN109802883B (zh) | 一种邮件传输方法及其系统 | |
US20040181582A1 (en) | Method of receiving an e-mail at mail server and sending a converted one therefrom | |
US20230328015A1 (en) | Technique for exchanging information between at least two communication entities | |
Liang et al. | An integrated multi-channel messaging model supporting for business collaboration | |
US20120271892A1 (en) | Method and apparatus for utilizing visually-encoded information to facilitate consumer information collection | |
CN118012639A (zh) | 一种结合可编辑模板实现的站内通知方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110622 Termination date: 20201212 |