CN101425984A - 一种建立邮件数据模型的方法 - Google Patents

一种建立邮件数据模型的方法 Download PDF

Info

Publication number
CN101425984A
CN101425984A CNA2008103061995A CN200810306199A CN101425984A CN 101425984 A CN101425984 A CN 101425984A CN A2008103061995 A CNA2008103061995 A CN A2008103061995A CN 200810306199 A CN200810306199 A CN 200810306199A CN 101425984 A CN101425984 A CN 101425984A
Authority
CN
China
Prior art keywords
mail
data model
thresholding
content
domain name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008103061995A
Other languages
English (en)
Other versions
CN101425984B (zh
Inventor
李强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN2008103061995A priority Critical patent/CN101425984B/zh
Publication of CN101425984A publication Critical patent/CN101425984A/zh
Application granted granted Critical
Publication of CN101425984B publication Critical patent/CN101425984B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种建立邮件数据模型的方法。本发明针对现有技术中的邮件数据模型半结构化带来消耗系统资源大的不足,提出一种建立全结构化邮件数据模型的方法。其技术方案的要点是:a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。本发明的有益效果是:建立全结构化的邮件数据模型,使得邮件传输占用系统资源小。

Description

一种建立邮件数据模型的方法
技术领域
本发明涉及一种建立邮件数据模型的方法。
背景技术
基于RFC822标准或RFC2822改进标准的电子邮件不能够支持非ASCII字符、二进制格式附件等多种格式的邮件,也不支持多媒体邮件(如音视频的应用),在非英语国家应用有限。MIME标准即RFC2045~RFC2049标准,扩展了电子邮件标准,使其能够满足现代电子邮件的各种需求,实现了非英语字符消息和二进制文件、图像、声音等非文字消息在电子邮件中的传输。MIME标准自1996年发布后获得极为广泛的应用。现有的MIME邮件数据结构是一种半结构化的数据模型,它基于文本格式,一封原始邮件就是一个文本文件。它以“行”为单位分隔邮件的每个域,包括以空行、空格来间隔每个域,以特殊文本字符包含正文数据。现有MIME邮件的编/解码要消耗大量的CUP资源,而且邮件中如果包含很大的附件程序,则会造成阅读邮件和发送邮件时会导致资源消耗太多而死机。有鉴于此,目前国内外大多数邮件服务器都对邮件附件的大小做了限制,比如新浪的邮件附件限制为15兆、搜狐的邮件附件限制为10兆。附件超出限制的大小则发送失败。造成以上现象的根源在于目前MIME邮件基于XML数据格式,存在半结构化的数据模型的特点,它语法结构比较松散、定义过于灵活,给邮件应用如邮件分析处理、垃圾邮件的筛选,甚至是邮件数据挖掘等带来很多困难,比如使得邮件的解析算法设计复杂,CPU需要进行大量运算才能把原始邮件转换为易读的邮件文本。也不利于邮件导入数据库保存,因为半结构化的数据转存入数据库同样需要大量的解析运算。
发明内容
本发明所要解决的技术问题是:针对现有技术中的邮件数据模型半结构化带来非常消耗系统资源的不足,提出一种建立全结构化邮件数据模型的方法。
本发明解决上述技术问题采用的技术方案是:一种建立邮件数据模型的方法,包括以下步骤:
a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;
b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;
c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;
d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。
本发明的有益效果是:建立全结构化的邮件数据模型,使得邮件传输占用系统资源小,也便于邮件的分析处理及垃圾邮件的筛选。
具体实施方式
针对现有技术中的邮件数据模型半结构化带来非常消耗系统资源的不足,提出一种建立全结构化邮件数据模型的方法,使得邮件传输占用系统资源小,也便于邮件的分析处理及垃圾邮件的筛选,该邮件数据模型的建立基于JSON数据交换格式,该数据交换格式可以克服现有技术采用XML数据格式带来的语法结构比较松散、定义过于灵活的不足。
在具体实施上,采用以下步骤实现:a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;
b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;例如邮件头中的Received域,表示方法如下:
Received:[{from:“value3_11”,by:“value3_12”,with:“value3_13”,id:“value3_14”},]
Received域是邮件在发送过程中由每个中继服务器自动添加的内容,用于帮助追踪传输中出现的错误。From表示发送的服务器名;By表示接收的主机名;With指示邮件传输使用的连接协议;Id用于标识邮件。
c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;由于邮件服务器市场有多家软件公司,故存在多种邮件服务器软件,这些软件并不完全统一,普遍在邮件头增加了自己的自定义域。所以,本数据模型对邮件头自定义域的域名和域值统一放入X-extends嵌套为对象处理,使得其结构更加紧凑。
d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象;邮件体包括邮件正文和邮件附件,附件可为多媒体文件,且可以有多个。本数据模型把邮件体所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。表示方法如下:
Content:[
     {
     Boundary:“value12_11”,
     Content-Type:“value12_12”,
    charset:“value12_13”,
    Content-Transfer-Encoding:“value12_14”,
    Content-Disposition:“value12_15”,
    Content-ID:“value12_16”,
    Content-Location:“value12_17”,
    Content-Base:“value12_18”,
    Content:“value12_19”
    },
    ......
]
其中,Boundary属性和值定义了邮件的边界;Content-Type属性和值定义了邮件的类型;charset属性和值定义了邮件的字符集;Content-Transfer Encoding属性和值指定邮件消息体中的内容所采用的编码方式;Content-Disposition属性和值指定邮件阅读程序处理数据内容的方式;Content-ID属性和值用于为邮件正文的内嵌资源指定一个唯一标识号,在正文中可以使用这个唯一标识号来引用该内嵌资源;Content-Location属性和值用于为内嵌资源设置一个URI地址,这个URI地址可以是绝对或相对的;Content-Base属性和值用于为内嵌资源设置一个基准路径,这样Content-Location头字段中设置的URI才可以采用相对地址;Content属性和值定义了邮件的正文。
采用JSON数据交换格式来定义并建立一种新型的邮件数据模型,不仅可使邮件数据表示结构化,简化邮件内容数据的采集方式,促进垃圾邮件屏蔽、数据挖掘等应用,还使得邮件数据本身具有JSON的网络传输资源消耗小、数据精炼等优点。虽然没有彻底解决邮件系统的附件限制,但在一定程度上可以减轻这种附件大小的限制,据测试,采用此数据模型的邮件系统,附件可轻松突破200M。

Claims (1)

  1. 【权利要求1】一种建立邮件数据模型的方法,其特征在于:包括以下步骤:
    a.将邮件的原始数据均放入大括号之间,表示为:ID:{…},其中ID为邮件服务器对邮件的唯一标识码;
    b.将邮件头中的每个域的域名和域值转换为JSON对象的域名对和域值对;
    c.将邮件头中自定义域的域名和域值统一放入X-extends嵌套处理;
    d.将邮件体中的所有内容均放入Content域,邮件正文和附件都作为段表示,每个段对应一个Content域的嵌套对象。
CN2008103061995A 2008-12-12 2008-12-12 一种建立邮件数据模型的方法 Expired - Fee Related CN101425984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008103061995A CN101425984B (zh) 2008-12-12 2008-12-12 一种建立邮件数据模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008103061995A CN101425984B (zh) 2008-12-12 2008-12-12 一种建立邮件数据模型的方法

Publications (2)

Publication Number Publication Date
CN101425984A true CN101425984A (zh) 2009-05-06
CN101425984B CN101425984B (zh) 2011-06-22

Family

ID=40616326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008103061995A Expired - Fee Related CN101425984B (zh) 2008-12-12 2008-12-12 一种建立邮件数据模型的方法

Country Status (1)

Country Link
CN (1) CN101425984B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567274A (zh) * 2010-12-08 2012-07-11 比亚迪股份有限公司 实现邮件数据在移动终端和计算机之间转移的方法及系统
CN103036891A (zh) * 2012-12-19 2013-04-10 北京时代凌宇科技有限公司 一种基于wi-fi接入物联网的方法及装置
CN109802883A (zh) * 2018-12-27 2019-05-24 南京信息职业技术学院 一种邮件传输方法及其系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100483419C (zh) * 2007-07-27 2009-04-29 华为技术有限公司 一种数据格式的校验方法及装置
CN101217507B (zh) * 2007-12-29 2010-11-17 深圳市迅雷网络技术有限公司 提供及替换网页中数据的系统、方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567274A (zh) * 2010-12-08 2012-07-11 比亚迪股份有限公司 实现邮件数据在移动终端和计算机之间转移的方法及系统
CN103036891A (zh) * 2012-12-19 2013-04-10 北京时代凌宇科技有限公司 一种基于wi-fi接入物联网的方法及装置
CN109802883A (zh) * 2018-12-27 2019-05-24 南京信息职业技术学院 一种邮件传输方法及其系统
CN109802883B (zh) * 2018-12-27 2021-07-30 南京信息职业技术学院 一种邮件传输方法及其系统

Also Published As

Publication number Publication date
CN101425984B (zh) 2011-06-22

Similar Documents

Publication Publication Date Title
US6393456B1 (en) System, method, and computer program product for workflow processing using internet interoperable electronic messaging with mime multiple content type
US9021035B2 (en) Formatting rich text data into a JSON array
FI20002566A (fi) Tiedonsiirto
EP2352269A1 (en) Service access method and system
CN101425984B (zh) 一种建立邮件数据模型的方法
CN1889106B (zh) 分离保存邮件附件的方法
US7623741B2 (en) System and method for transferring scanned imaging data to a personal imaging repository
CN105553818A (zh) 一种基于xmpp协议实现电子公告的系统和方法
CA2552651C (en) A system and method for formatted inter-node communications over a computer network
US20050288044A1 (en) System and method for using soap to invoke web services on handheld devices
CN101841514A (zh) 邮件处理方法及设备
Knight et al. Framework for the definition of significant properties
CN102238098A (zh) 一种信息合成方法、及对应的终端和即时通讯系统
CN212516568U (zh) 基于智慧物联网的云展厅系统
CN115098567A (zh) 一种基于bi平台的低代码平台数据传输方法
CN113593569A (zh) 一种电子面单生成方法、装置、电子设备及存储介质
CN201465172U (zh) 具有语音识别功能的物流系统
KR20000058954A (ko) 인터넷 전자메일과 게시판의 연동장치
US20050063387A1 (en) System and method of order reexamination in electronic data interchange
CN109802883B (zh) 一种邮件传输方法及其系统
US20040181582A1 (en) Method of receiving an e-mail at mail server and sending a converted one therefrom
US20230328015A1 (en) Technique for exchanging information between at least two communication entities
Liang et al. An integrated multi-channel messaging model supporting for business collaboration
US20120271892A1 (en) Method and apparatus for utilizing visually-encoded information to facilitate consumer information collection
CN118012639A (zh) 一种结合可编辑模板实现的站内通知方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110622

Termination date: 20201212