CN101116349A - 上下文识别增强消息转换系统和方法 - Google Patents
上下文识别增强消息转换系统和方法 Download PDFInfo
- Publication number
- CN101116349A CN101116349A CNA2006800039715A CN200680003971A CN101116349A CN 101116349 A CN101116349 A CN 101116349A CN A2006800039715 A CNA2006800039715 A CN A2006800039715A CN 200680003971 A CN200680003971 A CN 200680003971A CN 101116349 A CN101116349 A CN 101116349A
- Authority
- CN
- China
- Prior art keywords
- message
- data
- unit
- subscriber
- sms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/06—Message adaptation to terminal or network requirements
- H04L51/063—Content adaptation, e.g. replacement of unsuitable content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/18—Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Transfer Between Computers (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
提供一种在上下文识别上被增强的消息转换系统及方法。在这个消息转换系统及方法中,文字信息中的文本内容能够有效地识别从而避免了在文字信息的转换中的逻辑错误。根据本发明,筛选方法和采用统计学方法的鉴别单元用来作为识别上下文的方法。因此,可以有效地减少上下文识别中的错误。此外,内容管理模块使用数据库,利用数据文件实现的内容使用模块采用存储映射I/O单元。因此,同样的数据会出现在数据库和数据文件中。进一步地,在初始化的同时,内容使用模块将数据文件映射到存储器中,数据被高效地利用。
Description
技术领域
本发明涉及一种上下文识别增强消息转换系统及方法。在本消息转换系统及方法中,文本信息的上下文识别被认为是在转换文本信息中能最有效的避免逻辑错误的方法。
背景技术
已经发展进步的涉及消息内容的附加服务,由于在识别难度上存在高识别错误率,单个词识别的错误识别情况,生成错误结果的原因没有被普遍性的应用。
也就是说,当一个自动生成的含有相反意思的用户消息被传送的话,对于过去的服务来说是致命的打击。即使在目前的普通消息服务中,当负责消息服务的管理员发现哪怕一个错误的话执行识别进程就会被终止。在中文消息一个汉字可以表示一个词的时候,这个问题就变得严峻了,因为相同的汉字可以表示不同的意思。
技术问题
本发明的优点在于它提供了一个能够解决难题的消息转换系统和方法,它能解决难题例如:难点识别中发生的高识别错误率、简单词语识别中发生的错误别和错误结果的产生。
技术解决
根据本发明的一方面,消息转换系统包括一个构成/筛选数据库存储至少包括图像、声音、影像数据的MMS数据和各种字符SMS数据其中之一;一个鉴别信息存储单元存储根据消息转换服务器和移动通信终端(发送/接受消息终端信息)的终端信息;一个消息接收单元用来接收来自另一个终端订户的消息(订户消息);一个订户鉴定单元检查终端信息目的移动通信终端接收消息并使用SMS或者MMS消息转换装置组合起来;一个消息鉴别单元用存储在构成/筛选数据中的筛选数据来检验订户消息是否通过筛选,消息鉴定单元至少包含如下中的一个:第一筛选单元用来将一个主题的大量句子与订户消息比较,其中每个句子由一个或多个词组成;第二筛选单元用来比较订户消息与多数句子,每个句子由一个或多个词(包含可替代词)组成;第三筛选单元分析来自每个订户的消息,提取经常性重复利用的短语;一个构成提取单元,当订户消息经由消息鉴定单元筛选后,从构成/筛选数据库中提取订户消息中相应的MMS数据或者SMS数据;一个构成合并单元,用来将MMS或者SMS数据组合成订户消息或者用依照移动通信终端显示规范的MMS或者SMS消息替代接收的消息,然后生成MMS或者SMS消息;一个消息传输单元用来把生成的MMS或者SMS消息传输到目的移动通信终端。
一个互联网匹配单元,用来通过网页接收SMS或MMS消息转换服务的订阅,提供所有或者部分无线传送消息功能,SMS或MMS消息转换服务功能,SMS或MMS消息转换服务的相关设置功能。
依照本发明的一个增强方面,消息转换系统包含一个互联网匹配单元,用来通过网页接收SMS或MMS消息转换服务的订阅,提供所有或者部分无线传送消息功能,SMS或MMS消息转换服务功能,SMS或MMS消息转换服务的相关设置功能。
依照本发明的一个增强方面,构成提取单元提取一个构成包含一个比构成存储单元中的订户消息还要大的空白区域,构成组合单元将订户消息取代和插入到完整部分或者提取构成的一部分空白区域中。
依照本发明的一个增强方面,构成合并单元用特定的SMS或者MMS消息替换订户消息,从而与被选择的构成合并。
依照本发明的一个增强方面,构成合并单元将构成插入到订户消息的之前或之后。
依照本发明的一个增强方面,构成/筛选数据库当要写入或更新的时候将数据加载到存储器中,消息识别单元和构成提取单元在选择MMS数据,SMS数据和筛选数据时读取存储在存储器中的数据。
依照本发明的一个增强方面,构成/筛选数据库建立一个数据文件夹来存储被写入或更新的数据,消息鉴别单元和构成提取单元则在选择MMS数据,SMS数据,筛选数据时读取在数据文件夹中的数据。
依照本发明的一个增强方面,消息鉴别单元或者构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是一块预先提供的存储区域将部分或者完整的构成/筛选数据能够被存储并映射从而被用来读取。
依照本发明的一个增强方面,消息鉴别单元或者构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是一块预先提供的存储区域将部分或者完整的数据文件加载到存储器中,是一块预先提供的存储区域将部分或者完整的数据能够被存储并映射从而被用来读取。
依照本发明的一个增强方面,一个消息转换方法从一个订户终端收到消息时比较并检验接收消息的目的移动通信终端的终端信息和涉及消息转换服务的设置项目;通过第一筛选单元掌握上下文的意思结构,第一筛选单元用每个主题的大量的句子与消息进行比较,每个句子由一个或多个词组成;第二筛选单元使用一个句子与消息进行比较,这个句子由一个或多个词包括可替换的词组成;第三筛选单元通过掌握上下文和提取重复使用的短语或句子和符号来堆积私人用户传送的消息,第三筛选单元使用统计方法成为一个鉴别单元;生成订户消息需要通过进程上下文意思结构被筛选单元掌握;进程上下文意思结构被鉴别单元采用统计方法掌握;当消息转换经过上下文识别在经过第一筛选单元后没有产生效果时,执行第二筛选单元的操作;当消息转换经过上下文识别在经过第二筛选单元后也没有产生效果时,执行采用统计方法进行个性分析的第三筛选单元的操作;同时将提取构成合并后的订户消息传送到目的移动通信终端。
依照本发明的一个增强方面,鉴别单元采用统计方法包含分析每一个用户的消息,提取周期内重复性的短语,利用重复性使用的短语生成或分配内容,并应用到服务中。
有益效果
根据本发明,筛选方法和鉴别单元采用统计学方法来识别上下文。从而,降低了文本识别的错误率。
进一步地,内容管理模块应用数据库,内容使用模块利用存储映射I/O单元调用数据文件。因此,同样的数据会显示在数据库和数据文件中。此外,当内容使用模块映射数据文件到初始存储器中时,数据被高效地利用。
更进一步地,当内容管理模块同步更新数据库和数据文件时,内容使用模块能够即时地使用到最新数据。
附图说明
图1和图2举例说明了现有技术下的文本体现。
图3描述了一个应用本发明的一个通讯网络。
图4描述了依据本发明的一个消息转换系统的结构图。
图5描述了本发明中消息转换系统的筛选部分。
图6描述了本发明中的统计处理系统。
图7-10描述了本发明中的存储映射I/O单元。
图11描述了依照本发明的消息转换方法流程图。
图12描述了依照本发明的统计处理方法流程图。
图13-14举例说明了应用本发明的消息示例。
附图标记
12SMS或者MMS中心
13信息转换服务器
14构成/筛选数据库
15订户数据库
20信息接收单元
21订户认证单元
22信息鉴别单元
23构成提取单元
24构成合并单元
25信息传送单元
26互联网匹配单元
27筛选单元
28采用统计方法的鉴别单元
具体实施方式
在下文中,本发明的首选示例会由涉及到的附图描述。当一个对现有功能或构造的细节描述被判断有能够遮盖到本发明的发明点,这个描述会被省略。接下来描述的术语会被定义进本发明的功能考虑中,同时会不同于一致紧张用户或操作者或练习者。因此,术语的意思会在说明书中进行解释。
图1和图2展示了一个依照现有技术的示例。依照一个传统的消息转换系统,当一个词例如“爱”或者“生气”在文本消息中出现时,文本消息会由准备好的内容转换,传送者的表情会被识别使得一个兴趣发生,如图1所示。然而,这个转换由一些简单的词识别完成,这里面包含了很多逻辑错误,如图2所示。也就是说,用户的文本消息中在自动转换的过程中会产生与文本消息打算表示的意思正好相反的意思,这个结果对过去的服务是致命的。即使在目前的普通消息服务中,当负责消息服务的管理员发现哪怕一个错误的话执行识别进程就会被终止。在中文消息一个汉字可以表示一个词的时候,这个问题就变得严峻了,因为相同的汉字能够表达很多不同的意思。
图3图解说明了一个应用本发明的通信网络。如图3所示,这个通信网络包括一个提供服务的服务器,一个接收方,一个发送方,一个SMS网关,和一个SMSC(短消息服务中心),一个MMSC(多媒体消息系统中心),一个MMS手机接收方,一个其他移动通信服务提供者的MMS服务器。特别的,当一个来自接收方的消息经过SMSC(短消息服务中心)和MMSC(多媒体消息系统中心)传输后,提供服务的服务器合并消息相应的构成以便传送到发送者。然而,每个服务供应商使用它自己的MMSC(多媒体消息系统中心)。也就是说,一个由A移动通信服务供应商生成的多媒体消息不能传送到B移动通信服务供应商。因此,MMSC(多媒体消息系统中心)与其他移动通信服务供应商的MMS服务器相连,MMS手机接收方也是如此。
图4图解说明了依照本发明的一个消息转换系统的结构。如图4所示,本发明的消息转换系统13包含一个消息接收单元20用于接收来自SMS中心和MMS中心12的订户消息;一个订户认证单元21通过订户数据库来检验这个订户是否已加入消息转换服务,核实订户制定的消息转换服务,确认接收这个消息的目的移动通信终端的终端信息;一个消息鉴别单元22包含一个筛选单元27和一个应用统计方法的鉴别单元27,这个筛选单元27分析消息是否通过筛选单元。进一步地,消息转换系统13包含一个构成提取单元23,它用来提取构成,指出验证的消息转换服务属性或者分析结果,这个分析结果来自一个构成/筛选数据库14和一个构成合并单元24,它合并提取自订户消息的构成。由这些构成合并后的消息经过消息传送单元25传送到SMS或者MMS中心12。更进一步地,消息转换系统13包含互联网匹配单元26用来接收从一个移动通信订户通过移动通信终端和/或计算机16和互联网的订户消息转换服务,同时通过网页用一个短消息经无线进程提供消息转换服务的订户,这个进程设置消息转换中涉及配置项目,以及相应的设置/咨询功能。
SMS中心或者MMS中心12传送来自一个移动通信终端的消息到消息转换服务器13中的消息接收单元20,需要消息转换服务器将订户消息转换为SMS或者MMS消息,传送转换后的SMS消息或者MMS消息到目的移动通信终端。
构成/筛选数据库14存储MMS数据,例如图像、声音、影像、由各种各样字符组成的SMS数据,消息鉴别单元的筛选单元提到的多种数据。
订户数据库15存储移动通信终端的手机号码,移动通信服务订户的名字,SMS或者MMS自动插入选项,移动通信终端的终端信息(移动通信终端的终端信息采用短消息的形式发送和接收)(举个例子,是否支持MMS服务,像这样的信息会在终端上详细显示)。
通过存储在订户数据库15中的移动通信订户的个人信息(举个例子,移动通信终端的手机号码,订户是否加入消息转换服务,订户的用户名和密码),订户认证单元21检查这个移动通信订户是否加入消息转换服务。此外,订户认证单元21校验存储于订户数据库中的消息转换服务事项,目的移动通信终端的转终端信息接收SMS或者MMS消息。然后,订户认证单元21提供消息转换中需要的相应信息。
当SMS中心或者MMS中心接收到一条来自一个移动通信终端的消息时,如果相应的移动通信订户加入了消息转换服务,SMS中心或者MMS中心需要由消息转换系统13将此条消息转换为SMS或者MMS消息。同时,如果移动通信订户没有加入消息转换服务,这条消息会通过传统方式传送到移动通信终端。
消息鉴别单元22用于执行消息转换的预处理的操作,具体如下:消息鉴别单元22的预处理包括校验接收消息的目的移动通信终端的终端信息,当消息从一个订户终端接收到后设置消息转换服务;并且通过第一到第三筛选单元掌握上下文的意思结构。第一筛选单元使用一个主题的大量句子,每个句子由一个或多个词组成。第二筛选单元使用一个由一个或多个词其中包括可替换词组成的句子。第三筛选单元通过掌握的上下文堆积传送的消息内容以便提取重复性的短语或句子和符号,第三筛选单元是一个使用统计方法的鉴别单元。
鉴别单元28使用统计方法分析每个用户的消息,提取周期内重复性的短语,从重复性使用的短语中生成或分配内容,并应用到服务之中。
当订户消息经由消息鉴别单元鉴别并通过筛选单元后,构成提取单元23从构成/筛选数据库中提取订户消息中相应的MMS数据或SMS数据。
依靠对目的移动通信终端的显示规则,构成合并单元24将MMS数据或SMS数据合并成订户消息或者用MMS数据或SMS数据取代接收到的消息,然后生成一条MMS或SMS消息。
互联网匹配单元26通过互联网和移动通信终端和/或计算机16相连,并提供一个订阅消息转换服务的网页,这个网页可用来书写消息,也可以是包含涉及消息转换中的各种环境的设置的网页,并且可以是一个SMS或者MMS设定/咨询网页。
于此同时,这个消息能够被本领域的普通技术人员很容易地理解,移动通信订户可以把消息书写在互联网匹配单元26提供的网页上,并向上面描述的一样,要经过各自的单元进行相同形式的处理。此外,依照订户的要求,移动通信终端会被告知消息转换在正常地进行。消息转换服务可以采用按每月固定的价格或者按照传送SMS消息的数量或MMS消息的数量来进行收费。
图5图解说明了依照本发明的消息转换系统中的筛选单元。如图5所示,筛选单元包含第一筛选单元,第二筛选单元,第三筛选单元。其中,第一筛选单元使用大量的短语和子句,第二筛选单元使用短语和子句的结构,第三筛选单元像鉴别单元一样使用统计方法工作。
特别地,当一个词通过简词识别后被设置为一个主题,第一筛选单元设置将这个词或这个词的意思应用其中的大量的短语和子句。举个例子,如果假定一个主题“公共汽车”被设定并且这个词的简单识别也被使用。假如这样的话,如果一条消息说“我现在在步行因为我不想坐公共汽车”以一个乘坐公共汽车的人的图片来表示的话,这就会发生错误。在这里,由一个或多个词组成的清楚的筛选数据,例如“坐公共汽车”,“在公共汽车里”,和“我打算坐公共汽车”会被使用。这是因为多数的筛选数据应该被使用在一个主题中以便增加识别率。
第二筛选单元使用由一个或多个词组成的筛选数据,并且一部分能够被替代以便增加识别率。举个例子,当一个筛选如“A,我爱你”作为一个主题其中“爱”被使用,A就相当于“甜心”或者特定的名字。其他的例子,当一个筛选如“A和B在打架”作为一个主题其中“打架”被使用,A和B相当于很多或没有特别指明的人的名字。使用包含可替代的词的短语和子句的筛选能够构造的比上述例子更复杂。此外,尽管所有的词不能一一对应,识别还是能被执行,从而弥补由短语和子句组成的筛选数据的低识别率。
尽管第一和第二筛选单元使用一个或多个词来减少错误发生,但相对于简单的词识别而言识别率已经有了下降。第三筛选单元能够使用统计方法进行鉴别来弥补错误发生率。这个鉴别使用统计方法从大量堆积的传送的私人用户的消息内容中自动提取出重复使用的短语或句子和符号以便进行相应消息转换。在假定被用户经常性地使用的词和符号非常可能被重新使用,鉴别会对用户消息识别起到增强效果和提高服务成功率。鉴别采用统计方法大致分以下几步,第一步分析每个用户的消息,第二步提取周期内重复性使用的短语,第三步使用重复性使用的短语生成或分配内容,第四步应用到服务器中。分析来自每个用户消息的步骤和提取周期内重复性使用的短语的步骤采用自动化程序,生成或分配内容到重复性使用的短语的步骤和应用到服务器中的步骤被存储在一个CMS数据库中并由管理员进行操作。
图6图解说明了依照本发明的统计处理系统。图12是依照本发明的统计操作方法的流程图。在上面描述的词识别方法中,一个或多个词被使用以便减少错误发生率。然而,与单个词识别相比识别率会下降。既然这样,采用统计方法的鉴别单元会弥补这一缺点。这个鉴别使用统计方法从大量堆积的传送的私人用户的消息内容中自动提取出重复使用的短语或句子和符号以便进行相应消息转换。在假定被用户经常性地使用的词和符号非常可能被重新使用,鉴定会对用户消息识别起到增强效果和提高服务成功率。鉴定采用统计方法大致分以下几步,第一步分析每个用户的消息,第二步提取周期内重复性使用的短语,第三步使用重复性使用的短语生成或分配内容,第四步应用到服务器中。分析来自每个用户消息的步骤和提取周期内重复性使用的短语的步骤采用自动化程序,生成或分配内容到重复性使用的短语的步骤和应用到服务器中的步骤被存储在一个CMS数据库中并由管理员进行操作。
图7到图10说明了依照本发明的存储映射I/O单元。如前面所述的筛选单元执行比简单词识别更为复杂的操作。也就是说,当筛选单元在通常方式下实现时,高水平的操作能力是必须的。因此,存储映射I/O单元能够有效地增强效率。为了检验用户消息中的上下文或词以便匹配适合的构成,内容列表和词/短语列表是必须的,在相应的列表中的映射信息也是必须的。代表性地,像增加/删除/更新日期这样的操作经常会由数据库轻松管理执行。在这个服务之中,为了增加顾客的满意度,适合上下文的内容被匹配,这个内容和词/短语数据会通过用户的反馈不断地增加和更新。因此,为了实现服务,减少内容管理应当是最重要的考虑因素。
当数据库被使用时,增加/删除/更新内容和词/短语数据的管理功能能够由一个简单的SQL语句实现。如上所述,内容管理模块是很容易完成的。然而,如果一个模块(在下文中,以“内容管理模块”提及)使用如上数据将内容匹配到一个文本消息的话必须访问数据库而且是无论什么时候选择内容都必须访问数据库,内容使用模块的效率被降低了。一般需要数百兆秒来访问数据库,这个数据库访问不适合内容管理模块。因为内容管理模块需要每秒处理的文本消息多于100条。这个方法如图7所示。
如图7所示的方法,内容管理模块直接更新数据库,并且内容使用模块从数据库中直接读取数据。这样就确保了内容、词/短语数据和相关数据的一致性。尽管这样做效率较低,但是内容管理模块和内容使用模块都可不必顾及其他模块的状态而分别访问数据库。
为了避免当数据库正在使用的时候内容使用模块访问数据库,使用了如下方法。当内容使用模块被写入,内容使用模块与数据库连接以便将所有数据加载到存储器中。然后,无论何时选择内容,存储器中的数据都在被使用。尽管在这个方法中,无论什么时候内容或者词/短语数据被更新,内容使用模块都需要与数据库连接以便将更新的数据加载到存储器中。因此,无论什么时候数据被更新,性能不可避免地退化。如图8所示的方法。
本发明主张一个方法,当内容使用模块使用数据库时能够维持减轻管理内容和词/短语数据,内容使用模块使用最新的内容和词/短语数据以便在不使用数据库的情况下保持最大性能。在本发明中,存储映射I/O技术被应用到这一方法中。存储映射I/O技术用于将全部或部分文件映射到存储器中以便使用。当一个映射存储区域被读取时,相同的数据文件中的数据能够被读取。也就是说,当内容管理模块更新数据文件时,内容使用模块的映射存储区也同时更新。因此,在本发明中,内容使用模块能够立即识别服务中需要的更新的数据,像内容、词/短语,不需要通过其他单独的操作。使用这个技术的方法如图9所示。
在存储映射I/O单元中,存储器不是直接被访问的。但是文件会以提高了的速度被访问。通过存储映射I/O单元进行读/写数据的速率是当文件被读取时的速度的3倍,也就是说,通过存储映射I/O单元读写的速度低于存储器直接被访问的速度。因此,图9所示的方法在服务性能速度是要低于图10所示方法的。在图8中,当内容使用模块被分析时,所有的内容和词/语句数据都会被加载到存储器中,为了维持一个高速度。因此,当大量的内容和词/语句数据的数量大于存储器的容量时,图8所示的方法就无法实现了。然而,存储映射I/O单元在这种情况下仍能够使用,这是因为只有实际使用中的数据才会被映射到存储器中。
在本发明中,图9的方法实现了在一个系统中包含一个不能存储所有内容和词或语句数据的存储器,图10的方法实现了一个系统中包含一个能够存储所有内容和词/短语数据的存储器。
图10的方法是结合了图8和图9的方法得到的。在这个方法中,内容使用模块在初始化的时候把所有的内容和词/短语数据加载到存储器中,同时,利用存储映射I/O单元完成映射。之后,当数据在服务中被使用时,数据仅仅从存储器中读取。从而,内容使用模块能够显示出最好的性能。既然这样,内容管理模块周期性地检查一个区域的内容是否在映射区域进行了更新。以后这个区域如果仅仅需要一个字节,每秒访问一次不会在性能上有任何作用。
当内容和词/短语数据的更新之后,内容管理模块将更新的内容和数据信息加载到数据库和数据文件中,然后检查这个区域的内容是否做了更新。同时,内容使用模块侦测升级的内容和词/短语数据,并将映射区域的数据复制到存储器中。
图11是根据本发明所产生的消息转换方法的流程图。如图11所示,一条信息被接收(S11),随后检查订户信息和目的终端的终端信息(S120)。之后,判断这个订户是否加入了信息转换服务(S13)。如果这个订户已经加入了信息转换服务,信息会被检查是否通过了筛选单元(S14)。如果这条信息通过了筛选单元,适合订户信息的构成被提取出来然后与订户消息合并(S16)。与构成合并的这条消息通过信息转换单元进行传输。
图13和14阐明了应用本发明的消息示例。图13展示了一条信息包含了图片构成,图14展示了一条信息包含了影像构成和图片构成。
Claims (11)
1.一种信息转换系统包括:
一个构成/筛选数据库,它存储MMS数据,至少包括图像、声音、影像和由各种字符组成的SMS数据其中之一;
一个认证信息存储单元,它存储消息转换服务中的相关设置和移动通信终端的终端信息(发出/接入消息终端信息);
一个信息接收单元,它接收来自于终端订户的消息(订户消息);
一个订户认证单元,它核实接收消息的目的移动通信终端的终端信息和SMS或者MMS消息转换服务的相关设置;
一个消息鉴别单元,它通过使用存储在构成/筛选数据库中的数据执行筛选操作,以便检查订户消息是否通过筛选,这个消息鉴别单元至少包括下列单元中的一个:
第一筛选单元,将订户消息与一个主题的大量句子组成进行比较,每个句子由一个或多个词组成;
第二筛选单元,将订户消息与大量的句子进行比较,每个句子由一个或多个词组成,并且其中包含可替换的词;
第三筛选单元,用于分析每个订户的消息,提取周期内重复使用的短语,利用重复使用的短语生成或指定内容;
一个构成提取单元,当订户消息经由订户鉴别单元筛选后,从构成/筛选数据库提取出与订户消息相应的MMS数据或者SMS数据;
一个构成合并单元,用MMS或者SMS数据合并订户消息,或者将接收到的消息用依照详细描述的目的移动通信终端的MMS或者SMS数据替换,然后生成一条MMS或者SMS消息;
一个消息传送单元,用于把生成的MMS或者SMS消息传送到目的移动通信终端。
2.根据权利要求1所述的信息转换系统,其特征在于,还包括
一个互联网匹配单元,用来通过网页接收SMS或MMS消息转换服务的订阅,提供所有或者部分无线传送消息功能,SMS或MMS消息转换服务功能,SMS或MMS消息转换服务的相关设置功能。
3.根据权利要求1所述的信息转换系统,其特征在于,当构成提取单元从构成存储单元提取出一个包含一个空白区域远大于订户消息的构成,同时构成合并单元将订户消息替换和插入到提取的构成的全部或部分空白区域中。
4.根据权利要求1所述的信息转换系统,其特征在于,构成合并单元用精确的SMS或MMS消息替换订户消息并与选定的构成合并。
5.根据权利要求1所述的信息转换系统,其特征在于,构成合并单元将构成插入到订户消息的之前或之后。
6.根据权利要求1-5中的任何一项所述的信息转换系统,其特征在于,构成/筛选单元数据库在数据被写入或更新的时候将数据库中的数据加载到存储器中,消息鉴别单元和构成提取单元在选择MMS数据、SMS数据和筛选数据时读取加载到存储器中的数据。
7.根据权利要求1-5中的任何一项所述的信息转换系统,其特征在于,构成/筛选数据库在数据被写入或更新的时候建立包含数据的数据文件,消息鉴别单元和构成提取单元在选择MMS数据,SMS数据和筛选数据时读取加载到数据文件中的数据。
8.根据权利要求7所述的信息转换系统,其特征在于,消息鉴别单元或者构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是系统提供的一块预定的存储区域以便于全部或部分构成/筛选数据库能够被存储和映射以至于被读取。
9.根据权利要求7所述的信息转换系统,其特征在于,消息鉴别单元或者构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是系统提供的一块预定的存储区域以便于全部或部分数据文件能够被加载到存储器中,一块预定的存储区域便于全部或部分加载到存储器中的数据被存储和映射以至于被读取。
10.一种消息转换方法包括:
在从一个订户终端接收到信息时,检查接收消息的目的移动通信终端的终端信息和涉及消息转换服务的设置;
第一筛选单元使用一个主题的大量句子与消息进行比较,掌握上下文的意思结构,每个句子由一个或多个词组成;第二筛选单元使用一个句子与消息进行比较,这个句子由一个或多个包含可替换词的词组成;第三筛选单元通过堆积私人用户传送的大量的消息掌握上下文,提取重复使用的短语或句子和符号,第三筛选单元采用统计方法成为一个鉴别单元;
通过筛选单元掌握的上下文意思结构和通过采用统计方法的鉴别单元掌握的上下文意思结构后生成订户消息;
当消息转换在经过第一筛选单元操作后没有完成上下文识别,第二筛选单元开始进行识别操作;
当消息转换在经过第二筛选单元操作后也没有完成上下文识别,采用统计方法进行鉴别的第三筛选单元开始进行识别操作;
将提取构成的订户消息传送到目的移动通信终端。
11.根据权利要求10所述的信息转换方法,其特征在于,采用统计方法的鉴别包括分析给每个用户的每条消息,提取周期内重复使用的短语,将重复使用的短语生成或指定内容,并应用到服务中。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050086105A KR100680034B1 (ko) | 2005-09-15 | 2005-09-15 | 문맥 인식이 강화된 메시지 변환 시스템 및 방법 |
KR10-2005-0086105 | 2005-09-15 | ||
KR1020050086105 | 2005-09-15 | ||
PCT/KR2006/003176 WO2007032606A1 (en) | 2005-09-15 | 2006-08-14 | Context cognizance enhancing message transform system, and method for the same |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101116349A true CN101116349A (zh) | 2008-01-30 |
CN101116349B CN101116349B (zh) | 2011-04-20 |
Family
ID=37865158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800039715A Expired - Fee Related CN101116349B (zh) | 2005-09-15 | 2006-08-14 | 语境识别增强消息转换系统和方法 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4642903B2 (zh) |
KR (1) | KR100680034B1 (zh) |
CN (1) | CN101116349B (zh) |
WO (1) | WO2007032606A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8311058B2 (en) * | 2008-05-10 | 2012-11-13 | Vantrix Corporation | Modular transcoding pipeline |
US8220051B2 (en) | 2007-09-28 | 2012-07-10 | Vantrix Corporation | Generation and delivery of multimedia content-adaptation notifications |
CN102771080B (zh) | 2009-12-01 | 2016-03-16 | 万特里克斯公司 | 使用缓存的高效媒体传送的系统和方法 |
US9112922B2 (en) | 2012-08-28 | 2015-08-18 | Vantrix Corporation | Method and system for self-tuning cache management |
WO2014071375A1 (en) * | 2012-11-05 | 2014-05-08 | Brilliant Mobile L.L.C. | Media messaging methods, systems, and devices |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3470664B2 (ja) * | 1999-12-01 | 2003-11-25 | 日本電気株式会社 | 受信メール表示方法及び絵文字変換機能付き電子メール端末装置 |
US6754484B1 (en) * | 2000-07-10 | 2004-06-22 | Nokia Corporation | Short messaging using information beacons |
KR20050029902A (ko) * | 2003-09-24 | 2005-03-29 | 최용국 | 자동 이미지 문자 변환 서비스 방법 및 시스템 |
KR100608725B1 (ko) * | 2003-11-27 | 2006-08-04 | 엘지전자 주식회사 | 이동 통신 단말기의 문자메시지 송수신 방법 |
-
2005
- 2005-09-15 KR KR1020050086105A patent/KR100680034B1/ko not_active IP Right Cessation
-
2006
- 2006-08-14 WO PCT/KR2006/003176 patent/WO2007032606A1/en active Application Filing
- 2006-08-14 JP JP2008531002A patent/JP4642903B2/ja not_active Expired - Fee Related
- 2006-08-14 CN CN2006800039715A patent/CN101116349B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101116349B (zh) | 2011-04-20 |
JP4642903B2 (ja) | 2011-03-02 |
KR100680034B1 (ko) | 2007-02-07 |
WO2007032606A1 (en) | 2007-03-22 |
JP2009509229A (ja) | 2009-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6411974B1 (en) | Method to collate and extract desired contents from heterogeneous text-data streams | |
US8566096B2 (en) | System and method of generating responses to text-based messages | |
US20050076037A1 (en) | Method and apparatus for computerized extracting of scheduling information from a natural language e-mail | |
CN102110170B (zh) | 一种具有信息发布和搜索功能的系统及信息发布方法 | |
CN110377900A (zh) | 网络内容发布的审核方法、装置、计算机设备及存储介质 | |
JP2006172444A (ja) | アクション可能な電子メールドキュメント | |
CN104199812B (zh) | 一种支持多语言的数据系统和方法 | |
CN112487149A (zh) | 一种文本审核方法、模型、设备及存储介质 | |
CN106815356A (zh) | 基于语义分析的精确目标用户消息推送方法及系统 | |
CN112434501B (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
WO2012102761A1 (en) | Method and system for providing detailed information in an interactive manner in a short message service (sms) environment | |
CN108776677B (zh) | 平行语句库的创建方法、设备及计算机可读存储介质 | |
Geierhos | Customer interaction 2.0: Adopting social media as customer service channel | |
CN109447400A (zh) | 任务数据管理方法、装置、计算机设备和存储介质 | |
CN104008087A (zh) | 一种针对具有标准格式的文案的自动排版方法和系统 | |
CN101116349A (zh) | 上下文识别增强消息转换系统和方法 | |
CN105279159B (zh) | 联系人的提示方法和装置 | |
CN108399157A (zh) | 实体与属性关系的动态抽取方法、服务器及可读存储介质 | |
CN101470752A (zh) | 基于关键词解析调度的搜索引擎方法 | |
CN101022577A (zh) | 短信搜索方法及其系统 | |
CN104765784A (zh) | 关键词列表维护方法及系统 | |
CN115391439B (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN108961013A (zh) | 一种翻译匹配平台和方法 | |
CN101120341A (zh) | 以自然语言进行移动式信息访问的方法和设备 | |
CN112069304A (zh) | 一种保险业务的问答方法、装置、服务器以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110420 Termination date: 20130814 |