CN101116349B - 语境识别增强消息转换系统和方法 - Google Patents

语境识别增强消息转换系统和方法 Download PDF

Info

Publication number
CN101116349B
CN101116349B CN2006800039715A CN200680003971A CN101116349B CN 101116349 B CN101116349 B CN 101116349B CN 2006800039715 A CN2006800039715 A CN 2006800039715A CN 200680003971 A CN200680003971 A CN 200680003971A CN 101116349 B CN101116349 B CN 101116349B
Authority
CN
China
Prior art keywords
message
data
filter element
subscriber
sms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800039715A
Other languages
English (en)
Other versions
CN101116349A (zh
Inventor
李相雨
宋世赫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
POLIDIGM CO Ltd
Original Assignee
POLIDIGM CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by POLIDIGM CO Ltd filed Critical POLIDIGM CO Ltd
Publication of CN101116349A publication Critical patent/CN101116349A/zh
Application granted granted Critical
Publication of CN101116349B publication Critical patent/CN101116349B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/063Content adaptation, e.g. replacement of unsuitable content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

提供一种增强了语境识别的消息转换系统及方法。在该消息转换系统及方法中,文本消息的语境被有效地识别从而可以避免文本消息转换中的逻辑错误。根据本发明,过滤方法和采用统计方法的个性化单元用来作为识别语境的方法。因此,可以产生减少语境识别中的错误的效果。此外,内容管理模块使用数据库,内容使用模块使用采用了数据文件的存储器映射I/O。因此,同样的数据会出现在数据库和数据文件中。进一步地,由于在初始化时,内容使用模块将数据文件映射到存储器中,可以高速地利用数据。

Description

语境识别增强消息转换系统和方法
技术领域
本发明涉及一种语境识别增强消息转换系统及方法。在本消息转换系统及方法中,文本消息的语境被有效地识别,使得能够避免在文本消息的转换中出现逻辑错误。
背景技术
由于识别困难所导致的高识别错误率、由简单词识别产生的错误识别以及生成错误结果的原因,已经开发出的与消息内容相关的附加服务没有被普遍地应用。
也就是说,当发送了意思与用户消息希望表达的意思相反的自动设置内容时,这对于付费服务来说会是致命的。即使在目前普遍使用的消息服务中,当负责消息服务的人发现这样的错误后,会停止使用所执行的识别功能。在一个字可以用作一个词的中文消息中,这个问题变得更加严重,因为同一个字可以表示不同的意思。
发明内容
本发明的优点在于提供了一种能够解决由于识别困难导致的高识别错误率、由简单词语识别导致的错误识别和产生错误结果等问题的消息转换系统和方法。
根据本发明的一方面,消息转换系统包括组件/过滤数据库,其存储MMS数据和SMS数据,该MMS数据由照片、声音和运动图像中的至少一项构成,该SMS数据由各种字符构成;认证信息存储单元,它存储与消息转换服务相关的设置项和移动通信终端的终端信息(出/入消息终端信息);消息接收单元,其接收终端侧的订户编写的消息(订户消息);订户认证单元,其检查接收所述消息的目的移动通信终端的终端信息和与SMS或者MMS消息转换服务相关的设置项;消息鉴别单元,其使用存储在组件/过滤数据库中的过滤数据执行过滤操作,以检查订户消息是否通过过滤,该消息鉴别单元包括下列单元中的至少一个:第一过滤单元,其将订户消息与针对每个主题的多个句子进行比较,每个句子由一个或多个词组成;第二过滤单元,其将订户消息与多个句子进行比较,每个句子由包括可替换词在内的一个或多个词组成;和第三过滤单元,其用于为每个订户分析消息,提取以某一频率重复使用的短语,为所述重复使用的短语生成或分配内容;组件提取单元,当订户消息通过消息鉴别单元的过滤后,从组件/过滤数据库提取出与订户消息相应的MMS数据或者SMS数据;组件合并单元,根据目的移动通信终端的显示规格,将MMS或者SMS数据与订户消息合并,或者将接收到的消息替换成MMS或者SMS数据,以生成MMS或者SMS消息;消息发送单元,其把生成的MMS或者SMS消息发送到目的移动通信终端。
根据本发明的另一个方面,所述消息转换系统还包括互联网匹配单元,其通过网页接收SMS或MMS消息转换服务的订制,并提供编写消息的功能、SMS或MMS消息转换服务的功能、设置与SMS或MMS消息转换服务相关的项目的功能中的所有或者部分。
根据本发明的另一个方面,组件提取单元从组件存储单元提取出包含大于订户消息的空白区域的组件,并且组件合并单元将订户消息替换和插入到所提取的组件的全部或部分空白区域中。
根据本发明的再一个方面,组件合并单元用特定的SMS或MMS消息替换订户消息,以与选定的组件合并。
根据本发明的再一个方面,组件合并单元将组件插入到订户消息之前或订户消息之后。
根据本发明的再一个方面,组件/过滤单元数据库在被驱动或更新的时候将数据库中的数据加载到存储器中,并且消息鉴别单元和组件提取单元在选择MMS数据、SMS数据和过滤数据时读取加载到存储器中的数据。
根据本发明的再一个方面,组件/过滤数据库在被驱动或更新的时候建立包含数据库的数据的数据文件,并且消息鉴别单元和组件提取单元在选择MMS数据,SMS数据和过滤数据时读取包含在数据文件中的数据。
根据本发明的再一个方面,消息鉴别单元或者组件提取单元通过存储器映射I/O读取数据文件,并且在存储器映射I/O中提供有预定的存储区域以存储和映射组件/过滤数据库的全部或部分以便读取。
根据本发明的再一个方面,消息鉴别单元或者组件提取单元通过存储器映射I/O读取数据文件,并且在存储器映射I/O中提供有预定的存储器以将数据文件的全部或部分加载到存储器中,并且在存储器映射I/O中提供有预定的存储区域以存储和映射加载到存储器中的数据的全部或部分以便读取。
根据本发明的再一个方面,一种消息转换方法包括:在从订户终端接收到消息时,检查接收所述消息的目的移动通信终端的终端信息和与消息转换服务相关的设置项;通过第一过滤单元、第二过滤单元和第三过滤单元来掌握语境的意思结构,其中,第一过滤单元针对每个主题使用多个句子以与消息进行比较,每个句子由一个或多个词组成;第二过滤单元使用句子以与消息进行比较,所述句子由包括可替换词在内的一个或多个词组成;第三过滤单元通过所掌握的语境来积累发送的个人用户的消息内容,并提取重复使用的短语或句子和表述,第三过滤单元是采用统计方法的个性化单元;生成通过了由过滤单元掌握语境的意思结构的处理和由采用统计方法的个性化单元掌握语境的意思结构的处理的订户消息;当经过第一过滤单元的操作后没有通过语境识别进行消息转换时,执行第二过滤单元的操作;当经过第二过滤单元的操作后没有通过语境识别进行消息转换时,执行采用统计方法进行个性化的第三过滤单元的操作;将与所提取的组件合并的订户消息发送到目的移动通信终端。
根据本发明的再一个方面,采用统计方法的个性化包括为每个用户分析消息,提取以某一频率重复使用的短语,为重复使用的短语生成或分配内容,并应用所述服务。
根据本发明,使用过滤方法和采用统计方法的个性化单元来识别语境。从而,获得了降低文本识别的错误率的效果。
进一步地,内容管理模块应用数据库,内容使用模块利用使用数据文件的存储器映射I/O单元。因此,同样的数据会出现在数据库和数据文件中。此外,由于内容使用模块在初始化时把数据文件映射到存储器中,可以高速地使用数据。
更进一步地,由于内容管理模块同步更新数据库和数据文件,内容使用模块能够即时地使用到最新数据。
附图说明
图1和图2举例说明了现有技术的实施例。
图3是描述了应用本发明的通信网络的图。
图4是描述了根据本发明的消息转换系统的结构图。
图5是描述了根据本发明的消息转换系统的过滤部的图。
图6是描述了根据本发明的统计处理系统的图。
图7-10是描述了根据本发明的存储器映射I/O的图。
图11是描述了根据本发明的消息转换方法的流程图。
图12是描述了根据本发明的统计处理方法的流程图。
图13-14是举例说明了应用本发明的消息示例的图。
附图标记
12 SMS或者MMS中心
13 消息转换服务器
14 组件/过滤数据库
15 订户数据库
20 消息接收部
21 订户认证部
22 消息鉴别部
23 组件提取部
24 组件合并部
25 消息发送部
26 互联网匹配部
27 过滤部
28 采用统计方法的个性化单元
具体实施方式
在下文中,参照附图详细描述本发明的优选实施例。当判断为相关的公知功能或结构的详细描述会使本发明的发明点不清晰时,将省略该描述。接下来描述的术语是考虑本发明的功能而定义的,根据使用者和操作者的目的或实际情况会有所不同。因此,术语的意思应当基于本申请的内容进行解释。
图1和图2展示了一个根据现有技术的示例。根据传统的消息转换系统,当例如“爱”或者“生气”的词在文本消息中出现时,可使用为该词准备的内容来转换文本消息,以便获知发送者的心情,从而带来乐趣,如图1所示。然而,通过这样简单的词识别而执行的转换具有逻辑错误的问题,如图2所示。也就是说,用户的文本消息的意思与自动设置的内容相反,从而传达了与文本消息本来要表示的意思相反的意思。这个结果对于付费服务来说是致命的。在实际的消息服务中,当负责消息服务的人发现了这样的错误后,会停止使用所执行的识别功能。在一个字可以表示一个词的中文消息中,这个问题变得更加严重,因为同一个字能够表达很多不同的意思。
图3图解说明了一个应用本发明的通信网络。如图3所示,这个通信网络包括业务服务器、接收器、发送器、SMS G/W网关、SMSC(短消息服务中心)、MMSC(多媒体消息系统中心)、MMS手机接收器以及其他移动通信服务供应商的MMS服务器。具体地,当来自接收器的消息经过SMSC(短消息服务中心)或MMSC(多媒体消息系统中心)传输至业务服务器后,业务服务器合并与该消息相应的组件以便发送到发送者。然而,每个服务供应商使用它自己的MMSC。也就是说,由A移动通信服务供应商生成的多媒体消息不能发送到B移动通信服务供应商。因此,MMSC不仅与MMS手机接收器相连,还与其他移动通信服务供应商的MMS服务器相连。
图4图解说明了根据本发明的一个消息转换系统的结构。如图4所示,本发明的消息转换系统13包含消息接收部20,用于接收来自SMS中心或MMS中心12的订户消息;订户认证部21,其通过订户数据库来检验这个订户是否已加入消息转换服务,核实与订户指定的消息转换服务相关的设置项,确认接收这个消息的目的移动通信终端的终端信息;消息鉴别部22,其包含过滤单元27和应用统计方法的个性化单元28,这个过滤部27分析消息是否通过过滤单元。进一步地,消息转换系统13包含组件提取部23,用来从组件/过滤数据库14提取由经核实的与消息转换服务相关的设置项或分析出的结果所指示的组件;组件合并部24,它将提取出的组件与订户消息合并。合并有这些组件的消息经过消息发送部25发送到SMS或者MMS中心12。更进一步地,消息转换系统13包含互联网匹配部26,其用来通过移动通信终端和/或计算机16和互联网从移动通信订户接收消息转换服务的订制,并向消息转换服务的订户提供通过网页编写短消息的功能、设置与消息转换相关的各个项目的功能和与之对应的设置/查询功能。
SMS中心或者MMS中心12把移动通信终端的消息发送到消息转换服务器13中的消息接收部20,请求消息转换服务器将订户消息转换为SMS或者MMS消息,把转换后的SMS消息或者MMS消息发送到目的移动通信终端。
组件/过滤数据库14存储MMS数据,例如照片、声音、电影、由各种各样字母组成的SMS数据和消息鉴别部的过滤单元所参照的多种数据。
订户数据库15存储移动通信终端的手机号码,移动通信服务订户的名字,SMS或者MMS自动插入选项,移动通信终端的终端信息(发送和接收短消息的移动通信终端的终端信息)(例如,是否支持MMS服务,关于终端显示规格的信息等)。
通过存储在订户数据库15中的移动通信订户的个人信息(例如,移动通信终端的手机号码,订户是否加入了消息转换服务,订户的订户ID和密码),订户认证部21检查这个移动通信订户是否加入了消息转换服务。此外,订户认证部21校验存储于订户数据库15中的与消息转换服务相关的设置项,以及接收SMS或者MMS消息的目的移动通信终端的终端信息。然后,订户认证部21向相应部件提供消息转换所需的信息。
当SMS中心或者MMS中心12接收到来自移动通信终端的消息时,如果相应的移动通信订户加入了消息转换服务,则SMS中心或者MMS中心12请求消息转换系统13将该消息转换为SMS或者MMS消息。同时,如果移动通信订户没有加入消息转换服务,该消息会通过传统方式发送到移动通信终端。
消息鉴别部22用于执行消息转换的预处理,具体如下。消息鉴别部22的预处理包括当从订户终端接收到消息时,校验接收消息的目的移动通信终端的终端信息和与消息转换服务相关的设置项;并且通过第一到第三过滤单元掌握语境的意思结构。第一过滤单元使用针对一个主题的多个句子,每个句子由一个或多个字母组成。第二过滤单元使用由包括可替换词在内的一个或多个词组成的句子。第三过滤单元通过所掌握的语境积累所发送的消息内容以提取重复使用的短语或句子和表达,第三过滤单元是使用统计方法的个性化单元。
个性化单元28使用统计方法为每个用户分析消息,提取以某频率重复使用的短语,为重复使用的短语生成或分配内容,并应用服务。
当订户消息经由消息鉴别单元通过了过滤部时,组件提取部23从组件/过滤数据库中提取与订户消息相应的MMS数据或SMS数据。
根据目的移动通信终端的显示规格,组件合并部24将订户消息与MMS数据或SMS数据合并,或者用MMS数据或SMS数据替换接收到的消息,从而生成MMS或SMS消息。
互联网匹配部26通过互联网与移动通信终端和/或计算机16相连,并提供消息转换服务订阅网页,用于编写消息的网页,用于与消息转换相关的各种环境设置的网页,和SMS或者MMS设置/查询网页。
与此同时,本领域的普通技术人员很容易理解,由移动通信订户在互联网匹配部26的网页上编写的消息,像上面描述的一样由各个部件以相同的方式进行处理。此外,根据订户的要求,可以向移动通信终端告知消息转换在正常地进行。消息转换服务可以按月收费或者按照所发送的SMS消息的数量或所发送的MMS消息的数量来进行收费。
图5图解说明了根据本发明的消息转换系统中的过滤部。如图5所示,过滤部包含第一过滤单元,第二过滤单元,第三过滤单元。其中,第一过滤单元使用多个短语和子句,第二过滤单元使用短语和子句的结构,第三过滤单元用作使用统计方法的个性化单元。
具体而言,当要通过简单词识别而识别的词被设置为一个主题时,第一过滤单元设置应用了该词或其意思的多个短语和子句。例如,假定设定了一个主题“公共汽车”并且使用简单词识别。这种情况下,如果用一个乘坐公共汽车的人的图片来修饰表达“我现在在步行,因为我不想坐公共汽车”的消息,则会发生错误。在这里,使用由一个或多个词(例如“坐公共汽车”,“在公共汽车里”和“我打算坐公共汽车”)组成的更清楚的过滤器。这是因为应该在一个主题中使用多个过滤器以提高识别率。
第二过滤单元使用由一个或多个词构成的过滤器,该一个或多个词中的一部分可被替换以提高识别率。例如,当使用针对诸如“爱”的主题的“A,我爱你”这样的过滤器时,A对应于“甜心”或者特定的名字。作为另一例,当使用针对诸如“打架”的主题的“A和B在打架”这样的过滤器时,A和B可对应于很多非特定人的名字。使用包含这种可替代词的短语和子句的过滤器能够构造地比上述例子更复杂。此外,虽然不是所有的词都一致,但还是可以执行识别,从而弥补由短语和子句构成的过滤器的低识别率。
尽管第一和第二过滤单元使用一个或多个词来减少错误发生,但与简单词识别相比识别率会有所下降。第三过滤单元能够使用利用统计方法的个性化来对此进行弥补。该使用统计方法的个性化是积累个人用户的所发送消息内容以自动提取出重复使用的短语或句子和表达以便进行相应的消息转换。在用户经常使用的词和表达很有可能被再次使用的假设下,个性化具有提高用户消息的识别率和服务提供成功率的效果。采用统计方法的个性化大致分以下几步:为每个用户分析消息的步骤,提取以某一频率重复使用的短语的步骤,为重复使用的短语生成或分配内容的步骤,应用服务的步骤。为每个用户分析消息的步骤和提取以某一频率重复使用的短语的步骤由自动程序执行,为重复使用的短语生成或分配内容的步骤和应用服务的步骤通过管理员的操作被存储在CMS数据库中。
图6图解说明了根据本发明的统计处理系统。图12是根据本发明的统计处理方法的流程图。在上面描述的词识别方法中,使用了一个或多个词以减少错误。然而,与简单词识别相比识别率会下降。这种情况下,采用统计方法的个性化可以弥补这一缺点。该使用统计方法的个性化积累个人用户的所发送消息的内容以自动提取出重复使用的短语或句子和表达以便进行相应的消息转换。在用户经常使用的词和表达很有可能被再次使用的假设下,个性化具有提高用户消息的识别率和服务提供成功率的效果。采用统计方法的个性化大致分以下几步:为每个用户分析消息的步骤,提取以某一频率重复使用的短语的步骤,为重复使用的短语生成或分配内容的步骤,应用服务的步骤。为每个用户分析消息的步骤和提取以某一频率重复使用的短语的步骤由自动程序执行,为重复使用的短语生成或分配内容的步骤和应用服务的步骤通过管理员的操作被存储在CMS数据库中。
图7到图10说明了根据本发明的存储器映射I/O。如前面所述的过滤单元执行比简单词识别更为复杂的操作。因此,当按照通常方式来实现过滤单元时,需要更高的工作能力。因此,实施了能够提高速度的存储器映射I/O以增强效率。为了检查用户消息中的语境或词以附加适合的组件,需要内容列表和词/短语列表,还需要相应列表间的映射信息。代表性地,通常利用可容易地进行添加/删除/更新的数据库来管理这些数据。在添加适合于语境的内容的服务中,为了增加顾客的满意度,应当通过用户的反馈来不断地添加和更新内容和词/短语数据。因此,为了实现服务,应当重视内容管理的便利性。
当使用数据库时,可以通过简单的SQL语句来实现添加/删除/更新内容和词/短语数据的管理功能。如上所述容易地实现内容管理模块。然而,如果利用这些数据来向文本消息附加内容的模块(以下,称为“内容使用模块”)每当选择内容时都必须访问数据库,则内容使用模块的效率会被降低。因为一般需要数百毫秒来访问数据库,所以这样的数据库访问对于每秒需要处理一百条以上文本消息的内容使用模块来说是不适宜的。这个方法如图7所示。
如图7所示的方法中,内容管理模块直接更新数据库,并且内容使用模块从数据库中直接读取数据以确保内容、词/短语数据和相关数据的一致性。尽管速度低,但是内容管理模块和内容使用模块都可与各模块的状态无关地分别访问数据库。因此,实施起来很简单。
为了避免内容使用模块在数据库正在使用的时候访问数据库,使用了如下方法。当内容使用模块被驱动时,内容使用模块与数据库连接以将所有数据加载到存储器中。然后,只要选择了内容,都使用存储器中的数据。然而,即使在这个方法中,只要内容或者词/短语数据被更新,内容使用模块都需要与数据库连接以便更新加载到存储器中的数据。因此,只要数据被更新,就不可避免地会产生性能退化。图8中示出了该方法。
本发明提出了一个方法,当内容管理模块使用数据库以维持内容和词/短语数据管理的便利性时,内容使用模块不使用数据库而使用最新的内容和词/短语数据以保持最高性能。在本发明中,存储器映射I/O技术被应用到这一方法中。存储器映射I/O技术将文件的全部或部分映射到存储器中以进行使用。当读取映射存储区域时,可以读出与数据文件相同的数据。也就是说,当内容管理模块更新数据文件时,内容使用模块的映射存储区域也同时更新。因此,在该方法中,内容使用模块能够立即获知服务所需数据(如内容、词/短语)的更新,而不需要单独的操作。使用了该技术的方法如图9所示。
在存储器映射I/O中,不是直接访问存储器,而是以更高的速度访问文件。通过存储器映射I/O进行数据读/写的速度比对文件进行读/写的速度高3倍,也就是说,通过存储器映射I/O实现的速度低于直接访问存储器的速度。因此,图9所示的技术在服务执行速度方面要低于图10所示的技术。在图8中,当内容使用模块被初始化时,所有的内容和词/语句数据都应当被加载到存储器中,以维持高速度。因此,当内容和词/语句数据的量大于存储器的容量时,图8所示的方法就无法使用了。然而,存储器映射I/O在这种情况下仍能够使用,这是因为只有实际被使用的数据才会被映射到存储器中。
在本发明中,在包含不能存储所有内容和词/语句数据的存储器的系统中实施图9的技术,在包含能够存储所有内容和词/短语数据的存储器的系统中实施图10的技术。
图10中示出的方法是结合了图8的技术和图9的技术而得到的。在这个方法中,内容使用模块在初始化的时候把所有的内容和词/短语数据加载到存储器中,同时,利用存储器映射I/O进行映射。之后,在服务中使用数据时,仅从存储器中读取数据。从而,内容使用模块能够表现出最好的性能。这种情况下,内容使用模块周期性地检查关于映射区域中的内容是否进行了更新的字段。由于这个字段仅仅需要一个字节,每秒访问一次不会对性能有影响。
当内容和词/短语数据被更新之后,内容管理模块将更新后的内容和数据反映到数据库和数据文件中,然后设置关于内容是否被更新的字段。同时,内容使用模块侦测内容和词/短语数据的更新,并将映射区域的数据复制到存储器中。
图11是根据本发明的消息转换方法的流程图。如图11所示,接收消息(S11),并且检查订户信息和目的终端的终端信息(S120)。之后,判断这个订户是否加入了消息转换服务(S13)。如果这个订户已经加入了消息转换服务,则检查该消息是否通过了过滤部(S14)。如果这条信息通过了过滤部,则提取适合于订户消息的组件(S15)以与订户消息合并(S16)。与组件合并的这条消息通过消息发送部被发送出去。
图13和14阐明了应用本发明的消息示例。图13示出了合并有图片组件的消息示例,图14展示了合并有运动图像和图片组件的消息。

Claims (9)

1.一种消息转换系统,该消息转换系统包括:
组件/过滤数据库,其存储MMS数据和SMS数据,该MMS数据由照片、声音、运动图像中的至少一项构成,该SMS数据由各种字符构成;
认证信息存储单元,其存储与消息转换服务相关的设置项和发送和接收短消息的移动通信终端的终端信息;
信息接收单元,其接收终端侧的订户编写的订户消息;
订户认证单元,其检查接收所述消息的目的移动通信终端的终端信息和与SMS或者MMS消息转换服务相关的设置项;
消息鉴别单元,其使用存储在组件/过滤数据库中的过滤数据执行过滤操作,以检查订户消息是否通过过滤,该消息鉴别单元包括第一过滤单元、第二过滤单元和第三过滤单元:
第一过滤单元,其将订户消息与针对各个主题的多个句子进行比较,各个句子由一个或多个词组成;
第二过滤单元,其将订户消息与多个句子进行比较,各个句子由包括可替换词在内的一个或多个词组成;和
第三过滤单元,其针对每个订户分析消息,提取以某一频率重复使用的短语,为所述重复使用的短语生成或分配内容;
组件提取单元,当订户消息通过消息鉴别单元的过滤后,该组件提取单元从组件/过滤数据库提取出与该订户消息相应的MMS数据或者SMS数据;
组件合并单元,其根据目的移动通信终端的显示规格,将所述MMS或者SMS数据与订户消息合并,或者用所述MMS或者SMS数据替换接收到的消息,以生成MMS或者SMS消息;
消息发送单元,其把生成的MMS或者SMS消息发送到目的移动通信终端。
2.根据权利要求1所述的消息转换系统,其特征在于,还包括:
互联网匹配单元,其通过网页接收SMS或MMS消息转换服务的订制,并提供编写消息的功能、SMS或MMS消息转换服务的功能、设置与SMS或MMS消息转换服务相关的项目的功能中的全部或者部分。
3.根据权利要求1所述的消息转换系统,其特征在于,组件合并单元将组件插入到订户消息之前或订户消息之后。
4.根据权利要求1-3中的任何一项所述的消息转换系统,其特征在于,
组件/过滤数据库在被驱动或更新的时候将数据库中的数据加载到存储器中,并且
消息鉴别单元和组件提取单元在选择MMS数据、SMS数据和过滤数据时读取加载到存储器中的数据。
5.根据权利要求1-3中的任何一项所述的消息转换系统,其特征在于,
组件/过滤数据库在被驱动或更新的时候建立包含数据库的数据的数据文件,并且
消息鉴别单元和组件提取单元在选择MMS数据,SMS数据和过滤数据时读取包含在数据文件中的数据。
6.根据权利要求5所述的消息转换系统,其特征在于,
消息鉴别单元或者组件提取单元通过存储器映射I/O读取数据文件,并且
在存储器映射I/O中提供有预定的存储区域以存储和映射组件/过滤数据库的全部或部分以便读取。
7.根据权利要求5所述的消息转换系统,其特征在于,
消息鉴别单元或者组件提取单元通过存储器映射I/O读取数据文件,并且
在存储器映射I/O中提供有预定的存储器以将数据文件的全部或部分加载到该存储器中,并且提供有预定的存储区域以存储和映射加载到存储器中的数据的全部或部分以便读取。
8.一种消息转换方法,包括:
在从订户终端接收到消息时,检查接收所述消息的目的移动通信终端的终端信息和与消息转换服务相关的设置项;
通过第一过滤单元、第二过滤单元和第三过滤单元来掌握语境的意思结构,其中,第一过滤单元针对每个主题使用多个句子以与消息进行比较,每个句子由一个或多个词组成;第二过滤单元使用句子以与消息进行比较,所述句子由包括可替换词在内的一个或多个词组成;第三过滤单元通过所掌握的语境积累个人用户的所发送消息内容,并提取重复使用的短语或句子和表述,第三过滤单元是采用统计方法的个性化单元;
生成通过了由第一过滤单元和第二过滤单元掌握语境的意思结构的处理和由采用统计方法的个性化单元掌握语境的意思结构的处理的订户消息;
当经过第一过滤单元的操作后没有通过语境识别进行消息转换时,执行第二过滤单元的操作;
当经过第二过滤单元的操作后没有通过语境识别进行消息转换时,执行采用统计方法进行个性化的第三过滤单元的操作;
当订户消息通过所述第一过滤单元、第二过滤单元和第三过滤单元识别后,从组件/过滤数据库提取出与该订户消息相应的MMS数据或者SMS数据;
将所述MMS或者SMS数据与订户消息合并,或者用所述MMS或者SMS数据替换接收到的消息,以生成MMS或者SMS消息;
把生成的MMS或者SMS消息发送到目的移动通信终端。
9.根据权利要求8所述的消息转换方法,其特征在于,
采用统计方法的个性化包括为每个用户分析消息,提取以某一频率重复使用的短语,为重复使用的短语生成或分配内容,并应用所述服务。
CN2006800039715A 2005-09-15 2006-08-14 语境识别增强消息转换系统和方法 Expired - Fee Related CN101116349B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020050086105A KR100680034B1 (ko) 2005-09-15 2005-09-15 문맥 인식이 강화된 메시지 변환 시스템 및 방법
KR10-2005-0086105 2005-09-15
KR1020050086105 2005-09-15
PCT/KR2006/003176 WO2007032606A1 (en) 2005-09-15 2006-08-14 Context cognizance enhancing message transform system, and method for the same

Publications (2)

Publication Number Publication Date
CN101116349A CN101116349A (zh) 2008-01-30
CN101116349B true CN101116349B (zh) 2011-04-20

Family

ID=37865158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800039715A Expired - Fee Related CN101116349B (zh) 2005-09-15 2006-08-14 语境识别增强消息转换系统和方法

Country Status (4)

Country Link
JP (1) JP4642903B2 (zh)
KR (1) KR100680034B1 (zh)
CN (1) CN101116349B (zh)
WO (1) WO2007032606A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311058B2 (en) 2008-05-10 2012-11-13 Vantrix Corporation Modular transcoding pipeline
US8220051B2 (en) 2007-09-28 2012-07-10 Vantrix Corporation Generation and delivery of multimedia content-adaptation notifications
KR101657196B1 (ko) 2009-12-01 2016-09-19 밴트릭스 코오퍼레이션 캐시를 이용한 효율적인 미디어 배송 시스템 및 방법
US9112922B2 (en) 2012-08-28 2015-08-18 Vantrix Corporation Method and system for self-tuning cache management
WO2014071375A1 (en) * 2012-11-05 2014-05-08 Brilliant Mobile L.L.C. Media messaging methods, systems, and devices

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754484B1 (en) * 2000-07-10 2004-06-22 Nokia Corporation Short messaging using information beacons

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3470664B2 (ja) * 1999-12-01 2003-11-25 日本電気株式会社 受信メール表示方法及び絵文字変換機能付き電子メール端末装置
KR20050029902A (ko) * 2003-09-24 2005-03-29 최용국 자동 이미지 문자 변환 서비스 방법 및 시스템
KR100608725B1 (ko) * 2003-11-27 2006-08-04 엘지전자 주식회사 이동 통신 단말기의 문자메시지 송수신 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754484B1 (en) * 2000-07-10 2004-06-22 Nokia Corporation Short messaging using information beacons

Also Published As

Publication number Publication date
KR100680034B1 (ko) 2007-02-07
CN101116349A (zh) 2008-01-30
JP4642903B2 (ja) 2011-03-02
JP2009509229A (ja) 2009-03-05
WO2007032606A1 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
CN101567889B (zh) 用于为网络提供漏洞利用保护的系统与方法
CN103067896B (zh) 垃圾短信过滤方法及装置
CN101116349B (zh) 语境识别增强消息转换系统和方法
CN109617646A (zh) 报文转换方法、装置、计算机设备及计算机可读存储介质
KR20060043333A (ko) 데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법
US10558655B2 (en) Data query method supporting natural language, open platform, and user terminal
US8903771B2 (en) Method and device for importing backup data for a mobile terminal
CN109617647A (zh) 报文转换方法、装置、计算机设备及计算机可读存储介质
EP1480420B1 (en) Language information related keypad input mode control
CN113315874B (zh) 用于呼叫分类的系统和方法
CN109064161A (zh) 一种基于短信的银行账户交易流水智能管理方法和装置
US10067631B2 (en) Communication terminal and method of providing unified interface to the same
CN106685799A (zh) 基于CoreSeek的多平台微信服务的通知发送方法
CN101072206B (zh) 即时通信系统中二次认证的方法及系统
CN101470752A (zh) 基于关键词解析调度的搜索引擎方法
CA3065729A1 (en) Business rules processing framework
KR20090000597A (ko) 다이렉트 팬레터 운영시스템 및 방법
CN112069304A (zh) 一种保险业务的问答方法、装置、服务器以及存储介质
CN101120598B (zh) 感情图标消息转换系统及其方法
GB2369906A (en) Electronic mail service system
CN110401591A (zh) 一种基于透明代理的邮件全局审查过滤系统及方法
CN111368522B (zh) 信息生成方法及装置、计算机设备及计算机可读存储介质
CN101668253B (zh) 一种移动终端联系人的识别方法、系统移动终端
CN112434058B (zh) 基于Java与MySQL的数据交互方法及计算机可读介质
CN104363348A (zh) 信息数据处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110420

Termination date: 20130814