CN107132926A - 输入法中名词词组的创建方法及装置 - Google Patents
输入法中名词词组的创建方法及装置 Download PDFInfo
- Publication number
- CN107132926A CN107132926A CN201610112964.4A CN201610112964A CN107132926A CN 107132926 A CN107132926 A CN 107132926A CN 201610112964 A CN201610112964 A CN 201610112964A CN 107132926 A CN107132926 A CN 107132926A
- Authority
- CN
- China
- Prior art keywords
- addressee
- title
- noun phrase
- input method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例涉及一种输入法中名词词组的创建方法及装置,在检测到电子邮箱客户端中有已发送的目标电子邮件时,则提取目标电子邮件中的收件人的名称,并根据收件人的名称创建名词词组;之后将创建的名词词组添加到输入法的词库中。也即本申请中,增加了输入法创建名词词组的来源,由此提高了输入法中名词词组的全面性,从而进一步可以提高用户输入名词词组的效率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种输入法中名词词组的创建方法及装置。
背景技术
传统技术中,输入法创建名词词组的来源有限,如IOS系统内置的输入法,只能根据联系人列表中的联系人名称创建名词词组,然而该方法并不能完全覆盖用户所需要用到的名词词组,因此,需要提供一种输入法中名词词组的创建方法,以提高输入法中名词词组的全面性,进而提高用户输入名词词组的效率。
发明内容
本申请实施例提供了一种输入法中名词词组的创建方法及装置,可以提高用户输入名词词组的效率。
第一方面,提供了一种输入法中名词词组的创建方法,该方法包括:
从电子邮件客户端中获取已发送的目标电子邮件;
从所述已发送的目标电子邮件中提取收件人的名称;
根据所述收件人的名称,创建名词词组;
将所述名词词组添加到输入法的词库中。
第二方面,提供了一种输入法中名词词组的创建装置,该装置包括:
获取单元,用于从电子邮件客户端中获取已发送的目标电子邮件;
提取单元,用于从所述获取单元获取的所述已发送的目标电子邮件中提取收件人的名称;
创建单元,用于根据所述提取单元提取的所述收件人的名称,创建名词词组;
添加单元,用于将所述创建单元创建的所述名词词组添加到输入法的词库中。
本申请提供的输入法中名词词组的创建方法及装置,在检测到电子邮箱客户端中有已发送的目标电子邮件时,则提取目标电子邮件中的收件人的名称,并根据收件人的名称创建名词词组;之后将创建的名词词组添加到输入法的词库中。也即本申请中,增加了输入法创建名词词组的来源,也即提高了输入法中名词词组的全面性,从而进一步可以提高用户输入名词词组的效率。
附图说明
图1为本申请一种实施例提供的输入法中名词词组的创建方法流程图;
图2为本申请另一种实施例提供的输入法中名词词组的创建方法流程图;
图3为本申请再一种实施例提供的输入法中名词词组的创建装置示意图。
具体实施方式
下面结合附图,对本发明的实施例进行描述。
本申请实施例提供的输入法中名词词组的创建方法,适用于在输入法中为用户创建常用联系人的名称对应的名词词组的场景,如,创建电子邮件客户端中用户常用联系人的名称对应的名词词组。此处的输入法是指辅助用户输入非英语字符的软件程序,其可以为拼音输入法,也可以为形码输入法等;其中,拼音输入法包括但不限于搜狗拼音输入法和微软拼音输入法等。此外,本申请的电子邮件可以是指符合RFC2822格式规范的电子报文,如,Outlook、foxmail以及网易等中的电子邮件。上述电子邮件客户端包括但不限于Outlook客户端、foxmail客户端以及网易客户端等。
需要说明的是,本申请的词组是指输入法使用的多个字符集合,使用户无需单独输入每个字符即可一次完成词组的输入。
图1为本申请一种实施例提供的输入法中名词词组的创建方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图1所示,所述方法具体可以包括:
步骤110,从电子邮件客户端中获取已发送的目标电子邮件。
此处,由于已发送的电子邮件中的收件人是用户确定联系过的人,所以该收件人的名称在未来会继续输入的可能性较大,作为输入法词组的必要性很强。所以本申请将收件人的名称作为输入法创建名词词组的来源,可以有效提高名词词组输入的效率。
其中,步骤110具体可以包括:
周期性检测电子邮件客户端中已发送的电子邮件;
当检测到未对第一电子邮件中收件人的名称创建名词词组时,则将第一电子邮件获取为目标电子邮件。
在一个例子中,可以对电子邮件客户端中已发送的电子邮件进行标记;具体标记过程可以为:对已发送的任一电子邮件,若未对该任一电子邮件中收件人的名称创建对应的名词词组,则将该任一电子邮件标记为未处理状态,否则标记为已处理状态。可以理解的是,初始时,电子邮件客户端中的所有电子邮件均为未处理状态。本申请可以将所有处于未处理状态的电子邮件获取为目标电子邮件,也即初始时将所有电子邮件获取为目标电子邮件。需要说明的是,在为目标电子邮件中收件人的名称创建对应的名词词组之后,则可以将目标电子邮件标记为已处理状态。
在将电子邮件客户端中的目标电子邮件均标记为已处理状态时,也即在为电子邮件客户端中的目标电子邮件中收件人的名称创建对应的名词词组之后,因为用户可能通过电子邮件客户端发送新的电子邮件,所以可以周期性对电子邮箱客户端中已发送的电子邮件进行检测,一旦检测到有新的电子邮件被发送,也即有标记为未处理状态的电子邮件,则将该新的电子邮件获取为目标电子邮件。
可以理解的是,新的电子邮件中收件人的名称可能是用户之前联系过的,也即已经在输入法中为收件人的名称创建了对应的名词词组,从而可以直接将该新的电子邮件标记为已处理状态;否则,在为新的电子邮件中收件人的名称创建对应的名词词组之后,才将该新的电子邮件标记为已处理状态,由此可以方便用户对新的收件人的名称的输入。
步骤120,从所述已发送的目标电子邮件中提取收件人的名称。
其中,步骤120具体可以为:
根据预设字符串,从所述已发送的目标电子邮件中提取所述目标电子邮件的开头部分;
从所述目标电子邮件的开头部分中提取所述收件人的名称。
需要说明的是,电子邮件客户端中已发送的电子邮件可以包括两个部分:开头部分和主体部分,其中,开头部分也称邮件头,位于邮件报文开始部分,用于表示该邮件发送接收人或服务器相关信息的部分;开头部分一般通过预设字符串进行标识,如,可以通过“To”进行标识,其可以包括两个部分:收件人的名称(Name)和邮件地址(Email_address),收件人的名称属于可选部分,即开头部分可以只包括邮件地址。在本申请中,若开头部分不包括收件人的名称,则直接可以将目标电子邮件标记为已处理状态。
具体地,可以从目标电子邮件中提取以“To”开头的开头部分;之后判断开头部分中是否包含收件人的名称,也即判断是否包含“Name”字段,若是,则提取“Name”字段的内容,也即提取收件人的名称。
步骤130,根据所述收件人的名称,创建名词词组。
此处,收件人的名称可以是由至少一个中文字符(也称汉字)构成,也可以是由至少一个英文字符构成。具体地,在提取到收件人的名称之后,可以根据输入法中预设的编码算法,对收件人的名称进行编码,得到编码结果;之后根据收件人的名称以及编码结果,创建名词词组。以搜狗拼音输入法或者微软拼音输入法为例来说,其中预设的编码算法可以为:对于中文字符,将对应的拼音作为其编码结果,也即收件人的名称的编码结果即为其包含的至少一个中文字符对应的拼音的组合;对于英文字符,将本身作为其编码结果,也即收件人的名称的编码结果即为其包含的至少一个英文字符的组合。
需要说明的是,由于上述例子的预设的编码算法对中文字符与英文字符的编码方式不同,所以本申请在创建名词词组之前,还可以判断收件人的名称是由至少一个中文字符构成还是由至少一个英文字符构成。在一个例子中,该判断过程可以为:获取收件人的名称中的最高位字符,若该字符的计算机编码为0,则可以确定收件人的名称由至少一个英文字符构成;若该字符的计算机编码为1,则可以确定收件人的名称由至少一个中文字符构成。当然,在实际应用中,也可以通过其它方式识别中英文字符,本申请对此不作限定。
需要注意的是,上述预设的编码算法仅仅是为了便于理解而给出的一种示例性说明,不应理解为对本申请的限制。事实上,不同的输入法,预设的编码算法可能都不相同,比如,在王码五笔86版输入法中,其预设的编码算法可以为:对于中文字符,将对应的拼音作为其编码结果,对于英文字符,将本身作为其编码结果;之后使用收件人的名称中的每个字符的第一个或前两个编码组合而成名词词组的编码结果;需要说明的是,具体使用第一个还是前两个编码,取决于收件人的名称中的字符数量。此为所有五笔输入法遵循的标准词组编码方法,本申请对此不作展开。
以搜狗拼音输入法或者微软拼音输入法为例,当收件人的名称由至少一个中文字符构成时,上述根据预设的编码算法,对收件人的名称进行编码具体可以为:
步骤A:根据至少一个中文字符,从输入法的汉字与拼音的对应关系表中读取对应的拼音。
假设步骤120中提取的收件人的名称为“张三”,也即包含两个中文字符,即“张”和“三”;且假设输入法中汉字与拼音的对应关系如表1所示。
表1
汉字 | 拼音 |
啊 | a |
爱 | ai |
三 | san |
… | … |
张 | zhang |
… | … |
在此说明,受限于篇幅,表1只列出了较少的例子,实际上汉字与拼音的对应关系可能包含上万行内容。对于上述例子中的两个中文字符,从表1中读取的拼音分别为:“zhang”和“san”。
步骤B:根据至少一个中文字符的拼音,对收件人的名称进行编码。
在该例子中,将拼音“zhang”和“san”组合在一起就构成了收件人的名称的编码结果,即“zhangsan”。
以搜狗拼音输入法或者微软拼音输入法为例,词组的存储形式可以如下:
编码1,1=候选项1;编码2,2=候选项2;编码3,3=候选项3…
在如前述例子中,根据收件人的名称以及编码结果,创建的名词词组可以如下:
zhangsan,显示序号=张三;
也即在上述输入法中,创建的名词词组同时包含了编码结果,显示序号以及收件人的名称。当然,这里只是以搜狗拼音输入法或者微软拼音输入法为例,说明了创建的名词词组的格式。在其它输入法中,创建的名词词组的格式也可以为:“zhangsan,张三”,本申请对此不作限定。
上述过程说明了在收件人的名称由至少一个中文字符构成时,名词词组的创建方法;在收件人的名称由至少一个英文字符构成时,名词词组的创建方法类似,不同的只是,英文字符的编码即为其本身,如,在收件人的名称为“Angel”时,则创建的名词词组可以为:angel,显示序号=Angel;由于其创建方法类似,本申请在此不复赘述。
此外,还需要说明的是,初始获得的收件人的名称中可能还包含其它非中英文字符;在收件人的名称中还包含其它非中英文字符时,则可以先将收件人的名称中的非中英文字符删除,之后再创建名词词组。
步骤140,将所述名词词组添加到输入法的词库中。
以搜狗拼音输入法或者微软拼音输入法为例,将所述名词词组添加到输入法的词库中的具体过程可以为:将创建的名词词组新增到输入法的配置文件中,注销并重新登录输入法运行的终端之后,创建的名词词组即被添加到了输入法的词库中,也即创建的名词词组生效,生效后的名词词组的使用方式与其它词组相同。
当然,在其它输入法中,也可以通过其它方式将名词词组添加到输入法的词库中,如通过输入法提供的接口写入词库,本申请对此不作限定。
此外,本申请的名词词组的创建流程也可以由输入法或者邮件服务器执行,本申请对此不作限定。
本申请提供的输入法中名词词组的创建方法,在检测到电子邮箱客户端中有已发送的目标电子邮件时,则提取目标电子邮件中的收件人的名称,并根据收件人的名称创建名词词组;之后将创建的名词词组添加到输入法的词库中。也即本申请,增加了输入法创建名词词组的来源,也即提高了输入法中名词词组的全面性,从而进一步可以提高用户输入名词词组的效率。
以下以收件人的名称为中文名称(即由至少一个中文字符构成)为例,对本申请的具体实施方式进行进一步的说明。
图2为本申请另一种实施例提供的输入法中名词词组的创建方法示意图,图2中,所述方法具体可以包括如下步骤:
步骤210,检测电子邮件客户端中是否有处于未处理状态的电子邮件,若无,则结束;若是,则执行步骤220。
初始时,可以将电子邮件客户端中的所有电子邮件标记为未处理状态。
步骤220,读取处于未处理状态的电子邮件。
步骤230,从电子邮件中提取开头部分。
步骤240,判断开头部分是否包括收件人的名称,若否,则结束;若是,则执行步骤250。
步骤250,从开头部分提取收件人的名称。
步骤260,判断收件人的名称是否为中文名称,若否,则结束;若是,则执行步骤270。
步骤270,根据收件人的名称,创建名词词组。
步骤280,将名词词组添加到输入法的词库中,并将上述电子邮件标记为已处理状态。
本申请实施例提供的输入法中名词词组的创建方法,可以提高中文输入法中名词词组的输入效率。
与上述输入法中名词词组的创建方法对应地,本申请实施例还提供的一种输入法中名词词组的创建装置,如图3所示,该装置包括:
获取单元301,用于从电子邮件客户端中获取已发送的目标电子邮件。
其中,获取单元301具体可以用于:
周期性检测所述电子邮件客户端中已发送的电子邮件;
当检测到未对第一电子邮件中收件人的名称创建名词词组时,则将所述第一电子邮件获取为目标电子邮件。
提取单元302,用于从获取单元301获取的所述已发送的目标电子邮件中提取收件人的名称。
其中,提取单元302具体可以用于:
根据预设字符串,从所述已发送的目标电子邮件中提取所述目标电子邮件的开头部分;
从所述目标电子邮件的开头部分中提取所述收件人的名称。
创建单元303,用于根据提取单元302提取的所述收件人的名称,创建名词词组。
其中,创建单元303具体可以用于:
根据预设的编码算法,对所述收件人的名称进行编码,得到编码结果;
根据所述编码结果以及所述收件人的名称,创建名词词组。
创建单元303还可以具体用于:
根据所述至少一个中文字符,从所述输入法的汉字与拼音的对应关系表中读取对应的拼音;
根据所述至少一个中文字符的拼音,对所述收件人的名称进行编码。
添加单元304,用于将创建单元303创建的所述名词词组添加到输入法的词库中。
本申请实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本申请提供的装置的具体工作过程,在此不复赘述。
本申请提供的输入法中名词词组的创建装置,获取单元301从电子邮件客户端中获取已发送的目标电子邮件;提取单元302从所述已发送的目标电子邮件中提取收件人的名称;创建单元303根据所述收件人的名称,创建名词词组;添加单元304将所述名词词组添加到输入法的词库中。由此,提高了输入法中名词词组的全面性,从而进一步可以提高用户输入名词词组的效率。
本申请实施例提供的输入法中名词词组的创建装置可以以进程的形式在服务器的后台运行。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的对象及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种输入法中名词词组的创建方法,其特征在于,该方法包括:
从电子邮件客户端中获取已发送的目标电子邮件;
从所述已发送的目标电子邮件中提取收件人的名称;
根据所述收件人的名称,创建名词词组;
将所述名词词组添加到输入法的词库中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述收件人的名称,创建名词词组,具体为:
根据预设的编码算法,对所述收件人的名称进行编码,得到编码结果;
根据所述编码结果以及所述收件人的名称,创建名词词组。
3.根据权利要求2所述的方法,其特征在于,当所述收件人的名称由至少一个中文字符构成时,所述根据预设的编码算法,对所述收件人的名称进行编码,具体为:
根据所述至少一个中文字符,从所述输入法的汉字与拼音的对应关系表中读取对应的拼音;
根据所述至少一个中文字符的拼音,对所述收件人的名称进行编码。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述从所述已发送的目标电子邮件中提取收件人的名称,具体为:
根据预设字符串,从所述已发送的目标电子邮件中提取所述目标电子邮件的开头部分;
从所述目标电子邮件的开头部分中提取所述收件人的名称。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述从电子邮件客户端中获取已发送的目标电子邮件,具体为:
周期性检测所述电子邮件客户端中已发送的电子邮件;
当检测到未对第一电子邮件中收件人的名称创建名词词组时,则将所述第一电子邮件获取为目标电子邮件。
6.一种输入法中名词词组的创建装置,其特征在于,该装置包括:
获取单元,用于从电子邮件客户端中获取已发送的目标电子邮件;
提取单元,用于从所述获取单元获取的所述已发送的目标电子邮件中提取收件人的名称;
创建单元,用于根据所述提取单元提取的所述收件人的名称,创建名词词组;
添加单元,用于将所述创建单元创建的所述名词词组添加到输入法的词库中。
7.根据权利要求6所述的装置,其特征在于,所述创建单元具体用于:
根据预设的编码算法,对所述收件人的名称进行编码,得到编码结果;
根据所述编码结果以及所述收件人的名称,创建名词词组。
8.根据权利要求7所述的装置,其特征在于,所述创建单元还具体用于:
根据所述至少一个中文字符,从所述输入法的汉字与拼音的对应关系表中读取对应的拼音;
根据所述至少一个中文字符的拼音,对所述收件人的名称进行编码。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述提取单元具体用于:
根据预设字符串,从所述已发送的目标电子邮件中提取所述目标电子邮件的开头部分;
从所述目标电子邮件的开头部分中提取所述收件人的名称。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述获取单元具体用于:
周期性检测所述电子邮件客户端中已发送的电子邮件;
当检测到未对第一电子邮件中收件人的名称创建名词词组时,则将所述第一电子邮件获取为目标电子邮件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610112964.4A CN107132926A (zh) | 2016-02-29 | 2016-02-29 | 输入法中名词词组的创建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610112964.4A CN107132926A (zh) | 2016-02-29 | 2016-02-29 | 输入法中名词词组的创建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107132926A true CN107132926A (zh) | 2017-09-05 |
Family
ID=59721417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610112964.4A Pending CN107132926A (zh) | 2016-02-29 | 2016-02-29 | 输入法中名词词组的创建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107132926A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040111475A1 (en) * | 2002-12-06 | 2004-06-10 | International Business Machines Corporation | Method and apparatus for selectively identifying misspelled character strings in electronic communications |
CN103441921A (zh) * | 2013-08-21 | 2013-12-11 | 觅林网络科技(上海)有限公司 | 通过整理电子邮件的联系人添加方法 |
CN105022547A (zh) * | 2014-04-24 | 2015-11-04 | 刘健萍 | 一种文本输入法及装置 |
-
2016
- 2016-02-29 CN CN201610112964.4A patent/CN107132926A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040111475A1 (en) * | 2002-12-06 | 2004-06-10 | International Business Machines Corporation | Method and apparatus for selectively identifying misspelled character strings in electronic communications |
CN103441921A (zh) * | 2013-08-21 | 2013-12-11 | 觅林网络科技(上海)有限公司 | 通过整理电子邮件的联系人添加方法 |
CN105022547A (zh) * | 2014-04-24 | 2015-11-04 | 刘健萍 | 一种文本输入法及装置 |
Non-Patent Citations (1)
Title |
---|
林晓曦等: "《Windows XP 系统操作大全》", 31 January 2013 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Layton et al. | Authorship attribution for twitter in 140 characters or less | |
US10178107B2 (en) | Detection of malicious domains using recurring patterns in domain names | |
US8886727B1 (en) | Message distribution control | |
US8112484B1 (en) | Apparatus and method for auxiliary classification for generating features for a spam filtering model | |
De Silva et al. | User type classification of tweets with implications for event recognition | |
EP2889792A1 (en) | Method and system for identifying suspected phishing websites | |
JP2014532934A (ja) | 電子メールタグ | |
Uthus et al. | The ubuntu chat corpus for multiparticipant chat analysis | |
CN108259415A (zh) | 一种邮件检测的方法及装置 | |
CN101415159A (zh) | 对垃圾邮件进行拦截的方法和装置 | |
Zilberman et al. | Analyzing group communication for preventing data leakage via email | |
JP2022539622A (ja) | アプリケーションソフトウェアファイル内の難読化コードを検出するための方法、装置、およびシステム | |
US20190303384A1 (en) | Method and system for consolidating data retrieved from different sources | |
CN106878275A (zh) | 身份验证方法及装置和服务器 | |
Ergin et al. | Turkish anti-spam filtering using binary and probabilistic models | |
CN107239520A (zh) | 一种通用论坛正文提取方法 | |
Moutafis et al. | Spam email detection using machine learning techniques | |
Halder et al. | Information extraction from spam emails using stylistic and semantic features to identify spammers | |
CN105897552A (zh) | 在电子邮件客户端系统上生成电子消息的方法和通信设备 | |
CN107132926A (zh) | 输入法中名词词组的创建方法及装置 | |
Zhang et al. | Topic detection in instant messages | |
CN106330670A (zh) | 基于邮件指纹对相同邮件进行判定的方法 | |
Rowe et al. | Making sense of email addresses on drives | |
JP6784975B2 (ja) | 評価装置、評価方法、評価プログラムおよび評価システム | |
CN108710608A (zh) | 一种基于上下文语义的恶意域名语料库生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170905 |
|
RJ01 | Rejection of invention patent application after publication |