CN103399906A - 在进行输入时基于社会关系提供候选词的方法和装置 - Google Patents

在进行输入时基于社会关系提供候选词的方法和装置 Download PDF

Info

Publication number
CN103399906A
CN103399906A CN2013103226077A CN201310322607A CN103399906A CN 103399906 A CN103399906 A CN 103399906A CN 2013103226077 A CN2013103226077 A CN 2013103226077A CN 201310322607 A CN201310322607 A CN 201310322607A CN 103399906 A CN103399906 A CN 103399906A
Authority
CN
China
Prior art keywords
social relationships
mapping table
user
social
communication counterpart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103226077A
Other languages
English (en)
Other versions
CN103399906B (zh
Inventor
吴先超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310322607.7A priority Critical patent/CN103399906B/zh
Publication of CN103399906A publication Critical patent/CN103399906A/zh
Priority to PCT/CN2014/079376 priority patent/WO2015014159A1/zh
Priority to JP2016509289A priority patent/JP6187999B2/ja
Application granted granted Critical
Publication of CN103399906B publication Critical patent/CN103399906B/zh
Priority to US14/954,232 priority patent/US9894030B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/58Message adaptation for wireless communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Abstract

一种在进行输入时基于社会关系提供候选词的方法和装置。所述方法包括:检测用户的输入;当检测到用户的输入时,确定当前应用环境是否为信息交换应用;当确定当前应用环境是信息交换应用时,确定与用户通信的通信对方的标识符;基于确定的通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,其中,社会关系自动判定模型是判断用户与通信对方的社会关系的模型;根据社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,其中,社会关系修正映射表基于确定的社会关系提供与所述社会关系相应的修正候选词;如果所述输入与所述社会关系不匹配,则基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。

Description

在进行输入时基于社会关系提供候选词的方法和装置
技术领域
本发明涉及一种在进行输入时提供候选词的方法和装置,更具体地说,涉及一种在进行输入时基于社会关系提供候选词的方法和装置。
背景技术
现在,随着通信技术的发展,应用于各种通信终端(诸如基于支持各种通信系统的通信协议的移动通信终端、个人数字助理(PDA)、智能电话、台式计算机、笔记本计算机、和平板电脑等)的输入法系统也越来越丰富。然而,目前的输入法系统存在如下问题:1.对文字聊天的通信对方的身份以及输入法使用者和对方的社会关系不敏感;2.由于这种社会关系的不敏感,使得输入法难以正确选择是使用平常用语文法、还是使用自谦语文法、还是使用敬语文法。
例如,在中文输入法中,对于一位女性用户而言,在说“你”的情况下,如果对方是不同的人,则需要使用不同的词语。当对方是该女性输入法用户的丈夫的时候,通常使用“老公”;当对方是该女性输入法用户的商业往来的客户的时候,通常使用“您”或者“客人您”这样的字眼;当对方是该女性输入法用户的父亲的时候,通常使用“您”或者“爸爸”。另外,在中文中,在体现对对方尊敬的时候,一般使用对对方的尊敬语,以及对自己的自谦语,这些直接反应在文法中。例如,当表示“对不起”这个意思的时候,输入法的用户一般会根据对方和自己的社会关系来动态选择所需要的词语。作为示例,当对方是下级或者晚辈的时候,一般说的是“不好意思”,对不起的程度比较轻;当对方是自己的同事等的时候,一般用“对比起”,对不起的程度一般;当对方是自己的长辈或者老师或者商业客户的时候,一般用“十分抱歉”这种正式的“对不起”的用语,其程度也逐渐更加诚恳和认真。这样,当通信对方是用户的长辈老师或者商业客户时,在用户输入了“对不起”的情况下,如果输入法提示用户最好使用“十分抱歉”或者更加尊敬的词语,则会使最终的交流沟通目的被更好地表达,从而协助用户纠正用词不当的问题。因此,需要一种可以向用户提供适合于与对方的社会关系的候选词的输入法。
发明内容
根据本发明的多个方面,提供了一种在进行输入时基于社会关系提供候选词的方法和装置,所述方法和装置可以根据用户与通信对方的聊天记录判断用户与通信对方的社会关系,从而向用户提供适合于所述社会关系的候选词。
根据本发明的一方面,提供了一种在进行输入时基于社会关系提供候选词的方法,所述方法包括:检测用户的输入;当检测到用户的输入时,确定当前应用环境是否为信息交换应用;当确定当前应用环境是信息交换应用时,确定与用户通信的通信对方的标识符;基于确定的通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,其中,社会关系自动判定模型是判断用户与通信对方的社会关系的模型;根据社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,其中,社会关系修正映射表基于确定的社会关系提供与所述社会关系相应的修正候选词;如果所述输入与所述社会关系不匹配,则基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。
确定当前应用环境是否为信息交换应用的步骤可包括:通过调用当前应用环境的预定参数确定当前应用环境是否为信息交换应用。
确定与用户通信的通信对方的标识符的步骤可包括:通过在信息交换应用中提取与通信对方的标识符相关的信息来确定通信对方的标识符。
所述方法还可包括:预先建立社会关系自动判定模型,其中,建立社会关系自动判定模型的步骤包括:根据存储在信息交换应用中的用户与通信对方的聊天记录标注用户与通信对方的社会关系;利用n元语言模型对聊天记录进行特征提取;将特征提取后的聊天记录和标注的社会关系作为训练数据,基于分类算法训练社会关系自动判定模型,其中,社会关系自动判定模型包括聊天记录元素和社会关系元素。
所述方法还可包括:预先建立社会关系修正映射表,其中,建立社会关系自动判定模型的步骤包括:过手动构建和/或自动挖掘算法建立用语形式映射表,所述用语形式映射表是关于针对各个词语的平常用语形式、自谦语形式和尊敬语形式的对应映射表;基于建立的用语形式映射表以及建立的社会关系自动判定模型来建立社会关系修正映射表,其中,社会关系修正映射表包括社会关系元素、用户输入元素和修正候选词元素。
所述自动挖掘算法可以是最大期望算法的词对齐模型算法。
预先建立社会关系修正映射表的步骤还可包括:根据用户对提供的候选词的选择来更新社会关系修正映射表。
社会关系可包括平辈或平级关系、长晚辈关系、上下级关系以及商务关系。
与社会关系相关的候选词的形式可包括自谦语形式、尊敬语形式和平常用语形式。
信息交换应用可包括实时通信服务、基于社交网络的聊天/留言服务和移动终端中的短消息服务。
根据本发明的另一方面,提供了一种在进行输入时基于社会关系提供候选词的装置,所述装置包括:输入检测单元,检测用户的输入;第一确定单元,确定当前应用环境是否为信息交换应用;第二确定单元,当第一确定单元确定当前应用环境是信息交换应用时,确定与用户通信的通信对方的标识符;社会关系确定单元,基于确定的通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,其中,社会关系自动判定模型是判断用户与通信对方的社会关系的模型;匹配确定单元,根据社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,其中,社会关系修正映射表基于确定的社会关系提供与所述社会关系相应的修正候选词;修正候选词提供单元,当所述输入与所述社会关系不匹配时,基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。
第一确定单元可被配置为通过调用当前应用环境的预定参数确定当前应用环境是否为信息交换应用。
第二确定单元可被配置为通过在信息交换应用中提取与通信对方的标识符相关的信息来确定通信对方的标识符。
所述装置还可包括社会关系自动判定模型建立单元,其中,社会关系自动判定模型建立单元包括:社会关系标注单元,根据存储在信息交换应用中的用户与通信对方的聊天记录标注用户与通信对方的社会关系;特征提取单元,利用n元语言模型对聊天记录进行特征提取;社会关系自动判定模型训练单元,将特征提取后的聊天记录和标注的社会关系作为训练数据,基于分类算法训练社会关系自动判定模型,其中,社会关系自动判定模型包括聊天记录元素和社会关系元素。
所述装置还可包括社会关系修正映射表建立单元,其中,社会关系修正映射表建立单元包括:用语形式映射表建立单元,通过手动构建和/或自动挖掘算法建立用语形式映射表,所述用语形式映射表是关于针对各个词语的平常用语形式、自谦语形式和尊敬语形式的对应映射表;社会关系修正映射表建立器,基于建立的用语形式映射表和建立的社会关系自动判定模型来建立社会关系修正映射表,其中,社会关系修正映射表包括社会关系元素、用户输入元素和修正候选词元素。
所述自动挖掘算法可以是最大期望算法的词对齐模型算法。
社会关系修正映射表建立单元还可包括:更新单元,根据用户对提供的候选词的选择来更新社会关系修正映射表。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1示出根据本发明示例性实施例在进行输入时基于社会关系提供候选词的方法的流程图;
图2示出根据本发明示例性实施例的建立社会关系自动判定模型的处理的流程图;
图3示出根据本发明示例性实施例的建立社会关系修正映射表的处理的流程图;
图4示出根据本发明示例性实施例的通过基于社会关系的候选词提供方法向用户提供候选词的示例的示图。
图5示出根据本发明另一示例性实施例的在进行输入时基于社会关系提供候选词的装置的框图。
图6示出根据本发明另一示例性实施例的社会关系自动判定模型建立单元的框图。
图7示出根据本发明另一示例性实施例的社会关系修正映射表建立单元的框图。
具体实施方式
提供以下参照附图的描述以帮助对由权利要求及其等同物限定的本发明的示例性实施例的全面理解。描述包括用于帮助理解的各种特定细节,但是这些细节应仅被视为示例性的。因此,本领域的普通技术人员将认识到,在不脱离本发明的范围和精神的情况下,可以对这里描述的实施例进行各种改变和修改。此外,为了清楚和简明,可省略对公知功能和结构的描述。
图1示出根据本发明示例性实施例在进行输入时基于社会关系提供候选词的方法的流程图。
参照图1,在步骤S110,检测用户是否通过输入法应用进行了输入。如果检测到用户通过输入法应用进行了输入,则在步骤S120,确定当前应用环境是否是信息交换应用。例如,可以通过调用当前应用环境的预定参数确定当前应用环境是否为信息交换应用,所述预定参数指示与当前应用环境对应的应用标识符(ID)。信息交换应用可包括在各种通信终端(诸如基于支持各种通信系统的通信协议的移动通信终端、个人数字助理(PDA)、智能电话、台式计算机、笔记本计算机和平板电脑等)中使用的针对文本信息的信息交换应用,诸如各种实时通信服务(例如line、QQ、wechat和baiduHi等)、基于社交网络的聊天/留言服务(例如facebook(脸谱)、twitter(推特)等)以及移动终端中的短消息服务。然而,本发明的示例性实施例不限于此,信息交换应用还可包括本领域技术人员公知的其它用于信息交换的应用。
如果在步骤S120确定当前应用环境是信息交换应用,则在步骤S130确定与用户通信的通信对方的标识符。例如,可以通过在信息交换应用中提取与通信对方的标识符相关的信息来确定通信对方的标识符。
之后,在步骤S140,基于通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,这里,社会关系自动判定模型可以是判断用户与通信对方的社会关系的模型。用户与通信对方的社会关系可包括平辈(或平级)关系、长晚辈关系、上下级关系和商务关系等。以下将参照图2详细描述建立社会关系自动判定模型的处理。
在步骤S150,基于社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,这里,社会关系修正映射表可以基于在步骤S140确定的社会关系提供与所述社会关系相应的修正候选词。作为示例,如果用户与通信对方的社会关系是平辈(或平级)关系,则相应的对话用语形式可以是平常用语形式;如果用户与通信对方的社会关系是晚辈与长辈(或者下级与上级)或者商务交流的关系,则相应的对话用语形式可以是针对自身的自谦语形式与针对对方的尊敬语形式。以下将参照图3详细描述建立社会关系修正映射表的处理。
如果在步骤S150确定所述输入与所述社会关系匹配,则在步骤S160提供默认候选词,即,对应于用户输入的候选词;如果在步骤S150确定所述输入与所述社会关系不匹配,则在步骤S170基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。
图2示出根据本发明示例性实施例的建立社会关系自动判定模型的处理的流程图。
参照图1,在步骤S210,根据用户与通信对方的聊天记录标注用户与通信对方的社会关系。这里,可以通过手动方式标注社会关系。聊天记录可包括存储在上述信息交换应用中的聊天记录。
在步骤S220,利用n元语言模型对聊天记录进行特征提取。之后,在步骤S230,将特征提取后的聊天记录和标注的社会关系作为训练数据,基于分类算法训练社会关系自动判定模型。所述分类算法可以是支持向量机(SVM)分类算法、朴素贝叶斯分类算法或本领域技术人员公知的其它机器分类算法。社会关系自动判定模型可以包括聊天记录元素和社会关系元素。例如,社会关系自动判定模型可以是<聊天记录,社会关系>的形式。作为示例,可以通过将存储在信息交换应用中的聊天记录与社会关系自动判定模型中的聊天记录元素进行比较,来确定用户与通信对方的社会关系。
图3示出根据本发明示例性实施例的建立社会关系修正映射表的处理的流程图。
参照图3,在步骤S310,通过手动构建和/或自动挖掘算法(例如,最大期望算法的词对齐模型)建立用语形式映射表。所述用语形式映射表是关于针对各个词语的平常用语形式、自谦语形式和尊敬语形式的对应映射表。
之后,在步骤S320,基于在步骤S310建立的用语形式映射表以及在图2建立的社会关系自动判定模型来建立社会关系修正映射表。社会关系修正映射表包括社会关系元素、用户输入元素和修正候选词元素。例如,社会关系修正映射表可以是<社会关系、用户输入、修正候选词>的形式。作为示例,当确定了用户与通信对方的社会关系之后,确定用户输入是否与相应的修正候选词匹配。如果用户输入与修正候选词不匹配,则向用户提供所述修正候选词;如果用户输入与修正候选词匹配,则向用户提供对应于用户输入的候选词。
优选地,根据本发明示例性实施例的建立社会关系修正映射表的处理还可包括步骤S330,在步骤S330,通过用户对在输入法中提供的候选词的选择来更新社会关系修正映射表。例如,当用户对特定候选词的选择次数达到预定阈值次数时,可以基于该特定候选词改变社会关系修正映射表。
图4示出根据本发明示例性实施例的通过基于社会关系的候选词提供方法向用户提供候选词的示例的示图。
参照图4,当用户通过输入法应用在移动终端中输入“你”时,由于确定通信对方“A”是商业客户,因此在输入法应用的候选词选项中提供候选词“您”和“客人您”以供用户选择。此外,还可在移动终端的显示屏上显示提示是否用“您”替换“你”的弹出框。
本领域普通技术人员应该清楚,虽然这里以中文作为示例进行描述,但是本发明示例性实施例不限于中文,本发明示例性实施例可以应用于具有不同的用语形式(例如,自谦语形式、尊敬语形式和平常用语形式)的任何语言,诸如日文、韩文等。
图5示出根据本发明另一示例性实施例的在进行输入时基于社会关系提供候选词的装置500的框图。
参照图5,在进行输入时基于社会关系提供候选词的装置500包括:输入检测单元510,检测用户的输入;第一确定单元520,确定当前应用环境是否为信息交换应用;第二确定单元530,当第一确定单元520确定当前应用环境是信息交换应用时,确定与用户通信的通信对方的标识符;社会关系确定单元540,基于确定的通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,其中,社会关系自动判定模型是判断用户与通信对方的社会关系的模型;匹配确定单元550,根据社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,其中,社会关系修正映射表基于确定的社会关系提供与所述社会关系相应的修正候选词;修正候选词提供单元560,当所述输入与所述社会关系不匹配时,基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。
图6示出根据本发明另一示例性实施例的社会关系自动判定模型建立单元600的框图。
参照图6,社会关系自动判定模型建立单元600包括社会关系标注单元610,根据存储在信息交换应用中的用户与通信对方的聊天记录标注用户与通信对方的社会关系;特征提取单元620,利用n元语言模型对聊天记录进行特征提取;社会关系自动判定模型训练单元630,将特征提取后的聊天记录和标注的社会关系作为训练数据,基于分类算法训练社会关系自动判定模型,其中,社会关系自动判定模型包括聊天记录元素和社会关系元素。
图7示出根据本发明另一示例性实施例的社会关系修正映射表建立单元700的框图。
参照图7,社会关系修正映射表建立单元700包括用语形式映射表建立单元710,通过手动构建和/或自动挖掘算法建立用语形式映射表,所述用语形式映射表是关于针对各个词语的平常用语形式、自谦语形式和尊敬语形式的对应映射表;社会关系修正映射表建立器720,基于建立的用语形式映射表和通过社会关系自动判定模型建立单元600建立的社会关系自动判定模型来建立社会关系修正映射表,其中,社会关系修正映射表包括社会关系元素、用户输入元素和修正候选词元素。优选地,社会关系修正映射表建立单元700还可包括更新单元730,通过用户对提供的候选词的选择来更新社会关系修正映射表。
根据本发明的实施例的上述装置和方法可被实现为计算机程序或计算机可读代码。该计算机程序或计算机可读代码可被记录在计算机可读记录介质上。所述计算机可读记录介质可以是任何可存储其后可以被计算机系统读取的数据的数据存储设备。所述计算机可读记录介质的示例包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储设备和载波(例如,通过互联网的数据传输)。所述计算机可读记录介质也可以被分布在联网的计算机系统上,从而所述计算机可读代码以分布式方式被存储和执行。
根据本发明的在进行输入时基于社会关系提供候选词的方法和装置,可以根据用户与通信对方的聊天记录判断用户与通信对方的社会关系,从而向用户提供适合于所述社会关系的候选词,协助用户纠正用词不当的问题,使交流沟通目的被更好地表达。
尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。

Claims (20)

1.一种在进行输入时基于社会关系提供候选词的方法,所述方法包括:
检测用户的输入;
当检测到用户的输入时,确定当前应用环境是否为信息交换应用;
当确定当前应用环境是信息交换应用时,确定与用户通信的通信对方的标识符;
基于确定的通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,其中,社会关系自动判定模型是判断用户与通信对方的社会关系的模型;
根据社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,其中,社会关系修正映射表基于确定的社会关系提供与所述社会关系相应的修正候选词;
如果所述输入与所述社会关系不匹配,则基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。
2.如权利要求1所述的方法,其中,确定当前应用环境是否为信息交换应用的步骤包括:通过调用当前应用环境的预定参数确定当前应用环境是否为信息交换应用。
3.如权利要求1所述的方法,其中,确定与用户通信的通信对方的标识符的步骤包括:通过在信息交换应用中提取与通信对方的标识符相关的信息来确定通信对方的标识符。
4.如权利要求1所述的方法,还包括:预先建立社会关系自动判定模型,其中,建立社会关系自动判定模型的步骤包括:
根据存储在信息交换应用中的用户与通信对方的聊天记录标注用户与通信对方的社会关系;
利用n元语言模型对聊天记录进行特征提取;
将特征提取后的聊天记录和标注的社会关系作为训练数据,基于分类算法训练社会关系自动判定模型,
其中,社会关系自动判定模型包括聊天记录元素和社会关系元素。
5.如权利要求4所述的方法,还包括:预先建立社会关系修正映射表,其中,建立社会关系自动判定模型的步骤包括:
过手动构建和/或自动挖掘算法建立用语形式映射表,所述用语形式映射表是关于针对各个词语的平常用语形式、自谦语形式和尊敬语形式的对应映射表;
基于建立的用语形式映射表以及建立的社会关系自动判定模型来建立社会关系修正映射表,
其中,社会关系修正映射表包括社会关系元素、用户输入元素和修正候选词元素。
6.如权利要求5所述的方法,其中,所述自动挖掘算法是最大期望算法的词对齐模型算法。
7.如权利要求5所述的方法,其中,预先建立社会关系修正映射表的步骤还包括:根据用户对提供的候选词的选择来更新社会关系修正映射表。
8.如权利要求1所述的方法,其中,社会关系包括平辈或平级关系、长晚辈关系、上下级关系以及商务关系。
9.如权利要求1所述的方法,其中,与社会关系相关的候选词的形式包括自谦语形式、尊敬语形式和平常用语形式。
10.如权利要求1所述的方法,其中,信息交换应用包括实时通信服务、基于社交网络的聊天/留言服务和移动终端中的短消息服务。
11.一种在进行输入时基于社会关系提供候选词的装置,所述装置包括:
输入检测单元,检测用户的输入;
第一确定单元,确定当前应用环境是否为信息交换应用;
第二确定单元,当第一确定单元确定当前应用环境是信息交换应用时,确定与用户通信的通信对方的标识符;
社会关系确定单元,基于确定的通信对方的标识符,根据社会关系自动判定模型来确定用户与通信对方的社会关系,其中,社会关系自动判定模型是判断用户与通信对方的社会关系的模型;
匹配确定单元,根据社会关系修正映射表确定用户的输入是否和确定的社会关系匹配,其中,社会关系修正映射表基于确定的社会关系提供与所述社会关系相应的修正候选词;
修正候选词提供单元,当所述输入与所述社会关系不匹配时,基于社会关系修正映射表向用户提供与确定的社会关系匹配的修正候选词。
12.如权利要求11所述的装置,其中,第一确定单元被配置为通过调用当前应用环境的预定参数确定当前应用环境是否为信息交换应用。
13.如权利要求11所述的装置,其中,第二确定单元被配置为通过在信息交换应用中提取与通信对方的标识符相关的信息来确定通信对方的标识符。
14.如权利要求11所述的装置,还包括社会关系自动判定模型建立单元,其中,社会关系自动判定模型建立单元包括:
社会关系标注单元,根据存储在信息交换应用中的用户与通信对方的聊天记录标注用户与通信对方的社会关系;
特征提取单元,利用n元语言模型对聊天记录进行特征提取;
社会关系自动判定模型训练单元,将特征提取后的聊天记录和标注的社会关系作为训练数据,基于分类算法训练社会关系自动判定模型,
其中,社会关系自动判定模型包括聊天记录元素和社会关系元素。
15.如权利要求14所述的装置,还包括社会关系修正映射表建立单元,其中,社会关系修正映射表建立单元包括:
用语形式映射表建立单元,通过手动构建和/或自动挖掘算法建立用语形式映射表,所述用语形式映射表是关于针对各个词语的平常用语形式、自谦语形式和尊敬语形式的对应映射表;
社会关系修正映射表建立器,基于建立的用语形式映射表和建立的社会关系自动判定模型来建立社会关系修正映射表,
其中,社会关系修正映射表包括社会关系元素、用户输入元素和修正候选词元素。
16.如权利要求15所述的装置,其中,所述自动挖掘算法是最大期望算法的词对齐模型算法。
17.如权利要求15所述的装置,其中,社会关系修正映射表建立单元还包括:更新单元,根据用户对提供的候选词的选择来更新社会关系修正映射表。
18.如权利要求11所述的装置,其中,社会关系包括平辈或平级关系、长晚辈关系、上下级关系以及商务关系。
19.如权利要求11所述的装置,其中,与社会关系相关的候选词的形式包括自谦语形式、尊敬语形式和平常用语形式。
20.如权利要求11所述的装置,其中,信息交换应用包括实时通信服务、基于社交网络的聊天/留言服务和移动终端中的短消息服务。
CN201310322607.7A 2013-07-29 2013-07-29 在进行输入时基于社会关系提供候选词的方法和装置 Active CN103399906B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201310322607.7A CN103399906B (zh) 2013-07-29 2013-07-29 在进行输入时基于社会关系提供候选词的方法和装置
PCT/CN2014/079376 WO2015014159A1 (zh) 2013-07-29 2014-06-06 提供候选词的方法、装置、计算机存储介质和设备
JP2016509289A JP6187999B2 (ja) 2013-07-29 2014-06-06 候補単語を提供する方法、装置、コンピューター記憶媒体及びデバイス
US14/954,232 US9894030B2 (en) 2013-07-29 2015-11-30 Method, device, computer storage medium, and apparatus for providing candidate words

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310322607.7A CN103399906B (zh) 2013-07-29 2013-07-29 在进行输入时基于社会关系提供候选词的方法和装置

Publications (2)

Publication Number Publication Date
CN103399906A true CN103399906A (zh) 2013-11-20
CN103399906B CN103399906B (zh) 2015-07-29

Family

ID=49563535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310322607.7A Active CN103399906B (zh) 2013-07-29 2013-07-29 在进行输入时基于社会关系提供候选词的方法和装置

Country Status (4)

Country Link
US (1) US9894030B2 (zh)
JP (1) JP6187999B2 (zh)
CN (1) CN103399906B (zh)
WO (1) WO2015014159A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015014159A1 (zh) * 2013-07-29 2015-02-05 百度在线网络技术(北京)有限公司 提供候选词的方法、装置、计算机存储介质和设备
WO2015109605A1 (en) * 2014-01-27 2015-07-30 Nokia Technologies Oy Method and apparatus for social relation analysis and management
CN105515938A (zh) * 2014-09-24 2016-04-20 北京三星通信技术研究有限公司 生成通信信息的方法和装置
CN105930697A (zh) * 2016-04-11 2016-09-07 厦门幻世网络科技有限公司 一种交互信息使用权限开通方法及装置
CN106997343A (zh) * 2017-03-28 2017-08-01 联想(北京)有限公司 信息处理方法及设备
CN107562222A (zh) * 2017-09-25 2018-01-09 联想(北京)有限公司 一种数据处理方法及系统
CN107943771A (zh) * 2017-11-15 2018-04-20 百度在线网络技术(北京)有限公司 响应文本的生成方法、装置、处理器、及计算机可读介质
CN108153755A (zh) * 2016-12-05 2018-06-12 北京搜狗科技发展有限公司 一种输入推荐方法、装置及电子设备
CN111427459A (zh) * 2019-01-08 2020-07-17 北京搜狗科技发展有限公司 一种在用户通信时输入优化的方法及相关装置
US11205045B2 (en) * 2018-07-06 2021-12-21 International Business Machines Corporation Context-based autocompletion suggestion

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102351624B1 (ko) * 2021-09-01 2022-01-14 주식회사 핸들모빌리티 대리 기사 호출을 위한 서비스 제공 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183281A (zh) * 2007-12-26 2008-05-21 腾讯科技(深圳)有限公司 一种输入法中候选词的相关词输入的方法及系统
EP2109097A1 (en) * 2005-11-25 2009-10-14 Swisscom AG A method for personalization of a service
CN102508554A (zh) * 2011-10-02 2012-06-20 上海量明科技发展有限公司 一种通信关联的输入方法、个性语库及系统
CN103365833A (zh) * 2012-03-28 2013-10-23 百度在线网络技术(北京)有限公司 一种基于上下文场景的输入候选词提示方法及系统
CN103870000A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9619165D0 (en) * 1996-09-13 1996-10-23 British Telecomm Training apparatus and method
CN1174332C (zh) * 2000-03-10 2004-11-03 松下电器产业株式会社 转换表达方式的方法和装置
JP2002149187A (ja) * 2000-11-07 2002-05-24 Sony Corp 音声認識装置および音声認識方法、並びに記録媒体
JP2002222145A (ja) * 2001-01-26 2002-08-09 Fujitsu Ltd 電子メール送信方法、コンピュータ・プログラム、および、記録媒体
US7296057B2 (en) * 2002-01-08 2007-11-13 International Business Machines Corporation Method for user-specified error correction in an instant messaging system
JP2006048723A (ja) * 2002-11-28 2006-02-16 Matsushita Electric Ind Co Ltd 電子メール作成支援のための装置、プログラムおよび方法
US20120284015A1 (en) * 2008-01-28 2012-11-08 William Drewes Method for Increasing the Accuracy of Subject-Specific Statistical Machine Translation (SMT)
US8196112B1 (en) * 2008-02-15 2012-06-05 Amazon Technologies, Inc. Systems and methods for testing widgets in computer environments
CN101291302B (zh) * 2008-05-27 2011-08-03 北京搜狗科技发展有限公司 一种利用输入法进行即时通讯的方法和一种输入法系统
CN101697098A (zh) * 2009-09-29 2010-04-21 深圳华为通信技术有限公司 一种字符输入的方法及终端
JP5267450B2 (ja) * 2009-12-28 2013-08-21 株式会社デンソー 電子機器及びプログラム
CN102263799A (zh) * 2010-05-25 2011-11-30 腾讯数码(天津)有限公司 一种sns网络中好友推荐系统和方法
US9245253B2 (en) * 2011-08-19 2016-01-26 Disney Enterprises, Inc. Soft-sending chat messages
KR101947462B1 (ko) * 2011-12-20 2019-02-14 삼성전자 주식회사 사용자 디바이스에서 단축번호 제공 방법 및 장치
US9183195B2 (en) * 2013-03-15 2015-11-10 Disney Enterprises, Inc. Autocorrecting text for the purpose of matching words from an approved corpus
CN103399906B (zh) * 2013-07-29 2015-07-29 百度在线网络技术(北京)有限公司 在进行输入时基于社会关系提供候选词的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2109097A1 (en) * 2005-11-25 2009-10-14 Swisscom AG A method for personalization of a service
CN101183281A (zh) * 2007-12-26 2008-05-21 腾讯科技(深圳)有限公司 一种输入法中候选词的相关词输入的方法及系统
CN102508554A (zh) * 2011-10-02 2012-06-20 上海量明科技发展有限公司 一种通信关联的输入方法、个性语库及系统
CN103365833A (zh) * 2012-03-28 2013-10-23 百度在线网络技术(北京)有限公司 一种基于上下文场景的输入候选词提示方法及系统
CN103870000A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9894030B2 (en) 2013-07-29 2018-02-13 Baidu Online Network Technology (Beijing) Co., Ltd. Method, device, computer storage medium, and apparatus for providing candidate words
WO2015014159A1 (zh) * 2013-07-29 2015-02-05 百度在线网络技术(北京)有限公司 提供候选词的方法、装置、计算机存储介质和设备
WO2015109605A1 (en) * 2014-01-27 2015-07-30 Nokia Technologies Oy Method and apparatus for social relation analysis and management
CN105515938A (zh) * 2014-09-24 2016-04-20 北京三星通信技术研究有限公司 生成通信信息的方法和装置
CN105515938B (zh) * 2014-09-24 2020-04-17 北京三星通信技术研究有限公司 生成通信信息的方法和装置
CN105930697A (zh) * 2016-04-11 2016-09-07 厦门幻世网络科技有限公司 一种交互信息使用权限开通方法及装置
WO2017177871A1 (zh) * 2016-04-11 2017-10-19 厦门幻世网络科技有限公司 一种交互信息使用权限开通方法及装置
CN108153755A (zh) * 2016-12-05 2018-06-12 北京搜狗科技发展有限公司 一种输入推荐方法、装置及电子设备
CN106997343A (zh) * 2017-03-28 2017-08-01 联想(北京)有限公司 信息处理方法及设备
CN107562222A (zh) * 2017-09-25 2018-01-09 联想(北京)有限公司 一种数据处理方法及系统
CN107943771A (zh) * 2017-11-15 2018-04-20 百度在线网络技术(北京)有限公司 响应文本的生成方法、装置、处理器、及计算机可读介质
CN107943771B (zh) * 2017-11-15 2021-05-07 百度在线网络技术(北京)有限公司 响应文本的生成方法、装置、服务器、及计算机可读介质
US11205045B2 (en) * 2018-07-06 2021-12-21 International Business Machines Corporation Context-based autocompletion suggestion
CN111427459A (zh) * 2019-01-08 2020-07-17 北京搜狗科技发展有限公司 一种在用户通信时输入优化的方法及相关装置
CN111427459B (zh) * 2019-01-08 2024-04-02 北京搜狗科技发展有限公司 一种在用户通信时输入优化的方法及相关装置

Also Published As

Publication number Publication date
CN103399906B (zh) 2015-07-29
US9894030B2 (en) 2018-02-13
US20160094511A1 (en) 2016-03-31
JP6187999B2 (ja) 2017-08-30
WO2015014159A1 (zh) 2015-02-05
JP2016522482A (ja) 2016-07-28

Similar Documents

Publication Publication Date Title
CN103399906B (zh) 在进行输入时基于社会关系提供候选词的方法和装置
US9619119B2 (en) Information prompt method, apparatus and terminal device
US20170011303A1 (en) Contact-Based Predictive Response
US20180302350A1 (en) Method for determining candidate input, input prompting method and electronic device
US9686219B2 (en) Systems, methods, and apparatuses for facilitating determination of a message recipient
CN104883671A (zh) 一种垃圾短信的判断方法及系统
CN103442140B (zh) 一种输入法与通讯录协同的方法、系统及移动终端
CN103906012A (zh) 信息发送方法及装置
CN102752313A (zh) 一种即时通信工具中用户多身份的方法及装置
CN107277244A (zh) 截图处理方法及装置
US11481400B1 (en) Analytical tool for evaluation of message content
CN103781035A (zh) 一种基于移动终端的通讯联系处理方法及系统
CN104717340A (zh) 提供拨号号码的方法和装置
WO2016202277A1 (zh) 一种消息的发送方法及移动终端
US10320726B2 (en) Predictive message personalization
CN105376143B (zh) 一种识别发送者身份的方法及装置
KR101858544B1 (ko) 정보 처리 방법 및 장치
CN103777775A (zh) 输入法的显示处理装置及输入法的显示处理方法
CN101345966A (zh) 一种自动匹配菜单的方法和装置
CN105681523A (zh) 一种自动发送生日祝福短信的方法及装置
CN113420549B (zh) 异常字符串识别方法及装置
CN108960874A (zh) 一种积分信息的处理方法
CN104135725A (zh) 一种短消息发送方法及便携式终端
KR20130035251A (ko) 감성표현데이터 전달 방법 및 그 시스템
CN102546472A (zh) 结束型即时通信消息的提醒方法、客户端及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant