CN110268428A - 基于主题的消息分组和概括 - Google Patents

基于主题的消息分组和概括 Download PDF

Info

Publication number
CN110268428A
CN110268428A CN201780071662.XA CN201780071662A CN110268428A CN 110268428 A CN110268428 A CN 110268428A CN 201780071662 A CN201780071662 A CN 201780071662A CN 110268428 A CN110268428 A CN 110268428A
Authority
CN
China
Prior art keywords
message
user
theme
group
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780071662.XA
Other languages
English (en)
Inventor
马修·沙利菲
雅各布·尼古拉斯·霍斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN110268428A publication Critical patent/CN110268428A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种用于在通信应用的图形用户界面(GUI)中对消息进行分组和概括的计算机执行的技术,包括接收的消息以及确定消息中的多个通信主题。消息根据通信主题聚类到组中,使得每个组中的消息与同一主题相关。消息显示在确定的组中的GUI中。用户可以选择组来进行解组并查看消息。聚类所基于的通信主题可以对通信会话中的每个用户是特定的。

Description

基于主题的消息分组和概括
相关申请的交叉引用
本申请要求2017年2月20日提交的美国申请序列号15/437,223的优先权。上述申请的全部公开的内容通过引用结合在此。
背景技术
这里提供的背景描述是为了总体上呈现本公开的背景。目前列举的发明人的工作,在本背景技术部分中描述的范围,以及在提交时可能不具备现有技术资格的描述的各方面,既不明确也不暗示地被承认为针对本公开的现有技术。
在典型的通信应用中,通信会话中的基于文本的消息(诸如即时消息,短消息服务消息,或社交网络消息/发布)按时间顺序呈现在由计算设备(例如,移动设备)显示的通信应用的图形用户界面的列表中。使用这种按时间顺序排列的列表可能具有许多限制,尤其是当存在大量要显示的消息的时候。通信会话可以包括在很长一段时间(几天,几周等)内发送的许多消息。为了使用户找到先前发送的感兴趣的消息,用户可能不得不滚动消息列表,并浏览每个消息的内容以定位所需的消息(或消息集合)。在一些情况下,用户可能记得感兴趣的消息的大致日期/时间,其可以为用户减少感兴趣的消息的可能位置。尽管如此,即使当用户对感兴趣的消息的大致日期和时间有大概的概念时,定位特定的感兴趣的消息也可能是耗时且麻烦的过程。
发明内容
根据本公开的各种实施方式,公开了一种用于在计算设备的通信应用中按主题对消息进行分组和概括的技术。该技术包括在执行第一用户的通信应用的计算设备处,接收与所述第一用户和第二用户之间的通信会话相对应的多个消息。在所述计算设备处,可以评估所述多个消息,以确定所述通信会话的多个通信主题。还必须接收使用用户数据的用户许可。
该技术还包括,在所述计算设备处,确定所述第一用户对所述多个通信主题中的每个通信主题的感兴趣程度。基于所确定的感兴趣程度,识别所述多个通信主题中的多个用户特定通信主题。在所述计算设备处,生成用于每个所述用户特定通信主题的标签。每个标签描述与每个标签相关联的用户特定通信主题。
计算设备可以基于所述多个用户特定通信主题,将所述多个消息聚类成多个消息组。所述多个消息组中的每个特定组与所述多个用户特定通信主题的特定的用户特定通信主题相关联,并且所述特定组中的每个消息与所述特定的用户特定通信主题相关联。计算设备然后可以输出命令以生成与通信应用相对应的图形用户界面,在所述图形用户界面中:(i)在所述多个消息组中显示所述多个消息,以及(ii)所述多个消息组中的每个组和与所述每个组相关联的标签一起显示。
可以用相对术语来描述用户对每个通信主题的感兴趣程度。例如,在特定主题中,更高的感兴趣程度可能高于中等感兴趣程度,中等感兴趣程度可能高于低感兴趣程度。可以基于用户的记录动作来计算或估计感兴趣的程度,用户的记录动作包括例如与用于其他主题的数个消息相比,用户发送或接收包括或引用特定主题的消息的相对次数。其他行为可用于相对或绝对感兴趣程度的此类计算。
当使用该技术时,计算设备可以更有效地操作,以及更有效地使用户能够找到特定的消息或消息集合。通过增加设备的可用性可以改善人机交互,这在有利于用户的同时,相对于滚动浏览按时间顺序列出的许多早期消息的效率较低的过程,这会减少计算和能量资源(例如,电池电力)。当计算设备具有相对小的屏幕时,这种在可用性和效率上的改进尤其明显,否则相对小的屏幕将限制可以同时查看的消息的数量,因此在使用所描述的技术时进一步改善了这些设备的可用性。
在一些方面,评估所述多个消息以确定所述多个通信主题包括:从所述多个消息中提取一个或多个实体并消除一个或多个实体的歧义;确定所述一个或多个实体中的每个实体的关于每个特定消息的主题性分数,其中特定实体的主题性分数表明与所述特定消息和接近所述特定消息的至少一个消息中的所述特定实体相关的术语的数量的度量;通过将主题性分数与主题性阈值进行比较,确定每个特定消息的一个或多个主题实体;将所述一个或多个主题实体中的每一个主题实体与所述多个通信主题中的至少一个通信主题相关联。
进一步地,在一些方面,所述第一用户对所述多个通信主题中的每个通信主题的所述感兴趣程度可以是基于所述第一用户在所述通信会话中的行为和/或所述第一用户的用户简档。
附加地或替代地,该技术可以包括在所述计算设备处,确定所述多个消息组中的第一组和第二组之间的边界,其中所述边界识别所述第一组和所述第二组的消息之间的用户特定通信主题的变化。在一些实施方式中,确定所述边界可以包括在所述计算设备处,确定每个特定消息是否响应于先前消息,其中当所述特定消息响应所述先前消息时,所述特定消息与所述先前消息被聚类到所述多个消息组中的相同组。确定每个特定消息是否响应于先前消息是基于以下中的至少一个:(i)所述特定消息的发送时间,(ii)所述特定消息的发送时间与所述先前消息的读取时间之间的差异,所述读取时间包括发送所述特定消息的发送用户读取所述先前消息的估计时间,以及(iii)所述发送用户是经由所述通信应用直接发起所述特定消息,还是通过所述通信应用输出的通知发起所述特定消息。
此外,该技术还包括在所述计算设备处,从所述第一用户接收用户输入以对所述多个消息组中的第一组进行解组。响应于接收所述用户输入,该技术可以包括在所述计算设备处修改所述图形用户界面以显示:(i)所述第一组中的所述消息的多个子组,或(ii)所述第一组中的每个消息。在一些方面,所述多个消息组中的所述第一组与第一用户特定通信主题相关联,所述多个子组中的每一个子组与特定的用户特定通信子主题相关联,以及每个特定的用户特定通信子主题与所述第一组的所述第一用户特定通信主题有关。
本公开还涉及一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有多个指令,当所述指令由所述一个或多个处理器执行时,使所述一个或多个处理器进行此处所述技术的操作。本公开还涉及一种计算设备包括一个或多个处理器,所述处理器执行第一用户的通信应用,以及非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有多个指令,当所述指令由所述一个或多个处理器执行时,使所述一个或多个处理器进行此处所述技术的操作。
根据下文提供的详细描述,本公开的其他应用领域将变得显而易见。应该理解的是,详细的描述和具体示例仅用于说明的目的,并不旨在限制本公开的范围。
附图说明
从详细描述和附图将更全面地理解本公开,其中:
图1是根据本公开的一些实施方式的包括两个示例计算设备和示例服务器计算设备的示例计算系统的示意图;
图2是图1的一个示例计算设备的功能框图;
图3是根据本公开的一些实施方式的示例图形用户界面的示意图;
图4是根据本公开的一些实施方式的用于对消息进行分组和概括的示例技术的流程图;
图5是图2的示例聚类和概括模块的功能框图;
图6是根据本公开的一些实施方式的另一示例图形用户界面的示意图;
图7是根据本公开的一些实施方式的另一示例图形用户界面的示意图;以及
图8是根据本公开的一些实施方式的另一示例图形用户界面的示意图。
具体实施方式
本公开涉及在计算设备的通信应用中按主题对消息进行分组和概括的自动化技术。如下所述,该自动化技术提供了许多技术益处。除了其他方面之外,这样的技术益处包括减少为了获得期望的成果/结果(例如,检索期望的消息)的用户输入的数量,更有效地使用计算资源(例如,减少存储器检索操作的数量),以及降低计算设备的功耗。
如上所述,在计算设备(例如移动电话)上执行的典型的通信应用中的基于文本的消息(即时消息,短消息服务消息,社交网络消息/发布等)按时间顺序排列的列表被显示在图形用户界面中。通信会话可以包括在很长一段时间(几天,几周等)内发送的许多消息。为了使用户找到先前发送的感兴趣的消息,用户可能不得不滚动消息列表,并浏览每个消息的内容以定位所需的消息(或消息集合)。在一些情况下,用户可能记得感兴趣的消息的大致日期/时间,其可以为用户减少感兴趣的消息的可能位置。尽管如此,即使当用户对感兴趣的消息的大致日期和时间有大概的概念时,定位特定的感兴趣的消息也可能是耗时且麻烦的过程。
由于大多数移动电话的显示器尺寸以及一般分配给通信应用的计算设备的显示器部分都相对较小,用户还可能不得不提供大量重复输入(例如,滑动,按压箭头或页面上/下翻键)滚动查看一长串消息以查找感兴趣的消息。计算设备必须接收并处理每个用户输入,然后执行与每个用户输入相关联的功能。此外,用户如此快速地滚动消息使得感兴趣的消息(或用户认为可能是感兴趣的消息)被跳过这并不罕见,这要求用户以相反的方向往回滚动以查看跳过的消息。因此,计算设备可能不得不从存储器检索并显示许多用户不感兴趣的消息,这导致计算设备的功耗增加。此外,用户检索所需消息所需要的用户输入的数量的减少也可以导致更有效地使用计算资源。
本公开涉及在计算设备的通信应用中按主题对消息进行分组和概括的自动化技术。执行通信应用的计算设备接收在通信会话中的多个用户之间的多个基于文本的消息。评估基于文本的消息以确定与消息相关联的通信主题。仅作为示例,可以通过利用神经网络或被训练来识别消息内容中存在的主题的其他类型的模型来确定通信主题。在替代或另外的方面,可以利用词嵌入(word embedding)来识别消息的主题,情感和/或句法信息以及其他等,可以用于从消息中导出通信主题。下面将更全面地讨论通信主题的评估和确定。
对于通信会话中的每个用户,可能需要许可来从已确定的通信主题中识别用户特定的通信主题。用户数据(用户行为,用户简档等)的任何使用都必须由该用户明确授权。当接收到这样的明确许可时,可以确定对通信主题的感兴趣程度。计算设备利用所确定的感兴趣程度来从通信主题中识别用户特定的通信主题。仅作为示例,在讨论即将到夏威夷度假的第一和第二用户之间的通信会话中,计算设备可以确定通信主题包括度假,夏威夷,餐馆,观光活动,远足,购物和博物馆。基于第一用户在通信会话期间的行为,用户简档等,她/他可能对餐馆和购物具有相对高的感兴趣程度,而第二用户可能对远足和观光活动具有相对高的感兴趣程度。因此,第一用户的用户特定通信主题可以包括夏威夷,餐馆和购物,并且第二用户的用户特定通信主题可以包括度假,远足和观光活动。
当未接收到利用用户数据的明确许可时,所确定的感兴趣程度和/或用户特定通信主题可以是基于其他信息。这样的其他信息的示例包括但不限于,与主题相关的术语的数量,与主题相关联的消息的数量,以及主题是否与主题实体有关(下面描述)。应当理解,在接收到利用用户数据的明确许可的情况下,所确定的感兴趣程度和/或用户特定通信主题也可以是基于这样的其他信息。
计算设备可以为每个识别的用户特定通信主题生成标签。每个标签通常描述与该标签相关的用户特定通信主题。继续上述示例,用户特定通信主题“餐馆”的标签可以是“外出就餐”或“餐馆”。在另一示例中,可以组合用户特定通信主题,使得用户特定通信主题“夏威夷”和“餐馆”的标签可以是“在夏威夷外出就餐”等。下面描述用于用户特定通信主题的“嵌套”的更具体的技术。
然后,计算设备可以基于每个用户的用户特定通信主题来聚类多个基于文本的消息,以生成多个消息组。可以利用聚类分析来对消息进行分组,使得每组消息与至少一个用户特定的通信主题相关联,并且组中的所有基于文本的消息与相同的用户特定通信主题相关联。这种聚类分析利用将项目分组成聚类的模型,使得每个聚类中的项目被确定为与其他组中的项目相比彼此之间更相似。因为消息组是基于用户特定的通信主题而聚类的,这些通信主题可能在用户之间不同,所以消息的聚类组对于通信会话中的每个用户可以是不同的。以这种方式,可以为每个用户来个性化组,使得通信会话中的消息不仅按主题组织,而且按每个用户感兴趣的主题组织(如果用户授予了许可)。
将多个消息聚类成组还可以是基于其他因素,例如消息的发送时间,消息的发送时间与先前(较早)消息的读取时间之间的差异,和/或是否确定消息的发送者正在响应特定消息(例如,发送者经由通信应用输出的通知来发起消息的组成)。仅作为示例,可以合理地假设,在他/她自己的计算设备上接收第一消息的通知的用户经由通知启动通信应用,然后生成并发送响应第一消息的第二基于文本的消息,因此,第一和第二基于文本的消息应该与相同的用户特定通信主题相关联。
基于文本的消息可以由计算设备在通信应用的图形用户界面中显示在消息组。还可以显示与每个组相关联的标签。以这种方式,用户可以查看消息组(与单独地查看消息相反)并从标签快速确定与每个组相关联的用户特定通信主题。此外,因为可以基于用户特定通信主题来聚类消息组,所以图形用户界面在参与相同通信会话的不同用户之间可能看起来不同。
一旦用户识别出用户想要读取的一组消息,用户就可以提供用户输入(例如,通过点击,触摸或以其他方式选择特定的消息组)来显示所选择的组内的消息。在一些实施方式中,可以嵌套消息组,使得与用户特定通信主题相关联的特定消息组包括消息的子组。消息的每个子组可以与用户特定通信子主题相关联。仅作为示例,并且继续上述与度假,夏威夷,餐馆,观光活动,远足,购物和博物馆相关的示例,用户特定通信主题可以被确定为“到夏威夷度假”以及用户特定通信子主题可以是“在夏威夷外出就餐”,“在夏威夷观光”等。在这样的实施方式中,组的选择可以导致子组(和相关联的标签)单独的或与组/子组内的至少一部分消息相结合的显示。
在一些方面,基于文本的消息在聚类成组以及显示为组时不会被重新排序。也就是说,消息在组内按时间顺序呈现。此外,还可以按时间顺序排序消息组。在这样的实施方式中,并且如上面简要提到的,每个消息的时间(发送,接收,读取等的时间)以及其他因素,也可以用作信号来协助将消息聚类到组。仅作为示例,可以利用两个消息作为将与这两个消息有相同的用户特定通信主题的其他消息相关联的信号,这两个消息是被评估并确定为与相同的用户特定通信主题相关,但被确定了不同主题(或者可以没有主题)的数个其他消息隔开的两个消息。
因此,在一些方面,计算设备可以确定消息组之间的边界,其中消息组之间的边界可以识别消息组之间的用户特定通信主题的变化。仅作为示例,通过确定特定的基于文本的消息是否响应于先前的基于文本的消息,并且如果是,将先前的基于文本的消息与响应的基于文本的消息进行聚类,计算设备可以确定边界。除了利用消息的时间和/或发送者是否如上所述地通过通知发起消息的组成之外或作为另外一种选择,计算设备可以利用消息中的一个消息或两个消息的内容来确定后面的消息是否响应之前的消息。仅作为示例,如果先前的消息包括疑问(如何,为什么,什么,哪个,哪里等)或与问题相关联的标点符号(例如问号),则可以合理地推测后面的消息是响应先前的消息。
以这种方式,本公开可以提供一个或多个益处,包括但不限于用于,通信应用的更整洁,更简洁的用户界面,更有效地对计算资源的使用或减少对计算资源的使用,减少计算设备的能耗,以及减少为了获得期望的结果的用户输入的数量。为了便于描述,将在发送和接收消息的通信应用的情境中描述本公开的技术。然而,应当理解,本公开涉及用于发送,发布等基于文本的消息的任何类型的通信应用,包括但不限于,即时消息收发应用,社交网络,公告板或其他消息发布服务/网站。此外,特别考虑的是,这里使用的术语“基于文本的消息”可以包括,单独地包括图片,图形,表情符号等的消息或者包括图片,图形,表情符号等与文本相结合的消息。
现在参考图1,示出了示例计算系统100的示意图。计算系统100可以被配置为在多个用户之间经由用户的计算设备实施通信网络。根据本公开的一些实施方式,计算系统100可包括经由网络130通信的多个示例计算设备110和示例服务器120。
为了便于描述,在本申请中并且如图1所示,示出和描述了两个示例计算设备110:与发送方用户105s相关联的发送计算设备110s,以及与接收用户105r相关联的接收计算设备110r。然而,应当理解,计算设备110s和110r中的每个都能够发送和接收即时消息,并且因此,取决于情形和正在讨论的特定即时消息,计算设备110s和110r中的每个可以被描述为“发送”计算设备或“接收”计算设备(并且,类似地,“发送”用户或“接收”用户)。因此,术语“计算设备110”在本文中将用于单独指代发送计算设备110s和接收计算设备110r或指代发送计算设备110s和接收计算设备110r的组合。
虽然被图示为移动电话(“智能”电话),但是每个计算设备110可以是任何类型的合适的计算设备,诸如台式计算机,平板计算机,膝上型计算机,可穿戴计算设备,可穿戴计算设备诸如是眼镜,手表,或其他珠宝,或包含计算设备的衣服。图2中示出了示例计算设备110的功能框图。
计算设备110可以包括通信设备200,一个或多个处理器210,存储器220,显示设备230以及聚类和概括模块240。处理器210可以控制计算设备110的操作,包括实现本公开的至少一部分技术。这里使用的术语“处理器”旨在表示单个处理器和多个处理器一起操作,例如,在并行或分布式架构中。
通信设备200可以被配置为经由网络130与其他设备(例如,服务器120或其他计算设备110)通信。通信设备200的一个非限制性示例是收发器,但是其他形式的硬件也在本公开的范围内。存储器220可以是被配置为存储信息的任何合适的存储介质(闪存,硬盘等)。例如,存储器220可以存储可由处理器20执行的指令集,该指令集使得计算设备110进行操作,例如,诸如本公开的操作。显示设备230可以向用户105显示信息。在一些实施方式中,显示设备230可以包括触敏显示设备(诸如电容式触摸屏等),但是非触摸显示设备也在本公开的范围内。
聚类和概括模块240可以进行与本公开的技术相关的多个功能。仅作为示例,聚类和概括模型240可以包括一个或多个神经网络和/或其他训练的模型,训练的模型被配置为评估多个消息以确定消息中讨论的通信主题。此外,聚类和概括模块240可以包括用于确定用户对每个确定的通信主题的感兴趣程度(在接收到适当的许可后)的模型。基于所确定的通信主题和感兴趣程度,聚类和概括模块240可以识别每个用户的用户特定通信主题。用户特定通信主题可以包括所确定的通信主题的子集,例如,被确定为用户(最)感兴趣的通信主题。
聚类和概括模块240还可以为每个通信主题/用户特定通信主题生成标签,其中标签是与该标签关联的通信主题的概括或通常是与该标签关联的通信主题的描述。此外,聚类和概括模块240可以将多个消息聚类成针对每个用户并且基于用户特定通信主题的多个消息组。尽管示出为单独的元素,但是应当理解,聚类和概括模块240可以部分或全部由处理器210和/或存储器220(例如,存储各种模型的参数的数据库)实施。下面更全面地讨论聚类和概括模块240及其功能。
应当理解,示例服务器计算设备120可以包括与计算设备110相同或相似的组件,并且因此可以被配置为进行本公开的一些或全部技术,这些技术将在下面更全面地描述。此外,虽然本文在计算设备110的情境中描述了本公开的技术,但是可具体地预期,技术的每个特征可以由单独的计算设备110,由一起操作的多个计算设备110,由单独的服务器计算设备120,由一起操作的多个服务器计算设备120,以及由一起操作的一个或多个计算设备110和一个或多个服务器计算设备120的组合来进行。因此,为了简单起见,在以下描述中,术语“计算设备110”应该被解释为包括所有这些各种选项,该选项包括单独使用服务器计算设备120。
参考图3,示出了根据本公开的某些实施方式的在执行通信应用时的示例性计算设备110的显示设备230可以显示的示例GUI 300。图示的GUI 300包括消息显示部分302和消息输入部分304。被发送或接收的消息可以显示在消息显示部分302中,以及,例如,通过虚拟键盘(未示出)或其他用户输入设备,用户105可以在消息输入部分304中提供文本或其他输入。
计算设备110可以接收第一消息310。第一消息310包括可以例如包括诸如一个或多个词的文本的内容。在所示的示例中,第一消息310包括文本内容“我期待着我们的夏威夷之旅!”第一消息310与“时间t”的时间戳相关联,以及第一消息310由发送用户105s经由发送计算设备110s发送。第一消息310可以显示在消息显示部分302中。与计算设备110相关联的接收用户105r可以读取或以其他方式察觉第一消息310的文本内容(例如,经由文本到语音功能来听取代表文本内容的音频输出),并且如图所示,用第二消息“我也是!”315来回复。
可以在时间t+2接收第三消息“我想在Ala Moana购物”320,随后在时间t+4接收第四消息“我们必须徒步钻石头山并前往珍珠港”325。然后,第五消息(“你今晚的晚餐想要吃什么?”)330,第六消息(“大米和豆子听起来不错”)335,第七消息(“别忘了:我们今晚也要做瑜伽”)340,以及第八消息(“哦!对的”)345可以被接收并且分别与时间t+4到t+7相关联。如图3所示,可以在GUI 300中按照时间顺序显示这些消息中的每一个。
如上所述,以时间顺序列表显示来自通信会话的消息310-345(例如,如图3所示)在某些情况下可能导致计算设备110的计算资源、可用显示空间和/或能耗的低效使用。对于包括相对大量的消息和/或具有相对长的持续时间的通信会话尤其如此,因为这样的通信会话对于用户105来说往往更难以有效地搜索。为了解决这些和其他问题,本公开涉及用于按主题对消息进行分组的自动化技术,以及显示所生成的消息组,该消息组具有例如通过识别组中消息的主题来概括消息的标签。
现在参考图4,公开了用于对消息进行分组和概括的方法400。在410,计算设备110可以接收多个基于文本的消息(诸如消息310-345),这些消息对应于在计算设备110执行的通信应用中的第一和第二用户110之间的通信会话。计算设备110可以评估(420)消息310-345以确定通信会话的多个通信主题。在430处,计算设备110可以确定是否已经接收到使用任何类型的用户数据的明确的用户许可。如果尚未接收到明确的用户许可,则计算设备110将不使用(435)任何用户数据来进行方法400,并且方法进行到440。然而,如果已经接收到明确的用户许可,则受限于并且根据授予的用户许可,方法400可以继续使用用户数据,并且进行到440。
计算设备110还可以确定(440)用户105对所确定的通信主题的感兴趣程度。在450处,计算设备110可以基于所确定的感兴趣程度来识别用户特定通信主题,并且可以为每个用户特定通信主题生成(在460)标签。
计算设备110可以基于在450处识别的用户特定通信主题将多个消息聚类(470)成多个组。每个特定的消息组可以与特定的用户特定通信主题相关联,并且组中的每个消息将与该组的相同的用户特定通信主题相关联。在480处,计算设备110可以输出命令以生成与通信应用相对应的GUI,在GUI中,消息显示在聚类的组中。每个组还可以与关联标签一起显示,这可以协助用户105识别与这些组相关联的用户特定通信主题。
另外参考图5,示出了聚类和概括模块240的示例组件。如上所述,聚类和概括模块240可以(单独地或与其他计算设备或计算设备的组件一起)进行与方法400相关的一个或多个功能。聚类和概括模块240可以包括主题确定模型510,其可以评估(420)消息310-345以确定通信会话的多个通信主题。主题确定模型510可以包括神经网络或其他类型的被训练为识别消息内容中存在的主题的模型。在替代或另外的方面,可以利用词嵌入(wordembedding)来识别消息的主题,情感和/或句法信息以及其他等,可以用于从消息中导出通信主题。在一些方面,主题确定模型510可以包括训练为从标记的训练数据识别主题的机器学习分类器。在各种实施方式中,可以基于标记的训练数据来训练机器学习模型,该标记的训练数据包括用主题标记的多个消息。应当理解,可以使用任何类型的机器学习模型,例如通过监督学习,无监督学习及它们的组合进行训练的那些机器学习模型,以及神经网络等。
在一些示例实施方式中,主题确定模型510可以经由实体识别过程从消息中提取实体并消除实体的歧义。“实体”可以是可以被标记,识别或以其他方式命名的任何对象或概念。实体的示例包括但不限于,人员,地点,事物,产品,概念(明天,今晚等)和公司,以及“命名实体”(可以使用适当的名称识别的实体)。实体消除歧义的过程试图更充分地识别可能含糊不清的实体。仅作为示例,实体“星期四”通常可以指任何一周的任何星期四。然而,如果计算设备110知道实体所在的消息的情境(例如,日期),则可以更充分地将术语“本星期四”的使用识别为特定实体(日期)。
主题确定模型510可以进一步确定一些或所有所识别的实体的主题性分数。例如,特定实体的主题性分数可以被确定为与从消息中提取的特定实体相关的术语数量的度量。在一些实施方式中,特定实体的主题性分数可以附加地或替代地包括与提取特定实体的消息接近的一个或多个消息中的与该特定实体相关的术语的数量的度量。
每个消息的一个或多个主题实体也可以由主题确定模型510基于主题性分数来确定。在一个示例中,可以将实体的主题性分数与主题性阈值进行比较。当关于消息的特定实体的主题性分数被满足时,可以将特定实体分类为该消息(或一组消息)的主题。
在图3所示的通信会话中,例如,可以基于消息310、320和325中与“夏威夷”相关的术语的数量,将实体“夏威夷”确定为主题实体。计算设备110可以认识和识别术语(实体)“夏威夷”,“Ala Moana”,“钻石头山”和“珍珠港”之间的关系,并且可以确定“夏威夷”的主题性分数来满足主题性阈值。
主题实体或所有识别的实体可以与至少一个确定的通信主题相关联。在一些方面,实体本身可以被识别为通信主题或通信主题的一部分。仅作为示例,在图3中所示的消息中,主题实体“夏威夷”可以被识别为通信主题“夏威夷”/与通信主题“夏威夷”相关联。类似地,实体”珍珠港“可以被识别为通信主题”珍珠港“、”夏威夷“和”博物馆“等/与通信主题”珍珠港“、”夏威夷“和”博物馆“等相关联。实体(主题或其他)与通信主题的关联可以是,例如,基于诸如分类器的机器学习模型。
聚类和概括模块240还可以利用感兴趣程度模型520,感兴趣程度模型520可以确定(440)用户105对每个通信主题的感兴趣程度。如上所述,必须明确地允许感兴趣程度模型520使用的任何用户数据(在430)。在一些方面,感兴趣程度模型520可以基于通信会话内的用户105的行为来确定用户105的感兴趣程度。仅作为示例,如果用户105在通信会话内发送的消息重复地涉及特定通信主题,则可以确定用户105对于该特定通信主题的感兴趣程度相对较高。在附加或替代的实施方式中,感兴趣程度模型520可以基于用户简档和/或用户105在通信会话之外的其他行为来确定用户105的感兴趣程度。在一些方面,可以要求用户105识别他/她有相对高的感兴趣程度的一个或多个主题。
聚类和概括模块240的用户特定主题模型530可以基于在440确定的感兴趣程度从(在420)所确定的通信主题中识别(450)用户特定通信主题。此外,聚类和概括模块240还可以包括标签模型540,标签模型540被配置为每个用户特定通信主题生成标签,并且标签是每个用户特定通信主题的描述。在一些实施方式中,标签模型540可以包括分类器。在其他实施方式中,标签模型540可以利用被识别或以其他方式被确定为标签的通信主题,实体等。仅作为示例,可以通过标签模型540为已确定的通信主题“夏威夷”分配标签“夏威夷”。
在附加或替代的方面,标签模型540可以结合通信主题(用户特定的或其他方式的)以生成用于通信主题的标签。在图3所示的通信会话中,例如,标签模型540可以结合通信主题“夏威夷”和“旅行”以生成“夏威夷之旅”等的标签。
聚类模型550也可以包括在聚类和概括模块240中。聚类模型550是被训练为进行聚类分析的模型,在模型中,项目被分组(聚类),使得每个组中的项目被确定为与其他组中的项目相比彼此之间更相似。在本公开中,聚类模型550被训练为基于用户特定通信主题对消息进行分组,使得每个组与用户特定通信主题相关联,并且组中的每个消息与该组关联的特定的用户特定通信主题相关联。
在某些方面,聚类模型550可以被训练为基于除了用户特定通信主题之外的其他因素对消息进行分组,其他因素例如为消息的发送时间,消息的发送时间和先前(较早)消息的读取时间之间的差异,和/或是否确定消息的发送者正在响应特定消息(例如,发送者经由通信应用输出的通知来发起消息的组成)。仅作为示例,聚类模型550可以保持组内和/或组之间的消息的时间顺序。也就是说,聚类模型550可以生成消息按时间顺序排序的消息组,和/或可以按时间顺序排序的多个组。
在这样的实施方式中,聚类和概括模块240(例如,在聚类模型550处)可以确定消息组之间的边界,其中消息组之间的边界识别组之间的用户特定通信主题的变化。仅作为示例,为了确定消息组之间的边界,聚类模型550可以确定通信会话中的每个特定消息是否响应于先前消息。聚类模型550可以利用该响应性信息将每个响应消息以及该消息对其响应的消息聚类到同一组中。也就是说,当特定的消息(例如,“米饭和豆子听起来不错”335)被确定为是对先前的消息(“今晚的晚餐你想吃什么?”330)做出响应时,特定的消息和先前消息可以聚类到同一组中(例如,具有主题/标签“今晚”)。
聚类模型550可以包括在训练数据上训练的模型,该训练数据包括标记为响应(正例)和/或非响应(负例)的消息集合,用来确定表明响应性的消息的特征。在一些方面,可以利用特定消息的发送时间(消息的发送时间)来确定特定消息是否响应于先前消息。仅作为示例,具有在先前消息的发送时间之后不久的发送时间的特定消息指示特定消息更可能是对先前消息的响应。在另一示例中,可以利用用户150的先前消息的读取时间与特定消息的发送时间之间的差异来确定消息是否为响应。类似于上面的发送时间示例,在估计第一用户已经读取先前消息(读取时间)之后不久的发送时间,第一用户发送的特定消息指示该特定消息更可能是响应先前的消息。
可用于确定响应性的另一示例特征是,用户(发送用户)是直接经由消息应用发起特定的基于文本的消息,还是经由通信应用输出的通知(例如,利用与通信应用分开的计算设备110的通知功能)。仅作为示例,用户在他/她的计算设备上接收第一消息的通知,通过通知启动通信应用,然后生成并发送第二基于文本的消息,这可能表明第二消息更有可能是响应先前(第一)消息。根据该信息,计算设备110可以推断第一和第二基于文本的消息应该被分组并且与相同的用户特定通信主题相关联。
附加地或替代地,消息的内容可以用于确定后面的消息是否响应于先前的消息。仅作为示例,包括疑问(如何,为什么,什么,哪个,哪里等)或与问题相关联的标点符号(例如问号)的先前消息可以指示随后消息(例如,下一条消息)更有可能是响应先前的消息。在又一示例中,如果先前消息包括表明项目/对象的类别或集的词(诸如消息“颜色”),而且不包括疑问的词或标点符号,而后续消息包括表明类别或集合中的特定的成员/项目/对象的词(例如“蓝色”),则后续消息更有可能是响应先前消息。
应当理解,尽管各种不同模型(510-550)被描述为单独起作用的单独模型,但是本公开预期计算设备110可以利用一些或所有模型(或模型的特征)的组合。此外,特别考虑的是,除非另有说明,否则所描述的每个特征和模型可以单独使用或以任何组合一起使用。
如上所述,计算设备110可以输出命令以生成与通信应用相对应的GUI 300,在GUI300中,消息显示在聚类的组中。现在参考图6,所示的示例GUI 300被修改为包括已显示的组610、620,而不是如图3所示的消息310-345。每个组610、620还可以各自与它们相关联的标签612、622一起显示。在一些实施方式中,每个组610、620还可以各自与时间指示符614、624一起显示,该时间指示符614、624表明与时间指示符相关联的组中的消息的近似的日期,日子,时间等。
在一些实施方式中,每个组610、620还可以或可选地包括该组中的一个消息或多个消息的片段616、626(一个或多个部分)。片段可以由标签模型540选择/生成,并且在一些实施方式中也可以被指定为标签。仅作为示例,标签模型540可以基于消息中的一个或多个主题实体的存在来选择消息(或其一部分)。
在图6示出的示例中,组610对应于图3中的消息310、315、320和325,组620对应于消息330、335、340和345。组610与标签612“夏威夷之旅”和片段616“...我们的夏威夷之旅!”一起显示。类似地,如图所示,组620与标签622“今晚”和片段626“...我们今晚有瑜伽...”一起显示。如上所述,可以基于每个用户105的用户特定通信主题生成组610、620。因此,所示出的组610、620可以对应于用户105r,105s中的一个或两者。
用户105可以例如通过点击组,在组的显示位置处触摸触摸屏,或键盘输入来提供用户输入,以选择对消息组610、620进行解组。进一步参考图7,由于用户输入而对组620进行解组,所示的示例GUI 300被修改为包括已显示的组610和消息330-345。GUI 300还可以提供切换输入(未示出),该切换输入允许用户105容易地对已经解组的消息进行重新分组。
上面的描述涉及将消息聚类成组,但同样适用于通过嵌套用户特定通信主题,用户特定通信子主题等将消息分组成组,子组等。现在参考图8,所示的示例GUI 300被修改为图示对组620的子组810、820的显示。仅作为示例,用户105可以提供输入来对组620进行解组(来自图6的GUI 300)。而非显示如图7中所示的消息330-345,计算设备110替代地显示了多个子组810、820。类似于上述组610、620,每个子组810、820可以与该子组中的标签(812、822)和/或消息的片段(816、826)一起显示。尽管示出为包括组620的时间指示符624,但是可选地或另外地,每个子组810、820可以与单独的时间指示符一起显示,该单独的时间指示符表明与时间指示符相关联的子组中的消息的近似的日期,日子,时间等
用于生成子组810、820的方法可以与用于生成如上所述的组的方法相同或类似。在一些实施方式中,计算设备110将基于组内的消息的数量来确定是否在一组消息内生成子组。仅作为示例,当特定组内的消息的数量大于阈值时,计算设备110可以评估该特定组内的消息,以基于用户特定通信子主题将消息聚类成子组。
附加地或替代地,计算设备110可以基于消息之间的通信主题的相似性得分来确定是否在一组消息内生成子组。相似性得分可以是表明主题之间的相似性程度的任何度量。仅作为示例,在单个消息组中,第一数量的消息可以涉及第一通信(子)主题,并且在第一数量的消息之后的第二数量的消息可以涉及不同的第二通信(子)主题。为了在单个组中,在第一和第二数量的消息中的消息可以涉及相同的用户特定通信主题,同时还涉及其他通信主题。如果其他通信主题具有表明低相似程度的相似性得分,则计算设备110可以确定从第一和第二数量的消息生成子组。
计算设备110还可以确定是否将先前生成的消息组合并到超级组中,从而有效地将先前生成的组的状态改变为“超级组”的“子组”。类似于是否生成子组的确定,计算设备110可以基于组内的消息的数量和/或组之间的用户特定通信主题的相似性得分,来确定是否将组合并成超级组。仅作为示例,如果两个相邻消息组的用户特定通信主题具有表明高相似程度的相似性得分,则计算设备110可以确定从相邻组生成新(超级)组,同时保留原始组作为子组。
这里讨论的一个或多个系统和方法不需要收集或使用用户个人信息。在这里讨论的某些实施方式可能收集或使用关于用户的个人信息(例如,用户数据,关于用户的社交网络的信息,用户的位置和时间,用户的生物识别信息,用户的活动和人口统计信息)的情况下,向用户提供一个或更多机会控制是否收集个人信息,是否存储个人信息,是否使用个人信息,以及如何收集关于用户,存储和使用的信息。也就是说,这里讨论的系统和方法仅在接收到相关用户的明确授权时才收集,存储和/或使用用户个人信息。另外,某些数据可以在存储或使用之前以一种或多种方式处理,以便移除个人可识别信息。作为一个示例,可以对用户的身份处理,以便不能确定个人可识别信息。作为另一示例,用户的地理地点可以被概括在更大的区域,使得不能确定用户的特定。
提供示例实施例使得本公开详尽,并且将向本领域技术人员充分传达保护范围。许多具体细节,例如具体组件,设备和方法的示例被记载,以提供对本公开的实施例的透彻理解。对于本领域技术人员显而易见的是,不需要采用具体细节,示例实施例可以以各种不同形式实施,并且这些不同形式都不应被解释为限制本公开的范围。在一些示例实施例中,没有详细描述众所周知的过程,众所周知的设备结构和众所周知的技术。
这里使用的术语仅用于描述特定示例实施例的目的,而不是限制性的。如这里所使用的,单数形式“一”,“一个”和“该”也可以包括复数形式,除非上下文另有明确说明。术语“和/或”包括一个或多个相关联的列出的项目的任何和所有组合。术语“包含”,“包括”和“具有”是包含性的,因此指定了记载的特征,整数,步骤,操作,元件和/或组件的存在,但不排除一个或多个其他特征,整数,步骤,操作,元件,组件和/或这些的组的存在,或不排除一个或多个其他特征,整数,步骤,操作,元件,组件和/或这些的组的附加。除非进行顺序被具体地标识,否则本文描述的方法步骤,过程和操作不应被解释为必须要求它们以所讨论或说明的特定顺序进行。还应理解,可以采用另外的或替代的步骤。
尽管这里可以使用术语第一,第二,第三等来描述各种元件,组件,区域,层和/或部分,但是这些元件,组件,区域,层和/或部分不应受这些术语的限制。这些术语可仅用于将一个元件,组件,区域,层或部分与另一个区域,层或部分区分开。除非上下文明确指出,否则本文使用的诸如“第一”,“第二”和其他数字术语的术语不暗示顺序或排序。因此,在不脱离示例实施例的教导的情况下,下面讨论的第一元件,组件,区域,层或部分可以被称为第二元件,组件,区域,层或部分。
如这里所使用的,术语“模块”可以指代,部分的或包括:专用集成电路(ASIC);电子电路;组合逻辑电路;现场可编程门阵列(FPGA);执行代码或过程的处理器或处理器与在网络集群或数据中心中的存储的分布式网络(共享,专用或分组);提供所描述功能的其他合适组件;或者,诸如在片上系统中,上述部分或全部的组合。术语“模块”还可以包括存储有由一个或多个处理器执行的代码的存储器(共享的,专用的或分组的)。
如上所使用的术语“代码”可以包括软件,固件,字节代码和/或微代码,并且可以指代程序,例程,函数,类和/或对象。如上所使用的术语“共享的”意味着可以使用单个(共享的)处理器来执行来自多个模块的一些或所有代码。另外,来自多个模块的一些或所有代码可以由单个(共享的)存储器存储。如上所使用的术语“组”意味着可以使用一组处理器来执行来自单个模块的一些或所有的代码。另外,可以使用一组存储器来存储来自单个模块的一些或所有的代码。
这里描述的技术可以由一个或多个处理器执行的一个或多个计算机程序实施。计算机程序包括存储在非暂时性有形计算机可读介质上的处理器可执行的指令。计算机程序还可以包括存储的数据。非暂时性有形计算机可读介质的非限制性示例是非易失性存储器,磁性存储和光学存储。
以上描述的一些部分从对信息的操作的算法和符号表示的角度来呈现本文描述的技术。这些算法描述和表示是数据处理领域的技术人员使用的手段,以便最有效地将他们工作的实质传达给本领域其他技术人员。虽然在功能上或逻辑上描述了这些操作,但应理解为这些操作由计算机程序实施。此外,事实证明,在不失一般性的情况下,将这些操作安排称为模块或功能名称也很方便。
除非另外明确地声明或在上面的讨论中显而易见,否则应理解,在整个说明书中,利用诸如“处理”或“计算”或“运算”或“确定”或“显示”等术语的讨论指的是计算机系统或类似的电子计算设备的动作和过程,计算机系统或类似的电子计算设备操纵和变换数据,数据被表示为计算机系统存储器或寄存器或其他此类信息存储、传输或显示设备内的物理(电子)量。
所描述的技术的某些方面包括以算法的形式在此描述的过程步骤和指令。应当注意,所描述的过程步骤和指令可以体现在软件,固件或硬件中,当体现在软件中时,可以下载以驻留在实时网络操作系统所使用的不同平台上,以及并从实时网络操作系统所使用的不同平台操作。
本公开还涉及用于进行此处操作的装置。该装置可以为所需目的而专门构造,或者该装置可以包括由存储在可由计算机访问的计算机可读介质上的计算机程序选择性地激活或重新配置的通用计算机。这样的计算机程序可以存储在有形计算机可读存储介质中,例如但不限于,任何类型的盘,包括软盘,光盘,CD-ROM,磁光盘,只读存储器(ROM),随机存取存储器(RAM),EPROM,EEPROM,磁卡或光卡,专用集成电路(ASIC),或适用于存储电子指令的任何类型的介质,并且每个都耦合到计算机系统总线。此外,说明书中提到的计算机可以包括单个处理器,或者可以是采用多个处理器设计以提高计算能力的架构。
这里给出的算法和操作并非固有地涉及任何特定计算机或其他装置。根据本文的教导,各种通用系统也可以与程序一起使用,或者可以证明构造更专用的装置以执行所需的方法步骤是方便的。对于本领域技术人员来说,各种这些系统所需的结构以及等同的变型是显而易见的。此外,本发明不参考任何特定的编程语言来描述。应当理解,可以使用各种编程语言来实施本公开的在此描述的教导,并且提供用于公开本发明的实现和最佳模式的特定语言的任何参考。
本公开非常适合于使用多种拓扑结构的种类繁多的计算机网络系统。在该领域内,大型网络的配置和管理包括存储设备和计算机,这些通过存储设备和计算机诸如因特网的网络通信地耦合到不一样的计算机和存储设备。
出于说明和描述的目的已经提供了实施例的前述描述。描述并非旨在是穷举或限制本公开。特定实施例的单独的元件或特征通常不限于该特定实施例,而是在适用的情况下,单独的元件或特征可互换并且可以在所选实施例中使用,即使所选实施例没有被具体示出或描述。单独的元件或特征也可以以一种或多种方式变化。不应将这些变型视为脱离本公开,并且所有这些修改旨在包括在本公开的范围内。

Claims (21)

1.一种计算机实施的方法,其特征在于,包括:
在执行第一用户的通信应用的计算设备处,接收与所述第一用户和第二用户之间的通信会话相对应的多个消息;
在所述计算设备处,评估所述多个消息,以确定所述通信会话的多个通信主题;
在所述计算设备处,接收用户许可以利用用户数据;
在所述计算设备处,确定所述第一用户对所述多个通信主题中的每个通信主题的感兴趣程度;
在所述计算设备处,基于所确定的感兴趣程度,识别所述多个通信主题中的多个用户特定通信主题;
在所述计算设备处,生成用于每个所述用户特定通信主题的标签,其中每个标签描述与每个标签相关联的用户特定通信主题;
在所述计算设备处,基于所述多个用户特定通信主题,将所述多个消息聚类成多个消息组,其中所述多个消息组中的每个特定组与所述多个用户特定通信主题的特定的用户特定通信主题相关联,并且其中,所述特定组中的每个消息与所述特定的用户特定通信主题相关联;
在所述计算设备处,输出命令以生成与通信应用相对应的图形用户界面,在所述图形用户界面中:(i)在所述多个消息组中显示所述多个消息,以及(ii)所述多个消息组中的每个组和与所述每个组相关联的标签一起显示。
2.如权利要求1所述的计算机实施的方法,其特征在于,评估所述多个消息以确定所述多个通信主题包括:
从所述多个消息中提取一个或多个实体并消除所述一个或多个实体的歧义;
确定所述一个或多个实体中的每个实体关于每个特定消息的主题性分数,其中特定实体的主题性分数表明与所述特定消息和接近所述特定消息的至少一个消息中的所述特定实体相关的术语的数量的度量;
通过将主题性分数与主题性阈值进行比较,确定每个特定消息的一个或多个主题实体;
将所述一个或多个主题实体中的每一个主题实体与所述多个通信主题中的至少一个通信主题相关联。
3.如权利要求1或2所述的计算机实施的方法,其特征在于,所述第一用户对所述多个通信主题中的每个通信主题的所述感兴趣程度是基于所述第一用户在所述通信会话中的行为。
4.如任一项在先权利要求所述的计算机实施的方法,其特征在于,所述第一用户对所述多个通信主题中的每个通信主题的所述感兴趣程度是基于所述第一用户的用户简档。
5.如任一项在先权利要求所述的计算机实施的方法,其特征在于,基于文本的消息在所述多个消息组中的每个组中按时间顺序排序,并且所述多个消息组按时间顺序排序。
6.如任一项在先权利要求所述的计算机实施的方法,其特征在于,还包括:
在所述计算设备处,确定所述多个消息组中的第一组和第二组之间的边界,其中所述边界识别所述第一组和所述第二组的消息之间的用户特定通信主题的变化。
7.如权利要求6所述的计算机实施的方法,其特征在于,确定所述边界包括:
在所述计算设备处,确定每个特定消息是否响应于先前消息,其中当所述特定消息响应所述先前消息时,所述特定消息与所述先前消息被聚类到所述多个消息组中的相同组。
8.如权利要求7所述的计算机实施的方法,其特征在于,确定每个特定消息是否响应于先前消息是基于以下中的至少一个:(i)所述特定消息的发送时间,(ii)所述特定消息的所述发送时间与所述先前消息的读取时间之间的差异,所述读取时间包括发送了所述特定消息的发送用户读取所述先前消息的估计时间,以及(iii)所述发送用户是经由所述通信应用直接发起所述特定消息,还是通过所述通信应用输出的通知发起所述特定消息。
9.如任一项在先权利要求所述的计算机实施的方法,其特征在于,还包括:
在所述计算设备处,从所述第一用户接收用户输入以对所述多个消息组中的第一组进行解组;以及
响应于接收所述用户输入,在所述计算设备处修改所述图形用户界面以显示:(i)所述第一组中的所述消息的多个子组,或(ii)所述第一组中的每个消息。
10.如权利要求9所述的计算机实施的方法,其特征在于,
所述多个消息组中的所述第一组与第一用户特定通信主题相关联;
所述多个子组中的每一个子组与特定的用户特定通信子主题相关联;以及
每个特定的用户特定通信子主题与所述第一组的所述第一用户特定通信主题有关。
11.一种计算设备,其特征在于,包括:
一个或多个处理器,所述处理器执行第一用户的通信应用;以及
非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有多个指令,当所述指令由所述一个或多个处理器执行时,使所述一个或多个处理器进行操作,所述操作包括:
接收与所述第一用户和第二用户之间的通信会话相对应的多个消息;
评估所述多个消息,以确定所述通信会话的多个通信主题;
接收用户许可以利用用户数据;
确定所述第一用户对所述多个通信主题中的每个通信主题的感兴趣程度;
基于所确定的感兴趣程度,识别所述多个通信主题中的多个用户特定通信主题;
生成用于每个所述用户特定通信主题的标签,其中每个标签描述与每个标签相关联的用户特定通信主题;
基于所述多个用户特定通信主题,将所述多个消息聚类成多个消息组,其中所述多个消息组中的每个特定组与所述多个用户特定通信主题的特定的用户特定通信主题相关联,并且其中,所述特定组中的每个消息与所述特定的用户特定通信主题相关联;
输出命令以生成与通信应用相对应的图形用户界面,在所述图形用户界面中:(i)在所述多个消息组中显示所述多个消息,以及(ii)所述多个消息组中的每个组和与所述每个组相关联的标签一起显示。
12.如权利要求11所述的计算设备,其特征在于,评估所述多个消息以确定所述多个通信主题包括:
从所述多个消息中提取一个或多个实体并消除所述一个或多个实体的歧义;
确定所述一个或多个实体中的每个实体关于每个特定消息的主题性分数,其中特定实体的主题性分数表明与所述特定消息和接近所述特定消息的至少一个消息中的所述特定实体相关的术语的数量的度量;
通过将主题性分数与主题性阈值进行比较,确定每个特定消息的一个或多个主题实体;
将所述一个或多个主题实体中的每一个主题实体与所述多个通信主题中的至少一个通信主题相关联。
13.如权利要求11或12所述的计算设备,其特征在于,所述第一用户对所述多个通信主题中的每个通信主题的所述感兴趣程度是基于所述第一用户在所述通信会话中的行为。
14.如权利要求11-13中任一项所述的计算设备,其特征在于,所述第一用户对所述多个通信主题中的每个通信主题的所述感兴趣程度是基于所述第一用户的用户简档。
15.如权利要求11-14中任一项所述的计算设备,其特征在于,基于文本的消息在所述多个消息组中的每个组中按时间顺序排序,并且所述多个消息组按时间顺序排序。
16.如权利要求11-15中任一项所述的计算设备,其特征在于,还包括:
确定所述多个消息组中的第一组和第二组之间的边界,其中所述边界识别所述第一组和所述第二组的消息之间的用户特定通信主题的变化。
17.如权利要求11-16中任一项所述的计算设备,其特征在于,确定所述边界包括:
确定每个特定消息是否响应于先前消息,其中当所述特定消息响应所述先前消息时,所述特定消息与所述先前消息被聚类到所述多个消息组中的相同组。
18.如权利要求17所述的计算设备,其特征在于,确定每个特定消息是否响应于先前消息是基于以下中的至少一个:(i)所述特定消息的发送时间,(ii)所述特定消息的所述发送时间与所述先前消息的读取时间之间的差异,所述读取时间包括发送了所述特定消息的发送用户读取所述先前消息的估计时间,以及(iii)所述发送用户是经由所述通信应用直接发起所述特定消息,还是通过所述通信应用输出的通知发起所述特定消息。
19.如权利要求11-18中任一项所述的计算设备,其特征在于,还包括:
从所述第一用户接收用户输入以对所述多个消息组中的第一组进行解组;以及
响应于接收所述用户输入,修改所述图形用户界面以显示:(i)所述第一组中的所述消息的多个子组,或(ii)所述第一组中的每个消息。
20.如权利要求19所述的计算设备,其特征在于,
所述多个消息组中的所述第一组与第一用户特定通信主题相关联;
所述多个子组中的每一个子组与特定的用户特定通信子主题相关联;以及
每个特定的用户特定通信子主题与所述第一组的所述第一用户特定通信主题有关。
21.一种计算机可读介质,其特征在于,所述计算机可读介质包括指令,当所述指令被计算机执行时,使得所述计算机实行如权利要求1-9中任一项所述的方法。
CN201780071662.XA 2017-02-20 2017-10-31 基于主题的消息分组和概括 Pending CN110268428A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/437,223 US10509531B2 (en) 2017-02-20 2017-02-20 Grouping and summarization of messages based on topics
US15/437,223 2017-02-20
PCT/US2017/059328 WO2018151774A1 (en) 2017-02-20 2017-10-31 Grouping and summarization of messages based on topics

Publications (1)

Publication Number Publication Date
CN110268428A true CN110268428A (zh) 2019-09-20

Family

ID=60515801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780071662.XA Pending CN110268428A (zh) 2017-02-20 2017-10-31 基于主题的消息分组和概括

Country Status (3)

Country Link
US (1) US10509531B2 (zh)
CN (1) CN110268428A (zh)
WO (1) WO2018151774A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112787907A (zh) * 2020-12-31 2021-05-11 维沃移动通信有限公司 显示方法、装置及电子设备
CN112783389A (zh) * 2021-01-21 2021-05-11 维沃移动通信有限公司 信息发布方法、装置、设备及介质
CN113504860A (zh) * 2021-07-23 2021-10-15 维沃移动通信(杭州)有限公司 消息回复方法和装置
CN113810203A (zh) * 2020-06-11 2021-12-17 腾讯科技(深圳)有限公司 主题会话处理方法、装置、计算机设备和存储介质
CN113918055A (zh) * 2021-09-14 2022-01-11 维沃移动通信有限公司 消息处理方法、装置和电子设备

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10795947B2 (en) 2016-05-17 2020-10-06 Google Llc Unified message search
US20190171693A1 (en) * 2017-12-06 2019-06-06 Microsoft Technology Licensing, Llc Personalized presentation of messages on a computing device
US11019016B2 (en) * 2018-10-27 2021-05-25 International Business Machines Corporation Subgroup messaging within a group-based messaging interface
US10810243B2 (en) * 2019-03-08 2020-10-20 Fuji Xerox Co., Ltd. System and method for generating abstractive summaries of interleaved texts
US11914966B2 (en) 2019-06-19 2024-02-27 International Business Machines Corporation Techniques for generating a topic model
CN110768805B (zh) * 2019-09-26 2021-07-20 维沃移动通信有限公司 一种群消息的显示方法及电子设备
CN111614547B (zh) * 2020-05-14 2023-06-09 腾讯科技(深圳)有限公司 消息显示方法、装置、终端及介质
US11924153B2 (en) * 2020-12-31 2024-03-05 Snap Inc. Messaging user interface element with reminders
US20220385605A1 (en) * 2021-05-27 2022-12-01 Microsoft Technology Licensing, Llc Management of message threads generated from an intra-message split
US11637798B2 (en) 2021-05-27 2023-04-25 Microsoft Technology Licensing, Llc Controlled display of related message threads
US11652773B2 (en) 2021-05-27 2023-05-16 Microsoft Technology Licensing, Llc Enhanced control of user interface formats for message threads based on device form factors or topic priorities
US11716302B2 (en) 2021-05-27 2023-08-01 Microsoft Technology Licensing, Llc Coordination of message thread groupings across devices of a communication system
WO2022250909A1 (en) * 2021-05-28 2022-12-01 Microsoft Technology Licensing, Llc A personalized communication text compression system
US20230281389A1 (en) * 2022-03-02 2023-09-07 Microsoft Technology Licensing, Llc Topic suggestion in messaging systems
CN116774868A (zh) * 2022-03-10 2023-09-19 腾讯科技(深圳)有限公司 交互数据处理方法、装置、程序产品、计算机设备和介质
US11848905B1 (en) * 2023-08-01 2023-12-19 Sandeep Navinchandra Shah System and method of managing an online communication group

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060168026A1 (en) * 2004-12-16 2006-07-27 International Business Machines Corporation System and method enabling interactive electronic mail and real-time messaging
US20080263157A1 (en) * 2007-04-18 2008-10-23 Kulvir Singh Bhogal Method and system for ordering instant messages
CN102693273A (zh) * 2011-03-18 2012-09-26 微软公司 无监督消息聚类
US20130066984A1 (en) * 2011-09-09 2013-03-14 Pantech Co., Ltd. Apparatus and method for managing broadcast message group
CN103246676A (zh) * 2012-02-10 2013-08-14 富士通株式会社 对消息进行聚类的方法和设备
CN105049336A (zh) * 2015-08-12 2015-11-11 深圳前海珩昌科技有限公司 即时通信消息的处理方法、服务器、客户端及系统
CN105450497A (zh) * 2014-07-31 2016-03-30 国际商业机器公司 生成聚类模型以及基于该聚类模型进行聚类的方法和装置

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6845374B1 (en) * 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US20060161947A1 (en) * 2001-09-05 2006-07-20 Indra Laksono Method and apparatus for customizing messaging within a cable system
US7200635B2 (en) 2002-01-09 2007-04-03 International Business Machines Corporation Smart messenger
US7340674B2 (en) * 2002-12-16 2008-03-04 Xerox Corporation Method and apparatus for normalizing quoting styles in electronic mail messages
GB0312054D0 (en) * 2003-05-23 2003-07-02 Ibm Method and system for information distribution
US8190999B2 (en) 2004-05-20 2012-05-29 International Business Machines Corporation System and method for in-context, topic-oriented instant messaging
US7587461B2 (en) * 2005-04-19 2009-09-08 Google Inc. Method and system for activity based email sorting
US8566109B2 (en) * 2005-11-29 2013-10-22 Alcatel Lucent Common interest community service via presence messaging
US20080281927A1 (en) 2007-05-11 2008-11-13 Microsoft Corporation Summarization tool and method for a dialogue sequence
US7739261B2 (en) 2007-06-14 2010-06-15 Microsoft Corporation Identification of topics for online discussions based on language patterns
US8762285B2 (en) * 2008-01-06 2014-06-24 Yahoo! Inc. System and method for message clustering
US20140096033A1 (en) * 2008-03-06 2014-04-03 Software Hot-House Ltd. Enhancements to unified communications and messaging systems
GB0804164D0 (en) * 2008-03-06 2009-01-07 Software Hothouse Ltd Enhancements to unified communications and messaging systems
US8335827B2 (en) 2008-07-11 2012-12-18 Yuriy Mishchenko Systems and methods for exchanging information in a large group
US8166408B2 (en) 2009-01-05 2012-04-24 International Business Machines Corporation Management of virtual discussion threads in a synchronous conferencing system
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
KR101590766B1 (ko) 2009-06-26 2016-02-02 삼성전자주식회사 메시지를 그룹화하고 디스플레이하는 장치 및 방법
US9514435B2 (en) * 2009-08-17 2016-12-06 Accenture Global Services Limited System for targeting specific users to discussion threads
US20130232263A1 (en) * 2009-12-18 2013-09-05 Morningside Analytics System and method for classifying a contagious phenomenon propagating on a network
US10324598B2 (en) * 2009-12-18 2019-06-18 Graphika, Inc. System and method for a search engine content filter
EP2537106A4 (en) * 2009-12-18 2013-10-02 Morningside Analytics Llc SYSTEM AND METHOD FOR ATTENTION GROUPING AND ANALYTICAL PROCEDURES AND VIEWS RELATING THERETO
US8732590B2 (en) * 2010-04-14 2014-05-20 Linkedin Corporation Techniques for presenting content items to members of a group
US20110320441A1 (en) * 2010-06-25 2011-12-29 Microsoft Corporation Adjusting search results based on user social profiles
US9160806B1 (en) * 2010-08-04 2015-10-13 Open Invention Network, Llc Method and apparatus of organizing and delivering data to intended recipients
US20120066073A1 (en) * 2010-09-02 2012-03-15 Compass Labs, Inc. User interest analysis systems and methods
US9356806B2 (en) * 2010-10-06 2016-05-31 Twitter, Inc. Prioritizing messages within a message network
US8990065B2 (en) * 2011-01-11 2015-03-24 Microsoft Technology Licensing, Llc Automatic story summarization from clustered messages
US9146656B1 (en) * 2011-06-27 2015-09-29 Google Inc. Notifications user interface
US9116984B2 (en) 2011-06-28 2015-08-25 Microsoft Technology Licensing, Llc Summarization of conversation threads
US10277452B2 (en) * 2011-07-08 2019-04-30 Gree, Inc. Message processing system and message processing method
US9558165B1 (en) * 2011-08-19 2017-01-31 Emicen Corp. Method and system for data mining of short message streams
US9276974B2 (en) * 2011-10-12 2016-03-01 MarketChorus, Inc. Topical activity monitor and identity collector system and method
TWI591992B (zh) * 2011-11-16 2017-07-11 Alibaba Group Holding Ltd 群組通信關係的建立、以及網頁展現方法和相關設備
US20130311556A1 (en) * 2012-05-18 2013-11-21 Yahoo! Inc. System and Method for Generating Theme Based Dynamic Groups
WO2014011208A2 (en) * 2012-07-10 2014-01-16 Venor, Inc. Systems and methods for discovering content of predicted interest to a user
US20140074843A1 (en) * 2012-09-12 2014-03-13 Zuess, Inc. Systems and methods for dynamic analysis, sorting and active display of semantic-driven reports of communication repositories
US20140189000A1 (en) * 2013-01-02 2014-07-03 Microsoft Corporation Social media impact assessment
US9294576B2 (en) * 2013-01-02 2016-03-22 Microsoft Technology Licensing, Llc Social media impact assessment
US9483580B2 (en) * 2013-06-11 2016-11-01 International Business Machines Corporation Estimation of closeness of topics based on graph analytics
US9596205B2 (en) * 2013-08-14 2017-03-14 Yahoo! Inc. System and method for mailing list identification and representation
US8676913B1 (en) 2013-09-09 2014-03-18 LavaRipples, LLC Discussion-topic, social network systems
US9256670B2 (en) * 2013-10-10 2016-02-09 International Business Machines Corporation Visualizing conflicts in online messages
US20150120680A1 (en) 2013-10-24 2015-04-30 Microsoft Corporation Discussion summary
US10354284B2 (en) * 2013-12-05 2019-07-16 Palo Alto Research Center Incorporated System and method for estimating and clustering multiple-dimension characteristics for auction-based message delivery
US9306893B2 (en) * 2013-12-31 2016-04-05 Google Inc. Systems and methods for progressive message flow
US9756003B2 (en) * 2015-05-11 2017-09-05 International Business Machines Corporation Dynamic inclusion thresholds for social network conversations
US9729479B2 (en) * 2015-05-16 2017-08-08 International Business Machines Corporation Generate and display contextual hints in a message
US10268340B2 (en) 2015-06-11 2019-04-23 International Business Machines Corporation Organizing messages in a hierarchical chat room framework based on topics
US9560152B1 (en) * 2016-01-27 2017-01-31 International Business Machines Corporation Personalized summary of online communications
EP3331202A4 (en) * 2016-04-15 2018-08-22 Huawei Technologies Co., Ltd. Message presentation method, device, and system
US10616145B2 (en) * 2016-06-30 2020-04-07 Microsoft Technology Licensing, Llc Message grouping and relevance
US10594640B2 (en) * 2016-12-01 2020-03-17 Oath Inc. Message classification
US10334067B2 (en) * 2017-01-02 2019-06-25 International Business Machines Corporation MQTT cluster shared subscription hub for fat-pipe cloud applications

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060168026A1 (en) * 2004-12-16 2006-07-27 International Business Machines Corporation System and method enabling interactive electronic mail and real-time messaging
US20080263157A1 (en) * 2007-04-18 2008-10-23 Kulvir Singh Bhogal Method and system for ordering instant messages
CN102693273A (zh) * 2011-03-18 2012-09-26 微软公司 无监督消息聚类
US20130066984A1 (en) * 2011-09-09 2013-03-14 Pantech Co., Ltd. Apparatus and method for managing broadcast message group
CN103246676A (zh) * 2012-02-10 2013-08-14 富士通株式会社 对消息进行聚类的方法和设备
CN105450497A (zh) * 2014-07-31 2016-03-30 国际商业机器公司 生成聚类模型以及基于该聚类模型进行聚类的方法和装置
CN105049336A (zh) * 2015-08-12 2015-11-11 深圳前海珩昌科技有限公司 即时通信消息的处理方法、服务器、客户端及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113810203A (zh) * 2020-06-11 2021-12-17 腾讯科技(深圳)有限公司 主题会话处理方法、装置、计算机设备和存储介质
CN113810203B (zh) * 2020-06-11 2023-11-07 腾讯科技(深圳)有限公司 主题会话处理方法、装置、计算机设备和存储介质
CN112787907A (zh) * 2020-12-31 2021-05-11 维沃移动通信有限公司 显示方法、装置及电子设备
CN112783389A (zh) * 2021-01-21 2021-05-11 维沃移动通信有限公司 信息发布方法、装置、设备及介质
CN112783389B (zh) * 2021-01-21 2023-08-22 维沃移动通信有限公司 信息发布方法、装置、设备及介质
CN113504860A (zh) * 2021-07-23 2021-10-15 维沃移动通信(杭州)有限公司 消息回复方法和装置
CN113918055A (zh) * 2021-09-14 2022-01-11 维沃移动通信有限公司 消息处理方法、装置和电子设备

Also Published As

Publication number Publication date
US10509531B2 (en) 2019-12-17
US20180239495A1 (en) 2018-08-23
WO2018151774A1 (en) 2018-08-23

Similar Documents

Publication Publication Date Title
CN110268428A (zh) 基于主题的消息分组和概括
CN109952572B (zh) 基于消息贴纸的建议响应
US20220035989A1 (en) Personalized presentation of messages on a computing device
KR102050334B1 (ko) 언어 모델을 사용한, 메시지들에서 수신되는 이미지들에 대한 자동적인 제안 응답들
Fawagreh et al. Random forests: from early developments to recent advancements
Xu et al. My privacy my decision: Control of photo sharing on online social networks
CN109643412A (zh) 电子邮件个性化
CN112334889A (zh) 用于用户与助理系统交互的个性化手势识别
CN111615706A (zh) 基于子流形稀疏卷积神经网络分析空间稀疏数据
US20160306800A1 (en) Reply recommendation apparatus and system and method for text construction
CN105874753A (zh) 用于社交数据网络用户行为细分的系统和方法
CN107480161A (zh) 用于媒体探究的智能自动化助理
US20130154980A1 (en) Method and system for emotion tracking, tagging, and rating and communication
CN104079640B (zh) 一种用户服务提供方法及系统
CN103034675A (zh) 信息处理装置、服务器、方法、信息提取方法和程序
US20130346401A1 (en) Topical affinity badges in information retrieval
CN109074547A (zh) 基于消息内容的文本消息排序
CN110313010A (zh) 电子消息的结构化响应概要
CN107634897A (zh) 群推荐方法和装置
US11405340B2 (en) Personality reply for digital content
Kim et al. FaceCAPTCHA: a CAPTCHA that identifies the gender of face images unrecognized by existing gender classifiers
Zhu et al. Recognizing composite daily activities from crowd-labelled social media data
Fraser et al. Enticing notification text & the impact on engagement
CN106446969A (zh) 用户识别的方法及装置
KR20180010147A (ko) 사용자 맞춤식 가치 정보 검색 및 소셜 네트워크 구성 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190920

WD01 Invention patent application deemed withdrawn after publication