RU2621005C2 - Резюмирование потоков сообщений - Google Patents

Резюмирование потоков сообщений Download PDF

Info

Publication number
RU2621005C2
RU2621005C2 RU2013158714A RU2013158714A RU2621005C2 RU 2621005 C2 RU2621005 C2 RU 2621005C2 RU 2013158714 A RU2013158714 A RU 2013158714A RU 2013158714 A RU2013158714 A RU 2013158714A RU 2621005 C2 RU2621005 C2 RU 2621005C2
Authority
RU
Russia
Prior art keywords
message flow
message
electronic messages
user
messages
Prior art date
Application number
RU2013158714A
Other languages
English (en)
Other versions
RU2013158714A (ru
Inventor
Николас КОЛДУЭЛЛ
Салиха АЗЗАМ
ДЕЛЬ КАРПИО Диего ПЕРЕС
Е-И Ван
Ичжэн ЦАЙ
Майкл ГЕЙМОН
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2013158714A publication Critical patent/RU2013158714A/ru
Application granted granted Critical
Publication of RU2621005C2 publication Critical patent/RU2621005C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Abstract

Изобретение относится к электронной связи. Технический результат – эффективное резюмирование потоков сообщений электронной связи. Cпособ автоматического резюмирования электронного потока сообщений, содержащий этапы, где принимают поток сообщений, состоящий из электронных сообщений, обрабатывают электронные сообщения принятого потока сообщений, чтобы идентифицировать текстовые компоненты, причем текстовые компоненты включают в себя фразы в электронных сообщениях, выбирают по меньшей мере два из электронных сообщений для использования при генерировании резюме потока сообщений, отбрасывают из выбранных электронных сообщений электронные сообщения, являющиеся дубликатами других выбранных электронных сообщений, ранжируют выбранные электронные сообщения на основе критериев ранжирования, обрабатывают текстовые компоненты для идентификации ключевых слов на основе ранжирования выбранных электронных сообщений, генерируют резюме потока сообщений, содержащее часть ключевых слов и текстовых компонентов, при этом ключевые слова и текстовые компоненты выбираются на основе ранжирования выбранных электронных сообщений. 3 н. и 17 з.п. ф-лы, 6 ил.

Description

Уровень техники
Во многих деловых, социальных и академических предприятиях электронная почта обычно выполняет функцию основного средства связи между членами предприятия, а также между членами предприятия и людьми вне предприятия. К сожалению, когда пользователи электронной почты принимают десятки или даже сотни писем электронной почты, это может их ошеломить, и у них появятся сложности в приоритезации того, какие сообщения электронной почты прочесть первыми или иным образом обработать. Обычно пользователи хотят быстро найти диалоги электронной почты, ассоциированные с задачами, вопросами, приглашениями на собрания и т.п. Как только некоторый диалог электронной почты или поток сообщений идентифицирован как имеющий желаемую информацию, пользователи хотят перейти непосредственно к самым важным частям данного элемента электронной почты или системы сообщений. Чем быстрее пользователи могут найти и прочесть надлежащие элементы электронной почты или системы сообщений, тем проще им справляться с переизбытком писем электронной почты и сообщений.
Настоящее изобретение было выполнено в отношении этих и других соображений.
Сущность изобретения
Варианты осуществления настоящего изобретения решают вышеупомянутые и другие проблемы путем автоматического резюмирования потоков сообщений электронной связи. Согласно вариантам осуществления, письма электронной почты, текстовые сообщения, мгновенные сообщения, задачи, вопросы и ответы, приглашения на собрание, элементы календаря и т.п. обрабатываются посредством комбинации обработки естественного языка и эвристики. Для некоторого потока сообщений, например, потока электронной почты, ассоциированного с некоторой задачей, генерируется текстовое резюме потока для выделения самого важного текста в потоке. Текстовое резюме представляется пользователю в визуальном пользовательском интерфейсе для обеспечения возможности пользователю быстро понять смысл или значимость потока.
Подробности одного или нескольких вариантов осуществления излагаются на сопроводительных чертежах и в описании, приведенном ниже. Другие признаки и преимущества станут очевидны из чтения последующего подробного описания и просмотра ассоциированных чертежей. Следует понимать, что последующее подробное описание является только объяснительным и не ограничивает заявляемое изобретение.
Это краткое описание сущности изобретения предоставлено для представления подборки концепций в упрощенной форме, которые дополнительно описываются ниже в подробном описании. Это краткое описание сущности изобретения не предназначено для определения ключевых признаков или существенных признаков заявляемого изобретения, как не предназначено и для помощи в определении объема заявляемого изобретения.
Краткое описание чертежей
Сопроводительные чертежи, которые включаются сюда и составляют часть этого раскрытия, иллюстрируют различные варианты осуществления настоящего изобретения. На чертежах:
Фиг.1A изображает снимок экрана электронного пользовательского интерфейса, показывающего поток сообщений и показывающего резюме сообщений, автоматически генерируемое для потока сообщений.
Фиг.1B изображает снимок экрана электронного пользовательского интерфейса для обеспечения возможности пользователю одобрить, отклонить или модифицировать предварительное резюме потока сообщений.
Фиг.2 изображает архитектуру системы для автоматического резюмирования электронного потока сообщений.
Фиг.3 изображает поток процесса для автоматического резюмирования электронного потока сообщений.
Фиг.4 изображает архитектуру системы для автоматического резюмирования электронного потока сообщений.
Фиг.5 изображает структурную схему системы, включающей в себя вычислительное устройство, посредством которого варианты осуществления изобретения могут осуществляться на практике.
Подробное описание
Как описано выше, варианты осуществления настоящего изобретения направлены на автоматическое резюмирование потоков электронных сообщений и для обеспечения резюме одного или нескольких элементов потока электронных сообщений в компоненте пользовательского интерфейса для просмотра одним или несколькими пользователями, ассоциированными с элементами потока сообщений. Последующее описание ссылается на сопроводительные чертежи. Всегда, когда возможно, аналогичные ссылочные позиции используются на чертежах и в последующем описании для обозначения аналогичных или подобных элементов. Несмотря на то, что описываться могут конкретные варианты осуществления изобретения, возможны модификации, адаптации и другие реализации. Например, замещения, добавления или модификации могут выполняться над элементами, иллюстрируемыми на чертежах, и способы, описанные здесь, могут модифицироваться путем замещения, переупорядочивания или добавления этапов к раскрываемым способам. Соответственно, последующее подробное описание не ограничивает изобретение. Вместо этого, надлежащий объем изобретения определен прилагаемой формулой изобретения.
Обращаясь теперь к чертежам, на которых аналогичные ссылочные номера представляют аналогичные элементы на нескольких чертежах, будут описаны аспекты настоящего изобретения и примерные операционные среды. Несмотря на то, что изобретение будет описано в общем контексте программных модулей, которые исполняются в сочетании с прикладной программой, которая запущена в операционной системе на персональном компьютере, специалисты в данной области техники поймут, что изобретение может также осуществляться в комбинации с другими программными модулями.
В общем случае, программные модули включают в себя подпрограммы, программы, компоненты, структуры данных и другие типы структур, которые выполняют конкретные задачи или осуществляют конкретные абстрактные типы данных. Кроме того, специалисты в данной области техники поймут, что изобретение может осуществляться на практике с другими конфигурациями компьютерной системы, включая карманные устройства, многопроцессорные системы, микропроцессорную или программируемую бытовую электронику, миникомпьютеры, мэйнфреймы и т.п. Изобретение может также осуществляться на практике в распределенных вычислительных средах, где задачи выполняются удаленными обрабатывающими устройствами, которые соединены посредством сети связи. В распределенной вычислительной среде программные модули могут находиться как в локальных, так и в удаленных устройствах хранения памяти.
Фиг.1A изображает снимок экрана электронного пользовательского интерфейса, показывающий поток сообщений и показывающий резюме сообщений, автоматически генерируемое для потока сообщений. На фиг.1A отображается поток сообщений электронной почты, показывающий четыре последовательных сообщения электронной почты, составляющих поток сообщений, ассоциированный с некоторой темой или вопросом. Примерные элементы электронной почты, изображенные на фиг.1A, предназначены только для иллюстрации и не накладывают ограничений на другие типы элементов электронной связи, которые могут группироваться друг с другом в виде потока сообщений. Например, элементы электронного общения, изображенные на фиг.1A, могут иллюстрировать поток сообщений, состоящий из различных текстовых сообщений, отображаемых на карманном вычислительном устройстве, элементы общения могут иллюстрировать поток сообщений, состоящий из элементов общения с доски обсуждений, например форума для разговоров на основе Интернета и т.п. То есть варианты осуществления настоящего изобретения могут задействоваться для обеспечения резюме сообщений для любого типа элементов электронного общения, как описано ниже.
Также со ссылкой на фиг.1A, в типичной ситуации некоторый пользователь может принимать десятки или сотни сообщений электронной почты, текстовых сообщений, сообщений форума обсуждений и т.п. за любой заданный период времени, и каждое из принятых сообщений может относиться к множеству различных вопросов. Например, электронные сообщения могут включать в себя задачи, которые необходимо выполнить пользователю, собрания, которые необходимо посетить пользователю, вопросы к пользователю, ответы пользователю, общую информацию о некотором предстоящем событии и т.п. Если пользователь заинтересован во всех сообщениях, ассоциированных с некоторой заданной темой или вопросом, пользователь может выполнить функцию поиска для извлечения всех сообщений или элементов почты, относящихся к данной теме, например некоторому проекту, с которым пользователь ассоциирован. К сожалению, после того как пользователь выполняет функцию поиска, пользователь опять может получить большой список элементов электронной почты или других подобных сообщений, относящихся к теме, по которой осуществлен поиск.
Согласно вариантам осуществления изобретения, резюме сообщений может генерироваться для группы сообщений, например, элементов электронной почты, ассоциированных с некоторой заданной темой, и резюме сообщений может отображаться в компоненте пользовательского интерфейса для обеспечения возможности пользователю быстро понять природу и значимость потока сообщений. Как изображено на фиг.1A, отображается примерный поток сообщений, состоящий из четырех элементов электронной почты. Следует понимать, что в типичной среде электронной почты пользователь может получить десятки или даже сотни элементов электронной почты, сгруппированных друг с другом в поток сообщений, в результате поиска по некоторой теме, например, поиска по некоторому проекту.
Также со ссылкой на фиг.1A, каждый из примерных элементов электронной почты, отображаемых в примерном пользовательском интерфейсе электронной почты, ассоциирован с общим проектом "проект AB". Согласно вариантам осуществления настоящего изобретения и как будет описано ниже, извлекается информация о каждом из элементов общения, содержащихся в потоке общения, и генерируется резюме сообщений. Как изображено на фиг.1A, пользовательский интерфейс 130 резюме сообщений затем может отображаться пользователю и содержать краткое резюме потока сообщений. Например, со ссылкой на пользовательский интерфейс 130, краткое резюме сообщений "Планирование и документы по проекту AB" иллюстрируется в компоненте 130 пользовательского интерфейса. Таким образом, после того как пользователь выполняет поиск по сообщениям, например, элементам электронной почты, ассоциированным с некоторой заданной темой, резюме сообщений, иллюстрируемое в компоненте 130 пользовательского интерфейса, может автоматически отображаться, чтобы дать возможность пользователю быстро понять природу и значимость потока общения. Например, пользователь может отсортировать свои элементы электронной почты на основе некоторого отправителя элементов электронной почты или на основе некоторого периода времени, в течение которого принимаются элементы электронной почты, и пользователь может не понимать конкретную значимость получающегося потока. Однако резюме сообщений, отображаемое пользователю в компоненте 130 пользовательского интерфейса, может быть использовано для обеспечения резюме сообщений пользователю для обеспечения возможности пользователю узнать значимость элементов потока сообщений с первого взгляда, быстро просмотрев резюме сообщений, отображаемое пользователю в компоненте 130 пользовательского интерфейса резюме сообщений.
Согласно одному варианту осуществления, перед тем как резюме потока сообщений утверждается, предварительное резюме потока может быть представлено пользователю для одобрения, отклонения или модификации. Со ссылкой на фиг.1B, компонент 140 пользовательского интерфейса включает в себя примерный заголовок "Резюме потока сообщений" для указания пользователю, что предварительное резюме потока сообщений представляется для просмотра. Подзаголовок 145, такой как "Далее следует предлагаемое резюме потока сообщений", может быть обеспечен над текстовым окном или полем 150, в котором отображается указываемое предварительное резюме потока. Например, в текстовом окне или поле 150, изображенном на фиг.1B, отображается предварительное резюме "Документы и планирование по проекту AB". Если пользователь одобряет предварительное резюме, оно будет использовано в качестве резюме для ассоциированного потока общения. Если пользователь отклоняет предварительное резюме, может быть обеспечено измененное резюме. И, если пользователь предпочитает другое резюме, пользователь может ввести заменяющее резюме в текстовое окно/поле 155, и введенное пользователем заменяющее резюме будет использовано в качестве резюме для ассоциированного потока общения.
Фиг.2 изображает системную архитектуру системы 200 резюмирования потока сообщений для автоматического резюмирования электронного потока сообщений. Компонент 202 потоков сообщений и метаданных иллюстрирует одну или несколько зон хранения в памяти, в которых могут сохраняться потоки сообщений, сообщения, составляющие потоки сообщений, и элементы метаданных, ассоциированные с потоками сообщений, и из которых может быть получена информация о потоках сообщений для использования в генерировании резюме для потоков сообщений. Например, сообщения, изображенные на фиг.1, могут сохраняться в архиве 202, и элементы метаданных, например, идентификация отправителей сообщений, идентификация получателей сообщений, даты/время передачи и получения сообщений, строки темы, ручным образом введенные для любых сообщений, составляющих потоки сообщений, сгенерированные и сохраненные названия тем для потоков сообщений, взаимосвязь между некоторым потоком сообщений или сообщениями, составляющими поток сообщений, и другими сообщениями или другими потоками сообщений и т.п. могут быть получены.
Компонент 204 анализатора потока сообщений иллюстрирует приложение или модуль, функционирующий для обработки принятых элементов потока сообщений для генерирования резюме потока сообщений. Принятые потоки сообщений и метаданные анализируются и форматируются по необходимости для текстовой обработки, описанной ниже. Согласно вариантам осуществления, анализ потока сообщений может выполняться средством разбора (парсером) текста, функционирующим для разбора текста, содержащегося в извлеченных потоках сообщений и ассоциированных метаданных, для переработки текста в один или несколько текстовых компонентов (например, предложений и терминов, составляющих одно или несколько предложений). Например, если потоки сообщений и ассоциированные метаданные форматированы согласно языку структурированных данных, например расширяемому языку разметки (XML), анализ потока сообщений может включать в себя разбор извлеченных потоков сообщений и ассоциированных метаданных согласно ассоциированному языку структурированных данных для обработки текста, как описано здесь. В другом примере потоки сообщений и ассоциированные метаданные могут быть извлечены из сетевого источника, такого как форум разговоров на основе Интернета, где извлеченный текст может быть форматирован согласно такому форматированию, как язык гипертекстовой разметки (HTML). Согласно вариантам осуществления, анализ потока сообщений может включать в себя форматирование извлеченных потоков сообщений и ассоциированных метаданных из такого источника, чтобы они могли обрабатываться для тем обсуждений, как описано здесь.
Текст, включенный в сообщения, составляющие поток сообщений, затем может обрабатываться для использования в генерировании резюме потока сообщений. Может задействоваться приложение обработки текста, в результате чего текст разбивается на один или несколько текстовых компонентов для определения того, может ли принятый/извлеченный текст содержать термины, которые могут быть сформированы в названии темы для потока сообщений. Разбиение текста на один или несколько текстовых компонентов может включать в себя разбиение текста на отдельные предложения, за чем следует разбиение отдельных предложений на отдельные лексемы, например слова, цифровые строки и т.д.
Такая обработка текста широко известна специалистам в данной области техники и может включать в себя разбиение фрагментов текста на отдельные предложения и отдельные лексемы согласно известным параметрам. Например, знаки препинания и выделение прописными буквами, содержащиеся во фрагменте текста, могут задействоваться для определения начала и конца предложения. Пробелы, содержащиеся между фрагментами текста, могут задействоваться для определения разрывов между отдельными лексемами, например отдельными словами, содержащимися в отдельных предложениях. Буквенно-цифровые строки, следующие известным шаблонам, например, пять цифр, ассоциированных с почтовыми индексами, могут задействоваться для определения фрагментов текста. Дополнительно, изначально определенные предложения или лексемы предложения могут передаваться одной или нескольким программам распознания для сравнения изначально определенных предложений или лексем предложения с базами данных известных предложений или лексем для дополнительного определения отдельных предложений или лексем. Например, слово, содержащееся в некотором заданном предложении, может передаваться базе данных для определения того, является ли слово именем человека, названием города, названием страны, или является ли некоторая лексема известным сокращением, торговым наименованием или подобным. Следует понимать, что множество различных средств может быть задействовано для сравнения предложений или лексем предложений с известными словами или другими буквенно-цифровыми строками для дополнительного определения этих текстовых элементов. Например, со ссылкой на примерные сообщения электронной почты, изображенные на фиг.1, обработка текста может включать в себя разбиение каждого из почтовых сообщений на отдельные слова, которые могут задействоваться в ассоциации с другими свойствами, получаемыми для примерных элементов почты в автоматическом генерировании резюме для потока.
Компонент 206 извлечения признаков иллюстрирует сбор признаков элементов общения, извлеченных из каждого из сообщений, составляющих некоторый поток сообщений, для которого будет генерироваться резюме потока сообщений для представления пользователю через компонент 130 пользовательского интерфейса. Для любого заданного потока сообщений, имеющего некоторое количество элементов обсуждения, различные признаки и свойства ассоциированы с каждым элементом для обеспечения полезной информации в резюмировании значимости элемента по отношению к другим элементам в потоке сообщений. Например, свойства и признаки, которые могут быть извлечены из каждого элемента потока сообщений, включают в себя идентификацию отправителя элемента общения, идентификацию получателя элемента общения, дату/время передачи элемента общения, дату/время передачи и получения по отношению к другим элементам общения, уровень важности, ассоциированный с элементами общения, флаги, присоединенные к элементам общения, элементы содержимого, присоединенные к элементам общения и т.п.
Также со ссылкой на фиг.2, другие признаки, извлеченные из элементов общения, составляющих поток сообщений, включают в себя элементы самостоятельного содержимого, содержащиеся в элементах потока общения. Например, задачи 208 могут встраиваться в элементы потока сообщений и могут иметь полезную информацию, которая может быть использована для генерирования резюме потока сообщений. Информация о собраниях, например приглашения 210 на собрание, аналогичным образом может обеспечивать полезную информацию, которая может быть использована для генерирования резюме потока сообщений, например, строка темы, ассоциированная с приглашением на собрание, которая может включать в себя информацию, которая резюмирует причину для приглашения на собрание. Вопросы и ответы 212, встроенные в текст, содержащийся в элементах электронной почты, текстовых сообщениях или других способах обмена сообщениями, подобным образом могут быть использованы для извлечения полезной информации, которая может быть использована для резюмирования потока сообщений, состоящего из различных элементов общения.
Множество различных других признаков 214 элементов общения может также задействоваться системой 200 резюмирования потока сообщений для получения информации для генерирования и представления резюме потока сообщений, как изображается в компоненте 130 пользовательского интерфейса. Например, в то время как первый поток сообщений может состоять из элементов электронной почты, информация может быть получена системой 200 от других источников, например источника текстовых сообщений, которые могут включать в себя информацию, полезную в генерировании резюме для потока сообщений, состоящего из элементов электронной почты. Дополнительно, другие источники информации, например списки контактов, календари пользователей, идентифицированных в потоке сообщений, списки задач пользователей, идентифицированных в потоке сообщений и т.п. могут задействоваться для сбора информации, которая может быть использована для генерирования резюме потока сообщений, как описано здесь.
Компонент 216 выбора/ранжирования иллюстрирует определение, выполняемое системой 200, в отношении важности, веса или значимости различных признаков и свойств, извлеченных из элементов электронного общения, как описано выше. Например, во время операции выбора/ранжирования дублированные признаки могут удаляться, признаки, рассматриваемые как незначимые, например, элементы электронной почты, не имеющие текста, ассоциированного с другими элементами электронной почты в потоке сообщений, могут удаляться, устарелые приглашения на собрание, которые были замещены последующими приглашениями на собрание, могут удаляться, и более свежие элементы обсуждений в слишком длинном потоке сообщений могут повышаться до более высокой значимости в потоке сообщений, и признаки, извлекаемые из этих элементов, могут получать более высокую значимость в генерировании резюме потока сообщений. Например, временная шкала потока сообщений на основе дат и времени отправки/получения может быть использована для первоначального упорядочивания элементов потока сообщений для будущего извлечения и анализа.
Компонент 220 резюмирования текста иллюстрирует генерирование резюме потока сообщений, состоящего из одного или нескольких признаков элементов общения, например слов, фраз, цифровых строк и т.п., извлеченных из различных элементов потока общения, в резюме потока сообщений, который может быть представлен пользователям, ассоциированным с потоком сообщений. Компонент 225 пользовательского интерфейса иллюстрирует представление резюме потока сообщений пользователям потока сообщений для обеспечения возможности пользователям быстро и легко понять природу и значимость потока сообщений, который они просматривают.
Фиг.3 изображает поток процесса для автоматического резюмирования электронного потока сообщений. Способ 300 начинается с операции 305 начала и переходит к операции 310, где потоки сообщений и ассоциированные метаданные получаются от различных источников, на которых элементы потока сообщений могут сохраняться. Например, элементы электронной почты и ассоциированные метаданные могут сохраняться на сервере электронной почты, который обеспечивает хранилище электронной почты для больших организаций. Альтернативно, элементы электронной почты, которые могут задействоваться для генерирования резюме потока электронной почты, могут сохраняться на множестве различных серверов электронной почты или в носителях данных, находящихся в распределенной вычислительной среде, где некоторые элементы находятся на одном сервере, некоторые элементы находятся на другом сервере и так далее. В другом примере текстовые сообщения, которые могут задействоваться для генерирования резюме потока сообщений, могут быть распределены по серверам хранения, управляемым различными поставщиками услуг связи, отвечающими за обеспечение услуг обмена текстовыми сообщениями различным пользователям. В другом примере потоки сообщений и метаданные могут извлекаться из услуг разговоров на основе Интернета, где сообщения, содержимое сообщений и метаданные сообщений могут сохраняться в одной или во множестве систем служб хранения.
Согласно одному варианту осуществления, операция 310 выполняется после того, как пользователь производит некую операцию для составления некоторого потока сообщений, для которого должно быть сгенерировано резюме потока сообщений. Например, если пользователь ассоциирован с командой проекта, которая высылала и принимала множество различных сообщений электронной почты в отношении некоторого аспекта проекта, пользователь может желать произвести поиск всех писем электронной почты, ассоциированных с этим аспектом проекта. Как только пользователь вводит критерий поиска какого-либо типа, пользователь может получить большое количество элементов электронной почты, имеющих некоторую значимость для желаемого аспекта проекта. Например, список сообщений электронной почты, изображенный на фиг.1, может отображаться пользователю в результате поиска по "проекту AB", идентифицированному в каждом из примерных элементов электронной почты. К сожалению, пользователь может оказаться вынужден прочесть многочисленные элементы электронной почты, некоторые из которых могут не иметь большой значимости для пользователя в определении более конкретной значимости или природы потока общения. Таким образом, на операции 310 поток общения, идентифицированный поиском пользователя, который дает в результате набор элементов общения, составляющих поток, извлекается для анализа и генерирования резюме потока сообщений, как описано ниже.
На операции 315 текст и метаданные, извлеченные из каждого из элементов общения, содержащихся в потоке сообщений, анализируются, форматируются и обрабатываются в отдельные термины, например слова, фразы, цифровые строки и т.д., как описано выше со ссылками на анализатор 204 потока сообщений. Отдельные термины, извлеченные из элементов потока, могут быть использованы для конструирования резюме сообщений для потока.
На операции 320 признаки из элементов общения, составляющих извлеченный поток общения, извлекаются для использования в генерировании резюме потока общения. Как описано выше со ссылками на фиг.2, извлечение признаков на операции 320 включает в себя извлечение терминов и информации из обработанного текста и метаданных для каждого из элементов общения, которые могут быть полезны в определении отношения между элементами общения и затем в окончательном генерировании резюме потока общения. Следует понимать, что извлеченные признаки из элементов общения и ассоциированных метаданных могут сохраняться временным образом для выбора и ранжирования.
На операции 325 извлеченные признаки из элементов общения и ассоциированных метаданных выбираются и ранжируются для использования в генерировании резюме потока сообщений. Как описано выше, выбор одного или нескольких признаков может включать в себя отбрасывание конкретных признаков, которые расцениваются как дублированные или незначимые. Например, если одна и та же терминология используется в двух последовательных элементах общения, терминология одного из элементов общения может отбрасываться. В другом примере, если элемент общения, составляющий поток общения, не включает в себя термины или метаданные, общие с другими элементами общения, то элемент общения и его извлеченные признаки могут отбрасываться. После того, как набор признаков выбран, выбранные признаки могут ранжироваться в порядке важности. Например, более свежие элементы общения могут ранжироваться выше более старых элементов общения. Устарелые приглашения на собрание и информация, содержащаяся в них, могут отбрасываться в пользу более актуальных приглашений на собрание и информации, содержащейся в них.
На операции 330 выполняется резюмирование признаков текста, извлеченных из различных элементов общения, составляющих поток общения. На основе выбора и ранжирования, выполняемых на операции 325, группирование ключевых слов или других терминов, извлеченных из потока сообщений, может перерабатываться в резюме потока сообщений, как иллюстрируется выше на фиг.1. Например, снова со ссылкой на фиг.1, каждая из примерных элементов электронной почты включает в себя термины "проект" и "AB". Дополнительно, термин "документы" возникает в непосредственной близости с терминами "проект" и "AB". Наконец, некоторое количество элементов электронной почты включают в себя признаки планирования, которые могут быть ассоциированы с элементами задач и элементами календаря, извлеченными системой 200, когда собирался поток электронной почты. В результате, текстовое резюме "планирования и документов по проекту AB" генерируется для примерного потока сообщений.
Пример резюме потока сообщений "планирования и документов по проекту AB" упрощен в целях иллюстрации. Согласно вариантам осуществления, извлеченное и представленное резюме потока сообщений может включать в себя использование набора предложений или фраз, извлеченных из проанализированных элементов электронной почты, текстовых сообщений, элементов задач, элементов календаря и т.п., в качестве резюме ассоциированного потока. То есть представленное резюме в компоненте 130 пользовательского интерфейса может включать в себя одно или несколько предложений, извлеченных из потока сообщений, одну или несколько задач, извлеченных из средства хранения задач, один или несколько элементов планирования собраний, извлеченных из приложения календаря в ассоциации с потоком сообщений, ответы на вопросы, поставленные в потоке сообщений, или комбинации этих элементов, все из которых встречаются или ассоциированы с некоторым потоком сообщений. Например, резюме, представленное в компоненте 130 пользовательского интерфейса, может включать в себя пару предложений потока, элемент задачи и элемент календаря в качестве резюме ассоциированного потока.
На операции 330, согласно одному варианту осуществления, изначально сгенерированное резюме потока сообщений может быть представлено пользователю перед установлением изначально сгенерированного резюме в качестве окончательного резюме потока сообщений для примерного потока сообщений. Представление предварительного резюме потока сообщений может быть представлено пользователю в компоненте пользовательского интерфейса, как иллюстрируется выше на фиг.1B. Если пользователь одобряет представленный вариант потока сообщений, то вариант потока сообщений будет сохранен и представлен в качестве окончательного резюме потока сообщений. Альтернативно, пользователю может быть предоставлено поле 155, как иллюстрируется выше на фиг.1B, для обеспечения возможности пользователю ввести предпочтительное резюме потока сообщений, которое может замещать резюме потока сообщений, рекомендованное системой 200. Альтернативно, предварительное резюме потока сообщений, сгенерированное системой 200, может быть автоматически представлено пользователям потока сообщений в компоненте 130 пользовательского интерфейса, иллюстрируемого выше на фиг.1A, без взаимодействия с пользователем.
На операции 335 резюме сообщений, сгенерированное системой 200, или резюме сообщений, модифицированное или одобренное пользователем на операции 330, отображается пользователю в компоненте 130 пользовательского интерфейса резюме сообщений, как иллюстрируется и описывается выше со ссылками на фиг.1A. Следует понимать, что способ генерирования резюме потока сообщений может выполняться системой 200 каждый раз, когда поток сообщений получается некоторым конкретным пользователем или ранее сгенерированное резюме потока сообщений может быть получено из средства хранения и может быть представлено пользователю. Согласно одному варианту осуществления, каждый раз, когда дополнительные элементы обсуждения добавляются к потоку сообщений, способ 300 может выполняться повторно с учетом признаков дополнительных элементов обсуждения, которые могли быть добавлены в поток сообщений путем добавления нового элемента обсуждения. После того, как резюме потока сообщений представляется пользователю посредством компонента пользовательского интерфейса, описанного выше, способ заканчивается на операции 340.
Фиг.4 изображает архитектуру системы для обеспечения резюме потоков сообщений различным клиентским устройствам после генерирования, описанного выше. Как описано ранее, автоматическая система 420 резюме потока сообщений может генерировать резюме потока из потоков сообщений и метаданных, извлеченных с использованием множества различных каналов связи и хранилищ. Информация и признаки, пригодные для генерирования резюме потоков сообщений, могут также сохраняться в различных каналах связи или хранилищах другого типа. Например, элементы общения из состава потока сообщений, метаданные или информация признаков могут сохраняться с использованием служб 422 каталогов, веб-порталов 424, служб 426 почтовых ящиков, хранилищ 428 мгновенных сообщений и сайтов 430 социальных сетей. Автоматическая система 420 резюме потока сообщений может использовать любой из этих типов систем или подобное для сохранения резюме потоков сообщений в средстве 416 хранения резюме потоков. Сервер 412 может обеспечивать резюме потоков сообщений клиентам. В качестве одного примера, сервером 412 может быть веб-сервер, обеспечивающий резюме потоков через сеть. Сервер 412 может обеспечивать онлайн-резюме потоков через Интернет клиентам посредством сети 407. Примеры клиентов, которые могут получать резюме потоков, включают в себя вычислительное устройство 401, которое может включать в себя любой универсальный персональный компьютер, планшетное вычислительное устройство 403 и/или мобильное вычислительное устройство 405, которое может включать в себя интеллектуальные телефоны. Любое из этих устройств может получать резюме потоков из хранилищ 416резюме потоков.
Как описано выше, варианты осуществления изобретения могут осуществляться посредством локальных и удаленных компьютерных систем и систем хранения данных, включая системы, иллюстрируемые и описанные со ссылками на фиг.1A, 1B, 2, 3 и 4. В соответствии с вариантами осуществления изобретения, вышеупомянутые память и блок обработки данных могут быть реализованы в вычислительном устройстве, таком как вычислительное устройство 500 с фиг.5. Согласно вариантам осуществления, вычислительное устройство может быть в форме персонального компьютера, серверного компьютера, карманного компьютера, интеллектуального телефона, планшета или слейт-устройства или любого другого устройства, выполненного с возможностью содержать и выполнять вычислительные компоненты и функциональные возможности, описанные здесь. Дополнительно, компоненты вычислительного устройства, описанные ниже, могут работать как вычислительная система, прошитая на программируемую микросхему. Любая подходящая комбинация аппаратных средств, программных средств или программно-аппаратных средств (firmware) может быть использована для реализации памяти и блока обработки данных. Например, память и блок данных обработки могут быть реализованы в вычислительном устройстве 500 или любых других вычислительных устройствах 518, в комбинации с вычислительным устройством 500, причем функциональные возможности могут объединяться через сеть в распределенную вычислительную среду, например, внутреннюю сеть или Интернет, для выполнения функций, описанных здесь. Вышеупомянутые система, устройство и процессоры являются примерами, и другие системы, устройства и процессоры могут содержать вышеупомянутые память и блок обработки данных в соответствии с вариантами осуществления изобретения. Кроме того, вычислительное устройство 500 может содержать операционную среду 100, описанную выше.
Со ссылками на фиг.5, система в соответствии с вариантами осуществления изобретения может включать в себя вычислительное устройство, такое как вычислительное устройство 500. В базовой конфигурации вычислительное устройство 500 может включать в себя по меньшей мере один блок 502 обработки данных и системную память 504. В зависимости от конфигурации и типа вычислительного устройства, системная память 504 может содержать, но не ограничивается, энергозависимую память (например оперативную память (RAM)), энергонезависимую память (например постоянную память (ROM)), флэш-память или любую комбинацию. Системная память 504 может включать в себя операционную систему 505, один или несколько программируемых модулей 506 и может включать в себя систему 200 обнаружения темы обсуждения, генерирования и хранения, имеющую достаточные исполняемые компьютером инструкции, которые при их исполнении выполняют функциональные возможности, описанные здесь. Операционная система 505, например, может подходить для управления работой вычислительного устройства 500. Кроме того, варианты осуществления изобретения могут осуществляться на практике в сочетании с графической библиотекой, другими операционными системами или любой другой прикладной программой и не ограничиваются каким-либо конкретным приложением или системой. Эта базовая конфигурация изображается на фиг.5 компонентами внутри пунктирной линии 508.
Вычислительное устройство 500 может иметь дополнительные признаки или функциональные возможности. Например, вычислительное устройство 500 может также включать в себя дополнительные устройства хранения данных (сменные и/или несменные), такие как, например, магнитные диски, оптические диски или ленты. Такое дополнительное средство хранения изображается на фиг.5 сменным средством 509 хранения и несменным средством 510 хранения. Вычислительное устройство 500 может также содержать соединение 516 связи, которое может обеспечивать возможность устройству 500 осуществлять связь с другими вычислительными устройствами 518, например, по сети в распределенной вычислительной среде, например, внутренней сети или Интернете. Соединение 516 связи является одним примером среды связи.
Как сказано выше, некоторое количество программных модулей и файлов данных может сохраняться в системной памяти 504, включая операционную систему 505. При исполнении в блоке 502 обработки данных, программируемые модули 506 могут включать в себя систему 200, 420 автоматического генерирования резюме потока сообщений, которая может представлять собой программные модули, содержащие достаточные исполняемые компьютером инструкции, которые при их исполнении выполняют функциональные возможности, описанные здесь. Вышеупомянутый процесс является примером, и блок 502 обработки данных может выполнять другие процессы. Другие программируемые модули, которые могут быть использованы в соответствии с вариантами осуществления настоящего изобретения, могут включать в себя приложения электронной почты и контактов, приложения обработки текстов, приложения расчетных таблиц, приложения баз данных, приложения слайдовых презентаций, прикладные программы рисования или компьютерной помощи и т.д.
В общем случае, в соответствии с вариантами осуществления изобретения, программные модули могут включать в себя подпрограммы, программы, компоненты, структуры данных и другие типы структур, которые могут выполнять конкретные задачи или которые могут осуществлять конкретные абстрактные типы данных. Кроме того, варианты осуществления изобретения могут осуществляться на практике другими конфигурациями компьютерных систем, включая портативные устройства, многопроцессорные системы, микропроцессорную или программируемую бытовую электронику, миникомпьютеры, мэйнфреймы и т.п. Варианты осуществления изобретения могут также осуществляться на практике в распределенных вычислительных средах, где задачи выполняются удаленными обрабатывающими устройствами, которые соединены по сети связи. В распределенной вычислительной среде программные модули могут находиться как в локальных, так и в удаленных устройствах хранения памяти.
Кроме того, варианты осуществления изобретения могут осуществляться на практике в электрической схеме, содержащей дискретные электронные элементы, корпусных или интегральных электронных микросхемах, содержащих логические вентили, схемы, задействующей микропроцессор, или на однокристальной микросхеме, содержащей электронные элементы или микропроцессоры. Варианты осуществления изобретения могут также осуществляться на практике с использованием других технологий с возможностью выполнения логических операций, таких как, например, И, ИЛИ и НЕ, включая, но не ограничиваясь, механические, оптические, струйные и квантовые технологии. Дополнительно, варианты осуществления изобретения могут осуществляться на практике внутри универсального компьютера или в любых других цепях или системах.
Варианты осуществления изобретения, например, могут осуществляться в виде компьютерного процесса (способа), вычислительной системы или в качестве промышленного изделия, такого как компьютерный программный продукт или машиночитаемый носитель. Компьютерным программным продуктом может быть компьютерный носитель данных, который читается компьютерной системой и на котором закодирована компьютерная программа из инструкций для исполнения компьютерного процесса. Соответственно, настоящее изобретение может осуществляться в аппаратных средствах и/или в программных средствах (включая программно-аппаратные средства, резидентные программные средства, микрокод и т.д.). Иными словами, варианты осуществления настоящего изобретения могут принимать форму компьютерного программного продукта на используемом компьютером или машиночитаемом носителе данных, имеющем используемый компьютером или машиночитаемый программный код, осуществленный в носителе для использования посредством или в объединении с системой исполнения инструкций. Используемым компьютером или машиночитаемым носителем может быть любой носитель, который может содержать, хранить, осуществлять связь, распространять или перемещать программу для использования посредством или в объединении с системой, аппаратом или устройством исполнения инструкций.
Термин "машиночитаемый носитель", используемый здесь, может включать в себя компьютерные носители данных. Компьютерные носители данных могут включать в себя энергозависимые и энергонезависимые, сменные и несменные носители, осуществленные любым способом или технологией для хранения информации, такой как машиночитаемые инструкции, структуры данных, программные модули или другие данные. Системная память 504, сменное средство 509 хранения и несменное средство 510 хранения являются примерами компьютерных носителей данных (т.е. средства хранения данных). Компьютерные носители данных могут включать в себя, но не ограничиваться, RAM, ROM, электрически стираемую постоянную память (EEPROM), флэш-память или другие технологии памяти, CD-ROM, универсальные цифровые диски (DVD) или другое оптическое средство хранения данных, магнитные кассеты, магнитную ленту, накопитель на магнитных дисках или другие магнитные устройства хранения данных или любой другой носитель, который может быть использован для сохранения информации и к которому может осуществлять доступ вычислительное устройство 500. Любой такой компьютерный носитель данных может входить в состав устройства 500. Вычислительное устройство 500 может также иметь устройство(-а) 512 ввода, такое как клавиатура, мышь, стилус, устройство звукового ввода, устройство сенсорного ввода и т.д. Устройство(-а) 514 вывода, такое как дисплей, динамики, принтер и т.д. могут также быть включены. Вышеупомянутые устройства являются лишь примерами, и могут быть использованы другие.
Термин "машиночитаемые носители", используемый здесь, может также включать в себя среды связи. Среды связи воплощают машиночитаемые инструкции, структуры данных, программные модули или другие данные в модулированном сигнале данных, таком как несущая волна или другой механизм переноса, и включают в себя любые среды доставки информации. Термин "модулированный сигнал данных" может описывать сигнал, который имеет одну или несколько характеристик, устанавливаемых или изменяемых таким образом, чтобы кодировать информацию в сигнал. В качестве примера и не ограничения, среды связи могут включать в себя проводные среды, такие как проводная сеть или прямое проводное соединение, и беспроводные среды, такие как акустические, радиочастотные (RF), инфракрасные и другие беспроводные среды.
Варианты осуществления настоящего изобретения, например, описаны выше со ссылками на структурные схемы и/или операционные иллюстрации способов, систем и компьютерных программных продуктов согласно вариантам осуществления изобретения. Функции/действия, отмеченные в блоках, могут происходить в порядке, отличном от показанного на какой-либо блок-схеме. Например, два блока, показанных последовательно, на самом деле могут исполняться по существу параллельно, или блоки могут иногда исполняться в обратном порядке, в зависимости от задействованных функциональных возможностей/действий.
Хотя были описаны конкретные варианты осуществления изобретения, могут существовать другие варианты осуществления. Кроме того, хотя варианты осуществления настоящего изобретения были описаны как ассоциированные с данными, сохраненными в памяти и других носителях информации, данные могут также сохраняться на или считываться с других типов машиночитаемых носителей, таких как вторичные устройства хранения данных, например жесткие диски, гибкие диски или CD-ROM, несущая волна из Интернета или другие формы RAM или ROM. Дополнительно, этапы раскрываемых способов могут быть модифицированы любым образом, в том числе путем переупорядочивания этапов и/или добавления или удаления этапов, без выхода за пределы сущности изобретения.
Все права, включая авторские права, на код, включаемый сюда, принадлежат и являются собственностью заявителя. Заявитель сохраняет за собой все права на код, включаемый сюда, и дает разрешение воспроизводить материал только в связи с воспроизведением выданного патента и ни для каких других целей.
Хотя описание включает в себя конкретные примеры, объем изобретения определяется нижеследующей формулой изобретения. Кроме того, хотя описание было описано на языке, характерном для структурных признаков и/или действий способов, формула изобретения не ограничивается признаками или действиями, описанными выше. В действительности, конкретные признаки и действия, описанные выше, раскрываются лишь в качестве примера для вариантов осуществления изобретения.

Claims (49)

1. Компьютерно-реализуемый способ автоматического резюмирования электронного потока сообщений, содержащий этапы, на которых
принимают поток сообщений, состоящий из электронных сообщений;
обрабатывают электронные сообщения принятого потока сообщений, чтобы идентифицировать текстовые компоненты, причем текстовые компоненты включают в себя фразы в электронных сообщениях;
выбирают по меньшей мере два из электронных сообщений для использования при генерировании резюме потока сообщений;
отбрасывают из выбранных электронных сообщений электронные сообщения, являющиеся дубликатами других выбранных электронных сообщений;
ранжируют выбранные электронные сообщения на основе критериев ранжирования, включающих в себя важность, вес или релевантность различных признаков и свойств, ассоциированных с каждым из выбранных электронных сообщений;
обрабатывают текстовые компоненты для идентификации ключевых слов на основе ранжирования выбранных электронных сообщений; и
генерируют резюме потока сообщений, содержащее часть ключевых слов и текстовых компонентов, при этом ключевые слова и текстовые компоненты выбираются на основе ранжирования выбранных электронных сообщений.
2. Способ по п. 1, дополнительно содержащий этап, на котором отображают сгенерированное резюме потока сообщений в компоненте пользовательского интерфейса для просмотра пользователем потока сообщений.
3. Способ по п. 2, в котором прием потока сообщений, составленного из электронных сообщений, включает в себя прием потока сообщений, составленного из электронных сообщений, в ответ на поиск по хранилищу электронных сообщений в соответствии с первым критерием поиска.
4. Способ по п. 3, в котором по приему второго потока сообщений, составленного из других электронных сообщений, генерируют второе резюме потока сообщений для этих других электронных сообщений.
5. Способ по п. 4, дополнительно содержащий этап, на котором отображают сгенерированное второе резюме потока сообщений в компоненте пользовательского интерфейса для просмотра пользователем потока сообщений.
6. Способ по п. 1, в котором перед генерированием резюме потока сообщений представляют предварительное резюме потока сообщений пользователю извлеченного потока сообщений, чтобы пользователь одобрил предварительное резюме потока как верное резюме потока сообщений.
7. Способ по п. 6, в котором, если пользователь одобряет предварительное резюме потока сообщений как верное резюме для потока сообщений, генерируют резюме потока сообщений из одобренного предварительного резюме потока сообщений.
8. Способ по п. 7, в котором, если пользователь не одобряет предварительное резюме потока сообщений как верное резюме для потока сообщений, принимают модифицированное резюме потока сообщений от пользователя и генерируют модифицированное резюме потока сообщений как исправленное резюме для потока сообщений.
9. Способ по п. 1, в котором выбор по меньшей мере двух из электронных сообщений для использования при генерировании резюме потока сообщений включает в себя исключение одного или более из электронных сообщений из использования при генерировании резюме потока сообщений, где исключаемые сообщения не содержат никаких признаков, релевантных потоку сообщений.
10. Способ по п. 1, в котором ранжирование выбранных электронных сообщений на основе критериев ранжирования дополнительно содержит ранжирование выбранных электронных сообщений на основе даты и времени, ассоциированных с каждым из выбранных электронных сообщений.
11. Способ по п. 1, дополнительно содержащий этап, на котором связывают генерируемое резюме потока сообщений с извлеченным потоком сообщений.
12. Способ по п. 11, дополнительно содержащий этап, на котором сохраняют сгенерированное резюме потока сообщений, связанное с извлеченным потоком сообщений, для последующего извлечения с извлеченным потоком сообщений.
13. Способ по п. 12, дополнительно содержащий этап, на котором перед генерированием резюме потока сообщений определяют, было ли имеющееся резюме потока сообщений уже сгенерировано для потока сообщений.
14. Способ по п. 13, в котором если для потока сообщений уже сгенерировано имеющееся резюме потока сообщений, определяют, были ли одно или более из электронных сообщений потока сообщений добавлены к потоку сообщений после того, как имеющееся резюме потока сообщений было сгенерировано для потока сообщений.
15. Способ по п. 14, в котором если одно или более из электронных сообщений потока сообщений были добавлены к потоку сообщений после того, как имеющееся резюме потока сообщений было сгенерировано для потока сообщений, определяют, требуется ли исправление имеющегося резюме потока сообщений, и если исправление имеющегося резюме потока сообщений требуется, исправляют имеющееся резюме потока сообщений включением в него части текстовых компонентов электронных сообщений, которые были добавлены к потоку сообщений после того, как имеющееся резюме потока сообщений было сгенерировано.
16. Способ по п. 1, в котором обработка электронных сообщений для идентификации текстовых компонентов дополнительно содержит разбиение электронных сообщений потока сообщений на текстовые компоненты.
17. Машиночитаемый носитель, содержащий машиноисполняемые инструкции, которыми при их исполнении компьютером выполняется способ автоматического резюмирования электронного потока сообщений, содержащий этапы, на которых
принимают поток сообщений, состоящий из электронных сообщений, в ответ на поиск по хранилищу электронных сообщений согласно первому критерию поиска;
обрабатывают электронные сообщения принятого потока сообщений для идентификации текстовых компонентов, составляющих электронные сообщения, причем текстовые компоненты включают в себя фразы в электронных сообщениях;
принимают выбор электронных сообщений;
отбрасывают выбранные электронные сообщения, являющиеся дубликатами других выбранных электронных сообщений, при этом отбрасываемые выбранные электронные сообщения являются последующими по отношению к другим выбранным электронным сообщениям, имеющим ту же самую терминологию;
ранжируют выбранные электронные сообщения на основе одного или более критериев ранжирования, включающих в себя важность, вес или релевантность различных признаков и свойств, ассоциированных с каждым из выбранных электронных сообщений;
обрабатывают текстовые компоненты для идентификации ключевых слов, релевантных потоку сообщений, на основе ранжирования выбранных электронных сообщений;
генерируют резюме потока сообщений, содержащее часть ключевых слов и текстовых компонентов, при этом ключевые слова и текстовые компоненты выбираются так, чтобы они содержали эту часть, основываясь на ранжировании выбранных электронных сообщений; и
отображают сгенерированное резюме потока сообщений в компоненте пользовательского интерфейса для просмотра пользователем потока сообщений.
18. Машиночитаемый носитель по п. 17, в котором
по приему второго потока сообщений, состоящего из других электронных сообщений, генерируют второе резюме потока сообщений для этих других электронных сообщений; и
отображают сгенерированное второе резюме потока сообщений в компоненте пользовательского интерфейса для просмотра пользователем потока сообщений.
19. Система для автоматического резюмирования электронного потока сообщений, содержащая
процессорное устройство; и
запоминающее устройство, содержащее машиноисполняемые инструкции, которые при их исполнении процессорным устройством предписывают системе:
принимать поток сообщений, состоящий из электронных сообщений;
обрабатывать электронные сообщения потока сообщений для идентификации текстовых компонентов, причем текстовые компоненты включают в себя фразы в электронных сообщениях;
принимать выбор электронных сообщений;
отбрасывать по меньшей мере одно выбранное электронное сообщение, являющееся дубликатом другого выбранного электронного сообщения;
ранжировать выбранные электронные сообщения на основе критериев ранжирования, включающих в себя важность, вес или релевантность различных признаков и свойств, ассоциированных с каждым из выбранных электронных сообщений;
обрабатывать текстовые компоненты для идентификации ключевых слов, релевантных потоку сообщений, на основе ранжированных электронных сообщений;
генерировать предварительное резюме потока сообщений, содержащее часть ключевых слов и текстовых компонентов, на основе ранжированных электронных сообщений;
представлять предварительное резюме потока сообщений пользователю, чтобы пользователь одобрил предварительное резюме потока как верное резюме потока сообщений;
если пользователь одобряет предварительное резюме потока сообщений, утверждают предварительное резюме потока сообщений в качестве верного резюме потока сообщений; и
если пользователь не одобряет предварительное резюме потока сообщений, принимают модифицированное резюме потока сообщений от пользователя и утверждают модифицированное резюме потока сообщений в качестве верного резюме потока сообщений.
20. Система по п. 19, при этом система дополнительно выполнена с возможностью отбрасывать одно или более электронных сообщений, которые не включают в себя ключевые слова.
RU2013158714A 2011-06-28 2012-06-22 Резюмирование потоков сообщений RU2621005C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/170,787 2011-06-28
US13/170,787 US9116984B2 (en) 2011-06-28 2011-06-28 Summarization of conversation threads
PCT/US2012/043848 WO2013003240A2 (en) 2011-06-28 2012-06-22 Summarization of conversation threads

Publications (2)

Publication Number Publication Date
RU2013158714A RU2013158714A (ru) 2015-07-10
RU2621005C2 true RU2621005C2 (ru) 2017-05-30

Family

ID=47391656

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013158714A RU2621005C2 (ru) 2011-06-28 2012-06-22 Резюмирование потоков сообщений

Country Status (11)

Country Link
US (1) US9116984B2 (ru)
EP (1) EP2727012A4 (ru)
JP (1) JP2014524089A (ru)
KR (1) KR101960115B1 (ru)
CN (2) CN106021387B (ru)
AU (1) AU2012275628B2 (ru)
BR (1) BR112013032004A2 (ru)
CA (1) CA2840485C (ru)
MX (1) MX2013015150A (ru)
RU (1) RU2621005C2 (ru)
WO (1) WO2013003240A2 (ru)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10984387B2 (en) 2011-06-28 2021-04-20 Microsoft Technology Licensing, Llc Automatic task extraction and calendar entry
US11468243B2 (en) * 2012-09-24 2022-10-11 Amazon Technologies, Inc. Identity-based display of text
US10096316B2 (en) * 2013-11-27 2018-10-09 Sri International Sharing intents to provide virtual assistance in a multi-person dialog
US9894114B2 (en) 2013-01-14 2018-02-13 International Business Machines Corporation Adjusting the display of social media updates to varying degrees of richness based on environmental conditions and importance of the update
US20150006510A1 (en) * 2013-06-28 2015-01-01 Vonage Network Llc Method and apparatus for providing conversation history generated from multiple communication channels
US10817496B2 (en) * 2013-11-05 2020-10-27 Hewlett Packard Enterprise Development Lp Forum inspection based on correlation rating of response poster
US10079013B2 (en) * 2013-11-27 2018-09-18 Sri International Sharing intents to provide virtual assistance in a multi-person dialog
US8781815B1 (en) 2013-12-05 2014-07-15 Seal Software Ltd. Non-standard and standard clause detection
US9977830B2 (en) * 2014-01-31 2018-05-22 Verint Systems Ltd. Call summary
KR20150138513A (ko) * 2014-05-29 2015-12-10 주식회사 카카오 채팅 메시지를 그룹화하기 위한 방법, 디바이스 및 서버
US9380010B2 (en) 2014-06-03 2016-06-28 International Business Machines Corporation Conversation branching for more efficient resolution
KR102254885B1 (ko) * 2014-06-03 2021-05-24 엘지전자 주식회사 이동 단말기 및 그 제어 방법
US9703862B2 (en) 2014-06-12 2017-07-11 International Business Machines Corporation Engagement summary generation
US9887952B2 (en) 2014-07-17 2018-02-06 International Business Machines Corporation Intelligently splitting text in messages posted on social media website to be more readable and understandable for user
US9906478B2 (en) * 2014-10-24 2018-02-27 International Business Machines Corporation Splitting posts in a thread into a new thread
US10388270B2 (en) 2014-11-05 2019-08-20 At&T Intellectual Property I, L.P. System and method for text normalization using atomic tokens
US10361981B2 (en) 2015-05-15 2019-07-23 Microsoft Technology Licensing, Llc Automatic extraction of commitments and requests from communications and content
US10033677B2 (en) 2015-06-11 2018-07-24 International Business Machines Corporation Tracking conversation threads among electronic communications
US9805025B2 (en) 2015-07-13 2017-10-31 Seal Software Limited Standard exact clause detection
US10783179B2 (en) 2015-08-03 2020-09-22 International Business Machines Corporation Automated article summarization, visualization and analysis using cognitive services
KR20170048964A (ko) 2015-10-27 2017-05-10 라인 가부시키가이샤 메시지 제공 방법, 장치, 및 컴퓨터 프로그램과, 표시 제어 방법, 장치 및 컴퓨터 프로그램
US10412029B2 (en) * 2015-12-11 2019-09-10 Microsoft Technology Licensing, Llc Providing rich preview of communication in communication summary
US9560152B1 (en) * 2016-01-27 2017-01-31 International Business Machines Corporation Personalized summary of online communications
US10410385B2 (en) 2016-02-19 2019-09-10 International Business Machines Corporation Generating hypergraph representations of dialog
US10361987B2 (en) * 2016-05-21 2019-07-23 Facebook, Inc. Techniques to convert multi-party conversations to an editable document
US10628474B2 (en) * 2016-07-06 2020-04-21 Adobe Inc. Probabalistic generation of diverse summaries
US10410006B2 (en) * 2016-08-15 2019-09-10 Blackberry Limited Method and apparatus for automatically storing and applying permissions to documents attached to text-based messages
CN106328135B (zh) * 2016-08-19 2019-10-18 北京儒博科技有限公司 一种基于语音的应用切换方法及装置
EP3315404B1 (en) 2016-10-25 2019-08-07 AeroMobil R&D, s. r. o. Configurable tail for flying car
EP3315400A1 (en) 2016-10-25 2018-05-02 AeroMobil R&D, s. r. o. Folding propeller
US11115359B2 (en) 2016-11-03 2021-09-07 Samsung Electronics Co., Ltd. Method and apparatus for importance filtering a plurality of messages
US10977247B2 (en) * 2016-11-21 2021-04-13 International Business Machines Corporation Cognitive online meeting assistant facility
EP3335916A1 (en) 2016-12-13 2018-06-20 AeroMobil R&D, s. r. o. Acceleration control for a convertible air - road vehicle
EP3335915B1 (en) 2016-12-13 2019-12-04 AeroMobil R&D, s. r. o. Stability control for operation of a convertible air - road vehicle
EP3335935B1 (en) 2016-12-13 2019-11-13 AeroMobil R&D, s. r. o. Configurable lights for flying car
EP3335914B1 (en) 2016-12-13 2019-11-13 AeroMobil R&D, s. r. o. Vehicle including control pedal arrangement
US11586341B2 (en) * 2017-02-15 2023-02-21 Google Llc Structured response summarization of electronic messages
US10509531B2 (en) 2017-02-20 2019-12-17 Google Llc Grouping and summarization of messages based on topics
EP3366570A1 (en) 2017-02-22 2018-08-29 AeroMobil R&D, s. r. o. Wing folding
EP3392068A1 (en) 2017-04-18 2018-10-24 AeroMobil R&D, s. r. o. Suspension system
EP3412560B1 (en) 2017-06-05 2020-02-12 AeroMobil R&D, s. r. o. Wing folding
US11699039B2 (en) 2017-06-28 2023-07-11 Microsoft Technology Licensing, Llc Virtual assistant providing enhanced communication session services
US10585991B2 (en) 2017-06-29 2020-03-10 Microsoft Technology Licensing, Llc Virtual assistant for generating personalized responses within a communication session
US10127323B1 (en) * 2017-07-26 2018-11-13 International Business Machines Corporation Extractive query-focused multi-document summarization
US10679627B2 (en) 2017-07-28 2020-06-09 Bank Of America Corporation Processing system for intelligently linking messages using markers based on language data
US10490193B2 (en) 2017-07-28 2019-11-26 Bank Of America Corporation Processing system using intelligent messaging flow markers based on language data
US10341129B2 (en) * 2017-08-19 2019-07-02 Johnson Manuel-Devadoss Method and system to provide the trending news stories to the plurality of groups based on the plurality of group members existing conversations
US10972299B2 (en) * 2017-09-06 2021-04-06 Cisco Technology, Inc. Organizing and aggregating meetings into threaded representations
US10083006B1 (en) * 2017-09-12 2018-09-25 Google Llc Intercom-style communication using multiple computing devices
US10587553B1 (en) * 2017-12-29 2020-03-10 Entefy Inc. Methods and systems to support adaptive multi-participant thread monitoring
CN108460149B (zh) * 2018-03-22 2021-05-18 平安科技(深圳)有限公司 文本数据处理方法、装置、设备及计算机可读存储介质
KR102131404B1 (ko) * 2018-03-27 2020-07-08 라인 가부시키가이샤 메시지 제공 방법, 장치, 및 컴퓨터 프로그램과, 표시 제어 방법, 장치 및 컴퓨터 프로그램
US11074284B2 (en) * 2018-05-07 2021-07-27 International Business Machines Corporation Cognitive summarization and retrieval of archived communications
US20190355352A1 (en) * 2018-05-18 2019-11-21 Honda Motor Co., Ltd. Voice and conversation recognition system
US10785185B2 (en) 2018-06-13 2020-09-22 International Business Machines Corporation Automated summary of digital group conversations
JP2020071534A (ja) * 2018-10-29 2020-05-07 エヌ・ティ・ティ・コムウェア株式会社 情報処理システム、情報処理方法及び情報処理プログラム
US11048880B2 (en) 2019-01-21 2021-06-29 Microsoft Technology Licensing, Llc Automatic summarization of content in electronic messages
US10810243B2 (en) * 2019-03-08 2020-10-20 Fuji Xerox Co., Ltd. System and method for generating abstractive summaries of interleaved texts
US11126796B2 (en) 2019-03-15 2021-09-21 Microsoft Technology Licensing, Llc Intelligent summaries based on automated learning and contextual analysis of a user input
US11070598B2 (en) 2019-04-23 2021-07-20 International Business Machines Corporation Automatic report and resolution generation from multi-platform communications
US10778630B1 (en) 2019-06-18 2020-09-15 International Business Machines Corporation Simulation engagement points for long running threads
US11238236B2 (en) * 2019-10-08 2022-02-01 International Business Machines Corporation Summarization of group chat threads
US11315568B2 (en) 2020-06-09 2022-04-26 International Business Machines Corporation Summarizing multi-modal conversations in a multi-user messaging application
KR20220023211A (ko) * 2020-08-20 2022-03-02 삼성전자주식회사 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법
US11449683B2 (en) 2020-11-24 2022-09-20 International Business Machines Corporation Disentanglement of chat utterances
US11727935B2 (en) 2020-12-15 2023-08-15 Optum Technology, Inc. Natural language processing for optimized extractive summarization
US11804241B2 (en) 2020-12-21 2023-10-31 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11316818B1 (en) 2021-08-26 2022-04-26 International Business Machines Corporation Context-based consolidation of communications across different communication platforms
US20230177256A1 (en) * 2021-12-07 2023-06-08 International Business Machines Corporation Role-Based Cross Data Source Actionable Conversation Summarizer
US20230370410A1 (en) * 2022-05-16 2023-11-16 Google Llc Email Summary and Completion Check
US20230376515A1 (en) * 2022-05-18 2023-11-23 Slack Technologies, Llc Generating summary documents for communications in a communication platform
US11710000B1 (en) * 2022-06-13 2023-07-25 Capital One Services, Llc Email rewrite and reorganization
US11741143B1 (en) 2022-07-28 2023-08-29 Optum, Inc. Natural language processing techniques for document summarization using local and corpus-wide inferences

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080082607A1 (en) * 2006-09-29 2008-04-03 Sastry Nishanth R Advanced discussion thread management using a tag-based categorization system
US7392280B2 (en) * 2001-11-27 2008-06-24 International Business Machines Corporation Method for summarization of threads in electronic mail
US20090031244A1 (en) * 2007-07-25 2009-01-29 Xobni Corporation Display of Communication System Usage Statistics
US20090164572A1 (en) * 2007-12-20 2009-06-25 Motorola, Inc. Apparatus and method for content item annotation

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2931553B2 (ja) * 1996-08-29 1999-08-09 株式会社エイ・ティ・アール知能映像通信研究所 話題処理装置
US6346952B1 (en) * 1999-12-01 2002-02-12 Genesys Telecommunications Laboratories, Inc. Method and apparatus for summarizing previous threads in a communication-center chat session
JP3830128B2 (ja) * 2001-01-12 2006-10-04 株式会社東芝 要約作成支援装置
US6820081B1 (en) 2001-03-19 2004-11-16 Attenex Corporation System and method for evaluating a structured message store for message redundancy
CN1169075C (zh) * 2001-04-29 2004-09-29 国家数字交换系统工程技术研究中心 一种电子邮件的自动处理方法及装置
US20030163537A1 (en) 2001-11-27 2003-08-28 International Business Machines Corporation Method and apparatus for handling conversation threads and message groupings as a single entity
KR100988153B1 (ko) 2002-03-29 2010-10-18 소니 주식회사 정보 검색 시스템, 정보 처리 장치 및 방법, 정보 검색장치 및 방법
US7599852B2 (en) 2002-04-05 2009-10-06 Sponster Llc Method and apparatus for adding advertising tag lines to electronic messages
US7299261B1 (en) * 2003-02-20 2007-11-20 Mailfrontier, Inc. A Wholly Owned Subsidiary Of Sonicwall, Inc. Message classification using a summary
US7421690B2 (en) * 2003-06-23 2008-09-02 Apple Inc. Threaded presentation of electronic mail
US20080235018A1 (en) 2004-01-20 2008-09-25 Koninklikke Philips Electronic,N.V. Method and System for Determing the Topic of a Conversation and Locating and Presenting Related Content
US7856469B2 (en) 2004-04-15 2010-12-21 International Business Machines Corporation Searchable instant messaging chat repositories using topic and identifier metadata
US8190999B2 (en) 2004-05-20 2012-05-29 International Business Machines Corporation System and method for in-context, topic-oriented instant messaging
US7941491B2 (en) * 2004-06-04 2011-05-10 Messagemind, Inc. System and method for dynamic adaptive user-based prioritization and display of electronic messages
US7707167B2 (en) * 2004-09-20 2010-04-27 Microsoft Corporation Method, system, and apparatus for creating a knowledge interchange profile
US8316315B2 (en) 2005-02-28 2012-11-20 Microsoft Corporation Automatically generated highlight view of electronic interactions
US7653627B2 (en) 2005-05-13 2010-01-26 Microsoft Corporation System and method for utilizing the content of an online conversation to select advertising content and/or other relevant information for display
US20070168445A1 (en) 2006-01-18 2007-07-19 Genty Denise M Method and apparatus for storing and retrieving conversations in an instant messaging system
US7899871B1 (en) 2006-01-23 2011-03-01 Clearwell Systems, Inc. Methods and systems for e-mail topic classification
US20070250576A1 (en) 2006-04-21 2007-10-25 Shruti Kumar Method and system for automatically providing an abstract of a response message in a subject line of the response message
US9092434B2 (en) 2007-01-23 2015-07-28 Symantec Corporation Systems and methods for tagging emails by discussions
CN100501745C (zh) * 2007-02-15 2009-06-17 刘二中 电子文本处理与检索的便捷方法和系统
US20080201434A1 (en) 2007-02-16 2008-08-21 Microsoft Corporation Context-Sensitive Searches and Functionality for Instant Messaging Applications
US20080208975A1 (en) 2007-02-23 2008-08-28 Olive Bentley J Methods, systems, and computer program products for accessing a discussion forum and for associating network content for use in performing a search of a network database
US20080281927A1 (en) * 2007-05-11 2008-11-13 Microsoft Corporation Summarization tool and method for a dialogue sequence
US8209617B2 (en) * 2007-05-11 2012-06-26 Microsoft Corporation Summarization of attached, linked or related materials
US7752279B2 (en) 2007-05-29 2010-07-06 Research In Motion Limited System for facilitating thread-based message prioritization
US7739261B2 (en) 2007-06-14 2010-06-15 Microsoft Corporation Identification of topics for online discussions based on language patterns
US8108398B2 (en) * 2007-06-29 2012-01-31 Microsoft Corporation Auto-summary generator and filter
US7761524B2 (en) 2007-08-20 2010-07-20 International Business Machines Corporation Automatically generated subject recommendations for email messages based on email message content
US8452789B2 (en) * 2007-10-15 2013-05-28 International Business Machines Corporation Searching a database
US7840551B2 (en) * 2007-11-01 2010-11-23 Oracle International Corporation Method and apparatus for automatically classifying data
US8024412B2 (en) * 2008-02-15 2011-09-20 Microsoft Corporation User interface reading email conversations
WO2010008825A1 (en) * 2008-06-23 2010-01-21 Cloudmark, Inc. Systems and methods for re-evaluating data
US8185492B2 (en) * 2008-08-14 2012-05-22 Google Inc. Messaging application with multiple viewports for presenting messages in different orders
US8645430B2 (en) 2008-10-20 2014-02-04 Cisco Technology, Inc. Self-adjusting email subject and email subject history
CN101938430B (zh) 2009-06-30 2014-01-15 国际商业机器公司 电子邮件的处理方法和处理系统
US8533208B2 (en) 2009-09-28 2013-09-10 Ebay Inc. System and method for topic extraction and opinion mining
US9514466B2 (en) 2009-11-16 2016-12-06 Yahoo! Inc. Collecting and presenting data including links from communications sent to or from a user
US20110185024A1 (en) * 2010-01-26 2011-07-28 Yahoo! Inc. Embeddable metadata in electronic mail messages
US8914368B2 (en) 2010-03-31 2014-12-16 International Business Machines Corporation Augmented and cross-service tagging
US8595303B2 (en) * 2010-06-02 2013-11-26 Microsoft Corporation Thread data aggregation
US8775400B2 (en) 2010-06-30 2014-07-08 Microsoft Corporation Extracting facts from social network messages
US20120102037A1 (en) 2010-10-26 2012-04-26 Mehmet Kivanc Ozonat Message thread searching
US8667169B2 (en) 2010-12-17 2014-03-04 Cisco Technology, Inc. System and method for providing argument maps based on activity in a network environment
US8990065B2 (en) * 2011-01-11 2015-03-24 Microsoft Technology Licensing, Llc Automatic story summarization from clustered messages
US20130007137A1 (en) 2011-06-28 2013-01-03 Microsoft Corporation Electronic Conversation Topic Detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392280B2 (en) * 2001-11-27 2008-06-24 International Business Machines Corporation Method for summarization of threads in electronic mail
US20080082607A1 (en) * 2006-09-29 2008-04-03 Sastry Nishanth R Advanced discussion thread management using a tag-based categorization system
US20090031244A1 (en) * 2007-07-25 2009-01-29 Xobni Corporation Display of Communication System Usage Statistics
US20090164572A1 (en) * 2007-12-20 2009-06-25 Motorola, Inc. Apparatus and method for content item annotation

Also Published As

Publication number Publication date
US20130006973A1 (en) 2013-01-03
MX2013015150A (es) 2014-03-31
RU2013158714A (ru) 2015-07-10
WO2013003240A2 (en) 2013-01-03
US9116984B2 (en) 2015-08-25
CN106021387A (zh) 2016-10-12
CA2840485C (en) 2019-10-01
KR20140045452A (ko) 2014-04-16
WO2013003240A3 (en) 2013-03-28
AU2012275628B2 (en) 2017-01-05
BR112013032004A2 (pt) 2016-12-27
EP2727012A4 (en) 2015-03-25
CA2840485A1 (en) 2013-01-03
CN103620539A (zh) 2014-03-05
CN103620539B (zh) 2017-04-12
JP2014524089A (ja) 2014-09-18
CN106021387B (zh) 2019-12-03
KR101960115B1 (ko) 2019-03-19
EP2727012A2 (en) 2014-05-07

Similar Documents

Publication Publication Date Title
RU2621005C2 (ru) Резюмирование потоков сообщений
US11328259B2 (en) Automatic task extraction and calendar entry
AU2012275628A1 (en) Summarization of conversation threads
US8560567B2 (en) Automatic question and answer detection
US9529864B2 (en) Data mining electronic communications
US20130006986A1 (en) Automatic Classification of Electronic Content Into Projects
US20130007036A1 (en) Automatic Project Content Suggestion
US20130007137A1 (en) Electronic Conversation Topic Detection
US20130007009A1 (en) Expertise Tagging and Project Membership Suggestion
US20140379818A1 (en) Aggregating message responses into topic-organized content
US20110179061A1 (en) Extraction and Publication of Reusable Organizational Knowledge
CN104509041B (zh) 被遗忘的附件的检测方法及装置
US20070294281A1 (en) Systems and methods for consumer-generated media reputation management
EP3286661A1 (en) Identifying experts and areas of expertise in an organization
CN114625703A (zh) 用于软件开发中的协作项目的资产识别
Slater Academic knowledge transfer in social networks