RU2682023C1 - Взаимодействие цифрового персонального помощника с подражаниями и полнофункциональными мультимедиа в ответах - Google Patents
Взаимодействие цифрового персонального помощника с подражаниями и полнофункциональными мультимедиа в ответах Download PDFInfo
- Publication number
- RU2682023C1 RU2682023C1 RU2016128739A RU2016128739A RU2682023C1 RU 2682023 C1 RU2682023 C1 RU 2682023C1 RU 2016128739 A RU2016128739 A RU 2016128739A RU 2016128739 A RU2016128739 A RU 2016128739A RU 2682023 C1 RU2682023 C1 RU 2682023C1
- Authority
- RU
- Russia
- Prior art keywords
- personal assistant
- digital personal
- statement
- response
- user
- Prior art date
Links
- 230000004044 response Effects 0.000 title claims abstract description 200
- 230000003993 interaction Effects 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000004590 computer program Methods 0.000 claims description 24
- 230000000007 visual effect Effects 0.000 claims description 19
- 239000000126 substance Substances 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 28
- 230000003287 optical effect Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 241000283923 Marmota monax Species 0.000 description 2
- 241001653634 Russula vesca Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 1
- 241000860832 Yoda Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Collating Specific Patterns (AREA)
Abstract
Изобретение относится к области вычислительной техники. Технический результат заключается в улучшении эффективности со временем посредством непрерывного взаимодействия с пользователем. Способ содержит этапы, на которых: принимают цифровое представление высказывания пользователя цифрового персонального помощника; на основании по меньшей мере анализа цифрового представления высказывания определяют, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника; в ответ на по меньшей мере определение того, что высказывание содержит высказывание, идентифицируют множество подходящих ответов на высказывание, причем упомянутое множество подходящих ответов включает в себя по меньшей мере одно из следующего: мультимедийный объект; и речь, при этом речь содержит подражание голосу человека; и выбирают один из упомянутого множества подходящих ответов в качестве ответа, который должен быть предоставлен посредством цифрового персонального помощника. 2 н. и 7 з.п. ф-лы, 15 ил.
Description
ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ
[0001] Персонификация взаимодействия с компьютером является очень распространенной практикой в области искусственного интеллекта. Создатели цифровых персональных помощников могут наполнять своих помощников индивидуальностью с тем, чтобы поддерживать уровень контактирования с пользователем очень высоким и также, чтобы создавать элемент доверия между пользователем и помощником, тем самым способствуя непрерывному использованию взаимодействия с цифровым персональным помощником.
[0002] Одна методика для сохранения высоким уровня контактирования влечет за собой создание ответов, предоставляемых цифровым персональным помощником, смешными и развлекательными. Некоторые обычные реализации цифровых персональных помощников программируются, чтобы генерировать смешные текстовые ответы, когда пользователь задает вопросы, имеющие случайный тон. Тем не менее, обычные цифровые персональные помощники, как правило, не используют всю гибкость цифровой канвы при представлении шутливых ответов. Также они не используют мощь современных методик синтезирования речи из текста, чтобы звучало смешно или отлично при предоставлении ответов. Кроме того, отсутствует визуальное представление цифрового помощника, которое может быть использовано для переноса любого аспекта шутливого ответа.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0003] В данном документе описываются системы, способы, устройства, и компьютерные программные продукты для реализации цифрового персонального помощника. Цифровой персональный помощник выполнен с возможностью определения того, что пользователь задает вопрос или делает заявление, которое предназначено для того, чтобы контактировать с образом цифрового персонального помощника в отличие от, например, запроса того, чтобы цифровой персональный помощник получил информацию или выполнил некоторую другую задачу от лица пользователя. В ответ на определение того, что пользователь задал такой вопрос или сделал такое заявление, цифровой персональный помощник предоставляет ответ на это посредством отображения или воспроизведения мультимедийного объекта, ассоциированного с отсылкой к массовой культуре внутри или посредством интерфейса пользователя цифрового персонального помощника. Дополнительно или в качестве альтернативы, в ответ на определение того, что пользователь задал такой вопрос или сделал такое заявление, цифровой персональный помощник предоставляет ответ на это посредством генерирования или воспроизведения речи, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре. Более того, персональный цифровой помощник может предоставлять ответ посредством отображения внутри интерфейса пользователя цифрового персонального помощника текста, который содержит цитату, ассоциированную с отсылкой к массовой культуре, отображения внутри интерфейса пользователя цифрового персонального помощника визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре, и/или отображения внутри интерфейса пользователя цифрового персонального помощника ссылки (link), которая может быть активирована пользователем, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0004] В частности, в данном документе описывается способ для реализации цифрового персонального помощника. В соответствии со способом, принимается цифровое представление высказывания пользователя цифрового персонального помощника. На основании, по меньшей мере, анализа цифрового представления высказывания, определяется, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника. В ответ на, по меньшей мере, определение того, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника, цифровому персональному помощнику предписывается генерировать ответ на высказывание. Ответ на высказывание включает в себя мультимедийный объект (например, изображение, видео контент или аудио контент), который отображается внутри или воспроизводится посредством интерфейса пользователя цифрового персонального помощника и который ассоциирован с отсылкой к массовой культуре. В качестве альтернативы или в дополнение, ответ на высказывание включает в себя речь, которая генерируется или воспроизводится цифровым персональным помощником и которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре.
[0005] В одном варианте осуществления вышеупомянутого способа, ответ на высказывание дополнительно включает в себя текст, который отображается внутри интерфейса пользователя цифрового персонального помощника, причем текст, содержащий цитату, ассоциированную с отсылкой к массовой культуре.
[0006] В другом варианте осуществления, речь содержит цитату, ассоциированную с отсылкой к массовой культуре.
[0007] В еще одном другом варианте осуществления, ответ на высказывание включает в себя визуальное представление цифрового персонального помощника, которое отображается внутри его интерфейса пользователя и которое вызывает отсылку к массовой культуре. В дальнейшем в соответствии с таким вариантом осуществления, визуальное представление цифрового персонального помощника может содержать анимацию цифрового персонального помощника.
[0008] В еще одном другом варианте осуществления, ответ на высказывание дополнительно включает в себя ссылку, которая отображается внутри интерфейса пользователя цифрового персонального помощника и которая может быть активирована пользователем для того, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0009] В зависимости от реализации вышеупомянутого способа, предписание генерировать ответ на высказывание, может включать в себя идентификацию множества подходящих ответов на высказывание и выбор ответа на высказывание из множества подходящих ответов на высказывание.
[0010] В соответствии с другой реализацией, предписание генерировать ответ на высказывание, включает в себя сопоставление высказывания с конкретным типом высказывания внутри иерархического дерева типов высказываний, причем каждый тип высказывания в иерархическом дереве типов высказываний имеет один или более ассоциированные с ним ответы, и выбор ответа на высказывание из ответа(ов), ассоциированного с конкретным типом высказывания.
[0011] В соответствии с дополнительной реализацией, предписание генерировать ответ на высказывание, включает в себя определение того, что высказывание ассоциировано с актуальной темой и в ответ на определение того, что высказывание ассоциировано с актуальной темой, выбор ответа на высказывание из одного или более ответов, ассоциированных с актуальной темой.
[0012] В соответствии с еще одной дополнительной реализацией, предписание генерировать ответ на высказывание, включает в себя определение того, что высказывание является высказыванием, для которого существует один или более предварительно определенные ответы, предназначенные для того, чтобы выражать образ цифрового персонального помощника, и в ответ на определение того, что высказывание является высказыванием для которого существует один или более предварительно определенные ответы, предназначенные для того, чтобы выражать образ цифрового персонального помощника, выбор ответа на высказывание из одного или более предварительно определенных ответов.
[0013] В другом варианте осуществления вышеупомянутого способа, предписание генерировать ответ на высказывание включает в себя отправку аудио файла, который включает в себя речь или информацию, которая идентифицирует аудио файл, вычислительному устройству, исполняющему цифрового персонального помощника.
[0014] В еще одном другом варианте осуществления, предписание генерировать ответ на высказывание включает в себя предоставление текста вычислительному устройству, исполняющему цифровой персональный помощник, причем текст должен обрабатываться компонентом преобразования текста в речь цифрового персонального помощника, чтобы генерировать речь.
[0015] В данном документе также описывается вычислительное устройство. Вычислительное устройство включает в себя, по меньшей мере, один процессор и память. Память хранит логику компьютерной программы для исполнения посредством, по меньшей мере, одного процессора. Логика компьютерной программы включает в себя один или более компоненты, выполненные с возможностью выполнения операций, когда исполняется посредством, по меньшей мере, одного процессора. Один или более компоненты включают в себя цифровой персональный помощник. Цифровой персональный помощник выполнен с возможностью захвата аудио, которое представляет собой высказывание пользователя, и передачи аудио серверной части цифрового персонального помощника. Высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом персонального цифрового помощника. Цифровой персональный помощник дополнительно выполнен с возможностью предоставления ответа на высказывание на основании, по меньшей мере, информации, принятой от серверной части цифрового персонального помощника. Предоставление ответа включает в себя генерирование или воспроизведение речи, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре.
[0016] В одном варианте осуществления вычислительного устройства, цифровой персональный помощник выполнен с возможностью воспроизведения аудио файла, который включает в себя речь. В другом варианте осуществления вычислительного устройства, цифровой персональный помощник выполнен с возможностью применения преобразования текста в речь к тексту, чтобы генерировать речь.
[0017] В другом варианте осуществления вычислительного устройства, предоставление ответа дополнительно включает в себя, по меньшей мере, одно из следующего: отображение или воспроизведение мультимедийного объекта посредством интерфейса пользователя цифрового персонального помощника, причем мультимедийный объект ассоциирован с отсылкой к массовой культуре; отображение текста внутри интерфейса пользователя цифрового персонального помощника, причем текст содержит цитату, ассоциированную с отсылкой к массовой культуре; отображение визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре внутри интерфейса пользователя цифрового персонального помощника, и отображение ссылки внутри интерфейса пользователя цифрового персонального помощника, которая может быть активирована пользователем, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0018] В данном документе описывается другое вычислительное устройство. Вычислительное устройство включает в себя, по меньшей мере, один процессор и память. Память хранит логику компьютерной программы для исполнения посредством, по меньшей мере, одного процессора. Логика компьютерной программы включает в себя один или более компоненты, выполненные с возможностью выполнения операций, когда исполняется посредством, по меньшей мере, одного процессора. Один или более компоненты включают в себя цифровой персональный помощник. Цифровой персональный помощник выполнен с возможностью захвата аудио, которое представляет собой высказывание пользователя, и передачи аудио серверной части цифрового персонального помощника. Высказывание содержит высказывание предназначенное для того, чтобы контактировать с образом цифрового персонального помощника. Цифровой персональный помощник дополнительно выполнен с возможностью предоставления ответа на высказывание на основании, по меньшей мере, информации, принятой от серверной части персонального цифрового помощника. Предоставление ответа включает в себя отображение или воспроизведение мультимедийного объекта, ассоциированного с отсылкой к массовой культуре посредством интерфейса пользователя цифрового персонального помощника.
[0019] В одном варианте осуществления вычислительного устройства, мультимедийный объект содержит изображение, видео контент, или аудио контент.
[0020] В другом варианте осуществления вычислительного устройства, предоставление ответа дополнительно включает в себя, по меньшей мере, одно из следующего: генерирование или воспроизведение речи, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре; отображение текста внутри интерфейса пользователя цифрового персонального помощника, причем текст содержит цитату, ассоциированную с отсылкой к массовой культуре; отображение визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре, внутри интерфейса пользователя цифрового персонального помощника; и отображение ссылки внутри интерфейса пользователя цифрового персонального помощника, которая может быть активирована пользователем, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0021] Данная Сущность Изобретения предоставлена для того, чтобы представить выбор концепций в упрощенной форме, которые дополнительно описываются ниже в Подробном Описании. Данная Сущность Изобретения как не предназначена для того, чтобы идентифицировать ключевые признаки или неотъемлемые признаки заявленного предмета изобретения, так и не предназначена для того, чтобы быть использованной для ограничения объема заявленного предмета изобретения. Более того, отмечается, что заявленный предмет изобретения не ограничивается конкретными вариантами осуществления, описываемыми в Подробном Описании и/или других разделах данного документа. Такие варианты осуществления представлены в данном документе только в целях иллюстрации. Дополнительные варианты осуществления будут очевидны специалистам в соответствующей области(ях) техники на основании идей, которые содержатся в данном документе.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0022] Сопроводительные чертежи, которые включены в данный документ и формируют часть технического описания, иллюстрируют варианты осуществления настоящего изобретения и, совместно с описанием, дополнительно служат для объяснения принципов изобретения и для того, чтобы позволить специалисту в соответствующей области(ях) техники выполнить и использовать изобретение.
[0023] Фиг. 1 является структурной схемой примерной системы, которая реализует цифровой персональный помощник, который использует подражания и мультимедиа при ответе на высказывания типа болтовня в соответствии с примерным вариантом осуществления.
[0024] Фиг. 2 является структурной схемой, которая показывает каким образом разнообразные компоненты системы с Фиг. 1 работают для того, чтобы позволить персональному цифровому помощнику определять, что пользователь сделал высказывание типа болтовня, и предоставлять на него ответ.
[0025] Фиг. 3 изображает примерное иерархическое дерево типов высказываний, которое может быть использовано, чтобы выбирать ответ на высказывание типа болтовня в соответствии с вариантом осуществления.
[0026] Фиг. 4 является структурной схемой, которая показывает примерный ответ, который может быть предоставлен цифровым персональным помощником в ответ на высказывание типа болтовня в соответствии с вариантом осуществления.
[0027] Фиг. 5-10 предоставляют иллюстративные примеры ответов на высказывание типа болтовня, которые могут быть доставлены через интерфейс пользователя цифрового персонального помощника в соответствии с разнообразными вариантами осуществления.
[0028] Фиг. 11 изображает блок-схему способа для реализации цифрового персонального помощника, который использует подражания и/или мультимедиа при ответе на высказывания типа болтовня в соответствии с вариантом осуществления.
[0029] Фиг. 12 изображает блок-схему способа, посредством которого цифровой персональный помощник предоставляет ответ на высказывание типа болтовня, который включает в себя подражание голосу в соответствии с вариантом осуществления.
[0030] Фиг. 13 изображает блок-схему способа, посредством которого цифровой персональный помощник предоставляет ответ на высказывание типа болтовня, который выключает в себя мультимедийный объект в соответствии с вариантом осуществления.
[0031] Фиг. 14 является структурной схемой примерного мобильного устройства, которое может быть использовано, чтобы реализовывать разнообразные варианты осуществления.
[0032] Фиг. 15 является структурной схемой примерной основанной на процессоре компьютерной системы, которая может быть использована, чтобы реализовывать разнообразные варианты осуществления.
[0033] Признаки и преимущества настоящего изобретения станут более очевидны из изложенного ниже подробного описания, рассматриваемого совместно с чертежами, на которых подобные ссылочные знаки везде идентифицируют соответствующие элементы. На чертежах, подобные цифровые обозначения, как правило, указывают идентичные, функционально подобные, и/или структурно сходные элементы. Чертеж, на котором элемент появляется впервые, указывается посредством крайней левой цифры(ер) в соответствующем цифровом обозначении.
ПОДРОБНОЕ ОПИСАНИЕ
I. Введение
[0034] Нижеследующее подробное описание относится к сопроводительным чертежам, которые иллюстрируют примерные варианты осуществления настоящего изобретения. Тем не менее, объем настоящего изобретения не ограничивается этими вариантами осуществления, а вместо этого определяется прилагаемой формулой изобретения. Таким образом, варианты осуществления за пределами тех, что показаны на сопроводительных чертежах, такие как модифицированные версии иллюстрируемых вариантов осуществления, тем не менее могут быть охвачены настоящим изобретением.
[0035] Ссылки в техническом описании на «один вариант осуществления», «вариант осуществления», «примерный вариант осуществления», или подобное, указывают на то, что описываемый вариант осуществления может включать в себя конкретный признак, структуру, или характеристику, но каждый вариант осуществления не обязательно может включать в себя конкретный признак, структуру, или характеристику. Более того, такие фразы не обязательно относятся к одному и тому же варианту осуществления. Кроме того, когда конкретный признак, структура, или характеристика описывается в связи с вариантом осуществления, утверждается что в пределах компетенции специалистов в соответствующей области(ях) техники реализовывать такой признак, структуру, или характеристику в связи с другими вариантами осуществления, описано ли это явно или нет.
[0036] В данном документе описываются системы, способы, устройства, и компьютерные программные продукты для реализации цифрового персонального помощника. Цифровой персональный помощник выполнен с возможностью определения того, что пользователь задает вопрос или делает заявление, которое предназначено для того, чтобы контактировать с образом цифрового персонального помощника в отличие от, например, запроса того, чтобы цифровой персональный помощник получил информацию или выполнил некоторую другую задачу от лица пользователя. В ответ на определение того, что пользователь задал такой вопрос или сделал такое заявление, цифровой персональный помощник предоставляет ответ на это посредством отображения или воспроизведения мультимедийного объекта, ассоциированного с отсылкой к массовой культуре внутри или посредством интерфейса пользователя цифрового персонального помощника. Дополнительно или в качестве альтернативы, в ответ на определение того, что пользователь задал такой вопрос или сделал такое заявление, цифровой персональный помощник предоставляет ответ на это посредством генерирования или воспроизведения речи, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре. Более того, персональный цифровой помощник может предоставлять ответ посредством отображения внутри интерфейса пользователя цифрового персонального помощника текста, который содержит цитату, ассоциированную с отсылкой к массовой культуре, отображения внутри интерфейса пользователя цифрового персонального помощника визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре, и/или отображения внутри интерфейса пользователя цифрового персонального помощника ссылки, которая может быть активирована пользователем, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0037] Посредством предоставления цифровому персональному помощнику возможности отвечать на высказывания пользователя, которые предназначены для того, чтобы контактировать с его образом (также именуемые в данном документе как «высказывания типа болтовня»), вышеупомянутым образом, описываемые в данном документе варианты осуществления могут преимущественно повышать уровень контактирования между пользователем и цифровым персональным помощником, а также создавать элемент доверия между пользователем и помощником, тем самым способствуя непрерывному использованию и взаимодействию с цифровым персональным помощником. Например, посредством предоставления ответов, которые включают в себя мультимедийные объекты, подражания голоса, цитаты, и ссылки, ассоциированные с отсылками к массовой культуре, которые вероятно будут распознаны и/или оценены пользователем, цифровой персональный помощник может как развлекать, так и создавать чувство общности с пользователем.
[0038] Раздел II описывает примерную систему, которая реализует цифровой персональный помощник, который использует подражания и/или мультимедиа при ответе на высказывания типа болтовня в соответствии с вариантами осуществления. Раздел III описывает примерные способы для реализации цифрового персонального помощника, который использует подражания и/или мультимедиа при ответе на высказывания типа болтовня в соответствии с вариантами осуществления. Раздел IV описывает примерное мобильное устройство, которое может быть использовано, чтобы реализовывать цифровой персональный помощник в соответствии с вариантами осуществления, описываемыми в данном документе. Раздел V описывает примерный настольный компьютер, который может быть использован, чтобы реализовывать цифровой персональный помощник в соответствии с вариантами осуществления, описываемыми в данном документе. Раздел VI предоставляет некоторые заключительные замечания.
II. Примерная система, которая реализует цифровой персональный помощник, который использует подражания и/или мультимедиа в ответах
[0039] Фиг. 1 является структурной схемой примерной системы 100, которая реализует цифровой персональный помощник, который использует подражания и мультимедиа при ответе на высказывания типа болтовня в соответствии с примерным вариантом осуществления. Как показано на Фиг. 1, система 100 включает в себя вычислительное устройство 102 конечного пользователя, которое коммуникативно соединено с серверной частью 106 цифрового персонального помощника через одну или более сети 104. Теперь будет описан каждый из этих компонентов.
[0040] Вычислительное устройство 102 конечного пользователя предназначено для того, чтобы представлять основанное на процессоре электронное устройство, которое выполнено с возможностью исполнения основанного на программном обеспечении цифрового персонального помощника 130, который инсталлирован на нем. Цифровой персональный помощник 130 может быть исполнен от лица пользователя вычислительного устройства 102 конечного пользователя. В одном варианте осуществления, вычислительное устройство конечного пользователя содержит мобильное вычислительное устройство, такое как мобильный телефон (например, интеллектуальный телефон), компьютер класса лэптоп, планшетный компьютер, нетбук, носимый компьютер, такой как интеллектуальные часы или монтируемый на голове компьютер, портативный мультимедийный проигрыватель, переносная игровая консоль, персональный помощник в навигации, камера, или любое другое мобильное устройство, выполненное с возможностью исполнения цифрового персонального помощника от лица пользователя. Один пример мобильного устройства, которое может содержать в себе функциональность вычислительного устройства 102 конечного пользователя будет описан ниже со ссылкой на Фиг. 14. В другом варианте осуществления, вычислительное устройство 102 конечного пользователя содержит настольный компьютер, игровую консоль, или другую не-мобильную вычислительную платформу, которая выполнена с возможностью исполнения цифрового персонального помощника от лица пользователя. Примерный настольный компьютер, который может содержать в себе функциональность вычислительного устройства 102 конечного пользователя будет рассмотрен ниже со ссылкой на Фиг. 15.
[0041] Вычислительное устройство 102 конечного пользователя выполнено с возможностью осуществления связи с серверной частью 106 персонального цифрового помощника через сеть 104. Серверная часть 106 персонального помощника содержит один или более компьютеры (например, серверы), которые запрограммированы, чтобы предоставлять услуги для поддержки операций цифрового персонального помощника 130 и других цифровых персональных помощников, исполняющихся на других вычислительных устройствах конечного пользователя. Например, как будет рассмотрено в данном документе, серверная часть 106 персонального помощника включает в себя один или более компьютеры, выполненные с возможностью предоставления услуг цифровому персональному помощнику 130, которые относятся к распознаванию речи и пониманию запросов и ответу. В частности, как показано на Фиг. 1, эти услуги соответственно предоставляются посредством услуги 132 распознавания речи и системы понимания запросов и ответа. Следует отметить, что серверная часть 106 цифрового персонального помощника может выполнять любое количество других услуг от лица цифрового персонального помощника 130 несмотря на то, что такие дополнительные услуги могут не быть явно рассмотрены в данном документе.
[0042] В одном варианте осуществления, серверная часть 106 цифрового персонального помощника содержит основанную на облаке серверную часть, в которой любая из огромного количества сконфигурированных должным образом машин может быть произвольно выбрана, чтобы обсчитывать одну или более требуемые услуги для поддержки цифрового персонального помощника 130. Как будет понятно специалистам в соответствующей области(ях) техники, такая основанная на облаке реализация обеспечивает надежную и масштабируемую инфраструктуру для предоставления услуг серверной части цифровым персональным помощникам, таким как цифровой персональный помощник 130.
[0043] Сеть(и) 104 предназначена представлять собой любой тип сети или сочетание сетей, пригодных для обеспечения связи между вычислительными устройствами конечного пользователя, таким как вычислительное устройство 102 конечного пользователя, и серверной частью 106 цифрового персонального помощника. Сеть(и) 104 может включать в себя, например и без ограничения, глобальную сеть, локальную сеть, закрытую сеть, открытую сеть, пакетную сеть, сеть с коммутацией каналов, проводную сеть, и/или беспроводную сеть.
[0044] Как дополнительно показано на Фиг. 1, вычислительное устройство 102 конечного пользователя включает в себя множество взаимно-соединенных компонентов, включая блок 110 обработки, энергонезависимую память 120, энергозависимую память 112, одно или более устройства 116 ввода пользователя, дисплей 118, и один или более сетевые интерфейсы 114. Теперь будет описан каждый из этих компонентов.
[0045] Блок 110 обработки предназначен представлять собой один или более микропроцессоры, каждый из которых может иметь один или более центральные блоки управления (CPU) или ядра микропроцессора. Блок 110 обработки работает хорошо известным образом, чтобы исполнять компьютерные программы (также именуемые в данном документе логикой компьютерной программы). Исполнение таких компьютерных программ предписывает блоку 110 обработки выполнять операции, включающие в себя операции, которые будут описаны в данном документе. Каждый из компонентов: энергонезависимая память 120, энергозависимая память 112, устройство(а) 116 ввода пользователя, дисплей 118, и сетевой интерфейс(ы) 114 соединены с блоком 110 обработки через один или более пригодные интерфейсы.
[0046] Энергонезависимая память 120 содержит одно или более устройства машиночитаемой памяти, которые работают, чтобы хранить компьютерные программы и данные постоянным образом, так что хранящаяся информация не будет потеряна даже когда вычислительное устройство 102 конечного пользователя находится без питания или в состоянии выключенного питания. Энергонезависимая память 120 может быть реализована используя любые из широкого многообразия энергонезависимых устройств машиночитаемой памяти, включая, но не ограничиваясь, устройства постоянной памяти (ROM), твердотельные накопители, накопители на жестком диске, магнитные запоминающие носители информации такие как магнитные диски и ассоциированные накопители, оптические запоминающие носители информации, такие как оптические диски и ассоциированные накопители, устройства флэш-памяти, такие как USB флэш-накопители.
[0047] Энергозависимая память 112 содержит одно или более устройства машиночитаемой памяти, которые работают, чтобы хранить компьютерные программы и данные не постоянным образом, так что хранящаяся информация будет потеряна, когда вычислительное устройство 102 конечного пользователя находится без питания или в состоянии выключенного питания. Энергозависимая память может быть реализована, используя любое из широкого многообразия энергозависимых устройств машиночитаемой памяти, включающих в себя, но не ограниченных, устройства памяти с произвольным доступом (RAM).
[0048] Дисплей 118 содержит устройство, на котором контент, такой как текст и изображения, может быть визуализирован таким образом, что он будет видим пользователю вычислительного устройства 102 конечного пользователя. Некоторые или все из операций визуализации, требуемые, чтобы отображать такой контент, могут быть выполнены, по меньше мере частично, посредством блока 110 обработки. Некоторые или все из операций визуализации также могут быть выполнены посредством интерфейса дисплейного устройства, такого как видео или графический чип или карта (не показано на Фиг. 1), которое соединено между блоком 110 обработки и дисплеем 118. В зависимости от реализации вычислительного устройства 102 конечного пользователя, дисплей 118 может быть выполнен в виде устройства, которое является интегрированным внутри той же самой физической структуры или корпуса, что и блок 110 обработки, или может быть выполнено в виде монитора, проектора, или другого типа устройства, которое является физически отдельным от структуры или корпуса, которые включают в себя блок 110 обработки, и соединенное с ним через пригодное проводное и/или беспроводное соединение.
[0049] Устройство(а) 116 ввода пользователя содержат одно или более устройства, которые работают, чтобы генерировать информацию ввода пользователя в ответ на манипуляцию пользователя или его управление. Такая информация ввода пользователя пропускается через пригодный интерфейс к блоку 110 обработки для ее обработки. В зависимости от реализации, устройство(а) 116 ввода пользователя может включать в себя сенсорный экран (например, сенсорный экран, интегрированный с дисплеем 118), клавиатуру, клавишную панель, мышь, сенсорную панель, шаровой манипулятор, игровой манипулятор, манипулятор рычажного типа, проводную перчатку, датчик отслеживания движения, игровой контроллер или игровую панель, или устройство захвата видео, такое как камера. Тем не менее, эти примеры не предназначены быть ограничивающими и устройство(а) 116 ввода пользователя может включать в себя другие типы устройств, отличные от тех, что перечислены в данном документе. В зависимости от реализации, каждое устройство 116 ввода пользователя может быть интегрировано внутри одной и той же физической структуры или корпуса, что и блок 110 обработки (как например, интегрированный сенсорный экран, сенсорная панель, или клавиатура на мобильном устройстве) или физически отдельно от физической структуры или корпуса, который включает в себя блок 110 обработки, и соединено с ним через пригодное проводное и/или беспроводное соединение.
[0050] Сетевой интерфейс(ы) 114 содержит один или более интерфейсы, которые позволяют вычислительному устройству 102 конечного пользователя осуществлять связь через одну или более сети 104. Например, сетевой интерфейс(ы) 114 может содержать интерфейс проводной сети, такой как интерфейс Ethernet или интерфейс беспроводной сети, такой как интерфейс IEEE 802.11(«Wi-Fi») или телекоммуникационный интерфейс 3G. Тем не менее, это лишь примеры и они не предназначены быть ограничивающими.
[0051] Как дополнительно показано на Фиг. 1, энергонезависимая память 120 хранит некоторое количество компонентов программного обеспечения, включая множество приложений 122 и операционную систему 124.
[0052] Каждое во множестве приложений 122 содержит компьютерную программу, которой пользователь вычислительного устройства 102 конечного пользователя может предписать исполнение посредством блока 110 обработки. Исполнение каждого приложения предписывает выполнение некоторых операций от лица пользователя, при этом тип выполняемых операций будет варьироваться в зависимости от того, каким образом запрограммировано приложение. Приложения 122 могут включать в себя, например и без ограничения, приложение телефонии, приложение работы с электронной почтой, приложение обмена сообщениями, приложение Web-обзора, приложение работы с календарем, приложение общего назначения, игровое приложение, приложение работы с социальными сетями, музыкальное приложение, рабочее приложение, приложение образа жизни, справочное приложение, приложение для путешествий, спортивное приложение, приложение навигации, приложение заботы о здоровье и фитнес-приложение, новостное приложение, приложение работы с фотографиями, финансовое приложение, бизнес приложение, образовательное приложение, приложение прогноза погоды, приложение работы с книгами, медицинское приложение, или подобное. Как показано на Фиг. 1, приложения 122 включают в себя цифровой персональный помощник 130, функции которого будут описаны в данном документе более подробно.
[0053] Приложения 122 могут распространятся для и/или инсталлироваться на вычислительном устройстве 102 конечного пользователя разнообразными способами, в зависимости от реализации. Например, в одном варианте осуществления, по меньшей мере, одно приложение загружается из магазина приложений и инсталлируется на вычислительном устройстве 102 конечного пользователя. В другом варианте осуществления, в котором устройство 102 конечного пользователя используется как часть или совместно с сетью предприятия, по меньшей мере, одно приложение распространяется для вычислительного устройства 102 конечного пользователя системным администратором, используя любой из многообразия инструментов администрирования сети предприятия и затем инсталлируется на нем. В еще одном другом варианте осуществления, по меньшей мере, одно приложение инсталлируется на вычислительном устройстве 102 конечного пользователя сборщиком системы, как например посредством изготовителя комплексного оборудования (OEM) или изготовителя встроенного устройства, используя любые из многообразия пригодных утилит сборки системы. В дополнительном варианте осуществления, изготовитель операционной системы может включать приложение наряду с операционной системой 124, которая инсталлируется на вычислительное устройство конечного пользователя.
[0054] Операционная система 124 содержит набор программ, которые осуществляют администрирование ресурсов и предоставляют общие услуги для приложений, которые исполняются на вычислительном устройстве 102 конечного пользователя, таких как приложения 122. Среди прочих признаков, операционная система 124 содержит интерфейс 132 пользователя операционной системы (OS). Интерфейс 132 пользователя OS содержит компонент операционной системы 124, который генерирует интерфейс пользователя, посредством которого пользователь может взаимодействовать с операционной системой 124 для различных целей, таких как, но не ограничиваясь, поиск и запуск приложений, задействование некоторой функциональности операционной системы, и установка некоторых установок операционной системы. В одном варианте осуществления, интерфейс 132 пользователя OS содержит основанный на сенсорном экране графический интерфейс пользователя (GUI), несмотря на то, что это лишь пример. Дополнительно в соответствии с таким примером, каждое приложение 122, инсталлированное на вычислительном устройстве 102 конечного пользователя, может быть представлено в качестве пиктограммы или плитки внутри GUI и задействуется пользователем посредством взаимодействия с сенсорным экраном в отношении соответствующей пиктограммы или плитки. Тем не менее, любая из широкого многообразия альтернативных моделей интерфейса пользователя может быть использована посредством интерфейса 132 пользователя OS.
[0055] Несмотря на то, что приложения 122 и операционная система 124 показаны как хранящиеся в энергонезависимой памяти 120, должно быть понятно, что во время работы вычислительного устройства 102 конечного пользователя, приложения 122, операционная система 124, или ее части, могут быть загружены в энергозависимую память 112 и исполнены из нее в качестве процессов посредством блока 110 обработки.
[0056] Цифровой персональный помощник 130 содержит компьютерную программу, которая выполнена с возможностью выполнения задач, или услуг, для пользователя вычислительного устройства 102 конечного пользователя на основании ввода пользователя, как впрочем и признаков, таких как осведомленность о местоположении и возможность осуществления доступа к информации из многообразных источников, включая онлайновые источники (такие как условия погоды или дорожного движения, новости, цены на акции, расписания пользователей, розничные цены, и т.д.). Примеры задач, которые могут быть выполнены цифровым персональным помощником 130 от лица пользователя могут включать в себя, но не ограничиваются, осуществление телефонного вызова указанному пользователем человеку, запуск указанного пользователем приложения, отправку указанного пользователем сообщения электронной почты или текстового сообщения указанному пользователем получателю, воспроизведение указанной пользователем музыки, планирование встречи или другого события в календаре пользователя, получение направлений к указанному пользователем местоположению, получение счета ассоциированного с указанным пользователем спортивным событием, размещение указанного пользователем контента на web-сайте социальных медиа или услуге микроблоггинга, запись указанных пользователем напоминаний или заметок, получение отчета о погоде, получение текущего времени, установка будильника на указанное пользователем время, получение цены на акции для указанной пользователем компании, поиск ближайшего торгового предприятия, выполнение поиска в Интернет, или подобного. Цифровой персональный помощник 130 может использовать любую из многообразия методик искусственного интеллекта, чтобы улучшать свою эффективность со временем посредством непрерывного взаимодействия с пользователем. Цифровой персональный помощник 130 также может именоваться интеллектуальным персональным помощником, интеллектуальным программным помощником, виртуальным персональным помощником, или подобным образом.
[0057] Цифровой персональный помощник 130 выполнен с возможностью предоставления интерфейса пользователя посредством которого пользователь может задавать вопросы, команды, или осуществлять другой вербальный ввод и посредством которого ответы на такой ввод могут быть доставлены пользователю. В одном варианте осуществления, ввод может содержать речь пользователя, которая захватывается посредством одного или более микрофонов вычислительного устройства 102 конечного пользователя (каждый из которых может содержать одно из устройств 116 ввода пользователя), несмотря на то, что данный пример не предназначен для ограничения и ввод пользователя может быть предоставлен впрочем другими способами. Ответы, генерируемые цифровым персональным помощником 130, могут быть сделаны видимыми пользователю в форме текста, изображений, или другого визуального контента, показываемого на дисплее 118 внутри графического интерфейса пользователя цифрового персонального помощника 130. Ответы также могут содержать сгенерированную компьютером речь или другой аудио контент, который воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя (не показано на Фиг. 1).
[0058] В соответствии с вариантами осуществления, цифровой персональный помощник 130 выполнен с возможностью определения того, что пользователь задает вопрос или делает заявление, которое предназначено для того, чтобы контактировать с образом цифрового персонального помощника 130 в отличие от, например, запроса того, чтобы цифровой персональный помощник получил информацию или выполнил некоторую другую задачу от лица пользователя. Такие вопросы или заявления часто являются неофициальными или шутливыми по природе и могут включать в себя, например, «Ты выйдешь за меня?», «Какой твой любимый цвет?», «Спой мне песню», «Расскажи мне анекдот», «Тук-Тук», «Сколько дров мог бы нарубить сурок, если б сурок мог рубить дрова?», «Кто делает лучший телефон?», «Где я могу спрятать тело?», «Как ты выглядишь?», «Ты прекрасна», «Сколько тебе лет?», «Кто твой папа?», «У тебя есть парень?», «В чем смысл жизни?», «Я хотел бы узнать тебя лучше», или подобное. Для удобства, такие вопросы и заявления именуются в данном документе «высказываниями типа болтовня» или просто «болтовня».
[0059] Как будет рассмотрено ниже, цифровой персональный помощник 130 дополнительно выполнен с возможностью предпринимать некоторые действия в ответ на определение того, что пользователь сделал высказывание типа болтовня. Например, в ответ на определение того, что пользователь сделал высказывание типа болтовня, цифровой персональный помощник 130 может предоставлять ответ на него посредством отображения мультимедийного объекта, ассоциированного с отсылкой к массовой культуре, внутри своего интерфейса пользователя (когда мультимедийный объект является визуальным по природе) или воспроизведения посредством своего интерфейса пользователя такого мультимедийного объекта (когда мультимедийный объект является звуковым по природе). Используемое в данном документе понятие «отсылка к массовой культуре» предназначено для того, чтобы в широком смысле охватывать ссылку на любой предмет, связанный с обычаями, искусством и/или социальными взаимодействиями большой части людей. Например, и без какого-либо ограничения чего бы то ни было, отсылка к массовой культуре может включать в себя ссылку на хорошо известный фильм, телевизионное шоу, роман, короткую историю, живопись, видеоигру, изображение, видео, мультфильм, знаменитость, актера или актрису, политика или другую публичную фигуру, стереотип, мим, текущее событие, историческое событие, или подобное.
[0060] Дополнительно или в качестве альтернативы, в ответ на определение того, что пользователь сделал высказывание типа болтовня, цифровой персональный помощник 130 может предоставлять ответ на него посредством генерирования или воспроизведения речи, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре. Еще кроме того, цифровой персональный помощник 130 может быть выполнен с возможностью предоставления ответа посредством отображения внутри его интерфейса пользователя текста, который содержит цитату, ассоциированную с отсылкой к массовой культуре, отображения внутри его интерфейса пользователя визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре, и/или отображения внутри его интерфейса пользователя ссылки, которая может быть активирована пользователем, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0061] Один способ посредством которого цифровой персональный помощник 130 определяет, что пользователь сделал высказывание типа болтовня, и предоставляет ответ на него будет теперь описан со ссылкой на структурную схему 200 с Фиг. 2. В частности, структурная схема 200 показывает, каким образом разнообразные компоненты системы 100 работают вместе, чтобы позволить цифровому персональному помощнику 130 определять, что пользователь сделал высказывание типа болтовня, и предоставлять ответ на него.
[0062] Со ссылкой на Фиг. 2, процесс начинается после того, как цифровой персональный помощник 130 был запущен на вычислительном устройстве 102 конечного пользователя. Чтобы взаимодействовать с цифровым персональным помощником 130, пользователь говорит в один или более микрофоны вычислительного устройства 102 конечного пользователя. Высказывание пользователя захватывается посредством микрофона(ов) и преобразуется из аналоговой в цифровую форму хорошо известным образом. Цифровой персональный помощник 130 предписывает передать цифровое представление высказывания в качестве аудио потока к услуге 132 распознавания речи (которая является частью серверной части 106 цифрового персонального помощника) через сеть(и) 104. Например, в одном варианте осуществления, по мере того, как пользователь говорит в микрофон(ы) вычислительного устройства конечного пользователя, цифровой персональный помощник 139 периодически предписывает упаковать и передать цифровое представление части высказывания пользователя к услуге 132 распознавания речи через сеть(и) 104.
[0063] Услуга 132 распознавания речи работает, чтобы принимать аудио поток, переданный к ней посредством цифрового персонального помощника 130, и чтобы анализировать аудио поток, чтобы определять его фонетический контент. Как только услуга 132 распознавания речи определила фонетический контент аудио потока, она затем отображает фонетический контент в одном или более словах, которые собранные вместе содержат распознанное высказывание. Услуга 132 распознавания речи затем пропускает распознанное высказывание к системе 136 понимания запроса и ответа.
[0064] Как показано на Фиг. 2, услуга 132 распознавания речи также может передавать распознанное высказывание обратно цифровому персональному помощнику 130 через сеть(и) 104. Цифровой персональный помощник 130 может отображать текстовую версию распознанного высказывания внутри его графического интерфейса пользователя (видимого через дисплей 118) таким образом, что пользователь может видеть распознанное высказывание и определять, представляет точно или нет распознанное высказывание то, что он/она сказал(а). В соответствии с некоторыми вариантами осуществления, цифровой персональный помощник 130 может дополнительно предоставлять средство, посредством которого пользователь может редактировать распознанное высказывание, если он/она определяет, что распознанное высказывание не точно представляет то, что он/она сказал(а), и передавать отредактированную версию высказывания системе 136 понимания запроса и ответа для дальнейшей его обработки.
[0065] Система 136 понимания запроса и ответа принимает распознанное или скорректированное высказывание и анализирует его слова, чтобы определить, каким образом такое высказывание должны быть ею обработано. Например, система 136 понимания запроса и ответа может определять, что распознанное или скорректированное высказывание содержит вызов конкретной задачи внутри предварительно определенного набора задач. Например и без какого-либо ограничения чего бы то ни было, задача может содержать осуществление телефонного вызова указанному пользователем человеку (например «вызвать Брайана»), отправку указанного пользователем сообщения электронной почты или текстового сообщения указанному пользователем получателю (например, «текст Кэрол о том, что Я опаздываю»), или создание напоминания (например, «напомнить мне проверить печь через час»). Если система 136 понимания запроса и ответа определяет, что распознанное или скорректированное высказывание содержит вызов конкретной задачи внутри предварительно определенного набора, тогда она будет предписывать специализированной логике (например, специализированной логике внутри вычислительного устройства 102 конечного пользователя) выполнить задачу.
[0066] Тем не менее, если система 136 понимания запроса и ответа не в состоянии сопоставить распознанное или скорректированное высказывание с какой-либо задачей внутри предварительно определенного набора, тогда система 136 понимания запроса и ответа может дополнительно анализировать слова высказывания, чтобы определить, каким образом такое высказывание должно быть ею обработано. Например, система 136 понимания запроса и ответа может определять, что высказывание должно быть обработано посредством проведения Web-поиска или посредством предложения пользователю возможности проведения Web-поиска. В данном случае, высказывание может быть обработано посредством специализированной логики, чтобы способствовать Web-поиску, который является внутренним и/или внешним по отношению к системе 136 понимания запроса и ответа. В качестве альтернативы, система 136 понимания запроса и ответа может определять на основании анализа слов высказывания, что высказывание содержит высказывание типа болтовня, которое как отмечено выше является высказыванием, предназначенным для того, чтобы контактировать с цифровым персональным помощником 130.
[0067] В зависимости от реализации, система 136 понимания запроса и ответа может определять, что высказывание содержит высказывание типа болтовня на основании анализа факторов отличных от или в дополнение к анализу слов высказывания. Например, система 136 понимания запроса и ответа может определять, что высказывание содержит высказывание типа болтовня на основании частично анализа интонации высказывания, по контекстным подсказкам, полученным из истории беседы пользователя, или по любым другим факторам, которые могут считаться полезными при определении того, что высказывание содержит высказывание типа болтовня.
[0068] Если система 136 понимания запроса и ответа определяет, что высказывание содержит высказывание типа болтовня, тогда высказывание будет обработано посредством системы 138 понимания запроса и ответа для болтовни, которая является частью системы 136 понимания запроса и ответа. Система 138 понимания запроса и ответа для болтовни выполнена с возможностью определения предмета высказывания типа болтовня и затем, на основании определенного предмета, предпринимает шаги, чтобы предписать цифровому персональному помощнику 130 выводить соответствующий ответ на высказывание типа болтовня. Как показано на Фиг. 2, это может задействовать отправку всего или части ответа от системы 138 понимания запроса и ответа для болтовни к цифровому персональному помощнику 130 через сеть(и) 104. Составление ответа и способ, посредством которого он переносится к и/или генерируется посредством цифрового персонального помощника 130 будет рассмотрено более подробно ниже.
[0069] В одном варианте осуществления, система 138 понимания запроса и ответа для болтовни определяет предмет высказывания типа болтовня и затем идентифицирует множество подходящих ответов, которые подходят для ответа на высказывание. Система 138 понимания запроса и ответа для болтовни затем выбирает один из множества подходящих ответов в качестве ответа, который должен быть предоставлен посредством цифрового персонального помощника 130. Такой выбор может быть выполнен случайным образом, в некоторой последовательности, или посредством использования некоторой другой методологии выбора. Посредством сохранения множества подходящих ответов для заданного высказывания типа болтовня, система 138 понимания запроса и ответа для болтовни может гарантировать то, что цифровой персональный помощник 130 не будет предоставлять один и тот же ответ на одно и то же высказывание в каждом случае, тем самым обеспечивая некоторое многообразие и непредсказуемость для взаимодействия пользователя с цифровым персональным помощником 130.
[0070] В одном варианте осуществления, система 138 понимания запроса и ответа для болтовни работает, чтобы сопоставлять высказывание типа болтовня с конкретным типом высказывания внутри иерархического дерева типов высказываний с ассоциированным с ним одним или более ответами. Система 138 понимания запроса и ответа для болтовни затем выбирает ответ на высказывание типа болтовня из ответа(ов), ассоциированных с ним.
[0071] Чтобы способствовать иллюстрации данной концепции, Фиг. 3 изображает примерное иерархическое дерево 300 типов высказываний, которое может быть использовано, чтобы выбирать ответ на высказывание типа болтовня в соответствии с вариантом осуществления. Как показано на Фиг. 3, корневым узлом иерархического дерева 300 является общий тип высказывания болтовня. Каждый тип высказывания ниже данного корневого узла содержит высказывание типа болтовня. На один уровень ниже данного корневого узла находятся высказывания типа болтовня, которые являются утверждениями («Утверждение»), командами («Команда»), кокетливыми по природе («Флирт»), запрашивающими информацию о цифровом персональном помощнике 130 («Информация о системе»), или запрашивающими мнение у цифрового персонального помощника 130 («Мнение системы»). Ниже каждого из этих узлов находятся дополнительные категории и подкатегории типов высказываний болтовня. Таким образом, типы высказываний, как правило, идут от более широких в типе иерархического дерева 300 к более узким в нижней части иерархического дерева 300.
[0072] В варианте осуществления, на основании анализа высказывания типа болтовня, система 138 понимания запроса и ответа для болтовни проходит по иерархическому дереву 300 и сопоставляет высказывание с одним из узлов. Например, система 138 понимания запроса и ответа для болтовни может генерировать показатель достоверности того, что некоторое высказывание типа болтовня должно быть сопоставлено с «Утверждением», «Командой», «Флиртом», «Информацией о системе» и «Мнением системы». Система 138 понимания запроса и ответа для болтовни затем выбирает узел, для которого был получен наивысший показатель достоверности (предполагая что, по меньшей мере, некоторый минимальный показатель достоверности был получен для, по меньшей мере, одного из узлов). Предположим в целях иллюстрации, что наивысший показатель достоверности генерируется для «Мнения системы». Тогда, система 108 понимания запроса и ответа для болтовни будет проходит иерархическое дерево 300 до узла «Мнение системы» и генерирует показатель достоверности так, что высказывание типа болтовня должно быть сопоставлено с каждым и узлов-потомков а именно «Мнение системы», «Microsoft», «Анализ тенденций» и «Совет». Система 138 понимания запроса и ответа для болтовни затем выбирает узел-потомок, для которого был достигнут наивысший показатель достоверности (вновь, предполагая, что некоторый минимальный показатель достоверности был получен для, по меньшей мере, одного из узлов-потомков). Если показатель достоверности для каждого из узлов-потомков ниже некоторого предварительно определенного минимального показателя достоверности, тогда проход по иерархическому дереву 300 останавливается на узе «Мнение системы».
[0073] Один или более ответы ассоциируются с каждым узлом в иерархическом дереве 300. Когда система 138 понимания запроса и ответа для болтовни выполнила проход по иерархическому дереву 300 и выбрала совпадающий узел для высказывания типа болтовня, тогда система 138 понимания запроса и ответа для болтовни может выбирать ответ из одного или более ответов, ассоциированных с сопоставленным узлом.
[0074] Вышеприведенный подход для идентификации подходящих ответов на высказывания типа болтовня является преимущественным в том, что он обеспечивает возможность определения ответов как для широких групп высказываний типа болтовня, так впрочем и более узких групп внутри более широких групп. В качестве примера, для узла «Microsoft» внутри узла «Мнение системы», могут быть созданы очень специфичные ответы на высказывания типа болтовня (например, «Я думаю, что Microsoft это отлично!»), поскольку система имеет высокий уровень достоверности в отношении того, что пользователь спрашивает мнение цифрового персонального помощника 130 касательно Microsoft. В противоположность, для узла «Мнение системы», может быть создан более общий ответ на высказывания типа болтовня (например, «Без комментариев» или «Я промолчу»), поскольку система имеет высокий уровень достоверности в отношении того, что пользователь спрашивает мнение цифрового персонального помощника 130, но не может определить предмет, в отношении которого ищется мнение.
[0075] В одном варианте осуществления, типы высказываний, которые могут быть включены в иерархическое дерево 300, могут быть определены посредством экспертизы посредством человека журналов регистрации высказываний пользователя и маркируя каждое высказывание соответствующим типом высказывания. Например, платформа коллективной работы, такая как Универсальная Человеческая Система Релевантности (UHRS), разработанная Microsoft Corporation из Редмонда, штат Вашингтон, может быть использована, чтобы получить экспертизу посредством человека и маркирование тысяч высказываний пользователя. Данная информация коллективной работы затем может быть использована, чтобы генерировать иерархическое дерево 300. По-прежнему могут быть использованы другие способы для генерирования иерархического дерева типов высказываний, такого как иерархическое дерево 300.
[0076] В другом варианте осуществления, система 138 понимания запроса и ответа для болтовни выполнена с возможностью сохранения одного или более ответов, ассоциированных с каждой из одной или более актуальных тем. Говоря в общем, актуальные темы являются темами, которые становятся популярными или недавно стали популярными с помощью пользователей и могут быть идентифицированы автоматически (например, посредством автоматического мониторинга высказываний подаваемых в цифровые персональные помощники, запросов поисковой машины, микроблогов, таких как TWITTER, сайтов социальных сетей, таких как FACEBOOK, новостных публикаций, или других источников) или вручную (например, посредством обследования человеком любых или всех этих источников). Когда система 138 понимания запроса и ответа для болтовни определяет, что высказывание типа болтовня ассоциировано с конкретной актуальной темой, тогда система 138 понимания запроса и ответа для болтовни может выбирать ответ на высказывание типа болтовня из одного или более ответов, ассоциированных с конкретной актуальной темой.
[0077] Дополнительно в соответствии с таким вариантом осуществления, актуальные темы могут быть представлены внутри иерархического дерева типов высказываний, которое используется системой 138 понимания запроса и ответа для болтовни, чтобы выбирать подходящий ответ на высказывание типа болтовня. Например, как показано на Фиг. 3, один из узлов под «Мнением системы» является «Анализ тенденций». Данный узел может быть использован, чтобы хранить ответы на высказывания типа болтовня, которые просят мнения цифрового персонального помощника 130 в отношении одной или более актуальных тем. Еще дополнительно в соответствии с данным вариантом осуществления, узел «Анализ тенденций» может иметь несколько узлов-потомков, ассоциированных с ним, при этом каждый узел потомок ассоциируется с конкретной актуальной темой и имеет один или более ассоциированные с ней ответы.
[0078] В еще одном другом варианте осуществления, система 138 понимания запроса и ответа для болтовни выполнена с возможностью сохранения одного или более ответов на некоторые высказывания типа болтовня, которые предназначены выражать образ цифрового персонального помощника 130. Например, может присутствовать заинтересованность в гарантировании того, что цифровой персональный помощник 130 имеет нечто сказать касательно конкретного слова, фразы, или темы, которая ассоциируется с его образом. В данном случае, редакционная коллегия может генерировать предварительно определенные ответы на некоторые высказывания типа болтовня, чтобы гарантировать то, что цифровой персональный помощник 130 предоставляет характерные ответы всякий раз, когда обсуждается такая тема. В данном случае, когда система 138 понимания запроса и ответа для болтовни определяет, что высказывание типа болтовня является высказыванием, для которого присутствует один или более предварительно определенные ответы, предназначенные выражать образ цифрового персонального помощника 130, система 138 понимания запроса и ответа для болтовни будет выбирать ответ на высказывание типа болтовня из одного или более предварительно определенных ответов.
[0079] Фиг. 4 является структурной схемой, которая показывает примерный ответ 400, который может быть предоставлен цифровым персональным помощником 130 в ответ на высказывание типа болтовня в соответствии с вариантом осуществления. Как показано на Фиг. 4, ответ 400 включает в себя некоторое количество компонентов, включая строку 402 дисплея, контент 404 речи, компонент 406 подражания речи, компонент 408 эмоции речи, анимацию 410 цифрового персонального помощника, мультимедийный компонент 412, и ссылку 414 на контент.
[0080] В зависимости от реализации, каждый из компонентов внутри ответа 400 может быть сохранен и/или генерироваться серверной частью 106 цифрового персонального помощника и передаваться к цифровому персональному помощнику 130 системой 138 понимания запроса и ответа для болтовни во время, когда ответ должен предоставляться пользователю. В качестве альтернативы, один, более чем один, или все из компонентов ответа 400 может быть сохранен на и/или генерироваться посредством вычислительного устройства 102 конечного пользователя (например, в энергонезависимой памяти 120) и система 138 понимания запроса и ответа для болтовни может отправлять цифровому персональному помощнику 130 информацию, достаточную, чтобы идентифицировать или получать компонент(ы) во время, когда ответ должен предоставляться пользователю, с тем, чтобы цифровой персональный помощник 130 мог получать компонент(ы) локально.
[0081] Кроме того, несмотря на то, что ответ 400 включает в себя семь разных компонентов, должно быть понятно, что ответ на высказывание типа болтовня может включать в себя меньше чем все из компонентов, показанных на Фиг. 4.
[0082] Строка 402 дисплея содержит текст, который должен быть отображен внутри интерфейса пользователя цифрового персонального помощника 130. Текст может содержать вербальный ответ на высказывание типа болтовня пользователя. В одном варианте осуществления, строка 402 дисплея может содержать цитату, которая ассоциирована с отсылкой к массовой культуре.
[0083] Контент 404 речи содержит речь, которая должна быть сгенерирована или воспроизведена посредством интерфейса пользователя цифрового персонального помощника 130. Цифровой персональный помощник 130 может генерировать такую речь посредством применения преобразования текста в речь к тесту, который содержит часть контента 404 речи. В качестве альтернативы, цифровой персональный помощник 130 может генерировать такую речь посредством воспроизведения аудио файла, который включен в или идентифицируется посредством контент 404 речи. В одном варианте осуществления, контент 404 речи содержит звуковую версию контента, включенного в строку 402 дисплея, несмотря на то, что это не обязательно должно быть так. Например, контент 404 речи может содержать вербальную информацию, которая полностью отличается от вербальной информации, включенной в строку 402 дисплея. Подобно строке 402 дисплея, контент контента 404 речи может содержать цитату, которая ассоциирована с отсылкой к массовой культуре.
[0084] Компонент 406 подражания речи является компонентом, который указывает на то, что цифровой персональный помощник 130 должен генерировать или воспроизводить контент 404 речи образом, который подражает голосу человека, такому как человек, ассоциированный с отсылкой к массовой культуре. Компонент 406 подражания речи может включать в себя или идентифицировать аудио файл, который должен быть воспроизведен цифровым персональным помощником 130, чтобы выполнить подражание. В качестве альтернативы, компонент 406 подражания речи может указывать на то, что особый преобразователь текста в речь должен быть использован цифровым персональным помощником 130, чтобы генерировать контент 404 речи образом, который подражает голосу требуемого человека.
[0085] Компонент 408 эмоции речи содержит эмоциональный элемент, который должен быть применен к контенту 404 речи, когда преобразование текста в речь применяется к такому контенту, чтобы сгенерировать речь.
[0086] Анимация 410 цифрового персонального помощника содержит анимацию аватара, который представляет собой цифрового персонального помощника 130, который должен быть отображен внутри его интерфейса пользователя. Анимация может быть исполнена таким образом, что она вызывает отсылку к массовой культуре. Несмотря на то, что описание ответа 400 относится к анимации 410 цифрового персонального помощника, следует понимать, что типы визуальных представлений аватара, отличные от анимации, могут быть использованы, чтобы вызывать отсылку к массовой культуре, включая статические изображения или подобное.
[0087] Мультимедийный компонент 412 содержит один или более мультимедийные объекты, которые должны быть отображены внутри или воспроизведены посредством интерфейса пользователя цифрового персонального помощника 130. Каждый мультимедийный объект может быть ассоциирован с отсылкой к массовой культуре. В зависимости от реализации, каждый мультимедийный объект может содержать, например, изображение, которое должно быть отображено внутри интерфейса пользователя цифрового персонального помощника 130, видео контент, который должен быть отображен внутри интерфейса пользователя цифрового персонального помощника 130, или аудио контент, который должен быть воспроизведен посредством интерфейса пользователя цифрового персонального помощника 130.
[0088] Ссылка на контент 414 содержит ссылку, которая может быть отображена внутри интерфейса пользователя цифрового персонального помощника 130 и которая может быть активирована пользователем, чтобы осуществить доступ к другому контенту. Например, ссылка может быть активирована пользователем, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
[0089] Фиг. 5-10 предоставляют некоторые примеры ответов на высказывания типа болтовня, которые могут быть доставлены через интерфейс пользователя цифрового персонального помощника 130. Эти примеры помогают иллюстрировать разнообразные компоненты, которые могут быть включены в ответ на высказывание типа болтовня в соответствии с вариантами осуществления. В примерах на Фиг. 5-10, вычислительное устройство 102 конечного пользователя является интеллектуальным телефоном и дисплей 118 является интегрированным дисплеем интеллектуального телефона. Тем не менее, как было отмечено ранее, вычислительное устройство 102 конечного пользователя не ограничивается интеллектуальными телефонами и может быть любым из широкого многообразия мобильных и не мобильных вычислительных устройств.
[0090] Фиг. 5 иллюстрирует ответ, который может быть предоставлен цифровым персональным помощником 130 на высказывание типа болтовня «Я нервничаю из-за теста по статистике». В ответ на данное высказывание типа болтовня, строка 502 дисплея, содержащая слова «Да прибудет с тобой сила», отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Данный текст строки дисплея содержит хорошо известную цитату из популярного фильма «Звездные войны».
[0091] В дополнение, в ответ на высказывание типа болтовня, визуальное представление 504 цифрового персонального помощника 130 отображается внутри графического интерфейса пользователя. Визуальное представление 504 включает в себя световой меч, и таким образом также вызывает воспоминание о фильме «Звездные войны». В варианте осуществления, визуальное представление 504 может содержать часть анимации аватара цифрового персонального помощника 130, которая размахивает световым мечем, возможно сопровождаемое слышимыми звуками светового меча, которые воспроизводятся через один или более громкоговорители вычислительного устройства 102 конечного пользователя.
[0092] В варианте осуществления, ответ, предоставленный на Фиг. 5, также включает в себя слышимую речь, которая воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя, при этом такая речь также включает в себя слова «Да прибудет с тобой сила». В варианте осуществления, речь содержит подражание знаменитому персонажу «Звездных войн», такому как Йода или Оби-Ван Кеноби. Как было описано ранее, такая речь может быть исполнена посредством воспроизведения предназначенного аудио файла или посредством применения процесса преобразования текста в речь к тексту «Да прибудет с тобой сила». В зависимости от реализации, подражание может быть исполнено таким образом, что очевидно, что человек отличный от персонажа «Звездных войн» выполняет подражание (например, голос по умолчанию, ассоциированный с цифровым персональным помощником 130 выполняет подражание). В других подражаниях, подражание может создавать голос, который неотличим от того, что у персонажа «Звездных войн», или может фактически быть голосом актера, который играл персонажа «Звездных войн».
[0093] Вместе взятые, строка 502 дисплея, визуальное представление 504, и речь, доставляемая с подражанием, не только соответствующим образом отвечают на высказывание типа болтовня пользователя предлагая слова ободрения, но также служат для сильного вызова отсылки к массовой культуре («Звездные войны»), что вероятно будет мгновенно знакомо пользователю и поможет создать чувство общности с ним. Кроме того, поскольку ответ включает в себя разнообразные формы сенсорного вывода, включая анимацию светового меча и подражаемый голос, ответ более вероятно контактирует с и развлекает пользователя, чем ответ в форме плоского текста.
[0094] Фиг. 6 иллюстрирует ответ, который может быть предоставлен цифровым персональным помощником 130 на высказывание типа болтовня «Как я могу ограбить банк?». В ответ на данное высказывание типа болтовня, строка 602 дисплея, содержащая слова «Для этих ребят это добром не кончилось.», отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Ответ также может включать в себя слышимую речь, которая воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя, при этом такая речь также включает в себя слова «Для этих ребят это добром не кончилось.». Текст строки 602 дисплея обращается к объекту 604 мультимедиа, который также отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Как показано на Фиг. 6, мультимедийный объект 604 содержит изображение афиши фильма «Бонни и Клайд» 1967г., который является драмой о жизни и смерти хорошо известных грабителей банков Бонни Паркер и Клайда Бэрроу.
[0095] Вместе взятые, строка 602 дисплея (и соответствующая слышимая речь) и мультимедийный объект 604 содержат ответ на высказывание болтовня «Как я могу ограбить банк?», оба из которых соответствующим образом отвечают на высказывание типа болтовня пользователя, указывая опасности ограбления банка (Бонни и Клайд были застрелены офицерами полиции) а также вызывают отсылку к массовой культуре (Бонни и Клайд и фильм с одноименным названием), что вероятно будет знакомо пользователю и поможет создать чувство общности с ним. Кроме того, поскольку ответ формирует вывод отличный от плоского текста, более вероятно обеспечение контактирования с и развлечения пользователя.
[0096] Фиг. 7 иллюстрирует ответ, который может быть предоставлен цифровым персональным помощником 130 на высказывание типа болтовня «Какой ваш любимый автомобиль во всем мире?». В ответ на данное высказывание типа болтовня, строка 702 дисплея, содержащая слова «Я люблю Deloreans. Особенно те, которые путешествуют во времени», отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Ответ также может включать в себя слышимую речь, которая воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя, при этом такая речь также включает в себя слова «Я люблю Deloreans. Особенно те, которые путешествуют во времени». Данный текст и речь относятся к хорошо известному фильму «Назад в будущее».
[0097] Как так же показано на Фиг. 7, ответ также включает в себя мультимедийный объект 704 в форме видео YOUTUBE®, именуемого «Назад в будущее - Сцена с часовой башней.av», которое может быть воспроизведено и просмотрено пользователем внутри контекста графического интерфейса пользователя цифрового персонального помощника 130.
[0098] Как дополнительно показано на Фиг. 7, ответ включает в себя ссылку 706 которая, когда активируется пользователем, позволяет пользователю искать в Web фразу «Какой ваш любимый автомобиль во всем мире?», которая является исходным высказыванием. Отмечается, что в альтернативных вариантах осуществления, может быть предоставлена ссылка, которая, когда активируется пользователем, позволяет пользователю искать в Web контент, ассоциированный с отсылкой к массовой культуре (например, фильмом «Назад в будущее»).
[0099] Подобно ответам на Фиг. 5 и 6, ответ на Фиг. 7 прочно вызывает отсылку к массовой культуре и, следовательно, может создавать общность с пользователем. Кроме того, видео контент, который может быть просмотрен непосредственно из графического интерфейса пользователя цифрового персонального помощника 130, делает ответ весьма контактным.
[0100] Фиг. 8 иллюстрирует ответ, который может быть предоставлен цифровым персональным помощником 130 на высказывание типа болтовня «Ты стерва». В ответ на данное высказывание типа болтовня, строка 802 дисплея, содержащая слова «Я также любовница, ребенок и мать», отображаются внутри графического интерфейса пользователя цифрового персонального помощника 130. Ответ также может включать в себя слышимую речь, которая воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя, при этом такая речь также включает в себя слова «Я также любовница, ребенок и мать». Данный текст и речь содержат часть слов хорошо известной песни «Стерва» в исполнении Мередит Брукс.
[0101] Как также показано на Фиг. 8, ответ также включает в себя мультимедийный объект 804 в форме изображения Мередит Брукс. Ответ также включает в себя часть 806 текста, которая предоставляет информацию о песни «Стерва» и также может включать в себя одну или более ссылки, которые могут быть активированы пользователем, чтобы купить цифровую копию песни из одного или более источников, соответственно.
[0102] Ответ на Фиг. 8 умело использует отсылку к массовой культуре, чтобы отвечать на (и несколько менять направление) по внешнему виду непочтительное высказывание типа болтовня. Ответ, показанный на Фиг. 8, также иллюстрирует то, каким образом ответ на высказывание типа болтовня может служить в некоторых отношениях в качестве рекламы или коммерческой возможности в том, что пользователь имеет возможность купить песню, которая упоминается в ответе.
[0103] Фиг. 9 иллюстрирует ответ, который может быть предоставлен цифровым персональным помощником 130 на высказывание типа болтовня «Кто твой папа?». В ответ на данное высказывание типа болтовня, строка 902 дисплея, содержащая слова «Эти парни», отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Ответ также может включать в себя слышимую речь, которая воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя, при этом такая речь также включает в себя слова «Эти парни». Текст строки 902 дисплея относится к мультимедийному объекту 904, который также отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Как показано на Фиг. 9, мультимедийный объект 904 содержит видео Билла Гейтса (председатель Microsoft) и Стива Балмера (главный исполнительный директор Microsoft), одетых как персонажи Остин Пауэрс и Доктор Зло, соответственно, из очень популярного фильма «Остин Пауэрс». Данное видео может быть воспроизведено и просмотрено пользователем внутри контекста графического интерфейса пользователя цифрового персонального помощника 130.
[0104] В варианте осуществления, в котором цифровой персональный помощник 130 выпускается Microsoft Corporation из Редмонд, штат Вашингтон, ответ, показанный на Фиг. 9, является уместным, поскольку фигуры, показанные в видео, являются хорошо известными лицами, ассоциированными с Microsoft. Кроме того, видео контент является забавным и осуществляющим контакт с пользователем.
[0105] Фиг. 10 иллюстрирует ответ, который может быть предоставлен цифровым персональным помощником 130 на высказывание типа болтовня «Покажи мне нечто смешное?». В ответ на данное высказывание типа болтовня, строка 1002 дисплея, содержащая слова «Мой друг имеет свое мнение», отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Ответ также может включать в себя слышимую речь, которая воспроизводится через один или более громкоговорители вычислительного устройства 102 конечного пользователя, при этом такая речь также включает в себя слова «Мой друг имеет свое мнение». Текст строки 1002 дисплея относится к мультимедийному объекту 1004, который также отображается внутри графического интерфейса пользователя цифрового персонального помощника 130. Как показано на Фиг. 10, мультимедийный объект 1004 содержит изображение сердито выглядящего кота со слоганом: «У меня раз было веселье. Это было ужасно». Данное изображение является ссылкой на популярный интернет мим «Сердитый кот», который может быть мгновенно распознан пользователем и который также может служить для того, чтобы развлекать и контактировать с пользователем.
[0106] Вышеприведенные примеры на Фиг. 5-10 были предоставлены в данном документе лишь в качестве примера. Специалистам в соответствующей области(ях) техники следует иметь в виду, что широкое многообразие ответов на высказывания типа болтовня может быть предоставлено в отличие от тех, что изображены на Фиг. 5-10. Такие ответы могут включать в себя любой один или более из компонентов ответа, ранее описанных со ссылкой на Фиг. 4, как впрочем и дополнительные компоненты.
III. Примерные способы для реализации цифрового персонального помощника, который использует подражания и/или мультимедиа в ответах
[0107] Фиг. 11 изображает блок-схему 1100 способа для реализации цифрового персонального помощника, который использует подражания и/или мультимедиа при ответе на высказывания типа болтовня в соответствии с вариантом осуществления. Способ блок-схемы 1100 может быть выполнен, например, посредством серверной части 106 цифрового персонального помощника, как рассмотрено выше со ссылкой на Фиг. 1. Соответственно, способ блок-схемы 1100 теперь будет описан, продолжая ссылаться на систему 100 на Фиг. 1. Тем не менее, способ не ограничивается этой реализацией.
[0108] Как показано на Фиг. 11, способ блок-схемы 1100 начинается на этапе 1102, на котором принимается цифровое представление высказывания пользователя цифрового персонального помощника. Цифровое представление высказывания может содержать, например, высказывание, которое сгенерировано услугой 132 распознавания речи, или скорректированное высказывание, сгенерированное посредством взаимодействия пользователя с цифровым персональным помощником 130, как рассмотрено выше со ссылкой на Фиг. 2. Как дополнительно рассматривалось в отношении фигуры, цифровое представление высказывания принимается системой 136 понимания запроса и ответа.
[0109] На этапе 1104, цифровое представление высказывания анализируется. Как рассмотрено выше со ссылкой на Фиг. 2, данный этап может влечь за собой анализ, выполняемый системой 136 понимания запроса и ответа, чтобы определять, содержит ли высказывание типа болтовня.
[0110] На этапе 1106, на основании, по меньшей мере, анализа цифрового представления высказывания, определяется, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника. Как рассмотрено выше со ссылкой на Фиг. 2, данный этап происходит, когда система 136 понимания запроса и ответа определяет, что высказывание является высказыванием типа болтовня. Как отмечено ранее, данное определение может быть основано на анализе высказывания, выполненного системой 136 понимания запроса и ответа.
[0111] На этапе 1108, в ответ на, по меньшей мере, определение, выполненное на этапе 1106, предписывается генерировать ответ на высказывание посредством цифрового персонального помощника, который включает в себя, по меньшей мере, одно из следующего: мультимедийный объект, ассоциированный с отсылкой к массовой культуре, и речь, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре. Мультимедийный объект может содержать, например, изображение, видео контент, или аудио контент, и может быть отображен внутри или воспроизведен посредством интерфейса пользователя цифрового персонального помощника. Речь может быть сгенерирована и воспроизведена посредством цифрового персонального помощника. Данный этап может быть выполнен, например, посредством системы 138 понимания запроса и ответа для болтовни, которая предписывает цифровому персональному помощнику 130 предоставить ответ, который включает в себя мультимедийный объект, такой как мультимедийный компонент 404, описанный выше со ссылкой на Фиг. 4, или который включат в себя речь с подражанием, как указывается компонентом 406 подражания речи, как описано выше со ссылкой на Фиг. 4. Способ, посредством которого система 138 понимания запроса и ответа для болтовни выполняет данную функцию были описаны ранее.
[0112] Как также было описано ранее, ответ на высказывание, рассмотренный на этапе 1108, может дополнительно включать в себя: текст, который отображается внутри интерфейса пользователя цифрового персонального помощника, при этом текст содержит цитату, ассоциированную с отсылкой к массовой культуре; визуальное представление цифрового персонального помощника (например, анимацию цифрового персонального помощника), которое отображается внутри его интерфейса пользователя и которое вызывает отсылку к массовой культуре; и/или ссылку, которая отображается внутри интерфейса пользователя цифрового персонального помощника, и которая может быть активирована пользователем, чтобы осуществить доступ к контенту, такому как контент, ассоциированный с высказыванием типа болтовня или с отсылкой к массовой культуре. Дополнительно, речь, которая генерируется или воспроизводится цифровым персональным помощником, может содержать цитату, ассоциированную с отсылкой к массовой культуре.
[0113] В одном варианте осуществления, предписание генерировать ответ на высказывание на этапе 1108 содержит идентификацию множества подходящих ответов на высказывание и затем выбор ответа на высказывание из множества подходящих ответов на высказывание.
[0114] В другом варианте осуществления, предписание генерировать ответ на высказывание на этапе 1108 содержит сопоставление высказывания с конкретным типом высказывания в иерархическом дереве типов высказываний (например, иерархическом дереве 300 как рассмотрено выше со ссылкой на Фиг. 3), причем каждый тип высказывания в иерархическом дереве типов высказываний имеет один или более ассоциированные с ним ответы. После сопоставления, ответ на высказывание выбирается из ответа(ов), ассоциированного с конкретным типом высказывания.
[0115] В еще одном другом варианте осуществления, предписание генерировать ответ на высказывание на этапе 1108 содержит определение того, что высказывание ассоциировано с актуальной темой и тогда, в ответ на определение того, что высказывание ассоциировано с актуальной темой, выбор ответа на высказывание из одного или более ответов, ассоциированных с актуальной темой.
[0116] В дополнительном варианте осуществления, предписание генерировать ответ на высказывание на этапе 1108 содержит определение того, что высказывание является высказыванием для которого присутствует один или более предварительно определенные ответы, предназначенные для выражения образа цифрового персонального помощника и, в ответ на данное определение, выбор ответа на высказывание из одного или более предварительно определенных ответов.
[0117] В еще одном дополнительном варианте осуществления, предписание генерировать ответ на высказывание на этапе 1108 содержит отправку аудио файла, который включает в себя речь или информацию, которая идентифицирует аудио файл, вычислительному устройству, исполняющему цифровой персональный помощник. Данный этап может быть выполнен, например, когда система 138 понимания запроса и ответа для болтовни отправляет аудио файл, который включает в себя речь с подражанием вычислительному устройству 102 конечного пользователя таким образом, что доступ к нему может быть осуществлен или он может быть воспроизведен цифровым персональным помощником 130, или когда система 138 понимания запроса и ответа для болтовни отправляет информацию, которая идентифицирует такой аудио файл, цифровому персональному помощнику 130 таким образом, что аудио файл может быть получен локально цифровым персональным помощником 130.
[0118] В еще одном другом варианте осуществления, предписание генерировать ответ на высказывание на этапе 1108 содержит предоставление текста вычислительному устройству, исполняющему цифровой персональный помощник, при этом текст должен быть обработан компонентом преобразования текста в речь цифрового персонального помощника, чтобы сгенерировать речь. Данный этап может быть выполнен, например, когда система 138 понимания запроса и ответа для болтовни отправляет указание цифровому персональному помощнику в отношении того, что цифровой персональный помощник 130 должен применить особый преобразователь текста в речь к предназначенному тексту, чтобы вызвать преобразование текста в речь образом, который подражает голосу конкретного человека.
[0119] Фиг. 12 изображает блок-схему 1200 способа, посредством которого цифровой персональный помощник предоставляет ответ на высказывание типа болтовня, который включает в себя подражание голосу в соответствии с вариантом осуществления. Способ блок-схемы 1200 может быть выполнен, например, посредством цифрового персонального помощника 130 как рассмотрено выше со ссылкой на Фиг. 1. Соответственно, способ блок-схемы 1200 теперь будет описан продолжая ссылаться на систему 100 с Фиг. 1. Тем не менее, способ не ограничивается этой реализацией.
[0120] Как показано на Фиг. 12, способ блок-схемы 1200 начинается на этапе 1202, на котором цифровой персональный помощник 130 захватывает аудио, которое представляет собой высказывание пользователя, предназначенное для того, чтобы контактировать с образом персонального цифрового помощника 130.
[0121] На этапе 1204, цифровой персональный помощник передает аудио серверной части 106 цифрового персонального помощника.
[0122] На этапе 1206, цифровой персональный помощник 130 предоставляет ответ на высказывание, основанный, по меньшей мере, на информации, принятой от серверной части 106 цифрового персонального помощника. Предоставление ответа включает в себя генерирование или воспроизведение речи, которая содержит подражание голосу образа, ассоциированного с отсылкой к массовой культуре.
[0123] В варианте осуществления, предоставление ответа на этапе 1206 включает в себя воспроизведение аудио файла, который включает в себя речь. В альтернативном варианте осуществления, предоставление ответа на этапе 1206 включает в себя применение преобразования текста в речь к тексту, чтобы сгенерировать речь.
[0124] В соответствии с дополнительными вариантами осуществления, предоставление ответа на этапе 1206 включает в себя одно или более из следующего: отображение или воспроизведение мультимедийного объекта посредством интерфейса пользователя цифрового персонального помощника 130, при этом мультимедийный объект ассоциирован с отсылкой к массовой культуре; отображение текста внутри интерфейса пользователя цифрового персонального помощника, при этом текста, содержащего цитату, ассоциированную с отсылкой к массовой культуре; отображение визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре внутри интерфейса пользователя цифрового персонального помощника; и отображение ссылки внутри интерфейса пользователя цифрового персонального помощника, которая может быть активирована пользователем, чтобы осуществить доступ к контенту, такому как контент, ассоциированный с высказыванием или с отсылкой к массовой культуре.
[0125] Фиг. 13 изображает блок-схему 1300 способа, посредством которого цифровой персональный помощник предоставляет ответ на высказывание типа болтовня, который включает в себя мультимедийный объект, в соответствии с вариантом осуществления. Способ блок-схемы 1300 может быть выполнен, например, цифровым персональным помощником 130 как рассматривается выше со ссылкой на Фиг. 1. Соответственно, способ блок-схемы 1300 теперь будет описан продолжая ссылаться на систему 100 с Фиг. 1. Тем не менее, способ не ограничивается этой реализацией.
[0126] Как показано на Фиг. 13, способ блок-схемы 1300 начинается на этапе 1302, на котором цифровой персональный помощник 130 захватывает аудио, которое представляет собой высказывание пользователя, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника 130.
[0127] На этапе 1304, цифровой персональный помощник 130 передает аудио серверной части 106 цифрового персонального помощника.
[0128] На этапе 1306, цифровой персональный помощник 130 предоставляет ответ на высказывание, основанный, по меньшей мере, на информации, принятой от серверной части 106 цифрового персонального помощника. Предоставление ответа включает в себя отображение или воспроизведение мультимедийного объекта, ассоциированного с отсылкой к массовой культуре посредством интерфейса пользователя цифрового персонального помощника 130.
[0129] В варианте осуществления, отображение или воспроизведение мультимедийного объекта на этапе 1306 содержит отображение изображения или видео контента или воспроизведение аудио контента посредством интерфейса пользователя цифрового персонального помощника 130.
[0130] В соответствии с дополнительными вариантами осуществления, предоставление ответа на этапе 1306 включает в себя одно или более из следующего: генерирование или воспроизведение речи, которая содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре; отображение текста внутри интерфейса пользователя цифрового персонального помощника, при этом текста, содержащего цитату, ассоциированную с отсылкой к массовой культуре; отображение визуального представления цифрового персонального помощника, которое вызывает отсылку к массовой культуре, внутри интерфейса пользователя цифрового персонального помощника; и отображение ссылки внутри интерфейса пользователя цифрового персонального помощника, которая может быть активирована пользователем, чтобы осуществлять доступ к контенту, такому как контент, ассоциированный с вы сказанием или с отсылкой к массовой культуре.
IV. Примерная реализация мобильного устройства
[0131] Фиг. 14 является структурной схемой примерного мобильного устройства 1402, которое может быть использовано, чтобы реализовывать вычислительное устройство 102 конечного пользователя, как описано выше со ссылкой на Фиг. 1. Как показано на Фиг. 14, мобильное устройство 1402 включает в себя многообразие опциональных компонентов аппаратного и программного обеспечения. Любой компонент в мобильном устройстве 1402 может осуществлять связь с любым другим компонентом, несмотря на то, что не все соединения показаны для простоты иллюстрации. Мобильное устройство 1402 может быть любым из многообразия вычислительных устройств (например, сотовым телефоном, интеллектуальным телефоном, переносным компьютером, Персональным Цифровым Помощником (PDA), и т.д.) и может обеспечивать беспроводную двустороннюю связь с одной или более сетями 1404 мобильной связи, такой как сотовая или спутниковая сеть, или с локальной или глобальной сетью.
[0132] Иллюстрируемое мобильное устройство 1402 может включать в себя контроллер или процессор 1410 (например, сигнальный процессор, микропроцессор, ASIC, или другую схему логики управления и обработки) для выполнения таких задач как кодирование сигнала, обработка данных, обработка ввода/вывода, управление питанием, и/или других функций. Операционная система 1412 может управлять распределением и использованием компонентов мобильного устройства 1402 и обеспечивать поддержку для одной или более прикладных программ 1414 (также именуемых «приложениями» или «небольшие приложения»). Прикладные программы 1414 могут включать в себя общие мобильные вычислительные приложения (например, приложения работы с электронной почтой, календари, менеджеры контактов, Web-браузеры, приложения обмена сообщениями) и любые другие вычислительные приложения (например, приложения электронной обработки текста, приложения картографии, приложения мультимедийного проигрывателя). В одном варианте осуществления, прикладные программы 1414 включают в себя цифровой персональный помощник 130.
[0133] Иллюстрируемое мобильное устройство 1402 может включать в себя память 1420. Память 1420 может включать в себя несъемную память 1422 и/или съемную память 1424. Несъемная память 1422 может включать в себя RAM, ROM, флэш-память, жесткий диск, или другие хорошо известные устройства памяти или технологии. Съемная память 1424 может включать в себя флэш-память или карту Модуля Идентификации Абонента (SIM), которая хорошо известна в системах связи GSM, или другие хорошо известные устройства памяти или технологии, такие как «интеллектуальные карты». Память 1420 может быть использована для хранения данных и/или кода для работы операционной системы 1412 и приложений 1414. Примерные данные могут включать в себя Web-страницы, текст, изображения, звуковые файлы, видео данные, или другие данные, которые должны быть отправлены к и/или приняты от одного или более сетевых серверов или других устройств через одну или более проводные или беспроводные сети. Память 1420 может быть использована, чтобы хранить идентификатор абонента, такой как Международный Идентификационный Номер Мобильного Абонента (IMSI), и идентификатор оборудования, такой как Международный Идентификатор Мобильного Оборудования (IMEI). Такие идентификаторы могут быть переданы сетевому серверу, чтобы идентифицировать пользователей и оборудование.
[0134] Мобильное устройство 1402 может поддерживать одно или более устройства 1430 ввода, такое как сенсорный экран 1432, микрофон 1434, камера 1436, физическая клавиатура 1438 и/или шаровой манипулятор 1440 и одно или более устройства 1450 вывода, такое как громкоговоритель 1452 и дисплей 1454. Сенсорные экраны, такие как сенсорный экран 1432, могут обнаруживать ввод разными способами. Например, емкостные сенсорные экраны обнаруживают сенсорный ввод, когда объект (например, кончик пальца) искажает или нарушает электрический ток, проходящий по поверхности. В качестве другого примера, сенсорные экраны могут использовать оптические датчики, чтобы обнаруживать сенсорный ввод, когда нарушаются лучи от оптических датчиков. Физический контакт с поверхностью экрана необязателен для того, чтобы ввод обнаруживался некоторыми сенсорными экранами.
[0135] Другие возможные устройства вывода (не показано) могут включать в себя пьезоэлектрические или другие тактильные устройства вывода. Некоторые устройство могут обслуживать более чем одну функцию ввода/вывода. Например, сенсорный экран 1432 и дисплей 1454 могут быть объединены в единое устройство ввода/вывода. Устройства 1430 ввода могут включать в себя Естественный Интерфейс Пользователя (NUI).
[0136] Беспроводной модем(ы) 1460 может быть связан с антенной(ами) (не показано) и может обеспечивать двустороннюю связь между процессором 1410 и внешними устройствами, как хорошо понятно в данной области техники. Модем(ы) 1460 показаны в общем и могут включать в себя сотовый модем 1466 для осуществления связи с сетью 1404 мобильной связи и/или другие основанные на радиосвязи модемы (например, Bluetooth 1464 и/или Wi-Fi 1462). По меньше мере, один из беспроводного модема(ов) 1460, как правило, выполнен с возможностью связи с одной или более сотовыми сетями, такими как сеть GSM для осуществления голосовой связи и связи для передачи данных внутри единой сотовой сети, между сотовыми сетями, или между мобильным устройством и телефонной коммутируемой сетью общего пользования (PSTN).
[0137] Мобильное устройство 1402 может дополнительно включать в себя, по меньшей мере, один порт 1480 ввода/вывода, источник 1482 питания, приемник 1484 спутниковой навигационной системы, такой как приемник Глобальной Системы Позиционирования (GPS), акселерометр 1486, и/или физический соединитель 1490, который может быть портом USB, портом IEEE 1394 (FireWire), и/или портом RS-232. Иллюстрируемые компоненты мобильного устройства 1402 не являются требуемыми или включающими в себя все, поскольку любые компоненты могут быть удалены и другие компоненты могут быть добавлены, как будет понятно специалисту в соответствующей области техники.
[0138] В варианте осуществления, некоторые компоненты мобильного устройства 1402 выполнены с возможностью выполнения операций приписанных цифровому персональному помощнику 130, как описывается в предшествующих разделах. Логика компьютерной программы для выполнения операций, приписанных цифровому персональному помощнику 130, как описано выше, может храниться в памяти 1420 и исполняться процессором 1410. Посредством исполнения такой логики компьютерной программы, процессору 1410 может быть предписано реализовывать любой из признаков цифрового персонального помощника 130, как описано выше со ссылкой на Фиг. 1. Также, посредством исполнения такой логики компьютерной программы, процессору 1410 может быть предписано выполнить любой или все из этапов любой или всех из блок-схем, изображенных на Фиг. 12 и 13.
V. Примерная реализация компьютерной системы
[0139] Фиг. 15 изображает примерную основанную на процессоре компьютерную систему 1500, которая может быть использована, чтобы реализовывать разнообразные варианты осуществления, описываемые в данном документе. Например, система 1500 может быть использована, чтобы реализовывать вычислительное устройство 102 конечного пользователя или любой из компьютеров, используемых чтобы реализовывать серверную часть 106 цифрового персонального помощника, как описано выше со ссылкой на Фиг. 1. Система 1500 также может быть использована чтобы реализовывать любые или все этапы любой или всех из блок-схем, изображенных на Фиг. 11-13. Описание системы 1500, предоставленное в данном документе, предоставлено в целях иллюстрации, и не предназначено быть ограничивающим. Варианты осуществления могут быть реализованы в будущих типах компьютерных систем, как будет известно специалистам в соответствующей области(ях) техники.
[0140] Как показано на Фиг. 15, система 1500 включает в себя блок 1502 обработки, память 1504 системы, и шину 1506, которая связывает разнообразные компоненты системы, включая память 1504 системы с блоком 1502 обработки. Блок 1502 обработки может содержать один или боле микропроцессоры или ядра микропроцессора. Шина 1506 представляет собой одну или более из любого из нескольких типов структур шины, включая шину памяти или контроллер памяти, периферийную шину, ускоренный графический порт, и процессорную или локальную шину, использующую любую из многообразия архитектур шины. Память 1504 системы включает в себя постоянную память 1508 (ROM) и память 1510 с произвольным доступом (RAM). Базовая система 1512 ввода/вывода (BIOS) хранится в ROM 1508.
[0141] Система 1500 также имеет один или более из следующих накопителей: накопитель 1514 на жестком диске для чтения с и записи на жесткий диск, накопитель 1516 на магнитном диске для чтения с или записи на съемный магнитный диск 1518, и накопитель 1520 на оптическом диске для чтения с или записи на съемный оптический диск 1522, такой как CD ROM, DVD ROM, BLU-RAY™ диск или другие оптические носители информации. Накопитель 1514 на жестком диске, накопитель 1516 на магнитном диске, и накопитель 1520 на оптическом диске соединены с шиной 1506 посредством интерфейса 1524 накопителя на жестком диске, интерфейса 1526 накопителя на магнитном диске, и интерфейса 1520 накопителя на оптическом диске, соответственно. Накопители и их ассоциированные машиночитаемые носители информации обеспечивают энергонезависимое хранилище машиночитаемых инструкций, структур данных, программных модулей и прочих данных для компьютера. Несмотря на то, что описывается жесткий диск, съемный магнитный диск и съемный оптический диск, другие типы машиночитаемых устройств памяти и структур хранения могут быть использованы, чтобы хранить данные, такие как карты флэш-памяти, цифровые видео диски, памяти с произвольным доступом (RAM), постоянные памяти (ROM), и подобное.
[0142] Некоторое количество программных модулей может храниться на жестком диске, магнитном диске, оптическом диске, ROM, или RAM. Эти программные модули включают в себя операционную систему 1530, одну или более прикладные программы 1532, другие программные модули 1534, и данные 1536 программы. В соответствии с разнообразными вариантами осуществления, программные модули могут включать в себя логику компьютерной программы, которая является исполняемой посредством блока 1502 обработки, чтобы выполнять любую или все из функций и признаков вычислительного устройств 102 конечного пользователя или любых из компьютеров, используемых, чтобы реализовать серверную часть 106 цифрового персонального помощника, как описано выше со ссылкой на Фиг. 1. программные модули также могут включать в себя логику компьютерной программы, которая, когда исполняется блоком 1502 обработки, выполняет любые из этапов или операций, показанных или описанных со ссылкой на блок-схемы Фиг. 11-13.
[0143] Пользователь может вводить команды и информацию в систему 1500 посредством устройств ввода, таких как клавиатура 1538 и координатно-указательное устройство 1540. Другие устройства ввода (не показано) могут включать в себя микрофон, игровой манипулятор, игровой контроллер, сканер, и подобное. В одном варианте осуществления, сенсорный экран предусмотрен совместно с дисплеем 1544, чтобы позволить пользователю предоставлять ввод пользователя через приложение касания (как посредством пальца или стилуса например) к одной или более точкам на сенсорным экране. Эти и прочие устройства ввода часто соединены с блоком 1502 обработки посредством интерфейса 1542 последовательного порта, который связан с шиной 1506, однако могут быть соединены посредством других интерфейсов, таких как параллельный порт, игровой порт, или универсальная последовательная шина (USB). Такие интерфейсы могу быть проводными или беспроводными интерфейсами.
[0144] Дисплей 1544 также соединен с шиной 1506 через интерфейс, такой как видео адаптер 1546. В дополнение к дисплею 1544, система 1500 может включать в себя другие периферийные устройства вывода (не показано). такие как громкоговорители и принтеры.
[0145] Система 1500 соединена с сетью 1548 (например, локальной сетью или глобальной сетью, такой как Интернет) через сетевой интерфейс или адаптер 1550, модем 1552, или другое подходящее средство для создания связи через сеть. Модем 1552, который может быть внутренним или внешним, соединен с шиной 1506 через интерфейс 1542 последовательного порта.
[0146] Используемые в данном документе понятия «компьютерный программный носитель информации», «машиночитаемый носитель информации», и «машиночитаемый запоминающий носитель информации» используются, чтобы в общем относиться к устройствам памяти и структурам хранения, таким как жесткий диск, ассоциированный с накопителем 1514 на жестком диске, съемный магнитный диск 1518, съемный оптический диск 1522, как впрочем и другим устройствам памяти или структурам хранения, таким как карты флэш-памяти, цифровые видео диски, памяти с произвольным доступом (RAM), постоянные памяти (ROM), и подобное. Такие машиночитаемые запоминающие носители информации отличаются от и не перекрываются со средствами связи (не включают в себя средства связи). Средства связи, как правило, воплощают машиночитаемые инструкции, структуры данных, программные модули или другие данные в модулированном сигнале данных, таком как несущая волна. Понятие «модулированный сигнал данных» означает сигнал, одна или более характеристики которого установлены или изменены таким образом, чтобы кодировать информацию в сигнале. В качестве примера, а не ограничения, средства связи включают в себя беспроводные средства, такие как акустические, RF, инфракрасные и другие беспроводные средства. Варианты осуществления также направлены на такие средства связи.
[0147] Как отмечено выше, компьютерные программы и модули (включая прикладные программы 1532 и другие программные модули 1534) могут храниться на жестком диске, магнитном диске, оптическом диске, ROM, или RAM. Такие компьютерные программы также могут быть приняты через сетевой интерфейс 1550, интерфейс 1542 последовательного порта, или любой другой тип интерфейса. Такие компьютерные программы, когда исполняются или загружаются посредством приложения, позволяют компьютеру 1500 реализовать признаки вариантов осуществления настоящего изобретения, рассматриваемого в данном документе. Соответственно, такие компьютерные программы представляют собой контроллеры системы 1500.
[0148] Варианты осуществления также направлены на компьютерные программные продукты, содержащие программное обеспечение, хранящееся на любом пригодном для компьютера носителе информации. Такое программное обеспечение, когда исполняется в одном или более устройствах обработки данных, предписывает устройству(ам) обработки данных работать как описывается в данном документе. Варианты осуществления настоящего изобретения используют любой пригодный для компьютера или машиночитаемый носитель информации, известный в настоящее время или в будущем. Примеры машиночитаемых носителей информации включают в себя, но не ограничиваются, устройства памяти и структуры хранения, такие как RAM, жесткие диски, гибкие диски, CD ROM, DVD ROM, zip-диски, ленты, магнитные запоминающие устройства, оптические запоминающие устройства, MEM, запоминающие устройства основанные на нанотехнологии, и подобное.
[0149] В альтернативных вариантах осуществления, система 1500 может быть реализована в качестве логики аппаратного обеспечения/электрической схемы или встроенного программного обеспечения. В соответствии с дополнительными вариантами осуществления, один или более из этих компонентов может быть реализован в системе на кристалле (SoC). S°C может включать в себя чип интегральной микросхемы, который включает в себя один или более процессор (например, микроконтроллер, микропроцессор, цифровой сигнальный процессор (DSP), и т.д.), память, один или более интерфейсы связи, и/или дополнительные схемы и/или вложенное встроенное программное обеспечение, чтобы выполнять его функции.
VI. Заключение
[0150] В то время как выше были описаны разнообразные варианты осуществления, должно быть понятно, что они были представлены лишь в качестве примера, а не ограничения. Специалистам в соответствующей области(ях) техники будет очевидно, что разнообразные изменения по форме и в деталях могут быть выполнены здесь, не отступая от сущности и объема изобретения. Таким образом, широта и объем настоящего изобретения не должны ограничиваться любым из описанных выше примерных вариантов осуществления, а должны определяться только в соответствии с нижеследующей формулой изобретения и ее эквивалентами.
Claims (29)
1. Способ для реализации цифрового персонального помощника (130), содержащий этапы, на которых:
принимают (1102) цифровое представление высказывания пользователя цифрового персонального помощника;
на основании по меньшей мере анализа цифрового представления высказывания определяют (1106), что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника;
в ответ на по меньшей мере определение того, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника, идентифицируют множество подходящих ответов на высказывание, причем упомянутое множество подходящих ответов включает в себя по меньшей мере одно из следующего:
мультимедийный объект, который отображается внутри или воспроизводится посредством интерфейса пользователя цифрового персонального помощника, при этом мультимедийный объект ассоциирован с отсылкой к массовой культуре; и
речь, которая генерируется или воспроизводится цифровым персональным помощником, при этом речь содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре; и
выбирают один из упомянутого множества подходящих ответов в качестве ответа, который должен быть предоставлен посредством цифрового персонального помощника.
2. Способ по п. 1, в котором выбранный ответ на высказывание дополнительно включает в себя текст, который отображается внутри интерфейса пользователя цифрового персонального помощника (130), при этом текст содержит цитату, ассоциированную с отсылкой к массовой культуре.
3. Способ по п. 1, в котором выбранный ответ на высказывание дополнительно включает в себя визуальное представление цифрового персонального помощника (130), которое отображается внутри его интерфейса пользователя и которое вызывает отсылку к массовой культуре.
4. Способ по п. 1, в котором мультимедийный объект содержит:
изображение или видеоконтент, который отображается внутри интерфейса пользователя цифрового персонального помощника (130), или аудиоконтент, который воспроизводится посредством интерфейса пользователя цифрового персонального помощника (130).
5. Способ по п. 1, в котором выбранный ответ на высказывание дополнительно включает в себя:
ссылку, которая отображается внутри интерфейса пользователя цифрового персонального помощника (130) и которая может быть активирована пользователем для того, чтобы осуществить доступ к контенту, ассоциированному с отсылкой к массовой культуре.
6. Способ по п. 1, в котором идентификация упомянутого множества подходящих ответов на высказывание содержит: сопоставление высказывания с конкретным типом высказывания внутри иерархического дерева типов высказываний, причем каждый тип высказывания в иерархическом дереве типов высказываний имеет один или более ассоциированных с ним ответов.
7. Способ по п. 1, в котором идентификация упомянутого множества подходящих ответов на высказывание содержит этапы, на которых:
определяют, что высказывание ассоциировано с актуальной темой; и
в ответ на определение того, что высказывание ассоциировано с актуальной темой, идентифицируют один или более ответов, ассоциированных с темой.
8. Способ по п. 1, в котором идентификация упомянутого множества подходящих ответов на высказывание содержит этапы, на которых:
определяют, что высказывание является высказыванием, для которого существует один или более предварительно определенных ответов, предназначенных для того, чтобы выражать образ цифрового персонального помощника.
9. Вычислительное устройство (102), содержащее:
по меньшей мере один процессор; и
память, которая хранит логику компьютерной программы для исполнения посредством по меньшей мере одного процессора, причем логика компьютерной программы включает в себя один или более компонентов, выполненных с возможностью выполнения операций, когда исполняются посредством по меньшей мере одного процессора, причем один или более компонентов включают в себя:
цифровой персональный помощник (130), выполненный с возможностью
приема цифрового представления высказывания пользователя цифрового персонального помощника;
на основании по меньшей мере анализа цифрового представления высказывания определения, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника;
в ответ на по меньшей мере определение того, что высказывание содержит высказывание, предназначенное для того, чтобы контактировать с образом цифрового персонального помощника, идентификации множества подходящих ответов на высказывание, причем упомянутое множество подходящих ответов включает в себя, по меньшей мере, одно из следующего:
мультимедийный объект, который отображается внутри или воспроизводится посредством интерфейса пользователя цифрового персонального помощника, при этом мультимедийный объект ассоциирован с отсылкой к массовой культуре; и
речь, которая генерируется или воспроизводится цифровым персональным помощником, при этом речь содержит подражание голосу человека, ассоциированного с отсылкой к массовой культуре; и
выбора одного из упомянутого множества подходящих ответов в качестве ответа, который должен быть предоставлен посредством цифрового персонального помощника.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/156,009 | 2014-01-15 | ||
US14/156,009 US9514748B2 (en) | 2014-01-15 | 2014-01-15 | Digital personal assistant interaction with impersonations and rich multimedia in responses |
PCT/US2015/010711 WO2015108758A1 (en) | 2014-01-15 | 2015-01-09 | Digital personal assistant interaction with impersonations and rich multimedia in responses |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2682023C1 true RU2682023C1 (ru) | 2019-03-14 |
Family
ID=52440848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016128739A RU2682023C1 (ru) | 2014-01-15 | 2015-01-09 | Взаимодействие цифрового персонального помощника с подражаниями и полнофункциональными мультимедиа в ответах |
Country Status (17)
Country | Link |
---|---|
US (1) | US9514748B2 (ru) |
EP (1) | EP3095113B1 (ru) |
JP (1) | JP6505117B2 (ru) |
KR (1) | KR102295935B1 (ru) |
CN (1) | CN105917404B (ru) |
AU (1) | AU2015206736B2 (ru) |
BR (1) | BR112016015519B1 (ru) |
CA (1) | CA2935469C (ru) |
CL (1) | CL2016001788A1 (ru) |
HK (1) | HK1223728A1 (ru) |
IL (1) | IL246237B (ru) |
MX (1) | MX360118B (ru) |
MY (1) | MY180332A (ru) |
PH (1) | PH12016501223A1 (ru) |
RU (1) | RU2682023C1 (ru) |
SG (1) | SG11201605642VA (ru) |
WO (1) | WO2015108758A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2772382C1 (ru) * | 2018-08-06 | 2022-05-19 | Ниссан Мотор Ко., Лтд. | Голосовое диалоговое устройство, голосовая диалоговая система и способ управления для голосовой диалоговой системы |
Families Citing this family (166)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9634855B2 (en) * | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US9002322B2 (en) | 2011-09-29 | 2015-04-07 | Apple Inc. | Authentication with secondary approver |
US8769624B2 (en) | 2011-09-29 | 2014-07-01 | Apple Inc. | Access control utilizing indirect authentication |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014143776A2 (en) | 2013-03-15 | 2014-09-18 | Bodhi Technology Ventures Llc | Providing remote interactions with host device using a wireless device |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
KR102193559B1 (ko) * | 2014-02-18 | 2020-12-22 | 삼성전자주식회사 | 대화형 서버 및 이의 제어 방법 |
USD801993S1 (en) * | 2014-03-14 | 2017-11-07 | Microsoft Corporation | Display screen with animated graphical user interface |
US20150350146A1 (en) | 2014-05-29 | 2015-12-03 | Apple Inc. | Coordination of message alert presentations across devices based on device modes |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
EP3149554B1 (en) | 2014-05-30 | 2024-05-01 | Apple Inc. | Continuity |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9967401B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | User interface for phone call routing among devices |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10339293B2 (en) | 2014-08-15 | 2019-07-02 | Apple Inc. | Authenticated device used to unlock another device |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9786299B2 (en) * | 2014-12-04 | 2017-10-10 | Microsoft Technology Licensing, Llc | Emotion type classification for interactive dialog system |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) * | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9959866B2 (en) * | 2015-04-02 | 2018-05-01 | Panasonic Intellectual Property Management Co., Ltd. | Computer-implemented method for generating a response sentence by using a weight value of node |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10409550B2 (en) | 2016-03-04 | 2019-09-10 | Ricoh Company, Ltd. | Voice control of interactive whiteboard appliances |
US10417021B2 (en) * | 2016-03-04 | 2019-09-17 | Ricoh Company, Ltd. | Interactive command assistant for an interactive whiteboard appliance |
CN107293292A (zh) * | 2016-03-31 | 2017-10-24 | 深圳光启合众科技有限公司 | 基于云端的设备及其操作方法 |
US10291565B2 (en) * | 2016-05-17 | 2019-05-14 | Google Llc | Incorporating selectable application links into conversations with personal assistant modules |
US10263933B2 (en) | 2016-05-17 | 2019-04-16 | Google Llc | Incorporating selectable application links into message exchange threads |
DK179186B1 (en) | 2016-05-19 | 2018-01-15 | Apple Inc | REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK201670622A1 (en) | 2016-06-12 | 2018-02-12 | Apple Inc | User interfaces for transactions |
US9990176B1 (en) * | 2016-06-28 | 2018-06-05 | Amazon Technologies, Inc. | Latency reduction for content playback |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
CN108075959B (zh) * | 2016-11-14 | 2021-03-12 | 腾讯科技(深圳)有限公司 | 一种会话消息处理方法和装置 |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11650791B2 (en) | 2017-01-11 | 2023-05-16 | Microsoft Technology Licensing, Llc | Relative narration |
US10574825B2 (en) * | 2017-02-15 | 2020-02-25 | Microsoft Technology Licensing, Llc | Assisted-communication with intelligent personal assistant |
CN109313649B (zh) * | 2017-03-24 | 2022-05-31 | 微软技术许可有限责任公司 | 用于聊天机器人的基于语音的知识共享的方法和装置 |
US10853717B2 (en) | 2017-04-11 | 2020-12-01 | Microsoft Technology Licensing, Llc | Creating a conversational chat bot of a specific person |
US11170768B2 (en) * | 2017-04-17 | 2021-11-09 | Samsung Electronics Co., Ltd | Device for performing task corresponding to user utterance |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US11431836B2 (en) | 2017-05-02 | 2022-08-30 | Apple Inc. | Methods and interfaces for initiating media playback |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20220279063A1 (en) | 2017-05-16 | 2022-09-01 | Apple Inc. | Methods and interfaces for home media control |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US20200357382A1 (en) * | 2017-08-10 | 2020-11-12 | Facet Labs, Llc | Oral, facial and gesture communication devices and computing architecture for interacting with digital media content |
US10636424B2 (en) * | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US20190172240A1 (en) * | 2017-12-06 | 2019-06-06 | Sony Interactive Entertainment Inc. | Facial animation for social virtual reality (vr) |
CN107993657A (zh) * | 2017-12-08 | 2018-05-04 | 广东思派康电子科技有限公司 | 一种基于多个语音助手平台的切换方法 |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
WO2019161207A1 (en) * | 2018-02-15 | 2019-08-22 | DMAI, Inc. | System and method for conversational agent via adaptive caching of dialogue tree |
US11308312B2 (en) | 2018-02-15 | 2022-04-19 | DMAI, Inc. | System and method for reconstructing unoccupied 3D space |
KR102515023B1 (ko) * | 2018-02-23 | 2023-03-29 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10984799B2 (en) | 2018-03-23 | 2021-04-20 | Amazon Technologies, Inc. | Hybrid speech interface device |
US10777203B1 (en) | 2018-03-23 | 2020-09-15 | Amazon Technologies, Inc. | Speech interface device with caching component |
WO2019190812A1 (en) * | 2018-03-26 | 2019-10-03 | Microsoft Technology Licensing, Llc | Intelligent assistant device communicating non-verbal cues |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
KR20190142192A (ko) | 2018-06-15 | 2019-12-26 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
US11190465B2 (en) | 2018-08-06 | 2021-11-30 | Oracle International Corporation | Displaying data sets responsive to natural language messages received by chatbots |
WO2020060151A1 (en) | 2018-09-19 | 2020-03-26 | Samsung Electronics Co., Ltd. | System and method for providing voice assistant service |
KR20200033140A (ko) * | 2018-09-19 | 2020-03-27 | 삼성전자주식회사 | 보이스 어시스턴트 서비스를 제공하는 시스템 및 방법 |
CN110942518B (zh) * | 2018-09-24 | 2024-03-29 | 苹果公司 | 上下文计算机生成现实(cgr)数字助理 |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
KR20200044175A (ko) | 2018-10-05 | 2020-04-29 | 삼성전자주식회사 | 전자 장치 및 그의 비서 서비스 제공 방법 |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11657797B2 (en) * | 2019-04-26 | 2023-05-23 | Oracle International Corporation | Routing for chatbots |
US11133005B2 (en) | 2019-04-29 | 2021-09-28 | Rovi Guides, Inc. | Systems and methods for disambiguating a voice search query |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11620103B2 (en) | 2019-05-31 | 2023-04-04 | Apple Inc. | User interfaces for audio media control |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US10996917B2 (en) | 2019-05-31 | 2021-05-04 | Apple Inc. | User interfaces for audio media control |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11481094B2 (en) | 2019-06-01 | 2022-10-25 | Apple Inc. | User interfaces for location-related communications |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11477609B2 (en) | 2019-06-01 | 2022-10-18 | Apple Inc. | User interfaces for location-related communications |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11941362B2 (en) * | 2020-04-27 | 2024-03-26 | Early Warning Services, Llc | Systems and methods of artificially intelligent sentiment analysis |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11756574B2 (en) | 2021-03-11 | 2023-09-12 | Apple Inc. | Multiple state digital assistant for continuous dialog |
US11955137B2 (en) | 2021-03-11 | 2024-04-09 | Apple Inc. | Continuous dialog with a digital assistant |
US11847378B2 (en) | 2021-06-06 | 2023-12-19 | Apple Inc. | User interfaces for audio routing |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6721706B1 (en) * | 2000-10-30 | 2004-04-13 | Koninklijke Philips Electronics N.V. | Environment-responsive user interface/entertainment device that simulates personal interaction |
US20060155765A1 (en) * | 2004-12-01 | 2006-07-13 | Takeuchi Johane | Chat information service system |
US20090210217A1 (en) * | 2008-02-14 | 2009-08-20 | Aruze Gaming America, Inc. | Gaming Apparatus Capable of Conversation with Player and Control Method Thereof |
WO2013155619A1 (en) * | 2012-04-20 | 2013-10-24 | Sam Pasupalak | Conversational agent |
RU2654789C2 (ru) * | 2014-05-30 | 2018-05-22 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) и электронное устройство (варианты) обработки речевого запроса пользователя |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5918222A (en) | 1995-03-17 | 1999-06-29 | Kabushiki Kaisha Toshiba | Information disclosing apparatus and multi-modal information input/output system |
NL1000679C2 (nl) * | 1995-06-28 | 1996-12-31 | Arie Van Wieringen Video Film | Bewegingseditor/samensteleenheid. |
US6144938A (en) | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
JP2003044088A (ja) * | 2001-07-27 | 2003-02-14 | Sony Corp | プログラム、記録媒体、並びに音声対話装置および方法 |
JP2005070721A (ja) * | 2003-08-27 | 2005-03-17 | Akihiko Shigeta | 音響出力機能付き化粧用品 |
CN1943218A (zh) * | 2004-02-17 | 2007-04-04 | 语音信号科技公司 | 多模态嵌入界面的可替换定制的方法和设备 |
JP2006039120A (ja) * | 2004-07-26 | 2006-02-09 | Sony Corp | 対話装置および対話方法、並びにプログラムおよび記録媒体 |
JP2006048218A (ja) * | 2004-08-02 | 2006-02-16 | Advanced Media Inc | 音声動画応答方法および音声動画応答システム |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US7957976B2 (en) | 2006-09-12 | 2011-06-07 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US8831977B2 (en) * | 2007-09-26 | 2014-09-09 | At&T Intellectual Property I, L.P. | Methods, systems, and computer program products for implementing personalized dissemination of information |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
JP4547721B2 (ja) * | 2008-05-21 | 2010-09-22 | 株式会社デンソー | 自動車用情報提供システム |
US8386929B2 (en) * | 2010-06-22 | 2013-02-26 | Microsoft Corporation | Personal assistant for task utilization |
US8640021B2 (en) | 2010-11-12 | 2014-01-28 | Microsoft Corporation | Audience-based presentation and customization of content |
SG184583A1 (en) * | 2011-03-07 | 2012-10-30 | Creative Tech Ltd | A device for facilitating efficient learning and a processing method in association thereto |
US20130061257A1 (en) * | 2011-09-02 | 2013-03-07 | Sony Corporation | Verbally communicating facially responsive television apparatus |
US8346563B1 (en) | 2012-04-10 | 2013-01-01 | Artificial Solutions Ltd. | System and methods for delivering advanced natural language interaction applications |
KR102056461B1 (ko) * | 2012-06-15 | 2019-12-16 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치의 제어 방법 |
-
2014
- 2014-01-15 US US14/156,009 patent/US9514748B2/en active Active
-
2015
- 2015-01-09 RU RU2016128739A patent/RU2682023C1/ru active
- 2015-01-09 CN CN201580004844.6A patent/CN105917404B/zh active Active
- 2015-01-09 EP EP15702033.0A patent/EP3095113B1/en active Active
- 2015-01-09 KR KR1020167019069A patent/KR102295935B1/ko active IP Right Grant
- 2015-01-09 MY MYPI2016702496A patent/MY180332A/en unknown
- 2015-01-09 BR BR112016015519-0A patent/BR112016015519B1/pt active IP Right Grant
- 2015-01-09 JP JP2016546938A patent/JP6505117B2/ja active Active
- 2015-01-09 SG SG11201605642VA patent/SG11201605642VA/en unknown
- 2015-01-09 MX MX2016009130A patent/MX360118B/es active IP Right Grant
- 2015-01-09 WO PCT/US2015/010711 patent/WO2015108758A1/en active Application Filing
- 2015-01-09 AU AU2015206736A patent/AU2015206736B2/en active Active
- 2015-01-09 CA CA2935469A patent/CA2935469C/en active Active
-
2016
- 2016-06-15 IL IL246237A patent/IL246237B/en active IP Right Grant
- 2016-06-22 PH PH12016501223A patent/PH12016501223A1/en unknown
- 2016-07-13 CL CL2016001788A patent/CL2016001788A1/es unknown
- 2016-10-19 HK HK16112030.9A patent/HK1223728A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6721706B1 (en) * | 2000-10-30 | 2004-04-13 | Koninklijke Philips Electronics N.V. | Environment-responsive user interface/entertainment device that simulates personal interaction |
US20060155765A1 (en) * | 2004-12-01 | 2006-07-13 | Takeuchi Johane | Chat information service system |
US20090210217A1 (en) * | 2008-02-14 | 2009-08-20 | Aruze Gaming America, Inc. | Gaming Apparatus Capable of Conversation with Player and Control Method Thereof |
WO2013155619A1 (en) * | 2012-04-20 | 2013-10-24 | Sam Pasupalak | Conversational agent |
RU2654789C2 (ru) * | 2014-05-30 | 2018-05-22 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) и электронное устройство (варианты) обработки речевого запроса пользователя |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2772382C1 (ru) * | 2018-08-06 | 2022-05-19 | Ниссан Мотор Ко., Лтд. | Голосовое диалоговое устройство, голосовая диалоговая система и способ управления для голосовой диалоговой системы |
Also Published As
Publication number | Publication date |
---|---|
PH12016501223B1 (en) | 2016-08-22 |
JP6505117B2 (ja) | 2019-04-24 |
CA2935469A1 (en) | 2015-07-23 |
SG11201605642VA (en) | 2016-08-30 |
US20150199967A1 (en) | 2015-07-16 |
IL246237B (en) | 2019-03-31 |
BR112016015519B1 (pt) | 2023-01-17 |
MX360118B (es) | 2018-10-23 |
BR112016015519A8 (pt) | 2020-06-02 |
CN105917404A (zh) | 2016-08-31 |
EP3095113B1 (en) | 2022-06-15 |
IL246237A0 (en) | 2016-07-31 |
BR112016015519A2 (ru) | 2017-08-08 |
EP3095113A1 (en) | 2016-11-23 |
HK1223728A1 (zh) | 2017-08-04 |
AU2015206736B2 (en) | 2019-11-21 |
JP2017515134A (ja) | 2017-06-08 |
WO2015108758A1 (en) | 2015-07-23 |
MY180332A (en) | 2020-11-28 |
AU2015206736A1 (en) | 2016-07-07 |
MX2016009130A (es) | 2016-10-13 |
KR20160108348A (ko) | 2016-09-19 |
PH12016501223A1 (en) | 2016-08-22 |
CL2016001788A1 (es) | 2017-01-20 |
CN105917404B (zh) | 2019-11-05 |
CA2935469C (en) | 2022-05-03 |
KR102295935B1 (ko) | 2021-08-30 |
US9514748B2 (en) | 2016-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2682023C1 (ru) | Взаимодействие цифрового персонального помощника с подражаниями и полнофункциональными мультимедиа в ответах | |
US20090055186A1 (en) | Method to voice id tag content to ease reading for visually impaired | |
US20120108221A1 (en) | Augmenting communication sessions with applications | |
Pauletto et al. | Exploring expressivity and emotion with artificial voice and speech technologies | |
Svikhnushina et al. | Social and emotional etiquette of chatbots: a qualitative approach to understanding user needs and expectations | |
US10681402B2 (en) | Providing relevant and authentic channel content to users based on user persona and interest | |
Mahmud et al. | Adoption of ChatGPT by university students for academic purposes: Partial least square, artificial neural network, deep neural network and classification algorithms approach | |
Zhang et al. | Social media through voice: Synthesized voice qualities and self-presentation | |
Shih et al. | Virtual voice assistants | |
Haas | Towards auditory interaction: an analysis of computer-based auditory interfaces in three settings | |
Feng et al. | A platform for building mobile virtual humans | |
CN112309390A (zh) | 信息交互方法和装置 | |
US20240303030A1 (en) | Dynamic audio content generation | |
Hwang et al. | In Whose Voice?: Examining AI Agent Representation of People in Social Interaction through Generative Speech | |
Pathak et al. | Designing a multilingual virtual agent capable of interacting with uneducated people for automated data collection | |
Trang | CHATBOT TO SUPPORT LEARNING AMONG NEWCOMERS IN CITIZEN SCIENCE | |
Smith | The Gaps between Us: Multilingualism and Immigration in Alfian Sa'at's Cook a Pot of Curry | |
Herrera Machuca et al. | Live coding for all: three creative approaches to live coding for non-programmers | |
Campbell et al. | Expressivity in interactive speech synthesis; some paralinguistic and nonlinguistic issues of speech prosody for conversational dialogue systems | |
Agnihotri et al. | Discord Bot | |
Christ et al. | AIM: ARTIFICIAL INTELLIGENCE FOR MULTIMEDIA GENERATION | |
Alrumayh et al. | Improving Reminder Apps for Home Voice Assistants | |
van Dijk | NON-VERBAL COMMUNICATION IN INSTANT MESSAGING: CONVEYING EMOTION THROUGH VOICE INTERFACES | |
MORRIS et al. | Social Media through Voice: Synthesized Voice Qualities and Self-presentation | |
Ollikainen | Development and implementation of interactive drama for smart speakers |