CN112292674A - 为助理系统处理多模态用户输入 - Google Patents
为助理系统处理多模态用户输入 Download PDFInfo
- Publication number
- CN112292674A CN112292674A CN201880094828.4A CN201880094828A CN112292674A CN 112292674 A CN112292674 A CN 112292674A CN 201880094828 A CN201880094828 A CN 201880094828A CN 112292674 A CN112292674 A CN 112292674A
- Authority
- CN
- China
- Prior art keywords
- user
- user input
- assistant
- tasks
- particular embodiments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 21
- 238000004891 communication Methods 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims abstract description 98
- 230000000007 visual effect Effects 0.000 claims abstract description 90
- 230000004044 response Effects 0.000 claims abstract description 52
- 238000010801 machine learning Methods 0.000 claims abstract description 39
- 239000003795 chemical substances by application Substances 0.000 claims description 71
- 230000015654 memory Effects 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 27
- 230000003993 interaction Effects 0.000 claims description 25
- 230000006855 networking Effects 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 13
- 238000013475 authorization Methods 0.000 claims description 11
- 238000007726 management method Methods 0.000 claims description 10
- 230000001815 facial effect Effects 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000035755 proliferation Effects 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 62
- 230000006870 function Effects 0.000 description 32
- 230000008569 process Effects 0.000 description 29
- 230000009471 action Effects 0.000 description 26
- 238000012549 training Methods 0.000 description 16
- 230000008901 benefit Effects 0.000 description 14
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 8
- 230000004913 activation Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000011524 similarity measure Methods 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000013515 script Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 240000002407 Solanum quitoense Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000002939 conjugate gradient method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 235000013550 pizza Nutrition 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/176—Support for shared access to files; File sharing support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24552—Database cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
- G06F16/3323—Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/06—Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
- G06F7/14—Merging, i.e. combining at least two sets of record carriers each arranged in the same ordered sequence to produce a single set having the same ordered sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/31—Programming languages or programming paradigms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44505—Configuring for program initiating, e.g. using registry, configuration files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44505—Configuring for program initiating, e.g. using registry, configuration files
- G06F9/4451—User profiles; Roaming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/027—Frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/20—Network management software packages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/22—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
- H04L43/0882—Utilisation of link capacity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
- H04L43/0894—Packet rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L5/00—Arrangements affording multiple use of the transmission path
- H04L5/02—Channels characterised by the type of signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/18—Commands or executable codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/216—Handling conversation history, e.g. grouping of messages in sessions or threads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/102—Entity profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/565—Conversion or adaptation of application format or content
- H04L67/5651—Reducing the amount or size of exchanged application data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/75—Indicating network or usage conditions on the user display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/08—Access security
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/13—Prefetching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
- H04L51/046—Interoperability with other network applications or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/222—Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/53—Network services using third party service providers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Computer Security & Cryptography (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Computer Hardware Design (AREA)
- Environmental & Geological Engineering (AREA)
- Primary Health Care (AREA)
- Bioethics (AREA)
- Automation & Control Theory (AREA)
Abstract
在一个实施例中,一种方法包括从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中至少一个模态是视觉模态,基于一个或更多个机器学习模型、基于视觉模态来识别与用户输入相关联的一个或更多个主体,基于一个或更多个机器学习模型分别确定与一个或更多个主体相关联的一个或更多个属性,基于所确定的一个或更多个属性来解析对应于一个或更多个主体的一个或更多个实体,执行与一个或更多个解析的实体相关联的一个或更多个任务,以及向与第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令,该通信内容包括与所执行的一个或更多个任务相关联的信息。
Description
技术领域
本公开总体上涉及在网络环境内的数据库和文件管理,且具体涉及用于智能助理(smart assistant)系统的硬件和软件。
背景
助理系统可以基于用户输入、位置感知和从各种在线来源访问信息(如天气状况、交通拥堵、新闻、股票价格、用户日程、零售价格等)的能力的组合来代表用户提供信息或服务。用户输入可以包括文本(例如,在线聊天)(尤其是在即时消息传递应用或其他应用中的文本)、声音(voice)、图像或它们的组合。助理系统可以基于用户输入来执行礼宾类型的服务(例如,预订晚餐、购买活动门票、安排旅行)或者提供信息。助理系统也可以基于在线信息和事件执行管理或数据处理任务,而无需用户启动或交互。可以由助理系统执行的那些任务的示例可以包括日程管理(例如,对晚餐约会发送用户由于交通状况而要迟到的告警信息,更新双方的日程,以及改变餐馆预订时间)。助理系统可以通过计算设备、应用编程接口(API)、以及用户设备上应用激增(proliferation)的组合来实现。
可以包括社交网络网站的社交网络系统可以使它的用户(例如个人或组织)能够与它交互以及通过它彼此交互。社交网络系统可以利用来自用户的输入来在社交网络系统中创建并存储与用户相关联的用户简档(user profile)。用户简档可以包括用户的人口统计信息、通信渠道信息以及关于个人兴趣的信息。社交网络系统还可以用来自用户的输入来创建并存储用户与社交网络系统的其他用户的关系的记录,以及提供服务(例如,简档/动态消息(news feed)帖子、照片分享、事件组织、消息传递、游戏或广告)以便于在用户之间或当中的社会交互。
社交网络系统可以通过一个或更多个网络向用户的移动设备或其他计算设备发送与它的服务相关的内容或消息。用户还可以在用户的移动设备或其他计算设备上安装软件应用,用于访问用户的用户简档和在社交网络系统内的其他数据。社交网络系统可以生成一组个性化的内容对象以显示给用户,例如关连(connect)到该用户的其他用户的汇集的动态(story)的动态消息。
特定实施例的概述
在特定实施例中,助理系统可以帮助用户获得信息或服务。助理系统可以使用户能够在有状态和多轮会话(stateful and multi-turn conversations)中通过多模态用户输入(如声音、文本、图像、视频)与它进行交互,以获得帮助。助理系统可以创建和存储用户简档,该用户简档包括与用户相关联的个人信息和上下文信息(contextualinformation)。在特定实施例中,助理系统可以使用自然语言理解来分析用户输入。分析可以基于用户简档,以获得更个性化和上下文感知的理解。助理系统可以基于分析来解析(resolve)与用户输入相关联的实体。在特定实施例中,助理系统可以与不同的代理交互,以获得与解析的实体相关联的信息或服务。助理系统可以通过使用自然语言生成来为用户生成关于信息或服务的响应。通过与用户的交互,助理系统可以使用对话管理技术来管理和转发与用户的会话流。在特定实施例中,助理系统还可以通过汇总(summarize)信息来辅助用户有效且高效地消化所获得的信息。助理系统还可以通过提供帮助用户与在线社交网络交互(例如,创建帖子、评论、消息)的工具,来帮助用户更好地参与在线社交网络。助理系统另外可以帮助用户管理不同的任务,如持续跟踪事件。在特定实施例中,助理系统可以基于用户简档在没有用户输入的情况下主动(proactively)执行与用户兴趣和偏好相关的任务。在特定实施例中,助理系统可以检查隐私设置,以确保根据用户的隐私设置来允许访问用户的简档或其他用户信息以及执行不同的任务。
在特定实施例中,助理系统可以从与用户相关联的客户端系统接收多模态用户输入(例如,声音(sound)、图像、视频、文本)。助理系统可以基于用户输入的不同模态,利用助理系统的不同模块来处理多模态用户输入。然后,助理系统可以基于实体解析模块和共指(co-reference)模块来理解用户输入,即,识别用户输入的主体(subject)/实体和语义含义。助理系统还可以基于理解生成多模态输出,并经由客户端系统将多模态输出发送给用户。作为示例而不是作为限制,用户可以向助理系统提交几个人的图片,并请求助理系统向其中一个人发起呼叫(call)(例如,用户可以说“呼叫在左边的家伙(call the guy on theleft)”)。助理系统可以确定这些人的身份,识别“在左边”的人,访问在左边的人的联系信息(遵守此人的隐私设置),并相应地为用户发起呼叫。特别地,助理系统可以使用能够处理包含在多模态用户输入中的视觉输入的视觉识别代理,其中视觉识别代理可以访问各种计算机视觉模型来理解视觉输入。共指模块可以使用对视觉输入的理解来解析与用户输入相关联的实体。基于对视觉输入的理解和解析的实体,助理系统可以使用助理xbot来与用户进行会话,以通过执行对应于视觉输入的不同任务来进一步增强用户对助理系统的体验。助理系统可以响应于用户查询,反应性地(reactively)处理多模态用户输入。助理系统还可以通过基于用户输入提供建议来主动处理多模态用户输入。处理多模态用户输入和在不同输出模态之间无缝切换的能力使助理系统很好地适应各种客户端系统和软件,从而使助理系统对用户更有用和更有吸引力。尽管本公开描述了以特定方式经由特定系统处理特定多模态用户输入,但是本公开设想了以任何合适的方式经由任何合适的系统处理任何合适的多模态用户输入。
在特定实施例中,助理系统可以从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入。用户输入的模态中的至少一个模态可以是视觉模态。在特定实施例中,助理系统可以基于一个或更多个机器学习模型、基于视觉模态,来识别与用户输入相关联的一个或更多个主体。在特定实施例中,助理系统可以基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性。然后,助理系统可以基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体。在特定实施例中,助理系统可以执行与一个或更多个解析的实体相关联的一个或更多个任务。助理系统还可以向与第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令。通信内容可以包括与所执行的一个或更多个任务相关联的信息。
在实现处理并理解多模态用户输入的目标方面存在某些技术挑战。一个技术挑战包括从视觉输入准确地识别主体及其属性。本文公开的实施例所提出的解决上述挑战的解决方案是基于面部识别和对象检测(object detection)的机器学习模型,这些模型对于识别人、地点、企业和对象以及他们的属性是有效的。另一个技术挑战包括从多模态用户输入准确地解析实体。本文公开的实施例所提出的解决该挑战的解决方案是助理系统中的共指模块,该模块能够将声音和/或文本输入的措辞信息(wording information)与视觉输入的视觉分析结果相链接,从而准确地解析多模态用户输入的实体。另一个技术挑战包括用基于合适模态的通信内容来响应多模态用户输入。本文公开的实施例所提出的解决该挑战的解决方案是基于与用户相关联的上下文信息和与关联于用户的客户端系统相关联的上下文信息来确定适当的模态,这允许助理系统基于所确定的可能更适合用户当前情况的模态来与用户通信。
本文公开的某些实施例可以提供一个或更多个技术优势。这些实施例的技术优势可以包括以处理多模态用户输入和在不同输出模态之间切换的能力来有效地适应各种客户端系统和软件。这些实施例的另一个技术优势可以包括当声音和/或文本输入和视觉输入经由共指模块被联合分析时,对多模态用户输入的改进的理解。这些实施例的另一个技术优势可以包括通过基于视觉输入的分析主动向用户建议任务来增加用户参与助理系统的程度。本文公开的某些实施例可以不提供、提供一些或全部上述技术优势。鉴于本公开的附图、描述和权利要求,一个或更多个其他技术优势对于本领域技术人员来说是明显的。
本文公开的实施例仅仅是示例,并且本公开的范围不限于它们。特定实施例可以包括本文公开的实施例的组件、元件、特征、功能、操作或步骤中的全部、一些或没有一个被包括。根据本发明的实施例在涉及方法、存储介质、助理系统、系统和计算机程序产品的所附权利要求中被具体公开,其中,在一个权利要求类别(例如,方法)中提到的任何特征也可以在另一个权利要求类别(例如,系统)中被要求保护。在所附权利要求中的从属性或往回引用仅为了形式原因而被选择。然而,也可以要求保护由对任何前面的权利要求的有意往回引用(特别是多项引用)而产生的任何主题,使得权利要求及其特征的任何组合被公开并且可被要求保护,而不考虑在所附权利要求中选择的从属性。可以被要求保护的主题不仅包括如在所附权利要求中阐述的特征的组合,而且还包括在权利要求中的特征的任何其他组合,其中,在权利要求中提到的每个特征可以与在权利要求中的任何其他特征或其他特征的组合相结合。此外,本文描述或描绘的实施例和特征中的任一个可以在单独的权利要求中和/或以与本文描述或描绘的任何实施例或特征的任何组合或以与所附权利要求的任何特征的任何组合被要求保护。
在根据本发明的实施例中,一种方法可以包括由一个或更多个计算系统:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于视觉模态,来识别与用户输入相关联的一个或更多个主体;
基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令,其中通信内容包括与所执行的一个或更多个任务相关联的信息。
用户输入可以包括以下中的一个或更多个:
字符串;
音频剪辑;
图像;或者
视频剪辑。
与用户输入相关联的一个或更多个主体可以包括人、地点、企业或对象中的一个或更多个。
识别一个或更多个人可以基于面部识别。
识别一个或更多个对象可以基于对象检测。
在根据本发明的实施例中,一种方法可以包括基于视觉模态为用户输入生成特征表示。
一个或更多个机器学习模型可以包括以下中的一个或更多个:
支持向量机;
回归模型(regression model);或者
卷积神经网络。
在根据本发明的实施例中,一种方法可以包括基于用户输入来识别一个或更多个意图(intent)和一个或更多个槽(slot)。
可以基于所识别的意图和槽来执行与一个或更多个解析的实体相关联的一个或更多个任务。
通信内容可以包括以下中的一个或更多个:
字符串;
音频剪辑;
图像;或者
视频剪辑。
在根据本发明的实施例中,一种方法可以包括确定通信内容的一个或更多个模态。
确定通信内容的一个或更多个模态可以包括:
识别与第一用户相关联的上下文信息;
识别与客户端系统相关联的上下文信息;和
基于与第一用户相关联的上下文信息和与客户端系统相关联的上下文信息来确定一个或更多个模态。
在根据本发明的实施例中,一种方法可以包括:
基于用户输入的视觉模态来生成多个任务;和
从与第一用户相关联的客户端系统接收第一用户对来自多个任务中的一个或更多个任务的用户选择。
在根据本发明的实施例中,一种方法可以包括在对话状态中存储所识别的一个或更多个主体。
用户输入可以包括用户与媒体内容对象的交互。
在根据本发明的实施例中,一个或更多个计算机可读非暂时性存储介质可以体现软件,该软件在被执行时可操作来:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于视觉模态,来识别与用户输入相关联的一个或更多个主体;
基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与第一用户相关联的客户端系统发送用于响应于用户输入呈现通信内容的指令,其中通信内容包括与所执行的一个或更多个任务相关联的信息。
在根据本发明的实施例中,一种系统可以包括:一个或更多个处理器;以及耦合到处理器的非暂时性存储器,该非暂时性存储器包括由处理器可执行的指令,处理器在执行指令时可操作来:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于视觉模态,来识别与用户输入相关联的一个或更多个主体;
基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令,其中通信内容包括与所执行的一个或更多个任务相关联的信息。
在根据本发明的实施例中,一种方法,特别地在助理系统中使用的方法,用于通过使用户能够在会话中利用用户输入与助理系统交互以获取帮助,来帮助用户获得信息或服务,其中用户输入包括声音、文本、图像或视频或它们的任意组合,该助理系统特别地通过计算设备、应用编程接口(API)以及用户设备上应用激增的组合来实现,该方法可以包括由一个或更多个计算系统:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于视觉模态,来识别与用户输入相关联的一个或更多个主体;
基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令,其中通信内容包括与所执行的一个或更多个任务相关联的信息。
在根据本发明的实施例中,一个或更多个计算机可读非暂时性存储介质可以体现软件,该软件在被执行时可操作来执行根据本发明或任何上面提到的实施例的方法。
在根据本发明的实施例中,一种系统可以包括:一个或更多个处理器;以及至少一个存储器,其耦合到处理器并且包括由处理器可执行的指令,处理器在执行指令时可操作来执行根据本发明或任何上面提到的实施例的方法。
在根据本发明的实施例中,一种计算机程序产品,优选地包括计算机可读非暂时性存储介质,该计算机程序产品在数据处理系统上被执行时,可操作来执行根据本发明或任何上面提到的实施例的方法。
在根据本发明的实施例中,一种助理系统,其用于通过使用户能够在会话中利用用户输入与助理系统交互以获取帮助,来帮助用户获得信息或服务,其中用户输入包括声音、文本、图像或视频或它们的任意组合,该助理系统特别地通过计算设备、应用编程接口(API)以及用户设备上应用激增的组合来实现,该系统包括:一个或更多个处理器;以及耦合到处理器的非暂时性存储器,该非暂时性存储器包括由处理器可执行的指令,处理器在执行指令时可操作来执行根据本发明或任何上面提到的实施例的方法。
在根据本发明的实施例中,助理系统可通过执行以下特征或步骤中的至少一个或更多个来帮助用户:
-创建并存储包括与用户相关联的个人信息和上下文信息的用户简档
-使用自然语言理解来分析用户输入,其中分析可以基于用户简档,以获得更个性化和上下文感知的理解
-基于分析来解析与用户输入相关联的实体
-与不同的代理交互,以获得与解析的实体相关联的信息或服务
-通过使用自然语言生成来为用户生成关于信息或服务的响应
-通过与用户的交互,使用对话管理技术来管理和转发与用户的会话流
-通过汇总信息,帮助用户有效地且高效地消化所获得的信息
-通过提供帮助用户与在线社交网络交互(例如,创建帖子、评论、消息)的工具,来帮助用户更好地参与在线社交网络
-帮助用户管理不同的任务,例如持续跟踪事件
-在与用户相关的时间,而没有用户输入的情况下,基于用户简档主动执行与用户兴趣和偏好相关的预授权任务
-每当有必要确保访问用户简档和执行不同的任务都遵守用户的隐私设置时就检查隐私设置。
在根据本发明的实施例中,助理系统可以包括以下部件中的至少一个或更多个:
-消息传递平台,其用于从与用户相关联的客户端系统接收基于文本模态的用户输入,和/或用于接收基于图像或视频模态的用户输入,并在消息传递平台内使用光学字符识别技术对基于图像或视频模态的该用户输入进行处理,以将该用户输入转换成文本,
-音频语音识别(ASR)模块,其用于从与用户相关联的客户端系统接收基于音频模态的用户输入(例如,用户可以说话或者发送包括语音的视频),并将基于音频模态的该用户输入转换成文本,
-助理xbot,其用于接收消息传递平台或ASR模块的输出。
在根据本发明的实施例中,一种系统可以包括:
至少一个客户端系统(130),特别是电子设备,
根据权利要求29至31中任一项的至少一个助理系统(140),
该客户端系统和该助理系统特别地通过网络(110)彼此连接,
其中客户端系统包括用于允许客户端系统(130)处的用户与助理系统(140)交互的助理应用(136),
其中助理应用(136)将用户输入传送给助理系统(140),并且基于用户输入,助理系统(140)生成响应并将生成的响应发送给助理应用(136),并且助理应用(136)向客户端系统(130)处的用户呈现响应,
其中特别地,用户输入是音频或口头的,并且响应可以是文本的或者也可以是音频或口头的。
在根据本发明的实施例中,系统可以包括社交网络系统(160),
其中客户端系统特别地包括用于访问社交网络系统(160)的社交网络应用(134)。
附图简述
图1示出了与助理系统相关联的示例网络环境。
图2示出了助理系统的示例架构。
图3示出了助理系统响应用户请求的示例流程图。
图4示出了基于图2中的助理系统的示例架构来处理多模态用户输入的示例流程图。
图5示出了在用户和助理系统之间经由多模态用户输入和系统输出的示例交互。
图6示出了用于处理多模态用户输入的示例方法。
图7示出了示例社交图。
图8示出了嵌入空间的示例视图。
图9示出了示例人工神经网络。
图10示出了示例计算机系统。
示例实施例的描述
系统综述
图1示出了与助理系统相关联的示例网络环境100。网络环境100包括通过网络110彼此连接的客户端系统130、助理系统140、社交网络系统160和第三方系统170。尽管图1示出了客户端系统130、助理系统140、社交网络系统160、第三方系统170和网络110的特定布置,但是本公开设想了客户端系统130、助理系统140、社交网络系统160、第三方系统170和网络110的任何合适的布置。作为示例而不是作为限制,客户端系统130、社交网络系统160、助理系统140和第三方系统170中的两个或更多个可以绕过网络110彼此直接连接。作为另一个示例,客户端系统130、助理系统140、社交网络系统160和第三方系统170中的两个或更多个可以全部或部分地在物理上或逻辑上彼此位于同一位置。此外,尽管图1示出了特定数量的客户端系统130、助理系统140、社交网络系统160、第三方系统170和网络110,但是本公开设想了任何合适数量的客户端系统130、助理系统140、社交网络系统160、第三方系统170和网络110。作为示例而不是作为限制,网络环境100可以包括多个客户端系统130、助理系统140、社交网络系统160、第三方系统170和网络110。
本公开设想了任何合适的网络110。作为示例而不是作为限制,网络110的一个或更多个部分可以包括自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网的一部分、公共交换电话网(PSTN)的一部分、蜂窝电话网、或这些中的两个或更多个的组合。网络110可以包括一个或更多个网络110。
链路150可以将客户端系统130、助理系统140、社交网络系统160和第三方系统170连接到通信网络110或连接到彼此。本公开设想了任何合适的链路150。在特定实施例中,一个或更多个链路150包括一个或更多个有线(诸如例如数字用户线路(DSL)或基于电缆的数据服务接口规范(DOCSIS))链路、无线(诸如例如Wi-Fi或全球互通微波接入(WiMAX))链路、或光(诸如例如同步光网络(SONET)或同步数字体系(SDH))链路。在特定实施例中,一个或更多个链路150各自包括自组织网络、内联网、外联网、VPN、LAN、WLAN、WAN、WWAN、MAN、互联网的一部分、PSTN的一部分、基于蜂窝技术的网络、基于卫星通信技术的网络、另一链路150、或两个或更多个这种链路150的组合。链路150不需要在整个网络环境100中一定是相同的。一个或更多个第一链路150可以在一个或更多个方面上不同于一个或更多个第二链路150。
在特定实施例中,客户端系统130可以是一种电子设备,该电子设备包括硬件、软件或嵌入式逻辑部件、或两个或更多个这样的部件的组合,并且能够执行由客户端系统130实现或支持的适当功能。作为示例而不是作为限制,客户端系统130可以包括计算机系统,如台式计算机、笔记本或膝上型计算机、上网本、平板计算机、电子书阅读器、GPS设备、照相机、个人数字助理(PDA)、手持电子设备、蜂窝电话、智能手机、智能扬声器、其他合适的电子设备、或其任何合适的组合。在特定实施例中,客户端系统130可以是智能助理设备。关于智能助理设备的更多信息可以在2018年4月9日提交的美国专利申请第15/949011号、2018年4月10日提交的美国专利申请第62/655751号、2018年1月3日提交的美国专利申请第29/631910号、2018年1月2日提交的美国专利申请第29/631747号、2018年1月3日提交的美国专利申请第29/631913号和2018年1月3日提交的美国专利申请第29/631914号中找到,这些专利申请通过引用并入。本公开设想了任何合适的客户端系统130。客户端系统130可以使在客户端系统130处的网络用户能够访问网络110。客户端系统130可以使它的用户能够与在其他客户端系统130处的其他用户进行通信。
在特定实施例中,客户端系统130可以包括web浏览器132,例如MICROSOFTINTERNET EXPLORER、GOOGLE CHROME或MOZILLA FIREFOX,并且可以具有一个或更多个附加件、插件或其他扩展件,例如TOOLBAR或YAHOO TOOLBAR。在客户端系统130处的用户可以输入统一资源定位符(URL)或将web浏览器132引导到特定的服务器(例如服务器162或与第三方系统170相关联的服务器)的其他地址,并且web浏览器132可以生成超文本传输协议(HTTP)请求并将HTTP请求传递到服务器。服务器可以接受HTTP请求,并响应于HTTP请求而向客户端系统130传递一个或更多个超文本标记语言(HTML)文件。客户端系统130可以基于来自服务器的HTML文件来显现web界面(例如网页)用于呈现给用户。本公开设想了任何合适的源文件。作为示例而不是作为限制,可以根据特定的需要根据HTML文件、可扩展超文本标记语言(XHTML)文件或可扩展标记语言(XML)文件来显现web界面。这样的界面还可以执行脚本,诸如例如且没有限制地,用JAVASCRIPT、JAVA、MICROSOFT SILVERLIGHT编写的脚本、标记语言和脚本的组合(例如AJAX(异步JAVASCRIPT和XML))等。在本文,在适当的情况下,对web界面的引用包括一个或更多个相应的源文件(浏览器可以使用这些源文件来显现web界面),反之亦然。
在特定实施例中,客户端系统130可以包括安装在客户端系统130上的社交网络应用134。客户端系统130处的用户可以使用社交网络应用134来访问在线社交网络。客户端系统130处的用户可以使用社交网络应用134来与用户的社交关连(connection)(例如,朋友、关注者(follower)、关注账户、联系人等)进行通信。客户端系统130处的用户还可以使用社交网络应用134来与在线社交网络上的多个内容对象(例如,帖子、新闻文章、临时内容等)交互。作为示例而不是作为限制,用户可以使用社交网络应用134浏览热门话题和突发新闻。
在特定实施例中,客户端系统130可以包括助理应用136。客户端系统130的用户可以使用助理应用136来与助理系统140交互。在特定实施例中,助理应用136可以包括独立的应用。在特定实施例中,助理应用136可以被集成到社交网络应用134或另一个合适的应用(例如,消息传递应用)中。在特定实施例中,助理应用136也可以集成到客户端系统130、助理硬件设备或任何其他合适的硬件设备中。在特定实施例中,可以经由web浏览器132访问助理应用136。在特定实施例中,用户可以经由不同的模态提供输入。作为示例而不是作为限制,模态可以包括音频、文本、图像、视频等。助理应用136可以将用户输入传送给助理系统140。基于用户输入,助理系统140可以生成响应。助理系统140可以将生成的响应发送给助理应用136。然后,助理应用136可以向客户端系统130的用户呈现响应。所呈现的响应可以基于不同的模态,如音频、文本、图像和视频。作为示例而不是作为限制,用户可以口头向助理应用136询问交通信息(即,经由音频模态)。然后,助理应用136可以将请求传送给助理系统140。助理系统140可以相应地生成结果并将其发送回助理应用136。助理应用136还可以以文本向用户呈现结果。
在特定实施例中,助理系统140可以帮助用户从不同的源检索信息。助理系统140还可以帮助用户向不同的服务提供者请求服务。在特定实施例中,助理系统140可以经由客户端系统130中的助理应用136接收用户对信息或服务的请求。助理系统140可以使用自然语言理解来基于用户简档和其他相关信息分析用户请求。分析的结果可以包括与在线社交网络相关联的不同实体。然后,助理系统140可以检索信息或请求与这些实体相关联的服务。在特定实施例中,当为用户检索信息或请求服务时,助理系统140可以与社交网络系统160和/或第三方系统170交互。在特定实施例中,助理系统140可以使用自然语言生成技术为用户生成个性化的通信内容。个性化通信内容可以包括例如检索到的信息或所请求服务的状态。在特定实施例中,助理系统140可以使用户能够通过使用对话管理技术来在有状态和多轮会话中与它进行关于信息或服务的交互。在下面图2的讨论中更详细地描述了助理系统140的功能。
在特定实施例中,社交网络系统160可以是可以托管在线社交网络的网络可寻址计算系统。社交网络系统160可以生成、存储、接收并发送社交网络数据(诸如例如,用户简档数据、概念简档数据、社交图信息或与在线社交网络相关的其他合适的数据)。社交网络系统160可以由网络环境100的其他部件直接地或经由网络110来访问。作为示例而不是作为限制,客户端系统130可以使用web浏览器132或与社交网络系统160相关联的原生(native)应用(例如,移动社交网络应用、消息传递应用、另一合适的应用或其任何组合)直接地或经由网络110来访问社交网络系统160。在特定实施例中,社交网络系统160可以包括一个或更多个服务器162。每个服务器162可以是单一服务器(unitary server)或跨越多台计算机或多个数据中心的分布式服务器。服务器162可以具有各种类型,诸如,例如且没有限制,web服务器、新闻服务器、邮件服务器、消息服务器、广告服务器、文件服务器、应用服务器、交换服务器、数据库服务器、代理服务器、适合于执行本文描述的功能或过程的另一服务器、或者其任何组合。在特定实施例中,每个服务器162可以包括用于执行由服务器162实现或支持的适当功能的硬件、软件或嵌入式逻辑组件、或两个或更多个这样的部件的组合。在特定实施例中,社交网络系统160可以包括一个或更多个数据储存器164。数据储存器164可以用于存储各种类型的信息。在特定实施例中,可以根据特定的数据结构来组织存储在数据储存器164中的信息。在特定实施例中,每个数据储存器164可以是关系数据库、纵列(columnar)数据库、相关性数据库或其他合适的数据库。尽管本公开描述或示出了特定类型的数据库,但是本公开设想了任何合适类型的数据库。特定实施例可以提供使客户端系统130、社交网络系统160或第三方系统170能够管理、检索、修改、添加或删除存储在数据储存器164中的信息的接口。
在特定实施例中,社交网络系统160可以在一个或更多个数据储存器164中存储一个或更多个社交图。在特定实施例中,社交图可以包括多个节点——其可以包括多个用户节点(各自对应于特定用户)或多个概念节点(各自对应于特定概念)——以及关连节点的多条边。社交网络系统160可以向在线社交网络的用户提供与其他用户通信和交互的能力。在特定实施例中,用户可以经由社交网络系统160加入在线社交网络,且然后添加与社交网络系统160中的他们想要关连到的多个其他用户的关连(例如,关系)。在本文,术语“朋友”可以指用户经由社交网络系统160与其形成关连、关联(association)或关系的社交网络系统160的任何其他用户。
在特定实施例中,社交网络系统160可以向用户提供对由社交网络系统160支持的各种类型的项目或对象采取动作的能力。作为示例而不是作为限制,项目和对象可以包括社交网络系统160的用户可以属于的群组或社交网络、用户可能感兴趣的事件或日历条目、用户可以使用的基于计算机的应用、允许用户经由服务来购买或销售商品的交易、用户可以执行的与广告的交互、或其他合适的项目或对象。用户可以与能够在社交网络系统160中或者由第三方系统170的外部系统表示的任何事物进行交互,第三方系统170与社交网络系统160分离并且经由网络110耦合到社交网络系统160。
在特定实施例中,社交网络系统160能够链接各种实体。作为示例而不是作为限制,社交网络系统160可以使用户能够彼此交互以及从第三方系统170或其他实体接收内容,或者允许用户通过应用编程接口(API)或其他通信渠道与这些实体交互。
在特定实施例中,第三方系统170可以包括一种或更多种类型的服务器、一个或更多个数据储存器、一个或更多个接口(包括但不限于API)、一个或更多个web服务、一个或更多个内容源、一个或更多个网络或任何其他合适的部件(例如,服务器可以与这些部件通信)。第三方系统170可以由与操作社交网络系统160的实体不同的实体进行操作。然而,在特定实施例中,社交网络系统160和第三方系统170可以结合彼此来操作以向社交网络系统160或第三方系统170的用户提供社交网络服务。在这个意义上,社交网络系统160可以提供平台或骨干网,其他系统(例如第三方系统170)可以使用该平台或骨干网来在整个互联网上向用户提供社交网络服务和功能。
在特定实施例中,第三方系统170可以包括第三方内容对象提供者。第三方内容对象提供者可以包括可以被传送到客户端系统130的内容对象的一个或更多个源。作为示例而不是作为限制,内容对象可以包括关于用户感兴趣的事情或活动的信息,诸如例如电影放映时间、电影评论、餐馆评论、餐馆菜单、产品信息和评论或其他合适的信息。作为另一个示例而不是作为限制,内容对象可以包括激励内容对象(例如优惠券、折扣券、礼品券或其他合适的激励对象)。
在特定实施例中,社交网络系统160还包括用户生成的内容对象,其可以增强用户与社交网络系统160的交互。用户生成的内容可以包括用户可以添加、上传、发送或“发布”到社交网络系统160的任何内容。作为示例而不是作为限制,用户将帖子从客户端系统130传送到社交网络系统160。帖子可以包括数据,例如状态更新或其他文本数据、位置信息、照片、视频、链接、音乐或其他类似数据或媒体。内容还可以由第三方通过“通信渠道”(例如动态消息或流)来添加到社交网络系统160。
在特定实施例中,社交网络系统160可以包括各种服务器、子系统、程序、模块、日志和数据储存器。在特定实施例中,社交网络系统160可以包括下列项中的一个或更多个:web服务器、动作记录器、API请求服务器、相关性和排序引擎、内容对象分类器、通知控制器、动作日志、第三方内容对象暴露日志、推理模块、授权/隐私服务器、搜索模块、广告定位模块(advertisement-targeting module)、用户界面模块、用户简档储存器、关连储存器、第三方内容储存器或位置储存器。社交网络系统160还可以包括合适的部件,如网络接口、安全机构、负载平衡器、故障转移服务器、管理和网络操作控制台、其他合适的部件、或其任何合适的组合。在特定实施例中,社交网络系统160可以包括用于存储用户简档的一个或更多个用户简档储存器。用户简档可以包括例如,传记信息、人口统计信息、行为信息、社交信息或其他类型的描述性信息(例如工作经历、教育历史、爱好或偏好、兴趣、亲和性或位置)。兴趣信息可以包括与一个或更多个类别相关的兴趣。类别可以是一般的或特定的。作为示例而不是作为限制,如果用户“赞(like)”关于一种品牌的鞋的文章,则该类别可以是品牌,或者“鞋”或“衣服”的一般类别。关连储存器可以用于存储关于用户的关连信息。关连信息可以指示具有相似或共同的工作经历、组成员资格、爱好、教育历史或者以任何方式相关或共享共同属性的用户。关连信息还可以包括在不同用户和内容(内部和外部)之间的用户定义的关连。web服务器可以用于经由网络110将社交网络系统160链接到一个或更多个客户端系统130或一个或更多个第三方系统170。web服务器可以包括邮件服务器或用于在社交网络系统160和一个或更多个客户端系统130之间接收并路由(routing)消息的其他消息传递功能。API请求服务器可以允许第三方系统170通过调用一个或更多个API来访问来自社交网络系统160的信息。动作记录器可以用于从web服务器接收关于用户在社交网络系统160上或之外的动作的通信。结合动作日志,可以维护用户暴露于第三方内容对象的第三方内容对象日志。通知控制器可以向客户端系统130提供关于内容对象的信息。信息可以作为通知被推送到客户端系统130,或者信息可以响应于从客户端系统130接收的请求而从客户端系统130中被拉取。授权服务器可以用于实施社交网络系统160的用户的一个或更多个隐私设置。用户的隐私设置确定与用户相关联的特定信息可以如何被共享。授权服务器可以诸如例如通过设置适当的隐私设置来允许用户选择加入或选择退出使他们的动作由社交网络系统160记录或者与其他系统(例如,第三方系统170)共享。第三方内容对象储存器可以用于存储从第三方(例如第三方系统170)接收的内容对象。位置储存器可以用于存储从客户端系统130接收的与用户相关联的位置信息。广告定价模块可以组合社交信息、当前时间、位置信息或其他合适的信息以用通知的形式向用户提供相关广告。
助理系统
图2示出了助理系统140的示例架构。在特定实施例中,助理系统140可以帮助用户获得信息或服务。助理系统140可以使用户能够在有状态和多轮会话中用多模态用户输入(如声音、文本、图像、视频)与其进行交互,以获得帮助。助理系统140可以创建和存储包括与用户相关联的个人信息和上下文信息的用户简档。在特定实施例中,助理系统140可以使用自然语言理解来分析用户输入。分析可以基于用户简档,以获得更个性化和上下文感知的理解。助理系统140可以基于分析来解析与用户输入相关联的实体。在特定实施例中,助理系统140可以与不同的代理交互,以获得与解析的实体相关联的信息或服务。助理系统140可以通过使用自然语言生成来为用户生成关于信息或服务的响应。通过与用户的交互,助理系统140可以使用对话管理技术来管理和转发与用户的会话流。在特定实施例中,助理系统140还可以通过汇总信息来帮助用户有效和高效地消化所获得的信息。助理系统140还可以通过提供帮助用户与在线社交网络交互(例如,创建帖子、评论、消息)的工具,来帮助用户更好地参与在线社交网络。助理系统140另外可以帮助用户管理不同的任务,如持续跟踪事件。在特定实施例中,助理系统140可以在与用户相关的时间,而没有用户输入的情况下,基于用户简档主动执行与用户兴趣和偏好相关的预授权任务。在特定实施例中,助理系统140可以检查隐私设置,以确保根据用户的隐私设置,访问用户的简档或其他用户信息以及执行不同的任务是被允许的。
在特定实施例中,助理系统140可以从与用户相关联的客户端系统130中的助理应用136接收用户输入。如果用户输入基于文本模态,则助理系统140可以在消息传递平台205接收它。如果用户输入基于音频模态(例如,用户可以对助理应用136说话或者向助理应用136发送包括语音的视频),则助理系统140可以使用音频语音识别(ASR)模块210对其进行处理,以将用户输入转换成文本。如果用户输入基于图像或视频模态,则助理系统140可以使用消息传递平台205内的光学字符识别技术对其进行处理,以将用户输入转换成文本。消息传递平台205或ASR模块210的输出可以在助理xbot 215处接收。
在特定实施例中,助理xbot 215可以是一种类型的聊天机器人(chat bot)。助理xbot 215可以包括可编程服务通道,可编程服务通道可以是用作用户个人助理的软件代码、逻辑或例程(routine)。助理xbot 215可以作为助理系统140的用户门户。因此,助理xbot 215可以被认为是一种类型的会话代理。在特定实施例中,助理xbot 215可以将文本用户输入发送到自然语言理解(NLU)模块220,以解释用户输入。在特定实施例中,NLU模块220可以从用户上下文引擎225和语义信息聚合器(semantic information aggregator)230获得信息,以准确理解用户输入。用户上下文引擎225可以存储用户的用户简档。用户的用户简档可以包括用户简档数据,该用户简档数据包括与用户相关联的人口统计信息、社交信息和上下文信息。用户简档数据还可以包括通过动态消息、搜索日志、消息传递平台205等上的对话聚集的用户对多个主题的兴趣和偏好。用户简档的使用可以在隐私检查模块245之后受到保护,以确保用户的信息只能用于他/她的利益,而不能与任何其他人共享。语义信息聚合器230可以向NLU模块220提供与多个预定义的域(domain)、意图和槽相关联的本体数据(ontology data)。在特定实施例中,域可以表示交互的社交背景,例如,教育。意图可以指示用户与助理系统140交互的目的。槽可以表示基本语义实体。例如,“比萨”的槽可以是盘子。语义信息聚合器230还可以从社交图、知识图和概念图中提取信息,并从用户上下文引擎225检索用户简档。语义信息聚合器230还可以通过确定聚合什么信息、注释用户输入的n-gram(n元文法)、基于聚合的信息用置信度分数对n-gram进行排序、将排序后的n-gram公式化为可以被NLU模块220用于理解用户输入的特征,来处理来自这些不同源的信息。基于用户上下文引擎225和语义信息聚合器230的输出,NLU模块220可以以个性化和上下文感知的方式从用户输入中识别域、意图和一个或更多个槽。作为示例而不是作为限制,用户输入可以包括“告诉我如何去星巴克(show me how to get to the Starbucks)”。NLU模块220可以基于用户的个人信息和相关联的上下文信息来识别用户想要去的特定星巴克。在特定实施例中,NLU模块220可以包括语言词典(lexicon of language)、语法分析器(parser)和语法规则,以将句子划分成内部表示。NLU模块220还可以包括一个或更多个程序,该程序使用语用学(pragmatics)来执行朴素(naive)语义或随机语义分析,以理解用户输入。在特定实施例中,语法分析器可以基于包括多个长短期记忆(LSTM)网络的深度学习架构。作为示例而不是作为限制,语法分析器可以基于循环神经网络文法(RNNG)模型,这是一种类型的循环和递归LSTM算法。
在特定实施例中,来自NLU模块220的所识别的域、意图和一个或更多个槽可以被发送到对话引擎235。在特定实施例中,对话引擎235可以管理用户与助理xbot 215之间的会话流和对话状态。对话引擎235另外可以存储用户和助理xbot 215之间的先前会话。在特定实施例中,对话引擎235可以与实体解析模块240通信,以解析与一个或更多个槽相关联的实体,这支持对话引擎235转发用户和助理xbot 215之间的会话流。在特定实施例中,实体解析模块240可以在解析实体时访问社交图、知识图和概念图。实体可以包括例如独特的用户或概念,每个用户或概念可以具有唯一的标识符(ID)。作为示例而不是作为限制,知识图可以包括多个实体。每个实体可以包括与一个或更多个属性值相关联的单个记录。特定记录可以与唯一的实体标识符相关联。对于实体的一个属性,每个记录可以有不同的值。每个属性值可以与置信度概率相关联。属性值的置信度概率表示该值对于给定属性是准确的概率。每个属性值也可以与语义权重相关联。属性值的语义权重可以表示考虑到所有可用信息该值在语义上适合给定属性的程度。例如,知识图可以包括电影“火星救援(TheMartian)”(2015)的实体,其包括已经从多个内容源(例如,Facebook、Wikipedia、CSM、IMDb、Metacritics、Rovi、TMDb和Rotten Tomatoes)提取,然后被去重复、解析和融合以生成知识图的单个唯一记录的信息。实体可以与指示电影“火星救援”(2015年)的类型(genre)的空间属性值相关联。实体解析模块240另外可以从用户上下文引擎225请求与用户输入相关联的用户的用户简档。在特定实施例中,实体解析模块240可以与隐私检查模块245通信,以保证实体的解析不违反隐私策略。在特定实施例中,隐私检查模块245可以使用授权/隐私服务器来实施隐私策略。作为示例而不是作为限制,待解析的实体可以是在他/她的隐私设置中指定他/她的身份不应该在在线社交网络上可搜索的另一个用户,因此实体解析模块240可以响应于请求而不返回该用户的标识符。基于从社交图、知识图、概念图和用户简档获得的信息,并遵循适用的隐私策略,实体解析模块240因此可以以个性化和上下文感知的方式准确地解析与用户输入相关联的实体。在特定实施例中,每个解析的实体可以与由社交网络系统160托管的一个或更多个标识符相关联。作为示例而不是作为限制,标识符可以包括唯一的用户标识符(ID)。在特定实施例中,每个解析的实体也可以与置信度分数相关联。
在特定实施例中,对话引擎235可以基于所识别的意图和域以及所解析的实体与不同的代理通信。在特定实施例中,代理可以包括第一方代理250和第三方代理255。在特定实施例中,第一方代理250可以包括可由助理系统140访问和控制的内部代理(例如,与在线社交网络提供的服务相关联的代理(Messenger、Instagram))。在特定实施例中,第三方代理255可以包括助理系统140不能控制的外部代理(例如,音乐流代理(声田(Spotify))、门票销售代理(Ticketmaster))。第一方代理250可以与第一方提供者260相关联,该第一方提供者260提供由社交网络系统160托管的内容对象和/或服务。第三方代理255可以与第三方提供者265相关联,该第三方提供者265提供由第三方系统170托管的内容对象和/或服务。
在特定实施例中,从对话引擎235到第一方代理250的通信可以包括请求由第一方提供者260提供的特定内容对象和/或服务。因此,第一方代理250可以从第一方提供者260检索所请求的内容对象和/或执行命令第一方提供者260执行所请求服务的任务。在特定实施例中,从对话引擎235到第三方代理255的通信可以包括请求由第三方提供者265提供的特定内容对象和/或服务。因此,第三方代理255可以从第三方提供者265检索所请求的内容对象和/或执行命令第三方提供者265执行所请求服务的任务。第三方代理255可以访问隐私检查模块245,以保证在与第三方提供者265交互之前没有隐私侵犯。作为示例而不是作为限制,与用户输入相关联的用户可以在他/她的隐私设置中指定他/她的简档信息对于任何第三方内容提供者是不可见的。因此,当从第三方提供者265检索与用户输入相关联的内容对象时,第三方代理255可以在不向第三方提供者265透露哪个用户正在请求内容对象的情况下完成检索。
在特定实施例中,第一方代理250或第三方代理255中的每一个可以被指定用于特定域。作为示例而不是作为限制,域可以包括天气、运输、音乐等。在特定实施例中,助理系统140可以协同使用多个代理来响应用户输入。作为示例而不是作为限制,用户输入可以包括“指引我到我的下一个会议(direct me to my next meeting)”。助理系统140可以使用日历代理来检索下一个会议的位置。助理系统140然后可以使用导航代理来指引用户到下一个会议。
在特定实施例中,第一方代理250或第三方代理255中的每一个可以从用户上下文引擎225检索用户简档,从而以个性化和上下文感知的方式执行任务。作为示例而不是作为限制,用户输入可以包括“为我预订去机场的乘坐(book me a ride to the airport)”。运输代理可以执行预订乘坐的任务。运输代理可以在预订乘坐之前从用户上下文引擎225检索用户的用户简档。例如,用户简档可以指示用户更喜欢出租车,因此运输代理可以为用户预订出租车。作为另一个示例,与用户简档相关联的上下文信息可以指示用户赶时间,因此运输代理可以为用户从拼车服务(例如,Uber、Lyft)预订乘坐,因为从拼车服务获得乘坐可能比出租车公司更快。在特定实施例中,第一方代理250或第三方代理255中的每一个在执行任务时可以考虑其他因素。作为示例而不是作为限制,其他因素可以包括价格、评级、效率、与在线社交网络的伙伴关系等。
在特定实施例中,对话引擎235可以与会话理解编写器(CU编写器)270通信。对话引擎235可以将所请求的内容对象和/或所请求服务的状态发送给CU编写器270。在特定实施例中,对话引擎235可以将所请求的内容对象和/或所请求服务的状态作为<k,c,u,d>元组(tuple)发送,其中k指示知识源、c指示通信目标、u指示用户模型,并且d指示话语(discourse)模型。在特定实施例中,CU编写器270可以包括自然语言生成器(NLG)271和用户界面(UI)有效载荷生成器272。自然语言生成器271可以基于对话引擎235的输出生成通信内容。在特定实施例中,NLG271可以包括内容确定部件、句子规划器和表层实现(surfacerealization)部件。内容确定部件可以基于知识源、通信目标和用户的期望来确定通信内容。作为示例而不是作为限制,确定可以基于描述逻辑。描述逻辑可以包括例如三个基本观念(notion),它们是个体(表示域中的对象)、概念(描述个体集合)和角色(表示个体或概念之间的二元关系)。描述逻辑可以由一组构造器来表征,该构造器允许自然语言生成器271从原子(atomic)概念/角色构建复杂概念/角色。在特定实施例中,内容确定部件可以执行以下任务来确定通信内容。第一任务可以包括翻译任务,其中对自然语言生成器271的输入可以被翻译成概念。第二任务可以包括选择任务,其中可以基于用户模型从翻译任务产生的概念中选择相关概念。第三任务可以包括验证任务,其中可以验证所选概念的一致性。第四任务可以包括实例化任务,其中被验证的概念可以被实例化为可由自然语言生成器271处理的可执行文件。句子规划器可以确定通信内容的组织,使其为人所理解。表层实现部件可以确定要使用的特定单词、句子的顺序以及通信内容的风格。UI有效载荷生成器272可以确定要呈现给用户的通信内容的优选模态。在特定实施例中,CU编写器270可以与隐私检查模块245通信,以确保通信内容的生成遵循隐私策略。在特定实施例中,在生成通信内容并确定通信内容的模态时,CU编写器270可以从用户上下文引擎225检索用户简档。因此,对于用户来说,通信内容可以是更加自然、个性化和上下文感知的。作为示例而不是作为限制,用户简档可以指示用户喜欢会话中的短句,因此生成的通信内容可以基于短句。作为另一个示例而不是作为限制,与用户简档相关联的上下文信息可以指示用户正在使用仅输出音频信号的设备,因此UI有效载荷生成器272可以将通信内容的模态确定为音频。
在特定实施例中,CU编写器270可以将生成的通信内容发送给助理xbot 215。在特定实施例中,助理xbot 215可以将通信内容发送到消息传递平台205。消息传递平台205还可以经由助理应用136向客户端系统130发送通信内容。在替代实施例中,助理xbot 215可以将通信内容发送到文本到语音(TTS)模块275。TTS模块275可以将通信内容转换成音频剪辑。TTS模块275还可以经由助理应用136将音频剪辑发送到客户端系统130。
在特定实施例中,助理xbot 215可以在不接收用户输入的情况下与主动推断(proactive inference)层280交互。主动推断层280可以基于从用户上下文引擎225检索的用户简档来推断用户兴趣和偏好。在特定实施例中,主动推断层280还可以与主动代理285就推断进行通信。主动代理285可以基于推断执行主动任务。作为示例而不是作为限制,主动任务可以包括向用户发送内容对象或提供服务。在特定实施例中,每个主动任务可以与一个议程项目(agenda item)相关联。议程项目可以包括循环出现的项目,如每日摘要。议程项目也可以包括一次性项目。在特定实施例中,主动代理285可以在执行主动任务时从用户上下文引擎225检索用户简档。因此,主动代理285可以以个性化和上下文感知的方式执行主动任务。作为示例而不是作为限制,主动推断层可以推断用户喜欢Maroon 5乐队,并且主动代理285可以针对用户生成Maroon 5的新歌曲/专辑的推荐。
在特定实施例中,主动代理285可以基于用户简档生成与主动任务相关联的候选实体。该生成可以基于使用确定性滤波器从结构化数据储存器检索候选实体的直接后端查询。可替代地,该生成可以基于机器学习模型,该机器学习模型基于用户简档、实体属性以及用户和实体之间的相关性进行训练。作为示例而不是作为限制,机器学习模型可以基于支持向量机(SVM)。作为另一个示例而不是作为限制,机器学习模型可以基于回归模型。作为另一个示例而不是作为限制,机器学习模型可以基于深度卷积神经网络(DCNN)。在特定实施例中,主动代理285还可以基于用户简档和与候选实体相关联的内容来对生成的候选实体进行排序。排序可以基于用户兴趣与候选实体之间的相似性。作为示例而不是作为限制,助理系统140可以生成表示用户兴趣的特征向量和表示候选实体的特征向量。助理系统140然后可以计算表示用户兴趣的特征向量和表示候选实体的特征向量之间的相似性分数(例如,基于余弦相似性)。可替代地,排序可以基于排序模型,其基于用户反馈数据进行训练。
在特定实施例中,主动任务可以包括向用户推荐候选实体。主动代理285可以调度(schedule)推荐,从而将推荐时间与推荐的候选实体相关联。推荐的候选实体也可以与优先级和到期时间相关联。在特定实施例中,推荐的候选实体可以被发送到主动调度器。主动调度器可以基于与任务相关联的优先级和其他相关因素(例如,推荐的候选实体的点击和印象)来确定向用户发送推荐的候选实体的实际时间。在特定实施例中,主动调度器然后可以将具有确定的实际时间的推荐候选实体发送到异步层(asynchronous tier)。异步层可以将推荐的候选实体临时存储为作业(job)。在特定实施例中,异步层可以在确定的实际时间将作业发送到对话引擎235以进行执行。在替代实施例中,异步层可以通过将其发送到其他表层(例如,与社交网络系统160相关联的其他通知服务)来执行作业。在特定实施例中,对话引擎235可以识别与用户相关联的对话意图、状态和历史。基于对话意图,对话引擎235可以从推荐的候选实体中选择一些候选实体来发送给客户端系统130。在特定实施例中,对话状态和历史可以指示用户是否参与了与助理xbot 215的正在进行的会话。如果用户参与了正在进行的会话,并且推荐任务的优先级低,则对话引擎235可以与主动调度器通信,以重新调度将所选候选实体发送到客户端系统130的时间。如果用户参与了正在进行的会话并且推荐任务的优先级高,则对话引擎235可以发起与用户的新的对话会话(dialogsession),其中可以呈现所选候选实体。因此,可以防止正在进行的会话的中断。当确定发送所选择的候选实体不会中断用户时,对话引擎235可以将所选择的候选实体发送到CU编写器270,以根据用户的隐私设置生成包括所选候选实体的个性化和上下文感知的通信内容。在特定实施例中,CU编写器270可以将通信内容发送给助理xbot 215,助理xbot 215然后可以经由消息传递平台205或TTS模块275将其发送给客户端系统130。
在特定实施例中,助理xbot 215可以响应于用户输入与主动代理285通信。作为示例而不是作为限制,用户可以要求助理xbot 215设置提醒。助理xbot 215可以请求主动代理285设置这样的提醒,并且主动代理285可以在稍后主动执行提醒用户的任务。
在特定实施例中,助理系统140可以包括汇总器(summarizer)290。汇总器290可以向用户提供定制的动态消息汇总。在特定实施例中,汇总器290可以包括多个元代理(metaagent)。多个元代理可以使用第一方代理250、第三方代理255或主动代理285来生成动态消息汇总。在特定实施例中,汇总器290可以从主动推断层280检索用户兴趣和偏好。汇总器290然后可以从实体解析模块240检索与用户兴趣和偏好相关联的实体。汇总器290还可以从用户上下文引擎225检索用户简档。基于来自主动推断层280、实体解析模块240和用户上下文引擎225的信息,汇总器290可以为用户生成个性化的和上下文感知的汇总。在特定实施例中,汇总器290可以将汇总发送给CU编写器270。CU编写器270可以处理汇总并将处理结果发送给助理xbot 215。然后,助理xbot 215可以经由消息传递平台205或TTS模块275向客户端系统130发送经处理的汇总。
图3示出了助理系统140响应用户请求的示例流程图。在特定实施例中,助理xbot215可以在接收到用户请求时访问请求管理器305。请求管理器305可以包括上下文提取器306和会话理解对象生成器(CU对象生成器)307。上下文提取器306可以提取与用户请求相关联的上下文信息。CU对象生成器307可以生成与用户请求相关的特定内容对象。在特定实施例中,请求管理器305可以将上下文信息和生成的内容对象存储在数据储存器310中,数据储存器310是在助理系统140中实现的特定数据储存器。
在特定实施例中,请求管理器305可以将生成的内容对象发送到NLU模块220。NLU模块220可以执行多个步骤来处理内容对象。在步骤221,NLU模块220可以生成内容对象的白名单(whitelist)。在步骤222,NLU模块220可以基于白名单执行特征化。在步骤223,NLU模块220可以基于从特征化产生的特征来执行域分类/选择。可以基于两个相关的过程进一步处理域分类/选择结果。在步骤224a,NLU模块220可以使用意图分类器来处理域分类/选择结果。意图分类器可以确定与用户请求相关联的用户意图。作为示例而不是作为限制,意图分类器可以基于机器学习模型,该模型可以将域分类/选择结果作为输入,并计算该输入与特定预定义意图相关联的概率。在步骤224b,NLU模块可以使用元意图(meta-intent)分类器来处理域分类/选择结果。元意图分类器可以确定描述用户意图的类别。作为示例而不是作为限制,元意图分类器可以基于机器学习模型,该模型可以将域分类/选择结果作为输入,并计算输入与特定预定义元意图相关联的概率。在步骤225a,NLU模块220可以使用槽标记器(slot tagger)来注释与用户请求相关联的一个或更多个槽。在步骤225b,NLU模块220可以使用元槽标记器为来自元意图分类器的分类结果注释一个或更多个槽。作为示例而不是作为限制,用户请求可以包括“将我账户中的500美元兑换成日元(change 500dollarsin my account to Japanese yen)”。意图分类器可以将用户请求作为输入,并将其公式化为向量。意图分类器然后可以基于表示用户请求的向量和表示不同预定义意图的向量之间的向量比较来计算用户请求与不同预定义意图相关联的概率。以类似的方式,槽标记器可以将用户请求作为输入,并将每个单词公式化为向量。意图分类器然后可以基于表示单词的向量和表示不同预定义槽的向量之间的向量比较来计算每个单词与不同预定义槽相关联的概率。用户的意图可以被分类为“兑换钱(changing money)”。用户请求的槽可以包括“500”、“美元(dollars)”、“账户(account)”和“日元(Japanese yen)”。用户的元意图可以被分类为“金融服务(financial service)”。元槽(meta slot)可以包括“金融(finance)”。
在特定实施例中,NLU模块220可以通过从语义信息聚合器230提取语义信息来改进内容对象的域分类/选择。在特定实施例中,语义信息聚合器230可以以下述方式聚合语义信息。语义信息聚合器230可以首先从用户上下文引擎225检索信息。在特定实施例中,用户上下文引擎225可以包括离线聚合器226和在线推断服务227。离线聚合器226可以处理从先前时间窗口收集的与用户相关联的多个数据。作为示例而不是作为限制,数据可以包括从先前90天的窗口收集的动态消息帖子/评论、与动态消息帖子/评论的交互、Instagram帖子/评论、搜索历史等。处理结果可以作为用户简档的一部分存储在用户上下文引擎225中。在线推断服务227可以分析由助理系统140在当前时间接收的与用户相关联的会话数据。分析结果也可以作为用户简档的一部分存储在用户上下文引擎225中。在特定实施例中,语义信息聚合器230然后可以在以下步骤中处理从用户上下文引擎225检索的信息,即用户简档。在步骤231,语义信息聚合器230可以基于自然语言处理(NLP)来处理从用户上下文引擎225检索的信息。在步骤232,处理结果可以由实体标记器用实体来注释。在步骤233,基于注释,语义信息聚合器230可以为检索到的信息生成字典。在步骤234,语义信息聚合器230可以对由实体标记器标记的实体进行排序。在特定实施例中,语义信息聚合器230可以与包括社交图、知识图和概念图的不同图330通信,以提取与从用户上下文引擎225检索的信息相关的本体数据。在特定实施例中,语义信息聚合器230可以聚合用户简档、排序后的实体和来自图330的信息。语义信息聚合器230然后可以将聚合的信息发送到NLU模块220,以促进域分类/选择。
在特定实施例中,NLU模块220的输出可以被发送到共指模块315,以解释与用户请求相关联的内容对象的指代。共指模块315可以包括指代创建316和指代消解(referenceresolution)317。在特定实施例中,指代创建316可以为由NLU模块220确定的实体创建指代。指代消解317可以准确地消解这些指代。作为示例而不是作为限制,用户请求可以包括“为我找到最近的沃尔玛并指引我到那里(find me the nearest Walmart and direct methere)”。共指模块315可以将“那里(there)”解释为“最近的沃尔玛(the nearestWalmart)”。在特定实施例中,共指模块315可以在必要时访问用户上下文引擎225和对话引擎235,以用提高的准确性来解释指代。
在特定实施例中,所识别的域、意图、元意图、槽和元槽以及所消解的指代可以被发送到实体解析模块240以解析相关实体。在特定实施例中,实体解析模块240可以包括域实体解析241和通用实体解析242。域实体解析241可以通过将槽和元槽归类到不同的域来解析实体。在特定实施例中,可以基于从图330中提取的本体数据来解析实体。本体数据可以包括不同槽/元槽和域之间的结构关系。本体也可以包括槽/元槽可以如何在较高级别包括域的层次结构内被分组、相关,并根据相似性和差异细分的信息。通用实体解析242可以通过将槽和元槽归类到不同的通用主题来解析实体。在特定实施例中,解析也可以基于从图330中提取的本体数据。本体数据可以包括不同槽/元槽和通用主题之间的结构关系。本体也可以包括槽/元槽可以如何在较高级别包括主题的层次结构内被分组、相关,并根据相似性和差异细分的信息。作为示例而不是作为限制,响应于对特斯拉(Tesla)汽车的优点的询问的输入,通用实体解析242可以将特斯拉汽车解析为车辆(vehicle),并且域实体解析241可以将特斯拉汽车解析为电动汽车(electric car)。
在特定实施例中,实体解析模块240的输出可以被发送到对话引擎235,以转发与用户的会话流。对话引擎235可以包括对话意图解析236和对话状态更新/排序器237。在特定实施例中,对话意图解析236可以解析与当前对话会话相关联的用户意图。在特定实施例中,对话状态更新/排序器237可以对当前对话会话的状态进行更新/排序。作为示例而不是作为限制,如果对话会话结束,对话状态更新/排序器237可以将对话状态更新为“完成(completed)”。作为另一个示例而不是作为限制,对话状态更新/排序器237可以基于与对话状态相关联的优先级来对对话状态进行排序。
在特定实施例中,对话引擎235可以就对话意图和相关联的内容对象与任务完成模块335进行通信。任务完成模块335可以包括动作选择部件336。在特定实施例中,对话引擎235另外可以对照关于对话状态的对话策略320进行检查。对话策略320可以包括通用策略321和特定于域的策略322,它们都可以指导如何基于对话状态选择下一个系统动作。在特定实施例中,任务完成模块335可以与对话策略320通信,以获得下一个系统动作的指导。在特定实施例中,动作选择部件336因此可以基于对话意图、相关联的内容对象和来自对话策略320的指导来选择动作。
在特定实施例中,任务完成模块335的输出可以被发送到CU编写器270。在替代实施例中,所选择的动作可能需要一个或更多个代理340参与。因此,任务完成模块335可以向代理340通知所选择的动作。同时,对话引擎235可以接收更新对话状态的指令。作为示例而不是作为限制,更新可以包括等待代理的响应。在特定实施例中,CU编写器270可以基于任务完成模块335的输出使用NLG 271而为用户生成通信内容。CU编写器270还可以使用UI有效载荷生成器272来确定所生成的通信内容的模态。由于所生成的通信内容可以被认为是对用户请求的响应,所以CU编写器270可以另外使用响应排序器273来对所生成的通信内容进行排序。作为示例而不是作为限制,排序可以指示响应的优先级。
在特定实施例中,CU编写器270的输出可以被发送到响应管理器325。响应管理器325可以执行不同的任务,包括存储/更新从数据储存器310检索的对话状态326以及生成响应327。在特定实施例中,所生成的响应和通信内容可以被发送到助理xbot 215。在替代实施例中,如果所确定的通信内容的模态是音频,则CU编写器270的输出可以另外发送到TTS模块275。然后,由TTS模块275生成的语音和由响应管理器325生成的响应可以被发送到助理xbot 215。
处理多模态用户输入
在特定实施例中,助理系统140可以从与用户相关联的客户端系统130接收多模态用户输入(例如,声音、图像、视频、文本)。助理系统140可以基于用户输入的不同模态,利用助理系统140的不同模块来处理多模态用户输入。然后,助理系统140可以基于实体解析模块240和共指模块315来理解用户输入,即,识别用户输入的主体/实体和语义含义。助理系统140还可以基于该理解生成多模态输出,并经由客户端系统130将多模态输出发送给用户。作为示例而不是作为限制,用户可以向助理系统140提交几个人的图片,并请求助理系统140发起对其中一个人的呼叫(例如,用户可以说“呼叫在左边的家伙”)。助理系统140可以确定这些人的身份,识别“在左边”的人,访问在左边的人的联系信息(遵守此人的隐私设置),并相应地为用户发起呼叫。特别地,助理系统140可以使用能够处理包含在多模态用户输入中的视觉输入的视觉识别代理,其中视觉识别代理可以访问各种计算机视觉模型来理解视觉输入。共指模块315可以使用对视觉输入的理解来解析与用户输入相关联的实体。基于对视觉输入的理解和解析的实体,助理系统140可以使用助理xbot 215来与用户进行会话,以通过执行对应于视觉输入的不同任务来进一步增强用户对助理系统140的体验。助理系统140可以响应于用户查询,反应性地处理多模态用户输入。助理系统140还可以通过基于用户输入提供建议来主动处理多模态用户输入。处理多模态用户输入和在不同输出模态之间无缝切换的能力使助理系统140很好地适应各种客户端系统130和软件,从而使助理系统140对用户更加有用和有吸引力。尽管本公开描述了以特定方式经由特定系统来处理特定多模态用户输入,但是本公开设想了以任何合适的方式经由任何合适的系统来处理任何合适的多模态用户输入。
在特定实施例中,助理系统140可以从与第一用户相关联的客户端系统130接收基于一个或更多个模态的用户输入。用户输入的模态中的至少一个模态可以是视觉模态。在特定实施例中,助理系统140可以基于一个或更多个机器学习模型、基于视觉模态来识别与用户输入相关联的一个或更多个主体。在特定实施例中,助理系统140可以基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性。然后,助理系统140可以基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体。在特定实施例中,助理系统140可以执行与一个或更多个解析的实体相关联的一个或更多个任务。助理系统140还可以向与第一用户相关联的客户端系统130发送用于响应于用户输入来呈现通信内容的指令。通信内容可以包括与所执行的一个或更多个任务相关联的信息。
图4示出了基于图2中的助理系统140的示例架构200来处理多模态用户输入的示例流程图。在特定实施例中,消息传递平台205可以从客户端系统130接收多模态用户输入405。多模态用户输入405可以包括字符串、音频剪辑、图像或视频剪辑中的一个或更多个。在特定实施例中,助理xbot 215可以从消息传递平台205接收多模态用户输入405。助理xbot215可以识别出多模态用户输入405包括视觉输入410和文本输入415。在特定实施例中,助理xbot 215可以将视觉输入410发送给一个或更多个视觉识别代理450,以对视觉输入410执行视觉分析,从而识别一个或更多个主体。在特定实施例中,视觉识别代理450可以是第一方代理250。在替代实施例中,视觉识别代理450可以是第三方代理255。作为示例而不是作为限制,与用户输入405相关联的一个或更多个主体可以包括人、地点、企业或对象中的一个或更多个。在特定实施例中,视觉识别代理450可以基于面部识别来识别一个或更多个人。在特定实施例中,视觉识别代理450可以基于对象检测来识别一个或更多个对象。在特定实施例中,视觉识别代理450可以在对话引擎235中在对话状态中存储所识别的一个或更多个主体。因此,将来必要时,助理系统140可以从对话引擎235中有效地检索所识别的一个或更多个主体。在特定实施例中,视觉识别代理450可以另外分别确定与一个或更多个主体相关联的一个或更多个属性。作为示例而不是作为限制,一个或更多个属性可以是图像内的位置(例如,在左边)、与主体相关联的颜色、主体的形状等。在特定实施例中,视觉识别代理450可以访问一个或更多个计算机视觉库,以进行视觉分析。作为示例而不是作为限制,一个或更多个计算机视觉库可以包括用于检测图像中的对象的库。关于对象检测的更多信息可以在2016年9月27日提交的第15/277938号美国专利申请中找到,该申请通过引用被并入。作为另一个示例而不是作为限制,一个或更多个计算机视觉库可以包括用于识别图像中的人脸的库。关于面部识别的更多信息可以在2014年3月4日提交的第12/922984号美国专利申请中找到,该申请通过引用被并入。使用基于面部识别和对象检测的机器学习模型来识别人、地点、企业和对象以及他们的属性可能是解决从视觉输入准确地识别主体及其属性的技术挑战的有效解决方案。在特定实施例中,视觉识别代理450可以基于视觉模态(即,视觉输入410)为用户输入405生成特征表示。生成的特征表示可以由一个或更多个计算机视觉库提供的一个或更多个机器学习模型来处理。作为示例而不是作为限制,一个或更多个机器学习模型可以包括支持向量机、回归模型或卷积神经网络中的一个或更多个。在特定实施例中,视觉识别代理450可以与隐私检查模块245通信,以确保在访问计算机视觉库时视觉分析遵守用户的隐私设置。在特定实施例中,每个库可以具有其自己的隐私检查部件,这保证对象检测或面部识别遵守用户的隐私设置。尽管本公开描述了以特定方式的特定的视觉分析,但是本公开设想了以任何合适的方式的任何合适的视觉分析。
在特定实施例中,助理xbot 215可以将文本输入415发送给NLU模块220。NLU模块220可以基于用户输入405的文本输入415来识别一个或更多个意图和一个或更多个槽415。在特定实施例中,所识别的一个或更多个意图和槽420以及来自视觉识别代理450的视觉分析结果425可以被发送到共指模块315。共指模块315可以基于所识别的一个或更多个槽来解析对应于由视觉识别代理450识别的一个或更多个主体的一个或更多个实体。共指模块315能够将文本输入415或音频输入的措辞信息与视觉输入410的视觉分析结果425相链接,这使得它成为解决从多模态用户输入405准确地解析实体的技术挑战的有效解决方案。另一方面,经由共指模块315对文本输入415和视觉输入410的联合分析可以产生对多模态用户输入405的改进的理解的技术优势。在特定实施例中,解析的实体和意图430可以被发送到另一个或更多个第一方代理250或第三方代理255,其可以基于所识别的意图来执行与一个或更多个解析的实体相关联的一个或更多个任务。作为示例而不是作为限制,用户输入405可以包括图像和句子“呼叫在左边的人”。NLU模块220可以将意图识别为[IN:呼叫(人)],并识别人槽[SL:“在左边”的人]。视觉识别代理450可以对图像执行视觉分析,以识别图像中在左边的人。然后,共指模块315可以解析在左边的人的身份。助理系统140还可以相应地执行呼叫该人的任务。尽管本公开描述了以特定方式解析特定实体,但是本公开设想了以任何合适的方式解析任何合适的实体。
在特定实施例中,第一方代理250或第三方代理255可以将一个或更多个任务的状态435发送给CU编写器270。然后,CU编写器270可以生成与所执行的一个或更多个任务相关联的信息的通信内容440。通信内容440可以包括字符串、音频剪辑、图像或视频剪辑中的一个或更多个。在特定实施例中,助理系统140可以以下面的方式确定通信内容440的一个或更多个模态。首先,助理系统140可以识别与第一用户相关联的上下文信息。然后,助理系统140可以识别与客户端系统130相关联的上下文信息。助理系统140可以进一步基于与第一用户相关联的上下文信息和与客户端系统130相关联的上下文信息来确定一个或更多个模态。作为示例而不是作为限制,与用户相关联的上下文信息可以指示用户在家,这意味着任何模态都可以适用于通信内容440。另一方面,与客户端系统130相关联的上下文信息可以指示客户端系统130仅支持音频输出。因此,所确定的模态可以仅包括音频。作为另一个示例而不是作为限制,与用户相关联的上下文信息可以指示用户正在高速列车上旅行,并且与客户端系统130相关联的上下文信息可以指示客户端系统130没有连接到Wi-Fi而是仅连接到蜂窝数据。在这种情况下,尽管客户端系统130支持所有模态,助理系统140仍然可以将文本确定为模态,因为使用蜂窝数据下载图像和/或视频比下载文本花费更长的时间。基于与用户相关联的上下文信息和与关联于用户的客户端系统130相关联的上下文信息来确定适当的模态可能是解决用基于适当模态的通信内容440来响应多模态用户输入405的技术挑战的有效解决方案,这允许助理系统140基于所确定的可能更适合用户当前情况的模态来与用户通信。另一方面,处理多模态用户输入405和在不同输出模态之间切换的能力可以产生有效地适应各种客户端系统130和软件的技术优势。尽管本公开描述了以特定方式确定特定模态,但是本公开设想了以任何合适的方式确定任何合适的模态。
在特定实施例中,用户输入405可以包括用户与媒体内容对象的交互。该用户交互可以基于助理系统140与哪个表层(surface)集成而变化。作为示例而不是作为限制,助理系统140可以与存储在客户端系统130中的照片库集成或者与在线社交网络相关联。相应地,用户交互可以是长时间按压(long-press)照片,这可以触发助理系统140执行对所按压的照片的理解。作为另一个示例而不是作为限制,助理系统140可以与消息传递应用集成。相应地,用户交互可以是在消息线程中分享照片,这可以触发助理系统140执行对所分享的照片的理解。作为另一个示例而不是作为限制,助理系统140可以与直播表层(livestreaming surface)集成。在直播期间,用户可以向助理系统140询问问题,这可以作为用户输入405来触发对直播数据的理解。例如,用户可能正在直播他/她的卢浮宫之行,并询问助理系统140哪个艺术家创作了当前正被直播的绘画。作为另一个示例而不是作为限制,助理系统140可以与虚拟现实(VR)表层集成。例如,用户可能正在使用VR表层来探索纽约市。用户可能看到了钱包,并向助理系统140询问该钱包的品牌和价格,这可以作为用户输入405。作为另一个示例而不是作为限制,助理系统140可以与社交网络应用集成。用户可能正在浏览他/她的朋友的帖子,并向助理系统140询问特定的食物帖子,这可以作为用户输入405来触发助理系统140为用户获取关于哪个餐馆提供该食物的信息。尽管本公开描述了以特定方式与特定媒体内容对象的特定用户交互,但是本公开设想了以任何合适的方式与任何合适的媒体内容对象的任何合适的用户交互。
在特定实施例中,助理系统140可以基于用户输入405的视觉模态,主动生成多个任务。然后,助理系统140可以从与第一用户相关联的客户端系统130接收第一用户对来自多个任务中的一个或更多个任务的用户选择。作为示例而不是作为限制,用户可能正在浏览新款Nike鞋子的图片。助理系统140可以主动生成多个任务,用户可以选择这些任务来查看价格、购买此鞋子或查看类似的鞋子。作为另一个示例而不是作为限制,用户可能正在家中直播,并且助理系统140可以检测到背景中的烟雾。然后,助理系统140可以主动警告用户有烟雾,以确保安全。助理系统140还可以生成一些任务,包括呼叫紧急号码、关闭家中的电等。作为另一个示例而不是作为限制,客户端系统130可以具有捕获用户家中的实时视觉数据的相机。用户的孩子可能走进来,并且基于检测到孩子,助理系统140可以主动为孩子生成一些任务。基于孩子以前的游戏历史,这些任务可以包括玩游戏。作为另一个示例而不是作为限制,用户可能已经在群组消息传递表层中向他/她的朋友(这些朋友将与他/她一起旅行)分享了航班预订的截屏。助理系统140可以识别航班信息并主动生成一些任务,这些任务包括为航班设置提醒、预订目的地的酒店房间、检查目的地的天气预报、租赁目的地的汽车等。作为另一个示例而不是作为限制,用户可能已经向他/她的朋友分享了新电影的预告片,并且助理系统140可以主动生成一些任务供用户选择。生成的任务可以包括购买该电影的票、将预告片发布到用户的动态消息,以及获取该电影的更多信息(例如演员和评价)。基于对视觉输入410的分析来主动向用户建议任务可以产生增加用户参与助理系统140的程度的技术优势。尽管本公开描述了以特定方式基于特定用户输入来主动生成特定任务,但是本公开设想了以任何合适的方式基于任何合适的用户输入来生成任何合适的任务。
图5示出了在用户和助理系统140之间经由多模态用户输入405和系统输出的示例交互。如图5所示,用户可以提交视觉输入410,视觉输入410是一张三个人的照片。助理系统140可以对照片执行视觉分析,以生成识别照片中的人的视觉分析结果425,即“照片中的人:David Jones、Mark Smith和Bill Anders”。用户还可以提交文本输入415a,即“Mark住在哪里(Where does Mark live)”。助理系统140可以基于文本输入415a和视觉分析结果425(遵守Mark的隐私设置)来执行确定Mark的住所的任务。助理系统140还可以相应地生成通信内容440a(即,“你的朋友当前住在美国Hometown(Your friend currently lives inHometown U.S.A.)”),并将该通信内容440a呈现给用户。用户可以提交另一个文本输入415b(即,通过输入“Mark有什么新消息(What’s new about Mark)”)来查询Mark最近的活动。随后,助理系统140可以基于文本输入415b和视觉分析结果425来执行汇总Mark最近的活动的任务。助理系统140可以进一步相应地生成通信内容440b,并且将其呈现给用户(即,通过呈现在线社交网络上引用Mark Smith的帖子的汇总的水平滚动列表)。用户可以继续另一个文本输入415c(即,通过输入“呼叫他”)来试图呼叫照片中的人。在这种情况下,助理系统140可以生成通信内容440c来与用户交互(即,通过应答“你想要呼叫谁?(Who do youwant to call?)”),以消除用户想要呼叫哪个人的歧义。随后,用户可以用文本输入415d(即通过输入“David”)进行明确。助理系统140可以执行呼叫所明确的人的任务,并生成通信内容440d(即,通过应答“呼叫”,)来向用户通知任务的状态435。用户可以提交另一个用户输入415e(即通过输入“提醒我在Mark生日那天呼叫他(Remind me to call Mark onhis birthday)”)来试图设置提醒。以类似的方式,助理系统140可以生成通信内容440e来与用户进行交互(即,通过应答“您想要将提醒设置在什么时间?(What time do you wantto set the reminder for?)”),以从用户处获取关于提醒的更多细节。然后,用户可以用文本输入415f(即,“午夜(Midnight)”)来提供这样的细节。到这一步,助理系统140可以执行设置提醒的任务,并生成通信内容440f(即,通过应答“我已经设置了9月13日午夜在Mark生日那天呼叫他的提醒(I have set a reminder for midnight,Sept 13to call Markon his birthday)”,)来向用户通知任务的状态435。尽管本公开描述了在用户和特定系统之间的以特定方式的特定交互,但是本公开设想了在用户和任何合适的系统之间以任何合适的方式的任何合适的交互。
图6示出了用于处理多模态用户输入405的示例方法600。该方法可以在步骤610开始,在步骤610,助理系统140可以从与第一用户相关联的客户端系统130接收基于一个或更多个模态的用户输入405,其中用户输入405的模态中的至少一个模态是视觉模态。在步骤620,助理系统140可以基于一个或更多个机器学习模型、基于视觉模态,来识别与用户输入405相关联的一个或更多个主体。在步骤630,助理系统140可以基于一个或更多个机器学习模型,分别确定与一个或更多个主体相关联的一个或更多个属性。在步骤640,助理系统140可以基于所确定的一个或更多个属性,解析对应于一个或更多个主体的一个或更多个实体。在步骤650,助理系统140可以执行与一个或更多个解析的实体相关联的一个或更多个任务。在步骤660,助理系统140可以向与第一用户相关联的客户端系统130发送用于响应于用户输入405来呈现通信内容440的指令,其中通信内容440包括与所执行的一个或更多个任务相关联的信息。在适当的情况下,特定实施例可以重复图6的方法的一个或更多个步骤。尽管本公开将图6的方法的特定步骤描述并示出为以特定顺序发生,但是本公开设想了图6的方法的任何合适的步骤以任何合适的顺序发生。此外,尽管本公开描述并示出了包括图6的方法的特定步骤的用于处理多模态用户输入的示例方法,但是本公开设想了包括任何合适的步骤的用于处理多模态用户输入的任何合适的方法,在适当的情况下,该合适的方法可以包括图6的方法的所有步骤、一些步骤或不包括这些步骤。此外,尽管本公开描述并示出了执行图6的方法的特定步骤的特定部件、设备或系统,但是本公开设想了执行图6的方法的任何合适步骤的任何合适的部件、设备或系统的任何合适的组合。
社交图
图7示出了示例社交图700。在特定实施例中,社交网络系统160可以在一个或更多个数据储存器中存储一个或更多个社交图700。在特定实施例中,社交图700可以包括多个节点——该多个节点可以包括多个用户节点702或多个概念节点704——以及连接这些节点的多条边706。每个节点可以与唯一的实体(即,用户或概念)相关联,每个实体可以具有唯一的标识符(ID),例如唯一的号码或用户名。出于教导的目的,以二维视觉映射表示(two-dimensional visual map representation)示出了图7所示的示例社交图700。在特定实施例中,社交网络系统160、客户端系统130、助理系统140或第三方系统170可以访问社交图700和相关社交图信息以用于合适的应用。社交图700的节点和边可以作为数据对象被存储在例如数据储存器(例如社交图数据库)中。这种数据储存器可以包括社交图700的节点或边的一个或更多个可搜索或可查询的索引。
在特定实施例中,用户节点702可以对应于社交网络系统160或助理系统140的用户。作为示例而不是作为限制,用户可以是与社交网络系统160或助理系统140交互或通信或通过社交网络系统160或助理系统140交互或通信的个人(人类用户)、实体(例如,企业、公司或第三方应用)或(例如,个人或实体的)团体。在特定实施例中,当用户向社交网络系统160注册账户时,社交网络系统160可以创建对应于用户的用户节点702,并将用户节点702存储在一个或更多个数据储存器中。本文描述的用户和用户节点702在适当的情况下可以指注册的用户和与注册的用户相关联的用户节点702。另外或作为替代方案,在适当的情况下,本文描述的用户和用户节点702可以指没有向社交网络系统160注册的用户。在特定实施例中,用户节点702可以与由用户提供的信息或由各种系统(包括社交网络系统160)收集的信息相关联。作为示例而不是作为限制,用户可以提供他或她的姓名、简档图片、联系信息、出生日期、性别、婚姻状况、家庭状况、职业、教育背景、偏好、兴趣或其他人口统计信息。在特定实施例中,用户节点702可以与对应于与用户相关联的信息的一个或更多个数据对象相关联。在特定实施例中,用户节点702可以对应于一个或更多个web界面。
在特定实施例中,概念节点704可以对应于概念。作为示例而不是作为限制,概念可以对应于地点(诸如例如,电影院、餐馆、地标或城市);网站(诸如例如,与社交网络系统160相关联的网站或与web应用服务器相关联的第三方网站);实体(诸如例如,个人、企业、团体、运动队或名人);资源(诸如例如,音频文件、视频文件、数字照片、文本文件、结构化文档或应用),其可以位于社交网络系统160内或外部服务器(例如web应用服务器)上;不动产或知识产权(诸如例如,雕塑、绘画、电影、游戏、歌曲、想法、照片或书面作品);游戏;活动;想法或理论;另一个合适的概念;或者两个或更多个这样的概念。概念节点704可以与由用户提供的概念的信息或由各种系统(包括社交网络系统160和助理系统140)收集的信息相关联。作为示例而不是作为限制,概念的信息可以包括名称或标题;一个或更多个图像(例如,书籍的封面的图像);位置(例如,地址或地理位置);网站(其可以与URL相关联);联系信息(例如,电话号码或电子邮件地址);其他合适的概念信息;或者这样的信息的任何合适的组合。在特定实施例中,概念节点704可以与一个或更多个数据对象相关联,一个或更多个数据对象对应于与概念节点704相关联的信息。在特定实施例中,概念节点704可以对应于一个或更多个web界面。
在特定实施例中,社交图700中的节点可以表示web界面(其可以被称为“简档界面”)或者由web界面表示。简档界面可以由社交网络系统160或助理系统140托管或是社交网络系统160或助理系统140可访问的。简档界面也可以在与第三方系统170相关联的第三方网站上被托管。作为示例而不是作为限制,对应于特定外部web界面的简档界面可以是特定外部web界面,并且简档界面可以对应于特定概念节点704。简档界面可以由所有其他用户或其他用户的选定子集可查看。作为示例而不是作为限制,用户节点702可以具有相应的用户简档界面,其中相应的用户可以添加内容、作出声明或以其他方式表达他或她自己。作为另一示例而不是作为限制,概念节点704可以具有相应的概念简档界面,其中一个或更多个用户可以添加内容、作出声明或表达他们自己,特别是关于对应于概念节点704的概念。
在特定实施例中,概念节点704可以表示由第三方系统170托管的第三方web界面或资源。第三方web界面或资源可以包括表示动作或活动的内容、可选择的图标或其他图标或其他可交互对象(其可以例如用JavaScript、AJAX或PHP代码来实现)以及其他元素。作为示例而不是作为限制,第三方web界面可以包括可选择的图标,例如“赞”、“签到(check-in)”、“吃”、“推荐”,或其他合适的动作或活动。查看第三方web界面的用户可以通过选择图标之一(例如,“签到”)来执行动作,使客户端系统130向社交网络系统160发送指示用户的动作的消息。响应于该消息,社交网络系统160可以在对应于用户的用户节点702和对应于第三方web界面或资源的概念节点704之间创建边(例如,签到类型边),并将边706存储在一个或更多个数据储存器中。
在特定实施例中,社交图700中的一对节点可以通过一条或更多条边706关连到彼此。连接一对节点的边706可以表示在该对节点之间的关系。在特定实施例中,边706可以包括或表示对应于在一对节点之间的关系的一个或更多个数据对象或属性。作为示例而不是作为限制,第一用户可以指示第二用户是第一用户的“朋友”。响应于该指示,社交网络系统160可以向第二用户发送“好友请求”。如果第二用户确认“好友请求”,则社交网络系统160可以在社交图700中创建将第一用户的用户节点702关连到第二用户的用户节点702的边706,并将边706作为社交图信息存储在一个或更多个数据储存器167中。在图7的示例中,社交图700包括指示在用户“A”和用户“B”的用户节点702之间的朋友关系的边706、以及指示在用户“C”和用户“B”的用户节点702之间的朋友关系的边。尽管本公开描述或示出了关连特定用户节点702的具有特定属性的特定边706,但是本公开设想了关连用户节点702的具有任何合适属性的任何合适的边706。作为示例而不是作为限制,边706可以表示友谊、家庭关系、商业或雇佣关系、粉丝关系(包括例如,赞等)、关注者关系、访问者关系(包括例如,访问、查看、签到、分享等)、订购者关系、上级/下级关系、互惠关系、非互惠关系、另一种合适类型的关系、或两种或更多种这样的关系。此外,尽管本公开一般将节点描述为被关连,但是本公开也将用户或概念描述为被关连。在本文,对被关连的用户或概念的引用在适当的情况下可以指在社交图700中由一条或更多条边706关连的对应于那些用户或概念的节点。
在特定实施例中,在用户节点702和概念节点704之间的边706可以表示由与用户节点702相关联的用户朝着与概念节点704相关联的概念执行的特定动作或活动。作为示例而不是作为限制,如图7所示,用户可以“赞”、“出席”、“播放”、“收听”、“烹饪”、“工作于”或“观看”概念,其中每个可以对应于边类型或子类型。对应于概念节点704的概念简档界面可以包括例如可选择的“签到”图标(诸如例如,可点击的“签到”图标)或可选择的“添加到收藏夹”图标。类似地,在用户点击这些图标之后,社交网络系统160可以响应于对应于相应动作的用户动作来创建“收藏夹”边或“签到”边。作为另一示例而不是作为限制,用户(用户“C”)可以使用特定的应用(声田,其为在线音乐应用)来收听特定的歌曲(“想象(Imagine)”)。在这种情况下,社交网络系统160可以在对应于用户的用户节点702和对应于歌曲和应用的概念节点704之间创建“收听”边706和“使用”边(如图7所示),以指示用户收听了歌曲并使用了应用。此外,社交网络系统160可以在对应于歌曲和应用的概念节点704之间创建“播放”边706(如图7所示),以指示特定的歌曲被特定的应用播放。在这种情况下,“播放”边706对应于由外部应用(声田)对外部音频文件(歌曲“想象”)执行的动作。尽管本公开描述了连接用户节点702和概念节点704的具有特定属性的特定边706,但是本公开设想了连接用户节点702和概念节点704的具有任何合适属性的任何合适的边706。此外,尽管本公开描述了表示单个关系的在用户节点702和概念节点704之间的边,但是本公开设想了表示一个或更多个关系的在用户节点702和概念节点704之间的边。作为示例而不是作为限制,边706可以表示用户喜欢并使用了特定概念。可替代地,另一条边706可以表示用户节点702和概念节点704之间(如图7中所示,用户“E”的用户节点702和“声田”的概念节点704之间)的每种类型的关系(或者多个单一关系)。
在特定实施例中,社交网络系统160可以在社交图700中的用户节点702和概念节点704之间创建边706。作为示例而不是作为限制,(诸如例如,通过使用由用户的客户端系统130托管的web浏览器或专用应用)查看概念简档界面的用户可以通过点击或选择“赞”图标来指示他或她喜欢由概念节点704表示的概念,这可以使用户的客户端系统130向社交网络系统160发送指示用户喜欢与概念简档界面相关联的概念的消息。响应于该消息,社交网络系统160可以在与用户相关联的用户节点702和概念节点704之间创建边706,如由在用户节点和概念节点704之间的“赞”边706所示的。在特定实施例中,社交网络系统160可以将边706存储在一个或更多个数据储存器中。在特定实施例中,边706可以由社交网络系统160响应于特定用户动作而自动形成。作为示例而不是作为限制,如果第一用户上传图片、观看电影或收听歌曲,则可以在对应于第一用户的用户节点702和对应于那些概念的概念节点704之间形成边706。尽管本公开描述了以特定方式形成特定边706,但是本公开设想了以任何合适的方式形成任何合适的边706。
向量空间和嵌入
图8示出了向量空间800的示例视图。在特定实施例中,可以在d维向量空间中表示对象或n-gram,其中d表示任何合适的维数。尽管向量空间800被示为三维空间,但这仅仅是为了说明的目的,因为向量空间800可以具有任何合适的维度。在特定实施例中,n-gram可以在向量空间800中被表示为向量,该向量被称为项目嵌入(term embedding)。每个向量可以包括对应于向量空间800中的特定点(即,向量的终点)的坐标。作为示例而不是作为限制,如图8所示,向量810、820和880可以被表示为向量空间800中的点。n-gram可以被映射到相应的向量表示。作为示例而不是作为限制,通过应用由字典定义的函数n-gramt1和n-gramt2可以分别映射到向量空间800中的向量和使得并且作为另一个示例而不是作为限制,可以利用被训练为将文本映射到向量表示的字典,或者这种字典本身可以通过训练来生成。作为另一个示例而不是作为限制,模型(例如Word2vec)可以用于将n-gram映射到向量空间800中的向量表示。在特定实施例中,可以通过使用机器学习模型(例如,神经网络)将n-gram映射到向量空间800中的向量表示。机器学习模型可能已经使用训练数据的序列(例如,每个包括n-gram的多个对象的语料库(corpus))进行了训练。
在特定实施例中,对象可以在向量空间800中被表示为向量,该向量被称为特征向量或对象嵌入。作为示例而不是作为限制,通过应用函数对象e1和e2可以分别映射到向量空间800中的向量和使得并且在特定实施例中,可以基于对象的一个或更多个特性、属性或特征、对象与其他对象的关系或与对象相关联的任何其他合适的信息来将对象映射到向量。作为示例而不是作为限制,函数可以通过特征提取将对象映射到向量,特征提取可以从初始测量数据集开始,并构建导出值(例如,特征)。作为示例而不是作为限制,通过使用算法以检测或隔离对象的各种期望部分或形状,包括视频或图像的对象可以被映射到向量。用于计算向量的特征可以基于从边检测、拐角(corner)检测、团块(blob)检测、脊线(ridge)检测、尺度不变特征变换、边方向、变化强度、自相关、运动检测、光流、阈值化、团块提取、模板匹配、霍夫(Hough)变换(例如,线、圆、椭圆、任意形状)获得的信息或任何其他合适的信息。作为另一个示例而不是作为限制,包括音频数据的对象可以基于特征(例如频谱斜率、音调系数、音频频谱质心、音频频谱包络、梅尔频率倒频谱(Mel-frequency cepstrum)或任何其他合适的信息)来被映射到向量。在特定实施例中,当对象具有太大而无法有效地被处理的数据或者包括冗余数据时,函数可以使用所变换的精简特征集(例如,特征选择)来将对象映射到向量。在特定实施例中,函数可以基于与对象e相关联的一个或更多个n-gram来将对象e映射到向量尽管本公开描述了以特定方式在向量空间中表示n-gram或对象,但是本公开设想了以任何合适的方式在向量空间中表示n-gram或对象。
在特定实施例中,社交网络系统160可以计算向量空间800中的向量的相似性度量。相似性度量可以是余弦相似性、Minkowski距离、Mahalanobis距离、Jaccard相似性系数或任何合适的相似性度量。作为示例而不是作为限制,和的相似性度量可以是余弦相似性作为另一个示例而不是作为限制,和的相似性度量可以是欧几里德(Euclidean)距离两个向量的相似性度量可以表示分别对应于两个向量的两个对象或n-gram彼此之间的相似程度,如通过向量空间800中两个向量之间的距离所测量的。作为示例而不是作为限制,基于相应向量之间的距离,向量810和向量820可以对应于比对应于向量810和向量880的对象与彼此更相似的对象。尽管本公开描述了以特定方式计算向量之间的相似性度量,但本公开设想了以任何合适的方式计算向量之间的相似性度量。
关于向量空间、嵌入、特征向量和相似性度量的更多信息可以在2015年11月23日提交的美国专利申请第14/949436号、2016年10月5日提交的美国专利申请第15/286315号和2016年11月30日提交的美国专利申请第15/365789号中找到,这些专利申请中的每一个通过引用并入。
人工神经网络
图9示出了示例人工神经网络(“ANN”)900。在特定实施例中,ANN可以指包括一个或更多个节点的计算模型。示例ANN 900可以包括输入层910、隐藏层920、930、960和输出层950。ANN 900的每个层可以包括一个或更多个节点,例如节点905或节点915。在特定实施例中,ANN的每个节点可以关连到ANN的另一个节点。作为示例而不是作为限制,输入层910的每个节点可以关连到隐藏层920的一个或更多个节点。在特定实施例中,一个或更多个节点可以是偏置节点(例如,层中不关连到前一层中的任何节点并且不从其接收输入的节点)。在特定实施例中,每层中的每个节点可以关连到前一层或后一层的一个或更多个节点。尽管图9描绘了具有特定层数、特定节点数和节点间特定关连的特定ANN,但是本公开设想了具有任何合适层数、任何合适节点数和节点间任何合适关连的任何合适的ANN。作为示例而不是作为限制,尽管图9描绘了输入层910的每个节点和隐藏层920的每个节点之间的关连,但是输入层910的一个或更多个节点可以不关连到隐藏层920的一个或更多个节点。
在特定实施例中,ANN可以是前馈ANN(例如,没有循环或回路的ANN,其中节点之间的通信从输入层开始在一个方向上流动,并前进到连续层)。作为示例而不是作为限制,隐藏层920的每个节点的输入可以包括输入层910的一个或更多个节点的输出。作为另一个示例而不是作为限制,输出层950的每个节点的输入可以包括隐藏层960的一个或更多个节点的输出。在特定实施例中,ANN可以是深度神经网络(例如,包括至少两个隐藏层的神经网络)。在特定实施例中,ANN可以是深度残差网络。深度残差网络可以是前馈ANN,其包括组织成残差块的隐藏层。第一残差块之后的每个残差块的输入可以是前一个残差块的输出和前一个残差块的输入的函数。作为示例而不是作为限制,到残差块N的输入可以是F(x)+x,其中F(x)可以是残差块N-1的输出,x可以是到残差块N-1的输入。尽管本公开描述了特定的ANN,但是本公开设想了任何合适的ANN。
在特定实施例中,激活函数可以对应于ANN的每个节点。节点的激活函数可以针对给定输入定义节点的输出。在特定实施例中,节点的输入可以包括输入集合。作为示例而不是作为限制,激活函数可以是恒等函数、二进制阶跃函数、逻辑函数或任何其他合适的函数。作为另一个示例而不是作为限制,节点k的激活函数可以是sigmoid函数双曲线正切函数整流器Fk(sk)=max(0,sk)或任何其他合适的函数Fk(sk),其中sk可以是节点k的有效输入。在特定实施例中,对应于节点的激活函数的输入可以被加权。每个节点可以使用基于加权输入的对应激活函数来生成输出。在特定实施例中,节点之间的每个关连可以与权重相关联。作为示例而不是作为限制,节点905和节点915之间的关连925可以具有0.4的加权系数,这可以指示节点905的输出乘以0.4被用作节点915的输入。作为另一个示例而不是作为限制,节点k的输出yk可以是yk=Fk(sk),其中Fk可以是对应于节点k的激活函数,sk=∑j(wjkxj)可以是节点k的有效输入,xj可以是关连到节点k的节点j的输出,并且wjk可以是节点j和节点k之间的加权系数。在特定实施例中,输入层的节点的输入可以基于表示对象的向量。尽管本公开描述了节点的特定输入和输出,但是本公开考虑了节点的任何合适的输入和输出。此外,尽管本公开可以描述节点之间的特定关连和权重,但是本公开考虑了节点之间的任何合适的关连和权重。
在特定实施例中,可以使用训练数据来训练ANN。作为示例而不是作为限制,训练数据可以包括ANN 900的输入和预期输出。作为另一个示例而不是作为限制,训练数据可以包括向量,每个向量表示训练对象和每个训练对象的预期标签。在特定实施例中,训练ANN可以包括通过优化目标函数来修改与ANN的节点之间的关连相关联的权重。作为示例而不是作为限制,可以使用训练方法(例如,共轭梯度法、梯度下降法、随机梯度下降)来反向传播作为表示训练对象的每个向量之间的距离测量的平方和误差(例如,使用最小化平方和误差的成本函数)。在特定实施例中,可以使用丢弃技术来训练ANN。作为示例而不是作为限制,在训练时可以暂时忽略一个或更多个节点(例如,不接收输入并且不生成输出)。对于每个训练对象,ANN的一个或更多个节点都可以有被忽略的一定概率。针对特定训练对象忽略的节点可以不同于针对其他训练对象忽略的节点(例如,可以逐个对象地临时忽略节点)。尽管本公开描述了以特定方式训练ANN,但是本公开设想了以任何合适的方式训练ANN。
隐私
在特定实施例中,计算系统的一个或更多个对象(例如,内容或其他类型的对象)可以与一个或更多个隐私设置相关联。一个或更多个对象可以存储在任何合适的计算系统或应用上,或者以其他方式与任何合适的计算系统或应用相关联,该计算系统或应用诸如例如是社交网络系统160、客户端系统130、助理系统140、第三方系统170、社交网络应用、助理应用、消息传递应用、照片共享应用或者任何其他合适的计算系统或应用。尽管本文讨论的示例是在在线社交网络的上下文中,但是这些隐私设置可以应用于任何其他合适的计算系统。对象的隐私设置(或“访问设置”)可以以任何合适的方式——诸如例如与对象相关联地、在授权服务器上用索引、以另一种合适的方式、或其任何合适的组合——被存储。关于对象的隐私设置可以指定如何可以在在线社交网络中访问、存储或以其他方式使用(例如,查看、共享、修改、复制、执行、显现或识别)该对象(或与该对象相关联的特定信息)。在对象的隐私设置允许特定用户或其他实体访问该对象时,该对象可以被描述为相对于该用户或其他实体是“可见的”。作为示例而不是作为限制,在线社交网络的用户可以指定关于用户简档页面的隐私设置,该隐私设置识别可以访问在用户简档页面上的工作经历信息的一组用户,因而排除其他用户访问该信息。
在特定实施例中,对象的隐私设置可以指定不应当被允许访问与对象相关联的某些信息的用户或其他实体的“黑名单(blocked list)”。在特定实施例中,黑名单可以包括第三方实体。黑名单可以指定一个或更多个用户或实体,对象对这些用户或实体是不可见的。作为示例而不是作为限制,用户可以指定不可以访问与用户相关联的相册的用户集合,因而排除那些用户访问相册(同时也可能允许不在指定用户集合内的某些用户访问相册)。在特定实施例中,隐私设置可以与特定社交图元素相关联。社交图元素(例如节点或边)的隐私设置可以指定可以如何使用在线社交网络来访问社交图元素、与社交图元素相关联的信息、或与社交图元素相关联的对象。作为示例而不是作为限制,对应于特定照片的特定概念节点704可以具有指定照片仅可以由在照片中标记的用户以及在照片中标记的用户的朋友访问的隐私设置。在特定实施例中,隐私设置可以允许用户选择加入或选择退出使他们的内容、信息或动作被社交网络系统160或助理系统140存储/记录或者与其他系统(例如,第三方系统170)分享。尽管本公开描述了以特定方式使用特定隐私设置,但是本公开设想了以任何合适的方式使用任何合适的隐私设置。
在特定实施例中,隐私设置可以基于社交图700的一个或更多个节点或边。可以为社交图700的一条或更多条边706或边类型、或者关于社交图700的一个或更多个节点702、704或节点类型,指定隐私设置。应用于关连两个节点的特定边706的隐私设置可以控制对应于这两个节点的两个实体之间的关系对于在线社交网络的其他用户是否可见。类似地,应用于特定节点的隐私设置可以控制对应于该节点的用户或概念对于在线社交网络的其他用户是否可见。作为示例而不是作为限制,第一用户可以向社交网络系统160共享对象。该对象可以与通过边706关连到第一用户的用户节点702的概念节点704相关联。第一用户可以指定应用于关连到对象的概念节点704的特定边706的隐私设置,或者可以指定应用于关连到概念节点704的所有边706的隐私设置。作为另一个示例而不是作为限制,第一用户可以共享特定对象类型的对象集合(例如,图像集合)。第一用户可以针对与第一用户相关联的该特定对象类型的所有对象将隐私设置指定为具有特定的隐私设置(例如,指定由第一用户发布的所有图像仅对第一用户的朋友和/或在图像中标记的用户可见)。
在特定实施例中,社交网络系统160可以向第一用户呈现“隐私向导(privacywizard)”(例如,在网页、模块、一个或更多个对话框或任何其他合适的界面内),以帮助第一用户指定一个或更多个隐私设置。隐私向导可以显示指令、合适的隐私相关信息、当前隐私设置、用于接受来自第一用户的一个或更多个输入(其指定隐私设置的改变或确认)的一个或更多个输入字段、或其任何合适的组合。在特定实施例中,社交网络系统160可以向第一用户提供“仪表板(dashboard)”功能,该功能可以向第一用户显示第一用户的当前隐私设置。仪表板功能可以在任何适当的时间显示给第一用户(例如,在来自调用仪表板功能的第一用户的输入之后,在特定事件或触发动作发生之后)。仪表板功能可以允许第一用户以任何合适的方式在任何时间修改第一用户的一个或更多个当前隐私设置(例如,将第一用户重定向到隐私向导)。
与对象相关联的隐私设置可以指定允许访问或拒绝访问的任何合适的粒度(granularity)。作为示例而不是作为限制,可以为特定用户(例如,只有我、我的室友、我的老板)、在特定分离度内的用户(例如,朋友、朋友的朋友)、用户团体(例如,游戏俱乐部、我的家人)、用户网络(例如,特定雇主的雇员、特定大学的学生或校友)、所有用户(“公众”)、无用户(“私人的”)、第三方系统170的用户、特定应用(例如,第三方应用、外部网站)、其他合适的实体、或其任何合适的组合来指定访问或拒绝访问。尽管本公开描述了允许访问或拒绝访问的特定粒度,但是本公开考虑了允许访问或拒绝访问的任何合适粒度。
在特定实施例中,一个或更多个服务器162可以是用于实施隐私设置的授权/隐私服务器。响应于来自用户(或其他实体)的对存储在数据储存器164中的特定对象的请求,社交网络系统160可以向数据储存器164发送对该对象的请求。请求可以识别与该请求相关联的用户,并且对象只有在授权服务器基于与该对象相关联的隐私设置确定该用户被授权访问该对象时才可以被发送给该用户(或者该用户的客户端系统130)。如果请求用户未被授权访问该对象,则授权服务器可以阻止所请求的对象从数据储存器164中被检索,或者可以阻止所请求的对象被发送给用户。在搜索-查询上下文中,只有当查询用户被授权访问对象时,例如,如果对象的隐私设置允许其被显露给查询用户、被查询用户发现或以其他方式对查询用户可见,才可以提供对象作为搜索结果。在特定实施例中,对象可以表示通过用户的动态消息对用户可见的内容。作为示例而不是作为限制,一个或更多个对象对于用户的“热门话题(Trending)”页面可以是可见的。在特定实施例中,对象可以对应于特定用户。对象可以是与特定用户相关联的内容,或者可以是特定用户的账户或存储在社交网络系统160或其他计算系统上的信息。作为示例而不是作为限制,第一用户可以通过在线社交网络的“你可能认识的人(People You May Know)”功能或者通过查看第一用户的朋友列表来查看在线社交网络的一个或更多个第二用户。作为示例而不是作为限制,第一用户可以指定他们不希望在他们的动态消息或朋友列表中看到与特定第二用户相关联的对象。如果对象的隐私设置不允许其被显露给用户、被用户发现或对用户可见,则该对象可以从搜索结果中排除。尽管本公开描述了以特定方式实施隐私设置,但是本公开设想了以任何合适的方式实施隐私设置。
在特定实施例中,与用户相关联的相同类型的不同对象可以具有不同的隐私设置。与用户相关联的不同类型的对象可以具有不同类型的隐私设置。作为示例而不是作为限制,第一用户可以指定第一用户的状态更新是公开的,但是第一用户共享的任何图像仅对在线社交网络上第一用户的朋友可见。作为另一个示例而不是作为限制,用户可以为不同类型的实体(如个人用户、朋友的朋友、关注者、用户团体或公司实体)指定不同的隐私设置。作为另一个示例而不是作为限制,第一用户可以指定可以查看由第一用户发布的视频的一组用户,同时防止视频对第一用户的雇主可见。在特定实施例中,可以为不同的用户组或用户人口统计提供不同的隐私设置。作为示例而不是作为限制,第一用户可以指定与第一用户在同一所大学上学的其他用户可以查看第一用户的照片,但是作为第一用户的家庭成员的其他用户不能查看那些相同的照片。
在特定实施例中,社交网络系统160可以为特定对象类型的每个对象提供一个或更多个默认隐私设置。被设置为默认的对象的隐私设置可以由与该对象相关联的用户来改变。作为示例而不是作为限制,由第一用户发布的所有图像可以具有默认隐私设置,即仅对于第一用户的朋友可见,并且对于特定图像,第一用户可以改变图像的隐私设置,以对于朋友和朋友的朋友可见。
在特定实施例中,隐私设置可以允许第一用户指定(例如,通过选择退出,通过不选择加入)社交网络系统160或助理系统140是否可以出于任何目的接收、收集、记录或存储与用户相关联的特定对象或信息。在特定实施例中,隐私设置可以允许第一用户指定特定应用或进程是否可以访问、存储或使用与用户相关联的特定对象或信息。隐私设置可以允许第一用户选择加入或选择退出使对象或信息被特定应用或进程访问、存储或使用。社交网络系统160或助理系统140可以访问这样的信息,以便向第一用户提供特定的功能或服务,而社交网络系统160或助理系统140不能出于任何其他目的访问该信息。在访问、存储或使用这样的对象或信息之前,社交网络系统160或助理系统140可以提示用户提供隐私设置,该隐私设置指定哪些应用或进程(如果有的话)可以在允许任何这样的动作之前访问、存储或使用对象或信息。作为示例而不是作为限制,第一用户可以经由与在线社交网络相关的应用(例如,消息传递app)向第二用户传输消息,并且可以指定社交网络系统160或助理系统140不应该存储这种消息的隐私设置。
在特定实施例中,用户可以指定社交网络系统160或助理系统140是否可以访问、存储或使用与第一用户相关联的特定类型的对象或信息。作为示例而不是作为限制,第一用户可以指定由第一用户通过社交网络系统160或助理系统140发送的图像不可以被社交网络系统160或助理系统140存储。作为另一个示例而不是作为限制,第一用户可以指定从第一用户发送给特定第二用户的消息不可以被社交网络系统160或助理系统140存储。作为又一个示例而不是作为限制,第一用户可以指定经由特定应用发送的所有对象可以被社交网络系统160或助理系统140保存。
在特定实施例中,隐私设置可以允许第一用户指定是否可以从特定客户端系统130或第三方系统170访问与第一用户相关联的特定对象或信息。隐私设置可以允许第一用户选择加入或选择退出从特定设备(例如,用户智能电话上的电话簿)、从特定应用(例如,消息传递app)或从特定系统(例如,电子邮件服务器)访问对象或信息。社交网络系统160或助理系统140可以提供关于每个设备、系统或应用的默认隐私设置,和/或可以提示第一用户为每个上下文指定特定的隐私设置。作为示例而不是作为限制,第一用户可以利用社交网络系统160或助理系统140的位置服务特征来提供用户附近的餐馆或其他地方的推荐。第一用户的默认隐私设置可以指定社交网络系统160或助理系统140可以使用从第一用户的客户端设备130提供的位置信息来提供基于位置的服务,但是社交网络系统160或助理系统140不可以存储第一用户的位置信息或将其提供给任何第三方系统170。第一用户然后可以更新隐私设置,以允许第三方图像共享应用使用位置信息来对照片进行地理标记。
基于位置的隐私设置
在特定实施例中,隐私设置可以允许用户指定可以从其访问对象的一个或更多个地理位置。对象的访问或拒绝访问可以取决于试图访问对象的用户的地理位置。作为示例而不是作为限制,用户可以共享对象并指定只有同一城市的用户可以访问或查看该对象。作为另一个示例而不是作为限制,第一用户可以共享对象,并且指定该对象仅在第一用户处于特定位置时对第二用户可见。如果第一用户离开特定位置,对象不可以再对第二用户可见。作为另一个示例而不是作为限制,第一用户可以指定对象仅对在距离第一用户的阈值距离内的第二用户可见。如果第一用户随后改变了位置,则可以访问该对象的原始第二用户可能失去访问权,而新的第二用户组可以在他们进入第一用户的阈值距离内时获得访问权。
关于用户认证和体验个性化信息的隐私设置
在特定实施例中,社交网络系统160或助理系统140可具有可将用户的个人或生物信息用作输入以用于用户认证或体验个性化目的的功能。用户可以选择利用这些功能来增强他们在在线社交网络上的体验。作为示例而不是作为限制,用户可以向社交网络系统160或助理系统140提供个人或生物信息。用户的隐私设置可以指定这样的信息仅可用于特定的进程(如认证),并且还指定这样的信息不能与任何第三方系统170共享,或者不能用于与社交网络系统160或助理系统140相关联的其他进程或应用。作为另一个示例而不是作为限制,社交网络系统160可以为用户提供向在线社交网络提供声纹记录的功能。作为示例而不是作为限制,如果用户希望利用在线社交网络的这一功能,则用户可以提供他或她自己声音的声音记录,以提供在线社交网络上的状态更新。声音输入的记录可以与用户的声纹进行比较,以确定用户说了什么词语。用户的隐私设置可以指定这种声音记录可以仅用于声音输入目的(例如,认证用户、发送声音消息、改进声音识别以便使用在线社交网络的声音操作特征),并且还指定这种声音记录不可以与任何第三方系统170共享,或者不可以被与社交网络系统160相关联的其他进程或应用使用。作为另一个示例而不是作为限制,社交网络系统160可以为用户提供向在线社交网络提供参考图像(例如,面部轮廓、视网膜扫描)的功能。在线社交网络可以将参考图像与稍后接收的图像输入进行比较(例如,用于认证用户,在照片中标记用户)。用户的隐私设置可以指定这种声音记录仅可用于有限的目的(例如,认证、在照片中标记用户),并且还指定这种声音记录不能与任何第三方系统170共享,或者不能被与社交网络系统160相关联的其他进程或应用使用。
系统和方法
图10示出了示例计算机系统1000。在特定实施例中,一个或更多个计算机系统1000执行本文描述或示出的一个或更多个方法的一个或更多个步骤。在特定实施例中,一个或更多个计算机系统1000提供本文描述或示出的功能。在特定实施例中,在一个或更多个计算机系统1000上运行的软件执行本文描述或示出的一个或更多个方法的一个或更多个步骤,或者提供本文描述或示出的功能。特定实施例包括一个或更多个计算机系统1000的一个或更多个部分。在本文,在适当的情况下,对计算机系统的引用可以包括计算设备,反之亦然。此外,在适当的情况下,对计算机系统的引用可以包括一个或更多个计算机系统。
本公开设想了任何合适数量的计算机系统1000。本公开设想了采取任何合适的物理形式的计算机系统1000。作为示例而不是作为限制,计算机系统1000可以是嵌入式计算机系统、片上系统(SOC)、单板计算机系统(SBC)(诸如例如,模块上计算机(COM)或模块上系统(SOM))、台式计算机系统、膝上型或笔记本计算机系统、交互式信息亭、大型机、计算机系统网状网、移动电话、个人数字助理(PDA)、服务器、平板计算机系统、或者这些中的两个或更多个的组合。在适当的情况下,计算机系统1000可以包括一个或更多个计算机系统1000;可以是整体式的或分布式的;跨越多个位置;跨越多台机器;跨越多个数据中心;或者驻留在云中,云可以包括在一个或更多个网络中的一个或更多个云部件。在适当的情况下,一个或更多个计算机系统1000可以在没有实质性空间或时间限制的情况下执行本文描述或示出的一个或更多个方法的一个或更多个步骤。作为示例而不是作为限制,一个或更多个计算机系统1000可以实时地或以批处理模式来执行本文描述或示出的一个或更多个方法的一个或更多个步骤。在适当的情况下,一个或更多个计算机系统1000可以在不同的时间或在不同的位置处执行本文描述或示出的一个或更多个方法的一个或更多个步骤。
在特定实施例中,计算机系统1000包括处理器1002、存储器1004、存储装置1006、输入/输出(I/O)接口1008、通信接口1010和总线1012。尽管本公开描述并示出了具有在特定布置中的特定数量的特定部件的特定计算机系统,但是本公开设想了具有在任何合适布置中的任何合适数量的任何合适部件的任何合适的计算机系统。
在特定实施例中,处理器1002包括用于执行指令(例如构成计算机程序的那些指令)的硬件。作为示例而不是作为限制,为了执行指令,处理器1002可以从内部寄存器、内部高速缓存、存储器1004或存储装置1006中检索(或取回)指令;将这些指令解码并执行它们;以及然后将一个或更多个结果写到内部寄存器、内部高速缓存、存储器1004或存储装置1006。在特定实施例中,处理器1002可以包括用于数据、指令或地址的一个或更多个内部高速缓存。在适当的情况下,本公开设想了包括任何合适数量的任何合适的内部高速缓存的处理器1002。作为示例而不是作为限制,处理器1002可以包括一个或更多个指令高速缓存、一个或更多个数据高速缓存、以及一个或更多个转译后备缓冲区(TLB)。在指令高速缓存中的指令可以是在存储器1004或存储装置1006中的指令的副本,并且指令高速缓存可以加速处理器1002对那些指令的检索。在数据高速缓存中的数据可以是:在存储器1004或存储装置1006中的数据的副本,用于供在处理器1002处执行的指令操作;在处理器1002处执行的先前指令的结果,用于由在处理器1002处执行的后续指令访问或者用于写到存储器1004或存储装置1006;或其他合适的数据。数据高速缓存可以加速由处理器1002进行的读或写操作。TLB可以加速关于处理器1002的虚拟地址转译。在特定实施例中,处理器1002可以包括用于数据、指令或地址的一个或更多个内部寄存器。在适当的情况下,本公开设想了包括任何合适数量的任何合适的内部寄存器的处理器1002。在适当的情况下,处理器1002可以包括一个或更多个算术逻辑单元(ALU);可以是多核处理器;或者包括一个或更多个处理器1002。尽管本公开描述并示出了特定的处理器,但是本公开设想了任何合适的处理器。
在特定实施例中,存储器1004包括主存储器,其用于存储供处理器1002执行的指令或供处理器1002操作的数据。作为示例而不是作为限制,计算机系统1000可以将指令从存储装置1006或另一个源(诸如例如,另一个计算机系统1000)加载到存储器1004。处理器1002然后可以将指令从存储器1004加载到内部寄存器或内部高速缓存。为了执行指令,处理器1002可以从内部寄存器或内部高速缓存中检索指令并将它们解码。在指令的执行期间或之后,处理器1002可以将一个或更多个结果(其可以是中间结果或最终结果)写到内部寄存器或内部高速缓存。处理器1002然后可以将这些结果中的一个或更多个写到存储器1004。在特定实施例中,处理器1002仅执行在一个或更多个内部寄存器或内部高速缓存中或在存储器1004(而不是存储装置1006或其他地方)中的指令,并且仅对在一个或更多个内部寄存器或内部高速缓存中或在存储器1004(而不是存储装置1006或其他地方)中的数据进行操作。一个或更多个存储器总线(其可以各自包括地址总线和数据总线)可以将处理器1002耦合到存储器1004。如下所述,总线1012可以包括一个或更多个存储器总线。在特定实施例中,一个或更多个存储器管理单元(MMU)驻留在处理器1002和存储器1004之间,并且便于由处理器1002请求的对存储器1004的访问。在特定实施例中,存储器1004包括随机存取存储器(RAM)。在适当的情况下,该RAM可以是易失性存储器。在适当的情况下,该RAM可以是动态RAM(DRAM)或静态RAM(SRAM)。此外,在适当的情况下,该RAM可以是单端口RAM或多端口RAM。本公开设想了任何合适的RAM。在适当的情况下,存储器1004可以包括一个或更多个存储器1004。尽管本公开描述并示出了特定的存储器,但是本公开设想了任何合适的存储器。
在特定实施例中,存储装置1006包括用于数据或指令的大容量存储装置。作为示例而不是作为限制,存储装置1006可以包括硬盘驱动器(HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(USB)驱动器、或这些中的两个或更多个的组合。在适当的情况下,存储装置1006可以包括可移动或不可移动(或固定)介质。在适当的情况下,存储装置1006可以在计算机系统1000的内部或外部。在特定实施例中,存储装置1006是非易失性固态存储器。在特定实施例中,存储装置1006包括只读存储器(ROM)。在适当的情况下,该ROM可以是掩模编程ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可变ROM(EAROM)、或闪存、或这些中的两个或更多个的组合。本公开设想了采用任何合适的物理形式的大容量存储装置1006。在适当的情况下,存储装置1006可以包括便于在处理器1002和存储装置1006之间的通信的一个或更多个存储装置控制单元。在适当的情况下,存储装置1006可以包括一个或更多个存储装置1006。尽管本公开描述并示出了特定的存储装置,但是本公开设想了任何合适的存储装置。
在特定实施例中,I/O接口1008包括为在计算机系统1000和一个或更多个I/O设备之间的通信提供一个或更多个接口的硬件、软件或两者。在适当的情况下,计算机系统1000可以包括这些I/O设备中的一个或更多个。这些I/O设备中的一个或更多个可以实现在人和计算机系统1000之间的通信。作为示例而不是作为限制,I/O设备可以包括键盘、小键盘、麦克风、监视器、鼠标、打印机、扫描仪、扬声器、静态摄像机、触笔、平板计算机、触摸屏、跟踪球、视频摄像机、另一个合适的I/O设备、或这些中的两个或更多个的组合。I/O设备可以包括一个或更多个传感器。本公开设想了任何合适的I/O设备以及用于它们的任何合适的I/O接口1008。在适当的情况下,I/O接口1008可以包括使处理器1002能够驱动这些I/O设备中的一个或更多个的一个或更多个设备或软件驱动器。在适当的情况下,I/O接口1008可以包括一个或更多个I/O接口1008。尽管本公开描述并示出了特定的I/O接口,但是本公开设想了任何合适的I/O接口。
在特定实施例中,通信接口1010包括提供用于在计算机系统1000和一个或更多个其他计算机系统1000或一个或更多个网络之间的通信(例如,基于包(packet-based)的通信)的一个或更多个接口的硬件、软件或两者。作为示例而不是作为限制,通信接口1010可以包括用于与以太网或其他基于有线的网络进行通信的网络接口控制器(NIC)或网络适配器,或者用于与无线网络(例如WI-FI网络)进行通信的无线NIC(WNIC)或无线适配器。本公开设想了任何合适的网络和用于它的任何合适的通信接口1010。作为示例而不是作为限制,计算机系统1000可以与自组织网络、个域网(PAN)、局域网(LAN)、广域网(WAN)、城域网(MAN)或互联网的一个或更多个部分、或这些中的两个或更多个的组合进行通信。这些网络中的一个或更多个的一个或更多个部分可以是有线的或无线的。作为示例,计算机系统1000可以与无线PAN(WPAN)(诸如,例如,蓝牙WPAN)、WI-FI网络、WI-MAX网络、蜂窝电话网络(诸如,例如,全球移动通信系统(GSM)网络)、或其他合适的无线网络、或这些中的两个或更多个的组合进行通信。在适当的情况下,计算机系统1000可以包括用于这些网络中的任一个的任何合适的通信接口1010。在适当的情况下,通信接口1010可以包括一个或更多个通信接口1010。尽管本公开描述并示出了特定的通信接口,但是本公开设想了任何合适的通信接口。
在特定实施例中,总线1012包括将计算机系统1000的部件耦合到彼此的硬件、软件或两者。作为示例而不是作为限制,总线1012可以包括加速图形端口(AGP)或其他图形总线、扩展工业标准体系结构(EISA)总线、前端总线(FSB)、HYPERTRANSPORT(HT)互连、工业标准体系结构(ISA)总线、INFINIBAND互连、低引脚数(LPC)总线、存储器总线,微通道体系结构(MCA)总线、外围部件互连(PCI)总线、PCI-Express(PCIe)总线、串行高级技术附件(SATA)总线、视频电子标准协会本地(VLB)总线、或任何其他合适的总线、或这些中的两个或更多个的组合。在适当的情况下,总线1012可以包括一个或更多个总线1012。尽管本公开描述并示出了特定总线,但是本公开设想了任何合适的总线或互连。
在本文,在适当的情况下,一个或更多个计算机可读非暂时性存储介质可以包括一个或更多个基于半导体的或其他集成电路(IC)(诸如例如,现场可编程门阵列(FPGA)或专用IC(ASIC))、硬盘驱动器(HDD)、混合硬盘驱动器(HHD)、光盘、光盘驱动器(ODD)、磁光盘、磁光盘驱动器、软盘、软盘驱动器(FDD)、磁带、固态驱动器(SSD)、RAM驱动器、安全数字(SECURE DIGITAL)卡或驱动器、任何其他合适的计算机可读非暂时性存储介质、或这些中的两个或更多个的任何合适组合。在适当的情况下,计算机可读非暂时性存储介质可以是易失性的、非易失性的或者易失性和非易失性的组合。
其他杂项
本文中,除非另有明确指示或通过上下文另有指示,否则“或”是包括性的而非排他性的。因此在本文,除非另有明确指示或通过上下文另有指示,否则“A或B”意指“A、B或两者”。此外,除非另有明确指示或通过上下文另有指示,否则“和”既是联合的又是各自的。因此在本文,除非另有明确指示或通过上下文另有指示,否则“A和B”意指“A和B,联合地或各自地”。
本公开的范围包括本领域中的普通技术人员将理解的对本文描述或示出的示例实施例的所有改变、替换、变化、变更和修改。本公开的范围不限于本文描述或示出的示例实施例。此外,尽管本公开将本文的相应实施例描述并示为包括特定的部件、元件、特征、功能、操作或步骤,但是这些实施例中的任何一个可以包括本领域中的普通技术人员将理解的在本文任何地方描述或示出的任何部件、元件、特征、功能、操作或步骤的任何组合或置换。此外,在所附权利要求中对适合于、被布置成、能够、被配置成、实现来、可操作来、或操作来执行特定功能的装置或系统或装置或系统的部件的引用包括该装置、系统、部件,无论它或那个特定功能是否被激活、开启或解锁,只要该装置、系统或部件是这样被调整、被布置、使能够、被配置、被实现、可操作的、或操作的。此外,尽管本公开将特定实施例描述或示为提供特定优点,但是特定实施例可以提供这些优点中的一些、全部或不提供这些优点。
Claims (33)
1.一种方法,包括由一个或更多个计算系统:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中所述用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于所述视觉模态,来识别与所述用户输入相关联的一个或更多个主体;
基于所述一个或更多个机器学习模型,分别确定与所述一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于所述一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与所述第一用户相关联的客户端系统发送用于响应于所述用户输入来呈现通信内容的指令,其中所述通信内容包括与所执行的一个或更多个任务相关联的信息。
2.根据权利要求1所述的方法,其中所述用户输入包括以下中的一个或更多个:
字符串;
音频剪辑;
图像;或者
视频剪辑。
3.根据权利要求1所述的方法,其中与所述用户输入相关联的一个或更多个主体包括人、地点、企业或对象中的一个或更多个。
4.根据权利要求3所述的方法,其中识别所述一个或更多个人基于面部识别。
5.根据权利要求3所述的方法,其中识别所述一个或更多个对象基于对象检测。
6.根据权利要求1所述的方法,还包括基于所述视觉模态为所述用户输入生成特征表示。
7.根据权利要求1所述的方法,其中所述一个或更多个机器学习模型包括以下中的一个或更多个:
支持向量机;
回归模型;或者
卷积神经网络。
8.根据权利要求1所述的方法,还包括基于所述用户输入来识别一个或更多个意图和一个或更多个槽。
9.根据权利要求8所述的方法,其中,基于所识别的意图和槽来执行与所述一个或更多个解析的实体相关联的一个或更多个任务。
10.根据权利要求1所述的方法,其中,所述通信内容包括以下中的一个或更多个:
字符串;
音频剪辑;
图像;或者
视频剪辑。
11.根据权利要求1所述的方法,还包括确定所述通信内容的一个或更多个模态。
12.根据权利要求11所述的方法,其中确定所述通信内容的一个或更多个模态包括:
识别与所述第一用户相关联的上下文信息;
识别与所述客户端系统相关联的上下文信息;和
基于与所述第一用户相关联的上下文信息和与所述客户端系统相关联的上下文信息来确定所述一个或更多个模态。
13.根据权利要求1所述的方法,还包括:
基于所述用户输入的视觉模态来生成多个任务;和
从与所述第一用户相关联的客户端系统接收所述第一用户对来自所述多个任务中的一个或更多个任务的用户选择。
14.根据权利要求1所述的方法,还包括在对话状态中存储所识别的一个或更多个主体。
15.根据权利要求1所述的方法,其中所述用户输入包括用户与媒体内容对象的交互。
16.一个或更多个计算机可读非暂时性存储介质,其体现软件,所述软件在被执行时可操作来:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中所述用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于所述视觉模态,来识别与所述用户输入相关联的一个或更多个主体;
基于所述一个或更多个机器学习模型,分别确定与所述一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于所述一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与所述第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令,其中所述通信内容包括与所执行的一个或更多个任务相关联的信息。
17.一种系统,包括:一个或更多个处理器;以及耦合到所述处理器的非暂时性存储器,所述非暂时性存储器包括所述处理器能够执行的指令,所述处理器在执行所述指令时可操作来:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中所述用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于所述视觉模态,来识别与所述用户输入相关联的一个或更多个主体;
基于所述一个或更多个机器学习模型,分别确定与所述一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于所述一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与所述第一用户相关联的客户端系统发送用于响应于用户输入来呈现通信内容的指令,其中所述通信内容包括与所执行的一个或更多个任务相关联的信息。
18.一种方法,特别地在助理系统中使用的方法,用于通过使用户能够在会话中利用用户输入与所述助理系统交互以获取帮助,来帮助用户获得信息或服务,其中所述用户输入包括声音、文本、图像或视频或它们的任意组合,所述助理系统特别地通过计算设备、应用编程接口(API)以及用户设备上应用激增的组合来实现,所述方法包括,通过一个或更多个计算系统:
从与第一用户相关联的客户端系统接收基于一个或更多个模态的用户输入,其中所述用户输入的模态中的至少一个模态是视觉模态;
基于一个或更多个机器学习模型、基于所述视觉模态,来识别与所述用户输入相关联的一个或更多个主体;
基于所述一个或更多个机器学习模型,分别确定与所述一个或更多个主体相关联的一个或更多个属性;
基于所确定的一个或更多个属性,解析对应于所述一个或更多个主体的一个或更多个实体;
执行与一个或更多个解析的实体相关联的一个或更多个任务;和
向与所述第一用户相关联的客户端系统发送用于响应于所述用户输入来呈现通信内容的指令,其中所述通信内容包括与所执行的一个或更多个任务相关联的信息。
19.根据权利要求18所述的方法,其中所述用户输入包括以下中的一个或更多个:
字符串;
音频剪辑;
图像;或者
视频剪辑。
20.根据权利要求18或19所述的方法,其中,与所述用户输入相关联的一个或更多个主体包括人、地点、企业或对象中的一个或更多个;
可选地,其中识别所述一个或更多个人基于面部识别;和/或
可选地,其中识别所述一个或更多个主体基于对象检测。
21.根据权利要求18至20中任一项所述的方法,还包括基于所述视觉模态为所述用户输入生成特征表示。
22.根据权利要求18至21中任一项所述的方法,其中所述一个或更多个机器学习模型包括以下中的一个或更多个:
支持向量机;
回归模型;或者
卷积神经网络。
23.根据权利要求18至22中任一项所述的方法,还包括基于所述用户输入来识别一个或更多个意图和一个或更多个槽;
可选地,其中基于所识别的意图和槽来执行与所述一个或更多个解析的实体相关联的一个或更多个任务。
24.根据权利要求18至23中任一项所述的方法,其中,所述通信内容包括以下中的一个或更多个:
字符串;
音频剪辑;
图像;或者
视频剪辑。
25.根据权利要求18至24中任一项所述的方法,还包括确定所述通信内容的一个或更多个模态;
可选地,其中确定所述通信内容的一个或更多个模态包括:
识别与所述第一用户相关联的上下文信息;
识别与所述客户端系统相关联的上下文信息;和
基于与所述第一用户相关联的上下文信息和与所述客户端系统相关联的上下文信息来确定所述一个或更多个模态。
26.根据权利要求18至25中任一项所述的方法,还包括:
基于所述用户输入的视觉模态来生成多个任务;和
从与所述第一用户相关联的客户端系统接收所述第一用户对来自所述多个任务中的一个或更多个任务的用户选择。
27.根据权利要求18至26中任一项所述的方法,还包括在对话状态中存储所识别的一个或更多个主体;和/或
其中所述用户输入包括用户与媒体内容对象的交互。
28.一个或更多个计算机可读非暂时性存储介质,其体现软件,所述软件在被执行时可操作来执行根据权利要求18至27中任一项的方法。
29.一种助理系统,其用于通过使用户能够在会话中利用用户输入与所述助理系统交互以获取帮助,来帮助用户获得信息或服务,其中所述用户输入包括声音、文本、图像或视频或它们的任意组合,所述助理系统特别地通过计算设备、应用编程接口(API)以及用户设备上应用激增的组合来实现,所述系统包括:一个或更多个处理器;以及耦合到所述处理器的非暂时性存储器,所述非暂时性存储器包括所述处理器能够执行的指令,所述处理器在执行所述指令时可操作来执行根据权利要求18至27中任一项的方法。
30.根据权利要求29所述的助理系统,用于通过执行以下特征或步骤中的至少一个或更多个来帮助用户:
-创建并存储包括与用户相关联的个人信息和上下文信息的用户简档
-使用自然语言理解来分析所述用户输入,其中所述分析能够基于所述用户简档,以获得更个性化和上下文感知的理解
-基于所述分析来解析与所述用户输入相关联的实体
-与不同的代理交互,以获得与解析的实体相关联的信息或服务
-通过使用自然语言生成来为用户生成关于所述信息或服务的响应
-通过与用户的交互,使用对话管理技术来管理和转发与用户的会话流
-通过汇总信息,帮助用户有效地且高效地消化所获得的信息
-通过提供帮助用户与在线社交网络交互(例如,创建帖子、评论、消息)的工具,来帮助用户更好地参与所述在线社交网络
-帮助用户管理不同的任务,如持续跟踪事件
-在与用户相关的时间,而没有用户输入的情况下,基于所述用户简档主动执行与用户兴趣和偏好相关的预授权任务
-每当有必要确保访问用户简档和执行不同的任务都遵守用户的隐私设置时就检查隐私设置。
31.根据权利要求29或30所述的助理系统,包括以下部件中的至少一个或更多个:
-消息传递平台,其用于从与用户相关联的客户端系统接收基于文本模态的用户输入,和/或用于接收基于图像或视频模态的用户输入,并在所述消息传递平台内使用光学字符识别技术对基于图像或视频模态的该用户输入进行处理,以将该用户输入转换成文本,
-音频语音识别(ASR)模块,其用于从与用户相关联的所述客户端系统接收基于音频模态的用户输入(例如,用户能够说话或者发送包括语音的视频),并将基于所述音频模态的该用户输入转换成文本,
-助理xbot,其用于接收所述消息传递平台或所述ASR模块的输出。
32.一种系统,包括:
至少一个客户端系统(130),特别是电子设备,
根据权利要求29至31中任一项的至少一个助理系统(140),
所述客户端系统和所述助理系统特别地通过网络(110)彼此连接,
其中所述客户端系统包括用于允许所述客户端系统(130)处的用户与所述助理系统(140)交互的助理应用(136),
其中所述助理应用(136)将用户输入传送给所述助理系统(140),并且基于所述用户输入,所述助理系统(140)生成响应并将生成的响应发送给所述助理应用(136),并且所述助理应用(136)向所述客户端系统(130)处的用户呈现所述响应,
其中特别地,所述用户输入是音频或口头的,并且所述响应能够是文本的或者也能够是音频或口头的。
33.根据权利要求32所述的系统,还包括社交网络系统(160),
其中所述客户端系统特别地包括用于访问所述社交网络系统(160)的社交网络应用(134)。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862660876P | 2018-04-20 | 2018-04-20 | |
US62/660,876 | 2018-04-20 | ||
US16/053,600 | 2018-08-02 | ||
US16/053,600 US10936346B2 (en) | 2018-04-20 | 2018-08-02 | Processing multimodal user input for assistant systems |
PCT/US2018/045177 WO2019203872A1 (en) | 2018-04-20 | 2018-08-03 | Processing multimodal user input for assistant systems |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112292674A true CN112292674A (zh) | 2021-01-29 |
CN112292674B CN112292674B (zh) | 2024-10-01 |
Family
ID=68235956
Family Applications (10)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880094677.2A Pending CN112313740A (zh) | 2018-04-20 | 2018-05-17 | 聚合语义信息以提高对用户的理解 |
CN201880094305.XA Active CN112236766B (zh) | 2018-04-20 | 2018-05-25 | 用于帮助用户获得信息或服务的系统和方法 |
CN201880094857.0A Pending CN112313656A (zh) | 2018-04-20 | 2018-06-20 | 帮助用户在社交关连之间进行高效的信息共享 |
CN201880094771.8A Active CN112313644B (zh) | 2018-04-20 | 2018-06-25 | 基于会话数据构建定制的用户简档 |
CN201880094827.XA Active CN112513838B (zh) | 2018-04-20 | 2018-07-19 | 为用户生成个性化内容汇总 |
CN201880094828.4A Active CN112292674B (zh) | 2018-04-20 | 2018-08-03 | 为助理系统处理多模态用户输入 |
CN201880094714.XA Pending CN112313642A (zh) | 2018-04-20 | 2018-09-05 | 助理系统进行的用于代理匹配的意图识别 |
CN201880094832.0A Pending CN112470144A (zh) | 2018-04-20 | 2018-10-04 | 用于助理系统的上下文自动完成 |
CN201980040760.6A Pending CN112334889A (zh) | 2018-04-20 | 2019-04-18 | 用于用户与助理系统交互的个性化手势识别 |
CN201980040312.6A Pending CN112313680A (zh) | 2018-04-20 | 2019-04-19 | 助理系统中手势输入的自动完成 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880094677.2A Pending CN112313740A (zh) | 2018-04-20 | 2018-05-17 | 聚合语义信息以提高对用户的理解 |
CN201880094305.XA Active CN112236766B (zh) | 2018-04-20 | 2018-05-25 | 用于帮助用户获得信息或服务的系统和方法 |
CN201880094857.0A Pending CN112313656A (zh) | 2018-04-20 | 2018-06-20 | 帮助用户在社交关连之间进行高效的信息共享 |
CN201880094771.8A Active CN112313644B (zh) | 2018-04-20 | 2018-06-25 | 基于会话数据构建定制的用户简档 |
CN201880094827.XA Active CN112513838B (zh) | 2018-04-20 | 2018-07-19 | 为用户生成个性化内容汇总 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880094714.XA Pending CN112313642A (zh) | 2018-04-20 | 2018-09-05 | 助理系统进行的用于代理匹配的意图识别 |
CN201880094832.0A Pending CN112470144A (zh) | 2018-04-20 | 2018-10-04 | 用于助理系统的上下文自动完成 |
CN201980040760.6A Pending CN112334889A (zh) | 2018-04-20 | 2019-04-18 | 用于用户与助理系统交互的个性化手势识别 |
CN201980040312.6A Pending CN112313680A (zh) | 2018-04-20 | 2019-04-19 | 助理系统中手势输入的自动完成 |
Country Status (5)
Country | Link |
---|---|
US (51) | US10782986B2 (zh) |
EP (3) | EP3782090A4 (zh) |
JP (1) | JP7324772B2 (zh) |
CN (10) | CN112313740A (zh) |
WO (10) | WO2019203863A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486237A (zh) * | 2021-06-07 | 2021-10-08 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统、存储介质和电子设备 |
CN113744731A (zh) * | 2021-08-10 | 2021-12-03 | 浙江大学 | 多模态语音识别方法、系统及计算机可读存储介质 |
CN115291917A (zh) * | 2022-09-29 | 2022-11-04 | 天津大学 | 一种针对app中色彩普适性问题的修复方法 |
Families Citing this family (430)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
JP6753707B2 (ja) * | 2016-06-16 | 2020-09-09 | 株式会社オルツ | コミュニケーションを支援する人工知能システム |
EP3267291B1 (en) * | 2016-07-07 | 2019-11-06 | David Franklin | Gesture-based user interface |
US10339925B1 (en) * | 2016-09-26 | 2019-07-02 | Amazon Technologies, Inc. | Generation of automated message responses |
CN113535382A (zh) * | 2016-12-23 | 2021-10-22 | 创新先进技术有限公司 | 资源处理方法及装置 |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10951558B2 (en) | 2017-09-27 | 2021-03-16 | Slack Technologies, Inc. | Validating application dialog associated with a triggering event identification within user interaction data received via a group-based communication interface |
US11562243B2 (en) * | 2017-11-17 | 2023-01-24 | Meta Platforms, Inc. | Machine-learning models based on non-local neural networks |
US11853975B1 (en) * | 2017-12-12 | 2023-12-26 | Amazon Technologies, Inc. | Contextual parsing of meeting information |
US11273836B2 (en) | 2017-12-18 | 2022-03-15 | Plusai, Inc. | Method and system for human-like driving lane planning in autonomous driving vehicles |
CN118250315A (zh) | 2018-01-16 | 2024-06-25 | 谷歌有限责任公司 | 提供助理深度链接以实行第三方对话会话转移的系统、方法和装置 |
US10929601B1 (en) * | 2018-03-23 | 2021-02-23 | Amazon Technologies, Inc. | Question answering for a multi-modal system |
US11568863B1 (en) * | 2018-03-23 | 2023-01-31 | Amazon Technologies, Inc. | Skill shortlister for natural language processing |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US10782986B2 (en) | 2018-04-20 | 2020-09-22 | Facebook, Inc. | Assisting users with personalized and contextual communication content |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11113372B2 (en) | 2018-04-25 | 2021-09-07 | Google Llc | Delayed two-factor authentication in a networked environment |
KR102638579B1 (ko) | 2018-04-25 | 2024-02-21 | 구글 엘엘씨 | 네트워크 환경에서 지연된 2-팩터 인증 |
KR102512446B1 (ko) | 2018-05-04 | 2023-03-22 | 구글 엘엘씨 | 자동화된 어시스턴트 기능(들)의 핫-워드 프리 적응 |
CN112236739B (zh) | 2018-05-04 | 2024-05-17 | 谷歌有限责任公司 | 基于检测到的嘴运动和/或凝视的适配自动助理 |
US10890969B2 (en) * | 2018-05-04 | 2021-01-12 | Google Llc | Invoking automated assistant function(s) based on detected gesture and gaze |
US20190340527A1 (en) * | 2018-05-07 | 2019-11-07 | Microsoft Technology Licensing, Llc | Graphical user interface features for updating a conversational bot |
US11169668B2 (en) * | 2018-05-16 | 2021-11-09 | Google Llc | Selecting an input mode for a virtual assistant |
CN108766440B (zh) * | 2018-05-28 | 2020-01-14 | 平安科技(深圳)有限公司 | 说话人分离模型训练方法、两说话人分离方法及相关设备 |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
WO2019236372A1 (en) | 2018-06-03 | 2019-12-12 | Google Llc | Selectively generating expanded responses that guide continuance of a human-to-computer dialog |
US20190384811A1 (en) * | 2018-06-14 | 2019-12-19 | Pubali Sen | System and method for communication exchange feedback |
US10956462B1 (en) * | 2018-06-21 | 2021-03-23 | Amazon Technologies, Inc. | System answering of user inputs |
JP7017478B2 (ja) * | 2018-06-27 | 2022-02-08 | ヤフー株式会社 | 出力装置、出力方法および出力プログラム |
US10885905B2 (en) * | 2018-07-13 | 2021-01-05 | Samsung Electronics Co., Ltd. | Predicting user actions on ubiquitous devices |
US20210382953A1 (en) * | 2018-07-16 | 2021-12-09 | YE Ventures, LLC | Methods and systems for adjusting self-tuning personalization engines in near real-time |
JP7042914B2 (ja) * | 2018-07-25 | 2022-03-28 | 株式会社Nttドコモ | ユーザ装置及び外部装置 |
US11269943B2 (en) * | 2018-07-26 | 2022-03-08 | JANZZ Ltd | Semantic matching system and method |
JP2020034601A (ja) * | 2018-08-27 | 2020-03-05 | 株式会社日立製作所 | 制御システムおよび制御方法 |
EP3759626A4 (en) * | 2018-08-30 | 2021-10-27 | Hewlett-Packard Development Company, L.P. | SIMILARITY ANALYSIS OF SHARED CONTENT |
KR102225984B1 (ko) * | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
WO2020051192A1 (en) * | 2018-09-06 | 2020-03-12 | Google Llc | Dialogue systems |
US11256860B2 (en) * | 2018-09-13 | 2022-02-22 | FinancialForce.com, Inc. | Service provider server-based architecture for server-suggested data |
WO2020053631A1 (en) * | 2018-09-14 | 2020-03-19 | Philippe Laik | Interaction recommendation system |
US20200089773A1 (en) * | 2018-09-14 | 2020-03-19 | International Business Machines Corporation | Implementing dynamic confidence rescaling with modularity in automatic user intent detection systems |
US11061955B2 (en) * | 2018-09-21 | 2021-07-13 | Salesforce.Com, Inc. | Intent classification system |
US11061954B2 (en) * | 2018-09-21 | 2021-07-13 | Salesforce.Com, Inc. | Intent classification system |
KR20200034430A (ko) * | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US10997250B2 (en) * | 2018-09-24 | 2021-05-04 | Salesforce.Com, Inc. | Routing of cases using unstructured input and natural language processing |
US20200097601A1 (en) * | 2018-09-26 | 2020-03-26 | Accenture Global Solutions Limited | Identification of an entity representation in unstructured data |
JP7142315B2 (ja) * | 2018-09-27 | 2022-09-27 | パナソニックIpマネジメント株式会社 | 説明支援装置および説明支援方法 |
US20210350209A1 (en) * | 2018-09-28 | 2021-11-11 | Jin Wang | Intent and context-aware dialogue based virtual assistance |
US11233796B2 (en) * | 2018-09-28 | 2022-01-25 | EMC IP Holding Company LLC | Data-driven attribute selection for user application entitlement analysis |
US10978051B2 (en) * | 2018-09-28 | 2021-04-13 | Capital One Services, Llc | Adversarial learning framework for persona-based dialogue modeling |
EP3794587B1 (en) * | 2018-10-08 | 2024-07-17 | Google LLC | Selective enrollment with an automated assistant |
US11238294B2 (en) * | 2018-10-08 | 2022-02-01 | Google Llc | Enrollment with an automated assistant |
US11347940B2 (en) * | 2018-10-16 | 2022-05-31 | Soco, Inc. | Asynchronous role-playing system for dialog data collection |
US10956455B2 (en) | 2018-10-17 | 2021-03-23 | Clari Inc. | Method for classifying and grouping users based on user activities |
US11893427B2 (en) * | 2018-10-17 | 2024-02-06 | Clari Inc. | Method for determining and notifying users of pending activities on CRM data |
KR102669026B1 (ko) * | 2018-10-26 | 2024-05-27 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11144542B2 (en) * | 2018-11-01 | 2021-10-12 | Visa International Service Association | Natural language processing system |
US11144337B2 (en) * | 2018-11-06 | 2021-10-12 | International Business Machines Corporation | Implementing interface for rapid ground truth binning |
US10878821B2 (en) * | 2018-11-13 | 2020-12-29 | International Business Machines Corporation | Distributed system for conversational agent |
US10769378B2 (en) * | 2018-11-14 | 2020-09-08 | International Business Machines Corporation | Extending system entities for conversational system |
US11240320B2 (en) * | 2018-11-16 | 2022-02-01 | Microsoft Technology Licensing, Llc | System and method for managing notifications of document modifications |
US10997635B2 (en) * | 2018-11-29 | 2021-05-04 | Walmart Apollo, Llc | Method and apparatus for advertisement information error detection and correction |
US10839167B2 (en) | 2018-12-04 | 2020-11-17 | Verizon Patent And Licensing Inc. | Systems and methods for dynamically expanding natural language processing agent capacity |
KR20200067765A (ko) * | 2018-12-04 | 2020-06-12 | 키포인트 테크놀로지스 인디아 프라이비트 리미티드 | 하이퍼-콘텍스추얼 콘텐츠를 실시간으로 서빙하기 위한 시스템 및 방법 |
WO2020117296A1 (en) | 2018-12-07 | 2020-06-11 | Google Llc | Conditionally assigning various automated assistant function(s) to interaction with a peripheral assistant control device |
US20200183928A1 (en) * | 2018-12-11 | 2020-06-11 | DeepAssist Inc. | System and Method for Rule-Based Conversational User Interface |
US11693910B2 (en) * | 2018-12-13 | 2023-07-04 | Microsoft Technology Licensing, Llc | Personalized search result rankings |
US11663405B2 (en) * | 2018-12-13 | 2023-05-30 | Microsoft Technology Licensing, Llc | Machine learning applications for temporally-related events |
US11777874B1 (en) * | 2018-12-14 | 2023-10-03 | Carvana, LLC | Artificial intelligence conversation engine |
CN109815482B (zh) * | 2018-12-17 | 2023-05-23 | 北京百度网讯科技有限公司 | 一种新闻交互的方法、装置、设备和计算机存储介质 |
US10986045B2 (en) * | 2018-12-18 | 2021-04-20 | Sap Se | Integration hub |
US11087091B2 (en) * | 2018-12-27 | 2021-08-10 | Wipro Limited | Method and system for providing contextual responses to user interaction |
US11151993B2 (en) * | 2018-12-28 | 2021-10-19 | Baidu Usa Llc | Activating voice commands of a smart display device based on a vision-based mechanism |
US11133026B2 (en) * | 2019-01-04 | 2021-09-28 | International Business Machines Corporation | Natural language processor for using speech to cognitively detect and analyze deviations from a baseline |
JP6914975B2 (ja) * | 2019-01-07 | 2021-08-04 | 株式会社東芝 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
US12021864B2 (en) * | 2019-01-08 | 2024-06-25 | Fidelity Information Services, Llc. | Systems and methods for contactless authentication using voice recognition |
US12014740B2 (en) | 2019-01-08 | 2024-06-18 | Fidelity Information Services, Llc | Systems and methods for contactless authentication using voice recognition |
US11164562B2 (en) * | 2019-01-10 | 2021-11-02 | International Business Machines Corporation | Entity-level clarification in conversation services |
US11294472B2 (en) * | 2019-01-11 | 2022-04-05 | Microsoft Technology Licensing, Llc | Augmented two-stage hand gesture input |
US12001977B2 (en) * | 2019-01-18 | 2024-06-04 | GalaxE.Solutions, Inc. | Systems and methods for providing an interactive visualization of an enterprise IT environment |
US10817317B2 (en) | 2019-01-24 | 2020-10-27 | Snap Inc. | Interactive informational interface |
US11636401B2 (en) * | 2019-01-25 | 2023-04-25 | Noodle.ai | Artificial intelligence platform |
JP2020119412A (ja) * | 2019-01-28 | 2020-08-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US11379526B2 (en) * | 2019-02-08 | 2022-07-05 | Intuit Inc. | Disambiguation of massive graph databases |
US11113327B2 (en) * | 2019-02-13 | 2021-09-07 | Optum Technology, Inc. | Document indexing, searching, and ranking with semantic intelligence |
US11194796B2 (en) * | 2019-02-14 | 2021-12-07 | Microsoft Technology Licensing, Llc | Intuitive voice search |
CN109902149B (zh) * | 2019-02-21 | 2021-08-13 | 北京百度网讯科技有限公司 | 查询处理方法和装置、计算机可读介质 |
US11368465B2 (en) * | 2019-02-21 | 2022-06-21 | AVAST Software s.r.o. | Distributed entity counting with inherent privacy features |
US11741951B2 (en) * | 2019-02-22 | 2023-08-29 | Lenovo (Singapore) Pte. Ltd. | Context enabled voice commands |
CN109992248B (zh) * | 2019-02-25 | 2022-07-29 | 阿波罗智联(北京)科技有限公司 | 语音应用的实现方法、装置、设备及计算机可读存储介质 |
JP7240596B2 (ja) * | 2019-02-26 | 2023-03-16 | 京セラドキュメントソリューションズ株式会社 | 会話分析装置および会話分析システム |
US11157702B2 (en) * | 2019-03-06 | 2021-10-26 | International Business Machines Corporation | Utilizing varying coordinates related to a target event to provide contextual outputs |
KR102690215B1 (ko) * | 2019-03-26 | 2024-08-01 | 라인플러스 주식회사 | 대화 스레드를 표시하기 위한 방법 및 시스템 |
USD934286S1 (en) * | 2019-03-26 | 2021-10-26 | Facebook, Inc. | Display device with graphical user interface |
USD934285S1 (en) * | 2019-03-26 | 2021-10-26 | Facebook, Inc. | Display device with graphical user interface |
USD944282S1 (en) * | 2019-03-26 | 2022-02-22 | Facebook, Inc. | Display device with graphical user interface |
USD944848S1 (en) * | 2019-03-26 | 2022-03-01 | Facebook, Inc. | Display device with graphical user interface |
US11080490B2 (en) * | 2019-03-28 | 2021-08-03 | Servicenow, Inc. | Pre-training of virtual chat interfaces |
US11544308B2 (en) * | 2019-03-28 | 2023-01-03 | Microsoft Technology Licensing, Llc | Semantic matching of search terms to results |
US10867132B2 (en) * | 2019-03-29 | 2020-12-15 | Microsoft Technology Licensing, Llc | Ontology entity type detection from tokenized utterance |
US10970278B2 (en) * | 2019-03-29 | 2021-04-06 | Microsoft Technology Licensing, Llc | Querying knowledge graph with natural language input |
US10916237B2 (en) | 2019-03-29 | 2021-02-09 | Microsoft Technology Licensing, Llc | Training utterance generation |
US11544594B2 (en) * | 2019-04-11 | 2023-01-03 | Sunghee Woo | Electronic device comprising user interface for providing user-participating-type AI training service, and server and method for providing user-participating-type AI training service using the electronic device |
US11521114B2 (en) | 2019-04-18 | 2022-12-06 | Microsoft Technology Licensing, Llc | Visualization of training dialogs for a conversational bot |
US11663497B2 (en) * | 2019-04-19 | 2023-05-30 | Adobe Inc. | Facilitating changes to online computing environment by assessing impacts of actions using a knowledge base representation |
US11657800B2 (en) * | 2019-04-26 | 2023-05-23 | Lg Electronics Inc. | Electronic device with wakeup word determined multi-mode operation |
US11657797B2 (en) * | 2019-04-26 | 2023-05-23 | Oracle International Corporation | Routing for chatbots |
US11681416B2 (en) * | 2019-04-26 | 2023-06-20 | Verint Americas Inc. | Dynamic web content based on natural language processing (NLP) inputs |
US10997968B2 (en) * | 2019-04-30 | 2021-05-04 | Microsofttechnology Licensing, Llc | Using dialog context to improve language understanding |
US11183219B2 (en) * | 2019-05-01 | 2021-11-23 | Sony Interactive Entertainment Inc. | Movies with user defined alternate endings |
US11270077B2 (en) * | 2019-05-13 | 2022-03-08 | International Business Machines Corporation | Routing text classifications within a cross-domain conversational service |
US11568307B2 (en) * | 2019-05-20 | 2023-01-31 | International Business Machines Corporation | Data augmentation for text-based AI applications |
US11687553B2 (en) | 2019-05-21 | 2023-06-27 | Sisense Ltd. | System and method for generating analytical insights utilizing a semantic knowledge graph |
US11140099B2 (en) * | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11663498B2 (en) | 2019-05-21 | 2023-05-30 | Sisense Ltd. | System and method for generating organizational memory using semantic knowledge graphs |
US11170026B1 (en) | 2019-05-28 | 2021-11-09 | Intuit Inc. | System and method for identifying questions of users of a data management system |
US11477140B2 (en) | 2019-05-30 | 2022-10-18 | Microsoft Technology Licensing, Llc | Contextual feedback to a natural understanding system in a chat bot |
US10868778B1 (en) * | 2019-05-30 | 2020-12-15 | Microsoft Technology Licensing, Llc | Contextual feedback, with expiration indicator, to a natural understanding system in a chat bot |
CN112015852A (zh) * | 2019-05-31 | 2020-12-01 | 微软技术许可有限责任公司 | 在关于事件的会话中提供响应 |
US11256868B2 (en) * | 2019-06-03 | 2022-02-22 | Microsoft Technology Licensing, Llc | Architecture for resolving ambiguous user utterance |
US11348601B1 (en) * | 2019-06-06 | 2022-05-31 | Amazon Technologies, Inc. | Natural language understanding using voice characteristics |
US11501177B2 (en) * | 2019-06-14 | 2022-11-15 | Accenture Global Solutions Limited | Knowledge engineering and reasoning on a knowledge graph |
US10629191B1 (en) | 2019-06-16 | 2020-04-21 | Linc Global, Inc. | Methods and systems for deploying and managing scalable multi-service virtual assistant platform |
US11238866B2 (en) * | 2019-06-17 | 2022-02-01 | Motorola Solutions, Inc. | Intelligent alerting of individuals in a public-safety communication system |
US11676134B2 (en) * | 2019-06-17 | 2023-06-13 | International Business Machines Corporation | Transaction interaction analysis and summarization |
US12111873B1 (en) * | 2019-06-17 | 2024-10-08 | Yahoo Assets Llc | Systems and methods for adaptive online user profiles |
US11580968B1 (en) | 2019-06-27 | 2023-02-14 | Amazon Technologies, Inc. | Contextual natural language understanding for conversational agents |
WO2021002493A1 (ko) * | 2019-07-01 | 2021-01-07 | 엘지전자 주식회사 | 지능형 게이트웨이 장치 및 그를 포함하는 제어 시스템 |
US11205196B1 (en) | 2019-07-03 | 2021-12-21 | Verizon Media Inc. | Systems and methods for generating travel-related recommendations using electronic communication data |
US11263400B2 (en) * | 2019-07-05 | 2022-03-01 | Google Llc | Identifying entity attribute relations |
US11258814B2 (en) * | 2019-07-16 | 2022-02-22 | Hewlett Packard Enterprise Development Lp | Methods and systems for using embedding from Natural Language Processing (NLP) for enhanced network analytics |
WO2021011139A1 (en) * | 2019-07-18 | 2021-01-21 | Sri International | The conversational assistant for conversational engagement |
US11133006B2 (en) * | 2019-07-19 | 2021-09-28 | International Business Machines Corporation | Enhancing test coverage of dialogue models |
US11921792B2 (en) * | 2019-07-23 | 2024-03-05 | Rovi Guides, Inc. | Method and apparatus for curation of content |
US11373104B2 (en) * | 2019-07-26 | 2022-06-28 | Bae Systems Information And Electronic Systems Integration Inc. | Connecting OBP objects with knowledge models through context data layer |
US20210035666A1 (en) * | 2019-07-29 | 2021-02-04 | Alclear, Llc | Integrating distributed systems using biometric identification |
US11392796B2 (en) * | 2019-08-20 | 2022-07-19 | Micron Technology, Inc. | Feature dictionary for bandwidth enhancement |
US11755884B2 (en) | 2019-08-20 | 2023-09-12 | Micron Technology, Inc. | Distributed machine learning with privacy protection |
US11636334B2 (en) | 2019-08-20 | 2023-04-25 | Micron Technology, Inc. | Machine learning with feature obfuscation |
US11281854B2 (en) * | 2019-08-21 | 2022-03-22 | Primer Technologies, Inc. | Limiting a dictionary used by a natural language model to summarize a document |
EP3973413A4 (en) * | 2019-08-22 | 2022-07-06 | Samsung Electronics Co., Ltd. | METHOD AND SYSTEM FOR CONTEXT ASSIGNMENT AND PERSONALIZATION USING A WAKE-UP WORD IN VIRTUAL PERSONAL ASSISTANT |
US11184298B2 (en) * | 2019-08-28 | 2021-11-23 | International Business Machines Corporation | Methods and systems for improving chatbot intent training by correlating user feedback provided subsequent to a failed response to an initial user intent |
US11121987B1 (en) * | 2019-09-03 | 2021-09-14 | Octane AI, Inc. | Conversational support for user journey |
US11601339B2 (en) | 2019-09-06 | 2023-03-07 | Hewlett Packard Enterprise Development Lp | Methods and systems for creating multi-dimensional baselines from network conversations using sequence prediction models |
KR20210030160A (ko) * | 2019-09-09 | 2021-03-17 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11386144B2 (en) * | 2019-09-09 | 2022-07-12 | Adobe Inc. | Identifying digital attributes from multiple attribute groups within target digital images utilizing a deep cognitive attribution neural network |
CN110543943B (zh) * | 2019-09-10 | 2022-03-25 | 北京百度网讯科技有限公司 | 一种网络融合方法及装置、电子设备、存储介质 |
US11423066B2 (en) * | 2019-09-12 | 2022-08-23 | Intuit Inc. | System and method for reducing user query ambiguity through chatbot clarifying questions |
US11036464B2 (en) * | 2019-09-13 | 2021-06-15 | Bose Corporation | Spatialized augmented reality (AR) audio menu |
US10878008B1 (en) * | 2019-09-13 | 2020-12-29 | Intuit Inc. | User support with integrated conversational user interfaces and social question answering |
US11120790B2 (en) * | 2019-09-24 | 2021-09-14 | Amazon Technologies, Inc. | Multi-assistant natural language input processing |
US11393477B2 (en) * | 2019-09-24 | 2022-07-19 | Amazon Technologies, Inc. | Multi-assistant natural language input processing to determine a voice model for synthesized speech |
EP3798090A1 (de) * | 2019-09-27 | 2021-03-31 | Siemens Mobility GmbH | Verfahren zum überwachen einer gesprochenen kommunikation im zugverkehr und zugehöriges zugleitsystem |
US11275453B1 (en) | 2019-09-30 | 2022-03-15 | Snap Inc. | Smart ring for manipulating virtual objects displayed by a wearable device |
US11749265B2 (en) * | 2019-10-04 | 2023-09-05 | Disney Enterprises, Inc. | Techniques for incremental computer-based natural language understanding |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
US11308284B2 (en) | 2019-10-18 | 2022-04-19 | Facebook Technologies, Llc. | Smart cameras enabled by assistant systems |
US11948076B2 (en) * | 2019-10-25 | 2024-04-02 | Sony Group Corporation | Media rendering device control based on trained network model |
US11227583B2 (en) * | 2019-11-05 | 2022-01-18 | International Business Machines Corporation | Artificial intelligence voice response system having variable modes for interaction with user |
US11430447B2 (en) * | 2019-11-15 | 2022-08-30 | Qualcomm Incorporated | Voice activation based on user recognition |
US20210149886A1 (en) * | 2019-11-15 | 2021-05-20 | Salesforce.Com, Inc. | Processing a natural language query using semantics machine learning |
US11314790B2 (en) * | 2019-11-18 | 2022-04-26 | Salesforce.Com, Inc. | Dynamic field value recommendation methods and systems |
US11651250B2 (en) * | 2019-11-20 | 2023-05-16 | International Business Machines Corporation | Automatically generated conversation output |
CN114730463A (zh) * | 2019-11-22 | 2022-07-08 | 豪夫迈·罗氏有限公司 | 用于组织图像分类的多实例学习器 |
WO2021108679A1 (en) * | 2019-11-27 | 2021-06-03 | ConverSight.ai, Inc. | Contextual and intent based natural language processing system and method |
KR20210069860A (ko) * | 2019-12-04 | 2021-06-14 | 엘지전자 주식회사 | 스마트 장치 |
WO2021113687A1 (en) * | 2019-12-05 | 2021-06-10 | Augmented And Segmented Media Interface Corp. | System and method for in-video product placement and in-video purchasing capability using augmented reality |
US11228683B2 (en) * | 2019-12-06 | 2022-01-18 | At&T Intellectual Property I, L.P. | Supporting conversations between customers and customer service agents |
CN111026816B (zh) * | 2019-12-09 | 2022-09-02 | 重庆锐云科技有限公司 | 基于知识图谱的高净值客户群识别方法、装置及存储介质 |
US11694682B1 (en) | 2019-12-11 | 2023-07-04 | Amazon Technologies, Inc. | Triggering voice control disambiguation |
US11823659B2 (en) * | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
KR20210074833A (ko) * | 2019-12-12 | 2021-06-22 | 현대자동차주식회사 | 구문 분석 장치 및 방법 |
US20210182730A1 (en) * | 2019-12-12 | 2021-06-17 | Shopify Inc. | Systems and methods for detecting non-causal dependencies in machine learning models |
US11790302B2 (en) * | 2019-12-16 | 2023-10-17 | Nice Ltd. | System and method for calculating a score for a chain of interactions in a call center |
JP7230793B2 (ja) * | 2019-12-24 | 2023-03-01 | トヨタ自動車株式会社 | 情報処理装置、情報処理方法、及び、システム |
US11687778B2 (en) | 2020-01-06 | 2023-06-27 | The Research Foundation For The State University Of New York | Fakecatcher: detection of synthetic portrait videos using biological signals |
US20230025049A1 (en) * | 2020-01-07 | 2023-01-26 | Lg Electronics Inc. | Multi-modal input-based service provision device and service provision method |
CN111243587A (zh) * | 2020-01-08 | 2020-06-05 | 北京松果电子有限公司 | 语音交互方法、装置、设备及存储介质 |
CN111241282B (zh) * | 2020-01-14 | 2023-09-08 | 北京百度网讯科技有限公司 | 文本主题生成方法、装置及电子设备 |
CN111221984B (zh) * | 2020-01-15 | 2024-03-01 | 北京百度网讯科技有限公司 | 多模态内容处理方法、装置、设备及存储介质 |
US11562264B2 (en) * | 2020-01-29 | 2023-01-24 | Accenture Global Solutions Limited | System and method for using machine learning to select one or more submissions from a plurality of submissions |
US11243969B1 (en) * | 2020-02-07 | 2022-02-08 | Hitps Llc | Systems and methods for interaction between multiple computing devices to process data records |
US10841251B1 (en) * | 2020-02-11 | 2020-11-17 | Moveworks, Inc. | Multi-domain chatbot |
US11445301B2 (en) * | 2020-02-12 | 2022-09-13 | Sonos, Inc. | Portable playback devices with network operation modes |
US11093691B1 (en) * | 2020-02-14 | 2021-08-17 | Capital One Services, Llc | System and method for establishing an interactive communication session |
US11586597B2 (en) * | 2020-02-18 | 2023-02-21 | Freshworks Inc. | Integrated system for entity deduplication |
US11182282B2 (en) * | 2020-02-28 | 2021-11-23 | International Business Machines Corporation | Executing tests in deterministic order |
US11462220B2 (en) * | 2020-03-04 | 2022-10-04 | Accenture Global Solutions Limited | Infrastructure automation platform to assist in performing actions in response to tasks |
US11263527B2 (en) * | 2020-03-04 | 2022-03-01 | Kyndryl, Inc. | Cognitive switching logic for multiple knowledge domains |
US11503054B2 (en) * | 2020-03-05 | 2022-11-15 | Aetna Inc. | Systems and methods for identifying access anomalies using network graphs |
WO2021178901A1 (en) * | 2020-03-05 | 2021-09-10 | Brain Technologies, Inc. | Collaboration user interface for computing device |
JP7257349B2 (ja) * | 2020-03-10 | 2023-04-13 | Kddi株式会社 | 対象人物の特徴的な身振りを推定するプログラム、装置及び方法 |
US11947604B2 (en) * | 2020-03-17 | 2024-04-02 | International Business Machines Corporation | Ranking of messages in dialogs using fixed point operations |
US11256736B2 (en) * | 2020-03-19 | 2022-02-22 | Mercari, Inc. | Personalized image recognition |
JP7248615B2 (ja) * | 2020-03-19 | 2023-03-29 | ヤフー株式会社 | 出力装置、出力方法及び出力プログラム |
US11735169B2 (en) * | 2020-03-20 | 2023-08-22 | International Business Machines Corporation | Speech recognition and training for data inputs |
US11771999B2 (en) * | 2020-03-20 | 2023-10-03 | Valve Corporation | Personalized game notifications |
US11625873B2 (en) | 2020-03-30 | 2023-04-11 | Snap Inc. | Personalized media overlay recommendation |
US11818286B2 (en) * | 2020-03-30 | 2023-11-14 | Snap Inc. | Avatar recommendation and reply |
US11682391B2 (en) * | 2020-03-30 | 2023-06-20 | Motorola Solutions, Inc. | Electronic communications device having a user interface including a single input interface for electronic digital assistant and voice control access |
US11277597B1 (en) | 2020-03-31 | 2022-03-15 | Snap Inc. | Marker-based guided AR experience |
US11748713B1 (en) * | 2020-03-31 | 2023-09-05 | Amazon Technologies, Inc. | Data ingestion and understanding for natural language processing systems |
US11379666B2 (en) * | 2020-04-08 | 2022-07-05 | International Business Machines Corporation | Suggestion of new entity types with discriminative term importance analysis |
WO2021205362A1 (en) * | 2020-04-08 | 2021-10-14 | Docebo Spa a Socio Unico | Method and system for automated generation and editing of educational and training materials |
US11442969B2 (en) * | 2020-04-24 | 2022-09-13 | Capital One Services, Llc | Computer-based systems configured for efficient entity resolution for database merging and reconciliation |
JP6771251B1 (ja) * | 2020-04-24 | 2020-10-21 | 株式会社インタラクティブソリューションズ | 音声解析システム |
US11798429B1 (en) | 2020-05-04 | 2023-10-24 | Snap Inc. | Virtual tutorials for musical instruments with finger tracking in augmented reality |
US11514336B2 (en) | 2020-05-06 | 2022-11-29 | Morgan Stanley Services Group Inc. | Automated knowledge base |
US11823082B2 (en) * | 2020-05-06 | 2023-11-21 | Kore.Ai, Inc. | Methods for orchestrating an automated conversation in one or more networks and devices thereof |
US11651156B2 (en) | 2020-05-07 | 2023-05-16 | Optum Technology, Inc. | Contextual document summarization with semantic intelligence |
CN111563371B (zh) * | 2020-05-08 | 2023-08-11 | 海信电子科技(武汉)有限公司 | 一种文本生成的方法及设备 |
US11741308B2 (en) * | 2020-05-14 | 2023-08-29 | Oracle International Corporation | Method and system for constructing data queries from conversational input |
US11341339B1 (en) * | 2020-05-14 | 2022-05-24 | Amazon Technologies, Inc. | Confidence calibration for natural-language understanding models that provides optimal interpretability |
US11526678B2 (en) * | 2020-05-14 | 2022-12-13 | Naver Corporation | Attention over common-sense network for natural language inference |
US11520399B2 (en) | 2020-05-26 | 2022-12-06 | Snap Inc. | Interactive augmented reality experiences using positional tracking |
CN111612633A (zh) * | 2020-05-27 | 2020-09-01 | 佛山市知识图谱科技有限公司 | 股票分析方法、装置、计算机设备和存储介质 |
US11413541B2 (en) * | 2020-06-03 | 2022-08-16 | Electronic Arts Inc. | Generation of context-aware, personalized challenges in computer games |
US11222075B2 (en) | 2020-06-12 | 2022-01-11 | Earley Information Science, Inc. | Digital data processing systems and methods for digital content retrieval and generation |
US11290851B2 (en) * | 2020-06-15 | 2022-03-29 | Snap Inc. | Location sharing using offline and online objects |
US11314776B2 (en) | 2020-06-15 | 2022-04-26 | Snap Inc. | Location sharing using friend list versions |
US11483267B2 (en) | 2020-06-15 | 2022-10-25 | Snap Inc. | Location sharing using different rate-limited links |
US11503432B2 (en) | 2020-06-15 | 2022-11-15 | Snap Inc. | Scalable real-time location sharing framework |
US11256864B2 (en) * | 2020-06-19 | 2022-02-22 | Apple, Inc. | Contacts autocomplete keyboard |
US11893984B1 (en) * | 2020-06-22 | 2024-02-06 | Amazon Technologies, Inc. | Speech processing system |
US11803400B2 (en) * | 2020-06-25 | 2023-10-31 | International Business Machines Corporation | Method and system for asynchronous notifications for users in contextual interactive systems |
US11393456B1 (en) * | 2020-06-26 | 2022-07-19 | Amazon Technologies, Inc. | Spoken language understanding system |
US11741965B1 (en) * | 2020-06-26 | 2023-08-29 | Amazon Technologies, Inc. | Configurable natural language output |
WO2021260650A1 (en) * | 2020-06-27 | 2021-12-30 | Glance Inmobi Pte. Ltd | Generating personalized content for presentation on user devices |
US11763804B2 (en) * | 2020-06-29 | 2023-09-19 | Microsoft Technology Licensing, Llc | Leveraging dialogue history in updated dialogue |
US11388365B2 (en) * | 2020-06-30 | 2022-07-12 | Microsoft Technology Licensing, Llc | Video profile creation system |
CN111783462B (zh) * | 2020-06-30 | 2023-07-04 | 大连民族大学 | 基于双神经网络融合的中文命名实体识别模型及方法 |
KR102215088B1 (ko) * | 2020-07-03 | 2021-02-10 | (주)어센트코리아 | 검색 의도를 제공하기 위한 서비스 제공 장치 및 방법 |
US20220012296A1 (en) * | 2020-07-13 | 2022-01-13 | Rovi Guides, Inc. | Systems and methods to automatically categorize social media posts and recommend social media posts |
US10818293B1 (en) * | 2020-07-14 | 2020-10-27 | Drift.com, Inc. | Selecting a response in a multi-turn interaction between a user and a conversational bot |
US11609869B2 (en) * | 2020-07-14 | 2023-03-21 | Samsung Electronics Co., Ltd. | Systems, methods, and devices for time synchronized storage delivery |
CN113946719A (zh) * | 2020-07-15 | 2022-01-18 | 华为技术有限公司 | 词补全方法和装置 |
US20220019742A1 (en) * | 2020-07-20 | 2022-01-20 | International Business Machines Corporation | Situational awareness by fusing multi-modal data with semantic model |
US12039273B2 (en) * | 2020-07-30 | 2024-07-16 | International Business Machines Corporation | Feature vector generation for probabalistic matching |
US20220035795A1 (en) * | 2020-08-03 | 2022-02-03 | Adp, Llc | Report management system |
US11641330B2 (en) * | 2020-08-06 | 2023-05-02 | International Business Machines Corporation | Communication content tailoring |
US11789759B2 (en) * | 2020-08-12 | 2023-10-17 | Baton Simulations | Method, system and apparatus assisting a user of a virtual environment |
US20220318250A1 (en) * | 2020-08-18 | 2022-10-06 | Google Llc | Systems and methods for identifying events that share a characteristic |
KR20220023211A (ko) * | 2020-08-20 | 2022-03-02 | 삼성전자주식회사 | 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법 |
US11721338B2 (en) * | 2020-08-26 | 2023-08-08 | International Business Machines Corporation | Context-based dynamic tolerance of virtual assistant |
JP2023539744A (ja) | 2020-08-27 | 2023-09-19 | ライブパーソン, インコーポレイテッド | コンテキストセンシティブ会話型インターフェース |
EP4204981A4 (en) * | 2020-08-31 | 2024-06-05 | Hewlett-Packard Development Company, L.P. | INVITE TO SHARE DOCUMENTS BETWEEN COLLABORATING USERS |
KR102311218B1 (ko) * | 2020-09-07 | 2021-10-12 | 고려대학교 산학협력단 | 영상에 관한 대화 처리 장치, 방법 및 시스템 |
US11574637B1 (en) * | 2020-09-08 | 2023-02-07 | Amazon Technologies, Inc. | Spoken language understanding models |
US20220076173A1 (en) * | 2020-09-09 | 2022-03-10 | TravSolo, Inc. | Methods and systems for itinerary creation |
CN114253386A (zh) * | 2020-09-11 | 2022-03-29 | 成都木帆科技有限公司 | 一种基于感知的通信系统 |
US11925863B2 (en) | 2020-09-18 | 2024-03-12 | Snap Inc. | Tracking hand gestures for interactive game control in augmented reality |
US11507962B2 (en) * | 2020-09-22 | 2022-11-22 | Ebay Inc. | Counterfeit item detection system |
US20220101161A1 (en) * | 2020-09-25 | 2022-03-31 | LayerFive, Inc | Probabilistic methods and systems for resolving anonymous user identities based on artificial intelligence |
US11410653B1 (en) * | 2020-09-25 | 2022-08-09 | Amazon Technologies, Inc. | Generating content recommendation based on user-device dialogue |
US11546505B2 (en) | 2020-09-28 | 2023-01-03 | Snap Inc. | Touchless photo capture in response to detected hand gestures |
US11568463B2 (en) * | 2020-09-29 | 2023-01-31 | Intuit Inc. | Heterogeneous graph embedding |
US11568145B1 (en) * | 2020-09-30 | 2023-01-31 | Amazon Technologies, Inc. | Contextual natural language understanding for conversational agents |
US11507903B2 (en) * | 2020-10-01 | 2022-11-22 | Accenture Global Solutions Limited | Dynamic formation of inside sales team or expert support team |
US20220108413A1 (en) * | 2020-10-06 | 2022-04-07 | Convertsation Ed Inc. | Systems and Methods for Providing Civil Discourse as a Service |
US11467857B2 (en) * | 2020-10-13 | 2022-10-11 | Adobe Inc. | Intelligently sensing digital user context to generate recommendations across client device applications |
US12106760B2 (en) * | 2020-10-22 | 2024-10-01 | Capital One Services, Llc | Systems and methods using natural language processing to identify irregularities in a user utterance |
US11790173B2 (en) | 2020-10-22 | 2023-10-17 | Google Llc | Recommending action(s) based on entity or entity type |
US11182748B1 (en) * | 2020-10-29 | 2021-11-23 | Microsoft Technology Licensing, Llc | Augmented data insight generation and provision |
US11514109B2 (en) * | 2020-10-29 | 2022-11-29 | Google Llc | Inferring semantic label(s) for assistant device(s) based on device-specific signal(s) |
US12061873B2 (en) | 2020-10-30 | 2024-08-13 | Microsoft Technology Licensing, Llc | Determining lexical difficulty in textual content |
US11188833B1 (en) * | 2020-11-05 | 2021-11-30 | Birdview Films. Llc | Real-time predictive knowledge pattern machine |
US11783827B2 (en) * | 2020-11-06 | 2023-10-10 | Apple Inc. | Determining suggested subsequent user actions during digital assistant interaction |
US11830086B2 (en) * | 2020-11-10 | 2023-11-28 | Match Group, Llc | System and method for providing pairings for live digital interactions |
US20220147547A1 (en) * | 2020-11-12 | 2022-05-12 | International Business Machines Corporation | Analogy based recognition |
US11984124B2 (en) * | 2020-11-13 | 2024-05-14 | Apple Inc. | Speculative task flow execution |
US11749284B2 (en) * | 2020-11-13 | 2023-09-05 | Google Llc | Dynamically adapting on-device models, of grouped assistant devices, for cooperative processing of assistant requests |
US11727923B2 (en) * | 2020-11-24 | 2023-08-15 | Coinbase, Inc. | System and method for virtual conversations |
US20220164402A1 (en) * | 2020-11-26 | 2022-05-26 | Flipkart Internet Private Limited | Enhancing the accuracy of search results |
CN112530438B (zh) * | 2020-11-27 | 2023-04-07 | 贵州电网有限责任公司 | 一种基于知识图谱辅助声纹识别的身份认证方法 |
US11803831B1 (en) * | 2020-12-02 | 2023-10-31 | Wells Fargo Bank, N.A. | Systems and methods for utilizing a user expression map configured to enable contactless human to device interactions |
US11587055B1 (en) * | 2020-12-02 | 2023-02-21 | Wells Fargo Bank, N.A. | Systems and methods for generating a user expression map configured to enable contactless human to device interactions |
US11776534B1 (en) * | 2020-12-08 | 2023-10-03 | Amazon Technologies, Inc. | Natural language understanding intent adjustment |
US20220188361A1 (en) * | 2020-12-11 | 2022-06-16 | Meta Platforms, Inc. | Voice-based Auto-Completions and Auto-Responses for Assistant Systems |
EP4231286A4 (en) * | 2020-12-11 | 2024-03-27 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE AND ASSOCIATED CONTROL METHOD |
US11875550B2 (en) * | 2020-12-18 | 2024-01-16 | International Business Machines Corporation | Spatiotemporal sequences of content |
US11563706B2 (en) * | 2020-12-29 | 2023-01-24 | Meta Platforms, Inc. | Generating context-aware rendering of media contents for assistant systems |
US12086324B2 (en) * | 2020-12-29 | 2024-09-10 | Snap Inc. | Micro hand gestures for controlling virtual and graphical elements |
US11740313B2 (en) | 2020-12-30 | 2023-08-29 | Snap Inc. | Augmented reality precision tracking and display |
WO2022146673A1 (en) | 2020-12-30 | 2022-07-07 | Snap Inc. | Augmented reality precision tracking and display |
US11809480B1 (en) | 2020-12-31 | 2023-11-07 | Meta Platforms, Inc. | Generating dynamic knowledge graph of media contents for assistant systems |
EP4027233A1 (en) * | 2021-01-12 | 2022-07-13 | Atos France | Method, computer program, device for virtually assisting a user with a digital assistant |
CN112883170B (zh) * | 2021-01-20 | 2023-08-18 | 中国人民大学 | 一种用户反馈引导的自适应对话推荐方法和系统 |
GB2603464A (en) * | 2021-01-27 | 2022-08-10 | Legal Utopia Ltd | System and method for classification of unstructured text data |
US12057116B2 (en) * | 2021-01-29 | 2024-08-06 | Salesforce, Inc. | Intent disambiguation within a virtual agent platform |
CN112990430B (zh) * | 2021-02-08 | 2021-12-03 | 辽宁工业大学 | 基于长短时记忆网络的群组划分方法及系统 |
WO2022178066A1 (en) | 2021-02-18 | 2022-08-25 | Meta Platforms, Inc. | Readout of communication content comprising non-latin or non-parsable content items for assistant systems |
CN113014564B (zh) * | 2021-02-19 | 2022-10-21 | 提亚有限公司 | 一种用户的匹配方法、装置、计算机设备和存储介质 |
KR20220119219A (ko) * | 2021-02-19 | 2022-08-29 | 삼성전자주식회사 | 온디바이스 인공지능 서비스를 제공하는 전자 장치 및 방법 |
CN112883268B (zh) * | 2021-02-22 | 2022-02-01 | 中国计量大学 | 一种考虑用户多兴趣以及社交影响的会话推荐方法 |
US11531402B1 (en) | 2021-02-25 | 2022-12-20 | Snap Inc. | Bimanual gestures for controlling virtual and graphical elements |
US20220284318A1 (en) * | 2021-03-02 | 2022-09-08 | Accenture Global Solutions Limited | Utilizing machine learning models to determine engagement strategies for developers |
TW202240461A (zh) * | 2021-03-03 | 2022-10-16 | 美商元平台公司 | 使用輔助系統的語音和手勢輸入之文字編輯 |
US11115353B1 (en) * | 2021-03-09 | 2021-09-07 | Drift.com, Inc. | Conversational bot interaction with utterance ranking |
US11768894B2 (en) * | 2021-03-11 | 2023-09-26 | Ultra Information Solutions Ltd. | Systems and methods for profiling an entity |
US11811717B2 (en) * | 2021-03-15 | 2023-11-07 | International Business Machines Corporation | User preference based message filtering in group messaging |
US11748339B2 (en) * | 2021-03-19 | 2023-09-05 | Maplebear, Inc. | Anonymization of query information while retaining query structure and sizing information |
WO2022203651A1 (en) * | 2021-03-22 | 2022-09-29 | Hewlett-Packard Development Company, L.P. | Human machine interface having dynamic user interaction modalities |
US11811585B2 (en) | 2021-03-23 | 2023-11-07 | International Business Machines Corporation | Measuring incident management process efficiency metrics utilizing real-time conversation analysis |
CN113094544B (zh) * | 2021-03-26 | 2023-03-24 | 湖南大学 | 一种基于dcnn联合特征表示的音乐推荐方法 |
CN112948596B (zh) * | 2021-04-01 | 2023-03-31 | 泰豪软件股份有限公司 | 知识图谱构建方法、装置、计算机设备及计算机存储介质 |
US20220321612A1 (en) * | 2021-04-02 | 2022-10-06 | Whatsapp Llc | Enhanced text and voice communications |
US11954446B2 (en) * | 2021-04-08 | 2024-04-09 | International Business Machines Corporation | Automatic flow generation for virtual assistants |
US11444896B1 (en) * | 2021-04-09 | 2022-09-13 | Slack Technologies, Llc | Real-time feedback for message composition in a communication platform |
EP4327185A1 (en) | 2021-04-19 | 2024-02-28 | Snap, Inc. | Hand gestures for animating and controlling virtual and graphical elements |
US20220358917A1 (en) | 2021-04-21 | 2022-11-10 | Meta Platforms, Inc. | Multi-device Mediation for Assistant Systems |
US12118790B2 (en) | 2021-04-21 | 2024-10-15 | Meta Platforms, Inc. | Auto-capture of interesting moments by assistant systems |
TW202301081A (zh) | 2021-04-21 | 2023-01-01 | 美商元平台公司 | 輔助系統之基於真實世界文字偵測的任務執行 |
US20220366904A1 (en) | 2021-04-21 | 2022-11-17 | Meta Platforms, Inc. | Active Listening for Assistant Systems |
US11861315B2 (en) | 2021-04-21 | 2024-01-02 | Meta Platforms, Inc. | Continuous learning for natural-language understanding models for assistant systems |
US20220342931A1 (en) * | 2021-04-23 | 2022-10-27 | International Business Machines Corporation | Condition resolution system |
US11556718B2 (en) * | 2021-05-01 | 2023-01-17 | International Business Machines Corporation | Altering messaging using sentiment analysis |
US11736423B2 (en) * | 2021-05-04 | 2023-08-22 | International Business Machines Corporation | Automated conversational response generation |
US11797766B2 (en) * | 2021-05-21 | 2023-10-24 | Apple Inc. | Word prediction with multiple overlapping contexts |
US11637798B2 (en) | 2021-05-27 | 2023-04-25 | Microsoft Technology Licensing, Llc | Controlled display of related message threads |
US11716302B2 (en) | 2021-05-27 | 2023-08-01 | Microsoft Technology Licensing, Llc | Coordination of message thread groupings across devices of a communication system |
US20220385605A1 (en) * | 2021-05-27 | 2022-12-01 | Microsoft Technology Licensing, Llc | Management of message threads generated from an intra-message split |
US11652773B2 (en) | 2021-05-27 | 2023-05-16 | Microsoft Technology Licensing, Llc | Enhanced control of user interface formats for message threads based on device form factors or topic priorities |
CN115480679A (zh) * | 2021-05-28 | 2022-12-16 | 北京字节跳动网络技术有限公司 | 虚拟直播间的显示方法、装置、客户端、服务器和介质 |
US20220393999A1 (en) * | 2021-06-03 | 2022-12-08 | Twitter, Inc. | Messaging system with capability to edit sent messages |
CN113076405A (zh) * | 2021-06-04 | 2021-07-06 | 明品云(北京)数据科技有限公司 | 基于用户画像的解决方案匹配方法及系统 |
CN113094475B (zh) * | 2021-06-08 | 2021-09-21 | 成都晓多科技有限公司 | 一种基于上下文注意流的对话意图识别系统及方法 |
CN113449089B (zh) * | 2021-06-11 | 2023-12-01 | 车智互联(北京)科技有限公司 | 一种查询语句的意图识别方法、问答方法及计算设备 |
US11895061B2 (en) * | 2021-06-15 | 2024-02-06 | Genesys Cloud Services, Inc. | Dynamic prioritization of collaboration between human and virtual agents |
US11532333B1 (en) * | 2021-06-23 | 2022-12-20 | Microsoft Technology Licensing, Llc | Smart summarization, indexing, and post-processing for recorded document presentation |
US11830497B2 (en) | 2021-06-24 | 2023-11-28 | Amazon Technologies, Inc. | Multi-domain intent handling with cross-domain contextual signals |
US11705113B2 (en) | 2021-06-24 | 2023-07-18 | Amazon Technologies, Inc. | Priority and context-based routing of speech processing |
GB2623037A (en) * | 2021-06-24 | 2024-04-03 | Amazon Tech Inc | Early invocation for contextual data processing |
US11657807B2 (en) | 2021-06-24 | 2023-05-23 | Amazon Technologies, Inc. | Multi-tier speech processing and content operations |
US11657805B2 (en) | 2021-06-24 | 2023-05-23 | Amazon Technologies, Inc. | Dynamic context-based routing of speech processing |
US12111885B2 (en) * | 2021-06-28 | 2024-10-08 | International Business Machines Corporation | Image dispositioning using machine learning |
CN113470614B (zh) * | 2021-06-29 | 2024-05-28 | 维沃移动通信有限公司 | 语音生成方法、装置和电子设备 |
CN113177115B (zh) * | 2021-06-30 | 2021-10-26 | 中移(上海)信息通信科技有限公司 | 对话内容的处理方法、装置及相关设备 |
US20230004948A1 (en) * | 2021-06-30 | 2023-01-05 | Earley Information Science, Inc. | Digital data processing systems and methods for commerce-related digital content retrieval and generation |
US12019627B2 (en) * | 2021-07-05 | 2024-06-25 | International Business Machines Corporation | Automatically and incrementally specifying queries through dialog understanding in real time |
US20230011396A1 (en) * | 2021-07-06 | 2023-01-12 | Johnson Controls Tyco IP Holdings LLP | Systems and methods for providing personalized and contextualized environment security information |
US20230008868A1 (en) * | 2021-07-08 | 2023-01-12 | Nippon Telegraph And Telephone Corporation | User authentication device, user authentication method, and user authentication computer program |
TWI801941B (zh) * | 2021-07-21 | 2023-05-11 | 國立中正大學 | 個人化語音轉換系統 |
US20230027628A1 (en) * | 2021-07-26 | 2023-01-26 | Microsoft Technology Licensing, Llc | User context-based enterprise search with multi-modal interaction |
CN113704488B (zh) * | 2021-08-13 | 2024-03-22 | 北京百度网讯科技有限公司 | 内容的生成方法、装置、电子设备及存储介质 |
US11977605B2 (en) * | 2021-08-16 | 2024-05-07 | Intel Corporation | Methods and apparatus to automatically evolve a code recommendation engine |
US11570523B1 (en) | 2021-08-27 | 2023-01-31 | Rovi Guides, Inc. | Systems and methods to enhance interactive program watching |
US11729480B2 (en) * | 2021-08-27 | 2023-08-15 | Rovi Guides, Inc. | Systems and methods to enhance interactive program watching |
US12001418B2 (en) * | 2021-08-31 | 2024-06-04 | Zebra Technologies Corporation | Onboarding a data source for access via a virtual assistant |
US12072919B2 (en) * | 2021-08-31 | 2024-08-27 | Paypal, Inc. | Sentence level dialogue summaries using unsupervised machine learning for keyword selection and scoring |
CN113704626B (zh) * | 2021-09-06 | 2022-02-15 | 中国计量大学 | 一种基于重构社交网络的会话社交推荐方法 |
US20230076327A1 (en) * | 2021-09-07 | 2023-03-09 | Yohana Llc | Systems and methods for ingesting task data from a browser for task facilitation services |
US20230087896A1 (en) * | 2021-09-23 | 2023-03-23 | International Business Machines Corporation | Leveraging knowledge records for chatbot local search |
CN113849577A (zh) * | 2021-09-27 | 2021-12-28 | 联想(北京)有限公司 | 数据增强方法及装置 |
US11556183B1 (en) * | 2021-09-30 | 2023-01-17 | Microsoft Technology Licensing, Llc | Techniques for generating data for an intelligent gesture detector |
US11782964B2 (en) * | 2021-10-08 | 2023-10-10 | Adp, Inc. | Method to recommend intents based on a weighted ranked hierarchical graph |
US11960652B2 (en) * | 2021-10-12 | 2024-04-16 | Qualcomm Incorporated | User interactions with remote devices |
US20230118072A1 (en) * | 2021-10-19 | 2023-04-20 | International Business Machines Corporation | Content based on-device image adjustment |
US11915326B2 (en) * | 2021-10-22 | 2024-02-27 | International Business Machines Corporation | Determining tag relevance |
US11941393B2 (en) * | 2021-11-01 | 2024-03-26 | Capital One Services, Llc | Systems and methods for managing a software repository |
US20230135962A1 (en) * | 2021-11-02 | 2023-05-04 | Microsoft Technology Licensing, Llc | Training framework for automated tasks involving multiple machine learning models |
US12045568B1 (en) | 2021-11-12 | 2024-07-23 | Meta Platforms, Inc. | Span pointer networks for non-autoregressive task-oriented semantic parsing for assistant systems |
CN114090740B (zh) * | 2021-11-19 | 2023-07-07 | 北京有竹居网络技术有限公司 | 意图识别方法、装置、可读介质及电子设备 |
US11922938B1 (en) | 2021-11-22 | 2024-03-05 | Amazon Technologies, Inc. | Access to multiple virtual assistants |
US20230162055A1 (en) * | 2021-11-22 | 2023-05-25 | Tencent America LLC | Hierarchical context tagging for utterance rewriting |
US11727068B2 (en) * | 2021-11-29 | 2023-08-15 | Salesforce, Inc. | Customizable intent driven application triggering system |
US11803253B2 (en) * | 2021-11-29 | 2023-10-31 | International Business Machines Corporation | Keyword recommendations for virtual keyboards |
US20230169527A1 (en) * | 2021-11-30 | 2023-06-01 | Qualtrics, Llc | Utilizing a knowledge graph to implement a digital survey system |
CN114003735B (zh) * | 2021-12-24 | 2022-03-18 | 北京道达天际科技有限公司 | 基于情报文档面向知识图谱问答的实体消歧方法 |
US11929845B2 (en) * | 2022-01-07 | 2024-03-12 | International Business Machines Corporation | AI-based virtual proxy nodes for intent resolution in smart audio devices |
US11792243B2 (en) | 2022-01-19 | 2023-10-17 | Bank Of America Corporation | System and method for conducting multi-session user interactions |
US12020704B2 (en) | 2022-01-19 | 2024-06-25 | Google Llc | Dynamic adaptation of parameter set used in hot word free adaptation of automated assistant |
EP4224358A1 (en) | 2022-02-08 | 2023-08-09 | Koa Health B.V. Sucursal en España | Method and system for a more accurate autocomplete mechanism |
US20230266830A1 (en) * | 2022-02-22 | 2023-08-24 | Microsoft Technology Licensing, Llc | Semantic user input |
US20230281205A1 (en) * | 2022-03-01 | 2023-09-07 | Google Llc | Contextually Relevant Suggestions |
US12039264B2 (en) * | 2022-03-09 | 2024-07-16 | Talent Unlimited Online Services Pr | Artificial intelligence based system and method for smart sentence completion in mobile devices |
US20230289672A1 (en) * | 2022-03-14 | 2023-09-14 | Gm Cruise Holdings Llc | Adaptive social activities for autonomous vehicle (av) passengers |
US20230326178A1 (en) * | 2022-03-23 | 2023-10-12 | Adobe Inc. | Concept disambiguation using multimodal embeddings |
WO2023183914A1 (en) * | 2022-03-25 | 2023-09-28 | OrangeDot, Inc. | Method and system for automatically determining responses in a messaging platform |
CN114661910A (zh) * | 2022-03-25 | 2022-06-24 | 平安科技(深圳)有限公司 | 一种意图识别方法、装置、电子设备及存储介质 |
CN114760125A (zh) * | 2022-04-08 | 2022-07-15 | 中国银行股份有限公司 | 一种数据异常访问的检测方法及装置 |
KR20230150499A (ko) * | 2022-04-22 | 2023-10-31 | 에스케이텔레콤 주식회사 | 사용자 의도의 매핑을 이용하는 대화시스템 |
WO2023212258A1 (en) * | 2022-04-28 | 2023-11-02 | Theai, Inc. | Relationship graphs for artificial intelligence character models |
US20230350928A1 (en) * | 2022-04-28 | 2023-11-02 | Knowbl LLC | Systems and methods for implementing a virtual agent performing context and query transformations using unsupervised machine learning models |
FR3135372A1 (fr) * | 2022-05-03 | 2023-11-10 | Orange | Procédés et dispositifs permettant une interaction enrichie entre un véhicule connecté et un agent conversationnel. |
US12099808B2 (en) | 2022-05-11 | 2024-09-24 | OrangeDot, Inc. | Method and system for automatically prioritizing content provided to a user |
US20230376515A1 (en) * | 2022-05-18 | 2023-11-23 | Slack Technologies, Llc | Generating summary documents for communications in a communication platform |
US20230419952A1 (en) * | 2022-05-18 | 2023-12-28 | Meta Platforms, Inc. | Data Synthesis for Domain Development of Natural Language Understanding for Assistant Systems |
WO2023239804A1 (en) * | 2022-06-08 | 2023-12-14 | Roblox Corporation | Voice chat translation |
CN115037739B (zh) * | 2022-06-13 | 2024-02-23 | 深圳乐播科技有限公司 | 文件传输方法、装置、电子设备及存储介质 |
US20230401380A1 (en) * | 2022-06-14 | 2023-12-14 | Jpmorgan Chase Bank, N.A. | Method and system for context-driven conversation automation pipeline |
CN114780504B (zh) * | 2022-06-20 | 2022-09-02 | 中关村科学城城市大脑股份有限公司 | web端交互管理方法、装置、存储介质及电子设备 |
US20240036893A1 (en) * | 2022-07-28 | 2024-02-01 | Verint Americas Inc. | User persona injection for task-oriented virtual assistants |
US11810175B1 (en) * | 2022-07-29 | 2023-11-07 | Intuit Inc. | Method and system for generating an optimum identifier format |
US20240048505A1 (en) * | 2022-08-08 | 2024-02-08 | Bank Of America Corporation | Tokenization of resource exchange event information |
US20240096316A1 (en) * | 2022-08-24 | 2024-03-21 | Amazon Technologies, Inc. | Multi-assistant device control |
WO2024044088A1 (en) * | 2022-08-25 | 2024-02-29 | Welocalize, Inc. | Computing technologies for evaluating linguistic content to predict impact on user engagement analytic parameters |
US11966449B2 (en) * | 2022-08-26 | 2024-04-23 | Capital One Services, Llc | Systems and methods for generating custom content |
JP2024046474A (ja) * | 2022-09-22 | 2024-04-03 | 富士通株式会社 | 情報管理プログラム、情報処理システム及び情報管理方法 |
US20240112674A1 (en) | 2022-09-23 | 2024-04-04 | Meta Platforms, Inc. | Presenting Attention States Associated with Voice Commands for Assistant Systems |
FR3140687A1 (fr) * | 2022-10-11 | 2024-04-12 | Orange | Procédé de détermination d’au moins une action cible parmi un ensemble d’actions exécutables sur un terminal électronique |
US20240144192A1 (en) * | 2022-11-01 | 2024-05-02 | Google Llc | Using large language model in reducing extent of calendar related interaction |
USD980274S1 (en) * | 2022-12-05 | 2023-03-07 | Hangzhou Ruisheng Software Co., Ltd. | Display screen with graphical user interface |
US11983329B1 (en) | 2022-12-05 | 2024-05-14 | Meta Platforms, Inc. | Detecting head gestures using inertial measurement unit signals |
WO2024129016A1 (en) * | 2022-12-13 | 2024-06-20 | Metrik Bilgisayar Yazilim Danismanlik Servis Sanayi Ticaret Limited Sirketi | A smart feedback system |
WO2024145376A1 (en) | 2022-12-29 | 2024-07-04 | Meta Platforms, Inc. | Reading out scene analysis for users wearing head-mounted devices |
US20240232697A1 (en) * | 2023-01-10 | 2024-07-11 | Universal City Studios Llc | System and method for a persistent and personalized dataset solution for improving guest interaction with an interactive area |
US20240256536A1 (en) * | 2023-01-26 | 2024-08-01 | Microsoft Technology Licensing, Llc | Bottleneck aware query alteration for search |
EP4418077A1 (en) | 2023-02-16 | 2024-08-21 | Meta Platforms, Inc. | Proactively pausing media playing based on ambient motion for assistant systems |
US20240282300A1 (en) | 2023-02-17 | 2024-08-22 | Meta Platforms, Inc. | Interaction Composer for Conversation Design Flow for Assistant Systems |
US20240289863A1 (en) * | 2023-02-24 | 2024-08-29 | Alai Vault LLC | Systems and methods for providing adaptive ai-driven conversational agents |
US11947902B1 (en) | 2023-03-03 | 2024-04-02 | Microsoft Technology Licensing, Llc | Efficient multi-turn generative AI model suggested message generation |
US20240296275A1 (en) * | 2023-03-03 | 2024-09-05 | Microsoft Technology Licensing, Llc | Guardrails for efficient processing and error prevention in generating suggested messages |
US11962546B1 (en) | 2023-03-03 | 2024-04-16 | Microsoft Technology Licensing, Llc | Leveraging inferred context to improve suggested messages |
WO2024191664A1 (en) * | 2023-03-10 | 2024-09-19 | Microsoft Technology Licensing, Llc | Computer-implemented multi-user messaging application |
CN116308652A (zh) * | 2023-03-14 | 2023-06-23 | 南京邮电大学 | 一种基于商品知识图谱和用户社交图谱的推荐系统和方法 |
US12112001B1 (en) | 2023-03-14 | 2024-10-08 | Meta Platforms, Inc. | Preventing false activations based on don/doff detection for assistant systems |
US20240314093A1 (en) * | 2023-03-15 | 2024-09-19 | Microsoft Technology Licensing, Llc | Electronic message system with artificial intelligence (ai)-generated personalized summarization |
US20240321269A1 (en) | 2023-03-22 | 2024-09-26 | Meta Platforms, Inc. | Generating Contextual Responses for Out-of-coverage Requests for Assistant Systems |
US12088667B1 (en) | 2023-03-30 | 2024-09-10 | Dropbox, Inc. | Generating and managing multilocational data blocks |
US12093299B1 (en) * | 2023-03-30 | 2024-09-17 | Dropbox, Inc. | Generating and summarizing content blocks within a virtual space interface |
US11908446B1 (en) * | 2023-10-05 | 2024-02-20 | Eunice Jia Min Yong | Wearable audiovisual translation system |
CN117170982B (zh) * | 2023-11-02 | 2024-02-13 | 建信金融科技有限责任公司 | 人机检测方法、装置、电子设备和计算机可读介质 |
US12120000B1 (en) | 2024-02-26 | 2024-10-15 | The Strategic Coach Inc. | Apparatus and a method for the generation of dynamic data packets |
CN118312267B (zh) * | 2024-06-05 | 2024-08-13 | 深圳品阔信息技术有限公司 | 基于人工智能的交互方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104718765A (zh) * | 2012-10-17 | 2015-06-17 | 脸谱公司 | 与具有增强现实的存在粒度相关的方法 |
US20150220777A1 (en) * | 2014-01-31 | 2015-08-06 | Google Inc. | Self-initiated change of appearance for subjects in video and images |
US20160378861A1 (en) * | 2012-09-28 | 2016-12-29 | Sri International | Real-time human-machine collaboration using big data driven augmented reality technologies |
US9672251B1 (en) * | 2014-09-29 | 2017-06-06 | Google Inc. | Extracting facts from documents |
CN107000210A (zh) * | 2014-07-15 | 2017-08-01 | 趣普科技公司 | 用于提供持久伙伴装置的设备和方法 |
CN107003723A (zh) * | 2014-10-21 | 2017-08-01 | 罗伯特·博世有限公司 | 用于会话系统中的响应选择和组成的自动化的方法和系统 |
CN107490971A (zh) * | 2016-06-09 | 2017-12-19 | 苹果公司 | 家庭环境中的智能自动化助理 |
US20180052884A1 (en) * | 2016-08-16 | 2018-02-22 | Ebay Inc. | Knowledge graph construction for intelligent online personal assistant |
CN107924552A (zh) * | 2015-07-24 | 2018-04-17 | 脸谱公司 | 经由消息收发提供个人助理服务 |
Family Cites Families (698)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1544305A (en) | 1922-02-03 | 1925-06-30 | Morgan & Wright | Manufacture of tire treads |
US2998534A (en) | 1958-09-04 | 1961-08-29 | Clevite Corp | Symmetrical junction transistor device and circuit |
US5026424A (en) | 1989-08-28 | 1991-06-25 | Rohm And Haas Company | Aquatic antifouling compositions |
US6397198B1 (en) | 1994-11-28 | 2002-05-28 | Indivos Corporation | Tokenless biometric electronic transactions using an audio signature to identify the transaction processor |
US6115458A (en) * | 1995-07-14 | 2000-09-05 | American Express Travel Related Services Company, Inc. | Method and apparatus for summaries of prepaid instrument transaction activity |
US5872850A (en) * | 1996-02-02 | 1999-02-16 | Microsoft Corporation | System for enabling information marketplace |
US5721827A (en) | 1996-10-02 | 1998-02-24 | James Logan | System for electrically distributing personalized information |
WO1998023062A1 (en) | 1996-11-22 | 1998-05-28 | T-Netix, Inc. | Voice recognition for information system access and transaction processing |
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
JPH1173297A (ja) | 1997-08-29 | 1999-03-16 | Hitachi Ltd | 音声とジェスチャによるマルチモーダル表現の時間的関係を用いた認識方法 |
US6027451A (en) | 1997-09-26 | 2000-02-22 | Ep Technologies, Inc. | Method and apparatus for fixing the anatomical orientation of a displayed ultrasound generated image |
US6816904B1 (en) | 1997-11-04 | 2004-11-09 | Collaboration Properties, Inc. | Networked video multimedia storage server environment |
US6026424A (en) | 1998-02-23 | 2000-02-15 | Hewlett-Packard Company | Method and apparatus for switching long duration tasks from synchronous to asynchronous execution and for reporting task results |
US6243761B1 (en) | 1998-03-26 | 2001-06-05 | Digital Equipment Corporation | Method for dynamically adjusting multimedia content of a web page by a server in accordance to network path characteristics between client and server |
US20020015480A1 (en) | 1998-12-08 | 2002-02-07 | Neil Daswani | Flexible multi-network voice/data aggregation system architecture |
US6578025B1 (en) | 1999-06-11 | 2003-06-10 | Abuzz Technologies, Inc. | Method and apparatus for distributing information to users |
US6510451B2 (en) | 1999-10-14 | 2003-01-21 | Yodlee.Com, Inc. | System for completing a multi-component task initiated by a client involving Web sites without requiring interaction from the client |
US6484136B1 (en) * | 1999-10-21 | 2002-11-19 | International Business Machines Corporation | Language model adaptation via network of similar users |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6665640B1 (en) | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
US7421432B1 (en) | 1999-12-15 | 2008-09-02 | Google Inc. | Hypertext browser assistant |
AU2434600A (en) | 1999-12-29 | 2001-07-16 | Koninklijke Kpn N.V. | Electronic call assistants with shared database |
US7516190B2 (en) | 2000-02-04 | 2009-04-07 | Parus Holdings, Inc. | Personal voice-based information retrieval system |
AU2001249768A1 (en) | 2000-04-02 | 2001-10-15 | Tangis Corporation | Soliciting information based on a computer user's context |
JP4321944B2 (ja) | 2000-04-27 | 2009-08-26 | 富士通株式会社 | 生体情報を用いた個人認証システム |
NL1015165C2 (nl) | 2000-05-12 | 2001-11-13 | Koninkl Kpn Nv | Communicatiesysteem. |
WO2001098936A2 (en) | 2000-06-22 | 2001-12-27 | Microsoft Corporation | Distributed computing services platform |
US20020165912A1 (en) | 2001-02-25 | 2002-11-07 | Storymail, Inc. | Secure certificate and system and method for issuing and using same |
US7440904B2 (en) | 2000-10-11 | 2008-10-21 | Malik M. Hanson | Method and system for generating personal/individual health records |
US20040085162A1 (en) * | 2000-11-29 | 2004-05-06 | Rajeev Agarwal | Method and apparatus for providing a mixed-initiative dialog between a user and a machine |
WO2002060162A2 (en) | 2000-11-30 | 2002-08-01 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
US7257537B2 (en) | 2001-01-12 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for performing dialog management in a computer conversational interface |
US20020141621A1 (en) | 2001-02-09 | 2002-10-03 | Lane William F. | Self-authenticating identification substrate with encoded packet output |
FI20010792A (fi) | 2001-04-17 | 2002-10-18 | Nokia Corp | Käyttäjäriippumattoman puheentunnistuksen järjestäminen |
US20040230572A1 (en) * | 2001-06-22 | 2004-11-18 | Nosa Omoigui | System and method for semantic knowledge retrieval, management, capture, sharing, discovery, delivery and presentation |
US6839896B2 (en) * | 2001-06-29 | 2005-01-04 | International Business Machines Corporation | System and method for providing dialog management and arbitration in a multi-modal environment |
US7069215B1 (en) | 2001-07-12 | 2006-06-27 | At&T Corp. | Systems and methods for extracting meaning from multimodal inputs using finite-state devices |
US7158678B2 (en) | 2001-07-19 | 2007-01-02 | Motorola, Inc. | Text input method for personal digital assistants and the like |
US6901364B2 (en) | 2001-09-13 | 2005-05-31 | Matsushita Electric Industrial Co., Ltd. | Focused language models for improved speech input of structured documents |
ITTO20011035A1 (it) * | 2001-10-30 | 2003-04-30 | Loquendo Spa | Metodo per la gestione di dialoghi persona-macchina ad iniziativa mista basato sull'interazione vocale. |
US7080004B2 (en) * | 2001-12-05 | 2006-07-18 | Microsoft Corporation | Grammar authoring system |
US7136909B2 (en) * | 2001-12-28 | 2006-11-14 | Motorola, Inc. | Multimodal communication method and apparatus with multimodal profile |
US7315613B2 (en) | 2002-03-11 | 2008-01-01 | International Business Machines Corporation | Multi-modal messaging |
US7272564B2 (en) * | 2002-03-22 | 2007-09-18 | Motorola, Inc. | Method and apparatus for multimodal communication with user control of delivery modality |
US7197460B1 (en) | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
US7263347B2 (en) | 2002-05-24 | 2007-08-28 | Cingular Wireless Ii, Llc | Biometric authentication of a wireless device user |
US7426537B2 (en) * | 2002-05-31 | 2008-09-16 | Microsoft Corporation | Systems and methods for sharing dynamic content among a plurality of online co-users |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7464035B2 (en) | 2002-07-24 | 2008-12-09 | Robert Bosch Corporation | Voice control of home automation systems via telephone |
US7142645B2 (en) | 2002-10-04 | 2006-11-28 | Frederick Lowe | System and method for generating and distributing personalized media |
US7467087B1 (en) | 2002-10-10 | 2008-12-16 | Gillick Laurence S | Training and using pronunciation guessers in speech recognition |
US7310777B2 (en) | 2002-10-18 | 2007-12-18 | Computer Associates Think, Inc. | User interface for viewing performance information about transactions |
US7434169B2 (en) * | 2002-11-25 | 2008-10-07 | Aol Llc, A Delaware Limited Liability Company | Facilitating communications between computer users across a network |
KR20040073102A (ko) | 2003-02-13 | 2004-08-19 | 노용만 | 컨텐츠 적응변환에 있어 사용자 선호기반 형식 변환을위한 시스템적 접근방법 |
US20040186819A1 (en) | 2003-03-18 | 2004-09-23 | Aurilab, Llc | Telephone directory information retrieval system and method |
US7249120B2 (en) | 2003-06-27 | 2007-07-24 | Microsoft Corporation | Method and apparatus for selecting candidate statistics to estimate the selectivity value of the conditional selectivity expression in optimize queries based on a set of predicates that each reference a set of relational database tables |
US7124123B1 (en) | 2003-06-30 | 2006-10-17 | America Online, Inc. | Intelligent processing in the context of away and offline instant messages |
US20050149327A1 (en) | 2003-09-11 | 2005-07-07 | Voice Signal Technologies, Inc. | Text messaging via phrase recognition |
US7027586B2 (en) * | 2003-12-18 | 2006-04-11 | Sbc Knowledge Ventures, L.P. | Intelligently routing customer communications |
US20050197843A1 (en) | 2004-03-07 | 2005-09-08 | International Business Machines Corporation | Multimodal aggregating unit |
US7406408B1 (en) | 2004-08-24 | 2008-07-29 | The United States Of America As Represented By The Director, National Security Agency | Method of recognizing phones in speech of any language |
US7426497B2 (en) | 2004-08-31 | 2008-09-16 | Microsoft Corporation | Method and apparatus for analysis and decomposition of classifier data anomalies |
US8370323B2 (en) | 2004-08-31 | 2013-02-05 | Intel Corporation | Providing information services related to multimodal inputs |
US9240188B2 (en) | 2004-09-16 | 2016-01-19 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
US9355651B2 (en) | 2004-09-16 | 2016-05-31 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
US20070073678A1 (en) | 2005-09-23 | 2007-03-29 | Applied Linguistics, Llc | Semantic document profiling |
US7603413B1 (en) | 2005-04-07 | 2009-10-13 | Aol Llc | Using automated agents to facilitate chat communications |
US7693829B1 (en) | 2005-04-25 | 2010-04-06 | Google Inc. | Search engine with fill-the-blanks capability |
WO2007012988A2 (en) * | 2005-07-25 | 2007-02-01 | Koninklijke Philips Electronics N.V. | Method of controlled access to content |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070073745A1 (en) | 2005-09-23 | 2007-03-29 | Applied Linguistics, Llc | Similarity metric for semantic profiling |
KR100891358B1 (ko) | 2005-10-20 | 2009-04-01 | (주)트루시스템 | 사용자의 다음 문자열 입력을 예측하는 글자 입력 시스템및 그 글자 입력 방법 |
US7822699B2 (en) | 2005-11-30 | 2010-10-26 | Microsoft Corporation | Adaptive semantic reasoning engine |
US20070124147A1 (en) | 2005-11-30 | 2007-05-31 | International Business Machines Corporation | Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems |
CN101375273A (zh) * | 2005-12-09 | 2009-02-25 | 泰吉克通讯股份有限公司 | 用于绘制文本和其他应用的嵌入式规则引擎 |
KR100679051B1 (ko) | 2005-12-14 | 2007-02-05 | 삼성전자주식회사 | 복수의 신뢰도 측정 알고리즘을 이용한 음성 인식 장치 및방법 |
KR100717393B1 (ko) | 2006-02-09 | 2007-05-11 | 삼성전자주식회사 | 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 |
US7848917B2 (en) | 2006-03-30 | 2010-12-07 | Microsoft Corporation | Common word graph based multimodal input |
US7689420B2 (en) | 2006-04-06 | 2010-03-30 | Microsoft Corporation | Personalizing a context-free grammar using a dictation language model |
JP4114814B2 (ja) | 2006-04-10 | 2008-07-09 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 通信端末及び通信システム |
US20070270126A1 (en) | 2006-05-18 | 2007-11-22 | Microsoft Corporation | Authentication of a digital voice conversation |
US8146083B2 (en) | 2006-06-22 | 2012-03-27 | International Business Machines Corporation | Method and apparatus to modify a task within a set of tasks |
US7849079B2 (en) | 2006-07-31 | 2010-12-07 | Microsoft Corporation | Temporal ranking of search results |
US7577718B2 (en) | 2006-07-31 | 2009-08-18 | Microsoft Corporation | Adaptive dissemination of personalized and contextually relevant information |
US20080240379A1 (en) | 2006-08-03 | 2008-10-02 | Pudding Ltd. | Automatic retrieval and presentation of information relevant to the context of a user's conversation |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
KR100817798B1 (ko) | 2006-10-20 | 2008-03-31 | 한국정보보호진흥원 | 인터넷 제어 메시지 프로토콜의 타임스탬프 기능을 이용한네트워크 링크 가용 대역폭 추정 방법 |
US8150021B2 (en) * | 2006-11-03 | 2012-04-03 | Nice-Systems Ltd. | Proactive system and method for monitoring and guidance of call center agent |
NO325864B1 (no) | 2006-11-07 | 2008-08-04 | Fast Search & Transfer Asa | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten |
US8571862B2 (en) | 2006-11-30 | 2013-10-29 | Ashwin P. Rao | Multimodal interface for input of text |
US8817951B2 (en) | 2006-12-27 | 2014-08-26 | Motorola Mobility Llc | Method and system for monitoring a location |
WO2008085205A2 (en) | 2006-12-29 | 2008-07-17 | Prodea Systems, Inc. | System and method for providing network support services and premises gateway support infrastructure |
US7770136B2 (en) | 2007-01-24 | 2010-08-03 | Microsoft Corporation | Gesture recognition interactive feedback |
US7958104B2 (en) | 2007-03-08 | 2011-06-07 | O'donnell Shawn C | Context based data searching |
WO2008121700A1 (en) | 2007-03-29 | 2008-10-09 | Initiate Systems, Inc. | Method and system for managing entities |
US9794348B2 (en) | 2007-06-04 | 2017-10-17 | Todd R. Smith | Using voice commands from a mobile device to remotely access and control a computer |
US7970786B2 (en) * | 2007-06-13 | 2011-06-28 | The Boeing Company | Methods and systems for context based query formulation and information retrieval |
US8504349B2 (en) | 2007-06-18 | 2013-08-06 | Microsoft Corporation | Text prediction with partial selection in a variety of domains |
WO2009044296A2 (en) | 2007-06-26 | 2009-04-09 | Softlife Projects Limited Doing Business As Appli Ed Cytometry Systems | System and method for optimizing data analysis |
US8190627B2 (en) | 2007-06-28 | 2012-05-29 | Microsoft Corporation | Machine assisted query formulation |
US20090035733A1 (en) * | 2007-08-01 | 2009-02-05 | Shmuel Meitar | Device, system, and method of adaptive teaching and learning |
US8950001B2 (en) | 2007-08-01 | 2015-02-03 | Avaya Inc. | Continual peer authentication |
WO2009026159A1 (en) | 2007-08-17 | 2009-02-26 | Avi Oron | A system and method for automatically creating a media compilation |
US8494978B2 (en) | 2007-11-02 | 2013-07-23 | Ebay Inc. | Inferring user preferences from an internet based social interactive construct |
US20090119581A1 (en) | 2007-11-05 | 2009-05-07 | Verizon Data Services Inc. | Method and apparatus for providing auto-completion of information using strings |
US8019748B1 (en) | 2007-11-14 | 2011-09-13 | Google Inc. | Web search refinement |
US7991615B2 (en) | 2007-12-07 | 2011-08-02 | Microsoft Corporation | Grapheme-to-phoneme conversion using acoustic data |
US7953692B2 (en) | 2007-12-07 | 2011-05-31 | Microsoft Corporation | Predicting candidates using information sources |
US8413075B2 (en) | 2008-01-04 | 2013-04-02 | Apple Inc. | Gesture movies |
US11159909B2 (en) | 2008-02-05 | 2021-10-26 | Victor Thomas Anderson | Wireless location establishing device |
US20090228439A1 (en) | 2008-03-07 | 2009-09-10 | Microsoft Corporation | Intent-aware search |
US8082220B2 (en) | 2008-04-17 | 2011-12-20 | Elbit Systems Ltd. | Computing solutions to problems using dynamic association between abstract graphs |
US8219558B1 (en) | 2008-04-25 | 2012-07-10 | David Scott Trandal | Methods and systems for inventory management |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20090300525A1 (en) | 2008-05-27 | 2009-12-03 | Jolliff Maria Elena Romera | Method and system for automatically updating avatar to indicate user's status |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US20090326945A1 (en) | 2008-06-26 | 2009-12-31 | Nokia Corporation | Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system |
US8396282B1 (en) | 2008-10-31 | 2013-03-12 | Hrl Labortories, Llc | Method and system for computing fused saliency maps from multi-modal sensory inputs |
US8108214B2 (en) | 2008-11-19 | 2012-01-31 | Robert Bosch Gmbh | System and method for recognizing proper names in dialog systems |
US8140328B2 (en) | 2008-12-01 | 2012-03-20 | At&T Intellectual Property I, L.P. | User intention based on N-best list of recognition hypotheses for utterances in a dialog |
US8117036B2 (en) | 2008-12-03 | 2012-02-14 | At&T Intellectual Property I, L.P. | Non-disruptive side conversation information retrieval |
CN101465749B (zh) * | 2008-12-29 | 2011-05-11 | 武汉大学 | 基于Web Service组合的问答服务构建方法 |
US8397016B2 (en) | 2008-12-31 | 2013-03-12 | Violin Memory, Inc. | Efficient use of hybrid media in cache architectures |
US20100199320A1 (en) | 2009-02-02 | 2010-08-05 | Microsoft Corporation | Multimodal escalation to endpoints in enhanced communication systems |
US9210232B2 (en) * | 2009-02-26 | 2015-12-08 | Nokia Technologies Oy | Method and apparatus for adaptive media transfer |
US9123341B2 (en) | 2009-03-18 | 2015-09-01 | Robert Bosch Gmbh | System and method for multi-modal input synchronization and disambiguation |
CN102439544A (zh) | 2009-03-20 | 2012-05-02 | 谷歌股份有限公司 | 与输入法编辑器计算设备的交互 |
US20100241639A1 (en) | 2009-03-20 | 2010-09-23 | Yahoo! Inc. | Apparatus and methods for concept-centric information extraction |
US10042032B2 (en) | 2009-04-29 | 2018-08-07 | Amazon Technologies, Inc. | System and method for generating recommendations based on similarities between location information of multiple users |
US8504569B2 (en) | 2009-05-20 | 2013-08-06 | Genieo Innovation Ltd. | Apparatus and methods for providing answers to queries respective of a user based on user uniquifiers |
US20100306191A1 (en) | 2009-05-27 | 2010-12-02 | Lebeau Michael J | Computer Application Data In Search Results |
US20100306249A1 (en) | 2009-05-27 | 2010-12-02 | James Hill | Social network systems and methods |
US10424000B2 (en) | 2009-05-30 | 2019-09-24 | Edmond K. Chow | Methods and systems for annotation of digital information |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9610502B2 (en) | 2009-07-10 | 2017-04-04 | International Business Machines Corporation | Use of real time location information for user authentication and authorization in virtual environments |
CN101645797B (zh) | 2009-08-25 | 2011-04-13 | 华为技术有限公司 | 自动保护倒换方法、设备和系统 |
US20120179694A1 (en) | 2009-09-28 | 2012-07-12 | International Business Machines Corporation | Method and system for enhancing a search request |
US8312385B2 (en) | 2009-09-30 | 2012-11-13 | Palo Alto Research Center Incorporated | System and method for providing context-sensitive sidebar window display on an electronic desktop |
US9400548B2 (en) | 2009-10-19 | 2016-07-26 | Microsoft Technology Licensing, Llc | Gesture personalization and profile roaming |
US20110119216A1 (en) | 2009-11-16 | 2011-05-19 | Microsoft Corporation | Natural input trainer for gestural instruction |
US9400790B2 (en) | 2009-12-09 | 2016-07-26 | At&T Intellectual Property I, L.P. | Methods and systems for customized content services with unified messaging systems |
KR101622111B1 (ko) | 2009-12-11 | 2016-05-18 | 삼성전자 주식회사 | 대화 시스템 및 그의 대화 방법 |
US8171157B2 (en) | 2009-12-21 | 2012-05-01 | Microsoft Corporation | Distributing bandwidth across communication modalities |
EP3091535B1 (en) | 2009-12-23 | 2023-10-11 | Google LLC | Multi-modal input on an electronic device |
US20110153423A1 (en) | 2010-06-21 | 2011-06-23 | Jon Elvekrog | Method and system for creating user based summaries for content distribution |
US9019201B2 (en) | 2010-01-08 | 2015-04-28 | Microsoft Technology Licensing, Llc | Evolving universal gesture sets |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8478581B2 (en) * | 2010-01-25 | 2013-07-02 | Chung-ching Chen | Interlingua, interlingua engine, and interlingua machine translation system |
US20110184768A1 (en) | 2010-01-27 | 2011-07-28 | Norton Kenneth S | Automatically determine suggested meeting locations based on previously booked calendar events |
KR101477530B1 (ko) | 2010-03-12 | 2014-12-30 | 뉘앙스 커뮤니케이션즈, 인코포레이티드 | 이동 전화의 터치 스크린과 함께 사용하기 위한 다중 모드 문자 입력 시스템 |
US8468201B2 (en) | 2010-03-23 | 2013-06-18 | Google Inc. | Organizing social activity information on a site |
US20110246383A1 (en) | 2010-03-30 | 2011-10-06 | Microsoft Corporation | Summary presentation of media consumption |
US8732208B2 (en) | 2010-04-19 | 2014-05-20 | Facebook, Inc. | Structured search queries based on social-graph information |
US8782080B2 (en) | 2010-04-19 | 2014-07-15 | Facebook, Inc. | Detecting social graph elements for structured search queries |
US9098808B1 (en) | 2010-04-22 | 2015-08-04 | Google Inc. | Social search engine |
US20110264522A1 (en) * | 2010-04-26 | 2011-10-27 | Webjuice, LLC | Direct targeting of advertisements to social connections in a social network environment |
FR2959333B1 (fr) * | 2010-04-27 | 2014-05-23 | Alcatel Lucent | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne |
WO2011149558A2 (en) | 2010-05-28 | 2011-12-01 | Abelow Daniel H | Reality alternate |
US8560562B2 (en) | 2010-07-22 | 2013-10-15 | Google Inc. | Predictive query suggestion caching |
US20120101806A1 (en) | 2010-07-27 | 2012-04-26 | Davis Frederic E | Semantically generating personalized recommendations based on social feeds to a user in real-time and display methods thereof |
US8521661B2 (en) | 2010-08-16 | 2013-08-27 | Facebook, Inc. | Suggesting connections to a user based on an expected value of the suggestion to the social networking system |
US8532994B2 (en) * | 2010-08-27 | 2013-09-10 | Cisco Technology, Inc. | Speech recognition using a personal vocabulary and language model |
WO2012030838A1 (en) | 2010-08-30 | 2012-03-08 | Honda Motor Co., Ltd. | Belief tracking and action selection in spoken dialog systems |
US8560554B2 (en) | 2010-09-23 | 2013-10-15 | Salesforce.Com, Inc. | Methods and apparatus for selecting updates to associated records to publish on an information feed using importance weights in an on-demand database service environment |
EP2622592A4 (en) | 2010-09-28 | 2017-04-05 | International Business Machines Corporation | Providing answers to questions using multiple models to score candidate answers |
EP2622428A4 (en) | 2010-09-28 | 2017-01-04 | International Business Machines Corporation | Providing answers to questions using hypothesis pruning |
US9052800B2 (en) | 2010-10-01 | 2015-06-09 | Z124 | User interface with stacked application management |
US20120101865A1 (en) * | 2010-10-22 | 2012-04-26 | Slava Zhakov | System for Rating Agents and Customers for Use in Profile Compatibility Routing |
US8788434B2 (en) | 2010-10-28 | 2014-07-22 | Google Inc. | Search with joint image-audio queries |
US9348417B2 (en) | 2010-11-01 | 2016-05-24 | Microsoft Technology Licensing, Llc | Multimodal input system |
US20120117051A1 (en) | 2010-11-05 | 2012-05-10 | Microsoft Corporation | Multi-modal approach to search query input |
US8995981B1 (en) | 2010-12-13 | 2015-03-31 | Csr Technology Inc. | Systems and methods for remote control adaptive configuration |
US9311678B2 (en) | 2010-12-15 | 2016-04-12 | Facebook, Inc. | Comment plug-in for third party system |
KR101738641B1 (ko) | 2010-12-17 | 2017-05-23 | 삼성전자주식회사 | 멀티 코어 시스템의 프로그램 컴파일 장치 및 방법 |
CA2821578C (en) | 2010-12-21 | 2016-03-22 | Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. | Silicon photoelectric multiplier with optical cross-talk suppression due to special properties of the substrate |
US20120179481A1 (en) | 2011-01-10 | 2012-07-12 | Medimpact Healthcare Systems, Inc. | Recommending Prescription Information |
US8620836B2 (en) | 2011-01-10 | 2013-12-31 | Accenture Global Services Limited | Preprocessing of text |
US8504492B2 (en) | 2011-01-10 | 2013-08-06 | Accenture Global Services Limited | Identification of attributes and values using multiple classifiers |
US20120205436A1 (en) | 2011-02-16 | 2012-08-16 | Augme Technologies, Inc. | System for enhanced barcode decoding and image recognition and method therefor |
WO2012116236A2 (en) | 2011-02-23 | 2012-08-30 | Nova Spivack | System and method for analyzing messages in a network or across networks |
US9081760B2 (en) | 2011-03-08 | 2015-07-14 | At&T Intellectual Property I, L.P. | System and method for building diverse language models |
US8566321B2 (en) | 2011-03-11 | 2013-10-22 | Amco Llc | Relativistic concept measuring system for data clustering |
US20120246191A1 (en) | 2011-03-24 | 2012-09-27 | True Xiong | World-Wide Video Context Sharing |
US9116995B2 (en) | 2011-03-30 | 2015-08-25 | Vcvc Iii Llc | Cluster-based identification of news stories |
US20120265784A1 (en) | 2011-04-15 | 2012-10-18 | Microsoft Corporation | Ordering semantic query formulation suggestions |
US11068954B2 (en) | 2015-11-20 | 2021-07-20 | Voicemonk Inc | System for virtual agents to help customers and businesses |
US9229905B1 (en) | 2011-04-22 | 2016-01-05 | Angel A. Penilla | Methods and systems for defining vehicle user profiles and managing user profiles via cloud systems and applying learned settings to user profiles |
EP2523149B1 (en) | 2011-05-11 | 2023-01-11 | Tata Consultancy Services Ltd. | A method and system for association and decision fusion of multimodal inputs |
US8983501B2 (en) | 2011-05-11 | 2015-03-17 | Microsoft Technology Licensing, Llc | Proximity-based task notification |
US8676937B2 (en) | 2011-05-12 | 2014-03-18 | Jeffrey Alan Rapaport | Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging |
US20120297294A1 (en) | 2011-05-17 | 2012-11-22 | Microsoft Corporation | Network search for writing assistance |
US9443011B2 (en) | 2011-05-18 | 2016-09-13 | Microsoft Technology Licensing, Llc | Searching for images by video |
CA2741212C (en) | 2011-05-27 | 2020-12-08 | Ibm Canada Limited - Ibm Canada Limitee | Automated self-service user support based on ontology analysis |
US9398347B2 (en) | 2011-05-30 | 2016-07-19 | Sandvine Incorporated Ulc | Systems and methods for measuring quality of experience for media streaming |
US8868654B2 (en) | 2011-06-06 | 2014-10-21 | Microsoft Corporation | Privacy-preserving matching service |
US8589407B2 (en) | 2011-06-17 | 2013-11-19 | Google Inc. | Automated generation of suggestions for personalized reactions in a social network |
US20120324367A1 (en) | 2011-06-20 | 2012-12-20 | Primal Fusion Inc. | System and method for obtaining preferences with a user interface |
US20130031106A1 (en) | 2011-07-29 | 2013-01-31 | Microsoft Corporation | Social network powered query suggestions |
US8768863B2 (en) | 2011-07-29 | 2014-07-01 | Facebook, Inc. | Adaptive ranking of news feed in social networking systems |
US9015031B2 (en) | 2011-08-04 | 2015-04-21 | International Business Machines Corporation | Predicting lexical answer types in open domain question and answering (QA) systems |
US20130054631A1 (en) | 2011-08-30 | 2013-02-28 | Microsoft Corporation | Adding social network data to search suggestions |
US10120877B2 (en) | 2011-09-15 | 2018-11-06 | Stephan HEATH | Broad and alternative category clustering of the same, similar or different categories in social/geo/promo link promotional data sets for end user display of interactive ad links, coupons, mobile coupons, promotions and sale of products, goods and services integrated with 3D spatial geomapping and mobile mapping and social networking |
US10127563B2 (en) | 2011-09-15 | 2018-11-13 | Stephan HEATH | System and method for providing sports and sporting events related social/geo/promo link promotional data sets for end user display of interactive ad links, promotions and sale of products, goods, gambling and/or services integrated with 3D spatial geomapping, company and local information for selected worldwide locations and social networking |
US10096033B2 (en) | 2011-09-15 | 2018-10-09 | Stephan HEATH | System and method for providing educational related social/geo/promo link promotional data sets for end user display of interactive ad links, promotions and sale of products, goods, and/or services integrated with 3D spatial geomapping, company and local information for selected worldwide locations and social networking |
US10217117B2 (en) | 2011-09-15 | 2019-02-26 | Stephan HEATH | System and method for social networking interactions using online consumer browsing behavior, buying patterns, advertisements and affiliate advertising, for promotions, online coupons, mobile services, products, goods and services, entertainment and auctions, with geospatial mapping technology |
US8966602B2 (en) | 2011-11-07 | 2015-02-24 | Facebook, Inc. | Identity verification and authentication |
US9154739B1 (en) | 2011-11-30 | 2015-10-06 | Google Inc. | Physical training assistant system |
US20170235360A1 (en) | 2012-01-04 | 2017-08-17 | Tobii Ab | System for gaze interaction |
US10223710B2 (en) | 2013-01-04 | 2019-03-05 | Visa International Service Association | Wearable intelligent vision device apparatuses, methods and systems |
US9177291B2 (en) | 2012-01-11 | 2015-11-03 | Facebook, Inc. | Chaining connection requests |
US20130204813A1 (en) | 2012-01-20 | 2013-08-08 | Fluential, Llc | Self-learning, context aware virtual assistants, systems and methods |
US20130191250A1 (en) | 2012-01-23 | 2013-07-25 | Augme Technologies, Inc. | System and method for augmented reality using multi-modal sensory recognition from artifacts of interest |
US20160372116A1 (en) | 2012-01-24 | 2016-12-22 | Auraya Pty Ltd | Voice authentication and speech recognition system and method |
US9052819B2 (en) | 2012-01-25 | 2015-06-09 | Honeywell International Inc. | Intelligent gesture-based user's instantaneous interaction and task requirements recognition system and method |
US8791913B2 (en) | 2012-01-26 | 2014-07-29 | Honeywell International Inc. | Adaptive gesture recognition system and method for unstable work environments |
AU2013214801B2 (en) * | 2012-02-02 | 2018-06-21 | Visa International Service Association | Multi-source, multi-dimensional, cross-entity, multimedia database platform apparatuses, methods and systems |
US9418658B1 (en) | 2012-02-08 | 2016-08-16 | Amazon Technologies, Inc. | Configuration of voice controlled assistant |
WO2013126905A2 (en) | 2012-02-24 | 2013-08-29 | Moscarillo Thomas J | Gesture recognition devices and methods |
US20130226892A1 (en) | 2012-02-29 | 2013-08-29 | Fluential, Llc | Multimodal natural language interface for faceted search |
US20130238332A1 (en) | 2012-03-06 | 2013-09-12 | Apple Inc. | Automatic input signal recognition using location based language modeling |
EP2637128B1 (en) | 2012-03-06 | 2018-01-17 | beyo GmbH | Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device |
US9117249B2 (en) * | 2012-03-15 | 2015-08-25 | Facebook, Inc. | Selectively providing content on a social networking system |
US20130254139A1 (en) | 2012-03-21 | 2013-09-26 | Xiaoguang Lei | Systems and methods for building a universal intelligent assistant with learning capabilities |
US9026145B1 (en) | 2012-03-23 | 2015-05-05 | Google Inc. | Systems and methods for mapping IP-addresses to geolocations |
US10235346B2 (en) | 2012-04-06 | 2019-03-19 | Hmbay Patents Llc | Method and apparatus for inbound message summarization using message clustering and message placeholders |
JP6024167B2 (ja) | 2012-04-09 | 2016-11-09 | 株式会社リコー | 要求処理システム |
US8996539B2 (en) | 2012-04-13 | 2015-03-31 | Microsoft Technology Licensing, Llc | Composing text and structured databases |
WO2013160904A1 (en) | 2012-04-23 | 2013-10-31 | Hewlett-Packard Development Company L.P. | Influence scores for social media profiles |
US10325323B2 (en) * | 2012-04-24 | 2019-06-18 | Facebook, Inc. | Providing a claims-based profile in a social networking system |
US8676579B2 (en) | 2012-04-30 | 2014-03-18 | Blackberry Limited | Dual microphone voice authentication for mobile device |
US8719179B2 (en) * | 2012-04-30 | 2014-05-06 | Gild, Inc. | Recruiting service graphical user interface |
US9086732B2 (en) | 2012-05-03 | 2015-07-21 | Wms Gaming Inc. | Gesture fusion |
WO2013170383A1 (en) | 2012-05-16 | 2013-11-21 | Xtreme Interactions Inc. | System, device and method for processing interlaced multimodal user input |
KR20130128716A (ko) | 2012-05-17 | 2013-11-27 | 포항공과대학교 산학협력단 | 어학 학습 시스템 및 학습 방법 |
US8868592B1 (en) | 2012-05-18 | 2014-10-21 | Google Inc. | Providing customized autocomplete data |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
US9135751B2 (en) * | 2012-06-05 | 2015-09-15 | Apple Inc. | Displaying location preview |
US9299059B1 (en) | 2012-06-07 | 2016-03-29 | Google Inc. | Generating a summary of social media content |
US9043205B2 (en) | 2012-06-21 | 2015-05-26 | Google Inc. | Dynamic language model |
US9374396B2 (en) | 2012-06-24 | 2016-06-21 | Google Inc. | Recommended content for an endorsement user interface |
WO2014001908A1 (en) | 2012-06-29 | 2014-01-03 | Thomson Licensing | A system and method for recommending items in a social network |
US9576325B2 (en) | 2012-07-09 | 2017-02-21 | Facebook, Inc. | Recommending additional users for an event using a social networking system |
US9747895B1 (en) | 2012-07-10 | 2017-08-29 | Google Inc. | Building language models for a user in a social network from linguistic information |
US9424233B2 (en) * | 2012-07-20 | 2016-08-23 | Veveo, Inc. | Method of and system for inferring user intent in search input in a conversational interaction system |
US20140025702A1 (en) | 2012-07-23 | 2014-01-23 | Michael Curtiss | Filtering Structured Search Queries Based on Privacy Settings |
US20140032659A1 (en) | 2012-07-27 | 2014-01-30 | BranchOut, Inc. | Facilitating communications between users of multiple social networks |
US9799328B2 (en) | 2012-08-03 | 2017-10-24 | Veveo, Inc. | Method for using pauses detected in speech input to assist in interpreting the input during conversational interaction for information retrieval |
US9699485B2 (en) | 2012-08-31 | 2017-07-04 | Facebook, Inc. | Sharing television and video programming through social networking |
KR101350712B1 (ko) | 2012-08-24 | 2014-01-14 | 주식회사 트라이패스 | 온라인 콘텐츠 공유 서비스 제공 서버, 제공 방법 및 그 방법을 위한 기록매체 |
US9461876B2 (en) | 2012-08-29 | 2016-10-04 | Loci | System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9037592B2 (en) | 2012-09-12 | 2015-05-19 | Flipboard, Inc. | Generating an implied object graph based on user behavior |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9406103B1 (en) | 2012-09-26 | 2016-08-02 | Amazon Technologies, Inc. | Inline message alert |
US10096316B2 (en) | 2013-11-27 | 2018-10-09 | Sri International | Sharing intents to provide virtual assistance in a multi-person dialog |
US9625994B2 (en) | 2012-10-01 | 2017-04-18 | Microsoft Technology Licensing, Llc | Multi-camera depth imaging |
US10031968B2 (en) | 2012-10-11 | 2018-07-24 | Veveo, Inc. | Method for adaptive conversation state management with filtering operators applied dynamically as part of a conversational interface |
US9299060B2 (en) | 2012-10-12 | 2016-03-29 | Google Inc. | Automatically suggesting groups based on past user interaction |
US20140108307A1 (en) | 2012-10-12 | 2014-04-17 | Wipro Limited | Methods and systems for providing personalized and context-aware suggestions |
US8914751B2 (en) | 2012-10-16 | 2014-12-16 | Google Inc. | Character deletion during keyboard gesture |
US8843845B2 (en) | 2012-10-16 | 2014-09-23 | Google Inc. | Multi-gesture text input prediction |
US9361167B2 (en) | 2012-10-24 | 2016-06-07 | SanDisk Technologies, Inc. | Bit error rate estimation for wear leveling and for block selection based on data type |
US10146316B2 (en) | 2012-10-31 | 2018-12-04 | Nokia Technologies Oy | Method and apparatus for disambiguating a plurality of targets |
US9264391B2 (en) | 2012-11-01 | 2016-02-16 | Salesforce.Com, Inc. | Computer implemented methods and apparatus for providing near real-time predicted engagement level feedback to a user composing a social media message |
US20140129266A1 (en) | 2012-11-06 | 2014-05-08 | Utix Social Ticketing, Llc | Social interactive ticketing system |
US9671874B2 (en) | 2012-11-08 | 2017-06-06 | Cuesta Technology Holdings, Llc | Systems and methods for extensions to alternative control of touch-based devices |
US8819820B2 (en) | 2012-11-19 | 2014-08-26 | International Business Machines Corporation | Security capability reference model for goal-based gap analysis |
WO2014142702A1 (en) | 2013-03-15 | 2014-09-18 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Selective speech recognition for chat and digital personal assistant systems |
US20140164506A1 (en) | 2012-12-10 | 2014-06-12 | Rawllin International Inc. | Multimedia message having portions of networked media content |
JP2014134923A (ja) | 2013-01-09 | 2014-07-24 | Sony Corp | 情報処理装置、情報処理方法、プログラム及び端末装置 |
US10356135B2 (en) | 2013-01-22 | 2019-07-16 | Facebook, Inc. | Categorizing stories in a social networking system news feed |
US9368113B2 (en) | 2013-01-30 | 2016-06-14 | Google Inc. | Voice activated features on multi-level voice menu |
CN103971686B (zh) | 2013-01-30 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 自动语音识别方法和系统 |
US9292492B2 (en) | 2013-02-04 | 2016-03-22 | Microsoft Technology Licensing, Llc | Scaling statistical language understanding systems across domains and intents |
US9311913B2 (en) | 2013-02-05 | 2016-04-12 | Nuance Communications, Inc. | Accuracy of text-to-speech synthesis |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9159116B2 (en) | 2013-02-13 | 2015-10-13 | Google Inc. | Adaptive screen interfaces based on viewing distance |
US10136175B2 (en) | 2013-02-22 | 2018-11-20 | Facebook, Inc. | Determining user subscriptions |
US9172747B2 (en) | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
US20140280017A1 (en) | 2013-03-12 | 2014-09-18 | Microsoft Corporation | Aggregations for trending topic summarization |
US20140282956A1 (en) | 2013-03-12 | 2014-09-18 | Sony Corporation | System and method for user authentication |
US20140278786A1 (en) * | 2013-03-14 | 2014-09-18 | Twain Liu-Qiu-Yan | System and method to survey and evaluate items according to people's perceptions and to generate recommendations based on people's perceptions |
US20140280001A1 (en) | 2013-03-14 | 2014-09-18 | GearSay, Inc. | Systems and methods for organizing, presenting, and retrieving information about items of interest in a social network of interests |
US9659577B1 (en) | 2013-03-14 | 2017-05-23 | Amazon Technologies, Inc. | Voice controlled assistant with integrated control knob |
US9104982B2 (en) | 2013-03-15 | 2015-08-11 | Google Inc. | Prevention of invalid selections based on machine learning of user-specific latency |
US10204026B2 (en) | 2013-03-15 | 2019-02-12 | Uda, Llc | Realtime data stream cluster summarization and labeling system |
WO2014144869A1 (en) | 2013-03-15 | 2014-09-18 | Lehrer David | System and method for providing a semi-automated research tool |
US9294583B1 (en) | 2013-03-15 | 2016-03-22 | Google Inc. | Updating event posts |
US9639608B2 (en) | 2013-03-15 | 2017-05-02 | Daniel Freeman | Comprehensive user/event matching or recommendations based on awareness of entities, activities, interests, desires, location |
US9760262B2 (en) | 2013-03-15 | 2017-09-12 | Microsoft Technology Licensing, Llc | Gestures involving direct interaction with a data visualization |
US10220303B1 (en) | 2013-03-15 | 2019-03-05 | Harmonix Music Systems, Inc. | Gesture-based music game |
US10692096B2 (en) | 2013-03-15 | 2020-06-23 | Thermodynamic Design, Llc | Customizable data management system |
US10599697B2 (en) | 2013-03-15 | 2020-03-24 | Uda, Llc | Automatic topic discovery in streams of unstructured data |
EP2817170A4 (en) | 2013-04-15 | 2015-11-04 | ACCESS TO USER PROFILES STORED IN THE FORM OF MODELS AND PORTABILITY OF THESE USER PROFILES | |
WO2014172299A1 (en) | 2013-04-15 | 2014-10-23 | Chacha Search, Inc. | Method and system of increasing user interaction |
US9507718B2 (en) | 2013-04-16 | 2016-11-29 | Facebook, Inc. | Intelligent caching |
US9286528B2 (en) | 2013-04-16 | 2016-03-15 | Imageware Systems, Inc. | Multi-modal biometric database searching methods |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
US20140330832A1 (en) * | 2013-05-05 | 2014-11-06 | My Ideal World, Inc. | Universal Idea Capture and Value Creation Apparatuses, Methods and Systems |
US9223898B2 (en) | 2013-05-08 | 2015-12-29 | Facebook, Inc. | Filtering suggested structured queries on online social networks |
CN103294195A (zh) | 2013-05-09 | 2013-09-11 | 深圳Tcl新技术有限公司 | 基于手势识别的遥控装置及其方法 |
US10621274B2 (en) | 2013-05-23 | 2020-04-14 | Flipboard, Inc. | Dynamic arrangement of content presented while a client device is in a locked state |
US9396724B2 (en) | 2013-05-29 | 2016-07-19 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for building a language model |
US9396433B2 (en) | 2013-05-29 | 2016-07-19 | International Business Machines Corporation | Determining related data points from multi-modal inputs |
US10170114B2 (en) | 2013-05-30 | 2019-01-01 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
GB2514603B (en) | 2013-05-30 | 2020-09-23 | Tobii Ab | Gaze-controlled user interface with multimodal input |
CN104216913B (zh) | 2013-06-04 | 2019-01-04 | Sap欧洲公司 | 问题回答方法、系统和计算机可读介质 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9712577B2 (en) * | 2013-06-09 | 2017-07-18 | Apple Inc. | Device, method, and graphical user interface for sharing content from a respective application |
US9472206B2 (en) | 2013-06-17 | 2016-10-18 | Google Technology Holdings LLC | Privacy mode for always-on voice-activated information assistant |
US9236052B2 (en) | 2013-06-20 | 2016-01-12 | Bank Of America Corporation | Utilizing voice biometrics |
EP2816511A1 (en) | 2013-06-21 | 2014-12-24 | Thomson Licensing | Method for cold start of a multi-armed bandit in a recommender system |
US20150006286A1 (en) | 2013-06-28 | 2015-01-01 | Linkedin Corporation | Targeting users based on categorical content interactions |
US20150012524A1 (en) | 2013-07-02 | 2015-01-08 | Google Inc. | Using models for triggering personal search |
US9881077B1 (en) | 2013-08-08 | 2018-01-30 | Google Llc | Relevance determination and summary generation for news objects |
US9367806B1 (en) | 2013-08-08 | 2016-06-14 | Jasmin Cosic | Systems and methods of using an artificially intelligent database management system and interfaces for mobile, embedded, and other computing devices |
US9448962B2 (en) | 2013-08-09 | 2016-09-20 | Facebook, Inc. | User experience/user interface based on interaction history |
US9161188B2 (en) | 2013-08-22 | 2015-10-13 | Yahoo! Inc. | System and method for automatically suggesting diverse and personalized message completions |
US10109273B1 (en) | 2013-08-29 | 2018-10-23 | Amazon Technologies, Inc. | Efficient generation of personalized spoken language understanding models |
US9244522B2 (en) * | 2013-08-30 | 2016-01-26 | Linkedin Corporation | Guided browsing experience |
US9338242B1 (en) | 2013-09-09 | 2016-05-10 | Amazon Technologies, Inc. | Processes for generating content sharing recommendations |
US9582737B2 (en) | 2013-09-13 | 2017-02-28 | Qualcomm Incorporated | Context-sensitive gesture classification |
US20170132688A1 (en) | 2013-09-13 | 2017-05-11 | Google Inc. | Pricing product recommendations in a social network |
US9953079B2 (en) | 2013-09-17 | 2018-04-24 | International Business Machines Corporation | Preference based system and method for multiple feed aggregation and presentation |
US20150081321A1 (en) | 2013-09-18 | 2015-03-19 | Mobile Insights, Inc. | Methods and systems of providing prescription reminders |
US9824321B2 (en) | 2013-09-20 | 2017-11-21 | Infosys Limited | System and method for categorization of social media conversation for response management |
US10134395B2 (en) | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
US20150088665A1 (en) | 2013-09-26 | 2015-03-26 | Aol Advertising Inc. | Computerized systems and methods related to controlled content optimization |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9318109B2 (en) | 2013-10-02 | 2016-04-19 | Microsoft Technology Licensing, Llc | Techniques for updating a partial dialog state |
US9436918B2 (en) | 2013-10-07 | 2016-09-06 | Microsoft Technology Licensing, Llc | Smart selection of text spans |
US9195436B2 (en) | 2013-10-14 | 2015-11-24 | Microsoft Technology Licensing, Llc | Parallel dynamic programming through rank convergence |
JP5613314B1 (ja) | 2013-11-14 | 2014-10-22 | Jfeシステムズ株式会社 | ジェスチャー検出装置、ジェスチャー検出プログラム、ジェスチャー認識装置およびジェスチャー認識プログラム |
US9189742B2 (en) | 2013-11-20 | 2015-11-17 | Justin London | Adaptive virtual intelligent agent |
US10162813B2 (en) | 2013-11-21 | 2018-12-25 | Microsoft Technology Licensing, Llc | Dialogue evaluation via multiple hypothesis ranking |
US9110635B2 (en) | 2013-12-03 | 2015-08-18 | Lenova (Singapore) Pte. Ltd. | Initiating personal assistant application based on eye tracking and gestures |
US20150169744A1 (en) | 2013-12-12 | 2015-06-18 | Flipboard, Inc. | Selecting Diverse, Relevant Content From Multiple Content Feeds |
US9479931B2 (en) | 2013-12-16 | 2016-10-25 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US9804820B2 (en) | 2013-12-16 | 2017-10-31 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US20150169285A1 (en) * | 2013-12-18 | 2015-06-18 | Microsoft Corporation | Intent-based user experience |
US9367629B2 (en) | 2013-12-19 | 2016-06-14 | Facebook, Inc. | Grouping recommended search queries on online social networks |
US10181322B2 (en) | 2013-12-20 | 2019-01-15 | Microsoft Technology Licensing, Llc | Multi-user, multi-domain dialog system |
US10811013B1 (en) | 2013-12-20 | 2020-10-20 | Amazon Technologies, Inc. | Intent-specific automatic speech recognition result generation |
CN106462909B (zh) * | 2013-12-20 | 2020-07-10 | 罗伯特·博世有限公司 | 用于启用对话的上下文相关的和以用户为中心的内容呈现的系统和方法 |
WO2015100362A1 (en) | 2013-12-23 | 2015-07-02 | 24/7 Customer, Inc. | Systems and methods for facilitating dialogue mining |
US9536522B1 (en) * | 2013-12-30 | 2017-01-03 | Google Inc. | Training a natural language processing model with information retrieval model annotations |
US9424247B1 (en) | 2013-12-31 | 2016-08-23 | Google Inc. | Associating one or more terms in a message trail with a task entry |
US9823811B2 (en) | 2013-12-31 | 2017-11-21 | Next It Corporation | Virtual assistant team identification |
US20150185827A1 (en) | 2013-12-31 | 2015-07-02 | Linkedln Corporation | Techniques for performing social interactions with content |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
RU2665239C2 (ru) | 2014-01-15 | 2018-08-28 | Общество с ограниченной ответственностью "Аби Продакшн" | Автоматическое извлечение именованных сущностей из текста |
US20150207765A1 (en) | 2014-01-17 | 2015-07-23 | Nathaniel Brantingham | Messaging Service with Conversation Suggestions |
US9336300B2 (en) | 2014-01-17 | 2016-05-10 | Facebook, Inc. | Client-side search templates for online social networks |
CN103731274B (zh) | 2014-01-20 | 2016-09-28 | 飞天诚信科技股份有限公司 | 一种识别音频设备的方法 |
US20150220888A1 (en) | 2014-02-06 | 2015-08-06 | Zeeplanner Llc | System and method of scheduling meetings, appointments and events using multiple identities |
US9837075B2 (en) | 2014-02-10 | 2017-12-05 | Mitsubishi Electric Research Laboratories, Inc. | Statistical voice dialog system and method |
US10467302B2 (en) | 2014-02-11 | 2019-11-05 | International Business Machines Corporation | Candidate answers for speculative questions in a deep question answering system |
US10049334B2 (en) | 2014-02-24 | 2018-08-14 | International Business Machines Corporation | Providing support to human decision making |
US20150242525A1 (en) | 2014-02-26 | 2015-08-27 | Pixured, Inc. | System for referring to and/or embedding posts within other post and posts within any part of another post |
US20160070449A1 (en) | 2014-03-13 | 2016-03-10 | Thermodynamic Design, Llc | Customizable data management system |
JP6460636B2 (ja) * | 2014-03-28 | 2019-01-30 | キヤノンメディカルシステムズ株式会社 | 読影レポート作成装置、読影レポート作成システムおよび読影レポート作成プログラム |
WO2015153474A1 (en) | 2014-03-31 | 2015-10-08 | Monticello Enterprises LLC | System and method for providing a single input field having multiple processing possibilities |
US10002396B2 (en) | 2014-03-31 | 2018-06-19 | Monticello Enterprises LLC | System and method for transitioning from a first site to a second site |
US9754210B2 (en) | 2014-04-01 | 2017-09-05 | Microsoft Technology Licensing, Llc | User interests facilitated by a knowledge base |
US9892208B2 (en) | 2014-04-02 | 2018-02-13 | Microsoft Technology Licensing, Llc | Entity and attribute resolution in conversational applications |
US9253511B2 (en) | 2014-04-14 | 2016-02-02 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for performing multi-modal video datastream segmentation |
US10585762B2 (en) * | 2014-04-29 | 2020-03-10 | Hewlett Packard Enterprise Development Lp | Maintaining files in a retained file system |
US10191999B2 (en) | 2014-04-30 | 2019-01-29 | Microsoft Technology Licensing, Llc | Transferring information across language understanding model domains |
US9679558B2 (en) * | 2014-05-15 | 2017-06-13 | Microsoft Technology Licensing, Llc | Language modeling for conversational understanding domains using semantic web resources |
US20150331853A1 (en) | 2014-05-15 | 2015-11-19 | Marco Palmonari | Automated multi-grammar language processing system to optimize request handling in contact centers |
US9997157B2 (en) | 2014-05-16 | 2018-06-12 | Microsoft Technology Licensing, Llc | Knowledge source personalization to improve language models |
US10216841B2 (en) | 2014-05-22 | 2019-02-26 | Pixured, Inc. | System for referring to and/or embedding posts, videos or digital media within other posts, videos or digital media and posts within any part of another posts, videos or digital media |
CN104023247B (zh) | 2014-05-29 | 2015-07-29 | 腾讯科技(深圳)有限公司 | 获取、推送信息的方法和装置以及信息交互系统 |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9690771B2 (en) | 2014-05-30 | 2017-06-27 | Nuance Communications, Inc. | Automated quality assurance checks for improving the construction of natural language understanding systems |
US9589563B2 (en) | 2014-06-02 | 2017-03-07 | Robert Bosch Gmbh | Speech recognition of partial proper names by natural language processing |
US9607098B2 (en) | 2014-06-02 | 2017-03-28 | Wal-Mart Stores, Inc. | Determination of product attributes and values using a product entity graph |
US10108608B2 (en) | 2014-06-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Dialog state tracking using web-style ranking and multiple language understanding engines |
US9354709B1 (en) | 2014-06-17 | 2016-05-31 | Amazon Technologies, Inc. | Tilt gesture detection |
US10210261B2 (en) | 2014-06-18 | 2019-02-19 | Facebook, Inc. | Ranking and filtering groups recommendations |
US20150373565A1 (en) | 2014-06-20 | 2015-12-24 | Samsung Electronics Co., Ltd. | Quality of experience within a context-aware computing environment |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US10339465B2 (en) | 2014-06-30 | 2019-07-02 | Amazon Technologies, Inc. | Optimized decision tree based models |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9703952B2 (en) | 2014-07-07 | 2017-07-11 | University Of Ontario Institute Of Technology | Device and method for providing intent-based access control |
US10139987B2 (en) | 2014-07-18 | 2018-11-27 | Google Llc | Automated group recommendation |
US10120955B2 (en) | 2014-07-18 | 2018-11-06 | Nuance Communications, Inc. | State tracking over machine-learned relational trees in a dialog system |
WO2016016752A1 (en) | 2014-07-27 | 2016-02-04 | Yogesh Chunilal Rathod | User to user live micro-channels for posting and viewing contextual live contents in real-time |
EP2980733A1 (en) | 2014-07-31 | 2016-02-03 | Samsung Electronics Co., Ltd | Message service providing device and method of providing content via the same |
US10140517B2 (en) | 2014-08-06 | 2018-11-27 | Dropbox, Inc. | Event-based image classification and scoring |
US10127316B2 (en) | 2014-08-08 | 2018-11-13 | Facebook, Inc. | Identifying and processing recommendation requests |
US9396483B2 (en) | 2014-08-28 | 2016-07-19 | Jehan Hamedi | Systems and methods for determining recommended aspects of future content, actions, or behavior |
US10878453B2 (en) | 2014-08-29 | 2020-12-29 | Michael Pesochinsky | Apparatus, system and method for a commercial content provider controller for controlling ad content provided with Web page and search results |
US10255365B2 (en) | 2014-08-29 | 2019-04-09 | Facebook, Inc. | Priming search results on online social networks |
US9508341B1 (en) | 2014-09-03 | 2016-11-29 | Amazon Technologies, Inc. | Active learning for lexical annotations |
US9189514B1 (en) | 2014-09-04 | 2015-11-17 | Lucas J. Myslinski | Optimized fact checking method and system |
US20160092160A1 (en) * | 2014-09-26 | 2016-03-31 | Intel Corporation | User adaptive interfaces |
US10672391B2 (en) | 2014-09-26 | 2020-06-02 | Nuance Communications, Inc. | Improving automatic speech recognition of multilingual named entities |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
KR102035400B1 (ko) | 2014-09-30 | 2019-10-22 | 이베이 인크. | 자동완성 검색 결과에 대한 시간적 요구를 식별하는 기법 |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
KR101616914B1 (ko) | 2014-10-06 | 2016-04-29 | 전자부품연구원 | 사용자 맞춤형 콘텐츠 적응 객체 구성 방법, 이를 수행하는 사용자 맞춤형 콘텐츠 적응 객체 구성 서버 및 이를 저장하는 기록매체 |
US20160110381A1 (en) | 2014-10-17 | 2016-04-21 | Fuji Xerox Co., Ltd. | Methods and systems for social media-based profiling of entity location by associating entities and venues with geo-tagged short electronic messages |
US10540347B2 (en) | 2014-10-27 | 2020-01-21 | Nuance Communications, Inc. | Contextual search disambiguation |
US10587541B2 (en) | 2014-12-02 | 2020-03-10 | Facebook, Inc. | Device, method, and graphical user interface for lightweight messaging |
US10924444B2 (en) | 2014-12-02 | 2021-02-16 | Facebook, Inc. | Device, method, and graphical user interface for managing customer relationships using a lightweight messaging platform |
US9466297B2 (en) | 2014-12-09 | 2016-10-11 | Microsoft Technology Licensing, Llc | Communication system |
US10176228B2 (en) | 2014-12-10 | 2019-01-08 | International Business Machines Corporation | Identification and evaluation of lexical answer type conditions in a question to generate correct answers |
CN111427534B (zh) | 2014-12-11 | 2023-07-25 | 微软技术许可有限责任公司 | 能够实现可动作的消息传送的虚拟助理系统 |
US10366127B2 (en) | 2014-12-29 | 2019-07-30 | Samsung Electronics Co., Ltd. | Device-specific search results |
US20160188671A1 (en) * | 2014-12-29 | 2016-06-30 | Facebook, Inc. | Methods and Systems for Recommending Applications |
US9836452B2 (en) * | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
US10061855B2 (en) | 2014-12-31 | 2018-08-28 | Facebook, Inc. | User-specific pronunciations in a social networking system |
US20160196490A1 (en) | 2015-01-02 | 2016-07-07 | International Business Machines Corporation | Method for Recommending Content to Ingest as Corpora Based on Interaction History in Natural Language Question and Answering Systems |
EP3875981A3 (en) * | 2015-01-05 | 2022-04-20 | LocatorX, Inc. | Global resource locator |
US9959129B2 (en) | 2015-01-09 | 2018-05-01 | Microsoft Technology Licensing, Llc | Headless task completion within digital personal assistants |
US20160203238A1 (en) | 2015-01-09 | 2016-07-14 | Facebook, Inc. | Suggested Keywords for Searching News-Related Content on Online Social Networks |
US10719786B1 (en) | 2015-01-09 | 2020-07-21 | Facebook, Inc. | Event ticketing in online social networks |
US10050868B2 (en) | 2015-01-16 | 2018-08-14 | Sri International | Multimodal help agent for network administrator |
KR101641572B1 (ko) | 2015-01-19 | 2016-07-21 | 주식회사 엔씨소프트 | 상황 및 선호도 기반 대화 스티커 순위 결정 방법 및 컴퓨터 프로그램 |
US10509829B2 (en) | 2015-01-21 | 2019-12-17 | Microsoft Technology Licensing, Llc | Contextual search using natural language |
US9767091B2 (en) | 2015-01-23 | 2017-09-19 | Microsoft Technology Licensing, Llc | Methods for understanding incomplete natural language query |
US9508339B2 (en) * | 2015-01-30 | 2016-11-29 | Microsoft Technology Licensing, Llc | Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing |
WO2016127338A1 (en) | 2015-02-11 | 2016-08-18 | Yahoo! Inc. | Method and system for online user profiling |
US9530102B2 (en) | 2015-02-17 | 2016-12-27 | The Mathworks, Inc. | Multimodal input processing |
JP2016151736A (ja) | 2015-02-19 | 2016-08-22 | 日本放送協会 | 音声加工装置、及びプログラム |
JP2018512090A (ja) | 2015-02-27 | 2018-05-10 | キーポイント テクノロジーズ インディア プライベート リミテッド | 文脈発見技術 |
US20160253630A1 (en) | 2015-02-27 | 2016-09-01 | Anthony F. Oliveri | System and method for automatically scheduling an appointment |
US10585548B2 (en) | 2015-03-03 | 2020-03-10 | Soroco Private Limited | Software robots for programmatically controlling computer programs to perform tasks |
US9800536B2 (en) | 2015-03-05 | 2017-10-24 | International Business Machines Corporation | Automated document lifecycle management |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10462211B2 (en) | 2015-03-09 | 2019-10-29 | International Business Machines Corporation | System and method for providing more appropriate question/answer responses based upon profiles |
US10146355B2 (en) | 2015-03-26 | 2018-12-04 | Lenovo (Singapore) Pte. Ltd. | Human interface device input fusion |
US10594810B2 (en) | 2015-04-06 | 2020-03-17 | International Business Machines Corporation | Enhancing natural language processing query/answer systems using social network analysis |
US10418032B1 (en) * | 2015-04-10 | 2019-09-17 | Soundhound, Inc. | System and methods for a virtual assistant to manage and use context in a natural language dialog |
US20160306505A1 (en) | 2015-04-17 | 2016-10-20 | Avincel Group, Inc. | Computer-implemented methods and systems for automatically creating and displaying instant presentations from selected visual content items |
JP6210239B2 (ja) | 2015-04-20 | 2017-10-11 | 本田技研工業株式会社 | 会話解析装置、会話解析方法及びプログラム |
US10218651B2 (en) | 2015-04-20 | 2019-02-26 | Oracle International Corporation | Virtual assistance for chat agents |
KR102002112B1 (ko) | 2015-04-30 | 2019-07-19 | 구글 엘엘씨 | 제스처 추적 및 인식을 위한 rf―기반 마이크로―모션 추적 |
US10417799B2 (en) | 2015-05-07 | 2019-09-17 | Facebook, Inc. | Systems and methods for generating and presenting publishable collections of related media content items |
US9761220B2 (en) | 2015-05-13 | 2017-09-12 | Microsoft Technology Licensing, Llc | Language modeling based on spoken and unspeakable corpuses |
US10133613B2 (en) | 2015-05-14 | 2018-11-20 | Microsoft Technology Licensing, Llc | Digital assistant extensibility to third party applications |
US10229674B2 (en) | 2015-05-15 | 2019-03-12 | Microsoft Technology Licensing, Llc | Cross-language speech recognition and translation |
US9666192B2 (en) | 2015-05-26 | 2017-05-30 | Nuance Communications, Inc. | Methods and apparatus for reducing latency in speech recognition applications |
US10088908B1 (en) | 2015-05-27 | 2018-10-02 | Google Llc | Gesture detection and interactions |
WO2016194175A1 (ja) * | 2015-06-03 | 2016-12-08 | 株式会社日立製作所 | ストレージシステム |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9792281B2 (en) | 2015-06-15 | 2017-10-17 | Microsoft Technology Licensing, Llc | Contextual language generation by leveraging language understanding |
EP3106963B1 (en) | 2015-06-16 | 2019-07-24 | Nokia Technologies Oy | Mediated reality |
US9921805B2 (en) | 2015-06-17 | 2018-03-20 | Lenovo (Singapore) Pte. Ltd. | Multi-modal disambiguation of voice assisted input |
US9959328B2 (en) * | 2015-06-30 | 2018-05-01 | Microsoft Technology Licensing, Llc | Analysis of user text |
US9875374B2 (en) * | 2015-07-01 | 2018-01-23 | Michael L. Brownewell | System and method for collecting, storing, and securing data |
US10432560B2 (en) | 2015-07-17 | 2019-10-01 | Motorola Mobility Llc | Voice controlled multimedia content creation |
US10867256B2 (en) | 2015-07-17 | 2020-12-15 | Knoema Corporation | Method and system to provide related data |
KR102413693B1 (ko) | 2015-07-23 | 2022-06-27 | 삼성전자주식회사 | 음성 인식 장치 및 방법, 그를 위한 모델 생성 장치 및 방법 |
EP3122001B1 (en) | 2015-07-24 | 2019-10-23 | Facebook, Inc. | Providing personal assistant service via messaging |
US10218665B2 (en) | 2015-07-30 | 2019-02-26 | Pixured, Inc. | System relating to 3D, 360 degree or spherical for refering to and/or embedding posts, videos or digital media within other posts, videos, digital data or digital media and posts within anypart of another posts, videos, digital data or digital media |
US10387464B2 (en) | 2015-08-25 | 2019-08-20 | Facebook, Inc. | Predicting labels using a deep-learning model |
US9699205B2 (en) | 2015-08-31 | 2017-07-04 | Splunk Inc. | Network security system |
US10339916B2 (en) | 2015-08-31 | 2019-07-02 | Microsoft Technology Licensing, Llc | Generation and application of universal hypothesis ranking model |
JP6618735B2 (ja) | 2015-08-31 | 2019-12-11 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
US11334165B1 (en) | 2015-09-03 | 2022-05-17 | sigmund lindsay clements | Augmented reality glasses images in midair having a feel when touched |
US10262654B2 (en) | 2015-09-24 | 2019-04-16 | Microsoft Technology Licensing, Llc | Detecting actionable items in a conversation among participants |
US9811519B2 (en) | 2015-09-24 | 2017-11-07 | Conduent Business Services, Llc | Generative discriminative approach for transactional dialog state tracking via collective matrix factorization |
WO2017054004A1 (en) | 2015-09-24 | 2017-03-30 | California Instutute Of Technology | Systems and methods for data visualization using tree-dimensional displays |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US20170098236A1 (en) | 2015-10-02 | 2017-04-06 | Yahoo! Inc. | Exploration of real-time advertising decisions |
US9715874B2 (en) | 2015-10-30 | 2017-07-25 | Nuance Communications, Inc. | Techniques for updating an automatic speech recognition system using finite-state transducers |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10380190B2 (en) | 2015-11-18 | 2019-08-13 | International Business Machines Corporation | Optimized autocompletion of search field |
US9767309B1 (en) | 2015-11-23 | 2017-09-19 | Experian Information Solutions, Inc. | Access control system for implementing access restrictions of regulated database records while identifying and providing indicators of regulated database records matching validation criteria |
US10824660B2 (en) * | 2015-11-24 | 2020-11-03 | Adobe Inc. | Segmenting topical discussion themes from user-generated posts |
US10387511B2 (en) | 2015-11-25 | 2019-08-20 | Facebook, Inc. | Text-to-media indexes on online social networks |
US10585784B2 (en) | 2015-12-10 | 2020-03-10 | International Business Machines Corporation | Regression testing question answering cognitive computing systems by applying ground truth virtual checksum techniques |
US11250218B2 (en) * | 2015-12-11 | 2022-02-15 | Microsoft Technology Licensing, Llc | Personalizing natural language understanding systems |
US10467282B2 (en) | 2015-12-17 | 2019-11-05 | Facebook, Inc. | Suggesting tags on online social networks |
US10262062B2 (en) | 2015-12-21 | 2019-04-16 | Adobe Inc. | Natural language system question classifier, semantic representations, and logical form templates |
WO2017112796A1 (en) | 2015-12-21 | 2017-06-29 | Google Inc. | Automatic suggestions and other content for messaging applications |
US10134388B1 (en) | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10362137B2 (en) | 2015-12-28 | 2019-07-23 | Verizon Patent And Licensing Inc. | Hebbian learning-based recommendations for social networks |
US10402750B2 (en) | 2015-12-30 | 2019-09-03 | Facebook, Inc. | Identifying entities using a deep-learning model |
US10157309B2 (en) | 2016-01-14 | 2018-12-18 | Nvidia Corporation | Online detection and classification of dynamic gestures with recurrent convolutional neural networks |
US10740375B2 (en) * | 2016-01-20 | 2020-08-11 | Facebook, Inc. | Generating answers to questions using information posted by users on online social networks |
CN106997236B (zh) | 2016-01-25 | 2018-07-13 | 亮风台(上海)信息科技有限公司 | 基于多模态输入进行交互的方法和设备 |
US10152965B2 (en) | 2016-02-03 | 2018-12-11 | Google Llc | Learning personalized entity pronunciations |
US10055403B2 (en) | 2016-02-05 | 2018-08-21 | Adobe Systems Incorporated | Rule-based dialog state tracking |
US20170228240A1 (en) | 2016-02-05 | 2017-08-10 | Microsoft Technology Licensing, Llc | Dynamic reactive contextual policies for personal digital assistants |
US20170235726A1 (en) | 2016-02-12 | 2017-08-17 | Fujitsu Limited | Information identification and extraction |
US20170243107A1 (en) | 2016-02-19 | 2017-08-24 | Jack Mobile Inc. | Interactive search engine |
CN107102990A (zh) | 2016-02-19 | 2017-08-29 | 株式会社东芝 | 对语音进行翻译的方法和装置 |
US10241648B2 (en) | 2016-02-29 | 2019-03-26 | Hrb Innovations, Inc. | Context-aware field value suggestions |
US20170255580A1 (en) | 2016-03-02 | 2017-09-07 | Northrop Grumman Systems Corporation | Multi-modal input system for a computer system |
JP6495850B2 (ja) | 2016-03-14 | 2019-04-03 | 株式会社東芝 | 情報処理装置、情報処理方法、プログラムおよび認識システム |
US10795916B2 (en) | 2016-03-15 | 2020-10-06 | Facebook, Inc. | Temporal clustering of social networking content |
US9978367B2 (en) | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US10304444B2 (en) | 2016-03-23 | 2019-05-28 | Amazon Technologies, Inc. | Fine-grained natural language understanding |
CN105843801B (zh) * | 2016-03-25 | 2018-05-11 | 北京语言大学 | 多译本平行语料库的构建系统 |
WO2017168202A1 (en) | 2016-03-27 | 2017-10-05 | Yogesh Chunilal Rathod | Identifying & storing followers, following users, viewers, users and connections for user |
US10917767B2 (en) | 2016-03-31 | 2021-02-09 | Intel Corporation | IOT device selection |
US10437929B2 (en) * | 2016-03-31 | 2019-10-08 | Maluuba Inc. | Method and system for processing an input query using a forward and a backward neural network specific to unigrams |
US10831802B2 (en) | 2016-04-11 | 2020-11-10 | Facebook, Inc. | Techniques to respond to user requests using natural-language machine learning based on example conversations |
US10567312B2 (en) | 2016-04-11 | 2020-02-18 | Facebook, Inc. | Techniques for messaging bot controls based on machine-learning user intent detection |
EP4030295B1 (en) | 2016-04-18 | 2024-06-05 | Google LLC | Automated assistant invocation of appropriate agent |
US10305828B2 (en) | 2016-04-20 | 2019-05-28 | Google Llc | Search query predictions by a keyboard |
US10452671B2 (en) * | 2016-04-26 | 2019-10-22 | Facebook, Inc. | Recommendations from comments on online social networks |
US20170316159A1 (en) | 2016-04-27 | 2017-11-02 | Veeva Systems Inc. | System And Method For Updating Customer Data |
US11025741B2 (en) | 2016-05-25 | 2021-06-01 | International Business Machines Corporation | Dynamic cognitive user interface |
US20170351786A1 (en) | 2016-06-02 | 2017-12-07 | Xerox Corporation | Scalable spectral modeling of sparse sequence functions via a best matching algorithm |
US20170353469A1 (en) | 2016-06-03 | 2017-12-07 | Facebook, Inc. | Search-Page Profile |
US20170351969A1 (en) | 2016-06-06 | 2017-12-07 | Microsoft Technology Licensing, Llc | Exploit-explore on heterogeneous data streams |
US10462619B2 (en) | 2016-06-08 | 2019-10-29 | Google Llc | Providing a personal assistant module with a selectively-traversable state machine |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10255905B2 (en) | 2016-06-10 | 2019-04-09 | Google Llc | Predicting pronunciations with word stress |
US11366786B2 (en) * | 2016-06-10 | 2022-06-21 | OneTrust, LLC | Data processing systems for processing data subject access requests |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
CN107491469B (zh) * | 2016-06-11 | 2020-11-24 | 苹果公司 | 智能任务发现 |
US20170357661A1 (en) | 2016-06-12 | 2017-12-14 | Apple Inc. | Providing content items in response to a natural language query |
US11243987B2 (en) | 2016-06-16 | 2022-02-08 | Microsoft Technology Licensing, Llc | Efficient merging and filtering of high-volume metrics |
US20170366479A1 (en) | 2016-06-20 | 2017-12-21 | Microsoft Technology Licensing, Llc | Communication System |
EP3263619A1 (de) | 2016-06-27 | 2018-01-03 | Evonik Degussa GmbH | Alkoxysilan- und allophanat-funktionalisierte beschichtungsmittel |
US9973460B2 (en) | 2016-06-27 | 2018-05-15 | International Business Machines Corporation | Familiarity-based involvement on an online group conversation |
US9807037B1 (en) | 2016-07-08 | 2017-10-31 | Asapp, Inc. | Automatically suggesting completions of text |
US20180018562A1 (en) | 2016-07-14 | 2018-01-18 | Cside Japan Inc. | Platform for providing task based on deep learning |
US10433052B2 (en) | 2016-07-16 | 2019-10-01 | Ron Zass | System and method for identifying speech prosody |
US10878337B2 (en) | 2016-07-18 | 2020-12-29 | International Business Machines Corporation | Assistance generation |
CN106055114A (zh) | 2016-07-20 | 2016-10-26 | 西安中科比奇创新科技有限责任公司 | 一种可穿戴式人机交互手势识别控制装置 |
US10409818B1 (en) | 2016-08-04 | 2019-09-10 | Google Llc | Populating streams of content |
US10664899B2 (en) | 2016-08-15 | 2020-05-26 | Google Llc | Systems and methods for detection of navigation to physical venue and suggestion of alternative actions |
US20180052842A1 (en) * | 2016-08-16 | 2018-02-22 | Ebay Inc. | Intelligent online personal assistant with natural language understanding |
US20180054523A1 (en) | 2016-08-16 | 2018-02-22 | Rulai, Inc. | Method and system for context sensitive intelligent virtual agents |
US20180052824A1 (en) * | 2016-08-19 | 2018-02-22 | Microsoft Technology Licensing, Llc | Task identification and completion based on natural language query |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US20180060439A1 (en) | 2016-08-25 | 2018-03-01 | Facebook, Inc. | User status update suggestions |
US10481861B2 (en) | 2016-08-30 | 2019-11-19 | Google Llc | Using user input to adapt search results provided for presentation to the user |
US10217462B2 (en) * | 2016-08-31 | 2019-02-26 | Microsoft Technology Licensing, Llc | Automating natural language task/dialog authoring by leveraging existing content |
WO2018045358A1 (en) | 2016-09-05 | 2018-03-08 | Google Llc | Generating theme-based videos |
US10768804B2 (en) | 2016-09-06 | 2020-09-08 | Microsoft Technology Licensing, Llc | Gesture language for a device with multiple touch surfaces |
US10249294B2 (en) | 2016-09-09 | 2019-04-02 | Electronics And Telecommunications Research Institute | Speech recognition system and method |
US10403273B2 (en) | 2016-09-09 | 2019-09-03 | Oath Inc. | Method and system for facilitating a guided dialog between a user and a conversational agent |
US11574207B2 (en) | 2016-09-16 | 2023-02-07 | Oracle International Corporation | Proximal factorization machine interface engine |
CA3036998A1 (en) | 2016-09-19 | 2018-03-22 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
KR101961754B1 (ko) | 2016-09-20 | 2019-03-25 | 구글 엘엘씨 | 봇 상호작용 |
US11093711B2 (en) * | 2016-09-28 | 2021-08-17 | Microsoft Technology Licensing, Llc | Entity-specific conversational artificial intelligence |
CN107885316A (zh) | 2016-09-29 | 2018-04-06 | 阿里巴巴集团控股有限公司 | 一种基于手势的交互方法及装置 |
CN107885317A (zh) | 2016-09-29 | 2018-04-06 | 阿里巴巴集团控股有限公司 | 一种基于手势的交互方法及装置 |
US9785717B1 (en) | 2016-09-29 | 2017-10-10 | International Business Machines Corporation | Intent based search result interaction |
US20180096072A1 (en) | 2016-10-03 | 2018-04-05 | Google Inc. | Personalization of a virtual assistant |
CN109844855B (zh) | 2016-10-03 | 2023-12-05 | 谷歌有限责任公司 | 任务的多重计算代理执行 |
US10579688B2 (en) | 2016-10-05 | 2020-03-03 | Facebook, Inc. | Search ranking and recommendations for online social networks based on reconstructed embeddings |
US11580589B2 (en) | 2016-10-11 | 2023-02-14 | Ebay Inc. | System, method, and medium to select a product title |
US11392598B2 (en) | 2016-10-19 | 2022-07-19 | Ebay Inc. | Applying a quantitative range for qualitative terms |
EP3312832A1 (en) | 2016-10-19 | 2018-04-25 | Mastercard International Incorporated | Voice catergorisation |
US10200457B2 (en) | 2016-10-26 | 2019-02-05 | Uber Technologies, Inc. | Selective distribution of machine-learned models |
CN106527709B (zh) * | 2016-10-28 | 2020-10-02 | Tcl移动通信科技(宁波)有限公司 | 一种虚拟场景调整方法及头戴式智能设备 |
US10585891B2 (en) | 2016-11-03 | 2020-03-10 | Soundhound, Inc. | Dynamic choice of data sources in natural language query processing |
US10528614B2 (en) * | 2016-11-07 | 2020-01-07 | International Business Machines Corporation | Processing images from a gaze tracking device to provide location information for tracked entities |
US10649985B1 (en) | 2016-11-08 | 2020-05-12 | Premera Blue Cross | Systems and methods for processing natural language queries for healthcare data |
CN111971742B (zh) | 2016-11-10 | 2024-08-20 | 赛轮思软件技术(北京)有限公司 | 与语言无关的唤醒词检测的技术 |
US20180146019A1 (en) | 2016-11-21 | 2018-05-24 | International Business Machines Corporation | Light-weight resolution switching for online video streaming |
KR20180060328A (ko) | 2016-11-28 | 2018-06-07 | 삼성전자주식회사 | 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버 |
US10796217B2 (en) | 2016-11-30 | 2020-10-06 | Microsoft Technology Licensing, Llc | Systems and methods for performing automated interviews |
US10162886B2 (en) | 2016-11-30 | 2018-12-25 | Facebook, Inc. | Embedding-based parsing of search queries on online social networks |
US20180157759A1 (en) | 2016-12-06 | 2018-06-07 | Facebook, Inc. | Systems and methods for determination and provision of similar media content item recommendations |
US10603594B2 (en) | 2016-12-07 | 2020-03-31 | Microsoft Technology Licensing, Llc | Online ecosystem-based resource recommendations |
US20180165723A1 (en) * | 2016-12-12 | 2018-06-14 | Chatalytic, Inc. | Measuring and optimizing natural language interactions |
US10679008B2 (en) * | 2016-12-16 | 2020-06-09 | Microsoft Technology Licensing, Llc | Knowledge base for analysis of text |
US20180176614A1 (en) | 2016-12-21 | 2018-06-21 | Facebook, Inc. | Methods and Systems for Caching Content for a Personalized Video |
US10229680B1 (en) | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US10699181B2 (en) | 2016-12-30 | 2020-06-30 | Google Llc | Virtual assistant generation of group recommendations |
US11030515B2 (en) | 2016-12-30 | 2021-06-08 | Google Llc | Determining semantically diverse responses for providing as suggestions for inclusion in electronic communications |
US20180196854A1 (en) | 2017-01-11 | 2018-07-12 | Google Inc. | Application extension for generating automatic search queries |
CN113505205B (zh) | 2017-01-17 | 2023-06-06 | 华为技术有限公司 | 一种人机对话的系统和方法 |
US10146768B2 (en) * | 2017-01-25 | 2018-12-04 | Google Llc | Automatic suggested responses to images received in messages using language model |
US10552891B2 (en) | 2017-01-31 | 2020-02-04 | Walmart Apollo, Llc | Systems and methods for recommending cold-start items on a website of a retailer |
GB2559617B (en) | 2017-02-13 | 2020-06-24 | Toshiba Kk | A dialogue system, a dialogue method and a method of adapting a dialogue system |
US10467510B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Intelligent assistant |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US20180293221A1 (en) * | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US11373086B2 (en) | 2017-02-17 | 2022-06-28 | Google Llc | Cooperatively training and/or using separate input and response neural network models for determining response(s) for electronic communications |
US10783188B2 (en) | 2017-02-17 | 2020-09-22 | Salesforce.Com, Inc. | Intelligent embedded self-help service |
CN108811514B (zh) * | 2017-03-03 | 2022-03-01 | 谷歌有限责任公司 | 用于检测在客户端设备上执行的应用不当地实施对内容项的呈现的系统和方法 |
US10416854B2 (en) | 2017-03-07 | 2019-09-17 | Google Llc | Autofill for a user device |
US10755317B2 (en) | 2017-03-11 | 2020-08-25 | International Business Machines Corporation | Managing a set of offers using a dialogue |
US11250311B2 (en) * | 2017-03-15 | 2022-02-15 | Salesforce.Com, Inc. | Deep neural network-based decision network |
US10600406B1 (en) * | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
US10325224B1 (en) | 2017-03-23 | 2019-06-18 | Palantir Technologies Inc. | Systems and methods for selecting machine learning training data |
US10581765B2 (en) | 2017-04-03 | 2020-03-03 | Microsoft Technology Licensing, Llc | Conversation bot discovery and response fusion |
US10574613B2 (en) | 2017-04-04 | 2020-02-25 | International Business Machines Corporation | Context-based personalized summarization of missed messages |
US10839098B2 (en) | 2017-04-07 | 2020-11-17 | International Business Machines Corporation | System to prevent export of sensitive data |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
US11250844B2 (en) * | 2017-04-12 | 2022-02-15 | Soundhound, Inc. | Managing agent engagement in a man-machine dialog |
US10862918B2 (en) | 2017-04-21 | 2020-12-08 | Raytheon Bbn Technologies Corp. | Multi-dimensional heuristic search as part of an integrated decision engine for evolving defenses |
US9865260B1 (en) | 2017-05-03 | 2018-01-09 | Google Llc | Proactive incorporation of unsolicited content into human-to-computer dialogs |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
CN118055104A (zh) | 2017-05-10 | 2024-05-17 | 优玛尼股份有限公司 | 可穿戴多媒体设备和具有应用程序生态系统的云计算平台 |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US20180330714A1 (en) | 2017-05-12 | 2018-11-15 | Apple Inc. | Machine learned systems |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
AU2018269941A1 (en) | 2017-05-14 | 2019-12-05 | Digital Reasoning Systems, Inc. | Systems and methods for rapidly building, managing, and sharing machine learning models |
US10127227B1 (en) | 2017-05-15 | 2018-11-13 | Google Llc | Providing access to user-controlled resources by automated assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US11068659B2 (en) | 2017-05-23 | 2021-07-20 | Vanderbilt University | System, method and computer program product for determining a decodability index for one or more words |
US20180341871A1 (en) | 2017-05-25 | 2018-11-29 | Accenture Global Solutions Limited | Utilizing deep learning with an information retrieval mechanism to provide question answering in restricted domains |
US10581953B1 (en) | 2017-05-31 | 2020-03-03 | Snap Inc. | Real-time content integration based on machine learned selections |
US10242680B2 (en) | 2017-06-02 | 2019-03-26 | The Nielsen Company (Us), Llc | Methods and apparatus to inspect characteristics of multichannel audio |
US11354509B2 (en) | 2017-06-05 | 2022-06-07 | Deepmind Technologies Limited | Action selection based on environment observations and textual instructions |
US20180349962A1 (en) | 2017-06-05 | 2018-12-06 | International Business Machines Corporation | System and method for using electromagnetic noise signal-based predictive analytics for digital advertising |
US10348658B2 (en) | 2017-06-15 | 2019-07-09 | Google Llc | Suggested items for use with embedded applications in chat conversations |
US10404636B2 (en) * | 2017-06-15 | 2019-09-03 | Google Llc | Embedded programs and interfaces for chat conversations |
US10810256B1 (en) | 2017-06-19 | 2020-10-20 | Amazon Technologies, Inc. | Per-user search strategies |
WO2018235191A1 (ja) | 2017-06-21 | 2018-12-27 | 三菱電機株式会社 | ジェスチャ操作装置及びジェスチャ操作方法 |
US9986394B1 (en) | 2017-06-26 | 2018-05-29 | Amazon Technologies, Inc. | Voice-based messaging |
US11699039B2 (en) | 2017-06-28 | 2023-07-11 | Microsoft Technology Licensing, Llc | Virtual assistant providing enhanced communication session services |
CN109690455B (zh) | 2017-06-29 | 2022-03-11 | 苹果公司 | 具有传感器和触觉部件的指戴式装置 |
US10659225B2 (en) | 2017-06-30 | 2020-05-19 | Microsoft Technology Licensing, Llc | Encrypting existing live unencrypted data using age-based garbage collection |
US10607260B2 (en) | 2017-06-30 | 2020-03-31 | Rovi Guides, Inc. | Systems and methods for presenting supplemental information related to an advertisement consumed on a different device within a threshold time period based on historical user interactions |
US10311872B2 (en) * | 2017-07-25 | 2019-06-04 | Google Llc | Utterance classifier |
US11062243B2 (en) * | 2017-07-25 | 2021-07-13 | Bank Of America Corporation | Activity integration associated with resource sharing management application |
WO2019022567A2 (en) | 2017-07-27 | 2019-01-31 | Samsung Electronics Co., Ltd. | METHOD FOR AUTOMATICALLY PROVIDING AUTOMATIC COMPLETION SUGGESTIONS BASED ON GESTURES AND ASSOCIATED ELECTRONIC DEVICE |
JP6513749B2 (ja) | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
US10678831B2 (en) | 2017-08-31 | 2020-06-09 | Ca Technologies, Inc. | Page journey determination from fingerprint information in web event journals |
US10515625B1 (en) * | 2017-08-31 | 2019-12-24 | Amazon Technologies, Inc. | Multi-modal natural language processing |
US10635707B2 (en) | 2017-09-07 | 2020-04-28 | Xerox Corporation | Contextual memory bandit for proactive dialogs |
US10438594B2 (en) | 2017-09-08 | 2019-10-08 | Amazon Technologies, Inc. | Administration of privileges by speech for voice assistant system |
CN108304436B (zh) | 2017-09-12 | 2019-11-05 | 深圳市腾讯计算机系统有限公司 | 风格语句的生成方法、模型的训练方法、装置及设备 |
US10685049B2 (en) | 2017-09-15 | 2020-06-16 | Oath Inc. | Conversation summary |
US10108707B1 (en) | 2017-09-22 | 2018-10-23 | Amazon Technologies, Inc. | Data ingestion pipeline |
US11397887B2 (en) | 2017-09-26 | 2022-07-26 | Amazon Technologies, Inc. | Dynamic tuning of training parameters for machine learning algorithms |
US10504513B1 (en) * | 2017-09-26 | 2019-12-10 | Amazon Technologies, Inc. | Natural language understanding with affiliated devices |
US11216474B2 (en) | 2017-09-28 | 2022-01-04 | Oracle International Corporation | Statistical processing of natural language queries of data sets |
CN107704559B (zh) * | 2017-09-29 | 2020-06-05 | 北京软通智城科技有限公司 | 一种语义理解方法及装置 |
US10841249B2 (en) | 2017-10-02 | 2020-11-17 | Samsung Electronics Co., Ltd. | System and method for bot platform |
US10418023B2 (en) | 2017-10-17 | 2019-09-17 | International Business Machines Corporation | Automatic answer rephrasing based on talking style |
US20190121907A1 (en) | 2017-10-23 | 2019-04-25 | International Business Machines Corporation | Grouping messages based on temporal and multi-feature similarity |
US10645035B2 (en) * | 2017-11-02 | 2020-05-05 | Google Llc | Automated assistants with conference capabilities |
US10762903B1 (en) | 2017-11-07 | 2020-09-01 | Amazon Technologies, Inc. | Conversational recovery for voice user interface |
US20190139150A1 (en) | 2017-11-09 | 2019-05-09 | Facebook, Inc. | Systems and methods for generating multi-contributor content posts for events |
US10616148B2 (en) | 2017-11-13 | 2020-04-07 | International Business Machines Corporation | Progressively extending conversation scope in multi-user messaging platform |
US10380992B2 (en) | 2017-11-13 | 2019-08-13 | GM Global Technology Operations LLC | Natural language generation based on user speech style |
US20190146647A1 (en) | 2017-11-16 | 2019-05-16 | [24]7.ai, Inc. | Method and system for facilitating collaboration among enterprise agents |
US11544550B2 (en) | 2017-11-17 | 2023-01-03 | Meta Platforms, Inc. | Analyzing spatially-sparse data based on submanifold sparse convolutional neural networks |
US20190156204A1 (en) | 2017-11-20 | 2019-05-23 | Koninklijke Philips N.V. | Training a neural network model |
US20190163691A1 (en) | 2017-11-30 | 2019-05-30 | CrowdCare Corporation | Intent Based Dynamic Generation of Personalized Content from Dynamic Sources |
WO2019113124A1 (en) | 2017-12-04 | 2019-06-13 | Panjiva, Inc. | Mtransaction processing improvements |
CN107909061B (zh) | 2017-12-07 | 2021-03-30 | 电子科技大学 | 一种基于不完备特征的头部姿态跟踪装置及方法 |
US20190182195A1 (en) | 2017-12-13 | 2019-06-13 | Knowmail S.A.L LTD. | Event-Based Scoring of Communication Messages |
WO2019122990A1 (en) | 2017-12-23 | 2019-06-27 | Yogesh Chunilal Rathod | Providing interface for identifying one or more types of user actions & criteria specific users |
US11086916B2 (en) | 2017-12-29 | 2021-08-10 | Fujifilm Business Innovation Corp. | System and method for analyzing and visualizing team conversational data |
US11222632B2 (en) | 2017-12-29 | 2022-01-11 | DMAI, Inc. | System and method for intelligent initiation of a man-machine dialogue based on multi-modal sensory inputs |
US11017163B2 (en) | 2017-12-29 | 2021-05-25 | Google Llc | Input facilitation for forms in web resources |
EP3692522A4 (en) | 2017-12-31 | 2020-11-11 | Midea Group Co., Ltd. | METHOD AND SYSTEM FOR THE CONTROL OF HOME ASSISTANT DEVICES |
US10977711B1 (en) | 2018-01-03 | 2021-04-13 | Amazon Technologies, Inc. | Artificial intelligence system with hierarchical machine learning for interaction session optimization |
US11631017B2 (en) | 2018-01-09 | 2023-04-18 | Microsoft Technology Licensing, Llc | Federated intelligent assistance |
US11074289B2 (en) | 2018-01-31 | 2021-07-27 | Microsoft Technology Licensing, Llc | Multi-modal visual search pipeline for web scale images |
US10741176B2 (en) | 2018-01-31 | 2020-08-11 | International Business Machines Corporation | Customizing responses to users in automated dialogue systems |
US10794609B2 (en) | 2018-02-05 | 2020-10-06 | Mitsubishi Electric Research Laboratories, Inc. | Methods and systems for personalized heating, ventilation, and air conditioning |
US11030400B2 (en) | 2018-02-22 | 2021-06-08 | Verizon Media Inc. | System and method for identifying and replacing slots with variable slots |
AU2019201001B2 (en) | 2018-02-27 | 2020-04-23 | Accenture Global Solutions Limited | Intelligent content recommender for groups of users |
US10728200B2 (en) * | 2018-03-12 | 2020-07-28 | Microsoft Technology Licensing, Llc | Messaging system for automated message management |
US20180260481A1 (en) | 2018-04-01 | 2018-09-13 | Yogesh Rathod | Displaying search result associated identified or extracted unique identity associated structured contents or structured website |
WO2019193378A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10462422B1 (en) | 2018-04-09 | 2019-10-29 | Facebook, Inc. | Audio selection based on user engagement |
US11030412B2 (en) | 2018-04-10 | 2021-06-08 | Verizon Patent And Licensing Inc. | System and method for chatbot conversation construction and management |
US11176589B2 (en) | 2018-04-10 | 2021-11-16 | Ebay Inc. | Dynamically generated machine learning models and visualization thereof |
US10523864B2 (en) | 2018-04-10 | 2019-12-31 | Facebook, Inc. | Automated cinematic decisions based on descriptive models |
US11120158B2 (en) | 2018-04-13 | 2021-09-14 | Plaid Inc. | Secure permissioning of access to user accounts, including secure distribution of aggregated user account data |
US10573298B2 (en) * | 2018-04-16 | 2020-02-25 | Google Llc | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
US10839793B2 (en) | 2018-04-16 | 2020-11-17 | Google Llc | Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface |
US10679615B2 (en) | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
US10339919B1 (en) | 2018-04-20 | 2019-07-02 | botbotbotbot Inc. | Task-independent conversational systems |
US10782986B2 (en) | 2018-04-20 | 2020-09-22 | Facebook, Inc. | Assisting users with personalized and contextual communication content |
US10978056B1 (en) | 2018-04-20 | 2021-04-13 | Facebook, Inc. | Grammaticality classification for natural language generation in assistant systems |
US11514333B2 (en) | 2018-04-30 | 2022-11-29 | Meta Platforms, Inc. | Combining machine-learning and social data to generate personalized recommendations |
US20190348033A1 (en) | 2018-05-10 | 2019-11-14 | Fujitsu Limited | Generating a command for a voice assistant using vocal input |
JP7155605B2 (ja) | 2018-05-22 | 2022-10-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
US11397888B2 (en) | 2018-06-14 | 2022-07-26 | Accenture Global Solutions Limited | Virtual agent with a dialogue management system and method of training a dialogue management system |
US11301513B2 (en) | 2018-07-06 | 2022-04-12 | Spotify Ab | Personalizing explainable recommendations with bandits |
US11103773B2 (en) | 2018-07-27 | 2021-08-31 | Yogesh Rathod | Displaying virtual objects based on recognition of real world object and identification of real world object associated location or geofence |
US11095734B2 (en) | 2018-08-06 | 2021-08-17 | International Business Machines Corporation | Social media/network enabled digital learning environment with atomic refactoring |
US10896295B1 (en) | 2018-08-21 | 2021-01-19 | Facebook, Inc. | Providing additional information for identified named-entities for assistant systems |
US10949616B1 (en) | 2018-08-21 | 2021-03-16 | Facebook, Inc. | Automatically detecting and storing entity information for assistant systems |
US10802872B2 (en) | 2018-09-12 | 2020-10-13 | At&T Intellectual Property I, L.P. | Task delegation and cooperation for automated assistants |
US10482182B1 (en) | 2018-09-18 | 2019-11-19 | CloudMinds Technology, Inc. | Natural language understanding system and dialogue systems |
US20200104427A1 (en) | 2018-09-28 | 2020-04-02 | Microsoft Technology Licensing, Llc. | Personalized neural query auto-completion pipeline |
US10861446B2 (en) | 2018-12-10 | 2020-12-08 | Amazon Technologies, Inc. | Generating input alternatives |
US10868778B1 (en) | 2019-05-30 | 2020-12-15 | Microsoft Technology Licensing, Llc | Contextual feedback, with expiration indicator, to a natural understanding system in a chat bot |
US11657094B2 (en) | 2019-06-28 | 2023-05-23 | Meta Platforms Technologies, Llc | Memory grounded conversational reasoning and question answering for assistant systems |
US20210117214A1 (en) | 2019-10-18 | 2021-04-22 | Facebook, Inc. | Generating Proactive Content for Assistant Systems |
US11308284B2 (en) | 2019-10-18 | 2022-04-19 | Facebook Technologies, Llc. | Smart cameras enabled by assistant systems |
US11159767B1 (en) | 2020-04-07 | 2021-10-26 | Facebook Technologies, Llc | Proactive in-call content recommendations for assistant systems |
US20220188361A1 (en) | 2020-12-11 | 2022-06-16 | Meta Platforms, Inc. | Voice-based Auto-Completions and Auto-Responses for Assistant Systems |
US11210364B1 (en) | 2021-03-15 | 2021-12-28 | Contentful GmbH | Methods for launching content for publication |
-
2018
- 2018-04-30 US US15/966,455 patent/US10782986B2/en active Active
- 2018-04-30 US US15/967,239 patent/US20190327330A1/en not_active Abandoned
- 2018-04-30 US US15/967,342 patent/US11010179B2/en active Active
- 2018-04-30 US US15/967,279 patent/US11010436B1/en active Active
- 2018-04-30 US US15/967,290 patent/US10963273B2/en active Active
- 2018-05-17 WO PCT/US2018/033116 patent/WO2019203863A1/en active Application Filing
- 2018-05-17 CN CN201880094677.2A patent/CN112313740A/zh active Pending
- 2018-05-25 WO PCT/US2018/034604 patent/WO2019203864A1/en active Application Filing
- 2018-05-25 CN CN201880094305.XA patent/CN112236766B/zh active Active
- 2018-06-18 US US16/011,062 patent/US11429649B2/en active Active
- 2018-06-20 WO PCT/US2018/038396 patent/WO2019203866A1/en active Application Filing
- 2018-06-20 CN CN201880094857.0A patent/CN112313656A/zh active Pending
- 2018-06-25 WO PCT/US2018/039268 patent/WO2019203867A1/en active Application Filing
- 2018-06-25 CN CN201880094771.8A patent/CN112313644B/zh active Active
- 2018-07-16 US US16/036,827 patent/US11038974B1/en active Active
- 2018-07-17 US US16/038,120 patent/US11301521B1/en active Active
- 2018-07-19 CN CN201880094827.XA patent/CN112513838B/zh active Active
- 2018-07-19 WO PCT/US2018/042906 patent/WO2019203869A1/en active Application Filing
- 2018-07-27 US US16/048,049 patent/US10803050B1/en active Active
- 2018-08-02 US US16/053,600 patent/US10936346B2/en active Active
- 2018-08-03 WO PCT/US2018/045177 patent/WO2019203872A1/en active Application Filing
- 2018-08-03 CN CN201880094828.4A patent/CN112292674B/zh active Active
- 2018-08-14 US US16/103,775 patent/US11100179B1/en active Active
- 2018-08-30 US US16/118,169 patent/US10761866B2/en active Active
- 2018-09-05 WO PCT/US2018/049568 patent/WO2019203880A1/en active Application Filing
- 2018-09-05 CN CN201880094714.XA patent/CN112313642A/zh active Pending
- 2018-09-10 US US16/127,173 patent/US10855485B1/en active Active
- 2018-09-12 US US16/129,638 patent/US11093551B1/en active Active
- 2018-09-19 US US16/135,752 patent/US12001862B1/en active Active
- 2018-10-02 US US16/150,184 patent/US10958599B1/en active Active
- 2018-10-02 US US16/150,069 patent/US10853103B2/en active Active
- 2018-10-03 US US16/151,040 patent/US11003669B1/en active Active
- 2018-10-04 EP EP18915309.1A patent/EP3782090A4/en active Pending
- 2018-10-04 CN CN201880094832.0A patent/CN112470144A/zh active Pending
- 2018-10-04 WO PCT/US2018/054322 patent/WO2019203886A1/en active Application Filing
- 2018-10-31 US US16/176,312 patent/US11308169B1/en active Active
- 2018-10-31 US US16/176,081 patent/US11042554B1/en active Active
- 2018-11-07 US US16/183,650 patent/US10957329B1/en active Active
- 2018-11-15 US US16/192,538 patent/US11245646B1/en active Active
- 2018-12-17 US US16/222,923 patent/US10827024B1/en active Active
- 2018-12-17 US US16/222,957 patent/US11086858B1/en active Active
- 2018-12-21 US US16/229,828 patent/US10854206B1/en active Active
-
2019
- 2019-01-14 US US16/247,439 patent/US10977258B1/en active Active
- 2019-04-18 WO PCT/US2019/028187 patent/WO2019204651A1/en active Application Filing
- 2019-04-18 CN CN201980040760.6A patent/CN112334889A/zh active Pending
- 2019-04-18 JP JP2020556899A patent/JP7324772B2/ja active Active
- 2019-04-18 US US16/388,130 patent/US10802848B2/en active Active
- 2019-04-18 EP EP19722763.0A patent/EP3782092A1/en active Pending
- 2019-04-19 WO PCT/US2019/028387 patent/WO2019204775A1/en active Application Filing
- 2019-04-19 US US16/389,634 patent/US11368420B1/en active Active
- 2019-04-19 US US16/389,728 patent/US11087756B1/en active Active
- 2019-04-19 EP EP19722425.6A patent/EP3782091A1/en active Pending
- 2019-04-19 CN CN201980040312.6A patent/CN112313680A/zh active Pending
- 2019-04-19 US US16/389,708 patent/US10795703B2/en active Active
-
2020
- 2020-08-06 US US16/987,043 patent/US11544305B2/en active Active
- 2020-09-02 US US17/010,750 patent/US11249773B2/en active Active
- 2020-09-02 US US17/010,619 patent/US11231946B2/en active Active
- 2020-09-04 US US17/013,394 patent/US11249774B2/en active Active
- 2020-09-11 US US17/018,764 patent/US11704899B2/en active Active
- 2020-10-22 US US17/077,316 patent/US20210042136A1/en active Pending
-
2021
- 2021-02-23 US US17/182,951 patent/US20210183397A1/en active Pending
- 2021-03-16 US US17/203,286 patent/US11721093B2/en active Active
- 2021-04-07 US US17/224,487 patent/US11688159B2/en active Active
- 2021-04-09 US US17/227,210 patent/US20210232589A1/en active Pending
- 2021-06-29 US US17/362,676 patent/US12112530B2/en active Active
- 2021-07-06 US US17/368,066 patent/US20210343286A1/en not_active Abandoned
- 2021-07-14 US US17/375,473 patent/US11887359B2/en active Active
- 2021-10-27 US US17/512,490 patent/US11694429B2/en active Active
- 2021-12-06 US US17/543,539 patent/US11715289B2/en active Active
- 2021-12-30 US US17/566,308 patent/US11727677B2/en active Active
-
2022
- 2022-02-07 US US17/666,439 patent/US11704900B2/en active Active
- 2022-04-11 US US17/718,146 patent/US11908179B2/en active Active
-
2023
- 2023-01-05 US US18/150,737 patent/US11869231B2/en active Active
- 2023-02-03 US US18/164,480 patent/US11908181B2/en active Active
- 2023-11-02 US US18/500,825 patent/US20240062536A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160378861A1 (en) * | 2012-09-28 | 2016-12-29 | Sri International | Real-time human-machine collaboration using big data driven augmented reality technologies |
CN104718765A (zh) * | 2012-10-17 | 2015-06-17 | 脸谱公司 | 与具有增强现实的存在粒度相关的方法 |
US20150220777A1 (en) * | 2014-01-31 | 2015-08-06 | Google Inc. | Self-initiated change of appearance for subjects in video and images |
CN107000210A (zh) * | 2014-07-15 | 2017-08-01 | 趣普科技公司 | 用于提供持久伙伴装置的设备和方法 |
US9672251B1 (en) * | 2014-09-29 | 2017-06-06 | Google Inc. | Extracting facts from documents |
CN107003723A (zh) * | 2014-10-21 | 2017-08-01 | 罗伯特·博世有限公司 | 用于会话系统中的响应选择和组成的自动化的方法和系统 |
CN107924552A (zh) * | 2015-07-24 | 2018-04-17 | 脸谱公司 | 经由消息收发提供个人助理服务 |
CN107490971A (zh) * | 2016-06-09 | 2017-12-19 | 苹果公司 | 家庭环境中的智能自动化助理 |
US20180052884A1 (en) * | 2016-08-16 | 2018-02-22 | Ebay Inc. | Knowledge graph construction for intelligent online personal assistant |
Non-Patent Citations (2)
Title |
---|
LEI CHEN 等: "Automated scoring of interview videos using Doc2Vec multimodal feature extraction paradigm", 《ICMI \'16: PROCEEDINGS OF THE 18TH ACM INTERNATIONAL CONFERENCE ON MULTIMODAL INTERACTION》, 31 October 2016 (2016-10-31), pages 161 - 168, XP058300116, DOI: 10.1145/2993148.2993203 * |
张利远 等: "面向智能导师系统的Siri个人助理应用研究向智能导师系统的Siri个人助理应用研究", 《中国电化教育》, no. 309, 10 October 2012 (2012-10-10), pages 131 - 135 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486237A (zh) * | 2021-06-07 | 2021-10-08 | 海南太美航空股份有限公司 | 一种航班信息的推荐方法、系统、存储介质和电子设备 |
CN113744731A (zh) * | 2021-08-10 | 2021-12-03 | 浙江大学 | 多模态语音识别方法、系统及计算机可读存储介质 |
CN113744731B (zh) * | 2021-08-10 | 2023-07-21 | 浙江大学 | 多模态语音识别方法、系统及计算机可读存储介质 |
CN115291917A (zh) * | 2022-09-29 | 2022-11-04 | 天津大学 | 一种针对app中色彩普适性问题的修复方法 |
CN115291917B (zh) * | 2022-09-29 | 2023-01-06 | 天津大学 | 一种针对app中色彩普适性问题的修复方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11688159B2 (en) | Engaging users by personalized composing-content recommendation | |
US20210110114A1 (en) | Providing Additional Information for Identified Named-Entities for Assistant Systems | |
US20210182499A1 (en) | Automatically Detecting and Storing Entity Information for Assistant Systems | |
US11676220B2 (en) | Processing multimodal user input for assistant systems | |
US12118371B2 (en) | Assisting users with personalized and contextual communication content | |
EP3557502A1 (en) | Aggregating semantic information for improved understanding of users | |
EP3557500A1 (en) | Building customized user profiles based on conversational data | |
EP3557503A1 (en) | Generating personalized content summaries for users | |
EP3557498A1 (en) | Processing multimodal user input for assistant systems | |
EP3557501A1 (en) | Assisting users with personalized and contextual communication content | |
US20240095544A1 (en) | Augmenting Conversational Response with Volatility Information for Assistant Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: California, USA Applicant after: Yuan platform Co. Address before: California, USA Applicant before: Facebook, Inc. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |