JP2005215689A5 - - Google Patents

Download PDF

Info

Publication number
JP2005215689A5
JP2005215689A5 JP2005023001A JP2005023001A JP2005215689A5 JP 2005215689 A5 JP2005215689 A5 JP 2005215689A5 JP 2005023001 A JP2005023001 A JP 2005023001A JP 2005023001 A JP2005023001 A JP 2005023001A JP 2005215689 A5 JP2005215689 A5 JP 2005215689A5
Authority
JP
Japan
Prior art keywords
information
determining
source
context
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005023001A
Other languages
English (en)
Other versions
JP4678193B2 (ja
JP2005215689A (ja
Filing date
Publication date
Priority claimed from US10/768,675 external-priority patent/US7542971B2/en
Application filed filed Critical
Publication of JP2005215689A publication Critical patent/JP2005215689A/ja
Publication of JP2005215689A5 publication Critical patent/JP2005215689A5/ja
Application granted granted Critical
Publication of JP4678193B2 publication Critical patent/JP4678193B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (26)

  1. スピーチ情報と筆記情報のうちの少なくとも1つを含む第1の情報源からの情報部分を判定するステップと、
    前記第1の情報源からの前記情報部分に時間的に関連された第2の情報源からのコンテキスト情報部分を判定するステップと、
    前記第1の情報源からの前記情報部分と前記第2の情報源からの時間的に関連されたコンテキスト情報部分に基づいて少なくとも1つの認識モデルを判定するステップと、
    前記判定された認識モデルのうちの少なくとも1つに基づいて出力情報を判定するステップと、
    を含む、情報源から情報を認識する方法。
  2. 前記認識モデルが、音声情報、画像情報および触感情報のうちの少なくとも1つに関連する特徴を認識する、請求項1の方法。
  3. 前記コンテキスト情報が、サポート情報および共同ユーザー・フィードバック情報のうちの少なくとも1つである、請求項1の方法。
  4. 前記出力情報が、提案されたノートである、請求項1の方法。
  5. 前記サポート情報が、聴覚情報、視覚情報、触覚情報のうちの少なくとも1つに基づいている、請求項の方法。
  6. 前記共同ユーザー・フィードバック情報が、ユーザー行為に基づいている、請求項の方法。
  7. 少なくとも1つの認識モデルが動的に判定される、請求項1の方法。
  8. 認識されたスピーチ情報を判定するステップと、
    コンテキスト的に関係づけられたサポート情報を判定するステップと、
    認識されたスピーチ情報およびコンテキスト的に関係づけられたサポート情報の間の類似性を示す類似性メトリックに基づいて、前記認識されたスピーチ情報における顕著なトークンを判定するステップと、
    前記顕著なトークン、スピーチ情報、およびコンテキスト的に関係づけられたサポート情報に基づいて出力情報を判定するステップと、
    前記類似性メトリックに基づいて出力表示属性を判定するステップと、
    を含む、提案されたミーテイング・ノートを表示する方法。
  9. 前記出力表示属性が、スピーチ情報、コンテキスト情報、コンテキスト情報の再生または変換および顕著なトークンのうちの少なくとも1つの部分におけるズームである、請求項の方法。
  10. 関連性メトリックおよび正確性メトリックのうちの少なくとも1つに基づいた表示のための交互の顕著なトークンをランク付けするステップをさらに含む、請求項の方法。
  11. 時間、関連性スコア、および正確性スコアのうちの少なくとも1つに基づいて、ランク付けされた交互の顕著なトークンを表示するステップをさらに含む、請求項の方法。
  12. 各ランク付けされた交互の顕著なトークンに関連されかつ関連性スコアおよび正確性スコアの少なくとも1つに基づいた選択領域を動的に判定するステップをさらに含む、請求項の方法。
  13. メモリと、
    スピーチ情報および筆記情報のうちの少なくとも1つを含む第1の情報源から情報部分を検索しかつ第2の情報源からコンテキスト情報部分を検索する入力/出力回路であって、前記第1の情報源からの情報部分が、前記第2の情報源からのコンテキスト情報部分と時間的に関連づけられる入力/出力回路と、
    前記第1の情報源からの情報部分と前記第2の情報源からの時間的に関連づけられたコンテキスト情報部分とに基づいて少なくとも1つの複合認識モデルを判定し、かつ少なくとも1つの認識モデルに基づいて出力情報を判定するプロセッサと、
    を備えている、情報源からの情報を認識するシステム。
  14. 前記認識モデルが、音声情報、映像情報、および触覚情報のうちの少なくとも1つに関連づけられた特徴を認識する請求項13のシステム。
  15. 前記コンテキスト情報が、サポート情報および共同ユーザー・フィードバック情報のうちの少なくとも1つである、請求項13のシステム。
  16. 前記出力情報が、提案されたノートである、請求項13のシステム。
  17. 前記サポート情報が、聴覚情報、視覚情報および触覚情報のうちの少なくとも1つに基づいている、請求項15のシステム。
  18. 前記少なくとも1つの認識モデルが動的に判定される、請求項13のシステム。
  19. メモリと、
    認識されたスピーチ情報および概念的に関係づけられたサポート情報を受信する入力/出力回路と、
    認識されたスピーチ情報における顕著なトークンを類似性メトリックに基づいて判定しかつ認識されたスピーチ情報とコンテキスト的に関係づけられたサポート情報との間の類似性を示し、前記顕著なトークン、スピーチ情報およびコンテキスト的に関係づけられたサポート情報に基づいて出力情報を判定し、かつ前記類似性メトリックに基づいて出力表示属性を判定するプロセッサと、
    を備える、提案されたミーテイング・ノートを表示するシステム。
  20. 前記出力表示属性が、前記スピーチ情報、コンテキスト情報、コンテキスト情報の再生および変換、および顕著なトークンのうちの1つの部分におけるズーミングである、請求項19のシステム。
  21. 関連性メトリックおよび前記正確性メトリックの少なくとも1つに基づいた表示のための交互の顕著なトークンのランク付けをさらに含む、請求項19のシステム。
  22. ランク付けされた交互の顕著なトークンを、時間、関連性スコア、および正確性スコアのうちの少なくとも1つに基づいて表示することをさらに含む、請求項21のシステム。
  23. 各ランク付けされた交互の顕著なトークンに関連したかつ前記関連性スコアおよび前記正確性スコアのうちの少なくとも1つに基づいた選択領域を動的に判定することをさらに含む、請求項21のシステム。
  24. 報を認識するようにコンピュータをプログラムするコンピュータ・プログラムであって、
    第1の情報源から情報部分を判定する命令と、
    前記第1の情報源からの前記情報部分と時間的に関連された第2の情報源からのコンテキスト情報部分を判定する命令と、
    前記第1の情報源からの前記情報部分と前記第2の情報源からの時間的に関連づけられたコンテキスト情報部分とに基づいて少なくとも1つの認識モデルを判定する命令と、
    判定された認識モデルのうちの少なくとも1つに基づいて出力情報を判定する命令と、を含むコンピュータ・プログラム。
  25. 提案されたミーテイング・ノートを表示するようにコンピュータをプログラムするコンピュータ・プログラムであって、
    認識されたスピーチ情報を判定する命令と、
    コンテキスト的に関係づけられたサポート情報を判定する命令と、
    認識されたスピーチ情報とコンテキスト的に関係づけられたサポート情報との間の類似性を示す類似性メトリックに基づいて前記認識されたスピーチ情報における顕著なトークンを判定する命令と、
    前記顕著なトークン、スピーチ情報およびコンテキスト的に関係づけられたサポート情報に基づいて出力情報を判定する命令と、
    前記類似性メトリックに基づいて出力情報を判定する命令と、
    を含むコンピュータ・プログラム。
  26. 第1の情報源からの情報部分を判定するための手段と、
    前記第1の情報源からの前記情報部分に時間的に関連された第2の情報源からのコンテキスト情報部分を判定するための手段と、
    前記第1の情報源からの前記情報部分と、前記第2の情報源からの前記時間的に関連されたコンテキスト情報部分とに基づいて少なくとも1つの認識モデルを判定するための手段と、
    前記判定された認識モデルのうちの少なくとも1つに基づいて出力情報を判定するための手段と、
    を備える、情報を認識するためのシステム。
JP2005023001A 2004-02-02 2005-01-31 音声データ認識装置、ノート表示装置、音声データ認識プログラム、及びノート表示プログラム Expired - Fee Related JP4678193B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/768,675 US7542971B2 (en) 2004-02-02 2004-02-02 Systems and methods for collaborative note-taking

Publications (3)

Publication Number Publication Date
JP2005215689A JP2005215689A (ja) 2005-08-11
JP2005215689A5 true JP2005215689A5 (ja) 2008-03-06
JP4678193B2 JP4678193B2 (ja) 2011-04-27

Family

ID=34807932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005023001A Expired - Fee Related JP4678193B2 (ja) 2004-02-02 2005-01-31 音声データ認識装置、ノート表示装置、音声データ認識プログラム、及びノート表示プログラム

Country Status (2)

Country Link
US (2) US7542971B2 (ja)
JP (1) JP4678193B2 (ja)

Families Citing this family (217)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7970833B2 (en) * 2003-06-02 2011-06-28 Seiko Epson Corporation Image capture method, system and apparatus
US7542903B2 (en) * 2004-02-18 2009-06-02 Fuji Xerox Co., Ltd. Systems and methods for determining predictive models of discourse functions
US20050187772A1 (en) * 2004-02-25 2005-08-25 Fuji Xerox Co., Ltd. Systems and methods for synthesizing speech using discourse function level prosodic features
US7844464B2 (en) * 2005-07-22 2010-11-30 Multimodal Technologies, Inc. Content-based audio playback emphasis
US20060282265A1 (en) * 2005-06-10 2006-12-14 Steve Grobman Methods and apparatus to perform enhanced speech to text processing
US8924212B1 (en) * 2005-08-26 2014-12-30 At&T Intellectual Property Ii, L.P. System and method for robust access and entry to large structured data using voice form-filling
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US8266152B2 (en) * 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
WO2007103815A2 (en) * 2006-03-03 2007-09-13 Perfect Search Corporation Hyperspace index
US7881534B2 (en) 2006-06-19 2011-02-01 Microsoft Corporation Collecting and utilizing user correction feedback to improve handwriting recognition
WO2007150006A2 (en) * 2006-06-22 2007-12-27 Multimodal Technologies, Inc. Applying service levels to transcripts
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP4215792B2 (ja) * 2006-09-22 2009-01-28 株式会社東芝 会議支援装置、会議支援方法および会議支援プログラム
US8214208B2 (en) * 2006-09-28 2012-07-03 Reqall, Inc. Method and system for sharing portable voice profiles
JP2008084110A (ja) * 2006-09-28 2008-04-10 Toshiba Corp 情報表示装置、情報表示方法及び情報表示プログラム
US8631005B2 (en) * 2006-12-28 2014-01-14 Ebay Inc. Header-token driven automatic text segmentation
US8055648B2 (en) * 2007-02-01 2011-11-08 The Invention Science Fund I, Llc Managing information related to communication
US8626731B2 (en) * 2007-02-01 2014-01-07 The Invention Science Fund I, Llc Component information and auxiliary information related to information management
US20080270761A1 (en) * 2007-04-30 2008-10-30 Microsoft Corporation Techniques to generate event contexts for recurring events
US7774347B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
WO2009051791A2 (en) * 2007-10-16 2009-04-23 George Alex K Method and system for capturing voice files and rendering them searchable by keyword or phrase
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
JP2010008601A (ja) * 2008-06-25 2010-01-14 Fujitsu Ltd 案内情報表示装置、案内情報表示方法及びプログラム
JP5381988B2 (ja) * 2008-07-28 2014-01-08 日本電気株式会社 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
CA2680304C (en) * 2008-09-25 2017-08-22 Multimodal Technologies, Inc. Decoding-time prediction of non-verbalized tokens
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9129601B2 (en) * 2008-11-26 2015-09-08 At&T Intellectual Property I, L.P. System and method for dialog modeling
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
JP5257330B2 (ja) * 2009-11-06 2013-08-07 株式会社リコー 発言記録装置、発言記録方法、プログラム及び記録媒体
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8302010B2 (en) * 2010-03-29 2012-10-30 Avid Technology, Inc. Transcript editor
US9236047B2 (en) * 2010-05-21 2016-01-12 Microsoft Technology Licensing, Llc Voice stream augmented note taking
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8738375B2 (en) 2011-05-09 2014-05-27 At&T Intellectual Property I, L.P. System and method for optimizing speech recognition and natural language parameters with user feedback
US9396725B2 (en) 2011-05-09 2016-07-19 At&T Intellectual Property I, L.P. System and method for optimizing speech recognition and natural language parameters with user feedback
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
JP5799733B2 (ja) * 2011-10-12 2015-10-28 富士通株式会社 認識装置、認識プログラムおよび認識方法
KR20130045471A (ko) * 2011-10-26 2013-05-06 삼성전자주식회사 전자장치 및 그 제어방법
US9159236B2 (en) 2011-12-01 2015-10-13 Elwha Llc Presentation of shared threat information in a transportation-related context
US8811638B2 (en) 2011-12-01 2014-08-19 Elwha Llc Audible assistance
US8934652B2 (en) 2011-12-01 2015-01-13 Elwha Llc Visual presentation of speaker-related information
US9107012B2 (en) 2011-12-01 2015-08-11 Elwha Llc Vehicular threat detection based on audio signals
US9053096B2 (en) 2011-12-01 2015-06-09 Elwha Llc Language translation based on speaker-related information
US9064152B2 (en) 2011-12-01 2015-06-23 Elwha Llc Vehicular threat detection based on image analysis
US10875525B2 (en) 2011-12-01 2020-12-29 Microsoft Technology Licensing Llc Ability enhancement
US9368028B2 (en) 2011-12-01 2016-06-14 Microsoft Technology Licensing, Llc Determining threats based on information from road-based devices in a transportation-related context
US9245254B2 (en) * 2011-12-01 2016-01-26 Elwha Llc Enhanced voice conferencing with history, language translation and identification
WO2013097075A1 (en) * 2011-12-26 2013-07-04 Intel Corporation Vehicle based determination of occupant audio and visual input
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9542449B2 (en) * 2012-04-09 2017-01-10 Search For Yeti, LLC Collaboration and analysis system for disparate information sources
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) * 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US20130317988A1 (en) * 2012-05-28 2013-11-28 Ian A. R. Boyd Payment and account management system using pictooverlay technology
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9547997B2 (en) * 2013-01-03 2017-01-17 East Carolina University Methods, systems, and devices for multi-user improvement of reading comprehension using frequency altered feedback
USD716375S1 (en) 2013-01-03 2014-10-28 East Carolina University Multi-user reading comprehension therapy device
CN113470640B (zh) 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US10311743B2 (en) 2013-04-08 2019-06-04 Educational Testing Service Systems and methods for providing a multi-modal evaluation of a presentation
US20140350933A1 (en) * 2013-05-24 2014-11-27 Samsung Electronics Co., Ltd. Voice recognition apparatus and control method thereof
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10109273B1 (en) * 2013-08-29 2018-10-23 Amazon Technologies, Inc. Efficient generation of personalized spoken language understanding models
KR20150028627A (ko) * 2013-09-06 2015-03-16 삼성전자주식회사 사용자 필기를 텍스트 정보로 변환하는 방법 및 이를 수행하기 위한 전자 기기
RU2605039C2 (ru) * 2013-10-02 2016-12-20 Общество С Ограниченной Ответственностью "Яндекс" Способ и система ранжирования элементов сетевого ресурса для пользователя
US10199035B2 (en) * 2013-11-22 2019-02-05 Nuance Communications, Inc. Multi-channel speech recognition
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150161999A1 (en) * 2013-12-09 2015-06-11 Ravi Kalluri Media content consumption with individualized acoustic speech recognition
US9626961B2 (en) 2014-01-31 2017-04-18 Vivint, Inc. Systems and methods for personifying communications
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9652675B2 (en) * 2014-07-23 2017-05-16 Microsoft Technology Licensing, Llc Identifying presentation styles of educational videos
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9910644B2 (en) * 2015-03-03 2018-03-06 Microsoft Technology Licensing, Llc Integrated note-taking functionality for computing system entities
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9910840B2 (en) 2015-04-03 2018-03-06 Microsoft Technology Licensing, Llc Annotating notes from passive recording with categories
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
DE102015212413A1 (de) * 2015-07-02 2017-01-05 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zum Auswählen eines Bestandteils einer Spracheingabe
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
CN105304082B (zh) * 2015-09-08 2018-12-28 北京云知声信息技术有限公司 一种语音输出方法及装置
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
KR102474244B1 (ko) * 2015-11-20 2022-12-06 삼성전자주식회사 영상 표시 장치 및 그 동작방법
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10121474B2 (en) 2016-02-17 2018-11-06 Microsoft Technology Licensing, Llc Contextual note taking
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN107437416B (zh) * 2017-05-23 2020-11-17 创新先进技术有限公司 一种基于语音识别的咨询业务处理方法及装置
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10891800B1 (en) 2017-09-29 2021-01-12 Apple Inc. Providing features of an electronic product in an augmented reality environment
US20190129591A1 (en) * 2017-10-26 2019-05-02 International Business Machines Corporation Dynamic system and method for content and topic based synchronization during presentations
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10740555B2 (en) * 2017-12-07 2020-08-11 International Business Machines Corporation Deep learning approach to grammatical correction for incomplete parses
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
KR102225984B1 (ko) * 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
KR102346026B1 (ko) 2019-02-11 2021-12-31 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11270104B2 (en) 2020-01-13 2022-03-08 Apple Inc. Spatial and temporal sequence-to-sequence modeling for handwriting recognition
US11011253B1 (en) 2020-07-09 2021-05-18 Brian Hie Escape profiling for therapeutic and vaccine development
US11522730B2 (en) 2020-10-05 2022-12-06 International Business Machines Corporation Customized meeting notes
US11671696B2 (en) 2021-04-19 2023-06-06 Apple Inc. User interfaces for managing visual content in media
US11696017B2 (en) * 2021-05-19 2023-07-04 Apple Inc. User interface for managing audible descriptions for visual media
US20230267933A1 (en) * 2021-09-27 2023-08-24 International Business Machines Corporation Selective inclusion of speech content in documents

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5655058A (en) * 1994-04-12 1997-08-05 Xerox Corporation Segmentation of audio data for indexing of conversational speech for real-time or postprocessing applications
JP2931553B2 (ja) * 1996-08-29 1999-08-09 株式会社エイ・ティ・アール知能映像通信研究所 話題処理装置
US6269336B1 (en) * 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
JP2000231627A (ja) * 1998-12-22 2000-08-22 Xerox Corp フィードバック機構を備えた複数モード走査ペン及びこれを用いた入力方法
US6774917B1 (en) * 1999-03-11 2004-08-10 Fuji Xerox Co., Ltd. Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video
JP2001013992A (ja) * 1999-07-02 2001-01-19 Nec Corp 音声理解装置
US6594629B1 (en) * 1999-08-06 2003-07-15 International Business Machines Corporation Methods and apparatus for audio-visual speech detection and recognition
US6434547B1 (en) * 1999-10-28 2002-08-13 Qenm.Com Data capture and verification system
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7299405B1 (en) * 2000-03-08 2007-11-20 Ricoh Company, Ltd. Method and system for information management to facilitate the exchange of ideas during a collaborative effort
JP2001154693A (ja) * 1999-11-30 2001-06-08 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体
DE10085366T1 (de) * 1999-12-29 2002-12-05 Ge Harris Railway Electronics Rangierbahnhofsfunktionsmodell auf der Basis einer Betriebsablaufmodellierung
JP2001215994A (ja) * 2000-01-31 2001-08-10 Matsushita Electric Ind Co Ltd 音声認識住所検索装置と車載ナビゲーション装置
JP2003529845A (ja) * 2000-03-31 2003-10-07 アミカイ・インコーポレイテッド ネットワーク経由の多言語翻訳を提供する方法と装置
WO2001084535A2 (en) * 2000-05-02 2001-11-08 Dragon Systems, Inc. Error correction in speech recognition
US6961692B1 (en) 2000-08-01 2005-11-01 Fuji Xerox Co, Ltd. System and method for writing analysis using the linguistic discourse model
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US20030088570A1 (en) 2001-11-05 2003-05-08 Fuji Xerox Co., Ltd. Systems and methods for operating a multi-user document device via a personal device portal
JP3621686B2 (ja) * 2002-03-06 2005-02-16 日本電信電話株式会社 データ編集方法、データ編集装置、データ編集プログラム
JP2003280683A (ja) * 2002-03-20 2003-10-02 Toshiba Corp 音声認識装置、音声認識装置における音声認識制御方法、音声処理に関する辞書管理装置
US7680820B2 (en) 2002-04-19 2010-03-16 Fuji Xerox Co., Ltd. Systems and methods for displaying text recommendations during collaborative note taking
WO2004099900A2 (en) * 2002-12-20 2004-11-18 Banker Shailen V Linked information system
US20040119762A1 (en) 2002-12-24 2004-06-24 Fuji Xerox Co., Ltd. Systems and methods for freeform pasting
US7836409B2 (en) * 2003-09-26 2010-11-16 Fuji Xerox Co., Ltd. Systems and methods for using interaction information to deform representations of digital content
US7610190B2 (en) 2003-10-15 2009-10-27 Fuji Xerox Co., Ltd. Systems and methods for hybrid text summarization

Similar Documents

Publication Publication Date Title
JP2005215689A5 (ja)
KR102527281B1 (ko) 멀티미디어 재생 방법 및 그 디바이스
US9558737B2 (en) System and method for audibly presenting selected text
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
JP5855223B2 (ja) 同期されたコンテンツの再生管理
KR102396375B1 (ko) 멀티미디어 재생 방법 및 그 디바이스
JP2012053532A (ja) 情報処理装置及び方法、並びにプログラム
CN104239392A (zh) 与显示内容关联地记录音频
WO2013006221A1 (en) Method of providing instructional material while a software application is in use
US20080263067A1 (en) Method and System for Entering and Retrieving Content from an Electronic Diary
EP2849054A1 (en) Apparatus and method for selecting a control object by voice recognition
JP2924717B2 (ja) プレゼンテーション装置
US10331304B2 (en) Techniques to automatically generate bookmarks for media files
TW201142686A (en) Electronic apparatus having multi-mode interactive operation method
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
US20170132198A1 (en) Provide interactive content generation for document
JP2014067148A (ja) 手書き文書処理装置、方法およびプログラム
Chen et al. AudioBrowser: a mobile browsable information access for the visually impaired
CN110235093B (zh) 经由语义抽象的对铰链式设备的导航性辅助
TW201506685A (zh) 以語音辨識來選擇控制客體的裝置及方法
KR101853322B1 (ko) 학습 콘텐츠 편집 기능을 가진 학습 애플리케이션 제공 단말 및 그 학습 콘텐츠 편집 방법
KR102656262B1 (ko) 이미지를 이용한 중국어 연상학습 콘텐츠 제공 방법 및 장치
JP2004288008A (ja) プレゼンテーション用プログラム及びプレゼンテーション用装置
JP2007219219A (ja) 語学学習用電子機器および学習用文章リスト作成方法
TW202009891A (zh) 電子書語音朗讀裝置及其方法