TW201209804A - Digital media voice tags in social networks - Google Patents

Digital media voice tags in social networks Download PDF

Info

Publication number
TW201209804A
TW201209804A TW100106768A TW100106768A TW201209804A TW 201209804 A TW201209804 A TW 201209804A TW 100106768 A TW100106768 A TW 100106768A TW 100106768 A TW100106768 A TW 100106768A TW 201209804 A TW201209804 A TW 201209804A
Authority
TW
Taiwan
Prior art keywords
voice
tag
phoneme
sample
media object
Prior art date
Application number
TW100106768A
Other languages
English (en)
Inventor
Mark Bailey
James E Christensen
Catalina M Danis
Jason B Ellis
Thomas D Erickson
Robert G Farrell
Wendy A Kellogg
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of TW201209804A publication Critical patent/TW201209804A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/303Marking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/915Image
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/916Audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

201209804 六、發明說明: 【發明所屬之技術領域】 本發明係關於特性化媒體,且更特定言之,藉由語音標 籤特性化數位媒體。 【先前技術】 數位圖書館'照片共享網站、影像搜尋引擎、線上百科 全書及其他電腦系統皆在檔案系統或資料庫中擁有大量影 像。存取此等網站之使用纟可在查找戶斤要的影像方面有困 難,此係因為與文件不同,影像(及其他數位媒體)不包括 可索引之字或片語。 對查找所要的影像之問題的一解決方案為影像辨識,但 此方法對於使用纟產生之内容花費極高,i並不高度準 確。另一已知方法為按指定種類(諸如,資料夾)對影像分 組以促進存取。然而,此雲I人丁奴士 m此需要人工努力,且必須提前知曉 子在組織此等影像之許多方式,包括收集、集合及階 層,且織收集之—常用方法為加標籤。當使用者看到影 像時,使用者可鐘 — 予或片以對該影像「加標籤」 (描述該影像)。多個使用者可將一或多個標籤添加至同一 影像。當另一使用本 者存取该網站時,使用者可接著導覽至 由特定標籤標註之影像。 存在可❹標籤實現影像導覽之各種方式。舉例而言, 鍵入為用於—或多個影像之一集合的現有標藏之 子$ 5吾。或者,使用者可看到按各種方式(按字母順 154436.doc 201209804 , 序、按風行度等)排列之標籤,且接著選擇描述該(等)影像 之標籤。廣泛使用且良好地理解用於社群導覽之文字加標 籤的功效。 亦存在呈現數位媒體使得使用者可掃描且識別項目之多 個方式(拼貼、柵格、觀測)。此等方法之一主要缺點為其 不可縮放:顯示變得潼亂,且螢幕可能用完像素,尤其在 小螢幕上’諸如’在行動裝置上。 亦存在「自動」處理數位媒體以得出可接著用於搜尋之 中繼資料的多個方式。中繼資料(位置、時間)可在影像獲 取時捕獲,且隨後用以導覽至視覺數位媒體。 然而,存在創建或使用文字標籤不可能或不方便之許多 it形。實例包括當使用者:正使用行動電話(花了長時間 或將注意力自視覺任務轉至鍵入字或片語)時;身體殘疾 (不能鍵入字或片語)時;由於受教育有限而文盲或半文盲 (僅具有有限的閱讀或書寫能力)時;或具有視力問題(不能 看到字或片語)或此等情形之組合時。 【發明内容】 根據本發明之-實施例,提供一種系統,其包括一用戶 端計算裝置,該用戶端計算裝置包括—媒體物件捕獲裝置 及-語音捕獲裝置且運作使媒體物件與語音樣本相關聯之 一用戶端應用程式。此實施例之該系統亦包括:一通传網 路,其麵接至該用戶端計算裝置;-語音加標藏系統,其 耗接至該通信網路且垃|Wp JU Μ. u , 内峪五接收在一第一媒體物件與一第—語音 樣本之間的至少一翮辨. 〇〇 關聯,及一資料庫,其耦接至該語音加 154436.doc 201209804 標籤系統,該資料庫包括一或多個語音標籤,每一語音標 臧叙接至一或多個語音樣本。 根據本發明之另一實施例,揭示一種對媒體物件加標籤 之方法。此實施例之該方法包括:在一伺服器處接收一第 一語音樣本與一第一媒體物件之間的一關聯;比較該第一 語音樣本與一或多個其他語音樣本;將該第一語音樣本連 結至一第一語音標籤;將該第一語音標籤連結至該第一媒 體物件;及將該第一語音樣本、該第一語音標籤、該第一 媒體物件及其間之任何連結儲存於耦接至該伺服器之一資 料庫中。 根據本發明之另一實施例,揭示一種搜尋含有加語音標 籤之媒體物件的數位資料庫之方法。該方法包括:在一伺 服器處接收一第一音訊搜尋;比較該第一音訊搜尋與儲存 於該數位資料庫中的語音標籤之數位表示;及返回連結至 匹配該第一音訊搜尋之語音標籤之一或多個媒體物件。 經由本發明之技術認識到額外特徵及優點。本發明之其 他實施例及態樣在本文中得以詳細描述且被認為所主張之 本發明之一部分。為了更好地理解具有該等優點及該等特 徵之本發明,參考描述及圖式。 【實施方式】 被看作本發明之標的物在說明書結尾在申請專利範圍中 經特別地指出且清楚地主張。自以下結合附圖之詳細描 述,本發明之前述及其他特徵及優點係顯而易見的。 本發明之實施例可解決以上描述之問題或其他未提到之 154436.doc 201209804 問題中的-些或全部。在一些情況下,本發明之系統及方 法允許使用者藉由音訊識別符對媒體物件加標籤。此等音 訊識別符可在本文中被稱作「語音樣本」。此外,本發; 包括用於基於「語音查詢」搜尋連結至資料庫中之語音樣 本的媒體物件之系統及方法。語音查詢為人類語言令之丄 連串字,每-字由-連宰音素組成。若語音查詢聽起來像 一或多個語音樣本,則連結至此等語音樣本之此等標藏將 用以擷取媒體物件。 在-實施例中,提供用於使用者藉由其說出字或片語之 語音的音訊記錄對數位媒體加標藏之方法,及用於使用者 使用此等語音標籤搜尋且劉覽數位媒體之另一方法。應理 解’ 「使用者」為說出字或片語之人’未必為語音標藏提 供至的裝置之擁有者。 特定言之,一些實施例提供用於藉由口頭音訊(例如, 字及片語)對影像及其他數位媒體加標藏之系統及方法。 本文中揭示之系統及方法可包括將語音樣本中之一連串立 素辨識為標籤之能力。隨後,若同_或另—使用者講出: 配的音素’則…揭示之系統及方法可操取 數位媒體。 =提供用於使用者收聽語音標籤及選擇標籤中之一者以 接著掏取相關聯之數位媒體的方法。可按字母順序、按風 行度、按階層或按其他方式排列標籤。在階層中, 具體標籤前呈現較概括標籤,且標籤可具有同義字(如由 使用者對標藏之特定性或相似性層級的判斷所判定)。若 154436.doc 201209804 k擇處於給疋層級之標籤, 且驹神〜+ Γ呈現在下一向下層級的更 八體軚鐵或可記錄用於選定 疋知戡之新同義字。若在給定層 級下無標籤被選擇,則一栌蕕 w籤可!s己錄且添加至在此層級 n ㈣語音標籤時’則連結之語音樣本 的音訊特性(例如,響度)可用以指示該標籤相對於該組全 部標籤之風行度或其他特性以及身分(若揚聲器可用以根 據偏好選擇標籤或標籤之特定語音樣本舉例而言,吾 人可在Ρ丨其他使用者語音前更喜歡聽到其自己的語音。 —圖1展示本發明之實施例可實施於其上的計算系統之一 實例。在此實施例,系統100具有一或多個中央處理單元 (處理器mu、1Glb、1()1(:等(被共稱作或統稱作處理器 ιοί)。在一實施例中,每一處理器101可包括一精簡指令 集電腦(RISC)微處理器。處理器1〇1經由系統匯流排ιΐ3耦 接至系統記憶體114及各種其他組件。唯讀記憶體 (R〇M)1〇2耦接至系統匯流排113,且可包括一基本輸入/輸 出系統(BIOS),BIOS控制系統1〇〇之某些基本功能。 圖1進一步描繪耦接至系統匯流排113之輸入/輸出(1/〇) 配接器107及網路配接器1〇6。I/O配接器1〇7可為與硬碟 10 3及/或帶儲存驅動機1 〇 5或任何其他類似組件通信之小 電服系統介面(SCSI)配接益。I/O配接器1〇7、硬碟1〇3及帶 儲存驅動機105在本文中被共稱作大容量儲存器丨〇4。網路 配接器106與外部網路116—起與匯流排113互連,從而使 資料處理系統100能夠與其他此等系統通信》螢幕(例如, 顯示監視器)115藉由顯示配接器112連接至系統匯流排 154436.doc 201209804 113,顯示配接器112可包括一圖形配接器(用以改良需要 大量圖形之應用及之效能)及一視訊控制器。在一實施例 中,配接器107、106及112可連接至一或多個I/O匯流排, 該一或多個I/O匯流排可經由中間匯流排橋接器圖中未展 示連接至系統匯流排113 »用於連接周邊裝置(諸如,硬碟 控制器、網路配接器及圖形配接器)之合適的I/O匯流排通 常包括共同協定’諸如’周邊組件介面(PCI)。額外輸入/ 輸出裝置經展示為經由使用者介面配接器1〇8及顯示配接 器112連接至系統匯流排113。鍵盤1 〇9、滑鼠1 1 〇及揚聲器 111皆經由使用者介面配接器1 〇8互連至匯流排丨丨3,使用 者介面配接器108可包括(例如)將多個裝置配接器整合至一 單一積體電路中之超級I/O晶片。當然,可包括諸如數位 相機或數位視訊相機(或以數位格式供應一或多個影像之 其他構件)及麥克風之其他輸入作為額外輸入裝置。 因此’如圖1中所組態,系統1〇〇包括呈處理器1〇1之形 式的處理構件、包括系統記憶體114及大容量儲存器1〇4之 儲存構件、諸如鍵盤及滑鼠11〇之輸入構件,及包括揚 聲器111及顯示器115之輸出構件。在一實施例中,系統記 憶體114及大容量儲存器104之一部分共同地儲存一作業系 統(諸如,來自IBM Corporation之AIX⑥作業系統)以協調圖 1中展示的各種組件之功能。 應瞭解,系統100可為任何合適的電腦或計算平台,且 可包括終端機、無線裝置、資訊用具、裝置、工作站、微 型電腦、大型電腦、個人數位助理(PDA)或其他計算裝 154436.doc 201209804 置。應理解,系統100可包括藉由一通信網路連結在一起 之多個計算裝置。舉例而言,在兩系統之間可存在用戶端 —伺服器關係,且可在兩者之間分開進行處理。 可由系統100支援的作業系統之實例包括Wind〇ws 95、 Windows 98 ' Windows NT 4.0 > Windows XP , Windows 2000、Windows CE、Windows Vista、Mac OS、java、 AIX、LINUX及UNIX或任何其他合適的作業系統。系統 100亦包括一用於在網路116上通信之網路介面1〇6。網路 116可為區域網路(LAN)、都會網路(Man)或廣域網路 (WAN)(諸如’網際網路或全球資訊網)。 系統1〇〇之使用者可經由任何合適的網路介面116連接 (諸如,標準電話線、數位用戶線、LAN或WAN鏈路(例 如,ΤΙ、T3)、寬頻連接(訊框中繼、ATM)及無線連接(例 如,802.1 1 ⑷、802.1 1 (b)、802.1 1 (g)))連接至網路。 如本文中揭示,系統1〇〇包括儲存於機器可讀媒體(例 如,硬碟104)上用於使用者之螢幕115上展示的資訊之捕 獲及互動顯示的機器可讀指令。如本文中論述,該等指令 被稱作「軟體」120。可使用如此項技術中已知之軟體開 發工具生產軟體120。軟體120可包括如此項技術中已知之 用於提供使用者互動能力之各種工具及特徵。 在一些實施例中’將軟體120提供為對另一程式之覆 蓋。舉例而言,可將軟體12〇提供為針對一應用程式(或作 業系統)之「内插式附件(add_in)」。注意,術語「内插式 附件」通常指如此項技術中已知之補充程式碼。在此等實 154436.doc 201209804 施例中,軟體120替換其合作的應用程式或作業系統之結 構或物件。 應理解’在—實施例中,本發明之系統可按—特定方式 經組態’ 包括多個計算裝置。為此,圖2展示根據本發 明之實靶例的系統200之一實例。可利用系統2〇〇以實施 本文中揭示之方法。 系統200包括一或多個用戶端計算裝置2〇2。用戶端計算 裝置202可為任何類型之計算裝置。在一實施例中,用戶 端什算裝置202包括一麥克風及一揚聲器。在一實施例 中,且如圖2中所示,用戶端計算裝置202可為蜂巢式或 「智慧」電話、PDA或包括一麥克風2〇4及一揚聲器2〇6之 其他手持型通信(計算)裝置。為了完整性,用戶端計算裝 置202之其他組件可包括—數位相機2〇8、一顯示幕21〇及 一輸入小鍵盤212。應理解,可將用戶端計算裝置2〇2之組 件中的一些組合在—起。舉例而言,顯示幕21〇可包括輸 入能力,且因此,包括用於輸入資訊以及顯示(例如)影像 之構件。在一實施例中’用戶端計算裝置2〇2可包括運作 用戶端應用程式、連接至無線資料網路、捕獲一或多個影 像、顯示影像、捕獲音訊及廣播音訊之能力。 用戶端計算裝置202可耦接至通信網路2 14。在一實施例 中’通信網路214可為蜂巢式網路。舉例而言,通信網路 214可為〇8!^、丁〇]\4八、2〇、30或40無線網路。通信網路 214亦可為諸如WIMAX或802.1 1之無線資料網路。當然, 通信鏈路216可為無線或實體的。在一實施例中,通信網 154436.doc 201209804 路可為企業㈣網路或網際網路 系統亦可包括一語音加標❹統218。語音加標❹ 統218耗接至通仏網路214。因此,語音加標籤系統218可 在通信網路214上與用戶端計算裝置搬通信。在-實施例 中可將叩曰加;^鐵系統218植人於—饲服器上。在—些 實施例中…加標籤系統218可經組態以運作一 web應用 程式’該福應用程式處置對媒體物件及語音標籤之請求 且執灯浯音標滅匹配。在—實施例中,語音加標籤系統 218可包括具有用於人類語言之—音素層級話語模型之一 處理單,若給定_語音樣本,則該話語處理單元將 返回一連串最緊密匹配的音素。當然:’該話語處理單元可 處於-獨立的單元中或可實施於一獨立的單元上。 系統200亦可包括一耗接至語音加標藏系統叫之資料庫 220。資料庫220可儲存由語音加標籤系統218利用之資 訊。在—實施例中,語音加標籤系統218可在其内包括資 料庫220。 圖3a展示可儲存於資料庫22〇中的資訊之一實例。在一 實施例中,資料庫22〇可包括一語音標籤儲存器、數位 媒體304及一講話者登錄檔3〇6。當然,資料庫22〇無需按 此特定方式劃分。 數位媒體儲存器3〇4可包括數位媒體物件。數位媒體物 件可包括能夠視覺重現的任何類型之媒體,包括(但不限 於)影像、文件、動畫及視訊。應理解,在一實施例中, 可用於語音加標籤系統218(圖2)之所有數位媒體可不儲存 I54436.doc -11 - 201209804 於單一位置中,且可散佈於多個資料庫22〇上。 講話者登錄檔306可包括與一特定講話者相關聯之語音 剪輯。在-實施例中’語音剪輯中之—些或全部可與^ 語音剪輯之音素表示相Μ。此彳對於語音加才票藏並不需 要,但可用於以下論述之講話者識別驗證(SIV)中。 語音標籤為儲存一或多個語音剪輯與一或多個數位媒體 物件之間的關聯之物件,且儲存於語音標籤儲存器 中。在一實施例中,「加標籤」應指創建媒體物件與語音 樣本之間的關聯。相比之下,語音標籤儲存器3〇2中之嗜 音標籤包括至至少一媒體物件及一語音樣本之連結。 ° 圖3b展示講話者登錄檔306之較詳細版本。講話者登錄 稽唯· 一地識別語音加標籤系統之使用者。講話者可具有被 識別之不同方式:使用觸控式螢幕鍵入其姓名或特殊代 碼、匹配之語音剪輯(「說出字「baggage」」)、來自來電 顯示之電話號碼,或產生可連結至語音剪輯以識別在記錄 語音剪輯時正交談的講話者之唯一講話者身分之任何其他 方式。 圖4展示具有數位媒體儲存器3〇4與講話者登錄檔3〇6之 間的連結之資料庫220之一實例。更詳細地,圖4展示語音 剪輯402、404、406及408與數位媒體物件43 〇及432之間的 可能連接中之一些之實例。第一語音剪輯4〇2表示某一講 話者講出字「wheat」之剪輯。第一語音剪輯4〇2連結至第 一語音剪輯402之講話者身分410及音素表示412。 可按許多不同方式形成音素表示412(以及用於其他語音 154436.doc -12- 201209804 剪輯之任何其他音素表示)^在一實施例中,可將音訊剪 輯分成s吾音片段及非語音片段’且接著,可利用已知或曰 後開發之技術辨識語音部分之音素。如展示,以實例說 明,第一語音剪輯402可表示描繪為字母r wheet」之音素 「hwet」。 第一語音標籤426亦可連結至耦接至第二講話者身分414 及音素表示416之第二語音剪輯404。在此實施例中,第二 语音剪輯404表示由字母「weet」描繪之音素「w0t」。可 實施音素匹配演算法以推斷:當由不同人講話時,第一語 音剪輯402與第二語音剪輯404皆實際上為同一字。此匹配 可包括(例如)基於字之開始及因此用於字的音素之序列之 開頭按同一方式分類之語音剪輯。因此,舉例而言,每一 語音剪輯中之前N=3個音素經辨識且與其他者相比較。當 然’可利用其他分類技術,諸如’表示使兩個序列相同所 必需的添加、刪除及移動之數目的「編輯距離」。無論如 何’第一語音標籤426與第一數位媒體物件430相關聯。 第二語音標籤428與第一數位媒體物件430及第二數位媒 體物件432兩者相關聯。此說明本發明允許將一語音標籤 連結至包括不同類型之數位媒體物件(諸如,影像及視訊) 的一或多個數位媒體物件之原理。類似於第一語音標籤 426,第二語音標籤428可連結至一或多個語音剪輯。在此 貫例中,第一 §吾音標戴428連結至第三語音剪輯406及第四 語音剪輯4〇8。第三語音剪輯406連結至講話者身分418及 音素表示420。類似地’第四語音剪輯408連結至講話者身 154436.doc -13- 201209804 分422及音素表示424 »當然,在一實施例中,可組合該等 講話者身分。 使用者可創建語音剪輯與媒體物件之間的關聯。此等關 聯可用以創建語音標籤及創建語音標籤、數位媒體物件與 語音剪輯之間的連結(如圖4中所示)。此等連結可(例如)由 語音加標籤系統218(圖2)創建。當記錄音訊剪輯時,可創 建講話者身分與音訊剪輯之間的連結。亦可由語音加標籤 系統218創建與每一語音剪輯相關聯之音素表示且將其連 結至語音剪輯。如所示,講話者丨(區塊422)講出語音剪輯 406及408兩者。當收聽標籤428時,語音剪輯406可較佳, 此係由於包括清晰性、講話時間、音量等之許多可組態原 因。 影像之加標籤 存在可根據本發明對影像加標籤之若干方式。關於圖5 揭示一方法。在區塊5〇2處,獲取一媒體物件且呈現給使 用者。可按不同方式獲取媒體物件。舉例而言,媒體物件 可由使用者藉由建置於使用者之蜂巢式電話内的數位相機 拍照而獲取。在另一實施例中,可自資料庫將媒體物件下 載至使用者之蜂巢式電話之螢幕。當然,在不脫離本發明 之情況下’可執行其他獲取影像之方法。在一實施例中, 媒體物件必須為使用者可見以便對影像加標籤。當然,此 並非必需的。 在區塊504處,啟用語音加標籤應用程式。語音加標籤 應用程式可為(例如)能夠接收語音樣本且使其與正觀看之 154436.doc -14· 201209804 影像相關聯的用戶端應用程式。在—實施例中,語音加標 籤應用程式為在蜂巢式電話上之用戶端應用程式。 不 中 本 在區塊506處,自使用者接收語音樣本。在一實施例 ,可在對使用者呈現影像或其他媒體物件時接收語音樣 在區塊507處,可分析語音樣本以判定講話者之身分。 右無講話者可識別,則語音加標籤系統可與一匿名講話者 一起操作。可使用各種資訊判定講話者身分,包括(但不 限於)來電顯示(電活號碼)、講話者身分驗證(siv)及在電 活小鍵盤上鍵入姓名。儲存於講話者登錄檔中之一或多個 語音樣本亦可用以匹配由使用者提供且儲存於講話者登錄 檔中之語音樣本》視情況,若在區塊5〇7處不存在匹配, 則可在講話者登錄檔中創建新講話者身分。在此情況下, 可能需要與使用者之對話來記錄語音剪輯、姓名、電話號 碼或其他識別資訊。 ' 在區塊508處,創建語音樣本與媒體物件之間的關聯。 此關聯可處於語音樣本與下載之媒體檔案、已载入於裝置 上之媒體或由使用者創建之媒體物件之間。無論如何,關 聯可描述語音剪輯之位置及媒體物件位置及創建關聯之時 間。 在區塊510處’可將關聯傳輸至語音加標籤系統。當 然,若語音樣本或媒體物件先前未儲存於資料庫中,則可 將語音樣本或媒體物件與關聯一起傳輸。舉例而言,若使 用者自資料庫220(圖2)下載影像,且用語音樣本對該影像 154436.doc •15· 201209804 加標籤,則僅需要傳輸該語音樣本及關聯。所傳輸的 關聯之外的資料可為系統特定的且可組態,且視特定情形 而定。 創建加標叙之影像之資料庫 如上論述,個別使用者可創建語音樣本與媒體物件之間 的關聯。此等關聯形成圖4中展示之連結之基礎。圖6為展 示根據本發明之一實施例的形成資料庫之方法之流程圖。 在區塊6〇2處,接收-關聯。該關聯使語音樣本與媒體 物件相關聯。該關聯可來自(例如)同時記錄語音樣本及顯 不影像。或者,關聯可來自允許在不顯示影像之情況下進 行關聯之系統。在-實施例中,可將媒體物件及語音樣本 中之-者或兩者與關聯一起接收,例如,在媒體物件或語 音樣本甲之一者或兩者尚未存在於資料庫中之情況下。可 (例如)藉由語音加標籤系統218(圖2)接收關聯。 在區塊604處,將語音樣本轉換成音素表示。可藉由已 知技術創建音素表示。音素表示連結至語音樣本。此外, 若語音樣本之講話者已知,則音素表示可連結至在講話者 登錄檀令的語音樣本之創建者。此連結可將每-語音樣本 U至夕—4❹身分。例如’當不能識別唯-講話者 時,或當不使用講話者識別且因此所有語音樣本連結至匿 名講話者身分時,講話者身分可識別唯一匿名使用者。當 然,多個樣本可連結至一單一身分。 在區塊6G6處’比較在資料庫中之現有語音樣本之音素 表不與新接收之語音樣本之音素表示。存在執行此匹配之 J54436.doc • 16 · 201209804 許多方式。一實例包括匹配(及因此分類)基於字之開始聽 起來相似之字。此匹配可包括:針對此等N個音素中之每 一者’操取在語音樣本中辨識之前Μ個音素。對於一些情 形’可使用少至Μ=3個音素。對於每一語音標籤,依序比 較該等音素。標籤接收基於匹配其第Μ個音素之程度的計 分。可權衡比第Μ個音素高的與第M-1個音素之匹配。在 貫施例中,匹配度係基於音素之匹配特徵(諸如,濁輔 音及清輔音)之數目,且無匹配接收計分_丨。每個音素存在 5個特徵,因此,最佳計分為丨5且最差為_3。 在區塊608處,判定是否存在新語音樣本與現有語音樣 本之間的匹配。若多個現有語音樣本自現有語音樣本之資 料庫擷取且匹配,則使用者可選擇最佳者。在彼情況下, 存在與單一浯音樣本之匹配,在區塊6丨〇處,新語音樣本 連結至現有語音樣本連結至之語音標籤。舉例而言,再次 參看圖4,第一浯音剪輯4〇2及第二語音剪輯4〇4皆連結至 語音標鐵426。此可發生仙為第一語音剪輯權先前連結 至》。a ‘籤4:26。當將第二語音剪輯4〇4置放於系統中時, 第一曰素表不416匹配第一音素表示412。因此,第一音素 表不412及第二音素表示416皆指派至同一語音標籤(語音 標籤426)。 '現返回參看圖6,如上所論述,每一語音標籤連結至至 媒體物件及至少一語音樣本。在區塊處,判定連 結至現有語音標籤之媒體物件是否匹配與新語音樣本相關 聯之媒體物件:如此,則可記錄關於加標籤過程之資訊 154436.doc •17· 201209804 且該過程可結束。舉例而言,可將已對影像加標籤之次數 記錄於資料庫220(圖2)中。否則,在區塊614處’將語音標 籤連結至與新語音樣本相關聯之媒體物件。以此方式,可 使單一語音標籤與多個媒體物件相關聯。 在不存在新語音樣本與現有語音樣本之間的匹配(亦 即,此為先前未講出的字之語音樣本)之情況下,在區塊 616處,創建新語音標籤。接著在區塊6丨8處,將新創建之 语音標籤連結至新語音樣本。新創建之語音標籤用於開始 於已描述之區塊612處的處理。因此,若此為與匹配媒體 物件之關聯,則將新語音標籤連結至語音樣本先前相關聯 之媒體物件。若此為非匹配新媒體物件,則新創建之標籤 將連結至新媒體物#。因此可能使用新記錄之語音樣本對 新捕獲之影像加語音標籤,在該情況下,該語音樣本不匹 配任何現有標籤。 如上所論述,講話者登錄檔3〇6可用以唯一地識別語音 加標籤系統之使用者。可如上所述搜集用於講話者之資 訊0 搜尋加標叙之影像之資料庫 之方式,以下描述 以上描述詳述了可創建及修改資料庫 描述在一實施例中可搜尋資料庫之方式 圖7為展不搜*且操取加語音標籤之媒體物件之方法之 机私圖纟區塊702處’語音加標鐵系統之使用者啟用在 其用戶端計算裝置上之系统— 示既在—實施例中,用戶端計算 裝置可為蜂巢式電話。在另—寄^ y 任力貫施例中,能夠拍照且記錄 154436.doc -18- 201209804 及播放聲音且在WiFi網路上操作之觸控式螢幕裝置可形成 用戶端計算裝置。 在區塊704處’創建利用語音搜尋項之搜尋。此可包括 使用者對著麥克風說出字。接著在區塊706處將搜尋提交 至伺服器。 在區塊708處’伺服器(例如’語音加標籤系統218,圖 2)使語音搜尋項與現有語音標籤匹配。此匹配可包括將(多 個)搜尋項分成語音片段及非語音片段。接著,針對每一 語音片段,可形成一音素表示《可比較此等音素表示與連 結至語音標籤之現有音素表示,且基於與語音標籤一起儲 存的現有語音樣本之音素表示之匹配計分針對每一語音標 籤創建一「匹配計分」。可使用以上描述之匹配計分針對 每一語音標籤判定最佳匹配。 在區塊710處,將結果返回至搜尋者。在多個語音標籤 具有足夠高計分之情況下’返回彼等標籤。在未發現標籤 之情況下’可將此對搜哥者指示。假定存在匹配,則可將 關聯呈現給使用者。對搜尋者顯示連結至選定標籤之一或 多個匹配媒體物件。在觸控式螢幕裝置上選擇匹配媒體物 件可藉由播放具有最佳計分之相關聯的語音樣本來播放與 每一媒體物件相關聯之語音標籤。 在一替代實施例中’捕獲一影像且經由MMS(多媒體訊 息傳遞服務)來發送’且系統執行語音輸入之階層分類。 在此實施例中,系統可包括一「語音閘道器」,該語音閘 道器自身為將使用者之電話(經由公眾交換電話網路或 154436.doc 201209804 PSTN)連接至電腦系統的組件之總成。 現返回參看圖2,在此實施例中,語音加標鐵系統218可 經組態以操作一互動式語音響應系統(ivr)]vr系統可處 理使用者之小鍵盤輸入,且引導語音閘道器播放及/或記 錄音訊串流(亦稱作音訊剪輯或語音剪輯系統亦可包括 一無線手持型電^,該無線手持型電話能夠記錄且顯示影 像且具有與語音加標籤系統218之無線資料連接。如先前 所述,影像(或其他數位媒體)可儲存且連結於資料庫22〇 中。該系統亦可包括用以對其他使用者通知新書籤的至外 部(在本IVR外部)服務之一或多個介面。實例為公眾域電 子郵件網路、由無線電信廠商(服務提供者)擁有及運營之 SMS(簡訊服務)及MMS(多媒體訊息服務)網路,及公眾交 換電話網路(PSTN)。 在此實施例中,使用者調用在連接至PSTN的任一行動 相機電話上之IVR系統,且歷經以下步驟以階層分類照 片· 1 ·使用者藉由其相機電話拍照;使用者將照片自其行 動電話發送至IVR服務(使用電子郵件或河“” ;3 IVR服 務將照片儲存至資料庫中且將照片添加至一仲列未加㈣ 之照片;4.使用者登入IVR服務。使用者之電話的來電顯 示或明確的登入亦用以識別使用者;使用者藉由收聽與每 一未加標籤之照片相關聯的中繼資料之文字至話音(tts) 產生而使用IVR選單選擇照片。在此實施例中,使用該仔 列中每一未加標籤之照片之上載時間;使用者接著由ivr 提示其是否想要對該照片加標籤,且若如此,則自語音標 154436.doc -20. 201209804 籤之先前記錄之階層建構iVR選單樹;8在…厌選單樹中之 每-層級N處,對該使用者提示:a)選擇一適當標藏,^ 創建-新標籤,或c)刪除一標籤;9.若使用者已選擇一適 當標籤,則擷取在層級N+1處之語音標籤;及1〇若無更多 特定標籤可用,則將該語音標籤與照片一起儲存。 本文中使用之術語僅係用於描述特定實施例之目的,且 並不意欲限制本發明。如本文中所使用,單數形式「一」 及「該」意欲亦包括複數形式,除非上下文另有清晰^ 示。應進一步理解,當術語r包含」用於此說明書中時, 其指定所述特徵、整數、步驟、操作、元件及/或組件之 存在,但並不排除一或多個其他特徵、整數、步驟、操 作、元件、組件及/或其群組之存在或添加。 以下申言青專利範圍中之所有構件或步驟加功能元件之對 應結構、材料、動作及等效物意欲包括用於連同如具體所 主張之其他所主張元件一起執行功能的任何結構、材料或 動作。已呈現本發明之描述以用於達成說明及描述之目 的,但其並不意欲為詳盡的或限於所揭示之形式下的本發 明。在不脫離本發明之範疇及精神之情況下,許多修改及 變化對於一般熟習此項技術者將顯而易見。選擇並描述了 實施例以便最佳地解釋本發明之原理及實務應用,且使其 他一般熟習此項技術者能夠針對具有適合於所預期特定用 途的各種修改之各種實施例來理解本發明。 本文中描繪之流程圖僅為一實例。在不脫離本發明之精 神的情況下,可存在對本文中描述之此圖或步驟(或操作) J54436.doc •21 · 201209804 之許多變化。舉例而言,可按一不同次序執行該等步驟, 或者可添加、刪除或修改步驟。將所有此等變化考慮為所 主張之本發明之一部分。 儘管已描述了本發明之較佳實施例,但熟習此項技術者 應理解,在現在及將來,可進行屬於以下申請專利範圍之 範疇之各種改良及增強。此等申請專利範圍應被認作維持 對最初描述之本發明的適度保護。 【圖式簡單說明】 圖1展示本發明之實施例可實施於其上的計算系統之— 實例; 圖2展示根據本發明之一實施例的系統之一實例; 圖3展不可在圖2中展示之系統中利用的資料庫之一實施 例之方塊圖; 圖4為圖3中展示的資料庫之更詳細描繪; 圖5為展示根據本發明的可對媒體物件加標籤之方法之 流程圖; 圖6為展示根據本發明之一實施例的形成資料庫之方法 之流程圖;及 圆7為展不根據本發明之一實施例的搜尋且擷取加扭立 標籤之媒體物件之方法之流程圖。 【主要元件符號說明】 100 資料處理系統 101a 中央處理單元(處理器) 101b 中央處理單元(處理器) 154436.doc -22- 201209804 101c 中央處理單元(處理器) 102 唯讀記憶體(ROM) 103 硬碟 104 大容量儲存器 105 帶儲存驅動機 106 網路配接器 107 輸入/輸出(I/O)配接器 108 使用者介面配接器 109 鍵盤 110 滑鼠 111 揚聲器 112 顯示配接器 113 系統匯流排 1 14 系統記憶體 115 螢幕/顯示器 116 網路/網路介面 120 軟體 202 用戶端計算裝置 204 麥克風 206 揚聲器 208 數位相機 210 顯示幕 212 輸入小鍵盤 214 通信網路 I54436.doc •23. 201209804 216 通信鍵路 218 語音加標籤系統 220 資料庫 302 語音標籤儲存器 304 數位媒體/數位媒體儲存器 306 講話者登錄檔 402 第一語音剪輯 404 第二語音剪輯 406 第三語音剪輯 408 第四語音剪輯 410 講話者身分 412 音素表示 414 第二講話者身分 416 音素表不 418 講話者身分 420 音素表示 422 講話者身分 424 音素表示 426 第一語音標籤 428 第二語音標籤 430 第一數位媒體物件 432 第二數位媒體物件 154436.doc -24-

Claims (1)

  1. 201209804 七、申請專利範圍: 1. 一種數位媒體系統,包含: 用戶%叶算裝置,該用戶嫂斗I 件捕獲裝置及一_,十异裝置包括一媒體物 m 9捕獲裝置,且運作使媒體物件盘狂 曰樣本相關聯之一用戶端應用程式; 一 通L 同路’其麵接至該用戶端計算裝置; °°曰加標籤系統’其耦接至該通信網路且接收在一 第-媒體物件盥一第一立 _ 第°° 9樣本之間的至少一關聯;及 一厂庫其耦接至該語音加標籤系統,該資料庫包 括-或多個語音標籤,每—語音標籤柄接至—或多個語 音樣本。 2. 如明求項1之系統,其中儲存於該資料庫中之至少一語 音樣本具有一音素表示。 3. 如請求項2之系統 話者身分。 其中該至少一語音樣本連結至一講 4. 如凊求項1之系統,其中具有類似音素表示之多個語音 樣本連結至一語音標籤。 5. 如睛求項1之系統,其甲該第一媒體物件為—影像。 6. 一種對媒體物件加標籤之方法,該方法包含: 在飼服益處接收一第一語音樣本與—第一媒體物件 之間的一關聯; 比較該第__語音樣本與_或多個其他語音樣本; 將δ亥第—語音樣本連結至一第一語音標籤; 將該第一語音標籤連結至該第一媒體物件;及 154436.doc 201209804 將該第—語音樣本、該第-語音標籤、該第-媒體物 間之任何連結儲存於耦接至該伺服器之一資料 中。 7. 8. 9. 10. 11. 12. 月长項6之方法’其中自一蜂巢式電話接收該關聯。 如請求項7 $ t、土 *4. 4 其中自該資料庫彌取該第一媒體物 件且使其呈現於該蜂巢式電話上。 如請求項6之方法’其中該比較包括: 形成用於該第-語音樣本之一第一音素表示;及 比較该第-音素表示與連結至該一或多個其他語音樣 本之其他音素表示。 ’ 如請求項9之方法’其中在該第一音素表示匹配該—或 多個其他語音樣本中之_者之情況下,該[語音樣本 連結至該第一語音標籤’該第一語音標籤先前連結至嗜 :或多個其他語音樣本中之該—者,或在該第—音素^ 不不匹配該一或多個其他語音樣本中之一者之情況下, 將該第-語音樣本連結㈣第—語音標籤進—步包括: 在判定該第-音素表示不匹配該一或多個其他語音樣 本中之一者後,創建該第一標籤。 如請求項7之方法,進一步包含: 將該第一語音標籤連結至一第二媒體物件。 -種搜尋含有加語音標籤之媒體物件的一數位資料庫之 方法,該方法包含: 在一伺服器處接收—第一音訊搜尋; 比較該第一音訊搜尋與儲存於該數位資料庫中的語音 154436.doc 201209804 標籤之數位表示;及 返回連結至匹配該第一音訊搜尋之語音標籤之一或多 個媒體物件。 13 ·如請求項12之方法,其中比較包括: 將該第一音訊搜尋轉換為一第一音素表示;及 計算該第一音素表示與連結至該等語音標籤之其他音 素表示之間的一相似性計分。 14. 如請求項13之方法,其中該相似性計分係基於該第一音 素表示之一開頭部分。 15. 如請求項12之方法,其中該返回包括: 重放該第一音訊搜尋之至少一部分。 154436.doc
TW100106768A 2010-03-05 2011-03-01 Digital media voice tags in social networks TW201209804A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/718,041 US8903847B2 (en) 2010-03-05 2010-03-05 Digital media voice tags in social networks

Publications (1)

Publication Number Publication Date
TW201209804A true TW201209804A (en) 2012-03-01

Family

ID=44532204

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100106768A TW201209804A (en) 2010-03-05 2011-03-01 Digital media voice tags in social networks

Country Status (6)

Country Link
US (1) US8903847B2 (zh)
JP (1) JP5671557B2 (zh)
CN (1) CN102782751B (zh)
GB (1) GB2491324B (zh)
TW (1) TW201209804A (zh)
WO (1) WO2011109137A1 (zh)

Families Citing this family (184)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110115931A1 (en) * 2009-11-17 2011-05-19 Kulinets Joseph M Image management system and method of controlling an image capturing device using a mobile communication device
US20110115930A1 (en) * 2009-11-17 2011-05-19 Kulinets Joseph M Image management system and method of selecting at least one of a plurality of cameras
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8903847B2 (en) 2010-03-05 2014-12-02 International Business Machines Corporation Digital media voice tags in social networks
US20120244842A1 (en) 2011-03-21 2012-09-27 International Business Machines Corporation Data Session Synchronization With Phone Numbers
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8688090B2 (en) 2011-03-21 2014-04-01 International Business Machines Corporation Data session preferences
US20120246238A1 (en) 2011-03-21 2012-09-27 International Business Machines Corporation Asynchronous messaging tags
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
WO2013039473A1 (en) 2011-09-12 2013-03-21 Intel Corporation Methods and apparatus for keyword-based, non-linear navigation of video streams and other content
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US20130289991A1 (en) * 2012-04-30 2013-10-31 International Business Machines Corporation Application of Voice Tags in a Social Media Context
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US20130346068A1 (en) * 2012-06-25 2013-12-26 Apple Inc. Voice-Based Image Tagging and Searching
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9058806B2 (en) * 2012-09-10 2015-06-16 Cisco Technology, Inc. Speaker segmentation and recognition based on list of speakers
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
TWI528186B (zh) * 2012-11-09 2016-04-01 財團法人資訊工業策進會 經由音訊發布訊息的系統及方法
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN103399737B (zh) * 2013-07-18 2016-10-12 百度在线网络技术(北京)有限公司 基于语音数据的多媒体处理方法及装置
CN104346388B (zh) * 2013-07-31 2018-03-09 株式会社理光 云端服务器以及图像存储检索系统
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US9167082B2 (en) 2013-09-22 2015-10-20 Steven Wayne Goldstein Methods and systems for voice augmented caller ID / ring tone alias
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
CN104199956B (zh) * 2014-09-16 2018-01-16 成都博智维讯信息技术有限公司 一种erp数据语音搜索方法
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
KR102252072B1 (ko) * 2014-10-14 2021-05-14 삼성전자주식회사 음성 태그를 이용한 이미지 관리 방법 및 그 장치
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
KR20170027551A (ko) * 2015-09-02 2017-03-10 삼성전자주식회사 전자 장치 및 그의 제어 방법
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10186253B2 (en) 2015-10-05 2019-01-22 Olympus Corporation Control device for recording system, and recording system
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
JP2018025855A (ja) * 2016-08-08 2018-02-15 ソニーモバイルコミュニケーションズ株式会社 情報処理サーバ、情報処理装置、情報処理システム、情報処理方法、およびプログラム
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
TWI752437B (zh) * 2020-03-13 2022-01-11 宇康生科股份有限公司 基於至少雙音素的語音輸入操作方法及電腦程式產品
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence

Family Cites Families (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1191425A (en) 1915-08-13 1916-07-18 Henry Koch Adjustable table.
JPS58145998A (ja) 1982-02-25 1983-08-31 ソニー株式会社 音声過渡点検出方法
US5390278A (en) 1991-10-08 1995-02-14 Bell Canada Phoneme based speech recognition
US5422816A (en) 1994-02-22 1995-06-06 Trimble Navigation Limited Portable personal navigation tracking system
US6236365B1 (en) 1996-09-09 2001-05-22 Tracbeam, Llc Location of a mobile station using a plurality of commercial wireless infrastructures
US7225249B1 (en) 1997-09-26 2007-05-29 Mci, Llc Integrated systems for providing communications network management services and interactive generating invoice documents
US7209949B2 (en) 1998-05-29 2007-04-24 Research In Motion Limited System and method for synchronizing information between a host system and a mobile data communication device
AU777693B2 (en) * 1999-03-05 2004-10-28 Canon Kabushiki Kaisha Database annotation and retrieval
US6718367B1 (en) 1999-06-01 2004-04-06 General Interactive, Inc. Filter for modeling system and method for handling and routing of text-based asynchronous communications
US7177795B1 (en) * 1999-11-10 2007-02-13 International Business Machines Corporation Methods and apparatus for semantic unit based automatic indexing and searching in data archive systems
US6834270B1 (en) 2000-02-28 2004-12-21 Carlo Pagani Secured financial transaction system using single use codes
US7634528B2 (en) 2000-03-16 2009-12-15 Microsoft Corporation Harnessing information about the timing of a user's client-server interactions to enhance messaging and collaboration services
US7650376B1 (en) 2000-03-27 2010-01-19 Blumenau Trevor I Content distribution system for distributing content over a network, with particular applicability to distributing high-bandwidth content
US6700538B1 (en) 2000-03-29 2004-03-02 Time Domain Corporation System and method for estimating separation distance between impulse radios using impulse signal amplitude
AU2001247934A1 (en) 2000-04-03 2001-10-15 Craig Goren Method and system for content driven electronic messaging
US8489669B2 (en) 2000-06-07 2013-07-16 Apple Inc. Mobile data processing system moving interest radius
US20030120822A1 (en) 2001-04-19 2003-06-26 Langrind Nicholas A. Isolated control plane addressing
US7130885B2 (en) 2000-09-05 2006-10-31 Zaplet, Inc. Methods and apparatus providing electronic messages that are linked and aggregated
FI114000B (fi) 2000-11-08 2004-07-15 Mikko Kalervo Vaeaenaenen Sähköinen lyhytviestintä- ja ilmoittelumenetelmä ja vastaavat välineet
WO2002041029A1 (en) 2000-11-15 2002-05-23 Racetrace Inc. Tag tracking
US20030009385A1 (en) 2000-12-26 2003-01-09 Tucciarone Joel D. Electronic messaging system and method thereof
US7266085B2 (en) 2001-03-21 2007-09-04 Stine John A Access and routing protocol for ad hoc network using synchronous collision resolution and node state dissemination
US7263597B2 (en) 2001-04-19 2007-08-28 Ciena Corporation Network device including dedicated resources control plane
CA2450727A1 (en) 2001-06-14 2002-12-27 Rf Code, Inc. Wireless identification systems and protocol
US7110524B2 (en) 2001-08-07 2006-09-19 Qwest Communications International, Inc. Method and system for call queueing and customer application interaction
US6975994B2 (en) * 2001-09-12 2005-12-13 Technology Innovations, Llc Device for providing speech driven control of a media presentation
US7003570B2 (en) 2001-10-05 2006-02-21 Bea Systems, Inc. System for integrating java servlets with asynchronous messages
KR100451180B1 (ko) 2001-11-28 2004-10-02 엘지전자 주식회사 태그를 이용한 단문 메시지 전송방법
US7065544B2 (en) 2001-11-29 2006-06-20 Hewlett-Packard Development Company, L.P. System and method for detecting repetitions in a multimedia stream
US20030115366A1 (en) 2001-12-18 2003-06-19 Robinson Brian R. Asynchronous message delivery system and method
US6879257B2 (en) 2002-02-25 2005-04-12 Omron Corporation State surveillance system and method for an object and the adjacent space, and a surveillance system for freight containers
US7512649B2 (en) 2002-03-22 2009-03-31 Sun Microsytems, Inc. Distributed identities
JP4978810B2 (ja) 2002-05-30 2012-07-18 独立行政法人産業技術総合研究所 端末装置、情報配信装置、情報配信システムおよびプログラム
US7707317B2 (en) 2002-07-01 2010-04-27 Prolifiq Software Inc. Adaptive electronic messaging
US7966374B2 (en) 2002-07-01 2011-06-21 Profiliq Software Inc. Adaptive media messaging, such as for rich media messages incorporating digital content
US20040024598A1 (en) 2002-07-03 2004-02-05 Amit Srivastava Thematic segmentation of speech
US20040024817A1 (en) 2002-07-18 2004-02-05 Binyamin Pinkas Selectively restricting access of automated agents to computer services
US20040022264A1 (en) 2002-07-30 2004-02-05 Mccue Andrew Charles Method of determining context in a subjectless message
GB2396520A (en) 2002-11-23 2004-06-23 Liquid Drop Ltd System for issuing and authenticating mobile tokens
EP1434409A1 (en) 2002-12-23 2004-06-30 Koninklijke KPN N.V. Setting user preferences via a mobile terminal
AU2004246547B2 (en) 2003-06-09 2008-10-30 Toku Pte Ltd System and method for providing a service
US20040260551A1 (en) 2003-06-19 2004-12-23 International Business Machines Corporation System and method for configuring voice readers using semantic analysis
US7266754B2 (en) 2003-08-14 2007-09-04 Cisco Technology, Inc. Detecting network denial of service attacks
US20050049924A1 (en) 2003-08-27 2005-03-03 Debettencourt Jason Techniques for use with application monitoring to obtain transaction data
AU2003273654A1 (en) 2003-09-05 2005-03-29 Petr Hejl Reply recognition in communications
US20050102625A1 (en) 2003-11-07 2005-05-12 Lee Yong C. Audio tag retrieval system and method
US20050114357A1 (en) * 2003-11-20 2005-05-26 Rathinavelu Chengalvarayan Collaborative media indexing system and method
GB2409365B (en) 2003-12-19 2009-07-08 Nokia Corp Image handling
US8112103B2 (en) 2004-01-16 2012-02-07 Kuang-Chao Eric Yeh Methods and systems for mobile device messaging
US7756709B2 (en) 2004-02-02 2010-07-13 Applied Voice & Speech Technologies, Inc. Detection of voice inactivity within a sound stream
US8457300B2 (en) 2004-02-12 2013-06-04 Avaya Inc. Instant message contact management in a contact center
US7725545B2 (en) 2004-02-20 2010-05-25 Sybase 365, Inc. Dual use counters for routing loops and spam detection
US20050192808A1 (en) 2004-02-26 2005-09-01 Sharp Laboratories Of America, Inc. Use of speech recognition for identification and classification of images in a camera-equipped mobile handset
US7539860B2 (en) 2004-03-18 2009-05-26 American Express Travel Related Services Company, Inc. Single use user IDS
CN1973504A (zh) 2004-06-07 2007-05-30 99有限公司 用于对通信进行路由的方法和装置
US7693945B1 (en) 2004-06-30 2010-04-06 Google Inc. System for reclassification of electronic messages in a spam filtering system
JP4018678B2 (ja) * 2004-08-13 2007-12-05 キヤノン株式会社 データ管理方法および装置
JP4587165B2 (ja) * 2004-08-27 2010-11-24 キヤノン株式会社 情報処理装置及びその制御方法
US7738646B2 (en) 2004-11-23 2010-06-15 Transera Communications, Inc. Method and system for monitoring and managing multi-sourced call centers
US7218943B2 (en) 2004-12-13 2007-05-15 Research In Motion Limited Text messaging conversation user interface functionality
US7512659B2 (en) 2004-12-16 2009-03-31 International Business Machines Corporation Enabling interactive electronic mail and real-time messaging
US7574453B2 (en) 2005-01-03 2009-08-11 Orb Networks, Inc. System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
EP1882376A2 (en) 2005-05-20 2008-01-30 QUALCOMM Incorporated Asynchronous media communications using priority tags
US20060287867A1 (en) 2005-06-17 2006-12-21 Cheng Yan M Method and apparatus for generating a voice tag
US7471775B2 (en) 2005-06-30 2008-12-30 Motorola, Inc. Method and apparatus for generating and updating a voice tag
US7957520B2 (en) 2005-07-14 2011-06-07 Cisco Technology, Inc. System and method for responding to an emergency at a call center
US20070033229A1 (en) * 2005-08-03 2007-02-08 Ethan Fassett System and method for indexing structured and unstructured audio content
US7886083B2 (en) 2005-08-31 2011-02-08 Microsoft Corporation Offloaded neighbor cache entry synchronization
US20070078986A1 (en) 2005-09-13 2007-04-05 Cisco Technology, Inc. Techniques for reducing session set-up for real-time communications over a network
US7702821B2 (en) 2005-09-15 2010-04-20 Eye-Fi, Inc. Content-aware digital media storage device and methods of using the same
US8489132B2 (en) 2005-09-21 2013-07-16 Buckyball Mobile Inc. Context-enriched microblog posting
US7551935B2 (en) 2005-09-21 2009-06-23 U Owe Me, Inc. SMS+4D: short message service plus 4-dimensional context
US9009265B2 (en) 2005-09-28 2015-04-14 Photobucket Corporation System and method for automatic transfer of data from one device to another
CN1852354A (zh) 2005-10-17 2006-10-25 华为技术有限公司 收集用户行为特征的方法和装置
US8209620B2 (en) 2006-01-31 2012-06-26 Accenture Global Services Limited System for storage and navigation of application states and interactions
US7945653B2 (en) 2006-10-11 2011-05-17 Facebook, Inc. Tagging digital media
WO2007076418A2 (en) 2005-12-20 2007-07-05 Panifare Union, Llc Security-enabled digital media and authentication methods thereof
KR100833500B1 (ko) 2006-01-24 2008-05-29 한국전자통신연구원 Dab/dmb 방송 시스템에서 음성 태그가 추가된epg xml을 이용한 음성 epg 서비스 제공 시스템및 방법
US20070174326A1 (en) 2006-01-24 2007-07-26 Microsoft Corporation Application of metadata to digital media
ES2420559T3 (es) 2006-02-10 2013-08-23 Spinvox Limited Un sistema a gran escala, independiente del usuario e independiente del dispositivo de conversión del mensaje vocal a texto
US8151323B2 (en) 2006-04-12 2012-04-03 Citrix Systems, Inc. Systems and methods for providing levels of access and action control via an SSL VPN appliance
US20080004056A1 (en) 2006-06-01 2008-01-03 Paul Suzman Methods and systems for incorporating a voice-attached, tagged rich media package from a wireless camera-equipped handheld mobile device into a collaborative workflow
US20070290787A1 (en) 2006-06-20 2007-12-20 Trevor Fiatal Systems and methods for group messaging
US7729689B2 (en) 2006-07-13 2010-06-01 International Business Machines Corporation Mobile wireless device adaptation based on abstracted contectual situation of user using near-field communications and information collectors
US7652813B2 (en) 2006-08-30 2010-01-26 Silicon Quest Kabushiki-Kaisha Mirror device
US8239480B2 (en) 2006-08-31 2012-08-07 Sony Ericsson Mobile Communications Ab Methods of searching using captured portions of digital audio content and additional information separate therefrom and related systems and computer program products
NZ549654A (en) 2006-09-01 2007-05-31 Run The Red Ltd A method of online payment authorization, a method of correlating text messages and systems therefor
US20080075433A1 (en) 2006-09-22 2008-03-27 Sony Ericsson Mobile Communications Ab Locating digital images in a portable electronic device
US7917911B2 (en) 2006-12-01 2011-03-29 Computer Associates Think, Inc. Automated grouping of messages provided to an application using execution path similarity analysis
US9282446B2 (en) 2009-08-06 2016-03-08 Golba Llc Location-aware content and location-based advertising with a mobile device
US8136090B2 (en) 2006-12-21 2012-03-13 International Business Machines Corporation System and methods for applying social computing paradigm to software installation and configuration
US20080159266A1 (en) 2006-12-30 2008-07-03 Arcsoft (Shanghai) Technology Company, Ltd Determining Pairings of Telephone Numbers and IP Addresses from Caching and Peer-To-Peer Lookup
US20090012841A1 (en) 2007-01-05 2009-01-08 Yahoo! Inc. Event communication platform for mobile device users
US7788247B2 (en) 2007-01-12 2010-08-31 Microsoft Corporation Characteristic tagging
US8060123B2 (en) 2007-03-19 2011-11-15 Sony Corporation System and method for using SMS and tagged message to send position and travel information to server and/or to peers
US8761815B2 (en) 2007-03-21 2014-06-24 Motorola Mobility Llc Method, device and system for accessing mobile device user information
US7577433B2 (en) 2007-06-18 2009-08-18 Cvon Innovations Limited Method and system for managing delivery of communications
AU2008201643B1 (en) 2007-07-24 2008-08-28 Rambrandt Messaging Technologies, LP Messaging service in a wireless communications network
KR101459136B1 (ko) * 2007-09-03 2014-11-10 엘지전자 주식회사 오디오 데이터 플레이어 및 이의 재생목록 생성방법
WO2009035698A1 (en) 2007-09-12 2009-03-19 Airkast, Inc. Wireless device tagging system and method
US8347231B2 (en) 2007-10-08 2013-01-01 At&T Intellectual Property I, L.P. Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
GB2453810A (en) 2007-10-15 2009-04-22 Cvon Innovations Ltd System, Method and Computer Program for Modifying Communications by Insertion of a Targeted Media Content or Advertisement
US8539097B2 (en) 2007-11-14 2013-09-17 Oracle International Corporation Intelligent message processing
EP2061284B1 (en) 2007-11-15 2013-12-04 Deutsche Telekom AG Method and System providing a short message (SMS) forwarding unconditional service
US8472972B2 (en) 2007-11-21 2013-06-25 International Business Machines Corporation Device, system, and method of physical context based wireless communication
US20090150786A1 (en) 2007-12-10 2009-06-11 Brown Stephen J Media content tagging on a social network
US8307029B2 (en) 2007-12-10 2012-11-06 Yahoo! Inc. System and method for conditional delivery of messages
US20090164287A1 (en) 2007-12-24 2009-06-25 Kies Jonathan K Method and apparatus for optimizing presentation of media content on a wireless device based on user behavior
US20090191902A1 (en) 2008-01-25 2009-07-30 John Osborne Text Scripting
US9111286B2 (en) 2008-02-01 2015-08-18 Qualcomm, Incorporated Multiple actions and icons for mobile advertising
US8015005B2 (en) * 2008-02-15 2011-09-06 Motorola Mobility, Inc. Method and apparatus for voice searching for stored content using uniterm discovery
US7996432B2 (en) 2008-02-25 2011-08-09 International Business Machines Corporation Systems, methods and computer program products for the creation of annotations for media content to enable the selective management and playback of media content
CA2659698C (en) 2008-03-21 2020-06-16 Dressbot Inc. System and method for collaborative shopping, business and entertainment
US20090265631A1 (en) 2008-04-18 2009-10-22 Yahoo! Inc. System and method for a user interface to navigate a collection of tags labeling content
US9906620B2 (en) 2008-05-05 2018-02-27 Radware, Ltd. Extensible, asynchronous, centralized analysis and optimization of server responses to client requests
US8948731B2 (en) 2008-07-18 2015-02-03 Qualcomm Incorporated Rating of message content for content control in wireless devices
US9152722B2 (en) 2008-07-22 2015-10-06 Yahoo! Inc. Augmenting online content with additional content relevant to user interest
US8260846B2 (en) 2008-07-25 2012-09-04 Liveperson, Inc. Method and system for providing targeted content to a surfer
US8385971B2 (en) 2008-08-19 2013-02-26 Digimarc Corporation Methods and systems for content processing
US20100049599A1 (en) 2008-08-20 2010-02-25 First Data Corporation Filtering mobile marketing offers
GB2461730B (en) 2008-08-22 2010-11-10 Peter Tanner A communication device
US8365267B2 (en) 2008-11-13 2013-01-29 Yahoo! Inc. Single use web based passwords for network login
US8831203B2 (en) 2008-12-23 2014-09-09 Genesys Telecommunications Laboratories, Inc. System and methods for tracking unresolved customer involvement with a service organization and automatically formulating a dynamic service solution
KR20100079639A (ko) * 2008-12-31 2010-07-08 삼성전자주식회사 지도 정보를 이용한 음원 탐색 시스템 및 그 방법
US9857501B2 (en) 2009-02-13 2018-01-02 Centurylink Intellectual Property Llc System and method for a wireless phone enabled with weather alerts
US8638911B2 (en) * 2009-07-24 2014-01-28 Avaya Inc. Classification of voice messages based on analysis of the content of the message and user-provisioned tagging rules
US8539542B1 (en) 2009-08-25 2013-09-17 Whdc Llc System and method for managing multiple live video broadcasts via a public data network on a single viewing channel
US20110061068A1 (en) 2009-09-10 2011-03-10 Rashad Mohammad Ali Tagging media with categories
US8370358B2 (en) 2009-09-18 2013-02-05 Microsoft Corporation Tagging content with metadata pre-filtered by context
US9438741B2 (en) 2009-09-30 2016-09-06 Nuance Communications, Inc. Spoken tags for telecom web platforms in a social network
US9183580B2 (en) 2010-11-04 2015-11-10 Digimarc Corporation Methods and systems for resource management on portable devices
CA2684678A1 (en) 2009-11-03 2011-05-03 Research In Motion Limited System and method for dynamic post-processing on a mobile device
US20110141855A1 (en) 2009-12-11 2011-06-16 General Motors Llc System and method for updating information in electronic calendars
US8230054B2 (en) 2009-12-23 2012-07-24 Citrix Systems, Inc. Systems and methods for managing dynamic proximity in multi-core GSLB appliance
US8463887B2 (en) 2009-12-23 2013-06-11 Citrix Systems, Inc. Systems and methods for server surge protection in a multi-core system
US8903847B2 (en) 2010-03-05 2014-12-02 International Business Machines Corporation Digital media voice tags in social networks
US8583725B2 (en) 2010-04-05 2013-11-12 Microsoft Corporation Social context for inter-media objects
EP2567346B1 (en) 2010-05-05 2017-06-14 Digimarc Corporation Hidden image signaling
US20110276513A1 (en) 2010-05-10 2011-11-10 Avaya Inc. Method of automatic customer satisfaction monitoring through social media
US20120246238A1 (en) 2011-03-21 2012-09-27 International Business Machines Corporation Asynchronous messaging tags
WO2013075071A1 (en) 2011-11-18 2013-05-23 Ayman Hammad Mobile wallet store and service injection platform apparatuses, methods and systems
US9406222B2 (en) 2012-10-18 2016-08-02 Calamp Corp. Systems and methods for location reporting of detected events in vehicle operation

Also Published As

Publication number Publication date
CN102782751B (zh) 2015-02-11
GB2491324B (en) 2017-03-22
GB2491324A (en) 2012-11-28
GB201217273D0 (en) 2012-11-14
JP5671557B2 (ja) 2015-02-18
US20110219018A1 (en) 2011-09-08
JP2013521567A (ja) 2013-06-10
WO2011109137A1 (en) 2011-09-09
US8903847B2 (en) 2014-12-02
CN102782751A (zh) 2012-11-14

Similar Documents

Publication Publication Date Title
TW201209804A (en) Digital media voice tags in social networks
US10958598B2 (en) Method and apparatus for generating candidate reply message
US11314370B2 (en) Method for extracting salient dialog usage from live data
US20190251083A1 (en) Retrieving context from previous sessions
WO2019153607A1 (zh) 智能应答方法、电子装置及存储介质
US20170357661A1 (en) Providing content items in response to a natural language query
US9229974B1 (en) Classifying queries
CN1648902B (zh) 统一和混合搜索的系统和方法
US9483462B2 (en) Generating training data for disambiguation
JP6246951B2 (ja) ユーザコンタクトエントリのデータ設定
US7984034B1 (en) Providing parallel resources in search results
WO2017116715A2 (en) Methods and apparatus for determining non-textual reply content for inclusion in a reply to an electronic communication
US20150161129A1 (en) Image result provisioning based on document classification
JP2006527870A (ja) 設定可能な情報特定システム及び方法
JP2009093646A (ja) 検索結果のインテリジェント分類のための方法、ソフトウェア及び装置
JP2011028747A (ja) サーチ・タームを生成するシステムと方法
JP2002278977A (ja) 質問回答装置、質問回答方法及び質問回答プログラム
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
US20210056131A1 (en) Methods and systems for generating timelines for entities
US9747891B1 (en) Name pronunciation recommendation
CN111555960A (zh) 信息生成的方法
JP2005128955A (ja) 情報処理方法および記憶媒体、プログラム
KR101896479B1 (ko) 메모 등록을 위한 시스템, 방법 및 그에 대한 기록매체
JP2020016960A (ja) 推定装置、推定方法及び推定プログラム
CN110807089B (zh) 一种问答方法、装置及电子设备