TW201209804A - Digital media voice tags in social networks - Google Patents
Digital media voice tags in social networks Download PDFInfo
- Publication number
- TW201209804A TW201209804A TW100106768A TW100106768A TW201209804A TW 201209804 A TW201209804 A TW 201209804A TW 100106768 A TW100106768 A TW 100106768A TW 100106768 A TW100106768 A TW 100106768A TW 201209804 A TW201209804 A TW 201209804A
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- tag
- phoneme
- sample
- media object
- Prior art date
Links
- 238000004891 communication Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 41
- 230000001413 cellular effect Effects 0.000 claims description 8
- 230000008901 benefit Effects 0.000 claims description 5
- 239000002689 soil Substances 0.000 claims 1
- 239000000523 sample Substances 0.000 description 45
- 238000012545 processing Methods 0.000 description 11
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/30—Aspects of automatic or semi-automatic exchanges related to audio recordings in general
- H04M2203/303—Marking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/913—Multimedia
- Y10S707/915—Image
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/913—Multimedia
- Y10S707/916—Audio
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Description
201209804 六、發明說明: 【發明所屬之技術領域】 本發明係關於特性化媒體,且更特定言之,藉由語音標 籤特性化數位媒體。 【先前技術】 數位圖書館'照片共享網站、影像搜尋引擎、線上百科 全書及其他電腦系統皆在檔案系統或資料庫中擁有大量影 像。存取此等網站之使用纟可在查找戶斤要的影像方面有困 難,此係因為與文件不同,影像(及其他數位媒體)不包括 可索引之字或片語。 對查找所要的影像之問題的一解決方案為影像辨識,但 此方法對於使用纟產生之内容花費極高,i並不高度準 確。另一已知方法為按指定種類(諸如,資料夾)對影像分 組以促進存取。然而,此雲I人丁奴士 m此需要人工努力,且必須提前知曉 子在組織此等影像之許多方式,包括收集、集合及階 層,且織收集之—常用方法為加標籤。當使用者看到影 像時,使用者可鐘 — 予或片以對該影像「加標籤」 (描述該影像)。多個使用者可將一或多個標籤添加至同一 影像。當另一使用本 者存取该網站時,使用者可接著導覽至 由特定標籤標註之影像。 存在可❹標籤實現影像導覽之各種方式。舉例而言, 鍵入為用於—或多個影像之一集合的現有標藏之 子$ 5吾。或者,使用者可看到按各種方式(按字母順 154436.doc 201209804 , 序、按風行度等)排列之標籤,且接著選擇描述該(等)影像 之標籤。廣泛使用且良好地理解用於社群導覽之文字加標 籤的功效。 亦存在呈現數位媒體使得使用者可掃描且識別項目之多 個方式(拼貼、柵格、觀測)。此等方法之一主要缺點為其 不可縮放:顯示變得潼亂,且螢幕可能用完像素,尤其在 小螢幕上’諸如’在行動裝置上。 亦存在「自動」處理數位媒體以得出可接著用於搜尋之 中繼資料的多個方式。中繼資料(位置、時間)可在影像獲 取時捕獲,且隨後用以導覽至視覺數位媒體。 然而,存在創建或使用文字標籤不可能或不方便之許多 it形。實例包括當使用者:正使用行動電話(花了長時間 或將注意力自視覺任務轉至鍵入字或片語)時;身體殘疾 (不能鍵入字或片語)時;由於受教育有限而文盲或半文盲 (僅具有有限的閱讀或書寫能力)時;或具有視力問題(不能 看到字或片語)或此等情形之組合時。 【發明内容】 根據本發明之-實施例,提供一種系統,其包括一用戶 端計算裝置,該用戶端計算裝置包括—媒體物件捕獲裝置 及-語音捕獲裝置且運作使媒體物件與語音樣本相關聯之 一用戶端應用程式。此實施例之該系統亦包括:一通传網 路,其麵接至該用戶端計算裝置;-語音加標藏系統,其 耗接至該通信網路且垃|Wp JU Μ. u , 内峪五接收在一第一媒體物件與一第—語音 樣本之間的至少一翮辨. 〇〇 關聯,及一資料庫,其耦接至該語音加 154436.doc 201209804 標籤系統,該資料庫包括一或多個語音標籤,每一語音標 臧叙接至一或多個語音樣本。 根據本發明之另一實施例,揭示一種對媒體物件加標籤 之方法。此實施例之該方法包括:在一伺服器處接收一第 一語音樣本與一第一媒體物件之間的一關聯;比較該第一 語音樣本與一或多個其他語音樣本;將該第一語音樣本連 結至一第一語音標籤;將該第一語音標籤連結至該第一媒 體物件;及將該第一語音樣本、該第一語音標籤、該第一 媒體物件及其間之任何連結儲存於耦接至該伺服器之一資 料庫中。 根據本發明之另一實施例,揭示一種搜尋含有加語音標 籤之媒體物件的數位資料庫之方法。該方法包括:在一伺 服器處接收一第一音訊搜尋;比較該第一音訊搜尋與儲存 於該數位資料庫中的語音標籤之數位表示;及返回連結至 匹配該第一音訊搜尋之語音標籤之一或多個媒體物件。 經由本發明之技術認識到額外特徵及優點。本發明之其 他實施例及態樣在本文中得以詳細描述且被認為所主張之 本發明之一部分。為了更好地理解具有該等優點及該等特 徵之本發明,參考描述及圖式。 【實施方式】 被看作本發明之標的物在說明書結尾在申請專利範圍中 經特別地指出且清楚地主張。自以下結合附圖之詳細描 述,本發明之前述及其他特徵及優點係顯而易見的。 本發明之實施例可解決以上描述之問題或其他未提到之 154436.doc 201209804 問題中的-些或全部。在一些情況下,本發明之系統及方 法允許使用者藉由音訊識別符對媒體物件加標籤。此等音 訊識別符可在本文中被稱作「語音樣本」。此外,本發; 包括用於基於「語音查詢」搜尋連結至資料庫中之語音樣 本的媒體物件之系統及方法。語音查詢為人類語言令之丄 連串字,每-字由-連宰音素組成。若語音查詢聽起來像 一或多個語音樣本,則連結至此等語音樣本之此等標藏將 用以擷取媒體物件。 在-實施例中,提供用於使用者藉由其說出字或片語之 語音的音訊記錄對數位媒體加標藏之方法,及用於使用者 使用此等語音標籤搜尋且劉覽數位媒體之另一方法。應理 解’ 「使用者」為說出字或片語之人’未必為語音標藏提 供至的裝置之擁有者。 特定言之,一些實施例提供用於藉由口頭音訊(例如, 字及片語)對影像及其他數位媒體加標藏之系統及方法。 本文中揭示之系統及方法可包括將語音樣本中之一連串立 素辨識為標籤之能力。隨後,若同_或另—使用者講出: 配的音素’則…揭示之系統及方法可操取 數位媒體。 =提供用於使用者收聽語音標籤及選擇標籤中之一者以 接著掏取相關聯之數位媒體的方法。可按字母順序、按風 行度、按階層或按其他方式排列標籤。在階層中, 具體標籤前呈現較概括標籤,且標籤可具有同義字(如由 使用者對標藏之特定性或相似性層級的判斷所判定)。若 154436.doc 201209804 k擇處於給疋層級之標籤, 且驹神〜+ Γ呈現在下一向下層級的更 八體軚鐵或可記錄用於選定 疋知戡之新同義字。若在給定層 級下無標籤被選擇,則一栌蕕 w籤可!s己錄且添加至在此層級 n ㈣語音標籤時’則連結之語音樣本 的音訊特性(例如,響度)可用以指示該標籤相對於該組全 部標籤之風行度或其他特性以及身分(若揚聲器可用以根 據偏好選擇標籤或標籤之特定語音樣本舉例而言,吾 人可在Ρ丨其他使用者語音前更喜歡聽到其自己的語音。 —圖1展示本發明之實施例可實施於其上的計算系統之一 實例。在此實施例,系統100具有一或多個中央處理單元 (處理器mu、1Glb、1()1(:等(被共稱作或統稱作處理器 ιοί)。在一實施例中,每一處理器101可包括一精簡指令 集電腦(RISC)微處理器。處理器1〇1經由系統匯流排ιΐ3耦 接至系統記憶體114及各種其他組件。唯讀記憶體 (R〇M)1〇2耦接至系統匯流排113,且可包括一基本輸入/輸 出系統(BIOS),BIOS控制系統1〇〇之某些基本功能。 圖1進一步描繪耦接至系統匯流排113之輸入/輸出(1/〇) 配接器107及網路配接器1〇6。I/O配接器1〇7可為與硬碟 10 3及/或帶儲存驅動機1 〇 5或任何其他類似組件通信之小 電服系統介面(SCSI)配接益。I/O配接器1〇7、硬碟1〇3及帶 儲存驅動機105在本文中被共稱作大容量儲存器丨〇4。網路 配接器106與外部網路116—起與匯流排113互連,從而使 資料處理系統100能夠與其他此等系統通信》螢幕(例如, 顯示監視器)115藉由顯示配接器112連接至系統匯流排 154436.doc 201209804 113,顯示配接器112可包括一圖形配接器(用以改良需要 大量圖形之應用及之效能)及一視訊控制器。在一實施例 中,配接器107、106及112可連接至一或多個I/O匯流排, 該一或多個I/O匯流排可經由中間匯流排橋接器圖中未展 示連接至系統匯流排113 »用於連接周邊裝置(諸如,硬碟 控制器、網路配接器及圖形配接器)之合適的I/O匯流排通 常包括共同協定’諸如’周邊組件介面(PCI)。額外輸入/ 輸出裝置經展示為經由使用者介面配接器1〇8及顯示配接 器112連接至系統匯流排113。鍵盤1 〇9、滑鼠1 1 〇及揚聲器 111皆經由使用者介面配接器1 〇8互連至匯流排丨丨3,使用 者介面配接器108可包括(例如)將多個裝置配接器整合至一 單一積體電路中之超級I/O晶片。當然,可包括諸如數位 相機或數位視訊相機(或以數位格式供應一或多個影像之 其他構件)及麥克風之其他輸入作為額外輸入裝置。 因此’如圖1中所組態,系統1〇〇包括呈處理器1〇1之形 式的處理構件、包括系統記憶體114及大容量儲存器1〇4之 儲存構件、諸如鍵盤及滑鼠11〇之輸入構件,及包括揚 聲器111及顯示器115之輸出構件。在一實施例中,系統記 憶體114及大容量儲存器104之一部分共同地儲存一作業系 統(諸如,來自IBM Corporation之AIX⑥作業系統)以協調圖 1中展示的各種組件之功能。 應瞭解,系統100可為任何合適的電腦或計算平台,且 可包括終端機、無線裝置、資訊用具、裝置、工作站、微 型電腦、大型電腦、個人數位助理(PDA)或其他計算裝 154436.doc 201209804 置。應理解,系統100可包括藉由一通信網路連結在一起 之多個計算裝置。舉例而言,在兩系統之間可存在用戶端 —伺服器關係,且可在兩者之間分開進行處理。 可由系統100支援的作業系統之實例包括Wind〇ws 95、 Windows 98 ' Windows NT 4.0 > Windows XP , Windows 2000、Windows CE、Windows Vista、Mac OS、java、 AIX、LINUX及UNIX或任何其他合適的作業系統。系統 100亦包括一用於在網路116上通信之網路介面1〇6。網路 116可為區域網路(LAN)、都會網路(Man)或廣域網路 (WAN)(諸如’網際網路或全球資訊網)。 系統1〇〇之使用者可經由任何合適的網路介面116連接 (諸如,標準電話線、數位用戶線、LAN或WAN鏈路(例 如,ΤΙ、T3)、寬頻連接(訊框中繼、ATM)及無線連接(例 如,802.1 1 ⑷、802.1 1 (b)、802.1 1 (g)))連接至網路。 如本文中揭示,系統1〇〇包括儲存於機器可讀媒體(例 如,硬碟104)上用於使用者之螢幕115上展示的資訊之捕 獲及互動顯示的機器可讀指令。如本文中論述,該等指令 被稱作「軟體」120。可使用如此項技術中已知之軟體開 發工具生產軟體120。軟體120可包括如此項技術中已知之 用於提供使用者互動能力之各種工具及特徵。 在一些實施例中’將軟體120提供為對另一程式之覆 蓋。舉例而言,可將軟體12〇提供為針對一應用程式(或作 業系統)之「内插式附件(add_in)」。注意,術語「内插式 附件」通常指如此項技術中已知之補充程式碼。在此等實 154436.doc 201209804 施例中,軟體120替換其合作的應用程式或作業系統之結 構或物件。 應理解’在—實施例中,本發明之系統可按—特定方式 經組態’ 包括多個計算裝置。為此,圖2展示根據本發 明之實靶例的系統200之一實例。可利用系統2〇〇以實施 本文中揭示之方法。 系統200包括一或多個用戶端計算裝置2〇2。用戶端計算 裝置202可為任何類型之計算裝置。在一實施例中,用戶 端什算裝置202包括一麥克風及一揚聲器。在一實施例 中,且如圖2中所示,用戶端計算裝置202可為蜂巢式或 「智慧」電話、PDA或包括一麥克風2〇4及一揚聲器2〇6之 其他手持型通信(計算)裝置。為了完整性,用戶端計算裝 置202之其他組件可包括—數位相機2〇8、一顯示幕21〇及 一輸入小鍵盤212。應理解,可將用戶端計算裝置2〇2之組 件中的一些組合在—起。舉例而言,顯示幕21〇可包括輸 入能力,且因此,包括用於輸入資訊以及顯示(例如)影像 之構件。在一實施例中’用戶端計算裝置2〇2可包括運作 用戶端應用程式、連接至無線資料網路、捕獲一或多個影 像、顯示影像、捕獲音訊及廣播音訊之能力。 用戶端計算裝置202可耦接至通信網路2 14。在一實施例 中’通信網路214可為蜂巢式網路。舉例而言,通信網路 214可為〇8!^、丁〇]\4八、2〇、30或40無線網路。通信網路 214亦可為諸如WIMAX或802.1 1之無線資料網路。當然, 通信鏈路216可為無線或實體的。在一實施例中,通信網 154436.doc 201209804 路可為企業㈣網路或網際網路 系統亦可包括一語音加標❹統218。語音加標❹ 統218耗接至通仏網路214。因此,語音加標籤系統218可 在通信網路214上與用戶端計算裝置搬通信。在-實施例 中可將叩曰加;^鐵系統218植人於—饲服器上。在—些 實施例中…加標籤系統218可經組態以運作一 web應用 程式’該福應用程式處置對媒體物件及語音標籤之請求 且執灯浯音標滅匹配。在—實施例中,語音加標籤系統 218可包括具有用於人類語言之—音素層級話語模型之一 處理單,若給定_語音樣本,則該話語處理單元將 返回一連串最緊密匹配的音素。當然:’該話語處理單元可 處於-獨立的單元中或可實施於一獨立的單元上。 系統200亦可包括一耗接至語音加標藏系統叫之資料庫 220。資料庫220可儲存由語音加標籤系統218利用之資 訊。在—實施例中,語音加標籤系統218可在其内包括資 料庫220。 圖3a展示可儲存於資料庫22〇中的資訊之一實例。在一 實施例中,資料庫22〇可包括一語音標籤儲存器、數位 媒體304及一講話者登錄檔3〇6。當然,資料庫22〇無需按 此特定方式劃分。 數位媒體儲存器3〇4可包括數位媒體物件。數位媒體物 件可包括能夠視覺重現的任何類型之媒體,包括(但不限 於)影像、文件、動畫及視訊。應理解,在一實施例中, 可用於語音加標籤系統218(圖2)之所有數位媒體可不儲存 I54436.doc -11 - 201209804 於單一位置中,且可散佈於多個資料庫22〇上。 講話者登錄檔306可包括與一特定講話者相關聯之語音 剪輯。在-實施例中’語音剪輯中之—些或全部可與^ 語音剪輯之音素表示相Μ。此彳對於語音加才票藏並不需 要,但可用於以下論述之講話者識別驗證(SIV)中。 語音標籤為儲存一或多個語音剪輯與一或多個數位媒體 物件之間的關聯之物件,且儲存於語音標籤儲存器 中。在一實施例中,「加標籤」應指創建媒體物件與語音 樣本之間的關聯。相比之下,語音標籤儲存器3〇2中之嗜 音標籤包括至至少一媒體物件及一語音樣本之連結。 ° 圖3b展示講話者登錄檔306之較詳細版本。講話者登錄 稽唯· 一地識別語音加標籤系統之使用者。講話者可具有被 識別之不同方式:使用觸控式螢幕鍵入其姓名或特殊代 碼、匹配之語音剪輯(「說出字「baggage」」)、來自來電 顯示之電話號碼,或產生可連結至語音剪輯以識別在記錄 語音剪輯時正交談的講話者之唯一講話者身分之任何其他 方式。 圖4展示具有數位媒體儲存器3〇4與講話者登錄檔3〇6之 間的連結之資料庫220之一實例。更詳細地,圖4展示語音 剪輯402、404、406及408與數位媒體物件43 〇及432之間的 可能連接中之一些之實例。第一語音剪輯4〇2表示某一講 話者講出字「wheat」之剪輯。第一語音剪輯4〇2連結至第 一語音剪輯402之講話者身分410及音素表示412。 可按許多不同方式形成音素表示412(以及用於其他語音 154436.doc -12- 201209804 剪輯之任何其他音素表示)^在一實施例中,可將音訊剪 輯分成s吾音片段及非語音片段’且接著,可利用已知或曰 後開發之技術辨識語音部分之音素。如展示,以實例說 明,第一語音剪輯402可表示描繪為字母r wheet」之音素 「hwet」。 第一語音標籤426亦可連結至耦接至第二講話者身分414 及音素表示416之第二語音剪輯404。在此實施例中,第二 语音剪輯404表示由字母「weet」描繪之音素「w0t」。可 實施音素匹配演算法以推斷:當由不同人講話時,第一語 音剪輯402與第二語音剪輯404皆實際上為同一字。此匹配 可包括(例如)基於字之開始及因此用於字的音素之序列之 開頭按同一方式分類之語音剪輯。因此,舉例而言,每一 語音剪輯中之前N=3個音素經辨識且與其他者相比較。當 然’可利用其他分類技術,諸如’表示使兩個序列相同所 必需的添加、刪除及移動之數目的「編輯距離」。無論如 何’第一語音標籤426與第一數位媒體物件430相關聯。 第二語音標籤428與第一數位媒體物件430及第二數位媒 體物件432兩者相關聯。此說明本發明允許將一語音標籤 連結至包括不同類型之數位媒體物件(諸如,影像及視訊) 的一或多個數位媒體物件之原理。類似於第一語音標籤 426,第二語音標籤428可連結至一或多個語音剪輯。在此 貫例中,第一 §吾音標戴428連結至第三語音剪輯406及第四 語音剪輯4〇8。第三語音剪輯406連結至講話者身分418及 音素表示420。類似地’第四語音剪輯408連結至講話者身 154436.doc -13- 201209804 分422及音素表示424 »當然,在一實施例中,可組合該等 講話者身分。 使用者可創建語音剪輯與媒體物件之間的關聯。此等關 聯可用以創建語音標籤及創建語音標籤、數位媒體物件與 語音剪輯之間的連結(如圖4中所示)。此等連結可(例如)由 語音加標籤系統218(圖2)創建。當記錄音訊剪輯時,可創 建講話者身分與音訊剪輯之間的連結。亦可由語音加標籤 系統218創建與每一語音剪輯相關聯之音素表示且將其連 結至語音剪輯。如所示,講話者丨(區塊422)講出語音剪輯 406及408兩者。當收聽標籤428時,語音剪輯406可較佳, 此係由於包括清晰性、講話時間、音量等之許多可組態原 因。 影像之加標籤 存在可根據本發明對影像加標籤之若干方式。關於圖5 揭示一方法。在區塊5〇2處,獲取一媒體物件且呈現給使 用者。可按不同方式獲取媒體物件。舉例而言,媒體物件 可由使用者藉由建置於使用者之蜂巢式電話内的數位相機 拍照而獲取。在另一實施例中,可自資料庫將媒體物件下 載至使用者之蜂巢式電話之螢幕。當然,在不脫離本發明 之情況下’可執行其他獲取影像之方法。在一實施例中, 媒體物件必須為使用者可見以便對影像加標籤。當然,此 並非必需的。 在區塊504處,啟用語音加標籤應用程式。語音加標籤 應用程式可為(例如)能夠接收語音樣本且使其與正觀看之 154436.doc -14· 201209804 影像相關聯的用戶端應用程式。在—實施例中,語音加標 籤應用程式為在蜂巢式電話上之用戶端應用程式。 不 中 本 在區塊506處,自使用者接收語音樣本。在一實施例 ,可在對使用者呈現影像或其他媒體物件時接收語音樣 在區塊507處,可分析語音樣本以判定講話者之身分。 右無講話者可識別,則語音加標籤系統可與一匿名講話者 一起操作。可使用各種資訊判定講話者身分,包括(但不 限於)來電顯示(電活號碼)、講話者身分驗證(siv)及在電 活小鍵盤上鍵入姓名。儲存於講話者登錄檔中之一或多個 語音樣本亦可用以匹配由使用者提供且儲存於講話者登錄 檔中之語音樣本》視情況,若在區塊5〇7處不存在匹配, 則可在講話者登錄檔中創建新講話者身分。在此情況下, 可能需要與使用者之對話來記錄語音剪輯、姓名、電話號 碼或其他識別資訊。 ' 在區塊508處,創建語音樣本與媒體物件之間的關聯。 此關聯可處於語音樣本與下載之媒體檔案、已载入於裝置 上之媒體或由使用者創建之媒體物件之間。無論如何,關 聯可描述語音剪輯之位置及媒體物件位置及創建關聯之時 間。 在區塊510處’可將關聯傳輸至語音加標籤系統。當 然,若語音樣本或媒體物件先前未儲存於資料庫中,則可 將語音樣本或媒體物件與關聯一起傳輸。舉例而言,若使 用者自資料庫220(圖2)下載影像,且用語音樣本對該影像 154436.doc •15· 201209804 加標籤,則僅需要傳輸該語音樣本及關聯。所傳輸的 關聯之外的資料可為系統特定的且可組態,且視特定情形 而定。 創建加標叙之影像之資料庫 如上論述,個別使用者可創建語音樣本與媒體物件之間 的關聯。此等關聯形成圖4中展示之連結之基礎。圖6為展 示根據本發明之一實施例的形成資料庫之方法之流程圖。 在區塊6〇2處,接收-關聯。該關聯使語音樣本與媒體 物件相關聯。該關聯可來自(例如)同時記錄語音樣本及顯 不影像。或者,關聯可來自允許在不顯示影像之情況下進 行關聯之系統。在-實施例中,可將媒體物件及語音樣本 中之-者或兩者與關聯一起接收,例如,在媒體物件或語 音樣本甲之一者或兩者尚未存在於資料庫中之情況下。可 (例如)藉由語音加標籤系統218(圖2)接收關聯。 在區塊604處,將語音樣本轉換成音素表示。可藉由已 知技術創建音素表示。音素表示連結至語音樣本。此外, 若語音樣本之講話者已知,則音素表示可連結至在講話者 登錄檀令的語音樣本之創建者。此連結可將每-語音樣本 U至夕—4❹身分。例如’當不能識別唯-講話者 時,或當不使用講話者識別且因此所有語音樣本連結至匿 名講話者身分時,講話者身分可識別唯一匿名使用者。當 然,多個樣本可連結至一單一身分。 在區塊6G6處’比較在資料庫中之現有語音樣本之音素 表不與新接收之語音樣本之音素表示。存在執行此匹配之 J54436.doc • 16 · 201209804 許多方式。一實例包括匹配(及因此分類)基於字之開始聽 起來相似之字。此匹配可包括:針對此等N個音素中之每 一者’操取在語音樣本中辨識之前Μ個音素。對於一些情 形’可使用少至Μ=3個音素。對於每一語音標籤,依序比 較該等音素。標籤接收基於匹配其第Μ個音素之程度的計 分。可權衡比第Μ個音素高的與第M-1個音素之匹配。在 貫施例中,匹配度係基於音素之匹配特徵(諸如,濁輔 音及清輔音)之數目,且無匹配接收計分_丨。每個音素存在 5個特徵,因此,最佳計分為丨5且最差為_3。 在區塊608處,判定是否存在新語音樣本與現有語音樣 本之間的匹配。若多個現有語音樣本自現有語音樣本之資 料庫擷取且匹配,則使用者可選擇最佳者。在彼情況下, 存在與單一浯音樣本之匹配,在區塊6丨〇處,新語音樣本 連結至現有語音樣本連結至之語音標籤。舉例而言,再次 參看圖4,第一浯音剪輯4〇2及第二語音剪輯4〇4皆連結至 語音標鐵426。此可發生仙為第一語音剪輯權先前連結 至》。a ‘籤4:26。當將第二語音剪輯4〇4置放於系統中時, 第一曰素表不416匹配第一音素表示412。因此,第一音素 表不412及第二音素表示416皆指派至同一語音標籤(語音 標籤426)。 '現返回參看圖6,如上所論述,每一語音標籤連結至至 媒體物件及至少一語音樣本。在區塊處,判定連 結至現有語音標籤之媒體物件是否匹配與新語音樣本相關 聯之媒體物件:如此,則可記錄關於加標籤過程之資訊 154436.doc •17· 201209804 且該過程可結束。舉例而言,可將已對影像加標籤之次數 記錄於資料庫220(圖2)中。否則,在區塊614處’將語音標 籤連結至與新語音樣本相關聯之媒體物件。以此方式,可 使單一語音標籤與多個媒體物件相關聯。 在不存在新語音樣本與現有語音樣本之間的匹配(亦 即,此為先前未講出的字之語音樣本)之情況下,在區塊 616處,創建新語音標籤。接著在區塊6丨8處,將新創建之 语音標籤連結至新語音樣本。新創建之語音標籤用於開始 於已描述之區塊612處的處理。因此,若此為與匹配媒體 物件之關聯,則將新語音標籤連結至語音樣本先前相關聯 之媒體物件。若此為非匹配新媒體物件,則新創建之標籤 將連結至新媒體物#。因此可能使用新記錄之語音樣本對 新捕獲之影像加語音標籤,在該情況下,該語音樣本不匹 配任何現有標籤。 如上所論述,講話者登錄檔3〇6可用以唯一地識別語音 加標籤系統之使用者。可如上所述搜集用於講話者之資 訊0 搜尋加標叙之影像之資料庫 之方式,以下描述 以上描述詳述了可創建及修改資料庫 描述在一實施例中可搜尋資料庫之方式 圖7為展不搜*且操取加語音標籤之媒體物件之方法之 机私圖纟區塊702處’語音加標鐵系統之使用者啟用在 其用戶端計算裝置上之系统— 示既在—實施例中,用戶端計算 裝置可為蜂巢式電話。在另—寄^ y 任力貫施例中,能夠拍照且記錄 154436.doc -18- 201209804 及播放聲音且在WiFi網路上操作之觸控式螢幕裝置可形成 用戶端計算裝置。 在區塊704處’創建利用語音搜尋項之搜尋。此可包括 使用者對著麥克風說出字。接著在區塊706處將搜尋提交 至伺服器。 在區塊708處’伺服器(例如’語音加標籤系統218,圖 2)使語音搜尋項與現有語音標籤匹配。此匹配可包括將(多 個)搜尋項分成語音片段及非語音片段。接著,針對每一 語音片段,可形成一音素表示《可比較此等音素表示與連 結至語音標籤之現有音素表示,且基於與語音標籤一起儲 存的現有語音樣本之音素表示之匹配計分針對每一語音標 籤創建一「匹配計分」。可使用以上描述之匹配計分針對 每一語音標籤判定最佳匹配。 在區塊710處,將結果返回至搜尋者。在多個語音標籤 具有足夠高計分之情況下’返回彼等標籤。在未發現標籤 之情況下’可將此對搜哥者指示。假定存在匹配,則可將 關聯呈現給使用者。對搜尋者顯示連結至選定標籤之一或 多個匹配媒體物件。在觸控式螢幕裝置上選擇匹配媒體物 件可藉由播放具有最佳計分之相關聯的語音樣本來播放與 每一媒體物件相關聯之語音標籤。 在一替代實施例中’捕獲一影像且經由MMS(多媒體訊 息傳遞服務)來發送’且系統執行語音輸入之階層分類。 在此實施例中,系統可包括一「語音閘道器」,該語音閘 道器自身為將使用者之電話(經由公眾交換電話網路或 154436.doc 201209804 PSTN)連接至電腦系統的組件之總成。 現返回參看圖2,在此實施例中,語音加標鐵系統218可 經組態以操作一互動式語音響應系統(ivr)]vr系統可處 理使用者之小鍵盤輸入,且引導語音閘道器播放及/或記 錄音訊串流(亦稱作音訊剪輯或語音剪輯系統亦可包括 一無線手持型電^,該無線手持型電話能夠記錄且顯示影 像且具有與語音加標籤系統218之無線資料連接。如先前 所述,影像(或其他數位媒體)可儲存且連結於資料庫22〇 中。該系統亦可包括用以對其他使用者通知新書籤的至外 部(在本IVR外部)服務之一或多個介面。實例為公眾域電 子郵件網路、由無線電信廠商(服務提供者)擁有及運營之 SMS(簡訊服務)及MMS(多媒體訊息服務)網路,及公眾交 換電話網路(PSTN)。 在此實施例中,使用者調用在連接至PSTN的任一行動 相機電話上之IVR系統,且歷經以下步驟以階層分類照 片· 1 ·使用者藉由其相機電話拍照;使用者將照片自其行 動電話發送至IVR服務(使用電子郵件或河“” ;3 IVR服 務將照片儲存至資料庫中且將照片添加至一仲列未加㈣ 之照片;4.使用者登入IVR服務。使用者之電話的來電顯 示或明確的登入亦用以識別使用者;使用者藉由收聽與每 一未加標籤之照片相關聯的中繼資料之文字至話音(tts) 產生而使用IVR選單選擇照片。在此實施例中,使用該仔 列中每一未加標籤之照片之上載時間;使用者接著由ivr 提示其是否想要對該照片加標籤,且若如此,則自語音標 154436.doc -20. 201209804 籤之先前記錄之階層建構iVR選單樹;8在…厌選單樹中之 每-層級N處,對該使用者提示:a)選擇一適當標藏,^ 創建-新標籤,或c)刪除一標籤;9.若使用者已選擇一適 當標籤,則擷取在層級N+1處之語音標籤;及1〇若無更多 特定標籤可用,則將該語音標籤與照片一起儲存。 本文中使用之術語僅係用於描述特定實施例之目的,且 並不意欲限制本發明。如本文中所使用,單數形式「一」 及「該」意欲亦包括複數形式,除非上下文另有清晰^ 示。應進一步理解,當術語r包含」用於此說明書中時, 其指定所述特徵、整數、步驟、操作、元件及/或組件之 存在,但並不排除一或多個其他特徵、整數、步驟、操 作、元件、組件及/或其群組之存在或添加。 以下申言青專利範圍中之所有構件或步驟加功能元件之對 應結構、材料、動作及等效物意欲包括用於連同如具體所 主張之其他所主張元件一起執行功能的任何結構、材料或 動作。已呈現本發明之描述以用於達成說明及描述之目 的,但其並不意欲為詳盡的或限於所揭示之形式下的本發 明。在不脫離本發明之範疇及精神之情況下,許多修改及 變化對於一般熟習此項技術者將顯而易見。選擇並描述了 實施例以便最佳地解釋本發明之原理及實務應用,且使其 他一般熟習此項技術者能夠針對具有適合於所預期特定用 途的各種修改之各種實施例來理解本發明。 本文中描繪之流程圖僅為一實例。在不脫離本發明之精 神的情況下,可存在對本文中描述之此圖或步驟(或操作) J54436.doc •21 · 201209804 之許多變化。舉例而言,可按一不同次序執行該等步驟, 或者可添加、刪除或修改步驟。將所有此等變化考慮為所 主張之本發明之一部分。 儘管已描述了本發明之較佳實施例,但熟習此項技術者 應理解,在現在及將來,可進行屬於以下申請專利範圍之 範疇之各種改良及增強。此等申請專利範圍應被認作維持 對最初描述之本發明的適度保護。 【圖式簡單說明】 圖1展示本發明之實施例可實施於其上的計算系統之— 實例; 圖2展示根據本發明之一實施例的系統之一實例; 圖3展不可在圖2中展示之系統中利用的資料庫之一實施 例之方塊圖; 圖4為圖3中展示的資料庫之更詳細描繪; 圖5為展示根據本發明的可對媒體物件加標籤之方法之 流程圖; 圖6為展示根據本發明之一實施例的形成資料庫之方法 之流程圖;及 圆7為展不根據本發明之一實施例的搜尋且擷取加扭立 標籤之媒體物件之方法之流程圖。 【主要元件符號說明】 100 資料處理系統 101a 中央處理單元(處理器) 101b 中央處理單元(處理器) 154436.doc -22- 201209804 101c 中央處理單元(處理器) 102 唯讀記憶體(ROM) 103 硬碟 104 大容量儲存器 105 帶儲存驅動機 106 網路配接器 107 輸入/輸出(I/O)配接器 108 使用者介面配接器 109 鍵盤 110 滑鼠 111 揚聲器 112 顯示配接器 113 系統匯流排 1 14 系統記憶體 115 螢幕/顯示器 116 網路/網路介面 120 軟體 202 用戶端計算裝置 204 麥克風 206 揚聲器 208 數位相機 210 顯示幕 212 輸入小鍵盤 214 通信網路 I54436.doc •23. 201209804 216 通信鍵路 218 語音加標籤系統 220 資料庫 302 語音標籤儲存器 304 數位媒體/數位媒體儲存器 306 講話者登錄檔 402 第一語音剪輯 404 第二語音剪輯 406 第三語音剪輯 408 第四語音剪輯 410 講話者身分 412 音素表示 414 第二講話者身分 416 音素表不 418 講話者身分 420 音素表示 422 講話者身分 424 音素表示 426 第一語音標籤 428 第二語音標籤 430 第一數位媒體物件 432 第二數位媒體物件 154436.doc -24-
Claims (1)
- 201209804 七、申請專利範圍: 1. 一種數位媒體系統,包含: 用戶%叶算裝置,該用戶嫂斗I 件捕獲裝置及一_,十异裝置包括一媒體物 m 9捕獲裝置,且運作使媒體物件盘狂 曰樣本相關聯之一用戶端應用程式; 一 通L 同路’其麵接至該用戶端計算裝置; °°曰加標籤系統’其耦接至該通信網路且接收在一 第-媒體物件盥一第一立 _ 第°° 9樣本之間的至少一關聯;及 一厂庫其耦接至該語音加標籤系統,該資料庫包 括-或多個語音標籤,每—語音標籤柄接至—或多個語 音樣本。 2. 如明求項1之系統,其中儲存於該資料庫中之至少一語 音樣本具有一音素表示。 3. 如請求項2之系統 話者身分。 其中該至少一語音樣本連結至一講 4. 如凊求項1之系統,其中具有類似音素表示之多個語音 樣本連結至一語音標籤。 5. 如睛求項1之系統,其甲該第一媒體物件為—影像。 6. 一種對媒體物件加標籤之方法,該方法包含: 在飼服益處接收一第一語音樣本與—第一媒體物件 之間的一關聯; 比較該第__語音樣本與_或多個其他語音樣本; 將δ亥第—語音樣本連結至一第一語音標籤; 將該第一語音標籤連結至該第一媒體物件;及 154436.doc 201209804 將該第—語音樣本、該第-語音標籤、該第-媒體物 間之任何連結儲存於耦接至該伺服器之一資料 中。 7. 8. 9. 10. 11. 12. 月长項6之方法’其中自一蜂巢式電話接收該關聯。 如請求項7 $ t、土 *4. 4 其中自該資料庫彌取該第一媒體物 件且使其呈現於該蜂巢式電話上。 如請求項6之方法’其中該比較包括: 形成用於該第-語音樣本之一第一音素表示;及 比較该第-音素表示與連結至該一或多個其他語音樣 本之其他音素表示。 ’ 如請求項9之方法’其中在該第一音素表示匹配該—或 多個其他語音樣本中之_者之情況下,該[語音樣本 連結至該第一語音標籤’該第一語音標籤先前連結至嗜 :或多個其他語音樣本中之該—者,或在該第—音素^ 不不匹配該一或多個其他語音樣本中之一者之情況下, 將該第-語音樣本連結㈣第—語音標籤進—步包括: 在判定該第-音素表示不匹配該一或多個其他語音樣 本中之一者後,創建該第一標籤。 如請求項7之方法,進一步包含: 將該第一語音標籤連結至一第二媒體物件。 -種搜尋含有加語音標籤之媒體物件的一數位資料庫之 方法,該方法包含: 在一伺服器處接收—第一音訊搜尋; 比較該第一音訊搜尋與儲存於該數位資料庫中的語音 154436.doc 201209804 標籤之數位表示;及 返回連結至匹配該第一音訊搜尋之語音標籤之一或多 個媒體物件。 13 ·如請求項12之方法,其中比較包括: 將該第一音訊搜尋轉換為一第一音素表示;及 計算該第一音素表示與連結至該等語音標籤之其他音 素表示之間的一相似性計分。 14. 如請求項13之方法,其中該相似性計分係基於該第一音 素表示之一開頭部分。 15. 如請求項12之方法,其中該返回包括: 重放該第一音訊搜尋之至少一部分。 154436.doc
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/718,041 US8903847B2 (en) | 2010-03-05 | 2010-03-05 | Digital media voice tags in social networks |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201209804A true TW201209804A (en) | 2012-03-01 |
Family
ID=44532204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100106768A TW201209804A (en) | 2010-03-05 | 2011-03-01 | Digital media voice tags in social networks |
Country Status (6)
Country | Link |
---|---|
US (1) | US8903847B2 (zh) |
JP (1) | JP5671557B2 (zh) |
CN (1) | CN102782751B (zh) |
GB (1) | GB2491324B (zh) |
TW (1) | TW201209804A (zh) |
WO (1) | WO2011109137A1 (zh) |
Families Citing this family (184)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20110115931A1 (en) * | 2009-11-17 | 2011-05-19 | Kulinets Joseph M | Image management system and method of controlling an image capturing device using a mobile communication device |
US20110115930A1 (en) * | 2009-11-17 | 2011-05-19 | Kulinets Joseph M | Image management system and method of selecting at least one of a plurality of cameras |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8903847B2 (en) | 2010-03-05 | 2014-12-02 | International Business Machines Corporation | Digital media voice tags in social networks |
US20120244842A1 (en) | 2011-03-21 | 2012-09-27 | International Business Machines Corporation | Data Session Synchronization With Phone Numbers |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8688090B2 (en) | 2011-03-21 | 2014-04-01 | International Business Machines Corporation | Data session preferences |
US20120246238A1 (en) | 2011-03-21 | 2012-09-27 | International Business Machines Corporation | Asynchronous messaging tags |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
WO2013039473A1 (en) | 2011-09-12 | 2013-03-21 | Intel Corporation | Methods and apparatus for keyword-based, non-linear navigation of video streams and other content |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US20130289991A1 (en) * | 2012-04-30 | 2013-10-31 | International Business Machines Corporation | Application of Voice Tags in a Social Media Context |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US20130346068A1 (en) * | 2012-06-25 | 2013-12-26 | Apple Inc. | Voice-Based Image Tagging and Searching |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9058806B2 (en) * | 2012-09-10 | 2015-06-16 | Cisco Technology, Inc. | Speaker segmentation and recognition based on list of speakers |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
TWI528186B (zh) * | 2012-11-09 | 2016-04-01 | 財團法人資訊工業策進會 | 經由音訊發布訊息的系統及方法 |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN103399737B (zh) * | 2013-07-18 | 2016-10-12 | 百度在线网络技术(北京)有限公司 | 基于语音数据的多媒体处理方法及装置 |
CN104346388B (zh) * | 2013-07-31 | 2018-03-09 | 株式会社理光 | 云端服务器以及图像存储检索系统 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US9167082B2 (en) | 2013-09-22 | 2015-10-20 | Steven Wayne Goldstein | Methods and systems for voice augmented caller ID / ring tone alias |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
CN104199956B (zh) * | 2014-09-16 | 2018-01-16 | 成都博智维讯信息技术有限公司 | 一种erp数据语音搜索方法 |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
KR102252072B1 (ko) * | 2014-10-14 | 2021-05-14 | 삼성전자주식회사 | 음성 태그를 이용한 이미지 관리 방법 및 그 장치 |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
KR20170027551A (ko) * | 2015-09-02 | 2017-03-10 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10186253B2 (en) | 2015-10-05 | 2019-01-22 | Olympus Corporation | Control device for recording system, and recording system |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
JP2018025855A (ja) * | 2016-08-08 | 2018-02-15 | ソニーモバイルコミュニケーションズ株式会社 | 情報処理サーバ、情報処理装置、情報処理システム、情報処理方法、およびプログラム |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
TWI752437B (zh) * | 2020-03-13 | 2022-01-11 | 宇康生科股份有限公司 | 基於至少雙音素的語音輸入操作方法及電腦程式產品 |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
Family Cites Families (142)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1191425A (en) | 1915-08-13 | 1916-07-18 | Henry Koch | Adjustable table. |
JPS58145998A (ja) | 1982-02-25 | 1983-08-31 | ソニー株式会社 | 音声過渡点検出方法 |
US5390278A (en) | 1991-10-08 | 1995-02-14 | Bell Canada | Phoneme based speech recognition |
US5422816A (en) | 1994-02-22 | 1995-06-06 | Trimble Navigation Limited | Portable personal navigation tracking system |
US6236365B1 (en) | 1996-09-09 | 2001-05-22 | Tracbeam, Llc | Location of a mobile station using a plurality of commercial wireless infrastructures |
US7225249B1 (en) | 1997-09-26 | 2007-05-29 | Mci, Llc | Integrated systems for providing communications network management services and interactive generating invoice documents |
US7209949B2 (en) | 1998-05-29 | 2007-04-24 | Research In Motion Limited | System and method for synchronizing information between a host system and a mobile data communication device |
AU777693B2 (en) * | 1999-03-05 | 2004-10-28 | Canon Kabushiki Kaisha | Database annotation and retrieval |
US6718367B1 (en) | 1999-06-01 | 2004-04-06 | General Interactive, Inc. | Filter for modeling system and method for handling and routing of text-based asynchronous communications |
US7177795B1 (en) * | 1999-11-10 | 2007-02-13 | International Business Machines Corporation | Methods and apparatus for semantic unit based automatic indexing and searching in data archive systems |
US6834270B1 (en) | 2000-02-28 | 2004-12-21 | Carlo Pagani | Secured financial transaction system using single use codes |
US7634528B2 (en) | 2000-03-16 | 2009-12-15 | Microsoft Corporation | Harnessing information about the timing of a user's client-server interactions to enhance messaging and collaboration services |
US7650376B1 (en) | 2000-03-27 | 2010-01-19 | Blumenau Trevor I | Content distribution system for distributing content over a network, with particular applicability to distributing high-bandwidth content |
US6700538B1 (en) | 2000-03-29 | 2004-03-02 | Time Domain Corporation | System and method for estimating separation distance between impulse radios using impulse signal amplitude |
AU2001247934A1 (en) | 2000-04-03 | 2001-10-15 | Craig Goren | Method and system for content driven electronic messaging |
US8489669B2 (en) | 2000-06-07 | 2013-07-16 | Apple Inc. | Mobile data processing system moving interest radius |
US20030120822A1 (en) | 2001-04-19 | 2003-06-26 | Langrind Nicholas A. | Isolated control plane addressing |
US7130885B2 (en) | 2000-09-05 | 2006-10-31 | Zaplet, Inc. | Methods and apparatus providing electronic messages that are linked and aggregated |
FI114000B (fi) | 2000-11-08 | 2004-07-15 | Mikko Kalervo Vaeaenaenen | Sähköinen lyhytviestintä- ja ilmoittelumenetelmä ja vastaavat välineet |
WO2002041029A1 (en) | 2000-11-15 | 2002-05-23 | Racetrace Inc. | Tag tracking |
US20030009385A1 (en) | 2000-12-26 | 2003-01-09 | Tucciarone Joel D. | Electronic messaging system and method thereof |
US7266085B2 (en) | 2001-03-21 | 2007-09-04 | Stine John A | Access and routing protocol for ad hoc network using synchronous collision resolution and node state dissemination |
US7263597B2 (en) | 2001-04-19 | 2007-08-28 | Ciena Corporation | Network device including dedicated resources control plane |
CA2450727A1 (en) | 2001-06-14 | 2002-12-27 | Rf Code, Inc. | Wireless identification systems and protocol |
US7110524B2 (en) | 2001-08-07 | 2006-09-19 | Qwest Communications International, Inc. | Method and system for call queueing and customer application interaction |
US6975994B2 (en) * | 2001-09-12 | 2005-12-13 | Technology Innovations, Llc | Device for providing speech driven control of a media presentation |
US7003570B2 (en) | 2001-10-05 | 2006-02-21 | Bea Systems, Inc. | System for integrating java servlets with asynchronous messages |
KR100451180B1 (ko) | 2001-11-28 | 2004-10-02 | 엘지전자 주식회사 | 태그를 이용한 단문 메시지 전송방법 |
US7065544B2 (en) | 2001-11-29 | 2006-06-20 | Hewlett-Packard Development Company, L.P. | System and method for detecting repetitions in a multimedia stream |
US20030115366A1 (en) | 2001-12-18 | 2003-06-19 | Robinson Brian R. | Asynchronous message delivery system and method |
US6879257B2 (en) | 2002-02-25 | 2005-04-12 | Omron Corporation | State surveillance system and method for an object and the adjacent space, and a surveillance system for freight containers |
US7512649B2 (en) | 2002-03-22 | 2009-03-31 | Sun Microsytems, Inc. | Distributed identities |
JP4978810B2 (ja) | 2002-05-30 | 2012-07-18 | 独立行政法人産業技術総合研究所 | 端末装置、情報配信装置、情報配信システムおよびプログラム |
US7707317B2 (en) | 2002-07-01 | 2010-04-27 | Prolifiq Software Inc. | Adaptive electronic messaging |
US7966374B2 (en) | 2002-07-01 | 2011-06-21 | Profiliq Software Inc. | Adaptive media messaging, such as for rich media messages incorporating digital content |
US20040024598A1 (en) | 2002-07-03 | 2004-02-05 | Amit Srivastava | Thematic segmentation of speech |
US20040024817A1 (en) | 2002-07-18 | 2004-02-05 | Binyamin Pinkas | Selectively restricting access of automated agents to computer services |
US20040022264A1 (en) | 2002-07-30 | 2004-02-05 | Mccue Andrew Charles | Method of determining context in a subjectless message |
GB2396520A (en) | 2002-11-23 | 2004-06-23 | Liquid Drop Ltd | System for issuing and authenticating mobile tokens |
EP1434409A1 (en) | 2002-12-23 | 2004-06-30 | Koninklijke KPN N.V. | Setting user preferences via a mobile terminal |
AU2004246547B2 (en) | 2003-06-09 | 2008-10-30 | Toku Pte Ltd | System and method for providing a service |
US20040260551A1 (en) | 2003-06-19 | 2004-12-23 | International Business Machines Corporation | System and method for configuring voice readers using semantic analysis |
US7266754B2 (en) | 2003-08-14 | 2007-09-04 | Cisco Technology, Inc. | Detecting network denial of service attacks |
US20050049924A1 (en) | 2003-08-27 | 2005-03-03 | Debettencourt Jason | Techniques for use with application monitoring to obtain transaction data |
AU2003273654A1 (en) | 2003-09-05 | 2005-03-29 | Petr Hejl | Reply recognition in communications |
US20050102625A1 (en) | 2003-11-07 | 2005-05-12 | Lee Yong C. | Audio tag retrieval system and method |
US20050114357A1 (en) * | 2003-11-20 | 2005-05-26 | Rathinavelu Chengalvarayan | Collaborative media indexing system and method |
GB2409365B (en) | 2003-12-19 | 2009-07-08 | Nokia Corp | Image handling |
US8112103B2 (en) | 2004-01-16 | 2012-02-07 | Kuang-Chao Eric Yeh | Methods and systems for mobile device messaging |
US7756709B2 (en) | 2004-02-02 | 2010-07-13 | Applied Voice & Speech Technologies, Inc. | Detection of voice inactivity within a sound stream |
US8457300B2 (en) | 2004-02-12 | 2013-06-04 | Avaya Inc. | Instant message contact management in a contact center |
US7725545B2 (en) | 2004-02-20 | 2010-05-25 | Sybase 365, Inc. | Dual use counters for routing loops and spam detection |
US20050192808A1 (en) | 2004-02-26 | 2005-09-01 | Sharp Laboratories Of America, Inc. | Use of speech recognition for identification and classification of images in a camera-equipped mobile handset |
US7539860B2 (en) | 2004-03-18 | 2009-05-26 | American Express Travel Related Services Company, Inc. | Single use user IDS |
CN1973504A (zh) | 2004-06-07 | 2007-05-30 | 99有限公司 | 用于对通信进行路由的方法和装置 |
US7693945B1 (en) | 2004-06-30 | 2010-04-06 | Google Inc. | System for reclassification of electronic messages in a spam filtering system |
JP4018678B2 (ja) * | 2004-08-13 | 2007-12-05 | キヤノン株式会社 | データ管理方法および装置 |
JP4587165B2 (ja) * | 2004-08-27 | 2010-11-24 | キヤノン株式会社 | 情報処理装置及びその制御方法 |
US7738646B2 (en) | 2004-11-23 | 2010-06-15 | Transera Communications, Inc. | Method and system for monitoring and managing multi-sourced call centers |
US7218943B2 (en) | 2004-12-13 | 2007-05-15 | Research In Motion Limited | Text messaging conversation user interface functionality |
US7512659B2 (en) | 2004-12-16 | 2009-03-31 | International Business Machines Corporation | Enabling interactive electronic mail and real-time messaging |
US7574453B2 (en) | 2005-01-03 | 2009-08-11 | Orb Networks, Inc. | System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files |
EP1882376A2 (en) | 2005-05-20 | 2008-01-30 | QUALCOMM Incorporated | Asynchronous media communications using priority tags |
US20060287867A1 (en) | 2005-06-17 | 2006-12-21 | Cheng Yan M | Method and apparatus for generating a voice tag |
US7471775B2 (en) | 2005-06-30 | 2008-12-30 | Motorola, Inc. | Method and apparatus for generating and updating a voice tag |
US7957520B2 (en) | 2005-07-14 | 2011-06-07 | Cisco Technology, Inc. | System and method for responding to an emergency at a call center |
US20070033229A1 (en) * | 2005-08-03 | 2007-02-08 | Ethan Fassett | System and method for indexing structured and unstructured audio content |
US7886083B2 (en) | 2005-08-31 | 2011-02-08 | Microsoft Corporation | Offloaded neighbor cache entry synchronization |
US20070078986A1 (en) | 2005-09-13 | 2007-04-05 | Cisco Technology, Inc. | Techniques for reducing session set-up for real-time communications over a network |
US7702821B2 (en) | 2005-09-15 | 2010-04-20 | Eye-Fi, Inc. | Content-aware digital media storage device and methods of using the same |
US8489132B2 (en) | 2005-09-21 | 2013-07-16 | Buckyball Mobile Inc. | Context-enriched microblog posting |
US7551935B2 (en) | 2005-09-21 | 2009-06-23 | U Owe Me, Inc. | SMS+4D: short message service plus 4-dimensional context |
US9009265B2 (en) | 2005-09-28 | 2015-04-14 | Photobucket Corporation | System and method for automatic transfer of data from one device to another |
CN1852354A (zh) | 2005-10-17 | 2006-10-25 | 华为技术有限公司 | 收集用户行为特征的方法和装置 |
US8209620B2 (en) | 2006-01-31 | 2012-06-26 | Accenture Global Services Limited | System for storage and navigation of application states and interactions |
US7945653B2 (en) | 2006-10-11 | 2011-05-17 | Facebook, Inc. | Tagging digital media |
WO2007076418A2 (en) | 2005-12-20 | 2007-07-05 | Panifare Union, Llc | Security-enabled digital media and authentication methods thereof |
KR100833500B1 (ko) | 2006-01-24 | 2008-05-29 | 한국전자통신연구원 | Dab/dmb 방송 시스템에서 음성 태그가 추가된epg xml을 이용한 음성 epg 서비스 제공 시스템및 방법 |
US20070174326A1 (en) | 2006-01-24 | 2007-07-26 | Microsoft Corporation | Application of metadata to digital media |
ES2420559T3 (es) | 2006-02-10 | 2013-08-23 | Spinvox Limited | Un sistema a gran escala, independiente del usuario e independiente del dispositivo de conversión del mensaje vocal a texto |
US8151323B2 (en) | 2006-04-12 | 2012-04-03 | Citrix Systems, Inc. | Systems and methods for providing levels of access and action control via an SSL VPN appliance |
US20080004056A1 (en) | 2006-06-01 | 2008-01-03 | Paul Suzman | Methods and systems for incorporating a voice-attached, tagged rich media package from a wireless camera-equipped handheld mobile device into a collaborative workflow |
US20070290787A1 (en) | 2006-06-20 | 2007-12-20 | Trevor Fiatal | Systems and methods for group messaging |
US7729689B2 (en) | 2006-07-13 | 2010-06-01 | International Business Machines Corporation | Mobile wireless device adaptation based on abstracted contectual situation of user using near-field communications and information collectors |
US7652813B2 (en) | 2006-08-30 | 2010-01-26 | Silicon Quest Kabushiki-Kaisha | Mirror device |
US8239480B2 (en) | 2006-08-31 | 2012-08-07 | Sony Ericsson Mobile Communications Ab | Methods of searching using captured portions of digital audio content and additional information separate therefrom and related systems and computer program products |
NZ549654A (en) | 2006-09-01 | 2007-05-31 | Run The Red Ltd | A method of online payment authorization, a method of correlating text messages and systems therefor |
US20080075433A1 (en) | 2006-09-22 | 2008-03-27 | Sony Ericsson Mobile Communications Ab | Locating digital images in a portable electronic device |
US7917911B2 (en) | 2006-12-01 | 2011-03-29 | Computer Associates Think, Inc. | Automated grouping of messages provided to an application using execution path similarity analysis |
US9282446B2 (en) | 2009-08-06 | 2016-03-08 | Golba Llc | Location-aware content and location-based advertising with a mobile device |
US8136090B2 (en) | 2006-12-21 | 2012-03-13 | International Business Machines Corporation | System and methods for applying social computing paradigm to software installation and configuration |
US20080159266A1 (en) | 2006-12-30 | 2008-07-03 | Arcsoft (Shanghai) Technology Company, Ltd | Determining Pairings of Telephone Numbers and IP Addresses from Caching and Peer-To-Peer Lookup |
US20090012841A1 (en) | 2007-01-05 | 2009-01-08 | Yahoo! Inc. | Event communication platform for mobile device users |
US7788247B2 (en) | 2007-01-12 | 2010-08-31 | Microsoft Corporation | Characteristic tagging |
US8060123B2 (en) | 2007-03-19 | 2011-11-15 | Sony Corporation | System and method for using SMS and tagged message to send position and travel information to server and/or to peers |
US8761815B2 (en) | 2007-03-21 | 2014-06-24 | Motorola Mobility Llc | Method, device and system for accessing mobile device user information |
US7577433B2 (en) | 2007-06-18 | 2009-08-18 | Cvon Innovations Limited | Method and system for managing delivery of communications |
AU2008201643B1 (en) | 2007-07-24 | 2008-08-28 | Rambrandt Messaging Technologies, LP | Messaging service in a wireless communications network |
KR101459136B1 (ko) * | 2007-09-03 | 2014-11-10 | 엘지전자 주식회사 | 오디오 데이터 플레이어 및 이의 재생목록 생성방법 |
WO2009035698A1 (en) | 2007-09-12 | 2009-03-19 | Airkast, Inc. | Wireless device tagging system and method |
US8347231B2 (en) | 2007-10-08 | 2013-01-01 | At&T Intellectual Property I, L.P. | Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content |
GB2453810A (en) | 2007-10-15 | 2009-04-22 | Cvon Innovations Ltd | System, Method and Computer Program for Modifying Communications by Insertion of a Targeted Media Content or Advertisement |
US8539097B2 (en) | 2007-11-14 | 2013-09-17 | Oracle International Corporation | Intelligent message processing |
EP2061284B1 (en) | 2007-11-15 | 2013-12-04 | Deutsche Telekom AG | Method and System providing a short message (SMS) forwarding unconditional service |
US8472972B2 (en) | 2007-11-21 | 2013-06-25 | International Business Machines Corporation | Device, system, and method of physical context based wireless communication |
US20090150786A1 (en) | 2007-12-10 | 2009-06-11 | Brown Stephen J | Media content tagging on a social network |
US8307029B2 (en) | 2007-12-10 | 2012-11-06 | Yahoo! Inc. | System and method for conditional delivery of messages |
US20090164287A1 (en) | 2007-12-24 | 2009-06-25 | Kies Jonathan K | Method and apparatus for optimizing presentation of media content on a wireless device based on user behavior |
US20090191902A1 (en) | 2008-01-25 | 2009-07-30 | John Osborne | Text Scripting |
US9111286B2 (en) | 2008-02-01 | 2015-08-18 | Qualcomm, Incorporated | Multiple actions and icons for mobile advertising |
US8015005B2 (en) * | 2008-02-15 | 2011-09-06 | Motorola Mobility, Inc. | Method and apparatus for voice searching for stored content using uniterm discovery |
US7996432B2 (en) | 2008-02-25 | 2011-08-09 | International Business Machines Corporation | Systems, methods and computer program products for the creation of annotations for media content to enable the selective management and playback of media content |
CA2659698C (en) | 2008-03-21 | 2020-06-16 | Dressbot Inc. | System and method for collaborative shopping, business and entertainment |
US20090265631A1 (en) | 2008-04-18 | 2009-10-22 | Yahoo! Inc. | System and method for a user interface to navigate a collection of tags labeling content |
US9906620B2 (en) | 2008-05-05 | 2018-02-27 | Radware, Ltd. | Extensible, asynchronous, centralized analysis and optimization of server responses to client requests |
US8948731B2 (en) | 2008-07-18 | 2015-02-03 | Qualcomm Incorporated | Rating of message content for content control in wireless devices |
US9152722B2 (en) | 2008-07-22 | 2015-10-06 | Yahoo! Inc. | Augmenting online content with additional content relevant to user interest |
US8260846B2 (en) | 2008-07-25 | 2012-09-04 | Liveperson, Inc. | Method and system for providing targeted content to a surfer |
US8385971B2 (en) | 2008-08-19 | 2013-02-26 | Digimarc Corporation | Methods and systems for content processing |
US20100049599A1 (en) | 2008-08-20 | 2010-02-25 | First Data Corporation | Filtering mobile marketing offers |
GB2461730B (en) | 2008-08-22 | 2010-11-10 | Peter Tanner | A communication device |
US8365267B2 (en) | 2008-11-13 | 2013-01-29 | Yahoo! Inc. | Single use web based passwords for network login |
US8831203B2 (en) | 2008-12-23 | 2014-09-09 | Genesys Telecommunications Laboratories, Inc. | System and methods for tracking unresolved customer involvement with a service organization and automatically formulating a dynamic service solution |
KR20100079639A (ko) * | 2008-12-31 | 2010-07-08 | 삼성전자주식회사 | 지도 정보를 이용한 음원 탐색 시스템 및 그 방법 |
US9857501B2 (en) | 2009-02-13 | 2018-01-02 | Centurylink Intellectual Property Llc | System and method for a wireless phone enabled with weather alerts |
US8638911B2 (en) * | 2009-07-24 | 2014-01-28 | Avaya Inc. | Classification of voice messages based on analysis of the content of the message and user-provisioned tagging rules |
US8539542B1 (en) | 2009-08-25 | 2013-09-17 | Whdc Llc | System and method for managing multiple live video broadcasts via a public data network on a single viewing channel |
US20110061068A1 (en) | 2009-09-10 | 2011-03-10 | Rashad Mohammad Ali | Tagging media with categories |
US8370358B2 (en) | 2009-09-18 | 2013-02-05 | Microsoft Corporation | Tagging content with metadata pre-filtered by context |
US9438741B2 (en) | 2009-09-30 | 2016-09-06 | Nuance Communications, Inc. | Spoken tags for telecom web platforms in a social network |
US9183580B2 (en) | 2010-11-04 | 2015-11-10 | Digimarc Corporation | Methods and systems for resource management on portable devices |
CA2684678A1 (en) | 2009-11-03 | 2011-05-03 | Research In Motion Limited | System and method for dynamic post-processing on a mobile device |
US20110141855A1 (en) | 2009-12-11 | 2011-06-16 | General Motors Llc | System and method for updating information in electronic calendars |
US8230054B2 (en) | 2009-12-23 | 2012-07-24 | Citrix Systems, Inc. | Systems and methods for managing dynamic proximity in multi-core GSLB appliance |
US8463887B2 (en) | 2009-12-23 | 2013-06-11 | Citrix Systems, Inc. | Systems and methods for server surge protection in a multi-core system |
US8903847B2 (en) | 2010-03-05 | 2014-12-02 | International Business Machines Corporation | Digital media voice tags in social networks |
US8583725B2 (en) | 2010-04-05 | 2013-11-12 | Microsoft Corporation | Social context for inter-media objects |
EP2567346B1 (en) | 2010-05-05 | 2017-06-14 | Digimarc Corporation | Hidden image signaling |
US20110276513A1 (en) | 2010-05-10 | 2011-11-10 | Avaya Inc. | Method of automatic customer satisfaction monitoring through social media |
US20120246238A1 (en) | 2011-03-21 | 2012-09-27 | International Business Machines Corporation | Asynchronous messaging tags |
WO2013075071A1 (en) | 2011-11-18 | 2013-05-23 | Ayman Hammad | Mobile wallet store and service injection platform apparatuses, methods and systems |
US9406222B2 (en) | 2012-10-18 | 2016-08-02 | Calamp Corp. | Systems and methods for location reporting of detected events in vehicle operation |
-
2010
- 2010-03-05 US US12/718,041 patent/US8903847B2/en not_active Expired - Fee Related
-
2011
- 2011-02-03 CN CN201180012464.9A patent/CN102782751B/zh not_active Expired - Fee Related
- 2011-02-03 WO PCT/US2011/023557 patent/WO2011109137A1/en active Application Filing
- 2011-02-03 GB GB1217273.0A patent/GB2491324B/en active Active
- 2011-02-03 JP JP2012556078A patent/JP5671557B2/ja not_active Expired - Fee Related
- 2011-03-01 TW TW100106768A patent/TW201209804A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN102782751B (zh) | 2015-02-11 |
GB2491324B (en) | 2017-03-22 |
GB2491324A (en) | 2012-11-28 |
GB201217273D0 (en) | 2012-11-14 |
JP5671557B2 (ja) | 2015-02-18 |
US20110219018A1 (en) | 2011-09-08 |
JP2013521567A (ja) | 2013-06-10 |
WO2011109137A1 (en) | 2011-09-09 |
US8903847B2 (en) | 2014-12-02 |
CN102782751A (zh) | 2012-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201209804A (en) | Digital media voice tags in social networks | |
US10958598B2 (en) | Method and apparatus for generating candidate reply message | |
US11314370B2 (en) | Method for extracting salient dialog usage from live data | |
US20190251083A1 (en) | Retrieving context from previous sessions | |
WO2019153607A1 (zh) | 智能应答方法、电子装置及存储介质 | |
US20170357661A1 (en) | Providing content items in response to a natural language query | |
US9229974B1 (en) | Classifying queries | |
CN1648902B (zh) | 统一和混合搜索的系统和方法 | |
US9483462B2 (en) | Generating training data for disambiguation | |
JP6246951B2 (ja) | ユーザコンタクトエントリのデータ設定 | |
US7984034B1 (en) | Providing parallel resources in search results | |
WO2017116715A2 (en) | Methods and apparatus for determining non-textual reply content for inclusion in a reply to an electronic communication | |
US20150161129A1 (en) | Image result provisioning based on document classification | |
JP2006527870A (ja) | 設定可能な情報特定システム及び方法 | |
JP2009093646A (ja) | 検索結果のインテリジェント分類のための方法、ソフトウェア及び装置 | |
JP2011028747A (ja) | サーチ・タームを生成するシステムと方法 | |
JP2002278977A (ja) | 質問回答装置、質問回答方法及び質問回答プログラム | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
US20210056131A1 (en) | Methods and systems for generating timelines for entities | |
US9747891B1 (en) | Name pronunciation recommendation | |
CN111555960A (zh) | 信息生成的方法 | |
JP2005128955A (ja) | 情報処理方法および記憶媒体、プログラム | |
KR101896479B1 (ko) | 메모 등록을 위한 시스템, 방법 및 그에 대한 기록매체 | |
JP2020016960A (ja) | 推定装置、推定方法及び推定プログラム | |
CN110807089B (zh) | 一种问答方法、装置及电子设备 |