TWI536365B - 聲紋辨識 - Google Patents

聲紋辨識 Download PDF

Info

Publication number
TWI536365B
TWI536365B TW100110812A TW100110812A TWI536365B TW I536365 B TWI536365 B TW I536365B TW 100110812 A TW100110812 A TW 100110812A TW 100110812 A TW100110812 A TW 100110812A TW I536365 B TWI536365 B TW I536365B
Authority
TW
Taiwan
Prior art keywords
user
event
voiceprints
item
voiceprint
Prior art date
Application number
TW100110812A
Other languages
English (en)
Other versions
TW201142823A (en
Inventor
拉思慕森大衛約翰
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201142823A publication Critical patent/TW201142823A/zh
Application granted granted Critical
Publication of TWI536365B publication Critical patent/TWI536365B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1831Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063114Status monitoring or status determination for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/10Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces

Description

聲紋辨識
本發明係關於聲紋辨識。
聲紋辨識係用以根據不同的指示器產生聲紋和識別發聲者的過程。在一些情況中,對商業邏輯程序而言能夠識別一發聲者係有價值的。舉例而言,一使用者可進入與不熟悉人士的會議,或在一記錄裝置的範圍中具有一對話,例如具有一麥克風的一電腦。在往後與該會議或對話相關聯的記錄的重新檢視中,知悉當進行特定記錄時何人正在發聲,或能夠查知顯示何人在當時正在發聲的聲音記錄的彩色編碼串流係有價值的。此些仰賴能藉由聲音或其它方式來識別人物的系統,但傳統的系統需要人們以相同的方式記錄他們的聲紋。此些系統由於使用者係忙碌的及不願意參與而面臨運用上的困難。
本發明提供聲紋學習。提供此發明內容以用一簡化的形式作一選擇性概念的介紹,其進一步地描述於後文的實施方式中。此發明內容無意於識別本發明的關鍵特徵或必要特徵。此發明內容亦無意被使用於限制所請求內容的範圍。
本發明提供聲紋辨識。複數個發聲者可被記錄及與身份指示器相關聯。可產生每一發聲者的聲紋。若至少一發聲者的聲紋根據該身份指示器對應於一已知的使用者,可產生將該使用者與該聲紋相關聯的一資料庫項目。亦可顯示與該使用者相關聯的額外資訊。
前文的一般性描述和後續的實施方式二者為提供實例及僅為解釋性的。從而,前文的一般性描述和後續的實施方式不應視為限制性的。再者,除了在此所描述的彼些者,可提供特徵或變化。舉例而言,具體實施例係關於描述於實施方式中的各種特徵組合和子組合。
後續的實施方式意指隨附圖式。在任何可能的情況下,相同的參考編號使用於圖式中,及後文的描述意指相同的或類似的元件。當描述本發明的具體實施例時,調整、適應變化、及其它實施係可能的。舉例而言,可對示例說明於圖式中的元件作出替代、增加、或調整,及在此描述的方法可藉由替代、重新排序、或增加步驟至所揭露的方法中。從而,後續的實施方式並不限制本發明。而是,本發明的適當範圍係藉由隨附的申請專利範圍來界定。
本發明提供聲紋辨識。與本發明的具體實施例相一致,發聲者可被記錄及與各種周圍的指示器相關聯。舉例而言,一使用者可參與一會議,或具有在一麥克風的範圍內之電話呼叫。一聲紋針對該等發聲者的每一者產生,及將該聲紋與資料庫中的已知聲紋作比較。基於所識別的發聲者,各種商業邏輯模組可提供額外的功能性,例如所顯示來自先前會議的筆記及/或電子郵件、提供參與者的清單、及/或註記會議的記錄以識別在何時間點何位使用者發聲。周圍的指示器可從一些環境因素中提取出,例如會議位置、或裝置識別器的存在性。舉例而言,一使用者的行動電話可廣播與所紀綠聲音相關聯和使用以將一聲紋與一使用者相關聯的一藍芽識別器。此些指示器和所產生的聲紋可由個別的使用者私有地儲存、及/或在多個使用者之間共享,例如在一公司中的受僱者。一般而言,當收集及/或共享的指示器越多,在聲紋和所識別的使用者之間的相關性將變得更快速和精確。
舉例而言,一主要的使用者可參與具有該使用者之前未遇過的九個其它使用者之一會議。該主要的使用者的聲紋資料庫可不包含:與針對該主要的使用者及/或其它丸個使用者所產生的聲紋匹配的任何項目。該新近產生的聲紋可儲存或與周圍的指示器相關聯,例如無線網路識別器、藍芽識別器、會議位置、及/或行事曆約定。
行事曆約定能夠提供在該會議的參與者的清單,故每一聲紋能與可能的使用者之一清單相關聯。其它指示器可包含:該主要的使用者所產生而與該會議相關聯的筆記及/或電子郵件。舉例而言,該主要的使用者可傳送一電子郵件至該等參與者中的三者,該電子郵件包含:來自該會議的動作項目;該動作項目電子郵件可與此些三位參與者之每一者相關聯。當該使用者與其它九位使用者中的一些及/或全部(此些人、或此些人的子集)進行更多會議時,則該等相關性可允許個別使用者的隔絶。
舉例而言,該三位使用者的一位可與該主要的使用者進行電話溝通以討論該動作項目電子郵件。可針對該其它使用者產生一聲紋,及周圍的指示器(例如一呼叫者ID號碼(Caller ID number))可與該聲紋相關聯。在早先的會議進行期間,該聲紋可與所產生的聲紋作比較,及在進行傳呼的該使用者間進行相關性。呼叫者ID號碼可新增至與此聲紋相關聯的相關周圍的指示器之清單。再者,呼叫者ID號碼可在一公司的號碼簿中獲用,及與在會議中的已知參與者的一位相關聯。此可允許與此聲紋相關聯的該使用者之確實的識別。一初始的信心水平(confidence level)可與所識別的使用者的聲紋相關聯,該聲紋隨著收集額外的指示器而增加。
若聲紋和其相關的指示器資料透過一群的個人共享,識別程序可較快地發生。舉例而言,當任何使用者資料產生一確實的識別時,一組織可將一聲紋與每一個人相關聯。該使用者並不需精確地記錄其聲音,而一旦該系統已識別一聲紋為屬於一特定的個人,所識別的聲紋可獲用於其它使用者。所識別的聲紋而後可用於幫助識別其它聲紋,例如藉由減小參與者的清單。若一會議具有三個已知的參與者,其中二者具有所識別的聲紋,在此會議進行期間,第三使用者可識別為與一所記錄的未知聲紋相關聯。
發聲者識別系統可使用聲音生物統計以識別及/或驗證:一給定的發聲者為他們所聲稱的個人。聲音生物統計可藉由對個人的語音的輪廓特徵數位化而使用以產生一儲存的模型聲紋、樣板。生物統計技術可減少每一發聲的字詞至包含數個稱為共振峰的主要頻率的數個區段(segment)。每一區段可包含:可用一數位格式捕捉的數個音調。此些音調可共同地識別該發聲者的唯一的聲紋。聲紋可用類似於儲存指紋或其他生物統計資料的方式,儲存於資料庫中。各種技術可使用於處理和儲存聲紋,例如頻率估測,隱藏馬可夫模型、高斯混合模型、樣式匹配演算法、類神經網路、矩陣表示、向量量化(Vector Quantization)、及/或決策樹。一些系統亦可使用反發聲者(anti-speaker)技術,例如群模型(cohort model)和世界模型(world model)。
第1圖係一作業環境100的方塊圖,其中該方塊圖用以提供聲紋識別。作業環境100可包含:一事件位置105,該事件位置包含:一主要的使用者裝置110和複數個參與使用者裝置120(A)-(C)。主要的使用者裝置110可包含:一計算裝置400,其參照第4圖於後文更為詳細的地描述,及可包含:一記錄裝置400,例如可操作以記錄在一事件中的參與者的聲音及/或影像之麥克風及/或照相機。舉例而言,數個共同工作者可在事件位置105參與一會議,例如一會議室。主要的使用者裝置110可記錄該會議,及捕捉與該等參與者相關聯的身份指示器,例如與參與使用者裝置120(A)-(C)相關聯的裝置ID(例如Bluetooth及/或無線網路MAC位址)。
主要的使用者裝置110可操作以:在該會議期間,傳送記錄至操作以產生所記錄的聲音之每一者的聲紋之另一裝置,例如識別伺服器140。主要的使用者裝置110可操作以:產生聲紋本身和將其傳送至識別伺服器140。識別伺服器140可操作以產生及/或管理一事件存在資料庫150、一事件參與者資料庫155、及/或一身份指示器資料庫160。與該聲紋相關聯的資料及/或事件可儲存於此些資料庫中,及可週期性地經關聯以:識別與該等聲紋的每一者相關的使用者。與本發明的具體實施例相一致,該等資料可儲存於一單一資料庫中,及/或分佈於多個資料庫和表格中。
第2A圖示例說明一實例事件存在表格200。事件存在表格200可包含:複數個列,每一列包含:與一聲紋欄205相關聯的資料、一事件欄210、一主要者欄215、及一位置欄220。在聲紋欄205中的資料對應於由該主要的使用者裝置110所產生的聲紋。在事件欄215中的資料可與一行事曆事件識別器相關聯,該行事曆事件識別器係由與主要的使用者裝置110相關聯的一主要的使用者所產生。在主要的欄215中的資料可包含:與該主要的使用者相關聯的一使用者識別器,及在位置欄220中的資料可包含:與事件位置105相關聯的一位置識別器。
第2B圖示例說明一實例事件參與者表格200。事件參與者表格230可包含:複數個列,每一列包含:與一參與者欄235、一時間欄240、及一參與者聲紋欄245相關聯的資料。事件參與者表格230亦可包含:事件欄210和主要者欄215,其如同包含如在事件存在表格200中的此些欄中所發現者之相同資料的索引欄。在參與者欄235的資料可根據一行事曆項目對應於與該事件相關聯的參與者之一清單、及/或由一使用者手動地輸入(例如該主要的使用者)。在時間欄240中的資料可從行事曆事件擷取、及/或可根據記錄何時發生的一時間點來輸入。在參與者聲紋欄245中的資料可包含:與如在參與者欄235中識別的參與者相關聯的一已知聲紋。舉例而言,一主要的使用者具有“jsmith”的使用者識別器和一已知的聲紋,如同在一第一事件參與者表格列247中所示例說明者。一參與使用者“cfrank”可根據一行事曆項目而已知為處於該事件,但不具有一識別的聲紋,如同示例說明於一第二事件參與者表格列248中。另一事件(例如:具有事件識別器38405的一事件)不具有一相關的行事曆事件,但已對數個參與者產生三個聲紋。聲紋中的一者可與主要的使用者(jsmith)相關聯,而可對於其它二個聲紋產生未知的參與者列,其如同由第三事件參與者表格列249所示例說明者。
第2C圖示例說明一實例身份指示器表格260。身份指示器表格250可包含:複數個列,每一列包含:與一已知使用者欄255和一指示器欄260相關聯的資料。身份指示器表格250亦可包含:事件欄210,其如同包含在事件存在表格200的事件欄210和事件參與者欄230所發現者相同資料的索引欄。身份指示器表格260可使用以儲存與該記錄的事件之周圍的指示器,該等指示器可使用以識別在該事件中的使用者和將使用者與聲紋相匹配。舉例而言,在具有事件識別器“37125”的一事件進行期間,可記錄一位置指示器、一Bluetooth裝置ID、一主要的使用者、及三個MAC位址、和將上述者儲存於身份指示器表格250中。類似地,在具有事件識別器“38405”的一事件進行期間,可記錄一主要的使用者、一位置、一MAC位址、及一Bluetooth裝置ID。
與本發明的具體實施例相一致,可週期性地執行在事件存在表格200、事件參與者表格230、及身份識示器表格250之間的相關性。此相關性可嘗試產生在一使用者與一聲紋之間的唯一的鏈結。舉例而言,如在一第一指示器表格列262和一第二指示器表格列264所示例說明者,MAC位址“04:33:28:29:AF:C3”已知為與一使用者“cfrank”相關聯,及可存在於事件“37215”和“38405”。在事件“37215”中使用者cfrank的參與可由第二事件參與者表格列248來相關聯。此導致:cfrank陳列於參與者欄235中,作為在事件“38405”的未知使用者之一者的可能的匹配,例如在第三事件參與者表格列249中。根據事件存在表格200,三個聲紋與在事件“37215”的參與者相關聯,其中二者亦在事件“38405”進行期間存在。二個常見的聲紋的一者已知為屬於主要的使用者“jsmith”。因此,該相關性可決定:其它共同的聲紋應與使用者“cfrank”相關聯。再者,此相關性可允許在事件“37215”中的第三聲紋的識別以與在此會議中的唯一其它參與者(使用者“bjones”)相關聯。此資料可在事件參與者表格230中更新,及關於使用者“cfrank”及/或“bjones”的聲紋的未來記錄可立即地與此些使用者相關聯。本發明的其它具體實施例可使用不同的表格結構以完成類似的相關性。
第3圖係與本發明的具體實施例相一致的流程圖,其描述關於方法300的一般性步驟以提供聲紋識別。方法300可使用參照第4圖更詳細地描述的計算裝置400來實施。實施方法300的步驟的方式將更為詳細地於後文描述。方法300可開始於啟始方塊305,及進行至步驟310,其中計算裝置400可記錄一聲音串流。舉例而言,主要的使用者裝置110可包含:一麥克風及/或照相機,其用以在一會議進行期間記錄聲音及/或影像。主要的使用者裝置110亦可操作以收集周圍的身份指示器,例如Bluetooh裝置ID、及/或與無線裝置相關聯的MAC位址(例如參與使用者裝置120(A)-(C))。
從步驟310,方法300可前進至步驟315,其中計算裝置400可針對所記錄聲音的每一者產生一聲紋。舉例而言,主要的使用者裝置110可使用聲音的生物統計以對使用者的語音的輪廓特徵數位化,以產生一儲存的模型聲紋。
在步驟315中計算裝置400產生聲紋之後,方法300可進行至步驟320,其中計算裝置400可決定:聲紋中的任何者是否與一已知的使用者相匹配。舉例而言,主要的使用者110可在一已知的使用者資料庫中查詢該聲紋以決定:該聲紋是否與在主要的使用者的組織內的另一使用者相關聯。
在步驟320中若該聲紋經決定為匹配一已知的使用者,方法300可前進至步驟325,其中計算裝置400可顯示與該已知的使用者相關聯的資訊元件。舉例而言,主要的使用者可在與一第二使用者的電話呼叫上。該第二使用者的聲紋可匹配至該主要的使用者的工作團隊的同事,及主要的使用者裝置110可顯示從該使用者接收的新近的電子郵件之一清單。方法300而後可對額外的使用者重複、或在步驟330結束。
在步驟320中若該聲紋並不與一已知的使用者相匹配,方法300可前進至步驟335,其中計算裝置400可在事件存在表格中產生一項目。舉例而言,主要的使用者裝置110可在存在表格200中產生一項目,其包含:一聲紋、一事件識別器、一主要的識別器(例如與主要的使用者裝置110相關聯的使用者)、及/或發生記錄的一位置。
從步驟335,方法300可進行至步驟340,其中計算裝置400可在參與者表格中產生一項目。舉例而言,主要的使用者裝置110可在事件參與者表格230中產生一項目,其包含:事件識別器、主要的識別器、至少一期望的參與者、記錄發生的時間、及/或該至少一期望的參與者的一已知聲紋。已知的聲紋可從一已知的使用者資料庫取得,該使用者資料庫包含:在使用者識別器和驗證的聲紋之間的關聯性(例如聲紋包含:唯一的使用者之識別中的足夠信心)。
從步驟340,方法300前進至步驟345,其中計算裝置400可將在存在和參與者表格中的項目相關聯。舉例而言,主要的使用者裝置110可決定:一給定聲紋是否發生在不同的會議,及可將此聲紋與在不同會議之間的共同參與者相匹配。在一情況中,一第一會議可由User1、User2、User3、及User4參與,其產生四種聲紋,稱為A、B、C、及D。一第二會議可由User1、User3、及User5,其產生三種聲紋,稱為A、C和E。計算裝置400可因而將聲紋A和C與User1和User3相關聯,儘管需要更多的資料來唯一地識別聲紋A和C中的何者與User1和User3中的何者相匹配。
類似地,計算裝置400可將聲紋、身份指示器、及期望的參與者相匹配。在前述的情境中,四個身份指示器(例如Bluetooh裝置識別器及/或無線裝置MAC位址)可經識別、及與該第一會議的四個聲紋(A、B、C和D)的每一者相關聯。在該第二會議,三個身份指示器可經識別,及與三個現存的聲紋(A、C和E)相關聯。若來自該第一會議的四個身份指示器之任何者亦可存在於該第二會議的三個身份指示器間,共同的身份指示器僅可與共同的聲紋相關聯(A和C),而不同的指示器可與不同的聲紋相關聯(在該第一會議的B和D、及在該第二會議的E)。
當越來越多的資料變為可獲用時,身份指示器可縮小直到計算裝置400可唯一地識別與一聲紋及/或一身份指示器關聯的使用者。舉例而言,主要的使用者裝置110可藉由從一記錄產生該使用者的聲紋,將Bluetooh裝置ID與該裝置的主要的使用者及/或該主要的使用者的聲紋相關聯,其中該使用者的聲音係唯一存在的一者(例如僅記錄主要的使用者側的電話呼叫)。其它身份指示器可藉由步驟345的相關性與特定的使用者相關聯,例如一聲紋已知為與存在於一會議的特定指示器相關聯,及與該會議相關聯的一行事曆項目提供在該會議的參與使用者的清單。參與使用者的清單提供可能的使用者之初始清單以與聲紋/裝置識別器對相匹配,其可藉由額外資料的相關性對一唯一的使用者來縮小。
從步驟345,方法300可前進至步驟350,其中計算裝置400可在一已知的使用者資料庫及/或表格產生一新的已知使用者項目。舉例而言,一旦主要的使用者裝置110將一特定的使用者與一聲紋及/或身份指示器相關聯,其可儲存此資料於一資料庫表格及/或其它儲存媒體中。此資料而後可在下次被存取,該聲紋及/或身份指示器為主要的使用者裝置110所面臨,及可使用以顯示相關的資訊,如同前文根據步驟325所描述。一旦計算裝置400在步驟350中產生已知的使用者項目,方法300而後可於步驟330結束。
與本發明相一致的具體實施例可包含:用於提供聲紋識別的系統。該系統可包含:一記憶體儲存、及耦接至該記憶體儲存的一處理單元。該處理單元經操作以:記錄在一事件的複數個發聲者、將該等複數個記錄的發聲者的每一者與至少一身份指示器相關聯、產生複數個聲紋,其每一者與該等複數個記錄的發聲者之至少一者相關聯,及根據該至少一身份指示器決定:該等複數個聲紋的至少一者是否對應於一使用者。若為如此,該處理單元可操作以產生與該使用者相關聯的一資料庫項目,及/或顯示與該使用者相關聯的至少一資訊元件,該資料庫項目包含:相對應的該等複數個聲紋的至少一者。
所使用的身份指示器可包含(例如):該記錄的一位置、該記錄的一時間、一呼叫ID、一裝置識別器、一主要的使用者、與該事件相關聯的一行事曆項目、一記錄的影像、及一聲音至文字區段。所顯示的資訊元件可包含(例如):具有相對應使用者的先前會議之清單、與該對應的使用者相關聯的聯絡資訊、與該對應的使用者相關聯的一電子郵件、與該對應的使用者相關聯的一文件、及與該對應的使用者相關的社群網路資訊。
該處理單元可操作以:產生、更新、刪除及/或修正在複數個表格及/或儲存裝置中的資料庫項目,以追蹤識別指示器及將聲紋與使用者相關聯。舉例而言,該處理單元可操作以:產生一事件存在資料庫項目,該事件存在資料庫項目包含:該等複數個發聲者之每一者的聲紋和事件識別器、一事件參與者資料庫項目,其包含:與該事件相關聯的該事件識別器和在該事件的使用者之清單、及/或一身份識別器資料庫項目,其包含:該事件識別器和與該等複數個記錄的發聲者之每一者相關聯的該至少一身份指示器。該處理單元而後可操作以:將來自資料庫的項目相關聯,及根據該等相關的項目決定:該等複數個聲紋的一者是否與一唯一的使用者相關聯。
該處理單元亦可操作以:決定該等複數個聲紋的一者與低於一臨界值數目的可能使用者相關聯(例如減少與該聲紋相關聯可能的使用者)。該臨界值數目可在一系統及/或以各使用者為基礎來組態。若為如此,該處理單元可顯示一請求至主要的使用者,以選擇何者使用者應與來自可能的使用者的聲紋相關聯。舉例而言,該處理單元重放與該聲紋相關聯的記錄聲音之樣本,及顯示三個可能的使用者的清單給主要的使用者來選擇。
與本發明一致的另一具體實施例可包含:用以提供聲紋識別的系統。該系統可包含:一記憶體儲存和耦合至該記憶體儲存的一處理單元。該處理單元可操作以:從一事件記錄中產生複數個聲紋,其每一者與在一事件的參與使用者相關聯、產生該等複數個聲紋的至少一者之新的事件存在資料庫項目、及決定:該等複數個聲紋的至少一者是否與至少一先前事件存在資料庫項目相關聯。若為如此,該處理單元可操作以:將關聯於該至少一先前事件存在資料庫項目的該身份指示器與關聯於新的事件存在資料庫項目的該身份指示器相關聯、決定:相關聯的身份指示器唯一地識別與該等複數個聲紋的至少一者相關聯的一使用者,及若為如此,則顯示與唯一識別的使用者相關聯的至少一資訊元件。該處理單元可操作以:指定一信心數值予該唯一識別的使用者。該信心數值可隨著相關的身份指示器的數目增加而增加。在事件存在資料庫中的項目可全部與相同的主要的使用者相關聯,及/或可與不同的主要的使用者相關聯,其中該主要的使用者可包含:操作使用以記錄聲音的裝置之該使用者。多個主要的使用者可包含(例如):在一單一組織內的不同的使用者。
該處理單元可進一步操作以決定:記錄的位置是否並不與該唯一識別的使用者相關聯。若為如此,及來自該事件的其它聲紋之一者並不為該唯一識別的使用者之聲紋,該處理單元可決定:該記錄的位置是否與一單一的使用者相關聯,及若為如此,則將其它聲紋與該單一的使用者相關聯。舉例而言,若在一使用者的指定辦公室於二個人之間發生記錄,身為一拜訪者的使用者可為該唯一地識別的使用者。在此情況中,擁有辦公室的使用者與其它聲紋相關聯。
與本發明一致的另一具體實施例可包含:用以提供聲紋辨識的系統。該系統可包含:一記憶體儲存和耦合至該記憶體儲存的一處理單元。該處理單元可操作以:藉由耦合至該系統的麥克風,記錄與一事件相關聯的一聲音串流、將與該聲音串流相關聯的複數個發聲者隔離、產生複數個聲紋,每一者與關聯於該聲音串流的該等複數個發聲者中的一者相關聯,及決定:至少一聲紋是否與一已知的使用者相關聯。若為如此,該處理單元件可操作以:顯示與該已知的使用者相關聯的至少一資訊元件。否則,該處理單元件可操作以:在一存在資料庫中產生一存在項目、在一參與者資料庫中產生一參與者項目、週期性地將在該存在資料庫中的複數個存在項目與在該參與者資料庫中的複數個參與者項目相關聯、及根據該等複數個存在項目與該等複數個鄰近項目的週期的相關性,在已知的使用者資料庫中產生一新的已知使用者項目,其包含:至少一聲紋。
第4圖係包含計算裝置400的系統之方塊圖。與本發明的具體實施例相一致,前述的記憶體儲存和處理單元可實施於一計算裝置中,例如第4圖的計算裝置400。任何硬體、軟體、或韌體的適當組合可使用以實施記憶體儲存和處理單元。舉例而言,該記憶體儲存和處理單元可與計算裝置400、或任何其它計算裝置418結合計算裝置400來實施。前述的系統、裝置、及處理器係實例和其它系統、裝置,及處理器可包含:前述的記憶體儲存和處理單元,其與本發明的具體實施例相一致。再者,計算裝置400可包含:如前文所描述的作業環境100。
參照至第4圖,與本發明的具體實施例相一致的系統可包含:一計算裝置、例如計算裝置400。在一基本的組態中,計算裝置400可包含:至少一處理單元402和一系統記憶體404。取決於計算裝置的組態和類型,系統記憶體404可包含(但不限於):揮發性(例如隨機存取記憶體(RAM))、非揮發性(例如唯讀記憶體(ROM))、快閃記憶體、或任何組合。系統記憶體404可包含:作業系統405、一或多個可程式模組406、及可包含:一聲紋產生器407。作業系統405(例如)適合於控制計算裝置400的操作。在一具體實施例中,可程式化模組406可包含:聲紋產生器407,其可操作以分析所記錄的聲音及產生一聲紋簽署。再者,本發明的具體實施例可結合繪圖資料庫、其它作業系統、或任何其它應用程式來實施,及而限於任何特定的應用程式或系統。此基本的組態藉由在虛線408內的此些元件示例說明於第4圖。
計算裝置400可具有額外的特徵或功能性。舉例而言,計算裝置400亦可包含:額外的資料儲存裝置(可移除及/或不可移除),例如磁碟、光碟、或磁帶。此額外的儲存可藉由可移除儲存409和不可移除儲存410示例說明於第4圖中。計算裝置400亦可包含:一通訊連接416,其允許裝置400與其它計算裝置418通訊,例如透過在一分散式計算環境中的網路(例如企業內網路或網際網路)。通訊連接416係通訊媒體的一實例。
在此使用的詞彙「電腦可讀取媒體」可包含:電腦儲存媒體。電腦儲存媒體可包含:揮發性和非揮發性媒體、可移除和不可移除媒體,其可用任何方法或技術來實施以儲存資訊,例如電腦可讀取指令、資料結構、程式模組、或其它資料。系統記憶體404、可移除儲存409、和不可移除儲存410係所有的電腦儲存媒體實例(例如記憶體儲存)。電腦儲存媒體可包含(但不限於):RAM、ROM、電子式可抹除唯讀記憶體(EEPROM)、快閃記憶體或其它記憶體技術、CD-ROM、數位影音光碟(DVD)、或其它光學儲存、磁匣、磁帶、磁碟儲存、或磁性儲存裝置、或可使用以儲存資料和可由計算裝置400存取的任何其它媒體。任何此電腦儲存媒體可為裝置400的部份。計算裝置400亦可具有輸入裝置(多個),例如鍵盤、滑鼠、筆、聲音輸入裝置、觸控輸入裝置等等。亦可包含輸出裝置(多個)414,例如顯示器、揚聲器、印表機等等。前述的裝置為實例,及可使用其它者。
如在此使用的詞彙「電腦可讀取媒體」亦可包含:通訊媒體。通訊媒體可藉由電腦可讀取指令、資料結構、程式模組、在調變資料訊號中的其它資料(例如載波或其它傳輸機制)來體現,及包含:任何資訊傳送媒體。詞彙「調變的資料訊號」可描述具有一或多個特性集或以此將資訊編碼在訊號中的方式改變的訊號。藉由實例的方式,而非限制,通訊媒體可包含:有線媒體,例如有線網路或直接線路連接、及無線媒體,例如聲音、射頻(RF)、紅外線、及其它無線媒體。
如同前文所述,一些程式模組和資料檔案可儲存於系統記憶體404中,其包含:作業系統405。當在處理單元402上執行時,程式模組406(例如聲紋產生器407)可執行包含(例如)如前文所述的一或多個方法300的步驟之程序。前述的程序係一實例,及處理單元402可執行其它程序。可根據本發明的具體實施例使用的其它程式模組可包含:電子郵件和聯絡應用程式、文書處理應用程式、試算表應用程式、資料庫應用程式、投影片呈現應用程式、繪圖或電腦輔助應用程式等等。
一般而言,與本發明的具體實施例一致,程式模組可包含:常式、程式、元件、資料結構、及可執行特定任務或可實施特定抽象資料類型的其它類型的結構。再者,本發明的具體實施例可使用其它電腦組態來實施,其包含:手持裝置、多處理器系統、基於多處理器式或可程式化的消費者電子、小型電腦、大型電腦、及其類似者。本發明的具體實施例亦可在分散式的計算環境中實施,其中可藉由透過通訊網路鏈結的遠端處理裝置來執行任務。在分散式的計算環境中,程式模組可位於本地端和遠端記憶體儲存裝置二者中。
再者,本發明的具體實施例可實現於一電路中,該電路包含:離散電子元件、包含邏輯閘的封裝或積體電子晶片、使用一微處理器的電路、或在包含電子元件或微處理器的單一晶片上的電路。本發明的具體實施例亦可使用能執行邏輯操作(例如AND、OR、及NOT)的其它技術來實施,其包含(但不限於)機械、光學、流體、及量子技術。此外,本發明的具體實施例可在一般性目的電腦或在任何其它電路或系統內實施。
本發明的具體實施例(例如)可實施為電腦程序(方法)、電腦系統、或作為一製造物項,例如電腦程式產品或電腦可讀取媒體。電腦程式產品可為由電腦系統讀取的電腦儲存媒體,和將電腦程式指令編碼以用於執行電腦程序。電腦程式產品亦可為由電腦系統讀取的載波上的傳播訊號,和將電腦程式指令編碼以執行電腦程式。從而,本發明可以硬體及/或軟體來體現(其包含:韌體、常駐軟體、微代碼等等)。換言之,本發明的具體實施例可採取在電腦可使用或電腦可讀取儲存媒體上的電腦程式產品的形式,該儲存媒體具有體現於媒體中的電腦可使用或電腦可讀取程式碼,以由指令執行系統使用或與指令執行系統結合。電腦可使用或電腦可讀取媒體可為任何可包含、儲存、通訊、傳遞、或傳輸由指令執行系統、設備、或裝置使用,或與指令執行系統、設備、或裝置結合的程式的媒體。
電腦可使用或電腦可讀取媒體可為例如(但不限於)電子、磁性、光學、電磁、紅外線、或半導體系統、設備、裝置、或傳播媒體。更多的特定電腦可讀取媒體實例(非窮盡性列表),電腦可讀取媒體可包含下列各者:具有一或多個導線的電氣連接、一可攜式電腦磁匣、一隨機存取記憶體(RAM)、一唯讀記憶體(ROM)、一可抹除可程式化唯讀記憶體(EPROM或快閃記憶體)、一光纖、及一可攜式緊密光碟唯讀記憶體(CD-ROM)。注意到:電腦可使用或電腦可讀取媒體甚至可為紙張、或列印程式的另一適當媒體,如程式可藉由(例如)紙張或其它媒體的光學掃描而電子式地捕捉,接著編譯、直譯、或另外地以適當的方式處理,若為必需,及而後儲存於電腦記憶體中。
本發明的具體實施例於前文參照根據本發明的具體實施例的方塊圖及/或方法、系統、及電腦程式產品的操作示例說明來描述。在方塊所註記的功能/步驟可不同於在任何流程圖中所顯示的順序來發生。舉例而言,連續顯示的二個方塊事實上可實質同時地執行,或方塊有時以相反次序來執行,其取決於所牽涉的功能性/步驟。
當已描述了本發明的特定具體實施例,亦可存在其它的具體實施例。再者,雖然本發明的具體實施例已描述為與儲存於記憶體和其它儲存媒體中的資料相關聯,資料亦可儲存在其它類型的電腦可讀取媒體上,或從其它類型的電腦可讀取媒體讀出,例如次要儲存裝置,類似硬碟、軟碟、或CD-ROM、來自網際網路的載波、或其它形式的RAM或ROM。再者,所揭露方法的步驟可用任何方式來修正,其包含:藉由重新排列步驟及/或置入或刪除步驟,而不偏離本發明。
含有在此包含的代碼之著作權的所有權利屬於申請人的財產。申請人保持和保留在此包含的代碼之所有權利,及准許僅結合已准專利的重製及無其它目的以重製該題材的許可。
當說明書包含實例時,本發明的範疇係由隨附的申請專利範圍來指明。再者,當使用特定於結構特徵及/或方法步驟來描述此說明書時,申請專利範圍並不限於前文所描述的特徵或步驟。而是,前文所描述的特定特徵和步驟可揭露為本發明的具體實施例之實例。
100...作業環境
105...事件位置
110...主要的使用者裝置
120...使用者裝置
140...識別伺服器
150...事件存在資料庫
155...事件參與者資料庫
160...身份指示器資料庫
200...事件存在表格
205...聲紋欄
210...事件欄
215...主要者欄
220...位置欄
230...事件參與者表格
235...參與者欄
240...時間欄
245...參與者聲紋欄
247...第一事件參與者表格列
248...第二事件參與者表格列
249...第三事件參與者表格列
250...身份指示器表格
255...已知使用者欄
260...身份指示器表格
262...第一指示器表格列
264...第二指示器表格列
400...計算裝置
402...處理單元
404...系統記憶體
405...作業系統
406...可程式化模組
408...虛線
409...可移除儲存
410...不可移除儲存
412...輸入裝置
414...輸出裝置
416...通訊連接
418...其它計算裝置
隨附圖式示例說明本發明的各種具體實施例,其在此併入和構成此揭露的一部份。在此些圖式中:
第1圖係一作業環境中的一方塊圖。
第2A-2C圖係使用於提供聲紋辨識的實例表格。
第3圖係用於提供聲紋辨識的方法之流程圖;及
第4圖係包含一計算裝置的一系統之方塊圖。
100...作業環境
105...事件位置
110...主要的使用者裝置
120...使用者裝置
140...識別伺服器
150...事件存在資料庫
155...事件參與者資料庫
160...身份指示器資料庫

Claims (20)

  1. 一種用於提供聲紋辨識的方法,該方法包含以下步驟:記錄在一事件中的複數個發聲者;將該等複數個發聲者之每一者與至少一個身份指示器相關聯;產生複數個聲紋,每一者與該等複數個發聲者之至少一者相關聯;根據該至少一個身份指示器,決定該等複數個聲紋的至少一者是否對應於一使用者;回應於決定該等複數個聲紋的該至少一者對應於該使用者,產生與使用者相關聯的一資料庫項目,該資料庫項目包含:對應的該等複數個聲紋的該至少一者;回應於決定該等複數個聲紋的該至少一者並未對應於該使用者,決定該等複數個聲紋的該至少一者是否與小於一臨界值數目的可能使用者相關聯;及回應於決定該等複數個聲紋的該至少一者與小於一臨界值數目的複數個可能使用者相關聯,顯示一請求至一主要的使用者以將該等複數個聲紋的該至少一者與來自該等複數個可能使用者間的一新的已知使用者相關聯。
  2. 如申請專利範圍第1項所述之方法,其中該至少一個身份指示器包含下列的至少一者:該記錄的一位置、該 記錄的一時間、一呼叫者ID(caller ID)、一裝置識別器、一主要的使用者、與該事件相關聯的一行事曆項目、一記錄的影像、及一聲音至文字區段。
  3. 如申請專利範圍第1項所述之方法,進一步包含以下步驟:回應於決定該等複數個聲紋的該至少一者對應於該使用者,顯示與該使用者相關聯的至少一個資訊元件。
  4. 如申請專利範圍第3項所述之方法,其中該至少一個資訊元件包含下列至少一者:具有該對應的使用者之先前會議的一清單、與該對應的使用者相關聯的聯絡資訊、與該對應的使用者相關聯的一電子郵件、與該對應的使用者相關聯的一文件、及與該對應的使用者相關聯的社群網路資訊。
  5. 如申請專利範圍第1項所述之方法,進一步包含以下步驟:對該等複數個發聲者之每一者,產生一事件存在資料庫項目,其中每一資料庫項目包含:與該等複數個發聲者的每一者相關聯的一聲紋,及與該事件相關聯的一事件識別器。
  6. 如申請專利範圍第5項所述之方法,進一步包含以下 步驟:產生一事件參與者資料庫項目,該事件參與者資料庫項目包含:與該事件相關聯的該事件識別器,及在該事件的使用者之一清單。
  7. 如申請專利範圍第6項所述之方法,其中與該事件相關聯的該事件識別器、和在該事件的使用者之該清單係根據與該事件相關聯的一行事曆項目來識別。
  8. 如申請專利範圍第6項所述之方法,進一步包含以下步驟:產生一身份指示器資料庫項目,該身份指示器資料庫項目包含:該事件識別器和與該等複數個發聲者之每一者相關聯的該至少一個身份指示器。
  9. 如申請專利範圍第8項所述之方法,其中根據該至少一個身份指示器,決定該等複數個聲紋的至少一者是否對應於該使用者之步驟包含以下步驟:將複數個發聲者資料庫項目、複數個事件資料庫項目、及複數個識別器資料庫項目相關聯;及根據該等關聯的複數個發聲者資料庫項目、複數個事件資料庫項目、及該等複數個識別器資料庫項目,決定該等複數個聲紋聲紋的該至少一者是否與一唯一的使用者相關聯。
  10. 一種儲存一組指令的電腦可讀取儲存裝置,當執行該組指令時可執行提供聲紋識別的一方法,由該組指令執行的該方法包含以下步驟:從一事件記錄產生複數個聲紋,其中該等複數個聲紋的每一者與在該事件的一參與使用者相關聯;對該等複數個聲紋的至少一者,產生一新的事件存在資料庫項目,其中該新的事件存在資料庫項目包含:該等複數個聲紋的該至少一者、與該事件相關聯的一事件識別器、及與該事件相關聯的一身份指示器;決定該等複數個聲紋的該至少一者是否與至少一個先前的事件存在資料庫項目相關聯;及回應於決定該等複數個聲紋的該至少一者與該至少一個先前的事件存在資料庫項目相關聯:將關聯於該至少一個先前的事件存在資料庫項目的該身份指示器和關聯於該新的事件存在資料庫項目的該身份指示器相關聯;決定該關聯的身份指示器是否唯一地識別與該等複數個聲紋的該至少一者相關聯的一使用者;回應於決定該關聯的身份指示器是否唯一地識別與該等複數個聲紋的該至少一者相關聯的該使用者,顯示關聯於該唯一識別的使用者之至少一個資訊元件;回應於決定該等複數個聲紋的該至少一者並未對應於該使用者,決定該等複數個聲紋的該至少一者是否 與小於一臨界值數目的可能使用者相關聯;及回應於決定該等複數個聲紋的該至少一者與小於一臨界值數目的複數個可能使用者相關聯,顯示一請求至一主要的使用者以將該等複數個聲紋的該至少一者與來自該等複數個可能使用者間的一特定使用者相關聯。
  11. 如申請專利範圍第10項所述之電腦可讀取儲存裝置,進一步包含:指定一信心數值予該唯一識別的使用者。
  12. 如申請專利範圍第11項所述之電腦可讀取儲存裝置,進一步包含:決定與一目前的發聲者相關聯的一聲紋和與該目前的發聲者相關聯的該身份指示器是否和與該唯一識别的使用者相關聯的該聲紋和該身份指示器相匹配;及回應於決定與該目前的發聲者相關聯的該聲紋和與該目前的發聲者相關聯的該身份指示器和與該唯一識别的使用者相關聯的該聲紋和該身份指示器相匹配,增加與該識別的使用者相關聯的該信心數值。
  13. 如申請專利範圍第10項所述之電腦可讀取儲存裝置,其中該新的事件存在資料庫項目和該至少一個先前的事件存在資料庫項目每一者與一單一的主要的使用者 相關聯。
  14. 如申請專利範圍第10項所述之電腦可讀取儲存裝置,其中該新的事件存在資料庫項目和該至少一個先前的事件存在資料庫項目每一者與一不同的主要的使用者相關聯。
  15. 如申請專利範圍第14項所述之電腦可讀取儲存裝置,其中與該新的事件存在資料庫項目關聯的該主要的使用者和與該至少一個先前的事件存在資料庫項目關聯的該主要的使用者二者與一單一組織相關聯。
  16. 如申請專利範圍第10項所述之電腦可讀取儲存裝置,其中該身份指示器包含下列至少一者:該記錄的一位置、該記錄的一時間、一呼叫者ID、一裝置識別器、該主要的使用者、與該事件相關聯的一行事曆項目、一記錄的影像、及一聲音至文字區段。
  17. 如申請專利範圍第16項所述之電腦可讀取儲存裝置,進一步包含:決定該記錄的該位置是否並不與該唯一識別的使用者相關聯;回應於決定該記錄的該位置並不與該唯一識別的使用者相關聯,決定該等複數個聲紋的一者是否不與該唯一 識別的使用者相關聯;回應於決定該等複數個聲紋的一者並不與該唯一識別的使用者相關聯,決定該記錄的該位置是否與一單一的使用者相關聯;及回應於決定該記錄的該位置與該單一的使用者相關聯,將該等複數個聲紋的一者與該單一的使用者相關聯。
  18. 如申請專利範圍第10項所述之電腦可讀取儲存裝置,其中該至少一個資訊元件包含下列至少一者:具有該對應的使用者的先前會議的一清單、與該對應的使用者相關聯的連絡資訊、與該相對應的使用者相關聯的一電子郵件、與該對應的使用者相關聯的一文件、及與該對應的使用者相關聯的社交網路資訊。
  19. 一種提供聲紋識別的系統,該系統包含:一記憶體儲存;及耦合至該記憶體儲存的一處理單元,其中該處理單元操作以:藉由耦合至該系統的一麥克風,讀取與一事件相關聯的一聲音串流;將與該聲音串流相關聯的複數個發聲者隔離;產生複數個聲紋,每一者與關聯於該聲音串流的該等複數個發聲者的一者相關聯;決定該至少一個聲紋是否與一已知的使用者相關 聯,其中操作以決定該至少一個聲紋是否與該已知的使用者相關聯之步驟包含以下步驟:操作以決定在包含與一組織相關聯的複數個使用者之一已知的使用者資料庫中的一已知的使用者項目是否包含該至少一個聲紋;回應於決定該至少一個聲紋與一已知的使用者相關聯,顯示與該已知的使用者相關聯的至少一個資訊元件,其中該至少一個資訊元件包含下列至少一者:與該已知的使用者相關聯的一電子郵件、與具有該已知的使用者的至少一先前會議相關聯的一文件、該已知的使用者的一發聲者識別、及與該已知的使用者相關聯的一連絡資料,回應於決定該至少一個聲紋並不與該已知的使用者相關聯:在一存在資料庫產生一存在項目,該存在項目包含:該至少一個聲紋、與該聲音串流相關聯的一位置、與該聲音串流相關聯的一時間、與該系統相關聯的一裝置識別器、與該系統相關聯的一主要的使用者識別器,及與該聲音串流相關聯的至少一個周圍的指示器,及在一參與者資料庫產生一參與者項目,該參與者項目包含:與該系統相關聯的該主要的使用者識別器、與關聯於該事件的一行事曆項目相關聯的一事件識別器、與該事件相關聯的一閞始時間、與該事件相關聯的一結束時間、及與該事件相關聯的至少一個期望的使用者,週期性地將在該存在資料庫中的複數個存在項目與 在該參與者資料庫中的複數個參與者項目相關聯,其中該等複數個存在項目和該等複數個參與者項目與關聯於該組織的該等複數個使用者相關聯;及根據該等複數個存在項目與該等複數個參與者項目的一週期性相關性,在該已知的使用者資料庫產生一新的已知使用者項目,該新的已知使用者項目包含該至少一個聲紋;其中該週期性相關性包含:決定該至少一個聲紋是否與小於一臨界值數目的可能使用者相關聯;及回應於決定該等複數個聲紋的該至少一者與小於一值數目的複數個可能使用者相關聯,顯示一請求至一主要的使用者以將該等複數個聲紋的該至少一者與來自該等複數個參與者項目之一者的該已知的使用者相關聯。
  20. 如申請專利範圍第19項所述之系統,進一步包含:指定一信心數值予該已知的使用者。
TW100110812A 2010-05-24 2011-03-29 聲紋辨識 TWI536365B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/786,259 US8606579B2 (en) 2010-05-24 2010-05-24 Voice print identification for identifying speakers

Publications (2)

Publication Number Publication Date
TW201142823A TW201142823A (en) 2011-12-01
TWI536365B true TWI536365B (zh) 2016-06-01

Family

ID=44973214

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100110812A TWI536365B (zh) 2010-05-24 2011-03-29 聲紋辨識

Country Status (5)

Country Link
US (2) US8606579B2 (zh)
EP (1) EP2577655B1 (zh)
CN (1) CN102985965B (zh)
TW (1) TWI536365B (zh)
WO (1) WO2011149647A2 (zh)

Families Citing this family (192)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
CN101673544B (zh) * 2009-10-10 2012-07-04 上海电虹软件有限公司 一种基于声纹识别和定位跟踪的交叉监控方法和系统
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8606579B2 (en) * 2010-05-24 2013-12-10 Microsoft Corporation Voice print identification for identifying speakers
US20110320201A1 (en) * 2010-06-24 2011-12-29 Kaufman John D Sound verification system using templates
EP2405365B1 (en) * 2010-07-09 2013-06-19 Sony Ericsson Mobile Communications AB Method and device for mnemonic contact image association
US9800721B2 (en) 2010-09-07 2017-10-24 Securus Technologies, Inc. Multi-party conversation analyzer and logger
CN102023894A (zh) * 2010-11-18 2011-04-20 华为终端有限公司 一种用户操作界面的变换方法及终端
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9225701B2 (en) 2011-04-18 2015-12-29 Intelmate Llc Secure communication systems and methods
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9031842B2 (en) * 2011-07-28 2015-05-12 Blackberry Limited Methods and devices for facilitating communications
US9401058B2 (en) * 2012-01-30 2016-07-26 International Business Machines Corporation Zone based presence determination via voiceprint location awareness
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
TWI502411B (zh) * 2012-04-26 2015-10-01 Acer Inc 觸控偵測方法與觸控偵測裝置
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9996628B2 (en) * 2012-06-29 2018-06-12 Verisign, Inc. Providing audio-activated resource access for user devices based on speaker voiceprint
US8744995B1 (en) 2012-07-30 2014-06-03 Google Inc. Alias disambiguation
US8520807B1 (en) 2012-08-10 2013-08-27 Google Inc. Phonetically unique communication identifiers
US8583750B1 (en) 2012-08-10 2013-11-12 Google Inc. Inferring identity of intended communication recipient
US8571865B1 (en) * 2012-08-10 2013-10-29 Google Inc. Inference-aided speaker recognition
US9946699B1 (en) * 2012-08-29 2018-04-17 Intuit Inc. Location-based speech recognition for preparation of electronic tax return
US9147399B1 (en) * 2012-08-31 2015-09-29 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US8965759B2 (en) * 2012-09-01 2015-02-24 Sarah Hershenhorn Digital voice memo transfer and processing
US9058806B2 (en) * 2012-09-10 2015-06-16 Cisco Technology, Inc. Speaker segmentation and recognition based on list of speakers
US20140081637A1 (en) * 2012-09-14 2014-03-20 Google Inc. Turn-Taking Patterns for Conversation Identification
US9837078B2 (en) 2012-11-09 2017-12-05 Mattersight Corporation Methods and apparatus for identifying fraudulent callers
CN103035247B (zh) * 2012-12-05 2017-07-07 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置
JP2016508007A (ja) 2013-02-07 2016-03-10 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9123330B1 (en) * 2013-05-01 2015-09-01 Google Inc. Large-scale speaker identification
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9294616B2 (en) * 2013-06-30 2016-03-22 International Business Machines Corporation Identifying a contact based on a voice communication session
TWI508057B (zh) * 2013-07-15 2015-11-11 Chunghwa Picture Tubes Ltd 語音辨識系統以及方法
US20150025888A1 (en) * 2013-07-22 2015-01-22 Nuance Communications, Inc. Speaker recognition and voice tagging for improved service
EP3036741A4 (en) * 2013-08-20 2017-05-03 Intel Corporation Collaborative audio conversation attestation
US10014006B1 (en) 2013-09-10 2018-07-03 Ampersand, Inc. Method of determining whether a phone call is answered by a human or by an automated device
US9053711B1 (en) * 2013-09-10 2015-06-09 Ampersand, Inc. Method of matching a digitized stream of audio signals to a known audio recording
TW201513095A (zh) * 2013-09-23 2015-04-01 Hon Hai Prec Ind Co Ltd 語音處理系統、裝置及方法
CN104575575A (zh) * 2013-10-10 2015-04-29 王景弘 语音管理装置及其操作方法
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150278737A1 (en) * 2013-12-30 2015-10-01 Google Inc. Automatic Calendar Event Generation with Structured Data from Free-Form Speech
WO2015150867A1 (en) * 2014-04-01 2015-10-08 Sony Corporation Assigning voice characteristics to a contact information record of a person
WO2015156798A1 (en) 2014-04-09 2015-10-15 Empire Technology Development, Llc Identification by sound data
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10127911B2 (en) * 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10057699B2 (en) * 2014-10-01 2018-08-21 Sartorius Stedim Biotech Gmbh Audio identification device, audio identification method and audio identification system
US9563992B2 (en) 2014-12-01 2017-02-07 Honeywell International Inc. System and method of associating, assigning, and authenticating users with personal protective equipment using biometrics
US9922048B1 (en) 2014-12-01 2018-03-20 Securus Technologies, Inc. Automated background check via facial recognition
US9484033B2 (en) * 2014-12-11 2016-11-01 International Business Machines Corporation Processing and cross reference of realtime natural language dialog for live annotations
CN105788609B (zh) * 2014-12-25 2019-08-09 福建凯米网络科技有限公司 多路音源的关联方法和装置及评定方法和系统
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9704488B2 (en) * 2015-03-20 2017-07-11 Microsoft Technology Licensing, Llc Communicating metadata that identifies a current speaker
US9672829B2 (en) * 2015-03-23 2017-06-06 International Business Machines Corporation Extracting and displaying key points of a video conference
CN104766604B (zh) * 2015-04-02 2019-01-08 努比亚技术有限公司 语音数据的标记方法及装置
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
CN105096937A (zh) * 2015-05-26 2015-11-25 努比亚技术有限公司 语音数据处理方法及终端
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10048936B2 (en) * 2015-08-31 2018-08-14 Roku, Inc. Audio command interface for a multimedia device
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
CN106548793A (zh) * 2015-09-16 2017-03-29 中兴通讯股份有限公司 存储和播放音频文件的方法和装置
KR20170044386A (ko) * 2015-10-15 2017-04-25 삼성전자주식회사 전자기기 및 전자기기의 제어방법
CN105427857B (zh) * 2015-10-30 2019-11-08 华勤通讯技术有限公司 生成文字记录的方法及系统
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
CN105895077A (zh) * 2015-11-15 2016-08-24 乐视移动智能信息技术(北京)有限公司 录音标记方法及录音装置
CN105895102A (zh) * 2015-11-15 2016-08-24 乐视移动智能信息技术(北京)有限公司 录音编辑方法及录音装置
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
TWI612516B (zh) * 2016-08-25 2018-01-21 財團法人資訊工業策進會 聲紋辨識裝置、聲紋辨識方法及其電腦程式產品
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
EP3542360A4 (en) 2016-11-21 2020-04-29 Microsoft Technology Licensing, LLC METHOD AND DEVICE FOR AUTOMATIC SYNCHRONIZATION
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
CN106782551B (zh) * 2016-12-06 2020-07-24 北京华夏电通科技有限公司 一种语音识别系统及方法
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10276169B2 (en) * 2017-01-03 2019-04-30 Lenovo (Singapore) Pte. Ltd. Speaker recognition optimization
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
KR102444165B1 (ko) 2017-01-20 2022-09-16 삼성전자주식회사 적응적으로 회의를 제공하기 위한 장치 및 방법
CN107181851A (zh) * 2017-04-25 2017-09-19 上海与德科技有限公司 通话控制方法及装置
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10650813B2 (en) * 2017-05-25 2020-05-12 International Business Machines Corporation Analysis of content written on a board
EP3636052A4 (en) 2017-05-31 2021-02-24 Cryovac, LLC ELECTRONIC DEVICE, METHOD AND EQUIPMENT FOR MANUFACTURING AN ELECTRONIC DEVICE AND COMPOSITION THEREFORE
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN109147770B (zh) * 2017-06-16 2023-07-28 阿里巴巴集团控股有限公司 声音识别特征的优化、动态注册方法、客户端和服务器
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN107689225B (zh) * 2017-09-29 2019-11-19 福建实达电脑设备有限公司 一种自动生成会议记录的方法
CN108305615B (zh) * 2017-10-23 2020-06-16 腾讯科技(深圳)有限公司 一种对象识别方法及其设备、存储介质、终端
CN107945806B (zh) * 2017-11-10 2022-03-08 北京小米移动软件有限公司 基于声音特征的用户识别方法及装置
CN107845386B (zh) * 2017-11-14 2020-04-21 维沃移动通信有限公司 声音信号处理方法、移动终端和服务器
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10535346B2 (en) * 2017-12-07 2020-01-14 Ca, Inc. Speech processing computer system forming collaborative dialog data structures
CN107993665B (zh) * 2017-12-14 2021-04-30 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
EP3503092A1 (en) * 2017-12-21 2019-06-26 Thomson Licensing Method for establishing a link between a device and a speaker in a gateway, corresponding computer program computer and apparatus
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
CN111868711A (zh) * 2018-02-06 2020-10-30 日产自动车株式会社 信息处理方法以及信息处理装置
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11108912B2 (en) 2018-11-06 2021-08-31 International Business Machines Corporation Automated written indicator for speakers on a teleconference
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11302335B2 (en) * 2019-08-01 2022-04-12 Nuance Communications, Inc. System and method for managing an automated voicemail
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11076043B2 (en) 2019-10-04 2021-07-27 Red Box Recorders Limited Systems and methods of voiceprint generation and use in enforcing compliance policies
CN111243605A (zh) * 2020-01-13 2020-06-05 北京三快在线科技有限公司 业务处理方法、装置、设备及存储介质
CN111340555B (zh) * 2020-02-29 2023-07-18 重庆百事得大牛机器人有限公司 基于法律领域用户画像模型的建议决策系统及方法
CN111339257B (zh) * 2020-02-29 2023-05-23 重庆百事得大牛机器人有限公司 法律咨询用户的个性化用户画像识别方法
CN113571086B (zh) * 2020-04-28 2022-07-08 阿里巴巴集团控股有限公司 声音信号处理方法、装置、电子设备及可读存储介质
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
EP4017021A1 (en) * 2020-12-21 2022-06-22 Sonova AG Wireless personal communication via a hearing device

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5806040A (en) * 1994-01-04 1998-09-08 Itt Corporation Speed controlled telephone credit card verification system
US6457043B1 (en) 1998-10-23 2002-09-24 Verizon Laboratories Inc. Speaker identifier for multi-party conference
WO2001016940A1 (en) 1999-08-31 2001-03-08 Accenture, Llp System, method, and article of manufacture for a voice recognition system for identity authentication in order to gain access to data on the internet
US6782413B1 (en) * 2000-02-11 2004-08-24 Microsoft Corporation Distributed conference bridge
US6748356B1 (en) 2000-06-07 2004-06-08 International Business Machines Corporation Methods and apparatus for identifying unknown speakers using a hierarchical tree structure
US7047192B2 (en) 2000-06-28 2006-05-16 Poirier Darrell A Simultaneous multi-user real-time speech recognition system
US7487112B2 (en) * 2000-06-29 2009-02-03 Barnes Jr Melvin L System, method, and computer program product for providing location based services and mobile e-commerce
US6731307B1 (en) * 2000-10-30 2004-05-04 Koninklije Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and responds to user's mental state and/or personality
US6728679B1 (en) * 2000-10-30 2004-04-27 Koninklijke Philips Electronics N.V. Self-updating user interface/entertainment device that simulates personal interaction
US6795808B1 (en) * 2000-10-30 2004-09-21 Koninklijke Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and charges external database with relevant data
WO2002054264A1 (en) * 2000-12-29 2002-07-11 Webex Communications, Inc. Distributed network system architecture for collaborative computing
EP1395803B1 (en) 2001-05-10 2006-08-02 Koninklijke Philips Electronics N.V. Background learning of speaker voices
US20040029567A1 (en) * 2001-05-25 2004-02-12 Timmins Timothy A. Technique for effectively providing personalized communications and information assistance services
US7139722B2 (en) 2001-06-27 2006-11-21 Bellsouth Intellectual Property Corporation Location and time sensitive wireless calendaring
US7333798B2 (en) * 2002-08-08 2008-02-19 Value Added Communications, Inc. Telecommunication call management and monitoring system
US7251786B2 (en) 2003-02-26 2007-07-31 Microsoft Corporation Meeting information
US7702730B2 (en) * 2004-09-03 2010-04-20 Open Text Corporation Systems and methods for collaboration
US8639629B1 (en) * 2005-02-02 2014-01-28 Nexus Payments, LLC System and method for accessing an online user account registry via a thin-client unique user code
US8668568B2 (en) * 2005-04-27 2014-03-11 Ticketmaster, L.L.C. Methods and systems for determining user location
US7679518B1 (en) 2005-06-28 2010-03-16 Sun Microsystems, Inc. Meeting facilitation tool
US7864987B2 (en) * 2006-04-18 2011-01-04 Infosys Technologies Ltd. Methods and systems for secured access to devices and systems
JP4850690B2 (ja) 2006-12-26 2012-01-11 株式会社日立製作所 通信会議装置
CN101221761A (zh) 2007-01-12 2008-07-16 台达电子工业股份有限公司 具有智慧型鉴别调适功能的语音辨识方法及系统
US9552571B2 (en) 2007-02-02 2017-01-24 Blackberry Limited Electronic device and method of meeting notification
JP5261983B2 (ja) 2007-05-23 2013-08-14 ヤマハ株式会社 音声通信システム
US20090177476A1 (en) 2007-12-21 2009-07-09 May Darrell Method, system and mobile device for registering voice data with calendar events
US8140340B2 (en) * 2008-01-18 2012-03-20 International Business Machines Corporation Using voice biometrics across virtual environments in association with an avatar's movements
US20090204414A1 (en) 2008-02-07 2009-08-13 Bharat Punjalal Shah Method and system to enable in-context pre-meeting dialogue and collaboration among invitees
US20090204904A1 (en) 2008-02-08 2009-08-13 Research In Motion Limited Electronic device and method for determining time periods for a meeting
JP2010060850A (ja) 2008-09-04 2010-03-18 Nec Corp 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム
US8866607B2 (en) * 2009-12-23 2014-10-21 Verizon Patent And Licensing Inc. Method and system of providing location-based alerts for tracking personal items
US8428227B2 (en) * 2010-05-18 2013-04-23 Certicall, Llc Certified communications system and method
US8606579B2 (en) * 2010-05-24 2013-12-10 Microsoft Corporation Voice print identification for identifying speakers

Also Published As

Publication number Publication date
CN102985965B (zh) 2015-04-01
EP2577655B1 (en) 2016-11-23
EP2577655A4 (en) 2015-05-20
US20140100849A1 (en) 2014-04-10
TW201142823A (en) 2011-12-01
CN102985965A (zh) 2013-03-20
US9691393B2 (en) 2017-06-27
US8606579B2 (en) 2013-12-10
EP2577655A2 (en) 2013-04-10
WO2011149647A2 (en) 2011-12-01
US20110288866A1 (en) 2011-11-24
WO2011149647A3 (en) 2012-02-23

Similar Documents

Publication Publication Date Title
TWI536365B (zh) 聲紋辨識
US10586541B2 (en) Communicating metadata that identifies a current speaker
CN205647778U (zh) 一种智能会议系统
US7995732B2 (en) Managing audio in a multi-source audio environment
US8887303B2 (en) Method and system of processing annotated multimedia documents using granular and hierarchical permissions
CN111258528B (zh) 语音用户界面的显示方法和会议终端
US20130204618A1 (en) Methods and Systems for Dictation and Transcription
US20150154960A1 (en) System and associated methodology for selecting meeting users based on speech
US11909784B2 (en) Automated actions in a conferencing service
JP5030868B2 (ja) 会議音声録音システム
JP2009122839A (ja) 電子会議支援システム
KR20170126667A (ko) 회의 기록 자동 생성 방법 및 그 장치
JP2008242837A (ja) コミュニケーションの状況を管理する装置、方法およびプログラム
JP2010109898A (ja) 撮影制御装置、撮影制御方法及びプログラム
CN111223487B (zh) 一种信息处理方法及电子设备
US20160260435A1 (en) Assigning voice characteristics to a contact information record of a person
JP2008011272A (ja) 会議システム及び制御方法、並びにプログラム及び記憶媒体
JP7258686B2 (ja) 情報処理システム、情報処理方法、及びプログラム
JP6596913B2 (ja) スケジュール作成装置、スケジュール作成方法、プログラム
JP7103681B2 (ja) 音声認識プログラム、音声認識方法、音声認識装置および音声認識システム
US20230403174A1 (en) Intelligent virtual event assistant
JP2022190802A (ja) コミュニケーション管理プログラム、コミュニケーション管理方法および情報処理装置
JP2023172189A (ja) 表示制御システム及び表示制御装置
JP2015072554A (ja) 議事録作成システム、議事録作成装置及びプログラム

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees