TW201724879A - 在遠距通信期間發送語音對話的轉錄本 - Google Patents
在遠距通信期間發送語音對話的轉錄本 Download PDFInfo
- Publication number
- TW201724879A TW201724879A TW105137602A TW105137602A TW201724879A TW 201724879 A TW201724879 A TW 201724879A TW 105137602 A TW105137602 A TW 105137602A TW 105137602 A TW105137602 A TW 105137602A TW 201724879 A TW201724879 A TW 201724879A
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- user
- user device
- channel
- user equipment
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000004891 communication Methods 0.000 claims description 99
- 239000000463 material Substances 0.000 claims description 55
- 230000005540 biological transmission Effects 0.000 claims description 19
- 230000003139 buffering effect Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000013518 transcription Methods 0.000 claims description 2
- 230000035897 transcription Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 30
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 235000012431 wafers Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72475—User interfaces specially adapted for cordless or mobile telephones specially adapted for disabled users
- H04M1/72478—User interfaces specially adapted for cordless or mobile telephones specially adapted for disabled users for hearing-impaired users
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M11/00—Telephonic communication systems specially adapted for combination with other electrical systems
- H04M11/06—Simultaneous speech and data transmission, e.g. telegraphic transmission over the same conductors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M11/00—Telephonic communication systems specially adapted for combination with other electrical systems
- H04M11/10—Telephonic communication systems specially adapted for combination with other electrical systems with dictation recording and playback systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42391—Systems providing special services or facilities to subscribers where the subscribers are hearing-impaired persons, e.g. telephone devices for the deaf
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/0024—Services and arrangements where telephone services are combined with data services
- H04M7/0042—Services and arrangements where telephone services are combined with data services where the data service is a text-based messaging service
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42382—Text-based messaging services in telephone networks such as PSTN/ISDN, e.g. User-to-User Signalling or Short Message Service for fixed networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本文揭示用於在遠距通信期間發送語音對話的轉錄本的方法和系統。在一個態樣,參與同至少第二使用者設備的語音通話的第一使用者設備,接收來自第一使用者設備的使用者的語音資料,將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本,在第一通道上向第二使用者設備發送該語音資料,並且在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本。
Description
大體而言,本案內容的態樣係關於遠距通信,更特定言之,本案內容的態樣係關於在遠距通信期間發送語音對話的轉錄本等等。
無線通訊設備用於很多不同的環境,但有時聽者難以理解說話者講的話。例如,在較差的無線通訊通道狀況、壅塞的網路、高干擾等等情況下,通常會丟失(例如,IP承載語音(VoIP)撥叫中的)語音封包,故聽者變得很難理解說話者在說什麼。再舉一個例子,在不匹配的環境的情況下(例如,當說話者處於安靜環境,但聽者處於嘈雜環境時),聽者可能不能正確地感知對話。再舉一個例子,聽者可能由於說話者的口音,而感到難以理解說話者。
下文提供了與本文所揭示的一或多個態樣及/或實施例有關的簡單概括。因此,下文的概括部分不應被認為是與所有預期態樣及/或實施例有關的詳盡概述,亦不應將下文的概括部分視作為用於辨識與所有預期態樣及/或實施例有關的關鍵或重要要素,或者用於描述與任何特定態樣及/或實施例相關聯的範疇。因此,下文的概括部分的唯一目的是用簡單的形式,呈現與同本文所揭示的機制有關的一或多個態樣及/或實施例相關的某些概念,以此作為後面提供的具體實施方式的前奏。
一種用於在遠距通信期間發送語音對話的轉錄本的方法包括:在參與同至少第二使用者設備的語音通話的第一使用者設備處,接收來自第一使用者設備的使用者的語音資料;由第一使用者設備,將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本;由第一使用者設備,在第一通道上向第二使用者設備發送該語音資料;及由第一使用者設備,在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本。
一種用於在遠距通信期間發送語音對話的轉錄本的裝置包括:第一使用者設備的至少一個收發機,其被配置為接收來自第一使用者設備的使用者的語音資料,第一使用者設備參與同至少第二使用者設備的語音通話;及第一使用者設備的至少一個處理器,其被配置為將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本,其中該至少一個收發機亦被配置為:在第一通道上向第二使用者設備發送該語音資料,並且在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本。
一種用於在遠距通信期間發送語音對話的轉錄本的裝置包括:用於在參與同至少第二使用者設備的語音通話的第一使用者設備處,接收來自第一使用者設備的使用者的語音資料的構件;用於由第一使用者設備,將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本的構件;用於由第一使用者設備,在第一通道上向第二使用者設備發送該語音資料的構件;及用於由第一使用者設備,在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本的構件。
一種用於在遠距通信期間發送語音對話的轉錄本的非暫時性電腦可讀取媒體包括:用於在參與同至少第二使用者設備的語音通話的第一使用者設備處,接收來自第一使用者設備的使用者的語音資料的至少一條指令;用於由第一使用者設備,將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本的至少一條指令;用於由第一使用者設備,在第一通道上向第二使用者設備發送該語音資料的至少一條指令;及用於由第一使用者設備,在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本的至少一條指令。
基於所附的附圖和具體實施方式,與本文所揭示的態樣和實施例相關聯的其他目的和優點對於本領域一般技藝人士將是顯而易見的。
本文揭示用於在遠距通信期間發送語音對話的轉錄本的方法和系統。在一個態樣,參與同至少第二使用者設備的語音通話的第一使用者設備,從第一使用者設備的使用者接收語音資料,將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本,在第一通道上向第二使用者設備發送該語音資料,並且在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本。
在下文的針對本案內容的特定實施例的描述和相關附圖中,揭示本案內容的該等和其他態樣。在不脫離本案內容的範疇的基礎上,可以設計出替代性實施例。此外,為了避免對本案內容的相關細節造成模糊,將不詳細描述或者將省略本案內容的一些公知要素。
本文使用的「示例性」及/或「示例」一詞意味著「用作示例、實例或說明」。本文中描述為「示例性」及/或「示例」的任何實施例不一定被解釋為比其他實施例更優選或更具優勢。同樣,術語「本案內容的實施例」不是要求本案內容的所有實施例皆包括所論述的特徵、優點或操作模式。
此外,從由例如計算設備的元件執行的動作序列的角度,來描述了多個實施例。應當認識到,本文所描述的各種動作可以由特定的電路(例如,特殊應用積體電路(ASIC))、由藉由一或多個處理器執行的程式指令或者由二者的組合來執行。此外,本文描述的該等動作序列可以被認為是完全地體現在任何形式的電腦可讀取儲存媒體中,該電腦可讀取儲存媒體具有儲存在其中的相應電腦指令集,當該等電腦指令被執行時,將使得相關聯的處理器執行本文所描述的功能。因此,本案內容的各個態樣可以以多種不同的形式來體現,所有的該等不同形式皆已經被預期到而落入所要求保護的標的的範疇之內。此外,對於本文描述的每一個實施例而言而言,本文可以將相應形式的任何此種實施例描述成例如被配置為執行所描述的動作的「邏輯單元」。
本文稱為使用者設備(UE)的客戶端設備可以是行動的或者靜止的,可以與無線電存取網路(RAN)進行通訊。如本文所使用的,術語「UE」可以互換地稱為「存取終端」或「AT」、「無線設備」、「用戶設備」、「用戶終端」、「用戶站」、「使用者終端」或UT、「行動終端」、「行動站」、「使用者設備」以及其變型。通常,UE可以經由RAN與核心網路進行通訊,並且經由核心網路,UE可以與諸如網際網路之類的外部網路相連接。當然,對於UE而言,連接到核心網路及/或網際網路的其他機制亦是可能的,例如,經由有線存取網路、WiFi網路(如,基於IEEE 802.11等)等等。UE可以藉由多種類型的設備中的任意一種來體現,其包括但不限於:PC卡、緊湊型快閃記憶體設備、外部或者內接式數據機、無線或有線電話等等。UE經由其能夠向RAN發送信號的通訊鏈路,被稱為上行鏈路通道(例如,反向訊務通道、反向控制通道、存取通道等等)。RAN經由其能夠向UE發送信號的通訊鏈路,被稱為下行鏈路或前向鏈路通道(例如,傳呼通道、控制通道、廣播通道、前向訊務通道等等)。如本文所使用的,術語訊務通道(TCH)可以代表上行鏈路/反向或者下行鏈路/前向訊務通道。
圖1圖示根據本案內容的實施例的無線通訊系統100的高層系統架構。無線通訊系統100包含UE 1…N。UE 1…N可以包括蜂巢式電話、個人數位助理(PDA)、傳呼機、膝上型電腦、桌上型電腦等等。例如,在圖1中,將UE 1…2圖示為蜂巢撥叫電話,將UE 3…5圖示為蜂巢觸控式螢幕電話或者智慧型電話,以及將UE N圖示為桌上型電腦或PC。
參見圖1,UE 1…N被配置為經由實體通訊介面或者層(其在圖1中被圖示為空中介面104、106、108及/或直接有線連接),與存取網路(例如,RAN 120、存取點125等等)進行通訊。空中介面104和106可以遵循給定的蜂巢通訊協定(例如,CDMA(分碼多工存取)、EVDO(進化資料最佳化)、eHRPD(進化型高速率封包資料)、GSM(行動通訊全球系統)、EDGE(增強型資料速率GSM進化)、W-CDMA(寬頻CDMA)、LTE(長期進化)等等),而空中介面108可以遵循無線IP協定(例如,IEEE 802.11)。
RAN 120包括經由空中介面(例如,空中介面104和106)來服務UE的複數個存取點。RAN 120中的存取點可以稱為「存取節點」或者「AN」、「存取點」或「AP」、「基地台」或「BS」、「節點B」、「eNodeB」等等。該等存取點可以是陸地存取點(或者地面站)或者衛星存取點。RAN 120被配置為連接到核心網路140,核心網路140可以執行多種功能(其包括:對由RAN 120服務的UE和由RAN 120或不同的RAN服務的其他UE之間的電路交換(CS)撥叫總而言之進行橋接),並且核心網路140亦可以對與諸如網際網路175的外部網路的封包交換(PS)資料的交換起中間作用。網際網路175包括大量的路由代理和處理代理(為了方便起見,在圖1中未圖示)。在圖1中,將UE N圖示為直接連接到網際網路175(亦即,與核心網路140相分離,例如經由基於WiFi或802.11的網路的乙太網路連接)。從而,網際網路175可以用於經由核心網路140,來橋接UE N和UE 1…N之間的封包交換資料通訊。
此外,在圖1中亦圖示與RAN 120相分離的存取點125。存取點125可以獨立於核心網路140來連接到網際網路175(例如,經由諸如FiOS、線纜數據機等等之類的光通訊系統)。空中介面108可以經由本端無線連接(例如,在一個實例中,IEEE 802.11)來服務UE 4或UE 5。將UE N圖示為具有到網際網路175的有線連接的桌上型電腦,例如,到數據機或路由器的直接連接,在一個實例中,該數據機或路由器可以對應於存取點125自身(例如,對於具有有線和無線連接二者的WiFi路由器而言)。
參見圖1,將應用伺服器170圖示為連接到網際網路175、核心網路140或二者。應用伺服器170可以實施成複數個結構上獨立的伺服器,或者替代地可以對應於單個伺服器。如下文所進一步詳細描述的,應用伺服器170被配置為支援UE的一或多個通訊服務(例如,網際網路協定承載語音(VoIP)通信期、一鍵通(PTT)通信期、群組通訊通信期、社交網路服務等等),其中該等UE可以經由核心網路140及/或網際網路175來連接到應用伺服器170,及/或應用伺服器170被配置為向UE提供內容(例如,網頁下載)。
圖2圖示根據本案內容的實施例的UE(例如,客戶端設備)的實例。參見圖2,將UE 200A圖示成撥叫電話,將UE 200B圖示成觸控式螢幕設備(例如,智慧型電話、平板電腦等等)。如圖2中所示,UE 200A的外殼配置有天線205A、顯示器210A、至少一個按鈕215A(例如,PTT按鈕、電源鍵、音量控制鍵等等)和小鍵盤220A等其他部件,如本領域所已知的。此外,UE 200B的外殼配置有觸控式螢幕顯示器205B、周邊按鈕210B、215B、220B和225B(例如,功率控制按鈕、音量或振動控制按鈕、飛行模式切換按鈕等等)和至少一個前面板按鈕230B(例如,主頁按鈕等等)等其他部件,如本領域所已知的。儘管沒有明確地圖示成UE 200B的一部分,但UE 200B可以包括一個或多個外置天線及/或內置在UE 200B的外殼中的一個或多個整合天線,其包括但不限於:WiFi天線、蜂巢天線、衛星定位系統(SPS)天線(例如,全球定位系統(GPS)天線)等等。
儘管可以使用不同的硬體配置來體現諸如UE 200A和200B之類的UE的內部部件,但如圖2中的平臺202,圖示用於內部硬體部件的基本高層UE配置。平臺202可以接收和執行軟體應用、從RAN 120發送的資料及/或命令,其中該等資料及/或命令可能最終來自於核心網路140、網際網路175及/或其他遠端伺服器和網路(例如,應用伺服器170、web URL等等)。此外,平臺202亦可以在無RAN互動的情況下,獨立地執行本端儲存的應用。平臺202可以包括操作性耦合到至少一個處理器208(例如,特殊應用積體電路(ASIC)、微處理器、邏輯電路或其他資料處理設備)的收發機206。處理器208執行與UE 200A和UE 200B的記憶體212中的任何常駐程式進行介面連接的應用程式介面(API)210層。記憶體212可以包括唯讀記憶體或隨機存取記憶體(RAM和ROM)、EEPROM、快閃記憶卡,或者電腦平臺共用的任何記憶體。此外,平臺202亦可以包括本端資料庫214,後者可以儲存在記憶體212中沒有被活躍地使用的應用,以及其他資料。通常,本端資料庫214是快閃記憶體單元,但其亦可以是如本領域已知的任何次級儲存設備,例如,磁性媒體、EEPROM、光學媒體、磁帶、軟碟或硬碟等等。此外,平臺202亦可以包括語音轉文字模組216,以便將UE 200A和UE 200B的使用者的語音資料轉換成文字。語音轉文字模組216可以是耦合到或者併入到處理器208的硬體部件、儲存在記憶體212中並可由處理器208執行的軟體模組,或者硬體和軟體的組合(例如,韌體)。
因此,本案內容的實施例可以包括具有執行本文所描述的功能的能力的UE(例如,UE 200A、UE 200B等等)。如本領域一般技藝人士所應當理解的,可以利用用於實現本文所揭示的功能的分離元件、在處理器上執行的軟體模組或者軟體和硬體的任意組合來體現各種邏輯元件。例如,可以對處理器208、記憶體212、API 210和本端資料庫214統統進行協調地使用,以載入、儲存和執行本文所揭示的各種功能,因此,用於執行該等功能的邏輯單元可以分佈在各個元件上。替代地,可以將功能合併到一個分離部件中。因此,圖2中的UE 200A和UE 200B的特徵只應被視作為是示例性,而本案內容並不限於所圖示的特徵或佈置。
UE 200A及/或UE 200B和RAN 120之間的無線通訊可以是基於不同的技術的,諸如CDMA、W-CDMA、分時多工存取(TDMA)、分頻多工存取(FDMA)、正交分頻多工(OFDM)、GSM或者可以在無線通訊網路或資料通訊網路中使用的其他協定。如前文所論述和本領域所已知的,可以使用各種各樣的網路和配置,從RAN 120向UE 200A和UE 200B發送語音傳輸及/或資料。因此,本文所提供的說明並不意欲限制本案內容的實施例,其僅僅用於説明描述本案內容的實施例的態樣。
圖3圖示包括用於執行功能的結構部件的通訊設備300。通訊設備300可以對應於上面所陳述的通訊設備中的任何一個,其包括但不限於:UE 200A或者UE 200B、RAN 120的任何部件、核心網路140的任何部件、與核心網路140及/或網際網路175相耦合的任何部件(例如,應用伺服器170)等等。因此,通訊設備300可以對應於被配置為經由圖1的無線通訊系統100,與一或多個其他實體進行通訊(或者有助於與之通訊)的任何電子設備。
參見圖3,通訊設備300包括被配置為接收及/或發送資訊的收發機電路305。舉一個例子,若通訊設備300對應於無線通訊設備(例如,UE 200A及/或UE 200B、RAN 120、存取點125等等),則被配置為接收及/或發送資訊的收發機電路305可以包括無線通訊介面(例如,2G、CDMA、W-CDMA、3G、4G、LTE、藍芽、Wi-Fi、Wi-Fi直接型、LTE直接型等等),諸如無線收發機和相關聯的硬體(例如,RF天線、MODEM、調制器及/或解調器等等)。再舉一個例子,被配置為接收及/或發送資訊的收發機電路305可以對應於有線通訊介面(例如,經由其能夠存取網際網路175的串列連接、USB或火線連接、乙太網路連接等等)。因此,若通訊設備300對應於某種類型的基於網路的伺服器(例如,應用伺服器170)或者核心網路140的部件,則舉例而言,被配置為接收及/或發送資訊的收發機電路305可以對應於經由乙太網路協定,將基於網路的伺服器連接到其他通訊實體的乙太網路卡。在另外的實例中,被配置為接收及/或發送資訊的收發機電路305可以包括感測或者量測硬體(例如,加速計、溫度感測器、光感測器、用於監測本端RF信號的天線等等),其中通訊設備300可以據此來監測其本端環境。此外,被配置為接收及/或發送資訊的收發機電路305亦可以包括軟體,當該軟體被執行時,准許被配置為接收及/或發送資訊的收發機電路305的相關聯硬體來執行其接收及/或發送功能。但是,被配置為接收及/或發送資訊的收發機電路305並不單單地與軟體相對應,被配置為接收及/或發送資訊的收發機電路305至少部分地依賴於結構硬體來實現其功能。
參見圖3,通訊設備300亦包括被配置為處理資訊的至少一個處理器310。可以由被配置為處理資訊的至少一個處理器310執行的處理的類型的示例性實施方式,包括但不限於:執行決定、建立連接、在不同的資訊選項之間進行選擇、執行與資料有關的評估、與耦合到通訊設備300的感測器進行互動以執行量測操作、將資訊從一種格式轉換成另一種格式(例如,在不同的協定之間進行轉換,諸如從.wmv轉換成.avi等)等等。例如,被配置為處理資訊的至少一個處理器310可以包括:被設計用於執行本文所描述的功能的通用處理器、DSP、ASIC、現場可程式設計閘陣列(FPGA)或者其他可程式設計邏輯設備、分離閘或電晶體邏輯、分離硬體部件,或者其任意組合。通用處理器可以是微處理器,或者,被配置為處理資訊的至少一個處理器310可以是任何一般的處理器、控制器、微控制器或者狀態機。此外,亦可以將處理器實施成計算設備的組合(例如,DSP和微處理器的組合、複數個微處理器、結合DSP核心的一或多個微處理器,或者任何其他此種結構)。此外,被配置為處理資訊的至少一個處理器310亦可以包括軟體,當該軟體被執行時,准許被配置為處理資訊的至少一個處理器310的相關聯硬體來執行其處理功能。但是,被配置為處理資訊的至少一個處理器310並不單單地與軟體相對應,被配置為處理資訊的至少一個處理器310至少部分地依賴於結構硬體來實現其功能。
參見圖3,通訊設備300亦可以包括被配置為儲存資訊的記憶體315。舉例而言,被配置為儲存資訊的記憶體315可以至少包括非暫時性記憶體和相關聯的硬體(例如,記憶體控制器等等)。例如,被配置為儲存資訊的記憶體315中包括的非暫時性記憶體,可以對應於RAM、快閃記憶體、唯讀記憶體(ROM)、可抹除可程式設計ROM(EPROM)、電子可抹除可程式設計ROM(EEPROM)、暫存器、硬碟、可移除磁碟、CD-ROM或者本領域已知的任何其他形式的儲存媒體。被配置為儲存資訊的記憶體315亦可以包括軟體,當該軟體被執行時,准許被配置為儲存資訊的記憶體315的相關聯硬體來執行其儲存功能。但是,被配置為儲存資訊的記憶體315並不單單地與軟體相對應,被配置為儲存資訊的記憶體315至少部分地依賴於結構硬體來實現其功能。
參見圖3,通訊設備300亦可選地包括被配置為呈現資訊的使用者介面輸出電路320。舉例而言,被配置為呈現資訊的使用者介面輸出電路320可以至少包括輸出設備和相關聯的硬體。例如,輸出設備可以包括視訊輸出設備(例如,顯示螢幕、諸如USB、HDMI等等之類的能夠攜帶視訊資訊的埠)、音訊輸出設備(例如,揚聲器、諸如麥克風插孔、USB、HDMI等等之類的能夠攜帶音訊資訊的埠)、振動設備及/或藉由其能夠對資訊進行格式化以進行輸出或藉由其資訊能夠實際上由通訊設備300的使用者或操作者來進行輸出的任何其他設備。例如,若通訊設備300對應於如圖2中所圖示的UE 200A及/或UE 200B,則被配置為呈現資訊的使用者介面輸出電路320可以包括顯示器210A及/或觸控式螢幕顯示器205B。在另外的例子中,對於某些通訊設備而言,可以省略被配置為呈現資訊的使用者介面輸出電路320,例如,不具有本端使用者的網路通訊設備(例如,網路交換機或路由器、遠端伺服器等等)。此外,被配置為呈現資訊的使用者介面輸出電路320亦可以包括軟體,當該軟體被執行時,准許被配置為呈現資訊的使用者介面輸出電路320的相關聯硬體來執行其呈現功能。但是,被配置為呈現資訊的使用者介面輸出電路320並不單單地與軟體相對應,被配置為呈現資訊的使用者介面輸出電路320至少部分地依賴於結構硬體來實現其功能。
參見圖3,通訊設備300亦可選地包括被配置為接收本端使用者輸入的使用者介面輸入電路325。舉例而言,被配置為接收本端使用者輸入的使用者介面輸入電路325可以至少包括使用者輸入裝置和相關聯的硬體。例如,使用者輸入设备可以包括按鈕、觸控式螢幕顯示器、鍵盤、照相機、音訊輸入设备(例如,麥克風,或諸如麥克風插孔等等之類的能夠攜帶音訊資訊的埠),及/或藉由其能夠從通訊設備300的使用者或操作者接收資訊的任何其他設備。例如,若通訊設備300對應於如圖2中所圖示的UE 200A及/或UE 200B,則被配置為接收本端使用者輸入的使用者介面輸入電路325可以包括按鈕215A和215B-230B、小鍵盤220A、觸控式螢幕顯示器205B等等。在另外的例子中,對於某些通訊設備而言,可以省略被配置為接收本端使用者輸入的使用者介面輸入電路325,例如,不具有本端使用者的網路通訊設備(例如,網路交換機或路由器、遠端伺服器等等)。此外,被配置為接收本端使用者輸入的使用者介面輸入電路325亦可以包括軟體,當該軟體被執行時,准許被配置為接收本端使用者輸入的使用者介面輸入電路325的相關聯硬體來執行其輸入接收功能。但是,被配置為接收本端使用者輸入的使用者介面輸入電路325並不單單地與軟體相對應,被配置為接收本端使用者輸入的使用者介面輸入電路325至少部分地依賴於結構硬體來實現其功能。
參見圖3,儘管在圖3中將配置的結構部件305到325圖示成經由相關聯的通訊匯流排330來彼此耦合的單獨的或者不同的區塊,但應當理解的是,相應的配置的結構部件305到325藉由其來執行其相應的功能的硬體及/或軟體可以部分地重疊。例如,用於促進配置的結構部件305到325的功能的任何軟體,可以儲存在與被配置為儲存資訊的記憶體315相關聯的非暫時性記憶體中,使得配置的結構部件305到325各自部分地基於由被配置為儲存資訊的記憶體315所儲存的軟體的操作,來執行其相應的功能(亦即,在該情況下,軟體執行)。同樣,與配置的結構部件305到325中的一個直接相關聯的硬體,可以不時地被其他配置的結構部件305到325來借用或者使用。例如,在由被配置為接收及/或發送資訊的收發機電路305進行發送之前,被配置為處理資訊的至少一個處理器310可以將資料格式化成適當的格式,使得被配置為接收及/或發送資訊的收發機電路305部分地基於與被配置為處理資訊的至少一個處理器310相關聯的結構硬體的操作,來執行其功能(亦即,在該情況下,資料的傳輸)。
因此,各個結構部件305到325意欲調用至少部分地使用結構硬體來實施的態樣,而不是意欲映射到獨立於硬體的僅僅軟體實施,及/或映射到非結構功能解釋。在瞭解了下文更詳細描述的態樣之後,結構部件305到325之間的其他互動或者協調對於本領域一般技藝人士而言將變得清楚。
存在著此種情形:其中對於處於語音通話(無論是群組撥叫,亦是僅僅兩個使用者之間的撥叫)的聽者而言能夠看到說話者正在講的話的即時的語音轉文字轉錄本將是有益的。例如,在較差的無線通訊通道狀況、壅塞的網路、高干擾等等情況下,通常會丟失(例如,IP承載語音(VoIP)撥叫中的)語音封包,故聽者變得很難理解說話者在說什麼。再舉一個例子,在不匹配的環境的情況下(例如,當說話者處於安靜環境,但聽者處於嘈雜環境時),聽者可能不能正確地感知對話。再舉一個例子,聽者可能由於說話者的口音,而感到難以理解說話者。
目前的語音轉文字系統在聽者的使用者設備處,將說話者的話語轉換成文字。相比而言,本案內容提供了在說話者的使用者設備處,產生該說話者的話語的語音轉文字轉錄本,並將其發送給聽者。此種方式提供了眾多的優點。例如,在源處從語音轉換成文字,將提供更佳的轉換準確性,此是由於說話者的使用者設備能存取到原始語音封包,而在聽者的使用者設備處,說話者的語音將具有轉碼器偽跡以及由於無線通道所增加的其他失真。再舉一個例子,說話者的使用者設備通常將利用說話者的語音來訓練,並因此,語音轉文字準確性將是更高的。當說話者具有聽者很難理解的口音時,此種方式亦將是有益的。
圖4A圖示根據本案內容的至少一個態樣的源使用者設備410(亦即,說話者)和目的使用者設備420(亦即,聽者)之間的示例性通訊的高層圖。如圖4中所示,本案內容的機制經由不同的無線電存取承載(RAB)或者通道來發送語音和文字。與相對應的語音相比,在源使用者設備410處產生的語音轉文字轉錄本被更可靠地發送。例如,可以使用諸如即時訊息傳遞應用層協定,經由資料RAB來發送該轉錄本,其中即時訊息傳遞應用層協定可以是基於通信期啟動協定(SIP)或者可擴展訊息傳遞和出席協定(XMPP)的。相比而言,語音資訊可以經由電路交換(CS)網路或者封包交換(PS)網路來發送,此可能是較不可靠的(例如,預期到語音PS連接上的更低的可靠性,此是由於端到端延遲是語音通訊中的主要關注點,而不是可靠性)。因此,即使由於較差的通訊通道狀況而丟失語音封包,轉錄本亦具有更高的機率來成功到達目的使用者設備420,其中在目的使用者設備420處,使用者可以讀取該轉錄本。
圖4B更詳細地圖示圖4A的源使用者設備410和目的使用者設備420。如圖4B中所示,源使用者設備410包括用於產生語音資料404的麥克風402、用於對語音資料404進行編碼的語音編碼器406、用於將語音資料404轉換成文字的語音轉文字模組408、以及用於對由語音轉文字模組408所產生的語音轉文字資料進行緩存的緩衝器412。數據機414從語音編碼器406接收編碼的語音資料,從緩衝器412接收語音轉文字資料,並在不同的RAB上向目的使用者設備420發送其。可以將緩衝器412實施成循環緩衝器,據此,已發送的文字被尚未發送的文字替換。應當注意,可以實施不具有緩衝器412的源使用者設備410,詞是由於一些應用層協定將緩衝器提供成重傳機制的一部分。
在目的使用者設備420處,數據機424在語音RAB上接收編碼的語音資料,在資料RAB上接收語音轉文字資料。數據機424向語音編碼器426發送編碼的語音資料來進行解碼,並由揚聲器428進行重現,以及向顯示器422發送語音轉文字資料以便向使用者進行顯示。應當理解的是,當兩個或更多使用者設備在參與語音通話時,使用者設備可以在一些時間是源使用者設備410,而在其他時間是目的使用者設備420,此取決於在該時間處使用者設備是在發送語音和語音轉文字資料,還是在接收語音和語音轉文字資料。
參見圖2,當源使用者設備410與UE 200A及/或UE 200B相對應時,數據機414可以耦合到收發機206,並且語音轉文字模組408可以與語音轉文字模組216相對應。進一步參見圖2,當目的使用者設備420與UE 200A及/或UE 200B相對應時,數據機424可以耦合到收發機206,並且顯示器422可以與顯示器210A或者觸控式螢幕顯示器205B相對應。
參見圖3,當源使用者設備410與通訊設備300相對應時,麥克風402可以與被配置為接收本端使用者輸入的使用者介面輸入電路325相對應,數據機414可以耦合到被配置為接收及/或發送資訊的收發機電路305,以及語音轉文字模組408可以是整合到或者耦合到被配置為處理資訊的至少一個處理器310的硬體部件。進一步參見圖3,當目的使用者設備420與通訊設備300相對應時,數據機424可以耦合到被配置為接收及/或發送資訊的收發機電路305,並且顯示器422可以與被配置為呈現資訊的使用者介面輸出電路320相對應。
隨著語音轉文字轉錄本被接收,目的使用者設備420可以對其進行顯示,類似於使用者在電話通話期間可以觀看的滾動字幕。為了在觀看該轉錄本時仍能夠聽取撥叫,使用者可以在顯示器422上觀看該文字,並且使用揚聲器模式或者免提設備(例如,藍芽耳機)來聽取該撥叫。替代地,使用者可以在另一個智慧設備(例如,智慧手錶)上觀看該轉錄本,同時將目的使用者設備420保持在他或者她的耳邊。
圖5圖示根據本案內容的至少一個態樣的用於在遠距通信期間發送語音對話的轉錄本的示例性流程。在502處,源使用者設備410發起與目的使用者設備420的語音通話建立程序。在504處,源使用者設備410發起與目的使用者設備420的資料通信期建立程序。應當理解的是,儘管在圖5中僅圖示一個目的使用者設備420,但可以存在一個以上的目的使用者設備(例如,在群組撥叫的情況下)。
在506處,連接語音通話,源使用者設備410的使用者可以開始講話。當使用者開始講話時,源使用者設備410(例如,語音轉文字模組408)開始對該使用者的語音的語音轉文字轉換,並將文字儲存在緩衝器412中,直到建立資料通信期或者沒能建立資料通信期為止。應當注意,若資料通信期在任何時間點發生失敗(例如,若目的使用者設備420不支援該語音轉文字顯示特徵,則可能發生此種失敗),則將停止該語音轉文字轉換。儘管在圖5中未圖示,但源使用者設備410可以自動地或者回應於來自目的使用者設備420的請求,來發送該語音轉文字轉錄本。
在508處,源使用者設備410(例如,數據機414及/或收發機206)開始向目的使用者設備420發送語音封包。
在510處,建立資料通信期。例如,可以使用任何現有的即時訊息傳遞應用層協定(如前述,其可以是基於例如SIP或XMPP)來建立該資料通信期。所使用的傳輸層協定應當確保資料封包的按序傳輸(例如,傳輸控制協定(TCP))。該資料通信期的服務品質(QoS)應當確保用於轉錄本傳輸的可容忍延遲(例如,低於給定閥值的延遲),以確保對話之間具有更少的延遲。應當注意,502和506處的語音通話建立程序和後續的語音對話將繼續,而不管504和510處的資料通信期建立是否成功。
在512處,一旦建立了該資料通信期,則此時可以將緩衝器412中的任何文字發送給目的使用者設備420。一旦接收到該文字,目的使用者設備420就可以開始顯示說話者的語音的轉錄本。在該語音通話的持續時間內,或者直到該資料通信期失敗為止,在該源使用者設備410的使用者所講的每一個詞語或者語句結束時,源使用者設備410將即時地發送後續的語音轉錄本。
目的使用者設備420可以使用隱藏式字幕方法來顯示語音轉文字轉錄本,藉由該方法,更新的轉錄本取代更舊的轉錄本。替代地,目的使用者設備420可以使用滾動方法,藉由該方法,可以將新的轉錄本增加到更舊的轉錄本的顯示上,而當在目的使用者設備420的螢幕上存在太多要觀看的文字時,顯示捲軸,以便可以將轉錄本的顯示進行滾動以顯示較早的轉錄本。此種滾動顯示方法緩解了轉錄本關於相對應的語音的變化延遲的影響。更特定地,在目的使用者設備420的使用者聽到說話者的話語時的時間,和目的使用者設備420接收並顯示說話者的話語的相對應的語音轉文字轉錄本的時間之間將存在延遲。此種滾動方法允許目的使用者設備420的使用者對說話者的語音的轉錄本進行從頭至尾地滾動。
在514處,源使用者設備410發起語音通話斷開程序。在該時間點,語音對話結束,源使用者設備410停止對該源使用者設備410的使用者的語音的語音轉文字轉換。在516處,源使用者設備410發起資料通信期終止程序。在518處,目的使用者設備420確認對該語音通話的斷開。在該時間點,目的使用者設備420可以停止顯示說話者的話語的轉錄本。在520處,目的使用者設備420對該資料通信期的終止進行確認。
應當理解的是,與源使用者設備410相對應的使用者設備可以在一些時間充當源使用者設備410,而在其他時間充當目的使用者設備420,此取決於在該時間處使用者設備是在發送語音和語音轉文字資料,還是在接收語音和語音轉文字資料。類似地,與目的使用者設備420相對應的一或多個使用者設備可以在一些時間充當源使用者設備410,而在其他時間充當目的使用者設備420,此取決於在該時間處該一或多個使用者設備是在發送語音和語音轉文字資料,還是在接收語音和語音轉文字資料。
應當理解的是,圖5中所圖示的操作並不需要按照所圖示的順序來發生。例如,可以同時地或者按相反的順序,來建立語音通話和資料通信期。類似地,可以同時地或者按相反的順序,來終止語音通話和資料通信期。
儘管在圖5中未圖示,但目的使用者設備420可以保存該語音轉文字轉錄本,以便未來參考。
圖6圖示用於在遠距通信期間發送語音對話的轉錄本的示例性流程。圖6中所圖示的流程可以由源使用者設備410來執行。源使用者設備410可以在參與同至少一個第二使用者設備(例如,目的使用者設備420)的語音通話。
在602處,在源使用者設備410中,例如,麥克風402或語音編碼器406接收來自源使用者設備410的使用者的語音資料。
在604處,在源使用者設備410中,例如,語音轉文字模組408將來自第一使用者設備的使用者的語音資料轉換成該語音資料的語音轉文字轉錄本。
在606處,在源使用者設備410中,例如,數據機414及/或收發機206在第一通道上向第二使用者設備發送該語音資料。
在608處,在源使用者設備410中,例如,數據機414及/或收發機206在第二通道上向第二使用者設備發送該語音資料的語音轉文字轉錄本。如前述,第一通道和第二通道可以是不同的通道(例如,不同的RAB)。例如,第一通道可以是語音通道,而第二通道可以是資料通道。
儘管在圖6中未圖示,但該流程亦可以包括:由源使用者設備410在第一通道上建立語音通話,以向第二使用者設備發送語音資料,例如,圖5的502和506處;在第二通道上建立資料通信期,以向第二使用者設備發送語音轉文字轉錄本,例如,圖5的504和510處。語音通話的建立獨立於資料通信期的建立。
此外,儘管在圖6中未圖示,但該流程亦可以包括:在緩衝器412中,對語音資料的語音轉文字轉錄本進行緩存,直到在第二通道上建立資料通信期為止。
在一個實施例中,儘管在圖6中未圖示,但該流程亦可以包括:從第二使用者設備接收用於向第二使用者設備發送語音資料的語音轉文字轉錄本的請求。但是,在替代的實施例中,在沒有從第二使用者設備接收到用於發送語音轉文字轉錄本的請求的情況下,源使用者設備410可以在第二通道上,向第二使用者設備發送語音資料的語音轉文字轉錄本。
另外,儘管未圖示,但圖6中的流程亦可以包括:在去往第二使用者設備的語音資料傳輸結束之前,停止去往第二使用者設備的語音資料的語音轉文字轉錄本的傳輸。第一使用者設備可以基於從第二使用者設備接收到用於停止向第二使用者設備傳輸語音資料的語音轉文字轉錄本的請求,來停止向第二使用者設備傳輸語音資料的語音轉文字轉錄本。替代地,第一使用者設備可以基於從第一使用者設備的使用者接收到用於停止向第二使用者設備傳輸語音資料的語音轉文字轉錄本的指令,來停止向第二使用者設備傳輸語音資料的語音轉文字轉錄本。
如前述,第二使用者設備可以在第二使用者設備的使用者介面上顯示語音轉文字轉錄本。隨著第二使用者設備接收語音資料,可以在第二使用者設備的使用者介面上滾動語音轉文字轉錄本。第二使用者設備的使用者介面可以被配置為:接收輸入以滾動到語音轉文字轉錄本的較早部分。
圖7圖示表示成一系列相互有關的功能模組的示例性基地台裝置700。例如,用於接收的模組702可以至少在一些態樣對應於如本文所論述的通訊設備,諸如,圖2中的收發機206、圖3中的被配置為接收及/或發送資訊的收發機電路305,及/或圖4B中的數據機414。例如,用於轉換的模組704可以至少在一些態樣對應於如本文所論述的處理系統,諸如,圖2中的處理器208、圖3中的被配置為處理資訊的至少一個處理器310,及/或圖4B中的語音轉文字模組408。例如,用於發送的模組706可以至少在一些態樣對應於如本文所論述的通訊設備,諸如,圖2中的收發機206、圖3中的被配置為接收及/或發送資訊的收發機電路305,及/或圖4B中的數據機414。例如,用於發送的模組708可以至少在一些態樣對應於如本文所論述的通訊設備,諸如,圖2中的收發機206、圖3中的被配置為接收及/或發送資訊的收發機電路305,及/或圖4B中的數據機414。
可以使用與本文教示內容相一致的各種方式來實施圖7中的模組的功能。在一些設計方案中,可以將該等模組的功能實施成一或多個電部件。在一些設計方案中,可以將該等區塊的功能實施成包括一或多個處理器部件的處理系統。在一些設計方案中,可以使用例如一或多個積體電路(例如,ASIC)的至少一部分來實施該等模組的功能。如本文所論述的,積體電路可以包括處理器、軟體、其他有關的部件或者其某種組合。因此,可以將不同的模組的功能實施成例如積體電路的不同子集,一組軟體模組的不同子集,或者其組合。此外,應當理解的是,(例如,積體電路的及/或一組軟體模組的)給定子集可以提供用於一個以上模組的功能的至少一部分。
此外,可以使用任何適當的構件,來實施由圖7所表示的部件和功能,以及本文所描述的其他部件和功能。此外,可以至少部分地使用如本文所教示的相應結構來實施該等構件。例如,上面結合圖7的「用於…的模組」部件所描述的部件,亦可以對應於類似指定的「用於…的構件」功能。因此,在一些態樣,可以使用以下各項中的一項或多項來實施該等構件中的一或多個構件:處理器部件、積體電路或者如本文所教示的其他適當結構。
本領域一般技藝人士應當理解,可以使用多種不同的技術和方法中的任意一種來表示資訊和信號。例如,在貫穿上面的描述中提及的資料、指令、命令、資訊、信號、位元、符號和晶片可以用電壓、電流、電磁波、磁場或磁粒子、光場或光粒子或者其任意組合來表示。
此外,本領域一般技藝人士亦應當明白,結合本文所揭示的實施例描述的各種示例性邏輯區塊、模組、電路和演算法步驟可以實施成電子硬體、電腦軟體或二者的組合。為了清楚地闡釋硬體和軟體之間的此種可交換性,上面已經圍繞各種示例性部件、方塊、模組、電路和步驟的功能對其進行了整體描述。至於此種功能是實施成硬體還是實施成軟體,取決於特定的應用和施加在整個系統上的設計約束。本領域技藝人士可以針對每個特定應用,以變通的方式實施所描述的功能,但是,此種實施決策不應被解釋為使得背離本案內容的範疇。
可以用被設計用於執行本文所述功能的通用處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、現場可程式設計閘陣列(FPGA)或其他可程式設計邏輯設備、個別閘門或者電晶體邏輯、個別硬體部件或者其任意組合,來實施或執行結合本文所揭示的實施例描述的各種示例性邏輯區塊、模組和電路。通用處理器可以是微處理器,或者,該處理器亦可以是任何一般的處理器、控制器、微控制器或者狀態機。處理器亦可以實施為計算設備的組合,例如,DSP和微處理器的組合、多個微處理器、結合DSP核心的一或多個微處理器,或者任何其他此種結構。
結合本文所揭示的實施例描述的方法、序列及/或演算法可直接體現為硬體、由處理器執行的軟體模組或二者的組合。軟體模組可以位於RAM記憶體、快閃記憶體、ROM記憶體、EPROM記憶體、EEPROM記憶體、暫存器、硬碟、可移除磁碟、CD-ROM或者本領域已知的任何其他形式的儲存媒體中。將示例性儲存媒體耦合到處理器,使得該處理器能夠從該儲存媒體讀取資訊,並且可向該儲存媒體寫入資訊。或者,該儲存媒體亦可以是處理器的組成部分。處理器和儲存媒體可以位於ASIC中。該ASIC可以位於使用者終端(例如,UE)中。在替代方案中,處理器和儲存媒體可以作為個別部件存在於使用者終端中。
在一或多個示例性實施例中,本文所述功能可以用硬體、軟體、韌體或者其任意組合的方式來實施。若用軟體的方式來實施,則可以將該等功能儲存在電腦可讀取媒體上或者作為電腦可讀取媒體上的一或多個指令或代碼進行傳輸。電腦可讀取媒體包括電腦儲存媒體和通訊媒體二者,其中通訊媒體包括便於從一個地方向另一個地方傳送電腦程式的任何媒體。儲存媒體可以是電腦能夠存取的任何可用媒體。舉例而言,但並非做出限制,此種電腦可讀取媒體可以包括RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存設備,或者能夠用於攜帶或儲存具有指令或資料結構形式的期望的程式碼並能夠由電腦進行存取的任何其他媒體。此外,可以將任何連接適當地稱作電腦可讀取媒體。舉例而言,若軟體是使用同軸線纜、光纖線纜、雙絞線、數位用戶線(DSL)或者諸如紅外線、無線電和微波之類的無線技術,從網站、伺服器或其他遠端源傳輸的,則該同軸線纜、光纖線纜、雙絞線、DSL或者諸如紅外線、無線電和微波之類的無線技術包括在該媒體的定義中。如本文所使用的,磁碟和光碟包括壓縮光碟(CD)、雷射光碟、光碟、數位多功能光碟(DVD)、軟碟和藍光光碟,其中磁碟通常磁性地再現資料,而光碟則用鐳射來光學地再現資料。上述的組合亦應當包括在電腦可讀取媒體的範疇之內。
儘管上文圖示本案內容的示例性實施例,但應當注意的是,在不脫離如所附申請專利範圍所規定的本案內容的範疇的基礎上,可以對本文做出各種改變和修改。不需要以任何特定的順序來執行根據本文所描述的揭示內容的實施例的方法請求項的功能、步驟及/或動作。此外,儘管可能用單數的形式描述或主張了本案內容的組成要素,但除非明確說明限於單數,否則複數形式是可以預期的。
100‧‧‧無線通訊系統
104‧‧‧空中介面
106‧‧‧空中介面
108‧‧‧空中介面
120‧‧‧RAN
125‧‧‧存取點
140‧‧‧核心網路
170‧‧‧應用伺服器
175‧‧‧網際網路
200A‧‧‧UE
200B‧‧‧UE
202‧‧‧平臺
205A‧‧‧天線
205B‧‧‧觸控式螢幕顯示器
206‧‧‧收發機
208‧‧‧處理器
210‧‧‧應用程式介面(API)
210A‧‧‧顯示器
210B‧‧‧周邊按鈕
212‧‧‧記憶體
214‧‧‧本端資料庫
215A‧‧‧按鈕
215B‧‧‧按鈕
216‧‧‧語音轉文字模組
220A‧‧‧小鍵盤
220B‧‧‧周邊按鈕
225B‧‧‧周邊按鈕
230B‧‧‧前面板按鈕
300‧‧‧通訊設備
305‧‧‧收發機電路
310‧‧‧處理器
315‧‧‧記憶體
320‧‧‧使用者介面輸出電路
325‧‧‧使用者介面輸入電路
330‧‧‧通訊匯流排
402‧‧‧麥克風
404‧‧‧語音資料
406‧‧‧語音編碼器
408‧‧‧語音轉文字模組
410‧‧‧源使用者設備
412‧‧‧緩衝器
414‧‧‧數據機
420‧‧‧使用者設備
422‧‧‧顯示器
424‧‧‧數據機
426‧‧‧語音編碼器
428‧‧‧揚聲器
502‧‧‧步驟
504‧‧‧步驟
506‧‧‧步驟
508‧‧‧步驟
510‧‧‧步驟
512‧‧‧步驟
514‧‧‧步驟
516‧‧‧步驟
518‧‧‧步驟
520‧‧‧步驟
602‧‧‧步驟
604‧‧‧步驟
606‧‧‧步驟
608‧‧‧步驟
700‧‧‧基地台裝置
702‧‧‧模組
704‧‧‧模組
706‧‧‧模組
708‧‧‧模組
104‧‧‧空中介面
106‧‧‧空中介面
108‧‧‧空中介面
120‧‧‧RAN
125‧‧‧存取點
140‧‧‧核心網路
170‧‧‧應用伺服器
175‧‧‧網際網路
200A‧‧‧UE
200B‧‧‧UE
202‧‧‧平臺
205A‧‧‧天線
205B‧‧‧觸控式螢幕顯示器
206‧‧‧收發機
208‧‧‧處理器
210‧‧‧應用程式介面(API)
210A‧‧‧顯示器
210B‧‧‧周邊按鈕
212‧‧‧記憶體
214‧‧‧本端資料庫
215A‧‧‧按鈕
215B‧‧‧按鈕
216‧‧‧語音轉文字模組
220A‧‧‧小鍵盤
220B‧‧‧周邊按鈕
225B‧‧‧周邊按鈕
230B‧‧‧前面板按鈕
300‧‧‧通訊設備
305‧‧‧收發機電路
310‧‧‧處理器
315‧‧‧記憶體
320‧‧‧使用者介面輸出電路
325‧‧‧使用者介面輸入電路
330‧‧‧通訊匯流排
402‧‧‧麥克風
404‧‧‧語音資料
406‧‧‧語音編碼器
408‧‧‧語音轉文字模組
410‧‧‧源使用者設備
412‧‧‧緩衝器
414‧‧‧數據機
420‧‧‧使用者設備
422‧‧‧顯示器
424‧‧‧數據機
426‧‧‧語音編碼器
428‧‧‧揚聲器
502‧‧‧步驟
504‧‧‧步驟
506‧‧‧步驟
508‧‧‧步驟
510‧‧‧步驟
512‧‧‧步驟
514‧‧‧步驟
516‧‧‧步驟
518‧‧‧步驟
520‧‧‧步驟
602‧‧‧步驟
604‧‧‧步驟
606‧‧‧步驟
608‧‧‧步驟
700‧‧‧基地台裝置
702‧‧‧模組
704‧‧‧模組
706‧‧‧模組
708‧‧‧模組
由於當結合附圖來考慮對下文的具體實施方式的引用時,能更好地理解本案內容的實施例,因此將容易獲得該等實施例的更完整理解以及其多個附帶優點,呈現該等附圖只是用於對本案內容進行說明而不是限制,並且其中:
圖1圖示根據本案內容的一個實施例的無線通訊系統的高層系統架構。
圖2圖示根據本案內容的實施例的使用者設備(UE)的實例。
圖3圖示包括用於執行本文所揭示的功能的結構部件的通訊設備。
圖4A圖示根據本案內容的至少一個態樣的源使用者設備和目的使用者設備之間的示例性通訊的高層圖。
圖4B更詳細地圖示圖4A的源使用者設備和目的使用者設備。
圖5圖示根據本案內容的至少一個態樣的用於在遠距通信期間發送語音對話的轉錄本的示例性流程。
圖6圖示用於在遠距通信期間發送語音對話的轉錄本的示例性流程。
圖7是被配置為支援如本文所教示的通訊的裝置的若干示例性態樣的簡化方塊圖。
國內寄存資訊 (請依寄存機構、日期、號碼順序註記) 無
國外寄存資訊 (請依寄存國家、機構、日期、號碼順序註記) 無
(請換頁單獨記載) 無
602‧‧‧步驟
604‧‧‧步驟
606‧‧‧步驟
608‧‧‧步驟
Claims (30)
- 一種用於在遠距通信期間發送一語音對話的一轉錄本的方法,包括以下步驟: 在參與同至少一第二使用者設備的一語音通話的一第一使用者設備處,接收來自該第一使用者設備的一使用者的語音資料; 由該第一使用者設備,將來自該第一使用者設備的該使用者的該語音資料轉換成該語音資料的一語音轉文字轉錄本; 由該第一使用者設備,在一第一通道上向該第二使用者設備發送該語音資料;及 由該第一使用者設備,在一第二通道上向該第二使用者設備發送該語音資料的該語音轉文字轉錄本。
- 如請求項1所述之方法,其中該第一通道和該第二通道是不同的通道。
- 如請求項1所述之方法,其中該第一通道包括一語音通道,並且該第二通道包括一資料通道。
- 如請求項1所述之方法,亦包括以下步驟: 在該第一通道上建立一語音通話,以用於向該第二使用者設備發送該語音資料;及 在該第二通道上建立一資料通信期,以用於向該第二使用者設備發送該語音轉文字轉錄本。
- 如請求項4所述之方法,亦包括以下步驟: 在該第一使用者設備處,對該語音資料的該語音轉文字轉錄本進行緩存,直到在該第二通道上建立了該資料通信期為止。
- 如請求項4所述之方法,其中該資料通信期使用一即時訊息傳遞應用層協定。
- 如請求項4所述之方法,其中對該語音通話的該建立獨立於對該資料通信期的該建立。
- 如請求項4所述之方法,其中該資料通信期的一服務品質(QoS)為轉錄本傳輸提供可容忍延遲。
- 如請求項1所述之方法,亦包括以下步驟: 從該第二使用者設備接收用於向該第二使用者設備發送該語音資料的該語音轉文字轉錄本的一請求。
- 如請求項1所述之方法,其中在沒有從該第二使用者設備接收到用於發送該語音轉文字轉錄本的一請求的情況下,該第一使用者設備在該第二通道上,向該第二使用者設備發送該語音資料的該語音轉文字轉錄本。
- 如請求項1所述之方法,亦包括以下步驟: 在去往該第二使用者設備的對該語音資料的傳輸結束之前,停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的傳輸。
- 如請求項11所述之方法,其中該第一使用者設備基於從該第二使用者設備接收到用於停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的傳輸的一請求,停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的該傳輸。
- 如請求項11所述之方法,其中該第一使用者設備基於從該第一使用者設備的一使用者接收到用於停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的傳輸的一指令,停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的該傳輸。
- 如請求項1所述之方法,其中該語音轉文字轉錄本是在該第二使用者設備的一使用者介面上被顯示的。
- 如請求項14所述之方法,其中隨著該第二使用者設備接收該語音資料,在該第二使用者設備的該使用者介面上滾動該語音轉文字轉錄本。
- 如請求項15所述之方法,其中該第二使用者設備的該使用者介面被配置為:接收輸入以滾動到該語音轉文字轉錄本的一較早部分。
- 一種用於在遠距通信期間發送一語音對話的一轉錄本的裝置,包括: 一第一使用者設備的至少一個收發機,其被配置為接收來自該第一使用者設備的一使用者的語音資料,該第一使用者設備參與同至少一第二使用者設備的一語音通話;及 該第一使用者設備的至少一個處理器,其被配置為將來自該第一使用者設備的該使用者的該語音資料轉換成該語音資料的一語音轉文字轉錄本, 其中該至少一個收發機亦被配置為:在一第一通道上向該第二使用者設備發送該語音資料,並且在一第二通道上向該第二使用者設備發送該語音資料的該語音轉文字轉錄本。
- 如請求項17所述之裝置,其中該第一通道包括一語音通道,並且該第二通道包括一資料通道。
- 如請求項17所述之裝置,其中該至少一個收發機亦被配置為: 在該第一通道上建立一語音通話,以用於向該第二使用者設備發送該語音資料;及 在該第二通道上建立一資料通信期,以用於向該第二使用者設備發送該語音轉文字轉錄本。
- 如請求項19所述之裝置,其中該資料通信期使用即時訊息傳遞應用層協定。
- 如請求項19所述之裝置,其中對該語音通話的建立獨立於對該資料通信期的建立。
- 如請求項17所述之裝置,其中該至少一個收發機亦被配置為:從該第二使用者設備接收用於向該第二使用者設備發送該語音資料的該語音轉文字轉錄本的一請求。
- 如請求項17所述之裝置,其中該至少一個收發機在沒有從該第二使用者設備接收到用於發送該語音轉文字轉錄本的一請求的情況下,在該第二通道上,向該第二使用者設備發送該語音資料的該語音轉文字轉錄本。
- 如請求項17所述之裝置,其中該至少一個收發機亦被配置為:在去往該第二使用者設備的對該語音資料的傳輸結束之前,停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的傳輸。
- 如請求項24所述之裝置,其中該至少一個收發機基於從該第二使用者設備接收到用於停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的傳輸的一請求,停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的該傳輸。
- 如請求項24所述之裝置,其中該至少一個收發機基於從該第一使用者設備的使用者接收到用於停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的傳輸的一指令,停止去往該第二使用者設備的對該語音資料的該語音轉文字轉錄本的該傳輸。
- 如請求項17所述之裝置,其中該語音轉文字轉錄本是在該第二使用者設備的一使用者介面上被顯示的。
- 如請求項27所述之裝置,其中隨著該第二使用者設備接收該語音資料,在該第二使用者設備的該使用者介面上滾動該語音轉文字轉錄本。
- 一種用於在遠距通信期間發送一語音對話的一轉錄本的裝置,包括: 用於在參與同至少一第二使用者設備的一語音通話的一第一使用者設備處,接收來自該第一使用者設備的一使用者的語音資料的構件; 用於由該第一使用者設備,將來自該第一使用者設備的該使用者的該語音資料轉換成該語音資料的一語音轉文字轉錄本的構件; 用於由該第一使用者設備,在一第一通道上向該第二使用者設備發送該語音資料的構件;及 用於由該第一使用者設備,在一第二通道上向該第二使用者設備發送該語音資料的該語音轉文字轉錄本的構件。
- 一種用於在遠距通信期間發送一語音對話的一轉錄本的非暫時性電腦可讀取媒體,包括: 用於在參與同至少一第二使用者設備的一語音通話的一第一使用者設備處,接收來自該第一使用者設備的一使用者的語音資料的至少一條指令; 用於由該第一使用者設備,將來自該第一使用者設備的該使用者的該語音資料轉換成該語音資料的一語音轉文字轉錄本的至少一條指令; 用於由該第一使用者設備,在一第一通道上向該第二使用者設備發送該語音資料的至少一條指令;及 用於由該第一使用者設備,在一第二通道上向該第二使用者設備發送該語音資料的該語音轉文字轉錄本的至少一條指令。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/975,144 US20170178630A1 (en) | 2015-12-18 | 2015-12-18 | Sending a transcript of a voice conversation during telecommunication |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201724879A true TW201724879A (zh) | 2017-07-01 |
Family
ID=57539623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105137602A TW201724879A (zh) | 2015-12-18 | 2016-11-17 | 在遠距通信期間發送語音對話的轉錄本 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170178630A1 (zh) |
EP (1) | EP3391368A1 (zh) |
CN (1) | CN108369807A (zh) |
TW (1) | TW201724879A (zh) |
WO (1) | WO2017105751A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9497315B1 (en) | 2016-07-27 | 2016-11-15 | Captioncall, Llc | Transcribing audio communication sessions |
US10468028B2 (en) | 2016-10-12 | 2019-11-05 | Sorenson Ip Holdings, Llc | Transcription presentation of communication sessions |
FR3067547A1 (fr) * | 2017-06-19 | 2018-12-14 | Orange | Procede d'etablissement d'une communication avec un serveur interactif |
US10299084B1 (en) * | 2017-10-05 | 2019-05-21 | Sprint Spectrum L.P. | Systems and methods for providing group call service areas |
CN109218539B (zh) * | 2018-09-05 | 2021-02-23 | 国家电网公司华东分部 | 电网调度语音可视电话系统 |
CN111200827B (zh) * | 2018-11-19 | 2023-03-21 | 华硕电脑股份有限公司 | 网络系统、无线网络延伸器以及网络供应端 |
US11557296B2 (en) * | 2019-08-27 | 2023-01-17 | Sorenson Ip Holdings, Llc | Communication transfer between devices |
US11580985B2 (en) | 2020-06-19 | 2023-02-14 | Sorenson Ip Holdings, Llc | Transcription of communications |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6603835B2 (en) * | 1997-09-08 | 2003-08-05 | Ultratec, Inc. | System for text assisted telephony |
US6816468B1 (en) * | 1999-12-16 | 2004-11-09 | Nortel Networks Limited | Captioning for tele-conferences |
US6775360B2 (en) * | 2000-12-28 | 2004-08-10 | Intel Corporation | Method and system for providing textual content along with voice messages |
US7236580B1 (en) * | 2002-02-20 | 2007-06-26 | Cisco Technology, Inc. | Method and system for conducting a conference call |
US20040153504A1 (en) * | 2002-11-21 | 2004-08-05 | Norman Hutchinson | Method and system for enhancing collaboration using computers and networking |
US7133513B1 (en) * | 2004-07-21 | 2006-11-07 | Sprint Spectrum L.P. | Method and system for transcribing voice content of an on-going teleconference into human-readable notation |
US20070112571A1 (en) * | 2005-11-11 | 2007-05-17 | Murugappan Thirugnana | Speech recognition at a mobile terminal |
US20080295040A1 (en) * | 2007-05-24 | 2008-11-27 | Microsoft Corporation | Closed captions for real time communication |
US8755506B2 (en) * | 2007-06-29 | 2014-06-17 | Verizon Patent And Licensing Inc. | System and method for providing call and chat conferencing |
US8265671B2 (en) * | 2009-06-17 | 2012-09-11 | Mobile Captions Company Llc | Methods and systems for providing near real time messaging to hearing impaired user during telephone calls |
US9367876B2 (en) * | 2009-09-18 | 2016-06-14 | Salesforce.Com, Inc. | Systems and methods for multimedia multipoint real-time conferencing allowing real-time bandwidth management and prioritized media distribution |
US20110195739A1 (en) * | 2010-02-10 | 2011-08-11 | Harris Corporation | Communication device with a speech-to-text conversion function |
US20120034938A1 (en) * | 2010-08-04 | 2012-02-09 | Motorola, Inc. | Real time text messaging method and device |
US9230546B2 (en) * | 2011-11-03 | 2016-01-05 | International Business Machines Corporation | Voice content transcription during collaboration sessions |
US20140278402A1 (en) * | 2013-03-14 | 2014-09-18 | Kent S. Charugundla | Automatic Channel Selective Transcription Engine |
US9473363B2 (en) * | 2013-07-15 | 2016-10-18 | Globalfoundries Inc. | Managing quality of service for communication sessions |
-
2015
- 2015-12-18 US US14/975,144 patent/US20170178630A1/en not_active Abandoned
-
2016
- 2016-11-17 CN CN201680072725.9A patent/CN108369807A/zh active Pending
- 2016-11-17 EP EP16809593.3A patent/EP3391368A1/en not_active Withdrawn
- 2016-11-17 TW TW105137602A patent/TW201724879A/zh unknown
- 2016-11-17 WO PCT/US2016/062478 patent/WO2017105751A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP3391368A1 (en) | 2018-10-24 |
WO2017105751A1 (en) | 2017-06-22 |
US20170178630A1 (en) | 2017-06-22 |
CN108369807A (zh) | 2018-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201724879A (zh) | 在遠距通信期間發送語音對話的轉錄本 | |
US10834252B2 (en) | Transcribing audio communication sessions | |
US10771609B2 (en) | Messaging to emergency services via a mobile device in a wireless communication network | |
US10602562B2 (en) | Establishing communication sessions by downgrading | |
JP5852104B2 (ja) | 帯域内信号を使用するコーデック展開 | |
KR100927941B1 (ko) | 사용자 평면 트래픽 제공 방법, 컴퓨터 판독가능 저장 매체, 전송 장치, 통신 제공 시스템, 단말 장치 및 네트워크 제어기 장치 | |
CN111095879A (zh) | 在实时文本消息中交换非文本内容 | |
CA2883953C (en) | Methods and systems for delayed notifications in communications networks | |
EP2847987B1 (en) | Seamless in-call voice notes | |
RU2658602C2 (ru) | Поддержание аудиосвязи в перегруженном канале связи | |
JP2013522937A (ja) | WiFiハンドヘルドデバイス用の回線交換リンクを確立する方法及び装置 | |
US8941713B2 (en) | Video phone call method having function of adjusting resolution quality and video phone call apparatus supporting the same | |
US20240334520A1 (en) | Method and Apparatus for Session Management | |
US9237172B2 (en) | Application notification and service selection using in-band signals | |
WO2019045968A1 (en) | TRANSMITTING REAL-TIME TEXT BEFORE ESTABLISHING A PRIMARY COMMUNICATION SESSION | |
WO2022134023A1 (zh) | 一种通信处理方法、装置、通信设备及存储介质 | |
WO2014183499A1 (zh) | 一种实现语音通话的方法及装置 | |
CN114127735A (zh) | 通信网络中的用户设备、网络节点和方法 | |
JP6495583B2 (ja) | 音声通信端末及びコンピュータプログラム | |
EP2774450B1 (en) | Method, apparatus and computer-readable medium for exchanging control information between two mobile stations using in-band signaling | |
US8954058B2 (en) | Telephony interruption handling | |
JP2008113221A (ja) | 携帯端末、サーバ、通信システム、通信方法およびプログラム | |
JP2012175451A (ja) | 移動体通信端末、並びにその制御方法及びプログラム | |
JP2013021512A (ja) | ユーザ端末及びサーバ並びに通信方法 |