TW403892B - A method for enhancing 3-D localization of speech - Google Patents
A method for enhancing 3-D localization of speech Download PDFInfo
- Publication number
- TW403892B TW403892B TW087104113A TW87104113A TW403892B TW 403892 B TW403892 B TW 403892B TW 087104113 A TW087104113 A TW 087104113A TW 87104113 A TW87104113 A TW 87104113A TW 403892 B TW403892 B TW 403892B
- Authority
- TW
- Taiwan
- Prior art keywords
- language
- patent application
- signal
- sampling rate
- frequency
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000004807 localization Effects 0.000 title abstract description 9
- 230000002708 enhancing effect Effects 0.000 title description 3
- 238000005070 sampling Methods 0.000 claims abstract description 40
- 230000001965 increasing effect Effects 0.000 claims abstract description 22
- 230000002079 cooperative effect Effects 0.000 claims description 4
- 238000007373 indentation Methods 0.000 claims 1
- 238000009434 installation Methods 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001422033 Thestylus Species 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/043—Time compression or expansion by changing speed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Machine Translation (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Electrophonic Musical Instruments (AREA)
Description
—__五、發明説明(1 ) A7 B7 經濟部中央標準局員工消費合作社印製 .發明背景 - !· 發明領域 本發明係關於語言處理。更明.祕 处里更明確地虱,是關於一種增強 叩5二維(3-D)定乓之方法與裝置。 正常人類的語言包含寬廣範園的頻率成分 至數千赫⑽Z)之間變化。例二= ^基本上具有低頻,但是譜波則具有非常寬廣的音階。 '由於人㈣語言具有寬廣範園頻率之發現,所以某人在和 另人説居時,可以將其語言換句話説,通常可以 將與特定個人之語言加以定位。 . 爲了決定語言之或可明瞭性或訊息,聽 高頻率的語言。因此,許多通訊系統,例如,大;:更 話、影像電話與電話系統使用壓縮演算法-广而放棄在語 中發現的高頻資訊。所以,大約在4千赫的多數高頻内 被捨棄捧。當語言不需定位時,此種解答是足夠的。 疋,如果疋而要或一定要作語言定位(例如,虚擬實境) 應用時,成Λ 了失去語言中的高頻成分是不利的。這是叫 爲聽者的語言定位是需要更高頻的、語言中的高頻成分幫 助聽者智慧地感測到聲音之所在地。舉例來説,幫助聽者 決定聲音在聽者的上方或下方;或是在左方或右方;或是 在聽者的前方或後方。因此’所需的乃是一種將通訊系 中所傳送的捨棄高頻成分的語言加以轉換的方法。此種 法將允許聽者將所經過轉換的語言加以定位而且不失其· 電 言 容 但 的 因 統' 方 明 • - II 1 I—-I . —.―.-------裝 _. I (請先閲讀背面之注意事項再填^本頁) 線 4 本紙張尺度適用中國國家標準(CNS.).A4規格(210Χ297公釐) , 經濟部中央標準局黃工消費合作社印製 403892 五、發明説明(2 ) · — 瞭性。 _ 發明之概述 本發明揭露一種由電腦來完成的增強語言三維(3-D )定 位之方法。先接收0—預定速率取樣之語言訊號,接著; 決定該語言訊號之最大頻率;加大取樣速率,一低階、寬 波帶之雜訊加入該語言訊號以產生具有更高頻成分的新語 言訊號。 ' _ 圖式簡述 •本發明藉由舉例…的方式,但不限於附圖中的圖例來解 釋,其中相同代號代表類似元 圖1解釋一種可以完成本發明的典型電腦系統。 圖2爲解釋本發明具體實施例的流程圖。 圖3解釋一種可以用於本發明的一種硬體具體實施例。 一發明之詳細説兩 … 描述一種增強語言三維定位之方法與裝置。在以下的描 述中’許多特定的細節將會公開以徹底了解本發明。然 而,很顯然地;對於已熟知此項技藝之人士來説,可以不 用這些特定的細節而加以演練本發明。在其他的例子中, 著名的架構與設備將以方塊圖的形式來表示以避免對本發 明有不必要.的不了解。 本發明藉著提供語言高頻成分以增強語言之三維定位。 此方式是必須的,因爲,語言的高頻成分(例如,高於4 千赫)在傳送時經常因爲壓縮演算法而移去。結果,就失 去了可以用於空間定位線索之語言的高頻成分。因此,,聽 _5_ 尺度適用中關家標準(CNS ) A4規格(210/ 297公楚7~ '~~~-_ ^ 抑衣 訂 線 -« ^ (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 ^°^892 at ~~_______________B7 _ 五、發明説明(3 ) ' ~ — ~ ~~ 者所得到的經過壓縮與定位的語言就不能準確地感測到語 巨來源之位置。所以,本發明就藉由在加大語言取樣速率 疋後與執行定位之前,將高頻、寬波帶雜訊加入到壓縮的 语f中以改正此問題。 請參考圖1,此爲一種典型的電腦系統,藉此本發明的 —具體實施例可如圖中之1〇〇來完成。該電腦系統1〇〇包 含一匯流排或莫它通訊裝置1〇1以傳達資訊,處理機1〇2 與匯流排101連結以處理資訊。電腦系統1〇〇更包含隨機 接達1己憶(RAM)或其它動態儲存裝置104 (如圖1中之主記 憶),並連結到該匯-流排存.氛息及將由該處理機 1〇2執行之指令。主記憶亦可以儲存暫態之變數値或其它 在處理機102執行指令時之中間訊息。 電腦系統100亦包含僅讀記憶(ROM )與/或其它連結到該 匯排101之靜態儲存裝置〗06以儲存處理’機〗〇2 所需之靜 態t·訊與指令。連結到該匯流排1〇1之資料儲存裝置1〇7 儲存訊息與指令。該資料儲存裝置1〇7,例如爲磁碟或光 碟,與其相當的磁碟機可以連結到電腦系統1〇〇。網路介 面103連結到該匯流排101。操作網路介面1〇3以連結電腦 系統100至網路上的電腦系統(沒在圖中表示)。 電腦系統100亦可利用匯流排1.01與顯示裝置121連結。 該顯示裝置121,例如是陰極射線管(CRT),以顯示資訊 给電腦使用者。一字符數字輸入裝置122,包含其它字符 數字鍵,連結到該匯流排101以傳達資訊與下答指令至該 處理機102。另一種使用者輸入裝置爲游標控制123,·例 -6- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) --: (請先閲讀背面之注意事項再填寫本頁) -裝 -δ 線 4〇S892 ----—、發明説明(4 A7 B? 經濟部中央標準局員工消費合作社印製 與下或是游標方向键以傳達方向資訊 上之㈣==,1G2 ,並控制游標錢示裝置⑵ (如X)與第二接置具有2自由度與存取,第-接達 位置β 4(>Y),使得該裝[可以在平面上標示 器其它輸入裝置,如尖筆或筆可以用於與顯示 來二^腦:幕上顯示的物件可以用該尖筆或筆觸摸. .選柽。與系電躅猎由完成一觸摸感測式螢幕來感應到 牛例來説,—系統亦可缺少該鍵盤122且所有的介 面可藉由該尖筆當作是寫作儀似筆),而所寫的字元 :以利用感光字元辨識技術加以解釋。另夕卜,壓縮過的語 舌訊號亦可經由通訊通道如網際網路或區域網路的連接而 到達該電腦。 圖2解释本發明的一·個具體實施例-。在步一驟2〇〇中,從通 訊網路接收到數位語言訊號。例如,可能的數位語言訊號 爲大哥大電話、影像電話或影像電話會議。在這些系統 中’在該語s中,所發現的高頻成分(如大於4千赫).經常捨 棄掉β這是因爲在該語言中的高頻成分對於語言的了解性 疋不為要的。.尤有甚者,該語言中的高頻成分在亦被語言 的壓縮演算法給捨棄掉。 在步驟202中,分析'所接收到的語言高頻成分。在步躁 204中’由所接收到的語言訊號之取樣速率依據尼克斯特 (Nyquist)法則計算該數位訊號的最大頻率。換句話説, 該取樣速率被侃設成該傳送訊號最大頻率的兩倍。例如”, (靖先聞讀背面之注意事項再填寫本頁} -裝· -訂 .1 11 · -1 . 二·· 1-· 本紙張尺度適用中國國家標準(CNS ) Λ4規格(210X297公釐) Α7 B? 03892 五、發明説明(5 ) - 假設該數位語言訊號的取樣速率是8千赫(KHz ),則最大 頻率爲8千赫的一半’也就是4千赫。所以,該傳送訊號 的最大頻率爲4000赫。 此觀點中’該語言的高頻成分已經被拿掉(如語言的壓 縮演具法)且不可以經由空間的線索來提供方向性。更高 頻的訊息被加入到該語言中以増強三維定位。此結‘果可以 藉由將該語§以_更高.取樣速率再次取樣。步驟208中,將 該取樣速率(如8千赫)加大,通常是以初始取樣速率的2 至6倍因子。在一具體實施例中,該取樣速率可以由8千 赫提高到1 6千赫至4 8-千赫之肩—具體實施例中,該 取樣速率可以由每秒8000次提高到每秒22〇5〇次(約2 2千 赫)。取樣速率爲每秒22050次是中距離的標準取樣速率, 且類似於調頻無線電的品質。例如,在2 2千赫時,可以 不止聽到語言,亦可以聽到儀器的i質與效。所以,取 樣速率提高了;但是沒有增加其它的高頻成分。 在步驟210中,將寬波帶之高斯雜訊加入至該提高取樣 速率的數位語言訊號中。通常,該寬波帶高斯雜訊之頻率 焉所提高取樣速率之尼克斯特(Nyquist)頻率。例如,假 如該取樣速率提高至22千赫或每秒22050次,則該寬波帶 高斯雜訊之頻率爲u〇25赫或是所提高取樣速率的—半。 該高斯雜訊具有與該提高的取樣速率不同頻率的優點。該 寬波帶高斯雜訊亦具有與該提高的取樣速率成比例頻率的 優點。在一具體實施例中,所加入的寬波帶高斯雜訊頻率 可以在8千赫至24千赫之間。該寬波帶高斯雜訊的能量”通 張尺度準 KNS ) A4規格(21GX297公釐) -- ------i-----批衣------ 訂 線 r*--- (請先閲讀背面之注意事項再填寫本頁) , 經濟部中央為準局員工消費合作社印製 408892 Α7 Β7 經濟部中央標準局員工消費合作社印製 五、發明説明(6 ) - ~~-- 常只保持在低到不足以干擾該語言的了解性。紝果,所加 入的寬波帶高斯雜訊只加了約2〇到3〇分貝,較 收的 原始數位語言訊號爲低。 該寬波帶高斯雜,訊將高頻成分加入到原始數位語古訊 號。這對於増強語言之三維定位是很重要的這將經^波 态加以介紹。例如,在虛擬實境的經驗中重新產生聽者的 語言來源。在二具體實施例中,所形成的寬波帶語言可以 傳送到電腦系統的三維語言定位常式中,如步驟2^。另 、外,此時亦可以加入與該數位語言訊號相關的位置訊息。 相當於此語言訊號·的位置訊更實際的虛擬經驗。 例如,假如某人同時與五人進行多點的影像會議,其影像 在各螢幕上是可見的,那麼其語言的位置訊息與影像連結 起來而顯示在螢幕上。例如,顯示在螢幕上左方的影像正 在説話,則語言訊號聽起來就應該展是來-自-榮幕上左方。 該语—s訊號不能讓聽者覺得聽起來像是來自螢幕上的右 方。 本發明的另一應用是在三維虚擬實境螢幕上。例如,某 人處在虚擬空間或是三度空間的室内,其中某人與各人的 影像見面或説話。假如有一特定人士的三度空間影像可聽 到其正在説話,而非只是不動,那麼本發明將使該語言的 接收者能夠將此語言訊號與其三度空間影像連結起來。周 此’假如一使用者從一群説話者中走到另一群説話者中, 該使用者所接收的語言應該随著變化。 -9- (請it·閲讀背面之注意事項再填寫本頁) .裝- 訂 線 〇
I 一 A7 B7 403892 五、發明説明(7 ) " 圖3解釋本發明的一個磲體具體實施例300。數位語言凱 號301由接收機303所接收。該數位語言訊號301是由通訊 網路,如大哥大電話所傳送。人類的語言經常是先接收成 類比訊號,然後再轉換成數位訊號。該數位語言訊號3 〇1 經常在到達該接收機3〇3.之前被塾縮.或限制波帶。因此, 該數位語言訊號301的高頻成分(如大於4千赫)經常被移 去。 該接收機303亦決定該數位語言訊號的最大頻率。在該 •具體實施例中,該·接收機303依據該數位語言訊號的取樣 速率利用尼克斯特("Nyquist)-法alUJ來.決定其頻率。例如, 假如取樣速率是6千赫,那麼依據尼克斯特(NyqUist)法 則,其最大頻率是3千赫,也就是取樣速率的一半。然 後’轉換器3 0 5將最小的取樣速率加以轉換或提升到另一 _ 加大的取樣速率。在該具體實施例;,該加-大的取樣速率 可以是較大於原始取樣速率2到6倍。 然後’產生器307產生寬波幣高斯雜訊以増加該數位語 言訊號301的高頻成分。這是必須的因爲該語言的高頻成 分使传聽者可以較佳地將該數位語言予以定位。換句話 説,在二維疋位之後,該語言的高頻成分使得聽者可以決 疋該语s在其左方或右方;上方或右下方;前方或右後 方。該語言的三維定位增強聽者對於語言的能力。具有加 大取樣速率的語言訊號與寬波帶高斯雜訊在相加器3 〇 9中 相結合。然後所形成的寬波帶語言訊號在傳送到過濾衍生 單兀313之前被儲存在記憶311之中。在該具體實施,例 -10- 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公您 j ^ J 扣衣 j 訂 線 (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 403892 _- B7 A7 五、發明説明(8 中,此濾波器可以是有限脈衝響應濾波器(fir)。其具有 叮以.使用其t /慮波器的優點.。在先前的技藝中,不具有高 頻成分的數位語言訊號301經常是直接傳送到過濾衍生單 元313的。結果,邱形成的數位語言經常失去可察覺的三 維定位線索。在強烈的對比之下,本發明允許使用者増強 的二維定位能力或是語言訊號的感測力。因此,聽者將享 受語訊號更.實際的經驗^ 在以上的描述中’許多特定的細節作爲本發明的解釋 '並不是本發明的限制。很顯然地;對於已熟知此項技藝 人士來説,可以不甩這些特忠^加以演練本發明。 尤有甚者’特定的語言處理設備與演算法並沒有詳細地加 以公開以避免對本發明有不必要的不了解。因此,本發 的方法與裝置由所附的申請專利範圍加以定義。 因此’增強語言三維定位之方法碎加以福述。 但 之 明 (請先閲讀背面之注意事項再填寫本頁) .装.
•1T 經 部 中 a 標 準 員 工 消 费 合 作 社 印 製
(210X297公釐)
Claims (1)
- B8 C8 D8 ,經濟部中央標準局員工消費合作社印製 六、申請專利範圍 . ' Λ —種利用電腦完成增強語言三維定位之方法,包含: 接收以預定速率作取樣的語言訊號; 決定該語言訊號的最大頻率; 加大該語言訊I虎的取樣速率;與 在該語言訊號加入低階、寬波帶雜訊以產生具有高頻 成分的新語言訊號。, 2. 如申請專利範-圍第1項之方法,更包含: 傳送該新語言訊號的步驟。 • -· 3. 如申請專利範圍…第1項之方法,其中所加大的取樣速率 至少是最大頻率的兩倍。、-., 4·如申請專利範圍第3項之方法,其中該取樣速率以2到6 之間的範圍作爲增加的因子。、 5.如申請專利範圍.第丨項之方法,其中該低階、寬波帶雜 訊_具有爲加大的取樣速率一半的頻率。K . 6·如申請專利範圍第1項之方法,其中該低階、寬波帶雜 訊大約較該語言訊號低20至3〇分貝。、 7. 如申請專利範圍第i項之方法,其中該低階、寬波帶雜 訊具有大約8千赫至2 4千赫之間的頻率。' 8. —種電腦可讀媒介,儲存一串指令,此串指令由一處理 機執行,使得該處理機執行下列步碟: 接收數位語言訊號; 決定發生在該數位語言訊號的最大頻率; 決定該數位語言訊號的取樣速率; 加大該數位語.言.訊號的取樣速率以成爲加 八取樣速 -12- 本紙張尺度適用中國國家標準(〇呢)八4^#(210父297公釐) (請先閎讀背面之注意事項再填寫本頁) -裝 、βτ 線 A8 B8 C8 D8 403892 六、申請專利範圍 率 將寬波帶高斯雜訊加入該數位語言訊號以產生具有高 頻的寬波帶數位語言訊、號;並 傳送該寬波帶敦位語言訊,號。' 9. 如申請專利範圍第8項之電腦可讀媒介,更包含: 提供該寬波帶數位語言訊號位置訊息的步驟。、 10. 如申請專利範圍第8項之電腦可讀媒介,其中最大頻率 $約是4千赫(KHz)。、 -Π.如申請專利範圍第1 〇項之電腦可讀媒介,其中該加大 的取樣速率大約是在16與乏問% 12.如申請專利範園第8項之電腦可讀媒介,其中該寬波帶 高斯雜訊的頻率與該加大的取樣速率成正比。、 11如申請專利範圍第8項之電腦可讀媒介,其中該寬波帶 商斯雜訊的頻率大約是在8與2 4千赫之簡'、 Η.如申請專利範圍第8項之電腦可讀媒介,其中該寬波帶 南斯雜訊大約較該數位語言訊號低2〇至3〇分貝。、 15. —種增強語言三維定位之可程式化裝置,包含:、 接收語.言訊號的接收機; 與接收機連結以加大該語言訊號的取樣速率以成爲加 大的取樣速率的轉換器;、 產生寬波帶雜訊的產生器; 連結到轉換機與產生機以將寬波帶雜訊結合至具有加 大的取樣速率的語言訊號並產生寬波帶語言訊號的加 益;與、 ' -13- 本紙張尺彦用中囷固定垣痕r ΓΝίς、目故,处 — I J J ; — 裝 ^ 訂' II I I 線 (請先閔讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合t社印製 i ? r f I 8 3ο 4, 8 8 8-A1BCD 六、申請專利範圍 連結到加器以儲#該寬波帶語言訊號时記憶。、 16,如申請專利範園第15項之電腦可程式化裝置,更包 含:' 連結到記憶以將該寬波帶語言訊號加以定位的濾波 器。' . 17_如申請專利範園第15項之電腦可程式化裝置,其中該 語言訊號爲數-位化且具有大約爲4千赫的頻率q 18. 如申請專利範園第15項之電腦可程式化裝置,其中該 語s.訊號具有低泰4千赫的頻率。 19. 如申請專利範圍第〗5項之雇式化裝置,其中該 轉換機決定該語言訊號的最大頻率,然後並將該語言訊 號的取樣速率以最大頻率2至6倍的因子加以加大。、 2〇_如申請專利範圍第1 9項之電腦可程式化裝置,其中寬 波帶雜訊具有大約爲該加大的取袅速率二-半的波寬。 21·如申請專利範圍第1 5項之電腦可程式化裝置,其中寬 波帶雜訊大約較該語言訊號低2 〇至3 〇分貝。、 22.如申請專利範圍第2 1項之電腦可程式化裝置,其中寬 波帶雜訊的頻率與加大的取樣速率的頻率不同。 (請先閱讀背面之注意事項再填寫本頁) -裝- 線- 經濟部中央標準局員工消費合作社印製 14- 本紙張尺度適财關家標準(CNS ) ( 21QX297公董)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/826,016 US5864790A (en) | 1997-03-26 | 1997-03-26 | Method for enhancing 3-D localization of speech |
Publications (1)
Publication Number | Publication Date |
---|---|
TW403892B true TW403892B (en) | 2000-09-01 |
Family
ID=25245475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW087104113A TW403892B (en) | 1997-03-26 | 1998-03-19 | A method for enhancing 3-D localization of speech |
Country Status (10)
Country | Link |
---|---|
US (1) | US5864790A (zh) |
EP (1) | EP0970464B1 (zh) |
KR (1) | KR100310283B1 (zh) |
CN (1) | CN1119799C (zh) |
AT (1) | ATE250271T1 (zh) |
AU (1) | AU5734498A (zh) |
DE (1) | DE69818238T2 (zh) |
HK (1) | HK1025176A1 (zh) |
TW (1) | TW403892B (zh) |
WO (1) | WO1998043239A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000069831A (ko) * | 1997-10-31 | 2000-11-25 | 요트.게.아. 롤페즈 | 구성 신호에 대한 잡음 추가를 통한 엘피씨 원칙에 따라 인코딩된 음성의 오디오 표현을 위한 방법 및 장치 |
US7371175B2 (en) * | 2003-01-13 | 2008-05-13 | At&T Corp. | Method and system for enhanced audio communications in an interactive environment |
CN114023351B (zh) * | 2021-12-17 | 2022-07-08 | 广东讯飞启明科技发展有限公司 | 一种基于嘈杂环境的语音增强方法及系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3974336A (en) * | 1975-05-27 | 1976-08-10 | Iowa State University Research Foundation, Inc. | Speech processing system |
JPS52134303A (en) * | 1976-05-06 | 1977-11-10 | Tadamutsu Hirata | Device for processing audio pitch correcting signal |
CA1214112A (en) * | 1983-10-12 | 1986-11-18 | William A. Cole | Noise reduction system |
CA1220282A (en) * | 1985-04-03 | 1987-04-07 | Northern Telecom Limited | Transmission of wideband speech signals |
US5083310A (en) * | 1989-11-14 | 1992-01-21 | Apple Computer, Inc. | Compression and expansion technique for digital audio data |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5561736A (en) * | 1993-06-04 | 1996-10-01 | International Business Machines Corporation | Three dimensional speech synthesis |
US5487113A (en) * | 1993-11-12 | 1996-01-23 | Spheric Audio Laboratories, Inc. | Method and apparatus for generating audiospatial effects |
JPH07160299A (ja) * | 1993-12-06 | 1995-06-23 | Hitachi Denshi Ltd | 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式 |
DE4343366C2 (de) * | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
US5687243A (en) * | 1995-09-29 | 1997-11-11 | Motorola, Inc. | Noise suppression apparatus and method |
-
1997
- 1997-03-26 US US08/826,016 patent/US5864790A/en not_active Expired - Fee Related
-
1998
- 1998-01-06 AU AU57344/98A patent/AU5734498A/en not_active Abandoned
- 1998-01-06 AT AT98901213T patent/ATE250271T1/de not_active IP Right Cessation
- 1998-01-06 EP EP98901213A patent/EP0970464B1/en not_active Expired - Lifetime
- 1998-01-06 DE DE69818238T patent/DE69818238T2/de not_active Expired - Lifetime
- 1998-01-06 WO PCT/US1998/000427 patent/WO1998043239A1/en active IP Right Grant
- 1998-01-06 CN CN98803591A patent/CN1119799C/zh not_active Expired - Fee Related
- 1998-03-19 TW TW087104113A patent/TW403892B/zh not_active IP Right Cessation
-
1999
- 1999-09-22 KR KR1019997008728A patent/KR100310283B1/ko not_active IP Right Cessation
-
2000
- 2000-07-11 HK HK00104269A patent/HK1025176A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE69818238D1 (de) | 2003-10-23 |
DE69818238T2 (de) | 2004-04-08 |
CN1119799C (zh) | 2003-08-27 |
US5864790A (en) | 1999-01-26 |
AU5734498A (en) | 1998-10-20 |
EP0970464A4 (en) | 2000-12-27 |
ATE250271T1 (de) | 2003-10-15 |
EP0970464A1 (en) | 2000-01-12 |
KR100310283B1 (ko) | 2001-09-29 |
KR20010005660A (ko) | 2001-01-15 |
CN1251195A (zh) | 2000-04-19 |
WO1998043239A1 (en) | 1998-10-01 |
EP0970464B1 (en) | 2003-09-17 |
HK1025176A1 (en) | 2000-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200228913A1 (en) | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description | |
US8081762B2 (en) | Controlling the decoding of binaural audio signals | |
US8509454B2 (en) | Focusing on a portion of an audio scene for an audio signal | |
US9491561B2 (en) | Acoustic echo cancellation with internal upmixing | |
JP4921470B2 (ja) | 頭部伝達関数を表すパラメータを生成及び処理する方法及び装置 | |
KR101572894B1 (ko) | 오디오 신호의 디코딩 방법 및 장치 | |
CA3069403C (en) | Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description | |
US20070160218A1 (en) | Decoding of binaural audio signals | |
US20080008327A1 (en) | Dynamic Decoding of Binaural Audio Signals | |
CN108605193A (zh) | 声音输出设备、声音输出方法、程序和声音系统 | |
CN108989946A (zh) | 检测和减少反馈 | |
US8155358B2 (en) | Method of simultaneously establishing the call connection among multi-users using virtual sound field and computer-readable recording medium for implementing the same | |
TW403892B (en) | A method for enhancing 3-D localization of speech | |
US11937069B2 (en) | Audio system, audio reproduction apparatus, server apparatus, audio reproduction method, and audio reproduction program | |
CN114501297B (zh) | 一种音频处理方法以及电子设备 | |
CN114520950A (zh) | 音频输出方法、装置、电子设备及可读存储介质 | |
KR20080078907A (ko) | 양 귀 오디오 신호들의 복호화 제어 | |
Evans et al. | Perceived performance of loudspeaker-spatialized speech for teleconferencing | |
WO2023210699A1 (ja) | 音声生成装置、音声再生装置、音声生成方法、及び音声信号処理プログラム | |
WO2007080224A1 (en) | Decoding of binaural audio signals | |
Gerken et al. | Comparison of 2D and 3D multichannel audio rendering methods for hearing research applications using technical and perceptual measures | |
CN116830604A (zh) | 动态应用的渲染配置的渐进计算和应用 | |
CN115766950A (zh) | 语音会议创建方法、语音会议方法、装置、设备及介质 | |
JP2011086193A (ja) | 情報処理装置、処理方法、ならびに、プログラム | |
JP2007029506A (ja) | ゲーム装置、音声データの生成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |