TW307090B

TW307090B -

Info

Publication number: TW307090B
Application number: TW084111895A
Authority: TW
Original assignee: At & T Corp
Priority date: 1994-11-07
Filing date: 1995-11-08
Publication date: 1997-06-01
Also published as: JPH08235384A; EP0710929A3; CA2162199A1; EP0710929A2; AU3668095A; KR960018988A; MX9504648A

Description

307030 A7 B7 經濟部中央標準局員工消費合作社印製五、發明説明（1 ) 技術領域：本案係與語音辨識及影像製作有關。發明背景：唇音讀取方法爲在時聽力受損者的一種語音溝通方法由於機器語苷辨識準確度之增加，使用視ft賫訊幫助瞭解語音通訊已大大地改進。但是對於使用語音通信了解視覺資訊方面的反向應用進步卻極其有限。尤其是應用聲訊幫忙影像之製作。希望能對任何說話者，不受限於任何字彙，而不需任何特殊之動作而可即時完成此一製造過程。發明概述在本發明中應用熟知的方法及裝置完成聲音辅助影像處理，其中聲訊依聲訊取樣率取樣；一第一速率以第一率產生以回應取樣的聲訊信號，對應於聲域取樣率的第一率 ;該第一單音咀形（viserae)使用預定的轉換準則，轉換成第二率之第二單音咀形序列，該第二率回應對應視域框率，且處理一影像以回應第二單音咀形序列。在本發明的說明例中，一人類說話者一面的影像應用三維面架模型製造，其映像一表面架构。三維面架棋型可因回應從語音信號所取出的比例轉換單音咀形序列而變形，使得視像之咀形可隨語音動作。其優點爲此一製作可即時完成，可逋用於任何說話者，且不限制字彙，說話者亦不需要任何特殊動作。本紙張·尺度逋用中國國家標準（CNS)A4規格（ 210X297公釐 (請先W讀背面之注意事項再填寫本頁) A7 B7 經濟部中央標隼局貞工消費合作社印«. 五、發明説明（2 ) 圖形簡述圖1爲本發明之音助影像處理說明例之方塊圖。麵2爲圚1之單音咀形序列產生器的細部。圖3爲圖2之單音咀形聲音特徽取出器搡作的細部圓 0 圖4爲圖2中單音咀形辨識器操作細部之簡化方塊圖 » 圖5爲面像製作之6個特點。圖6爲圖1中序列轉換操作的簡化流程圖。圖7爲本發明中加權移動平均過程之簡化方塊圓。圖8系3 D線架面部模型之例。圖9及1 0系3 D線架模型之例，’其說明本發明之原理。圖11及12爲M9及10中的3D線架影像，其中已加上表面架构。圖1 3爲併有本發明之觀點的逮程通訊系統的說明例〇圓14爲併有本發明之觀點的逮程通訊系統的說明例 0 詳細說明本發明說明一方法及裝置，可合成視像，其參數從聲訊中取出。在本發明的第一說明例中，合成說話者的製成本紙張尺度遑用中國國家橾隼（CNS)A4規格（ 210X297公釐i 5 - 1J ~裝訂 ^旅 (請先閲讀背面之注f項再填寫本頁) 307030 A7 B7 經濟部十央標隼局員工消费合作杜印製五、發明説明（3 ) 顏面影像以回應語音信號。本發明之此一說明例有多種優點，例如可快速而準確的機械製成卡通及視像遊戲。說聒者語音與卡通人物咀巴之對齊爲最大的挑戦。因爲傅統上由手工製造此人像，因此在卡通或視像製造上爲相當费時的程序。由下列說明可使上述及其他的優點益形明顢。圖1爲本發明音助影像處理器1 0 0的簡化方塊圖。因由有聲音輔助，很明顯地影像處理器可同時用音訊及視訊操作。影像處理器1 0 0包含單音咀形序列產生器 1 2 0，及單音咀形序列轉換器1 3 0 ，結构變形轉換器 1 5 0 ，及架构（texture)映成器1 6 0 ，如所示耦含 —序列裝®。下文說明道些組件之細節。爲清楚起見，以· 個別功能及操作方塊說明本發明。道些方塊的功能及操作可用共享或專用硬髖表之，其中包含（不限於可執於軟體的硬體）。例如，圖1之音助影像處理器100的功能可爲單一使用處理器所提供。須知本文中的處理器包含可執行軟髏之軟髗。如圇1所示，將聲訊输入線110上之影像處理器 1 0 0在此例中的聲訊爲一表示語音的連績波形。單音咀形序列產生器1 2 0產生一序列的單音咀形以回應聲訊信號。—單音咀形爲一序列的口部顏面移動，或回應種音節之語言基礎單元上咀形。有關於單音咀形可見於K ,W, Bergen 所著的％ S p e e c h r e ad i n g : Principleo and M e t h o d s # ，1 9 7 2年之國際敎育版。圖2爲單音咀形序列產生器1 2 0之細部，其包含單本紙張尺度適用中國困家標準（0灿）八4规格（2丨0父297公釐"）6 - IJ - 裝------訂------ (請先閲讀背面之注意1P項再填寫本頁) 經濟部中夬標準局貝工消費合作社印製 A7 _B7__五、發明説明（4 ) 音咀形語音特擞取出器2 1 0及單音咀形辨谶器2 2 0，兩者相串連。該特徽取出器210從在線11〇上連績翰入的語音信號取出聲音特徽向量序列，且在線215上取出音序列向量。單音咀形產生器2 2 0由特徼取出器 210输出的聲音特徽向量序列產生一序列單音咀形。圖3爲圓2所示特徽抽取器210之操作細節。參考圖3，對連績語音信號取樣，且在方塊3 1 0中依據下示在方塊3 1 0中預先强調： S(n) = S(n) * aS(n -1) 其中S ( η )爲取樣之語音信號，且在本例中α = 0. 95。§(η)內預先强調取樣語音信號，且在方塊 3 2 0中成爲由方塊組成之框架，在方塊3 3 0中加入一 H a m m i n g 窗口，其爲 3 Oms ec 宽，及 1 Oms ec 之偏移。此產生的特徽向量序列，以毎秒1 0 0樣本的聲域率在線3 3 5上输出。當然對於熟習此一技術者應知其他的聲域取樣率之依發明之特殊應用之需要而加以調整。在方塊3 4 0及3 5 0中相對應地執行第十階特徽向置之自叠稹（auto-correlation)及線性預測碼（"^LPC·) ceptral分析。L C P ceptral 分析見 C ·Η .L EE 等人所著的 ^ I m p r o v e d A c o u s t i c Μ o d e 1 i π g f o r S p e a k e r I η-degendent Large Vocabulary Continuous Speech Reco-g n i t i ο π ,^ ，Corapater Speech and Language » 1 0 3 頁至127頁，1992年出版。線355上LPC分析的本紙張尺度適用中國國家揉準（CNS ) A4規格（210 X 297公釐·）7 * " (請先M讀背面之注意事項再填寫本頁) 丨裝' 訂 -H" 經濟部中央棣準局貝工消費合作社印製 A7 B7 五、發明説明（5 ) 输出在方塊3 6 0中加權，而形成第一階ceptral特徴向置。在方塊3 7 0中將轉高階的ceptra丨特徽及能量（即八，△△ ceptral，△，△△能量）加到第一階cept- ral特撤向置中。然後在線3 7 5上的聲苷特徵向置序列由單音咀形辨識器2 2 0 (圚2 )所處理。參考圓4，其爲一簡化方塊圚，其說明單音咀形 2 2 0之操作。在方塊4 1 0中，單音咀形辨識器2 2 0 依據從儲存4 2 0中的單音咀形辨識例如使用已知的維持比解碼及對齊方法將聲音特徽向置序列解碼。單音咀形例如可由已知的連績密度隱藏馬可失棋型（)加以說明。在方塊410中特徽向量序列可用框架同步或不同步方式解碼。很顯然地對應極短音之單音咀形通常爲次音節位準。因此在本發明的原理中，使用精細暫時解析度以準確地從聲訊中辨識單音咀形。在本發明之此例中，如上所述，特徽取出器2 1 0 ，以每秒1 0 0樣本之聲域取樣率输出特徽向量序列。因此序列產生器210依此速率產生一單音咀形序列。此行之行家應知基本上視域之框架率只在每秒 1 5至3 0框間。爲了解決此速率之不相配，序列轉換器 1 3 0 (圚1 )將線1 2 5上的高速率聲率單音咀形序列轉換成低速率視域上單音咀形序列。序列轉換器1 2 0依據預定之準則執行此一功能，其可包含如聲域中單苷咀形之生理聲音規則，視域中單音咀形的視像知覺，及其他以知識爲基準之準則。此預定的轉換準則例如使用準則貯存本紙張尺度適用中國國家標準（CNS ) A4规格（210 X 297公釐8 - (請先閲讀背面之注f項再填寫本頁) -裝. 訂 307030 Α7 Β7 經濟部中央標準局員工消費合作社印製五、發明説明（6 ) 1 4 0加以貯存，該貯存1 4 0經線1 4 5與序列轉換器 1 3 0耦合，如圚1所示。除了速率轉換外，序列轉換器 1 2 0亦可依據預定以知識爲基準的規則執行影像平整及錯誤偵測功能。爲了回壓低速率視域單音咀形序列，序列轉換器1 3 0输出表示線1 4 7上咀形的咀形參數，其以視域框架（frame)率输出。在此例中，視框架率爲毎秒 3 0框，因此咀形參數的輸出率爲每秒3 0咀形參數序列。咀形參數存在咀形參數一覽表中，其中一例見表1 ，其中上咀形參數含六個繞著咀辱特徽點座檩，其見於圚5中。雖然本例中使用六個咀唇特徴點，但本發明之觀點中亦含其他咀唇特徴點。而且在本發明的應用中，專於此一技術者可控制繞著顏面部份的其他特徽點。例如可控制眼睛及頭部而使最後影像更自然。參6爲圖1中序列轉換器操作的簡化流程圖。在本發明中應用三個步驟完成聲域至視域之轉換包含速率轉換，加欞移動平均，及知識基礎之平整。在線610進入此一程序，此處單音咀形V i以每秒1 0 0樣本的聲域率输入。在方塊6 2 0中，框架計數器C在毎一次的單音咀形之處理中增加0. 3。在一去尾數操作之後其値爲C的視框架數f在框架6 3 0中計算。在決定方塊6 4 0中，當框架計數數f大於指數k時，產生一新框架。如果f小於k ，則現在進入的單音咀形存在緩衝器中，如方塊6 5 0所示，此時單音咀形以B j表之。須知存在緩衝器中的單音咀形之數3及4之間變更。在方塊6 6 0中指數i及加本紙浪尺度適用中國國家標準（CMS ) Μ規格（210 X 297公釐·）9 ' (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作杜印製 A7 _B7五、發明説明（7 ) 1 ，且執行方塊6 7 0。在6 7 0中，視域中的單音咀形由進入上音域單音咀形形V i決定。在方塊6 8 0中，對視域之單音咀形執行加權移動平均。圖7爲籣化的方塊圚，其說明加權移動平均過程。存在緩衢器710中的單音咀形B i使且單音咀形表，如表1加以解碼（方塊7 2 0 )。一加權加到來自方塊680的解碼咀形參數，其對應緩衝之單苷咀形，且產生新的咀形參數◊回至圖6，來自方塊6 8 0的加權移動平均咀形參數在方塊6 9 0中承受知識基礎之平整。此操作係基於人類說話者的生理特徽。例如人類音節受限於物理上的定律，因此不可能從一極端之位置移動到另一極端之位置。在一快速的說話狀況下，咀形將移到中間位置以在下一單音咀形處理之前預備下一逋移。結果知識基礎的平整操作可基於聲域中的生理音節及視域中咀形的視像知覺。另外在聲域中來自寄生產生單音咀形的不自然高頻移動可在平整操作中過濾出來。在方塊6 9 0中的知識基礎平整操作後，進行方塊6 9 5，指數k爲框架數f之函數，而指數j的起始値爲0 ，且在方塊6 9 7中i加1。然後進行方塊6 2 0 ，並重複上述步驟。優點爲咀形參數爲圖1之序列轉換器1 3 0即時產生。另外，很明顦地產生對應於語音信號的咀形並不需要聲音輔助影像處理之訓練，本發明可逋用於任何說話者，不需要特別的動作，並不受字彙限制。結构變形產生器1 5 0 (圓1 )產生信號以控制3維 (3 D)嫌框架面部模型而對線1 4 7上所接收的咀形參本紙張尺度遑用中困國家揉準（€阳）厶4現格（210乂297公羞-)1〇 - (請先閲讀背面之注意事項再填寫本頁) -裝. 訂 A7 _B7_ 五、發明説明（8 ) 經濟部中央標隼局負工消费合作社印製 (請先閱讀背面之注意事項再填寫本頁) 數產生回應。圓8爲3 D線框架面部棋型上例。其包含約 5 0 0個多邊形元件格，其中約8 0個用於咀形。可操作 3 D線框架面部棋型而經由使用傅統的變形方法控制線框架之格子點而表示面部動作。其中—方法見K. Aizawa 等人的 'Model-Based' Analysis Synthesis Image Coding (MBAS I C ) Systen for a Persons Face 〃發表於 S i g n a 1 P r o c e s s i π g : Image Communication — ^ 中第1 3 9 — 1 5 2頁，於1 9 8 9年出版。因爲格子點的運動將影響鄰近的格子點，因此不需獨立控制3 D線框架2 0 0的所有格子點。在本發明之此一例中，對應於圖 5中6個特徽點的6個格子點爲結构變形產生器1 5 0使用在線1 4 7上所接收包含在咀形參數的座標。線1 4 7 所接收咀形參數的序列因此可形容3 D線框架面部模型的咀形移動。結构變形產生器1 5 0在視域上操作，在本例中其速率爲毎秒3 0框。結果3D線框架之一序列（此時視訊系列說明含製造咀形區域的線框架影像）由結构變形產生器1 5 0沿毎秒3 0框之速在線1 5 5上输出。圊9 ，：L 0爲兩典型之例子，其說明此項製造方法。紋路映成路1 6 0在線1 5 5上接收器製作之3D線框架影像視訊序列。紋路映成器1 6 0從紋路貯存器 1 6 5中將一貯存的面部紋路投影或映像在貯存的表面紋路上以產生最後的合成製造視像。紋路映成製爲一般技術上所熟知者再此不予赘述。圖1 1 ，1 2爲圖9 ，1 0之 3 D線框架影像，其中已加入表面紋路。製作之視像在線本紙張尺度適用中il國家梯準（CNS ) A4規格（210 X 297公着-> 11 - 經濟部中央標準局員工消費合作杜印製 A7 B7五、發明説明（9 ) 1 7 0上以毎秒3 0框的速率输出。圖1 3爲速程通倌系統1 3 0 0之例，其已併入本發明之觀點。一聲訊，如一語音倌號，在線1310上输入聲音編碼器1 3 2 0。該編碼器爲一般熟知者，基本上用於數位化及/或壓縮聲訊成爲數位位元串，其在速程通訊系統中使用較少的頻寬。然後已編碼之聲訊經傳输系統 1 3 3 0傅输至逮外的聲音解碼器1 3 4 0，其爲一般热知者，且用於從壓縮的位元串中重新架构原始聲訊。聲訊解碼器在線1 3 5 0上输出重架构之原始聲訊至某些裝置 (圖中無示）如電話，語音系統等。重架构語音信號亦爲圖1所示的·聲音輔助影像處理器1 0 0所接收。聲音輔助影像處理器输出一視訊信號至某些視像顦示裝置，如監視器，視像電話等。本技術之熟習者應知聲苷輔助影像處理器部份可在逮程通訊系統1 3 0 0側執行。如單音咀形序列產生器1 2 0 (圚1 )及單音咀形序列轉換器1 3 0 ( 圖1)可位在傳输側且耦合後接收原始聲訊。然後傅送咀形參數經輸系統1 3 0 0至結构變形產生器1 5 0 (圖1 )爲紋路映像器1 6 0 (圓1 )，其可在逮程通訊系統 1 3 0之接收側。咀形參數可經分開之《路送至接收側，或應用編碼聲訊多工處理。圓1 4爲逮程通訊系統1 4 0 0之說明例，其併有本發明之觀點。本例與圖13之例相似，然而一視訊編碼器 1 4 1 0亦包含於速程通訊系統1 4 0 0的傅输側。視像編碼器1 4 1 0在線1 4 0 5上接收視像。在嫌1 4 1 0 1^---Γ----fitII (請先閩讀背面之注意事項再填寫本頁) 訂本紙張尺度遑用中國國家標率（CNS ) A4规格（2WX297公釐-)12 - 經涛部中央樣準局貝工消費合作杜印«. 307090 A7 __B7五、發明説明（1()) 的視像信猇接收視訊，其例如可爲說聒者的面部影像。視訊編碼器將視訊編碼，再經傳输系統1 4 4 0送至視訊解碼器1 4 2 0。另外解碼之視趴可在傅输件1 3 3 0中應用不同之電路傅输，或在相同電路上應用編碼聲訊多工。訊像編碼器及解碼器爲一般已知者。視像解碼器1 4 2 0 重建原始視訊且送至聲音輔助影像處理器1 0 0，使用如辨識及追蹤等已知技術，處理器1 0 0可將3D線框架面部模型移至原始面部影像，其亦用於3 D線框架面部棋型的紋路，而非使用在紋路貯存器1 6 5 (_1 )中的紋路。如上所述製成視像信號在匯流排1 3 6 0上输出至如影像監視器之裝置。聲助影像處理器1 〇_〇因此製成一對說話者顯視的影像。此一製造方法的優點爲可提供一有意義的傳输頻宽，較傅統視像m聒節省，因爲起碼上只有一視像框架醫要傅送至聲助影像處理器1 〇〇。此單一框架可送出，例如在分開電路聲訊傅输開始時，或應用聲訊多工。最好額外視訊框架可從視訊編碼器1410周期性地傳输，以更新製成影像或輔助錯誤更正。甚至應用周期性更新框架，可更節省頻宽。本發明之例子可做爲提供視訊線索的機构，可對聽障者增加對視訊的了解。當然因爲視訊可允許更人性化通訊，所以視訊之壓用更廣。亦可由額外的視訊增加說話者辨嫌，其優點爲此可應用於如信用卡授權，家庭貯物，航空及汽車訂位等。須知上列特別技術僅用於說明本發明之原理，對於精於此一技術之專門人貝可執行多種不同的修改而不偏離本 (請先閱讀背面之注意事項再填寫本頁)

T -裝· 訂本紙張尺度適用中國國家標準（CNS ) A4规格（210X297公着*) 13 - 11 A7 B7 五、發明説明（發明的精神及觀點，本發明之精神及觀點僅受限於下文之申請專利範園。 (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製本紙張尺度遥用中國國家梯準（CNS ) A4规格（210X297公釐-)14 -

Claims

補充 Α8 Β8 C8 D8 經濟部中央橾準局貝工消費合作社印製 ☆、申請專利範圍第84 1 1 1 89 5號專利申請案中文申請專利範園修正本民國8 5年1 1月修正 1. 一種方法，包含下列步驟：以聲域取樣率對聲訊取樣；產生第一單音阻形（viseme)而應用第一速率回應該取樣之聲訊信猇，該第一速率符合該聲域取樣率；將該第一單音咀形序列依據預定的轉換準則組送入第二單音咀形序列，該第二速率符合視域框架率；及執行影像處理，以對該第二單音咀形序列產生反應。 2. 如申請專利範圏第1項之方法，其中該聲域取樣率爲毎秒100個樣本。 3. 如申請專利範團第1項之方法*其中該視域取樣率從一群中選取，其爲每秒3 0框架或每秒1 5框架（ frames) β 4. 如申請專利範園第1項之方法，其中該轉換準則包含知識基準之規則。 5. 如申請專利範園第4項之方法，其中該知識基準規則包含生理音節規則。 6. 如申請專利範園第1項之方法•其中該轉換準則包含該處理影像之知覺。 7 .如申請專利範圓第1項之方法，其中該轉換包含對該第一單音咀形序列加權移動平均。 8.如申請專利範圃第1項之方法，其中該影像爲一丨m HI HI HI n 1^1 n - - - -- HI In '*· (請先w讀背面之注意事項再樓寫本頁) 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐）-1 - A8 B8 C8 D8 307090 申請專利範圍視像。 9·如申請專利範鼷第1項之方法，其中該影像包含說話者顔面區域之影# β (請先聞讀背面之注$項再填寫本頁) 10.如申請專利範園第9項之方法，其中該處理包含製作該顔面影像的咀部區域· 1 1 _如申請專利範園第9項之方法，其中該處理包含製作該顔面影像的眼睛區域》 12.如申請專利範圓第1項之方法，其中該處理包含製作該顔面影像的頭部區域· 1 3 ·如申請專利範園第1 〇項之方法，其中該項製作工作包含可控制地該三維線框架顔面模型變形，以符合該顔面影像。 1 4 _如申請專利範園第1 3項之方法，更包含將表面紋路映至三維線框架顔面模型的步鞣· 1 5 . —種方法，包含下列步JR : 在傅输系統的傅輸側對聲訊編碼；使編碼上聲訊傳過傅输系統；經濟部中央標準局員工消費合作社印製在傳輸系統的接收端對該傅输解碼聲訊解碼：以一聲域（aud i o-doma i η )取樣率對解碼聲訊取樣；產生第一單音咀形序列，以應用符合該聲訊取樣率的第一速率對該取樣聲訊編碼：依據預定的傅输準則組將該第一單音咀形序列傅送入第二單音咀形序列，該第二速率符合視域線框架：且處理影像，以回應該第二單音咀形序列· 本紙張尺度逋用中國國家標準（CNS )八4规格（210Χ297公釐> -2 - 經濟部中央橾準局負工消費合作社印製 A8 B8 C8 _ D8々、申請專利範圍 1 6 ·如申請專利範圈第1 5項之方法，更包含在該傅输系統的傅輪測對該視訊編碼之步覉· 1 7.如申請專利範國第1 6項之方法，更包含將編碼的視訊傳送過傅輸系統的步思。 1 8 .如申請專利範_第1 6項之方法，更包含將該傅输編碼視訊解碼的步驟· 1 9 ·如申請專利範圓第1 8項之方法，更包含將三維線框架模型登錄在該解碼視訊上之步驊。 2 0 .如申請專利範麵第1 9項之方法，更包含將解碼視像信號的紋路加到該三維線框架模型上· 2 1 .如申請專利範臞第1 5項之方法，其中該項轉換在傅输系統的俥输側執行。 2 2 . —種裝置，包含：以聲域取樣率對聲訊取樣的機構；產生第一單音阻形（viseme)而應用第一速率回應該取樣之聲訊信號，該第一速率符合該聲域取樣率的機構將該第一單音咀形序列依據預定的轉換準則組送入第二單音咀形序列的機構，該第二速率符合視域框架率；及執行影像處理，以對該第二單音咀形序列產生反應的機構。 2 3 ·如申請專利範園第2 2項之裝置，其中該聲域取樣率爲每秒100個樣本· 24.如申請專利範園第22項之裝置，其中該視域取樣率從一群中選取，其爲每秒3 0框架或每秒1 5框架本紙^尺度適用中國國家揉率（€阳）八4規格（2丨0\297公釐）-3- ~ 一~ (請先Η讀背面之注意事項再填寫本頁) 裝· 訂 A8 B8 C8 D8 經濟部中夬揉準局员工消費合作社印製六、申請專利範圍 (frames)。 2 5 .如申請專利範圏第2 2項之裝置，其中該轉換準則包含知謙基準之規則* 2 6 .如申請專利範國第2 5項之裝置，其中該知識基準規則包含生理音節規則· 2 7 .如申請專利範園第2 2項之裝置•其中該轉換準則包含該處理影儼之知覺。 2 8 .如申請專利範圏第2 2項之裝置，其中該轉換包含對該第一單音咀形序列加權移動平均· 2 9 .如申請專利範園第2 2項之裝置，其中該影像爲一視像。 3 0 .如申請專利範園第2 2項之裝置，其中該影像包含說話者顔面區域之影像。 3 1 .如申請專利範園第3 0項之裝置，其中該影像處理器包含製作該顔面影像的咀部區域的機構》 3 2 .如申請專利範圈第3 0項之裝置，其中該影像處理器包含製作該顔面影像的眼睛區域的機構· 3 3 .如申請專利範國第2 2項之裝置，其中該影像處理器包含製作該顔面影像的頭部區域。 34.如申請專利範園第33項之裝置，其中該影像處理器包含一結构變形產生器，以可控制地讓三維線框架顏面模型變形，且符合該顔面影像。 3 5 .如申請專利範園第3 4項之裝置，更包該影像處理器含一紋路映成器，可將表面紋路映至三維線框架顔本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐) -Δ- ~ ---^-----f —------tT------‘ (請先Η讀背面之注意事項再填寫本頁) 307090 經濟部中央揉隼局貞工消費合作社印装 A8 B8 C8 D8 六、申請專利範圍面模型上。 3 6 .—種裝置，包含： —單音咀形序列轉產生可產生第一單音咀形（viseme )而應用第一速率回應該取樣之聲訊信號，該第一速率符合該聲域取樣率； —耦合該單音咀形序列產生器的單音咀形轉換器將該第一單音咀形序列依據預定的轉換準則組送入第二單音咀形序列*該第二速率符合視域框架率：及 —耦合該單音咀形轉換器的影像處理器執行影像處理，以對該第二單音咀形序列產生反應· 37. 如申請專利範園第36項之裝置，其中該聲域取樣率爲每秒1 0 0個樣本· 38. 如申請專利範園第36項之裝置，其中該視域取樣率從一群中選取，其爲每秒3 0框架或每秒1 5框架 (frames ) * 3 9 .如申請專利範圔第3 6項之裝置，其中該轉換準則包含知識基準之規則· 4 0.如申請專利範圏第3 9項之裝置，其中該知識基準規則包含生理音節規則· 4 1 .如申請專利範圏第3 6項之裝置，其中該轉換準則包含該處理影像之知覺。 4 2 .如申請專利範園第3 6項之裝置，其中該轉換包含對該第一單音咀形序列加權移動平均。 4 3 .如申請專利範園第3 6項之裝置，其中該影像 (請先聞讀背面之注意事項再填寫本頁) 本紙張尺度適用中國釅家揉準（CNS ) A4規格（210X297公釐）經濟部中央標準局員工消費合作社印製 307090 —---—_ 六、申請專利範圍爲一視像。 44.如申請專利範園第36項之裝置，其中該影像包含說話者顔面區域之影像· 4 5，如申請專利範園第4 4項之裝置，其中該影像器包含製作該顔面影像的咀部班域的機構β 46 _如申請專利範園第4 4項之裝置，其中該影像處理器包含製作該顔面影像的眼睛區域的機構。 47.如申請專利範園第36項之裝置*其中該影像處理器包含製作該顔面影像的頭部區域· 4 8 .如申請專利範園第4 7項之裝置，其中該影像處理器包含一結构變形產生器，以可控制地讓三維線框架顔面模型變形，且符合該顏面影像。 4 9 ·如申請專利範圃第4 8項之裝置，更包該影像處理器含一紋路映成器，可將表面紋路映至三維線框架顔面模型上。 A8 B8 C8 D8 (請先聞讀背面之注$項再填寫本頁) 裝· 訂 Λ 本紙張尺度適用中國國家標準（CNS ) Λ4規格（210X297公釐〉 6