TW201034004A

TW201034004A - Systems and methods for interactively accessing hosted services using voice communications

Info

Publication number: TW201034004A
Application number: TW099102886A
Authority: TW
Inventors: Eugeniusz Wlasiuk
Original assignee: Softhus Sp Z O O
Priority date: 2009-02-03
Filing date: 2010-02-01
Publication date: 2010-09-16
Also published as: IL214424A0; SG173511A1; WO2010089645A1; KR20110127180A; CN102369568A; RU2011136720A; JP2012517174A; US20130226579A1; US20100198595A1; EP2394267A1; US20130226575A1; US8417523B2

Description

201034004 六、發明說明：【發明所屬之技術領域】在此所揭露之實施例係大致關於互動語音回覆系統，尤其是關於可允許托管服務（例如購物、租車、飯店等）透過電話存取語音通訊之系統及方法。【先前技掏·】基於成本或效率的考量，現今的公司經常採取透過網路及電話的方式提供客戶服務。目前，使用者可經由存取裝置所提供的視覺表達能力獲得網路服務，例如可使用具有網路瀏覽器之個人電腦（PC)，其可要求並接收由網路伺服器（Web server) 所產生的超文件標記語言（HyperText Markup Language，簡稱 HTML)文件。對於電子商務之應用，網路伺服器可提供存取服務邏輯（service logic)以及交易祠服介面。交易伺服介面可處理使用者之輸入，服務邏輯可使用任意的通用網路編碼工具來進行編碼。使用者可透過存取裝置獲得電話服務，存取裝置可具有語音互動能力，例如，電話或是網路電話（voice over Internet protocol，簡稱VOIP)裝置，又稱互動語音回覆（interactive voice response，簡稱IVR)平台，其具有音訊輸入、輸出、電話功能、以及自己的服務邏輯及存取服務介面。互動語音回覆系統可自動地允許電話使用者，透過字母命令存取在系統上鏈結的伺服器。此服務邏輯通常係以通用的軟體語言並使用平台的應用程式介面（application-programming interface，簡稱 API)，或是 201034004 平台專用編石馬語言來進行編碼。由於語音辨識科技的進步，傳統亙動語音回覆系統的互動模式已可包含選單、直接對話、混合主動式對話。選單類型的互動模式通常使用預錄的聲音，即時地要求使用者在電話鍵盤上輸入一個數字或是唸出簡單的回答，例如「是」或「不是」，或是簡單的數字，從多個選擇中選取項目。對於直接對話，藉由詢問各別的問題，以要求各別的答案，系統可引導使用者完 •成資料的選擇。例如，各別的對話系統將先要求使用者回答居住的州再回答居住的城市，以得到使用者的住址混合主動式對話系統職❹者在單—次語音巾輸人多筆資料並提供部份的訊息。項以話雖然已有以上所述之科技，傳統的互動語音回覆系統仍然 =以下缺點.速度慢、非人性化、且僅能提供笨拙的平台協 4用者與纟H的互動。要透過電話巾迷宮般的選單 ^進行操絲序通常是非常料的，且直接及混合主動式對

在立、Μα的3碭直接反應之語音命令。總之，現有的互動 ^月^系統並無法允許真正地由㈣者透過互動式的方式【發明内容】系統揭露一種使用語音通訊以互動式存取托管服務之在方面，本發明係揭露一種在包含一語音辨認模級、— 201034004 時間管理模組以及一語音產生模組之一系統内，用於提供一服務給一使用者之一方法其包含經由語音辨識模組接收一談話；使用屬於一資料模型之詞典，將談話轉換為至少一結構；使用結構辨認談話内之概念；若所提供之談話包含足夠的資訊，依據概念選取一服務；依據選取的服務產生一文字訊息；且使用語音產生器將文字訊息轉換為一語音訊息。在另一方面，本發明係揭露一種用於提供一服務給一使用者之系統，其包含一語音辨識模組，其組態為接收一談話並將談話轉換為字稿；至少一個使用屬於一資料模型之詞典的結構；一時間管理模組，其耦接語音辨認模組並組態為使用屬於一資料模型之詞典產生關於字稿之一結構、使用結構辨認談話内之概念、若談話包含足夠的資訊，則依據概念選擇一服務、依據選擇的服務產生一回覆文字訊息；以及一語音產生模組，其與時間管理模組耦接並組態為將回覆文字訊息轉換為一語音訊息。其它的目的，技術特徵，及本發明之優點，如同由申請專利範圍所定義，且由以下非限制性的實施方式揭露。、【實施方式】在此係描述使用語音通訊以互動式地存取托管服務之系統及方法。然而，應了解在此所述之系統及方法可不需某些或全部的細節資訊即可執行。在其它情況下，為使本說明書更加簡潔，習知的操作程序並未詳細地描述。如同在此所示，電話通訊為廣用之儀器，例如路線電話、 3 201034004 行動電話、網路通訊裝置等等’其用於提供長距離的語音通訊。電話通訊包含傳統的類比電語系統，其透過類比訊號（即時間及強度為連續）來傳遞語音通話，或是近來發展的數位電話系統’其透過數位訊號（即不連續的二元訊號）傳遞語音通話。網路電話（Voice over Internet Protocol，簡稱 VoIP )為數位類型電話中較新發展的型式，其使用傳輸控制協定/網路協定（Transmission Control Protocol/Internet Protocol，簡稱 φ TCP/IP )以及其它的網路傳輸格式以透過網路傳遞數位化的語音資料。網路或全球資訊網（World Wide Web，簡稱WWW)為廣域網路（wide area network，簡稱WAN)，其由許多鏈結在一起的伺服器組成’並可允許資料透過網路資料傳輸協定，例如 TCP/IP、可#性使用者資料庫協定（ Reiiabie User Datagram Protoco卜簡稱RUDP)或其它等同協定，由一伺服器傳遞到另一伺服器。通常’網路可將分佈於廣大地理範圍的多個伺服器參鏈結在一起。相反地’局部區域網（local area networks，簡稱 LAN)為較小的伺服器網路，這些伺服器涵蓋較小的地區，例如住家、辦公室或是學校。如前所述’應了解互動語音回覆系統可受益於在此所述之系統及方法，可不需要透過選單驅動或事先錄好的對話，即可互動式地使用語音通訊來決定顧客所要求的服務，並將這些服務傳遞給顧客。第1圖係依據本發明某一實施例描述互動語音回覆 (interactive voice resp0nse，簡稱IVR)系統的功能方塊圖示， 4 201034004 此系統可允許使用者使用語音通訊互動地存取托管服務 (hosted services)。如同此圖所示，此系統服務操作電話裝置 102的使用者1〇1，電話裝置1〇2係組態為和人類智慧系統 (Human Understanding System) 103 通訊，人類智慧系統 103 包含各種托管服務108。為了可透過人類智慧系統1〇3被存取’各個服務108必需先在此系統内被定義。因此，系統100可組態為透過人類智慧系統1〇3處理複數 ❿個服務丨〇8，並將其提供給使用者。在範例的註冊程序中，需對各種服務提供以下的元素：可獲得服務的地理區域、以自然的浯§所提供之服務的詳細述敘、必須由使用者1〇1提供之 ^料列表以提供服務給使用者101，以及對話的文稿。在某一實施例中，各個註冊的托管服務係關於一個或多個服務提供者的群組，例如商店、租車處、旅館。應了解，只要 14些服務可由使用者1〇1透過電話裝置1〇2命令，人類生活的許多面向皆可由適當的托管服務提供服務。參在某一實施例中，電話裝置102可透過類比的路線和人類智慧系、統103 it訊鏈結，例如透過類比的實體電線連結，其組態為傳輸使用類比訊號的語音資料。在另-實施例中，電話t 置1〇2可透過數位路線和人類智慧系統103通訊鏈結，例如透 ^位光纖連結’其組態為傳輸使用不連續數位二元訊號的語在又一實施例中，話，可透過無線通訊鏈通訊鏈結組態為使用射電話裝置102，例如行動電話或衛星電結和人類智慧系統1〇3通訊鏈結，無線頻（radio frequency，簡稱 RF)或是微 5 201034004 波訊號將語音資料傳輸至人類智慧系統103。此傳輸格式可為數位或類比，無線通訊鏈結可為和人類智慧系統1〇3連接的直接鏈結，或是透過和人類智慧系統1〇3經由路線或是其它無線鏈結連接的基地台。在再一實施例中，電話裝置1〇2，即網路通訊裝置，其可透過路線、無線連結其中之一或二者與人類智慧系統103通訊鏈結，其係藉由網路連接的方式，其組態為使用網路電話（v〇ice over Internet pr〇t〇c〇1，簡稱 v〇Ip)或類同 ❹的協定，傳輸語音資料。此網路連接可被分佈為地域網路例如本地£域網路’或廣域網路例如網路（the internet)。在某一實施例中，此系統可組態為經由使用者1〇1操作，其中使用者101可操作行動電話（即，電話裝置1〇2)以將通話置入人類智慧系統103中以存取一服務，其係由人類智慧系統103所提供。行動電話1〇2係藉由射頻鏈結和行動電話提供者’即手機網路提供者通訊，手機網路提供者自已係鏈結至公共父換電話網（Public Switched Telephone Network，簡稱 φ PSTN) ’即路線，以和人類智慧系統103通訊。人類智慧系統 103可接耆藉由網路或LAN與多個區域系統（domain systems ) 通訊鏈結。在其它的情況，使用者101可操作一 VOIP啟能電腦（VOIP-enable(j computer)，即電話裝置 102，以將 VOIP 通話置入鏈結至網路的人類智慧系統i〇3。此V0Ip啟能電腦藉由廣頻網路鍵結通訊，廣頻網路鏈結係透過網路鏈結，例如網際網路、LAN等，與人類智慧系統103通訊鏈結。應了解上述的情況係僅用以作為描述之用而非作為限制系統100可用的通訊組態。目前已有多種可想到的方法可用於 6 201034004 設定使用者1〇1及人類智慧系統103之間的通訊；僅受限於所造之系統將語音資料傳輸至人類智慧系統1〇3的能力，是否足夠清楚，尤其是要可允許人類智慧系统1〇3處理並了解此資料。接續第1圖，人類智慧系、统103包含：語音辨認模組1〇4、音訊產生模組106、以及時間管理模組（⑽加⑽挪 module) U)5。語音辨認模組1()4可％態為透過電話裝置ι〇2 參自使用者ΗΠ接收談話，電話裝置1〇2可例如使用上述任一種電話通訊組態’通訊鍵結至人類智慧系統1〇3。在某些實施例中’這些談話包含關於使用者101 #資訊，例如身份資訊認證資訊以及關於應使用者101所要求存取而提供的服務。語音辨認模組可組態為將自使用者叫接收的語音資料轉換為文字資料並將此資料傳輸至時間管理模組1〇5。應了解人類智慧系統1〇3彳包含需要執行在此所述之功能的軟體或硬體元件。更應了解人類智慧系統⑽可包含其它的 φ元件及功旎，且某些的功能可被相同或不同元件執行。因此，第1圖不應被視作將在此所述之系統及方法限縮為某些結構或是組態。更是，第1圖係被提供作為範例之用。在一實施例中’語音辨認模組104係組態為辨認30種世上最常使用的語言。語音辨認模組1〇4可以辨認的語言可以是：英語、中文、印度語、西班牙語、孟加拉語、葡萄牙語、俄語、德語、日語及法語。在其它的實施例中，語音辨認模組 104係組態為僅辨識由人類智慧系統103所處理之服務所指定的語言。然而應了解，語音辨認模組丨〇4係可由系統管理者組 7 201034004 態為辨識任何的語言，只需所選語言其語言特徵有助於使此語言可經由電腦處理轉換。語音辨認模組104更可組態為將使用者101的語音，其係經由裝置102所提供，轉換為字稿。時間管理模組105可組態為操作在二個狀態下：（一）「選擇服務狀態」，在此狀態下時間管理模組105係組態為選取服務108 ;以及（二）「對話文稿狀態」，在此狀態下時間管理模組105係組態為執行適用於所選取之服務1〇6的對話文稿2〇3。時間管理模組105係裝置有用於特定自然語言的字典組，

其連接至資料模型（ontology)。此可允許其將自然談話的字稿轉換為特殊的結構’其包含文法及資料模型的資訊。資料模型的資訊可被用於決定被要求的服務1〇6，並用於「對話猄態」，例如詢問是否使用者i i事實上是使用某些概诵當時間管理模組105操作在「選擇服務狀態 ^ 為執行以下的程序：選擇特定的服務剛，其所定義之；：態型的概念為最接近客戶談話中所 ^資枓拉排除特定的服務1〇8，1所定貝·㈣概念，同時 *… 義之資料模型的概念與客戶㈣話衝犬^貝讯不足讓時間管理模組ι〇5決定，戶的談 108的身伤，時間管理模組1〇5 永之服務問使用者1G卜以取得要做出卜^為產生適•的字稿以詢組105接著送出字稿至音訊產生:斤必需的資訊。時間管理模換為談話，而談話可由音^且1G6 ’其組態為將字稿轉以讓使用*⑼聽取。K產生編旦106傳輸給電話较置^ 在某一實施例中，此来皮情況下重覆執行，直到時門^時間f理模組叱在 1時間“里模組！05接收到足夠的資^ 8 201034004 決定使用者101呈現之話音資料内所求服務108之身份。在另一實施例中，系統管理者可藉由適當的談話文稿203啟能或執行特定的服務，例如，服務對選擇服務，其中談話文稿203可詢問顧客更多的資訊並選擇特定的服務108。在某些的實施例中，對話文稿203可呼叫其它的服務。例如’對於租車應用中，依據州、城市、車型等等，可呼叫一特殊的服務，其組態為選擇適當租車公司的以完成此服務。應了解，以上所述之各種的實施例係組態為實現使用者 101與人類智慧系統103之間的高度互動對話。此目的係為近可能相似地模仿使用者101和所處理的服務1〇8之間的通訊環境，包含嘗試決定正被使用者101所要求的服務108或其它的資訊。與傳統的系統相反，其必需選取一系列的選單或必需回應一系列的資訊要求，其中，選擇及回應要求係依照固定的才^ 對線性程序，並經由事先決定的判斷樹。這些傳統的互動和二個人之間自然的對話並不相似。〜

二I二賴二任何的語言，只需所選达 6其：：=:，此1 言可經由電腦處理被轉換，旦時間管理模組1〇5已成功地辨識時間管理模組105將開始執行此服第2圖係依據一實施例為時間管理哉使用者所要求的服務務所定義的對話文稿。理模組1〇5 内部元件的詳 201034004 互動及&些7^件如何和人類智慧系統1G3内其它的模組庫綱、，務資:管=之對話文稿203、服務資料適告的詞模組1G5亦包含文件至結構模組212，其可使用业；10 :矛、次4〇將人類談話的文字轉換為特殊的結構。這些詞〇 210係和資料模型2U赫結構模組212，^制^在—起。此關連性可允許文件至人類語古的類語言’皆可將任一已定義之、昧^ ’轉換為包含文法及資料模型資訊的結構。了解特組105亦可包含特殊概念探測模組230。為了 it此概人/米測模組23G’必f要解釋這些特殊概念為何。 ==不Ϊ被了解的概念，例如名字、顏色、地址。然而， +中疋可和此概念關連的數值或級數。在所有自然語 ::二，具有一些形式，其可允許人類使用它們。因此，特殊概:的=====產生的讲 ;芒二=來念自使用者101產生資訊，一弄清求，殊話文稿203内對特殊概念的要值。在缺乏f模23G以取得與此概念關連的數 1〇1。在接收笈空/Γ ί音訊產生模組106被送至顧客客拒絕提供答V，'文稿:二2 :見是否必要而重覆執行。若顧柄丨單02將寫下此事件使文稿可作出反 201034004 應。特洙概念及其使用將在以下說明詳加描述。特洙的指令可被嵌入至對話文稿203以詢問適當的庫。其它的指令可被嵌入至和服務108相關的對話文稿貝料中’以允許結果可被顯示給顧客，使顧客可選擇特定的H〇3 更有其它的指令可被用於更新資料庫204合適的資料。 ° 對話文稿2 0 3中條件式的指令可允許其對已預測的人類反應1出回應。這些條件式的指令可包含例如若、切換、當等等 φ θ々’其可允許系統103或更明域地使對話文稿2〇3虛裡々種的幡<理各与况，例如在使用者101拒絕提供某些資訊或回答時應如何動作。 ’Μ 你田鮮話文稿203可組態為操作於訊息數字，其可取決於顧客的語言被轉換為自然語言的訊息。序，=3圖為一流程圖，其依據一實施例詳細描述一範例的程熊）/认中系統100係用於選取並提供服務108 (「選擇服務狀 =使用者10卜在步驟302中，語音辨認模組104可自使上所述!經，裝置ι〇2以及相關的通訊設備接收語音談話。如證資^，此"炎居可包含身份資訊，即姓名、數字、地址等；認即銷售/1社會安全號碼、確認數字等；關於所需服務的資訊，包含於“戶服務、保留等；僅列出此類資訊的範例，其可被 =自使用者ι〇1所接收之談話内。步驟3 04中，兮五立抛為字稿 . σ9辨識桓組可組態為翻譯或轉換此談話 i牛ii在步驟306中被送至時間管理模組奶。鏈結之字典將此字稿組Γ可接著使用和資料模型得供為、，告構。在步驟310中，時間管理模 201034004 組105可使用此結構以辨認此談話所包含的楙念’即包含在此談話内資料模型的概念。此概念可接著在步驟312内被用來辨斷正被要求的服務108。在系統103内之概念及其辨認係在以下有更加詳細之描述。當談話内未包含足夠的資訊以充份辨認一服務時’時間管理模組105可被組態為在步驟314中產生文字訊息，其設計為誘導更多資訊以允許服務108之辨認。在步驟316中，此 φ 文字訊息可使用對話文稿203被產生而被送至音訊產生模組 106，其可被組態為將文字訊息轉換為對話，其中對話將經由裝置102被傳輸給使用者1(Π。此流程將重覆地被執行直到足夠的訊息出現，以在步驟 318中選取服務。在步驟320中，一旦服務被選取後，適當的對話文稿20$可被啟動，以產生可在步驟322中被送至語音產生模組106的文字訊息，以和使用者1〇1通訊。第4圖係為一流程圖，其依據一實施例更加詳細地描述由鲁時間管理105所執行選取服務的流程圖。在步驟402中，文稿引擎202自語音辨識模組104接收字稿資訊並將此字稿送至文字至結構引擎212 ’其可被組態為在步驟4〇4中使用適當的詞典210以及相關的資料模型211將字稿轉換為結構。此結構可接著在步驟406中被服務選擇模組220使用來自服務資料庫 204選取一服務。在步驟408中’選取的服務可接著使用對話文稿203，其需用來提供適當的資訊給或索取資訊自使用者1〇丨，讓文稿引擎202產生適當的文字訊息。換言之，文稿引擎2〇2係和對話 12 201034004 文稿203配合以允許系統103在由所選之服務述敘時用自然的方式和使用者溝通。服務資料管理者205可組態為將關於各種服務的資料儲存在服務資料庫204内。另外，服務資料庫204可組態為儲存自使用者101，以及例如特殊概念處理模組230接收的資訊。因此，當訊息在步驟408中被產生時，新的資訊係被接收以在步驟410中作出回應。在步驟412中，關於在步驟41〇中所接收 ^ 的資訊或數值可被儲存於服務資料庫412。第5圖係依據一實施例為描述用於形成結構及將其鏈結至概念之範例。第5圖描述用於以下談話之程序：「我希望為我太太和她的醫生預約（“I would like to make an appointment for my wife with her doctor )」以及用波蘭語所述之 “ Chciaibym um0wi0 m〇h έοης z jej lekarzem.”。各個談話 5〇2 (英文）及 514 (波蘭文）包含複數個字彙’如同於相關的詞典對該語言所定義。通常，各種語言的詞典210内各個字彙係直接或經由 φ字根連接。因為在自然語言溝通中，有許多的同義字及表達相同概心的溝通方式’各個概念508係連接至各個詞典21 〇内複數個字彙。繼續參考第5圖，談話502及514可被轉換為單元5〇4或 512。各個單元504及512可對應談話内一個或多個字彙。例 =，單元504可對應至單一的字彙，或可具有多個次單元，使得，可對應至多個字彙，例如在第5圖範例中談話5〇2内的字群「希望」（would like to)。各個單元5〇4或次單元可接著依據相關的資料模型21丨經由鏈結5〇6及51〇鏈結至一個或多個 13 201034004 概念508。單元504及512分別與鏈結506及510的組合，形成與各種概念508相關的結構505及515。應了解，不管在指向或引導所辨認之概念的輸出談話，其内包含的詞典為何，各個概念 508將具有獨特的結構。換言之，即使談話502有些微的不同，例如「我希望為我太太和她的醫生預約（“ I would like to make an appointment for my wife with her doctor)」或「我想知道我 φ 太太的醫生是否有空（“I would like to see if my wife’ s doctor is available”）」，仍應產生相似的結構505及515以引導相同概念508的認識。因此’在系統103内定義的各個服務1〇8可具有與其相關之一組的概念508。在許多實施例中，僅有包含重要的概念以避免不必要的關連性。同時，在另一實施例中，僅溝通文法的詞典亦可被忽略。在某些狀況下，各個服務亦有排除及要求的狀況。例如，對於某些要選取的服務，某些資訊必需被示出， ❹而對於某些要選取的服務，則不能包含某些其它的資訊。概念508可接著與服務1〇8產生關連性。換言之，各個服務將具有與其產生關連性的某些概念。時間管理模組1〇5可接著決定架構’例如架構5〇5，其與一談話產生關連性，例如談后502 ’以决疋何種服務1〇8是和談話5〇2最相關，即，依據結構505和談話502最相關的服務。對於某些實施例，時間管理模組H)5亦可組態為決定各個服務1〇8是否已符合任一要求的f月况及排除的f月況’以決定何種服務1〇8係和談話最為相關。 201034004 一旦服務108被選取後，接著下一步驟可對服務使用談話文稿收集資料。如上所述，其可包含特殊的概念。又，特殊的概念係為概念系統103未嘗試了解，但又是系統103嘗試產生相關數值階級的概念。在第5圖的範例中，此概念可以是：人物’將拜訪醫生的人物；時間，為預約所指定的時間；以及醫生，所指定的醫生。首先，談話，例如談話502可被評估以決定其是否包含必 φ 需的資料。此數值或位階為所提供之資料與此資訊對應強度的指標。決定是否被包含並提供數值或位階的資料可落入特殊概念處理模組230。若顯示此談話502不包含必需的資料，文稿引擎202，在所選服務1〇8的控制下，可選取設計用來誘導資 sfl的對話文稿。在上述的範例中，因僅剩預約的時間尚未被指定’顧客將被問及此資訊（以談話文稿）。一旦產生的數值指示所有必需的資訊都已出現，則此資料可被儲存並用於執行預約。對話文稿2〇4可接著被用於產生確 φ 認預約的訊息，其可向使用者敘述。又，對話文稿203可使用語言以自然的方式產生及回應所接收的談話。因此，當可以馬上被提供所需的資訊時，使用者 101可覺得自已是進行一般的對話。在此所述之系統及方法所有的部份亦可以電腦可讀取編碼的方式實施於一電腦可讀媒體上。此電腦可讀媒體可為任何可儲存資料的資料儲存裝置，且此資料可接著被一電腦系統讀取。電腦可讀媒體的範例可包含硬碟、附網存儲設備（netw〇rk attached storage ’簡稱NAS)、唯讀記憶體、隨機存取記憶體、 201034004 CD-ROMs、CD-Rs、CD-RWs、磁帶以及其它匕的光學及非光璺的資料儲存裝置。此電腦可讀媒體亦可分佈於和電腦系矣&予的網路’使得電腦可讀編碼可被分散地儲存並執行。、’、耗接 ❹

雖然在此已描述許多的實施例’本領域具有通常知識者應了解在此所述之系統及方法亦可以其它特定形式實施此’在此提供之範例及實施例應視為示範而非限縮之用，且Z 此所述之系統及方法不應限於在此所提供之細節，而可在以下所述之申請專利範圍内進行調整及使用。【圖式簡單說明】第1圖係依據本發明某一實施例描述互動語音回覆系統的功能方塊圖示，此系統可允許使用者使用語音通訊互動地存取托管服務。第2圖係依據一實施例為時間管理模組内部元件的詳細描述’以及這些元件如何和人類智慧系統内其它的模組互動的情形。第3圖為一流程圖，其依據一實施例詳細描述一範例的程序’其中系統係用於選取並提供服務（「選擇服務狀態」）給使用者。第4圖係為一流程圖，其依據一實施例更加詳細地描述由時間管理模組執行選取服務的流程圖。第5圖係依據一實施例為描述用於形成結構及將其鏈結至概念之範例。 16 201034004 【主要元件符號說明】 101 :使用者 102 :電話裝置 103 :人類智慧系統 104 :語音辨認模組 105 ··時間管理模組 106 :音訊產生模組 ❹ 108 :服務 202 :文稿引擎 203 :對話文稿 204 :服務資料庫 205 :服務資料管理者 210 :語文詞典 211 :資料模型 212 :文件至結構參 230 :特殊概念探測模組 302 :接收談話 304 :將談話轉換為字稿 306 :送出字稿 308 :將字稿轉換為結構 310 :辨認概念 312 :辨認服務 314 :產生訊息 17 201034004 316 :送出訊息 318 :選擇服務 320 :啟動文稿 322 :收集資料 402 :接收字稿 404 :將字稿轉換為結構 406 :選擇一服務 408 :產生文字訊息 410 :接收回應 412 :儲存資訊 508 :概念

Claims

201034004 七、申請專利範圍： 1. 一種在包含一語音辨認模組、一時間管理模組以及一語音產生模組之一系統内，用於提供一服務給一使用者的方法，其包含：經由該語音辨識模組接收一談話；使用屬於一資料模型之詞典，將該談話轉換為至少一 ▲ 結構；使用該結構辨認該談話内之概念；若所提供之該談話包含足夠的資訊，依據該概念選取一服務；依據該選取的服務產生一文字訊息；且使用該語音產生模組將該文字訊息轉換為一語音訊息。 2. 如申請專利範圍第1項所述之方法，更包含將該談話轉換為字稿，並接著將該字稿轉換為該至少一結構。 3. 如申請專利範圍第1項所述之方法，更包含當該談話未包含足夠資訊時，產生設計為誘導更多資訊之一文字訊息，使用該語音產生模組將該文字訊息轉換為一語音訊息，並將該語音訊息傳輸給該使用者。 4. 如申請專利範圍第1項所述之方法，更包含將該語音訊 19 201034004 息傳輪給該使用者。 5.如申請專利範圍第】項所述之方法，更包含：回應傳輸給該使用者之該語音訊息模組接收更多談話；使用屬於―資料模型之詞典將該談話轉換為至少一 "JLi結構，

使用該結構辨認該談話内之概念；依據該辨認的概念，獲得資訊以提供給該使用者；依據至少一該獲得之資訊或該辨認的概念，產生文字訊息； .使用該語音產生模組將該文字訊息轉換為一語音訊息；且將該文字訊息傳輸給該使用者。 6一 =睛專利範圍第丨項所述之方法，其中所述使用屬於 ^料模型之詞典’將該談話轉換為至少—結構之步驟更匕S將該談話與至少—個單元產生性，其鏈結至複數固概念，其則會因此與複數個服務相關。 3=利範！第6項所述之方法，其中使用該結構辨 •話内之概念的步驟包含決定和該單元鏈結之概念。 8.如申請專利範圍第7項所述之方法，更包含依據該概念 20 201034004 服務，包含依據經由該單元將每一該複數個服務與 = <話鍵結之相關概念的數目’決定和該談話最相關之服 9$1口1研專利範圍第1項所述之方法，更包含辨認和該所 k 務相關的特殊概S，並依據該談話内所包含的資訊，指派一數值給該辨認的特殊概念。申Μ專利範gj第9項所述之方法，更包含決定是否二若斤不選曰服務相關之所有的特殊概念皆在該談話中出見1不疋，職著產生—文字訊息，其設計用來之特殊概念相_資訊，並制該語音產生模电將该文字訊息轉換為—語音訊息。度生模、、且 1的1特項所述之方法’更包含當所有服務。現且被彳日派—數值時，接著執行或完成該申請專利範圍第11項所述之方法，其中執行談服匕3儲存κ話㈣包含及㈣特殊概如目關的資訊。 13.二^於提供―服務給一使用者之线，其包含：換為字稿；辨顺組’其，_為接收—談話並將該談話轉 21 201034004 -結構使用屬於—資料模型之詞典產生與該字稿相關之使用該結構辨認該談話内之概念；

服務；#錢話包含足夠的資訊，則依據該概念選擇一一該選擇的服務產生一回覆文字訊息；以及料η ^產域組’其與該時間管理馳純並組態為將_覆文字訊息轉換為—語音訊息。 h 14.如申請專利範圍第13項所述之系統，其中該時間管二模組更組態為，當該談話未包含足夠的資訊時，產生設冲為，導更多資訊的—文字訊息’且其中該語音產生模組更組態為將該文字訊息轉換為一語音訊息，且將該語音訊息傳輪給該使用者。 β 15. 如申請專利範圍第13項所述之系統，其中該時間管模、、且更組想為，藉由將該談話與至少一單元產生關連性，其鏈結至複數個概念，其則會因此與複數個服而產生與該字稿相關之一結構。相關 16. 如申請專利範圍第15項所述之系統，其中該時間管 22 201034004 理模組更組態為，藉由決定和該單元鏈結之概念，使用該結構辨斷該談話内之概念。 P·如申請專利範圍第16項所述之系統，該時間管理模組更組態為依據該概念選擇一服務，其係藉由依據經由該單元將每一該複數個服務與該談話鏈結之相關概念的數目’決定和該談話最相關之服務。 8.如申叫專利範圍第13項所述之系統，其中該時間管理模組更組態為決定和該選擇之服務相關的特殊概念，且依據該談話所包含的資訊，指派一數值給該辨認的特殊概 19.如申請專利範圍第18項所述之系統，其中該時間管理模組更組態為決定是否所有和該選擇的服務相關的特 ❹ 殊概念皆出現在該談話内，若無，則接著產生一文字訊息’其設計用來誘導和^壬何遺漏的特殊概念相目的資訊*，且其中該語音產生模組更組態為使用該語音組該文字訊息轉換為一語音訊息。镔'，且將 20p如申請專利範圍第19項所述之系統，其中該時間管 =更：態為，當所有的特殊概念皆出現且被指派—個數值時，執行或完成該服務。 23 201034004 21.如申請專利範圍第20項所述之系統，其中該時間管理更組態為執行該服務，藉由儲存該談話内所包含及與該特殊概念相關之該資訊。

24