TWI713015B

TWI713015B - 語言識別方法及裝置

Info

Publication number: TWI713015B
Application number: TW106105361A
Authority: TW
Inventors: 吳金朋; 侯震宇
Original assignee: 香港商阿里巴巴集團服務有限公司
Priority date: 2016-03-25
Filing date: 2017-02-17
Publication date: 2020-12-11
Also published as: WO2017162082A1; EP3435227A4; US20190065479A1; CN107229616A; CN107229616B; US10755055B2; KR20180126479A; EP3435227A1; JP2019512776A; TW201737241A

Abstract

本發明公開了一種語言識別方法、裝置及系統，涉及資訊技術領域，可以透過用戶輸入的資料結構映射得到對應的文法規則，可以提高語言識別的處理效率。本發明的主要技術方案為：首先接收客戶端發送的業務資料結構資訊；再從所述業務資料結構資訊中獲取文法規則；當接收到所述客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；將所述業務資料結構中的所述翻譯結果發送給所述客戶端，以使得所述客戶端對所述翻譯結果進行顯示。本發明主要用於語言識別。

Description

語言識別方法及裝置

本發明係關於資訊技術領域，尤其關於一種語言識別方法、裝置及系統。

隨著資訊技術的不斷發展，語言識別技術越來越成熟。語言識別一直是計算機科學中非常重要的一部分，廣泛應用於編譯、腳本解釋、自然語言處理等方面。所謂語言識別，即可以利用計算機識別特定語言。語言識別的目標在於將用戶輸入的字母序列轉化成計算機能夠識別和處理的資料結構。

目前，當需要識別用戶輸入的一種語言的語句資訊時，可以透過一些語言識別工具來實現語言識別，例如，ANTLR(Another Tool for Language Recognition)、YACC(Yet Another Compiler Complier)、LEX(Lexical Compiler)等語言識別工具。具體地，首先用戶需要預先定義該語言對應的文法規則；再將該文法規則轉化為語言識別工具支持的文法格式並輸入到該語言識別工具當中，進而生成能夠識別該語言的翻譯器；然後透過生成的翻譯器去翻譯輸入的字母序列；由於翻譯後的結果儲存在語言識別工具生成的資料結構中，此資料結構通常與業務資料結構存在差異，所以需要用戶將翻譯後的結果重新格式化，以便存入該業務資料結構中，進而變成業務處理所需要的資料結構資料。

然而，上述定義文法規則的步驟需要用戶對形式語言處理及編譯原理有較深理解，對於完全不懂得編譯原理或沒有任何文法知識的人而言，會增加用戶額外的學習負擔；另外，上述將翻譯後的結果存入業務資料結構的過程，由於需要透過人工方式來完成，當批量進行輸入語句的語言識別時，會影響處理的效率。

有鑑於此，本發明實施例提供了一種語言識別方法、裝置及系統，主要目的是解決上述由於需要用戶自己定義文法規則，會增加用戶額外學習負擔的問題，以及透過人工方式將翻譯後的結果存入業務資料結構的過程，會影響語言識別處理效率的問題。

為達到上述目的，本發明提供如下技術方案：一方面，本發明提供了一種語言識別方法，包括：接收客戶端發送的業務資料結構資訊；從所述業務資料結構資訊中獲取文法規則；當接收到所述客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；將所述業務資料結構中的所述翻譯結果發送給所述客戶端，以使得所述客戶端對所述翻譯結果進行顯示。

另一方面，本發明提供了另一種語言識別方法，包括：當接收到用戶輸入的業務資料結構資訊時，向伺服器發送所述業務資料結構資訊，以使得所述伺服器從所述業務資料結構資訊中獲取文法規則；當接收到用戶輸入的待識別語句資訊時，向所述伺服器發送所述待識別語句資訊，以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；接收所述伺服器發送的所述業務資料結構中的所述翻譯結果並進行顯示。

又一方面，本發明提供了一種伺服器，包括：接收單元，用於接收客戶端發送的業務資料結構資訊；獲取單元，用於從所述接收單元接收的業務資料結構資訊中獲取文法規則；翻譯單元，用於當接收到所述客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯；儲存單元，用於將所述翻譯單元的翻譯結果儲存至業務資料結構中；發送單元，用於將所述業務資料結構中的所述翻譯結果發送給所述客戶端，以使得所述客戶端對所述翻譯結果進行顯示。

再一方面，本發明提供了一種客戶端，包括：發送單元，用於當接收到用戶輸入的業務資料結構資訊時，向伺服器發送所述業務資料結構資訊，以使得所述伺服器從所述業務資料結構資訊中獲取文法規則；所述發送單元，用於當接收到用戶輸入的待識別語句資訊時，向所述伺服器發送所述待識別語句資訊，以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；接收單元，用於接收所述伺服器發送的所述業務資料結構中的所述翻譯結果；顯示單元，用於將所述接收單元接收的翻譯結果進行顯示。

再一方面，本發明提供了一種語言識別系統，包括：伺服器和客戶端；所述客戶端，用於當接收到用戶輸入的業務資料結構資訊時，向所述伺服器發送所述業務資料結構資訊；所述伺服器，用於接收所述客戶端發送的業務資料結構資訊；從所述業務資料結構資訊中獲取文法規則；所述客戶端，還用於當接收到用戶輸入的待識別語句資訊時，向所述伺服器發送所述待識別語句資訊；所述伺服器，還用於當接收到所述客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；將所述業務資料結構中的所述翻譯結果發送給所述客戶端；所述客戶端，還用於接收所述伺服器發送的所述業務資料結構中的所述翻譯結果並進行顯示。

藉由上述技術方案，本發明實施例提供的技術方案至少具有下列優點：

本發明實施例提供的一種語言識別方法、裝置及系統，首先接收客戶端發送的用戶輸入的業務資料結構資訊；然後從所述業務資料結構資訊中獲取文法規則；當接收到客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

上述說明僅是本發明技術方案的概述，為了能夠更清楚瞭解本發明的技術手段，而可依照說明書的內容予以實施，並且為了讓本發明的上述和其它目的、特徵和優點能夠更明顯易懂，以下特舉本發明的具體實施方式。

41‧‧‧接收單元

42‧‧‧獲取單元

43‧‧‧翻譯單元

44‧‧‧儲存單元

45‧‧‧發送單元

51‧‧‧接收單元

52‧‧‧獲取單元

521‧‧‧獲取模組

522‧‧‧生成模組

53‧‧‧翻譯單元

54‧‧‧儲存單元

55‧‧‧發送單元

56‧‧‧檢測單元

57‧‧‧調整單元

58‧‧‧生成單元

59‧‧‧轉化單元

510‧‧‧輸入單元

61‧‧‧發送單元

62‧‧‧接收單元

63‧‧‧顯示單元

71‧‧‧伺服器

72‧‧‧客戶端

透過閱讀下文較佳實施方式的詳細描述，各種其他的優點和益處對於本領域普通技術人員將變得清楚明瞭。附圖僅用於示出較佳實施方式的目的，而並不認為是對本發明的限制。而且在整個附圖中，用相同的參考符號表示相同的部件。在附圖中：圖1示出本發明實施例提供的一種語言識別方法的流程圖；圖2示出本發明實施例提供的另一種語言識別方法的流程圖；圖3示出本發明實施例提供的又一種語言識別方法的流程圖；圖4示出本發明實施例提供的一種伺服器的結構示意圖；圖5示出本發明實施例提供的另一種伺服器的結構示意圖；圖6示出本發明實施例提供的一種客戶端的結構示意圖；圖7示出本發明實施例提供的一種語言識別系統的結構示意圖。

下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例，然而應當理解，可以以各種形式實現本公開而不應被這裡闡述的實施例所限制。相反，提供這些實施例是為了能夠更透徹地理解本公開，並且能夠將本公開的範圍完整的傳達給本領域的技術人員。

本發明實施例提供了一種語言識別方法，可以應用於伺服器，如圖1所示，所述方法包括：

101、接收客戶端發送的業務資料結構資訊。

其中，所述業務資料結構資訊中包含業務處理所需要的業務資料結構。

對於本發明實施例，用戶可以根據業務需求，定義業務資料結構，並將定義好的業務資料結構輸入到客戶端中，並由客戶端發送給伺服器，而伺服器接收包含業務資料結構的這些業務資料結構資訊，觸發獲取文法規則的操作。

102、從業務資料結構資訊中獲取文法規則。

其中，所述文法規則可以為一種語言的句子一般滿足的特定規則。所述文法規則可以由四個部分組成，這四個部分分別為起始符、終結符、非終結符、推導規則。具體地，文法是一個四元組：文法G={VT，VN，S，P}，其中，VT是一個非空有限的符號集合，它的每個元素為終結符。VN也是一個非空有限的符號集合，它的每個元素為非終結符，並且VT與VN的交集為空集。S

VN，即S屬於VN，為文法G的起始符。P是一個非空有限集合，它的元素成為產生式，即推導規則，而產生式的形式可以定義為α→β，α稱為產生式的左部，β稱為產生式的右部，符號“→”表示“定義為”，並且α、β

(VT∪VN)，即α、β是由終結符和非終結符組成的符號串。起始符S必須至少在某一產生式的左部出現一次。

具體地，上述文法規則的四個部分可以從業務資料結構中映射得到。例如，用戶輸入的業務資料結構為JAVA資料結構，起始符可以為該業務資料結構的根對應的標識，終結符可以為JAVA類中原子類型屬性的標識，非終結符可以為業務資料結構中涉及的所有的非原子類型的類名，而推導關係可以透過類與類之間的包含關係確定。

103、當接收到客戶端發送的待識別語句資訊時，透過文法規則對待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。

其中，所述待識別語句資訊可以為用戶輸入的字母序列，所述字母序列包括且不局限於自然語言的字符，可以為任何要解析的序列中不可分割的實體，例如，摩斯碼的字母為點和短線。

104、將業務資料結構中的翻譯結果發送給客戶端。

進一步地，以使得所述客戶端對所述翻譯結果進行顯示。

對於本發明實施例，當接收到客戶端發送的待識別語句資訊時，觸發執行語言識別的操作。透過調用步驟102中獲取得到的文法規則，對輸入的待識別語句資訊進行翻譯。翻譯的過程同步將翻譯的結果儲存至用戶輸入的資料結構中，因為該資料結構是實際的業務資料結構，可以被直接使用。需要說明的是，與現有技術相比，本發明實施例從業務資料結構資訊中得到的文法規則與業務資料結構之間不存在資訊冗餘，每次更新時不需要同步修改，可以提高更新效率，便於程式的移植、升級等。並且由於翻譯過程高度自動化，可以用此方法來實現自動的資料序列化與反序列化。

本發明實施例提供的一種語言識別方法，首先接收客戶端發送的用戶輸入的業務資料結構資訊；然後從所述業務資料結構資訊中獲取文法規則；當接收到客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

進一步地，本發明實施例提供了另一種語言識別方法，可以應用於伺服器，如圖2所示，所述方法包括：

201、接收客戶端發送的業務資料結構資訊。

其中，所述業務資料結構資訊中包含業務資料結構對應的資料類型的自解釋資訊。所述自解釋資訊可以為透過自解釋機制獲取得到資料結構的注解資訊，所謂自解釋機制可以為自動獲取資料結構的資料類型特徵的過程，包含且不限於面向對象語言的反射機制，凡是能讓計算機自動描述自己資料結構、資料關係的機制，均為自解釋過程。

對於本發明實施例，當接收到客戶端發送的業務資料結構資訊時，會觸發獲取相應文法規則的操作。

202、根據自解釋資訊，從業務資料結構資訊中獲取業務資料結構對應的資料類型資訊。

其中，所述資料類型資訊中包含資料類型對應的屬性資訊以及類與類之間的包含關係。

具體地，本地根據資料類型的自解釋資訊，獲取得到全部資料類型及關係，並將資料結構映射成對應的文法元素。例如，可以根據自解釋資訊，從業務資料結構資訊中獲取原子類型屬性的名稱、非原子類型的類名以及類與類之間的包含關係等。

需要說明的是，自解釋資訊可以幫助更好地理解用戶定義好的資料結構，因此有自解釋資訊並能透過自解釋機制獲取得到注解內容的計算機語言，例如，JAVA、C#等計算機語言，更適合本發明實施例中語言識別的實現過程。

203、透過資料類型資訊生成文法規則。

其中，所述文法規則的概念解釋可以參考步驟102中相應描述，在此不再贅述。

具體地，所述步驟203具體包括：根據所述資料類型對應的屬性資訊，確定所述文法規則對應的起始符、終結符、非終結符；透過所述類與類之間的包含關係，確定所述文法規則對應的推導規則；透過所述起始符、所述終結符、所述非終結符以及所述推導規則，生成所述文法規則。

例如，以比較典型的JAVA資料結構與文法規則的映射過程為例，起始符可以為該資料結構的根對應的標識，終結符可以為JAVA類中原子類型屬性的標識，並可以根據資料類型系統自動轉換標識對應的值，非終結符可以為資料結構中涉及的所有的非原子類型的類名，而推導關係可以透過類與類之間的包含關係確定，具體地，如類A有二屬性a與b，其資料類型分別是String類和類B，則可以抽取出推導規則為A→aB。

204、當接收到客戶端發送的待識別語句資訊時，透過文法規則對待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。

需要說明的是，透過本發明實施例提供的實現方式，用戶不需要定義文法規則或理解語言本身，也不需要學習語言識別工具的文法定義格式，增加額外的學習負擔，只需要將目標資料結構輸入，即可透過輸入的資料結構映射得到對應的文法規則，並可以開始識別語言，方便用戶進行使用。

對於本發明實施例，所述步驟204之前還可以包括：檢測所述文法規則中是否存在文法錯誤；若是，則對所述文法規則進行調整。所述步驟204具體可以包括：透過調整後的文法規則對所述待識別語句資訊進行翻譯。進一步地，若文法規則中不存在文法錯誤，說明該文法規則可以直接被調用進行待識別語句資訊的翻譯。

具體地，當業務資料結構資訊中獲取的文法規則不夠規整，如存在左遞歸、歧義等文法錯誤時，需要對該文法規則進行調整，例如，變換規則內部排序等，以適應後續解釋過程。變換的過程需要記錄文法規則的起始來源，從而能夠將識別結果儲存至正確的位置。需要說明的是，當文法規則中存在文法錯誤時，透過對文法規則進行調整，並利用調整後的文法規則對接收到的待識別語句資訊進行翻譯，可以更好的進行語句資訊的翻譯，可以提高翻譯的準確性。

對於本發明實施例，所述步驟204之前還可以包括：根據所述文法規則生成翻譯器。所述步驟204具體可以包括：透過所述翻譯器對所述待識別語句資訊進行翻譯。

具體地，根據獲取得到的文法規則生成翻譯器，透過翻譯器翻譯需要翻譯的字母序列，翻譯的過程同步將翻譯的結果儲存至用戶輸入的業務資料結構中。需要說明的是，透過生成的翻譯器進行待識別語句資訊的翻譯，用戶可以透過客戶端將需要翻譯的字母序列直接輸入到翻譯器中進行翻譯，便於用戶的操作。

對於本發明實施例，所述步驟204之前還可以包括：將所述文法規則對應的文法格式轉化為預設語言識別工具支持的文法格式；將轉化後文法格式的文法規則輸入到所述預設語言識別工具中，以便透過所述預設語言識別工具生成所述文法規則對應的翻譯器；所述步驟204具體可以包括：透過所述翻譯器對所述待識別語句資訊進行翻譯。其中，所述預設語言識別工具可以為現有的語言識別工具，例如，ANTLR、YACC、LEX等語言識別工具。所述預設語言識別工具可以由技術人員根據實際需求進行預先配置。

例如，可以將獲取得到的文法規則對應的文法格式轉化為ANTLR支持的文法格式，並將轉化後文法格式的文法規則輸入到ANTLR中，透過調用ANTLR生成對應的翻譯器，並最終透過這個生成的翻譯器翻譯輸入的字母序列。

需要說明的是，對於本發明實施例的翻譯步驟，可以由本地根據獲取得到的文法規則自身以翻譯器的方式來翻譯輸入的字母序列，也可以預先根據文法規則生成翻譯器並透過翻譯器來實現翻譯過程，而翻譯器可以由本地根據獲取得到的文法規則來創建生成，還可以調用預設語言識別工具來創建生成，具體可以根據用戶的實際需求而定，本發明實施例不做限定。

205、將業務資料結構中的翻譯結果發送給客戶端。

進一步地，以使得所述客戶端對所述翻譯結果進行顯示。

本發明實施例提供的另一種語言識別方法，首先接收客戶端發送的用戶輸入的業務資料結構資訊；然後從所述業務資料結構資訊中獲取文法規則；當接收到客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

進一步地，本發明實施例提供了又一種語言識別方法，可以應用於客戶端，如圖3所示，所述方法包括：

301、當接收到用戶輸入的業務資料結構資訊時，向伺服器發送業務資料結構資訊。

進一步地，以使得所述伺服器從所述業務資料結構資訊中獲取文法規則。其中，所述業務資料結構資訊以及文法規則的概念解釋可以參考步驟101至102中相應描述，在此不再贅述。

對於本發明實施例，用戶可以根據實際的業務需求，定義業務資料結構，並將定義好的業務資料結構資訊輸入到客戶端中，客戶端接收到該業務資料結構資訊後發送給伺服器，以使得伺服器觸發從該業務資料結構資訊中獲取文法規則的操作。

302、當接收到用戶輸入的待識別語句資訊時，向伺服器發送待識別語句資訊。

進一步地，以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中，並將所述業務資料結構中的所述翻譯結果返回給客戶端。其中，所述待識別語句資訊的概念解釋可以參考步驟103中相應描述，在此不再贅述。

303、接收伺服器發送的業務資料結構中的翻譯結果並進行顯示。

本發明實施例提供的又一種語言識別方法，首先向伺服器發送的用戶輸入的業務資料結構資訊，以使得伺服器從所述業務資料結構資訊中獲取文法規則；然後向伺服器發送待識別語句資訊，以使得伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

進一步地，作為圖1所示方法的具體實現，本發明實施例提供了一種伺服器，如圖4所示，所述伺服器可以包括：接收單元41、獲取單元42、翻譯單元43、儲存單元44、發送單元45。

所述接收單元41，可以用於接收客戶端發送的業務資料結構資訊。所述接收單元41面向客戶端，接收客戶端發送的資訊。

所述獲取單元42，可以用於從所述接收單元41接收的業務資料結構資訊中獲取文法規則。所述獲取單元42可以為本伺服器中獲取文法規則的主要功能模組。

所述翻譯單元43，可以用於當接收到所述客戶端發送的待識別語句資訊時，透過所述獲取單元42獲取的文法規則對所述待識別語句資訊進行翻譯。所述翻譯單元43為本伺服器中對待識別語句資訊進行翻譯的主要功能模組。

所述儲存單元44，可以用於將所述翻譯單元43的翻譯結果儲存至業務資料結構中。所述儲存單元44可以自動實現將翻譯結果儲存至業務資料結構中，可以提高語言識別的處理效率。

所述發送單元45，可以用於將所述業務資料結構中的所述翻譯結果發送給所述客戶端。

進一步地，以使得所述客戶端對所述翻譯結果進行顯示。所述發送單元45面向客戶端，用於向客戶端返回處理資訊。

需要說明的是，該裝置實施例與前述方法實施例對應，具體可以參考圖1中的對應描述，為便於閱讀，本裝置實施例不再對前述方法實施例中的細節內容進行逐一贅述，但應當明確，本實施例中的裝置能夠對應實現前述方法實施例中的全部內容。

本發明實施例提供的一種伺服器，首先接收客戶端發送的用戶輸入的業務資料結構資訊；然後從所述業務資料結構資訊中獲取文法規則；當接收到客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

進一步地，作為圖2所示方法的具體實現，本發明實施例提供了另一種伺服器，如圖5所示，所述伺服器可以包括：接收單元51、獲取單元52、翻譯單元53、儲存單元54、發送單元55。

所述接收單元51，可以用於接收客戶端發送的業務資料結構資訊。所述接收單元51面向用戶，接收客戶端發送的資訊。

所述獲取單元52，可以用於從所述接收單元51接收的業務資料結構資訊中獲取文法規則。所述獲取單元52可以為本伺服器中獲取文法規則的主要功能模組。

所述翻譯單元53，可以用於當接收到所述客戶端發送的待識別語句資訊時，透過所述獲取單元52獲取的文法規則對所述待識別語句資訊進行翻譯。所述翻譯單元53為本伺服器中對待識別語句資訊進行翻譯的主要功能模組。

所述儲存單元54，可以用於將所述翻譯單元53的翻譯結果儲存至業務資料結構中。所述儲存單元54可以自動實現將翻譯結果儲存至業務資料結構中，可以提高語言識別的處理效率。

所述發送單元55，可以用於將所述業務資料結構中的所述翻譯結果發送給所述客戶端。

進一步地，以使得所述客戶端對所述翻譯結果進行顯示。所述發送單元55面向客戶端，用於向客戶端返回處理資訊。

可選地，所述業務資料結構資訊中包含所述業務資料結構對應的資料類型的自解釋資訊。

進一步地，所述獲取單元52包括：獲取模組521、生成模組522。

所述獲取模組521，可以用於根據所述自解釋資訊，從所述業務資料結構資訊中獲取所述業務資料結構對應的資料類型資訊。

所述生成模組522，可以用於透過所述獲取模組521獲取的資料類型資訊生成文法規則。

可選地，所述資料類型資訊中包含資料類型對應的屬性資訊以及類與類之間的包含關係。

所述生成模組522，具體可以用於根據所述資料類型對應的屬性資訊，確定所述文法規則對應的起始符、終結符、非終結符。

所述生成模組522，具體還可以用於透過所述類與類之間的包含關係，確定所述文法規則對應的推導規則。

所述生成模組522，具體還可以用於透過所述起始符、所述終結符、所述非終結符以及所述推導規則，生成所述文法規則。

進一步地，所述裝置還包括：檢測單元56、調整單元57。

所述檢測單元56，可以用於檢測所述文法規則中是否存在文法錯誤。

所述調整單元57，可以用於若所述檢測單元56檢測出所述文法規則中存在文法錯誤，則對所述文法規則進行調整。

所述翻譯單元53，具體可以用於透過所述調整單元57調整後的文法規則對所述待識別語句資訊進行翻譯。

進一步地，所述裝置還包括：生成單元58。

所述生成單元58，可以用於根據所述獲取單元52獲取的文法規則生成翻譯器。

所述翻譯單元53，具體可以用於透過所述生成單元58生成的翻譯器對所述待識別語句資訊進行翻譯。

進一步地，所述裝置還包括：轉化單元59、輸入單元510。

所述轉化單元59，可以用於將所述文法規則對應的文法格式轉化為預設語言識別工具支持的文法格式。

所述輸入單元510，可以用於將所述轉化單元59轉化後文法格式的文法規則輸入到所述預設語言識別工具中。

進一步地，以便於透過所述預設語言識別工具生成所述文法規則對應的翻譯器。

所述翻譯單元53，具體可以用於透過所述翻譯器對所述待識別語句資訊進行翻譯。

需要說明的是，該裝置實施例與前述方法實施例對應，具體可以參考圖2中的對應描述，為便於閱讀，本裝置實施例不再對前述方法實施例中的細節內容進行逐一贅述，但應當明確，本實施例中的裝置能夠對應實現前述方法實施例中的全部內容。

所述伺服器包括處理器和記憶體，上述接收單元、獲取單元、翻譯單元、儲存單元、發送單元、檢測單元、調整單元、生成單元、轉化單元、輸入單元等均作為程式單元儲存在記憶體中，由處理器執行儲存在記憶體中的上述程式單元來實現相應的功能。

處理器中包含核心，由核心去記憶體中調取相應的程式單元。核心可以設置一個或以上，透過調整核心參數來解決在對圖表中被選中的圖形進行顯示時存在顯示卡頓的問題。

記憶體可能包括電腦可讀媒體中的非永久性記憶體，隨機存取記憶體(RAM)和/或非揮發性記憶體等形式，如唯讀記憶體(ROM)或快閃記憶體(flash RAM)，記憶體包括至少一個記憶體晶片。

本發明實施例提供的另一種伺服器，首先接收客戶端發送的用戶輸入的業務資料結構資訊；然後從所述業務資料結構資訊中獲取文法規則；當接收到客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

進一步地，作為圖3所示方法的具體實現，本發明實施例提供了一種客戶端，如圖6所示，所述客戶端可以包括：發送單元61、接收單元62、顯示單元63。

所述發送單元61，可以用於當接收到用戶輸入的業務資料結構資訊時，向伺服器發送所述業務資料結構資訊。

進一步地，以使得所述伺服器從所述業務資料結構資訊中獲取文法規則。

所述發送單元61，還可以用於當接收到用戶輸入的待識別語句資訊時，向所述伺服器發送所述待識別語句資訊。

進一步地，以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。

所述接收單元62，可以用於接收所述伺服器發送的所述業務資料結構中的所述翻譯結果。

所述顯示單元63，可以用於將所述接收單元62接收的翻譯結果進行顯示。

需要說明的是，本發明實施例提供的一種客戶端所涉及各功能單元的其他相應描述，可以參考圖3中的對應描述，在此不再贅述。

本發明實施例提供的一種客戶端，首先向伺服器發送的用戶輸入的業務資料結構資訊，以使得伺服器從所述業務資料結構資訊中獲取文法規則；然後向伺服器發送待識別語句資訊，以使得伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

進一步地，本發明實施例提供了一種語言識別系統，如圖7所示，包括：伺服器71、客戶端72。

所述客戶端72，可以用於當接收到用戶輸入的業務資料結構資訊時，向所述伺服器71發送所述業務資料結構資訊。

所述伺服器71，可以用於接收所述客戶端72發送的業務資料結構資訊；從所述業務資料結構資訊中獲取文法規則。

所述客戶端72，還可以用於當接收到用戶輸入的待識別語句資訊時，向所述伺服器71發送所述待識別語句資訊。

所述伺服器71，還可以用於當接收到所述客戶端72發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；將所述業務資料結構中的所述翻譯結果發送給所述客戶端72。

所述客戶端72，還可以用於接收所述伺服器71發送的所述業務資料結構中的所述翻譯結果並進行顯示。

本發明實施例提供的一種語言識別系統，首先伺服器接收客戶端發送的用戶輸入的業務資料結構資訊；然後從所述業務資料結構資訊中獲取文法規則；當接收到客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比，本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則，以便透過該文法規則對輸入的語句資訊進行翻譯，無需用戶自己抽象出語言的文法規則，減輕了用戶學習負擔，簡化了語言識別的過程，便於用戶操作。另外，與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比，本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯，翻譯後存入結果的資料結構正是需要存入的業務資料結構，可以實現自動將翻譯後的結果存入業務資料結構的過程，可以提高語言識別的處理效率。

本申請還提供了一種計算機程式產品，當在資料處理設備上執行時，適於執行初始化有如下方法步驟的程式代碼：接收客戶端發送的業務資料結構資訊；從所述業務資料結構資訊中獲取文法規則；當接收到所述客戶端發送的待識別語句資訊時，透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中；將所述業務資料結構中的所述翻譯結果發送給所述客戶端，以使得所述客戶端對所述翻譯結果進行顯示。

本領域內的技術人員應明白，本申請的實施例可提供為方法、系統、或計算機程式產品。因此，本申請可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且，本申請可採用在一個或多個其中包含有計算機可用程式代碼的計算機可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的計算機程式產品的形式。

本申請是參照根據本申請實施例的圖表中圖形的顯示方法、裝置、和計算機程式產品的流程圖和/或方框圖來描述的。應理解可由計算機程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程式指令到通用計算機、專用計算機、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器，使得透過計算機或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程式指令也可儲存在能引導計算機或其他可編程資料處理設備以特定方式工作的電腦可讀取記憶體中，使得儲存在該電腦可讀取記憶體中的指令產生包括指令裝置的製造品，該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程式指令也可裝載到計算機或其他可編程資料處理設備上，使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理，從而在計算機或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

在一個典型的配置中，計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。

儲存器可能包括電腦可讀取媒體中的非永久性記憶體，隨機存取記憶體(RAM)和/或非揮發性記憶體等形式，如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀取媒體的示例。

電腦可讀取媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括，但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可編程唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶，磁帶磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒體，可用於儲存可以被計算設備訪問的資訊。按照本文中的界定，電腦可讀取媒體不包括暫存電腦可讀媒體(transitory media)，如調製的資料信號和載波。

以上僅為本申請的實施例而已，並不用於限制本申請。對於本領域技術人員來說，本申請可以有各種更改和變化。凡在本申請的精神和原理之內所作的任何修改、等同替換、改進等，均應包含在本申請的申請專利範圍之範圍之內。

Claims

一種語言識別方法，其特徵在於，包括：於伺服器接收客戶端發送的使用程式語言定義的業務資料結構，所述業務資料結構包括一或更多資料類型；該伺服器根據該業務資料結構中的所述一或更多資料類型獲取文法規則；該伺服器檢測所述文法規則是否包含一或更多錯誤；該伺服器藉由根據所述一或更多錯誤變換所述文法規則的內部排序，以產生調整的文法規則；伺服器接收到該客戶端發送的語句資訊；透過該調整的文法規則對該語句資訊進行翻譯；該伺服器將翻譯結果儲存至該業務資料結構中；及該伺服器將該業務資料結構中的該翻譯結果發送給該客戶端。
根據請求項1所述的語言識別方法，其中，所述獲取文法規則包括獲取四部分文法規則，該四部分文法規則包含起始符、終結符、非終結符以及推導規則。
根據請求項1所述的語言識別方法，其中，所述獲取文法規則包含根據所述業務資料結構的內容分析，從所述業務資料結構映射得到該文法規則。
根據請求項1所述的語言識別方法，其中，所述接收語句資訊包含接收該客戶端的用戶所輸入的字母序列。
根據請求項1所述的語言識別方法，其中，接收所述業務資料結構包含接收該業務資料結構，其中包含對應於該業務資料結構的資料類型的自解釋資訊，所述自解釋資訊包含該資料結構的注解。
根據請求項5所述的語言識別方法，更包含：該伺服器根據該自解釋資訊，獲取資料類型資訊。
根據請求項6所述的語言識別方法，其中，所述獲取文法規則包含該伺服器透過該資料類型資訊生成該文法規則。
根據請求項7所述的語言識別方法，其中，所述透過該資料類型資訊生成文法規則包括：該伺服器根據該資料類型資訊對應的屬性資訊，確定與該文法規則對應的起始符、終結符、非終結符；該伺服器透過在該業務資料結構中的類與類之間的包含關係，確定與該文法規則對應的推導規則；及該伺服器透過該起始符、該終結符、該非終結符以及該推導規則，生成該文法規則。
根據請求項1所述的語言識別方法，該方法還包括：該伺服器將與該文法規則對應的第一文法格式轉化為第二文法格式，該第二文法格式包含預設語言識別工具支持的文法格式；及該伺服器使用該第二文法格式，以生成該文法規則。
一種語言識別裝置，包括：處理器；及儲存媒體，用以儲存程式邏輯於其上，以為該處理器所執行，該儲存的程式邏輯包含：為該處理器所執行之接收邏輯，用於接收客戶端發送的使用程式語言定義的業務資料結構，該業務資料結構包含一或更多資料類型；為該處理器所執行的獲取邏輯，用於根據該業務資料結構的所述一或更多資料類型獲取文法規則；為該處理器所執行的檢測邏輯，用於檢測該文法規則是否包含一或更多錯誤；為該處理器所執行的產生邏輯，用於藉由根據所述一或更多錯誤變換所述文法規則的內部排序，以產生調整的文法規則；為該處理器所執行的接收邏輯，用於接收該客戶端發送的語句資訊；為該處理器所執行的翻譯邏輯，用於透過該調整的文法規則對該語句資訊進行翻譯；為該處理器所執行的儲存邏輯，用於將翻譯結果儲存至該業務資料結構中；及為該處理器所執行的發送邏輯，用於將該業務資料結構中的該翻譯結果發送給該客戶端。
根據請求項10所述的語言識別裝置，其中該用於獲取文法規則的獲取邏輯包含為該處理器所執行的獲取邏輯，用以獲取四部分文法規則，該四部分文法規則包含起始符、終結符、非終結符以及推導規則。
根據請求項10所述的語言識別裝置，其中，該用於獲取文法規則的獲取邏輯包含為該處理器所執行的映射邏輯，用於根據所述業務資料結構的內容分析，從所述業務資料結構映射得到該文法規則。
根據請求項10所述的語言識別裝置，其中，所述用於接收語句資訊的接收邏輯包含為該處理器所執行的接收邏輯，用於接收該客戶端的用戶所輸入的字母序列。
根據請求項10所述的語言識別裝置，其中，所述用於接收該業務資料結構的接收邏輯包含為該處理器所執行的接收邏輯，用於接收包含與該業務資料結構對應的資料類型的自解釋資訊的業務資料結構，該自解釋資訊包含該資料結構的注解。
根據請求項14所述的語言識別裝置，其中所儲存的程式邏輯更包含為該處理器所執行的獲取邏輯，用於根據該自解釋資訊，獲取資料類型資訊。
根據請求項15所述的語言識別裝置，其中所述用於獲取文法規則的獲取邏輯包含為該處理器所執行的生成邏輯，用於透過該資料類型資訊生成該文法規則。
根據請求項16所述的語言識別裝置，其中，所述透過該資料類型資訊生成該文法規則的生成邏輯包含：為該處理器所執行的確定邏輯，用於根據與該資料類型資訊對應的屬性資訊，確定與該文法規則對應的起始符、終結符、非終結符；為該處理器所執行的確定邏輯，用於透過在該業務資料結構中的類與類之間的包含關係，確定與該文法規則對應的推導規則；及為該處理器所執行的生成邏輯，用於透過該起始符、該終結符、該非終結符以及該推導規則，生成該文法規則。
根據請求項10所述的語言識別裝置，其中，透過該文法規則對該語句資訊進行翻譯的該翻譯邏輯還包括：為該處理器所執行的生成邏輯，用於根據該文法規則生成翻譯器；為該處理器所執行的翻譯邏輯，用於透過該翻譯器對該語句資訊進行翻譯。
根據請求項10所述的語言識別裝置，其中，該儲存程式邏輯還包括：為該處理器所執行的轉化邏輯，用於將與該文法規則對應的第一文法格式轉化為第二文法格式，該第二文法格式包含預設語言識別工具支持的文法格式；及為該處理器所執行的使用邏輯，用於使用該第二文法格式，以生成該文法規則。