TWI713015B - 語言識別方法及裝置 - Google Patents

語言識別方法及裝置 Download PDF

Info

Publication number
TWI713015B
TWI713015B TW106105361A TW106105361A TWI713015B TW I713015 B TWI713015 B TW I713015B TW 106105361 A TW106105361 A TW 106105361A TW 106105361 A TW106105361 A TW 106105361A TW I713015 B TWI713015 B TW I713015B
Authority
TW
Taiwan
Prior art keywords
data structure
grammar
business data
information
language recognition
Prior art date
Application number
TW106105361A
Other languages
English (en)
Other versions
TW201737241A (zh
Inventor
吳金朋
侯震宇
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201737241A publication Critical patent/TW201737241A/zh
Application granted granted Critical
Publication of TWI713015B publication Critical patent/TWI713015B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/43Checking; Contextual analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本發明公開了一種語言識別方法、裝置及系統,涉及資訊技術領域,可以透過用戶輸入的資料結構映射得到對應的文法規則,可以提高語言識別的處理效率。本發明的主要技術方案為:首先接收客戶端發送的業務資料結構資訊;再從所述業務資料結構資訊中獲取文法規則;當接收到所述客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;將所述業務資料結構中的所述翻譯結果發送給所述客戶端,以使得所述客戶端對所述翻譯結果進行顯示。本發明主要用於語言識別。

Description

語言識別方法及裝置
本發明係關於資訊技術領域,尤其關於一種語言識別方法、裝置及系統。
隨著資訊技術的不斷發展,語言識別技術越來越成熟。語言識別一直是計算機科學中非常重要的一部分,廣泛應用於編譯、腳本解釋、自然語言處理等方面。所謂語言識別,即可以利用計算機識別特定語言。語言識別的目標在於將用戶輸入的字母序列轉化成計算機能夠識別和處理的資料結構。
目前,當需要識別用戶輸入的一種語言的語句資訊時,可以透過一些語言識別工具來實現語言識別,例如,ANTLR(Another Tool for Language Recognition)、YACC(Yet Another Compiler Complier)、LEX(Lexical Compiler)等語言識別工具。具體地,首先用戶需要預先定義該語言對應的文法規則;再將該文法規則轉化為語言識別工具支持的文法格式並輸入到該語言識別工具當中,進而生成能夠識別該語言的翻譯器;然後透過生成的翻譯 器去翻譯輸入的字母序列;由於翻譯後的結果儲存在語言識別工具生成的資料結構中,此資料結構通常與業務資料結構存在差異,所以需要用戶將翻譯後的結果重新格式化,以便存入該業務資料結構中,進而變成業務處理所需要的資料結構資料。
然而,上述定義文法規則的步驟需要用戶對形式語言處理及編譯原理有較深理解,對於完全不懂得編譯原理或沒有任何文法知識的人而言,會增加用戶額外的學習負擔;另外,上述將翻譯後的結果存入業務資料結構的過程,由於需要透過人工方式來完成,當批量進行輸入語句的語言識別時,會影響處理的效率。
有鑑於此,本發明實施例提供了一種語言識別方法、裝置及系統,主要目的是解決上述由於需要用戶自己定義文法規則,會增加用戶額外學習負擔的問題,以及透過人工方式將翻譯後的結果存入業務資料結構的過程,會影響語言識別處理效率的問題。
為達到上述目的,本發明提供如下技術方案:一方面,本發明提供了一種語言識別方法,包括:接收客戶端發送的業務資料結構資訊;從所述業務資料結構資訊中獲取文法規則;當接收到所述客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;將所述業務資料結構中的所述翻譯結果發送給所述客戶端,以使得所述客戶端對所述翻譯結果進行顯示。
另一方面,本發明提供了另一種語言識別方法,包括:當接收到用戶輸入的業務資料結構資訊時,向伺服器發送所述業務資料結構資訊,以使得所述伺服器從所述業務資料結構資訊中獲取文法規則;當接收到用戶輸入的待識別語句資訊時,向所述伺服器發送所述待識別語句資訊,以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;接收所述伺服器發送的所述業務資料結構中的所述翻譯結果並進行顯示。
又一方面,本發明提供了一種伺服器,包括:接收單元,用於接收客戶端發送的業務資料結構資訊;獲取單元,用於從所述接收單元接收的業務資料結構資訊中獲取文法規則;翻譯單元,用於當接收到所述客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯;儲存單元,用於將所述翻譯單元的翻譯結果儲存至業務資料結構中; 發送單元,用於將所述業務資料結構中的所述翻譯結果發送給所述客戶端,以使得所述客戶端對所述翻譯結果進行顯示。
再一方面,本發明提供了一種客戶端,包括:發送單元,用於當接收到用戶輸入的業務資料結構資訊時,向伺服器發送所述業務資料結構資訊,以使得所述伺服器從所述業務資料結構資訊中獲取文法規則;所述發送單元,用於當接收到用戶輸入的待識別語句資訊時,向所述伺服器發送所述待識別語句資訊,以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;接收單元,用於接收所述伺服器發送的所述業務資料結構中的所述翻譯結果;顯示單元,用於將所述接收單元接收的翻譯結果進行顯示。
再一方面,本發明提供了一種語言識別系統,包括:伺服器和客戶端;所述客戶端,用於當接收到用戶輸入的業務資料結構資訊時,向所述伺服器發送所述業務資料結構資訊;所述伺服器,用於接收所述客戶端發送的業務資料結構資訊;從所述業務資料結構資訊中獲取文法規則;所述客戶端,還用於當接收到用戶輸入的待識別語句資訊時,向所述伺服器發送所述待識別語句資訊;所述伺服器,還用於當接收到所述客戶端發送的待識 別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;將所述業務資料結構中的所述翻譯結果發送給所述客戶端;所述客戶端,還用於接收所述伺服器發送的所述業務資料結構中的所述翻譯結果並進行顯示。
藉由上述技術方案,本發明實施例提供的技術方案至少具有下列優點:
本發明實施例提供的一種語言識別方法、裝置及系統,首先接收客戶端發送的用戶輸入的業務資料結構資訊;然後從所述業務資料結構資訊中獲取文法規則;當接收到客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
上述說明僅是本發明技術方案的概述,為了能夠更清楚瞭解本發明的技術手段,而可依照說明書的內容予以實 施,並且為了讓本發明的上述和其它目的、特徵和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
41‧‧‧接收單元
42‧‧‧獲取單元
43‧‧‧翻譯單元
44‧‧‧儲存單元
45‧‧‧發送單元
51‧‧‧接收單元
52‧‧‧獲取單元
521‧‧‧獲取模組
522‧‧‧生成模組
53‧‧‧翻譯單元
54‧‧‧儲存單元
55‧‧‧發送單元
56‧‧‧檢測單元
57‧‧‧調整單元
58‧‧‧生成單元
59‧‧‧轉化單元
510‧‧‧輸入單元
61‧‧‧發送單元
62‧‧‧接收單元
63‧‧‧顯示單元
71‧‧‧伺服器
72‧‧‧客戶端
透過閱讀下文較佳實施方式的詳細描述,各種其他的優點和益處對於本領域普通技術人員將變得清楚明瞭。附圖僅用於示出較佳實施方式的目的,而並不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:圖1示出本發明實施例提供的一種語言識別方法的流程圖;圖2示出本發明實施例提供的另一種語言識別方法的流程圖;圖3示出本發明實施例提供的又一種語言識別方法的流程圖;圖4示出本發明實施例提供的一種伺服器的結構示意圖;圖5示出本發明實施例提供的另一種伺服器的結構示意圖;圖6示出本發明實施例提供的一種客戶端的結構示意圖;圖7示出本發明實施例提供的一種語言識別系統的結構示意圖。
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這裡闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,並且能夠將本公開的範圍完整的傳達給本領域的技術人員。
本發明實施例提供了一種語言識別方法,可以應用於伺服器,如圖1所示,所述方法包括:
101、接收客戶端發送的業務資料結構資訊。
其中,所述業務資料結構資訊中包含業務處理所需要的業務資料結構。
對於本發明實施例,用戶可以根據業務需求,定義業務資料結構,並將定義好的業務資料結構輸入到客戶端中,並由客戶端發送給伺服器,而伺服器接收包含業務資料結構的這些業務資料結構資訊,觸發獲取文法規則的操作。
102、從業務資料結構資訊中獲取文法規則。
其中,所述文法規則可以為一種語言的句子一般滿足的特定規則。所述文法規則可以由四個部分組成,這四個部分分別為起始符、終結符、非終結符、推導規則。具體地,文法是一個四元組:文法G={VT,VN,S,P},其中,VT是一個非空有限的符號集合,它的每個元素為終結符。VN也是一個非空有限的符號集合,它的每個元素 為非終結符,並且VT與VN的交集為空集。S
Figure 106105361-A0202-12-0008-9
VN,即S屬於VN,為文法G的起始符。P是一個非空有限集合,它的元素成為產生式,即推導規則,而產生式的形式可以定義為α→β,α稱為產生式的左部,β稱為產生式的右部,符號“→”表示“定義為”,並且α、β
Figure 106105361-A0202-12-0008-10
(VT∪VN),即α、β是由終結符和非終結符組成的符號串。起始符S必須至少在某一產生式的左部出現一次。
具體地,上述文法規則的四個部分可以從業務資料結構中映射得到。例如,用戶輸入的業務資料結構為JAVA資料結構,起始符可以為該業務資料結構的根對應的標識,終結符可以為JAVA類中原子類型屬性的標識,非終結符可以為業務資料結構中涉及的所有的非原子類型的類名,而推導關係可以透過類與類之間的包含關係確定。
103、當接收到客戶端發送的待識別語句資訊時,透過文法規則對待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。
其中,所述待識別語句資訊可以為用戶輸入的字母序列,所述字母序列包括且不局限於自然語言的字符,可以為任何要解析的序列中不可分割的實體,例如,摩斯碼的字母為點和短線。
104、將業務資料結構中的翻譯結果發送給客戶端。
進一步地,以使得所述客戶端對所述翻譯結果進行顯示。
對於本發明實施例,當接收到客戶端發送的待識別語 句資訊時,觸發執行語言識別的操作。透過調用步驟102中獲取得到的文法規則,對輸入的待識別語句資訊進行翻譯。翻譯的過程同步將翻譯的結果儲存至用戶輸入的資料結構中,因為該資料結構是實際的業務資料結構,可以被直接使用。需要說明的是,與現有技術相比,本發明實施例從業務資料結構資訊中得到的文法規則與業務資料結構之間不存在資訊冗餘,每次更新時不需要同步修改,可以提高更新效率,便於程式的移植、升級等。並且由於翻譯過程高度自動化,可以用此方法來實現自動的資料序列化與反序列化。
本發明實施例提供的一種語言識別方法,首先接收客戶端發送的用戶輸入的業務資料結構資訊;然後從所述業務資料結構資訊中獲取文法規則;當接收到客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可 以提高語言識別的處理效率。
進一步地,本發明實施例提供了另一種語言識別方法,可以應用於伺服器,如圖2所示,所述方法包括:
201、接收客戶端發送的業務資料結構資訊。
其中,所述業務資料結構資訊中包含業務資料結構對應的資料類型的自解釋資訊。所述自解釋資訊可以為透過自解釋機制獲取得到資料結構的注解資訊,所謂自解釋機制可以為自動獲取資料結構的資料類型特徵的過程,包含且不限於面向對象語言的反射機制,凡是能讓計算機自動描述自己資料結構、資料關係的機制,均為自解釋過程。
對於本發明實施例,當接收到客戶端發送的業務資料結構資訊時,會觸發獲取相應文法規則的操作。
202、根據自解釋資訊,從業務資料結構資訊中獲取業務資料結構對應的資料類型資訊。
其中,所述資料類型資訊中包含資料類型對應的屬性資訊以及類與類之間的包含關係。
具體地,本地根據資料類型的自解釋資訊,獲取得到全部資料類型及關係,並將資料結構映射成對應的文法元素。例如,可以根據自解釋資訊,從業務資料結構資訊中獲取原子類型屬性的名稱、非原子類型的類名以及類與類之間的包含關係等。
需要說明的是,自解釋資訊可以幫助更好地理解用戶定義好的資料結構,因此有自解釋資訊並能透過自解釋機制獲取得到注解內容的計算機語言,例如,JAVA、C#等 計算機語言,更適合本發明實施例中語言識別的實現過程。
203、透過資料類型資訊生成文法規則。
其中,所述文法規則的概念解釋可以參考步驟102中相應描述,在此不再贅述。
具體地,所述步驟203具體包括:根據所述資料類型對應的屬性資訊,確定所述文法規則對應的起始符、終結符、非終結符;透過所述類與類之間的包含關係,確定所述文法規則對應的推導規則;透過所述起始符、所述終結符、所述非終結符以及所述推導規則,生成所述文法規則。
例如,以比較典型的JAVA資料結構與文法規則的映射過程為例,起始符可以為該資料結構的根對應的標識,終結符可以為JAVA類中原子類型屬性的標識,並可以根據資料類型系統自動轉換標識對應的值,非終結符可以為資料結構中涉及的所有的非原子類型的類名,而推導關係可以透過類與類之間的包含關係確定,具體地,如類A有二屬性a與b,其資料類型分別是String類和類B,則可以抽取出推導規則為A→aB。
204、當接收到客戶端發送的待識別語句資訊時,透過文法規則對待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。
需要說明的是,透過本發明實施例提供的實現方式,用戶不需要定義文法規則或理解語言本身,也不需要學習 語言識別工具的文法定義格式,增加額外的學習負擔,只需要將目標資料結構輸入,即可透過輸入的資料結構映射得到對應的文法規則,並可以開始識別語言,方便用戶進行使用。
對於本發明實施例,所述步驟204之前還可以包括:檢測所述文法規則中是否存在文法錯誤;若是,則對所述文法規則進行調整。所述步驟204具體可以包括:透過調整後的文法規則對所述待識別語句資訊進行翻譯。進一步地,若文法規則中不存在文法錯誤,說明該文法規則可以直接被調用進行待識別語句資訊的翻譯。
具體地,當業務資料結構資訊中獲取的文法規則不夠規整,如存在左遞歸、歧義等文法錯誤時,需要對該文法規則進行調整,例如,變換規則內部排序等,以適應後續解釋過程。變換的過程需要記錄文法規則的起始來源,從而能夠將識別結果儲存至正確的位置。需要說明的是,當文法規則中存在文法錯誤時,透過對文法規則進行調整,並利用調整後的文法規則對接收到的待識別語句資訊進行翻譯,可以更好的進行語句資訊的翻譯,可以提高翻譯的準確性。
對於本發明實施例,所述步驟204之前還可以包括:根據所述文法規則生成翻譯器。所述步驟204具體可以包括:透過所述翻譯器對所述待識別語句資訊進行翻譯。
具體地,根據獲取得到的文法規則生成翻譯器,透過翻譯器翻譯需要翻譯的字母序列,翻譯的過程同步將翻譯 的結果儲存至用戶輸入的業務資料結構中。需要說明的是,透過生成的翻譯器進行待識別語句資訊的翻譯,用戶可以透過客戶端將需要翻譯的字母序列直接輸入到翻譯器中進行翻譯,便於用戶的操作。
對於本發明實施例,所述步驟204之前還可以包括:將所述文法規則對應的文法格式轉化為預設語言識別工具支持的文法格式;將轉化後文法格式的文法規則輸入到所述預設語言識別工具中,以便透過所述預設語言識別工具生成所述文法規則對應的翻譯器;所述步驟204具體可以包括:透過所述翻譯器對所述待識別語句資訊進行翻譯。其中,所述預設語言識別工具可以為現有的語言識別工具,例如,ANTLR、YACC、LEX等語言識別工具。所述預設語言識別工具可以由技術人員根據實際需求進行預先配置。
例如,可以將獲取得到的文法規則對應的文法格式轉化為ANTLR支持的文法格式,並將轉化後文法格式的文法規則輸入到ANTLR中,透過調用ANTLR生成對應的翻譯器,並最終透過這個生成的翻譯器翻譯輸入的字母序列。
需要說明的是,對於本發明實施例的翻譯步驟,可以由本地根據獲取得到的文法規則自身以翻譯器的方式來翻譯輸入的字母序列,也可以預先根據文法規則生成翻譯器並透過翻譯器來實現翻譯過程,而翻譯器可以由本地根據獲取得到的文法規則來創建生成,還可以調用預設語言識 別工具來創建生成,具體可以根據用戶的實際需求而定,本發明實施例不做限定。
205、將業務資料結構中的翻譯結果發送給客戶端。
進一步地,以使得所述客戶端對所述翻譯結果進行顯示。
本發明實施例提供的另一種語言識別方法,首先接收客戶端發送的用戶輸入的業務資料結構資訊;然後從所述業務資料結構資訊中獲取文法規則;當接收到客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
進一步地,本發明實施例提供了又一種語言識別方法,可以應用於客戶端,如圖3所示,所述方法包括:
301、當接收到用戶輸入的業務資料結構資訊時,向伺服器發送業務資料結構資訊。
進一步地,以使得所述伺服器從所述業務資料結構資訊中獲取文法規則。其中,所述業務資料結構資訊以及文法規則的概念解釋可以參考步驟101至102中相應描述,在此不再贅述。
對於本發明實施例,用戶可以根據實際的業務需求,定義業務資料結構,並將定義好的業務資料結構資訊輸入到客戶端中,客戶端接收到該業務資料結構資訊後發送給伺服器,以使得伺服器觸發從該業務資料結構資訊中獲取文法規則的操作。
302、當接收到用戶輸入的待識別語句資訊時,向伺服器發送待識別語句資訊。
進一步地,以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中,並將所述業務資料結構中的所述翻譯結果返回給客戶端。其中,所述待識別語句資訊的概念解釋可以參考步驟103中相應描述,在此不再贅述。
303、接收伺服器發送的業務資料結構中的翻譯結果並進行顯示。
本發明實施例提供的又一種語言識別方法,首先向伺服器發送的用戶輸入的業務資料結構資訊,以使得伺服器從所述業務資料結構資訊中獲取文法規則;然後向伺服器發送待識別語句資訊,以使得伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發 明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
進一步地,作為圖1所示方法的具體實現,本發明實施例提供了一種伺服器,如圖4所示,所述伺服器可以包括:接收單元41、獲取單元42、翻譯單元43、儲存單元44、發送單元45。
所述接收單元41,可以用於接收客戶端發送的業務資料結構資訊。所述接收單元41面向客戶端,接收客戶端發送的資訊。
所述獲取單元42,可以用於從所述接收單元41接收的業務資料結構資訊中獲取文法規則。所述獲取單元42可以為本伺服器中獲取文法規則的主要功能模組。
所述翻譯單元43,可以用於當接收到所述客戶端發送的待識別語句資訊時,透過所述獲取單元42獲取的文法規則對所述待識別語句資訊進行翻譯。所述翻譯單元43為本伺服器中對待識別語句資訊進行翻譯的主要功能模組。
所述儲存單元44,可以用於將所述翻譯單元43的翻譯結果儲存至業務資料結構中。所述儲存單元44可以自動實現將翻譯結果儲存至業務資料結構中,可以提高語言識別的處理效率。
所述發送單元45,可以用於將所述業務資料結構中的所述翻譯結果發送給所述客戶端。
進一步地,以使得所述客戶端對所述翻譯結果進行顯示。所述發送單元45面向客戶端,用於向客戶端返回處理資訊。
需要說明的是,該裝置實施例與前述方法實施例對應,具體可以參考圖1中的對應描述,為便於閱讀,本裝置實施例不再對前述方法實施例中的細節內容進行逐一贅述,但應當明確,本實施例中的裝置能夠對應實現前述方法實施例中的全部內容。
本發明實施例提供的一種伺服器,首先接收客戶端發送的用戶輸入的業務資料結構資訊;然後從所述業務資料結構資訊中獲取文法規則;當接收到客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻 譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
進一步地,作為圖2所示方法的具體實現,本發明實施例提供了另一種伺服器,如圖5所示,所述伺服器可以包括:接收單元51、獲取單元52、翻譯單元53、儲存單元54、發送單元55。
所述接收單元51,可以用於接收客戶端發送的業務資料結構資訊。所述接收單元51面向用戶,接收客戶端發送的資訊。
所述獲取單元52,可以用於從所述接收單元51接收的業務資料結構資訊中獲取文法規則。所述獲取單元52可以為本伺服器中獲取文法規則的主要功能模組。
所述翻譯單元53,可以用於當接收到所述客戶端發送的待識別語句資訊時,透過所述獲取單元52獲取的文法規則對所述待識別語句資訊進行翻譯。所述翻譯單元53為本伺服器中對待識別語句資訊進行翻譯的主要功能模組。
所述儲存單元54,可以用於將所述翻譯單元53的翻譯結果儲存至業務資料結構中。所述儲存單元54可以自動實現將翻譯結果儲存至業務資料結構中,可以提高語言識別的處理效率。
所述發送單元55,可以用於將所述業務資料結構中的所述翻譯結果發送給所述客戶端。
進一步地,以使得所述客戶端對所述翻譯結果進行顯示。所述發送單元55面向客戶端,用於向客戶端返回處理資訊。
可選地,所述業務資料結構資訊中包含所述業務資料結構對應的資料類型的自解釋資訊。
進一步地,所述獲取單元52包括:獲取模組521、生成模組522。
所述獲取模組521,可以用於根據所述自解釋資訊,從所述業務資料結構資訊中獲取所述業務資料結構對應的資料類型資訊。
所述生成模組522,可以用於透過所述獲取模組521獲取的資料類型資訊生成文法規則。
可選地,所述資料類型資訊中包含資料類型對應的屬性資訊以及類與類之間的包含關係。
所述生成模組522,具體可以用於根據所述資料類型對應的屬性資訊,確定所述文法規則對應的起始符、終結符、非終結符。
所述生成模組522,具體還可以用於透過所述類與類之間的包含關係,確定所述文法規則對應的推導規則。
所述生成模組522,具體還可以用於透過所述起始符、所述終結符、所述非終結符以及所述推導規則,生成所述文法規則。
進一步地,所述裝置還包括:檢測單元56、調整單元57。
所述檢測單元56,可以用於檢測所述文法規則中是否存在文法錯誤。
所述調整單元57,可以用於若所述檢測單元56檢測出所述文法規則中存在文法錯誤,則對所述文法規則進行調整。
所述翻譯單元53,具體可以用於透過所述調整單元57調整後的文法規則對所述待識別語句資訊進行翻譯。
進一步地,所述裝置還包括:生成單元58。
所述生成單元58,可以用於根據所述獲取單元52獲取的文法規則生成翻譯器。
所述翻譯單元53,具體可以用於透過所述生成單元58生成的翻譯器對所述待識別語句資訊進行翻譯。
進一步地,所述裝置還包括:轉化單元59、輸入單元510。
所述轉化單元59,可以用於將所述文法規則對應的文法格式轉化為預設語言識別工具支持的文法格式。
所述輸入單元510,可以用於將所述轉化單元59轉化後文法格式的文法規則輸入到所述預設語言識別工具中。
進一步地,以便於透過所述預設語言識別工具生成所述文法規則對應的翻譯器。
所述翻譯單元53,具體可以用於透過所述翻譯器對 所述待識別語句資訊進行翻譯。
需要說明的是,該裝置實施例與前述方法實施例對應,具體可以參考圖2中的對應描述,為便於閱讀,本裝置實施例不再對前述方法實施例中的細節內容進行逐一贅述,但應當明確,本實施例中的裝置能夠對應實現前述方法實施例中的全部內容。
所述伺服器包括處理器和記憶體,上述接收單元、獲取單元、翻譯單元、儲存單元、發送單元、檢測單元、調整單元、生成單元、轉化單元、輸入單元等均作為程式單元儲存在記憶體中,由處理器執行儲存在記憶體中的上述程式單元來實現相應的功能。
處理器中包含核心,由核心去記憶體中調取相應的程式單元。核心可以設置一個或以上,透過調整核心參數來解決在對圖表中被選中的圖形進行顯示時存在顯示卡頓的問題。
記憶體可能包括電腦可讀媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非揮發性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM),記憶體包括至少一個記憶體晶片。
本發明實施例提供的另一種伺服器,首先接收客戶端發送的用戶輸入的業務資料結構資訊;然後從所述業務資料結構資訊中獲取文法規則;當接收到客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需 要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
進一步地,作為圖3所示方法的具體實現,本發明實施例提供了一種客戶端,如圖6所示,所述客戶端可以包括:發送單元61、接收單元62、顯示單元63。
所述發送單元61,可以用於當接收到用戶輸入的業務資料結構資訊時,向伺服器發送所述業務資料結構資訊。
進一步地,以使得所述伺服器從所述業務資料結構資訊中獲取文法規則。
所述發送單元61,還可以用於當接收到用戶輸入的待識別語句資訊時,向所述伺服器發送所述待識別語句資訊。
進一步地,以使得所述伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。
所述接收單元62,可以用於接收所述伺服器發送的所述業務資料結構中的所述翻譯結果。
所述顯示單元63,可以用於將所述接收單元62接收的翻譯結果進行顯示。
需要說明的是,本發明實施例提供的一種客戶端所涉及各功能單元的其他相應描述,可以參考圖3中的對應描述,在此不再贅述。
本發明實施例提供的一種客戶端,首先向伺服器發送的用戶輸入的業務資料結構資訊,以使得伺服器從所述業務資料結構資訊中獲取文法規則;然後向伺服器發送待識別語句資訊,以使得伺服器透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
進一步地,本發明實施例提供了一種語言識別系統,如圖7所示,包括:伺服器71、客戶端72。
所述客戶端72,可以用於當接收到用戶輸入的業務資料結構資訊時,向所述伺服器71發送所述業務資料結構資訊。
所述伺服器71,可以用於接收所述客戶端72發送的業務資料結構資訊;從所述業務資料結構資訊中獲取文法規則。
所述客戶端72,還可以用於當接收到用戶輸入的待識別語句資訊時,向所述伺服器71發送所述待識別語句資訊。
所述伺服器71,還可以用於當接收到所述客戶端72發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;將所述業務資料結構中的所述翻譯結果發送給所述客戶端72。
所述客戶端72,還可以用於接收所述伺服器71發送的所述業務資料結構中的所述翻譯結果並進行顯示。
本發明實施例提供的一種語言識別系統,首先伺服器接收客戶端發送的用戶輸入的業務資料結構資訊;然後從所述業務資料結構資訊中獲取文法規則;當接收到客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中。與目前需要用戶自己定義文法規則相比,本發明可以透過用戶輸入的業務資料結構資訊中獲取文法規則,以便透過該文法規則對輸入的語句資訊進行翻譯,無需用戶自 己抽象出語言的文法規則,減輕了用戶學習負擔,簡化了語言識別的過程,便於用戶操作。另外,與目前需要透過人工方式將翻譯後的結果存入業務資料結構的過程相比,本發明透過從業務資料結構資訊中獲取的文法規則進行翻譯,翻譯後存入結果的資料結構正是需要存入的業務資料結構,可以實現自動將翻譯後的結果存入業務資料結構的過程,可以提高語言識別的處理效率。
本申請還提供了一種計算機程式產品,當在資料處理設備上執行時,適於執行初始化有如下方法步驟的程式代碼:接收客戶端發送的業務資料結構資訊;從所述業務資料結構資訊中獲取文法規則;當接收到所述客戶端發送的待識別語句資訊時,透過所述文法規則對所述待識別語句資訊進行翻譯並將翻譯結果儲存至業務資料結構中;將所述業務資料結構中的所述翻譯結果發送給所述客戶端,以使得所述客戶端對所述翻譯結果進行顯示。
本領域內的技術人員應明白,本申請的實施例可提供為方法、系統、或計算機程式產品。因此,本申請可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本申請可採用在一個或多個其中包含有計算機可用程式代碼的計算機可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的計算機程式產品的形式。
本申請是參照根據本申請實施例的圖表中圖形的顯示方法、裝置、和計算機程式產品的流程圖和/或方框圖來 描述的。應理解可由計算機程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程式指令到通用計算機、專用計算機、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得透過計算機或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程式指令也可儲存在能引導計算機或其他可編程資料處理設備以特定方式工作的電腦可讀取記憶體中,使得儲存在該電腦可讀取記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程式指令也可裝載到計算機或其他可編程資料處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。
儲存器可能包括電腦可讀取媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非揮發性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀取媒體的示例。
電腦可讀取媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可編程唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒體,可用於儲存可以被計算設備訪問的資訊。按照本文中的界定,電腦可讀取媒體不包括暫存電腦可讀媒體(transitory media),如調製的資料信號和載波。
以上僅為本申請的實施例而已,並不用於限制本申請。對於本領域技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內所作的任何修改、等同替換、改進等,均應包含在本申請的申請專利範圍之範圍之內。

Claims (19)

  1. 一種語言識別方法,其特徵在於,包括:於伺服器接收客戶端發送的使用程式語言定義的業務資料結構,所述業務資料結構包括一或更多資料類型;該伺服器根據該業務資料結構中的所述一或更多資料類型獲取文法規則;該伺服器檢測所述文法規則是否包含一或更多錯誤;該伺服器藉由根據所述一或更多錯誤變換所述文法規則的內部排序,以產生調整的文法規則;伺服器接收到該客戶端發送的語句資訊;透過該調整的文法規則對該語句資訊進行翻譯;該伺服器將翻譯結果儲存至該業務資料結構中;及該伺服器將該業務資料結構中的該翻譯結果發送給該客戶端。
  2. 根據請求項1所述的語言識別方法,其中,所述獲取文法規則包括獲取四部分文法規則,該四部分文法規則包含起始符、終結符、非終結符以及推導規則。
  3. 根據請求項1所述的語言識別方法,其中,所述獲取文法規則包含根據所述業務資料結構的內容分析,從所述業務資料結構映射得到該文法規則。
  4. 根據請求項1所述的語言識別方法,其中,所述接收語句資訊包含接收該客戶端的用戶所輸入的字母序列。
  5. 根據請求項1所述的語言識別方法,其中,接收 所述業務資料結構包含接收該業務資料結構,其中包含對應於該業務資料結構的資料類型的自解釋資訊,所述自解釋資訊包含該資料結構的注解。
  6. 根據請求項5所述的語言識別方法,更包含:該伺服器根據該自解釋資訊,獲取資料類型資訊。
  7. 根據請求項6所述的語言識別方法,其中,所述獲取文法規則包含該伺服器透過該資料類型資訊生成該文法規則。
  8. 根據請求項7所述的語言識別方法,其中,所述透過該資料類型資訊生成文法規則包括:該伺服器根據該資料類型資訊對應的屬性資訊,確定與該文法規則對應的起始符、終結符、非終結符;該伺服器透過在該業務資料結構中的類與類之間的包含關係,確定與該文法規則對應的推導規則;及該伺服器透過該起始符、該終結符、該非終結符以及該推導規則,生成該文法規則。
  9. 根據請求項1所述的語言識別方法,該方法還包括:該伺服器將與該文法規則對應的第一文法格式轉化為第二文法格式,該第二文法格式包含預設語言識別工具支持的文法格式;及該伺服器使用該第二文法格式,以生成該文法規則。
  10. 一種語言識別裝置,包括:處理器;及 儲存媒體,用以儲存程式邏輯於其上,以為該處理器所執行,該儲存的程式邏輯包含:為該處理器所執行之接收邏輯,用於接收客戶端發送的使用程式語言定義的業務資料結構,該業務資料結構包含一或更多資料類型;為該處理器所執行的獲取邏輯,用於根據該業務資料結構的所述一或更多資料類型獲取文法規則;為該處理器所執行的檢測邏輯,用於檢測該文法規則是否包含一或更多錯誤;為該處理器所執行的產生邏輯,用於藉由根據所述一或更多錯誤變換所述文法規則的內部排序,以產生調整的文法規則;為該處理器所執行的接收邏輯,用於接收該客戶端發送的語句資訊;為該處理器所執行的翻譯邏輯,用於透過該調整的文法規則對該語句資訊進行翻譯;為該處理器所執行的儲存邏輯,用於將翻譯結果儲存至該業務資料結構中;及為該處理器所執行的發送邏輯,用於將該業務資料結構中的該翻譯結果發送給該客戶端。
  11. 根據請求項10所述的語言識別裝置,其中該用於獲取文法規則的獲取邏輯包含為該處理器所執行的獲取邏輯,用以獲取四部分文法規則,該四部分文法規則包含起始符、終結符、非終結符以及推導規則。
  12. 根據請求項10所述的語言識別裝置,其中,該用於獲取文法規則的獲取邏輯包含為該處理器所執行的映射邏輯,用於根據所述業務資料結構的內容分析,從所述業務資料結構映射得到該文法規則。
  13. 根據請求項10所述的語言識別裝置,其中,所述用於接收語句資訊的接收邏輯包含為該處理器所執行的接收邏輯,用於接收該客戶端的用戶所輸入的字母序列。
  14. 根據請求項10所述的語言識別裝置,其中,所述用於接收該業務資料結構的接收邏輯包含為該處理器所執行的接收邏輯,用於接收包含與該業務資料結構對應的資料類型的自解釋資訊的業務資料結構,該自解釋資訊包含該資料結構的注解。
  15. 根據請求項14所述的語言識別裝置,其中所儲存的程式邏輯更包含為該處理器所執行的獲取邏輯,用於根據該自解釋資訊,獲取資料類型資訊。
  16. 根據請求項15所述的語言識別裝置,其中所述用於獲取文法規則的獲取邏輯包含為該處理器所執行的生成邏輯,用於透過該資料類型資訊生成該文法規則。
  17. 根據請求項16所述的語言識別裝置,其中,所述透過該資料類型資訊生成該文法規則的生成邏輯包含:為該處理器所執行的確定邏輯,用於根據與該資料類型資訊對應的屬性資訊,確定與該文法規則對應的起始符、終結符、非終結符;為該處理器所執行的確定邏輯,用於透過在該業務資 料結構中的類與類之間的包含關係,確定與該文法規則對應的推導規則;及為該處理器所執行的生成邏輯,用於透過該起始符、該終結符、該非終結符以及該推導規則,生成該文法規則。
  18. 根據請求項10所述的語言識別裝置,其中,透過該文法規則對該語句資訊進行翻譯的該翻譯邏輯還包括:為該處理器所執行的生成邏輯,用於根據該文法規則生成翻譯器;為該處理器所執行的翻譯邏輯,用於透過該翻譯器對該語句資訊進行翻譯。
  19. 根據請求項10所述的語言識別裝置,其中,該儲存程式邏輯還包括:為該處理器所執行的轉化邏輯,用於將與該文法規則對應的第一文法格式轉化為第二文法格式,該第二文法格式包含預設語言識別工具支持的文法格式;及為該處理器所執行的使用邏輯,用於使用該第二文法格式,以生成該文法規則。
TW106105361A 2016-03-25 2017-02-17 語言識別方法及裝置 TWI713015B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610179961.2A CN107229616B (zh) 2016-03-25 2016-03-25 语言识别方法、装置及系统
CN201610179961.2 2016-03-25

Publications (2)

Publication Number Publication Date
TW201737241A TW201737241A (zh) 2017-10-16
TWI713015B true TWI713015B (zh) 2020-12-11

Family

ID=59899371

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106105361A TWI713015B (zh) 2016-03-25 2017-02-17 語言識別方法及裝置

Country Status (7)

Country Link
US (1) US10755055B2 (zh)
EP (1) EP3435227A4 (zh)
JP (1) JP2019512776A (zh)
KR (1) KR20180126479A (zh)
CN (1) CN107229616B (zh)
TW (1) TWI713015B (zh)
WO (1) WO2017162082A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427671B (zh) * 2018-01-25 2021-06-25 腾讯科技(深圳)有限公司 信息转换方法和装置、存储介质及电子装置
CN108021559B (zh) * 2018-02-05 2022-05-03 威盛电子股份有限公司 自然语言理解系统以及语意分析方法
US20230161975A1 (en) * 2018-05-04 2023-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for enriching entities with alternative texts in multiple languages
CN108984536A (zh) * 2018-07-02 2018-12-11 北京分音塔科技有限公司 店铺识别翻译机、方法、装置及存储介质
US11393463B2 (en) * 2019-04-19 2022-07-19 Soundhound, Inc. System and method for controlling an application using natural language communication
CN113160827A (zh) * 2021-04-07 2021-07-23 深圳鱼亮科技有限公司 一种基于多语言模型的语音转写系统及方法
WO2024148612A1 (zh) * 2023-01-13 2024-07-18 华为技术有限公司 一种翻译器生成方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629213A (zh) * 2012-02-21 2012-08-08 北京经纬恒润科技有限公司 一种c语言仿真模型的剖析及监控方法
CN103092669A (zh) * 2011-11-01 2013-05-08 镇江华扬信息科技有限公司 一种基于Java的CUP构造编译器的实现方法
US20150160934A1 (en) * 2013-12-06 2015-06-11 Ab Initio Technology Llc Source code translation

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63305463A (ja) 1987-06-05 1988-12-13 Hitachi Ltd 自然言語処理方式
JPH02165378A (ja) 1988-12-20 1990-06-26 Csk Corp 機械翻訳システム
US20020032564A1 (en) 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
US6681383B1 (en) * 2000-04-04 2004-01-20 Sosy, Inc. Automatic software production system
US6957184B2 (en) * 2000-07-20 2005-10-18 Microsoft Corporation Context free grammar engine for speech recognition system
EP1352316A2 (en) 2000-12-01 2003-10-15 The Trustees Of Columbia University In The City Of New York A method and system for voice activating web pages
US6973429B2 (en) 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
JP2003006255A (ja) * 2001-06-22 2003-01-10 Fujitsu Ltd Hdl自動修正装置およびhdl自動修正プログラム並びに同プログラムを記録したコンピュータ読取可能な記録媒体
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US7185276B2 (en) 2001-08-09 2007-02-27 Voxera Corporation System and method for dynamically translating HTML to VoiceXML intelligently
US7010779B2 (en) * 2001-08-16 2006-03-07 Knowledge Dynamics, Inc. Parser, code generator, and data calculation and transformation engine for spreadsheet calculations
US7080004B2 (en) 2001-12-05 2006-07-18 Microsoft Corporation Grammar authoring system
US7529658B2 (en) 2002-07-26 2009-05-05 Sankhya Technologies Private Limited Method for specifying equivalence of language grammars and automatically translating sentences in one language to sentences in another language in a computer environment
US7302383B2 (en) * 2002-09-12 2007-11-27 Luis Calixto Valles Apparatus and methods for developing conversational applications
US20050091424A1 (en) * 2003-10-24 2005-04-28 Snover Jeffrey P. Mechanism for analyzing partially unresolved input
GB2407657B (en) 2003-10-30 2006-08-23 Vox Generation Ltd Automated grammar generator (AGG)
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US8397157B2 (en) 2006-10-20 2013-03-12 Adobe Systems Incorporated Context-free grammar
CN101201750B (zh) * 2006-12-13 2010-09-08 西安大唐电信有限公司 利用语法词法分析工具为编解码提供数据的方法
US8041697B2 (en) 2007-08-31 2011-10-18 Microsoft Corporation Semi-automatic example-based induction of semantic translation rules to support natural language search
IL186505A0 (en) * 2007-10-08 2008-01-20 Excelang Ltd Grammar checker
CN101446895B (zh) * 2008-12-18 2011-03-23 浙江大学 基于语法重构的代码级构件组装方法
US20100332217A1 (en) * 2009-06-29 2010-12-30 Shalom Wintner Method for text improvement via linguistic abstractions
EP2454661A1 (en) * 2009-07-15 2012-05-23 Proviciel - Mlstate System and method for creating a parser generator and associated computer program
US9002700B2 (en) * 2010-05-13 2015-04-07 Grammarly, Inc. Systems and methods for advanced grammar checking
US8543374B2 (en) 2010-08-12 2013-09-24 Xerox Corporation Translation system combining hierarchical and phrase-based models
US9292271B2 (en) 2013-05-24 2016-03-22 Medidata Solutions, Inc. Apparatus and method for managing software translation
US20150057994A1 (en) * 2013-08-20 2015-02-26 Eric Hong Fang Unified Mobile Learning Platform
CN104252510A (zh) * 2013-11-05 2014-12-31 深圳市华傲数据技术有限公司 一种sql语言翻译方法和装置
US10176256B1 (en) * 2013-12-23 2019-01-08 BroadbandTV, Corp Title rating and improvement process and system
US9535904B2 (en) 2014-03-26 2017-01-03 Microsoft Technology Licensing, Llc Temporal translation grammar for language translation
CN104899147B (zh) * 2015-06-19 2017-11-28 北京理工大学 一种面向安全检查的代码静态分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092669A (zh) * 2011-11-01 2013-05-08 镇江华扬信息科技有限公司 一种基于Java的CUP构造编译器的实现方法
CN102629213A (zh) * 2012-02-21 2012-08-08 北京经纬恒润科技有限公司 一种c语言仿真模型的剖析及监控方法
US20150160934A1 (en) * 2013-12-06 2015-06-11 Ab Initio Technology Llc Source code translation

Also Published As

Publication number Publication date
WO2017162082A1 (zh) 2017-09-28
EP3435227A4 (en) 2019-11-06
US20190065479A1 (en) 2019-02-28
CN107229616A (zh) 2017-10-03
CN107229616B (zh) 2020-10-16
US10755055B2 (en) 2020-08-25
KR20180126479A (ko) 2018-11-27
EP3435227A1 (en) 2019-01-30
JP2019512776A (ja) 2019-05-16
TW201737241A (zh) 2017-10-16

Similar Documents

Publication Publication Date Title
TWI713015B (zh) 語言識別方法及裝置
CN105760534B (zh) 自定义的可序列化的数据结构、hadoop集群、服务器及其应用方法
CN106970820B (zh) 代码存储方法及代码存储装置
CN111159220B (zh) 用于输出结构化查询语句的方法和装置
CN110554875B (zh) 代码转换方法及装置、电子设备、存储介质
CN108595171B (zh) 对象的模型生成方法、装置、设备及存储介质
CN107943691A (zh) 一种自动产生智能合约的功能测试页面的方法及装置
CN111581920A (zh) 文档转换方法、装置、设备及计算机存储介质
US10678514B2 (en) Method and device for generating code assistance information
CN110941655A (zh) 一种数据格式转换方法及装置
CN112420145A (zh) 电子病历文书数据处理方法、装置及计算机可读存储介质
CN116028028B (zh) 请求函数生成方法、装置、设备及存储介质
CN114153459A (zh) 接口文档生成方法及装置
CN106776779B (zh) 基于Mac平台的JSON数据生成实体文件的方法
CN112582073B (zh) 医疗信息获取方法、装置、电子设备和介质
WO2016131295A1 (zh) 一种北向数据转换方法和装置
CN111125154A (zh) 用于输出结构化查询语句的方法和装置
CN114090619B (zh) 自然语言的查询处理方法及装置
WO2020162985A1 (en) Knowledge-driven digital companion
Kochedykov et al. Conversing with databases: Practical Natural Language Querying
Osis et al. Using Use Cases for Domain Modeling.
WO2024199450A1 (zh) 车辆控制方法、装置、设备及存储介质
CN110837896B (zh) 机器学习模型的存储和调用方法、装置
CN110162307B (zh) 一种将json文件转换为dll文件的方法及装置
US20230334069A1 (en) Cross-platform content management

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees