TWI417747B - 增強多國語言資料查詢 - Google Patents

增強多國語言資料查詢 Download PDF

Info

Publication number
TWI417747B
TWI417747B TW096113117A TW96113117A TWI417747B TW I417747 B TWI417747 B TW I417747B TW 096113117 A TW096113117 A TW 096113117A TW 96113117 A TW96113117 A TW 96113117A TW I417747 B TWI417747 B TW I417747B
Authority
TW
Taiwan
Prior art keywords
word
language
components
component
service component
Prior art date
Application number
TW096113117A
Other languages
English (en)
Other versions
TW200813755A (en
Inventor
Bruce E Peoples
Michael R Johnson
Original Assignee
Raytheon Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Raytheon Co filed Critical Raytheon Co
Publication of TW200813755A publication Critical patent/TW200813755A/zh
Application granted granted Critical
Publication of TWI417747B publication Critical patent/TWI417747B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

增強多國語言資料查詢 相關申請案
本案主張2006年4月19日所申請之案名為「多國語言查詢」暫時案序號60/745,144之優先權,其整體地併入此處。本案亦有關於同日所申請之「多國語言資料查詢」,發明人為Michael Johnson以及Bruce Peoples,而代理人目錄號碼則為RTN-288AUS,亦主張暫時案序號60/745,144之優先權,其整體地併入此處。
本發明係有關於查詢資料庫,且更特別關於橫跨多個語言來查詢資料庫。
由於以來源語言的字可能具有不同的涵義,將一字從來源語言翻譯至目標語言可能不導致從該來源語言之字至該目標語言之已翻譯字的一對一的對應關係。舉例而言,字詞「mole」可能意謂胎塊、地底中的動物、或間諜。在某些例子中,以該來源語言的字可能不具有以該目標語言的涵義。這些種類的情況使得,對於具有目標語言淺薄知識的使用者而言,在資料庫中搜尋多個語言的資訊是困難的。
在一態樣中,本發明係為用於多國語言資料查詢之方法。該方法包括:接收針對一查詢的一請求。該查詢包括以一來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋。該方法更包括:將該請求應用至數個因子、基於該些因子選擇數個組件、以及基於該選擇執行該查詢。
在另一態樣中,本發明係為用於多國語言資料查詢之裝置。該裝置包括:用於接收針對一查詢的一請求之電路。該查詢包括以一來源語言的一基礎字,該基礎字用於以一目標語言的的一資料庫搜尋。該裝置包括用於將該請求應用至數個因子、基於該些因子選擇數個組件、以及基於該選擇之電路執行該查詢之額外電路。
在又一態樣中,本發明係為包括一機器可讀取媒體之物件,該機器可讀取媒體儲存有用於多國語言資料查詢的可執行指令。該些可執行指令致使一機器接收針對一查詢的一請求。該查詢包括以一來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋。該些指令更包含致使一機器進行:將該請求應用至數個因子、基於該些因子選擇數個組件、以及基於該選擇執行該查詢之指令。
在又另一態樣中,本發明係為用於多國語言資料查詢的系統。該系統包括:一使用者介面,其組態以接收一查詢。該查詢包括以來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋。該系統亦包括:一組核心企業服務組件、一組多國語言服務組件、以及一處理流程管理器,其組態以接收來自該使用者介面的該查詢,以及基於一組因子選擇來自該組核心企業服務組件與該組多國語言服務組件的數個組件,以處理該查詢。
參考第1圖,語義反向查詢延伸(SRQE)系統包括:SRQE處理器、使用者介面14、字本體系統20、索引資料庫22和轉譯器24,其中處理器介面14具有(例如)滑鼠16、鍵盤17、和顯示器18(例如,監視器、螢幕等等)。SRQE處理器12可為電腦或多個電腦。
字本體系統20提供一基礎字(例如,由使用者所選擇以及用於從索引資料庫22之資料檢索的基礎字)的字本體,其包括提供基礎字的(例如)同義詞、同音詞、上位詞、和下位詞。同義詞係為與該基礎字相同或等義的字詞。例如,字詞「spectacles(眼鏡)」係為「eyeglasses(眼鏡)」的同義詞。同音詞係為具有與該基礎字相同發音或拼音的字詞。舉例而言,「bow」意謂彎曲,或「bow」意謂蝴蝶結。上位詞係為較該基礎字更上位或更廣的字詞。例如,「munition(軍火)」是「bomb(炸彈)」的上位詞。下位詞係為較該基礎字更明確的字詞。例如,「car(車)」是「vehicle(交通工具)」的下位詞。字本體系統20的例子之一係為WordNet English Language Ontology(普林斯頓大學,普林斯頓,紐澤西州)。
索引資料庫22可使用各種技術來集結,其中技術之一係在第4圖中例示。在一範例中,索引資料庫22具有一名稱,藉由該名稱可被應用程式所參照,並可利用標準結構化查詢語言(SQL)敘述來控制。索引資料庫的範例之一係為ORACLE 10g資料庫(Oracle公司,紅木海岸,加州),其具有文字索引(例如,ORACLE文字索引)。文字索引係為資料庫領域索引,且可用於產生查詢應用程式。例如,可產生CONTEXT類型的已產生Oracle文字索引,並以SQL CONTAINS運算元藉由SRQE 10來查詢。一索引從已集結的文字表格產生,且係為與儲存在資料庫表格中的文件相關或參照儲存在資料庫表格中的文件之符記的索引。在查詢應用程式中,索引係為該查詢正在實行者。該索引包含待被搜尋的符記以及該文字儲存在索引資料庫22中所處之指標。在一範例中,該文字可為文件之集合體。在一範例中,該文字可為小型文字區段。
轉譯器24可為一翻譯系統或是一系列翻譯系統。在一範例中,轉譯器24係為機器翻譯系統,其將來源語言的字翻譯至目標語言的字,而不需人工介入。
參考第2圖和第3A至3D圖,用於實施反向查詢延伸的範例處理係為處理30。處理30提出一初始樣型(32)。例如,SRQE處理器12在顯示器18上提出樣型100。樣型100包括部分詞類(POS)核取方塊102(例如,名詞核取方塊102a、動詞核取方塊102b、和形容詞核取方塊102c)。樣型100亦包括文字方塊104,用於指示待被檢索的基礎字(例如,由使用者所選擇的字);以及選擇鈕106(標示為「字義sense」),用於傳送一請求至SRQE處理器12。
處理30接收部分詞類資料(36)。例如,使用者藉由在核取方塊102間移動滑鼠16並點選滑鼠,選擇所欲之POS核取方塊102。使用者使用鍵盤17在文字方塊104中輸入基礎字。該使用者藉由在該選擇鈕16間點選滑鼠16而執行請求。
處理30產生字義(42)。例如,在第3A圖,使用者藉由點選名詞核取方塊102a來選擇名詞字義,並藉由點選動詞核取方塊102b來選擇動詞字義,以及在文字方塊104中鍵入字詞「spy」作為基礎字。SRQE處理器12產生該字詞「spy」針對名詞的字義和針對動詞的字義。字義代表基於POS之字詞的意義。「spy」的動詞字義,例如,「catch sight of(看見)」、「watch,observe or inquire secretly(暗中監視、觀察或詢問)」、以及「secretly collect sensitive or classified information,engage in espionage(暗中收集機密性、保密性資訊,進行間諜活動)」。在一範例中,SRQE處理器12存取字本體系統20,以決定字義。在其他範例中,字義資料可儲存在SRQE處理器12之記憶體(圖未示)中。
處理30產生基礎字的字本體(46)。例如,SRQE系統12存取字本體系統20、產生代表基礎字之字本體的一組字。例如,該組字可包括同義詞、同音詞、上位詞、和下位詞。
處理30提出字義選擇和代表基礎字之字本體的一組字(48)。例如,在第3B圖,SRQE處理器12提出一樣型120。樣型120包括字義部分122以及字本體部分124。
例如,字義部分122包括對於由使用者所選擇之基礎字並對應於由使用者所選擇的詞類之動詞和名詞部分的動詞字義部分122a和名詞字義部分122b。在另一範例中,字本體部分124包括對應於由使用者所選擇之詞類的動詞和名詞部分的動詞部分124a和名詞部分124b。在其他範例中,假如使用者已選擇詞類的形容詞部份,字義部分可包括形容詞字義部分(圖未示),且字本體部份可包括形容詞部分(圖未示)。儘管第3B圖僅包括字本體部分124的上位詞(例如),可包括從代表字本體的該組字之其他字詞。
動詞部分124a和名詞部分12b包括核取方塊126(例如,核取方塊126a、核取方塊126b、核取方塊126c、核取方塊126d、以及核取方塊126e),以允許使用者從基礎字的字本體選擇該使用者所關注之字詞。
處理30從代表基礎字之字本體的該組字接收由使用者所選擇的字(52)。例如,使用者使用滑鼠16來選擇核取方塊126,其係由SRQE處理器12所接收。
處理30提出目標語言樣型130,以選擇來源語言和目標語言(56)。例如,在第3C圖,SRQE處理器12在顯示器18上提出目標語言樣型130。目標語言樣型130包括語言對部分132,其包括語言對核取方塊(例如,英文對中文核取方塊133);字本體選擇部分134,其反映來自該基礎字之字本體由使用者所選擇的字詞;以及執行鈕136(標示為「translate」)。在語言對部分132中,第一語言係為來源語言,且第二語言係為目標語言。例如,核取方塊133表示從作為來源語言之英文(EN)翻譯至作為目標語言之中文(CN)。
處理30接收目標語言選擇(62)。例如,使用者在語言對部分132中藉由核取方塊間點選滑鼠來選擇所欲之語言對,以及利用滑鼠藉由點選執行鈕來傳送該請求至SRQE處理器12。在第3C圖,已選擇英文對中文核取方塊133b。
處理30產生字詞翻譯(66)。例如,SRQE處理器12存取轉譯器24,並將該基礎字(例如,spy)翻譯至目標語言(例如,中文字/字元)。再者,轉譯器24亦將已翻譯字(例如,中文字/字元)翻譯回至來源語言(英文)。在一範例中,轉譯器24可包括一翻譯系統,其將該字詞翻譯至目標語言,以及一第二翻譯系統,其將該字詞翻譯回至來源語言。
處理30提出字詞翻譯(72)。例如,在第3D圖,SRQE處理器12在顯示器18上提出翻譯樣型140。翻譯樣型140包括由使用者所選擇之數列字詞、代表已翻譯至目標語言之字本體的已翻譯欄144、代表已翻譯回至來源語言的已翻譯字的反向來源欄146、和送出核取方塊欄148。樣型140亦包括「全部核取」鈕,當由使用者利用滑鼠16點選時,其核取在送出核取方塊欄148中的所有方塊;以及「全部不核取」鈕,當由使用者利用滑鼠16點選時,其不核取在送出核取方塊欄148中的所有方塊。翻譯樣型140更包括執行鈕160。
處理30接收用於查詢的使用者選取字(76)。例如,使用者將檢視反向來源欄144,以決定在使用者的搜尋中該已翻譯字是否是有意義的。假如在搜尋中已翻譯字是有意義的,使用者將核取在核取方塊欄148中的適當核取方塊,以及使用滑鼠16點選該執行鈕160。
處理30提出結果(78)。例如,SRQE處理器12使用該使用者選定之已翻譯字以及針對該資料查詢索引資料庫22。在一範例中,該結果將返回至藉由該轉譯器24所翻譯至來源語言的目標語言。在另一範例中,另一轉譯器(圖未示)在傳送至SRQE處理器12之前,可將該結果從目標語言翻譯至來源語言。
參考第4圖,SRQE系統10可被實施至多國語言查詢系統中。在一範例中,以英文作為來源語言用於搜尋阿拉伯文和中文資料之多國語言系統400,包括SRQE系統10,其包括索引資料庫22。多國語言系統400亦可包括資料儲存庫420(例如,網際網路、線上廣播資料儲存庫、有線廣播資料儲存庫、文件、及等等)、轉碼器422、過濾器424、路由器426、分段器428、分析器/字彙分析器430(例如,英文字彙分析器430a、中文字彙分析器430b、阿拉伯文字彙分析器430c)、形態分析器434(其耦合至例如阿拉伯文字彙分析器430c)。
索引資料庫22係藉由從資料儲存庫420擷取資料、使用轉碼器422來轉碼已擷取的資料、和使用過濾器424來過濾已轉碼資料而集結。轉碼器422將已接收的資料轉換為單一格式。在一範例中,轉碼器422將電子文字資料從一格式轉換至另一格式。例如,轉碼器將阿拉伯文的電子文字資料從編碼格式(例如,ASMO 449、CODAR-U、ISO 8859-6、Windows 1256或是Arabic-MAC)轉換至UTF-8格式。
路由器426決定已過濾資料是否可被分段。可被分段的已過濾資料(例如,標示資料和超文件標示語言HTML之資料、及等等)藉由分段器428來分段。
分段資料和未分段資料被路由至資料庫並儲存在資料庫表格中。為了要產生索引,基於文件組合的語言來選擇適當的字彙分析器(例如,英文資料至英文字彙分析器430a,中文資料至中文字彙分析器430b,及阿拉伯文資料至阿拉伯文字彙分析器430c)。字彙分析器430將已接收的資料分離為符記(token)。例如,針對各個字母或各個圖形符(例如,中文符號、阿拉伯文符號,及等等)使用一符記。在其他範例中,針對各個字使用符記。字彙分析器430利用符記集結該索引。索引係儲存在資料庫中,其產生索引資料庫22。阿拉伯文430c使用阿拉伯文形態分析器434,例如Morfix。形態分析器434識別已接收的阿拉伯文字元的字根。在一範例中,針對各個語言使用一字彙分析器(例如,字彙分析器430c)。在另一範例中,針對各個語言使用形態分析器並結合字彙分析器。
索引產生處理亦利用字列表資料440和標點列表資料450。例如,字列表資料440包括用於詞根化分析和索引處理的字典。例如,英文字「running」可與英文字「run」相關聯。「run」是「running」字根化分析的結果。在一範例中,字列表資料440可為一組資料庫,各個資料庫代表以一語言的字和不同形式的字。例如,一字列表資料庫可包括英文字的字典和其使用字首的修改形式,例如「soak」和「presoak」。其他字列表資料庫可包含英文字和其使用字尾的修改形式,例如「eat」和「eating」。標點列表資料450包括語言字元,其描述句子及/或字詞之間,以在索引化處理中忽略。例如,英文中的句點或驚嘆號將結束一句子,且對於該索引不具有用處。句點或驚嘆號將不被包括在字彙分析器的符記化處理。另一範例包括冠詞,例如:「a」、「an」、「the」。冠詞在索引中不具有用處。標點列表資料450可包括一組標點列表資料庫。例如,各個標點列表資料庫可被用於代表一組字或符號,以在索引產生處理中忽略。
在一範例中,字彙分析器(例如,字彙分析器430c)、形態分析器434、字列表440、和標點列表450,可在產生該索引中用於將以目標語言之文件的文字資料符記化。例如,在從資料庫表格中的文件產生索引中,文字資料的內容藉由標點列表450而被適當放置,以移除無用的字,例如冠詞。形態分析器434係以字列表440共同地作業,字詞係由字彙分析器處理而被轉換成字根,以成為集結該索引的符記。
參考第5圖,語義反向查詢延伸系統10可在多國語言企業管理系統(MEMS)500中實施。MEMS 500包括處理流程管理器510、多國語言服務組件512、核心企業服務(CES)組件515、以及藉由通訊網路518耦合一起的使用者516,例如:使用者516a(飛機中)、使用者516b(船上)、使用者516c(使用個人資料助理PDA裝置)、使用者516d(在戰車上)、使用者516e(例如,在該領域的經紀人)、和使用者516f(例如:辦公室中的分析師)。處理流程管理器510藉由管理處理30而致能使用者516初始化、執行、和接收增加查詢。
多國語言服務組件512包括一組字彙分析器532、一組轉碼器534、一組轉譯器536、一組形態分析器538、字列表545、一組校正器544、光學字元辨識裝置(OCR)546、和其他形態服務548。
在一範例中,該組校正器544將校正文件中的錯誤,例如:文法、拼字、和大寫錯誤。在另一範例中,該組校正器將來自複雜語言的文字類型正規化,用於索引產生、查詢、和翻譯。例如,阿拉伯文包括數個子語言。該組校正器544用於將阿拉伯子語言轉換至主流形式的阿拉伯文,例如,可使用來自該組轉譯器的相對應轉譯器之形式。通常係在由一機器轉譯器的索引產生、查詢、和翻譯之前使用該組校正器544,以減低錯誤。
其他形態服務548可包括字彙分析器、素材、分類、字典、標點列表、轉譯器、語言識別器、部分詞類識別器、字義清楚器、擷取器、標籤器、知識基礎、代理器、詞類(口語字)處理器、視覺處理器、索引器、語域分析、語義解譯器、和各種類型的語言本體結構。
CES組件514包括企業服務管理(ESM)組件552、探索服務組件554、送訊服務組件556、合作服務組件558、仲裁服務組件560、儲存服務組件562、安全服務組件564、應用服務組件556、和使用者輔助組件568。CES組件514可用於提供針對於處理流程管理器510的支援功能。
在一範例中,ESM組件552包括致能MEMS 500的使用壽命管理之服務、支援選擇性地管理MEMS 500中資訊流程所需的活動之性能之服務,上述活動包括服務機構的品質之監控、管理、和強化。ESM組件552可提供端點對端點企業性能監控、組態管理、事件關聯問題偵測/解析,以及企業資源會計和稱謂(例如,針對使用者、系統、裝置)。ESM組件552亦可提供用於企業和支援通訊設備的整合式經營基礎建設管理能力。ESM組件552提供自動或手動使用者帳戶和動態設定檔管理能力。在一範例中,ESM組件552包括ESM軟體分配服務(圖未示),其驗證待被用於MEMS 500中的軟體或使用說明,其在MEMS 500中使用之前已從已授權來源獲得。
在一範例中,探索服務組件554包括一些活動,其通常係藉由元資料及/或本體描述的使用,允許資訊內容或其他服務的探索。元資料和本體描述係為資料資產(例如,檔案、資料庫、服務、目錄、網頁、樣型、及等等)的描述。元資料和本體描述係儲存在儲存庫(圖未示)中或由儲存庫所產生,舉例而言該儲存庫例如註冊表、目錄、登錄。在一範例中,探索服務組件554可包括搜尋引擎,用以查詢元資料註冊表。在一範例中,處理流程管理器510可與探索服務組件554相互作用。例如,處理流程管理器510可能需要使用探索服務組件554,以尋找特定多國語言服務組件512,以供在處理600中使用。探索服務組件亦可與其他服務組件相互作用。例如,探索服務組件554係與儲存服務組件562和安全服務組件564相互作用,用以當被探索到時,提供對資料、元資料和本體資產之存取。
在一範例中,送訊服務組件556支援同步和非同步資訊交換。送訊服務組件556交換使用者以及企業基礎建設上的應用之間的資訊(例如,email、傳真、訊息導向中間軟體、無線服務、警示服務、及等等)。在一範例中,訊息服務組件55提供技術服務,以從WordNet English Language Ontology(普林斯頓大學,普林斯頓,紐澤西州)發送、傳送和接收(例如)本體字資料。送訊服務組件556可提供處理流程管理器510,在使用者或使用於處理600中的應用之間交換資訊的能力。
在一範例中,合作服務組件558致使個人和團體以非同步(email、討論區、及等等)和同步(聊天、即時送訊、及等等)設定而一起通訊和工作。合作服務五件558用於處理600中之所有合作工作地點和合作會議之產生和管理。合作服務的工作流程係由處理流程管理器500所管理。合作服務組件558包括個別和相關應用程式及/或服務,其有助於在合作工作場所中之同步及非同步合作活動。
在一範例中,仲裁服務組件560提供致使轉換處理例如資料或服務之翻譯、聚集、和整合之能力,致使出席和職位支援:例如資料或服務的關聯和融合,及致使協商:例如資料或服務的掮客或交易。仲裁服務可提供用於映射交換格式的機構,以增加藉由常用方法交換資訊的能力。在一範例中,仲裁服務組件560包括用於點對點通訊的配接器服務。仲裁服務組件560可與處理流程管理器510交互作用。例如,仲裁服務組件560允許使用適當轉碼器534,以將編碼格式作轉換。
在一範例中,儲存服務組件562將實體和虛擬位置提供給網路上之主機資料或元資料。儲存服務組件562隨著持續時間的變動等級(例如:檔案記錄)而提供經要求的資料或元資料之宣告、儲存和擷取。儲存服務組件562亦提供操作和內容籌劃之持續的準備,例如:組織和配置能力以及資料和元資料的處理。在一範例中,儲存服務組件562可包括處理600交易(係由處理流程管理器510所管理)之檔案記錄。儲存服務組件562可提供合作服務組件558由不同組成的電腦達成針對關注群體(COI)之可獲得和可共享的資訊,從單一邏輯資料影像、任意處、任意時間,與中央儲存管理一致。
在一範例中,安全服務組件564致使MEMS系統500之保護、安全、健全、和持續,以及MEMS 500的資訊儲存、處理、維持、使用、共享、散佈、配置、顯示、傳送。此包括有關使用者、特定內容、和網路之個人資訊,其標示資訊環境,例如SEQE系統10。安全服務組件564藉由合併保護、偵測和反應能力而允許資訊系統之復原。在一範例中,安全服務組件564保護已傳送訊息之認證。安全服務組件564可與處理流程管理器510相互作用,以確保在處理600中(例如,當接收請求602時)安全的環境。
在一範例中,應用服務組件566包括提供、主持、操作、管理和維持保護網路運算基礎建設之服務。應用服務組件566易提供使用者或企業在網際網路上對應用程式或相關服務(其必須位於其所握有的個人電腦或企業電腦中)之存取。在一範例中,應用服務組件566係為分配機構,其提供企業系統監控和提供載入平衡功能所需的應用程式。與處理流程管理器510共同地作業,應用服務組件566實施應用程式的選擇、尺寸調整、和載入,其可操作SRQE系統10,或用於管理多國語言服務組件512(例如,字彙分析器532、轉碼器534、轉譯器536、形態分析器538、字列表542、校正器544、OCR 546、及等等)。
在一範例中,使用者輔助服務組件568提供自動化能力,其學習和應用使用者偏好和互動樣型。此資訊可由處理流程管理器510所使用,以輔助使用者生效地及有效地利用工作效能之資源。在一範例中,使用者輔助服務組件568提供自動化幫手服務,其減低執行人力密集工作之努力。
該些組件(例如,多國語言服務組件512和CES組件514)可代表數個不同組件。例如,校正器544可代表數個不同品牌、模式和類型的校正器。處理流程管理器510基於特定因子來確保使用特定組件。
參考第6圖,處理流程管理器510(係與CES 514共同地作業)可使用範例流程600,以增強使用者512之查詢。處理600接收一查詢請求(602)。例如,處理管理器510經由通訊網路518接收來自使用者512其中之一的語言服務之請求。
處理600將該請求應用至因子(604)。該些因子可包括語言ID、需求速度、需求品質、使用者語言流暢度因子、介面因子、組件可獲得性、和索引之存在。語言ID包括待被轉譯之語言。需求速度包括使用者所需時間量。使用者可指定搜尋必須在(例如)10秒內完成。
需求品質可包括(例如)使用F分數。F分數係為精確度與再呼叫的總和除以二。精確度係為良好返回的數量除以良好返回和錯誤警示總和。再呼叫係為良好返回的數量除以良好返回與遺漏的總和。
使用者語言流暢度因子可包括因次化數量的熟練度或簡單旗標。介面因子包括組件之間(例如,多國語言服務512和CES 514)的連結之速度。索引之存在可包括在索引資料庫22中正被搜尋的字詞之索引的存在。
處理600基於該些因子選擇組件,以處理該查詢(606)。例如,處理流程管理器510決定處理流程及所使用的該些組件(例如,多國語言服務512和CES 514),處理由該使用者所請求的查詢以及將該查詢的結果傳送至使用者。
例如,維吉尼亞州的分析師可接收使用一處理流程的查詢之結果,且具有相同查詢之敵對區域的代理人可接收來自相同查詢但來自不同處理(使用MEMS 500中的不同組件)的結果以及不同結果(在某些範例中)。
處理600將結果傳送至使用者(608)。在某些實施例中,從處理方塊606所選擇的組件將結果傳送至使用者,而不需由處理管理器510進一部的相互作用。在其他範例中,該些結果由處理流程管理器510所處理,以監控MEMS 500之準確度和性能。
第7圖顯示電腦700,其可用於執行此處的處理(例如,處理30和處理600)。電腦700包括處理器702、揮發性記憶體704和非揮發性記憶體706(例如,硬碟)。非揮發性記憶體706包括作業系統710、資料716和電腦指令714,其係由揮發性記憶體704所執行,以實行該些處理(例如,處理30和處理600)。電腦700亦包括使用者介面(UI)724,例如:第1圖的使用者介面14。
此處所敘述之處理(例如,處理30和處理600)並不侷限於利用第7圖的硬體和軟體之使用;其可在任意運算和處理環境中尋得其適用性以及利用可運行電腦程式之任意類型的機器或一組機器。該些處理可在硬體、軟體、或二者的組合中實施。該些處理可在可程式化電腦/機器(其各自包括處理器、儲存媒體或其他可由處理器所讀取之製造物件,上述處理器包括揮發性和非揮發性記憶體及/或儲存單元)上所執行之電腦程式、至少一輸入裝置、及一或多個輸出裝置中實施。程式碼可應用於使用一輸入裝置所鍵入的資料,用以執行此處所敘述之處理及產生輸出資訊。
該系統可經由電腦程式產品(亦即,可觸式地內建於資訊載體中之電腦程式,該資訊載體例如,在可讀取儲存裝置中或傳播信號中)至少部分地實施,用以由資料處理裝置(例如,可程式化處理器、電腦、或多電腦)之執行,以及用以控制資料處理裝置之操作。此種程式各自可於高階程序或目標導向程式語言中實施,以與電腦系統相通訊。然而,這些程式可在組合語言或機器語言中實施。語言可以為編譯或解譯語言,且其可以任何形式(包括單機程式或模組、組件、次常式或其他運算環境中適用的其他單元)來部署。電腦程式可被部署以在單一站點或多個站點之分佈的一電腦或多電腦上執行,以及由一通訊網路互連。電腦程式可被儲存在儲存媒體或裝置(例如,CD-ROM、硬碟、或磁碟),其可由一般或特殊用途可程式化電腦所讀取,用以當該儲存媒體或裝置由該電腦讀取時可組態和操作該電腦,以執行該些處理。該些處理亦可實施為機器可讀取儲存媒體,其係以電腦程式來組態,其中當執行時,電腦程式中的指令致使電腦根據一處理(例如,處理30和處理600)來操作。
此處所敘述之處理並不侷限於此處所述之特定實施例。例如,該些處理並不侷限於第2和6圖的特定處理順序。反而是,第2和6圖的任何處理區塊可視其需要而被重排序、組合或移除、平行地或序列地執行,以達成上述的結果。
此處所敘述之系統並不侷限於上述利用硬體和軟體之使用。該系統可在數位電子電路中實施,或在電腦硬體、韌體、軟體、或其組合中實施。
與實施該系統相關聯的處理區塊可藉由執行一或多個電腦程式之一或多個可程式化處理器所實行,以實行該系統之功能。該系統的全部或部分可實施為特殊用途邏輯電路,例如:FPGA(場式可程式化閘極陣列)及/或ASIC(特殊應用積體電路)。
適於執行電腦程式之處理器(藉由範例)包括一般用途和特殊用途微處理器,以及任意類型的數位電腦之一或多個處理器中任一者。一般而言,處理器將接收來自唯讀記憶體或隨機存取記憶體或二者的指令和資料。電腦之元件包括用於執行指令之處理器以及用於儲存指令和資料之一或多個記憶體裝置。
此處所敘述之不同實施例的元件可被組合,以形成非上述特定的其他實施例。非此處所特定敘述的其他實施例亦可包含在以下申請專利範圍之範圍內。
10...SRQE系統
14...使用者介面
16...滑鼠
17...鍵盤
18...顯示器
20...字本體系統
12...SRQE處理器
22...索引資料庫
24...轉譯器
30...處理
100...樣型
102...核取方塊
102a...名詞核取方塊
102b...動詞核取方塊
102c...形容詞核取方塊
104...文字方塊
106...選擇鈕
120...樣型
126...核取方塊
122a...動詞字義部分
122b...名詞字義部分
124a...動詞部分
124b...名詞部分
122...字義部分
124...字本體部分
130...目標語言樣型
133...英文對中文核取方塊
132...語言對部分
134...字本體選擇部分
136...執行鈕
144...已翻譯欄
148...送出核取方塊欄
140...翻譯樣型
146...反向來源欄
160...執行鈕
400...多國語言系統
420...資料儲存庫
422...轉碼器
424...過濾器
426...路由器
428...分段器
440...字列表
450...標點列表
430a...英文字彙分析器
430b...中文字彙分析器
430c...阿拉伯文字彙分析器
430...字彙分析器
434...形態分析器
516...使用者
510...處理流程管理器
500...多國語言企業管理系統(MEMS)
534...轉碼器
532...字彙分析器
538...形態分析器
536...轉譯器
542...字列表
544...校正器
546...光學字元辨識裝置
548...其他多國語言服務
512...多國語言服務組件
518...通訊網路
552...企業服務管理(ESM)組件
556...送訊服務組件
560...仲裁服務組件
564...安全服務組件
568...使用者輔助服務組件
554...探索服務組件
558...合作服務組件
562...儲存服務組件
566...應用服務組件
514...核心企業服務(CES)組件
600...處理
700...電腦
702...處理器
704...揮發性記憶體
724...使用者介面(UI)
706...非揮發性記憶體
714...電腦指令
710...作業系統
716...資料
第1圖係為語義反向查詢延伸(SRQE)系統的圖式。
第2圖係為用於語義反向查詢延伸的處理之流程圖。
第3A至3D圖係為由SRQE系統所使用的範例樣型。
第4圖係為SRQE系統的範例使用之圖式。
第5圖係為多國語言企業系統(MEMS)之圖式。
第6圖係為用於增強多國語言資料庫查詢的處理之流程圖。
第7圖係為電腦系統之方塊圖,在該電腦系統上可實施第2和6圖的處理。
12...SRQE處理器
14...使用者介面
16...滑鼠
17...鍵盤
18...顯示器
20...字本體系統
22...索引資料庫
24...轉譯器

Claims (19)

  1. 一種用以查詢多國語言資料之方法,該方法包含:使用一電腦接收針對一查詢的一請求,該查詢包括以一來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋;使用該電腦將該請求應用至數個因子,該些因子包含;介面因子,用以指示一組組件之間的連結之速度,該些組件包含:多國語言服務組件;以及核心企業服務組件;組件可取得性因子,用以指示該些組件之該可取得性;語言識別因子,用以指示該來源語言,需求速度因子,用以指示使用者對該請求所需時間量以返回一結果,需求品質因子,以及使用者語言流暢度因子,使用該電腦基於該些因子選擇該些組件之子組合;以及使用該電腦基於該些組件之該子組合執行該查詢,其中執行該查詢包含決定以該來源語言之該基礎字的一字本體,以及其中決定該基礎字的該字本體包含決定該基礎字的同 義詞、同音詞、上位詞、和下位詞。
  2. 如申請專利範圍第1項所述之方法,其中執行該查詢包含:決定以該來源語言之該基礎字的一字本體;產生代表該基礎字之該字本體的一組字;將該組字的至少一子組合翻譯至該目標語言;以及將該組字的該至少一子組合從該目標語言翻譯至該基礎字的該來源語言。
  3. 如申請專利範圍第1項所述之方法,其中選擇該些組件之該子組合包含選擇以下之至少一者:一字彙分析器、一轉碼器、一轉譯器、一形態分析器、一字列表、一校正器以及一光學字元辨識(OCR)裝置。
  4. 如申請專利範圍第1項所述之方法,其中選擇該些組件之該子組合包含選擇以下之至少一者:一企業服務管理(ESM)組件、一探索服務組件、一送訊服務組件、一合作服務組件、一仲裁服務組件、一儲存服務組件、一安全服務組件、一應用服務組件以及一使用者輔助組件。
  5. 如申請專利範圍第1項所述之方法,其中將該請求應用至該些因子更包含:一索引的存在。
  6. 一種用以查詢多國語言資料之裝置,該裝置包含:用於接收針對一查詢的一請求之電路,該查詢包括以一來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋; 用於將該請求應用至數個因子之電路,該些因子包含;介面因子,用以指示一組組件之間的連結之速度,該些組件包含:多國語言服務組件;以及核心企業服務組件;組件可取得性因子,用以指示該些組件之該可取得性;語言識別因子,用以指示該來源語言,需求速度因子,用以指示使用者對該請求所需時間量以返回一結果,需求品質因子,以及使用者語言流暢度因子,用於基於該些因子選擇該些組件之子組合的電路;以及用於基於該些組件之子組合執行該查詢之電路,其中該查詢之該電路包含決定以該來源語言之該基礎字的一字本體之電路,決定該基礎字的該字本體包含決定該基礎字的同義詞、同音詞、上位詞、和下位詞。
  7. 如申請專利範圍第6項所述之裝置,其中該電路包含一處理器、一記憶體、可程式化邏輯和邏輯閘中的至少之一。
  8. 如申請專利範圍第6項所述之裝置,其中該用於執行該查詢之電路包含:決定以該來源語言之該基礎字的一字本體之電路; 產生代表該基礎字之該字本體的一組字之電路;將該組字的至少一子組合翻譯至該目標語言之電路;以及將該組字的該至少一子組合從該目標語言翻譯至該基礎字的該來源語言之電路。
  9. 如申請專利範圍第6項所述之裝置,其中該用於選擇該些組件之該子組合的電路包含選擇以下之至少一者之電路:一字彙分析器、一轉碼器、一轉譯器、一形態分析器、一字列表、一校正器以及一光學字元辨識(OCR)裝置。
  10. 如申請專利範圍第9項所述之裝置,其中該用於選擇該些組件之該子組合的電路包含選擇以下之至少一者之電路:一企業服務管理(ESM)組件、一探索服務組件、一送訊服務組件、一合作服務組件、一仲裁服務組件、一儲存服務組件、一安全服務組件、一應用服務組件以及一使用者輔助組件。
  11. 如申請專利範圍第6項所述之裝置,其中該用於將該請求應用至該些因子之電路更包含:一索引的存在。
  12. 一種包含一機器可讀取媒體之物件,該機器可讀取媒體儲存有用以查詢多國語言資料的可執行指令,該些可執行指令致使一機器進行以下:接收針對一查詢的一請求,該查詢包括以一來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋; 將該請求應用至數個因子;該些因子包含:語言識別因子,用以指示該來源語言,需求速度因子,用以指示使用者對該請求所需時間量以返回一結果;需求品質因子;使用者語言流暢度因子;介面因子,用以指示組件之間的連結之速度,該些組件包含:多國語言服務組件;以及核心企業服務組件;組件可取得性因子,用以指示該些組件之該可取得性;以及一索引的存在;基於該些因子選擇該些組件之子組合;以及基於該選擇之該些組件之該子組合執行該查詢,其中該些指令致使該機器執行該查詢包含指令致使一機器決定以該來源語言之該基礎字的一字本體,決定該基礎字的該字本體包含決定該基礎字的同義詞、同音詞、上位詞、和下位詞。
  13. 如申請專利範圍第12項所述之物件,其中致使一機器執行該查詢之該些指令包含致使一機器進行以下之指令:決定以該來源語言之該基礎字的一字本體;產生代表該基礎字之該字本體的一組字;將該組字的至少一子組合翻譯至該目標語言;以及 將該組字的該至少一子組合從該目標語言翻譯至該基礎字的該來源語言。
  14. 如申請專利範圍第12項所述之物件,其中致使該機器選擇該些組件之該子組合的該些指令包含致使該機器選擇以下之至少一者:一字彙分析器、一轉碼器、一轉譯器、一形態分析器、一字列表、一校正器以及一光學字元辨識(OCR)裝置。
  15. 如申請專利範圍第12項所述之物件,其中致使該機器選擇該些組件之該子組合的該些指令包含致使該機器選擇以下之至少一者之指令:,一企業服務管理(ESM)組件、一探索服務組件、一送訊服務組件、一合作服務組件、一仲裁服務組件、一儲存服務組件、一安全服務組件、一應用服務組件以及一使用者輔助組件。
  16. 一種用於多國語言資料查詢之系統,該系統包含:一使用者介面,其包含硬體並組態以接收一查詢,該查詢包括以來源語言的一基礎字,該基礎字用於以一目標語言的一資料庫搜尋;一組核心企業服務組件;一組多國語言服務組件;以及一處理流程管理器,其組態以接收來自該使用者介面的該查詢,以及基於一組因子選擇來自該組核心企業服務組件與該組多國語言服務組件的該些組件之子組合,以處理該查詢,該組因子包含: 介面因子,用以指示該些組件之間的連結之速度,組件可取得性因子,用以指示該些組件之該可取得性;語言識別因子,用以指示該來源語言,需求速度因子,用以指示使用者對該請求所需時間量以返回一結果,需求品質因子,以及使用者語言流暢度因子。
  17. 如申請專利範圍第16項所述之系統,其中該些組件之該子組合包含以下之至少一者:一字彙分析器、一轉碼器、一轉譯器、一形態分析器、一字列表、一校正器以及一光學字元辨識(OCR)裝置。
  18. 如申請專利範圍第16項所述之系統,其中該些組件之該子組合包含以下之至少一者:一企業服務管理(ESM)組件、一探索服務組件、一送訊服務組件、一合作服務組件、一仲裁服務組件、一儲存服務組件、一安全服務組件、一應用服務組件以及一使用者輔助組件。
  19. 如申請專利範圍第16項所述之系統,其中該組因子更包含:一索引的存在。
TW096113117A 2006-04-19 2007-04-13 增強多國語言資料查詢 TWI417747B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US74514406P 2006-04-19 2006-04-19
US11/468,856 US7853555B2 (en) 2006-04-19 2006-08-31 Enhancing multilingual data querying

Publications (2)

Publication Number Publication Date
TW200813755A TW200813755A (en) 2008-03-16
TWI417747B true TWI417747B (zh) 2013-12-01

Family

ID=38620681

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096113117A TWI417747B (zh) 2006-04-19 2007-04-13 增強多國語言資料查詢

Country Status (2)

Country Link
US (1) US7853555B2 (zh)
TW (1) TWI417747B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701119A (zh) * 2014-11-21 2016-06-22 财团法人资讯工业策进会 检索过滤方法及其处理装置

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US8266152B2 (en) 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US8176052B2 (en) * 2006-03-03 2012-05-08 Perfect Search Corporation Hyperspace index
US9639618B2 (en) * 2006-05-25 2017-05-02 International Business Machines Corporation System, method and program product for key word searching where a key word is a homonym
US7672740B1 (en) * 2006-09-28 2010-03-02 Rockwell Automation Technologies, Inc. Conditional download of data from embedded historians
US7742833B1 (en) 2006-09-28 2010-06-22 Rockwell Automation Technologies, Inc. Auto discovery of embedded historians in network
US8181157B2 (en) * 2006-09-29 2012-05-15 Rockwell Automation Technologies, Inc. Custom language support for project documentation and editing
US8798988B1 (en) * 2006-10-24 2014-08-05 Google Inc. Identifying related terms in different languages
US8799307B2 (en) * 2007-05-16 2014-08-05 Google Inc. Cross-language information retrieval
US8583415B2 (en) * 2007-06-29 2013-11-12 Microsoft Corporation Phonetic search using normalized string
US7774347B2 (en) 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7930261B2 (en) 2007-09-26 2011-04-19 Rockwell Automation Technologies, Inc. Historians embedded in industrial units
US7761471B1 (en) * 2007-10-16 2010-07-20 Jpmorgan Chase Bank, N.A. Document management techniques to account for user-specific patterns in document metadata
US8402046B2 (en) * 2008-02-28 2013-03-19 Raytheon Company Conceptual reverse query expander
KR100978581B1 (ko) 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
US20090287474A1 (en) * 2008-05-16 2009-11-19 Yahoo! Inc. Web embedded language input arrangement
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
US8386489B2 (en) * 2008-11-07 2013-02-26 Raytheon Company Applying formal concept analysis to validate expanded concept types
US8463808B2 (en) * 2008-11-07 2013-06-11 Raytheon Company Expanding concept types in conceptual graphs
US9158838B2 (en) * 2008-12-15 2015-10-13 Raytheon Company Determining query return referents for concept types in conceptual graphs
US8577924B2 (en) * 2008-12-15 2013-11-05 Raytheon Company Determining base attributes for terms
US9087293B2 (en) * 2008-12-23 2015-07-21 Raytheon Company Categorizing concept types of a conceptual graph
US8838532B2 (en) * 2008-12-24 2014-09-16 At&T Intellectual Property I, L.P. Collaborative self-service contact architecture with automatic blog content mapping capability
US8577909B1 (en) * 2009-05-15 2013-11-05 Google Inc. Query translation using bilingual search refinements
US8577910B1 (en) 2009-05-15 2013-11-05 Google Inc. Selecting relevant languages for query translation
US8572109B1 (en) * 2009-05-15 2013-10-29 Google Inc. Query translation quality confidence
US8538957B1 (en) 2009-06-03 2013-09-17 Google Inc. Validating translations using visual similarity between visual media search results
US20100332217A1 (en) * 2009-06-29 2010-12-30 Shalom Wintner Method for text improvement via linguistic abstractions
US8352244B2 (en) * 2009-07-21 2013-01-08 International Business Machines Corporation Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains
CN102770859B (zh) * 2009-11-20 2017-05-03 谷歌公司 跨语言搜索选项
US11100098B2 (en) * 2010-05-28 2021-08-24 Oracle International Corporation Systems and methods for providing multilingual support for data used with a business intelligence server
US8326857B2 (en) 2010-05-28 2012-12-04 Oracle International Corporation Systems and methods for providing value hierarchies, ragged hierarchies and skip-level hierarchies in a business intelligence server
US10073927B2 (en) 2010-11-16 2018-09-11 Microsoft Technology Licensing, Llc Registration for system level search user interface
US8515984B2 (en) 2010-11-16 2013-08-20 Microsoft Corporation Extensible search term suggestion engine
US10346479B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Facilitating interaction with system level search user interface
US8639701B1 (en) 2010-11-23 2014-01-28 Google Inc. Language selection for information retrieval
KR20130102854A (ko) * 2012-03-08 2013-09-23 삼성전자주식회사 검색 시스템 및 동작 방법
CN103488648B (zh) * 2012-06-13 2018-03-20 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
US9135916B2 (en) 2013-02-26 2015-09-15 Honeywell International Inc. System and method for correcting accent induced speech transmission problems
US9626417B1 (en) * 2013-05-08 2017-04-18 Amdocs Software Systems Limited System, method, and computer program for automatically converting characters from an ISO character set to a UTF8 character set in a database
US20180293091A1 (en) * 2015-07-15 2018-10-11 Mitsubishi Electric Corporation Display control apparatus and display control method
US11100112B2 (en) * 2016-03-29 2021-08-24 Gurunavi, Inc. Information processing apparatus, system, method and program for registering and retrieving menu and ingredients
US10169414B2 (en) * 2016-04-26 2019-01-01 International Business Machines Corporation Character matching in text processing
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10191899B2 (en) * 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360196B1 (en) * 1998-05-20 2002-03-19 Sharp Kabushiki Kaisha Method of and apparatus for retrieving information and storage medium
TW200530856A (en) * 2003-12-15 2005-09-16 Lab For Language Technology Inc System, method and program for identifying corresponding translation

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0285614A1 (fr) * 1986-10-06 1988-10-12 Stéfan Grigore DE FAY Procede et dispositif portatif pour saisir, memoriser et eventuellement traiter et reproduire des signes graphiques figurant sur un support quelconque
KR980004126A (ko) * 1997-12-16 1998-03-30 양승택 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법
US6424983B1 (en) * 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
GB2338089A (en) * 1998-06-02 1999-12-08 Sharp Kk Indexing method
US7152031B1 (en) * 2000-02-25 2006-12-19 Novell, Inc. Construction, manipulation, and comparison of a multi-dimensional semantic space
US6349276B1 (en) * 1998-10-29 2002-02-19 International Business Machines Corporation Multilingual information retrieval with a transfer corpus
US6859778B1 (en) * 2000-03-16 2005-02-22 International Business Machines Corporation Method and apparatus for translating natural-language speech using multiple output phrases
US7865358B2 (en) * 2000-06-26 2011-01-04 Oracle International Corporation Multi-user functionality for converting data from a first form to a second form
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7853557B2 (en) * 2002-06-14 2010-12-14 Siebel Systems, Inc. Method and computer for responding to a query according to the language used
US20040102957A1 (en) * 2002-11-22 2004-05-27 Levin Robert E. System and method for speech translation using remote devices
GB2399427A (en) * 2003-03-12 2004-09-15 Canon Kk Apparatus for and method of summarising text
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US8117327B2 (en) * 2003-05-08 2012-02-14 Jda Software Group, Inc. Data integration system with programmatic source and target interfaces
US7146361B2 (en) * 2003-05-30 2006-12-05 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND)
US20050197991A1 (en) * 2003-06-25 2005-09-08 Wray Robert E. Method and apparatus for providing rule-based, autonomous software agent with ontological information
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
US7451185B2 (en) * 2004-02-27 2008-11-11 Fotomedia Technologies, Llc Method and system for providing links to resources related to a specified resource
US20060021049A1 (en) * 2004-07-22 2006-01-26 Cook Chad L Techniques for identifying vulnerabilities in a network
US7401077B2 (en) * 2004-12-21 2008-07-15 Palo Alto Research Center Incorporated Systems and methods for using and constructing user-interest sensitive indicators of search results
US7698126B2 (en) * 2005-03-08 2010-04-13 Microsoft Corporation Localization matching component
US7912810B2 (en) * 2005-06-28 2011-03-22 Sap Ag Methods, systems and computer program products for integrating carrier services into an enterprise
US20070106499A1 (en) * 2005-08-09 2007-05-10 Kathleen Dahlgren Natural language search system
US7587308B2 (en) * 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies
US8060357B2 (en) * 2006-01-27 2011-11-15 Xerox Corporation Linguistic user interface
EP1983445B1 (en) * 2006-02-17 2018-12-26 Google LLC Encoding and adaptive, scalable accessing of distributed models

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360196B1 (en) * 1998-05-20 2002-03-19 Sharp Kabushiki Kaisha Method of and apparatus for retrieving information and storage medium
TW200530856A (en) * 2003-12-15 2005-09-16 Lab For Language Technology Inc System, method and program for identifying corresponding translation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701119A (zh) * 2014-11-21 2016-06-22 财团法人资讯工业策进会 检索过滤方法及其处理装置

Also Published As

Publication number Publication date
US7853555B2 (en) 2010-12-14
TW200813755A (en) 2008-03-16
US20070250494A1 (en) 2007-10-25

Similar Documents

Publication Publication Date Title
TWI417747B (zh) 增強多國語言資料查詢
TWI453610B (zh) 用於多國語言資料查詢之方法、設備、程式產品及系統
JP6714024B2 (ja) 言語入力データからnグラムおよび概念関係の自動生成
McEnery et al. Corpus linguistics: Method, theory and practice
Ide et al. The language application grid
JP7289047B2 (ja) ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム
US9846720B2 (en) System and method for refining search results
JP7248879B2 (ja) 特許文書作成装置、方法、コンピュータプログラム、コンピュータで読み取り可能な記録媒体、サーバー、およびシステム
US11074402B1 (en) Linguistically consistent document annotation
Radoev et al. A language adaptive method for question answering on French and English
US20220129623A1 (en) Performance characteristics of cartridge artifacts over text pattern constructs
Abrate et al. Sharing cultural heritage: the clavius on the web project
Raza et al. FAIR Enough: How Can We Develop and Assess a FAIR-Compliant Dataset for Large Language Models' Training?
Moussallem et al. Entity linking in 40 languages using MAG
AU2007240937B2 (en) Multilingual data querying
Šostaka et al. The Semi-Algorithmic Approach to Formation of Latvian Information and Communication Technology Terms.
Gawley et al. Comparing the intertextuality of multiple authors using Tesserae: A new technique for normalization
Hai-Jew Querying google books ngram viewer's big data text corpuses to complement research
Al Ameri et al. Building Lexical Resources for Dialectical Arabic
Finin et al. HLTCOE participation in TAC KBP 2017: Cold start TEDL and low-resource EDL
Fakouri-Kapourchali et al. Semantic textual similarity as a service
Mehta et al. String Matching Based Framework for Online Hindi Question Answering System
Schwitter et al. Meaningful web annotations for humans and machines using controlled natural language
Sharjeel et al. Cross-lingual Text Reuse Detection at Document Level for English-Urdu Language Pair
Ekbal et al. Multilinguality in Misinformation Detection

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees