JP2009534745A - 多言語データクエリ - Google Patents

多言語データクエリ Download PDF

Info

Publication number
JP2009534745A
JP2009534745A JP2009506514A JP2009506514A JP2009534745A JP 2009534745 A JP2009534745 A JP 2009534745A JP 2009506514 A JP2009506514 A JP 2009506514A JP 2009506514 A JP2009506514 A JP 2009506514A JP 2009534745 A JP2009534745 A JP 2009534745A
Authority
JP
Japan
Prior art keywords
word
component
ontology
language
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009506514A
Other languages
English (en)
Other versions
JP5361708B2 (ja
Inventor
ジョンソン,マイケル・アール
ピープルズ,ブルース・イー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Co
Original Assignee
Raytheon Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/468,856 external-priority patent/US7853555B2/en
Priority claimed from US11/468,853 external-priority patent/US7991608B2/en
Application filed by Raytheon Co filed Critical Raytheon Co
Publication of JP2009534745A publication Critical patent/JP2009534745A/ja
Application granted granted Critical
Publication of JP5361708B2 publication Critical patent/JP5361708B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

一態様では、多言語データクエリの方法は、ソース言語で基本単語の単語オントロジーを定めること、基本単語の単語オントロジーを表す単語セットを生成すること、当該単語セットのうちの少なくとも1つのサブセットをターゲット言語に翻訳すること、及び当該単語セットのうちの少なくとも1つのサブセットをターゲット言語から基本単語のソース言語に翻訳することを含む。別の態様では、多言語データクエリの方法は、クエリ要求を受信することを含む。クエリは、ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含む。本方法は、要求をファクタに適用すること、当該ファクタに基づいてコンポーネントを選択すること、及び当該選択に基づいてクエリを実行することをさらに含む。

Description

本発明はデータベースクエリに関し、詳細には多言語にわたるデータベースクエリに関する。
単語をソース言語からターゲット(目標)言語に翻訳した結果、ソース言語の単語とターゲット言語における翻訳された単語とが、1対1の対応にならない場合がある。これはソース言語の単語が様々な意味を有する場合があるためである。たとえば、単語「mole」は、皮膚のしみ、地中の動物、又はスパイを意味する場合がある。幾つかの場合、ソース言語の単語が、ターゲット言語において意味を有しないおそれがある。このような事情によって、ターゲット言語の知識をほとんど有しないユーザにとって、データベース内の情報を多言語にわたって検索するのは困難になる。
本発明は、一態様では、多言語データクエリを行う方法であって、ソース言語で基本単語の単語オントロジーを決定すること、当該基本単語の単語オントロジーを表す単語セットを生成すること、当該単語セットのうちの少なくとも1つのサブセットをターゲット言語に翻訳すること、及び当該単語セットのうちの少なくとも1つのサブセットをターゲット言語から基本単語のソース言語に翻訳することを含む、方法である。
別の態様では、本発明は多言語データクエリを行う装置である。当該装置は、ソース言語で基本単語のオントロジーを決定し、当該基本単語の単語オントロジーに基づいて単語セットを生成し、当該単語セットのうちの少なくとも1つのサブセットをターゲット言語に翻訳すると共に、当該単語セットのうちの少なくとも1つのサブセットをターゲット言語から基本単語のソース言語に翻訳する回路を含む。
さらなる態様では、本発明は、多言語データクエリを行う実行可能な命令を記憶する、マシン(機械)読取り可能媒体を含む物品(製品)である。当該実行可能な命令は、機械に、ソース言語で基本単語のオントロジーを決定させ、当該基本単語のオントロジーに基づいて単語セットを生成させ、当該単語セットのうちの少なくとも1つのサブセットをターゲット言語に翻訳させると共に、当該単語セットのうちの少なくとも1つのサブセットをターゲット言語から基本単語のソース言語に翻訳させる。
なおさらなる態様では、本発明は多言語データクエリを行うシステムである。当該システムは、索引付け(インデックス)されたデータベースと、ユーザによって選択されたソース言語での基本単語を含むクエリを受信するように構成されるユーザインタフェースと、ソース言語での基本単語に基づいて単語セットを生成するように構成される単語オントロジーシステムと、当該単語セットのターゲット言語への翻訳を生成すると共に、当該単語セットをターゲット言語からソース言語へ翻訳するように構成される翻訳機と、単語オントロジーシステム、ユーザインタフェース、索引付けされたデータベース、及び翻訳機に結合されるプロセッサとを含む。プロセッサは、ユーザインタフェースから、単語セットから選択された単語を受信して、索引付けされたデータベース内を検索するように構成される。
一態様では、本発明は多言語データクエリを行う方法である。当該方法は、クエリ要求を受信することを含む。クエリは、ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含む。当該方法は、要求をファクタに適用すること、当該ファクタに基づいてコンポーネントを選択すること、及び当該選択に基づいてクエリを実行することをさらに含む。
別の態様では、本発明は多言語データクエリを行う装置である。当該装置はクエリ要求を受信する回路を含む。クエリは、ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含む。当該装置は、要求をファクタに適用し、当該ファクタに基づいてコンポーネントを選択すると共に、当該選択する回路に基づいてクエリを実行する追加の回路をさらに含む。
さらなる態様では、本発明は、多言語データクエリを行う実行可能な命令を記憶する機械読取り可能媒体を含む物品である。当該実行可能な命令は、機械にクエリ要求を受信させる。クエリはターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含む。当該命令は、機械に、要求をファクタに適用させ、当該ファクタに基づいてコンポーネントを選択させると共に、当該選択に基づいてクエリを実行させる命令をさらに含む。
なおさらなる態様では、本発明は多言語データクエリのシステムである。当該システムは、クエリを受信するように構成されるユーザインタフェースを含む。クエリは、ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含む。また、当該システムはコア(中核)事業サービスコンポーネントのセットと、多言語サービスコンポーネントのセットと、プロセスフローマネージャであって、ユーザインタフェースからクエリを受信して、ファクタのセットに基づいて中核事業コンポーネントのセット及び多言語サービスコンポーネントのセットからコンポーネントを選択してクエリを処理するように構成される、プロセスフローマネージャとを含む。
図1を参照すると、セマンティック逆クエリ拡張(semantic reverse query expansion)(SRQE)システム10は、SRQEプロセッサ12と、たとえば、マウス16、キーボード17、及びディスプレイ18(たとえば、モニタ、スクリーン等)を有するユーザインタフェース14と、単語オントロジーシステム20と、索引付けされたデータベース22と、翻訳機24とを含む。SRQEプロセッサ12は、1つ又は複数のコンピュータとすることができる。
単語オントロジーシステム20は、基本単語(たとえば、基本単語はユーザによって選択され、索引データベース22からのデータの検索に用いられる)の単語オントロジーを提供する。これは基本単語の、たとえば、類義語、同音異義語、上位語、及び下位語を提供することを含む。類義語は、基本単語と同じか又は全く同一の単語である。たとえば、単語「spectacles(眼鏡)」は「eyeglasses(眼鏡)」の類義語である。同形同音異義語は、基本単語と同じ発音又は綴りを有する単語である。たとえば、「bow」はお辞儀をすることを意味するか、又は飾り結びを意味する。上位語は、基本単語よりも総称的な、又は広義の単語である。たとえば、「munition(軍用品)」は「bomb(爆弾)」の上位語と考えられる。下位語は、基本単語よりも特定的な単語である。たとえば、「car(車)」は「vehicle(乗り物)」の下位語と考えられる。単語オントロジーシステム20の一例は、WordNet英語言語オントロジー(ニュージャージー州プリンストン、プリンストン大学)である。
索引付けされたデータベース22は、様々な技法を用いて取り込むことができる。それらの技法のうちの1つを図4に例示する。一例では、索引付けされたデータベース22は、アプリケーションによって参照される名前を有し、標準的な構造化クエリ言語(SQL)文を使用して操作することができる。索引付けされたデータベースの一例は、テキスト索引(たとえば、ORACLEテキスト索引)を有するORACLE 10gデータベース(カリフォルニア州レッドウッドショアズ、Oracle社)である。テキスト索引はデータベースドメイン索引であり、クエリアプリケーションの生成において用いることができる。たとえば、生成されたCONTEXT型のOracleテキスト索引は、SRQE10によって、SQLのCONTAINS演算子を使用して、生成してクエリを行うことができる。索引は取り込まれたテキストテーブルから生成され、データベーステーブルに記憶された文書に関連すると共に当該文書を参照する、トークンの索引である。クエリアプリケーションにおいて、索引はクエリが実行される対象である。索引は、検索されるトークンと、索引付けされたデータベース22においてテキストが記憶される場所を示すポインタとを含む。一例では、テキストは文書の集合とすることができる。一例では、テキストは小さなテキストの断片とすることもできる。
翻訳機24は、1つの翻訳システム又は一連の翻訳システムとすることができる。一例では、翻訳機24は機械翻訳システムであり、ソース言語の単語を人間の介在なしにターゲット言語の単語に翻訳する。
図2及び図3A〜図3Dを参照すると、逆クエリ拡張を実行する1つの例示的なプロセスは、プロセス30である。プロセス30は、初期テンプレートを提示する(32)。たとえば、SRQEプロセッサ12はテンプレート100をディスプレイ18上に提示する。テンプレート100は、品詞(POS:part of speech)チェックボックス102(たとえば、名詞チェックボックス102a、動詞チェックボックス102b、及び形容詞チェックボックス102c)を含む。また、テンプレート100は、検索される基本単語(たとえば、ユーザによって選択された単語)を示すテキストボックス104と、要求をSRQEプロセッサ12に送信するための選択ボタン106(「意味(sense)」とラベル付けされる)とを含む。
プロセス30は、品詞データを受信する(36)。たとえば、ユーザはマウス16をチェックボックス102上に動かしてマウスをクリックすることによって、所望のPOSチェックボックス102を選択する。ユーザは、キーボード17を用いてテキストボックス104に基本単語を入力する。ユーザは選択ボタン106上でマウス16をクリックすることによって要求を実行する。
プロセス30は、語義を生成する(42)。たとえば図3Aにおいて、ユーザは、名詞チェックボックス102aをチェックすることによって名詞語義を、動詞チェックボックス102bをチェックすることによって動詞語義を選択すると共に、単語「spy」を基本単語としてテキストボックス104に入力している。SRQEプロセッサ12は、単語「spy」に関して名詞語義及び動詞語義を生成する。語義はPOSに基づく単語の意味を表す。spyの動詞語義は、たとえば、「見つける」、「ひそかに見張る、観察する、又は調査する」、及び「機密情報又は機密扱いの情報を密かに集める、スパイ活動に従事する」を含む。一例では、SRQEプロセッサ12は、単語オントロジーシステム20にアクセスして語義を定める。他の例では、語義データをSRQEプロセッサ12内のメモリ(図示せず)に記憶することができる。
プロセス30は基本単語の単語オントロジーを生成する(46)。たとえば、SRQEシステム12は単語オントロジーシステム20にアクセスし、基本単語の単語オントロジーを表す単語セットを生成する。たとえば、単語セットは、類義語、同音異義語、上位語、及び下位語を含むことができる。
プロセス30は、語義選択と基本単語の単語オントロジーを表す単語セットとを提示する(48)。たとえば、図3Bにおいて、SRQEプロセッサ12はテンプレート120を提示する。テンプレート120は、語義セクション122と、単語オントロジーセクション124とを含む。
たとえば、語義セクション122は、ユーザによって選択された基本単語に関して、ユーザによって選択された動詞に対応する動詞語義セクション122aと、名詞に対応する名詞語義セクション122bとを含む。別の例では、単語オントロジーセクション124は、ユーザによって選択された動詞に対応する動詞セクション124aと、名詞に対応する名詞セクション124bとを含む。他の例では、ユーザが形容詞を選択した場合、語義セクションは形容詞語義セクション(図示せず)を含み、単語オントロジーセクションは形容詞セクション(図示せず)を含む。図3Bは、単語オントロジーセクション124に上位語しか含んでいないが、たとえば、単語オントロジーを表す単語セットからの他の単語を含んでもよい。
動詞セクション124a及び名詞セクション124bは、ユーザが基本単語の単語オントロジーからユーザにとって重要な単語を選択できるようにするための、チェックボックス126(たとえば、チェックボックス126a、チェックボックス126b、チェックボックス126c、チェックボックス126d、及びチェックボックス126e)を含む。
プロセス30は、基本単語の単語オントロジーを表す単語セットからユーザによって選択された単語を受信する(52)。たとえば、ユーザはマウス16を用いてチェックボックス126を選択し、それはSRQEプロセッサ12によって受信される。
プロセス30は、ソース言語及びターゲット言語を選択するためのターゲット言語テンプレート130を提示する(56)。たとえば、図3Cにおいて、SRQEプロセッサ12はターゲット言語テンプレート130をディスプレイ18上に提示する。ターゲット言語テンプレート130は、言語対チェックボックス(たとえば、「英語から中国語」チェックボックス133)を含む言語対セクション132と、ユーザによって基本単語の単語オントロジーから選択された単語を反映する単語オントロジー選択セクション134と、実行ボタン136(「翻訳」とラベル付けされる)とを含む。言語対セクション132において、第1の言語はソース言語であり、第2の言語はターゲット言語である。たとえば、チェックボックス133は、ソース言語として英語(EN)から、ターゲット言語として中国語(CN)に翻訳することを示す。
プロセス30は、ターゲット言語の選択を受信する(62)。たとえば、ユーザは、言語対セクション132内のチェックボックス上でマウス16をクリックすることによって、所望の言語対を選択すると共に、マウスで実行ボタン136をクリックすることによって、その要求をSRQEプロセッサ12に送信する。図3Cにおいて、「英語から中国語」チェックボックス133bが選択されている。
プロセス30は単語翻訳を生成する(66)。たとえば、SRQEプロセッサ12は翻訳機24にアクセスし、基本単語、たとえば、「spy」を、ターゲット言語、たとえば中国語の単語(文字)に翻訳する。さらに、翻訳機24は、翻訳された単語、たとえば中国語の単語(文字)を、ソース言語、すなわち英語に戻す翻訳も行う。一例では、翻訳機24は、単語をターゲット言語に翻訳する1つの翻訳システムと、その単語をソース言語に戻す翻訳を行う第2の翻訳システムとを備えることができる。
プロセス30は単語翻訳を提示する(72)。たとえば、図3Dにおいて、SRQEプロセッサ12は、翻訳テンプレート140をディスプレイ18上に提示する。翻訳テンプレート140は、ユーザによって選択された単語の行142と、ターゲット言語に翻訳された単語オントロジーの単語を表す、翻訳された列144と、ソース言語に戻す翻訳をされた、上記翻訳された単語を表す、逆翻訳されたソース(reversed source)列146と、提示チェックボックス列148とを含む。テンプレート140はまた、ユーザによってマウス16を使用してクリックされると、提示チェックボックス列148内のボックスを全てチェックする「全てチェック」ボタンと、ユーザによってマウス16を使用してクリックされると、提示チェックボックス列148内のチェックボックスの全てのチェックを外す「全てチェックを外す」ボタンとを含む。翻訳テンプレート140は、実行ボタン160をさらに含む。
プロセス30は、クエリのためにユーザが選択した単語を受信する(76)。たとえば、ユーザは逆翻訳されたソース列144を見直して、翻訳された単語がユーザの検索において意味を有するか否かを判断する。翻訳された単語がその検索において意味を有する場合、ユーザは、チェックボックス列148内の適切なチェックボックスをチェックし、マウス16を使用して実行ボタン160をクリックする。
プロセス30は結果を提示する(78)。たとえば、SRQEプロセッサ12は、ユーザが選択した翻訳された単語を用いて、索引データベース22にデータのクエリを行う。一例では、結果は、翻訳機24によってソース言語に翻訳されたターゲット言語で返される。別の例では、結果がSRQEプロセッサ12に転送される前に、別の翻訳機(図示せず)がその結果をターゲット言語からソース言語に翻訳してもよい。
図4を参照すると、SRQEシステム10は、多言語クエリシステム内に実装することができる。一例では、ソース言語として英語を使用してアラビア語及び中国語のデータを検索する多言語システム400は、SRQEシステム10を含み、当該SRQEシステム10は、索引付けされたデータベース22を含む。多言語システム400はまた、データストア420(たとえば、インターネット、無線放送のデータストレージ、有線放送のデータストレージ、文書等)と、コード変換器(トランスコーダ)422と、フィルタ424と、ルータ426と、区分化器(sectionizer)428と、レクサー(字句解析器)430(たとえば、英語レクサー430a、中国語レクサー430b、及びアラビア語レクサー430c)と、たとえばアラビア語レクサー430cに結合される、形態素解析器434とを含む。
索引付けされたデータベース22は、データストア420からデータを抽出し、抽出したデータをコード変換器422を用いてコード変換し、コード変換されたデータをフィルタ424を用いてフィルタリングすることによって取り込まれる。コード変換器422は受信したデータを単一のフォーマットに変換する。一例では、コード変換器422は、電子テキストデータを1つのフォーマットから別のフォーマットに変換する。たとえば、コード変換器はアラビア語の電子テキストデータを、ASMO 449、CODAR−U、ISO 8859−6、Windows 1256、又はアラビア語−MACフォーマットのような符号化フォーマットから、UTF−8フォーマットに変換する。
ルータ426は、フィルタリングされたデータを区分化することができるか否かを判断する。区分化することができるフィルタリングされたデータ、たとえばマークアップデータ及びハイパーテキストマークアップ言語(HTML)データ等は、区分化器428によって区分化される。
区分化されたデータ及び区分化されていないデータは、データベースにルーティングされ、データベーステーブルに記憶される。索引を生成するために、文書セットの言語に基づいて適切なレクサーが選択される(たとえば、英語データは英語レクサー430a、中国語データは中国語レクサー430b、アラビア語データはアラビア語レクサー430c)。レクサー430は、受信したデータをトークンに分割する。たとえば、トークンは各文字、又は各図形文字(picturegram)(たとえば、中国語文字、アラビア文字等)に用いられる。他の例では、トークンは各単語に用いられる。レクサー430はトークンを使用して索引を取り込む。索引はデータベースに記憶され、索引付けされたデータベース22が生成される。アラビア語レクサー430cは、Morfixのようなアラビア語形態素解析器434を用いる。形態素解析器434は、受信したアラビア文字列の語根を識別する。一例では、1つのレクサー(たとえば、レクサー430c)が各言語に用いられる。別の例では、各言語につき、1つの形態素解析器が1つのレクサーと連携して用いられる。
索引生成プロセスは、単語リストデータ440及び終止符リストデータ450も利用する。たとえば、単語リストデータ440は、語幹化(stemming)プロセス、及び索引付けプロセスにおいて利用される辞書を含む。たとえば、英語における単語「running」は、単語「run」に関連付けられる。「run」は単語「running」を語幹化した結果である。一例では、単語リストデータ440はデータベースのセットとすることができ、各データベースは1つの言語における単語及び単語の異なる形態を示す。たとえば、1つの単語リストデータベースは、「soak」及び「presoak」のような、英単語及びそれらの英単語の接頭辞を利用する変更形態の辞書を含むことができる。他の単語リストデータベースは、「eat」及び「eating」のような、英単語及びそれらの英単語の接尾辞を利用する変更形態の辞書を含んでもよい。終止符リストデータ450は、文及び/又は単語の間の境界を示す言語文字を含み、それらは索引付けプロセスにおいて無視される。たとえば、英語におけるピリオド又は感嘆符は、文を終了させるが、索引に関しては価値を有しない。ピリオド又は感嘆符は、レクサーのトークン化プロセスには含まれない。別の例は、「a」、「an」、及び「the」のような冠詞を含む。冠詞は索引において価値を有しない。冠詞は、レクサーのトークン化プロセスには含まれない。終止符リストデータ450は終止符リストデータベースのセットを含むことができる。たとえば、各終止符リストデータベースを用いて単語又はシンボルのセットを表し、それらを索引生成プロセスで無視することができる。
一例では、レクサー(たとえば、レクサー430c)、形態素解析器434、単語リスト440、及び終止符リスト450を用いて、索引の作成時にターゲット言語の文書のテキストデータをトークン化することができる。たとえば、データベーステーブル内の文書からの索引の作成において、冠詞のような有用でない単語を除去するために、テキストデータの内容が終止符リスト450を通じて確認される。形態素解析器434は単語リスト440と連携して動作するため、単語は語根(基語)に変換され、レクサーによって処理され、索引を取り込むトークンとなる。
図5を参照すると、セマンティック逆クエリ拡張システム10は、多言語事業管理システム(MEMS)500内に実装することができる。MEMS500は、プロセスフローマネージャ510と、多言語サービスコンポーネント512と、中核事業サービス(CES)コンポーネント514と、通信ネットワーク518によって互いに連結されたユーザ516(たとえば、ユーザ516a(飛行機内)、ユーザ516b(船内)、ユーザ516c(個人情報端末(PDA)装置を用いる)、ユーザ516d(戦車内)、ユーザ516e(現場の情報要員等)、及びユーザ516f(オフィス内のアナリスト等))とを含む。プロセスフローマネージャ510は、ユーザ516が管理プロセス30によって強化型のクエリを開始、実行、及び受信することを可能にする。
多言語サービスコンポーネント512は、レクサー532のセットと、コード変換器534のセットと、翻訳機536のセットと、形態素解析器538のセットと、単語リスト542と、校正器544のセットと、光学文字認識装置(OCR)546と、他の多言語サービス548とを含む。
一例では、校正器544のセットは、文法、スペル、及び大文字化の誤りのような文書内の誤りを訂正する。別の例では、校正器544のセットは、索引作成、クエリ、及び翻訳に用いられる複合言語からの単語の型を標準化する。たとえば、アラビア語はいくつかの下位方言を含む。校正器544のセットを用いて、アラビア語の副方言をアラビア語の主流の形態、たとえば翻訳機のセットからの対応する翻訳機が用いることができる形態に変換する。校正器544のセットは通常、誤りを低減するために、索引作成、クエリ、及び機械翻訳機による翻訳の前に用いられる。
他の多言語サービス548は、レクサーと、コーパスと、分類法と、辞書と、終止符リストと、翻訳機と、言語識別子と、品詞識別子と、単語一義化装置と、抽出装置と、タグ付け装置と、知識ベースと、エージェントと、発話(口語)プロセッサと、視覚プロセッサと、索引付け装置と、ジスタ(gister:要点をつかむ装置)と、意味解釈機と、様々なタイプの言語オントロジー構成概念とを含むことができる。
CESコンポーネント514は、事業サービス管理(ESM)コンポーネント552と、ディスカバリサービスコンポーネント554と、メッセージングサービスコンポーネント556と、協調(コラボレーション)サービスコンポーネント558と、仲介サービスコンポーネント560と、ストレージサービスコンポーネント562と、セキュリティサービスコンポーネント564と、アプリケーションサービスコンポーネント566と、ユーザ支援コンポーネント568とを含む。CESコンポーネント514を用いてプロセスフローマネージャ510に対してサポート機能を提供することができる。
一例では、ESMコンポーネント552は、MEMS500のライフサイクル管理を可能にするサービスを含み、MEMS500において、サービス品質体系の監視、管理、及び実施を含む、情報フローを操作可能に管理するのに必要なアクティビティのパフォーマンスをサポートする。ESMコンポーネント552は、エンドツーエンド事業パフォーマンス監視、コンフィギュレーション管理、イベント相関問題の検出/解決、並びに事業資源の課金(accounting)及び割当て(addressing)(たとえば、ユーザ、システム、装置用)を提供することができる。ESMコンポーネント552は、事業用及び通信設備をサポートするための統合された操作可能なインフラの管理能力を提供することができる。ESMコンポーネント552は、自動又は手動のユーザアカウントと、動的プロファイル管理能力とを提供する。一例では、ESMコンポーネント552は、MEMS500内で用いられる全てのソフトウェア又は文書が認証された送信元から取得されたことを、それらがMEMS500内で用いられる前に検証するESMソフトウェア配布サービス(図示せず)を含む。
一例では、ディスカバリサービスコンポーネント554は、通常メタデータ及び/又はオントロジー記述の使用によって情報コンテンツ又は他のサービスの発見を可能にするアクティビティを含む。メタデータ及びオントロジー記述は、ファイル、データベース、サービス、ディレクトリ、ウェブページ、テンプレート等のようなデータアセットの記述である。メタデータ及びオントロジー記述は、たとえば、レジストリ、ディレクトリ、又はカタログのようなレポジトリ(図示せず)内に記憶されるか、又はそのようなレポジトリによって生成される。一例において、ディスカバリサービスコンポーネント554はメタデータレジストリにクエリを行うためのサーチエンジンサービスを含むことができる。一例では、プロセスフローマネージャ510は、ディスカバリサービスコンポーネント554と対話することができる。たとえば、プロセスフローマネージャ510は、プロセス600で用いるための特定の多言語サービスコンポーネント512を見つけるために、ディスカバリサービスコンポーネント554を利用する必要がある場合がある。ディスカバリサービスコンポーネントは、他のサービスコンポーネントとも対話することができる。たとえば、ディスカバリサービスコンポーネント554は、ストレージサービスコンポーネント562及びセキュリティサービスコンポーネント564と対話して、データ、メタデータ、及びオントロジーアセットが発見されると、それらに対するアクセスを提供する。
一例では、メッセージングサービスコンポーネント556は、同期及び非同期の情報交換をサポートする。メッセージングサービスコンポーネント556は事業インフラ上のユーザ間又はアプリケーション間で情報を交換する(たとえば、eメール、ファックス、メッセージ指向ミドルウェア、無線サービス、警告サービス等)。一例では、メッセージングサービスコンポーネント55は、たとえばオントロジー単語データをWordNet英語言語オントロジー(ニュージャージー州プリンストン、プリンストン大学)から送信、転送、及び受信するための技術サービスを提供する。メッセージングサービスコンポーネント55は、プロセスフローマネージャ510に、ユーザ間又はプロセス600で利用されるアプリケーション間で情報交換する能力を提供することができる。
一例では、協調サービスコンポーネント558は、個人及び団体が、非同期の環境(eメール、掲示板等)及び同期の環境(チャット、インスタントメッセージング等)において、通信及び共働することを可能にする。協調サービスコンポーネント558はプロセス600における全ての協調作業環境及び協調セッションの生成及び管理に用いられる。協調サービスのワークフローはプロセスフローマネージャ510によって管理される。協調サービスコンポーネント558は、協調作業環境において同期及び非同期の協調アクティビティを容易にする、別個の、且つ相関するアプリケーション及び/又はサービスを含む。
一例では、仲介サービスコンポーネント560は、変換処理、すなわち、たとえばデータ又はサービスの翻訳、集約、及び統合を可能にし、プレゼンス及び状況のサポート、すなわち、たとえばデータ又はサービスの相関及び融合を可能にすると共に、交渉、すなわち、たとえばデータ又はサービスの仲介及び交換を可能にする能力を提供する。仲介サービスは、共通の方法を通じて情報を交換する能力を向上させる交換フォーマットをマッピングするメカニズムを提供することができる。一例では、仲介サービスコンポーネント560はポイントツーポイント通信のための適合サービスを含む。仲介サービスコンポーネント560は、プロセスフローマネージャ510と対話することができる。たとえば、仲介サービスコンポーネント560によって、符号化フォーマットを変換するための適切なコード変換器534を用いることができる。
一例では、ストレージサービスコンポーネント562は、ネットワーク上にデータ又はメタデータをホスティングするための物理的及び仮想的な場所を提供する。ストレージサービスコンポーネント562は、アーカイビングのような、多様な持続期間を有するデータ又はメタデータのポスティング、ストレージ、及び、検索を要求に応じて提供する。また、ストレージサービスコンポーネント562は、連続動作及びコンテンツステージングのために、たとえば、編成及び処置の能力、並びにデータ及びメタデータのためのプロセスを提供する。一例では、ストレージサービスコンポーネント562は、プロセスフローマネージャ510によって管理されるプロセス600のトランザクションのアーカイブを含むことができる。ストレージサービスコンポーネント562は、協調サービスコンポーネント558に、利益共同体(COI:communities of interest)にとって利用可能且つ共有可能な情報を、異種コンピュータによって単一の論理データイメージから、いかなる場所でも、いかなる時でも、一貫した中央ストレージ管理を使用して作成する能力を提供することができる。
一例では、セキュリティサービスコンポーネント564は、MEMSシステム500、及びMEMS500が記憶、処理、維持、使用、共有、流布、配置、表示、又は送信を行う情報の保護、安全、統合、及び継続を可能にする。これは、ユーザに関する個人情報と、特定のコンテンツと、SEQEシステム10のような情報環境を形成するネットワーク(複数可)とを含む。セキュリティサービスコンポーネント564は、保護、検出、及び反応の能力を組み込むことによって、情報システムの復旧を可能にする。一例では、セキュリティサービスコンポーネント564は送信されたメッセージの認証を保護する。セキュリティサービスコンポーネント564は、プロセスフローマネージャ510と対話して、たとえば要求の受信時602に、プロセス600における安全な環境を保証することができる。
一例では、アプリケーションサービスコンポーネント566は、安全なネットワークコンピューティングインフラを提供、ホスティング、操作、管理、及び維持するサービスを含む。また、アプリケーションサービスコンポーネント566は、ユーザ又は企業に、インターネットを介してアプリケーション及び関連サービスへのアクセスも提供する(そうでなければ自身のパーソナルコンピュータ又は企業コンピュータ内に配置されなくてはならない)。一例では、アプリケーションサービスコンポーネント566は、負荷分散機能を監視及び提供するのに必要なアプリケーションを事業システムに提供する際の配布メカニズムである。プロセスフローマネージャ510と連携して動作して、アプリケーションサービスコンポーネント566は、SRQEシステム10を操作することができるか、又は多言語サービスコンポーネント512(たとえば、レクサー532、コード変換器534、翻訳機536、形態素解析器538、単語リスト542、校正器544、OCR546等)を管理するのに用いられるアプリケーションを、選択、サイジング、及びロードする操作を行う。
一例では、ユーザ補助サービスコンポーネント568は、ユーザ嗜好及び対話パターンを学習及び適用する、自動化された能力を提供する。プロセスフローマネージャ510がこの情報を用いて、ユーザがタスクの実行において効率的且つ効果的に資源を利用するのを補助することができる。一例では、ユーザ補助サービスコンポーネント568は、人手の集中するタスクを実行するのに要求される努力を低減する自動ヘルパーサービスを提供する。
コンポーネント(たとえば、多言語サービスコンポーネント512及びCESコンポーネント514)は、幾つかの異なるコンポーネントを表すことができる。たとえば、校正器544は幾つかの異なるメーカー、モデル、及び型の校正器を表すことができる。プロセスフローマネージャ510は特定のコンポーネントが特定のファクタに基づいて用いられることを保証する。
図6を参照すると、プロセスフローマネージャ510はCES514と連携して動作し、例示的なプロセス600を用いてユーザ512によるクエリを強化することができる。プロセス600はクエリ要求を受信する(602)。たとえば、プロセスマネージャ510は、通信ネットワーク518を通じてユーザ512のうちの1つから言語サービスの要求を受信する。
プロセス600は要求をファクタに適用する(604)。ファクタは、言語ID、要求される速度、要求される品質、ユーザ言語流暢性ファクタ、インタフェースファクタ、コンポーネント可用性、及び索引の存在を含むことができる。言語IDは翻訳される言語を含む。要求される速度は、ユーザによって要求される時間量を含む。ユーザは、たとえば、検索が10秒で完了されなくてはならないことを指定することができる。
要求される品質は、たとえば、F値を用いることを含むことができる。F値は適合率と再現率との和を2で除算したものである。適合率は、良好な結果を、良好な結果と誤警報との和で除算した数である。再現率は、良好な結果を、良好な結果とミスとの和で除算した数である。
ユーザ言語流暢性ファクタは、基準化された熟練度の数字又は単なるフラグを含むことができる。インタフェースファクタは、コンポーネント(たとえば、多言語サービス512及びCES514)間の接続速度を含む。索引の存在は、索引付けされたデータベース22内で検索されている単語に対する索引の存在を含むことができる。
プロセス600は、ファクタに基づいてクエリを処理するコンポーネントを選択する(606)。たとえば、プロセスフローマネージャ510は、プロセスフロー、及びいずれのコンポーネント(たとえば多言語サービス512及びCES514)をユーザによって要求されたクエリを処理するために用いるかを判断し、そのクエリの結果をユーザに転送する。
たとえば、バージニア州のアナリストは1つのプロセスフローを用いてクエリの結果を受信することができ、敵対区域にいる情報要員は同じクエリを使用して、同じクエリからであるが、MEMS500内の異なるコンポーネントを用いる異なるプロセスから、且つ幾つかの例においては異なる結果を、受信することができる。
プロセス600は結果をユーザに転送する(608)。幾つかの実施形態では、コンポーネントは処理ブロックから選択され(606)、プロセスマネージャ510によるさらなる対話をせずにユーザに結果を転送する。別の例では、結果は、MEMS500の精度及びパフォーマンスを監視するために、プロセスフローマネージャ510によって処理される。
図7は、本明細書におけるプロセス(たとえば、プロセス30及びプロセス600)を実行するのに用いることができるコンピュータ700を示す。コンピュータ700は、プロセッサ702と、揮発性メモリ704と、不揮発性メモリ706(たとえば、ハードディスク)とを含む。不揮発性メモリ706は、オペレーティングシステム710と、データ716と、プロセス(たとえば、プロセス30及びプロセス600)を実行するために揮発性メモリ704から取り出して実行されるコンピュータ命令714とを含む。コンピュータ700は、ユーザインタフェース(UI)724(たとえば、ユーザインタフェース14(図1))も含む。
本明細書で説明したプロセス(たとえば、プロセス30及びプロセス600)は、図7のハードウェア及びソフトウェアによる使用に限定されない。プロセスは、いかなる演算環境又は処理環境においても、またコンピュータプログラムを実行することが可能ないかなるタイプの機械又は機械のセットにも適応性を見出すことができる。プロセスは、ハードウェア、ソフトウェア、又はその2つの組合わせにおいて実施することができる。プロセスは、プログラム可能なコンピュータ/機械上で実行されるコンピュータプログラム内で実施することができ、プログラム可能なコンピュータ/機械はそれぞれ、プロセッサと、ストレージ媒体又はプロセッサによって読取り可能な他の物品(揮発性及び不揮発性メモリ並びに/又はストレージ要素を含む)と、少なくとも1つの入力装置と、1つ又は複数の出力装置とを含む。プログラムコードを、入力装置を用いて入力されたデータに適用して、本明細書で説明したプロセスを実行すると共に、出力情報を生成することができる。
システムは、データ処理装置(たとえば、プログラム可能なプロセッサ、又は1つ若しくは複数のコンピュータ))によって実行するか又は当該データ処理装置の動作を制御するために、少なくとも部分的にコンピュータプログラム物品(すなわち、情報担体において(たとえば、機械読取り可能ストレージ装置又は伝搬信号において)有形に具現化されたコンピュータプログラム)を介して実装することができる。そのようなプログラムはそれぞれ、コンピュータシステムと通信するために、高級手続き型プログラミング言語又はオブジェクト指向プログラミング言語で実施することができる。しかしながら、プログラムをアセンブリ言語又は機械言語で実施してもよい。言語はコンパイルされた言語又は解釈実行された言語とすることができ、独立型プログラムとしての形態、又はモジュール、コンポーネント、サブルーチン、若しくは演算環境での使用に適した他のユニットとしての形態を含む任意の形態でデプロイすることができる。コンピュータプログラムをデプロイして、1つのコンピュータ、又は、1つのサイトにある、若しくは複数のサイトにまたがって分布して通信ネットワークによって相互接続される複数のコンピュータ上で実行することができる。コンピュータプログラムは、ストレージ媒体又はストレージ装置がプロセスを実行するためにコンピュータによって読み出されるときに、コンピュータを構成及び操作するための、汎用プログラム可能コンピュータ又は専用プログラム可能コンピュータによって読取り可能なストレージ媒体又はストレージ装置(たとえば、CD−ROM、ハードディスク、又は磁気ディスケット)に記憶することができる。また、プロセスを、コンピュータプログラムと共に構成される、機械読取り可能ストレージ媒体として実施することができ、実行時に、コンピュータプログラム内の命令によって、コンピュータがプロセス(たとえば、プロセス30及びプロセス600)に従って動作する。
本明細書で説明したプロセスは、本発明書で説明される特定の実施形態に限定されない。たとえば、プロセスは図2及び図6の特定の処理順序に限定されない。むしろ、図2及び図6の処理ブロックのいずれかを、上記で説明した結果を達成するために、必要に応じて、並び替え、結合又は削除、並列又は連続で実行することができる。
本明細書で説明したシステムは、上記で説明したハードウェア及びソフトウェアによる使用に限定されない。システムは電子回路において、若しくはコンピュータハードウェア、ファームウェア、ソフトウェアにおいて、又はそれらの組み合わせにおいて実施することができる。
システムの実施に関連付けられる処理ブロックは、システムの機能を実行するために1つ又は複数のコンピュータプログラムを実行する1つ又は複数のプログラム可能なプロセッサによって実行することができる。システムの全て又は一部を、専用論理回路(たとえば、FPGA(フィールドプログラムマブルゲートアレイ)及び/又はASIC(特定用途向け集積回路)として実施することができる。
コンピュータプログラムの実行に適切なプロセッサは、一例として、汎用マイクロプロセッサ及び専用マイクロプロセッサの両方と、任意の種類のデジタルコンピュータの任意の1つ又は複数のプロセッサを含む。通常、プロセッサは、命令及びデータを読出し専用メモリ若しくはランダムアクセスメモリ又はその両方から受信する。コンピュータの要素は命令を実行するプロセッサと、命令及びデータを記憶する1つ又は複数のメモリ装置とを含む。
本明細書で説明した様々な実施形態の要素を結合して、上記で具体的に説明されていない他の実施形態を形成することができる。上記で具体的に説明されていない他の実施形態もまた、特許請求の範囲に含まれる。
セマンティック逆クエリ拡張(SRQE)システムの図である。 セマンティック逆クエリ拡張のプロセスの流れ図である。 SRQEシステムによって用いられる例示的なテンプレートである。 SRQEシステムによって用いられる例示的なテンプレートである。 SRQEシステムによって用いられる例示的なテンプレートである。 SRQEシステムによって用いられる例示的なテンプレートである。 SRQEシステムの例示的な使用の図である。 多言語事業システム(MEMS)の図である。 多言語データベースクエリを強化するプロセスの流れ図である。 図2及び図6のプロセスを実施することができるコンピュータシステムのブロック図である。

Claims (50)

  1. 多言語データクエリを行う方法であって、
    ソース言語で基本単語の単語オントロジーを決定し、
    前記基本単語の前記単語オントロジーを表す単語セットを生成し、
    前記単語セットのうちの少なくとも1つのサブセットをターゲット言語に翻訳し、
    前記単語セットのうちの前記少なくとも1つのサブセットを前記ターゲット言語から前記基本単語の前記ソース言語に翻訳する、
    ことを含む多言語データクエリ方法。
  2. 前記基本単語をユーザから受信することをさらに含む、請求項1に記載の方法。
  3. 前記基本単語の前記単語オントロジーの決定は、品詞に基づいて単語オントロジーを決定することを含む、請求項2に記載の方法。
  4. 前記品詞に基づく単語オントロジーの決定は、前記ユーザによって選択される品詞に基づいて前記単語の単語オントロジーを決定することを含む、請求項3に記載の方法。
  5. 前記基本単語の前記単語オントロジーを表す単語セットの生成は、同音異義語、類義語、上位語、及び下位語から成るグループから選択される単語セットを生成することを含む、請求項1に記載の方法。
  6. 前記単語セットの少なくとも1つのサブセットの翻訳は、ユーザによって選択される単語セットを翻訳することを含む、請求項5に記載の方法。
  7. 前記ユーザから、前記単語セットの少なくとも1つのサブセットからの選択を受信することをさらに含む、請求項6に記載の方法。
  8. 前記ユーザからの前記選択に基づいて、索引付けされたデータベースからデータを検索することをさらに含む、請求項7に記載の方法。
  9. 多言語データクエリを行う装置であって、
    ソース言語で基本単語のオントロジーを決定し、
    前記基本単語の前記オントロジーに基づいて単語セットを生成し、
    前記単語セットのうちの少なくとも1つのサブセットをターゲット言語に翻訳し、
    前記単語セットの少なくとも1つのサブセットを前記ターゲット言語から前記基本単語のソース言語に翻訳する、
    回路を備えた多言語データクエリ装置。
  10. 前記回路は、プロセッサ、メモリ、プログラマブルロジック、及びロジックゲートのうちの少なくとも1つを備える、請求項9に記載の装置。
  11. 前記基本単語をユーザから受信する回路をさらに含む、請求項9に記載の装置。
  12. 前記基本単語の単語オントロジーを決定する回路は、品詞に基づいて単語オントロジーを決定する回路を含む、請求項9に記載の装置。
  13. 前記品詞に基づいて単語オントロジーを決定する回路は、ユーザによって選択される品詞に基づいて前記単語の単語オントロジーを決定する回路を含む、請求項12に記載の装置。
  14. 前記基本単語の単語オントロジーを表す単語セットを生成する回路は、同音異義語、類義語、上位語、及び下位語から成るグループから選択される単語セットを生成する回路を含む、請求項9に記載の装置。
  15. 前記単語セットの少なくとも1つのサブセットを翻訳する回路は、ユーザによって選択される単語セットを翻訳する回路を含む、請求項14に記載の装置。
  16. ユーザから、前記単語セットの少なくとも1つのサブセットからの選択を受信する回路をさらに含む、請求項15に記載の装置。
  17. 前記ユーザからの前記選択に基づいて、索引付けされたデータベースからデータを検索する回路をさらに含む、請求項16に記載の装置。
  18. 多言語データクエリを行うための実行可能な命令を記憶する、機械読取り可能媒体を含む物品であって、該実行可能な命令は、機械に、
    ソース言語で基本単語のオントロジーを決定させ、
    前記基本単語の前記オントロジーに基づき単語セットを生成させ、
    前記単語セットの少なくとも1つのサブセットをターゲット言語に翻訳させ、
    前記単語セットの少なくとも1つのサブセットを前記ターゲット言語から前記基本単語の前記ソース言語に翻訳させる、
    機械読取り可能媒体を含む物品。
  19. 前記実行可能な命令は、機械に、前記基本単語をユーザから受信させる実行可能な命令をさらに含む、請求項18に記載の物品。
  20. 前記機械に、前記基本単語の前記単語オントロジーを定めさせる前記実行可能な命令は、前記機械に、品詞に基づいて単語オントロジーを定めさせる実行可能な命令を含む、請求項18に記載の物品。
  21. 前記機械に、品詞に基づいて単語オントロジーを決定させる前記実行可能な命令は、ユーザによって選択される品詞に基づいて前記単語の単語オントロジーを決定する回路を備える、請求項20に記載の物品。
  22. 前記機械に、前記基本単語の単語オントロジーを表す単語セットを生成させる前記命令は、前記機械に、同形同音異義語、類義語、上位語、及び下位語から成るグループから選択される単語セットを生成させる命令を含む、請求項18に記載の物品。
  23. 前記機械に、前記単語セットの少なくとも1つのサブセットを翻訳させる前記実行可能な命令は、前記機械に、ユーザによって選択される単語セットを翻訳させる命令を含む、請求項22に記載の物品。
  24. 前記実行可能な命令は、機械に、前記ユーザから前記単語セットのうちの前記少なくとも1つのサブセットからの選択を受信させる命令をさらに含む、請求項23に記載の物品。
  25. 前記実行可能な命令は、機械に、前記ユーザからの前記選択に基づいて、索引付けされたデータベースからデータを検索させる命令をさらに含む、請求項24に記載の物品。
  26. 多言語データクエリシステムであって、
    索引付けされたデータベースと、
    ユーザによって選択されるソース言語での基本単語を含むクエリを受信するように構成されるユーザインタフェースと、
    前記基本単語に基づいて単語セットを生成するように構成される単語オントロジーシステムと、
    前記単語セットのターゲット言語への翻訳を生成すると共に、該単語セットを前記ターゲット言語から前記ソース言語に翻訳するように構成される、翻訳機と、
    前記単語オントロジーシステム、前記ユーザインタフェース、前記索引付けされたデータベース、及び前記翻訳機に結合されるプロセッサであって、前記ユーザインタフェースから、前記単語セットから選択される単語を受信して、前記索引付けされたデータベース内を検索するように構成される、プロセッサと、
    を備えた多言語データクエリシステム。
  27. データストアと、
    前記データストアに結合されるコード変換器と、
    前記索引付けされたデータベース及び前記コード変換器に結合されるレクサーと、
    をさらに備え、前記データストア、前記コード変換器、及び前記レクサーは、索引付けされたデータベースを取り込むように構成される、請求項26に記載のシステム。
  28. 前記レクサーに結合される形態素解析器をさらに含む、請求項27に記載のシステム。
  29. 前記レクサーは前記ターゲット言語のレクサーである、請求項26に記載のシステム。
  30. 前記レクサーは前記ソース言語のレクサーである、請求項26に記載のシステム。
  31. 多言語データクエリ方法であって、
    クエリ要求を受信し、該クエリはターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含み、
    前記要求をファクタに適用し、
    前記ファクタに基づいてコンポーネントを選択し、
    前記選択に基づいてクエリを実行する、
    ことを含む多言語データクエリ方法。
  32. 前記クエリの実行は、
    前記ソース言語で前記基本単語の単語オントロジーを決定し、
    前記基本単語の前記単語オントロジーを表す単語セットを生成し、
    前記単語セットの少なくとも1つのサブセットを前記ターゲット言語に翻訳し、
    前記単語セットの少なくとも1つのサブセットを前記ターゲット言語から前記基本単語の前記ソース言語に翻訳する、
    ことを含む、請求項31に記載の方法。
  33. 前記コンポーネントの選択は、レクサー、コード変換器、翻訳機、形態素解析器、単語リスト、校正器、及び光学文字認識(OCR)装置から成るコンポーネントのグループから多言語サービスコンポーネントを選択することを含む、請求項31に記載の方法。
  34. 前記コンポーネントの選択は、事業サービス管理(ESM)コンポーネント、ディスカバリサービスコンポーネント、メッセージングサービスコンポーネント、協調サービスコンポーネント、仲介サービスコンポーネント、ストレージサービスコンポーネント、セキュリティサービスコンポーネント、アプリケーションサービスコンポーネント、及びユーザ補助コンポーネントから成るコンポーネントのグループから、中核事業サービスコンポーネントを選択することを含む、請求項31に記載の方法。
  35. 前記要求のファクタへの適用は、言語識別、要求される速度、要求される品質、ユーザ言語流暢性ファクタ、インタフェースファクタ、コンポーネント可用性、及び索引の存在から成るグループからのファクタに前記要求を適用することを含む、請求項31に記載の方法。
  36. 多言語データクエリを行う装置であって、
    ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含むクエリの要求を受信し、
    前記要求をファクタに適用し、
    前記ファクタに基づいてコンポーネントを選択し、
    選択する回路に基づいて前記クエリを実行する、
    回路を備えた多言語データクエリ装置。
  37. 前記回路は、プロセッサ、メモリ、プログラマブルロジック、及びロジックゲートのうちの少なくとも1つを備える、請求項36に記載の装置。
  38. 前記クエリを実行する回路は、
    前記ソース言語で前記基本単語の単語オントロジーを決定し、
    前記基本単語の前記単語オントロジーを表す単語セットを生成し、
    前記単語セットのうちの少なくとも1つのサブセットを前記ターゲット言語に翻訳し、
    前記単語セットのうちの前記少なくとも1つのサブセットを前記ターゲット言語から前記基本単語の前記ソース言語に翻訳する、
    回路を備える、請求項36に記載の装置。
  39. 前記コンポーネントを選択する回路は、レクサー、コード変換器、翻訳機、形態素解析器、単語リスト、校正器、及び光学文字認識(OCR)装置から成るコンポーネントのグループから多言語サービスコンポーネントを選択する回路を含む、請求項36に記載の装置。
  40. 前記コンポーネントを選択する回路は、事業サービス管理(ESM)コンポーネント、ディスカバリサービスコンポーネント、メッセージングサービスコンポーネント、協調サービスコンポーネント、仲介サービスコンポーネント、ストレージサービスコンポーネント、セキュリティサービスコンポーネント、アプリケーションサービスコンポーネント、及びユーザ補助コンポーネントから成るコンポーネントのグループから、中核事業サービスコンポーネントを選択する回路を含む、請求項39に記載の装置。
  41. 前記要求をファクタに適用する回路は、言語識別、要求される速度、要求される品質、ユーザ言語流暢性ファクタ、インタフェースファクタ、コンポーネント可用性、及び索引の存在から成るグループからのファクタに前記要求を適用する回路を含む、請求項36に記載の装置。
  42. 多言語データクエリを行うための実行可能な命令を記憶する、機械読取り可能媒体を含む物品であって、該実行可能な命令は、機械に、
    ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含むクエリの要求を受信させ、
    前記要求をファクタに適用させ、
    前記ファクタに基づいてコンポーネントを選択させ、
    前記選択に基づいて前記クエリを実行させる、
    機械読取り可能媒体を含む物品。
  43. 前記クエリを機械に実行させる命令は、機械に、
    前記ソース言語で前記基本単語の単語オントロジーを決定させ、
    前記基本単語の前記単語オントロジーを表す単語セットを生成させ、
    前記単語セットのうちの少なくとも1つのサブセットを前記ターゲット言語に翻訳させ、
    前記単語セットのうちの前記少なくとも1つのサブセットを前記ターゲット言語から前記基本単語の前記ソース言語に翻訳させる、
    命令を含む、請求項42に記載の物品。
  44. 前記機械に、コンポーネントを選択させる命令は、機械に、レクサー、コード変換器、翻訳機、形態素解析器、単語リスト、校正器、及び光学文字認識(OCR)装置から成るコンポーネントのグループから多言語サービスコンポーネントを選択させる命令を含む、請求項42に記載の物品。
  45. 前記機械に、コンポーネントを選択させる命令は、機械に、事業サービス管理(ESM)コンポーネント、ディスカバリサービスコンポーネント、メッセージングサービスコンポーネント、協調サービスコンポーネント、仲介サービスコンポーネント、ストレージサービスコンポーネント、セキュリティサービスコンポーネント、アプリケーションサービスコンポーネント、及びユーザ補助コンポーネントから成るコンポーネントのグループから、中核事業サービスコンポーネントを選択させる命令を含む、請求項42に記載の装置。
  46. 前記機械に、要求をファクタに適用させる命令は、機械に、言語識別、要求される速度、要求される品質、ユーザ言語流暢性ファクタ、インタフェースファクタ、コンポーネント可用性、及び索引の存在から成るグループからのファクタに前記要求を適用させる命令を含む、請求項42に記載の物品。
  47. 多言語データクエリシステムであって、
    クエリを受信するように構成されるユーザインタフェースであって、該クエリは、ターゲット言語でのデータベース検索に用いられるソース言語での基本単語を含む、ユーザインタフェースと、
    中核事業サービスコンポーネントのセットと、
    多言語サービスコンポーネントのセットと、
    プロセスフローマネージャであって、前記ユーザインタフェースから前記クエリを受信すると共に、ファクタのセットに基づいて前記中核事業コンポーネントのセット及び前記多言語サービスコンポーネントのセットからコンポーネントを選択して前記クエリを処理するように構成される、プロセスフローマネージャと、
    を含む、多言語データクエリシステム。
  48. 前記多言語サービスコンポーネントのセットは、レクサー、コード変換器、翻訳機、形態素解析器、単語リスト、校正器、及び光学文字認識(OCR)装置から成るコンポーネントのグループからのものである、請求項47に記載のシステム。
  49. 前記中核事業サービスコンポーネントのセットは、事業サービス管理(ESM)コンポーネント、ディスカバリサービスコンポーネント、メッセージングサービスコンポーネント、協調サービスコンポーネント、仲介サービスコンポーネント、ストレージサービスコンポーネント、セキュリティサービスコンポーネント、アプリケーションサービスコンポーネント、及びユーザ補助コンポーネントから成るコンポーネントのグループからのものである、請求項47に記載のシステム。
  50. 前記ファクタのセットは、言語識別、要求される速度、要求される品質、ユーザ言語流暢性ファクタ、インタフェースファクタ、コンポーネント可用性、及び索引の存在から成る群からのファクタを含む、請求項47に記載のシステム。
JP2009506514A 2006-04-19 2007-04-10 多言語データクエリ Active JP5361708B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US74514406P 2006-04-19 2006-04-19
US60/745,144 2006-04-19
US11/468,856 2006-08-31
US11/468,856 US7853555B2 (en) 2006-04-19 2006-08-31 Enhancing multilingual data querying
US11/468,853 2006-08-31
US11/468,853 US7991608B2 (en) 2006-04-19 2006-08-31 Multilingual data querying
PCT/US2007/008900 WO2007123838A1 (en) 2006-04-19 2007-04-10 Multilingual data querying

Publications (2)

Publication Number Publication Date
JP2009534745A true JP2009534745A (ja) 2009-09-24
JP5361708B2 JP5361708B2 (ja) 2013-12-04

Family

ID=38514055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009506514A Active JP5361708B2 (ja) 2006-04-19 2007-04-10 多言語データクエリ

Country Status (5)

Country Link
EP (1) EP2013778A1 (ja)
JP (1) JP5361708B2 (ja)
AU (1) AU2007240937B2 (ja)
CA (1) CA2649099C (ja)
WO (1) WO2007123838A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8402046B2 (en) * 2008-02-28 2013-03-19 Raytheon Company Conceptual reverse query expander

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305728A (ja) * 1995-05-10 1996-11-22 Oki Electric Ind Co Ltd 多言語間検索システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US7146361B2 (en) * 2003-05-30 2006-12-05 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND)
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305728A (ja) * 1995-05-10 1996-11-22 Oki Electric Ind Co Ltd 多言語間検索システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200500663006; 藤井 敦 他: 'Webマイニングによる事典的コンテンツの構築と多様なアクセス手法' 電子情報通信学会技術研究報告 第104巻、第102号, 20040531, pp.31-36, 社団法人電子情報通信学会 *
JPN6012020346; 藤井 敦 他: 'Webマイニングによる事典的コンテンツの構築と多様なアクセス手法' 電子情報通信学会技術研究報告 第104巻、第102号, 20040531, pp.31-36, 社団法人電子情報通信学会 *

Also Published As

Publication number Publication date
AU2007240937A1 (en) 2007-11-01
WO2007123838A1 (en) 2007-11-01
JP5361708B2 (ja) 2013-12-04
AU2007240937B2 (en) 2011-06-23
CA2649099A1 (en) 2007-11-01
CA2649099C (en) 2015-05-26
EP2013778A1 (en) 2009-01-14

Similar Documents

Publication Publication Date Title
US7853555B2 (en) Enhancing multilingual data querying
US7991608B2 (en) Multilingual data querying
Reber Overcoming language barriers: Assessing the potential of machine translation and topic modeling for the comparative analysis of multilingual text corpora
US20080249992A1 (en) Cross-language searching
US20150278195A1 (en) Text data sentiment analysis method
US9858314B2 (en) System and method for refining search results
US20020193986A1 (en) Pre-translated multi-lingual email system, method, and computer program product
JP2003529845A (ja) ネットワーク経由の多言語翻訳を提供する方法と装置
AU2009238294A1 (en) Data transformation based on a technical design document
KR20210048569A (ko) 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
US10606903B2 (en) Multi-dimensional query based extraction of polarity-aware content
US20110289115A1 (en) Scientific definitions tool
RU61442U1 (ru) Система автоматизированного упорядочения неструктурированного информационного потока входных данных
US9298689B2 (en) Multiple template based search function
JP6840597B2 (ja) 検索結果要約装置、プログラム及び方法
US20220129623A1 (en) Performance characteristics of cartridge artifacts over text pattern constructs
KR20210013991A (ko) 번역예 검색 기능을 갖는 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
Rasmussen et al. The data documentation initiative: a preservation standard for research
JP5361708B2 (ja) 多言語データクエリ
US11645472B2 (en) Conversion of result processing to annotated text for non-rich text exchange
Trips et al. From original sources to linguistic analysis: Tools and datasets for the investigation of multilingualism in medieval english
KR20210013989A (ko) 구성요소 번역 관리 기능을 갖는 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
KR20210013990A (ko) 특허 명세서 번역을 위한 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
KR20210013992A (ko) 자동완성 기능을 갖는 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
Fahl et al. SemPubFlow: a novel Scientific Publishing Workflow using Knowledge Graphs, Wikidata and LLMs–the CEUR-WS use case

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120718

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130805

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130903

R150 Certificate of patent or registration of utility model

Ref document number: 5361708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250