JP2011517495A - 辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法 - Google Patents

辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法 Download PDF

Info

Publication number
JP2011517495A
JP2011517495A JP2011501161A JP2011501161A JP2011517495A JP 2011517495 A JP2011517495 A JP 2011517495A JP 2011501161 A JP2011501161 A JP 2011501161A JP 2011501161 A JP2011501161 A JP 2011501161A JP 2011517495 A JP2011517495 A JP 2011517495A
Authority
JP
Japan
Prior art keywords
owl
ontology
terms
rdf
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011501161A
Other languages
English (en)
Other versions
JP5888978B2 (ja
Inventor
ラルベ,フィリップ
カレ,フランソワ
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2011517495A publication Critical patent/JP2011517495A/ja
Application granted granted Critical
Publication of JP5888978B2 publication Critical patent/JP5888978B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

オントロジを自動的に生成することを意図されたデバイス(D)は、オントロジを生成しなければならない用語が受け取られるたびに、i)この受け取られた用語の定義を特定するために辞書(DC)にアクセスすることと、次に、ii)この特定された定義から関連用語を抽出することと、次に、iii)抽出された関連用語のそれぞれの定義を特定するために辞書(DC)にアクセスすることと、次に、iv)受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築することであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築することとのために構成された分析モジュール(AM)を含む。

Description

本発明は、文書の分析に関し、より具体的には、文書分析または文書処理の文脈で使用されるオントロジ(ontology)を自動的に生成する方法およびデバイスに関する。
用語「自動的に生成」は、本明細書では、本発明によってオントロジを用語定義から自動的に生成でき、完成できることを意味する。
さらに、用語「オントロジ」は、本明細書では、所与の領域内で操作される用語(または概念)およびこれらの用語(または概念)の間の関係の形式記述(またはデータ・モデル)を叙述する。オントロジは、特に、ある領域内に存在するオブジェクトに関して推論するのに使用される。
当業者から知られているとおり、増加する数のアプリケーションが、文書の分析または処理を可能にし、またはこれに関係し、またはこれを容易にするためにオントロジを使用する。これは、特に、仕様書から実行可能アプリケーションを自動的に構築するデバイス、CRM(「カスタマ・リレーションシップ・マネジメント」)で着信電子メールを自動的に処理するのに使用されるテキスト分析、または自然言語要求から関連情報を見つけることができる「意味論検索エンジン」にあてはまる。
したがって、分析されまたは処理されがちなテキストに含まれる可能性がある用語(または概念)を完全にかつ正確に記述する、自由になるオントロジを有することが重要である。
現在、オントロジは、たとえば「Protege」(特にインターネット・アドレス「http://protege.standford.edu」で説明されている)などの専用ツールの援助によって手作業で構築される。これは、満足できるものではない。というのは、テキスト(または文書)が、オントロジ内の対応物がまだ存在しない用語(または概念)を含むたびに、専門家がオントロジ内に対応するエントリを手作業で構築するまで、このテキストの一部を正しく分析しまたは処理することができないからである。同様に、この用語(または概念)の同義語(または下位語または反意語…)がテキスト内で使用されている場合に、この用語の関連する定義または他の有用な用語との関係の欠如に起因して、このテキストの意味全体が誤解されることがある。
http://protege.standford.edu
したがって、本発明の目的は、オントロジの自動生成を可能にすることによってこの状況を改善することである。
このために、本発明は、オントロジを自動的に生成する方法であって、オントロジを生成しなければならない用語が受け取られるたびに、
−この受け取られた用語の定義を辞書内で特定するステップと、次に、
−この特定された定義から関連用語を抽出するステップと、次に、
−これらの抽出された関連用語のそれぞれの定義を辞書内で特定するステップと、次に、
−受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するステップであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築するステップと
からなる方法が提供される。
本発明による方法は、考慮される追加の特性を別々にまたは組み合わせて含むことができ、特に、
−論理節を構築し終えた後に、それらの論理節を、選択されたオントロジ言語に変換することができ、
>変換テーブルによって論理節を変換することができ、
>オントロジ言語は、少なくともOWL(「Ontology Web Language」)およびRDF(「Resource Description Framework」)を含む言語群から選択することができる。
本発明は、オントロジを自動的に生成するデバイスであって、オントロジを生成しなければならない用語が受け取られるたびに、
−この受け取られた用語の定義を特定するために辞書にアクセスすることと、次に、
−この特定された定義から関連用語を抽出することと、次に、
−抽出された関連用語のそれぞれの定義を特定するために辞書にアクセスすることと、次に、
−受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築することであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築することと
のために構成された分析手段を含むデバイスをも提供する。
本発明によるデバイスは、考慮される追加の特性を別々にまたは組み合わせて含むことができ、特に、
−構築された論理節を、選択されたオントロジ言語に変換するように構成された変換手段をさらに含むことができ、
>変換手段は、変換テーブルによって論理節を変換するように構成することができ、
・変換テーブルを格納するように構成された格納手段をさらに含むことができ、
>オントロジ言語は、少なくともOWLおよびRDFを含む言語群から選択することができる。
本発明は、上で紹介したものなどのデバイスを含むコンピュータ・ソフトウェア製品をも提供する。
本発明の他の特徴および利益は、下の詳細な説明および添付図面を調べる時に明白になる。
本発明によるデバイスの実施形態の例を概略的に示す図である。
添付図面は、本発明を完成させるだけではなく、必要な場合にその定義に寄与するようにも働く可能性がある。
本発明は、辞書に含まれる用語定義からオントロジを自動的に生成することを意図された、デバイス(D)および関連する方法を提供することを目指す。
本発明は、すべてのタイプの領域で操作される用語(または概念)およびこれらの用語(または概念)の間の関係を形式的な形で記述するすべてのオントロジを対象とする。
本発明によるデバイスDを、たとえばテキストまたは文書の分析または処理を意図された機器またはアプリケーションの一部とするかそれに結合することができることに留意することが重要である。したがって、そのようなデバイスDを、ソフトウェア・モジュールまたは電子回路(1つまたは複数)(またはハードウェア・モジュール)またはハードエア・モジュールおよびソフトウェア・モジュールの組合せからなるコンピュータ電子製品とすることができる。
唯一の図に概略的に示されているように、本発明によるデバイスDは、少なくとも分析モジュールAMを含む。
分析モジュールAMは、デバイスDが、オントロジを生成しなければならない用語(または概念)を受け取るたびに介入するように構成される。したがって、ある用語が受け取られる時に、分析モジュールAMは、この受け取られた用語の定義を特定するために、少なくとも1つの辞書DCにアクセスする。図示されているように、辞書DCを、デバイスDの第1格納手段SM1に格納することができる。しかし、これは必須ではない。実際に、辞書DCを、デバイスDからアクセス可能な外部格納手段に、たとえば通信ネットワークを介して遠くのサーバに格納することもできる。
少なくとも1つの辞書DCを格納でき、当業者から知られているすべてのタイプの第1格納手段SM1を使用することができる。したがって、第1格納手段SM1を、データベース、フラッシュ・メモリ、ROM、RAM、CD(「コンパクト・ディスク」)またはDVD(「ディジタル・ビデオ・ディスク」)、フラット・ファイル・システム、または任意の他の種類のリポジトリとすることができる。
たとえば、分析モジュールAMが、「translation(翻訳)」という概念の「意味論」を記述するオントロジを構築しなければならない場合に、分析モジュールAMは、辞書DC(ここでは、第1格納手段SM1に格納される)内で概念「translation」の定義を特定する。この定義を、「The act of converting a text from one language to another(ある言語から別の言語へテキストを変換する行為)」とすることができる。
次に、分析モジュールAMは、それが特定した用語(または概念)定義に含まれる関連用語を抽出する。このために、分析モジュールAMは、定義の意味論分析を実行することができる。「句内の関連用語」とは、句の「意味論的骨格」である単語または単語のセット(または「辞書編集的ストリング(lexical string)」)すなわち、主に名詞および動詞である。たとえば、文「The act of converting a text from one language to another(ある言語から別の言語へテキストを変換する行為)」では、関連用語は、「act of converting(変換する行為)」(すなわち、「conversion(変換)」または「convert(変換する)」)、「text」、および「language」である。
したがって、概念「translation」について、その定義の関連用語は、「convert」、「text」、および「language」である。
分析モジュールAMが、定義に含まれる関連用語を抽出し終えた時に、これらの抽出された関連用語のそれぞれの定義を特定するための辞書DCに対する分析モジュールAMの再度のアクセス。たとえば、概念「translation」の場合には、
−抽出された関連用語「convert」の定義は、「to transform or change something into another form,substance,state,or product(あるものを別の形、物質、状態、または産物に変形しまたは変更すること)」であり、
−抽出された関連用語「text」の定義は、「a written passage consisting of multiple characters,symbols or sentences(複数の文字、記号、または文からなる書かれた一節)」であり、
−抽出された関連用語「language」の定義は、「a system of communication using the spoken words or using symbols that represent words or sounds(単語または音を表す話された言葉または記号を使用することによるコミュニケーションの体系)」である。
分析モジュールAMが、受け取られた用語(または概念)の定義から抽出された各関連用語の定義を特定し終えた時に、分析モジュールAMは、受け取られた用語(または概念)および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築する。構築される論理節のセットは、受け取られた用語(または概念)のオントロジを定義する。用語「節」は、ここでは、ブルバキの集合論の意味で理解されなければならない。
たとえば、概念「translation」の場合には、
−「translation」の定義は、次の論理節を与える。
>「translation is an act of converting(翻訳は、変換する行為である)」、
>「the conversion concerns a text(変換は、テキストに関係する)」、および
>「the text is converted from one language to another language(テキストは、ある言語から別の言語に変換される)」。
−「text」の定義は、次の論理節を与える。
>「a text is a written passage(テキストは、書かれた一節である)」、
>「the passage consists of several characters(一節は、複数の文字からなる)」、または
>「the passage consists of several symbols(一節は、複数の記号からなる)」、または
>「the passage consists of several sentences(一節は、複数の文からなる)」、
>「a sentence is a set of words(文は、単語のセットである)」、および
>「a sentence has a grammatical structure(文は、文法構造を有する)」。
分析モジュールAMを、2つのサブモジュールすなわち、定義を特定するために辞書DCにアクセスする第1サブモジュールと、第1サブモジュールによって特定された定義に含まれる関連用語を抽出する第2サブモジュールとに分割できることに留意することが重要である。
唯一の図の非限定的な例に示されているように、本発明によるデバイスDは、変換モジュールCMをも含むことができる。この変換モジュールCMは、論理節(分析モジュールAMによって構築された)を、たとえばOWL(「Ontology Web Language」)またはRDF(「Resource Description Framework」)などの選択されたオントロジ言語に変換することが意図されている。
OWLおよびRDFが、W3C(「World Wide Web Consortium」)によって開発され、標準化された2つのオントロジ言語であることを想起されたい。
論理節のセットの変換を実行するために、変換モジュールCMは、変換テーブルCTを使用することができる。図示されているように、そのような変換テーブルCTを、デバイスDの第2格納手段SM2に格納することができる。しかし、これは必須ではない。実際に、変換テーブルCTを、デバイスDからアクセス可能な外部格納手段に、たとえば通信ネットワークを介して遠くのサーバに格納することもできる。
少なくとも1つの変換テーブルCTを格納でき、当業者から知られているすべてのタイプの第2格納手段SM2を使用することができる。したがって、第2格納手段SM2を、データベース、フラッシュ・メモリ、ROM、RAM、CDまたはDVD、フラット・ファイル・システム、または任意の他の種類のリポジトリとすることができる。
第1格納手段SM1および第2格納手段SM2を、同一の格納手段の2つの部分とすることができることに留意することが重要である。
変換モジュールCMは、出力を含み、この出力で、変換した論理節のセットを送達し、この出力は、そのデバイスDによって以前に受け取られた用語(または概念)に対応するオントロジONを定義する。
唯一の図の非限定的な例に示されているように、本発明によるデバイスDは、変換モジュールCMが、それが変換した論理節のセットを格納できる第3格納手段SM3をも含むことができる。オントロジONを定義する(変換された)論理節のセットを格納でき、当業者から知られているすべてのタイプの第3格納手段SM3を使用することができる。したがって、第3格納手段SM3を、データベース、フラッシュ・メモリ、ROM、RAM、フラット・ファイル・システム、または任意の他の種類のリポジトリとすることができる。
第1格納手段SM1および/または第2格納手段SM2および/または第3格納手段SM3を、同一の格納手段の2つまたは3つの部分とすることができることに留意することが重要である。
OWL変換テーブルCTの一部の非限定的な例を、下に与える。
Figure 2011517495
この変換テーブルCTでは、各論理節が、OWLにおける対応物に変換される。
変換テーブルCTのそのような例があれば、OWL内の用語「Translation」を説明する(すなわち、OWL内の変換された論理節を有する)オントロジONを含むXMLファイルの次の例を生成することが可能である(「<!−−・・・−−>」の内部の斜体のコメントは、論理節が変換モジュール(または、オントロジ・ジェネレータ)CMによってどのように解釈されるのかを示す)。
<?xml version="1.0"?>
<rdf:RDF
xmlns="file:Domain_Translation.owl#"
xml:base="file:Domain_Translation.owl#"
xmlns:owl=http://www.w3.org/2002/07/owl#
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:rdfs=http://www.w3.org/2000/01/rdf-schema#
xmlns:xsd="http://www.w3.org/2001/XMLSchema#">

<owl:Ontology rdf:about="">
<rdfs:description>
Domain Ontology for Translation
</rdfs:description>
<rdfs:comment>This ontology has been fully generated from natural language by AutogenerativeOntologyBuilder.</rdfs:comment>
</owl:Ontology>

<owl:Class rdf:ID="Translation">
<rdfs:description>Translation is the name of the Domain addressed by this ontology.</rdfs:description>
</owl:Class>

<!-- heritage: Translation is-a-kind-of conversion -->
<owl:Class rdf:ID="conversion" />
<owl:Class rdf:about="#Translation">
<rdfs:subClassOf>
<owl:Class rdf:about="#conversion"/>
</rdfs:subClassOf>
</owl:Class>

<!-- synonym: conversion is-synonym-of act_of_converting -->
<owl:Class rdf:ID="act_of_converting" />
<owl:Class rdf:about="#conversion">
<equivalentClass rdf:resource="#act_of_converting"/>
</owl:Class>

<!-- obj_property: conversion concerns text -->
<owl:ObjectProperty rdf:ID="concerns">
<rdfs:domain rdf:resource="#conversion"/>
<rdfs:range rdf:resource="#text"/>
</owl:ObjectProperty>

<!-- assoc: text is_converted_from (1) language -->
<owl:Class rdf:ID="text" />
<owl:Class rdf:ID="language" />
<owl:ObjectProperty rdf:ID="is_converted_from">
<rdfs:domain rdf:resource="#text"/>
<rdfs:range rdf:resource="#language"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#text">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#is_converted_from"/>
<owl:cardinality>1</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- assoc: text is_converted_to (1) language -->
<owl:ObjectProperty rdf:ID="is_converted_to">
<rdfs:domain rdf:resource="#text"/>
<rdfs:range rdf:resource="#language"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#text">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#is_converted_to"/>
<owl:cardinality>1</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- heritage: text is-a-kind-of passage -->
<owl:Class rdf:ID="passage" />
<owl:Class rdf:about="#text">
<rdfs:subClassOf>
<owl:Class rdf:about="#passage"/>
</rdfs:subClassOf>
</owl:Class>

<!-- data_property: passage has the property: isWritten = written -->
<owl:DatatypeProperty rdf:ID="isWritten">
<rdfs:domain rdf:resource="#passage" />
<rdfs:range rdf:datatype="string"/>
<rdfs:description>
Written
</rdfs:description>
</owl:DatatypeProperty>

<!-- composition: passage isComposedOf (1..n) character -->
<owl:Class rdf:ID="character" />
<owl:ObjectProperty rdf:ID="isComposedOf">
<rdfs:domain rdf:resource="#passage"/>
<rdfs:range rdf:resource="#character"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#passage">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- composition: passage isComposedOf (1..n) symbol -->
<owl:Class rdf:ID="symbol" />
<owl:ObjectProperty rdf:about="#isComposedOf">
<rdfs:domain rdf:resource="#passage"/>
<rdfs:range rdf:resource="#symbol"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#passage">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- composition: passage isComposedOf (1..n) sentence -->
<owl:Class rdf:ID="sentence" />
<owl:ObjectProperty rdf:about="#isComposedOf">
<rdfs:domain rdf:resource="#passage"/>
<rdfs:range rdf:resource="#sentence"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#passage">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- composition: sentence isComposedOf (1..n) word -->
<owl:Class rdf:ID="word" />
<owl:ObjectProperty rdf:about="#isComposedOf">
<rdfs:domain rdf:resource="#sentence"/>
<rdfs:range rdf:resource="#word"/>
</owl:ObjectProperty>

<owl:Class rdf:about="#sentence">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#isComposedOf"/>
<owl:cardinality>1..n</owl:cardinality>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>

<!-- obj_property: sentence has grammatical_structure -->
<owl:ObjectProperty rdf:ID="has">
<rdfs:domain rdf:resource="#sentence"/>
<rdfs:range rdf:resource="#grammatical_structure"/>
</owl:ObjectProperty>

<!-- data_property: sentence has the property: hasGrammaticalStructure = grammatical structure -->
<owl:DatatypeProperty rdf:ID="hasGrammaticalStructure">
<rdfs:domain rdf:resource="#sentence" />
<rdfs:range rdf:datatype="string"/>
<rdfs:description>
grammatical structure
</rdfs:description>
</owl:DatatypeProperty>

</rdf:RDF>
概念「translation」に対応するオントロジONの上で述べた例を用いると、推論を行い、「what is a translation?(翻訳とは何か)」、「what is concerned by a translation?(翻訳は何に関係するのか)」、「what is the role of a text in the translation?(翻訳におけるテキストの役割は何か)」、「how languages are used in a translation?(言語は翻訳でどのように使用されるのか)」などの質問に答えることが可能になる。
本発明を、オントロジを自動的に生成する方法に関して検討することもできる。
そのような方法を、唯一の図を参照して上で説明したものなどのデバイスDによって実施することができる。したがって、その主な特性だけに、下で言及する。
本発明による方法は、オントロジを生成しなければならない用語が受け取られるたびに、
−この受け取られた用語の定義を辞書DC内で特定するステップと、次に、
−この特定された定義から関連用語を抽出するステップと、次に、
−これらの抽出された関連用語のそれぞれの定義を辞書DC内で特定するステップと、次に、
−受け取られた用語および抽出された関連用語の特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するステップであって、これらの構築される論理節は、受け取られた用語のオントロジを定義する、構築するステップと
からなる。
本発明は、処理時間を減らすことができるのでテキスト処理またはテキスト分析の性能を改善するだけではなく、テキストの「理解」の深さが増えるのでテキスト処理またはテキスト分析の性能を改善することを可能にする。たとえば、文法手法または意味論手法を用いて顧客電子メールを処理することを意図されたCRMアプリケーションの場合に、テキスト・プロセッサおよび文法アナライザの機能は、i)異なる用語および概念を一緒にリンクすることができ、ii)用語の間の関係を確立することができ、iii)分析の深さおよび妥当性を高めることができるので、特に改善される。さらに、オントロジの自動構築は、自然言語要求または自然言語処理の領域の強力なツールの使用を可能にする。
本発明は、例としてのみ上で説明した方法およびデバイスの実施形態に限定されるのではなく、当業者によって添付の特許請求の範囲の範囲に含まれると考えられる可能性があるすべての代替実施形態を含む。

Claims (11)

  1. オントロジを自動的に生成する方法であって、オントロジを生成しなければならない用語が受け取られるたびに、i)前記受け取られた用語の定義を辞書(DC)内で特定するステップと、次に、ii)前記特定された定義から関連用語を抽出するステップと、次に、iii)前記抽出された関連用語のそれぞれの定義を前記辞書(DC)内で特定するステップと、次に、iv)前記受け取られた用語および前記抽出された関連用語の前記特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築するステップとを含み、前記構築される論理節は、前記受け取られた用語のオントロジを定義する、方法。
  2. 前記論理節を構築し終えた後に、それらの論理節を選択されたオントロジ言語に変換する、請求項1に記載の方法。
  3. 変換テーブル(CT)によって前記論理節を変換する、請求項2に記載の方法。
  4. 前記オントロジ言語は、少なくともOWLおよびRDFを含む言語群から選択される、請求項2または3に記載の方法。
  5. オントロジを自動的に生成するデバイス(D)であって、分析手段(AM)を含み、前記分析手段は、オントロジを生成しなければならない用語が受け取られるたびに、i)前記受け取られた用語の定義を特定するために辞書(DC)にアクセスし、次に、ii)前記特定された定義から関連用語を抽出し、次に、iii)前記抽出された関連用語のそれぞれの定義を特定するために前記辞書(DC)にアクセスし、次に、iv)前記受け取られた用語および前記抽出された関連用語の前記特定された定義のそれぞれについて、含まれる関連用語の対の間の関係を表す少なくとも1つの論理節を構築する、よう構成され、前記構築される論理節は、前記受け取られた用語のオントロジを定義する、デバイス。
  6. 前記構築された論理節を、選択されたオントロジ言語に変換するように構成された変換手段(CM)をさらに含む、請求項5に記載のデバイス。
  7. 前記変換手段(CM)は、変換テーブル(CT)によって前記論理節を変換するように構成される、請求項6に記載のデバイス。
  8. 前記変換テーブル(CT)を格納するように構成された格納手段(SM2)をさらに含む、請求項7に記載のデバイス。
  9. 前記オントロジ言語は、少なくともOWLおよびRDFを含む言語群から選択される、請求項6乃至8のいずれか1項に記載のデバイス。
  10. 前記辞書(DC)を格納するように構成された他の格納手段(SM1)をさらに含む、請求項5乃至9のいずれか1項に記載のデバイス。
  11. 請求項5乃至10のいずれか1項に記載のデバイス(D)を含むコンピュータ・ソフトウェア製品。
JP2011501161A 2008-03-27 2009-02-24 辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法 Expired - Fee Related JP5888978B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08300157.8 2008-03-27
EP08300157A EP2105847A1 (en) 2008-03-27 2008-03-27 Device and method for automatically generating ontologies from term definitions contained into a dictionary
PCT/EP2009/052176 WO2009118223A1 (en) 2008-03-27 2009-02-24 Device and method for automatically generating ontologies from term definitions contained into a dictionary

Publications (2)

Publication Number Publication Date
JP2011517495A true JP2011517495A (ja) 2011-06-09
JP5888978B2 JP5888978B2 (ja) 2016-03-22

Family

ID=39496116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011501161A Expired - Fee Related JP5888978B2 (ja) 2008-03-27 2009-02-24 辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法

Country Status (6)

Country Link
US (1) US20100179969A1 (ja)
EP (1) EP2105847A1 (ja)
JP (1) JP5888978B2 (ja)
KR (1) KR101587026B1 (ja)
CN (1) CN101546339A (ja)
WO (1) WO2009118223A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2596599C2 (ru) * 2015-02-03 2016-09-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Система и способ создания и использования пользовательских онтологических моделей для обработки пользовательского текста на естественном языке

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1903454A1 (en) * 2006-09-19 2008-03-26 Alcatel Lucent Method, used by computers, for developing an ontology from a text in natural language

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
CN100417130C (zh) * 2000-03-07 2008-09-03 日本电信电话株式会社 语义信息网络(sion)
US7774388B1 (en) * 2001-08-31 2010-08-10 Margaret Runchey Model of everything with UR-URL combination identity-identifier-addressing-indexing method, means, and apparatus
US7284196B2 (en) * 2001-10-05 2007-10-16 Vitria Technology, Inc. Vocabulary and syntax based data transformation
AU2003210803A1 (en) * 2002-02-01 2003-09-02 John Fairweather A system and method for real time interface translation
US20050149538A1 (en) * 2003-11-20 2005-07-07 Sadanand Singh Systems and methods for creating and publishing relational data bases
JP2005165958A (ja) * 2003-12-05 2005-06-23 Ibm Japan Ltd 情報検索システム、情報検索支援システム及びその方法並びにプログラム
US7630947B2 (en) * 2005-08-25 2009-12-08 Siemens Medical Solutions Usa, Inc. Medical ontologies for computer assisted clinical decision support
AU2008350882A1 (en) * 2008-02-22 2009-08-27 Lead Horse Technologies, Inc. Automated ontology generation system and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1903454A1 (en) * 2006-09-19 2008-03-26 Alcatel Lucent Method, used by computers, for developing an ontology from a text in natural language

Also Published As

Publication number Publication date
US20100179969A1 (en) 2010-07-15
KR101587026B1 (ko) 2016-01-20
KR20100135841A (ko) 2010-12-27
JP5888978B2 (ja) 2016-03-22
CN101546339A (zh) 2009-09-30
EP2105847A1 (en) 2009-09-30
WO2009118223A1 (en) 2009-10-01

Similar Documents

Publication Publication Date Title
US11250842B2 (en) Multi-dimensional parsing method and system for natural language processing
Augustinus et al. Example-based treebank querying.
US20160042058A1 (en) Processing Natural-Language Documents and Queries
US20100121630A1 (en) Language processing systems and methods
Alrehaili et al. Computational ontologies for semantic tagging of the Quran: A survey of past approaches
Tyers et al. Towards a free/open-source universal-dependency treebank for kazakh
KR20230005797A (ko) 질의어를 처리하는 장치, 방법 및 컴퓨터 프로그램
US20060224566A1 (en) Natural language based search engine and methods of use therefor
Gang et al. Chinese intelligent chat robot based on the AIML language
Srivastava et al. Improving machine translation through linked data
Choudhury et al. Bridging Bangla to Universal Networking Language-a human language neutral meta-language
JP5888978B2 (ja) 辞書に含まれる用語定義からオントロジを自動的に生成するデバイスおよび方法
KR20100003087A (ko) 온톨로지 프로퍼티를 이용한 온톨로지 인스턴스 추출시스템 및 그 방법
Jayan et al. Difficulties in processing malayalam verbs for statistical machine translation
Di Maro et al. Graph databases for designing high-performance speech recognition grammars
Dietrich et al. Multilingual extraction and mapping of dictionary entry names in business schema integration
KR20170088467A (ko) 의미역 결정 기술을 활용한 온톨로지 기반 지식베이스 구축 방법
Schneider et al. Towards Practical Semantic Interoperability in NLP Platforms
Vileiniškis et al. Searching the web by meaning: a case study of Lithuanian news websites
WO2020026229A2 (en) Proposition identification in natural language and usage thereof
Yang et al. Construction of an “Analects of Confucius” knowledge base including pragmatics information
Alrehaili et al. Discovering Qur’anic Knowledge through AQD: Arabic Qur’anic Database, a Multiple Resources Annotation-level Search
Ramachandran et al. NLION: N atural L anguage I nterface for querying ON tologies
Alawwad et al. An Intelligent Database System using Natural Language Processing
Zárate et al. A portable natural language interface for diverse databases using ontologies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120222

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140704

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140714

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140725

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150828

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160216

R150 Certificate of patent or registration of utility model

Ref document number: 5888978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees