JP4427500B2 - 意味解析装置、意味解析方法および意味解析プログラム - Google Patents

意味解析装置、意味解析方法および意味解析プログラム Download PDF

Info

Publication number
JP4427500B2
JP4427500B2 JP2005283477A JP2005283477A JP4427500B2 JP 4427500 B2 JP4427500 B2 JP 4427500B2 JP 2005283477 A JP2005283477 A JP 2005283477A JP 2005283477 A JP2005283477 A JP 2005283477A JP 4427500 B2 JP4427500 B2 JP 4427500B2
Authority
JP
Japan
Prior art keywords
concept
data
instance
semantic analysis
item name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005283477A
Other languages
English (en)
Other versions
JP2007094775A (ja
Inventor
隆浩 川村
晃嗣 上野
伸一 長野
哲夫 長谷川
昭彦 大須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005283477A priority Critical patent/JP4427500B2/ja
Priority to US11/362,224 priority patent/US7953592B2/en
Publication of JP2007094775A publication Critical patent/JP2007094775A/ja
Application granted granted Critical
Publication of JP4427500B2 publication Critical patent/JP4427500B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Description

本発明は、自然文中において使用されている言葉の意味を解析する意味解析装置、意味解析方法および意味解析プログラムに関するものである。
従来、人間の言葉を計算機に理解させることを大目標として、自然文を対象として文中で使われている言葉の意味を解析する自然言語処理、特に意味解析に関する研究が広く行われている。
例えば、意味クラス解析技術として、28万語彙の形態素辞書とそれに含まれるプロパティ(106種の意味クラスや共起語の定義)を用いた、対象分野における文章の解析が行われている(例えば、「非特許文献1」参照)。
また、対象をテーブルに絞り、オントロジーを活用し、インスタンスからクラスを判定し、属性名領域と属性値領域を抽出する処理が開示されている(例えば、「特許文献1」参照)。さらに、オントロジーを用いて、単語を分類する技術も開示されている(例えば、「特許文献2」参照)。
特開2001−325284号公報 米国特許第6487545号明細書 質問応答技術に基づくマルチモーダルヘルプシステム,情報処理学会研究報告 デジタル・ドキュメント,No.36, 2004.
しかしながら、こうしたアプローチにおいては一般に、意味解析の適合率が60−70%と低く問題となっていた。さらに、ルール作成やその保守作業が煩雑であるという問題もあった。
本発明は、上記に鑑みてなされたものであって、煩雑な処理を要さず高精度に意味解析を行うことのできる意味解析装置を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、意味解析装置であって、項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得手段と、前記データ取得手段が取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出手段と、前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスと、前記コンセプトと他のコンセプトの間の関係を示す属性とを対応付けて保持するコンセプト保持手段と、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトを検索することにより、前記項目値抽出手段によって抽出された前記項目値の文字列と少なくとも一部一致するインスタンスを特定し、特定した前記インスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定手段と、前記コンセプト特定手段により特定された前記コンセプトと、前記項目名とを対応付ける対応付手段と、前記データ取得手段が取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索手段と、前記コンセプト保持手段において、前記コンセプト検索手段により検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索手段と、前記インスタンス検索手段が前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索手段により検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加手段とを備えたことを特徴とする。
また、本発明の他の形態は、意味解析装置における意味解析方法であって、前記意味解析装置は、前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスと、前記コンセプトと他のコンセプトの間の関係を示す属性とを対応付けて保持するコンセプト保持手段を備え、データ取得手段が、項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得ステップと、項目値抽出手段が、前記データ取得ステップにおいて取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出ステップと、コンセプト特定手段が、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトを検索することにより、前記項目値抽出ステップにおいて抽出された前記項目値の文字列と少なくとも一部一致するインスタンスを特定し、特定した前記インスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定ステップと、対応付手段が、前記コンセプト特定ステップにおいて特定された前記コンセプトと、前記項目名とを対応付ける対応付ステップと、コンセプト検索手段が、前記データ取得ステップにおいて取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索ステップと、インスタンス検索手段が、前記コンセプト保持手段において、前記コンセプト検索ステップにおいて検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索ステップと、インスタンス追加手段が、前記インスタンス検索ステップにおいて前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索ステップにおいて検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加ステップとを有することを特徴とする。
また、本発明の他の形態は、意味解析処理をコンピュータに実行させるための意味解析プログラムであって、前記コンピュータは、前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスと、前記コンセプトと他のコンセプトの間の関係を示す属性とを対応付けて保持するコンセプト保持手段を備え、項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得ステップと、前記データ取得ステップにおいて取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出ステップと、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトを検索することにより、前記項目値抽出ステップにおいて抽出された前記項目値の文字列と少なくとも一部一致するインスタンスを特定し、特定した前記インスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定ステップと、前記コンセプト特定ステップにおいて特定された前記コンセプトと、前記項目名とを対応付ける対応付ステップと、前記データ取得ステップにおいて取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索ステップと、前記コンセプト保持手段において、前記コンセプト検索ステップにおいて検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索ステップと、前記インスタンス検索ステップにおいて前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索ステップにおいて検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加ステップと前記コンピュータに実行させるための意味解析プログラムである
本発明にかかる意味解析装置は、コンセプトとインスタンスを参照することにより、より精度よく意味解析を行うことができるという効果を奏する。
以下に、本発明にかかる意味解析装置、意味解析方法および意味解析プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
図1は、意味解析装置10の構成を示すブロック図である。意味解析装置10は、データ取得部100と、項目値抽出部102と、コンセプト特定部104と、コンセプト対応付部106と、オントロジーDB110と、コンセプト抽出部120と、インスタンス追加部122とを備えている。
意味解析装置10は、所定のデータ形式で表現されるデータから、RDF(Resouce Desucription Framework)形式でのXML(eXtensible Markup Language)を生成する。
データ取得部100は、外部からデータを取得する。そして、意味解析装置10において扱う内部形式に変換する。ここで外部から取得するデータは、意味解析の処理対象となるデータである。また、このデータは、所定のデータ形式で表現される半構造化されたデータである。具体的には、「項目名:項目値」というようにコロン「:」の直前に項目名が記載され、コロンの直後に項目値が記載される。
データ取得部100は、具体的には、このようなデータ形式で表されたHTML(HyperText Markup Language)や表形式で記述されたメタデータを取得する。さらに、このメタデータには、このデータ形式で記載された項目名と項目値の組み合わせが1組以上含まれている。
なお、所定のデータ形式で表現されたデータは、その文法(シンタクス)を制限するものではなく、データの意味的な構成を制限するものである。このため、実際のデータは、テキスト形式以外にも表形式などであってもよい。例えば、二列の表形式をデータ形式としてもよい。この場合には、二列のうち左側に記載されている内容が項目名であり、右側に記載されている内容が項目値である。
項目値抽出部102は、データ取得部100が取得したWebページから項目値を取得する。なお、項目値抽出部102は、上述のデータ形式に基づいてコロンを検索し、コロンの直後に記載されている内容を項目値として抽出する。
オントロジーDB110は、オントロジーを格納している。オントロジーとは、対象とする世界をある知識表現言語を用いてモデリングしたものである。なお、本実施の形態においては、例えば,W3C(World Wide Web Consortium)で標準化が進められているOWL(Web Ontology Language)などで記述可能であることを前提としている。すなわち、特定の状況における役割(ロール)など、より詳細なオントロジー使用は考慮しないものとする。なお、オントロジーDB110は、コンセプト保持手段に相当する。
オントロジーDB110は、具体的には、複数のコンセプトを格納している。コンセプトとは、データに含まれる意味的な概念である。さらに複数のコンセプトの間の関係を示す情報である属性を格納している。ここで、コンセプト間の関係としては、例えばコンセプトAがコンセプトBの一部である関係、すなわち全体部分関係(part of)や、コンセプトAがコンセプトBの一種である関係、すなわち上位下位関係(is a)などがある。また、コンセプトAがコンセプトBを抽象化したものである関係、すなわち抽象具体化関係(instance of)などがある。
コンセプト特定部104は、オントロジーDB110を参照し項目値抽出部102によって抽出された項目値に対応する項目名のコンセプトを特定する。なお、コンセプト特定部104は、所定の条件に基づいて、コンセプトを特定する際に検索するコンセプト、すなわち検索対象を特定する。すなわち、コンセプト特定部104は、検索対象特定手段として機能する。
コンセプト付与部106は、コンセプト特定部104において特定されたコンセプトを項目名に付与する。すなわち、項目名とコンセプトとを対応付ける。具体的には、RDFのXML形式で記述する。そして、コンセプトが付与された状態で出力する。すなわち、コンセプト付与部106は、コンセプト対応付手段として機能する。
コンセプト抽出部120は、データ取得部100が取得したデータからコンセプトを抽出する。インスタンス追加部122は、コンセプト抽出部120により抽出されたコンセプトに基づいて、データ取得部100が取得したデータに含まれる項目値をインスタンスとしてオントロジーDB110に新たに追加する。
なお、インスタンス追加部122は、オントロジーDB110においてコンセプトを検索するコンセプト検索手段、オントロジーDB110においてインスタンスを検索するインスタンス検索手段およびインスタンス追加手段として機能する。
図2は、オントロジーDB110に格納されているコンセプト対応テーブル112のデータ構成を示す図である。コンセプト対応テーブル112は、コンセプト(クラス)フィールドと、インスタンスフィールドと、属性フィールドとを有している。
コンセプトフィールドには、項目名に付与されるべきコンセプトが格納されている。また、インスタンスには、対応するコンセプトに含まれる具体的なデータが格納されている。例えば、「Wine Color」というコンセプトに対しては、「Red」,「「Rose」,「White」など「Wine Color」の具体的なデータが格納されている。すなわち、コンセプトとは、インスタンスに対するクラスに相当するデータである。
属性フィールドには、コンセプトの属性が格納されている。すなわち、対象とするコンセプトと他のコンセプトとの間の関係を示すデータが格納されている。上述の「part of」関係や「is a」関係に加えて、各コンセプト特有の属性も格納されている。
例えば、コンセプト「Wine」に対する属性として、「has Color」が格納されている。これは、「Wine」に特有の属性であり、「Color」というコンセプトを持つことを示している。ここで、「Wine」と「has Color」は、主語と述語の関係にある。さらに、コンセプト「Wine Color」に対応付けられているインスタンス「Red」,「「Rose」,「White」は、先の関係に対し目的語の関係にある。
意味解析装置10が処理対象としているデータは、主語、述語、目的語のトリプレット構造に対応する内容を記述している場合が多い。この点に着目し、主語、述語、目的語の関係を解析すべく以上のようにコンセプトと属性とを対応付けたデータを予め格納することとしている。
さらに、属性として表現された述語を概念化したプロパティを特定することができる。具体的には、オントロジーDB110は、属性と、当該属性を概念化したプロパティとを対応付けた概念化テーブル114をさらに格納している。
図3は、オントロジーDB110に格納されている概念化テーブル114のデータ構成を示す図である。概念化テーブル114は、属性フィールドと、コンセプトフィールドとを有している。
コンセプト対応テーブル112に格納されている属性が、当該属性に対応付けられているコンセプトを主語とした場合の述語である場合がある。この述語は、概念化されてコンセプトとなる場合がある。概念化テーブル114は、この概念化に対応する処理に利用される。すなわち、述語に対応する属性と、この属性を概念化して得られるコンセプトとを対応付けて格納している。
例えば、「has Color」は、「Wine Color」に対応付けられている。また、「has Body」は、「Wine Body」に対応付けられている。
図4は、意味解析装置10による意味解析処理を示すフローチャートである。まず、データ取得部100は、Webページを取得する(ステップS100)。図5は、意味解析処理の対象となるWebページ20を示す図である。図5に示すWebページ20には、「Style : White Wine」という表示が含まれている。このように、Webページ20には、項目名と項目値とがコロン「:」により対応付けられている。
再び説明を図4に戻す。Webページ20を取得すると、次に、項目値抽出部102は、取得したWebページ20からデータ形式に基づいて項目値を抽出する(ステップS102)。次に、コンセプト特定部104は、抽出された項目値と一致するインスタンスをオントロジーDB110において検索する(ステップS104)。
インスタンスの検索においては、コンセプト特定部104は、抽出された項目値とオントロジーDB110に格納されている複数のインスタンスそれぞれとの比較を行う。この際、コンセプトの属性に基づいて、複数のインスタンスそれぞれの比較順番を決定する。
例えば「is a」関係における、より上位のコンセプトから検索していく。ここで、上位のコンセプトは、「コンセプトA is aコンセプトB」という関係においては、コンセプトBである。
また、例えば「part of」関係においては全体コンセプトから検索していく。ここで、全体コンセプトは、コンセプトAが「part of コンセプトB」という関係にある場合には、コンセプトBである。
また、例えば「instance of」関係においては抽象コンセプトから検索していく。ここで、抽象コンセプトは、コンセプトAが「instance of コンセプトB」という関係にある場合には、コンセプトBである。
「is a」関係における上位コンセプト、part of」関係における全体コンセプト、「instance of」関係における抽象コンセプトを以下、大概念と称する。また、逆を小概念と称する。すなわち、大概念とは、一般的に対応するインスタンス数および並列されるコンセプトの数が小概念に比べて比較的多い概念である。
このように、大概念に対するコンセプトおよびインスタンスは、小概念に対するコンセプトおよびインスタンスに比べて数が少ないので、大概念から検索していくことにより、処理量を削減することができる。
さらに、大概念において抽出された項目値と一致するインスタンスを検出した場合には、さらに検出したインスタンスに対するプロパティの属性を参照し、当該プロパティの小概念に相当するプロパティを順に検索し、インスタンスを検出し続ける。そして最も小概念のプロパティを特定する(ステップS106)。
このように、大概念から小概念に順に検索することにより検索処理の高速化を図ることができる。また、小概念化されたプロパティは、より細分化された概念である。したがって、項目名に最も適したプロパティであると考えられる。そこで、このように最も小概念のプロパティを特定することとした。
このようにプロパティを特定すると、次に、コンセプト対応付部106は、特定したプロパティを項目値に付与する(ステップS108)。以上で、意味解析装置10による意味解析処理が完了する。
図6は、意味解析処理を説明するための図である。図6は、図5に示すWebページ20における例を示している。例えば、Webページ20においては、ステップS102において項目値としてコロンの直後に記載されている「White Wine」が抽出される。そして、この項目値と所定量の文字列が一致するインスタンスをコンセプト対応テーブル112において検索する。この結果、インスタンス「White」が検出される。ここでの一致は完全一致または一部一致をいう。
さらにこの際、属性を参照しつつ、小概念を辿っていき、最も小概念のコンセプトに対するインスタンスを特定する。なお、このとき概念化テーブル114を参照し、属性を概念化したコンセプトについても検索する。
さらに、コンセプト対応テーブル112において、特定された小概念に対するインスタンスに対応付けられているコンセプトを特定する。ここでは、「Wine Color」が特定される。すなわち、項目値として抽出された「White Wine」に対する項目名である「Style」のコンセプトが特定される。
そして、このコンセプト「Wine Color」が項目名「Style」に付与される。具体的には、この処理によりWebページ20は、

<Wine Color>Style<Wine Color>:White Wine

と記述される。そして、このデータが外部に出力される。
このように、半構造化されたデータを対象とする場合には、その構造化された部分、すなわち本実施の形態においてはコロンを利用することにより、より正確に意味概念を判定することができる。
ただし、このようにデータ形式を制限するため自由文に比べて用途が限定される。しかし、バーコードや今後普及が予想されるRFID(Radio Frequency Identification)で参照されるメタデータのほとんどは、本質的にはこのようなデータ形式、すなわちデータそのものを主語とする二項関係で表されている。このため、実用上の汎用性が高い。
図7は、Webページ20において、項目名のコンセプトを示すメタデータが付与されている場合の意味解析処理を示すフローチャートである。データ取得部100がWebページ20を取得する(ステップS100)。次に、コンセプト抽出部122は、データ取得部110が取得したWebページ20に含まれる各項目名それぞれに対するコンセプトを示すメタデータを検索する。コンセプトのメタデータが存在する場合には(ステップS130,Yes)、メタデータにおいてコンセプトが特定された項目名に対する項目値を特定する(ステップS132)。一方、コンセプトのメタデータが存在しない場合には(ステップS130,No)、図4において説明した項目値抽出処理(ステップS102)へ進む。
ステップS132において項目値を特定した後、インスタンス追加部122は、オントロジーDB110において、特定した項目値と一致するインスタンスを検索する。このとき、検索対象は、メタデータとして付与されているコンセプトに対応付けられているインスタンスのみとする。
オントロジーDB110において、項目値と一致するインスタンスが検出されない場合、すなわち、Webページ20から抽出された項目値が対するインスタンスとしてオントロジーDB110に登録されていない場合には(ステップS134,No)、この項目値を、インスタンスとして新たにコンセプト対応テーブル112に登録する(ステップS136)。具体的には、この項目値に対応する項目名のコンセプトに対応するインスタンスとして登録する。一方、オントロジーDB110において、項目値と一致するインスタンスが検出された場合には(ステップS134)、処理が完了する。
図8は、図5に示すWebページ20に対して、図7を参照しつつ説明した意味解析処理を行う例を説明するための図である。Webページ20には、メタデータが付与されているとする。このメタデータは、Webページ20に記載されている「Style」のコンセプトが「Wine Color」である旨を示すデータである。
この場合には、このメタデータより、「Style」のコンセプト「Wine Color」と一致するコンセプトをオントロジーDB110において特定する。そして、
コンセプト対応テーブル112中のコンセプト「Wine Color」が特定される。 さらに、このコンセプト「Wine Color」に対応付けられているインスタンスから、項目名「Style」に対する項目値「White Wine」を検索する。そして、「White Wine」が含まれていないので、コンセプト「Wine Color」に対する新たなインスタンスとして「White Wine」を登録する。
このように、Webページ20の意味解析処理において、オントロジーDB110に登録されていないインスタンスを特定した場合には、これをオントロジーDB110に新たに登録することにより、オントロジーDB110に格納されているオントロジーを拡張し、以降の意味解析に利用することができる。
図9は、Webページのコンセプトが既知である場合の意味解析処理を示すフローチャートである。図8においては、項目名に対するコンセプトがメタデータとして付与されている場合について説明したが、ここでは、Webページ20自体のコンセプトが既知である場合について説明する。言い換えれば、Webページ20、すなわちメタデータの主語であるコンセプトがわかっている場合である。
なお、Webページ20のコンセプトが既知である場合とは、例えばWebページ20のURLから予めWebページ20が所定のコンセプトに対応するものであるとわかっている場合などがある。なお、この情報、すなわちURLとコンセプトとを対応付けた情報は、意味解析装置10のオントロジーDB110に予め登録されているものとする。すなわち、オントロジーDB110は、取得データコンセプト保持手段として機能する。
また、他の例としては、Webページ20のメタデータにおいて項目名に対するコンセプトが記述されていてもよい。この場合には、メタデータに記載されているコンセプトを抽出する。
データ取得部100が取得したWebページ20におけるコンセプトが既知である場合には(ステップS150,Yes)、コンセプト対応テーブル112において既知であるコンセプトに対応付けられている属性および概念化テーブル114においてこの属性に対応付けられているコンセプトを参照し、このコンセプトと何らかの関係を有するコンセプトを特定する(ステップS152)。
より詳しくは、このコンセプトよりも小概念のコンセプトのみを特定する。具体的には、このコンセプトの属性として他のコンセプトとの「is a」関係が格納されている場合には、その下位概念となるコンセプトを特定する。さらにこのコンセプトの属性として他のコンセプトとの「part of」関係が格納されている場合には、その部分概念を特定する。「instance of」関係が格納されている場合には、その具体概念を特定する。
そして、オントロジーDB110において、Webページ20から抽出された項目値と一致するインスタンスを検出する際の検出対象をステップS152において特定したコンセプトに限定する(ステップS154)。このように、Webページのコンセプトが予めわかっている場合には、このコンセプトに基づいて、検索対象とするコンセプトを限定することにより意味解析の精度を向上させることができる。
検索対象絞込み処理(ステップS154)に続き、さらに既にWebページ20に含まれる項目名に対する意味解析処理を行い、コンセプトを特定した場合には(ステップS156,Yes)、特定したコンセプトと何らかの関係を有するコンセプトを特定し、検対象を特定したコンセプトに絞り込む(ステップS158)。一方、Webページ20に対する意味解析処理がまだ行われていない場合には(ステップS156,No)、項目抽出処理(ステップS102)へ進む。
このように、同一のWebページにおいて既に行われた意味解析処理により、他の項目名に対するコンセプトが予めわかっている場合には、このコンセプトに基づいて、これから意味解析を行う項目名に対するコンセプトを検索する際に検索対象とするコンセプトを限定することにより意味解析の精度を向上させることができる。
図10は、図5に示すWebページ20に対して、図9を参照しつつ説明したステップS150〜ステップS154の処理を行う例を説明するための図である。前提として、Webページ20のURLからWebページ20がワインに関するページであることがわかっているとする。この場合には、オントロジーDB110に格納されているコンセプトのうち、コンセプト「Wine」の小概念のコンセプトのみが検索対象となる。
オントロジーDB110においては、項目値「WHite Wine」と一致するインスタンスが、コンセプト「Wine Color」とコンセプト「Body Color」のいずれに対応するインスタンスにも含まれているとする。
図9において説明した検索対象コンセプトの絞込みが行われているため、コンセプト「Body Color」は検索対象から外されている。従って、オントロジーDB110からは、コンセプト「Wine Color」のみが特定される。
このように、検索対象を特定することにより、誤って「Body Color」を特定するのを避けることができる。
図11および図12は、図5に示すWebページ20に対して、図9を参照しつつ説明したステップS156,ステップS158の処理を行う例を説明するための図である。例えば、図11に示すように、Webページ20において、「Celler : ○○○」から項目値「○○○」と一致するインスタンスをオントロジーDB110において検出し、これにより対応する項目名「Celler」に対するコンセプトを「Winery」と特定したとする。
さらに、Webページ20において、「Area : ×××」から項目値「×××」と一致するインスタンスをオントロジーDB110において検出し、これにより対応する項目名「Area」に対するコンセプトを「Region」と特定したとする。
この場合には、同一のWebページ20において特定されたコンセプト「Winery」および「Region」から、これらの大概念に相当するコンセプトを推測する。この場合には、Webページ20のコンセプトは「Wine」と推測される。そして、推測したコンセプトにより検索対象となるコンセプトの絞り込みを行ってもよい。すなわち、検索対象コンセプトを「Wine」の小概念のコンセプトのみとする。
具体的には、図12に示すようにWebページ20のコンセプトが「Wine」と特定された後に、さらにWebページ20に含まれる「Varietal : Chardonnay」における項目名に対するコンセプトを特定するとする。
項目名「「Varietal」に対応する項目値「Chardonnay」をインスタンスとするコンセプトとして「Wine Grape」と「Manufactur」が特定される。ただし、上述のようにWebページ20のコンセプト「Wine」と推測され、検索対象が「Wine」の小概念のコンセプトのみに限定されている。
このため、コンセプト「Wine Grape」に対するインスタンスのみが検出される。そして、項目名「Varietal」のコンセプトとして「Wine Grape」が特定される。以上のように、検索対象を特定することにより、誤った意味解析を行うのを避けることができきる。
Webページ20中に意味解析困難な項目名を含む複数の項目名が含まれている場合に、このような利用形態が好ましい。この場合には、複数の項目名のうちコンセプトを容易に特定することのできる項目名についての意味解析を先に行う。そして、これにより特定されたコンセプトに基づいて、Webページ20のコンセプトを推測する。その後、推測したコンセプトの小概念のコンセプトを検索対象として、Webページ20に含まれる残りの項目名に対する意味解析を行う。これにより、検索対象が制限されるため、意味解析困難な項目名に対しても、より精度よく意味解析を行うことができる。
具体的には、Webページ20中の項目名の意味解析により、エンジンの型、タイヤサイズなどがプロパティとして特定されたとする。この場合には、このWebページ20は、車に関するものである、すなわち車をプロパティとするものであると推測できる。
さらに、図11に示すように、同一のWebページ20における項目名の意味解析において既に特定されたコンセプトを検索対象から外してもよい。これにより、より精度よく意味解析を行うことができる。
先の具体例においては、エンジンの型、タイヤサイズについては、既に特定されているので、これ以降に意味解析を行う際には、車のプロパティに対する小概念であって、かつエンジンの型およびタイヤサイズ以外のプロパティを検索対象とする。
図13は、意味解析装置10のハードウェア構成を示す図である。意味解析装置10は、ハードウェア構成として、意味解析装置10における意味解析処理を実行する意味解析プログラムなどが格納されているROM52と、ROM52内のプログラムに従って意味解析装置10の各部を制御するCPU51と、意味解析装置10の制御に必要な種々のデータを記憶するRAM53と、ネットワークに接続して通信を行う通信I/F57と、各部を接続するバス62とを備えている。
先に述べた意味解析装置10における意味解析プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(R)ディスク(FD)、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。
この場合には、意味解析プログラムは、意味解析装置10において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、本実施の形態の意味解析プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。
以上、本発明を実施の形態を用いて説明したが、上記実施の形態に多様な変更または改良を加えることができる。
意味解析装置10のデータ構成を示すブロック図である。 オントロジーDB110に格納されているコンセプト対応テーブル112のデータ構成を示す図である。 オントロジーDB110に格納されている概念化テーブル114のデータ構成を示す図である。 意味解析装置10による意味解析処理を示すフローチャートである。 意味解析処理の対象となるWebページ20を示す図である。 意味解析処理を説明するための図である。 Webページ20において、項目名のコンセプトを示すメタデータが付与されている場合の意味解析処理を示すフローチャートである。 図5に示すWebページ20に対して、図7を参照しつつ説明した意味解析処理を行う例を説明するための図である。 Webページのコンセプトが既知である場合の意味解析処理を示すフローチャートである。 図5に示すWebページ20に対して、図9を参照しつつ説明したステップS150〜ステップS154の処理を行う例を説明するための図である。 図5に示すWebページ20に対して、図9を参照しつつ説明したステップS156,ステップS158の処理を行う例を説明するための図である。 図5に示すWebページ20に対して、図9を参照しつつ説明したステップS156,ステップS158の処理を行う例を説明するための図である。 意味解析装置10のハードウェア構成を示す図である。
符号の説明
10 意味解析装置
20 ページ
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 データ取得部
102 項目値抽出部
104 コンセプト特定部
106 コンセプト対応付部
110 オントロジーDB
112 コンセプト対応テーブル
114 概念化テーブル
120 コンセプト抽出部
122 インスタンス追加部

Claims (15)

  1. 項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得手段と、
    前記データ取得手段が取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出手段と、
    前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスと、前記コンセプトと他のコンセプトの間の関係を示す属性と
    を対応付けて保持するコンセプト保持手段と、
    前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトを検索することにより、前記項目値抽出手段によって抽出された前記項目値の文字列と少なくとも一部一致するインスタンスを特定し、特定した前記インスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定手段と、
    前記コンセプト特定手段により特定された前記コンセプトと、前記項目名とを対応付ける対応付手段と
    前記データ取得手段が取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索手段と、
    前記コンセプト保持手段において、前記コンセプト検索手段により検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索手段と、
    前記インスタンス検索手段が前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索手段により検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加手段と
    を備えたことを特徴とする意味解析装置。
  2. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の上位下位関係を示す前記属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて上位から下位の順を前記比較順番として決定することを特徴とする請求項に記載の意味解析装置。
  3. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の全体と当該全体に対する一部との関係を示す全体部分関係を示す前記属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて、全体から部分の順を前記比較順番として決定することを特徴とする請求項に記載の意味解析装置。
  4. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の抽象具体化関係を示す前記属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて、抽象から具体化の順を前記比較順番として決定することを特徴とする請求項に記載の意味解析装置。
  5. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の上位下位関係を示す属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記項目値と同一のインスタンスに対応付けられている前記コンセプトが複数存在し、複数のコンセプトが前記上位下位関係にある場合に、下位のコンセプトを特定することを特徴とする請求項1に記載の意味解析装置。
  6. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の全体と当該全体に対する一部との関係を示す全体部分関係を示す属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記項目値と同一のインスタンスに対応付けられている前記コンセプトが複数存在し、複数のコンセプトが前記全体部分関係にある場合に、部分のコンセプトを特定することを特徴とする請求項1に記載の意味解析装置。
  7. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の抽象具体化関係を示す属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記項目値と同一のインスタンスに対応付けられている前記コンセプトが複数存在し、複数のコンセプトが前記抽象具体化関係にある場合に、具体化されたコンセプトを特定することを特徴とする請求項1に記載の意味解析装置。
  8. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
    前記データ取得手段が取得した前記データから、当該データに対するコンセプトを示す情報を抽出するコンセプト抽出手段と、
    前記コンセプト抽出手段が前記データに対する前記コンセプトを抽出した場合に、前記コンセプト保持手段において、前記コンセプト抽出手段が抽出した前記コンセプトに対応付けられている前記属性において、当該コンセプトに関係付けられている前記コンセプトを検索対象として特定する検索対象特定手段と
    をさらに備え、
    前記コンセプト特定手段は、前記検索対象特定手段により前記検索対象として特定された前記コンセプトの中から、前記項目名に対する前記コンセプトを特定することを特徴とする請求項1からのいずれか一項に記載の意味解析装置。
  9. 前記コンセプト抽出手段は、前記データ取得手段が取得した前記データのメタデータから前記コンセプトを抽出することを特徴とする請求項に記載の意味解析装置。
  10. 前記コンセプト抽出手段は、前記データ取得手段が取得した前記データにURL(Uniform Resource Locator)が含まれている場合に、当該URLから前記コンセプトを抽出することを特徴とする請求項に記載の意味解析装置。
  11. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
    前記データ取得手段が取得すべき前記データを識別するデータ識別情報と、当該データの前記コンセプトとを対応付けて保持する取得データコンセプト保持手段と、
    前記取得データコンセプト保持手段において前記データ取得手段が取得した前記データの前記データ識別情報に対応付けられている前記コンセプトを特定し、特定した前記コンセプトの前記属性において、当該コンセプトに関係付けられている前記コンセプトを検索対象として特定する検索対象特定手段と
    をさらに備え、
    前記コンセプト特定手段は、前記検索対象特定手段により前記検索対象として特定された前記コンセプトの中から、前記項目名に対する前記コンセプトを特定することを特徴とする請求項1から1のいずれか一項に記載の意味解析装置。
  12. 前記コンセプト保持手段は、前記コンセプトと他のコンセプトの間の関係を示す属性を前記コンセプトに対応付けてさらに保持し、
    前記コンセプト特定手段は、前記データに含まれる他の項目名に対するコンセプトを既に特定している場合に、既に特定した前記コンセプトの前記属性において、当該コンセプトに関係付けられている前記コンセプトを検索対象として特定する検索対象特定手段をさらに備え、
    前記コンセプト特定手段は、前記検索対象特定手段により前記検索対象として特定された前記コンセプトの中から、前記項目名に対する前記コンセプトを特定することを特徴とする請求項1から1のいずれか一項に記載の意味解析装置。
  13. 前記検索対象特定手段は、さらに前記コンセプト特定手段が既に特定した前記コンセプト以外の前記コンセプトを前記検索対象として特定することを特徴とする請求項1に記載の意味解析装置。
  14. 意味解析装置における意味解析方法であって、
    前記意味解析装置は、前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスと、前記コンセプトと他のコンセプトの間の関係を示す属性とを対応付けて保持するコンセプト保持手段を備え、
    データ取得手段が、項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得ステップと、
    項目値抽出手段が、前記データ取得ステップにおいて取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出ステップと、
    コンセプト特定手段が、前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトを検索することにより、前記項目値抽出ステップにおいて抽出された前記項目値の文字列と少なくとも一部一致するインスタンスを特定し、特定した前記インスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定ステップと、
    対応付手段が、前記コンセプト特定ステップにおいて特定された前記コンセプトと、前記項目名とを対応付ける対応付ステップと
    コンセプト検索手段が、前記データ取得ステップにおいて取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索ステップと、
    インスタンス検索手段が、前記コンセプト保持手段において、前記コンセプト検索ステップにおいて検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索ステップと、
    インスタンス追加手段が、前記インスタンス検索ステップにおいて前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索ステップにおいて検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加ステップと
    を有することを特徴とする意味解析方法。
  15. 意味解析処理をコンピュータに実行させるための意味解析プログラムであって、
    前記コンピュータは、前記項目名に付与すべき意味的な概念であるコンセプトと、当該コンセプトの具体的データであるインスタンスと、前記コンセプトと他のコンセプトの間の関係を示す属性とを対応付けて保持するコンセプト保持手段を備え、
    項目名と、当該項目名に属する項目値とが所定のデータ形式で表されたデータを取得するデータ取得ステップと、
    前記データ取得ステップにおいて取得した前記データの前記データ形式に基づいて、前記データから前記項目値を抽出する項目値抽出ステップと、
    前記コンセプト保持手段において前記コンセプトに対応付けられている前記属性に基づいて前記コンセプトの比較順番を決定し、当該比較順番に沿って前記コンセプトを検索することにより、前記項目値抽出ステップにおいて抽出された前記項目値の文字列と少なくとも一部一致するインスタンスを特定し、特定した前記インスタンスに対応付けられている前記コンセプトを前記項目名に対するコンセプトとして特定するコンセプト特定ステップと、
    前記コンセプト特定ステップにおいて特定された前記コンセプトと、前記項目名とを対応付ける対応付ステップと
    前記データ取得ステップにおいて取得した前記データに、前記項目名に対する前記コンセプトを示す情報が含まれている場合に、前記コンセプト保持手段において、前記データに含まれる前記コンセプトと同一のコンセプトを検索するコンセプト検索ステップと、
    前記コンセプト保持手段において、前記コンセプト検索ステップにおいて検出された同一のコンセプトに対応付けられている前記インスタンスの中から前記項目名に対応する項目値と同一のインスタンスを検索するインスタンス検索ステップと、
    前記インスタンス検索ステップにおいて前記項目値と同一のインスタンスを検出しない場合に、前記コンセプト検索ステップにおいて検出された前記コンセプトに対応付けて、前記項目値を前記インスタンスとして追加するインスタンス追加ステップと
    前記コンピュータに実行させるための意味解析プログラム。
JP2005283477A 2005-09-29 2005-09-29 意味解析装置、意味解析方法および意味解析プログラム Expired - Fee Related JP4427500B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005283477A JP4427500B2 (ja) 2005-09-29 2005-09-29 意味解析装置、意味解析方法および意味解析プログラム
US11/362,224 US7953592B2 (en) 2005-09-29 2006-02-27 Semantic analysis apparatus, semantic analysis method and semantic analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005283477A JP4427500B2 (ja) 2005-09-29 2005-09-29 意味解析装置、意味解析方法および意味解析プログラム

Publications (2)

Publication Number Publication Date
JP2007094775A JP2007094775A (ja) 2007-04-12
JP4427500B2 true JP4427500B2 (ja) 2010-03-10

Family

ID=37895360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005283477A Expired - Fee Related JP4427500B2 (ja) 2005-09-29 2005-09-29 意味解析装置、意味解析方法および意味解析プログラム

Country Status (2)

Country Link
US (1) US7953592B2 (ja)
JP (1) JP4427500B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8495004B2 (en) * 2006-03-27 2013-07-23 International Business Machines Corporation Determining and storing at least one results set in a global ontology database for future use by an entity that subscribes to the global ontology database
JP2008084193A (ja) * 2006-09-28 2008-04-10 Toshiba Corp インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
JP4451435B2 (ja) * 2006-12-06 2010-04-14 本田技研工業株式会社 言語理解装置、言語理解方法、及び、コンピュータプログラム
CN100592293C (zh) * 2007-04-28 2010-02-24 李树德 基于智能本体的知识搜索引擎及其实现方法
JP2009080624A (ja) * 2007-09-26 2009-04-16 Toshiba Corp 情報表示装置、方法及びプログラム
KR101308048B1 (ko) * 2007-10-10 2013-09-12 삼성전자주식회사 반도체 메모리 장치
US9245243B2 (en) * 2009-04-14 2016-01-26 Ureveal, Inc. Concept-based analysis of structured and unstructured data using concept inheritance
MY168837A (en) * 2009-05-25 2018-12-04 Mimos Berhad A method and system for extendable semantic query interpretation
JP5469985B2 (ja) * 2009-10-06 2014-04-16 株式会社ピーエスシー データ受渡方法及び汎用データ取得方法
US9208223B1 (en) * 2010-08-17 2015-12-08 Semantifi, Inc. Method and apparatus for indexing and querying knowledge models
US11294977B2 (en) 2011-06-20 2022-04-05 Primal Fusion Inc. Techniques for presenting content to a user based on the user's preferences
EP4120101A1 (en) * 2011-01-07 2023-01-18 Ixreveal, Inc. Concepts and link discovery system
US9092516B2 (en) 2011-06-20 2015-07-28 Primal Fusion Inc. Identifying information of interest based on user preferences
US9799328B2 (en) * 2012-08-03 2017-10-24 Veveo, Inc. Method for using pauses detected in speech input to assist in interpreting the input during conversational interaction for information retrieval
US9582572B2 (en) * 2012-12-19 2017-02-28 Intel Corporation Personalized search library based on continual concept correlation
US20150178372A1 (en) * 2013-12-19 2015-06-25 OpenGov, Inc. Creating an ontology across multiple semantically-related data sets
US11281853B2 (en) * 2017-03-06 2022-03-22 Mitsubishi Electric Corporation Ontology creation assistance device
WO2019171490A1 (ja) * 2018-03-07 2019-09-12 日本電気株式会社 ナレッジ拡充システム、方法およびプログラム
CN109325201A (zh) 2018-08-15 2019-02-12 北京百度网讯科技有限公司 实体关系数据的生成方法、装置、设备及存储介质
JP7350674B2 (ja) * 2020-02-26 2023-09-26 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061675A (en) * 1995-05-31 2000-05-09 Oracle Corporation Methods and apparatus for classifying terminology utilizing a knowledge catalog
JP2001325284A (ja) 2000-05-12 2001-11-22 Nippon Telegr & Teleph Corp <Ntt> 表構造領域からの情報抽出方法および装置と情報抽出プログラムを記録した記録媒体
US7027974B1 (en) * 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7043492B1 (en) * 2001-07-05 2006-05-09 Requisite Technology, Inc. Automated classification of items using classification mappings
AU2003210393A1 (en) * 2002-02-27 2003-09-09 Michael Rik Frans Brands A data integration and knowledge management solution
US7493253B1 (en) * 2002-07-12 2009-02-17 Language And Computing, Inc. Conceptual world representation natural language understanding system and method
JP2005182280A (ja) * 2003-12-17 2005-07-07 Ibm Japan Ltd 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム

Also Published As

Publication number Publication date
US7953592B2 (en) 2011-05-31
JP2007094775A (ja) 2007-04-12
US20070073680A1 (en) 2007-03-29

Similar Documents

Publication Publication Date Title
JP4427500B2 (ja) 意味解析装置、意味解析方法および意味解析プログラム
WO2020108063A1 (zh) 特征词的确定方法、装置和服务器
CN111198948A (zh) 文本分类校正方法、装置、设备及计算机可读存储介质
US8775158B2 (en) Data processing device, data processing method, and data processing program
CN112749284B (zh) 知识图谱构建方法、装置、设备及存储介质
US7822788B2 (en) Method, apparatus, and computer program product for searching structured document
US11651014B2 (en) Source code retrieval
CN109344355B (zh) 针对网页变化的自动回归检测与块匹配自适应方法和装置
CN110096599B (zh) 知识图谱的生成方法及装置
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
CN112818200A (zh) 基于静态网站的数据爬取及事件分析方法及系统
CN109753646B (zh) 一种文章属性识别方法以及电子设备
US20110270862A1 (en) Information processing apparatus and information processing method
JP2009199302A (ja) ドキュメントを解析するためのプログラム,装置および方法
CN113220854A (zh) 机器阅读理解的智能对话方法及装置
KR101802051B1 (ko) 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템
CN110750984A (zh) 命令行字符串处理方法、终端、装置及可读存储介质
JP6327799B2 (ja) 自然言語推論システム、自然言語推論方法及びプログラム
KR100433584B1 (ko) 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
CN114065749A (zh) 一种面向文本的粤语识别模型及系统的训练、识别方法
KR20150043958A (ko) 객체 인식장치 및 그 방법
JP2007148630A (ja) 特許分析装置、特許分析システム、特許分析方法およびプログラム
KR100998291B1 (ko) 키워드 스트링을 구조화하고 검출하는 방법 및 장치
JP5295576B2 (ja) 自然言語解析装置、自然言語解析方法および自然言語解析プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091214

R151 Written notification of patent or utility model registration

Ref document number: 4427500

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131218

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees