JP2011086167A - 情報抽出ルール作成支援システム - Google Patents

情報抽出ルール作成支援システム Download PDF

Info

Publication number
JP2011086167A
JP2011086167A JP2009239416A JP2009239416A JP2011086167A JP 2011086167 A JP2011086167 A JP 2011086167A JP 2009239416 A JP2009239416 A JP 2009239416A JP 2009239416 A JP2009239416 A JP 2009239416A JP 2011086167 A JP2011086167 A JP 2011086167A
Authority
JP
Japan
Prior art keywords
sentence
company
information extraction
activity
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009239416A
Other languages
English (en)
Other versions
JP5317922B2 (ja
Inventor
Osamu Oshima
修 大島
Tomoyasu Okada
智靖 岡田
Gasuaki Takehara
一彰 竹原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2009239416A priority Critical patent/JP5317922B2/ja
Publication of JP2011086167A publication Critical patent/JP2011086167A/ja
Application granted granted Critical
Publication of JP5317922B2 publication Critical patent/JP5317922B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】自然文から企業名−企業活動−活動対象の意味的構造を備えた企業情報を抽出する際に用いる情報抽出ルールを一般ユーザが容易に作成できるように支援可能な技術の提供。
【解決手段】辞書記憶部22と、形態素解析処理部12と、主語特定処理部14と、構文解析処理部16と、各文節に抽象化タグを付与して素材文記憶部26に格納する抽象化処理部18と、複数の素材文が列挙されたルール編集画面40をクライアント端末30に送信し、特定企業の企業活動及び活動対象が記述されている素材文の選択を促し、素材文の選択情報が送信された場合に、当該素材文における企業名を含む文節、企業活動を含む文節及び活動対象を含む文節相互間の係り受け構造等を抽出条件として取り出し、所定の書式に従って記述した情報抽出ルール52を生成し、情報抽出ルール記憶部28に格納する情報抽出ルール生成部20を備えた支援システム10。
【選択図】図1

Description

この発明は情報抽出ルール作成支援システムに係り、特に、構文解析技術を用いて自然文から意味的構造を備えた情報要素を抽出する際に用いられる情報抽出ルールを、専門知識を有さない一般ユーザでも容易に作成できるように支援する技術に関する。
インターネット上のニュースサイトにおいて公開されているWebページなど、自然言語で記述された構造化されていないテキストデータから意味的構造を備えた情報要素のセットを抽出するための技術として、構文解析技術を用いるものが種々提案されている。
例えば、特許文献1に記載の情報抽出装置の場合、自然言語で記述された文書中の文字列と所定の文字パターンとを逐次照合し、一致が認められた文字列部分に対し固有名詞の種類を示すタグ情報を付与する文字パターン処理部と、上記タグ情報はそのままに、タグ情報を除く他の文字列部分を逐次単語情報に分割する形態素解析処理部と、形態素解析の結果得られた単語情報を文節単位にまとめ上げ、当該まとめ上げ後の単語情報を、文法上の構文規則と共に、ある種の情報の表現に特徴的に現れる構文パターンを用いて構文解析する構文解析部と、上記構文パターンに基づく解析により得られる係り受け関係及び当該係り受け関係に含まれるタグ情報から特定される情報を、必要な情報として抽出する情報抽出部を備えている。
この従来の情報抽出装置を用いることにより、例えば「5日午前零時35分ごろ、大阪市中央町、消毒業、鈴木勇さん(50)方から出火、木造平屋建て約125平方メートルが全焼した。」という文章から、「<人名>鈴木勇さん|<地名>大阪市中央町|<業種名>消毒業」の構造化された情報が抽出可能となる。
特開平11−272695号
しかしながら、このように構文解析処理を前提とした情報抽出方式の場合、必要な情報を正確に抽出するためには、抽出対象となる形態素を指定するための構文パターンを予め多数準備しておく必要があった。
例えば、「東洋自動車子会社の変速機メーカーパイロンは、燃費効率の高い変速機である無段変速機を中国の広州市で生産すると発表した」という文章の場合、複数の企業名(東洋自動車、パイロン)、複数の対象物(変速機、無段変速機)、及び複数の活動内容(生産、発表)が形式上含まれている。このため、この文章から真の活動主体(主語)、活動対象(目的語)、活動内容(述語)を抽出するとなると、図17に示すように、まず文全体を構文解析して文節間の係り受け構造を明らかにし、各種辞書を参照して各文節に種類を表すタグ(<企業名>等)を付与した後、図18に示すように、抽出すべき形態素の種類及び文中の位置関係を定義した構文パターンAを用意する必要がある。
この構文パターンAを図17の構文解析結果に適用することにより、図19(a)に示す文節が文中より抽出され、これに必要な整形処理を施すことにより、図19(b)に示すように、主語、述語、目的語の組合せからなる構造化された企業情報が得られる。
また、文が「東洋自動車子会社の変速機メーカーパイロンは、燃費効率の高い変速機である無段変速機を中国の広州市で生産する」と表現される場合を想定し、図20に示すように、別の構文パターンBを用意しておく必要がある。
さらに、自然文の場合には修辞上の目的で倒置表現が用いられることがあるが、このような文章からも必要な情報を抽出するためには、倒置表現を前提とした構文パターンを事前に多数用意しておく必要があった。
このように、自然文は複雑かつ多様な構造を備えているため、例え事前に構文解析が施された文を抽出対象とする場合であっても、そこから特定の意味的構造を備えた情報を的確に抽出するためには、多数の情報抽出ルール(構文パターン)を準備しておくことが不可欠であり、そのためには言語解析に通じた専門家を多数動員する必要があった。
この発明は、従来のこのような問題を解決するために案出されたものであり、構文解析がなされたテキストから特定の意味的構造を備えた情報を抽出する際に用いる情報抽出ルールを、専門知識を有さない一般ユーザでも容易に作成できるように支援可能な技術の提供を目的としている。
上記の目的を達成するため、請求項1に記載した情報抽出ルールの作成支援システムは、具体的な表現文字列と、その種類を示す抽象化文字列との対応関係を登録した辞書と、テキストデータ中の各文を形態素単位に分解する手段と、上記の辞書を参照し、各形態素の中で企業名、企業活動、活動対象に該当するものに対して対応の抽象化タグを関連付ける手段と、各文中の企業名主語を探索する手段と、企業名主語を備えた文を、素材文として素材文記憶手段に格納する手段と、この素材文記憶手段から素材文を取り出し、これらを所定のテンプレートに充填してルール編集画面を生成する手段と、このルール編集画面をクライアント端末に送信し、特定企業の企業活動及び活動対象が記述されている素材文の選択を促す手段と、クライアント端末から特定の素材文の選択情報が送信された場合に、当該素材文における企業名を含む文節、企業活動を含む文節及び活動対象を含む文節相互間の係り受け構造、またはこれら企業名を含む文節、企業活動を含む文節及び活動対象物を含む文節と企業名、企業活動、活動対象物以外の文字列を含む文節との間の係り受け構造を抽出条件として取り出し、これを所定の書式に従って記述した情報抽出ルールを生成する情報抽出ルール生成手段と、この情報抽出ルールを情報抽出ルール記憶手段に格納する手段とを備えたことを特徴としている。
これらの情報抽出ルールは、自然文から構造化された企業情報を生成する際に、情報抽出の条件として適用される。すなわち、対象となる自然文に対して形態素解析及び構文解析を施し、辞書を参照して対応の文節に企業名、企業活動、活動対象の抽象化タグを付与した上で、各情報抽出ルールを当てはめていき、マッチする場合には当該情報抽出ルールに規定された位置にある文字列が企業名、企業活動、活動対象として取り出される。
請求項2に記載した情報抽出ルールの作成支援システムは、請求項1のシステムであって、さらに上記ルール編集画面中の各素材文には、企業名を示す文字列部分、企業活動を示す文字列部分、活動対象を示す文字列部分に対して、それぞれの種類を識別するためのマーキング(網掛けやカラーリング等の文字装飾)が施されていることを特徴としている。
請求項3に記載した情報抽出ルールの作成支援システムは、請求項1または2のシステムであって、さらに、 上記の辞書を参照し、各形態素の中で場所に該当するものに対して対応の抽象化タグを関連付ける手段を備え、上記情報抽出ルール生成手段は、クライアント端末から特定の素材文の選択情報が送信された場合に、当該素材文中に場所の抽象化タグが関連付けられた形態素が含まれているときには、当該場所を示す形態素が含まれた文節と、他の文節との係り受け構造を任意的な抽出条件として取り出し、これを含めた情報抽出ルールを生成することを特徴としている。
請求項4に記載した情報抽出ルールの作成支援システムは、請求項1〜3のシステムであって、さらに、文中に主語が存在しない場合に、当該文の前に位置する文において企業名主語が存在しており、かつ、当該文と上記企業名主語が存在する文との間に他の企業名主語及び企業名以外の形態素を主語とする文が介在していないときには、上記企業名主語を当該主語の存在しない文の企業名主語として関連付ける手段を備えたことを特徴としている。
請求項5に記載した情報抽出ルールの作成支援システムは、請求項1〜4のシステムであって、さらに、文中に企業代名詞が主語として含まれていた場合に、当該文の前に位置する文において企業名主語が存在しており、かつ、当該文と上記企業名主語が存在する文との間に他の企業名主語及び企業名以外の形態素を主語とする文が介在していないときには、当該企業代名詞を上記企業名主語の企業名に置き換える手段を備えたことを特徴としている。
請求項6に記載した情報抽出ルールの作成支援システムは、請求項1〜5のシステムであって、さらに、予め設定された正規表現ルールを各文に対して適用し、当該正規表現ルールにマッチする形態素を企業名、企業活動、活動対象物の何れかであると認定すると共に、当該形態素に対して対応の抽象化タグを関連付ける手段を備えたことを特徴としている。
請求項7に記載した情報抽出ルールの作成支援システムは、請求項1〜6のシステムであって、さらに、予め設定された係り受けルールを各文に対して適用し、当該係り受けルールにマッチする文節の形態素を企業名、企業活動、活動対象物の何れかであると認定すると共に、当該形態素に対して対応の抽象化タグを関連付けることを特徴としている。
自然文は複雑かつ曖昧な構造を備えているため、情報抽出ルール生成の基礎となるべき素材文の選定に関しては、人間の感覚に頼らざるを得ないが、請求項1に記載した情報抽出ルールの作成支援システムによれば、ユーザはクライアント端末に表示されたルール編集画面上において、各素材文の意味内容を判断し、特定企業の企業活動及び活動対象が実質的に記述されている素材文を選択するだけで済み、素材文の生成及び情報抽出ルールの生成はシステム側で自動処理されるため、言語解析についての専門知識を有さないユーザであっても、情報抽出ルールを容易に作成することが可能となる。
請求項2に記載の情報抽出ルール作成支援システムの場合、企業名を示す文字列部分、企業活動を示す文字列部分、活動対象を示す文字列部分に対してマーキングが施されているため、ユーザは素材文中に含まれるチェックポイントを一目で認識可能となり、選択作業の効率化が実現できる。
上記のように、企業名、企業活動、活動対象物の組合せからなる企業情報は、主語(企業名)→述語(企業活動)→目的語(活動対象物)の形式を備え、それ自体で完結した一連の意味的構造を表現しているといえる。ただし、これに場所的な要素が組み込まれることにより、さらに企業情報の価値や有効性を高めることが可能となる。
請求項3に記載の情報抽出ルール作成支援システムによれば、自然文から企業活動に係る場所的要素を抽出可能な情報抽出ルールを作成することが可能となる。
請求項4に記載した情報抽出ルール作成支援システムによれば、ある文に主語が含まれていない場合であっても、それよりも前に位置する文の中に企業名主語が含まれている場合には、当該企業名の記述が省略されたものと推定し、主語のない文の企業名主語として認定される。この結果、主語が含まれていない文をも素材文として有効に活用することが可能となる。
請求項5に記載した情報抽出ルール作成支援システムによれば、企業を表す「同社」等の代名詞が主語として含まれている文については、それよりも前に位置する文の企業名主語を指すものと推定し、この企業名主語の企業名によって当該企業代名詞が置き換えられる。この結果、企業代名詞を主語とする文をも素材文として有効に活用することが可能となる。
請求項6及び7に記載した情報抽出ルール作成支援システムによれば、各形態素に対しルールベースで必要な企業名、企業活動、活動対象物の抽象化タグを関連付けることが可能となり、辞書ベースでの抽象化を補完することが可能となる。
図1は、この発明に係る情報抽出ルール作成支援システム10の全体構成を示すブロック図であり、形態素解析処理部12と、主語特定処理部14と、構文解析処理部16と、抽象化処理部18と、情報抽出ルール生成部20と、辞書記憶部22と、抽象化ルール記憶部24と、素材文記憶部26と、情報抽出ルール記憶部28とを備えている。
情報抽出ルール生成部20には、ユーザが操作するクライアント端末30が通信ネットワークを介して接続されている。
上記の形態素解析処理部12、主語特定処理部14、構文解析処理部16、抽象化処理部18及び情報抽出ルール生成部20は、コンピュータのCPUが、OS及びアプリケーションプログラムに従って必要な処理を実行することによって実現される。
また、上記の辞書記憶部22、抽象化ルール記憶部24、素材文記憶部26及び情報抽出ルール記憶部28は、同コンピュータのハードディスク内に設けられている。
辞書記憶部22内には、企業名辞書、企業活動辞書、活動対象辞書、人物名辞書、国名辞書、地域名辞書、都道府県名辞書、市町村名辞書、動植物名辞書、同義語辞書等が格納されている。
図2は、企業活動辞書の登録内容を例示するものであり、企業活動の一種である上位概念的な「生産活動」の抽象化文字列に対して、「生産」、「製造」、「加工」、「組立」等の述語となるべき具体的な表現文字列が予め対応付けられている。同じく、企業活動の一種である上位概念的な「販売活動」の抽象化文字列に対しては、「販売」、「発売」、「売り出す」等の述語となるべき具体的な表現文字列が予め対応付けられている。なお、「生産活動」や「販売活動」の代わりに、より上位概念的な「企業活動」の抽象化文字列を用いて一まとめにしてもよい。
図3は、活動対象辞書の登録内容を例示するものであり、上位概念的な「生産対象」の抽象化文字列に対して、「液晶」、「液晶テレビ」、「液晶パネル」、「液晶モニター」、「携帯音楽プレーヤー」、「ギガバイト」等の、目的語となるべき具体的な表現文字列が予め対応付けられている。同じく、上位概念的な「販売対象」の抽象化文字列に対して、「液晶」、「液晶テレビ」、「液晶パネル」、「液晶モニター」、「携帯音楽プレーヤー」、「ギガバイト」等の、目的語となるべき具体的な表現文字列が予め対応付けられている。なお、括弧内の「一般」は一般名詞であることを、また「固有」は固有名詞であることを示している。
「生産対象」や「販売対象」の代わりに、より上位概念的な「活動対象」の抽象化文字列を用いてもよい。
図示は省略したが、企業名辞書には、主語となるべき具体的な企業名(正式名称及び略称)が、「企業名」の抽象化文字列に関連付けられて多数登録されている。
つぎに、このシステム10による処理内容を説明する。
まず、形態素解析処理部12により、外部から入力されたWebファイル等のテキストデータ32に対する形態素解析が実行される。ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を同定する処理をいう。
例えば、「初芝は、携帯音楽プレーヤー『ギガバイト』の新製品を15日、関西で発売する。」という文が与えられた場合、図4に示すように、形態素解析処理部12はこれを「初芝/名詞,固有名詞」、「は/助詞,係助詞」、「携帯音楽プレーヤー/名詞,一般」のように分解し、それぞれの品詞を特定する。
この形態素解析自体は公知技術であり、例えば以下のようなフリーソフトを形態素解析エンジンとして用いることができる。
(1) MeCab(http://mecab.sourceforge.net/)
(2) ChaSen(http://chasen.naist.jp/hiki/ChaSen/)
形態素解析処理部12は、辞書記憶部22に格納された活動対象辞書を参照し、その登録内容を形態素解析の結果に反映させることができる。
例えば、「携帯音楽プレーヤー」という語は、一般的な形態素解析エンジンに投入すると「携帯/名詞,サ変接続」、「音楽/名詞,一般名詞」、「プレーヤー/名詞,一般名詞」のように細分化されてしまうことになるが、活動対象辞書に「携帯音楽プレーヤー(一般)」が生産対象及び販売対象として登録されているため、形態素解析処理部12は「携帯音楽プレーヤー」という結合語を一形態素として認定している。
また、「ギガバイト」という語についても、一般的な形態素解析エンジンによれば「ギガ/名詞,一般名詞」、「バイト/名詞,一般名詞」のように細分化されてしまうが、活動対象辞書に「ギガバイト(固有)」が生産対象及び販売対象として登録されているため、形態素解析処理部12は「ギガバイト」という結合語を一形態素として認識できる。
つぎに形態素解析処理部12は、辞書記憶部22内に格納された企業名辞書、企業活動辞書、活動対象辞書を参照し、特定形態素の品詞に対応の抽象化タグを補充する。
例えば、「初芝」に関しては、企業名辞書に登録例が存在していたため、「企業名」という抽象化タグが品詞項目に追記される。また、「携帯音楽プレーヤー」及び「ギガバイト」に関しては、活動対象辞書に生産対象及び販売対象として登録されていたため、「生産対象」及び「販売対象」の抽象化タグが品詞項目に追記される。また、「関西」に関しては、地域名辞書に場所として登録されていたため、「場所」の抽象化タグが品詞項目に追記される。さらに、「発売」に関しては、企業活動辞書中に販売活動の一類型として登録例が存在していたため、「販売活動」という抽象化タグが品詞項目に追記される。
つぎに、主語特定処理部14が起動し、形態素解析処理部12によって形態素単位に分解されたデータに基づき、主語となる企業名を文単位で特定する。
具体的には、図5に示すように、企業名の直後に「が〜」(助詞-格助詞)や「は〜」(助詞-係助詞)、あるいは「、〜」(記号-読点)が続く文字列が文中に存在していることを検知した場合、主語特定処理部14は当該企業名を主語と認定する。
図6の(a)及び(b)の文では、「初芝、」及び「初芝は」が存在しているため、企業名「初芝」が企業名主語としてそれぞれ認定される。
また、主語特定処理部14は、企業名主語を認定した文の後に主語の存在しない文が続く場合、当該文に対しても先に認定した企業名主語を継承させる。
例えば、図6の(c)の文中からは主語に相当する文字列が検出されないが、この場合には前の文に登場した企業名主語が省略されているものと推定し、「初芝」が当該文の企業名主語として関連付けられる。
さらに、主語特定処理部14は、企業を表す代名詞である「同社」等が主語となっている文については、前の文の企業名主語で置き換える処理(照応処理)を実行する。
例えば、図6の(d)の「同社の新製品は、ソフコムが提供する公衆無線LANサービス…」という文が存在した場合、(d)'に示すように、企業代名詞の「同社」がその直前の文に関連付けられた企業名主語「初芝」に置き換えられる。
企業名主語の継承処理及び照応処理は、他の企業名主語の存在が認められる文が登場するまで続けられる。例えば、図6の(x)の文には「サリーは、」の文字列が存在し、「サリー」は企業名に相当するため、主語特定処理部14は(x)の文の企業名主語として「サリー」を認定する。
また、これ以降に主語に相当する文字列が存在しない文が続いた場合、主語特定処理部14は「サリー」を企業名主語としてこれらの文に関連付ける。
さらに、これ以降に企業代名詞を主語とする文が登場した場合、主語特定処理部14は「サリー」によって企業代名詞を置き換える。
企業名主語の承継は、企業名以外の主語(例えば人物名、国名、都道府県名、動物名、植物名等)を備えた文が登場した際にも、停止される。この前提として、形態素解析処理に際し、各形態素には人物名、国名、都道府県名の識別タグが品詞項目に追記されている。
ただし、このシステム10は企業に係る情報を抽出するためのルール作成を目的としているため、企業名以外の形態素が主語となっている文については、処理の対象外として排除される。
つぎに、構文解析処理部16によって、各文の係り受け構造が分析される。
図7は、その分析結果を示すテーブルであり、文節毎に係り先文節IDが格納されている。また、図8は、この係り受け構造をイメージ化したものである。
この構文解析自体は公知技術であり、例えば以下のようなフリーソフトを構文解析エンジンとして用いることができる。
(1) KNP(http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.html)
(2) CaboCha(http://chasen.org/~taku/software/cabocha/)
つぎに、抽象化処理部18により、各文節単位で企業名、企業活動(生産活動、販売活動)、活動対象(生産対象、販売対象等)、場所に該当する文字列(形態素)を含んでいるか否かが判定され、含んでいる場合には、図9(b)に示すように、対応する抽象化タグが当該文節に関連付けられる。
この抽象化に際しては、先に形態素解析処理部12が辞書DB22を参照し、形態素単位で企業名や販売活動、販売対象等の抽象化タグの付与を完了しているため、まず第1にこの形態素単位で関連付けられた抽象化タグが、当該形態素を含む文節にもそのまま引き継がれることとなる。
具体的には、図9(a)に示すように、形態素ID、形態素、品詞、文節IDを備えたテーブルがメモリ上に生成され、形態素に付加された抽象化タグが対応の文節に転記される。
ただし、辞書の収録語数には自ずと限界があり、辞書ベースでの抽象化処理だけでは漏れが生じる可能性があるため、抽象化処理部18は正規表現ルールによる抽象化処理と、係り受けルールによる抽象化処理を実行し、辞書に収録されていない企業名や活動対象について、対応の抽象化タグを関連付ける機能を備えている。
[正規表現ルールによる抽象化処理]
これは、例えば、「新製品であるABCを〜」という表現が文中に存在した場合、「ABC」の部分を「生産対象物」と認定し、「ABCを」の文節に「生産対象物」の抽象化タグを割り当てることを意味する。あるいは、「小売り大手の米AAAマートは、〜」という表現が文中に存在した場合に、「AAAマート」の部分を「企業名」と認定し、「AAAマートは」の文節に「企業名」の抽象化タグを割り当てることが該当する。
このため、抽象化ルール記憶部24には、予め多数の抽象化ルールが格納されている。
図10の(a)は抽象化ルールの一例を示すものであり、「<company_size>の<country>(<feature:名詞>+)」は、「company_size(企業規模を表す文字列)」+「の」+「country(国を表す文字列)」の直後に続く名詞を企業名と認定することが定義されている。また、「company_size」のエイリアス表現(別名)として、「首位、大手、中堅」が定義されており、「company_size」のエイリアス表現として、「米、英、欧州」が定義されている。
ここに、図10(b)に示すように、「小売大手の米AAAマートは、人員削減計画を発表した。」という文が与えられた場合、抽象化処理部18はこれを図10(c)に示すように名詞単位のOR表現に置き換え、ルールにマッチする「小売り大手の米AAAマート」を抽出した後、正規表現の「後方参照」を用いて「AAAマート」を取り出し、企業名と認定する。
[係り受けルールによる抽象化処理]
(1) 企業名の抽象化
これは、企業活動を含む文節に係る文節で、助詞が「が」または「は」となる場合には、当該助詞の直前の形態素を企業名と認定するルールをいう。
例えば、図11の例で説明すると、「米オラテルは」という文節は、販売活動を意味する「出荷する」の文節に係っており、「は」の助詞を備えているため、その直前の形態素「オラテル」が企業名と認定される。
(2) 活動対象の抽象化
これは、企業活動を含む文節に係る文節で、助詞が「を」となる場合には、当該助詞の直前の形態素を活動対象物と認定するルールをいう。
図11の例でいえば、「『Core o7』を」という文節は、販売活動を意味する「出荷する」の文節に係っており、「を」の助詞を備えているため、その直前の形態素「Core o7」が販売対象と認定される。
抽象化処理が完了した文は、抽象化処理部18によって素材文記憶部26に格納される。この素材文記憶部26に格納された各文は、情報抽出ルール生成のための素材として利用される。
すなわち、ユーザの操作するクライアント端末30から情報抽出ルール作成のリクエストが送信されると、情報抽出ルール生成部20は素材文記憶部26から一定のルール(例えば新着順)に従って素材文を抽出し、これらを埋め込んだルール編集画面を生成した後、クライアント端末30に送信する。
図12は、クライアント端末30のWebブラウザ上に表示されたルール編集画面40の一例を示すものであり、センテンス表示欄42には、構造化された多数のテキストが列記されている。
また、各テキスト中の企業名に該当する文字列部分、企業活動に該当する文字列部分、活動対象に該当する文字列部分には、それぞれ固有のマーキング(装飾)が施されている。なお、先行する文の企業名主語を継承した場合には、「(初芝)」のように企業名が括弧付きで表示され、元から企業名が明記されている文と区別されている。
図においては、企業名、企業活動、活動対象、場所に対して異なるパターンの網掛けが施される例を示したが、それぞれに対して異なる色彩のマーカー表示(例えば、企業名=青色、企業活動=黄緑色、活動対象=オレンジ色、場所=黄緑色等)を施すこともできる。
この結果ユーザは、テキスト中からチェックすべき企業名、企業活動、活動対象、場所を一目で識別可能となる。
この文字列のマーキングに際しては、各文字列に関連付けられた抽象化タグや、当該文に関連付けられた企業名の情報(企業名の継承情報)が参照される。
この場合、ルール編集画面40の「販売活動」タブ44が選択されているため、企業活動の中でも「販売活動」に係る文字列(例えば「発売」)についてマーキングが施されているが、ユーザが「生産活動」のタブ46に切り替えると、「生産」に係る文字列(例えば「製造」)についてマーキングが施され、「発売」に施されていたマーキングは解除されることとなる。
同様に、ルール編集画面40の「販売活動」タブ44が選択された状態では、活動対象の中でも「販売対象」に係る文字列(例えば「携帯音楽プレーヤー」)についてマーキングが施されているが、「生産活動」タブ46に切り替えられると、「生産対象」に係る文字列についてマーキングが施され、「販売対象」に施されていたマーキングは解除されることとなる。もっとも、同一文字列が生産対象と販売対象の両方に登録されている場合が多く、見た目には変化が感じられないこともある。
このルール編集画面40に対してユーザは、センテンス表示欄42に記載された各テキストを読み込んでいき、主語(企業名)、述語(販売活動)、目的語(販売対象)が正しく揃っている文を見付けた場合には、それぞれの文字列に施されたマーキング部をクリックしていく。
例えば、最初の文である「[初芝]、外出先で[動画]を視聴できる[携帯音楽プレーヤー]。」は所謂タイトル文であり、述語が省略されているため、ユーザは情報抽出ルール作成の対象文から除外する。
これに対し、2番目の文である「[初芝]は、[携帯音楽プレーヤー]『[ギガバイト]』の新製品を15日、[関西]で[発売]する。」は、主語、述語、目的語が正しく揃っており、企業名、販売対象、販売活動、場所を有効に抽出可能であるため、[初芝]、[携帯音楽プレーヤー]、[ギガバイト]、[関西]、[発売]の各マーキング部をクリックする。
この結果、抽出ノード表示欄48にユーザが選択した文字列(初芝、携帯音楽プレーヤー、ギガバイト、発売、関西)が表示される。この状態でユーザが「ルールを生成」のアンカーテキスト50をクリックすると、情報抽出ルール生成部20は、情報抽出ルールを生成する。
図13は、この情報抽出ルール生成の仕組みを説明するものであり、同図(a)は当該文に含まれる文節間の係り受け構造を示している。
この図に示すように、ユーザが選択した「初芝」を含む「初芝は」の文節は、販売活動の抽象化タグが付された「発売する」の文節に係っており、「携帯音楽プレーヤー」の文節は「『ギガバイト』の」の文節に、「『ギガバイト』の」の文節は「新製品を」の文節に、「新製品を」の文節は「発売する」の文節に、「関西で」の文節は「発売する」の文節にそれぞれ係っている。
そこで情報抽出ルール生成部20は、同図(b)に示すように、抽象化タグが付されている文節については<企業名>や<企業活動>、<販売対象物>、<場所>のように抽象化タグで当該文節を表現し、抽象化タグが付されていない文節については(新製品を)のようにそのままの文字列を採用し、文節間の係り受け関係を認定する。この際、「携帯音楽プレーヤー」と「『ギガバイト』の」の文節間は「販売対象→販売対象」のように同じ抽象化タグが連続しているため、一つの抽象化タグにまとめられる。
つぎに情報抽出ルール生成部20は、同図(c)に示すように、(b)の係り受け関係に基づき、所定の表記法に従って情報抽出ルール52を生成する。
この情報抽出ルール52においては、まず「extraction(抽出対象)」として、「subject(主語)=<企業名>」、「predicate(述語)=<販売活動>」、「object(目的語)=<販売対象>」、「option(オプション)=<場所>」が定義されている。
また、「necessary(必須条件)」として、「<企業名>の文節が<販売活動>の文節に係っていること」、「<販売対象>の文節が(新製品を)の文節に係っていること」、「(新製品を)の文節が<販売活動>の文節に係っていること」が規定されている。
さらに、「optional(オプション条件)」として、「<場所>の文節が<販売活動>の文節に係っていること」が規定されている。
この情報抽出ルール52は、情報抽出ルール生成部20によって情報抽出ルール記憶部28に格納される。
なお、「場所」は必須条件ではなくオプション条件に過ぎないため、場所に係る文字列を含まない文に対しても適用可能なルールとなる。
この情報抽出ルール52を適用することにより、例えば「東洋自動車は来月、スカイライナーの新製品をアメリカで発売する。」という文から、以下の情報を抽出可能となる。
主語(企業名):東洋自動車
述語(企業活動):販売
目的語(活動対象):スカイライナー
オプション(場所):アメリカ
これらの情報要素は相互に主語−述語−目的語−場所の関係を持っているため、これらの情報を検索用のデータベースとして多数蓄積しておくことにより、ノイズの少ない高精度の検索処理が実現可能となる。
なお、上記の情報抽出ルール52は、「新製品を」の文節が販売活動の文節に係っている必要があるため、「東洋自動車は来月、スカイライナーを発売する。」という文に変形した場合には抽出条件にマッチせず、「主語(企業名):東洋自動車−述語(企業活動):販売−目的語(活動対象):スカイライナー」という情報を抽出することができないことになる。
しかしながらユーザは、他の多くの素材文に基づいて情報抽出ルールの作成作業を繰り返していくことで、このような文に適合可能なルールを作成可能となる。
例えば、図14の(a)に示すように、「アニーは来月、20代をターゲットにした男性化粧品を発売する。」という文がルール編集画面40のセンテンス表示欄42に記載されていた場合、ユーザは「アニー(企業名)」、「男性化粧品(販売対象)」、「発売(販売活動)」のマーキング部をクリックして「ルールを作成」のアンカーテキスト50をクリックする。
この文を構成する各文節は、図14(b)に示す係り受け構造を備えているため、情報抽出ルール生成部20は同図(c)に示すように、「<企業名>→<販売活動>」及び「<販売対象>→<販売活動>」の係り受け関係を取り出し、同図(d)に示す情報抽出ルール54を生成する。
この情報抽出ルール54を先の「東洋自動車は来月、スカイライナーを発売する。」の文に適用することにより、以下の情報を首尾良く抽出可能となる。
主語(企業名):東洋自動車
述語(企業活動):販売
目的語(活動対象):スカイライナー
この情報抽出ルールの編集作業に際しユーザは、素材文の意味内容を理解し、当該文が積極的な企業活動を表現しているものと判断した場合にのみ、文中のマーキング部を選択する。
例えば、図15(b)に示すように、「初芝は15日、携帯音楽プレーヤー『ギガバイト』の新製品の発売を延期すると発表した。」という文が与えられた場合、同図(a)の「初芝は、携帯音楽プレーヤー『ギガバイト』の新製品を15日、発売する。」と同じく、「初芝」、「携帯音楽プレーヤー」、「ギガバイト」、「発売」についてマーキングが施されることになる。
しかしながら、この(b)の文に基づいて情報抽出ルールを生成すると、ある企業が特定の企業活動の延期を発表したとする文の中から、当該企業が企業活動を積極的に行ったことを示す情報が誤って抽出される結果となる。
そこでユーザは、このような文を情報抽出ルール作成の対象からは意識的に除外する。
これに対し、図15(c)に示すように、「初芝は、携帯音楽プレーヤー『ギガバイト』をアメリカで発売すると発表した。」という文が与えられた場合、文の述語は「発表した」という一般的な用語であり、企業の生産活動を表す用語が述語にはなっていないが、文全体の意味からすれば企業が販売対象を販売することが記述されているため、ユーザは各マーキング部をクリックし、「ルールを作成」のアンカーテキスト50をクリックする。
これを受けた情報抽出ルール生成部20は、当該文から情報抽出ルールを生成する。
この文を構成する各文節は、図16(a)に示す係り受け構造を備えているため、情報抽出ルール生成部20は同図(b)に示すように、「<企業名>→<販売活動>」、「<販売対象>→<販売活動>」、「<販売活動>→(発表した)」及び「<場所>→<販売活動>」の係り受け関係を取り出し、同図(c)に示す情報抽出ルール56を生成する。
この情報抽出ルール56を適用することにより、例えば「東洋自動車は来月、ハイブリッド車をヨーロッパで売り出すと発表した。」という文から、以下の企業情報を抽出可能となる。
主語(企業名):東洋自動車
述語(企業活動):販売
目的語(活動対象):ハイブリッド車
場所:ヨーロッパ
図示は省略したが、先行する文の企業名主語を継承した文からも、情報抽出ルールを生成することができる。例えば、「[(初芝)]『[ギガバイト]』は10月下旬に[発売]する。」という文がルール編集画面40のセンテンス表示欄42に記載されていた場合に、ユーザが[(初芝)](継承した企業名主語)、[ギガバイト]及び[発売]に施されたマーキング部をクリックし、「ルールを作成」のアンカーテキスト50をクリックすると、情報抽出ルール生成部20によって以下の情報抽出ルールが生成される。
============================
extraction:
subject <企業名>
predicate: <販売活動>
object: <販売対象>

necessary:
<販売対象> -> <販売活動>
============================
この情報抽出ルールでは、「necessary(必須条件)」に<企業名>に関する係り受けが規定されていないが、この情報抽出ルールを適用する際には、対象となる文が先行文から継承した企業名が、主語(subject)として抽出されることになる。
ユーザは、上記のルール編集画面40を通じて辞書の追加登録を行うことができる。
例えば、センテンス表示欄42において「投入」という文字列に企業活動(この場合は「販売活動」)であることを示すマーキングが施されていない場合、ユーザはマウス操作によって「投入」を選択状態となした上で、「活動として辞書に追加」のアンカーテキスト60をクリックする。
これを受けた情報抽出ルール生成部20は、「投入」の文字列を辞書記憶部22の企業活動辞書に販売活動の一つとして追加登録する。
この結果、つぎに「投入」を含む文がセンテンス表示欄42に表示された際には、販売活動を示すマーキングが施されることとなる。
同様に、明らかに企業名であるにもかかわらずマーキング対象から外れている文字列が存在した場合、ユーザは当該文字列を選択状態とした上で、「企業として辞書に追加」のアンカーテキスト58をクリックする。
これを受けた情報抽出ルール生成部20は、当該文字列を辞書記憶部22の企業名辞書に企業名の一つとして追加登録する。
また、明らかに活動対象を示す文字列に対してマーキングが施されていない場合、ユーザは当該文字列を選択状態とした上で「対象として辞書に追加」のアンカーテキスト62をクリックし、展開される選択ウィンドウ(図示省略)上で一般名詞と固有名詞の区分を選択入力する。
これを受けた情報抽出ルール生成部20は、当該文字列を辞書記憶部22の活動対象辞書に販売活動の一つとして追加登録する。
この発明に係る情報抽出ルール作成支援システムの機能構成を示すブロック図である。 企業活動辞書の登録内容を例示する図表である。 活動対象辞書の登録内容を例示する図表である。 形態素解析の結果を示す図表である。 文中の企業名主語を認定する方法を例示する説明図である。 企業名主語の継承及び照応処理を説明する図表である。 構文解析の結果を示す図表である。 構文解析の結果である係り受け構造をイメージ化した図である。 形態素に付与された抽象化タグが文節に引き継がれる様子を示す図表である。 正規表現ルールによる抽象化処理を示す説明図である。 係り受けルールによる抽象化処理を示す説明図である。 ルール編集画面の一例を示す画面構成図である。 情報抽出ルール生成の過程を示す説明図である。 他の情報抽出ルール生成の過程を示す説明図である。 情報抽出ルール生成の素材となる文の他の例を示す説明図である。 他の情報抽出ルール生成の過程を示す説明図である。 構文解析格の結果である係り受け構造をイメージ化した説明図である。 情報抽出ルールをイメージ化した説明図である。 構文解析された文に情報抽出ルールを適用して構造化された企業情報を抽出する様子を示す説明図である。 他の情報抽出ルールをイメージ化した説明図である。
10 情報抽出ルール作成支援システム
12 形態素解析処理部
14 主語特定処理部
16 構文解析処理部
18 抽象化処理部
20 情報抽出ルール生成部
22 辞書記憶部
24 抽象化ルール記憶部
26 素材文記憶部
28 情報抽出ルール記憶部
30 クライアント端末
32 テキストデータ
40 ルール編集画面
42 センテンス表示欄
44 「販売活動」タブ
46 「生産活動」タブ
48 抽出ノード表示欄
50 「ルールを生成」のアンカーテキスト
52 情報抽出ルール
54 情報抽出ルール
56 情報抽出ルール
58 「企業として辞書に追加」のアンカーテキスト
60 「活動として辞書に追加」のアンカーテキスト
62 「対象として辞書に追加」のアンカーテキスト

Claims (7)

  1. 具体的な表現文字列と、その種類を示す抽象化文字列との対応関係を登録した辞書と、
    テキストデータ中の各文を形態素単位に分解する手段と、
    上記の辞書を参照し、各形態素の中で企業名、企業活動、活動対象に該当するものに対して対応の抽象化タグを関連付ける手段と、
    各文中の企業名主語を探索する手段と、
    企業名主語を備えた文を、素材文として素材文記憶手段に格納する手段と、
    この素材文記憶手段から素材文を取り出し、これらを所定のテンプレートに充填してルール編集画面を生成する手段と、
    このルール編集画面をクライアント端末に送信し、特定企業の企業活動及び活動対象が記述されている素材文の選択を促す手段と、
    クライアント端末から特定の素材文の選択情報が送信された場合に、当該素材文における企業名を含む文節、企業活動を含む文節及び活動対象を含む文節相互間の係り受け構造、またはこれら企業名を含む文節、企業活動を含む文節及び活動対象物を含む文節と企業名、企業活動、活動対象物以外の文字列を含む文節との間の係り受け構造を抽出条件として取り出し、これを所定の書式に従って記述した情報抽出ルールを生成する情報抽出ルール生成手段と、
    この情報抽出ルールを情報抽出ルール記憶手段に格納する手段と、
    を備えたことを特徴とする情報抽出ルール作成支援システム。
  2. 上記ルール編集画面中の各素材文には、企業名を示す文字列部分、企業活動を示す文字列部分、活動対象を示す文字列部分に対して、それぞれの種類を識別するためのマーキングが施されていることを特徴とする請求項1に記載の情報抽出ルール作成支援システム。
  3. 上記の辞書を参照し、各形態素の中で場所に該当するものに対して対応の抽象化タグを関連付ける手段を備え、
    上記情報抽出ルール生成手段は、クライアント端末から特定の素材文の選択情報が送信された場合に、当該素材文中に場所の抽象化タグが関連付けられた形態素が含まれているときには、当該場所を示す形態素が含まれた文節と、他の文節との係り受け構造を任意的な抽出条件として取り出し、これを含めた情報抽出ルールを生成することを特徴とする請求項1または2に記載の情報抽出ルール作成支援システム。
  4. 文中に主語が存在しない場合に、当該文の前に位置する文において企業名主語が存在しており、かつ、当該文と上記企業名主語が存在する文との間に他の企業名主語及び企業名以外の形態素を主語とする文が介在していないときには、上記企業名主語を当該主語の存在しない文の企業名主語として関連付ける手段を備えたことを特徴とする請求項1〜3の何れかに記載の情報抽出ルール作成支援システム。
  5. 文中に企業代名詞が主語として含まれていた場合に、当該文の前に位置する文において企業名主語が存在しており、かつ、当該文と上記企業名主語が存在する文との間に他の企業名主語及び企業名以外の形態素を主語とする文が介在していないときには、当該企業代名詞を上記企業名主語の企業名に置き換える手段を備えたことを特徴とする請求項1〜4の何れかに記載の情報抽出ルール作成支援システム。
  6. 予め設定された正規表現ルールを各文に対して適用し、当該正規表現ルールにマッチする形態素を企業名、企業活動、活動対象物の何れかであると認定すると共に、当該形態素に対して対応の抽象化タグを関連付ける手段を備えたことを特徴とする請求項1〜5の何れかに記載の情報抽出ルール作成支援システム。
  7. 予め設定された係り受けルールを各文に対して適用し、当該係り受けルールにマッチする文節の形態素を企業名、企業活動、活動対象物の何れかであると認定すると共に、当該形態素に対して対応の抽象化タグを関連付けることを特徴とする請求項1〜6の何れかに記載の情報抽出ルール作成支援システム。
JP2009239416A 2009-10-16 2009-10-16 情報抽出ルール作成支援システム Expired - Fee Related JP5317922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009239416A JP5317922B2 (ja) 2009-10-16 2009-10-16 情報抽出ルール作成支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009239416A JP5317922B2 (ja) 2009-10-16 2009-10-16 情報抽出ルール作成支援システム

Publications (2)

Publication Number Publication Date
JP2011086167A true JP2011086167A (ja) 2011-04-28
JP5317922B2 JP5317922B2 (ja) 2013-10-16

Family

ID=44079056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009239416A Expired - Fee Related JP5317922B2 (ja) 2009-10-16 2009-10-16 情報抽出ルール作成支援システム

Country Status (1)

Country Link
JP (1) JP5317922B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140108326A (ko) * 2011-12-28 2014-09-05 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 평가 정보 생성 방법 및 시스템, 및 컴퓨터 저장 매체
JP2019096248A (ja) * 2017-11-28 2019-06-20 富士ゼロックス株式会社 文書処理装置及びプログラム
CN111783460A (zh) * 2020-06-15 2020-10-16 苏宁金融科技(南京)有限公司 一种企业简称提取方法、装置、计算机设备及存储介质
JP7064274B2 (ja) 2017-10-10 2022-05-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 意図認識のための抽象化および移植性

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297100A (ja) * 2000-04-14 2001-10-26 Fuji Xerox Co Ltd キーワード抽出ルール精製支援装置
WO2008093569A1 (ja) * 2007-01-29 2008-08-07 Nec Corporation 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム
WO2009087996A1 (ja) * 2008-01-07 2009-07-16 Nec Corporation 情報抽出装置及び情報抽出システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297100A (ja) * 2000-04-14 2001-10-26 Fuji Xerox Co Ltd キーワード抽出ルール精製支援装置
WO2008093569A1 (ja) * 2007-01-29 2008-08-07 Nec Corporation 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム
WO2009087996A1 (ja) * 2008-01-07 2009-07-16 Nec Corporation 情報抽出装置及び情報抽出システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140108326A (ko) * 2011-12-28 2014-09-05 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 평가 정보 생성 방법 및 시스템, 및 컴퓨터 저장 매체
JP2015506509A (ja) * 2011-12-28 2015-03-02 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 評価情報を生成するための方法およびシステム、ならびにコンピュータ記憶媒体
KR101652358B1 (ko) * 2011-12-28 2016-08-30 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 평가 정보 생성 방법 및 시스템, 및 컴퓨터 저장 매체
JP7064274B2 (ja) 2017-10-10 2022-05-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 意図認識のための抽象化および移植性
JP2019096248A (ja) * 2017-11-28 2019-06-20 富士ゼロックス株式会社 文書処理装置及びプログラム
CN111783460A (zh) * 2020-06-15 2020-10-16 苏宁金融科技(南京)有限公司 一种企业简称提取方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
JP5317922B2 (ja) 2013-10-16

Similar Documents

Publication Publication Date Title
US7143026B2 (en) Generating rules to convert HTML tables to prose
CN104252533B (zh) 搜索方法和搜索装置
Billington et al. The petri net markup language: Concepts, technology, and tools
JP2007141123A (ja) 異なるファイルの同一文字列のリンク
CN102236645A (zh) 基于语义逻辑的类自然语言人机对话装置
JP2007287134A (ja) 情報抽出装置、及び情報抽出方法
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP4625535B1 (ja) 情報抽出システム及び情報抽出プログラム
JP5317922B2 (ja) 情報抽出ルール作成支援システム
Rodrigues et al. Advanced applications of natural language processing for performing information extraction
Ide et al. Towards International Standards for Language Resources Nancy Ide and Laurent Romary
KR101818107B1 (ko) 스토리텔링 저작지원 장치 및 그 방법
JP5410334B2 (ja) 語順変換装置、機械翻訳用統計モデル作成装置、機械翻訳装置、語順変換方法、機械翻訳用統計モデル作成方法、機械翻訳方法、プログラム
Chadwick Programming Razor
Sierra et al. A document-oriented paradigm for the construction of content-intensive applications
JP5438603B2 (ja) 感性辞書編集支援システム及びプログラム
Bauer et al. Trias: Trainable information assistants for cooperative problem solving
Kumar et al. Punjabi deconverter for generating Punjabi from universal networking language
Deeptimahanti et al. An innovative approach for generating static UML models from natural language requirements
JP4377096B2 (ja) 普遍言語による表現を生成するシステム
Brown Information architecture with XML: a management strategy
Kilgarriff A detailed, accurate, extensive, available English lexical database
Phillips et al. Special edition using XML
Saadatfar et al. Best Practice for DSDL-based Validation
JP2006154952A (ja) 構造化文書処理装置及び構造化文書処理方法、プログラム、記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130709

R150 Certificate of patent or registration of utility model

Ref document number: 5317922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees