JP5941345B2 - 文字情報の分析方法および情報分析装置並びにプログラム - Google Patents
文字情報の分析方法および情報分析装置並びにプログラム Download PDFInfo
- Publication number
- JP5941345B2 JP5941345B2 JP2012133729A JP2012133729A JP5941345B2 JP 5941345 B2 JP5941345 B2 JP 5941345B2 JP 2012133729 A JP2012133729 A JP 2012133729A JP 2012133729 A JP2012133729 A JP 2012133729A JP 5941345 B2 JP5941345 B2 JP 5941345B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- word
- concept
- analysis
- cost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
このような状況において、これらの電子化文書を計算機上で分析し、情報検索や自動分類、自動要約など電子化文書を利活用するための仕掛けに対する需要が高まっている。
形態素解析技術を用いることによる文字列分割(以下、分かち書きと呼ぶ)後の各文字列は、形態素と呼ばれる言語的に意味のある塊となっており、さらに、各形態素における詳細な特性情報(品詞、名詞、動詞など)を利用することが可能になるため、より詳細なデータによる様々な再利用が可能になるという利点がある。ただし、形態素解析技術を実現したプログラム(以下、形態素解析エンジンと呼ぶ)では、一般的に、形態素解析を実行するための本体となるプログラムの他に、形態素解析を実行するための辞書、具体的には、その言語に対応した単語情報を定義した単語辞書と、その言語における語彙の連接関係に関する情報を格納した連接辞書などが必要となっている。すなわち、形態素解析を実行するためには、その言語に対応した言語知識を格納した複数の形態素解析用の辞書(以下、形態素解析辞書と呼ぶ)が別途必要となる。
このことから、形態素解析エンジンには、その形態素解析エンジンに対応した自然言語毎の形態素解析辞書を別途提供している形態が多い。この形態素解析辞書を用いることにより、95〜98%程度の形態素解析精度を得ることができるとされている。
また、もしその分野における用語を全て定義したとしても、その形態素解析辞書を別の業界や企業に適用すれば、その業界や企業では使われていない用語であるため、解析精度がかえって低下することになる。このことから、専門用語などについては、状況に応じて辞書を複数用意し、容易に辞書を切り替えられるような仕組みが求められる。
上述した問題を解決するためには、状況に応じて形態素解析辞書をメンテナンスすることが必要となる。しかし、現状の形態素解析エンジンでは、このメンテナンスを人手で行なう必要があり、過大な負担となっていることが問題となっている。
まず,形態素解析辞書には、少なくとも単語自体の情報を格納するための「単語辞書」と単語間の連接情報を格納するための「連接辞書」が存在する。
図3は、形態素解析辞書の一部である単語辞書の一例を示す図である。
「表層形」というのは、単語が表記される形である。
「左文脈ID」はその単語を左(前)から見たときの内部状態における識別子、
「右文脈ID」はその単語を右(後)から見たときの内部状態における識別子である。
また、「生起コスト」とは、その単語の出現しやすさを示す指標である。この数値が小さいほど出現しやすいという意味となる。
また、上述したデータ項目の他、品詞、基本形、活用形、単語の原形、読み等を付与している辞書も存在する。
本発明は、日本語に限らず、言語の特性として、同じ種別(概念)に属するものを直接入れ替えても文章として成立することが多いことから着想を得ている。例えば、「私は、日立のテレビを買いました。」という文章の場合、「日立」を「東芝」や「GE」などに置き換えても文章として成立する。また、「テレビ」を「パソコン」、「携帯電話」、あるいは、「スマートフォン」などに入れ替えても文章は成立する。ここで、「日立」「東芝」「GE」といった単語については、例えば「企業名」という概念で集約することができる。また、「テレビ」、「パソコン」、「携帯電話」、あるいは、「スマートフォン」という単語については、例えば「商品」という概念で集約することができる。こういったことは、特に名詞と類される単語に有効であると考えられる。業界内あるいは企業内で独自に用いられる単語など新規に登録したい単語のほとんどは名詞に属するものであるため、この概念による集約という考え方は特に有効であると考えられる。
その後、本処理として形態素解析を実行する際には、前処理として再構築済の形態素解析辞書を用いて行なう。
これにより、事前に単語の生起コストおよび連接コストが設定されていない場合でも、その単語が属する概念から該当単語の生起コストおよび連接コストが自動的に設定されることになり、高精度な解析精度を実現することが可能となる。
自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書と、単語と前記単語の意味を表現する概念とを対応付ける辞書とから成る辞書データを読み込む外部定義辞書取得手段と、
前記外部定義辞書取得手段によって取得した辞書データを元に、前記テキストデータの概念に内包される単語の生起コストの平均値又は最頻値を概念の生起コストとして推定する概念特性推定手段と、
ユーザが追加で作成した単語と前記単語の意味を表現する概念とを対応付ける辞書を読み込み、前記概念特性推定手段によって得られた概念の生起コストを当該概念に内包される単語と対応付けることにより、単語の生起コストを推定する単語特性推定手段と、
前記外部定義辞書取得手段によって得られる辞書データと前記単語特性推定手段によって得られる単語の生起コストとを含む分析辞書を構築する分析辞書構築手段と、
ユーザが入力した自然言語からなるテキスト情報を入力文として受け付ける文字情報受付手段と、
前記分析辞書構築手段により生成した分析辞書を用いて前記文字情報受付手段によって得られた入力文に内包される単語を同定して抽出する単語抽出手段と、
前記単語抽出手段によって得られた抽出結果をユーザの指示に基づき、選択して出力する分析結果出力手段と
を有することを特徴とする。
前記各辞書をメンテナンスするユーザの指示に従い、前記未知語を提示する改善候補データ提示手段とをさらに備えることを特徴とする。
前記計算機が、
自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書と、単語と前記単語の意味を表現する概念とを対応付ける辞書とから成る辞書データを読み込む第1のステップと、
前記第1のステップにおいて読み込んだ辞書データを元に、前記テキストデータの概念に内包される単語の生起コストの平均値又は最頻値を概念の生起コストとして推定する第2のステップと、
ユーザが追加で作成した単語と前記単語の意味を表現する概念とを対応付ける辞書を読み込み、前記第2のステップで得られた概念の生起コストを当該概念に内包される単語と対応付けることにより、単語の生起コストを推定する第3のステップと、
前記第1のステップにおいて読み込んだ辞書データと前記第2のステップにおいて得られた単語の生起コストとを含む分析辞書を構築する第3のステップと、
ユーザが入力した自然言語からなるテキスト情報を入力文として受け付ける第4のステップと、
前記第3のステップにおいて構築した分析辞書を用いて前記第4のステップにおいて受け付けた入力文に内包される単語を同定して抽出する第5のステップと、
前記第5のステップにおいて抽出した抽出結果をユーザの指示に基づき、選択して出力する第6のステップと
を備えることを特徴とする。
前記各辞書をメンテナンスするユーザの指示に従い、前記未知語を提示するステップをさらに備えることを特徴とする。
概念の生起コストを、当該概念と関係のある概念の生起コストに所定の重み係数を乗算することによって生成するステップとをさらに含むことを特徴とする。
前記計算機を、
自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書と、単語と前記単語の意味を表現する概念とを対応付ける辞書とから成る辞書データを読み込む外部定義辞書取得手段と、
前記外部定義辞書取得手段によって取得した辞書データを元に、前記テキストデータの概念に内包される単語の生起コストの平均値又は最頻値を概念の生起コストとして推定する概念特性推定手段と、
ユーザが追加で作成した単語と前記単語の意味を表現する概念とを対応付ける辞書を読み込み、前記概念特性推定手段によって得られた概念の生起コストを当該概念に内包される単語と対応付けることにより、単語の生起コストを推定する単語特性推定手段と、
前記外部定義辞書取得手段によって得られる辞書データと前記単語特性推定手段によって得られる単語の生起コストとを含む分析辞書を構築する分析辞書構築手段と、
ユーザが入力した自然言語からなるテキスト情報を入力文として受け付ける文字情報受付手段と、
前記分析辞書構築手段により構築した分析辞書を用いて前記文字情報受付手段によって得られた入力文に内包される単語を同定して抽出する単語抽出手段と、
前記単語抽出手段によって得られた抽出結果をユーザの指示に基づき、選択して出力する分析結果出力手段として機能させることを特徴とする。
このことから、形態素解析辞書における辞書メンテナンスコストを削減することができるようになる。さらに、新規単語の辞書登録自体が容易になるため、頻繁にメンテナンスを行なうことができるようになり、結果として形態素解析精度の向上につなげることができるなどの効果が得られる。
<第1の実施形態>
図1は、本発明の第1の実施形態を示すシステムの全体構成図である。
図1に示す通り、本実施形態の情報分析システムは情報分析辞書構築サブシステム101、情報分析サーバ102、情報分析クライアント103および104を備える。これらの各装置はネットワーク105によって接続されている。
情報分析辞書構築サブシステム101は、形態素解析に用いる単語辞書や連結辞書を再構築するための計算機であり、その詳細な構成は図2を用いて後述する。すなわち、情報分析辞書構築サブシステム101は、形態素解析に用いる単語辞書や連結辞書の他、言葉の意味概念を定義するための概念定義辞書と概念と単語を紐付けるための概念辞書を保持する。情報分析辞書構築サブシステム101は、これらの各種辞書を用いて、概念レベルでの生起コストと連接コストを算出し、それぞれ概念生起コスト辞書および概念連接コスト辞書として生成する。
その後、この概念生起コスト辞書および概念連接コスト辞書を元に単語辞書および連接辞書を再構築する。
次に、本実施形態における情報分析辞書構築サブシステム101について説明する。
図2は、本実施形態における情報分析辞書構築サブシステム101の構成を示すブロック図である。
情報分析辞書構築サブシステム101は、メモリ110、記憶装置120、CPU(中央演算装置)130、出力装置140、入力装置150および通信インタフェース160を備え、これらの各構成がバス170によって接続される一般的な構成のコンピュータである。
メモリ110は、CPU130によって実行されるプログラムを格納する。具体的には、システム制御プログラムP10および情報分析辞書構築制御プログラムP11がメモリ110に格納される。また、メモリ110には、CPU130によるプログラムの実行時にデータを一時的に格納するワークエリアが設けられる。
情報分析辞書構築制御プログラムP11は、情報分析のために必要となる辞書を構築するプログラムであり、概念コスト分析プログラムP111を含む。
概念コスト分析プログラムP111は、記憶装置120に存在する各種辞書を読み出し、単語の生起コストや連接コストを同定するために必要となる概念レベルでのコスト値を算出し、記憶装置120に格納する(図9のステップS107)プログラムである。
また、記憶装置120には、単語辞書D110、連接辞書D120、概念提示辞書D130、概念辞書D140、概念生起コスト辞書D150および概念連接コスト辞書D160が格納される。
単語辞書D110は、一般的な形態素解析処理に用いられる単語辞書であり、図3に示すように単語の情報を保持する。なお、前述したように、図3に示したデータの他に、単語ID、品詞、活用形、単語の原形、読みなどを付加した形としても構わない。
概念定義辞書D130は、図5に示すように概念を識別するためのID(識別子)と具体的な概念名とを紐付ける情報を保持する。なお、図5に示したデータの他に、概念そのものの定義や概念が属する品詞などその他の項目を付加した形としても構わない。
概念生起コスト辞書D150は、図7に示すように、概念に関する情報、特に、生起コスト情報を保持する。基本的なデータ構造としては、単語辞書D110と同様の形態となるが、独自の項目を追加しても構わない。
出力装置140は、処理の結果を画面に表示するディスプレイや、紙に出力するプリンタなどである。
入力装置150は、ユーザが情報分析辞書構築サブシステム101に指示を与えるためのキーボード、マウスなどである。
まず、ユーザあるいは情報分析サーバ102からのリクエストを受信すると(ステップS101)、受信したリクエストを解析する(ステップS202)。
受信したリクエストが辞書構築コマンドである場合、要求された登録内容に応じて情報を記憶装置120に格納する。
具体的には、単語辞書の登録要求であれば、受信した単語辞書情報を単語辞書格納領域D110に格納する(ステップS103)。連接辞書の登録要求であれば、受信した連接辞書情報を連接辞書格納領域D120に格納する(ステップS104)。概念定義辞書の登録要求であれば、受信した概念定義辞書情報を概念定義辞書格納領域D130に格納する(ステップS105)。概念辞書の登録要求であれば、受信した概念辞書情報を概念辞書格納領域D140に格納する(ステップS106)。概念コストの算出要求であれば、概念コスト生成プログラムP111を実行することにより、記憶装置120内に存在する単語辞書D110、連接辞書D120、概念定義辞書D130、概念辞書D140を元に、概念における生起コストと連接コストを算出し、概念生起コスト辞書格納領域D150および概念連接コスト辞書格納領域D160に格納する(ステップS107)。
一方、受信したリクエストが情報転送コマンドである場合、要求された問合せ内容に応じた情報を記憶装置120から読み出して(ステップS108)、読み出した情報を要求元に送信する(ステップS109)。その後、ステップS101に戻り、他のリクエストの受信を待つ。
ここで、概念コスト分析プログラムP111、すなわち、図9におけるステップS107の詳細について、図面を用いて説明する。
まず、概念コスト分析プログラムP111は、記憶装置120から概念辞書D140を取得し、ワークエリアに格納する(ステップS10701)。その後、ループを制御するパラメータnを1に初期設定する(ステップS10702)。
そして、ワークエリアに格納した概念辞書D140から、n番目の概念情報を読み出す(ステップS10703)。なお、概念情報とは、概念IDと単語が紐付いた情報のことを指す。
まず、ステップS10704、すなわち、辞書構築に用いるモデルの更新処理について図面を用いて説明する。
図11は、ステップS10704において実行される処理のフローチャートである。
概念IDと単語が紐付いた情報を入力として、ステップS10704が実行されると、まず、記憶装置120から単語辞書D110を取得し、ワークエリアに格納する(ステップS1070401)。さらに、記憶装置120から連接辞書D120を取得し、ワークエリアに格納する(ステップS1070402)。その後、ループを制御するパラメータsを1に初期設定する(ステップS1070403)。
読み出したs番目の単語情報が、入力値である単語と合致するか否かを判定し(ステップS1070405)、合致すれば、ステップS1070406およびステップS1070407の処理を実行する。合致しなければ、ステップS1070408乃至ステップS1070410の処理を実行する。
ステップS1070405において、入力値である単語と合致すると判定した場合、入力値として得られた概念IDとs番目の単語情報内に存在する左文脈ID、右文脈ID、生起コストを元に、概念生起コストモデルを更新(追記)する(ステップS1070406)。
概念生起コストモデルはワークエリア内で存在し、図12で示す通り、概念を識別するIDと左文脈ID、右文脈ID、生起コストが格納できるようになっている。このモデルに対して、得られたデータをそのまま追記するという形になる。なお、ここでは、概念生起コストモデルはワークエリア内に存在することとしたが、記憶装置120内に概念生起コストモデルを格納するための専用領域を確保し、そこで更新処理を実行するようにしても構わない。
図13は、概念連接コストモデルのデータ構造の一例を示す図である。
概念連接コストモデルはワークエリア内で存在し、図13で示す通り、左文脈ID、右文脈ID、連接コストが格納できるようになっている。また、左文脈IDと右文脈IDをキーにした場合に、複数の連接コストが格納できるような形となっている。このモデルに対して、得られたデータをそのまま追記するという形になる。なお、ここでは、概念連接コストモデルはワークエリア内に存在することとしたが、記憶装置120内に概念連接コストモデルを格納するための専用領域を確保し、そこで更新処理を実行するようにしても構わない。
ステップS1070407の処理が終わると、ステップS10704の処理を終了する。
その結果、次(s+1番目)の単語情報が存在すれば、パラメータに“1”を加算し(ステップS1070409)、ステップS1070404に戻り、次の単語情報についての処理を実行する。
未処理単語モデルはワークエリア内で存在し、図14で示す通り、単語そのものと概念を識別するIDが紐付いて格納できるようになっている。このモデルに対して、得られたデータをそのまま追記するという形になる。基本的なデータ構造としては、図6に示した概念辞書と同様の形態であるため、概念辞書のデータ構造に合わせて、図14で示した項目以外の項目を追加しても構わない。なお、ここでは、未処理単語モデルはワークエリア内に存在することとしたが、記憶装置120内に未処理単語モデルを格納するための専用領域を確保し、そこで更新処理を実行するようにしても構わない。
ステップS1070410の処理が終わった後、ステップS10704の処理を終了する。
以上がステップS10704の処理の詳細である。
図15は、ステップS10707において実行される処理の概要を示すフローチャートである。
ステップS10707では、まず、概念生起コスト辞書を生成し(ステップS107071)、概念連接コスト辞書を生成する(ステップS107072)。その後、形態素解析に用いる単語辞書を生成し(ステップS107073)、同じく形態素解析に用いる連接辞書を生成する(ステップS107074)という流れになる。なお、ステップS107071乃至ステップS107074の詳細については、図面を用いて後述する。
まず、ステップS107071、すなわち、概念生起コスト辞書の生成処理について図面を用いて説明する。
ステップS107071では、まず、ワークエリア内に存在する概念生起コストモデルを取得する(ステップS10707101)。さらに、記憶装置120に存在する概念定義辞書D130を取得し、ワークエリアに格納する(ステップS10707102)。
概念生起コストモデルに存在する概念IDおよび概念定義辞書D130に存在する概念IDを元に、構築対象となる概念IDの全リストを作成する(ステップS10707103)。その後、ループを制御するパラメータiを“1”に初期設定する(ステップS10707104)。
その後、構築対象となる概念IDの全リストに次の概念IDが存在するか否かを確認する(S10707110)。
その結果、次(i+1番目)の情報が存在すれば、パラメータに“1”を加算し(ステップS10707111)、ステップS10707105に戻り、次の単語情報についての処理を実行する。
以上が、ステップS107071の詳細な説明である。
図17は、ステップS107072において実行される処理のフローチャートである。
ステップS107072では、まず、ワークエリア内に存在する概念連接コストモデルを取得する(ステップS10707201)。さらに、記憶装置120に存在する概念生起コスト辞書D150を取得し、ワークエリアに格納する(ステップS10707202)。
概念連接コストモデルに存在する左文脈ID、右文脈IDおよび概念生起コスト辞書D150に存在する左文脈ID、右文脈IDを元に、構築対象となる左文脈IDと右文脈IDのペアの全リストを作成する(ステップS10707203)。
その後、ループを制御するパラメータiを“1”に初期設定する(ステップS10707204)。
その後、構築対象となる左文脈IDと右文脈IDのペアの全リストに次のペアが存在するか否かを確認する(S10707108)。
その結果、次(i+1番目)の情報が存在すれば、パラメータに“1”を加算し(ステップS10707109)、ステップS10707205に戻り、次の単語情報についての処理を実行する。
以上が、ステップS107072の詳細な説明である。
次に、ステップS107073、すなわち、形態素解析に用いる単語辞書の生成処理について図面を用いて説明する。
ステップS107073では、まず、記憶装置120に存在する概念生起コスト辞書D150を取得し、ワークエリアに格納する(ステップS10707301)。さらに、ワークエリアに存在する未処理単語モデルを取得する(ステップS10707302)。
その後、ループを制御するパラメータiを“1”に初期設定する(ステップS10707303)。
そして、未処理単語モデルから、i番目の単語情報を読み出す(ステップS10707304)。
ステップS10707305およびステップS10707306による生起コスト計算が終了すると、構築対象となる未処理単語の全リストに次の未処理単語が存在するか否かを確認する(S10707307)。
一方、次(i+1番目)の未処理単語が存在しない場合、全ての未処理単語についての処理が終了していると考えられるため、ワークエリア内に存在する処理済みのデータを元に、記憶装置120に存在する単語辞書格納領域D110を更新する(ステップS10707309)。
全ての更新処理が終了後、ステップS107073の処理を終了する。
以上が、ステップS107073の詳細な説明である。
図19は、ステップS107074において実行される処理のフローチャートである。
ステップS107074では、まず、記憶装置120内に存在する概念連接コスト辞書D160を取得する(ステップS10707401)。さらに、記憶装置120に存在する連接辞書D120を取得し、ワークエリアに格納する(ステップS10707402)。
概念連接コスト辞書D160に存在する左文脈ID、右文脈IDおよび連接辞書D120に存在する左文脈ID、右文脈IDを元に、構築対象となる左文脈IDと右文脈IDのペアの全リストを作成する(ステップS10707403)。
そして、構築対象となる左文脈IDと右文脈IDのペアの全リストから、i番目の左文脈IDと右文脈IDのペアを読み出す(ステップS10707405)。読み出した左文脈IDと右文脈IDのペアを元に、概念連接コスト辞書D160と連接辞書D120を走査し(ステップS10707406)、左文脈IDと右文脈IDのペアにおける連接コスト値を算出する(ステップS10707107)。
その結果、次(i+1番目)のペアが存在すれば、パラメータに“1”を加算し(ステップS10707409)、ステップS10707405に戻り、次のペアについての処理を実行する。
全ての更新処理が終了後、ステップS107074の処理を終了する。
以上が、ステップS107074の詳細な説明である。
以下では、第1の実施例における情報分析辞書構築処理について、具体的な例を用いて説明する。
形態素解析を実行するための辞書に単語を登録するためには、その単語が辞書内に存在するかを確認し、存在していなければ、新規に単語を登録するという手順となる。本実施形態では、その確認作業を軽減するための施策についても後述することになるが、ここでは、「京大」という単語が形態素解析を実行するための辞書に存在せず、新たに登録したい場合を例にして説明する。
前述したように、通常であれば、図3のような単語辞書に「京大」という単語を追加し、左文脈ID、右文脈ID、生起コストという値について試行錯誤を繰り返して設定しなくてはならなかった。また、左文脈IDもしくは右文脈IDとして記載するIDを新規に作成した場合には、図4のような連接辞書に対して、該当するIDの組み合わせおよびその連接コストを試行錯誤で設定しなくてはならなかった。そのため、メンテナンスにおけるコストが増大するという問題があった。
本実施形態では、その試行錯誤を繰り返すことによるコストが必要でなくなることを示す。
次に、図4のような連接辞書を用意し、登録する。具体的には、図9におけるステップS104の処理を実行する。この連接辞書についても、単語辞書と同様に一般に形態素解析で用いられる辞書をそのまま活用して構わない。
次に、図6のような概念辞書を用意し、登録する。具体的には、図9におけるステップS106の処理を実行する。概念辞書については後述する。
以下では、前述した概念定義辞書および概念辞書について記載する。
図20の例では、「東芝」という単語は、「企業」という概念に属し、「日立」という単語は、「企業」という概念と「地域」という概念に属していることを示している。また、同様に、「京都大学」という単語は、「教育機関」という概念と「施設」という概念に属し、「京都」という単語は、「地域」という概念に属していることを示している。
まず、図6のような概念辞書に「京大」という単語を追加する。その後、「京大」という単語がどのような意味を持つのかを考慮し、図5のような概念定義辞書データ構造を俯瞰し、該当するものを「京大」という単語と紐付ける。ここでは、「京大」という単語は、「教育機関」という概念と「施設」という概念に属しているものとする。また、図5より、「教育機関」という概念の概念IDは「120」、「施設」という概念の概念IDは「520」であることがわかる。そのため、概念辞書に「京大」という単語と「120」という概念IDを紐付け、さらに、「京大」という単語と「520」という概念IDを紐付ければよい。
なお、図20で示した状態に、「京大」という単語を紐付けした結果をイメージ化したのが、図21である。
また、ここでは概念定義辞書に定義を追加する処理については記載していないが、ここで新たな概念を定義しても構わない。
なお、ユーザにとってこれらの辞書登録を利便化するために、専用の画面を用意することも容易に実現できる。なお、図22に登録画面の一例を示す。
これらの定義を行ない、概念定義辞書および概念辞書の登録を行なった後、実際の辞書構築処理を行なう。具体的には、図9におけるステップS107の処理を行なう。
ここで、図14に示す通り、「京大」という単語は、「120」と「520」という概念IDと紐付けられているとする。
同様にして、概念IDが「520」であるデータを取得し、左文脈IDが「100」、右文脈IDが「100」である「京大」の生起コストを算出する。
これらにより、「京大」という生起コストが得られたため、そのデータを単語辞書格納領域D110に追加更新する。
この手順により、ユーザによる試行錯誤による設定ではなく、ユーザは概念辞書に「京大」という単語とその意味する概念をマッピングするだけで、単語辞書に「京大」という単語を自動的に追加し、かつ、形態素解析実行に必要な生起コストおよび連接コストの妥当な値を自動的に算出して設定することができる。
以上が、第一の実施例における情報分析辞書構築処理についての説明である。
次に、本実施形態における情報分析サーバ102について説明する。
図23は、本実施形態における情報分析サーバ102の構成を示すブロック図である。
情報分析サーバ102は、前述した情報分析辞書構築サブシステム101と比べると格納されているプログラムが異なること以外は同じ構成を有する。このため、前述した情報分析辞書構築サブシステム101と同じ構成には同じ符号を付し、その説明は省略する。
すなわち、情報分析サーバ102は、メモリ110、記憶装置120、CPU(中央演算装置)130、出力装置140、入力装置150および通信インタフェース160を備え、これらの各構成がバス170によって接続される一般的な構成のコンピュータである。
分析条件式解析プログラムP122は、ユーザによって入力された分析条件式を解析する(図24のステップS205)。
形態素解析プログラムP123は、形態素解析を実行するプログラムである(図24のステップS206)。
未知語リスト取得プログラムP124は、記憶装置120内に存在する未知語リストD200の内容を要求元に転送する(図24のステップS210およびステップS211)。
また、記憶装置120には、単語辞書D110および連接辞書D120が含まれる。単語辞書D110および連接辞書D120は、情報分析辞書構築サブシステム101にて構築された辞書データであり、辞書ローディングプログラムP121によって情報分析辞書構築サブシステム101からロードされ、記憶装置120に格納される。
情報分析サーバ102は、情報分析プログラムP12を実行することによって、情報分析クライアント103もしくは104から送信された分析要求に基づいて、データを分析し、分析結果を要求元の情報分析クライアントに返信する。次にこの処理の詳細を図面を用いて説明する。
まず、情報分析サーバ102は、要求元からリクエストを受信すると(ステップS201)、受信したリクエストを解析する(ステップS202)。
受信したリクエストが辞書ローディング要求であった場合、辞書ローディングプログラムP121を実行し、情報分析辞書構築サブシステム101にて格納されている単語辞書と連接辞書を取得するため、情報分析辞書構築サブシステム101に対して情報転送コマンドを発行し(ステップS203)、情報分析辞書構築サブシステム101から返送されてきた各種辞書データを記憶装置120の単語辞書格納領域D110および連接辞書格納領域D120に格納する。
一方、受信したリクエストがサーバ停止要求であった場合、情報分析サーバ102の動作を停止する。
一方、受信したリクエストが分析要求であった場合、分析条件式解析プログラムP122を実行し、分析条件式を解析する(ステップS205)。具体的には、分析条件式からユーザが入力した解析対象テキストを取得する。
一方、解析結果の形態素集合に未知語が存在していれば、解析結果に含まれる未知語の集合を未知語リストD200に登録する(ステップS208)。
その後、ステップS206にて得られた解析結果を要求元に返信する(ステップS209)。
図25に示すように、形態素解析を行った結果、未知語と判断された単語、すなわち、単語辞書に登録されていない語彙のリストが格納されている。なお、図25では、未知語の単語表記のみを格納することとしているが、辞書メンテナンスを行う際の参考情報のために、出現回数や、その未知語が出現した時における前後の文字列など、その他の項目を合わせて格納するようにしてもよい。
この未知語リストD200が存在することにより、未知語リスト内の未知語は辞書に存在しない単語であることが明確にわかるため、辞書メンテナンスを行う際の指標を得ることができる。このことにより、その単語が辞書内に存在するかを確認し、存在していなければ、新規に単語を登録するという手順を、大幅に軽減することができる。
以上が、本発明の第1の実施例における情報分析サーバ102についての説明である。
次に、本実施形態における情報分析クライアント103,104について説明する。
図26は、本実施例における情報分析クライアント103あるいは104の構成を示すブロック図である。
情報分析クライアント103あるいは104は、前述した情報分析辞書構築サブシステム101(図2)と比べ、格納されているプログラムが異なること以外は同じ構成を有する。このため、前述した情報分析辞書構築サブシステム101と同じ構成には同じ符号を付し、その説明は省略する。
すなわち、情報分析クライアント103あるいは104は、メモリ110、記憶装置120、CPU(中央演算装置)130、出力装置140、入力装置150および通信インタフェース160を備え、これらの各構成がバス170によって接続されるコンピュータである。
メモリ110は、CPU130によって実行されるプログラムを格納する。具体的には、システム制御プログラムP10および分析クライアント制御プログラムP13がメモリ110に格納される。
分析条件入力プログラムP131は、ユーザからの分析条件の入力を受け付け、分析リクエストを情報分析サーバ102に送信する。分析結果表示プログラムP132は、ユーザからの指示に従って分析結果を表示する。
記憶装置120には、各種プログラムD100が格納される。この各種プログラムD100には、システム制御プログラムP10および分析クライアント制御プログラムP13が含まれており、CPU130によって実行される際にメモリ110にロードされる。
情報分析クライアント103あるいは104は、分析クライアント制御プログラムP13を実行することによって、情報分析サーバ102に送信する分析要求を生成し、情報分析サーバ102によって行われた分析の結果を表示する。次に、この処理の詳細について図面を用いて説明する。
分析クライアント制御プログラムP13が起動されると、まず、分析条件入力用画面を表示して、指示(コマンド)の入力を促す(ステップS301)。
その後、コマンドが入力されると(ステップS302)、入力されたコマンドを解析する(ステップS303)。
解析したコマンドがクライアント停止コマンドである場合、分析クライアント制御プログラムP13を終了する。
その後、情報分析サーバ102から分析結果を受信すると、受信した分析結果を記憶装置120の分析結果データD300に格納する(ステップS306)。なお、分析結果は、分析対象となるテキストから得られた単語情報のリストが含まれ、図24におけるステップS209にて情報分析サーバ102から送信される。
さらに、本実施形態では、実際に解析を行った結果、十分に解析できなかった単語(未知語)を蓄積することができるため、ユーザはそれを用いて次に辞書登録すべき単語を判断することができるようになる。つまり、未知語を取得することと単語の新規登録が容易になることにより、辞書を積極的にメンテナンスすることが可能になり、結果的に解析精度を向上させることが可能になる。
次に本発明の第2の実施形態について図面を用いて説明する。この第2の実施形態は、システムの構成については前記第一の実施例と同一であるが、情報分析辞書構築サブシステム101の処理において、概念生起コスト辞書の生成方法が異なり、その結果、単語辞書における生起コスト値が異なってくる。
以下、本実施形態における情報分析辞書構築サブシステム101の詳細について説明する。
なお、第1の実施形態における情報分析辞書構築サブシステム101(図2)と同じ構成には同じ符号を付し、その説明は省略する。
図28は、本実施形態における情報分析辞書構築サブシステム101のシステム構成を示す図である。
図28に示す情報分析辞書構築サブシステム101は、そのハードウェア構成に関しては、図2に示す第1の実施形態の場合と変わらない。ただし、メモリ110中には、第1の実施形態において保持するプログラム群に加えて、概念関係調整プログラムP112を保持する。また記憶装置120には、第1の実施形態において確保する領域群に加えて、概念関係定義辞書D170が確保される。
概念関係調整プログラムP112は、概念間の関係性を元に概念における生起コストを調整し、単語の生起コストを更新するプログラムである(図29のステップS111)。
さらに、概念関係定義辞書D170は、第1の実施形態における概念定義辞書D130および概念辞書D140と同様、ユーザ自ら手作業にて構築してもよいし、非特許文献8および非特許文献9に提示されているWordNet、あるいは非特許文献10に提示されているEDRといった一般に入手可能な辞書を用いても構わない。または、特許文献3にて提示されている方式を用いて構築しても構わない。
第1の実施形態における情報分析辞書構築サブシステム101によって実行される処理のフローチャート、すなわち、図9と比較した場合、ステップS110およびステップS111が追加されていること以外は同じ処理内容を有する。このため、前述した情報分析辞書構築サブシステム101と同じ処理内容には同じ符号を付し、その説明は省略する。
受信したリクエストが辞書構築コマンドである場合、要求された登録内容に応じて情報を記憶装置120に格納する。具体的には第1の実施形態において説明した内容と同等であるが、第1の実施形態と比較して、概念関係定義辞書登録コマンドに基づいて、記憶装置120に格納される(図29のステップS110)処理が加わる。
ここで、図29のステップS111の詳細について、図面を用いて説明する。
まず、概念関係調整プログラムP112は、まず、記憶装置120に存在する概念関係定義辞書D170を読み出し、概念関係定義の全リストをワークエリアに格納する(ステップS11101)。さらに、記憶装置120から概念生起コスト辞書D150上の全データを読み出し、概念生起コストモデルとしてワークエリアに格納する。また、同様に、記憶装置120から概念連接コスト辞書D160上の全データを読み出し、概念連接コストモデルとしてワークエリアに格納する。(ステップS11102)。
そして、ワークエリアに格納した概念生起コストモデルからa番目の概念生起コスト情報を取得する(ステップS11104)。
a番目の概念生起コスト情報とb番目の概念定義情報を元に、a番目の概念生起コスト情報に存在する概念IDとb番目の概念定義情報に存在するいずれかの概念IDが合致するか否かを判定し(ステップS11106)、合致する場合は、ステップS11107およびステップS11108からなる処理に進む。
ステップS11107では、b番目の概念定義情報に存在する概念IDのうち、a番目の概念生起コスト情報に存在する概念IDと合致しなかった概念IDと共に、a番目の概念生起コスト情報に存在する左文脈ID、右文脈ID、および生起コストをセットにして、概念生起コストモデルに追記する。
ステップS11108の処理の後、ステップS11111にてパラメータbを初期状態、つまり、“1”に設定し、ステップS11112に進む。
ステップS11114の処理を終えると、全ての処理が終了したと考え、概念関係調整プログラムP112、すなわち、ステップS111の処理を終了する。
以下では、第2の実施形態における情報分析辞書構築処理について、具体的な例を用いて説明する。
ここで、企業内における部門名の略称を辞書に登録する場合を考える。部門名は企業独自に命名されるものであり、かつ、部門名の略称については、その企業の慣習に基づいて命名されることになるため、一般的な辞書に存在することはあり得ない。また、部門名の略称では、漢字とカタカナなどが混在していることも多い。
ここでは、ある企業における部門名およびその略称の例として、「生産技術センタ」の略称である「生技セ」と「第一営業本部」の略称である「1営本」を考える。どちらの略称も2種類以上の文字種が含まれている。そのため、これらの単語を登録せずに一般的な形態素解析エンジンで解析した場合、「生技/セ」、「1/営/本」というような形で分かち書きされることが多い。
そこで、「生技セ」と「1営本」という単語を辞書に登録することになる。基本的には、第1の実施形態の説明で行った手順にて行なうことになるのだが、ここでは、第2の実施形態における説明を行なうため、「部門」という概念を新設したと考える。
これらを元に、図29におけるステップS111を実行した場合を考える。ここでは、図29のステップS107の実行結果として、「企業」という概念の左文脈IDが「011」、右文脈IDが「011」、生起コストが「100」であったとして記載を進める。以下、図31を元に説明を進める。
あるタイミングにおいて、概念ID−1が「100」、概念ID−2が「110」という項目がヒットし、その役割が「上位」であった時、ステップS11107にて概念生起コストモデルの更新を行う。具体的には、「企業」という概念における生起コスト「100」に対してある一定の重み値を乗算した値をその概念の生起コストと位置付ける。なお、ある一定の重み値については、上位概念は「0.95」、部分概念は「0.9」など、役割毎にあらかじめ設定しておけばよい。ここでは、100×0.95=95を設定するものとする。
また、あるタイミングにおいて、概念ID−1が「140」、概念ID−2が「110」という項目がヒットし、その役割が「部分」であった時、ステップS11107にて概念生起コストモデルの更新を行う。ここでは、部分概念関係は「0.9」という重みに設定することとすれば、概念ID「140」の生起コストは100×0.9=90という値となる。
そこで、概念ID「140」と、「企業」という概念における左文脈ID「011」、右文脈ID「011」、算出した生起コスト「90」をセットにして、概念生起コストモデルに追加する。
102・・・情報分析サーバ、
103および104・・・情報分析クライアント、
105・・・ネットワーク、
110・・・メモリ、
120・・・記憶装置、
130・・・CPU(中央演算装置)、
140・・・出力装置、
150・・・入力装置、
160・・・通信インタフェース、
170・・・バス
Claims (10)
- 自然言語からなるテキストデータを分析する装置であって、
自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書と、単語と前記単語の意味を表現する概念とを対応付ける辞書とから成る辞書データを読み込む外部定義辞書取得手段と、
前記外部定義辞書取得手段によって取得した辞書データを元に、前記テキストデータの概念に内包される単語の生起コストの平均値又は最頻値を概念の生起コストとして推定する概念特性推定手段と、
ユーザが追加で作成した単語と前記単語の意味を表現する概念とを対応付ける辞書を読み込み、前記概念特性推定手段によって得られた概念の生起コストを当該概念に内包される単語と対応付けることにより、単語の生起コストを推定する単語特性推定手段と、
前記外部定義辞書取得手段によって得られる辞書データと前記単語特性推定手段によって得られる単語の生起コストとを含む分析辞書を構築する分析辞書構築手段と、
ユーザが入力した自然言語からなるテキスト情報を入力文として受け付ける文字情報受付手段と、
前記分析辞書構築手段により生成した分析辞書を用いて前記文字情報受付手段によって得られた入力文に内包される単語を同定して抽出する単語抽出手段と、
前記単語抽出手段によって得られた抽出結果をユーザの指示に基づき、選択して出力する分析結果出力手段と
を有することを特徴とする情報分析装置。 - 前記外部定義辞書取得手段が、外部定義辞書として、自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書および単語と前記単語の意味を表現する概念とを対応付ける辞書に加えて、前記概念間の関係性を定義した概念関係辞書を読み込む手段をさらに有し、前記概念特性推定手段が、概念の生起コストを、当該概念と関係のある概念の生起コストに所定の重み係数を乗算することによって生成する概念特性修正手段をさらに有することを特徴とする請求項1に記載の情報分析装置。
- 前記分析結果出力手段が出力した結果が未知語を含む場合、前記未知語を記憶装置に保持する改善候補保持手段と、
前記各辞書をメンテナンスするユーザの指示に従い、前記未知語を提示する改善候補データ提示手段とをさらに備えることを特徴とする請求項1または請求項2に記載の情報分析装置。 - 自然言語からなるテキストデータを計算機によって分析する方法であって、
前記計算機が、
自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書と、単語と前記単語の意味を表現する概念とを対応付ける辞書とから成る辞書データを読み込む第1のステップと、
前記第1のステップにおいて読み込んだ辞書データを元に、前記テキストデータの概念に内包される単語の生起コストの平均値又は最頻値を概念の生起コストとして推定する第2のステップと、
ユーザが追加で作成した単語と前記単語の意味を表現する概念とを対応付ける辞書を読み込み、前記第2のステップで得られた概念の生起コストを当該概念に内包される単語と対応付けることにより、単語の生起コストを推定する第3のステップと、
前記第1のステップにおいて読み込んだ辞書データと前記第2のステップにおいて得られた単語の生起コストとを含む分析辞書を構築する第3のステップと、
ユーザが入力した自然言語からなるテキスト情報を入力文として受け付ける第4のステップと、
前記第3のステップにおいて構築した分析辞書を用いて前記第4のステップにおいて受け付けた入力文に内包される単語を同定して抽出する第5のステップと、
前記第5のステップにおいて抽出した抽出結果をユーザの指示に基づき、選択して出力する第6のステップと
を備えることを特徴とする情報分析方法。 - 前記第1のステップが、外部定義辞書として、自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書および単語と前記単語の意味を表現する概念とを対応付ける辞書に加えて、前記概念間の関係性を定義した概念関係辞書を読み込むステップをさらに有し、前記第2のステップが、概念の生起コストを、当該概念と関係のある概念の生起コストに所定の重み係数を乗算することによって生成するステップをさらに有することを特徴とする請求項4に記載の情報分析方法。
- 前記第6のステップにおいて出力した結果が未知語を含む場合、前記未知語を記憶装置に保持するステップと、
前記各辞書をメンテナンスするユーザの指示に従い、前記未知語を提示するステップをさらに備えることを特徴とする請求項4または請求項5に記載の情報分析方法。 - 前記第1のステップにおいて、外部定義辞書として、自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書および単語と前記単語の意味を表現する概念とを対応付ける辞書に加えて前記概念間の関係性を定義した概念関係辞書を読み込み、記憶装置に格納するステップと、
概念の生起コストを、当該概念と関係のある概念の生起コストに所定の重み係数を乗算することによって生成するステップとをさらに含むことを特徴とする請求項5に記載の情報分析方法。 - 自然言語からなるテキストデータを計算機によって分析するためのプログラムであって、
前記計算機を、
自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書と、単語と前記単語の意味を表現する概念とを対応付ける辞書とから成る辞書データを読み込む外部定義辞書取得手段と、
前記外部定義辞書取得手段によって取得した辞書データを元に、前記テキストデータの概念に内包される単語の生起コストの平均値又は最頻値を概念の生起コストとして推定する概念特性推定手段と、
ユーザが追加で作成した単語と前記単語の意味を表現する概念とを対応付ける辞書を読み込み、前記概念特性推定手段によって得られた概念の生起コストを当該概念に内包される単語と対応付けることにより、単語の生起コストを推定する単語特性推定手段と、
前記外部定義辞書取得手段によって得られる辞書データと前記単語特性推定手段によって得られる単語の生起コストとを含む分析辞書を構築する分析辞書構築手段と、
ユーザが入力した自然言語からなるテキスト情報を入力文として受け付ける文字情報受付手段と、
前記分析辞書構築手段により構築した分析辞書を用いて前記文字情報受付手段によって得られた入力文に内包される単語を同定して抽出する単語抽出手段と、
前記単語抽出手段によって得られた抽出結果をユーザの指示に基づき、選択して出力する分析結果出力手段として機能させることを特徴とするプログラム。 - 前記外部定義辞書取得手段を、外部定義辞書として、自然言語に用いられる単語とその生起コストを対応付けて登録した単語辞書および単語と前記単語の意味を表現する概念とを対応付ける辞書に加えて、前記概念間の関係性を定義した概念関係辞書を読み込む手段として機能させ、さらに前記概念特性推定手段を、概念の生起コストを、当該概念と関係のある概念の生起コストに所定の重み係数を乗算することによって生成する概念特性修正手段として機能させることを特徴とする請求項8に記載のプログラム。
- 前記分析結果出力手段が出力した結果が未知語を含む場合、前記未知語を記憶装置に保持する改善候補保持手段として機能させ、
前記各辞書をメンテナンスするユーザの指示に従い、前記未知語を提示する改善候補データ提示手段として機能させることを特徴とする請求項8または請求項9に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012133729A JP5941345B2 (ja) | 2012-06-13 | 2012-06-13 | 文字情報の分析方法および情報分析装置並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012133729A JP5941345B2 (ja) | 2012-06-13 | 2012-06-13 | 文字情報の分析方法および情報分析装置並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013257756A JP2013257756A (ja) | 2013-12-26 |
JP5941345B2 true JP5941345B2 (ja) | 2016-06-29 |
Family
ID=49954137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012133729A Expired - Fee Related JP5941345B2 (ja) | 2012-06-13 | 2012-06-13 | 文字情報の分析方法および情報分析装置並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5941345B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740436B (zh) * | 2016-02-01 | 2019-12-27 | 北京京东尚科信息技术有限公司 | 基于互联网搜索技术的文字作品推送方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3347477B2 (ja) * | 1994-06-24 | 2002-11-20 | 沖電気工業株式会社 | 単語辞書登録装置及び文書認識装置 |
JP4059501B2 (ja) * | 2003-12-09 | 2008-03-12 | 株式会社リコー | 自然語辞書更新装置 |
-
2012
- 2012-06-13 JP JP2012133729A patent/JP5941345B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013257756A (ja) | 2013-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11080493B2 (en) | Translation review workflow systems and methods | |
TWI729472B (zh) | 特徵詞的確定方法、裝置和伺服器 | |
EP2570974B1 (en) | Automatic crowd sourcing for machine learning in information extraction | |
US8484238B2 (en) | Automatically generating regular expressions for relaxed matching of text patterns | |
US9864741B2 (en) | Automated collective term and phrase index | |
Chen et al. | Mining user requirements to facilitate mobile app quality upgrades with big data | |
JP2018097846A (ja) | Api学習 | |
US10877828B2 (en) | Automatic analysis of a set of systems used to implement a process | |
US20160062981A1 (en) | Methods and apparatus related to determining edit rules for rewriting phrases | |
JP6693582B2 (ja) | 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体 | |
US20160085389A1 (en) | Knowledge automation system thumbnail image generation | |
CN110347806B (zh) | 原创文本甄别方法、装置、设备与计算机可读存储介质 | |
WO2022125096A1 (en) | Method and system for resume data extraction | |
CN112015866A (zh) | 用于生成同义文本的方法、装置、电子设备及存储介质 | |
JP5941345B2 (ja) | 文字情報の分析方法および情報分析装置並びにプログラム | |
CN111026916A (zh) | 文本描述的转换方法、装置、电子设备及存储介质 | |
US10628632B2 (en) | Generating a structured document based on a machine readable document and artificial intelligence-generated annotations | |
CN113656579A (zh) | 文本分类方法、装置、设备及介质 | |
US20240012995A1 (en) | Computerized systems and methods for hierarchical structure parsing and building | |
JP5324500B2 (ja) | ファイル共有装置 | |
Zuo et al. | How to Get to Know Your Customers Better? A Case Analysis of Smartphone Users with Chinese Input Method Based on Baidu Index | |
JP2023155158A (ja) | スマート翻訳システム | |
CN117453205A (zh) | 系统架构创建方法、装置、设备及计算机可读存储介质 | |
CN116541071A (zh) | 一种基于提示学习的应用编程接口迁移方法 | |
JP2020170426A (ja) | 表組み構造推定システムおよび表組み構造推定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150202 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150413 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5941345 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |