JP2848430B2 - Information extraction method - Google Patents

Information extraction method

Info

Publication number
JP2848430B2
JP2848430B2 JP5217464A JP21746493A JP2848430B2 JP 2848430 B2 JP2848430 B2 JP 2848430B2 JP 5217464 A JP5217464 A JP 5217464A JP 21746493 A JP21746493 A JP 21746493A JP 2848430 B2 JP2848430 B2 JP 2848430B2
Authority
JP
Japan
Prior art keywords
pattern
predetermined
fixed pattern
information
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5217464A
Other languages
Japanese (ja)
Other versions
JPH0773188A (en
Inventor
克尚 柴田
智子 平野
章子 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP5217464A priority Critical patent/JP2848430B2/en
Publication of JPH0773188A publication Critical patent/JPH0773188A/en
Application granted granted Critical
Publication of JP2848430B2 publication Critical patent/JP2848430B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、先ず抽出すべき情報の
分類を判断することにより、パタ−ンマッチングを迅速
に行って、文から必要な情報を抽出することが可能な情
報抽出方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information extraction method capable of quickly performing pattern matching by first determining the classification of information to be extracted and extracting necessary information from a sentence. .

【0002】[0002]

【従来の技術】従来、順序や書き方の異なった文献リス
ト等を抽出する方法としては、例えば特開平5−203
61号公報に記載された意味抽出方法がある。この方法
では、先ず記載形式の異なる入力レコ−ドを形態素解析
処理(単語分割と品詞付け)により単語に分割した後、
予め用意された区切り記号テーブルを用いて、区間分割
処理により分割された単語をさらに区間に分割し、次の
意味解析処理において分割された各区間に対して複数の
意順解析ルーチンを所定の順序で実行することにより、
区間内にある語句が何を表わしているかを求めて、語句
を抽出していく。また、別の方法としては、例えば、
『yacc/lexプログラムジェネレータon UN
IX』五月女健治著、哲学出版に記載されている方法が
ある。この方法では、UNIXシステムラボラトリーズ
が開発したUNIXコマンドのyacc(構文解析プロ
グラムのC言語ジェネレータ)およびlex(字句解析
プログラムのC言語ジェネレータ)を用いて、文章から
語句(単語および単語の集り)を抽出する仕組みを構築
する。すなわち、yaccおよびlexの構文規則に従
って、語句抽出プログラムを作成した後、そのプログラ
ムをyaccおよびlexに入力することにより、C言
語の語句抽出プログラムを生成する仕組みである。
2. Description of the Related Art Conventionally, as a method of extracting a list of documents having different orders and writing styles, for example, Japanese Patent Application Laid-Open
There is a meaning extraction method described in JP-A-61-61. In this method, first, input records having different description formats are divided into words by morphological analysis processing (word division and part of speech),
The words divided by the section dividing process are further divided into sections using a delimiter table prepared in advance, and a plurality of order analysis routines are executed in a predetermined order for each section divided in the next semantic analysis processing. By running in
Words are extracted by finding what the words in the section represent. Also, as another method, for example,
"Yacc / lex Program Generator on UN
IX], written by Kenji Satsuki, philosophy publishing. In this method, a word (a group of words and a group of words) is extracted from a sentence using the UNIX commands “yacc” (a C language generator of a lexical analysis program) and “lex” (a C language generator of a lexical analysis program) developed by UNIX System Laboratories. Build a mechanism to do it. That is, according to the mechanism of generating a word / phrase extraction program in accordance with the syntax rules of yacc and lex, and then inputting the program to yacc and lex, a word / phrase extraction program in C language is generated.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、前述の
各方法には、以下に述べるような問題点が存在する。先
ず、特開平5−20361号公報に記載の方法では、文
中の区切り記号(例えば、コンマ、コロン等)により語
句の抽出を可能にしているので、文中にもし区切り記号
がない文のときには、必要な語句を抽出することは不可
能となる。また、語句を意味解析するための特徴、例え
ば全体における位置や字数の長さや元号等を、予め詳細
に定義しておく必要がある。次に、yaccおよびle
xを用いた方法では、UNIXコマンドの構文規則が極
めて複雑であるため、これに熟知した者でなければプロ
グラムを作成することができないという問題がある。ま
た、プログラムを作成できたとしても、yaccおよび
lexは簡易的なプログラムジェネレータであるため、
使用するために種々の制限が存在し、普通の者では、実
用的な語句抽出プログラムを作成することはできないと
いう問題もある。本発明の目的は、これら従来の課題を
解決し、文中に区切り記号がなくても、またプログラム
に熟知していない者でも、文から必要な情報を抽出する
ことができ、かつ実用的な情報の抽出が可能な情報抽出
方法を提供することにある。
However, each of the above methods has the following problems. First, in the method described in JP-A-5-20361, words can be extracted by using a delimiter (for example, a comma or a colon) in a sentence. It becomes impossible to extract a simple phrase. In addition, it is necessary to previously define in detail features for semantic analysis of words, such as the position in the whole, the length of the number of characters, and the era. Next, yacc and le
In the method using x, since the syntax rules of the UNIX command are extremely complicated, there is a problem that only a person who is familiar with the command can create a program. Even if a program can be created, since yacc and lex are simple program generators,
There is also a problem that there are various restrictions on the use, and that a normal person cannot create a practical word / phrase extraction program. SUMMARY OF THE INVENTION An object of the present invention is to solve these conventional problems and to extract necessary information from a sentence even if there is no delimiter in the sentence or even a person who is not familiar with the program, and can obtain practical information. It is an object of the present invention to provide an information extraction method capable of extracting information.

【0004】[0004]

【課題を解決するための手段】上記目的を達成するた
め、本発明の情報抽出方法は、複数の所定語句を任意の
位置に並べた入力文から、各所定語句間にある語句を
出する場合に、まず、所定語句のうち入力文の分類種別
の特定に用いられる複数の所定語句の記憶と、この分類
種別毎の、複数の所定語句の並びおよび各所定語句間の
一以上の語句の区切りを特定するのに用いる情報からな
る複数の定形パターンの記憶を予め行ない、入力文か
ら、予め記憶した分類種別特定用の所定語句に一致もし
くは最もマッチングする語句を抽出して入力文の分類種
別を特定し、この特定した分類種別の記憶済みの定形パ
ターンから、入力文の各所定語句の並びに一致もしくは
最もマッチングする定形パターンを選択し、この選択し
た定形パターンで示される各所定語句の並びと情報に従
って、入力文の各所定語句間にある各語句を区切って抽
出することを特徴とする。尚、記憶済の定形パターン
ら、入力の各所定語句の並びに最もマッチングする
形パターンを選択する際、複数の定形パターンの候補が
ある場合、各定形パターン毎に、順次、各定形パターン
の各所定語句が他の定形パターン存在するか否かを判
断して、存在しない数をカウントし、このカウント数が
最も大きい定形パターンを最もマッチングする定形パタ
ーンとして選択する。
In order to achieve the above object, an information extraction method according to the present invention is provided .
When extracting words between each predetermined phrase from the input sentences arranged in the position , first, the classification type of the input sentence among the predetermined words
Storage of multiple phrases used to identify
Arrangement of a plurality of predetermined phrases for each type and between each predetermined phrase
From information used to identify one or more words
Before storing multiple fixed patterns in
If there is a match with a predetermined phrase for classifying classification stored in advance,
Or the best matching words and phrases
Identify another, and store the stored fixed-format
From the turn, the sequence of each predetermined phrase in the input sentence
Select the best matching fixed pattern, and follow the sequence and information of each predetermined phrase indicated by the selected fixed pattern.
And extract each word between each predetermined word in the input sentence.
It is characterized by putting out. Is it a stored fixed pattern ?
Et al., When selecting a constant <br/> shaped pattern that best matches the sequence of the predetermined phrase input sentence candidates of a plurality of fixed pattern
If there is, for each fixed pattern, sequentially, each fixed pattern
Each predetermined phrase to determine whether or not another of the fixed pattern of, and counts the number that does not exist, you select a fixed pattern that best matches the largest fixed pattern is the number of counts.

【0005】[0005]

【作用】本発明においては、例えば、戸籍簿の入力から
必要な情報(身分事項)を抽出するときには、そこに書
き込まれている文が全て複数の身分事項と特徴デ−タの
集合から構成されているので、先ず、入力された戸籍デ
−タがどの事件種別(出生、婚姻、死亡等の種別)に属
するかを判断し、特定された事件種別の記載パターンの
特徴デ−タと入力された戸籍デ−タの特徴デ−タとを順
次マッチングしていき、一致した特徴デ−タが最も多い
記載パターンをその戸籍デ−タの記載パターンであると
みなす。そして、その記載パターンを参照しながら入力
戸籍デ−タを展開し、必要な情報を抽出する。このよう
に、本発明では、予め定形パターン毎に抽出すべき情報
がその定形パターンのどの部分に存在するかを記憶して
おき、その定形パターンに基づいて作成された文から必
要な情報を抽出する場合に、先ずその文がどの定形パタ
ーンに属するかを、定形パターン毎に存在するいくつか
の特徴デ−タが当該文にどれだけ多く存在するか否かに
より判断する。これにより決定した定形パターンとマッ
チングをとることにより、当該文から情報を抽出するの
で、必要な情報が正確に抽出できる。また、定形パター
ンは特定の特徴デ−タに基づいて分類されているので、
情報を抽出すべき文がどの分類に属するかを判断した後
に、該当する分類中の定形パターンとのマッチング処理
を行うのみでよい。その結果、全ての定形パターンとの
マッチング処理を行う必要がなく、迅速に情報を抽出す
ることが可能である。
According to the present invention, for example, when extracting necessary information (identification items) from the input of a family register, all sentences written therein are composed of a plurality of identification items and a set of characteristic data. First, it is determined which case type (type of birth, marriage, death, etc.) the input family register data belongs to, and the data is input as the characteristic data of the description pattern of the specified case type. The feature data of the family register data is sequentially matched, and the description pattern having the most matching feature data is regarded as the description pattern of the family register data. Then, the input family register data is developed while referring to the description pattern, and necessary information is extracted. As described above, in the present invention, information to be extracted for each fixed pattern is stored in advance in which part of the fixed pattern, and necessary information is extracted from a sentence created based on the fixed pattern. In such a case, first, it is determined to which fixed pattern the sentence belongs, based on how many feature data present for each fixed pattern exist in the sentence. Since information is extracted from the sentence by matching with the determined fixed pattern, necessary information can be accurately extracted. In addition, since fixed patterns are classified based on specific feature data,
After determining which classification the sentence from which information should be extracted belongs to, it is only necessary to perform a matching process with a fixed pattern in the corresponding classification. As a result, it is not necessary to perform the matching process with all the fixed patterns, and the information can be quickly extracted.

【0006】[0006]

【実施例】以下、本発明の実施例を、図面により詳細に
説明する。ここでは、戸籍原簿からの情報抽出に適用し
た場合を例にとって説明する。図3は、本実施例の対象
となる戸籍簿の一例を示す図であり、図4は、身分事項
事件種別コ−ドを示す図である。図3に示すように、戸
籍簿に書かれた文章は一般にいくつかの事件が記載され
ており、それらの1つ1つはいずれも日付の次に本人や
本人に関係する人の事件が記載されている。それらの事
件とは、例えば図4に示すように、『出生』,『婚
姻』,『死亡』等を表わす文のことである。なお、図3
には、『出生』と『婚姻』のみが記載されている。この
ように、戸籍簿の文はある程度フォーマットが定まって
おり、以下に示すようにその文は複数の事件文から構成
されている。 戸籍文=『事件文』『事件文』『事件文』・・・・『事
件文』 さらに、各事件文は、以下に示すように、複数の身分事
項と特徴デ−タの集合、あるいは身分事項の集合で構成
されている。 事件文=『身分事項』『特徴デ−タ』『身分事項』『特
徴デ−タ』・・・ ここで、身分事項とは、日付や場所等の身分に関する事
項であり、特徴デ−タとは、記載パターンを特定するた
めのデ−タ、つまり出生や婚姻や死亡等の特徴的な事件
デ−タのことである。
Embodiments of the present invention will be described below in detail with reference to the drawings. Here, a case where the present invention is applied to information extraction from a family register is described as an example. FIG. 3 is a diagram showing an example of a family register to be processed in the present embodiment, and FIG. 4 is a diagram showing an identification matter case type code. As shown in Fig. 3, the sentences written on the family register generally describe several cases, and each of them describes the case of the person or a person related to the person after the date. Have been. These cases are, for example, sentences indicating “birth”, “marriage”, “death”, etc., as shown in FIG. Note that FIG.
Contains only "birth" and "marriage". In this way, the sentence of the family register has a certain format, and as shown below, the sentence is composed of a plurality of case sentences. Family register sentence = "incident sentence""incidentsentence""incidentsentence" ... "incident sentence" Furthermore, each incident sentence is, as shown below, a set of a plurality of identity matters and characteristic data, or an identity. It consists of a set of items. Incident text = "identification matter""characteristicdata""identificationmatter""characteristicdata" ... Here, the identification matter is a matter related to the identity such as date and place. Is data for specifying a description pattern, that is, characteristic case data such as birth, marriage, and death.

【0007】ところで、事件文は、以下のように4つの
パターンに分類される。ここで、NLとはニューライン
の略で、改行を示している。 パターン1=『身分事項』『身分事項』 パターン2=『身分事項』『NL』 パターン3=『身分事項』『特徴デ−タ』 パターン4=『特徴デ−タ』 例えば、『平成5年3月5日東京都千代田区で出生同月
6日父届出入籍』と言う文章の記載パターンデ−タは、
『(出生日)(出生地)で出生(届出日)(届出人)届
出入籍』であり、これを上記4つのパターンに当てはめ
ると、次のようになる。 事件文=『(身分事項)(身分事項)(特徴デ−タ)
(身分事項)(身分事項)(特徴デ−タ)』
By the way, incident sentences are classified into four patterns as follows. Here, NL is an abbreviation of new line, and indicates a line feed. Pattern 1 = "identification matter""identificationmatter" Pattern 2 = "identification matter""NL" Pattern 3 = "identification matter""characteristicdata" Pattern 4 = "characteristic data" For example, "1993 The birth date in Chiyoda-ku, Tokyo on the 5th of March, and the birth on the 6th of the same month, the father was registered, and the pattern data is as follows:
"(Birth date) (birthplace) and birth (notification date) (notifier) notification registration and enrollment" is applied to the above four patterns and becomes as follows. Incident text = “(identification item) (identification item) (characteristic data)
(Identity matters) (Identity matters) (Feature data)

【0008】図1および図2は、本発明の一実施例を示
す情報抽出方法の動作フローチャ−トであり、特に戸籍
簿の入力から必要な情報(身分事項)を抽出する処理を
示す。また、図5は、内部テーブルの展開図であり、図
6は、記載パターン定義ファイルのデ−タ構成図であ
る。先ず、図1に示すように、記載パターン定義ファイ
ルから記載パターンデ−タを読み込んで登録した後、記
載項目事件種別から事件種別を特定するための特徴デ−
タを作成して、テーブルに展開する。ここで、特徴デ−
タとは、例えば『出生』,『婚姻』等の言葉であって、
以後はキーワードと呼ぶ。また、登録された記載パター
ンデ−タから、記載パターンを特定するための特徴デ−
タを抽出し、テーブルに展開する(ステップ400)。
展開された内部テーブルの概念は、図5に示す通りであ
る。図5では、『出生』,『婚姻届出、婚姻取消により
婚姻と婚姻国籍取得』,『離婚』,『国籍取得 帰化
国籍選択 国籍喪失 夫国籍妻国籍』に分けられてい
る。また、記載パターン定義ファイルに格納する記載パ
ターンデ−タの構成は、図6に示すように、出生、婚姻
等の事件毎に複数のパターンに分かれており、身分事項
を展開するための記載パターンデ−タを全て格納してお
く。図6のパターンには、次の3つのパターンが示され
ている。 出生1=(出生日)(出生地)で出生(届出日)(届出
人)届出入籍、 出生2=(出生日)(出生地)で出生(届出日)(届出
人)届出(送付を受けた日)(受理者)入籍、 出生3=(出生日)(出生地)で出生(届出日)(届出
人)(特記事項)届出入籍
FIGS. 1 and 2 are operation flowcharts of an information extracting method according to an embodiment of the present invention, and particularly show a process of extracting necessary information (identification items) from an input of a family register. FIG. 5 is a development view of the internal table, and FIG. 6 is a data configuration diagram of the description pattern definition file. First, as shown in FIG. 1, after reading and registering the description pattern data from the description pattern definition file, the feature data for specifying the incident type from the entry item incident type is described.
Create data and deploy it to a table. Here, the feature data
Ta is a word such as "birth" or "marriage",
Hereinafter, it is called a keyword. Also, feature data for specifying a description pattern from registered description pattern data.
Data is extracted and developed in a table (step 400).
The concept of the expanded internal table is as shown in FIG. In Figure 5, "Birth", "Marriage registration, marriage and marriage acquisition by marriage cancellation", "Divorce", "Nationality acquisition naturalization"
Nationality selection Loss of nationality Husband nationality Wife nationality]. As shown in FIG. 6, the structure of the description pattern data stored in the description pattern definition file is divided into a plurality of patterns for each case such as birth, marriage, etc. All data is stored. The following three patterns are shown in the pattern of FIG. Birth 1 = (Birth Date) (Birthplace) Birth (Notification Date) (Notified Person) Reported Enrollment, Birth 2 = (Birth Date) (Birthplace) Birth (Notified Date) (Notified Person) Reported (Received Birth 3 = (birth date) (place of birth), birth (notification date) (notified person) (special notes)

【0009】図1のフロ−では、次に、戸籍デ−タを入
力する(ステップ401)。なお、既に複数の戸籍デ−
タが入力されている場合には、次に処理の対象となる戸
籍デ−タを取り出す。全ての戸籍デ−タが入力され、処
理されたか否かを判断し、全てが入力されるまで処理を
続行する(ステップ402)。戸籍デ−タが入力される
と、次に、記載パターンデ−タ定義ファイルに格納され
た記載パターンデ−タと、戸籍デ−タファイルより入力
された戸籍データとのマッチング処理を行う。マッチン
グ処理に先行して、先ず記載項目事件種別の特定を行う
(ステップ403)。この戸籍デ−タファイルには、戸
籍簿上の身分事項欄のデ−タが1文につき1レコ−ドに
なって格納されている。しかし、登録されている全記載
パターンデ−タの数は膨大であるため、全てのパターン
とのマッチング処理を行うと時間がかかり過ぎる。そこ
で、登録された全記載パタ−ンデ−タとのマッチングを
避けるために、マッチング処理の前に先ず事件種別の特
定を行うのである。特定処理としては、予め記載項目事
件種別を特定するためのキーワード、および以下に述べ
る記載パターン特定処理により、事件種別を特定する。
この時、一意に決まらない場合には(4030)、それ
ぞれの事件種別に対して記載パターンの特徴デ−タとマ
ッチングを行う(4031)。この場合、対象となる文
の事件種別と異なる事件種別の記載パターンの特徴デ−
タとマッチングする必要はないので、記載パターンを一
意に決定することができる。
In the flow of FIG. 1, next, family register data is input (step 401). Note that multiple family register data
If the data has been input, the family register data to be processed next is extracted. It is determined whether all family register data has been input and processed, and the process is continued until all family register data has been input (step 402). When the family register data is input, next, matching processing is performed between the description pattern data stored in the description pattern data definition file and the family register data input from the family register data file. Prior to the matching process, the description item case type is first specified (step 403). In this family register data file, the data in the identity column on the family register is stored as one record per sentence. However, since the number of all the described pattern data registered is enormous, it takes too much time to perform the matching process with all the patterns. Therefore, in order to avoid matching with all the registered pattern data, the case type is first specified before the matching process. As the specifying process, the case type is specified in advance by a keyword for specifying the described item case type and the description pattern specifying process described below.
At this time, if it is not determined uniquely (4030), matching is performed with the feature data of the written pattern for each case type (4031). In this case, the characteristic data of the description pattern of the case type different from the case type of the target sentence
Since there is no need to match the data, the description pattern can be uniquely determined.

【0010】このようにして、記載項目事件種別が決定
したならば(ステップ4030)、次は記載パターンを
特定する。記載パターンの特定は、対象となる事件種別
の全記載パターンに対して、内部テーブル展開順に入力
データと特徴データ(記載パターン特定用デ−タ)とを
マッチングすることにより行う(ステップ404)。こ
の場合、一意にパタ−ンとマッチングすることが決定さ
れたときには(ステップ405)、マッチングを終了す
るが(ステップ408)、一意に決定されないときに
は、後述するように、図のフロ−により記載パターン
特定処理を用いて1つのパターンに特定する(ステップ
4050)。この処理を用いても1つに特定できない場
合には(406)、後述するように、身分事項展開時に
特定する(ステップ407)。なお、記載パターンに一
致するものがないときには、エラ−となる。図7は、図
1における記載パターン特定処理を示すフローチャート
である。図1における記載パターン特定処理(ステップ
4050)では、先ず対象となった全記載パターンにつ
いて、特徴デ−タが他の対象となった記載パターンの特
徴デ−タに存在するか否かを順次チェックする。そし
て、存在しない数を記載パターン毎にカウントして(ス
テップ209)、最もカウント数が大である記載パター
ンを身分事項の展開対象とする。すなわち、この場合に
は、文の特徴データと複数の定形パターンとのマッチン
グをとった結果、最も多くの特徴データが一致する定形
パタ−ンが特定できないとき、つまり最も多くの特徴デ
−タが一致する定形パタ−ンが複数個存在するときであ
る。このようなときには、最後に残った複数個の定形パ
ターン相互間で、1定形パターン毎に、順次特徴デ−タ
が他の定形パターンの特徴デ−タに存在するか否かを判
断し、存在しない数を定形パターン毎にカウントして、
最もカウント値の大きい定形パターンをその文の定形パ
ターンとみなすのである。この処理の原理は、文中の用
語が、予め準備されていた定形パターンの特徴デ−タに
ない用語であるとき、つまりヌル文字と判断されるとき
に、1つの定形パターンに特定できなくなることが多い
ので、ヌル文字と判断されるような、複数の定形パター
ンの特徴デ−タには存在しない特徴デ−タを最も多く有
する定形パターンを探索することが最良の方法と考えら
れるからである。
When the description item case type is determined in this way (step 4030), the description pattern is specified next. The description pattern is specified by matching the input data and the characteristic data (data for specifying the description pattern) with respect to all the description patterns of the target case type in the order of development of the internal table (step 404). In this case, uniquely pattern - when it is determined that emissions matching (step 405), but ends the matching (step 408), when not uniquely determined, as described below, flow of FIG. 7 - described by One pattern is specified using the pattern specification processing (step 4050). If it is not possible to specify one even by using this processing (406), as will be described later, it is specified at the time of developing the identity item (step 407). If there is no pattern that matches the description pattern, an error occurs. FIG. 7 is a flowchart showing the written pattern specifying process in FIG. In the description pattern specifying process (step 4050) in FIG. 1, first, it is sequentially checked whether or not the feature data of all the target description patterns exists in the feature data of the other target description patterns. I do. Then, the number that does not exist is counted for each written pattern (step 209), and the written pattern with the largest count is set as an expansion target of the identity item. That is, in this case, as a result of matching the sentence feature data with a plurality of fixed patterns, when a fixed pattern with which the most feature data matches cannot be specified, that is, the most feature data is determined. This is when there are a plurality of matching fixed patterns. In such a case, it is determined whether or not the feature data of the last remaining fixed patterns is present for each fixed pattern in the feature data of another fixed pattern. Count the number not to do for each fixed pattern,
The fixed pattern with the largest count value is regarded as the fixed pattern of the sentence. The principle of this processing is that when a term in a sentence is a term that does not exist in the feature data of a prepared standard pattern, that is, when it is determined that it is a null character, it cannot be specified as one standard pattern. This is because it is considered that the best method is to search for a fixed pattern that has the most feature data that does not exist in the feature data of a plurality of fixed patterns, such as a null character.

【0011】例えば、以下の3つの記載パターンが対象
となった場合の処理について説明する。 記載パターン1・・『で出生』,『届出』,『から送付
入籍』 記載パターン2・・『で出生』,『国籍保留とともに届
出』,『から送付入籍』 記載パターン3・・『で出
生』,『届出』 先ず、記載パターン1の特徴デ−タ(『で出生』,『届
出』,『から送付入籍』)が他の記載パターン(2およ
び3)の特徴デ−タに存在しない数を求める。 『で出生』は、記載パターン2,3ともに存在するの
で、カウントアップは行わない。 『届出』は、記載パターン2,3ともに存在するの
で、カウントアップは行わない。 『から送付入籍』は、記載パターン2には存在する
が、記載パターン3には存在しないので、1カウントア
ップする。 以上の結果から、記載パターン1のカウント数は
『1』である。次に、記載パターン2の特徴デ−タ
(『で出生』,『国籍保留とともに届出』,『から送付
入籍』)が、他の記載パターン(1および3)の特徴デ
−タに存在しない数を求める。 『で出生』は、記載パターン1,3ともに存在するの
で、カウントアップは行わない。 『国籍保留とともに届出』は、記載パターン1,3と
もに存在しないので、2カウントアップする。 『から送付入籍』は、記載パターン1には存在する
が、記載パターン3には存在しないので、1カウントア
ップする。 以上の結果から、記載パターン2のカウント数は
『3』である。最後に、記載パタ−ン3の特徴デ−タ
(『で出生』,『届出』)が、他の記載パターン(1お
よび2)の特徴デ−タに存在しない数を求める。 『で出生』は、記載パターン1,2ともに存在するの
で、カウントアップは行わない。 『届出』は、記載パターン1,2ともに存在するの
で、カウントアップは行わない。 以上の結果から、記載パターン3のカウント数は『0』
である。
For example, a process when the following three described patterns are targeted will be described. Described pattern 1 “Birth at”, “Notification”, “Registered to send” Described pattern 2 “Birth at”, “Notification with nationality hold”, “Registered to send at” Described pattern 3 ... “Birth at” , "Notification" First, the number of the feature data of the described pattern 1 ("Birth at,""Notification","Registeredfrom") that does not exist in the feature data of the other described patterns (2 and 3) is determined. Ask. "Birth at birth" is not counted up because both of the description patterns 2 and 3 exist. Since “notification” exists in both the description patterns 2 and 3, the count is not performed. Although “from sending enrollment” exists in the description pattern 2 but does not exist in the description pattern 3, it is counted up by one. From the above results, the count number of the written pattern 1 is “1”. Next, the number of the characteristic data of the description pattern 2 (“Birth at birth”, “Notification with nationality pending”, and “Registration sent from”) that do not exist in the characteristic data of the other description patterns (1 and 3) Ask for. "Birth at birth" is not counted up since both of the description patterns 1 and 3 exist. "Notification with nationality hold" is counted up by 2 since neither of the description patterns 1 and 3 exists. Although "from sending enrollment" exists in the description pattern 1 but does not exist in the description pattern 3, it is counted up by one. From the above results, the count number of the described pattern 2 is “3”. Finally, the number of the feature data of the description pattern 3 ("Birth at", "Notification") that does not exist in the feature data of the other description patterns (1 and 2) is determined. "Birth at birth" does not count up because both description patterns 1 and 2 exist. Since “notification” exists in both the description patterns 1 and 2, the count-up is not performed. From the above results, the count number of the described pattern 3 is “0”.
It is.

【0012】チェックの結果、記載パターン2のカウン
ト数が最も大であったので、記載パターン2を身分事項
の展開対象とする。つまり、他の記載パターンの特徴デ
ータに存在しない特徴データを多く持つ記載パターンを
身分事項の展開対象とする処理方法である。図7では、
上述した記載パターン特定処理のフロ−が示されてい
る。比較すべき対象パターン(1,2,3)がなくなる
まで(ステップ201)、カウンタと不一致エリアの初
期化を行い(ステップ202)、かつその対象パターン
の特徴デ−タがなくなるまで(ステップ203)、マッ
チングのための初期設定を行う(ステップ204)。比
較のための対象パタ−ンとのマッチングが終了すれば、
次の対象パターンに移る(ステップ205,203)。
対象パターンが同一であれば、カウントせずに次の対象
パターンに移る(ステップ206,205)。対象パタ
−ンが同じでなければ、マッチングのための初期設定を
行い(ステップ206,207)、マッチングをとった
結果がヌル文字(無意味な文字)であれば、カウントア
ップを行う(ステップ208,209)。また、特徴デ
−タが存在すれば、対象パタ−ンの同一チェックを行っ
て、マッチング処理に移る(ステップ210,205,
206,207)。そして、対象パタ−ン中の比較すべ
き特徴デ−タが終了すると(ステップ203)、不一致
数エリアの値とカウンタの値を比較して(ステップ21
2)、不一致エリアが大のときには次の対象パターンと
の比較に移り、カウンタの値が大のときにはそのカウン
タ値を不一致エリアに書き込み、記載パターン番号を格
納した後(ステップ213)、次の対象パターンとの比
較に移る。比較すべき対象パターンがなくなれば(ステ
ップ201)、処理を終了する。
As a result of the check, since the count number of the description pattern 2 is the largest, the description pattern 2 is set as the subject of development of the identity item. In other words, this is a processing method in which a description pattern having a large amount of feature data that does not exist in the feature data of another description pattern is set as an expansion target of the identity item. In FIG.
The flow of the above described description pattern specifying process is shown. Until there are no more target patterns (1, 2, 3) to be compared (Step 201), the counter and the non-coincidence area are initialized (Step 202), and until there is no more characteristic data of the target pattern (Step 203). Initial setting for matching is performed (step 204). When the matching with the target pattern for comparison is completed,
The process moves to the next target pattern (steps 205 and 203).
If the target patterns are the same, the process proceeds to the next target pattern without counting (steps 206 and 205). If the target patterns are not the same, initialization is performed for matching (steps 206 and 207), and if the result of the matching is a null character (meaningless character), a count is performed (step 208). , 209). If the feature data exists, the same pattern is checked for the target pattern, and the process proceeds to the matching process (steps 210, 205,
206, 207). When the feature data to be compared in the target pattern is completed (step 203), the value of the mismatch number area is compared with the value of the counter (step 21).
2) When the mismatch area is large, the process proceeds to the comparison with the next target pattern. When the counter value is large, the counter value is written in the mismatch area and the written pattern number is stored (step 213). Move on to comparison with the pattern. When there are no more target patterns to be compared (step 201), the process ends.

【0013】図1、図2に戻り、図7のような記載パタ
ーン特定処理を行った後(ステップ4050)、一意に
決定され(ステップ406)、マッチングが終了すると
(ステップ408)、特定された記載パターンデ−タを
用いて身分事項の展開を行う(ステップ409)。以
下、身分事項の展開例を説明する。 〔身分事項展開例〕 入力デ−タ:『平成5年3月1日東京都千代田区で出生
同月2日父届出同月3日同区長から送付入籍』 記載パターン:(出生日)(出生地)で出生(届出日)
(届出人)届出(送付を受けた日)(受理者)から送付
入籍 記載パターンデ−タとマッチングを行い、身分事項を
展開する。 (ア)記載パターンデ−タの先頭の情報が『出生日』
で、次の情報が身分事項であることを判定する。この場
合、『出生日』が『日付』であるため『日』で区切り、
『平成5年3月1日』を抽出する。 (イ)次の情報が『出生地』で、その次がセパレータで
あることを判定する。従って、特徴デ−タ『で出生』で
区切り、『東京都千代田区』を抽出する。 (ウ)次の情報が『届出日』で、その次が身分事項であ
ることを判定する。従って、『届出日』が『日付』であ
るため『日』で区切り、『同月2日』を抽出する。 (エ)次の情報が『届出人』で、その次がセパレータで
ある。従って、特徴データ『届出』で区切り、『父』を
抽出する。 (オ)次の情報が『送付を受けた日』で、その次が身分
事項である。従って、『送付を受けた日』が『日付』で
あるため『日』で区切り、『同月3日』を抽出する。 (カ)次の情報が『受理者』で、その次がセパレータで
ある。従って、特徴デ−タ『から送付入籍』で区切り、
『同区長』を抽出する。 (キ)次の情報はNL(ニューライン)である。従っ
て、入力デ−タの身分事項の展開はこれで終了する。
Returning to FIGS. 1 and 2, after performing a description pattern specifying process as shown in FIG. 7 (step 4050), it is uniquely determined (step 406), and when the matching is completed (step 408), it is specified. The identification information is developed using the written pattern data (step 409). Hereinafter, an example of development of the identity item will be described. [Example of identification item development] Input data: "Birth day in Chiyoda-ku, Tokyo March 1, 1993 Notification of father on the same month 2 Sending enrollment from the mayor of the same month on the same month 3" Description pattern: (birth date) (place of birth) Birth at (date of notification)
(Notifier) Notification (date of receipt) From (recipient) Matching with the pattern data described in the enrollment registration, and develop the identification information. (A) The head information of the described pattern data is "birth date"
Then, it is determined that the next information is an identity item. In this case, since "birth date" is "date", it is separated by "day".
"March 1, 1993" is extracted. (A) It is determined that the next information is "place of birth" and the next is a separator. Accordingly, the feature data is separated by "departure" and "Chiyoda-ku, Tokyo" is extracted. (C) It is determined that the next information is the “notification date” and that the next is an identity matter. Therefore, since the “report date” is “date”, it is separated by “day” and “same month 2” is extracted. (D) The next information is the "reporter" and the next is the separator. Therefore, "father" is extracted by separating with the feature data "notification". (E) The next information is the "date of receipt", followed by the identity. Therefore, since the “date of receiving the transmission” is the “date”, it is separated by the “day” and “the same month 3” is extracted. (F) The next information is the "acceptor" and the next is the separator. Therefore, it is separated by the feature data
"Same ward mayor" is extracted. (G) The next information is NL (new line). Therefore, the development of the status of the input data is completed.

【0014】図1、図2に戻って、身分事項の展開(ス
テップ409)に続く処理について述べる。NLまで
展開したならば(ステップ410)、身分事項デ−タを
ワークエリアにセットする(ステップ411)。 ワークエリアにセットされた身分事項デ−タと、記載
パターンデ−タを用いて文章を復元し、入力データとの
整合性をチェックする(ステップ412)。不整合が生
じなければ(ステップ413)、ワークエリアの身分事
項デ−タをセーブエリアにセットする(ステップ41
4)。一方、不整合があった場合には、例外記載パター
ンとなり(ステップ415)、印刷して出力される(ス
テップ4150)。 セーブエリアにセットされている身分事項データのう
ち、省略されているものを、決められたル−ルに従って
追加することにより、身分事項データを復元する(ステ
ップ416)。例えば、『同月』を『3月』にする等が
これに該当する。以上の手順により、身分事項の展開が
終了したならば(ステップ417)、セーブエリアに展
開された身分事項の内容と別ファイル(戸籍簿上の身分
事項以外の情報を格納してあるファイル)の内容との整
合性をチェックする(ステップ418)。チェック項目
としては、例えば、父親等の名前、日付の前後関係、元
号に対する年号(西歴との対応)等である。最後に、抽
出されてセーブエリアに展開された身分事項情報を、身
分事項ファイルに格納する(ステップ419)。なお、
身分事項への格納は、整合性チェックの結果に関係なく
行われる。また、身分事項デ−タの復元(ステップ41
6)あるいは整合性のチェック(ステップ412)等の
処理は、戸籍デ−タに特有の処理であるため、入力デ−
タが戸籍デ−タ以外の場合には省略することができる。
Returning to FIGS. 1 and 2, the processing subsequent to the development of the identity item (step 409) will be described. When the data has been expanded to NL (step 410), the identification data is set in the work area (step 411). The sentence is restored using the identification item data set in the work area and the written pattern data, and the consistency with the input data is checked (step 412). If no inconsistency occurs (step 413), the identification data of the work area is set in the save area (step 41).
4). On the other hand, if there is an inconsistency, the pattern becomes an exceptional description pattern (step 415), which is printed and output (step 4150). Of the identification item data set in the save area, omitted ones are added according to a predetermined rule to restore the identification item data (step 416). For example, “Same month” is changed to “March”, which corresponds to this. When the development of the identification information is completed by the above procedure (step 417), the contents of the identification information developed in the save area and a separate file (a file storing information other than the identification information on the family register) are stored. The consistency with the contents is checked (step 418). The check items include, for example, the name of the father or the like, the context of the date, the year of the era (correspondence with Seishi), and the like. Finally, the extracted identification information expanded in the save area is stored in the identification information file (step 419). In addition,
The storage in the identity item is performed regardless of the result of the consistency check. Also, the identification data is restored (step 41).
6) Or the process of checking consistency (step 412) is a process unique to family register data.
If the data is other than family register data, it can be omitted.

【0015】[0015]

【発明の効果】以上説明したように、本発明によれば、
(a)予め定められた定形パターンに基づき文から情報
を抽出するので、文中に区切り記号がなくても必要な情
報を正確に抽出することができる。また、(b)定形パ
ターンは特定の特徴デ−タに基づいて分類されており、
情報を抽出すべき文がどの分類に属するかを先ず判断し
た後に、該当する分類中の定形パターンとのマッチング
処理を行うので、全ての定形パターンとのマッチング処
理を行う必要がなく、迅速な情報抽出を行うことができ
る。
As described above, according to the present invention,
(A) Since information is extracted from a sentence based on a predetermined fixed pattern, necessary information can be accurately extracted without a delimiter in the sentence. (B) The fixed patterns are classified based on specific feature data.
After first determining to which class a sentence from which information should be extracted belongs, a matching process is performed with a fixed pattern in the corresponding class. Therefore, it is not necessary to perform a matching process with all fixed patterns, and quick information can be obtained. An extraction can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例として、戸籍簿の入力から必
要な情報を抽出する処理のフローチャートの一部であ
る。
FIG. 1 is a part of a flowchart of a process of extracting necessary information from input of a family register as one embodiment of the present invention.

【図2】同じく情報抽出処理のフローチャートの他の一
部である。
FIG. 2 is another part of the flowchart of the information extraction process.

【図3】図1,図2に用いられる戸籍簿の一例を示す図
である。
FIG. 3 is a diagram showing an example of a family register used in FIGS. 1 and 2;

【図4】図1,図2で用いられる身分事項事件種別コー
ドの一覧を示す図である。
FIG. 4 is a diagram showing a list of identification matter case type codes used in FIGS. 1 and 2;

【図5】図1,図2で用いられる内部テーブルの展開図
である。
FIG. 5 is a development view of an internal table used in FIGS. 1 and 2;

【図6】図1,図2で用いられる記載パターンデ−タ定
義ファイルのデ−タ構造図である。
FIG. 6 is a data structure diagram of a description pattern data definition file used in FIGS. 1 and 2;

【図7】図1,図2における記載パターン特定処理を示
す詳細フローチャートである。
FIG. 7 is a detailed flowchart showing a written pattern specifying process in FIGS. 1 and 2;

【符号の説明】[Explanation of symbols]

01〜32 身分事項事件種別コード 01-32 Identity matter case type code

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭56−60935(JP,A) 特開 平2−23413(JP,A) 特開 平5−120269(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-56-60935 (JP, A) JP-A-2-23413 (JP, A) JP-A-5-120269 (JP, A) (58) Investigation Field (Int.Cl. 6 , DB name) G06F 17/30 JICST file (JOIS)

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数の所定語句を任意の位置に並べた入
文から、各所定語句間にある語句を抽出する情報抽出
方法であって、上記所定語句のうち上記入力文の分類種別の特定に用い
られる複数の所定語句を予め記憶するステップと、 上記分類種別毎に、上記複数の所定語句の並びおよび各
所定語句間の一以上の語句の区切りを特定するのに用い
る情報からなる 複数の定形パターンを予め記憶するステ
ップと、 上記入力文から、上記予め記憶した分類種別特定用の所
定語句に一致もしくは最もマッチングする語句を抽出し
て上記入力文の分類種別を特定するステップと、該ステ
ップで特定した分類種別の上記予め記憶した 定形パター
から、上記入力文の各所定語句の並びに一致もしくは
最もマッチングする定形パターンを選択するステップ
と、 該ステップで選択し た定形パターンで示される各所定語
句の並びと情報に従って、上記入力文の各所定語句間に
ある各語句を区切って抽出するステップとを有すること
を特徴とする情報抽出方法。
1. An input in which a plurality of predetermined words are arranged at an arbitrary position.
From the force statement, an information extracting method for extracting words in between the predetermined phrases used in a particular classification type of the input sentence of said predetermined word
Storing a plurality of predetermined words and phrases in advance, and for each of the classification types, an arrangement of the plurality of predetermined words and
Used to identify one or more word breaks between given words
For storing a plurality of fixed patterns of information in advance.
From the input sentence and the input sentence,
Extract the phrase that matches or best matches the fixed phrase
Identifying the classification type of the input sentence by
From the previously stored fixed pattern was classified type specified in-up or match the sequence of the predetermined words in the input sentence
Selecting a fixed pattern that best matches
And each predetermined word represented by the fixed pattern selected in the step.
According to the arrangement of phrases and information, between each predetermined phrase in the above input sentence
Information extraction method characterized by a step of extracting by separating certain each word.
【請求項2】複数の所定語句を任意の位置に並べた入力
文から、各所定語句間にある語句を抽出する情報抽出方
法であって、上記複数の所定語句の並びおよび各所定語句間の一以上
の語句の区切りを特定するのに用いる情報からなる 複数
の定形パターンを予め記憶するステップと、 該ステップで記憶した上記 定形パターンから、上記入力
文の各所定語句の並びに一致もしくは最もマッチング
定形パターンを選択するステップと、 該ステップで選択した上記 定形パターンで示される各所
定語句の並びと情報に従って、上記入力文の各所定語句
間にある各語句を区切って抽出するステップとを有する
ことを特徴とする情報抽出方法。
From wherein input <br/> sentence by arranging a plurality of predetermined words to an arbitrary position, an information extracting method for extracting words in between the predetermined words, arrangement and each of the plurality of predetermined phrases One or more between certain words
Storing in advance a plurality of fixed patterns consisting of information used to specify the delimiter of the phrase ; and inputting the input data from the fixed patterns stored in the step.
Matches or most matching sequence of each predetermined word sentences
Selecting a fixed pattern to be performed , and various points indicated by the fixed pattern selected in the step.
Each predetermined phrase in the above input sentence according to the list of fixed phrases and information
Information extraction method according to claim <br/> that a step of extracting separate each word in between.
【請求項3】 請求項1、もしくは、請求項2のいずれ
に記載の情報抽出方法において、上記記憶した 定形パターンから上記入力文の各所定語句
の並びに最もマッチングする定形パターンを選択するス
テップで、最もマッチングする定形パターンの候補が
ある場合、定形パターン毎に、順次、該定形パター
の各所定語句が他の定形パターン存在するか否かを
判断し、存在しない数をカウントし該カウント数が最
も大きい定形パターンを上記最もマッチングする定形パ
ターンとして選択することを特徴とする情報抽出方法。
3. The method according to claim 1 or 2,
The information extraction method according to either the predetermined word of the input sentence from the fixed pattern of the above-mentioned storage
Vinegar to select the most matching the fixed pattern to the list
In step, if the candidate of the fixed pattern that best match there is more <br/> number, for each fixed pattern, sequentially, each predetermined word of said fixed pattern is judged whether or not another of the fixed pattern, several of the count does not exist, the information extraction method of the largest fixed pattern the counted number and selects as the fixed pattern of the most matching.
JP5217464A 1993-09-01 1993-09-01 Information extraction method Expired - Lifetime JP2848430B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5217464A JP2848430B2 (en) 1993-09-01 1993-09-01 Information extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5217464A JP2848430B2 (en) 1993-09-01 1993-09-01 Information extraction method

Publications (2)

Publication Number Publication Date
JPH0773188A JPH0773188A (en) 1995-03-17
JP2848430B2 true JP2848430B2 (en) 1999-01-20

Family

ID=16704646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5217464A Expired - Lifetime JP2848430B2 (en) 1993-09-01 1993-09-01 Information extraction method

Country Status (1)

Country Link
JP (1) JP2848430B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287144A (en) * 1995-04-19 1996-11-01 Fuji Xerox Syst Service Kk Family register data generating process system and its itemizing method
KR100340386B1 (en) * 1999-09-08 2002-08-03 사단법인 고등기술연구원 연구조합 Method of data-processing and auto-generating patent map for patent/technical information analysis

Also Published As

Publication number Publication date
JPH0773188A (en) 1995-03-17

Similar Documents

Publication Publication Date Title
US20030041058A1 (en) Queries-and-responses processing method, queries-and-responses processing program, queries-and-responses processing program recording medium, and queries-and-responses processing apparatus
US5983171A (en) Auto-index method for electronic document files and recording medium utilizing a word/phrase analytical program
EP0415000B1 (en) Method and apparatus for spelling error detection and correction
US9875254B2 (en) Method for searching for, recognizing and locating a term in ink, and a corresponding device, program and language
US20090222395A1 (en) Systems, methods, and software for entity extraction and resolution coupled with event and relationship extraction
JP2006244262A (en) Retrieval system, method and program for answer to question
WO2020100553A1 (en) Question-and-answer data generation device and question-and-answer data generation method
KR20070007001A (en) Method and apparatus for searching information using automatic query creation
KR20020009583A (en) System and method for extracting index key data fields
Yunus et al. A context free spell correction method using supervised machine learning algorithms
Ekbal et al. Voted NER system using appropriate unlabeled data
CN113642327A (en) Method and device for constructing standard knowledge base
JP2693914B2 (en) Search system
US20210182549A1 (en) Natural Language Processing (NLP) Pipeline for Automated Attribute Extraction
JP2848430B2 (en) Information extraction method
JP2000231559A (en) Information processor
JPH10162008A (en) Method and device for information retrieval
JP3350556B2 (en) Search system
KS et al. Automatic error detection and correction in malayalam
JP2007058415A (en) Text mining device, text mining method, and program for text mining
EP1072986A2 (en) System and method for extracting data from semi-structured text
JPS61248160A (en) Document information registering system
JPH07244669A (en) Document retrieval system
JP3317904B2 (en) Abbreviated name extraction device, method and recording medium
EP4145302A1 (en) Information search system

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081106

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091106

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091106

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101106

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101106

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111106

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 14

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 14

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131106

Year of fee payment: 15