JP2001318939A - 文書処理方法及び装置並びにその処理プログラムを記憶した媒体 - Google Patents

文書処理方法及び装置並びにその処理プログラムを記憶した媒体

Info

Publication number
JP2001318939A
JP2001318939A JP2000142231A JP2000142231A JP2001318939A JP 2001318939 A JP2001318939 A JP 2001318939A JP 2000142231 A JP2000142231 A JP 2000142231A JP 2000142231 A JP2000142231 A JP 2000142231A JP 2001318939 A JP2001318939 A JP 2001318939A
Authority
JP
Japan
Prior art keywords
occurrence
phrase
word
definition information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000142231A
Other languages
English (en)
Inventor
Natsuko Sugaya
菅谷  奈津子
Katsumi Tada
勝己 多田
Tadataka Matsubayashi
忠孝 松林
Akihiko Yamaguchi
明彦 山口
Yasuhiko Inaba
靖彦 稲場
Mikihiko Tokunaga
幹彦 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000142231A priority Critical patent/JP2001318939A/ja
Priority to DE60040968T priority patent/DE60040968D1/de
Priority to EP00118624A priority patent/EP1154355B1/en
Priority to US09/649,961 priority patent/US6757676B1/en
Publication of JP2001318939A publication Critical patent/JP2001318939A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】多種多様な視点から文書(テキスト)を分析す
ることが可能なテキストマイニング方法を提供すること
にある。 【解決手段】予め登録された文書の集合を対象として、
その全体または一部分を取り出した処理対象文書集合に
特徴的に出現する語句を抽出する特徴語句抽出ステップ
と、指定された語句または書誌情報を含む定義情報を設
定する定義情報設定ステップと、該特徴語句抽出ステッ
プで抽出した語句の中から該定義情報に含まれる語句ま
たは書誌情報と予め定められた範囲内で共起する共起語
句を取得する共起語句取得ステップを有するテキストマ
イニング方法において、複数の異なる定義情報を有し、
該複数の定義情報の各々から取得した個々の語句または
書誌情報と予め定められた範囲内で共起する共起語句を
取得する多重共起語句取得ステップを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、登録された文書の
データベースを対象として、指定された文書集合に関す
る各種情報を取得する文書処理技術に係る。
【0002】
【従来の技術】近年、ワードプロセッサやパーソナルコ
ンピュータ等の普及により、これらによって作成される
電子化情報は増大してきている。また、WWW(World Wid
e Web)や電子メール、電子ニュース等から入手可能な
電子化情報も急速に増加している。そのため、これらの
電子化情報の内容を分析し、有効に活用することが企業
における重要な課題となっている。
【0003】一般に多くの電子化情報はテキスト、すな
わち文章形式で記述されていることが多い。このような
テキスト情報、例えば自由回答形式のアンケート等は、
機械的に分析することが困難なため、従来人手による分
析が行われてきた。この人手による分析処理には以下の
ような問題がある。
【0004】(1)処理対象文書を全て読まなければな
らず、文書が増加した場合には実用的ではない。
【0005】(2)主観的判断に基づき分析が行われる
ため、分析者の知識や熟練度によって結果が異なる。
【0006】このような、人手による分析を支援する技
術としてテキストマイニングへのニーズが高まってい
る。テキストマイニングの処理手順については、「テキ
ストマイニング―膨大な文書データの自動分析による知
識発見―」(那須川 他、情報処理学会誌、Vol.40、No.
4、pp.358-364)や「単語の連想関係によるテキストマ
イニング」(渡部 他、情報処理学会研究会情報学基礎5
5-8、pp.57-64)に具体的に記載されている。以下、こ
れを従来技術1と呼ぶ。テキストマイニングは、予め登
録されたテキスト情報を対象として、処理対象情報に含
まれる語句の共起関係や出現傾向等から新たな知識を発
見するものである。具体的には、処理対象文書集合に対
して、分析を行う視点である軸を設定し、軸の構成要素
に対応付けて文書集合の特徴を表す語句を取得する。こ
こで、“軸の構成要素に対応付けて語句を取得する”と
は、後述するように“軸の構成要素と予め定められた範
囲内で共起する語句を取得する”ことを意味する。この
語句を参照することにより、ユーザは文書集合の傾向を
つかむことが可能となる。例えば、“病原性大腸菌O1
57”に関する新聞記事集合を、掲載月を軸として分析
する場合の例を図2に示す。掲載月を軸として分析する
ことにより、軸の構成要素である“7月”と対応付けて
「感染、患者、症状、入院、…」、“8月”と対応付け
て「衝撃、給食、入院、集団感染、…」、“9月”と対
応付けて「売上、マイナス、食料品、生鮮、…」という
語句が取得される。この語句を参照することにより、ユ
ーザは“7月”には「O157に感染した患者が入
院」、“8月”には「給食でO157に集団感染が発
生」、“9月”には「O157の影響で生鮮食品等の売
上げが低下」した話題が文書集合に存在するという傾向
を把握することが可能となる。図3のPAD(Problem Ana
lysis Diagram)図に従来技術1の処理手順を示す。ま
ずステップ300で、テキストマイニングの処理対象と
なる文書集合を限定する。アンケートのように予めある
観点に基づいて集められた文書データベースの場合には
そのまま処理対象文書集合として設定したり、新聞記事
のように、政治や経済、スポーツ等の多様な観点が含ま
れる文書データベースの場合にはユーザの分析目的に応
じて全文検索等を行い、文書集合を限定する。全文検索
とは、登録時に処理対象文書中のテキスト全体を計算機
システムに入力してデータベース化し、検索時には該当
データベース中からユーザの指定した文字列を含む全て
の文書を探し出す技術である。全文検索については、
「カギを握るインデクス処理 高速全文検索技術の現状
と将来」(真島、日経バイト、OCTOBER 1996、pp.158-1
67)に詳細に記載されている。以下、これを従来技術2
と呼ぶ。次にステップ301で、ステップ300で設定
した処理対象文書集合から内容を特徴付ける語句(以
下、特徴語句)を抽出する。この特徴語句は辞書を参照
して抽出してもよいし、統計情報を用いて抽出してもよ
い。そしてステップ302で、分析を行う視点である軸
を設定する。ここでは文書の書誌情報として付与されて
いる日付や年齢、性別等を分析軸として設定したり、指
定された語句を分析軸の構成要素として設定する。例え
ば、アンケートから年齢による意識の違いを知りたい場
合には、ここで年齢を分析軸として設定する。この場
合、“20”や“30”等の年齢を表す数値が分析軸の構成
要素となる。最後にステップ303で、ステップ301
で抽出した特徴語句の中から、ステップ302で設定し
た分析軸の構成要素と予め定められた範囲内で共起する
語句を取得する。予め定められた範囲内としては、同一
文書内、同一段落内、同一文章内またはm語以内、n文
字以内(m、nは整数)等を用いることができる。以上
のように、従来技術1では、分析する軸の構成要素に対
応付けて語句を取得することにより、ユーザが文書集合
の傾向を把握することを支援している。このように従来
技術1では、分析軸の構成要素に対応付けて、自動的に
処理対象文書集合を特徴付ける語句を取得しているた
め、分析者の負担の軽減、分析者による分析結果の相違
の低減が図れる。
【0007】
【発明が解決しようとする課題】以上説明した従来技術
1によると、分析する軸の構成要素に対応付けて、自動
的に処理対象文書集合を特徴付ける語句を取得してお
り、分析者の負担を軽減し、分析者の知識や熟練度によ
る分析結果の相違を低減することが可能となる。
【0008】しかし、従来技術1には以下のような問題
がある。図3に示すとおり、従来技術1では、分析軸の
個々の構成要素との共起関係だけに基づいて分析を行う
ことになり、複数の異なる視点、すなわち複数の分析軸
の組み合わせとの共起関係を分析したい場合には、その
分析軸毎にテキストマイニングを行い、その結果をユー
ザが自分で組み合わせて分析しなければならない。ユー
ザが分析を行う際には、文書集合の内容を知らない状態
から始めるため、最初から一つの視点を決めて分析する
ことは困難である。しかし、従来技術1には上述したよ
うな問題があり、多種多様な視点の組み合わせで分析す
ることができない。
【0009】こうした問題に対し、本発明では以下の課
題を改善することを目的とする。すなわち、本発明の目
的は、文書集合の内容を複数の視点から分析することが
可能なテキストマイニング機能を提供することにより、
文書集合の傾向を容易に分析することを可能とする文書
処理方法およびシステムを提供することにある。
【0010】
【課題を解決するための手段】上記課題を改善するため
に、本発明では、以下の処理ステップを有する。
【0011】すなわち、予め登録された文書の集合を対
象として、その全体または一部分を取り出した処理対象
文書集合に特徴的に出現する語句を抽出する特徴語句抽
出ステップと、指定された語句または書誌情報を含む定
義情報を設定する定義情報設定ステップと、前記特徴語
句抽出ステップで抽出した語句の中から前記定義情報に
含まれる語句または書誌情報と予め定められた範囲内で
共起する共起語句を取得する共起語句取得ステップを有
するテキストマイニング方法であって、複数の異なる定
義情報を有し、さらに、前記共起語句取得ステップは、
前記共起語句及び共起語句と予め定められた範囲内で共
起する前記定義情報に含まれる語句または書誌情報を、
分析履歴として記憶する分析履歴記憶ステップを有し、
さらに、複数の定義情報の各々から取得した個々の語句
または書誌情報と予め定められた範囲内で共起する共起
語句を取得するとともに、前記共起語句及び共起語句と
共起する複数の定義情報の各々から取得した個々の語句
または書誌情報を、前記分析履歴として記憶する多重共
起語句取得ステップを有し、さらに、指定された語句ま
たは書誌情報を含む定義情報を追加するとともに、追加
する前の前記複数の定義情報の各々から取得した個々の
語句または書誌情報と共起するとして取得した共起語句
を前記分析履歴から抽出して、前記多重共起語句取得ス
テップの共起語句の候補とする定義情報追加ステップ
と、指定された定義情報に含まれる語句または書誌情報
を、指定された語句または書誌情報に変更するととも
に、変更した定義情報を追加する前の前記複数の定義情
報の各々から取得した個々の語句または書誌情報と共起
するとして取得した共起語句を前記分析履歴から抽出し
て、前記多重共起語句取得ステップの共起語句の候補と
する定義情報変更ステップの、両方とも、またはいずれ
か一方を有するようにしている。
【0012】上記文書検索方法を用いた本発明の原理
を、図4を用いて説明する。
【0013】テキストマイニング実行指示がユーザから
入力された場合には、テキストマイニングの処理対象と
なる文書集合から特徴語句を抽出し、その中からユーザ
が指定した分析軸の構成要素と共起する語句を取得す
る。本処理内容は従来技術1と同様である。図4に示す
例では、“O157”に関する新聞記事集合を処理対象
としており、特徴語句「小学校、集団感染、患者、腹
痛、出血性、下痢、症状、入院、…」が抽出されてい
る。そして、その中から指定された分析軸(図4に示す
例では新聞の掲載月)の構成要素と共起する語句を取得
している。本発明ではさらに、この分析軸及び分析結果
を分析履歴として保存しておくとともに、複数の異なる
分析軸を有するようにし、分析軸の追加や任意の分析軸
の変更を行った際に、複数の分析軸の構成要素の各々と
共起する可能性が高い語句を分析履歴を用いて絞り込
み、複数の異なる分析軸の組み合わせによる分析を実現
している。
【0014】指定された特徴語句を含む分析軸を追加す
る際には、指定された構成要素にその分析軸を追加し
て、指定された構成要素と追加した分析軸の構成要素の
組を作成するとともに、作成した構成要素の組の各々と
共起する可能性が高い語句を共起語句候補として分析履
歴から抽出する。そして抽出した共起語句候補の中か
ら、作成した構成要素の組の各々と予め定められた範囲
内で共起する語句を取得する。図4に示す例では、構成
要素“7月”と対応付けて取得した共起語句“感染”及
び“症状”を含む分析軸を追加している。そして、指定
された構成要素“7月”と追加した分析軸の構成要素の
組“7月―感染”、“7月―症状”と共起する可能性が
高い共起語句候補として、“7月”と共起する語句「感
染、患者、症状、入院、…」を分析履歴から抽出する。
そしてこの共起語句候補の中から、構成要素の組“7月
―感染”、“7月―症状”と予め定められた範囲内で共
起する語句を取得する。ここで、“7月−感染”とは、
“7月”と“感染”の組であることを意味し、「“7月
―感染”と予め定められた範囲内で共起する」とは、
「“7月”と予め定められた範囲内で共起し、かつ、
“感染”と予め定められた範囲内で共起する」ことを意
味する。この分析軸及び特徴語句は分析履歴に保存して
おく。
【0015】追加した分析軸を変更する際には、分析軸
をユーザの指示に従って変更するとともに、構成要素の
組と共起する可能性が高い語句を共起語句候補として分
析履歴から抽出する。そして抽出した共起語句候補の中
から、構成要素の組と予め定められた範囲内で共起する
語句を取得する。図4に示す例では、「構成要素“7
月”に分析軸を追加した」ことを消去して、“8月”と
対応付けて取得した共起語句“給食”を含む分析軸を追
加している。そして、指定された構成要素“8月”と追
加した分析軸の構成要素の組“8月―給食”と共起する
可能性が高い共起語句候補として、“8月”と共起する
語句「衝撃、給食、入院、集団感染、…」を分析履歴か
ら抽出する。そしてこの共起語句候補の中から、構成要
素の組“8月―給食”と予め定められた範囲内で共起す
る語句を取得する。この分析軸及び共起語句も分析履歴
に保存しておく(図4には示していない)。
【0016】以上説明したように、本方式では、分析軸
及び分析結果を分析履歴として保存しておくとともに、
複数の異なる分析軸を有するようにし、分析軸の追加や
任意の分析軸の変更を行った際に、複数の分析軸の構成
要素の各々と共起する可能性が高い語句を分析履歴を用
いて絞り込み、複数の異なる分析軸の組み合わせによる
分析を実現している。こうすることにより、多種多様な
視点から分析することが可能なテキストマイニング機能
を実現することができため、ユーザが文書集合の傾向を
適切かつ容易に分析することが可能な文書処理システム
を提供することが可能となる。
【0017】
【発明の実施の形態】本発明の原理について図4を用い
て説明する。
【0018】テキストマイニング実行指示がユーザから
入力された場合には、テキストマイニングの処理対象と
なる文書集合から特徴語句を抽出し、その中からユーザ
が指定した分析軸の構成要素と共起する語句を取得す
る。本処理内容は従来技術1と同様である。図4に示す
例では、“O157”に関する新聞記事集合を処理対象
としており、特徴語句「小学校、集団感染、患者、腹
痛、出血性、下痢、症状、入院、…」が抽出されてい
る。そして、その中から指定された分析軸(図4に示す
例では新聞の掲載月)の構成要素と共起する語句を取得
している。本発明ではさらに、この分析軸及び分析結果
を分析履歴として保存しておくとともに、分析軸の指定
された構成要素に異なる分析軸を追加し、指定された構
成要素と追加した分析軸の構成要素の組の各々と共起す
る語句を取得するようにしている。また、指定された構
成要素への分析軸の追加や追加した分析軸の変更を行っ
た際に、指定された構成要素と追加した分析軸の構成要
素の組の各々と共起する可能性が高い語句を共起語句候
補として分析履歴から抽出し、その共起語句候補の中か
ら指定された構成要素と追加した分析軸の構成要素の組
の各々と共起する語句を取得するようにしている。この
ように、分析履歴を用いて共起語句を絞り込んでから、
実際に構成要素の各々と共起する語句を調べるため、全
ての特徴語句について共起するか否かを調べる場合に比
べ、高速な分析が行える。
【0019】指定された語句を含む分析軸を追加する際
には、指定された構成要素にその分析軸を追加して、指
定された構成要素と追加した分析軸の構成要素の組を作
成するとともに、作成した構成要素の組の各々と共起す
る可能性が高い語句を共起語句候補として分析履歴から
抽出する。そして抽出した共起語句候補の中から、作成
した構成要素の組の各々と予め定められた範囲内で共起
する語句を取得する。図4に示す例では、構成要素“7
月”と対応付けて取得した共起語句“感染”及び“症
状”を含む分析軸を追加している。そして、指定された
構成要素“7月”と追加した分析軸の構成要素の組“7
月―感染”、“7月―症状”と共起する可能性が高い共
起語句候補として、“7月”と共起する語句「感染、患
者、症状、入院、…」を分析履歴から抽出する。そして
この共起語句候補の中から、構成要素の組“7月―感
染”、“7月―症状”と予め定められた範囲内で共起す
る語句を取得する。ここで、“7月−感染”とは、“7
月”と“感染”の組であることを意味し、「“7月―感
染”と予め定められた範囲内で共起する」とは、「“7
月”と予め定められた範囲内で共起し、かつ、“感染”
と予め定められた範囲内で共起する」ことを意味する。
この分析軸及び共起語句は分析履歴に保存しておく。
【0020】追加した分析軸を変更する際には、分析軸
をユーザの指示に従って変更するとともに、構成要素の
組と共起する可能性が高い語句を共起語句候補として分
析履歴から抽出する。そして抽出した共起語句候補の中
から、構成要素の組と予め定められた範囲内で共起する
語句を取得する。図4に示す例では、「構成要素“7
月”に分析軸を追加した」ことを消去して、“8月”と
対応付けて取得した共起語句“給食”を含む分析軸を追
加している。そして、指定された構成要素“8月”と追
加した分析軸の構成要素の組“8月―給食”と共起する
可能性が高い共起語句候補として、“8月”と共起する
語句「衝撃、給食、入院、集団感染、…」を分析履歴か
ら抽出する。そしてこの共起語句候補の中から、構成要
素の組“8月―給食”と予め定められた範囲内で共起す
る語句を取得する。この分析軸及び共起語句も分析履歴
に保存しておく(図4には示していない)。
【0021】以上説明したように、本実施例に示す方法
では、分析軸及び分析結果を分析履歴として保存してお
くとともに、分析軸の指定された構成要素に異なる分析
軸を追加し、指定された構成要素と追加した分析軸の構
成要素の組の各々と共起する語句を取得するようにして
いる。また、指定された構成要素への分析軸の追加や追
加した分析軸の変更を行った際に、指定された構成要素
と追加した分析軸の構成要素の組の各々と共起する可能
性が高い語句を共起語句候補として分析履歴から抽出
し、その共起語句候補の中から指定された構成要素と追
加した分析軸の構成要素の組の各々と共起する語句を取
得するようにしている。このように、分析履歴を用いて
共起語句を絞り込んでから、実際に構成要素の各々と共
起する語句を調べるため、全ての特徴語句について共起
するか否かを調べる場合に比べ、高速な分析が行える。
こうすることにより、多種多様な視点から対話的に分析
することが可能なテキストマイニング機能を実現するこ
とができため、ユーザが文書集合の傾向を適切かつ容易
に分析することが可能な文書処理システムを提供するこ
とが可能となる。
【0022】本発明の実施例の構成を図1に示す。
【0023】本発明を適用した文書処理システムは、図
1に示すように、ディスプレイ100、キーボード10
1、中央演算処理装置(CPU)102、フロッピディ
スクドライバ(FDD)104、磁気ディスク装置10
6、主記憶装置109及びこれらを結ぶバス103から
構成される。磁気ディスク装置106は二次記憶装置の
一つであり、テキストファイル107及び分析履歴ファ
イル108が格納される。フロッピディスク105に格
納されている情報は、FDD104によりアクセスされ
る。
【0024】主記憶装置109には、システム制御プロ
グラム110、処理対象文書集合設定プログラム11
1、検索プログラム112、特徴語句抽出プログラム1
13、分析軸設定プログラム114、共起語句取得プロ
グラム115、多重分析プログラム116、分析軸追加
プログラム117、分析軸変更プログラム118、多重
共起語句取得プログラム119が格納されるとともにワ
ークエリア120が確保される。以上のプログラムは磁
気ディスク装置106、フロッピディスク105等のコ
ンピュータで読み書きできる記憶媒体に格納することも
できる。
【0025】以下、本発明の実施例の処理内容につい
て、図5を用いて説明する。
【0026】システム制御プログラム110はキーボー
ド101からのテキストマイニング実行指示を受け起動
し、処理対象文書集合設定プログラム111、特徴語句
抽出プログラム113、分析軸設定プログラム114、
共起語句取得プログラム115及び多重分析プログラム
116の制御を行う。
【0027】システム制御プログラム110は、まずス
テップ300で処理対象文書集合設定プログラム111
を起動し、テキストファイル107の中からテキストマ
イニングの処理対象となる文書集合を限定する。テキス
トファイル107がアンケートのように予めある観点に
基づいて集められた文書データベースの場合にはそのま
ま処理対象文書集合として設定したり、新聞記事のよう
に、政治や経済、スポーツ等の多様な観点が含まれる文
書データベースの場合にはユーザの分析目的に応じて全
文検索等を行い、文書集合を限定する。全文検索等を用
いて処理対象文書集合を設定する際には、処理対象文書
集合設定プログラム111は検索プログラム112を起
動し、ユーザが入力した検索条件でテキストファイル1
07を限定し、処理対象文書集合とする。検索プログラ
ム112には従来技術2で示したような既存の検索技術
を用いる。次にステップ301で特徴語句抽出プログラ
ム113を起動し、ステップ300で設定した処理対象
文書集合から内容を特徴付ける語句である特徴語句を抽
出する。この特徴語句は、辞書等を参照して抽出しても
よいし、統計情報を用いて抽出してもよい。次にステッ
プ302で分析軸設定プログラム114を起動し、分析
を行う視点である軸を設定する。ここでは文書の書誌情
報として付与されている日付や年齢、性別等を分析軸と
して設定したり、指定された語句を分析軸の構成要素と
して設定する。例えば、アンケートから年齢による意識
の違いを知りたい場合には、ここで年齢を軸として設定
する。この場合、“20”や“30”等の年齢を表す数値が
分析軸の構成要素となる。このステップ300からステ
ップ302までの処理は従来技術1と同様である。次に
ステップ500で共起語句取得プログラム115を起動
し、ステップ301で抽出した特徴語句の中から、ステ
ップ302で設定した分析軸の構成要素と予め定められ
た範囲内で共起する語句を取得する。そしてこの分析軸
及び共起語句を分析履歴として分析履歴ファイル108
に記憶する。本ステップにおける共起語句を取得する処
理は従来技術1と同様である。そしてステップ501で
多重分析プログラム116を起動し、ユーザからテキス
トマイニング終了指示が入力されるまで、ステップ50
2からステップ506の一連の多重分析処理を繰り返
す。
【0028】この多重分析処理では、まずステップ50
2で、ユーザから分析軸追加指示が入力されているか否
かを判定する。ここで、分析軸追加指示が入力されてい
ると判断された場合には、ステップ503で分析軸追加
プログラム117を起動し、指定された語句を含む分析
軸を、指定された構成要素に追加して、指定された構成
要素と追加した分析軸の構成要素の組を作成するととも
に、作成した構成要素の組の各々と共起する可能性が高
い語句を共起語句候補として分析履歴ファイル108か
ら抽出する。ステップ502で分析軸追加指示が入力さ
れていないと判断された場合には、ステップ504でユ
ーザから分析軸変更指示が入力されているか否かを判定
する。そしてステップ504で分析軸変更指示が入力さ
れたと判断された場合には、ステップ505で分析軸変
更プログラム118を起動し、追加した分析軸をユーザ
の指示に従って変更するとともに、構成要素の組と共起
する可能性が高い語句を共起語句候補として分析履歴フ
ァイル108から抽出する。最後にステップ506で多
重共起語句取得プログラム119を起動し、ステップ5
03またはステップ505で作成した構成要素の組と予
め定められた範囲内で共起する語句を、ステップ503
またはステップ505で抽出した共起語句候補の中から
取得する。ここで、共起語句を取得する際には、共起の
範囲(同一文書内、同一段落内、同一文章内、指定した
文字・単語数内等)をユーザに指定させて取得するよう
にしてもよい。そしてこの分析軸及び共起語句を分析履
歴として分析履歴ファイル108に記憶する。
【0029】以下、本実施例における処理内容を図5に
沿って具体的に説明する。
【0030】システム制御プログラム110は、まずス
テップ300で処理対象文書集合設定プログラム111
を起動し、テキストファイル107の中からテキストマ
イニングの処理対象となる文書集合を限定する。テキス
トファイル107がアンケートのように予めある観点に
基づいて集められた文書データベースの場合にはそのま
ま処理対象文書集合として設定したり、新聞記事のよう
に、政治や経済、スポーツ等の多様な観点が含まれる文
書データベースの場合にはユーザの分析目的に応じて全
文検索等を行い、文書集合を限定する。全文検索等を用
いて処理対象文書集合を設定する際には、処理対象文書
集合設定プログラム111は検索プログラム112を起
動し、ユーザが入力した検索条件でテキストファイル1
07を限定し、処理対象文書集合とする。検索プログラ
ム112には従来技術2で示したような既存の検索技術
を用いる。図6に新聞記事データベース中の“O15
7”関連記事をテキストマイニングする場合の例を示
す。本図に示す例では、テキストファイル107には新
聞記事データベースが格納されている。そこで、検索プ
ログラム112を用いて本データベースを“O157”
を含むものに限定し、処理対象文書集合として文書00
12、文書0130、文書0293、文書0535、文
書0829、…を得る。次にステップ301で特徴語句
抽出プログラム113を起動し、ステップ300で設定
した処理対象文書集合から内容を特徴付ける語句である
特徴語句を抽出する。特徴語句は、辞書等を参照して抽
出してもよいし、統計情報を用いて抽出してもよい。図
6に示す例では、ステップ300で設定した処理対象文
書集合から特徴語句として「小学校、集団感染、患者、
腹痛、出血性、下痢、症状、入院、家庭、二次感染、ス
ーパー、生鮮、食料品、売上、打撃、…」が抽出されて
いる。次にステップ302で分析軸設定プログラム11
4を起動し、分析を行う視点である軸を設定する。ここ
では文書の書誌情報として付与されている日付や年齢、
性別等を分析軸として設定したり、指定された語句を分
析軸の構成要素として設定する。図6に示す例では、新
聞記事の書誌情報として付与されている掲載月を分析軸
として設定している。このステップ300からステップ
302までの処理は従来技術1と同様である。次にステ
ップ500で共起語句取得プログラム115を起動し、
ステップ301で抽出した特徴語句の中から、ステップ
302で設定した分析軸の構成要素と予め定められた範
囲内で共起する語句を取得する。そしてこの分析軸及び
共起語句を分析履歴として分析履歴ファイル108に記
憶する。図6の例では、本処理を実行することにより、
分析軸の構成要素である“7月”と対応付けて「感染、
患者、症状、入院、…」、“8月”と対応付けて「衝
撃、給食、入院、集団感染、…」、“9月”と対応付け
て「売上、マイナス、食料品、生鮮、…」といった共起
語句が取得され、この結果を1つの分析軸による分析結
果として分析履歴ファイル108に格納する。本ステッ
プにおける共起語句を取得する処理は従来技術1と同様
である。そしてステップ501で多重分析プログラム1
16を起動し、ユーザからテキストマイニング終了指示
が入力されるまで、ステップ502からステップ506
の一連の多重分析処理を繰り返す。以下、この多重分析
処理について分析軸を追加する場合と、分析軸を変更す
る場合に分けて説明する。
【0031】分析軸を追加する場合には、まずステップ
502で、ユーザから分析軸追加指示が入力されたと判
断される。そしてステップ503で分析軸追加プログラ
ム117を起動し、指定された語句を含む分析軸を、指
定された構成要素に追加して、指定された構成要素と追
加した分析軸の構成要素の組を作成するとともに、作成
した構成要素の組の各々と共起する可能性が高い語句を
共起語句候補として分析履歴ファイル108から抽出す
る。図7に本処理の例を示す。本図における例では、構
成要素“7月”と対応付けて取得した語句“感染”及び
“症状”を含む分析軸を追加している。そこで、指定さ
れた構成要素“7月”に“感染”及び“症状”を分析軸
として追加し、構成要素の組“7月―感染”、“7月―
症状”を作成する。ここで、“7月−感染”とは、“7
月”と“感染”の組であることを意味する。そして、こ
の構成要素の組“7月―感染”、“7月―症状”と共起
する可能性が高い共起語句候補として、“7月”と共起
する語句である「感染、患者、症状、入院、集団、…」
を分析履歴ファイル108から取得する。最後にステッ
プ506で多重共起語句取得プログラム119を起動
し、ステップ503で作成した構成要素の組と予め定め
られた範囲内で共起する語句を、ステップ503で抽出
した共起語句候補の中から取得する。ここで、共起関係
を取得する際には、共起の範囲(同一文書内、同一段落
内、同一文章内、指定した文字・単語数内等)をユーザ
に指定させて取得するようにしてもよい。そしてこの分
析軸及び共起語句を分析履歴として分析履歴ファイル1
08に記憶する。図7に示す例では、ステップ503で
作成した分析軸“7月―感染”、“7月―症状”と、同
じくステップ503で分析履歴ファイル108から抽出
した共起語句候補との共起関係を調べることにより、
“7月―感染”と共起する語句として「患者、症状、予
防法、集団、…」、“7月―症状”と共起する語句とし
て「吐気、下痢、入院、重傷、…」を得る。ここで
「“7月―感染”と予め定められた範囲内で共起する」
とは、「“7月”と予め定められた範囲内で共起し、か
つ、“感染”と予め定められた範囲内で共起する」こと
を意味する。そしてこの分析軸及び共起語句を2つの分
析軸による分析結果として分析履歴ファイル108に格
納する。
【0032】分析軸を変更する場合には、ステップ50
2でユーザから分析軸追加指示が入力されていないと判
断され、ステップ504で分析軸変更指示が入力されて
いると判断される。そしてステップ505で分析軸変更
プログラム118を起動し、追加した分析軸をユーザの
指示に従って変更するとともに、構成要素の組と共起す
る可能性が高い語句を共起語句候補として分析履歴ファ
イル108から抽出する。図8に本処理の例を示す。本
図における例は、3つの分析軸で分析を行った段階でユ
ーザはその視点で分析を掘り下げるのを止め、「2つの
分析軸の構成要素“7月−感染”に“患者”ではなく
“予防法”を含む分析軸を追加」するように変更して違
った視点で分析を行う場合の例である。本処理ではユー
ザの指示を受け、まず2つの分析軸の構成要素“7月−
感染”と共起する語句“予防法”を含む分析軸を追加
し、指定された構成要素“7月−感染”と追加した分析
軸の構成要素の組“7月―感染―予防法”を作成する。
そして、この構成要素の組“7月―感染―予防法”と共
起する可能性が高い共起語句候補として、“7月―感
染”と共起する語句である「患者、症状、予防法、集
団、重傷、…」を分析履歴ファイル108から抽出す
る。最後にステップ506で多重共起語句取得プログラ
ム119を起動し、ステップ505で作成した構成要素
の組と予め定められた範囲内で共起する語句を、ステッ
プ505で抽出した共起語句候補の中から取得する。こ
こで、共起関係を取得する際には、共起の範囲(同一文
書内、同一段落内、同一文章内、指定した文字・単語数
内等)をユーザに指定させて取得するようにしてもよ
い。そしてこの分析軸及び共起語句を分析履歴として分
析履歴ファイル108に記憶する。図8に示す例では、
ステップ505で作成した構成要素の組“7月―感染―
予防法”と、同じくステップ505で分析履歴ファイル
108から抽出した共起語句候補との共起関係を調べる
ことにより、“7月―感染―予防法”と共起する語句と
して「加熱調理、手洗、器具洗浄、…」を得る。そして
この分析軸および共起語句を3つの分析軸による分析結
果として分析履歴ファイル108に格納する。
【0033】以上が本実施例における処理内容の詳細な
説明である。
【0034】以上説明したように、本実施例に示す方法
では、分析軸及び分析結果を分析履歴として保存してお
くとともに、分析軸の指定された構成要素に異なる分析
軸を追加し、指定された構成要素と追加した分析軸の構
成要素の組の各々と共起する語句を取得するようにして
いる。また、指定された構成要素への分析軸の追加や追
加した分析軸の変更を行った際に、指定された構成要素
と追加した分析軸の構成要素の組の各々と共起する可能
性が高い語句を共起語句候補として分析履歴から抽出
し、その共起語句候補の中から指定された構成要素と追
加した分析軸の構成要素の組の各々と共起する語句を取
得するようにしている。このように、分析履歴を用いて
共起語句を絞り込んでから、実際に構成要素の各々と共
起する語句を調べるため、全ての特徴語句について共起
するか否かを調べる場合に比べ、高速な分析が行える。
こうすることにより、多種多様な視点から対話的に分析
することが可能なテキストマイニング機能を実現するこ
とができため、ユーザが文書集合の傾向を適切かつ容易
に分析することが可能な文書処理システムを提供するこ
とが可能となる。
【0035】なお、本実施例では、処理対象となる文書
集合を、単語を指定した全文検索を用いて限定する場合
を例として説明したが、データベースに格納されている
文書集合全体を処理対象文書集合としたり、文章や文書
を検索条件として用いて検索した結果を処理対象文書集
合とする場合についても同様の処理が可能である。
【0036】また、本実施例では、分析結果として得ら
れた共起語句を構成要素とする分析軸を追加する場合を
例として説明したが、指定された任意の語句を構成要素
とする分析軸を追加したり、指定された任意の書誌情報
を分析軸として追加する場合についても、その分析軸を
追加する構成要素を指定することにより同様の処理が可
能である。
【0037】本発明の第二の実施例の原理について図9
を用いて説明する。
【0038】本実施例は、表示した共起語句の中から、
分析軸として追加する語句をユーザが選択することによ
って、該当語句を含む分析軸を対応する構成要素に追加
するとともに、追加後の分析軸によるテキストマイニン
グ結果を表示する方法である。また、過去に分析軸とし
て追加した共起語句を、別の共起語句に変更する場合に
は、変更する共起語句をユーザが選択し直すことによ
り、該当分析軸の構成要素を選択した語句に変更し、変
更後の分析軸によるテキストマイニング結果を表示する
方法である。
【0039】テキストマイニング実行指示がユーザから
入力された場合には、指定された処理対象文書集合を、
設定した分析軸を用いて分析し、分析軸の構成要素に対
応付けて共起する語句を表示する。図9に示す例では、
“O157”に関する新聞記事集合を処理対象文書集
合、“掲載月”を分析軸として共起語句を表示してい
る。表示した共起語句の中から、ユーザが分析軸として
追加する語句を選択することによって、該当語句を含む
分析軸を対応する構成要素に追加し、追加後の分析軸に
よるテキストマイニング結果を表示する。図9に示す例
では、“7月”の共起語句として表示した語句のうち
「感染」が選択されている。そのため、この「感染」を
含む分析軸を対応する構成要素“7月”に追加し、構成
要素“7月”と追加した分析軸の構成要素の組“7月―
感染”と共起する語句を表示する。さらに、表示した共
起語句の中から「患者」が選択された場合には、この
「患者」を含む分析軸を対応する構成要素“7月―感
染”に追加し、構成要素“7月―感染”と追加した分析
軸の構成要素の組“7月―感染―患者”と共起する語句
を表示する。さらに、表示した共起語句の中から「対
策」が選択された場合には、この「対策」を含む分析軸
を対応する構成要素“7月―感染―患者”に追加し、構
成要素“7月―感染―患者”と追加した分析軸の構成要
素の組“7月―感染―患者―対策”と共起する語句を表
示する。また、ユーザが構成要素“7月―感染―患者”
に追加した「対策」を「症状」に変更したい場合には、
過去に表示した“7月―感染―患者”の共起語句の中か
ら「症状」を選択することにより、この「症状」を含む
分析軸を対応する構成要素“7月―感染―患者”に追加
し、構成要素“7月―感染―患者”と追加した分析軸の
構成要素の組“7月―感染―患者―症状”と共起する語
句を表示する。なお、共起語句を表示する際には、過去
に表示した共起語句と同一の画面に表示させても良い
し、新たな画面を作成して表示させても良い。また、ユ
ーザからの指示により、過去の共起語句表示画面を消去
するようにしてもよい。
【0040】以上説明したように、本実施例におけるテ
キストマイニング結果表示方法によれば、対話的に分析
軸を変更し、多様な視点からの分析が容易に行えるテキ
ストマイニング機能を実現している。こうすることによ
り、ユーザが文書集合の傾向を適切かつ容易に分析する
ことが可能な文書処理システムを提供することが可能と
なる。
【0041】本実施例は基本的に第一の実施例(図1)
と同様の構成をとるが、その中の主記憶装置109に格
納されるプログラムの構成が異なる。主記憶装置109
aには、図10に示すように、ユーザインターフェース
プログラム1000、システム制御プログラム110、
処理対象文書集合設定プログラム111、検索プログラ
ム112、特徴語句抽出プログラム113、分析軸設定
プログラム114、共起語句取得プログラム115、多
重分析プログラム116、分析軸追加プログラム11
7、分析軸変更プログラム118、多重共起語句取得プ
ログラム119が格納されるとともにワークエリア12
0が確保される。以上のプログラムは磁気ディスク装置
106、フロッピディスク105等のコンピュータで読
み書きできる記憶媒体に格納することもできる。
【0042】以下、第二の実施例に特有なユーザインタ
フェースプログラム1000の処理内容について図11
を用いて説明する。
【0043】ユーザインタフェースプログラム1000
は、キーボード101からのテキストマイニング実行指
示を受け起動する。
【0044】ユーザインタフェースプログラム1000
は、まずステップ1100で、ユーザから指定された処
理対象文書集合及び分析軸の情報を取得し、テキストマ
イニング実行指示とともに、システム制御プログラム1
10に入力する。そしてステップ1101で、システム
制御プログラム110から出力されたテキストマイニン
グ結果をディスプレイ100に表示する。次にステップ
1102で、ユーザから終了指示が入力されるまで、ス
テップ1103からステップ1107の一連の処理を繰
り返す。
【0045】この繰り返し処理では、まずステップ11
03で、最新のテキストマイニング結果から共起語句が
選択されているか否かを判定する。ここで、最新のテキ
ストマイニング結果から共起語句が選択されていると判
断された場合には、ステップ1104で、選択された共
起語句を、分析軸追加指示とともに、システム制御プロ
グラム110に入力する。また、ステップ1103で最
新のテキストマイニング結果から共起語句が選択されて
いないと判断された場合には、ステップ1105で、最
新以外のテキストマイニング結果から共起語句が選択さ
れているか否かを判定する。ここで、最新以外のテキス
トマイニング結果から共起語句が選択されていると判断
された場合には、ステップ1106で、選択された共起
語句を、分析軸変更指示とともに、システム制御プログ
ラム110に入力する。最後にステップ1107で、シ
ステム制御プログラム110から出力されたテキストマ
イニング結果をディスプレイ100に表示する。なお、
このテキストマイニング結果を表示する際には、過去の
テキストマイニング結果と同一の画面に表示させても良
いし、新たな画面を作成して表示させても良い。また、
ユーザからの指示により、過去のテキストマイニング結
果を消去するようにしてもよい。
【0046】以下、ユーザインタフェースプログラム1
000の処理内容を図11に沿って具体的に説明する。
【0047】ユーザインタフェースプログラム1000
は、まずステップ1100で、ユーザから指定された処
理対象文書集合及び分析軸の情報を取得し、テキストマ
イニング実行指示とともに、システム制御プログラム1
10に入力する。そしてステップ1101で、システム
制御プログラム110から出力されたテキストマイニン
グ結果をディスプレイ100に表示する。本処理の結
果、表示されるテキストマイニング結果例を図9に示
す。図9に示した例は、“O157”に関する新聞記事
集合を処理対象文書集合、“掲載月”を分析軸とした場
合の例である。ユーザが、ユーザインタフェースプログ
ラム1000にテキストマイニング実行指示とともに、
処理対象文書集合及び分析軸の情報を与えることによ
り、それらの情報がシステム制御プログラム110に入
力され、その出力であるテキストマイニング結果がディ
スプレイ100に表示される。次にステップ1102
で、ユーザから終了指示が入力されるまで、ステップ1
103からステップ1107の一連の処理を繰り返す。
【0048】以下、この繰り返し処理について、分析軸
の追加を行う場合と、分析軸の変更を行う場合に分けて
説明する。
【0049】分析軸の追加を行う場合には、ユーザは最
新のテキストマイニング結果から追加する共起語句を選
択する。その結果、ユーザインタフェースプログラム1
000はステップ1103で、最新のテキストマイニン
グ結果から共起語句が選択されていると判断する。そし
てステップ1104で、選択された共起語句を、分析軸
追加指示とともに、システム制御プログラム110に入
力する。最後にステップ1107で、システム制御プロ
グラム110から出力されたテキストマイニング結果を
ディスプレイ100に表示する。図9に示す例では、
“7月”の共起語句として表示した語句のうち「感染」
が選択されている。そのため、ユーザインタフェースプ
ログラム1000はこの「感染」と分析軸追加指示をシ
ステム制御プログラム110に入力し、その出力結果、
すなわち「感染」を含む分析軸を対応する構成要素“7
月”に追加した際のテキストマイニング結果を表示す
る。さらに、表示した結果の中から「患者」が選択され
た場合には、この「患者」と分析軸追加指示をシステム
制御プログラム110に入力し、その出力結果、すなわ
ち「患者」を含む分析軸を対応する構成要素“7月―感
染”に追加した際のテキストマイニング結果を表示す
る。さらに、表示した結果の中から「対策」が選択され
た場合には、この「対策」と分析軸追加指示をシステム
制御プログラム110に入力し、その出力結果、すなわ
ち「対策」を含む分析軸を対応する構成要素“7月―感
染―患者”に追加した際のテキストマイニング結果をデ
ィスプレイ100に表示する。
【0050】分析軸の変更を行う場合には、ユーザは最
新以外のテキストマイニング結果から変更する共起語句
を選択し直す。その結果、ユーザインターフェースプロ
グラム1000はステップ1103で最新のテキストマ
イニング結果から共起語句が選択されていないと判断
し、ステップ1105で、最新以外のテキストマイニン
グ結果から共起語句が選択されていると判断する。そし
てステップ1106で、選択された共起語句を、分析軸
変更指示とともに、システム制御プログラム110に入
力する。最後にステップ1107で、システム制御プロ
グラム110から出力されたテキストマイニング結果を
ディスプレイ100に表示する。図9に示す例は、構成
要素“7月―感染―患者”に分析軸として追加した「対
策」を「症状」に変更する場合の例である。ユーザは、
過去に表示した“7月―感染―患者”の共起語句の中か
ら「症状」を選択し直している。そこでユーザインター
フェースプログラム1000は、この「症状」と分析軸
変更指示をシステム制御プログラム110に入力する。
そして、その出力結果、すなわち「症状」を含む分析軸
を対応する構成要素“7月―感染―患者”に追加した際
のテキストマイニング結果をディスプレイ100に表示
する。なお、このテキストマイニング結果を表示する際
には、過去のテキストマイニング結果と同一の画面に表
示させても良いし、新たな画面を作成して表示させても
良い。また、ユーザからの指示により、過去のテキスト
マイニング結果を消去するようにしてもよい。
【0051】以上が本実施例における処理内容の詳細な
説明である。
【0052】以上説明したように、本実施例におけるテ
キストマイニング結果表示方法によれば、対話的に分析
軸を変更し、多様な視点からの分析が容易に行えるテキ
ストマイニング機能を実現している。こうすることによ
り、ユーザが文書集合の傾向を適切かつ容易に分析する
ことが可能な文書処理システムを提供することが可能と
なる。
【0053】本発明の第三の実施例の原理について図1
2を用いて説明する。
【0054】本実施例は、ユーザが指定した共起語句及
び対応する構成要素と関連の深い代表的な文書を取得す
ることによって、ユーザが文書集合の傾向を把握するこ
とを支援する方法である。
【0055】テキストマイニング結果から指定された共
起語句とともに、代表文書取得指示がユーザから入力さ
れた場合には、指定された共起語句及びその共起語句と
対応する構成要素に含まれる語句でテキストマイニング
対象となった文書集合の検索を行い、得点の高い文書や
最新の文書、指定された書誌情報を持つ文書等を代表文
書として取得する。ここで指定される共起語句は複数で
あってもかまわない。図12に示す例では、構成要素
“7月―感染”と共起する語句から「二次」が選択され
ている。ここで、代表文書取得指示が入力された場合に
は、指定された共起語句及びその共起語句と対応する構
成要素に含まれる語句を抽出し、それらの語句で処理対
象文書集合を検索する。図12に示す例では、指定され
た共起語句「二次」と対応する構成要素に含まれる語句
「7月」、「感染」が抽出され、これらの語句を含む文
書が処理対象文書集合から検索される。ここで用いてい
る検索条件では全ての語句を同じ重みで扱っているが、
分析軸の追加順序に応じて検索語句に重みを付けるよう
にしてもよい。この検索の結果、得点の高い文書や最新
の文書、指定された書誌情報を持つ文書等を代表文書と
して取得する。図12に示す例では、“掲載月:7月
病原性大腸菌「O157」が新たに小学生男児から検出
されたと発表があった。この男児は三日前から腹痛、血
便で入院していた。この男児の弟からO157が検出さ
れていることから、家庭内で二次感染した可能性があ
る。”という文書が代表文書として取得されている。
【0056】以上説明したように、本実施例における方
法によれば、指定された共起語句及び対応する構成要素
と関連の深い代表的な文書を取得している。この代表文
書を閲覧することにより、ユーザが文書集合の傾向を適
切かつ容易に分析することが可能な文書処理システムを
提供することが可能となる。
【0057】本実施例は基本的に第一の実施例(図1)
と同様の構成をとるが、多重分析プログラム116の下
のプログラム構成が異なる。多重分析プログラム116
aの下のプログラム構成を図13に示す。多重分析プロ
グラム116aの下には、図13に示すように、分析軸
追加プログラム117、分析軸変更プログラム118、
多重共起語句取得プログラム119及び代表文書取得プ
ログラム1300が格納される。
【0058】以下、第三の実施例に特有なステップ50
1以下の多重分析プログラム116aによる繰り返し処
理について図14を用いて説明する。
【0059】まずステップ502で、ユーザから分析軸
追加指示が入力されているか否かを判定する。ここで、
分析軸追加指示が入力されていると判断された場合に
は、ステップ503で分析軸追加プログラム117を起
動し、指定された語句を含む分析軸を、指定された構成
要素に追加して、指定された構成要素と追加した分析軸
の構成要素の組を作成するとともに、作成した構成要素
の組の各々と共起する可能性が高い語句を共起語句候補
として分析履歴ファイル108から抽出する。ステップ
502で分析軸追加指示が入力されていないと判断され
た場合には、ステップ504でユーザから分析軸変更指
示が入力されているか否かを判定する。そしてステップ
504で分析軸変更指示が入力されたと判断された場合
には、ステップ505で分析軸変更プログラム118を
起動し、追加した分析軸をユーザの指示に従って変更す
るとともに、構成要素の組と共起する可能性が高い語句
を共起語句候補として分析履歴ファイル108から抽出
する。次にステップ506で多重共起語句取得プログラ
ム119を起動し、ステップ503またはステップ50
5で作成した構成要素の組と予め定められた範囲内で共
起する語句を、ステップ503またはステップ505で
抽出した共起語句候補の中から取得する。そしてこの分
析軸及び共起語句を分析履歴として分析履歴ファイル1
08に記憶する。ここまでは、第一の実施例の処理内容
と同様である。第三の実施例ではさらにステップ140
0で、ユーザから代表文書取得指示が入力されているか
否かを判定する。そしてステップ1400で代表文書取
得指示が入力されたと判断された場合には、ステップ1
401で代表文書取得プログラム1300を起動し、代
表文書の取得処理を実行する。本処理では、テキストマ
イニング結果から指定された共起語句と、その共起語句
に対応する構成要素に含まれる語句で、テキストマイニ
ング対象となった文書集合を検索し、検索結果として得
られた文書を代表文書として取得する。
【0060】ステップ1401における代表文書取得処
理の詳細を、図15に示す。代表文書取得処理では、ま
ずステップ1500で、テキストマイニング結果から指
定された共起語句と、その共起語句に対応する構成要素
に含まれる語句を抽出する。ここで指定される共起語句
は複数であってもかまわない。次にステップ1501
で、ステップ1500で抽出した語句を用いて、テキス
トマイニング対象となった文書集合を検索する。最後に
ステップ1502で、ステップ1501で検索結果とし
て得られた文書の中で、得点の高い文書や最新の文書、
指定された書誌情報を持つ文書等を代表文書として取得
する。
【0061】以上が、本実施例における処理内容の詳細
である。
【0062】以下、第三の実施例に特有な図15に示す
代表文書取得処理の内容を図12を用いて具体的に説明
する。
【0063】代表文書取得処理では、まずステップ15
00で、テキストマイニング結果から指定された共起語
句と、その共起語句に対応する構成要素に含まれる語句
を抽出する。ここで指定される共起語句は複数であって
もかまわない。図12に示す例は、“7月―感染”と共
起する語句「二次」が選択され、代表文書取得指示が入
力された場合の例である。そのため、指定された共起語
句「二次」と、対応する構成要素に含まれる語句「7
月」、「感染」が抽出される。次にステップ1501
で、ステップ1500で抽出した語句を用いて、テキス
トマイニング対象となった文書集合を検索する。図12
に示す例では、「“二次”and“7月”and“感染”」と
いう検索条件で検索が行われている。これは、「“二
次”を含み、かつ、“7月”を含み、かつ、“感染”を
含む文書」を探し出すことを意味する。ここで用いてい
る検索条件では全ての検索語句を同じ重みで扱っている
が、分析軸の追加順序に応じて検索語句に重みを付ける
ようにしてもよい。最後にステップ1502で、ステッ
プ1501で検索結果として得られた文書の中で、得点
の高い文書や最新の文書、指定された書誌情報を持つ文
書等を代表文書として取得する。図12に示す例では、
“掲載月:7月 病原性大腸菌「O157」が新たに小
学生男児から検出されたと発表があった。この男児は三
日前から腹痛、血便で入院していた。この男児の弟から
O157が検出されていることから、家庭内で二次感染
した可能性がある。”という文書が代表文書として取得
されている。
【0064】以上説明したように、本実施例における方
法によれば、指定された共起語句及び対応する構成要素
と関連の深い代表的な文書を取得している。この代表文
書を閲覧することにより、ユーザが文書集合の傾向を適
切かつ容易に分析することが可能な文書処理システムを
提供することが可能となる。
【0065】以上の実施例によれば、分析軸及び分析結
果を分析履歴として保存しておくとともに、分析軸の指
定された構成要素に異なる分析軸を追加し、指定された
構成要素と追加した分析軸の構成要素の組の各々と共起
する語句を取得するようにしている。この結果、多種多
様な視点から分析することができるテキストマイニング
機能を提供することが可能となり、ユーザが文書集合の
傾向を適切かつ容易に分析することが可能な文書処理シ
ステムを実現することができる。
【0066】
【発明の効果】本発明によれば、複数の視点から分析す
ることができるテキストマイニング機能を提供すること
が可能となる。
【図面の簡単な説明】
【図1】本発明の第一の実施例の構成を示す図
【図2】従来技術1の処理内容を示す図
【図3】従来技術1の処理内容を示すPAD図
【図4】本発明の第一の実施例の処理内容を示す図
【図5】本発明の第一の実施例の処理内容を示すPAD図
【図6】本発明の第一の実施例における処理対象文書集
合設定処理、特徴語句抽出処理、分析軸設定処理および
共起語句取得処理の内容を示す図
【図7】本発明の第一の実施例における分析軸追加処理
の内容を示す図
【図8】本発明の第一の実施例における分析軸変更処理
の内容を示す図
【図9】本発明の第二の実施例の処理内容を示す図
【図10】本発明の第二の実施例における主記憶装置1
09aに格納されるプログラムの構成を示す図
【図11】本発明の第二の実施例の処理内容を示すPAD
【図12】本発明の第三の実施例の処理内容を示す図
【図13】本発明の第三の実施例における多重分析プロ
グラム116aの制御下のプログラムの構成を示す図
【図14】本発明の第三の実施例における多重分析プロ
グラム116aの処理内容を示すPAD図
【図15】本発明の第三の実施例における代表文書取得
処理の内容を示すPAD図
【符号の説明】 100・・・ディスプレイ、 101・・・キーボード、 102・・・CPU 、 103・・・バス、 104・・・フロッピディスクドライバ、 105・・・フロッピディスク、 106・・・磁気ディスク装置、 107・・・テキストファイル、 108・・・分析履歴ファイル、 109・・・主記憶装置、 109a・・・主記憶装置、 110・・・システム制御プログラム、 111・・・処理対象文書集合設定プログラム、 112・・・検索プログラム、 113・・・特徴語句抽出プログラム、 114・・・分析軸設定プログラム、 115・・・共起語句取得プログラム、 116・・・多重分析プログラム、 116a・・・多重分析プログラム、 117・・・分析軸追加プログラム、 118・・・分析軸変更プログラム、 119・・・多重共起語句取得プログラム、 120・・・ワークエリア、 1000・・・ユーザインタフェースプログラム、 1300・・・代表文書取得プログラム
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松林 忠孝 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション開 発本部内 (72)発明者 山口 明彦 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション開 発本部内 (72)発明者 稲場 靖彦 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション開 発本部内 (72)発明者 徳永 幹彦 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B075 ND03 NK32 NK39 NS01 PP24 QP05

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】予め登録された文書の集合を対象として、
    その全体または一部分を取り出した処理対象文書集合に
    特徴的に出現する語句を抽出する特徴語句抽出ステップ
    と、指定された語句または書誌情報を含む定義情報を設
    定する定義情報設定ステップと、該特徴語句抽出ステッ
    プで抽出した語句の中から該定義情報に含まれる語句ま
    たは書誌情報と予め定められた範囲内で共起する共起語
    句を取得する共起語句取得ステップを有するテキストマ
    イニング方法において、 複数の異なる定義情報を有し、該複数の定義情報の各々
    から取得した個々の語句または書誌情報と予め定められ
    た範囲内で共起する共起語句を取得する多重共起語句取
    得ステップを有することを特徴としたテキストマイニン
    グ方法。
  2. 【請求項2】請求項1記載のテキストマイニング方法に
    おいて、 前記処理対象文書集合は、語句または文章または文書を
    検索条件として用いて検索を行うことにより得られた文
    書集合であることを特徴としたテキストマイニング方
    法。
  3. 【請求項3】請求項1または請求項2記載のテキストマ
    イニング方法において、 指定された語句または書誌情報を含む定義情報を追加す
    る定義情報追加ステップと、 指定された定義情報に含まれる語句または書誌情報を、
    指定された語句または書誌情報に変更する定義情報変更
    ステップの、両方とも、またはいずれか一方を有するこ
    とを特徴としたテキストマイニング方法。
  4. 【請求項4】請求項3記載のテキストマイニング方法に
    おいて、 前記共起語句取得ステップは、前記共起語句及び該共起
    語句と予め定められた範囲内で共起する前記定義情報に
    含まれる語句または書誌情報を、分析履歴として記憶す
    る分析履歴記憶ステップを有し、 前記定義情報追加ステップは、前記定義情報を追加する
    前の前記複数の定義情報の各々から取得した個々の語句
    または書誌情報と共起するとして取得した共起語句を、
    該分析履歴から抽出して、前記多重共起語句取得ステッ
    プの共起語句の候補とする追加前共起語句抽出ステップ
    を有し、 前記定義情報変更ステップは、前記変更した定義情報を
    追加する前の前記複数の定義情報の各々から取得した個
    々の語句または書誌情報と共起するとして取得した共起
    語句を、該分析履歴から抽出して、前記多重共起語句取
    得ステップの共起語句の候補とする変更前共起語句抽出
    ステップを有し、 前記多重共起語句取得ステップは、該追加前共起語句抽
    出ステップまたは該変更前共起語句抽出ステップによっ
    て取得した共起語句の候補の中から、前記複数の定義情
    報の各々から取得した個々の語句または書誌情報と予め
    定められた範囲内で共起する共起語句を取得する共起語
    句確定ステップと、 該共起語句及び該共起語句と予め定められた範囲内で共
    起する該複数の定義情報の各々から取得した個々の語句
    または書誌情報を、該分析履歴として記憶する多重分析
    履歴記憶ステップを有することを特徴としたテキストマ
    イニング方法。
  5. 【請求項5】請求項1または請求項2記載のテキストマ
    イニング方法において、 前記共起語句取得ステップは、前記定義情報に含まれる
    語句または書誌情報と指定された位置関係を満たして共
    起する共起語句を取得する指定位置語句抽出ステップを
    有することを特徴としたテキストマイニング方法。
  6. 【請求項6】請求項1または請求項2記載のテキストマ
    イニング方法において、 前記多重共起語句取得ステップは、前記複数の定義情報
    の各々から取得した個々の語句または書誌情報と指定さ
    れた位置関係を満たして共起する共起語句を取得する複
    数指定位置語句抽出ステップを有することを特徴とした
    テキストマイニング方法。
  7. 【請求項7】請求項3記載のテキストマイニング方法に
    おいて、 前記定義情報追加ステップは、最新のテキストマイニン
    グ表示結果から共起語句が指定された場合には、該共起
    語句を含む定義情報を追加する語句追加ステップを有
    し、 前記定義情報変更ステップは、最新以外のテキストマイ
    ニング表示結果から共起語句が指定された場合には、指
    定された定義情報に含まれる語句または書誌情報を、指
    定された共起語句に変更する語句変更ステップを有し、 前記多重共起語句取得ステップは、前記複数の定義情報
    の各々から取得した個々の語句または書誌情報と予め定
    められた範囲内で共起する共起語句を取得し、表示する
    多重共起語句表示ステップを有することを特徴としたテ
    キストマイニング方法。
  8. 【請求項8】請求項1または請求項2記載のテキストマ
    イニング方法において、 指定された共起語句、及び該共起語句と指定された範囲
    内で共起する前記定義情報に含まれる語句または書誌情
    報と関連の深い文書を前記処理対象文書集合から取得す
    る代表文書取得ステップを有することを特徴としたテキ
    ストマイニング方法。
  9. 【請求項9】請求項1または請求項2記載のテキストマ
    イニング方法において、 指定された共起語句、及び該共起語句と指定された範囲
    内で共起する前記複数の定義情報の各々から取得した個
    々の語句または書誌情報と関連の深い文書を前記処理対
    象文書集合から取得する代表文書取得ステップを有する
    ことを特徴としたテキストマイニング方法。
  10. 【請求項10】請求項9記載のテキストマイニング方法
    において、 前記代表文書取得ステップは、前記指定された共起語
    句、及び該共起語句と指定された範囲内で共起する前記
    複数の定義情報の各々から取得した個々の語句または書
    誌情報を抽出する検索用語句抽出ステップと、 前記処理対象文書集合の中で、該検索用語句抽出ステッ
    プで抽出した語句または書誌情報と関連の深い文書を検
    索する関連文書検索ステップと、 該関連文書検索ステップで検索結果として得られた文書
    の中で、該検索用語句抽出ステップで抽出した語句また
    は書誌情報との関連度が高い文書を代表文書として抽出
    する代表文書抽出ステップを有することを特徴としたテ
    キストマイニング方法。
  11. 【請求項11】請求項10記載のテキストマイニング方
    法において、 前記関連文書検索ステップは、前記検索用語句抽出ステ
    ップで抽出した語句または書誌情報に、前記複数の定義
    情報への追加順に重みを付けて関連の深い文書を検索す
    る重み付き関連文書検索ステップであることを特徴とし
    たテキストマイニング方法。
  12. 【請求項12】請求項10記載のテキストマイニング方
    法において、 前記代表文書抽出ステップは、関連度の高い文書に替え
    て、最新の登録日付を持つ文書を代表文書として抽出す
    ることを特徴としたテキストマイニング方法。
  13. 【請求項13】請求項10記載のテキストマイニング方
    法において、 前記代表文書抽出ステップは、関連度の高い文書に替え
    て、指定された書誌情報を持つ文書を代表文書として抽
    出することを特徴としたテキストマイニング方法。
  14. 【請求項14】予め登録された文書の集合を対象とし
    て、その全体または一部分を取り出した処理対象文書集
    合に特徴的に出現する語句を抽出する特徴語句抽出手段
    と、指定された語句または書誌情報を含む定義情報を設
    定する定義情報設定手段と、該特徴語句抽出手段で抽出
    した語句の中から該定義情報に含まれる語句または書誌
    情報と予め定められた範囲内で共起する共起語句を取得
    する共起語句取得手段を備えるテキストマイニング装置
    において、 複数の異なる定義情報を備え、該複数の定義情報の各々
    から取得した個々の語句または書誌情報と予め定められ
    た範囲内で共起する共起語句を取得する多重共起語句取
    得手段を備えることを特徴としたテキストマイニング装
    置。
  15. 【請求項15】予め登録された文書の集合を対象とし
    て、その全体または一部分を取り出した処理対象文書集
    合に特徴的に出現する語句を抽出する特徴語句抽出モジ
    ュールと、指定された語句または書誌情報を含む定義情
    報を設定する定義情報設定モジュールと、該特徴語句抽
    出モジュールで抽出した語句の中から該定義情報に含ま
    れる語句または書誌情報と予め定められた範囲内で共起
    する共起語句を取得する共起語句取得モジュールを含む
    テキストマイニングシステムを構築するためのプログラ
    ムを格納した記憶媒体において、 該プログラムにおいて、複数の異なる定義情報を含み、
    該複数の定義情報の各々から取得した個々の語句または
    書誌情報と予め定められた範囲内で共起する共起語句を
    取得する多重共起語句取得モジュールを含むことを特徴
    とした記憶媒体。
JP2000142231A 2000-05-09 2000-05-09 文書処理方法及び装置並びにその処理プログラムを記憶した媒体 Pending JP2001318939A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2000142231A JP2001318939A (ja) 2000-05-09 2000-05-09 文書処理方法及び装置並びにその処理プログラムを記憶した媒体
DE60040968T DE60040968D1 (de) 2000-05-09 2000-08-28 Verfahren, System und rechnerlesbares Speichermedium zur Verarbeitung von Dokumenten
EP00118624A EP1154355B1 (en) 2000-05-09 2000-08-28 Document processing method, system and computer readable storage medium
US09/649,961 US6757676B1 (en) 2000-05-09 2000-08-29 Text mining method and apparatus allowing a user to analyze contents of a document set from plural analysis axes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000142231A JP2001318939A (ja) 2000-05-09 2000-05-09 文書処理方法及び装置並びにその処理プログラムを記憶した媒体

Publications (1)

Publication Number Publication Date
JP2001318939A true JP2001318939A (ja) 2001-11-16

Family

ID=18649243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000142231A Pending JP2001318939A (ja) 2000-05-09 2000-05-09 文書処理方法及び装置並びにその処理プログラムを記憶した媒体

Country Status (4)

Country Link
US (1) US6757676B1 (ja)
EP (1) EP1154355B1 (ja)
JP (1) JP2001318939A (ja)
DE (1) DE60040968D1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014002653A (ja) * 2012-06-20 2014-01-09 Ntt Docomo Inc 共起語を特定する装置およびプログラム
JP2016081412A (ja) * 2014-10-21 2016-05-16 日本電気株式会社 情報処理システム、情報処理プログラム、及び、情報処理方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7395222B1 (en) * 2000-09-07 2008-07-01 Sotos John G Method and system for identifying expertise
JP2003085204A (ja) * 2001-09-11 2003-03-20 Ricoh Co Ltd 文書処理管理装置
US7257530B2 (en) * 2002-02-27 2007-08-14 Hongfeng Yin Method and system of knowledge based search engine using text mining
US7877383B2 (en) * 2005-04-27 2011-01-25 Microsoft Corporation Ranking and accessing definitions of terms
US7689411B2 (en) * 2005-07-01 2010-03-30 Xerox Corporation Concept matching
US7809551B2 (en) * 2005-07-01 2010-10-05 Xerox Corporation Concept matching system
US8745054B1 (en) 2005-11-30 2014-06-03 At&T Intellectual Property Ii, L.P. Method and apparatus for large volume text summary and visualization
WO2007066704A1 (ja) * 2005-12-09 2007-06-14 Nec Corporation テキストマイニング装置、テキストマイニング方法、および、テキストマイニングプログラム
US8260619B1 (en) 2008-08-22 2012-09-04 Convergys Cmg Utah, Inc. Method and system for creating natural language understanding grammars
US8577884B2 (en) * 2008-05-13 2013-11-05 The Boeing Company Automated analysis and summarization of comments in survey response data
SG11201402943WA (en) * 2011-12-06 2014-07-30 Perception Partners Inc Text mining analysis and output system
US9448994B1 (en) 2013-03-13 2016-09-20 Google Inc. Grammar extraction using anchor text
US9996527B1 (en) 2017-03-30 2018-06-12 International Business Machines Corporation Supporting interactive text mining process with natural language and dialog

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062074A (en) * 1986-12-04 1991-10-29 Tnet, Inc. Information retrieval system and method
US5546516A (en) * 1994-12-14 1996-08-13 International Business Machines Corporation System and method for visually querying a data set exhibited in a parallel coordinate system
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
JP4155363B2 (ja) * 1997-06-19 2008-09-24 富士通株式会社 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
JP3478725B2 (ja) * 1997-07-25 2003-12-15 株式会社リコー 文書情報管理システム
US6006223A (en) * 1997-08-12 1999-12-21 International Business Machines Corporation Mapping words, phrases using sequential-pattern to find user specific trends in a text database
JP3429184B2 (ja) * 1998-03-19 2003-07-22 シャープ株式会社 テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
US6532469B1 (en) * 1999-09-20 2003-03-11 Clearforest Corp. Determining trends using text mining

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014002653A (ja) * 2012-06-20 2014-01-09 Ntt Docomo Inc 共起語を特定する装置およびプログラム
JP2016081412A (ja) * 2014-10-21 2016-05-16 日本電気株式会社 情報処理システム、情報処理プログラム、及び、情報処理方法

Also Published As

Publication number Publication date
EP1154355A2 (en) 2001-11-14
US6757676B1 (en) 2004-06-29
EP1154355B1 (en) 2008-12-03
EP1154355A3 (en) 2004-01-14
DE60040968D1 (de) 2009-01-15

Similar Documents

Publication Publication Date Title
US7587420B2 (en) System and method for question answering document retrieval
Jansen et al. Real life, real users, and real needs: a study and analysis of user queries on the web
US8275776B2 (en) Method and apparatus for enhancing electronic reading by identifying relationships between sections of electronic text
US6078917A (en) System for searching internet using automatic relevance feedback
WO2016027714A1 (ja) 質問文生成装置及びコンピュータプログラム
US9323827B2 (en) Identifying key terms related to similar passages
Beirade et al. Semantic query for Quranic ontology
JP2001318939A (ja) 文書処理方法及び装置並びにその処理プログラムを記憶した媒体
JP2009169541A (ja) Webページ検索サーバ及びクエリ推薦方法
JP2002245070A (ja) データ表示方法及び装置並びにその処理プログラムを記憶した媒体
Rasolofo et al. Result merging strategies for a current news metasearcher
US20080065621A1 (en) Ambiguous entity disambiguation method
Hanum et al. Using topic analysis for querying halal information on Malay documents
Gupta A survey of text summarizers for Indian Languages and comparison of their performance
Kumova Metin et al. Measuring collocation tendency of words
JPH11154164A (ja) 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体
JP2006293616A (ja) 文書集約方法及び装置及びプログラム
Lazarinis et al. Improving non-English web searching (iNEWS07)
Ådland et al. Subject Cataloging by Norwegian Cataloging Agencies
Sadeghi et al. How well does Google work with Persian documents?
JPH10207904A (ja) 知識情報検索システムおよび知識情報検索方法
JP6188226B2 (ja) 関連語抽出装置、及びプログラム
Manjula et al. Developing online search strategy skills for effective information retrieval: An activity-based approach
JP3256614B2 (ja) 情報提示装置
JP4808181B2 (ja) ウェブページ情報処理装置、ウェブページ情報処理方法、及びウェブページ情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040521

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040902

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041111

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20041210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060427