JP5367869B2

JP5367869B2 - 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法

Info

Publication number: JP5367869B2
Application number: JP2012103996A
Authority: JP
Inventors: 圭司新里
Original assignee: Rakuten Inc
Current assignee: Rakuten Group Inc
Priority date: 2012-04-27
Filing date: 2012-04-27
Publication date: 2013-12-11
Anticipated expiration: 2032-04-27
Also published as: WO2013161397A1; TW201407386A; EP2849094A4; ES2650467T3; US9740770B2; TWI442247B; US20150006533A1; JP2013232111A; EP2849094A1; EP2849094B1

Description

本発明は、集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法に関する。

従来から、入力された複数のテキストから、互いに表現が異なるが同じ特徴的な内容を表す複数のテキストを検索できるテキストマイニング装置が知られている（例えば、特許文献１）。このテキストマイニング装置は、同じ特徴的な内容を表す異なる複数の表現を互いに対応付けて記憶しており、所定の表現に対応付けられた表現が入力テキストに含まれている場合に、当該表現を所定の表現に置換してから、所定の表現を含むテキストを検索する。

特許第４８１５９３４号公報

ここで、特許文献１の技術では、入力された複数の文などのテキストにおいてどのような表現がどれだけ使用されたかを集計できないという問題があった。

本発明は、このような問題点に鑑みてなされたものであり、その目的とするところは、入力された複数の文においてどのような表現がどれだけ使用されたかを集計できる集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法を提供することにある。

上記目的を達成するため、本発明の第１の観点に係る集計装置は、
入力された文を集計する集計装置であって、
第１文と第２文とを入力する入力部と、
前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析部と、
前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成部と、
前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別部と、
前記互いに一致した内容を表すと判別された第１表現と第２表現との１の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第１表現と第２表現との複数の組み合わせのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類部と、
前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の部分木でそれぞれ表される表現を出力する出力部と、を備える、
ことを特徴とする。

また、第１の観点に係る集計装置において、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木と、当該部分木組み合わせを構成する第２部分木と、が、高さと、枝数と、根及び１若しくは複数の葉にそれぞれ割り当てられた文節と、の全てにおいて一致する場合に、当該第１部分木で表される第１表現と、当該第２部分木で表される第２表現と、が一致していると判別する、
としても良い。

また、第１の観点に係る集計装置において、
前記部分木生成部は、前記生成された第１文の構文木から、前記第１文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第１部分木を１若しくは複数生成し、かつ前記生成された第２文の構文木から、前記第２文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第２部分木を１若しくは複数生成し、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木の係り文節と、当該部分木組み合わせを構成する第２部分木の係り文節と、が、一致しているか否か、及び当該第１部分木の受け文節と、当該第２部分木の受け文節と、が、一致しているか否か、に基づいて、当該第１部分木で表される第１表現と当該第２部分木で表される第２表現とが一致した内容を表すか否かを判別する、
としても良い。

また、第１の観点に係る集計装置において、
前記一致判別部は、１若しくは複数の部分木がそれぞれ分類された第１グループと第２グループとの組み合わせである１のグループ組み合わせ、若しくは、複数のグループ組み合わせのそれぞれについて、当該第１グループと当該第２グループとの間の包含関係を、当該第１グループに属する部分木の高さ、枝数、及び文節の数と、当該第２グループに属する部分木の高さ、枝数、及び文節の数と、に基づいて判別し、
前記出力部は、当該第１グループに分類された１の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、当該第２グループに分類された１の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、を、前記判別された包含関係に基づいて配列して出力する、
としても良い。

また、第１の観点に係る集計装置において、
前記一致判別部は、前記１のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、第１グループに分類された部分木が有する係り文節の数が、第２グループに分類された部分木が有する係り文節の数より少ないグループ組み合わせについて、当該第１グループに分類された部分木が有する係り文節の全てが、当該第２グループに分類された部分木が有する係り文節のいずれかと一致すると、当該第１グループに分類された部分木で表される表現は、当該第２グループに分類された部分木で表される表現よりも上位の表現であると判別し、
前記分類部は、前記１のグループ組み合わせ、若しくは、前記複数のグループ組み合わせのそれぞれについて、当該グループ組み合わせを構成する第１グループに分類された部分木が表す表現が、当該グループ組み合わせを構成する第２グループに分類された部分木が表す表現よりも上位の表現であると判別されると、当該第１グループを、当該第２グループより上位のグループとする、
としても良い。

また、第１の観点に係る集計装置において、
前記一致判別部は、前記１のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、受け文節と係り文節とを有する部分木が分類された第１グループと、受け文節と係り文節と当該係り文節に係る文節とを有する部分木が分類された第２グループと、で構成されるグループ組み合わせについて、当該第１グループに分類された部分木の受け文節と、当該第２グループに分類された部分木の受け文節と、が一致し、かつ当該第１グループに分類された部分木の係り文節と、当該第２グループに分類された部分木の係り文節と、が一致すると判別すると、当該第１グループに分類された部分木で表される表現は、当該第２グループに分類された部分木で表される表現よりも上位の表現であると判別する、
としても良い。

さらに、第１の観点に係る集計装置において、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、
当該部分木組み合わせを構成する第１部分木の係り文節が、当該部分木組み合わせを構成する第２部分木の係り文節の同義語である場合、当該第１部分木の係り文節と当該第２部分木の係り文節との相違が活用の相違である場合、及び当該第１部分木の係り文節と当該第２部分木の係り文節との相違が表記の相違である場合のいずれかの場合に、当該第１部分木の係り文節と当該第２部分木の係り文節とが一致する、と判別し、
当該第１部分木の受け文節が、当該第１部分木の受け文節の同義語である場合、当該第１部分木の受け文節と当該第２部分木の受け文節との相違が活用の相違である場合、及び当該第１部分木の受け文節と当該第２部分木の受け文節との相違が表記の相違である場合のいずれかの場合に、当該第１部分木の受け文節と当該第２部分木の受け文節とが一致する、と判別する、
としても良い。

さらに、第１の観点に係る集計装置において、
前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木の係り文節の末尾が助詞の「と」若しくは「とは」であり、当該第１部分木の係り文節が用言を含み、肯定表現を含み、当該第１部分木の係り文節と当該第１部分木の受け文節との間に句読点「、」若しくは「，」が無く、かつ当該第１部分木の受け文節が否定表現を含む場合に、当該受け文節を肯定表現に変換し、かつ当該係り文節を否定表現に変換する文節変換部、をさらに備え、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する、前記変換された第１部分木の係り文節と、当該部分木組み合わせを構成する第２部分木の係り文節と、が、一致しているか否か、及び当該変換された第１部分木の受け文節と、当該第２部分木の受け文節と、が、一致しているか否か、を判別する、
としても良い。

さらに、第１の観点に係る集計装置において、
前記入力部は、質問に対する回答文である第１文及び第２文を入力し、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせの内で、受け文節と所定数の係り文節とを有する第１部分木と、受け文節と前記所定数の係り文節とを有する第２部分木と、で構成される部分木組み合わせについて、当該第１部分木が有する前記所定数の係り文節のそれぞれが、当該第２部分木が有する前記所定数の係り文節のそれぞれに一致すると判別すると、当該第１部分木が有する受け文節と当該第２部分木が有する受け文節とが一致していると判別する、
としても良い。

上記目的を達成するため、本発明の第２の観点に係る集計プログラムは、
コンピュータを、
第１文と第２文とを入力する入力部、
前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析部、
前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成部、
前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された１の第１表現と第２表現、若しくは、複数の第１表現と第２表現とのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする。

上記目的を達成するため、本発明の第３の観点に係るコンピュータ読み取り可能な記録媒体は、
コンピュータを、
第１文と第２文とを入力する入力部、
前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析部、
前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成部、
前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された１の第１表現と第２表現、若しくは、複数の第１表現と第２表現とのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラムを記録している。

上記目的を達成するため、本発明の第４の観点に係る集計方法は、
入力部、構文解析部、部分木生成部、一致判別部、分類部、及び出力部を備える集計装置が実行する方法であって、
前記入力部が、第１文と第２文とを入力する入力ステップと、
前記構文解析部が、前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析ステップと、
前記部分木生成部が、前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成ステップと、
前記一致判別部が、前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別ステップと、
前記分類部が、前記互いに一致した内容を表すと判別された１の第１表現と第２表現、若しくは、複数の第１表現と第２表現とのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類ステップと、
前記出力部が、前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力ステップと、を有する、
ことを特徴とする。

本発明に係る集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法によれば、入力された複数の文においてどのような表現がどれだけ使用されたかを集計できる。

集計システムの一構成例を表すシステム構成図である。質問画面の一例を表す図である。実施例１における集計結果画面の一例を表す図である。本発明の実施例に係る集計装置の一例を表すハードウェア構成図である。実施例１に係る集計装置が実行する集計処理の一例を表すフローチャートである。実施例１に係る集計装置が有する機能の一例を表す機能ブロック図である。（ａ）は、完全木の一例を表す図である。（ｂ）は、部分木の第一例を表す図である。（ｃ）は、部分木の第二例を表す図である。（ｄ）は、部分木の第三例を表す図である。（ｅ）は、部分木の第四例を表す図である。（ｆ）は、部分木の第五例を表す図である。（ｇ）は、部分木の第六例を表す図である。（ａ）は、互いに完全に一致する部分木の第一例を表す図である。（ｂ）は、互いに完全に一致する部分木の第二例を表す図である。（ａ）は、互いに実質的に一致する部分木の第一例を表す図である。（ｂ）は、互いに実質的に一致する部分木の第二例を表す図である。互いに実質的に一致する部分木の第三例を表す図である。実施例１において集計装置が記憶する入力文テーブルの一例を表す図である。集計装置が記憶する文節テーブルの一例を表す図である。集計装置が記憶する部分木テーブルの一例を表す図である。（ａ）は、集計装置が記憶する表記テーブルの一例を表す図である。（ｂ）は、集計装置が記憶する同義語テーブルの一例を表す図である。（ｃ）は、集計装置が記憶する活用テーブルの一例を表す図である。集計装置が記憶するグループテーブルの一例を表す図である。集計装置が記憶する包含関係テーブルの一例を表す図である。集計装置が記憶する階層構造テーブルの一例を表す図である。（ａ）は、完全木ＦＴ１を表す図である。（ｂ）は、部分木ＰＴ１０を表す図である。（ｃ）は、部分木ＰＴ１１を表す図である。（ｄ）は、部分木ＰＴ１２を表す図である。（ｅ）は、部分木ＰＴ１３を表す図である。（ｆ）は、部分木ＰＴ１４を表す図である。（ｇ）は、部分木ＰＴ１５を表す図である。（ａ）は、完全木ＦＴ２を表す図である。（ｂ）は、完全木ＰＴ２０を表す図である。（ｃ）は、部分木ＰＴ２１を表す図である。（ｄ）は、部分木ＰＴ２２を表す図である。（ｅ）は、部分木ＰＴ２３を表す図である。（ｆ）は、部分木ＰＴ２４を表す図である。（ｇ）は、部分木ＰＴ２５を表す図である。（ａ）は、完全木ＦＴ３を表す図である。（ｂ）は、完全木ＰＴ３０を表す図である。（ｃ）は、部分木ＰＴ３１を表す図である。（ｄ）は、部分木ＰＴ３２を表す図である。（ａ）は、完全木ＦＴ４を表す図である。（ｂ）は、完全木ＦＴ５を表す図である。（ｃ）は、完全木ＦＴ６を表す図である。（ｄ）は、完全木ＰＴ４０を表す図である。（ｅ）は、完全木ＰＴ５０を表す図である。（ｆ）は、完全木ＰＴ６０を表す図である。集計装置が実行する部分木分類処理の一例を表すフローチャートである。実施例１において、部分木分類処理を実行した後におけるグループの分類結果の一例を表す図である。集計装置が実行する部分木集計処理の一例を表すフローチャートである。集計装置が実行する包含関係特定処理の一例を表すフローチャートである。集計装置が実行するグループ分類処理の一例を表すフローチャートである。実施例１においてグループ分類処理を実行した後におけるグループの分類結果の一例を表す図である。実施例２において一致すると判別される第１部分木と第２部分木との一例を表す図である。実施例３に係る集計装置が実行する集計処理の一例を表すフローチャートである。実施例３に係る集計装置が有する機能の一例を表す機能ブロック図である。（ａ）は、実施例３に係る集計装置が変換する部分木の第一例を表す図である。（ｂ）は、実施例３に係る集計装置が変換した部分木の一例を表す図である。（ｃ）は、実施例３に係る集計装置が変換する部分木の第二例を表す図である。（ａ）は、実施例３に係る集計装置が変換しない部分木の一例を表す図である。（ｂ）は、図３２（ａ）に示す部分木と異なる意味内容を表す部分木の一例を表す図である。実施例５において集計装置が記憶する入力文テーブルの一例を表す図である。（ａ）は、完全木ＦＴ１１を表す図である。（ｂ）は、部分木ＰＴ１１０を表す図である。（ｃ）は、部分木ＰＴ１１１を表す図である。（ｄ）は、部分木ＰＴ１１２を表す図である。（ｅ）は、完全木ＰＴ１２を表す図である。（ｆ）は、部分木ＰＴ１２０を表す図である。（ｇ）は、完全木ＦＴ１３を表す図である。（ｈ）は、部分木ＰＴ１３０を表す図である。（ａ）は、完全木ＦＴ１４を表す図である。（ｂ）は、部分木ＰＴ１４０を表す図である。（ｃ）は、部分木ＰＴ１４１を表す図である。（ｄ）は、完全木ＦＴ１５を表す図である。（ｅ）は、部分木ＰＴ１５０を表す図である。（ｆ）は、部分木ＰＴ１５１を表す図である。（ｇ）は、完全木ＦＴ１６を表す図である。（ｈ）は、部分木ＰＴ１６０を表す図である。（ｉ）は、部分木ＰＴ１６１を表す図である。（ａ）は、完全木ＦＴ１７を表す図である。（ｂ）は、部分木ＰＴ１７０を表す図である。（ｃ）は、部分木ＰＴ１７１を表す図である。（ｄ）は、完全木ＦＴ１８を表す図である。（ｅ）は、部分木ＰＴ１８０を表す図である。（ｆ）は、部分木ＰＴ１８１を表す図である。実施例５において、部分木分類処理を実行した後におけるグループの分類結果の一例を表す図である。実施例５においてグループ分類処理を実行した後におけるグループの分類結果の一例を表す図である。実施例５における集計結果画面の一例を表す図である。実施例５における集計結果画面の他例を表す図である。

以下、本発明の実施例について添付図面を参照しつつ説明する。

＜実施例１＞
本発明の実施例１に係る集計装置１００は、図１に示すような集計システム１を構成する。集計システム１は、アンケートに対するユーザの回答を集計する。

集計システム１は、集計装置１００の他に、コンピュータ通信網１０（以下単に、通信網１０という）と、端末装置２０及び２１と、で構成される。

通信網１０は、例えば、インターネットで構成される。通信網１０は、ＬＡＮ（Local Area Network）又は公衆回線網であっても良い。

端末装置２０及び２１は、互いに同様の構成を有し、同様の動作を行うため、以下主に、端末装置２０について説明を行う。

端末装置２０は、例えば、ＬＣＤ（Liquid Crystal Display）などの表示部と、キーボード及びマウスなどの入力部と、を備えたパーソナル・コンピュータで構成される。

端末装置２０は、図２に示すようなアンケートの質問を表示する質問画面を表示する。端末装置２０は、入力部をユーザに操作されると、当該操作に応じて質問に対するユーザの回答を入力し、入力された回答を集計装置１００へ送信する。その後、端末装置２０は、集計装置１００から回答の集計結果を受信し、受信した集計結果を表示する、図３に示すような集計結果画面を表示部に表示する。

集計装置１００は、図４に示すようなサーバ機で構成され、ＣＰＵ（Central Processing Unit）１０１、ＲＯＭ（Read Only Memory）１０２、ＲＡＭ（Random Access Memory）１０３、ハードディスク１０４、メディアコントローラ１０５、ＬＡＮ（Local Area Network）カード１０６、ビデオカード１０７、ＬＣＤ（Liquid Crystal Display）１０８、キーボード１０９、スピーカ１１０、及びタッチパッド１１１で構成される。

ＣＰＵ１０１は、ＲＯＭ１０２又はハードディスク１０４に保存されたプログラムに従ってプログラムを実行することで、集計装置１００の全体制御を行う。ＲＡＭ１０３は、ＣＰＵ１０１によるプログラムの実行時において、処理対象とするデータを一時的に記憶するワークメモリである。

ハードディスク１０４は、各種のデータを保存したテーブルを記憶する情報記憶部である。尚、集計装置１００は、ハードディスク１０４の代わりに、フラッシュメモリを備えても良い。

メディアコントローラ１０５は、フラッシュメモリ、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、及びブルーレイディスク（Blu-ray Disc）（登録商標）を含む記録媒体から各種のデータ及びプログラムを読み出す。

ＬＡＮカード１０６は、通信網１０を介して接続する端末装置２０及び２１との間でデータを送受信する。キーボード１０９及びタッチパッド１１１は、ユーザの操作に応じた信号を入力する。

ビデオカード１０７は、ＣＰＵ１０１から出力されたデジタル信号に基づいて画像を描画（つまり、レンダリング）すると共に、描画された画像を表す画像信号を出力する。ＬＣＤ１０８は、ビデオカード１０７から出力された画像信号に従って画像を表示する。なお、集計装置１００は、ＬＣＤ１０８の代わりに、ＰＤＰ（Plasma Display Panel）又はＥＬ（Electroluminescence）ディスプレイを備えても良い。スピーカ１１０は、ＣＰＵ１０１から出力された信号に基づいて音声を出力する。

次に、集計装置１００の有する機能について説明する。
ＣＰＵ１０１は、アンケートの回答を集計する、図５に示す集計処理を実行する。これにより、ＣＰＵ１０１は、図６に示す入力部１２０、保存部１２１、構文解析部１２２、部分木生成部１２３、一致判別部１２４、分類部１２５、集計部１２６、及び出力部１２７として機能する。また、ＣＰＵ１０１は、図４に示したハードディスク１０４と協働して、情報記憶部１２９として機能する。

入力部１２０は、図４に示すＬＡＮカード１０６が端末装置２０若しくは２１から受信したアンケートの回答文を入力する。保存部１２１は、入力された文を情報記憶部１２９へ保存する。構文解析部１２２は、情報記憶部１２９に保存された文を構文解析して、文を表す構文木を生成する。

ここで、集計装置１００が有する機能についての説明を一旦中断し、構文解析部１２２が生成する構文木について、図７（ａ）に示す構文木を例に挙げて説明する。

図７（ａ）に示す構文木は、「靴下の汚れが綺麗に落ちる。」という文を表す構文木である。この構文木のルートノードは文節「落ちる」であり、ルートノードの子ノードは文節「汚れが」と文節「綺麗に」とであり、文節「汚れが」の子ノードは文節「靴下の」である。これは、文節「靴下の」が、文節「汚れ」を修飾し、文節「汚れが」と文節「綺麗に」とが、文節「落ちる」を修飾するためである。

このように、他の文節に係る（つまり、修飾する）文節を係り文節といい、係り文節を受ける（つまり、係り文節に修飾される）文節を受け文節という。すなわち、文節「靴下の」は、文節「汚れ」に係る係り文節であり、文節「汚れ」は、文節「靴下の」を受ける受け文節である。また、文節「汚れが」と文節「綺麗に」とは、文節「落ちる」に係る係り文節であり、文節「落ちる」は、文節「汚れが」と文節「綺麗に」とを受ける受け文節である。

図７（ａ）に示す構文木は、受け文節「落ちる」に係る２つの係り文節「汚れが」と「綺麗に」とを有する。構文木で表される文「靴下の汚れが綺麗に落ちる。」において、係り文節「綺麗に」の方が係り文節「汚れが」よりも受け文節「落ちる」に近い位置で使用される。このため、図７（ａ）に示す構文木では、係り文節「綺麗に」の方が係り文節「汚れが」よりも受け文節「落ちる」に近く（つまり、下側の）、かつ順位の高いノードで表される。すなわち、同じ受け文節に係る複数の係り文節を構文木が有する場合には、当該構文木で表される文において受け文節に近い位置で使用される係り文節から順に高い順位が割り振られている。

ここで、構文木で表されるアンケート文を集計する集計装置１００の有する機能について、説明を再開する。

図６に示す部分木生成部１２３は、構文解析部１２２で生成された構文木から、当該構文木の部分構文木（以下、部分木という）を複数生成する。但し、本明細書では、構文木と部分的に一致する木だけでなく、完全に一致する木（以下、完全木という）も部分木と称する。

図７（ａ）に示した文「靴下の汚れが綺麗に落ちる。」を表す構文木（完全木）を例に挙げて説明すると、部分木生成部１２３は、図７（ｂ）から図７（ｇ）に示す部分木を生成する。

図７（ｂ）から図７（ｇ）にそれぞれ示した部分木は、図７（ａ）に示した構文木で表される「靴下の汚れが綺麗に落ちる。」の一部分若しくは全部を表す。

図７（ｂ）に示した部分木は、図７（ａ）に示した完全木と完全に一致する構文木であり、「靴下の汚れが綺麗に落ちる。」の全文を表す。図７（ｃ）から図７（ｇ）に示す部分木は、当該構文木で表される文「靴下の汚れが綺麗に落ちる。」の一部分を表す。

具体的には、図７（ｃ）に示した部分木は、文「靴下の汚れが落ちる。」を表し、図７（ｄ）に示した部分木は、文「汚れが綺麗に落ちる。」を表し、図７（ｅ）に示した部分木は、文「汚れが落ちる。」を表し、図７（ｆ）に示した部分木は、文「綺麗に落ちる。」を表し、図７（ｇ）に示した部分木は、文「靴下の汚れが。」を表す。

部分木の枝数は、完全木の枝数よりも少ないか若しくは同じであり、部分木の高さは、完全木の高さよりも低いか若しくは同じであり、かつ部分木の枝の全ては、完全木の枝のいずれか若しくは全てと一致している。

具体例としては、図７（ｂ）に示す部分木は、図７（ａ）に示す完全木と完全一致する構文木であり、当該部分木の枝数及び高さは、当該完全木の枝数及び高さとそれぞれ一致しており、当該部分木が有する枝の全ては、完全木が有する枝の全てと一致している。

これに対して、図７（ｃ）に示す部分木の高さは、図７（ａ）の完全木の高さと一致しているが、当該部分木は、当該完全木が有する文節「綺麗に」に対応する葉を付けた枝を有さない。また、図７（ｄ）に示す部分木は、図７（ａ）の完全木が有する文節「靴下の」を有さないため、図７（ｄ）に示す部分木の高さは、図７（ａ）の完全木の高さより低い。さらに、図７（ｅ）及び図７（ｆ）にそれぞれ示す部分木は、図７（ｄ）に示す部分木よりも枝数が少ない。また、図７（ｇ）に示す部分木の高さは、図７（ａ）の完全木の高さより低い。

ここで、図７（ｃ）の部分木で表される文「靴下の汚れが落ちる。」は、図７（ａ）の完全木及び図７（ｂ）の部分木でそれぞれ表される文「靴下の汚れが『綺麗に』落ちる。」よりも上位の概念を表す。文「靴下の汚れが落ちる。」は、靴下の汚れが「綺麗に」落ちることだけではなく、例えば、靴下の汚れが落ちるが、綺麗には落ちないことなども表すためである。

また、図７（ｄ）の部分木で表される文「汚れが綺麗に落ちる。」は、図７（ａ）の完全木及び図７（ｂ）の部分木でそれぞれ表される文「『靴下の』汚れが綺麗に落ちる。」よりも上位の概念を表す。文「汚れが綺麗に落ちる。」は、「靴下」の汚れが綺麗に落ちることだけではなく、例えば、「襟首」の汚れが綺麗に落ちることなども表すためである。

このように、基準となる部分木よりも上位の概念を表す部分木を、当該基準となる部分木より上位の部分木といい、基準となる部分木よりも下位の概念を表す部分木を、当該基準となる部分木より下位の部分木という。

また、図７（ｄ）の部分木は、図７（ｂ）の部分木よりも枝数（つまり、葉数）が１つ少ない。つまり、図７（ｄ）の部分木で表される文「汚れが綺麗に落ちる。」は、図７（ｂ）の部分木で表される文「『靴下の』汚れが綺麗に落ちる。」のよりも、文を構成する文節が１つ少ない。同様に、図７（ｃ）の部分木は、図７（ｂ）の部分木よりも枝数が少なく、図７（ｃ）の部分木で表される文「靴下の汚れが落ちる。」は、図７（ｂ）の部分木で表される文「靴下の汚れが『綺麗に』落ちる。」よりも、文を構成する文節が１つ少ない。

このように、当該基準となる部分木よりも枝数が１つ少ない部分木を、当該基準となる部分木の直近上位の部分木といい、当該基準となる部分木よりも枝数が１つ多い部分木を、当該基準となる部分木の直近下位の部分木という。

図６の一致判別部１２４は、部分木生成部１２３で生成された複数の部分木でそれぞれ表される文の内容が互いに一致するか否かを、部分木を構成する文節と係り受け関係が一致する（以下、部分木が一致するという）か否かに基づいて判別する。

具体例を挙げて説明すると、一致判別部１２４は、図８（ａ）に示すような第１部分木と、第２部分木と、は、互いに完全に一致すると判別する。第１部分木と第２部分木とは、高さと枝数とが同じであって、ルートノードの文節「落ちる」と、ルートノードに係る２つの文節「汚れ」と文節「綺麗に」と、文節「綺麗に」に係る文節「靴下の」をそれぞれ有するためである。

また、一致判別部１２４は、図８（ｂ）に示すような、文「靴下の汚れが綺麗に落ちる。」を表す第１部分木と、文「綺麗に靴下の汚れが落ちる。」を表す第２部分木と、は、互いに完全に一致すると判別する。すなわち、一致判別部１２４は、第１部分木と第２部分木とで、ルートノードに係る係り文節「汚れが」及び「綺麗に」の順位が互いに相違していても、ルートノード「落ちる」と、ルートノードに係る２つの係り文節「汚れが」及び「綺麗に」と、係り文節「汚れが」に係る文節「靴下の」と、が互いに一致していれば、第１部分木と第２部分木とが完全に一致すると判別する。第１部分木で表される文と、第２部分木で表される文と、で、「落ちる」に係る文節「綺麗に」と「汚れ」との記載順序が異なるに過ぎず、第１部分木で表される意味内容と、第２部分木で表される意味内容と、が同じためである。

さらに、一致判別部１２４は、図９（ａ）に示すような、「靴下の汚れが綺麗に落ちる」を表す第１部分木と、「靴下のヨゴレが綺麗に落ちる」を表す第２部分木と、を互いに実質的に一致すると判別する。単語「よごれ」は、「汚れ」とも「ヨゴレ」とも表記されるためである。

また、一致判別部１２４は、図９（ｂ）に示すような、「靴下の汚れが綺麗に落ちる」を表す第１部分木と、「靴下の汚れが綺麗に取れる」を表す第２部分木と、を互いに実質的に一致すると判別する。単語「落ちる」と「取れる」とは、同義語だからである。同様の例として、一致判別部１２４は、「汚れが綺麗に落ちる洗剤」を表す部分木と、「汚れが綺麗に取れる洗剤」を表す部分木と、を、互いに実質的に一致すると判別する。すなわち、互いに同義語の関係にある文節は、係り文節であっても良いし、受け文節であっても良い。

また、一致判別部１２４は、図１０に示すような、「靴下の汚れが綺麗に落ちる」を表す第１部分木と、「靴下の汚れが綺麗に落ちた」を表す第２部分木と、を互いに実質的に一致すると判別する。動詞などの用言は活用するためである。同様の例として、一致判別部１２４は、「汚れが綺麗に落ちる喜び」を表す部分木と、「汚れが綺麗に落ちた喜び」を表す部分木と、も互いに実質的に一致すると判別する。すなわち、活用が相違する文節は、係り文節であっても良いし、受け文節であっても良い。

図６の分類部１２５は、一致判別部１２４の判定結果に基づいて部分木をグループ分けする。集計部１２６は、各グループに分類された部分木の数を集計する。出力部１２７は、集計結果をＬＡＮカード１０６へ出力する。ＬＡＮカード１０６は、端末装置２０若しくは２１へ集計結果を返信する。

次に、情報記憶部１２９が記憶する各種テーブルについて、図１１から図１６を参照して説明する。

情報記憶部１２９は、入力部１２０で入力された文が保存された、図１１に示す入力文テーブルを記憶している。入力文テーブルには、文を識別する文ＩＤと、当該ＩＤで識別される文と、が対応付けられて複数保存される。

また、情報記憶部１２９は、入力文テーブルの文に含まれる文節が保存された、図１２に示す文節テーブルを記憶している。文節テーブルには、入力文テーブルに保存された文ＩＤと、当該文ＩＤで識別される文に含まれる文節と、当該文節を識別する文節ＩＤと、が対応付けられて複数保存される。

さらに、情報記憶部１２９は、文節テーブルの文節で構成される部分木が保存された、図１３に示す部分木テーブルを記憶している。部分木テーブルには、入力文テーブルに保存された文ＩＤと、当該文ＩＤで識別される文の部分木を識別する部分木ＩＤと、当該部分木を構成する文節と、当該文節の文節ＩＤと、当該文節を受ける受け文節の文節ＩＤ（以下、受け文節ＩＤという）と、が対応付けられて複数保存される。

またさらに、情報記憶部１２９は、複数の部分木が実質的に同一であるか否かを一致判別部１２４が判別するために用いられる、図１４（ａ）に示す表記テーブル、図１４（ｂ）に示す同義語テーブル、及び図１４（ｃ）に示す活用テーブルを記憶している。表記テーブルには、単語の表記と、当該単語の当該表記と異なる表記と、が複数対応付けられて保存される。同義語テーブルには、単語と、当該単語の同義語と、が複数対応付けられて保存されている。活用テーブルには、単語の活用形と、当該単語の当該活用形と異なる活用形と、が複数対応付けられて保存される。

尚、表記テーブルにおいて互いに対応付けられた表記が異なる２つの単語、同義語テーブルにおいて互いに対応付けられた２つの同義語、及び同義語テーブルにおいて互いに対応付けられた活用が異なる２つの単語を、それぞれ実質的に一致した（若しくは、実質的に同一の）単語という。

また、情報記憶部１２９は、部分木テーブルの部分木が分類されたグループが保存された、図１５に示すグループテーブルを記憶している。グループテーブルには、グループを識別するグループＩＤと、当該グループに分類された部分木の部分木ＩＤと、当該部分木の高さと、当該部分木の総枝数と、当該グループを代表する部分木（以下、代表木という）と、当該グループの名称と、当該グループの名称と完全に一致する文を表す部分木の数（以下、グループ名一致木数という）と、当該グループに分類された部分木の総木数と、が対応付けられて保存される。

ここで、あるグループは、ある基準となるグループに分類された部分木よりも、下位の概念を表す部分木が分類されている場合に、当該基準となるグループよりも下位のグループとされる。また、当該基準となるグループに分類された部分木で表される概念は、当該基準となるグループよりも下位のグループに分類された部分木で表される概念を包含する。上位の概念は、下位の概念を含むからである。

このため、情報記憶部１２９は、グループの包含関係（つまり、上下関係）を表すデータが保存された、図１６に示す包含関係テーブルを記憶している。包含関係テーブルには、グループテーブルに保存されたグループＩＤと、当該グループＩＤで識別されるグループの直近上位のグループのＩＤ（以下、直近上位グループＩＤという）と、が互いに対応付けられて保存される。

ここで、共通の概念を表す部分木がそれぞれ分類された複数のグループからなる集合をグループ集合という。グループ集合に属する複数のグループは、前述のように、それぞれ上下関係を有するため、互いに階層構造を構成する。

このため、情報記憶部１２９は、グループの階層構造を表すデータが保存された、図１７に示す階層構造テーブルを記憶している。階層構造テーブルには、グループテーブルに保存されたグループＩＤと、当該グループＩＤで識別されるグループが属するグループ集合を識別するグループ集合ＩＤと、当該グループＩＤで識別されるグループの直近上位のグループの直近上位グループＩＤと、が互いに対応付けられて保存される。

次に、図６に示す入力部１２０、保存部１２１、構文解析部１２２、部分木生成部１２３、一致判別部１２４、分類部１２５、集計部１２６、及び出力部１２７で行われるＣＰＵ１０１の動作について説明する。

ここでは、集計装置１００が、「靴下の汚れが綺麗に落ちる。」というアンケートの回答文を受信した場合を例に挙げて説明を行う。

ＣＰＵ１０１は、端末装置２０から回答文を受信すると、図５に示す集計処理の実行を開始する。

先ず、入力部１２０は、図４のＬＡＮカード１０６から「靴下の汚れが綺麗に落ちる。」という回答文を入力する（ステップＳ０１）。

次に、保存部１２１は、入力された回答文「靴下の汚れが綺麗に落ちる。」を識別する文ＩＤを生成し、生成した文ＩＤと、文「靴下の汚れが綺麗に落ちる。」と、を対応付けて、図１１に示した入力文テーブルに保存する（ステップＳ０２）。

ここで、ステップＳ０２の処理が終了したとき、入力文テーブルには、以下の６つの文が保存されているとして説明を行う。

文ＩＤ「ST1」で識別される文「靴下の汚れが綺麗に落ちる。」、文ＩＤ「ST2」で識別される文「靴下の汚れが綺麗に取れる。」、文ＩＤ「ST3」で識別される文「ヨゴレが綺麗に落ちる。」、文ＩＤ「ST4」で識別される文「汚れが落ちた。」、文ＩＤ「ST5」で識別される文「汚れが落ちる。」、文ＩＤ「ST6」で識別される「パッケージが格好いい。」である。

図５のステップＳ０２の後に、入力部１２０は、入力文テーブルに保存された全ての回答文を読み出す（ステップＳ０３）。

次に、構文解析部１２２は、入力部１２０で読み出された６つの文を形態素解析することで、これらの文の形態素列を取得する（ステップＳ０４ａ）。

次に、構文解析部１２２は、形態素解析により得られた形態素列を構文解析する（ステップＳ０４ｂ）。このようにして、構文解析部１２２は、上記６つの入力文の形態素列から、上記６つの入力文を構成する複数の文節を特定する。

その後、保存部１２１は、文を識別する文ＩＤと、当該文から得られた文節の文節ＩＤと、当該文節と、を対応付けて、図１２に示した文節テーブルに保存する。

また、構文解析部１２２は、文ＩＤ「ST1」で識別される文「靴下の汚れが綺麗に落ちる。」を構成する複数の文節を用いて、図１８（ａ）に示す完全構文木（つまり、完全木）ＦＴ１を生成する。同様に、構文解析部１２２は、文ＩＤ「ST2」から「ST6」でそれぞれ識別される文から、図１９（ａ）、図２０（ａ）、図２１（ａ）から図２１（ｃ）にそれぞれ示す完全木ＦＴ２からＦＴ６を生成する（ステップＳ０５）。

次に、部分木生成部１２３は、図１８（ａ）に示す完全木ＦＴ１から、図１８（ｂ）から図１８（ｇ）に示す部分木Ｐ１０からＰＴ１５（つまり、全ての部分木）を生成する。同様に、部分木生成部１２３は、図１９（ａ）に示す完全木ＦＴ２から、図１９（ｂ）から図１９（ｇ）に示す部分木Ｐ２０からＰＴ２５を生成する。さらに、部分木生成部１２３は、図２０（ａ）に示す完全木ＦＴ３から、図２０（ｂ）から図２０（ｄ）に示す部分木Ｐ３０からＰＴ３２を生成する。また、部分木生成部１２３は、図２１（ａ）から図２１（ｃ）に示す完全木ＦＴ４ないしＦＴ６から、図２１（ｄ）から図２１（ｆ）に示す部分木ＰＴ４０、ＰＴ５０、及びＰＴ６０を生成する（図５のステップＳ０６）。

その後、図６の保存部１２１は、ステップＳ０６で生成された複数の部分木について、部分木の生成に用いられた文の文ＩＤと、当該部分木を識別する部分木ＩＤと、当該部分木を構成する文節と、当該文節の文節ＩＤと、当該文節を受ける文節の受け文節ＩＤと、を対応付けて、図１３に示した部分木テーブルに保存する。

図５のステップＳ０６の処理で部分木が生成された後に、生成された部分木をグループ分けする、図２２に示す部分木分類処理が実行される（ステップＳ０７ａ）。

部分木分類処理が開始されると、分類部１２５は、新しいグループを生成してから、図１３に示した部分木テーブルを参照する。次に、分類部１２５は、部分木テーブルに保存された部分木ＩＤで識別される部分木の内で、未だグループに分類されていない部分木（以下、未分類木という）の１つを新しいグループに分類する（ステップＳ２１）。

このとき、部分木テーブルに保存された部分木ＩＤで識別される部分木の全てが未分類木である。ここでは、分類部１２５は、部分木テーブルの最も先頭に保存された部分木ＩＤ「PT10」を選択し、選択されたＩＤで識別される、図１８（ｂ）に示した部分木ＰＴ１０を新しいグループＧ１０に分類するとして説明を行う。

次に、保存部１２１は、部分木ＰＴ１０の部分木ＩＤ「PT10」と、グループＧ１０のグループＩＤ「G10」と、を対応付けて、図１５に示したグループテーブルに保存する。このとき、保存部１２１は、部分木ＰＴ１０の部分木ＩＤ「PT10」と、グループＧ１０のグループＩＤ「G10」と、に対して、図１８（ｂ）に示した部分木ＰＴ１０の高さ「2」及び総枝数「3」をさらに対応付ける。グループＧ１０よりも上位のグループを検索し易くするためである。

次に、分類部１２５は、図１３の部分木テーブルに保存された部分木の全てを何らかのグループに分類したか否かを判別する（図２２のステップＳ２２）。このとき、分類部１２５は、部分木ＰＴ１１からＰＴ１５、ＰＴ２０からＰＴ２５、ＰＴ３０からＰＴ３２、ＰＴ４０、ＰＴ５０、及びＰＴ６０を未だ分類していないため、部分木の全てをグループに分類した訳ではないと判別する（ステップＳ２２；Ｎｏ）。

その後、分類部１２５は、未分類木の１つを、これからグループに分類する部分木である分類対象木とする（ステップＳ２３）。

ここでは、分類部１２５は、未分類木ＰＴ１１からＰＴ１５、ＰＴ２０からＰＴ２５、ＰＴ３０からＰＴ３２、ＰＴ４０、ＰＴ５０、及びＰＴ６０の内で、図１８（ｃ）に示した部分木ＰＴ１１を分類対象木とするとして説明を行う。

次に、分類部１２５は、既にグループに分類された部分木（以下、分類済木という）の全てに注目したか否かを判別する（ステップＳ２４）。このとき、分類済木は、部分木ＰＴ１０のみであり、かつ未だ部分木ＰＴ１０に注目していない。このため、分類部１２５は、分類済木の全てに注目した訳ではないと判別する（図２１のステップＳ２４；Ｎｏ）。

その後、分類部１２５は、未注目の分類済木の１つに注目し、注目分類済木とする（ステップＳ２５）。ここでは、分類部１２５は、図１８（ｂ）に示した分類済木ＰＴ１０に注目するとして説明を行う。

次に、一致判別部１２４は、図１８（ｃ）の分類対象木ＰＴ１１の部分木ＩＤ「PT11」に対応付けられた文ＩＤ（以下、分類対象木ＰＴ１１の文ＩＤという）「ST1」を、図１３に示した部分木テーブルから検索する。また、一致判別部１２４は、図１８（ｂ）の注目分類済木ＰＴ１０の部分木ＩＤ「PT10」に対応付けられた文ＩＤ（以下、注目分類済木ＰＴ１０の文ＩＤという）「ST1」を部分木テーブルから検索する。その後、一致判別部１２４は、分類対象木ＰＴ１１の文ＩＤ「ST1」と、注目分類済木ＰＴ１０の文ＩＤ「ST1」と、が一致すると判別し（ステップＳ２６ａ；Ｙｅｓ）、ステップＳ２４に戻り、上記処理を繰り返す。部分木生成部１２３は、同じ文から同じ部分木を生成しないため、同じ文から生成された２つの部分木は、互いに一致することがないためである。

その後、図２２のステップＳ２４に戻り、分類部１２５は、分類済木の全てに注目したか否かを判別する（ステップＳ２４）。このとき、分類済木は、部分木ＰＴ１０のみであり、部分木ＰＴ１０は既に注目されている。このため、分類部１２５は、分類済木の全てに注目したと判別する（ステップＳ２４；Ｙｅｓ）。

次に、分類部１２５は、新しいグループを生成し、生成したグループに分類対象木を分類する（ステップＳ２８）。ここでは、分類部１２５は、新しいグループＧ１１を生成し、図１８（ｃ）の分類対象木ＰＴ１１をグループＧ１１に分類するとして説明を行う。

次に、保存部１２１は、グループＧ１１のグループＩＤ「G11」と、分類対象木ＰＴ１１の部分木ＩＤ「PT11」と、分類対象木ＰＴ１１の高さ「2」と、総枝数「2」と、を対応付けて、図１５に示したグループテーブルに保存する。

その後、分類部１２５は、分類対象木を順に、図１８（ｄ）から（ｇ）の部分木ＰＴ１２からＰＴ１５とするとして説明を行う。分類部１２５は、図２２のステップＳ２２からステップＳ２６ｂ及びステップＳ２８を繰り返し実行することで、新しいグループＧ１２からＧ１５を生成し、これらのグループＧ１２からＧ１５のそれぞれに、部分木ＰＴ１２からＰＴ１５を分類する。

次に、分類部１２５は、図１９（ｂ）に示した未分類木ＰＴ２０を分類対象木とし、図１８（ｂ）に示した分類済木ＰＴ１０を注目分類済木とするとして説明を行う。分類部１２５が図２２のステップＳ２２からステップＳ２５を実行した後に、一致判別部１２４は、分類対象木ＰＴ２０の文ＩＤ「ST2」と、注目分類済木ＰＴ１０の文ＩＤ「ST1」と、が相違すると判別し（ステップＳ２６ａ；Ｎｏ）、ステップＳ２６ｂの処理を実行する。

ステップＳ２６ｂにおいて、一致判別部１２４は、図１９（ｂ）の分類対象木ＰＴ２０と、図１８（ｂ）の注目分類済木ＰＴ１０と、が完全に一致する若しくは実質的に一致する（以下単に、一致するという）か、否か、を判別する（ステップＳ２６ｂ）。

ここでは、一致判別部１２４は、文「靴下の汚れが綺麗に取れる。」を表す分類対象木ＰＴ２０と、文「靴下の汚れが綺麗に落ちる。」を表す注目分類済木ＰＴ１０と、は、完全に一致する訳ではない、と判別する。分類対象木ＰＴ２０のルートノード「取れる」と、注目分類済木ＰＴ１０のルートノード「落ちる」と、が相違するためである。

次に、一致判別部１２４は、「取れる」と「落ちる」とが、図１４（ｂ）の同義語テーブルに対応付けられて保存されているので、「取れる」は、「落ちる」の同義語であると判別する。このため、一致判別部１２４は、分類対象木ＰＴ２０と、注目分類済木ＰＴ１０と、は、実質的に一致する、と判別する（図２２のステップＳ２６ｂ；Ｙｅｓ）。

その後、分類部１２５は、図１８（ｂ）の注目分類済木ＰＴ１０と同じグループＧ１０に、図１９（ｂ）の分類対象木ＰＴ２０を分類する（ステップＳ２７）。

次に、保存部１２１は、部分木ＰＴ２０の部分木ＩＤ「PT20」と、グループＧ１０のグループＩＤ「G10」と、を対応付けて、図１５に示したグループテーブルに保存する。

その後、分類部１２５は、分類対象木を順に、図１９（ｃ）から（ｇ）の部分木ＰＴ２１からＰＴ２５とするとして説明を行う。分類部１２５は、図２２のステップＳ２２からステップＳ２７を繰り返し実行する。これにより、分類部１２５は、部分木ＰＴ２１からＰＴ２５を、図１８（ｃ）から（ｇ）の部分木ＰＴ１１からＰＴ１５が分類された既存のグループＧ１１からＧ１５のそれぞれに分類する。

次に、分類部１２５は、図２０（ｂ）に示した未分類木ＰＴ３０を分類対象木とし、図１８（ｂ）及び（ｃ）の分類済木ＰＴ１０及びＰＴ１１を順に注目分類済木とするとして説明を行う。分類部１２５は、図２２のステップＳ２２からステップＳ２６ｂの処理を繰り返す。

次に、分類部１２５は、図１８（ｄ）に示した分類済木ＰＴ１２を注目分類済木とするとして説明を行う。分類部１２５がステップＳ２２からステップＳ２６ａの処理を実行した後に、一致判別部１２４は、図２０（ｂ）の分類対象木ＰＴ３０と、図１８（ｄ）の注目分類済木ＰＴ１２と、が一致するか否かを判別する（ステップＳ２６ｂ）。

ここでは、一致判別部１２４は、文「ヨゴレが綺麗に取れる」を表す分類対象木ＰＴ３０と、文「汚れが綺麗に落ちる」を表す注目分類済木ＰＴ１２と、は、完全に一致する訳ではない、と判別する。分類対象木ＰＴ３０のルートノードに係る係り文節「ヨゴレが」と、注目分類済木ＰＴ１２のルートノードに係る係り文節「汚れが」と、が相違するためである。

次に、一致判別部１２４は、「ヨゴレ」と「汚れ」とが、図１４（ａ）の表記テーブルに対応付けられて保存されているので、文節の相違は表記の相違に過ぎないと判別する。このため、一致判別部１２４は、分類対象木ＰＴ３０と、注目分類済木ＰＴ１２と、は、実質的に一致する、と判別する（図２２のステップＳ２６ｂ；Ｙｅｓ）。

その後、分類部１２５は、注目分類済木ＰＴ１２と同じグループＧ１２に、分類対象木ＰＴ３０を分類する（ステップＳ２７）。

次に、保存部１２１は、部分木ＰＴ３０の部分木ＩＤ「PT30」と、グループＧ１２のグループＩＤ「G12」と、を、図１５に示したグループテーブルに保存する。

その後、分類部１２５は、図２０（ｃ）に示す部分木ＰＴ３１を分類対象木とするとして説明を行う。分類部１２５は、図２２のステップＳ２２からステップＳ２７を実行することで、図１８（ｅ）の部分木ＰＴ１３が分類された既存のグループＧ１３に部分木ＰＴ３１を分類する。

次に、分類部１２５は、図２０（ｄ）に示す未分類木ＰＴ３２を分類対象木とし、図１８（ｂ）から（ｅ）の分類済木ＰＴ１０からＰＴ１３を順に注目分類済木とするとして説明を行う。分類部１２５は、図２２のステップＳ２２からステップＳ２６ｂの処理を繰り返す。

次に、分類部１２５は、図１８（ｆ）の分類済木ＰＴ１４を注目分類済木とするとして説明を行う。分類部１２５が、図２２のステップＳ２２からステップＳ２６ｂの処理を実行した後に、一致判別部１２４は、図２０（ｄ）の分類対象木ＰＴ３２と、図１８（ｆ）の注目分類済木ＰＴ１４と、が一致するか否かを判別する（ステップＳ２６ｂ）。

ここでは、一致判別部１２４は、文「綺麗に落ちる。」を表す分類対象木ＰＴ３２と、文「綺麗に落ちる。」を表す注目分類済木ＰＴ１４と、は、完全に一致する、と判別する。分類対象木ＰＴ３２の係り文節「綺麗に」及び受け文節「落ちる」と、注目分類済木ＰＴ１４の係り文節「綺麗に」及び受け文節「落ちる」と、が一致するためである。

その後、分類部１２５は、注目分類済木ＰＴ１４と同じグループＧ１４に、分類対象木ＰＴ３２を分類する（ステップＳ２７）。次に、保存部１２１は、部分木ＰＴ３２の部分木ＩＤ「PT32」と、グループＧ１４のグループＩＤ「G14」と、を対応付けて、図１５に示したグループテーブルに保存する。この際に、分類部１２５は、部分木ＩＤ「PT14」と「PT32」とを、部分木ＰＴ１４と部分木ＰＴ３２とが完全に一致していることを表す記号「=」で連結してグループテーブルに保存する。

次に、分類部１２５は、図２１（ｄ）に示す未分類木ＰＴ４０を分類対象木とし、分類済木ＰＴ１０からＰＴ１２を順に注目分類済木とするとして説明を行う。分類部１２５は、図２２のステップＳ２２からステップＳ２６ｂの処理を繰り返す。

次に、分類部１２５は、図１８（ｅ）に示した分類済木ＰＴ１３を注目分類済木とするとして説明を行う。分類部１２５が、図２２のステップＳ２２からステップＳ２６ｂの処理を実行した後に、一致判別部１２４は、図２１（ｄ）の分類対象木ＰＴ４０と、図１８（ｅ）の注目分類済木ＰＴ１３と、が一致するか否かを判別する（ステップＳ２６ｂ）。

ここでは、一致判別部１２４は、文「汚れが落ちた。」を表す分類対象木ＰＴ４０と、文「汚れが落ちる。」を表す注目分類済木ＰＴ１３と、は、完全に一致する訳ではない、と判別する。分類対象木ＰＴ４０のルートノード「落ちた」と、注目分類済木ＰＴ１３のルートノード「落ちる」と、が相違するためである。

次に、一致判別部１２４は、「落ちた」と「落ちる」とが、図１４（ｃ）の活用テーブルに対応付けられて保存されているので、ルートノードの相違は活用の相違に過ぎないと判別する。このため、一致判別部１２４は、分類対象木ＰＴ４０と、注目分類済木ＰＴ１３と、は、実質的に一致する、と判別する（図２２のステップＳ２６ｂ；Ｙｅｓ）。

その後、分類部１２５は、注目分類済木ＰＴ１３と同じグループＧ１３に、分類対象木ＰＴ４０を分類する（ステップＳ２７）。

その後、分類部１２５は、図２１（ｅ）に示した部分木ＰＴ５０を分類対象木とするとして説明を行う。分類部１２５は、ステップＳ２２からステップＳ２７を実行することで、既存のグループＧ１３に部分木ＰＴ５０を分類する。

その後、分類部１２５は、図２１（ｆ）に示した部分木ＰＴ６０を分類対象木とするとして説明を行う。分類部１２５は、ステップＳ２２からステップＳ２６ｂ及びステップＳ２８を実行することで、新規のグループＧ１６に部分木ＰＴ６０を分類する。

次に、分類部１２５は、部分木の全てを分類したと判別した後に（ステップＳ２２；Ｙｅｓ）、部分木分類処理の実行を終了する。

図５のステップＳ０７ａで、部分木分類処理の実行が終了すると、図２３に示すように、グループＧ１０に部分木ＰＴ１０及びＰＴ２０が分類され、グループＧ１１に部分木ＰＴ１１及びＰＴ２１が分類され、グループＧ１２に部分木ＰＴ１２、ＰＴ２２、及びＰＴ３０が分類されている。また、グループＧ１３に部分木ＰＴ１３、ＰＴ２３、ＰＴ３１、ＰＴ４０、及びＰＴ５０が分類され、グループＧ１４に部分木ＰＴ１４、ＰＴ２４、及びＰＴ３２が分類され、グループＧ１５に部分木ＰＴ１５及びＰＴ２５が分類され、グループＧ１６に部分木ＰＴ６０が分類されている。

図５のステップＳ０７ａが実行された後に、集計部１２６は、これらのグループに分類された部分木の数を集計する、図２４に示す部分木集計処理を実行する（ステップＳ０７ｂ）。

集計処理を開始すると、集計部１２６は、図１５に示したグループテーブルを参照する。次に、集計部１２６は、グループテーブルに保存されたグループＩＤで識別されるグループの全てについて部分木の数を集計したか否かを判別する（ステップＳ５１）。このとき、グループＧ１０からＧ１６のいずれも集計されていないので、集計部１２６は、全てのグループについて集計した訳ではないと判別する（ステップＳ５１；Ｎｏ）。

次に、集計部１２６は、未集計のグループの１つに注目し、注目したグループを注目グループとする（ステップＳ５２）。このとき、集計部１２６は、未集計のグループＧ１０からＧ１６の内で、グループＧ１０に注目するとして説明を行う。

次に、集計部１２６は、注目グループに分類された部分木の全てについて、互いに完全一致する部分木の数（つまり、完全一致木数）を集計する（ステップＳ５３）。図１５に示したグループテーブルには、グループＧ１０のグループＩＤ「G10」と対応付けて、完全一致を表す記号「=」を含まない「PT10, PT20」が保存されている。このため、集計部１２６は、グループＧ１０には、図１８（ｂ）に示した部分木ＰＴ１０と、図１９（ｂ）に示した部分木ＰＴ２０と、が分類されており、互いに完全一致する部分木が分類されていないと判別する。

次に、集計部１２６は、一致木数が最も多い部分木の１つを代表木とする（ステップＳ５４）。ここでは、部分木ＰＴ１０及びＰＴ２０の完全一致木数がそれぞれ「0」であるので、集計部１２６は、部分木ＩＤがより若い部分木ＰＴ１０を代表木とするとして説明を行う。

次に、集計部１２６は、代表木に基づいて注目グループの名称を決定する（ステップＳ５５）。ここでは、集計部１２６は、代表木ＰＴ１０で表される文「靴下の汚れが綺麗に落ちる。」を注目グループＧ１０の名称とするとして説明を行う。

次に、集計部１２６は、注目グループに分類された部分木の総数（以下、総木数という）を算出する（ステップＳ５６）。ここでは、集計部１２６は、グループＩＤ「G10」と対応付けられた「PT10, PT20」に基づいて総木数「2」を算出するとして説明する。

その後、保存部１２１は、グループＩＤ「G10」と、代表木の部分木ＩＤ「PT10」と、グループ名「靴下の汚れが綺麗に落ちる。」と、グループのグループ名一致木数「1」と、総木数「2」と、を対応付けて、図１６に示した包含関係テーブルに保存する。

次に、集計部１２６は、グループＧ１１及びＧ１２を順に注目グループとするとして説明を行う。集計部１２６は、ステップＳ５１からステップＳ５６の処理を繰り返し実行する。

これにより、包含関係テーブルに、グループＩＤ「G11」と、代表木の部分木ＩＤ「PT11」と、グループ名「靴下の汚れが落ちる。」と、グループ名完全一致木数「1」と、総木数「2」と、が対応付けられて保存される。

また、包含関係テーブルに、グループＩＤ「G12」と、代表木の部分木ＩＤ「PT12」と、グループ名「汚れが綺麗に落ちる。」と、グループ名完全一致木数「1」と、総木数「3」と、が対応付けられて保存される。

次に、集計部１２６は、グループＧ１３を注目グループとするとして説明を行う。集計部１２６は、ステップＳ５１及びステップＳ５２の処理を実行する。

ここで、図１５に示したグループテーブルには、グループＧ１３のグループＩＤ「G13」と対応付けて、完全一致を表す記号「=」で連結された「PT13」及び「PT50」を含む「PT13=PT50,PT23,PT31,PT40」が保存されている。このため、集計部１２６は、グループＧ１３には、図１８（ｅ）の部分木ＰＴ１３、図１９（ｅ）の部分木ＰＴ２３、図２０（ｃ）の部分木ＰＴ３１、図２１（ｄ）の部分木ＰＴ４０、及び図２１（ｅ）の部分木ＰＴ５０が分類されており、部分木ＰＴ１３と部分木ＰＴ５０とは、互いに完全一致すると判別する。

このため、集計部１２６は、注目グループＧ１３に分類された部分木１３及びＰＴ５０の完全一致木数がそれぞれ「1」であり、部分木ＰＴ２３、ＰＴ３１、及びＰＴ４０の完全一致木数がそれぞれ「0」であると集計する（ステップＳ５３）。

次に、部分木ＰＴ１３及びＰＴ５０の完全一致木数がそれぞれ「1」であるので、集計部１２６は、部分木ＩＤがより若い部分木ＰＴ１３を代表木とする（ステップＳ５４）。

次に、集計部１２６は、ステップＳ５５及びステップＳ５６を実行する。これにより、包含関係テーブルに、グループＩＤ「G13」と、代表木の部分木ＩＤ「PT13」と、グループ名「汚れが落ちる。」と、グループ名完全一致木数「2」と、総木数「5」と、が対応付けられて保存される。

次に、集計部１２６は、グループＧ１４からＧ１６を順に注目グループとするとして説明を行う。集計部１２６は、ステップＳ５１からステップＳ５６の処理を繰り返し実行する。

これにより、包含関係テーブルに、グループＩＤ「G14」と、代表木の部分木ＩＤ「PT14」と、グループ名「綺麗に落ちる。」と、グループ名完全一致木数「2」と、総木数「3」と、が対応付けられて保存される。また、グループＩＤ「G15」と、代表木の部分木ＩＤ「PT15」と、グループ名「靴下の汚れ。」と、グループ名完全一致木数「1」と、総木数「2」と、が対応付けられて保存される。

さらに、グループテーブルに、グループＩＤ「G16」と、代表木の部分木ＩＤ「PT60」と、グループ名「パッケージが格好いい。」と、グループ名完全一致木数「1」と、総木数「1」と、が対応付けられて保存される。

その後、集計部１２６は、グループＧ１０からＧ１６の全てを集計したと判別し（ステップＳ５１；Ｙｅｓ）、部分木集計処理の実行を終了する。

図５のステップＳ０７ｂの実行が終了すると、分類部１２５は、これらのグループの包含関係を特定する、図２５に示すような包含関係特定処理を実行する（ステップＳ０８）。

包含関係特定処理を開始すると、分類部１２５は、図１５に示したグループテーブルから、グループＩＤ「G10」から「G16」を取得する。

次に、分類部１２５は、グループテーブルから取得した複数のグループＩＤでそれぞれ識別されるグループの全てに注目したか否かを判別する（ステップＳ６１）。このとき、分類部１２５は、包含関係特定処理を開始したばかりであるので、グループのいずれについても注目していない。このため、分類部１２５は、全てのグループに注目した訳ではないと判別する（ステップＳ６１；Ｎｏ）。

次に、分類部１２５は、未だ注目していないグループのグループＩＤ「G10」から「G16」の１つを注目グループとする（ステップＳ６２）。ここでは、最もグループＩＤの番号が若いグループＧ１０を注目グループとするとして説明する。

次に、分類部１２５は、注目グループＧ１０とは異なるグループＧ１１からＧ１６を、注目グループと比較されるグループ（以下、比較対象グループという）とする（ステップＳ６３）。

その後、分類部１２５は、全ての比較対象グループＧ１１からＧ１６に対して注目したか否かを判別する（ステップＳ６４）。このとき、分類部１２５は、比較対象グループＧ１１からＧ１６のいずれにも注目していないので、全ての比較対象グループＧ１１からＧ１６に注目した訳ではないと判別する（ステップＳ６４；Ｎｏ）。

次に、分類部１２５は、未注目の比較対象グループＧ１１からＧ１６の１つに注目し、注目したグループを注目比較対象グループとする（ステップＳ６５）。ここでは、分類部１２５は、最もグループＩＤの番号が若い比較対象グループＧ１１を注目比較対象グループとするとして説明を行う。

次に、一致判別部１２４は、注目比較対象グループＧ１１が、注目グループＧ１０の直近上位のグループであるか否かを判別する（ステップＳ６６）。具体的には、一致判別部１２４は、図１５に示したグループテーブルから、注目グループＧ１０に対応付けられた総枝数「3」を取得する。この総枝数は、注目グループＧ１０に分類された代表木ＰＴ１０の総枝数であり、代表木ＰＴ１０で表される係り受け関係の総数である。また、一致判別部１２４は、注目比較対象グループＧ１１に対応付けられた総枝数「2」を取得する。この枝数は、注目比較対象グループＧ１１に分類された代表木ＰＴ１１の総枝数である。その後、一致判別部１２４は、注目比較対象グループＧ１１の総枝数「2」が、注目グループＧ１０の総枝数「3」よりも１つだけ少ないと判別し、注目比較対象グループＧ１１が注目グループＧ１０の直近上位のグループである可能性がある、と判別する。前述のように、注目グループの直近上位のグループに属する部分木の枝数は、注目グループに属する部分木の枝数よりも１つ少ないためである。

次に、一致判別部１２４は、注目比較対象グループＧ１１の代表木ＰＴ１１が、注目グループＧ１０の代表木ＰＴ１０の部分構文木であるか否かを判別する。代表木ＰＴ１１が、代表木ＰＴ１０の部分構文木であれば、代表木ＰＴ１１で表される概念は、代表木ＰＴ１０で表される概念を含むので、注目比較対象グループＧ１１が、注目グループＧ１０の直近上位のグループであると判別されるためである。

具体的には、一致判別部１２４は、グループテーブルから、注目グループＧ１０のグループＩＤ（以下、注目グループＩＤという）「G10」に対応付けられた高さ「2」を取得する。この高さは、図１８（ｂ）に示した注目比較対象グループＧ１０を代表する代表木ＰＴ１０の高さである。また、一致判別部１２４は、グループテーブルから、注目比較対象グループＧ１１の注目グループＩＤ「G11」に対応付けられた高さ「2」を取得する。この高さは、図１８（ｃ）に示した注目グループＧ１１を代表する代表木ＰＴ１１の高さである。

このため、一致判別部１２４は、注目比較対象グループＧ１１の代表木ＰＴ１１と、注目グループＧ１０の代表木ＰＴ１０とは、高さが同じであるので、代表木ＰＴ１１で表される概念が、代表木ＰＴ１０で表される概念よりも上位の概念である可能性がある、と判別する。上位の概念を表す部分木の高さは、下位の概念を表す部分木の高さと同じかそれよりも低いためである。

さらに、一致判別部１２４は、代表木ＰＴ１１のルートノード「落ちる」と、代表木ＰＴ１０のルートノード「落ちる」と、が一致すると判別する。また、一致判別部１２４は、代表木ＰＴ１１のルートノードに係る文節「汚れが」と、代表木ＰＴ１０のルートノードに係る文節「汚れが」と、が一致すると判別する。さらにまた、一致判別部１２４は、代表木ＰＴ１１の文節「汚れが」に係る「靴下の」と、代表木ＰＴ１０の文節「汚れが」に係る「靴下の」と、が一致すると判別する。すなわち、一致判別部１２４は、注目グループＧ１０の代表木ＰＴ１０が、注目比較対象グループＧ１１の代表木ＰＴ１１が有する受け文節及び係り文節の全てを有する、と判別する。

これらのため、一致判別部１２４は、注目比較対象グループＧ１１に分類された代表木ＰＴ１１は、注目グループＧ１０の代表木ＰＴ１０の部分構文木であると判別する。よって、一致判別部１２４は、注目比較対象グループＧ１１は、注目グループＧ１０の直近上位のグループであると判別する（図２５のステップＳ６６；Ｙｅｓ）。

尚、一致判別部１２４は、代表木ＰＴ１１が有する受け文節及び係り文節の全てと完全に一致する若しくは実質的に一致する受け文節及び係り文節を代表木ＰＴ１０が有する場合にも、代表木ＰＴ１１は、代表木ＰＴ１０の部分構文木であると判別する。

次に、分類部１２５は、注目比較対象グループＧ１１のグループＩＤ「G11」を注目グループＧ１０の直近上位グループＩＤとする。その後、保存部１２１は、注目グループＧ１０のグループＩＤ「G10」と、直近上位グループＩＤ「G11」と、を対応付けて、図１６に示した包含関係テーブルに保存する（図２５のステップＳ６７）。

その後、分類部１２５は、ステップＳ６４に戻り、全ての比較対象グループＧ１１からＧ１６に注目した訳ではないと判別する（ステップＳ６４；Ｎｏ）。分類部１２５は、比較対象グループＧ１１からＧ１６の内で、比較対象グループＧ１１にしか注目していないからである。

次に、分類部１２５は、未注目の比較対象グループＧ１２からＧ１６の内、比較対象グループＧ１２を注目比較対象グループとする（ステップＳ６５）。

次に、一致判別部１２４は、注目比較対象グループＧ１２が、注目グループＧ１０の直近上位のグループであると判別する（ステップＳ６６）。具体的には、一致判別部１２４は、図１５に示したグループテーブルから、注目グループＧ１０に対応付けられた総枝数「3」と、注目比較対象グループＧ１２に対応付けられた総枝数「2」と、を取得する。その後、一致判別部１２４は、注目比較対象グループＧ１２の総枝数「2」が、注目グループＧ１０の総枝数「3」よりも１つだけ少ないと判別し、注目比較対象グループＧ１２が注目グループＧ１０の直近上位のグループである可能性がある、と判別する。

次に、一致判別部１２４は、グループテーブルから、注目グループＧ１０のグループＩＤ「G10」に対応付けられた高さ「2」と、注目比較対象グループＧ１２の注目グループＩＤ「G12」に対応付けられた高さ「1」と、を取得する。このため、一致判別部１２４は、注目比較対象グループＧ１２の代表木ＰＴ１２の高さは、注目グループＧ１０の代表木ＰＴ１０の高さよりも低いので、代表木ＰＴ１２で表される概念が、代表木ＰＴ１０で表される概念よりも上位の概念である可能性があると、と判別する。

さらに、一致判別部１２４は、代表木ＰＴ１２のルートノード「落ちる」と、代表木ＰＴ１０のルートノード「落ちる」と、が一致すると判別する。また、一致判別部１２４は、代表木ＰＴ１２のルートノードに係る文節「汚れが」と、代表木ＰＴ１０のルートノードに係る文節「汚れが」と、が一致すると判別する。さらにまた、一致判別部１２４は、代表木ＰＴ１２のルートノードに係る文節「綺麗に」と、代表木ＰＴ１０のルートノードに係る文節「綺麗に」と、が一致すると判別する。すなわち、一致判別部１２４は、注目グループＧ１０の代表木ＰＴ１０が、注目比較対象グループＧ１２の代表木ＰＴ１２が有する受け文節及び係り文節の全てを有する、と判別する。

これらのため、一致判別部１２４は、注目比較対象グループＧ１２に分類された代表木ＰＴ１２は、注目グループＧ１０の代表木ＰＴ１０の部分構文木であり、注目比較対象グループＧ１２は、注目グループＧ１０の直近上位のグループであると判別する（ステップＳ６６；Ｙｅｓ）。

次に、分類部１２５は、注目比較対象グループＧ１２のグループＩＤ「G12」を注目グループＧ１０の直近上位グループＩＤとし、保存部１２１は、注目グループＧ１０のグループＩＤ「G10」と、直近上位グループＩＤ「G11」と、を対応付けて、図１６に示した包含関係テーブルに保存する（ステップＳ６７）。その後、分類部１２５は、ステップＳ６４から上記処理を繰り返す。

その後、分類部１２５は、比較対象グループＧ１３を注目比較対象グループとして、ステップＳ６４及びＳ６５の処理を実行する。

その後、一致判別部１２４は、注目比較対象グループＧ１３が、注目グループＧ１０の直近上位のグループでないと判別する（ステップＳ６６；Ｎｏ）。グループテーブルにおいて、注目比較対象グループＧ１３に対応付けられた総枝数「1」は、注目グループＧ１０に対応付けられた総枝数「3」よりも２以上少ないためである。

その後、分類部１２５は、比較対象グループＧ１４からＧ１６をそれぞれ注目比較対象グループとして、ステップＳ６４からＳ６６の処理を繰り返し実行する。これにより、分類部１２５は、注目比較対象グループＧ１４からＧ１６が、注目グループＧ１０の直近上位のグループでないと判別する。

その後、分類部１２５は、全ての比較対象グループＧ１１からＧ１６に注目したと判別する（ステップＳ６４；Ｙｅｓ）。

次に、分類部１２５は、図１６に示した包含関係テーブルに、注目グループＧ１０のグループＩＤ「G10」と、直近上位グループのグループＩＤ「G11」及び「G12」と、が対応付けて保存されていると判別する（ステップＳ６８；Ｙｅｓ）。このため、分類部１２５は、注目グループＧ１０を最上位のグループでないと判別する。

次に、分類部１２５は、グループＧ１１及びＧ１２を順に注目グループとして、ステップＳ６１から上記処理を繰り返す。これにより、保存部１２１は、グループＧ１１のグループＩＤ「G11」と、グループＧ１１の直近上位グループのグループＩＤ「G13」及び「G15」と、を、図１６に示す包含関係テーブルに、対応付けて保存する。また、保存部１２１は、グループＧ１２のグループＩＤ「G12」と、グループＧ１２の直近上位グループのグループＩＤ「G13」及び「G14」と、を対応付けて、包含関係テーブルに保存する。

次に、分類部１２５は、グループＧ１３を注目グループとし、グループＧ１０からＧ１２及びＧ１４からＧ１６を注目比較対象グループとして、ステップＳ６１からステップＳ６６の処理を繰り返す。その後、分類部１２５は、全ての比較対象グループＧ１０からＧ１２及びＧ１４からＧ１６に注目したと判別する（ステップＳ６４；Ｙｅｓ）。

次に、分類部１２５は、図１６に示した包含関係テーブルに、注目グループＧ１３のグループＩＤ「G13」と、直近上位グループのグループＩＤと、が対応付けて保存されていないと判別する（ステップＳ６８；Ｎｏ）。このため、分類部１２５は、注目グループＧ１３が最上位のグループであると判別する（ステップＳ６９）。

その後、保存部１２１は、グループＧ１３のグループＩＤと、グループＧ１３の直近上位グループが存在しないことを表す記号「-」と、を対応付けて、包含関係テーブルに保存する。

その後、分類部１２５は、グループＧ１４からＧ１６を注目グループとして、ステップＳ６１からＳ６６、Ｓ６８、及びＳ６９の処理を繰り返す。これにより、保存部１２１は、グループＧ１４からＧ１６のグループＩＤと、これらグループの直近上位グループが存在しないことを表す記号「-」と、を対応付けて、包含関係テーブルに保存する。

その後、分類部１２５は、グループＧ１０からＧ１６の全てに注目したと判別し（ステップＳ６１；Ｙｅｓ）、包含関係特定処理の実行を終了する。

図５のステップＳ０８が実行された後に、グループ分類された部分木で表される概念に基づいてグループを分類し、分類したグループ間の階層構造を特定する、図２６に示すようなグループ分類処理が実行される（図５のステップＳ０９）。

グループ分類処理を開始すると、分類部１２５は、図１６に示した包含関係テーブルを参照する。次に、分類部１２５は、包含関係テーブルに保存された記号「-」に対応付けられたグループＩＤ「G13」から「G16」を取得する。記号「-」に対応付けられたグループＩＤは、直近上位グループが存在しない最上位グループである。

次に、分類部１２５は、未だグループ集合に分類されていない最上位グループ（以下、未分類の最上位グループという）Ｇ１３からＧ１６の全てについて注目したか否かを判別する（ステップＳ７１）。このとき、分類部１２５は、グループ分類処理を開始したばかりであるので、未分類の最上位グループＧ１３からＧ１６のいずれにも注目していないため、未分類の最上位グループＧ１３からＧ１６の全てについて注目した訳ではないと判別する（ステップＳ７１；Ｎｏ）。

次に、分類部１２５は、未分類の最上位グループＧ１３からＧ１６の１つについて注目し、注目グループとする（ステップＳ７２）。ここでは、分類部１２５は、グループＧ１３に注目するとして説明する。

次に、分類部１２５は、注目グループＧ１３の代表木ＰＴ１３で表される「汚れが落ちる」という概念を表す部分木が分類されたグループが分類される新たなグループ集合ＳＧ１を生成する（ステップＳ７３）。その後、分類部１２５は、生成したグループ集合ＳＧ１に注目グループＧ１３を分類する（ステップＳ７４）。次に、保存部１２１は、グループ集合ＳＧ１のグループ集合ＩＤ「SG1」と、注目グループＧ１３のグループＩＤ「G13」と、を対応付けて、図１７に示した階層構造テーブルに保存する。

次に、分類部１２５は、図１６に示す包含関係テーブルから、注目グループＧ１３の直近下位のグループを検索し、グループＧ１１及びグループＧ１２を取得したと判別する（ステップＳ７５；Ｙｅｓ）。具体的には、分類部１２５は、直近上位グループＩＤ「G13」に対応付けられたグループＩＤ「G11」及び「G12」を取得し、取得したグループＩＤ「G11」及び「G12」で識別されるグループＧ１１及びＧ１２を直近下位グループ（以下、取得グループという）とする。

次に、分類部１２５は、ステップＳ７３で作成した新たなグループ集合ＳＧ１に、取得グループＧ１１及びＧ１２を分類する（ステップＳ７６）。

次に、分類部１２５は、取得グループＧ１１及びＧ１２の１つに注目し、注目グループとする（ステップＳ７７）。ここでは、分類部１２５は、取得グループＧ１１を注目グループとするとして説明する。

その後、分類部１２５は、ステップＳ７５からステップＳ７７を実行することで、注目グループＧ１１の直近下位のグループＧ１０を取得し、グループ集合ＳＧ１にグループＧ１０を分類し、グループＧ１０を注目グループとする。

その後、分類部１２５は、ステップＳ７５を実行し、図１６に示す包含関係テーブルから、注目グループＧ１０の直近下位のグループが取得できなかったと判別する（ステップＳ７５；Ｎｏ）。

次に、分類部１２５は、ステップＳ７６で取得された取得グループＧ１１、Ｇ１２、及びＧ１０の内で、未だ注目していないグループＧ１２がある、と判別する（ステップＳ７８；Ｙｅｓ）。

次に、分類部１２５は、未だ注目していないグループＧ１２を注目グループとし（ステップＳ７９）、ステップＳ７５からＳ７７の処理を繰り返す。これにより、分類部１２５は、注目グループＧ１２の直近下位のグループＧ１０を取得する。また、保存部１２１は、グループ集合ＩＤ「SG1」と、グループＩＤ「G10」と、直近上位グループＩＤ「G12」と、を対応付けて、図１７に示した階層構造テーブルに保存する。

その後、分類部１２５は、ステップＳ７５で、図１６に示す包含関係テーブルから、注目グループＧ１０の直近下位のグループが取得できなかったと判別する（ステップＳ７５；Ｎｏ）。

次に、分類部１２５は、ステップＳ７６で取得された取得グループＧ１１、Ｇ１２、及びＧ１０の内で、未だ注目していないグループがない、と判別する（ステップＳ７８；Ｎｏ）。

その後、分類部１２５は、ステップＳ７１からステップＳ７７を繰り返し実行する。これにより、分類部１２５は、新たなグループ集合ＳＧ２からＳＧ４を生成する。また、分類部１２５は、グループＧ１４と、グループＧ１４の直近下位グループＧ１２と、グループＧ１２の直近下位グループＧ１０と、をグループ集合ＳＧ２に分類する。さらに、分類部１２５は、グループＧ１５と、グループＧ１５の直近下位グループＧ１１と、グループＧ１１の直近下位グループＧ１０と、をグループ集合ＳＧ３に分類する。またさらに、分類部１２５は、グループＧ１６をグループ集合ＳＧ４に分類する。

その後、分類部１２５は、未だ注目していない取得グループはない、と判別する（ステップＳ７８；Ｎｏ）。次に、分類部１２５は、最上位グループＧ１３からＧ１６の全てについて注目したと判別し（ステップＳ７１；Ｙｅｓ）、グループ分類処理の実行を終了する。

図５のステップＳ０９で、グループ分類処理の実行が終了すると、「綺麗に落ちる。」という互いに共通した概念を表す部分木が分類されたグループＧ１０、Ｇ１２、及びＧ１４が、グループ集合ＳＧ２に分類されている。これらのグループＧ１０、Ｇ１２、及びＧ１４は、図２７に示すような階層構造を形成している。この階層構造では、グループＧ１０を、グループＧ１０よりも上位のグループＧ１２が包含し、グループＧ１２を、グループＧ１２よりも上位のグループＧ１４が包含する。

尚、グループ集合ＳＧ１に分類されたグループＧ１０、Ｇ１１、Ｇ１２、及びＧ１３、グループ集合ＳＧ３に分類されたグループＧ１０、Ｇ１１、及びＧ１５、並びにグループ集合ＳＧ４に分類されたグループＧ１６は、図示を省略するが、それぞれ異なる階層構造を形成する。

図５のステップＳ０９で部分木集計処理が実行された後に、図６に示す出力部１２７は、図３に示した集計結果画面を生成する集計結果画面生成処理を実行する（ステップＳ１０）。

集計結果画面生成処理を開始すると、出力部１２７は、図３に示した集計結果画面を生成する。次に、出力部１２７は、図１７に示した階層構造テーブルに保存されたグループ集合ＧＳ１からＧＳ４までにそれぞれ分類されたグループを表すツリーＴ１から４を作成し、集計結果画面に表示する。

具体的には、先ず、出力部１２７は、階層構造テーブルから、直近上位グループが無いことを表す記号「-」に対応付けられたグループＩＤ（つまり、最上位グループのグループＩＤ）「G13」を取得する。次に、出力部１２７は、図１５に示したグループテーブルから、グループＩＤ「G13」に対応付けたグループ名「汚れが落ちる。」、グループ名一致木数「2」、及び総木数「5」を取得する。その後、出力部１２７は、取得したグループ名を表す文字列の末尾に、グループ名一致木数を丸括弧で囲った文字列と、総木数を角括弧で囲った文字列と、を表すルートＲＴ１を生成し、ツリーＴ１のルートとする。

次に、出力部１２７は、階層構造テーブルから、直近上位グループＩＤ「G13」に対応付けられたグループＩＤ（つまり、グループＧ１３の直近下位グループのグループＩＤ）「G11」及び「G12」を取得する。次に、出力部１２７は、グループテーブルから、グループＩＤ「G11」に対応付けたグループ名「靴下の汚れが落ちる。」、グループ名一致木数「1」、及び総木数「2」を取得する。また、出力部１２７は、グループテーブルから、グループＩＤ「G12」に対応付けたグループ名「汚れが綺麗に落ちる。」、グループ名一致木数「1」、及び総木数「3」を取得する。その後、出力部１２７は、２つのグループそれぞれに対して、取得したグループ名を表す文字列の末尾に、それぞれのグループのグループ名一致木数を丸括弧で囲った文字列と、総木数を角括弧で囲った文字列と、を表す葉ＬＦ１２及びＬＦ１３を生成する。次に、出力部１２７は、葉ＬＦ１２及びＬＦ１３と、ルートＲＴ１と、を結ぶ枝をそれぞれ生成する。

その後、出力部１２７は、階層構造テーブルから、直近上位グループＩＤ「G11」に対応付けられたグループＩＤ（つまり、グループＧ１１の直近下位グループのグループＩＤ）「G10」を取得する。次に、出力部１２７は、グループテーブルから、グループＩＤ「G10」に対応付けたグループ名「靴下の汚れが綺麗に落ちる。」、グループ名一致木数「1」、及び総木数「2」を取得する。その後、出力部１２７は、取得したグループ名を表す文字列の末尾に、それぞれのグループのグループ名一致木数を丸括弧で囲った文字列と、総木数を角括弧で囲った文字列と、を表す葉ＬＦ１４を生成する。その後、出力部１２７は、葉ＬＦ１４と、葉ＬＦ１２と、を結ぶ枝を生成する。

同様に、出力部１２７は、階層構造テーブルから、直近上位グループＩＤ「G12」に対応付けられたグループＩＤ（つまり、グループＧ１２の直近下位グループのグループＩＤ）「G10」を取得する。その後、出力部１２７は、グループＧ１０のグループ名を表す文字列の末尾に、グループＧ１０のグループ名一致木数を丸括弧で囲った文字列と、総木数を角括弧で囲った文字列と、を表す葉ＬＦ１５を生成する。その後、出力部１２７は、葉ＬＦ１５と、葉ＬＦ１３と、を結ぶ枝を生成する。

このようにして、出力部１２７は、ルートＲＴ１と、葉ＬＦ１１からＬＦ１５と、を有するツリーＴ１を生成する。また、出力部１２７は、同様に、ルートＲＴ２と葉ＬＦ２２及びＬＦ２３とを有するツリーＴ２と、ルートＲＴ３と葉ＬＦ３１及びＬＦ３２とを有するツリーＴ３と、ルートＲＴ４のみを有するツリーＴ４と、を生成する。その後、出力部１２７は、ツリーＴ１からツリーＴ４を集計結果画面に表示する。

その後、出力部１２７は、生成した集計画面をＬＡＮカード１０６へ出力する（図５のステップＳ１１）。その後、ＬＡＮカード１０６が端末装置２０へ集計結果画面を送信した後に、出力部１２７は、集計処理の実行を終了する。

尚、端末装置２０は、集計結果画面を受信すると、受信した集計結果画面を表示部に表示する。

本実施例では、入力部１２０は、端末装置２０若しくは２１から受信したアンケートの回答文を入力するとして説明したが、回答文は、日本語の文に限定される訳ではない。

これらの構成によれば、集計装置１００は、部分木ＰＴ１０からＰＴ１５のいずれか１つと、部分木ＰＴ２０からＰＴ２５のいずれか１つと、の組み合わせの全てについて、図２１のステップＳ２６ｂの処理を実行する。集計装置１００は、ステップＳ２６ｂで、部分木ＰＴ１０からＰＴ１５のいずれか１つで表される表現と、部分木ＰＴ２０からＰＴ２５のいずれか１つで表される表現と、が、一致すると判別すると、これらの部分木を同じグループへ分類する。その後、集計装置１００は、グループに分類された部分木の数、若しくは、当該グループに分類された１の部分木若しくは複数の部分木でそれぞれ表される表現を出力する。このため、集計装置１００は、入力された複数の文において部分木で表される表現がどれだけ使用されたかを集計できる。

また、これらの構成によれば、集計装置１００は、部分木の高さ、枝数、根と枝に付された葉とにそれぞれ割り当てられた文節に基づいて複数の部分木が同じ表現を表しているか否かを判別する。ここで、部分木の高さ及び枝数が異なれば、根と枝に付された葉とにそれぞれ割り当てられた文節の係り受け関係が異なる。このため、集計装置１００は、複数の部分木が係り受け関係の同じ表現を表すか否かを判別できる。

さらに、これらの構成によれば、集計装置１００は、図２１のステップＳ２６ｂにおいて、部分木ＰＴ１０の係り文節と、部分木ＰＴ２０の係り文節と、が、一致しているか否か、及び部分木ＰＴ１０の受け文節と、部分木ＰＴ２０の受け文節と、が、一致しているか否か、に基づいて、部分木ＰＴ１０で表される表現と部分木ＰＴ２０で表される表現とが一致した内容を表すか否かを判別する。ここで、部分木の高さ、枝数、及び文節が同じであっても、係り文節同士及び受け文節同士のいずれかが異なれば、文節の係り受け関係が異なる。このため、集計装置１００は、複数の部分木が係り受け関係の同じ表現を表すか否かを精度良く判別できる。

またさらに、これらの構成によれば、集計装置１００は、図２３のステップＳ３８において、グループＧ１０とグループＧ１１との間の包含関係を、グループＧ１０に属する部分木の高さ、枝数、及び文節の数と、グループＧ１１に属する部分木の高さ、枝数、及び文節の数と、に基づいて判別する。このため、集計装置１００は、グループＧ１１に分類された部分木ＰＴ１０及びＰＴ２０でそれぞれ表される表現と、グループＧ１２に分類された部分木ＰＴ１１及びＰＴ２１でそれぞれ表される表現と、を、グループＧ１１とグループＧ１２との包含関係に基づいて配列して出力できる。よって、ユーザは、部分木ＰＴ１０及びＰＴ２０でそれぞれ表される表現は、それぞれ同じ内容を表し、部分木ＰＴ１１及びＰＴ２１でそれぞれ表される同じ内容を表す表現に包含される概念を表すか否かを容易に理解できる。

これらの構成によれば、集計装置１００は、図２３に示したグループ分類処理において、集計装置１００は、グループＧ１１に分類された部分木ＰＴ１１が有する係り文節の全てが、グループＧ１０に分類された部分木ＰＴ１０が有する係り文節のいずれかと一致すると、部分木ＰＴ１１で表される表現は、部分木ＰＴ１０で表される表現よりも上位の表現であると判別する。また、集計装置１００は、グループＧ１１に分類された部分木ＰＴ１１が表す表現が、グループＧ１０に分類された部分木ＰＴ１０が表す表現よりも上位の表現であると判別すると、グループＧ１１をグループＧ１０より上位のグループとする。ここで、同じ受け文節に係る係り文節の数が多い程、これらの係り文節は、受け文節で表される内容をより詳細に限定する。このため、集計装置１００は、複数のグループに分類した複数の部分木でそれぞれ表される表現の包含関係を精度良く判別できる。

これらの構成によれば、集計装置１００は、図２３に示したグループ分類処理において、集計装置１００は、グループＧ１１に分類された部分木ＰＴ１１と、グループＧ１３に分類された部分木ＰＴ１３と、で、係り文節「汚れが」及び受け文節「落ちる」が一致すると判別すると、係り文節「汚れが」に係る「靴下の」を有さない部分木ＰＴ１３で表される表現は、部分木ＰＴ１１で表される表現よりも上位の表現であると判別する。ここで、係り文節が追加された部分木は、追加前の部分木で表される表現を係り文節でより限定した表現を表す。このため、集計装置１００は、複数の部分木でそれぞれ表される表現の包含関係を精度良く判別できる。

また、これらの構成によれば、図２１に示した部分木分類処理において、分類対象木の文節と注目分類済木の文節とに表記ゆれがあったり、分類対象木の文節が注目分類済木の文節の同義語若しくは言い換えである場合であっても、分類対象木で表される表現と注目分類済木で表される表現とが同一の内容を表す表現か否かを判別できる。

＜実施例２＞
実施例１では、図９（ｂ）を参照して説明したように、図６の一致判別部１２４は、第１部分木で表される文「靴下の汚れが綺麗に落ちる。」と、第２部分木で表される文「靴下の汚れが綺麗に取れる。」と、は、実質的に一致する内容を表すと判別する。これは、第１部分木のルートノードと、第２部分木のルートノードと、が相違するが互いに同義語であり、ルートノードに係る文節「汚れ」及び「綺麗に」と、文節「汚れ」に係る文節「靴下の」と、が、第１部分木と第２部分木とで一致するためである。

実施例２では、一致判別部１２４は、第１部分木が、ルートノードなどの受け文節と、当該受け文節に係る所定数の係り文節と、を有し、かつ第２部分木が、ルートノードなどの受け文節と、当該受け文節に係る所定数の係り文節と、を有する場合に、当該所定数の係り文節がそれぞれ互いに一致すると判別すると、受け文節も互いに一致すると判別し、第１部分木と第２部分木とが一致していると判別する。尚、好適な所定数は、実験により当業者が定めることができる。

図２８に示す第１部分木と第２部分木とを例に挙げて説明する。
一致判別部１２４は、図２８に示す第１部分木で表される文「私は興味があまりない。」と、第２部分木で表される文「私は興味があまりわかない。」と、は、実質的に一致する内容を表すと判別する。

一致判別部１２４は、第１部分木のルートノードと、第２部分木のルートノードと、が相違し、かつ互いに同義語でなくとも、ルートノードに係る文節「あまり」及び「興味が」と、文節「興味が」に係る文節「私は」と、が、第１部分木と第２部分木とで一致する場合には、第１部分木と第２部分木とが実質的に一致すると判別するためである。

ここで、ユーザは、アンケートなどの質問に定型化された文で回答することが多い。この定型化された文には、修飾語（つまり、係り文節）が定型化されているが被修飾語（つまり、受け文節）が定型化されていない、同じ内容を表す複数の文が存在することが多い。このため、これらの構成によれば、受け文節が互いに一致していなくとも、所定数の係り文節が互いに一致している場合に、一致判別部１２４は、受け文節が互いに一致しているとみなす。このため、複数の部分木でそれぞれ表される複数の文が定型化された文である場合に、複数の部分木が互いに一致した内容を表すか否かを従来よりも精度良く判別できる。

＜実施例３＞
実施例１では、図４に示したＣＰＵ１０１は、図５に示した集計処理を実行すると説明したが、実施例３では、ＣＰＵ１０１は、図２９に示す集計処理を実行する。これにより、ＣＰＵ１０１は、図６に示した各機能部の他に、図３０に示す文節変換部１２８として機能する。

文節変換部１２８は、部分木生成部１２３で生成された部分木が、以下の変換前条件（１）から（３）の全てを満たす場合に、以下の変換後条件（１）及び（２）を満たすように部分木を変換する。

変換前条件（１）：部分木の係り文節の末尾が助詞の「と」若しくは「とは」である。
変換前条件（２）：当該係り文節が、動詞、形容詞、若しくは形容動詞（つまり、用言）を含み、肯定表現を表し、かつ当該係り文節と、当該係り文節を受ける受け文節と、の間に読点「、」若しくは「，」が無い。
変換前条件（３）：当該受け文節が否定表現を表す。

変換後条件（１）：当該受け文節が肯定表現を表す。
変換後条件（２）：当該係り文節が否定表現を表す。

ここで、例えば、生成された部分木が、図３１（ａ）に示すような部分木である場合を例に挙げて説明する。

図３１（ａ）に示す部分木は、文「私は汚れが落ちると思わない。」を表す。この部分木を、文節変換部１２８は、図３１（ｂ）に示す、「私は汚れが落ちないと思う。」を表す部分木に変換する。

これは、この部分木の文節「思わない」に係る係り文節「落ちると」の末尾が助詞の「と」であるため、文節変換部１２８は、図３１（ａ）の部分木が変換前条件（１）を満足すると判別するからである。

また、この部分木の係り文節「落ちると」は、動詞（つまり、用言）を含む。また、当該係り文節「落ちると」は、肯定的な表現である。さらに、当該係り文節「落ちると」と、係り文節「落ちると」を受ける受け文節「思わない」と、の間に読点「、」若しくは「，」が無い。このため、文節変換部１２８は、図３１（ａ）の部分木が変換前条件（２）を満足すると判別するためである。

さらに、この部分木の受け文節「思わない」は、否定表現を含んでいる。このため、文節変換部１２８は、図３１（ａ）の部分木が変換前条件（３）を満足すると判別するためである。

これらのため、文節変換部１２８は、受け文節「思わない」を、肯定的表現を表す「思う」に変換し、かつ係り文節「落ちると」を、否定的表現を表す「落ちないと」に変換する。これにより、文節変換部１２８は、変換後条件（１）及び（２）を満足する、図３１（ｂ）に示す部分木に変換するのである。

図３１（ａ）に示す変換前の部分木は、文「汚れが落ちると思わない。」を表す。この文の文節「思わない」という否定表現により否定されるのは、文節「思わない」に係る文節「落ちる」である。このため、文節「思わない」を肯定表現「思う」とし、係り文節「落ちる」を否定表現「落ちない」としても、意味内容が変化しない。すなわち、図３１（ａ）に示す変換前の部分木で表される文「汚れが落ちると思わない。」と、図３１（ｂ）に示す変換後の部分木で表される文「汚れが落ちないと思う。」とは、同じ意味内容を表す。このため、文節変換部１２８が部分木を変換する前と後とで、部分木で表される文の内容が変化しない。

同様に、部分木生成部１２３で生成された部分木が、図３１（ｃ）に示すような部分木である場合には、文節変換部１２８は、図３１（ｂ）に示す部分木に変換する。

図３１（ｃ）に示す部分木は、文「私は汚れが落ちる『とは』思わない。」を表す。この部分木の文節「落ちるとは」の末尾が助詞の「とは」であるので、文節変換部１２８は、この部分木が変換前条件（１）を満足すると判別するからである。

これに対して、部分木生成部１２３で生成された部分木が、図３２（ａ）に示すような部分木である場合には、文節変換部１２８は、図３２（ｂ）に示す部分木に変換しない。

図３２（ａ）に示す部分木は、文「私は汚れが落ちると、聞かない」を表す。この部分木の係り文節「落ちると」と、受け文節「聞かない」と、の間に読点「、」があるので、文節変換部１２８は、この部分木が変換前条件（２）を満足しないと判別するからである。

図３２（ａ）に示す変換前の部分木は、文「汚れが落ちると、聞かない。」を表し、この文の文節「聞かない」という否定表現により否定されるのは、文節「聞かない」に係る文節「落ちる」ではない。文節「聞かない」と文節「落ちる」との間に読点が用いられているからである。

このため、文節「聞かない」を肯定表現「聞く」とし、係り文節「落ちる」を否定表現「落ちない」とすると、意味内容が変化する。すなわち、図３２（ａ）に示す部分木で表される文「汚れが落ちると、聞かない」は、図３２（ｂ）に示す部分木で表される文「汚れが落ちない、と聞く」か否かに言及する文ではないからである。よって、文節変換部１２８は、変換前条件（２）を満足しない部分木を変換しない。

次に、図３０に示す文節変換部１２８などの各機能部で行われるＣＰＵ１０１の動作について説明する。

ＣＰＵ１０１は、端末装置２０若しくは２１からアンケートの回答文を受信すると、図２９に示す集計処理の実行を開始し、ステップＳ０１からＳ０６の処理を実行する。

次に、文節変換部１２８は、ステップＳ０５及びステップＳ０６でそれぞれ生成された複数の部分木の内で、上記変換前条件（１）から（３）の全てを満足する部分木を、上記変換後条件（１）及び（２）を満足する部分木に変換する変換処理を実行する（ステップＳ０６ｂ）。

その後、分類部１２５は、変換された部分木を用いて、図２１に示した部分木分類処理を実行する（ステップＳ０７ａ）。

ここで、図２２のステップＳ２６ｂについて、注目分類済木が、図３１（ｂ）に示す部分木であり、分類対象木が文節変換部１２８によって、図３１（ａ）に示す部分木から図３１（ｂ）に示す部分木に変換される場合を例に挙げて説明する。

変換前の分類対象木で表される文は、図３１（ａ）に示すような「私は汚れが落ちると思わない。」であった。これに対して、注目分類済木で表される文は、図３１（ｂ）に示すような「私は汚れが落ちないと思う。」である。このため、変換前の分類対象木と、注目分類済木と、は、同じ意味内容の文を表すにもかかわらず、互いに一致する部分木と判別されない。変換前の分類対象木の係り文節「落ちると」と、注目分類済木の係り文節「落ちない」と、が相違し、かつ変換前の分類対象木の受け文節「思わない」と、注目分類済木の受け文節「思う」と、が相違するためである。

しかし、変換後の分類対象木で表される文は、注目分類済木で表される文と同じ、図３１（ｂ）に示す文「汚れが落ちないと思う。」である。このため、変換後の分類対象木と、注目分類済木と、は、互いに一致する部分木と判別される。よって、これらの構成によれば、複数の部分木が同じ内容を表しているか否かを判別する判別精度が従来よりも向上する。

＜実施例４＞
実施例３では、文節変換部１２８は、部分木生成部１２３で生成された部分木が、上記変換前条件（１）から（３）の全てを満たす場合に、上記変換後条件（１）及び（２）を満たすように部分木を変換するとして説明した。

すなわち、文節変換部１２８は、例えば、図３１（ａ）に示すような、文「汚れが落ちると思わない。」を表す部分木を、図３１（ｂ）に示すような、文「汚れが落ちないと思う。」を表す部分木に変換するとして説明した。

本実施例では、文節変換部１２８は、部分木生成部１２３で生成された部分木が、上記変換前条件（１）及び（２）並びに下記変換前条件（４）の全てを満たす場合に、下記の変換後条件（３）及び（４）を満たすように部分木を変換する。

変換前条件（４）：当該係り文節が否定表現を表す。

変換後条件（３）：当該受け文節が否定表現を表す。
変換後条件（４）：当該係り文節が肯定表現を表す。

すなわち、文節変換部１２８は、例えば、図３１（ｂ）に示すような、文「私は汚れが落ちないと思う。」を表す部分木を、図３１（ａ）に示すような、文「私は汚れが落ちると思わない。」を表す部分木に変換する。

＜実施例５＞
実施例１では、２以上の文節で構成される回答文が入力された場合に、集計装置１００が実行する集計処理を実行について説明した。これに対して、本実施例では、２以上の文節で構成される回答文と、ただ１つの文節からなる回答文と、が入力された場合に、集計装置１００が実行する集計処理を実行について説明する。以下、主に、実施例１との相違点について説明する。

本実施例において、集計装置１００は、「この商品ＸＸＸの良いところは何ですか？」というアンケートに対する回答文を入力するとして説明を行う。

集計装置１００が、図５に示した集計処理の実行を開始すると、ステップＳ０１及びステップＳ０２を実行する。これにより、集計装置１００は、アンケートに対する回答文を入力し、入力した回答文を、図１１に示した入力文テーブルに保存する。

ここで、ステップＳ０２の処理が終了したとき、入力文テーブルには、図３３に示すような８つの文が保存されているとして説明を行う。

図３３に示す８つの文は、文ＩＤ「ST11」で識別される文「とても値段が安い。」、文ＩＤ「ST12」で識別される文「価格が安い。」、文ＩＤ「ST13」で識別される文「値段が魅力。」、文ＩＤ「ST14」で識別される文「値段。」、文ＩＤ「ST15」で識別される文「価格。」、文ＩＤ「ST16」で識別される文「安い。」、文ＩＤ「ST17」及び「ST18」で識別される文「汚れ落ち。」である。

文ＩＤ「ST11」から「ST13」でそれぞれ識別される文は、２以上の文節で構成される文である。これに対して、文ＩＤ「ST14」から「ST18」でそれぞれ識別される文は、ただ１つの文節からなる文である。

図５のステップＳ０２の後に、入力部１２０は、入力文テーブルに保存された全ての回答文を読み出し（ステップＳ０３）、読み出した８つの文を形態素解析し（ステップＳ０４ａ）、形態素解析により得られた形態素列を構文解析する（ステップＳ０４ｂ）。

このようにして、構文解析部１２２は、文ＩＤ「ST11」から「ST13」でそれぞれ識別される２以上の文節で構成される文から、図３４（ａ）、図３４（ｅ）、及び図３４（ｇ）にそれぞれ示すような、それぞれの文を表す完全木Ｆ１１からＦ１３を生成する。これに対して、構文解析部１２２は、文ＩＤ「ST14」から「ST18」でそれぞれ識別されるただ１つの文節からなる文から、図３５（ａ）、図３５（ｄ）、図３５（ｇ）、図３６（ａ）、及び図３６（ｄ）にそれぞれ示すような、それぞれの文を表す１つのノードのみで構成される完全木Ｆ１４からＦ１８を生成する（図５のステップＳ０５）。

次に、部分木生成部１２３は、実施例１と同様に、図３４（ａ）に示す完全木ＦＴ１１から、図３４（ｂ）から図３４（ｄ）にそれぞれ示す部分木Ｐ１１０からＰＴ１１２を生成する。同様に、部分木生成部１２３は、図３４（ｅ）に示す完全木ＦＴ１２から、図３４（ｆ）に示す部分木Ｐ１２０を生成し、図３４（ｇ）に示す完全木ＦＴ１３から、図３４（ｈ）に示す部分木Ｐ１３０を生成する。

また、本実施例では、部分木生成部１２３は、図３５（ａ）に示す完全木ＦＴ１４から、完全木ＦＴ１４が有するただ１つのノードを受ける全ての文節を表すルート「＊」が追加された、図３５（ｂ）に示すような部分木（以下、受け追加部分木という）ＰＴ１４０を生成する。また、部分木生成部１２３は、完全木ＦＴ１４から、完全木ＦＴ１４が有するただ１つのノードに係る全ての文節を表す葉「＊」が追加された、図３５（ｃ）に示すような部分木（以下、係り追加部分木という）ＰＴ１４１を生成する。

同様に、部分木生成部１２３は、図３５（ｄ）に示す完全木ＦＴ１５から、図３５（ｅ）に示す受け追加部分木ＰＴ１５０及び図３５（ｆ）に示す係り追加部分木ＰＴ１５１を生成する。また同様に、部分木生成部１２３は、図３５（ｇ）に示す完全木ＦＴ１６から、図３５（ｈ）に示す受け追加部分木ＰＴ１６０及び図３５（ｉ）に示す係り追加部分木ＰＴ１６１を生成する。さらに同様に、部分木生成部１２３は、図３６（ａ）に示す完全木ＦＴ１７から、図３６（ｂ）に示す受け追加部分木ＰＴ１７０及び図３６（ｃ）に示す係り追加部分木ＰＴ１７１を生成する。またさらに同様に、部分木生成部１２３は、図３６（ｄ）に示す完全木ＦＴ１８から、図３６（ｅ）に示す受け追加部分木ＰＴ１８０及び図３６（ｆ）に示す係り追加部分木ＰＴ１８１を生成する（図５のステップＳ０６）。

その後、ルート「＊」や葉「＊」を有する部分木（つまり、ただ１つの文節からなる文から生成された部分木）を除いた部分木（つまり、２以上の文節で構成された文から生成された部分木）について、図２２に示した部分木分類処理が実行される（ステップＳ０７ａ）。

部分木分類処理の実行が終了すると、図３７に示すように、グループＧ１１０に部分木ＰＴ１１０が分類され、グループＧ１１１に部分木ＰＴ１１１が分類されている。また、グループＧ１１２に部分木ＰＴ１１２及びＰＴ１２０が分類されている。図１４（ｂ）に示す同義語テーブルには、「価格」と「価格」の同義語である「値段」とが対応付けて保存されているためである。さらに、グループＧ１３０に部分木ＰＴ１３０が分類されている。

図５のステップＳ０７ａが実行された後に、集計部１２６は、図２４に示す部分木集計処理を実行する（ステップＳ０７ｂ）。実施例１では、集計部１２６は、各グループについて、グループの代表木で表される文をグループ名とするとして説明した。これに対して、本実施例では、集計部１２６は、グループに分類された部分木が１つの場合は、当該部分木で表される文をグループ名とし、グループに分類された部分木が複数の場合は、当該複数の部分木でそれぞれ表される文を「，」で連結した文をグループ名とする。

図５のステップＳ０７ｂの実行が終了すると、分類部１２５は、図２５に示した包含関係特定処理を実行することで、図３７に示すグループＧ１１０、グループＧ１１１、グループＧ１１２、及びグループＧ１３０の包含関係を特定する（図５のステップＳ０８）。

次に、分類部１２５は、図２６に示したグループ分類処理を実行する（ステップＳ０９）。これにより、分類部１２５は、図３８に示すように、グループＧ１１０及びグループＧ１１２を、「値段が安い」若しくは「価格が安い」という概念を表すグループが分類されるグループ集合ＳＧ１１に分類する。また、分類部１２５は、グループＧ１１０及びグループＧ１１１を、「とても安い」という概念を表すグループが分類されるグループ集合ＳＧ１２に分類する。さらに、分類部１２５は、グループＧ１３０を、「値段が魅力」という概念を表すグループが分類されるグループ集合ＳＧ１３に分類する。

さらに、分類部１２５は、グループ集合ＳＧ１１に分類したグループＧ１１０は、グループＧ１１０よりも上位のグループであるグループＧ１１２によって包含されるという階層構造を特定する。同様に、分類部１２５は、グループ集合ＳＧ１２に分類したグループＧ１１０は、グループＧ１１０よりも上位のグループであるグループＧ１１１によって包含されるという階層構造を特定する。

次に、出力部１２７は、図３に示した集計結果画面を生成する集計結果画面生成処理を実行する（図５のステップＳ１０）。

集計結果画面生成処理を開始すると、出力部１２７は、特定された階層構造に従って、図３９に示すツリーＴ１１からＴ１３を生成する。ツリーＴ１１は、グループＧ１１２のグループ名と、グループＧ１１２の総木数「2」と、を表すルートＲＴ１１と、グループＧ１１０のグループ名と、グループＧ１１０の総木数「2」と、を表す葉ＬＦ１１１と、を有する。また、ツリーＴ１２は、グループＧ１１１のグループ名と、グループＧ１１１の総木数「1」と、を表すルートＲＴ１２と、グループＧ１１０のグループ名と、グループＧ１１２の総木数「2」と、を表す葉ＬＦ１２１と、を有する。さらに、ツリーＴ１３は、グループＧ１３０のグループ名と、グループＧ１３０の総木数「1」と、を表すルートＲＴ１３を有する。

次に、出力部１２７は、ただ１つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図３５（ｂ）に示す受け追加部分木ＰＴ１４０と、図３５（ｃ）に示す係り追加部分木ＰＴ１４１と、を特定する。

次に、出力部１２７は、「価格＊」を表す受け追加部分木ＰＴ１４０と実質的に一致し、２文節からなり、かつ文「値段が安い」を表す部分木ＰＴ１１２と、受け追加部分木ＰＴ１４０と完全に一致し、２文節からなり、かつ文「価格が安い」を表すＰＴ１２０と、が分類されたグループ１１２を特定する。また、出力部１２７は、「価格＊」を表す受け追加部分木ＰＴ１４０と実質的に一致し、２文節からなり、かつ「値段が魅力」を表す部分木ＰＴ１３０が分類されたグループ１３０を特定する。次に、出力部１２７は、係り追加部分木ＰＴ１４１と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。

その後、出力部１２７は、グループ１１２に分類された部分木の総木数「2」の方が、グループ１３０に分類された部分木の総木数「1」より多いと判別する。文「価格」は、グループ１１２に分類された部分木ＰＴ１１２で表される文「価格が安い」が表す内容と同じ内容を表す文として回答者が回答した文であると推測される。このため、出力部１２７は、追加部分木ＰＴ１４０の生成に用いられた１つの文節のみからなる文「価格」が表す意味内容は、受け文節「安い」で補足説明されると判別する。

次に、出力部１２７は、図４０に示すツリーＴ１１の有する「値段が安い，価格が安い」を表すルートＴ１１を、「値段が安い，価格が安い，価格」を表すルートに変更し、ルートＴ１１が表す総木数を値「1」増加させて「3」とする。

次に、出力部１２７は、ただ１つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図３５（ｅ）に示す受け追加部分木ＰＴ１５０と、図３５（ｆ）に示す係り追加部分木ＰＴ１５１と、を特定する。次に、出力部１２７は、追加部分木ＰＴ１５０の生成に用いられた１つの文節のみからなる文「値段」が表す意味内容は、受け文節「安い」で補足説明されると判別する。次に、出力部１２７は、ツリーＴ１１が有する「値段が安い，価格が安い，価格」を表すルートＴ１１を、「値段が安い，価格が安い，価格，値段」を表すルートに変更し、ルートＴ１１が表す総木数を値「1」増加させて「4」とする。

次に、出力部１２７は、ただ１つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図３５（ｈ）に示す受け追加部分木ＰＴ１６０と、図３５（ｉ）に示す係り追加部分木ＰＴ１６１と、を特定する。

次に、出力部１２７は、「安い＊」を表す受け追加部分木ＰＴ１６０と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。また、出力部１２７は、「＊安い」を表す受け追加部分木ＰＴ１６０と完全一致し、２文節からなり、かつ文「とても安い」を表す部分木ＰＴ１１１が分類されたグループ１１１を特定する。さらに、出力部１２７は、「＊安い」を表す受け追加部分木ＰＴ１６０と完全一致し、２文節からなり、かつ文「値段が安い」を表す部分木ＰＴ１１２及び文「価格が安い」を表すＰＴ１２０が分類されたグループ１１２を特定する。

その後、出力部１２７は、グループ１１２に分類された部分木の総木数「2」の方が、グループ１１１に分類された部分木の総木数「1」より多いと判別する。このため、出力部１２７は、追加部分木ＰＴ１６０の生成に用いられた１つの文節のみからなる文「安い」が表す意味内容は、受け文節「値段」若しくは「価格」で補足説明されると判別する。

次に、出力部１２７は、図４０に示すツリーＴ１１が有する「値段が安い，価格が安い，価格，値段」を表すルートＴ１１を、「値段が安い，価格が安い，価格，値段，安い」を表すルートに変更し、ルートＴ１１が表す総木数を値「1」増加させて「5」とする。

その後、出力部１２７は、ただ１つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図３６（ｂ）に示す受け追加部分木ＰＴ１７０と、図３６（ｃ）に示す係り追加部分木ＰＴ１７１と、及び、図３６（ｅ）に示す受け追加部分木ＰＴ１８０と、図３６（ｆ）に示す係り追加部分木ＰＴ１８１と、を特定する。

次に、出力部１２７は、「汚れ落ち＊」を表す受け追加部分木ＰＴ１７０及びＰＴ１８０と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。また、出力部１２７は、「＊汚れ落ち」を表す係り追加部分木ＰＴ１７１及びＰＴ１８１と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。その後、出力部１２７は、「汚れ落ち」と総木数「2」とを表すルートＲＴ１４を有するツリーＴ１４を生成する。

その後、出力部１２７は、ツリーＴ１１からＴ１４を集計結果画面に表示する。

その後、出力部１２７は、生成した集計画面をＬＡＮカード１０６へ出力した後に（図５のステップＳ１１）、集計処理の実行を終了する。

実施例１から５は、互いに組み合わせることができる。実施例１から５のいずれかに係る機能を実現するための構成を備えた集計装置１００として提供できることはもとより、複数の装置で構成されるシステムであって、実施例１から５のいずれかに係る機能を実現するための構成をシステム全体として備えたシステムとして提供することもできる。

尚、実施例１から５のいずれかに係る機能を実現するための構成を予め備えた集計装置１００として提供できることはもとより、プログラムの適用により、既存の集計装置１００を実施例１から５のいずれかに係る集計装置１００として機能させることもできる。すなわち、実施例１から５のいずれかで例示した集計装置１００による各機能構成を実現させるための集計プログラムを、既存の集計装置を制御するコンピュータ（ＣＰＵなど）が実行できるように適用することで、実施例１から５のいずれかに係る集計装置１００として機能させることができる。

このようなプログラムの配布方法は任意であり、例えば、メモリカード、ＣＤ−ＲＯＭ、又はＤＶＤ−ＲＯＭなどの記録媒体に格納して配布できる他、インターネットなどの通信媒体を介して配布することもできる。また、本発明に係る集計方法は、実施例１から５のいずれかに係る集計装置１００を用いて実施できる。

以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。

１０：通信網
２０、２１：端末装置
１００：集計装置
１０１：ＣＰＵ
１０２：ＲＯＭ
１０３：ＲＡＭ
１０４：ハードディスク
１０５：メディアコントローラ
１０６：ＬＡＮカード
１０７：ビデオカード
１０８：ＬＣＤ
１０９：キーボード
１１０：スピーカ
１１１：タッチパッド
１２０：入力部
１２１：保存部
１２２：構文解析部
１２３：部分木生成部
１２４：一致判別部
１２５：分類部
１２６：集計部
１２７：出力部
１２８：文節変換部
１２９：情報記憶部

Claims

入力された文を集計する集計装置であって、
第１文と第２文とを入力する入力部と、
前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析部と、
前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成部と、
前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別部と、
前記互いに一致した内容を表すと判別された第１表現と第２表現との１の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第１表現と第２表現との複数の組み合わせのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類部と、
前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の部分木でそれぞれ表される表現を出力する出力部と、を備える、
ことを特徴とする集計装置。
請求項１に記載の集計装置であって、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木と、当該部分木組み合わせを構成する第２部分木と、が、高さと、枝数と、根及び１若しくは複数の葉にそれぞれ割り当てられた文節と、の全てにおいて一致する場合に、当該第１部分木で表される第１表現と、当該第２部分木で表される第２表現と、が一致していると判別する、
ことを特徴とする集計装置。
請求項１又は２に記載の集計装置であって、
前記部分木生成部は、前記生成された第１文の構文木から、前記第１文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第１部分木を１若しくは複数生成し、かつ前記生成された第２文の構文木から、前記第２文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第２部分木を１若しくは複数生成し、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木の係り文節と、当該部分木組み合わせを構成する第２部分木の係り文節と、が、一致しているか否か、及び当該第１部分木の受け文節と、当該第２部分木の受け文節と、が、一致しているか否か、に基づいて、当該第１部分木で表される第１表現と当該第２部分木で表される第２表現とが一致した内容を表すか否かを判別する、
ことを特徴とする集計装置。
請求項１から３のいずれか一項に記載の集計装置であって、
前記一致判別部は、１若しくは複数の部分木がそれぞれ分類された第１グループと第２グループとの組み合わせである１のグループ組み合わせ、若しくは、複数のグループ組み合わせのそれぞれについて、当該第１グループと当該第２グループとの間の包含関係を、当該第１グループに属する部分木の高さ、枝数、及び文節の数と、当該第２グループに属する部分木の高さ、枝数、及び文節の数と、に基づいて判別し、
前記出力部は、当該第１グループに分類された１の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、当該第２グループに分類された１の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、を、前記判別された包含関係に基づいて配列して出力する、
ことを特徴とする集計装置。
請求項４に記載の集計装置であって、
前記一致判別部は、前記１のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、第１グループに分類された部分木が有する係り文節の数が、第２グループに分類された部分木が有する係り文節の数より少ないグループ組み合わせについて、当該第１グループに分類された部分木が有する係り文節の全てが、当該第２グループに分類された部分木が有する係り文節のいずれかと一致すると、当該第１グループに分類された部分木で表される表現は、当該第２グループに分類された部分木で表される表現よりも上位の表現であると判別し、
前記分類部は、前記１のグループ組み合わせ、若しくは、前記複数のグループ組み合わせのそれぞれについて、当該グループ組み合わせを構成する第１グループに分類された部分木が表す表現が、当該グループ組み合わせを構成する第２グループに分類された部分木が表す表現よりも上位の表現であると判別されると、当該第１グループを、当該第２グループより上位のグループとする、
ことを特徴とする集計装置。
請求項５に記載の集計装置であって、
前記一致判別部は、前記１のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、受け文節と係り文節とを有する部分木が分類された第１グループと、受け文節と係り文節と当該係り文節に係る文節とを有する部分木が分類された第２グループと、で構成されるグループ組み合わせについて、当該第１グループに分類された部分木の受け文節と、当該第２グループに分類された部分木の受け文節と、が一致し、かつ当該第１グループに分類された部分木の係り文節と、当該第２グループに分類された部分木の係り文節と、が一致すると判別すると、当該第１グループに分類された部分木で表される表現は、当該第２グループに分類された部分木で表される表現よりも上位の表現であると判別する、
ことを特徴とする集計装置。
請求項２から６のいずれか一項に記載の集計装置であって、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、
当該部分木組み合わせを構成する第１部分木の係り文節が、当該部分木組み合わせを構成する第２部分木の係り文節の同義語である場合、当該第１部分木の係り文節と当該第２部分木の係り文節との相違が活用の相違である場合、及び当該第１部分木の係り文節と当該第２部分木の係り文節との相違が表記の相違である場合のいずれかの場合に、当該第１部分木の係り文節と当該第２部分木の係り文節とが一致する、と判別し、
当該第１部分木の受け文節が、当該第１部分木の受け文節の同義語である場合、当該第１部分木の受け文節と当該第２部分木の受け文節との相違が活用の相違である場合、及び当該第１部分木の受け文節と当該第２部分木の受け文節との相違が表記の相違である場合のいずれかの場合に、当該第１部分木の受け文節と当該第２部分木の受け文節とが一致する、と判別する、
ことを特徴とする集計装置。
請求項７に記載の集計装置であって、
前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木の係り文節の末尾が助詞の「と」若しくは「とは」であり、当該第１部分木の係り文節が用言を含み、肯定表現を含み、当該第１部分木の係り文節と当該第１部分木の受け文節との間に読点「、」若しくは「，」が無く、かつ当該第１部分木の受け文節が否定表現を含む場合に、当該受け文節を肯定表現に変換し、かつ当該係り文節を否定表現に変換する文節変換部、をさらに備え、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する、前記変換された第１部分木の係り文節と、当該部分木組み合わせを構成する第２部分木の係り文節と、が、一致しているか否か、及び当該変換された第１部分木の受け文節と、当該第２部分木の受け文節と、が、一致しているか否か、を判別する、
ことを特徴とする集計装置。
請求項８に記載の集計装置であって、
前記入力部は、質問に対する回答文である第１文及び第２文を入力し、
前記一致判別部は、前記１の部分木組み合わせ、若しくは、前記複数の部分木組み合わせの内で、受け文節と所定数の係り文節とを有する第１部分木と、受け文節と前記所定数の係り文節とを有する第２部分木と、で構成される部分木組み合わせについて、当該第１部分木が有する前記所定数の係り文節のそれぞれが、当該第２部分木が有する前記所定数の係り文節のそれぞれに一致すると判別すると、当該第１部分木が有する受け文節と当該第２部分木が有する受け文節とが一致していると判別する、
ことを特徴とする集計装置。
コンピュータを、
第１文と第２文とを入力する入力部、
前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析部、
前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成部、
前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された１の第１表現と第２表現、若しくは、複数の第１表現と第２表現とのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラム。
コンピュータを、
第１文と第２文とを入力する入力部、
前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析部、
前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成部、
前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された１の第１表現と第２表現、若しくは、複数の第１表現と第２表現とのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラムを記録したコンピュータ読み取り可能な記録媒体。
入力部、構文解析部、部分木生成部、一致判別部、分類部、及び出力部を備える集計装置が実行する方法であって、
前記入力部が、第１文と第２文とを入力する入力ステップと、
前記構文解析部が、前記第１文と前記第２文とを構文解析することで、前記第１文の構文木と前記第２文の構文木とを生成する構文解析ステップと、
前記部分木生成部が、前記生成された第１文の構文木から、前記第１文を構成する部分木である第１部分木を１若しくは複数生成し、前記生成された第２文の構文木から、前記第２文を構成する部分木である第２部分木を１若しくは複数生成する部分木生成ステップと、
前記一致判別部が、前記生成された１の第１部分木若しくは複数の第１部分木のいずれか１つと、前記生成された１の第２部分木若しくは複数の第２部分木のいずれか１つと、の組み合わせである１の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第１部分木で表される第１表現と、当該部分木組み合わせを構成する第２部分木で表される第２表現とが互いに一致した内容を表すか否かを判別する一致判別ステップと、
前記分類部が、前記互いに一致した内容を表すと判別された第１表現と第２表現との１の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第１表現と第２表現との複数の組み合わせのそれぞれについて、当該第１表現を表す第１部分木を、当該第２表現を表す第２部分木と同じグループに分類する分類ステップと、
前記出力部が、前記グループに分類された部分木の数、若しくは、前記グループに分類された１の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力ステップと、を有する、
ことを特徴とする集計方法。