JP5367869B2 - 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 - Google Patents

集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 Download PDF

Info

Publication number
JP5367869B2
JP5367869B2 JP2012103996A JP2012103996A JP5367869B2 JP 5367869 B2 JP5367869 B2 JP 5367869B2 JP 2012103996 A JP2012103996 A JP 2012103996A JP 2012103996 A JP2012103996 A JP 2012103996A JP 5367869 B2 JP5367869 B2 JP 5367869B2
Authority
JP
Japan
Prior art keywords
subtree
group
sentence
tree
clause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012103996A
Other languages
English (en)
Other versions
JP2013232111A (ja
Inventor
圭司 新里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Priority to JP2012103996A priority Critical patent/JP5367869B2/ja
Priority to EP13781546.0A priority patent/EP2849094B1/en
Priority to ES13781546.0T priority patent/ES2650467T3/es
Priority to PCT/JP2013/056196 priority patent/WO2013161397A1/ja
Priority to US14/374,692 priority patent/US9740770B2/en
Priority to TW102111696A priority patent/TWI442247B/zh
Publication of JP2013232111A publication Critical patent/JP2013232111A/ja
Application granted granted Critical
Publication of JP5367869B2 publication Critical patent/JP5367869B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/183Tabulation, i.e. one-dimensional positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Description

本発明は、集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法に関する。
従来から、入力された複数のテキストから、互いに表現が異なるが同じ特徴的な内容を表す複数のテキストを検索できるテキストマイニング装置が知られている(例えば、特許文献1)。このテキストマイニング装置は、同じ特徴的な内容を表す異なる複数の表現を互いに対応付けて記憶しており、所定の表現に対応付けられた表現が入力テキストに含まれている場合に、当該表現を所定の表現に置換してから、所定の表現を含むテキストを検索する。
特許第4815934号公報
ここで、特許文献1の技術では、入力された複数の文などのテキストにおいてどのような表現がどれだけ使用されたかを集計できないという問題があった。
本発明は、このような問題点に鑑みてなされたものであり、その目的とするところは、入力された複数の文においてどのような表現がどれだけ使用されたかを集計できる集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法を提供することにある。
上記目的を達成するため、本発明の第1の観点に係る集計装置は、
入力された文を集計する集計装置であって、
第1文と第2文とを入力する入力部と、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部と、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部と、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部と、
前記互いに一致した内容を表すと判別された第1表現と第2表現との1の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第1表現と第2表現との複数の組み合わせのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部と、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の部分木でそれぞれ表される表現を出力する出力部と、を備える、
ことを特徴とする。
また、第1の観点に係る集計装置において、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木と、当該部分木組み合わせを構成する第2部分木と、が、高さと、枝数と、根及び1若しくは複数の葉にそれぞれ割り当てられた文節と、の全てにおいて一致する場合に、当該第1部分木で表される第1表現と、当該第2部分木で表される第2表現と、が一致していると判別する、
としても良い。
また、第1の観点に係る集計装置において、
前記部分木生成部は、前記生成された第1文の構文木から、前記第1文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第1部分木を1若しくは複数生成し、かつ前記生成された第2文の構文木から、前記第2文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第2部分木を1若しくは複数生成し、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、に基づいて、当該第1部分木で表される第1表現と当該第2部分木で表される第2表現とが一致した内容を表すか否かを判別する、
としても良い。
また、第1の観点に係る集計装置において、
前記一致判別部は、1若しくは複数の部分木がそれぞれ分類された第1グループと第2グループとの組み合わせである1のグループ組み合わせ、若しくは、複数のグループ組み合わせのそれぞれについて、当該第1グループと当該第2グループとの間の包含関係を、当該第1グループに属する部分木の高さ、枝数、及び文節の数と、当該第2グループに属する部分木の高さ、枝数、及び文節の数と、に基づいて判別し、
前記出力部は、当該第1グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、当該第2グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、を、前記判別された包含関係に基づいて配列して出力する、
としても良い。
また、第1の観点に係る集計装置において、
前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、第1グループに分類された部分木が有する係り文節の数が、第2グループに分類された部分木が有する係り文節の数より少ないグループ組み合わせについて、当該第1グループに分類された部分木が有する係り文節の全てが、当該第2グループに分類された部分木が有する係り文節のいずれかと一致すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別し、
前記分類部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせのそれぞれについて、当該グループ組み合わせを構成する第1グループに分類された部分木が表す表現が、当該グループ組み合わせを構成する第2グループに分類された部分木が表す表現よりも上位の表現であると判別されると、当該第1グループを、当該第2グループより上位のグループとする、
としても良い。
また、第1の観点に係る集計装置において、
前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、受け文節と係り文節とを有する部分木が分類された第1グループと、受け文節と係り文節と当該係り文節に係る文節とを有する部分木が分類された第2グループと、で構成されるグループ組み合わせについて、当該第1グループに分類された部分木の受け文節と、当該第2グループに分類された部分木の受け文節と、が一致し、かつ当該第1グループに分類された部分木の係り文節と、当該第2グループに分類された部分木の係り文節と、が一致すると判別すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別する、
としても良い。
さらに、第1の観点に係る集計装置において、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、
当該部分木組み合わせを構成する第1部分木の係り文節が、当該部分木組み合わせを構成する第2部分木の係り文節の同義語である場合、当該第1部分木の係り文節と当該第2部分木の係り文節との相違が活用の相違である場合、及び当該第1部分木の係り文節と当該第2部分木の係り文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の係り文節と当該第2部分木の係り文節とが一致する、と判別し、
当該第1部分木の受け文節が、当該第1部分木の受け文節の同義語である場合、当該第1部分木の受け文節と当該第2部分木の受け文節との相違が活用の相違である場合、及び当該第1部分木の受け文節と当該第2部分木の受け文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の受け文節と当該第2部分木の受け文節とが一致する、と判別する、
としても良い。
さらに、第1の観点に係る集計装置において、
前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節の末尾が助詞の「と」若しくは「とは」であり、当該第1部分木の係り文節が用言を含み、肯定表現を含み、当該第1部分木の係り文節と当該第1部分木の受け文節との間に句読点「、」若しくは「,」が無く、かつ当該第1部分木の受け文節が否定表現を含む場合に、当該受け文節を肯定表現に変換し、かつ当該係り文節を否定表現に変換する文節変換部、をさらに備え、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する、前記変換された第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該変換された第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、を判別する、
としても良い。
さらに、第1の観点に係る集計装置において、
前記入力部は、質問に対する回答文である第1文及び第2文を入力し、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせの内で、受け文節と所定数の係り文節とを有する第1部分木と、受け文節と前記所定数の係り文節とを有する第2部分木と、で構成される部分木組み合わせについて、当該第1部分木が有する前記所定数の係り文節のそれぞれが、当該第2部分木が有する前記所定数の係り文節のそれぞれに一致すると判別すると、当該第1部分木が有する受け文節と当該第2部分木が有する受け文節とが一致していると判別する、
としても良い。
上記目的を達成するため、本発明の第2の観点に係る集計プログラムは、
コンピュータを、
第1文と第2文とを入力する入力部、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする。
上記目的を達成するため、本発明の第3の観点に係るコンピュータ読み取り可能な記録媒体は、
コンピュータを、
第1文と第2文とを入力する入力部、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラムを記録している。
上記目的を達成するため、本発明の第4の観点に係る集計方法は、
入力部、構文解析部、部分木生成部、一致判別部、分類部、及び出力部を備える集計装置が実行する方法であって、
前記入力部が、第1文と第2文とを入力する入力ステップと、
前記構文解析部が、前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析ステップと、
前記部分木生成部が、前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成ステップと、
前記一致判別部が、前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別ステップと、
前記分類部が、前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類ステップと、
前記出力部が、前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力ステップと、を有する、
ことを特徴とする。
本発明に係る集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法によれば、入力された複数の文においてどのような表現がどれだけ使用されたかを集計できる。
集計システムの一構成例を表すシステム構成図である。 質問画面の一例を表す図である。 実施例1における集計結果画面の一例を表す図である。 本発明の実施例に係る集計装置の一例を表すハードウェア構成図である。 実施例1に係る集計装置が実行する集計処理の一例を表すフローチャートである。 実施例1に係る集計装置が有する機能の一例を表す機能ブロック図である。 (a)は、完全木の一例を表す図である。(b)は、部分木の第一例を表す図である。(c)は、部分木の第二例を表す図である。(d)は、部分木の第三例を表す図である。(e)は、部分木の第四例を表す図である。(f)は、部分木の第五例を表す図である。(g)は、部分木の第六例を表す図である。 (a)は、互いに完全に一致する部分木の第一例を表す図である。(b)は、互いに完全に一致する部分木の第二例を表す図である。 (a)は、互いに実質的に一致する部分木の第一例を表す図である。(b)は、互いに実質的に一致する部分木の第二例を表す図である。 互いに実質的に一致する部分木の第三例を表す図である。 実施例1において集計装置が記憶する入力文テーブルの一例を表す図である。 集計装置が記憶する文節テーブルの一例を表す図である。 集計装置が記憶する部分木テーブルの一例を表す図である。 (a)は、集計装置が記憶する表記テーブルの一例を表す図である。(b)は、集計装置が記憶する同義語テーブルの一例を表す図である。(c)は、集計装置が記憶する活用テーブルの一例を表す図である。 集計装置が記憶するグループテーブルの一例を表す図である。 集計装置が記憶する包含関係テーブルの一例を表す図である。 集計装置が記憶する階層構造テーブルの一例を表す図である。 (a)は、完全木FT1を表す図である。(b)は、部分木PT10を表す図である。(c)は、部分木PT11を表す図である。(d)は、部分木PT12を表す図である。(e)は、部分木PT13を表す図である。(f)は、部分木PT14を表す図である。(g)は、部分木PT15を表す図である。 (a)は、完全木FT2を表す図である。(b)は、完全木PT20を表す図である。(c)は、部分木PT21を表す図である。(d)は、部分木PT22を表す図である。(e)は、部分木PT23を表す図である。(f)は、部分木PT24を表す図である。(g)は、部分木PT25を表す図である。 (a)は、完全木FT3を表す図である。(b)は、完全木PT30を表す図である。(c)は、部分木PT31を表す図である。(d)は、部分木PT32を表す図である。 (a)は、完全木FT4を表す図である。(b)は、完全木FT5を表す図である。(c)は、完全木FT6を表す図である。(d)は、完全木PT40を表す図である。(e)は、完全木PT50を表す図である。(f)は、完全木PT60を表す図である。 集計装置が実行する部分木分類処理の一例を表すフローチャートである。 実施例1において、部分木分類処理を実行した後におけるグループの分類結果の一例を表す図である。 集計装置が実行する部分木集計処理の一例を表すフローチャートである。 集計装置が実行する包含関係特定処理の一例を表すフローチャートである。 集計装置が実行するグループ分類処理の一例を表すフローチャートである。 実施例1においてグループ分類処理を実行した後におけるグループの分類結果の一例を表す図である。 実施例2において一致すると判別される第1部分木と第2部分木との一例を表す図である。 実施例3に係る集計装置が実行する集計処理の一例を表すフローチャートである。 実施例3に係る集計装置が有する機能の一例を表す機能ブロック図である。 (a)は、実施例3に係る集計装置が変換する部分木の第一例を表す図である。(b)は、実施例3に係る集計装置が変換した部分木の一例を表す図である。(c)は、実施例3に係る集計装置が変換する部分木の第二例を表す図である。 (a)は、実施例3に係る集計装置が変換しない部分木の一例を表す図である。(b)は、図32(a)に示す部分木と異なる意味内容を表す部分木の一例を表す図である。 実施例5において集計装置が記憶する入力文テーブルの一例を表す図である。 (a)は、完全木FT11を表す図である。(b)は、部分木PT110を表す図である。(c)は、部分木PT111を表す図である。(d)は、部分木PT112を表す図である。(e)は、完全木PT12を表す図である。(f)は、部分木PT120を表す図である。(g)は、完全木FT13を表す図である。(h)は、部分木PT130を表す図である。 (a)は、完全木FT14を表す図である。(b)は、部分木PT140を表す図である。(c)は、部分木PT141を表す図である。(d)は、完全木FT15を表す図である。(e)は、部分木PT150を表す図である。(f)は、部分木PT151を表す図である。(g)は、完全木FT16を表す図である。(h)は、部分木PT160を表す図である。(i)は、部分木PT161を表す図である。 (a)は、完全木FT17を表す図である。(b)は、部分木PT170を表す図である。(c)は、部分木PT171を表す図である。(d)は、完全木FT18を表す図である。(e)は、部分木PT180を表す図である。(f)は、部分木PT181を表す図である。 実施例5において、部分木分類処理を実行した後におけるグループの分類結果の一例を表す図である。 実施例5においてグループ分類処理を実行した後におけるグループの分類結果の一例を表す図である。 実施例5における集計結果画面の一例を表す図である。 実施例5における集計結果画面の他例を表す図である。
以下、本発明の実施例について添付図面を参照しつつ説明する。
<実施例1>
本発明の実施例1に係る集計装置100は、図1に示すような集計システム1を構成する。集計システム1は、アンケートに対するユーザの回答を集計する。
集計システム1は、集計装置100の他に、コンピュータ通信網10(以下単に、通信網10という)と、端末装置20及び21と、で構成される。
通信網10は、例えば、インターネットで構成される。通信網10は、LAN(Local Area Network)又は公衆回線網であっても良い。
端末装置20及び21は、互いに同様の構成を有し、同様の動作を行うため、以下主に、端末装置20について説明を行う。
端末装置20は、例えば、LCD(Liquid Crystal Display)などの表示部と、キーボード及びマウスなどの入力部と、を備えたパーソナル・コンピュータで構成される。
端末装置20は、図2に示すようなアンケートの質問を表示する質問画面を表示する。端末装置20は、入力部をユーザに操作されると、当該操作に応じて質問に対するユーザの回答を入力し、入力された回答を集計装置100へ送信する。その後、端末装置20は、集計装置100から回答の集計結果を受信し、受信した集計結果を表示する、図3に示すような集計結果画面を表示部に表示する。
集計装置100は、図4に示すようなサーバ機で構成され、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、ハードディスク104、メディアコントローラ105、LAN(Local Area Network)カード106、ビデオカード107、LCD(Liquid Crystal Display)108、キーボード10、スピーカ110、及びタッチパッド111で構成される。
CPU101は、ROM102又はハードディスク104に保存されたプログラムに従ってプログラムを実行することで、集計装置100の全体制御を行う。RAM103は、CPU101によるプログラムの実行時において、処理対象とするデータを一時的に記憶するワークメモリである。
ハードディスク104は、各種のデータを保存したテーブルを記憶する情報記憶部である。尚、集計装置100は、ハードディスク104の代わりに、フラッシュメモリを備えても良い。
メディアコントローラ105は、フラッシュメモリ、CD(Compact Disc)、DVD(Digital Versatile Disc)、及びブルーレイディスク(Blu-ray Disc)(登録商標)を含む記録媒体から各種のデータ及びプログラムを読み出す。
LANカード106は、通信網10を介して接続する端末装置20及び21との間でデータを送受信する。キーボード10及びタッチパッド111は、ユーザの操作に応じた信号を入力する。
ビデオカード107は、CPU101から出力されたデジタル信号に基づいて画像を描画(つまり、レンダリング)すると共に、描画された画像を表す画像信号を出力する。LCD108は、ビデオカード107から出力された画像信号に従って画像を表示する。なお、集計装置100は、LCD108の代わりに、PDP(Plasma Display Panel)又はEL(Electroluminescence)ディスプレイを備えても良い。スピーカ110は、CPU101から出力された信号に基づいて音声を出力する。
次に、集計装置100の有する機能について説明する。
CPU101は、アンケートの回答を集計する、図5に示す集計処理を実行する。これにより、CPU101は、図6に示す入力部120、保存部121、構文解析部122、部分木生成部123、一致判別部124、分類部125、集計部126、及び出力部127として機能する。また、CPU101は、図4に示したハードディスク104と協働して、情報記憶部129として機能する。
入力部120は、図4に示すLANカード106が端末装置20若しくは21から受信したアンケートの回答文を入力する。保存部121は、入力された文を情報記憶部129へ保存する。構文解析部122は、情報記憶部129に保存された文を構文解析して、文を表す構文木を生成する。
ここで、集計装置100が有する機能についての説明を一旦中断し、構文解析部122が生成する構文木について、図7(a)に示す構文木を例に挙げて説明する。
図7(a)に示す構文木は、「靴下の汚れが綺麗に落ちる。」という文を表す構文木である。この構文木のルートノードは文節「落ちる」であり、ルートノードの子ノードは文節「汚れが」と文節「綺麗に」とであり、文節「汚れが」の子ノードは文節「靴下の」である。これは、文節「靴下の」が、文節「汚れ」を修飾し、文節「汚れが」と文節「綺麗に」とが、文節「落ちる」を修飾するためである。
このように、他の文節に係る(つまり、修飾する)文節を係り文節といい、係り文節を受ける(つまり、係り文節に修飾される)文節を受け文節という。すなわち、文節「靴下の」は、文節「汚れ」に係る係り文節であり、文節「汚れ」は、文節「靴下の」を受ける受け文節である。また、文節「汚れが」と文節「綺麗に」とは、文節「落ちる」に係る係り文節であり、文節「落ちる」は、文節「汚れが」と文節「綺麗に」とを受ける受け文節である。
図7(a)に示す構文木は、受け文節「落ちる」に係る2つの係り文節「汚れが」と「綺麗に」とを有する。構文木で表される文「靴下の汚れが綺麗に落ちる。」において、係り文節「綺麗に」の方が係り文節「汚れが」よりも受け文節「落ちる」に近い位置で使用される。このため、図7(a)に示す構文木では、係り文節「綺麗に」の方が係り文節「汚れが」よりも受け文節「落ちる」に近く(つまり、下側の)、かつ順位の高いノードで表される。すなわち、同じ受け文節に係る複数の係り文節を構文木が有する場合には、当該構文木で表される文において受け文節に近い位置で使用される係り文節から順に高い順位が割り振られている。
ここで、構文木で表されるアンケート文を集計する集計装置100の有する機能について、説明を再開する。
図6に示す部分木生成部123は、構文解析部122で生成された構文木から、当該構文木の部分構文木(以下、部分木という)を複数生成する。但し、本明細書では、構文木と部分的に一致する木だけでなく、完全に一致する木(以下、完全木という)も部分木と称する。
図7(a)に示した文「靴下の汚れが綺麗に落ちる。」を表す構文木(完全木)を例に挙げて説明すると、部分木生成部123は、図7(b)から図7(g)に示す部分木を生成する。
図7(b)から図7(g)にそれぞれ示した部分木は、図7(a)に示した構文木で表される「靴下の汚れが綺麗に落ちる。」の一部分若しくは全部を表す。
図7(b)に示した部分木は、図7(a)に示した完全木と完全に一致する構文木であり、「靴下の汚れが綺麗に落ちる。」の全文を表す。図7(c)から図7(g)に示す部分木は、当該構文木で表される文「靴下の汚れが綺麗に落ちる。」の一部分を表す。
具体的には、図7(c)に示した部分木は、文「靴下の汚れが落ちる。」を表し、図7(d)に示した部分木は、文「汚れが綺麗に落ちる。」を表し、図7(e)に示した部分木は、文「汚れが落ちる。」を表し、図7(f)に示した部分木は、文「綺麗に落ちる。」を表し、図7(g)に示した部分木は、文「靴下の汚れが。」を表す。
部分木の枝数は、完全木の枝数よりも少ないか若しくは同じであり、部分木の高さは、完全木の高さよりも低いか若しくは同じであり、かつ部分木の枝の全ては、完全木の枝のいずれか若しくは全てと一致している。
具体例としては、図7(b)に示す部分木は、図7(a)に示す完全木と完全一致する構文木であり、当該部分木の枝数及び高さは、当該完全木の枝数及び高さとそれぞれ一致しており、当該部分木が有する枝の全ては、完全木が有する枝の全てと一致している。
これに対して、図7(c)に示す部分木の高さは、図7(a)の完全木の高さと一致しているが、当該部分木は、当該完全木が有する文節「綺麗に」に対応する葉を付けた枝を有さない。また、図7(d)に示す部分木は、図7(a)の完全木が有する文節「靴下の」を有さないため、図7(d)に示す部分木の高さは、図7(a)の完全木の高さより低い。さらに、図7(e)及び図7(f)にそれぞれ示す部分木は、図7(d)に示す部分木よりも枝数が少ない。また、図7(g)に示す部分木の高さは、図7(a)の完全木の高さより低い。
ここで、図7(c)の部分木で表される文「靴下の汚れが落ちる。」は、図7(a)の完全木及び図7(b)の部分木でそれぞれ表される文「靴下の汚れが『綺麗に』落ちる。」よりも上位の概念を表す。文「靴下の汚れが落ちる。」は、靴下の汚れが「綺麗に」落ちることだけではなく、例えば、靴下の汚れが落ちるが、綺麗には落ちないことなども表すためである。
また、図7(d)の部分木で表される文「汚れが綺麗に落ちる。」は、図7(a)の完全木及び図7(b)の部分木でそれぞれ表される文「『靴下の』汚れが綺麗に落ちる。」よりも上位の概念を表す。文「汚れが綺麗に落ちる。」は、「靴下」の汚れが綺麗に落ちることだけではなく、例えば、「襟首」の汚れが綺麗に落ちることなども表すためである。
このように、基準となる部分木よりも上位の概念を表す部分木を、当該基準となる部分木より上位の部分木といい、基準となる部分木よりも下位の概念を表す部分木を、当該基準となる部分木より下位の部分木という。
また、図7(d)の部分木は、図7(b)の部分木よりも枝数(つまり、葉数)が1つ少ない。つまり、図7(d)の部分木で表される文「汚れが綺麗に落ちる。」は、図7(b)の部分木で表される文「『靴下の』汚れが綺麗に落ちる。」のよりも、文を構成する文節が1つ少ない。同様に、図7(c)の部分木は、図7(b)の部分木よりも枝数が少なく、図7(c)の部分木で表される文「靴下の汚れが落ちる。」は、図7(b)の部分木で表される文「靴下の汚れが『綺麗に』落ちる。」よりも、文を構成する文節が1つ少ない。
このように、当該基準となる部分木よりも枝数が1つ少ない部分木を、当該基準となる部分木の直近上位の部分木といい、当該基準となる部分木よりも枝数が1つ多い部分木を、当該基準となる部分木の直近下位の部分木という。
図6の一致判別部124は、部分木生成部123で生成された複数の部分木でそれぞれ表される文の内容が互いに一致するか否かを、部分木を構成する文節と係り受け関係が一致する(以下、部分木が一致するという)か否かに基づいて判別する。
具体例を挙げて説明すると、一致判別部124は、図8(a)に示すような第1部分木と、第2部分木と、は、互いに完全に一致すると判別する。第1部分木と第2部分木とは、高さと枝数とが同じであって、ルートノードの文節「落ちる」と、ルートノードに係る2つの文節「汚れ」と文節「綺麗に」と、文節「綺麗に」に係る文節「靴下の」をそれぞれ有するためである。
また、一致判別部124は、図8(b)に示すような、文「靴下の汚れが綺麗に落ちる。」を表す第1部分木と、文「綺麗に靴下の汚れが落ちる。」を表す第2部分木と、は、互いに完全に一致すると判別する。すなわち、一致判別部124は、第1部分木と第2部分木とで、ルートノードに係る係り文節「汚れが」及び「綺麗に」の順位が互いに相違していても、ルートノード「落ちる」と、ルートノードに係る2つの係り文節「汚れが」及び「綺麗に」と、係り文節「汚れが」に係る文節「靴下の」と、が互いに一致していれば、第1部分木と第2部分木とが完全に一致すると判別する。第1部分木で表される文と、第2部分木で表される文と、で、「落ちる」に係る文節「綺麗に」と「汚れ」との記載順序が異なるに過ぎず、第1部分木で表される意味内容と、第2部分木で表される意味内容と、が同じためである。
さらに、一致判別部124は、図9(a)に示すような、「靴下の汚れが綺麗に落ちる」を表す第1部分木と、「靴下のヨゴレが綺麗に落ちる」を表す第2部分木と、を互いに実質的に一致すると判別する。単語「よごれ」は、「汚れ」とも「ヨゴレ」とも表記されるためである。
また、一致判別部124は、図9(b)に示すような、「靴下の汚れが綺麗に落ちる」を表す第1部分木と、「靴下の汚れが綺麗に取れる」を表す第2部分木と、を互いに実質的に一致すると判別する。単語「落ちる」と「取れる」とは、同義語だからである。同様の例として、一致判別部124は、「汚れが綺麗に落ちる洗剤」を表す部分木と、「汚れが綺麗に取れる洗剤」を表す部分木と、を、互いに実質的に一致すると判別する。すなわち、互いに同義語の関係にある文節は、係り文節であっても良いし、受け文節であっても良い。
また、一致判別部124は、図10に示すような、「靴下の汚れが綺麗に落ちる」を表す第1部分木と、「靴下の汚れが綺麗に落ちた」を表す第2部分木と、を互いに実質的に一致すると判別する。動詞などの用言は活用するためである。同様の例として、一致判別部124は、「汚れが綺麗に落ちる喜び」を表す部分木と、「汚れが綺麗に落ちた喜び」を表す部分木と、も互いに実質的に一致すると判別する。すなわち、活用が相違する文節は、係り文節であっても良いし、受け文節であっても良い。
図6の分類部125は、一致判別部124の判定結果に基づいて部分木をグループ分けする。集計部126は、各グループに分類された部分木の数を集計する。出力部127は、集計結果をLANカード106へ出力する。LANカード106は、端末装置20若しくは21へ集計結果を返信する。
次に、情報記憶部129が記憶する各種テーブルについて、図11から図16を参照して説明する。
情報記憶部129は、入力部120で入力された文が保存された、図11に示す入力文テーブルを記憶している。入力文テーブルには、文を識別する文IDと、当該IDで識別される文と、が対応付けられて複数保存される。
また、情報記憶部129は、入力文テーブルの文に含まれる文節が保存された、図12に示す文節テーブルを記憶している。文節テーブルには、入力文テーブルに保存された文IDと、当該文IDで識別される文に含まれる文節と、当該文節を識別する文節IDと、が対応付けられて複数保存される。
さらに、情報記憶部129は、文節テーブルの文節で構成される部分木が保存された、図13に示す部分木テーブルを記憶している。部分木テーブルには、入力文テーブルに保存された文IDと、当該文IDで識別される文の部分木を識別する部分木IDと、当該部分木を構成する文節と、当該文節の文節IDと、当該文節を受ける受け文節の文節ID(以下、受け文節IDという)と、が対応付けられて複数保存される。
またさらに、情報記憶部129は、複数の部分木が実質的に同一であるか否かを一致判別部124が判別するために用いられる、図14(a)に示す表記テーブル、図14(b)に示す同義語テーブル、及び図14(c)に示す活用テーブルを記憶している。表記テーブルには、単語の表記と、当該単語の当該表記と異なる表記と、が複数対応付けられて保存される。同義語テーブルには、単語と、当該単語の同義語と、が複数対応付けられて保存されている。活用テーブルには、単語の活用形と、当該単語の当該活用形と異なる活用形と、が複数対応付けられて保存される。
尚、表記テーブルにおいて互いに対応付けられた表記が異なる2つの単語、同義語テーブルにおいて互いに対応付けられた2つの同義語、及び同義語テーブルにおいて互いに対応付けられた活用が異なる2つの単語を、それぞれ実質的に一致した(若しくは、実質的に同一の)単語という。
また、情報記憶部129は、部分木テーブルの部分木が分類されたグループが保存された、図15に示すグループテーブルを記憶している。グループテーブルには、グループを識別するグループIDと、当該グループに分類された部分木の部分木IDと、当該部分木の高さと、当該部分木の総枝数と、当該グループを代表する部分木(以下、代表木という)と、当該グループの名称と、当該グループの名称と完全に一致する文を表す部分木の数(以下、グループ名一致木数という)と、当該グループに分類された部分木の総木数と、が対応付けられて保存される。
ここで、あるグループは、ある基準となるグループに分類された部分木よりも、下位の概念を表す部分木が分類されている場合に、当該基準となるグループよりも下位のグループとされる。また、当該基準となるグループに分類された部分木で表される概念は、当該基準となるグループよりも下位のグループに分類された部分木で表される概念を包含する。上位の概念は、下位の概念を含むからである。
このため、情報記憶部129は、グループの包含関係(つまり、上下関係)を表すデータが保存された、図16に示す包含関係テーブルを記憶している。包含関係テーブルには、グループテーブルに保存されたグループIDと、当該グループIDで識別されるグループの直近上位のグループのID(以下、直近上位グループIDという)と、が互いに対応付けられて保存される。
ここで、共通の概念を表す部分木がそれぞれ分類された複数のグループからなる集合をグループ集合という。グループ集合に属する複数のグループは、前述のように、それぞれ上下関係を有するため、互いに階層構造を構成する。
このため、情報記憶部129は、グループの階層構造を表すデータが保存された、図17に示す階層構造テーブルを記憶している。階層構造テーブルには、グループテーブルに保存されたグループIDと、当該グループIDで識別されるグループが属するグループ集合を識別するグループ集合IDと、当該グループIDで識別されるグループの直近上位のグループの直近上位グループIDと、が互いに対応付けられて保存される。
次に、図6に示す入力部120、保存部121、構文解析部122、部分木生成部123、一致判別部124、分類部125、集計部126、及び出力部127で行われるCPU101の動作について説明する。
ここでは、集計装置100が、「靴下の汚れが綺麗に落ちる。」というアンケートの回答文を受信した場合を例に挙げて説明を行う。
CPU101は、端末装置20から回答文を受信すると、図5に示す集計処理の実行を開始する。
先ず、入力部120は、図4のLANカード106から「靴下の汚れが綺麗に落ちる。」という回答文を入力する(ステップS01)。
次に、保存部121は、入力された回答文「靴下の汚れが綺麗に落ちる。」を識別する文IDを生成し、生成した文IDと、文「靴下の汚れが綺麗に落ちる。」と、を対応付けて、図11に示した入力文テーブルに保存する(ステップS02)。
ここで、ステップS02の処理が終了したとき、入力文テーブルには、以下の6つの文が保存されているとして説明を行う。
文ID「ST1」で識別される文「靴下の汚れが綺麗に落ちる。」、文ID「ST2」で識別される文「靴下の汚れが綺麗に取れる。」、文ID「ST3」で識別される文「ヨゴレが綺麗に落ちる。」、文ID「ST4」で識別される文「汚れが落ちた。」、文ID「ST5」で識別される文「汚れが落ちる。」、文ID「ST6」で識別される「パッケージが格好いい。」である。
図5のステップS02の後に、入力部120は、入力文テーブルに保存された全ての回答文を読み出す(ステップS03)。
次に、構文解析部122は、入力部120で読み出された6つの文を形態素解析することで、これらの文の形態素列を取得する(ステップS04a)。
次に、構文解析部122は、形態素解析により得られた形態素列を構文解析する(ステップS04b)。このようにして、構文解析部122は、上記6つの入力文の形態素列から、上記6つの入力文を構成する複数の文節を特定する。
その後、保存部121は、文を識別する文IDと、当該文から得られた文節の文節IDと、当該文節と、を対応付けて、図12に示した文節テーブルに保存する。
また、構文解析部122は、文ID「ST1」で識別される文「靴下の汚れが綺麗に落ちる。」を構成する複数の文節を用いて、図18(a)に示す完全構文木(つまり、完全木)FT1を生成する。同様に、構文解析部122は、文ID「ST2」から「ST6」でそれぞれ識別される文から、図19(a)、図20(a)、図21(a)から図21(c)にそれぞれ示す完全木FT2からFT6を生成する(ステップS05)。
次に、部分木生成部123は、図18(a)に示す完全木FT1から、図18(b)から図18(g)に示す部分木P10からPT15(つまり、全ての部分木)を生成する。同様に、部分木生成部123は、図19(a)に示す完全木FT2から、図19(b)から図19(g)に示す部分木P20からPT25を生成する。さらに、部分木生成部123は、図20(a)に示す完全木FT3から、図20(b)から図20(d)に示す部分木P30からPT32を生成する。また、部分木生成部123は、図21(a)から図21(c)に示す完全木FT4ないしFT6から、図21(d)から図21(f)に示す部分木PT40、PT50、及びPT60を生成する(図5のステップS06)。
その後、図6の保存部121は、ステップS06で生成された複数の部分木について、部分木の生成に用いられた文の文IDと、当該部分木を識別する部分木IDと、当該部分木を構成する文節と、当該文節の文節IDと、当該文節を受ける文節の受け文節IDと、を対応付けて、図13に示した部分木テーブルに保存する。
図5のステップS06の処理で部分木が生成された後に、生成された部分木をグループ分けする、図22に示す部分木分類処理が実行される(ステップS07a)。
部分木分類処理が開始されると、分類部125は、新しいグループを生成してから、図13に示した部分木テーブルを参照する。次に、分類部125は、部分木テーブルに保存された部分木IDで識別される部分木の内で、未だグループに分類されていない部分木(以下、未分類木という)の1つを新しいグループに分類する(ステップS21)。
このとき、部分木テーブルに保存された部分木IDで識別される部分木の全てが未分類木である。ここでは、分類部125は、部分木テーブルの最も先頭に保存された部分木ID「PT10」を選択し、選択されたIDで識別される、図18()に示した部分木PT10を新しいグループG10に分類するとして説明を行う。
次に、保存部121は、部分木PT10の部分木ID「PT10」と、グループG10のグループID「G10」と、を対応付けて、図15に示したグループテーブルに保存する。このとき、保存部121は、部分木PT10の部分木ID「PT10」と、グループG10のグループID「G10」と、に対して、図18()に示した部分木PT10の高さ「2」及び総枝数「3」をさらに対応付ける。グループG10よりも上位のグループを検索し易くするためである。
次に、分類部125は、図13の部分木テーブルに保存された部分木の全てを何らかのグループに分類したか否かを判別する(図22のステップS22)。このとき、分類部125は、部分木PT11からPT15、PT20からPT25、PT30からPT32、PT40、PT50、及びPT60を未だ分類していないため、部分木の全てをグループに分類した訳ではないと判別する(ステップS22;No)。
その後、分類部125は、未分類木の1つを、これからグループに分類する部分木である分類対象木とする(ステップS23)。
ここでは、分類部125は、未分類木PT11からPT15、PT20からPT25、PT30からPT32、PT40、PT50、及びPT60の内で、図18(c)に示した部分木PT11を分類対象木とするとして説明を行う。
次に、分類部125は、既にグループに分類された部分木(以下、分類済木という)の全てに注目したか否かを判別する(ステップS24)。このとき、分類済木は、部分木PT10のみであり、かつ未だ部分木PT10に注目していない。このため、分類部125は、分類済木の全てに注目した訳ではないと判別する(図21のステップS24;No)。
その後、分類部125は、未注目の分類済木の1つに注目し、注目分類済木とする(ステップS25)。ここでは、分類部125は、図18(b)に示した分類済木PT10に注目するとして説明を行う。
次に、一致判別部124は、図18(c)の分類対象木PT11の部分木ID「PT11」に対応付けられた文ID(以下、分類対象木PT11の文IDという)「ST1」を、図13に示した部分木テーブルから検索する。また、一致判別部124は、図18(b)の注目分類済木PT10の部分木ID「PT10」に対応付けられた文ID(以下、注目分類済木PT10の文IDという)「ST1」を部分木テーブルから検索する。その後、一致判別部124は、分類対象木PT11の文ID「ST1」と、注目分類済木PT10の文ID「ST1」と、が一致すると判別し(ステップS26a;Yes)、ステップS24に戻り、上記処理を繰り返す。部分木生成部123は、同じ文から同じ部分木を生成しないため、同じ文から生成された2つの部分木は、互いに一致することがないためである。
その後、図22のステップS24に戻り、分類部125は、分類済木の全てに注目したか否かを判別する(ステップS24)。このとき、分類済木は、部分木PT10のみであり、部分木PT10は既に注目されている。このため、分類部125は、分類済木の全てに注目したと判別する(ステップS24;Yes)。
次に、分類部125は、新しいグループを生成し、生成したグループに分類対象木を分類する(ステップS28)。ここでは、分類部125は、新しいグループG11を生成し、図18(c)の分類対象木PT11をグループG11に分類するとして説明を行う。
次に、保存部121は、グループG11のグループID「G11」と、分類対象木PT11の部分木ID「PT11」と、分類対象木PT11の高さ「2」と、総枝数「2」と、を対応付けて、図15に示したグループテーブルに保存する。
その後、分類部125は、分類対象木を順に、図18(d)から(g)の部分木PT12からPT15とするとして説明を行う。分類部125は、図22のステップS22からステップS26b及びステップS28を繰り返し実行することで、新しいグループG12からG15を生成し、これらのグループG12からG15のそれぞれに、部分木PT12からPT15を分類する。
次に、分類部125は、図19(b)に示した未分類木PT20を分類対象木とし、図18(b)に示した分類済木PT10を注目分類済木とするとして説明を行う。分類部125が図22のステップS22からステップS25を実行した後に、一致判別部124は、分類対象木PT20の文ID「ST2」と、注目分類済木PT10の文ID「ST1」と、が相違すると判別し(ステップS26a;No)、ステップS26bの処理を実行する。
ステップS26bにおいて、一致判別部124は、図19(b)の分類対象木PT20と、図18(b)の注目分類済木PT10と、が完全に一致する若しくは実質的に一致する(以下単に、一致するという)か、否か、を判別する(ステップS26b)。
ここでは、一致判別部124は、文「靴下の汚れが綺麗に取れる。」を表す分類対象木PT20と、文「靴下の汚れが綺麗に落ちる。」を表す注目分類済木PT10と、は、完全に一致する訳ではない、と判別する。分類対象木PT20のルートノード「取れる」と、注目分類済木PT10のルートノード「落ちる」と、が相違するためである。
次に、一致判別部124は、「取れる」と「落ちる」とが、図14(b)の同義語テーブルに対応付けられて保存されているので、「取れる」は、「落ちる」の同義語であると判別する。このため、一致判別部124は、分類対象木PT20と、注目分類済木PT10と、は、実質的に一致する、と判別する(図22のステップS26b;Yes)。
その後、分類部125は、図18(b)の注目分類済木PT10と同じグループG10に、図19(b)の分類対象木PT20を分類する(ステップS27)。
次に、保存部121は、部分木PT20の部分木ID「PT20」と、グループG10のグループID「G10」と、を対応付けて、図15に示したグループテーブルに保存する。
その後、分類部125は、分類対象木を順に、図19(c)から(g)の部分木PT21からPT25とするとして説明を行う。分類部125は、図22のステップS22からステップS27を繰り返し実行する。これにより、分類部125は、部分木PT21からPT25を、図18(c)から(g)の部分木PT11からPT15が分類された既存のグループG11からG15のそれぞれに分類する。
次に、分類部125は、図20(b)に示した未分類木PT30を分類対象木とし、図18(b)及び(c)の分類済木PT10及びPT11を順に注目分類済木とするとして説明を行う。分類部125は、図22のステップS22からステップS26bの処理を繰り返す。
次に、分類部125は、図18(d)に示した分類済木PT12を注目分類済木とするとして説明を行う。分類部125がステップS22からステップS26aの処理を実行した後に、一致判別部124は、図20(b)の分類対象木PT30と、図18(d)の注目分類済木PT12と、が一致するか否かを判別する(ステップS26b)。
ここでは、一致判別部124は、文「ヨゴレが綺麗に取れる」を表す分類対象木PT30と、文「汚れが綺麗に落ちる」を表す注目分類済木PT12と、は、完全に一致する訳ではない、と判別する。分類対象木PT30のルートノードに係る係り文節「ヨゴレが」と、注目分類済木PT12のルートノードに係る係り文節「汚れが」と、が相違するためである。
次に、一致判別部124は、「ヨゴレ」と「汚れ」とが、図14(a)の表記テーブルに対応付けられて保存されているので、文節の相違は表記の相違に過ぎないと判別する。このため、一致判別部124は、分類対象木PT30と、注目分類済木PT12と、は、実質的に一致する、と判別する(図22のステップS26b;Yes)。
その後、分類部125は、注目分類済木PT12と同じグループG12に、分類対象木PT30を分類する(ステップS27)。
次に、保存部121は、部分木PT30の部分木ID「PT30」と、グループG12のグループID「G12」と、を、図15に示したグループテーブルに保存する。
その後、分類部125は、図20(c)に示す部分木PT31を分類対象木とするとして説明を行う。分類部125は、図22のステップS22からステップS27を実行することで、図18(e)の部分木PT13が分類された既存のグループG13に部分木PT31を分類する。
次に、分類部125は、図20(d)に示す未分類木PT32を分類対象木とし、図18(b)から(e)の分類済木PT10からPT13を順に注目分類済木とするとして説明を行う。分類部125は、図22のステップS22からステップS26bの処理を繰り返す。
次に、分類部125は、図18(f)の分類済木PT14を注目分類済木とするとして説明を行う。分類部125が、図22のステップS22からステップS26bの処理を実行した後に、一致判別部124は、図20(d)の分類対象木PT32と、図18(f)の注目分類済木PT14と、が一致するか否かを判別する(ステップS26b)。
ここでは、一致判別部124は、文「綺麗に落ちる。」を表す分類対象木PT32と、文「綺麗に落ちる。」を表す注目分類済木PT14と、は、完全に一致する、と判別する。分類対象木PT32の係り文節「綺麗に」及び受け文節「落ちる」と、注目分類済木PT14の係り文節「綺麗に」及び受け文節「落ちる」と、が一致するためである。
その後、分類部125は、注目分類済木PT14と同じグループG14に、分類対象木PT32を分類する(ステップS27)。次に、保存部121は、部分木PT32の部分木ID「PT32」と、グループG14のグループID「G14」と、を対応付けて、図15に示したグループテーブルに保存する。この際に、分類部125は、部分木ID「PT14」と「PT32」とを、部分木PT14と部分木PT32とが完全に一致していることを表す記号「=」で連結してグループテーブルに保存する。
次に、分類部125は、図21(d)に示す未分類木PT40を分類対象木とし、分類済木PT10からPT12を順に注目分類済木とするとして説明を行う。分類部125は、図22のステップS22からステップS26bの処理を繰り返す。
次に、分類部125は、図18(e)に示した分類済木PT13を注目分類済木とするとして説明を行う。分類部125が、図22のステップS22からステップS26bの処理を実行した後に、一致判別部124は、図21(d)の分類対象木PT40と、図18(e)の注目分類済木PT13と、が一致するか否かを判別する(ステップS26b)。
ここでは、一致判別部124は、文「汚れが落ちた。」を表す分類対象木PT40と、文「汚れが落ちる。」を表す注目分類済木PT13と、は、完全に一致する訳ではない、と判別する。分類対象木PT40のルートノード「落ちた」と、注目分類済木PT13のルートノード「落ちる」と、が相違するためである。
次に、一致判別部124は、「落ちた」と「落ちる」とが、図14(c)の活用テーブルに対応付けられて保存されているので、ルートノードの相違は活用の相違に過ぎないと判別する。このため、一致判別部124は、分類対象木PT40と、注目分類済木PT13と、は、実質的に一致する、と判別する(図22のステップS26b;Yes)。
その後、分類部125は、注目分類済木PT13と同じグループG13に、分類対象木PT40を分類する(ステップS27)。
その後、分類部125は、図21(e)に示した部分木PT50を分類対象木とするとして説明を行う。分類部125は、ステップS22からステップS27を実行することで、既存のグループG13に部分木PT50を分類する。
その後、分類部125は、図21(f)に示した部分木PT60を分類対象木とするとして説明を行う。分類部125は、ステップS22からステップS26b及びステップS28を実行することで、新規のグループG16に部分木PT60を分類する。
次に、分類部125は、部分木の全てを分類したと判別した後に(ステップS22;Yes)、部分木分類処理の実行を終了する。
図5のステップS07aで、部分木分類処理の実行が終了すると、図23に示すように、グループG10に部分木PT10及びPT20が分類され、グループG11に部分木PT11及びPT21が分類され、グループG12に部分木PT12、PT22、及びPT30が分類されている。また、グループG13に部分木PT13、PT23、PT31、PT40、及びPT50が分類され、グループG14に部分木PT14、PT24、及びPT32が分類され、グループG15に部分木PT15及びPT25が分類され、グループG16に部分木PT60が分類されている。
図5のステップS07aが実行された後に、集計部126は、これらのグループに分類された部分木の数を集計する、図24に示す部分木集計処理を実行する(ステップS07b)。
集計処理を開始すると、集計部126は、図15に示したグループテーブルを参照する。次に、集計部126は、グループテーブルに保存されたグループIDで識別されるグループの全てについて部分木の数を集計したか否かを判別する(ステップS51)。このとき、グループG10からG16のいずれも集計されていないので、集計部126は、全てのグループについて集計した訳ではないと判別する(ステップS51;No)。
次に、集計部126は、未集計のグループの1つに注目し、注目したグループを注目グループとする(ステップS52)。このとき、集計部126は、未集計のグループG10からG16の内で、グループG10に注目するとして説明を行う。
次に、集計部126は、注目グループに分類された部分木の全てについて、互いに完全一致する部分木の数(つまり、完全一致木数)を集計する(ステップS53)。図15に示したグループテーブルには、グループG10のグループID「G10」と対応付けて、完全一致を表す記号「=」を含まない「PT10, PT20」が保存されている。このため、集計部126は、グループG10には、図18(b)に示した部分木PT10と、図19(b)に示した部分木PT20と、が分類されており、互いに完全一致する部分木が分類されていないと判別する。
次に、集計部126は、一致木数が最も多い部分木の1つを代表木とする(ステップS54)。ここでは、部分木PT10及びPT20の完全一致木数がそれぞれ「0」であるので、集計部126は、部分木IDがより若い部分木PT10を代表木とするとして説明を行う。
次に、集計部126は、代表木に基づいて注目グループの名称を決定する(ステップS55)。ここでは、集計部126は、代表木PT10で表される文「靴下の汚れが綺麗に落ちる。」を注目グループG10の名称とするとして説明を行う。
次に、集計部126は、注目グループに分類された部分木の総数(以下、総木数という)を算出する(ステップS56)。ここでは、集計部126は、グループID「G10」と対応付けられた「PT10, PT20」に基づいて総木数「2」を算出するとして説明する。
その後、保存部121は、グループID「G10」と、代表木の部分木ID「PT10」と、グループ名「靴下の汚れが綺麗に落ちる。」と、グループのグループ名一致木数「1」と、総木数「2」と、を対応付けて、図16に示した包含関係テーブルに保存する。
次に、集計部126は、グループG11及びG12を順に注目グループとするとして説明を行う。集計部126は、ステップS51からステップS56の処理を繰り返し実行する。
これにより、包含関係テーブルに、グループID「G11」と、代表木の部分木ID「PT11」と、グループ名「靴下の汚れが落ちる。」と、グループ名完全一致木数「1」と、総木数「2」と、が対応付けられて保存される。
また、包含関係テーブルに、グループID「G12」と、代表木の部分木ID「PT12」と、グループ名「汚れが綺麗に落ちる。」と、グループ名完全一致木数「1」と、総木数「3」と、が対応付けられて保存される。
次に、集計部126は、グループG13を注目グループとするとして説明を行う。集計部126は、ステップS51及びステップS52の処理を実行する。
ここで、図15に示したグループテーブルには、グループG13のグループID「G13」と対応付けて、完全一致を表す記号「=」で連結された「PT13」及び「PT50」を含む「PT13=PT50,PT23,PT31,PT40」が保存されている。このため、集計部126は、グループG13には、図18(e)の部分木PT13、図19(e)の部分木PT23、図20(c)の部分木PT31、図21(d)の部分木PT40、及び図21(e)の部分木PT50が分類されており、部分木PT13と部分木PT50とは、互いに完全一致すると判別する。
このため、集計部126は、注目グループG13に分類された部分木13及びPT50の完全一致木数がそれぞれ「1」であり、部分木PT23、PT31、及びPT40の完全一致木数がそれぞれ「0」であると集計する(ステップS53)。
次に、部分木PT13及びPT50の完全一致木数がそれぞれ「1」であるので、集計部126は、部分木IDがより若い部分木PT13を代表木とする(ステップS54)。
次に、集計部126は、ステップS55及びステップS56を実行する。これにより、包含関係テーブルに、グループID「G13」と、代表木の部分木ID「PT13」と、グループ名「汚れが落ちる。」と、グループ名完全一致木数「2」と、総木数「5」と、が対応付けられて保存される。
次に、集計部126は、グループG14からG16を順に注目グループとするとして説明を行う。集計部126は、ステップS51からステップS56の処理を繰り返し実行する。
これにより、包含関係テーブルに、グループID「G14」と、代表木の部分木ID「PT14」と、グループ名「綺麗に落ちる。」と、グループ名完全一致木数「2」と、総木数「3」と、が対応付けられて保存される。また、グループID「G15」と、代表木の部分木ID「PT15」と、グループ名「靴下の汚れ。」と、グループ名完全一致木数「1」と、総木数「2」と、が対応付けられて保存される。
さらに、グループテーブルに、グループID「G16」と、代表木の部分木ID「PT60」と、グループ名「パッケージが格好いい。」と、グループ名完全一致木数「1」と、総木数「1」と、が対応付けられて保存される。
その後、集計部126は、グループG10からG16の全てを集計したと判別し(ステップS51;Yes)、部分木集計処理の実行を終了する。
図5のステップS07bの実行が終了すると、分類部125は、これらのグループの包含関係を特定する、図25に示すような包含関係特定処理を実行する(ステップS08)。
包含関係特定処理を開始すると、分類部125は、図15に示したグループテーブルから、グループID「G10」から「G16」を取得する。
次に、分類部125は、グループテーブルから取得した複数のグループIDでそれぞれ識別されるグループの全てに注目したか否かを判別する(ステップS61)。このとき、分類部125は、包含関係特定処理を開始したばかりであるので、グループのいずれについても注目していない。このため、分類部125は、全てのグループに注目した訳ではないと判別する(ステップS61;No)。
次に、分類部125は、未だ注目していないグループのグループID「G10」から「G16」の1つを注目グループとする(ステップS62)。ここでは、最もグループIDの番号が若いグループG10を注目グループとするとして説明する。
次に、分類部125は、注目グループG10とは異なるグループG11からG16を、注目グループと比較されるグループ(以下、比較対象グループという)とする(ステップS63)。
その後、分類部125は、全ての比較対象グループG11からG16に対して注目したか否かを判別する(ステップS64)。このとき、分類部125は、比較対象グループG11からG16のいずれにも注目していないので、全ての比較対象グループG11からG16に注目した訳ではないと判別する(ステップS64;No)。
次に、分類部125は、未注目の比較対象グループG11からG16の1つに注目し、注目したグループを注目比較対象グループとする(ステップS65)。ここでは、分類部125は、最もグループIDの番号が若い比較対象グループG11を注目比較対象グループとするとして説明を行う。
次に、一致判別部124は、注目比較対象グループG11が、注目グループG10の直近上位のグループであるか否かを判別する(ステップS66)。具体的には、一致判別部124は、図15に示したグループテーブルから、注目グループG10に対応付けられた総枝数「3」を取得する。この総枝数は、注目グループG10に分類された代表木PT10の総枝数であり、代表木PT10で表される係り受け関係の総数である。また、一致判別部124は、注目比較対象グループG11に対応付けられた総枝数「2」を取得する。この枝数は、注目比較対象グループG11に分類された代表木PT11の総枝数である。その後、一致判別部124は、注目比較対象グループG11の総枝数「2」が、注目グループG10の総枝数「3」よりも1つだけ少ないと判別し、注目比較対象グループG11が注目グループG10の直近上位のグループである可能性がある、と判別する。前述のように、注目グループの直近上位のグループに属する部分木の枝数は、注目グループに属する部分木の枝数よりも1つ少ないためである。
次に、一致判別部124は、注目比較対象グループG11の代表木PT11が、注目グループG10の代表木PT10の部分構文木であるか否かを判別する。代表木PT11が、代表木PT10の部分構文木であれば、代表木PT11で表される概念は、代表木PT10で表される概念を含むので、注目比較対象グループG11が、注目グループG10の直近上位のグループであると判別されるためである。
具体的には、一致判別部124は、グループテーブルから、注目グループG10のグループID(以下、注目グループIDという)「G10」に対応付けられた高さ「2」を取得する。この高さは、図18(b)に示した注目比較対象グループG10を代表する代表木PT10の高さである。また、一致判別部124は、グループテーブルから、注目比較対象グループG11の注目グループID「G11」に対応付けられた高さ「2」を取得する。この高さは、図18(c)に示した注目グループG11を代表する代表木PT11の高さである。
このため、一致判別部124は、注目比較対象グループG11の代表木PT11と、注目グループG10の代表木PT10とは、高さが同じであるので、代表木PT11で表される概念が、代表木PT10で表される概念よりも上位の概念である可能性がある、と判別する。上位の概念を表す部分木の高さは、下位の概念を表す部分木の高さと同じかそれよりも低いためである。
さらに、一致判別部124は、代表木PT11のルートノード「落ちる」と、代表木PT10のルートノード「落ちる」と、が一致すると判別する。また、一致判別部124は、代表木PT11のルートノードに係る文節「汚れが」と、代表木PT10のルートノードに係る文節「汚れが」と、が一致すると判別する。さらにまた、一致判別部124は、代表木PT11の文節「汚れが」に係る「靴下の」と、代表木PT10の文節「汚れが」に係る「靴下の」と、が一致すると判別する。すなわち、一致判別部124は、注目グループG10の代表木PT10が、注目比較対象グループG11の代表木PT11が有する受け文節及び係り文節の全てを有する、と判別する。
これらのため、一致判別部124は、注目比較対象グループG11に分類された代表木PT11は、注目グループG10の代表木PT10の部分構文木であると判別する。よって、一致判別部124は、注目比較対象グループG11は、注目グループG10の直近上位のグループであると判別する(図25のステップS66;Yes)。
尚、一致判別部124は、代表木PT11が有する受け文節及び係り文節の全てと完全に一致する若しくは実質的に一致する受け文節及び係り文節を代表木PT10が有する場合にも、代表木PT11は、代表木PT10の部分構文木であると判別する。
次に、分類部125は、注目比較対象グループG11のグループID「G11」を注目グループG10の直近上位グループIDとする。その後、保存部121は、注目グループG10のグループID「G10」と、直近上位グループID「G11」と、を対応付けて、図16に示した包含関係テーブルに保存する(図25のステップS67)。
その後、分類部125は、ステップS64に戻り、全ての比較対象グループG11からG16に注目した訳ではないと判別する(ステップS64;No)。分類部125は、比較対象グループG11からG16の内で、比較対象グループG11にしか注目していないからである。
次に、分類部125は、未注目の比較対象グループG12からG16の内、比較対象グループG12を注目比較対象グループとする(ステップS65)。
次に、一致判別部124は、注目比較対象グループG12が、注目グループG10の直近上位のグループであると判別する(ステップS66)。具体的には、一致判別部124は、図15に示したグループテーブルから、注目グループG10に対応付けられた総枝数「3」と、注目比較対象グループG12に対応付けられた総枝数「2」と、を取得する。その後、一致判別部124は、注目比較対象グループG12の総枝数「2」が、注目グループG10の総枝数「3」よりも1つだけ少ないと判別し、注目比較対象グループG12が注目グループG10の直近上位のグループである可能性がある、と判別する。
次に、一致判別部124は、グループテーブルから、注目グループG10のグループID「G10」に対応付けられた高さ「2」と、注目比較対象グループG12の注目グループID「G12」に対応付けられた高さ「1」と、を取得する。このため、一致判別部124は、注目比較対象グループG12の代表木PT12の高さは、注目グループG10の代表木PT10の高さよりも低いので、代表木PT12で表される概念が、代表木PT10で表される概念よりも上位の概念である可能性があると、と判別する。
さらに、一致判別部124は、代表木PT12のルートノード「落ちる」と、代表木PT10のルートノード「落ちる」と、が一致すると判別する。また、一致判別部124は、代表木PT12のルートノードに係る文節「汚れが」と、代表木PT10のルートノードに係る文節「汚れが」と、が一致すると判別する。さらにまた、一致判別部124は、代表木PT12のルートノードに係る文節「綺麗に」と、代表木PT10のルートノードに係る文節「綺麗に」と、が一致すると判別する。すなわち、一致判別部124は、注目グループG10の代表木PT10が、注目比較対象グループG12の代表木PT12が有する受け文節及び係り文節の全てを有する、と判別する。
これらのため、一致判別部124は、注目比較対象グループG12に分類された代表木PT12は、注目グループG10の代表木PT10の部分構文木であり、注目比較対象グループG12は、注目グループG10の直近上位のグループであると判別する(ステップS66;Yes)。
次に、分類部125は、注目比較対象グループG12のグループID「G12」を注目グループG10の直近上位グループIDとし、保存部121は、注目グループG10のグループID「G10」と、直近上位グループID「G11」と、を対応付けて、図16に示した包含関係テーブルに保存する(ステップS67)。その後、分類部125は、ステップS64から上記処理を繰り返す。
その後、分類部125は、比較対象グループG13を注目比較対象グループとして、ステップS64及びS65の処理を実行する。
その後、一致判別部124は、注目比較対象グループG13が、注目グループG10の直近上位のグループでないと判別する(ステップS66;No)。グループテーブルにおいて、注目比較対象グループG13に対応付けられた総枝数「1」は、注目グループG10に対応付けられた総枝数「3」よりも2以上少ないためである。
その後、分類部125は、比較対象グループG14からG16をそれぞれ注目比較対象グループとして、ステップS64からS66の処理を繰り返し実行する。これにより、分類部125は、注目比較対象グループG14からG16が、注目グループG10の直近上位のグループでないと判別する。
その後、分類部125は、全ての比較対象グループG11からG16に注目したと判別する(ステップS64;Yes)。
次に、分類部125は、図16に示した包含関係テーブルに、注目グループG10のグループID「G10」と、直近上位グループのグループID「G11」及び「G12」と、が対応付けて保存されていると判別する(ステップS68;Yes)。このため、分類部125は、注目グループG10を最上位のグループでないと判別する。
次に、分類部125は、グループG11及びG12を順に注目グループとして、ステップS61から上記処理を繰り返す。これにより、保存部121は、グループG11のグループID「G11」と、グループG11の直近上位グループのグループID「G13」及び「G15」と、を、図16に示す包含関係テーブルに、対応付けて保存する。また、保存部121は、グループG12のグループID「G12」と、グループG12の直近上位グループのグループID「G13」及び「G14」と、を対応付けて、包含関係テーブルに保存する。
次に、分類部125は、グループG13を注目グループとし、グループG10からG12及びG14からG16を注目比較対象グループとして、ステップS61からステップS66の処理を繰り返す。その後、分類部125は、全ての比較対象グループG10からG12及びG14からG16に注目したと判別する(ステップS64;Yes)。
次に、分類部125は、図16に示した包含関係テーブルに、注目グループG13のグループID「G13」と、直近上位グループのグループIDと、が対応付けて保存されていないと判別する(ステップS68;No)。このため、分類部125は、注目グループG13が最上位のグループであると判別する(ステップS69)。
その後、保存部121は、グループG13のグループIDと、グループG13の直近上位グループが存在しないことを表す記号「-」と、を対応付けて、包含関係テーブルに保存する。
その後、分類部125は、グループG14からG16を注目グループとして、ステップS61からS66S68及びS69の処理を繰り返す。これにより、保存部121は、グループG14からG16のグループIDと、これらグループの直近上位グループが存在しないことを表す記号「-」と、を対応付けて、包含関係テーブルに保存する。
その後、分類部125は、グループG10からG16の全てに注目したと判別し(ステップS61;Yes)、包含関係特定処理の実行を終了する。
図5のステップS08が実行された後に、グループ分類された部分木で表される概念に基づいてグループを分類し、分類したグループ間の階層構造を特定する、図26に示すようなグループ分類処理が実行される(図5のステップS09)。
グループ分類処理を開始すると、分類部125は、図16に示した包含関係テーブルを参照する。次に、分類部125は、包含関係テーブルに保存された記号「-」に対応付けられたグループID「G13」から「G16」を取得する。記号「-」に対応付けられたグループIDは、直近上位グループが存在しない最上位グループである。
次に、分類部125は、未だグループ集合に分類されていない最上位グループ(以下、未分類の最上位グループという)G13からG16の全てについて注目したか否かを判別する(ステップS71)。このとき、分類部125は、グループ分類処理を開始したばかりであるので、未分類の最上位グループG13からG16のいずれにも注目していないため、未分類の最上位グループG13からG16の全てについて注目した訳ではないと判別する(ステップS71;No)。
次に、分類部125は、未分類の最上位グループG13からG16の1つについて注目し、注目グループとする(ステップS72)。ここでは、分類部125は、グループG13に注目するとして説明する。
次に、分類部125は、注目グループG13の代表木PT13で表される「汚れが落ちる」という概念を表す部分木が分類されたグループが分類される新たなグループ集合SG1を生成する(ステップS73)。その後、分類部125は、生成したグループ集合SG1に注目グループG13を分類する(ステップS74)。次に、保存部121は、グループ集合SG1のグループ集合ID「SG1」と、注目グループG13のグループID「G13」と、を対応付けて、図17に示した階層構造テーブルに保存する。
次に、分類部125は、図16に示す包含関係テーブルから、注目グループG13の直近下位のグループを検索し、グループG11及びグループG12を取得したと判別する(ステップS75;Yes)。具体的には、分類部125は、直近上位グループID「G13」に対応付けられたグループID「G11」及び「G12」を取得し、取得したグループID「G11」及び「G12」で識別されるグループG11及びG12を直近下位グループ(以下、取得グループという)とする。
次に、分類部125は、ステップS73で作成した新たなグループ集合SG1に、取得グループG11及びG12を分類する(ステップS76)。
次に、分類部125は、取得グループG11及びG12の1つに注目し、注目グループとする(ステップS77)。ここでは、分類部125は、取得グループG11を注目グループとするとして説明する。
その後、分類部125は、ステップS75からステップS77を実行することで、注目グループG11の直近下位のグループG10を取得し、グループ集合SG1にグループG10を分類し、グループG10を注目グループとする。
その後、分類部125は、ステップS75を実行し、図16に示す包含関係テーブルから、注目グループG10の直近下位のグループが取得できなかったと判別する(ステップS75;No)。
次に、分類部125は、ステップS76で取得された取得グループG11、G12、及びG10の内で、未だ注目していないグループG12がある、と判別する(ステップS78;Yes)。
次に、分類部125は、未だ注目していないグループG12を注目グループとし(ステップS79)、ステップS75からS77の処理を繰り返す。これにより、分類部125は、注目グループG12の直近下位のグループG10を取得する。また、保存部121は、グループ集合ID「SG1」と、グループID「G10」と、直近上位グループID「G12」と、を対応付けて、図17に示した階層構造テーブルに保存する。
その後、分類部125は、ステップS75で、図16に示す包含関係テーブルから、注目グループG10の直近下位のグループが取得できなかったと判別する(ステップS75;No)。
次に、分類部125は、ステップS76で取得された取得グループG11、G12、及びG10の内で、未だ注目していないグループがない、と判別する(ステップS78;No)。
その後、分類部125は、ステップS71からステップS77を繰り返し実行する。これにより、分類部125は、新たなグループ集合SG2からSG4を生成する。また、分類部125は、グループG14と、グループG14の直近下位グループG12と、グループG12の直近下位グループG10と、をグループ集合SG2に分類する。さらに、分類部125は、グループG15と、グループG15の直近下位グループG1と、グループG11の直近下位グループG10と、をグループ集合SG3に分類する。またさらに、分類部125は、グループG16をグループ集合SG4に分類する。
その後、分類部125は、未だ注目していない取得グループはない、と判別する(ステップS78;No)。次に、分類部125は、最上位グループG13からG16の全てについて注目したと判別し(ステップS71;Yes)、グループ分類処理の実行を終了する。
図5のステップS09で、グループ分類処理の実行が終了すると、「綺麗に落ちる。」という互いに共通した概念を表す部分木が分類されたグループG10、G12、及びG14が、グループ集合SG2に分類されている。これらのグループG10、G12、及びG14は、図27に示すような階層構造を形成している。この階層構造では、グループG10を、グループG10よりも上位のグループG12が包含し、グループG12を、グループG12よりも上位のグループG14が包含する。
尚、グループ集合SG1に分類されたグループG10、G11、G12、及びG13、グループ集合SG3に分類されたグループG10、G11、及びG15、並びにグループ集合SG4に分類されたグループG16は、図示を省略するが、それぞれ異なる階層構造を形成する。
図5のステップS09で部分木集計処理が実行された後に、図6に示す出力部127は、図3に示した集計結果画面を生成する集計結果画面生成処理を実行する(ステップS10)。
集計結果画面生成処理を開始すると、出力部127は、図3に示した集計結果画面を生成する。次に、出力部127は、図17に示した階層構造テーブルに保存されたグループ集合GS1からGS4までにそれぞれ分類されたグループを表すツリーT1から4を作成し、集計結果画面に表示する。
具体的には、先ず、出力部127は、階層構造テーブルから、直近上位グループが無いことを表す記号「-」に対応付けられたグループID(つまり、最上位グループのグループID)「G13」を取得する。次に、出力部127は、図15に示したグループテーブルから、グループID「G13」に対応付けたグループ名「汚れが落ちる。」、グループ名一致木数「2」、及び総木数「5」を取得する。その後、出力部127は、取得したグループ名を表す文字列の末尾に、グループ名一致木数を丸括弧で囲った文字列と、総木数を括弧で囲った文字列と、を表すルートRT1を生成し、ツリーT1のルートとする。
次に、出力部127は、階層構造テーブルから、直近上位グループID「G13」に対応付けられたグループID(つまり、グループG13の直近下位グループのグループID)「G11」及び「G12」を取得する。次に、出力部127は、グループテーブルから、グループID「G11」に対応付けたグループ名「靴下の汚れが落ちる。」、グループ名一致木数「1」、及び総木数「2」を取得する。また、出力部127は、グループテーブルから、グループID「G12」に対応付けたグループ名「汚れが綺麗に落ちる。」、グループ名一致木数「1」、及び総木数「3」を取得する。その後、出力部127は、2つのグループそれぞれに対して、取得したグループ名を表す文字列の末尾に、それぞれのグループのグループ名一致木数を丸括弧で囲った文字列と、総木数を括弧で囲った文字列と、を表す葉LF12及びLF13を生成する。次に、出力部127は、葉LF12及びLF13と、ルートRT1と、を結ぶ枝をそれぞれ生成する。
その後、出力部127は、階層構造テーブルから、直近上位グループID「G11」に対応付けられたグループID(つまり、グループG11の直近下位グループのグループID)「G10」を取得する。次に、出力部127は、グループテーブルから、グループID「G10」に対応付けたグループ名「靴下の汚れが綺麗に落ちる。」、グループ名一致木数「1」、及び総木数「2」を取得する。その後、出力部127は、取得したグループ名を表す文字列の末尾に、それぞれのグループのグループ名一致木数を丸括弧で囲った文字列と、総木数を括弧で囲った文字列と、を表す葉LF14を生成する。その後、出力部127は、葉LF14と、葉LF12と、を結ぶ枝を生成する。
同様に、出力部127は、階層構造テーブルから、直近上位グループID「G12」に対応付けられたグループID(つまり、グループG12の直近下位グループのグループID)「G10」を取得する。その後、出力部127は、グループG10のグループ名を表す文字列の末尾に、グループG10のグループ名一致木数を丸括弧で囲った文字列と、総木数を括弧で囲った文字列と、を表す葉LF15を生成する。その後、出力部127は、葉LF15と、葉LF13と、を結ぶ枝を生成する。
このようにして、出力部127は、ルートRT1と、葉LF11からLF15と、を有するツリーT1を生成する。また、出力部127は、同様に、ルートRT2と葉LF22及びLF23とを有するツリーT2と、ルートRT3と葉LF31及びLF32とを有するツリーT3と、ルートRT4のみを有するツリーT4と、を生成する。その後、出力部127は、ツリーT1からツリーT4を集計結果画面に表示する。
その後、出力部127は、生成した集計画面をLANカード106へ出力する(図5のステップS11)。その後、LANカード106が端末装置20へ集計結果画面を送信した後に、出力部127は、集計処理の実行を終了する。
尚、端末装置20は、集計結果画面を受信すると、受信した集計結果画面を表示部に表示する。
本実施例では、入力部120は、端末装置20若しくは21から受信したアンケートの回答文を入力するとして説明したが、回答文は、日本語の文に限定される訳ではない。
これらの構成によれば、集計装置100は、部分木PT10からPT15のいずれか1つと、部分木PT20からPT25のいずれか1つと、の組み合わせの全てについて、図21のステップS26bの処理を実行する。集計装置100は、ステップS26bで、部分木PT10からPT15のいずれか1つで表される表現と、部分木PT20からPT25のいずれか1つで表される表現と、が、一致すると判別すると、これらの部分木を同じグループへ分類する。その後、集計装置100は、グループに分類された部分木の数、若しくは、当該グループに分類された1の部分木若しくは複数の部分木でそれぞれ表される表現を出力する。このため、集計装置100は、入力された複数の文において部分木で表される表現がどれだけ使用されたかを集計できる。
また、これらの構成によれば、集計装置100は、部分木の高さ、枝数、根と枝に付された葉とにそれぞれ割り当てられた文節に基づいて複数の部分木が同じ表現を表しているか否かを判別する。ここで、部分木の高さ及び枝数が異なれば、根と枝に付された葉とにそれぞれ割り当てられた文節の係り受け関係が異なる。このため、集計装置100は、複数の部分木が係り受け関係の同じ表現を表すか否かを判別できる。
さらに、これらの構成によれば、集計装置100は、図21のステップS26bにおいて、部分木PT10の係り文節と、部分木PT20の係り文節と、が、一致しているか否か、及び部分木PT10の受け文節と、部分木PT20の受け文節と、が、一致しているか否か、に基づいて、部分木PT10で表される表現と部分木PT20で表される表現とが一致した内容を表すか否かを判別する。ここで、部分木の高さ、枝数、及び文節が同じであっても、係り文節同士及び受け文節同士のいずれかが異なれば、文節の係り受け関係が異なる。このため、集計装置100は、複数の部分木が係り受け関係の同じ表現を表すか否かを精度良く判別できる。
またさらに、これらの構成によれば、集計装置100は、図23のステップS38において、グループG10とグループG11との間の包含関係を、グループG10に属する部分木の高さ、枝数、及び文節の数と、グループG11に属する部分木の高さ、枝数、及び文節の数と、に基づいて判別する。このため、集計装置100は、グループG11に分類された部分木PT10及びPT20でそれぞれ表される表現と、グループG12に分類された部分木PT11及びPT21でそれぞれ表される表現と、を、グループG11とグループG12との包含関係に基づいて配列して出力できる。よって、ユーザは、部分木PT10及びPT20でそれぞれ表される表現は、それぞれ同じ内容を表し、部分木PT11及びPT21でそれぞれ表される同じ内容を表す表現に包含される概念を表すか否かを容易に理解できる。
これらの構成によれば、集計装置100は、図23に示したグループ分類処理において、集計装置100は、グループG11に分類された部分木PT11が有する係り文節の全てが、グループG10に分類された部分木PT10が有する係り文節のいずれかと一致すると、部分木PT11で表される表現は、部分木PT10で表される表現よりも上位の表現であると判別する。また、集計装置100は、グループG11に分類された部分木PT11が表す表現が、グループG10に分類された部分木PT10が表す表現よりも上位の表現であると判別すると、グループG11をグループG10より上位のグループとする。ここで、同じ受け文節に係る係り文節の数が多い程、これらの係り文節は、受け文節で表される内容をより詳細に限定する。このため、集計装置100は、複数のグループに分類した複数の部分木でそれぞれ表される表現の包含関係を精度良く判別できる。
これらの構成によれば、集計装置100は、図23に示したグループ分類処理において、集計装置100は、グループG11に分類された部分木PT11と、グループG13に分類された部分木PT13と、で、係り文節「汚れが」及び受け文節「落ちる」が一致すると判別すると、係り文節「汚れが」に係る「靴下の」を有さない部分木PT13で表される表現は、部分木PT11で表される表現よりも上位の表現であると判別する。ここで、係り文節が追加された部分木は、追加前の部分木で表される表現を係り文節でより限定した表現を表す。このため、集計装置100は、複数の部分木でそれぞれ表される表現の包含関係を精度良く判別できる。
また、これらの構成によれば、図21に示した部分木分類処理において、分類対象木の文節と注目分類済木の文節とに表記ゆれがあったり、分類対象木の文節が注目分類済木の文節の同義語若しくは言い換えである場合であっても、分類対象木で表される表現と注目分類済木で表される表現とが同一の内容を表す表現か否かを判別できる。
<実施例2>
実施例1では、図9(b)を参照して説明したように、図6の一致判別部124は、第1部分木で表される文「靴下の汚れが綺麗に落ちる。」と、第2部分木で表される文「靴下の汚れが綺麗に取れる。」と、は、実質的に一致する内容を表すと判別する。これは、第1部分木のルートノードと、第2部分木のルートノードと、が相違するが互いに同義語であり、ルートノードに係る文節「汚れ」及び「綺麗に」と、文節「汚れ」に係る文節「靴下の」と、が、第1部分木と第2部分木とで一致するためである。
実施例2では、一致判別部124は、第1部分木が、ルートノードなどの受け文節と、当該受け文節に係る所定数の係り文節と、を有し、かつ第2部分木が、ルートノードなどの受け文節と、当該受け文節に係る所定数の係り文節と、を有する場合に、当該所定数の係り文節がそれぞれ互いに一致すると判別すると、受け文節も互いに一致すると判別し、第1部分木と第2部分木とが一致していると判別する。尚、好適な所定数は、実験により当業者が定めることができる。
図2に示す第1部分木と第2部分木とを例に挙げて説明する。
一致判別部124は、図2に示す第1部分木で表される文「私は興味があまりない。」と、第2部分木で表される文「私は興味があまりわかない。」と、は、実質的に一致する内容を表すと判別する。
一致判別部124は、第1部分木のルートノードと、第2部分木のルートノードと、が相違し、かつ互いに同義語でなくとも、ルートノードに係る文節「あまり」及び「興味が」と、文節「興味が」に係る文節「私は」と、が、第1部分木と第2部分木とで一致する場合には、第1部分木と第2部分木とが実質的に一致すると判別するためである。
ここで、ユーザは、アンケートなどの質問に定型化された文で回答することが多い。この定型化された文には、修飾語(つまり、係り文節)が定型化されているが被修飾語(つまり、受け文節)が定型化されていない、同じ内容を表す複数の文が存在することが多い。このため、これらの構成によれば、受け文節が互いに一致していなくとも、所定数の係り文節が互いに一致している場合に、一致判別部124は、受け文節が互いに一致しているとみなす。このため、複数の部分木でそれぞれ表される複数の文が定型化された文である場合に、複数の部分木が互いに一致した内容を表すか否かを従来よりも精度良く判別できる。
<実施例3>
実施例1では、図4に示したCPU101は、図5に示した集計処理を実行すると説明したが、実施例3では、CPU101は、図29に示す集計処理を実行する。これにより、CPU101は、図6に示した各機能部の他に、図30に示す文節変換部128として機能する。
文節変換部128は、部分木生成部123で生成された部分木が、以下の変換前条件(1)から(3)の全てを満たす場合に、以下の変換後条件(1)及び(2)を満たすように部分木を変換する。
変換前条件(1):部分木の係り文節の末尾が助詞の「と」若しくは「とは」である。
変換前条件(2):当該係り文節が、動詞、形容詞、若しくは形容動詞(つまり、用言)を含み、肯定表現を表し、かつ当該係り文節と、当該係り文節を受ける受け文節と、の間に読点「、」若しくは「,」が無い。
変換前条件(3):当該受け文節が否定表現を表す。
変換後条件(1):当該受け文節が肯定表現を表す。
変換後条件(2):当該係り文節が否定表現を表す。
ここで、例えば、生成された部分木が、図31(a)に示すような部分木である場合を例に挙げて説明する。
図31(a)に示す部分木は、文「私は汚れが落ちると思わない。」を表す。この部分木を、文節変換部128は、図31(b)に示す、「私は汚れが落ちないと思う。」を表す部分木に変換する。
これは、この部分木の文節「思わない」に係る係り文節「落ちると」の末尾が助詞の「と」であるため、文節変換部128は、図31(a)の部分木が変換前条件(1)を満足すると判別するからである。
また、この部分木の係り文節「落ちると」は、動詞(つまり、用言)を含む。また、当該係り文節「落ちると」は、肯定的な表現である。さらに、当該係り文節「落ちると」と、係り文節「落ちると」を受ける受け文節「思わない」と、の間に読点「、」若しくは「,」が無い。このため、文節変換部128は、図31(a)の部分木が変換前条件(2)を満足すると判別するためである。
さらに、この部分木の受け文節「思わない」は、否定表現を含んでいる。このため、文節変換部128は、図31(a)の部分木が変換前条件(3)を満足すると判別するためである。
これらのため、文節変換部128は、受け文節「思わない」を、肯定的表現を表す「思う」に変換し、かつ係り文節「落ちると」を、否定的表現を表す「落ちないと」に変換する。これにより、文節変換部128は、変換後条件(1)及び(2)を満足する、図31(b)に示す部分木に変換するのである。
図31(a)に示す変換前の部分木は、文「汚れが落ちると思わない。」を表す。この文の文節「思わない」という否定表現により否定されるのは、文節「思わない」に係る文節「落ちる」である。このため、文節「思わない」を肯定表現「思う」とし、係り文節「落ちる」を否定表現「落ちない」としても、意味内容が変化しない。すなわち、図31(a)に示す変換前の部分木で表される文「汚れが落ちると思わない。」と、図31(b)に示す変換後の部分木で表される文「汚れが落ちないと思う。」とは、同じ意味内容を表す。このため、文節変換部128が部分木を変換する前と後とで、部分木で表される文の内容が変化しない。
同様に、部分木生成部123で生成された部分木が、図31(c)に示すような部分木である場合には、文節変換部128は、図31(b)に示す部分木に変換する。
図31(c)に示す部分木は、文「私は汚れが落ちる『とは』思わない。」を表す。この部分木の文節「落ちるとは」の末尾が助詞の「とは」であるので、文節変換部128は、この部分木が変換前条件(1)を満足すると判別するからである。
これに対して、部分木生成部123で生成された部分木が、図32(a)に示すような部分木である場合には、文節変換部128は、図32(b)に示す部分木に変換しない。
図32(a)に示す部分木は、文「私は汚れが落ちると、聞かない」を表す。この部分木の係り文節「落ちると」と、受け文節「聞かない」と、の間に読点「、」があるので、文節変換部128は、この部分木が変換前条件(2)を満足しないと判別するからである。
図32(a)に示す変換前の部分木は、文「汚れが落ちると、聞かない。」を表し、この文の文節「聞かない」という否定表現により否定されるのは、文節「聞かない」に係る文節「落ちる」ではない。文節「聞かない」と文節「落ちる」との間に読点が用いられているからである。
このため、文節「聞かない」を肯定表現「聞く」とし、係り文節「落ちる」を否定表現「落ちない」とすると、意味内容が変化する。すなわち、図32(a)に示す部分木で表される文「汚れが落ちると、聞かない」は、図32(b)に示す部分木で表される文「汚れが落ちない、と聞く」か否かに言及する文ではないからである。よって、文節変換部128は、変換前条件(2)を満足しない部分木を変換しない。
次に、図30に示す文節変換部128などの各機能部で行われるCPU101の動作について説明する。
CPU101は、端末装置20若しくは21からアンケートの回答文を受信すると、図29に示す集計処理の実行を開始し、ステップS01からS06の処理を実行する。
次に、文節変換部128は、ステップS05及びステップS06でそれぞれ生成された複数の部分木の内で、上記変換前条件(1)から(3)の全てを満足する部分木を、上記変換後条件(1)及び(2)を満足する部分木に変換する変換処理を実行する(ステップS06b)。
その後、分類部125は、変換された部分木を用いて、図21に示した部分木分類処理を実行する(ステップS07a)。
ここで、図22のステップS26bについて、注目分類済木が、図31(b)に示す部分木であり、分類対象木が文節変換部128によって、図31(a)に示す部分木から図31(b)に示す部分木に変換される場合を例に挙げて説明する。
変換前の分類対象木で表される文は、図31(a)に示すような「私は汚れが落ちると思わない。」であった。これに対して、注目分類済木で表される文は、図31(b)に示すような「私は汚れが落ちないと思う。」である。このため、変換前の分類対象木と、注目分類済木と、は、同じ意味内容の文を表すにもかかわらず、互いに一致する部分木と判別されない。変換前の分類対象木の係り文節「落ちると」と、注目分類済木の係り文節「落ちない」と、が相違し、かつ変換前の分類対象木の受け文節「思わない」と、注目分類済木の受け文節「思う」と、が相違するためである。
しかし、変換後の分類対象木で表される文は、注目分類済木で表される文と同じ、図31(b)に示す文「汚れが落ちないと思う。」である。このため、変換後の分類対象木と、注目分類済木と、は、互いに一致する部分木と判別される。よって、これらの構成によれば、複数の部分木が同じ内容を表しているか否かを判別する判別精度が従来よりも向上する。
<実施例4>
実施例3では、文節変換部128は、部分木生成部123で生成された部分木が、上記変換前条件(1)から(3)の全てを満たす場合に、上記変換後条件(1)及び(2)を満たすように部分木を変換するとして説明した。
すなわち、文節変換部128は、例えば、図31(a)に示すような、文「汚れが落ちると思わない。」を表す部分木を、図31(b)に示すような、文「汚れが落ちないと思う。」を表す部分木に変換するとして説明した。
本実施例では、文節変換部128は、部分木生成部123で生成された部分木が、上記変換前条件(1)及び(2)並びに下記変換前条件(4)の全てを満たす場合に、下記の変換後条件(3)及び(4)を満たすように部分木を変換する。
変換前条件(4):当該係り文節が否定表現を表す。
変換後条件(3):当該受け文節が否定表現を表す。
変換後条件(4):当該係り文節が肯定表現を表す。
すなわち、文節変換部128は、例えば、図31(b)に示すような、文「私は汚れが落ちないと思う。」を表す部分木を、図31(a)に示すような、文「私は汚れが落ちると思わない。」を表す部分木に変換する。
<実施例5>
実施例1では、2以上の文節で構成される回答文が入力された場合に、集計装置100が実行する集計処理を実行について説明した。これに対して、本実施例では、2以上の文節で構成される回答文と、ただ1つの文節からなる回答文と、が入力された場合に、集計装置100が実行する集計処理を実行について説明する。以下、主に、実施例1との相違点について説明する。
本実施例において、集計装置100は、「この商品XXXの良いところは何ですか?」というアンケートに対する回答文を入力するとして説明を行う。
集計装置100が、図5に示した集計処理の実行を開始すると、ステップS01及びステップS02を実行する。これにより、集計装置100は、アンケートに対する回答文を入力し、入力した回答文を、図11に示した入力文テーブルに保存する。
ここで、ステップS02の処理が終了したとき、入力文テーブルには、図33に示すような8つの文が保存されているとして説明を行う。
図33に示す8つの文は、文ID「ST11」で識別される文「とても値段が安い。」、文ID「ST12」で識別される文「価格が安い。」、文ID「ST13」で識別される文「値段が魅力。」、文ID「ST14」で識別される文「値段。」、文ID「ST15」で識別される文「価格。」、文ID「ST16」で識別される文「安い。」、文ID「ST17」及び「ST18」で識別される文「汚れ落ち。」である。
文ID「ST11」から「ST13」でそれぞれ識別される文は、2以上の文節で構成される文である。これに対して、文ID「ST14」から「ST18」でそれぞれ識別される文は、ただ1つの文節からなる文である。
図5のステップS02の後に、入力部120は、入力文テーブルに保存された全ての回答文を読み出し(ステップS03)、読み出した8つの文を形態素解析し(ステップS04a)、形態素解析により得られた形態素列を構文解析する(ステップS04b)。
このようにして、構文解析部122は、文ID「ST11」から「ST13」でそれぞれ識別される2以上の文節で構成される文から、図34(a)、図34(e)、及び図34(g)にそれぞれ示すような、それぞれの文を表す完全木F11からF13を生成する。これに対して、構文解析部122は、文ID「ST14」から「ST18」でそれぞれ識別されるただ1つの文節からなる文から、図35(a)、図35(d)、図35(g)、図36(a)、及び図36(d)にそれぞれ示すような、それぞれの文を表す1つのノードのみで構成される完全木F14からF18を生成する(図5のステップS05)。
次に、部分木生成部123は、実施例1と同様に、図34(a)に示す完全木FT11から、図34(b)から図34(d)にそれぞれ示す部分木P110からPT112を生成する。同様に、部分木生成部123は、図34(e)に示す完全木FT12から、図34(f)に示す部分木P120を生成し、図34(g)に示す完全木FT13から、図34(h)に示す部分木P130を生成する。
また、本実施例では、部分木生成部123は、図35(a)に示す完全木FT14から、完全木FT14が有するただ1つのノードを受ける全ての文節を表すルート「*」が追加された、図35(b)に示すような部分木(以下、受け追加部分木という)PT140を生成する。また、部分木生成部123は、完全木FT14から、完全木FT14が有するただ1つのノードに係る全ての文節を表す葉「*」が追加された、図35(c)に示すような部分木(以下、係り追加部分木という)PT141を生成する。
同様に、部分木生成部123は、図35(d)に示す完全木FT15から、図35(e)に示す受け追加部分木PT150及び図35(f)に示す係り追加部分木PT151を生成する。また同様に、部分木生成部123は、図35(g)に示す完全木FT16から、図35(h)に示す受け追加部分木PT160及び図35(i)に示す係り追加部分木PT161を生成する。さらに同様に、部分木生成部123は、図36(a)に示す完全木FT17から、図36(b)に示す受け追加部分木PT170及び図36(c)に示す係り追加部分木PT171を生成する。またさらに同様に、部分木生成部123は、図36(d)に示す完全木FT18から、図36(e)に示す受け追加部分木PT180及び図36(f)に示す係り追加部分木PT181を生成する(図5のステップS06)。
その後、ルート「*」や葉「*」を有する部分木(つまり、ただ1つの文節からなる文から生成された部分木)を除いた部分木(つまり、2以上の文節で構成された文から生成された部分木)について、図22に示した部分木分類処理が実行される(ステップS07a)。
部分木分類処理の実行が終了すると、図37に示すように、グループG110に部分木PT110が分類され、グループG111に部分木PT111が分類されている。また、グループG112に部分木PT112及びPT120が分類されている。図14(b)に示す同義語テーブルには、「価格」と「価格」の同義語である「値段」とが対応付けて保存されているためである。さらに、グループG130に部分木PT130が分類されている。
図5のステップS07aが実行された後に、集計部126は、図24に示す部分木集計処理を実行する(ステップS07b)。実施例1では、集計部126は、各グループについて、グループの代表木で表される文をグループ名とするとして説明した。これに対して、本実施例では、集計部126は、グループに分類された部分木が1つの場合は、当該部分木で表される文をグループ名とし、グループに分類された部分木が複数の場合は、当該複数の部分木でそれぞれ表される文を「,」で連結した文をグループ名とする。
図5のステップS07bの実行が終了すると、分類部125は、図25に示した包含関係特定処理を実行することで、図37に示すグループG110、グループG111、グループG112、及びグループG130の包含関係を特定する(図5のステップS08)。
次に、分類部125は、図26に示したグループ分類処理を実行する(ステップS09)。これにより、分類部125は、図38に示すように、グループG110及びグループG112を、「値段が安い」若しくは「価格が安い」という概念を表すグループが分類されるグループ集合SG11に分類する。また、分類部125は、グループG110及びグループG111を、「とても安い」という概念を表すグループが分類されるグループ集合SG12に分類する。さらに、分類部125は、グループG130を、「値段が魅力」という概念を表すグループが分類されるグループ集合SG13に分類する。
さらに、分類部125は、グループ集合SG11に分類したグループG110は、グループG110よりも上位のグループであるグループG112によって包含されるという階層構造を特定する。同様に、分類部125は、グループ集合SG12に分類したグループG110は、グループG110よりも上位のグループであるグループG111によって包含されるという階層構造を特定する。
次に、出力部127は、図3に示した集計結果画面を生成する集計結果画面生成処理を実行する(図5のステップS10)。
集計結果画面生成処理を開始すると、出力部127は、特定された階層構造に従って、図39に示すツリーT11からT13を生成する。ツリーT11は、グループG112のグループ名と、グループG112の総木数「2」と、を表すルートRT11と、グループG110のグループ名と、グループG110の総木数「2」と、を表す葉LF111と、を有する。また、ツリーT12は、グループG111のグループ名と、グループG111の総木数「1」と、を表すルートRT12と、グループG110のグループ名と、グループG112の総木数「2」と、を表す葉LF121と、を有する。さらに、ツリーT13は、グループG130のグループ名と、グループG130の総木数「1」と、を表すルートRT13を有する。
次に、出力部127は、ただ1つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図35(b)に示す受け追加部分木PT140と、図35(c)に示す係り追加部分木PT141と、を特定する。
次に、出力部127は、「価格*」を表す受け追加部分木PT140と実質的に一致し、2文節からなり、かつ文「値段が安い」を表す部分木PT112と、受け追加部分木PT140と完全に一致し、2文節からなり、かつ文「価格が安い」を表すPT120と、が分類されたグループ112を特定する。また、出力部127は、「価格*」を表す受け追加部分木PT140と実質的に一致し、2文節からなり、かつ「値段が魅力」を表す部分木PT130が分類されたグループ130を特定する。次に、出力部127は、係り追加部分木PT141と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。
その後、出力部127は、グループ112に分類された部分木の総木数「2」の方が、グループ130に分類された部分木の総木数「1」より多いと判別する。文「価格」は、グループ112に分類された部分木PT112で表される文「価格が安い」が表す内容と同じ内容を表す文として回答者が回答した文であると推測される。このため、出力部127は、追加部分木PT140の生成に用いられた1つの文節のみからなる文「価格」が表す意味内容は、受け文節「安い」で補足説明されると判別する。
次に、出力部127は、図40に示すツリーT11の有する「値段が安い,価格が安い」を表すルートT11を、「値段が安い,価格が安い,価格」を表すルートに変更し、ルートT11が表す総木数を値「1」増加させて「3」とする。
次に、出力部127は、ただ1つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図35(e)に示す受け追加部分木PT150と、図35(f)に示す係り追加部分木PT151と、を特定する。次に、出力部127は、追加部分木PT150の生成に用いられた1つの文節のみからなる文「値段」が表す意味内容は、受け文節「安い」で補足説明されると判別する。次に、出力部127は、ツリーT11が有する「値段が安い,価格が安い,価格」を表すルートT11を、「値段が安い,価格が安い,価格,値段」を表すルートに変更し、ルートT11が表す総木数を値「1」増加させて「4」とする。
次に、出力部127は、ただ1つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図35(h)に示す受け追加部分木PT160と、図35(i)に示す係り追加部分木PT161と、を特定する。
次に、出力部127は、「安い*」を表す受け追加部分木PT160と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。また、出力部127は、「*安い」を表す受け追加部分木PT160と完全一致し、2文節からなり、かつ文「とても安い」を表す部分木PT111が分類されたグループ111を特定する。さらに、出力部127は、「*安い」を表す受け追加部分木PT160と完全一致し、2文節からなり、かつ文「値段が安い」を表す部分木PT112及び文「価格が安い」を表すPT120が分類されたグループ112を特定する。
その後、出力部127は、グループ112に分類された部分木の総木数「2」の方が、グループ111に分類された部分木の総木数「1」より多いと判別する。このため、出力部127は、追加部分木PT160の生成に用いられた1つの文節のみからなる文「安い」が表す意味内容は、受け文節「値段」若しくは「価格」で補足説明されると判別する。
次に、出力部127は、図40に示すツリーT11が有する「値段が安い,価格が安い,価格,値段」を表すルートT11を、「値段が安い,価格が安い,価格,値段,安い」を表すルートに変更し、ルートT11が表す総木数を値「1」増加させて「5」とする。
その後、出力部127は、ただ1つの文節からなる同じ文から生成された受け追加部分木と係り追加部分木として、図36(b)に示す受け追加部分木PT170と、図36(c)に示す係り追加部分木PT171と、及び、図36(e)に示す受け追加部分木PT180と、図36(f)に示す係り追加部分木PT181と、を特定する。
次に、出力部127は、「汚れ落ち*」を表す受け追加部分木PT170及びPT180と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。また、出力部127は、「*汚れ落ち」を表す係り追加部分木PT171及びPT181と完全一致若しくは実質的に一致する部分木が分類されたグループが存在しないと判別する。その後、出力部127は、「汚れ落ち」と総木数「2」とを表すルートRT14を有するツリーT14を生成する。
その後、出力部127は、ツリーT11からT14を集計結果画面に表示する。
その後、出力部127は、生成した集計画面をLANカード106へ出力した後に(図5のステップS11)、集計処理の実行を終了する。
実施例1から5は、互いに組み合わせることができる。実施例1から5のいずれかに係る機能を実現するための構成を備えた集計装置100として提供できることはもとより、複数の装置で構成されるシステムであって、実施例1から5のいずれかに係る機能を実現するための構成をシステム全体として備えたシステムとして提供することもできる。
尚、実施例1から5のいずれかに係る機能を実現するための構成を予め備えた集計装置100として提供できることはもとより、プログラムの適用により、既存の集計装置100を実施例1から5のいずれかに係る集計装置100として機能させることもできる。すなわち、実施例1から5のいずれかで例示した集計装置100による各機能構成を実現させるための集計プログラムを、既存の集計装置を制御するコンピュータ(CPUなど)が実行できるように適用することで、実施例1から5のいずれかに係る集計装置100として機能させることができる。
このようなプログラムの配布方法は任意であり、例えば、メモリカード、CD−ROM、又はDVD−ROMなどの記録媒体に格納して配布できる他、インターネットなどの通信媒体を介して配布することもできる。また、本発明に係る集計方法は、実施例1から5のいずれかに係る集計装置100を用いて実施できる。
以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
10:通信網
20、21:端末装置
100:集計装置
101:CPU
102:ROM
103:RAM
104:ハードディスク
105:メディアコントローラ
106:LANカード
107:ビデオカード
108:LCD
10:キーボード
110:スピーカ
111:タッチパッド
120:入力部
121:保存部
122:構文解析部
123:部分木生成部
124:一致判別部
125:分類部
126:集計部
127:出力部
128:文節変換部
129:情報記憶部

Claims (12)

  1. 入力された文を集計する集計装置であって、
    第1文と第2文とを入力する入力部と、
    前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部と、
    前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部と、
    前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部と、
    前記互いに一致した内容を表すと判別された第1表現と第2表現との1の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第1表現と第2表現との複数の組み合わせのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部と、
    前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の部分木でそれぞれ表される表現を出力する出力部と、を備える、
    ことを特徴とする集計装置。
  2. 請求項1に記載の集計装置であって、
    前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木と、当該部分木組み合わせを構成する第2部分木と、が、高さと、枝数と、根及び1若しくは複数の葉にそれぞれ割り当てられた文節と、の全てにおいて一致する場合に、当該第1部分木で表される第1表現と、当該第2部分木で表される第2表現と、が一致していると判別する、
    ことを特徴とする集計装置。
  3. 請求項1又は2に記載の集計装置であって、
    前記部分木生成部は、前記生成された第1文の構文木から、前記第1文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第1部分木を1若しくは複数生成し、かつ前記生成された第2文の構文木から、前記第2文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第2部分木を1若しくは複数生成し、
    前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、に基づいて、当該第1部分木で表される第1表現と当該第2部分木で表される第2表現とが一致した内容を表すか否かを判別する、
    ことを特徴とする集計装置。
  4. 請求項1から3のいずれか一項に記載の集計装置であって、
    前記一致判別部は、1若しくは複数の部分木がそれぞれ分類された第1グループと第2グループとの組み合わせである1のグループ組み合わせ、若しくは、複数のグループ組み合わせのそれぞれについて、当該第1グループと当該第2グループとの間の包含関係を、当該第1グループに属する部分木の高さ、枝数、及び文節の数と、当該第2グループに属する部分木の高さ、枝数、及び文節の数と、に基づいて判別し、
    前記出力部は、当該第1グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、当該第2グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、を、前記判別された包含関係に基づいて配列して出力する、
    ことを特徴とする集計装置。
  5. 請求項4に記載の集計装置であって、
    前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、第1グループに分類された部分木が有する係り文節の数が、第2グループに分類された部分木が有する係り文節の数より少ないグループ組み合わせについて、当該第1グループに分類された部分木が有する係り文節の全てが、当該第2グループに分類された部分木が有する係り文節のいずれかと一致すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別し、
    前記分類部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせのそれぞれについて、当該グループ組み合わせを構成する第1グループに分類された部分木が表す表現が、当該グループ組み合わせを構成する第2グループに分類された部分木が表す表現よりも上位の表現であると判別されると、当該第1グループを、当該第2グループより上位のグループとする、
    ことを特徴とする集計装置。
  6. 請求項5に記載の集計装置であって、
    前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、受け文節と係り文節とを有する部分木が分類された第1グループと、受け文節と係り文節と当該係り文節に係る文節とを有する部分木が分類された第2グループと、で構成されるグループ組み合わせについて、当該第1グループに分類された部分木の受け文節と、当該第2グループに分類された部分木の受け文節と、が一致し、かつ当該第1グループに分類された部分木の係り文節と、当該第2グループに分類された部分木の係り文節と、が一致すると判別すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別する、
    ことを特徴とする集計装置。
  7. 請求項2から6のいずれか一項に記載の集計装置であって、
    前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、
    当該部分木組み合わせを構成する第1部分木の係り文節が、当該部分木組み合わせを構成する第2部分木の係り文節の同義語である場合、当該第1部分木の係り文節と当該第2部分木の係り文節との相違が活用の相違である場合、及び当該第1部分木の係り文節と当該第2部分木の係り文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の係り文節と当該第2部分木の係り文節とが一致する、と判別し、
    当該第1部分木の受け文節が、当該第1部分木の受け文節の同義語である場合、当該第1部分木の受け文節と当該第2部分木の受け文節との相違が活用の相違である場合、及び当該第1部分木の受け文節と当該第2部分木の受け文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の受け文節と当該第2部分木の受け文節とが一致する、と判別する、
    ことを特徴とする集計装置。
  8. 請求項7に記載の集計装置であって、
    前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節の末尾が助詞の「と」若しくは「とは」であり、当該第1部分木の係り文節が用言を含み、肯定表現を含み、当該第1部分木の係り文節と当該第1部分木の受け文節との間に読点「、」若しくは「,」が無く、かつ当該第1部分木の受け文節が否定表現を含む場合に、当該受け文節を肯定表現に変換し、かつ当該係り文節を否定表現に変換する文節変換部、をさらに備え、
    前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する、前記変換された第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該変換された第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、を判別する、
    ことを特徴とする集計装置。
  9. 請求項8に記載の集計装置であって、
    前記入力部は、質問に対する回答文である第1文及び第2文を入力し、
    前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせの内で、受け文節と所定数の係り文節とを有する第1部分木と、受け文節と前記所定数の係り文節とを有する第2部分木と、で構成される部分木組み合わせについて、当該第1部分木が有する前記所定数の係り文節のそれぞれが、当該第2部分木が有する前記所定数の係り文節のそれぞれに一致すると判別すると、当該第1部分木が有する受け文節と当該第2部分木が有する受け文節とが一致していると判別する、
    ことを特徴とする集計装置。
  10. コンピュータを、
    第1文と第2文とを入力する入力部、
    前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
    前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
    前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
    前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
    前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
    ことを特徴とする集計プログラム。
  11. コンピュータを、
    第1文と第2文とを入力する入力部、
    前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
    前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
    前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
    前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
    前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
    ことを特徴とする集計プログラムを記録したコンピュータ読み取り可能な記録媒体。
  12. 入力部、構文解析部、部分木生成部、一致判別部、分類部、及び出力部を備える集計装置が実行する方法であって、
    前記入力部が、第1文と第2文とを入力する入力ステップと、
    前記構文解析部が、前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析ステップと、
    前記部分木生成部が、前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成ステップと、
    前記一致判別部が、前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別ステップと、
    前記分類部が、前記互いに一致した内容を表すと判別された第1表現と第2表現との1の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第1表現と第2表現との複数の組み合わせのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類ステップと、
    前記出力部が、前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力ステップと、を有する、
    ことを特徴とする集計方法。
JP2012103996A 2012-04-27 2012-04-27 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 Active JP5367869B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2012103996A JP5367869B2 (ja) 2012-04-27 2012-04-27 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法
EP13781546.0A EP2849094B1 (en) 2012-04-27 2013-03-06 Counting device, counting program, memory medium, and counting method
ES13781546.0T ES2650467T3 (es) 2012-04-27 2013-03-06 Dispositivo contador, programa de conteo, medio de memoria y procedimiento de conteo
PCT/JP2013/056196 WO2013161397A1 (ja) 2012-04-27 2013-03-06 集計装置、集計プログラム、記録媒体、及び集計方法
US14/374,692 US9740770B2 (en) 2012-04-27 2013-03-06 Counting device, counting program, memory medium, and counting method
TW102111696A TWI442247B (zh) 2012-04-27 2013-04-01 Statistical devices, computer program products, recording media, and statistical methods

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012103996A JP5367869B2 (ja) 2012-04-27 2012-04-27 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法

Publications (2)

Publication Number Publication Date
JP2013232111A JP2013232111A (ja) 2013-11-14
JP5367869B2 true JP5367869B2 (ja) 2013-12-11

Family

ID=49482737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012103996A Active JP5367869B2 (ja) 2012-04-27 2012-04-27 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法

Country Status (6)

Country Link
US (1) US9740770B2 (ja)
EP (1) EP2849094B1 (ja)
JP (1) JP5367869B2 (ja)
ES (1) ES2650467T3 (ja)
TW (1) TWI442247B (ja)
WO (1) WO2013161397A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10713426B2 (en) * 2013-11-14 2020-07-14 Elsevier B.V. Systems, computer-program products and methods for annotating multiple controlled vocabulary-defined concepts in single noun phrases
US10969431B1 (en) * 2019-12-23 2021-04-06 Intel Corporation Error-tolerant architecture for power-efficient computing
CN112559929B (zh) * 2021-02-25 2021-05-07 中航信移动科技有限公司 提取网页页面目标信息的方法、电子设备和介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171803A (ja) * 1996-12-09 1998-06-26 Oki Electric Ind Co Ltd 文類似度計算装置
JP3879321B2 (ja) * 1998-12-17 2007-02-14 富士ゼロックス株式会社 文書要約装置、文書要約方法及び文書要約プログラムを記録した記録媒体
JP3353829B2 (ja) * 1999-08-26 2002-12-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 膨大な文書データからの知識抽出方法、その装置及び媒体
JP3587120B2 (ja) * 2000-03-15 2004-11-10 日本電気株式会社 アンケート回答分析システム
JP4815934B2 (ja) * 2005-08-02 2011-11-16 日本電気株式会社 テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム
AU2006278225A1 (en) * 2005-08-09 2007-02-15 Compography, Inc. Methods and apparatuses to assemble, extract and deploy content from electronic documents

Also Published As

Publication number Publication date
WO2013161397A1 (ja) 2013-10-31
TW201407386A (zh) 2014-02-16
EP2849094A4 (en) 2015-12-30
ES2650467T3 (es) 2018-01-18
US9740770B2 (en) 2017-08-22
TWI442247B (zh) 2014-06-21
US20150006533A1 (en) 2015-01-01
JP2013232111A (ja) 2013-11-14
EP2849094A1 (en) 2015-03-18
EP2849094B1 (en) 2017-09-20

Similar Documents

Publication Publication Date Title
JP5939588B2 (ja) 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム
JP5621773B2 (ja) 分類階層再作成システム、分類階層再作成方法及び分類階層再作成プログラム
JP5229226B2 (ja) 情報共有システム、情報共有方法、および情報共有プログラム
JP2015505082A (ja) 情報ドメインに対する自然言語処理モデルの生成
JP2008152774A (ja) 固有表現抽出装置、方法、及びプログラム
JP2007157058A (ja) 分類モデル学習装置、分類モデル学習方法、及び分類モデルを学習するためのプログラム
JP5367869B2 (ja) 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法
JP5527548B2 (ja) 情報分析装置、情報分析方法、及びプログラム
JP2020113129A (ja) 文書評価装置、文書評価方法及びプログラム
JP5224532B2 (ja) 評判情報分類装置及びプログラム
JP2006004098A (ja) 評価情報生成装置、評価情報生成方法、及びプログラム
JP2010182267A (ja) コンテンツ分類装置、方法及びプログラム
JP2011041164A (ja) 映像要約方法および映像要約プログラム
JP2010198142A (ja) 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム
JP2006318509A (ja) 解データ編集処理装置および処理方法
JP2009064191A (ja) 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体
JP2012226697A (ja) Wbs作成システムおよびwbs作成方法
JP5954742B2 (ja) 文書を検索する装置及び方法
JP5242722B2 (ja) 代表文抽出装置およびプログラム
JP2010244341A (ja) 属性表現獲得方法及び装置及びプログラム
WO2012124213A1 (ja) 要約作成装置、要約作成方法、およびコンピュータ読み取り可能な記録媒体
JP2020154992A (ja) 支援システム、プログラム、及び記憶媒体
JP6200392B2 (ja) 情報提示装置および情報提示プログラム
JP5202598B2 (ja) ワークフロー管理装置、及びワークフロー管理プログラム
JP2014063306A (ja) 検索装置、検索方法及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130911

R150 Certificate of patent or registration of utility model

Ref document number: 5367869

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250