JP5367869B2 - 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 - Google Patents
集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 Download PDFInfo
- Publication number
- JP5367869B2 JP5367869B2 JP2012103996A JP2012103996A JP5367869B2 JP 5367869 B2 JP5367869 B2 JP 5367869B2 JP 2012103996 A JP2012103996 A JP 2012103996A JP 2012103996 A JP2012103996 A JP 2012103996A JP 5367869 B2 JP5367869 B2 JP 5367869B2
- Authority
- JP
- Japan
- Prior art keywords
- subtree
- group
- sentence
- tree
- clause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/183—Tabulation, i.e. one-dimensional positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Description
入力された文を集計する集計装置であって、
第1文と第2文とを入力する入力部と、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部と、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部と、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部と、
前記互いに一致した内容を表すと判別された第1表現と第2表現との1の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第1表現と第2表現との複数の組み合わせのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部と、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の部分木でそれぞれ表される表現を出力する出力部と、を備える、
ことを特徴とする。
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木と、当該部分木組み合わせを構成する第2部分木と、が、高さと、枝数と、根及び1若しくは複数の葉にそれぞれ割り当てられた文節と、の全てにおいて一致する場合に、当該第1部分木で表される第1表現と、当該第2部分木で表される第2表現と、が一致していると判別する、
としても良い。
前記部分木生成部は、前記生成された第1文の構文木から、前記第1文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第1部分木を1若しくは複数生成し、かつ前記生成された第2文の構文木から、前記第2文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第2部分木を1若しくは複数生成し、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、に基づいて、当該第1部分木で表される第1表現と当該第2部分木で表される第2表現とが一致した内容を表すか否かを判別する、
としても良い。
前記一致判別部は、1若しくは複数の部分木がそれぞれ分類された第1グループと第2グループとの組み合わせである1のグループ組み合わせ、若しくは、複数のグループ組み合わせのそれぞれについて、当該第1グループと当該第2グループとの間の包含関係を、当該第1グループに属する部分木の高さ、枝数、及び文節の数と、当該第2グループに属する部分木の高さ、枝数、及び文節の数と、に基づいて判別し、
前記出力部は、当該第1グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、当該第2グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、を、前記判別された包含関係に基づいて配列して出力する、
としても良い。
前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、第1グループに分類された部分木が有する係り文節の数が、第2グループに分類された部分木が有する係り文節の数より少ないグループ組み合わせについて、当該第1グループに分類された部分木が有する係り文節の全てが、当該第2グループに分類された部分木が有する係り文節のいずれかと一致すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別し、
前記分類部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせのそれぞれについて、当該グループ組み合わせを構成する第1グループに分類された部分木が表す表現が、当該グループ組み合わせを構成する第2グループに分類された部分木が表す表現よりも上位の表現であると判別されると、当該第1グループを、当該第2グループより上位のグループとする、
としても良い。
前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、受け文節と係り文節とを有する部分木が分類された第1グループと、受け文節と係り文節と当該係り文節に係る文節とを有する部分木が分類された第2グループと、で構成されるグループ組み合わせについて、当該第1グループに分類された部分木の受け文節と、当該第2グループに分類された部分木の受け文節と、が一致し、かつ当該第1グループに分類された部分木の係り文節と、当該第2グループに分類された部分木の係り文節と、が一致すると判別すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別する、
としても良い。
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、
当該部分木組み合わせを構成する第1部分木の係り文節が、当該部分木組み合わせを構成する第2部分木の係り文節の同義語である場合、当該第1部分木の係り文節と当該第2部分木の係り文節との相違が活用の相違である場合、及び当該第1部分木の係り文節と当該第2部分木の係り文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の係り文節と当該第2部分木の係り文節とが一致する、と判別し、
当該第1部分木の受け文節が、当該第1部分木の受け文節の同義語である場合、当該第1部分木の受け文節と当該第2部分木の受け文節との相違が活用の相違である場合、及び当該第1部分木の受け文節と当該第2部分木の受け文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の受け文節と当該第2部分木の受け文節とが一致する、と判別する、
としても良い。
前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節の末尾が助詞の「と」若しくは「とは」であり、当該第1部分木の係り文節が用言を含み、肯定表現を含み、当該第1部分木の係り文節と当該第1部分木の受け文節との間に句読点「、」若しくは「,」が無く、かつ当該第1部分木の受け文節が否定表現を含む場合に、当該受け文節を肯定表現に変換し、かつ当該係り文節を否定表現に変換する文節変換部、をさらに備え、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する、前記変換された第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該変換された第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、を判別する、
としても良い。
前記入力部は、質問に対する回答文である第1文及び第2文を入力し、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせの内で、受け文節と所定数の係り文節とを有する第1部分木と、受け文節と前記所定数の係り文節とを有する第2部分木と、で構成される部分木組み合わせについて、当該第1部分木が有する前記所定数の係り文節のそれぞれが、当該第2部分木が有する前記所定数の係り文節のそれぞれに一致すると判別すると、当該第1部分木が有する受け文節と当該第2部分木が有する受け文節とが一致していると判別する、
としても良い。
コンピュータを、
第1文と第2文とを入力する入力部、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする。
コンピュータを、
第1文と第2文とを入力する入力部、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラムを記録している。
入力部、構文解析部、部分木生成部、一致判別部、分類部、及び出力部を備える集計装置が実行する方法であって、
前記入力部が、第1文と第2文とを入力する入力ステップと、
前記構文解析部が、前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析ステップと、
前記部分木生成部が、前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成ステップと、
前記一致判別部が、前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別ステップと、
前記分類部が、前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類ステップと、
前記出力部が、前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力ステップと、を有する、
ことを特徴とする。
本発明の実施例1に係る集計装置100は、図1に示すような集計システム1を構成する。集計システム1は、アンケートに対するユーザの回答を集計する。
CPU101は、アンケートの回答を集計する、図5に示す集計処理を実行する。これにより、CPU101は、図6に示す入力部120、保存部121、構文解析部122、部分木生成部123、一致判別部124、分類部125、集計部126、及び出力部127として機能する。また、CPU101は、図4に示したハードディスク104と協働して、情報記憶部129として機能する。
実施例1では、図9(b)を参照して説明したように、図6の一致判別部124は、第1部分木で表される文「靴下の汚れが綺麗に落ちる。」と、第2部分木で表される文「靴下の汚れが綺麗に取れる。」と、は、実質的に一致する内容を表すと判別する。これは、第1部分木のルートノードと、第2部分木のルートノードと、が相違するが互いに同義語であり、ルートノードに係る文節「汚れ」及び「綺麗に」と、文節「汚れ」に係る文節「靴下の」と、が、第1部分木と第2部分木とで一致するためである。
一致判別部124は、図28に示す第1部分木で表される文「私は興味があまりない。」と、第2部分木で表される文「私は興味があまりわかない。」と、は、実質的に一致する内容を表すと判別する。
実施例1では、図4に示したCPU101は、図5に示した集計処理を実行すると説明したが、実施例3では、CPU101は、図29に示す集計処理を実行する。これにより、CPU101は、図6に示した各機能部の他に、図30に示す文節変換部128として機能する。
変換前条件(2):当該係り文節が、動詞、形容詞、若しくは形容動詞(つまり、用言)を含み、肯定表現を表し、かつ当該係り文節と、当該係り文節を受ける受け文節と、の間に読点「、」若しくは「,」が無い。
変換前条件(3):当該受け文節が否定表現を表す。
変換後条件(2):当該係り文節が否定表現を表す。
実施例3では、文節変換部128は、部分木生成部123で生成された部分木が、上記変換前条件(1)から(3)の全てを満たす場合に、上記変換後条件(1)及び(2)を満たすように部分木を変換するとして説明した。
変換後条件(4):当該係り文節が肯定表現を表す。
実施例1では、2以上の文節で構成される回答文が入力された場合に、集計装置100が実行する集計処理を実行について説明した。これに対して、本実施例では、2以上の文節で構成される回答文と、ただ1つの文節からなる回答文と、が入力された場合に、集計装置100が実行する集計処理を実行について説明する。以下、主に、実施例1との相違点について説明する。
20、21:端末装置
100:集計装置
101:CPU
102:ROM
103:RAM
104:ハードディスク
105:メディアコントローラ
106:LANカード
107:ビデオカード
108:LCD
109:キーボード
110:スピーカ
111:タッチパッド
120:入力部
121:保存部
122:構文解析部
123:部分木生成部
124:一致判別部
125:分類部
126:集計部
127:出力部
128:文節変換部
129:情報記憶部
Claims (12)
- 入力された文を集計する集計装置であって、
第1文と第2文とを入力する入力部と、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部と、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部と、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部と、
前記互いに一致した内容を表すと判別された第1表現と第2表現との1の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第1表現と第2表現との複数の組み合わせのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部と、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の部分木でそれぞれ表される表現を出力する出力部と、を備える、
ことを特徴とする集計装置。 - 請求項1に記載の集計装置であって、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木と、当該部分木組み合わせを構成する第2部分木と、が、高さと、枝数と、根及び1若しくは複数の葉にそれぞれ割り当てられた文節と、の全てにおいて一致する場合に、当該第1部分木で表される第1表現と、当該第2部分木で表される第2表現と、が一致していると判別する、
ことを特徴とする集計装置。 - 請求項1又は2に記載の集計装置であって、
前記部分木生成部は、前記生成された第1文の構文木から、前記第1文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第1部分木を1若しくは複数生成し、かつ前記生成された第2文の構文木から、前記第2文を構成する複数の文節の内で、他の文節に係る係り文節と、当該他の文節である受け文節と、を少なくとも有する第2部分木を1若しくは複数生成し、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、に基づいて、当該第1部分木で表される第1表現と当該第2部分木で表される第2表現とが一致した内容を表すか否かを判別する、
ことを特徴とする集計装置。 - 請求項1から3のいずれか一項に記載の集計装置であって、
前記一致判別部は、1若しくは複数の部分木がそれぞれ分類された第1グループと第2グループとの組み合わせである1のグループ組み合わせ、若しくは、複数のグループ組み合わせのそれぞれについて、当該第1グループと当該第2グループとの間の包含関係を、当該第1グループに属する部分木の高さ、枝数、及び文節の数と、当該第2グループに属する部分木の高さ、枝数、及び文節の数と、に基づいて判別し、
前記出力部は、当該第1グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、当該第2グループに分類された1の部分木で表される表現若しくは複数の部分木でそれぞれ表される複数の表現と、を、前記判別された包含関係に基づいて配列して出力する、
ことを特徴とする集計装置。 - 請求項4に記載の集計装置であって、
前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、第1グループに分類された部分木が有する係り文節の数が、第2グループに分類された部分木が有する係り文節の数より少ないグループ組み合わせについて、当該第1グループに分類された部分木が有する係り文節の全てが、当該第2グループに分類された部分木が有する係り文節のいずれかと一致すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別し、
前記分類部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせのそれぞれについて、当該グループ組み合わせを構成する第1グループに分類された部分木が表す表現が、当該グループ組み合わせを構成する第2グループに分類された部分木が表す表現よりも上位の表現であると判別されると、当該第1グループを、当該第2グループより上位のグループとする、
ことを特徴とする集計装置。 - 請求項5に記載の集計装置であって、
前記一致判別部は、前記1のグループ組み合わせ、若しくは、前記複数のグループ組み合わせの内で、受け文節と係り文節とを有する部分木が分類された第1グループと、受け文節と係り文節と当該係り文節に係る文節とを有する部分木が分類された第2グループと、で構成されるグループ組み合わせについて、当該第1グループに分類された部分木の受け文節と、当該第2グループに分類された部分木の受け文節と、が一致し、かつ当該第1グループに分類された部分木の係り文節と、当該第2グループに分類された部分木の係り文節と、が一致すると判別すると、当該第1グループに分類された部分木で表される表現は、当該第2グループに分類された部分木で表される表現よりも上位の表現であると判別する、
ことを特徴とする集計装置。 - 請求項2から6のいずれか一項に記載の集計装置であって、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、
当該部分木組み合わせを構成する第1部分木の係り文節が、当該部分木組み合わせを構成する第2部分木の係り文節の同義語である場合、当該第1部分木の係り文節と当該第2部分木の係り文節との相違が活用の相違である場合、及び当該第1部分木の係り文節と当該第2部分木の係り文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の係り文節と当該第2部分木の係り文節とが一致する、と判別し、
当該第1部分木の受け文節が、当該第1部分木の受け文節の同義語である場合、当該第1部分木の受け文節と当該第2部分木の受け文節との相違が活用の相違である場合、及び当該第1部分木の受け文節と当該第2部分木の受け文節との相違が表記の相違である場合のいずれかの場合に、当該第1部分木の受け文節と当該第2部分木の受け文節とが一致する、と判別する、
ことを特徴とする集計装置。 - 請求項7に記載の集計装置であって、
前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木の係り文節の末尾が助詞の「と」若しくは「とは」であり、当該第1部分木の係り文節が用言を含み、肯定表現を含み、当該第1部分木の係り文節と当該第1部分木の受け文節との間に読点「、」若しくは「,」が無く、かつ当該第1部分木の受け文節が否定表現を含む場合に、当該受け文節を肯定表現に変換し、かつ当該係り文節を否定表現に変換する文節変換部、をさらに備え、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する、前記変換された第1部分木の係り文節と、当該部分木組み合わせを構成する第2部分木の係り文節と、が、一致しているか否か、及び当該変換された第1部分木の受け文節と、当該第2部分木の受け文節と、が、一致しているか否か、を判別する、
ことを特徴とする集計装置。 - 請求項8に記載の集計装置であって、
前記入力部は、質問に対する回答文である第1文及び第2文を入力し、
前記一致判別部は、前記1の部分木組み合わせ、若しくは、前記複数の部分木組み合わせの内で、受け文節と所定数の係り文節とを有する第1部分木と、受け文節と前記所定数の係り文節とを有する第2部分木と、で構成される部分木組み合わせについて、当該第1部分木が有する前記所定数の係り文節のそれぞれが、当該第2部分木が有する前記所定数の係り文節のそれぞれに一致すると判別すると、当該第1部分木が有する受け文節と当該第2部分木が有する受け文節とが一致していると判別する、
ことを特徴とする集計装置。 - コンピュータを、
第1文と第2文とを入力する入力部、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラム。 - コンピュータを、
第1文と第2文とを入力する入力部、
前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析部、
前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成部、
前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別部、
前記互いに一致した内容を表すと判別された1の第1表現と第2表現、若しくは、複数の第1表現と第2表現とのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類部、
前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力部、として機能させる、
ことを特徴とする集計プログラムを記録したコンピュータ読み取り可能な記録媒体。 - 入力部、構文解析部、部分木生成部、一致判別部、分類部、及び出力部を備える集計装置が実行する方法であって、
前記入力部が、第1文と第2文とを入力する入力ステップと、
前記構文解析部が、前記第1文と前記第2文とを構文解析することで、前記第1文の構文木と前記第2文の構文木とを生成する構文解析ステップと、
前記部分木生成部が、前記生成された第1文の構文木から、前記第1文を構成する部分木である第1部分木を1若しくは複数生成し、前記生成された第2文の構文木から、前記第2文を構成する部分木である第2部分木を1若しくは複数生成する部分木生成ステップと、
前記一致判別部が、前記生成された1の第1部分木若しくは複数の第1部分木のいずれか1つと、前記生成された1の第2部分木若しくは複数の第2部分木のいずれか1つと、の組み合わせである1の部分木組み合わせ、若しくは、複数の部分木組み合わせのそれぞれについて、当該部分木組み合わせを構成する第1部分木で表される第1表現と、当該部分木組み合わせを構成する第2部分木で表される第2表現とが互いに一致した内容を表すか否かを判別する一致判別ステップと、
前記分類部が、前記互いに一致した内容を表すと判別された第1表現と第2表現との1の組み合わせ、若しくは、前記互いに一致した内容を表すと判別された第1表現と第2表現との複数の組み合わせのそれぞれについて、当該第1表現を表す第1部分木を、当該第2表現を表す第2部分木と同じグループに分類する分類ステップと、
前記出力部が、前記グループに分類された部分木の数、若しくは、前記グループに分類された1の部分木若しくは複数の構文木でそれぞれ表される表現を出力する出力ステップと、を有する、
ことを特徴とする集計方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012103996A JP5367869B2 (ja) | 2012-04-27 | 2012-04-27 | 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 |
EP13781546.0A EP2849094B1 (en) | 2012-04-27 | 2013-03-06 | Counting device, counting program, memory medium, and counting method |
ES13781546.0T ES2650467T3 (es) | 2012-04-27 | 2013-03-06 | Dispositivo contador, programa de conteo, medio de memoria y procedimiento de conteo |
PCT/JP2013/056196 WO2013161397A1 (ja) | 2012-04-27 | 2013-03-06 | 集計装置、集計プログラム、記録媒体、及び集計方法 |
US14/374,692 US9740770B2 (en) | 2012-04-27 | 2013-03-06 | Counting device, counting program, memory medium, and counting method |
TW102111696A TWI442247B (zh) | 2012-04-27 | 2013-04-01 | Statistical devices, computer program products, recording media, and statistical methods |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012103996A JP5367869B2 (ja) | 2012-04-27 | 2012-04-27 | 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013232111A JP2013232111A (ja) | 2013-11-14 |
JP5367869B2 true JP5367869B2 (ja) | 2013-12-11 |
Family
ID=49482737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012103996A Active JP5367869B2 (ja) | 2012-04-27 | 2012-04-27 | 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9740770B2 (ja) |
EP (1) | EP2849094B1 (ja) |
JP (1) | JP5367869B2 (ja) |
ES (1) | ES2650467T3 (ja) |
TW (1) | TWI442247B (ja) |
WO (1) | WO2013161397A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10713426B2 (en) * | 2013-11-14 | 2020-07-14 | Elsevier B.V. | Systems, computer-program products and methods for annotating multiple controlled vocabulary-defined concepts in single noun phrases |
US10969431B1 (en) * | 2019-12-23 | 2021-04-06 | Intel Corporation | Error-tolerant architecture for power-efficient computing |
CN112559929B (zh) * | 2021-02-25 | 2021-05-07 | 中航信移动科技有限公司 | 提取网页页面目标信息的方法、电子设备和介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10171803A (ja) * | 1996-12-09 | 1998-06-26 | Oki Electric Ind Co Ltd | 文類似度計算装置 |
JP3879321B2 (ja) * | 1998-12-17 | 2007-02-14 | 富士ゼロックス株式会社 | 文書要約装置、文書要約方法及び文書要約プログラムを記録した記録媒体 |
JP3353829B2 (ja) * | 1999-08-26 | 2002-12-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 膨大な文書データからの知識抽出方法、その装置及び媒体 |
JP3587120B2 (ja) * | 2000-03-15 | 2004-11-10 | 日本電気株式会社 | アンケート回答分析システム |
JP4815934B2 (ja) * | 2005-08-02 | 2011-11-16 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム |
AU2006278225A1 (en) * | 2005-08-09 | 2007-02-15 | Compography, Inc. | Methods and apparatuses to assemble, extract and deploy content from electronic documents |
-
2012
- 2012-04-27 JP JP2012103996A patent/JP5367869B2/ja active Active
-
2013
- 2013-03-06 US US14/374,692 patent/US9740770B2/en active Active
- 2013-03-06 ES ES13781546.0T patent/ES2650467T3/es active Active
- 2013-03-06 WO PCT/JP2013/056196 patent/WO2013161397A1/ja active Application Filing
- 2013-03-06 EP EP13781546.0A patent/EP2849094B1/en active Active
- 2013-04-01 TW TW102111696A patent/TWI442247B/zh active
Also Published As
Publication number | Publication date |
---|---|
WO2013161397A1 (ja) | 2013-10-31 |
TW201407386A (zh) | 2014-02-16 |
EP2849094A4 (en) | 2015-12-30 |
ES2650467T3 (es) | 2018-01-18 |
US9740770B2 (en) | 2017-08-22 |
TWI442247B (zh) | 2014-06-21 |
US20150006533A1 (en) | 2015-01-01 |
JP2013232111A (ja) | 2013-11-14 |
EP2849094A1 (en) | 2015-03-18 |
EP2849094B1 (en) | 2017-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5939588B2 (ja) | 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム | |
JP5621773B2 (ja) | 分類階層再作成システム、分類階層再作成方法及び分類階層再作成プログラム | |
JP5229226B2 (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
JP2015505082A (ja) | 情報ドメインに対する自然言語処理モデルの生成 | |
JP2008152774A (ja) | 固有表現抽出装置、方法、及びプログラム | |
JP2007157058A (ja) | 分類モデル学習装置、分類モデル学習方法、及び分類モデルを学習するためのプログラム | |
JP5367869B2 (ja) | 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 | |
JP5527548B2 (ja) | 情報分析装置、情報分析方法、及びプログラム | |
JP2020113129A (ja) | 文書評価装置、文書評価方法及びプログラム | |
JP5224532B2 (ja) | 評判情報分類装置及びプログラム | |
JP2006004098A (ja) | 評価情報生成装置、評価情報生成方法、及びプログラム | |
JP2010182267A (ja) | コンテンツ分類装置、方法及びプログラム | |
JP2011041164A (ja) | 映像要約方法および映像要約プログラム | |
JP2010198142A (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
JP2006318509A (ja) | 解データ編集処理装置および処理方法 | |
JP2009064191A (ja) | 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体 | |
JP2012226697A (ja) | Wbs作成システムおよびwbs作成方法 | |
JP5954742B2 (ja) | 文書を検索する装置及び方法 | |
JP5242722B2 (ja) | 代表文抽出装置およびプログラム | |
JP2010244341A (ja) | 属性表現獲得方法及び装置及びプログラム | |
WO2012124213A1 (ja) | 要約作成装置、要約作成方法、およびコンピュータ読み取り可能な記録媒体 | |
JP2020154992A (ja) | 支援システム、プログラム、及び記憶媒体 | |
JP6200392B2 (ja) | 情報提示装置および情報提示プログラム | |
JP5202598B2 (ja) | ワークフロー管理装置、及びワークフロー管理プログラム | |
JP2014063306A (ja) | 検索装置、検索方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130911 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5367869 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |