JP3940707B2 - 文章分析装置、及び文章分析プログラム - Google Patents

文章分析装置、及び文章分析プログラム Download PDF

Info

Publication number
JP3940707B2
JP3940707B2 JP2003177729A JP2003177729A JP3940707B2 JP 3940707 B2 JP3940707 B2 JP 3940707B2 JP 2003177729 A JP2003177729 A JP 2003177729A JP 2003177729 A JP2003177729 A JP 2003177729A JP 3940707 B2 JP3940707 B2 JP 3940707B2
Authority
JP
Japan
Prior art keywords
word
sentence
analysis
analysis table
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003177729A
Other languages
English (en)
Other versions
JP2005018110A (ja
JP2005018110A5 (ja
Inventor
桂子 溝尾
朝彦 溝尾
Original Assignee
桂子 溝尾
朝彦 溝尾
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 桂子 溝尾, 朝彦 溝尾 filed Critical 桂子 溝尾
Priority to JP2003177729A priority Critical patent/JP3940707B2/ja
Priority to US10/868,533 priority patent/US7606418B2/en
Publication of JP2005018110A publication Critical patent/JP2005018110A/ja
Publication of JP2005018110A5 publication Critical patent/JP2005018110A5/ja
Application granted granted Critical
Publication of JP3940707B2 publication Critical patent/JP3940707B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文章に含まれるイメージを分析する文章分析装置、及び文章分析プログラムに関する。
【0002】
【従来の技術】
従来、文章分析技術は、翻訳やテキストの音声変換などに関するものとしては存在していた。
例えば、自動言語翻訳において、原語の文章の文章分析を行い、それらに対応する形態学的、構文的及び意味的特性を与え、分析した文章を中間言語に転移した後に統合するとともに、これを翻訳すべき言語の形態学的、構文的及び意味的特性を全て有する人工国際語で表し、これを目的言語の構造的特性を全て有する中間言語に転移した後、目的言語の具体的な単語で表わした文章に変換するシステムなどが提案されている(例えば、特許文献1参照。)。このシステムにおける文章分析では、文章を異なる言語で表現可能とするために、文章構造に着目した文章の分析が行われている。
また、テキストの音声変換においては、入力文章を単語に分割して、これに読みとアクセントを正しく付加することの可能な装置なども提案されている(例えば、特許文献2参照。)。
【0003】
【特許文献1】
特開平6−325080号公報
【特許文献2】
特開平7−36905号公報
【非特許文献1】
学術論文「英文学の定性定量分析」(帝京女子短期大学『紀要』第17号 1997年)
【非特許文献2】
学術論文「固有名詞を手がかりとするイメージ分析」(帝京大学『文学部紀要』第28号[平成8年度] 1997年)
【非特許文献3】
学術論文「繰り返し現れる語句を手がかりとするイメージ分析」(帝京女子短期大学『紀要』第18号 1998年)
【非特許文献4】
学術論文「歴史的手がかりを用いるイメージ分析」(帝京大学文学部『紀要』第29号[平成9年度] 1998年)
【0004】
【発明が解決しようとする課題】
これらのような従来の文章分析によれば、文章構造を分析したり、あるいは単語レベルにまで分解することは可能である。
しかしながら、文章の内容についての分析を行うことが可能な文章分析技術は、従来の技術には見受けられない。
すなわち、ある文章が、どのような文章であるかをとらえるために、その文章に含まれる各種のイメージを探り出し、その文章がどのような傾向にある文章であるかということ等を解析することのできる技術は存在しなかった。
また、時系列的に文章を解析して、その文章の流れの中で、文章のイメージがどのように変化していくのかを解析することの可能な技術は存在しなかった。
さらに、その文章における登場人物や快楽要素などといった各種要素の変化を追跡可能な技術は存在しなかった。
【0005】
加えて、文章を読むにあたっては、その文章における単語により読み手は様々な印象をもつわけであるが、単語によっては複数の意味をもつため、読み手は文章の文脈において表れるその単語の意味以外の意味についても認識することが可能である。このため、このような文脈において表れるその単語の意味以外の意味が、読み手の文脈を追う意識とは異なる意識に影響を与えることがあると考えられるが、このような単語の文脈における意味以外の意味が、読み手に与える影響等を分析可能な文章分析技術は、未だ存在していない。
なお、非特許文献1の「英文学の定性定量分析」には、一般に科学的論文で用いられている言葉が一義的であるのに対して文学作品で用いられる言語が極めて多義的であることや、小説の定性定量分析方法におけるイメージ分析の手がかりなどが記載されている。
非特許文献2の「固有名詞を手がかりとするイメージ分析」には、文学作品からその文章に含まれる固有名詞とその関連事項等をリストアップすることで、文章のイメージを浮かび上がらせること、及びその具体例が記載されている。
非特許文献3の「繰り返し現れる語句を手がかりとするイメージ分析」には、文学作品からその文章に含まれる繰り返し現れる語句とその関連事項等をリストアップすることで、文章のイメージを浮かび上がらせること、及びその具体例が記載されている。
非特許文献4の「歴史的手がかりを用いるイメージ分析」には、文学作品からその文章に含まれる歴史的手がかりとその関連事項等をリストアップすることで、文章のイメージを浮かび上がらせること、及びその具体例が記載されている。
しかしながら、これら非特許文献1〜4には、文章を所定の分析単位に分解して、その分析単位ごとに、所定のイメージを表わす単語が含まれているかどうかを確認し、これを分析テーブルに抽出する構成については記載されていない。
【0006】
本発明は、上記の事情にかんがみなされたものであり、文章データを有する文章ソースと、所定のイメージを表わす単語データを有する単語リストを用いて、文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに、単語リストに存在する単語を抽出して、分析単位ごとに抽出した各単語を表示する分析テーブルを作成することにより、文章に含まれるイメージを分析することの可能な文章分析装置、及び文章分析プログラムの提供を目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するため、本発明の請求項1記載の文章分析装置は、文章に含まれるイメージを分析する文章分析装置であって、文章データを有する文章ソースを記憶する記憶手段と、所定のイメージを表わす一又は二以上の単語データを有する単語リストと、文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに、単語リストに存在する単語を抽出して、分析単位ごとに当該抽出した各単語を有する分析テーブルを作成する文章分析手段と、を有する構成としてある。
【0008】
文章分析装置をこのような構成にすれば、文章を所定の分析単位に分解して、その分析単位ごとに、所定のイメージを表わす単語が含まれているかどうかを確認し、これを分析テーブルに抽出することができる。
このため、その文章が読み手に与えるイメージを時系列的に把握することが可能となる。
すなわち、本発明により作成される分析テーブルを参照することによって、文章にどのような傾向の単語が使用されているのかということを明確に把握することができ、その文章が読み手に与えるイメージをとらえることが可能となるとともに、所定の分析単位ごとにそのような単語の出現の有無やその数を把握することができるため、文章におけるイメージの流れを時系列的に把握することが可能となる。
【0009】
このイメージ分析としては、あらゆる単語で表わすことのできるイメージについて、そのイメージが文章に含まれているかどうかを検証することが可能である。例えば、単語リストに、「明るさ」を表わす様々な単語データ(例えば、「light」,「lamp」,「glare」等)を保有させ、本発明の分析を行って、分析テーブルを参照することにより、その文章において、どの場所にどの程度その単語が出現しているかを把握することが可能となる。このため、文章にどのようなイメージがどのような流れで表れているのかを容易に把握することが可能となるものである。
【0010】
加えて、本発明のイメージ分析によれば、単一の単語が有するイメージを分析することができるのみならず、その単語が文章において出現するリズムや、同音の繰り返しなどについても把握することが可能である。
なお、本明細書においては、便宜上、本発明の文章分析装置により行うことの可能な種々の分析、例えば、文章が有するイメージの分析、登場人物分析、快楽要素分析、複数の文章間の関係分析について、単にイメージ分析と総称する場合がある。また、抽出される単語は、一の場合(単語)も二以上の場合(単語群)もあり、単語リストにおける一の単語にもとづき抽出された単語又は単語群である場合と、単語リストにおける二以上の単語にもとづき抽出された単語群である場合とがあるが、いずれの場合も簡便のため単に「単語」と称する。
【0011】
本発明の請求項2記載の文章分析装置は、文章分析手段が、文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに番号を付して、番号つきテキストを作成する番号つきテキスト作成手段と、番号つきテキストにおけるそれぞれの分析単位ごとに、単語リストに存在する単語を抽出して、番号ごとに当該抽出した各単語を有する分析テーブルを作成する分析テーブル作成手段と、を有する構成としてある。
【0012】
文章分析装置をこのような構成にすれば、本発明の分析テーブルを作成するにあたって、文章を所定の分析単位ごとに分解するとともに、それぞれの要素に番号を付与して、番号つきテキストを作成し、この番号つきテキストを用いて、番号ごとに抽出した単語データを有する分析テーブルを作成するようにすることができる。
このため、分析テーブルを、番号と抽出した単語データのみにより構成した見やすいものとすることができ、文章におけるイメージの流れの把握しやすい分析テーブルを作成することが可能となる。
【0013】
本発明の請求項3記載の文章分析装置は、分析テーブル作成手段が、番号つきテキスト及び分析テーブルにもとづいて、又は、番号つきテキスト及び単語リストにもとづいて、又は、文章ソース及び分析テーブルにもとづいて、又は、文章ソース及び単語リストにもとづいて、文章ソースの文章における抽出した各単語を、他の単語と識別可能に表示する単語識別テキストを作成する構成としてある。
【0014】
文章分析装置をこのような構成にすれば、文章において、どの単語が所定のイメージを表わすものとして抽出されたかを識別することができる。
この識別方法としては、例えば、文章ソースにおける抽出対象となった単語を反転することにより行うことができる。
このようにして単語識別テキストを作成し、これを参照することによって、分析が適切に行われたかどうかを点検することが可能となることに加え、文章中における抽出対象となった単語を明確に把握することが可能となる。
また、この単語識別テキストを作成するにあたっては、番号つきテキスト及び分析テーブルにもとづいて作成することができるが、特にこれに限定されるものではなく、番号つきテキストと単語リスト、文章ソースと分析テーブル、文章ソースと単語リストのいずれの組み合わせにもとづいても作成することが可能である。
【0015】
本発明の請求項4記載の文章分析装置は、文章分析装置が、番号つきテキスト及び単語リスト、又は分析テーブルにもとづいて、番号ごとに抽出された単語の個数を表示する単語出現頻度グラフを作成する単語出現頻度グラフ作成手段を有する構成としてある。
文章分析装置をこのような構成にすれば、分析テーブル等にもとづいて、番号ごとに抽出対象となった単語の個数を表示するグラフを作成することができる。このため、文章の流れの中で、どのようなイメージがどのように出現しているかを、時系列的により明確に把握することが可能となる。
【0016】
本発明の請求項5記載の文章分析装置は、単語リストが、単語の配点情報を有し、分析テーブル作成手段が、番号つきテキスト及び単語リストにもとづいて、番号ごとに、抽出した各単語の配点の合計点を算出し、この合計点と抽出した各単語を番号ごとに有する一の分析テーブル、又は同一の配点情報を有する単語についてのそれぞれの分析テーブルを作成し、又は、単語リストが、同一の配点を付与すべき単語のみを有し、分析テーブル作成手段が、番号つきテキスト及び単語リストにもとづいて、番号ごとに抽出した各単語を有する分析テーブルを作成するとともに、この分析テーブルと、入力された単語の配点情報にもとづいて、番号ごとに、抽出した各単語の配点の合計点を算出し、この合計点と抽出した各単語を番号ごとに有する分析テーブルを作成する構成としてある。
【0017】
文章分析装置をこのような構成にすれば、文章において、所定のイメージを表わす単語が出現したかどうかを把握することができるのみならず、出現した単語の内容に応じて、そのイメージを与える程度を考慮して、分析テーブルを作成することが可能となる。
例えば、文章における「明るさ」のイメージを分析する場合において、明らかに「明」を表わす単語、例えば、「light」,「lamp」等の配点を1点とし、「薄明かり」を表わす単語、例えば、「twilight」,「dawn」等の配点を0.6点として、これらの点数データをもたせた分析テーブルを作成することができる。
【0018】
さらに、単語リストに「light」を保有させた場合、「light」が、文章の文脈上、「光」など明るさを表わすものとして用いられている場合には、配点を1点とするが、「軽い」や「降り立つ」を意味するものとして用いられている場合には、この単語の出現により読み手に与える「明るさ」のイメージが、4割程度であると仮定し、例えば、0.4点などの配点を与えて、その影響を微調整することも可能である。
【0019】
加えて、本発明の分析テーブルについては、各番号ごとに配点の合計値を表示する一の分析テーブルとする他、配点ごとのもの、例えば、配点1点の単語についての分析テーブル、配点0.6点の単語についての分析テーブルなど複数の分析テーブルを作成するようにすることもできる。
また、本発明における単語リストは、同一の配点を有する単語ごとに作成する構成としてもかまわない。
【0020】
本発明の請求項6記載の文章分析装置は、単語出現頻度グラフ作成手段が、分析テーブルにもとづいて、番号ごとに合計点を表示する単語出現頻度グラフを作成する構成としてある。
文章分析装置をこのような構成にすれば、抽出された単語が分析を行うイメージに与える影響を考慮した配点情報を有する分析テーブルにもとづいて、単語出現頻度グラフを作成することができる。
この場合、番号ごとに抽出された各単語の配点の合計点を、その番号に対応する文における単語の出現回数として用いることができる。
【0021】
すなわち、分析対象とするイメージを明らかに表わす単語については、配点を1とし、明確にそのイメージを表わしてはいないが、ある程度それを表わしていると考えられる単語や、読み手にそのイメージについての影響を与え得ると考えられる単語については、1未満の配点を与え、配点1を出現頻度1ととらえることによって、意識上で明確にイメージを把握可能なもの以外の単語が読み手にもたらす影響についても、単語出現頻度グラフ上にとらえることが可能となる。
なお、分析テーブルが配点ごとに複数ある場合であっても、それぞれの分析テーブルにおける各番号ごとの配点を集計することによって、抽出された全ての単語についての単語出現頻度グラフを作成することが可能である。
【0022】
本発明の請求項7記載の文章分析装置は、文章分析装置が、複数の文章ソースにもとづき作成されたそれぞれの分析テーブルにもとづいて、文章ごとの単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフを作成し、又は、文章ごとに抽出した各単語の配点の合計点を算出して比較し、当該複数の文章のイメージが類似するかどうかを判定する比較判定手段を有する構成としてある。
【0023】
文章分析装置をこのような構成にすれば、ある一の文章についてイメージ分析を行うことができるのみならず、複数の文章間の関係を分析することも可能となる。
すなわち、本発明によれば、それぞれの文章についての単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフを作成することができるため、これを参照することによって、複数の文章間の影響関係等を調べることが可能となる。また、各文章ごとに得られた分析テーブルにもとづいて、それぞれの文章について抽出された単語の配点の合計点を算出し、比較することができるため、それらの文章がどの程度共通したイメージを有するものであるか等を判断することも可能となる。
【0024】
本発明の請求項8記載の文章分析装置は、文章分析装置が、所定の辞書データにもとづき単語リストを作成する単語リスト作成手段を有する構成としてある。文章分析装置をこのような構成にすれば、この文章分析装置における単語リストについて、あらかじめ手作業によって、適切な単語を選択し、用意しておくようにするほか、所定の辞書にもとづいて、自動的に作成するようにすることもできる。
【0025】
このような単語リストの自動作成を行うための元データとしての辞書は、あらかじめ単語ごとに所定の分類情報を保有させたものを用いる必要がある。
そして、その分類情報にもとづき辞書データから所定のイメージを表わす単語データを抽出する。
このようにして、例えば、辞書データを用いて「植物」に分類される単語を抽出して、単語リストを自動的に作成するようにすることが可能である。
また、辞書データとして、単語の変化形についても、基本形と同一の分類情報をあらかじめ登録しておくことにより、複数形や、三人称単数現在形、過去形、過去分詞形等の単語についても自動的に適切に抽出して単語リストを作成することが可能である。
【0026】
本発明の請求項9記載の文章分析装置は、単語リストが、少なくとも、所定のイメージを表わす一又は二以上の単語データ、文章における登場人物を表わす一又は二以上の単語データ、又は快楽要素を表わす一又は二以上の単語データのいずれかの単語データを有する構成としてある。
文章分析装置をこのような構成にすれば、本発明の分析対象として、具体的に、例えば、「明るさ」や「暗さ」、「支配」といった所定のイメージを表わす単語や、登場人物の特徴などを表す単語、快楽要素を表す単語などを単語リストとして保有させ、これらを分析することが可能となる。
【0027】
本発明の請求項10記載の文章分析装置は、所定の分析単位が、一文である構成としてある。
文章分析装置をこのような構成にすれば、分析単位を一文とすることができる。
このため、文章におけるイメージの状態やその流れを、一文ごとに時系列で把握することが可能となる。
【0028】
本発明の請求項11記載の文章分析プログラムは、コンピュータに、文章に含まれるイメージを分析させる文章分析プログラムであって、コンピュータを、文章データを有する文章ソースを記憶する記憶手段、所定のイメージを表わす一又は二以上の単語データを有する単語リスト、及び、文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに、単語リストに存在する単語を抽出して、分析単位ごとに当該抽出した各単語を有する分析テーブルを作成する文章分析手段として機能させる構成としてある。
【0029】
文章分析プログラムをこのような構成にすれば、文章分析装置に、文章を所定の分析単位に分解させて、その分析単位ごとに、所定のイメージを表わす単語が含まれているかどうかを検索させ、これを分析テーブルに抽出させることができる。
このため、本発明により作成される分析テーブルを参照することによって、文章にどのような傾向の単語が使用されているのかということを明確に把握することができ、その文章が読み手に与えるイメージをとらえることが可能となる。
また、所定の分析単位ごとに、所定のイメージを表わす単語の出現の有無やその数を把握することができるため、文章におけるイメージの流れを時系列的にとらえることが可能となる。
【0030】
本発明の請求項12記載の文章分析プログラムは、コンピュータを、文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに番号を付して、番号つきテキストを作成する番号つきテキスト作成手段、及び、番号つきテキストにおけるそれぞれの分析単位ごとに、単語リストに存在する単語を抽出して、番号ごとに当該抽出した各単語を有する分析テーブルを作成する分析テーブル作成手段として機能させる構成としてある。
【0031】
文章分析プログラムをこのような構成にすれば、文章分析装置に分析テーブルを作成させるにあたり、文章を所定の分析単位ごとに分解させ、その分析単位ごとに番号を付与させて番号つきテキストを作成させ、この番号テキストを用いて、番号ごとに抽出した単語データを有する分析テーブルを作成させることができ、分析テーブルを見やすく、文章におけるイメージの流れの把握しやすいものとすることが可能となる。
【0032】
本発明の請求項13記載の文章分析プログラムは、分析テーブル作成手段に、番号つきテキスト及び分析テーブルにもとづいて、又は、番号つきテキスト及び単語リストにもとづいて、又は、文章ソース及び分析テーブルにもとづいて、又は、文章ソース及び単語リストにもとづいて、文章ソースの文章における抽出した各単語を、他の単語と識別可能に表示する単語識別テキストを作成させる構成としてある。
【0033】
文章分析プログラムをこのような構成にすれば、文章分析装置に、文章ソースにおける抽出対象たる単語を反転させることなどにより、明示させることができる。
これによって、分析が適切に行われたかどうかを点検することが可能となることに加え、文章中における抽出対象となった単語を明確に把握することが可能となる。
【0034】
本発明の請求項14記載の文章分析プログラムは、文章分析装置を、番号つきテキスト及び単語リスト、又は分析テーブルにもとづいて、番号ごとに抽出された単語の個数を表示する単語出現頻度グラフを作成する単語出現頻度グラフ作成手段として機能させる構成としてある。
文章分析プログラムをこのような構成にすれば、文章分析装置に、分析テーブル等にもとづいて、番号ごとに抽出対象となった単語の個数を表示するグラフを作成させることができ、文章の流れの中で、どのようなイメージがどのように出現しているかを、時系列的により明確に把握することが可能となる。
【0035】
本発明の請求項15記載の文章分析プログラムは、単語リストが、単語の配点情報を有し、分析テーブル作成手段に、番号つきテキスト及び単語リストにもとづいて、番号ごとに、抽出された各単語の配点の合計点を算出させ、この合計点と抽出された各単語を番号ごとに有する一の分析テーブル、又は同一の配点情報を有する単語についてのそれぞれの分析テーブルを作成させ、又は、単語リストが、同一の配点を付与すべき単語のみを有し、分析テーブル作成手段に、番号つきテキスト及び単語リストにもとづいて、番号ごとに抽出された各単語を有する分析テーブルを作成させるとともに、この分析テーブルと、入力された単語の配点情報にもとづいて、番号ごとに、抽出された各単語の配点の合計点を算出させ、この合計点と抽出された各単語を番号ごとに有する分析テーブルを作成させる構成としてある。
【0036】
文章分析プログラムをこのような構成にすれば、文章分析装置に、抽出されたそれぞれの単語が文章のイメージに与える影響を個別に考慮して、分析テーブルを作成させることができる。
このため、単語ごとの文章に与えるイメージを適切に調整した分析テーブルを作成することが可能となる。
【0037】
本発明の請求項16記載の文章分析プログラムは、単語出現頻度グラフ作成手段に、分析テーブルにもとづいて、番号ごとに合計点を表示する単語出現頻度グラフを作成させる構成としてある。
【0038】
文章分析プログラムをこのような構成にすれば、文章分析装置に、抽出された単語が分析を行うイメージに与える影響を考慮した配点情報を有する分析テーブルにもとづいて、単語出現頻度グラフを作成させることができる。
すなわち、分析対象とするイメージを明らかに表わす単語については、配点を1とし、明確にそのイメージを表わしてはいないが、ある程度それを表わしていると考えられる単語等については、1未満の配点を与え、配点1を出現頻度1ととらえることによって、意識上で明確にイメージを把握可能なもの以外の単語が読み手にもたらす影響についても適切に表示する単語出現頻度グラフを作成させることが可能となる。
【0039】
本発明の請求項17記載の文章分析プログラムは、コンピュータを、複数の文章ソースにもとづき作成されたそれぞれの分析テーブルにもとづいて、文章ごとの単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフを作成し、又は、文章ごとに抽出された各単語の配点の合計点を算出して比較し、当該複数の文章のイメージが類似するかどうかを判定する比較判定手段として機能させる構成としてある。
【0040】
文章分析プログラムをこのような構成にすれば、文章分析装置に、複数の文章のそれぞれについての単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフを作成させることができる。
また、各文章ごとに得られた分析テーブルにもとづいて、それぞれの文章について抽出された単語の配点の合計点を算出させ、比較させることができ、それらの文章がどの程度共通したイメージを有するものであるか等を判定させことも可能となる。
【0041】
本発明の請求項18記載の文章分析プログラムは、コンピュータを、所定の辞書データにもとづき単語リストを作成する単語リスト作成手段として機能させる構成としてある。
文章分析プログラムをこのような構成にすれば、文章分析装置に、自動的に所定のイメージを表わす単語リストを作成させることが可能となる。
【0042】
本発明の請求項19記載の文章分析プログラムは、単語リストが、少なくとも、所定のイメージを表わす一又は二以上の単語データ、文章における登場人物を表わす一又は二以上の単語データ、又は快楽要素を表わす一又は二以上の単語データのいずれかの単語データを有する構成としてある。
文章分析プログラムをこのような構成にすれば、文章分析装置に、本発明の分析対象として、具体的に、例えば、「明るさ」や「暗さ」等の所定のイメージを表わす単語や、登場人物の特徴などを表す単語、快楽要素を表す単語などを単語リストとして保有させ、これらを分析させることが可能となる。
【0043】
本発明の請求項20記載の文章分析プログラムは、所定の分析単位が、一文である構成としてある。
文章分析プログラムをこのような構成にすれば、文章分析装置に、分析単位を一文とさせることができ、文章におけるイメージの状態やその流れを、一文ごとに時系列で把握することが可能となる。
【0044】
【発明の実施の形態】
以下、本発明の実施形態につき、図面を参照して説明する。
[第一実施形態]
まず、本発明の第一実施形態の構成について、図1〜図6を参照して説明する。図1は、本実施形態の文章分析装置の構成を示すブロック図である。図2〜図6は、それぞれ実施形態の文章分析における文章ソース,番号つきテキスト,単語リスト(「明」リスト),分析テーブル,単語反転テキストを示す図である。
【0045】
[文章分析装置10]
本発明の文章分析装置は、本発明の文章分析プログラムをインストールしたパーソナルコンピュータやサーバ、ワークステーション、PDA等の情報処理装置として、あるいはその一部として構成することができる。
また、本発明の文章分析装置は、本発明の文章分析プログラムをインストールすることにより、このプログラムが文章分析装置におけるメモリ上に展開され、文章分析装置のCPUが、このプログラムにしたがって、各処理を実行することにより実現される。文章分析装置における以下の各手段は、このCPUと文章分析プログラムが展開されたメモリ等により構成される。
図1に示すように、本実施形態の文章分析装置10は、文章ソース10−1,文章分解手段10−2,番号つきテキスト作成手段10−3,番号つきテキスト10−4,単語リスト10−5,分析テーブル作成手段10−6,分析テーブル10−7,単語反転テキスト10−8を有している。
【0046】
[文章ソース10−1]
文章ソース10−1は、本実施形態の文章分析装置10によって分析を行う対象としての文章を保有する記憶部であり、文章分析装置10において、ファイルやデータベース等として保有させることができる。本実施形態においては、テキストファイルとして作成した場合を想定している。
図2は、この文章ソース10−1の例を示している。同図においては、文章の一部しか表示していないが、文章ソース10−1には、ある文章の全部を保有させるようにすることができる。また、同図における文章は英文であるが、文章の言語としては英語に限られるものではなく、日本語やその他のあらゆる言語の文章を保有させて、本発明の分析の対象とすることが可能である。もちろん、この場合は、それぞれの言語に応じた単語リストを作成することとなる。
この文章ソース10−1が有する文章としては、小説や、随筆などの文学における文章の他、新聞や雑誌の記事、音声情報を変換したテキストなど、文章であれば特に限定されることはなく、様々なものを用いることができる。
【0047】
[文章分解手段10−2]
文章分解手段10−2は、文章ソース10−1を読み込んで、これを所定の分析単位に分解する。本実施形態においては、文章の最初から、一文ごとに分解するものとしている。そして、分解した文章の各部分を、番号つきテキスト作成手段10−3に受け渡す。
【0048】
[番号つきテキスト作成手段10−3,番号つきテキスト10−4]
番号つきテキスト作成手段10−3は、分解した文章の各部分に番号を付与して、番号つきテキスト10−4を作成する。図3は、この番号つきテキスト10−4の例を示している。同図は、文章の一文ごとに連番を付与した場合の例を示している。
【0049】
[単語リスト10−5]
単語リスト10−5は、本発明の分析対象とするイメージを表わす各種の単語を有する記憶部であり、本発明の分析において、極めて重要な要素の一つである。すなわち、本発明による文章のイメージ分析は、この単語リストにもとづいて行われ、この単語リストとして様々なものを用いることにより、多くの異なるイメージの分析を行うことが可能となる。
この単語リストに登録すべきデータ等の限定は特にないが、例えば、次に示すような単語の種類を用いることによって、文章が有するイメージを効果的に分析することが可能である。
以下に、イメージ分析の対象を、一般的なイメージ分析、登場人物分析、快楽要素分析に分類し、それぞれの分析に効果的な単語の種類を例示する。
【0050】
<イメージ分析>
明るさ,暗さ,カトリック,支配,被支配,アラブ社会,植物,鳥等。
<登場人物分析>
1.道徳劇の人物典型の場合
人間,悪魔,天使,美徳,悪徳,知識,悔悟,親戚,富裕等。
2.風習喜劇の場合
王,貴族,騎士,道化,僧侶,軍人,学者,市長,商人,職人,農民,役者,行商人,乞食,盗賊等。
<快楽要素分析>
1.主要登場人物への感情移入による快楽
A.力の拡大感覚
超自然,神力,魔力,ESP能力,夢の中,権力,財力,武勇,魅力的容姿,異能等。
B.新奇
冒険,探訪,異国情緒等。
C.主要登場人物の感情の高まり
怒り,悲しみ,絶望,期待,喜び,愉快,不安等。
2.読者独自の快楽
A.読者独自の感情の高まり
滑稽さ,スリル,すれ違い,恐怖,懐かしさ,子供らしさ,意外性等。
【0051】
また、例えば、単語の種類が「王」である場合、その単語リストにおける単語データとしては、例えば、以下に挙げるようなものをもたせるようにすることができる。
王,王国,領土,国土,女王,王妃,王女,王子,王太子,太子,皇太子,王弟,王座,玉座,玉璽,王錫,王冠,冠,陛下,余,即位,退位,I,II,III,IV,V,VI,VII,VIII(一世〜八世)等。
図4は、このような単語リスト10−5の例として、「明るさ」のイメージを分析するための単語を保有するリストを示すものである。
【0052】
[分析テーブル作成手段10−6,分析テーブル10−7,単語反転テキスト10−8]
分析テーブル作成手段10−6は、番号つきテキスト10−4と単語リスト10−5を用いて分析テーブル10−7を作成する。
このとき、分析テーブル作成手段10−6は、番号つきテキスト10−4における文章について、番号ごとに単語リスト10−5に存在する単語データが存在するかどうかを検索する。そして、存在する場合は、その番号に対応つけてその単語を分析テーブル10−7に書き出す。図5は、このようにして作成された分析テーブル10−7の例を示している。
【0053】
また、分析テーブル作成手段10−6は、分析テーブル10−7を作成するとともに、単語反転テキスト10−8を作成する。
この単語反転テキスト10−8は、番号つきテキスト10−4と分析テーブル10−7にもとづいて作成することができる。
この場合、分析テーブル作成手段10−6は、分析テーブル10−7から単語が登録されている番号と、その番号に対応づけられた単語を取得して、番号つきテキスト10−4におけるその番号の文を、上記単語をキーとして検索し、ヒットした単語部分の属性を反転表示に設定する。これを全ての番号について行ったのちに、番号つきテキスト10−4から、番号部分を除去して、分析対象として抽出された単語が反転した文章を作成し、これを単語反転テキスト10−8として出力する。
【0054】
また、分析テーブル作成手段10−6による単語反転テキスト10−8の作成は、このような処理に限定されず、その他の種々の方法により作成することができる。例えば、分析テーブル作成手段10−6は、番号つきテキスト10−4と単語リスト10−5にもとづいて、又は、文章ソース10−1と分析テーブル10−7にもとづいて、又は、文章ソース10−1と単語リスト10−5にもとづいて、単語反転テキスト10−8を作成することもできる。
図6は、このようにして作成された単語反転テキスト10−8の例を示している。
【0055】
なお、本実施形態においては、分析対象として抽出された単語を反転することによって、文章中において見やすいものとしたが、これに限定されるものではなく、文章における他の単語から、その抽出された単語が識別可能であればよい。したがって、例えば、単語を反転させるかわりに、色彩を変更することにより、識別可能として、分析テーブル作成手段10−6に、単語識別テキストを作成させる構成とすることも好ましい。
【0056】
次に、本実施形態の文章分析装置における処理手順について、図1を参照して説明する。
[文章分析装置における処理手順]
まず、あらかじめ分析対象としたい文章(図2参照)と、分析したいイメージを表わす単語を有する単語リスト(図4参照)を文章分析装置に記憶させておく。
そして、本発明の文章分析プログラムを実行することにより、文章分解手段10−2は、文章ソース10−1における文章を文単位に分解して、番号つきテキスト作成手段10−3に受け渡す。
次に、番号つきテキスト作成手段10−3は、受け取った文のそれぞれに対して、順に連番を付与し、番号つきテキスト10−4(図3参照)を作成して、分析テーブル作成手段10−6にその機能の実行を指示する。
これに応じて、分析テーブル作成手段10−6は、番号つきテキスト10−4と単語リスト10−5にもとづいて、分析テーブル10−7(図5参照)を作成するとともに、単語反転テキスト10−8(図6参照)を作成して、処理を終了する。
【0057】
以上説明したように、本実施形態の文章分析装置によれば、文章を所定の分析単位に分解して、その分析単位ごとに、所定のイメージを表わす単語が含まれているかを確認し、該当した単語を分析単位ごとに表示する分析テーブルを作成することができる。
このため、その文章が読み手に与えるイメージを、時系列的に把握することが可能となる。
すなわち、本発明により作成される分析テーブルを参照することによって、文章にどのような傾向の単語が使用されているのかということを明確に把握することができ、その文章が読み手に与えるイメージをとらえることが可能となるとともに、所定の分析単位ごとにそのような単語の出現の有無やその数を把握することができるため、文章におけるイメージの流れを時系列的に把握することが可能となる。
さらに、本実施形態の文章分析装置によれば、分析対象である単語を文章中において識別可能とした単語反転テキストを作成することができる。この単語反転テキストによって、分析が適切に行われたかどうかを点検することが可能となるり、また、文章中における抽出対象となった単語を明確に把握することが可能となる。
【0058】
加えて、本実施形態の文章分析装置によれば、各単語により文章にもたらされるイメージのみならず、複数の単語によって文章に与えられるイメージも把握することが可能である。
例えば、分析テーブル等を参照し、同音の単語の出現などをとらえることによって、同音の繰り返しや文章のリズム等を把握することもでき、単語リストの説明において上述した読者独自の快楽をとらえることも可能である。
【0059】
[第二実施形態]
次に、本発明の第二実施形態について、図7及び図8を参照して説明する。図7は、本実施形態の文章分析装置の構成を示すブロック図である。図8は、本実施形態の文章分析における単語出現頻度グラフを示す図である。
本実施形態は、文章分析装置が、分析対象である単語が文章中においてどのような頻度で出現しているかを時系列的に把握可能なグラフを作成する点で第一実施形態と異なる。その他の点については、第一実施形態と同様である。
図7に示すように、本実施形態の文章分析装置は、第一実施形態における構成に加えて、単語出現頻度グラフ作成手段10−9、及び単語出現頻度グラフ10−10を有している。
【0060】
[単語出現頻度グラフ作成手段10−9,単語出現頻度グラフ10−10]
単語出現頻度グラフ作成手段10−9は、分析テーブル10−7の情報にもとづいて、分析対象である単語の出現頻度を表わす単語出現頻度グラフ10−10を作成する。図8は、この単語出現頻度グラフ作成手段10−9により作成された単語出現頻度グラフ10−10の例を示す図である。
同図は、図5に示す分析テーブル10−7にもとづき作成したものであり、番号10に対して、1個の単語が、番号12に対して、2個の単語が抽出されたこと等を示している。
【0061】
この単語出現頻度グラフ10−10を参照することによって、分析対象である文章において、分析すべきイメージを表わす単語が、どのような流れで出現し、あるいは、消滅するかを時系列的により明確に把握することができる。
このため、その文章において、分析目的であるイメージが、どのような流れで、どのような強さで表れているのかなどを適切にとらえることが可能となる。
【0062】
なお、本実施形態においては、単語出現頻度グラフ10−10を、単語出現頻度グラフ作成手段10−9が、分析テーブル10−7にもとづき作成する構成としたが、これに限定されるものではなく、単語出現頻度グラフ作成手段10−9が、番号つきテキスト10−4と単語リスト10−5にもとづき単語出現頻度グラフ10−10を作成する構成とすることも可能である。この場合、単語出現頻度グラフ作成手段10−9は、番号つきテキスト10−4における文ごとに、単語リスト10−5に保有された単語が存在するかどうかを検索し、その文に対応する番号ごとに、ヒットした単語の個数をカウントして、単語出現頻度グラフ10−10を作成することができる。
また、本実施形態は、分析テーブル10−7及び単語反転テキスト10−8の作成とは別個に文章分析プログラムにおける単語出現頻度グラフ作成機能を実行することによって、単語出現頻度グラフ10−10を作成する構成としているが、分析テーブル作成手段10−6が、分析テーブル10−7及び単語反転テキスト10−8の作成を行った後、引き続き単語出現頻度グラフ作成手段10−9に対して、単語出現頻度グラフ10−10の作成処理の実行を行わせる構成とすることも好ましい。
【0063】
本実施形態の単語出現頻度グラフを用いれば、文章における同音の繰り返しや文章のリズム等についても、第一実施形態における場合に比較して、より一層明確に把握することが可能となる。
以下に、文章における同音の繰り返しを把握するイメージ分析の例について詳細に説明する。
<同音の繰り返し>
1.単語リストとして、次のようなリストを用意する。
頭韻分析用の単語リスト:同音で始まる単語からなる単語リストを作成する。
例えば、liar,libel,Lias,lie,life,light,like,line,lion,lycanthrope,lye,lyre など。
脚韻分析用の単語リスト:同音で終わる単語からなる単語リストを作成する。
例えば、大雪,どか雪,先行き,奥行き,搾油機,小雪,粉雪など。
【0064】
2.それぞれの単語リストを用いて、上述のような文章分析処理を実行し、分析テーブル10−7及び単語出現頻度グラフ10−10を作成する。これによって、時系列に沿って頭韻又は脚韻を明確に把握可能な単語出現頻度グラフ10−10が作成される。
【0065】
以上説明したように、本実施形態の文章分析装置によれば、分析テーブル等にもとづいて、番号ごとに抽出対象となった単語の個数を表示する単語出現頻度グラフを作成することができる。
このため、文章の流れの中で、どのようなイメージがどのように出現しているかを、時系列的に明確に把握することが可能となる。
また、本実施形態の単語出現頻度グラフを用いることによって、同音の繰り返しや文章のリズム等を、一層明確に把握することができ、単語リストの説明において上述した読者独自の快楽をより効果的にとらえることが可能となる。
【0066】
[第三実施形態]
次に、本発明の第三実施形態について、図9〜図12を参照して説明する。これらの図は、それぞれ本実施形態の文章分析における単語リスト(配点つき),分析テーブル,単語出現頻度グラフ,配点入力ウィンドウを示す図である。
本実施形態は、イメージ分析において、単語ごとのイメージに与える影響を考慮して、分析テーブル10−7や単語出現頻度グラフ10−10を作成することができる点で第二実施形態と異なる。その他の点については、第二実施形態と同様であり、本実施形態における文章分析装置のブロック図は、図7に示すものと同様のものを用いることができる。
【0067】
本発明の文章分析装置を用いて文章の分析を行うにあたっては、まず、分析に用いる単語を決定し、その単語を有する単語リストを作成する必要があるが、単語によって、分析したいイメージ等に与える影響は、異なる場合があると考えられる。
例えば、文章における「明るさ」のイメージを分析する場合、明らかに「明」を表わす単語もあれば、「薄明かり」を表わす単語もある。また、単語によっては、複数の意味を有するため、必ずしも「明るさ」を意味して用いられているとは限らないが、「明るさ」を意味して用いられていない場合であっても、読み手に対して「明るさ」のイメージを与えることもあると考えられる。
このような現象は、記号論や認知心理学においては、意味ネットワークと呼ばれている。
【0068】
すなわち、それぞれの単語は、表の意味以外にいくつかの意味を同時に担っており、読者は、意識上では表の意味(この場合は、分析対象とするイメージと異なる意味)だけを考えているとしても、同時にいくつかの裏の意味(この場合は、分析対象とするイメージと同じ意味)をも意識下で認識している可能性がある。このような裏の意味は、意識上にのぼることなく消えていくことも多いと考えられるが、分析対象とするイメージを担う他の単語が数多く出現していると、活性化して意識上にのぼってくると考えられる。
本実施形態では、単語ごとに異なる、このような分析するイメージに与える影響の度合いを、単語ごとに配点をもたせることによって考慮し、分析を行うことを可能としている。
【0069】
本実施形態の文章分析装置におけるイメージ分析の具体的処理方法としては、以下のような方法を挙げることができる。
<1.単語への配点を単語リストにもたせる方法>
まず、図9に示すような単語リストを用いて、それぞれの単語がイメージに与える影響を個別に考慮して、イメージ分析を行うことが可能である。
図9の単語リストは、「明るさ」のイメージを分析するための単語リストであり、明らかに「明」を表わす単語について、1点の配点が与えられている。また、「薄明かり」を表わす単語については、0.6点が与えられている。
【0070】
このような単語リストを用いて、本発明の文章分析プログラムを実行すると、文章分析装置における分析テーブル作成手段10−6は、分析テーブル10−7の作成にあたり、抽出された単語ごとの配点を、番号ごとに合計して、図10に示すような分析テーブル10−7を作成する。
同図においては、番号ごとに、抽出された単語に対する配点の合計点を表示するとともに、配点を有した単語も合わせて表示しているが、いずれか一方のみを表示するようにしてもよい。
【0071】
ここで、同図において、「0.4」の配点が付与されたものがあるが、これは、「明るさ」を表わす意味を有する単語ではあるものの、その文においては「明るさ」を表わす意味以外の意味で用いられていることを示しており、単語反転テキスト10−8を参照し、手入力により分析テーブル10−7に対して直接修正を加えたものである。この場合は、「light」が、「軽い,降り立つ」の意味で用いられていることを想定しており、これによって読み手に与えられる「明るさ」のイメージは、0.4点程度であると推定して、配点を付与している。もちろん、これらの配点は、適宜調整することが可能である。
【0072】
また、分析対象とするイメージと異なる意味で使用されている単語に対する配点など、複数の意味を有する単語に対する配点については、分析テーブル作成手段10−6により、単語反転テキスト10−8にもとづきその単語の前後の単語を参照することによって、その意味や品詞を特定し、自動的に付与することがより望ましい。
さらに、本実施形態の文章分析装置は、単語出現頻度グラフ作成手段10−9によって、上記分析テーブル10−7にもとづいて、図11に示すような単語出現頻度グラフ10−10を作成することができる。この単語出現頻度グラフ10−10においては、番号ごとの合計点が1点である場合を、出現頻度1としている。
【0073】
また、第二実施形態における場合と同様に、単語出現頻度グラフ作成手段10−9に、番号つきテキスト10−4と単語リスト10−5にもとづいて、単語出現頻度グラフ10−10を作成させるようにすることもできる。
この場合、単語出現頻度グラフ作成手段10−9は、単語リスト10−5が有する配点情報にもとづいて、抽出された単語の配点を番号ごとに合計し、合計点1を出現頻度1として、単語出現頻度グラフ10−10を作成するようにすることができる。これは、以下に示す2.及び3.の方法においても同様である。
【0074】
<2.異なる配点を有する単語ごとに、配点情報を有する単語リストを作成する方法>
次に、異なる配点を有する単語ごとに、単語リストを作成し、これを用いて各単語がイメージに与える影響を個別に考慮したイメージ分析を行う場合について説明する。
単語リストとして、図9に示す単語リストを分割して、1点の配点を有するものと0.6点の配点を有するものを文章分析装置に保有させ、分析テーブル作成手段10−6に、これらの単語リスト10−5を用いて分析テーブル10−7を作成させる。
この場合、配点は、図9に示すように各単語ごとにもたせる必要はなく、例えば、ファイル名にもたせるようにして、分析テーブル作成手段10−6に各単語リスト10−5の配点情報を与えるようにすることもできる。
【0075】
分析テーブル作成手段10−6は、番号つきテキスト10−4と上記各単語リスト10−5にもとづいて、配点ごとに個別に分析テーブル10−7を作成する。すなわち、この場合は、配点1点の単語についての分析テーブル10−7と、配点0.6点の分析テーブル10−7を作成するようにすることができる。
また、分析テーブル作成手段10−6に、番号つきテキスト10−4と各単語リスト10−5にもとづいて、図10に示すような配点1点の単語と配点0.6点の単語を併せもつ分析テーブル10−7を作成させることも可能である。
なお、配点0.4点のものについては、上述の1.の場合と同様である。
【0076】
単語出現頻度グラフ作成手段10−9は、これらの分析テーブル10−7にもとづいて、単語出現頻度グラフ10−10を作成する。分析テーブル10−7が、配点ごとに個別に作成された場合であっても、単語出現頻度グラフ作成手段10−9は、これら全ての分析テーブル10−7の情報にもとづいて、図11に示すような単語出現頻度グラフを作成することができる。
【0077】
<3.異なる配点を有する単語ごとに単語リストを作成し、配点入力ウィンドウから配点を手入力可能とする方法>
次に、異なる配点を有する単語ごとに、単語リストを作成するとともに、配点を手入力可能として、各単語がイメージに与える影響を個別に考慮したイメージ分析を行う場合について説明する。
この場合、単語リスト自体には、配点を保有させる必要がなく、異なる配点を有する単語ごとに図4に示すような単語リストを作成して、本実施形態の文章分析プログラムを実行する。
この場合、第二実施形態における場合と同様に、図5に示すような分析テーブル10−7が作成される。
【0078】
次に、この作成された分析テーブル10−7に対して、配点情報を付与することにより、配点を有する分析テーブル10−7を作成する。
ここで、分析テーブル10−7に対し、配点情報を付与する方法としては、例えば、図12に示すように、配点情報を有しない、最初に作成された分析テーブル10−7を開くとともに、配点情報を付与するウィンドウを表示して、配点を入力後、実行ボタンを押下することにより、図10のような分析テーブル10−7であって、特定の配点の単語(例えば、配点1点の単語)についてのみ表示するものを生成する構成とすることができる。このような配点入力ウィンドウの表示は、文章分析プログラムにより、例えば、分析テーブル作成手段10−6などの機能としてもたせるようにすることが可能である。
【0079】
そして、単語出現頻度グラフ作成手段10−9は、上述の1.の場合と同様にして配点0.4点の単語についての情報を付加した配点1点の分析テーブル10−7及び配点0.6点の分析テーブル10−7を用いて、図11に示すような単語出現頻度グラフ10−10を作成する。
本実施形態の文章分析装置における分析テーブルの作成を、このような処理方法とすれば、あらかじめ配点情報を有した単語リストを作成する必要がないため、単語リストの作成に余分な負担を掛けることなく、単語ごとのイメージに与える影響を考慮した分析テーブル等を作成することが可能となる。
【0080】
本実施形態の配点を考慮した単語出現頻度グラフを用いれば、文章のリズム等について、第二実施形態における場合に比較して、より一層明確に把握することが可能となる。
以下に、文章のリズムを把握するイメージ分析の例について詳細に説明する。<文章のリズム>
1.単語リストとして、次のようなリストを用意する。
単語リストA:一般的な辞書から、強勢(アクセント)の弱い冠詞,前置詞,助動詞,接続詞,代名詞,(日本語の場合は、助詞も含む。)を省き、強勢の強い名詞,形容詞,動詞,副詞,(日本語の場合は、形容動詞も含む。)等のみからなるもの。
単語リストB:やや強勢の強い助動詞,接続詞,代名詞のみからなるもの。
単語リストC:特に強勢の強い間投詞(日本語では感動詞。例えば、ああ,おお,なんと等)のみからなるもの。
【0081】
2.それぞれの単語リストにもとづき分析テーブル10−7を作成する。
このとき、単語リストAにもとづき作成された分析テーブルAについては、1単語1点の配点を与えて数値化する。同様に、単語リストB,Cにもとづき作成された分析テーブルB,Cについては、それぞれ1単語0.5点,1単語1.5点の配点を与えて数値化する。
3.分析テーブルA,B,Cにもとづいて、各文ごとの強勢の合計点数を算出し、時系列に沿って強勢を把握することの可能な単語出現頻度グラフ10−10を作成する。
【0082】
以上説明したように、本実施形態の文章分析装置によれば、文章において、所定のイメージを表わす単語がどのように出現するかを時系列的に把握することができるのみならず、その出現した単語が、所定のイメージをもたらす影響力を考慮して、分析テーブル及び単語出現頻度グラフを作成することが可能となる。
また、このような単語出現頻度グラフを用いることによって、文章のリズムなどを一層明確に把握することもでき、単語リストの説明において上述した読者独自の快楽をさらに効果的にとらえることが可能となる。
【0083】
[第四実施形態]
次に、本発明の第四実施形態について、図13を参照して説明する。同図は、本実施形態の文章分析装置の構成を示すブロック図である。
本実施形態は、文章分析装置が、複数の文章の関係分析を行うことができる点で第三実施形態と異なる。その他の点については、第三実施形態と同様である。すなわち、本実施形態の文章分析装置は、複数の文章にもとづき作成されたそれぞれの単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフ10−10を作成することができる。
また、各文章から作成された分析テーブル10−7における点数を比較することによって、それらの文章が類似することやその影響についての判定等を行うことができる。
【0084】
具体的には、例えば、以下のような関係分析を行うことが可能である。
1.複数の文章間の影響関係を調べる。
例:ルイス・キャロルの「不思議の国のアリス」とトールキンの「指輪物語」
2.ある文章と特定ジャンルの典型的文章とを比較する。
例:ジュール・ベルヌの「十五少年漂流記」とゴールディングの「蝿の王」
3.同一作家の複数の文章を比較する。
例:ヘミングウェイの「老人と海」と「キリマンジャロの雪」
4.同時代の複数の作家の文章を比較する。
例:ディケンズの「デービッド・コパーフィールド」とシャーロット・ブロンテの「ジェイン・エア」
【0085】
本実施形態の文章分析装置は、図13に示すように、第三実施形態における構成に加えて、比較判定手段10−11を有している。
【0086】
[比較判定手段10−11]
比較判定手段10−11は、分析テーブル作成手段10−6により作成され、文章分析装置に記憶された複数の分析テーブル10−7にもとづいて、それぞれの分析テーブルの情報から得られる単語出現頻度グラフを重ね合わせた単語出現頻度グラフ10−10を作成する。
【0087】
このような単語出現頻度グラフ10−10を作成することによって、上述のような複数の文章間の影響関係を把握することが可能となる。
例えば、文章間に共通の要素がある場合には、グラフを少しずらすと部分的にぴったり重なってくることなどが考えられ、これによりその関係をとらえることが可能となる。
また、同一の単語リストを用いて複数の文章のイメージ分析を行うことにより、それぞれの文章において、ある一定以上の量の単語が抽出されている場合に、これらの文章間に共通の要素があるとの証明を行うことも可能になると考えられる。
さらに、様々な文章について、多くのイメージ分析結果を蓄積すれば、作者不明の文章についてイメージ分析を行い、得られた分析テーブルと、これを蓄積された分析結果における分析テーブルとにもとづいて関係分析を行うことにより、その文章の作者を明らかにすることも可能となるものと考えられる。
【0088】
また、比較判定手段10−11に、複数の文章にもとづき作成された分析テーブル10−7における各点数や、その合計点を比較させて、その差が所定の範囲である場合に、それらの文章が類似する、あるいは共通の要素をもつものであると判定させ、その差が所定の範囲内にない場合には、それらの文章は、非類似のもの、あるいは共通の要素が見られないもとの判定させて、その結果を単語出現頻度グラフ10−10上等に出力させるようにすることもできる。
もちろん、それらの文章が同一の文章である場合には、それぞれの単語出現頻度グラフは完全に重なり合い、上記点数の差は0となることから、文章が同一か否かを判定することも可能となる。
この比較判定手段10−11の機能は、文章分析プログラムにより、分析テーブル作成機能等とは別個に、独自に実行可能なものとすることが好ましい。
【0089】
以上説明したように、本実施形態の文章分析装置によれば、ある一の文章についてイメージ分析を行うことができるのみならず、複数の文章間で、それらが有するイメージが類似するものであるか否か等を判断することも可能となる。
【0090】
[第五実施形態]
次に、本発明の第五実施形態について、図14を参照して説明する。同図は、本実施形態の文章分析装置の構成を示すブロック図である。
本実施形態は、文章分析装置が、単語リストの自動作成を行う点で第四実施形態と異なる。その他の点については、第四実施形態と同様である。
図14に示すように、本実施形態の文章分析装置は、第四実施形態における構成に加えて、単語リスト作成手段10−12を有している。
【0091】
[単語リスト作成手段10−12]
この単語リスト作成手段10−12は、所定の入力情報にもとづいて辞書データから単語リスト10−5を作成する。
この辞書データとしては、各単語に対して、様々な分類情報を保有している既存のものを用いることができる。例えば、ある単語が「植物」に分類されるものを意味する場合、その単語は、属性情報として、「植物」を示す情報を有している。また、各種変化形、例えば、複数形、三人称単数現在形、ing形、過去形、過去分詞形等についても、基本形と同一の分類属性情報が付与されているものを用いることが好ましい。また、このような基準を満足する専用の辞書を作成して、文章分析装置に保有させておくことも好ましい。
【0092】
さらに、単語リスト作成手段10−12は、上記所定の入力情報を入力し、単語リストの作成要求を受けるための単語リスト作成画面を表示する。
そして、この単語リスト作成画面から入力された単語を抽出するためのキーワードにもとづき辞書データを検索して、ヒットした単語を単語リスト10−5に出力する。このとき、既に作成された単語リスト10−5に、抽出した単語を追加可能とすることも好ましい。
この単語リスト作成手段10−12の機能も、文章分析プログラムにより、分析テーブル作成機能等とは別個に、独自に実行可能なものとすることが好ましい。
【0093】
以上説明したように、本実施形態の文章分析装置によれば、分析したいイメージを示すキーワードを入力することにより、そのキーワードにもとづき自動的に単語リストを作成することができるため、大変手間のかかる単語リストの作成作業を比較的簡略化することができ、イメージ分析をより容易に行うことが可能となる。
【0094】
上記の実施形態における番号つきテキストの作成や、分析テーブルの作成等は、文章分析プログラムにより実行される。
この文章分析プログラムにもとづいて、文章分析装置のCPUは、コンピュータの各構成要素に指令を送り、所定の処理、例えば、番号つきテキストの作成処理や、分析テーブルの作成処理等を行わせる。
これによって、これらの処理は、文章分析プログラムとコンピュータとが協働した文章分析装置により実現される。
【0095】
なお、文章分析プログラムは、コンピュータのROMやハードディスクに記憶させる他、コンピュータ読み取り可能な記録媒体、たとえば、外部記憶装置及び可搬記録媒体等に格納することができる。
外部記憶装置とは、磁気ディスク等の記録媒体を内蔵し、例えば文章分析装置に外部接続される記憶増設装置をいう。一方、可搬記録媒体とは、記録媒体駆動装置(ドライブ装置)に装着でき、かつ、持ち運び可能な記録媒体であって、たとえば、CD−ROM、フレキシブルディスク、メモリカード、光磁気ディスク等をいう。
【0096】
そして、記録媒体に記録されたプログラムは、コンピュータのRAMにロードされて、CPUにより実行される。この実行により、上述した本実施形態の文章分析装置の機能が実現される。
さらに、コンピュータで文章分析プログラムをロードする場合、他のコンピュータで保有された文章分析プログラムを、通信回線を利用して自己の有するRAMや外部記憶装置にダウンロードすることもできる。
このダウンロードされた文章分析プログラムも、CPUにより実行され、本実施形態の番号つきテキストの作成処理や、分析テーブルの作成処理等を実現する。
【0097】
なお、本発明は以上の実施形態に限定されるものではなく、本発明の範囲内において、種々の変更実施が可能であることは言うまでもない。
例えば、本実施形態では、分析対象の文章として英文を例に挙げて説明したが、同様の方法を用いて、日本語やその他のあらゆる言語に適用することが可能である。
また、文章分析装置における各構成を、本発明の効果を得ることができる範囲内で変更し、例えば、番号つきテキストの作成を省略して、文章分解後に、各文ごとに抽出した単語を表示する分析テーブルを作成する構成とするなど適宜変更することが可能である。
さらに、本発明の文章分析装置は、人工知能における機能の一部を実現するものとして、その構成に利用することの可能なものである。
【0098】
【発明の効果】
以上のように、本発明によれば、文章を所定の分析単位に分解して、その分析単位ごとに、所定のイメージを表わす単語が含まれているかどうかを確認して、これを分析単位ごとに表示する分析テーブルと、その単語の出現頻度グラフを作成することができ、その文章が読み手に与えるイメージを時系列的に把握することが可能となる。
また、本発明によれば、文章に所定のイメージを表わす単語がどのように出現するかを時系列的に把握することができるのみならず、その出現した単語が、所定のイメージをもたらす影響力を考慮して、分析テーブル及び単語出現頻度グラフを作成することなども可能となる。
【0099】
さらに、複数の文章間で、それらが有するイメージが類似するものであるか、あるいは共通する要素があるかということなどについて、判断を行うことも可能となる。
加えて、分析したいイメージを示すキーワードにもとづいて、自動的に単語リストを作成することができるため、大変手間のかかる単語リストの作成作業を簡略化することができ、イメージ分析をより容易に行うことも可能となる。
【0100】
また、文章分析プログラムにもとづいて、文章分析装置のCPUが、コンピュータの各構成要素へ所定の指令を送ることにより、番号つきテキストの作成機能や、分析テーブルの作成機能等を実現させることができる。
これによって、これらの機能等は、文章分析プログラムとコンピュータにおけるCPU等とが協働した文章分析装置により実現可能である。
【図面の簡単な説明】
【図1】本発明の第一実施形態の文章分析装置の構成を示すブロック図である。
【図2】本発明の第一実施形態の文章分析における文章ソースを示す図である。
【図3】本発明の第一実施形態の文章分析における番号つきテキストを示す図である。
【図4】本発明の第一実施形態の文章分析における単語リスト(「明」リスト)を示す図である。
【図5】本発明の第一実施形態の文章分析における分析テーブルを示す図である。
【図6】本発明の第一実施形態の文章分析における単語反転テキストを示す図である。
【図7】本発明の第二実施形態の文章分析装置の構成を示すブロック図である。
【図8】本発明の第二実施形態の文章分析における単語出現頻度グラフを示す図である。
【図9】本発明の第三実施形態の文章分析における単語リスト(配点つき)を示す図である。
【図10】本発明の第三実施形態の文章分析における分析テーブルを示す図である。
【図11】本発明の第三実施形態の文章分析における単語出現頻度グラフを示す図である。
【図12】本発明の第三実施形態の文章分析における配点入力ウィンドウを示す図である。
【図13】本発明の第四実施形態の文章分析装置の構成を示すブロック図である。
【図14】本発明の第五実施形態の文章分析装置の構成を示すブロック図である。
【符号の説明】
10 文章分析装置
10−1 文章ソース
10−2 文章分解手段
10−3 番号つきテキスト作成手段
10―4 番号つきテキスト
10−5 単語リスト
10−6 分析テーブル作成手段
10−7 分析テーブル
10−8 単語反転テキスト
10−9 単語出現頻度グラフ作成手段
10−10 単語出現頻度グラフ
10−11 比較判定手段
10−12 単語リスト作成手段

Claims (20)

  1. 文章に含まれるイメージを分析する文章分析装置であって、
    文章データを有する文章ソースを記憶する記憶手段と、
    所定のイメージを表わす一又は二以上の単語データを有する単語リストと、
    前記文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに、前記単語リストに存在する単語を抽出して、前記分析単位ごとに当該抽出した各単語を有する分析テーブルを作成する文章分析手段と、を有する
    ことを特徴とする文章分析装置。
  2. 前記文章分析手段が、
    前記文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに番号を付して、番号つきテキストを作成する番号つきテキスト作成手段と、
    前記番号つきテキストにおけるそれぞれの分析単位ごとに、前記単語リストに存在する単語を抽出して、前記番号ごとに当該抽出した各単語を有する分析テーブルを作成する分析テーブル作成手段と、を有する
    ことを特徴とする請求項1記載の文章分析装置。
  3. 前記分析テーブル作成手段が、
    前記番号つきテキスト及び前記分析テーブルにもとづいて、又は、
    前記番号つきテキスト及び前記単語リストにもとづいて、又は、
    前記文章ソース及び前記分析テーブルにもとづいて、又は、
    前記文章ソース及び前記単語リストにもとづいて、
    前記文章ソースの文章における前記抽出した各単語を、他の単語と識別可能に表示する単語識別テキストを作成する
    ことを特徴とする請求項2記載の文章分析装置。
  4. 前記文章分析装置が、
    前記番号つきテキスト及び前記単語リスト、又は前記分析テーブルにもとづいて、前記番号ごとに前記抽出された単語の個数を表示する単語出現頻度グラフを作成する単語出現頻度グラフ作成手段を有する
    ことを特徴とする請求項2又は3記載の文章分析装置。
  5. 前記単語リストが、単語の配点情報を有し、前記分析テーブル作成手段が、前記番号つきテキスト及び前記単語リストにもとづいて、前記番号ごとに、前記抽出した各単語の配点の合計点を算出し、この合計点と前記抽出した各単語を前記番号ごとに有する一の分析テーブル、又は同一の配点情報を有する単語についてのそれぞれの分析テーブルを作成し、又は、
    前記単語リストが、同一の配点を付与すべき単語のみを有し、前記分析テーブル作成手段が、前記番号つきテキスト及び前記単語リストにもとづいて、前記番号ごとに前記抽出した各単語を有する分析テーブルを作成するとともに、この分析テーブルと、入力された単語の配点情報にもとづいて、前記番号ごとに、前記抽出した各単語の配点の合計点を算出し、この合計点と前記抽出した各単語を前記番号ごとに有する分析テーブルを作成する
    ことを特徴とする請求項2〜4のいずれかに記載の文章分析装置。
  6. 前記単語出現頻度グラフ作成手段が、前記分析テーブルにもとづいて、前記番号ごとに前記合計点を表示する単語出現頻度グラフを作成する
    ことを特徴とする請求項5記載の文章分析装置。
  7. 前記文章分析装置が、
    複数の前記文章ソースにもとづき作成されたそれぞれの分析テーブルにもとづいて、文章ごとの前記単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフを作成し、又は、文章ごとに前記抽出した各単語の配点の合計点を算出して比較し、当該複数の文章のイメージが類似するかどうかを判定する比較判定手段を有する
    ことを特徴とする請求項4〜6のいずれかに記載の文章分析装置。
  8. 前記文章分析装置が、
    所定の辞書データにもとづき前記単語リストを作成する単語リスト作成手段を有する
    ことを特徴とする請求項1〜7のいずれかに記載の文章分析装置。
  9. 前記単語リストが、少なくとも、所定のイメージを表わす一又は二以上の単語データ、前記文章における登場人物を表わす一又は二以上の単語データ、又は快楽要素を表わす一又は二以上の単語データのいずれかの単語データを有する
    ことを特徴とする請求項1〜8のいずれかに記載の文章分析装置。
  10. 前記所定の分析単位が、一文であることを特徴とする請求項1〜9のいずれかに記載の文章分析装置。
  11. コンピュータに、文章に含まれるイメージを分析させる文章分析プログラムであって、
    コンピュータを、
    文章データを有する文章ソースを記憶する記憶手段、
    所定のイメージを表わす一又は二以上の単語データを有する単語リスト、及び、
    前記文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに、前記単語リストに存在する単語を抽出して、前記分析単位ごとに当該抽出した各単語を有する分析テーブルを作成する文章分析手段
    として機能させるための文章分析プログラム。
  12. 前記コンピュータを、
    前記文章ソースにおける文章を、所定の分析単位に分解し、この分析単位ごとに番号を付して、番号つきテキストを作成する番号つきテキスト作成手段、及び、
    前記番号つきテキストにおけるそれぞれの分析単位ごとに、前記単語リストに存在する単語を抽出して、前記番号ごとに当該抽出した各単語を有する分析テーブルを作成する分析テーブル作成手段
    として機能させるための請求項11記載の文章分析プログラム。
  13. 前記分析テーブル作成手段に、
    前記番号つきテキスト及び前記分析テーブルにもとづいて、又は、
    前記番号つきテキスト及び前記単語リストにもとづいて、又は、
    前記文章ソース及び前記分析テーブルにもとづいて、又は、
    前記文章ソース及び前記単語リストにもとづいて、
    前記文章ソースの文章における前記抽出した各単語を、他の単語と識別可能に表示する単語識別テキストを作成させる
    ことを実行させるための請求項12記載の文章分析プログラム。
  14. 前記文章分析装置を、
    前記番号つきテキスト及び前記単語リスト、又は前記分析テーブルにもとづいて、前記番号ごとに前記抽出された単語の個数を表示する単語出現頻度グラフを作成する単語出現頻度グラフ作成手段
    として機能させるための請求項12又は13記載の文章分析プログラム。
  15. 前記単語リストが、単語の配点情報を有し、
    前記分析テーブル作成手段に、前記番号つきテキスト及び前記単語リストにもとづいて、前記番号ごとに、前記抽出された各単語の配点の合計点を算出させ、この合計点と前記抽出された各単語を前記番号ごとに有する一の分析テーブル、又は同一の配点情報を有する単語についてのそれぞれの分析テーブルを作成させ、又は、
    前記単語リストが、同一の配点を付与すべき単語のみを有し、
    前記分析テーブル作成手段に、前記番号つきテキスト及び前記単語リストにもとづいて、前記番号ごとに前記抽出された各単語を有する分析テーブルを作成させるとともに、この分析テーブルと、入力された単語の配点情報にもとづいて、前記番号ごとに、前記抽出された各単語の配点の合計点を算出させ、この合計点と前記抽出された各単語を前記番号ごとに有する分析テーブルを作成させる
    ことを実行させるための請求項12〜14のいずれかに記載の文章分析プログラム。
  16. 前記単語出現頻度グラフ作成手段に、前記分析テーブルにもとづいて、前記番号ごとに前記合計点を表示する単語出現頻度グラフを作成させる
    ことを実行させるための請求項15記載の文章分析プログラム。
  17. 前記コンピュータを、
    複数の前記文章ソースにもとづき作成されたそれぞれの分析テーブルにもとづいて、文章ごとの前記単語出現頻度グラフを重ね合わせて表示する単語出現頻度グラフを作成し、又は、文章ごとに前記抽出された各単語の配点の合計点を算出して比較し、当該複数の文章のイメージが類似するかどうかを判定する比較判定手段
    として機能させるための請求項14〜16のいずれかに記載の文章分析プログラム。
  18. 前記コンピュータを、
    所定の辞書データにもとづき前記単語リストを作成する単語リスト作成手段として機能させるための請求項11〜17のいずれかに記載の文章分析プログラム。
  19. 前記単語リストが、少なくとも、所定のイメージを表わす一又は二以上の単語データ、前記文章における登場人物を表わす一又は二以上の単語データ、又は快楽要素を表わす一又は二以上の単語データのいずれかの単語データを有する
    ことを特徴とする請求項11〜18のいずれかに記載の文章分析プログラム。
  20. 前記所定の分析単位が、一文であることを特徴とする請求項項11〜19のいずれかに記載の文章分析プログラム。
JP2003177729A 2003-06-23 2003-06-23 文章分析装置、及び文章分析プログラム Expired - Fee Related JP3940707B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003177729A JP3940707B2 (ja) 2003-06-23 2003-06-23 文章分析装置、及び文章分析プログラム
US10/868,533 US7606418B2 (en) 2003-06-23 2004-06-15 Writing analytic apparatus and writing analytic program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003177729A JP3940707B2 (ja) 2003-06-23 2003-06-23 文章分析装置、及び文章分析プログラム

Publications (3)

Publication Number Publication Date
JP2005018110A JP2005018110A (ja) 2005-01-20
JP2005018110A5 JP2005018110A5 (ja) 2007-02-01
JP3940707B2 true JP3940707B2 (ja) 2007-07-04

Family

ID=33516292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003177729A Expired - Fee Related JP3940707B2 (ja) 2003-06-23 2003-06-23 文章分析装置、及び文章分析プログラム

Country Status (2)

Country Link
US (1) US7606418B2 (ja)
JP (1) JP3940707B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150078148A (ko) * 2013-12-30 2015-07-08 주식회사 케이티 문장과 매칭되는 이미지를 제공하는 장치 및 방법

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140125676A1 (en) * 2012-10-22 2014-05-08 University Of Massachusetts Feature Type Spectrum Technique
US9501469B2 (en) 2012-11-21 2016-11-22 University Of Massachusetts Analogy finder
US10089765B2 (en) * 2014-10-20 2018-10-02 Bernardo Jose Martinez-Avalos Methods and computer programs to create images and information based in texts
JP6612291B2 (ja) * 2017-06-26 2019-11-27 日本電信電話株式会社 類似文書検索装置、類似文書検索方法及びプログラム
JP6646014B2 (ja) * 2017-06-26 2020-02-14 日本電信電話株式会社 類似文書検索装置、類似性計算装置、これらの方法及びプログラム
JP2022026278A (ja) * 2020-07-30 2022-02-10 クロスリバ株式会社 文章解析装置、方法、及び、プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109495A (en) * 1989-02-03 1992-04-28 Digital Equipment Corp. Method and apparatus using a source operand list and a source operand pointer queue between the execution unit and the instruction decoding and operand processing units of a pipelined data processor
ES2101613B1 (es) 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
JPH0736905A (ja) 1993-07-16 1995-02-07 Oki Electric Ind Co Ltd テキスト音声変換装置
US5983237A (en) * 1996-03-29 1999-11-09 Virage, Inc. Visual dictionary
US6249765B1 (en) * 1998-12-22 2001-06-19 Xerox Corporation System and method for extracting data from audio messages
JP3444486B2 (ja) * 2000-01-26 2003-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識手段を使用する自動音声応答システムおよび方法
US7142689B2 (en) * 2000-01-31 2006-11-28 Canon Kabushiki Kaisha Image processing apparatus for determining specific images
US6921265B2 (en) * 2001-08-06 2005-07-26 Wanda L. Sims-Barnes Literacy training method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150078148A (ko) * 2013-12-30 2015-07-08 주식회사 케이티 문장과 매칭되는 이미지를 제공하는 장치 및 방법
KR102200230B1 (ko) * 2013-12-30 2021-01-08 주식회사 케이티 문장과 매칭되는 이미지를 제공하는 장치 및 방법

Also Published As

Publication number Publication date
US7606418B2 (en) 2009-10-20
US20040259061A1 (en) 2004-12-23
JP2005018110A (ja) 2005-01-20

Similar Documents

Publication Publication Date Title
Egbert et al. Doing linguistics with a corpus: Methodological considerations for the everyday user
EP1217533A2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
CN102439595A (zh) 基于文本文档和用户问题的语义标记的问答系统和方法
De Joode Metaphorical landscapes and the theology of the book of Job: An analysis of Job’s spatial metaphors
JP3940707B2 (ja) 文章分析装置、及び文章分析プログラム
Hornstein et al. Syntactic structures after 60 years: The impact of the Chomskyan revolution in linguistics
Legallois et al. The notion of motif where disciplines intersect: folkloristics, narrativity, bioinformatics, automatic text processing and linguistics
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
Langlet et al. Modelling user’s attitudinal reactions to the agent utterances: focus on the verbal content
Begum et al. Analysis of legal case document automated summarizer
KR100479205B1 (ko) 텍스트 문서집합에서 반복학습을 통한 개체명 인식 및의미범주 분류 장치 및 그 방법
Ploch Living on the edge: 28 papers in honour of Jonathan Kaye
Hosseini et al. Resolving indirect referring expressions for entity selection
JP4588657B2 (ja) 翻訳装置
KR950013128B1 (ko) 기계번역장치 및 방법
CN112732885A (zh) 用于问答系统的答案扩展方法、装置及电子设备
JP4965766B2 (ja) 関係情報抽出装置および属性情報抽出装置
JP2007241900A (ja) ネーミングシステム及びネーミング自動化方法
Mickus et al. About neural networks and writing definitions
Brown English and empire: literary history, dialect, and the digital archive
Garg et al. Identification and Classification of Reduplication Words in Punjabi Language
JP2000194559A5 (ja)
Gîfu et al. Towards an Automated Semiotic Analysis of the Romanian Political Discourse
JP4588417B2 (ja) 翻訳装置
Das A survey on question answering system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070327

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070402

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160406

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees