JP2005092616A - 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム - Google Patents

自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2005092616A
JP2005092616A JP2003326397A JP2003326397A JP2005092616A JP 2005092616 A JP2005092616 A JP 2005092616A JP 2003326397 A JP2003326397 A JP 2003326397A JP 2003326397 A JP2003326397 A JP 2003326397A JP 2005092616 A JP2005092616 A JP 2005092616A
Authority
JP
Japan
Prior art keywords
sentence
case
verb
syntax
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003326397A
Other languages
English (en)
Inventor
Tomoko Okuma
智子 大熊
Hiroshi Masuichi
博 増市
Hiroki Yoshimura
宏樹 吉村
Daigo Sugihara
大悟 杉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2003326397A priority Critical patent/JP2005092616A/ja
Publication of JP2005092616A publication Critical patent/JP2005092616A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 アンケートなどの設問に対する不特定数の回答文について、同意見をとりまとめ少数意見を汲み取るように要約する。
【解決手段】 注目すべき特定の動詞を抽出し、回答文の集合から特定の動詞を含む回答文を抽出し、各回答文に対して構文・意味解析を行って特定の動詞の格関係を抽出し、構文・意味解析結果に基づいて抽出された回答文について特定の動詞の格関係表を作成し、特定の動詞を述部に持つ要約文を作成する。語の重要度の判定に文中の位置情報を利用することにより、頻度が低くても要約文中に含まれていることが望ましい語を要約文に採用することができる。
【選択図】 図1

Description

本発明は、人間が日常的なコミュニケーションに使用する自然言語を数学的に取り扱うための自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、自然言語文の構文・意味解析を行なう自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
さらに詳しくは、本発明は、文書要約などのアプリケーションに適用することができる自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに係り、特に、文書要約に適用した際に、同意見をとりまとめ少数意見を汲み取ることができる自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムに関する。
日本語や英語など、人間が日常的なコミュニケーションに使用する言葉のことを「自然言語」と呼ぶ。多くの自然言語は、自然発生的な起源を持ち、人類、民族、社会の歴史とともに進化してきた。勿論、人は身振りや手振りなどによっても意思疎通を行なうことが可能であるが、自然言語により最も自然で且つ高度なコミュニケーションを実現することができる。
他方、情報技術の発展に伴い、コンピュータが人間社会に定着し、各種産業や日常生活の中に深く浸透している。いまやコンピュータ・データだけでなく、画像や音響などほとんどすべての情報コンテンツがコンピュータ上で取り扱われ、情報の編集・加工、蓄積、管理、伝達、共有など高度な処理を行なうことが可能となっている。
例えば、日本語や英語を始めとする各種の言語で記述される自然言語は、本来抽象的であいまい性が高い性質を持つが、文章を数学的に取り扱うことにより、コンピュータ処理を行なうことができる。この結果、機械翻訳や対話システム、検索システム、質問応答システム、文書の要約システムなど、自動化処理により自然言語に関するさまざまなアプリケーション/サービスが実現される。
かかる自然言語処理は一般に、形態素解析、構文解析、意味解析、文脈解析という各処理フェーズに区分される。
形態素解析では、文を意味的最小単位である形態素(morpheme)に分節して品詞の認定処理を行なう。構文解析では、文法規則などを基に句構造などの文の構造を解析する。文法規則が木構造であることから、構文解析結果は一般に個々の形態素が係り受け関係などを基にして接合された木構造となる。意味解析では、文中の語の語義(概念)や、語と語の間の意味関係などに基づいて、文が伝える意味を表現する意味構造を求めて、意味構造を合成する。また、文脈解析では、文の系列である文章(談話)を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。
とりわけ、構文解析及び意味解析は、自然言語処理の分野において、対話システム、機械翻訳、文書校正支援、文書要約などのアプリケーションを実現する上で必要不可欠の技術であるとされている。
構文解析では、自然言語文を受け取り、文法規則に基づいて単語(文節)間の係り受け関係を決定する処理を行なう。構文解析結果は、依存構造と呼ばれる木構造(依存木)の形態で表現することができる。また、意味解析では、単語(文節)間の係り受け関係に基づいて文中の格関係を決定する処理を行なうことができる。ここで言う格関係とは、文を構成する各要素が持つ、主語(SUBJ)、目的語(OBJ)といった文法上の役割のことを指す。また、文の時制や様相、話法などを判定する処理を意味解析が含む場合もある。
ここで、自然言語処理を文書の要約処理に適用した場合について考察してみる。従来の文書要約の手法は、大きく2つに大別される。
1つは、要約の対象となる文書から、ある基準に基づいて重要な文を抽出する方法である。しかし、この方法では、元文書の情報量を保持したまま、文書の圧縮を行うことは難しい。そこで、キーワードの抽出に代えて、修飾語を削除する用法により、文における修飾語を省き、文を短く要約することで、文の概要を効率よく理解できるようにする文書要約装置について提案がなされている(例えば、特許文献1を参照のこと)。この場合、ユーザが修飾語抑制指示を行ったことに応答して、出力されたレベル以上の修飾語を抑制して文が再表示される。すなわち、文に対して特定の修飾要素を取り除くことにより、要約に要する文の圧縮を図っている。
もう1つは、要約の対象となる文書から、tf/idf(term frequenct/inverse document frequency)や出現位置などを用いて重要な語を抽出する方法である。しかし、このようなキーワード方式では、元の文書の情報を的確に表現することが難しい。そこで、重要語と共起する語との2項関係を利用して、より的確な表現を生成する手法について提案されている(例えば、特許文献2を参照のこと)。この場合、入力された文書から重要な単語を抽出し、抽出された重要な単語を含む文の構造を解析し、その文に含まれている単語同士の2項関係を解析して関係表を生成し、生成された関係表から、重要な単語を含む2項関係を所定の規則に従って選択し、この2項関係に基づいて文を合成することにより、入力文書から短くて的確な要約を作成することが可能となる。
しかしながら、要約対象がアンケート調査の自由回答文の集合であった場合、これらの手法を適用すると幾つかの不具合が生じる。
アンケートの自由回答文の要約には、同意見をまとめることと、少数でも貴重な意見を見落とさないことが同時に要求される。前者の修飾語を削除して文を圧縮する方式では、同意見をまとめることができない。また、後者の重要語と共起する語との2項関係を利用する方法では、少数の意見を汲み取ることが困難である。
特開平6−35961号公報 特開平11−282881号公報
本発明の目的は、文書要約などのアプリケーションに好適に適用することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、アンケートなどの設問に対する不特定数の回答文の文書要約に適用した際に、同意見をとりまとめ少数意見を汲み取ることができる自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、所定の設問に対する回答文の集合を文書要約する自然言語処理システムであって、
前記回答文の集合から注目すべき特定の動詞を抽出する動詞抽出手段と、
前記回答文の集合のうち該抽出された動詞を含む回答文を抽出する文抽出手段と、
前記文抽出手段により抽出された各回答文に対して構文・意味解析を行って、前記動詞抽出手段により抽出された前記特定の動詞の格関係を抽出する構文・意味解析手段と、
前記構文・意味解析手段による構文・意味解析結果に基づいて前記特定の動詞についての格関係表を作成する格関係表作成手段と、
前記格関係表中の各格要素の語を用いて、前記特定の動詞を述部に持つ要約文を作成する要約文生成手段と、
を具備することを特徴とする自然言語処理システムである。
ここで、前記格関係表作成手段は、前記格関係表において、格要素毎に出現した語を重要度の順に並べ替えるようにする。
また、前記要約文作成手段は、前記格関係表において各格要素において上位からk番目の語を要約に採用する。
従来の文書要約手法では、出現頻度などに基づいて割り出される十四語に基づいて要約文の作成を行っていた。しかしながら、アンケートに対する自由回答文を要約の対象とする場合には、文の順序が不同であるため重要度の判定に位置情報を用いることができない。
これに対し、本発明に係る自然言語処理システムによれば、格関係表を用いることで、格要素毎に採用する語を選ぶことにより、語の重要度の判定に文中の位置情報を利用することとなり、頻度が低くても要約文中に含まれていることが望ましい語を要約文に採用することができる。したがって、アンケートの回答文の集合に対して、同意見をまとめると同時に、少数でも貴重な意見を汲み取ることができる。
また、本発明の第2の側面は、所定の設問に対する回答文の集合を文書要約するための処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
前記回答文の集合から注目すべき特定の動詞を抽出する動詞抽出ステップと、
前記回答文の集合のうち該抽出された動詞を含む回答文を抽出する文抽出ステップと、
前記文抽出ステップにおいて抽出された各回答文に対して構文・意味解析を行って、前記動詞抽出ステップにおいて抽出された前記特定の動詞の格関係を抽出する構文・意味解析ステップと、
前記構文・意味解析ステップにおける構文・意味解析結果に基づいて前記特定の動詞についての格関係表を作成する格関係表作成ステップと、
前記格関係表中の各格要素の語を用いて、前記特定の動詞を述部に持つ要約文を作成する要約文生成ステップと、
を具備することを特徴とするコンピュータ・プログラムである。
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る自然言語処理システムと同様の作用効果を得ることができる。
本発明によれば、文書要約などのアプリケーションに好適に適用することができる、優れた自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、アンケートなどの設問に対する不特定数の回答文の文書要約に適用した際に、同意見をとりまとめ少数意見を汲み取ることができる自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラムを提供することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
図1には、本発明の一実施形態に係る文書要約システムの機能構成を模式的に示している。この文書要約システムは、例えばパーソナル・コンピュータ(PC)などの一般的な計算機システム上で、所定のアプリケーション・プログラムを実行するという形態で実現することができる。
本実施形態に係る文書要約システムは、とりわけアンケートの自由回答文の要約処理を行なうようにデザインされている。同図に示すように、この文書要約システム10は、注目すべき特定の動詞を抽出する動詞抽出部11と、回答文の集合から特定の動詞を含む回答文を抽出する文抽出部12と、各回答文に対して構文・意味解析を行って特定の動詞の格関係を抽出する構文・意味解析部13と、構文・意味解析結果に基づいて抽出された回答文について特定の動詞の格関係表を作成する格関係表作成部14と、特定の動詞を述部に持つ要約文を作成する要約文生成部15で構成される。
文書要約システム10の動作手順を説明する上で、ここでは、以下に示すような、自由回答文を要求するアンケートの設問と、この設問に対する回答文の集合を仮定する。
設問:どんな時にこのソフトに不満を感じますか?
回答文a)プレビューウィンドウでフォントを確認するとき
回答文b)フォントを調整するとき
回答文c)印刷時のイメージを確認するとき
回答文d)フォントを確認するとき
回答文e)イメージとサイズを確認するとき
回答文f)ツールバーでフォントを変更するとき
回答文g)画像サイズを変更するとき
まず、動詞抽出部11により、特定の動詞に着目する。動詞の特定には、従来の重要語抽出の手法を用いたり、ユーザが指定したりすることができる。ここでは、最も頻度の多い「確認する」を採用する。
次に、文抽出部12により、この抽出された動詞「確認する」を含む回答文を、回答文の集合の中から抽出する。上記の例では、回答文(a)、(c)、(d)、(e)が該当する。
次に、構文・意味解析部13では、文法ルールや結合価辞書などの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう。本実施形態では、文抽出部12により抽出された各回答文に対して、構文・意味解析を行って、「確認」するの格関係を抽出する。
本実施形態に係る構文・意味解析部13は、LFG文法理論に基づく構文・意味解析処理を適用する。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した“c−structure(constituent structure)”と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文など意味的・機能的に解析した結果として“f−structure(functional structure)”を出力する。
ここで、c−structureは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリによって定義される。例えば音素列を生成するための音韻学的な解釈を、c−structureを基に行なうことができる。一方、f−structureは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。f−structureを参照することにより、主語(subject)、目的語(object)、補語(complement)、修飾語(adjunct)といった意味理解を得ることができる。f−structureは、c−structureの各節点に付随する素性の集合であり、属性−属性値のマトリックスの形で表現される。
図2〜図5には、文抽出部12により抽出された各回答文(a)、(c)、(d)、(e)についての構文・意味解析結果をf−structureの形式でそれぞれ示している。各図において、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
ここで、Lexical Functional Grammar(LFG)構文・意味解析を行うための文法理論の代表的な手法であり、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。LFGの詳細に関しては、例えばR.M.Kaplan及びJ.Bresnan共著の論文“Lexical−Functional Grammar: A Formal System for Grammatical Representation”(The MIT Press,Cambridge (1982). Reprinted in Formal Issues in Lexical−Functional Grammar,pp.29−130.CSLI publications,Stanford University(1995).)などに記述されている。
続いて、図2〜図5に示した構文・意味解析結果を用いて、「確認する」の格関係表を作成する。図6には、格関係表の構成例を示している。この格関係表には、各回答文において出現した語を各要素毎に登録される。さらに、この格関係表において、格要素毎に出現した語を重要度の順に並べ替える、各項目を重要度順に並び替える。出現後の並べ替えも、従来の重要語抽出の手法を用いたり、ユーザが指定したりしてもよい。ここでは、頻度に基づいて並び替えるものとする。
次に、各格要素において上からk番目の語を要約に採用する。ここでは、k=2とする。したがって、格要素OBJにおいて採用される語は「フォント」、「イメージ」、格要素OBL_deで採用される語は「プレビューウィンドウ」となる。
このような回答文の集合について要約処理を行なった結果、以下のような要約文が生成される。例えば、動詞抽出部11により抽出された動詞についての各格要素がブランクとなっている雛型文に対して、該当する語を格関係表から取り出してそれぞれのブランクに記入することによって、要約文が生成される。
要約文:
「フォント」と「イメージ」を「プレビューウィンドウ」で確認する。
重要語と共起する語の2項関係を利用する従来の手法(前述)では、「フォント」と「確認する」の関係は抽出できても、上記の文に含まれている「プレビューウィンドウ」と「確認する」を抽出することは難しい。何故なら、「プレビューウィンドウ」は他の単語「フォント」や「イメージ」と違って1回しか文書中に現れていないため、頻度を用いたtf/idfなどの一般的な計算方法では重要度が低いと判断されるからである。また、ここで要約の対象とする文書はアンケート文の集合であるため、文の順序は不同である。したがって、重要度の判定に位置情報を用いることはできない。
しかしながら、本来、「プレビューウィンドウ」は「確認する」という動作がどこで行われているかを示す唯一の語であるため、頻度が低くても要約文中に含まれていることが望ましいと思料される。本発明に係る文書要約システムによれば、格関係表を用いることで、格要素毎に採用する語を選ぶことにより、語の重要度の判定に文中の意味役割を利用することとなり、頻度が低くても要約文中に含まれていることが望ましい語を要約文に採用することができる。
要言すれば、本発明に係る文書要約システムによれば、アンケートの回答文の集合に対して、同意見をまとめると同時に、少数でも貴重な意見を汲み取ることができる訳である。
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
図1は、本発明の一実施形態に係る文書要約システムの機能構成に示した図である。 図2は、文抽出部12により抽出された回答文(a)についての構文・意味解析結果をf−structureの形式で示した図である。 図3は、文抽出部12により抽出された回答文(c)についての構文・意味解析結果をf−structureの形式で示した図である。 図4は、文抽出部12により抽出された回答文(d)についての構文・意味解析結果をf−structureの形式で示した図である。 図5は、文抽出部12により抽出された回答文(e)についての構文・意味解析結果をf−structureの形式で示した図である。 図6は、図2〜図5に示した構文・意味解析結果を用いて作成される、「確認する」についての格関係表を示した図である。
符号の説明
10…文書要約システム
11…動詞抽出部
12…文抽出部
13…構文・意味解析部
14…格関係表作成部
15…要約文生成部

Claims (7)

  1. 所定の設問に対する回答文の集合を文書要約する自然言語処理システムであって、
    前記回答文の集合から注目すべき特定の動詞を抽出する動詞抽出手段と、
    前記回答文の集合のうち該抽出された動詞を含む回答文を抽出する文抽出手段と、
    前記文抽出手段により抽出された各回答文に対して構文・意味解析を行って、前記動詞抽出手段により抽出された前記特定の動詞の格関係を抽出する構文・意味解析手段と、
    前記構文・意味解析手段による構文・意味解析結果に基づいて前記特定の動詞についての格関係表を作成する格関係表作成手段と、
    前記格関係表中の各格要素の語を用いて、前記特定の動詞を述部に持つ要約文を作成する要約文生成手段と、
    を具備することを特徴とする自然言語処理システム。
  2. 前記格関係表作成手段は、前記格関係表において、格要素毎に出現した語を重要度の順に並べ替える、
    ことを特徴とする請求項1に記載の自然言語処理システム。
  3. 前記要約文作成手段は、前記格関係表において各格要素において上位からk番目の語を要約に採用する、
    ことを特徴とする請求項2に記載の自然言語処理システム。
  4. 所定の設問に対する回答文の集合を文書要約する自然言語処理方法であって、
    前記回答文の集合から注目すべき特定の動詞を抽出する動詞抽出ステップと、
    前記回答文の集合のうち該抽出された動詞を含む回答文を抽出する文抽出ステップと、
    前記文抽出ステップにおいて抽出された各回答文に対して構文・意味解析を行って、前記動詞抽出ステップにおいて抽出された前記特定の動詞の格関係を抽出する構文・意味解析ステップと、
    前記構文・意味解析ステップにおける構文・意味解析結果に基づいて前記特定の動詞についての格関係表を作成する格関係表作成ステップと、
    前記格関係表中の各格要素の語を用いて、前記特定の動詞を述部に持つ要約文を作成する要約文生成ステップと、
    を具備することを特徴とする自然言語処理方法。
  5. 前記格関係表作成ステップでは、前記格関係表において、格要素毎に出現した語を重要度の順に並べ替える、
    ことを特徴とする請求項4に記載の自然言語処理方法。
  6. 前記要約文作成ステップでは、前記格関係表において各格要素において上位からk番目の語を要約に採用する、
    ことを特徴とする請求項5に記載の自然言語処理方法。
  7. 所定の設問に対する回答文の集合を文書要約するための処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
    前記回答文の集合から注目すべき特定の動詞を抽出する動詞抽出ステップと、
    前記回答文の集合のうち該抽出された動詞を含む回答文を抽出する文抽出ステップと、
    前記文抽出ステップにおいて抽出された各回答文に対して構文・意味解析を行って、前記動詞抽出ステップにおいて抽出された前記特定の動詞の格関係を抽出する構文・意味解析ステップと、
    前記構文・意味解析ステップにおける構文・意味解析結果に基づいて前記特定の動詞についての格関係表を作成する格関係表作成ステップと、
    前記格関係表中の各格要素の語を用いて、前記特定の動詞を述部に持つ要約文を作成する要約文生成ステップと、
    を具備することを特徴とするコンピュータ・プログラム。
JP2003326397A 2003-09-18 2003-09-18 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム Pending JP2005092616A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003326397A JP2005092616A (ja) 2003-09-18 2003-09-18 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003326397A JP2005092616A (ja) 2003-09-18 2003-09-18 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2005092616A true JP2005092616A (ja) 2005-04-07

Family

ID=34456606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003326397A Pending JP2005092616A (ja) 2003-09-18 2003-09-18 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP2005092616A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767193B2 (en) 2015-03-27 2017-09-19 Fujitsu Limited Generation apparatus and method
CN110222344A (zh) * 2019-06-17 2019-09-10 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN111177383A (zh) * 2019-12-24 2020-05-19 上海大学 一种融合文本语法结构和语义信息的文本实体关系自动分类方法
JP2020140469A (ja) * 2019-02-28 2020-09-03 富士ゼロックス株式会社 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767193B2 (en) 2015-03-27 2017-09-19 Fujitsu Limited Generation apparatus and method
JP2020140469A (ja) * 2019-02-28 2020-09-03 富士ゼロックス株式会社 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム
JP7322428B2 (ja) 2019-02-28 2023-08-08 富士フイルムビジネスイノベーション株式会社 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム
CN110222344A (zh) * 2019-06-17 2019-09-10 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN110222344B (zh) * 2019-06-17 2022-09-23 上海元趣信息技术有限公司 一种针对小学生作文辅导的作文要素分析算法
CN111177383A (zh) * 2019-12-24 2020-05-19 上海大学 一种融合文本语法结构和语义信息的文本实体关系自动分类方法
CN111177383B (zh) * 2019-12-24 2024-01-16 上海大学 一种融合文本语法结构和语义信息的文本实体关系自动分类方法

Similar Documents

Publication Publication Date Title
JP2005182823A (ja) 縮小されたテキスト本文を生成する方法
KR20040024619A (ko) 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트생성 알고리즘, 장치 및 프로그램
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
El-Kahlout et al. Turkish constituent chunking with morphological and contextual features
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005092616A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Mohamed et al. ADPBC: Arabic dependency parsing based corpora for information extraction
WO1997048058A1 (en) Automated translation of annotated text
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3903820B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
De Pauw et al. African language technology: The data-driven perspective
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JP3972698B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972699B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Li et al. Automatic function interpretation: Using natural language processing on patents to understand design purposes
JP4289822B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Attri et al. The Machine Translation Systems Demystifying the Approaches