JPH06259471A - メッセージ種別判定装置 - Google Patents

メッセージ種別判定装置

Info

Publication number
JPH06259471A
JPH06259471A JP5046973A JP4697393A JPH06259471A JP H06259471 A JPH06259471 A JP H06259471A JP 5046973 A JP5046973 A JP 5046973A JP 4697393 A JP4697393 A JP 4697393A JP H06259471 A JPH06259471 A JP H06259471A
Authority
JP
Japan
Prior art keywords
message
type
expression
type determination
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5046973A
Other languages
English (en)
Inventor
Rintarou Sunaba
倫太郎 砂場
Muneyuki Horii
統之 堀井
Kenji Imamura
賢治 今村
Yoshiji Oyama
芳史 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5046973A priority Critical patent/JPH06259471A/ja
Publication of JPH06259471A publication Critical patent/JPH06259471A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 揺らぎのある表現を含めた詳細な語句により
メッセージ種別を判定する。 【構成】 メッセージ入力部1から入力したメッセージ
は形態素解析部2で形態素に分割され、用言の終止形を
含めて出力される。種別判定表現辞書5には、判定語句
と、語句の組合わせによる適合表現と、適合表現の種別
に対応する評価値が蓄積されている。メッセージ種別判
定部は形態素解析部2の出力を受けて、種別判定表現辞
書5を参照し、メッセージに含まれた適合表現の種別に
対する評価値からメッセージの種別に対応する評価値を
演算して種別判定テーブル6に代入し、種別判定テーブ
ル6上よりメッセージに適合する種別を判定してメッセ
ージ種別出力部4よりメッセージとともに出力させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語通信文処理装置
などの文書分類装置における、入力されたメッセージの
目的種別(以下単に種別と称する)を判定するためのメ
ッセージ種別判定装置に関する。
【0002】
【従来の技術】従来、この種の文書分類装置において
は、文書の種別を自動的に検出し、分類、蓄積を行なう
方法には各種のものがある。例えば、新聞記事等では経
済等の分野に対応したキーワード名詞を、自動、もしく
は入手で作成して記事の分類を行なっている。また、活
用する用言も検出する手法は、機械翻訳の分野で用いら
れている。この場合、文の体言が係る用言のパターンを
格フレームとして蓄積しておき、体言と用言のパターン
に合致するものが文章中に検出されたら、それに応じて
翻訳を行っている(文献:自然言語処理の基礎技術、電
子情報通信学会編、1988)。
【0003】
【発明が解決しようとする課題】上述した従来の方法
は、キーワード名詞を作成して記事の分類をする方法
は、用言である動詞、形容詞、形容動詞を用いた詳細な
解析は行っておらず、例えば経済分野の記事で、“株
価”という名詞で検索される記事が、“株価が上がる”
記事なのか“株価が下がる”記事なのかまで分類してお
らず、また表記に揺らぎがある語句、例えば“すえなが
い”を実際に表記してみると、“末長い”や“末永い”
となったり、送り仮名表記も、文献や人によって揺らぎ
があるので、単一の表記のキーワードでは同じ意味にも
関わらず表記に揺らぎがある語句全てを検索できないと
いう欠点がある。
【0004】また、文の体言が係る用言のパターンを格
フレームとして蓄積する方法は、この格フレームは全て
の文章パターンを網羅するものではなく、文章の体言と
用言のパターンを特定できないものも存在し、そのよう
な文章は他の手段で翻訳しなければならないという欠点
がある。
【0005】本発明の目的は、不特定のメッセージの種
別を判定する際に、メッセージを形態素解析し、名詞だ
けでなく活用する動詞、形容詞、形容動詞の終止形も判
定語句に用いることと、判定語句を、特定の表現を検出
するため、主語・述語、修飾語・被修飾語等の組を適合
表現として蓄積し、個々の適合表現のメッセージ種別に
対する評価値を定め、文に適合する適合表現の評価値に
よって、メッセージの詳細な種別を判定できる装置を提
供することである。
【0006】
【課題を解決するための手段】本発明のメッセージ種別
判定装置は、日本語で表記された1つまたは複数の文で
構成されたメッセージを入力するメッセージ入力部と、
前記メッセージ入力部に入力されたメッセージを形態素
ごとに分割し、各形態素の字面と、前記形態素が動詞、
形容詞、形容動詞である場合、当該動詞、形容詞、形容
動詞の終止形とを出力する形態素解析部と、名詞ならび
に動詞、形容詞および形容動詞の終止形を含む、メッセ
ージの目的種別を判定するための語句を蓄積し、特定の
表現を検出するための、「主語と述語」、「修飾語と被
修飾語」および「類似した語」を含む語句の組み合わせ
を適合表現として蓄積し、および前記適合表現のメッセ
ージ目的種別に対応する評価値を蓄積した種別判定表現
辞書と、メッセージに適合した適合表現のメッセージ目
的種別に対応する評価値から前記メッセージに適合する
目的種別を判定するための種別判定テーブルと、前記形
態素解析部が出力したメッセージの形態素字面と前記終
止形を入力し、前記種別判定表現辞書を参照して、前記
メッセージ中に適合表現と一致する語句の組み合わせが
あれば、当該適合表現のメッセージ目的種別に対応する
評価値により定められた関数を用いて当該メッセージの
各メッセージ目的種別に対応する評価値を演算して前記
種別判定テーブルに代入し、前記種別テーブルの評価値
により別に定めた判定規則にもとづいて前記メッセージ
に適合するメッセージ目的種別を判定するメッセージ種
別判定部と、前記メッセージ種別判定部が判定したメッ
セージ目的種別判定結果を当該メッセージとともに出力
するメッセージ種別出力部とを有する。
【0007】
【作用】メッセージを形態素解析した結果について、名
詞だけでなく、動詞、形容詞および形容動詞の終止形も
判定語句に用いるので、メッセージの目的種別を判定す
るさいに、揺らぎのある表現も含めてより詳細に語句を
検索したうえでの判定ができる。
【0008】また、「主語と述語」、「修飾語と被修飾
語」や「類似した語句」等を組でまとめた適合表現を作
成し、適合表現ごとに目的種別に対応する評価値を配列
した種別判定表現辞書を参照して、メッセージ種別を判
定するので、種別判定表現辞書の適合表現とメッセージ
種別の評価値を更新するだけで他分野への対応や判定精
度の向上ができる。
【0009】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0010】図1は本発明のメッセージ種別判定装置の
一実施例の構成ブロック図、図2は図1の種別判定表現
辞書5に格納されている単語と熟語レベルのデータを示
す図、図3(a)は種別判定表現辞書5に格納されてい
る適合表現のメッセージ種別に対応する評価値Pn を示
す図、同図(b)は評価値Pn の設定法の一例を示す
図、図4は種別判定表現辞書5に格納されている適合表
現とメッセージ種別に対応する評価値の蓄積方法を示す
図、図5(a)はメッセージに適合した適合表現とメッ
セージ種別に対応する評価値を示す図、同図(b)は種
別判定テーブル6の内容を示す図である。
【0011】このメッセージ種別判定装置はメッセージ
入力部1と形態素解析部2とメッセージ種別判定部3と
メッセージ種別出力部4と種別判定表現辞書5と種別判
定テーブル6とより構成されている。
【0012】メッセージ入力部1にはメッセージが入力
される。形態素解析部2はメッセージ入力部1に1文以
上のメッセージが入力されると、入力されたメッセージ
に対して形態素解析を行い、分割された各形態素の字面
と、形態素が動詞、形容詞、形容動詞である場合は、そ
の終止形も併せてリストを作成して出力する。
【0013】種別判定表現辞書5には、1)単語・熟
語、2)適合表現、3)適合表現のメッセージ種別に対
応する評価値の3段階のデータがあらかじめ蓄積されて
いる。以下各段階のデータについて説明する。
【0014】第1の段階は単語と熟語レベルのデータ
で、メッセージの種別判定に用いる全ての語句の、形態
素の終止形と、形態素が連なった熟語が蓄積されてい
る。これは図2に示す名詞(家庭、マイホーム、スイー
トホーム)21および、動詞の終止形(築く、作る、創
る)23の1つ1つの単語に相当する。
【0015】第2段階は、解析文中に存在する表現を検
出するために、第1段階の語句の体言と用語、修飾と被
修飾、並列関係等で組み合わせたパターンが蓄積され
る。この組み合わせパターンを適合表現と呼ぶことにす
る。例えば「家庭をお築きください」という表現の体言
は「家庭」であり、用言「築き」の終止形は「築く」で
あるが、この表現を検出するための適合表現について説
明する。第1段階の語句データ中にある、名詞「家庭」
と、動詞「築き」の終止形「築く」の体言・用言の組
が、1文中に同時に存在したときに表現が存在したと判
定する。この“同時に存在する”という適合条件を図2
に示すように。“and”という記号23で記述してあ
る。また「家庭」という語句の代わりに類義語である
「マイホーム」や「スイートホーム」が使われた場合で
も、あるいは「築く」という語句の代わりに類義語であ
る「作る」や「創る」が使われた場合でも表現を検出で
きるように、語句の互換性を示す“or”という記号2
4で類義語もまとめて格納しておく。
【0016】第3段階は、すべての適合表現についてメ
ッセージ種別に対応する評価値が蓄積されている。い
ま、メッセージ種別判定部3でk1 からkn のn種類に
種別判定を行うとする。適合表現の種別に対する関係は
図3(a)に示すように、適合表現のメッセージ種別に
対応する評価値Pn として格納されている。評価値Pn
の設定法の1例を図3(b)によって説明する。文中に
適合表現が存在するとき、文の種別がkn であると判断
できる場合はPn =1、種別がkn であることを否定で
きる場合はPn =−1、それ以外の場合はPn =0を設
定する。こうしてm個の適合表現im の1つ1つにつき
種別数nの配列を作成し、図4に示すように、適合表現
のメッセージ種別に対応する評価値の2次元配列を作成
し、種別判定表現辞書5に蓄積しておく。
【0017】種別判定テーブル6には、図5(b)に示
すように、メッセージ種別k1 からkn に対して演算さ
れた、入力したメッセージの評価値f(P1 ),f(P
2 ),・・・・,f(Pn )が代入される。
【0018】メッセージ種別判定部3は、形態素解析部
2から形態素解析されたメッセージが入力されると、種
別判定表現辞書5中に格納されている全ての適合表現i
1 からim までを順次参照して、入力文中に、適合表現
と一致する語句の組み合わせの存在を調べる。ここで入
力形態素列にx,y,zの3つの適合表現が適合したと
すると、適合表現x,y,zのメッセージ種別に対する
評価値Pnx,Pny,P nzを種別判定表現辞書5より読取
り、評価値Pnx,Pny,Pnzをあらかじめ定めた関数f
(X)=(Pnx,Pny,Pnz)によって演算し、演算結
果を対応するメッセージ種別ごとに種別判定テーブル6
に代入する。ここで、関数f(Pnx,P ny,Pnz)は、
一例として、単純に同じ種別の適合表現の評価値の合計
をとる関数、すなわちf(Pnx,Pny,Pnz)=Pnx
ny+Pnzがある。続いて、メッセージ種別判定部3は
種別判定テーブル6より別に定めた判定規則によって入
力されたメッセージに適合するメッセージ種別に決定す
る。ここで、判定規則の例として、種別判定テーブル6
の中で評価値が最大値をとるメッセージ種別を入力メッ
セージに適合する判定種別とする評価法が考えられる。
【0019】メッセージ種別出力部4はメッセージ種別
判定部3が判定したメッセージ種別をメッセージととも
に出力する。
【0020】次に、本実施例の動作を具体的な例で説明
する。
【0021】図6は図1のメッセージ種別判定装置の動
作の第1具体例を示す図である。
【0022】いま、電報文の「結婚式」、「結婚記念
日」、「お悔やみ」等のメッセージ種別をこの装置で判
定する場合を考える。
【0023】「お嬢様の晴れのご結婚、心よりお祝い申
しあげます。お二人の末ながいお幸せをお祈りいたしま
す。」というメッセージ種別を判定する場合について説
明する。
【0024】まずメッセージ入力部1から入力された電
報文は、形態素解析部2によって形態素解析される。例
えば、入力された電報文の各文は次のように形態素に分
割される。ここで、“/”は形態素の区切り記号であ
る。 お嬢様/の/晴れ/の/ご/結婚/、/ 心より/お/祝い/申しあげ/ます/。/ お/二人/の/末ながい/お/幸せ/を/お/祈り/い
たし/ます/。
【0025】形態素が動詞、形容詞、形容動詞の場合に
は終止形情報も付与する。メッセージ種別判定部3では
形態素解析部2の出力に対して、種別判定表現辞書5を
参照しながら解析し、電報文の種別を得る。
【0026】種別判定表現辞書5の全ての語句を参照
し、入力された電報文中に、適合する適合表現を調べ
る。図6の適合表現を参照すると、まず第1文の“結
婚”という形態素に対して、種別判定表現辞書5の適合
表現「婚礼」(a)にある、“結婚”という語句が適合
する。この適合表現「婚礼」は結婚式を示す名詞が“o
r”によって並べられており、この単語群中の1語でも
文中に存在すればこの適合表現が適合すると判断され
る。この適合表現のメッセージ種別に対する評価値Pn
は、図6(d)の評価値欄61において種別「結婚式」
に対応する部分に評価値P=1が設定されている。第1
文に適合した適合表現は他にはない。
【0027】続いて第2文の解析に移る。第2文に対し
ては、適合表現「二人の幸せ」(b)が適合した。この
適合表現は文中に同時に存在する“二人”と“幸せ”の
語句の組み合わせに適合した。この適合表現も種別「結
婚式」に対する評価値Pが欄61において1になってい
る。また適合表現「永遠の愛」(c)の“二人and末
永い”も存在し、これは種別「結婚式」と「結婚記念
日」に対する評価値Pが1になっている。このように第
2文には2つの適合表現が適合した。
【0028】図6(d)に示すように、種別判定テーブ
ル62で、このメッセージに適合した3つの適合表現の
種別に対する評価値Pを集計する。この例の場合は種別
ごとに合計する関数f(x)を用いて種別判定テーブル
62上で演算する。
【0029】種別判定テーブルを評価する際に、評価値
が最大値をとる種別を判定種別とする判定規則でこの種
別判定テーブル62を評価すると、種別「結婚式」に対
応する評価値Pが3で、最大値をとるので、このメッセ
ージに適合するメッセージ種別は「結婚式」と判定さ
れ、メッセージ種別出力部4から、〔種別「結婚式」,
“お嬢様の晴れのご結婚、心よりお祝い申しあげます。
お二人の末ながいお幸せをお祈りいたします。”〕のよ
うに、判定された種別とメッセージが出力される。
【0030】次に、動作の第2具体例について説明す
る。
【0031】図7は図1のメッセージ種別判定装置の動
作の第2具体例を示す図である。
【0032】この例では、種別「結婚記念日」と判定さ
れた電報文の例を取り上げる。
【0033】「紙婚式おめでとう。まだ新婚気分の毎日
でしょう。これからもお二人仲良く素敵なご家庭を築い
てください。二世の誕生を待望しています。」 この例文をメッセージ入力部1へ入力すると、形態素解
析部2の出力は 紙婚式/おめでとう/。/ まだ/新婚/気分/の/毎日/でしょう/。/ これから/も/お/二人/仲良く/素敵な/ご/家庭/
を/ 築い/て/ください/。/ 二世/の/誕生/を/待望し/て/い/ます/。 となる。
【0034】さて、この文がメッセージ種別判定部3に
入力され、種別判定表現辞書5が参照される。図7に示
すように、まず第1文中に存在する“紙婚式”に対し
て、適合表現「結婚記念日」(a)が適合する。第2文
には適合表現「新婚」(b)に含まれる“新婚”が存在
し、第3文には“家庭”と“築く”が同時に存在するの
で、適合表現「家庭を築く」(c)が適合する。適合表
現「家庭を築く」の評価値Pは、種別「結婚記念日」だ
けでなく、「結婚式」に対する評価値Pも1になってい
る(評価値欄71)。
【0035】これらの適合した3つの、適合表現の評価
値Pを、第1具体例と同じように種別判定テーブル72
上で、種別ごとに合計する関数を用いて集計すると、種
別判定テーブル72は、種別「結婚式」が1、「結婚記
念日」が3になる。種別はテーブル中の最大値をとる
「結婚記念日」と判定され、メッセージ種別出力部4に
よって、〔種別「結婚記念日」,“紙婚式おめでとう。
まだ新婚気分の毎日でしょう。これからもお二人仲良く
素敵なご家庭を築いてください。二世の誕生を待望して
います。”〕のように、判定された種別とメッセージが
出力される。
【0036】この例のように適合表現によっては、種別
への評価値に、−1をとることによって、その種別と判
定される可能性を下げることができる。
【0037】上記実施例に示した、種別判定表現辞書5
内の適合表現と種別との評価値Pの設定法や、種別判定
テーブル6における集計関数f(x)は、判定対象文に
よって変更できる。例えば、適合表現と種別との評価値
Pに設定した値は(0,1,−1)の3種であったが、
より判定精度を改善するために、実数値を設定すること
もできる。また、この評価値Pを更新することによっ
て、メッセージ以外の文章の判定や、判定精度の向上が
可能になる。
【0038】本実施例のメッセージ種別判定装置では、
メッセージ形態素解析結果について、動詞、形容詞、形
容動詞の終止形も判定語句としているので、揺らぎのあ
る表現を含めて詳細に語句を検索したうえでのメッセー
ジ種別判定ができるばかりでなく、種別判定表現辞書で
の適合表現とメッセージ種別の評価値を更新することで
容易に他分野への対応や判定精度の向上が図れる。
【0039】
【発明の効果】以上説明したように本発明は、メッセー
ジを形態素解析し、名詞だけでなく動詞、形容詞および
形容動詞の終止形を含む語句を判定語句として、判定語
句を組み合わせた適合表現を蓄積し、かつ適合表現のメ
ッセージ種別に対応する評価値を蓄積した種別判定表現
辞書を参照して、メッセージに適合した適合表現の評価
値をもとにメッセージ種別を判定することにより、揺ら
ぎのある表現を含めて、より詳細に語句を検索したうえ
でのメッセージ種別の判定が可能となり、また、種別判
定表現辞書の適合表現とメッセージ種別の評価値を更新
するだけで、メッセージ種別判定以外の他分野への対応
や判定精度の向上ができるという効果がある。
【図面の簡単な説明】
【図1】本発明のメッセージ種別判定装置の一実施例の
構成ブロック図である。
【図2】図1の種別判定表現辞書5に格納されている単
語と熟語レベルのデータを示す図である。
【図3】(a)は種別判定表現辞書5に格納されている
適合表現のメッセージ種別に対応する評価値Pn を示す
図、(b)は評価値Pn の設定法の一例を示す図であ
る。
【図4】種別判定表現辞書5に格納されている適合表現
とメッセージ種別に対応する評価値の蓄積方法を示す図
である。
【図5】(a)はメッセージに適合した適合表現とメッ
セージ種別に対応する評価値を示す図、(b)は種別判
定テーブル6の内容を示す図である。
【図6】図1のメッセージ種別判定装置の動作の第1具
体例を示す図であって、(a),(b)および(c)は
適合表現を示し、(d)はメッセージ種別判定結果を示
す。
【図7】図1のメッセージ種別判定装置の動作の第2具
体例を示す図であって、(a),(b)および(c)は
適合表現を示し、(d)はメッセージ種別判定結果を示
す。
【符号の説明】
1 メッセージ入力部 2 形態素解析部 3 メッセージ種別判定部 4 メッセージ種別出力部 5 種別判定表現辞書 6 種別判定テーブル 21 名詞 22 動詞の終止形 23,24 記号 61,71 評価値欄 62,72 種別判定テーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大山 芳史 東京都千代田区内幸町一丁目1番6号 日 本電信電話株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 日本語で表記された1つまたは複数の文
    で構成されたメッセージを入力するメッセージ入力部
    と、 前記メッセージ入力部に入力したメッセージを形態素ご
    とに分割し、各形態素の字面と、前記形態素が動詞、形
    容詞、形容動詞である場合、当該動詞、形容詞、形容動
    詞の終止形とを出力する形態素解析部と、 名詞ならびに動詞、形容詞および形容動詞の終止形を含
    む、メッセージの目的種別を判定するための語句を蓄積
    し、特定の表現を検出するための、「主語と述語」、
    「修飾語と被修飾語」および「類似した語句」を含む語
    句の組み合わせを適合表現として蓄積し、および前記適
    合表現のメッセージ目的種別に対応する評価値を蓄積し
    た種別判定表現辞書と、 メッセージに適合した適合表現のメッセージ目的種別に
    対応する評価値から前記メッセージに適合する目的種別
    を判定するための種別判定テーブルと、 前記形態素解析部が出力したメッセージの形態素字面と
    前記終止形を入力し、前記種別判定表現辞書を参照し
    て、前記メッセージ中に適合表現と一致する語句の組み
    合わせがあれば、当該適合表現のメッセージ目的種別に
    対応する評価値にもとづいて定められた関数を用いて当
    該メッセージの各メッセージ目的種別に対応する評価値
    を演算して前記種別判定テーブルに代入し、前記種別判
    定テーブル上の評価値により別に定めた判定規則にもと
    づいて前記メッセージに適合するメッセージ目的種別を
    判定するメッセージ種別判定部と、 前記メッセージ種別判定部が判定したメッセージ目的種
    別判定結果を当該メッセージとともに出力するメッセー
    ジ種別出力部とを有するメッセージ種別判定装置。
JP5046973A 1993-03-08 1993-03-08 メッセージ種別判定装置 Pending JPH06259471A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5046973A JPH06259471A (ja) 1993-03-08 1993-03-08 メッセージ種別判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5046973A JPH06259471A (ja) 1993-03-08 1993-03-08 メッセージ種別判定装置

Publications (1)

Publication Number Publication Date
JPH06259471A true JPH06259471A (ja) 1994-09-16

Family

ID=12762196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5046973A Pending JPH06259471A (ja) 1993-03-08 1993-03-08 メッセージ種別判定装置

Country Status (1)

Country Link
JP (1) JPH06259471A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012147428A1 (ja) * 2011-04-27 2012-11-01 日本電気株式会社 テキストクラスタリング装置、テキストクラスタリング方法、およびコンピュータ読み取り可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012147428A1 (ja) * 2011-04-27 2012-11-01 日本電気株式会社 テキストクラスタリング装置、テキストクラスタリング方法、およびコンピュータ読み取り可能な記録媒体
JP5534280B2 (ja) * 2011-04-27 2014-06-25 日本電気株式会社 テキストクラスタリング装置、テキストクラスタリング方法、およびプログラム

Similar Documents

Publication Publication Date Title
Amjad et al. “Bend the truth”: Benchmark dataset for fake news detection in Urdu language and its evaluation
Schäfer et al. Web corpus construction
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
JP2742115B2 (ja) 類似文書検索装置
GB2401972A (en) Identifying special word usage in a document
WO2008059111A2 (en) Natural language processing
JP2011118689A (ja) 検索方法及びシステム
Nguyen-Son et al. Identifying computer-generated text using statistical analysis
Madatov et al. Automatic detection of stop words for texts in the Uzbek language
JP2002132811A (ja) 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
Mataoui et al. A new syntax-based aspect detection approach for sentiment analysis in Arabic reviews
Rodrigues et al. NLPPort: a pipeline for Portuguese NLP (Short paper)
Kolesnikova et al. A study of lexical function detection with word2vec and supervised machine learning
Kilgarriff et al. Longest–commonest Match
JP6830971B2 (ja) 文章生成のためのデータを生成するシステム及び方法
JP2018136900A (ja) 文章解析装置及び文章解析プログラム
JPH01217623A (ja) キーワード自動生成装置
Puscasu A multilingual method for clause splitting
Kulick Simultaneous tokenization and part-of-speech tagging for Arabic without a morphological analyzer
JPH06259471A (ja) メッセージ種別判定装置
Sawalha et al. Linguistically informed and corpus informed morphological analysis of Arabic
Molendini et al. LIT: Rule based Italian lemmatizer
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
Althobaiti Minimally-supervised Methods for Arabic Named Entity Recognition
Neumann et al. Shallow natural language technology and text mining