JP2003076688A - 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム - Google Patents

文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム

Info

Publication number
JP2003076688A
JP2003076688A JP2001262211A JP2001262211A JP2003076688A JP 2003076688 A JP2003076688 A JP 2003076688A JP 2001262211 A JP2001262211 A JP 2001262211A JP 2001262211 A JP2001262211 A JP 2001262211A JP 2003076688 A JP2003076688 A JP 2003076688A
Authority
JP
Japan
Prior art keywords
sentence
character string
expression
string pattern
simplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001262211A
Other languages
English (en)
Inventor
Yoji Kawasaki
洋治 川崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2001262211A priority Critical patent/JP2003076688A/ja
Publication of JP2003076688A publication Critical patent/JP2003076688A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 形態素解析や構文解析などの大掛かりなシス
テムを用いずに、簡単なシステムで簡略化対象文の文末
表現を簡略化すること。 【解決手段】 簡略化対象文の文末の文字列パタンと当
該文字列パタンに対応した文末簡略化方法を予め用意し
ておく。簡略化対象文を取得した場合、当該簡略化対象
文の文末の文字列パタンと予め登録してある文字列パタ
ンを比較する。そして、簡略化対象文の文末の文字列表
現が登録済みの文字列パタンに一致した場合、当該文字
列パタンに設定された文末簡略化方法を当該簡略化対象
文の文末に適用する。例えば、文末が「提供する」とい
ったサ変活用形である場合、サ変活用部分を削除して
「提供」などとする文末簡略化方法がある。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文末表現簡略化装
置、文末表現簡略化方法、及び文末表現簡略化プログラ
ムに関し、例えば文章中の文の文末を自動的に簡略化す
るものに関する。
【0002】
【従来の技術】コンピュータで文章を取り扱う場合、文
章中の文から見出しや箇条書き、或いは目次を生成して
使用する場合がある。そして、生成された文は、例え
ば、ホームページ検索や文献検索の結果、ヒットしたホ
ームページや検索文の見出しなどとして利用させる場合
がある。従来は、このように、文章中の文などを表示す
る場合に、元の文をそのまま利用するか、あるいは文頭
から特定の文字数以降を削除するといった方法で長さを
強制的に短くすることが行われていた。文の長さを強制
的に短くする場合は、特に携帯電話の表示画面などの表
示領域が限られている装置に文を表示する場合に有効で
ある。
【0003】
【発明が解決しようとする課題】しかし、文章中の文を
そのまま利用した場合、文中の言い回しが見出しなどに
なじまなかったり、冗長となる場合があった。また、文
頭から特定の文字数以降を削除した場合、元の文の文意
が損なわれることがあった。また文意を変えずに文末を
短くしようとすれば、形態素解析を実行してその結果に
よって文末表現を生成する必要があり、CPU、メモ
リ、ファイルリソースを消費することになった。そのた
め、与えられた文の文意を変えることなく、軽量でかつ
高速に文末を簡略化するシステムに対する要望が高まっ
ている。
【0004】そこで、本発明の目的は、簡単なシステム
で文末表現を簡略化することのできる文末表現簡略化装
置、文末表現簡略化方法、及び文末表現簡略化プログラ
ムを提供することである。
【0005】
【課題を解決するための手段】本発明は、前記目的を達
成するために、請求項1に記載の発明では、文末表現簡
略化の対象となる対象文を取得する対象文取得手段と、
前記対象文の文末の文字列が所定の文字列パタンである
であるか否かを判別する文字列パタン判別手段と、前記
対象文の文末の文字列が所定の文字列パタンであると前
記文字列パタン判別手段で判別した場合に、前記対象文
の文末の文字列に前記文字列パタンに対応付けられた所
定の処理を施して前記対象文の文末表現を簡略化する簡
略化手段と、を具備したことを特徴とする文末表現簡略
化装置を提供する。請求項2に記載の発明では、前記簡
略化手段は、前記文末表現の所定の部分を削除すること
を特徴とする請求項1に記載の文末表現簡略化装置を提
供する。請求項3に記載の発明では、前記所定の部分
は、サ変活用形の部分であることを特徴とする請求項2
に記載の文末表現簡略化装置を提供する。請求項4に記
載の発明では、前記処理は、前記文字列パタンを、前記
文字列パタンに対応付けられた所定の表現又は所定の記
号に置き換えることを特徴とする請求項1、請求項2又
は請求項3に記載の文末表現簡略化装置を提供する。請
求項5に記載の発明では、対象文取得手段と、文字列パ
タン判別手段と、簡略化手段を備えたコンピュータにお
いて、前記対象文取得手段で、文末表現簡略化の対象と
なる対象文を取得する対象文取得ステップと、前記文字
列パタン判別手段で、前記取得した前記対象文の文末の
文字列が所定の文字列パタンであるであるか否かを判別
する文字列パタン判別ステップと、前記対象文の文末の
文字列が所定の文字列パタンであると前記文字列パタン
判別手段で判別した場合に、前記簡略化手段が、前記対
象文の文末の文字列に前記文字列パタンに対応付けられ
た所定の処理を施して前記対象文の文末表現を簡略化す
る簡略化ステップと、から構成されたことを特徴とする
文末表現簡略化方法を提供する。請求項6に記載の発明
では、文末表現簡略化の対象となる対象文を取得する対
象文取得機能と、前記対象文の文末の文字列が所定の文
字列パタンであるであるか否かを判別する文字列パタン
判別機能と、前記対象文の文末の文字列が所定の文字列
パタンであると前記文字列パタン判別機能で判別した場
合に、前記対象文の文末の文字列に前記文字列パタンに
対応付けられた所定の処理を施して前記対象文の文末表
現を簡略化する簡略化機能と、を具備したことを特徴と
する文末表現簡略化プログラム、又は文末表現簡略化プ
ログラムを記憶したコンピュータが読み取り可能な記憶
媒体を提供する。
【0006】
【発明の実施の形態】本実施の形態は、簡略化可能な文
末表現のパタンを予め登録しておき、簡略化の対象であ
る簡略化対象文の文末表現がこのパタンに合致するか否
かを調べる。また、文末表現のパタンごとに、文末表現
の簡略化方法が予め決められており、当該所定の簡略化
方法に基づいて簡略化対象文の文末表現を簡略化する。
【0007】以下、本発明の好適な実施の形態につい
て、図1ないし図3を参照して詳細に説明する。図1
は、本実施の形態に係る文末表現簡略装置1の概念的な
構成を示した図である。図に示したように文末表現簡略
装置1は、文末表現簡略部10、文字種判別部8、文字
列パタン判定部6、文字列パタン条件部4、漢語・符号
登録部などから構成されている。後に説明するように、
図1に示した各構成要素は、例えばパーソナルコンピュ
ータ(以下PCと記す)を用いて実現することができ
る。
【0008】文末表現簡略装置1は、これらの構成要素
を用いて入力された簡略化対象文2から文末表現を簡略
化した簡略化済み文12を生成する。簡略化対象文2
は、文末表現簡略装置1によって、文末表現を簡略化す
るための文である。簡略化対象文2は、例えば「レスト
ラン○×が新装開店しました。」といったような所定の
文を記録したテキストデータなどである。
【0009】簡略化済み文12は、文末表現簡略装置1
によって、文末が簡略化された後出力された文である。
簡略済み文12は、例えば「レストラン○×が新装開
店」などといったような文末表現が簡略化されたテキス
トデータなどである。
【0010】文末表現簡略装置1は、簡略化対象文2の
文末を予め登録してある簡略化するための文末表現文字
列パタンに該当するか否かを判断し、該当する場合は、
予め登録してある規則に従って簡略化対象文2の文末を
簡略化し、簡略化済み文12を生成する。
【0011】このように、文末表現簡略装置1は、簡略
化対象文2の文末が簡略化できるのかどうかを文末の字
面処理のみで判定するので、形態素解析や構文解析など
を行わずに簡略化対象文2の文末を簡略化することがで
きる。
【0012】簡略化対象文2の文末表現が簡略化できる
場合、文末表現簡略装置1は簡略化対象文2の文末表現
を、予め設定した条件(マッチした文字列パタンによっ
て決まる)に従った文末表現に変更し、文意を変えるこ
となく軽量、高速に文末表現を簡略化する。以下に、文
末表現簡略化するために予め設定した文末表現の文字列
パタンや、当該文字列パタンに対応する簡略化した文末
表現を生成する条件などの具体例を示す。本実施の形態
では以下の(1)〜(8)に示す簡略化方法を採用し
た。
【0013】(1)文末の文字列パタンが「漢字2文字
又はカタカナ2文字」+「サ変活用形」の場合。 「した」「したのである」「すると思う」といったサ変
活用形を用いた特定の文末表現(文末にある文字列パタ
ン)の直前に漢字2文字かカタカナ2文字が存在する場
合に、サ変活用部分を削除する。これによって、簡略化
対象文2の文意を変えることなく文末の簡略化すること
ができる。
【0014】後に説明するように、これらサ変活用形を
用いた特定の文字列パタンは、文字列パタン条件部4に
登録されており、文字列パタン判定部6が登録されてい
るこれらの文字列パタンと、簡略化対象文2の文末の文
字列パタンを比較することにより、簡略化対象文2の文
末の文字列パタンが予め登録されたものか否かを判断す
ることができる。また、文字種判別部8が、当該文字列
パタンの直前の文字種を判定し、当該直前の2文字が漢
字2文字であるかカタカナ2文字であるかを判断する。
そして、文末表現簡略部10が文末のサ変活用部を削除
して簡略化済み文12を生成する。
【0015】このように、予め登録されているサ変活用
形が文末に現れ、その直前が漢字2文字またはカタカナ
2文字であるかどうかを判定することで、例えば 「学会誌を隔月発行している」→「学会誌を隔月発行」 「近所の人が目撃したのだった」→「近所の人が目撃」 「富裕層にアプローチする」→「富裕層にアプローチ」 といったような文末表現の簡略化を行うことができる。
【0016】ところで(1)の規則を当てはめると文意
が損なわれる文もある。例えば簡略化対象文2の文末が
「裏返す」とか「見下す」といったサ行5段活用動詞の
場合、サ変活用形を削除すると文意が損なわれる。その
ため、これらのサ行5段活用動詞の語幹「裏返」「見
下」を例外として文字列パタン条件部4に登録してお
き、簡略化対象文2の文末の文字列パタンがこれらの語
幹を含む場合、文末のサ変活用形を削除しないようにす
ることにより、文末のサ変活用形が過剰に削除されるの
を防ぐことができる。
【0017】(2)文末の文字列パタンが「漢字」+
「い段又はえ段の平仮名」+「サ変活用形」の場合。 簡略化対象文2の文末がサ変活用形であり、その直前
が、い段、え段にある特定の平仮名で、更にその前が漢
字のときに、サ変活用部分を削除して文意を変えること
なく文末の簡略化を行うことができる。文末がサ変活用
形であるか否か、その直前がい段、え段にある特定の平
仮名であるかどうかは、文字列パタン条件部4に予め登
録してある文字列パタンを用いて文字列パタン判定部6
が判断し、更にその前が漢字であることは文字種判別部
8が判別する。
【0018】以上のように、サ変活用形の直前がい段、
え段の平仮名でその前が漢字であることを判別すること
によって、例えば 「勉強部屋を建て増しした」→「勉強部屋を建て増し」 「物資を横流しした」→「物資を横流し」 「祭壇にお供えした」→「祭壇にお供え」 といったように文末表現を簡略化することができる。
【0019】ところで、文末の表現に丁寧語の「お」が
含まれる場合、(2)の規則を当てはめて簡略化すると
不自然な文が生成される。この場合は、さらに判別され
た漢字の前方の特定の区間に平仮名の「お」の文字が存
在するときは例外として削除しないようにすることで、
不自然な文が生成されるのを防ぐことができる。このよ
うに、丁寧語を表す「お」が存在するかどうかを判定す
ることで、 「お客様にお会いした」→「お客様にお会い」 というような不自然な簡略化が実行されないようにする
ことができる。
【0020】(3)文末の文字列パタンが「カタカナ」
+「化」+「サ変活用形」の場合。 簡略化対象文2の文末がサ変活用形であり、その直前が
「化」の文字で、更にその前がカタカナのときに、サ変
活用部分を削除して文末の簡略化を行うことができる。
文末のサ変活用形とその直前の文字「化」は、文字列パ
タン判定部6が文字列パタン条件部4を用いて判別し、
さらにその直前がカタカナであることは文字種判別部8
が判別する。
【0021】このように、サ変活用形の直前が「化」で
その前がカタカナであることを判定することによって、 「代行業務をシステム化している」→「代行業務をシス
テム化」 「数学を用いてモデル化することができる」→「数学を
用いてモデル化」 といったような簡略を行うことができる。
【0022】(4)文末も文字列パタンが「特定のサ変
名詞」の場合。 個別にサ変名詞と判定したい語を文字列パタン条件部4
に登録しておき、サ変活用形の直前がその登録されてい
るサ変名詞のときに、例えば以下のようにサ変活用部分
を削除して文末の簡略化ができる。 「買収後の見通しを危ぐしている」→「買収後の見通し
を危ぐ」 「寄生虫は免疫力が低下している人に悪さしやすい」→
「寄生虫は免疫力が低下している人に悪さ」
【0023】(5)文末の文字列パタンが「漢字2文字
又はカタカナ2文字」+「を」+「サ変活用形」の場
合。 (1)において簡略化対象文2の文末のサ変活用形で、
その直前が平仮名の「を」であり、更にその前が漢字2
文字かカタカナ2文字のときにも、同様に「を」とサ変
活用部分を削除して簡略化することかできる。文末のサ
変活用形とその直前が「を」であることは、文字列パタ
ン判定部6が文字列パタン条件部4を用いて判別し、さ
らにその前が漢字2文字かカタカナ2文字であるか否か
は文字種判別部8が判別する。
【0024】この場合、文末のサ変活用形の直前が
「を」でその前が漢字2文字かカタカナ2文字であるか
を判定することで、 「口外しない約束をした」→「口外しない約束」 「明日の予習をする」→「明日の予習」 「コートでテニスをする」→「コートでテニス」 といったような簡略化を行うことができる。
【0025】(6)文末の文字列パタンが特定の和語の
場合。 (1)〜(5)においてサ変活用形を用いた表現に加え
て、「できる」「見つけた」といった和語を用いた表現
と、それぞれに対応する漢語表現「可能」「発見」を対
応付けて登録しておき、和語を対応する漢語で置き換え
ることによって、短く引き締まった文末表現を生成する
ことができる。対応する和語と漢語は漢語・符号登録部
11にデータベースとして登録してあり、文末表現簡略
部10は、漢語・符号登録部11を検索することによ
り、簡略化対象文2の文末に現れる和語に対応する漢語
を取得することができる。
【0026】このように、意味が似ている和語と漢語を
ぺアで登録しておき、当該和語を漢語で置換することに
より、例えば、 「3日から実施できます」→「3日から実施可能」 「問題解決の糸口を見つけた」→「問題解決の糸口を発
見」 「予定を前倒しすることもできる」→「予定を前倒しす
ることも可能」 といったような引き締まった表現に簡略化することがで
きる。上記の例では、和語と漢語の組は、それぞれ「で
きます」−「可能」、「見つけた」−「発見」、「でき
る」−「可能」である。
【0027】(7)文末の文字列パタンが特定の文末表
現である場合。 (6)に加えて、「するのだろうか」のような疑問を表
す文末表現に符号「?」を対応付けて登録しておくこと
によって、文意を変えることなく文末表現を簡略化する
ことができる。また「したのだ」のような強調を表す表
現には符号「!」を対応付けておけば、同様に文意を変
えることなく簡略化できる。これらの文末表現と符号の
対応関係は漢語・符号登録部11にデータベース化して
記憶してあり、文末表現簡略部10は、漢語・符号登録
部11を検索することにより、簡略化対象文2の文末表
現に対応する符号を取得することができる。。
【0028】このように、疑問や強調を表す表現と疑問
符、感嘆符を対応付ければ、例えば、 「容疑者は観念したのだろうか」→「容疑者は観念?」 「双方の利害が一致したのだ」→「双方の利害が一致
!」 といったような簡略化を行うことができる。
【0029】(8)文末の文字列パタンが括弧書きの場
合。 更に上記の(1)〜(7)において、括弧記
号「(」「」)」を文字列パタン条件部4に登録してお
けば、文末にあるかっこ書きの前にある表現に対して同
様に簡略化を実行することができる。あるいはかっこ書
きそのものも削除して短い表現にすることができる。
【0030】このように括弧の文字を登録しておき文末
の括弧書きを判定することで、例えば、括弧書きを残す
場合は、 「野党は首相の退陣を要求した(3月1日)」→「野党
は首相の退陣を要求(3月1日)」 と簡略化され、また、括弧書きを削除する場合は、 「給湯システムが故障した(部品の劣化が原因)」→
「給湯システムが故障」 と簡略化することが可能になる。
【0031】文末表現簡略化装置1は、以上に例示した
(1)〜(8)の文末表現文字列パタンや簡略化した文
末表現を生成する規則に従って、簡略化対象文2の文末
表現を簡略化し、簡略化済み文12を生成する。なお、
以上に示した文末表現文字列パタンや文末の簡略化のた
めの規則は1例であって、以上の(1)〜(8)に限定
するものではない。更に他の文末表現文字列パタンやそ
れに対応する文末簡略化のための規則を設けても良い。
【0032】次に、文末表現簡略化装置1の構成要素で
ある、文末表現簡略化部10、文字種判別部8、文字列
パタン判定部6、文字列パタン条件部4、漢語・符号登
録部11について説明する。文字列パタン条件部4は、
上記(1)〜(8)で説明したサ変活用形やそれらを用
いた表現、例外表現、個別に指定するサ変名詞といった
文字列パタン条件を前もって登録しておくためのデータ
ベースである。
【0033】文字列パタン判定部6は、文末表現簡略部
10によって起動され、文末表現簡略部10が取得した
簡略化対象文2を文字列パタン条件部4に登録されてい
る文字列パタン条件と比較する。そして、簡略化対象文
2の中に登録済みの文字列パタン条件と一致する文字列
パタンがあった場合、この文字列パタンが現れる文字列
の出現位置を特定する。そして、文字列パタン判定部6
は、当該文字列パタンの出現位置と文字列パタンを特定
する情報を文末表現簡略部10に送る。
【0034】そして、簡略化対象文2の中に登録済みの
文字列パタン条件と一致する文字列パタンがあった場
合、この文字列パタンが現れる文字列の出現位置を特定
する。そして、文字列パタン判定部6は、当該文字列パ
タンの出現位置と文字列パタンを特定する情報を文末表
現簡略部10に送る。
【0035】文字種判別部8は、文末表現簡略部10に
よって起動され、以下のようにサ変活用形の直前の文字
列の文字の種別(漢字、平仮名、カタカナ、など)など
を特定し、特定結果を文末表現簡略部10に送る。
(1)の場合は、サ変活用形の直前が漢字2文字かカタ
カナ2文字かを判別する。(2)の場合は、い段、え段
の平仮名の直前が漢字であるかどうかを判別する。
(3)の場合は、「化」の直前の文字がカタカナである
かどうかを判別する。(5)の場合は、「を」の直前の
2文字が漢字2文字かカタカナ2文字かどうかを判別す
る。
【0036】漢語・符号登録部11は、意味の似た和語
に対応付けられている漢語と、疑問や強調を表す表現に
対応付けられた符号を格納したデータベースである。 漢語・符号登録部11に格納されている漢語としては、
例えば、和語「できます」に対応付けられた漢語「可
能」などがあり、同様に格納されている符号としては、
例えば疑問を表す表現「したのだろうか」に対応付けら
れた符号「?」などがある。 漢語・符号登録部11は、和語によって対応する漢語を
検索することができ、所定の表現に対して、当該表現に
対応する符号を検索することができるようになってい
る。
【0037】漢語・符号登録部11は、文末表現簡略部
10からの検索を受けて所定の漢語や符号を文末表現簡
略部10に提供する。 例えば、文末表現簡略部10は、和語「できます」に対
応する漢語を漢語・符号登録部11で検索し、登録して
ある漢語の中から漢語「可能」を取得することができ
る。また、文末表現簡略部10は、疑問を表す表現「し
たのだろうか」に対応する符号を検索し、対応する符号
「?」を取得することができる。
【0038】文末表現簡略部10は、簡略化対象文2を
取得した後、文字列パタン判定部6を起動し、予め文字
列パタン条件部4に登録してある文字列パタン(サ変活
用形や括弧など)が簡略化対象文2の文末に含まれるか
否かをチェックする。文末表現簡略部10は、更に文字
種判別部8を起動してそれら文字列パタンの出現位置の
前に現れる文字の種別(漢字、平仮名、カタカナ、な
ど)のパタンなどを解析する。
【0039】更に文末表現簡略部10は、漢語・符号登
録部11を検索し、簡略化対象文2の文末に対応する漢
語表現或いは符号があるかどうかを調べる。このよう
に、文末表現簡略部10は、文字列パタン判定部6と文
字種判別部8及び漢語・符号登録部11を起動して、簡
略化対象文2の文末表現が上記(1)〜(8)の何れか
に該当するか否かを解析する。
【0040】解析の結果、簡略化対象文2の文末表現の
文字列パタンが上記(1)〜(8)の何れかに合致する
場合、文末簡略化部10は、それぞれのパタンに対応し
た方法で簡略化対象文2の文末を簡略化し、簡略化済み
文12を生成する。
【0041】簡略化対象文2の文末表現の文字列パタン
が(1)〜(5)の何れかに該当する場合、文末表現簡
略部10は、簡略化対象文2の文末のサ変活用形を削除
して簡略化済み文12を生成する。
【0042】簡略化対象文2の文末表現の文字列パタン
が(6)に該当する場合、文末表現簡略部10は、簡略
化対象文2の文末の和語に対応する漢語を漢語・符号登
録部11を検索して取得する。そして、文末表現簡略部
10は、簡略化対象文2の文末の和語を検索した漢語で
置換して簡略済み文12を生成する。
【0043】簡略化対象文2の文末表現の文字列パタン
が(7)の場合は、文末表現簡略部10は、簡略化対象
文2の文末表現に対応する符号「?」、「!」などを漢
語・符号登録部11から検索する。そして文末簡略部1
0は、簡略化対象文2の文末表現に対応する符号を用い
て文末を簡略化し、簡略化済み文12を生成する。
【0044】簡略化対象文2の文末表現の文字列パタン
が(8)の場合、文末簡略部10は、括弧書きの直前に
ある文末表現の文字列パタンを上記(1)〜(7)の何
れかであるか判断して特定する。そして文末簡略部10
は、特定された文字列パタンに基づいて括弧書き直前の
文末を簡略化する。そして、文末簡略化部10は、生成
した文末に括弧書を付け加える。又は、括弧書きを削除
するように構成することもできる。
【0045】以上に説明したように、文末表現簡略化装
置1は、簡略化対象文2の文末の文字列パターンから、
簡略化方法を判断する。そのため、形態素解析や構文解
析といった、大掛かりで複雑なシステムを使用せずに、
簡略化対象文2の文末表現を簡略化することができる。
【0046】図2(a)は、文末表現簡略装置1をPC
を用いて構成した場合の構成図である。文末表現簡略装
置1は、制御部26にバスライン43を介して入力装置
34、出力装置38、通信制御装置42、記憶装置4
8、記憶媒体駆動装置46、入出力インターフェース4
4などが接続して構成されている。
【0047】制御部26は、文末表現簡略プログラム5
0などに従って簡略化対象文2から簡略化済み文12を
生成したり、文末表現簡略装置1全体を制御したりなど
する。制御部26は、CPU28、ROM(Read
Only Memory)30、RAM(Random
Access Memory)30などから構成され
ている。
【0048】ROM30は、CPU28が各種演算や制
御を行うための各種プログラム、データ及びパラメータ
などを格納したリードオンリーメモリである。CPU2
8は、ROM30からプログラムやデータ、パラメータ
などを読み込むことはできるが、これらを書き換えたり
消去することはできない。
【0049】RAM32は、CPU28にワーキングメ
モリとして使用されるランダムアクセスメモリである。
CPU28は、RAM32にプログラムやデータなどを
書込んだり消去したりすることができる。本実施の形態
では、RAM32には、CPU28が簡略化対象文2の
格納、文字列パタンの判定、文末表現の削除や漢語、符
号などによる置き換え、などを行うためのエリアが確保
可能となっている。
【0050】入力装置34は、文末表現簡略装置1に対
して文字や数字その他の情報を入力するための装置であ
り、例えばキーボードやマウスなどにより構成されてい
る。キーボードは、カナや英文字などを入力するための
キーや数字を入力するためのテンキー、各種機能キー、
カーソルキー及びその他のキーによって構成されてい
る。
【0051】キーボートは、例えばユーザが文末表現簡
略装置1にログインするためのログインIDやパスワー
ドを入力したり、あるいは文末表現簡略プログラム50
に従って表示装置表示される画面の各種入力欄に必要な
データ(例えば入力パラメータ18など)を入力する際
に使用する。また、文末表現簡略装置1がテキストエデ
ィタやワープロソフトなどを実装している場合は、これ
らのソフトウェアを用いてキーボードから簡略化対象文
2を直接文末表現簡略装置1に入力することも可能であ
る。
【0052】マウスは、ポインティングデバイスであ
る。GUI(Graphical User Inte
rface)などを用いて文末表現簡略装置1を操作す
る場合、表示装置上に表示されたボタンやアイコンなど
をマウスでクリックすることにより、所定の情報の入力
を行うことができる。
【0053】出力装置38は、例えば表示装置や印刷装
置などである。表示装置は、例えばCRT(Catho
de Ray Tube)ディスプレイ、液晶ディスプ
レイ、プラズマディスプレイなどで構成された情報を画
面上に提示するための装置である。表示装置は、入力装
置34の入力結果や、簡略化対象文2、簡略化済み文1
2などを表示することができる。
【0054】印刷装置は、例えば、生成した簡略化済み
文12や、簡略化対象文2などをテキストの形で紙など
の印刷媒体に印刷する装置である。印刷装置は、例え
ば、インクジェットプリンタ、レーザプリンタ、熱転写
プリンタ、ドットプリンタなどの各種プリンタ装置によ
って構成されている。
【0055】通信制御装置42は、専用回線10を介し
て文末表現簡略装置1を端末装置9に接続するための装
置であって、モデム、ターミナルアダプタその他の装置
によって構成されている。通信制御装置42は、例えば
インターネットやLAN(Local AreaNet
work)などに接続しており、これらのネットワーク
に接続した他の端末装置あるいはサーバ装置などから通
信によって簡略化対象文2を取得したり、あるいはこれ
らの装置に対して簡略化済み文12を送信したりするこ
となどができる。通信制御装置42はCPU28によっ
て制御され、例えば、TCP/IPなどの所定のプロト
コルに従ってこれら端末装置やサーバ装置との信号及び
データの送受信を行う。
【0056】記憶装置48は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータを読み書
きするための駆動装置によって構成されている。当該記
憶媒体として主にハードディスクが使用されるが、その
他に、例えば、光磁気ディスク、磁気ディスク、半導体
メモリなどの他の読み書き可能な記憶媒体によって構成
することも可能である。
【0057】記憶装置48は、文末表現簡略プログラム
50、その他のプログラム52、文字列パタン条件デー
タ54、漢語・符号登録データ56、その他のデータ6
0などが記憶されている。文末表現簡略プログラム50
は、CPU28に文末表現簡略機能を発揮させるための
プログラムであって、後に説明する各モジュールから構
成されている。
【0058】その他のプログラム52は、例えば、通信
制御装置42を制御し、文末表現簡略装置1とネットワ
ークでつながれた端末装置やサーバ装置との通信を維持
する通信プログラムや、メモリ管理や入出力管理などの
文末表現簡略装置1を動作させるための基本ソフトウェ
アであるOS(Operating System)な
どで構成されている。
【0059】CPU28は、記憶装置48の駆動装置を
駆動することにより、記憶装置48に対してプログラム
やデータの読み書きを行うことができる。その他のデー
タ60に簡略化対象文2を格納しておき、記憶装置48
を駆動してCPU28が簡略化対象文2を読み込んで取
得することができる。このように、記憶装置48は、簡
略化対象文2の取得手段として使用することができる。
【0060】文字列パタン条件データ54は、図1の文
字列パタン条件部4に対応するデータベースであり、サ
変活用形など、簡略化対象文2の文末表現の文字列パタ
ンを判別するためのデータが格納されている。 漢語・符号登録データ56は、図1の漢語・符号登録部
11に対応するデータベースである。漢語・符号登録5
6には、和語とこれに対応する漢語及び所定の文末表現
に対応する符号などが格納されている。漢語・符号登録
データ56は、和語によって、これに対応する漢語、及
び文末表現によって対応する符号を検索することができ
るようになっている。
【0061】記憶媒体駆動装置46は、着脱可能な記憶
媒体を駆動してデータの読み書きを行うための駆動装置
である。着脱可能な記憶媒体としては、例えば、光磁気
ディスク、磁気ディスク、磁気テープ、半導体メモリ、
データをパンチした紙テープ、CD−ROMなどがあ
る。なお、CD−ROMや紙テープは、読み込みのみ可
能である。
【0062】文末表現簡略装置1は、記憶媒体駆動装置
46によって記憶媒体を駆動することにより、簡略化対
象文2を記録した記憶媒体から簡略化対象文2を取得し
たり、あるいは、生成した簡略化済み文12を記憶媒体
駆動装置に出力することができる。このように、記憶媒
体駆動装置46は、簡略化対象文取得手段として使用す
ることができる。
【0063】入出力インターフェース44は、例えば、
シリアルインターフェースやその他の規格のインターフ
ェースにより構成されている。入出力インターフェース
44に当該インターフェースに対応した外部機器を接続
することにより、文末表現簡略装置1の機能を拡張する
ことができる。このような外部機器として例えば、ハー
ドディスクなどの記憶装置、スピーカ、マイクロフォン
などがある。
【0064】図2(b)は、文末表現簡略プログラム5
0を構成するモジュールを示した図である。文末表現簡
略プログラム50は、文末表現簡略モジュール62、文
字列パタン判定モジュール64、文字種判別モジュール
66などから構成されている。CPU28が文末表現簡
略プログラム50の各モジュールをロードして実行する
ことにより、当該PCは文末表現簡略装置としての機能
を発揮することができる。
【0065】CPU28が文末表現簡略モジュール62
を実行することにより、文末表現簡略部10(図1)が
実現される。更に、CPU28が文字列パタン判定モジ
ュール64、文字種判別モジュール66を実行すること
により、それぞれ文字列パタン判定部6、文字種判別部
8が実現される。
【0066】即ち、図1の文末表現簡略部10、文字列
パタン判定部6、文字種判別部8は、それぞれ文末表現
簡略モジュール62、文字列パタン判別モジュール6
4、文字種判別部8がCPU28によって実行されるこ
とにより、ソフトウェア的に実現される。CPU28は
これらのプログラムに従って動作し、文字列パタン条件
データ54、漢語・符号登録データ56を参照しながら
簡略化対象文2から簡略済み文12を生成する。
【0067】以上、本実施の形態では、1例として文末
表現簡略装置1をPCを用いて実現したが、これに限定
するものではなく、例えばワードプロセッサや携帯電話
その他の端末装置などを用いて実現することができる。
また、文末表現簡略装置1の機能をサーバ装置で実現
し、当該サーバ装置にネットワーク接続した端末装置に
文末を簡略化した文を提供するように構成することもで
きる。
【0068】図3は、文末表現簡略装置1の動作を説明
するためのフローチャートである。まず、CPU28
は、簡略化対象文2を取得する(ステップ10)。これ
は、テキストデータなどで構成された簡略化対象文2
を、例えば、記憶装置48、又は記憶媒体駆動装置46
で駆動された記憶媒体、又は通信制御装置42を介して
ネットワークなどから取得する。
【0069】次に、CPU28は、取得した簡略化対象
文2中の文字列と文字列パタン条件データ54に登録し
た文字列パタンとを比較し、簡略化対象文2中に登録さ
れた文字列パタンがあるか否かを調べる(ステップ1
5)。これは、文字列パタン判定モジュールがCPU2
8によって実行されることにより行われる。
【0070】登録された文字列パタンがない場合は(ス
テップ15;N)、CPU28は、簡略化済み文12を
生成せずに作業を終了する。登録された文字列パタンが
あった場合は(ステップ15;Y)、CPU28は、簡
略化対象文2における当該文字列パタンの出現位置を調
べて取得する(ステップ25)。
【0071】文字列パタンの出現位置が文末でない場合
は(ステップ30;N)、CPU28は、簡略化済み文
12を生成せずに作業を終了する。文字列パタンの出現
位置が文末であった場合は(ステップ30;Y)、CP
U28は、文字列パタンの出現位置の前にある文字の文
字種を判別する(ステップ35)。
【0072】次にCPU28は、簡略化対象文2の文末
に現れる文字列パタンと当該文字列パタンの前に現れる
文字種から簡略化対象文2の文末が簡略化可能か(サ変
活用形など文末の文字列を削除できるか、和語を漢語で
置換するか、或いは符号を用いて簡略化可能かなど)否
かを判断する(ステップ40)。即ち、簡略化対象文2
の文末の文字列パタンが(1)〜(8)の何れからに該
当するか否かを判断する。
【0073】文末のサ変活用形など、文末の文字列を削
除することにより簡略化可能な場合は(ステップ45;
Y)、CPU28は、簡略化対象文2の文末の所定の文
字列を削除して文末表現を簡略化する(ステップ5
0)。なお、この場合は(1)〜(5)、(8)の場合
に該当する。また、簡略化対象文2の文末の和語をこれ
に対応付けられた漢語に置換することにより文末表現を
簡略化する場合は(ステップ45;N)、CPU28
は、当該和語を対応する漢語に置換する(ステップ6
5)。なお、これは(6)の場合に該当する。
【0074】また、文末削除又は漢語に置換することに
よって省略された文字列が「したのだろうか」、「した
のだ」といった所定の符号に対応付けられた表現であっ
た場合(ステップ55;Y)、CPU28は、簡略化し
た文の文末に対応する符号「?」、「!」などを付加す
る(ステップ60)。これは、(7)の場合に該当す
る。
【0075】本実施の形態では、所定の符号に対応付け
られた文末表現の文字列を一旦削除した後(ステップ5
0)、当該削除された文字列に対応する符号を文末に付
加したが(ステップ60)、これに限定するものではな
く、文末表現の文字列に、これに対応する符号が関連付
けられている場合、当該文字列を対応する符号で置換す
るように構成することもできる。
【0076】以上、本実施の形態では、以下のような効
果を得ることができる。簡略化対象文2の文末の文字列
の字面から簡略化可能か否かを判定するため、形態素解
析、構文解析などの大掛かりなシステムが必要なく、文
末の簡略化処理が高速、軽量に実行できる。そのため、
コンピュータで実現した場合、コンピュータのリソース
の消費を低減することができる。
【0077】また、サ変活用形などの文末の文字列パタ
ンとその文字列パタンの前の文字の文字種を合わせて認
識することにより、適切な簡略化した文末表現をえるこ
とができる。また、文章の目次を自動生成する際に目次
らしい表現に置き換えたり、引き締まった印象を与える
箇条書き表現を生成することが可能になる。
【0078】また、小規模なシステムで実現できるため
携帯電話などの携帯端末装置に容易に搭載することがで
きる。更に、予め特定の和語に対応付けられた漢語を登
録しておくことにより、元の文には無かった簡潔な表現
を新たに生成することができる。
【0079】
【発明の効果】本発明によれば、簡単なシステムで文末
表現を簡略化することができる。
【図面の簡単な説明】
【図1】本実施の形態に係る文末表現簡略装置の概念的
な構成を示した図である。
【図2】(a)は、文末表現簡略装置をPCを用いて構
成した場合の構成図であり、(b)は、文末表現簡略プ
ログラムを構成するモジュールを示した図である。
【図3】文末表現簡略装置の動作を説明するためのフロ
ーチャートである。
【符号の説明】
1 文末表現簡略装置 2 簡略化対象文 4 文字列パタン条件部 6 文字列パタン判定部 8 文字種判定部 10 文末表現簡略部 11 漢語・符号登録部 12 簡略化済み文 26 制御部 28 CPU 30 ROM 32 RAM 34 入力装置 38 出力装置 42 通信制御装置 43 バスライン 44 入出力インターフェース 46 記憶媒体駆動装置 48 記憶装置 50 文末表現簡略プログラム 52 その他のプログラム 54 文字列パタン条件データベース 56 漢語・符号登録データベース 60 その他のデータ 62 文末表現簡略モジュール 64 文字列パタン判定モジュール 66 文字種判別モジュール

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文末表現簡略化の対象となる対象文を取
    得する対象文取得手段と、 前記対象文の文末の文字列が所定の文字列パタンである
    であるか否かを判別する文字列パタン判別手段と、 前記対象文の文末の文字列が所定の文字列パタンである
    と、前記文字列パタン判別手段で判別した場合に、前記
    対象文の文末の文字列に前記文字列パタンに対応付けら
    れた所定の処理を施して前記対象文の文末表現を簡略化
    する簡略化手段と、 を具備したことを特徴とする文末表現簡略化装置。
  2. 【請求項2】 前記簡略化手段は、前記文末表現の所定
    の部分を削除することを特徴とする請求項1に記載の文
    末表現簡略化装置。
  3. 【請求項3】 前記所定の部分は、サ変活用形の部分で
    あることを特徴とする請求項2に記載の文末表現簡略化
    装置。
  4. 【請求項4】 前記処理は、前記文字列パタンを、前記
    文字列パタンに対応付けられた所定の表現又は所定の記
    号に置き換えることを特徴とする請求項1、請求項2又
    は請求項3に記載の文末表現簡略化装置。
  5. 【請求項5】 対象文取得手段と、文字列パタン判別手
    段と、簡略化手段を備えたコンピュータにおいて、 前記対象文取得手段で、文末表現簡略化の対象となる対
    象文を取得する対象文取得ステップと、 前記文字列パタン判別手段で、前記取得した前記対象文
    の文末の文字列が所定の文字列パタンであるであるか否
    かを判別する文字列パタン判別ステップと、 前記対象文の文末の文字列が所定の文字列パタンである
    と前記文字列パタン判別手段で判別した場合に、前記簡
    略化手段が、前記対象文の文末の文字列に前記文字列パ
    タンに対応付けられた所定の処理を施して前記対象文の
    文末表現を簡略化する簡略化ステップと、 から構成されたことを特徴とする文末表現簡略化方法。
  6. 【請求項6】 文末表現簡略化の対象となる対象文を取
    得する対象文取得機能と、 前記対象文の文末の文字列が所定の文字列パタンである
    であるか否かを判別する文字列パタン判別機能と、 前記対象文の文末の文字列が所定の文字列パタンである
    と前記文字列パタン判別機能で判別した場合に、前記対
    象文の文末の文字列に前記文字列パタンに対応付けられ
    た所定の処理を施して前記対象文の文末表現を簡略化す
    る簡略化機能と、 を具備したことを特徴とする文末表現簡略化プログラ
    ム。
JP2001262211A 2001-08-30 2001-08-30 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム Pending JP2003076688A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001262211A JP2003076688A (ja) 2001-08-30 2001-08-30 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001262211A JP2003076688A (ja) 2001-08-30 2001-08-30 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム

Publications (1)

Publication Number Publication Date
JP2003076688A true JP2003076688A (ja) 2003-03-14

Family

ID=19089138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001262211A Pending JP2003076688A (ja) 2001-08-30 2001-08-30 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム

Country Status (1)

Country Link
JP (1) JP2003076688A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944497A (ja) * 1995-07-28 1997-02-14 Maruzen Kk タイトル文作成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944497A (ja) * 1995-07-28 1997-02-14 Maruzen Kk タイトル文作成装置

Similar Documents

Publication Publication Date Title
TWI496012B (zh) 管理電子形式之中文、日文及韓文語言資料的模組系統與方法
TW200813755A (en) Enhancing multilingual data querying
JP2004252944A (ja) プログラム、文字入力編集方法、装置及び記録媒体
JP2004280574A (ja) 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体
US7398210B2 (en) System and method for performing analysis on word variants
JP2002222185A (ja) 構造化文書共有装置、構造化文書共有方法及び構造化文書のファイル共有システム
JP2019197336A (ja) 学習データ生成装置、方法、およびプログラム
Harabagiu et al. Acquisition of Linguistic Patterns for Knowledge-based Information Extraction.
JP4109461B2 (ja) 対話システム、対話サーバ、対話方法、及び対話プログラム
JP4221132B2 (ja) 情報処理装置及び方法並びにこれに利用される記憶媒体
JP2003076688A (ja) 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム
JPH07334499A (ja) 文字列入力装置
JP4044644B2 (ja) 電子掲示板システム、電子掲示板プログラムが記憶された記憶媒体、及び電子掲示板の活性化方法
JP2004118461A (ja) 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体
JP7535610B2 (ja) スマート翻訳システム
JP5361708B2 (ja) 多言語データクエリ
JPS60193074A (ja) 日本語解析装置
JP2005018504A (ja) 会議録公開システム
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム
KR20240055290A (ko) 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
KR20240055302A (ko) 문장 템플릿을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
JP2003067368A (ja) 文章処理装置、文章処理方法、及び文章処理プログラム
JPH0232467A (ja) 機械翻訳方式
KR20240055309A (ko) 논문 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
JPH05189421A (ja) 古文かな漢字変換装置及び方法