JP2000250907A - 文書処理装置および記録媒体 - Google Patents

文書処理装置および記録媒体

Info

Publication number
JP2000250907A
JP2000250907A JP11049722A JP4972299A JP2000250907A JP 2000250907 A JP2000250907 A JP 2000250907A JP 11049722 A JP11049722 A JP 11049722A JP 4972299 A JP4972299 A JP 4972299A JP 2000250907 A JP2000250907 A JP 2000250907A
Authority
JP
Japan
Prior art keywords
word
document
unit
sentence
replacement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11049722A
Other languages
English (en)
Inventor
Kengo Omura
賢悟 大村
Tomoko Okuma
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP11049722A priority Critical patent/JP2000250907A/ja
Publication of JP2000250907A publication Critical patent/JP2000250907A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ユーザの要望に応じて文書の文体を変更す
る。 【解決手段】 処理後の文書の文体から受ける印象を決
定するための印象情報が印象情報入力手段101から入
力されると、その印象情報に対応する単語が感性データ
ベース100から検索手段102によって検索され、置
換可能性判定手段105に供給される。文書入力手段1
03から入力された処理対象文書は、単語特定手段10
4によって置換の対象となる単語が特定される。置換可
能性判定手段105は、単語特定手段104によって特
定された単語を、検索手段102から供給された単語に
よって置換可能であるか判定し、置換可能である場合に
は置換手段106にその旨を通知する。置換手段106
は、単語セットデータベース107と呼応関係単語デー
タベース108とを参照しつつ、単語特定手段104に
よって特定された単語を、検索手段102から供給され
た単語によって置換する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ワードプロセッサ
やコンピュータ等に入力された電子文書に対して、文書
作成者が要望する印象をもたらすように、元の文章の文
体を簡単に変更することができる文書処理装置に関す
る。
【0002】
【従来の技術】近年、ワードプロセッサやパーソナルコ
ンピュータの普及により、電子化された文書が扱われる
機会が増加しつつある。
【0003】このように文書を電子化すると、文書に記
述された内容としての文章に対して種々の処理を施すこ
とが可能となる。そのような処理の一例として、例え
ば、文体の変更処理を挙げることができる。
【0004】従来における文体変更装置は、主として、
ワードプロセッサなどの文書処理編集装置と連動して利
用することを前提としたものであり、その目的は、主
に、常識的にみて不適切ではない文章や、読みやすい文
章を作成するための支援機能を提供することにあった。
【0005】例えば、「です・ます」調と「である・
だ」調が混在する文章は、フォーマルな文書では不適切
であるとされるが、作成された文章から文体を損ねる文
を見つけて修正するのは時間を要し、また、しばしば見
落としも生じる。
【0006】特開平1−321553号公報に記載され
た「文体変換機能付き日本語処理方法」はこの作業を代
行する技術の一例であり、文章作成時に、作成者自身
が、文体の不統一をマニュアル操作でチェックしなくて
も自動的に文体を統一でき、さらに必要に応じて、文章
を任意の文体に変更できる方法を提供したものである。
【0007】この種の関連技術例としては、例えば、特
開平3−175569号公報や特開平9−274615
号公報などに開示されているように、日本語ワードプロ
セッサのかな漢字変換処理機能に文体変換処理を連動さ
せることによって、文体の統一性を損ねるような文が入
力された場合には、即座にそれを検出して適切な表現に
書き換えることができる文体変換装置もある。こうした
装置では、文章作成後に文体の統一性のチェックを行な
う手間が省けるという効果がある。
【0008】更に、ワードプロセッサのペースト機能を
利用して、他の文書から作成中の文書に文章を転記した
際に、文体上の統一性が損なわれることがしばしば起こ
るが、特開平7−85038号公報に記載された「文書
作成装置及び同装置のペースト処理方法」では、転記さ
れた文章の文体を編集中の文書の基調文体に自動的に訂
正するような機能が提供されている。
【0009】
【発明が解決しようとする課題】ところで、文章を作成
した後で、その文体のもたらす印象が、本人の要望や嗜
好にそぐわないという理由で、文章の内容は変えずに文
体のみを変更したいことがある。例えば、手紙文を書い
た後で、その文体がどこかよそよそしく、暖かみに欠
け、自分の思いが相手に巧く伝わりそうにないと感じる
ことがある。このようなことは、例えば、文例集など他
者によって書かれた文章を利用して、文章を作成した場
合にしばしば生じる問題である。
【0010】しかし、従来の文体変換装置では、文書作
成者が要望する印象をもたらすように、元の文章の文体
を簡単に変更することができないという問題点があっ
た。そのために、文章作成者は、所望する印象(例え
ば、暖かで、親愛な感じ)をもたらすような文章表現を
求めて、推敲を重ねたり、何度も書き直しをしなければ
ならなかった。
【0011】また、同じ内容の事柄を複数の相手に向け
て通知しようとする場合は、文書をひとつ作成して、そ
れを複写してから送付するのが一般的である。しかし、
時には、受け手ひとりひとりの嗜好や要望や、送り手と
受け手との関係等の違いを考慮して、文書の文体をそれ
ぞれ個々に変える必要がある場合もある。
【0012】しかし、従来、このような場合には、文書
作成者自身がもとの文書を編集し直さなければならず、
その作業に時間を要するという問題があった。本発明
は、以上の事情に鑑みてなされたものであり、文書作成
者が要望する印象をもたらすように元の文章の文体を簡
単に変更することができる文体変換装置を提供すること
を目的とする。
【0013】
【課題を解決するための手段】本発明では上記課題を解
決するために、処理対象となる文書を入力して所定の処
理を施す文書処理装置において、単語と、その単語から
受ける印象を数値化した印象値とを関連付けて記憶した
感性データベースと、処理後の文の印象を決定する印象
情報の入力を受ける印象情報入力手段と、前記印象情報
入力手段から入力された印象情報に対応する単語を、前
記感性データベースから検索する検索手段と、処理対象
となる文書の入力を受ける文書入力手段と、前記文書入
力手段から入力された文書から、処理の対象となる単語
を特定する単語特定手段と、前記単語特定手段によって
特定された単語を、前記検索手段によって検索された単
語によって置換可能か否かを判定する置換可能性判定手
段と、前記置換可能性判定手段によって置換が可能であ
ると判定された場合には、文書内の該当する単語を、検
索された単語によって置換する置換手段とを有すること
を特徴とする文書処理装置が提供される。
【0014】ここで、感性データベースは、単語と、そ
の単語から受ける印象を数値化した印象値とを関連付け
て記憶している。印象情報入力手段は、処理後の文の印
象を決定する印象情報の入力を受ける。検索手段は、印
象情報入力手段から入力された印象情報に対応する単語
を、感性データベースから検索する。文書入力手段は、
処理対象となる文書の入力を受ける。単語特定手段は、
文書入力手段から入力された文書から、処理の対象とな
る単語を特定する。置換可能性判定手段は、単語特定手
段によって特定された単語を、検索手段によって検索さ
れた単語によって置換可能か否かを判定する。置換手段
は、置換可能性判定手段によって置換が可能であると判
定された場合には、文書内の該当する単語を、検索され
た単語によって置換する。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明の動作原理を説明
する原理図である。この図において、感性データベース
100は、単語と、その単語から受ける印象を数値化し
た印象値とを関連付けて記憶している。
【0016】印象情報入力手段101は、処理後の文の
印象を決定する印象情報の入力を受ける。検索手段10
2は、印象情報入力手段101から入力された印象情報
に対応する単語を、感性データベース100から検索す
る。
【0017】文書入力手段103からは、処理の対象と
なる文書が入力される。単語特定手段104は、文書入
力手段103から入力された文書から、処理の対象とな
る単語を、例えば、形態素解析法を用いて特定する。
【0018】置換可能性判定手段105は、単語特定手
段104によって特定された単語を、検索手段102に
よって検索された単語によって置換可能か否かを判定す
る。置換手段106は、置換可能性判定手段105によ
って置換が可能であると判定された場合には、文書内の
該当する単語を、検索された単語によって置換する。
【0019】単語セットデータベース107は、相互に
置換可能な単語群を単語セットとして記憶しており、置
換手段106が置換処理を実行する際に、該当するデー
タを読み出して供給する。
【0020】呼応関係単語データベース108は、相互
に呼応関係を有する単語を関連付けて記憶しており、置
換手段106が置換処理を実行する際に、該当するデー
タを読み出して供給する。
【0021】次に、以上の原理図の動作について説明す
る前に、本発明の基本的な原理の概要について説明す
る。文体印象を規定する表現上の要素は数多くあるが、
例えば、所定の品詞の単語を他の単語に置換することに
よっても、文の印象を変えることができる。例えば、動
詞である「食べる」を「食う」や「食する」に変更した
場合がそれである。また、接続詞である「だけど」を
「しかし」や「しかしながら」に変更した場合にも文の
印象は異なることになる。
【0022】特に、文末に付加される助動詞、助詞、く
だけた口語的文末表現(以下、文末付属語)の種類によ
っても、その印象が大きく変わることが知られている。
例えば、「ブラームスの音楽はすばらしい」という文
に、終助詞「わ」を付加した場合には、女性的な印象の
文体になるが、終助詞「ぜ」を付加した場合には、男性
的な印象を与える文体になる。
【0023】本発明の文書処理装置は、このような単語
の置換処理を、ユーザの要望に応じて一括して実行する
ことにより、その文体から受ける印象を適宜変更する。
なお、以下では、文末付属語を置換の対象とした場合に
ついて説明を行う。
【0024】ところで、文の終わりに来る助詞(終助
詞、間投助詞、感動を表す助詞)には、「ね」、
「な」、「よ」、「や」、「さ」、「ぞ」、「ぜ」、
「わ」、「か」、「の」、「もの」、「とも」、「かし
ら」、「こと」、「やら」、「っけ」等多数の種類があ
り、これらは、それぞれ異なる話者の態度や情意を示す
と言われており、会話文、文芸作品、広告文などによく
使われている。また、「じゃん」、「もん」などの口語
的な文末表現も、若者を中心によく使われている。
【0025】図1に示す感性データベース100を構成
する方法としては、感性計測手法として心理学や感性工
学の領域で用いられてきたセマンティック・ディファレ
ンシャル法を用いて、文末にこれらの付属語(以下、ま
とめて終助詞と呼ぶ)を付加した場合に、どのような種
類の印象がどの程度に喚起されるかを、日常標準語を使
用している多くの人たちを被験者にして定量的に測定
し、各終助詞の印象スコア(印象評価値)を取得し、終
助詞と印象スコアとを相互に関連付けて記憶することに
より構成することができる。
【0026】なお、感性データベース100内には、文
末に終助詞を付加しない場合の印象スコアも格納してい
るので、利用者の要望によっては、終助詞を付加しない
表現(無付加)に文体が変換される場合もある。
【0027】印象情報入力手段101から入力される印
象情報としては、例えば、「男性的な−女性的な」とい
う要素に対して、「非常に男性的な=1」、「やや男性
的な=2」、「どちらでもない=3」、「やや女性的な
=4」、「非常に女性的な=5」の何れかを選択して入
力する。いま、「非常に男性的な=1」が選択されたと
すると、この値は検索手段102に供給される。検索手
段102は、「非常に男性的な」印象スコアを有する終
助詞(例えば、「ぜ」)を感性データベース100から
検索し、置換可能性判定手段105に供給する。
【0028】また、このとき、文書入力手段103か
ら、処理対象の文書が入力されたとすると、この文書は
単語特定手段104に供給される。例えば、処理対象の
文書として「私は新宿に買い物に行くね。帰りはたぶん
遅くなるわ。」という文書が入力されたとすると、この
文書は単語特定手段104に供給される。
【0029】単語特定手段104は、置換の対象となる
終助詞を特定する。先の例では、「私は新宿に買い物に
行くね。」の「ね」と、「帰りはたぶん遅くなるわ。」
の「わ」が特定される。
【0030】置換可能性判定手段105は、単語特定手
段104によって特定された「ね」「わ」が、検索手段
102によって検索された「ぜ」によって置換可能であ
ることから、置換可能である旨を置換手段106に通知
する。
【0031】置換手段106は、置換可能性判定手段1
05の判定結果を参照して置換が可能であることを認知
し、置換処理を実行する。このとき、置換手段106
は、呼応関係単語データベース108を参照して、呼応
関係を有する単語が処理対象となる文中に存在している
か否かを判定する。なお、呼応関係とは、例えば、終助
詞として「ぜ」が使用された場合、代名詞としては男性
的な代名詞である「俺」等を用いることが望まいが、こ
のような関係を呼応関係と呼ぶ。
【0032】置換手段106は、第1番目の文である
「私は新宿に買い物に行くね。」の「ね」を「ぜ」に置
換するとともに、呼応関係を有する代名詞「私」を、例
えば、「俺」に置換する。その結果、第1番目の文は、
「俺は新宿に買い物にいくぜ。」に変換される。
【0033】次に、置換手段106は、第2番目の文で
ある「帰りはたぶん遅くなるわ。」に対する置換処理を
実行する。第2の文の場合も「わ」が「ぜ」に置換可能
であるが、同一の終助詞が繰り返し登場するのは、表現
が単調になって好ましくない場合が多いので、置換手段
106は、単語セットデータベース107に記憶されて
いる相互に置換可能な単語群である単語セットを参照
し、「ぜ」と置換可能な「ぞ」を選択し、置換処理を実
行する。その結果、第2番目の文は、「帰りはたぶん遅
くなるぞ。」に変換されることになる。なお、単語セッ
トを用いて終助詞を使い分ける場合には、例えば、単語
セットを構成する各単語に対して出現頻度や優先度等を
付与しておき、それらの値に応じて使い分けを行うよう
にすれば、自然な文を得ることができる。
【0034】置換手段106の置換処理の結果、文書入
力手段103から入力された「私は新宿に買い物に行く
ね。帰りはたぶん遅くなるわ。」という文は、「俺は新
宿に買い物にいくぜ。帰りはたぶん遅くなるぞ。」に変
換されることになる。
【0035】以上に示したように、本発明に係る文書処
理装置によれば、ユーザが要望の指定を変更しない限
り、同一の文末付属語が選定され、それによって文末表
現が変更されるので処理対象となる文書を、ユーザが要
望する印象をもたらすように統一的に変更することがで
きる。
【0036】また、単語セットデーターベース107に
より、同一の終助詞が繰り返し出現することを防止する
ようにしたので、ユーザが要望する印象に合致し、かつ
多様な終助詞を含む自然な文体変更が可能となる。
【0037】更に、呼応関係単語データベース108に
より、終助詞と呼応関係を有する代名詞等を一括して置
換するようにしたので、より自然な文への変換が可能と
なる。
【0038】次に、本発明の実施の形態の構成例につい
て説明する。図2は、本発明に係る文書処理装置の実施
の形態の構成例を示すブロック図である。この図におい
て、変換前文字列入力部1は、文体変換を行おうとする
文字列を入力し、入力した文字列を文末表現解析部2
(形態素解析部21、解析用辞書22、単語列・単語情
報記憶部23、単語情報読み込み部24、終助詞抽出部
25、接続情報抽出部26、性別表現・待遇表現抽出部
27からなる)へ送る。
【0039】形態素解析部21は、解析用辞書22を用
いて、変換前文字列入力部1より受け取った文字列に対
して形態素解析を施し、文字列を単語(句読点等区切り
記号も含む)に分けるとともに、各単語の表記、品詞
名、活用形に関する単語情報を獲得し、その結果を単語
列・単語情報記憶部23に供給する。
【0040】単語列・単語情報記憶部23は、形態素解
析部21から受け取った単語列と単語情報を記憶する。
単語情報読み込み部24は、単語列・単語情報記憶部2
3に記憶された単語情報を読み込み、句点や引用符を検
出した後、文単位に区切った単語情報を、終助詞抽出部
25、接続情報抽出部26、及び、性別表現・待遇表現
抽出部27にそれぞれ供給する。
【0041】終助詞抽出部25は、単語情報読み込み部
24より受け取った単語情報と、図示しない終助詞リス
トとを照合することによって、文中の終助詞の有無を判
定するとともに、終助詞が存在する場合にはその種類を
同定して、結果を接続情報抽出部26へ送る。
【0042】接続情報抽出部26は、終助詞抽出部25
より受け取った結果に基づき、終助詞が検出された場合
にはその終助詞が接続する単語に関する単語情報(表
記、品詞名、及び、活用形)を、また、終助詞が検出さ
れなかった場合には文末単語の単語情報を、単語情報読
み込み部24より受け取った単語情報から検出し、その
結果を性別表現・待遇表現抽出部27に供給する。
【0043】性別表現・待遇表現抽出部27は、単語情
報読み込み部24より受け取った単語情報と、図示しな
い性別・待遇単語リストとを照合することによって、性
別単語(男言葉、女言葉)、待遇表現(敬語、非礼な単
語等)の有無を判定するとともに、これらが存在する場
合にはその種類を同定し、接続情報抽出部26より受け
取った結果と合わせて、解析結果として変更可能性判定
部3(終助詞付加・置換可能性判定部31、接続規則テ
ーブル32、修正表現検索部33、及び、修正表現DB
(Data Base)34からなる)へ送る。
【0044】感性検索部4は、印象要望値入力部41、
終助詞候補検索部42、終助詞感性DB43、および、
終助詞削除判定部44から構成される。印象要望値入力
部41は、どのような印象の文体に変換したいかという
利用者の要望に対応した印象要望値の入力を行い、入力
された印象要望値を終助詞候補検索部42へ送る。
【0045】終助詞感性DB43は、終助詞毎に、それ
らを文末に付加した場合に人がどのような種類の印象を
どの程度の強度で喚起するかを表した印象スコア(及
び、終助詞の無付加条件の印象スコア)を示すデータを
格納している。
【0046】終助詞候補検索部42は、印象要望値入力
部41から受け取った印象要望値と、終助詞感性データ
ベース43に格納された印象スコアとに基づき、変換用
終助詞候補を検索し、その結果を終助詞削除判定部44
へ送る。
【0047】終助詞削除判定部44は、終助詞候補検索
部42から受け取った検索結果が「終助詞無付加」か否
かを判定する。「終助詞無付加」と判定された場合に
は、表現変更部5に終助詞の削除処理を実行するように
指示する。一方、そうでない場合には、検索された終助
詞を変更可能性判定部3(終助詞付加・置換可能性判定
部31、接続規則テーブル32、修正表現検索部33、
および、修正表現DB34からなる)に通知する。
【0048】終助詞付加・置換可能性判定部31は、終
助詞接続規則テーブル32を参照することにより、感性
検索部4から受け取った終助詞に関する接続条件を抽出
し、抽出した接続条件と文末表現解析部2より受け取っ
た解析結果とを照合して、感性検索部4から受け取った
終助詞を用いて入力文の文末表現を変更可能かどうかを
判定する。変更可能と判定された場合には、表現変更部
5に終助詞の付加処理または置換処理を実行するように
指示する。変更不可能と判定された場合には、感性検索
部4に対して、次候補の検索を行うように指示する。
【0049】修正表現検索部33は、感性検索部4から
送られてきた終助詞が、終助詞付加・置換可能性判定部
31においてそのままの表現では付加または置換できな
いと判定された場合に、その終助詞候補を用いた修正表
現を、修正表現DB34より検索し、それを再び終助詞
付加・置換可能性判定部31に提供する。ここで、終助
詞候補を用いた修正表現とは、例えば、「だぜ」のよう
に、終助詞の前に助動詞を付加した表現であり、このよ
うな修正表現を用いることで、例えば、終助詞「ぜ」だ
けでは接続できない文でも接続が可能となる。
【0050】表現変更部5は、単語列・単語情報記憶部
23に記憶された単語列を文単位で読み込み、終助詞付
加・置換可能性判定部31と、終助詞削除判定部44の
それぞれから受け取った指示情報に従って、各文に対し
て、終助詞の置換、付加、削除処理を実行する。
【0051】性別表現・待遇表現一致処理部51は、変
更可能性判定部3において、ある終助詞またはそれを用
いた修正表現により、入力文を変更することができると
判定された場合に、性別表現・待遇表現抽出部27で抽
出された性別表現や待遇表現を、図示しない置換用表現
テーブル内の情報と照合することにより、文末以外の単
語列中に終助詞と連動して置換可能な表現があるかどう
かを判定し、置換すべき単語があると判定された場合に
は、表現変更部5に対して置換処理の実行を指示する。
これにより、終助詞を付加、置換した場合には、それに
相応しい語彙を用いた文体変換が可能になる。変換後文
字列表示部6は、表現変更部5において変換処理を終え
た文字列を表示する。
【0052】次に文体変換を行うときの文体変換装置の
動作を、図を参照して説明する。文体変換処理は、利用
者からの印象要望値の入力と、変換前文字列の指定を受
けて始まる。図3は、文末表現解析部2において実行さ
れる文末表現解析処理の流れを示すフローチャートであ
る。このフローチャートが開始されると、以下の処理が
実行されることになる。 [S1]変換前文字列入力部1は、変換前の文字列を読
み込む。 [S2]形態素解析部21は、読み込んだ文字列に対す
る形態素解析処理の実行を開始する。 [S3]形態素解析部21は、解析により文字列を単語
列に分節化するとともに、各単語の表記、品詞名、活用
形を獲得し、単語列・単語情報記憶部23に記憶させ
る。
【0053】例えば、「桜が咲いたわね。とてもきれい
よ。」という文が形態素解析されると、 桜:桜,名詞// が:が,格助詞// 咲い:咲く,動
詞,連用形// た:た,助動詞,終止形// わ:終助詞
// ね:ね,終助詞// 。:。,句点// とても:とて
も,副詞// きれい:きれいだ,形容動詞,語幹//
よ:終助詞// 。:。,句点// という結果が得られる。 [S4]単語情報読み込み部24は、単語列・単語情報
記憶部23に記憶されている情報から、句点(。.)あ
るいは引用符(「」)を同定する。 [S5]単語情報読み込み部24は、句読点の後に番号
を挿入する。
【0054】例えば、上で挙げた例の場合では、 桜:桜,名詞// が:が,格助詞// 咲い:咲く,動
詞,連用形// た:た,助動詞,終止形// わ:終助詞
// ね:ね,終助詞// 。:。,句点// とても:とても,副詞// きれい:きれいだ,形容動
詞,語幹// よ:終助詞// 。:。,句点// となり、文を構成する単語列及び単語情報が同定され
る。 [S6]終助詞抽出部25は、単語情報読み込み部24
から供給された単語列から、終助詞を検出する。
【0055】即ち、終助詞抽出部25は、供給された単
語列及び単語情報を一連の終助詞検出フィルタに文頭側
から文末に向かって順に読み込み、各種終助詞の検出結
果を所定の場所である結果記録テーブル(図示せず)に
記録する。なお、結果記録テーブルは、文末表現解析部
2および感性検索部4の共通の資源であり、双方からア
クセス可能とされている。
【0056】この終助詞検出フィルタは、例えば、
「よ」、「ね」、「な」、「さ」、「わ」、「ぞ」等の
各終助詞毎に、読み込まれた単語列及び単語情報をマッ
チングするアルゴリズムによって構成される。また、終
助詞が連続する場合(例えば、「よね」、「かな」・・
・)には、それぞれの終助詞を分離して検出する。
【0057】なお、連続する終助詞を検出した場合、文
頭側から順に、第1終助詞、第2終助詞、・・・と呼
ぶ。この終助詞検出処理により、例えば、上の例文で
は、以下の結果が得られる。
【0058】 文→第1終助詞:「わ」、第2終助詞:「ね」 文→第1終助詞:「よ」 [S7]終助詞抽出部25は、入力文が疑問文であるか
否かの検出を行う。
【0059】即ち、終助詞抽出部25は、各文毎に、検
出されている終助詞と、「か」、「かしら」とを照合
し、何れかを検出した場合には、その文を疑問文と判定
し、結果を結果記録テーブルに記録する。 [S8]終助詞抽出部25は、入力文が禁止文であるか
否かの検出を行う。
【0060】即ち、終助詞抽出部25は、各文毎に、第
1終助詞と「な」とを照合する。照合した場合には、
「な」の直前の単語の品詞と活用形を読み出し、それ
が、「動詞:終止形」、「助動詞:れる、られる、せ
る、させる、しめる、ます、たがる」の何れかに相当す
るか否かを、例えば、マッチングアルゴリズムにより同
定する。そして、マッチした場合には、その文を禁止文
と判定し、結果記録テーブルに記録する。 [S9]終助詞抽出部25は、入力文が平叙文であるか
否かの検出を行う。
【0061】即ち、終助詞抽出部25は、入力文が疑問
文、禁止文にも該当しない場合には平叙文とし、結果記
録テーブルに記録する。 [S10]終助詞抽出部25は、平叙文と判定された文
に終助詞が付加されているか否かを判定し、付加されて
いる場合にはステップS11に進み、それ以外の場合に
はステップS12に進む。 [S11]接続情報抽出部26は、平叙文と判定された
文から終助詞の接続情報を獲得する。
【0062】即ち、接続情報抽出部26は、第1終助詞
の直前の単語の表記、品詞名、活用形を獲得する。 [S12]接続情報抽出部26は、平叙文と判定された
文から文末単語の表記、品詞名、活用形を獲得する。
【0063】以上の処理により、先の例文から以下の結
果が得られる。 文→|<終助>第1:「わ」、第2:「ね」、|<文
種>平叙|<接続>た:た,助動詞,終止形 文→|<終助>第1:「よ」、|<文種>平叙|<接
続>きれい:きれいだ,形容動詞,語幹 [S13]性別表現・待遇表現抽出部27は、全ての文
に対して、男性語や女性語、敬語表現や逆に極端に粗野
な表現などの終助詞以外の単語を検出する。
【0064】例えば、一人称代名詞を例に挙げれば、
「あたし、あたい、わたくし」等は主として女性に使わ
れており、「僕、ぼく、俺、おいら、わし、儂、小生、
我が輩、・・・」等は、男性によって独占的に使われ
る。
【0065】ステップS13の処理では、予め登録した
このような単語をマッチングアルゴリズムにより検出し
て結果記録テーブルに記録する。以上で、入力文字列に
対する文末表現の解析は完了し、処理が終了したことが
感性検索部4へ伝達される。
【0066】次に、感性検索部4の処理の流れについ
て、図4に示すフローチャートを参照して説明する。図
4に示すフローチャートが開始されると、以下の処理が
実行されることになる。 [S20]終助詞候補検索部42は、前述した結果記録
テーブルから、最初の文の文種(平叙、疑問、禁止)を
読み込む。 [S21]終助詞候補検索部42は、検索の対象となる
終助詞の種類を限定する。
【0067】例えば、対象となる文が疑問文である場合
に検索可能な終助詞のセットは、「か」、「かしら」、
「ね」、「な」、「よ」、「や」、「のう」、「っ
け」、「い」、「え」、「って」等に限定され、
「さ」、「ぞ」、「ぜ」、「わ」、「の」等の「か」と
接続しない助詞は、検索対象から除かれる。
【0068】次に、禁止文である場合には、検索可能な
終助詞は、「よ」、「な」、「や」、「い」、「え」、
「って」等に限定される。更に、平叙文の場合には、
「か」、「かしら」を除く全ての終助詞と、それらに加
えて「終助詞無付加(終助詞を付加しない表現)」が検
索対象となる。 [S22]終助詞候補検索部42は、判別関数(U1(x)
〜Un(x))のセットを終助詞感性DB43から呼び出
す。なお、判別関数(U1(x)〜Un(x))のセットとして
は、以下のような式を用いることができる。
【0069】
【数1】
【0070】ここで、Cはある終助詞を他の終助詞から
最もよく判別するための重み係数を表す。さらに、α
は、各関数に与えられた定数値である。これらの判別関
数は、終助詞と印象との関係を規定する関数であり、例
えば、式(1−1)は終助詞「よ」、式(1−2)は終
助詞「ね」、式(1−3)は終助詞「ぜ」のように、各
助詞及び助詞無付加に対応づけられている。
【0071】本実施の形態においては、これらの判別関
数は、予め多人数の被験者に対して、文末に各助詞を付
加した場合にどのような印象がどの程度の強さで生じる
かを、反意語からなる形容詞や形容動詞のペアを用いて
5段階(例えば、「非常に明るい」=5、「やや明る
い」=4、「どちらともいえない」=3、「やや暗い」
=2、「非常に暗い」=1)で評価してもらい、その評
価結果に対して重判別分析を適用することにより導出し
た。 [S23]終助詞候補検索部42は、ステップS22に
おいて呼び出した判別関数U(x)のx1〜xnに、利用者が
印象要望値入力部41から入力した印象要望値y1〜yn
を設定して計算を行う。 [S24]終助詞候補検索部42は、前述した判別関数
のセットから最大値をとる関数を同定する。 [S25]終助詞候補検索部42は、ステップS21に
おいて限定した終助詞の中から、最大値をとる関数に対
応した終助詞(あるいは、終助詞無付加の表現)を終助
詞感性DB43より検索して、それをテーブルに書き込
む。
【0072】以上の処理を、具体例をあげて説明する
と、以下のようになる。例えば、いま利用者が、「桜が
咲いたわね。とてもきれいよ。」という文の文体を、
「非常に男性的で、かつ、非常に動きのある」印象の文
体に変更したいと考えているとする。本実施例では、要
望する印象を指定するための入力装置は、「男性的な─
女性的な」、「フォーマルな─インフォーマルな」、
「明るい─暗い」、「若い─年寄りじみた」、「親しい
─よそよそしい」、「インパクトのある─インパクトの
ない」、「静的な─動的な」等の各印象特性に関して、
例えば、「非常に男性的な=1」、「やや男性的な=
2」、「どちらでもない=3」、「やや女性的な=
4」、「非常に女性的な=5」のように、5段階でその
強度を指定できるように構成されている。利用者が望む
印象は、「非常に男性的で、非常に動きのある」印象の
文体なので、例えば、<1,3,3,3,3,3,5>
のように数値指定を行う。
【0073】本実施の形態では、これらの数値を受け取
り、前述の判別関数のx1〜x(n=7)に代入して計算
を行い、ステップS24において、最大値を示す関数に
対応する終助詞を検索結果として取り出す。
【0074】例えば、上の例では、<1,3,3,3,
3,3,5>の入力に対して、8番目の判別関数、U8
(x)が最大値を示したとする。この判別関数は、例え
ば、終助詞「ぜ」に対応するので、「ぜ」が利用者の要
望を最も満たす終助詞として検索される。以上の処理を
入力文に対応して行い、検索された終助詞を文番号に対
応付けて保存する。前述の例では、2文とも、平常文な
ので、検索結果は、文「ぜ」、文「ぜ」と同じもの
になる。
【0075】なお、終助詞感性DB43には、既に述べ
たように、印象計測実験における平均評価値や、印象評
価結果に対して因子分析を適用して獲得される各終助詞
の因子得点も格納しているので、利用者からの要望値に
最も近い終助詞を次式に基づいて検索することもでき
る。
【0076】
【数2】
【0077】ここでDi2は、ある終助詞に関する登録済
みの印象評価スコアベクトルX(x1〜xn)と、利用者
が指定した印象要求値ベクトルY(y1〜yn)間の距離を
示すものである。従って、これらの距離を全ての終助詞
に関して計算を行い、その値が最小の終助詞を選択する
という方法でも、利用者の要望に合致した印象をもたら
す終助詞を検索することができる。 [S26]終助詞候補検索部42は、検索したものが終
助詞か否かを判定し、終助詞の場合にはステップS27
に進み、それ以外の場合にはステップS28に進む。
【0078】即ち、本実施例では、平常文に対する終助
詞のセットの中には、終助詞を付加しない表現(終助詞
無付加)も含んでいる。この「終助詞無付加」が検索さ
れた場合には、入力文の文末に終助詞が付加されている
場合には、これを削除しなければならない。一方、何ら
かの終助詞が選択された場合には、入力文に対して終助
詞の付加処理か置換処理を行う必要がある。ステップS
26は、これを決定する処理であり、検索された表現
と、「終助詞無付加」とをマッチングすることにより、
終助詞利用か、終助詞無付加かが決定される。 [S27]終助詞候補検索部42は、検索された終助詞
を変更可能性判定部3へ供給する。 [S28]終助詞候補検索部42は、表現変更部5に対
して終助詞の削除処理を指示する。なお、疑問文、禁止
文に対する終助詞セットの中には、「終助詞無付加」の
表現は含まれていない。従って、疑問の「か」や禁止の
「な」が、変更後の文末から消えることはなく、疑問や
禁止の文意が維持される。
【0079】次に、変更可能性判定部3の処理の流れに
ついて、図4に示すフローチャートを参照して説明す
る。なお、以下の処理は、変更可能性判定部3が感性検
索部4から検索された終助詞を受け取ることによって開
始される。 [S30]終助詞付加・置換可能性判定部31は、結果
記録テーブルから入力文の接続情報を取り出す。
【0080】いま、結果記録テーブルには、例えば、
「桜が咲いたわね。とてもきれいよ。」という2つ
の入力文に対して、「た:た,助動詞,終止形」、
「きれい:きれいだ,形容動詞,語幹」が得られている
ので、まず文の接続情報を取り出す。 [S31]終助詞付加・置換可能性判定部31は、接続
規則テーブル32を参照し、取り出した接続情報から接
続不可能な終助詞をすべてリストアップする。
【0081】終助詞の接続可能性については、必ずしも
明確ではないものもあるが、古くから各種の文法書や研
究書などで明らかにされているので、接続規則テーブル
はそれらを参考に作成することができる。
【0082】図6に、終助詞接続規則テーブルの一部を
示す。これは、各種の助動詞と終助詞が連接可能か否か
をチェックするものである。上の例では、助動詞「た」
の終止形に接続不可能な終助詞は、禁止の「な」だけで
あることがわかる。 [S32]終助詞付加・置換可能性判定部31は、既に
説明した感性検索処理によって各文に対して検索された
終助詞と、リストアップされた終助詞とを照合する。 [S33]終助詞付加・置換可能性判定部31は、ステ
ップS32の照合により、各文に対して検索された終助
詞が、リストアップされた終助詞に含まれているか否か
を判定し、含まれている場合にはステップS35に進
み、それ以外の場合にはステップS34に進む。 [S34]終助詞付加・置換可能性判定部31は、結果
を表現変更部5に供給し、表現変更処理を実行させる。 [S35]終助詞付加・置換可能性判定部31は、修正
表現検索部33を制御し、既に獲得している品詞名、活
用形を手がかりにして修正表現を修正表現DB34から
検索させる。 [S36]終助詞付加・置換可能性判定部31は、接続
可能な修正表現が存在する場合にはステップS37に進
み、それ以外の場合にはステップS38に進む。 [S37]終助詞付加・置換可能性判定部31は、修正
表現を表現変更部5に供給して、表現変更処理を実行さ
せる。 [S38]終助詞付加・置換可能性判定部31は、感性
検索部4に対して次候補の終助詞の検索を指示し、ステ
ップS32に戻って同様の処理を繰り返す。
【0083】具体例をあげて説明するなら、いま、文
「桜が咲いたわね。」と、文「とてもきれいよ。」の
それぞれに対して、いずれも終助詞「ぜ」が感性検索部
4によって検索されているとすると、接続規則表を参照
することにより、文は、接続可能と判定され[助動詞
た+ぜ]、文は、接続不可能と判定される[形容動詞
語幹(きれい)+ぜ:接続不可能]。文のように、接
続不可能という判定がなされた場合には、ステップS3
5において、既に獲得している接続情報を、修正表現検
索部33へ送り、その接続条件で接続可能な修正表現の
中に、接続不可能と判定された前述の終助詞を使った表
現が含まれているか否かをマッチング処理により判定す
る。
【0084】例えば、文の場合には、まず、接続情報
「形容動詞語幹(きれい)」という情報を、修正表現検
索部33に送って、「わ→だわ、ぞ→だぞ、ぜ→だぜ、
な→だな、っけ→だっけ、のう→だのう、こと→だこと
・・・」を修正表現DB34からリストアップする。こ
れにより、「ぜ」とマッチングする修正表現が見つかる
ので、「だぞ」という修正表現を用いれば、文を変更で
きることが確認される(「きれいだぜ」)。
【0085】ここで、接続可能な表現が見つからない場
合には、ステップS38において、感性検索部4に対し
て、次候補(判別関数値が2番目に大きいもの)の検索
を指示する(そのプロセスの説明は省略する)。すべて
の入力文に対して、以上の処理を終えたら、結果を表現
変更部5へ伝える。
【0086】次に、表現変更部5における処理の流れに
ついて、図7に示すフローチャートを参照して説明す
る。このフローチャートが開始されると、以下の処理が
実行される。 [S40]表現変更部5は、終助詞付加・置換可能性判
定部31の処理結果を入力し、文番号(=1〜n)毎に
分けて記録する。 [S41]表現変更部5は、終助詞の削除の指示がある
か否かを判定し、指示がある場合にはステップS42に
進み、それ以外の場合にはステップS44に進む。 [S42]表現変更部5は、終助詞の削除が指示された
単語列を獲得する。 [S43]表現変更部5は、入力文から検出した全ての
終助詞(第1終助詞及びそれ以外の終助詞)を削除して
処理を終える(エンド)。 [S44]表現変更部5は、各文の文種を参照して、入
力文が、平叙文、禁止文、疑問文の何れであるかを同定
し、平叙文である場合にはステップS45に進み、禁止
文である場合にはステップS49に進み、また、疑問文
である場合にはステップS54に進む。 [S45]表現変更部5は、入力文の番号に対応する単
語列を獲得する。 [S46]表現変更部5は、入力文から検出した全ての
終助詞を削除する。 [S47]表現変更部5は、変更可能性判定部3におい
て接続可能と判定された終助詞あるいは終助詞を含んだ
修正表現を取得する。 [S48]表現変更部5は、選択した終助詞あるいは終
助詞を含んだ修正表現を文末に付加し、ステップS59
へ進む。 [S49]表現変更部5は、入力文の番号に対応する単
語列を獲得する。 [S50]表現変更部5は、入力文から検出した全ての
終助詞を削除する。 [S51]表現変更部5は、付加すべき終助詞の種類を
調べ、それが「な」か、それ以外の終助詞かを判定す
る。そして、「な」の場合には、ステップS52へ進
み、「な」以外の場合には、ステップS53へ進む。 [S52]表現変更部5は、文末に「な」を付加する。 [S53]表現変更部5は、文末に「な」を付加すると
ともに、選択された終助詞を連接した表現を付加する。
例えば、「よ」が選択されているならば、「なよ」が付
加される。 [S54]表現変更部5は、入力文の番号に対応する単
語列を獲得する。 [S55]表現変更部5は、「か」および「かしら」、
更に、それらに接続する終助詞を削除する(なお、
「か」、「かしら」の前に終助詞がある場合には、削除
しない)。 [S56]表現変更部5は、付加すべき終助詞の種類を
調べ、それが「か」または、「かしら」(及び、それら
を使った修正表現)ならばステップS57に進み、ま
た、「か」または「かしら」以外の終助詞が選択されて
いる場合にはステップS58に進む。 [S57]表現変更部5は、「か」または、「かしら」
(及び、それらを使った修正表現)を文末に付加する。 [S58]表現変更部5は、「か」に選択された終助詞
を連接した表現を付加し、ステップS59に進む。
【0087】例えば、「な」が選択されている場合に
は、文末に、「かな」を付加する。 [S59]性別表現・待遇表現一致処理部51は、入力
文中に、性別表現・待遇表現が検出されているか否かを
判定し、存在している場合にはステップS60に進み、
それ以外の場合には処理を終了する(エンド)。 [S60]性別表現・待遇表現一致処理部51は、置換
用の新しい表現を、付加した終助詞を手がかりにして、
図示しない性別・待遇単語リスト(変換表)から取得す
る。 [S61]表現変更部5は、ステップS60において取
得した置換用の新しい表現によって置換する処理を行
う。
【0088】そして、すべての入力文に対して、以上に
示す処理が終了した場合には、文体変換後の文字列を、
変換後文字列表示部6に供給して表示させる。以上に説
明したように、本発明の実施の形態によれば、ユーザの
要望に応じて、処理対象となる文書の文体を一括して変
更することが可能となるので、例えば、複数のユーザに
よって作成された文書の文体を簡単に統一することが可
能となる。
【0089】また、変換する部位を特定して変換を行う
ようにすれば、翻訳文に登場するキャラクタに応じて各
会話文を適切に変更することも可能となる。なお、以上
の実施の形態においては、終助詞を例にあげて説明を行
ったが、本発明はこのような場合にのみ限定されるもの
ではなく、助動詞、接続詞、副詞、形容詞、形容動詞、
動詞、名詞、擬態語等に関しても同様に感性データベー
スを構築すれば、印象要望に基づく文体変換が、ほぼ同
じ方法で可能となる。
【0090】また、終助詞感性データベース内に、複数
の終助詞(終助詞セット)を同一文章内で併用した場合
の印象評価値と、各終助詞セットに対応する判別関数を
格納しておくことにより、複数の終助詞を併用した自然
なかたちの文体変換が可能となる。
【0091】更に、文章内の複数の文に、単一または複
数の種類の助詞を付加する場合、特定の品詞や表記を指
定できるようにすることも可能であり、また、付加確率
や付加順序を指定できるようにすることも可能である。
【0092】最後に、本実施例の文体変換装置は、CP
U、メモリ、キーボード等から構成される一般的なコン
ピュータシステムやワードプロセッサのハードウエア上
でのソフトウエアとして実現でき、また、そのソフトウ
エアは、かな漢字変換機能や文書編集機能を具備する日
本語ワードプロセッサに実装することができる。
【0093】また、上記の処理機能は、コンピュータに
よって実現することができる。その場合、文書処理装置
が有すべき機能の処理内容は、コンピュータで読み取り
可能な記録媒体に記録されたプログラムに記述されてお
り、このプログラムをコンピュータで実行することによ
り、上記処理がコンピュータで実現される。コンピュー
タで読み取り可能な記録媒体としては、磁気記録装置や
半導体メモリ等がある。
【0094】市場に流通させる場合には、CD−ROM
(Compact Disk Read Only Memory)やフロッピーディス
ク等の可搬型記録媒体にプログラムを格納して流通させ
たり、ネットワークを介して接続されたコンピュータの
記憶装置に格納しておき、ネットワークを通じて他のコ
ンピュータに転送することもできる。コンピュータで実
行する際には、コンピュータ内のハードディスク装置等
にプログラムを格納しておき、メインメモリにロードし
て実行するようにすればよい。
【0095】
【発明の効果】以上説明したように、本発明によれば、
処理対象となる文書を入力して所定の処理を施す文書処
理装置において、単語と、その単語から受ける印象を数
値化した印象値とを関連付けて記憶した感性データベー
スと、処理後の文の印象を決定する印象情報の入力を受
ける印象情報入力手段と、印象情報入力手段から入力さ
れた印象情報に対応する単語を、感性データベースから
検索する検索手段と、処理対象となる文書の入力を受け
る文書入力手段と、文書入力手段から入力された文書か
ら、処理の対象となる単語を特定する単語特定手段と、
単語特定手段によって特定された単語を、検索手段によ
って検索された単語によって置換可能か否かを判定する
置換可能性判定手段と、置換可能性判定手段によって置
換が可能であると判定された場合には、文書内の該当す
る単語を、検索された単語によって置換する置換手段と
を有するようにしたので、ユーザが編集しようとしてい
る文書の文体をユーザの要望する印象に合わせて簡単に
変更することが可能となる。
【図面の簡単な説明】
【図1】 本発明の動作原理を説明する原理図である。
【図2】 本発明の実施の形態の構成例を示すブロック
図である。
【図3】 図2に示す実施の形態の文末表現解析部にお
いて実行される処理の流れを示すフローチャートであ
る。
【図4】 図2に示す実施の形態の感性検索部において
実行される処理の流れを示すフローチャートである。
【図5】 図2に示す実施の形態の変更可能性判定部に
おいて実行される処理の流れを示すフローチャートであ
る。
【図6】 図2に示す接続規則テーブルの内容の一部を
示す図である。
【図7】 図2に示す実施の形態の表現変更部において
実行される処理の流れを示すフローチャートである。
【符号の説明】
1 変換前文字列入力部 2 文末表現解析部 3 変更可能性判定部 4 感性検索部 5 表現変更部 6 変換後文字列表示部 21 形態素解析部 22 解析用辞書 23 単語列・単語情報記憶部 24 単語情報読み込み部 25 終助詞抽出部 26 接続情報抽出部 27 性別表現・待遇表現抽出部 41 印象要望値入力部 42 終助詞候補検索部 43 終助詞感性DB 44 終助詞削除判定部 51 性別表現・待遇表現一致処理部 100 感性データベース 101 印象情報入力部 102 検索手段 103 文書入力手段 104 単語特定手段 105 置換可能性判定手段 106 置換手段 107 単語セットデータベース 108 呼応関係単語データベース
フロントページの続き Fターム(参考) 5B009 ME22 QA03 QA04 QA17 QB02 QB12 QB13 QB14 VA09 5B091 AA15 AB17 BA02 BA15 CA12 CC04 CC05 DA02

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 処理対象となる文書を入力して所定の処
    理を施す文書処理装置において、 単語と、その単語から受ける印象を数値化した印象値と
    を関連付けて記憶した感性データベースと、 処理後の文の印象を決定する印象情報の入力を受ける印
    象情報入力手段と、 前記印象情報入力手段から入力された印象情報に対応す
    る単語を、前記感性データベースから検索する検索手段
    と、 処理対象となる文書の入力を受ける文書入力手段と、 前記文書入力手段から入力された文書から、処理の対象
    となる単語を特定する単語特定手段と、 前記単語特定手段によって特定された単語を、前記検索
    手段によって検索された単語によって置換可能か否かを
    判定する置換可能性判定手段と、 前記置換可能性判定手段によって置換が可能であると判
    定された場合には、文書内の該当する単語を、検索され
    た単語によって置換する置換手段と、 を有することを特徴とする文書処理装置。
  2. 【請求項2】 前記置換手段は、前記検索手段の検索結
    果によっては、検索された単語を新たに付加する処理を
    実行することを特徴とする請求項1記載の文書処理装
    置。
  3. 【請求項3】 前記置換手段は、検索手段の検索結果に
    よっては、処理対象となる単語を削除する処理を実行す
    ることを特徴とする請求項1記載の文書処理装置。
  4. 【請求項4】 前記検索手段によって検索された単語
    が、処理対象となる文書に複数含まれている場合であっ
    て、かつ、所定の品詞である場合には、処理後の文書に
    おけるその単語の出現頻度が所定の値となるように前記
    置換手段が置換処理を実行することを特徴とする請求項
    1記載の文書処理装置。
  5. 【請求項5】 相互に置換可能な単語群を単語セットと
    して記憶した単語セットデータベースを更に有し、 前記置換手段は、前記単語セットデータベースに記憶さ
    れている単語を置換の対象とする場合には、前記単語セ
    ットから所定の規則に応じて所定の単語を選択して置換
    処理を行うことを特徴とする請求項4記載の文書処理装
    置。
  6. 【請求項6】 第1の単語と、前記第1の単語と呼応関
    係を有している第2の単語とを関連付けて記憶した呼応
    関係単語データベースを更に有し、 前記置換手段は、前記第1または第2の単語を置換する
    場合には、前記第2または第1の単語も同時に置換する
    ことを特徴とする請求項1記載の文書処理装置。
  7. 【請求項7】 1対1の置換が不可能な単語を置換する
    ための修正表現を格納した修正表現データベースを更に
    有し、 前記検索手段によって検索された単語では、置換が不可
    能であると前記置換可能性判定手段によって判定された
    場合には、前記置換手段は、前記修正表現データベース
    から対応する修正表現を検索して置換処理を実行するこ
    とを特徴とする請求項1記載の文書処理装置。
  8. 【請求項8】 処理対象となる文書を入力して所定の処
    理を施す文書処理装置としてコンピュータを機能させる
    プログラムを記録したコンピュータ読み取り可能な記録
    媒体において、 コンピュータを、 単語と、その単語から受ける印象を数値化した印象値と
    を関連付けて記憶した感性データベース、 処理後の文の印象を決定する印象情報の入力を受ける印
    象情報入力手段と、 前記印象情報入力手段から入力された印象情報に対応す
    る単語を、前記感性データベースから検索する検索手
    段、 処理対象となる文書の入力を受ける文書入力手段、 前記文書入力手段から入力された文書から、処理の対象
    となる単語を特定する単語特定手段、 前記単語特定手段によって特定された単語を、前記検索
    手段によって検索された単語によって置換可能か否かを
    判定する置換可能性判定手段、 前記置換可能性判定手段によって置換が可能であると判
    定された場合には、文書内の該当する単語を、検索され
    た単語によって置換する置換手段、 として機能させるプログラムを記録したコンピュータ読
    み取り可能な記録媒体。
JP11049722A 1999-02-26 1999-02-26 文書処理装置および記録媒体 Pending JP2000250907A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11049722A JP2000250907A (ja) 1999-02-26 1999-02-26 文書処理装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11049722A JP2000250907A (ja) 1999-02-26 1999-02-26 文書処理装置および記録媒体

Publications (1)

Publication Number Publication Date
JP2000250907A true JP2000250907A (ja) 2000-09-14

Family

ID=12839091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11049722A Pending JP2000250907A (ja) 1999-02-26 1999-02-26 文書処理装置および記録媒体

Country Status (1)

Country Link
JP (1) JP2000250907A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163417A (ja) * 2000-11-24 2002-06-07 Just Syst Corp データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体
US7809572B2 (en) 2005-07-20 2010-10-05 Panasonic Corporation Voice quality change portion locating apparatus
KR101006191B1 (ko) * 2002-08-06 2011-01-07 윤재민 가상인격체의 감정표현과 동작구현방법
JP2011076375A (ja) * 2009-09-30 2011-04-14 Yahoo Japan Corp 文章変換装置、方法及びプログラム
JP2017004051A (ja) * 2015-06-04 2017-01-05 日本電信電話株式会社 書き換え規則獲得装置、方法、及びプログラム
JP2017151902A (ja) * 2016-02-26 2017-08-31 日本電信電話株式会社 書き換え装置、印象評価装置、方法、及びプログラム
WO2019167848A1 (ja) * 2018-02-27 2019-09-06 パナソニックIpマネジメント株式会社 データ変換システム、データ変換方法及びプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163417A (ja) * 2000-11-24 2002-06-07 Just Syst Corp データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体
JP4614526B2 (ja) * 2000-11-24 2011-01-19 株式会社ジャストシステム データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体
KR101006191B1 (ko) * 2002-08-06 2011-01-07 윤재민 가상인격체의 감정표현과 동작구현방법
US7809572B2 (en) 2005-07-20 2010-10-05 Panasonic Corporation Voice quality change portion locating apparatus
JP2011076375A (ja) * 2009-09-30 2011-04-14 Yahoo Japan Corp 文章変換装置、方法及びプログラム
JP2017004051A (ja) * 2015-06-04 2017-01-05 日本電信電話株式会社 書き換え規則獲得装置、方法、及びプログラム
JP2017151902A (ja) * 2016-02-26 2017-08-31 日本電信電話株式会社 書き換え装置、印象評価装置、方法、及びプログラム
WO2019167848A1 (ja) * 2018-02-27 2019-09-06 パナソニックIpマネジメント株式会社 データ変換システム、データ変換方法及びプログラム

Similar Documents

Publication Publication Date Title
Malheiro et al. Emotionally-relevant features for classification and regression of music lyrics
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3691844B2 (ja) 文書処理方法
JPWO2018221120A1 (ja) 表示装置
CN103324621B (zh) 一种泰语文本拼写纠正方法及装置
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP2007287134A (ja) 情報抽出装置、及び情報抽出方法
US7398196B1 (en) Method and apparatus for summarizing multiple documents using a subsumption model
CN109101551B (zh) 一种问答知识库的构建方法及装置
US8516013B2 (en) Systems and methods for subtext searching data using synonym-enriched predicative phrases and substituted pronouns
JP2000250907A (ja) 文書処理装置および記録媒体
Baker A year to remember? Introducing the BE21 corpus and exploring recent part of speech tag change in British English
Nurmio et al. The rise and fall of a minor category: The case of the Welsh numerative
JP4423385B2 (ja) 文書分類支援装置およびコンピュータプログラム
JP4567025B2 (ja) テキスト分類装置、テキスト分類方法及びテキスト分類プログラム並びにそのプログラムを記録した記録媒体
JP6687078B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
JP2010117529A (ja) 音声読み上げ文生成装置、音声読み上げ文生成方法および音声読み上げ文生成プログラム
JP3029403B2 (ja) 文章データ音声変換システム
KR102618219B1 (ko) 사전 학습된 언어 모델의 파라미터 및 사전 학습 단어장을미세 조정하는 방법 및 사전 학습된 언어 모델의 파라미터 및 사전 학습 단어장을 미세 조정하기 위한 전자 장치
JP2003099429A (ja) 用語集生成装置及び用語集生成プログラム並びに用語集検索装置
JP2001142897A (ja) 文書検索装置、文書検索方法、文書検索システム及び文書検索方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Ren et al. Sentiment analysis of Internet performance data
JP2011198051A (ja) 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム
US20220114202A1 (en) Summary generation apparatus, control method, and system
JP4088176B2 (ja) 質問応答装置及び質問応答プログラム