JP6592378B2 - 書き換え装置、方法、及びプログラム - Google Patents
書き換え装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6592378B2 JP6592378B2 JP2016036089A JP2016036089A JP6592378B2 JP 6592378 B2 JP6592378 B2 JP 6592378B2 JP 2016036089 A JP2016036089 A JP 2016036089A JP 2016036089 A JP2016036089 A JP 2016036089A JP 6592378 B2 JP6592378 B2 JP 6592378B2
- Authority
- JP
- Japan
- Prior art keywords
- impression
- notation
- rewriting
- rewrite
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
まず、本発明の実施形態に係る書き換え装置について説明する。本発明の実施形態に係る書き換え装置は、日本語で書かれたテキストを入力として受け取り、入力されたテキストを構成する表記(形態素または形態素列)を、指定された印象らしさを持つ表現に置換する。
<第1の実施形態に係る学習装置の構成>
次に、本実施形態に係る学習装置の構成について説明する。図1に示すように、本実施形態に係る学習装置100は、CPUと、RAMと、後述する書き換え規則学習処理ルーチン、及び印象スコア学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この学習装置100は、機能的には図1に示すように演算部20を含んで構成されている。
文2:レポートはありますか
文3:お弁当を食べました
文5:実験ってあったっけ
文6:弁当食った
(2)名詞_助詞/名詞_助詞/動詞語幹:カ行五段_活用語尾:連用形_助動詞_助動詞
(4)名詞_助詞/名詞/動詞語幹:カ行五段_活用語尾:連用形-音便_助動詞
(7)書き換え元:<動詞語幹>ました − 書き換え先:<動詞語幹>[連用形−音便]た
= <名詞>は の「改まった」コーパスにおける出現回数 ÷
「改まった」コーパスおよび「くだけた」コーパスにおける出現回数の合計
= 1÷(0+1)
=1
(9)名詞_助詞/形容詞語幹_活用語尾:終止形_助動詞
(10){レポート}_は/{あ}_り_ます_か
(11)名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形_助動詞_助詞
(12)お_{弁当}_を/{食}_べ_まし_た
(13)接頭詞_名詞_助詞/動詞語幹:一段_活用語尾:連用形_助動詞_終助詞
(14){レポート}/{むず}_い
(15)名詞/形容詞語幹_活用語尾:終止形
(16){実験}_って/{あ}_っ_た_っけ
(17)名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形-音便_助動詞_助詞
(18){弁当}/{食}_っ_た
(19)名詞/動詞語幹:一段_活用語尾:連用形-音便_助動詞
次に、第1の実施形態に係る書き換え装置の構成について説明する。図6に示すように、本実施形態に係る書き換え装置200は、CPUと、RAMと、後述する書き換え処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この書き換え装置200は、機能的には図6に示すように入力部210と、演算部220と、出力部290とを含んで構成されている。
(21)名詞_助詞/名詞:形容動詞語幹_助詞/名詞:形容動詞語幹_助詞/名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形_助動詞_助動詞
(23)名詞_助詞/名詞:形容動詞語幹_助詞/名詞:形容動詞語幹_助詞/名詞_助詞/動詞語幹:ラ行五段_活用語尾:連用形_助動詞_助動詞
(24)今日/マジで/いっぱい/雨/降[連用形-音便]た!
(25)今日/マジで/いっぱい/雨/降った!
次に、第1の実施形態に係る学習装置100の作用について説明する。書き換えコーパス記憶部30から書き換え元の文と書き換え先の文とのペアの各々を読み込むと、学習装置100によって図10に示す書き換え規則学習処理ルーチンを実行する。
次に、第1の実施形態に係る書き換え装置200の作用について説明する。事前に、入力部210において、学習装置100において学習された書き換え規則リストと各表記の印象軸毎の印象スコアを受け付け、各々を、書き換え規則リスト記憶部224、又は表記別印象スコア記憶部226に記憶する。次に、入力部210において書き換え元の文と、キャラクタ及び印象スコアの指定を受け付けると、書き換え装置200によって図12に示す書き換え処理ルーチンを実行する。
次に、第2の実施の形態に係る印象評価装置について説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して説明を省略する。
次に、第2の実施形態に係る印象評価装置の構成について説明する。図13に示すように、第2の実施形態に係る印象評価装置300は、CPUと、RAMと、後述する印象評価処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この印象評価装置300は、機能的には図13に示すように入力部310と、演算部320と、出力部390とを含んで構成されている。
次に、第2の実施形態に係る印象評価装置300の作用について説明する。事前に、入力部310において、上記第1の実施の形態で説明した学習装置100において学習された印象スコアを受け付け、表記別印象スコア記憶部226に記憶する。次に、入力部310において評価対象文を受け付けると、印象評価装置300によって図13に示す印象評価処理ルーチンを実行する。
22、40、223 形態素文節情報付与部
30 書き換えコーパス記憶部
32 印象別コーパス記憶部
42 書き換え箇所アライメント部
44 書き換え規則リスト取得部
46 表記書き換え規則リスト記憶部
48 印象スコア算出部
50 表記別印象スコア記憶部
100 学習装置
200 書き換え装置
210、310 入力部
221 印象パラメータ設定表記憶部
222 印象パラメータ自動設定部
224 表記書き換え規則リスト記憶部
226 表記別印象スコア記憶部
228 書き換え候補選択部
230 動詞活用表記憶部
232 活用調整部
290、390 出力部
300 印象評価装置
330 評価部
Claims (9)
- 書き換え先のキャラクタの指定、予め定められた複数の印象軸のうちの少なくとも1つの印象軸の印象スコアの指定、及び入力文を受け付ける入力部と、
書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定及び前記少なくとも1つの印象軸の印象スコアの指定と、キャラクタ毎に予め定められた複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
を含む書き換え装置であって、
前記書き換え候補選択部は、前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの複数の印象軸の各々の印象スコアを、前記少なくとも1つの印象軸の印象スコアで上書きして得られる、複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して、前記書き換え候補の表記を選択する
書き換え装置。 - 予め定められた複数の印象軸毎に、当該印象軸に紐づけられた文からなるコーパスを記憶する印象別コーパス記憶部と、
表記毎に、前記複数の印象軸の各々について、当該印象軸に紐づけられたコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出する印象スコア算出部と、
書き換え先の印象の指定及び入力文を受け付ける入力部と、
書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、前記印象スコア算出部により表記毎に算出された前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先の印象の指定とに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
を含む書き換え装置。 - 書き換え先のキャラクタの指定及び入力文を受け付ける入力部と、
書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め定められた複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定と、キャラクタ毎に予め定められた前記複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
を含む書き換え装置であって、
前記書き換え候補選択部は、前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの前記複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して前記書き換え候補の表記を選択し、
前記キャラクタに対する前記複数の印象軸の各々の印象スコアは、当該キャラクタに対応するテキストデータに含まれる表記の各々の印象スコアに基づいて予め定められる
書き換え装置。 - 前記印象別コーパス記憶部は、前記複数の印象軸毎に、当該印象軸において対立する2つの印象の各々について、当該印象を持つ文からなるコーパスを記憶し、
前記印象スコア算出部は、表記毎に、前記複数の印象軸の各々について、当該印象軸において対立する2つの印象の各々のコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出する請求項2記載の書き換え装置。 - 予め定められた複数の印象軸毎に、当該印象軸に紐づけられた文からなるコーパスを記憶する印象別コーパス記憶部と、
表記毎に、前記複数の印象軸の各々について、当該印象軸に紐づけられたコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出する印象スコア算出部と、
書き換え先のキャラクタの指定、予め定められた複数の印象軸のうちの少なくとも1つの印象軸の印象スコアの指定、及び入力文を受け付ける入力部と、
前記入力文に対して形態素情報及び文節情報を付与する形態素文節情報付与部と、
書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定及び前記少なくとも1つの印象軸の印象スコアの指定と、キャラクタ毎に予め定められた複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する書き換え候補選択部と、
前記形態素文節情報付与部において付与された形態素情報及び文節情報と、前記書き換え候補選択部により置換された前記入力文と、動詞の活用型及び活用形に対応する活用語尾が格納されている動詞活用表とに基づいて、前記置換された前記入力文に含まれる動詞の活用語尾を置換する活用調整部と、
を含む書き換え装置であって、
前記キャラクタに対する前記複数の印象軸の各々の印象スコアは、当該キャラクタに対応するテキストデータに含まれる表記の各々の印象スコアに基づいて予め定められ、
前記印象別コーパス記憶部は、前記複数の印象軸毎に、当該印象軸において対立する2つの印象の各々について、当該印象を持つ文からなるコーパスを記憶し、
前記印象スコア算出部は、表記毎に、前記複数の印象軸の各々について、当該印象軸において対立する2つの印象の各々のコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを算出し、
前記書き換え候補選択部は、前記入力文に含まれる文節の各々について、前記書き換え規則リストから、前記文節の表記が、書き換え元の表記と一致する前記組み合わせの書き換え先の表記を、前記書き換え候補の表記として抽出し、
前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの複数の印象軸の各々の印象スコアを、前記少なくとも1つの印象軸の印象スコアで上書きして得られる、複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して、前記書き換え候補の表記を選択する
書き換え装置。 - 入力部が、書き換え先のキャラクタの指定、予め定められた複数の印象軸のうちの少なくとも1つの印象軸の印象スコアの指定、及び入力文を受け付け、
書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め求められた前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定及び前記少なくとも1つの印象軸の印象スコアの指定と、キャラクタ毎に予め定められた複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する
書き換え方法であって、
前記書き換え候補選択部が前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの複数の印象軸の各々の印象スコアを、前記少なくとも1つの印象軸の印象スコアで上書きして得られる、複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して、前記書き換え候補の表記を選択する
書き換え方法。 - 予め定められた複数の印象軸毎に、当該印象軸に紐づけられた文からなるコーパスを記憶する印象別コーパス記憶部を含む書き換え装置における書き換え方法であって、
印象スコア算出部が、表記毎に、前記複数の印象軸の各々について、当該印象軸に紐づけられたコーパスにおける当該表記の出現頻度に基づいて、当該印象軸の印象スコアを予め算出しておき、
入力部が、書き換え先の印象の指定及び入力文を受け付け、
書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、前記印象スコア算出部により表記毎に算出された前記複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先の印象の指定とに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する
書き換え方法。 - 入力部が、書き換え先のキャラクタの指定及び入力文を受け付け、
書き換え候補選択部が、書き換え元の表記と書き換え先の表記との組み合わせからなる書き換え規則リストと、表記毎に予め定められた複数の印象軸の各々の印象スコアと、前記入力部で受け付けた書き換え先のキャラクタの指定と、キャラクタ毎に予め定められた前記複数の印象軸の各々の印象スコアとに基づいて、前記入力文を構成する表記のうち、書き換え対象となる表記について、前記書き換え規則リストから得られる書き換え候補の表記を選択し、前記入力文に含まれる前記書き換え対象となる表記を、前記選択された表記に置換する
書き換え方法であって、
前記書き換え候補選択部が前記書き換え対象となる表記について前記書き換え候補の表記を選択する際に、前記書き換え先のキャラクタの前記複数の印象軸の各々の印象スコア、及び前記書き換え候補の表記の前記複数の印象軸の各々の印象スコアを比較して前記書き換え候補の表記を選択し、
前記キャラクタに対する前記複数の印象軸の各々の印象スコアは、当該キャラクタに対応するテキストデータに含まれる表記の各々の印象スコアに基づいて予め定められる
書き換え方法。 - コンピュータを、請求項1〜請求項5の何れか1項記載の書き換え装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016036089A JP6592378B2 (ja) | 2016-02-26 | 2016-02-26 | 書き換え装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016036089A JP6592378B2 (ja) | 2016-02-26 | 2016-02-26 | 書き換え装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017151902A JP2017151902A (ja) | 2017-08-31 |
JP6592378B2 true JP6592378B2 (ja) | 2019-10-16 |
Family
ID=59741871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016036089A Active JP6592378B2 (ja) | 2016-02-26 | 2016-02-26 | 書き換え装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6592378B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6712387B2 (ja) * | 2016-07-21 | 2020-06-24 | 国立大学法人電気通信大学 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP7295429B2 (ja) * | 2019-10-16 | 2023-06-21 | 富士通株式会社 | 文書処理プログラム、文書処理方法および文書処理装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0748216B2 (ja) * | 1989-08-19 | 1995-05-24 | 工業技術院長 | 表現変換方式 |
JP3033133B2 (ja) * | 1990-06-05 | 2000-04-17 | 松下電器産業株式会社 | 文章編集装置 |
JP2000250907A (ja) * | 1999-02-26 | 2000-09-14 | Fuji Xerox Co Ltd | 文書処理装置および記録媒体 |
JP2009217665A (ja) * | 2008-03-12 | 2009-09-24 | Sharp Corp | 文章編集装置 |
-
2016
- 2016-02-26 JP JP2016036089A patent/JP6592378B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017151902A (ja) | 2017-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
JP4762103B2 (ja) | 韻律統計モデル訓練方法及び装置、並びに韻律解析方法及び装置 | |
CN109255115B (zh) | 一种文本标点调整方法及装置 | |
CN105045777A (zh) | 使用互联网语料库的自动的上下文相关的语言校正和增强 | |
CN112115700A (zh) | 一种基于依存句法树和深度学习的方面级情感分析方法 | |
US9348901B2 (en) | System and method for rule based classification of a text fragment | |
JP7142435B2 (ja) | 要約装置、要約方法、及び要約プログラム | |
CN111666409A (zh) | 一种基于综合深度胶囊网络的复杂评论文本的整体情感智能分类方法 | |
CN111737961B (zh) | 一种故事生成的方法、装置、计算机设备和介质 | |
JP5231698B2 (ja) | 日本語の表意文字の読み方を予測する方法 | |
Macklin-Cordes et al. | Re-evaluating phoneme frequencies | |
JP6592378B2 (ja) | 書き換え装置、方法、及びプログラム | |
CN114239589A (zh) | 语义理解模型的鲁棒性评估方法、装置及计算机设备 | |
CN112200674B (zh) | 一种证券市场情绪指数智能计算信息系统 | |
Chennoufi et al. | Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization | |
CN110728133B (zh) | 个性语料获取方法及个性语料获取装置 | |
KR100542757B1 (ko) | 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치 | |
CN116562240A (zh) | 文本生成方法、计算机设备及计算机存储介质 | |
Alqahtani et al. | Investigating input and output units in diacritic restoration | |
US20100145677A1 (en) | System and Method for Making a User Dependent Language Model | |
CN114896966A (zh) | 一种中文文本语法错误定位方法、系统、设备及介质 | |
CN111090720B (zh) | 一种热词的添加方法和装置 | |
Zhang | Comparing the Effect of Smoothing and N-gram Order: Finding the Best Way to Combine the Smoothing and Order of N-gram | |
JP2006004366A (ja) | 機械翻訳システム及びそのためのコンピュータプログラム | |
CN113988047A (zh) | 一种语料筛选方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160303 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180305 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20180305 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190212 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6592378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |