JP7295429B2 - 文書処理プログラム、文書処理方法および文書処理装置 - Google Patents
文書処理プログラム、文書処理方法および文書処理装置 Download PDFInfo
- Publication number
- JP7295429B2 JP7295429B2 JP2019189390A JP2019189390A JP7295429B2 JP 7295429 B2 JP7295429 B2 JP 7295429B2 JP 2019189390 A JP2019189390 A JP 2019189390A JP 2019189390 A JP2019189390 A JP 2019189390A JP 7295429 B2 JP7295429 B2 JP 7295429B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- document
- words
- impression
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
[第1の実施の形態]
第1の実施の形態を説明する。
第1の実施の形態の文書処理装置10は、読み手が文書から受ける印象が変わるように文書の変換を支援する。文書処理装置10は、クライアント装置でもよいしサーバ装置でもよい。文書処理装置10を、コンピュータや情報処理装置と言うこともできる。
次に、第2の実施の形態を説明する。
第2の実施の形態の文書処理装置は、多数の読み手に対して公開される文章の編集を支援する。第2の実施の形態では一例として、衣服などの商品を販売する小売業者が、商品を紹介する文章をインターネット上に公開する業務形態を想定する。例えば、第2の実施の形態の文書処理装置は、編集担当者によって使用され、執筆担当者によって執筆された商品紹介文を公開前に評価して編集する。第2の実施の形態の文書処理装置は、クライアント装置でもよいしサーバ装置でもよい。また、第2の実施の形態の文書処理装置を、コンピュータや情報処理装置と言うこともできる。
文書処理装置100は、CPU101、RAM102、HDD103、画像インタフェース104、入力インタフェース105、媒体リーダ106および通信インタフェース107を有する。文書処理装置100が有するこれらのユニットは、バスに接続されている。文書処理装置100は、第1の実施の形態の文書処理装置10に対応する。CPU101は、第1の実施の形態の処理部12に対応する。RAM102またはHDD103は、第1の実施の形態の記憶部11に対応する。
文書処理装置100は、単語データベース121、過去文書データベース122、ユーザ通信部123、単語分割部124、スコア算出部125および単語変換部126を有する。単語データベース121および過去文書データベース122は、例えば、RAM102またはHDD103の記憶領域を用いて実現される。ユーザ通信部123、単語分割部124、スコア算出部125および単語変換部126は、例えば、CPU101が実行するプログラムを用いて実現される。
単語辞書テーブル131は、単語データベース121に記憶されている。単語辞書テーブル131には、「きれいめ」、「フェミニン」、「ガーリー」など、1000個~10000個程度の単語が登録されている。また、単語辞書テーブル131には、形容詞や形容動詞など、各単語の品詞が登録されている。また、単語辞書テーブル131には、各単語に対して13個の印象軸の印象スコアが登録されている。
単語列テーブル132,133は、過去文書データベース122に記憶されている。単語列テーブル132は、文書のカテゴリであるブランドAに対応する。単語列テーブル132には、ブランドAの商品説明文に使用された単語列が登録される。単語列テーブル133は、文書のカテゴリであるブランドBに対応する。単語列テーブル133には、ブランドBの商品説明文に使用された単語列が登録される。なお、単語列テーブルは、商品ジャンルやブランドシリーズなど所望のカテゴリ単位で作成してよい。
図6は、単語変換例を示す図である。
文書134は、編集対象の文書の一例である。文書134には、単語辞書に登録されたキーワードとして、「キュート」、「フリル」、「プルオーバーニット」および「きれいめ」が含まれている。ユーザは、印象軸「かわいい感」に着目しているとする。「キュート」はかわいい感=5、「フリル」はかわいい感=3、「プルオーバーニット」はかわいい感=3、「きれいめ」はかわいい感=2である。キーワードの印象スコアの平均値を文書全体の印象スコアと定義すると、印象軸「かわいい感」の文書全体の印象スコアは、(5+3+3+2)/4=3.2と算出される。
図7は、文書処理の手順例を示すフローチャートである。
(S10)ユーザ通信部123は、編集対象の文書を取得する。
(S13)スコア算出部125は、単語辞書テーブル131から、ステップS12で抽出された単語に対応付けられている13個の印象軸の印象スコアを検索する。スコア算出部125は、13個の印象軸それぞれについて、抽出された単語の印象スコアを集計する。例えば、スコア算出部125は、印象軸毎に印象スコアの平均値を求める。集計された印象スコアが、編集対象の文書全体に対する印象スコアとなる。
(S19)単語変換部126は、編集前文章の中で、ステップS18で残った何れかの単語が出現する出現位置を1つ選択する。同一単語が2箇所以上に出現する場合、単語変換部126は、当該2箇所以上の出現位置を区別し、出現位置を1つずつ選択する。これは、単語が同一でも出現位置毎に文脈が異なるためである。
(S23)単語変換部126は、ステップS20で特定した前単語および後単語とステップS22で選択した変換候補単語とを組み合わせて、(前単語,変換候補単語,後単語)の3-gramを生成する。また、単語変換部126は、過去文書データベース122から、ステップS15で指定されたブランドの過去文書に対応する単語列テーブルを選択する。単語変換部126は、選択した単語列テーブルから、生成した3-gramを検索して当該3-gramの尤度を算出する。尤度は出現頻度を表す。
(S26)単語変換部126は、ステップS22において全ての変換候補単語を選択したか判断する。全ての変換候補単語を選択した場合はステップS27に進み、未選択の変換候補単語がある場合はステップS22に戻る。
編集画面141は、表示装置111または他の情報処理装置の表示装置に表示される。編集画面141は、タイトルを入力する入力欄とブランドを指定する選択欄とを含む。また、編集画面141は、編集前文章を表示するテキスト欄と編集後文章を表示するテキスト欄とを含む。ただし、編集画面141ではまだ編集が行われていないため、編集後文章のテキスト欄が空となっている。編集前文章のテキスト欄では、印象スコアが付与されているキーワードが強調表示される。また、編集画面141は、編集前文章に対する13個の印象軸の印象スコアを示すレーダーチャートを含む。
編集画面142は、前述の編集画面141の後に、表示装置111または他の情報処理装置の表示装置に表示される。編集画面142の編集後文章のテキスト欄には、一部のキーワードが編集前文章から置換された編集後文章が表示される。編集後文章のテキスト欄では、置換されたキーワードとその前後の単語とを含む3-gramが強調表示される。また、編集画面142のレーダーチャートは、編集後文章に対する13個の印象軸の印象スコアを示すように更新されている。レーダーチャートでは、指定された印象軸の印象スコアが文章修正の前後でどの様に変化したかが強調表示される。ユーザは、更に強調したい他の印象軸がある場合、文章の自動修正を更に指示することができる。
編集画面143は、編集画面142に代えて、表示装置111または他の情報処理装置の表示装置に表示することができる。編集画面142では、ある変換元単語が、尤度が最大の変換候補単語に自動的に置換されている。これに対して編集画面143では、尤度が最大の変換候補単語以外の他の変換候補単語がユーザに提示され、ユーザが変換候補単語を変更できるようにする。ユーザに提示される他の変換候補単語は、前述のステップS25で不採用とならずに残った変換候補単語のうち、尤度が最大のもの以外である。
11 記憶部
12 処理部
13 単語辞書
14,15 文書
Claims (9)
- コンピュータに、
単語に対して当該単語がもつ印象のレベルを示すスコアを対応付けた単語辞書を参照して、評価対象の第1の文書に含まれる第1の単語に対する第1のスコアを算出し、
前記単語辞書から、前記第1のスコアより高い印象のレベルを示す第2のスコアがそれぞれ対応付けられた複数の第2の単語を検索し、
前記第1の文書と異なる第2の文書を用いて、前記複数の第2の単語それぞれに対して、前記第1の単語から前記第1の文書の中で所定範囲内にある第3の単語と当該第2の単語とを組み合わせた単語列の出現頻度を算出し、
前記複数の第2の単語それぞれに対して算出した前記出現頻度に基づいて、前記複数の第2の単語のうち前記第1の単語と置換する第2の単語を選択する、
処理を実行させる文書処理プログラム。 - 前記コンピュータに更に、前記第1の文書に含まれる複数の単語のうち、スコアが閾値未満の単語を前記第1の単語として選択する処理を実行させる、
請求項1記載の文書処理プログラム。 - 前記コンピュータに更に、前記第1の文書に含まれる複数の単語のうち、品詞が形容詞または形容動詞である単語を前記第1の単語として選択する処理を実行させる、
請求項1記載の文書処理プログラム。 - 前記単語辞書は、単語に対して当該単語がもつ他の印象のレベルを示す他のスコアを更に対応付けており、
前記コンピュータに更に、前記第1の文書に含まれる複数の単語のうち、他のスコアが閾値未満の単語を前記第1の単語として選択する処理を実行させる、
請求項1記載の文書処理プログラム。 - 前記出現頻度の算出では、前記第1の文書から、前記第1の単語の前にある前単語と前記第1の単語の後にある後単語とを前記第3の単語として抽出し、前記前単語と前記複数の第2の単語の1つと前記後単語との組に対して前記出現頻度を算出する、
請求項1記載の文書処理プログラム。 - 前記コンピュータに更に、前記第1の単語を、前記複数の第2の単語のうち前記出現頻度が最大の第2の単語に置換し、置換後の前記第1の文書を出力する処理を実行させる、
請求項1記載の文書処理プログラム。 - 前記出現頻度の算出では、前記第1の文書のカテゴリの指定を受け付け、複数のカテゴリに対応する複数の第2の文書のうち、前記第1の文書のカテゴリに対応する第2の文書を用いて前記出現頻度を算出する、
請求項1記載の文書処理プログラム。 - コンピュータが、
単語に対して当該単語がもつ印象のレベルを示すスコアを対応付けた単語辞書を参照して、評価対象の第1の文書に含まれる第1の単語に対する第1のスコアを算出し、
前記単語辞書から、前記第1のスコアより高い印象のレベルを示す第2のスコアがそれぞれ対応付けられた複数の第2の単語を検索し、
前記第1の文書と異なる第2の文書を用いて、前記複数の第2の単語それぞれに対して、前記第1の単語から前記第1の文書の中で所定範囲内にある第3の単語と当該第2の単語とを組み合わせた単語列の出現頻度を算出し、
前記複数の第2の単語それぞれに対して算出した前記出現頻度に基づいて、前記複数の第2の単語のうち前記第1の単語と置換する第2の単語を選択する、
文書処理方法。 - 単語に対して当該単語がもつ印象のレベルを示すスコアを対応付けた単語辞書と、評価対象の第1の文書と異なる第2の文書とを記憶する記憶部と、
前記単語辞書を参照して、前記第1の文書に含まれる第1の単語に対する第1のスコアを算出し、前記単語辞書から、前記第1のスコアより高い印象のレベルを示す第2のスコアがそれぞれ対応付けられた複数の第2の単語を検索し、前記第2の文書を用いて、前記複数の第2の単語それぞれに対して、前記第1の単語から前記第1の文書の中で所定範囲内にある第3の単語と当該第2の単語とを組み合わせた単語列の出現頻度を算出し、前記複数の第2の単語それぞれに対して算出した前記出現頻度に基づいて、前記複数の第2の単語のうち前記第1の単語と置換する第2の単語を選択する処理部と、
を有する文書処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019189390A JP7295429B2 (ja) | 2019-10-16 | 2019-10-16 | 文書処理プログラム、文書処理方法および文書処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019189390A JP7295429B2 (ja) | 2019-10-16 | 2019-10-16 | 文書処理プログラム、文書処理方法および文書処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021064252A JP2021064252A (ja) | 2021-04-22 |
JP7295429B2 true JP7295429B2 (ja) | 2023-06-21 |
Family
ID=75486338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019189390A Active JP7295429B2 (ja) | 2019-10-16 | 2019-10-16 | 文書処理プログラム、文書処理方法および文書処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7295429B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287020A (ja) | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2017151902A (ja) | 2016-02-26 | 2017-08-31 | 日本電信電話株式会社 | 書き換え装置、印象評価装置、方法、及びプログラム |
JP2019114224A (ja) | 2017-10-13 | 2019-07-11 | 富士通株式会社 | 検索方法、検索プログラム及び検索装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007018234A (ja) * | 2005-07-07 | 2007-01-25 | National Institute Of Information & Communication Technology | 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置 |
-
2019
- 2019-10-16 JP JP2019189390A patent/JP7295429B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287020A (ja) | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2017151902A (ja) | 2016-02-26 | 2017-08-31 | 日本電信電話株式会社 | 書き換え装置、印象評価装置、方法、及びプログラム |
JP2019114224A (ja) | 2017-10-13 | 2019-07-11 | 富士通株式会社 | 検索方法、検索プログラム及び検索装置 |
Non-Patent Citations (1)
Title |
---|
吉岡 直輝,印象尺度に基づいた文章言い換え手法,言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD-ROM] ,日本,言語処理学会,2012年03月13日,pp.425-426 |
Also Published As
Publication number | Publication date |
---|---|
JP2021064252A (ja) | 2021-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5996734B2 (ja) | 動画を自動的にアセンブリする方法およびシステム | |
US8145662B2 (en) | Methods and apparatus for generating a data dictionary | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
JP4251652B2 (ja) | 検索装置、検索プログラムおよび検索方法 | |
JP3695191B2 (ja) | 翻訳支援装置及びその方法並びにコンピュータ可読記録媒体 | |
CN101213542B (zh) | 信息处理设备、信息处理方法和信息处理程序 | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
JP2005182280A (ja) | 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム | |
JP4861375B2 (ja) | 文書処理装置、文書処理プログラムおよび記録媒体 | |
JP6260294B2 (ja) | 情報検索装置、情報検索方法および情報検索プログラム | |
US8914398B2 (en) | Methods and apparatus for automated keyword refinement | |
JP2013050890A (ja) | テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法 | |
JP7295429B2 (ja) | 文書処理プログラム、文書処理方法および文書処理装置 | |
JP4602388B2 (ja) | 類似文検索システム及びプログラム | |
JP5085584B2 (ja) | 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム | |
JP2009295101A (ja) | 音声データ検索システム | |
JP2008026967A (ja) | 文書検索システム及びプログラム | |
JP2004326479A (ja) | 単語間類似度計算プログラム及び装置 | |
JP2005346560A (ja) | 検索結果提示方法およびその装置並びに検索結果提示プログラムを格納した記憶媒体 | |
US11681870B2 (en) | Reducing latency and improving accuracy of work estimates utilizing natural language processing | |
JP2010122823A (ja) | テキスト処理システム、情報処理装置、テキストおよび情報の処理方法ならびに処理プログラム | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム | |
JP2008293070A (ja) | 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム | |
JP2024007282A (ja) | 情報処理装置、及び情報処理プログラム | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7295429 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |