JP2019028937A

JP2019028937A - 説明文評価方法、説明文評価装置及び説明文評価プログラム

Info

Publication number: JP2019028937A
Application number: JP2017150873A
Authority: JP
Inventors: 智裕桑原; Tomohiro Kuwabara; 矢野　亮; Akira Yano; 亮矢野; 直哉前田; Naoya Maeda; 理沙松元; Risa Matsumoto; 拓也茨木; Takuya IBARAKI
Original assignee: NTT Data Corp; Shiseido Co Ltd; NTT Data Institute of Management Consulting Inc
Current assignee: Shiseido Co Ltd; NTT Data Institute of Management Consulting Inc; NTT Data Group Corp
Priority date: 2017-08-03
Filing date: 2017-08-03
Publication date: 2019-02-21
Anticipated expiration: 2037-08-03
Also published as: JP6896552B2

Abstract

【課題】本発明の課題は、商品の説明文に対し安定した評価を迅速に得ることを目的とする。【解決手段】上記課題は、商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理ステップと、単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価ステップと、評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価ステップによる評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成ステップと、をコンピュータが行う説明文評価方法により達成される。【選択図】図１

Description

本願は、説明文評価方法、説明文評価装置及び説明文評価プログラムに関する。

商品のパッケージやＴＶ、新聞、雑誌等における宣伝広告には、通常、使用方法、使用効果等を示した説明文が記載されている。消費者が品質、有効性、安全性等を適切に把握し商品を購入し及び使用できるように、医薬品医療機器法（薬機法）や景品表示法等の様々な法令によって、説明文に対して様々な規制やガイドラインの策定がなされている。

商品の特長を表わす表現は、様々な法令等の規制のもとで、消費者が通常理解するであろう効能及び効果の範囲を超えた内容を含んではならない。このようなことから、商品の説明文は、通常、熟練者等によってチェックされている。

説明文として適切な語を選択するために、文書内の未知の語の前後の語から未知の語となり得る語を予測する技術等（例えば、特許文献１参照）を用いることが考えられる。

米国特許第９０３７４６４号

しかしながら、説明文は、商品を計画及び開発する担当者が、様々な法令等の規制に従い適切な表現であるか否かを評価することは難しく、不明な場合は、熟練者に問合せて確認することが行われている。

一方、熟練者の教育には時間を要し、また、今日では各部門の担当者からの問合せも増加傾向にあり、対応に追われる状況にある。また、説明文は熟練者の経験に基づき評価された場合、熟練者により異なる判断となる場合があり、一定の評価を得ることが難しいといった問題がある。

したがって、一つの側面では、本発明は、商品の説明文に対し安定した評価を迅速に得ることを目的とする。

一つの形態によれば、商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理ステップと、単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価ステップと、評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価ステップによる評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成ステップと、をコンピュータが行う説明文評価方法が提供される。

また、上記課題を解決するための手段として、説明文評価装置及び説明文評価プログラムとすることもできる。

説明文に対し安定した評価を迅速に得ることができる。

第１実施例における説明文評価システムのネットワーク構成例を示す図である。第１実施例における説明文評価システムにおけるハードウェア構成を示す図である。第１実施例におけるモデル作成検証処理を説明するためのフローチャート図である。第１実施例における説明文評価システムにおける説明文の評価処理を説明するためのフローチャート図である。第２実施例における訴求文評価システムにおける機能構成例を示す図である。第２実施例における定義テーブルのデータ構成例を示す図である。第２実施例における教師データのデータ構成例を示す図である。第２実施例における知識ベース作成処理を説明するためのフローチャート図である。第２実施例における判別モデル作成処理を説明するためのフローチャート図である。第２実施例における訴求文評価処理を説明するためのフローチャート図である。第２実施例におけるクライアント端末に表示される初期の画面例を示す図である。第２実施例における結果表示データの受信時の画面例を示す図である。第２実施例における評価結果の詳細の表示例を示す図である。第２実施例における結果表示データの受信時の他の画面例を示す図である。第２実施例における評価結果の詳細の他の表示例を示す図である。第３実施例における定義テーブルのデータ構成例を示す図である。第３実施例における教師データのデータ構成例を示す図である。図１８は、第３実施例における評価結果の詳細の表示例を示す図である。

以下、本発明を実施するための形態について図面を参照して説明するが、本発明は、下記の実施形態に制限されることはなく、本発明の範囲を逸脱することなく、下記の実施形態に種々の変形および置換を加えることができる。

［第１実施例］
先ず、販売される商品、サービス（役務）等に関する説明文を、商品分野、それぞれの国又は地域（以下、国という。）の法令等に従った内容であるかを評価する説明文評価システム１０００の概要を説明する。

図１は、第１実施例における説明文評価システムのネットワーク構成例を示す図である。図１において、説明文評価システム１０００は、サーバ装置１００と、複数のクライアント端末３とを有し、それぞれは、ネットワーク２を介して接続可能である。

サーバ装置１００は、クライアント端末３から説明文の評価要求４ｒを受信すると、評価要求４ｒの選択情報４ｓで指定される商品分野、国、及び評価観点に基づいて、評価要求４ｒに含まれる説明文４ｑの評価を行う。その評価結果に基づいて、評価説明情報５ｐが付加された結果表示データ５ｒをクライアント端末３に提供する。説明文４ｑは、テキストデータ、音声データ等である。

サーバ装置１００は、評価要求４ｒを受信すると、評価要求４ｒの選択情報４ｓで指定される評価観点に基づき予め作成したモデルを用いて説明文４ｑを評価し、その評価結果に基づいて、評価説明情報５ｐが付加された結果表示データ５ｒを出力する。

評価説明情報５ｐは、リスクのある文章及び単語を識別可能に表示させるコード、リスクのある文章及び単語が選択された場合に説明文が表示されるように文章及び単語にそれぞれの説明文をリンクさせるコード、説明文等のデータを含む。説明文に加え、代替案を含んでもよい。

クライアント端末３は、ユーザの操作に応じて、ユーザによって指定された評価する説明文４ｑを含む評価要求４ｒをサーバ装置１００へ送信し、サーバ装置１００から結果表示データ５ｒを受信して表示する。

このような、評価説明情報５ｐを提供するサーバ装置１００は、商品、サービス（役務）等の説明文４ｑを対象としてもよい。一例として、化粧品、食品、不動産・金融等である。さまざまな商品の説明文４ｑに対応するために、図１に例示されるように、サーバ装置１００は、化粧品の商品分野ＳＢ１と、食品の商品分野ＳＢ２と、不動産・金融の商品分野ＳＢ３等のそれぞれにおいて、判別モデル群を備えるようにする。判別モデル群は、国ごとに備えられてもよい。ここでは、各商品分野で国ごとに判別モデル群を備えた場合の機能構成の概要を示す。

例えば、サーバ装置１００は、モデル作成検証部１１５０と、説明文評価部１１８０と、説明文ＤＢ１１３７と、化粧品の商品分野ＳＢ１に対して、国ごとの判別モデル群ＨＭＧ１、ＨＭＧ２、ＨＭＧ３、ＨＭＧ４、ＨＭＧ５等（総称して、複数の判別モデル群ＨＭＧという場合がある。）を有する。

判別モデル群ＨＭＧ１は、日本の法令等に対応した、評価観点ａ_１に基づく判別モデルＳＢ１ａ、評価観点ｂ_１に基づく判別モデルＳＢ１ｂ等を有する。判別モデル群ＨＭＧ２は、韓国の法令等に対応した、評価観点ａ_２に基づく判別モデルＳＢ２ａ、評価観点ｂ_２に基づく判別モデルＳＢ２ｂ等である。

判別モデル群ＨＭＧ３は、中国の法令等に対応した、評価観点ａ₃に基づく判別モデルＳＢ３ａ、評価観点ｂ₃に基づく判別モデルＳＢ３ｂ等である。判別モデル群ＨＭＧ４は、米国の法令等に対応した、評価観点ａ₄に基づく判別モデルＳＢ４ａ、評価観点ｂ₄に基づく判別モデルＳＢ４ｂ等である。

判別モデル群ＨＭＧ５は、欧州の法令等に対応した、評価観点ａ_５に基づく判別モデルＳＢ５ａ、評価観点ｂ_５に基づく判別モデルＳＢ５ｂ等を有する。判別モデルＳＢ１ａ、・・・、ＳＢ５ｂ等は、いずれかを特定しない限り、単に、判別モデルＳＢという。

これらの判別モデルＳＢの各々は、モデル作成検証部１１５０によって、判別モデル作成用に収集した多くの説明文を蓄積した説明文ＤＢ１１３７を用いて、同様の処理により作成され適正性が検証されたモデルである。

説明文ＤＢ１１３７は、各商品分野において国毎に収集し蓄積した説明文を管理するデータベースである。収集し蓄積した説明文はコーパスデータに相当し、説明文ＤＢ１１３７は、商品分野及び国毎のコーパスデータを含んでいる。

モデル作成検証部１１５０及び説明文評価部１１８０は、後述されるＣＰＵ１１１（図２）が対応するプログラムを実行することによる処理によって実現され、それらの処理については後述される。

図１では、クライアント端末３とサーバ装置１００とがネットワーク２を介して接続されるネットワーク構成で説明したが、サーバ装置１００の機能を有するスタンドアロン装置でユーザが説明文４ｑの評価を行う形態でもよい。また、商品分野ごとに個別のサーバ装置に同様の機能構成を持たせるようにしてもよい。或いは、国ごとに個別のサーバ装置としてもよい。

ここで、商品分野ごとに関連する法令には、次の様なものがある。
・化粧品
薬機法等
・食品（一般食品、特定保健用食品、栄養機能食品、機能性表示食品、健康食品）
景品表示法、特定商取引法、ＪＡＳ法等
・不動産・金融
景品表示法等
である。

更に、化粧品に関して、主な国ごとの法令を示す。
・韓国
化粧品法、広告ガイドライン等
・中国
化粧品衛星監督条例、中華人民共和国消費者権益保護法等
・米国
Federal Food, Drug, and Cosmetic Act、 Federal Trade Commission Act、Fair Packaging and Labeling Act等
・欧州
Cosmetic Regulation, Unfair commercial practices directive等
である。

以下の説明では、１つのサーバ装置１００において、少なくとも１つの商品分野に対して、複数の国のそれぞれの法令に基づいて判別モデルを作成する場合で説明する。

第１実施例では、国内及び諸外国の様々な法令に十分に精通していないユーザであっても、作成した説明文４ｑの評価を行うことができる。

図２は、第１実施例における説明文評価システムにおけるハードウェア構成を示す図である。図２において、サーバ装置１００は、コンピュータによって制御される情報処理装置であって、ＣＰＵ（Central Processing Unit）１１１と、主記憶装置１１２と、補助記憶装置１１３と、入力装置１１４と、表示装置１１５と、通信Ｉ／Ｆ（インターフェース）１１７と、ドライブ装置１１８とを有し、バスＢ１に接続される。

ＣＰＵ１１１は、主記憶装置１１２に格納されたプログラムに従ってサーバ装置１００を制御するプロセッサに相当する。主記憶装置１１２には、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等が用いられ、ＣＰＵ１１１にて実行されるプログラム、ＣＰＵ１１１での処理に必要なデータ、ＣＰＵ１１１での処理にて得られたデータ等を記憶又は一時保存する。

補助記憶装置１１３には、ＨＤＤ（Hard Disk Drive）等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置１１３に格納されているプログラムの一部が主記憶装置１１２にロードされ、ＣＰＵ１１１に実行されることによって、各種処理が実現される。記憶部１３０は、主記憶装置１１２及び／又は補助記憶装置１１３に相当する。

入力装置１１４は、マウス、キーボード等を有し、ユーザがサーバ装置１００による処理に必要な各種情報を入力するために用いられる。表示装置１１５は、ＣＰＵ１１１の制御のもとに必要な各種情報を表示する。入力装置１１４と表示装置１１５とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信Ｉ／Ｆ１１７は、有線又は無線などのネットワークを通じて通信を行う。通信Ｉ／Ｆ１１７による通信は無線又は有線に限定されるものではない。

サーバ装置１００によって行われる処理を実現するプログラムは、例えば、プログラムを提供する外部サーバ装置からネットワーク２を介してダウンロードすることで取得する。

ドライブ装置１１８は、ドライブ装置１１８にセットされた記憶媒体１１９（例えば、ＣＤ−ＲＯＭ等）とサーバ装置１００とのインターフェースを行う。本実施例に係る処理を実現するプログラムは、ＣＤ−ＲＯＭ（Compact Disc Read-Only Memory）等の記憶媒体１１９によってサーバ装置１００に提供してもよい。

この場合、後述される本実施の形態に係る種々の処理を実現するプログラムを格納した記憶媒体１１９をドライブ装置１１８に設定することにより、この記憶媒体１１９に格納されたプログラムをサーバ装置１００にインストールしてもよい。インストールされたプログラムは、サーバ装置１００により実行可能となる。

尚、プログラムを格納する記憶媒体１１９はＣＤ−ＲＯＭに限定されず、コンピュータが読み取り可能な、データとしての構造（structure）を有する１つ以上の非一時的（non-transitory）な、有形（tangible）な媒体であればよい。コンピュータ読取可能な記憶媒体として、ＣＤ−ＲＯＭの他に、ＤＶＤ（Digital Versatile Disk）ディスク、ＵＳＢメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。

クライアント端末３は、コンピュータによって制御される情報処理装置であって、ＣＰＵ（Central Processing Unit）１１と、主記憶装置１２と、補助記憶装置１３と、入力装置１４と、表示装置１５と、通信Ｉ／Ｆ（インターフェース）１７と、ドライブ装置１８とを有し、バスＢ２に接続される。

ＣＰＵ１１は、主記憶装置１２に格納されたプログラムに従ってクライアント端末３を制御するプロセッサに相当する。主記憶装置１２には、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等が用いられ、ＣＰＵ１１にて実行されるプログラム、ＣＰＵ１１での処理に必要なデータ、ＣＰＵ１１での処理にて得られたデータ等を記憶又は一時保存する。

補助記憶装置１３には、ＨＤＤ（Hard Disk Drive）等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置１３に格納されているプログラムの一部が主記憶装置１２にロードされ、ＣＰＵ１１に実行されることによって、各種処理が実現される。記憶部３０は、主記憶装置１２及び／又は補助記憶装置１３に相当する。

入力装置１４は、マウス、キーボード等を有し、ユーザがクライアント端末３による処理に必要な各種情報を入力するために用いられる。表示装置１５は、ＣＰＵ１１の制御のもとに必要な各種情報を表示する。入力装置１４と表示装置１５とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信Ｉ／Ｆ１７は、有線又は無線などのネットワークを通じて通信を行う。通信Ｉ／Ｆ１７による通信は無線又は有線に限定されるものではない。

クライアント端末３によって行われる処理は、Ｗｅｂブラウザを介してサーバ装置１００と接続することにより実現されればよい。

ドライブ装置１８は、ドライブ装置１８にセットされた記憶媒体１９（例えば、ＣＤ−ＲＯＭ等）とクライアント端末３とのインターフェースを行う。

クライアント端末３によって行われる処理を実現する他の方法として、記憶媒体１９に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体１９に格納されたプログラムは、ドライブ装置１８を介してクライアント端末３にインストールしてもよい。インストールされたプログラムは、クライアント端末３により実行可能となる。

尚、この場合、プログラムを格納する記憶媒体１９はＣＤ−ＲＯＭに限定されず、コンピュータが読み取り可能な、データとしての構造（structure）を有する１つ以上の非一時的（non-transitory）な、有形（tangible）な媒体であればよい。コンピュータ読取可能な記憶媒体として、ＣＤ−ＲＯＭの他に、ＤＶＤ（Digital Versatile Disk）ディスク、ＵＳＢメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。

クライアント端末３は、ラップトップ、タブレット端末等であってもよい。その場合、記憶媒体１９は、ＳＤ（Secure Digital）メモリカード等であり、ドライブ装置１８は、ドライブ装置１８にセットされた記憶媒体１９と端末３とのインターフェースを行う。

モデル作成検証部１１５０によるモデル作成検証処理について説明する。図３は、第１実施例におけるモデル作成検証処理を説明するためのフローチャート図である。図３において、説明文ＤＢ１１３７から商品分野、国、及び評価観点の組み合せ毎に複数の説明文（コーパスデータ）を選択し、各組み合せに対して、以下の処理を行う。説明文ＤＢ１１３７からのコーパスデータの選択は、商品分野及び国を選択する画面を、表示装置１１５に表示させ、ユーザの指定に基づき、一致または関連する種類のコーパスデータを抽出すればよい。

先ず、モデル作成検証部１１５０は、収集・構造化処理を行う（ステップＳ１１０）。収集・構造化処理では、モデル作成検証部１１５０は、判別モデル作成用の説明文を収集し、収集した説明文からサンプリングして、適正性ラベルを関連付けて構造化する。説明文ＤＢ１１３７から抽出したコーパスデータにおいて、サンプリングされた説明文に対して適正性が判断され、その判断結果が適正性ラベルに相当する。適正性ラベルは、不適切、要注意、又は適正のいずれかを示す。適正性ラベルが関連付けられた説明文が教師データ１３８となる。

適正性の判断は、商品分野に関する種々の法令とその運用方針、質疑応答集に基づき、専門性を有する熟練者の判断により行われる。

次に、モデル作成検証部１１５０は、特徴抽出処理を行う（ステップＳ１２０）。特徴抽出処理では、モデル作成検証部１１５０は、形態素分解を行ったうえで、自然言語処理を行い、文章特徴を抽出するアルゴリズムを作成する。そして、モデル作成検証部１１５０は、作成したアルゴリズムにより文章ベクター空間を生成する。

そして、モデル作成検証部１１５０は、機械学習による判別モデル作成処理を行う（ステップＳ１３０）。判別モデル作成処理では、モデル作成検証部１１５０は、文章特徴に対し、説明文ＤＢ１１３７に蓄積した説明文のうち、教師データ１３８に基づいて判別モデルＳＢｉを作成する。

機械学習では、一例として、マルチサポートベクターマシン（マルチＳＶＭ）等を用いて、文章ベクター空間における、適正性ラベルの分類を示す境界面３ｆを学習する。境界面３ｆの学習の過程で、モデル作成検証部１１５０は、精度検証処理を行う（ステップＳ１４０）。精度検証処理では、モデル作成検証部１１５０は、適正性ラベルのない説明文を用いて、モデルに含まれる種々の係数を変化させながらモデルの精度を算出する処理を繰り返し、最も高い精度で分類できるモデルを生成する。

また、教師データ１３８に加えて、適宜、オーバサンプリングを行う。オーバサンプリングでは、文章ベクター空間において、適正性ラベルと紐付いた文章特徴を示す点と点の間に、所定の距離で定められる近傍に文書特徴点が存在するように仮想的に点（以下、仮想点３ｖという）を追加することである。このような仮想点３ｖを追加することで、収集した教師データ１３８に適正性ラベルの偏りがある場合であってもモデルの精度を維持することができる。このような処理の一例として、ＳＭＯＴＥ（Synthetic Minority Over-sampling Technique）等を用いればよい。

このモデル作成検証処理全体を繰り返すことで、商品分野、国、及び評価観点の組み合せ毎の判別モデルが作成される。即ち、１又は複数の判別モデルＳＢｉが作成される。

図４は、第１実施例における説明文評価システムにおける説明文の評価処理を説明するためのフローチャート図である。図４において、クライアント端末３は、表示装置１５に表示されたサーバ装置１００に説明文４ｑを評価させるための画面から、商品分野、国、及び評価観点の選択を受け付け（ステップＳ２１１）、更に、ユーザによって指定された評価する説明文を読み込む（ステップＳ２１２）。

クライアント端末３は、ステップＳ２１１で受け付けた、商品分野、国、及び評価観点を指定した選択情報４ｓと、ステップＳ２１２で読み込んだ説明文とを含む評価要求４ｒを作成し、サーバ装置１００へ送信する（ステップＳ２１３）。評価要求４ｒがサーバ装置１００へと送信される。

サーバ装置１００では、クライアント端末３から評価要求４ｒを受信すると、説明文評価部１１８０は、受信した評価要求４ｒの選択情報４ｓから商品分野、及び１以上の評価観点を特定する（ステップＳ３２１）。

そして、説明文評価部１１８０は、選択情報４ｓで指定される商品分野及び国に基づいて、判別モデル群ＨＭＧを選択する（ステップＳ３２２）。また、説明文評価部１１８０は、選択情報４ｓで指定される１以上の評価観点に基づいて、評価観点ごとの判別モデルＳＢを選択する（ステップＳ３２３）。

次に、説明文評価部１１８０は、評価要求４ｒに含まれる説明文４ｑを解析して、ステップＳ３２３で選択した判別モデルＳＢごとに、リスクの有無を判定し（ステップＳ２３４）、評価説明情報５ｐを含む結果表示データ５ｒを作成し、クライアント端末３へ送信する（ステップＳ２３５）。サーバ装置１００における説明文評価部１１８０による説明文評価処理は終了する。

端末３では、結果表示データ５ｒを受信すると、結果表示データ５ｒから評価説明情報５ｐを取得して、表示装置１５に表示して（ステップＳ２１４）、端末３での処理を終了する。

以下に、上述した第１実施例における、米国の法令に基づいて化粧品を説明した訴求文を評価する判別モデルを作成し、作成した判別モデルを用いて評価対象の訴求文を評価する場合を第２実施例とし、その具体的な処理内容を説明する。第２実施例において、訴求文４ｐ（図５）は、第１実施例の説明文４ｑの一例である。

［第２実施例］
図５は、第２実施例における訴求文評価システムにおける機能構成例を示す図である。図５に示す訴求文評価システム１００２では、サーバ装置１００は、主に、知識ベース作成部６０と、判別モデル作成部７０と、訴求文評価部８０とを有する。知識ベース作成部６０と、判別モデル作成部７０と、訴求文評価部８０とは、ＣＰＵ１１１が対応するプログラムを実行することで行われる処理により実現される。

ここで、知識ベース作成部６０と、判別モデル作成部７０とは、事前処理を行い、第１実施例のモデル作成検証部１１５０に相当する。また、訴求文評価部８０は、第１実施例の説明文評価部１１８０に相当する。

また、記憶部１３０は、説明文ＤＢ１１３７、知識ベース１３７、教師データ１３８、判別モデル１３９、定義テーブル１４０、評価要求４ｒ、結果表示データ５ｒ等を記憶する。第２実施例における知識ベース１３７及び教師データ１３８は、第１実施例の説明文ＤＢ１１３７内の商品分野「化粧品」及び国「米国」に分類されるコーパスデータに相当する。

知識ベース作成部６０は、評価要求４ｒの選択情報４ｓで指定された商品分野「化粧品」及び国「米国」に基づいて、説明文ＤＢ１１３７から対応する化粧品の訴求文を抽出し、抽出した化粧品の訴求文に対して、単文単位に区切り、区切り毎の単語（又は文）の分散表現（ベクトル表現）を解析する。抽出した化粧品の訴求文は、コーパスデータに相当する。その解析結果を知識ベース１３７として記憶部１３０に記憶する。知識ベース作成部６０は、訴求文収集部６２と、単文化処理部６４と、分散表現解析部６６とを有する。

訴求文収集部６２は、訴求文を収集し、訴求文について専門知識を有する熟練者の操作に応じて、対象としたい領域（美類）の文章を選別させる。美類の文章の選別は、収集の段階で十分であれば省略可能である。

単文化処理部６４は、収集された訴求文において予め選別された対象となる領域の文章、即ち、美類の文章に対して、単文単位に区切る。単文化処理部６４は、日本語の場合には、文書に対しては単語の区切り認識も行う。

分散表現解析部６６は、単文化処理部６４によって区切られた単語の分散表現を解析する。分散表現解析部６６の一例として、Ｇｏｏｇｌｅ（登録商標）のオープンソースコードであるＤｏｃ２Ｖｅｃ（登録商標）又はＷｏｒｄ２Ｖｅｃ（登録商標）等を利用すればよい。ここでは、教師データのない機械学習が行われ、分散表現の解析結果が知識ベース１３７として記憶部１３０に出力される。

判別モデル作成部７０は、訴求文が法律やガイドラインに沿っており、評価観点において化粧品として適切な内容となっているかを判別する判別モデル１３９を作成する。

評価観点は、一つに限定されるものではない。評価観点は複数あってもよいし、各評価観点において更に詳細にレベル分けされてもよい。

本実施例では、化粧品の訴求としての相応しさ（ふさわしさ）をリスク値として示す。

判別モデル作成部７０は、更に、単文化処理部７２と、リスク値取得部７４と、機械学習部７６とを有する。単文化処理部７２は、収集した訴求文から学習用にサンプリングした訴求文（以下、学習用訴求文）を単文化する。

リスク値取得部７４は、単文化処理部７２から単文を受信すると、評価画面等を熟練者のクライアント端末３に表示するなどして、熟練者からリスク値を取得する。熟練者は、化粧品の訴求としての相応しさをリスク値として設定する。リスク値は、予め設定された定義テーブル１４０に順ずる。単文がリスク値と関連付けられ、教師データ１３８として記憶部１３０に格納される。

機械学習部７６は、知識ベース作成部６０で得た知識ベース１３７上で、リスク値取得部７４によって得られた教師データ１３８をより精度良く分類できるような判別モデル１３９を作成する。機械学習部７６は、マルチＳＶＭ等を用いる。教師データに偏りがある場合には、機械学習部７６は、ＳＭＯＴＥ等を用いて、仮想点３ｖを追加するオーバサンプリングを行うようにする。

判別モデル１３９は、訴求文内の単語又は文章が化粧品の訴求として相応しいか否かを判別するモデルである。判別モデル１３９は、第１実施例の米国用の判別モデル群ＨＭＧ４の１つに相当する。説明の便宜のため、一つの判別モデル１３９で説明するが、複数の判別モデルを備えてもよい。

訴求文評価部８０は、ネットワーク２を介してクライアント端末３から送信され、通信Ｉ／Ｆ１１７で受信した評価要求４ｒに応じて、評価要求４ｒに含まれる訴求文４ｐを評価する。評価要求４ｒは、記憶部１３０に記憶される。訴求文評価部８０は、単文化処理部８２と、単文単位評価部８４と、結果表示データ作成部８６とを有する。

単文化処理部８２は、評価要求４ｒに含まれる訴求文４ｐの入力に応じて、訴求文４ｐを単文化し、単文単位評価部８４に入力される。

単文単位評価部８４は、判別モデル１３９を用いて、訴求文４ｐを単文単位で評価し、単文が化粧品の訴求として相応しいか否かを判定する。評価結果が評価結果送信部８５に通知される。評価結果には、評価した単文と、定義テーブル１４０で定義されたリスク値とが示される。

結果表示データ作成部８６は、単文単位評価部８４による評価結果に基づいて、評価説明情報５ｐを付加した結果表示データ５ｒを評価要求４ｒの要求元のクライアント端末３へネットワーク２を介して送信する。

クライアント端末３は、ユーザの操作に応じて、Ｗｅｂブラウザ（またはアプリケーション）によりサーバ装置１００へアクセスすることにより、訴求文４ｐをサーバ装置１００に評価させ、サーバ装置１００から結果表示データ５ｒを受信する。結果表示データ５ｒに基づいて、訴求文４ｐ内の問題となる箇所を特定して、リスクの程度を示した評価説明が表示装置１５に表示する。

クライアント端末３に、評価するための画面Ｇ９０が表示装置１５に表示されると、ユーザは、所望の訴求文４ｐを設定し、サーバ装置１００に評価させる操作を行う。

サーバ装置１００からの結果表示データ５ｒの受信に応じて、画面Ｇ９０には、評価説明情報５ｐに基づいて、訴求文４ｐ内における見直しの箇所が特定され、見直しの理由が文章で説明されることにより、ユーザは、見直し対象となった単語（又は文章）をどの程度改訂すればよいかを容易に判断できる。

図６は、第２実施例における定義テーブルのデータ構成例を示す図である。図６において、定義テーブル１４０は、評価観点毎に、リスク値と説明とを対応付けたテーブルであり、評価観点、リスク値、説明等の項目を有する。

評価観点は、例えば化粧品の訴求としての相応しさを示す。熟練者にあらかじめ特定された評価観点に該当する単語は、その評価観点内におけるリスクの高さが指定される。リスク値はリスクの高さを示す。評価観点は複数あってもよい。

説明には、リスク値のそれぞれに対する説明文が設定されている。クライアント端末３に送信される結果表示データ５ｒにおいて、単文単位評価部８４によって判定されたリスク値に対応する説明文が評価説明情報５ｐに含まれる。

このデータ構成例では、リスク値が「１」から「３」まで定義されている。リスク値「３」の場合、「化粧品の範疇を逸脱しており、ＮＧ」であることを示す。リスク値「２」の場合、「化粧品の範疇を逸脱していると取られるリスクがある」ことを示す。リスク値「１」の場合、「化粧品の範疇の表現であり、問題なし」であることを示す。

このような評価観点のリスク値に基づく説明が画面Ｇ９０にてなされることで、訴求文に専門知識が十分にない部門のユーザに対しても安定した評価を提供することができる。

図７は、第２実施例における教師データのデータ構成例を示す図である。図７において、教師データ１３８は、リスク値取得部７４によって得られた訴求文ごとに評価結果を示したテーブルであり、商品名、評価結果、訴求文等の項目を有する。

商品名は、訴求文を記載する対象商品の名称を示す。商品名は省略してもよい。評価結果の値は、図６に例示したような定義テーブル１４０のリスク値である。訴求文は、評価済みの文章を示す。

図７のデータ構成例では、主に、英文の訴求文を示しているが、日本語、他の言語であってもよい。一例として、商品名「AAA」の化粧品に対して、評価された訴求文は、「AAA completely erases acne scars rejuvenating dermal collagen.」であり、その評価結果は、リスク値「３」が示され、つまり、明らかに化粧品の範疇を逸脱しており、ＮＧである、ことが示されている。

図７では、評価観点が１つの場合の例を示しているが、２以上の評価観点が選択された場合には、評価観点毎のリスク値が示される。また、理解を容易とするため、訴求文を文章で示したが、文章ベクター空間における座標を示してもよい。

教師データ１３８をより多く蓄積することで、訴求文評価部８０による評価結果の精度を改善することができる。教師データ１３８は、訴求文の収集時に専門的な知識を有する熟練者により評価された訴求文のみに限定されない。

クライアント端末３に提供済みの評価結果をログとして記憶部１３０に記憶し、専門的な知識を有する熟練者により、再度評価された場合には、教師データ１３８に追加するようにしてもよい。

次に、各処理部６０、７０及び８０による処理についてフローチャートで説明する。先ず、知識ベース作成部６０による知識ベース作成処理について説明する。図８は、第２実施例における知識ベース作成処理を説明するためのフローチャート図である。

図８において、知識ベース作成部６０では、訴求文収集部６２が複数の訴求文４ｃを収集する（ステップＳ６１１）。訴求文４ｃの収集では、一例として、英文の場合、約９０、０００件程度収集される。訴求文４ｃごとに商品名を取得してもよい。

また、訴求文収集部６２は、訴求文４ｃを分類して選別する（ステップＳ６１２）。訴求文４ｃの分類及び選別は、既に、十分になされていれば省略してもよい。

次に、単文化処理部６４は、訴求文４ｃの文章を単文化する（ステップＳ６１３）。製品単位で訴求文を単文単位に切り分ける。訴求文４ｃが日本語の場合、単語の区切り認識も行う。

そして、分散表現解析部６６は、単文ごとに、分散表現の解析処理を行う（ステップＳ６１４）。分散表現の解析処理では、教師データ無しの機械学習により、単語（又は文）の分散表現（ベクトル表現）が解析され、解析結果が知識ベース１３７に蓄積される。

次に、判別モデル作成部７０による判別モデル作成処理について説明する。図９は、第２実施例における判別モデル作成処理を説明するためのフローチャート図である。

図９において、判別モデル作成部７０では、学習用に訴求文（以下、学習用訴求文４ｔ）を選定する（ステップＳ６３１）。熟練者により、収集した訴求文４ｃから学習用訴求文４ｔを選定してもよいし、ランダムに抽出してもよい。選定された学習用訴求文４ｔは、記憶部１３０に記憶される。

単文化処理部７２は、学習用訴求文４ｔの文章を単文化し（ステップＳ６３２）、リスク値取得部７４は、熟練者から単文ごとのリスク値を取得する（ステップＳ６３３）。リスク値取得部７４は、熟練者のクライアント端末３にリスク値の設定画面を表示して熟練者から単文ごとのリスク値を取得してもよい。リスク値の設定画面は、単文に対してリスク値が設定可能な画面であればよい。設定されたリスク値は、単文ごとに対応付けて教師データ１３８に蓄積される。

機械学習部７６は、教師データ１３８を用いて、リスク値毎に単文の数をカウントし（ステップＳ６３４）、教師データ１３８に含まれる単文の総数に対するリスク値毎の単文の割合を算出する（ステップＳ６３５）。

機械学習部７６は、リスク値ごとの文章サンプル数の偏りの度合いについて評価する（ステップＳ６３６）。リスク値ごとの文章数の割合が所定の閾値を超えている場合（ステップＳ６３６のＹＥＳ）、機械学習部７６は、該当リスク値の教師データ１３８に偏りがあると判断し、オーバーサンプリングを行い（ステップＳ６３７）、ステップＳ６３７へと進む。一方、リスク値ごとの文章数の割合が所定の閾値を超えていない場合（ステップＳ６３６のＮＯ）、機械学習部７６は、ステップＳ６３７へと進む。

ステップＳ６３７のオーバーサンプリングを行う代わりに、教師データ１３８に対して統計的な有意性を担保できる前提であれば、教師データ１３８において、割合が高いリスク値を持つ単文を一部用いないようにしてもよい（ダウンサンプリング）。

学習用訴求文４ｔのすべてに対して単文ごとにリスク値が設定され、バラツキの少ない教師データ１３８が準備できると、機械学習部７６は、教師データ１３８を用いた知識ベース１３７の機械学習を行う（ステップＳ６３８）。

よって、化粧品の訴求として相応しいか否かを判別する判別モデル１３９が記憶部１３０に出力される（ステップＳ６３９）。

次に、訴求文評価部８０による訴求文評価処理について説明する。図１０は、第２実施例における訴求文評価処理を説明するためのフローチャート図である。図１０において、先ず、クライアント端末３にて、ユーザが評価したい訴求文４ｐを画面Ｇ９０で入力し（ステップＳ６４１）、評価ボタン９１ａ（図１１）が押下されることにより（ステップＳ６４３）、ユーザが入力した訴求文４ｐを含む評価要求４ｒがサーバ装置１００へ送信される。

サーバ装置１００では、評価要求４ｒを受信すると、訴求文評価部８０に通知され、訴求文評価部８０において、単文化処理部８２は、選択情報４ｓで指定される国から言語を特定し、評価要求４ｒに含まれる訴求文４ｐを単文化し（ステップＳ６５１）、単文１文を単文単位評価部８４に入力する（ステップＳ６５２）。

単文単位評価部８４は、選択情報４ｓで指定される商品分野から判別モデル１３９を選択し、化粧品の訴求としての相応しさの判別用の判別モデル１３９を用いて、入力された単文１文が化粧品の訴求としての相応しさに該当するリスク値を判別し（ステップＳ６５３）、リスク有りか否かを判断する（ステップＳ６５４）。即ち、図６の定義テーブル１４０より、リスク値が「２」以上であるか否かを判断すればよい。

評価結果のリスク値が「２」以上である場合、結果表示データ作成部８６は、定義テーブル１４０を用いて、リスク値に対応付けられた説明文を取得する（ステップＳ６５５）。

また、リスク値が「２」以上である場合、結果表示データ作成部８６は、知識ベース１３７を用いて、入力された単文に類似する単文を探索して代替案として取得する（ステップＳ６５６）。

その後、結果表示データ作成部８６は、評価結果に基づいて、リスク値「２」以上の単文に対して得た説明文、代替案等を用いて結果表示データ５ｒを作成する（ステップＳ６５７）。訴求文４ｐ内のリスク値「２」以上の単文に対して、文字色を変える、ハイライトする、下線を付加する等により区別可能な表示とし、単文の指定に応じて代替案を表示可能とするデータが結果表示データ５ｒに追加される。

結果表示データ作成部８６の処理の終了に応じて、単文化処理部８２は、未処理の次の単文があるか否かを判断する（ステップＳ６５８）。未処理の次の単文が存在する場合（ステップＳ６５８のＹＥＳ）、単文化処理部８２は、ステップＳ６５２へと戻り、未処理の次の単文を単文単位評価部８４に入力し、上述した同様の処理が繰り返される。

一方、未処理の次の単文が存在しない場合（ステップＳ６５８のＮＯ）、訴求文４ｐに対する評価を終了したと判断され、訴求文評価部８０は、記憶部１３０に記憶されている結果表示データ５ｒを評価要求４ｒの送信元のクライアント端末３に送信する（ステップＳ６５９）。

クライアント端末３では、画面Ｇ９０に、ステップＳ６４１で入力した訴求文４ｐに対して、リスクのある文章及び単語が識別可能に表示され、それら文章又は単語が選択された場合には、リスクの説明文が表示される。説明文には、代替案が含まれていてもよい。

図１１は、第２実施例におけるクライアント端末に表示される初期の画面例を示す図である。クライアント端末３の表示装置１５には、図１１に示すような、画面Ｇ９０が表示される。図１１において、初期に表示される画面Ｇ９０は、リスクチェック領域９ａのみを有する。リスクチェック領域９ａは、訴求文入力域７ａ、評価ボタン７ｂ、リセットボタン７ｃ等を有する。

訴求文入力域７ａは、ユーザが訴求文４ｐを入力する領域であり、初期状態では、ユーザに訴求文４ｐの入力を促すメッセージ等を表示するようにしてもよい。評価ボタン７ｂは、訴求文入力域７ａに入力された訴求文４ｐが化粧品の訴求として適正であるかを評価するためのボタンである。評価ボタン７ｂの押下に応じて、評価要求４ｒがサーバ装置１００へ送信される。リセットボタン７ｃは、訴求文入力域７ａを初期状態に戻すためのボタンである。

ユーザが、画面Ｇ９０の訴求文入力域７ａに訴求文４ｐを入力し、評価ボタン７ｂを押下すると、クライアント端末３からサーバ装置１００へと評価要求４ｒが送信される。サーバ装置１００から結果表示データ５ｒを受信すると、例えば、画面Ｇ９０は、図１２に示すように画面遷移する。

図１２は、第２実施例における結果表示データの受信時の画面例を示す図である。図１２に示す画面Ｇ９０では、リスクチェック領域９ａに加えて、評価結果領域９ｂを有する。リスクチェック領域９ａの構成は、図１１で説明した通りであるためその説明を省略する。

評価結果領域９ｂは、保存形式選択領域９ｃと、評価結果表示域８ａとを有する。保存形式選択領域９ｃは、クライアント端末３でデータ形式を選択して、評価結果を保存するための領域である。評価結果表示域８ａは、サーバ装置１００から受信した結果表示データ５ｒに基づいて、リスクチェック領域９ａの訴求文入力域７ａに入力された訴求文４ｐに対する評価結果を変更可能な表示域８ｍを有する。

表示域８ｍは、リスク値等を表示すると共に、ユーザによる見直しによって評価結果を変更可能に表示する領域であって、ＩＤ、判定文、リスク値、リスクワード数、類似文、不明ワード数等の項目を有する。

ＩＤは、リスクチェック領域９ａの訴求文入力域７ａに入力された訴求文４ｐを文単位に区切り、一文ごとに付与した識別番号である。判定文は、区切られた一文を示す。リスク値は、文章に対する化粧品の初級としての相応しさの程度を示す。評価結果は、３レベルのリスク値うちのどのレベルであるかを示し、熟練者等のユーザにより修正可能なように表示される。

リスクワード数は、該当文内に存在するリスクがあると判断された単語数を示す。類似文は、知識ベース１３７に訴求文４ｐと類似する文章が存在するか否かを示す。不明ワード数は、化粧品の訴求として適正であるか否かを判別できない単語数を示す。

この例では、ユーザが入力した訴求文４ｐは、一つの文章７ｄ「AAA completely erases acne scars rejuvenating dermal collagen.」のみであるため、評価結果表示域８ａでは、ＩＤ「１」、判定文「AAA completely erases acne scars rejuvenating ...」、リスク値「３」、リスクワード数「２」、類似文「あり」、および不明ワード数「０」であったことが示されている。ユーザがＩＤ「１」の横の選択ボタン８ｐを押下すると、例えば、図１３のように、評価結果の詳細が表示される。

図１３は、第２実施例における評価結果の詳細の表示例を示す図である。図１３において、画面Ｇ９０の評価結果領域９ｂには、図１２に示す保存形式選択領域９ｃと、評価結果表示域８ａとに加えて、判定文表示域８ｂ、リスクワード表示域８ｃ、不明ワード表示域８ｄ、類似文表示域８ｅ、備考表示域８ｆ等の詳細情報が表示される。

判定文表示域８ｂは、ＩＤ「１」の文章７ｄの全体を表示する領域である。リスクワード表示域８ｃは、文章７ｄ内で検出されたリスクワードと、そのリスク値とが示される。不明ワード表示域８ｄは、文章７ｄ内で判定できなかった単語が示される。類似文表示域８ｅは、知識ベース１３７から検索された文章７ｄに類似する文章と、そのリスク値および類似度（％）を示す。備考表示域８ｆは、文章７ｄに対するリスク値の根拠、対策等の説明文を表示する。

この例において、判定文表示域８ｂには、文章７ｄ「AAA completely erases acne scars rejuvenating dermal collagen.」が表示されると共に、リスク有りと判定された「acne」および「dermal」の部分９ｒが、容易に判別可能に表示される。部分９ｒは、他の単語の色とは異なる色、またはハイライトされて示されれば良い。

リスクワード表示域８ｃには、判定文表示域８ｂで判別可能に表示された部分９ｒの「acne」および「dermal」ごとにリスク値「２」と判定されたことが示されている。不明ワード表示域８ｄは、空白または「−」等により、この文章７ｄでは検出されたなかったことを示している。

類似文表示域８ｅは、３つの類似文が示され、それぞれのリスク値と類似度とが示されている。類似文「AAA erases △△△ … .」は、リスク値「１」および類似度「７７％」であったことが示されている。また、類似文「○○○○ moderately ○○○○ … .」は、リスク値「１」および類似度「７５％」であったことが示されている。更に、類似文「AAA reduces □□□□ … .」は、リスク値「１」および類似度「７５％」であったことが示されている。

備考表示域８ｆには、「化粧品の範囲を逸脱しています。」等の説明文が表示されている。この説明文は、経験を有する熟練者等のユーザにより変更されてもよい。

図１２及び図１３では、１つの文章７ｄのみを有する訴求文４ｐの例を説明したが、訴求文４ｐは、複数の文章から構成されていてもよい。訴求文４ｐが複数の文章を含む場合、文章ごとに評価結果が示される。

図１４は、第２実施例における結果表示データの受信時の他の画面例を示す図である。図１４において、画面Ｇ９０の構成は、図１２と同様であるため、その説明を省略する。図１４では、画面Ｇ９０のリスクチェック領域９ａに、ユーザが、文章７ｅ、７ｆ、７ｇ、７ｈ、および７ｉの複数の文章からなる訴求文４ｐを入力した場合を示している。

具体的には、訴求文４ｐは、文章７ｅの「BBB cream has been repackaged and is now available in a newly designed pack.」と、文章７ｆの「○○○○ ○○○ ○○○○.」と、文章７ｇの「This product is 100% protection against uv.」と、文章７ｈの「△△△△ … .」と、文章７ｉの「□□□□□□□ … .」とを有するものとする。

サーバ装置１００は、訴求文４ｐを文章ごとに分割する。例えば、この訴求文４ｐは、５文章に分割される。サーバ装置１００は、分割した５文章のそれぞれにＩＤを付与し、単文単位評価部８４により評価結果を得る。

評価結果領域９ｂでは、訴求文４ｐを分割した５文章それぞれを、ＩＤ「１」、ＩＤ「２」、ＩＤ「３」、ＩＤ「４」、およびＩＤ「５」で識別し、各文章の評価結果が示される。この例では、ＩＤ「１」の文章７ｅの評価結果は、リスク値「１」、リスクワード数「０」、類似文「なし」、不明ワード数「０」等を示す。ＩＤ「２」の文章７ｆの評価結果は、リスク値「２」、リスクワード数「１」、類似文「なし」、不明ワード数「０」等を示す。

また、ＩＤ「３」の文章７ｇの評価結果は、リスク値「３」、リスクワード数「１」、類似文「あり」、不明ワード数「０」等を示す。ＩＤ「４」の文章７ｈの評価結果は、リスク値「３」、リスクワード数「１」、類似文「あり」、不明ワード数「０」等を示す。ＩＤ「５」の文章７ｉの評価結果は、リスク値「１」、リスクワード数「０」、類似文「なし」、不明ワード数「０」等を示す。

ここで、リスクのレベルを識別可能に表示することが望ましい。一例として、リスク値が最も高い値「３」を示すＩＤ「３」およびＩＤ「４」の文章７ｇおよび７ｈは赤色系の色で示し、リスク値が次に高い「２」を示すＩＤ「２」の文章７ｆは黄色系の色で示し、リスク値が最も小さい（リスク無しと判断された）ＩＤ「１」およびＩＤ「５」の文章７ｅおよび７ｉは青色系の色で示せばよい。

図１４の画面Ｇ９０の評価結果領域９ｂにおいて、評価結果表示域８ａの「リスク値」にカーソルを近付けることで、リスク値の凡例９ｄを表示させることができる。凡例９ｄには、リスクのレベルを示すリスク値の値ごとに説明が示される。例えば、値「１」は「化粧品の範疇の表現であり、問題なし」、値「２」は「化粧品の範疇を逸脱していると取られるリスクがある」、また、値「３」は「明らかに化粧品の範疇を逸脱しており、ＮＧ」等の説明が表示される。

この画面Ｇ９０において、ユーザがＩＤ「３」の選択ボタン８ｐを押下すると、図１５に示すような評価結果の詳細が表示される。

図１５は、第２実施例における評価結果の詳細の他の表示例を示す図である。図１５において、画面Ｇ９０の評価結果領域９ｂには、ユーザが選択したＩＤ「３」の文章７ｇの評価結果の詳細が示される。

この場合、判定文表示域８ｂには、文章７ｇ「This product is 100% protection against uv.」が表示されると共に、リスク有りと判定された「100% protection against uv」の部分９ｔが、容易に判別可能に表示される。部分９ｔは、他の単語の色とは異なる色、またはハイライトされて示されれば良い。

リスクワード表示域８ｃには、判定文表示域８ｂで判別可能に表示された部分９ｒの「100% protection against uv」がリスク値「３」と判定されたことが示されている。不明ワード表示域８ｄは、空白または「−」等により、この文章７ｄでは検出されたなかったことを示している。

類似文表示域８ｅは、３つの類似文が示され、それぞれのリスク値と類似度とが示されている。類似文「The product is environmentally-friendly and cruelty-free.」は、リスク値「１」および類似度「３６％」であったことが示されている。また、類似文「The product is said to help *** **.」は、リスク値「１」および類似度「３４％」であったことが示されている。更に、類似文「This product retails in 100g pack.」は、リスク値「１」および類似度「３０％」であったことが示されている。

備考表示域８ｆには、「化粧品の範疇を逸脱しています。」等の説明文が表示されている。この説明文は、経験を有する熟練者等のユーザにより変更されてもよい。

このように、第２実施例では、訴求文４ｐ内のリスクのある表現を自動判別し、判別理由、代替案等を表示させることにより、いずれのユーザに対しても安定した評価を提供することができる。また、リスクの高い単語及び文章に対して、好ましい表現への変更を容易に行なうことができる。更に、熟練者にとって、種々の部門からの訴求文に関する問い合わせに掛る時間を削減でき、負担を軽減することができる。

［第３実施例］
次に、上述した第１実施例における、日本の法令に基づいて食品の説明文を評価する場合を第３実施例として、定義テーブル、教師データ、及び評価結果の例で説明する。第３実施例では、その機能構成の詳細は第２実施例と同様であるため省略される。

図１６は、第３実施例における定義テーブルのデータ構成例を示す図である。図１６において、定義テーブル２４０は、第２実施例と同様に、評価観点毎に、リスク値と説明とを対応付けたテーブルであり、評価観点、リスク値、説明等の項目を有する。

評価観点は、第１実施例同様に、例えば食品の説明としての相応しさを示す。熟練者にあらかじめ特定された評価項目に該当する単語は、その評価項目内におけるリスクの高さが指定される。リスク値はリスクの高さを示す。評価観点は複数あってもよい。

このデータ構成例では、リスク値が「１」から「３」まで定義されている。リスク値「３」の場合、「食品の説明は誤認表示に該当しており、ＮＧ」であることを示す。リスク値「２」の場合、「食品の説明は誤認表示に該当すると取られるリスクがある」ことを示す。リスク値「１」の場合、「食品の説明は適正な表現であり、問題なし」であることを示す。

このような評価観点のリスク値に基づく説明が、第２実施例と同様に、画面Ｇ９０にてなされることで、食品の説明文に専門知識が十分にない部門のユーザに対しても安定した評価を提供することができる。

図１７は、第３実施例における教師データのデータ構成例を示す図である。図１７において、教師データ２３８は、第２実施例のリスク値取得部７４と同様の処理部によって得られた説明文ごとに評価結果を示したテーブルであり、商品名、評価結果、説明文等の項目を有する。

商品名は、説明文を記載する対象商品の名称を示す。商品名は省略してもよい。評価結果の値は、図１７に例示したような定義テーブル２４０のリスク値である。説明文は、評価済みの文章を示す。

図１７のデータ構成例では、主に、日本語の説明文を示しているが、他の言語であってもよい。一例として、商品名「あいうえお」の商品に対して、評価された説明文は、「一日一回の飲料で、運動や食事制限なく、体脂肪が劇的に減少！！」であり、その評価結果は、リスク値「３」が示され、つまり、明らかに食品の説明は誤認表示に該当しており、ＮＧである、ことが示されている。

図１７では、評価観点が１つの場合の例を示しているが、２以上の評価観点が選択された場合には、評価観点毎のリスク値が示される。また、理解を容易とするため、説明文を文章で示したが、文章ベクター空間における座標が示されてもよい。

図１８は、第３実施例における評価結果の詳細の表示例を示す図である。図１８において、第２実施例と同様に、画面Ｇ９０の評価結果領域９ｂには、説明文４ｑに含まれていた文章７ｋの評価結果の詳細が示される。

この場合、判定文表示域８ｂには、文章７ｋ「１日３錠で、免疫力アップ！生活習慣病、ガン予防に抜群の効果！！」が表示されると共に、リスク有りと判定された「ガン予防に抜群の効果」の部分９ｗが、容易に判別可能に表示される。部分９ｗは、他の単語の色とは異なる色、またはハイライトされて示されれば良い。

リスクワード表示域８ｃには、判定文表示域８ｂで判別可能に表示された部分９ｗの「ガン予防に抜群の効果」がリスク値「３」と判定されたことが示されている。不明ワード表示域８ｄは、空白または「−」等により、この文章７ｋでは検出されたなかったことを示している。

類似文表示域８ｅは、１つの類似文が示され、そのリスク値と類似度とが示されている。類似文「日常の食事に不足しがちな栄養成分を補充できます。」は、リスク値「１」および類似度「２９％」であったことが示されている。

備考表示域８ｆには、「食品の誤認表示に該当しています。」等の説明文が表示されている。この説明文は、経験を有する熟練者等のユーザにより変更されてもよい。

このように、第３実施例では、説明文４ｑ内のリスクのある表現を自動判別し、判別理由、代替案等を表示させることにより、いずれのユーザに対しても安定した評価を提供することができる。また、リスクの高い単語及び文章に対して、好ましい表現への変更を容易に行なうことができる。更に、熟練者にとって、種々の部門からの説明文に関する問い合わせに掛る時間を削減でき、負担を軽減することができる。

２ネットワーク
３クライアント端末
４ｒ評価要求
４ｐ訴求文
４ｑ説明文
４ｓ選択情報
５ｒ結果表示データ
５ｐ評価説明情報
６０知識ベース作成部
６２訴求文収集部
６４単文化処理部
６６分散表現解析部
７０判別モデル作成部
７２単文化処理部
７４リスク値取得部
７６機械学習部
８０訴求文評価部
８２単文化処理部
８４単文単位評価部
８６結果表示データ作成部
１００サーバ装置
１１、１１１ＣＰＵ
１２、１１２主記憶装置
１３、１１３補助記憶装置
１４、１１４入力装置
１５、１１５表示装置
１７、１１７通信Ｉ／Ｆ
１８、１１８ドライブ装置
１９、１１９記憶媒体
３０、１３０記憶部
１３７知識ベース
１３８教師データ
１３９判別モデル
Ｇ９０画面
１１３７説明文ＤＢ
１１５０モデル作成検証部
１１８０説明文評価部

Claims

商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理ステップと、
単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価ステップと、
評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価ステップによる評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成ステップと、
をコンピュータが行う説明文評価方法。
前記結果表示データ作成ステップは、更に、
予め収集した説明文に対して分散表現の解析結果を蓄積した知識ベースを参照して、前記評価要求の説明文の単文に類似する文を代替案として取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章に加え、代替案を表示可能とする結果表示データを作成する
ことを特徴とする請求項１記載の説明文評価方法。
前記単文単位評価ステップは、
前記評価要求の訴求文を単文単位で評価する
ことを特徴とする請求項１又は２記載の説明文評価方法。
前記評価要求は、前記商品が属する商品分野、国、及び評価観点の少なくとも１つ以上を指定し、
前記評価要求の指定に対応する前記モデルを選択するモデル選択ステップ
を更に有することを特徴とする請求項１乃至３のいずれか一項記載の説明文評価方法。
前記モデル選択ステップは、２以上の前記評価観点が指定された場合、該評価観点毎に前記モデルを選択し、
前記単文単位評価ステップは、選択した前記モデル毎に、前記単文の内容を前記法令に従って評価する
ことを特徴とする請求項４記載の説明文評価方法。
前記モデルの作成用に収集した複数の商品に関する複数の説明文を収集し、収集した該複数の説明文からサンプリングして、サンプリングした説明文を前記法令に従って適正性を判定し、判定した結果を関連付けて構造化する収集・構造化ステップと、
前記サンプリングした前記説明文を解析して文章特徴を抽出して文章ベクター空間を生成する特徴抽出ステップと、
前記適正性が判定された説明文を教師データとして用いた機械学習により前記文章特徴を分類することで、前記モデルを作成するモデル作成ステップと、
を更に有する請求項１乃至５のいずれか一項記載の説明文評価方法。
前記モデル作成ステップは、マルチサポートベクターマシンを用いて、前記教師データを分類し、該分類ごとの教師データの数に偏りがある場合には、前記文章ベクター空間の所定の距離で定められる近傍に文書特徴点が存在するように点を追加するオーバーサンプリングを行う
ことを特徴とする請求項６記載の説明文評価方法。
前記商品が属する商品分野、国、及び評価観点の組み合せ毎に、前記収集・構造化ステップと、前記特徴抽出ステップと、前記モデル作成ステップとを繰り返す
ことを特徴とする請求項６乃至７のいずれか一項記載の説明文評価方法。
商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理部と、
単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価部と、
評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価部による評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成部と、
を有する説明文評価装置。
コンピュータを、
商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理手段、
単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価手段、
評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価手段による評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成手段、
として機能させる説明文評価プログラム。