JP2019028937A - 説明文評価方法、説明文評価装置及び説明文評価プログラム - Google Patents

説明文評価方法、説明文評価装置及び説明文評価プログラム Download PDF

Info

Publication number
JP2019028937A
JP2019028937A JP2017150873A JP2017150873A JP2019028937A JP 2019028937 A JP2019028937 A JP 2019028937A JP 2017150873 A JP2017150873 A JP 2017150873A JP 2017150873 A JP2017150873 A JP 2017150873A JP 2019028937 A JP2019028937 A JP 2019028937A
Authority
JP
Japan
Prior art keywords
sentence
evaluation
unit
product
explanatory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017150873A
Other languages
English (en)
Other versions
JP6896552B2 (ja
Inventor
智裕 桑原
Tomohiro Kuwabara
智裕 桑原
矢野 亮
Akira Yano
亮 矢野
直哉 前田
Naoya Maeda
直哉 前田
理沙 松元
Risa Matsumoto
理沙 松元
拓也 茨木
Takuya IBARAKI
拓也 茨木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shiseido Co Ltd
NTT Data Institute of Management Consulting Inc
NTT Data Group Corp
Original Assignee
NTT Data Corp
Shiseido Co Ltd
NTT Data Institute of Management Consulting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp, Shiseido Co Ltd, NTT Data Institute of Management Consulting Inc filed Critical NTT Data Corp
Priority to JP2017150873A priority Critical patent/JP6896552B2/ja
Publication of JP2019028937A publication Critical patent/JP2019028937A/ja
Application granted granted Critical
Publication of JP6896552B2 publication Critical patent/JP6896552B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】本発明の課題は、商品の説明文に対し安定した評価を迅速に得ることを目的とする。【解決手段】 上記課題は、商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理ステップと、単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価ステップと、評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価ステップによる評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成ステップと、をコンピュータが行う説明文評価方法により達成される。【選択図】 図1

Description

本願は、説明文評価方法、説明文評価装置及び説明文評価プログラムに関する。
商品のパッケージやTV、新聞、雑誌等における宣伝広告には、通常、使用方法、使用効果等を示した説明文が記載されている。消費者が品質、有効性、安全性等を適切に把握し商品を購入し及び使用できるように、医薬品医療機器法(薬機法)や景品表示法等の様々な法令によって、説明文に対して様々な規制やガイドラインの策定がなされている。
商品の特長を表わす表現は、様々な法令等の規制のもとで、消費者が通常理解するであろう効能及び効果の範囲を超えた内容を含んではならない。このようなことから、商品の説明文は、通常、熟練者等によってチェックされている。
説明文として適切な語を選択するために、文書内の未知の語の前後の語から未知の語となり得る語を予測する技術等(例えば、特許文献1参照)を用いることが考えられる。
米国特許第9037464号
しかしながら、説明文は、商品を計画及び開発する担当者が、様々な法令等の規制に従い適切な表現であるか否かを評価することは難しく、不明な場合は、熟練者に問合せて確認することが行われている。
一方、熟練者の教育には時間を要し、また、今日では各部門の担当者からの問合せも増加傾向にあり、対応に追われる状況にある。また、説明文は熟練者の経験に基づき評価された場合、熟練者により異なる判断となる場合があり、一定の評価を得ることが難しいといった問題がある。
したがって、一つの側面では、本発明は、商品の説明文に対し安定した評価を迅速に得ることを目的とする。
一つの形態によれば、商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理ステップと、単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価ステップと、評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価ステップによる評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成ステップと、をコンピュータが行う説明文評価方法が提供される。
また、上記課題を解決するための手段として、説明文評価装置及び説明文評価プログラムとすることもできる。
説明文に対し安定した評価を迅速に得ることができる。
第1実施例における説明文評価システムのネットワーク構成例を示す図である。 第1実施例における説明文評価システムにおけるハードウェア構成を示す図である。 第1実施例におけるモデル作成検証処理を説明するためのフローチャート図である。 第1実施例における説明文評価システムにおける説明文の評価処理を説明するためのフローチャート図である。 第2実施例における訴求文評価システムにおける機能構成例を示す図である。 第2実施例における定義テーブルのデータ構成例を示す図である。 第2実施例における教師データのデータ構成例を示す図である。 第2実施例における知識ベース作成処理を説明するためのフローチャート図である。 第2実施例における判別モデル作成処理を説明するためのフローチャート図である。 第2実施例における訴求文評価処理を説明するためのフローチャート図である。 第2実施例におけるクライアント端末に表示される初期の画面例を示す図である。 第2実施例における結果表示データの受信時の画面例を示す図である。 第2実施例における評価結果の詳細の表示例を示す図である。 第2実施例における結果表示データの受信時の他の画面例を示す図である。 第2実施例における評価結果の詳細の他の表示例を示す図である。 第3実施例における定義テーブルのデータ構成例を示す図である。 第3実施例における教師データのデータ構成例を示す図である。 図18は、第3実施例における評価結果の詳細の表示例を示す図である。
以下、本発明を実施するための形態について図面を参照して説明するが、本発明は、下記の実施形態に制限されることはなく、本発明の範囲を逸脱することなく、下記の実施形態に種々の変形および置換を加えることができる。
[第1実施例]
先ず、販売される商品、サービス(役務)等に関する説明文を、商品分野、それぞれの国又は地域(以下、国という。)の法令等に従った内容であるかを評価する説明文評価システム1000の概要を説明する。
図1は、第1実施例における説明文評価システムのネットワーク構成例を示す図である。図1において、説明文評価システム1000は、サーバ装置100と、複数のクライアント端末3とを有し、それぞれは、ネットワーク2を介して接続可能である。
サーバ装置100は、クライアント端末3から説明文の評価要求4rを受信すると、評価要求4rの選択情報4sで指定される商品分野、国、及び評価観点に基づいて、評価要求4rに含まれる説明文4qの評価を行う。その評価結果に基づいて、評価説明情報5pが付加された結果表示データ5rをクライアント端末3に提供する。説明文4qは、テキストデータ、音声データ等である。
サーバ装置100は、評価要求4rを受信すると、評価要求4rの選択情報4sで指定される評価観点に基づき予め作成したモデルを用いて説明文4qを評価し、その評価結果に基づいて、評価説明情報5pが付加された結果表示データ5rを出力する。
評価説明情報5pは、リスクのある文章及び単語を識別可能に表示させるコード、リスクのある文章及び単語が選択された場合に説明文が表示されるように文章及び単語にそれぞれの説明文をリンクさせるコード、説明文等のデータを含む。説明文に加え、代替案を含んでもよい。
クライアント端末3は、ユーザの操作に応じて、ユーザによって指定された評価する説明文4qを含む評価要求4rをサーバ装置100へ送信し、サーバ装置100から結果表示データ5rを受信して表示する。
このような、評価説明情報5pを提供するサーバ装置100は、商品、サービス(役務)等の説明文4qを対象としてもよい。一例として、化粧品、食品、不動産・金融等である。さまざまな商品の説明文4qに対応するために、図1に例示されるように、サーバ装置100は、化粧品の商品分野SB1と、食品の商品分野SB2と、不動産・金融の商品分野SB3等のそれぞれにおいて、判別モデル群を備えるようにする。判別モデル群は、国ごとに備えられてもよい。ここでは、各商品分野で国ごとに判別モデル群を備えた場合の機能構成の概要を示す。
例えば、サーバ装置100は、モデル作成検証部1150と、説明文評価部1180と、説明文DB1137と、化粧品の商品分野SB1に対して、国ごとの判別モデル群HMG1、HMG2、HMG3、HMG4、HMG5等(総称して、複数の判別モデル群HMGという場合がある。)を有する。
判別モデル群HMG1は、日本の法令等に対応した、評価観点aに基づく判別モデルSB1a、評価観点bに基づく判別モデルSB1b等を有する。判別モデル群HMG2は、韓国の法令等に対応した、評価観点aに基づく判別モデルSB2a、評価観点bに基づく判別モデルSB2b等である。
判別モデル群HMG3は、中国の法令等に対応した、評価観点a3に基づく判別モデルSB3a、評価観点b3に基づく判別モデルSB3b等である。判別モデル群HMG4は、米国の法令等に対応した、評価観点a4に基づく判別モデルSB4a、評価観点b4に基づく判別モデルSB4b等である。
判別モデル群HMG5は、欧州の法令等に対応した、評価観点aに基づく判別モデルSB5a、評価観点bに基づく判別モデルSB5b等を有する。判別モデルSB1a、・・・、SB5b等は、いずれかを特定しない限り、単に、判別モデルSBという。
これらの判別モデルSBの各々は、モデル作成検証部1150によって、判別モデル作成用に収集した多くの説明文を蓄積した説明文DB1137を用いて、同様の処理により作成され適正性が検証されたモデルである。
説明文DB1137は、各商品分野において国毎に収集し蓄積した説明文を管理するデータベースである。収集し蓄積した説明文はコーパスデータに相当し、説明文DB1137は、商品分野及び国毎のコーパスデータを含んでいる。
モデル作成検証部1150及び説明文評価部1180は、後述されるCPU111(図2)が対応するプログラムを実行することによる処理によって実現され、それらの処理については後述される。
図1では、クライアント端末3とサーバ装置100とがネットワーク2を介して接続されるネットワーク構成で説明したが、サーバ装置100の機能を有するスタンドアロン装置でユーザが説明文4qの評価を行う形態でもよい。また、商品分野ごとに個別のサーバ装置に同様の機能構成を持たせるようにしてもよい。或いは、国ごとに個別のサーバ装置としてもよい。
ここで、商品分野ごとに関連する法令には、次の様なものがある。
・化粧品
薬機法等
・食品(一般食品、特定保健用食品、栄養機能食品、機能性表示食品、健康食品)
景品表示法、特定商取引法、JAS法等
・不動産・金融
景品表示法等
である。
更に、化粧品に関して、主な国ごとの法令を示す。
・韓国
化粧品法、広告ガイドライン等
・中国
化粧品衛星監督条例、中華人民共和国消費者権益保護法等
・米国
Federal Food, Drug, and Cosmetic Act、 Federal Trade Commission Act、Fair Packaging and Labeling Act等
・欧州
Cosmetic Regulation, Unfair commercial practices directive等
である。
以下の説明では、1つのサーバ装置100において、少なくとも1つの商品分野に対して、複数の国のそれぞれの法令に基づいて判別モデルを作成する場合で説明する。
第1実施例では、国内及び諸外国の様々な法令に十分に精通していないユーザであっても、作成した説明文4qの評価を行うことができる。
図2は、第1実施例における説明文評価システムにおけるハードウェア構成を示す図である。図2において、サーバ装置100は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)111と、主記憶装置112と、補助記憶装置113と、入力装置114と、表示装置115と、通信I/F(インターフェース)117と、ドライブ装置118とを有し、バスB1に接続される。
CPU111は、主記憶装置112に格納されたプログラムに従ってサーバ装置100を制御するプロセッサに相当する。主記憶装置112には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU111にて実行されるプログラム、CPU111での処理に必要なデータ、CPU111での処理にて得られたデータ等を記憶又は一時保存する。
補助記憶装置113には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置113に格納されているプログラムの一部が主記憶装置112にロードされ、CPU111に実行されることによって、各種処理が実現される。記憶部130は、主記憶装置112及び/又は補助記憶装置113に相当する。
入力装置114は、マウス、キーボード等を有し、ユーザがサーバ装置100による処理に必要な各種情報を入力するために用いられる。表示装置115は、CPU111の制御のもとに必要な各種情報を表示する。入力装置114と表示装置115とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F117は、有線又は無線などのネットワークを通じて通信を行う。通信I/F117による通信は無線又は有線に限定されるものではない。
サーバ装置100によって行われる処理を実現するプログラムは、例えば、プログラムを提供する外部サーバ装置からネットワーク2を介してダウンロードすることで取得する。
ドライブ装置118は、ドライブ装置118にセットされた記憶媒体119(例えば、CD−ROM等)とサーバ装置100とのインターフェースを行う。本実施例に係る処理を実現するプログラムは、CD−ROM(Compact Disc Read-Only Memory)等の記憶媒体119によってサーバ装置100に提供してもよい。
この場合、後述される本実施の形態に係る種々の処理を実現するプログラムを格納した記憶媒体119をドライブ装置118に設定することにより、この記憶媒体119に格納されたプログラムをサーバ装置100にインストールしてもよい。インストールされたプログラムは、サーバ装置100により実行可能となる。
尚、プログラムを格納する記憶媒体119はCD−ROMに限定されず、コンピュータが読み取り可能な、データとしての構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD−ROMの他に、DVD(Digital Versatile Disk)ディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。
クライアント端末3は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)11と、主記憶装置12と、補助記憶装置13と、入力装置14と、表示装置15と、通信I/F(インターフェース)17と、ドライブ装置18とを有し、バスB2に接続される。
CPU11は、主記憶装置12に格納されたプログラムに従ってクライアント端末3を制御するプロセッサに相当する。主記憶装置12には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を記憶又は一時保存する。
補助記憶装置13には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置13に格納されているプログラムの一部が主記憶装置12にロードされ、CPU11に実行されることによって、各種処理が実現される。記憶部30は、主記憶装置12及び/又は補助記憶装置13に相当する。
入力装置14は、マウス、キーボード等を有し、ユーザがクライアント端末3による処理に必要な各種情報を入力するために用いられる。表示装置15は、CPU11の制御のもとに必要な各種情報を表示する。入力装置14と表示装置15とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F17は、有線又は無線などのネットワークを通じて通信を行う。通信I/F17による通信は無線又は有線に限定されるものではない。
クライアント端末3によって行われる処理は、Webブラウザを介してサーバ装置100と接続することにより実現されればよい。
ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19(例えば、CD−ROM等)とクライアント端末3とのインターフェースを行う。
クライアント端末3によって行われる処理を実現する他の方法として、記憶媒体19に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体19に格納されたプログラムは、ドライブ装置18を介してクライアント端末3にインストールしてもよい。インストールされたプログラムは、クライアント端末3により実行可能となる。
尚、この場合、プログラムを格納する記憶媒体19はCD−ROMに限定されず、コンピュータが読み取り可能な、データとしての構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD−ROMの他に、DVD(Digital Versatile Disk)ディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。
クライアント端末3は、ラップトップ、タブレット端末等であってもよい。その場合、記憶媒体19は、SD(Secure Digital)メモリカード等であり、ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19と端末3とのインターフェースを行う。
モデル作成検証部1150によるモデル作成検証処理について説明する。図3は、第1実施例におけるモデル作成検証処理を説明するためのフローチャート図である。図3において、説明文DB1137から商品分野、国、及び評価観点の組み合せ毎に複数の説明文(コーパスデータ)を選択し、各組み合せに対して、以下の処理を行う。説明文DB1137からのコーパスデータの選択は、商品分野及び国を選択する画面を、表示装置115に表示させ、ユーザの指定に基づき、一致または関連する種類のコーパスデータを抽出すればよい。
先ず、モデル作成検証部1150は、収集・構造化処理を行う(ステップS110)。収集・構造化処理では、モデル作成検証部1150は、判別モデル作成用の説明文を収集し、収集した説明文からサンプリングして、適正性ラベルを関連付けて構造化する。説明文DB1137から抽出したコーパスデータにおいて、サンプリングされた説明文に対して適正性が判断され、その判断結果が適正性ラベルに相当する。適正性ラベルは、不適切、要注意、又は適正のいずれかを示す。適正性ラベルが関連付けられた説明文が教師データ138となる。
適正性の判断は、商品分野に関する種々の法令とその運用方針、質疑応答集に基づき、専門性を有する熟練者の判断により行われる。
次に、モデル作成検証部1150は、特徴抽出処理を行う(ステップS120)。特徴抽出処理では、モデル作成検証部1150は、形態素分解を行ったうえで、自然言語処理を行い、文章特徴を抽出するアルゴリズムを作成する。そして、モデル作成検証部1150は、作成したアルゴリズムにより文章ベクター空間を生成する。
そして、モデル作成検証部1150は、機械学習による判別モデル作成処理を行う(ステップS130)。判別モデル作成処理では、モデル作成検証部1150は、文章特徴に対し、説明文DB1137に蓄積した説明文のうち、教師データ138に基づいて判別モデルSBiを作成する。
機械学習では、一例として、マルチサポートベクターマシン(マルチSVM)等を用いて、文章ベクター空間における、適正性ラベルの分類を示す境界面3fを学習する。境界面3fの学習の過程で、モデル作成検証部1150は、精度検証処理を行う(ステップS140)。精度検証処理では、モデル作成検証部1150は、適正性ラベルのない説明文を用いて、モデルに含まれる種々の係数を変化させながらモデルの精度を算出する処理を繰り返し、最も高い精度で分類できるモデルを生成する。
また、教師データ138に加えて、適宜、オーバサンプリングを行う。オーバサンプリングでは、文章ベクター空間において、適正性ラベルと紐付いた文章特徴を示す点と点の間に、所定の距離で定められる近傍に文書特徴点が存在するように仮想的に点(以下、仮想点3vという)を追加することである。このような仮想点3vを追加することで、収集した教師データ138に適正性ラベルの偏りがある場合であってもモデルの精度を維持することができる。このような処理の一例として、SMOTE(Synthetic Minority Over-sampling Technique)等を用いればよい。
このモデル作成検証処理全体を繰り返すことで、商品分野、国、及び評価観点の組み合せ毎の判別モデルが作成される。即ち、1又は複数の判別モデルSBiが作成される。
図4は、第1実施例における説明文評価システムにおける説明文の評価処理を説明するためのフローチャート図である。図4において、クライアント端末3は、表示装置15に表示されたサーバ装置100に説明文4qを評価させるための画面から、商品分野、国、及び評価観点の選択を受け付け(ステップS211)、更に、ユーザによって指定された評価する説明文を読み込む(ステップS212)。
クライアント端末3は、ステップS211で受け付けた、商品分野、国、及び評価観点を指定した選択情報4sと、ステップS212で読み込んだ説明文とを含む評価要求4rを作成し、サーバ装置100へ送信する(ステップS213)。評価要求4rがサーバ装置100へと送信される。
サーバ装置100では、クライアント端末3から評価要求4rを受信すると、説明文評価部1180は、受信した評価要求4rの選択情報4sから商品分野、及び1以上の評価観点を特定する(ステップS321)。
そして、説明文評価部1180は、選択情報4sで指定される商品分野及び国に基づいて、判別モデル群HMGを選択する(ステップS322)。また、説明文評価部1180は、選択情報4sで指定される1以上の評価観点に基づいて、評価観点ごとの判別モデルSBを選択する(ステップS323)。
次に、説明文評価部1180は、評価要求4rに含まれる説明文4qを解析して、ステップS323で選択した判別モデルSBごとに、リスクの有無を判定し(ステップS234)、評価説明情報5pを含む結果表示データ5rを作成し、クライアント端末3へ送信する(ステップS235)。サーバ装置100における説明文評価部1180による説明文評価処理は終了する。
端末3では、結果表示データ5rを受信すると、結果表示データ5rから評価説明情報5pを取得して、表示装置15に表示して(ステップS214)、端末3での処理を終了する。
以下に、上述した第1実施例における、米国の法令に基づいて化粧品を説明した訴求文を評価する判別モデルを作成し、作成した判別モデルを用いて評価対象の訴求文を評価する場合を第2実施例とし、その具体的な処理内容を説明する。第2実施例において、訴求文4p(図5)は、第1実施例の説明文4qの一例である。
[第2実施例]
図5は、第2実施例における訴求文評価システムにおける機能構成例を示す図である。図5に示す訴求文評価システム1002では、サーバ装置100は、主に、知識ベース作成部60と、判別モデル作成部70と、訴求文評価部80とを有する。知識ベース作成部60と、判別モデル作成部70と、訴求文評価部80とは、CPU111が対応するプログラムを実行することで行われる処理により実現される。
ここで、知識ベース作成部60と、判別モデル作成部70とは、事前処理を行い、第1実施例のモデル作成検証部1150に相当する。また、訴求文評価部80は、第1実施例の説明文評価部1180に相当する。
また、記憶部130は、説明文DB1137、知識ベース137、教師データ138、判別モデル139、定義テーブル140、評価要求4r、結果表示データ5r等を記憶する。第2実施例における知識ベース137及び教師データ138は、第1実施例の説明文DB1137内の商品分野「化粧品」及び国「米国」に分類されるコーパスデータに相当する。
知識ベース作成部60は、評価要求4rの選択情報4sで指定された商品分野「化粧品」及び国「米国」に基づいて、説明文DB1137から対応する化粧品の訴求文を抽出し、抽出した化粧品の訴求文に対して、単文単位に区切り、区切り毎の単語(又は文)の分散表現(ベクトル表現)を解析する。抽出した化粧品の訴求文は、コーパスデータに相当する。その解析結果を知識ベース137として記憶部130に記憶する。知識ベース作成部60は、訴求文収集部62と、単文化処理部64と、分散表現解析部66とを有する。
訴求文収集部62は、訴求文を収集し、訴求文について専門知識を有する熟練者の操作に応じて、対象としたい領域(美類)の文章を選別させる。美類の文章の選別は、収集の段階で十分であれば省略可能である。
単文化処理部64は、収集された訴求文において予め選別された対象となる領域の文章、即ち、美類の文章に対して、単文単位に区切る。単文化処理部64は、日本語の場合には、文書に対しては単語の区切り認識も行う。
分散表現解析部66は、単文化処理部64によって区切られた単語の分散表現を解析する。分散表現解析部66の一例として、Google(登録商標)のオープンソースコードであるDoc2Vec(登録商標)又はWord2Vec(登録商標)等を利用すればよい。ここでは、教師データのない機械学習が行われ、分散表現の解析結果が知識ベース137として記憶部130に出力される。
判別モデル作成部70は、訴求文が法律やガイドラインに沿っており、評価観点において化粧品として適切な内容となっているかを判別する判別モデル139を作成する。
評価観点は、一つに限定されるものではない。評価観点は複数あってもよいし、各評価観点において更に詳細にレベル分けされてもよい。
本実施例では、化粧品の訴求としての相応しさ(ふさわしさ)をリスク値として示す。
判別モデル作成部70は、更に、単文化処理部72と、リスク値取得部74と、機械学習部76とを有する。単文化処理部72は、収集した訴求文から学習用にサンプリングした訴求文(以下、学習用訴求文)を単文化する。
リスク値取得部74は、単文化処理部72から単文を受信すると、評価画面等を熟練者のクライアント端末3に表示するなどして、熟練者からリスク値を取得する。熟練者は、化粧品の訴求としての相応しさをリスク値として設定する。リスク値は、予め設定された定義テーブル140に順ずる。単文がリスク値と関連付けられ、教師データ138として記憶部130に格納される。
機械学習部76は、知識ベース作成部60で得た知識ベース137上で、リスク値取得部74によって得られた教師データ138をより精度良く分類できるような判別モデル139を作成する。機械学習部76は、マルチSVM等を用いる。教師データに偏りがある場合には、機械学習部76は、SMOTE等を用いて、仮想点3vを追加するオーバサンプリングを行うようにする。
判別モデル139は、訴求文内の単語又は文章が化粧品の訴求として相応しいか否かを判別するモデルである。判別モデル139は、第1実施例の米国用の判別モデル群HMG4の1つに相当する。説明の便宜のため、一つの判別モデル139で説明するが、複数の判別モデルを備えてもよい。
訴求文評価部80は、ネットワーク2を介してクライアント端末3から送信され、通信I/F117で受信した評価要求4rに応じて、評価要求4rに含まれる訴求文4pを評価する。評価要求4rは、記憶部130に記憶される。訴求文評価部80は、単文化処理部82と、単文単位評価部84と、結果表示データ作成部86とを有する。
単文化処理部82は、評価要求4rに含まれる訴求文4pの入力に応じて、訴求文4pを単文化し、単文単位評価部84に入力される。
単文単位評価部84は、判別モデル139を用いて、訴求文4pを単文単位で評価し、単文が化粧品の訴求として相応しいか否かを判定する。評価結果が評価結果送信部85に通知される。評価結果には、評価した単文と、定義テーブル140で定義されたリスク値とが示される。
結果表示データ作成部86は、単文単位評価部84による評価結果に基づいて、評価説明情報5pを付加した結果表示データ5rを評価要求4rの要求元のクライアント端末3へネットワーク2を介して送信する。
クライアント端末3は、ユーザの操作に応じて、Webブラウザ(またはアプリケーション)によりサーバ装置100へアクセスすることにより、訴求文4pをサーバ装置100に評価させ、サーバ装置100から結果表示データ5rを受信する。結果表示データ5rに基づいて、訴求文4p内の問題となる箇所を特定して、リスクの程度を示した評価説明が表示装置15に表示する。
クライアント端末3に、評価するための画面G90が表示装置15に表示されると、ユーザは、所望の訴求文4pを設定し、サーバ装置100に評価させる操作を行う。
サーバ装置100からの結果表示データ5rの受信に応じて、画面G90には、評価説明情報5pに基づいて、訴求文4p内における見直しの箇所が特定され、見直しの理由が文章で説明されることにより、ユーザは、見直し対象となった単語(又は文章)をどの程度改訂すればよいかを容易に判断できる。
図6は、第2実施例における定義テーブルのデータ構成例を示す図である。図6において、定義テーブル140は、評価観点毎に、リスク値と説明とを対応付けたテーブルであり、評価観点、リスク値、説明等の項目を有する。
評価観点は、例えば化粧品の訴求としての相応しさを示す。熟練者にあらかじめ特定された評価観点に該当する単語は、その評価観点内におけるリスクの高さが指定される。リスク値はリスクの高さを示す。評価観点は複数あってもよい。
説明には、リスク値のそれぞれに対する説明文が設定されている。クライアント端末3に送信される結果表示データ5rにおいて、単文単位評価部84によって判定されたリスク値に対応する説明文が評価説明情報5pに含まれる。
このデータ構成例では、リスク値が「1」から「3」まで定義されている。リスク値「3」の場合、「化粧品の範疇を逸脱しており、NG」であることを示す。リスク値「2」の場合、「化粧品の範疇を逸脱していると取られるリスクがある」ことを示す。リスク値「1」の場合、「化粧品の範疇の表現であり、問題なし」であることを示す。
このような評価観点のリスク値に基づく説明が画面G90にてなされることで、訴求文に専門知識が十分にない部門のユーザに対しても安定した評価を提供することができる。
図7は、第2実施例における教師データのデータ構成例を示す図である。図7において、教師データ138は、リスク値取得部74によって得られた訴求文ごとに評価結果を示したテーブルであり、商品名、評価結果、訴求文等の項目を有する。
商品名は、訴求文を記載する対象商品の名称を示す。商品名は省略してもよい。評価結果の値は、図6に例示したような定義テーブル140のリスク値である。訴求文は、評価済みの文章を示す。
図7のデータ構成例では、主に、英文の訴求文を示しているが、日本語、他の言語であってもよい。一例として、商品名「AAA」の化粧品に対して、評価された訴求文は、「AAA completely erases acne scars rejuvenating dermal collagen.」であり、その評価結果は、リスク値「3」が示され、つまり、明らかに化粧品の範疇を逸脱しており、NGである、ことが示されている。
図7では、評価観点が1つの場合の例を示しているが、2以上の評価観点が選択された場合には、評価観点毎のリスク値が示される。また、理解を容易とするため、訴求文を文章で示したが、文章ベクター空間における座標を示してもよい。
教師データ138をより多く蓄積することで、訴求文評価部80による評価結果の精度を改善することができる。教師データ138は、訴求文の収集時に専門的な知識を有する熟練者により評価された訴求文のみに限定されない。
クライアント端末3に提供済みの評価結果をログとして記憶部130に記憶し、専門的な知識を有する熟練者により、再度評価された場合には、教師データ138に追加するようにしてもよい。
次に、各処理部60、70及び80による処理についてフローチャートで説明する。先ず、知識ベース作成部60による知識ベース作成処理について説明する。図8は、第2実施例における知識ベース作成処理を説明するためのフローチャート図である。
図8において、知識ベース作成部60では、訴求文収集部62が複数の訴求文4cを収集する(ステップS611)。訴求文4cの収集では、一例として、英文の場合、約90、000件程度収集される。訴求文4cごとに商品名を取得してもよい。
また、訴求文収集部62は、訴求文4cを分類して選別する(ステップS612)。訴求文4cの分類及び選別は、既に、十分になされていれば省略してもよい。
次に、単文化処理部64は、訴求文4cの文章を単文化する(ステップS613)。製品単位で訴求文を単文単位に切り分ける。訴求文4cが日本語の場合、単語の区切り認識も行う。
そして、分散表現解析部66は、単文ごとに、分散表現の解析処理を行う(ステップS614)。分散表現の解析処理では、教師データ無しの機械学習により、単語(又は文)の分散表現(ベクトル表現)が解析され、解析結果が知識ベース137に蓄積される。
次に、判別モデル作成部70による判別モデル作成処理について説明する。図9は、第2実施例における判別モデル作成処理を説明するためのフローチャート図である。
図9において、判別モデル作成部70では、学習用に訴求文(以下、学習用訴求文4t)を選定する(ステップS631)。熟練者により、収集した訴求文4cから学習用訴求文4tを選定してもよいし、ランダムに抽出してもよい。選定された学習用訴求文4tは、記憶部130に記憶される。
単文化処理部72は、学習用訴求文4tの文章を単文化し(ステップS632)、リスク値取得部74は、熟練者から単文ごとのリスク値を取得する(ステップS633)。リスク値取得部74は、熟練者のクライアント端末3にリスク値の設定画面を表示して熟練者から単文ごとのリスク値を取得してもよい。リスク値の設定画面は、単文に対してリスク値が設定可能な画面であればよい。設定されたリスク値は、単文ごとに対応付けて教師データ138に蓄積される。
機械学習部76は、教師データ138を用いて、リスク値毎に単文の数をカウントし(ステップS634)、教師データ138に含まれる単文の総数に対するリスク値毎の単文の割合を算出する(ステップS635)。
機械学習部76は、リスク値ごとの文章サンプル数の偏りの度合いについて評価する(ステップS636)。リスク値ごとの文章数の割合が所定の閾値を超えている場合(ステップS636のYES)、機械学習部76は、該当リスク値の教師データ138に偏りがあると判断し、オーバーサンプリングを行い(ステップS637)、ステップS637へと進む。一方、リスク値ごとの文章数の割合が所定の閾値を超えていない場合(ステップS636のNO)、機械学習部76は、ステップS637へと進む。
ステップS637のオーバーサンプリングを行う代わりに、教師データ138に対して統計的な有意性を担保できる前提であれば、教師データ138において、割合が高いリスク値を持つ単文を一部用いないようにしてもよい(ダウンサンプリング)。
学習用訴求文4tのすべてに対して単文ごとにリスク値が設定され、バラツキの少ない教師データ138が準備できると、機械学習部76は、教師データ138を用いた知識ベース137の機械学習を行う(ステップS638)。
よって、化粧品の訴求として相応しいか否かを判別する判別モデル139が記憶部130に出力される(ステップS639)。
次に、訴求文評価部80による訴求文評価処理について説明する。図10は、第2実施例における訴求文評価処理を説明するためのフローチャート図である。図10において、先ず、クライアント端末3にて、ユーザが評価したい訴求文4pを画面G90で入力し(ステップS641)、評価ボタン91a(図11)が押下されることにより(ステップS643)、ユーザが入力した訴求文4pを含む評価要求4rがサーバ装置100へ送信される。
サーバ装置100では、評価要求4rを受信すると、訴求文評価部80に通知され、訴求文評価部80において、単文化処理部82は、選択情報4sで指定される国から言語を特定し、評価要求4rに含まれる訴求文4pを単文化し(ステップS651)、単文1文を単文単位評価部84に入力する(ステップS652)。
単文単位評価部84は、選択情報4sで指定される商品分野から判別モデル139を選択し、化粧品の訴求としての相応しさの判別用の判別モデル139を用いて、入力された単文1文が化粧品の訴求としての相応しさに該当するリスク値を判別し(ステップS653)、リスク有りか否かを判断する(ステップS654)。即ち、図6の定義テーブル140より、リスク値が「2」以上であるか否かを判断すればよい。
評価結果のリスク値が「2」以上である場合、結果表示データ作成部86は、定義テーブル140を用いて、リスク値に対応付けられた説明文を取得する(ステップS655)。
また、リスク値が「2」以上である場合、結果表示データ作成部86は、知識ベース137を用いて、入力された単文に類似する単文を探索して代替案として取得する(ステップS656)。
その後、結果表示データ作成部86は、評価結果に基づいて、リスク値「2」以上の単文に対して得た説明文、代替案等を用いて結果表示データ5rを作成する(ステップS657)。訴求文4p内のリスク値「2」以上の単文に対して、文字色を変える、ハイライトする、下線を付加する等により区別可能な表示とし、単文の指定に応じて代替案を表示可能とするデータが結果表示データ5rに追加される。
結果表示データ作成部86の処理の終了に応じて、単文化処理部82は、未処理の次の単文があるか否かを判断する(ステップS658)。未処理の次の単文が存在する場合(ステップS658のYES)、単文化処理部82は、ステップS652へと戻り、未処理の次の単文を単文単位評価部84に入力し、上述した同様の処理が繰り返される。
一方、未処理の次の単文が存在しない場合(ステップS658のNO)、訴求文4pに対する評価を終了したと判断され、訴求文評価部80は、記憶部130に記憶されている結果表示データ5rを評価要求4rの送信元のクライアント端末3に送信する(ステップS659)。
クライアント端末3では、画面G90に、ステップS641で入力した訴求文4pに対して、リスクのある文章及び単語が識別可能に表示され、それら文章又は単語が選択された場合には、リスクの説明文が表示される。説明文には、代替案が含まれていてもよい。
図11は、第2実施例におけるクライアント端末に表示される初期の画面例を示す図である。クライアント端末3の表示装置15には、図11に示すような、画面G90が表示される。図11において、初期に表示される画面G90は、リスクチェック領域9aのみを有する。リスクチェック領域9aは、訴求文入力域7a、評価ボタン7b、リセットボタン7c等を有する。
訴求文入力域7aは、ユーザが訴求文4pを入力する領域であり、初期状態では、ユーザに訴求文4pの入力を促すメッセージ等を表示するようにしてもよい。評価ボタン7bは、訴求文入力域7aに入力された訴求文4pが化粧品の訴求として適正であるかを評価するためのボタンである。評価ボタン7bの押下に応じて、評価要求4rがサーバ装置100へ送信される。リセットボタン7cは、訴求文入力域7aを初期状態に戻すためのボタンである。
ユーザが、画面G90の訴求文入力域7aに訴求文4pを入力し、評価ボタン7bを押下すると、クライアント端末3からサーバ装置100へと評価要求4rが送信される。サーバ装置100から結果表示データ5rを受信すると、例えば、画面G90は、図12に示すように画面遷移する。
図12は、第2実施例における結果表示データの受信時の画面例を示す図である。図12に示す画面G90では、リスクチェック領域9aに加えて、評価結果領域9bを有する。リスクチェック領域9aの構成は、図11で説明した通りであるためその説明を省略する。
評価結果領域9bは、保存形式選択領域9cと、評価結果表示域8aとを有する。保存形式選択領域9cは、クライアント端末3でデータ形式を選択して、評価結果を保存するための領域である。評価結果表示域8aは、サーバ装置100から受信した結果表示データ5rに基づいて、リスクチェック領域9aの訴求文入力域7aに入力された訴求文4pに対する評価結果を変更可能な表示域8mを有する。
表示域8mは、リスク値等を表示すると共に、ユーザによる見直しによって評価結果を変更可能に表示する領域であって、ID、判定文、リスク値、リスクワード数、類似文、不明ワード数等の項目を有する。
IDは、リスクチェック領域9aの訴求文入力域7aに入力された訴求文4pを文単位に区切り、一文ごとに付与した識別番号である。判定文は、区切られた一文を示す。リスク値は、文章に対する化粧品の初級としての相応しさの程度を示す。評価結果は、3レベルのリスク値うちのどのレベルであるかを示し、熟練者等のユーザにより修正可能なように表示される。
リスクワード数は、該当文内に存在するリスクがあると判断された単語数を示す。類似文は、知識ベース137に訴求文4pと類似する文章が存在するか否かを示す。不明ワード数は、化粧品の訴求として適正であるか否かを判別できない単語数を示す。
この例では、ユーザが入力した訴求文4pは、一つの文章7d「AAA completely erases acne scars rejuvenating dermal collagen.」のみであるため、評価結果表示域8aでは、ID「1」、判定文「AAA completely erases acne scars rejuvenating ...」、リスク値「3」、リスクワード数「2」、類似文「あり」、および不明ワード数「0」であったことが示されている。ユーザがID「1」の横の選択ボタン8pを押下すると、例えば、図13のように、評価結果の詳細が表示される。
図13は、第2実施例における評価結果の詳細の表示例を示す図である。図13において、画面G90の評価結果領域9bには、図12に示す保存形式選択領域9cと、評価結果表示域8aとに加えて、判定文表示域8b、リスクワード表示域8c、不明ワード表示域8d、類似文表示域8e、備考表示域8f等の詳細情報が表示される。
判定文表示域8bは、ID「1」の文章7dの全体を表示する領域である。リスクワード表示域8cは、文章7d内で検出されたリスクワードと、そのリスク値とが示される。不明ワード表示域8dは、文章7d内で判定できなかった単語が示される。類似文表示域8eは、知識ベース137から検索された文章7dに類似する文章と、そのリスク値および類似度(%)を示す。備考表示域8fは、文章7dに対するリスク値の根拠、対策等の説明文を表示する。
この例において、判定文表示域8bには、文章7d「AAA completely erases acne scars rejuvenating dermal collagen.」が表示されると共に、リスク有りと判定された「acne」および「dermal」の部分9rが、容易に判別可能に表示される。部分9rは、他の単語の色とは異なる色、またはハイライトされて示されれば良い。
リスクワード表示域8cには、判定文表示域8bで判別可能に表示された部分9rの「acne」および「dermal」ごとにリスク値「2」と判定されたことが示されている。不明ワード表示域8dは、空白または「−」等により、この文章7dでは検出されたなかったことを示している。
類似文表示域8eは、3つの類似文が示され、それぞれのリスク値と類似度とが示されている。類似文「AAA erases △△△ … .」は、リスク値「1」および類似度「77%」であったことが示されている。また、類似文「○○○○ moderately ○○○○ … .」は、リスク値「1」および類似度「75%」であったことが示されている。更に、類似文「AAA reduces □□□□ … .」は、リスク値「1」および類似度「75%」であったことが示されている。
備考表示域8fには、「化粧品の範囲を逸脱しています。」等の説明文が表示されている。この説明文は、経験を有する熟練者等のユーザにより変更されてもよい。
図12及び図13では、1つの文章7dのみを有する訴求文4pの例を説明したが、訴求文4pは、複数の文章から構成されていてもよい。訴求文4pが複数の文章を含む場合、文章ごとに評価結果が示される。
図14は、第2実施例における結果表示データの受信時の他の画面例を示す図である。図14において、画面G90の構成は、図12と同様であるため、その説明を省略する。図14では、画面G90のリスクチェック領域9aに、ユーザが、文章7e、7f、7g、7h、および7iの複数の文章からなる訴求文4pを入力した場合を示している。
具体的には、訴求文4pは、文章7eの「BBB cream has been repackaged and is now available in a newly designed pack.」と、文章7fの「○○○○ ○○○ ○○○○.」と、文章7gの「This product is 100% protection against uv.」と、文章7hの「△△△△ … .」と、文章7iの「□□□□□□□ … .」とを有するものとする。
サーバ装置100は、訴求文4pを文章ごとに分割する。例えば、この訴求文4pは、5文章に分割される。サーバ装置100は、分割した5文章のそれぞれにIDを付与し、単文単位評価部84により評価結果を得る。
評価結果領域9bでは、訴求文4pを分割した5文章それぞれを、ID「1」、ID「2」、ID「3」、ID「4」、およびID「5」で識別し、各文章の評価結果が示される。この例では、ID「1」の文章7eの評価結果は、リスク値「1」、リスクワード数「0」、類似文「なし」、不明ワード数「0」等を示す。ID「2」の文章7fの評価結果は、リスク値「2」、リスクワード数「1」、類似文「なし」、不明ワード数「0」等を示す。
また、ID「3」の文章7gの評価結果は、リスク値「3」、リスクワード数「1」、類似文「あり」、不明ワード数「0」等を示す。ID「4」の文章7hの評価結果は、リスク値「3」、リスクワード数「1」、類似文「あり」、不明ワード数「0」等を示す。ID「5」の文章7iの評価結果は、リスク値「1」、リスクワード数「0」、類似文「なし」、不明ワード数「0」等を示す。
ここで、リスクのレベルを識別可能に表示することが望ましい。一例として、リスク値が最も高い値「3」を示すID「3」およびID「4」の文章7gおよび7hは赤色系の色で示し、リスク値が次に高い「2」を示すID「2」の文章7fは黄色系の色で示し、リスク値が最も小さい(リスク無しと判断された)ID「1」およびID「5」の文章7eおよび7iは青色系の色で示せばよい。
図14の画面G90の評価結果領域9bにおいて、評価結果表示域8aの「リスク値」にカーソルを近付けることで、リスク値の凡例9dを表示させることができる。凡例9dには、リスクのレベルを示すリスク値の値ごとに説明が示される。例えば、値「1」は「化粧品の範疇の表現であり、問題なし」、値「2」は「化粧品の範疇を逸脱していると取られるリスクがある」、また、値「3」は「明らかに化粧品の範疇を逸脱しており、NG」等の説明が表示される。
この画面G90において、ユーザがID「3」の選択ボタン8pを押下すると、図15に示すような評価結果の詳細が表示される。
図15は、第2実施例における評価結果の詳細の他の表示例を示す図である。図15において、画面G90の評価結果領域9bには、ユーザが選択したID「3」の文章7gの評価結果の詳細が示される。
この場合、判定文表示域8bには、文章7g「This product is 100% protection against uv.」が表示されると共に、リスク有りと判定された「100% protection against uv」の部分9tが、容易に判別可能に表示される。部分9tは、他の単語の色とは異なる色、またはハイライトされて示されれば良い。
リスクワード表示域8cには、判定文表示域8bで判別可能に表示された部分9rの「100% protection against uv」がリスク値「3」と判定されたことが示されている。不明ワード表示域8dは、空白または「−」等により、この文章7dでは検出されたなかったことを示している。
類似文表示域8eは、3つの類似文が示され、それぞれのリスク値と類似度とが示されている。類似文「The product is environmentally-friendly and cruelty-free.」は、リスク値「1」および類似度「36%」であったことが示されている。また、類似文「The product is said to help *** **.」は、リスク値「1」および類似度「34%」であったことが示されている。更に、類似文「This product retails in 100g pack.」は、リスク値「1」および類似度「30%」であったことが示されている。
備考表示域8fには、「化粧品の範疇を逸脱しています。」等の説明文が表示されている。この説明文は、経験を有する熟練者等のユーザにより変更されてもよい。
このように、第2実施例では、訴求文4p内のリスクのある表現を自動判別し、判別理由、代替案等を表示させることにより、いずれのユーザに対しても安定した評価を提供することができる。また、リスクの高い単語及び文章に対して、好ましい表現への変更を容易に行なうことができる。更に、熟練者にとって、種々の部門からの訴求文に関する問い合わせに掛る時間を削減でき、負担を軽減することができる。
[第3実施例]
次に、上述した第1実施例における、日本の法令に基づいて食品の説明文を評価する場合を第3実施例として、定義テーブル、教師データ、及び評価結果の例で説明する。第3実施例では、その機能構成の詳細は第2実施例と同様であるため省略される。
図16は、第3実施例における定義テーブルのデータ構成例を示す図である。図16において、定義テーブル240は、第2実施例と同様に、評価観点毎に、リスク値と説明とを対応付けたテーブルであり、評価観点、リスク値、説明等の項目を有する。
評価観点は、第1実施例同様に、例えば食品の説明としての相応しさを示す。熟練者にあらかじめ特定された評価項目に該当する単語は、その評価項目内におけるリスクの高さが指定される。リスク値はリスクの高さを示す。評価観点は複数あってもよい。
説明には、リスク値のそれぞれに対する説明文が設定されている。クライアント端末3に送信される結果表示データ5rにおいて、単文単位評価部84によって判定されたリスク値に対応する説明文が評価説明情報5pに含まれる。
このデータ構成例では、リスク値が「1」から「3」まで定義されている。リスク値「3」の場合、「食品の説明は誤認表示に該当しており、NG」であることを示す。リスク値「2」の場合、「食品の説明は誤認表示に該当すると取られるリスクがある」ことを示す。リスク値「1」の場合、「食品の説明は適正な表現であり、問題なし」であることを示す。
このような評価観点のリスク値に基づく説明が、第2実施例と同様に、画面G90にてなされることで、食品の説明文に専門知識が十分にない部門のユーザに対しても安定した評価を提供することができる。
図17は、第3実施例における教師データのデータ構成例を示す図である。図17において、教師データ238は、第2実施例のリスク値取得部74と同様の処理部によって得られた説明文ごとに評価結果を示したテーブルであり、商品名、評価結果、説明文等の項目を有する。
商品名は、説明文を記載する対象商品の名称を示す。商品名は省略してもよい。評価結果の値は、図17に例示したような定義テーブル240のリスク値である。説明文は、評価済みの文章を示す。
図17のデータ構成例では、主に、日本語の説明文を示しているが、他の言語であってもよい。一例として、商品名「あいうえお」の商品に対して、評価された説明文は、「一日一回の飲料で、運動や食事制限なく、体脂肪が劇的に減少!!」であり、その評価結果は、リスク値「3」が示され、つまり、明らかに食品の説明は誤認表示に該当しており、NGである、ことが示されている。
図17では、評価観点が1つの場合の例を示しているが、2以上の評価観点が選択された場合には、評価観点毎のリスク値が示される。また、理解を容易とするため、説明文を文章で示したが、文章ベクター空間における座標が示されてもよい。
図18は、第3実施例における評価結果の詳細の表示例を示す図である。図18において、第2実施例と同様に、画面G90の評価結果領域9bには、説明文4qに含まれていた文章7kの評価結果の詳細が示される。
この場合、判定文表示域8bには、文章7k「1日3錠で、免疫力アップ!生活習慣病、ガン予防に抜群の効果!!」が表示されると共に、リスク有りと判定された「ガン予防に抜群の効果」の部分9wが、容易に判別可能に表示される。部分9wは、他の単語の色とは異なる色、またはハイライトされて示されれば良い。
リスクワード表示域8cには、判定文表示域8bで判別可能に表示された部分9wの「ガン予防に抜群の効果」がリスク値「3」と判定されたことが示されている。不明ワード表示域8dは、空白または「−」等により、この文章7kでは検出されたなかったことを示している。
類似文表示域8eは、1つの類似文が示され、そのリスク値と類似度とが示されている。類似文「日常の食事に不足しがちな栄養成分を補充できます。」は、リスク値「1」および類似度「29%」であったことが示されている。
備考表示域8fには、「食品の誤認表示に該当しています。」等の説明文が表示されている。この説明文は、経験を有する熟練者等のユーザにより変更されてもよい。
このように、第3実施例では、説明文4q内のリスクのある表現を自動判別し、判別理由、代替案等を表示させることにより、いずれのユーザに対しても安定した評価を提供することができる。また、リスクの高い単語及び文章に対して、好ましい表現への変更を容易に行なうことができる。更に、熟練者にとって、種々の部門からの説明文に関する問い合わせに掛る時間を削減でき、負担を軽減することができる。
2 ネットワーク
3 クライアント端末
4r 評価要求
4p 訴求文
4q 説明文
4s 選択情報
5r 結果表示データ
5p 評価説明情報
60 知識ベース作成部
62 訴求文収集部
64 単文化処理部
66 分散表現解析部
70 判別モデル作成部
72 単文化処理部
74 リスク値取得部
76 機械学習部
80 訴求文評価部
82 単文化処理部
84 単文単位評価部
86 結果表示データ作成部
100 サーバ装置
11、111 CPU
12、112 主記憶装置
13、113 補助記憶装置
14、114 入力装置
15、115 表示装置
17、117 通信I/F
18、118 ドライブ装置
19、119 記憶媒体
30、130 記憶部
137 知識ベース
138 教師データ
139 判別モデル
G90 画面
1137 説明文DB
1150 モデル作成検証部
1180 説明文評価部

Claims (10)

  1. 商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理ステップと、
    単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価ステップと、
    評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価ステップによる評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成ステップと、
    をコンピュータが行う説明文評価方法。
  2. 前記結果表示データ作成ステップは、更に、
    予め収集した説明文に対して分散表現の解析結果を蓄積した知識ベースを参照して、前記評価要求の説明文の単文に類似する文を代替案として取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章に加え、代替案を表示可能とする結果表示データを作成する
    ことを特徴とする請求項1記載の説明文評価方法。
  3. 前記単文単位評価ステップは、
    前記評価要求の訴求文を単文単位で評価する
    ことを特徴とする請求項1又は2記載の説明文評価方法。
  4. 前記評価要求は、前記商品が属する商品分野、国、及び評価観点の少なくとも1つ以上を指定し、
    前記評価要求の指定に対応する前記モデルを選択するモデル選択ステップ
    を更に有することを特徴とする請求項1乃至3のいずれか一項記載の説明文評価方法。
  5. 前記モデル選択ステップは、2以上の前記評価観点が指定された場合、該評価観点毎に前記モデルを選択し、
    前記単文単位評価ステップは、選択した前記モデル毎に、前記単文の内容を前記法令に従って評価する
    ことを特徴とする請求項4記載の説明文評価方法。
  6. 前記モデルの作成用に収集した複数の商品に関する複数の説明文を収集し、収集した該複数の説明文からサンプリングして、サンプリングした説明文を前記法令に従って適正性を判定し、判定した結果を関連付けて構造化する収集・構造化ステップと、
    前記サンプリングした前記説明文を解析して文章特徴を抽出して文章ベクター空間を生成する特徴抽出ステップと、
    前記適正性が判定された説明文を教師データとして用いた機械学習により前記文章特徴を分類することで、前記モデルを作成するモデル作成ステップと、
    を更に有する請求項1乃至5のいずれか一項記載の説明文評価方法。
  7. 前記モデル作成ステップは、マルチサポートベクターマシンを用いて、前記教師データを分類し、該分類ごとの教師データの数に偏りがある場合には、前記文章ベクター空間の所定の距離で定められる近傍に文書特徴点が存在するように点を追加するオーバーサンプリングを行う
    ことを特徴とする請求項6記載の説明文評価方法。
  8. 前記商品が属する商品分野、国、及び評価観点の組み合せ毎に、前記収集・構造化ステップと、前記特徴抽出ステップと、前記モデル作成ステップとを繰り返す
    ことを特徴とする請求項6乃至7のいずれか一項記載の説明文評価方法。
  9. 商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理部と、
    単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価部と、
    評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価部による評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成部と、
    を有する説明文評価装置。
  10. コンピュータを、
    商品に添付される説明文の評価要求の受信に応じて、該説明文を単文化する単文化処理手段、
    単文ごとに該単文の内容が少なくとも前記商品の説明表現に係る法令に従った内容であるか否かを、予め機械学習により得られたモデルを用いて評価する単文単位評価手段、
    評価結果ごとに商品の説明としての相応しさに関する文章を対応付けた定義テーブルを参照することで、前記単文単位評価手段による評価結果に対応する該文章を取得し、前記説明文を表示する画面上で前記単文の選択に応じて該文章を表示可能とする結果表示データを作成する結果表示データ作成手段、
    として機能させる説明文評価プログラム。
JP2017150873A 2017-08-03 2017-08-03 説明文評価方法、説明文評価装置及び説明文評価プログラム Active JP6896552B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017150873A JP6896552B2 (ja) 2017-08-03 2017-08-03 説明文評価方法、説明文評価装置及び説明文評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017150873A JP6896552B2 (ja) 2017-08-03 2017-08-03 説明文評価方法、説明文評価装置及び説明文評価プログラム

Publications (2)

Publication Number Publication Date
JP2019028937A true JP2019028937A (ja) 2019-02-21
JP6896552B2 JP6896552B2 (ja) 2021-06-30

Family

ID=65478545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017150873A Active JP6896552B2 (ja) 2017-08-03 2017-08-03 説明文評価方法、説明文評価装置及び説明文評価プログラム

Country Status (1)

Country Link
JP (1) JP6896552B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020161008A (ja) * 2019-03-28 2020-10-01 クレコン・リサーチアンドコンサルティング株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム
KR20210059605A (ko) * 2019-11-15 2021-05-25 한국과학기술원 언어의 구체성 및 설득 전략 나열에 기반하여 문서의 설득력을 판단하고 향상시키는 방법 및 시스템
KR20220114346A (ko) * 2021-02-08 2022-08-17 인제대학교 산학협력단 플랜트 절차서의 작성지침 준수여부 검증방법 및 그의 시스템
JP7273442B1 (ja) 2022-10-07 2023-05-15 Dcアーキテクト株式会社 情報処理システム、情報処理方法及びプログラム
JP7273439B1 (ja) 2022-09-09 2023-05-15 Dcアーキテクト株式会社 情報処理システム、情報処理方法及びプログラム
JP7453116B2 (ja) 2020-09-30 2024-03-19 日鉄ソリューションズ株式会社 情報処理装置、情報処理方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015072614A (ja) * 2013-10-03 2015-04-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 特定のテーマに依存して危険表現となりうる表現を検出する方法、並びに、当該表現を検出するための電子装置及びその電子装置用プログラム
JP2016143099A (ja) * 2015-01-30 2016-08-08 カシオ計算機株式会社 出力データ作成装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015072614A (ja) * 2013-10-03 2015-04-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 特定のテーマに依存して危険表現となりうる表現を検出する方法、並びに、当該表現を検出するための電子装置及びその電子装置用プログラム
JP2016143099A (ja) * 2015-01-30 2016-08-08 カシオ計算機株式会社 出力データ作成装置及びプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020161008A (ja) * 2019-03-28 2020-10-01 クレコン・リサーチアンドコンサルティング株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム
KR20210059605A (ko) * 2019-11-15 2021-05-25 한국과학기술원 언어의 구체성 및 설득 전략 나열에 기반하여 문서의 설득력을 판단하고 향상시키는 방법 및 시스템
KR102419648B1 (ko) * 2019-11-15 2022-07-12 한국과학기술원 언어의 구체성 및 설득 전략 나열에 기반하여 문서의 설득력을 판단하고 향상시키는 방법 및 시스템
JP7453116B2 (ja) 2020-09-30 2024-03-19 日鉄ソリューションズ株式会社 情報処理装置、情報処理方法、及びプログラム
KR20220114346A (ko) * 2021-02-08 2022-08-17 인제대학교 산학협력단 플랜트 절차서의 작성지침 준수여부 검증방법 및 그의 시스템
KR102591138B1 (ko) * 2021-02-08 2023-10-19 인제대학교 산학협력단 플랜트 절차서의 작성지침 준수여부 검증방법 및 그의 시스템
JP7273439B1 (ja) 2022-09-09 2023-05-15 Dcアーキテクト株式会社 情報処理システム、情報処理方法及びプログラム
JP2024039172A (ja) * 2022-09-09 2024-03-22 Dcアーキテクト株式会社 情報処理システム、情報処理方法及びプログラム
JP7273442B1 (ja) 2022-10-07 2023-05-15 Dcアーキテクト株式会社 情報処理システム、情報処理方法及びプログラム
JP2024055308A (ja) * 2022-10-07 2024-04-18 Dcアーキテクト株式会社 情報処理システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP6896552B2 (ja) 2021-06-30

Similar Documents

Publication Publication Date Title
JP6896552B2 (ja) 説明文評価方法、説明文評価装置及び説明文評価プログラム
US10445357B2 (en) Document classification system, document classification method, and document classification program
US7194471B1 (en) Document classification system and method for classifying a document according to contents of the document
US9720912B2 (en) Document management system, document management method, and document management program
US20130218872A1 (en) Dynamic filters for data extraction plan
US20180039633A1 (en) Information processing system and information processing method
US10417338B2 (en) External resource identification
CN112015721A (zh) 一种基于大数据的电商平台存储数据库的优化方法
US20150379610A1 (en) Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program
KR20210022873A (ko) 인터넷을 통해 수집된 화장품 리뷰 정보를 분석하여 개선된 리뷰 정보를 사용자에게 제공하는 방법 및 시스템
CN111475731B (zh) 数据处理方法、装置、存储介质及设备
JP2021056614A (ja) 文書審査支援装置、文書審査支援方法及びコンピュータプログラム
KR20180013777A (ko) 비정형데이터 분석기술 장치 및 방법, 이를 구현하기 위한 애플리케이션/프로그램이 기록된 기록매체
US20150310004A1 (en) Document management system, document management method, and document management program
CN112492342A (zh) 基于云计算数据分析的电子商务视频直播平台
US20210312130A1 (en) Information processing device, information processing method, and computer program product
CN115292460A (zh) 一种话题推荐方法、装置、电子设备及存储介质
EP3869381A1 (en) Procedure of textual data analysis for interpreting emotional states that can be inferred from said textual data
JP7351502B2 (ja) 変数データ生成装置、予測モデル生成装置、変数データ生産方法、予測モデル生産方法、プログラム及び記録媒体
CN113936186A (zh) 一种内容识别方法、装置、电子设备及可读存储介质
CN113886538A (zh) 医保报销信息查询方法、装置、电子设备和存储介质
US20170242849A1 (en) Methods and systems for extracting content items from content
CN107870995B (zh) 一种基于用户信息推送释义的方法及电子设备
JP2021117659A (ja) 特定装置、特定方法、プログラム、及びデータ構造
Rizvi et al. Personality prediction through offline handwriting analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210518

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210609

R150 Certificate of patent or registration of utility model

Ref document number: 6896552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350