WO2022190199A1

WO2022190199A1 - 需要予測装置、需要予測方法および予測モデル生成装置

Info

Publication number: WO2022190199A1
Application number: PCT/JP2021/009237
Authority: WO
Inventors: 祐加子鷲見; 訓光山; 貢一平岡; 久美子岡田; 裕子土屋; 浩子助田; 巌田沼; 奈緒子牛尾
Original assignee: 株式会社日立製作所
Priority date: 2021-03-09
Filing date: 2021-03-09
Publication date: 2022-09-15

Abstract

需要予測装置（１００）は高精度な需要予測を可能とする。需要予測装置（１００）は、需要予測対象に係る潜在需要者が作成した第１のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第２のテキストデータ（メッセージデータベース（２１０）参照）を含むとともに、需要予測対象の販売実績データ（２６０）を含む学習データ（３００）を用いて生成された予測モデル（１月後予測モデル（１３１）、２月後予測モデル（１３２）、３月後予測モデル（１３３））を用いて、需要予測対象の需要量を予測する予測部（１１８）を備える。

Description

需要予測装置、需要予測方法および予測モデル生成装置

　本発明は、商品やサービスの需要を予測する需要予測装置、需要予測方法および予測モデル生成装置に関する。

　ビッグデータ解析や機械学習の技術を用いて過去の販売実績から商品やサービスなどの需要（販売量）予測が行われている。予測する手法としては、需要と関連しているデータの特徴量および過去の販売実績から予測モデルを生成し、予測対象の時期の需要と関連しているデータから当該予測モデルを用いて予測するのが一般的である。予測の精度は、需要と関連しているデータが需要を反映している度合い、および当該データから抽出する特徴量に大きく依存する。

　特許文献１に記載の情報処理装置は、不動産売買において物件データから取引価格や取引期間を予測する。物件データから抽出される特徴量としては、床面積など物件そのもののデータの他に、物件の周辺環境のデータ、物件説明文に含まれる特徴的な単語がある。

特開２０２０－１２６６７０号公報

　特許文献１に記載の情報処理装置は、形態素解析を用いて物件説明文から特徴量となる単語を抽出しているが、どのような単語を抽出するのかについては記載されていない。商品やサービスの需要を反映するのは、需要対象そのものに係る特徴量だけではなく、需要者（購入者）に係る特徴量や社会状況に係る特徴量があると考えられる。このような特徴量を用いて予測することで、より高精度に需要が予測できると考えられる。
　本発明は、このような背景を鑑みてなされたものであり、高精度な需要予測を可能とする需要予測装置、需要予測方法および予測モデル生成装置を提供することを課題とする。

　上記した課題を解決するため、本発明に係る需要予測装置は、需要予測対象に係る潜在需要者が作成した第１のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第２のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて生成された予測モデルを用いて、前記需要予測対象の需要量を予測する予測部を備える。

　また、本発明に係る予測モデル生成装置は、需要予測対象に係る潜在需要者が作成した第１のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第２のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて予測モデルを生成するモデル生成部を備える。

　本発明によれば、高精度な需要予測を可能とする需要予測装置、需要予測方法および予測モデル生成装置を提供することができる。上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされる。

本実施形態に係る需要予測装置の機能ブロック図である。本実施形態に係るメッセージデータベースのデータ構成図である。本実施形態に係る感性辞書のデータ構成図である。本実施形態に係るカテゴリ辞書のデータ構成図である。本実施形態に係る経済指標データのデータ構成図である。本実施形態に係る販売実績データのデータ構成図である。本実施形態に係る１月後予測モデルを説明するための図である。本実施形態に係る１月後予測モデルを生成するための学習データである。本実施形態に係る１月後特徴量重要度データベースのデータ構成図である。本実施形態に係る予測結果データのデータ構成図である。本実施形態に係る予測結果画面の画面構成図である。本実施形態に係る予測結果画面の画面構成図である。本実施形態に係る予測結果画面の画面構成図である。本実施形態に係る予測モデル生成処理のフローチャートである。本実施形態に係る予測処理のフローチャートである。本実施形態に係る記録媒体を示す図である。

　以下に本発明を実施するための形態（実施形態）における需要予測装置（後記する図１参照）について説明する。本実施形態に係る需要予測装置は、乗用車の需要（販売台数、販売量）を予測する。予測に用いるデータとしては、当該乗用車に係るソーシャルメディアデータの他に、社会状況に係るデータとして株価指標などの経済状況に係るオープンデータを含む。ソーシャルメディアデータからは、需要予測の対象となる乗用車に係る特定の特徴語だけではなく、ソーシャルメディアの利用者である需要者（潜在需要者を含む）の感性情報も抽出される。感性情報としては、対象である乗用車に対する印象や好感度などがある。
　このように、ソーシャルメディアデータに含まれる特徴語の他に、需要者の感性情報や経済状況に係るデータを含めて予測することで、需要予測装置はより高精度に需要を予測できるようになる。

≪需要予測装置の構成≫
　図１は、本実施形態に係る需要予測装置１００の機能ブロック図である。需要予測装置１００は、ネットワーク４９０を介して販売ディーラサーバ４１０、ソーシャルメディアデータ提供サーバ４２０、およびオープンデータ提供サーバ４３０と接続されている。販売ディーラサーバ４１０には乗用車の販売実績が格納されている。また、ソーシャルメディアデータ提供サーバ４２０には乗用車に係るソーシャルメディアのテキストデータが蓄積されている。オープンデータ提供サーバ４３０には経済状況に係るオープンデータが蓄積されている。

　需要予測装置１００はコンピュータであって、制御部１１０、記憶部１３０、および入出力部１６０を含んで構成される。入出力部１６０には、ディスプレイやキーボード、マウスなどのユーザインターフェイス機器が接続される。また、入出力部１６０はネットワーク４９０に接続され、販売ディーラサーバ４１０、ソーシャルメディアデータ提供サーバ４２０、およびオープンデータ提供サーバ４３０との通信データを送受信する。

　制御部１１０は、ＣＰＵ（Central Processing Unit）を含んで構成される。制御部１１０は、データ取得部１１１、感性分析部１１２、カテゴリ分類部１１３、車種分析部１１４、データ結合部１１５、モデル生成部１１６、予測根拠算出部１１７、予測部１１８、地域別予測部１１９、および可視化部１２０を備える。

　記憶部１３０は、ＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）、ＳＳＤ（Solid State Drive）などの記憶装置から構成される。記憶部１３０には、メッセージデータベース２１０、感性辞書２３０、カテゴリ辞書２４０、経済指標データ２５０、販売実績データ２６０、プログラム１３８、学習データ３００、１月後予測モデル１３１、２月後予測モデル１３２、３月後予測モデル１３３、１月後特徴量重要度データベース３１０、２月後特徴量重要度データベース３２０、３月後特徴量重要度データベース３３０、地域別割合予測モデル３４０、および予測結果データ３８０が記憶される。プログラム１３８は後記する予測モデル生成処理（図１４参照）および予測処理（図１５参照）の処理手順の記述を含む。

　なお、図１では、メッセージデータベース２１０、１月後特徴量重要度データベース３１０、２月後特徴量重要度データベース３２０、および３月後特徴量重要度データベース３３０は、それぞれメッセージＤＢ（Database）、１月後特徴量重要度ＤＢ、２月後特徴量重要度ＤＢ、および３月後特徴量重要度ＤＢと記している。
　以下、需要予測の処理順序に従って制御部１１０および記憶部１３０の構成要素を説明する。

≪ソーシャルメディアデータの取得処理≫
　データ取得部１１１はソーシャルメディアデータ提供サーバ４２０（図１参照）から、ソーシャルメディアに投稿されたメッセージ（第１のテキストデータ）を取得して、メッセージデータベース２１０（後記する図２参照）に格納する。図２は、本実施形態に係るメッセージデータベース２１０のデータ構成図である。メッセージデータベース２１０は、例えば表形式のデータであって、１つの行（レコード）は１つのメッセージ（第２のテキストデータ）を示す。レコードには、識別番号２１１（図２ではＩＤ（identifier）と記載）、投稿日時２１２、投稿者２１３、メッセージ２１４、車種２１５、感性２１６、感性詳細２１７、カテゴリ２１８、家計消費２１９、および株価２２０の列（属性）が含まれる。

　識別番号２１１は、メッセージの識別番号である。投稿日時２１２は、メッセージがソーシャルメディアに投稿された日時である。投稿者２１３は、メッセージを投稿したソーシャルメディア利用者（潜在需要者）の識別情報である。メッセージ２１４は、投稿されたメッセージ（テキストデータ）である。他の属性である車種２１５、感性２１６、感性詳細２１７、カテゴリ２１８、家計消費２１９、および株価２２０については後記する。
　データ取得部１１１は、ソーシャルメディアデータ提供サーバ４２０から取得したメッセージを、メッセージデータベース２１０の識別番号２１１、投稿日時２１２、投稿者２１３、およびメッセージ２１４の属性に格納する。

≪感性分析処理≫
　感性分析部１１２は図３に記載の感性辞書２３０を用いながら、メッセージ２１４（図２参照）の感性（投稿者の感性／感情）を分析する。図３は、本実施形態に係る感性辞書２３０のデータ構成図である。感性辞書２３０は、好悪や喜怒哀楽などの感情／感性に係る語の辞書である。感性辞書２３０は表形式のデータであって、１つの行（レコード）は見出し語２３１、感性２３２、および感性詳細２３３の列（属性）を含む。

　見出し語２３１は、感性辞書２３０の見出しとなる語である。感性２３２は、見出し語２３１の感性を示し、需要予測対象（乗用車）に対してプラスの感情（「好」）、マイナスの感情（「悪」）、および、プラスとマイナスの何れでもない（「他」）である。感性詳細２３３は感性２３２の内容を示し、「楽しい」、「褒め」、「満足」、「不満」、「反感」、「疑問」などである。レコード２３９は「厳しい」という語の感性２３２は「悪」であり、「不満」を意味していることを示している。

　感性分析部１１２は、メッセージ２１４に含まれる見出し語２３１を特定し、当該見出し語に対応する感性２３２および感性詳細２３３を、メッセージデータベース２１０（図２参照）の感性２１６および感性詳細２１７にそれぞれ格納する。

≪カテゴリ分類処理≫
　カテゴリ分類部１１３は図４に記載のカテゴリ辞書２４０を用いながら、メッセージ２１４（図２参照）をカテゴリに分類する。図４は、本実施形態に係るカテゴリ辞書２４０のデータ構成図である。カテゴリ辞書２４０は、メッセージ２１４（図２参照）に含まれる語のカテゴリを示す（カテゴリを付与するための）辞書である。カテゴリ辞書２４０は表形式のデータであって、１つの行（レコード）は代名詞２４１、名詞２４２、形容詞２４３、およびカテゴリ２４４の列（属性）を含む。

　代名詞２４１、名詞２４２、および形容詞２４３の属性の「－」は、メッセージ２１４に当該品詞の語が含まれないことを示し、「＊」は当該品詞の語が含まれることを示す。また、語は当該品詞の当該語が含まれることを示す。レコード２４９は、メッセージ２１４に、代名詞２４１が含まれず、形容詞２４３が含まれ、名詞２４２としての「運転」が含まれる場合（パターン）には、当該メッセージ２１４のカテゴリ２４４は「乗り心地」となることを示している。

　カテゴリ分類部１１３は、メッセージ２１４がカテゴリ辞書２４０の何れかのレコードが示すパターンに合致する場合には、当該レコードのカテゴリ２４４をメッセージデータベース２１０（図２参照）のカテゴリ２１８に格納する。
　１つのメッセージ２１４がカテゴリ辞書２４０にある複数のレコード（パターン）を含む場合には、カテゴリ分類部１１３はカテゴリ２１８に該当する複数のカテゴリ２４４を格納する。または、カテゴリ分類部１１３はメッセージデータベース２１０に当該メッセージ２１４のレコードを追加して、複数の当該メッセージ２１４のレコードのカテゴリ２１８それぞれに１つずつカテゴリ２４４を格納するようにしてもよい。

≪車種分析処理、経済状況データ結合処理≫
　車種分析部１１４は、メッセージ２１４に需要予測対象の車種が含まれていれば、当該車種をメッセージデータベース２１０の車種２１５に格納する。
　データ取得部１１１はオープンデータ提供サーバ４３０（図１参照）から経済状況に係るデータとして家計消費と株価を取得して、経済指標データ２５０に格納する。図５は、本実施形態に係る経済指標データ２５０のデータ構成図である。経済指標データ２５０は表形式のデータであって、１つの行（レコード）は日別の経済指標を示し、年月日２５１、家計消費２５２、および株価２５３の列（属性）を含む。家計消費２５２は例えば、１世帯当たり１か月間の支出金額を日割りした金額である。家計消費２５２は、小売業の週別または日別ＰＯＳデータと比例するように、週別または日別の支出金額を割り出した金額であってもよい。また、株価２５３は例えば、国内株式市場の年月日２５１の終値を示す。

　データ結合部１１５は、投稿日２１２（図２参照）に対応する年月日２５１を特定し、当該年月日２５１に対応する家計消費２５２および株価２５３をメッセージデータベース２１０の家計消費２１９および株価２２０にそれぞれ格納する。
　以上でメッセージデータベース２１０の全ての属性について説明した。

≪モデル生成処理≫
　データ取得部１１１は販売ディーラサーバ４１０（図１参照）から需要予測対象である乗用車に係るデータとして月別販売実績を取得して、販売実績データ２６０に格納する。図６は、本実施形態に係る販売実績データ２６０のデータ構成図である。販売実績データ２６０は表形式のデータであって、地域別・月別の販売実績を示す。１つの行（レコード）は地域２６１における月別の販売の実績２６２，２６４，２６６と、割合２６３，２６５，２６７とを示す。例えば、実績２６２は１２月前の１月の実績であり、割合２６３は全地域における実績２６２が占める割合（単位は％）である。データ取得部１１１は、月別販売実績を販売ディーラサーバ４１０が取得して実績２６２，２６４，２６６に格納した後に、各実績の割合を計算して割合２６３，２６５，２６７に格納する。

　モデル生成部１１６は、メッセージデータベース２１０（第２のテキストデータ）を含むとともに販売実績データ２６０を含む学習データ（後記する図８参照）を用いて、１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３を生成する。以下、１月後予測モデル１３１について説明する。

　図７は、本実施形態に係る１月後予測モデル１３１を説明するための図である。１月後予測モデル１３１は、メッセージデータベース２１０（図２参照）に含まれる１年間（第Ｘ月～第Ｘ＋１１月）のデータ２１０Ａから翌月（第Ｘ＋１２月）の販売実績２６９を予測する機械学習モデルである。換言すれば、１月後予測モデル１３１は、メッセージデータベース２１０の１年間のデータ２１０Ａを入力（説明変数）とし、翌月の販売実績２６９を出力（目的変数、予測結果）とする。モデル生成部１１６は、学習データ（後記する図８参照）を用いて機械学習技術の学習処理を行って１月後予測モデル１３１を生成する。なお、販売実績とは、販売実績データ２６０における実績２６２，２６４，２６６の全地域の合計である。

　図８は、本実施形態に係る１月後予測モデル１３１を生成するための学習データ３００である。学習データ３００には、過去における実績である入力と出力とのペアが複数含まれる。例えばペア３０１は、２０１０年１月から１年間のメッセージデータベース２１０（第２のテキストデータ）のデータ（入力）と、２０１１年１月の販売実績（正解ラベル、出力）とのペアである。学習データ３００は、２０１０年１月～２０２０年１１月のメッセージデータベース２１０のデータ、および２０１１年１月～２０２０年１２月までの販売実績データから生成された１２０のペアを含んでいる。

　モデル生成部１１６は、学習データ３００を教師データとして機械学習モデルを訓練して１月後予測モデル１３１を生成する。生成された１月後予測モデル１３１は、過去１年間のメッセージデータベース２１０のデータから、翌月の販売実績を予測するモデルである。２月後予測モデル１３２、および３月後予測モデル１３３についても同様である。２月後予測モデル１３２は、過去１年間のメッセージデータベース２１０のデータから、翌々月（２月後）の販売実績を予測するモデルである。また３月後予測モデル１３３は、過去１年間のメッセージデータベース２１０のデータから、３月後の販売実績を予測するモデルである。なお、１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３を総称して予測モデルとも記す。

≪予測根拠算出処理≫
　予測根拠算出部１１７は、予測モデルそれぞれにおける特徴量重要度を算出する。特徴量重要度とは、予測モデルによる予測結果の算出にあたり特徴量を重要視している度合いを示し、Feature Importanceまたは Variable Importanceとも呼ばれる。予測根拠算出部１１７は特徴量について、予測モデルが重要視する度合い（特徴量重要度）を算出する。なお特徴量とは、入力の特徴量であり、本実施形態ではメッセージデータベース２１０（図２参照）の属性の値である。予測根拠算出部１１７は、１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３について、それぞれ１月後特徴量重要度データベース３１０、２月後特徴量重要度データベース３２０、および３月後特徴量重要度データベース３３０を生成する。

　図９は、本実施形態に係る１月後特徴量重要度データベース３１０のデータ構成図である。１月後特徴量重要度データベース３１０は、１月後予測モデル１３１の特徴量重要度を示す表形式のデータであって、１つの行（レコード）は、順位３１１、重要度３１２、特徴量項目３１３、影響の方向３１４、および予測根拠３１５の列（属性）を含む。

　順位３１１は特徴量重要度の順位を示す。重要度３１２は特徴量重要度を示す。重要度３１２の合計は１００となる。特徴量項目３１３は、特徴量の値であって、メッセージデータベース２１０の属性（属性名）とその値で示される。例えば「本文：Ａ」はメッセージ２１４に「Ａ」が含まれることを示し、「ユーザ名：Ｕ００３１」は投稿者２１３が「Ｕ００３１」であることを示す。

　影響の方向３１４は、特徴量項目３１３が予測結果（販売量）を増加／減少させる方向に影響するのか、影響がないのかを示す。予測根拠３１５は、後記する予測結果表示画面（図１１～図１３参照）に表示されるテキストであり、予測結果の根拠を説明するための説明文である。

≪需要の予測処理≫
　予測部１１８は、予測モデルを用いて需要（販売量）を予測し、予測結果を予測結果データ３８０に格納する。例えば予測部１１８は、過去１年のメッセージデータベース２１０のデータから１月後予測モデル１３１を用いて、翌月の販売量を予測する。

　図１０は、本実施形態に係る予測結果データ３８０のデータ構成図である。予測結果データ３８０は、地域別および全地域での販売量の割合予測および販売予測を示す。予測結果データ３８０は表形式のデータであって、１つの行（レコード）は地域または全地域における割合と販売量の予測結果を示し、地域３８１、割合予測３８２，３８４，３８６、および販売予測３８３，３８５，３８７の列（属性）を含む。

　地域３８１は、地域名または全ての地域の和である「全地域」を示す。割合予測３８２，３８４，３８６は、後記する地域別予測部１１９が予測する地域３８１における販売量の割合である。地域３８１が「全地域」のレコードの割合予測３８２，３８４，３８６は１００であり、「－」としている。地域３８１が「全地域」の販売予測３８３，３８５，３８７は、予測部１１８が予測して格納した翌月（１月後）、翌々月（２月後）、３月後の予測結果である。

　地域別予測部１１９は、地域別の販売量を予測する。詳しくは、地域別予測部１１９は地域別に、過去１年の販売の割合（図６の割合２６３，２６５，２６７参照）から翌月、翌々月および３月後の割合を予測する地域別割合予測モデル３４０（図１参照）を生成する。時系列分析では種々の予測手法が提案されており、地域別割合予測モデル３４０は例えばARIMAモデルである。

　続いて、地域別予測部１１９は、地域別割合予測モデル３４０を用いて、翌月、翌々月および３月後の割合を予測して、予測結果データの３８０に割合予測３８２，３８４，３８６に格納する。さらに地域別予測部１１９は、「全地域」の販売予測３８３，３８５，３８７に割合予測３８２，３８４，３８６を乗じた結果を地域別の販売予測３８３，３８５，３８７に格納する。販売予測３８３，３８５，３８７が、地域別予測部１１９が予測した地域別の翌月（１月後）、翌々月（２月後）、３月後の販売予測である。

≪予測結果表示処理≫
　可視化部１２０は、予測結果画面５１０，５２０，５３０（後記する図１１～図１３参照）を生成して入出力部１６０（図１参照）に接続されたディスプレイ（不図示）に出力する。図１１は、本実施形態に係る予測結果画面５１０の画面構成図である。予測結果画面５１０は、グラフ５１１、プルダウンメニュー５１２、予測根拠５１３、およびメッセージ５１４を含む。

　グラフ５１１は棒グラフであって、地域別の今月の販売実績と１月後の販売予測と２月後の販売予測と３月後の販売予測とを示す。プルダウンメニュー５１２は、予測根拠表示月を選択するためのプルダウンメニューである。図１１記載のプルダウンメニュー５１２では「３月後の予測根拠」が選択されており、予測根拠５１３は、３月後特徴量重要度データベース３３０（図１参照）における順位および予測根拠（図９記載の１月後特徴量重要度データベース３１０における順位３１１および予測根拠３１５参照）を示している。

　メッセージ５１４には、ポインタ５１５で指定された予測根拠に係るメッセージデータベース２１０（図２参照）のレコードの投稿日時２１２、投稿者２１３、およびメッセージ２１４が含まれる。図１１では感性詳細２１７が「楽しい」という予測根拠が指定されており、これに相当するメッセージ２１４がメッセージ５１４に含まれる。予測結果画面５１０には、車種Ａが「楽しい」車であり、販売量が増加する予測が示されている。

　図１２は、本実施形態に係る予測結果画面５２０の画面構成図である。予測結果画面５２０の画面構成は、予測結果画面５１０（図１１参照）と同様である。予測結果画面５２０は、車種Ｂは燃費が悪く、販売量が減少する予測が示されている。

　図１３は、本実施形態に係る予測結果画面５３０の画面構成図である。予測結果画面５３０の画面構成は予測結果画面５１０とは異なり、メッセージ５１４に替わって経済指標５３４が表示される。これは、ポインタ５３５が指定する予測根拠が経済指標に係るためである。経済指標５３４として直近の月平均の株価が示され、合わせて販売実績と、株価（時系列データ）および販売実績の散布図とが示される。
　以上で、制御部１１０および記憶部１３０の構成要素の説明を終える。続いて、予測モデルの生成処理および予測処理を説明する。

≪予測モデル生成処理≫
　図１４は、本実施形態に係る予測モデル生成処理のフローチャートである。予測モデル生成処理は所定のタイミングで、例えば毎月、実行される。
　ステップＳ１１においてデータ取得部１１１は、ソーシャルメディアデータ提供サーバ４２０（図１参照）から投稿されたメッセージを取得して、メッセージデータベース２１０（図２参照）の識別番号２１１、投稿日２１２、投稿者２１３、およびメッセージ２１４に格納する。

　ステップＳ１２において感性分析部１１２は、感性辞書２３０（図３参照）を用いてメッセージ２１４それぞれに感性２１６および感性詳細２１７を付与する。
　ステップＳ１３においてカテゴリ分類部１１３は、カテゴリ辞書２４０（図４参照）を用いてメッセージ２１４それぞれにカテゴリ２１８を付与する。
　ステップＳ１４において車種分析部１１４は、メッセージ２１４に含まれる車種を特定してメッセージ２１４それぞれに車種２１５に付与する。

　ステップＳ１５においてデータ取得部１１１は、オープンデータ提供サーバ４３０（図１参照）から経済指標を取得して、経済指標データ２５０（図５参照）に格納する。
　ステップＳ１６においてデータ結合部１１５は、投稿日２１２と年月日２５１との対応を取って、メッセージ２１４それぞれに家計消費２１９と株価２２０とを付与する。
　ステップＳ１７においてデータ取得部１１１は販売ディーラサーバ４１０（図１参照）から需要予測対象である乗用車に係るデータとして月別販売実績を取得して、販売実績データ２６０（図６参照）に格納する。

　ステップＳ１８においてモデル生成部１１６は、１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３を生成するための学習データ（１月後予測モデル１３１を生成するための図８記載の学習データ３００参照）をそれぞれ生成する。
　ステップＳ１９においてモデル生成部１１６は、ステップＳ１８で生成した学習データを用いて１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３を生成する。

　ステップＳ２０において予測根拠算出部１１７は、１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３それぞれにおける特徴量重要度を算出する。算出した特徴量重要度は、１月後特徴量重要度データベース３１０、２月後特徴量重要度データベース３２０、および３月後特徴量重要度データベース３３０に格納される。

≪予測処理≫
　図１５は、本実施形態に係る予測処理のフローチャートである。
　ステップＳ３１においてデータ取得部１１１は、過去１年分のソーシャルメディアデータを取得する。
　ステップＳ３２において、ステップＳ３１で取得されたソーシャルメディアデータに特徴量が付与される。詳しくは、ステップＳ１２～Ｓ１６（図１４参照）と同様にして、車種２１５、感性２１６、感性詳細２１７、カテゴリ２１８、家計消費２１９、および株価２２０が付与される。

　ステップＳ３３において予測部１１８は、ステップＳ３１で取得したデータから１月後予測モデル１３１、２月後予測モデル１３２、および３月後予測モデル１３３を用いて、１月後、２月後、３月後の販売量を予測（算出）して、予測結果データ３８０（図１０参照）の「全地域」にあたるレコード３８９の販売予測３８３，３８５，３８７にそれぞれ格納する。
　ステップＳ３４においてデータ取得部１１１は、販売実績データ２６０（図６参照）の販売の実績２６２，２６４，２６６から販売の割合２６３，２６５，２６７を算出する。

　ステップＳ３５において地域別予測部１１９は、販売実績データ２６０の割合２６３，２６５，２６７から、１月後、２月後および３月後の割合を予測する地域別割合予測モデル３４０（図１参照）を生成する。
　ステップＳ３６において地域別予測部１１９は、地域別割合予測モデル３４０を用いて、１月後、２月後および３月後の割合を予測して、予測結果データの３８０（図１０参照）に割合予測３８２，３８４，３８６に格納する。

　ステップＳ３７において地域別予測部１１９は、レコード３８９の販売予測３８３，３８５，３８７に割合予測３８２，３８４，３８６を乗じた結果を地域別の販売予測３８３，３８５，３８７に格納する。
　ステップＳ３８において可視化部１２０は、予測結果画面５１０，５２０，５３０を入出力部１６０に接続されたディスプレイに出力する。

≪需要予測装置の特徴≫
　需要予測装置１００はソーシャルメディアに投稿されたメッセージに感性やカテゴリ、経済状況に係る情報を付与したデータから、所定長として１月～３月後の販売量（需要、需要量）を予測する。予測には機械学習技術が用いられる。また、需要予測装置１００は過去の地域別の販売量の割合から１月～３月後の販売量の割合を予測して、地域別の販売量を予測する。

　需要予測装置１００はメッセージに含まれる語だけではなく、メッセージに含まれる感性情報やメッセージ投稿時の経済状況を含めて予測するため、予測精度が向上する。日々購入される消費財とは異なり、乗用車は高価であり経済状況の影響を受けやすい。予測の材料として経済状況を含めることで予測精度が向上する。

　需要予測装置１００は予測結果を予測結果画面５１０，５２０，５３０（図１１～図１３参照）として表示する。予測結果画面５１０，５２０，５３０には予測結果である販売量の他に、予測根拠５１３，５２３，５３３が含まれる。需要予測装置１００の利用者は、予測根拠や予測根拠に関連するメッセージを参照することで、予測の確からしさを確認できるようになる。

≪変形例：入力データ≫
　上記した実施形態では予測モデルの入力（説明変数）は、過去１年のメッセージデータベース２１０のデータであったが、１年とは限らず１年より長いまたは短い期間であってもよい。また、入力は感性やカテゴリ、経済状況に係る情報が付与されたメッセージであったが、さらに販売実績を加えてもよい。さらに、経済状況に係るデータは家計消費と株価に限らず、例えば消費者物価指数などの他のデータでもよい。

　経済状況の他に、需要対象の市場状況を加えてもよい。上記した実施形態では例えば、国内の乗用車全体の販売台数や車種別の販売台数を予測モデルの入力に加えてもよい。他に需要対象の競合品に係るメッセージや感性、カテゴリを市場状況として予測モデルの入力に加えてもよい。また、地域別割合予測モデル３４０の入力として地域別の販売台数や経済状況を加えてもよい。

≪変形例：感性分析≫
　上記した実施形態では需要予測装置１００は、感性辞書（図３参照）を用いてメッセージ２１４（図２参照）に感性２１６、感性詳細２１７を付与している。他の手法を用いてもよい。例えば、ディープラーニングなどの手法で学習させたモデルによる感性分析結果を感性や感性詳細としてもよい。

≪変形例：カテゴリ≫
　上記した実施形態では需要予測装置１００は、カテゴリ辞書（図４参照）を用いてメッセージ２１４（図２参照）にカテゴリ２１８を付与している。他の手法を用いてもよい。例えばメッセージをクラスタリングして分類して分類結果をカテゴリとして付与したり、Latent Dirichlet AllocationやLatent Semantic Indexなどの手法を用いてトピックを分析したりしてカテゴリとしてもよい。

≪プログラム≫
　上記した実施形態では、プログラム１３８は、コンピュータである需要予測装置１００の記憶部１３０に記憶される。記録媒体にあるプログラムが読み込まれて、記憶部１３０にロードされて実行されてもよいし、記録媒体からインストールされて実行されてもよい。
　図１６は、本実施形態に係る記録媒体を示す図である。記録媒体９１０からコンピュータ９００に、インストールを行うことで、コンピュータ９００が需要予測装置１００として機能することができるようになる。なお、記録媒体９１０に限らずネットワークを経由してプログラム１３８がダウンロードされてインストールされてもよい。

≪その他変形例≫
　以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。例えば上記した実施形態では、乗用車の販売台数（需要）を予測しているが、本発明は乗用車に限らない商品やサービスの販売量（需要）の予測に利用することができる。また、需要予測装置１００は、予測モデルを生成して、当該予測モデルを用いて販売量を予測しているが、別の装置（予測モデル生成装置）で生成された予測モデルを用いるようにしてもよい。

　本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１００　需要予測装置（予測モデル生成装置）
１１１　データ取得部
１１２　感性分析部
１１３　カテゴリ分類部
１１４　車種分析部
１１５　データ結合部
１１６　モデル生成部
１１７　予測根拠算出部
１１８　予測部
１１９　地域別予測部
１２０　可視化部
１３１　１月後予測モデル（予測モデル）
１３２　２月後予測モデル（予測モデル）
１３３　３月後予測モデル（予測モデル）
１３８　プログラム
２１０　メッセージデータベース（第２のテキストデータ）
２１４　メッセージ（第１のテキストデータ）
２１６　感性（感性情報）
２１７　感性詳細（感性情報）
２１８　カテゴリ
２１９　家計消費（経済状況）
２２０　株価（経済状況）
２６０　販売実績データ
３１０　１月後特徴量重要度データベース（特徴量重要度データベース）
３１１　順位（需要量へ影響を与える順番）
３１２　重要度（需要量へ影響度）
３２０　２月後特徴量重要度データベース（特徴量重要度データベース）
３３０　３月後特徴量重要度データベース（特徴量重要度データベース）
３４０　地域別割合予測モデル
３８０　予測結果データ
３８２，３８４，３８６　割合予測（販売比率）
３８３，３８５，３８７　販売予測（需要量）

Claims

　需要予測対象に係る潜在需要者が作成した第１のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第２のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて生成された予測モデルを用いて、前記需要予測対象の需要量を予測する予測部を備える
　ことを特徴とする需要予測装置。
　前記予測部が予測する需要量は、所定長の１つ以上の期間それぞれの需要量である
　ことを特徴とする請求項１に記載の需要予測装置。
　地域別の販売実績データから地域別の販売比率を予測し、当該販売比率と前記予測部が予測した需要量とから地域別の需要量を予測する地域別予測部をさらに備える
　ことを特徴とする請求項１に記載の需要予測装置。
　前記第１のテキストデータに付与する感性情報、カテゴリ、および経済状況の前記需要量への影響度、または、前記需要量へ影響を与える順番を含む特徴量重要度データベースが記憶された記憶部を備えるとともに、
　前記需要量と、前記影響度または前記順番が高い前記第２のテキストデータの感性情報、カテゴリ、または経済状況とを出力する可視化部を備える
　ことを特徴とする請求項１に記載の需要予測装置。
　前記可視化部は、出力した前記感性情報または前記カテゴリのなかで指定された感性情報またはカテゴリに係る前記第１のテキストデータを出力する
　ことを特徴とする請求項４に記載の需要予測装置。
　前記可視化部は、出力した前記経済状況のなかで指定された経済状況に対応する時系列データを出力する
　ことを特徴とする請求項４に記載の需要予測装置。
　需要予測装置の需要予測方法であって、
　前記需要予測装置は、
　需要予測対象に係る潜在需要者が作成した第１のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第２のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて生成された予測モデルを用いて、前記需要予測対象の需要量を予測するステップを実行する
　ことを特徴とする需要予測方法。
　需要予測対象に係る潜在需要者が作成した第１のテキストデータに対して感性情報とカテゴリと経済状況とが付与された第２のテキストデータを含むとともに、前記需要予測対象の販売実績データを含む学習データを用いて予測モデルを生成するモデル生成部を備える
　ことを特徴とする予測モデル生成装置。
　前記予測モデルを用いて予測される前記需要予測対象の需要量について、前記第２のテキストデータの感性情報、カテゴリ、および経済状況の前記需要量への影響度、または、前記需要量へ影響を与える順番を算出する予測根拠算出部をさらに備える
　ことを特徴とする請求項８に記載の予測モデル生成装置。