JP2018092347A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2018092347A JP2018092347A JP2016234794A JP2016234794A JP2018092347A JP 2018092347 A JP2018092347 A JP 2018092347A JP 2016234794 A JP2016234794 A JP 2016234794A JP 2016234794 A JP2016234794 A JP 2016234794A JP 2018092347 A JP2018092347 A JP 2018092347A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- concepts
- network
- document
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
創造的なタスクとして、コンセプトを創出するタスクを実施する手法の概要について説明する。コンセプトを創出するタスクには、コンセプト創出過程のモデルの生成と、当該モデルに基づいたコンセプトの生成とが含まれる。
2.1 コンセプトの意味ネットワークによる表現
概念のコンセプトとその意味を計算機(情報処理装置)で扱える形式でモデル化して表現するために、本実施形態では意味ネットワークのノードとその接続関係を用いる。意味ネットワークではノードが概念に対応しており、意味的に関連のある概念同士がエッジで接続されている。
S = (V, E)
本実施形態において、既存のコンセプトを表す意味ネットワークに新しい接続を付与した新しい意味ネットワークを生成することとしてコンセプト創出過程をモデル化する。
コンセプトの創出を従来の知識(コンセプト)を表す意味ネットワークSbeforeから新しい接続を生成する過程と捉えれば、情報処理装置によるコンセプトの自動生成(創出)には、入力データである意味ネットワークSbeforeと、式(3)で示した関数Ψが必要である。これらが与えられれば、コンセプトの生成ために定められた対象vtargetと、Sbeforeとを関数Ψに入力することにより、新しい接続が出力される。出力された接続を用いてコンセプトを生成できる。
ノードに概念が紐付けられ、ノード間の意味的なつながりがエッジで表されたような意味ネットワークを構築するためには、すべての概念の集合と概念のあいだの接続関係がわかればよい。すべての概念が与えられ、その概念の任意のペアの意味的なつながりの有無(例えば、「日本車」と「安全性」は接続され、「日本車」と「辛い」は接続されない等)を特定できれば、概念に対応するノードの集合をV、つながりのある概念間のエッジの集合をEとしたときに、意味ネットワーク(V, E)を構築できる。
専門家に共通したコンセプト創出の過程であるΨ*を近似的に再現するモデルを構築できれば、現在の知識を表現した意味ネットワークをΨ*に入力することにより、(例えば、商業的に)成功する確率の高いコンセプトを自動で生成することができる。そのためには、過去に成功したコンセプトについてΨ*の入出力関係に対応するデータを作成すればよい。作成したデータを学習データに用いて機械学習モデルを訓練することで、成功したコンセプトを創出した専門家に共通する生成過程を近似したモデルを得られることが期待される。
上記で説明したコンセプト生成の手法は、以下に説明する情報処理装置(計算機)であるコンセプト創出装置で実装することで実現できる。
図3を参照して、本実施形態に係るコンセプト創出装置のハードウェアの概略構成の例を説明する。図3に示すように、コンセプト創出装置10は、制御部11、通信部14、記憶部15及び入出力部16を主に備える。制御部11は、CPU(Central Processing Unit)12及びメモリ13を主に備えて構成される。コンセプト創出装置10は、専用若しくは汎用のサーバ・コンピュータ又はパーソナルコンピュータなどの情報処理装置を用いて実現することができる。また、コンセプト創出装置10は、例えば、CPU12がメモリ13等に格納された所定のプログラムを実行することにより、各種の機能実現手段として機能する。なお、コンセプト創出装置10は、単一の情報処理装置より構成されるものであっても、ネットワーク上に分散した複数の情報処理装置より構成されるものであってもよい。
本実施形態におけるコンセプト創出装置10の機能構成について説明する。コンセプト創出装置10は、機能構成として、意味ネットワーク構築モジュール12,15,20、学習機17、及びコンセプト創出モジュール18を主に備える。意味ネットワーク構築モジュール12,15及び学習機17によりコンセプト創出過程のモデルが生成される。当該生成されたモデルに基づいて、コンセプト創出モジュール18及び意味ネットワーク構築モジュール20によりコンセプトが創出される。コンセプト創出過程のモデル及びコンセプトの創出については、前述したとおりである。
以下に二つの実験結果について説明する。まず、過去に成功した商品コンセプトが持つ接続を本実施形態で説明した機械学習モデルで予測できることを検証する実験の結果を説明する。次に、本実施形態で説明した機械学習モデルを用いて新しいコンセプトを生成した実験結果を説明する。
過去に成功したコンセプトについて、意味ネットワークの接続のされ方に何らかの法則があることの検証には、過去に成功したコンセプトについての入出力データを作成し、その入出力データを近似する関数の存在を交差検定によって確認すればよい。交差検定は機械学習等の統計モデルの精度検証にしばしば用いられる方法で、正解付きのデータを訓練用データと検証用データに分割して精度検証を行う方法である。Ψの入出力データを近似する関数の存在を交差検定で確認するためには、過去のコンセプトについて入出力データを作成し、そのデータの一部を機械学習モデルの訓練に用い、残りのデータを検証用に用いて訓練済みモデルの推定精度を算出する。その精度がランダムに推定を行うモデルに比べて高ければ、訓練済みのモデルがデータの入出力関係を近似していることになり、入出力データを近似する関数が存在するという仮説が成立することになる。
インターネット検索エンジンで、「ラー油」、「携帯電話」、「日本車」というキーワードで検索して得られたウェブページを文書データとして用いた。これらキーワードは食べるラー油、iPhone(登録商標)、レクサス(登録商標)という成功した商品の対象概念である。これらの商品が登場した前後の意味ネットワークを作成するため、文書が公開された時期で検索結果を絞り込める検索エンジンを用いて、商品の登場前後についてそれぞれ文書を取得した。
以上の設定のもとで行った実験の精度を図6の表2及び図7の表3に示す。表2の結果は「ラー油」を検索キーワードとして収集した文書を用いて行った、単一コンセプトについての実験の精度であり、表3は、3つの全ての検索キーワードの文書を用いた複数コンセプトについての精度である。単一のコンセプトに関する実験の交差検定の分割数は3とし、複数コンセプトについては式(9)(10)にしたがってコンセプトごとに分割した。分割ごとの得られる精度の平均と分散が表に示した値である。データの正負のラベルの数が大きく偏っていることをふまえ、評価指標には、Precision、 Recall、 F値、 Cohen's kappaを用いた。F値はPrecisionとRecallの調和平均である。Cohen's kappaはラベルに偏りがある教師有り学習タスクの評価にしばしば用いられる指標であり、−1から1をとる。
続を予測したい概念の個々の次数の寄与度は1%であった。
過去に成功したコンセプトの法則性を抽出したモデルを用いて、「醤油」、「ケチャップ」、「塩」の新しい商品コンセプトの創出を試みた。モデルの学習データには、4.1に示した「食べるラー油」についての単一コンセプトの実験のために作成した学習データをそのまま用いた。交差検定が不要なので訓練データとテストデータを分割せず、データの全てを訓練用のデータとしてRFを訓練した。すなわち、ランダムフォレストを用いて機械学習を行った。対象概念である「醤油」、「ケチャップ」、「塩」の、それぞれについて特徴量のデータを作成した。作成された特徴量のデータを訓練済みの学習機に入力することで、新たな意味付けに用いるべき概念の集合を得た。
本発明は、上記した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。
Claims (8)
- 文書データから抽出された概念間のネットワークを構築する構築部と、
第1の属性値を有する文書から前記構築部により構築された概念間の第1のネットワークを説明変数とし、第2の属性値を有する文書から前記構築部により構築された概念間の第2のネットワークを目的変数として機械学習を行い、概念間の第3のネットワークに応じて概念間の第4のネットワークを出力するために使用される関数を生成する生成部と
を備えた情報処理装置。 - 前記第1の属性値を有する文書は、第1のタイミングに関連付けられた文書であり、
前記第2の属性値を有する文書は、前記第1のタイミングより後のタイミングである第2のタイミングに関連付けられた文書である、請求項1に記載の情報処理装置。 - 前記第1の属性値を有する文書は、第1の著者による文書であり、
前記第2の属性値を有する文書は、第2の著者による文書である、請求項1に記載の情報処理装置。 - 前記機械学習は、ランダムフォレストを用いて行われる、請求項1から3のいずれか一項に記載の情報処理装置。
- 前記構築部により構築されるネットワークは、意味ネットワークにより表現される、請求項1から4のいずれか一項に記載の情報処理装置。
- 前記構築部により構築されるネットワークは、前記概念をクラスとするクラス図により表現される、請求項1から4のいずれか一項に記載の情報処理装置。
- 文書データから抽出された概念間のネットワークを構築する構築ステップと、
第1の属性値を有する文書から前記構築ステップにより構築された概念間の第1のネットワークを説明変数とし、第2の属性値を有する文書から前記構築ステップにより構築された概念間の第2のネットワークを目的変数として機械学習を行い、概念間の第3のネットワークに応じて概念間の第4のネットワークを出力するために使用される関数を生成する生成ステップと
を備える情報処理方法。 - コンピュータを、
文書データから抽出された概念間のネットワークを構築する構築部、
第1の属性値を有する文書から前記構築部により構築された概念間の第1のネットワークを説明変数とし、第2の属性値を有する文書から前記構築部により構築された概念間の第2のネットワークを目的変数として機械学習を行い、概念間の第3のネットワークに応じて概念間の第4のネットワークを出力するために使用される関数を生成する生成部、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016234794A JP2018092347A (ja) | 2016-12-02 | 2016-12-02 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016234794A JP2018092347A (ja) | 2016-12-02 | 2016-12-02 | 情報処理装置、情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018092347A true JP2018092347A (ja) | 2018-06-14 |
Family
ID=62566235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016234794A Pending JP2018092347A (ja) | 2016-12-02 | 2016-12-02 | 情報処理装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018092347A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291894A (zh) * | 2018-11-21 | 2020-06-16 | 第四范式(北京)技术有限公司 | 超参数优化过程中的资源调度方法、装置、设备及介质 |
KR20210038263A (ko) * | 2019-09-30 | 2021-04-07 | 주식회사 니블스카이 | Hmm 기반의 클릭스트림 데이터를 이용한 구매 여부 예측 시스템 및 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001243223A (ja) * | 2000-02-29 | 2001-09-07 | Nec Corp | 意味ネットワーク自動作成装置及びコンピュータ可読記録媒体 |
JP2012501018A (ja) * | 2008-08-29 | 2012-01-12 | プライマル フュージョン インコーポレイテッド | 既存の領域定義を活用した意味概念定義および意味概念関係の統合のためのシステムおよび方法。 |
-
2016
- 2016-12-02 JP JP2016234794A patent/JP2018092347A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001243223A (ja) * | 2000-02-29 | 2001-09-07 | Nec Corp | 意味ネットワーク自動作成装置及びコンピュータ可読記録媒体 |
JP2012501018A (ja) * | 2008-08-29 | 2012-01-12 | プライマル フュージョン インコーポレイテッド | 既存の領域定義を活用した意味概念定義および意味概念関係の統合のためのシステムおよび方法。 |
Non-Patent Citations (4)
Title |
---|
林良彦: "概念間の想起の強さと方向性の予測", 2016年度 人工知能学会全国大会(第30回)論文集, JPN6020044424, 6 June 2016 (2016-06-06), JP, pages 1 - 4, ISSN: 0004565680 * |
玉井哲雄 ほか, ソフトウェア工学, JPN6020044426, 20 March 2013 (2013-03-20), pages 94 - 97, ISSN: 0004565682 * |
玉井哲雄, ソフトウエア工学の基礎, JPN6020044425, 12 July 2016 (2016-07-12), pages 47 - 53, ISSN: 0004565681 * |
須藤明人 ほか: "ウェブ文書と機械学習で新しい商品コンセプトを生み出す創造的な人工知能に関する一検討", 電子情報通信学会技術研究報告, vol. 116, no. 105, JPN6020011628, 11 June 2016 (2016-06-11), JP, pages 25 - 28, ISSN: 0004565679 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291894A (zh) * | 2018-11-21 | 2020-06-16 | 第四范式(北京)技术有限公司 | 超参数优化过程中的资源调度方法、装置、设备及介质 |
CN111291894B (zh) * | 2018-11-21 | 2024-06-07 | 第四范式(北京)技术有限公司 | 超参数优化过程中的资源调度方法、装置、设备及介质 |
KR20210038263A (ko) * | 2019-09-30 | 2021-04-07 | 주식회사 니블스카이 | Hmm 기반의 클릭스트림 데이터를 이용한 구매 여부 예측 시스템 및 방법 |
KR102302780B1 (ko) * | 2019-09-30 | 2021-09-15 | 주식회사 니블스카이 | Hmm 기반의 클릭스트림 데이터를 이용한 구매 여부 예측 시스템 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Transparency and accountability in AI decision support: Explaining and visualizing convolutional neural networks for text information | |
JP6961727B2 (ja) | 関心点コピーの生成 | |
US11138212B2 (en) | Natural language response recommendation clustering for rapid retrieval | |
CN106462807B (zh) | 根据大规模非结构化数据学习多媒体语义 | |
CN111539197B (zh) | 文本匹配方法和装置以及计算机系统和可读存储介质 | |
CN109933686B (zh) | 歌曲标签预测方法、装置、服务器及存储介质 | |
CN112307351A (zh) | 用户行为的模型训练、推荐方法、装置和设备 | |
JP2014501988A (ja) | 複合的知識表現の解析及び合成を行うシステム及び方法 | |
CN106557563A (zh) | 基于人工智能的查询语句推荐方法及装置 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
Chaudhari et al. | A few good predictions: selective node labeling in a social network | |
Ning et al. | Integration of image feature and word relevance: Toward automatic image annotation in cyber-physical-social systems | |
JP2018092347A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN113869609A (zh) | 一种根因分析频繁子图置信度预测方法及系统 | |
US11501071B2 (en) | Word and image relationships in combined vector space | |
Jia et al. | Latent task adaptation with large-scale hierarchies | |
Sunitha et al. | Political optimizer-based automated machine learning for skin lesion data | |
Henri et al. | A deep transfer learning model for the identification of bird songs: A case study for Mauritius | |
KR102549937B1 (ko) | Sns 텍스트 기반의 사용자의 인테리어 스타일 분석 모델 제공 장치 및 방법 | |
Fergus et al. | Natural language processing | |
KR102466559B1 (ko) | 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템 | |
CN105808522A (zh) | 一种语义联想的方法及装置 | |
Qin et al. | Recommender resources based on acquiring user's requirement and exploring user's preference with Word2Vec model in web service | |
KR102549939B1 (ko) | Sns 텍스트 기반의 사용자의 인테리어 스타일 분석 모델 제공 서버, 사용자 단말 및 방법 | |
US11769340B2 (en) | Information processing apparatus and method of inferring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20161222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201119 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210806 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220228 |