JP2023043129A

JP2023043129A - ターゲット情報生成方法及びシステム

Info

Publication number: JP2023043129A
Application number: JP2021212157A
Authority: JP
Inventors: ジスジョン; Jisu Jeong; ジンウクキム; Jin-Wuk Kim; ソクフンキム; Seokhoon Kim; ジエホ; Ji Ae Heo
Original assignee: Naver Corp
Current assignee: Naver Corp
Priority date: 2021-09-15
Filing date: 2021-12-27
Publication date: 2023-03-28
Anticipated expiration: 2041-12-27
Also published as: JP7334230B2; KR20230040138A; KR102629214B1

Abstract

【課題】アイテムに関するターゲット情報を生成する方法及びシステムを提供する。【解決手段】本発明によるターゲット情報生成方法は、サンプルデータ及び前記サンプルデータに対応する校正データがそれぞれ含まれる異なる複数のサンプルデータセットの選択を受けるステップと、アイテムに関連する関連情報の入力を受けるステップと、前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも１つのキーワードを含むターゲット情報を生成するステップと、を含む。【選択図】図１

Description

本発明は、アイテムに関するターゲット情報を生成する方法及びシステムに関する。

人工知能の辞書的意味は、人間の学習能力、推論能力、知覚能力、自然言語理解能力などをコンピュータプログラムで実現した技術である。このような人工知能は、ディープラーニングにより飛躍的に発展してきた。

特に、人工知能が発達するにつれて様々な言語モデル（Language Model）が開発されており、このような言語モデルは、テキストを認知し、その意味を理解するだけでなく、文書などのように膨大なテキストが含まれるデータから情報を抽出し、分類し、ひいては、直接テキストを生成するレベルに至っている。

このような言語モデルは、様々な分野に積極的に用いられており、例えば、検索エンジン、文書作成（ｅｘ：履歴書作成、報告書作成、掲示物作成など）、様々なテーマに関する自由対話、与えられたテキストでのデータパース（ｅｘ：データ要約、分類など）、専門知識の提供、プログラミング、与えられた文章のスタイル変換などのように、テキストをベースとする様々な分野で用いられる。

このような言語モデルに基づいて、従来人間が直接行っていた様々な業務の自動化を図ることができるようになった。特に、様々なサービス分野（例えば、ショッピングサービス、ニュースサービス、など）で人間により直接生成されるか、修正されていたテキストベースの作業の自動化が可能となった。よって、サービスの特性を加味して言語モデルを用いる方法に関する研究が必要である。

本発明は、様々なサービス分野に応じてカスタマイズされたターゲット情報を生成できるターゲット情報生成方法及びシステムを提供するためのものである。

また、本発明は、ショッピングサービスに活用できるターゲット情報を生成するターゲット情報生成方法及びシステムを提供するためのものである。

さらに、本発明は、言語モデル（Language Model、LM）を用いて、状況に適したテキストで構成された情報を生成できるターゲット情報生成方法及びシステムを提供するためのものである。

上記課題を解決するために、本発明によるターゲット情報生成方法は、特定のカテゴリーに該当するサンプルデータ及び前記サンプルデータに対応する校正データが一対（pair）としてそれぞれ含まれる異なる複数のサンプルデータセット（dataset）の入力を受けるステップと、前記特定のカテゴリーに該当し、アイテム（item）に関連する関連情報の入力を受けるステップと、前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも１つのキーワードを含むターゲット情報を生成するステップと、を含むようにしてもよい。

また、本発明によるターゲット情報生成システムは、特定のカテゴリーに該当するサンプルデータ及び前記サンプルデータに対応する校正データが一対（pair）としてそれぞれ含まれる異なる複数のサンプルデータセット（dataset）を保存する保存部と、アイテム（item）に関連する関連情報及び前記複数のサンプルデータセットを用いて、前記関連情報に関連する少なくとも１つのキーワードを含むターゲット情報を生成するプロセスを実行する制御部と、を含むようにしてもよい。

さらに、本発明による電子機器で１つ以上のプロセスにより実行され、コンピュータ可読記録媒体に格納されるプログラムは、特定のカテゴリーに該当するサンプルデータ及び前記サンプルデータに対応する校正データが一対（pair）としてそれぞれ含まれる異なる複数のサンプルデータセット（dataset）の入力を受けるステップ、前記特定のカテゴリーに該当し、アイテム（item）に関連する関連情報の入力を受けるステップ、並びに、前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも１つのキーワードを含むターゲット情報を生成するステップ、を実行させるコマンドを含むようにしてもよい。

前述したように、本発明によるターゲット情報生成方法及びシステムは、サンプルデータセット及びアイテムに関連する関連情報が含まれるプロンプト（prompt）を入力とする言語モデルを用いて、アイテムに関するターゲット情報を生成することができる。本発明によるターゲット情報生成方法及びシステムにおいては、サンプルデータ及び前記サンプルデータに対応する校正データが一対として含まれるようにサンプルデータセットを構成することにより、言語モデルがプロンプトに基づいて校正データに対応する品質のターゲット情報を生成するように誘導することができる。

よって、本発明によるターゲット情報生成方法及びシステムにより、アイテムに関連する関連情報に基づいて、校正データに対応する品質のターゲット情報を生成することができる。その結果、ユーザは、関連情報を校正もしくは修正してターゲット情報を生成するための作業を減らすことができ、業務効率を最大化することができる。

本発明によるターゲット情報生成方法及びシステムの活用例を説明するための概念図である。本発明によるターゲット情報生成システムを説明するための概念図である。本発明によるターゲット情報生成方法及びシステムで用いられるプロンプトを説明するための概念図である。本発明によるターゲット情報生成方法を説明するためのフローチャートである。本発明によるターゲット情報生成方法を説明するためのフローチャートである。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。サンプルデータセット及びターゲット情報を説明するための概念図である。

以下、添付図面を参照して本発明の実施形態について詳細に説明するが、図面番号に関係なく、同一又は類似の構成要素には同一の符号を付し、それについての重複する説明は省略する。以下の説明で用いられる構成要素の接尾辞である「モジュール」や「部」は、明細書の作成を容易にするために付与又は混用されるものであり、それ自体が有意性や有用性を有するものではない。また、本発明の実施形態について説明するにあたり、関連する公知技術についての具体的な説明が本発明の実施形態の要旨を不明にすると判断される場合は、その詳細な説明を省略する。さらに、添付図面は本発明の実施形態の理解を助けるためのものにすぎず、添付図面により本発明の技術的思想が限定されるものではなく、本発明の思想及び技術範囲に含まれるあらゆる変更、均等物、乃至代替物を含むものと理解すべきである。

「第１」、「第２」などのように序数を含む用語は、様々な構成要素を説明するために用いられるが、上記構成要素は上記用語により限定されるものではない。上記用語は、１つの構成要素を他の構成要素と区別する目的でのみ用いられる。

ある構成要素が他の構成要素に「連結」又は「接続」されていると言及された場合は、他の構成要素に直接連結又は接続されていてもよく、中間に、さらに他の構成要素が存在してもよいものと解すべきである。それに対して、ある構成要素が他の構成要素に「直接連結」又は「直接接続」されていると言及された場合は、中間には、さらなる他の構成要素が存在しないものと解すべきである。

単数の表現には、特に断らない限り複数の表現が含まれる。

本明細書において、「含む」や「有する」などの用語は、本明細書に記載された特徴、数字、段階、動作、構成要素、部品、又はそれらの組み合わせが存在することを指定しようとするものであり、１つ又はそれ以上の他の特徴、数字、段階、動作、構成要素、部品、又はそれらの組み合わせの存在や付加可能性を予め排除するものではないと理解すべきである。

前述したように、人工知能が発達するにつれて様々な言語モデルが開発されており、それに基づいて、従来人間が直接行っていた様々な業務の自動化を図ることができるようになった。特に、様々なサービス分野（例えば、ショッピングサービス、ニュースサービス、など）で人間により直接生成されるか、校正もしくは修正されていたテキストベースの作業の自動化が可能となった。本発明は、様々なサービス分野に応じてカスタマイズされた情報を生成できるターゲット情報生成方法及びシステムを提供するためのものである。

本発明においては、説明の便宜上、「ターゲット情報」という用語を用いて、本発明によるターゲット情報生成方法及びシステムにより生成される情報を定義する。ただし、上記用語を自由に変更できることは言うまでもない。

また、本発明における「ターゲット情報を生成する」とは、ｉ）新たな情報を生成すること、および、ｉｉ）情報を校正もしくは修正すること、の両方を含む意味である。これは、情報の校正もしくは修正の結果物も情報の生成として捉えられるからである。

なお、本発明によるターゲット情報生成方法及びシステムにおいては、アイテムを基準とし、アイテムに関するターゲット情報を生成するようにしてもよい。

本発明におけるアイテムは、本発明が適用される分野に応じて様々に定義される。

一例として、図１に示すように、本発明が適用される分野がショッピングサービス分野である場合、アイテムとは商品を意味する。この場合、本発明によるターゲット情報生成方法及びシステムにおいては、図１の（ｂ）に示すように、アイテム、すなわち商品（例えば、靴や鞄など）に関するターゲット情報３１ａ、３２ａを生成する。このようなターゲット情報３１ａ、３２ａは、ショッピングサービスに活用される。また、ターゲット情報３１ａ、３２ａは、図１の（ｂ）に示すように、ショッピングサービスのためのショッピングサービスページ（例えば、ウェブページ又はアプリケーション(application)のページ）３０に露出し、アイテムの商品名として活用され、または、アイテムを説明する用途に活用されるなど、様々に活用される。

他の例として、本発明が適用される分野がニュースサービス分野である場合、アイテムとは記事（又は、ニュース記事）のコンテンツ（content）を意味する。この場合、本発明によるターゲット情報生成方法及びシステムにおいては、アイテム、すなわちニュース記事に関するターゲット情報を生成する。このようなターゲット情報は、ニュースサービスページ（例えば、ウェブページ又はアプリケーション(application)のページ）に露出し、アイテムのニュース記事のタイトル、ヘッドライン、アイテムを説明する用途に活用されるなど、様々に活用される。

その他にも、本発明は、様々なサービス分野に活用され、本発明で生成されるターゲット情報は、アイテムのタイトル、アイテムに関する説明、アイテムに関する情報としての役割を果たす。

一方、ターゲット情報は、アイテムに関連する情報に基づいて生成されてもよい。本発明においては、説明の便宜上、「アイテムに関連する情報」を「関連情報」とする。このような関連情報は、アイテムに関連して、少なくとも１つのサーバ（server）に保存（もしくは、登録）されるか、又は、少なくとも１つの保存部（もしくは、ストレージ）に保存された情報であってもよい。

このような関連情報は、本発明によるシステム又は少なくとも１つの他のシステムにより生成された情報であってもよく、ユーザ又は管理者により入力された情報であってもよい。

関連情報について例を挙げて説明すると、図１の（ａ）に示すように、関連情報は、アイテム（例えば、ショッピングアイテム又は商品）に関する様々な情報２１、２２のうち少なくとも１つであり、例えばアイテムの商品名２１ａ、２２ａであってもよい。

一例として、図１の（ａ）に示すように、第１アイテム（例えば、「靴」）に関する情報２１のうち、第１関連情報２１ａは、第１アイテムの商品名である「サルヴァトーレ・シャッカフラワーヒールベルベットミュール０１Ｍ９０」である。

他の例として、図１の（ａ）に示すように、第２アイテム（例えば、「鞄」）に関する情報２２のうち、第２関連情報２２ａは、第２アイテムの商品名である「プリダ・ＳＡＣＣＡサテンブラックショルダーバッグ・ブラック」である。

なお、本発明によるターゲット情報生成方法及びシステムにおいては、前述したアイテムに関連する関連情報（例えば、第１関連情報２１ａ、第２関連情報２２ａ）を用いて、図１の（ｂ）に示すように、ターゲット情報（例えば、第１ターゲット情報３１ａ、第２ターゲット情報３２ｂ）を生成することができる。

このように、本発明においては、関連情報を用いて様々なターゲット情報を生成することができ、当該ターゲット情報は、上記例のように、ショッピングアイテムの商品名やニュース記事のタイトルなどに活用することができる。

一例として、本発明をショッピングアイテムの商品名校正器として活用する場合、関連情報のうち少なくとも一部には、ショッピングアイテムに関連する関連情報が含まれるようにしてもよく、本発明においては、それに基づいてショッピングアイテムに関するターゲット情報を生成することができる。

他の例として、本発明をニュース記事のタイトル校正器として活用する場合、関連情報のうち少なくとも一部には、ニュース記事に関連する関連情報が含まれるようにしてもよく、本発明においては、それに基づいてニュース記事に関するターゲット情報を生成することができる。

一方、関連情報に基づいて生成されるターゲット情報は、関連情報が属するカテゴリー（又は、関連情報の属性）と同じカテゴリー（又は、同じ属性）の情報であってもよい。すなわち、本発明においては、関連情報が属するカテゴリーと同じカテゴリーのターゲット情報を生成するようにしてもよい。この場合、ターゲット情報として取得したい特定のカテゴリーの情報が存在すると、本発明においては、関連情報として、前記特定のカテゴリーの情報を入力することにより、ターゲット情報を取得することができる。

例えば、前述したように、関連情報がアイテムの商品名である場合、ターゲット情報は、アイテムの商品名であってもよい。

また、関連情報に基づいて生成されるターゲット情報は、関連情報が属するカテゴリーとは異なるカテゴリーに属する情報であってもよいことは言うまでもない。本発明においては、ターゲット情報を生成するためのサンプルデータセットの構成を変化させることにより、必要な形態のターゲット情報を生成することができる。

一方、本発明によるターゲット情報生成方法及びシステムにおいては、言語モデルを用いて、ターゲット情報を生成することができ、本発明においては、このような言語モデルを「大言語モデル」とする。なお、大言語モデルは、様々な用語で呼ばれ、本発明においては、その用語については特に限定しない。

本発明で用いられる大言語モデルは、その種類が特に限定されるものではなく、様々な情報についての学習が行われた言語モデルであればよい。なお、近年盛んに研究されている大言語モデルは、フューショットラーニング（few-shot learning）などの方式を用いて、ファインチューニング（fine-tuning）することなく推論が可能な言語モデルであって、従来の一般言語モデルに比べてモデルサイズを１００倍以上大きくすることができ、多くの量のデータを用いて学習が行われる。例えば、ハイパークローバ（HyperCLOVA）、ＧＰＴ－３（Generative Pre-trained Transformer 3）などであり、本発明においても、これらの大言語モデルを用いることができる。

本発明によるターゲット情報生成方法及びシステムにおいては、図１に示すように、大言語モデル１０にアイテムに関連する関連情報及び追加情報（例えば、後述するサンプルデータセット）を入力することにより、ターゲット情報を生成することができる。

以下、添付図面を参照して、本発明によるターゲット情報生成方法及びシステムについてより具体的に説明する。図２は、本発明によるターゲット情報生成システムを説明するための概念図であり、図３は、本発明によるターゲット情報生成方法及びシステムで用いられるプロンプトを説明するための概念図である。また、図４及び図５は、本発明によるターゲット情報生成方法を説明するためのフローチャートであり、図６ａ、図６ｂ、図６ｃ、図７、図８、図９ａ、図９ｂ、図９ｃ、図１０、及び図１１は、サンプルデータセット及びターゲット情報を説明するための概念図である。

図２に示すように、本発明によるターゲット情報生成システム１００は、入力部１１０、保存部１２０、及び制御部１３０の少なくとも１つを含んでもよい。また、図示していないが、本発明によるターゲット情報生成システム１００は、通信部をさらに含んでもよい。通信部は、電子機器（又は、ユーザの電子機器）と通信を行うようにしてもよい。

さらに、ターゲット情報生成システム１００は、大言語モデル１０と連動するようにしてもよい。すなわち、ターゲット情報生成システム１００は、大言語モデル１０を用いてターゲット情報を生成するものであり、ターゲット情報生成システム１００の構成の少なくとも一部は、大言語モデル１０への情報の入力を処理し、または、大言語モデル１０から出力される情報を処理する役割を果たす。

さらに、本発明によるターゲット情報生成システム１００は、大言語モデル１０を含むようにしてもよいことは言うまでもない。

まず、入力部１１０は、大言語モデル１０に入力されるプロンプトを構成する情報の入力又は選択を受ける役割を果たす。

入力部１１０は、ｉ）ユーザと本発明によるターゲット情報生成システム１００、又は、ｉｉ）本発明によるターゲット情報生成システム１００と少なくとも１つの他のシステムとを接続するインタフェース（interface）を含んでもよい。また、入力部１１０は、本発明によるターゲット情報生成システム１００に含まれる構成要素間を接続するインタフェースを含んでもよい。

本発明においては、大言語モデル１０にプロンプト３１０を入力することにより、その結果物としてターゲット情報を取得することができる。ここで、プロンプト３１０は、図３の（ａ）に示すように、大言語モデル１０に入力されるデータであり、様々なデータセットを含むようにしてもよい。

プロンプト３１０は、少なくとも１つのサンプルデータセット３１１、３１２、及びターゲットデータセット３１３の少なくとも一方を含むようにしてもよい。

ここで、サンプルデータセット３１１、３１２は、ターゲット情報を生成するために、大言語モデル１０が参照するデータを含んでもよい。また、サンプルデータセット３１１、３１２は、各サンプルデータに関するターゲット情報をさらに含んでもよく、その詳細については後述する。

ターゲットデータセット３１３は、ターゲット情報の生成の対象となるアイテムに関するデータを含んでもよい。前述したアイテムに関連する関連情報は、ターゲットデータセット３１３のデータとして含まれてもよい。すなわち、ターゲットデータセット３１３は、アイテムに関連する関連情報を含んでもよい。

サンプルデータセット３１１、３１２、及びターゲットデータセット３１３に含まれるデータのそれぞれは、少なくとも１つのカテゴリー（又は、属性）に対応するようにしてもよい。

また、サンプルデータセット３１１、３１２に含まれるデータのカテゴリー（又は、属性）と、ターゲットデータセット３１３に含まれるデータのカテゴリー（又は、属性）とは、少なくとも１つが同じであってもよい。例えば、ターゲットデータセット３１３に「商品名」カテゴリーが含まれる場合、サンプルデータセット３１１、３１２にも「商品名」カテゴリーが含まれるようにしでもよい。

なお、本発明においては、上記例とは異なり、サンプルデータセット３１１、３１２に含まれるデータのカテゴリー（又は、属性）と、ターゲットデータセット３１３に含まれるデータのカテゴリー（又は、属性）とは、全て異なってもよいことは言うまでもない。

さらに、サンプルデータセット３１１、３１２及びターゲットデータセット３１３を構成するデータは、それぞれのカテゴリー（又は、データタイプ、データ属性）に該当するデータフィールド（data filed）及びデータ値から構成されてもよい。

データフィールドは、図３の（ａ）に示すように、「商品名」、「日付」、「校正文句」のように、データ値が示す意味又はデータ値の種類を定義するためのものである。このようなデータフィールドは、「カテゴリー名」、「データタイプ」、「データ属性」などと理解できる。

一方、データフィールドは、大言語モデル１０が認識できるように、事前に定義された規則に従うようにしてもよい。一例として、大言語モデル１０は、「商品名：」に続いて入力されるデータを、「商品名」というデータフィールド（ｅｘ：カテゴリー）に該当するデータとして認識するようにしてもよい。

他の例として、大言語モデル１０は、特定のデータフィールド（例えば、「校正文句：」）に続いて入力されるデータを、該当データセットに含まれるデータ値に基づいて生成又は校正されたデータとして認識するようにしてもよい。

例えば、図３の（ａ）に示すように、大言語モデル１０は、特定のサンプルデータセット３１１に含まれる特定のデータフィールド（「校正文句：」）に対応するデータ値（「コーヒースター・タンブラー」）は、特定のサンプルデータセット３１１に含まれるサンプルデータ３１１ａ、３１１ｂに基づいて生成又は校正（もしくは、修正）されたデータとして認識するようにしてもよい。

大言語モデル１０と本発明によるターゲット情報生成システム１００とは、様々なデータフィールドが有する意味及びデータ特性について、事前に定義された規則を共有するようにしてもよい。

なお、本発明においては、プロンプト３１０の最後をデータフィールドにすることにより、それに対応するデータ値３１３ｄを、プロンプト３１０を入力とする大言語モデル１０の出力として取得することができる。その結果、図３の（ｂ）に示すように、「校正文句」データフィールド３１３ｃに対応するデータ値３１３ｄ（「安全で快適なベッド」）を取得することができる。

なお、データフィールドの名称は、状況に応じて適切な用語に変更できることは言うまでもない。

プロンプト３１０は、異なるデータセットを区分するセパレータ（又は、区分データ、識別子）３１４を含んでもよい。セパレータ３１４は、同図に示すように「＃＃＃＃＃」で表してもよく、様々な文字や記号を用いて表してもよい。このようなセパレータ３１４は、大言語モデル１０と事前に定義した規則に基づくようにしてもよい。大言語モデル１０は、プロンプト３１０にセパレータ３１４が含まれる場合、セパレータ３１４の次にあるデータは、セパレータ３１４の前にあるデータとは異なるデータセットに含まれるデータとして認識する。

次に、保存部１２０には、様々な情報が保存される。保存部１２０は、本発明によるターゲット情報生成システム１００の内部又は外部の少なくとも一方に存在するようにしてもよい。保存部１２０は、サーバで構成されてもよく、クラウド方式のストレージで構成されてもよいことは言うまでもない。

保存部１２０には、複数のサンプルデータセット及びターゲットデータセットの少なくとも一方に関するデータが保存されるようにしてもよい。保存部１２０には、プロンプト３１０に含まれるサンプルデータセットの他に、さらなる様々なサンプルデータセットが保存されるようにしてもよい。プロンプト３１０に含まれるサンプルデータセットは、保存部１２０に存在する様々なサンプルデータセットのうち、ユーザ又は制御部１３０により選択された少なくとも一部であってもよい。

また、保存部１２０には、アイテムに関連する関連情報が保存されるようにしてもよい。制御部１３０は、保存部１２０に含まれるアイテムに関連する関連情報を用いて、ターゲットデータセットを構成することができる。

次に、制御部１３０は、ターゲット情報を生成するための全般的な制御を行うことができる。例えば、制御部１３０は、大言語モデル１０にプロンプト３１０が入力として処理されるように、大言語モデル１０と連動することができる。また、本発明によるターゲット情報生成システム１００は、大言語モデル１０を一構成として含んでもよく、その場合、制御部１３０は、ターゲット情報の生成のために大言語モデル１０に対する適切な制御を行うことができる。

一方、制御部１３０は、大言語モデル１０により生成されたターゲット情報の検証を行い、その検証の結果に基づいてターゲット情報を再生成する一連のプロセスを実行することができる。

また、制御部１３０は、大言語モデル１０により生成された複数のターゲット情報から少なくとも１つを最終的に選択し、または、最終選択のために複数のターゲット情報のそれぞれの意味分析を行うことができる。ここで、意味分析とは、複数のターゲット情報のそれぞれと関連情報との関連性の程度を判断することをいい、様々な方法に基づいて行うことができる。

一方、大言語モデル１０により生成されたターゲット情報は、保存部１２０に保存されるか、ユーザが確認できるように出力部（図示せず）に出力されるなど、状況に応じて適切に処理される。制御部１３０は、生成されたターゲット情報に関する処理を行い、例えば、ターゲット情報をユーザに対して視覚的に出力する場合、連動したディスプレイ部を用いてターゲット情報を出力することができる。例えば、出力部は、ユーザの電子機器に備えられたディスプレイ部であってもよい。

本発明によるターゲット情報生成システム１００は、ユーザの電子機器との通信により、ユーザの電子機器から関連情報が入力されるようにしてもよい。また、ターゲット情報生成システム１００は、大言語モデル１０を用いてユーザの電子機器から入力された関連情報に基づいてターゲット情報を生成し、それをユーザの電子機器に送信するようにしてもよい。

ユーザの電子機器から入力された関連情報は、少なくとも１つのカテゴリーに関する情報であってもよい。

例えば、本発明によるターゲット情報生成システム１００がショッピングアイテムの商品名校正器として活用される場合、本発明によるターゲット情報生成システム１００においては、ユーザの電子機器からショッピングアイテムに関連する少なくとも１つのカテゴリーに関する情報の入力を受けるようにしてもよい。ショッピングアイテムに関連する少なくとも１つのカテゴリーは、商品名、日付、レビュー、ブランド、カラー、サイズ、など様々である。

ターゲット情報生成システム１００は、ユーザの電子機器から入力された関連情報及び複数のサンプルデータセットを用いて、ターゲット情報を生成するようにしてもよい。

ここで、複数のサンプルデータセットの選択は、ターゲット情報生成システム１００の制御下で行われるようにしてもよく、ユーザの要求に基づいて行われるようにしてもよい。

以下、前述した本発明によるターゲット情報生成システム１００を参照して、ターゲット情報を生成する方法についてより具体的に説明する。

図４に示すように、本発明においては、複数のサンプルデータセットを選択（又は、選定）する過程が行われる（Ｓ４１０）。ここで、複数のサンプルデータセットに含まれるデータは、プロンプトに含まれ、プロンプトは、大言語モデル１０に入力され、ターゲット情報の生成に用いられる。

サンプルデータセットを構成するデータについてより具体的に説明すると、サンプルデータセットは、異なる複数のカテゴリーにそれぞれ対応するデータを含んでもよい。

ここで、カテゴリーは、データの意味、データの種類、データのタイプ、及びデータの属性の少なくとも１つを定義するためのものであり、例えば、図６ａに示すような商品名６１１、日付６１２、校正文句６１３、図６ｂに示すような商品種類カテゴリー６３３、ブランド（brand）６３４、図６ｃに示すようなタグ（tag）６５５、など様々なカテゴリーが存在する。一方、上記列挙したカテゴリーのほとんどは、ショッピングサービスのカテゴリーであってもよい。このように、サンプルデータセットを構成するカテゴリーは、サンプルデータセットを構成するデータの内容によって様々である。

例えば、サンプルデータセットを構成するデータの内容がニュース記事である場合、カテゴリーは、言論社、記事タイトル、日付、記事分野、コメント、校正文句、などから構成されてもよい。

なお、本発明において、サンプルデータセットを構成するデータは、異なる特性を有するようにしてもよい。

まず、サンプルデータセットを構成する第１特性のデータは、少なくとも１つのカテゴリーにそれぞれ対応するデータであり、本発明においては、それを「サンプルデータ」とする。

本発明によるサンプルデータセットには、前述したサンプルデータ及びサンプルデータに対応するターゲット情報（又は、ターゲットデータ）が一対として含まれてもよい。ここで、ターゲット情報（又は、ターゲットデータ）を第２特性のデータとする。すなわち、サンプルデータセットには、ターゲット情報に該当するデータ（又は、ターゲットデータ、ターゲット文句）が含まれてもよい。

本発明において、ターゲット情報に該当する「校正文句」カテゴリーのデータは、サンプルデータセットを構成するデータに基づいて生成又は校正（もしくは修正）された文句（又はテキスト、データ）である。ターゲット情報に該当する校正文句は、前述した第１特性のデータに基づいて生成又は校正された文句であってもよい。

このように、サンプルデータセットに含まれるターゲット情報は、サンプルデータセットを構成するデータに基づいて生成又は校正することができる。ここで、ターゲット情報に該当するデータのカテゴリーは、サンプルデータに対応する少なくとも１つのカテゴリーと同じカテゴリーであってもよく、異なるカテゴリーであってもよい。

ターゲット情報に該当するデータのカテゴリーがサンプルデータに対応する少なくとも１つのカテゴリーと同じ場合、例えば、第１特性のデータであるサンプルデータに商品名カテゴリーが含まれる場合、第２特性のデータである校正文句は、商品名カテゴリーに該当するデータであってもよい。一方、ターゲット情報カテゴリーに該当するデータは、本発明によるターゲット情報生成システム１００により生成された情報であってもよく、ユーザ又は管理者により入力された情報であってもよい。

ターゲット情報に該当するデータは、当該ターゲット情報に関するサンプルデータセットを構成するデータに関連するキーワードを少なくとも１つ含むようにしてもよい。ここで、キーワードは、サンプルデータセットを構成するデータに該当するテキスト（又は、トークン(token)）の少なくとも一部と同一又は同様の意味を有するものであってもよい。

ここで、「トークン」は、自然言語処理のために１つの単語を細分化した単語片からなる。韓国語の場合、単語は、平均して１つや２つのトークンからなる。例えば、「

（発音：マシッソ、意味：美味しい）」という表現は、それぞれ「

（マッ）」と「

（イッソ）」の２つのトークンに分けられる。

例えば、図３の（ａ）に示すように、特定のサンプルデータセット３１０に「商品名」カテゴリーに該当するデータ（「コーヒースター・ステンレスＴＯＧＯカップタンブラー３３５ｍｌ」）３３１ａが含まれる場合、ターゲット情報である校正文句は、「商品名」カテゴリーに含まれるデータの内容に関連するキーワードを含むデータ（「コーヒースター・タンブラー」）３３１ｃで構成される。

このように、サンプルデータセットには、サンプルデータ及びサンプルデータに対応する校正文句（又は校正データ）が一対として含まれるようにしてもよい。

ステップＳ４１０で選択された複数のサンプルデータセットのそれぞれには、少なくとも１つのカテゴリーにそれぞれ対応するサンプルデータが含まれるようにしてもよい。すなわち、サンプルデータセットには、１つ又はそれ以上のカテゴリーにそれぞれ対応するサンプルデータが含まれるようにしてもよい。

よって、それぞれのサンプルデータセットには、図６ａ～図６ｃに示すように、第１カテゴリー（商品名）６１１、第２カテゴリー（日付）６１２、第３カテゴリー（商品種類）６３３、第４カテゴリー（ブランド）６３４、第５カテゴリー（タグ）６５５、などのように、様々なカテゴリーの少なくとも１つに該当するサンプルデータが含まれるようにしてもよい。

例えば、図３の（ａ）に示すように、サンプルデータセット３１０には、「商品名」カテゴリーに該当するサンプルデータ３１１ａ、及び「日付」カテゴリーに該当するサンプルデータ３１１ｃが含まれる。

なお、本発明において、ターゲット情報を生成するためにプロンプトに含まれるサンプルデータセットは、複数であってもよい。すなわち、ステップＳ４１０においては、複数のサンプルデータセットが選択されてもよい。本発明で選択されるサンプルデータの数は特に限定されない。

一方、複数のサンプルデータセットのそれぞれに含まれるデータの内容は、ターゲット情報を生成するアイテムとの関連性がある内容であってもよい。例えば、アイテムが商品に関するものである場合、選択された複数のサンプルデータセットのそれぞれに含まれるデータの内容は、商品に関する内容であってもよい。

また、ステップＳ４１０で選択された複数のサンプルデータセットのそれぞれに含まれるデータのカテゴリーは、互いに同じであってもよい。ステップＳ４１０においては、同じプロンプト内には同じカテゴリーを有するデータで構成された複数のサンプルデータセットが選択されるようにしてもよい。

一例として、図６ａに示すように、ステップＳ４１０で選択された複数のサンプルデータセット６２１、６２２、６２３のそれぞれには、商品名カテゴリー６１１、日付カテゴリー６１２、校正文句カテゴリー６１３に該当するデータが存在するようにしてもよい。

他の例として、図６ｂに示すように、ステップＳ４１０で選択された複数のサンプルデータセット６４１、６４２、６４３のそれぞれには、商品名カテゴリー６３１、日付カテゴリー６３２、商品種類カテゴリー６３３、ブランドカテゴリー６３４、校正文句カテゴリー６３５に該当するデータが存在するようにしてもよい。

さらに他の例として、図６ｃに示すように、ステップＳ４１０で選択された複数のサンプルデータセット６６１、６６２、６６３のそれぞれには、商品名カテゴリー６５１、日付カテゴリー６５２、商品種類カテゴリー６５３、ブランドカテゴリー６５４、タグカテゴリー６５５、校正文句カテゴリー６５６に該当するデータが存在するようにしてもよい。

一方、上記例の他に、選択された複数のサンプルデータセットのそれぞれには、様々なカテゴリーにそれぞれ対応するデータが含まれるようにしてもよい。

前述したように、ステップＳ４１０で選択された複数のサンプルデータセットのそれぞれは、互いに同じカテゴリーに該当するデータで構成されるが、図６ａ、図６ｂ、及び図６ｃにおいて説明したように、複数のサンプルデータセットのそれぞれを構成するカテゴリーの数及び種類は特に限定されない。

本発明において、ターゲット情報は、複数のサンプルデータセットを参照して生成されるので、複数のサンプルデータセットのそれぞれを構成するデータの内容によって、異なる内容を有するようになる。すなわち、大言語モデル１０は、プロンプトに入力された複数のサンプルデータセットの内容に基づいて、ターゲット情報を生成するので、複数のサンプルデータセットを構成するデータの内容が異なると、異なるターゲット情報を生成するようになる。よって、図６ａ、図６ｂ、及び図６ｃにおいて説明したように、サンプルデータを構成するカテゴリーの種類が異なると、異なるターゲット情報が生成される。すなわち、サンプルデータを構成するカテゴリーの種類によって、大言語モデル１０の出力として生成されるターゲット情報が異なる。

一例として、複数のサンプルデータセットのそれぞれに、商品名に該当するカテゴリー及びレビューに該当するカテゴリーにそれぞれ対応するデータが含まれる場合、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのレビューに関連するキーワードを含んでもよい。すなわち、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのレビューに関連するキーワードを含む確率が高くなる。

ここで、アイテムのレビューに関連するキーワードは、サンプルデータセットを参照して生成されたものであってもよい。

他の例として、複数のサンプルデータセットのそれぞれに、商品名に該当するカテゴリー及びブランドに該当する追加カテゴリーにそれぞれ対応するデータが含まれる場合、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのブランドに関連するキーワードを含んでもよい。すなわち、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのブランドに関連するキーワードを含む確率が高くなる。

一方、ステップＳ４１０において、サンプルデータセットの選択は、制御部１３０の制御下で行われるようにしてもよく、ユーザ又は管理者の選択に基づいて行われるようにしてもよい。

例えば、ユーザ又は管理者は、サンプルデータセットに含まれるカテゴリーを選択することができる。図７に示すように、サンプルデータセットのタイプ（以下、「サンプルデータタイプ」という）は、それぞれのサンプルデータセットに含まれるカテゴリーの種類によって複数のサンプルデータタイプに分けられる。

例えば、サンプルデータタイプＡは、図６ａに示すカテゴリーである「商品名」、「日付」、「校正文句」のカテゴリー種類で構成され、サンプルデータタイプＢは、図６ｂに示すカテゴリーである「商品名」、「日付」、「商品種類」、「ブランド」、「校正文句」のカテゴリー種類で構成される。

制御部１３０は、ユーザ又は管理者により複数のサンプルデータタイプのいずれかが選択されると、図８に示すように、選択されたサンプルデータタイプに該当する異なる複数のサンプルデータセットをユーザ又は管理者に提供することができる。

保存部１２０には、サンプルデータタイプ別に、それぞれマッチした異なる様々なサンプルデータセットが保存されるようにしてもよい。制御部１３０は、制御部の制御下で、ユーザ又は管理者の選択に基づいて、保存部１２０に保存されたサンプルデータセットのうち、ターゲット情報の生成のために用いられる複数のサンプルデータセットを特定することができる。

なお、本発明においては、図８に示すように、ターゲット情報の生成のために選択できる様々なサンプルデータセットのそれぞれに関する様々な情報を管理することができる。

例えば、制御部１３０は、サンプルデータセット別に、様々な指標に関する情報を保存することができる。ここで、指標は、サンプルデータセットが、ターゲット情報の生成のために大言語モデル１０のプロンプトとして入力され、ターゲット情報の生成に用いられた場合、当該ターゲット情報を用いて達成する目標に関する指標であってもよい。例えば、アイテムが商品に関するものであり、ターゲット情報をショッピングサービスに活用する場合、ターゲット情報の目標は、消費者に当該商品に関心を持たせることであり、それはアイテムのクリック率や転換率などで評価される。

制御部１３０は、ターゲット情報がサービス分野に活用される場合、ターゲット情報のモニタリングを行うことにより、ターゲット情報が目標を達成したかに関する評価を行うことができる。また、その評価の結果に関する指標を、ターゲット情報の生成時にプロンプトとして入力されたサンプルデータセットの指標として保存することができる。

例えば、図８に示すように、保存部１２０は、それぞれのサンプルデータセット毎にクリック率指標がマッチングされて存在するようにしてもよい。よって、ユーザ又は管理者は、その指標に基づいて、サンプルデータセットを選択することができる。

また、制御部１３０は、ユーザ又は管理者の選択がなくても、サンプルデータセットにそれぞれマッチされた指標に基づいて、ターゲット情報の生成に活用される複数のサンプルデータセットを選択又は推薦することができる。

図８に示すように、制御部１３０は、クリック率の高いサンプルデータセットを優先的にターゲット情報の生成に活用されるサンプルデータとして選択することができる。

一方、前述したように、ターゲット情報は、複数のサンプルデータセットのそれぞれを構成するデータの内容によって、異なる内容を有するようになる。すなわち、大言語モデル１０は、プロンプトに入力された複数のサンプルデータセットの内容に基づいて、ターゲット情報を生成するので、選択された複数のサンプルデータセットの内容が異なると、異なるターゲット情報を生成するようになる。よって、本発明においては、様々な基準でサンプルデータセットを選択又は推薦することができる。

以下、図６ａに示す複数のサンプルデータセット６２１、６２２、６２３が選択された場合を例に説明する。

図６ａに示すように、複数のサンプルデータセット６２１、６２２、６２３が選択されると（Ｓ４１０）、本発明においては、複数のサンプルデータセット及びアイテムに関連する関連情報を含めてプロンプトを構成する過程が行われる（Ｓ４２０）。

より具体的には、図５に示すように、プロンプトの構成のために、サンプルデータ及び校正データが一対としてそれぞれ含まれる異なる複数のサンプルデータセットの入力を受ける過程が行われる（Ｓ５１０）。

図６ａに示すように、ステップＳ４１０で選択された複数のサンプルデータセット６２１、６２２、６２３は、プロンプト６２０に入力される。

次に、本発明においては、アイテムに関連する関連情報の入力を受ける過程が行われる（Ｓ５２０）。

このような関連情報の入力を受ける過程は、関連情報を含むターゲットデータセットがプロンプトに入力される過程であるといえる。関連情報は、ユーザの電子機器から入力されるようにしてもよい。

図６ａに示すように、ターゲットデータセット６２４には、ターゲット情報の生成の対象となるアイテムに関するデータが含まれてもよい。

ターゲットデータセット６２４には、ターゲット情報の生成に用いられる少なくとも１つのカテゴリーにそれぞれ対応するデータ６２４ａ、６２４ｂが含まれてもよい。また、ターゲットデータセット６２４には、ターゲット情報に該当するデータフィールド６２４ｃがさらに含まれてもよい。

本発明によるターゲット情報生成システム１００と大言語モデル１０は、事前に定義された規則に従って、ターゲット情報に該当するデータフィールド（例えば、「校正文句：」）がプロンプト６２０に含まれる場合、ターゲット情報を生成させる命令として認識する。

また、大言語モデル１０は、ターゲットデータセット６２４に含まれるデータ６２４ａ、６２４ｂの少なくとも一部を用いて、ターゲット情報を生成することができる。

一方、ターゲットデータセットに含まれるデータのカテゴリーは、ステップＳ４１０で選択されたサンプルデータセットに含まれるデータのカテゴリーと同じであってもよい（又は、対応するようにしてもよい）。また、ターゲットデータセット及びサンプルデータセットに含まれるデータのカテゴリーは、少なくとも１つが異なってもよいことは言うまでもない。さらに、ターゲットデータセット及びサンプルデータセットに含まれるデータのカテゴリーは、全て異なってもよい。

ターゲットデータセット及びサンプルデータセットに含まれるデータのカテゴリーが同じ（対応する）場合を例に説明する。

一例として、図６ａに示すように、サンプルデータセット６２１、６２２、６２３に、「商品名」、「日付」カテゴリーにそれぞれ該当するデータが含まれる場合、ターゲットデータセット６２４にも、「商品名」、「日付」カテゴリーに該当するデータ６２４ｂが含まれる。

他の例として、図６ｂに示すように、サンプルデータセット６４１、６４２、６４３に、「商品名」、「日付」、「商品種類」、「ブランド」カテゴリーにそれぞれ該当するデータが含まれる場合、ターゲットデータセット６４４にも、「商品名」、「日付」、「商品種類」、「ブランド」カテゴリーに該当するデータ６４４ｂが含まれる。

さらに他の例として、図６ｃに示すように、サンプルデータセット６６１、６６２、６６３に、「商品名」、「日付」、「商品種類」、「ブランド」、「タグ」カテゴリーにそれぞれ該当するデータが含まれる場合、ターゲットデータセット６６４にも、「商品名」、「日付」、「商品種類」、「ブランド」、「タグ」カテゴリーに該当するデータ６６４ｂが含まれる。

ステップＳ５１０及びステップＳ５２０において複数のサンプルデータセット及び関連情報が入力されると、ターゲット情報を生成する過程が行われる。

より具体的には、複数のサンプルデータセット及び関連情報が入力されると、複数のサンプルデータセット及び関連情報を用いて、前記関連情報に関連する少なくとも１つのキーワードを含むターゲット情報を生成する過程が行われる（Ｓ５３０）。

ステップＳ５３０は、図４に示すステップＳ４３０に対応するものであり、制御部１３０は、ターゲット情報の生成のために、構成されたプロンプトを大言語モデル１０の入力として処理することができる。

本発明において、ターゲット情報は、大言語モデル１０の出力として生成されるようにしてもよい。

大言語モデル１０の出力として生成されたターゲット情報は、前述したように、ユーザの電子機器に送信されるようにしてもよい。よって、ユーザの電子機器のディスプレイ部にターゲット情報を出力（表示）することができる。

制御部１３０は、大言語モデル１０と連動して、又は、大言語モデル１０に対する制御を行うことにより、ターゲット情報を出力させることができる。

図９ａ、図９ｂ、及び図９ｃに示すように、プロンプト８１０、８２０、８３０により、ターゲット情報８１１ｂ、８２１ｂ、８３１ｂを出力することができる。大言語モデル１０の出力は、同図に示すように、プロンプト８１０、８２０、８３０により取得することができる。

なお、本発明において、ターゲット情報には、関連情報に関連する少なくとも１つのキーワードが含まれ、キーワードは、関連情報に含まれる。ここで、キーワードとは、複数の単語の少なくとも一部と同一又は類似の意味を有する単語をいう。

大言語モデル１０においては、ターゲットデータセットに含まれる関連情報に基づいて、ターゲット情報が生成されるので、関連情報と同一又は類似の内容がターゲット情報に含まれるようにターゲット情報を生成することができる。このようなターゲット情報は、関連情報が校正もしくは修正されたものであると概念的に理解できる。

例えば、図６ａに示すように、関連情報６２４ａとして「フリルズ・アクアイージークリーンファブリック生地ファミリベッド」がプロンプトに入力されると、図９ａに示すように、ターゲット情報８１１ｂとして「ファミリベッド用ファブリックシーツ」が生成される。ターゲット情報８１１ｂは、「ファミリ」、「ベッド」、「ファブリック」のように、関連情報６２４ａの少なくとも一部と同一又は類似の内容を含むようにしてもよい。

このように、制御部１３０は、複数のサンプルデータセット及びターゲットデータセットに基づいて、ターゲット情報が生成されるように、大言語モデル１０に対する適切な制御を行うことができる。

一方、制御部１３０は、複数のサンプルデータセット及びターゲットデータセットに基づいて生成されるターゲット情報に、特定のテーマに関連するキーワード（以下、「サブキーワード」という）が含まれるようにすることができる。

例えば、制御部１３０は、図１０に示すように、ターゲット情報１０２４ａに「季節」関連テーマが含まれるようにしてもよく、図１１に示すように、ターゲット情報１１２４ａに「割引」関連テーマが含まれるようにしてもよい。

そのために、制御部１３０は、特定のテーマに関連するターゲット情報を生成するために、前記特定のテーマに該当するキーワードが含まれるサンプルデータセットを選択（又は、生成）することができる。

一例として、図１０に示すように、「季節」をテーマとしてターゲット情報を生成する場合、サンプルデータセット１０２１、１０２２、１０２３の各サンプルデータに関するターゲット情報（「校正文句」カテゴリー）には、「夏」、「サマー」、「春」のように、「季節」をテーマとするキーワードが多数含まれる。

他の例として、図１１に示すように、「割引」をテーマとしてターゲット情報を生成する場合、サンプルデータセット１１２１、１１２２、１１２３の各サンプルデータに関するターゲット情報（「校正文句」カテゴリー）には、「セール」、「割引」のように、「割引」をテーマとするキーワードが多数含まれる。このような特定のテーマは、様々な方法で特定することができ、例えば、アイテムが属するサービス分野における様々な統計資料、最近の社会イシュー、最近のニュース、ユーザの選択、など様々な方法で特定することができる。

ユーザの選択に基づいて特定のテーマを特定する方法について説明すると、次の通りである。本発明においては、ターゲット情報に含めるサブキーワードに関連するテーマの選択を受ける過程が行われるようにしてもよい。テーマの選択を受ける時点は、ステップＳ４１０～ステップＳ４３０の少なくとも１つの過程から選択されてもよく、本発明においては、それについては特に限定しない。

また、テーマの選択は、ターゲット情報が生成された後に行われることも可能である。この場合、制御部１３０は、生成されたターゲット情報に、選択されたテーマに該当するサブキーワードが含まれるか否かを判断し、判断の結果、サブキーワードが含まれない場合、ターゲット情報の再生成を行うようにしてもよい。

一方、選択されたテーマに基づいてターゲット情報が生成された場合、本発明においては、ターゲット情報に選択されたテーマに関連するサブキーワードが含まれる確率が高くなる。

一例として、図１０に示すように、「季節」関連テーマが選択された場合、ターゲット情報１０２４ａには、季節（例えば、「夏」）に関連するサブキーワード（例えば、「夏」、「アクア」）が含まれる。

他の例として、図１１に示すように、「割引」関連テーマが選択された場合、ターゲット情報１１２４ａには、割引に関連するサブキーワード（例えば、「割引」）が含まれる。

一方、テーマの選択が、ステップＳ４１０又はステップＳ４２０のように、サンプルデータセットを選択する過程又はサンプルデータセットをプロンプトに入力する過程で行われた場合、制御部１３０は、プロンプトに入力されるサンプルデータセットのそれぞれに、選択されたテーマに関連する単語が含まれるようにしてもよい。

この場合、制御部１３０は、サンプルデータセットのそれぞれに、選択されたテーマに関連する内容を含むデータ及び選択されたテーマに関連する内容を含むデータと一対をなす校正文句に該当するデータに、選択されたテーマに関連する単語が含まれるように、サンプルデータセットを選択又は入力するようにしてもよい。

一方、大言語モデル１０は、サンプルデータセットに含まれるデータとそれに対応する校正文句間のパターン（又は、規則）に基づいて、ターゲット情報を生成するが、そのパターン（又は、規則）は整形化されないこともあるので、本発明においては、それについて特に限定しない。

次に、前述したようにターゲット情報が生成されると、本発明においては、ターゲット情報の検証を行う過程が行われる（Ｓ４４０）。

制御部１３０は、大言語モデル１０によりターゲット情報が生成されることに基づいて、ターゲット情報が予め設定された検証基準を満たすか否かを判断することができる。

ここで、予め設定された検証基準は、様々に設定することができる。例えば、予め設定された検証基準は、ターゲット情報に含まれるテキストの長さ及びターゲット情報に予め設定された禁止語が含まれるか否かの少なくとも一方に関するものであってもよい。

一例として、モバイル画面や所定長さの画面に表示するテキストを生成するために、予め設定された検証基準として、ターゲット情報を構成するテキストは、予め設定された数の字（例えば、２０字）を超えるか否かを判断するように設定してもよい。

制御部１３０は、ターゲット情報が生成されると、生成されたターゲット情報が予め設定された数の字を超えるか否かを判断する。

判断の結果、生成されたターゲット情報が予め設定された字の数を超える場合、制御部１３０は、生成されたターゲット情報が予め設定された検証基準を満たしていないと判断する。予め設定された時の数が２０字であり、ターゲット情報に含まれるテキストが２２字である場合、制御部１３０は、ターゲット情報が予め設定された検証基準を満たしていないと判断する。

他の例として、予め設定された検証基準として、ターゲット情報を構成するテキストに予め設定された禁止語が含まれるか否かを判断するように設定してもよい。判断の結果、生成されたターゲット情報に予め設定された禁止語が含まれる場合、制御部１３０は、生成されたターゲット情報が予め設定された検証基準を満たしていないと判断する。予め設定された禁止語の設定は、制御部１３０の制御下で、ユーザ又は管理者の要求により行われるようにしてもよい。予め設定された禁止語には、アイテムが属する取引業界の公正取引を害する用語、俗語などがある。

このように、判断の結果、ターゲット情報が予め設定された検証基準を満たしていない場合、制御部１３０は、アイテムに関するターゲット情報を再生成する過程を行うことができる。

すなわち、制御部１３０は、既に生成されたターゲット情報とは異なるターゲット情報が生成されるように、大言語モデル１０に対する適切な制御を行うことができる。制御部１３０は、大言語モデル１０に対して、ターゲット情報の再生成を要求する信号を送信することができる。

一方、制御部１３０は、既に生成されたターゲット情報とは異なるターゲット情報が生成されるように、大言語モデル１０の少なくとも１つのインファレンスパラメータ（inference parameter）を調整することができる。

インファレンスパラメータは、大言語モデル１０の出力値を変更する因子であり、大言語モデル１０で処理されるトークンに関連する確率値を調整する因子である。

大言語モデル１０は、確率に基づいてターゲット情報を生成するモデルからなり、大言語モデル１０におけるインファレンスパラメータの調整は、ターゲット情報として選択されるトークンに対する確率の調整を意味する。よって、インファレンスパラメータの調整により、ターゲット情報を再生成する際に、既に生成されたターゲット情報に含まれるトークンとは異なるトークンが含まれる確率が高くなる。

大言語モデル１０に関連するインファレンスパラメータは様々である。一例として、第１インファレンスパラメータ（例えば、ＴｏｐＰサンプリング）は、トークンの累積確率値に関するものであってもよい。大言語モデル１０においては、第１インファレンスパラメータとして、予め設定された確率値に基づいて、予め設定された確率値に該当するトークンに対してのみ、ターゲット情報として含まれ得るトークンの候補として選択することができる。例えば、第１インファレンスパラメータの値が０．８に予め設定された場合、大言語モデル１０は、上位８０％に含まれるトークンに対してのみ、ターゲット情報として含まれ得るトークンの候補として選択することができる。

よって、制御部１３０は、第１インファレンスパラメータを調整することにより、ターゲット情報として含まれ得るトークンの範囲を変更することができ、その結果、ターゲット情報を再生成する際に、既に生成されたターゲット情報とは異なるターゲット情報が生成されるように誘導することができる。

他の例として、第１インファレンスパラメータとは異なる第２インファレンスパラメータ（例えば、Ｔｅｍｐｅｒａｔｕｒｅ）は、確率分布に加重値の変化を与えてターゲット情報として生成される文章の多様性を調整する値に関するものであってもよい。例えば、第２インファレンスパラメータの値が低く設定されると、ターゲット情報として含まれ得るトークン（「候補トークン」ともいう）の順位は変更されないが、ターゲット情報として含まれる確率が高いトークンは確率値がさらに高くなり、ターゲット情報として含まれる確率が低いトークンは確率値がさらに低なる。第２インファレンスパラメータの値が高くなるほど、ターゲット情報として含まれる可能性が最も高い順位のトークンが選択される確率が高くなる。

制御部１３０は、前述した第１インファレンスパラメータ及び第２インファレンスパラメータの少なくとも一方、又は大言語モデル１０に関連する様々なインファレンスパラメータを変更することにより、ターゲット情報として含まれ得るトークンに関連する確率を調整することができる。よって、本発明においては、ターゲット情報を再生成する際に、既に生成されたターゲット情報と同じターゲット情報が生成されることを避けることができる。

一方、制御部１３０は、ターゲット情報が再生成されると、再生成されたターゲット情報に対して、上記ステップＳ４４０を同様に行うことができる。すなわち、制御部１３０は、再生成されたターゲット情報が予め設定された検証条件を満たすか否かを判断し、再生成されたターゲット情報が予め設定された検証条件を満たしていない場合、ターゲット情報の再生成を再び行うことができる。

このとき、制御部１３０は、ターゲット情報の再生成を予め設定された回数だけ行い、ターゲット情報の再生成を予め設定された回数だけ行ったにもかかわらず、再生成されたターゲット情報が予め設定された検証条件を満たしていない場合、ステップＳ４１０で選択された複数のサンプルデータセットに基づくターゲット情報の再生成を行わないようにしてもよい。

例えば、予め設定された回数を３回とすると、制御部１３０は、ターゲット情報の再生成回数が３回になるまで、大言語モデル１０のインファレンスパラメータを調整してターゲット情報の再生成を行う。この場合、再生成回数が３回になる前でも、再生成されたターゲット情報が予め設定された検証条件を満たすと、ターゲット情報の再生成はそれ以上行わないようにしてもよい。

また、制御部１３０は、ターゲット情報の再生成を予め設定された回数だけ行ったにもかかわらず、再生成されたターゲット情報が予め設定された検証条件を満たしていない場合、ステップＳ４１０で選択された複数のサンプルデータの少なくとも１つを変更し、ターゲット情報の生成過程を再び行うようにしてもよい。

さらに、制御部１３０は、前記関連性の程度が予め設定された基準を満たしている場合、前記ターゲット情報を前記アイテムに関するターゲット情報として用いるようにしてもよい。さらに、制御部１３０は、前記関連性の程度が前記予め設定された基準を満たしていない場合、前記ターゲット情報を再生成するようにしてもよい。

制御部１３０は、様々なサービス分野にターゲット情報を用いる（又は、活用する）ことができ、例えばショッピングサービス分野にターゲット情報を活用する場合、ターゲット情報を、ショッピングサービスのウェブページ又はアプリケーションのページに露出するように処理することができる。

一方、ターゲット情報とアイテムとの関連性の程度が予め設定された基準を満たすか否かは、アイテムの関連情報とターゲット情報間のベクトルベースの類似度の程度に基づいて判断することができる。ここで、ベクトルベースの類似度を判断する方法は非常に様々であり、本発明においては、それについて特に限定しない。ここで、類似度の程度は、ターゲット情報がアイテムに関連する関連情報の内容を反映する程度に関するものであってもよい。

一方、制御部１３０は、類似度の程度が予め設定された基準を満たしていない場合、前述した方式でターゲット情報の再生成を行うようにしてもよい。また、制御部１３０は、類似度の程度が予め設定された基準を満たしている場合、ターゲット情報を最終的にアイテムに関するターゲット情報として選択するようにしてもよい。

さらに、ターゲット情報とアイテムとの関連性の程度が予め設定された基準を満たすか否かは、アイテムに関連するイメージとターゲット情報との類似度の程度に基づいて判断することができる。アイテムに関連するイメージは、アイテムに関連して保存部１２０又は少なくとも１つの外部サーバに保存又は登録されたイメージであってもよい。例えば、アイテムがショッピングアイテム（例えば、「靴」）である場合、制御部１３０は、アイテムに関連するイメージ（例えば、ショッピングアイテムに関連する「靴の写真」）とターゲット情報との類似度を判断し、アイテムに関連するイメージとターゲット情報との類似度の程度を判断するようにしてもよい。また、制御部１３０は、類似度の程度が予め設定された基準を満たしている場合、ターゲット情報を最終的にアイテムに関するターゲット情報として選択するようにしてもよい。ここで、類似度の程度は、ターゲット情報がアイテムに関連するイメージに該当する内容を反映する程度に関するものであってもよい。

一方、制御部１３０は、上記ステップＳ４１０及びステップＳ４４０を複数回行うことにより、異なるターゲット情報をそれぞれ生成することができる。

このとき、本発明においては、予め設定された検証条件を満たすターゲット情報から特定のターゲット情報を選択する過程が行われる（Ｓ４５０、図４参照）ようにしてもよい。すなわち、制御部１３０は、検証をパスしたターゲット情報から特定のターゲット情報を最終的に選択するようにしてもよい。

制御部１３０は、選択されるサンプルデータセットを変化させ、異なるターゲット情報を生成することができる。例えば、図６ａ、図６ｂ、及び図６ｃに示すように、制御部１３０は、異なるサンプルデータセットが含まれるプロンプト６２０、６４０、６６０を用いて、図９ａ、図９ｂ、及び図９ｃに示すように、異なるターゲット情報８１１ｂ、８２１ｂ、８３１ｂをそれぞれ生成する。このとき、異なるターゲット情報の生成のために選択される異なるサンプルデータセットは、図６ａ、図６ｂ、及び図６ｃに示すように、少なくとも１つのカテゴリーに該当するデータ（例えば、商品名カテゴリーに該当するデータ）は同じであってもよい。

これとは異なり、異なるターゲット情報の生成のために選択される異なるサンプルデータセットは、サンプルデータセットを構成するデータの内容が全て異なるものであってもよい。

このように、ステップＳ４１０及びステップＳ４４０を複数回行い、異なる複数のターゲット情報（例えば、図９の８１１ｂ、８２１ｂ、８３１ｂ）が存在する場合、制御部１３０は、複数のターゲット情報のいずれかを最終的に選択することができる。最終的に選択されたターゲット情報は、前述したターゲット情報が活用されるサービス分野に活用することができる。例えば、ターゲット情報がショッピングサービス分野に活用される場合、最終的に選択されたターゲット情報は、ウェブページ又はアプリケーションのページに露出するように処理することができる。

一方、ターゲット情報の最終選択のために、制御部１３０は、複数のターゲット情報のそれぞれが、前述した予め設定された検証基準を満たす場合、複数のターゲット情報のそれぞれとアイテムとの関連性の程度を判断する過程を行うようにしてもよい。

例えば、制御部１３０は、前記予め設定された検証基準を満たすターゲット情報が複数存在する場合、複数のターゲット情報のそれぞれとアイテムに関連する関連情報との類似度を判断するようにしてもよい。

また、制御部１３０は、前記複数のターゲット情報のうち、前記関連情報との類似度が最も高いいずれかのターゲット情報を、アイテムに関する最終のターゲット情報として決定するようにしてもよい。ここで、ターゲット情報と関連情報との類似度の判断については前述したので省略する。

さらに、制御部１３０は、前記関連性の程度の判断において、前記複数のターゲット情報のそれぞれとアイテムに関連するイメージとの類似度の程度を判断し、類似度が最も高い特定のターゲット情報をアイテムに関する最終のターゲット情報として決定するようにしてもよい。

前述したように、本発明によるターゲット情報生成方法及びシステムは、サンプルデータセット及びアイテムに関連する関連情報が含まれるプロンプトを入力とする言語モデルを用いて、アイテムに関するターゲット情報を生成することができる。本発明によるターゲット情報生成方法及びシステムにおいては、サンプルデータ及び前記サンプルデータに対応する校正データが一対として含まれるようにサンプルデータセットを構成することにより、言語モデルがプロンプトに基づいて校正データに対応する品質のターゲット情報を生成するように誘導することができる。

よって、本発明によるターゲット情報生成方法及びシステムにより、アイテムに関連する関連情報に基づいて、校正データに対応する品質のターゲット情報を生成することができる。その結果、ユーザは、関連情報をターゲット情報で校正もしくは修正するための作業を減らすことができ、業務効率を最大化することができる。

一方、前述した本発明は、コンピュータで１つ以上のプロセスにより実行され、コンピュータ可読媒体（又は、記録媒体）に格納可能なプログラムとして実現することができる。

また、前述した本発明は、プログラム記録媒体にコンピュータ可読コード又はコマンドとして実現することができる。すなわち、本発明は、プログラムの形態で提供することができる。

一方、コンピュータ可読媒体は、コンピュータシステムにより読み取り可能なデータが記録されるあらゆる種類の記録装置を含む。コンピュータ可読媒体の例としては、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Disk）、ＳＤＤ（Silicon Disk Drive）、ＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピー（登録商標）ディスク、光データ記憶装置、などが挙げられる。

また、コンピュータ可読媒体は、ストレージを含み、電子機器が通信によりアクセスできるサーバ又はクラウドストレージであり得る。この場合、コンピュータは、有線又は無線通信により、サーバ又はクラウドストレージから本発明によるプログラムをダウンロードすることができる。

さらに、本発明において、前述したコンピュータは、プロセッサ、すなわち中央処理装置（Central Processing Unit, CPU）が搭載された電子機器であり、その種類は特に限定されない。

一方、本発明の詳細な説明は例示的なものであり、あらゆる面で制限的に解釈されてはならない。本発明の範囲は添付の特許請求の範囲の合理的解釈により定められるべきであり、本発明の等価的範囲内でのあらゆる変更が本発明の範囲に含まれる。

１００ターゲット情報生成システム
１１０入力部
１２０保存部
１３０制御部

Claims

アイテムに関するターゲット情報を生成する方法であって、
サンプルデータ及び前記サンプルデータに対応するターゲットデータが含まれる異なる複数のサンプルデータセットを選択するステップと、
前記アイテムに関連する関連情報の入力を受けるステップと、
前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも１つのキーワードを含む、前記アイテムに関するターゲット情報を生成するステップと、を含む、
ことを特徴とする、方法。
前記方法は、さらに、
前記異なる複数のサンプルデータセット及び前記関連情報を含むプロンプトを構成するステップと、
前記プロンプトを予め特定された大言語モデルの入力として処理するステップと、を含み、
前記ターゲット情報は、
前記大言語モデルの出力として生成される、
ことを特徴とする、請求項１に記載の方法。
前記アイテムが商品に該当する場合、
前記サンプルデータセットに含まれるデータに対応する少なくとも１つのカテゴリーは、商品名、商品種類、ブランド、日付、レビュー、タグ、カラー、サイズ、及び、原産地、のうち少なくとも１つに該当する、
ことを特徴とする、請求項２に記載の方法。
前記異なる複数のサンプルデータセットのそれぞれに、前記商品名に該当するカテゴリー及び前記レビューに該当するカテゴリーにそれぞれ対応するデータが含まれる場合、
前記ターゲット情報は、前記関連情報に関連するキーワード及び前記アイテムのレビューに関連するキーワードを含み、
前記異なる複数のサンプルデータセットのそれぞれに、前記商品名に該当するカテゴリー及び前記ブランドに該当するカテゴリーにそれぞれ対応するデータが含まれる場合、
前記ターゲット情報は、前記関連情報に関連するキーワード及び前記アイテムのブランドに関連するキーワードを含む、
ことを特徴とする、請求項３に記載の方法。
前記方法は、さらに、
前記大言語モデルにより前記ターゲット情報が生成されることに基づいて、前記ターゲット情報が予め設定された検証基準を満たすか否かを判断するステップ、を含み、
前記予め設定された検証基準は、
前記ターゲット情報に含まれるテキストの長さ、前記ターゲット情報に予め設定された禁止語が含まれるか否か、及び、前記ターゲット情報と前記アイテムとの関連性の程度、のうち少なくとも１つに関するものである、
ことを特徴とする、請求項２～４のいずれか一項に記載の方法。
前記判断の結果、前記ターゲット情報が前記予め設定された検証基準を満たしていない場合、
前記アイテムに関するターゲット情報を再生成するステップ、をさらに含む、
ことを特徴とする、請求項５に記載の方法。
前記ターゲット情報を再生成するステップにおいては、
既に生成されたターゲット情報とは異なるターゲット情報が生成されるように、前記大言語モデルの少なくとも１つのインファレンスパラメータを調整する、
ことを特徴とする、請求項６に記載の方法。
前記予め設定された検証基準を満たすターゲット情報が複数存在する場合、
前記複数のターゲット情報のそれぞれと前記アイテムとの類似度を判断し、
前記複数のターゲット情報のうち、前記アイテムとの類似度が最も高いいずれかのターゲット情報を、前記アイテムに関する最終のターゲット情報として決定する、
ことを特徴とする請求項５に記載の方法。
前記類似度の判断は、
前記ターゲット情報と前記関連情報との類似度、及び、前記アイテムに関連して既に登録されたイメージと前記ターゲット情報との類似度の程度、のうち少なくとも一方に基づいて行う、
ことを特徴とする、請求項８に記載の方法。
前記方法は、さらに、
前記ターゲット情報に含めるサブキーワードに関連するテーマの選択を受けるステップ、を含み、
前記ターゲット情報に前記テーマが選択されることに基づいて、前記ターゲット情報に前記テーマに関連するサブキーワードが含まれる確率が高くなる、
ことを特徴とする請求項１～９のいずれか一項に記載の方法。
前記テーマが選択されることに基づいて、前記異なる複数のサンプルデータセットのそれぞれは、前記テーマに関連する単語が含まれるように構成される、
ことを特徴とする、請求項１０に記載の方法。
アイテムに関するターゲット情報を生成するシステムであって、
前記システムは、サンプルデータ及び前記サンプルデータに対応するターゲットデータが含まれる異なる複数のサンプルデータセットを保存する保存部と、
前記アイテムに関連する関連情報及び前記複数のサンプルデータセットを用いて、前記関連情報に関連する少なくとも１つのキーワードを含む、前記アイテムに関するターゲット情報を生成するプロセスを実行する制御部と、
を含む、ことを特徴とするシステム。
サンプルデータ及び前記サンプルデータに対応するターゲットデータが含まれる異なる複数のサンプルデータセットの選択を受けるステップと、
アイテムに関連する関連情報の入力を受けるステップと、
前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも１つのキーワードを含む、前記アイテムに関するターゲット情報を生成するステップと、
を実行する、プログラム。
アイテムに関するターゲット情報を生成するシステムであって、
前記システムは、
複数のサンプルデータセットを保存する保存部と、
ユーザの電子機器と通信する通信部と、
前記通信部を介して、前記ユーザの電子機器から少なくとも１つのカテゴリーにそれぞれ対応する関連情報の入力を受け、前記関連情報及び前記複数のサンプルデータセットを用いて、前記関連情報に関連する前記ターゲット情報が生成されるように大言語モデルと連動する制御部と、を含み、
前記制御部は、
前記ターゲット情報が前記ユーザの電子機器に出力されるように、前記通信部を介して、前記ターゲット情報を前記ユーザの電子機器に送信する、
ことを特徴とする、システム。
通信部を介して、ユーザの電子機器から、特定のアイテムに関連する少なくとも１つのカテゴリーにそれぞれ対応する関連情報を受信するステップと、
複数のサンプルデータセットを選択するステップと、
サンプルデータ及び前記サンプルデータに対応する校正データがそれぞれ含まれる、異なる複数のサンプルデータセットを選択するステップと、
前記異なる複数のサンプルデータセット及び前記関連情報を含むプロンプトを構成するステップと、
前記プロンプトを予め特定された大言語モデルの入力として処理し、前記予め特定された大言語モデルから前記特定のアイテムに関するターゲット情報を取得するステップと、
前記ターゲット情報が前記ユーザの電子機器に出力されるように、前記通信部を介して、前記ターゲット情報を前記ユーザの電子機器に送信するステップと、
を含むことを特徴とする、ターゲット情報生成方法。