JP2022082524A

JP2022082524A - 機械学習を通じての学習モデルを使った情報提供方法および装置

Info

Publication number: JP2022082524A
Application number: JP2021189434A
Authority: JP
Inventors: ジェ・ミン・ソン; Jae Min Song; クァン・ソプ・キム; Kwang Seob Kim; ホ・ジン・ファン; Ho Jin Hwang; ジョン・フィ・パク; Jong Hwi Park
Original assignee: Emro Co Ltd
Current assignee: Emro Co Ltd
Priority date: 2020-11-23
Filing date: 2021-11-22
Publication date: 2022-06-02
Anticipated expiration: 2041-11-22
Also published as: US12026764B2; JP7287699B2; KR102271810B1; US20220164850A1

Abstract

【課題】機械学習に基づいて生成された学習モデルを使って情報を提供する方法およびこれを利用した装置を提供する。【解決手段】機械学習を通じての学習モデルを使った情報提供方法は、学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認する段階；前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成する段階；情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認する段階；および前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名情報および属性情報を確認する段階；を含む機械学習を通じての学習モデルを使う情報提供方法を提供する。【選択図】図６

Description

本開示は機械学習に基づいて生成された学習モデルを使って情報を提供する方法およびこれを利用した装置に関する。

自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ、ＮＬＰ）は人間の言語現象をコンピュータのような機械を利用して模写できるように研究し、これを具現する人工知能の主要分野の一つである。最近機械学習およびディープラーニング技術が発展するにつれ、機械学習およびディープラーニング基盤の自然語処理を通じて、膨大なテキストから意味のある情報を抽出して活用するための言語処理研究開発が活発に進行している。

先行技術文献：韓国登録１０－１９３９１０６号公報

先行技術文献は学習システムを利用した在庫管理システムおよび在庫管理方法について開示している。このように企業は業務の効率および生産性を向上させるために、企業で算出される各種情報を標準化して統合および管理することが要求される。例えば、企業が購入するアイテムの場合、体系的な管理がなされないと購入の重複が発生し得、既存の購入内訳の検索が困難であり得る。先行技術文献の場合、予測モデルを生成し、これに基づいて在庫管理を遂行する技術的特徴を開示しているが、具体的な予測モデル生成方法や在庫管理に特化したアイテム分類方法については開示していない。

一般的に、企業でローテキスト（ｒａｗｔｅｘｔ）で構成された形態のアイテム情報を使う場合が多い。ローテキストの場合、別途の項目分類がなっておらず、作成者の性向により一括的な記載形式を有さずにランダムな構成を有する場合が多いため、ローテキストが意味するアイテムに関する情報を正確に識別するには多少困難が存在する。したがって、より高い正確性を有し、効果的にアイテムに関する情報を識別してそれに関する情報を提供するための方法が要求される。

本実施形態が解決しようとする課題は、アイテムに関する情報を示す文字列に基づいて学習モデルを生成し、生成された学習モデルを使ってアイテムに関する情報を示す文字列をより正確かつ効果的に確認する方法および装置を提供することにある。

本実施形態が解決しようとする課題は、アイテムに関する情報を示す文字列をより効果的に確認する学習モデルを生成する方法および装置を提供することにある。

本実施形態が達成しようとする技術的課題は上記のような技術的課題に限定されず、以下の実施形態からさらに他の技術的課題が類推され得る。

第１実施形態により、機械学習を通じての学習モデルを使った情報提供方法は、学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認する段階；前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成する段階；情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認する段階；および前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名および属性情報を確認する段階；を含むことができる。

第２実施形態により、機械学習を通じての学習モデルを使った情報提供装置は、少なくとも一つの命令語（ｉｎｓｔｒｕｃｔｉｏｎ）を含むメモリと、プロセッサを含み、前記プロセッサは前記少なくとも一つの命令語に基づいて、学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認し、前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成し、情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認し、前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名および属性情報を確認することができる。

第３実施形態により、コンピュータ読み取り可能な記録媒体は機械学習を通じての学習モデルを使った情報提供方法をコンピュータで実行させるためのプログラムを記録したコンピュータ読み取り可能な非一過性の記録媒体であって、前記情報提供方法は、学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認する段階；前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成する段階；情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認する段階；および前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名および属性情報を確認する段階；を含む非一過性の記録媒体を含むことができる。

その他の実施形態の具体的な事項は詳細な説明および図面に含まれている。

本開示に係る情報提供方法および装置は、アイテムに関する情報を示す文字列を利用して生成された学習モデルを利用して文字列を分析することによって、アイテムに対応する基準品名および属性情報がより正確かつ効果的に確認されるようにすることができる。

また、本開示に係る情報提供方法および装置は、学習モデルを利用して文字列を入力しさえすれば自動で文字列に対応するアイテムの情報が提供されるようにすることによって、アイテムに関する情報を示す文字列を迅速かつ効率的に分析することができる。

発明の効果は以上で言及した効果に制限されず、言及されていないさらに他の効果は特許請求の範囲の記載から当該技術分野の通常の技術者に明確に理解され得るであろう。

本明細書の実施形態に係るアイテム管理システムを説明するための図面である。本明細書の一実施形態に係るアイテムに関する情報を管理する方法を説明するための図面である。本明細書の一実施形態により学習モデルを生成する方法を説明するための図面である。本明細書の一実施形態により学習モデルを利用して文字列を確認する方法を説明するための図面である。本明細書の一実施形態に係る情報提供装置の機能ブロック図である。本明細書の一実施形態に係る情報提供方法の各段階の流れを示す図面である。本明細書の一実施形態に係る情報提供装置で少なくとも一つの学習モデルの生成のために利用される文字列セットを説明するための図面である。本明細書の一実施形態に係る情報提供装置で利用される学習モデルのパラメータを説明するための図面である。本明細書の一実施形態に係る情報提供装置によって基準品名情報が確認される場合を説明するための図面である。本明細書の一実施形態に係る情報提供装置によって属性情報が確認される場合を説明するための図面である。本明細書の一実施形態により属性情報基盤の分類を遂行する前に前処理を遂行する方法を説明するための図面である。

実施形態で使われる用語は本開示での機能を考慮しつつ、可能な限り現在広く使われる一般的な用語を選択したが、これは当分野に従事する技術者の意図または判例、新しい技術の出現などによって変わり得る。また、特定の場合は出願人が任意に選定した用語もあり、この場合、該当する説明の部分で詳細にその意味を記載するであろう。したがって、本開示で使われる用語は単純な用語の名称ではなく、その用語が有する意味と本開示の全般にわたった内容に基づいて定義されるべきである。

明細書全体で或る部分が何らかの構成要素を「含む」とする時、これは特に反対の記載がない限り他の構成要素を除くものではなく他の構成要素をさらに含み得ることを意味する。

明細書全体で記載された「ａ、ｂ、およびｃのうち少なくとも一つ」の表現は、「ａ単独」、「ｂ単独」、「ｃ単独」、「ａおよびｂ」、「ａおよびｃ」、「ｂおよびｃ」、または「ａ、ｂ、およびｃすべて」を含むことができる。

以下では、添付した図面を参照して本開示の実施形態について、本開示が属する技術分野で通常の知識を有する者が容易に実施できるように詳細に説明する。しかし、本開示は多様な異なる形態で具現され得、ここで説明する実施形態に限定されない。

以下では、図面を参照して本開示の実施形態を詳細に説明する。

図１は、本明細書の実施形態に係るアイテム管理システムを説明するための図面である。

本明細書の一実施形態に係るアイテム管理システム１００は、アイテムに関する情報が受信されると、各アイテムに関する情報を統一された形式に加工し、別途のコードが割り当てられていないアイテムに対してコードを割り当てることができ、特定のアイテムに対して最も先に割り当てられるコードは代表コードであり得る。実施形態でアイテム情報は一般的な文字列を含むことができ、少なくとも一つの区分子を含む文字列であり得る。実施形態で区分子は空白および文章記号を含むことができ、これに制限されず、特定項目の間を区別できる文字を含むことができる。

図１を参照すると、アイテム管理システム１００は複数の管理者１１１、１１２から購入アイテム情報を受信することができる。実施形態で購入アイテム情報は該当アイテムを購入するための購入要請であり得、この時、複数の管理者１１１、１１２から受信される購入アイテム情報は形式が異なり得るため、複数の購入要請の統合および管理が困難であり得る。

したがって、一実施形態に係るアイテム管理システム１００は既存のアイテム情報に基づいて機械学習を遂行し、これを通じて生成された学習結果により複数の管理者１１１、１１２から受信された購入アイテム情報を一定の形式に加工し、保存することができる。

例えば、第１管理者１１１が提供したアイテム情報にはアイテムの具体的なモデル名（Ｐ０００９０３）および用途（ＰＣＢエッチング腐食用）のみが含まれているだけであって、アイテムの分類に必要な情報（大分類、中分類、小分類に関する情報）は含まれていないこともある。このような場合、アイテム管理システム１００は機械学習結果に基づいて、第１管理者１１１が提供したアイテム情報を受信するとアイテムおよびアイテムの属性情報を分類し、分類結果を保存および出力することができる。

また、アイテム管理システム１００は第１管理者１１１が提供したアイテム情報に含まれた各属性項目の順序が第２管理者１１２が提供したアイテム情報に含まれた各属性項目の順序と異なっていても、各属性項目を識別して属性情報を分類および保存することができる。一方、実施形態で第１管理者１１１および第２管理者１１２は同一の管理者であり得る。また、同一のアイテムに関する情報を誤記や表示形態により異なるように記録した場合にも、学習モデルの学習結果により入力されたアイテム情報間の類似度を判断して、すでに入力されたアイテムとの類似度を判断したり新しい代表コードを割り当てるなどの動作を遂行できる。

したがって、一実施形態に係るアイテム管理システム１００は各アイテムに関する情報の管理効率性を増大させることができる。

一方、図１のアイテム管理システム１００はアイテム購入に関する情報の統合管理のためのものであることを前提として説明したが、アイテム管理システム１００の用途はアイテム購入に限定されず、すでに入力されたアイテム情報に基づいて該当情報を再び分類することにも使われ得、本明細書の実施形態は複数のアイテムを統合および管理するすべてのシステムに適用され得ることは該当技術分野の通常の技術者に自明である。換言すると、アイテムの購入要請だけでなく既存に保存されたアイテム情報の加工にも本明細書の実施形態が活用され得ることは自明である。

図２は、本明細書の一実施形態に係るアイテムに関する情報を管理する方法を説明するための図面である。

一実施形態に係るアイテム管理システムは、アイテムに関する情報が受信されると、各属性項目に基づいて受信された情報から属性情報を分類することができる。ここで、アイテムに関する情報は複数の属性情報を含むことができ、属性情報は属性項目により分類され得る。より具体的には、アイテムに関する情報は複数の属性情報を含む文字列であり得、アイテム管理システムはアイテムに関する情報を分類して各属性に対応する情報を導き出すことができる。

図２の（ａ）を参照すると、アイテム管理システムは形式が互いに異なる複数のアイテムに関する情報を受信することができる。例えば、アイテム管理システムは複数のアイテムに関する情報を顧客のデータベースからクローリングしたり受信することができ、またはユーザーの入力から受信することができる。この時、アイテムに関する情報に含まれた属性（アイテム名または品目名、メーカー、ＯＳなど）項目は識別されていない状態であり得る。

このような場合、一実施形態に係るアイテム管理システムは、機械学習を通じてアイテムに関する情報に含まれた各属性情報を分類することができる。例えば、図２の（ａ）に図示されたアイテム情報２１０は、図２の（ｂ）のようにアイテム名を含む各種属性項目により属性情報を分類することができる。実施形態で管理システムは、学習モデルにより分類された各情報がどのような属性に該当するかを判断することができ、各属性に該当する値に基づいて一つのアイテムに対する文字列がどのアイテムに対するものであるかを確認し、同一の分類のアイテムに関する情報を確認してこのようなアイテムを一括的に管理できるようにする。

このようなアイテム管理システムにより、アイテムに関する情報から各属性に対応する情報を導き出してこれを分けて整理することができ、今後これと対応する文字列が入力される場合にも該当文字列を分析して対応する属性値を確認し、これを分類して保存することができる。

したがって、一実施形態に係るアイテム管理システムは、アイテムに関する情報を標準化し、主要属性情報を管理することができるため、類似するか重複するアイテムを分類することができ、データ整備の便宜性を増大させることができる効果がある。

図３は、本明細書の一実施形態により学習モデルを生成する方法を説明するための図面である。

図３を参照すると、演算装置はアイテム情報に関連した複数の文字列３０１を利用して学習が遂行されて少なくとも一つの学習モデル３２０を生成することができる。例えば演算装置は、アイテム情報に関連した文字列でアイテムに関連した属性情報３０３を確認し、属性情報３０３に基づいて属性学習３０５を遂行し、これに伴い、第１学習モデルを生成することができる。また、演算装置はアイテム情報に関連した文字列でアイテムに関連した基準品名情報３１１を確認し、基準品名情報３１１に基づいて基準品名学習３１３を遂行し、これに伴い、第２学習モデルを生成することができる。

アイテム情報に関連した複数の文字列３０１は学習モデル生成に関連した複数のアイテムに関する情報を示してもよい。複数の文字列３０１はソース文字列セットに含まれ得るが、このような場合、ソース文字列セットは分析対象となる多様なアイテムに関する情報を示す文字列の集合であり得る。すなわち、学習に利用される複数の文字列３０１はソース文字列セットに含まれる多様な文字列のうち一部であり得る。

一実施形態で、文字列はアイテムに関する情報を示す字の組み合わせであり、例えば、文字列は図２の（ａ）に図示されたアイテム情報２１０と同一であり得る。複数の文字列３０１それぞれごとに対応する属性情報（例：メーカー、ＯＳ、バッテリー、重さ）と基準品名情報（例：アイテム名）が存在し得る。属性情報と基準品名情報はアイテムにより予め指定された値であり、アイテム情報を示す文字列にもアイテムと同一に予め指定され得る。

一方、実施形態でアイテムのメーカーによって、同一のアイテムであっても指称する品名は異なり得る。例えばＡメーカーのスイッチはＫと指称され、ＢメーカーのスイッチはＭと指称され得る。本明細書の一実施形態によると、ＫとＭという品名がいずれも「Ｒ」という基準品名によって分類されることによって、アイテムがより効果的に管理され得る。また、これと同様に同じ属性に対して他の用語で指称される場合にも、本明細書の一実施形態によると、同じ属性を分析してこれに関する情報を提供することによってアイテムがより効果的に管理され得る。

一実施形態で、基準品名により属性情報の類型の少なくとも一部は異なり得る。例えば基準品名が「ＢＩＯ－ＤＩＳＰＥＲＳＡＮＴ」である場合、属性情報の類型は「ＦＬＯＷＲＡＴＥ」、「ＰＵＭＰＩＮＧＨＥＡＤ」、「ＰＯＷＥＲ」、および「ＳＩＺＥ」を含むことができる。基準品名が「ＳＭＡＲＴＰＨＯＮＥ」である場合、属性情報の類型は「ＯＳ」、「ＰＯＷＥＲ」、および「ＳＩＺＥ」を含むことができる。

このような属性情報と基準品名情報それぞれは学習モデルの正解値として利用され得、これに伴い、属性情報に対する学習モデルと基準品名情報に対する学習モデルが生成され得る。

一実施形態で、複数の文字列３０１を入力値とし、複数の文字列３０１それぞれに対応する属性情報３０３を正解値として属性情報に対する学習３０５が遂行されて第１学習モデルが生成され得る。例えば第１文字列が入力されると、第１文字列が示す属性情報を正解値として学習が遂行され、その後第２文字列が入力されると第２文字列が示す属性情報を正解値として学習が遂行され得る。このように複数の文字列３０１と属性情報に基づいて第１学習モデルの学習が遂行されることによって、第１学習モデルは文字列が入力されると入力された文字列に対応する属性情報を確認することができる。

他の例として、複数の文字列３０１を入力値とし、基準品名情報３１１を正解値として基準品名情報に対する学習３１３が遂行されることによって第２学習モデルが生成され得る。例えば第１文字列が入力されると第１文字列が示す基準品名情報を正解値として学習が遂行され、その後第２文字列が入力されると第２文字列が示す基準品名情報を正解値として学習が遂行され得る。このように複数の文字列３０１と属性情報に基づいて第２学習モデルの学習が遂行されることによって、第１学習モデルは文字列が入力されると入力された文字列に対応する基準品名情報を確認することができる。

実施形態で、基準品名情報により属性情報の類型が異なり得るため、属性情報を利用した学習と基準品名情報を利用した学習は関連づけられてなされ得る。例えば属性情報を利用した学習は基準品名により区分されてなされ得る。このような場合、少なくとも一つの学習モデル３２０は基準品名を確認する学習モデルと基準品名別属性情報を確認する少なくとも一つの学習モデルを含むことができる。例えば少なくとも一つの学習モデル３２０は、文字列に対応する基準品名を確認するように学習された第１学習モデル、第１基準品名に対応する属性情報の類型により属性情報を確認するように学習がなされた第２学習モデル、および第２基準品名に対応する属性情報の類型により属性情報を確認するように学習がなされた第３学習モデルを含むことができる。

実施形態で、第２学習モデルと第３学習モデルは一つの学習モデルとして具現され得る。例えば第２学習モデルと第３学習モデルが一つの学習モデルである第４学習モデルとして具現される場合、第４学習モデルは文字列および基準品名情報の入力を受けると、文字列に対応する属性情報を確認することができる。

ただし、これに制限されるものではなく、場合により少なくとも一つの学習モデル３２０は基準品名の指定にかかわらず、文字列だけ入力されても属性情報を確認するように学習された学習モデルを含むことができる。

少なくとも一つの学習モデル３２０は前述した第１学習モデルと第２学習モデルを含むことができる。少なくとも一つの学習モデル３２０それぞれはＣＮＮ（ｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ）で構成され得るが、これに制限されるものではない。

図４は、本明細書の一実施形態により学習モデルを利用して文字列を確認する方法を説明するための図面である。

図４を参照すると、分類しようとする対象となる文字列である分類対象文字列４０１は第１学習モデル４０３に入力され得る。第１学習モデル４０３は分類対象文字列４０１が示す基準品名情報を確認（４０５）することができる。

基準品名情報が確認された分類対象文字列は第２学習モデル４０７に入力され得る。第２学習モデル４０７は基準品名が確認された分類対象文字列に対する属性情報を確認（４０９）することができる。

図示されてはいないが、実施形態により基準品名情報が確認された分類対象文字列に対して属性トークン化（ｔｏｋｅｎｉｚａｔｉｏｎ）が遂行され得る。属性トークン化は文字列を構成する単語単位で区分することを意味し得る。具体的には、例えば文字列が［ＧＬＯＢＥＶＡＬＶＥ．ＳＩＺＥ１－１／２”．Ａ－１０５．ＳＣＲ’Ｄ．８００＃．ＪＩＳ］である場合、文字列は単語単位でトークン化されて［ＧＬＯＢＥ、ＶＡＬＶＥ、ＳＩＺＥ、１－１／２”、Ａ－１０５、ＳＣＲ’Ｄ、８００＃、ＪＩＳ］のように表され得る。このような単語単位のトークン化は分かち書きおよび文章記号のうち少なくとも一つを基準として遂行され得る。トークン化された単語は特定の意味を有する単語であり得るが、これに制限されるものではない。

実施形態で、文字列がトークン化されると、少なくとも一つのトークンが生成され得る。少なくとも一つのトークンには機械学習が遂行された学習モデルによってタグが追加され得る。タグの追加は機械学習に基づいて設けられたタグ追加のための学習モデルに基づいてなされ得る。タグに基づいて一つ以上のトークンは単語に決定され得る。決定された単語は第２学習モデル４０７に入力され得る。第２学習モデル４０７は入力された単語に対応する属性情報を確認することができる。一方、トークン化およびタグ追加に関連したより具体的な説明は図１１を参照することができる。

図５は、本明細書の一実施形態に係る情報提供装置の機能ブロック図である。図５には本実施形態に関連した構成要素が図示されているがこれに制限されるものではなく、図５に図示された構成要素以外に他の汎用的な構成要素がさらに含まれ得る。

図５を参照すると、機械学習を通じての学習モデルを使った情報提供装置５００はメモリ５１０とプロセッサ５２０を含むことができる。一方、実施形態で情報提供装置５００は演算装置の形態であり得る。図５に図示された各要素（ｅｌｅｍｅｎｔ）は少なくとも一つの機能や動作を処理する単位を意味し、これはハードウェアやソフトウェア、またはハードウェアおよびソフトウェアの結合で具現され得る。

メモリ５１０は情報提供装置５００に関連した多様なデータを保存することができる。例えばメモリ５１０は情報提供装置５００の動作のための少なくとも一つの命令語（ｉｎｓｔｒｕｃｔｉｏｎ）を保存することができる。このような場合、プロセッサ５２０はメモリ５１０に保存された命令語に基づいて多様な動作を遂行できる。

プロセッサ５２０は情報提供装置５００の全般的な動作を制御することができる。例えば、プロセッサ５２０はメモリ５１０に保存された命令語に基づいて情報提供装置５００の要素を制御することによって情報提供装置５００の動作を制御することができる。

プロセッサ５２０は学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認することができる。複数の文字列それぞれは互いに区分されるアイテムに関する情報を示すことができる。複数の文字列それぞれは少なくとも一つの単語で構成され得、場合により文字列を構成する単語の配列または属性情報は非規則的であり得る。例えば、互いに異なる単語が互いに同じ意味を示してもよく、または文字列を構成する単語の配列が文字列ごとに異なってもよい。

ここで、単語は分離して自立的に使うことができる字の組み合わせ（またはグループ、集合）を含むことができるが、これに制限されるものではなく、例えば分かち書きや文章記号を利用して区分される字の組み合わせを含んでもよい。また、単語は特定の意味を有し得るがこれに制限されるものではない。

プロセッサ５２０は第１セットの文字列に基づいて少なくとも一つの学習モデルを生成することができる。プロセッサ５２０は第１セットの文字列を学習データとして利用して少なくとも一つの学習モデルを生成することができる。

一実施形態で、プロセッサ５２０は第１セットの文字列と第１セットの文字列それぞれが示す基準品名情報を利用して学習モデルを学習させることができる。このような場合、特定文字列が入力されると入力された文字列が示す基準品名情報を確認する学習モデルが生成され得る。

一実施形態で、プロセッサ５２０は第１セットの文字列と第１セットの文字列それぞれに対応する属性情報を利用して学習モデルを学習させることができる。このような場合、特定文字列が入力されると入力された文字列が示す属性情報を確認する学習モデルが生成され得る。

場合によって、属性情報は基準品名によりその類型が異なり得る。このような場合、学習は基準品名が指定されることに基づいてなされ得る。例えば第１基準品名を有する文字列と文字列それぞれに対応する属性情報を利用して学習が遂行され得る。その後第１基準品名を有する文字列と文字列それぞれに対応する属性情報を利用して学習が遂行され得る。他の例として、文字列および文字列に対応する基準品名が入力され、属性情報が正解値として入力されることに対応して学習がなされてもよい。しかし、これに制限されるものではなく、基準品目の区分がなくても文字列が入力されさえすれば該当する属性情報が出力されるように学習が遂行されてもよい。

実施形態で、少なくとも一つの学習モデルは教師あり学習（ｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇ）に基づいて学習が遂行され得る。少なくとも一つの学習モデルは第１セットの文字列および第１セットの文字列に対して品名情報と属性情報に基づいて生成され得る。例えば少なくとも一つの学習モデルは第１セットの文字列を入力値とし、基準品名情報と属性情報を正解値とする教師あり学習に基づいて学習が遂行され得る。他の例として、少なくとも一つの学習モデルは第１学習モデルと第２学習モデルを含むことができ、第１学習モデルの場合、基準品名を正解値とする教師あり学習に基づいて学習が遂行され、第２学習モデルの場合、属性を正解値とする教師あり学習に基づいて学習が遂行され得る。この時、学習データとして利用される文字列それぞれに対応する正解値（例：基準品名、属性）は予め指定されたものであり得る。

プロセッサ５２０は情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認することができる。第２セットの文字列は情報分類対象である複数のアイテムに対するものであり得る。

一方、第１セットの文字列と第２セットの文字列はソース文字列セットに含まれ得る。ソース文字列セットは一つ以上のアイテムそれぞれを示す文字列を含むグループであり得る。ソース文字列セットのうち、学習のための文字列として第１セットの文字列が選択され、学習モデルを利用した分析対象となる文字列として第２セットの文字列が選択され得る。

実施形態により第１セットの文字列のうち少なくとも一部は第２セットの文字列のうち少なくとも一部と重複され得、このような場合は学習に利用されたデータが学習の検証にもう一度利用される場合と見ることができるであろう。しかし、これは例示に過ぎず、このような例に本実施形態が制限されるものではない。

実施形態で、ソース文字列セットに含まれる文字列はカテゴリー化されてもよい。すなわち、ソース文字列セットに含まれた文字列は文字列間の類似性に基づいてカテゴリー化され、カテゴリー単位で区分され得る。例えば第１文字列と第２文字列は第１カテゴリーに含まれ、第３文字列と第４文字列は第２カテゴリーに含まれ得る。第１カテゴリーに含まれた第１文字列と第２文字列は互いに類似し、第２カテゴリーに含まれた第３文字列と第４文字列は互いに類似し得る。

文字列のカテゴリー化に利用される類似性は多様な基準によって決定され得る。例えば類似性は文字列に関連した属性情報に基づいて決定され得る。このような場合、ソース文字列セットに含まれる文字列は属性情報に対応するカテゴリー情報を有することができる。

一実施形態で第１セットの文字列はカテゴリー情報を基準としてソース文字列セットから選択され得る。例えば第１セットの文字列はカテゴリー情報を基準としてソース文字列セットから、同一カテゴリーを有する文字列のうち基準比率（例：２０％）以上の文字列を含むように選択され得る。すなわち、第１セットの文字列は、ソース文字列セットを構成する各カテゴリ別に特定比率以上に対応する個数の文字列が含まれるように生成されたものであり得る。例えば、第１カテゴリーに１０個の文字列が含まれ、第２カテゴリーに２０個の文字列が含まれ、基準比率が２０％である場合、第１セットの文字列は第１カテゴリーの文字列のうち２個、第２カテゴリーの文字列のうち４個を含むことができる。この時、各カテゴリ別に選択される文字列はランダムに選択され得るがこれに制限されるものではない。

一実施形態で、第１セットの文字列に含まれる文字列を選択するための基準比率は、複数のアイテムの種類、複数の文字列の長さおよびカテゴリーの個数のうち少なくとも一つに基づいて決定され得る。ここで、複数のアイテムの種類は例えば複数のアイテムが示すことができる基準品名の種類を含むことができる。複数の文字列の長さは例えば複数の文字列それぞれの平均の長さを含むことができる。カテゴリーの個数は例えばソース文字列セットを構成するカテゴリーの個数を含むことができる。

例えば、基準比率は複数のアイテムの種類、複数の文字列の長さおよびカテゴリーの個数のうち少なくとも一つが示す値に比例して決定され得る。他の例として、基準比率は複数のアイテムの種類が所定個数以上であるか、文字列の長さが所定長さ以上であるか、カテゴリーの個数が所定個数以上の場合、より大きな値に決定され得る。ただしこれに制限されるものではなく、基準比率は予め指定された値であってもよい。

プロセッサ５２０は少なくとも一つの学習モデルを使って、第２セットの文字列の少なくとも一部それぞれに対する基準品名情報および属性情報を確認することができる。少なくとも一つの学習モデルは基準品名情報の導出に関連した第１学習モデルと属性情報の導出に関連した第２学習モデルを含むことができる。このような場合、プロセッサ５２０は第１学習モデルを通じて第２セットの文字列に基づいて基準品名情報を導き出すことができる。プロセッサ５２０は導き出された基準品名情報に基づいて第２セットの文字列それぞれのうち少なくとも一部をトークン化することができる。プロセッサ５２０は第２学習モデルを通じてトークン化された文字列に基づいて属性情報を導き出すことができる。

実施形態で、トークン化に関連して、プロセッサ５２０は第２セットの文字列に含まれた空白を基準として第２セットの文字列それぞれのうち少なくとも一部をトークン化することができる。プロセッサ５２０は機械学習を通じて、トークン化に基づいて生成された複数のトークンそれぞれにタグを追加することができる。ここで、タグを追加する過程は前記機械学習に基づいて予め設けられた学習モデルに基づいてなされ得る。

プロセッサ５２０はタグに基づいて一つ以上のトークンを単語として決定することができる。タグは例えば開始タグ、連続タグ、および終了タグを含むことができる。このような場合、プロセッサ５２０は開始タグが追加されたトークンから次の開始タグが追加されたトークン以前のトークンまで、または開始タグが追加されたトークンから終了タグが追加されたトークンまでを一つの単語として決定することができる。トークン化に関連したより具体的な説明は図１１を参照することができる。

プロセッサ５２０は第２学習モデルを利用して決定された単語に基づいて属性情報を導き出すことができる。例えばプロセッサ５２０は決定された単語を第２学習モデルに入力させることに基づいて、単語それぞれに該当する属性情報を導き出すことができる。

実施形態で、少なくとも一つの学習モデルは一つ以上のパラメータ（ｐａｒａｍｅｔｅｒ）を利用して学習が遂行され得る。一つ以上のパラメータは例えば、学習繰り返し（ｉｔｅｒａｔｉｏｎ）回数、学習のためのテキスト個数単位、機械学習アルゴリズムの隠れユニット（ｈｉｄｄｅｎｕｎｉｔ）の個数、機械学習アルゴリズムの出力ベクトルの次元、出力ベクトルのドロップアウト（ｄｒｏｐｏｕｔ）、機械学習アルゴリズムのバッチサイズ（ｂａｔｃｈｓｉｚｅ）およびラーニングレート（ｌｅａｒｎｉｎｇｒａｔｅ）のうち少なくとも一つを含むことができる。プロセッサ５２０は一つ以上のパラメータのうち少なくとも一つを調節することに基づいて、学習モデルの学習がより効果的になされるように制御することができる。パラメータの調節に関連したより具体的な説明は図８を参照することができる。

実施形態で、プロセッサ５２０は基準品名情報および属性情報の確認に基づいて、基準品名情報および属性情報のうち少なくとも一つを利用して入力された文字列を修正することができる。プロセッサ５２０は修正された文字列を提供することができる。例えば、プロセッサ５２０は文字列を見て基準品名または属性がより容易に確認されるように、文字列に基準品名または属性を示すテキストが含まれるように文字列を修正して提供することができる。これに関連した具体的な例は図９を参照することができる。

図６は、本明細書の一実施形態に係る情報提供方法の各段階の流れを示す図面である。図６に図示された方法の各段階は、場合により図面に図示されたものとその順序を異ならせて遂行され得ることは言うまでもない。以下の図面に対する説明では前述した内容と重複する内容が省略され得る。

図６を参照すると、段階６１０で情報提供装置は、学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認することができる。第１セットの文字列は複数の文字列で構成されたソース文字列セットの少なくとも一部であり得る。複数の文字列それぞれはアイテムに関する情報を示すことができる。アイテムに関する情報はアイテムの基準品名および属性のうち少なくとも一つに関する情報を含むことができる。

段階６２０で、情報提供装置は第１セットの文字列に基づいて少なくとも一つの学習モデルを生成することができる。情報提供装置は第１セットの文字列を学習データとして利用して少なくとも一つの学習モデルを生成することができる。具体的には、情報提供装置は第１セットの文字列と文字列それぞれに対応する基準品名情報および属性情報を利用して、文字列が入力されると基準品名情報および属性情報のうち少なくとも一つを導き出す学習モデルを生成することができる。

段階６３０で、情報提供装置は情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認することができる。第２セットの文字列はソース文字列セットの少なくとも一部であり得る。第２セットの文字列は分類（または分析）しようとする対象となるアイテムに関するものであり得る。

段階６４０で、情報提供装置は少なくとも一つの学習モデルを使って第２セットの文字列の少なくとも一部それぞれに対する基準品名情報および属性情報を確認することができる。情報提供装置は前記第１セットの文字列に基づいて生成された少なくとも一つの学習モデルに第２セットの文字列を入力することに基づいて第２セットの文字列それぞれに対応する基準品名情報および属性情報を確認することができる。

実施形態で、少なくとも一つの学習モデルは基準品名情報の導出に関連した第１学習モデルと属性情報の導出に関連した第２学習モデルを含むことができる。情報提供装置は第２セットの文字列を第１学習モデルを通じて分析することに基づいて第２セットの文字列それぞれが示す基準品名情報を確認することができる。情報提供装置は基準品名情報に基づいて第２セットの文字列それぞれに対するトークン化を遂行できる。情報提供装置はトークン化に基づいて第２セットの文字列それぞれに対応する単語を決定することができる。情報提供装置は決定された単語を第２学習モデルを通じて分析することに基づいて決定された単語が示す属性情報を確認することができる。これに伴い、結果として第２セットの文字列それぞれに対する基準品名情報と属性情報が確認され得る。

図７は、本明細書の一実施形態に係る情報提供装置で少なくとも一つの学習モデルの生成のために利用される文字列セットを説明するための図面である。

具体的には、図７は、ソース文字列セット７１０が複数のカテゴリーに区分される場合、カテゴリー別に基準比率以上の文字列が選択されて第１文字列セット７３０に含まれる実施形態を概念的に図示する。

図７を参照すると、ソース文字列セット７１０は複数のカテゴリー、例えば第１カテゴリー７２１、第２カテゴリー７２２ないし第ｋカテゴリー７２３を含むことができる。複数のカテゴリーそれぞれには少なくとも一つの文字列が含まれ得る（図示されず）。このような場合、第１文字列セット７３０は各カテゴリ別に基準比率以上の文字列が選択されることに基づいて設けられ得る。

例えば、基準比率以上が２０％である場合、第１カテゴリー７２１に含まれた文字列個数の２０％に該当する個数だけの文字列が選択されて第１文字列セット７３０に含まれ得る。第２カテゴリー７２２～第ｋカテゴリー７２３も第１カテゴリー７２１と同様にそれぞれ２０％に該当する個数だけの文字列が選択されて第１文字列セット７３０に含まれ得る。

一方、実施形態で、カテゴリーは属性情報に基づいて区分されたものであり得、このような場合、第１文字列セット７３０はカテゴリー情報に基づいて構成されることによって多様な属性情報を有する文字列を含むことになり得る。このような第１文字列セット７３０を利用して学習モデルが生成される場合、生成された学習モデルは多様な属性情報に対する分類が可能となり得る。

ただし、これに制限されるものではなく、カテゴリーは文字列間の類似度に基づいて区分されたものであり得る。例えばカテゴリーは類似するデータをカテゴリー化する学習モデル（以下、第３学習モデル）に基づいて生成されたものであり得る。このような場合、ソース文字列セットに含まれる文字列が第３学習モデルに入力されることに基づいて類似する文字列同士でカテゴリー化されることによって、前記複数のカテゴリーが生成され得る。このような第３学習モデルは教師なし学習（ｕｎｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇ）に基づいた多様な種類の学習モデル（例：ＧＡＮ（ｇｅｎｅｒａｔｉｖｅａｄｖｅｒｓａｒｉａｌｎｅｔｗｏｒｋ））で具現され得る。

図８は、本明細書の一実施形態に係る情報提供装置で利用される学習モデルのパラメータを説明するための図面である。

一実施形態に係る情報提供装置は文字列を利用して機械学習を遂行することに基づいて学習モデルを生成し、生成された学習モデルを利用して文字列に関する情報を分類して分類された情報を提供することができる。文字列に関する情報を分類するにおいて、情報提供装置はパラメータを調整することによって学習モデルの性能を改善することができる。図８は、学習モデルの性能改善のためにパラメータを調整する場合を説明するための図面である。

図８を参照すると、情報提供装置は情報提供のために利用される学習モデルに対するリスト８１０を提供することができる。リスト８１０は第１学習モデルと第２学習モデルに対するリストを含むことができるが、これに制限されるものではなく、トークン化のために利用される学習モデルまたはソース文字列セットのカテゴリー化のために利用される学習モデルに対するリストを含んでもよい。

図８によると、ユーザーの入力に基づいてリスト８１０に含まれる学習モデルのうち一つが選択され得る。このような場合、選択された学習モデルに対する詳細情報８２０が提供され得る。以下では、選択された学習モデルが第１文字列セットを利用して学習が遂行された少なくとも一つの学習モデルのうち第１学習モデルであると仮定する。

実施形態において、第１学習モデルが選択されることに基づいて、詳細情報８２０には第１学習モデルを指称するために指定された名称が「学習名」欄に表示され得る。第１学習モデルの類型は「モデル類型」欄に表示され得る。詳細情報８２０は例示的に示したものであり、これに制限されず、第１学習モデルに関連した多様な情報例えば、生成日が表示されてもよい。

実施形態において、第１学習モデルが選択されることに基づいて第１学習モデルに関連したパラメータ情報８３０が表示され得る。パラメータ情報８３０は第１学習モデルの性能調節のために制御される要素であり、情報提供装置またはアイテム管理システムの設計要求事項により調節され得る。図８に図示されたパラメータに対するより具体的な内容は下記の表１を参照することができる。

一方、学習モデルの性能向上のために調節され得るパラメータは図８または表１に制限されず、システム設計の要求事項によって変わり得ることは該当技術分野の通常の技術者に自明である。

一方、実施形態で学習モデルを生成した後、これを通じて基準品名情報および属性情報の確認結果の正確度が落ちる場合、このようなパラメータのうち少なくとも一つを調節して学習モデルを新しく生成したり追加学習を遂行できる。

図９および図１０は、本明細書の一実施形態により確認される基準品名情報および属性情報を説明するための図面である。

図９は、本明細書の一実施形態に係る情報提供装置によって基準品名情報が確認される場合を説明するための図面である。

図９を参照すると、情報提供装置は「＃１ＣＷＢＩＯ－ＤＩＳＰＥＲＳＡＮＴＦＯＲ」という文字列を少なくとも一つの学習モデルを通じて確認することができる。例えば情報提供装置は、文字列を第１学習モデルを使って分析することに基づいて文字列に対応する基準品名情報を確認することができる。情報提供装置は確認された基準品名情報を提供することができる。例えば、情報提供装置は「＃１ＣＷＢＩＯ－ＤＩＳＰＥＲＳＡＮＴＦＯＲ」が示す基準品名情報である「ＢＩＯ－ＤＩＳＰＥＲＳＡＮＴ」を確認してこれに関する情報を提供することができる。

実施形態において、情報提供装置は入力された文字列を確認された基準品目情報に基づいて修正して提供することができる。例えば情報提供装置は「＃１ＣＷＢＩＯ－ＤＩＳＰＥＲＳＡＮＴＦＯＲ」という文字列が示す基準品目情報が「ＢＩＯ－ＤＩＳＰＥＲＳＡＮＴ」であることに対応して、文字列を「＃１ＣＷＢＩＯ－ＤＩＳＰＥＲＳＡＮＴ」という文字列に修正して提供することができる。

図１０は、本明細書の一実施形態に係る情報提供装置によって属性情報が確認された場合を説明するための図面である。

図１０を参照すると、情報提供装置は文字列を第２学習モデルを利用して分析することができる。情報提供装置は第２学習モデルを通じて文字列が示す属性情報を確認し、確認された属性情報を提供することができる。

実施形態において、第２学習モデルに文字列が入力される前、基準品目情報が決定されることにより文字列に対するトークン化が遂行され得る。例えば基準品目情報に対応する属性情報に基づいてトークン化が遂行されることに基づいて、文字列は一つ以上の単語に区分され得る。区分された単語は第２学習モデルを通じて分析されることに基づいて単語別に対応する属性情報が確認され得る。

一実施形態において、トークン化に基づいて、基準品目情報により予め指定された属性情報の類型別に文字列を構成する単語が区分され得る。例えば文字列が第１基準品目であり、予め指定された属性情報がＳＩＺＥ、ＦＬＯＷＲＡＴＥ、ＰＵＭＰＩＮＧＨＥＡＤ、ＰＯＷＥＲである場合、トークン化により文字列を構成する単語のうち「Ｑ：１０Ｍ３／ＨＲＨＥＡＤ：２０Ｍ３．７ＫＷ」はＳＩＺＥに関連したものであると区分され得る。

ただし、このようなトークン化は文字列の分かち書きや文章記号のような構成によって遂行されるものであるため、「Ｑ：１０Ｍ３／ＨＲＨＥＡＤ：２０Ｍ３．７ＫＷ」はＳＩＺＥに関連したものではなく異なる属性情報（例：ＦＬＯＷＲＡＴＥ、ＰＵＭＰＩＮＧＨＥＡＤ、ＰＯＷＥＲ）に関連したものであり得る。情報提供装置は第２学習モデルを通じてトークン化された単語を分析することによって正確な属性情報を確認することができる。トークン化に関連したより具体的な説明は図１１を参照することができる。

すなわち、図示された通り、情報提供装置は「Ｑ：１０Ｍ３／ＨＲＨＥＡＤ：２０Ｍ３．７ＫＷ」を第２学習モデルを通じて分析して実際の属性情報（例：ＦＬＯＷＲＡＴＥ、ＰＵＭＰＩＮＧＨＥＡＤ、ＰＯＷＥＲ）を確認することができる。また、実際の属性情報により単語を再構成して、これに関する情報を図示されたように提供することができる。

ただし、これに制限されるものではなく、実施形態により属性情報はマッチングされていない状態で文字列が単語で区分されてもよい。このような場合にも情報提供装置は区分された単語を第２学習モデルに適用することができ、単語に対応する属性情報を確認することができる。

図１１は、本明細書の一実施形態により属性情報基盤の分類を遂行する前に前処理を遂行する方法を説明するための図面である。

実施形態において、アイテムに関する情報に含まれた各属性情報は区画文字で分類されたものであり得、区画文字なしに連続した文字で構成され得る。もしアイテムに関する情報に含まれた各属性項目が区分されず、連続した文字で入力された場合、前処理なしでは各属性項目を識別することが困難であり得る。このような場合、一実施形態に係るアイテム分類装置はアイテム分類を遂行する前にアイテムに関する情報を前処理することができる。

具体的には、一実施形態に係るアイテム分類装置は、アイテムに関する情報間の類似度を計算する前に機械学習を通じてアイテムに関する情報に含まれたそれぞれの単語を識別するための前処理を遂行できる。

図１１を参照すると、アイテムに関する情報が連続した文字列１１１０で入力された場合、一実施形態に係るアイテム分類装置は空白または特定文字を基準として、連続した文字列１１１０内の文字をタギング（ｔａｇｇｉｎｇ）のための単位として分類することができる。ここで、タギングのための単位の文字列１１２０はトークン化単位の文字列１１４０より長さが短い文字列と定義され、開始（ＢＥＧＩＮ＿）、連続（ＩＮＮＥＲ＿）および終了（Ｏ）タグを追加する単位を意味する。

その後、アイテム分類装置は各タギングのための単位の文字列１１２０ごとに機械学習アルゴリズム１１３０を利用してタグを追加することができる。例えば、図１１のＧＬＯＢＥにはＢＥＧＩＮ＿タグが追加され得、／にはＩＮＮＥＲ＿タグが追加され得る。

一方、アイテム分類装置は開始（ＢＥＧＩＮ＿）タグが追加されたトークンから終了（Ｏ）タグが追加されたトークンまでを一つの単語として認識することができ、または開始（ＢＥＧＩＮ＿）タグが追加されたトークンから次の開始（ＢＥＧＩＮ＿）タグが追加されたトークン以前のトークンまでを一つの単語として認識することができる。したがって、アイテム分類装置は連続した文字列１１１０からトークン化単位の文字列１１４０を認識できることになる。

したがって、アイテム分類装置は図１１に開示された方法により、アイテムに関する情報に含まれた各トークンを識別した後、アイテムに関する情報を分類することができる。

前述した実施形態に係るプロセッサは、プロセッサ、プログラムデータを保存し実行するメモリ、ディスクドライブのような永久保存部（ｐｅｒｍａｎｅｎｔｓｔｏｒａｇｅ）、外部装置と通信する通信ポート、タッチパネル、キー（ｋｅｙ）、ボタンなどのようなユーザインターフェース装置などを含むことができる。ソフトウェアモジュールまたはアルゴリズムで具現される方法は前記プロセッサ上で実行可能なコンピュータ読み取り可能なコードまたはプログラム命令であって、コンピュータ読み取り可能な記録媒体上に保存され得る。ここで、コンピュータ読み取り可能な記録媒体として、マグネチック保存媒体（例えば、ＲＯＭ（ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍ－Ａｃｃｅｓｓｍｅｍｏｒｙ）、フロッピーディスク、ハードディスクなど）および光学的読み取り媒体（例えば、シーディーロム（ＣＤ－ＲＯＭ）、ティブイディ（ＤＶＤ：ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ））等がある。コンピュータ読み取り可能な記録媒体はネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータが読み取り可能なコードが保存され実行され得る。媒体はコンピュータによって読み取り可能であり、メモリに保存され、プロセッサで実行され得る。

本実施形態は機能的なブロック構成および多様な処理段階で示され得る。このような機能ブロックは特定の機能を実行する多様な個数のハードウェアまたは／およびソフトウェア構成で具現され得る。例えば、実施形態は一つ以上のマイクロプロセッサの制御または他の制御装置によって多様な機能を実行できる、メモリ、プロセッシング、ロジック（ｌｏｇｉｃ）、ルックアップテーブル（ｌｏｏｋ－ｕｐｔａｂｌｅ）などのような直接回路構成を採用することができる。構成要素がソフトウェアプログラミングまたはソフトウェア要素で実行され得るのと同様に、本実施形態はデータ構造、プロセス、ルーチンまたは他のプログラミング構成の組み合わせで具現される多様なアルゴリズムを含み、Ｃ、Ｃ＋＋、ジャバ（Ｊａｖａ）、パイソン（ｐｙｔｈｏｎ）などのようなプログラミングまたはスクリプト言語で具現され得る。機能的な側面は一つ以上のプロセッサで実行されるアルゴリズムで具現され得る。また、本実施形態は電子的な環境設定、信号処理、および／またはデータ処理などのために従来技術を採用することができる。「メカニズム」、「要素」、「手段」、「構成」のような用語は広く使われ得、機械的かつ物理的な構成で限定されるものではない。前記用語はプロセッサなどと連係してソフトウェアの一連の処理（ｒｏｕｔｉｎｅｓ）の意味を含むことができる。

前述した実施形態は一例示に過ぎず、後述する請求項の範囲内で他の実施形態が具現され得る。

Claims

機械学習を通じての学習モデルを使った情報提供方法であって、
学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認する段階と、
前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成する段階と、
情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認する段階と、
前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名情報および属性情報を確認する段階と、を含む、情報提供方法。
前記第１セットの文字列は前記第２セットの文字列を含むソース文字列セットから選択され、
前記少なくとも一つの学習モデルは前記第１セットの文字列および前記第１セットの文字列に対して基準品名情報と属性情報に基づいて生成される、請求項１に記載の情報提供方法。
前記第１セットの文字列は前記第２セットの文字列を含むソース文字列セットから選択され、
前記ソース文字列セットに含まれる文字列は属性情報に対応するカテゴリー情報を有し、前記第１セットの文字列は前記カテゴリー情報を基準として前記ソース文字列セットから選択される、請求項１に記載の情報提供方法。
前記第１セットの文字列は前記カテゴリー情報を基準として前記ソース文字列セットで同一カテゴリーを有する文字列のうち基準比率以上の文字列を含む、請求項３に記載の情報提供方法。
前記基準比率は前記複数のアイテムの種類、前記複数の文字列の長さおよびカテゴリーの個数のうち少なくとも一つに基づいて決定される、請求項４に記載の情報提供方法。
前記少なくとも一つの学習モデルは基準品名情報の導出に関連した第１学習モデルおよび属性情報の導出に関連した第２学習モデルを含む、請求項１に記載の情報提供方法。
前記基準品名情報および属性情報を確認する段階は、
前記第１学習モデルを通じて前記第２セットの文字列に基づいて基準品名情報を導き出す段階と、
前記基準品名情報に基づいて前記第２セットの文字列それぞれのうち少なくとも一部をトークン化する段階と、
前記第２学習モデルを通じて前記トークン化された文字列に基づいて属性情報を導き出す段階と；を含む、請求項６に記載の情報提供方法。
前記トークン化する段階は、
前記第２セットの文字列に含まれた空白を基準として前記第２セットの文字列それぞれのうち少なくとも一部をトークン化する段階と、
機械学習を通じて、前記トークン化に基づいて生成された複数のトークンそれぞれにタグを追加する段階と、
前記タグに基づいて一つ以上のトークンを単語として決定する段階を含む、請求項７に記載の情報提供方法。
前記属性情報を導き出す段階は、前記第２学習モデルを通じて前記決定された単語に基づいて属性情報を導き出す段階を含む、請求項８に記載の情報提供方法。
前記タグは開始タグ、連続タグおよび終了タグを含み、
前記単語で決定する段階は、前記開始タグが追加されたトークンから次の開始タグが追加されたトークン以前のトークンまたは終了タグが追加されたトークンまでを一つの単語として決定する段階を含む、請求項８に記載の情報提供方法。
前記少なくとも一つの学習モデルはＣＮＮ（ｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ）を含む、請求項１に記載の情報提供方法。
前記少なくとも一つの学習モデルは、学習繰り返し（ｉｔｅｒａｔｉｏｎ）回数、前記機械学習のためのテキスト個数単位、前記機械学習アルゴリズムの隠れユニット（ｈｉｄｄｅｎｕｎｉｔ）の個数、前記機械学習アルゴリズムの出力ベクトルの次元、前記出力ベクトルのドロップアウト（ｄｒｏｐｏｕｔ）、前記機械学習アルゴリズムのバッチサイズ（ｂａｔｃｈｓｉｚｅ）およびラーニングレート（ｌｅａｒｎｉｎｇｒａｔｅ）のうち少なくとも一つを利用して学習が遂行される、請求項１に記載の情報提供方法。
機械学習を通じての学習モデルを使った情報提供装置であって、
少なくとも一つの命令語（ｉｎｓｔｒｕｃｔｉｏｎ）を含むメモリと、
プロセッサを含み、
前記プロセッサは前記少なくとも一つの命令語に基づいて、
学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認し、
前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成し、
情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認し、
前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名情報および属性情報を確認する、情報提供装置。
機械学習を通じての学習モデルを使った情報提供方法をコンピュータで実行させるためのプログラムを記録したコンピュータ読み取り可能な非一過性の記録媒体であって、
前記情報提供方法は、
学習モデル生成に関連した複数のアイテムに関する情報を示す複数の文字列を含む第１セットの文字列を確認する段階と、
前記第１セットの文字列に基づいて少なくとも一つの学習モデルを生成する段階と、
情報分類対象に関連した複数のアイテムに関する情報を示す複数の文字列を含む第２セットの文字列を確認する段階と、
前記少なくとも一つの学習モデルを使って、前記第２セットの文字列の少なくとも一部それぞれに対する基準品名情報および属性情報を確認する段階と、を含む、非一過性の記録媒体。