JP2021114082A

JP2021114082A - 情報処理装置および情報処理方法

Info

Publication number: JP2021114082A
Application number: JP2020005937A
Authority: JP
Inventors: 悠希武田; Yuki Takeda
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2021-08-05
Also published as: WO2021145228A1

Abstract

【課題】単語データの収集に用いられるコンピュータ端末に適用できる、ユーザが所望するデータを効率良く収集する情報処理装置及び情報処理方法を提供する。【解決手段】情報処理装置１００の制御部１４０は、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、候補データの中からユーザによりラベルの付与対象として選択された選択データを用いて学習した学習モデルに基づいて、さらなる候補データを出力する。【選択図】図３

Description

本技術は、情報処理装置および情報処理方法に関し、特に、ユーザが所望するデータを効率良く収集することができるようにした情報処理装置および情報処理方法に関する。

語彙間の関係性を推測する技術が知られている。

例えば、特許文献１には、既存の語彙間関係性データを用いた機械学習により、処理対象とする複数の語彙間の関係性を定義する語彙間関係性推測装置が開示されている。この技術は、関連性の強い互いに類似するデータを収集するといったタスクにも応用することができる。

特開２０１９−１４９０９７号公報

しかしながら、特許文献１の技術では、処理対象とする語彙間の関係性は、既存の語彙間関係性データにより一意に定まってしまう。したがって、例えば、ユーザがアプリケーション毎にデータ間の関係性を設定するなど、ユーザの要求に応じたデータを収集することはできなかった。

本技術は、このような状況に鑑みてなされたものであり、ユーザが所望するデータを効率良く収集することができるようにするものである。

本技術の情報処理装置は、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力する制御部を備え、前記制御部は、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する情報処理装置である。

本技術の情報処理方法は、情報処理装置が、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する情報処理方法である。

本技術においては、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データが出力され、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データが出力される。

単語データの例を示す図である。音声エージェントに応じた単語データの違いについて説明する図である。本技術を適用した情報処理装置の機能構成例を示すブロック図である。学習部の処理概要を示す図である。単語データ収集処理の流れについて説明するフローチャートである。候補データの提示例を示す図である。候補データの提示例を示す図である。候補データの提示例を示す図である。単語データ収集処理の流れについて説明するフローチャートである。学習モデル毎の重み付けについて説明する図である。情報処理装置の他の機能構成例を示すブロック図である。単語データ収集処理の流れについて説明するフローチャートである。単語の翻訳の例を示す図である。単語データへのラベル付与の変形例について説明する図である。クラウドサーバの機能構成例を示すブロック図である。コンピュータの構成例を示すブロック図である。

以下、本技術を実施するための形態（以下、実施の形態とする）について説明する。なお、説明は以下の順序で行う。

１．従来技術の問題点
２．第１の実施の形態（候補データの出力と提示）
３．第２の実施の形態（学習モデル毎の重み付け）
４．第３の実施の形態（多言語の単語データの収集）
５．変形例
６．クラウドコンピューティングへの適用
７．コンピュータの構成

＜１．従来技術の問題点＞
図１に示されるように、本技術において扱われる単語データは、「猫」−「Animal」、「リンゴ」−「Fruit」、「お祭り」−「Event」などのように、「単語」と、その単語が属する概念を表す「ラベル」のペアで記述される。

ユーザの発話に対して応答を提示する音声エージェント（スマートスピーカなどともいわれる）を作成する際、図１に示されるような単語データは不可欠である。しかしながら、このような単語データを収集するには、多くの時間とコストがかかってしまう。

ここでいう単語データの収集は、何らかの手法で集めてきた多数の単語に、それぞれの単語が属する概念のラベルを付与することをいう。単語データの収集を自動化するには、所定の単語が与えられたときに、その単語が属する概念を推測し、該当するラベルを付与するアルゴリズムが必要となる。

しかしながら、作成したい音声エージェントの種類によっては、必要となる単語データの構造が異なる場合がある。例えば、図２に示されるように、料理支援を行う音声エージェント１１を作成する際、「魚」という単語には、「食材」のラベルを付与するべきである。一方で、水族館での案内を行う音声エージェント１２を作成する際、「魚」という単語には、「生き物」のラベルを付与するべきである。

単語データの収集において、辞書のような既存のデータベースを用いた場合、図２のようにして、柔軟にラベルを付与することはできなかった。その結果、ユーザの要求に応じた単語データを収集することはできなかった。

そこで、本技術においては、ユーザにより入力された入力データに近い候補データを出力し、その候補データの中からユーザにより選択された選択データを用いた学習により、さらなる候補データを出力することで、ユーザが所望するデータを効率良く収集できるようにする。

＜２．第１の実施の形態（候補データの出力と提示）＞
（情報処理装置の構成）
図３は、本技術を適用した情報処理装置の構成例を示すブロック図である。

図３の情報処理装置１００は、ユーザが操作するＰＣ（Personal Computer）やタブレット端末、スマートフォンなどのコンピュータ端末で構成される。

情報処理装置１００は、入力部１１０、提示部１２０、記憶部１３０、および制御部１４０から構成される。

入力部１１０は、ボタンやキーボード、マウス、マイクロフォンなどで構成され、ユーザの操作を受け付ける。ユーザの操作に応じた入力情報は、制御部１４０に入力される。

提示部１２０は、有機ＥＬ（Electro-Luminescence）ディスプレイや液晶ディスプレイ、スピーカなどで構成され、制御部１４０により出力されたデータなどを提示する。入力部１１０は、提示部１２０としてのディスプレイと一体で形成されるタッチパネルで構成されてもよい。

記憶部１３０は、フラッシュメモリなどの不揮発性メモリなどにより構成され、制御部１４０に読み出されるプログラムや各種のデータを記憶している。

制御部１４０は、ＣＰＵ（Central Processing Unit）などのプロセッサやメモリなどで構成される。制御部１４０は、学習部１４１を備えている。学習部１４１は、制御部１４０を構成するＣＰＵにより、記憶部１３０から読み出された所定のプログラムが実行されることによって実現される。

（学習部の処理概要）
ここで、図４を参照して、学習部１４１の処理概要について説明する。

例えば、ユーザが果物に属する単語データを収集する場合、既存の単語データリストから、「Fruit」のラベルが付与された所定数の単語データＰ１が、学習データとして学習モデル１４１ａに入力される。単語データＰ１の入力は、入力部１１０により受け付けられる。

このとき、既存の単語データリストからは、果物に属さない単語データとして、「Animal」のラベルが付与された単語データＮ１や、「Vegetable」のラベルが付与された単語データＮ２などが、単語データＰ１と同数だけランダムに抽出される。単語データＮ１や単語データＮ２もまた、学習データとして学習モデル１４１ａに入力される。

学習部１４１は、例えばｗｏｒｄ２ｖｅｃなどのアルゴリズムを用いて単語埋め込みをする（単語をベクトルに変換する）学習モデル１４１ａを、単語データＰ１を正例として、単語データＮ１や単語データＮ２を負例として学習させる。

学習部１４１は、学習モデル１４１ａの学習結果である特徴量（各単語のベクトル）に基づいて、二値分類器１４１ｂを用いて、語彙データベースＶＤＢから抽出されたラベル無し単語データＷＤを分類する。正例側に分類されたラベル無し単語データＷＤは、候補データＣＤとして提示部１２０に出力され、提示部１２０により提示される。候補データＣＤは、単語データＰ１に近いベクトルを有する単語データとなる。

図４の例では、ラベル無し単語データＷＤとして「キウイ」、「政治家」、「ドリアン」、「トマト」、・・・が分類対象とされ、正例側に分類された「キウイ」、「ドリアン」、「トマト」、・・・が候補データＣＤとして出力され、提示される。

学習部１４１は、提示部１２０により提示された候補データＣＤの中からユーザにより選択された選択データＳＤを、正例の学習データとして学習モデル１４１ａに入力させる。

図４の例では、選択データＳＤとして「キウイ」、「ドリアン」、・・・が選択されている。このとき、候補データＣＤの中からユーザにより選択されなかった非選択データは、負例の学習データとして学習モデル１４１ａに入力される。特に、一般的に「トマト」は、果物であるか野菜であるかの明確な定義がないが、この例では、ユーザの要求により「トマト」は果物ではないことが選択されている。

学習部１４１は、ユーザの指示があるまで、以上の処理を繰り返す。

このように、学習部１４１は、学習モデルを用いて、入力部１１０から供給される入力データ（単語データ）を学習し、入力データに近い候補データ（ラベル無し単語データ）を提示部１２０に出力する。また、学習部１４１は、提示部１２０に提示された候補データの中からユーザにより選択された候補データを用いて再度学習し、新たな候補データを提示部１２０に出力する。

（単語データ収集処理の流れ）
次に、図５のフローチャートを参照して、情報処理装置１００による単語データ収集処理の流れについて説明する。

ステップＳ１１において、入力部１１０は、ユーザが収集を所望する属性のラベルが付与された単語データの入力を受け付ける。

ステップＳ１２において、制御部１４０（学習部１４１）は、入力データを用いて学習させた学習モデルに基づいて、入力された単語データと同じラベルを付与する候補となる候補データを、提示部１２０に出力する。

ステップＳ１３において、提示部１２０は、制御部１４０から出力された候補データを提示する。

ステップＳ１４において、制御部１４０は、入力部１１０に対するユーザの操作により、単語データの収集を終了する旨の指示が受け付けられたか否かを判定する。

入力部１１０において、単語データの収集を終了する旨の指示ではなく、提示部１２０によって提示された候補データの中から、ユーザによりラベルの付与対象として、所定の候補データの選択が受け付けられた場合、処理はステップＳ１５に進む。

ステップＳ１５において、制御部１４０（学習部１４１）は、選択された候補データである選択データを正例に、選択されなかった候補データである非選択データを負例に加える。

ステップＳ１６において、制御部１４０（学習部１４１）は、選択データを正例として、非選択データを負例として、学習モデルを学習させる。その後、処理はステップＳ１２に戻り、以降の処理が繰り返される。

図６乃至図８は、提示部１２０における候補データの提示例を示す図である。

図６乃至図８に示される画面には、単語データ入力領域１５１、送信ボタン１５２、および、候補データ表示領域１５３−１，１５３−２，１５３−３，・・・が設けられる。

単語データ入力領域１５１には、ユーザが収集を所望する属性のラベルが付与された単語データ（正例の学習データ）が入力される。図６の例では、単語データ入力領域１５１に、単語データとして、例えば「菓子」のラベルが付与された「ケーキ」、「プリン」、および「クッキー」が入力されている。

単語データ入力領域１５１に単語データが入力された状態で、送信ボタン１５２が操作されると、候補データ表示領域１５３−１，１５３−２，１５３−３，・・・には、候補データ１６１と選択ボタン１６２Ｐ，１６２Ｎが表示される。選択ボタン１６２Ｐは、候補データ１６１を選択データ（正例の学習データ）とするためのボタンである。一方、選択ボタン１６２Ｎは、候補データ１６１を非選択データ（負例の学習データ）とするためのボタンである。

図６の例では、候補データ表示領域１５３−１，１５３−２，１５３−３それぞれに、「菓子」のラベルを付与する候補となる候補データ１６１として「チョコレート」、「ラムネ」、「カレー」が表示されている。なお、候補データ１６１それぞれの右側には、二値分類のスコアが示されている。このスコアが１．０に近いほど、対応する候補データ１６１が正例側に分類されていることを示している。

図７の例では、図６の状態から、候補データ表示領域１５３−１，１５３−２，１５３−３それぞれにおいて、選択ボタン１６２Ｐ，１６２Ｎのいずれかが選択されている。

具体的には、候補データ表示領域１５３−１においては、候補データ１６１の「チョコレート」を選択データとする選択ボタン１６２Ｐが選択され、候補データ表示領域１５３−２においては、候補データ１６１の「ラムネ」を選択データとする選択ボタン１６２Ｐが選択されている。また、候補データ表示領域１５３−３においては、候補データ１６１の「カレー」を非選択データとする選択ボタン１６２Ｎが選択されている。

図７の状態で、送信ボタン１５２が操作されることで、「チョコレート」と「ラムネ」には、「菓子」のラベルが付与される。

その後、図８に示されるように、単語データ入力領域１５１には、図６の状態で入力された「ケーキ」、「プリン」、および「クッキー」に加え、新たに「菓子」のラベルが付与された「チョコレート」と「ラムネ」が入力される。

この状態で、送信ボタン１５２が操作されると、候補データ表示領域１５３−１，１５３−２，１５３−３それぞれには、「菓子」のラベルを付与するさらなる候補データ１６１として、「チーズ」、「アーモンド」、「パン」が表示される。

このようにして、提示された候補データの選択と、選択データを用いた学習による候補データの提示が繰り返される。

さて、図５のフローチャートに戻り、ステップＳ１４において、ユーザが満足できる量の単語データが収集されたと判断するなどして、単語データの収集を終了する旨の指示が受け付けられたと判定されると、処理は終了する。ラベルが付与された選択データ、すなわち、収集された単語データは、例えば記憶部１３０に記憶される。

以上の処理によれば、ユーザにより入力された単語データに近い候補データが提示され、候補データの中から選択された選択データを用いた学習により、さらなる候補データが提示される。これにより、ユーザの要求に応じた精度の高い単語データの提案が可能となり、ユーザが所望するデータを効率良く収集することが可能となる。

また、学習モデルの学習において、高速なアルゴリズムを用いるようにすることで、単語データの出力に要する時間を短縮することができる。これにより、ユーザにストレスを与えることなく、インタラクティブな学習により単語データの提案の精度を高めることが可能となる。

＜３．第２の実施の形態（学習モデル毎の重み付け）＞
作成したい音声エージェントの種類によっては、どのような文脈での単語データを収集すべきかが異なる場合がある。例えば、ニュースを紹介する音声エージェントを作成する場合には、ニュースに用いられる堅い表現の単語を多く扱いたい一方、フレンドリーな会話相手となる音声エージェントを作成する際には、流行語や砕けた表現の単語を多く扱いたい。

そこで、新聞記事の内容から学習したｗｏｒｄ２ｖｅｃモデルや、ＳＮＳ（Social Networking Service）投稿の内容から学習したｗｏｒｄ２ｖｅｃモデルなど、あらかじめ複数の学習モデルを用意し、学習モデル毎に候補データを提示する例について説明する。

（単語データ収集処理の流れ）
図９のフローチャートを参照して、複数の学習モデルを用いた単語データ収集処理の流れについて説明する。

なお、図９のフローチャートにおけるステップＳ２１，Ｓ２３乃至Ｓ２６の処理は、図５のフローチャートにおけるステップＳ１１，Ｓ１３乃至Ｓ１６の処理と基本的に同様であるので、その説明は省略する。

すなわち、ステップＳ２２において、制御部１４０（学習部１４１）は、あらかじめ用意された複数の学習モデルに基づいて、学習モデル毎に、入力された単語データと同じラベルを付与する候補となる候補データを、提示部１２０に出力する。このとき、学習モデル毎に同一数の候補データが出力される。

その後、提示部１２０によって提示された候補データの中から所定の候補データが選択される。そして、ステップＳ２７において、制御部１４０（学習部１４１）は、選択された候補データ（選択データ）に応じて、学習モデル毎に出力される候補データの数の重み付けを変更する。その後、処理はステップＳ２２に戻り、以降の処理が繰り返される。

図１０は、学習モデル毎の候補データの数の重み付けについて説明する図である。

図１０の例では、新聞記事の内容から学習したｗｏｒｄ２ｖｅｃモデル２１０と、ＳＮＳ投稿の内容から学習したｗｏｒｄ２ｖｅｃモデル２２０が用意されている。

まず、図１０のＡ図に示されるように、ｗｏｒｄ２ｖｅｃモデル２１０，２２０それぞれからは同一数（例えば５つ）の候補データ２３１が出力される。

Ａ図の例では、ｗｏｒｄ２ｖｅｃモデル２１０から出力された５つの候補データ２３１のうちの４つが選択データとして選択され、ｗｏｒｄ２ｖｅｃモデル２２０から出力された５つの候補データ２３１のうちの１つが選択データとして選択されている。

この場合、ユーザは、新聞記事に用いられる堅い表現の単語データの収集を所望していることが推測される。

その結果、ｗｏｒｄ２ｖｅｃモデル２１０，２２０それぞれから出力される候補データの数の重み付けが変更される。具体的には、選択データがより多く出力されたｗｏｒｄ２ｖｅｃモデルについて、より多くの候補データが出力されるように重み付けが変更される。

例えば、図１０のＢ図に示されるように、ｗｏｒｄ２ｖｅｃモデル２１０からは７つの候補データ２３２が出力され、ｗｏｒｄ２ｖｅｃモデル２２０からは３つの候補データ２３２が出力されるようになる。

以上の処理によれば、ユーザにより選択された選択データに応じて、学習モデル毎に出力される候補データの数の重み付けが変更されるので、ユーザが所望する文脈での単語データを収集することが可能となる。

＜４．第３の実施の形態（多言語の単語データの収集）＞
多言語に対応する音声エージェントを開発する場合、単語データも対応する言語の数だけ用意する必要がある。これは、音声エージェントの開発者にとって負担となる。

そこで、上述した機能により１つの言語（例えば日本語）の単語データを収集した後、これらの単語データを自動的に各言語に翻訳する例について説明する。

（情報処理装置の構成）
図１１は、本実施の形態の情報処理装置の構成例を示すブロック図である。

図１１の情報処理装置１００は、制御部１４０が、学習部１４１に加え、翻訳処理部３１１を備えている点で、図３の情報処理装置１００と異なる。

翻訳処理部３１１は、ユーザにより入力された入力データ（単語データ）と、入力データと同じラベルが付与された候補データ（選択データ）とを、所定の言語に翻訳する。言語の翻訳は、例えば記憶部１３０に記憶されている、対応する言語の辞書を用いるなどして行われる。

（単語データ収集処理の流れ）
次に、図１２のフローチャートを参照して、収集された単語データを所定の言語に翻訳する単語データ収集処理の流れについて説明する。

なお、図１２のフローチャートにおけるステップＳ３１乃至Ｓ３６の処理は、図５のフローチャートにおけるステップＳ１１乃至Ｓ１６の処理と基本的に同様であるので、その説明は省略する。

すなわち、ステップＳ３４において、単語データの収集を終了する旨の指示が受け付けられたと判定された後、ステップＳ３７において、翻訳処理部３１１は、正例の単語データ（すなわち、入力データと選択データ）を、所定の言語に翻訳する。

例えば、図１３に示されるように、正例の単語データとして、果物に属する単語データ３３０が収集された場合、その単語データ３３０は、中国語の単語データ３３０Ｃ、英語の単語データ３３０Ｅ、ロシア語の単語データ３３０Ｒにそれぞれ翻訳される。

以上の処理によれば、多言語の単語データの収集の工数を短縮することができ、多言語に対応する音声エージェントの開発にかかるコストや時間を削減することが可能となる。

＜５．変形例＞
以下では、上述した実施の形態の変形例について説明する。

（提示の例）
上述した実施の形態では、ユーザが、図６乃至図８に示されるような画面において単語データを選択することで、その単語データにラベルが付与されるものとした。

これに限らず、図１４に示されるような、クイズゲームを提供する画面３５０において単語データを選択させ、その単語データにラベルが付与されるようにしてもよい。

図１４の画面３５０上部には、ユーザが収集を所望する属性の単語、具体的には、果物に属する単語を選択させる質問文が表示されている。その質問文の下方には、その属性（果物）の単語の候補となる「ドリアン」、「トマト」、「テーブル」、「椅子」を選択するためのボタン３６１乃至３６４が表示されている。

ユーザが、「果物はどれですか？」という質問文に回答するように、果物であると考える単語のボタンを選択することで、選択された単語には、果物のラベルが付与される。

このようなクイズゲームを、より多くのプレーヤに提供することで、ユーザが所望するデータを効率良く収集することが可能となる。

（入力データの例）
上述した実施の形態では、入力データとして単語データが入力されるものとしたが、その他の形式のデータが入力されるようにしてもよい。

具体的には、入力データとして画像データが入力されるようにしてもよい。この場合、候補データとして、入力された画像データと同じラベルを付与する候補となる画像データが提示され、その中から選択された画像データを用いた学習により、さらなる画像データが提示される。

これにより、入力された画像データに近い画像データを効率良く収集することができ、例えば、類似画像検索の精度を向上させることが可能となる。

また、入力データとして、各種のセンサから得られるセンサデータが入力されるようにもできる。

例えば、入力データとして、加速度センサから得られる加速度データや、ジャイロセンサから得られる角加速度データが入力されるようにしてもよい。この場合、候補データとして、入力されたセンサデータと同じラベルを付与するセンサデータが、例えばＶＲ（Virtual Reality）ゴーグルにおける加速や回転として提示されるようにする。その中から選択されたセンサデータを用いた学習により、さらなるセンサデータが提示される。

これにより、入力されたセンサデータに近い加速や回転を実現するセンサデータを効率良く収集することができ、例えば、ＶＲ体験における没入感を高めることが可能となる。

＜６．クラウドコンピューティングへの適用＞
本技術は、クラウドコンピューティングへ適用することもできる。

図１５は、本技術をクラウドコンピューティングへ適用した情報処理システムの機能構成例を示すブロック図である。

図１５の情報処理システムは、端末装置４００とクラウドサーバ５００により構成される。端末装置４００とクラウドサーバ５００とは、例えばインターネットなどのネットワークＮＷにより接続され、互いに通信可能とされる。

端末装置４００は、ユーザが操作するＰＣやタブレット端末、スマートフォンなどのコンピュータ端末で構成され、入力部４１０と提示部４２０を少なくとも備える。入力部４１０と提示部４２０は、それぞれ、図３の入力部１１０と提示部１２０に対応する。

一方、クラウドサーバ５００は、大型のコンピュータ装置で構成され、記憶部５１０と制御部５２０を少なくとも備える。制御部５２０は、学習部５２１を備えている。記憶部５１０、制御部５２０、および学習部５２１は、それぞれ、図３の記憶部１３０、制御部１４０、および学習部１４１に対応する。記憶部５１０は、クラウドサーバ５００とは別に構成されるデータベースサーバなどに設けられてもよい。

図１５の情報処理システムにおいて、端末装置４００は、入力データをクラウドサーバ５００に送信する。

クラウドサーバ５００は、学習モデルに基づいて、端末装置４００からの入力データと同じラベルを付与する候補となる候補データを、端末装置４００に送信する。

端末装置４００は、候補データを提示し、その中のいずれかがユーザによりラベルの付与対象として選択される。選択された候補データ（選択データ）は、クラウドサーバ５００に送信される。

クラウドサーバ５００は、端末装置４００において選択された候補データ（選択データ）を用いて学習した学習モデルに基づいて、さらなる候補データを端末装置４００に送信する。

このような構成においても、ユーザの要求に応じた精度の高い単語データの提案が可能となり、ユーザが所望するデータを効率良く収集することが可能となる。

＜７．コンピュータの構成＞
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

図１６は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

上述した情報処理装置１００およびクラウドサーバ５００は、図１６に示す構成を有するコンピュータ１０００により実現される。

ＣＰＵ１００１、ＲＯＭ１００２、ＲＡＭ１００３は、バス１００４により相互に接続されている。

バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、キーボード、マウスなどよりなる入力部１００６、ディス
プレイ、スピーカなどよりなる出力部１００７が接続される。また、入出力インタフェース１００５には、ハードディスクや不揮発性のメモリなどよりなる記憶部１００８、ネットワークインタフェースなどよりなる通信部１００９、リムーバブルメディア１０１１を駆動するドライブ１０１０が接続される。

以上のように構成されるコンピュータ１０００では、ＣＰＵ１００１が、例えば、記憶部１００８に記憶されているプログラムを入出力インタフェース１００５およびバス１００４を介してＲＡＭ１００３にロードして実行することにより、上述した一連の処理が行われる。

ＣＰＵ１００１が実行するプログラムは、例えばリムーバブルメディア１０１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部１００８にインストールされる。

なお、コンピュータ１０００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたときなどの必要なタイミングで処理が行われるプログラムであっても良い。

なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

さらに、本技術は以下のような構成をとることができる。
（１）
学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力する制御部
を備え、
前記制御部は、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
情報処理装置。
（２）
前記制御部は、前記選択データを正例として、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択されなかった非選択データを負例として、前記学習モデルを学習させる
（１）に記載の情報処理装置。
（３）
前記制御部は、複数の前記学習モデルに基づいて、前記学習モデル毎に前記候補データを出力する
（１）または（２）に記載の情報処理装置。
（４）
前記制御部は、
前記学習モデル毎に同一数の前記候補データを出力し、
前記ユーザにより選択された前記選択データに応じて、前記学習モデル毎に出力される前記候補データの数の重み付けを変更する
（３）に記載の情報処理装置。
（５）
前記制御部は、前記選択データがより多く出力された前記学習モデルについて、より多くの前記候補データが出力されるように前記重み付けを変更する
（４）に記載の情報処理装置。
（６）
前記入力データは、単語データである
（１）乃至（５）のいずれかに記載の情報処理装置。
（７）
前記学習モデルは、ｗｏｒｄ２ｖｅｃモデルである
（６）に記載の情報処理装置。
（８）
前記入力データと前記ラベルが付与された前記選択データとを、所定の言語に翻訳する翻訳処理部をさらに備える
（６）または（７）に記載の情報処理装置。
（９）
前記入力データは、画像データである
（１）に記載の情報処理装置。
（１０）
前記入力データは、センサデータである
（１）に記載の情報処理装置。
（１１）
前記センサデータは、加速度データである
（１０）に記載の情報処理装置。
（１２）
前記センサデータは、角加速度データである
（１０）に記載の情報処理装置。
（１３）
出力された前記候補データを前記ユーザに提示する提示部と、
提示された前記候補データの中から前記選択データの選択を受け付ける入力部とをさらに備える
（１）乃至（１２）のいずれかに記載の情報処理装置。
（１４）
情報処理装置が、
学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、
前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
情報処理方法。

１００情報処理装置，１１０入力部，１２０提示部，１３０記憶部，１４０制御部，１４１学習部，３１１翻訳処理部，５００クラウドサーバ

Claims

学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力する制御部
を備え、
前記制御部は、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
情報処理装置。
前記制御部は、前記選択データを正例として、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択されなかった非選択データを負例として、前記学習モデルを学習させる
請求項１に記載の情報処理装置。
前記制御部は、複数の前記学習モデルに基づいて、前記学習モデル毎に前記候補データを出力する
請求項１に記載の情報処理装置。
前記制御部は、
前記学習モデル毎に同一数の前記候補データを出力し、
前記ユーザにより選択された前記選択データに応じて、前記学習モデル毎に出力される前記候補データの数の重み付けを変更する
請求項３に記載の情報処理装置。
前記制御部は、前記選択データがより多く出力された前記学習モデルについて、より多くの前記候補データが出力されるように前記重み付けを変更する
請求項４に記載の情報処理装置。
前記入力データは、単語データである
請求項１に記載の情報処理装置。
前記学習モデルは、ｗｏｒｄ２ｖｅｃモデルである
請求項６に記載の情報処理装置。
前記入力データと前記ラベルが付与された前記選択データとを、所定の言語に翻訳する翻訳処理部をさらに備える
請求項６に記載の情報処理装置。
前記入力データは、画像データである
請求項１に記載の情報処理装置。
前記入力データは、センサデータである
請求項１に記載の情報処理装置。
前記センサデータは、加速度データである
請求項１０に記載の情報処理装置。
前記センサデータは、角加速度データである
請求項１０に記載の情報処理装置。
出力された前記候補データを前記ユーザに提示する提示部と、
提示された前記候補データの中から前記選択データの選択を受け付ける入力部とをさらに備える
請求項１に記載の情報処理装置。
情報処理装置が、
学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、
前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
情報処理方法。