JP2021114082A - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JP2021114082A
JP2021114082A JP2020005937A JP2020005937A JP2021114082A JP 2021114082 A JP2021114082 A JP 2021114082A JP 2020005937 A JP2020005937 A JP 2020005937A JP 2020005937 A JP2020005937 A JP 2020005937A JP 2021114082 A JP2021114082 A JP 2021114082A
Authority
JP
Japan
Prior art keywords
data
information processing
candidate
input
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020005937A
Other languages
English (en)
Inventor
悠希 武田
Yuki Takeda
悠希 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Priority to JP2020005937A priority Critical patent/JP2021114082A/ja
Priority to PCT/JP2021/000017 priority patent/WO2021145228A1/ja
Publication of JP2021114082A publication Critical patent/JP2021114082A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】単語データの収集に用いられるコンピュータ端末に適用できる、ユーザが所望するデータを効率良く収集する情報処理装置及び情報処理方法を提供する。【解決手段】情報処理装置100の制御部140は、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、候補データの中からユーザによりラベルの付与対象として選択された選択データを用いて学習した学習モデルに基づいて、さらなる候補データを出力する。【選択図】図3

Description

本技術は、情報処理装置および情報処理方法に関し、特に、ユーザが所望するデータを効率良く収集することができるようにした情報処理装置および情報処理方法に関する。
語彙間の関係性を推測する技術が知られている。
例えば、特許文献1には、既存の語彙間関係性データを用いた機械学習により、処理対象とする複数の語彙間の関係性を定義する語彙間関係性推測装置が開示されている。この技術は、関連性の強い互いに類似するデータを収集するといったタスクにも応用することができる。
特開2019−149097号公報
しかしながら、特許文献1の技術では、処理対象とする語彙間の関係性は、既存の語彙間関係性データにより一意に定まってしまう。したがって、例えば、ユーザがアプリケーション毎にデータ間の関係性を設定するなど、ユーザの要求に応じたデータを収集することはできなかった。
本技術は、このような状況に鑑みてなされたものであり、ユーザが所望するデータを効率良く収集することができるようにするものである。
本技術の情報処理装置は、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力する制御部を備え、前記制御部は、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する情報処理装置である。
本技術の情報処理方法は、情報処理装置が、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する情報処理方法である。
本技術においては、学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データが出力され、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データが出力される。
単語データの例を示す図である。 音声エージェントに応じた単語データの違いについて説明する図である。 本技術を適用した情報処理装置の機能構成例を示すブロック図である。 学習部の処理概要を示す図である。 単語データ収集処理の流れについて説明するフローチャートである。 候補データの提示例を示す図である。 候補データの提示例を示す図である。 候補データの提示例を示す図である。 単語データ収集処理の流れについて説明するフローチャートである。 学習モデル毎の重み付けについて説明する図である。 情報処理装置の他の機能構成例を示すブロック図である。 単語データ収集処理の流れについて説明するフローチャートである。 単語の翻訳の例を示す図である。 単語データへのラベル付与の変形例について説明する図である。 クラウドサーバの機能構成例を示すブロック図である。 コンピュータの構成例を示すブロック図である。
以下、本技術を実施するための形態(以下、実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.従来技術の問題点
2.第1の実施の形態(候補データの出力と提示)
3.第2の実施の形態(学習モデル毎の重み付け)
4.第3の実施の形態(多言語の単語データの収集)
5.変形例
6.クラウドコンピューティングへの適用
7.コンピュータの構成
<1.従来技術の問題点>
図1に示されるように、本技術において扱われる単語データは、「猫」−「Animal」、「リンゴ」−「Fruit」、「お祭り」−「Event」などのように、「単語」と、その単語が属する概念を表す「ラベル」のペアで記述される。
ユーザの発話に対して応答を提示する音声エージェント(スマートスピーカなどともいわれる)を作成する際、図1に示されるような単語データは不可欠である。しかしながら、このような単語データを収集するには、多くの時間とコストがかかってしまう。
ここでいう単語データの収集は、何らかの手法で集めてきた多数の単語に、それぞれの単語が属する概念のラベルを付与することをいう。単語データの収集を自動化するには、所定の単語が与えられたときに、その単語が属する概念を推測し、該当するラベルを付与するアルゴリズムが必要となる。
しかしながら、作成したい音声エージェントの種類によっては、必要となる単語データの構造が異なる場合がある。例えば、図2に示されるように、料理支援を行う音声エージェント11を作成する際、「魚」という単語には、「食材」のラベルを付与するべきである。一方で、水族館での案内を行う音声エージェント12を作成する際、「魚」という単語には、「生き物」のラベルを付与するべきである。
単語データの収集において、辞書のような既存のデータベースを用いた場合、図2のようにして、柔軟にラベルを付与することはできなかった。その結果、ユーザの要求に応じた単語データを収集することはできなかった。
そこで、本技術においては、ユーザにより入力された入力データに近い候補データを出力し、その候補データの中からユーザにより選択された選択データを用いた学習により、さらなる候補データを出力することで、ユーザが所望するデータを効率良く収集できるようにする。
<2.第1の実施の形態(候補データの出力と提示)>
(情報処理装置の構成)
図3は、本技術を適用した情報処理装置の構成例を示すブロック図である。
図3の情報処理装置100は、ユーザが操作するPC(Personal Computer)やタブレット端末、スマートフォンなどのコンピュータ端末で構成される。
情報処理装置100は、入力部110、提示部120、記憶部130、および制御部140から構成される。
入力部110は、ボタンやキーボード、マウス、マイクロフォンなどで構成され、ユーザの操作を受け付ける。ユーザの操作に応じた入力情報は、制御部140に入力される。
提示部120は、有機EL(Electro-Luminescence)ディスプレイや液晶ディスプレイ、スピーカなどで構成され、制御部140により出力されたデータなどを提示する。入力部110は、提示部120としてのディスプレイと一体で形成されるタッチパネルで構成されてもよい。
記憶部130は、フラッシュメモリなどの不揮発性メモリなどにより構成され、制御部140に読み出されるプログラムや各種のデータを記憶している。
制御部140は、CPU(Central Processing Unit)などのプロセッサやメモリなどで構成される。制御部140は、学習部141を備えている。学習部141は、制御部140を構成するCPUにより、記憶部130から読み出された所定のプログラムが実行されることによって実現される。
(学習部の処理概要)
ここで、図4を参照して、学習部141の処理概要について説明する。
例えば、ユーザが果物に属する単語データを収集する場合、既存の単語データリストから、「Fruit」のラベルが付与された所定数の単語データP1が、学習データとして学習モデル141aに入力される。単語データP1の入力は、入力部110により受け付けられる。
このとき、既存の単語データリストからは、果物に属さない単語データとして、「Animal」のラベルが付与された単語データN1や、「Vegetable」のラベルが付与された単語データN2などが、単語データP1と同数だけランダムに抽出される。単語データN1や単語データN2もまた、学習データとして学習モデル141aに入力される。
学習部141は、例えばword2vecなどのアルゴリズムを用いて単語埋め込みをする(単語をベクトルに変換する)学習モデル141aを、単語データP1を正例として、単語データN1や単語データN2を負例として学習させる。
学習部141は、学習モデル141aの学習結果である特徴量(各単語のベクトル)に基づいて、二値分類器141bを用いて、語彙データベースVDBから抽出されたラベル無し単語データWDを分類する。正例側に分類されたラベル無し単語データWDは、候補データCDとして提示部120に出力され、提示部120により提示される。候補データCDは、単語データP1に近いベクトルを有する単語データとなる。
図4の例では、ラベル無し単語データWDとして「キウイ」、「政治家」、「ドリアン」、「トマト」、・・・が分類対象とされ、正例側に分類された「キウイ」、「ドリアン」、「トマト」、・・・が候補データCDとして出力され、提示される。
学習部141は、提示部120により提示された候補データCDの中からユーザにより選択された選択データSDを、正例の学習データとして学習モデル141aに入力させる。
図4の例では、選択データSDとして「キウイ」、「ドリアン」、・・・が選択されている。このとき、候補データCDの中からユーザにより選択されなかった非選択データは、負例の学習データとして学習モデル141aに入力される。特に、一般的に「トマト」は、果物であるか野菜であるかの明確な定義がないが、この例では、ユーザの要求により「トマト」は果物ではないことが選択されている。
学習部141は、ユーザの指示があるまで、以上の処理を繰り返す。
このように、学習部141は、学習モデルを用いて、入力部110から供給される入力データ(単語データ)を学習し、入力データに近い候補データ(ラベル無し単語データ)を提示部120に出力する。また、学習部141は、提示部120に提示された候補データの中からユーザにより選択された候補データを用いて再度学習し、新たな候補データを提示部120に出力する。
(単語データ収集処理の流れ)
次に、図5のフローチャートを参照して、情報処理装置100による単語データ収集処理の流れについて説明する。
ステップS11において、入力部110は、ユーザが収集を所望する属性のラベルが付与された単語データの入力を受け付ける。
ステップS12において、制御部140(学習部141)は、入力データを用いて学習させた学習モデルに基づいて、入力された単語データと同じラベルを付与する候補となる候補データを、提示部120に出力する。
ステップS13において、提示部120は、制御部140から出力された候補データを提示する。
ステップS14において、制御部140は、入力部110に対するユーザの操作により、単語データの収集を終了する旨の指示が受け付けられたか否かを判定する。
入力部110において、単語データの収集を終了する旨の指示ではなく、提示部120によって提示された候補データの中から、ユーザによりラベルの付与対象として、所定の候補データの選択が受け付けられた場合、処理はステップS15に進む。
ステップS15において、制御部140(学習部141)は、選択された候補データである選択データを正例に、選択されなかった候補データである非選択データを負例に加える。
ステップS16において、制御部140(学習部141)は、選択データを正例として、非選択データを負例として、学習モデルを学習させる。その後、処理はステップS12に戻り、以降の処理が繰り返される。
図6乃至図8は、提示部120における候補データの提示例を示す図である。
図6乃至図8に示される画面には、単語データ入力領域151、送信ボタン152、および、候補データ表示領域153−1,153−2,153−3,・・・が設けられる。
単語データ入力領域151には、ユーザが収集を所望する属性のラベルが付与された単語データ(正例の学習データ)が入力される。図6の例では、単語データ入力領域151に、単語データとして、例えば「菓子」のラベルが付与された「ケーキ」、「プリン」、および「クッキー」が入力されている。
単語データ入力領域151に単語データが入力された状態で、送信ボタン152が操作されると、候補データ表示領域153−1,153−2,153−3,・・・には、候補データ161と選択ボタン162P,162Nが表示される。選択ボタン162Pは、候補データ161を選択データ(正例の学習データ)とするためのボタンである。一方、選択ボタン162Nは、候補データ161を非選択データ(負例の学習データ)とするためのボタンである。
図6の例では、候補データ表示領域153−1,153−2,153−3それぞれに、「菓子」のラベルを付与する候補となる候補データ161として「チョコレート」、「ラムネ」、「カレー」が表示されている。なお、候補データ161それぞれの右側には、二値分類のスコアが示されている。このスコアが1.0に近いほど、対応する候補データ161が正例側に分類されていることを示している。
図7の例では、図6の状態から、候補データ表示領域153−1,153−2,153−3それぞれにおいて、選択ボタン162P,162Nのいずれかが選択されている。
具体的には、候補データ表示領域153−1においては、候補データ161の「チョコレート」を選択データとする選択ボタン162Pが選択され、候補データ表示領域153−2においては、候補データ161の「ラムネ」を選択データとする選択ボタン162Pが選択されている。また、候補データ表示領域153−3においては、候補データ161の「カレー」を非選択データとする選択ボタン162Nが選択されている。
図7の状態で、送信ボタン152が操作されることで、「チョコレート」と「ラムネ」には、「菓子」のラベルが付与される。
その後、図8に示されるように、単語データ入力領域151には、図6の状態で入力された「ケーキ」、「プリン」、および「クッキー」に加え、新たに「菓子」のラベルが付与された「チョコレート」と「ラムネ」が入力される。
この状態で、送信ボタン152が操作されると、候補データ表示領域153−1,153−2,153−3それぞれには、「菓子」のラベルを付与するさらなる候補データ161として、「チーズ」、「アーモンド」、「パン」が表示される。
このようにして、提示された候補データの選択と、選択データを用いた学習による候補データの提示が繰り返される。
さて、図5のフローチャートに戻り、ステップS14において、ユーザが満足できる量の単語データが収集されたと判断するなどして、単語データの収集を終了する旨の指示が受け付けられたと判定されると、処理は終了する。ラベルが付与された選択データ、すなわち、収集された単語データは、例えば記憶部130に記憶される。
以上の処理によれば、ユーザにより入力された単語データに近い候補データが提示され、候補データの中から選択された選択データを用いた学習により、さらなる候補データが提示される。これにより、ユーザの要求に応じた精度の高い単語データの提案が可能となり、ユーザが所望するデータを効率良く収集することが可能となる。
また、学習モデルの学習において、高速なアルゴリズムを用いるようにすることで、単語データの出力に要する時間を短縮することができる。これにより、ユーザにストレスを与えることなく、インタラクティブな学習により単語データの提案の精度を高めることが可能となる。
<3.第2の実施の形態(学習モデル毎の重み付け)>
作成したい音声エージェントの種類によっては、どのような文脈での単語データを収集すべきかが異なる場合がある。例えば、ニュースを紹介する音声エージェントを作成する場合には、ニュースに用いられる堅い表現の単語を多く扱いたい一方、フレンドリーな会話相手となる音声エージェントを作成する際には、流行語や砕けた表現の単語を多く扱いたい。
そこで、新聞記事の内容から学習したword2vecモデルや、SNS(Social Networking Service)投稿の内容から学習したword2vecモデルなど、あらかじめ複数の学習モデルを用意し、学習モデル毎に候補データを提示する例について説明する。
(単語データ収集処理の流れ)
図9のフローチャートを参照して、複数の学習モデルを用いた単語データ収集処理の流れについて説明する。
なお、図9のフローチャートにおけるステップS21,S23乃至S26の処理は、図5のフローチャートにおけるステップS11,S13乃至S16の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS22において、制御部140(学習部141)は、あらかじめ用意された複数の学習モデルに基づいて、学習モデル毎に、入力された単語データと同じラベルを付与する候補となる候補データを、提示部120に出力する。このとき、学習モデル毎に同一数の候補データが出力される。
その後、提示部120によって提示された候補データの中から所定の候補データが選択される。そして、ステップS27において、制御部140(学習部141)は、選択された候補データ(選択データ)に応じて、学習モデル毎に出力される候補データの数の重み付けを変更する。その後、処理はステップS22に戻り、以降の処理が繰り返される。
図10は、学習モデル毎の候補データの数の重み付けについて説明する図である。
図10の例では、新聞記事の内容から学習したword2vecモデル210と、SNS投稿の内容から学習したword2vecモデル220が用意されている。
まず、図10のA図に示されるように、word2vecモデル210,220それぞれからは同一数(例えば5つ)の候補データ231が出力される。
A図の例では、word2vecモデル210から出力された5つの候補データ231のうちの4つが選択データとして選択され、word2vecモデル220から出力された5つの候補データ231のうちの1つが選択データとして選択されている。
この場合、ユーザは、新聞記事に用いられる堅い表現の単語データの収集を所望していることが推測される。
その結果、word2vecモデル210,220それぞれから出力される候補データの数の重み付けが変更される。具体的には、選択データがより多く出力されたword2vecモデルについて、より多くの候補データが出力されるように重み付けが変更される。
例えば、図10のB図に示されるように、word2vecモデル210からは7つの候補データ232が出力され、word2vecモデル220からは3つの候補データ232が出力されるようになる。
以上の処理によれば、ユーザにより選択された選択データに応じて、学習モデル毎に出力される候補データの数の重み付けが変更されるので、ユーザが所望する文脈での単語データを収集することが可能となる。
<4.第3の実施の形態(多言語の単語データの収集)>
多言語に対応する音声エージェントを開発する場合、単語データも対応する言語の数だけ用意する必要がある。これは、音声エージェントの開発者にとって負担となる。
そこで、上述した機能により1つの言語(例えば日本語)の単語データを収集した後、これらの単語データを自動的に各言語に翻訳する例について説明する。
(情報処理装置の構成)
図11は、本実施の形態の情報処理装置の構成例を示すブロック図である。
図11の情報処理装置100は、制御部140が、学習部141に加え、翻訳処理部311を備えている点で、図3の情報処理装置100と異なる。
翻訳処理部311は、ユーザにより入力された入力データ(単語データ)と、入力データと同じラベルが付与された候補データ(選択データ)とを、所定の言語に翻訳する。言語の翻訳は、例えば記憶部130に記憶されている、対応する言語の辞書を用いるなどして行われる。
(単語データ収集処理の流れ)
次に、図12のフローチャートを参照して、収集された単語データを所定の言語に翻訳する単語データ収集処理の流れについて説明する。
なお、図12のフローチャートにおけるステップS31乃至S36の処理は、図5のフローチャートにおけるステップS11乃至S16の処理と基本的に同様であるので、その説明は省略する。
すなわち、ステップS34において、単語データの収集を終了する旨の指示が受け付けられたと判定された後、ステップS37において、翻訳処理部311は、正例の単語データ(すなわち、入力データと選択データ)を、所定の言語に翻訳する。
例えば、図13に示されるように、正例の単語データとして、果物に属する単語データ330が収集された場合、その単語データ330は、中国語の単語データ330C、英語の単語データ330E、ロシア語の単語データ330Rにそれぞれ翻訳される。
以上の処理によれば、多言語の単語データの収集の工数を短縮することができ、多言語に対応する音声エージェントの開発にかかるコストや時間を削減することが可能となる。
<5.変形例>
以下では、上述した実施の形態の変形例について説明する。
(提示の例)
上述した実施の形態では、ユーザが、図6乃至図8に示されるような画面において単語データを選択することで、その単語データにラベルが付与されるものとした。
これに限らず、図14に示されるような、クイズゲームを提供する画面350において単語データを選択させ、その単語データにラベルが付与されるようにしてもよい。
図14の画面350上部には、ユーザが収集を所望する属性の単語、具体的には、果物に属する単語を選択させる質問文が表示されている。その質問文の下方には、その属性(果物)の単語の候補となる「ドリアン」、「トマト」、「テーブル」、「椅子」を選択するためのボタン361乃至364が表示されている。
ユーザが、「果物はどれですか?」という質問文に回答するように、果物であると考える単語のボタンを選択することで、選択された単語には、果物のラベルが付与される。
このようなクイズゲームを、より多くのプレーヤに提供することで、ユーザが所望するデータを効率良く収集することが可能となる。
(入力データの例)
上述した実施の形態では、入力データとして単語データが入力されるものとしたが、その他の形式のデータが入力されるようにしてもよい。
具体的には、入力データとして画像データが入力されるようにしてもよい。この場合、候補データとして、入力された画像データと同じラベルを付与する候補となる画像データが提示され、その中から選択された画像データを用いた学習により、さらなる画像データが提示される。
これにより、入力された画像データに近い画像データを効率良く収集することができ、例えば、類似画像検索の精度を向上させることが可能となる。
また、入力データとして、各種のセンサから得られるセンサデータが入力されるようにもできる。
例えば、入力データとして、加速度センサから得られる加速度データや、ジャイロセンサから得られる角加速度データが入力されるようにしてもよい。この場合、候補データとして、入力されたセンサデータと同じラベルを付与するセンサデータが、例えばVR(Virtual Reality)ゴーグルにおける加速や回転として提示されるようにする。その中から選択されたセンサデータを用いた学習により、さらなるセンサデータが提示される。
これにより、入力されたセンサデータに近い加速や回転を実現するセンサデータを効率良く収集することができ、例えば、VR体験における没入感を高めることが可能となる。
<6.クラウドコンピューティングへの適用>
本技術は、クラウドコンピューティングへ適用することもできる。
図15は、本技術をクラウドコンピューティングへ適用した情報処理システムの機能構成例を示すブロック図である。
図15の情報処理システムは、端末装置400とクラウドサーバ500により構成される。端末装置400とクラウドサーバ500とは、例えばインターネットなどのネットワークNWにより接続され、互いに通信可能とされる。
端末装置400は、ユーザが操作するPCやタブレット端末、スマートフォンなどのコンピュータ端末で構成され、入力部410と提示部420を少なくとも備える。入力部410と提示部420は、それぞれ、図3の入力部110と提示部120に対応する。
一方、クラウドサーバ500は、大型のコンピュータ装置で構成され、記憶部510と制御部520を少なくとも備える。制御部520は、学習部521を備えている。記憶部510、制御部520、および学習部521は、それぞれ、図3の記憶部130、制御部140、および学習部141に対応する。記憶部510は、クラウドサーバ500とは別に構成されるデータベースサーバなどに設けられてもよい。
図15の情報処理システムにおいて、端末装置400は、入力データをクラウドサーバ500に送信する。
クラウドサーバ500は、学習モデルに基づいて、端末装置400からの入力データと同じラベルを付与する候補となる候補データを、端末装置400に送信する。
端末装置400は、候補データを提示し、その中のいずれかがユーザによりラベルの付与対象として選択される。選択された候補データ(選択データ)は、クラウドサーバ500に送信される。
クラウドサーバ500は、端末装置400において選択された候補データ(選択データ)を用いて学習した学習モデルに基づいて、さらなる候補データを端末装置400に送信する。
このような構成においても、ユーザの要求に応じた精度の高い単語データの提案が可能となり、ユーザが所望するデータを効率良く収集することが可能となる。
<7.コンピュータの構成>
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図16は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
上述した情報処理装置100およびクラウドサーバ500は、図16に示す構成を有するコンピュータ1000により実現される。
CPU1001、ROM1002、RAM1003は、バス1004により相互に接続されている。
バス1004には、さらに、入出力インタフェース1005が接続されている。入出力インタフェース1005には、キーボード、マウスなどよりなる入力部1006、ディス
プレイ、スピーカなどよりなる出力部1007が接続される。また、入出力インタフェース1005には、ハードディスクや不揮発性のメモリなどよりなる記憶部1008、ネットワークインタフェースなどよりなる通信部1009、リムーバブルメディア1011を駆動するドライブ1010が接続される。
以上のように構成されるコンピュータ1000では、CPU1001が、例えば、記憶部1008に記憶されているプログラムを入出力インタフェース1005およびバス1004を介してRAM1003にロードして実行することにより、上述した一連の処理が行われる。
CPU1001が実行するプログラムは、例えばリムーバブルメディア1011に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部1008にインストールされる。
なお、コンピュータ1000が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたときなどの必要なタイミングで処理が行われるプログラムであっても良い。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
さらに、本技術は以下のような構成をとることができる。
(1)
学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力する制御部
を備え、
前記制御部は、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
情報処理装置。
(2)
前記制御部は、前記選択データを正例として、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択されなかった非選択データを負例として、前記学習モデルを学習させる
(1)に記載の情報処理装置。
(3)
前記制御部は、複数の前記学習モデルに基づいて、前記学習モデル毎に前記候補データを出力する
(1)または(2)に記載の情報処理装置。
(4)
前記制御部は、
前記学習モデル毎に同一数の前記候補データを出力し、
前記ユーザにより選択された前記選択データに応じて、前記学習モデル毎に出力される前記候補データの数の重み付けを変更する
(3)に記載の情報処理装置。
(5)
前記制御部は、前記選択データがより多く出力された前記学習モデルについて、より多くの前記候補データが出力されるように前記重み付けを変更する
(4)に記載の情報処理装置。
(6)
前記入力データは、単語データである
(1)乃至(5)のいずれかに記載の情報処理装置。
(7)
前記学習モデルは、word2vecモデルである
(6)に記載の情報処理装置。
(8)
前記入力データと前記ラベルが付与された前記選択データとを、所定の言語に翻訳する翻訳処理部をさらに備える
(6)または(7)に記載の情報処理装置。
(9)
前記入力データは、画像データである
(1)に記載の情報処理装置。
(10)
前記入力データは、センサデータである
(1)に記載の情報処理装置。
(11)
前記センサデータは、加速度データである
(10)に記載の情報処理装置。
(12)
前記センサデータは、角加速度データである
(10)に記載の情報処理装置。
(13)
出力された前記候補データを前記ユーザに提示する提示部と、
提示された前記候補データの中から前記選択データの選択を受け付ける入力部とをさらに備える
(1)乃至(12)のいずれかに記載の情報処理装置。
(14)
情報処理装置が、
学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、
前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
情報処理方法。
100 情報処理装置, 110 入力部, 120 提示部, 130 記憶部, 140 制御部, 141 学習部, 311 翻訳処理部, 500 クラウドサーバ

Claims (14)

  1. 学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力する制御部
    を備え、
    前記制御部は、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
    情報処理装置。
  2. 前記制御部は、前記選択データを正例として、前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択されなかった非選択データを負例として、前記学習モデルを学習させる
    請求項1に記載の情報処理装置。
  3. 前記制御部は、複数の前記学習モデルに基づいて、前記学習モデル毎に前記候補データを出力する
    請求項1に記載の情報処理装置。
  4. 前記制御部は、
    前記学習モデル毎に同一数の前記候補データを出力し、
    前記ユーザにより選択された前記選択データに応じて、前記学習モデル毎に出力される前記候補データの数の重み付けを変更する
    請求項3に記載の情報処理装置。
  5. 前記制御部は、前記選択データがより多く出力された前記学習モデルについて、より多くの前記候補データが出力されるように前記重み付けを変更する
    請求項4に記載の情報処理装置。
  6. 前記入力データは、単語データである
    請求項1に記載の情報処理装置。
  7. 前記学習モデルは、word2vecモデルである
    請求項6に記載の情報処理装置。
  8. 前記入力データと前記ラベルが付与された前記選択データとを、所定の言語に翻訳する翻訳処理部をさらに備える
    請求項6に記載の情報処理装置。
  9. 前記入力データは、画像データである
    請求項1に記載の情報処理装置。
  10. 前記入力データは、センサデータである
    請求項1に記載の情報処理装置。
  11. 前記センサデータは、加速度データである
    請求項10に記載の情報処理装置。
  12. 前記センサデータは、角加速度データである
    請求項10に記載の情報処理装置。
  13. 出力された前記候補データを前記ユーザに提示する提示部と、
    提示された前記候補データの中から前記選択データの選択を受け付ける入力部とをさらに備える
    請求項1に記載の情報処理装置。
  14. 情報処理装置が、
    学習モデルに基づいて、ユーザにより入力された入力データと同じラベルを付与する候補となる候補データを出力し、
    前記候補データの中から前記ユーザにより前記ラベルの付与対象として選択された選択データを用いて学習した前記学習モデルに基づいて、さらなる前記候補データを出力する
    情報処理方法。
JP2020005937A 2020-01-17 2020-01-17 情報処理装置および情報処理方法 Pending JP2021114082A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020005937A JP2021114082A (ja) 2020-01-17 2020-01-17 情報処理装置および情報処理方法
PCT/JP2021/000017 WO2021145228A1 (ja) 2020-01-17 2021-01-04 情報処理装置および情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020005937A JP2021114082A (ja) 2020-01-17 2020-01-17 情報処理装置および情報処理方法

Publications (1)

Publication Number Publication Date
JP2021114082A true JP2021114082A (ja) 2021-08-05

Family

ID=76863997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020005937A Pending JP2021114082A (ja) 2020-01-17 2020-01-17 情報処理装置および情報処理方法

Country Status (2)

Country Link
JP (1) JP2021114082A (ja)
WO (1) WO2021145228A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017194782A (ja) * 2016-04-19 2017-10-26 ソニー株式会社 情報処理装置及び情報処理方法
JP7167437B2 (ja) * 2017-12-26 2022-11-09 大日本印刷株式会社 物品特定装置
CN112236832A (zh) * 2018-06-05 2021-01-15 住友化学株式会社 诊断辅助系统、诊断辅助方法以及诊断辅助程序

Also Published As

Publication number Publication date
WO2021145228A1 (ja) 2021-07-22

Similar Documents

Publication Publication Date Title
US11409961B2 (en) System for minimizing repetition in intelligent virtual assistant conversations
US11037048B2 (en) Virtual conversation method or system
CN111277706B (zh) 一种应用推荐方法、装置、存储介质及电子设备
Shawai et al. Malay language mobile learning system (MLMLS) using NFC technology
CN110134931B (zh) 媒介标题生成方法、装置、电子设备及可读介质
EP1986175A2 (en) Method, interface and system for obtaining user input
JP6345577B2 (ja) 情報提供システム、情報提供方法、プログラム、及びデータ構造
CN107636648A (zh) 基于情绪标识来构造响应
CN109940627A (zh) 一种面向绘本阅读机器人的人机交互方法和系统
JP2016099967A (ja) 情報提供システム、情報提供方法、及びプログラム
JP6986978B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20170004821A1 (en) Voice synthesizer, voice synthesis method, and computer program product
US10878813B2 (en) Analytics-based speech therapy
KR102035088B1 (ko) 스토리텔링 기반 멀티미디어 무인 원격 1:1 맞춤형 교육시스템
US20180101789A1 (en) Method for editing machine learning result and information processing apparatus
US20190371195A1 (en) Cognitive robotic assistance for education
CN204425398U (zh) 智能早教系统及装置
WO2021145228A1 (ja) 情報処理装置および情報処理方法
CN113963306B (zh) 基于人工智能的课件片头制作方法和装置
JP6948978B2 (ja) 知識データのデータ構造
Durand-López L2 within-language morphological competition during spoken word recognition
JPWO2018147435A1 (ja) 学習支援システム及び方法、並びにコンピュータプログラム
WO2023079712A1 (ja) 処理装置、処理方法及び処理プログラム
JP7359196B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
US20230237922A1 (en) Artificial intelligence-driven avatar-based personalized learning techniques