JP2024071324A

JP2024071324A - メディアファイルを選択する方法、サービスシステム、及びコンピュータープログラム

Info

Publication number: JP2024071324A
Application number: JP2023015931A
Authority: JP
Inventors: 高佳橋本; Takayoshi Hashimoto
Original assignee: Aiello International Taiwan Co Ltd
Current assignee: Aiello International Taiwan Co Ltd
Priority date: 2022-11-14
Filing date: 2023-02-06
Publication date: 2024-05-24
Also published as: TW202420143A; TWI808038B

Abstract

【課題】メディアファイルを選択する方法を提供する。【解決手段】方法は、サービスシステムによって実行され、ａ）メディアファイルの出力要求に関する文字データを得るステップと、ｂ）言語処理モデルを用いて、文字データが明確な要求または曖昧な要求に属するかを判断するステップと、ｃ）文字データが明確な要求に属すると判断される場合において、文字データに含まれる少なくとも１つのキーワードに基づいて、メディアデータから一部がキーワードと一致する１つのメディアデータを選択するステップと、ｄ）文字データが曖昧な要求に属すると判断される場合において、言語処理モデルを用いて文字データに好み分析処理を実行して好み分析結果を得て、メディアデータそれぞれの好み分析結果とのマッチング程度を計算し、マッチング程度が所定の閾値以上である１つのメディアデータを選択するステップと、を含む。【選択図】図２

Description

本発明は、メディアファイルを選択する方法に関し、特に、ユーザが口述した内容を処理してメディアファイルを選択する方法に関する。本発明はさらに、ユーザが口述した内容を処理するサービスシステムと、電子装置に前述のメディアファイルを選択する方法を実行させるコンピュータープログラムと、に関する。

言語処理技術の発展に伴い、ユーザが音声で操作できる電子装置が増えている。音声操作の活用事例の１つは、ユーザが音声で、電子装置に、聴きたい曲を再生するようにリクエストすることである。これにより、ユーザは、手を使わずに聴きたい曲のメディアファイルを検索して再生することができる。

中国特許出願公開第１１４５４８２００号明細書

しかしながら、ユーザが音楽を聴きたいと思った時、必ずしも特定の曲が聴きたいとは限らなく、好みに合う曲であればよい場合もある。この場合において、ユーザは、音楽を聴きたいと思っても、聴きたい曲を短時間で決定することができない。さらに、音声操作の場合において、ユーザは通常、曲のリストを確認して曲を選択する意向が低く（音声操作の利便性が損なわれるため）、曲の選択がユーザが思い浮かべる曲に制限され、結果としてよくない使用経験になる可能性がある。

従って、本発明の目的は、従来技術の欠点を少なくとも１つ軽減することができるメディアファイルを選択する方法を提供することにある。

メディアファイルを選択する方法は、サービスシステムによって実行される。サービスシステムは、処理ユニットと、処理ユニットに電気的に接続する記憶ユニットと、を含む。記憶ユニットには、機械学習技術により実現される言語処理モデルと、複数のメディアファイルにそれぞれ対応し、対応のメディアファイルの属性を示す複数のメディアデータと、が格納されている。方法は、ａ）処理ユニットが、メディアファイルの出力要求に関する文字データを得るステップと、ｂ）処理ユニットが、言語処理モデルを用いて、文字データが明確な要求または曖昧な要求に属するかを判断するステップと、ｃ）文字データが明確な要求に属すると判断される場合において、処理ユニットが、文字データに含まれる少なくとも１つのキーワードに基づいて、複数のメディアデータから一部がキーワードと一致する１つのメディアデータを指定のメディアデータとして選択し、指定のメディアデータに対応するメディアファイルが出力されるようにするステップと、ｄ）文字データが曖昧な要求に属すると判断される場合において、処理ユニットが、言語処理モデルを用いて文字データに好み分析処理を実行して好み分析結果を得て、複数のメディアデータそれぞれの好み分析結果とのマッチング程度を計算し、複数のメディアデータから好み分析結果とのマッチング程度が所定の閾値以上である１つのメディアデータをマッチングされたメディアデータとして選択し、マッチングされたメディアデータに対応するメディアファイルが出力されるようにするステップと、を含む。

本発明の他の目的は、従来技術の欠点を少なくとも１つ軽減することができるサービスシステムを提供することにある。

サービスシステムは、処理ユニットと、処理ユニットに電気的に接続する記憶ユニットと、を含む。

記憶ユニットには、機械学習技術により実現される言語処理モデルと、複数のメディアファイルにそれぞれ対応し、対応のメディアファイルの属性を示す複数のメディアデータと、が格納されている。

処理ユニットは、メディアファイルの出力要求に関する文字データを得て、言語処理モデルを用いて、文字データが明確な要求または曖昧な要求に属するかを判断し、文字データが明確な要求に属すると判断される場合において、文字データに含まれる少なくとも１つのキーワードに基づいて、複数のメディアデータから一部がキーワードと一致する１つのメディアデータを指定のメディアデータとして選択し、指定のメディアデータに対応するメディアファイルが出力されるようにし、文字データが曖昧な要求に属すると判断される場合において、言語処理モデルを用いて文字データに好み分析処理を実行して好み分析結果を得て、複数のメディアデータそれぞれの好み分析結果とのマッチング程度を計算し、複数のメディアデータから好み分析結果とのマッチング程度が所定の閾値以上である１つのメディアデータをマッチングされたメディアデータとして選択し、マッチングされたメディアデータに対応するメディアファイルが出力されるようにするように構成される。

本発明の他の目的は、従来技術の欠点を少なくとも１つ軽減することができるコンピュータプログラムを提供することにある。

コンピュータプログラムは、機械学習技術により実現される言語処理モデル及び命令を含む。該コンピュータプログラムが電子装置により実行されると、電子装置に前述のメディアファイルを選択する方法を実行させる。

サービスシステムは、まず文字データが明確な要求または曖昧な要求に属するかを判断する。文字データが明確な要求に属すると判断される場合において、サービスシステムは、該文字データに含まれるキーワードに基づいて、出力されるメディアファイル（例えば、音楽ファイル）を選択する。文字データが曖昧な要求に属すると判断される場合において、サービスシステムは、該文字データに好み分析処理を実行して好み分析結果を得て、メディアデータの好み分析結果とのマッチング程度に基づいて、出力されるメディアファイルを選択する。このように、ユーザは、より曖昧な表現でサービスシステムにリクエストすることもでき、従来技術の欠点を改善し、本発明の目的を実現する。

本発明の他の特徴及び利点は、添付の図面を参照する以下の実施形態の詳細な説明において明白になる。

本発明のサービスシステムの一実施形態を例示的に示すブロック図である。本発明のメディアファイルを選択する方法の一実施形態を例示的に示すフローチャートである。

本発明をより詳細に説明する前に、本明細書における「結合」又は「接続」という用語は、複数の電気機器／装置／設備の間が導電材料（例えば、電線）により直接的に接続されること、或いは、２つの電気機器／装置／設備の間が他の一つ以上の機器／装置／設備又は無線通信により間接的に接続されることを意味することに留意されたい。

図１を参照すると、本発明のサービスシステム１の一実施形態は、サーバーシステム１１と、電子装置１２と、を含む。サーバーシステム１１は、ネットワークを介して電子装置１２に接続して通信する。

本実施形態において、サーバーシステム１１は、１つのサーバー機器であって、処理ユニット１１１と、該処理ユニット１１１に電気的に接続する記憶ユニット１１２と、を含む。本実施形態において、処理ユニット１１１は、データの演算及び処理の機能を有する１つの中央処理装置であるが、他の実施形態において、処理ユニット１１１は、複数の中央処理装置の組み合わせであってもよく、本実施形態に限定されない。本実施形態において、記憶ユニット１１２は、デジタルデータを格納する１つのデータ記憶装置（例えば、ハードディスク）であるが、他の実施形態において、記憶ユニット１１２は、異なる種類のコンピュータ読み取り可能な記憶媒体または複数のコンピュータ読み取り可能な記憶媒体の組み合わせであってもよく、本実施形態に限定されない。また、他の実施形態において、サーバーシステム１１は、互いに電気的に接続する複数のサーバー機器であってもよく、本実施形態に限定されない。

本実施形態において、サーバーシステム１１の記憶ユニット１１２には、機器学習技術により実現される言語処理モデルＭと、複数のメディアファイル（図示せず）にそれぞれ対応し、対応のメディアファイルの属性を示す複数のメディアデータＤと、が格納されている。本実施形態において、言語処理モデルＭは、語意解析サブモデルｍ１と、好み分析サブモデルｍ２と、を含む。本実施形態において、メディアデータＤが対応するメディアファイルは、音楽ファイルであるが、これに限定されない。

言語処理モデルＭの語意解析サブモデルｍ１について、本実施形態において、語意解析サブモデルｍ１は、ニューラルネットワークであり、少なくとも複数のフレーズデータをトレーニングデータとして機械学習によりトレーニングされたものである。フレーズデータは、本実施形態において、自然言語で音楽ファイルを出力させるようにリクエストするフレーズであり、例えば、「ジョリンツァイの曲を流して」、「時の流れに身をまかせを聴きたい」、「Ｔｈｉｓｉｓ嵐に収録されている曲をかけて」、「ロックを再生して」、「日本語のバラードが聴きたい」などを含むが、これらに限定されない。

より具体的には、語意解析サブモデルｍ１をトレーニングするように用いられるトレーニングデータは、２種のフレーズデータを含むことが好ましい。１種は、曲名、アーティスト名、又はアルバム名を示す明確な要求であり、他の１種は、曲名、アーティスト名、及びアルバム名を示さない曖昧な要求である。前述の例として挙げられたフレーズデータにおける「ジョリンツァイの曲を流して」、「時の流れに身をまかせを聴きたい」及び「Ｔｈｉｓｉｓ嵐に収録されている曲をかけて」は、明確な要求に属し、「ロックを再生して」及び「日本語のバラードが聴きたい」は、曖昧な要求に属する。

これにより、トレーニングされた語意解析サブモデルｍ１は、文字データに言語解析処理を行うことができ、言語解析処理を行うことにより、文字データから複数の単語を抽出し、抽出された単語に基づいて、該フレーズデータが明確な要求または曖昧な要求に属するかを判断する。言語解析処理の詳細は後述する。なお、本明細書における「単語」は１つまたは１つ以上の文字からなるものであり、その言語は例えば中国語、英語、及び日本語を含む。

言語処理モデルＭの好み分析サブモデルｍ２について、好み分析サブモデルｍ２は、語意解析サブモデルｍ１に似ているニューラルネットワークである。好み分析サブモデルｍ２は、少なくとも曖昧な要求に属する複数のフレーズデータをトレーニングデータとして機械学習によりトレーニングされたものである。好み分析サブモデルｍ２のトレーニングデータは、語意解析サブモデルｍ１のトレーニングデータの一部を含んでもよい。例えば、好み分析サブモデルｍ２のトレーニングデータは、前述の「ロックを再生して」及び「日本語のバラードが聴きたい」の２つのフレーズデータを含んでもよい。好み分析サブモデルｍ２のトレーニングデータは、「女性が歌う懐メロが聴きたい」、「ジャズを流して」、「新曲を聴きたい」などのフレーズデータをさらに含んでもよく、これらに限定されない。

これにより、トレーニングされた好み分析サブモデルｍ２は、文字データに好み分析処理を行うことができ、好み分析処理を行うことにより、文字データから複数の単語を抽出し、抽出された単語に基づいて、好み分析結果を得る。好み分析処理の詳細は後述する。

記憶ユニット１１２に格納されているメディアデータＤのそれぞれは、ファイル識別データと、可読性（本明細書においてはすなわち人間可読性）のある文字形式で表されている少なくとも１つの名称データと、予め定義される複数の属性タグと、を含む。

より具体的には、メディアデータＤそれぞれのファイル識別データは、該メディアデータＤが対応するメディアファイルを識別する唯一性のある文字列であり、例えば、可読性のある複数の文字、または可読性のない識別子であってもよく、本実施形態はファイル識別データについて特に限定しない。

本実施形態において、メディアデータＤのそれぞれは、種類の異なる３つの名称データを含む。より具体的には、１つの名称データは可読性のある文字形式で曲名を表し、他の１つの名称データは可読性のある文字形式でアーティスト名を表し、さらに他の１つの名称データは可読性のある文字形式でアルバム名を表す。なお、メディアデータＤが含む名称データの数及び各名称データが表す意味は、ニーズに応じて自由に設定し調整することができ、本実施形態に限定されない。

本実施形態において、メディアデータＤそれぞれの属性タグは、該メディアデータＤが対応するメディアファイルの属性を示す。本実施形態において、メディアデータＤが対応するメディアファイルが音楽ファイルであるため、メディアデータＤの属性データは、対応の音楽ファイルの属性を示し、例えば、言語、ジャンル、テンポ、楽器、アーティスト、作詞家、作曲家、アルバム名、リリース日などを示してもよいが、これらに限定されない。さらに、メディアデータＤの属性データは、可読性のある１つ以上の文字、または特定の属性を表すコードや数値であってもよく、本実施形態は属性タグについて特に限定しない。

電子装置１２は、処理モジュール１２１と、処理モジュール１２１に電気的に接続する入力モジュール１２２と、処理モジュール１２１に電気的に接続する出力モジュール１２３と、を含む。処理モジュール１２１は、中央処理装置であり、入力モジュール１２２は、少なくとも処理モジュール１２１に電気的に接続し、音声を拾うように用いられるマイクロフォンであり、出力モジュール１２３は、少なくとも処理モジュール１２１に電気的に接続し、音声を発するように用いられるスピーカーである。また、電子装置１２とサーバーシステム１１とは互いに通信可能に構成され、例えばネットワークを介して互いに通信可能である。本実施形態において、電子装置１２は、宿泊施設の客室に設置され、宿泊者に使用されるサービス電子装置である。なお、図１においては１つの電子装置１２が示されているが、これに限らず、サービスシステム１は複数の電子装置１２を含み得る。この場合、電子装置１２のそれぞれがネットワークを介してサーバーシステム１１と通信できる。また、他の実施形態において、電子装置１２は、モバイル電子装置（例えば、スマートフォン、タブレットコンピューター、ラップトップコンピューター）、インターネットテレビ、デスクトップコンピューターなどであってもよく、本実施形態に限定されない。

図２を参照し、以下では、本実施形態のサービスシステム１により実行されるメディアファイルを選択する方法について説明する。

ステップＳ１において、サーバーシステム１１の処理ユニット１１１は、音声データに対応し、メディアファイルの出力要求に関連する文字データを得る。

具体的には、音声データは、電子装置１２の入力モジュール１２２が拾った音声の電気信号であり、例えば、ユーザが音楽出力をリクエストするために電子装置１２に対して喋った音声の電気信号である。そして、電子装置１２の処理モジュール１２１は、入力モジュール１２２から該音声データを受信し、受信した音声データを音声認識技術を用いて処理し対応の文字データを生成し、生成した文字データをサーバーシステム１１の処理ユニット１１１に送信する。また、他の実施形態において、電子装置１２の処理モジュール１２１は、音声データを入力モジュール１２２から受信し、音声データをそのままサーバーシステム１１の処理ユニット１１１に送信し、サーバーシステム１１の処理ユニット１１１は、受信した音声データに基づいて、対応の文字データを生成してもよい。従って、サーバーシステム１１の処理ユニット１１１が文字データを得る手段は、本実施形態に限定されない。

ステップＳ２において、処理ユニット１１１は、言語処理モデルＭの語意解析サブモデルｍ１を用いて、ステップＳ１で得られた文字データが明確な要求または曖昧な要求に属するかを判断する。

具体的には、本実施形態において、処理ユニット１１１は、語意解析サブモデルｍ１を用いて言語解析処理を実行し、文字データから抽出された単語に、メディアデータＤの名称データのいずれか１つに関連する少なくとも１つの単語があるどうかを判断する。

文字データから抽出された単語にメディアデータＤの名称データのいずれか１つに関連する少なくとも１つの単語があると判断される場合において、処理ユニット１１１は、該文字データが明確な要求に属すると判断し、且つ、名称データのいずれか１種に該当する少なくとも１つの単語を少なくとも１つのキーワードとする。

文字データから抽出された単語にメディアデータＤの名称データのいずれか１つに関連する少なくとも１つの単語がないと判断される場合において、処理ユニット１１１は、該文字データが曖昧な要求に属すると判断する。

さらに具体的には、本実施形態において、処理ユニット１１１は、文字データから抽出された単語に、名称データのいずれか１種に該当する少なくとも１つの単語があるかどうかを判断する。すなわち、文字データから抽出された単語に、曲名、アーティスト名、又はアルバム名を示す少なくとも１つの単語があるかどうかを判断する。語意解析サブモデルｍ１により文字データから抽出された単語に、曲名、アーティスト名、又はアルバム名を示す少なくとも１つの単語があると判断される場合に、処理ユニット１１１は、文字データから抽出された単語に名称データの少なくとも１種に該当する少なくとも１つの単語があると判断し、該文字データが明確な要求に属すると判断し、さらに、該名称データの少なくとも１種に該当する（すなわち、曲名、アーティスト名、又はアルバム名を示す）単語を、キーワードとする。

文字データが「夏色が聴きたい」である例において、処理ユニット１１１は、文字データのうちの「夏色」が曲名を示し、名称データの１種に該当すると判断することにより、文字データの「夏色が聴きたい」が明確な要求に属すると判断し、「夏色」をキーワードとする。文字データが「イーソンチャンの曲を流して」である他の例において、処理ユニット１１１は、文字データのうちの「イーソンチャン」がアーティスト名を示し、名称データの１種に該当すると判断することにより、文字データの「イーソンチャンの曲を流して」が明確な要求に属すると判断し、「イーソンチャン」をキーワードとする。文字データは「アンコールに収録されている曲を流して」である他の例において、処理ユニット１１１は、文字データのうちの「アンコール」がアルバム名を示し、名称データの１種に該当すると判断することにより、文字データの「アンコールに収録されている曲を流して」が明確な要求に属すると判断し、「アンコール」をキーワードとする。

なお、文字データが明確な要求または曖昧な要求に属するかを判断する具体な手段は、本実施形態に限定されない。また、本実施形態において、語意解析サブモデルｍ１を用いて単語を抽出して明確な要求または曖昧な要求に属するかを判断することは、機械学習により語意解析サブモデルｍ１をトレーニングした結果であり、詳細は本明細書のポイントではないため、詳しく説明しない。

文字データが明確な要求に属すると判断される場合において、フローはステップＳ３へ進む。その一方、文字データが曖昧な要求に属すると判断される場合において、フローはステップＳ５へ進む。

ステップＳ３において、処理ユニット１１１は、該文字データに含まれる少なくとも１つのキーワードに基づいて、複数のメディアデータＤから一部がキーワードと一致する１つのメディアデータＤを指定のメディアデータとして選択する。

文字データが「夏色が聴きたい」である例において、処理ユニット１１１は、メディアデータＤから名称データがキーワードの「夏色」を含む１つのメディアデータＤを指定のメディアデータとして選択する。文字データが「イーソンチャンの曲を流して」である他の例において、処理ユニット１１１は、メディアデータＤから名称データがキーワードの「イーソンチャン」を含む１つのメディアデータＤを指定のメディアデータとして選択する。文字データが「アンコールに収録されている曲を流して」である他の例において、処理ユニット１１１は、メディアデータＤから名称データがキーワードの「アンコール」を含む１つのメディアデータＤを指定のメディアデータとして選択する。

ステップＳ４において、処理ユニット１１１は、該指定のメディアデータに対応するメディアファイルが出力されるようにする。

具体的には、本実施形態において、サーバーシステム１１の処理ユニット１１１は、該指定のメディアデータのファイル識別データを用いて、メディアファイルデータベース（図示せず）から該指定のメディアデータに対応するメディアファイルを得て、該対応のメディアファイルを電子装置１２に送信し、電子装置１２の処理モジュール１２１は、出力モジュール１２３に指定のメディアデータに対応するメディアファイルを出力させるように出力モジュール１２３を制御するが、本発明は本実施形態に限定されない。なお、メディアファイルデータベースは、サーバーシステム１１の記憶ユニット１１２に格納されてもよく、或いは、ネットワークを介して処理ユニット１１１と電気的に接続する外部サーバーに格納されてもよい。すなわち、メディアファイルは、必ずしもサービスシステム１に格納されているとは限らない。対応のメディアファイルが出力されると、本実施形態のメディアファイルを選択する方法は完了する。

ステップＳ５において、処理ユニット１１１は、言語処理モデルＭの好み分析サブモデルｍ２を用いて、文字データに好み分析処理を実行して、好み分析結果を得る。

好み分析処理について具体的には、本実施形態において、処理ユニット１１１は、好み分析サブモデルｍ２を用いて、文字データからメディアファイルの属性に関連する少なくとも１つの単語を抽出して重点単語とし、好み分析サブモデルｍ２が有するパラメーターを用いて重点単語に計算をし、好み分析結果を生成する。文字データが「日本語のバラードを再生して」である例において、処理ユニット１１１は、好み分析サブモデルｍ２を用いて文字データから「日本語」と「バラード」との２つの単語を抽出して重点単語として、好み分析結果を生成する。さらに、本実施形態において、好み分析結果は、多次元ベクトルの形式で表されている。すなわち、好み分析結果は、文字データが示したメディアファイルへの要求の好みを多次元ベクトルで示す。具体的には、多次元ベクトルである好み分析結果が有する複数の成分ベクトルは、メディアデータＤの複数の属性タグに関連する。例えば、好み分析結果の複数の成分ベクトルは、文字データが、言語、ジャンル、テンポ、楽器、アーティスト、作詞家、作曲家、アルバム名、リリース日などについて好みを示したかどうかを示す。なお、好み分析サブモデルｍ２を用いて重点単語を抽出して好み分析結果を生成することは、機械学習により好み分析サブモデルｍ２をトレーニングした結果であり、詳細は本明細書のポイントではないため、詳しく説明しない。

ステップＳ６において、処理ユニット１１１は、好み分析結果に基づいて、メディアデータＤからマッチングされたメディアデータを選択する。

具体的には、処理ユニット１１１は、メディアデータＤそれぞれの属性タグに基づいて、該メディアデータＤの好み分析結果とのマッチング程度を計算し、メディアデータＤにおける好み分析結果とのマッチング程度が所定の閾値以上である少なくとも１つのメディアデータＤから、１つのメディアデータＤをランダムで選択し、選択された該１つのメディアデータＤをマッチングされたメディアデータとする。

処理ユニット１１１は、マッチングされたメディアデータをランダムで選択するため、類似の曖昧な要求（例えば、「日本語のバラードを流して」及び「日本語のバラードをもう一曲」）を用いて本発明のメディアファイルを選択する方法を実行しても、好み分析結果とのマッチング程度が所定の閾値以上であるメディアデータＤの数が多ければ、同一のメディアデータＤがマッチングされたメディアデータとして何度も選択され同一のメディアファイルが何度も出力されることを回避することができる。

メディアデータＤのそれぞれの属性タグが可読性のある文字形式で実施される場合において、処理ユニット１１１は、例えば、好み分析サブモデルｍ２を用いてメディアデータＤそれぞれの属性タグをベクトル形式に変換してから、該メディアデータＤの好み分析結果とのマッチング程度を計算する。メディアデータＤのそれぞれの属性タグがコードや数値で実施される場合において、処理ユニット１１１は、メディアデータＤの好み分析結果とのマッチング程度の計算に必ずしも好み分析サブモデルｍ２を用いる必要はない。

ステップＳ７において、処理ユニット１１１は、マッチングされたメディアデータに対応するメディアファイルが出力されるようにする。

具体的には、本実施形態において、サーバーシステム１１の処理ユニット１１１は、該マッチングされたメディアデータのファイル識別データを用いて、メディアファイルデータベースから、マッチングされたメディアデータに対応するメディアファイルを得て、該対応のメディアファイルを電子装置１２に送信し、電子装置１２の処理モジュール１２１は、出力モジュール１２３にマッチングされたメディアデータに対応するメディアファイルを出力させるように出力モジュール１２３を制御するが、本発明は本実施形態に限定されない。対応のメディアファイルが出力されると、本実施形態のメディアファイルを選択する方法は完了する。

ステップＳ１からステップＳ７及び図２のフローチャートは、本発明のメディアファイルを選択する方法の一実施形態を例示的に示すものに過ぎないことを理解されたい。ステップＳ１からステップＳ７を組み合わせたり、分割したり、順序を変えたりしても、本実施形態と実質的に同一の方法で同一の効果を得ることができれば、本発明のメディアファイルを選択する方法の実施形態に該当し、本発明の権利範囲に含まれる。従って、ステップＳ１からステップＳ７及び図２のフローチャートは、本発明を限定するものではない。

また、本発明の適用する範囲は、音楽ファイルに限定されない。従って、メディアファイルは音楽ファイルに限定されなく、例えば、音声を含む動画ファイル（例えば、映画の動画ファイル）、画像ファイル（例えば、写真や絵の画像ファイル）などであってもよい。メディアデータＤの内容（名称データ、属性タグなど）及び言語処理モデルＭのトレーニングデータも、メディアファイルに応じて自由に設計して調整してもよい。従って、メディアデータＤ及びトレーニングデータは、本実施形態に限定されない。

本実施形態において、サービスシステム１は、図１に示されるように、サーバーシステム１１と電子装置１２とを含むが、本発明は本実施形態に限定されないことを理解されたい。他の実施形態において、サービスシステム１は、サーバーシステム１１のみを含んでもよく、必ずしも電子装置１２を含む必要はない。他の実施形態において、サーバーシステム１は、処理ユニット１１１と、記憶ユニット１１２と、入力モジュール１２２と、出力モジュール１２３と、を含むユーザが所有する１つのデバイス（例えば、スマートフォン、タブレットコンピューター、ノート型コンピューター、デスクトップコンピューター、インターネットテレビ）であってもよい。従って、サービスシステム１は、本実施形態に限定されない。

本発明のコンピュータープログラムは、機械学習技術により実現される言語処理モデルＭと命令とを含む。コンピュータープログラムは、例えば、コンピュータ読み取り可能な記憶媒体に格納されており、電子装置（例えば、スマートフォン、タブレットコンピューター、ノート型コンピューター、デスクトップコンピューター）により実行することができるアプリケーションである。コンピュータープログラムが電子装置により実行されると、該電子装置は本発明のサービスシステム１として機能し、本発明のメディアファイルを選択する方法が実行される。また、コンピュータープログラムは、メディアデータＤをさらに含んでもよい。

要約すると、サービスシステム１は、まず文字データが明確な要求または曖昧な要求に属するかを判断する。文字データが明確な要求に属すると判断される場合において、サービスシステム１は、該文字データに含まれるキーワードに基づいて、出力されるメディアファイルを選択する。文字データが曖昧な要求に属すると判断される場合において、サービスシステム１は、該文字データに好み分析処理を実行して好み分析結果を得て、メディアデータＤの好み分析結果とのマッチング程度に基づいて、出力されるメディアファイルを選択する。このように、ユーザは、より曖昧な表現でサービスシステム１にリクエストすることもでき、従来技術の欠点を改善し、本発明の目的を実現する。

上記の説明では、説明の目的のために、実施形態の完全な理解を提供するために多数の特定の詳細が述べられた。しかしながら、当業者であれば、一又はそれ以上の他の実施形態が具体的な詳細を示さなくとも実施され得ることが明らかである。また、本明細書における「一実施形態」「一つの実施形態」を示す説明において、序数などの表示を伴う説明は全て、特定の態様、構造、特徴を有する本発明の具体的な実施に含まれ得るものであることと理解されたい。更に、本明細書において、時には複数の変化例が一つの実施形態、図面、又はこれらの説明に組み込まれているが、これは本明細書を合理化させるためのもので、本発明の多面性が理解されることを目的としたものであり、また、一実施形態における一又はそれ以上の特徴あるいは特定の具体例は、適切な場合には、本発明の実施において、他の実施形態における一またはそれ以上の特徴あるいは特定の具体例と共に実施され得る。

以上、本発明の実施形態および変化例を説明したが、本発明はこれらに限定されるものではなく、最も広い解釈の精神および範囲内に含まれる様々な構成として、全ての修飾および均等な構成を包含するものとする。

１サービスシステム
１１サーバーシステム
１１１処理ユニット
１１２記憶ユニット
１２電子装置
１２１処理モジュール
１２２入力モジュール
１２３出力モジュール
Ｍ言語処理モデル
ｍ１語意解析サブモデル
ｍ２好み分析サブモデル
Ｄメディアデータ
Ｓ１～Ｓ７ステップ

Claims

サービスシステムによって実行される、メディアファイルを選択する方法であって、
前記サービスシステムは、処理ユニットと、前記処理ユニットに電気的に接続する記憶ユニットと、を含み、
前記記憶ユニットには、機械学習技術により実現される言語処理モデルと、複数の前記メディアファイルにそれぞれ対応し、対応の前記メディアファイルの属性を示す複数のメディアデータと、が格納されており、
前記方法は、
ａ）前記処理ユニットが、前記メディアファイルの出力要求に関する文字データを得るステップと、
ｂ）前記処理ユニットが、前記言語処理モデルを用いて、前記文字データが明確な要求または曖昧な要求に属するかを判断するステップと、
ｃ）前記文字データが前記明確な要求に属すると判断される場合において、前記処理ユニットが、前記文字データに含まれる少なくとも１つのキーワードに基づいて、複数の前記メディアデータから一部が前記キーワードと一致する１つの前記メディアデータを指定のメディアデータとして選択し、前記指定のメディアデータに対応する前記メディアファイルが出力されるようにするステップと、
ｄ）前記文字データが前記曖昧な要求に属すると判断される場合において、前記処理ユニットが、前記言語処理モデルを用いて前記文字データに好み分析処理を実行して好み分析結果を得て、複数の前記メディアデータそれぞれの前記好み分析結果とのマッチング程度を計算し、複数の前記メディアデータから前記好み分析結果との前記マッチング程度が所定の閾値以上である１つの前記メディアデータをマッチングされたメディアデータとして選択し、前記マッチングされたメディアデータに対応する前記メディアファイルが出力されるようにするステップと、を含む、
方法。
前記メディアデータのそれぞれは、該メディアデータが対応する前記メディアファイルの属性を示す複数の属性タグを含み、
前記ステップｄ）は、前記文字データが前記曖昧な要求に属すると判断される場合において、前記処理ユニットが、前記言語処理モデルを用いて前記文字データから前記メディファイルの属性に関連する少なくとも１つの重点単語を抽出し、前記重点単語に基づいて、多次元ベクトルの形式で表されている前記好み分析結果を生成し、前記メディアデータそれぞれの複数の前記属性タグに基づいて、該メディアデータの前記好み分析結果との前記マッチング程度を計算し、複数の前記メディアデータにおける前記好み分析結果との前記マッチング程度が前記所定の閾値以上である少なくとも１つの前記メディアデータから前記マッチングされたメディアデータを選択するステップである、請求項１に記載の方法。
前記ステップｄ）において、前記処理ユニットは、前記好み分析結果との前記マッチング程度が前記所定の閾値以上である少なくとも１つの前記メディアデータから前記マッチングされたメディアデータをランダムで選択する、請求項２に記載の方法。
前記メディアデータのそれぞれは、可読性のある文字形式で表されている少なくとも１つの名称データを含み、
前記ステップｂ）は、
前記処理ユニットは、前記文字データに前記名称データのいずれか１つに関連する少なくとも１つの単語があるかどうかを判断することと、
前記文字データに前記名称データのいずれか１つに関連する少なくとも１つの前記単語があると判断される場合において、前記処理ユニットは、前記文字データが前記明確な要求に属すると判断し、且つ、前記名称データのいずれか１つに関連する少なくとも１つの前記単語を少なくとも１つの前記キーワードとすることと、
前記文字データに前記名称データのいずれか１つに関連する少なくとも１つの前記単語がないと判断される場合において、前記処理ユニットは、前記文字データが前記曖昧な要求に属すると判断することと、を含む、請求項１に記載の方法。
前記サービスシステムは、出力モジュールをさらに含み、
前記メディアデータのそれぞれは、ファイル識別データを含み、
前記ステップｃ）は、前記処理ユニットにより、前記指定のメディアデータの前記ファイル識別データに基づいて、前記指定のメディアデータに対応する前記メディアファイルを得て、前記出力モジュールに前記指定のメディアデータに対応する前記メディアファイルを出力させるように前記出力モジュールを制御することにより、前記指定のメディアデータに対応する前記メディアファイルが出力されるようにし、
前記ステップｄ）は、前記処理ユニットにより、前記マッチングされたメディアデータの前記ファイル識別データに基づいて前記マッチングされたメディアデータに対応する前記メディアファイルを得て、前記出力モジュールに前記マッチングされたメディアデータに対応する前記メディアファイルを出力させるように前記出力モジュールを制御することにより、前記マッチングされたメディアデータに対応する前記メディアファイルが出力されるようにする、請求項１に記載の方法。
処理ユニットと、
前記処理ユニットに電気的に接続する記憶ユニットと、を含み、
前記記憶ユニットには、機械学習技術により実現される言語処理モデルと、複数のメディアファイルにそれぞれ対応し、対応の前記メディアファイルの属性を示す複数のメディアデータと、が格納されており、
前記処理ユニットは、
前記メディアファイルの出力要求に関する文字データを得て、
前記言語処理モデルを用いて、前記文字データが明確な要求または曖昧な要求に属するかを判断し、
前記文字データが前記明確な要求に属すると判断される場合において、前記文字データに含まれる少なくとも１つのキーワードに基づいて、複数の前記メディアデータから一部が前記キーワードと一致する１つの前記メディアデータを指定のメディアデータとして選択し、前記指定のメディアデータに対応する前記メディアファイルが出力されるようにし、
前記文字データが前記曖昧な要求に属すると判断される場合において、前記言語処理モデルを用いて前記文字データに好み分析処理を実行して好み分析結果を得て、複数の前記メディアデータそれぞれの前記好み分析結果とのマッチング程度を計算し、複数の前記メディアデータから前記好み分析結果との前記マッチング程度が所定の閾値以上である１つの前記メディアデータをマッチングされたメディアデータとして選択し、前記マッチングされたメディアデータに対応する前記メディアファイルが出力されるようにするように構成される、
サービスシステム。
前記メディアデータのそれぞれは、該メディアデータが対応する前記メディアファイルの属性を示す複数の属性タグを含み、
前記処理ユニットは、
前記文字データが前記曖昧な要求に属すると判断される場合において、前記言語処理モデルを用いて前記文字データから前記メディファイルの属性に関連する少なくとも１つの重点単語を抽出し、前記重点単語に基づいて、多次元ベクトルの形式で表されている前記好み分析結果を生成し、前記メディアデータそれぞれの複数の前記属性タグに基づいて、該メディアデータの前記好み分析結果との前記マッチング程度を計算し、複数の前記メディアデータにおける前記好み分析結果との前記マッチング程度が前記所定の閾値以上である少なくとも１つの前記メディアデータから前記マッチングされたメディアデータを選択することによって、前記マッチングされたメディアデータを選択するように構成される、請求項６に記載のサービスシステム。
前記処理ユニットは、前記好み分析結果との前記マッチング程度が前記所定の閾値以上である少なくとも１つの前記メディアデータから前記マッチングされたメディアデータをランダムで選択するように構成される、請求項７に記載のサービスシステム。
前記メディアデータのそれぞれは、可読性のある文字形式で表されている少なくとも１つの名称データを含み、
前記処理ユニットは、
前記文字データに前記名称データのいずれか１つに関連する少なくとも１つの単語があるかどうかを判断し、
前記文字データに前記名称データのいずれか１つに関連する少なくとも１つの前記単語があると判断される場合において、前記文字データが前記明確な要求に属すると判断し、且つ、前記名称データのいずれか１つに関連する少なくとも１つの前記単語を少なくとも１つの前記キーワードとし、
前記文字データに前記名称データのいずれか１つに関連する少なくとも１つの前記単語がないと判断される場合において、前記文字データが前記曖昧な要求に属すると判断することにより、前記文字データが前記明確な要求または前記曖昧な要求に属するかを判断するように構成される、請求項６に記載のサービスシステム。
さらに、出力モジュールを含み、
前記メディアデータのそれぞれは、ファイル識別データを含み、
前記処理ユニットは、
前記指定のメディアデータの前記ファイル識別データに基づいて、前記指定のメディアデータに対応する前記メディアファイルを得て、前記出力モジュールに前記指定のメディアデータに対応する前記メディアファイルを出力させるように前記出力モジュールを制御することにより、前記指定のメディアデータに対応する前記メディアファイルが出力されるようにするように構成され、
前記マッチングされたメディアデータの前記ファイル識別データに基づいて前記マッチングされたメディアデータに対応する前記メディアファイルを得て、前記出力モジュールに前記マッチングされたメディアデータに対応する前記メディアファイルを出力させるように前記出力モジュールを制御することにより、前記マッチングされたメディアデータに対応する前記メディアファイルが出力されるようにするように構成される、請求項６に記載のサービスシステム。
機械学習技術により実現される言語処理モデル及び命令を含むコンピュータプログラムであって、該コンピュータプログラムが電子装置により実行されると、前記電子装置に請求項１から５のいずれか一項に記載の方法を実行させる、コンピュータプログラム。