WO2023218993A1

WO2023218993A1 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: WO2023218993A1
Application number: PCT/JP2023/016700
Authority: WO
Inventors: 正行佐賀野; 慶子洞; 次郎川野; 裕也由田; 寛菜富永; 鈴奈伊藤; 丈松井; 崇藤岡
Original assignee: ソニーグループ株式会社
Priority date: 2022-05-10
Filing date: 2023-04-27
Publication date: 2023-11-16

Abstract

スマートフォン（「情報処理装置」の一例に相当）は、録音編集アプリ（「音源データの録音機能および編集機能を有するアプリ」の一例に相当）を実行可能に設けられるアプリ実行部と、録音編集アプリを介してユーザにより高音質化の対象とする上記音源データの選択が行われた場合に、選択された上記音源データの種別に連動して上記高音質化のメニューを表示部に可変表示させる表示制御部と、を備える。

Description

情報処理装置、情報処理方法およびプログラム

　本開示は、情報処理装置、情報処理方法およびプログラムに関する。

　近年、スマートフォンやタブレット端末といった携帯型の情報処理装置の普及が目覚ましい。また、これら携帯型の情報処理装置は、処理能力の高性能化も急速に進んでおり、ユーザは、かかる情報処理装置を用いて、個人で手軽に音楽や映像等の各種メディアコンテンツを制作することが可能になってきている。

　音楽コンテンツの制作に関しては、情報処理装置で動作する録音編集用のアプリケーションソフトウェア（アプリ）が知られている。ユーザは、かかるアプリを用いて、情報処理装置が録音したあるいは外部から購入した音源データの編集作業を自由度高く行うことができる。

　また、録音編集用のアプリには、ネットワークを介し、複数の情報処理装置で録音された音源データを編集可能とすることで、複数のユーザの共同での音楽コンテンツの制作を支援するものもある（例えば、特許文献１参照）。

国際公開第２０１９／１０２７３０号

　しかしながら、上述した従来技術には、ユーザが音楽コンテンツを制作する際の利便性をより向上させるうえで、さらなる改善の余地がある。

　そこで、本開示では、ユーザが音楽コンテンツを制作する際の利便性より向上させることができる情報処理装置、情報処理方法およびプログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、音源データの録音機能および編集機能を有するアプリを実行可能に設けられるアプリ実行部と、前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させる表示制御部と、を備える。

本開示の実施形態に係る情報処理方法の概要説明図である。本開示の実施形態に係るスマートフォンの構成例を示すブロック図である。本開示の実施形態に係るサーバ装置の構成例を示すブロック図である。トラック追加時のＵＩ例を示す図である。トラック選択時のＵＩ例を示す図（その１）である。トラック選択時のＵＩ例を示す図（その２）である。トラック選択時のＵＩ例を示す図（その３）である。トラック種別の変更時のＵＩ例を示す図である。高音質化処理実行時のＵＩ例を示す図（その１）である。高音質化処理の内容を示す図である。高音質化処理実行時のＵＩ例を示す図（その２）である。高音質化処理実行時のＵＩ例を示す図（その３）である。高音質化処理実行時のＵＩ例を示す図（その４）である。高音質化処理実行時のＵＩ例を示す図（その５）である。高音質化処理の通知内容を示す図である。高音質化処理実行中の状態を示す図である。高音質化処理実行時のＵＩ例を示す図（その６）である。高音質化処理実行時のＵＩ例を示す図（その７）である。トラック名の命名規則の説明図（その１）である。トラック名の命名規則の説明図（その２）である。高音質化処理実行時のＵＩ例を示す図（その８）である。非表示／表示切り替え時のＵＩ例を示す図である。カウントイン機能に関するＵＩ例を示す図（その１）である。カウントイン機能に関するＵＩ例を示す図（その２）である。カウントイン機能に関するＵＩ例を示す図（その３）である。情報処理システムが高音質化処理を行う場合の処理シーケンスを示す図である。スマートフォンの機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　また、以下では、本開示の実施形態に係る情報処理装置が、ユーザの利用するスマートフォン１０である場合を主たる例に挙げて説明を行う。また、以下では、スマートフォン１０で動作する録音編集用のアプリを「録音編集アプリ」と言う。

　また、以下では、スマートフォン１０によって録音される、あるいは外部から購入されてスマートフォン１０のストレージに記憶されている音源データのことを適宜「トラック」と言う。

　また、以下では、本開示の実施形態に係る録音編集アプリにおいて各トラックを高音質化させる機能のことを高音質化機能と言う。高音質化機能は、後に示す図面において「Studio　tuning」や「STUDIO　TUNING」と図示される場合がある。また、高音質化機能によって実行される処理のことを「高音質化処理」と言う。

　また、以下に示す項目順序に従って本開示を説明する。
　　１．概要
　　２．スマートフォンの構成例
　　３．サーバ装置の構成例
　　４．録音編集アプリにおけるＵＩ例
　　　４－１．トラック追加時
　　　４－２．トラック選択時
　　　４－３．トラック種別の変更時
　　　４－４．高音質化処理実行時
　　　４－５．非表示／表示切り替え時
　　　４－６．カウントイン機能
　　５．処理シーケンス
　　６．変形例
　　７．ハードウェア構成
　　８．むすび

＜＜１．概要＞＞
　図１は、本開示の実施形態に係る情報処理方法の概要説明図である。本開示の実施形態に係る情報処理方法は、情報処理システム１が実行する。図１に示すように、情報処理システム１は、スマートフォン１０と、サーバ装置１００とを含む。

　スマートフォン１０は、ユーザが利用する携帯型の情報処理装置である。スマートフォン１０は、本開示の実施形態に係る録音編集アプリを実行可能なプラットフォームを有する。

　図１に示すように、スマートフォン１０は、マイク１１と、スピーカ１２と、表示部１５とを有する。マイク１１は、スマートフォン１０の長手方向の送話口寄りの一端部に設けられる。スピーカ１２は、上記一端部に対する受話口寄りの他端部に設けられる。

　表示部１５は、後述する操作部１４（図２参照）と一体化したタッチスクリーンとして実現され、矩形形状を有する。タッチスクリーンは、ユーザのタッチ操作を検出する。タッチスクリーンの検出方式としては、静電容量方式、抵抗膜方式、表面弾性波方式（又は超音波方式）、赤外線方式、電磁誘導方式および荷重検出方式などの公知の方式が用いられる。

　タッチスクリーンは、スマートフォン１０で録音編集アプリが実行されている場合、録音編集アプリに関する各種のユーザインターフェイス（User　Interface；ＵＩ）を表示し、かかるＵＩに対するユーザのタッチ操作を検出する。

　また、マイク１１は、録音編集アプリにおいて録音を開始する操作が行われた場合、音源（例えば楽器）から発せられる音を集音し、録音に際し予め指定されたトラック種別の音源データとして収録させる。また、スピーカ１２は、録音編集アプリにおいて音源データを再生する操作が行われた場合、再生に際して選択された音源データを出力する。

　ところで、従来の録音編集アプリは、ユーザが音楽コンテンツを制作する際の利便性をより向上させるうえで、さらなる改善の余地がある。

　既に述べた通り、スマートフォン１０をはじめとする携帯型の情報処理装置は近年、処理能力の高性能化が急速に進んでおり、ユーザは、録音編集アプリを用いて、個人で手軽に音楽コンテンツを制作することが可能となっている。また、これに伴って、ユーザが、制作した音楽コンテンツを例えばＳＮＳ（Social　Network　Service）や動画配信サービスなどに公開する機会も増えてきている。

　このため、昨今、ユーザが自身の制作する音楽コンテンツの高音質化を求めるニーズも高まっている。なお、ここに言う「高音質化」の例としては、例えば１つのマイク１１を用いて収録されたトラックに含まれる複数の異なる音源を分離する「音源分離」や、ノイズを除去する「ノイズ除去」、不要な残響を除去する「残響除去」などを挙げることができる。この他にも、高性能なマイクのマイク特性を再現する「マイクシミュレート」や、レコーディングスタジオ等が持つ固有の反響を付加する「スタジオシミュレート」などを挙げることができる。

　従来の録音編集アプリは、こうした高音質化機能に関する拡充が十分ではないという実情があった。例えば、１つのトラックは、単一の音源で録音されたり、複数の音源を含んで録音されたりとその種別は様々である。そして、複数の音源を含むトラックは前述の「音源分離」の処理対象となりうるが、単一の音源のトラックはその処理対象とはなりえない。従来の録音編集アプリを用いる場合、ユーザは、こうしたトラック種別に応じた違いを自身が把握し、自身で高音質化に関する設定内容を逐一指定する必要があった。

　そこで、本開示の実施形態に係る情報処理方法では、スマートフォン１０は、高音質化の対象として選択された音源データの種別に連動して高音質化のメニューを可変表示させることとした。

　具体的には、図１に示すように、スマートフォン１０はまず録音編集アプリを実行する（ステップＳ１）。そして、スマートフォン１０は、録音編集アプリにおいて、高音質化の対象として選択された音源データの種別に連動して高音質化のメニューを可変表示させる（ステップＳ２）。

　このように、言わば音源データの種別に応じたメニューの自動化を行うことで、ユーザは、トラック種別に応じた違いを自身が把握し、自身で高音質化に関する設定内容を逐一指定する必要がなくなる。また、ユーザが、間違った指定を行ってしまうことを防ぐことができる。すなわち、ユーザが音楽コンテンツを制作する際の利便性をより向上させることができる。なお、ステップＳ２の場合を含む本開示の実施形態に係る録音編集アプリの各種のＵＩの具体例については、図４以降を用いた説明で後述する。

　そして、スマートフォン１０は、高音質化に関し、可変表示させたメニューを介して指定された内容とともに音源データをサーバ装置１００へ送信する（ステップＳ３）。

　サーバ装置１００は、携帯電話回線網やインターネット等であるネットワークＮを介し、スマートフォン１０と通信可能に設けられた装置である。サーバ装置１００は、例えばクラウドサーバとして実現される。

　サーバ装置１００は、高音質化処理モデル１０２ａ（図３参照）を有しており、かかる高音質化処理モデル１０２ａを用いた高音質化処理を実行可能に設けられる。高音質化処理モデル１０２ａは、例えば深層学習のアルゴリズムを用いて学習されたＤＮＮ（Deep　Neural　Network）モデルである。

　サーバ装置１００は、かかる高音質化処理モデル１０２ａを用いたＡＩ（Artificial　Intelligence）処理により、スマートフォン１０から取得した音源データに対し高音質化処理を実行する（ステップＳ４）。そして、サーバ装置１００は、高音質化後のデータをスマートフォン１０へ向けて送信し、スマートフォン１０はこれを受信する（ステップＳ５）。

　なお、サーバ装置１００が、処理負荷の高い高音質化処理をクラウドサーバモデルにより統合的に実行することで、スマートフォン１０は、高音質化処理の間も、高音質化処理に影響を与えない範囲で録音編集アプリの使用を継続したり、他のアプリを実行したりすることができる。

＜＜２．スマートフォンの構成例＞＞
　次に、スマートフォン１０の構成例について説明する。図２は、本開示の実施形態に係るスマートフォン１０の構成例を示すブロック図である。なお、図２および後に示す図３では、本開示の実施形態の特徴を説明するために必要な構成要素のみを表しており、一般的な構成要素についての記載を省略している。

　換言すれば、図２および図３に図示される各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。例えば、各ブロックの分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することが可能である。

　また、図２および図３を用いた説明では、既に説明済みの構成要素については、説明を簡略するか、省略する場合がある。

　図２に示すように、スマートフォン１０は、マイク１１と、スピーカ１２と、通信部１３と、操作部１４と、表示部１５と、記憶部１６と、制御部１７とを有する。

　マイク１１およびスピーカ１２については説明済みのため、ここでは説明を省略する。通信部１３は、通信モジュール等によって実現される。通信部１３は、前述のネットワークＮに対し無線接続され、ネットワークＮを介したサーバ装置１００との間の通信を実現する。

　操作部１４は、スマートフォン１０に搭載された操作部品であり、例えばタッチパネルにより実現される。表示部１５は、スマートフォン１０に搭載された表示部品であり、例えばディスプレイにより実現される。

　なお、操作部１４と表示部１５とは例えば一体化され、前述のタッチスクリーンを構成する。したがって、操作部１４は、表示部１５に表示されるソフトウェア部品であってもよく、例えば録音編集アプリが表示部１５上に操作可能に表示させるＧＵＩ（Graphical　User　Interface）であってもよい。

　記憶部１６は、例えば、ＲＡＭ（Random　Access　Memory）、ＲＯＭ（Read　Only　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子などによって実現される。図２に示す例では、記憶部１６は、アプリ情報１６ａを記憶する。アプリ情報１６ａは、録音編集アプリのプログラムや、録音編集アプリの動作中に用いられる各種のパラメータ等を含む情報である。

　制御部１７は、コントローラ（controller）であり、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、記憶部１６に記憶されている本開示の実施形態に係るプログラムがＲＡＭを作業領域として実行されることにより実現される。また、制御部１７は、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現することができる。

　制御部１７は、アプリ実行部１７ａと、表示制御部１７ｂと、通信制御部１７ｃとを有し、以下に説明する情報処理の機能や作用を実現または実行する。

　アプリ実行部１７ａは、記憶部１６に記憶されているアプリ情報１６ａを読み込んで録音編集アプリを実行する。アプリ実行部１７ａは、例えば、操作部１４から入力される録音編集アプリにおけるトラック追加時の操作内容に応じて、トラックを追加する。

　また、アプリ実行部１７ａは、例えば、操作部１４から入力される録音編集アプリにおけるトラック選択時の操作内容に応じて、トラックを選択する。また、アプリ実行部１７ａは、例えば、操作部１４から入力される録音編集アプリにおけるトラック種別の変更時の操作内容に応じて、音源データのトラック種別を変更する。

　また、アプリ実行部１７ａは、例えば、操作部１４から入力される録音編集アプリにおける高音質化処理実行時の操作内容に応じて、高音質化処理を実行する。また、アプリ実行部１７ａは、例えば、操作部１４から入力される録音編集アプリにおけるトラックの非表示／表示切り替えに関する操作内容に応じて、トラックの非表示／表示を切り替える。また、アプリ実行部１７ａは、例えば、操作部１４から入力される録音編集アプリにおけるカウントイン機能に関する操作内容に応じて、カウントイン機能を実行する。

　また、アプリ実行部１７ａは、これら録音編集アプリの実行に際しての各種の操作内容に応じ、各種のＵＩを含む視覚情報の表示制御を表示制御部１７ｂに行わせる。各種のＵＩの具体例については、図４～図２５を用いた説明で後述する。

　表示制御部１７ｂは、アプリ実行部１７ａの指示に基づいて、録音編集アプリを実行するに際しての表示部１５に対する視覚情報の表示制御を行う。通信制御部１７ｃは、録音編集アプリを実行するに際してのサーバ装置１００に対する通信制御を行う。

　通信制御部１７ｃは、通信部１３を介し、例えば高音質化処理の対象となる音源データをサーバ装置１００へ向けてアップロードする。また、通信制御部１７ｃは、通信部１３を介し、例えばサーバ装置１００において高音質化処理が行われた高音質化処理済みのデータをサーバ装置１００からダウンロードする。

＜＜３．サーバ装置の構成例＞＞
　次に、サーバ装置１００の構成例について説明する。図３は、本開示の実施形態に係るサーバ装置１００の構成例を示すブロック図である。

　図３に示すように、サーバ装置１００は、通信部１０１と、記憶部１０２と、制御部１０３とを有する。

　通信部１０１は、上述した通信部１３と同様に、通信モジュール等によって実現される。通信部１０１は、前述のネットワークＮに対し有線接続または無線接続され、ネットワークＮを介したスマートフォン１０との間の通信を実現する。

　記憶部１０２は、上述した記憶部１６と同様に、例えば、ＲＡＭ、ＲＯＭ、フラッシュメモリ等の半導体メモリ素子などによって実現される。また、記憶部１０２は、ハードディスク装置や光ディスク装置などのディスク装置によって実現される。図３に示す例では、記憶部１０２は、高音質化処理モデル１０２ａを記憶する。

　高音質化処理モデル１０２ａは、既に述べた通り、例えば深層学習のアルゴリズムを用いて学習されたＤＮＮモデルである。なお、高音質化処理モデル１０２ａの学習アルゴリズムは、深層学習に限られない。高音質化処理モデル１０２ａは、後述する高音質化処理部１０３ｂによって読み込まれ、処理対象となる音源データが入力された場合に、指定された設定内容（オプション）で当該音源データに対する高音質化処理を施し、高音質化処理済みのデータを出力する。

　制御部１０３は、上述した制御部１７と同様に、コントローラであり、例えば、ＣＰＵやＭＰＵ等によって、記憶部１０２に記憶されている図示略の各種プログラムがＲＡＭを作業領域として実行されることにより実現される。また、制御部１０３は、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現することができる。

　制御部１０３は、取得部１０３ａと、高音質化処理部１０３ｂと、送信部１０３ｃとを有し、以下に説明する情報処理の機能や作用を実現または実行する。

　取得部１０３ａは、通信部１０１を介し、スマートフォン１０において指定された高音質化処理のオプション、および、処理対象となる音源データを取得する。また、取得部１０３ａは、取得した各データを高音質化処理部１０３ｂへ出力する。

　高音質化処理部１０３ｂは、記憶部１０２から高音質化処理モデル１０２ａへ読み込み、取得部１０３ａから受け取った各データを高音質化処理モデル１０２ａへ入力する。また、高音質化処理部１０３ｂは、高音質化処理モデル１０２ａから出力される高音質化処理済みのデータを取得し、送信部１０３ｃへ出力する。

　送信部１０３ｃは、通信部１０１を介し、高音質化処理部１０３ｂから受け取った高音質化処理済みのデータをスマートフォン１０へ向けて送信する。

＜＜４．録音編集アプリにおけるＵＩ例＞＞
　次に、本開示の実施形態に係る録音編集アプリにおける各種のＵＩ例について、図４～図２５を用いて順次説明する。

＜４－１．トラック追加時＞
　まず、録音編集アプリの録音画面におけるトラック追加時のＵＩ例から説明する。図４は、トラック追加時のＵＩ例を示す図である。

　録音編集アプリを起動すると、前述の表示制御部１７ｂは、図４に示すように、録音画面選択ボタンＲＢおよび編集画面選択ボタンＥＢを表示させる。そして、ユーザが録音画面選択ボタンＲＢをタッチ操作すると、表示制御部１７ｂは、図４の左図に示すように、トラック追加ボタンＡ１を含むトラック追加画面を表示させる。

　そして、ユーザがトラック追加ボタンＡ１をタッチ操作すると、表示制御部１７ｂは、図４の中央図に示すように、トラック種別選択画面Ａ２を表示させる。本開示の実施形態に係る録音編集アプリでは、例えば音源となる楽器ごとに高音質化処理において指定可能なオプション等が異なるため、トラック追加時にトラック種別選択画面Ａ２においてユーザにトラック種別を選択させる。

　ここで、図４の中央図に示すように、ユーザがトラック種別Ｔ３を選択したものとする。トラック種別Ｔ３は、音源としてボーカルおよびギター（図中の「Vocals　&　Guitar」参照）の複数音源を含む音源データの種別に該当する。すなわち、トラック種別Ｔ３は、複数の楽器を同時に録音する録音モードを選択する場合に指定される。

　かかる録音モードで録音された音源データは、高音質化処理のオプションの一つである前述の「音源分離」を実行することで、録音後に楽器ごとの音の音源データに分離することができる。

　そして、トラック種別Ｔ３が選択されると、表示制御部１７ｂは、図４の右図に示すように、トラック種別選択画面Ａ２を消去し、トラック種別Ｔ３に対応するアイコンＩ３を表示させる。そのうえで、図４の右図に示すように、ユーザが録音ボタンＳＢをタッチ操作すれば、アプリ実行部１７ａは録音動作を開始させ、表示制御部１７ｂは、かかる録音動作に応じた入力波形のリアルタイム表示等を行うこととなる。

＜４－２．トラック選択時＞
　次に、録音編集アプリの編集画面におけるトラック選択時のＵＩ例について説明する。図５～図７は、トラック選択時のＵＩ例を示す図（その１）～（その３）である。ユーザが前述の編集画面選択ボタンＥＢをタッチ操作すると、表示制御部１７ｂは、図５に示すように、編集画面を表示させる。

　編集画面では、図５に示すように、編集対象の候補となる音源データがリスト表示される。ここで、ユーザが編集したい音源データをタッチ操作すると、該当の音源データが選択され、図中のＭ１部に示すように、選択された音源データがハイライト表示される。すなわち、表示制御部１７ｂは、かかるハイライト表示によって選択された音源データを明示する。

　なお、図５に示すように、各音源データにはタグＲが付与され、表示されている。表示制御部１７ｂは、かかるタグＲの表示を変更することによって、選択された音源データを明示することができる。例えば、図５に示すように、音源データ「Track_1」が選択されたものとする。

　すると、表示制御部１７ｂは、図６に示すように、例えば当該「Track_1」のタグＲ１を「Track_1」が表示されている行の行方向に向けて延伸するようにタグＲ１を拡大表示する。表示制御部１７ｂは、かかるタグＲ１の拡大表示によって、選択された音源データを明示することができる。

　また、表示制御部１７ｂは、図７に示すように、例えば「Track_1」のタグＲ１を含む「Track_1」が表示されている行の幅全体を拡げる拡大表示を行うこともできる。表示制御部１７ｂは、かかる行の幅全体を拡げる拡大表示によっても、選択された音源データを明示することができる。なお、音源データの選択が解除された場合、表示制御部１７ｂは、図６および図７に示した各拡大表示を解消して選択前の状態に表示を戻す。

＜４－３．トラック種別の変更時＞
　次に、編集画面におけるトラック種別の変更時のＵＩ例について説明する。図８は、トラック種別の変更時のＵＩ例を示す図である。編集画面において選択された音源データに対しユーザが所定のタッチ操作を行うと、図８に示すように、表示制御部１７ｂは、該当の音源データに対する所定の操作を行うことができるトラックメニューＴＭを表示させる。

　トラックメニューＴＭでは、「トラック種別の変更（Change　track　type）」、「トラック名の変更（Change　track　name）」、「複製（Duplicate）」、「削除（Delete）」が可能である。

　図８の例では、ユーザが、アイコンＩ３に対応するトラック種別Ｔ３の音源データ「Track_1」を選択し、図中のＭ２部に示すように、さらに「トラック種別の変更」を選択したものとする。

　すると、表示制御部１７ｂは、図８の中央図に示すように、トラック種別の変更画面ＣＴを表示させる。ここで、ユーザは同図に示すように、トラック種別Ｔ１を選択したものとする。トラック種別Ｔ１は、単一音源であるボーカル（図中の「Vocals」参照）の音源データに該当する。

　すると、表示制御部１７ｂは、図８の下図に示すように、該当の「Track_1」に関し、トラック種別Ｔ１に対応するアイコンＩ１を表示させる。なお、単一音源のトラック種別Ｔ１への変更を行うと、高音質化処理のオプションとして、前述の「音源分離」は選択できなくなる。すなわち、ユーザは、図８に示したトラック種別の変更を行うことによって、高音質化処理において選択可能となるオプションを任意に変更することができる。

＜４－４．高音質化処理実行時＞
　次に、編集画面における高音質化処理実行時のＵＩ例について説明する。図９は、高音質化処理実行時のＵＩ例を示す図（その１）である。また、図１０は、高音質化処理の内容を示す図である。また、図１１～図１４は、高音質化処理実行時のＵＩ例を示す図（その２）～（その５）である。また、図１５は、高音質化処理の通知内容を示す図である。また、図１６は、高音質化処理実行中の状態を示す図である。

　また、図１７および図１８は、高音質化処理実行時のＵＩ例を示す図（その６）および（その７）である。また、図１９および図２０は、トラック名の命名規則の説明図（その１）および（その２）である。また、図２１は、高音質化処理実行時のＵＩ例を示す図（その８）である。

　図９の上図に示すように、ユーザが音源データのいずれか（ここでは「Track_1」）を選択した状態で、編集画面における高音質化（STUDIO　TUNING）ボタンＴＢをタップ操作すると、表示制御部１７ｂは、図９の下図に示すように、高音質化処理実行画面を表示させる。

　高音質化処理実行画面には、図中のＤ１部に示すように、選択された音源データのデータ容量のほか、Ｄ２部に示すように利用可能な残りのデータ容量が表示される。また、高音質化処理実行画面には、高音質化処理において選択可能なオプションを示す高音質化のメニューＭ３が表示される。

　図１０に示すように、本開示の実施形態では、前述した「音源分離（Audio　Separation）」、「ノイズ除去（De-noise）」、「残響除去（De-reverb）」、「マイクシミュレート（Mic　simulation）」、「スタジオシミュレート（Studio　simulation）」等の高音質化処理を実行可能とする。

　図１を用いて説明したように、本開示の実施形態に係る情報処理方法では、高音質化処理モデル１０２ａを用いたＡＩ処理により、スマートフォン１０から取得した音源データに対し高音質化処理を実行する。これにより、音源データをプロのスタジオクオリティの音質にアップコンバートすることができる。

　「音源分離」については、既に述べた点以外を補足すると、スマートフォン１０側では分離した音を個別に聴いたり、ユーザの任意の音量バランスでミックスを行ったりすることができる。

　また、「ノイズ除去」について補足すると、「音源分離」の技術を利用することにより、例えばトラック種別Ｔ３の音源データに含まれるボーカルやギターの音から、それ以外のあらゆる音をノイズとして分離除去することができる。

　また、「残響除去」について補足すると、ＡＩ処理により、一般的な家屋における残響（部屋の反響）を抑制および除去し、スタジオ録音素材のような音質に作り替えることができる。

　また、「マイクシミュレート」について補足すると、高性能な真空管式コンデンサーマイクロホンの周波数特性を再現することができる。

　また、「スタジオシミュレート」については、エフェクトとしてのリバーブを付加することなく、レコーディングスタジオ等が持つ固有の反響を付加することができる。

　そして、表示制御部１７ｂは、選択された音源データの種別に連動して高音質化のメニューＭ３を可変表示させる。例えば、表示制御部１７ｂは、トラック種別Ｔ３の音源データが選択された場合、図１１に示すように、「Audio　Separation　&　De-noise」、「De-reverb」、「Mic　Simulation」、「Studio　simulation」がそれぞれ選択可能なメニューＭ３を表示させる。

　なお、「音源分離」では、選択されたトラック種別とそれ以外とに分離される。したがって、トラック種別Ｔ３の場合、ボーカルの音と、ギターの音と、その他の音とに分離される。本開示の実施形態では、複数音源としてボーカルおよびギターを例に挙げているが、ピアノやドラムといったその他の楽器についても、高音質化処理モデル１０２ａの学習対象とすることで分離対象とすることは可能である。

　そして、サーバ装置１００は、分離した音のうち、選択されたトラック種別が示す音のデータのみをスマートフォン１０へ送信する。ノイズはその他の音に含まれるため、「音源分離」が行われることでノイズも除去される。よって図１１に示すように、表示制御部１７ｂは、メニューＭ３において選択可能なオプション名として「Audio　Separation　&　De-noise」を表示する。

　同様に、表示制御部１７ｂは、例えば前述のトラック種別Ｔ１である「Vocals」の音源データが選択された場合、図１２に示すように、「De-noise」、「De-reverb」、「Mic　Simulation」、「Studio　simulation」がそれぞれ選択可能なメニューＭ３を表示させる。

　トラック種別が単一音源の場合でも、サーバ装置１００は、上述したように「ノイズ除去」に「音源分離」の技術を利用する。ただし、サーバ装置１００は、スマートフォン１０に対し単一音源の音のデータを送信するのみで、複数回に分けた送信を行うわけではない。このため、オプション名は「Audio　separation　&　De-noise」ではなく、「De-noise」となる。

　同様に、表示制御部１７ｂは、例えばトラック種別「Guitar」の音源データが選択された場合、図１３に示すように、「De-noise」、「Studio　simulation」がそれぞれ選択可能なメニューＭ３を表示させる。例えばトラック種別「Guitar」の音源データがマイク１１を介して録音されたものではなく、ユーザが購入した音源データ等である場合、図１３に示すように「De-reverb」や「Mic　Simulation」は選択不要として非表示にすることができる。

　そして、図１４に示すように、ユーザが高音質化処理実行画面において選択スイッチＳＷによってオプションを指定し、実行（EXECUTE）ボタンＥＸＢをタッチ操作すると、高音質化処理が実行される。表示制御部１７ｂは、高音質化処理の実行中、図中のＭ４部に示すように、高音質化処理の進捗状況を通知する。

　図１５に示すように、表示制御部１７ｂは、その通知内容として、「アップロード中」、「チューニング中」、「ダウンロード中」およびその進捗状況を示すインジケータを表示させる。また、図示は略しているが、完了後は完了通知を表示させる。

　「アップロード中」、「チューニング中」、「ダウンロード中」は、図１６に示す各工程に対応する。なお、高音質化処理は時間がかかるため、スマートフォン１０では、図１６に示すように、機能制限ありではあるが、録音編集アプリの継続使用は可となる。また、他アプリの使用は可である。例えばユーザが他アプリを使用して高音質化処理の完了を待つ場合、高音質化処理の進捗状況は、図１５および図１６に示すように表示部１５の通知パネル１５ａに表示される。

　また、録音編集アプリを継続使用して高音質化処理の完了を待つ場合、ユーザは、高音質化処理中のトラック以外の他のトラックについては、録音および編集が可能である。また、高音質化処理中のトラックは、再生に関する操作のみが可能である。再生に関する操作は、再生、ミュート、音量調整等である。したがって、高音質化処理中のトラックは、トリミングやコンピングといった編集を施すことはできない。これにより、高音質化処理の対象となったトラックの整合性を確保することができる。

　そして、高音質化処理が完了すると、図１８に示すように、録音編集アプリの編集画面には、高音質化処理済みの各トラックがリスト表示される。このとき、表示制御部１７ｂは、高音質化処理済みの各トラックを、高音質化処理前のトラックよりも上の位置に表示させる。また、表示制御部１７ｂは、高音質化処理済みであることを示すアイコンＤＩを併せて表示させる。

　また、表示制御部１７ｂは、高音質化処理前のトラックについては、その表示を例えばグレーアウトさせる。また、かかる高音質化処理前のトラックは、ミュートされた状態となる。

　高音質化処理前のトラックは基本的に不要なので、高音質化処理後は自動的にミュート状態となる。なお、ユーザは、高音質化処理済みのトラックと高音質化処理前のトラックとでミュート状態を切り替えて聴き比べを行うことができる。そのうえでユーザは、高音質化処理済みのトラックが気に入らなかった場合は、高音質化処理前のトラックをミュート状態にしたうえで高音質化処理済みのトラックの編集を行ったり、再度高音質化処理を実行したりすることができる。再度高音質化処理を実行する場合、ユーザは指定するオプションを従前とは変更することもできる。

　また、アプリ実行部１７ａは、高音質化処理済みのトラックに対し、高音質化処理前とは異なるトラック名を命名する。その基本的な命名規則は、図１９に示すように、高音質化処理前のオリジナルトラック名に対し、（Tuned）を付加したものとなる。

　そして、「音源分離」を行った場合、前述の（Tuned）が（Tuned_音源名）の形式となる形でトラック名が命名される。例えば前述のトラック種別Ｔ３の音源データが音源分離された場合、図２０に示すように、高音質化処理済みのボーカルの音のトラックは、トラック名が「オリジナルトラック名（Tuned_Vo）」となる。また、高音質化処理済みのギターの音のトラックは、トラック名が「オリジナルトラック名（Tuned_Gt）」となる。

　このように、高音質化処理前と高音質化処理済みとでトラック名を変更することにより、例えば各トラックをファイル出力する際に、ファイル名をトラック名＋拡張子の形式とすることで、ファイル出力後にもファイル名のみで高音質化処理済みであるか否かを即座に識別することが可能となる。

　また、表示制御部１７ｂは、図１８に示したように、高音質化処理済みのトラックに対し、命名されたトラック名を重畳表示するとともに、高音質化処理済みのトラック種別に応じたアイコンを表示させる。

　図２０の例の場合、高音質化処理前のトラックに対して表示されていたアイコンＩ３は、高音質化処理済みの各トラックでは、アイコンＩ１，Ｉ２となる。このように、表示制御部１７ｂは、高音質化処理済み、特に音源分離済みであることを、トラック種別を示すアイコンおよびトラック名によって明示する。

　また、表示制御部１７ｂは、図２１に示すように、高音質化処理済みであることを示すアイコンＤＩがユーザによってタッチ操作された場合、施された高音質化処理の内容を示すポップアップＰ１を表示させる。これにより、ユーザは、アイコンＤＩをタッチ操作するという簡単な操作で、該当のトラックに対し施された高音質化処理の内容を即座に把握することができる。

＜４－５．非表示／表示切り替え時＞
　なお、スマートフォン１０のような携帯型の情報処理装置は、表示部１５の表示領域が限られるため、ユーザが、削除まではしないが当面不要なトラックを非表示としたい場合もある。かかる場合、録音編集アプリは、トラックの非表示／表示切り替え画面を表示させることができる。

　図２２は、非表示／表示切り替え時のＵＩ例を示す図である。図２２に示すように、非表示／表示切り替え画面では、録音編集アプリの編集対象となりうる各トラックがリスト表示される。

　そして、各リストにはチェックボックスＣＢが設けられている。ユーザは、かかる非表示／表示切り替え画面において、表示を残したいトラックについてのみチェックボックスＣＢで選択し、ＮＥＸＴボタンＮＢをタッチ操作する。すると、表示制御部１７ｂは以降、チェックボックスＣＢで選択されたトラックのみを表示対象とし、選択されなかったトラックは非表示とする。非表示となったトラックは、自動的にミュート状態となり、再生対象からも外れることとなる。

　これにより、ユーザは、表示部１５におけるトラックのリスト表示を見やすくまた編集しやすくなるように、任意かつ容易に変更することが可能となる。

＜４－６．カウントイン機能＞
　また、本開示の実施形態に係る録音編集アプリは、カウントイン機能を有する。カウントイン機能は、録音画面において、録音開始にタイミングを合わせてカウントをとる機能である。録音編集アプリは、かかるカウントイン機能を、表示部１５へのカウント表示およびスピーカ１２からのカウント出力を行うことによって実現する。

　図２３～図２５は、カウントイン機能に関するＵＩ例を示す図（その１）～（その３）である。ユーザが、録音編集アプリの録音画面から所定の操作によってカウントイン機能の利用を指定すると、表示制御部１７ｂは、図２３に示すようにカウントイン機能の設定画面を表示させる。

　かかる設定画面には、テンポ（図中の「Tempo」参照）の設定部、カウント音の設定部のほか、拍子の設定部ＴＳ、および、カウントインの長さの設定部ＣＩが設けられている。テンポは、任意の数値を指定することで設定することができる。カウント音は、メトロノーム（図中の「Metronome」参照）によるカウント音や、ドラムスティックによるカウント音などを選択することができる。

　また、ユーザは、設定部ＴＳから４分の４拍子、４分の３拍子、８分の６拍子などを選択して設定することができる。また、ユーザは、設定部ＣＩをタッチ操作することによって展開される設定部ＣＩ１からは、カウントインの長さを示す小節数を１小節以上、例えば１小節、２小節、４小節、８小節の中から選択して設定することができる。

　ここで、ユーザが、図２３のＭ５，Ｍ６部に示すように、拍子として４分の４拍子を選択し、小節数として４小節（4　bars）を選択したものとする。そして、図２４に示すように、ユーザは、録音画面において、曲位置カーソルＩｎをタイムスタンプ「２５」に位置付け、かかる位置を録音開始位置として録音ボタンＳＢをタッチ操作したものとする。

　すると、表示制御部１７ｂは、図２５に示すように、曲位置カーソルＩｎをタイムスタンプ「２５」の４小節前に該当する位置へ自動的にスキップさせ、当該位置からのカウントインを開始する。

　すなわち、表示制御部１７ｂは、設定されたテンポに応じて曲位置カーソルＩｎを移動させるとともに、カウント表示エリアＣＲに対するカウント表示を行う。なお、表示制御部１７ｂは、録音開始位置の直前の１小節に曲位置カーソルＩｎが到達するまでは、カウント表示エリアＣＲに対し、「－２」、「－１」、…のようにマイナス値からのカウントアップ表示を行う。図２５に示すように、「－２」は３小節前に、「－１」は２小節前に、それぞれ相当する。

　また、表示制御部１７ｂは、録音開始位置から１小節前では、カウント表示エリアＣＲに対し「１」からのカウントアップ表示を行う。図２３に示した４分の４拍子の設定であれば、表示制御部１７ｂは、図２５に示すように「１」、「２」、「３」、「４」と１～４までのカウントアップ表示をテンポに合わせて行う。

　なお、アプリ実行部１７ａは、表示制御部１７ｂが行う１小節前でのカウントアップ表示ごとに、カウントアップに同期してカウント音をスピーカ１２から出力させる。そして、曲位置カーソルＩｎが録音開始位置へ到達した時点から録音が開始されることとなる。

　このようなカウントイン機能によれば、ユーザは、例えば自身のリズムのとり方等に応じ、２小節以上に渡るカウントインの長さを選べるなど自由度高くカウントイン機能の設定を行うことができる。また、ユーザは、その設定に応じたカウントイン機能を利用しつつ、好みのタイミングで録音開始のタイミングをとることができる。

＜＜５．処理シーケンス＞＞
　次に、本開示の実施形態に係る情報処理システム１が高音質化処理を行う場合の処理シーケンスについて、図２６を用いて説明する。図２６は、情報処理システム１が高音質化処理を行う場合の処理シーケンスを示す図である。

　図２６に示すように、スマートフォン１０は、まず録音編集アプリを起動する（ステップＳ１０１）。そして、スマートフォン１０は、録音編集アプリの編集画面における高音質化ボタンＴＢに対するタッチ操作を検出する（ステップＳ１０２）。

　そして、スマートフォン１０は、高音質化ボタンＴＢに対するタッチ操作時に選択された音源データの種別に連動して高音質化のメニューＭ３を可変表示させる（ステップＳ１０３）。

　つづいて、スマートフォン１０は、可変表示されたメニューＭ３を介した高音質化処理のオプションの選択操作を検出する（ステップＳ１０４）。そして、スマートフォン１０は、選択されたオプションならびに音源データをサーバ装置１００へ送信する（ステップＳ１０５）。

　サーバ装置１００は、ステップＳ１０５でスマートフォン１０から送信されたデータを取得し、かかるデータに基づいてＡＩ処理による高音質化処理を実行する（ステップＳ１０６）。

　そして、サーバ装置１００は、高音質化処理が完了すると、高音質化処理済みのデータをスマートフォン１０へ送信する（ステップＳ１０７）。なお、実行された高音質化処理に音源分離処理が含まれる場合、サーバ装置１００は、分離した音源の分だけ高音質化処理済みのデータをスマートフォン１０へ送信する。このとき、音源以外のその他の音として分離されたデータは送信されない。

　そして、スマートフォン１０は、サーバ装置１００から送信された高音質化処理済みのデータを受信する（ステップＳ１０８）。ユーザは、かかる高音質化処理済みのデータを確認し、必要に応じて編集等を行う。

　また、再度高音質化処理を行いたい場合に、ユーザが編集画面において処理対象となる音源データを選択し、高音質化ボタンＴＢをタッチ操作すれば、スマートフォン１０は、ステップＳ１０２からの処理を繰り返すこととなる。

＜＜６．変形例＞＞
　ところで、上述してきた本開示の実施形態には、いくつかの変形例を挙げることができる。

　上述した本開示の実施形態では、録音編集アプリが、スマートフォン１０の備えるマイク１１が集音した音を収録することとしたが、かかる録音機能において用いられるマイクはスマートフォン１０に接続される外部マイクであってもよい。同様に、録音編集アプリが用いるスピーカは、スマートフォン１０の備えるスピーカ１２でなく、スマートフォン１０に接続される外部スピーカであってもよい。

　また、上述した実施形態では、サーバ装置１００が高音質化処理モデル１０２ａを用いた高音質化処理を実行することとしたが、スマートフォン１０がかかる高音質化処理を実行するようにしてもよい。

　かかる場合、サーバ装置１００は、高音質化処理モデル１０２ａを学習する学習装置として機能することとなる。また、スマートフォン１０は、サーバ装置１００から学習済みの高音質化処理モデル１０２ａの配信を受け、スマートフォン１０の中に高音質化処理モデル１０２ａを保有する。

　そして、スマートフォン１０は、ユーザによって高音質化処理を実行させる操作が行われた場合には、保有する高音質化処理モデル１０２ａを用いた高音質化処理を実行することとなる。かかる場合、高音質化処理のレスポンスを向上させることができるというメリットがある。一方で、スマートフォン１０は、高音質化処理を実行可能な処理能力を有する必要がある。

　また、上述した実施形態では、高音質化処理として「音源分離」、「ノイズ除去」、「残響除去」、「マイクシミュレート」、「スタジオシミュレート」を例に挙げたが、高音質化処理は無論これらに限定されない。

　例えば、「マイクシミュレート」は、複数の高性能マイクの中から一つのマイクをユーザが選択し、選択されたマイクのマイク特性を再現するものであってもよい。同様に、「スタジオシミュレート」は、複数の有名スタジオの中から一つのスタジオをユーザが選択し、選択されたスタジオが有する固有の反響を付加するものであってもよい。また、スタジオではなく、複数の有名なコンサート会場の中から一つのコンサート会場をユーザが選択し、選択されたコンサート会場が有する固有の反響を付加する「コンサートシミュレート」のような高音質化処理が行われてもよい。

　また、上述した本開示の実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

　また、上述した本開示の実施形態は、処理内容を矛盾させない領域で適宜組み合わせることが可能である。また、本実施形態のシーケンス図或いはフローチャートに示された各ステップは、適宜順序を変更することが可能である。

＜＜７．ハードウェア構成＞＞
　また、上述してきた本開示の実施形態に係るスマートフォン１０およびサーバ装置１００は、例えば図２７に示すような構成のコンピュータ１０００によって実現される。スマートフォン１０を例に挙げて説明する。図２７は、スマートフォン１０の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、二次記憶装置１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又は二次記憶装置１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又は二次記憶装置１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　二次記憶装置１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、二次記憶装置１４００は、プログラムデータ１４５０の一例であるアプリ情報１６ａに相当する本開示の実施形態に係るプログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、マイクやタッチパネル等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が本開示の実施形態に係るスマートフォン１０として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１７の機能を実現する。また、二次記憶装置１４００には、本開示に係るプログラムや、記憶部１６内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０を二次記憶装置１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

＜＜８．むすび＞＞
　以上説明したように、本開示の一実施形態によれば、スマートフォン１０（「情報処理装置」の一例に相当）は、録音編集アプリ（「音源データの録音機能および編集機能を有するアプリ」の一例に相当）を実行可能に設けられるアプリ実行部１７ａと、録音編集アプリを介してユーザにより高音質化の対象とする上記音源データの選択が行われた場合に、選択された上記音源データの種別に連動して上記高音質化のメニューＭ３を表示部１５に可変表示させる表示制御部１７ｂと、を備える。これにより、ユーザが音楽コンテンツを制作する際の利便性より向上させることができる。

　以上、本開示の各実施形態について説明したが、本開示の技術的範囲は、上述の各実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　音源データの録音機能および編集機能を有するアプリを実行可能に設けられるアプリ実行部と、
　前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させる表示制御部と、
　を備える、情報処理装置。
（２）
　前記表示制御部は、
　前記アプリを介して前記音源データの選択が行われた場合に、選択された前記音源データを前記表示部に明示する、
　前記（１）に記載の情報処理装置。
（３）
　前記表示制御部は、
　前記音源データに付与したタグとともに前記音源データを前記表示部にリスト表示し、前記アプリを介して前記音源データの選択が行われた場合に、選択された前記音源データに付与された前記タグを前記音源データが表示された行の行方向に向けて伸長するように拡大表示させる、
　前記（２）に記載の情報処理装置。
（４）
　前記表示制御部は、
　前記音源データを前記表示部にリスト表示し、前記アプリを介して前記音源データの選択が行われた場合に、選択された前記音源データが表示された行を当該行の幅全体を拡げるように拡大表示させる、
　前記（２）または（３）に記載の情報処理装置。
（５）
　前記アプリ実行部は、
　ユーザの選択に基づいて前記音源データに対し複数の異なる音源の音が含まれることを示す第１の種別の設定が可能であり、
　前記表示制御部は、
　前記音源データに前記第１の種別が設定されている場合に、当該第１の種別が設定されていることを示すアイコンとともに前記音源データを前記表示部にリスト表示する、
　前記（１）～（４）のいずれか一つに記載の情報処理装置。
（６）
　前記高音質化を行う高音質化処理は、
　前記音源データに複数の異なる音源が含まれる場合に、当該音源データから任意の音源分を分離する音源分離処理を含み、
　前記表示制御部は、
　前記音源データに前記第１の種別が設定されている場合にのみ前記音源分離処理が選択可能となるように、前記高音質化のメニューを前記表示部に表示させる、
　前記（５）に記載の情報処理装置。
（７）
　前記高音質化処理は、
　前記音源分離処理を用いて前記任意の音源分以外をノイズとして除去するノイズ除去処理を含み、
　前記表示制御部は、
　前記音源データに前記第１の種別が設定されている場合に、前記音源分離処理および前記ノイズ除去処理が同時に選択可能となるように前記高音質化のメニューを前記表示部に表示させる、
　前記（６）に記載の情報処理装置。
（８）
　前記表示制御部は、
　前記音源データに前記第１の種別以外の他の種別が設定されている場合、前記ノイズ除去処理を単独に選択可能となるように前記高音質化のメニューを前記表示部に表示させる、
　前記（７）に記載の情報処理装置。
（９）
　前記表示制御部は、
　前記高音質化処理済みのデータを取得した場合に、当該高音質化処理済みであることを示すアイコンとともに前記高音質化処理済みのデータを前記表示部にリスト表示する、
　前記（７）または（８）に記載の情報処理装置。
（１０）
　音源データの録音機能および編集機能を有するアプリを実行することと、
　前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させることと、
　を含む、情報処理方法。
（１１）
　音源データの録音機能および編集機能を有するアプリを実行すること、
　前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させること、
　をコンピュータに実行させる、プログラム。

　１　情報処理システム
　１０　スマートフォン
　１１　マイク
　１２　スピーカ
　１３　通信部
　１４　操作部
　１５　表示部
　１５ａ　通知パネル
　１６　記憶部
　１６ａ　アプリ情報
　１７　制御部
　１７ａ　アプリ実行部
　１７ｂ　表示制御部
　１７ｃ　通信制御部
　１００　サーバ装置
　１０１　通信部
　１０２　記憶部
　１０２ａ　高音質化処理モデル
　１０３　制御部
　１０３ａ　取得部
　１０３ｂ　高音質化処理部
　１０３ｃ　送信部

Claims

　音源データの録音機能および編集機能を有するアプリを実行可能に設けられるアプリ実行部と、
　前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させる表示制御部と、
　を備える、情報処理装置。
　前記表示制御部は、
　前記アプリを介して前記音源データの選択が行われた場合に、選択された前記音源データを前記表示部に明示する、
　請求項１に記載の情報処理装置。
　前記表示制御部は、
　前記音源データに付与したタグとともに前記音源データを前記表示部にリスト表示し、前記アプリを介して前記音源データの選択が行われた場合に、選択された前記音源データに付与された前記タグを前記音源データが表示された行の行方向に向けて伸長するように拡大表示させる、
　請求項２に記載の情報処理装置。
　前記表示制御部は、
　前記音源データを前記表示部にリスト表示し、前記アプリを介して前記音源データの選択が行われた場合に、選択された前記音源データが表示された行を当該行の幅全体を拡げるように拡大表示させる、
　請求項２に記載の情報処理装置。
　前記アプリ実行部は、
　ユーザの選択に基づいて前記音源データに対し複数の異なる音源の音が含まれることを示す第１の種別の設定が可能であり、
　前記表示制御部は、
　前記音源データに前記第１の種別が設定されている場合に、当該第１の種別が設定されていることを示すアイコンとともに前記音源データを前記表示部にリスト表示する、
　請求項１に記載の情報処理装置。
　前記高音質化を行う高音質化処理は、
　前記音源データに複数の異なる音源が含まれる場合に、当該音源データから任意の音源分を分離する音源分離処理を含み、
　前記表示制御部は、
　前記音源データに前記第１の種別が設定されている場合にのみ前記音源分離処理が選択可能となるように、前記高音質化のメニューを前記表示部に表示させる、
　請求項５に記載の情報処理装置。
　前記高音質化処理は、
　前記音源分離処理を用いて前記任意の音源分以外をノイズとして除去するノイズ除去処理を含み、
　前記表示制御部は、
　前記音源データに前記第１の種別が設定されている場合に、前記音源分離処理および前記ノイズ除去処理が同時に選択可能となるように前記高音質化のメニューを前記表示部に表示させる、
　請求項６に記載の情報処理装置。
　前記表示制御部は、
　前記音源データに前記第１の種別以外の他の種別が設定されている場合、前記ノイズ除去処理を単独に選択可能となるように前記高音質化のメニューを前記表示部に表示させる、
　請求項７に記載の情報処理装置。
　前記表示制御部は、
　前記高音質化処理済みのデータを取得した場合に、当該高音質化処理済みであることを示すアイコンとともに前記高音質化処理済みのデータを前記表示部にリスト表示する、
　請求項７に記載の情報処理装置。
　音源データの録音機能および編集機能を有するアプリを実行することと、
　前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させることと、
　を含む、情報処理方法。
　音源データの録音機能および編集機能を有するアプリを実行すること、
　前記アプリを介してユーザにより高音質化の対象とする前記音源データの選択が行われた場合に、選択された前記音源データの種別に連動して前記高音質化のメニューを表示部に可変表示させること、
　をコンピュータに実行させる、プログラム。