JP7004944B2

JP7004944B2 - コンテンツ投稿方法、コンテンツ投稿装置並びに読み取り可能な記憶媒体

Info

Publication number: JP7004944B2
Application number: JP2020541526A
Authority: JP
Inventors: ▲逸▼▲シン▼ ▲デン▼; ▲シン▼ 胡
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-02-06
Filing date: 2019-01-30
Publication date: 2022-01-21
Anticipated expiration: 2039-01-30
Also published as: US11429659B2; CN108270794B; WO2019154216A1; US20200293569A1; CN108270794A; JP2021513699A

Description

本願は、２０１８年０２月０６日に中国特許庁に提出された、出願番号がＣＮ２０１８１０１１７６６５．９であり、発明の名称が「コンテンツ投稿方法、コンテンツ投稿装置並びに読み取り可能な記憶媒体」である中国特許出願の優先権を主張し、当該中国特許出願の全てのコンテンツが参照により本願に組み込まれている。

本願実施例は、人工知能（ＡＩ：ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）領域、具体的に、コンテンツ投稿方法、コンテンツ投稿装置並びに読み取り可能な記憶媒体に関するものである。

ネットワークコミュニティは、ユーザが他のユーザと対話できるプラットフォームである。ユーザは、当該ネットワークコミュニティで、ユーザオリジナルコンテンツ（ＵＧＣ：ＵｓｅｒＧｅｎｅｒａｔｅｄＣｏｎｔｅｎｔ）を送信できる。当該ユーザオリジナルコンテンツは、ユーザが編集して生成したテキストコンテンツ、ローカルでユーザによってアップロードされた写真、音声録音機能によりユーザが録音した音声など含み、他のユーザは、当該ユーザオリジナルコンテンツを閲覧および当該ユーザオリジナルコンテンツとの対話を実行できる。

ユーザがネットワークコミュニティで送信するコンテンツはさまざまであり、ユーザは、ネットワークコミュニティでテキスト、写真、ビデオ、音声などを送信できる。例えば、第１ユーザはテキストを編集して、ユーザの携帯電話におけるローカル画像を添付し、テキストと写真を組み合わせた形のコンテンツを、ユーザオリジナルコンテンツとしてネットワークコミュニティに送信し、他のユーザは、当該ネットワークコミュニティで、当該第１ユーザによって送信されたユーザオリジナルコンテンツ、つまりテキストと写真を閲覧でき、当該ユーザオリジナルコンテンツに対して、コメント、再投稿、「いいね！」ボタンを押すなどの形式で対話を実行できる。

ただし、ネットワークコミュニティでユーザが表示するユーザオリジナルコンテンツでは、写真は、ユーザがアップロードした写真のみであり、形式が単調である。

本願実施例は、ネットワークコミュニティでの、ユーザによって表示されるコンテンツの形式が単調であるという課題を解決する、コンテンツ投稿方法、コンテンツ投稿装置並びに読み取り可能な記憶媒体を開示する。

本願実施例の一態様によれば、端末に適用されるコンテンツ投稿方法を開示し、当該投稿方法は、
マルチメディア素材および地理的位置情報を取得することと、
マルチメディア素材および地理的位置情報をサーバにアップロードすることと、
ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示することであって、第１出力結果は、サーバがマルチメディア素材を人工知能モデルに入力した後に取得したものであり、第２出力結果は、サーバが第１出力結果と地理的位置情報を組み合わせて取得したものであることと、
ユーザコンテンツを生成することであって、当該ユーザコンテンツは、第１出力結果および第２出力結果を含むこととを含む。

本願実施例の別の態様によれば、コンテンツ投稿方法を開示し、当該投稿方法は、
端末によってアップロードされたマルチメディア素材および地理的位置情報を受信することと、
マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得することと、
第１出力結果と地理的位置情報を組み合わせて、第２出力結果を取得することと、
第１出力結果および第２出力結果を端末に送信することと、
端末がネットワークコミュニティプラットフォームを介して送信したユーザコンテンツを受信することであって、当該ユーザコンテンツは、前記第１出力結果および前記第２出力結果を含むこととを含む。

本願実施例の別の態様によれば、コンテンツ投稿装置を開示し、当該投稿装置が、
マルチメディア素材および地理的位置情報を取得するように構成される取得モジュールと、
マルチメディア素材および地理的位置情報をサーバにアップロードするように構成されるアップロードモジュールと、
ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示するように構成される表示モジュールであって、第１出力結果は、サーバがマルチメディア素材を人工知能モデルに入力した後取得したものであり、第２出力結果は、サーバが第１出力結果と地理的位置情報を組み合わせて取得したものであり、
ユーザコンテンツを生成するように構成される生成モジュールであって、当該ユーザコンテンツは第１出力結果および第２出力結果を含む生成モジュールとを備える。

本願実施例の別の態様によれば、コンテンツ投稿装置を更に開示し、当該投稿装置が、
端末によってアップロードされたマルチメディア素材および地理的位置情報を受信するように構成される第２受信モジュールと、
マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得するように構成される入力モジュールと、
第１出力結果と地理的位置情報を組み合わせて、第２出力結果を取得するように構成される結合モジュールと、
第１出力結果および第２出力結果を端末に送信するように構成される第２送信モジュールとを備え、
第２送信モジュールは、端末がネットワークコミュニティプラットフォームを介して送信した、第１出力結果および前記第２出力結果を含むユーザコンテンツを受信するように更に構成される。

本願実施例の別の態様によれば、コンピュータ機器を開示し、当該コンピュータ機器が、プロセッサと、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットが記憶されたメモリとを備え、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットがプロセッサによってロードおよび実行されると、上述の本願実施例で開示されたコンテンツ投稿方法を実現する。

本願実施例の別の態様によれば、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットか記憶されたコンピュータ読み取り可能な記憶媒体を開示し、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットがプロセッサによってロードおよび実行されると、上述の本願実施例で開示されたコンテンツ投稿方法を実現する。

本願実施例の別の態様によれば、コンピュータプログラム製品を開示し、コンピュータプログラム製品がコンピュータで実行されると、コンピュータに上述の本願実施例で開示されたコンテンツ投稿方法を実行させる。

本願実施例で開示される技術的解決策は、以下の有益な効果を含み得る。

マルチメディア素材を人工知能モデルに入力して第１出力結果を取得し、および第１出力結果と地理的位置情報を組み合わせて第２出力結果を取得し、第１出力結果および第２出力結果に従って生成したコンテンツをネットワークコミュニティプラットフォームに送信することにより、ユーザがネットワークコミュニティプラットフォームで投稿するＵＧＣの形式が増加し、ネットワークコミュニティプラットフォームでの対話を改善するため、ネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。

本願実施例の技術的解決策をより明確に説明するために、以下は、実施例の説明で使用される図面について簡単に紹介する。以下に説明される図面は、本開示のいくつかの実施例に過ぎず、当業者にとっては、創造的な作業なしに、これらの図面にしたがって他の図面を得ることもできることは自明である。

本願の一例示的な実施例で開示される実施環境シナリオの概略図である。本願の一例示的な実施例で開示されるコンテンツ投稿方法のフローチャートである。本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートである。本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートである。図４に示される実施例に基づいて開示されるコンテンツ投稿方法のフローチャートである。図４に示される実施例に基づいて開示される別のコンテンツ投稿方法のフローチャートである。本願の別の例示的な実施例で開示される端末のユーザインターフェースの概略図である。本願の別の例示的な実施例で開示される端末のユーザインターフェースの概略図である。本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートである。図９に示される実施例に基づいて開示されるコンテンツ投稿方法のフローチャートである。図９に示される実施例に基づいて開示される別のコンテンツ投稿方法のフローチャートである。図９に示される実施例に基づいて開示される別のコンテンツ投稿方法のフローチャートである。本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートである。本願の別の例示的な実施例で開示される端末のユーザインターフェースの概略図である。本願の一例示的な実施例で開示されるコンテンツ投稿装置の構造ブロック図である。本願の別の例示的な実施例で開示されるコンテンツ投稿装置の構造ブロック図である。本願の別の例示的な実施例で開示されるコンテンツ投稿装置の構造ブロック図である。本願の別の例示的な実施例で開示されるコンテンツ投稿装置の構造ブロック図である。本願の一例示的な実施例で開示されるコンピュータ機器の構造ブロック図である。

本願の目的、技術的解決策および利点をより明確に説明するために、本開示の実施形態を添付の図面を参照して以下に詳細に説明する。

最初に、本願実施例に関する名詞の一部を説明する。

ネットワークコミュニティプラットフォーム：表示用のコンテンツの投稿サービスをユーザに提供するプラットフォームである。ユーザが当該ネットワークコミュニティプラットフォームで投稿したコンテンツは、他のユーザによって閲覧できる。例示的に、上述の投稿されたコンテンツは、ユーザ生成コンテンツ（ユーザオリジナルコンテンツとも呼ばれる）であってもよいし、ユーザによって再投稿されたコンテンツなどであってもよいが、本願実施例では、主にユーザオリジナルコンテンツについて説明する。

例示的に、１つのコミュニティは、いくつかのサークルを含み、各サークルは、異なるトピックに対応し、つまり、ユーザは１つのサークルで１つのトピックを中心に話し合うことができる。

ユーザコンテンツ：ネットワークコミュニティプラットフォームに投稿するために端末で生成されたコンテンツを指す。例示的に、当該ユーザコンテンツは、写真、ビデオ、テキスト、オーディオおよび絵文字のうちの少なくとも１つを含んでもよい。当該ユーザコンテンツはまた、ユーザオリジナルコンテンツと非オリジナルコンテンツに分けることができ、ユーザオリジナルコンテンツは、端末で、ユーザによって編集、撮影、記録、ローカル画像をアップロードして生成したコンテンツを指し、非オリジナルのコンテンツは、ユーザの再投稿、ダウンロード、コピーアンドペーストなどの方式で生成したコンテンツを指すが、本願実施例では、主にユーザオリジナルコンテンツについて説明する。

人工知能モデル：人工知能を使用して画像、音声、テキストなどのコンテンツを識別および処理する機械学習モデルである。例示的に、当該人工知能モデルは、１つまたは複数のニューラルネットワークで構成できる。

例示的に、人工知能モデルは、ディープニューラルネットワーク（ＤＮＮ：ＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋ）モデル、リカレントニューラルネットワーク（ＲＮＮ：ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋｓ）モデル、埋め込み（ｅｍｂｅｄｄｉｎｇ）モデル、勾配ブースティング決定木（ＧＢＤＴ：ＧｒａｄｉｅｎｔＢｏｏｓｔｉｎｇＤｅｃｉｓｉｏｎＴｒｅｅ）、ロジスティック回帰（ＬＲ：ＬｏｇｉｓｔｉｃＲｅｇｒｅｓｓｉｏｎ）モデルのうちの少なくとも１つを含んでもよいが、これらに限定されるものではない。

ＤＮＮモデルは、ディープラーニングフレームワークである。ＤＮＮモデルは、入力層、少なくとも１つの非表示層（中間層とも呼ばれる）、および出力層を含む。例示的に、入力層、少なくとも１つの非表示層（中間層とも呼ばれる）、および出力層は受信したデータの処理に使用される少なくとも１つのニューロンを含んでもよい。例示的に、異なる層の間のニューロンの数は同じでもよいし、異なってもよい。

ＲＮＮモデルは、フィードバック構造を有するニューラルネットワークである。ＲＮＮモデルでは、ニューロンの出力は、次のタイムスタンプで、それ自体に直接影響を与えることができる。つまり、第ｉ層のニューロンの時刻ｍの入力は、当該時刻での（ｉ－１）層のニューロンの出力に加えて、時刻（ｍ－１）での自体の出力も含む。

ｅｍｂｅｄｄｉｎｇモデルは、実体と関係の分散ベクトル表現に基づいて、各３タプル実例における関係を実体の先頭から末尾への翻訳として扱う。３タプル実例は、本体、関係、客体を含み、（本体、関係、客体）として表すことができ、本体は実体の先頭であり、客体は実体の末尾である。例えば、「張ちゃんの父親は張さんです」というフレーズの場合、３タプル実例では（張ちゃん、父親、張さん）として表す。

ＧＢＤＴモデルは、反復決定木アルゴリズムであり、当該アルゴリズムは複数の決定木で構成され、すべての決定木の結果を最終結果として加算する。決定木の各ノードは予測値を取得し、年齢を例にとると、予測値は、年齢に対応するノードに属するすべての人々の年齢の平均値である。

ＬＲモデルは、線形回帰に基づいて、論理関数を適用して確立したモデルを指す。

図１は、本願の一例示的な実施例で開示される実施環境シナリオの概略図であり、図１に示されるように、当該実施環境は、端末１１、サーバ１２および通信ネットワーク１３を含む。

当該端末１１は、ネットワークコミュニティプラットフォームにアクセスするために使用され、当該ネットワークコミュニティプラットフォームは、ユーザコンテンツを共有できるプラットフォームである。ここで、ユーザコンテンツは、少なくともユーザオリジナルコンテンツおよび非オリジナルコンテンツを含む。例示的に、端末１１で、ネットワークコミュニティプラットフォームサービスを提供するクライアントが実行され、当該クライアントは、ブラウザアプリケーション、インスタントメッセージングアプリケーション、オーディオおよびビデオアプリケーション、ゲームアプリケーション、資産管理アプリケーション、支払い関連のアプリケーションなどであってもよい。例示的に、当該端末１１は、携帯電話、タブレットコンピュータ、ラップトップコンピュータ、デスクトップコンピュータなどであってもよい。図１に示されるように、当該端末１１は、端末１１１および端末１１２を含み、本願実施例では、２つの端末を含む端末１１を例にとって説明するが、実際の適用では、より多いまたはより少ない端末を含み得る。

サーバ１２には、人工知能モデルが格納され、当該人工知能モデルは、マルチメディア素材の入力を受け取り、第１出力結果を出力するために使用される。マルチメディア素材は、ネットワークコミュニティプラットフォームでの編集またはアップロードを通じて、端末によって生成された素材である。例えば、画像素材を人工知能モデルに入力して取得した画像識別の出力結果、または、オーディオ素材を人工知能モデルに入力して取得した、ボイスチェンジされたオーディオ出力結果などである。例示的に、当該サーバ１２は、１つのサーバまたは複数のサーバから構成されるサーバクラスタであってもよく、当該サーバ１２は、物理サーバまたはクラウドサーバであってもよく、本願は、サーバ１２の特定の形式に対して限定しない。

端末１１とサーバ１２は、ネットワーク１３を介して通信し、当該通信ネットワーク１３は、有線ネットワークまたは無線ネットワークであり得る。

図２は、本願の一例示的な実施例で開示されるコンテンツ投稿方法のフローチャートであり、当該投稿方法を図１に示される実施環境に適用する場合、当該コンテンツ投稿方法は以下のステップを含む。

ステップ２０１において、端末が、マルチメディア素材および地理的位置情報を取得する。

例示的に、当該マルチメディア素材は、編集、ダウンロード、アップロード、撮影または記録を通じて端末が取得した素材である。当該マルチメディア素材が、編集、ダウンロード、アップロード、撮影または記録を通じて端末が取得した素材である場合、当該マルチメディア素材はオリジナル素材とも呼ばれる。例えば、端末は、マルチメディア素材として１セグメントのテキストを編集して生成したり、マルチメディア素材として１つの画像をアップロードしたり、マルチメディア素材として１セグメントのオーディオを記録したりすることができる。例示的に、当該マルチメディア素材は、画像素材、オーディオ素材、テキスト素材またはビデオ素材のうちの少なくとも１つを含んでもよい。

例示的に、当該地理的位置情報は、衛星測位法を介して端末が取得した情報であってもよいし、モバイル基地局測位法を介して端末が取得した情報であってもよいし、無線ネットワーク支援測位法を介して端末が取得した情報であってもよいし、アシスト全地球測位システム（ＡＧＰＳ：ＡｓｓｉｓｔｅｄＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）を介して端末が取得した情報であってもよいが、本願実施例はこれに対して限定しない。

ステップ２０２において、端末が、マルチメディア素材および地理的位置情報をサーバにアップロードする。

例示的に、端末は、マルチメディア素材を取得および送信してから、地理的位置情報を取得および送信してもよいし、地理的位置情報を取得および送信してから、マルチメディア素材を取得および送信してもよいし、マルチメディア素材および地理的位置情報を同時に取得および送信してもよい。

ステップ２０３において、サーバが、端末によってアップロードされたマルチメディア素材および地理的位置情報を受信する。

ステップ２０４において、サーバが、マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得する。

例示的に、サーバが、受信したマルチメディア素材を当該人工知能モデルに入力して、第１出力結果を取得する。例示的に、当該第１出力結果は、サーバが、人工知能モデルに従ってマルチメディア素材に対して人工知能処理を実行した後に取得した処理結果のコンテンツを含むマルチメディアデータであってもよい。

例示的に、当該第１出力結果は、画像素材に対して画像識別を実行した後の画像識別結果、またはオーディオ素材に対してボイスチェンジを実行した後のボイスチェンジ結果、またはオーディオ素材に対してオーディオ識別を実行した後のオーディオ識別結果であってもよい。

ステップ２０５、サーバが、第１出力結果と地理的位置情報を組み合わせて、第２出力結果を取得する。

例示的に、第１出力結果と地理的位置情報を組み合わせ方法は、マップ内の地理的位置情報に対応する位置ポイントで、第１出力結果に対応するコンテンツを表示すること、地理的位置情報に対応する地理的領域を取得し、当該地理的領域における第１出力結果のタイプに対応する出力結果セットを決定し、当該出力結果セットの配列順番に従って第２出力結果を決定することのうちの少なくとも１つを含んでもよい。例示的に、当該出力結果セットは、人工知能モデルによって出力された少なくとも１つの出力結果を含んでもよい。例示的に、当該出力結果セットは、同じ人工知能モデルによって出力された複数の出力結果を含んでもよい。例示的に、当該出力結果セットはまた、異なる人工知能モデルによって出力された複数の出力結果を含んでもよい。例示的に、当該出力結果セットは、顔処理モデルによって出力された、公人ａとの顔の類似度結果を含み、当該出力結果セットは、サウンド処理モデルによって出力された公人ａとの音声の類似度結果も含み、顔の類似度結果および音声の類似度結果を配列して、当該出力結果セットの配列順番を取得する。

ステップ２０６において、サーバが、第１出力結果および第２出力結果を端末に送信する。

ステップ２０７において、端末が、サーバによって送信された第１出力結果および第２出力結果を受信する。

例示的に、当該第１出力結果は、サーバがマルチメディア素材を人工知能モデルに入力して取得したものであり、第２出力結果は、サーバが第１出力結果と地理的位置情報を組み合わせて取得したものである。

ステップ２０８において、端末が、ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示する。

例示的に、端末は、編集ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示でき、当該編集ユーザインターフェースは、編集ボックス、第１出力結果、第２出力結果、送信制御部を含み、ユーザは、テキスト編集ボックスでテキストを編集できる。端末はまた、表示ユーザインターフェースでサーバによって送信された第１出力結果および第２出力結果を表示でき、当該表示ユーザインターフェースは、第１出力結果、第２出力結果および共有制御部を含む。

ステップ２０９において、ユーザコンテンツを生成する。

例示的に、当該ユーザコンテンツは、当該第１出力結果および第２出力結果を含んでもよい。例示的に、当該ユーザコンテンツが、ネットワークコミュニティプラットフォームでの投稿に使用されてもよい。

例示的に、端末が編集ユーザインターフェースで第１出力結果および第２出力結果を表示する場合、ユーザが自分で編集したテキストコンテンツ、第１出力結果および第２出力結果はユーザコンテンツである。例示的に、当該ユーザコンテンツはまた、他のユーザによって編集、ダウンロード、アップロード、撮影または記録されたコンテンツを含み得る。例示的に、端末が表示ユーザインターフェースで第１出力結果および第２出力結果を表示する場合、共有制御部がユーザによってトリガされると、端末は編集ユーザインターフェースを表示し、ユーザが編集ユーザインターフェースで編集したテキストコンテンツ、第１出力結果および第２出力結果はユーザコンテンツである。例示的に、当該ユーザコンテンツはまた、ユーザによって編集、ダウンロード、アップロード、撮影または記録された他のコンテンツを含み得る。

ステップ２１０において、端末が、ユーザコンテンツをサーバに送信する。

例示的に、端末が編集ユーザインターフェースで第１出力結果および第２出力結果を表示する場合、送信制御部がユーザによってタッチされると、端末はユーザコンテンツをサーバに送信する。端末が表示ユーザインターフェースで第１出力結果および第２出力結果を表示する場合、共有制御部がユーザによってトリガされると、端末は編集ユーザインターフェースを表示し、編集ユーザインターフェースは送信制御部を含み、ユーザは、送信制御部をタッチすることによってユーザコンテンツをサーバに送信できる。

ステップ２１１において、サーバが、端末によって送信されたユーザコンテンツをネットワークコミュニティプラットフォームに投稿する。

例示的に、サーバがユーザコンテンツをネットワークコミュニティプラットフォームに投稿した後、上述の端末または他の端末は、当該ネットワークコミュニティプラットフォームで当該ユーザコンテンツを閲覧できる。

まとめると、本実施例で開示されたコンテンツ投稿方法において、マルチメディア素材を人工知能モデルに入力して第１出力結果を取得し、第１出力結果と地理的位置情報を組み合わせて第２出力結果を取得し、第１出力結果および第２出力結果に従って、コンテンツを生成してネットワークコミュニティプラットフォームに送信することにより、ユーザがネットワークコミュニティプラットフォームで投稿するＵＧＣの形式が増加し、ネットワークコミュニティプラットフォームでの対話を改善し、当該ネットワークコミュニティプラットフォームの調性を改善するため、ネットワークコミュニティプラットフォームの特定のサークルで、ユーザによって投稿されたコンテンツが、このサークルにおける対応するトピックの要件によりマッチングし、ネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。

代替実施例において、第２出力結果は、同じタイプの出力結果セットにおける第１出力結果の配列順番に従って決定される。

図３は、本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートであり、当該投稿方法を図１に示される実施環境に適用する場合、当該コンテンツ投稿方法は以下のステップを含む。

ステップ３０１において、端末が、マルチメディア素材および地理的位置情報を取得する。

ステップ３０２において、端末が、マルチメディア素材および地理的位置情報をサーバにアップロードする。

例示的に、マルチメディア素材は画像素材である場合、ユーザは、端末のローカルアルバムでアップロードする画像素材を選択し、アップロード制御部をクリックしてアップロードしてもよいし、端末のカメラを利用して画像素材を撮影し、画像素材を取得した後に、アップロード制御部をクリックしてアップロードしてもよい。マルチメディア素材がオーディオ素材である場合、ユーザは、端末のローカルレコーディングライブラリでアップロードするオーディオ素材を選択し、アップロード制御部をクリックしてアップロードしてもよいし、端末のマイクを利用してオーディオ素材を録音し、オーディオ素材を取得した後に、アップロード制御部をクリックしてアップロードしてもよい。

ステップ３０３において、サーバが、端末によってアップロードされたマルチメディア素材および地理的位置情報を受信する。

ステップ３０４において、サーバが、マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得する。

例示的に、サーバが、受信したマルチメディア素材を当該人工知能モデルに入力して、第１出力結果を取得してもよい。当該第１出力結果は、画像素材に対して画像識別を実行した後の画像識別結果、またはオーディオ素材に対してボイスチェンジを実行した後のボイスチェンジ結果、またはオーディオ素材に対してオーディオ識別を実行した後のオーディオ識別結果であってもよい。

ステップ３０５において、サーバが、地理的位置情報に対応する地理的領域を取得する。

例示的に、地理的位置情報は１つの地理的領域に対応し、当該地理的領域は当該地理的位置情報に対応する位置ポイントを含み、当該地理的領域は、プリセットされた地理的領域であってもよい。つまり、マップは複数の地理的領域に分割され、地理的位置情報に従って、マップでの当該地理的位置情報に対応する地理的領域を決定してもよい。例示的に、地理的領域「南山区」は位置ポイントＡを含み、サーバが取得した地理的位置情報が位置ポイントＡの地理的位置情報である場合、サーバは、当該位置ポイントＡに対応する地理的領域「南山区」を取得する。

ステップ３０６において、サーバが、地理的領域における第１出力結果のタイプに対応する出力結果セットを取得する。

例示的に、出力結果セットは、人工知能モデルによって出力された少なくとも１つの出力結果を含み、且つ当該人工知能モデルと第１出力結果に対応する人工知能モデルは同じモデルであってもよく、つまり、当該出力結果セットは、同じ人工知能モデルによって出力された少なくとも１つの出力結果を含んでもよい。

ステップ３０７において、出力結果セットの配列順番に従って、第２出力結果を決定する。

例示的に、当該第２出力結果は、同じタイプ出力結果セットにおける第１出力結果のランキング情報を含んでもよい。

ステップ３０８において、サーバが、第１出力結果および第２出力結果を端末に送信する。

ステップ３０９において、端末が、サーバによって送信された第１出力結果および第２出力結果を受信する。

例示的に、当該第１出力結果は、サーバがマルチメディア素材を人工知能モデルに入力して取得したものであり、第２出力結果は、サーバが第１出力結果と地理的位置情報を組み合わせて取得したものであってもよい。

ステップ３１０において、端末が、ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示する。

ステップ３１１において、ユーザコンテンツを生成する。

例示的に、当該ユーザコンテンツは、当該第１出力結果および第２出力結果を含んでもよい。例示的に、当該ユーザコンテンツは、ネットワークコミュニティプラットフォームでの投稿に使用されてもよい。

ステップ３１２において、端末が、ユーザコンテンツをサーバに送信する。

例示的に、端末が編集ユーザインターフェースで第１出力結果および第２出力結果を表示する場合、送信制御部がユーザによってタッチされると、端末はコンテンツをサーバに送信する。端末が表示ユーザインターフェースで第１出力結果および第２出力結果を表示する場合、共有制御部がユーザによってトリガされると、端末は編集ユーザインターフェースを表示し、編集ユーザインターフェースは送信制御部を含み、ユーザは、送信制御部をタッチすることによってコンテンツをサーバに送信できる。

ステップ３１３において、サーバが、端末によって送信されたユーザコンテンツをネットワークコミュニティプラットフォームに投稿する。

まとめると、本実施例で開示されたコンテンツ投稿方法において、マルチメディア素材を人工知能モデルに入力して第１出力結果を取得し、第１出力結果と地理的位置情報を組み合わせて第２出力結果を取得し、第１出力結果および第２出力結果に従って、コンテンツを生成してネットワークコミュニティプラットフォームに送信することにより、ユーザがネットワークコミュニティプラットフォームで投稿するＵＧＣの形式が増加し、ネットワークコミュニティプラットフォームでの対話を改善し、ネットワークコミュニティプラットフォームにテーマを含むいくつかのサークルが含まれている場合、当該ネットワークコミュニティプラットフォームの調性を改善するため、ネットワークコミュニティプラットフォームの特定のサークルで、ユーザによって投稿されたコンテンツが、このサークルにおける対応するトピックの要件によりマッチングし、ネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。調性は、サークルに投稿されたコンテンツとテーマの関連性を指す。

本実施で開示されるコンテンツ投稿方法において、同じタイプの出力結果セットを取得し、同じタイプの出力結果セットにおける第１出力結果の配列順番に従って第２出力結果を決定することにより、ユーザは、第１の出力結果および第２の出力結果の楽しみを直感的に感じることができ、第１の出力結果および第２の出力結果をネットワークコミュニティプラットフォームに投稿することができる。

代替実施例において、マルチメディア素材は、画像素材であってもよいし、オーディオ素材であってもよい。

まず、マルチメディア素材が画像素材である場合について例示的に説明する。図４は、本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートであり、当該投稿方法を図１に示される実施環境に適用する場合、当該コンテンツ投稿方法は以下のステップを含む。

ステップ４０１において、マルチメディア素材および地理的位置情報を取得する。

例示的に、当該マルチメディア素材は、編集、アップロードまたは記録を通じて端末によって取得した素材であってもよい。本実施例では、説明のための例として、当該マルチメディア素材が画像素材である場合について説明する。

例示的に、当該地理的位置情報は、衛星測位法を介して端末が取得した情報であってもよいし、モバイル基地局測位法を介して端末が取得した情報であってもよいし、無線ネットワーク支援測位法を介して端末が取得した情報であってもよいし、端末が全地球測位システムに対する補助を介して取得した情報であってもよいが、本願実施例はこれに対して限定しない。

ステップ４０２、マルチメディア素材および地理的位置情報をサーバにアップロードする。

例示的に、マルチメディア素材は画像素材である場合、ユーザは、端末のローカルでアップロードする画像素材を選択し、アップロード制御部をクリックしてアップロードすることができる。ユーザはまた、端末のカメラを利用して画像素材を撮影し、画像素材を取得した後に、アップロード制御部をクリックしてアップロードすることができる。

例示的に、図５に示されるように、ユーザインターフェース５１において、ユーザは、「写真」オプションを選択して写真をアップロードし、端末でユーザインターフェース５２、即ちローカル画像を選択してアップロードするためのユーザインターフェースを表示する。ユーザが当該ユーザインターフェース５２で、画像素材を選択してアップロードした後、端末は、選択された画像素材と地理的位置情報をサーバにアップロードする。

ステップ４０３において、サーバが、端末によってアップロードされたマルチメディア素材および地理的位置情報を受信する。

ステップ４０４において、サーバが、画像素材に顔領域が含まれているかどうかを検出する。

サーバは、画像素材を受信した後、当該画像素材に顔領域が含まれているかどうかを検出する。

例示的に、サーバは、顔認識テクノロジ（ＦａｃｅＲｅｃｏｇｎｉｔｉｏｎＴｅｃｈｎｏｌｏｇｙ）を呼び出して、画像素材に顔領域が含まれているかどうかを検出してもよい。例示的に、以下の４つの顔認識方法を使用して、画像素材に顔領域が含まれているかどうかを検出できる。

最初に、テンプレート参照法において、サーバに１つまたは複数の顔テンプレートを事前に記憶し、画像素材の一部またはすべての領域を顔テンプレートとマッチングし、取得したマッチング程度に従って、画像素材に顔領域が含まれているかどうかを判断する。

次に、顔ルール法において、顔には特定の構造的分布特性があるため、顔テンプレートの特徴を抽出し、対応するルールを生成することにより、生成したルールを使用して、画像素材に顔領域が含まれているかどうかを判断する。

第３に、サンプル学習法において、ニューラルネットワークを通じて画像素材を学習し、画像素材の画像要素を分類し、画像素材に顔領域が含まれているかどうかを判断する。

第４に、肌色シミュレーション法において、顔の肌色は色空間に比較的集中しているため、顔の肌色の分布ルールに従って、画像要素に顔画像が含まれているかどうかを判断する。

ステップ４０５において、画像素材に顔領域が含まれている場合、顔領域を顔処理モデルに入力して、第１出力結果を取得する。

例示的に、当該顔処理モデルは、顔領域に対して顔の類似度検出および顔の分析の少なくとも１つの処理を実行するために使用される。例示的に、当該顔処理モデルはまた、顔領域に対して顔識別を実行するために使用される。

顔の類似度検出とは、２つ以上の顔領域間の類似度検出することである。

顔の特徴分析とは、顔の特徴に対して分析することであって、顔の特徴は、性別、年齢、ムードタイプ、魅力値、メガネを着用しているかどうか、ジュエリを着用しているかどうか、および帽子を着用しているかどうかのうちの少なくとも１つを含む。

顔識別とは、顔領域を事前に記憶した顔とマッチングして、当該事前に記憶した顔に対応する顔情報を取得する。ここで、顔情報は、名前、性別、年齢、魅力値、身元、職業のうちの少なくとも１つを含む。

ステップ４０６において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ４０７において、サーバが、地理的領域における第１出力結果のタイプに対応する同じタイプの出力結果セットを取得する。

ステップ４０８において、同じタイプの出力結果セットにおける第１出力結果の配列順番に従って、第２出力結果を決定する。

例示的に、当該第２出力結果は、同じタイプ出力結果セットにおける第１出力結果のランキング情報を含む。

ステップ４０９において、サーバが、第１出力結果および第２出力結果を端末に送信する。

ステップ４１０において、端末が、サーバによって送信された第１出力結果および第２出力結果を受信する。

例示的に、当該第２出力結果は、地理的領域における第１出力結果のランキング情報を含み、当該ランキング情報は、サーバが地理的位置情報に対応する地理的領域を取得した後、地理的領域における第１出力結果に対応する同じタイプの出力結果セットを取得し、同じタイプの出力結果セットにおける第１出力結果の配列順番に従って決定したものであり、同じタイプの出力結果セットは、他のマルチメディア素材を人工知能モデルに入力して取得した少なくとも１つの出力結果を含む。

ステップ４１１において、端末が、ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示する。

図６に示されるように、端末が画像素材および地理的位置情報を正常にアップロードした後、サーバは、第１出力結果および第２出力結果を返し、ユーザインターフェース６１で表示する。第１出力結果は、ユーザによってアップロードされた画像素材の顔領域と顔サンプル「シンディ（Ｃｉｎｄｙ）」の類似度「７８％」であり、第２出力結果は、「南山区の２番名のシンディ」である。ユーザは、第１出力結果および第２出力結果を選択した後、ユーザインターフェース６２でテキスト編集を実行し、ユーザコンテンツを生成する。

ステップ４１２において、ユーザコンテンツを生成する。

ステップ４１３において、端末が、ユーザコンテンツをサーバに送信する。

ステップ４１４において、サーバが、端末によって送信されたユーザコンテンツをネットワークコミュニティプラットフォームに投稿する。

まとめると、本実施例で開示されたコンテンツ投稿方法において、マルチメディア素材を人工知能モデルに入力して第１出力結果を取得し、第１出力結果と地理的位置情報を組み合わせて第２出力結果を取得し、第１出力結果および第２出力結果に従って、コンテンツを生成してネットワークコミュニティプラットフォームに送信することにより、ユーザがネットワークコミュニティプラットフォームで投稿するＵＧＣの形式が増加し、ネットワークコミュニティプラットフォームでの対話を改善し、当該ネットワークコミュニティプラットフォームの調性を改善するため、ネットワークコミュニティプラットフォームの特定のサークルで、ユーザによって投稿されたコンテンツが、このサークルにおける対応するトピックの要件によりマッチングし、ネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。調性は、サークルに投稿されたコンテンツとテーマの関連性を指す。

本実施例で開示されたコンテンツ投稿方法において、画像素材の顔領域を識別し、顔領域を顔処理モデルに入力することにより、画像素材に対して顔の類似度検出、顔の特徴分析および顔識別のうちの少なくとも１つの処理を実行できるため、ユーザがネットワークコミュニティプラットフォームで投稿するＵＧＣの楽しみを増加できる。

代替実施例において、当該顔処理モデルは顔マッチングモデルであってもよく、上述のステップ４０５ないしステップ４０８は、代わりに図７に示されるステップ４０５１ないしステップ４０８１として実施されてもよい。

ステップ４０５１において、画像素材に顔領域が含まれている場合、顔領域を顔マッチングモデルに入力して、第１出力結果を取得する。

例示的に、当該第１出力結果は、顔領域と顔サンプルの間の第１類似度を含んでもよい。

例示的に、サーバは、顔領域および顔サンプルを顔マッチングモデルに入力することができ、当該顔マッチングモデルは、１つまたは複数のニューラルネットワークで構成されることができ、当該１つまたは複数のニューラルネットワークを使用して、顔領域および顔サンプルの特徴を抽出およびマッチングして、顔領域と顔サンプルの間の第１類似度を取得する。

当該第１出力結果は、顔領域と顔サンプルの間の第１類似度を含む。例示的に、顔サンプルは、サーバに事前に記憶された１つまたは複数の顔画像であってもよく、つまり、第１出力結果は、複数の第１類似度を含むことができる。例示的に、顔サンプルは、映画スター、歌手、スポーツスター、モデル、有名企業の代表者などの有名人の顔画像であってもよい。例示的に、顔サンプルは、ユーザによって選択されることができ、ユーザが顔サンプルを選択した後、サーバは、顔領域および選択された顔領域サンプルを顔マッチングモデルに入力して、第１類似度を取得する。

例示的に、顔領域に対して取得された第１出力結果は、当該顔領域と顔サンプルＡの間の第１類似度が７８％あり、顔領域と顔サンプルＢの間の第１類似度が５５％であるという情報を含む。

例示的に、サーバはまた、顔領域と顔サンプルの間の第１類似度を、降順で配列できる。例示的に、当該顔領域と顔サンプルＡの間の第１類似度が７８％であり、当該顔領域と顔サンプルＢの間の第１類似度が５５％であり、当該顔領域と顔サンプルＣの間の第１類似度が９０％である場合、顔領域と顔サンプルの間の第１類似度を、顔サンプルＣ（９０％）、顔サンプルＡ（７８％）、顔サンプルＢ（５５％）の降順で配列する。

例示的に、画像素材が複数の顔領域を含む場合、上述の複数の顔領域をそれぞれ顔マッチングモデルに入力し、各顔領域に対応する第１類似度を取得し、各顔領域に対応する第１類似度は、同じまたは同じセット内の顔サンプルとの間の類似度であってもよいし、異なる顔サンプルとの間の類似度であってもよい。

例示的に、検出到画像素材に顔領域ａおよび顔領域ｂが含まれていることを検出した場合、第１出力結果は、顔領域ａと顔サンプルＡの間の第１類似度が８０％であり、顔領域ａと顔サンプルＢの間の第１類似度が５０％であり、顔領域ｂと顔サンプルＡの間の第１類似度が８８％であり、顔領域ｂと顔サンプルＤの間の第１類似度が７０％であるという情報を含む。

ステップ４０６１において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ４０７１において、サーバが、地理的領域における第１出力結果に対応する第１類似度セットを取得する。

例示的に、当該第１類似度セットは、他の顔領域と顔サンプルの間の少なくとも１つの類似度を含み、他の顔領域は、当該地理的領域にある端末によってアップロードされたものである。

例示的に、当該第１類似度セットの顔領域は、第１類似度に従って降順で配列されてもよい。

例示的に、南山区にある端末によってアップロードされた顔領域と、顔サンプル「シンディ（Ｃｉｎｄｙ）」の間の類似度セットは、以下の表１の通りである。

ステップ４０８１において、地理的領域および第１類似度セットの配列順番に従って、顔領域の類似度ランキング情報を第２出力結果として生成する。

例示的に、サーバは、地理的領域の名前、類似度セットにおける第１類似度の配列順番および顔サンプルの名前を繋ぎ合わせて、類似度ランキング情報を取得してもよい。

例示的に、表１を参照すると、第１類似度が、顔領域ｂと顔サンプル「シンディ（Ｃｉｎｄｙ）」の間の類似度である場合、当該類似度が８８％であり、且つ類似度セットにおける配列順番で２番目にランクされている場合、当該顔領域ｂの類似度ランキング情報は、「南山区の２番目のシンディ」である。

まとめると、本実施例で開示されたコンテンツ投稿方法において、端末によって送信された画像要素における顔領域に対して顔の類似度検出を実行することにより、顔領域とスターなどの有名人の間の類似度を計算し、計算結果を端末に送信でき、端末によって当該類似度をコンテンツに追加して送信できるため、ネットワークコミュニティプラットフォームで投稿するＵＧＣの楽しみを増加できる。

代替実施例において、上述の顔処理モデルは顔分析モデルであってもよく、上述のステップ４０５ないしステップ４０８は、代わりに図８に示されるステップ４０５２ないしステップ４０８２として実施されてもよい。

ステップ４０５２において、画像素材に顔領域が含まれている場合、顔領域を顔分析モデルに入力して、第１出力結果を取得する。

例示的に、当該第１出力結果は顔の魅力値を含んでもよい。

例示的に、当該顔分析モデルは、顔領域の顔の特徴を分析するために使用されてもよい。例示的に、当該第１出力結果は、当該顔領域に係る性別、年齢、ムードタイプ、魅力値、メガネを着用しているかどうか、ジュエリを着用しているかどうか、および帽子を着用しているかどうかのうちの少なくとも１つ特徴を含む。

例示的に、顔分析モデルは、１つまたは複数のニューラルネットワークを含み、当該１つまたは複数のニューラルネットワークを使用して、顔領域の特徴を抽出して、当該顔領域に係る上述の少なくとも１つの顔の特徴を取得する。

ステップ４０６２において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ４０７２において、地理的領域における第１出力結果に対応する顔の魅力値セットを取得する。

例示的に、当該魅力値セットは、他の顔領域の少なくとも１つの魅力値を含んでもよく、他の顔領域は、当該地理的領域にある端末によってアップロードされたものである。

例示的に、当該顔の魅力値セットの顔領域は、魅力値に従って降順で配列されてもよい。

例示的に、南山区にある端末によってアップロードされた顔領域の魅力値セットは、以下の表２の通りである。

ステップ４０８２において、地理的領域および顔の魅力値セットの配列順番に従って、顔領域の顔の魅力値のランキング情報を第２出力結果として生成する。

例示的に、サーバは、地理的領域の名前、顔の魅力値セットにおける顔の魅力値の配列順番および顔領域の性別情報を繋ぎ合わせて、顔の魅力値のランキング情報を取得できる。

例示的に、サーバはまた、識別して取得した性別に従って、魅力値セットの顔領域を分類できる。例えば、女性の性別の顔領域に従って、第１魅力値セットを取得し、男性の性別の顔領域に従って、第２魅力値セットを取得し、顔領域の性別に従って、第１魅力値セットまたは第２魅力値セットで、第２出力結果として当該顔領域の魅力値ランキング情報を決定する。

例示的に、表２を参照すると、当該表２を性別が女性の顔領域に対応する第１魅力値セット、且つ顔領域ｂの魅力値を例にとると、当該魅力値が８８であり、且つ魅力値セットにおける配列順番で２番目にランクされている場合、当該顔領域ｂの顔の魅力値のランキング情報、「南山区の２番目の魅力的な女性」である。

まとめると、本実施例で開示されたコンテンツ投稿方法において、端末によってアップロードされた画像素材における顔領域に対して顔分析を実行し、魅力値ランキング情報を端末に送信することにより、ネットワークコミュニティプラットフォームで投稿するコンテンツの楽しみを増加できる。

上述の図７および図８に示されるコンテンツ投稿方法は、同時に実現されてもよいし、独立した解決策として別個に実現されてもよいが、本願実施例はこれに対して限定しないことを留意されたい。

次に、マルチメディア素材がオーディオ素材である場合について説明する。図９は、本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートであり、当該投稿方法を図１に示される実施環境に適用する場合、当該コンテンツ投稿方法は以下のステップを含む。

ステップ９０１において、端末が、マルチメディア素材および地理的位置情報を取得する。

例示的に、当該マルチメディア素材は、編集、アップロード、撮影または記録を通じて端末によって取得した素材であってもよい。例えば、マルチメディア素材として、記録を通じて端末によって１セグメントのオーディオ情報を生成する。

例示的に、当該地理的位置情報は、衛星測位法を介して端末が取得した情報であってもよいし、モバイル基地局測位法を介して端末が取得した情報であってもよいし、無線ネットワーク支援測位法を介して端末が取得した情報であってもよいし、ＡＧＰＳを介して端末が取得した情報であってもよいが、本願実施例はこれに対して限定しない。

ステップ９０２において、端末が、マルチメディア素材および地理的位置情報をサーバにアップロードする。

ステップ９０３において、サーバが、端末によってアップロードされたマルチメディア素材および地理的位置情報を受信する。

例示的に、サーバは、オーディオのみをアップロードできるように制限するなど、端末によってアップロードされるコンテンツを制限できる。

端末は、ネットワークコミュニティプラットフォームでオーディオを記録し、記録したオーディオをオーディオ素材としてアップロードできる。端末はまた、オーディオ素材として、ローカルオーディオを選択してアップロードできる。

ステップ９０４において、サーバが、オーディオ素材をサウンド処理モデルに入力して、第１出力結果を取得する。

例示的に、当該サウンド処理モデルは、端末によって送信されたサウンド処理オプションに従って決定されてもよい。例示的に、端末はサウンド処理オプションをサーバに送信し、サーバは、サウンド処理オプションに対応するサウンド処理モデルを取得する。

ステップ９０５において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ９０６において、サーバが、地理的領域における第１出力結果のタイプに対応する同じタイプの出力結果セットを取得する。

例示的に、出力結果セットは、人工知能モデルによって出力された少なくとも１つの出力結果を含み、且つ当該人工知能モデルと第１出力結果に対応する人工知能モデルは同じモデルであってもよい。

ステップ９０７において、同じタイプの出力結果セットにおける第１出力結果の配列順番に従って、第２出力結果を決定する。

ステップ９０８において、サーバが、第１出力結果および第２出力結果を端末に送信する。

ステップ９０９において、端末が、サーバによって送信された第１出力結果および第２出力結果を受信する。

例示的に、第１出力結果は、サーバがオーディオ素材をサウンド処理モデルに入力して取得したものであってもよく、サウンド処理モデルは、オーディオ素材に対して、ボイスチェンジ、サウンド特徴抽出、サウンド類似度検出のうちの少なくとも１つの処理を実行するために使用される。

ステップ９１０において、端末が、ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示する。

例示的に、端末は、編集ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示してもよく、当該編集ユーザインターフェースは、編集ボックス、第１出力結果、第２出力結果、送信制御部を含み、ユーザは、テキスト編集ボックスでテキストを編集できる。端末はまた、表示ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示してもよく、当該表示ユーザインターフェースは、第１出力結果、第２出力結果および共有制御部を含む。

ステップ９１１において、ユーザコンテンツを生成する。

ステップ９１２において、端末が、ユーザコンテンツをサーバに送信する。

ステップ９１３において、サーバが、端末によって送信されたコンテンツをネットワークコミュニティプラットフォームに投稿する。

例示的に、サーバがコンテンツをネットワークコミュニティプラットフォームに投稿した後、上述の端末または他の端末は、当該ネットワークコミュニティプラットフォームで当該コンテンツを閲覧できる。

本実施例で開示されたコンテンツ投稿方法において、オーディオ素材に対して様々な人工知能モデルを提供し、オーディオ素材のコンテンツの楽しみを増加し、さらにネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。

代替実施例において、上述のサウンド処理モデルはオーディオのボイスチェンジモデルであってもよく、上述のステップ９０４ないしステップ９０７は、代わりに図１０に示されるステップ９０４１ないしステップ９０７１として実施されてもよい。

ステップ９０４１において、オーディオ素材をオーディオのボイスチェンジモデルに入力して、オーディオのボイスチェンジ結果を取得する。

例示的に、当該オーディオのボイスチェンジモデルは、１つまたは複数のニューラルネットワークで構成され、且つ、当該オーディオのボイスチェンジモデルは、複数の異なるオーディオのボイスチェンジモデルに分割でき、各オーディオのボイスチェンジモデルは、オーディオ素材を対応する効果音にボイスチェンジするために使用される。例えば、オーディオのボイスチェンジモデル「トランスフォーマ」は、オーディオ素材をトランスフォーマの効果音にボイスチェンジするために使用され、オーディオのボイスチェンジモデル「女の子」は、オーディオ素材を女の子の効果音にボイスチェンジするために使用される。

例示的に、サーバは、オーディオのボイスチェンジモデルを通じてオーディオ素材をボイスチェンジした後、当該オーディオのボイスチェンジ結果のスコアも計算でき、当該スコアは、オーディオのボイスチェンジ結果と、オーディオのボイスチェンジモデルに対応する標準オーディオの間の類似度を計算して取得したものであってもよい。例示的に、オーディオのボイスチェンジモデル「トランスフォーマ」が、オーディオ素材をトランスフォーマの効果音に変更した後、サーバにはまた、映画「トランスフォーマ」のトランスフォーマのラインのオーディオが記憶され、当該オーディオのボイスチェンジ結果と当該ラインのオーディオの間のオーディオ類似度を計算して、当該オーディオのボイスチェンジ結果のスコアを取得する。

ステップ９０５１において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ９０６１において、サーバが、地理的領域におけるオーディオのボイスチェンジ結果に対応するオーディオのボイスチェンジセットを取得する。

例示的に、当該オーディオのボイスチェンジセットは、他のオーディオ素材の少なくとも１つのボイスチェンジ結果を含んでもよく、他のオーディオ素材は、当該地理的領域にある端末によってアップロードされたものである。

例示的に、当該オーディオのボイスチェンジセットにおけるオーディオ素材は、ボイスチェンジ結果のスコアに従って降順で配列されてもよい。

例示的に、南山区にある端末によってアップロードされたオーディオ素材が、オーディオのボイスチェンジモデル「トランスフォーマ」によってボイスチェンジされた後の、対応するオーディオのボイスチェンジセットは、以下の表３の通りである。

ステップ９０７１において、地理的領域およびオーディオのボイスチェンジセットの配列順番に従って、オーディオ素材のボイスチェンジのランキング情報を第２出力結果として生成する。

例示的に、サーバは、地理的領域の名前、オーディオのボイスチェンジセットにおけるオーディオのボイスチェンジ結果の配列順番およびオーディオのボイスチェンジモデルの名前を繋ぎ合わせて、ボイスチェンジのランキング情報を取得してもよい。

例示的に、表３を参照すると、オーディオのボイスチェンジ結果がオーディオ素材ｂのボイスチェンジ結果である場合、当該オーディオのボイスチェンジ結果のスコアが８８であり、且つオーディオのボイスチェンジセットにおける配列順番で２番目にランクされている場合、当該オーディオ素材ｂのボイスチェンジのランキング情報は、「南山区の２番目のトランスフォーマ」である。

まとめると、本実施例で開示されたコンテンツ投稿方法において、オーディオ素材をオーディオのボイスチェンジモデルに入力して、オーディオのボイスチェンジ結果を取得し、オーディオのボイスチェンジ結果と地理的位置情報を組み合わせて第２出力結果を取得することにより、コンテンツの楽しみを増加し、さらにネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。

代替実施例において、上述のサウンド処理モデルはオーディオ検出モデルであってもよく、上述のステップ９０４ないしステップ９０７は、代わりに図１１に示されるステップ９０４２ないしステップ９０７２として実施されてもよい。

ステップ９０４２において、オーディオ素材をオーディオ検出モデルに入力して、オーディオ素材とオーディオ素材サンプルの間の第２類似度を取得する。

当該オーディオ検出モデルは、オーディオ素材とオーディオ素材サンプルの間の第２類似度を計算するために使用される。

例示的に、サーバは、オーディオ素材およびオーディオ素材サンプルをオーディオ検出モデルに入力することができ、当該オーディオ検出モデルは、１つまたは複数のニューラルネットワークで構成されることができ、当該１つまたは複数のニューラルネットワークを使用して、オーディオ素材およびオーディオ素材サンプルの特徴を抽出およびマッチングして、オーディオ素材とオーディオ素材サンプルの間の第２類似度を取得する。

当該第１出力結果は、オーディオ素材とオーディオ素材サンプルの間の第２類似度を含む。例示的に、オーディオ素材サンプルは、サーバに事前に記憶された１つまたは複数のオーディオ素材であってもよく、つまり、第１出力結果は、複数の第２類似度を含むことができる。例示的に、オーディオ素材サンプルは、歌手のオーディオ素材、映画のキャラクタのオーディオ素材、アニメーションのキャラクタのオーディオ素材などのよく知られたオーディオであってもよい。

例示的に、オーディオ素材に対して取得した第２出力結果は、当該オーディオ素材とオーディオ素材サンプルＡの間の第２類似度が７８％であり、当該オーディオ素材とオーディオ素材サンプルＢの間の第２類似度が５５％であるという情報を含む。例示的に、サーバはまた、オーディオ素材とオーディオ素材サンプルの間の第２類似度を、降順で配列できる。

ステップ９０５２において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ９０６２において、サーバが、地理的領域における第２類似度に対応する第２類似度セットを取得する。

例示的に、当該第２類似度セットは、他のオーディオ素材とオーディオ素材サンプルの間の少なくとも１つの類似度を含んでもよく、他のオーディオ素材は、地理的領域にある端末によってアップロードされたものである。

例示的に、当該第２類似度セットのオーディオ素材は、第２類似度に従って降順で配列されてもよい。

例示的に、南山区にある端末によってアップロードされたオーディオ素材と、オーディオ素材サンプル「女の子」の間の第２類似度セットは、以下の表４の通りである。

ステップ９０７２において、地理的領域および第２類似度セットの配列順番に従って、オーディオ類似度のランキング情報を第２出力結果として生成する。

例示的に、サーバは、地理的領域の名前、第２類似度セットにおける第２類似度のランキングおよびオーディオ素材サンプルの名前を繋ぎ合わせて、オーディオ類似度のランキング情報を取得してもよい。

例示的に、表４を参照すると、第２類似度が、オーディオ素材ｂとオーディオ素材サンプル「女の子」の間の類似度である場合、当該第２類似度が８８％であり、且つ第２類似度セットにおける配列順番で２番目にランクされている場合、当該オーディオ素材ｂのオーディオ類似度のランキング情報は、「南山区の２番目の女の子」である。

まとめると、本実施例で開示されたコンテンツ投稿方法において、オーディオ素材をオーディオ検出モデルに入力して、第２類似度を取得し、第２類似度と地理的位置情報を組み合わせて第２出力結果を取得することにより、コンテンツの楽しみを増加し、さらにネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。

代替実施例において、上述のサウンド処理モデルはオーディオサウンド特徴抽出モデルであってもよく、上述のステップ９０４ないしステップ９０７は、代わりに図１２に示されるステップ９０４３ないしステップ９０７３として実施されてもよい。

ステップ９０４３において、オーディオ素材をオーディオサウンド特徴抽出モデルに入力して、オーディオ素材に対応する年齢情報を取得する。

当該オーディオサウンド特徴抽出モデルは、オーディオ素材の特徴を抽出するために使用される。

例示的に、サーバは、オーディオ素材をオーディオサウンド特徴抽出モデルに入力することができ、当該オーディオサウンド特徴抽出モデルは、１つまたは複数のニューラルネットワークで構成されることができ、当該１つまたは複数のニューラルネットワークを使用して、オーディオ素材の特徴を抽出して、オーディオ素材に対応する年齢情報を取得する。

例示的に、特徴抽出により、当該オーディオ素材のサウンドの強さ、サウンド認識度、サウンドの柔らかさなどの特徴も取得できる。

ステップ９０５３において、サーバが、地理的位置情報に対応する地理的領域を取得する。

ステップ９０６３において、サーバが、地理的領域における年齢情報に対応するオーディオ年齢セットを取得する。

例示的に、当該オーディオ年齢セットは、他のオーディオ素材のオーディオに対応する少なくとも１つの年齢情報を含んでもよく、他のオーディオ素材は、当該地理的領域にある端末によってアップロードされたものである。

例示的に、当該オーディオ年齢セットにおけるオーディオ素材は、年齢情報に従って昇順で配列されてもよい。

例示的に、南山区にある端末によってアップロードされた、オーディオ素材の年齢情報に対応するオーディオ年齢セットは、以下の表５の通りである。

ステップ９０７３において、地理的領域、およびオーディオ年齢セットにおけるオーディオ素材に対応する年齢情報の配列順番に従って、年齢のランキング情報を第２出力結果として生成する。

例示的に、サーバは、地理的領域名前、オーディオ年齢セットにおけるオーディオ素材に対応する年齢情報の配列順番、およびオーディオ素材の性別情報を繋ぎ合わせて、年齢のランキング情報を取得してもよい。

例示的に、表５を参照すると、オーディオ素材に対応する年齢情報が、オーディオ素材ｂに対応する年齢情報である場合、当該年齢情報が１４であり、且つオーディオ年齢セットにおける配列順番で２番目にランクされている場合、当該オーディオ素材ｂの年齢のランキング情報は、「南山区の２番目の若い女の子」である。

まとめると、本実施例で開示されたコンテンツ投稿方法において、オーディオ素材をオーディオサウンド特徴抽出モデルに入力して、オーディオ素材に対応する年齢情報を取得し、オーディオ素材に対応する年齢情報と地理的位置情報を組み合わせて第２出力結果を取得することにより、コンテンツの楽しみを増加し、さらにネットワークコミュニティプラットフォームで投稿するコンテンツが単調すぎるという課題を解決する。

上述の図１０ないし図１２に示される３つのコンテンツ投稿方法は、同時に実現されてもよいし、それらを２つ組み合わせて実現されてもよいし、独立した解決策として別個に実現されてもよいが、本願実施例はこれに対して限定しないことを留意されたい。

代替実施例において、端末はまた、コンテンツの識別子か表示されたマップを閲覧できる。図１３は、本願の別の例示的な実施例で開示されるコンテンツ投稿方法のフローチャートであり、当該投稿方法を図１に示される実施環境に適用する場合、当該コンテンツ投稿方法は以下のステップを含む。

ステップ１３０１において、端末が、マルチメディア素材および地理的位置情報を取得する。

例示的に、当該マルチメディア素材は、編集、アップロードまたは記録を通じて端末によって取得した素材であってもよい。例えば、端末は、マルチメディア素材として１セグメントのテキストを編集したり、マルチメディア素材として１つの写真をアップロードしたり、マルチメディア素材として１セグメントのオーディオを記録したりすることができる。例示的に、当該マルチメディア素材は、画像素材、オーディオ素材、テキスト素材またはビデオ素材のうちの少なくとも１つを含む。

ステップ１３０２において、端末が、マルチメディア素材および地理的位置情報をサーバにアップロードする。

例示的に、マルチメディア素材は画像素材である場合、ユーザは、端末のローカルでアップロードする画像素材を選択し、アップロード制御部をクリックしてアップロードすることができる。ユーザはまた、端末のカメラを利用して画像素材を撮影し、画像素材を取得した後に、アップロード制御部をクリックしてアップロードすることができる。マルチメディア素材がオーディオ素材である場合、ユーザは、端末のローカルレコーディングライブラリでアップロードするオーディオ素材を選択し、アップロード制御部をクリックしてアップロードすることができる。ユーザはまた、端末のマイクを利用してオーディオ素材を録音し、オーディオ素材を取得した後に、アップロード制御部をクリックしてアップロードすることができる。

ステップ１３０３において、サーバが、端末によってアップロードされたマルチメディア素材および地理的位置情報を受信する。

ステップ１３０４において、サーバが、マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得する。

例示的に、サーバは、受信したマルチメディア素材を当該人工知能モデルに入力して、第１出力結果を取得してもよい。当該第１出力結果は、画像素材に対して画像識別を実行した後の画像識別結果、またはオーディオ素材に対してボイスチェンジを実行した後のボイスチェンジ結果であってもよい。

ステップ１３０５において、サーバが、第１出力結果と地理的位置情報を組み合わせて、第２出力結果を取得する。

例示的に、第１出力結果と地理的位置情報を組み合わせ方法は、マップ内の、地理的位置情報に対応する位置ポイントで、第１出力結果に対応するコンテンツを表示すること、および地理的位置情報に対応する地理的領域を取得し、当該地理的領域における第１出力結果のタイプに対応する同じタイプの出力結果セットを取得することのうちの少なくとも１つを含んでもよい。例示的に、当該同じタイプの出力結果セットは、人工知能モデルによって出力された少なくとも１つの出力結果を含んでもよい。例示的に、当該同じタイプの出力結果セットは、同じ人工知能モデルによって出力された複数の出力結果を含んでもよい。

ステップ１３０６において、サーバが、第１出力結果および第２出力結果を端末に送信する。

ステップ１３０７において、端末が、サーバによって送信された第１出力結果および第２出力結果を受信する。

例示的に、当該第１出力結果は、サーバがマルチメディア素材を人工知能モデルに入力して取得したものであってもよく、第２出力結果は、サーバが第１出力結果と地理的位置情報を組み合わせて取得したものであってもよい。

ステップ１３０８において、端末が、ユーザインターフェースで、サーバによって送信された第１出力結果および第２出力結果を表示する。

ステップ１３０９において、ユーザコンテンツを生成する。

ステップ１３１０において、端末が、ユーザコンテンツをサーバに送信する。

ステップ１３１１において、サーバが、端末によって送信されたユーザコンテンツをネットワークコミュニティプラットフォームに投稿する。

ステップ１３１２において、サーバが、マップで地理的位置情報に対応する位置ポイントを決定する。

例示的に、マップに、各地理的位置情報に対応する位置ポイントがあり、サーバは、端末の地理的位置情報を取得した後、マップで当該地理的位置情報に対応する位置ポイントを決定してもよい。

ステップ１３１３において、サーバが、ユーザコンテンツをマップ内の位置ポイントに関連付ける。

例示的に、ユーザコンテンツをマップ内の位置ポイントに関連付けることは、ターゲット端末を介してマップを閲覧するとき、当該位置ポイントで当該ユーザコンテンツを閲覧でき、または、当該ユーザコンテンツの識別子を確認できることであってもよい。ここで、当該ユーザコンテンツの識別子は、マップで表示されるフローティング識別子であり、当該フローティング識別子で表示されるコンテンツは、ユーザのアバタ、ユーザのニックネーム、ユーザのアイデンティティ（Ｉｄｅｎｔｉｔｙ、ＩＤと略称）のうちの少なくとも１つを含む。例えば、マップで当該コンテンツを送信したユーザのアバタを表示する。

ステップ１３１４において、端末が、マップビュー要求をサーバに送信する。

当該端末は、上述の端末、即ちコンテンツを投稿する端末、および／または他の端末を含む。

当該マップビュー要求は、ユーザコンテンツに関連付けるマップのビューを要求するために使用される。

ステップ１３１５において、サーバが、端末によって送信されたマップビュー要求を受信する。

ステップ１３１６において、サーバが、マップビュー要求に従って、ユーザコンテンツに関連付けるマップを端末に送信する。

ステップ１３１７において、端末が、サーバによって送信されたマップを受信する。

ステップ１３１８において、ユーザインターフェースでマップを表示する。

例示的に、端末が、サーバによって送信された、ユーザコンテンツに関連付けるマップを受信した後、ユーザインターフェースで当該マップを表示し、当該マップで、当該ユーザコンテンツを送信したユーザのアバタなどのユーザコンテンツの識別子を表示してもよい。例示的に、図１４に示された表示結果を参照すると、端末でユーザインターフェース１４０１を表示し、当該ユーザインターフェース１４０１は、上述のマップを含み、且つ、位置ポイント１４０２で当該コンテンツを送信したユーザのアバタを表示し、他の位置ポイントで他のコンテンツを投稿したユーザのアバタを表示し、即ちユーザのアバタを、マップ内の当該コンテンツの地理的位置ポイントに表示する。

ステップ１３１９において、識別子に対するタッチ信号を受信する。

ステップ１３２０において、タッチ信号に従って、ユーザインターフェースで、識別子に対応するユーザコンテンツを表示する。

例示的に、端末が識別子に対するタッチ信号を受信した後、当該タッチ信号に従って、ユーザインターフェースで、識別子に対応するコンテンツを表示してもよい。例示的に、端末が識別子に対するタッチ信号を受信した後、サーバから当該識別子に対応するコンテンツを取得し、ユーザインターフェースで当該コンテンツを表示してもよいし、端末が識別子に対するタッチ信号を受信した後、キャッシュされたコンテンツから当該識別子に対応するコンテンツ取得し、ユーザインターフェースで当該コンテンツを表示してもよい。例示的に、ユーザがユーザインターフェースで上述のユーザのアバタをクリックした後、当該アバタに対応するユーザによって投稿された、コンテンツの詳細を表示してもよい。

例示的に、図１４を参照すると、ユーザがユーザインターフェース１４０１で位置ポイント１４０２のアバタをクリックした後、端末で表示ユーザインターフェース１４０３を表示し、当該ユーザインターフェース１４０３で、位置ポイント１４０２のアバタに対応するユーザによって、送信されたコンテンツを表示する。

上述のステップ１３１４ないしステップ１３２０は、ステップ１３１３の後、またはステップ１３１３の前のいつでも実行することができ、本願実施例は、ステップ１３１４ないしステップ１３２０の実行順番に対して限定しないことを留意されたい。

図１３に示されるコンテンツ投稿方法は、上述の図１ないし図１２に示されるコンテンツ投稿方法のいずれかと組み合わせて実現されてもよいし、独立した解決策として別個に実現されてもよいことを留意されたい。

本実施例で開示されたコンテンツ投稿方法において、マップでユーザのアバタなどの識別子を表示することにより、ターゲット端末は、マップでユーザのアバタを選択して、マップ内の地理的位置ポイントで当該ユーザによって送信されたコンテンツを表示できるため、ネットワークコミュニティプラットフォームで投稿するコンテンツの楽しみを増加し、さらにネットワークコミュニティプラットフォームでの対話を改善する。

上述の図１ないし図１３で説明したコンテンツ投稿方法において、説明のための例として、ユーザコンテンツが第１出力結果および第２出力結果を含むが、実際の適用では、ユーザコンテンツは、第１出力結果のみを含んでもよいし、第２出力結果のみを含んでもよいし、第１出力結果およびユーザが追加した他のコンテンツを含んでもよいし、第２出力結果およびユーザが追加した他のコンテンツを含んでもよいことを留意されたい。ユーザコンテンツの詳細は、ユーザが最終的に投稿のために選択したユーザコンテンツによって決定される。

図１５は、本願の一例示的な実施例で開示されるコンテンツ投稿装置の構造ブロック図であり、図１５に示されるように、当該コンテンツ投稿装置が、第１取得モジュール１５１０と、アップロードモジュール１５２０と、表示モジュール１５３０と、生成モジュール１５４０とを備える。

第１取得モジュール１５１０は、マルチメディア素材および地理的位置情報を取得するように構成される。

アップロードモジュール１５２０は、前記マルチメディア素材および前記地理的位置情報をサーバにアップロードするように構成される。

表示モジュール１５３０は、ユーザインターフェースで、前記サーバによって送信された第１出力結果および第２出力結果を表示するように構成され、前記第１出力結果は、前記サーバが前記マルチメディア素材を人工知能モデルに入力して取得したものであり、前記第２出力結果は、前記サーバが前記第１出力結果と前記地理的位置情報を組み合わせて取得したものである。

生成モジュール１５４０は、ユーザコンテンツを生成するように構成され、前記ユーザコンテンツは、前記第１出力結果および前記第２出力結果を含む。

代替実施例において、前記第２出力結果は、地理的領域における前記第１出力結果のランキング情報を含み、

前記ランキング情報は、前記サーバが前記地理的位置情報に対応する前記地理的領域を取得した後、地理的領域における前記第１出力結果のタイプに対応する出力結果セットを決定し、前記出力結果セットの配列順番に従って決定したものであり、前記出力結果セットは、他のマルチメディア素材を前記人工知能モデルに入力して取得した少なくとも１つの出力結果を含む。

代替実施例において、前記マルチメディア素材は画像素材であり、前記画像素材は顔領域を含み、
前記第１出力結果は、前記サーバが前記画像素材の前記顔領域を顔処理モデルに入力した後に取得したものであり、
ここで、前記顔処理モデルは、前記顔領域に対して顔の類似度検出および顔の特徴分析の少なくとも１つの処理を実行するために使用される。

代替実施例において、前記第１出力結果は、前記顔領域と顔サンプルの間の第１類似度を含み、
前記第２出力結果は、顔の類似度ランキング情報を含み、
前記顔の類似度ランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の第１類似度セットを取得し、前記第１類似度セットの配列順番に従って決定したものであり、前記第１類似度セットは、他の顔領域と前記顔サンプルの間の少なくとも１つの類似度を含む。

代替実施例において、前記第１出力結果は魅力値を含み、前記魅力値は、前記サーバが前記顔領域を顔分析モデルに入力して取得したものであり、
前記第２出力結果は、顔の魅力値のランキング情報を含み、
前記顔の魅力値のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の顔の魅力値セットを取得し、前記顔の魅力値セットの配列順番に従って決定したものであり、前記顔の魅力値セットは、他の顔領域の少なくとも１つの魅力値を含む。

代替実施例において、前記マルチメディア素材はオーディオ素材であり、
前記第１出力結果は、前記サーバが前記オーディオ素材をサウンド処理モデルに入力した後に取得したものであり、
ここで、前記サウンド処理モデルは、前記オーディオ素材に対して、ボイスチェンジ、サウンド特徴抽出、サウンド類似度検出のうちの少なくとも１つの処理を実行するために使用される。

代替実施例において、前記第１出力結果は、オーディオのボイスチェンジ結果を含み、前記オーディオのボイスチェンジ結果は、前記サーバが前記オーディオ素材をオーディオのボイスチェンジモデルに入力して取得したものであり、
前記第２出力結果は、ボイスチェンジのランキング情報を含み、
前記ボイスチェンジのランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域のオーディオのボイスチェンジセットを取得し、前記オーディオのボイスチェンジセットの配列順番に従って決定したものであり、前記オーディオのボイスチェンジセットは、他のオーディオ素材の少なくとも１つのボイスチェンジ結果を含む。

代替実施例において、前記第１出力結果は、前記オーディオ素材に対応する年齢情報を含み、前記オーディオ素材に対応する年齢情報は、前記サーバが前記オーディオ素材をサウンド特徴抽出モデルに入力した後に取得したものであり、
前記第２出力結果は、年齢のランキング情報を含み、
前記年齢のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域のオーディオ年齢セットを取得し、前記オーディオ年齢セットの配列順番に従って決定したものであり、前記オーディオ年齢セットは、他のオーディオ素材のオーディオに対応する少なくとも１つの年齢情報を含む。

代替実施例において、前記第１出力結果は、前記オーディオ素材とオーディオ素材サンプルの間の第２類似度を含み、前記第２類似度は、前記サーバが前記オーディオ素材をオーディオ検出モデルに入力した後に取得したものであり、
前記第２出力結果は、オーディオ類似度のランキング情報を含み、
前記オーディオ類似度のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の第２類似度セットを取得し、前記第２類似度セットの配列順番に従って決定したものであり、前記第２類似度セットは、他のオーディオ素材と前記オーディオ素材サンプルの間の少なくとも１つの類似度を含む。

代替実施例において、図１６に示されるように、当該コンテンツ投稿装置が、
前記サーバにサウンド処理オプションを送信するように構成され第１送信モジュール１５５０をさらに備え、前記サウンド処理オプションは、前記サーバが前記オーディオ素材を、前記サウンド処理オプションに対応するサウンド処理モデルに入力するように指示するために使用される。

代替実施例において、前記第１送信モジュール１５５０は、前記サーバにマップビュー要求を送信するようにさらに構成され、前記マップビュー要求は、前記ユーザコンテンツに関連付けるマップのビューを要求するために使用され、
前記コンテンツ投稿装置が、
前記サーバによって送信された前記マップを受信するように構成される第１受信モジュール１５６０をさらに備え、
前記表示モジュール１５３０は、さらに前記ユーザインターフェースで前記マップを表示するように構成され、前記マップ内の前記地理的位置情報に対応する位置ポイントで、前記ユーザコンテンツの識別子が表示される。

代替実施例において、前記第１受信モジュール１５６０は、さらに前記識別子に対するタッチ信号を受信するように構成され、
前記表示モジュール１５３０は、前記タッチ信号に従って、前記ユーザインターフェースで、前記識別子に対応する前記ユーザコンテンツを表示するようにさらに構成される。

図１７は、本願の別の例示的な実施例で開示されるコンテンツ投稿装置の構造ブロック図であり、図１７に示されるように、当該ンテンツ投稿装置が、第２受信モジュール１７１０と、入力モジュール１７２０と、結合モジュール１７３０と、第２送信モジュール１７４０とを備える。

第２受信モジュール１７１０は、端末によってアップロードされたマルチメディア素材および地理的位置情報を受信するように構成される。

入力モジュール１７２０は、前記マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得するように構成される。

結合モジュール１７３０は、前記第１出力結果と前記地理的位置情報を組み合わせて、第２出力結果を取得するように構成される。

第２送信モジュール１７４０は、前記第１出力結果および前記第２出力結果を前記端末に送信するように構成される。

前記第２受信モジュール１７１０は、前記ネットワークコミュニティプラットフォームを介して、前記端末によって送信されたユーザコンテンツを受信するようにさらに構成され、前記ユーザコンテンツは、前記第１出力結果および前記第２出力結果を含む。

代替実施例において、図１８に示されるように、前記結合モジュール１７３０が、
前記地理的位置情報に対応する地理的領域を取得するように構成される取得ユニット１７３１と、
前記取得ユニット１７３１は、前記地理的領域における前記第１出力結果のタイプに対応する同じタイプの出力結果セットを取得するようにさらに構成され、前記同じタイプの出力結果セットは、他のマルチメディア素材を前記人工知能モデルに入力して取得した少なくとも１つの出力結果を含み、
前記同じタイプの出力結果セットの配列順番に従って、前記第２出力結果を決定するように構成される決定ユニット１７３２とを備える。

代替実施例において、前記マルチメディア素材は画像素材であり、
前記入力モジュール１７２０が、
前記画像素材に顔領域が含まれているかどうかを検出するように構成される検出ユニット１７２１と、
前記画像素材に前記顔領域が含まれている場合、前記顔領域を顔処理モデルに入力して、前記第１出力結果を取得するように構成される第１入力ユニット１７２２とを備え、
ここで、前記顔処理モデルは、前記顔領域に対して顔の類似度検出および顔の特徴分析の少なくとも１つ処理を実行するために使用される。

代替実施例において、前記画像素材に前記顔領域が含まれている場合、前記第１入力ユニット１７２２は、前記顔領域を顔マッチングモデルに入力して、前記第１出力結果を取得するようにさらに構成され、前記第１出力結果は、前記顔領域と顔サンプルの間の第１類似度を含む。

代替実施例において、前記同じタイプの出力結果セットは第１類似度セットを含み、
前記第１類似度セットは、他の顔領域と前記顔サンプルの間の少なくとも１つの類似度を含み、前記他の顔領域は、前記地理的領域にある端末によってアップロードされたものであり、
前記決定ユニット１７３２は、前記地理的領域および前記第１類似度セットの配列順番に従って、前記顔領域の類似度ランキング情報を前記第２出力結果として生成するようにさらに構成される。

代替実施例において、前記第１入力ユニット１７２２は、前記画像素材に前記顔領域が含まれている場合、前記顔領域を顔分析モデルに入力して、前記第１出力結果を取得するようにさらに構成され、前記第１出力結果は顔の魅力値を含む。

代替実施例において、前記同じタイプの出力結果セットは、顔の魅力値セットを含む。

前記顔の魅力値セットは、他の顔領域の少なくとも１つの魅力値を含み、前記他の顔領域は、前記地理的領域にある端末によってアップロードされたものであり、
前記決定ユニット１７３２は、前記地理的領域および前記顔の魅力値セットの配列順番に従って、生成前記顔領域的顔の魅力値のランキング情報を前記第２出力結果として生成するようにさらに構成される。

代替実施例において、前記マルチメディア素材はオーディオ素材を含み、
前記入力モジュール１７２０が、
前記オーディオ素材をサウンド処理モデルに入力して、前記第１出力結果を取得するように構成される第２入力ユニット１７２３を備え、
ここで、前記サウンド処理モデルは、前記オーディオ素材に対して、ボイスチェンジ、サウンド特徴抽出、サウンド類似度検出のうちの少なくとも１つの処理を実行するために使用される。

代替実施例において、前記第１出力結果は、オーディオのボイスチェンジ結果を含み、
前記第２入力ユニット１７２３は、前記オーディオ素材をオーディオのボイスチェンジモデルに入力して、前記オーディオのボイスチェンジ結果を取得するようにさらに構成される。

代替実施例において、前記同じタイプの出力結果セットは、オーディオのボイスチェンジセットを含み、
前記オーディオのボイスチェンジセットは、他のオーディオ素材の少なくとも１つのボイスチェンジ結果を含み、前記他のオーディオ素材は、前記地理的領域にある端末によってアップロードされたものであり、
前記決定ユニット１７３２は、前記地理的領域および前記オーディオのボイスチェンジセットの配列順番に従って、前記オーディオ素材のボイスチェンジのランキング情報を前記第２出力結果として生成するようにさらに構成される。

代替実施例において、前記第１出力結果は、前記オーディオ素材とオーディオ素材サンプルの間のオーディオ類似度を含み、
前記第２入力ユニット１７２３は、前記オーディオ素材をオーディオ検出モデルに入力して、前記オーディオ素材とオーディオ素材サンプルの間の第２類似度を取得するようにさらに構成される。

代替実施例において、前記同じタイプの出力結果セットは、第２類似度セットを含み、
前記第２類似度セットは、他の少なくとも１つのオーディオ素材とオーディオ素材サンプルの間の類似度を含み、前記他のオーディオ素材は、前記地理的領域にある端末によってアップロードされたものであり、
前記決定ユニット１７３２は、前記地理的領域および前記第２類似度セットの配列順番に従って、オーディオ類似度のランキング情報を前記第２出力結果として生成するようにさらに構成される。

代替実施例において、前記第１出力結果は、前記オーディオ素材に対応する年齢情報を含み、
前記第２入力ユニット１７２３は、前記オーディオ素材をオーディオサウンド特徴抽出モデルに入力して、前記オーディオ素材に対応する年齢情報を取得するようにさらに構成される。

代替実施例において、前記同じタイプの出力結果セットは、オーディオ年齢セットを含み、
前記オーディオ年齢セットは、他のオーディオ素材のオーディオに対応する少なくとも１つの年齢情報を含み、前記他のオーディオ素材は、前記地理的領域にある端末によってアップロードされたものであり、
前記決定ユニット１７３２は、前記地理的領域および前記オーディオ年齢セットの配列順番に従って、年齢のランキング情報を前記第２出力結果として生成するようにさらに構成される。

代替実施例において、前記第２受信モジュール１７１０は、前記ネットワークコミュニティプラットフォームを介して、前記端末によって送信されたサウンド処理オプションを受信するようにさらに構成され、
前記コンテンツ投稿装置が、
前記サウンド処理オプションに対応する前記サウンド処理モデルを取得するように構成される第２取得モジュール１７５０をさらに備える。

代替実施例において、前記コンテンツ投稿装置が、
マップで前記地理的位置情報に対応する位置ポイントを決定するように構成される決定モジュール１７６０と、
前記ユーザコンテンツを前記マップ内の前記位置ポイントに関連付けるように構成される関連付けモジュール１７７０とをさらに備え、
前記第２受信モジュール１７１０は、前記ネットワークコミュニティプラットフォームを介して、ターゲット端末によって送信されたマップビュー要求を受信するようにさらに構成され、
前記第２送信モジュール１７４０は、前記マップビュー要求に従って、前記ユーザコンテンツに関連付けられた前記マップを、前記ネットワークコミュニティプラットフォームを介して前記ターゲット端末に送信するようにさらに構成され、前記ターゲット端末は、前記端末および／または他の端末を含む。

図１９を参照すると、本願の一例示的な実施例で開示されるコンピュータ機器の構造ブロック図を示す。当該コンピュータ機器が、プロセッサ１１０１と、メモリ１１０２と、ネットワークインタフェース１１０３とを備える。

ネットワークインタフェース１１０３は、バスまたは他の方式を介してプロセッサ１１０１に接続され、入力画像または画像サンプルを受信するために使用される。

プロセッサ１１０１は、中央処理装置（ＣＰＵ：ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、ネットワークプロセッサ（ＮＰ：ｎｅｔｗｏｒｋｐｒｏｃｅｓｓｏｒ）、またはＣＰＵとＮＰの組み合わせであってもよい。プロセッサ１１０１は、ハードウェアチップをさらに含み得る。上述のハードウェアチップは、特定用途向け集積回路（ＡＳＩＣ：ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、プログラマブルロジックデバイス（ＰＬＤ：ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｄｅｖｉｃｅ）、またはこれらの組み合わせであってもよい。上述のＰＬＤは、複合プログラマブルロジックデバイス（ＣＰＬＤ：ｃｏｍｐｌｅｘｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｄｅｖｉｃｅ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ：ｆｉｅｌｄ－ｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）、ジェネリックアレイロジック（ＧＡＬ：ｇｅｎｅｒｉｃａｒｒａｙｌｏｇｉｃ）、またはこれらの任意の組み合わせであってもよい。プロセッサ１１０１は１つまたは複数であってもよい。

メモリ１１０２は、バスまたはバスまたは他の方式を介してプロセッサ１１０１に接続され、メモリ１１０２に１つまたは複数のプログラムが記憶され、上述の１つまたは複数のプログラムは、プロセッサ１１０１によって実行されるように構成され、上述の１つまたは複数のプログラムは、図２、図３、図４、図７ないし図１３に係る実施例におけるコンテンツ投稿方法を実行するための命令を含む。メモリ１１０２は、揮発性メモリ（ｖｏｌａｔｉｌｅｍｅｍｏｒｙ）、不揮発性メモリ（ｎｏｎ－ｖｏｌａｔｉｌｅｍｅｍｏｒｙ）、またはこれらの組み合わせであってもよい。揮発性メモリは、スタティックランダムアクセスメモリ（ＳＲＡＭ：Ｓｔａｔｉｃａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ：ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などのランダムアクセスメモリ（ＲＡＭ：ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）であってもよい。不揮発性メモリは、プログラム可能な読み取り専用メモリ（ＰＲＯＭ：ｐｒｏｇｒａｍｍａｂｌｅｒｅａｄｏｎｌｙｍｅｍｏｒｙ、ＰＲＯＭ）、消去可能なプログラム可能な読み取り専用メモリ（ＥＰＲＯＭ：ｅｒａｓａｂｌｅｐｒｏｇｒａｍｍａｂｌｅｒｅａｄｏｎｌｙｍｅｍｏｒｙ）、電気的に消去可能なプログラム可能な読み取り専用メモリ（ＥＥＰＲＯＭ：ｅｌｅｃｔｒｉｃａｌｌｙｅｒａｓａｂｌｅｐｒｏｇｒａｍｍａｂｌｅｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）などの読み取り専用メモリ（ＲＯＭ：ｒｅａｄｏｎｌｙｍｅｍｏｒｙｉｍａｇｅ）であってもよい。不揮発性メモリは、フラッシュメモリ（ｆｌａｓｈｍｅｍｏｒｙ）、または磁気テープ（ｍａｇｎｅｔｉｃｔａｐｅ）、フロッピーディスク（フロッピーディスク）、ハードディスクなどの磁気メモリであってもよい。不揮発性メモリは光ディスクであってもよい。

例示的に、上述のコンピュータ機器は、端末またはサーバであってもよい。

本願実施例では、コンピュータ読み取り可能な記憶媒体をさらに開示し、当該記憶媒体に、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットが記憶され、前記少なくとも１つの命令、前記少なくとも１セグメントのプログラム、前記コードセットまたは命令セットが、前記プロセッサ１１０１によってロードおよび実行されると、図２、図３、図４、図７ないし図１３のいずれかに記載のコンテンツ投稿方法を実現する。

本願では、コンピュータプログラム製品を開示し、コンピュータプログラム製品がコンピュータで実行されると、コンピュータによって上述の各方法実施例で開示されたコンテンツ投稿方法を実行する。

当業者なら自明であるが、上述の実施例における各方法において、その全部又は一部のステップが、関連のハードウェアに、プログラムによる命令（コマンド）で、実行されることができる。当該プログラムがコンピュータ読取可能な記憶媒体に記憶されてもよい。当該記憶媒体は、上述の実施例のメモリに含まれるコンピュータ可読記憶媒体であってもよいし、端末に組み込まれていない、単独で存在し、コンピュータ可読記憶媒体であってもよい。当該コンピュータ読み取り可能な記憶媒体に、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットが記憶され、前記少なくとも１つの命令、前記少なくとも１セグメントのプログラム、前記コードセットまたは命令セットが、前記プロセッサによってロードおよび実行されると、図１ないし図１３のいずれかに記載のコンテンツ投稿方法を実現する。

例示的に、当該コンピュータ読み取り可能な記憶媒体は、読み取り専用メモリ（ＲＯＭ：ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ランダムアクセスメモリ（ＲＡＭ：ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ソリッドステートハードディスク（ＳＳＤ：ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅｓ）または光ディスクなどを含み得る。ここで、ランダムアクセスメモリは、アールラム（ＲＲＡＭ（登録商標）：ｒｅｓｉｓｔａｎｃｅｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、およびダイナミックランダムアクセスメモリ（ＤＲＡＭ：ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）を含み得る。上述の本願実施例の番号は、実施例の優劣を表すものではなく、説明の便宜を図るためのものである。

当業者は、前記実施例の全てまたは一部のステップは、ハードウェアによって具現され得るか、関連するハードウェアを完成するようにプログラムによって命令され得ることを理解することができ、前記プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されることができ、上記に言及された記憶媒体は、読み取り専用メモリ、磁気ディスク、または光ディスクであり得る。

上記は本願の好ましい実施例に過ぎず、本願を限定することを意図するものではなく、本願の精神および原則内で行われるあらゆる修正、同等の置換、改善などは、本願の保護範囲に含まれるべきである。

1101 プロセッサ
1102 メモリ
1103 ネットワークインタフェース
1510 第１取得モジュール
1520 アップロードモジュール
1530 表示モジュール
1540 生成モジュール
1550 第１送信モジュール
1560 第１受信モジュール
1710 第２受信モジュール
1720 入力モジュール
1721 検出ユニット
1722 第１入力ユニット
1723 第２入力ユニット
1730 結合モジュール
1731 取得ユニット
1732 決定ユニット
1740 第２送信モジュール
1750 第２取得モジュール
1760 決定モジュール
1770 関連付けモジュール

Claims

端末が実行する、コンテンツ投稿方法であって、
マルチメディア素材および地理的位置情報を取得することと、
前記マルチメディア素材および前記地理的位置情報をサーバにアップロードすることと、
ユーザインターフェースに前記サーバによって送信された第１出力結果および第２出力結果を表示することであって、前記第１出力結果は、前記サーバが前記マルチメディア素材を人工知能モデルに入力した後に取得したものであり、前記第２出力結果は、前記サーバが取得した、前記地理的位置情報に対応する地理的領域における前記第１出力結果のタイプに対応する出力結果セットのランキング情報を含み、前記出力結果セットは、他のマルチメディア素材を前記人工知能モデルに入力して取得した少なくとも１つの出力結果を含むことと、
ユーザコンテンツを生成することであって、前記ユーザコンテンツは、前記第１出力結果および前記第２出力結果を含むこととを含むことを特徴とする、前記コンテンツ投稿方法。
前記ランキング情報は、前記サーバが前記地理的位置情報に対応する前記地理的領域を取得した後、地理的領域における前記第１出力結果のタイプに対応する出力結果セットを決定し、前記出力結果セットの配列順番に従って決定したものであることを特徴とする、
請求項１に記載のコンテンツ投稿方法。
前記マルチメディア素材は画像素材であり、前記画像素材は顔領域を含み、
前記第１出力結果は、前記サーバが前記画像素材の前記顔領域を顔処理モデルに入力した後に取得したものであり、
前記顔処理モデルは、前記顔領域に対して顔の類似度検出および顔の特徴分析の少なくとも１つの処理を実行するために使用されることを特徴とする、
請求項２に記載のコンテンツ投稿方法。
前記第１出力結果は、前記顔領域と顔サンプルの間の第１類似度を含み、
前記第２出力結果は、顔の類似度ランキング情報を含み、
前記顔の類似度ランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の第１類似度セットを取得し、前記第１類似度セットの配列順番に従って決定したものであり、前記第１類似度セットは、他の顔領域と前記顔サンプルの間の少なくとも１つの類似度を含むことを特徴とする、
請求項３に記載のコンテンツ投稿方法。
前記第１出力結果は魅力値を含み、前記魅力値は、前記サーバが前記顔領域を顔分析モデルに入力して取得したものであり、
前記第２出力結果は、顔の魅力値のランキング情報を含み、
前記顔の魅力値のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の顔の魅力値セットを取得し、前記顔の魅力値セットの配列順番に従って決定したものであり、前記顔の魅力値セットは、他の顔領域の少なくとも１つの魅力値を含むことを特徴とする、
請求項３に記載のコンテンツ投稿方法。
前記マルチメディア素材はオーディオ素材であり、
前記第１出力結果は、前記サーバが前記オーディオ素材をサウンド処理モデルに入力した後に取得したものであり、
前記サウンド処理モデルは、前記オーディオ素材に対して、ボイスチェンジ、サウンド特徴抽出、サウンド類似度検出のうちの少なくとも１つの処理を実行するために使用されることを特徴とする、
請求項２に記載のコンテンツ投稿方法。
前記第１出力結果は、オーディオのボイスチェンジ結果を含み、前記オーディオのボイスチェンジ結果は、前記サーバが前記オーディオ素材をオーディオのボイスチェンジモデルに入力した後に取得したものであり、
前記第２出力結果は、ボイスチェンジのランキング情報を含み、
前記ボイスチェンジのランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域のオーディオのボイスチェンジセットを取得し、前記オーディオのボイスチェンジセットの配列順番に従って決定したものであり、前記オーディオのボイスチェンジセットは、他のオーディオ素材の少なくとも１つのボイスチェンジ結果を含むことを特徴とする、
請求項６に記載のコンテンツ投稿方法。
前記第１出力結果は、前記オーディオ素材に対応する年齢情報を含み、前記オーディオ素材に対応する年齢情報は、前記サーバが前記オーディオ素材をサウンド特徴抽出モデルに入力した後に取得したものであり、
前記第２出力結果は、年齢のランキング情報を含み、
前記年齢のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域のオーディオ年齢セットを取得し、前記オーディオ年齢セットの配列順番に従って決定したものであり、前記オーディオ年齢セットは、他のオーディオ素材のオーディオに対応する少なくとも１つの年齢情報を含むことを特徴とする、
請求項６に記載のコンテンツ投稿方法。
前記第１出力結果は、前記オーディオ素材とオーディオ素材サンプルの間の第２類似度を含み、前記第２類似度は、前記サーバが前記オーディオ素材をオーディオ検出モデルに入力した後に取得したものであり、
前記第２出力結果は、オーディオ類似度のランキング情報を含み、
前記オーディオ類似度のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の第２類似度セットを取得し、前記第２類似度セットの配列順番に従って決定したものであり、前記第２類似度セットは、他のオーディオ素材と前記オーディオ素材サンプルの間の少なくとも１つの類似度を含むことを特徴とする、
請求項６に記載のコンテンツ投稿方法。
前記ユーザインターフェースで、前記サーバによって送信された第１出力結果および第２出力結果を表示する前に、前記コンテンツ投稿方法は、
前記サーバにサウンド処理オプションを送信することをさらに含み、前記サウンド処理オプションは、前記サーバが前記オーディオ素材を、前記サウンド処理オプションに対応するサウンド処理モデルに入力するように指示するために使用されることを特徴とする、
請求項６ないし９のいずれか一項に記載のコンテンツ投稿方法。
前記コンテンツ投稿方法は、
前記サーバにマップビュー要求を送信することであって、前記マップビュー要求は、前記ユーザコンテンツに関連付けるマップのビューを要求するために使用されることと、
前記サーバによって送信された前記マップを受信することと、
前記ユーザインターフェースで前記マップを表示することであって、前記マップ内の、前記地理的位置情報に対応する位置ポイントで、前記ユーザコンテンツの識別子を表示することとをさらに含むことを特徴とする、
請求項１ないし９のいずれか一項に記載のコンテンツ投稿方法。
前記ユーザインターフェースで前記マップを表示した後、前記コンテンツ投稿方法は、
前記識別子に対するタッチ信号を受信することと、
前記タッチ信号に従って、前記ユーザインターフェースで、前記識別子に対応する前記ユーザコンテンツを表示することとをさらに含むことを特徴とする、
請求項１１に記載のコンテンツ投稿方法。
コンテンツ投稿方法であって、
サーバに適用され、
端末によってアップロードされたマルチメディア素材および地理的位置情報を受信することと、
前記マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得することと、
前記第１出力結果と前記地理的位置情報を組み合わせて、第２出力結果を取得することと、
前記第１出力結果および前記第２出力結果を前記端末に送信することと、
ネットワークコミュニティプラットフォームを介して、前記端末によって送信されたユーザコンテンツを受信することであって、前記ユーザコンテンツは、前記第１出力結果および前記第２出力結果を含むこととを含み、
前記第２出力結果は、前記地理的位置情報に対応する地理的領域における前記第１出力結果のタイプに対応する出力結果セットのランキング情報を含み、前記出力結果セットは、他のマルチメディア素材を前記人工知能モデルに入力して取得した少なくとも１つの出力結果を含むことを特徴とする、前記コンテンツ投稿方法。
コンテンツ投稿装置であって、
１つまたは複数のプロセッサ、および
メモリを備え、
前記メモリに１つまたは複数のプログラムが記憶され、前記１つまたは複数のプログラムは、前記１つまたは複数のプロセッサによって実行されるように構成され、前記１つまたは複数のプログラムは、
マルチメディア素材および地理的位置情報を取得し、
前記マルチメディア素材および前記地理的位置情報をサーバにアップロードし、
ユーザインターフェースで、前記サーバによって送信された第１出力結果および第２出力結果を表示し、前記第１出力結果は、前記サーバが前記マルチメディア素材を人工知能モデルに入力して取得したものであり、前記第２出力結果は、前記サーバが取得した、前記地理的位置情報に対応する地理的領域における前記第１出力結果のタイプに対応する出力結果セットのランキング情報を含み、前記出力結果セットは、他のマルチメディア素材を前記人工知能モデルに入力して取得した少なくとも１つの出力結果を含み、
コンテンツを生成する操作を実行するための命令を含み、前記コンテンツは、前記第１出力結果および前記第２出力結果を含むことを特徴とする、前記コンテンツ投稿装置。
前記ランキング情報は、前記サーバが前記地理的位置情報に対応する前記地理的領域を取得した後、地理的領域における前記第１出力結果のタイプに対応する出力結果セットを決定し、前記出力結果セットの配列順番に従って決定したものであることを特徴とする、
請求項１４に記載のコンテンツ投稿装置。
前記マルチメディア素材は画像素材であり、前記画像素材は顔領域を含み、
前記第１出力結果は、前記サーバが前記画像素材の前記顔領域を顔処理モデルに入力した後に取得したものであり、
前記顔処理モデルは、前記顔領域に対して顔の類似度検出および顔の特徴分析の少なくとも１つの処理を実行するために使用されることを特徴とする、
請求項１５に記載のコンテンツ投稿装置。
前記第１出力結果は、前記顔領域と顔サンプルの間の第１類似度を含み、
前記第２出力結果は、顔の類似度ランキング情報を含み、
前記顔の類似度ランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の第１類似度セットを取得し、前記第１類似度セットの配列順番に従って決定したものであり、前記第１類似度セットは、他の顔領域と前記顔サンプルの間の少なくとも１つの類似度を含むことを特徴とする、
請求項１６に記載のコンテンツ投稿装置。
前記第１出力結果は魅力値を含み、前記魅力値は、前記サーバが前記顔領域を顔分析モデルに入力して取得したものであり、
前記第２出力結果は、顔の魅力値のランキング情報を含み、
前記顔の魅力値のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の顔の魅力値セットを取得し、前記顔の魅力値セットの配列順番に従って決定したものであり、前記顔の魅力値セットは、他の顔領域の少なくとも１つの魅力値を含むことを特徴とする、
請求項１６に記載のコンテンツ投稿装置。
前記マルチメディア素材はオーディオ素材であり、
前記第１出力結果は、前記サーバが前記オーディオ素材をサウンド処理モデルに入力した後に取得したものであり、
前記サウンド処理モデルは、前記オーディオ素材に対して、ボイスチェンジ、サウンド特徴抽出、サウンド類似度検出のうちの少なくとも１つの処理を実行するために使用されることを特徴とする、
請求項１５に記載のコンテンツ投稿装置。
前記第１出力結果は、オーディオのボイスチェンジ結果を含み、前記オーディオのボイスチェンジ結果は、前記サーバが前記オーディオ素材をオーディオのボイスチェンジモデルに入力して取得したものであり、
前記第２出力結果は、ボイスチェンジのランキング情報を含み、
前記ボイスチェンジのランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域のオーディオのボイスチェンジセットを取得し、前記オーディオのボイスチェンジセットの配列順番に従って決定したものであり、前記オーディオのボイスチェンジセットは、他のオーディオ素材の少なくとも１つのボイスチェンジ結果を含むことを特徴とする、
請求項１９に記載のコンテンツ投稿装置。
前記第１出力結果は、前記オーディオ素材に対応する年齢情報を含み、前記オーディオ素材に対応する年齢情報は、前記サーバが前記オーディオ素材をサウンド特徴抽出モデルに入力した後に取得したものであり、
前記第２出力結果は、年齢のランキング情報を含み、
前記年齢のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域のオーディオ年齢セットを取得し、前記オーディオ年齢セットの配列順番に従って決定したものであり、前記オーディオ年齢セットは、他のオーディオ素材のオーディオに対応する少なくとも１つの年齢情報を含むことを特徴とする、
請求項１９に記載のコンテンツ投稿装置。
前記第１出力結果は、前記オーディオ素材とオーディオ素材サンプルの間の第２類似度を含み、前記第２類似度は、前記サーバが前記オーディオ素材をオーディオ検出モデルに入力した後に取得したものであり、
前記第２出力結果は、オーディオ類似度のランキング情報を含み、
前記オーディオ類似度のランキング情報は、前記サーバが前記地理的位置情報に対応する地理的領域を取得した後、前記地理的領域の第２類似度セットを取得し、前記第２類似度セットの配列順番に従って決定したものであり、前記第２類似度セットは、他のオーディオ素材と前記オーディオ素材サンプルの間の少なくとも１つの類似度を含むことを特徴とする、
請求項１９に記載のコンテンツ投稿装置。
前記１つまたは複数のプログラムは、
前記サーバにサウンド処理オプションを送信する操作を実行するための命令をさらに含み、前記サウンド処理オプションは、前記オーディオ素材を、前記サウンド処理オプションに対応するサウンド処理モデルに入力するように前記サーバに指示するために使用されることを特徴とする、
請求項１９ないし２２のいずれか一項に記載のコンテンツ投稿装置。
前記１つまたは複数のプログラムは、
前記サーバにマップビュー要求を送信し、前記マップビュー要求は、ユーザコンテンツに関連付けるマップのビューを要求するために使用され、
前記サーバによって送信された前記マップを受信し、
前記ユーザインターフェースで前記マップを表示し、前記マップ内の前記地理的位置情報に対応する位置ポイントで、前記ユーザコンテンツの識別子を表示する操作を実行するための命令をさらに含むことを特徴とする、
請求項１４ないし２２のいずれか一項に記載のコンテンツ投稿装置。
前記１つまたは複数のプログラムは、
前記識別子に対するタッチ信号を受信し、
前記タッチ信号に従って、前記ユーザインターフェースで、前記識別子に対応する前記ユーザコンテンツを表示する操作を実行するための命令をさらに含むことを特徴とする、
請求項２４に記載のコンテンツ投稿装置。
コンテンツ投稿装置であって、
１つまたは複数のプロセッサ、およびメモリを備え、
前記メモリに１つまたは複数のプログラムが記憶され、前記１つまたは複数のプログラムは、前記１つまたは複数のプロセッサによって実行されるように構成され、前記１つまたは複数のプログラムは、
端末によってアップロードされたマルチメディア素材および地理的位置情報を受信し、
前記マルチメディア素材を人工知能モデルに入力して、第１出力結果を取得し、
前記第１出力結果と前記地理的位置情報を組み合わせて、第２出力結果を取得し、
前記第１出力結果および前記第２出力結果を前記端末に送信し、
前記端末がネットワークコミュニティプラットフォームを介して送信したユーザコンテンツを受信する操作を実行するための命令を含み、前記ユーザコンテンツは、前記第１出力結果および前記第２出力結果を含み、
前記第２出力結果は、前記地理的位置情報に対応する地理的領域における前記第１出力結果のタイプに対応する出力結果セットのランキング情報を含み、前記出力結果セットは、他のマルチメディア素材を前記人工知能モデルに入力して取得した少なくとも１つの出力結果を含むことを特徴とする、前記コンテンツ投稿装置。
コンピュータ機器であって、
プロセッサ、およびメモリを備え、
前記メモリに、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットが記憶され、前記少なくとも１つの命令、前記少なくとも１セグメントのプログラム、前記コードセットまたは命令セットが、前記プロセッサによってロードおよび実行されると、請求項１ないし１３のいずれか一項に記載のコンテンツ投稿方法を実現することを特徴とする、前記コンピュータ機器。
コンピュータ読み取り可能な記憶媒体であって、前記読み取り可能な記憶媒体に、少なくとも１つの命令、少なくとも１セグメントのプログラム、コードセットまたは命令セットが記憶され、前記少なくとも１つの命令、前記少なくとも１セグメントのプログラム、前記コードセットまたは命令セットが、プロセッサによってロードおよび実行されると、請求項１ないし１３のいずれか一項に記載のコンテンツ投稿方法を実現することを特徴とする、前記コンピュータ読み取り可能な記憶媒体。