JP2022512271A

JP2022512271A - 音声パケット記録機能のガイド方法、装置、デバイス、プログラム及びコンピュータ記憶媒体

Info

Publication number: JP2022512271A
Application number: JP2021515173A
Authority: JP
Inventors: ウェンタオマー; チーチョウホアン; チンイーレイ; シーチアンティン
Original assignee: バイドゥオンラインネットワークテクノロジー（ペキン）カンパニーリミテッド
Priority date: 2019-11-20
Filing date: 2020-05-25
Publication date: 2022-02-03
Anticipated expiration: 2040-05-25
Also published as: CN112825256A; US11976931B2; KR20210065100A; US20220276067A1; EP3851803B1; WO2021098175A1; JP7225380B2; EP3851803A4; EP3851803A1; KR102440635B1

Abstract

本願は、ビッグデータ分野に関し、音声パケット記録機能のガイド方法、装置、デバイス及びコンピュータ記憶媒体を開示した。具体的な実現方案は、地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別し、前記目標ユーザがクライアントを使用する場面を識別し、音声パケット記録場面と一致すれば、前記クライアントに音声パケット記録機能の第１のガイド情報を送信する。本願によれば、音声パケット記録機能に対する正確なガイドを実現し、ユーザに対する過剰な妨害を軽減した。【選択図】図２

Description

本願は、出願日が２０１９年１１月２０日、出願番号が２０１９１１１４０１３７．６、発明名称が「音声パケット記録機能のガイド方法、装置、デバイス及びコンピュータ記憶媒体」である中国特許出願の優先権を主張した。
本願は、コンピュータ応用技術分野に関し、特にビッグデータ技術分野における音声パケット記録機能のガイド方法、装置、デバイス、プログラム及びコンピュータ記憶媒体に関する。

本明細書は、特許請求の範囲に記載されている本発明の実施形態に対して背景又は文脈を提供するためである。ここでの説明は、本明細書に含まれたからといって従来技術であると考えてはいけない。

コンピュータ技術の発展及び製品に対する人間のニーズの増加につれて、音声合成技術によりコンピュータ応用製品に話し手の異なる音声再生機能を提供する場合がある。例えば、地図関連製品において、ナビゲーション音声再生を行う際に、ユーザは地図関連製品により提供される異なる話し手を選択してナビゲーション音声再生を行うことができる。これらの話し手は、一般的に、俳優、コメディアン、歌手のような有名人である。しかし、パーソナライズに対するユーザのニーズの高まりに伴い、非常に少ない地図関連アプリがユーザにパーソナライズされた音声パケットの記録機能を提供する場合がある。ユーザが自身、家族又は友達などの音声を音声パケットとして記録可能であり、音声再生を行う際に自身、家族又は友達などの音声になる。
しかしながら、パーソナライズされた音声パケットの記録は、テクノロジーの最前線に立つ新機能として、殆どのユーザに認識されていない。大衆に当該機能を宣伝する場合に、従来はオープニング画面情報として宣伝し、ユーザに宣伝情報をプッシュするなどは、何れも情報丸ごと且つ同時にプッシュするため、全てのユーザがこのような宣伝情報を頻繁に受信することになり、配信精度が悪くなり、一部のユーザに過剰な妨害を引き起こす。

上記の状況に鑑み、本願発明は、宣伝情報によるユーザへの過剰な妨害を軽減する。

第１の形態によれば、本願は、地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別し、前記目標ユーザがクライアントを使用する場面を識別し、音声パケット記録の場面と一致すると、前記クライアントに音声パケット記録機能の第１のガイド情報を送信することを含む音声パケット記録機能のガイド方法を提供する。

本願の一つの好適な実施形態によれば、地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別することは、地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、予め訓練された第１の分類モデルにより前記地図ユーザの特徴ベクトルに基づいて地図ユーザを識別し、前記地図ユーザが音声パケット記録のニーズを有するか否かの識別結果を取得することを含む。

本願の一つの好適な実施形態によれば、ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別することは、シードユーザから行為特徴を予め抽出してシードユーザの特徴ベクトルを取得し、シードユーザの特徴ベクトルに基づいてシードユーザをクラスタリングして各ユーザクラスタを取得し、地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、前記地図ユーザの特徴ベクトルに基づいて地図ユーザが既存のユーザクラスタにクラスタリングされるか否かを確定し、既存のユーザクラスタにクラスタリングされた地図ユーザを音声パケット記録のニーズを有する目標ユーザとして識別することを含む。

本願の一つの好適な実施形態によれば、前記特徴ベクトルは更にユーザプロファイルを含む。

本願の一つの好適な実施形態によれば、前記行為特徴は、旅行相関行為、音声使用行為及び音声パケット相関行為のうちの少なくとも一つを含み、前記旅行相関行為は、ＰＯＩ検索、ナビゲーション及び定位のうちの少なくとも一つの時間／位置情報を含み、前記音声使用行為は、音声機能を使用する頻度、直前の使用時間及び使用された音声機能のうちの少なくとも一つを含み、前記音声パケット相関行為は、音声パケットを使用する回数、使用される音声パケットのタイプ、音声パケットを記録する状態、直前の音声パケット記録の時間、及び音声パケット記録ページにアクセスする頻度のうちの少なくとも一つを含む。

本願の一つの好適な実施形態によれば、前記目標ユーザがクライアントを使用する場面を識別することは、前記目標ユーザがクライアントを使用する場面情報を取得し、予め訓練された第２の分類モデルにより前記場面情報を識別して前記場面情報が音声パケット記録の場面と一致するか否かの識別結果を取得することを含む。

本願の一つの好適な実施形態によれば、前記場面情報は、前記目標ユーザがクライアントを使用する時間情報、位置情報、直前のＰＯＩ検索時間、直前のナビゲーション時間、常駐位置に定位されたか、音声パケットを記録する状態、直前の音声パケット記録の時間及び履歴における第１のガイド情報に対する応答情報のうちの少なくとも一つを含む。

本願の一つの好適な実施形態によれば，当該方法は、更に、ユーザが音声パケットを記録するイベントを取得した後に、ユーザによる音声パケット記録の状態を追跡して記録することを含む。

本願の一つの好適な実施形態によれば、当該方法は、更に、前記ユーザによる音声パケット記録の状態に基づいて前記ユーザに第２のガイド情報を送信することを含む。

第２の形態によれば、本願は、地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別するニーズ識別ユニットと、前記目標ユーザがクライアントを使用する場面を識別する場面識別ユニットと、前記目標ユーザがクライアントを使用する場面が音声パケット記録場面と一致すれば、前記クライアントに音声パケット記録機能の第１のガイド情報を送信する第１のガイドユニットとを備える音声パケット記録機能のガイド装置を提供する。

第３の形態によれば、本願は、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサと通信接続されたメモリとを備え、前記メモリは、前記少なくとも一つのプロセッサにより実行可能なコマンドを記憶しており、前記コマンドは、前記少なくとも一つのプロセッサが前記の何れか一つの方法を実行できるように、前記少なくとも一つのプロセッサにより実行される電子デバイスを提供する。

第４の形態によれば、本願は、前記コンピュータに前記の何れか一つの方法を実行させるコンピュータコマンドを記憶する不揮発性コンピュータ可読記憶媒体を提供する。

前記の技術案によれば、本願により提供される方法、装置、デバイス及びコンピュータ記憶媒体は以下の利点を具備することができる。

１）本願は、履歴の地図使用行為により音声パケット記録のニーズを有する目標ユーザを識別し、目標ユーザがクライアントを使用する場面を識別し、音声パケット記録のニーズを有し且つ音声パケット記録場面と一致するユーザのみに音声パケット記録機能のガイド情報を送信することにより、精確なガイドを実現し、ユーザに対する過剰な妨害を軽減した。

２）本願によりクライアントにおいて実現された精確なガイドは、従来的に有名人を代弁者とすること、或いはプッシュによる方式と比べて、コストを大幅に削減し、転換率を向上した。

３）本願において、ユーザの音声パケット記録状態を追跡し記録して後続のユーザに対するニーズ識別と場面識別に用いることにより、ユーザの連続したガイドを実現し、ユーザのニーズと場面に対する識別を最適化した。

４）本願において、ユーザの音声パケット記録状態に基づいてユーザに更にガイド情報を送信できるため、ユーザの記録に対する激励及び記録フローのガイドを実現した。

前記選択可能な方式における他の効果は、以下で具体的な実施例と合わせて説明する。

図面は、本実施形態をより良く理解するためのものであり、本願発明を限定しない。図面において、
本願の実施例を適用可能な例示的なシステム構造を示した。本願の実施例により提供される方法のフローチャートである。本願の実施例により提供される第１のガイド情報の模式図である。本願の実施例により提供される装置の構成図である。本願の実施例を実現するための電子デバイスのブロック図である。

以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。

図１は、本願実施例を適用可能な、音声パケット記録機能に用いられるガイド方法又は音声パケット記録機能に用いられるガイド装置の例示的なシステム構造を示した。

図１に示されたように、当該システム構造は、端末デバイス１０１と１０２、ネットワーク１０３及びサーバ１０４を備えてよい。ネットワーク１０３は、端末デバイス１０１、１０２とサーバ１０４との間に通信リンクの媒体を提供する。ネットワーク１０３は、例えば有線、無線通信リンク又は光ファイバケーブルなどのような各種の接続タイプを含んでよい。

ユーザは、端末デバイス１０１と１０２を使用してネットワーク１０３を介してサーバ１０４とインタラクティブを行うことができる。端末デバイス１０１と１０２には、例えば音声インタラクティブアプリ、地図関連アプリ、ウェブブラウザアプリ、通信関連アプリなどのような各種のアプリがインストールされて良い。

端末デバイス１０１と１０２は、記録（即ちユーザが記録した音声データを取り込むこと機能）と音声再生をサポートする各種の電子デバイスであって良い。スマートフォン、タブレット、ノートパソコンなどを含むが、それらに限定されない。本願により提供される音声パケット記録機能のガイド装置は、前記サーバ１０４に設置して実行することができる。複数のソフトウェア又はソフトウェアモジュール（例えば分散型サービスを提供する）として実現されても良く、単一のソフトウェア又はソフトウェアモジュールとして実現されても良いが、ここでは特に限定しない。サーバ１０４は、ユーザが端末デバイス１０１又は１０２におけるクライアントを介して地図アプリの使用履歴行為を記録し、これに基づいてクライアントに音声パケット記録機能のガイド情報を送信することができる。

サーバ１０４は、単一のサーバでも良く、複数のサーバからなるサーバグループであっても良い。理解すべきなのは、図１における端末デバイス、ネットワーク及びサーバの数は、例示的なものに過ぎない。実際の必要に応じて、任意の数の端末デバイス、ネットワーク及びサーバを具備しても良い。

本願の本旨は、ユーザの履歴の地図使用行為により音声パケット記録のニーズを有するユーザを識別し、音声パケット記録のニーズを有するユーザがクライアントを使用する場面を識別し、所定の音声パケット記録場面と一致すれば、クライアントに音声パケット記録機能のガイド情報を送信することにある。つまり、ニーズと場面についてユーザを識別し、音声パケット記録場面のみにおいて音声パケット記録のニーズを有するユーザをガイドすることにより、宣伝情報によるユーザへの過剰な妨害を軽減する。以下の実施例は、本願により提供される方法を詳しく説明する。

図２は、本願の実施例により提供される方法のフローチャートである。図２に示されたように、当該方法は、以下のステップを含んでよい。

２０１において、地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別する。

あるアプリ製品、特に人気のあるアプリについて、一般的にユーザの数が非常に多い。従来技術のように全てのユーザに音声パケット記録機能を宣伝すると、必ずこのようなニーズを持っていないユーザに対する邪魔になる。

本ステップは、目標ユーザの選択であり、採用方式が以下の二種類を含むが、それらに限定されない。

第１種の方式において、地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、予め訓練された第１の分類モデルにより、地図ユーザの特徴ベクトルに基づいて地図ユーザを識別して地図ユーザが音声パケット記録のニーズを有するか否かの識別結果を得る。

前記方式における特徴ベクトルは、行為特徴のほか、ユーザプロファイルを含んでも良い。なお、ユーザプロファイルは、年齢、性別、仕事などであって良い。

以下に主に行為特徴について説明する。本願において抽出された行為特徴は、旅行相関行為、音声使用行為及び音声パケット相関行為のうちの少なくとも一つを含むが、それらに限定されない。

なお、旅行相関行為は、ＰＯＩ検索、ナビゲーションと定位のうちの少なくとも一つの時間／位置情報を含んで良い。一般的には、音声パケットを使用して記録可能なユーザに地図使用の行為において幾つかの特徴が現れ、例えば子供を持っている親が音声パケット記録機能により子供の音声を音声パケットとして記録可能である。それは、例えば朝夕に幼稚園の定位データがあり、週末に塾までナビゲーションすることがあり、子供との遊ぶに適する場所を検索することなどが現れることになる。また、例えば、在校する大学生は、自分の音声又は恋人の音声を使って音声パケットを記録する可能性があり、多くの場合にある大学に定位されたことが現れる。従って、ＰＯＩ検索、ナビゲーション及び定位の時間／位置情報は、主にユーザが音声パケット記録機能の目標ユーザであるか否かを反映することができる。

音声使用行為は、音声機能を使用する頻度、直前の使用時間及び使用された音声機能のうちの少なくとも一つを含んで良い。例えば、あるユーザがいつもナビゲーション再生機能を使用すれば、このようなユーザが音声パケット機能を使用する潜在の目標ユーザである可能性がある。また、例えば、あるユーザがいつも音声インタラクション方式で地図を使用すれば、このようなユーザも音声パケット機能を使用する潜在の目標ユーザである可能性がある。

音声パケット相関行為は、音声パケットを使用する回数、使用される音声パケットのタイプ、音声パケットを記録する状態、直前の音声パケットの記録時間及び音声パケット記録ページにアクセスする頻度のうちの少なくとも一つを含む。例えば、幾つかのユーザが各種の音声パケットの使用に興味あり、豊富な音声パケットの使用履歴があれば、このようなユーザが音声パケットの自作に興味がある可能性がある。また、例えば，幾つかのユーザが音声パケット記録機能を使ったことがあり、且つ長い間に新たな音声パケットを記録していなければ、当該ユーザがガイドで新たな音声パケットの記録を行う可能性がある。また、例えば、幾つかのユーザが前回に音声パケットを記録する時に完成していなければ、ガイドで音声パケットの記録を完成する可能性がある。

地図ユーザに対して行為特徴とユーザプロファイルが抽出された後に、それぞれコーディングし又はマッピングしてそれぞれに対応する特徴ベクトルを得、更にスプライシングして地図ユーザの特徴ベクトルを得る。

地図ユーザの特徴ベクトルが予め訓練された分類モデルに入力され、分類モデルが当該特徴ベクトルによる分類結果、即ち当該地図ユーザが音声パケット記録のニーズを有するか否かを出力する。

分類モデルは訓練を行う場合に、予めオフライン訪問、電話インタビューでポジティブ／ネガティブサンプルを特定し、或いは、小さい範囲内にオンラインで第１のガイド情報をユーザに送信し、ユーザから第１のガイド情報に応答するか否かに基づいてポジティブ／ネガティブサンプルを特定することができる。そして、ポジティブサンプルになるユーザの履歴の地図使用行為から行為特徴を抽出してポジティブサンプルユーザの特徴ベクトルを得、ネガティブサンプルになるユーザの履歴の地図使用行為から行為特徴を抽出してネガティブサンプルユーザの特徴ベクトルを得ることにより、分類モデルを訓練する。ポジティブ／ネガティブサンプルユーザの特徴ベクトルの特定方式は、前記地図ユーザの特徴ベクトルの特定方式と一致するため、ここでは詳しく説明しない。なお、分類モデルは、例えばＳＶＭ（ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ，サポートベクトルマシーン）、ＬＲ（ＬｏｇｉｓｔｉｃＲｅｇｒｅｓｓｉｏｎ，ロジスティック回帰モデル）などを採用すれば良い。

第２種の方式において、予めシードユーザから行為特徴を抽出してシードユーザの特徴ベクトルを得、シードユーザの特徴ベクトルに基づいてシードユーザをクラスタリングして各ユーザクラスタを取得し、地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを得、地図ユーザの特徴ベクトルに基づいて地図ユーザが既存のユーザクラスタにクラスタリングされるか否かを確定し、既存のユーザクラスタにクラスタリングされた地図ユーザを音声パケット記録のニーズを有する目標ユーザとして識別する。

予め音声パケット記録機能を使ったことがある幾つかのユーザをシードユーザとして特定し、これらのシードユーザから特徴ベクトルを抽出することができる。特徴ベクトルの抽出方式は前記の方式と同じであるため、ここでは詳しく説明しない。シードユーザの特徴ベクトルに基づいてシードユーザをクラスタリングして各ユーザクラスタを得る。これらのユーザクラスタは実際に一部の典型的なユーザタイプを示す。これらのユーザタイプは、音声パケット記録機能を使用する確率が高い。各ユーザクラスタが得られた後に、当該タイプの特徴ベクトルをまとめて算出し、地図ユーザの特徴ベクトルに基づいて地図ユーザが既存のユーザクラスタにクラスタリングされることができる。既存のユーザクラスタへのクラスタリングができれば、当該地図ユーザがこれらの典型的なユーザタイプに属し、音声パケット記録機能を使用する確率が高いと示す。既存のユーザクラスタへの地図ユーザのクラスタリングができなければ、当該地図ユーザがこれらの典型的なユーザタイプに属せず、音声パケット記録機能を使用する確率が低いと示す。

本願は、前記のクラスタリングに採用されたクラスタリング方法に制限しなくても良く、例えばＫ－ｍｅａｎｓ（ｋ平均値クラスタリングアルゴリズム）、ＥＭ（ＥｘｐｅｃｔａｔｉｏｎＭａｘｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ，期待値最大化）などのクラスタリング方法であって良い。

２０２において、目標ユーザがクライアントを使用する場面を識別する。

音声パケット記録は、環境に対する要求が厳しく、ノイズの高い環境で記録できないこと、及び記録時間が長く、ユーザに比較的に自由な時間が必要であること、という二つの特徴を持つが、ユーザの行為に関する規則性が異なり、全てのユーザが同一の場面でガイドすることに適するわけではないため、従来の全てのユーザに対する同時間のプッシュ方式が正確ではなく、ユーザへの過剰な妨害が発生し易い。これに鑑み、本願の実施例に場面識別のメカニズムが導入された。

本ステップにおいて、簡単な場面識別方式を採用して目標ユーザがクライアントを使用した現在の時間と位置が所定の音声パケット記録場面に属しているか否か、例えば現在の時間が夜八時以後又は週末であり、且つユーザが家に居ると定位されたか否かを判断することができる。

しかし、前記簡単に時間と位置を規則とする判断の他、ユーザの行為の慣習の複雑により、場面情報の使用についてより豊かで詳細になる必要がある。従って、本願は、一つの好ましい方式を提供して場面識別を行う。

目標ユーザがクライアントを使用した場面情報を取得し、予め訓練された第２の分類モデルにより場面情報を識別して、場面情報が音声パケット記録場面と一致するか否かの識別結果を得る。なお、取得された場面情報は、目標ユーザがクライアントを使用した時間情報、位置情報、直前のＰＯＩ検索の時間、直前のナビゲーション時間、常駐位置に定位されたか否か、音声パケットを記録する状態、直前の音声パケット記録の時間、及び履歴の第１のガイド情報に対する応答情報などのうちの何れか一つ又は任意の組み合わせを含んで良い。

第２の分類モデルを訓練する際に、小さい範囲内にオンラインで第１のガイド情報をユーザに送信し、ユーザが第１のガイド情報に応答したか否かに基づいてポジティブ／ネガティブサンプルを特定することができる。そして、ポジティブサンプルのユーザの場面情報、ネガティブサンプルのユーザの場面情報を取得して分類モデルを訓練する。なお、ポジティブ／ネガティブサンプルのユーザの場面情報の取得方式は、前記目標ユーザの場面情報の取得方式と一致する。

また、説明すべきなのは、本実施例における「第１の分類モデル」、「第２の分類モデル」、「第１のガイド情報」、「第２のガイド情報」などのうち、「第１」と「第２」は名称により区別するために過ぎず、数、順番などの意味を持たない。

２０３において、音声パケット記録場面に一致すると識別されると、クライアントに音声パケット記録機能の第１のガイド情報を送信する。

第１のガイド情報は、テキスト、ピクチャー、ページコンポーネント、リンクなどのうちの何れか一つ又は任意の組み合わせを採用して良い。ユーザは、当該第１のガイド情報により、音声パケットの記録ページに簡単にアクセスして音声記録を行うことができる。例えば、図３に示されたように、クライアントの画面上でコンポーネントとテキスト、ピクチャー、リンクの組み合わせを表示して第１のガイド情報を展示することができる。ユーザによりそのうちの「記録をクリックする」がクリックされると、音声パケットを記録するページに遷移される。

２０４において、ユーザの音声パケットを記録するイベントが取得された後に、ユーザによる音声パケット記録状態を追跡して記録する。

ユーザによる音声パケット記録状態に対する追跡及び記録は、後続で当該ユーザのニーズと場面識別に用いられ、即ち当該ユーザの行為特徴と場面特徴を更新できると共に、ステップ２０５の実行に用いることができる。

２０５において、ユーザによる音声パケット記録状態に基づいて、ユーザに第２のガイド情報を送信する。

本願において、異なる記録状態に基づいて異なる文章を予め配置し、ユーザによる音声パケット記録状態に応じてユーザに対応する文章のテキスト情報、音声情報などを第２のガイド情報として送信することができる。

例えば、ユーザの記録の完成まで５句が足りない場合に、ユーザに「勝利は目の前！頑張れ」という音声を送信して良い。ユーザの記録が完成すると、ユーザに「素晴らしい、記録が完成しました、１５分後に音声パケットをダウンロードすることができる」などを送信して良い。このようなガイド情報は、ユーザに激励を与え、例えば児童などが一回で記録を完成させることに寄与できる。一方、記録手順に慣れていないユーザが次にどうするかを了解するようにすることもできる。

以上は本願により提供された方法について詳しく説明した。以下で実施例と合わせて本願により提供される装置を詳しく説明する。

図４は、本願の実施例により提供された装置の構成図である。図４に示されたように、当該装置は、ニーズ識別ユニット０１と、場面識別ユニット０２と、第１のガイドユニット０３とを備えても良く、更に記録追跡ユニット０４と第２のガイドユニット０５とを備えても良い。なお、各部の主な機能は以下のようになる。

ニーズ識別ユニット０１は、地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別する。

なお、ニーズ識別ユニット０１は、以下の二種類の方式を採用して良いが、それらに限定されない。

前記行為特徴は、旅行相関行為、音声使用行為及び音声パケット相関行為のうちの少なくとも一つを含んで良い。

なお、旅行相関行為は、ＰＯＩ検索、ナビゲーション及び定位のうちの少なくとも一つの時間／位置情報を含む。音声使用行為は、音声機能を使用する頻度、直前の使用時間及び使用された音声機能のうちの少なくとも一つを含む。音声パケット相関行為は、音声パケットを使用する回数、使用された音声パケットのタイプ、音声パケットを記録する状態、直前の音声パケットの記録時間及び音声パケット記録ページにアクセスする頻度のうちの少なくとも一つを含む。

前記方式における特徴ベクトルは、行為特徴のほか、更にユーザプロファイルを含んで良い。なお、ユーザプロファイルは、年齢、性別、仕事などであって良い。地図ユーザに対して行為特徴とユーザプロファイルが抽出された後に、それぞれコーディングし又はマッピングしてそれぞれに対応する特徴ベクトルを得、更にスプライシングして地図ユーザの特徴ベクトルを得る。

また、当該装置は、前記第１種の方式について、訓練サンプルを取得する第１のモデル訓練ユニット（図示せず）を更に備えて良い。当該訓練サンプルは、予めオフライン訪問、電話インタビューでポジティブ／ネガティブサンプルを特定し、或いは、小さい範囲内にオンラインで第１のガイド情報をユーザに送信し、ユーザから第１のガイド情報に応答するか否かに基づいてポジティブ／ネガティブサンプルを特定することができる。そして、ポジティブサンプルになるユーザの履歴の地図使用行為から行為特徴を抽出してポジティブサンプルユーザの特徴ベクトルを得、ネガティブサンプルになるユーザの履歴の地図使用行為から行為特徴を抽出してネガティブサンプルユーザの特徴ベクトルを得ることにより、分類モデルを訓練して第１の分類モデルを得る。

場面識別ユニット０２は、目標ユーザがクライアントを使用する場面を識別する。

具体的に、場面識別ユニット０２は、目標ユーザがクライアントを使用する場面情報を取得し、予め訓練された第２の分類モデルにより場面情報を識別して、場面情報が音声パケット記録場面と一致するか否かの識別結果を得られる。

前記場面情報は、目標ユーザがクライアントを使用した時間情報、位置情報、直前のＰＯＩ検索の時間、直前のナビゲーションの時間、常駐位置に定位されたか、音声パケットを記録する状態、直前の音声パケットの記録時及び履歴の第１のガイド情報に対する応答情報のうちの少なくとも一つを含んで良い。

それに応じて、本願は、訓練サンプルを取得する第２のモデル訓練ユニット（図示せず）を更に備えて良い。例えば、小さい範囲内にオンラインで第１のガイド情報をユーザに送信し、ユーザが第１のガイド情報に応答したか否かに基づいてポジティブ／ネガティブサンプルを特定することができる。そして、ポジティブサンプルのユーザの場面情報、ネガティブサンプルのユーザの場面情報を取得して分類モデルを訓練して第２の分類モデルを得る。

第１のガイドユニット０３は、目標ユーザがクライアントを使用した場面が音声パケット記録場面と一致すれば、クライアントに音声パケット記録機能の第１のガイド情報を送信する。

第１のガイド情報は、テキスト、ピクチャー、ページコンポーネント、リンクなどのうちの何れか一つ又は任意の組み合わせを採用して良い。ユーザは、当該第１のガイド情報により、音声パケットの記録ページに簡単にアクセスして音声記録を行うことができる。

記録追跡ユニット０４は、ユーザが音声パケットを記録するイベントを取得した後に、ユーザによる音声パケット記録状態を追跡して記録する。

第２のガイドユニット０５は、ユーザによる音声パケット記録状態に基づいて、ユーザに第２のガイド情報を送信する。本願において、異なる記録状態に基づいて異なる文書を予め配置し、ユーザの音声パケット記録状態に基づいてユーザに対応する文書のテキスト情報、音声情報などを第２のガイド情報として送信することができる。

本願の実施例によれば、本願は更に電子デバイス及び可読記憶媒体を提供した。

図５は、本願の実施例の方法による電子デバイスのブロック図である。電子デバイスは、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、ＰＤＡ、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータであることが意図される。電子デバイスは、様々な形式のモバイル装置、例えば、ＰＤＡ、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。本文で示された構成要素、それらの接続及び関係、ならびにそれらの機能は例示にすぎなく、本明細書において説明及び／又は請求される本出願の実現を限定することが意図されない。

図５に示すように、この電子デバイスは、一つ又は複数のプロセッサ５０１、メモリ５０２、及び各構成要素に接続するための高速インターフェース及び低速インターフェースを含むインターフェースを備える。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の態様で実装されてもよい。プロセッサは、電子デバイス内で実行されるコマンドを処理してもよく、メモリに記憶される又はメモリ上で外部入力／出力装置（例えば、インターフェースに結合される表示装置）にグラフィカルユーザインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、必要な場合に、複数のプロセッサ及び／又は複数のバスが、複数のメモリとともに用いられてもよい。同様に、複数の電子デバイスが接続されてもよく、それぞれのデバイスが必要な操作の一部を提供する（例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサシステムとする）。図５において、一つのプロセッサ５０１を例とする。

メモリ５０２は、本出願で提供される非一時的コンピュータ可読記憶媒体である。なお、前記メモリには、少なくとも１つのプロセッサが本願に提供された方法を実行するように、前記少なくとも１つのプロセッサに実行可能なコマンドが記憶されている。本出願の非一時的コンピュータ可読記憶媒体は、本願に提供された方法をコンピュータに実行させるためのコンピュータコマンドを記憶している。

メモリ５０２は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム、モジュール、例えば、本出願の実施例における方法に対応するプログラムコマンド／ユニットを記憶するために用いられる。プロセッサ５０１は、メモリ５０２に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例における方法を実現する。

メモリ５０２は、プログラム記憶領域及びデータ記憶領域を含んでもよく、プログラム記憶領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、データ記憶領域は電子デバイスの使用により作成されたデータなどを記憶してもよい。また、メモリ５０２は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリ、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ５０２は、プロセッサ５０１に対して遠隔設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介して電子デバイスに接続されてもよい。上記のネットワークの実例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。

電子デバイスは、更に、入力装置５０３と出力装置５０４とを備えても良い。プロセッサ５０１、メモリ５０２、入力装置５０３及び出力装置５０４は、バス又は他の手段により接続されても良く、図５においてバスによる接続を例とする。

入力装置５０３は、入力された数字又はキャラクタ情報を受信し、電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置５０４は、表示装置、補助照明装置（例えば、ＬＥＤ）、触覚フィードバック装置（例えば、振動モータ）などを含むことができる。当該表示装置は、液晶ディスプレイ（ＬＣＤ）、発光ダイオードディスプレイ（ＬＥＤ）、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。

本明細書に説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向け集積回路（ＡＳＩＣ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、当該記憶システム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサを含む、プログラム可能なシステム上で実行可能及び／又は解釈可能な一つ又は複数のコンピュータプログラムにおける実行を含んでもよい。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される）は、プログラマブルプロセッサの機械命令を含み、高水準のプロセス及び／又はオブジェクト向けプログラミング言語、及び／又はアセンブリ／機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」及び「コンピュータ可読媒体」という用語は、機械可読信号としての機械命令を受け取る機械可読媒体を含むプログラマブルプロセッサに機械命令及び／又はデータを提供するのに用いられる任意のコンピュータプログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス（ＰＬＤ））を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械命令及び／又はデータを提供するために用いられる任意の信号を指す。

ユーザとのインタラクティブを提供するために、本明細書に説明されるシステムと技術は、ユーザに対して情報を表示するための表示装置（例えば、ＣＲＴ（ブラウン管）又はＬＣＤ（液晶ディスプレイ）モニタ）、ユーザがコンピュータに入力を与えることができるキーボード及びポインティングデバイス（例えば、マウスや、トラックボール）を有するコンピュータ上に実施されることが可能である。その他の種類の装置は、さらに、ユーザとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚的なフィードバック、聴覚的なフィードバック、又は触覚的なフィードバック）であり得、ユーザからの入力は、任意の形態で（音響、音声又は触覚による入力を含む）受信され得る。

本明細書に説明されるシステムと技術は、バックエンド構成要素を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア構成要素を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド構成要素を含むコンピューティングシステム（例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる）、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク（「ＬＡＮ」）、ワイド・エリア・ネットワーク（「ＷＡＮ」）、インターネットワークを含む。

コンピュータシステムは、クライアントとサーバを含み得る。クライアントとサーバは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント－サーバの関係を有するコンピュータプログラムによって生じる。

以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。

上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。

Claims

音声パケット記録機能のガイド方法であって、
地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別し、
前記目標ユーザのクライアントを使用する場面を識別し、音声パケット記録の場面と一致すると、前記クライアントに音声パケット記録機能の第１のガイド情報を送信することを含む、方法。
地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別することは、
地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、
予め訓練された第１の分類モデルにより前記地図ユーザの特徴ベクトルに基づいて地図ユーザを識別し、前記地図ユーザが音声パケット記録のニーズを有するか否かの識別結果を取得することを含む、請求項１に記載の方法。
ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別することは、
シードユーザから行為特徴を予め抽出してシードユーザの特徴ベクトルを取得し、シードユーザの特徴ベクトルに基づいてシードユーザをクラスタリングして各ユーザクラスタを取得し、
地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、
前記地図ユーザの特徴ベクトルに基づいて地図ユーザが既存のユーザクラスタにクラスタリングされるか否かを確定し、
既存のユーザクラスタにクラスタリングされた地図ユーザを音声パケット記録のニーズを有する目標ユーザとして識別することを含む、請求項１に記載の方法。
前記特徴ベクトルは更にユーザプロファイルを含む、請求項２又は３に記載の方法。
前記行為特徴は、旅行相関行為、音声使用行為及び音声パケット相関行為のうちの少なくとも一つを含み、
前記旅行相関行為は、ＰＯＩ検索、ナビゲーション及び定位のうちの少なくとも一つの時間／位置情報を含み、
前記音声使用行為は、音声機能を使用する頻度、直前の使用時間及び使用された音声機能のうちの少なくとも一つを含み、
前記音声パケット相関行為は、音声パケットを使用する回数、使用される音声パケットのタイプ、音声パケットを記録する状態、直前の音声パケット記録の時間、及び音声パケット記録ページにアクセスする頻度のうちの少なくとも一つを含む、請求項２又は３に記載の方法。
前記目標ユーザがクライアントを使用する場面を識別することは、
前記目標ユーザがクライアントを使用する場面情報を取得し、予め訓練された第２の分類モデルにより前記場面情報を識別して前記場面情報が音声パケット記録の場面と一致するか否かの識別結果を取得することを含む、請求項１に記載の方法。
前記場面情報は、前記目標ユーザがクライアントを使用する時間情報、位置情報、直前のＰＯＩ検索時間、直前のナビゲーション時間、常駐位置に定位されたか、音声パケットを記録する状態、直前の音声パケット記録の時間及び履歴における第１のガイド情報に対する応答情報のうちの少なくとも一つを含む、請求項６に記載の方法。
当該方法は、
ユーザの音声パケットを記録するイベントを取得した後に、ユーザによる音声パケット記録の状態を追跡して記録することを更に含む、請求項１に記載の方法。
当該方法は、
前記ユーザによる音声パケット記録の状態に基づいて前記ユーザに第２のガイド情報を送信することを更に含む、請求項８に記載の方法。
音声パケット記録機能のガイド装置であって、
地図ユーザの履歴の地図使用行為により、音声パケット記録のニーズを有する目標ユーザを識別するニーズ識別ユニットと、
前記目標ユーザのクライアントを使用する場面を識別する場面識別ユニットと、
前記目標ユーザがクライアントを使用する場面が音声パケット記録場面と一致すれば、前記クライアントに音声パケット記録機能の第１のガイド情報を送信する第１のガイドユニットとを備える、装置。
前記ニーズ識別ユニットは、
地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、
予め訓練された第１の分類モデルにより前記地図ユーザの特徴ベクトルに基づいて地図ユーザを識別し、前記地図ユーザが音声パケット記録のニーズを有するか否かの識別結果を取得する、請求項１０に記載の装置。
前記ニーズ識別ユニットは、
シードユーザから行為特徴を予め抽出してシードユーザの特徴ベクトルを取得し、シードユーザの特徴ベクトルに基づいてシードユーザをクラスタリングして各ユーザクラスタを取得し、
地図ユーザの履歴の地図使用行為から行為特徴を抽出して地図ユーザの特徴ベクトルを取得し、
前記地図ユーザの特徴ベクトルに基づいて地図ユーザが既存のユーザクラスタにクラスタリングされるか否かを確定し、
既存のユーザクラスタにクラスタリングされた地図ユーザを音声パケット記録のニーズを有する目標ユーザとして識別する、請求項１０に記載の装置。
前記行為特徴は、旅行相関行為、音声使用行為及び音声パケット相関行為のうちの少なくとも一つを含み、
前記旅行相関行為は、ＰＯＩ検索、ナビゲーション及び定位のうちの少なくとも一つの時間／位置情報を含み、
前記音声使用行為は、音声機能を使用する頻度、直前の使用時間及び使用された音声機能のうちの少なくとも一つを含み、
前記音声パケット相関行為は、音声パケットを使用する回数、使用される音声パケットのタイプ、音声パケットを記録する状態、直前の音声パケット記録の時間、及び音声パケット記録ページにアクセスする頻度のうちの少なくとも一つを含む、請求項１１又は１２に記載の装置。
前記場面識別ユニットは、前記目標ユーザがクライアントを使用する場面情報を取得し、予め訓練された第２の分類モデルにより前記場面情報を識別して前記場面情報が音声パケット記録の場面と一致するか否かの識別結果を取得し、
前記場面情報は、前記目標ユーザがクライアントを使用する時間情報、位置情報、直前のＰＯＩ検索時間、直前のナビゲーション時間、常駐位置に定位されたか、音声パケットを記録する状態、直前の音声パケット記録の時間及び履歴における第１のガイド情報に対する応答情報のうちの少なくとも一つを含む、請求項１０に記載の装置。
当該装置は、
ユーザの音声パケットを記録するイベントを取得した後に、ユーザによる音声パケット記録状態を追跡して記録する記録追跡ユニットを更に備える、請求項１０に記載の装置。
当該装置は、
前記ユーザによる音声パケット記録状態に基づいて、前記ユーザに第２のガイド情報を送信する第２のガイドユニットを更に備える、請求項１５に記載の装置。
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を備え、
前記メモリに前記少なくとも一つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサに請求項１～９の何れか一つに記載の方法を実行させる、電子デバイス。
コンピュータコマンドが記憶されており、前記コンピュータコマンドは前記コンピュータに請求項１～９の何れか一つに記載の方法を実行させる、不揮発性コンピュータ可読記憶媒体。
コンピュータに請求項１～９の何れか一つに記載の方法を実行させる命令を含む、プログラム。