JP7194284B2 - 量子化モデルの最適化方法、装置、情報推薦方法、装置、ニューラルネットワークモデルの最適化方法、装置、電子機器及びコンピュータプログラム - Google Patents

量子化モデルの最適化方法、装置、情報推薦方法、装置、ニューラルネットワークモデルの最適化方法、装置、電子機器及びコンピュータプログラム Download PDF

Info

Publication number
JP7194284B2
JP7194284B2 JP2021533463A JP2021533463A JP7194284B2 JP 7194284 B2 JP7194284 B2 JP 7194284B2 JP 2021533463 A JP2021533463 A JP 2021533463A JP 2021533463 A JP2021533463 A JP 2021533463A JP 7194284 B2 JP7194284 B2 JP 7194284B2
Authority
JP
Japan
Prior art keywords
parameter
model
jump
quantized
predetermined time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021533463A
Other languages
English (en)
Other versions
JP2022531641A (ja
Inventor
ユアン,イ
マオ,ジチョン
ワン,ヨンジョアン
シュイ,ユィホォイ
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2022531641A publication Critical patent/JP2022531641A/ja
Application granted granted Critical
Publication of JP7194284B2 publication Critical patent/JP7194284B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Machine Translation (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、2019年5月10日に中国特許庁に提出された、出願番号が201910390616.7であり、出願名称が「量子化モデルの最適化方法、装置、電子機器及びコンピュータ記憶媒体」である中国特許出願の優先権を主張し、その内容の全てが本願に引用にて組み込まれる。
本願は、人工知能の機械学習の技術分野に関し、具体的には、量子化モデルの最適化方法、装置、電子機器及びコンピュータ記憶媒体に関する。
コンピュータ技術の発展に伴い、ニューラルネットワークモデルがますます広く注目されて適用されている。例えば、情報認識、推薦やユーザ行動予測などに適用されている。通常、ニューラルネットワークモデルにより推薦予測を行う前に、予め大量の訓練データを使用して、ニューラルネットワークモデルをオフラインで訓練する必要があり、それにより、ニューラルネットワークモデルをオンラインで実際に使用する際、訓練データ以外の、実際の適用シーンで生成されたデータに対して、推薦予測能力を持つようになることができる。
従来、実際にオンラインで適用される際、ユーザ及び製品は、新しい職業の出現、新しい作品の生成などの新しい行動を生成し、これらの新しい行動は、データ上で、通常、新しいデータ特徴として表される。しかし、オフラインで訓練された後のニューラルネットワークモデルは、通常、それ自体のオリジナル最適化アルゴリズムにより、新しいデータ特徴を学習するので、学習能力が弱く、推薦予測の正確性が低いなどの問題を引き起こしてしまう。
本願は、上述の技術的欠陥の少なくとも1つを解決するために、以下の技術的思想を提供することを目的とする。
各実施例は、
訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定するステップであって、量子化モデルは、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルであるステップと、
各ジャンプレイシオに基づいて、所定時間範囲内のジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得するステップと、
タイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたターゲット最適化アルゴリズムを獲得して、ターゲット最適化アルゴリズムに基づいて量子化モデルを訓練するステップと、を含む、量子化モデルの最適化方法を提供する。
各実施例は、
訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定する第1の決定モジュールであって、量子化モデルは、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルである第1の決定モジュールと、
各ジャンプレイシオに基づいて、所定時間範囲内のジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する第1の処理モジュールと、
タイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたターゲット最適化アルゴリズムを獲得して、ターゲット最適化アルゴリズムに基づいて量子化モデルを訓練する第2の処理モジュールと、を含む、量子化モデルの最適化装置をさらに提供する。
各実施例は、
所定時間帯内のユーザ行動データを取得するステップと、
上述の量子化モデルの最適化方法で獲得された最適化後の量子化モデルに基づいて、ユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定するステップと、
ユーザ行動特徴に基づいてターゲット推薦情報を決定し、ターゲット推薦情報を推薦するステップと、を含む、最適化後の量子化モデルに基づく情報推薦方法をさらに提供する。
他の態様では、
所定時間帯内のユーザ行動データを取得する取得モジュールと、
上述の量子化モデルの最適化方法で獲得された最適化後の量子化モデルに基づいて、ユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定する第2の決定モジュールと、
ユーザ行動特徴に基づいてターゲット推薦情報を決定し、ターゲット推薦情報を推薦する推薦モジュールと、を含む、最適化後の量子化モデルに基づく情報推薦装置を提供する。
また、各実施例は、
ニューラルネットワークモデルのオリジナル学習率パラメータを決定するステップであって、ニューラルネットワークモデルは、前記量子化モデル又は前記量子化モデルの量子化前のオリジナルモデルであるステップと、
ジャンプレイシオに基づいて、ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定するステップであって、ジャンプレイシオは、上述の量子化モデルの最適化方法で獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオであるステップと、
信頼度に基づいてオリジナル学習率パラメータを調整することで、ニューラルネットワークモデルを最適化するステップと、を含む、ニューラルネットワークモデルの最適化方法を提供する。
各実施例は、
ニューラルネットワークモデルのオリジナル学習率パラメータを決定する第3の決定モジュールであって、前記ニューラルネットワークモデルは、前記量子化モデル又は前記量子化モデルの量子化前のオリジナルモデルである第3の決定モジュールと、
ジャンプレイシオに基づいて、ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定する第4の決定モジュールであって、ジャンプレイシオは、上述の量子化モデルの最適化方法で獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオである第4の決定モジュールと、
信頼度に基づいてオリジナル学習率パラメータを調整することで、ニューラルネットワークモデルを最適化する最適化モジュールと、を含む、ニューラルネットワークモデルの最適化装置をさらに提供する。
各実施例は、メモリと、プロセッサと、メモリに記憶されており、プロセッサにより実行されることができるコンピュータプログラムを含む電子機器であって、プロセッサが前記プログラムを実行すると、各実施例の方法を実現する、電子機器をさらに提供する。
各実施例は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、このプログラムがプロセッサにより実行されると、各実施例の方法を実現する、コンピュータ読み取り可能な記憶媒体をさらに提供する。
本願の実施例による量子化モデルの最適化方法は、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオが対応するジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行って獲得されたタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化後のオリジナル最適化アルゴリズムに基づいて、量子化モデルを訓練し、それにより、オリジナル最適化アルゴリズムを最適化する際、時間パラメータを十分に配慮することで、量子化モデルがオンラインで適用される過程において、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンライン予測推薦を行う正確性を向上させる。
本願の実施例による最適化後の量子化モデルに基づく情報推薦方法は、最適化後の量子化モデルに基づいて、取得した所定時間帯内のユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定し、ユーザ行動特徴に基づいてターゲット推薦情報を推薦することによって、最適化後の量子化モデルに基づく推薦システが所定時間帯内のユーザの具体的な行動データに基づいて、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
本願の実施例によるニューラルネットワークモデルの最適化方法は、ジャンプレイシオの信頼度を決定し、信頼度に基づいてニューラルネットワークモデルの学習率パラメータを調整し、それにより、ニューラルネットワークモデルに対する最適化を実現することで、ニューラルネットワークモデルが新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
本願の上述の及び/又は付加的な側面及び利点は、下記の図面を参照した実施例についての説明により、明らかになり、理解しやすくなる。
本願の実施例の適用シーンの模式図である。 本願の実施例の量子化モデルの最適化方法の模式的なフローチャートである。 本願の実施例の所定時間範囲内での各ジャンプレイシオに対応するジャンプ曲線の模式図である。 本願の実施例の各期日の同じ所定時間区間のジャンプレイシオの曲線の模式図である。 本願の実施例のジャンプレイシオの曲線をフィッティングする模式図である。 本願の実施例のジャンプレイシオの曲線をフィッティングする他の模式図である。 本願の実施例の量子化モデルを最適化する模式的なプロセス図である。 本願の実施例のオリジナル最適化アルゴリズムと、ターゲット最適化アルゴリズムとの比較結果の模式図である。 本願の実施例の最適化後の量子化モデルに基づく情報推薦方法の模式的なフローチャートである。 本願の実施例のニューラルネットワークモデルの最適化方法の模式的なフローチャートである。 本願の実施例の量子化モデルの最適化装置の基本構成の模式図である。 本願の実施例の量子化モデルの最適化装置の詳細構成の模式図である。 本願の実施例の最適化後の量子化モデルに基づく情報推薦装置の基本構成の模式図である。 本願の実施例のニューラルネットワークモデルの最適化装置の基本構成の模式図である。 本願の実施例の電子機器の構成の模式図である。
以下、本願の実施例について詳細に説明する。前記実施例の例は、図面に示され、一貫して同様又は類似の番号は、同一又は類似の素子,または、同一又は類似の機能を有する素子を示す。以下、図面を参照して説明される実施例は、例示的なものであり、本願を解釈するためのものに過ぎず、本願を制限するものとして解釈してはいけない。
特に説明しない限り、ここで用いられる単数形態の「1」、「1つ」、「前記」及び「この」は複数の形態も含んでもよいことが当業者は理解できる。本願の明細書で用いられる用語の「含む」とは、前記特徴、整数、ステップ、動作、素子及び/又はコンポーネントの存在を意味するが、1つ又は複数の他の特徴、整数、ステップ、動作、素子、コンポーネント及び/又はそれらのグループの追加又は存在を排除しないことがさらに理解できる。素子が他の素子に「接続」又は「結合」されている場合、他の素子に直接接続される、又は、結合されてもよいし、或いは、中間素子が存在してもよいことが理解できる。また、ここで用いられる「接続」又は「結合」されていることは、無線で接続されている、又は、無線で結合されていることを含む。ここで用いられる用語の「及び/又は」は、関連してリストされる全て又はいずれかのユニット、及び全ての組合せを含む。
以下、本願の目的、技術的思想及び利点をより明瞭にするために、図面を参照しながら本願の実施形態についてさらに詳細に説明する。
本願による量子化モデルの最適化方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体は、従来技術の上述の技術課題を解決することを目的とする。
以下の具体的な実施例により、本願の技術的思想及び本願の技術的思想が如何に上述の技術課題を解決するかについて詳細に説明する。以下、この一部の具体的な実施例は、互いに組み合わせることができ、同一又は類似の概念又はプロセスについて、一部の実施例においては説明を省略する可能性がある。以下、図面を参照しながら、本願の実施例について説明する。
人工知能(Artificial Intelligence、AI)は、デジタルコンピュータ又はデジタルコンピュータにより制御されるマシンを利用して、人間の知能をシミュレート、延伸及び拡張し、環境を感知し、知識を取得し、知識で最適な結果を取得する理論、方法、技術及び応用システムである。つまり、人工知能は、コンピュータ科学の統合技術であり、知能の実質を把握し、人間の知能に類似する方式で反応できる新たな知能マシンを生産することを目的としている。人工知能は、様々な知能マシンの設計原理及び実現方法を研究し、マシンに感知、推理及び決定する機能を具備するようにする。
人工知能技術は、統合学科であり、関連する分野が広く、ハードウェア技術にも関わり、ソフトウェア技術にも関わる。人工知能の基礎技術は、一般的に、センサ、専用人工知能チップ、クラウドコンピューティング、分散型記憶、ビッグデータ処理技術、オペレーティング/インタラクティブシステム、メカトロニクスなどの技術を含む。人工知能ソフトウェア技術は、主に、コンピュータビジョン技術、音声処理技術、自然言語処理技術及び機械学習/深層学習などの複数の方面を含む。
コンピュータビジョン技術(Computer Vision、CV)は、如何に機械に「見させる」かを研究する科学であり、さらに言えば、人の目の代わりに、ビデオカメラ及びコンピュータを用いてターゲットに対して認識、追跡、測定などの機械ビジョンを行い、さらにグラフィック処理を行い、人の目の観察又は機械検出に適する画像にコンピュータで処理することを指す。科学学科としては、コンピュータビジョンは、関連する理論及び技術を研究することで、画像又は多次元データから情報を取得できる人工知能システムを構築することを目的とする。コンピュータビジョン技術は、通常、画像処理、画像認識、画像セマンティクス理解、画像検索、OCR、ビデオ処理、ビデオセマンティクス理解、ビデオコンテンツ/行動認識、三次元物体の再構築、3D技術、仮想現実、拡張現実、シンクロナス測位、地図構築などの技術を含み、一般的な顔認識、指紋認識などの生体的特徴の認識技術をさらに含む。
音声技術(Speech Technology)のキー技術は、自動音声認識技術(ASR)、音声合成技術(TTS)及び声紋認識技術である。コンピュータが聞いたり、見たり、話したり、感じたりできるようにすることは、未来のヒューマンコンピュータインタラクションの発展方向であり、ここで、音声が将来的に最も有望なヒューマンコンピュータインタラクション方式の1つとなっている。
自然言語処理(Nature Language processing、NLP)は、コンピュータ科学分野と人工知能分野での重要な部分である。自然言語処理は、人とコンピュータとが自然言語で効果的に通信することを実現できる様々な理論及び方法を研究するものである。自然言語処理は、言語学と、コンピュータ科学と、数学とを一体に統合する科学である。従って、この分野での研究は、自然言語、すなわち、人々が日常的に使用する言語に関わるため、言語学の研究と密接に関連している。自然言語処理技術は、通常、テキスト処理、セマンティクス理解、機械翻訳、ロボットQ&A、知識スペクトルなどの技術を含む。
機械学習(Machine Learning、ML)は、複数の分野の交差学科であり、確率論、統計学、近似論、凸解析、アルゴリズム複雑度理論などの複数の学科に関する。コンピュータにどのように人間の学習行為をシミュレート又は実現し、新たな知識又はスキルを取得し、従来の知識構造を改めて組織して性能を改善させるかを専門に研究する。機械学習は、人工知能の核心であり、コンピュータに知能を具備するようにする基本的な方法であり、人工知能の各分野に適用されている。機械学習及び深層学習は、通常、人工ニューラルネットワーク、信念ネットワーク、強化学習、転移学習、帰納学習、教示学習などの技術を含む。
自動運転技術は、通常、高精度地図、環境感知、行動決定、経路計画、移動制御などの技術を含み、広い利用可能性を持っている。
人工知能技術の研究及び進歩に伴って、人工知能技術は、通常のスマートホーム、スマートウェアラブルデバイス、仮想アシスタント、スマートスピーカー、スマートマーケティング、無人運転、自律運転、ドローン、ロボット、スマート医療、スマートカスタマーサービスなどの複数の分野において研究及び利用が展開されており、人工知能技術は、技術の発展に伴って、より多くの分野において利用され、ますます重要な価値を発揮する。
本願の実施例による技術的思想は、人工知能の機械学習などの技術に関し、具体的には、以下の実施例にて説明する。
本願の一実施例は、コンピュータ機器に適用される量子化モデルの最適化方法を提供し、このコンピュータ機器は、端末又はサーバであってもよく、例えば、図1Aに示すサーバ10、又は、サーバ10とネットワーク20を介して通信する端末30、40、50などである。端末30、40、50は、デスクトップ機器又はモバイル端末であってもよい。サーバ10は、独立した物理サーバ、物理サーバクラスター又は仮想サーバであってもよい。図1に示すように、この方法は、ステップS110~ステップS130を含む。
ステップS110において、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定する。量子化モデルは、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルである。
一部の実施例では、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルを予めオフラインで訓練し、訓練後の量子モデルを獲得することができ、それにより、訓練後の量子モデルを使用する際、訓練データ以外の、実際の適用シーンで生成されたデータに対して、推薦予測の能力を有するようになる。量子化とは、マルチビットの高精度の数値を、限られた数の低精度の数値に変換するプロセスである。ニューラルネットワークモデルの埋め込み層パラメータに対して量子化処理を行うことによって、高次元かつスパースな埋め込み層を量子化し、低次元かつ稠密なニューラルネットワーク(DNN)モデルの精度を維持することができ、それにより、ニューラルネットワークモデルの大きさを圧縮し、ニューラルネットワークモデルの予測性能を向上させることができる。
一部の実施例では、訓練後の量子モデルを使用する際、量子化モデルの埋め込み層パラメータは、実際の適用シーンでユーザ又は製品により生成された新しい行動又は新しいデータに基づいて、所定時間範囲内でジャンプし得る。新しい行動又は新しいデータは、例えば、新しいビデオの閲覧、新しい図面の閲覧、新しい作品の生成などであってもよい。所定時間範囲は、例えば、1時間、12時間、24時間、1週間、1ヶ月などであってもよい。例えば、所定時間範囲が24時間である場合、埋め込み層パラメータは、実際の適用シーンでユーザ又は製品により生成された新しい行動に基づいて、24時間内で対応してジャンプする可能性がある。
一部の実施例では、量子化モデルの埋め込み層パラメータは、通常、複数であり、所定時間範囲内において、毎回ジャンプした埋め込み層パラメータは、同じである可能性があるし、同じではない可能性もある。また、所定時間範囲内において、毎回ジャンプした埋め込み層パラメータの数は、同じである可能性があるし、同じではない可能性もある。ジャンプレイシオは、ジャンプした埋め込み層パラメータの数と、埋め込み層パラメータの総数量との比である。例えば、所定時間範囲が24時間であり、埋め込み層パラメータの総数量が20である場合、現在ジャンプした埋め込み層パラメータの数が10であると、ジャンプレイシオが10/20=0.5であり、現在ジャンプした埋め込み層パラメータの数が5であると、ジャンプレイシオが5/20=0.25であり、現在ジャンプした埋め込み層パラメータの数が1であると、ジャンプレイシオが1/20=0.05である。
ステップS120において、各ジャンプレイシオに基づいて、所定時間範囲内のジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。
一部の実施例では、所定時間範囲内の各ジャンプレイシオが獲得されると、各ジャンプレイシオに基づいて、この所定時間範囲内のジャンプ曲線を描くことができる。ここで、ジャンプ曲線を描く際、この所定時間範囲を横座標、ジャンプレイシオの各々を縦座標とし、各ジャンプレイシオの離散点を描き、各離散点を接続することで、この所定時間範囲内のジャンプ曲線を獲得する。
一部の実施例では、所定時間範囲内のジャンプ曲線が獲得されると、このジャンプ曲線に対してフィッティング処理を行い、それにより、このジャンプ曲線に対応するタイムスケールパラメータを獲得し、量子化モデルのオリジナル最適化アルゴリズムに対する後続の最適化に前提及び保障を提供する。
ステップS130において、タイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたターゲット最適化アルゴリズムを獲得して、ターゲット最適化アルゴリズムに基づいて量子化モデルを訓練する。
一部の実施例では、ジャンプ曲線に対応するタイムスケールパラメータが獲得されると、このタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、それにより、最適化後のターゲット最適化アルゴリズムを獲得することができる。本願の実施例におけるオリジナル最適化アルゴリズムとは、ニューラルネットワークモデルにおいて、損失関数に基づいて、ニューラルネットワークモデルパラメータを最適化するアルゴリズムのことである。
一部の実施例では、最適化後のターゲット最適化アルゴリズムが獲得されると、このターゲット最適化アルゴリズムに基づいて量子化モデルを訓練することで、量子化モデルが実際の適用シーンで生成された新しいデータのデータ特徴を迅速にオンラインで学習できるようにすることができる。
本願の実施例による量子化モデルの最適化方法は、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオが対応するジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行って獲得されたタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化後のオリジナル最適化アルゴリズムに基づいて、量子化モデルを訓練し、それにより、オリジナル最適化アルゴリズムを最適化する際、時間パラメータを十分に配慮することで、量子化モデルがオンラインで適用される過程において、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンライン予測推薦を行う正確性を向上させる。
本願の実施例の一つ実現可能な形態では、埋め込み層パラメータの量子化処理は、埋め込み層パラメータのN(Nは1より大きい整数である)値化の量子化処理を含む。
一部の実施例では、実際には、埋め込み層パラメータの量子化処理は、二値化の量子化処理であってもよいし、三値化の量子化処理であってもよいし、四値化の量子化、五値化の量子化などの実現可能な量子化処理であってもよいが、本願の実施例では限定しない。
一部の実施例では、二値化の量子化処理とは、パラメータの値と量子化閾値との比較に基づいて、パラメータを0と1、又は-1と0、又は-1と1などに量子化することであるが、本願の実施例では限定しない。0と1を例として、パラメータの値が量子化閾値以上である場合、パラメータを1に量子化し、パラメータの値が量子化閾値より小さい場合、パラメータを0に量子化する。
一部の実施例では、三値化の量子化処理とは、パラメータの値と量子化閾値との比較に基づいて、パラメータを-1、0及び1の形式に量子化することである。勿論、ニーズに応じて、0、1及び2などの他の数値形式に量子化してもよいが、本願の実施例では限定しない。-1、0及び1を例として、量子化閾値を0.001とする場合、パラメータの値が-0.001より小さいと、パラメータを-1に量子化処理し、パラメータの値が-0.001以上、0.001以下であると、パラメータを0に量子化処理し、パラメータの値が0.001より大きいと、パラメータを1に量子化処理する。
ここで、上述の四値化の量子化、五値化の量子化などについて、それらの量子化処理プロセスは、上述の二値化の量子化処理、三値化の量子化処理と同様であるため、ここでは説明を省略する。
なお、以下、量子化結果が-1、0及び1である三値化の量子化処理を例として、本願の実施例について具体的に説明する。
一部の実施例では、実際の適用において、埋め込み層パラメータの所定時間範囲内の各所定時間区間でのパラメータジャンプがそれぞれ対応するジャンプレイシオを決定することで、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定することができる。所定時間範囲が一日中の24時間であり、各所定時間区間のそれぞれが0時~3時、3時~6時、6時~9時、9時~12時、12時~15時、15時~18時、18時~21時及び21時~24時であると仮定する場合、埋め込み層パラメータの、0時~3時、3時~6時、6時~9時、9時~12時、12時~15時、15時~18時、18時~21時及び21時~24時などの所定時間区間内での埋め込み層パラメータジャンプがそれぞれ対応するジャンプレイシオを決定することにより、埋め込み層パラメータの所定時間範囲内の各ジャンプレイシオを獲得することができる。
なお、各所定時間区間内でジャンプした埋め込み層パラメータは、同じである可能性があるし、同じではない可能性もあり、毎回ジャンプした埋め込み層パラメータの数は、同じである可能性があるし、同じではない可能性もある。ここで、ジャンプレイシオは、ジャンプした埋め込み層パラメータの数と埋め込み層パラメータの総数量との比である。また、埋め込み層パラメータのジャンプとは、埋め込み層パラメータが-1、0及び1の間を互いにジャンプすることであり、例えば、-1から1までジャンプしたり、-1から0までジャンプしたり、0から1までジャンプしたり、0から-1までジャンプしたり、1から0までジャンプしたり、1から-1までジャンプしたりするなどである。
一部の実施例では、埋め込み層パラメータの、0時~3時である所定時間区間内でのジャンプレイシオが0.05であり、3時~6時である所定時間区間内でのジャンプレイシオが0.04であり、6時~9時である所定時間区間内でのジャンプレイシオが0.03であり、9時~12時である所定時間区間内でのジャンプレイシオが0.02であり、12時~15時である所定時間区間内でのジャンプレイシオが0.02であり、15時~18時である所定時間区間内でのジャンプレイシオが0.01であり、18時~21時である所定時間区間内でのジャンプレイシオが0.01であり、21時~24時である所定時間区間内でのジャンプレイシオが0.01であると仮定する場合、埋め込み層パラメータの、一日中の24時間内のジャンプレイシオのそれぞれが順に0.05、0.04、0.03、0.02、0.02、0.01、0.01及び0.01であることを獲得することができる。
一部の実施例では、埋め込み層パラメータのいずれかの所定時間区間内でのパラメータジャンプのジャンプレイシオを決定する際、まず、いずれかの所定時間区間の埋め込み層パラメータがこのいずれかの所定時間の直前の所定時間区間の埋め込み層パラメータに対して、ジャンプしたパラメータの数を決定し、そして、パラメータの数及び埋め込み層パラメータの総数量に基づいて、埋め込み層パラメータのいずれかの所定時間区間内でのパラメータジャンプのジャンプレイシオを決定することができる。
以下、所定時間範囲が一日中の24時間であり、各所定時間区間がそれぞれ0時~3時、3時~6時、6時~9時、9時~12時、12時~15時、15時~18時、18時~21時及び21時~24時であることを例とすると、各所定時間区間においてジャンプしたパラメータの数を決定するプロセスについて具体的に説明する。埋め込み層パラメータの総数量が100であると仮定する場合、0時~3時である所定時間区間の埋め込み層パラメータがこのいずれかの所定時間(すなわち、0時~3時)の直前の所定時間区間(すなわち、前の日の21時~24時)の埋め込み層パラメータに対して、ジャンプしたパラメータの数が5であれば、埋め込み層パラメータの0時~3時である所定時間区間内でのジャンプレイシオが5/100=0.05であり、3時~6時である所定時間区間の埋め込み層パラメータがこのいずれかの所定時間(すなわち、3時~6時)の直前の所定時間区間(すなわち、0時~3時)の埋め込み層パラメータに対して、ジャンプしたパラメータの数が4であれば、埋め込み層パラメータの3時~6時である所定時間区間内でのジャンプレイシオが4/100=0.04であり、このようにして、埋め込み層パラメータの、6時~9時、9時~12時、12時~15時、15時~18時、18時~21時及び21時~24時などの所定時間区間でそれぞれ対応するジャンプレイシオを獲得することができる。
一部の実施例では、所定時間範囲内での各ジャンプレイシオが獲得されると、図2に示すように、各ジャンプレイシオに基づいて、この所定時間範囲内のジャンプ曲線を描くことができる。図2における横座標は時間であり、縦座標はジャンプレイシオである。ここで、図2における曲線から、所定の周期的な変化を呈することが分かり、その原因は、一日の異なる時間区間でのデータが異なる特徴を持っているからだ。例えば、朝には、ユーザが天気予報を見ることが多く、夜には、ユーザがニュースなどを見ることが多い。また、各期日の同じ所定時間区間には、一致性を持っている傾向があり、例えば、今日の朝に天気予報を見たユーザが、明日の朝にも天気予報を見る可能性が高い。この場合、図3に示すように、各期日の同じ所定時間区間での埋め込み層パラメータのジャンプレイシオを、対応するジャンプ曲線に描くと、その変化法則はより著しくなる。
本願の実施例の別の実現可能な形態では、埋め込み層パラメータの所定時間範囲内でのジャンプ曲線を描いた後、ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得することができる。
一部の実施例では、ジャンプ曲線に対してフィッティング処理を行う際、まず、描かれたジャンプ曲線の変化傾向に基づいて、このジャンプ曲線の曲線タイプを決定し、この曲線タイプに対応するフィッティング関数を決定し、そして、決定されたフィッティング関数に基づいて、このジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。図2及び図3におけるジャンプ曲線から分かるように、それらの変化傾向が指数関数の変化傾向と同様であるので、このジャンプ曲線の曲線タイプが指数関数曲線であることを決定することができ、この曲線タイプに対応するフィッティング関数が指数関数であることを決定することができる。指数関数に基づいて、このジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。図2におけるジャンプ曲線に対して指数関数フィッティングを行ったフィッティング曲線は、図4に示され、図3におけるジャンプ曲線に対して指数関数フィッティングを行ったフィッティング曲線は、図5に示される。
一部の実施例では、実際の適用において、描かれたジャンプ曲線の変化傾向と対数関数の変化傾向とが同様である場合、このジャンプ曲線の曲線タイプが対数関数曲線であることを決定することができ、この曲線タイプに対応するフィッティング関数が対数関数であることを決定することができる。対数関数によりこのジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。描かれたジャンプ曲線の変化傾向とベキ関数の変化傾向とが同様である場合、このジャンプ曲線の曲線タイプがベキ関数曲線であることを決定することができ、この曲線タイプに対応するフィッティング関数がベキ関数であることを決定することができる。ベキ関数によりこのジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。
一部の実施例では、対応するタイムスケールパラメータが獲得されると、獲得されたタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムにおける学習率パラメータを最適化し、最適化された学習率パラメータを獲得することができる。ここで、オリジナル最適化アルゴリズムにおける学習率パラメータをこの学習率パラメータとタイムスケールパラメータとの積に更新することで、量子化モデルにおけるオリジナル最適化アルゴリズムにおける学習率パラメータを最適化することができ、すなわち、最適化後の学習率パラメータはオリジナル最適化アルゴリズムにおける学習率パラメータとタイムスケールパラメータとの積となる。
量子化モデルのオリジナル最適化アルゴリズムを
Figure 0007194284000001

とする。ここで、gは、勾配又はモーメント推定を表し、tは、埋め込み層パラメータが更新されたタイムスタンプを表し、埋め込み層パラメータの更新回数であってもよく、αは、学習率パラメータであり、値が予め設定されたハイパーパラメータであり、
外1
Figure 0007194284000002
は、現在の所定時間区間の直前の所定時間区間のパラメータ値を表し、
外2

Figure 0007194284000003
は、現在の所定時間区間の埋め込み層パラメータ値を表す。また、フィッティングして獲得されたタイムスケールパラメータを
Figure 0007194284000004

(μ及びλがハイパーパラメータである)の形式とすると、最適化後の学習率パラメータが
Figure 0007194284000005

となり、最適化後の学習率パラメータを
外3
Figure 0007194284000006
とすると、
Figure 0007194284000007

となり、さらに、最適化後のターゲット最適化アルゴリズムが
Figure 0007194284000008

となる。
一部の実施例では、フィッティングして獲得されたタイムスケールパラメータを
Figure 0007194284000009

の形式とする場合、ターゲット最適化アルゴリズムに基づいて量子化モデルを訓練する際、量子化モデルの収束速度が所定の速度閾値より小さい、又は、収束速度に係る所定の条件を満たすと、μ又はλを適当に大きくし、すなわち、タイムスケールパラメータを大きくすることができ、量子化モデルの精度が所定の精度閾値より低い、又は、精度に係る所定の条件を満たすと、μ又はλを適当に小さくし、すなわち、タイムスケールパラメータを小さくすることができる。
一部の実施例では、図6は、本願の実施例の量子化モデルを最適化する模式的なプロセス図である。図6において、ステップS601において、量子化モデルをオフラインで訓練し、すなわち、オフラインシーンで、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルを、収束させるまで、サンプルデータで訓練し、訓練後の量子モデルを獲得する。
ステップS602において、埋め込み層パラメータのジャンプ状況を統計する。
ここで、埋め込み層パラメータのジャンプ状況を統計することは、2つの実現可能な実施形態を含む。1つの実施形態としては、所定時間範囲内のオンライン実際の適用シーンでのユーザ又は製品により生成されたデータを、時間の前後順序で記憶し、そして、記憶されたデータをオフラインで訓練された後の量子モデルに入力し、このオフラインで訓練された後の量子モデルの埋め込み層パラメータのジャンプ状況を決定する、あるいは、記憶されたデータを訓練データとして、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルに入力して訓練し、この訓練中の埋め込み層パラメータのジャンプ状況を決定する。もう1つの実施形態としては、オフラインで訓練された後の量子モデルを実際のオンライン適用シーンで適用し、実際のオンライン適用シーンでのユーザ又は製品により生成されたデータに基づいて、埋め込み層パラメータの所定時間範囲内の各所定時間区間でのパラメータジャンプがそれぞれ対応するジャンプレイシオをリアルタイムに決定する。
ステップS603において、パラメータジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。
すなわち、所定時間範囲内の各ジャンプレイシオが獲得されると、各ジャンプレイシオに基づいて、この所定時間範囲内のジャンプ曲線を描き、描かれたジャンプ曲線の変化傾向に基づいて、このジャンプ曲線の曲線タイプを決定し、この曲線タイプに対応するフィッティング関数を決定する。決定されたフィッティング関数に基づいてこのジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。
ステップS604において、オリジナル最適化アルゴリズムとフィッティングして獲得されたタイムスケールパラメータとを結合して、改良後のターゲット最適化アルゴリズムを獲得する。
すなわち、獲得されたタイムスケールパラメータに基づいて、オリジナル最適化アルゴリズムにおける学習率パラメータをこの学習率パラメータとタイムスケールパラメータとの積に更新し、それにより、最適化後の学習率パラメータを獲得し、さらに最適化後のターゲット最適化アルゴリズムを獲得する。
ステップS605において、最適化後のターゲット最適化アルゴリズムを用いて、量子化モデルを改めて訓練し、それにより、ターゲット最適化アルゴリズムに基づいて、量子化モデルに対してオンライン訓練を行うことができ、量子化モデルがオンラインで適用される場合、新しいデータ特徴を迅速に学習できるようにし、オンライン予測能力及び推薦正確性を向上させる。
ステップS606において、タイムスケールパラメータを適当に調整することで、量子化モデルがより高い効果を実現する。
なお、実際の適用において、一定の訓練事前値又は経験値が参照となる場合、ステップS601~S602を繰り返して実行することなく、直接、最適化アルゴリズムにおいてタイムスケールパラメータ、例えば、
Figure 0007194284000010

を考慮してもよい。
図7は、オリジナル最適化アルゴリズムとターゲット最適化アルゴリズムとの比較結果の模式図を示す。図7には、量子化モデルのAUC(Area under curve、曲線下面積)曲線が示されている。図7におけるAUC曲線から分かるように、本願の実施例におけるターゲット最適化アルゴリズムは、オリジナル最適化アルゴリズムと比較すると、約24時間後のデータが、安定して2‰~6‰ほど高まる。この結果から分かるように、本願の実施例のターゲット最適化アルゴリズムによって、量子化モデルは、オンラインシーンで、新しいデータ特徴が生成される状況及び時間とともに変化する状況に良好に適応することができ、ターゲット最適化アルゴリズムは、量子化モデルのオンライン学習能力及び推薦正確性を向上させることに寄与する。
本願の他の実施例は、最適化後の量子化モデルに基づく情報推薦方法を提供する。コンピュータ機器に適応される方法であって、このコンピュータ機器は、端末又はサーバであってもよい。端末は、デスクトップ機器又はモバイル端末であってもよい。サーバは、独立する物理サーバ、物理サーバクラスター又は仮想サーバであってもよい。図8に示すように、この方法は、ステップS810~ステップS830を含む。
ステップS810において、所定時間帯内のユーザ行動データを取得する。
ステップS820において、量子化モデルの最適化方法による最適化後の量子化モデルに基づいて、ユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定する。
ステップS830において、ユーザ行動特徴に基づいて、ターゲット推薦情報を決定し、ターゲット推薦情報を推薦する。
一部の実施例では、コンピュータ機器の推薦システムは、最適化後の量子化モデルを用いて、所定時間帯内のユーザ行動データをオンラインでリアルタイム取得することができ、例えば、12時~13時である所定時間帯内にユーザがショッピングウェブページを閲覧したり、ユーザがニュースを閲覧したりするなどのユーザ行動データを取得し、また例えば、この前の20時~22時である所定時間帯内のユーザがビデオを閲覧したり、ユーザがウェブページを閲覧したりするなどのユーザ行動データなどを取得する。ここで、上述の推薦システムとは、ユーザのニーズ、好みなどの特徴に基づいて、ニュース、商品などの情報を個人化推薦するシステムのものであり、特に説明しない限り、「推薦システム」という言葉は、ウェブページ、画像テキストやビデオなどの情報を推薦するシステムを意味する。
一部の実施例では、所定時間帯内のユーザ行動データが取得されると、上述の実施例で獲得された最適化後の量子化モデルに基づいて、ユーザ行動データを学習することができ、それにより、取得された所定時間帯内のユーザ行動データに対応するユーザ行動特徴を獲得して、この後にユーザに情報を推薦することに、前提及び保障を提供する。
一部の実施例では、ユーザ行動データに対応するユーザ行動特徴が決定されると、決定されたユーザ行動特徴に基づいてターゲット推薦情報を決定し、決定されたターゲット推薦情報をユーザに推薦することができる。
本願の実施例による方法は、最適化後の量子化モデルに基づいて、取得された所定時間帯内のユーザ行動データを学習することで、ユーザ行動データに対応するユーザ行動特徴を決定し、ユーザ行動特徴に基づいてターゲット推薦情報を推薦することで、最適化後の量子化モデルに基づく推薦システムが所定時間帯内のユーザの具体的な行動データに基づいて、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
本願の他の実施例は、ニューラルネットワークモデルの最適化方法を提供する。コンピュータ機器に適用される方法であって、このコンピュータ機器は、端末又はサーバであってもよい。端末は、デスクトップ機器又はモバイル端末であってもよい。サーバは、独立する物理サーバ、物理サーバクラスター又は仮想サーバであってもよい。図9に示すように、この方法は、ステップS910~ステップS930を含むことができる。
ステップS910において、ニューラルネットワークモデルのオリジナル学習率パラメータを決定する。ニューラルネットワークモデルは、量子化モデル又は量子化モデルの量子化前のオリジナルモデルである。
ステップS920において、ジャンプレイシオに基づいて、ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定する。ジャンプレイシオは、量子化モデルの最適化方法で獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオである。
ステップS930において、信頼度に基づいてオリジナル学習率パラメータを調整することで、ニューラルネットワークモデルを最適化する。
一部の実施例では、本願の実施例のニューラルネットワークモデルは、埋め込み層パラメータが量子化処理される前のオリジナルのニューラルネットワークモデルであってもよいし、埋め込み層パラメータが量子化処理された後のニューラルネットワークモデルである量子化モデルであってもよい。
一部の実施例では、現在、埋め込み層パラメータが量子化処理されていないオリジナルのニューラルネットワークモデルを使用している場合、まず、このニューラルネットワークモデルのオリジナル学習率パラメータを決定する必要がある。ジャンプレイシオと所定の信頼度との比例関係に基づいて、ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定する。信頼度に基づいてオリジナル学習率パラメータを調整することで、ニューラルネットワークモデルを最適化する。ここで、ジャンプレイシオは、量子化モデルの最適化方法に基づいて獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオである。
一部の実施例では、現在、量子化モデル(すなわち、埋め込み層パラメータが量子化処理された後のニューラルネットワークモデル)を使用している場合、まず、この量子化モデルのオリジナル学習率パラメータを決定する必要がある。ジャンプレイシオと所定の信頼度との比例関係に基づいて、量子化モデル埋め込み層パラメータの信頼度を決定する。信頼度に基づいてオリジナル学習率パラメータを調整することで、量子化モデルを最適化する。ここで、ジャンプレイシオは、量子化モデルの最適化方法に基づいて獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオである。
一部の実施例では、本願の実施例の埋め込み層パラメータのジャンプレイシオと現在の埋め込み層の信頼度とが反比例関係をなすと仮定する。埋め込み層パラメータのジャンプレイシオが高いほど、この所定時間区間内の埋め込み層パラメータと、安定したニューラルネットワークモデルに対応する埋め込み層パラメータとが異なる確率が高くなり、ニューラルネットワークモデルの埋め込み層パラメータが信頼できなく、すなわち、信頼度が低いと考えられる。この所定時間区間内の信頼度が第1の所定の条件を満たす(例えば、直前の所定時間の埋め込み層パラメータの信頼度より遥かに低く、また例えば、第1の所定の信頼度閾値より小さい)場合、学習率パラメータを大きくすることで、迅速に調整できるようにする必要がある。埋め込み層パラメータのジャンプレイシオが低いほど、この所定時間区間内の埋め込み層パラメータと、安定したニューラルネットワークモデルに対応する埋め込み層パラメータとが異なる確率が低くなり、埋め込み層パラメータが信頼でき、すなわち、信頼度が高いと考えられる。この所定時間区間内の信頼度が第2の所定の条件を満たす(例えば、直前の所定時間の埋め込み層パラメータの信頼度より遥かに高く、また例えば、第2の所定の信頼度閾値以上である)場合、学習率パラメータを適当に小さくすることで、微調整できるようにする必要がある。ここで、最適化された後の量子化モデルの埋め込み層パラメータのジャンプレイシオは、連続的空間において、ニューラルネットワークモデルの現在の所定時間区間内での学習率パラメータを調整する根拠とすることができ、すなわち、埋め込み層パラメータが量子化処理されていないオリジナルのニューラルネットワークモデル、又は、埋め込み層パラメータが量子化処理された後のニューラルネットワークモデルが、現在の所定時間区間内において、学習率パラメータを調整する根拠とすることができる。
本願の実施例による方法は、ジャンプレイシオの信頼度を決定することで、信頼度に基づいてニューラルネットワークモデルの学習率パラメータを調整し、それにより、ニューラルネットワークモデルに対する最適化を実現し、ニューラルネットワークモデルが新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
図10は、本願の他の実施例による量子化モデルの最適化装置の基本構成の模式図である。図10に示すように、この装置1000は、第1の決定モジュール1001と、第1の処理モジュール1002と、第2の処理モジュール1003とを含む。
第1の決定モジュール1001は、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定し、量子化モデルは、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルである。
第1の処理モジュール1002は、各ジャンプレイシオに基づいて、所定時間範囲内のジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。
第2の処理モジュール1003は、タイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたターゲット最適化アルゴリズムを獲得して、ターゲット最適化アルゴリズムに基づいて量子化モデルを訓練する。
本願の実施例による装置は、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオのジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行って獲得されたタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたオリジナル最適化アルゴリズムに基づいて、量子化モデルを訓練する。それにより、オリジナル最適化アルゴリズムを最適化する際、時間パラメータを十分に考慮することで、量子化モデルがオンライン適用過程において、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンライン予測推薦を行う正確性を向上させる。
図11は、本願のまた他の実施例による量子化モデルの最適化装置の詳細構成の模式図である。図11に示すように、この装置1100は、第1の決定モジュール1101と、第1の処理モジュール1102と、第2の処理モジュール1103とを含む。図11における第1の決定モジュール1101により実現された機能と、図10における第1の決定モジュール1001とが同様であり、図11における第1の処理モジュール1102により実現された機能と、図10における第1の処理モジュール1002とが同様であり、図11における第2の処理モジュール1103により実現された機能と、図10における第2の処理モジュール1003とが同様であり、ここでは説明を省略する。
埋め込み層パラメータの量子化処理は、埋め込み層パラメータのN(Nは1より大きい整数である)値化の量子化処理である。
第1の決定モジュール1101は、埋め込み層パラメータの所定時間範囲内の各所定時間区間でのパラメータジャンプがそれぞれ対応するジャンプレイシオを決定する。
図11に示すように、第1の決定モジュール1101は、パラメータ数決定サブモジュール11011と、ジャンプレイシオ決定サブモジュール11012とを含む。
パラメータ数決定サブモジュール11011は、いずれかの所定時間区間の埋め込み層パラメータがこのいずれかの所定時間の直前の所定時間区間の埋め込み層パラメータに対して、ジャンプしたパラメータの数を決定する。
ジャンプレイシオ決定サブモジュール11012は、パラメータの数及び埋め込み層パラメータの総数量に基づいて、埋め込み層パラメータのいずれかの所定時間区間内でのジャンプパラメータのジャンプレイシオを決定する。
別の実現可能な形態では、第1の処理モジュール1102は、フィッティング関数決定サブモジュール11021と、フィッティング処理サブモジュール11022とを含む。
フィッティング関数決定サブモジュール11021は、ジャンプ曲線の曲線タイプを決定し、曲線タイプに対応するフィッティング関数を決定する。
フィッティング処理サブモジュール11022は、フィッティング関数に基づいて、ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する。
一部の実施例では、第2の処理モジュール1103は、タイムスケールパラメータに基づいて、オリジナル最適化アルゴリズムにおける学習率パラメータを最適化する。
一部の実施例では、第2の処理モジュール1103は、オリジナル最適化アルゴリズムにおける学習率パラメータを、学習率パラメータとタイムスケールパラメータとの積に更新する。
一部の実施例では、第2の処理モジュール1103は、量子化モデルの収束速度が所定の速度閾値より小さい場合、タイムスケールパラメータを大きくし、量子化モデルの精度が所定の精度閾値より小さい場合、タイムスケールパラメータを小さくする。
図12は、本願のまた他の実施例による最適化後の量子化モデルに基づく情報推薦装置の基本構成の模式図である。図12に示すように、この装置1200は、取得モジュール1201と、第2の決定モジュール1202と、推薦モジュール1203とを含む。
取得モジュール1201は、所定時間帯内のユーザ行動データを取得する。
第2の決定モジュール1202は、上述の量子化モデルの最適化方法で獲得された最適化後の量子化モデルに基づいて、ユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定する。
推薦モジュール1203は、ユーザ行動特徴に基づいてターゲット推薦情報を決定し、ターゲット推薦情報を推薦する。
本願の実施例による装置は、最適化後の量子化モデルに基づいて、取得した所定時間帯内のユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定し、ユーザ行動特徴に基づいてターゲット推薦情報を推薦することによって、最適化後の量子化モデルに基づく推薦システムが所定時間帯内のユーザの具体的な行動データに基づいて、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
図13は、本願のまた他の実施例によるニューラルネットワークモデルの最適化装置の基本構成の模式図である。図13に示すように、この装置1300は、第3の決定モジュール1301と、第4の決定モジュール1302と、最適化モジュール1303とを含む。
第3の決定モジュール1301は、ニューラルネットワークモデルのオリジナル学習率パラメータを決定することができ、ニューラルネットワークモデルは、量子化モデル又は量子化モデルの量子化前のオリジナルモデルである。
第4の決定モジュール1302は、ジャンプレイシオに基づいて、ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定することができ、ジャンプレイシオは、上述の量子化モデルの最適化方法で獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオである。
最適化モジュール1303は、前記信頼度に基づいて、オリジナル学習率パラメータを調整することで、ニューラルネットワークモデルを最適化する。
一部の実施例では、最適化モジュール1303は、信頼度が第1の所定の条件を満たす場合、オリジナル学習率パラメータを小さくし、信頼度が第2の所定の条件を満たす場合、オリジナル学習率パラメータを大きくする。
本願の実施例による装置は、ジャンプレイシオの信頼度を決定し、信頼度に基づいてニューラルネットワークモデルの学習率パラメータを調整することで、ニューラルネットワークモデルに対する最適化を実現し、ニューラルネットワークモデルが新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
本願の他の実施例は、図14に示す電子機器を提供し、図14に示す電子機器1400は、プロセッサ1401と、メモリ1403とを含む。プロセッサ1401とメモリ1403とが接続されており、例えば、バス1402を介して接続されている。一部の実施例では、電子機器1400は、送受信機1404をさらに含んでもよい。なお、実際の適用において、送受信機1404は、1つに限られず、この電子機器1400の構造は、本願の実施例を限定しない。
ここで、プロセッサ1401は、本願の実施例に適用され、図10又は図11に示す第1の決定モジュール、第1の処理モジュール及び第2の処理モジュールの機能を実現し、図12に示す取得モジュール、第2の決定モジュール及び推薦モジュールの機能を実現し、図13に示す第3の決定モジュール、第4の決定モジュール及び最適化モデルの機能を実現するためのものである。
プロセッサ1401は、CPU、汎用プロセッサ、DSP、ASIC、FPGA、又は、他のプログラマブルロジックデバイス、トランジスタロジックデバイス、ハードウェア部材、又は、それらの任意の組合せであってもよい。本願に開示された内容を用いて説明された各例示的なロジックブロック、モジュール及び回路を実現又は実行することができる。プロセッサ1401は、演算機能を実現する組合せであってもよく、例えば、1つ又は複数のマイクロプロセッサーの組合せ、DSPとマイクロプロセッサーの組合せなどを含む。
バス1402は、上述のコンポーネントの間で情報を転送するチャンネルを含む。バス1402は、PCIバス又はEISAバスなどであってもよい。バス1402は、アドレスバス、データバス、制御バスなどに分けられてもよい。便宜のために、図14では、1本の粗い線のみで示されるが、1本のバス又は1種のバスしかないというわけではない。
メモリ1403は、ROM、又は、静的情報及び命令を記憶できる他のタイプの静的記憶デバイス、RAM、或いは、情報及び命令を記憶できる他の種類の動的記憶デバイスであってもよいし、EEPROM、CD-ROM又は他のディスクメモリ、光ディスクメモリ(圧縮光ディスク、レーザディスク、光ディスク、デジタルユニバーサル光ディスク、ブルーレイ光ディスクなどを含む)、磁気ディスク記憶媒体もしくは他の磁気記憶デバイスであってもよいし、或いは、命令又はデータ構造の形式の所望のプログラムコードを保持もしくは記憶することができ、かつコンピュータによってアクセスすることができる任意の他の媒体であってもよいが、これらに限られない。
メモリ1403は、本願の実施形態を実行するアプリケーションプログラムコードを記憶するためのものであり、プロセッサ1401により制御して実行される。プロセッサ1401は、メモリ1403に記憶されたアプリケーションプログラムコードを実行することで、図10又は図11に示す実施例による量子化モデルの最適化装置の動作を実現する、又は、図12に示す実施例による最適化された量子化モデルに基づく情報推薦装置の動作を実現するする、又は、図13に示す実施例によるニューラルネットワークモデルの最適化装置の動作を実現する。
本願のまた他の実施例による電子機器は、メモリと、プロセッサと、メモリに記憶されており、プロセッサにより実行できるコンピュータプログラムとを含み、プロセッサは、プログラムを実行すると、各実施例の方法を実現することができる。
例えば、本願の実施例による装置は、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオのジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行って獲得されたタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化後のオリジナル最適化アルゴリズムに基づいて、量子化モデルを訓練する。それにより、オリジナル最適化アルゴリズムを最適化する際、時間パラメータを十分に考慮することで、量子化モデルがオンライン適用過程において、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンライン予測推薦を行う正確性を向上させる。
また例えば、本願の実施例による装置は、最適化後の量子化モデルに基づいて、取得した所定時間帯内のユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定し、ユーザ行動特徴に基づいてターゲット推薦情報を推薦することによって、最適化後の量子化モデルに基づく推薦システムが所定時間帯内のユーザの具体的な行動データに基づいて、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
また例えば、本願の実施例による装置は、ジャンプレイシオの信頼度を決定し、信頼度に基づいてニューラルネットワークモデルの学習率パラメータを調整して、ニューラルネットワークモデルに対する最適化を実現する。それにより、ニューラルネットワークモデルが新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
本願のまた他の実施例は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、このプログラムは、プロセッサにより実行されると、上述いずれかの実施例による方法を実現する、コンピュータ読み取り可能な記憶媒体を提供する。
例えば、本願の実施例による装置は、訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオのジャンプ曲線を決定し、ジャンプ曲線に対してフィッティング処理を行って獲得されたタイムスケールパラメータに基づいて、量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化後のオリジナル最適化アルゴリズムに基づいて、量子化モデルを訓練する。それにより、オリジナル最適化アルゴリズムを最適化する際、時間パラメータを十分に考慮することで、量子化モデルがオンライン適用過程において、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンライン予測推薦を行う正確性を向上させる。
また例えば、最適化後の量子化モデルに基づいて、取得した所定時間帯内のユーザ行動データを学習し、ユーザ行動データに対応するユーザ行動特徴を決定し、ユーザ行動特徴に基づいてターゲット推薦情報を推薦することによって、最適化後の量子化モデルに基づく推薦システムが所定時間帯内のユーザの具体的な行動データに基づいて、新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
また例えば、ジャンプレイシオの信頼度を決定し、信頼度に基づいてニューラルネットワークモデルの学習率パラメータを調整して、ニューラルネットワークモデルに対する最適化を実現することで、ニューラルネットワークモデルが新しいデータ特徴を迅速に学習できるようにし、量子化モデルのオンライン予測能力、及び量子化モデルに基づいてオンラインで予測推薦を行う正確性を向上させる。
図面のフローチャートにおける各ステップは矢印が示す順番に実施されるが、これらのステップが必ずしも矢印が示す順番に実施されなくてもよいことが理解されるべきである。本明細書に明確な説明がないかぎり、これらのステップの実施順番は厳しく限定されず、他の順番で実施されてもよい。また、図面のフローチャートにおける少なくとも一部のステップは、複数のサブステップ又は複数の段階を含んでもよい。これらのサブステップと段階は必ず同じ時刻で実施されず、異なる時刻で実施されてもよく、その実施順番も必ずしも連続ではなく、他のステップ又は他のステップのサブステップ又は段階の少なくとも一部分と順番に又は交互に実施されてもよい。
以上は、本願の一部の実施形態に過ぎない。なお、当業者にとって、本願の原理から逸脱しない限り、いくつかの改良や修飾を行うことができ、これらの改良や修飾も本願の保護範囲に含まれると見なすべきである。

Claims (20)

  1. 電子機器に適用される量子化モデルの最適化方法であって、
    訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定するステップであって、前記量子化モデルは、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルであるステップと、
    各ジャンプレイシオに基づいて、前記所定時間範囲内のジャンプ曲線を決定し、前記ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得するステップと、
    前記タイムスケールパラメータに基づいて前記量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたターゲット最適化アルゴリズムを獲得して、前記ターゲット最適化アルゴリズムに基づいて前記量子化モデルを訓練するステップと、を含む、量子化モデルの最適化方法。
  2. 埋め込み層パラメータの量子化処理は、埋め込み層パラメータのN(Nは1より大きい整数である)値化の量子化処理を含む、請求項1に記載の方法。
  3. 訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定する前記ステップは、
    前記埋め込み層パラメータの前記所定時間範囲内の各所定時間区間でのパラメータジャンプがそれぞれ対応するジャンプレイシオを決定するステップを含み、
    前記埋め込み層パラメータのいずれかの所定時間区間内でのパラメータジャンプのジャンプレイシオを決定するステップは、
    前記いずれかの所定時間区間での埋め込み層パラメータがこのいずれかの所定時間の直前の所定時間区間での埋め込み層パラメータに対して、ジャンプしたパラメータの数を決定するステップと、
    前記パラメータの数及び前記埋め込み層パラメータの総数量に基づいて、前記埋め込み層パラメータの前記いずれかの所定時間区間でのパラメータジャンプのジャンプレイシオを決定するステップと、を含む、請求項1又は2に記載の方法。
  4. 前記ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得するステップは、
    前記ジャンプ曲線の曲線タイプを決定し、前記曲線タイプに対応するフィッティング関数を決定するステップと、
    前記フィッティング関数に基づいて、前記ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得するステップと、を含む、請求項1に記載の方法。
  5. 前記タイムスケールパラメータに基づいて前記量子化モデルのオリジナル最適化アルゴリズムを最適化するステップは、
    前記タイムスケールパラメータに基づいて、前記オリジナル最適化アルゴリズムにおける学習率パラメータを最適化するステップを含む、請求項1に記載の方法。
  6. 前記タイムスケールパラメータに基づいて、前記オリジナル最適化アルゴリズムにおける学習率パラメータを最適化するステップは、
    前記オリジナル最適化アルゴリズムにおける学習率パラメータを前記学習率パラメータと前記タイムスケールパラメータとの積に更新するステップを含む、請求項5に記載の方法。
  7. 前記量子化モデルを訓練するステップは、
    前記量子化モデルの収束速度が所定の速度閾値より小さい場合、前記タイムスケールパラメータを大きくするステップと、
    前記量子化モデルの精度が所定の精度閾値より小さい場合、前記タイムスケールパラメータを小さくするステップと、を含む、請求項1に記載の方法。
  8. 電子機器に適用される、最適化後の量子化モデルに基づく情報推薦方法であって、
    所定時間帯内のユーザ行動データを取得するステップと、
    請求項1~請求項7のいずれかに記載の方法で獲得された最適化後の量子化モデルに基づいて、前記ユーザ行動データを学習し、前記ユーザ行動データに対応するユーザ行動特徴を決定するステップと、
    前記ユーザ行動特徴に基づいて、ターゲット推薦情報を決定し、前記ターゲット推薦情報を推薦するステップと、を含む、情報推薦方法。
  9. 電子機器に適用されるニューラルネットワークモデルの最適化方法であって、
    ニューラルネットワークモデルのオリジナル学習率パラメータを決定するステップであって、前記ニューラルネットワークモデルは、前記量子化モデル又は前記量子化モデルの量子化前のオリジナルモデルであるステップと、
    ジャンプレイシオに基づいて、前記ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定するステップであって、前記ジャンプレイシオは、請求項1~請求項7のいずれかに記載の方法で獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオであるステップと、
    前記信頼度に基づいて、前記オリジナル学習率パラメータを調整することで、前記ニューラルネットワークモデルを最適化するステップと、を含む、ニューラルネットワークモデルの最適化方法。
  10. 前記信頼度に基づいて、前記オリジナル学習率パラメータを調整する前記ステップは、
    信頼度が第1の所定の条件を満たす場合、前記オリジナル学習率パラメータを小さくするステップと、
    信頼度が第2の所定の条件を満たす場合、前記オリジナル学習率パラメータを大きくするステップと、を含む、請求項9に記載の方法。
  11. 訓練後の量子モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオを決定する第1の決定モジュールであって、前記量子化モデルは、埋め込み層パラメータが量子化処理されたニューラルネットワークモデルである第1の決定モジュールと、
    各ジャンプレイシオに基づいて、前記所定時間範囲内のジャンプ曲線を決定し、前記ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得する第1の処理モジュールと、
    前記タイムスケールパラメータに基づいて前記量子化モデルのオリジナル最適化アルゴリズムを最適化し、最適化されたターゲット最適化アルゴリズムを獲得して、前記ターゲット最適化アルゴリズムに基づいて前記量子化モデルを訓練する第2の処理モジュールと、を含む、量子化モデルの最適化装置。
  12. 前記第1の決定モジュールは、
    前記埋め込み層パラメータの前記所定時間範囲内での各所定時間区間に対して、
    いずれかの所定時間区間の埋め込み層パラメータがこのいずれかの所定時間区間の直前の所定時間区間の埋め込み層パラメータに対して、ジャンプしたパラメータの数を決定し、
    前記パラメータの数及び前記埋め込み層パラメータの総数量に基づいて、前記埋め込み層パラメータの前記所定時間区間でのパラメータジャンプのジャンプレイシオを決定するためのものである、請求項11に記載の装置。
  13. 前記第1の処理モジュールは、
    前記ジャンプ曲線の曲線タイプを決定し、前記曲線タイプに対応するフィッティング関数を決定し、
    前記フィッティング関数に基づいて、前記ジャンプ曲線に対してフィッティング処理を行い、対応するタイムスケールパラメータを獲得するためのものである、請求項11に記載の装置。
  14. 前記第2の処理モジュールは、
    前記タイムスケールパラメータに基づいて、前記オリジナル最適化アルゴリズムにおける学習率パラメータを最適化するためのものである、請求項11に記載の装置。
  15. 前記第2の処理モジュールは、
    前記量子化モデルの収束速度が所定の速度閾値より小さい場合、前記タイムスケールパラメータを大きくし、
    前記量子化モデルの精度が所定の精度閾値より小さい場合、前記タイムスケールパラメータを小さくするためのものである、請求項11に記載の装置。
  16. 最適化後の量子化モデルに基づく情報推薦装置であって、
    所定時間帯内のユーザ行動データを取得する取得モジュールと、
    請求項1~請求項7のいずれかに記載の方法で獲得された最適化後の量子化モデルに基づいて、前記ユーザ行動データを学習し、前記ユーザ行動データに対応するユーザ行動特徴を決定する第2の決定モジュールと、
    前記ユーザ行動特徴に基づいて、ターゲット推薦情報を決定し、前記ターゲット推薦情報を推薦する推薦モジュールと、を含む、情報推薦装置。
  17. ニューラルネットワークモデルの最適化装置であって、
    ニューラルネットワークモデルのオリジナル学習率パラメータを決定する第3の決定モジュールであって、前記ニューラルネットワークモデルは、前記量子化モデル又は前記量子化モデルの量子化前のオリジナルモデルである第3の決定モジュールと、
    ジャンプレイシオに基づいて、前記ニューラルネットワークモデル埋め込み層パラメータの信頼度を決定する第4の決定モジュールであって、前記ジャンプレイシオは、請求項1~請求項7のいずれかに記載の方法で獲得された訓練後の量子化モデルの埋め込み層パラメータの所定時間範囲内での各ジャンプレイシオである第4の決定モジュールと、
    前記信頼度に基づいて、前記オリジナル学習率パラメータを調整することで、前記ニューラルネットワークモデルを最適化する最適化モジュールと、を含む、ニューラルネットワークモデルの最適化装置。
  18. 前記最適化モジュールは、
    信頼度が第1の所定の条件を満たす場合、前記オリジナル学習率パラメータを小さくし、
    信頼度が第2の所定の条件を満たす場合、前記オリジナル学習率パラメータを大きくするためのものである、請求項17に記載の装置。
  19. メモリと、プロセッサと、メモリに記憶されており、プロセッサにより実行されることができるコンピュータプログラムとを含む電子機器であって、
    前記プロセッサが前記プログラムを実行すると、請求項1~請求項10のいずれかに記載の方法を実現する電子機器。
  20. コンピュータプログラムであって、
    プロセッサにより実行されると、請求項1~請求項10のいずれかに記載の方法を実現する、コンピュータプログラム。
JP2021533463A 2019-05-10 2020-05-11 量子化モデルの最適化方法、装置、情報推薦方法、装置、ニューラルネットワークモデルの最適化方法、装置、電子機器及びコンピュータプログラム Active JP7194284B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910390616.7 2019-05-10
CN201910390616.7A CN110096647B (zh) 2019-05-10 2019-05-10 优化量化模型的方法、装置、电子设备及计算机存储介质
PCT/CN2020/089543 WO2020228655A1 (zh) 2019-05-10 2020-05-11 优化量化模型的方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
JP2022531641A JP2022531641A (ja) 2022-07-08
JP7194284B2 true JP7194284B2 (ja) 2022-12-21

Family

ID=67447749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021533463A Active JP7194284B2 (ja) 2019-05-10 2020-05-11 量子化モデルの最適化方法、装置、情報推薦方法、装置、ニューラルネットワークモデルの最適化方法、装置、電子機器及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210374540A1 (ja)
EP (1) EP3968184A4 (ja)
JP (1) JP7194284B2 (ja)
CN (1) CN110096647B (ja)
WO (1) WO2020228655A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019089015A1 (en) 2017-10-31 2019-05-09 Nissan North America, Inc. Autonomous vehicle operation with explicit occlusion reasoning
US11874120B2 (en) 2017-12-22 2024-01-16 Nissan North America, Inc. Shared autonomous vehicle operational management
CN110096647B (zh) * 2019-05-10 2023-04-07 腾讯科技(深圳)有限公司 优化量化模型的方法、装置、电子设备及计算机存储介质
WO2021036412A1 (zh) * 2019-08-23 2021-03-04 上海寒武纪信息科技有限公司 数据处理方法、装置、计算机设备和存储介质
CN110659678B (zh) * 2019-09-09 2023-11-17 腾讯科技(深圳)有限公司 一种用户行为分类方法、系统及存储介质
CN110659725B (zh) * 2019-09-20 2023-03-31 字节跳动有限公司 神经网络模型的压缩与加速方法、数据处理方法及装置
US11899454B2 (en) 2019-11-26 2024-02-13 Nissan North America, Inc. Objective-based reasoning in autonomous vehicle decision-making
US11635758B2 (en) * 2019-11-26 2023-04-25 Nissan North America, Inc. Risk aware executor with action set recommendations
US11613269B2 (en) 2019-12-23 2023-03-28 Nissan North America, Inc. Learning safety and human-centered constraints in autonomous vehicles
US11714971B2 (en) 2020-01-31 2023-08-01 Nissan North America, Inc. Explainability of autonomous vehicle decision making
US11782438B2 (en) 2020-03-17 2023-10-10 Nissan North America, Inc. Apparatus and method for post-processing a decision-making model of an autonomous vehicle using multivariate data
CN112258654A (zh) * 2020-11-03 2021-01-22 芯勍(上海)智能化科技股份有限公司 模型抽壳方法、终端设备及计算机可读存储介质
CN112348279B (zh) * 2020-11-18 2024-04-05 武汉大学 资讯传播趋势的预测方法、装置、电子设备和存储介质
CN112329923B (zh) * 2020-11-24 2024-05-28 杭州海康威视数字技术股份有限公司 一种模型压缩方法、装置、电子设备及可读存储介质
US20220190990A1 (en) * 2020-12-16 2022-06-16 Qualcomm Incorporated Network-configured training procedure
CN113673532B (zh) * 2021-10-21 2022-04-22 北京科技大学 基于量化模型的目标检测方法及装置
CN114253135B (zh) * 2021-12-13 2024-03-26 深圳智现未来工业软件有限公司 基于机器学习的芯片性能参数测试方法和装置
CN114266324B (zh) * 2021-12-30 2023-04-07 智慧眼科技股份有限公司 模型可视化建模方法、装置、计算机设备及存储介质
CN115829035B (zh) * 2022-12-29 2023-12-08 苏州市欧冶半导体有限公司 一种分布式量化方法、系统及终端设备
CN116772662B (zh) * 2023-07-17 2024-04-19 东方空间技术(山东)有限公司 一种火箭回收子级着陆腿控制方法、计算设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786830A (zh) 2014-12-19 2016-07-20 阿里巴巴集团控股有限公司 计算机系统中模型自适应调整方法、装置及系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4476733B2 (ja) * 2004-07-30 2010-06-09 株式会社東芝 パターン評価方法、プログラムおよびパターン評価装置
US20060239338A1 (en) * 2005-02-15 2006-10-26 James Kolanek Modulation feature measurement and statistical classification system and method
EP2170155A4 (en) * 2007-06-28 2012-01-25 Cardiosoft Llp DIAGNOSTIC AND PREDICTION SYSTEM AND METHODOLOGY USING SUPERSCORE MULTI-PARAMETER ELECTROCARDIOGRAPHY TECHNIQUE
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
CN102324034B (zh) * 2011-05-25 2012-08-15 北京理工大学 基于最小二乘支持向量机在线预测的传感器故障诊断方法
US8819653B2 (en) * 2012-01-30 2014-08-26 Cisco Technology, Inc. Automated improvement of executable applications based on evaluating independent execution heuristics
CN103605909B (zh) * 2013-12-09 2017-04-05 中国科学院重庆绿色智能技术研究院 一种基于灰色理论及支持向量机的水质预测方法
ES2738319T3 (es) * 2014-09-12 2020-01-21 Microsoft Technology Licensing Llc Sistema informático para entrenar redes neuronales
CN104978612A (zh) * 2015-01-27 2015-10-14 厦门大学 基于ahp-rbf的分布式大数据系统风险预测方法
EP3602419B1 (en) * 2017-04-28 2023-09-20 Google LLC Neural network optimizer search
CN107967489A (zh) * 2017-11-29 2018-04-27 中国科学院空间应用工程与技术中心 一种异常检测方法及系统
CN108562835A (zh) * 2018-03-19 2018-09-21 杭州拓深科技有限公司 一种基于bp神经网络的故障电弧检测方法
CN109299253A (zh) * 2018-09-03 2019-02-01 华南理工大学 一种基于深度融合神经网络的中文社交文本情绪识别模型构造方法
CN109582875B (zh) * 2018-12-17 2021-02-02 武汉泰乐奇信息科技有限公司 一种在线医疗教育资源的个性化推荐方法及系统
GB2580171B (en) * 2018-12-21 2021-02-17 Imagination Tech Ltd Methods and systems for selecting quantisation parameters for deep neural networks using back-propagation
CN109670277B (zh) * 2019-02-19 2022-09-09 南京邮电大学 一种基于多模态数据融合与多模型集成的旅行时间预测方法
CN109726524B (zh) * 2019-03-01 2022-11-01 哈尔滨理工大学 一种基于cnn和lstm的滚动轴承剩余使用寿命预测方法
CN110069715B (zh) * 2019-04-29 2022-12-23 腾讯科技(深圳)有限公司 一种信息推荐模型训练的方法、信息推荐的方法及装置
CN110096647B (zh) * 2019-05-10 2023-04-07 腾讯科技(深圳)有限公司 优化量化模型的方法、装置、电子设备及计算机存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786830A (zh) 2014-12-19 2016-07-20 阿里巴巴集团控股有限公司 计算机系统中模型自适应调整方法、装置及系统

Also Published As

Publication number Publication date
EP3968184A4 (en) 2022-06-08
EP3968184A1 (en) 2022-03-16
JP2022531641A (ja) 2022-07-08
CN110096647A (zh) 2019-08-06
CN110096647B (zh) 2023-04-07
US20210374540A1 (en) 2021-12-02
WO2020228655A1 (zh) 2020-11-19

Similar Documents

Publication Publication Date Title
JP7194284B2 (ja) 量子化モデルの最適化方法、装置、情報推薦方法、装置、ニューラルネットワークモデルの最適化方法、装置、電子機器及びコンピュータプログラム
CN110597991B (zh) 文本分类方法、装置、计算机设备及存储介质
US10846522B2 (en) Speaking classification using audio-visual data
US11381651B2 (en) Interpretable user modeling from unstructured user data
CN112863180B (zh) 交通速度预测方法、装置、电子设备及计算机可读介质
EP4383136A2 (en) Population based training of neural networks
CN113569892A (zh) 图像描述信息生成方法、装置、计算机设备及存储介质
CN113039555B (zh) 在视频剪辑中进行动作分类的方法、系统及存储介质
CN110609955A (zh) 一种视频推荐的方法及相关设备
CN111709493A (zh) 对象分类方法、训练方法、装置、设备及存储介质
CN113761153A (zh) 基于图片的问答处理方法、装置、可读介质及电子设备
CN114443899A (zh) 视频分类方法、装置、设备及介质
CN114282013A (zh) 一种数据处理方法、装置及存储介质
CN113362852A (zh) 一种用户属性识别方法和装置
CN114783459A (zh) 一种语音分离方法、装置、电子设备和存储介质
CN116564338B (zh) 语音动画生成方法、装置、电子设备和介质
CN116628345A (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN116977885A (zh) 视频文本任务处理方法、装置、电子设备及可读存储介质
CN115116444A (zh) 一种语音识别文本的处理方法、装置、设备及存储介质
CN114373443A (zh) 语音合成方法和装置、计算设备、存储介质及程序产品
CN115482019A (zh) 一种活动关注度预测方法、装置、电子设备和存储介质
CN116975654B (zh) 对象互动方法、装置、电子设备及存储介质
CN116913278B (zh) 语音处理方法、装置、设备和存储介质
CN111259138A (zh) 一种税务领域短文本的情感分类方法及装置
CN117152467B (zh) 图像识别方法、装置、介质及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221209

R150 Certificate of patent or registration of utility model

Ref document number: 7194284

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150