JP2022137214A - インスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体 - Google Patents

インスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP2022137214A
JP2022137214A JP2022112885A JP2022112885A JP2022137214A JP 2022137214 A JP2022137214 A JP 2022137214A JP 2022112885 A JP2022112885 A JP 2022112885A JP 2022112885 A JP2022112885 A JP 2022112885A JP 2022137214 A JP2022137214 A JP 2022137214A
Authority
JP
Japan
Prior art keywords
search
candidate
objects
search request
instant messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022112885A
Other languages
English (en)
Inventor
チュウトン パン,
Qiutong Pan
ルイガオ リー,
Ruigao Li
ヤナン リー,
Yanan Li
ボーレイ へ,
Bolei He
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022137214A publication Critical patent/JP2022137214A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/42Mailbox-related aspects, e.g. synchronisation of mailboxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】インスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体を提供する。【解決手段】方法は、第1のオブジェクトからの検索要求を受信し、検索要求のタイプを決定するステップ101と、検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて第1のオブジェクトの少なくとも1つのリコール候補セットを取得するステップ102と、検索要求内の検索キーワード及び少なくとも1つのリコール候補セットに基づいて、検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するステップ103と、各候補オブジェクトの特徴情報を取得するステップ104と、特徴情報に基づいて各候補オブジェクトをソートした後に、検索要求に応答するステップ105と、を含む。【選択図】図1

Description

本開示は人工知能の分野に関し、具体的には深層学習の分野、クラウドコンピューティングの分野及びインテリジェント検索の分野に関し、特にインスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体に関する。
知識経済の時代では、現代の企業において最も重要な生産要素は人と情報であり、両者は共に企業のコア競争力を構築している。情報の流れをよりよく推進し、人々の組織を調整するために、現代の企業は企業IM(Instant Messaging、インスタントメッセージング)ソフトウェアを用いてこのようなニーズを満たすことが多い。
本開示は、インスタントメッセージングソフトウェア内の検索のシーンに適用可能なインスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体を提供する。
本開示の第1の態様によれば、第1のオブジェクトからの検索要求を受信し、前記検索要求のタイプを決定するステップと、前記検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて前記第1のオブジェクトの少なくとも1つのリコール候補セットを取得するステップと前記検索要求内の検索キーワード及び前記少なくとも1つのリコール候補セットに基づいて、前記検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するステップと
各前記候補オブジェクトの特徴情報を取得するステップと前記特徴情報に基づいて各前記候補オブジェクトをソートした後に、前記検索要求に応答するステップと、を含む、インスタントメッセージングオブジェクトの検索方法が提供される。
本開示の第2の態様によれば、第1のオブジェクトからの検索要求を受信するように構成される受信モジュールと、前記検索要求のタイプを決定するように構成される第1の決定モジュールと、前記検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて前記第1のオブジェクトの少なくとも1つのリコール候補セットを取得するように構成される第1の取得モジュールと、前記検索要求内の検索キーワード及び前記少なくとも1つのリコール候補セットに基づいて、前記検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するように構成される第2の取得モジュールと、各前記候補オブジェクトの特徴情報を取得するように構成される第3の取得モジュールと、前記特徴情報に基づいて、各前記候補オブジェクトをソートした後に前記検索要求に応答するように構成される応答モジュールと、を備える、インスタントメッセージングオブジェクトの検索装置が提供される。
本開示の第3の態様によれば、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが上記第1の態様に記載のインスタントメッセージングオブジェクトの検索方法を実行できる、電子機器が提供される。
本開示の第4の態様によれば、コンピュータに上記第1の態様に記載のインスタントメッセージングオブジェクトの検索方法を実行させるためのコンピュータ命令を記憶した非一時的コンピュータ読み取り可能な記憶媒体が提供される。
本開示の第5の態様によれば、プロセッサによって実行される場合、上記第1の態様に記載のインスタントメッセージングオブジェクトの検索方法を実現する、コンピュータプログラムが提供される。
本開示の技術案によれば、サーバ側の大きなリコールセットによる一部のリコール不良の問題、及び大きなリコールセットによる性能のさらなる低下の問題を効果的に回避することができ、応答にかかる時間を短縮し、システム性能を向上させることができる。さらに、本開示は、候補オブジェクトの特徴情報に基づいて各候補オブジェクトをソートすることにより、検索結果の精度を向上させ、ユーザが自分の検索ターゲットを迅速に見つけることに役立ち、ユーザの検索及び仕事の効率を向上させることができる。
なお、この概要部分で説明された内容は本開示の実施例の肝心又は重要な特徴を特定するものではなく、本開示の範囲を限定するものでもないことを理解されたい。本開示の他の特徴は以下の詳細説明によりわかりやすくなる。
図面は本解決案をよりよく理解するためのものであり、本開示を限定するものではない。
本開示の実施例に係るインスタントメッセージングオブジェクトの検索方法のフローチャートである。 本開示の実施例に係る別のインスタントメッセージングオブジェクトの検索方法のフローチャートである。 本開示の実施例に係る別のインスタントメッセージングオブジェクトの検索方法のフローチャートである。 本開示の実施例に係る別のインスタントメッセージングオブジェクトの検索方法のフローチャートである。 本開示の実施例に係るインスタントメッセージングオブジェクトの検索装置の構成ブロック図である。 本開示の実施例に係る別のインスタントメッセージングオブジェクトの検索装置の構成ブロック図である。 本開示の実施例に係る別のインスタントメッセージングオブジェクトの検索装置の構成ブロック図である。 本開示の実施例のインスタントメッセージングオブジェクトの検索方法を実現するための電子機器のブロック図である。
以下、本開示の例示的な実施例を図面を参照しながら説明し、理解を助けるために、その中には本開示の実施例の様々な詳細が含まれており、それらを例示的なものとして見なすべきである。したがって、当業者であれば、本開示の範囲と主旨から逸脱しない限り、ここで説明された実施例に対して様々な変更と修正を行うことができる。同様に、明確且つ簡潔にするために、以下の説明では周知の機能及び構成に対する説明を省略する。
なお、本開示の技術案では、関連するユーザ個人情報の取得、記憶及び応用などは、いずれも法律と法規の規定に合致しており、且つ公序良俗に反しない。さらに、本開示に係るユーザ個人情報は、ユーザが事情を知っており且つ同意したうえで取得、記憶及び応用される。
知識経済の時代では、現代の企業において最も重要な生産要素は人と情報であり、両者は共に企業のコア競争力を構築している。情報の流れをよりよく推進し、人々の組織を調整するために、現代の企業は企業IMソフトウェアを用いてこのようなニーズを満たすことが多い。これらのツールにはいずれも検索エンジン能力が統合されており、連絡先、グループ、ドキュメントン、メッセージ履歴などを検索し、ユーザの検索と仕事の効率を大幅に向上させることができる。関連技術では、企業IMの検索解決案は多くの場合、以下のとおりである。サーバによるリモート呼び出しの方式で検索能力を実現し、リコールセットは企業内のすべてのセットを用い、ソートポリシーは関連性のみを参照する。
しかしながら、関連技術の解決案には多くの場合、以下の課題が存在する。サーバ性能が悪く、応答時間は100ms~500msの間にあるなど、長い場合が多く、リコールセットが大きいことによって一部のリコールが悪くなるとともに、大きなリコールセットによって性能がさらに低下し、ソートのポリシーは関連性のみを参照するため、ユーザが自分の検索目標を探すには時間がかかり、ユーザの検索と仕事の効率を低下させる。
そのため、本開示は、インスタントメッセージングオブジェクトの検索方法、インスタントメッセージングオブジェクトの検索装置、電子機器及び記憶媒体を提供する。以下、本開示の実施例のインスタントメッセージングオブジェクトの検索方法、インスタントメッセージングオブジェクトの検索装置、電子機器及び記憶媒体を、図面を参照しながら説明する。
図1は、本開示の実施例に係るインスタントメッセージングオブジェクトの検索方法のフローチャートである。なお、本開示の実施例のインスタントメッセージングオブジェクトの検索方法はインスタントメッセージングオブジェクトの検索装置によって実行することができ、この装置はソフトウェア及び/又はハードウェアの態様で実現することができ、且つサーバ又はユーザ端末などの電子機器に統合することができる。
図1に示すように、当該インスタントメッセージングオブジェクトの検索方法は以下のステップ101~105を含むことができる。
ステップ101において、第1のオブジェクトからの検索要求を受信し、検索要求のタイプを決定する。
本開示の実施例に係る第1のオブジェクトは、インスタントメッセージングソフトウェアを使用するユーザとして理解され得る。
本開示の実施例では、検索要求とは、インスタントメッセージングソフトウェア内でオブジェクトを検索するユーザからの要求を指し、ユーザはテキストコンテンツを検索キーワードとして入力してオブジェクト検索を行うことができる。検索キーワードはオブジェクトの名称であってもよい。なお、オブジェクト検索は、連絡先又はグループに対する検索であってもよく、又は、ドキュメント、メッセージ履歴などのコンテンツに対する検索であってもよく、ここでは特に限定されない。
なお、異なる検索コンテンツが異なるタイプの検索要求に対応することに留意されたい。一例として、検索要求のタイプは第1のタイプ及び第2のタイプに分けることができる。ここで、当該第1のタイプは、クライアント内の検索エンジンで検索要求に応答する必要があるタイプとして理解され得る。第2のタイプは、サーバ側検索エンジンで検索要求に応答する必要があるタイプとして理解され得る。例えば、ユーザが頻繁に使用するまたは頻繁に検索するコンテンツ(例えば連絡先、グループなどを検索するなど)は、検索要求の第1のタイプとして見なすことができ、即ち、クライアント側検索エンジンは、ユーザが頻繁に使用または検索するコンテンツの検索機能を提供することを担うことができる。また、ユーザが頻繁に使用しない又は頻繁に検索しないコンテンツ(例えばサービスアカウント、公式アカウント等を検索する)は、検索要求の第2のタイプとして見なすことができ、即ち、サーバ側検索エンジンは、ユーザが頻繁に使用しない又は頻繁に検索しないコンテンツを検索する機能を提供することを担うことができる。
ステップ102において、検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて第1のオブジェクトの少なくとも1つのリコール候補セットを取得する。
選択可能に、第1のオブジェクトによって開始された検索要求のタイプが第1のタイプであると決定した場合、例えば、第1のオブジェクトによって開始された、連絡先又はグループなどの頻繁に使用又は検索されるコンテンツに対して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて検索機能を提供することができ、この時、クライアント側検索エンジンは、第1のオブジェクトの少なくとも1つのリコール候補セットを取得し、検索要求内の検索キーワードに応じて当該リコール候補セット内で検索することができる。
本開示のいくつかの実施例では、少なくとも1つのリコール候補セットのソースは、第1の時間帯内に第1のオブジェクトがクリックしたオブジェクト、及び/又は、第2の時間帯内に第1のオブジェクトが通信した予め設定された数のオブジェクト、及び/又は、第3の時間帯内の第1のオブジェクトの親密度オブジェクトを含んでもよいが、これらに限定されない。
なお、企業レベルのIMユーザの検索クリックログを収集して分析すると、平均して、ユーザが検索及びクリックしたオブジェクトの87%以上は、過去1年間以内(直前の1分から昨年まで)に通信・連絡したオブジェクトであり、即ちユーザ間に安定的な仕事関係が存在し、ユーザはこれらの安定的な関係から連絡先又はグループを検索する傾向があることが分かる。そのため、クライアント側検索エンジンのリコール候補セットソースは、ユーザが最近クリックしたオブジェクト(例えば時間の上限は1ヶ月以内)、ユーザが最近通信した300個のオブジェクト(例えば時間の上限は1年以内)、サーバが提供した親密度オブジェクト(例えば時間の上限は1年以内)を含んでもよい。以上から分かるように、クライアント側検索エンジンが提供したリコール候補セットは小さいため、応答にかかる時間を短縮させ、システム性能を向上させることができる。
選択可能に、上記親密度オブジェクトはクライアント側検索エンジンによって決定されたものであってもよいし、サーバによって決定されたものであってもよい。一例として、サーバによって第1のオブジェクトの親密度オブジェクトを決定し、且つ一定の時間ごとにクライアントに送信することができる。選択可能に、サーバは、各オブジェクトをノードとし、且つ各オブジェクトの関係データに基づいて関係図モデルを構築し、関係図モデル内の各オブジェクトノードとターゲットオブジェクトノードとの類似度を算出し、ここで、ターゲットオブジェクトノードがオブジェクトノードのワンホップオブジェクトノードであり、類似度が予め設定された閾値よりも大きいターゲットオブジェクトノードをオブジェクトノードの親密度オブジェクトとして決定する。ここで、当該関係データは、通信データ、メールデータ、会議招待データ、報告関係などの情報を含んでもよいが、これらに限定されない。
一例として、オブジェクトが企業IMソフトウェアを利用するユーザである場合を例とし、ユーザの通信データ、メールデータ、会議招待データ、報告関係などの情報に基づいて関係図モデルを構築し、Node2Vec技術により各ユーザを1つのベクトルとしてマッピングし、各ユーザ(ノード)とそのワンホップユーザ(ノード)との類似度を算出し、類似度が一定の閾値よりも大きいユーザ(ノード)を親密なオブジェクトとして決定することができる。ワンホップユーザとは、通信データ、メールデータ、会議招待データ、報告関係などの関係を直接持つユーザを指し、例えば、AがB、Cにメールし、CがDにメールした場合、B、CはAのワンホップユーザであり、DはAの2ホップユーザ(A、Dの2人は知らない可能性がある)である。
ステップ103において、検索要求内の検索キーワード及び少なくとも1つのリコール候補セットに基づいて、検索キーワードに対応する少なくとも1つの候補オブジェクトを取得する。
一実現形態では、検索要求内の検索キーワードを用いてリコール候補セット内で検索して、検索キーワードに対応する少なくとも1つの候補オブジェクトを得る。
ステップ104において、各候補オブジェクトの特徴情報を取得する。
本開示の実施例では、当該特徴情報は、検索キーワードQuery、ヒットドメイン、ヒットドメインスコア、ヒットドメインコンテンツ、ヒットドメインインデックス、最近のインタラクション時間、今日のメッセージ数、今週のメッセージ数、過去10、30、90日間のメッセージ数、過去10、30、90日間の通信日数、親密度スコア、ユーザが最近クリックしたものであるか否か、ユーザ画像、過去50回のユーザ検索クリック行為内の検索キーワードとヒットドメインコンテンツとの交差マッピング、のうちの1つ又は複数を含むが、これらに限定されない。ドメインは被検索オブジェクトのコンテンツブロックを表し、例えば連絡先のドメインは備考、ニックネーム、部門などを含む。
ヒットドメインとは、検索キーワードを利用してリコール候補セット内でオブジェクト検索を行う際にヒットしたオブジェクトのドメインを指す。ヒットドメインスコアとは、検索キーワードを用いてリコール候補セット内でオブジェクト検索を行う際にヒットしたオブジェクトのドメインのスコアを指す。ヒットドメインコンテンツとは、検索キーワードを用いてリコール候補セット内でオブジェクト検索を行う際にヒットしたオブジェクトのドメインの具体的なコンテンツを指す。ヒットドメインインデックスとは、検索キーワードを用いてリコール候補セット内でオブジェクト検索を行う際にヒットしたオブジェクトのドメインのインデックス値を指す。
ステップ105において、特徴情報に基づいて各候補オブジェクトをソートした後に、検索要求に応答する。
選択可能に、各候補オブジェクトの特徴情報に基づいて少なくとも1つの候補オブジェクトをソートし、且つソートの結果に基づいて少なくとも1つの候補オブジェクトを表示することにより、検索要求に応答する。例えば、上位N個の候補オブジェクトを表示することにより、検索要求に応答することができ、Nは1又は3であってもよく、実際の状況に応じてこのNの数値を決定することができ、本開示ではこれが特に限定されない。
なお、本開示のクライアント側検索エンジンはC++を用いて解決案全体を実現することができ、SDK(Software Development Kit、ソフトウェア開発キット)として各クライアント側内に統合して、ユーザのために検索機能を提供する。クライアント側検索エンジンに必要な特徴及びデータは、一定の時間(例えば1時間)ごとに、インターフェースサービスを介してオンラインサーバからクライアント側に送信される。
本開示の実施例のインスタントメッセージングオブジェクトの検索方法により、第1のオブジェクトからの検索要求が第1のタイプであると決定した場合、クライアント側検索エンジンによって提供される検索機能をもとにすることができ、そしてクライアント側検索エンジン自身はリコール候補セットを提供するため、サーバの大きなリコールセットによる一部のリコール不良の問題、及び大きなリコールセットによる性能のさらなる低下の問題を効果的に回避することができ、応答にかかる時間を短縮し、システム性能を向上させることができる。さらに、本開示は、候補オブジェクトの特徴情報に応じて各候補オブジェクトをソートすることにより、検索結果の精度を向上させることができ、ユーザが自分の検索目標を迅速に見つけることに役立ち、ユーザの検索と仕事の効率を向上させることができる。
応答にかかる時間をさらに短縮し、検索結果の精度を向上させるために、本開示のいくつかの実施例では、クライアント側検索エンジンによって提供される少なくとも1つのリコール候補セットをマージし且つ重複排除した後、候補の各ドメインに対して初期のヒット及びフィルタリングを行い、残りの候補セットをソート段階に進ませる。選択可能に、図2に示すように、当該インスタントメッセージングオブジェクトの検索方法は以下のステップ201~207を含んでもよいが、これらに限定されない。
ステップ201において、第1のオブジェクトからの検索要求を受信し、検索要求のタイプを決定する。
本開示の実施例では、ステップ201は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ202において、検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて第1のオブジェクトの少なくとも1つのリコール候補セットを取得する。
本開示の実施例では、ステップ202は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ203において、少なくとも1つのリコール候補セットをマージし、マージされた少なくとも1つのリコール候補セット内の同じオブジェクトに対して重複排除処理を行い、ターゲット候補セットを取得する。
なお、クライアント側検索エンジンによって提供される少なくとも1つのリコール候補セット内には、同じ候補オブジェクトが存在する可能性がある。応答にかかる時間をさらに短縮するために、リコールされた候補セットをマージし、且つマージしたリコール候補セット内の同じオブジェクトに対して重複排除処理を行って、1つの候補セットを取得することができ、当該候補セットはターゲット候補セットと呼ぶことができる。
ステップ204において、検索要求内の検索キーワードに応じて、ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行う。
選択可能に、検索要求内の検索キーワードを用いて、ターゲット候補セット内の各オブジェクトの各ドメインで検索を行う。一例として、検索要求内の検索キーワードに応じて、複数の異なるヒットレベルに基づいてターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行うことができる。ここで、異なるヒットレベルスコアはそれぞれ区別される。
例えば、完全一致検索、ピンイン検索、ファジー検索、頭文字検索などのヒットレベルを使用することができ、検索キーワードに応じてターゲット候補セット内の各オブジェクトの各ドメインに対してヒット及びフィルタリング処理を行う。例えば、
Query=張、ドメイン(Staff_name)=張三、Result=ヒット(完全ヒット)
Query=張、ドメイン(Staff_name)=李四、Result=フィルタリング(ヒットなし)
Query=zhang、ドメイン(Staff_name)=張三、Result=ヒット(ピンインヒット)
Query=張、ドメイン(Staff_name)=劉璋、Result=ヒット(ファジーヒット)
Query=zs、ドメイン(Staff_name)=張三、Result=ヒット(頭文字ヒット)。
ステップ205において、ヒット結果に基づいて、ターゲット候補セットから検索キーワードに対応する少なくとも1つの候補オブジェクトを決定する。
選択可能に、ヒット結果に基づいて、ターゲット候補セット内でヒットした候補オブジェクトを、検索キーワードに対応する候補オブジェクトとして決定する。
ステップ206において、各候補オブジェクトの特徴情報を取得する。
本開示の実施例では、ステップ206は本開示の各実施例内のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ207において、特徴情報に基づいて、各候補オブジェクトをソートした後に検索要求に応答する。
本開示の実施例では、ステップ207は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
本開示の実施例のインスタントメッセージングオブジェクトの検索方法によれば、クライアント側検索エンジンによって提供される少なくとも1つのリコール候補セットをマージし且つ重複排除した後、候補の各ドメインに対して初期のヒット及びフィルタリングを行い、残りの候補セットをソート段階に進ませ、即ち、マージ及び重複排除された候補オブジェクトをソートすることにより、応答にかかる時間をさらに短縮し、検索結果の精度を向上させることができる。
ソート効果をさらに向上させ、検索結果の精度を向上させるために、本開示のいくつかの実施例では、特徴情報に基づいて、各候補オブジェクトのクリック率予測スコアを決定し、各候補オブジェクトのクリック率予測スコアに基づいて、少なくとも1つの候補オブジェクトをソートすることができる。選択可能に、図3に示すように、当該インスタントメッセージングオブジェクトの検索方法は、以下のステップ301~309を含んでもよいが、これらに限定されない。
ステップ301において、第1のオブジェクトからの検索要求を受信し、検索要求のタイプを決定する。
本開示の実施例では、ステップ301は、本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ302において、検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて第1のオブジェクトの少なくとも1つのリコール候補セットを取得する。
本開示の実施例では、ステップ302は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ303において、少なくとも1つのリコール候補セットをマージし、マージされた少なくとも1つのリコール候補セット内の同じオブジェクトに対して重複排除処理を行い、ターゲット候補セットを取得する。
本開示の実施例では、ステップ303は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ304において、検索要求内の検索キーワードに応じて、ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行う。
本開示の実施例では、ステップ304は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ305において、ヒット結果に基づいて、ターゲット候補セットから検索キーワードに対応する少なくとも1つの候補オブジェクトを決定する。
本開示の実施例では、ステップ305は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ306において、各候補オブジェクトの特徴情報を取得する。
本開示の実施例では、ステップ306は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ307において、特徴情報に基づいて、各候補オブジェクトのクリック率予測スコアを決定する。
一実現形態では、予め訓練されたディープニューラルネットワークモデルを用いて各候補オブジェクトの特徴情報を予測することで、各候補オブジェクトのクリック率予測スコアを取得することができる。当該クリック率とは、ユーザがクリックしたオブジェクトのTop1位置にソートされる比率を指す。
選択可能に、当該ディープニューラルネットワークモデルは、ワイド(wide)モデル及びディープ(deep)モデルを統合して共同トレーニングするフレームワークであってもよく、ワイドモデルの記憶能力及びディープモデルの一般化能力を包括的に利用することにより、単一のモデルがシステムの精度とスケーラビリティを両立させることを実現する。当該ディープニューラルネットワークモデルを訓練する時に使用される訓練データは、ユーザの履歴検索クリックデータ(クリックしたのは正の例、クリックしなかったのは負の例)であってもよい。モデルが用いる重要な特徴の一部は以下のとおりである。
Figure 2022137214000002
クライアント側の性能(クライアント側で使用できるコンテンツ及び中央処理装置CPUは限られている)に影響を与えないために、モデル蒸留方法で上記ディープニューラルネットワークモデルを3層のDNN(Deep Neural Networks、ディープニューラルネットワーク)モデルに蒸留し、このようにして、算出パラメータを数千万から数千に減らすことができ、クライアント側のCUP及びメモリの使用率の明らかな増加がなく、各クライアント側の明らかな速度低下や遅延はない。
モデル蒸留は、1つの大きなモデル又は複数のモデル全体が学習した知識を他の軽量の単一モデルに移すため、配置しやすい。簡単に言えば、新しい小さいモデルで大きいモデルの予測結果を学習することである。以上から分かるように、モデルはロバスト性が強く、ユーザの検索習慣を学習することで、パーソナライズされた最適な結果を提供する。また、モデルが学習したのは、ユーザがクリックしたオブジェクトのTop1位置にソートされる比率であるため、ユーザのTop1のクリック率を大きく向上させることができる。
ステップ308において、各候補オブジェクトのクリック率予測スコアに基づいて、少なくとも1つの候補オブジェクトをソートする。
選択可能に、各候補オブジェクトのクリック率予測スコアに基づいて、大きい順に少なくとも1つの候補オブジェクトをソートする。
ステップ309において、ソートの結果に基づいて少なくとも1つの候補オブジェクトを表示することにより、検索要求に応答する。
本開示の実施例では、ステップ309は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
本開示の実施例のインスタントメッセージングオブジェクトの検索方法では、特徴情報に基づいて、各候補オブジェクトのクリック率予測スコアを決定し、各候補オブジェクトのクリック率予測スコアに基づいて少なくとも1つの候補オブジェクトをソートすることにより、ソートの効果をさらに向上させることができ、ソートの結果に基づいて候補オブジェクトをユーザに提供することにより、検索結果の精度をさらに向上させることができる。
異なる検索のシーンに適用するために、本開示のいくつかの実施例では、検索要求が第2のタイプであると決定した場合、サーバ側検索エンジンによって、検索キーワードに応じてインスタントメッセージングオブジェクトを検索することができる。選択可能に、図4に示すように、当該インスタントメッセージングオブジェクトの検索方法は以下のステップ401~410を含んでもよいが、これらに限定されない。
ステップ401において、第1のオブジェクトからの検索要求を受信し、検索要求のタイプを決定する。
本開示の実施例では、ステップ401は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ402において、検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて第1のオブジェクトの少なくとも1つのリコール候補セットを取得する。
本開示の実施例では、ステップ402は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ403において、少なくとも1つのリコール候補セットをマージし、マージされた少なくとも1つのリコール候補セット内の同じオブジェクトに対して重複排除処理を行い、ターゲット候補セットを取得する。
本開示の実施例では、ステップ403は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例はこのステップを限定せず、詳しい説明を省略する。
ステップ404において、検索要求内の検索キーワードに応じて、ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行う。
本開示の実施例では、ステップ404は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ405において、ヒット結果に基づいて、ターゲット候補セットから検索キーワードに対応する少なくとも1つの候補オブジェクトを決定する。
本開示の実施例では、ステップ405は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ406において、各候補オブジェクトの特徴情報を取得する。
本開示の実施例では、ステップ406は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ407において、特徴情報に基づいて、各候補オブジェクトのクリック率予測スコアを決定する。
本開示の実施例では、ステップ407は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ408において、各候補オブジェクトのクリック率予測スコアに基づいて、少なくとも1つの候補オブジェクトをソートする。
本開示の実施例では、ステップ408は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ409において、ソートの結果に基づいて少なくとも1つの候補オブジェクトを表示することにより、検索要求に応答する。
本開示の実施例では、ステップ409は本開示の各実施例のいずれか1つの方式をそれぞれ用いて実現することができ、本開示の実施例ではこれが限定されず、詳しい説明も省略する。
ステップ410において、検索要求のタイプが第2のタイプであることに応答して、インスタントメッセージングシステム内のサーバ側検索エンジンによって、検索キーワードに応じてインスタントメッセージングオブジェクト検索を行う。
選択可能に、検索要求のタイプが第2のタイプである場合、サーバ側検索エンジンによって、検索キーワードに応じてインスタントメッセージングオブジェクト検索を行う。即ち、サーバ側検索エンジンは、ユーザが頻繁に使用しない及び頻繁に検索しないコンテンツを検索する機能を提供することができる。
本開示の実施例に係るインスタントメッセージングオブジェクトの検索方法では、検索要求のタイプが第1のタイプである場合、クライアント側検索エンジンは検索機能を提供し、検索要求のタイプが第2のタイプである場合、サーバ側検索エンジンは検索機能を提供し、これにより、異なる検索のシーンに適用することができる。
上記実施例を実現するために、本開示はインスタントメッセージングオブジェクトの検索装置をさらに提供する。
図5は本開示の実施例に係るインスタントメッセージングオブジェクトの検索装置の構成ブロック図である。図5に示すように、当該インスタントメッセージングオブジェクトの検索装置は、受信モジュール510、第1の決定モジュール520、第1の取得モジュール530、第2の取得モジュール540、第3の取得モジュール550及び応答モジュール560を備えることができる。
受信モジュール510は、第1のオブジェクトからの検索要求を受信するように構成される。
第1の決定モジュール520は、検索要求のタイプを決定するように構成される。
第1の取得モジュール530は、検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて第1のオブジェクトの少なくとも1つのリコール候補セットを取得するように構成され、リコール候補セットのソースは、第1の時間帯内に第1のオブジェクトがクリックしたオブジェクト、及び/又は、第2の時間帯内に第1のオブジェクトが通信した予め設定された数のオブジェクト、及び/又は、第3の時間帯内の第1のオブジェクトの親密度オブジェクトを含む。
第2の取得モジュール540は、検索要求内の検索キーワード及び少なくとも1つのリコール候補セットに基づいて、検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するように構成され、一例として、第2の取得モジュール540は、少なくとも1つのリコール候補セットをマージし、マージされた少なくとも1つのリコール候補セット内の同じオブジェクトに対して重複排除処理を行って、ターゲット候補セットを取得し、検索要求内の検索キーワードに応じて、ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行い、ヒット結果に基づいて、ターゲット候補セットから検索キーワードに対応する少なくとも1つの候補オブジェクトを決定する。
一実現形態では、第2の取得モジュール540は、検索要求内の検索キーワードに応じて、複数のヒットレベルに基づいてターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行う。
第3の取得モジュール550は各候補オブジェクトの特徴情報を取得するように構成される。
応答モジュール560は、特徴情報に基づいて各候補オブジェクトをソートした後に、検索要求に応答するように構成される。一例として、応答モジュール560は、特徴情報に基づいて、各候補オブジェクトのクリック率予測スコアを決定し、各候補オブジェクトのクリック率予測スコアに基づいて、少なくとも1つの候補オブジェクトをソートし、ソートの結果に基づいて少なくとも1つの候補オブジェクトを表示することにより、検索要求に応答する。
いくつかの実施例では、図6に示すように、当該インスタントメッセージングオブジェクトの検索装置は、第2の決定モジュール670をさらに備える。第2の決定モジュール670は、各オブジェクトをノードとし、各オブジェクトの関係データに基づいて関係図モデルを構築し、関係図モデル内の各オブジェクトノードとターゲットオブジェクトノードとの類似度を算出し、ここで、ターゲットオブジェクトノードがオブジェクトノードのワンホップオブジェクトノードであり、類似度が予め設定された閾値よりも大きいターゲットオブジェクトノードをオブジェクトノードの親密度オブジェクトとして決定するするように構成される。図6中の610~660及び図5中の510~560は同じ機能及び構成を有する。
いくつかの実施例では、図7に示すように、当該インスタントメッセージングオブジェクトの検索装置は、検索モジュール780をさらに備えることができる。検索モジュール780は、検索要求のタイプが第2のタイプであることに応答して、インスタントメッセージングシステム内のサーバ側検索エンジンによって、検索キーワードに応じてインスタントメッセージングオブジェクト検索を行うように構成される。図7中の710~770及び図6中の610~670は同じ機能及び構成を有する。
上記実施例内の装置について、各モジュールが操作を実行する具体的な方法は、当該方法に関する実施例で詳しく説明したが、ここで詳しく説明しない。
本開示の実施例のインスタントメッセージングオブジェクトの検索装置によれば、第1のオブジェクトからの検索要求が第1のタイプであると決定した場合、クライアント側検索エンジンに基づいて検索機能を提供することができ、クライアント側検索エンジン自体はリコール候補セットを提供するため、サーバ側の大きなリコールセットによる一部のリコール不良の問題、及び大きなリコールセットによる性能のさらなる低下の問題を効果的に回避することができ、応答にかかる時間を短縮し、システム性能を向上させることができる。さらに、本開示は、候補オブジェクトの特徴情報に応じて各候補オブジェクトをソートすることにより、検索結果の精度を向上させることができ、ユーザが自分の検索目標を迅速に見つけることに役立ち、ユーザの検索と仕事の効率を向上させることができる。
本開示の実施例によれば、本開示は電子機器及び読み取り可能な記憶媒体をさらに提供する。
図8に示すように、本開示の実施例に係るインスタントメッセージングオブジェクトの検索方法を実現するための電子機器のブロック図である。電子機器はラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の類似するコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
図8に示すように、当該電子機器は、1つ又は複数のプロセッサ801と、メモリ802と、高速インターフェース及び低速インターフェースを備える各コンポーネントを接続するためのインターフェースと、を備える。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられてもよいし、又は必要に応じて他の方式で取り付けられてもよい。プロセッサは、外部入力/出力装置(インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施形態では、必要であれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、必要な操作(例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする)の一部を提供する。図8では、1つのプロセッサ801を例とする。
メモリ802は、本開示により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記少なくとも1つのプロセッサが本開示に係るインスタントメッセージングオブジェクトの検索方法を実行するようにする。本開示の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータに本開示に係るインスタントメッセージングオブジェクトの検索方法を実行させるためのコンピュータ命令を記憶している。
メモリ802は、非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するために使用することができ、例えば本開示の実施例内のインスタントメッセージングオブジェクトの検索方法に対応するプログラム命令/モジュール。プロセッサ801は、メモリ802に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記方法の実施例のインスタントメッセージングオブジェクトの検索方法を実現する。
メモリ802は、プログラム記憶領域及びデータ記憶領域を含むことができる。プログラム記憶領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができる。データ記憶領域は、インスタントメッセージングオブジェクト検索の電子機器の使用による作成されたデータなどを記憶することができる。また、メモリ802は、高速ランダムアクセスメモリを備えることができ、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリをさらに備えることができる。いくつかの実施例では、メモリ802は、プロセッサ801に対して遠隔に設定されたメモリを選択的に備えることができ、これらの遠隔メモリは、ネットワークを介して、インスタントメッセージングオブジェクトの検索方法を実現するための電子機器に接続することができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
メッセージングオブジェクトの検索方法を実現するための電子機器は、入力装置803と出力装置804とをさらに備えることができる。プロセッサ801、メモリ802、入力装置803、及び出力装置804は、バスまたは他の方式で接続することができ、図8では、バスを介して接続することを例に挙げる。
入力装置803は、入力された数字又は文字情報を受信することができ、及びインスタントメッセージングオブジェクトの検索方法を実現するための電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、指示棒、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置804は、ディスプレイデバイス、補助照明デバイス(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを備えることができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを備えることができるが、これらに限定されない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。
本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを備えるプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令、高度のプロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することを含む。本明細書で使用されるように、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するために使用される任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力、または、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを備えるコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを備えるコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションできる)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントのいずれかの組み合わせを備えるコンピューティングシステムで実行することができる。いずれかの形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、ブロックチェーンネットワークを含む。
コンピュータシステムは、クライアントとサーバを備えることができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよい、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステム内の1つのホスト製品であり、従来の物理ホストとVPSサービス(「Virtual Private Server」、または「VPS」と略す)に存在する管理の難しさ、業務拡張性の弱い欠陥を解決した。サーバは分散システムのサーバであってもよいし、ブロックチェーンを組み込んだサーバであってもよい。
なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案の所望の結果を実現することができれば、本明細書では限定されない。
上記具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができることを理解されたい。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims (17)

  1. 第1のオブジェクトからの検索要求を受信し、前記検索要求のタイプを決定するステップと、
    前記検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて前記第1のオブジェクトの少なくとも1つのリコール候補セットを取得するステップと、
    前記検索要求内の検索キーワード及び前記少なくとも1つのリコール候補セットに基づいて、前記検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するステップと、
    各前記候補オブジェクトの特徴情報を取得するステップと、
    前記特徴情報に基づいて各前記候補オブジェクトをソートした後に、前記検索要求に応答するステップと、
    を含む、インスタントメッセージングオブジェクトの検索方法。
  2. 前記検索要求内の検索キーワード及び前記少なくとも1つのリコール候補セットに基づいて、前記検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するステップが、
    前記少なくとも1つのリコール候補セットをマージし、マージされた前記少なくとも1つのリコール候補セット内の同じオブジェクトに対して重複排除処理を行い、ターゲット候補セットを取得するステップと、
    前記検索要求内の検索キーワードに応じて、前記ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行うステップと、
    ヒット結果に基づいて、前記ターゲット候補セットから前記検索キーワードに対応する少なくとも1つの候補オブジェクトを決定するステップと、
    を含む、請求項1に記載のメッセージングオブジェクトの検索方法。
  3. 前記検索要求内の検索キーワードに応じて、前記ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行うステップが、
    前記検索要求内の検索キーワードに応じて、複数のヒットレベルに基づいて前記ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行うステップを含む、請求項2に記載のメッセージングオブジェクトの検索方法。
  4. 前記特徴情報に基づいて各前記候補オブジェクトをソートした後に、前記検索要求に応答するステップが、
    前記特徴情報に基づいて、各前記候補オブジェクトのクリック率予測スコアを決定するステップと、
    各前記候補オブジェクトのクリック率予測スコアに基づいて、前記少なくとも1つの候補オブジェクトをソートするステップと、
    ソートの結果に基づいて前記少なくとも1つの候補オブジェクトを表示することにより、前記検索要求に応答するステップと、
    を含む、請求項1に記載のメッセージングオブジェクトの検索方法。
  5. 前記リコール候補セットのソースは、第1の時間帯内に第1のオブジェクトがクリックしたオブジェクト、第2の時間帯内に第1のオブジェクトが通信した予め設定された数のオブジェクト、及び第3の時間帯内の第1のオブジェクトの親密度オブジェクトの少なくとも1つを含む、請求項1に記載のメッセージングオブジェクトの検索方法。
  6. 前記親密度オブジェクトが、
    各オブジェクトをノードとし、前記各オブジェクトの関係データに基づいて関係図モデルを構築するステップと、
    前記関係図モデル内の各オブジェクトノードとターゲットオブジェクトノードとの類似度を算出し、前記ターゲットオブジェクトノードが前記オブジェクトノードのワンホップオブジェクトノードであるステップと、
    類似度が予め設定された閾値よりも大きいターゲットオブジェクトノードを前記オブジェクトノードの親密度オブジェクトとして決定するステップと、
    によって決定される、請求項5に記載のメッセージングオブジェクトの検索方法。
  7. 前記検索要求のタイプが第2のタイプであることに応答して、前記インスタントメッセージングシステム内のサーバ側検索エンジンによって、前記検索キーワードに応じてインスタントメッセージングオブジェクト検索を行うステップと、を含む、請求項1に記載のメッセージングオブジェクトの検索方法。
  8. 第1のオブジェクトからの検索要求を受信するように構成される受信モジュールと、
    前記検索要求のタイプを決定するように構成される第1の決定モジュールと、
    前記検索要求のタイプが第1のタイプであることに応答して、インスタントメッセージングシステム内のクライアント側検索エンジンに基づいて前記第1のオブジェクトの少なくとも1つのリコール候補セットを取得するように構成される第1の取得モジュールと、
    前記検索要求内の検索キーワード及び前記少なくとも1つのリコール候補セットに基づいて、前記検索キーワードに対応する少なくとも1つの候補オブジェクトを取得するように構成される第2の取得モジュールと、
    各前記候補オブジェクトの特徴情報を取得するように構成される第3の取得モジュールと、
    前記特徴情報に基づいて各前記候補オブジェクトをソートした後に、前記検索要求に応答するように構成される応答モジュールと、
    を備える、インスタントメッセージングオブジェクトの検索装置。
  9. 前記第2の取得モジュールが、
    前記少なくとも1つのリコール候補セットをマージし、マージされた前記少なくとも1つのリコール候補セット内の同じオブジェクトに対して重複排除処理を行い、ターゲット候補セットを取得し、
    前記検索要求内の検索キーワードに応じて、前記ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行い、
    ヒット結果に基づいて、前記ターゲット候補セットから前記検索キーワードに対応する少なくとも1つの候補オブジェクトを決定するように構成される、請求項8に記載のメッセージングオブジェクトの検索装置。
  10. 前記第2の取得モジュールが、
    前記検索要求内の検索キーワードに応じて、複数のヒットレベルに基づいて前記ターゲット候補セット内の各オブジェクトの各ドメインに対してヒット処理を行うように構成される、請求項9に記載のメッセージングオブジェクトの検索装置。
  11. 前記応答モジュールが、
    前記特徴情報に基づいて、各前記候補オブジェクトのクリック率予測スコアを決定し、
    各前記候補オブジェクトのクリック率予測スコアに基づいて、前記少なくとも1つの候補オブジェクトをソートし、
    ソートの結果に基づいて前記少なくとも1つの候補オブジェクトを表示することにより、前記検索要求に応答するように構成される、請求項8に記載のメッセージングオブジェクトの検索装置。
  12. 前記リコール候補セットのソースは、第1の時間帯内に第1のオブジェクトがクリックしたオブジェクト、第2の時間帯内に第1のオブジェクトが通信した予め設定された数のオブジェクト、及び第3の時間帯内の第1のオブジェクトの親密度オブジェクトの少なくとも1つを含む、請求項8に記載のメッセージングオブジェクトの検索装置。
  13. 各オブジェクトをノードとし、前記各オブジェクトの関係データに基づいて関係図モデルを構築し、前記関係図モデル内の各オブジェクトノードとターゲットオブジェクトノードとの類似度を算出し、前記ターゲットオブジェクトノードが前記オブジェクトノードのワンホップオブジェクトノードであり、類似度が予め設定された閾値より大きいターゲットオブジェクトノードを前記オブジェクトノードの親密度オブジェクトとして決定するように構成される第2の決定モジュールを備える、請求項12に記載のメッセージングオブジェクトの検索装置。
  14. 前記検索要求のタイプが第2のタイプであることに応答して、前記インスタントメッセージングシステム内のサーバ側検索エンジンによって、前記検索キーワードに応じてインスタントメッセージングオブジェクト検索を行うように構成される検索モジュールを備える、請求項8から13のいずれか一項に記載のメッセージングオブジェクトの検索装置。
  15. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、
    を備え、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が、前記少なくとも1つのプロセッサが前記少なくとも1つのプロセッサによって実行される場合、請求項1から7のいずれか一項に記載のメッセージングオブジェクトの検索方法を実行できる電子機器。
  16. コンピュータに請求項1から7のいずれか一項に記載のインスタントメッセージングオブジェクトの検索方法を実行させるためのコンピュータ命令を記憶した非一時的コンピュータ読み取り可能な記憶媒体。
  17. プロセッサによって実行される場合、請求項1から7のいずれか一項に記載のメッセージングオブジェクトの検索方法を実現するコンピュータプログラム。
JP2022112885A 2021-07-15 2022-07-14 インスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体 Pending JP2022137214A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110801928.X 2021-07-15
CN202110801928.XA CN113626462B (zh) 2021-07-15 2021-07-15 即时通讯对象的搜索方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
JP2022137214A true JP2022137214A (ja) 2022-09-21

Family

ID=78379928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022112885A Pending JP2022137214A (ja) 2021-07-15 2022-07-14 インスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20220365941A1 (ja)
EP (1) EP4053715A3 (ja)
JP (1) JP2022137214A (ja)
KR (1) KR20220106719A (ja)
CN (1) CN113626462B (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007534057A (ja) * 2004-03-31 2007-11-22 グーグル インク. 情報を取り込み抽出する方法及びシステム
JP2013518323A (ja) * 2010-01-21 2013-05-20 マグネット システムズ, インコーポレイテッド 企業ビジネスアプリケーションのためのソーシャルおよびコンテキスト検索
US8631076B1 (en) * 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
JP2019506664A (ja) * 2015-12-30 2019-03-07 フェイスブック,インク. ディープラーニングモデルを用いたエンティティの識別

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10171386B1 (en) * 2004-10-06 2019-01-01 Oracle International Corporation Methods and systems for storing instant messaging messages
JP4951331B2 (ja) * 2006-12-26 2012-06-13 株式会社日立製作所 ストレージシステム
CN102043834B (zh) * 2010-11-25 2013-07-31 北京搜狗科技发展有限公司 一种客户端实现搜索的方法及搜索客户端
CN102043833B (zh) * 2010-11-25 2013-12-25 北京搜狗科技发展有限公司 一种基于查询词进行搜索的方法和搜索装置
CN103457837B (zh) * 2013-08-18 2018-08-14 苏州量跃信息科技有限公司 通过搜索引擎进行即时通信搜索的方法及系统
US20160188734A1 (en) * 2014-12-30 2016-06-30 Socialtopias, Llc Method and apparatus for programmatically synthesizing multiple sources of data for providing a recommendation
US10735532B2 (en) * 2015-10-20 2020-08-04 Axon Vibe AG System and method for detecting interaction and influence in networks
CN107330019A (zh) * 2017-06-19 2017-11-07 北京小米移动软件有限公司 搜索方法及装置
CN109033386B (zh) * 2018-07-27 2020-04-10 北京字节跳动网络技术有限公司 搜索排序方法、装置、计算机设备和存储介质
CN112084774B (zh) * 2020-09-08 2021-07-20 百度在线网络技术(北京)有限公司 数据搜索方法、装置、系统、设备和计算机可读存储介质
CN112749258A (zh) * 2021-01-21 2021-05-04 京东数字科技控股股份有限公司 数据搜索的方法和装置、电子设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007534057A (ja) * 2004-03-31 2007-11-22 グーグル インク. 情報を取り込み抽出する方法及びシステム
US8631076B1 (en) * 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
JP2013518323A (ja) * 2010-01-21 2013-05-20 マグネット システムズ, インコーポレイテッド 企業ビジネスアプリケーションのためのソーシャルおよびコンテキスト検索
JP2019506664A (ja) * 2015-12-30 2019-03-07 フェイスブック,インク. ディープラーニングモデルを用いたエンティティの識別

Also Published As

Publication number Publication date
EP4053715A2 (en) 2022-09-07
US20220365941A1 (en) 2022-11-17
KR20220106719A (ko) 2022-07-29
CN113626462B (zh) 2022-11-15
CN113626462A (zh) 2021-11-09
EP4053715A3 (en) 2022-12-07

Similar Documents

Publication Publication Date Title
CN112650907B (zh) 搜索词的推荐方法、目标模型的训练方法、装置及设备
CN112087371B (zh) 一种即时通讯群组的搜索方法、装置、设备和存储介质
US20210295098A1 (en) Event argument extraction method, event argument extraction apparatus and electronic device
JP7269913B2 (ja) ナレッジグラフ構築方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US20210200813A1 (en) Human-machine interaction method, electronic device, and storage medium
US11343572B2 (en) Method, apparatus for content recommendation, electronic device and storage medium
WO2022121227A1 (zh) 数据存储方法、装置、查询方法、电子设备及可读介质
JP7300475B2 (ja) エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111767381A (zh) 自动问答方法和装置
CN111563198B (zh) 一种物料召回方法、装置、设备及存储介质
CN111984775A (zh) 问答质量确定方法、装置、设备和存储介质
JP7241122B2 (ja) スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
CN112579897B (zh) 信息搜索方法和装置
JP2022137214A (ja) インスタントメッセージングオブジェクトの検索方法、その検索装置、電子機器及び記憶媒体
US11671370B2 (en) Method and apparatus for adjusting network flow
CN113590914B (zh) 信息处理方法、装置、电子设备和存储介质
CN113902005A (zh) 语言模型的预训练方法、装置、设备和存储介质
CN113220982A (zh) 广告搜索方法、装置、电子设备和介质
CN111782794A (zh) 问答响应方法和装置
CN112801682B (zh) 数据修正方法、装置、设备和存储介质
CN113282690B (zh) 兴趣点召回的排序方法、装置、设备和存储介质
CN112100237B (zh) 一种用户数据处理方法、装置、设备以及存储介质
CN115809364B (zh) 对象推荐方法和模型训练方法
CN112989178B (zh) 搜索方法、装置、设备和存储介质
CN111506737B (zh) 图数据处理方法、检索方法、装置及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240207