JP7277502B2 - タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム - Google Patents

タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Download PDF

Info

Publication number
JP7277502B2
JP7277502B2 JP2021060937A JP2021060937A JP7277502B2 JP 7277502 B2 JP7277502 B2 JP 7277502B2 JP 2021060937 A JP2021060937 A JP 2021060937A JP 2021060937 A JP2021060937 A JP 2021060937A JP 7277502 B2 JP7277502 B2 JP 7277502B2
Authority
JP
Japan
Prior art keywords
tags
tag
text
existing
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021060937A
Other languages
English (en)
Other versions
JP2022003514A (ja
Inventor
チェン レイ
ジュアン シュン
シャンシャン チャン
ホウチン ヤオ
ポン シュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022003514A publication Critical patent/JP2022003514A/ja
Application granted granted Critical
Publication of JP7277502B2 publication Critical patent/JP7277502B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本出願は、人工知能分野におけるビッグデータ技術、特に自然言語処理、スマート検索、及びスマート推奨の技術に関する。具体的には、タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムに関する。
タグはコンテンツを理解するための一般的なキャリアである。通常、インターネットにおける1つのコンテンツは、より良好な表示及び配信の効果を得るために、複数のタグとして抽象し、検索エンジンや推薦エンジンに供給される。
テキストコンテンツのタグを正確に説明することにより、テキストが検索エンジン又は推薦エンジンに供給された後、ユーザに正確に配信・表示され、それによって、ユーザが情報を取得するときの効率及びユーザエクスペリエンスを向上させる。
本開示は、タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムを提供する。
本開示の一態様によれば、
既存タグ及び前記既存タグが属するカテゴリーを決定するステップと、
前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定するステップと、
前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定するステップと、を含む、タグマイニング方法を提供する。
本開示の別の態様によれば、
既存タグ及び前記既存タグが属するカテゴリーを決定するためのカテゴリー決定モジュールと、
前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定するためのタグ決定モジュールと、
前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定するためのタグ組み合わせモジュールとを含む、タグマイニング装置を提供する。
本開示のさらなる態様によれば、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリとを含み、
前記メモリは、前記少なくとも1つのプロセッサにより実行可能な命令を記憶しており、前記命令は、前記少なくとも1つのプロセッサにより実行されて、本出願の実施例のいずれか1項に記載の方法を前記少なくとも1つのプロセッサに実行させる、電子デバイスを提供する。
本開示のさらなる態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令は、本出願の実施例のいずれか1項に記載の方法を前記コンピュータに実行させる記憶媒体を提供する。
本開示のさらなる態様によれば、コンピュータプログラムであって、前記コンピュータプログラムは、プロセッサにより実行されると、本出願の実施例のいずれか1項に記載の方法を実行させるコンピュータプログラムを提供する。
本出願の技術によれば、既存タグによる正確なタグのマイニングを実現する。
なお、本部分で記載されるコンテンツは、本開示の実施例のキーとなる又は重要な特徴を表すことを意図しておらず、また本開示の範囲を制限するものでもない。本開示の他の特徴は、以下の明細書により理解されやすくなる。
図面は、本解決手段をより理解しやすくするために過ぎず、本出願の限定を構成していない。
本出願の実施例によるタグマイニング方法のフローチャートである。 本出願の実施例による別のタグマイニング方法のフローチャートである。 本出願の実施例によるさらなるタグマイニング方法のフローチャートである。 本出願の実施例によるさらなるタグマイニング方法のフローチャートである。 本出願の実施例によるさらなるタグマイニング方法のフローチャートである。 本出願の実施例によるさらなるタグマイニング方法のフローチャートである。 本出願の実施例によるさらなるタグマイニング方法の模式的フローチャートである。 本出願の実施例によるタグマイニング装置の構造模式図である。 本出願の実施例のグマイニング方法の電子デバイスのブロック図である。
以下、図面を参照して本出願の例示的な実施例を説明し、理解しやすくするためにこの説明には本出願の実施例のさまざまな詳細が含まれており、このような詳細は例示的なものとして理解すべきである。したがって、当業者が理解できるように、本出願の範囲及び主旨を逸脱することなく、ここで記載された実施例についてさまざまな変化及び修正を行うことができる。同様に、明瞭さ及び簡素化から、以下の記載には、公知の機能及び構造の記載が省略される。
図1は、本出願の実施例によるタグマイニング方法のフローチャートである。本実施例は、テキストコンテンツを正確に説明する正確なタグをマイニングする場合に適用できる。この方法はタグマイニング装置によって実行され得る。この装置はソフトウェア及び/又はハードウェアの形態で実現され得る。図1に示すように、本出願の実施例によるタグマイニング方法は、S110~S130を含む。
S110、既存タグ及び前記既存タグが属するカテゴリーを決定する。
既存タグとは、従来技術により抽出されたタグを指す。
既存タグが属するカテゴリーとは、既存タグのカテゴリーを指す。
一実施例では、既存タグを決定するステップは、従来のタグの抽出アルゴリズムによって、テキストから既存タグを抽出することを含む。
S120、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する。
ターゲットテキストとは、既存タグが属するカテゴリーのテキストを指す。
一例として、既存タグが属するカテゴリーが美食である場合、ターゲットテキストは美食に関するテキストである。
候補タグ是とは、既存タグと生成すべき新しいタグを指す。
一実施例では、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定するステップは、
既存タグと共起するターゲットテキスト内の他のタグを候補タグとするステップを含む。
S130、前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定する。
新しいタグとは、既存タグに基づいてマイニングされた新しいタグである。
一実施例では、組み合わせ結果に基づいて新しいタグを決定するステップは、
組み合わせて得たタグ群を新しいタグとするステップを含む。
本出願の実施例では、既存タグに基づいて、既存タグが属するカテゴリーに関連つけられたターゲットテキストから候補タグを決定し、既存タグと候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定することによって、既存タグによる新しいタグのマイニングを実現する。
さらに、既存タグが属するカテゴリーに関連つけられたターゲットテキストから候補タグを決定することによって、組み合わせタグの計算範囲を限定し、組み合わせ潜在力を備えないことが明らかであるタグを除去する。ここで、組み合わせ潜在力を備えないタグとは、分割された後の意味が分割されていないものの意味と同じタグを指す。たとえば、このようなタグは、「夏野菜」、「夏の旅行」であってもよい。組み合わせ潜在力を備えたタグの組み合わせによりテキストコンテンツを正確に説明できるため、本解決手段では、正確なタグがマイニングされ、検索エンジン又は推薦エンジンに供給された後、テキストがユーザに正確に配信・表示され、それによって、ユーザが情報を取得するときの効率及びユーザエクスペリエンスを向上させる。
従来のタグが固定しており、ユーザのニーズをタイムリーに反映できないという問題を解決するために、前記既存タグを決定するステップは、
人気が所定の人気しきい値よりも大きいタグを決定し、このタグを前記既存タグとするステップを含む。
ここで、所定の人気しきい値とは、実際のニーズに応じて決定することができる。本実施例では、これについて特に限制がない。
人気が所定の人気しきい値よりも大きいタグは、時効性が高いタグ、つまり、現在の人気タグである。たとえば、「恰飯」、「後浪」などである。
このようなタグを既存タグに追加することにより、既存タグの時効性を向上させ、従来のタグが固定しており、ユーザのニーズをタイムリーに反映できないという問題を解決する。
図2は、本出願の実施例による別のタグマイニング方法のフローチャートである。本解決手段は、上記の解決手段を基に、ステップ「前記既存タグが属するカテゴリーを決定する」を具体的に最適化するものである。図2に示すように、本解決手段によるタグマイニング方法は、S210~S240を含む。
S210、既存タグを決定し、前記既存タグを含むテキストのカテゴリーを統計する。
テキストのカテゴリーとは、テキストが属するカテゴリーである。一例として、テキストのカテゴリーは、美食やエンターテインメント等であってもよい。
S220、統計結果に基づいて、前記既存タグを含むテキストのカテゴリーから、前記既存タグが属するカテゴリーを決定する。
既存タグが属するカテゴリーとは、既存タグが属するカテゴリー、つまり、既存タグのカテゴリーを指す。
一実施例では、統計結果に基づいて、前記既存タグを含むテキストのカテゴリーから、前記既存タグが属するカテゴリーを決定するステップは、
統計した結果、最も多いカテゴリーを既存タグが属するカテゴリーとするステップを含む。
たとえば、統計の結果、美食類のテキストが80個であり、エンターテインメント類のテキストが20個である場合、既存タグが属するカテゴリーを美食として決定する。
S230、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する。
一例として、また既存タグが属するカテゴリーが美食である場合を例に、既存タグに基づいて、既存タグが属するカテゴリーに関連つけられたターゲットテキストから候補タグを決定するステップは、既存タグに基づいて、美食類のテキストから候補タグを決定するステップを含む。
S240、前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定する。
本解決手段では、既存タグを含むテキストのカテゴリーを統計し、統計結果に基づいて、既存タグを含むテキストのカテゴリーから既存タグが属するカテゴリーを決定することによって、既存タグの決定正確率を向上させ、組み合わせタグの計算範囲をさらに限定し、それにより、組み合わせ潜在力を備えていないことが明らかであるタグをフィルタリングにより除去する。
図3は、本出願の実施例によるさらなるタグマイニング方法のフローチャートである。本解決手段は、上記の解決手段を基に、ステップ「前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する」を具体的に最適化させたものである。図3に示すように、本解決手段によるタグマイニング方法は、S310~S340を含む。
S310、既存タグ及び前記既存タグが属するカテゴリーを決定する。
S320、前記既存タグと前記カテゴリーに関連つけられたターゲットテキスト中のほかのタグとの共起頻度を統計する。
他のタグとは、ターゲットテキスト内の、上記の既存タグ以外のタグを指す。
共起頻度とは、ターゲットテキストに同時に現れる回数を指す。
S330、統計結果に基づいて、前記ターゲットテキストのほかのタグから前記候補タグを決定する。
一実施例では、統計結果に基づいて、前記ターゲットテキストのほかのタグから前記候補タグを決定するステップは、
共起頻度の最も高い他のタグを候補タグとするステップを含む。
S340、前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定する。
本解決手段では、既存タグ与ターゲットテキスト中のほかのタグの共起頻度を統計し、統計結果に基づいて、ターゲットテキストの他のタグから候補タグを決定することによって、候補タグの決定正確率を向上させる。通常、組み合わせ潜在力を備えたタグの、テキスト内の共起頻度が最も高いため、本解決手段により組み合わせタグの計算範囲をさらに限定し、組み合わせ潜在力を備えないことが明らかであるタグをさらにフィルタリングにより除去する。
図4は、本出願の実施例によるさらなるタグマイニング方法のフローチャートである。本解決手段は、上記の解決手段を基に、上記の解決手段をさらに拡張させたものである。図4に示すように、本解決手段によるタグマイニング方法は、S410~S450を含む。
S410、既存タグ及び前記既存タグが属するカテゴリーを決定する。
S420、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する。
S430、前記既存タグと前記候補タグを組み合わせる。
S440、前記既存タグと前記候補タグとの前記ターゲットテキスト内の間隔及び/又は共起頻度に基づいて、組み合わせ結果をフィルタリングする。
既存タグと候補タグとのターゲットテキスト内の間隔は、2つのタグのターゲットテキスト内の距離として理解してもよい。距離が大きい場合、新しいタグが形成される確率が低い。したがって、この部分の組み合わせ結果をフィルタリングにより除去する。
既存タグと候補タグとのターゲットテキスト内の共起頻度は、2つのタグが同時に現れる頻度として理解してもよい。この頻度が過不足する場合にも、好ましいタグ組み合わせではなく、したがって、同様にこの部分の組み合わせ結果をフィルタリングにより除去する。
S450、フィルタリングした組み合わせ結果に基づいて、新しいタグを決定する。
本解決手段では、既存タグと候補タグとのターゲットテキスト内の間隔及び/又は共起頻度に基づいて、組み合わせ結果をフィルタリングすることによって、組み合わせ結果の正確率を向上させ、さらに新しいタグの正確率を向上させる。
図5は、本出願の実施例によるさらなるタグマイニング方法のフローチャートである。本解決手段は、上記の解決手段を基に、上記のステップ「組み合わせ結果に基づいて新しいタグを決定する」を具体的に最適化させたものである。図5に示すように、本解決手段によるタグマイニング方法は、S510~S550を含む。
S510、既存タグ及び前記既存タグが属するカテゴリーを決定する。
S520、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する。
S530、前記既存タグと前記候補タグを組み合わせる。
S540、前記既存タグと前記候補タグを組み合わせて得る候補タグ群を含む少なくとも1つのテキストフラグメントを前記ターゲットテキストから抽出する。
代表例として、このテキストフラグメントは1つの文であってもよい。
S550、前記少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定する。
一実施例では、上記の少なくとも1つのテキストフラグメントのうちいずれかのテキストフラグメントを新しいタグとすることができる。
新しいタグを簡素化させるために、前記少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定する前記ステップは、
前記テキストフラグメントの本体情報を抽出して、少なくとも1つのテキスト本体を得るステップと、
前記少なくとも1つのテキスト本体から新しいタグを決定するステップとを含む。
テキストフラグメントの本体情報とは、分の基本構造を左右する成分情報を指す。
一実施例では、テキストフラグメントの本体情報を抽出するステップは、
テキストフラグメント中の修飾語及び接頭辞と接尾辞を削除することを含む。
テキスト本体とは、抽出したテキストフラグメントの本体情報を指す。
本解決手段では、候補タグ群を含む少なくとも1つのテキストフラグメントをターゲットテキストから抽出し、少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定することによって、新しいタグの表現を最適化させ、ユーザにより理解されやすくする。
新しいタグの正確率を向上させるために、前記少なくとも1つのテキスト本体から新しいタグを決定する前記ステップは、
前記少なくとも1つのテキスト本体を統計し、統計結果に基づいて前記少なくとも1つのテキスト本体からターゲットテキスト本体を決定し、このターゲットテキスト本体を新しいタグとするステップを含む。
ターゲットテキスト本体とは、新しいタグを正確に記述し得るテキスト本体を指す。
一実施例では、統計結果に基づいて、少なくとも1つのテキスト本体からターゲットテキスト本体を決定するステップは、
統計の結果、現れる頻度が最も多いテキスト本体をターゲットテキスト本体とするステップを含む。
図6は、本出願の実施例によるさらなるタグマイニング方法のフローチャートである。本解決手段は、上記の解決手段を基に、上記の解決手段を拡張させたものである。図6に示すように、本解決手段によるタグマイニング方法は、S610~S650を含む。
S610、既存タグ及び前記既存タグが属するカテゴリーを決定する。
S620、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する。
S630、前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定する。
S640、前記既存タグと前記候補タグを含む標識対象テキストを決定する。
S650、決定した新しいタグを前記標識対象テキスト内に標識する。
本解決手段では、既存タグと候補タグを含む標識対象テキストを決定し、決定した新しいタグを標識対象テキストに標識することによって、新しいタグを用いて標識対象テキストに対するタグ標識を実現する。
図7は、本出願の実施例によるさらなるタグマイニング方法の模式的フローチャートである。本解決手段は、上記の解決手段を基に提供する、任意の解決手段である。図7に示すように、本解決手段によるタグマイニング方法は、
収集したテキスト集合に人気タグを追加するステップと、
テキスト集合から各テキストのタグを抽出し、タグセットを得るステップと、
得たタグセットから重複を排除し、残りのタグを既存タグとするステップと、
既存タグに関連つけられたテキストのカテゴリーに基づいて、既存タグが属するカテゴリーを決定するステップと、
共起頻度に基づいて、対応するカテゴリーのターゲットテキスト内の他のタグから候補タグを決定するステップと、
既存タグと候補タグを組み合わせて、候補タグ群を得るステップと、
候補タグ群中の2つのタグのターゲットテキスト内の間隔及び共起頻度に基づいて、候補タグ群をフィルタリングして、ターゲットタグ群を得るステップと、
ターゲットタグ群中の各タグが共起している少なくとも1つの文をターゲットテキストから抽出するステップと、
この文の修飾語、接頭辞と接尾辞を削除して、候補文を得るステップと、
候補文を統計し、統計結果に基づいて、候補文からターゲット文を決定するステップと、
ターゲット文を新しいタグとして、新しいタグを、ターゲットタグ群を含むテキストに標識するステップとを含む。
本解決手段では、テキストに人気の高いタグを追加することによって、タグ集合が固定されており、ユーザのニーズをタイムリーに反映できないという問題を解決する。
タグを組み合わせて、組み合わせて得たタグ群に応じて文を抽出し、抽出した文に基づいて決定した新しいタグに基づいて、タグ粒度を細分化することによって、従来のタグが意味を要約できないという問題を解決する。
図8は、本出願の実施例によるタグマイニング装置の構造模式図である。図8に示すように、本出願の実施例によるタグマイニング装置800は、カテゴリー決定モジュール801、タグ決定モジュール802、及びタグ組み合わせモジュール803を含む。
カテゴリー決定モジュール801は、既存タグ及び前記既存タグが属するカテゴリーを決定することに用いられ、
タグ決定モジュール802は、前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定することに用いられ、
タグ組み合わせモジュール803は、前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定することに用いられる。
本出願の実施例では、既存タグに基づいて、既存タグが属するカテゴリーに関連つけられたターゲットテキストから候補タグを決定し、既存タグと候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定することによって、既存タグによる新しいタグのマイニングを実現する。
さらに、既存タグが属するカテゴリーに関連つけられたターゲットテキストから候補タグを決定することによって、組み合わせタグの計算範囲を限定し、組み合わせ潜在力を備えないことが明らかであるタグを除去する。其ここで、組み合わせ潜在力を備えないタグとは、分割された意味が、分割されていないものの意味と同じタグを指す。たとえば、このようなタグは、「夏野菜」、「夏の旅行」であってもよい。組み合わせ潜在力を備えたタグの組み合わせによりテキストコンテンツを正確に説明できるため、本解決手段では、正確なタグがマイニングされ、検索エンジン又は推薦エンジンに供給された後、テキストがユーザに正確に配信・表示され、それによって、ユーザが情報を取得するときの効率及びユーザエクスペリエンスを向上させる。
さらに、前記カテゴリー決定モジュールは、
前記既存タグを含むテキストのカテゴリーを統計するためのカテゴリー統計ユニットと、
統計結果に基づいて、前記既存タグを含むテキストのカテゴリーから、前記既存タグが属するカテゴリーを決定するためのカテゴリー決定ユニットとを含む。
さらに、前記タグ決定モジュールは、
前記既存タグと前記ターゲットテキスト中のほかのタグとの共起頻度を統計するための頻度統計ユニットと、
統計結果に基づいて、前記ターゲットテキストのほかのタグから前記候補タグを決定するためのタグ決定ユニットとを含む。
さらに、前記カテゴリー決定モジュールは、
人気が所定の人気しきい値よりも大きいタグを決定し、このタグを前記既存タグとするための既存タグ決定ユニットを含む。
さらに、前記装置は、
前記組み合わせ結果に基づいて新しいタグを決定する前に、前記既存タグと前記候補タグとの前記ターゲットテキスト内の間隔及び/又は共起頻度に基づいて、前記組み合わせ結果をフィルタリングする結果フィルタリングモジュールをさらに含む。
さらに、前記タグ組み合わせモジュールは、
前記既存タグと前記候補タグを組み合わせて得る候補タグ群を含む少なくとも1つのテキストフラグメントを、前記ターゲットテキストから抽出するためのテキストフラグメント抽出ユニットと、
前記少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定するための新しいタグ決定ユニットとを含む。
さらに、前記新しいタグ決定ユニットは、
前記テキストフラグメントの本体情報に基づいて、少なくとも1つのテキスト本体を得るための本体抽出サブユニットと、
前記少なくとも1つのテキスト本体から新しいタグを決定するための新しいタグ決定サブユニットとを含む。
さらに、前記新しいタグ決定サブユニットは、具体的には、
前記少なくとも1つのテキスト本体を統計し、統計結果に基づいて前記少なくとも1つのテキスト本体からターゲットテキスト本体を決定し、このターゲットテキスト本体を新しいタグとすることに用いられる。
さらに、前記装置は、
前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定する前記ステップの後、前記既存タグと前記候補タグを含む標識対象テキストを決定するための標識テキスト決定モジュールと、
決定した新しいタグを前記標識対象テキスト内に標識するためのテキスト標識モジュールとをさらに含む。
本出願の実施例によれば、本出願は、電子デバイス、及び読み取り可能な記憶媒体をさらに提供する。
図9には、本出願の実施例に係るタグマイニング方法の電子デバイスのブロック図が示されている。電子デバイスは、たとえば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなど、様々な形式のデジタルコンピュータを指すことを意図している。電子デバイスは、たとえば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブルデバイス、及びその他の類似のコンピューティング装置など、様々な形式の移動装置を示してもよい。本明細書に示されているコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であるが、本明細書の説明及び/又は要求される本出願の実現を制限する意図はしない。
図9に示すように、この電子デバイスは、1つ又は複数のプロセッサ901、メモリ902、及び高速インターフェースと低速インターフェースを含む、様々なコンポーネントを接続するためのインターフェースを含む。各コンポーネントは、異なるバスを介して互いに接続され、共通のマザーボードに取り付けられ、又は必要に応じて他の方式で取り付けられ得る。プロセッサは電子デバイス内で実行される命令を処理でき、この命令には、メモリ内に格納される又はメモリ上に格納されて外部入力/出力装置(たとえば、インターフェースに結合された表示デバイスなど)にGUMのグラフィック情報を表示する命令が含まれる。他の実施形態では、複数のプロセッサ及び/又は複数のバスを、必要に応じて、複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続することができ、各デバイスは必要な操作の一部(たとえば、サーバアレイ、ブレードサーバのグループ、又はマルチプロセッサシステムとして)を提供する。図9では、1つのプロセッサ901の場合が例示されている。
メモリ902は、本出願による非一時的なコンピュータ可読記憶媒体である。前記メモリは、本出願に係るタグマイニング方法を前記少なくとも1つの前記プロセッサに実行させるように、少なくとも1つのプロセッサによって実行可能な命令を格納している。本出願の非一時的なコンピュータ可読記憶媒体は、本出願に係るタグマイニング方法をコンピュータに実行させるためのコンピュータ命令を格納している。
非一時的なコンピュータ可読記憶媒体としてのメモリ902は、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、たとえば、本出願の実施例におけるタグマイニング方法に対応するプログラム命令/モジュール(たとえば、図8に示すカテゴリー決定モジュール801、タグ決定モジュール802、及びタグ組み合わせモジュール803)を格納することができる。プロセッサ901は、メモリ902に格納された非一時的なソフトウェアプログラム、命令、及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例におけるタグマイニング方法を実現する。
メモリ902は、プログラム記憶領域及びデータ記憶領域を含むことができ、プログラム記憶領域は、オペレーティングシステム、及び少なくとも1つの機能に必要なアプリケーションプログラムを格納し、データ記憶領域は、タグマイニング電子デバイスの使用に従って作成されたデータなどを格納する。さらに、メモリ902は、たとえば、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスなどの非一時的なメモリを含んでもよい。いくつかの実施例では、メモリ902は、プロセッサ901に対して遠隔的に設置されるメモリを選択的に含んでもよく、これらの遠隔メモリは、ネットワークを介してタグマイニング電子デバイスに接続され得る。上記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
タグマイニング電子デバイスは、入力装置903及び出力装置904をさらに含んでもよい。プロセッサ901、メモリ902、入力装置903及び出力装置904はバス又はその他の方式で接続してもよく、図9には、バスによる接続が例示されている。
入力装置903は、入力される数字又はキャラクター情報を受信すること、タグマイニング電子デバイス、たとえば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインタ、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置のユーザ設定及び機能制御に関連するキー信号入力を生成することができる。出力装置904は、表示デバイス、補助照明装置(たとえば、LED)、触覚フィードバック装置(たとえば、振動モータ)などを含む。この表示デバイスは、液晶ディスプレイ(LDC)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むが、これらに限定されない。いくつかの実施形態では、表示デバイスはタッチスクリーンであり得る。
ここで説明するシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実施され、この1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステムで実行及び/又は解釈され得、このプログラム可能なプロセッサは専用又は汎用のプログラム可能なプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令をこのストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に送信することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)には、プログラム可能なプロセッサの機械命令が含まれ、高度なプロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ/機械語を用いてこれらのコンピューティングプログラムを実施できる。たとえば、本明細書で使用される「機械読み取り可能な媒体」及び「コンピュータ可読媒体」という用語は、機械命令及び/又はデータをプログラム可能なプロセッサの任意のコンピュータプログラム製品、デバイス、及び/又は装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))に提供するものを指し、機械読み取り可能な信号としての機械命令を受信するための機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、プログラム可能なプロセッサに機械命令及び/又はデータを提供するために使用される任意の信号を指す。
ユーザと対話できるように、ここで説明するシステム及び技術をコンピュータに実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置(たとえば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニター)、ユーザがコンピュータに入力することを可能とするキーボード及びポインティング装置(たとえば、マウスやトラックボール)を有する。他の種類の装置も、ユーザとの対話を提供することができ、たとえば、ユーザに提供するフィードバックは、任意の形式の感覚フィードバック(たとえば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であってもよく、そして、ユーザからの入力は、任意の形式(音響入力、音声入力、又は触覚入力を含む)で受信できる。
ここで説明するシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(たとえば、データサーバとして)、又はミドルウェアコンポーネントを含むコンピューティングシステム(たとえば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(たとえば、グラフィカルユーザインターフェース又はWEBブラウザーを備えたユーザコンピュータが挙げられ、ユーザはこのグラフィカルユーザインターフェース又はこのWEBブラウザーを介してここで説明するシステム及び技術の実施形態と対話できる)、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントを含む任意の組み合わせコンピューティングシステムにおいて実施できる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信(たとえば、通信ネットワーク)を介して相互に接続できる。通信ネットワークの例には、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、及びインターネットが含まれる。
コンピュータシステムには、クライアントとサーバを含むことができる。クライアントとサーバは通常、互いに遠く離れており、通信ネットワークを介して互いに会話するのが一般的である。クライアントとサーバの関係は、対応するコンピュータで実行され、互いにクライアント-サーバの関係を持つコンピュータプログラムによって生成される。サーバは、クラウドコンピューティングサーバー又はクラウドホストとも呼ばれるクラウドサーバーにすることができ、これは、管理が困難であり、ビジネススケーラビリティが低いという従来の物理ホスト及びVPSサービスの欠陥を解決するためのクラウドコンピューティングサービスシステムにおける1つのホスト製品である。
本出願の技術によれば、既存タグによる正確なタグのマイニングを実現する。なお、上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。たとえば、本出願に記載の各ステップは、本出願開示の技術案の所望の結果が達成できる限り、並行して実施しても、順次実施しても、異なる順序で実施してもよく、本明細書では、それについて限定しない。
上記特定実施形態は、本出願の特許範囲に対する制限を構成するものではない。当業者にとって明らかなように、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び置換を行うことができる。本出願の精神及び原則の範囲内で行われた修正、同等の置換、及び改良であれば、本出願の特許範囲に含まれるものとする。

Claims (21)

  1. タグマイニング装置により実行される方法であって、
    既存タグ及び前記既存タグが属するカテゴリーを決定するステップと、
    前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定するステップと、
    前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定するステップとを含む、方法。
  2. 前記既存タグが属するカテゴリーを決定する前記ステップは、
    前記既存タグを含むテキストのカテゴリーを統計するステップと、
    統計結果に基づいて、前記既存タグを含むテキストのカテゴリーから、前記既存タグが属するカテゴリーを決定するステップとを含む、請求項1に記載の方法。
  3. 前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定する前記ステップは、
    前記既存タグと前記ターゲットテキスト中のほかのタグとの共起頻度を統計するステップと、
    統計結果に基づいて、前記ターゲットテキストのほかのタグから前記候補タグを決定するステップとを含む、請求項1又は2に記載の方法。
  4. 既存タグを決定する前記ステップは、
    人気が所定の人気しきい値よりも大きいタグを決定し、このタグを前記既存タグとするステップを含む、請求項1又は2に記載の方法。
  5. 前記組み合わせ結果に基づいて新しいタグを決定する前ステップの前に、
    前記既存タグと前記候補タグとの前記ターゲットテキスト内の間隔及び/又は共起頻度に基づいて、前記組み合わせ結果をフィルタリングするステップをさらに含む、請求項1又は2に記載の方法。
  6. 組み合わせ結果に基づいて新しいタグを決定する前記ステップは、
    前記既存タグと前記候補タグを組み合わせて得る候補タグ群を含む少なくとも1つのテキストフラグメントを前記ターゲットテキストから抽出するステップと、
    前記少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定するステップとを含む、請求項1又は2に記載の方法。
  7. 前記少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定する前記ステップは、
    前記テキストフラグメントの本体情報を抽出して、少なくとも1つのテキスト本体を得るステップと、
    前記少なくとも1つのテキスト本体から新しいタグを決定するステップとを含む、請求項6に記載の方法。
  8. 前記少なくとも1つのテキスト本体から新しいタグを決定する前記ステップは、
    前記少なくとも1つのテキスト本体を統計し、統計結果に基づいて前記少なくとも1つのテキスト本体からターゲットテキスト本体を決定し、このターゲットテキスト本体を新しいタグとするステップを含む、請求項7に記載の方法。
  9. 前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定する前記ステップの後、
    前記既存タグと前記候補タグを含む標識対象テキストを決定するステップと、
    決定した新しいタグを前記標識対象テキスト内に標識するステップとをさらに含む、請求項1又は2に記載の方法。
  10. タグマイニング装置であって、
    既存タグ及び前記既存タグが属するカテゴリーを決定するためのカテゴリー決定モジュールと、
    前記既存タグに基づいて、前記カテゴリーに関連つけられたターゲットテキストから候補タグを決定するためのタグ決定モジュールと、
    前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定するためのタグ組み合わせモジュールとを含むタグマイニング装置。
  11. 前記カテゴリー決定モジュールは、
    前記既存タグを含むテキストのカテゴリーを統計するためのカテゴリー統計ユニットと、
    統計結果に基づいて、前記既存タグを含むテキストのカテゴリーから、前記既存タグが属するカテゴリーを決定するためのカテゴリー決定ユニットとを含む、請求項10に記載の装置。
  12. 前記タグ決定モジュールは、
    前記既存タグと前記ターゲットテキスト中のほかのタグとの共起頻度を統計するための頻度統計ユニットと、
    統計結果に基づいて、前記ターゲットテキストのほかのタグから前記候補タグを決定するためのタグ決定ユニットとを含む、請求項10又は11に記載の装置。
  13. 前記カテゴリー決定モジュールは、
    人気が所定の人気しきい値よりも大きいタグを決定し、このタグを前記既存タグとするための既存タグ決定ユニットをさらに含む、請求項10又は11に記載の装置。
  14. 前記組み合わせ結果に基づいて新しいタグを決定する前、前記既存タグと前記候補タグとの前記ターゲットテキスト内の間隔及び/又は共起頻度に基づいて、前記組み合わせ結果をフィルタリングするための結果フィルタリングモジュールをさらに含む、請求項10又は11に記載の装置。
  15. 前記タグ組み合わせモジュールは、
    前記既存タグと前記候補タグを組み合わせて得る候補タグ群を含む少なくとも1つのテキストフラグメントを前記ターゲットテキストから抽出するためのテキストフラグメント抽出ユニットと、
    前記少なくとも1つのテキストフラグメントに基づいて、新しいタグを決定するための新しいタグ決定ユニットとを含む、請求項10又は11に記載の装置。
  16. 前記新しいタグ決定ユニットは、
    前記テキストフラグメントの本体情報に基づいて、少なくとも1つのテキスト本体を得るための本体抽出サブユニットと、
    前記少なくとも1つのテキスト本体から新しいタグを決定するための新しいタグ決定サブユニットとを含む、請求項15に記載の装置。
  17. 前記新しいタグ決定サブユニットは、具体的には、
    前記少なくとも1つのテキスト本体を統計し、統計結果に基づいて前記少なくとも1つのテキスト本体からターゲットテキスト本体を決定し、このターゲットテキスト本体を新しいタグとすることに用いられる、請求項16に記載の装置。
  18. 前記既存タグと前記候補タグを組み合わせて、組み合わせ結果に基づいて新しいタグを決定した後、前記既存タグと前記候補タグを含む標識対象テキストを決定するための標識テキスト決定モジュールと、
    決定した新しいタグを前記標識対象テキスト内に標識するためのテキスト標識モジュールとをさらに含む、請求項10又は11に記載の装置。
  19. 電子デバイスであって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されたメモリとを含み、
    前記メモリは、前記少なくとも1つのプロセッサにより実行可能な命令を記憶しており、前記命令が前記少なくとも1つのプロセッサにより実行されて、前記少なくとも1つのプロセッサに請求項1~9のいずれか1項に記載の方法を実行させる電子デバイス。
  20. コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令は、請求項1~9のいずれか1項に記載の方法をコンピュータに実行させる記憶媒体。
  21. コンピュータプログラムであって、
    前記コンピュータプログラムは、プロセッサにより実行されると、請求項1~9のいずれか1項に記載の方法を実行させるコンピュータプログラム。
JP2021060937A 2020-08-11 2021-03-31 タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Active JP7277502B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010802838.8A CN111984883B (zh) 2020-08-11 2020-08-11 标签挖掘方法、装置、设备以及存储介质
CN202010802838.8 2020-08-11

Publications (2)

Publication Number Publication Date
JP2022003514A JP2022003514A (ja) 2022-01-11
JP7277502B2 true JP7277502B2 (ja) 2023-05-19

Family

ID=73434100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021060937A Active JP7277502B2 (ja) 2020-08-11 2021-03-31 タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210216598A1 (ja)
EP (1) EP3842961A3 (ja)
JP (1) JP7277502B2 (ja)
KR (1) KR20210044747A (ja)
CN (1) CN111984883B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722493B (zh) * 2021-09-09 2023-10-13 北京百度网讯科技有限公司 文本分类的数据处理方法、设备、存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070283252A1 (en) 2006-06-01 2007-12-06 Gunther Stuhec Adding tag name to collection
JP2010262577A (ja) 2009-05-11 2010-11-18 Nec Corp 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP2010262332A (ja) 2009-04-30 2010-11-18 Nec Corp 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP2012525630A (ja) 2009-04-30 2012-10-22 ティヴォ インク コミュニティに基づく格付けによる階層的タグ
JP2013186764A (ja) 2012-03-09 2013-09-19 Kddi Corp 対象文から直接的に導出できないカテゴリのタグを付与するタグ付けプログラム、装置、方法及びサーバ
US20170024443A1 (en) 2015-07-24 2017-01-26 International Business Machines Corporation Generating and executing query language statements from natural language
JP6085072B1 (ja) 2016-02-18 2017-02-22 楽天株式会社 管理装置、管理方法、プログラム、及び、非一時的なコンピュータ読取可能な情報記録媒体

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070078832A1 (en) * 2005-09-30 2007-04-05 Yahoo! Inc. Method and system for using smart tags and a recommendation engine using smart tags
US20080071929A1 (en) * 2006-09-18 2008-03-20 Yann Emmanuel Motte Methods and apparatus for selection of information and web page generation
US20090265631A1 (en) * 2008-04-18 2009-10-22 Yahoo! Inc. System and method for a user interface to navigate a collection of tags labeling content
KR20130009754A (ko) * 2010-02-01 2013-01-23 점프탭, 인크. 통합형 광고 시스템
US8943070B2 (en) * 2010-07-16 2015-01-27 International Business Machines Corporation Adaptive and personalized tag recommendation
US9552376B2 (en) * 2011-06-09 2017-01-24 MemoryWeb, LLC Method and apparatus for managing digital files
US8903819B2 (en) * 2011-12-28 2014-12-02 United Video Properties, Inc. Systems and methods for sharing profile information using user preference tag clouds
US9898748B1 (en) * 2012-08-30 2018-02-20 Amazon Technologies, Inc. Determining popular and trending content characteristics
US20140201180A1 (en) * 2012-09-14 2014-07-17 Broadbandtv, Corp. Intelligent Supplemental Search Engine Optimization
US9218321B2 (en) * 2013-01-29 2015-12-22 International Business Machines Corporation Creating tag clouds based on user specified arbitrary shape tags
KR101475439B1 (ko) 2013-02-18 2014-12-24 주식회사 솔트룩스 사용자에게 최적화된 관심 정보를 제공하기 위한 시스템 및 방법
WO2014190216A1 (en) * 2013-05-22 2014-11-27 Thompson David S Fantasy sports interleaver
US9440152B2 (en) * 2013-05-22 2016-09-13 Clip Engine LLC Fantasy sports integration with video content
US9710437B2 (en) * 2014-07-10 2017-07-18 International Business Machines Corporation Group tagging of documents
US10346876B2 (en) * 2015-03-05 2019-07-09 Ricoh Co., Ltd. Image recognition enhanced crowdsourced question and answer platform
CN109615470A (zh) * 2018-12-07 2019-04-12 北京三快在线科技有限公司 标签推荐方法、标签推荐装置、电子设备及存储介质
US11531703B2 (en) * 2019-06-28 2022-12-20 Capital One Services, Llc Determining data categorizations based on an ontology and a machine-learning model
US11232147B2 (en) * 2019-07-29 2022-01-25 Adobe Inc. Generating contextual tags for digital content
CN111125435B (zh) * 2019-12-17 2023-08-11 北京百度网讯科技有限公司 视频标签的确定方法、装置和计算机设备
CN111274330B (zh) * 2020-01-15 2022-08-26 腾讯科技(深圳)有限公司 一种目标对象确定方法、装置、计算机设备及存储介质
CN111339250B (zh) * 2020-02-20 2023-08-18 北京百度网讯科技有限公司 新类别标签的挖掘方法及电子设备、计算机可读介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070283252A1 (en) 2006-06-01 2007-12-06 Gunther Stuhec Adding tag name to collection
JP2010262332A (ja) 2009-04-30 2010-11-18 Nec Corp 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP2012525630A (ja) 2009-04-30 2012-10-22 ティヴォ インク コミュニティに基づく格付けによる階層的タグ
JP2010262577A (ja) 2009-05-11 2010-11-18 Nec Corp 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP2013186764A (ja) 2012-03-09 2013-09-19 Kddi Corp 対象文から直接的に導出できないカテゴリのタグを付与するタグ付けプログラム、装置、方法及びサーバ
US20170024443A1 (en) 2015-07-24 2017-01-26 International Business Machines Corporation Generating and executing query language statements from natural language
JP6085072B1 (ja) 2016-02-18 2017-02-22 楽天株式会社 管理装置、管理方法、プログラム、及び、非一時的なコンピュータ読取可能な情報記録媒体

Also Published As

Publication number Publication date
CN111984883A (zh) 2020-11-24
EP3842961A2 (en) 2021-06-30
KR20210044747A (ko) 2021-04-23
CN111984883B (zh) 2024-05-14
US20210216598A1 (en) 2021-07-15
JP2022003514A (ja) 2022-01-11
EP3842961A3 (en) 2021-09-22

Similar Documents

Publication Publication Date Title
CN111325020B (zh) 一种事件论元抽取方法、装置以及电子设备
JP7130194B2 (ja) ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
KR20210092152A (ko) 핵심 엔티티를 레이블링하는 방법, 장치 및 전자 기기
JP7235817B2 (ja) 機械翻訳モデルのトレーニング方法、装置及び電子機器
CN112650907A (zh) 搜索词的推荐方法、目标模型的训练方法、装置及设备
US11423907B2 (en) Virtual object image display method and apparatus, electronic device and storage medium
CN110797005B (zh) 韵律预测方法、装置、设备和介质
CN111414482A (zh) 一种事件论元抽取方法、装置以及电子设备
JP7300475B2 (ja) エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111783468A (zh) 文本处理方法、装置、设备和介质
JP7200277B2 (ja) ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP7246437B2 (ja) 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム
JP7140913B2 (ja) 映像配信時効の決定方法及び装置
US20210216710A1 (en) Method and apparatus for performing word segmentation on text, device, and medium
CN111522863A (zh) 一种主题概念挖掘方法、装置、设备以及存储介质
CN112269862A (zh) 文本角色标注方法、装置、电子设备和存储介质
CN111858905A (zh) 模型训练方法、信息识别方法、装置、电子设备及存储介质
JP2021168125A (ja) スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP7277502B2 (ja) タグマイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111984774A (zh) 搜索方法、装置、设备以及存储介质
CN112052397A (zh) 用户特征生成方法、装置、电子设备及存储介质
CN111832313B (zh) 文本中情感搭配集合的生成方法、装置、设备和介质
CN112446728B (zh) 广告召回方法、装置、设备及存储介质
CN111400431A (zh) 一种事件论元抽取方法、装置以及电子设备
CN111931524A (zh) 用于输出信息的方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230508

R150 Certificate of patent or registration of utility model

Ref document number: 7277502

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150