JP5940056B2 - テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム - Google Patents

テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム Download PDF

Info

Publication number
JP5940056B2
JP5940056B2 JP2013506579A JP2013506579A JP5940056B2 JP 5940056 B2 JP5940056 B2 JP 5940056B2 JP 2013506579 A JP2013506579 A JP 2013506579A JP 2013506579 A JP2013506579 A JP 2013506579A JP 5940056 B2 JP5940056 B2 JP 5940056B2
Authority
JP
Japan
Prior art keywords
semantic
text content
online community
concepts
proximity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013506579A
Other languages
English (en)
Other versions
JP2013530437A (ja
Inventor
スタン,ヨハン
ハシド,ハキム
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2013530437A publication Critical patent/JP2013530437A/ja
Application granted granted Critical
Publication of JP5940056B2 publication Critical patent/JP5940056B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、オンライン・コミュニティ内のグループ電子通信に関する。
ここで、「オンライン」という用語は、コミュニティのメンバと相互作用するためにコンピューティング・デバイスおよび電子デバイスを単に使用することを指す。オンライン・コミュニティは、例えば、メールリスト、ディスカッション・フォーラム、もしくはソーシャルネットワークなど、インターネット(Web2.0)を経由して、または、企業の協調作業空間、実践共同体など、イントラネット・ネットワーク/エクストラネット・ネットワークを経由してアクセス可能である。
1人または複数のアドミニストレータによって作成される、仮想コミュニティとしても知られているオンライン・コミュニティは、例えば、本質的に、社会的、商業的、または教育的であり得る、あるテーマに関心のある人々の間のリアルタイムではない(非同期対話である)グループ(集合的)電子通信の場所を表す。この主題に関心のあるいずれのユーザも、そのコミュニティに参加して、それによって、そのメンバと相互作用することができる。そこで、ユーザは、テキストコンテンツ、マルチメディア、またはより一般には、データを交換(掲示および/もしくは閲覧)することができる。いくつかのオンライン・コミュニティでは、パスワードによって識別される、登録されたユーザだけが、コンテンツを掲示および/または閲覧することが可能である。
これらのオンライン・コミュニティは、文書による電子通信が主にユーザのグループがコミュニティを形成する唯一の様式であるという点で、主に言語ベースである。
これは、メンバの関心を引く主題の他に、オンライン・コミュニティは、一般に、このグループ電子通信空間において、特定の相互作用的な言語行動を採用および実践するグループによって生み出されるためである。これは、何らかの言語習慣をオンライン・コミュニティ内で経時的に儀式化させ、結果として、そのコミュニティに属するレベルを表す。
すなわち、オンライン・コミュニティに属することは、それ自体、そのメンバによって、ならびに従来の言語規範によって、集合的に認識および予期される語彙、言語レジスタ(language register)、言語習慣、略語、頭文字、通信プロトコル、コード、構文特徴、および概念を共有することを示す。例として、一部のオンライン・コミュニティでは、
フランスの首都は、「エッフェル塔の街」と呼ばれ、(例えば、イントラネット上の協調作業空間において)チームリーダは「ボス」と呼ばれ、「ロングタームエボリューション」という表現は「LTE」と呼ばれ、「おはよう」という用語は「gm」と呼ばれ、敵のサッカーチームは「敗者」と呼ばれ、オンライン・コミュニティによって組織されたゲームにおいて勝者チームは「王様」と呼ばれる、
メッセージは「皆さん、こんにちは」で始まり、質問は「よろしくお願いします」または「回答よろしくお願いします」で終わる、
(フランス語またはスペイン語などの言語で)非公式Tフォーム(informal T−form)が使用される。
これらの言語習慣は、それ自体、言語的な正当化の根拠がほとんどない場合があるが、これらの言語習慣は、概念、語彙、および、特に、オンライン・コミュニティ固有の意味において見出される点に留意されたい。これは、オンライン・コミュニティの正規のメンバによってだけ共有される言語文化である。この場合、これは生態系と見なされる。
オンライン・コミュニティに対するコミュニティ接続は、したがって、そのコミュニティ固有の言語および共通コードを採用ならびに使用することを必要とする。
一部のオンライン・コミュニティにおける新しいメンバの場合、文書による通信(メッセージ、注釈、コメント、質問、または、より一般に、電子テキスト)を掲示することは、その表現がそのコミュニティの正規のメンバによって予期されるような表現である場合だけ成功を収める。同じような形で、そのオンライン・コミュニティによって既に公開されている文書による通信は、その新しいメンバがそのオンライン・コミュニティの言語習慣を認識(復号)する場合だけ、最適に理解される。そうでない場合、どの新しいメンバもそのオンライン・コミュニティによって疎外されたと感じることになる。
これは、ユーザがオンライン・コミュニティに参加するときにユーザが遭遇する主な障害のうちの1つが、確かに、そのコミュニティの「真の」メンバになるために必要とされる適応努力であることによる。この適応は、それ自体、特に、そのコミュニティの言語行動に照らして、文書によるテキストを迅速に理解し、かつ/または正しい言葉で表すことを介して示される。
したがって、そのコミュニティの語彙および意味にまだ慣れ親しんでいない新しいメンバによって掲示されたメッセージ(特に、質問)のオンライン・コミュニティのメンバによる解釈は、多くの時間がかかる場合があり、その結果、そのコミュニティの反応性を改変させる可能性がある。新しいユーザ(すなわち、新しいメンバ)は、そのオンライン・コミュニティから入って来る通信を理解するためにより多くの時間を必要とすることにもなる。
M.Z MAALA他、Langages et Modeles a Objets 07 Toulouseにより発行された「Distance semantique entre concepts definis en ALE」、2007
本発明の1つの目的は、前述の欠点を是正することである。
本発明の別の目的は、オンライン・コミュニティのユーザに新しい付加価値サービスを提案することである。
本発明の別の目的は、文書による電子通信のコンテンツをオンライン・コミュニティの言語行動に適合(整合)させることである。
本発明の別の目的は、オンライン・コミュニティの通信空間のコンテンツの均一表現を保証することである。
本発明の別の目的は、企業のネットワーク内の情報共有の効率を促進および改善することである。
本発明の別の目的は、オンライン・コミュニティへの新しいメンバの統合を円滑にすることである。
本発明の別の目的は、言語的な観点からオンライン・コミュニティを特徴付けることである。
本発明の別の目的は、オンライン・コミュニティの成功を促進することである。
本発明の別の目的は、仮想コミュニティに属している感覚を新しいユーザの中に出現させることを促進することである。
本発明の別の目的は、オンライン・コミュニティ内で通信の出現を促進する社会技術デバイスを提案することである。
本発明の別の目的は、グループ電子通信の効率を改善することである。
本発明の別の目的は、オンライン・コミュニティの言語行動を識別することである。
このために、本発明は、第1の態様によれば、テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法であって、
オンライン・コミュニティの意味的タグクラウドを確立するステップと、
意味的タグクラウドに基づいて、テキストコンテンツの少なくとも1つの概念の少なくとも1つの意味的近接性(semantic vicinity)を決定するステップと、
決定された意味的近接性を用いて、テキストコンテンツを再公式化するステップと
を含む方法に関する。
本発明は、第2の態様によれば、テキストコンテンツをオンライン・コミュニティの言語行動に適合させるためのデバイスであって、以下のモジュール、すなわち、
オンライン・コミュニティの意味的タグクラウドを確立するように構成された意味解析装置と、
意味的タグクラウドに基づいて、少なくとも1つのテキストコンテンツ概念の少なくとも1つの意味的近接性を決定するように構成された意味的近接性計算機と、
決定された意味的近接性を使用するテキストコンテンツの意味的再公式化装置と
を備えるデバイスに関する。
第3の態様によれば、本発明は、コンピュータ処理装置内で実施可能な、上で要約された方法を実施するための命令を備える、メモリ媒体上で実施されるコンピュータプログラム製品に関する。
本発明のその他の特徴および利点は、添付の図面を参照して行われる、好ましい実施形態の下の説明を読むとすぐに、より明瞭かつ完全に明らかになるであろう。
テキストコンテンツの一部をある言語行動に意味的に適合させるための、デバイスのモジュールを概略的に示す図である。 テキストコンテンツの一部をある言語行動に意味的に適合させるための、デバイスの非限定的な機能的アーキテクチャを概略的に示す図である。
図1は、オンライン・コミュニティ51と相互作用するためのユーザ20手順を示す。この場合、「オンライン・コミュニティと相互作用すること」は、そのコミュニティの電子通信空間内に電子テキストコンテンツを掲示すること、および/またはその空間内でその電子テキストコンテンツを読み取ることを指す。非限定的な例として、オンライン・コミュニティ51は、
「Facebook(登録商標)」、「Twitter(登録商標)」、「mySpace(登録商標)、もしくは「hi5(登録商標)」などのソーシャルネットワーク、
「delicious(登録商標)」、「youtube(登録商標)」、「flickr(登録商標)」、もしくは「yoolink(登録商標)」など、フォークソノミー(社会的なタグ付け)としても知られているパーソナル・インデックス・サービス、
www.commentcamarche.net、http://forum.hardware.fr/、もしくはhttp://voyageforum.com/など、オンライン・ディスカッション・フォーラム、または
協調作業空間など、イントラネット・ネットワーク上もしくはエクストラネット・ネットワーク上のユーザグループ、である。
オンライン・コミュニティ5のうちの1つと相互作用する際に、ユーザ20は、意味適合装置10の助けを借りる。
意味適合装置10は、オンライン・コミュニティ51の言語習慣に関して、ユーザ20によって生成されたテキストコンテンツの意味予測を行うように構成される。この意味予測は、詳細には、ユーザ20が掲示することを望むテキストコンテンツをオンライン・コミュニティ51の言語習慣に最も良好に適合させることを目的とする。
このために、意味適合装置10は、意味解析装置1と、意味的近接性計算機2と、意味的再公式化装置3とを含めて、複数のモジュールを備える。
意味的再公式化装置3はオンライン・コミュニティ51のタグ(すなわち、キーワード)の意味的クラウドを確立するように構成される。
そのために、意味的再公式化装置3は、オンライン・コミュニティ51内で公開されたテキスト交換の従来の解析を行う。これらの交換は、一般に、ディスカッション・スレッド(例えば、フォーラムにおける単一の議論主題、「Flickr(登録商標)」内の単一の収集物、協調作業空間における単一のプロジェクト、「Facebook(登録商標)上の友人のグループによって公開されたコンテンツの一部)として組織される。
意味解析装置1によって確立された意味的タグクラウドは、オンライン・コミュニティ51の特徴的な用語の意味的な凝縮である。これらの用語は、そのオンライン・コミュニティ51の言語習慣内のその重要性を強調表示するために、少なくとも1つの基準を備える。
例として、基準は、そのオンライン・コミュニティ51内に既に掲示されているある概念を相互作用の際に使用する頻度であってよい。この場合、それぞれの概念は、このオンライン・コミュニティ51内のその発生を反映する重みによって特徴付けられる。
改変形態において、または組合せにおいて、この基準は、例えば、概念が含む情報の量を反映する、情報理論からのシャノン分布(Shannon distribution)など、他の属性に関する場合もある。このように、この意味的タグクラウドは、オンライン・コミュニティ51内で最も一般的に使用される用語の単なるリストではなく、その真の意味的な凝縮である。例として、意味的タグクラウドは、テキストコンテンツの一部の最も頻出する概念、ならびにそのコンテンツ内のその意味的近接性を同時に反映することが可能である(木構造における意味的タグクラウド、3D意味的タグクラウド)。
これらの概念は、例えば、以下に関係し得る。
礼儀作法規定(メッセージの導入部および結び、挨拶メッセージ、よろしくお願いします)、
略語、
言語レジスタおよび語彙(例えば、ビジネス用語、一般的な/正式の/通常の/人気のある/俗語のレジスタ)、
周辺言語指標(スマイリーまたはエモーティコン)、
(意見または感情の強度を伝えるために、大文字で書かれた、同じシンボルを複製する(例えば、複数の感嘆符)表現上の句読法、
相互作用の語用論(名の使用、非公式Tフォームの使用)。
有利には、意味的タグクラウドは、そのコンテンツ固有の言語習慣だけを用いて、オンライン・コミュニティ51の複雑なコンテンツを要約することを可能にする。すなわち、意味解析装置1は、そこで一般的に何が実践されているかに基づいて、オンライン・コミュニティ51の意味的イメージを取得することを可能にする。
オンライン・コミュニティ51の意味的タグクラウドは、ユーザがそのコミュニティにおいて掲示すること/読むことを望む何らかのテキストコンテンツとは無関係に取得される。
意味的近接性計算機2は、意味解析装置1によって確立された意味的タグクラウドに基づいて、事前定義された意味的近接性報告(例えば、同義語集、周辺同義語集(parasynonymy)、または、主観的論理の解析)に基づいてユーザ20によって生成されたテキストコンテンツの一部の意味的近接性を提供するように動作可能である。
意味的近接性計算機2は、意味的タグクラウド内で、それぞれ、ユーザ20によって生成されたテキストコンテンツ内で識別された概念を最も表す用語/概念で構成された意味的近接性を決定するように構成される。すなわち、それぞれの決定された意味的近接性は、好ましくは、ユーザによって生成されたテキストコンテンツ内で識別された概念に意味的に近い複数の概念を優先的に含む。
優先的には、意味的近接性計算機2は、(WordNet(登録商標)、SentiWordNet(登録商標)、ConceptNet(登録商標)など)オントロジー・メタデータ4、および/またはユーザ20によって事前定義された、または自動的に生成された語彙を使用する。このメタデータ4は、意味的近接性計算機2が、そのそれぞれの意味的近接性が意味的タグクラウド内に見出されると推定される、ユーザ20によって生成されたテキストコンテンツ内に含まれた概念を識別するのを支援する。
より一般的には、テキストコンテンツのある部分に関する要求に応答して、少なくとも1つの意味的近接性を提供するその機能を考慮すると、意味的近接性計算機2は、「セマンティックプロキシ(semantic proxy)」である。
このセマンティックプロキシは、オンライン通信プラットフォーム、より詳細には、ソーシャルシステム(「Facebook(登録商標)もしくは「Frickr(登録商標)」など、ソーシャルネットワークおよびソーシャル「タグ」システム)に通じる、オントロジー・メタデータまたはゲートウェイ・メタデータの一部である。
意味的再公式化装置3は、以下を可能にする。
意味的近接性計算機2に従って、ユーザ20によって生成されたコンテンツの用語/概念に意味的に近かった用語/概念を意味的タグクラウドから取り出すこと、および
それに応じて、取り出された用語/概念を用いて、ユーザ20によって生成されたテキストコンテンツを再公式化すること。
ユーザ20によって生成されたコンテンツは、したがって、意味的タグクラウドから選択されたその意味的近接性を用いて適合され、次いで、ユーザ20に提示される。
適合されたテキストコンテンツがユーザ20によって拒絶された場合、前の適合とは異なる新しい適合がユーザに優先的に提供される。そのために、意味的再公式化装置3は、
ユーザ20によって生成された概念Cとオンライン・コミュニティ51の意味的クラウドNSの間の意味的距離を評価するステップと、
別の概念C’とCの間の意味的距離が最小であるように、概念C付近でC’を検索するステップと、
概念Cを置換するために概念C’を推奨するステップであって、C’がそのコミュニティの言語行動により良好に適合されている、推奨するステップと
を含めて、意味的近接性の測定を進めることによって、ユーザ20によって生成されたコンテンツに関して、意味的近接性計算機2によって決定された意味的近接性のコンテンツの階層を調べる。
例えば、(M.Z MAALA他、Langages et Modeles a Objets 07 Toulouseにより発行された「Distance semantique entre concepts definis en ALE」、2007)において、意味的距離を測定するための異なる技術が説明されている。意味的な類似性または意味的関係の程度の測定を使用することも可能である。
次に、オンライン・コミュニティ51とのユーザ相互作用の手順を例示する図2を参照する。
テキストコンテンツの一部をオンライン・コミュニティ51の言語行動に意味的に適合させる手順は、以下の形で、前述の機能モデルの支援を得る:
ユーザ20の要求時に、または、テキストコンテンツをオンライン・コミュニティ51の言語行動に適合させるためのデバイスに通信されるテキスト注釈21を含むコンテンツのいずれかを提示する前に自動的に(図2のステップ11)、
オントロジー・メタデータ4を使用して(図2のステップ12)、意味的近接性計算機2は注釈21内の少なくとも1つの概念を識別する、
この場合も、オントロジー・メタデータ4を使用して(図2のステップ12)、意味的近接性計算機2は、テキスト注釈21内で識別されたそれぞれの概念の少なくとも1つの意味的近接性をオンライン・コミュニティ51の意味的タグクラウド31内で検索する(図2のステップ13)、
意味的再公式化装置3を用いて、意味的近接性計算機2に従って、最も意味的に近いタグクラウド概念31が取り出され、次いで、注釈21に提供され、結果として、注釈22がオンライン・コミュニティ51の言語行動に適合される。適合された注釈22は、ユーザ20に送られる(図2のステップ14)、
ユーザは、注釈21に行われた変更を、すべてもしくは一部、自由に承認することまたは取り消すことができる(図2のステップ15)。
優先的には、行われた変更の識別を円滑にし、それによって、ユーザ30によるこれらの概念20の割当てを促進し、結果として、オンライン・コミュニティ51に属している感覚を新しいユーザ20の中に出現させるために、ユーザ20によって生成された元のコンテンツ内で修正された概念は、ユーザ20のために一時的に強調表示される。
目標とするオンライン・コミュニティの言語行動に適合されたテキストコンテンツは、ユーザ20が無視または拒絶できる単なる提案である点に留意されたい。すなわち、編集されたテキストコンテンツを、ユーザの明示的な承認なしに、直接掲示することはできない。
さらに、上で説明された方法は、オンライン・コミュニティの言語行動に照らして、そのコミュニティの通信空間内の(例えば、選択された)テキストコンテンツの識別された部分を明確化するためにも使用可能である。例として、オンライン・コミュニティ固有の辞書の使用は、そのコミュニティに慣れ親しんでいない任意の他のユーザ(例えば、そのコミュニティのメンバと非常に異なる年齢のユーザ)に対して、そのコミュニティによって公開されたテキストコンテンツの一部を明確化することを可能にする。
まさに説明された方法は、異なる作業チーム間の通信を改善および円滑にすることに鑑みて、ビジネスネットワークに特に適用可能である。この方法のおかげで、異なるビジネス用語/企業風土を有する、企業間協調作業空間のメンバは、より良好な相互理解を有することになる。この方法は、使用される語彙(例えば、同じ略語、同じ技術用語)の調和も可能にできる。
まさに説明された方法は、いくつかの利点を示す。この方法は、テキスト電子コンテンツの一部のオントロジーを目標とするオンライン・コミュニティのオントロジーと整合させることを可能にし、これは、そのテキスト電子コンテンツの一部をそのコミュニティのメンバによって直接的に理解できるものにする。
このデバイスは、ウェブブラウザに関連する拡張または機能の形で実施可能であり、その使用は、自動的であってよく、またはユーザ主導であってもよい。そのデバイスによって適合されたテキストコンテンツは、
優先的に、行われた変更を見分けることを可能にし、
ユーザがその提案を承認もしくは無視すること(または、その適合拡張/適合機能を動作不能にさせることすら)を可能にする
と同時に、例えば、元のテキストコンテンツの場所と同じ場所に、新しいウィンドウ/タブ内に、またはファクトバブル(fact bubble)内に表示可能である。

Claims (11)

  1. コンピュータ処理装置により実施される、テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法であって、
    前記オンライン・コミュニティ内で公開されたテキスト交換を解析し、前記オンライン・コミュニティの特徴的な用語の意味的な凝縮である意味的タグクラウドを確立するステップと、
    前記意味的タグクラウドの中から、前記テキストコンテンツ内で前記特徴的な用語に対応すると識別された少なくとも1つの概念を表す用語又は概念で構成された少なくとも1つの意味的近接性を決定するステップと、
    前記決定された意味的近接性を用いて、前記テキストコンテンツを再構築するステップとを含み、
    前記決定された意味的近接性は、前記テキストコンテンツ内で識別された前記概念に意味的に近い複数の概念を含み、
    前記テキストコンテンツを再構築する前記ステップでは、前記複数の概念のうち最も意味的に近い概念を用いて前記テキストコンテンツを再構築する
    ことを特徴とする方法。
  2. オントロジー・メタデータを用いて、前記テキストコンテンツ内に含まれた少なくとも1つの概念を識別するステップをさらに含むことを特徴とする、請求項1に記載の方法。
  3. 少なくとも1つの意味的近接性を決定する前記ステップでは、少なくとも1つの前記意味的近接性を、事前定義された意味的近接性報告に従って決定することを特徴とする、請求項1または2に記載の方法。
  4. 前記テキストコンテンツを再構築する前記ステップは、前記テキストコンテンツ内で識別された前記概念を置換するために決定された前記意味的近接性のうちの1つを選択するステップを含むことを特徴とする、請求項1乃至のいずれか1項に記載の方法。
  5. 前記選択された前記意味的近接性は、前記テキストコンテンツ内で識別された前記概念に意味的に近い概念で構成されていることを特徴とする、請求項に記載の方法。
  6. 再構築された前記テキストコンテンツを前記オンライン・コミュニティの電子通信空間内に掲示するステップをさらに含むことを特徴とする、請求項1乃至のいずれか1項に記載の方法。
  7. テキストコンテンツをオンライン・コミュニティの前記言語行動に適用させる処理を実施するためのデバイスであって、以下のモジュール、すなわち、
    前記オンライン・コミュニティ内で公開されたテキスト交換を解析し、前記オンライン・コミュニティ(51)の特徴的な用語の意味的な凝縮である意味的タグクラウドを確立するための処理を実施するように構成された意味解析装置(1)と、
    前記意味的タグクラウドの中から、前記テキストコンテンツ内で前記特徴的な用語に対応すると識別された少なくとも1つの概念を表す用語又は概念で構成された少なくとも1つの意味的近接性を決定するための処理を実施するように構成された意味的近接性計算機(2)であって、前記テキストコンテンツ内で識別された前記概念に意味的に近い複数の概念を含む意味的近接性を決定する意味的近接性計算機と、
    前記決定された意味的近接性を使用して前記テキストコンテンツを再構築するための処理を実施するように構成された意味的再構築装置(3)であって、前記複数の概念のうち最も意味的に近い概念を用いて前記テキストコンテンツを再構築する意味的再構築装置
    を備えるデバイス。
  8. 前記テキストコンテンツ内に含まれた少なくとも1つの概念を識別することを可能にするオントロジー・メタデータ(4)をさらに備えることを特徴とする、請求項に記載のデバイス。
  9. 再構築された前記テキストコンテンツを前記オンライン・コミュニティの電子通信空間内に掲示する手段をさらに備えることを特徴とする、請求項またはに記載のデバイス。
  10. コンピュータ処理装置内で実施可能な、請求項1乃至のいずれか1項に記載の方法を実施するための命令を備える、メモリ媒体上で実施されるコンピュータプログラム。
  11. ウェブブラウザに関連する拡張であることを特徴とする、請求項1に記載のコンピュータプログラム。
JP2013506579A 2010-04-27 2011-04-14 テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム Expired - Fee Related JP5940056B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1001793 2010-04-27
FR1001793A FR2959333B1 (fr) 2010-04-27 2010-04-27 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne
PCT/EP2011/055968 WO2011134804A1 (fr) 2010-04-27 2011-04-14 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne

Publications (2)

Publication Number Publication Date
JP2013530437A JP2013530437A (ja) 2013-07-25
JP5940056B2 true JP5940056B2 (ja) 2016-06-29

Family

ID=43125621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013506579A Expired - Fee Related JP5940056B2 (ja) 2010-04-27 2011-04-14 テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム

Country Status (7)

Country Link
US (1) US20130096910A1 (ja)
EP (1) EP2564362A1 (ja)
JP (1) JP5940056B2 (ja)
KR (1) KR101415634B1 (ja)
CN (1) CN102844775A (ja)
FR (1) FR2959333B1 (ja)
WO (1) WO2011134804A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US10289727B2 (en) 2015-09-17 2019-05-14 International Business Machines Corporation Incorporation of semantic attributes within social media
US10878473B1 (en) * 2017-11-16 2020-12-29 Amazon Technologies, Inc. Content modification
US10782986B2 (en) * 2018-04-20 2020-09-22 Facebook, Inc. Assisting users with personalized and contextual communication content
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
CN108664998A (zh) * 2018-04-27 2018-10-16 上海爱优威软件开发有限公司 一种释义加强的图片训练方法及系统
US11176322B2 (en) * 2018-05-22 2021-11-16 International Business Machines Corporation Predicting if a message will be understood by recipients

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245038A (ja) * 1996-03-07 1997-09-19 Just Syst Corp 文章作成装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
EP0914637B1 (en) * 1996-07-03 2001-10-17 Sopheon N.V. Document producing support system
WO2002001401A1 (en) * 2000-06-26 2002-01-03 Onerealm Inc. Method and apparatus for normalizing and converting structured content
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
EP1576586A4 (en) * 2002-11-22 2006-02-15 Transclick Inc LANGUAGE TRANSLATION SYSTEM AND METHOD
US8155951B2 (en) * 2003-06-12 2012-04-10 Patrick William Jamieson Process for constructing a semantic knowledge base using a document corpus
US20060020447A1 (en) * 2004-07-26 2006-01-26 Cousineau Leo E Ontology based method for data capture and knowledge representation
US7860873B2 (en) * 2004-07-30 2010-12-28 International Business Machines Corporation System and method for automatic terminology discovery
JP2008522332A (ja) 2004-12-01 2008-06-26 ホワイトスモーク,インク. 自動的に文書を拡充するシステムおよび方法
US7653528B2 (en) * 2005-03-08 2010-01-26 Microsoft Corporation Resource authoring incorporating ontology
US7702665B2 (en) * 2005-06-14 2010-04-20 Colloquis, Inc. Methods and apparatus for evaluating semantic proximity
US7664629B2 (en) * 2005-07-19 2010-02-16 Xerox Corporation Second language writing advisor
CN100349161C (zh) * 2005-07-29 2007-11-14 中国科学院声学研究所 一种用于句子分析中动词歧义结构消解的语义分析方法
US20080040094A1 (en) * 2006-08-08 2008-02-14 Employease, Inc. Proxy For Real Time Translation of Source Objects Between A Server And A Client
WO2008021512A2 (en) * 2006-08-17 2008-02-21 Neustar, Inc. System and method for handling jargon in communication systems
US7640233B2 (en) * 2006-08-29 2009-12-29 International Business Machines Corporation Resolution of abbreviated text in an electronic communications system
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9275036B2 (en) * 2006-12-21 2016-03-01 International Business Machines Corporation System and method for adaptive spell checking
US7869987B2 (en) * 2007-12-03 2011-01-11 International Business Machines Corporation Methods involving translating text emphasis
US20100030551A1 (en) * 2008-07-31 2010-02-04 Ark Wendy S Jargon translation in an instant messaging environment
US8359191B2 (en) * 2008-08-01 2013-01-22 International Business Machines Corporation Deriving ontology based on linguistics and community tag clouds
JP2009043288A (ja) 2008-11-10 2009-02-26 Japan Science & Technology Agency コミュニティ依存型情報検索システム及び方法
US9009022B2 (en) * 2010-03-30 2015-04-14 Young Hee Yi E-book reader language mapping system and method

Also Published As

Publication number Publication date
KR20120139791A (ko) 2012-12-27
CN102844775A (zh) 2012-12-26
US20130096910A1 (en) 2013-04-18
WO2011134804A1 (fr) 2011-11-03
EP2564362A1 (fr) 2013-03-06
FR2959333B1 (fr) 2014-05-23
FR2959333A1 (fr) 2011-10-28
JP2013530437A (ja) 2013-07-25
KR101415634B1 (ko) 2014-07-09

Similar Documents

Publication Publication Date Title
US11977854B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
JP5940056B2 (ja) テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム
Caplan et al. Qualitative inquiry using social media: A field-tested example
US12073180B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US20170185581A1 (en) Systems and methods for suggesting emoji
US11989507B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US20230274094A1 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US10467301B2 (en) System and method for automated responses to information needs on websites
US9710829B1 (en) Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities
US20140108143A1 (en) Social content distribution network
WO2023161630A1 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
WO2013024338A1 (en) System and method for managing opinion networks with interactive opinion flows
Benamara et al. Introduction to the special issue on language in social media: exploiting discourse and other contextual information
US20130275438A1 (en) Disambiguating authors in social media communications
Mangal et al. Analysis of users’ interest based on tweets
US12067362B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US20140025496A1 (en) Social content distribution network
Itani Sentiment analysis and resources for informal Arabic text on social media
Mehmet et al. More than words can say: a multimodal approach to understanding meaning and sentiment in social media
Yu et al. The Art of Post Captions: Readability and User Engagement on Social Media
US20200351241A1 (en) Data-driven online domain name generator
Chen et al. Predicting and characterising persuasion strategies in misinformation content over social media based on the multi-label classification approach
Wang et al. Word intuition agreement among Chinese speakers: a Mechanical Turk-based study
Li et al. The Effects of Online Information on E‐Book Pricing Strategies: A Text Analytics Approach
Gitau An approach for using twitter to perform sentiment analysis in Kenya

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150427

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150508

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20150710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160517

R150 Certificate of patent or registration of utility model

Ref document number: 5940056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees