JP7266838B2 - 情報分析装置及びプログラム - Google Patents
情報分析装置及びプログラム Download PDFInfo
- Publication number
- JP7266838B2 JP7266838B2 JP2018160577A JP2018160577A JP7266838B2 JP 7266838 B2 JP7266838 B2 JP 7266838B2 JP 2018160577 A JP2018160577 A JP 2018160577A JP 2018160577 A JP2018160577 A JP 2018160577A JP 7266838 B2 JP7266838 B2 JP 7266838B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- subscriber
- vocabulary
- analysis target
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
Description
本実施の形態は以上の構成を備えており、次のように動作する。以下の例では、予め、所定の情報発信サイトにおいて登録された、ブランドA,B,Cのアカウントを分析対象アカウントとするものとする。
アカウントAのフォロワー:α,β
アカウントBのフォロワー:γ,ε
アカウントCのフォロワー:κ,μ
となっているものとする。
αの第1の投稿に含まれるタグ(以下これをα1などと略して記す):「pink」,「love」,「cosmetic」,「l4l(like for like)」
α2:「cosmetic」,「fashion」,「l4l(like for like)」
…
β1:「summer」,「white」,「style」
β2:「pink」,「lovely」,「cute」
…
γ1:「son」,「mama」,「school」
γ2:「mother」,「family」
…
ε1:「daughter」,「son」,「kindergarten」
ε2:「children」,「sibling」,「family」
…
κ1:「work」,「coffee」,「f4f(follow for follow)」
κ2:「fashionable」,「black」,「simple」,「f4f(follow for follow)」
…
μ1:「trend」,「mode」,「white」,「fff(follow for follow)」
μ2:「mode」,「fff(follow for follow)」
…
アカウントAの購読者関係情報:「pink」,「love」,「cosmetic」,「l4l(like for like)」,「cosmetic」,「fashion」,「l4l(like for like)」,「summer」,「white」,「style」,「pink」,「lovely」,「cute」…
アカウントBの購読者関係情報:「son」,「mama」,「school」,「mother」,「family」,「daughter」,「son」,「kindergarten」,「children」,「sibling」,「family」…
というように取得されることになる。なおここでは重複を許して取得しているが、重複は排除することとしてもよい。
アカウントA:「1」(「pink」が属するクラスタの代表ベクトルを表す情報、以下同様),「1」,「3」,「4」,「3」,「5」,「4」,「6」,「6」,「5」,「1」,「1」,「1」…
アカウントB:「2」,「2」,「2」,「2」,「7」,「2」,「2」,「2」,「7」,「7」,「7」…
などといった代表ベクトルを表す情報のリスト(クラスタ情報リスト)が得られることとなる。
アカウントA:Vaca=(Ca(Vrep_1),Ca(Vrep_2)…)
アカウントB:Vacb=(Cb(Vrep_1),Cb(Vrep_2)…)
といったように演算される。ここで、Cp(V)は、アカウントPについて得られたクラスタの代表ベクトルVの数(カウント数)を表す。つまり、Ca(Vrep_1)は、アカウントAについての購読者関係情報に含まれる語彙情報のうち、クラスタ番号「1」に属している語彙情報の数(クラスタ情報リストに、クラスタ番号「1」の代表ベクトルが現れた数)を表す。また、各分析対象アカウントを特徴づけるベクトルの第i番目の成分は、いずれも共通の、i番目のクラスタの代表ベクトルのカウント数を表すものとする。
情報分析装置1は、分析対象アカウントとして指定された複数のブランドの一対の組み合わせごとに上記の処理を繰り返して行う。
ブランドA,B間:ベクトルVaca,Vacbの距離の情報、
ブランドA,C間:ベクトルVaca,Vaccの距離の情報、
ブランドB,C間:ベクトルVacb,Vaccの距離の情報
をそれぞれのブランド間の類似性を表す情報として出力する。
ここまでの説明において、購読者関係情報は、情報発信サイトにおいて投稿された文字列の情報であるものとしたが、本実施の形態は、これらが文字列である場合に限られない。
さらに、上述の例では、制御部11が推定処理部22の判定処理部41として動作する際に、指定された分析対象アカウントごとに、その購読者の購読者関係情報を取得し、取得した購読者関係情報に含まれる語彙情報ごとに、語彙情報が属するクラスタの代表ベクトルの情報Vcxを取り出していたが、本実施の形態では、購読者関係情報に含まれる語彙情報自体の出現頻度の情報をさらに用いてもよい。
本実施の形態によれば、情報発信サイトにおける複数の分析対象アカウントの類似性により評価するので、売り上げの情報が得られない場合などであっても組織間、やブランド間の類似性、あるいは、組織とユーザ(人)との間の類似性など、複数のアカウントの間の類似性を、当該複数のアカウントが同質もの(例えばブランドのみ、組織のみ、など)からなっていても、また、異質なものを含む(例えばブランドとユーザ、組織とユーザなど)場合であっても、数値的に評価できる。
Claims (4)
- 所定の情報発信サイトにおける複数の分析対象アカウントについてのそれぞれの購読者の情報を取得する手段と、
前記購読者ごとに、当該購読者の投稿に含まれる情報を、当該購読者に関係する購読者関係情報として収集する収集手段と、
当該収集した購読者関係情報に含まれる語彙情報を用いてベクトル値を生成する手段であって、意味または用法が互いに類似する複数の語彙情報のベクトル値が互いに近接するよう機械学習したモデルを用いて、前記語彙情報に係るベクトル値を得る手段と、
前記語彙情報を、対応するベクトル値を用いてクラスタリングする分類手段と、
分析対象アカウントの購読者ごとの前記購読者関係情報に含まれる語彙情報に係るクラスタの出現頻度の情報を得て、当該得られた出現頻度の情報を用いて、一対の分析対象アカウント間の類似性を判定する判定手段と、
前記判定した一対の分析対象アカウント間の類似性を出力する手段と、
を含む情報分析装置。 - 請求項1に記載の情報分析装置であって、
前記ベクトル値を生成する手段は、購読者関係情報に含まれる語彙情報の投稿ごとの出現頻度と、購読者関係情報に含まれる語彙情報の出現する投稿の数とに基づいて、投稿によらずに頻出する語彙情報を除外してベクトル値を得る情報分析装置。 - 請求項1または2に記載の情報分析装置であって、
前記購読者関係情報は、投稿に含まれるタグである情報分析装置。 - コンピュータを、
所定の情報発信サイトにおける複数の分析対象アカウントについてのそれぞれの購読者の情報を取得する手段と、
前記購読者ごとに、当該購読者の投稿に含まれる情報を、当該購読者に関係する購読者関係情報として収集する収集手段と、
当該収集した購読者関係情報に含まれる語彙情報を用いてベクトル値を生成する手段であって、意味または用法が互いに類似する複数の語彙情報のベクトル値が互いに近接するよう機械学習したモデルを用いて、前記語彙情報に係るベクトル値を得る手段と、
前記語彙情報を、対応するベクトル値を用いてクラスタリングする分類手段と、
分析対象アカウントの購読者ごとの前記購読者関係情報に含まれる語彙情報に係るクラスタの出現頻度の情報を得て、当該得られた出現頻度の情報を用いて、一対の分析対象アカウント間の類似性を判定する判定手段と、
前記判定した一対の分析対象アカウント間の類似性を出力する手段と、
として機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018160577A JP7266838B2 (ja) | 2018-08-29 | 2018-08-29 | 情報分析装置及びプログラム |
PCT/JP2019/033780 WO2020045526A1 (ja) | 2018-08-29 | 2019-08-28 | 情報分析装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018160577A JP7266838B2 (ja) | 2018-08-29 | 2018-08-29 | 情報分析装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035148A JP2020035148A (ja) | 2020-03-05 |
JP7266838B2 true JP7266838B2 (ja) | 2023-05-01 |
Family
ID=69643590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018160577A Active JP7266838B2 (ja) | 2018-08-29 | 2018-08-29 | 情報分析装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7266838B2 (ja) |
WO (1) | WO2020045526A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035683A (zh) * | 2020-09-30 | 2020-12-04 | 北京百度网讯科技有限公司 | 用户交互信息处理模型生成方法和用户交互信息处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015138500A (ja) | 2014-01-24 | 2015-07-30 | 株式会社Nttドコモ | 情報提示システムおよび情報提示方法 |
US20180129940A1 (en) | 2016-11-08 | 2018-05-10 | Facebook, Inc. | Systems and methods for similar account determination |
JP2018124966A (ja) | 2017-02-01 | 2018-08-09 | 富士通株式会社 | ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキング |
-
2018
- 2018-08-29 JP JP2018160577A patent/JP7266838B2/ja active Active
-
2019
- 2019-08-28 WO PCT/JP2019/033780 patent/WO2020045526A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015138500A (ja) | 2014-01-24 | 2015-07-30 | 株式会社Nttドコモ | 情報提示システムおよび情報提示方法 |
US20180129940A1 (en) | 2016-11-08 | 2018-05-10 | Facebook, Inc. | Systems and methods for similar account determination |
JP2018124966A (ja) | 2017-02-01 | 2018-08-09 | 富士通株式会社 | ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキング |
Non-Patent Citations (5)
Title |
---|
三村 乃那、外1名,SNSからファン層は見えるのか?,第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [online] ,日本,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2017年07月06日,p.1-7,Internet<URL:http://db-event.jpn.org/deim2017/papers/317.pdf> |
和田 なぎさ、外2名,Twitterにおけるアカウント乗っ取りによるスパムツイートの検出,第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会),日本,電子情報通信学会データ工学研究専門委員会 日本デー,2013年06月05日,p.1-6 |
山下 晃弘、外3名,SNSプライバシー保護とリスク管理の検討,情報処理学会 デジタルプラクティス,日本,情報処理学会,2016年11月07日,第6巻,第2号,p.150-158 |
石川 尚季、外4名,Q&Aサイトにおいて1つの質問に対して複数のアカウントを用いて複数の回答を投稿するユーザの検出,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2011年01月20日,第110巻,第400号,p.1-6 |
落合 桂一、外4名,Twitter投稿文章とプロフィール情報を用いたPOI公式アカウント分類手法,情報処理学会 論文誌(トランザクション) データベース(TOD),日本,情報処理学会,2017年03月16日,第9巻,第2号,p.11-22 |
Also Published As
Publication number | Publication date |
---|---|
WO2020045526A1 (ja) | 2020-03-05 |
JP2020035148A (ja) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107424043B (zh) | 一种产品推荐方法及装置,电子设备 | |
Zhao et al. | Affective image content analysis: Two decades review and new perspectives | |
Guo et al. | Ms-celeb-1m: A dataset and benchmark for large-scale face recognition | |
US20240086971A1 (en) | Systems, methods, and storage media for training a machine learning model | |
CN105612514B (zh) | 通过将语境线索与图像关联进行图像分类的系统和方法 | |
US10635952B2 (en) | Cognitive analysis and classification of apparel images | |
CN105975558B (zh) | 建立语句编辑模型的方法、语句自动编辑方法及对应装置 | |
US20160364419A1 (en) | Image and text data hierarchical classifiers | |
JP2016181196A (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20070233622A1 (en) | Method and system for computerized searching and matching using emotional preference | |
US11521013B2 (en) | Systems and methods for providing personalized product recommendations using deep learning | |
JP6569183B2 (ja) | 情報処理装置、方法及びプログラム | |
TWI705411B (zh) | 社交業務特徵用戶的識別方法和裝置 | |
Zhong et al. | Predicting pinterest: Automating a distributed human computation | |
Dellagiacoma et al. | Emotion based classification of natural images | |
Kaya et al. | Multimodal personality trait analysis for explainable modeling of job interview decisions | |
CN110968780B (zh) | 页面内容推荐方法、装置、计算机设备和存储介质 | |
JP7266838B2 (ja) | 情報分析装置及びプログラム | |
KR102126911B1 (ko) | KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법 | |
Demidova et al. | Semantic image-based profiling of users’ interests with neural networks | |
JP6696270B2 (ja) | 情報提供サーバ装置、プログラム及び情報提供方法 | |
US11089086B1 (en) | Intelligent routing of media items | |
Stacchio et al. | Applying deep learning approaches to mixed quantitative-qualitative analyses | |
Kim et al. | # ShoutYourAbortion on Instagram: exploring the visual representation of hashtag movement and the public’s responses | |
US11947616B2 (en) | Systems and methods for implementing session cookies for content selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220726 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7266838 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |