JP5602980B1 - 情報処理システム、情報処理方法、および情報処理プログラム - Google Patents

情報処理システム、情報処理方法、および情報処理プログラム Download PDF

Info

Publication number
JP5602980B1
JP5602980B1 JP2014531034A JP2014531034A JP5602980B1 JP 5602980 B1 JP5602980 B1 JP 5602980B1 JP 2014531034 A JP2014531034 A JP 2014531034A JP 2014531034 A JP2014531034 A JP 2014531034A JP 5602980 B1 JP5602980 B1 JP 5602980B1
Authority
JP
Japan
Prior art keywords
posted
onomatopoeia
information processing
sentence
review
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014531034A
Other languages
English (en)
Other versions
JPWO2015129044A1 (ja
Inventor
圭司 新里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5602980B1 publication Critical patent/JP5602980B1/ja
Publication of JPWO2015129044A1 publication Critical patent/JPWO2015129044A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Abstract

一実施形態に係る情報処理システムは、特定部および抽出部を備える。特定部は、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する。抽出部は、複数の投稿レビューから、内容語を含む投稿文を抽出する。一般に、オノマトペを含む投稿文または投稿レビューには投稿者の実体験が記述されることが多い。オノマトペと共起しやすい内容語を含む投稿文を抽出することで、ユーザの実体験が記述された投稿文を効率的に抽出することができる。

Description

本発明の一側面は、投稿レビューを処理する情報処理システム、情報処理方法、および情報処理プログラムに関する。
インターネット上に投稿された文または文章が他人の判断材料として用いられる場合がある。例えば、商品を利用したユーザによって書き込まれた商品レビューは、購入する商品をこれから決めようとする他のユーザにとっての判断材料となる。
下記特許文献1には、ユーザからの投稿を利用して商品情報を管理するシステムが記載されている。例えば、このシステムはユーザの端末から商品利用情報(感想などの投稿)を受け付け、その商品利用情報を用いて、ユーザが投稿に係る商品の購入者であるかを認証する。
特開2007−141051号公報
しかし、投稿レビューの内容は様々であり、そのすべてが他人の判断材料として使えるわけではない。例えば、投稿される商品レビューの中には、単に店舗への要望を述べたものや、商品の到着を待ち望んでることを述べたに過ぎないものなどがある。このように投稿レビューの内容は様々であり、そのすべてが他人の判断材料として使えるわけではない。そこで、ユーザの実体験が記述された投稿レビューを効率的に抽出することが求められている。
本発明の一側面に係る情報処理システムは、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、複数の投稿レビューから、内容語を含む投稿文を抽出する抽出部とを備える。
本発明の一側面に係る情報処理方法は、プロセッサを備える情報処理システムにより実行される情報処理方法であって、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定ステップであって、各投稿レビューが1以上の投稿文を含む、該特定ステップと、複数の投稿レビューから、内容語を含む投稿文を抽出する抽出ステップとを含む。
本発明の一側面に係る情報処理プログラムは、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、複数の投稿レビューから、内容語を含む投稿文を抽出する抽出部としてコンピュータを機能させる。
このような側面によれば、オノマトペと共に用いられる可能性がある内容語が特定され、続いて、その内容語を含む投稿文が抽出される。本発明者らは、オノマトペを含む文または文章に出現しやすい内容語は、ユーザの実体験を記述する際に用いられやすいとの知見を得た。したがって、その知見に基づく上記側面により、ユーザの実体験が記述された投稿レビューを効率的に抽出することが期待できる。
本発明の一側面によれば、ユーザの実体験が記述された投稿レビューを効率的に抽出することができる。
実施形態に係る情報処理システムを構成するコンピュータのハードウェア構成を示す図である。 実施形態に係る情報処理システムの機能構成を示すブロック図である。 単語の共起度の例を示す図である。 単語の組の共起度の例を示す図である。 投稿文のスコアの例を示す図である。 投稿文のスコアの例を示す図である。 実施形態に係る情報処理システムの動作を示すフローチャートである。 実施形態に係る情報処理プログラムの構成を示す図である。
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
まず、図1〜6を用いて、実施形態に係る情報処理システム10の機能および構成を説明する。情報処理システム10は、ユーザの実体験が記述された可能性がある投稿文または投稿レビューを抽出するコンピュータシステムである。
本明細書における「ユーザの実体験」とは、投稿者本人による体験したことであり、具体的な体験の種類は限定されない。例えば、ユーザが商品を使用することは、該ユーザにとっての実体験の一つである。なお、本明細書における「商品」とは、有償または無償で取引され得る任意の有体物または無体物である。有体物は何ら限定されるものではなく、動産でも不動産でもよい。また、無体物も何ら限定されるものではなく、例えば任意のサービスの提供が考えられる。このように、商品の種類は何ら限定されないので、商品の「使用」の態様も何ら限定されない。例えば、商品が食品であれば、その商品の「使用」はその食品を食べることを含む。また、商品が宿泊施設の利用の権利であれば、その商品の「使用」はその施設に泊まることを含む。
本明細書における「投稿レビュー」とは、投稿者により作成された、投稿者以外のユーザを含むグループに公開される文または文章である。グループの態様は限定されず、誰でも参加可能なグループ(いわゆる、オープンなグループ)でもよいし、特定の者のみが参加可能なグループ(いわゆる、クローズドな(closed)グループ)でもよい。例えば、インターネット上のあるサイトにおいて誰でも文を投稿したり閲覧したりすることができるのであれば、それはオープンなグループである。別の例で、インターネット上のあるサイトにおいてログインなどの手続をしないと文の投稿や閲覧ができないのであれば、それはクローズドなグループである。投稿レビューの内容は限定されない。例えば、ある商品に対するコメント(いわゆる、商品レビュー)は投稿レビューの一種であるし、ある記事に対するコメントも投稿レビューの一種である。
上記の通り、ユーザの実体験の内容は何ら限定されないので、「ユーザの実体験が記述された可能性がある投稿レビュー」が表す内容も限定されない。例えば、その投稿レビューは、ユーザが実際に商品を使用した感想、すなわち、商品の使用感を示すものであり得る。あるいは、その投稿レビューは、ユーザが実際に祭りやコンサートなどのイベントに参加した感想を示すものであり得る。
本明細書における「投稿文」とは、投稿レビューに含まれる一つの文のことである。上記の通り投稿レビューは文または文章であるから、一つの投稿レビューは一または複数の投稿文を含み得る。
情報処理システム10は、ユーザの実体験が記述された可能性がある投稿文または投稿レビューを抽出するためにオノマトペ(onomatopoeia)に着目する。オノマトペとは、擬音語、擬態語、および擬声語を含む概念である。擬声語が擬音語および擬態語の総称であるという説と、擬声語は擬音語の一部である説とが見受けられるが、いずれにしても、本明細書におけるオノマトペは、擬音語、擬態語、および擬声語を含む概念である。このオノマトペは副詞として用いられることが多いので、情報処理システム10は副詞として用いられるオノマトペのみを処理してもよい。
例えば、「ケーキのふわふわの感じや色合いなどが気に入りました」という文は、「ふわふわ(fuwafuwa)」(英語の“soft”に相当する)というオノマトペを含む。そして、この文からは、投稿者自身がチーズケーキを実際に目にしたかまたは食べたことが推定され、そのチーズケーキに対するユーザの実際の感想が表れているといえる。一方、「このケーキはオンラインショップや物産展などで何度も購入しているので、味はわかっています」という文はオノマトペを含まない。そして、この文そのものからは、投稿者自身がそのチーズケーキを実際に見たり食べたりしたとは言えず、そのチーズケーキに対するユーザの実際の感想は表れていないといえる。情報処理システム10はオノマトペを手掛かりにこれらのような投稿文を処理して、どの投稿レビューがユーザの実体験を表しているかを推定する。
情報処理システム10は1台以上のコンピュータを備え、複数台のコンピュータを備える場合には、後述する情報処理システム10の各機能要素は分散処理により実現される。個々のコンピュータの種類は限定されない。例えば、据置型または携帯型のパーソナルコンピュータ(PC)を用いてもよいし、ワークステーションを用いてもよいし、高機能携帯電話機(スマートフォン)や携帯電話機、携帯情報端末(PDA)などの携帯端末を用いてもよい。あるいは、様々な種類のコンピュータを組み合わせて情報処理システム10を構築してもよい。複数台のコンピュータを用いる場合には、これらのコンピュータはインターネットやイントラネットなどの通信ネットワークを介して接続される。
情報処理システム10内の個々のコンピュータ100の一般的なハードウェア構成を図1に示す。コンピュータ100は、オペレーティングシステムやアプリケーション・プログラムなどを実行するCPU(プロセッサ)101と、ROM及びRAMで構成される主記憶部102と、ハードディスクやフラッシュメモリなどで構成される補助記憶部103と、ネットワークカードあるいは無線通信モジュールで構成される通信制御部104と、キーボードやマウスなどの入力装置105と、ディスプレイやプリンタなどの出力装置106とを備える。当然ながら、搭載されるハードウェアモジュールはコンピュータ100の種類により異なる。例えば、据置型のPCおよびワークステーションは入力装置および出力装置としてキーボード、マウス、およびモニタを備えることが多いが、スマートフォンはタッチパネルが入力装置および出力装置として機能することが多い。
後述する情報処理システム10の各機能要素は、CPU101または主記憶部102の上に所定のソフトウェアを読み込ませ、CPU101の制御の下で通信制御部104や入力装置105、出力装置106などを動作させ、主記憶部102または補助記憶部103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部102または補助記憶部103内に格納される。
情報処理システム10の各機能要素を説明する前に、この情報処理システム10が参照する各データベースについて説明する。
オノマトペ辞書21は、オノマトペの集合を記憶するデータベース(記憶装置または記憶部)である。オノマトペ辞書21の具体的な実装方法は限定されず、例えばオノマトペ辞書21は関係データベースあるいはテキストファイルとして用意されてもよい。また、オノマトペ辞書21の設置場所は限定されず、例えば、オノマトペ辞書21は情報処理システム10の内部に存在してもよいし、情報処理システム10とは異なる他のコンピュータシステム内に存在してもよい。オノマトペ辞書21が他の情報処理システム内にある場合には、情報処理システム10は通信ネットワークを介してオノマトペ辞書21にアクセスすればよい。
日本語のオノマトペの辞書を用意する場合には、個々の言葉についての表記揺れを考慮して、一つの単語に対して複数の表記をオノマトペ辞書21に記憶してもよい。例えば、上記の「ふわふわ(fuwafuwa)」という擬態語は、平仮名で表記される場合もあれば片仮名で表記される場合もある。このような場合には、その言葉の平仮名表記および片仮名表記の双方をオノマトペ辞書21に記憶してもよい。
投稿データベース22は、投稿レビューの集合を記憶するデータベース(記憶装置または記憶部)である。投稿データベース22の具体的な実装方法は限定されず、投稿データベース22は関係データベースとして用意されてもよいしテキストファイルの集合として用意されてもよい。また、投稿データベース22の設置場所は限定されず、例えば、投稿データベース22は情報処理システム10の内部に存在してもよいし、情報処理システム10とは異なる他のコンピュータシステム内に存在してもよい。投稿データベース22が他のコンピュータシステム内にある場合には、情報処理システム10は通信ネットワークを介してオノマトペ辞書21にアクセスすればよい。
投稿データベース22は、1以上の投稿文からなる投稿レビューを受け付けるが、投稿レビューが投稿データベース22に記憶される手順は何ら限定されない。例えば、投稿データベース22は、ユーザが何らかのウェブサイトまたはアプリケーション・ソフトウェア上で書き込まれた投稿レビューを記憶してもよい。この具体例として、オンライン・ショッピング・サイト上で書き込まれた商品レビューを記憶する態様が挙げられる。あるいは、投稿データベース22は、収集されたアンケート結果を管理者がデータ化したものを記憶してもよい。いずれにしても、情報処理システム10は投稿データベース22に記憶された投稿レビューを処理するのであって、その投稿レビューがどのような経路で投稿データベース22に登録されたかを考慮する必要はない。
投稿データベース22は、投稿レビューを、レビューの対象となった物(本明細書ではこれを「レビュー対象物」という)の属性と関連付けて記憶してもよい。例えば投稿データベース22が商品レビューを記憶するのであれば、その商品レビュー(投稿レビュー)は、レビュー対象物である商品の属性(例えば、商品を一意に特定する商品ID、商品名、商品カテゴリ、販売者など)と関連付けられてもよい。
図2に示すように、情報処理システム10は機能的構成要素として取得部11、特定部12、および抽出部13を備える。
取得部11は、オノマトペを含む複数の投稿文を取得する機能要素である。オノマトペを含む投稿文を取得するためには何がオノマトペかを知る必要がある。そこで、取得部11はオノマトペ辞書21を参照してオノマトペのリストを取得する。
続いて、取得部11は投稿データベース22から投稿レビューを読み出す。このとき、取得部11はレビュー対象物の特定の属性に対応する投稿レビューのみを読み出してもよい.例えば、取得部11は、ある特定の商品カテゴリ(例えば、「チーズケーキ」や「シャンプー」など)に対応する商品レビュー(投稿レビュー)のみを読み出してもよい。あるいは、取得部11はレビュー対象物の属性にかかわらずすべての投稿レビューを読み出してもよい。
読み出した一つの投稿レビューが複数の投稿文を含む場合には、取得部11は予め指定された区切り文字を手掛かりにその投稿レビューを複数の投稿文に分割する。なお、区切り文字の種類は限定されない。例えば、取得部11は、句点や疑問符などの符号の他に、文の終わりにおいて慣用的に用いられている文字列(例えば顔文字)を区切り文字として用いてもよい。
取得部11は読み出した投稿レビューのすべてを1以上の投稿文に分割し、個々の投稿文に、該投稿文が何らかのオノマトペを含むか否かを示すフラグを設定する。例えば、取得部11は、何らかのオノマトペを含む投稿文にはフラグ「1」を設定し、オノマトペを全く含まない投稿文にはフラグ「0」を設定する。このように、オノマトペを含む投稿文とオノマトペを含まない投稿文とを取得すると、取得部11はこれらの投稿文を特定部12に出力する。
特定部12は、オノマトペを含む1以上の投稿文のそれぞれから、そのオノマトペと共起する表現を特定する(言い換えると、同一の投稿文の中でオノマトペと共起する表現を特定する)機能要素である。本明細書における「表現」とは1以上の単語の組合せであり、したがって、ある表現が1単語から成る場合もあれば、一つの文中に存在する2以上の単語から成る場合もある。本明細書における「オノマトペと共起する表現」とは、何らかのオノマトペと共に現れる頻度が一定のレベル以上の表現のことである。一例として、特定部12は、機能語を特定することなく、オノマトペと共起する内容語を特定してもよい。あるいは、特定部12は内容語または限られた機能語から成る表現を特定してもよい。
なお、内容語とは、文法的な機能をほとんど持たず、主として語彙的意味を表す語である。内容語は、それ自体で独立して意味のある事物、概念、事象、行動などを表す語であるともいうことができる。内容語の例として、名詞、動詞、形容詞、および副詞が挙げられる。本明細書において、内容語は1以上の単語の組合せであり得、したがって、ある内容語が1単語から成る場合もあれば、一つの文中に存在する2以上の単語から成る場合もある。内容語が2以上の単語から成る場合には、それらの単語は文中で連続して並んでもよいし互いに離れた場所に存在してもよい。
また、機能語とは、文を成立させるための文法的な機能を果たすが、それ自体で独立して意味のある事物・概念・事象・行動を表すわけではない語である。機能語の例として、前置詞、接続詞、助動詞、冠詞、関係詞が挙げられる。
機能語を排除して内容語のみを処理することで、ユーザが興味を持つであろう語句から、オノマトペと共起するものを効率的に特定することができる。また、処理対象の語句が減るので、情報処理システム10の処理負荷(例えばプロセッサの使用率やメモリの消費量など)を下げることができる。以下では、特定部12が、オノマトペと共起する内容語を特定する処理を例示する。
特定部12は、入力されたすべての投稿文に対して形態素解析を実行することで個々の投稿文を単語分割する。この処理により、特定部12は単語のリストを得る。続いて、特定部12はその単語リストから得られる各内容語について、オノマトペとの共起度(以下では単に「共起度」ともいう)を求める。
例えば、特定部12は個々の単語について共起度を求めてもよく、この場合には、単語間の共起度の差が出やすくなる。あるいは、特定部12は2以上の単語から成る組について共起度を求めてもよい。単語の組合せに対して共起度を求めることで、例えば、「おいしいです」などのような肯定的な表現についての共起度と、「おいしいとは思わない」などのような否定的な表現についての共起度とを区別することができる。いずれにしても、オノマトペとの共起度を求める内容語の態様は限定されない。どのような内容語についてオノマトペとの共起度を求めるかは、ユーザの実体験が記述された可能性がある投稿レビューとして最終的にどのような投稿レビューを得たいかを考慮して決めればよい。
本明細書における「オノマトペとの共起度」とは、ある内容語が何らかのオノマトペと共に現れる頻度を示す数値であり、共起の強さを示す数値であるともいうことができる。ある内容語Eaの共起度が別の内容語Ebの共起度よりも高いということは、内容語Eaの方が内容語Ebよりオノマトペと共に現れやすいことを意味する。
例えば、ある1単語wの共起度S(w)は下記式で求めることができる。
S(w)=log[P(w,O)/{P(w)P(O)}]
P(w,O)は、取得部11から入力された投稿文のすべて(オノマトペを含む投稿文とオノマトペを含まない投稿文との集合)のうち、単語wと何らかのオノマトペとの双方を含む投稿文が存在する確率である。単純な例を用いて説明すると、全部で10個の投稿文があるとして、そのうち2個の投稿文に単語wおよびある特定のオノマトペOaが含まれ、別の1個の投稿文に単語wおよび別のオノマトペObが含まれ、さらに別の1個の投稿文には単語wおよびさらに別のオノマトペOcが含まれるならば、P(w,O)は(2+1+1)/10=0.4である。P(w)は、入力されたすべての投稿文のうち、単語wを含む投稿文が存在する確率である。P(O)は、入力されたすべての投稿文のうち、何らかのオノマトペを含む投稿文が存在する確率である。P(w,O)およびP(O)に関して補足すると、これらの確率の計算においては、個々のオノマトペを区別していないことに注意されたい。
あるいは、ある1単語wの共起度S(w)を下記式で求めてもよい。
S(w)=log(coocw.O)×log[P(w,O)/{P(w)P(O)}]
ここで、coocw.Oとは、単語wと何らかのオノマトペとの双方を含む投稿文の個数である。その個数を考慮することで、何らかのオノマトペと共起する単語のうち出現頻度が高いものの共起度を他の単語よりも優先して高く設定することができる。
内容語が複数の単語から成る組である場合も、特定部12は1単語の場合と同様の論理で共起度を求めることができる。例えば、ある複数の単語から成る組wの共起度S(w)は下記式で求めることができる。
S(w)=log[P(w,O)/{P(w)P(O)}]
P(w,O)は、入力されたすべての投稿文のうち、単語の組wと何らかのオノマトペとの双方を含む投稿文が存在する確率である。P(w)は、入力されたすべての投稿文のうち、単語の組wを含む投稿文が存在する確率である。P(O)は、入力されたすべての投稿文のうち、何らかのオノマトペを含む投稿文が存在する確率である。ここでも、P(w,O)およびP(O)の計算においては個々のオノマトペを区別していないことに注意されたい。
あるいは、ある複数の単語から成る組wの共起度S(w)を下記式で求めてもよい。
S(w)=log(coocws.O)×log[P(w,O)/{P(w)P(O)}]
ここで、coocws.Oとは、単語の組wと何らかのオノマトペとの双方を含む投稿文の個数である。その個数を考慮することで、出現頻度が高い単語の組の共起度を優先して高く設定することができる。
このように、共起度の計算方法は限定されないが、いずれにしても、特定部12は処理対象のすべての内容語についてオノマトペとの共起度を求める。共起度の計算結果の一例を図3,4に示す。
図3は、商品カテゴリ「チーズケーキ」に対応する商品レビューから得られた各単語の共起度と、商品カテゴリ「シャンプー」に対応する商品レビューから得られた各単語の共起度とについての例である。チーズケーキの例に関していうと、「めちゃくちゃ」(absolutely)や「ぴったり」(suitable)などの単語はオノマトペと共に現れやすく、「物産」や「ラッキー」などの単語はオノマトペと共に現れにくいことがわかる。シャンプーの例における「ごわごわ(gowagowa)」(英語の“rough”に相当する)はオノマトペであるとともに形容詞でもある。この単語に対して共起度が算出された理由は、特定部12が、形態素解析によりその単語を形容詞として判定し、他のオノマトペとの共起度を計算したからである。このように、オノマトペが形容詞や副詞、名詞などの何らかの品詞として判定されて、共起度算出の対象となることがあり得る。
図4は、商品カテゴリ「酒」に対応する商品レビューから得られた単語の組の共起度の例である。この例から、動詞「冷やす」と動詞「飲む」との組や、名詞「辛口」と形容詞「おいしい」との組などはオノマトペと共に現れやすく、名詞「プレゼント」と名詞「購入」との組などはオノマトペと共に現れにくいことがわかる。
特定部12は、各単語の共起度を、入力された投稿文と共に抽出部13に出力する。
抽出部13は、オノマトペと共起する内容語を含む投稿文を抽出する機能要素である。「オノマトペと共起する内容語を含む投稿文」は、ユーザの実体験が記述された可能性がある投稿文であると言い換えることができる。抽出部13は、入力された各投稿文sについて、ユーザの実体験が記述された可能性があるか否かを示すスコアScore(s)を求める。Score(s)が相対的に高い投稿文はユーザの実体験を表すと推定され、Score(s)が相対的に低い投稿文はユーザの実体験を表していないと推定される。
各単語の共起度を求めた場合には、ある投稿文sについてのScore(s)は、その投稿文sに含まれる単語wの共起度S(w)を集計することで得られる。例えば、Score(s)は下記式で表される。
Score(s)=ΣS(w)
単語の組の共起度を求めた場合には、ある投稿文sについてのScore(s)は、その投稿文sに含まれる単語の組wの共起度S(w)を集計することで得られる。例えば、Score(s)は下記式で表される。
Score(s)=ΣS(w
なお、ある投稿文sの中にある特定の単語wが複数回現れる場合には、抽出部13はその単語wの共起度を一度だけ集計する。同様に、ある投稿文sの中にある特定の単語の組wsaが複数回現れる場合には、抽出部13はその組wsaの共起度を一度だけ集計する。このように、同じ内容語が複数回出現する場合にはその内容語の共起度を一度だけ集計処理することで、投稿文のスコアが特定の内容語の出現回数により大きくばらつくことを防止できる。
なお、抽出部13は、投稿文sに含まれる単語wの共起度S(w)を集計する際に加算以外の演算を用いてもよい。
各投稿文のスコアを求めると、抽出部13はオノマトペと共起する内容語を含む投稿文を抽出する。例えば、抽出部13は所定の閾値を予め保持しており、スコアがその閾値以上である投稿文を、オノマトペと共起する内容語を含む投稿文として抽出する。この閾値は任意に設定してよく、例えば、0でもよいし、2.0でもよいし、−1.0でもよい。また、この閾値はレビュー対象物の属性毎に異ならせてもよいし、その属性に関係なく統一させてもよい。
スコアの計算結果の一例を図5,6に示す。図5は、商品カテゴリ「チーズケーキ」に対応する商品レビューの文のスコアである。図6は、商品カテゴリ「シャンプー」に対応する商品レビューの文のスコアである。
図5の例において、上記の閾値が1.0であるとする。この場合には、抽出部13は図5の結果から、「チーズケーキはとろけるような食感と濃厚な味わいであり、ブラウニーはナッツの香ばしさとチョコの甘みが濃縮され、どちらもおいしかったです」や「ケーキは口に入れたらとろっとして甘酸っぱく、私好みの味でした」などの投稿文を、オノマトペと共起する内容語を含む投稿文(すなわち、ユーザの実体験を記述した投稿文)として抽出する。また、抽出部13は、「このケーキはオンラインショップや物産展などで何度も購入しているので、味はわかっています」や「このケーキは物産展で購入したことがあり、とっても大好きです」などの投稿文を、オノマトペと共起する内容語を含まない投稿文(すなわち、ユーザの実体験が記述されていない投稿文)として抽出する。
図6の例についても同様に、抽出部13は閾値と各投稿文のスコアとを比較することで、オノマトペと共起する内容語を含む投稿文(例えばスコアが閾値0以上の投稿文)とそのような内容語を含まない投稿文(例えばスコアが閾値0未満の投稿文)とを抽出することができる。
ここで注意すべき点は、抽出部13は、オノマトペを含む投稿文を抽出するのではなく、あくまでも、オノマトペと共起する内容語を含む投稿文を抽出するということである。例えば、図5における「チーズケーキはとろけるような食感と濃厚な味わいであり、ブラウニーはナッツの香ばしさとチョコの甘みが濃縮され、どちらもおいしかったです」という文と、図6における「シャンプーは軽くすすぐだけでよいのか少し不安でしたが、べたつかず良い洗い上がりでした」という文とはオノマトペを含んでいない。しかし、これらの文はスコアが高く、したがって、オノマトペと共起する内容語を含む投稿文として抽出される。
抽出部13は、入力された投稿文のそれぞれに、該投稿文がオノマトペと共起する内容語を含むか否かを確認できるようにするための付加情報を関連付ける。その付加情報は、算出されたスコアであってもよいし、オノマトペと共起する内容語を含むか否かを示すフラグであってもよいし、スコアおよびフラグの双方であってもよい。フラグの例としては、スコアが閾値以上であること(すなわち、投稿文がオノマトペと共起する内容語を含むこと)を意味する「1」と、スコアが閾値未満であること(すなわち、投稿文がオノマトペと共起する内容語を含まないこと)を意味する「0」との組合せが考えられる。
抽出部13は、付加情報が関連付けられた投稿文を抽出結果23として出力する。抽出結果23の出力先は何ら限定されない。例えば、抽出部13は抽出結果23をモニタ上に表示したりプリンタに印刷したりしてもよいし、抽出結果23をテキストファイルに書き出してもよいし、抽出結果23をメモリやデータベースなどの記憶装置(投稿データベース22でもよい)に格納してもよい。抽出結果23の出力態様も何ら限定されず、例えば、抽出部13は付加情報が関連付けられた投稿文のすべてを抽出結果23として出力してもよいし、オノマトペと共起する内容語を含む投稿文のみを抽出結果23として出力してもよい。あるいは、抽出部13は投稿データベース22を参照することで、オノマトペと共起する内容語を含む投稿文が存在する投稿レビューを特定し、特定した投稿レビューを投稿データベース22から読み出して出力してもよい。あるいは、抽出部13はスコアの高い順に投稿文を出力してもよいし、投稿レビュー内の1以上の投稿文のスコアの合計値が高い順に投稿レビューを出力してもよい。このように、抽出結果23の出力先および出力態様は限定されないが、いずれにしても、抽出結果23を参照することで、どの投稿レビューがユーザの実体験を表しているかを知ることができる。
次に、図7を用いて、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。
まず、取得部11がオノマトペ辞書21からオノマトペのリストを読み出すと共に、投稿データベース22から投稿レビューを読み出す(ステップS11)。この際に、取得部11は、レビュー対象物の特定の属性に対応する投稿レビュー(例えば、特定の商品カテゴリに対応する商品レビュー)のみを読み出してもよいし、レビュー対象物の属性にかかわらずすべての投稿レビューを読み出してもよい。続いて、取得部11は各投稿レビューを1以上の投稿文に分割する(ステップS12)。続いて、取得部11は、個々の投稿文に、該投稿文が何らかのオノマトペを含むか否かを示すフラグを設定することで、オノマトペを含む投稿文を特定する(ステップS13)。
続いて、特定部12が、オノマトペを含む1以上の投稿文から、そのオノマトペと共起する内容語を特定する(ステップS14、特定ステップ)。具体的には、特定部12は個々の投稿文を単語分割することで単語のリストを取得し、そのリストから得られる各内容語について、オノマトペとの共起度を求める。上述したように、この共起度の求め方は限定されず、様々な手法が考えられる。
続いて、抽出部13が、オノマトペと共起する内容語を含む投稿文を抽出する(抽出ステップ)。具体的には、抽出部13はまず、各投稿文について、ユーザの実体験が記述された可能性があるか否かを示すスコアを求める(ステップS15)。そして、投稿文のスコアが所定の閾値以上である場合には(ステップS16;YES)、抽出部13はその投稿文を、オノマトペと共起する内容語を含む投稿文として抽出する(ステップS17)。一方、投稿文のスコアが所定の閾値未満である場合には(ステップS16;NO)、抽出部13はその投稿文を、オノマトペと共起する内容語を含まない投稿文として抽出する(ステップS18)。抽出部13は処理対象のすべての投稿文についてステップS16〜S18の処理を実行し(ステップS19参照)、すべての処理を終えると、抽出結果23を出力する(ステップS20)。上述した通り、抽出結果23の出力方法は限定されない。
次に、図8を用いて、情報処理システム10を実現するための情報処理プログラムP1を説明する。
情報処理プログラムP1は、メインモジュールP10、取得モジュールP11、特定モジュールP12、および抽出モジュールP13を備える。
メインモジュールP10は、投稿レビューに関する処理を統括的に制御する部分である。取得モジュールP11、特定モジュールP12、および抽出モジュールP13を実行することにより実現される機能はそれぞれ、上記の取得部11、特定部12、および抽出部13の機能と同様である。
情報処理プログラムP1は、例えば、CD−ROMやDVD−ROM、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。また、情報処理プログラムP1は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
以上説明したように、本発明の一側面に係る情報処理システムは、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、複数の投稿レビューから、内容語を含む投稿文を抽出する抽出部とを備える。
本発明の一側面に係る情報処理方法は、プロセッサを備える情報処理システムにより実行される情報処理方法であって、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定ステップであって、各投稿レビューが1以上の投稿文を含む、該特定ステップと、複数の投稿レビューから、内容語を含む投稿文を抽出する抽出ステップとを含む。
本発明の一側面に係る情報処理プログラムは、記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、複数の投稿レビューから、内容語を含む投稿文を抽出する抽出部としてコンピュータを機能させる。
このような側面によれば、オノマトペと共に用いられる可能性がある内容語が特定され、続いて、その内容語を含む投稿文が抽出される。本発明者らは、オノマトペを含む文または文章に出現しやすい内容語は、ユーザの実体験を記述する際に用いられやすいとの知見を得た。したがって、その知見に基づく上記側面により、ユーザの実体験が記述された投稿レビューを効率的に抽出することが期待できる。
本実施形態を様々な場面に応用することができる。例えば、投稿者の実体験が記述された投稿レビューのみを抽出することで、投稿レビューの閲覧者にとって参考になる蓋然性が高い投稿レビューのみが閲覧者の端末に送信および表示される。したがって、端末とサーバとの間の通信量を削減したり、大きさが限られる端末画面上に多くの有効な投稿レビューを表示したりすることができる。また、閲覧者は所望の投稿レビューを見つけやすくなる。仮に本実施形態をオンライン・ショッピング・サイトでの商品レビューの表示に応用したならば、そのサイトにアクセスした閲覧者は個々の商品のイメージをより具体的につかんで、その商品の購入をより簡単に決断することができ、ひいては、そのサイトの活性化が期待できる。
他の側面に係る情報処理システムでは、特定部が、複数の投稿レビューを分割することで1以上の内容語を取得し、各内容語についてオノマトペとの共起度を求めることで、オノマトペと共起する内容語を特定してもよい。このように共起度という指数を用いることで、オノマトペと共起する内容語を客観的に特定することができる。
他の側面に係る情報処理システムでは、抽出部が、一の投稿文に含まれる内容語の共起度を集計することで該一の投稿文についてのスコアを求め、該スコアが所定の閾値以上の投稿文を抽出してもよい。このように、共起度から得られるスコアという指数を用い、そのスコアを閾値と比較することで、オノマトペと共起する内容語を含む投稿文を客観的に抽出することができる。
他の側面に係る情報処理システムでは、抽出部が、一の投稿文に同じ内容語が複数回出現する場合に、該内容語の共起度を一度だけ集計してもよい。この場合には、投稿文のスコアが特定の内容語の出現回数により大きくばらつくことを防止できる。
他の側面に係る情報処理システムでは、内容語のそれぞれが単語であり、抽出部が、一の投稿文に含まれる単語についての共起度を集計してもよい。この場合には、単語間の共起度の差が出やすくなるので、投稿文のスコアの差も出やすくなる。その結果、ユーザの実体験が記述された投稿文とそうではない投稿文とを区別しやすくなる。
他の側面に係る情報処理システムでは、内容語が複数の単語から成る組であり、抽出部が、一の投稿文に含まれる複数の単語から成る組についての共起度を集計してもよい。この場合には、例えば、肯定的な表現についての共起度と否定的な表現についての共起度とを区別することができる。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
オノマトペ辞書21は、レビュー対象物の属性毎に(例えば商品カテゴリ毎に)用意されてもよいし、そのような属性に関係なく一つのみ用意されてもよい。オノマトペ辞書21をその属性毎に用意する場合には、当然ながら、オノマトペ辞書21から取得するオノマトペの集合と、投稿データベース22から読み出す投稿レビューとの間で、その属性を合わせる必要がある。レビュー対象物の属性に関係なくオノマトペ辞書21を一つのみ用意した場合には、オノマトペ辞書21内のオノマトペの集合は毎回の処理で用いられることになる。
取得部11は、投稿レビューを複数の投稿文に分割せず、オノマトペを含む投稿レビューとオノマトペを含まない投稿レビューとを特定部12に出力してもよい。この場合には、特定部12が共起度S(w)を求めるための変数は以下のように定義される。
P(w,O)…取得部11から入力された投稿レビューのすべて(オノマトペを含む投稿レビューとオノマトペを含まない投稿レビューとの集合)のうち、単語wと何らかのオノマトペとの双方を含む投稿レビューが存在する確率。
P(w)…入力されたすべての投稿レビューのうち、単語wを含む投稿レビューが存在する確率
P(O)…入力されたすべての投稿レビューのうち、何らかのオノマトペを含む投稿レビューが存在する確率
coocw.O…単語wと何らかのオノマトペとの双方を含む投稿レビューの個数。
ある複数の単語から成る組wの共起度S(w)を求める場合も同様に各変数の定義が変更される。
抽出部13は、この変形例においても、投稿文sのそれぞれについてスコア(Score(s))を求めればよい。
10…情報処理システム、11…取得部、12…特定部、13…抽出部、21…オノマトペ辞書、22…投稿データベース、P1…情報処理プログラム、P10…メインモジュール、P11…取得モジュール、P12…特定モジュール、P13…抽出モジュール。

Claims (8)

  1. 記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、
    前記複数の投稿レビューから、前記内容語を含む投稿文を抽出する抽出部と
    を備える情報処理システム。
  2. 前記特定部が、前記複数の投稿レビューを分割することで1以上の前記内容語を取得し、各内容語について前記オノマトペとの共起度を求めることで、前記オノマトペと共起する内容語を特定する、
    請求項1に記載の情報処理システム。
  3. 前記抽出部が、一の投稿文に含まれる前記内容語の前記共起度を集計することで該一の投稿文についてのスコアを求め、該スコアが所定の閾値以上の前記投稿文を抽出する、
    請求項2に記載の情報処理システム。
  4. 前記抽出部が、前記一の投稿文に同じ内容語が複数回出現する場合に、該内容語の共起度を一度だけ集計する、
    請求項3に記載の情報処理システム。
  5. 前記内容語のそれぞれが単語であり、
    前記抽出部が、前記一の投稿文に含まれる前記単語についての前記共起度を集計する、
    請求項3または4に記載の情報処理システム。
  6. 前記内容語が複数の単語から成る組であり、
    前記抽出部が、前記一の投稿文に含まれる前記複数の単語から成る組についての前記共起度を集計する、
    請求項3または4に記載の情報処理システム。
  7. プロセッサを備える情報処理システムにより実行される情報処理方法であって、
    記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定ステップであって、各投稿レビューが1以上の投稿文を含む、該特定ステップと、
    前記複数の投稿レビューから、前記内容語を含む投稿文を抽出する抽出ステップと
    を含む情報処理方法。
  8. 記憶部に記憶された複数の投稿レビューから、1レビューの中でオノマトペと共起する内容語を特定する特定部であって、各投稿レビューが1以上の投稿文を含む、該特定部と、
    前記複数の投稿レビューから、前記内容語を含む投稿文を抽出する抽出部と
    してコンピュータを機能させるための情報処理プログラム。
JP2014531034A 2014-02-28 2014-02-28 情報処理システム、情報処理方法、および情報処理プログラム Active JP5602980B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/055158 WO2015129044A1 (ja) 2014-02-28 2014-02-28 情報処理システム、情報処理方法、および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP5602980B1 true JP5602980B1 (ja) 2014-10-08
JPWO2015129044A1 JPWO2015129044A1 (ja) 2017-03-30

Family

ID=51840428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014531034A Active JP5602980B1 (ja) 2014-02-28 2014-02-28 情報処理システム、情報処理方法、および情報処理プログラム

Country Status (4)

Country Link
US (1) US10007935B2 (ja)
EP (1) EP3113034A4 (ja)
JP (1) JP5602980B1 (ja)
WO (1) WO2015129044A1 (ja)

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5887120A (en) * 1995-05-31 1999-03-23 Oracle Corporation Method and apparatus for determining theme for discourse
US7191115B2 (en) * 2001-06-20 2007-03-13 Microsoft Corporation Statistical method and apparatus for learning translation relationships among words
US20100153107A1 (en) * 2005-09-30 2010-06-17 Nec Corporation Trend evaluation device, its method, and program
JP2007141051A (ja) 2005-11-21 2007-06-07 Scenes:Kk 商品情報を管理する方法及びシステム
JP4930584B2 (ja) * 2007-03-20 2012-05-16 富士通株式会社 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム
US20100174739A1 (en) * 2007-03-30 2010-07-08 Albert Mons System and Method for Wikifying Content for Knowledge Navigation and Discovery
KR100925376B1 (ko) * 2007-09-12 2009-11-09 엔에이치엔(주) 댓글 표시 제어 방법, 및 그 방법의 구현을 위한 시스템 및컴퓨터 판독 가능한 기록 매체
WO2009110550A1 (ja) * 2008-03-06 2009-09-11 日本電気株式会社 属性抽出方法、システム及びプログラム
US8572093B2 (en) * 2009-01-13 2013-10-29 Emc Corporation System and method for providing a license description syntax in a software due diligence system
JP5382651B2 (ja) * 2009-09-09 2014-01-08 独立行政法人情報通信研究機構 単語対取得装置、単語対取得方法、およびプログラム
NZ599047A (en) * 2009-09-26 2013-02-22 Sajari Pty Ltd Document analysis and association system and method
US9197736B2 (en) * 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
US9684683B2 (en) * 2010-02-09 2017-06-20 Siemens Aktiengesellschaft Semantic search tool for document tagging, indexing and search
JP5398007B2 (ja) * 2010-02-26 2014-01-29 独立行政法人情報通信研究機構 関係情報拡張装置、関係情報拡張方法、及びプログラム
EP2653981A4 (en) * 2010-12-17 2018-01-17 Rakuten, Inc. Natural language processing device, method, and program
US9082040B2 (en) * 2011-05-13 2015-07-14 Microsoft Technology Licensing, Llc Identifying visual contextual synonyms
US8583669B2 (en) * 2011-05-30 2013-11-12 Google Inc. Query suggestion for efficient legal E-discovery
US8671098B2 (en) * 2011-09-14 2014-03-11 Microsoft Corporation Automatic generation of digital composite product reviews
US20130275429A1 (en) * 2012-04-12 2013-10-17 Graham York System and method for enabling contextual recommendations and collaboration within content
WO2013170344A1 (en) * 2012-05-15 2013-11-21 Whyz Technologies Limited Method and system relating to sentiment analysis of electronic content
US9336297B2 (en) * 2012-08-02 2016-05-10 Paypal, Inc. Content inversion for user searches and product recommendations systems and methods
US20140067370A1 (en) * 2012-08-31 2014-03-06 Xerox Corporation Learning opinion-related patterns for contextual and domain-dependent opinion detection

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNG201000459215; 森田 一匡: 'Web上のオノマトペの用例を共起単語で絞り込む用例抽出法' 言語処理学会第16回年次大会発表論文集 , 20100308, 924-927ページ, 言語処理学会 *
CSNG201200271165; 五十嵐 沢馬: 'オノマトペの音象徴を利用した評判分析' 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD-ROM] , 20120313, 715-718ページ, 言語処理学会 *
CSNJ201110061083; 内田 ゆず: 'ブログ記事から抽出した用例文に基づくオノマトペの感情分析' FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文 データ , 20110822, 273-279ページ, 一般社団法人情報処理学会 *
JPN6014034796; 五十嵐 沢馬: 'オノマトペの音象徴を利用した評判分析' 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD-ROM] , 20120313, 715-718ページ, 言語処理学会 *
JPN6014034797; 内田 ゆず: 'ブログ記事から抽出した用例文に基づくオノマトペの感情分析' FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文 データ , 20110822, 273-279ページ, 一般社団法人情報処理学会 *
JPN6014034798; 森田 一匡: 'Web上のオノマトペの用例を共起単語で絞り込む用例抽出法' 言語処理学会第16回年次大会発表論文集 , 20100308, 924-927ページ, 言語処理学会 *

Also Published As

Publication number Publication date
EP3113034A4 (en) 2017-07-12
WO2015129044A1 (ja) 2015-09-03
JPWO2015129044A1 (ja) 2017-03-30
EP3113034A1 (en) 2017-01-04
US20160253720A1 (en) 2016-09-01
US10007935B2 (en) 2018-06-26

Similar Documents

Publication Publication Date Title
Gao et al. The pile: An 800gb dataset of diverse text for language modeling
Rangel et al. Overview of the 3rd Author Profiling Task at PAN 2015
US10572589B2 (en) Cognitive matching of narrative data
KR101005337B1 (ko) 웹 문서에서의 의견 추출 및 분석 장치 및 그 방법
US20080154883A1 (en) System and method for evaluating sentiment
US8880390B2 (en) Linking newsworthy events to published content
JP5547669B2 (ja) 関連語抽出装置、関連語抽出方法、関連語抽出プログラム
KR20100034140A (ko) 인터넷을 이용한 의견 검색 시스템 및 그 방법
JP5942052B1 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
JP5905652B1 (ja) データ評価システム、データ評価方法、およびデータ評価プログラム
JP2007233584A (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
JP2004280180A (ja) 広告用キーワード抽出システム、広告文配信システム、広告用キーワード抽出プログラム及び広告文配信プログラム
JP2019046289A (ja) 評価装置、評価方法、ノイズ除去装置、およびプログラム
Kaddoura et al. Dataset of Arabic spam and ham tweets
JP5602980B1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
Chan et al. Few-shot adaptation works with unpredictable data
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
JP2006293616A (ja) 文書集約方法及び装置及びプログラム
KR20220142705A (ko) 초고속 분석 인공지능을 이용한 실시간 댓글 판단 방법
Lopez Torres Omicron Tweets Sentiment Analysis
JP5942981B2 (ja) 要約作成装置、要約作成方法、およびプログラム
Gawley et al. Comparing the intertextuality of multiple authors using Tesserae: A new technique for normalization
Sharma et al. Extraction, summariz ation and sentiment analysis of trending topics on twitter
US10217143B2 (en) Information processing system, information processing method, and information processing program
Correia Evaluation Metrics for Text and Creation of Writing Tool for Sports Journalism

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140701

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20140701

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20140811

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140820

R150 Certificate of patent or registration of utility model

Ref document number: 5602980

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250