JP2009193133A - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP2009193133A
JP2009193133A JP2008030542A JP2008030542A JP2009193133A JP 2009193133 A JP2009193133 A JP 2009193133A JP 2008030542 A JP2008030542 A JP 2008030542A JP 2008030542 A JP2008030542 A JP 2008030542A JP 2009193133 A JP2009193133 A JP 2009193133A
Authority
JP
Japan
Prior art keywords
information
character string
sentence
unit
presentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008030542A
Other languages
English (en)
Inventor
Mitsuharu Nishimoto
光治 西本
Yoshihisa Uchida
善久 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
C2cube
C2CUBE Inc
Original Assignee
C2cube
C2CUBE Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by C2cube, C2CUBE Inc filed Critical C2cube
Priority to JP2008030542A priority Critical patent/JP2009193133A/ja
Publication of JP2009193133A publication Critical patent/JP2009193133A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】従来、twitter等で記載した情報を用いた効果的な情報の提示をすることはできなかった。
【解決手段】ユーザに提示する情報である提示情報を含む情報である管理情報を格納し得る管理情報格納部と、ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する文章取得部と、前記取得した文章から、当該文章を構成する1以上の用語を取得する文章処理部と、前記管理情報格納部から、前記1以上の用語を用いて取得され得る1以上の提示情報を取得する提示情報取得部と、前記提示情報取得部が取得した提示情報を出力する提示情報出力部を具備する情報処理装置により、ユーザが他人に読んでもらうために入力し、送信した文章と関連する情報を、ユーザに提示できる。
【選択図】図2

Description

本発明は、例えば、ユーザから入力された文を解析し、用語を取得し、用語に対応する情報を送付する情報処理装置等に関するものである。
従来の情報処理システムにおいて、世の中のブログやWeb日記から評判情報を自動抽出することができる技術がある。かかる技術を利用して、キーワードの盛り上がり度(バースト度)、評判分析が可能である(例えば、非特許文献1参照)。
「評判分析」、[online]、[2007年10月26日検索]、インターネット<URL:http://www.itmedia.co.jp/bizid/articles/0705/10/news125.html>
しかしながら、従来の情報処理システムにおいては、twitter、ブログ等で記載した情報に基づいて評判分析はできるが、twitter等で記載した情報を用いた効果的な情報の提示をすることはできない、という課題があった。
さらに具体的には、例えば、ユーザが、twitterにログインし、ひとりごと、つぶやきに相当する文章を入力した場合、リアルタイムに、当該ユーザに共感する他のユーザの情報や、当該ユーザが入力した文章に関連する文章を入力したユーザの情報や、関連する広告情報を提示することはできない、という課題があった。
本第一の発明の情報処理システムは、ユーザに提示する情報である提示情報を含む情報である管理情報を格納し得る管理情報格納部と、ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する文章取得部と、前記取得した文章から、当該文章を構成する1以上の用語を取得する文章処理部と、前記管理情報格納部から、前記1以上の用語を用いて取得され得る1以上の提示情報を取得する提示情報取得部と、前記提示情報取得部が取得した提示情報を出力する提示情報出力部を具備する情報処理装置である。
かかる構成により、ユーザが他人に読んでもらうために入力し、送信した文章と関連する情報を、ユーザに提示できる。その結果、ユーザは、現在のユーザの状況に適した情報を得ることができる。
また、本第二の発明の情報処理システムは、第一の発明に対して、前記文章処理部は、第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語情報と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納手段と、前記取得した文章の中の1以上の各文について、当該各文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御手段と、前記文分割制御手段が取得した第二文字列の種類のうち、文の主題または文の副題に対応する第二文字列が有する用語である対象物を取得する用語取得手段とを具備する情報処理装置である。
かかる構成により、twitter、ブログなどで多く見られる口語調の文章に対しても、精度高く自然言語処理でき、よりユーザの現在の状況に適した情報を、ユーザに提示できる。
また、本第三の発明の情報処理システムは、第二の発明に対して、対象物の良し悪しに関する用語である評価語を有する評価情報を1以上格納している評価情報格納部をさらに具備し、前記管理情報は、対象物、当該対象物に対する評価を示す情報である評価関連情報、および提示情報を有し、前記用語取得手段は、対象物を取得し、かつ、前記対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて評価語を含み得る第二文字列を特定し、当該評価語を取得し、前記提示情報取得部は、前記用語取得手段が取得した対象物と評価語を用いて、ユーザの前記対象物に対する評価と一致または近似する評価に対応する評価関連情報、および前記対象物と対になる提示情報を、前記管理情報格納部から取得する情報処理装置である。
かかる構成により、ユーザが入力した文章から読み取れる、ユーザの対象物の評価に対応した情報を、ユーザに提示できる。例えば、ユーザが低い評価をしている対象物(例えば、嫌いなもの)に対する広告情報などを提示することはなく、ユーザが高い評価をしている対象物(例えば、好きなもの)に対する広告情報などのみを提示できる。
また、本第四の発明の情報処理システムは、第一から第三いずれかの発明に対して、前記管理情報は、他のユーザが他の人に読んでもらうために入力した文章から取得される用語を含み、前記提示情報は、前記他のユーザが入力した文章または、前記他のユーザに関する情報である情報処理装置である。
かかる構成により、例えば、ユーザが着目している対象物と、同様の対象物に着目しているユーザに関する情報をユーザに提示できる。その結果、ユーザにとって、仲間作りを支援できる。
また、本第五の発明の情報処理システムは、第一から第三いずれかの発明に対して、前記管理情報は、対象物と提示情報を含み、前記提示情報は、対象物に関連する広告情報を含む情報処理装置である。
かかる構成により、ユーザにとって関心のある対象物に対する広告情報を得ることができ、ユーザおよび広告主にとって好適である。
また、本第六の発明の情報処理システムは、第一から第五いずれかの発明に対して、前記管理情報は、他のユーザが他の人に読んでもらうために入力した文章から取得される用語と、提示情報と、前記文章が取得された時刻に関する情報である時刻情報を含み、前記提示情報取得部は、前記文章取得部が文章を取得した時刻と比較して、予め決められた時間以内の時刻を示す時刻情報に対応する提示情報の中から選択して、提示情報を取得する情報処理装置である。
かかる構成により、ユーザは、現在からあまり古くない時間帯に、同様の対象物に対して関心をもった他のユーザの情報を得ることができ、例えば、その他のユーザに連絡することにより、前記対象物に対する会話がはずみ、強力に仲間作りを支援できる。
また、本第七の発明の情報処理システムは、第一から第五いずれかの発明に対して、前記管理情報は、さらに位置情報を含み、前記文章取得部は、前記文章と、前記ユーザの位置を示す位置情報を取得し、前記提示情報取得部は、前記文章取得部が取得した位置情報と比較して、予め決められた関係を有する位置情報に対応する提示情報の中から選択して、提示情報を取得する情報処理装置である。
かかる構成により、ユーザは、ユーザの現地点から近い地点に居る他のユーザであり、同様の対象物に対して関心をもった他のユーザの情報を得ることができ、例えば、その他のユーザに連絡することにより、例えば、すぐに会うことができ、強力に仲間作りを支援できる。
また、本第八の発明の情報処理システムは、第二から第八いずれかの発明に対して、前記文分割制御手段は、前記取得した文章の中の1以上の各文の先頭から予め決められたサイズ(n文字[nは2以上の整数])の第三文字列を切り出し、前記切り出した第三文字列を構成する文字列であって、先頭からn文字の文字列から順に、前記辞書情報格納手段に当該文字列が存在するか否かを判断し、n文字の文字列が存在しない場合には、先頭から(n−1)文字の文字列が前記辞書情報格納手段に存在するか否かを判断し、かかる判断を、1文字ずつ文字数を減らして、文字列が存在するまで行い、または、文字列が存在しない場合には、先頭から1文字になるまでかかる判断を行い、文字列が存在すると判断した場合には、当該文字列に対応する機能語情報と前接続記号と後接続記号とを、前記辞書情報格納部から読み出し、読み出した機能語情報と前接続記号と後接続記号とを当該文字列に付与し、文字列が存在しない場合には、1文字の文字列に対して未知語であることを示す情報である未知語情報を付与する要素分割手段と、前記要素分割手段が未知語情報を付与した連続する未知語であり、ひらがなの文字を連結し文字列を構成し、かつ連続する未知語であり、ひらがなではない文字を連結し文字列を構成し、前記連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報を付与し、隣接する2つの、前記要素分割手段が分割した要素またはまとまり情報を読み出し、当該読み出した要素またはまとまり情報のうち、前出の要素またはまとまり情報の後接続記号と、後出の要素またはまとまり情報の前接続記号から、前出の要素またはまとまり情報と後出の要素またはまとまり情報が連結可能であるか否かを判断し、連結可能な要素またはまとまり情報を一つの文字列にまとめて、当該まとめた文字列である第二文字列を複数の取得する要素連結手段と、前記要素連結手段が取得した複数の各第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、前記各第二文字列の種類を特定する情報を決定し、当該複数の各第二文字列の種類を特定する情報と、当該複数の各第二文字列を対にした複数の対の情報をメモリ上に配置する文字列取得手段を具備する情報処理装置である。
かかる構成により、twitter、ブログなどで多く見られる口語調の文章に対しても、精度高く自然言語処理でき、よりユーザの現在の状況に適した情報を、ユーザに提示できる。
本発明による情報処理システムによれば、ユーザが他人に読んでもらうために入力し、送信した文章と関連する情報を、ユーザに提示できる。
以下、情報処理システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、いわゆるCGM(twitterを含む)から、プロファイルを構成し、入力された文を解析し、用語を取得し、用語に対応する情報を送付する情報処理システムについて説明する。また、本情報処理システムにおいて行う自然言語処理方法については、機能素解析という自然言語処理方法について、主として説明する。さらに、ユーザがあるもの(適宜、「対象物」という。)に対する評価をしている文章が入力された場合、当該評価の同様の評価をしている他のユーザの情報や、肯定的な評価を有する対象物の広告情報などをユーザに提示できる情報処理システムについて説明する。
図1は、本実施の形態における情報処理システム1の概念図である。情報処理システム1は、情報処理装置11、端末装置12、サーバ装置13を具備する。端末装置12は、ユーザが使用する端末であり、例えば、携帯端末、電話機能も有する端末であるいわゆる携帯電話、いわゆるパソコンなどである。また、サーバ装置13は、端末装置12から送信された文章であり、ユーザが入力した文章を受信し、処理する。なお、ここでの処理とは、例えば、文章を他のユーザが閲覧可能な記憶媒体に蓄積したり、文章を他のユーザに送信したりすること等である。情報処理装置11は、ユーザが他の人に読んでもらうために入力した文章に対して、後述する処理を行い、文章を入力したユーザ(当該ユーザが保持している端末装置12)に対して、情報を提示する処理を行う装置である。サーバ装置13は、twitterを実現する装置、またはブログを実現する装置、またはチャットを実現する装置、または電子メールを実現する装置などである。さらに、「ユーザが他の人に読んでもらうために入力した文章」とは、通常、ウェブ上のサーバ装置13に格納される文章を含む。
図2は、本実施の形態における情報処理システム1のブロック図である。図3は、本実施の形態における情報処理装置11のブロック図である。情報処理装置11は、評価情報格納部111、文章取得部112、文章処理部113、管理情報蓄積部114、管理情報格納部115、提示情報取得部116、提示情報出力部117を具備する。
文章処理部113は、辞書情報格納手段1131、文分割制御手段1132、用語取得手段1133を具備する。文分割制御手段1132は、要素分割手段11321、要素連結手段11322、文字列取得手段11323を具備する。
提示情報取得部116は、評価語取得手段1161、スコア取得手段1162、評価算出手段1163、提示情報取得手段1164、変更情報格納手段1165を具備する。
端末装置12は、受付部121、送信部122、受信部123、出力部124を具備する。
サーバ装置13は、文章受信部131、文章出力部132、提示情報受付部133、提示情報送信部134を具備する。
評価情報格納部111は、評価語を有する評価情報を1以上格納している。評価語とは、評価対象(上記の対象物と同意義)の良し悪しに関する用語である。評価情報は、評価語と良し悪しの程度を示すスコアを有することは好適である。ただし、評価情報は、「良い」「美しい」「素晴らしい」などのポジティブな評価を示す評価語の集合だけでも良い。評価語は、例えば、「好き」「嫌い」「良い」「悪い」「だめ」「素敵」「すばらしい」などである。また、評価情報は、「悪い」「醜い」「ひどい」などのネガティブな評価を示す評価語の集合だけでも良い。スコアは、通常、「−5から+5」まで、等の数値であるが、「A、B、C」などのランクなどでも良い。評価情報格納部111は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。評価情報格納部111に評価情報が記憶される過程は問わない。例えば、記録媒体を介して評価情報が評価情報格納部111で記憶されるようになってもよく、通信回線等を介して送信された評価情報が評価情報格納部111で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された評価情報が評価情報格納部111で記憶されるようになってもよい。
文章取得部112は、ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する。文章取得部112は、例えば、サーバ装置13からユーザ識別子と文章を取得する。また、文章取得部112は、端末装置12から、直接に(サーバ装置13を経由せずに)、ユーザ識別子と文章を取得しても良い。また、文章取得部112は、ユーザ識別子、文章に加えて、ユーザの位置を示す位置情報を取得しても良い。さらに、文章取得部112は、ユーザ識別子、文章に加えて、文章が送信された時刻を示す時刻情報を取得しても良い。なお、文章が送信された時刻とは、文章を受信した時刻と同意義である、とする。また、ここで、ユーザ識別子とは、ユーザID、電話番号、メールアドレスなどである。ユーザIDは、twitter、SNS、ブログ、チャットシステムなどを利用する場合に、ユーザに付与された識別情報である。電話番号とは、例えば、携帯電話の電話番号である。また、文章とは、CGM(twitter、SNS、メール、ブログ、チャットなど)の文章である。なお、CGMとは、「Consumer Generated Media」の略である。CGMには、例えば、twitter、クチコミサイト、Q&Aコミュニティ、ソーシャルネットワーキングサービス、ブログ、COI(Community Of Interest)サイトなどがある。また、「取得」とは、例えば、受信や、読み出し、引渡し(関数やメソッドによる引渡しなど)などを含む概念である。また、文章取得部112は、例えば、クローリングにより、サーバ装置13から文章等を取得する。さらに、文章とは、通常、1以上の文から構成されるが、単語のみ等でも良い。文章取得部112は、通常、MPUやメモリ等から実現され得る。文章取得部112の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
文章処理部113は、取得した文章から、当該文章に含まれる1以上の用語を取得する。用語の取得方法は、例えば、機能素解析というアルゴリズムを用いる方法、形態素解析を用いる方法、パターンマッチングによる方法などがある。用語とは、例えば、単語(複合語を含む)であり、通常、自立語である。機能素解析とは、後述する辞書情報格納手段1131、文分割制御手段1132、および用語取得手段1133を用いて、用語の取得を実現する方法であり、後述する。また、形態素解析を用いる方法とは、形態素解析を行い、名詞、形容詞などの自立語を抽出することにより、用語を取得する方法であり、公知技術である。パターンマッチングによる方法とは、例えば、用語の候補を辞書に保持しており、当該用語をパターンマッチングし、文章中から用語を抽出する方法であり、公知技術である。文章処理部113は、通常、MPUやメモリ等から実現され得る。文章処理部113の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
辞書情報格納手段1131は、辞書情報を1以上格納している。辞書情報は、ここでは、解析対象の文から用語を取得しやすいように、文を区切るための情報である、と言える。また、辞書情報は、第一文字列と、機能語情報と、前接続記号と、後接続記号とを対に有する。第一文字列は、1文字以上の文字からなる。第一文字列は、「を」「に」「だ」などの膠着語の文の中で機能を示す機能語を含む。機能語情報とは、文中における第一文字列の機能または種類を特定する情報である。前接続記号とは、第一文字列の前に接続され得る文字列の種類を特定する情報である。後接続記号とは、第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である。なお、第二文字列は、第一文字列または2以上の第一文字列が結合した文字列である。第二文字列の種類は、例えば、文の「主題」、文の「副題」、「動作状態」、「準主題」などである。「主題」は、解析対象の文の主題を示す文字列であることを示す。「副題」は、解析対象の文の副題を示す文字列であることを示す。「動作状態」は、何らかの動作や状態を示す文字列であることを示す。「動作状態」は、「動作」と「状態」という具合に、2つに区別されていても良い。「準主題」は、サブの主題であることを示す。単に主題と言う場合に、準主題を含んで考えても良い。辞書情報の具体例は、後述する。辞書情報格納手段1131は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。辞書情報格納手段1131に辞書情報が記憶される過程は問わない。例えば、記録媒体を介して辞書情報が辞書情報格納手段1131で記憶されるようになってもよく、通信回線等を介して送信された辞書情報が辞書情報格納手段1131で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された辞書情報が辞書情報格納手段1131で記憶されるようになってもよい。
文分割制御手段1132は、取得した文章の中の1以上の各文を、メモリ上に読み出し、各文について、当該各文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する。文分割制御手段1132は、通常、MPUやメモリ等から実現され得る。文分割制御手段1132の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
文分割制御手段1132を構成する要素分割手段11321は、取得した文章の中の1以上の各文をメモリ上に読み出し、当該文の先頭から予め決められたサイズ(n文字[nは2以上の整数])の第三文字列を切り出し、メモリ上に配置し、当該切り出した第三文字列を構成する文字列であって、先頭からn文字の文字列から順に、辞書情報格納手段1131に当該文字列(この文字列は、第一文字列である。)が存在するか否かを判断し、n文字の文字列が存在しない場合には、先頭から(n−1)文字の文字列が辞書情報格納手段1131に当該文字列が存在するか否かを判断し、かかる判断を、1文字ずつ文字数を減らして、文字列が辞書情報格納手段1131に存在するまで行い、または、文字列が辞書情報格納手段1131に存在しない場合には、先頭から1文字になるまでかかる判断を行い、文字列が辞書情報格納手段1131に存在すると判断した場合には、当該文字列(この文字列は、第一文字列である。)に対応する機能語情報と前接続記号と後接続記号とを、辞書情報格納手段1131から読み出し、読み出した機能語情報と前接続記号と後接続記号とを当該文字列に付与し、文字列が存在しない場合には、1文字の文字列に対して未知語であることを示す情報である未知語情報を付与する。
要素連結手段11322は、要素分割手段11321が未知語情報を付与した連続する未知語であり、ひらがなの文字を連結し文字列を構成し、かつ連続する未知語であり、ひらがなではない文字を連結し文字列を構成し、当該連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報を付与し、隣接する要素分割手段11321が分割した要素またはまとまり情報が有する、前出の要素またはまとまり情報の後接続記号と、後出の要素またはまとまり情報の前接続記号を読み出し、当該前出の要素またはまとまり情報の後接続記号と、後出の要素またはまとまり情報の前接続記号から、前出の要素またはまとまり情報と後出の要素またはまとまり情報が連結可能であるか否かを判断し、連結可能な要素またはまとまり情報を一つの文字列にまとめて、複数の第二文字列を取得する。
文字列取得手段11323は、要素連結手段11322が取得した複数の各第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、各第二文字列の種類を特定する情報を決定し、当該複数の各第二文字列の種類を特定する情報と、当該複数の各第二文字列を対にした複数の対の情報をメモリ上に配置する。
要素分割手段11321、要素連結手段11322、および文字列取得手段11323は、通常、MPUやメモリ等から実現され得る。要素分割手段11321等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
用語取得手段1133は、文分割制御手段1132が取得した第二文字列の種類のうち、文の主題(準主題を含む)または文の副題に対応する第二文字列が有する用語である対象物を取得する。また、用語取得手段1133は、対象物と評価語を取得しても良い。かかる場合、用語取得手段1133は、第二文字列の種類のうち、文の主題または文の副題に対応する第二文字列が有する用語(通常、機能語を除く文字列)を対象物として取得する。また、用語取得手段1133は、対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて評価語を含み得る第二文字列を特定し、当該評価語を取得する。評価語は、通常、第二文字列の種類が動作状態に対応する第二文字列が有する用語である。なお、対象物とは、例えば、評価語が修飾する用語であり、機能素解析による自然言語処理を行った場合は、例えば、機能素解析の結果の中の「主題」(準主題を含む)または「副題」である。形態素解析と係り受け解析などの処理により文章を自然言語解析した場合、対象物は、評価語(例えば、「良い」「すばらしい」「悪い」など)の対象となる用語である。かかる用語は、評価語が修飾する名詞や、評価語の主語となる名詞などである。形態素解析と係り受け解析などの処理により文章を自然言語解析した場合の対象物を取得する処理は、公知技術による処理であるので、詳細な説明を省略する。例えば、「A社は、非常に良い会社だ。」という文が、文分割制御手段1132により「主題「A社は」、動作状態「非常に良い会社だ」」に分割される。そして、対象物取得手段1142は、主題「A社は」が対象物を含む第二文字列である、と特定する。次に、対象物取得手段1142は、主題「A社は」が有する用語「A社」を取得し、対象物とする。用語取得手段1133は、通常、MPUやメモリ等から実現され得る。用語取得手段1133の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
管理情報蓄積部114は、ユーザに提示する情報である提示情報を含む情報である管理情報を、管理情報格納部115に蓄積する。管理情報は、例えば、提示情報と位置情報と時刻情報を含む。また、管理情報は、例えば、文章取得部112が取得した文章から、文章処理部113が取得した対象物を含む。管理情報蓄積部114は、例えば、文章処理部113が取得した対象物と、文章取得部112が取得した文章と、当該文章を送信してきたユーザのユーザ識別子(例えば、ユーザIDまたは端末装置の識別子など)と、文章取得部112が取得した位置情報(ユーザが居る位置の情報)と、図示しない時計が取得した時刻情報を用いて、これらの情報を有する管理情報を構成し、当該管理情報を管理情報格納部115に蓄積する。管理情報蓄積部114は、通常、MPUやメモリ等から実現され得る。管理情報蓄積部114の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
管理情報格納部115は、ユーザに提示する情報である提示情報を含む情報である管理情報を格納し得る。ここで、管理情報は、対象物と提示情報を含んでも良い。また、提示情報は、対象物に関連する広告情報を含んでも良い。また、管理情報は、対象物と、提示情報の出力条件と、広告情報を含む提示情報を有しても良い。提示情報の出力条件とは、提示情報を出力するための条件を示す情報であり、例えば、評価情報を用いた条件を示す情報である。提示情報の出力条件は、例えば、「+3以上」(評価のスコアが3以上の場合のみ、提示情報を出力することを示す)、「ポジティブ」(評価値で言えば、+1以上の場合のみ、提示情報を出力することを示す)などである。なお、広告情報は、文字列、静止画、動画、音声など、そのデータタイプは問わない。管理情報格納部115は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。通常、管理情報蓄積部114が蓄積することにより、管理情報が管理情報格納部115に格納されるが、管理情報格納部115に管理情報が記憶される過程は問わない。例えば、記録媒体を介して管理情報が管理情報格納部115で記憶されるようになってもよく、通信回線等を介して送信された管理情報が管理情報格納部115で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された管理情報が管理情報格納部115で記憶されるようになってもよい。
提示情報取得部116は、管理情報格納部115から、1以上の用語を用いて取得され得る1以上の提示情報を取得する。提示情報取得部116は、例えば、用語取得手段1133が取得した対象物(用語)と対になる提示情報を取得する。また、提示情報取得部116は、用語取得手段1133が取得した対象物と評価語を用いて、ユーザの対象物に対する評価と一致または近似する評価に対応する評価関連情報、および対象物と対になる提示情報を、管理情報格納部115から取得しても良い。ここで、「一致」とは、両者の評価を示すスコアが一致している場合である。また、「一致」とは、例えば、評価が「肯定的」または「否定的」または「いずれでもない」の3種類のいずれかである場合、両者の評価が「肯定的」である場合、両者の評価が「否定的」である場合である。また、「近似」とは、例えば、評価を示すスコアの差が、予め格納されている閾値より小さい(または、以下である)場合や、評価のスコアの符号(+、−)が一致する場合などである。また、提示情報取得部116は、文章取得部112が文章を取得した時刻(文章の受信時刻でも良い)と比較して、予め決められた時間以内の時刻を示す時刻情報に対応する提示情報の中から選択して、提示情報を取得することは好適である。さらに、提示情報取得部116は、文章取得部112が取得した位置情報と比較して、予め決められた関係を有する位置情報に対応する提示情報の中から選択して、提示情報を取得することは好適である。「予め決められた関係を有する位置情報」とは、あらかじめ決められた距離以内、同一の県、電車で10分以内、など、距離的に近いことである。提示情報取得部116は、通常、MPUやメモリ等から実現され得る。提示情報取得部116の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
評価語取得手段1161は、対象物を含む第二文字列を有する文中の、他の第二文字列の種類を用いて評価語を含み得る第二文字列(例えば、「非常に良い会社だ」)を取得する。
スコア取得手段1162は、評価語取得手段1161が取得した評価語(例えば、「良い」)をキーとして、評価情報格納部111を検索し、当該評価語と対になるスコアを評価情報格納部111から取得する。なお、評価語は、通常、上述した機能素解析により取得されるが、形態素解析や係り受け解析等を行い、形態素のうちの形容詞を取得されるようにしても良い。
評価算出手段1163は、一のユーザ識別子で識別されるユーザが同一の対象物についての1以上の評価語を含む文章(文章が2以上でも良い)を送信してきている場合、当該1以上の評価語に対応する1以上のスコアを用いて、当該対象物についての評価を算出する。同一の対象物についての2以上のスコアが得られた場合、評価算出手段1163は、通常、2以上のスコアを予め決められた演算式に代入し、一のスコアを得る。なお、予め決められた演算式の情報は、評価算出手段1163が保持している。また、評価算出手段1163は、後述するスコア変更処理をも行うことは好適である。
提示情報取得手段1164は、用語取得手段1133が取得した1以上の用語を用いて、取得され得る1以上の提示情報を、管理情報格納部115から検索し、取得する。また、用語取得手段1133が取得した1以上の用語の中に評価語が存在する場合、当該評価語と対象物(評価の対象を示す用語)を用いて、管理情報格納部115から検索し、1以上の提示情報を取得することは好適である。
変更情報格納手段1165は、評価を変更するための情報である変更情報を1以上格納している。変更情報は、変更語と評価変更情報の対である。変更語は、評価語に対する評価の変更を示す言い回しの用語である。変更語は、例えば、「でない」「じゃない」「とは言えない」「あまり」などである。つまり、「好き」というポジティブな評価語に「でない」という変更語が後続すると、評価はポジティブではなく、ネガティブとしなければならない。評価変更情報は、評価を変更するための情報である。また、具体的には、評価変更情報は、スコアを変更するための情報である、と言える。評価変更情報は、例えば、「−1」や「0.5」などの数値である。つまり、例えば、評価語「好き」に対して、スコア「+4」とする場合、変更語「でない」に対する評価変更情報は「−1」、変更語「あまり」に対する評価変更情報は「0.5」とする。そして、後述する変更スコア算出部1313は、各数値を乗算し、「4×(−1)×(0.5)=−2」を算出する。ここで、「+5」は、非常にポジティブ、「−5」は非常にネガティブとして、「好きでない」は、「−2」であり、若干、ネガティブ、ということになる。なお、変更語として、評価を強める語(例えば、「非常に」「かなり」)、評価を弱める語(例えば、「あまり」)、評価を逆転させる語(例えば、「でない」)、評価を無効にする語(例えば、「であるとは言えない。」)などの種類がある。そして、評価を強める語は、例えば、強くする度合いにより、「1」より大きな評価変更情報が与えられ、評価を弱める語は、例えば、弱くする度合いにより、「1」より小さな評価変更情報が与えられ、評価を逆転させる語は、「−1」が与えられる。変更情報格納手段1165は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
評価語取得手段1161、スコア取得手段1162、評価算出手段1163および提示情報取得手段1164は、通常、MPUやメモリ等から実現され得る。評価語取得手段1161等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
提示情報出力部117は、提示情報取得部116が取得した提示情報を出力する。ここで、出力とは、例えば、サーバ装置13への引渡しが好適である。また、出力とは、例えば、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置(例えば、サーバ装置13や端末装置12)への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。提示情報出力部117は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。提示情報出力部117は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
受付部121は、ユーザからの各種の入力を受け付ける。ここで、入力とは、指示や情報の入力であり、具体的には、例えば、twitterやSNSなどへの参加やソフトウェアの起動の指示、文章の入力などである。入力の手段は、キーボードやマウスやメニュー画面によるもの等、何でも良い。受付部121は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
送信部122は、受付部121が受け付けた文章や、指示などをサーバ装置13に送信する。なお、送信部122は、受付部121が受け付けた文章や、指示などを情報処理装置11に送信しても良い。送信部122は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
受信部123は、サーバ装置13などの外部装置から送信された情報を受信する。受信部123は、例えば、提示情報を受信する。なお、受信部123は、送信部122における文章の送信に対応して、概ねリアルタイム(時間の遅れはある)に、提示情報を受信することは好適である。また、提示情報は、送信された文章に関連する情報であるが、ユーザが意図せずに受信された情報である。受信部123は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
出力部124は、受信部123が受信した情報(例えば、提示情報)を出力する。かかる出力により、ユーザの文章の送信に応じて、自動的に、文章に関連する提示情報が出力される。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。出力部124は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部124は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
文章受信部131は、端末装置12から、ユーザが他の人に読んでもらうために入力した文章を受信する。かかる文章は、CGM(twitter、SNS、メール、ブログ、チャットなど)の文章である。文章受信部131は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
文章出力部132は、文章受信部131が受信した文章を出力する。ここでの出力は、通常、記憶媒体への蓄積や、文章の伝達先への送信などである。サーバ装置13がtwitterやブログ機能やSNSやチャットを実現する場合、文章出力部132は文章を記憶媒体へ蓄積する。サーバ装置13が電子メール機能を実現する場合、文章出力部132は文章を指示された伝達先へ送信する。文章出力部132は、例えば、MPUやメモリ等から実現され得る。文章出力部132の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
提示情報受付部133は、情報処理装置11から提示情報を受け付ける。ここでの受け付けとは、通常、受信であるが、引渡しなどでも良い。引渡しの場合、例えば、情報処理装置11とサーバ装置13は一体となっている。提示情報受付部133は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
提示情報送信部134は、提示情報受付部133が受け付けた提示情報を、端末装置12に送信する。提示情報送信部134は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
次に、情報処理システム1の動作について説明する。まず、情報処理装置11の動作について、図4のフローチャートを用いて説明する。
(ステップS401)文章取得部112は、文章等を取得したか否かを判断する。文章等を取得すればステップS402に行き、文章等を取得しなければステップS401に戻る。なお、文章等とは、例えば、文章、ユーザ識別子、位置情報などである。
(ステップS402)提示情報取得部116は、文章取得部112が取得した情報から、ユーザ識別子、位置情報などを抽出する。
(ステップS403)文章処理部113は、カウンタiに1を代入する。
(ステップS404)文章処理部113は、ステップS401で取得された文章の中に、i番目の文が存在するか否かを判断する。i番目の文が存在すればステップS405に行き、i番目の文が存在しなければステップS416に行く。
(ステップS405)文章処理部113は、ステップS401で取得された文章の中の、i番目の文を取得し、メモリ上に配置する。
(ステップS406)文章処理部113は、ステップS405で取得した文に対して、文の処理を行う。この文の処理とは、文から、提示情報を検索するための用語を取得する処理である。文の処理の具体例について、図5のフローチャートを用いて説明する。
(ステップS407)提示情報取得部116の評価語取得手段1161は、ステップS406で取得された用語の中に、評価語が含まれるか否かを判断する。評価語が含まれる場合はステップS408に行き、評価語が含まれない場合はステップS410に行く。なお、ここで、評価語が含まれる場合、提示情報取得部116の評価語取得手段1161は、ステップS406で取得された用語の中の評価語を取得する。なお、例えば、評価語は、第二文字列の種類「動作状態」に対応する第二文字列の中の機能語を除く用語、または「動作状態」に対応する第二文字列すべて等である。
(ステップS408)スコア取得手段1162は、ステップS407で取得された評価語に対応するスコアを読み出す。なお、スコア取得手段1162は、通常、評価語に対応するスコアを、評価情報格納部111から検索し、取得する。評価情報は、例えば、評価語(例えば、「好き」)とスコア(例えば、「+4」)を有する。
(ステップS409)評価算出手段1163は、ステップS408で取得したスコアを変更する処理を行う。スコア変更処理の詳細について、図9のフローチャートを用いて説明する。なお、スコア変更処理が、実質的に必要ない場合もある。
(ステップS410)提示情報取得手段1164は、用語取得手段1133が取得した1以上の用語を用いて、取得され得る1以上の提示情報を、管理情報格納部115から検索し、取得する。また、提示情報取得手段1164は、用語取得手段1133が取得した1以上の用語の中に評価語が存在する場合、当該評価語と対象物(評価の対象を示す用語)を用いて、管理情報格納部115から検索し、1以上の提示情報を取得する。提示情報取得手段1164は、対象物(評価の対象を示す用語)とスコア(評価の程度の値)を用いて、1以上の提示情報を取得しても良い。
(ステップS411)提示情報出力部117は、ステップS410で取得された提示情報が存在するか否かを判断する。提示情報が存在すればステップS412に行き、提示情報が存在しなければステップS413に行く。
(ステップS412)提示情報出力部117は、ステップS410で取得された提示情報をバッファに一時的に追記する。
(ステップS413)管理情報蓄積部114は、管理情報を構成する。管理情報蓄積部114は、例えば、ステップS401で取得した文章、ユーザ識別子、位置情報、およびステップS406で取得した用語(評価語を含んでも良い)が対になる管理情報を構成する。なお、管理情報蓄積部114は、管理情報の中に時刻情報を含めても良い。管理情報蓄積部114は、図示しない時計から、時刻情報を取得しても良いし、情報処理装置11の文章取得部112が時刻情報を受け付けても良い。
(ステップS414)管理情報蓄積部114は、ステップS413で構成した管理情報を、管理情報格納部115に蓄積する。
(ステップS415)文章処理部113は、カウンタiを1、インクリメントとする。ステップS404に戻る。
(ステップS416)提示情報出力部117は、バッファ中に、ステップS412で一時格納された提示情報が存在するか否かを判断する。提示情報が存在すればステップS417に行き、提示情報が存在しなければステップS401に戻る。
(ステップS417)提示情報出力部117は、バッファ中の提示情報を出力する。ステップS401に戻る。
なお、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS406の文の処理について、図5から図8のフローチャートを用いて説明する。
(ステップS501)要素分割手段11321は、カウンタiに1を代入する。
(ステップS502)要素分割手段11321は、解析対象の文(ステップS405におけるi番目の文)の中に、i番目の文字が存在するか否かを判断する。i番目の文字が存在すればステップS503に行き、i番目の文字が存在しなければステップS513に行く。
(ステップS503)要素分割手段11321は、解析対象の文の中の、i番目の文字から(i+n)番目の文字までの文字列を取得し、バッファ上に置く。nは、固定の数であり、例えば、「5」である。なお、処理対象の文に、i番目の文字から(i+n)番目の文字まで存在しない場合、要素分割手段11321は、i番目の文字から文の最終文字までを取得し、バッファ上に置く。つまり、要素分割手段11321は、i番目の文字から(i+n)番目以下の文字までの文字列を取得し、バッファ上に置く。
(ステップS504)要素分割手段11321は、ステップS503でバッファ上に配置した文字列を、辞書情報格納手段1131に検索しにいく。
(ステップS505)要素分割手段11321は、ステップS504における検索結果において、ステップS503でバッファ上に配置した文字列が、辞書情報格納手段1131に存在したか否かを判断する。文字列が存在すればステップS510に行き、文字列が存在しなければステップS506に行く。なお、文字列が存在する場合とは、バッファ上に配置した文字列と一致する文字列が、辞書情報が有する第一文字列に存在する場合である。
(ステップS506)要素分割手段11321は、ステップS503でバッファ上に配置した文字列の長さが1(1文字)であるか否かを判断する。1文字であればステップS508に行き、1文字でなければステップS507に行く。
(ステップS507)要素分割手段11321は、ステップS503でバッファ上に配置した文字列から最後の文字を削除し、一文字少なくして、i番目から文字列を取得し、バッファ上に配置する。なお、要素分割手段11321は、単に、バッファ上の最終文字を消去するだけでも良い。ステップS504に戻る。
(ステップS508)要素分割手段11321は、i番目の文字に未知語であることを示す情報である「未知語」フラグを付与する。「「未知語」フラグを付与する」とは、i番目の文字が他の文字または文字列と区別できれば良く、例えば、他の文字または文字列に何らかのフラグを付与し、未知語であるi番目の文字には、何も付与しなくても良い。さらに、未知語を格納するバッファがあり、そのバッファに未知語であるi番目の文字を書き込む処理も、「未知語」フラグを付与する処理とする。
(ステップS509)要素分割手段11321は、カウンタiを1、インクリメントする。ステップS502に戻る。
(ステップS510)要素分割手段11321は、バッファ上に配置した文字列と一致する第一文字列と対になる機能語情報、前接続記号、および後接続記号を、辞書情報格納手段1131から読み出し、メモリ上に配置する。
(ステップS511)要素分割手段11321は、バッファ上に配置した文字列に対して、ステップS510で読み出した機能語情報、前接続記号、および後接続記号を付与する。
(ステップS512)要素分割手段11321は、カウンタiに、「i+文字列の文字数」を代入する。ステップS502に戻る。なお、「文字列の文字数」の「文字列」は、バッファ上に配置した文字列である。
(ステップS513)要素連結手段11322は、要素分割手段11321が分割した文字列のうち、連結可能な文字列を連結する。かかる連結処理について、図6のフローチャートを用いて、詳細に説明する。
(ステップS514)文字列取得手段11323は、要素連結手段11322が取得した複数の各第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、各第二文字列の種類を特定する情報を決定し、当該複数の各第二文字列の種類を特定する情報と、当該複数の各第二文字列を対にした複数の対の情報をメモリ上に配置する。かかる処理(文分割処理、という)について、図7のフローチャートを用いて、詳細に説明する。
(ステップS515)文字列取得手段11323は、ステップS516で取得した2以上の区切られた各第二文字列と、各第二文字列の種類を特定する情報を対にして、メモリ上に配置する。かかるメモリ配置処理について、図8のフローチャートを用いて、詳細に説明する。
(ステップS516)用語取得手段1133は、用語取得処理を行う。用語取得処理とは、例えば、以下の処理である。用語取得手段1133は、文字列取得手段11323により取得された第二文字列の種類のうち、「主題」または「準主題」または「副題」に対応する文字列が有する用語を、対象物として取得し、バッファに一時格納する。また、用語取得手段1133は、文字列取得手段11323により取得された第二文字列の種類のうち、「動作状態」(「動作」または「状態」でも良い)に対応する文字列を取得する。そして、用語取得手段1133は、当該文字列が評価情報格納部111に、評価語として格納されているか否かを判断するために、評価情報格納部111を検索する。そして、当該用語が評価情報格納部111に格納されていれば、当該用語(評価語)を取得し、バッファに一時格納する。上位処理にリターンする。
なお、図5のフローチャートにおいて、ステップS515のメモリ配置処理は必須ではない。
次に、ステップS513の連結処理について、図6のフローチャートを用いて、詳細に説明する。
(ステップS601)要素連結手段11322は、要素分割手段11321が未知語フラグ(未知語情報の一種)を付与した連続する未知語であり、ひらがなの文字を連結し文字列を構成する。また、要素連結手段11322は、かつ要素分割手段11321が未知語フラグを付与した連続する未知語であり、ひらがなではない文字を連結し文字列を構成する。なお、要素連結手段11322は、連続する未知語を連結しても良い。
(ステップS602)要素連結手段11322は、ステップS601で連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報を付与する。まとまり情報は、機能語情報の一種である。まとまり情報は、文字列に付与される未知語フラグでも良い。
(ステップS603)要素連結手段11322は、カウンタiに1を代入する。
(ステップS604)要素連結手段11322は、処理対象の文中に、(i+1)番目の、まとめられた文字列(1文字の場合もある)が存在するか否かを判断する。(i+1)番目の文字列が存在すればステップS605に行き、(i+1)番目の文字列が存在しなければ上位処理にリターンする。
(ステップS605)要素連結手段11322は、i番目の文字列の後接続記号と、(i+1)番目の文字列の前接続記号を読み出し、メモリ上に配置する。なお、i番目の文字列の後接続記号は、i番目の文字列の最後の第一文字列と対になる後接続記号である。また、(i+1)番目の文字列の前接続記号は、(i+1)番目の文字列の先頭の第一文字列と対になる前接続記号である。
(ステップS606)要素連結手段11322は、ステップS605で読み出したi番目の文字列の後接続記号と、(i+1)番目の文字列の前接続記号から、i番目の文字列と(i+1)番目の文字列が連結可能であるか否かを判断する。なお、2つの連続する文字列が連結可能であるか否かは、前出の後接続記号と、後出の前接続記号から判断可能であり、要素連結手段11322は、例えば、連結可能な2つの文字列の後接続記号と前接続記号の組の情報(ルール)を保持している。
(ステップS607)要素連結手段11322は、ステップS606における判断結果が、連結可能である、との判断であればステップS608に行き、連結可能でない、との判断であればステップS609に行く。
(ステップS608)要素連結手段11322は、i番目の文字列と、(i+1)番目の文字列を連結する。文字列の連結とは、連結した文字列をバッファに書き込む処理でも良いし、2つの文字列をリンク付けする処理等でも良い。
(ステップS609)要素連結手段11322は、カウンタiを1、インクリメントする。ステップS604に行く。
次に、ステップS514の文分割処理について、図7のフローチャートを用いて、詳細に説明する。
(ステップS701)文字列取得手段11323は、カウンタiに1を代入する。
(ステップS702)文字列取得手段11323は、処理対象の文中に、i番目の第二文字列が存在するか否かを判断する。i番目の第二文字列が存在すればステップS703に行き、i番目の第二文字列が存在しなければ上位処理にリターンする。
(ステップS703)文字列取得手段11323は、i番目の第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、各第二文字列の種類を特定する情報を決定する。具体的には、例えば、第二文字列の種類は、例えば、「主題」、「準主題」、「副題」、「動作」、または「状態」であり、第二文字列の最後尾の第一文字列に対応する機能語情報が「動作」または「状態」であれば、第二文字列の種類は「動作」または「状態」であると、文字列取得手段11323は決定する。また、第二文字列の最後尾の第一文字列に対応する後接続記号が「主題」または「準主題」または「副題」を示す記号である場合は、第二文字列の種類は「主題」または「準主題」または「副題」であると、文字列取得手段11323は決定する。そして、文字列取得手段11323は、i番目の第二文字列と、第二文字列の種類を特定する情報を取り出し、メモリ上に配置する。
(ステップS704)文字列取得手段11323は、カウンタiを1、インクリメントする。ステップS702に戻る。
次に、ステップS515のメモリ配置処理について、図8のフローチャートを用いて、詳細に説明する。
(ステップS801)文字列取得手段11323は、出力する文構造の情報を取得する。出力する文構造の情報は、例えば、文字列取得手段11323があらかじめ格納しており、この情報を文字列取得手段11323が読み出す。また、出力する文構造の情報とは、例えば、「主題、副題、動作|状態」である。これは、「主題を示す文字列」、「副題を示す文字列」、「動作を示す文字列」または「状態を示す文字列」の順で出力することを示す。「主題」、「副題」、「動作」、「状態」などは、文中の文字列の機能や、意義などを示すことを示す。また、「主題」、「副題」、「動作」、「状態」などを、以下、適宜、文要素という。また、出力する文構造の情報の他の例は、「主題、状態」である。これは、「主題を示す文字列」、「状態を示す文字列」の順で出力することを示す。
(ステップS802)文字列取得手段11323は、カウンタiに1を代入する。
(ステップS803)文字列取得手段11323は、ステップS801で読み出した文構造の情報に、i番目の文要素が存在するか否かを判断する。i番目の文要素が存在すればステップS804に行き、i番目の文要素が存在しなければ上位処理にリターンする。
(ステップS804)文字列取得手段11323は、i番目の文要素(例えば、「主題」)の情報を読み出し、当該文要素に対応する種類(例えば、「主題」)を示す第二文字列を検索する。
(ステップS805)文字列取得手段11323は、文要素に対応する種類(例えば、「主題」)を示す第二文字列が存在すればステップS806に行き、存在しなければステップS807に行く。
(ステップS806)文字列取得手段11323は、文要素に対応する種類(例えば、「主題」)を示す第二文字列を取得し、当該第二文字列と、文要素に対応する種類を対にしてバッファに追記する。
(ステップS807)文字列取得手段11323は、カウンタiを1、インクリメントする。ステップS803に戻る。
なお、図8のフローチャートにおいて、文構造の情報に従って、第二文字列の順序を入れ替えてメモリ上に配置したが、かかる文構造の情報に従って第二文字列の順序を入れ替える処理は必須の処理ではない。第二文字列と、その種類を対にして記憶すれば良い。
ステップS409のスコア変更処理の詳細について、図9のフローチャートを用いて説明する。
(ステップS901)評価算出手段1163は、変更情報格納手段1165に格納されている変更情報が有する変更語の情報を用いて、評価語の前後の所定以内の文字数の距離内に、変更語が存在するか否かを判断する。
(ステップS902)評価算出手段1163は、ステップS901で変更語が存在すると判断した場合はステップS903に行き、存在しないと判断した場合は上位処理にリターンする。
(ステップS903)評価算出手段1163は、変更情報格納手段1165の変更情報が有する変更語にマッチする評価語の前後の所定以内の文字数の距離内の文字列(変更語)をすべて取得し、メモリ上に配置する。
(ステップS904)評価算出手段1163は、ステップS903で取得された1以上の変更語と対になる各評価変更情報を、変更情報格納手段1165から取得する。
(ステップS905)評価算出手段1163は、スコア取得手段1162が取得したスコアに対して、ステップS904で取得した1以上の評価変更情報を用いて、スコアを変更し、新たなスコアを算出する。評価算出手段1163は、例えば、「スコア×1番目の評価変更情報×2番目の評価変更情報×・・・×n番目の評価変更情報」により、新たなスコアを算出する。上位処理にリターンする。その際、変更語が存在する場合には新たなスコアを、または変更語が存在しない場合には元のスコアをリターンする。
なお、図9のフローチャートにおいて、評価算出手段1163は、評価語の前後の所定以内の文字数の距離内に、変更語が存在するか否かを判断した。しかし、変更語の存在を検索する対象の文字列は、例えば、評価語が含まれる第二文字列など、他のアルゴリズムや、他の範囲でも良い。
また、評価算出手段1163は、スコアの変更処理は行わなくても良い。また、評価算出手段1163は、図9のフローチャートを用いて説明したように、スコアの変更処理を行っても良い。つまり、評価算出手段1163は、変更情報格納手段1165の変更情報が有する変更語の情報を用いて、取得された評価語から所定以内の文字数の距離内にある変更語を取得する。また、評価算出手段1163は、変更情報格納手段1165から、取得した変更語と対になる評価変更情報を取得する。そして、評価算出手段1163は、スコア取得手段1162が取得したスコアに対して、取得した評価変更情報を用いて、スコアを変更し、新たなスコアを算出する。評価算出手段1163の演算式は問わない。なお、変更語は存在しない場合もあることは言うまでもない。
次に、端末装置12の動作について説明する。端末装置12の受付部121は、ユーザから各種の指示や、文章を受け付ける。そして、送信部122ユーザの指示に従って、例えば、受け付けられた文章を、サーバ装置13などに送信する。また、端末装置12の受信部123は、情報処理装置11からサーバ装置13経由で、提示情報を受信する。そして、出力部124は、受信部123が受信した提示情報を出力する。なお、端末装置12は、通常、受け付けられた文章をサーバ装置13などに送信したことをトリガーとして、提示情報を受信し、出力する。
次に、サーバ装置13の動作について説明する。サーバ装置13の文章受信部131は、端末装置12から文章を受信する。そして、文章出力部132は、受信された文章を出力する。また、提示情報受付部133は、提示情報を情報処理装置11から受け付け、提示情報送信部134は、当該提示情報を、端末装置12に送信する。
以下、本実施の形態における情報処理システム1の具体的な動作について説明する。情報処理システム1の概念図は図1である。
今、管理情報格納部115に、図10に示す管理情報管理表が格納されている。管理情報管理表は、管理情報を管理する表であり、「ID」「ユーザ識別子」「位置情報」「対象物」「スコア」「時刻情報」「文章」の属性値を有するレコードを1以上、格納している。「ID」は、レコードを識別する情報であり、表管理のために存在する。「ユーザ識別子」は、ここでは、Twitterを利用するユーザを識別するIDである。「位置情報」は、経度、緯度の組(例えば、(x,y)は、経度x、緯度yである)、または、IRタグから受信した位置を示す情報(例えば、新宿駅など)などである。「対象物」は文章から抽出された用語であり、ここでは、文章に含まれる主題、準主題、または副題である、とする。「スコア」は、対象物に対する評価の度合いを示す数値であり、ここでは、「+5」から「−5」の値をとり得る。「+5」は極めて肯定的、「−5」は極めて否定的であることを示す。「時刻情報」は、文章取得部112が文章を取得した時刻(ユーザが文章を送信した時刻でも良い。)を格納する属性である。さらに、「文章」は、文章取得部112が取得した文章を格納する属性である。
そして、図11は、辞書情報格納手段1131に格納されている辞書情報管理表である。辞書情報管理表は、「第一文字列」「前接続記号」「後接続記号」「機能語情報」の属性を有するレコードを1以上格納している。
図11の「前接続記号」の「−&」は、前に、未知語情報で識別される未知語や、「object」で識別される対象物などが連結されることを示す。「前接続記号」は、他にも「&&」などがあり、「&&」は、前に、「名前」や、未知語や、「object」で識別される対象物などが連結されることを示す。「名前」とは、登録している人や物などの名前である。
また、「後接続記号」の「s%」は、区切りになり得て、「副題」となり得ることを示す。また、「後接続記号」の「&&」は、後に、「名前」や、未知語情報で識別される未知語や、「object」で識別される対象物などが連結されることを示す。また、「後接続記号」の「m%」は、区切りになり得て、「主題」となり得ることを示す。また、「後接続記号」の「n%」は、区切りになり得て、「主題」となり得ることを示す。「m%」と「n%」は、両方とも「主題」となり得るが、「m%」の方が主題になる優先度は高い、ことを意味する。また、「後接続記号」の「−−」は、「action」で識別される文字列が連結されることを示す。また、「後接続記号」の「%=」は、区切りになり得て、かつ、「object」で識別される対象物や「名前」などが連結されることを示す。また、「後接続記号」の「o%」は、区切りになり得て、「準主題」となり得ることを示す。また、「後接続記号」の「%%」は、強制的な区切りであることを示す。
また、「機能語情報」の「object」は、対象物を示す。また、「機能語情報」の「action」は、動作を示す。さらに、「機能語情報」の「state」は、状態を示す。
また、図12は、評価情報格納部111に管理されている評価情報管理表である。評価情報管理表は、「評価語」「スコア」の属性値を有するレコードを1以上格納している。本評価情報管理表において、例えば、評価語「良い」のスコアは「+3」、評価語「おしゃれ」のスコアは「+4」等である。
さらに、図13は、変更情報格納手段1165に管理されている変更情報管理表である。変更情報管理表は、「変更語」「評価変更情報」の属性値を有するレコードを1以上格納している。本評価情報管理表において、「評価変更情報」は、スコアに対して乗算される数値である。
以上の状況において、以下の3つの具体例を用いて説明する。
(具体例1)
具体例1では、評価語を用いる場合の例である。端末装置12のユーザAは、ユーザ識別子「3812」とパスワードを入力し、Twitterを利用するためのサーバ装置13にログインした、とする。なお、かかるログイン処理(サーバ装置13における認証処理など)は、公知技術で可能であるので、説明を省略する。
そして、ユーザAは、「カラオケに行きたい。」と端末装置12に入力した、とする。すると、受付部121は「カラオケに行きたい。」を受け付ける。そして、送信部122は、文章「カラオケに行きたい。」、ユーザ識別子「3812」、および位置情報(x,y)をサーバ装置13に送信する。なお、端末装置12は、GPS受信機能を具備しており、端末装置12が存在する位置情報(経度、緯度)を取得でき得る、とする。
次に、サーバ装置13の文章受信部131は「カラオケに行きたい。」、ユーザ識別子「3812」、および位置情報(x,y)を受信する。次に、文章出力部132は、ユーザ識別子「3812」で識別されるユーザAが入力した文章であることを示す情報(例えば、ユーザAのペンネームや氏名やユーザ識別子など)と対応付けて、文章「カラオケに行きたい。」を、所定のファイルに追記する。なお、ユーザAのペンネームや氏名を追記する場合、サーバ装置13は、ユーザ識別子と対応付けて、ペンネームや氏名を格納している、とする。なお、Twitterにおける本来的な処理は、公知技術であるので、詳細な説明を省略する。
次に、情報処理装置11は、Twitterを利用して投函された情報(文章「カラオケに行きたい。」など)を、以下のように処理する。
つまり、情報処理装置11の文章取得部112は、サーバ装置13を、例えば、クローリングして、文章「カラオケに行きたい。」、ユーザ識別子「3812」、および位置情報(x,y)を取得する。
次に、文章処理部113は、1番目の文「カラオケに行きたい。」を取得する。なお、ここでは、文章取得部112が取得した文章では、1番目の文しか存在しない。次に、文章処理部113は、取得した文「カラオケに行きたい。」に対して、以下のように、図5のフローチャートに従った、文の処理を行う。
文分割制御手段1132の要素分割手段11321は、文「カラオケに行きたい。」の中の、1番目の文字から6番目(上記の「n」は「5」である)の文字までの文字列「カラオケに行」を取得し、バッファ上に置く(図14の(1))。
そして、要素分割手段11321は、文字列「カラオケに行」を、辞書情報格納手段1131に検索しにいく。しかし、文字列「カラオケに行」に合致する第一文字列が、図11の辞書情報管理表に存在しないので、要素分割手段11321は、先の文字列より1文字少ない文字列「カラオケに」を構成する。そして、要素分割手段11321は、文字列「カラオケに」をバッファ上に置く(図14の(2))。そして、同様に、要素分割手段11321は、文字列「カラオケに」を、辞書情報格納手段1131に検索しにいく。しかし、文字列「カラオケに」に合致する第一文字列が、図11の辞書情報管理表に存在しないので、要素分割手段11321は、先の文字列より1文字少ない文字列「カラオケ」を構成し、バッファ上に置く(図14の(3))。そして、要素分割手段11321は、文字列「カラオケ」を、辞書情報格納手段1131に検索しにいく。同様に、文字列「カラオケ」に合致する第一文字列が、図11の辞書情報管理表に存在しない。そして、要素分割手段11321は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納手段1131に検索しにいく(図14の(4)から(6))。そして、要素分割手段11321は、最後の文字「カ」も図11の辞書情報管理表に存在しない、と判断する。そして、要素分割手段11321は、文字「カ」に、未知語であることを示す情報である「未知語」フラグを付与する(図14の(7))。なお、ここでの「未知語」フラグは、情報「未知語」である。
次に、要素分割手段11321は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段11321は、2番目の文字から6文字分の文字列「ラオケに行き」を読み出し、バッファに配置する(図14の(8))。そして、同様に、要素分割手段11321は、文字列「ラオケに行き」を、辞書情報格納手段1131に検索しにいく。同様に、文字列「ラオケに行き」に合致する第一文字列が、図11の辞書情報管理表に存在しない。そして、要素分割手段11321は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納手段1131に検索しにいく(図14の(9)から(13))。そして、要素分割手段11321は、最後の文字「ラ」も図11の辞書情報管理表に存在しない、と判断する。そして、要素分割手段11321は、文字「ラ」に、未知語であることを示す情報である「未知語」フラグを付与する(図14の(14))。
次に、要素分割手段11321は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段11321は、3番目の文字から6文字分の文字列「オケに行きた」を読み出し、バッファに配置する(図14の(15))。そして、同様に、要素分割手段11321は、文字列「オケに行きた」を、辞書情報格納手段1131に検索しにいく。同様に、文字列「オケに行きた」に合致する第一文字列が、図11の辞書情報管理表に存在しない。そして、要素分割手段11321は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納手段1131に検索しにいく(図14の(16)から(20))。そして、要素分割手段11321は、最後の文字「オ」も図11の辞書情報管理表に存在しない、と判断する。そして、要素分割手段11321は、文字「オ」に、未知語であることを示す情報である「未知語」フラグを付与する(図14の(21))。
次に、同様に、処理が行われ、要素分割手段11321は、文字「ケ」に、未知語であることを示す情報である「未知語」フラグを付与する(図14の(22))。
次に、要素分割手段11321は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段11321は、5番目の文字から6文字分の文字列「に行きたい。」を読み出し、バッファに配置する(図14の(23))。同様に、文字列「に行きたい。」に合致する第一文字列が、図11の辞書情報管理表に存在しない。そして、要素分割手段11321は、同様の処理により、1文字ずつ文字数を少なくして、辞書情報格納手段1131に検索しにいく(図14の(23)から(28))。そして、要素分割手段11321は、最後の文字「に」は図11の辞書情報管理表に存在する、と判断する。そして、要素分割手段11321は、バッファ上に配置した文字列と一致する第一文字列「に」と対になる前接続記号「−&」、後接続記号「o%」、および機能語情報「object」を、辞書情報格納手段1131から読み出し、メモリ上に配置する。そして、要素分割手段11321は、バッファ上に配置した文字列「に」に対して、読み出した前接続記号「−&」、後接続記号「o%」、および機能語情報「object」を付与する(図14の(29))。
以上の処理を繰り返し、処理対象の文「カラオケに行きたい。」について、図14の(x)のようなデータを得る。つまり、「カ」「ラ」「オ」「ケ」「行」「き」に対して、「未知語」が付与される。また、「に」に対して、「−&:o%:object」が付与される。また、「たい」に対して、「−&:−−:action」が付与される。さらに、「。」に対して、「:%%:」が付与される。「:%%:」は、後接続記号が「%%」であることを示す。後接続記号「%%」は、無条件に、後ろが区切られることを示す(図14の(x))。
次に、要素連結手段11322は、要素分割手段11321が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがなではない文字「カ」「ラ」「オ」「ケ」を連結し文字列「カラオケ」を構成する。また、要素連結手段11322は、要素分割手段11321が未知語フラグ「未知語」を付与した連続する未知語「行」「き」を連結した文字列「行き」を構成する。そして、要素連結手段11322は、連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報(ここでは、「未知語」)を付与し、バッファに書き込む。バッファ内の情報は、図14の(x+1)である。
次に、要素連結手段11322は、図14(x+1)の各前後するまとまりの文字列(例えば、「カラオケ」と「に」)が連結するか否かを判断し、連結するものは連結させる。
例えば、「カラオケ」と「に」は、「カラオケ」が未知語で、「に」の前接続記号「−&」により、要素連結手段11322は、連結すると判断する。なぜなら、前接続記号「−&」は、前の未知語と連結するからである。そして、要素連結手段11322は、「カラオケに」に対して、「:o%:object」を付与する(図14(x+2)参照)。「:o%:object」は、前接続記号はなし、後接続記号は「o%」、機能語情報は「object」であることを示す。
また、要素連結手段11322は、「行き」と「たい」は連結する、と判断し、連結させる。つまり、要素連結手段11322は、文字列「行きたい」を構成し、かつ、「:%−:action」を付与する(図14(x+2)参照)。
そして、要素連結手段11322は、「行きたい」と「。」は連結しない、と判断する。「。」は、無条件に、後ろが区切られる記号であり、前の文字列とは結合しない、とする。
次に、文字列取得手段11323は、1番目の第二文字列「カラオケに」を取得し、当該第二文字列の最後尾の第一文字列「に」に対応する機能語情報「object」または後接続記号「o%」から、第二文字列の種類を「準主題」であると、決定する。なお、ここでは、文字列取得手段11323は、後接続記号「o%」から、第二文字列「カラオケに」の種類を「準主題」であると、決定する(図14の(x+3))。
次に、文字列取得手段11323は、2番目の第二文字列「行きたい」を取得し、当該第二文字列の最後尾の第一文字列「たい」に対応する機能語情報「action」または後接続記号「%−」から、第二文字列の種類を「動作」であると、決定する。なお、ここでは、文字列取得手段11323は、機能語情報「action」から、第二文字列「行きたい」の種類を「動作」であると、決定する(図14の(x+3))。
次に、文字列取得手段11323は、メモリ上に配置する要素の順序を示す文構造「準主題、動作」を読み出す。なお、文構造「準主題、動作」は、あらかじめ文字列取得手段11323が保持している、とする。そして、文字列取得手段11323は、文構造「準主題、動作」に従って、第二文字列「カラオケに」「行きたい」をメモリ上に配置する。そして、文字列取得手段11323は、文要素に対応する種類の情報も、第二文字列と対にして、メモリ上に書き込む。そして、文字列取得手段11323は、「カラオケに:準主題、行きたい:動作」を得る。以上の処理により、文「カラオケに行きたい。」を、「準主題」と「動作」に分割できた。
次に、用語取得手段1133は、以下のように用語取得処理を行う。つまり、用語取得手段1133は、文字列取得手段11323により取得された第二文字列の種類のうち、「準主題」に対応する文字列「カラオケに」が有する用語「カラオケ」を、対象物として取得し、バッファに一時格納する。つまり、用語取得手段1133は、第二文字列「カラオケに」から第一文字列(機能語)「に」を除いて、「カラオケに」を取得する。
次に、用語取得手段1133は、文字列取得手段11323により取得された第二文字列の種類のうち、「動作状態」(ここでは「動作」)に対応する文字列「行きたい」を取得する。そして、提示情報取得部116の評価語取得手段1161は、当該文字列「行きたい」が評価情報格納部111に、評価語として格納されているか否かを判断する。ここで、図12の提示情報取得部116の評価語取得手段1161は、評価語「行きたい」を、図12の評価情報管理表から取得する。
次に、スコア取得手段1162は、取得された評価語「行きたい」に対応するスコア「+4」を読み出す。
次に、評価算出手段1163は、取得したスコア「+4」を変更する処理を行う。つまり、評価算出手段1163は、変更情報格納手段1165に格納されている変更情報(図13参照)が有する変更語の情報を用いて、文「カラオケに行きたい。」の中において、評価語「行きたい」の前後の所定以内の文字数(例えば、前後5文字)の距離内に、変更語(例えば、「ない」「あまり」など)が存在するか否かを判断する。ここで、変更語は存在しないので、スコア変更処理は行わない。
次に、提示情報取得手段1164は、用語取得手段1133が取得した1以上の用語「カラオケ」を用いて、取得され得る1以上の提示情報を、管理情報格納部115(図10参照)から検索し、取得する。つまり、提示情報取得手段1164は、用語「カラオケ」を対象物の属性値とするレコード(例えば、ID=「1」「6」「7」)を検索し、メモリ上に取得する。
次に、提示情報取得手段1164は、評価算出手段1163が取得したスコア「+4」と近似する範囲(例えば、差が「2」以内)のレコードであり、両者の位置情報から、両者の距離が予め決められた距離(D)内のレコードのみを取得する。つまり、まず、提示情報取得手段1164は、評価算出手段1163が取得したスコア「+4」と近似する範囲のレコード(ID=「1」「7」)に絞り込む。次に、提示情報取得手段1164は、両者の距離が予め決められた距離(D)内のレコード(ID=「1」)に絞り込む。なお、位置情報(x,y)と位置情報(x,y)の距離はD以内であり、位置情報(x,y)と位置情報(x,y)の距離はDより大きいとする。2地点の位置情報から、両地点の距離を算出する処理は公知技術であるので、説明を省略する。
次に、提示情報取得手段1164は、図10のID=「1」のレコードから、例えば、提示情報として、「ユーザ識別子「2345」、位置情報(x,y)、文章「カラオケ好きだ。」」を取得する。そして、提示情報出力部117は、取得された提示情報「ユーザ識別子「2345」、位置情報(x,y)、文章「カラオケ好きだ。」」をバッファに一時的に追記する。
次に、管理情報蓄積部114は、ユーザに提示する情報である提示情報を含む情報である管理情報を構成する。ここでの管理情報は、ユーザ識別子「3812」、位置情報(x,y)、対象物「カラオケ」、スコア「+4」、時刻情報「2008/2/4 11:58:02」、文章「カラオケに行きたい。」を含む情報である。なお、管理情報蓄積部114は、例えば、保有している時計から、現在時刻「2008/2/4 11:58:02」を取得し、時刻情報とする。管理情報蓄積部114は、構成した管理情報を、管理情報格納部115に蓄積し、図15の管理情報管理表を得る。図15の管理情報管理表において、ID=「129」のレコードが追記されている。
次に、提示情報出力部117は、バッファ中の提示情報「ユーザ識別子「2345」、位置情報(x,y)、文章「カラオケ好きだ。」」を、サーバ装置13の提示情報受付部133に引き渡す。なお、提示情報出力部117は、提示情報「ユーザ識別子「2345」、位置情報(x,y)、文章「カラオケ好きだ。」」に対して、予め決められた方法で文字列の加工を行い、「ユーザ「2345」さんもカラオケ好き。近くに居るよ。」という文字列に変換し、当該文字列を提示情報としても良い。かかる場合、提示情報出力部117は、文字列生成のための雛形「ユーザ<ユーザ識別子>さんも<対象物>好き。近くに居るよ。」を保持しており、当該雛形に<ユーザ識別子>、<対象物>(これらは変数である)を代入することにより、提示情報を構成しても良い。
そして、サーバ装置13の提示情報受付部133は提示情報を受け付け、提示情報送信部134は当該提示情報を、ユーザAの端末装置12に送信する。
次に、端末装置12の受信部123は、当該提示情報を受信する。そして、出力部124は、図16に示すように、当該提示情報を出力する。なお、図16の出力態様は、提示情報の出力例であることは言うまでもない。また、本Twitterにおいて、ユーザ識別子が分かれば、当人にアクセス可能である、とする。このことによって、ユーザAは、ユーザ「2345」さんにアクセスでき、一緒にカラオケに行くこととなる可能性もあり、趣味の合う人との活発なコミュニケーションが促進される。
(具体例2)
具体例2では、評価語を用いない場合の例である。端末装置12のユーザAは、ユーザ識別子「3333」とパスワードを入力し、Twitterを利用するためのサーバ装置13にログインした、とする。
そして、新宿駅に居るユーザAは、「ひまだ」と、時刻「2008/2/4 11:58:05」に、端末装置12に入力した、とする。すると、受付部121は「ひまだ」を受け付ける。そして、送信部122は、文章「ひまだ」、ユーザ識別子「3333」、および位置情報「新宿駅」をサーバ装置13に送信する。なお、端末装置12は、IRタグ受信機能を具備しており、端末装置12が存在する近くにIRタグの発信機から発信される「新宿駅」という現在地点を示す情報を受信できる、とする。また、端末装置12は、自身が保有する時計から時刻情報「2008/2/4 11:58:05」を取得する。そして、端末装置12は、「ユーザID:3333,文章:ひまだ,時刻情報:2008/2/4 11:58:05,位置情報:新宿駅」という情報を構成し、サーバ装置13に送信する。
次に、サーバ装置13の文章受信部131は情報「ユーザID:3333,文章:ひまだ,時刻情報:2008/2/4 11:58:05,位置情報:新宿駅」を受信する。次に、文章出力部132は、ユーザ識別子「3333」で識別されるユーザAが入力した文章であることを示す情報(例えば、ユーザAのペンネームや氏名やユーザ識別子など)と対応付けて、文章「ひまだ」を、所定のファイルに追記する。
次に、情報処理装置11は、Twitterを利用して投函された情報(文章「ひまだ」など)を、以下のように処理する。
つまり、情報処理装置11の文章取得部112は、サーバ装置13を、例えば、クローリングして、文章「ひまだ」、ユーザ識別子「3333」、時刻情報「2008/2/4 11:58:05」、および位置情報「新宿駅」を取得する。なお、文章取得部112は、クローリング以外の方法で、サーバ装置13から情報を取得しても良い。また、クローリングする場合、文章取得部112は、短い時間間隔で、定期的にクローリングすることは好適である。
次に、文章処理部113は、1番目の文「ひまだ」を取得する。なお、ここでは、文章取得部112が取得した文章では、1番目の文しか存在しない。次に、文章処理部113は、取得した文「ひまだ」に対して、以下のように、図5のフローチャートに従った、文の処理を行う。
文分割制御手段1132の要素分割手段11321は、文「ひまだ」の中の、1番目の文字から3番目(上記の「n」は「3」である)の文字までの文字列「ひまだ」を取得し、バッファ上に置く(図17の(1))。
そして、要素分割手段11321は、文字列「ひまだ」を、辞書情報格納手段1131に検索しにいく。しかし、文字列「ひまだ」に合致する第一文字列が、図11の辞書情報管理表に存在しないので、要素分割手段11321は、先の文字列より1文字少ない文字列「ひま」を構成する。そして、要素分割手段11321は、文字列「ひま」をバッファ上に置く(図17の(2))。そして、同様に、要素分割手段11321は、文字列「ひま」を、辞書情報格納手段1131に検索しにいく。しかし、文字列「ひま」に合致する第一文字列が、図11の辞書情報管理表に存在しないので、要素分割手段11321は、先の文字列より1文字少ない文字列「ひ」を構成し、バッファ上に置く(図17の(3))。そして、要素分割手段11321は、文字列「ひ」を、辞書情報格納手段1131に検索しにいく。同様に、文字列「ひ」に合致する第一文字列が、図11の辞書情報管理表に存在しない。そして、要素分割手段11321は、文字「ひ」に、未知語であることを示す情報である「未知語」フラグを付与する(図17の(4))。
次に、要素分割手段11321は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段11321は、2番目の文字から6文字分の文字列「まだ」を読み出し、バッファに配置する(図17の(5))。そして、同様に、要素分割手段11321は、文字列「まだ」を、辞書情報格納手段1131に検索しにいく。同様に、文字列「まだ」に合致する第一文字列が、図11の辞書情報管理表に存在しない。そして、要素分割手段11321は、同様の処理により、1文字、文字数を少なくして、辞書情報格納手段1131に検索しにいく(図17の(6))。そして、要素分割手段11321は、文字「ま」も図11の辞書情報管理表に存在しない、と判断する。そして、要素分割手段11321は、文字「ま」に、未知語であることを示す情報である「未知語」フラグを付与する(図17の(7))。
次に、要素分割手段11321は、処理対象の文字列の先頭のポインタを1ずらす。そして、要素分割手段11321は、文字列「だ」を読み出し、バッファに配置する(図17の(8))。そして、要素分割手段11321は、同様の処理により、文字「だ」をキーとして、辞書情報格納手段1131に検索しにいく。そして、要素分割手段11321は、文字「だ」は図11の辞書情報管理表に存在する、と判断する。そして、要素分割手段11321は、バッファ上に配置した文字列と一致する第一文字列「だ」と対になる前接続記号「−&」、後接続記号「%−」、および機能語情報「state」を、辞書情報格納手段1131から読み出し、メモリ上に配置する。そして、要素分割手段11321は、バッファ上に配置した文字列「だ」に対して、読み出した前接続記号「−&」、後接続記号「%−」、および機能語情報「state」を付与する(図17の(9))。
次に、要素連結手段11322は、要素分割手段11321が未知語フラグ「未知語」を付与した連続する未知語であり、ひらがな文字「ひ」「ま」を連結し文字列「ひま」を構成する。そして、要素連結手段11322は、連結した文字列「ひま」に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報(ここでは、「未知語」)を付与し、バッファに書き込む。バッファ内の情報は、図17の(11)である。
また、要素連結手段11322は、「ひま」と「だ」は連結する、と判断し、連結させる。つまり、要素連結手段11322は、文字列「ひまだ」を構成し、かつ、「:%−:state」を付与する(図17(12)参照)。
次に、文字列取得手段11323は、1番目の第二文字列「ひまだ」を取得し、当該第二文字列の最後尾の第一文字列「だ」に対応する機能語情報「stete」または後接続記号「%−」から、第二文字列の種類を「状態」であると、決定する。なお、ここでは、文字列取得手段11323は、機能語情報「stete」から、第二文字列「ひまだ」の種類を「状態」であると、決定する(図17の(13))。
次に、用語取得手段1133は、以下のように用語取得処理を行う。つまり、用語取得手段1133は、文字列取得手段11323により取得された第二文字列の種類のうち、「状態」に対応する文字列「ひまだ」が有する用語「ひま」を、対象物として取得し、バッファに一時格納する。つまり、用語取得手段1133は、第二文字列「ひまだ」から第一文字列(機能語)「だ」を除いて、「ひま」を取得する。
次に、提示情報取得手段1164は、用語取得手段1133が取得した1以上の用語「ひま」を用いて、取得され得る1以上の提示情報を、管理情報格納部115(図10参照)から検索し、取得する。つまり、提示情報取得手段1164は、用語「ひま」を対象物の属性値とするレコード(例えば、ID=「4」など)を検索し、時刻情報が予め決められた時間以内(例えば、10分以内)であり、位置情報が一致する(例えば、両方「新宿駅」)であるレコード(ID=「4」)をメモリ上に取得する。
次に、提示情報取得手段1164は、図10のID=「4」のレコードから、例えば、提示情報として、「ユーザ識別子「573」、位置情報(新宿駅)、時刻情報「2008/2/4 10:02:08」、文章「ひまだねえー。」」を取得する。そして、提示情報出力部117は、取得された提示情報「ユーザ識別子「573」、位置情報(新宿駅)、時刻情報「2008/2/4 10:02:08」、文章「ひまだねえー。」」をバッファに一時的に追記する。
次に、管理情報蓄積部114は、ユーザに提示する情報である提示情報を含む情報である管理情報を構成する。ここでの管理情報は、ユーザ識別子「3333」、位置情報「新宿駅」、対象物「ひま」、時刻情報「2008/2/4 11:58:05」、文章「ひまだ」を含む情報である。管理情報蓄積部114は、構成した管理情報を、管理情報格納部115に蓄積し、図15の管理情報管理表を得る。図15の管理情報管理表において、ID=「130」のレコードが追記されている。
次に、提示情報出力部117は、バッファ中の提示情報「ユーザ識別子「573」、位置情報(新宿駅)、時刻情報「2008/2/4 10:02:08」、文章「ひまだねえー。」」を、サーバ装置13の提示情報受付部133に引き渡す。なお、提示情報出力部117は、提示情報「ユーザ識別子「573」、位置情報(新宿駅)、時刻情報「2008/2/4 10:02:08」、文章「ひまだねえー。」」に対して、予め決められた方法で文字列の加工を行い、「ユーザ「573」さんもひまだよ。近くに居るよ。」という文字列に変換し、当該文字列を提示情報としても良い。かかる場合、提示情報出力部117は、文字列生成のための雛形「ユーザ<ユーザ識別子>さんも<対象物>だよ。近くに居るよ。」を保持しており、当該雛形に<ユーザ識別子>、<対象物>を代入することにより、提示情報を構成しても良い。
そして、サーバ装置13の提示情報受付部133は提示情報を受け付け、提示情報送信部134は当該提示情報を、ユーザAの端末装置12に送信する。
(具体例3)
具体例3では、端末装置12に送信され、出力される情報は、広告情報である。今、図10に示す管理情報管理表に代えて、管理情報格納部115には、図18の管理情報管理表が格納されている。管理情報管理表は、管理情報を管理する表であり、「ID」「対象物」「位置情報」「スコア条件」「広告情報」の属性値を有するレコードを1以上、格納している。「スコア条件」とは、ユーザの評価に対する条件であり、「広告情報」を出力する場合の情報である。なお、「スコア条件」がNULLの場合は、ユーザの評価に対する条件が存在しない、こととなる。
かかる状況において、具体例1と同様に、端末装置12のユーザAは、ユーザ識別子「3812」とパスワードを入力し、Twitterを利用するためのサーバ装置13にログインした、とする。
そして、ユーザAは、「カラオケに行きたい。」と端末装置12に入力した、とする。すると、受付部121は「カラオケに行きたい。」を受け付ける。そして、送信部122は、文章「カラオケに行きたい。」、ユーザ識別子「3812」、および位置情報(x,y)をサーバ装置13に送信する。
次に、サーバ装置13の文章受信部131は「カラオケに行きたい。」、ユーザ識別子「3812」、および位置情報(x,y)を受信する。次に、文章出力部132は、ユーザ識別子「3812」で識別されるユーザAが入力した文章であることを示す情報(例えば、ユーザAのペンネームや氏名やユーザ識別子など)と対応付けて、文章「カラオケに行きたい。」を、所定のファイルに追記する。
次に、情報処理装置11は、Twitterを利用して投函された情報(文章「カラオケに行きたい。」など)を、具体例1で説明した通りに、機能素解析の技術を用いて処理する。そして、用語取得手段1133は、「カラオケに:準主題」、「行きたい:動作状態」を取得する。
また、スコア取得手段1162は、評価語「行きたい」に対応するスコア「+4」を読み出す。
次に、提示情報取得手段1164は、用語取得手段1133が取得した1以上の用語「カラオケ」を用いて、取得され得る1以上の提示情報を、図18の管理情報管理表から検索し、取得する。つまり、提示情報取得手段1164は、用語「カラオケ」を対象物の属性値とするレコード(ここでは、例えば、ID=「2」「3」とする。)を検索し、メモリ上に取得する。
次に、提示情報取得手段1164は、評価算出手段1163が取得したスコア「+4」がスコア条件に合致するレコードであり、両者の位置情報から、両者の距離が予め決められた距離(D)内のレコードのみを取得する。ここで、提示情報取得手段1164は、ID=「2」「3」のレコードについて、スコア条件は満足する、と判断する。また、提示情報取得手段1164は、例えば、ID=「2」のレコードの位置情報(x,y)と、位置情報(x,y)の距離はDより大きいと判断し、ID=「3」のレコードの位置情報(x,y)と、位置情報(x,y)の距離はDより小さいと判断する、とする。そして、提示情報取得手段1164は、最終的に、ID=「3」のレコードの検索をマッチさせ、ID=「3」のレコードから提示情報を取得する。つまり、ここでは、提示情報取得手段1164は、ID=「3」の広告情報を取得する。
次に、管理情報蓄積部114は、具体例1で説明したように、図15のID=「129」のレコードを追記する。
次に、提示情報出力部117は、ID=「3」の広告情報を、サーバ装置13の提示情報受付部133に引き渡す。
そして、サーバ装置13の提示情報受付部133は当該広告情報を受け付け、提示情報送信部134は当該広告情報を、ユーザAの端末装置12に送信する。
次に、端末装置12の受信部123は、当該広告情報を受信する。そして、出力部124は、図19に示すように、当該提示情報を出力する。図19に示すように、本システムにおいて、あたかも独り言に答えてくれる相手が存在するかのように振舞う。
以上、本実施の形態によれば、ユーザが他人に読んでもらうために入力し、送信した文章と関連する情報を、ユーザに提示できる。その結果、ユーザは、現在のユーザの状況に適した情報を得ることができる。関連する情報とは、人の情報、広告情報などである。また、人の情報を提示することは、人の紹介である、とも言える。なお、人の情報とは、例えば、ユーザ識別子、ユーザの氏名、年齢などのプロフィールを含んでも良い。
また、本実施の形態によれば、ユーザが文章を送信した位置、時刻の情報を用いて、よりコンタクトを取りやすい人を、概ねリアルタイムに知ることができる。また、ユーザが文章からユーザの嗜好を分析することにより、当該ユーザと嗜好が会う人を紹介できる。
また、本実施の形態によれば、機能素解析の自然言語処理技術を用いることにより、twitter、ブログなどで多く見られる口語調の文章に対しても、精度高く自然言語処理でき、よりユーザの現在の状況(入力した文章)に適した情報を、ユーザに提示できる。
また、本実施の形態によれば、文章から抽出される評価語を利用した自然言語処理を行うことにより、ユーザが入力した文章から読み取れる、ユーザの対象物の評価に対応した情報(人を含む)を、ユーザに提示できる。そして、ユーザが着目している対象物と、同様の対象物に着目しているユーザに関する情報をユーザに提示できる。その結果、ユーザにとって、仲間作りを支援できる。
なお、本実施の形態における具体例において、時刻情報を用いて提示情報を取得しなったが、時刻情報を用いて提示情報を取得しても良い。つまり、ユーザが文章を送信してから所定時間以内に送信された文章から得られた管理情報から、提示情報を取得するようにしても良い。かかる場合、ユーザは、現在からあまり古くない時間帯に、同様の対象物に対して関心をもった他のユーザの情報を得ることができ、例えば、その他のユーザに連絡することにより、前記対象物に対する会話がはずみ、強力に仲間作りを支援できる。
また、本実施の形態における具体例において、文章は評価語を有した。しかし、上述したように、評価語を有しない文章を処理して対象物を取得し、当該対象物に対して着目している(言及している)ユーザの文章等から取得できる提示情報が出力されても良い。また、文章が評価語を含む場合でも、上述した評価語の処理を行わなくても良い。
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する文章取得部と、前記取得した文章から、当該文章を構成する1以上の用語を取得する文章処理部と、ユーザに提示する情報である提示情報を含む情報である管理情報が格納された記憶媒体から、前記1以上の用語を用いて取得され得る1以上の提示情報を取得する提示情報取得部と、前記提示情報取得部が取得した提示情報を出力する提示情報出力部として機能させるためのプログラム、である。
上記プログラムにおいて、前記文章処理部は、第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語情報と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納手段と、前記取得した文章の中の1以上の各文について、当該各文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御手段と、前記文分割制御手段が取得した第二文字列の種類のうち、文の主題または文の副題に対応する第二文字列が有する用語である対象物を取得する用語取得手段とを具備するものとしてコンピュータを機能させるためのプログラム、であることは好適である。
また、図20は、本明細書で述べたプログラムを実行して、上述した実施の形態の情報処理システム等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図20は、このコンピュータシステム340の概観図であり、図21は、コンピュータシステム340のブロック図である。
図20において、コンピュータシステム340は、FD(Flexible Disk)ドライブ、CD−ROM(Compact Disk Read Only Memory)ドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
図21において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、MPU3413と、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM(Read−Only Memory)3415と、CPU3413に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM(Random Access Memory)3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム340に、上述した実施の形態の情報処理システム等の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ341に、上述した実施の形態の情報処理システム等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段(端末情報送信部、端末情報受信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
以上のように、本発明にかかる情報処理システムは、ユーザが他人に読んでもらうために入力し、送信した文章と関連する情報を、ユーザに提示できる、という効果を有し、情報処理システム等として有用である。
実施の形態1における情報処理システム1の概念図 同情報処理システムのブロック図 同情報処理装置のブロック図 同情報処理装置の動作について説明するフローチャート 同具体例の動作について説明するフローチャート 同連結処理の動作について説明するフローチャート 同文分割処理の動作について説明するフローチャート 同メモリ配置処理の動作について説明するフローチャート 同スコア変更処理の動作について説明するフローチャート 同管理情報管理表を示す図 同辞書情報管理表を示す図 同評価情報管理表を示す図 同変更情報管理表を示す図 同文の処理の例を示す図 同管理情報管理表を示す図 同提示情報の出力例を示す図 同文の処理の例を示す図 同管理情報管理表を示す図 同提示情報の出力例を示す図 同コンピュータシステムの概観図 同コンピュータシステムのブロック図
符号の説明
1 情報処理システム
11 情報処理装置
12 端末装置
13 サーバ装置
111 評価情報格納部
112 文章取得部
113 文章処理部
114 管理情報蓄積部
115 管理情報格納部
116 提示情報取得部
117 提示情報出力部
121 受付部
122 送信部
123 受信部
124 出力部
131 文章受信部
132 文章出力部
133 提示情報受付部
134 提示情報送信部
1131 辞書情報格納手段
1132 文分割制御手段
1133 用語取得手段
1142 対象物取得手段
1161 評価語取得手段
1162 スコア取得手段
1163 評価算出手段
1164 提示情報取得手段
1165 変更情報格納手段
1313 変更スコア算出部
11321 要素分割手段
11322 要素連結手段
11323 文字列取得手段

Claims (11)

  1. ユーザに提示する情報である提示情報を含む情報である管理情報を格納し得る管理情報格納部と、
    ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する文章取得部と、
    前記取得した文章から、当該文章を構成する1以上の用語を取得する文章処理部と、
    前記管理情報格納部から、前記1以上の用語を用いて取得され得る1以上の提示情報を取得する提示情報取得部と、
    前記提示情報取得部が取得した提示情報を出力する提示情報出力部を具備する情報処理装置。
  2. 前記文章処理部は、
    第一文字列と、文中における前記第一文字列の機能または種類を特定する情報である機能語情報と、前記第一文字列の前に接続され得る文字列の種類を特定する情報である前接続記号と、前記第一文字列の後ろに接続され得る文字列の種類、または区切りであることを示す記号であり、当該記号により区切られた文中における第二文字列の種類を特定する情報である後接続記号とを対に有する辞書情報を1以上格納している辞書情報格納手段と、
    前記取得した文章の中の1以上の各文について、当該各文から区切りであることを示す後接続記号に対する第一文字列を取り出し、当該第一文字列をキーにして、文を2以上の文字列である2以上の第二文字列に区切り、当該第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、前記第二文字列の種類を特定する情報を取得し、当該第二文字列と第二文字列の種類を特定する情報を取得する文分割制御手段と、
    前記文分割制御手段が取得した第二文字列の種類のうち、文の主題または文の副題に対応する第二文字列が有する用語である対象物を取得する用語取得手段とを具備する請求項1記載の情報処理装置。
  3. 対象物の良し悪しに関する用語である評価語を有する評価情報を1以上格納している評価情報格納部をさらに具備し、
    前記管理情報は、
    対象物、当該対象物に対する評価を示す情報である評価関連情報、および提示情報を有し、
    前記用語取得手段は、
    対象物を取得し、かつ、前記対象物を含む第二文字列を有する文中の他の第二文字列の種類を用いて評価語を含み得る第二文字列を特定し、当該評価語を取得し、
    前記提示情報取得部は、
    前記用語取得手段が取得した対象物と評価語を用いて、ユーザの前記対象物に対する評価と一致または近似する評価に対応する評価関連情報、および前記対象物と対になる提示情報を、前記管理情報格納部から取得する請求項2記載の情報処理装置。
  4. 前記管理情報は、
    他のユーザが他の人に読んでもらうために入力した文章から取得される用語を含み、
    前記提示情報は、
    前記他のユーザが入力した文章または、前記他のユーザに関する情報である請求項1から請求項3いずれか記載の情報処理装置。
  5. 前記管理情報は、
    対象物と提示情報を含み、
    前記提示情報は、
    対象物に関連する広告情報を含む請求項1から請求項3いずれか記載の情報処理装置。
  6. 前記管理情報は、
    他のユーザが他の人に読んでもらうために入力した文章から取得される用語と、提示情報と、前記文章が取得された時刻に関する情報である時刻情報を含み、
    前記提示情報取得部は、
    前記文章取得部が文章を取得した時刻と比較して、予め決められた時間以内の時刻を示す時刻情報に対応する提示情報の中から選択して、提示情報を取得する請求項1から請求項5いずれか記載の情報処理装置。
  7. 前記管理情報は、
    さらに位置情報を含み、
    前記文章取得部は、
    前記文章と、前記ユーザの位置を示す位置情報を取得し、
    前記提示情報取得部は、
    前記文章取得部が取得した位置情報と比較して、予め決められた関係を有する位置情報に対応する提示情報の中から選択して、提示情報を取得する請求項1から請求項5いずれか記載の情報処理装置。
  8. 前記文分割制御手段は、
    前記取得した文章の中の1以上の各文の先頭から予め決められたサイズ(n文字[nは2以上の整数])の第三文字列を切り出し、
    前記切り出した第三文字列を構成する文字列であって、先頭からn文字の文字列から順に、前記辞書情報格納手段に当該文字列が存在するか否かを判断し、n文字の文字列が存在しない場合には、先頭から(n−1)文字の文字列が前記辞書情報格納手段に存在するか否かを判断し、かかる判断を、1文字ずつ文字数を減らして、文字列が存在するまで行い、または、文字列が存在しない場合には、先頭から1文字になるまでかかる判断を行い、
    文字列が存在すると判断した場合には、当該文字列に対応する機能語情報と前接続記号と後接続記号とを、前記辞書情報格納部から読み出し、読み出した機能語情報と前接続記号と後接続記号とを当該文字列に付与し、
    文字列が存在しない場合には、1文字の文字列に対して未知語であることを示す情報である未知語情報を付与する要素分割手段と、
    前記要素分割手段が未知語情報を付与した連続する未知語であり、ひらがなの文字を連結し文字列を構成し、かつ連続する未知語であり、ひらがなではない文字を連結し文字列を構成し、
    前記連結した文字列、または連結されなかった未知語の文字に対してまとまりであることを示す文字列の種類を特定する情報であるまとまり情報を付与し、
    隣接する2つの、前記要素分割手段が分割した要素またはまとまり情報を読み出し、
    当該読み出した要素またはまとまり情報のうち、前出の要素またはまとまり情報の後接続記号と、後出の要素またはまとまり情報の前接続記号から、前出の要素またはまとまり情報と後出の要素またはまとまり情報が連結可能であるか否かを判断し、
    連結可能な要素またはまとまり情報を一つの文字列にまとめて、当該まとめた文字列である第二文字列を、複数取得する要素連結手段と、
    前記要素連結手段が取得した複数の各第二文字列の最後尾の第一文字列に対応する機能語情報または後接続記号から、前記各第二文字列の種類を特定する情報を決定し、
    当該複数の各第二文字列の種類を特定する情報と、当該複数の各第二文字列を対にした複数の対の情報をメモリ上に配置する文字列取得手段を具備する請求項2から請求項8いずれか記載の情報処理装置。
  9. 前記ユーザが他の人に読んでもらうために入力した文章は、twitterへ入力された文章である請求項1から請求項9いずれか記載の情報処理装置。
  10. 文章取得部、文章処理部、提示情報取得部、および提示情報出力部により実現される情報処理方法であって、
    前記文章取得部により、ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する文章取得ステップと、
    前記文章処理部により、前記取得した文章から、当該文章を構成する1以上の用語を取得する文章処理ステップと、
    前記提示情報取得部により、ユーザに提示する情報である提示情報を含む情報である管理情報が格納された記憶媒体から、前記1以上の用語を用いて取得され得る1以上の提示情報を取得する提示情報取得ステップと、
    前記提示情報出力部により、前記提示情報取得ステップで取得した提示情報を出力する提示情報出力ステップを具備する情報処理方法。
  11. コンピュータを、
    ユーザを識別するユーザ識別子と、当該ユーザが他の人に読んでもらうために入力した文章を取得する文章取得部と、
    前記取得した文章から、当該文章を構成する1以上の用語を取得する文章処理部と、
    ユーザに提示する情報である提示情報を含む情報である管理情報が格納された記憶媒体から、前記1以上の用語を用いて取得され得る1以上の提示情報を取得する提示情報取得部と、
    前記提示情報取得部が取得した提示情報を出力する提示情報出力部として機能させるためのプログラム。
JP2008030542A 2008-02-12 2008-02-12 情報処理装置、情報処理方法、およびプログラム Pending JP2009193133A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008030542A JP2009193133A (ja) 2008-02-12 2008-02-12 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008030542A JP2009193133A (ja) 2008-02-12 2008-02-12 情報処理装置、情報処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JP2009193133A true JP2009193133A (ja) 2009-08-27

Family

ID=41075115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008030542A Pending JP2009193133A (ja) 2008-02-12 2008-02-12 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP2009193133A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011086056A (ja) * 2009-10-14 2011-04-28 Kinki Univ 情報処理装置、情報処理方法、およびプログラム
JP2011192180A (ja) * 2010-03-16 2011-09-29 Equos Research Co Ltd 情報サービス提供システム
JP2012039561A (ja) * 2010-08-11 2012-02-23 Funai Electric Co Ltd コンテンツ関連情報通知装置
JP2012113434A (ja) * 2010-11-22 2012-06-14 Internatl Business Mach Corp <Ibm> 複数の投稿(データのグループ)を複数の軸に沿ってリアルタイムにコンピュータ画面に表示する方法およびコンピュータ・プログラム
JP2014092797A (ja) * 2012-10-31 2014-05-19 Olympus Corp 端末装置、サーバシステム及びプログラム
US8930367B2 (en) 2012-07-17 2015-01-06 Fuji Xerox Co., Ltd. Non-transitory computer-readable medium, information classification method, and information processing apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011086056A (ja) * 2009-10-14 2011-04-28 Kinki Univ 情報処理装置、情報処理方法、およびプログラム
JP2011192180A (ja) * 2010-03-16 2011-09-29 Equos Research Co Ltd 情報サービス提供システム
JP2012039561A (ja) * 2010-08-11 2012-02-23 Funai Electric Co Ltd コンテンツ関連情報通知装置
JP2012113434A (ja) * 2010-11-22 2012-06-14 Internatl Business Mach Corp <Ibm> 複数の投稿(データのグループ)を複数の軸に沿ってリアルタイムにコンピュータ画面に表示する方法およびコンピュータ・プログラム
US9513767B2 (en) 2010-11-22 2016-12-06 International Business Machines Corporation Displaying posts in real time along axes on a computer screen
US8930367B2 (en) 2012-07-17 2015-01-06 Fuji Xerox Co., Ltd. Non-transitory computer-readable medium, information classification method, and information processing apparatus
JP2014092797A (ja) * 2012-10-31 2014-05-19 Olympus Corp 端末装置、サーバシステム及びプログラム

Similar Documents

Publication Publication Date Title
US20190311709A1 (en) Computerized system and method for formatted transcription of multimedia content
US9679060B2 (en) Following online social behavior to enhance search experience
US9442903B2 (en) Generating preview data for online content
US10133710B2 (en) Generating preview data for online content
CN104903886A (zh) 基于社交图谱信息的结构化搜索查询
KR20130083012A (ko) 음악컨텐츠 추천장치, 그 추천방법 및 기록매체
JP2009076043A (ja) メッセージから活動関連のコンテキスト情報を推測するための方法
TW200947234A (en) Techniques for input recognition and completion
JP6262613B2 (ja) 提示装置、提示方法及び提示プログラム
KR20150016786A (ko) 대화의 소재를 제공하는 장치, 서버 및 방법
CN104823183A (zh) 基于特征的候选选择
JP2009193133A (ja) 情報処理装置、情報処理方法、およびプログラム
WO2012151743A1 (en) Methods, apparatuses and computer program products for providing topic model with wording preferences
JP6605410B2 (ja) 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム
JP2009223749A (ja) 情報処理装置、情報処理方法、およびプログラム
JP4744404B2 (ja) 評価出力装置、評価出力方法、およびプログラム
JP2014153977A (ja) コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム
JP2017134675A (ja) 情報検索装置及びプログラム
JP2009122738A (ja) 情報処理装置、情報処理方法、およびプログラム
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
JP4484957B1 (ja) 検索式生成装置、検索式生成方法、およびプログラム
JP5741242B2 (ja) プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム
KR101756738B1 (ko) 메시지 기반 관련 앱 제공 방법 및 그 장치
JP2009042841A (ja) コンテンツ管理装置
US20210183123A1 (en) Method and System for Providing Multi-Dimensional Information Using Card