JP5229226B2 - 情報共有システム、情報共有方法、および情報共有プログラム - Google Patents

情報共有システム、情報共有方法、および情報共有プログラム Download PDF

Info

Publication number
JP5229226B2
JP5229226B2 JP2009529006A JP2009529006A JP5229226B2 JP 5229226 B2 JP5229226 B2 JP 5229226B2 JP 2009529006 A JP2009529006 A JP 2009529006A JP 2009529006 A JP2009529006 A JP 2009529006A JP 5229226 B2 JP5229226 B2 JP 5229226B2
Authority
JP
Japan
Prior art keywords
information
bulletin board
topic
text
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009529006A
Other languages
English (en)
Other versions
JPWO2009025193A1 (ja
Inventor
聡 中澤
崇博 池田
邦彦 定政
剛巨 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009529006A priority Critical patent/JP5229226B2/ja
Publication of JPWO2009025193A1 publication Critical patent/JPWO2009025193A1/ja
Application granted granted Critical
Publication of JP5229226B2 publication Critical patent/JP5229226B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、情報共有システム、情報共有方法、および情報共有プログラムに係り、特に同じ題目に対する情報を共有するための技術に関するものである。
Webページに記載された情報など電子化された情報に対して、同じ題目に対する情報を共有する複数の技術が存在する。なお、ここでの「題目」とは、あるテキストの中心的な話題、テーマを指す。
ある題目に対する情報を共有する技術の例として、ブログのコメント機能(従来技術1)や電子掲示板(従来技術2。以下「掲示板」と称する。)が挙げられる。
従来技術1は、ブログの閲覧者が、元の記事を読んだ感想やコメント、追加情報などをコメントとして、元のブログのページに投稿することができる機能である。後でそのブログを読んだ別の閲覧者は、元の記事に加えて投稿されたコメントも読むことができ、同じブログページを読んだ他の閲覧者の感想や、追加情報などを元のブログページの情報に加えて得ることができる。また、閲覧者間でコメント欄を通じて、議論や意見交換も可能となる。
従来技術2は、スレッド(題目ごとに設けられた掲示板機能を有するページ)に対して、ユーザが新たな情報を追加するものである。ユーザが任意にスレッドを新規作成することも可能である。この技術により、ユーザ間での意見交換の場を提供することができる。また、掲示板には一つのスレッドに対して多くの情報が追加されるため、題目に対する情報を効率的に参照できるという、参照的な機能としても有効である。
従来技術では、ある題目に対する情報が分散するため、情報が効率的に共有できないという問題点があった。
従来技術1では、そのブログの閲覧者間での情報共有は可能である。しかし、ブログは基本的には情報発信者(ブログ作成者)に紐づいて情報発信を行うものである。Web上などでは多数の情報発信者が独立に様々な題目に関して情報を発信しているため、こうした、同じあるいは類似の題目を取り扱う独立に作成されたページが多く存在している。そのどれか1つを閲覧した閲覧者が、閲覧したブログに有用なコメントを追加しても、他の同様の題目を取り扱うブログの閲覧者は、そのコメントの存在を気づくことはできない。
一方、従来技術2は、情報発信者ではなくスレッドに紐づくものであり、題目に対する情報の追加や議論に適した情報共有ツールである。ある題目に対する情報を追加するときに、皆が特定の掲示板における特定のスレッドに追加すれば、情報が分散することはない。
しかし、任意のタイトルでスレッドを作成できるため、スレッドと題目が一意になるとは限らない。よって、同じような題目に関して複数のスレッドが存在し、どのスレッドを参照すればよいのか曖昧になるという問題が存在する。
また、皆が特定の掲示板に対して情報を追加するとは限らない。例えば、当然その掲示板の存在をしらない人は利用できない。さらに、ブログなどの閲覧者にとっては、ブログの閲覧中に従来技術1を用いて新たな情報をブログのページに追加できてしまうため、別途掲示板の中から自らの興味がある題目に関連するスレッドを検索して情報を追加する、という行動を取ることは考えにくい。
本発明はこのような問題を解消するためになされたものであり、ある題目に対してより効率的に情報共有する、情報共有装置、情報共有システム、情報共有方法、および情報共有用プログラムを提供することを目的とする。
本発明における情報共有システムは、
指定区間テキストに対して言語解析を行い言語解析情報を出力する指定区間言語解析手段と、
前記言語解析情報に基づき、前記指定区間テキストから、前記指定区間テキストに対するコメントを記録するための掲示板を指し示す題目情報を、後記、題目生成ポリシー記憶部を参照して生成する指定区間題目生成手段と、
前記指定区間題目生成手段が、前記指定区間テキストの言語解析情報から、前記題目情報を生成する際に、題目情報として区別しない情報を削除・縮退させるための規則を格納する題目生成ポリシー記憶部と、
前記指定区間題目生成手段がこれまで生成した題目情報をIDとして、各題目情報に対応する掲示板のアドレス情報を各題目情報と組で格納する掲示板情報記憶部と、
前記掲示板情報記憶部を参照し、前記題目情報が指し示す掲示板のアドレス情報が存在する場合は、該アドレス情報、ないしは該題目情報と該アドレス情報との組を対応掲示板情報として出力する掲示板管理手段と
を備えたことを特徴とする。
本発明の効果は、同じ題目の情報をより効率的に共有できる点である。
その理由は、指定区間言語解析手段において、指定されたテキスト区間の言語解析を行い、指定区間生成部において、言語解析結果に応じた題目情報を生成し、掲示板管理手段において、生成された題目情報の掲示板がすでに存在する場合はそのアドレスをユーザに通知するためである。
よって、ブログなど掲示板以外のページを閲覧しているユーザが、閲覧している内容に関連する掲示板が存在することを知ることができるため、掲示板に対して新しい情報を追加するようにユーザを誘導することができる。また、情報を追加しないユーザにとっても、掲示板を参照することでより多くの情報を得ることができる。
また、言語解析を行うことで多少表現が異なっても同じ題目情報として認識してスレッドと関連づけることができるため、題目とスレッドとを一意に定めることができ、さらに効率的に同じ題目に対する情報を共有できる。
次に、発明を実施するための最良の形態について図面と例を参照して詳細に説明する。
(第1の実施の形態)
図1を参照すると、本発明の第1の実施の形態は、処理装置10と記憶装置20から構成される。処理装置10は、ドキュメントブラウザ手段11と、閲覧中のドキュメントからコメントを登録したいテキスト区間を指定するユーザ指定区間入力手段12と、ユーザが指定したテキスト区間の言語解析を行う指定区間言語解析手段13と、指定したテキスト区間の言語解析結果を受け付けて、その区間の言語解析結果に応じた題目情報を生成する指定区間題目生成手段14aと、生成された題目情報の掲示板が掲示板情報記憶部23中にすでに存在するかを判定し、対応掲示板情報として出力する掲示板管理手段15aと、前記対応掲示板情報をドキュメントブラウザ手段11に表示させる対応掲示板情報出力手段16からなる。また、記憶装置20は、ドキュメント情報記憶部21、言語解析用辞書記憶部22、題目情報毎の掲示板の情報を格納する掲示板情報記憶部23から構成される。言語解析用辞書記憶部22は、言語解析に用いる単語辞書記憶部221と、言語解析時に同一視する単語や複数単語からなる表現を格納した同義表現辞書記憶部222を備える。掲示板情報記憶部23は、各題目情報に対応する掲示板のアドレスなどの情報を記憶するアドレス情報記憶部231と、各題目情報に対応するコメント情報を記憶するコメント情報記憶部232を備える。アドレス情報記憶部231とコメント情報記憶部232に格納されている情報は、1つにまと
めて格納してもよい。
なお、ここで「題目情報」とは、後述する掲示板情報記憶部23に記憶されている掲示板の情報から、特定の1つの掲示板を指定する掲示板のIDのことをいうものとする。掲示板のIDであるから、題目情報が異なれば別の掲示板を示し、逆に掲示板が同一ならば、その題目情報は必ず同じものとなる。
ドキュメントブラウザ手段11は、ユーザがWeb文書やオフィス文書などのドキュメントを閲覧するためのブラウザである。ドキュメントを閲覧する機能さえ含まれていれば、編集機能を搭載したワープロなどのエディタであってもよいし、他のアプリケーションに組み込まれたドキュメントビューアーであってもよい。ユーザが閲覧するドキュメントも、テキストだけにとどまらず、動画や静止画など一般にWWW上で公開されているマルチメディアドキュメントであってもよい。ただし、後述する対応掲示板情報出力手段16が出力する、閲覧しているドキュメント中のテキスト区間と、そのテキスト区間に対応する掲示板へのアドレスを受け取り、対応する掲示板にアクセスする機能は必ず備えている必要がある。受け取った掲示板へのアドレスは、ハイパーリンクとして、対応するテキスト区間に埋め込んで表示してもよい。また、ドキュメントの最後や、ページの区切りなどに、受け取った掲示板アドレスをまとめて表示してもよい。さらには、掲示板へのアドレスだけでなく、各掲示板に格納されているコメントの全部または一部を、閲覧するドキュメント自体とは区別できるようフォントやインデントなどの表示の仕方を変えて出力し、ユーザが掲示板自体にアクセスしなくとも、そのコメントの内容を見ることができるような機能を提供してもよい。
ユーザ指定区間入力手段12は、ドキュメントブラウザ手段11でユーザが閲覧するドキュメントに含まれている任意のテキスト区間をユーザが指定するための入力インターフェースである。テキスト区間の指定方法としては、一般にインターネットブラウザやワープロ等で用いられているテキストの範囲指定法であれば任意のものであってよい。たとえば、マウスを用いてテキスト区間の先頭と終端を指定する、カーソルで範囲指定する、ユーザが指定したドキュメント中のあるポイントを含むテキスト区間で文や段落、章節などのテキスト構造で区切られる区間をとる、などでよい。ユーザ指定区間入力手段12で指定された指定区間テキストは、後述する指定区間言語解析手段13に出力される。
指定区間言語解析手段13は、後述する言語解析用辞書記憶部22を参照して、入力された指定区間テキストの言語解析を行い、言語解析情報を出力するモジュールである。言語解析の結果、入力された指定区間テキストは、そのテキストの意味内容を示す言語表現形式に変換される。どのような言語表現形式を取るかは、指定区間テキストにどのような言語解析技術を用いるかによって変わる。よって、本発明を実施する際の用途や目的に応じた言語解析技術をこのモジュールに搭載する。可能な言語解析技術とその結果の言語表現形式の例としては、図2のような組合せが考えられる。この図2に挙げている例自体は、既存の自然言語処理技術である。また、言語解析技術の欄に、複数の技術が挙げられている行があるが、これら全てを用いる必要がある訳ではなく、この中のどれか1つ以上を適宜用いればよい。
例えば、係り受け解析技術を用いる場合、「健康食品Aの実績と販売経路」のようなテキスト区間を「健康食品A −> 実績、健康食品A−> 販売経路」のような言語表現形式にすることができる。
また指定区間テキストから「いつ」「どこで」「誰が」「何を」「何のために」「どうする」といった5W1Hの要素を抽出し、そのテキストの意味内容を示す言語表現形式としても良い。固有表現の抽出技術などがこのために使用できる。たとえば「支出分析のため、横浜市の近年の乳幼児増加傾向を以下に示す」といったテキストから、「いつ −> 近年」「どこで −> 横浜市」「何を −> 乳幼児増加傾向」「どうする −> 示す」といった5W1H要素が抽出される。
さらに、指定区間言語解析手段13で行う言語解析処理に対し、入力された指定区間テキストに含まれている情報が不十分の場合には、元のドキュメント中の指定区間テキストの前後からテキストをさらに抽出して、入力された指定区間テキストに加え、言語解析処理を行っても良い。また、5W1H「いつ」「誰が」などの要素を抽出する際に、指定区間テキストだけでなく元のドキュメントに付与されているプロパティ情報を読み出して、ドキュメントの作成日時や作成者などの情報から、それらの要素を抽出しても良い。
指定区間題目生成手段14aは、指定区間言語解析手段13で作成された言語解析情報を受け取り、それを基に、題目情報を生成する。
本発明を実施する際に、題目情報を、掲示板情報記憶部23で管理されている複数の掲示板から1つを特定する掲示板IDとしてのみ用いる場合は、言語解析情報をそのまま題目情報として生成する。ただし、題目情報を掲示板の名前として活用し、ユーザにも提示する場合には、言語表現形式である言語解析情報のままだと可読性が低いため、言語表現を再び自然言語で書かれたテキスト表現に変換し、変換結果を題目情報として生成しても良い。言語表現から自然言語形式への変換には、機械翻訳などで用いられているテキスト合成の技術を使用する。例えば、単語の2項間関係で書かれた「ゲーム機P −> 販売、ゲーム機W −> リコール」は、「ゲーム機Pの販売と、ゲーム機Wのリコール」のようにテキスト合成できる。テキスト合成の結果、題目情報の掲示板IDとしての一意性が失われるおそれがある場合には、テキスト合成前の言語表現を掲示板を規定するIDとして利用し、テキスト合成結果はユーザに提示する掲示板のタイトルとするように、セットで用いても良い。
また、題目情報自体は掲示板を一意に指定するIDとするが、1つの言語解析情報から、複数の題目情報を生成しても良い。その場合、ユーザが指定した指定区間テキストには複数の異なる掲示板が対応するため、後述する指定区間用掲示板アドレス出力手段も、複数の掲示板へのアドレスを返すこととなる。ユーザがコメントを登録・閲覧する場合には、コメントを登録・閲覧する掲示板を別途選択するか、全ての掲示板に対してコメントを登録・閲覧することになる。例えば、「ゲーム機P −> 販売、ゲーム機W −> リコール」のような複数の並列した言語表現を受け取った場合には、「ゲーム機P −> 販売 & ゲーム機W −> リコール」のようにアンド条件で題目情報を規定するか、「ゲーム機P −> 販売」と「ゲーム機W −> リコール」の2つの題目情報に分割しても良い。どのように題目情報を分割・生成するかは、本発明を実施する際の用途・目的に応じて予め定めておく。
掲示板管理手段15aは、指定区間題目生成手段14aで生成された各題目情報に対して、掲示板情報記憶部23に一致する既存の題目情報が存在するかを判定する。
題目情報が一致する既存の掲示板が存在する場合には、その題目情報が示す掲示板へのアドレスを、その題目情報がどの指定区間テキストから得られたかの情報と組にして、対応掲示板情報として出力する。
題目情報が一致する既存の掲示板が存在しない場合には、まず掲示板情報記憶部23に新規にその題目情報の掲示板を作成し、ついで作成した新規の掲示板へのアドレスをどの指定区間テキストから得られたかの情報と組にして、対応掲示板情報として出力する。ここで、掲示板へのアドレスとは、httpアドレスなど、掲示板へアクセスするためのインターフェースサービスを提供するアドレスである。
なお、必ずしも新規にその題目情報の掲示板を作成する必要はない。「掲示板が存在しない」という情報を対応掲示板情報として出力してもよい。
掲示板管理手段15aは、ユーザが閲覧しているドキュメントの内容を掲示板に表示できるように動作させてもよい。具体的には、ユーザ指定区間入力手段12で入力された指定区間付近のテキスト情報や、httpなどドキュメントブラウザ手段11でユーザが閲覧しているドキュメントのアドレス情報などを、対応する題目情報の掲示板に対するコメントを格納しているコメント情報記憶部820に追加する形態などが挙げられる。もちろんこの形態に限ったものではない。これにより、ユーザは、掲示板を閲覧するだけで、同じ題目について記載されている他のドキュメントの記載内容も知ることができる。
対応掲示板情報出力部16は、掲示板管理部15aから、指定区間テキストと対応する掲示板へのアドレスを組にしてまとめ、対応掲示板情報としてドキュメントブラウザ手段11に返す。返し方としては、アドレスの情報を直接渡しても良いし、ドキュメントのファイルにアドレスの情報を埋め込んでも良い。
ドキュメントブラウザ手段11は、対応掲示板情報出力部16が出力した対応掲示板情報を参照し、指定区間テキストと対応する掲示板のアドレスを表示する。掲示板情報は、アドレスの情報を直接渡す形式でも良いし、ドキュメントのファイルにアドレスの情報を埋め込んだ形式でも良い。また、ドキュメントブラウザの表示方法は、指定区間テキスト部に掲示板に対するリンクをはってもよいし、掲示板のアドレスをテキスト情報として表示してもよい。さらに、掲示板が存在しない場合は、その旨を表示するか、指定区間テキストに対して何も出力しないことによって、対応する掲示板が存在しないことを示す。
ドキュメント情報記憶部21は、ユーザが閲覧しているドキュメントの情報を記憶する記憶部である。ドキュメントブラウザ手段11とインターネットで接続されており、ユーザはドキュメントブラウザ手段11を通じて、ドキュメント情報記憶部21に記憶された情報を閲覧することができる。
言語解析用辞書記憶部22は、指定区間言語解析手段13が言語解析を行う際に参照するための辞書データを記憶するもので、単語辞書記憶部221や同義表現辞書記憶部222を備えている。
単語辞書記憶部221は、指定区間言語解析手段13において、指定区間テキストを言語解析する際に用いられる単語の辞書である。各単語の辞書には、単語の表記や、単語の区切り、品詞や活用などの文法情報、単語間の接続の仕方を示す文法情報や統計情報、各単語が本発明を実施する際の用途や目的にとって重要かどうかを示すストップワードの情報、各単語の意味的なクラスを示す情報など、一般的な自然言語処理技術で用いられる辞書情報のうち、指定区間言語解析手段13での言語解析処理に必要な情報が格納される。
同義表現辞書記憶部222は、指定区間言語解析手段13での言語解析処理で、同一視する単語、または複数単語の組み合わせの集合を記述した辞書である。言語解析処理の際に、「インターネット」と「Internet」といった意味的には同じ単語の表記の揺れや、「登校」と「学校に行く」といった類似の表現を統一的に取り扱うために用いる。こうした同義表現辞書記憶部222自体は、単語辞書記憶部221と同じく、既存の自然言語処理技術の1つであり、本明細書では詳しくは取り扱わない。この同義表現辞書記憶部222にどのような単語の集合、または単語の組合せの集合を登録しておくかは、本発明を実施する際の用途や目的に応じて異なる。指定区間題目生成手段14aで、掲示板を規定する題目情報を生成する際に、同一視したい単語や単語の組合せの集合を登録する。
掲示板情報記憶部23は、掲示板の情報を格納するデータベースである。掲示板情報記憶部23には、掲示板のタイトルごとの情報を格納するアドレス情報記憶部231と、各掲示板毎に登録されているコメント情報記憶部820から構成される。掲示板の機能としては、WWW上などで広く使用されている一般的な掲示板と同様である。コメント情報記憶部は、コメント自体の他に、コメント登録の基となったドキュメントの情報と、指定区間テキストの情報を保持する。また他に、コメントが登録された日時や、コメント登録者の情報などを保持しても良い。コメント登録の基となったドキュメントの情報としては、httpアドレスなどドキュメントの保管場所やアクセス方法を示す情報の形式で保持しても良いし、基のドキュメントが変更・削除された場合に備えて、ドキュメント自体のコピーを保持しても良い。
以上が、本発明の第1の実施の形態の構成である。
また、本実施の形態では、図1の処理装置10で挙げられている各コンポーネントは、それぞれの機能を制御するプログラムとして、CD−ROMなどの機械読み取り可能な記録媒体や、インターネットなどのネットワークを通して提供され、計算機(コンピュータ)等に読み込まれて実行されるものとしても良い。
次に、本実施の形態の動作について、図3のフローチャートに沿って説明する。
図3は、本発明の第1の実施の形態の情報共有装置におけるユーザ指定区間用掲示板アドレス出力動作を示すフローチャートである。
図3によると、まずドキュメント手段11で表示されているドキュメント内からユーザに指定された指定区間テキストをユーザ指定区間入力手段12にて受け付ける(ステップA1)。
ついで、言語解析用辞書記憶部22を参照して、指定区間言語解析手段13にて、受け付けた指定区間テキストの言語解析を行い、指定された指定区間テキストに応じた言語表現である言語解析情報を出力する(ステップA2)。
次に、前記言語解析情報から、指定区間題目生成手段14aにて、指定区間テキストに対応した題目である題目情報を生成する(ステップA3)。
題目情報が生成されると、掲示板管理手段15aにて、その題目情報に対応する掲示板が掲示板情報記憶部23に存在するかどうか確認し、存在する場合はステップA51に、存在しない場合はステップA52に移る(ステップA4)。
生成された題目情報に応じた既存の掲示板が存在する場合は、該既存の掲示板の題目情報とアドレス情報を組にして対応掲示板情報として出力する(ステップA51)。
生成された題目情報に応じた既存の掲示板が存在しない場合は、新たな題目情報の掲示板を掲示板情報記憶部23に作成し、該掲示板の題目情報とアドレス情報を組として対応掲示板情報として出力する。または、掲示板を作成せず、掲示板が存在しないという情報を対応掲示板情報として出力する(ステップA52)。
ここで、ステップA3で生成された題目情報が複数ある場合には、ステップA4〜ステップA51またはA52までの手順を、各題目情報に対して実行する。
さらに、対応掲示板情報出力手段16が、ドキュメントブラウザ手段11に対応掲示板情報を出力する。(ステップA6)
最後に、掲示板のアドレスを本発明を実施する際の用途や目的に応じた出力形式で、元のドキュメントブラウザ手段を通して出力する(ステップA7)。
本実施の形態における効果は、同じ題目の情報をより効率的に共有できる点である。ブログなど掲示板以外のページを閲覧しているユーザが、閲覧している内容に関連する掲示板が存在することを知ることができるため、掲示板に対して新しい情報を追加するように誘導することができる。また、情報を追加しないユーザにとっても、掲示板を参照することでより多くの情報を得ることができる。
また、言語解析を行うことで多少表現が異なっても同じ題目情報として認識してスレッドと関連づけることができるため、題目とスレッドとを一意に定めることができ、さらに効率的に同じ題目に対する情報を共有できる。
例えば「はてなキーワード」または「はてなダイアリーキーワード」と呼ばれるサービス(従来技術3。非特許文献1)は、「はてなダイアリー」と呼ばれるブログ中のテキストに「はてなキーワード」に一致する文字列が含まれていた場合、自動的にブログ中のその文字列の部分に下線が引かれ、「はてなキーワード」システムにおけるその語の定義が記述されたページへのリンクが埋め込まれる。しかし、従来技術3では、類似した題目を取り扱っているブログ同士でも、既にキーワード登録された文字列を共通に含んでいない場合は、一方のブログの閲覧者は他方に気づくことはできない。
"はてなキーワード"[online]、[平成19年7月20日検索]、インターネット<URL http://d.hatena.ne.jp/keyword/>
一方、本実施の形態では、完全に同一な文字列を含まない場合でも、同じ題目として認識することが可能であるため、より効率的に同じ題目に対する情報を共有できる。
(第2の実施の形態)
本発明の第2の実施の形態の構成について、図4を参照して説明する。
本発明の第2の実施の形態にかかる情報共有装置は、第1の実施の形態に加えて、題目生成ポリシー記憶部24を有する。それに伴い、指定区間題目生成手段14bが、第1の実施の形態における指定区間題目生成手段14aと異なる点がある。その他の構成については、第1の実施の形態と同様な構成であるため、説明を省略する。
指定区間題目生成手段14bは、指定区間テキストの言語解析処理結果である言語表現を受け取り、題目生成ポリシー記憶部24で格納されている題目生成用の規則に従って題目情報を生成する。受け取った言語表現に対して、題目生成ポリシー記憶部24に格納されている各規則(ポリシー)が適用できるかどうかを確認し、適用できる場合には、その規則に従って、言語表現を書き換える。
題目生成ポリシー記憶部24は、指定区間題目生成手段14bで、言語表現から題目情報へ変換する際の規則を格納するデータベースである。具体的には、指定区間言語解析手段13で指定区間テキストを言語解析した結果得られた言語表現には、題目情報として区別することが望ましくない詳細な情報が含まれている場合があるので、そうした詳細な情報を削除し、題目情報として縮退させるための規則を格納する。どのような言語表現の情報を削除するかは、本発明を実施する際の用途・目的に応じて異なる。
規則の種類の例として、係り受け表現が挙げられる。単語間の係り受け表現を言語表現として用いる場合でも、係り受けの方向を区別しない場合には、係り受けの方向性を示す情報を言語表現から削除する規則を格納する。
また、時制やモダリティや時制表現の区分に関する規則も挙げられる。「した」「する」などの時制情報を区分するかを設定することができる。
他にも、5W1Hなどの情報に対する情報のレベルや情報の削除などが挙げられる。指定区間テキストから5W1H情報として位置情報や時間情報を抽出し、言語表現とした場合でも、時間により掲示板を分ける必要がない場合や、場所毎に掲示板を分ける必要がない場合には、そうした分ける必要がない情報の要素を削除する規則を格納する。
さらに、題目情報の表示方法なども挙げられる。ユーザが読みやすい自然言語による表記でもよいし、単語の係り受け構造や構文解析木の部分木などの言語表現としてもよい。生成する題目情報はあくまで掲示板を一意に特定できればよい。なお、単語の係り受け構造や、構文解析木の部分木などの言語表現は、自然言語による表記と異なり、通常人間にとって読みやすいものではない。しかし、生成する題目情報はあくまで掲示板を一意に特定できればよいので、こうした言語表現をそのまま題目情報として用いても問題ない。
もちろん、規則の種類は上記の例に限ったものではなく、適宜設定可能である。
ここで、指定区間テキストから、指定区間言語解析手段13と指定区間題目生成手段14bを通して、題目情報を生成する処理は、元の指定区間テキストに対する一種の要約を実行しているということができる。表記上は異なる指定区間テキストであっても、生成される題目情報が同一の場合は、掲示板情報記憶部23で格納されている掲示板で共通の掲示板が、それらの異なる指定区間テキストに対応する。ただし、通常のテキスト要約技術と異なり、題目情報は必ずしもユーザに対して、可読性の高いものでなくてよい。また、本発明を用いて、コメント情報を共有する際に重要視するポイントでなければ、元の指定区間テキストに含まれていても、題目情報を生成する際には落として良い点も、テキスト要約技術との違いである。
次に、本実施の形態の動作について、図5のフローチャートに沿って説明する。
図5は、第1の実施の形態にかかる図3と比較して、ステップA3がステップB3である点が異なる。その他の動作については、図3と同様であるため、説明を省略する。
ステップB3では、指定区間テキストの言語表現から、題目生成ポリシー記憶部24に格納された規則を用いて、指定区間題目生成手段14bにて、指定区間テキストに対応した題目情報を生成する。
本実施の形態における効果は、情報共有の用途や目的に応じて、題目情報の詳細度や区分、表示方法を設定できる点である。それにより、より掲示板サービス提供者の目的に沿った情報共有を行うことが可能となる。
また、掲示板を利用するユーザにとっても、興味を持っている内容に関連する題目の掲示板を探しやすいという効果がある。その理由は、題目情報を生成する際に、詳細度のレベルを統一するからである。例えば、「6月11日の陸上大会」「6月第2週の陸上大会」というテキストが同じ題目情報を生成するため、表現が異なった記事を閲覧したユーザーでも同じ掲示板に誘導することができる。
(第3の実施の形態)
本発明の第3の実施の形態の構成について、図6を参照して説明する。
図6を参照すると、本発明の第3の実施の形態は、第1の実施の形態の構成と比較して、ユーザ指定区間入力手段12の代わりにドキュメント区間分割手段17を有する点で、構成上異なる。ここでは、ドキュメント区間分割手段17と、動作が異なる点がある掲示板管理手段15bのみ説明する。
ドキュメント区間分割手段110は、ドキュメントブラウザ手段11からドキュメントを受け取り、そこに含まれるテキストを複数のテキスト区間にまず分割する。分割は、文や章節などの文書構造に基づいて行っても良いし、本発明を実施する際の用途・目的に応じて予め規定した単語や表現で区切っても良い。さらに、各分割されたテキスト区間は、他のテキスト区間と完全には一致しない範囲で重なりを持っても良い。ついで、分割した各テキスト区間に対して、指定区間言語解析手段13に送り、以後はユーザ指定区間入力手段12でユーザが明示的に指定した指定区間テキストと同様に言語解析処理を行い、結果として各指定区間テキストに対応する掲示板アドレスが掲示板管理手段15bから出力される。
掲示板管理手段15bの機能は、未処理の分割されたテキストがあるかを確認して、各々のテキストに対して順次処理を行うよう動作する以外は、本発明の第1の実施の形態における掲示板管理手段15aの機能と同様である。
ただし、本実施の形態の場合は、各題目情報に対する掲示板が存在しない場合は、新規に対応する掲示板を作成するのではなく、対応する掲示板がないという情報を対応掲示板情報とすることが望ましい。何故なら、全てのドキュメント内容に対して、同じ題目情報の掲示板がない場合は新規の掲示板を作成するように動作してしまうと、有用でない掲示板を多量に作成してしまうためである。
以上が、本発明の第3の実施の形態の構成である。
次に、本発明の第3の実施の形態における動作を、図7のフローチャートに沿って説明する。
図7によると、まずドキュメントブラウザ手段11から、処理対象とするドキュメントをドキュメント区間分割手段17が読み込み、複数のテキスト区間に分割する(ステップC1)。次に、分割されたテキスト区間の1つを指定区間テキストとして出力する(ステップC2)。
ステップA2〜ステップA51またはA52は、実施の形態1の動作と同じであるため、説明を省略する。
ステップA51またはA52の後、ステップC1で分割されたテキスト区間で、未処理のものが残っているかどうか確認し、未処理のものが残っている場合には、その未処理のテキスト区間を言語解析するために、ステップC2に戻る(ステップC3)。全てのテキスト区間に対する処理が終了している場合は、ステップC4に進む。
最後に、ステップC4で出力された対応掲示板情報を、全て本発明を実施する際の用途や目的に応じた出力形式で、元のドキュメントブラウザ手段を通して出力する(ステップC5)。
以上で、本発明の第3の実施の形態における動作の終了となる。
本実施の形態における効果は、ドキュメントに含まれるテキストを分割して各テキストに応じた掲示板が存在するかを判定するため、ユーザが特定の区間を指定することなく、掲示板の存在を知ることができる点である。
なお、本実施の形態を、第2の実施の形態と組合せてもよい。その場合は、図6において、指定区間題目生成手段14aが指定区間題目生成手段14bとなり、さらに、題目生成ポリシー記憶部24を有する構成となる。各構成の動作は、第2の実施の形態で説明した通りである。
(第1の実施例)
第1の実施の形態における実施例を、図8を用いて説明する。
ユーザがドキュメントブラウザ手段11により、図8のブログ1を閲覧する。その中の「ゲーム機PによりSACDを聞く」という記載に興味を持った場合に、マウスを利用して前記記載の指定区間テキストを指定する。
次に、指定区間言語解析手段13において、指定された区間に対して言語解析を行う。本実施例では、係り受け解析技術を用いる。その結果として、「ゲーム機P −> 聞く、SACD −> 聞く」という言語解析結果が出力される。
さらに、指定区間題目生成手段14では、機械翻訳などで用いられているテキスト合成の技術を使用して、指定区間言語解析手段13の出力結果から題目情報を生成する。本実施例では、「ゲーム機PでSACDを聞く」という題目情報を生成する。
掲示板管理手段15aでは、生成された題目情報「ゲーム機PでSACDを聞く」に一致する既存の題目情報が存在するかを判定する。題目情報が一致する既存の題目情報が存在する場合には、その題目情報が示す掲示板へのアドレスを、どの指定区間テキストから得られたかの情報と組にして、対応掲示板情報として出力する。掲示板情報記憶部23に題目情報が一致する既存の掲示板が存在しない場合には、まず掲示板情報記憶部23に新規にその題目情報の掲示板を作成し、ついで作成した新規の掲示板へのアドレスをどの指定区間テキストから得られたかの情報と組にして対応掲示板情報として出力する。対応掲示板情報は、対応掲示板情報出力手段16を通じて、ドキュメントブラウザ手段11に表示される。
ユーザは、図8に示すように「ゲーム機PによりSACDを聞く」というテキスト部分にリンクがはられることで、「ゲーム機PでSACDを聞く」という題目情報の掲示板の存在とその掲示板のアドレスを知ることができる。その情報に基づいて掲示板を閲覧することで、興味のある題目について、より多くの情報を得ることができる。また、最初に閲覧したページでなく、共通の掲示板にコメントを追加することで、より効率的な情報共有が可能となる。
(第2の実施例)
第2の実施の形態における実施例を説明する。
題目生成ポリシー記憶部24には、生成する題目情報の、詳細度や区分、表示方法を設定するために必要な規則を格納している。例として、5つの規則について説明する。
第一の規則は、モダリティや時制表現の区分に関する規則である。例えば、テキストに対して構文解析を実行し、得られた構文解析結果を言語表現としている場合、通常、テキスト中のモダリティや時制表現も構文木中に情報として格納されている。その結果、「ゲーム機Pを購入したい」「ゲーム機Pを購入すると聞いた」「ゲーム機Pを購入する」「ゲーム機Pを購入した」「ゲーム機Pを購入するつもりだ」「ゲーム機Pを購入するかもしれない」これらのテキストに対する言語表現が異なってくる。そこで、第一の規則では、モダリティや時制の区分に関する規則を設定する。前記の例を、言語表現中のモダリティや時制情報を削除して、全て「ゲーム機Pを購入」という同一の題目情報に分類することもできる。逆に「ゲーム機Pを購入したい」のような意志を表す表現と「ゲーム機Pを購入した」のような既に購入した結果を表す表現とで、コメントを登録する掲示板を分けたい用途では、これらの情報を言語表現から削除しないようにし、題目情報としても異なるものが生成されるようにすることもできる。
第二の規則は、データのレベルの中で時間に関する規則である。例えば、時間情報を1週間毎に変換するように設定した場合、07年1月12日 −> 07年第2週、07年1月16日 −> 07年第3週、07年1月19日 −> 07年第3週のように変換される。つまり、時間情報として07年1月12日を含むテキストに対するコメントと、時間情報として07年1月16日を含むテキストに対するコメントは別の掲示板に格納される(別の掲示板を示す題目情報が生成される)が、07年1月16日とを含む指定区間テキストに対するコメントと、07年1月19日とを含むテキストに対するコメントは、(他の言語表現が異ならない範囲で)同じ掲示板に格納される。
第三の規則は、データのレベルの中で場所に関する規則である。例えば、元のテキストが「横浜市港南区で火災発生」と「横浜市緑区で火災」であったとする。ここで、指定区間言語解析手段13により得られた場所情報はそれぞれ「横浜市港南区」「横浜市緑区」となるが、区のレベルで区別する必要のない目的の場合、区のレベルの情報を場所情報から削除し題目情報とする規則を、題目生成ポリシー記憶部24に格納しておく。その結果、どちらも「横浜市」という場所情報になり、同じ掲示板を指し示すことになる。
第四の規則は、情報の削除に関する規則である。例えば、時間情報を削除するよう設定した場合、「5月最新ニュース!! ソフトXXにメール受信時のバッファーアンダーランを利用したセキュリティーホールが発見」という指定区間テキストに対しては、「ソフトXX −> セキュリティーホール」のように時間情報を落とした題目情報を生成する。これは、通常掲示板ではコメント登録時の時間情報や、コメントを付与する元のドキュメントの更新日時を自動的に取得できる場合が多いため、時間毎にコメントを別の掲示板に分ける必要性が少ない時などに有用である。掲示板のユーザは必要ならば、コメントを見る際に、コメントの登録時期や元のドキュメントの更新時期を機械的に絞り込んでソート表示できるためである。
第五の規則は、題目情報の表現方法に関する規則である。例えば、表現方法を自然言語による表記と設定した場合、「ゲーム機P −> 使用する <− DVDプレーヤーとして」という解析結果は「ゲーム機PをDVDプレーヤーとして使用する件」として題目情報が生成される。
(第3の実施例)
第3の実施の形態における実施例を、図9を用いて説明する。
ブログ「ゲームの広場」には、「早速、ゲーム機PでSACDかけてみたの。だけど、いまいちCDとの差が分からなくて。…。そういえば、次世代ビデオも再生できるらしいね。そのためには、P本体にAAアプリをインストールしないと…」というテキストが含まれている。
ドキュメント区間分割手段17が前記テキストを読み込み、複数の指定区間テキストに分割する。本実施例では、前記のテキストを、文章ごとに「早速、ゲーム機PでSACDかけてみたの」「そういえば、ゲーム機Pは次世代ビデオも再生できるらしいね。」「そのためには、P本体にAAアプリを入れないと…。」と3つのテキストに分割する。
次に、各々の分割したテキストに対して、順次、指定区間言語解析手段13において言語解析を行い、指定区間題目生成手段14aにおいて題目情報を生成し、掲示板管理手段15bにおいて既存の掲示板が存在するかを判定していく。
前記テキストの例では、初めに「早速、ゲーム機PでSACDかけてみたの」というテキストから、指定区間題目生成手段14aにおいて「ゲーム機PでSACDを聞く」という題目情報を生成する。さらに、掲示板管理手段15bにおいて同じ題目情報の掲示板が存在かを判定する。掲示板が存在したため、題目情報と掲示板のアドレスを出力する。また、図9に示したように、共有掲示板に「リンク:ゲームの広場」と、テキストが含まれたドキュメントへのリンクを表示してもよい。
まだ未処理の分割したテキストが存在するため、次の「そういえば、ゲーム機Pは次世代ビデオも再生できるらしいね。」というテキストに対しても同様な処理を行う。このテキストから生成された題目情報「ゲーム機Pで次世代ビデオを生成」は、同じ題目情報の掲示板が存在したため、同様に題目情報と掲示板のアドレスを出力する。
次に、「そのためには、P本体にAAアプリを入れないと…。」というテキストに対しても同様に処理を行う。このテキストから生成された題目情報「ゲーム機PにAAアプリをインストール」には、同じ題目情報の掲示板が存在しない。よって、掲示板を生成せずに処理を終了する。
掲示板管理手段15bは、「ゲーム機PでSACDを聞く」「ゲーム機Pで次世代ビデオを生成」という題目情報について、指定区間テキストと対応する掲示板へのアドレスを組にしてまとめて対応掲示板情報として出力する。前記対応掲示板情報は、対応掲示板情報出力手段16を通じてドキュメントブラウザ手段11に出力される。
ドキュメントブラウザ手段11は、対応するテキスト部に対して、掲示板へのリンクをはって表示する。
この実施例によれば、ユーザがブログ1を閲覧した際に、ユーザが特別に区間を指定しなくても、ドキュメントの内容に関連した掲示板の存在を知ることができる。
本発明によれば、Web文書やオフィス文書などに意見や修正、追加情報などのコメントを付与や共有する用途に適用可能である。特に、オフィスなどでは、同様の内容を取り扱う文書が、部門毎や、バージョン違いなどで多数存在する場合が多い。そのような場合に、閲覧者は複数の文書を調べなくとも、1つの文書を調べるだけで、類似のテキストを含む文書に付与されたコメントをすべて見ることができる。
また、コメントを通して、議論を展開する場を提供する用途にも適用可能である。議論が適切に展開されるためには、ある一定数以上のユーザが議論に参加していることが必要となるが、個別のドキュメント毎にコメントを付与する従来技術1や従来技術2のような場合では、ドキュメント毎に閲覧するユーザが分断されるため、それらのシナジー効果を得ることが難しい。しかし、本発明を用いると、複数のドキュメントで共通または類似の(同じ題目が生成される)テキスト内容が含まれている箇所を通して、コメントが共有化されるため、別のドキュメントを閲覧するユーザ同士を結びつける場として有用である。
またさらに、既存のドキュメント同士や、本発明とは直接関係のない既存の掲示板同士を結びつける用途に適用可能である。同じ題目を生成する既存のドキュメント同士、掲示板同士には、本発明を用いることで、本発明による新たな共通の掲示板へのアドレスが提供される。よって、既存のドキュメントや掲示板のユーザは、同じテキストを含む他のドキュメントや掲示板の存在を知ることができ、本発明による掲示板へのアドレスが返されたテキスト区間毎に、必要に応じてそれらの統廃合や更新などの作業が可能となる。
この出願は、2007年8月21日に出願された日本出願特願2007−214489を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明の第1の実施の形態の構成を示すブロック図である。 本発明の指定区間言語解析手段13で用いられる言語解析手段と、対応する言語表現形式の例を示す図である。 本発明の第1の実施の形態の動作を示すフローチャートである。 本発明の第2の実施の形態の構成を示すブロック図である。 本発明の第2の実施の形態の動作を示すフローチャートである。 本発明の第3の実施の形態の構成を示すブロック図である。 本発明の第3の実施の形態の動作を示すフローチャートである。 本発明の第1の実施例の模式図である。 本発明の第3の実施例の模式図である。
符号の説明
10 処理装置
11 ドキュメントブラウザ手段
12 ユーザ指定区間入力手段
13 指定区間言語解析手段
14a、14b 指定区間題目生成手段
15a、15b 掲示板管理手段
16 対応掲示板情報出力手段
17 ドキュメント区間分割手段
20 記憶装置
21 ドキュメント情報記憶部
22 言語解析用辞書記憶部
221 単語辞書記憶部
222 同義表現辞書記憶部
23 掲示板情報記憶部
231 アドレス情報記憶部
232 コメント情報記憶部
24 題目生成ポリシー記憶部

Claims (7)

  1. 指定区間テキストに対して言語解析を行い言語解析情報を出力する指定区間言語解析手段と、
    前記言語解析情報に基づき、前記指定区間テキストから、前記指定区間テキストに対するコメントを記録するための掲示板を指し示す題目情報を、後記、題目生成ポリシー記憶部を参照して生成する指定区間題目生成手段と、
    前記指定区間題目生成手段が、前記指定区間テキストの言語解析情報から、前記題目情報を生成する際に、題目情報として区別しない情報を削除・縮退させるための規則を格納する題目生成ポリシー記憶部と、
    前記指定区間題目生成手段がこれまで生成した題目情報をIDとして、各題目情報に対応する掲示板のアドレス情報を各題目情報と組で格納する掲示板情報記憶部と、
    前記掲示板情報記憶部を参照し、前記題目情報が指し示す掲示板のアドレス情報が存在する場合は、該アドレス情報、ないしは該題目情報と該アドレス情報との組を対応掲示板情報として出力する掲示板管理手段と
    を備えたことを特徴とする情報共有システム。
  2. 前記掲示板管理手段が、前記題目情報が指し示す掲示板のアドレス情報が存在しない場合は、新規に前記題目情報をIDとする掲示板を作成し、作成した掲示板のアドレス情報、ないしは該題目情報と作成した掲示板のアドレス情報との組を、前記掲示板情報記憶部に格納した上で出力すること、を特徴とする請求項1記載の情報共有システム。
  3. ユーザ指定区間入力手段を備え、
    前記ユーザ指定区間入力手段は、ユーザが指定した区間情報に対応したテキストを、前記指定区間言語解析手段に対して前記指定区間テキストとして出力することを特徴とする請求項1または2記載の情報共有システム。
  4. ドキュメント区間分割手段を備え、
    前記ドキュメント区間分割手段は、入力されたテキストを分割して分割テキストを生成し、
    前記分割テキストの少なくとも一つ以上を前記指定区間言語解析手段に対して前記指定区間テキストとして出力することを特徴とする請求項1または2記載の情報共有システム。
  5. 前記対応掲示板情報を指定区間テキストに対応して表示するドキュメントブラウザ手段を備えることを特徴とする請求項1乃至4に記載の情報共有システム。
  6. 指定区間テキストに対して言語解析を行い言語解析情報を出力する指定区間言語解析ステップと、
    前記言語解析情報に基づき、前記指定区間テキストから、前記指定区間テキストに対するコメントを記録するための掲示板を指し示す題目情報を、前記指定区間題目生成手段が、前記指定区間テキストの言語解析情報から、前記題目情報を生成する際に、題目情報として区別しない情報を削除・縮退させるための規則を格納する題目生成ポリシー記憶部を参照して生成する指定区間題目生成ステップと、
    前記指定区間題目生成ステップでこれまで生成した題目情報をIDとして、各題目情報に対応する掲示板のアドレス情報を各題目情報と組で掲示板情報記憶部に格納する格納ステップと、
    前記掲示板情報記憶部を参照し、前記題目情報が指し示す掲示板のアドレス情報が存在する場合は、該アドレス情報、ないしは該題目情報と該アドレス情報との組を対応掲示板情報として出力する掲示板管理ステップと
    を含むことを特徴とする情報共有方法。
  7. 指定区間テキストに対して言語解析を行い言語解析情報を出力する指定区間言語解析ステップと、
    前記言語解析情報に基づき、前記指定区間テキストから、前記指定区間テキストに対するコメントを記録するための掲示板を指し示す題目情報を、前記指定区間題目生成手段が、前記指定区間テキストの言語解析情報から、前記題目情報を生成する際に、題目情報として区別しない情報を削除・縮退させるための規則を格納する題目生成ポリシー記憶部を参照して生成する指定区間題目生成ステップと、
    前記指定区間題目生成ステップでこれまで生成した題目情報をIDとして、各題目情報に対応する掲示板のアドレス情報を各題目情報と組で掲示板情報記憶部に格納する格納ステップと、
    前記掲示板情報記憶部を参照し、前記題目情報が指し示す掲示板のアドレス情報が存在する場合は、該アドレス情報、ないしは該題目情報と該アドレス情報との組を対応掲示板情報として出力する掲示板管理ステップと
    をコンピュータに実行させるための情報共有プログラム。
JP2009529006A 2007-08-21 2008-08-08 情報共有システム、情報共有方法、および情報共有プログラム Active JP5229226B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009529006A JP5229226B2 (ja) 2007-08-21 2008-08-08 情報共有システム、情報共有方法、および情報共有プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007214489 2007-08-21
JP2007214489 2007-08-21
JP2009529006A JP5229226B2 (ja) 2007-08-21 2008-08-08 情報共有システム、情報共有方法、および情報共有プログラム
PCT/JP2008/064360 WO2009025193A1 (ja) 2007-08-21 2008-08-08 情報共有システム、情報共有方法、および情報共有プログラム

Publications (2)

Publication Number Publication Date
JPWO2009025193A1 JPWO2009025193A1 (ja) 2010-11-25
JP5229226B2 true JP5229226B2 (ja) 2013-07-03

Family

ID=40378099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009529006A Active JP5229226B2 (ja) 2007-08-21 2008-08-08 情報共有システム、情報共有方法、および情報共有プログラム

Country Status (3)

Country Link
US (1) US20110202532A1 (ja)
JP (1) JP5229226B2 (ja)
WO (1) WO2009025193A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600343B2 (en) 2007-07-25 2013-12-03 Yahoo! Inc. Method and system for collecting and presenting historical communication data for a mobile device
WO2010064843A2 (ko) * 2008-12-02 2010-06-10 엔에이치엔비즈니스플랫폼 주식회사 업체 정보 전송 광고 방법 및 시스템
US9721228B2 (en) 2009-07-08 2017-08-01 Yahoo! Inc. Locally hosting a social network using social data stored on a user's computer
US9514466B2 (en) 2009-11-16 2016-12-06 Yahoo! Inc. Collecting and presenting data including links from communications sent to or from a user
US9760866B2 (en) 2009-12-15 2017-09-12 Yahoo Holdings, Inc. Systems and methods to provide server side profile information
US8620935B2 (en) 2011-06-24 2013-12-31 Yahoo! Inc. Personalizing an online service based on data collected for a user of a computing device
US8972257B2 (en) 2010-06-02 2015-03-03 Yahoo! Inc. Systems and methods to present voice message information to a user of a computing device
US9747583B2 (en) 2011-06-30 2017-08-29 Yahoo Holdings, Inc. Presenting entity profile information to a user of a computing device
US20130097522A1 (en) * 2011-10-15 2013-04-18 Derek A. Devries Method and system of generating composite web page elements with an annotating proxy server
US10977285B2 (en) 2012-03-28 2021-04-13 Verizon Media Inc. Using observations of a person to determine if data corresponds to the person
US10013672B2 (en) 2012-11-02 2018-07-03 Oath Inc. Address extraction from a communication
US9753921B1 (en) 2015-03-05 2017-09-05 Dropbox, Inc. Comment management in shared documents
WO2017217661A1 (ko) * 2016-06-15 2017-12-21 울산대학교 산학협력단 어휘 의미망을 이용한 단어 의미 임베딩 장치 및 방법과, 어휘 의미망 및 단어 임베딩을 이용한 동형이의어 분별 장치 및 방법
CN110880142B (zh) * 2019-11-22 2024-01-19 深圳前海微众银行股份有限公司 一种风险实体获取方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283366A (ja) * 1997-04-09 1998-10-23 Matsushita Electric Ind Co Ltd 情報分類装置
JPH1125092A (ja) * 1997-07-09 1999-01-29 Just Syst Corp 文書管理支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JP2002259289A (ja) * 2001-03-02 2002-09-13 Mitsubishi Heavy Ind Ltd 双方向知識提供システム、双方向知識提供方法および双方向知識提供プログラム
JP2005283622A (ja) * 2004-03-26 2005-10-13 Matsushita Electric Ind Co Ltd 協調学習支援システムおよび協調作業支援システム
JP2007122403A (ja) * 2005-10-28 2007-05-17 Fuji Xerox Co Ltd 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231238A (ja) * 1996-02-20 1997-09-05 Omron Corp テキスト検索結果表示方法及び装置
US6411924B1 (en) * 1998-01-23 2002-06-25 Novell, Inc. System and method for linguistic filter and interactive display
EP1116132A2 (en) * 1998-09-22 2001-07-18 Science Applications International Corporation User-defined dynamic collaborative environments
JP2003263454A (ja) * 2002-03-11 2003-09-19 Hitachi Ltd 文書情報検索配信装置
US7802263B2 (en) * 2002-12-17 2010-09-21 Stragent, Llc System, method and computer program product for sharing information in a distributed framework
US7756897B2 (en) * 2003-01-23 2010-07-13 Fujtisu Limited Topic net generation method and apparatus
JP2004295269A (ja) * 2003-03-26 2004-10-21 Hitachi Ltd 対話型知識共有システム及び方法
US8312034B2 (en) * 2005-06-24 2012-11-13 Purediscovery Corporation Concept bridge and method of operating the same
US20080215607A1 (en) * 2007-03-02 2008-09-04 Umbria, Inc. Tribe or group-based analysis of social media including generating intelligence from a tribe's weblogs or blogs
US8327414B2 (en) * 2007-06-21 2012-12-04 Motorola Solutions, Inc. Performing policy conflict detection and resolution using semantic analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283366A (ja) * 1997-04-09 1998-10-23 Matsushita Electric Ind Co Ltd 情報分類装置
JPH1125092A (ja) * 1997-07-09 1999-01-29 Just Syst Corp 文書管理支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JP2002259289A (ja) * 2001-03-02 2002-09-13 Mitsubishi Heavy Ind Ltd 双方向知識提供システム、双方向知識提供方法および双方向知識提供プログラム
JP2005283622A (ja) * 2004-03-26 2005-10-13 Matsushita Electric Ind Co Ltd 協調学習支援システムおよび協調作業支援システム
JP2007122403A (ja) * 2005-10-28 2007-05-17 Fuji Xerox Co Ltd 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム

Also Published As

Publication number Publication date
US20110202532A1 (en) 2011-08-18
JPWO2009025193A1 (ja) 2010-11-25
WO2009025193A1 (ja) 2009-02-26

Similar Documents

Publication Publication Date Title
JP5229226B2 (ja) 情報共有システム、情報共有方法、および情報共有プログラム
US10706091B2 (en) User driven computerized selection, categorization, and layout of live content components
Khalili et al. The rdfa content editor-from wysiwyg to wysiwym
US9922383B2 (en) Patent claims analysis system and method
US20150067476A1 (en) Title and body extraction from web page
CN102779114B (zh) 利用自动规则生成的非结构化数据支持
KR20100038378A (ko) 지능적인 텍스트 주석을 위한 방법, 시스템 및 컴퓨터 프로그램
JP2010092476A (ja) 表示方法、システムおよび格納媒体
Khalili et al. Wysiwym authoring of structured content based on schema. org
JP5399450B2 (ja) 医療用語の曖昧性を判定するシステム、方法およびソフトウェア
US9129036B2 (en) Systems and methods of identifying chunks within inter-related documents
JP2008107904A (ja) テキスト及びアニメーションサービス装置及びコンピュータプログラム
Luczak-Rösch et al. Linked Data Authoring for Non-Experts.
JP2011154739A (ja) 文書探索サービス提供方法及びシステム
JP6653169B2 (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
Heese et al. One Click Annotation.
US8195458B2 (en) Open class noun classification
Arolas et al. Uses of explicit and implicit tags in social bookmarking
JP6488399B2 (ja) 情報提示システム、及び情報提示方法
JP4900475B2 (ja) 電子文書管理装置及び電子文書管理プログラム
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
JP2007052693A (ja) Webページ情報表示装置,処理方法およびプログラム
Stolk Evoke: Exploring and extending a thesaurus of old english using a linked data approach
Gottron Content extraction-identifying the main content in HTML documents.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130304

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160329

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5229226

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150