JP5083669B2 - 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム - Google Patents
情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム Download PDFInfo
- Publication number
- JP5083669B2 JP5083669B2 JP2008506343A JP2008506343A JP5083669B2 JP 5083669 B2 JP5083669 B2 JP 5083669B2 JP 2008506343 A JP2008506343 A JP 2008506343A JP 2008506343 A JP2008506343 A JP 2008506343A JP 5083669 B2 JP5083669 B2 JP 5083669B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- candidate
- word
- character string
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 132
- 238000000034 method Methods 0.000 claims abstract description 72
- 239000000284 extract Substances 0.000 claims abstract description 44
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
また、本発明による情報サービスシステムは、上述のいずれかの情報抽出システムと、同種の語句のリストである辞書を記憶する辞書データベースと、広告を表示する広告表示装置からキーワードを受信して、広告表示装置に広告を送信する広告サービスシステムとを備え、広告サービスシステムが、入力語リスト作成者によって作成された入力語リストを情報抽出システムに入力して、情報抽出システムから語句のリストを受け取り、語句のリストおよび入力語リストに含まれる語句を含む辞書を辞書データベースに登録する登録手段と、広告および広告に関連する関連キーワードを対応付けて記憶する広告記憶手段と、広告表示装置から受信したキーワードを含む辞書を辞書データベースに記憶された辞書の中から検索し、検索された辞書に含まれる語句に対応付けられた広告および広告表示装置から受信したキーワードに対応づけられた広告を広告記憶手段から読み込んで、広告表示装置に送信する広告提供手段とを含むことを特徴とする。
12 語句候補作成手段
13 語句選択手段
14 文書検索手段
15 文書群
16 パターン候補
17 語句候補
18 検索結果文書群
19 再作成手段
100 入力装置
200 データ処理装置
300 出力装置
400 記憶装置
500 情報抽出プログラム
図1は、本発明による情報抽出システムの第1の実施の形態を示すブロック図である。第1の実施の形態の情報抽出システムは、入力装置100と、プログラム制御により動作するデータ処理装置200と、出力装置300と、情報を記憶する記憶装置400とを含む。
図2は、本実施の形態におけるデータ処理装置200の動作の例を示すフローチャートである。
第2の実施の形態の情報抽出システムは、第1の実施の形態と同様であり、第2の実施の形態の情報抽出システムも図1のように示すことができる。ただし、パターン候補作成手段11、語句候補作成手段12、語句選択手段13の処理内容が第1の実施の形態とは異なる。
図12は、本発明による情報抽出システムの第3の実施の形態を示すブロック図である。第1の実施の形態と同様の構成部については、図1と同一の符号を付し、説明を省略する。第3の実施の形態では、データ処理装置200は、パターン候補作成手段11、語句候補作成手段12、語句選択手段13に加え、文書検索手段14も含む。また、記憶装置400は、文書群15、パターン候補16、語句候補17に加え、検索結果文書群18も記憶する。
図13は、本発明による情報抽出システムの第4の実施の形態を示すブロック図である。第3の実施の形態と同様の構成部については、図12と同一の符号を付し、説明を省略する。第4の実施の形態では、データ処理装置200は、パターン候補作成手段11、語句候補作成手段12、語句選択手段13、文書検索手段14に加え、再作成手段19も含む。
次に、本発明の第5の実施の形態について説明する。図15は、本発明による情報サービスシステムの構成例を示すブロック図である。本実施の形態の情報サービスシステムは、情報抽出システム1000と、辞書サービスシステム2000と、辞書データベース3000とを備える。
購入者端末51は、辞書購入者の操作に従って、辞書購入者が購入を希望する辞書の種類を辞書サービスシステム2000に送信する。辞書サービスシステム2000の制御部62は、その種類の情報を受信する。
次に、本発明の第6の実施の形態について説明する。本実施の形態の情報サービスシステムの構成は、第5の実施の形態と同様である(図15および図16参照。)。ただし、入力語リスト作成者に辞書作成の対価を支払う態様が異なる。本実施の形態では、辞書を辞書購入者に販売(提供)した場合に、辞書作成の対価として辞書サービス運営者が支払うべき金額を金銭情報記憶手段61に記憶する。すなわち、辞書が販売されることによって、入力語リスト作成者に辞書作成の対価が支払われることになる。また、入力語リスト作成者に作成料を支払うとき、辞書サービスシステム利用料としての対価を差し引く。
まず、入力語作成者は、入力語リストを作成し、作成者端末52を用いて、入力語リストを辞書サービスシステム2000に送信する。このとき、作成者端末52には、入力語リストが入力され、作成者端末52は、入力語作成者の操作に従って、入力語リストを辞書サービスシステム2000に送信する。辞書サービスシステム2000の制御部62は、入力語リストを受信する。
次に、本発明の第7の実施の形態について説明する。図17は、本実施の形態の情報サービスシステムの構成例を示すブロック図である。第6の実施の形態と同様の構成部については、図15と同一の符号を付し、説明を省略する。本実施の形態の情報サービスシステムは、トレンドキーワードデータベース4000を備える。なお、辞書サービスシステム2000は、第6の実施の形態と同様に、制御部62および金銭情報記憶手段61(図16参照。)を備える。
まず、入力語リスト作成者が、辞書サービスシステム2000を介し、トレンドキーワードデータベース4000を参照する。例えば、作成者端末52(図17において図示せず。図16参照。)が、入力語リスト作成者の操作に従って、トレンドキーワードデータベース4000に記憶されているキーワードのリストを、辞書サービスシステム2000に要求する。辞書サービスシステム2000の制御部62は、この要求に応じて、トレンドキーワードデータベース4000に記憶されているキーワードのリストを読み込み、作成者端末52に送信する。作成者端末は、受信したキーワードのリストを表示して、入力語リスト作成者にキーワードのリストを提示する。
次に、本発明の第8の実施の形態について説明する。図18は、第8の実施の形態の情報サービスシステムの構成例を示すブロック図である。本実施の形態の情報サービスシステムは、情報抽出システム1000と、広告サービスシステム5000と、辞書データベース3000とを備える。また、広告サービスシステム5000には、通信ネットワークを介して広告閲覧システム6000が接続される。
また、製品の移り変わりが頻繁に起こったとしても、情報抽出システム1000が出力語リストを自動的に作成するので、辞書を素早く簡単に作成することができる。
Claims (28)
- 文書内の語句を文書から抽出して出力する情報抽出システムであって、
複数の語句を含む入力語リストが入力される入力手段と、
形式が異なる文書を含む複数の文書の中から一つの文書を選択し、選択した文書内で、入力語リストに含まれる語句を抽出対象でない文字列と区切る文字列をパターンとして決定することを文書毎に前記複数の文書に対して行い、決定されたパターンと決定に用いた文書とを対応付けておくパターン決定手段と、
パターンによって区切られる文字列を、当該パターンに対応付けられた文書から抽出して語句の候補とする語句候補抽出手段と、
語句候補抽出手段によって抽出された語句の候補または当該語句の候補に含まれる部分文字列のうち所定の条件を満たす語句の候補または部分文字列を出力対象の語句として選択する語句選択手段とを備えた
ことを特徴とする情報抽出システム。 - パターン決定手段は、入力語リストに含まれる語句の前方の文字列および後方の文字列をパターンとして決定し、
語句候補抽出手段は、前記前方の文字列および前記後方の文字列によって挟まれる文字列を文書から抽出して語句の候補とし、
語句選択手段は、語句候補抽出手段によって抽出された語句の候補の中から出力対象の語句を選択する
請求項1に記載の情報抽出システム。 - 語句選択手段は、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを語句の候補毎に算出し、語句スコアが所定のしきい値以上である語句の候補を出力対象の語句として選択する
請求項2に記載の情報抽出システム。 - 語句選択手段は、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを語句の候補毎に算出し、語句スコアの高い順に語句の候補をソートし所定の順位以上である語句の候補を出力対象の語句として選択する
請求項2に記載の情報抽出システム。 - 語句選択手段は、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを語句の候補毎に算出し、語句スコアの高い順に語句の候補をソートし上位の所定の割合の語句の候補を出力対象の語句として選択する
請求項2に記載の情報抽出システム。 - パターン決定手段は、入力語リストに含まれる語句の前方の文字列のみ、あるいは、入力語リストに含まれる語句の後方の文字列のみをパターンとして決定し、
語句候補抽出手段は、前記前方の文字列に続く文字列、あるいは、前記後方の文字列の直前の文字列を文書から抽出して語句の候補とし、
語句選択手段は、語句の候補に含まれる部分文字列を作成し、作成した各部分文字列の中から出力対象の語句を選択する
請求項1に記載の情報抽出システム。 - 語句選択手段は、語句の候補の総数に対する部分文字列を含む語句の候補の割合を、各語句の候補毎および各部分文字列毎に算出して、前記割合が所定の範囲に属する部分文字列を特定し、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを、特定した部分文字列を含む語句の候補毎に算出して、算出結果を前記部分文字列の語句スコアとし、語句スコアが所定のしきい値以上である部分文字列を出力対象の語句として選択する
請求項6に記載の情報抽出システム。 - 語句選択手段は、語句の候補の総数に対する部分文字列を含む語句の候補の割合を、各語句の候補毎および各部分文字列毎に算出して、前記割合が所定の範囲に属する部分文字列を特定し、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを、特定した部分文字列を含む語句の候補毎に算出して、算出結果を前記部分文字列の語句スコアとし、語句スコアの高い順に部分文字列をソートし所定の順位以上である部分文字列を出力対象の語句として選択する
請求項6に記載の情報抽出システム。 - 語句選択手段は、語句の候補の総数に対する部分文字列を含む語句の候補の割合を、各語句の候補毎および各部分文字列毎に算出して、前記割合が所定の範囲に属する部分文字列を特定し、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを、特定した部分文字列を含む語句の候補毎に算出して、算出結果を前記部分文字列の語句スコアとし、語句スコアの高い順に部分文字列をソートし上位の所定の割合の部分文字列を出力対象の語句として選択する
請求項6に記載の情報抽出システム。 - 形式が異なる文書を含む複数の文書であって、予め記憶装置に記憶されている複数の文書の中から、入力語リストから選択した複数の語句全てを含む文書を検索する文書検索手段を備え、
パターン決定手段は、文書検索手段によって検索された文書毎にパターンの決定を行う
請求項1から請求項9のうちのいずれか1項に記載の情報抽出システム。 - 語句選択手段によって選択された語句のリストを入力語リストとして文書検索手段に付与する再作成手段を備えた
請求項10に記載の情報抽出システム。 - 語句選択手段によって選択された語句のリストを入力語リストとしてパターン決定手段に付与する再作成手段を備えた
請求項1から請求項9のうちのいずれか1項に記載の情報抽出システム。 - 請求項1から請求項12のうちのいずれか1項に記載の情報抽出システムと、
同種の語句のリストである辞書を記憶する辞書データベースと、
辞書の作成および辞書の販売に伴い授受される金額を管理する辞書サービスシステムとを備え、
辞書サービスシステムは、
入力語リスト作成者によって作成された入力語リストを情報抽出システムに入力して、情報抽出システムから語句のリストを受け取り、当該語句のリストおよび前記入力語リストに含まれる語句を含む辞書を辞書データベースに登録する登録手段と、
辞書購入者の端末からの要求に応じて、辞書データベースに記憶されている辞書を前記端末に送信する辞書提供手段と、
辞書作成および辞書の販売に伴い授受される金額を記憶する金銭情報記憶手段と、
辞書サービスシステムの運用者が入力語リスト作成者に対し辞書の作成の対価として支払うべき金額、および辞書購入者が辞書サービスシステムの運用者に辞書の対価として支払うべき金額を金銭情報記憶手段に記憶させる金額情報登録手段とを含む
ことを特徴とする情報サービスシステム。 - 流行している語句を記憶する流行キーワード記憶手段を備え、
辞書サービスシステムは、
流行キーワード記憶手段から流行している語句を読み込んで、入力語リスト作成者の端末に送信する流行キーワード提供手段を含む
請求項13に記載の情報サービスシステム。 - 請求項1から請求項12のうちのいずれか1項に記載の情報抽出システムと、
同種の語句のリストである辞書を記憶する辞書データベースと、
広告を表示する広告表示装置からキーワードを受信して、広告表示装置に広告を送信する広告サービスシステムとを備え、
広告サービスシステムは、
入力語リスト作成者によって作成された入力語リストを情報抽出システムに入力して、情報抽出システムから語句のリストを受け取り、当該語句のリストおよび前記入力語リストに含まれる語句を含む辞書を辞書データベースに登録する登録手段と、
広告および当該広告に関連する関連キーワードを対応付けて記憶する広告記憶手段と、
広告表示装置から受信したキーワードを含む辞書を辞書データベースに記憶された辞書の中から検索し、検索された辞書に含まれる語句に対応付けられた広告および広告表示装置から受信したキーワードに対応づけられた広告を広告記憶手段から読み込んで、広告表示装置に送信する広告提供手段とを含む
ことを特徴とする情報サービスシステム。 - 文書内の語句を文書から抽出する情報抽出方法であって、
入力手段が、複数の語句を含む入力語リストを入力し、
パターン決定手段が、形式が異なる文書を含む複数の文書の中から一つの文書を選択し、選択した文書内で、入力語リストに含まれる語句を抽出対象でない文字列と区切る文字列をパターンとして決定することを文書毎に前記複数の文書に対して行い、決定されたパターンと決定に用いた文書とを対応付けておき、
語句候補抽出手段が、パターンによって区切られる文字列を、当該パターンに対応付けられた文書から抽出して語句の候補とし、
語句選択手段が、語句候補抽出手段によって抽出された語句の候補または当該語句の候補に含まれる部分文字列のうち所定の条件を満たす語句の候補または部分文字列を出力対象の語句として選択する
ことを特徴とする情報抽出方法。 - パターン決定手段が、入力語リストに含まれる語句の前方の文字列および後方の文字列をパターンとして決定し、
語句候補抽出手段が、前記前方の文字列および前記後方の文字列によって挟まれる文字列を文書から抽出して語句の候補とし、
語句選択手段が、語句候補抽出手段によって抽出された語句の候補の中から出力対象の語句を選択する
請求項16に記載の情報抽出方法。 - 語句選択手段が、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを語句の候補毎に算出し、語句スコアが所定のしきい値以上である語句の候補を出力対象の語句として選択する
請求項17に記載の情報抽出方法。 - 語句選択手段が、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを語句の候補毎に算出し、語句スコアの高い順に語句の候補をソートし所定の順位以上である語句の候補を出力対象の語句として選択する
請求項17に記載の情報抽出方法。 - 語句選択手段が、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを語句の候補毎に算出し、語句スコアの高い順に語句の候補をソートし上位の所定の割合の語句の候補を出力対象の語句として選択する
請求項17に記載の情報抽出方法。 - パターン決定手段が、入力語リストに含まれる語句の前方の文字列のみ、あるいは、入力語リストに含まれる語句の後方の文字列のみをパターンとして決定し、
語句候補抽出手段が、前記前方の文字列に続く文字列、あるいは、前記後方の文字列の直前の文字列を文書から抽出して語句の候補とし、
語句選択手段が、語句の候補に含まれる部分文字列を作成し、作成した各部分文字列の中から出力対象の語句を選択する
請求項16に記載の情報抽出方法。 - 語句選択手段が、語句の候補の総数に対する部分文字列を含む語句の候補の割合を、各語句の候補毎および各部分文字列毎に算出して、前記割合が所定の範囲に属する部分文字列を特定し、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを、特定した部分文字列を含む語句の候補毎に算出して、算出結果を前記部分文字列の語句スコアとし、語句スコアが所定のしきい値以上である部分文字列を出力対象の語句として選択する
請求項21に記載の情報抽出方法。 - 語句選択手段が、語句の候補の総数に対する部分文字列を含む語句の候補の割合を、各語句の候補毎および各部分文字列毎に算出して、前記割合が所定の範囲に属する部分文字列を特定し、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを、特定した部分文字列を含む語句の候補毎に算出して、算出結果を前記部分文字列の語句スコアとし、語句スコアの高い順に部分文字列をソートし所定の順位以上である部分文字列を出力対象の語句として選択する
請求項21に記載の情報抽出方法。 - 語句選択手段が、語句の候補の総数に対する部分文字列を含む語句の候補の割合を、各語句の候補毎および各部分文字列毎に算出して、前記割合が所定の範囲に属する部分文字列を特定し、語句の候補の特定に用いたパターンの候補の重要度の高さ、あるいは語句の候補が出現する文書の多さを示す語句スコアを、特定した部分文字列を含む語句の候補毎に算出して、算出結果を前記部分文字列の語句スコアとし、語句スコアの高い順に部分文字列をソートし上位の所定の割合の部分文字列を出力対象の語句として選択する
請求項21に記載の情報抽出方法。 - 文書検索手段が、形式が異なる文書を含む複数の文書であって、予め記憶装置に記憶されている複数の文書の中から、入力語リストから選択した複数の語句全てを含む文書を検索し、
パターン決定手段が、文書検索手段によって検索された文書毎にパターンの決定を行う
請求項16から請求項24のうちのいずれか1項に記載の情報抽出方法。 - 再作成手段が、語句選択手段によって選択された語句のリストを入力語リストとして文書検索手段に付与する
請求項25に記載の情報抽出方法。 - 再作成手段が、語句選択手段によって選択された語句のリストを入力語リストとしてパターン決定手段に付与する
請求項16から請求項24のうちのいずれか1項に記載の情報抽出方法。 - 文書内の語句を文書から抽出して出力するコンピュータに搭載される情報抽出プログラムであって、
前記コンピュータに、
複数の語句を含む入力語リストを入力する入力処理、
形式が異なる文書を含む複数の文書の中から一つの文書を選択し、選択した文書内で、入力語リストに含まれる語句を抽出対象でない文字列と区切る文字列をパターンとして決定することを文書毎に前記複数の文書に対して行い、決定されたパターンと決定に用いた文書とを対応付けておくパターン決定処理、
パターンによって区切られる文字列を、当該パターンに対応付けられた文書から抽出して語句の候補とする語句候補抽出処理、および
語句候補抽出処理で抽出された語句の候補または当該語句の候補に含まれる部分文字列のうち所定の条件を満たす語句の候補または部分文字列を出力対象の語句として選択する語句選択処理
を実行させるための情報抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008506343A JP5083669B2 (ja) | 2006-03-23 | 2007-03-23 | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006081598 | 2006-03-23 | ||
JP2006081598 | 2006-03-23 | ||
JP2008506343A JP5083669B2 (ja) | 2006-03-23 | 2007-03-23 | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム |
PCT/JP2007/055958 WO2007108529A1 (ja) | 2006-03-23 | 2007-03-23 | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007108529A1 JPWO2007108529A1 (ja) | 2009-08-06 |
JP5083669B2 true JP5083669B2 (ja) | 2012-11-28 |
Family
ID=38522553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008506343A Expired - Fee Related JP5083669B2 (ja) | 2006-03-23 | 2007-03-23 | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8886661B2 (ja) |
JP (1) | JP5083669B2 (ja) |
WO (1) | WO2007108529A1 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8812304B2 (en) * | 2008-08-12 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for downloading additional search results into electronic dictionaries |
US9081765B2 (en) | 2008-08-12 | 2015-07-14 | Abbyy Infopoisk Llc | Displaying examples from texts in dictionaries |
US20100057569A1 (en) * | 2008-08-29 | 2010-03-04 | Nathan Cantelmo | Advertising System for Internet Discussion Forums |
US8510249B2 (en) | 2008-10-10 | 2013-08-13 | Nec Corporation | Determining whether text information corresponds to target information |
JP2013084020A (ja) * | 2010-02-17 | 2013-05-09 | Froute Mobile Technology Inc | 制御プログラム |
US20110313756A1 (en) * | 2010-06-21 | 2011-12-22 | Connor Robert A | Text sizer (TM) |
US8316030B2 (en) * | 2010-11-05 | 2012-11-20 | Nextgen Datacom, Inc. | Method and system for document classification or search using discrete words |
US9785628B2 (en) * | 2011-09-29 | 2017-10-10 | Microsoft Technology Licensing, Llc | System, method and computer-readable storage device for providing cloud-based shared vocabulary/typing history for efficient social communication |
RU2631164C2 (ru) * | 2011-12-08 | 2017-09-19 | Общество с ограниченной ответственностью "Базелевс-Инновации" | Способ анимации sms-сообщений |
TW201411379A (zh) * | 2012-09-14 | 2014-03-16 | Hon Hai Prec Ind Co Ltd | 搜索系統及方法 |
WO2014050981A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
US20150248699A1 (en) * | 2012-11-30 | 2015-09-03 | Google Inc. | Keyword remarketing |
US9229926B2 (en) * | 2012-12-03 | 2016-01-05 | International Business Machines Corporation | Determining similarity of unfielded names using feature assignments |
WO2014146032A2 (en) * | 2013-03-15 | 2014-09-18 | Suarez Sergio David Jr | System for method for data sweeping using keywords |
JP5664813B1 (ja) * | 2014-06-10 | 2015-02-04 | 富士ゼロックス株式会社 | デザイン管理装置及びプログラム |
CN108027823B (zh) * | 2015-07-13 | 2022-07-12 | 帝人株式会社 | 信息处理装置、信息处理方法以及计算机可读取的存储介质 |
WO2018146864A1 (ja) * | 2017-02-07 | 2018-08-16 | パナソニックIpマネジメント株式会社 | 翻訳装置および翻訳方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001297100A (ja) * | 2000-04-14 | 2001-10-26 | Fuji Xerox Co Ltd | キーワード抽出ルール精製支援装置 |
JP2002108887A (ja) * | 2000-09-29 | 2002-04-12 | Canon Inc | 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体 |
JP2004151926A (ja) * | 2002-10-30 | 2004-05-27 | Ricoh Co Ltd | キーワード抽出装置、キーワード抽出方法並びにプログラムおよび記録媒体 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3113814B2 (ja) * | 1996-04-17 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法及び情報検索装置 |
JP4843867B2 (ja) * | 2001-05-10 | 2011-12-21 | ソニー株式会社 | 文書処理装置、文書処理方法および文書処理プログラム、ならびに、記録媒体 |
JP2003256447A (ja) | 2002-02-26 | 2003-09-12 | Kyoji Umemura | 関連語抽出方法および装置 |
JP2003330947A (ja) | 2002-05-09 | 2003-11-21 | Nippon Steel Corp | ファクトデータの抽出装置 |
JP2004152041A (ja) | 2002-10-31 | 2004-05-27 | Ricoh Co Ltd | 重要語句抽出装置、プログラムおよび記録媒体 |
US7797303B2 (en) * | 2006-02-15 | 2010-09-14 | Xerox Corporation | Natural language processing for developing queries |
-
2007
- 2007-03-23 JP JP2008506343A patent/JP5083669B2/ja not_active Expired - Fee Related
- 2007-03-23 US US12/294,143 patent/US8886661B2/en active Active
- 2007-03-23 WO PCT/JP2007/055958 patent/WO2007108529A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001297100A (ja) * | 2000-04-14 | 2001-10-26 | Fuji Xerox Co Ltd | キーワード抽出ルール精製支援装置 |
JP2002108887A (ja) * | 2000-09-29 | 2002-04-12 | Canon Inc | 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体 |
JP2004151926A (ja) * | 2002-10-30 | 2004-05-27 | Ricoh Co Ltd | キーワード抽出装置、キーワード抽出方法並びにプログラムおよび記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US8886661B2 (en) | 2014-11-11 |
JPWO2007108529A1 (ja) | 2009-08-06 |
WO2007108529A1 (ja) | 2007-09-27 |
US20110161144A1 (en) | 2011-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5083669B2 (ja) | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム | |
US9323827B2 (en) | Identifying key terms related to similar passages | |
KR100932999B1 (ko) | 사용자 정보 및 콘텐츠에 기초하여 자동으로 생성된 링크에의한 문서 브라우징 | |
US7680778B2 (en) | Support for reverse and stemmed hit-highlighting | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
US20040117353A1 (en) | Searching apparatus and a method of searching | |
JP2008511075A5 (ja) | ||
US20100125531A1 (en) | System and method for the automated filtering of reviews for marketability | |
CN101501630A (zh) | 基于相关性对搜索结果列表中的电子文件进行排名和排序的方法 | |
KR20080026948A (ko) | 연관 키워드 그룹 추출 방법 | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
JP2011107826A (ja) | 行動情報抽出システム及び抽出方法 | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
WO2007011129A1 (en) | Information search method and information search apparatus on which information value is reflected | |
JP6653169B2 (ja) | キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム | |
JP5302614B2 (ja) | 施設関連情報の検索データベース形成方法および施設関連情報検索システム | |
JP5151368B2 (ja) | 情報処理装置および情報処理プログラム | |
JP4883644B2 (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
JP5000801B2 (ja) | インターネット補助システム | |
JP6960553B2 (ja) | ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム | |
CN112989020B (zh) | 信息处理方法、装置和计算机可读存储介质 | |
US20100125496A1 (en) | System and method for automated generation of advertising | |
US20030237042A1 (en) | Document processing device and document processing method | |
JP6228425B2 (ja) | 広告生成装置および広告生成方法 | |
JP5458058B2 (ja) | 商品名同一性判定装置および商品名同一性判定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100218 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101020 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120810 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5083669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |