JP4587236B2 - 情報検索装置、情報検索方法、およびプログラム - Google Patents
情報検索装置、情報検索方法、およびプログラム Download PDFInfo
- Publication number
- JP4587236B2 JP4587236B2 JP2008216509A JP2008216509A JP4587236B2 JP 4587236 B2 JP4587236 B2 JP 4587236B2 JP 2008216509 A JP2008216509 A JP 2008216509A JP 2008216509 A JP2008216509 A JP 2008216509A JP 4587236 B2 JP4587236 B2 JP 4587236B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- text
- extracted
- search
- general
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 71
- 238000000605 extraction Methods 0.000 claims description 40
- 239000000284 extract Substances 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 3
- 230000010365 information processing Effects 0.000 description 43
- 238000012790 confirmation Methods 0.000 description 28
- 230000014509 gene expression Effects 0.000 description 25
- 230000002354 daily effect Effects 0.000 description 22
- 238000004458 analytical method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 5
- 230000003203 everyday effect Effects 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索のためのキーワードが入力されると、該キーワードを含むテキストを格納部に記憶されているテキストから収集し、収集した第1のテキストの名詞を抽出し、前記キーワードと部分一致する名詞を第1の単語として決定し、前記第1のテキストのうち該第1の単語を含む第2のテキストを抽出し、該第2のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、抽出した単語の使用回数をカウントし、該使用回数が上位所定のランク内である単語を前記第1の単語の関連語である第2の単語に決定し、前記第1の単語および前記第2の単語を出力する制御部を有する。
前記制御部は、検索のためのキーワードが入力されると、該キーワードを含むテキストを格納部に記憶されているテキストから収集し、
前記制御部は、収集した第1のテキストの名詞を抽出し、前記キーワードと部分一致する名詞を第1の単語として決定し、
前記制御部は、前記第1のテキストのうち該第1の単語を含む第2のテキストを抽出し、
前記制御部は、前記第2のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、
前記制御部は、前記第2のテキストから抽出した単語の使用回数をカウントし、
前記制御部は、前記第2のテキストから抽出した単語の前記使用回数が上位所定のランク内である単語を前記第1の単語の関連語である第2の単語に決定し、
前記制御部は、前記第1の単語および前記第2の単語を出力するものである。
検索のためのキーワードが入力されると、該キーワードを含むテキストを格納部に記憶されているテキストから収集し、
収集した第1のテキストの名詞を抽出し、前記キーワードと部分一致する名詞を第1の単語として決定し、
前記第1のテキストのうち該第1の単語を含む第2のテキストを抽出し、
前記第2のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、
前記第2のテキストから抽出した単語の使用回数をカウントし、
前記第2のテキストから抽出した単語の前記使用回数が上位所定のランク内である単語を前記第1の単語の関連語である第2の単語に決定し、
前記第1の単語および前記第2の単語を出力する処理を前記コンピュータに実行させるものである。
本実施形態の情報検索方法を実施するための構成を説明する。
express or エクスプレス or えくすぷれす・・・式1
検索サーバ10は、ネットワーク100上で公開されているブログから、検索式1により含有ブログを抽出する。
(express or エクスプレス or えくすぷれす)and Express5800・・・式2−1
(express or エクスプレス or えくすぷれす)and つくばエクスプレス・・・式2−2
(express or エクスプレス or えくすぷれす)and エクスプレス予約・・・式2−3
検索サーバ10は、式2−1により抽出した全ての含有ブログに対して、単語Aを求めたときと同様にして、名詞を抽出し、名詞毎の使用回数を求める。その結果、使用回数の多いものから順に並べると、「NEC(100)、サーバ(85)、PC(50)、・・・」となった。これらが、“Express5800”の関連語である単語Cとなる(ステップ108)。同様にして、式2−2により抽出した全ての含有ブログから、“つくばエクスプレス”の関連語である単語Cが「電車(85)、秋葉原(65)、TSUKUBA(30)・・・」と求まる。式2−3により抽出した全ての含有ブログから、“エクスプレス予約”の関連語である単語Cが「新幹線(60)、特急(40)、電車(40)、・・・」と求まる。
(express or エクスプレス or えくすぷれす or Express5800)not(つくばエクスプレス or エクスプレス予約)・・・式3
検索サーバ10は、式3により抽出した全ての含有ブログに対して、単語Aを求めたときと同様にして、名詞を抽出し、名詞毎の使用回数を求める。その結果、使用回数の多いものから順に並べると、「NEC(100)、サーバ(85)、PC(50)、・・・」となった。これらが、検索後の関連語である単語Eとなる(ステップ114)。
操作1:検索対象について思いつくキーワードを入力する。
操作2:表示される単語A(表記ゆれ語)に対して、同時に表示された単語Cを参考に、関係/無関係を選択する。
操作3:表示される単語E(検索後の関連語)がユーザの検索したいものと関連しているかどうかを判断する。
操作4:関連していない語が含まれていたら、操作2に戻りやり直す。表示された語が全て関連していれば検索式の編集を終了し、編集が終了した検索式で検索を実行する。
(単語Aの抽出方法)
(i)入力された検索条件でテキストを抽出する。
(ii)テキストに対して言語解析エンジンで単語毎に抽出する。
(iii)単語のうち名詞の中で、最も出現数が多い単語(高頻度語)から順に列挙する。
(iV)各単語に対して、入力された検索条件にヒットするかマッチングにより調べる。完全一致であれば、消去し、部分一致であれば、単語Aとして表示する。単語Aは本発明の第1の単語に相当する。
単語Aの(i)から(iii)まで同様に実施した後、各単語に対して、入力された検索条件にヒットするかをマッチングにより調べる。一致しなければ、単語Bとして表示する。単語Bは本発明の第3の単語に相当する。
(i)[入力された検索条件and単語A]でテキストブログを抽出する。
(ii)単語Aの抽出方法における(ii)、(iii)と同様に行う。単語Cは本発明の第2の単語に相当する。
本実施形態は、第1の実施形態に比べてユーザが入力する検索条件をより充実させることで、検索対象のブログをより効率よく収集することを可能にしたものである。
操作1:検索対象について思いつくキーワードの入力(AND、OR条件)、禁止ワード(NOT条件)の設定を行う。図9は本実施形態のキーワード入力画面の一例を示す図である。図9に示す画面では、図4に示した画面に、禁止ワードの入力欄が追加されている。
操作2:表示される単語A(表記ゆれ語)、単語B(関連語)に対して関係/無関係を選択する。
操作3:データを更新し、単語A、単語Bを再計算させ、再表示させる。
操作4:関係のない単語があまりにも多すぎるようであれば、操作1に戻り原因となる単語を条件式から削除する。修正できるレベルであれば、操作2に戻りやり直す。表示された語が全て関連していれば検索式の編集を終了し、編集が終了した検索式で検索を実行する。
(express or エクスプレス or えくすぷれす)and NEC・・・式4
となる。
(単語Dの抽出方法)
(i)[入力された検索条件and単語B]でテキストブログを抽出する。
(ii)第1の実施形態の単語Aの抽出方法における(ii)、(iii)と同様に行う。単語Dは本発明の第4の単語に相当する。
本実施形態は、第1の実施形態で抽出される単語Cおよび第2の実施形態で抽出される単語B、単語Dの上位に汎用語が入らないようにするものである。汎用語とは、文章の中で汎用的に使われる言葉である。汎用語として、例えば、時間、ブログ、日記などの単語がある。
2008/1/1 1位 ブログ 500件
2008/1/1 2位 時間 480件
…
2008/1/2 1位 祝日 600件
2008/1/2 2位 時間 580件
…
上述の例では、2008年1月1日の日次ベースでは、「ブログ」という単語が500件使用され、1位にランクされていることを示している。また、2008年1月2日の日次ベースでは、「祝日」という単語が600件使用され、1位にランクされていることを示している。
条件1:ブログに出現する頻度が非常に高い単語であること。
条件2:毎日、定常的に利用される単語であること(毎日の出現する頻度に変動が少ない単語であること)。
Score(w) = αF(w)×(1+log T(w))×ΣHt(w)・・・式5
と表される。
)の総和である。tは、指定された期間内の日付である。
Ht(w)=−Ft(w)/F(w)×log(Ft(w)/F(w))・・・式6
式6のFt(w)は、日付tでの単語w出現件数を示す。
Score(w) = αP(w)×(1+log T(w))×ΣHt(w)・・・式7
と表される。
す。Ftは、日付tでの全単語出現件数の総和を示す。T(w)およびαは第1の方法と同様である。
Ht(w)=−Pt(w)/P(w)×log(Pt(w)/P(w))・・・式8
式8のPt(w)は日付tでの単語w出現確率(=Ft(w)/Ft)を示す。
Score(w) = αO(w)×(1+log T(w))×ΣHt(w)・・・式9
と表される。
Ht(w)=−Ot(w)/O(w)×log(Ot(w)/O(w))・・・式10
式10のOt(w)は、単語w日次出現順位ポイントを示す。高順位ほど高ポイントになるように点をつける。例えば、1位:5000点、2位:4999点、・・・などである。
(1)検索語確認画面データのスコア(使用回数、件数)に汎用語スコアの逆数(1/汎用語スコア)を乗算し、検索語確認画面における汎用語の出力順位を下げる。汎用語スコアは汎用語順位が高いほど高いスコアである。
(2)マッチングにより汎用語と一致した単語を検索語確認画面から完全に非表示にする。
総件数が上位(既定件数以上)でかつ日次集計の件数の変動が少ない(規定件数値内で変動)ものが選ばれる。
次に、情報量、単語出現確率を利用する第2の方法の場合を説明する。
次に、情報量、単語出現順位を利用する第3の方法の場合を説明する。
11 記憶部
12 制御部
Claims (15)
- 検索のためのキーワードが入力されると、該キーワードを含むテキストを格納部に記憶されているテキストから収集し、収集した第1のテキストの名詞を抽出し、前記キーワードと部分一致する名詞を第1の単語として決定し、前記第1のテキストのうち該第1の単語を含む第2のテキストを抽出し、該第2のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、抽出した単語の使用回数をカウントし、該使用回数が上位所定のランク内である単語を前記第1の単語の関連語である第2の単語に決定し、前記第1の単語および前記第2の単語を出力する制御部を有する情報検索装置。
- 前記制御部は、
出力された前記第1の単語のうちいずれかについて除外する指示が入力されると、除外対象の第1の単語を含むテキストを前記第1のテキストから除外した後の第3のテキストについて前記第1の単語および前記第2の単語を抽出し直して出力する、請求項1記載の情報検索装置。 - 前記制御部は、
前記第1のテキストから抽出された名詞のうち前記第1の単語を除いた単語を第3の単語と決定し、前記第1のテキストのうち該第3の単語を含む第4のテキストを抽出し、該第4のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、抽出した単語の使用回数をカウントし、該使用回数が上位所定のランク内である単語を前記第3の単語の関連語である第4の単語に決定し、前記第3の単語および前記第4の単語を出力する、請求項1記載の情報検索装置。 - 検索対象から除外する単語が記述された汎用語リストを保存する記憶部をさらに有し、
前記制御部は、
前記汎用語リストを参照し、抽出した単語について、該汎用語リストに含まれる単語と一致する単語のランクを下げる、または該単語を削除する請求項1から3のいずれか1項記載の情報検索装置。 - 前記制御部は、
汎用語の抽出要求の指示により、または、所定の時刻になったとき、前記格納部に記憶されているテキストを収集し、収集したテキストから単語を抽出し、第1の所定の期間の出現頻度が第1の既定値より高く、かつ、前記第1の所定の期間よりも短い第2の所定の期間毎の出現頻度が第2の既定値範囲内で変動している単語を汎用語として決定し、該汎用語のリストである前記汎用語リストを作成する、請求項4記載の情報検索装置。 - 情報を記録するための格納部と接続された情報検索装置の制御部による情報検索方法であって、
前記制御部は、検索のためのキーワードが入力されると、該キーワードを含むテキストを格納部に記憶されているテキストから収集し、
前記制御部は、収集した第1のテキストの名詞を抽出し、前記キーワードと部分一致する名詞を第1の単語として決定し、
前記制御部は、前記第1のテキストのうち該第1の単語を含む第2のテキストを抽出し、
前記制御部は、前記第2のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、
前記制御部は、前記第2のテキストから抽出した単語の使用回数をカウントし、
前記制御部は、前記第2のテキストから抽出した単語の前記使用回数が上位所定のランク内である単語を前記第1の単語の関連語である第2の単語に決定し、
前記制御部は、前記第1の単語および前記第2の単語を出力する、情報検索方法。 - 前記制御部は、出力された前記第1の単語のうちいずれかについて除外する指示が入力されると、除外対象の第1の単語を含むテキストを前記第1のテキストから除外した後の第3のテキストについて前記第1の単語および前記第2の単語を抽出し直して出力する、請求項6記載の情報検索方法。
- 前記制御部は、前記第1のテキストから抽出された名詞のうち前記第1の単語を除いた単語を第3の単語と決定し、前記第1のテキストのうち該第3の単語を含む第4のテキストを抽出し、
前記制御部は、前記第4のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、
前記制御部は、前記第4のテキストから抽出した単語の使用回数をカウントし、
前記制御部は、前記第4のテキストから抽出した単語の前記使用回数が上位所定のランク内である単語を前記第3の単語の関連語である第4の単語に決定し、
前記制御部は、前記第3の単語および前記第4の単語を出力する、請求項6記載の情報検索方法。 - 検索対象から除外する単語が記述された汎用語リストを保存する記憶部が前記情報検索装置に設けられ、
前記制御部は、前記汎用語リストを参照し、抽出した単語について、該汎用語リストに含まれる単語と一致する単語のランクを下げる、または該単語を削除する請求項6から8のいずれか1項記載の情報検索方法。 - 前記制御部は、汎用語の抽出要求の指示により、または、所定の時刻になったとき、前記格納部に記憶されているテキストを収集し、収集したテキストから単語を抽出し、
前記制御部は、第1の所定の期間の出現頻度が第1の既定値より高く、かつ、前記第1の所定の期間よりも短い第2の所定の期間毎の出現頻度が第2の既定値範囲内で変動している単語を汎用語として決定し、該汎用語のリストである前記汎用語リストを作成する、請求項9記載の情報検索方法。 - コンピュータに実行させるためのプログラムであって、
検索のためのキーワードが入力されると、該キーワードを含むテキストを格納部に記憶されているテキストから収集し、
収集した第1のテキストの名詞を抽出し、前記キーワードと部分一致する名詞を第1の単語として決定し、
前記第1のテキストのうち該第1の単語を含む第2のテキストを抽出し、
前記第2のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、
前記第2のテキストから抽出した単語の使用回数をカウントし、
前記第2のテキストから抽出した単語の前記使用回数が上位所定のランク内である単語を前記第1の単語の関連語である第2の単語に決定し、
前記第1の単語および前記第2の単語を出力する処理を前記コンピュータに実行させるためのプログラム。 - 出力された前記第1の単語のうちいずれかについて除外する指示が入力されると、除外対象の第1の単語を含むテキストを前記第1のテキストから除外した後の第3のテキストについて前記第1の単語および前記第2の単語を抽出し直して出力する処理を有する請求項11記載のプログラム。
- 前記第1のテキストから抽出された名詞のうち前記第1の単語を除いた単語を第3の単語と決定し、前記第1のテキストのうち該第3の単語を含む第4のテキストを抽出し、
前記第4のテキストから名詞、動詞または形容詞の少なくとも1つである単語を抽出し、
前記第4のテキストから抽出した単語の使用回数をカウントし、
前記第4のテキストから抽出した単語の前記使用回数が上位所定のランク内である単語を前記第3の単語の関連語である第4の単語に決定し、
前記第3の単語および前記第4の単語を出力する処理を有する請求項11記載のプログラム。 - 検索対象から除外する単語が記述された汎用語リストを保存し、
前記汎用語リストを参照し、抽出した単語について、該汎用語リストに含まれる単語と一致する単語のランクを下げる、または該単語を削除する処理を有する請求項11から13のいずれか1項記載のプログラム。 - 汎用語の抽出要求の指示により、または、所定の時刻になったとき、前記格納部に記憶されているテキストを収集し、収集したテキストから単語を抽出し、
第1の所定の期間の出現頻度が第1の既定値より高く、かつ、前記第1の所定の期間よりも短い第2の所定の期間毎の出現頻度が第2の既定値範囲内で変動している単語を汎用語として決定し、該汎用語のリストである前記汎用語リストを作成する、請求項14記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008216509A JP4587236B2 (ja) | 2008-08-26 | 2008-08-26 | 情報検索装置、情報検索方法、およびプログラム |
US12/543,273 US8793259B2 (en) | 2008-08-26 | 2009-08-18 | Information retrieval device, information retrieval method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008216509A JP4587236B2 (ja) | 2008-08-26 | 2008-08-26 | 情報検索装置、情報検索方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010055159A JP2010055159A (ja) | 2010-03-11 |
JP4587236B2 true JP4587236B2 (ja) | 2010-11-24 |
Family
ID=41726834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008216509A Active JP4587236B2 (ja) | 2008-08-26 | 2008-08-26 | 情報検索装置、情報検索方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8793259B2 (ja) |
JP (1) | JP4587236B2 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9875298B2 (en) | 2007-10-12 | 2018-01-23 | Lexxe Pty Ltd | Automatic generation of a search query |
US9773283B2 (en) | 2011-06-24 | 2017-09-26 | Facebook, Inc. | Inferring topics from social networking system communications using social context |
US9779385B2 (en) * | 2011-06-24 | 2017-10-03 | Facebook, Inc. | Inferring topics from social networking system communications |
US10311113B2 (en) | 2011-07-11 | 2019-06-04 | Lexxe Pty Ltd. | System and method of sentiment data use |
EP2570939A1 (en) * | 2011-09-16 | 2013-03-20 | Lexxe Pty Ltd. | Automatic generation of a search query |
CN102999547A (zh) * | 2011-09-16 | 2013-03-27 | 莱克西私人有限公司 | 搜索查询的自动生成 |
EP2570938A1 (en) * | 2011-09-16 | 2013-03-20 | Lexxe Pty Ltd. | System and method for ordering semantic sub-keys utilizing superlative adjectives |
CN102724332A (zh) * | 2011-12-30 | 2012-10-10 | 新奥特(北京)视频技术有限公司 | 一种网络服务地址的动态匹配方法 |
CN104272307A (zh) * | 2012-05-18 | 2015-01-07 | 索尼公司 | 信息处理装置、信息处理方法、以及程序 |
US10380606B2 (en) | 2012-08-03 | 2019-08-13 | Facebook, Inc. | Negative signals for advertisement targeting |
JP2014085780A (ja) * | 2012-10-23 | 2014-05-12 | Samsung Electronics Co Ltd | 番組推薦装置及び番組推薦プログラム |
CN104503980B (zh) * | 2014-11-26 | 2020-06-05 | 百度在线网络技术(北京)有限公司 | 确定综合搜索信息以及据此确定待推送候选搜索序列 |
JP6305630B2 (ja) * | 2015-03-20 | 2018-04-04 | 株式会社東芝 | 文書検索装置、方法及びプログラム |
JP6382139B2 (ja) * | 2015-03-20 | 2018-08-29 | ヤフー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2016220175A (ja) * | 2015-05-26 | 2016-12-22 | 株式会社オプティム | 装置検索サーバ、装置検索方法及び装置検索サーバ用プログラム。 |
CN105095434B (zh) * | 2015-07-23 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 时效需求识别方法及装置 |
CN105955993B (zh) * | 2016-04-19 | 2020-09-25 | 北京百度网讯科技有限公司 | 搜索结果排序方法和装置 |
CN107729457B (zh) * | 2017-10-10 | 2020-11-13 | 惠州Tcl移动通信有限公司 | 一种信息智能检索的方法、装置及存储介质 |
US10732789B1 (en) * | 2019-03-12 | 2020-08-04 | Bottomline Technologies, Inc. | Machine learning visualization |
CN111444429B (zh) * | 2020-03-27 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 信息推送方法、装置及服务器 |
CN111797205B (zh) * | 2020-06-30 | 2024-03-12 | 百度在线网络技术(北京)有限公司 | 一种词表检索方法、装置、电子设备及存储介质 |
CN111859944B (zh) * | 2020-07-17 | 2022-12-13 | 维沃移动通信有限公司 | 信息显示方法、装置和电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001325272A (ja) * | 2000-05-16 | 2001-11-22 | Internatl Business Mach Corp <Ibm> | 情報整理方法、情報処理装置、記憶媒体、およびプログラム伝送装置 |
JP2002117043A (ja) * | 2000-10-11 | 2002-04-19 | Ricoh Co Ltd | 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体 |
JP2002140366A (ja) * | 2000-10-31 | 2002-05-17 | Ricoh Co Ltd | 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体 |
JP2004054882A (ja) * | 2002-05-27 | 2004-02-19 | Ricoh Co Ltd | 類義語検索装置、方法、プログラム及び記憶媒体 |
JP2004139222A (ja) * | 2002-10-16 | 2004-05-13 | Internatl Business Mach Corp <Ibm> | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
JP2005135113A (ja) * | 2003-10-29 | 2005-05-26 | Sony Corp | 電子機器装置、関連語抽出方法及びプログラム |
WO2005066837A1 (ja) * | 2003-12-26 | 2005-07-21 | Matsushita Electric Industrial Co., Ltd. | 辞書作成装置および辞書作成方法 |
JP2006146802A (ja) * | 2004-11-24 | 2006-06-08 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニング方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3607462B2 (ja) * | 1997-07-02 | 2005-01-05 | 松下電器産業株式会社 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
JPH11259515A (ja) * | 1998-03-12 | 1999-09-24 | Toshiba Corp | 類似文書検索装置、類似文書検索方法、および類似文書検索のためのプログラムが記録された記録媒体 |
EP1225517B1 (en) * | 2001-01-17 | 2006-05-17 | International Business Machines Corporation | System and methods for computer based searching for relevant texts |
US7324990B2 (en) * | 2002-02-07 | 2008-01-29 | The Relegence Corporation | Real time relevancy determination system and a method for calculating relevancy of real time information |
JP2004287827A (ja) | 2003-03-20 | 2004-10-14 | Fuji Xerox Co Ltd | 検索システム、プログラム、及び検索条件選択肢の提示方法 |
JP2008537225A (ja) * | 2005-04-11 | 2008-09-11 | テキストディガー,インコーポレイテッド | クエリについての検索システムおよび方法 |
-
2008
- 2008-08-26 JP JP2008216509A patent/JP4587236B2/ja active Active
-
2009
- 2009-08-18 US US12/543,273 patent/US8793259B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001325272A (ja) * | 2000-05-16 | 2001-11-22 | Internatl Business Mach Corp <Ibm> | 情報整理方法、情報処理装置、記憶媒体、およびプログラム伝送装置 |
JP2002117043A (ja) * | 2000-10-11 | 2002-04-19 | Ricoh Co Ltd | 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体 |
JP2002140366A (ja) * | 2000-10-31 | 2002-05-17 | Ricoh Co Ltd | 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体 |
JP2004054882A (ja) * | 2002-05-27 | 2004-02-19 | Ricoh Co Ltd | 類義語検索装置、方法、プログラム及び記憶媒体 |
JP2004139222A (ja) * | 2002-10-16 | 2004-05-13 | Internatl Business Mach Corp <Ibm> | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
JP2005135113A (ja) * | 2003-10-29 | 2005-05-26 | Sony Corp | 電子機器装置、関連語抽出方法及びプログラム |
WO2005066837A1 (ja) * | 2003-12-26 | 2005-07-21 | Matsushita Electric Industrial Co., Ltd. | 辞書作成装置および辞書作成方法 |
JP2006146802A (ja) * | 2004-11-24 | 2006-06-08 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニング方法 |
Also Published As
Publication number | Publication date |
---|---|
US20100057725A1 (en) | 2010-03-04 |
JP2010055159A (ja) | 2010-03-11 |
US8793259B2 (en) | 2014-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4587236B2 (ja) | 情報検索装置、情報検索方法、およびプログラム | |
US12001429B2 (en) | Methods, systems, and media for interpreting queries | |
US9589071B2 (en) | Query suggestions from documents | |
US10140368B2 (en) | Method and apparatus for generating a recommendation page | |
US9201880B2 (en) | Processing a content item with regard to an event and a location | |
JP5647508B2 (ja) | ショートテキスト通信のトピックを識別するためのシステムおよび方法 | |
KR102001647B1 (ko) | 지식 패널들을 컨텍스트화 | |
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
US20110295612A1 (en) | Method and apparatus for user modelization | |
JP6538277B2 (ja) | 検索クエリ間におけるクエリパターンおよび関連する総統計の特定 | |
US20070288498A1 (en) | Interface for managing search term importance relationships | |
US20080243835A1 (en) | Program, method and apparatus for web page search | |
JP4640554B2 (ja) | サーバ装置、情報処理方法およびプログラム | |
CN110717008B (zh) | 基于语意识别的搜索结果排序方法及相关装置 | |
JP2011070291A (ja) | トピックワード抽出装置、トピックワード抽出システム、トピックワード抽出方法、及びプログラム | |
KR102434880B1 (ko) | 멀티미디어 플랫폼 기반 지식 공유 서비스 제공 시스템 | |
JP2011100191A (ja) | 文書検索装置、文書検索方法、及び文書検索プログラム | |
JP5072792B2 (ja) | 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ | |
JP4331177B2 (ja) | 情報検索システム、情報検索方法及び情報検索プログラム | |
JP5332128B2 (ja) | 情報検索装置、情報検索方法およびそのプログラム | |
Tian et al. | A prediction model for web search hit counts using word frequencies | |
JP2020013387A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2010066888A (ja) | 同文字異議語の検索装置 | |
JP2013178808A (ja) | 情報検索装置、情報検索方法およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100811 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100901 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4587236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |