JP5116738B2 - 文字列評価装置、方法及びプログラム - Google Patents
文字列評価装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5116738B2 JP5116738B2 JP2009207540A JP2009207540A JP5116738B2 JP 5116738 B2 JP5116738 B2 JP 5116738B2 JP 2009207540 A JP2009207540 A JP 2009207540A JP 2009207540 A JP2009207540 A JP 2009207540A JP 5116738 B2 JP5116738 B2 JP 5116738B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- character string
- evaluation
- score
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims description 149
- 238000000034 method Methods 0.000 title description 12
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000012854 evaluation process Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
複数の評価先Webサイトの指定を受け付ける評価先指定部と、
前記文字列受付部が受け付けた前記文字列を複数の形態素に分割する形態素分割部と、
前記形態素分割部によって分割された前記複数の形態素から処理対象の形態素を抽出する形態素抽出部と、
前記形態素抽出部により抽出された前記処理対象の形態素に対して、前記評価先指定部により指定された前記複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出部と、
前記検索API呼出部により呼び出された前記複数の検索APIの各々を実行して、前記処理対象の形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出部と、
前記スコア算出部により算出された前記スコアと、前記処理対象の形態素と、前記スコアを算出した前記検索APIとを対応付けて出力するスコア出力部と、
を備えること、
を特徴とする文字列評価装置。
を特徴とする(1)に記載の文字列評価装置。
を特徴とする(1)又は(2)に記載の文字列評価装置。
前記スコア出力部は、前記スコア算出部により算出した前記スコアに代えて、前記重み付け付与部により重み付けが付与された付与後のスコアを出力すること、
を特徴とする(1)から(3)までのいずれかに記載の文字列評価装置。
を特徴とする(1)から(4)までのいずれかに記載の文字列評価装置。
を特徴とする(1)から(5)までのいずれかに記載の文字列評価装置。
文字列を受け付ける文字列受付ステップと、
複数の評価先Webサイトの指定を受け付ける評価先指定ステップと、
前記文字列受付ステップが受け付けた前記文字列を複数の形態素に分割する形態素分割ステップと、
前記形態素分割ステップによって分割された前記複数の形態素から処理対象の形態素を抽出する形態素抽出ステップと、
前記形態素抽出ステップにより抽出された前記処理対象の形態素に対して、前記評価先指定ステップにより指定された前記複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出ステップと、
前記検索API呼出ステップにより呼び出された前記複数の検索APIの各々を実行して、前記処理対象の形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出ステップと、
前記スコア算出ステップにより算出された前記スコアと、前記処理対象の形態素と、前記スコアを算出した前記検索APIとを対応付けて出力するスコア出力ステップと、
を含むこと、
を特徴とする文字列評価方法。
文字列を受け付ける文字列受付手段と、
複数の評価先Webサイトの指定を受け付ける評価先指定手段と、
前記文字列受付手段が受け付けた前記文字列を複数の形態素に分割する形態素分割手段と、
前記形態素分割手段によって分割された前記複数の形態素から処理対象の形態素を抽出する形態素抽出手段と、
前記形態素抽出手段により抽出された前記処理対象の形態素に対して、前記評価先指定手段により指定された前記複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出手段と、
前記検索API呼出手段により呼び出された前記複数の検索APIの各々を実行して、前記処理対象の形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出手段と、
前記スコア算出手段により算出された前記スコアと、前記処理対象の形態素と、前記スコアを算出した前記検索APIとを対応付けて出力するスコア出力手段と、
して機能させること、
を特徴とする文字列評価プログラム。
[文字列評価システム100の全体構成及び文字列評価装置1の機能構成]
図1は、本実施形態に係る文字列評価システム100の全体構成及び文字列評価装置1の機能構成を示す図である。
次に、文字列評価装置1の処理について説明する。図2は、本実施形態に係る文字列評価装置1での評価処理の概要を説明する図である。
次に、スコアの重み付けについて説明する。図5は、本実施形態に係る重み付けテーブル40の例を示す図である。
次に、上述で算出したスコアの他の使用方法について説明する。スコアは、様々なサービスに利用できる。例えば、辞書DB35は、辞書として用いることができるものであったが、商品名データベースとしても利用することができる。
10 制御部
11 文字列受付部
12 評価先指定部
13 形態素分割部
14 形態素抽出部
15 検索API呼出部
16 スコア算出部
17 重み付け付与部
18 スコア出力部
20 記憶部
23 文字列評価プログラム
25 スコア記憶部
33 検索サービス
34 XMLリスト
35 辞書DB
40 重み付けテーブル
100 文字列評価システム
Claims (8)
- 利用者が閲覧するWebページに含まれる文字列を受け付ける文字列受付部と、
Webページを集めた複数のWebサイトの中から評価先Webサイトの指定を受け付ける評価先指定部と、
前記文字列受付部が受け付けた前記文字列を複数の形態素に分割する形態素分割部と、
前記形態素分割部によって分割された前記複数の形態素から処理対象の形態素を抽出する形態素抽出部と、
前記形態素抽出部により抽出された前記処理対象の形態素に対して、前記評価先指定部により指定された前記複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出部と、
前記検索API呼出部により呼び出された前記複数の検索APIの各々を実行して、前記処理対象の形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出部と、
前記スコア算出部により算出された前記スコアが上位の形態素を用いて、指定を受付けた前記評価先Webサイトに含まれるWebページを検索して取得する情報に対するリンク先のアドレスを生成し、前記利用者が閲覧するWebページに該生成したリンク先のアドレスを出力する出力部と、
を備えること、
を特徴とする文字列評価装置。 - 前記形態素抽出部は、前記形態素分割部によって分割された前記複数の形態素を再結合させて、前記処理対象の形態素を抽出すること、
を特徴とする請求項1に記載の文字列評価装置。 - 前記形態素抽出部は、前記形態素分割部によって分割された前記複数の形態素をフィルタリングすることで、前記処理対象の形態素を選別して抽出すること、
を特徴とする請求項1又は請求項2に記載の文字列評価装置。 - 前記複数の評価先Webサイトの各々に対応する重み付けの入力を受け付け、前記重み付けを参照して、前記スコア算出部により算出された前記スコアに、そのスコアを算出した前記検索APIに対応する評価先Webサイトの前記重み付けを付与する重み付け付与部を備え、
前記スコア出力部は、前記スコア算出部により算出した前記スコアに代えて、前記重み付け付与部により重み付けが付与された付与後のスコアを出力すること、
を特徴とする請求項1から請求項3までのいずれかに記載の文字列評価装置。 - 前記スコア出力部は、前記スコア算出部により算出された前記スコアと、前記処理対象の形態素と、前記スコアを算出した前記検索APIの前記評価先Webサイトとを対応付けて記憶部に記憶すること、
を特徴とする請求項1から請求項4までのいずれかに記載の文字列評価装置。 - 前記評価先Webサイトは、カテゴリごとに分類されたサービスを提供するWebサイトであること、
を特徴とする請求項1から請求項5までのいずれかに記載の文字列評価装置。 - コンピュータを用いた文字列評価方法であって、
利用者が閲覧するWebページに含まれる文字列を受け付ける文字列受付ステップと、
Webページを集めた複数のWebサイトの中から評価先Webサイトの指定を受け付ける評価先指定ステップと、
前記文字列受付ステップが受け付けた前記文字列を複数の形態素に分割する形態素分割ステップと、
前記形態素分割ステップによって分割された前記複数の形態素から処理対象の形態素を抽出する形態素抽出ステップと、
前記形態素抽出ステップにより抽出された前記処理対象の形態素に対して、前記評価先指定ステップにより指定された前記複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出ステップと、
前記検索API呼出ステップにより呼び出された前記複数の検索APIの各々を実行して、前記処理対象の形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出ステップと、
前記スコア算出ステップにより算出された前記スコアが上位の形態素を用いて、指定を受付けた前記評価先Webサイトに含まれるWebページを検索して取得する情報に対するリンク先のアドレスを生成し、前記利用者が閲覧するWebページに該生成したリンク先のアドレスを出力する出力ステップと、
を含むこと、
を特徴とする文字列評価方法。 - コンピュータを、
利用者が閲覧するWebページに含まれる文字列を受け付ける文字列受付手段と、
Webページを集めた複数のWebサイトの中から評価先Webサイトの指定を受け付ける評価先指定手段と、
前記文字列受付手段が受け付けた前記文字列を複数の形態素に分割する形態素分割手段と、
前記形態素分割手段によって分割された前記複数の形態素から処理対象の形態素を抽出する形態素抽出手段と、
前記形態素抽出手段により抽出された前記処理対象の形態素に対して、前記評価先指定手段により指定された前記複数の評価先Webサイトの各々に対応した複数の検索APIを呼び出す検索API呼出手段と、
前記検索API呼出手段により呼び出された前記複数の検索APIの各々を実行して、前記処理対象の形態素の出現度合いに応じた数値をその形態素のスコアとして算出するスコア算出手段と、
前記スコア算出手段により算出された前記スコアが上位の形態素を用いて、指定を受付けた前記評価先Webサイトに含まれるWebページを検索して取得する情報に対するリンク先のアドレスを生成し、前記利用者が閲覧するWebページに該生成したリンク先のアドレスを出力する出力手段と、
して機能させること、
を特徴とする文字列評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009207540A JP5116738B2 (ja) | 2009-09-08 | 2009-09-08 | 文字列評価装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009207540A JP5116738B2 (ja) | 2009-09-08 | 2009-09-08 | 文字列評価装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011059902A JP2011059902A (ja) | 2011-03-24 |
JP5116738B2 true JP5116738B2 (ja) | 2013-01-09 |
Family
ID=43947469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009207540A Active JP5116738B2 (ja) | 2009-09-08 | 2009-09-08 | 文字列評価装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5116738B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11550937B2 (en) * | 2019-06-13 | 2023-01-10 | Fujitsu Limited | Privacy trustworthiness based API access |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003132060A (ja) * | 2001-10-23 | 2003-05-09 | Just Syst Corp | 検索支援装置、検索支援方法、及び検索支援プログラム |
JP2009037501A (ja) * | 2007-08-03 | 2009-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
-
2009
- 2009-09-08 JP JP2009207540A patent/JP5116738B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011059902A (ja) | 2011-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929487B1 (en) | Customization of search results for search queries received from third party sites | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
US20060190446A1 (en) | Web search system and method thereof | |
JP5541049B2 (ja) | データ生成装置、データの生成方法及びデータ生成プログラム | |
JP2007122513A (ja) | コンテンツ検索方法、及び、コンテンツ検索サーバ | |
JP2002245061A (ja) | キーワード抽出 | |
JP2009048408A (ja) | ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム | |
JP5056133B2 (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
JP6960253B2 (ja) | 商品等評価装置、商品等評価方法、およびプログラム | |
JP5116738B2 (ja) | 文字列評価装置、方法及びプログラム | |
CN107622125B (zh) | 一种信息爬取方法和装置、电子设备 | |
JP4834118B2 (ja) | ファセットクエリを利用したサービス誘導入札装置及び方法 | |
JP6960553B2 (ja) | ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム | |
US20130311449A1 (en) | Identifying Referred Documents Based on a Search Result | |
JP5408623B2 (ja) | 検索式提供方法、プログラム、及び、検索式提供システム | |
JP7064871B2 (ja) | テキストマイニング装置およびテキストマイニング方法 | |
JP5002631B2 (ja) | 単語情報収集装置、単語情報収集方法および単語情報収集プログラム | |
JP6235632B2 (ja) | リアルタイム・ライティング支援装置 | |
JP2005316590A (ja) | 情報検索装置 | |
JP2008250893A (ja) | 情報検索装置、情報検索方法およびそのプログラム | |
JP5165704B2 (ja) | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム | |
JP5792871B1 (ja) | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム | |
JP5083627B2 (ja) | 少数意見抽出装置 | |
JP6814093B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN113190753B (zh) | 数据采集方法和装置、电子设备、计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120612 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120813 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120918 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5116738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151026 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |