JP5295818B2 - 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム - Google Patents
文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム Download PDFInfo
- Publication number
- JP5295818B2 JP5295818B2 JP2009039999A JP2009039999A JP5295818B2 JP 5295818 B2 JP5295818 B2 JP 5295818B2 JP 2009039999 A JP2009039999 A JP 2009039999A JP 2009039999 A JP2009039999 A JP 2009039999A JP 5295818 B2 JP5295818 B2 JP 5295818B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- category
- assignment
- occurrence
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
このように制御部5のCPU10が、基準語句と共起語句との関連の強さを示す重み係数Wを算出する重み係数算出手段として機能し、重み係数Wに基づき前記配属スコアAsを算出している。
5・・・制御部
10・・・CPU
20・・・メモリ
21・・・入出力モジュール
22・・・抽出関連モジュール
23・・・カテゴリ等設定モジュール
24・・・スコア等演算モジュール
25・・・配属関連モジュール
30・・・データベース
Claims (11)
- 語句を分類するためのカテゴリを設定するカテゴリ設定手段と、
前記カテゴリごとに1または2以上の基準語句の入力を受け付け、当該基準語句を初期基準語句として設定する基準語句設定手段と、
前記初期基準語句と共に出現する共起語句を文書から抽出する共起語句抽出手段と、
前記初期基準語句と前記共起語句をデータベースに記憶する第一記憶手段と、
前記文書から前記カテゴリへの配属候補となる語句を抽出する語句抽出手段と、
前記配属候補語句について、前記共起語句との共起関連性に基づき前記カテゴリへの配属スコアを算出する配属スコア算出手段と、
前記配属スコアに基づき前記配属候補語句を前記カテゴリに配属を決定する配属決定手段と、
前記配属決定手段によって前記カテゴリに配属された前記配属候補語句を前記カテゴリに関連付けて前記データベースに記憶する第二記憶手段と、
を備えたこと特徴とするデータベースの作成装置。 - 請求項1に記載のデータベースの作成装置において、
前記カテゴリ設定手段が、語句を分類するための目的カテゴリおよび前記分類の目的外の非目的カテゴリを設定することを特徴とするデータベースの作成装置。 - 請求項1または請求項2に記載のデータベースの作成装置において、
外部から前記基準語句の入力を受け付ける入力手段を更に備えたことを特徴とするデータベースの作成装置。 - 請求項1から請求項3のいずれか1項に記載のデータベースの作成装置において、
前記基準語句と前記共起語句との関連の強さを示す重み係数を算出する重み係数算出手段を更に有し、
前記重み係数に基づき前記配属スコアを算出することを特徴とするデータベースの作成装置。 - 請求項4に記載のデータベースの作成装置において、
前記配属候補語句を前記カテゴリの前記基準語句に加えた際に、前記重み係数を更新する重み係数更新手段を更に有することを特徴とするデータベースの作成装置。 - 請求項5に記載のデータベースの作成装置において、
前記共起語句が、複数の前記カテゴリの基準語句に対する共起語句となる場合、前記重み係数の値を減少させることを特徴とするデータベースの作成装置。 - 請求項1から請求項6のいずれか1項に記載のデータベースの作成装置において、
前記配属候補語句について、前記共起語句との前記共起関連性を、共起頻度に基づき算出することを特徴とするデータベースの作成装置。 - 請求項1から請求項7のいずれか1項に記載のデータベースの作成装置において、
前記共起語句が、前記基準語句と係り受け関係を持つ語句であることを特徴とするデータベースの作成装置。 - 請求項1から請求項8のいずれか1項に記載のデータベースの作成装置において、
前記文書から語句を抽出する際、前記語句の品詞の組み合せパターンに基づき、前記文書中で隣接する複数の前記語句から複合語句を作成する複合語句作成手段を更に有することを特徴とするデータベースの作成装置。 - コンピュータにより実行させるデータベースを作成するデータベースの作成方法であって、
語句を分類するためのカテゴリを設定するカテゴリ設定ステップと、
前記カテゴリごとに1または2以上の基準語句の入力を受け付け、当該基準語句を初期基準語句として設定する基準語句設定ステップと、
前記初期基準語句と共に出現する共起語句を文書から抽出する共起語句抽出ステップと、
前記初期基準語句と前記共起語句をデータベースに記憶する第一記憶ステップと、
前記文書から前記カテゴリへの配属候補となる語句を抽出する語句抽出ステップと、
前記配属候補語句について、前記共起語句との共起関連性に基づき前記カテゴリへの配属スコアを算出する配属スコア算出ステップと、
前記配属スコアに基づき前記配属候補語句を前記カテゴリに配属を決定する配属決定ステップと、
前記配属決定ステップによって前記カテゴリに配属された前記配属候補語句を前記カテゴリに関連付けて前記データベースに記憶する第二記憶ステップと、
を有すること特徴とするデータベースの作成方法。 - コンピュータを、
語句を分類するためのカテゴリを設定するカテゴリ設定手段、
前記カテゴリごとに1または2以上の基準語句の入力を受け付け、当該基準語句を初期基準語句として設定する基準語句設定手段、
前記初期基準語句と共に出現する共起語句を文書から抽出する共起語句抽出手段、
前記初期基準語句と前記共起語句をデータベースに記憶する第一記憶手段、
前記文書から前記カテゴリへの配属候補となる語句を抽出する語句抽出手段、
前記配属候補語句について、前記共起語句との共起関連性に基づき前記カテゴリへの配属スコアを算出する配属スコア算出手段、
前記配属スコアに基づき前記配属候補語句を前記カテゴリに配属を決定する配属決定手段、および、
前記配属決定手段によって前記カテゴリに配属された前記配属候補語句を前記カテゴリに関連付けて前記データベースに記憶する第二記憶手段として機能させることを特徴とするデータベースの作成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009039999A JP5295818B2 (ja) | 2009-02-23 | 2009-02-23 | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009039999A JP5295818B2 (ja) | 2009-02-23 | 2009-02-23 | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010198141A JP2010198141A (ja) | 2010-09-09 |
JP2010198141A5 JP2010198141A5 (ja) | 2012-04-05 |
JP5295818B2 true JP5295818B2 (ja) | 2013-09-18 |
Family
ID=42822835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009039999A Active JP5295818B2 (ja) | 2009-02-23 | 2009-02-23 | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5295818B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6188222B2 (ja) * | 2013-12-26 | 2017-08-30 | 日本放送協会 | トピック抽出装置、及びプログラム |
CN110413956B (zh) * | 2018-04-28 | 2023-08-01 | 南京云问网络技术有限公司 | 一种基于bootstrapping的文本相似度计算方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3847273B2 (ja) * | 2003-05-12 | 2006-11-22 | 沖電気工業株式会社 | 単語分類装置、単語分類方法及び単語分類プログラム |
JP2006065366A (ja) * | 2004-08-24 | 2006-03-09 | Nec Corp | キーワード分類装置およびその方法、端末装置ならびにプログラム |
JP2007264985A (ja) * | 2006-03-28 | 2007-10-11 | Oki Electric Ind Co Ltd | 情報分類方法、情報分類装置及び情報分類プログラム |
-
2009
- 2009-02-23 JP JP2009039999A patent/JP5295818B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010198141A (ja) | 2010-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McCarthy et al. | Unsupervised acquisition of predominant word senses | |
US10394830B1 (en) | Sentiment detection as a ranking signal for reviewable entities | |
US9710457B2 (en) | Computer-implemented patent portfolio analysis method and apparatus | |
JP5817491B2 (ja) | 商品検索装置およびプログラム | |
US7657546B2 (en) | Knowledge management system, program product and method | |
US8983963B2 (en) | Techniques for comparing and clustering documents | |
US7783629B2 (en) | Training a ranking component | |
US20090094208A1 (en) | Automatically Generating A Hierarchy Of Terms | |
WO2017013667A1 (en) | Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof | |
Qazi et al. | Enhancing business intelligence by means of suggestive reviews | |
JP2005309853A (ja) | 専門的記述と非専門的記述間の語彙変換方法・プログラム・システム | |
CN111080055A (zh) | 酒店评分方法、酒店推荐方法、电子装置和存储介质 | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP2010198142A (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
JP5224532B2 (ja) | 評判情報分類装置及びプログラム | |
JP3921837B2 (ja) | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 | |
JP5138621B2 (ja) | 情報処理装置及び不満解決商品発見方法及びプログラム | |
JP5295818B2 (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
KR102126911B1 (ko) | KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법 | |
JP4539616B2 (ja) | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム | |
Prakhash et al. | Categorizing food names in restaurant reviews | |
Piasecki et al. | Extraction of the multi-word lexical units in the perspective of the wordnet expansion | |
Herng Leong et al. | Classification of Healthcare Service Reviews with Sentiment Analysis to Refine User Satisfaction | |
JP5679400B2 (ja) | カテゴリ主題語句抽出装置及び階層的タグ付与装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
da Rocha et al. | Polarity classification on web-based reviews using Support Vector Machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120220 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20120413 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5295818 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |