JP5094835B2 - 意味属性推定装置、方法及びプログラム - Google Patents
意味属性推定装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5094835B2 JP5094835B2 JP2009298412A JP2009298412A JP5094835B2 JP 5094835 B2 JP5094835 B2 JP 5094835B2 JP 2009298412 A JP2009298412 A JP 2009298412A JP 2009298412 A JP2009298412 A JP 2009298412A JP 5094835 B2 JP5094835 B2 JP 5094835B2
- Authority
- JP
- Japan
- Prior art keywords
- semantic attribute
- search
- provisional
- word
- search query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 15
- 239000002245 particle Substances 0.000 claims description 51
- 238000000605 extraction Methods 0.000 claims description 20
- 238000003780 insertion Methods 0.000 claims description 18
- 230000037431 insertion Effects 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 description 24
- 230000009194 climbing Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 235000013305 food Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、その単語が同音異義語や多義語である場合には、単語が複数の意味を有することにより、当該単語を入力したユーザに興味のない分野の広告が表示される場合も生じるだけでなく、検索結果にも影響を与える。例えば、あるユーザが検索語として「おいなりさん」と入力した場合、この単語は、稲荷神社としての「お稲荷さん」という意味と、食べ物としての「お稲荷さん」(いなりずし)という意味の2つの意味を有する。このような場合、稲荷神社としての「お稲荷さん」に関する検索結果や広告と、いなりずしに関する検索結果と広告とが混在することになる。上記の例でいうと、「いなりずし」に関心のあるユーザの検索結果に神社に関する広告が表示されても、そのユーザが神社の広告に関心を持つことは考えにくく、表示された広告の効果を期待するのは困難である。
そこで、格フレーム辞書を用いて、自然文に使用された単語の意味を推定して自然文のマッチングを行う装置が提案されている(例えば、特許文献1)。
「単語」列には、検索対象の単語が登録されており、「変換語」列には、検索対象の単語を仮文の述語となるように変換した語が登録されている。なお、「単語」列に格納された単語のうち(例えば、単語辞書テーブルの「レシピ」など)、活用形がないなど、仮文の述語となるように変換できないものは変換されない。また、「種類」列には、当該単語の品詞の種類又は「変換後」列に格納されている語について活用形の種類が格納されている。
ここで、格フレームは、動詞を基準として取り得る格とその値に関する制約を記述したものである。また、格フレーム辞書は、動詞が取り得る格やその動詞が持つ制約に大きな影響を与える格助詞などについてのパターンを、各動詞について予め作成しておき、検索可能に構成されたものである。本実施形態では、各用言(一部の名詞も含む)について、格フレームテーブルが作成されており、この格フレームテーブルが検索可能に構成されたものが格フレーム辞書として、格フレーム辞書記憶部122に格納されている。
このように、「意味属性」列には、「語句」列に格納されている用言又は名詞の各要素の意味属性が予め定義され、これを表す用語が格納されている。
最初に複数の仮文を作成して、使用される頻度の高い文章を抽出し、その抽出した文章について格フレーム辞書を検索するので、全ての単語について格フレーム辞書を検索するよりも処理負担が少なく、確実性の高い意味属性の推定結果を得ることができる。
20 検索サーバ
30a,30b 端末
40 通信ネットワーク
111 入力検索クエリ取得部
112 助詞挿入部
113 検索部
114 最大頻度語句抽出部
115 意味属性情報取得部
116 単語変換部
117 格フレーム辞書検索部
121 単語辞書記憶部
122 格フレーム辞書記憶部
Claims (4)
- 複数の文字列からなる検索クエリに含まれる前記文字列の意味を推定する意味属性推定装置であって、
入力された前記検索クエリを取得する検索クエリ取得手段と、
取得した前記検索クエリに複数種類の助詞を挿入して複数の仮文を作成する助詞挿入手段と、
前記複数の仮文それぞれについて検索する検索手段と、
前記検索手段による検索結果から、前記複数の仮文ごとに一致した数を取得し、前記一致した数が最大である前記仮文を抽出する最大頻度語句抽出手段と、
前記最大頻度語句抽出手段が抽出した前記仮文に含まれる文字列の意味属性情報を格フレーム辞書を検索して取得する意味属性情報取得手段と、
前記意味属性情報を出力する出力手段と、を備える意味属性推定装置。 - 前記意味属性情報取得手段は、前記最大頻度語句抽出手段が抽出した前記仮文に含まれる前記文字列について、前記仮文に含まれる助詞とともに前記格フレーム辞書を検索して前記意味属性情報を取得する請求項1に記載の意味属性推定装置。
- 複数の文字列からなる検索クエリに含まれる前記文字列の意味を推定する意味属性推定方法であって、
コンピュータを用いて、
入力された前記検索クエリを取得するステップと、
取得した前記検索クエリに複数種類の助詞を挿入して複数の仮文を作成するステップと、
前記複数の仮文それぞれについて検索する検索ステップと、
前記検索ステップでの検索結果から、前記複数の仮文ごとに一致した数を取得し、前記一致した数が最大である前記仮文を抽出する最大頻度語句抽出ステップと、
前記最大頻度語句抽出ステップで抽出された前記仮文に含まれる文字列の意味属性情報を格フレーム辞書を検索して取得するステップと、
前記意味属性情報を出力するステップと、を実行する意味属性推定方法。 - コンピュータに、複数の文字列からなる検索クエリに含まれる前記文字列の意味を推定させる意味属性推定プログラムであって、
コンピュータが、
入力された前記検索クエリを取得するステップと、
取得した前記検索クエリに複数種類の助詞を挿入して複数の仮文を作成するステップと、
前記複数の仮文それぞれについて検索する検索ステップと、
前記検索ステップでの検索結果から、前記複数の仮文ごとに一致した数を取得し、前記一致した数が最大である前記仮文を抽出する最大頻度語句抽出ステップと、
前記最大頻度語句抽出ステップで抽出された前記仮文に含まれる文字列の意味属性情報を格フレーム辞書を検索して取得するステップと、
前記意味属性情報を出力するステップと、を実行する意味属性推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009298412A JP5094835B2 (ja) | 2009-12-28 | 2009-12-28 | 意味属性推定装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009298412A JP5094835B2 (ja) | 2009-12-28 | 2009-12-28 | 意味属性推定装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011138346A JP2011138346A (ja) | 2011-07-14 |
JP5094835B2 true JP5094835B2 (ja) | 2012-12-12 |
Family
ID=44349714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009298412A Active JP5094835B2 (ja) | 2009-12-28 | 2009-12-28 | 意味属性推定装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5094835B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5915053B2 (ja) * | 2011-09-22 | 2016-05-11 | カシオ計算機株式会社 | 情報生成装置、情報生成方法及びプログラム |
JP5906869B2 (ja) * | 2012-03-23 | 2016-04-20 | 富士通株式会社 | アクセント付与装置、アクセント付与方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233724A (ja) * | 2006-03-01 | 2007-09-13 | Nec Corp | 文書検索システム、その方法及びプログラム |
-
2009
- 2009-12-28 JP JP2009298412A patent/JP5094835B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011138346A (ja) | 2011-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
JP6813591B2 (ja) | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、及びプログラム | |
US20100287162A1 (en) | method and system for text summarization and summary based query answering | |
TWI656450B (zh) | 從中文語料庫提取知識的方法和系統 | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
JP5143057B2 (ja) | 重要キーワード抽出装置及び方法及びプログラム | |
JP2020191075A (ja) | Web APIおよび関連エンドポイントの推薦 | |
KR101541306B1 (ko) | 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체 | |
JP2007207127A (ja) | 質問応答システム、質問応答処理方法及び質問応答プログラム | |
JP5094835B2 (ja) | 意味属性推定装置、方法及びプログラム | |
JP6106489B2 (ja) | 語義解析装置、及びプログラム | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JP2018072979A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
JP5073349B2 (ja) | 専門用語抽出装置、方法及びプログラム | |
JPWO2007010836A1 (ja) | コミュニティ特有表現検出装置及び方法 | |
JP2007200252A (ja) | 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体 | |
JP5112416B2 (ja) | 用語抽出装置、方法及び用語辞書のデータ構造 | |
JP2009086979A (ja) | 組織名抽出装置、方法及びプログラム | |
KR101116465B1 (ko) | 광의어를 통한 단어의 온톨로지 매칭 방법 | |
KR101614551B1 (ko) | 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법 | |
JP4155970B2 (ja) | 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム | |
JP5856905B2 (ja) | 主題抽出装置およびそのプログラム | |
Rajalingam | A rule based iterative affix stripping stemming algorithm for Tamil | |
Thanadechteemapat et al. | Thai word segmentation for visualization of thai web sites | |
JP7326637B2 (ja) | チャンキング実行システム、チャンキング実行方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120918 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5094835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |