JP5307781B2 - 情報処理装置、方法及びプログラム - Google Patents
情報処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5307781B2 JP5307781B2 JP2010210324A JP2010210324A JP5307781B2 JP 5307781 B2 JP5307781 B2 JP 5307781B2 JP 2010210324 A JP2010210324 A JP 2010210324A JP 2010210324 A JP2010210324 A JP 2010210324A JP 5307781 B2 JP5307781 B2 JP 5307781B2
- Authority
- JP
- Japan
- Prior art keywords
- noun
- search
- type
- word
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 23
- 230000010365 information processing Effects 0.000 title claims description 19
- 230000008569 process Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 2
- 230000004931 aggregating effect Effects 0.000 claims 2
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000008520 organization Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000003796 beauty Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本実施形態は、図1に示す情報処理装置1(以下「本装置1」又は「本装置」と略称する)に関するもので、本装置1は、自動翻訳サーバ2及びウェブ検索サーバ3のバックエンドとして、これら自動翻訳サーバ2及びウェブ検索サーバ3から名詞(名詞を含む文字列でもよい)を受け取って、その類型を回答するものである。自動翻訳サーバ2及びウェブ検索サーバ3は、それぞれ、通信ネットワークN(インターネット、携帯電話網、LANなど)経由でユーザの端末Tからのアクセスを受け付けて、自動翻訳及びウェブ検索のサービスを提供するものである。
上記のように構成した本装置1が名詞の類型を判定する作用における処理手順を図3のフローチャートに示す。
〔2−1.名詞の取得〕
すなわち、名詞取得手段10が、言語処理の対象として与えられた判定対象の名詞を取得する(ステップS1)。この判定対象の名詞の取得は、図1の例では自動翻訳サーバ2やウェブ検索サーバ3から送信される判定対象の名詞を受信することで行うが、他に、端末Tのユーザなどから直接入力を受け付けてもよいし、検索ログの検索クエリなど、類型を判定したい名詞群をファイルなどに用意しておき、アップロードを受け付けたりバッチ処理などによりまとめて判定処理を行ってもよい。
続いて、検索結果取得手段20が、取得された名詞に基づくウェブ検索結果を取得する(ステップS2)。具体的には、取得された名詞を検索キーワード入力手段15が、ウェブ検索サーバ3などの実現する所定の検索エンジン(すなわちウェブ検索サービス)などに入力し、検索結果取得手段20が、その名詞に基づく検索エンジンなどによるウェブ検索結果を取得する(ステップS2)。図4は、名詞(例えば「キールナ」)が検索クエリとして入力された場合の検索結果表示画面の一例を示す図である。
そして、類型判定手段30が、取得されたウェブ検索結果における名詞に関する文脈に基づいて、例えば形態素解析による固有表現抽出技術を適用するなどにより、名詞の類型を判定する(ステップS3)。ここで、固有表現抽出技術(NE技術)は、形態素解析により、所定の語について接尾語や接頭語になっているか、また当該名詞との共起性などに応じて名詞の類型の判定などを行うものであり、例えば、非特許文献3に記載のように、隠れマルコフモデルや最大エントロピーモデルによる固有表現抽出などが知られている。なお、ここでは、対象の名詞は既に特定されているので、既存の固有表現抽出技術については、名詞の類型を判定するアルゴリズムの部分のみを利用してもよいし、必ずしも利用しなくてもよい。
上記のように判定された類型を自動翻訳サーバ2へ出力して活用すれば翻訳精度が改善する。例えば、自動翻訳において、翻訳辞書にないような単語が原文にあった場合、もしくは、与えられた原文からでは類型を決めかねる単語が原文中にあった場合に、本装置1での判定に基づいて翻訳処理を行うことで、判定結果の精度が改善する。一例として、例えば、「キールナは美しさで有名です」という文を英語に訳す場合、キールナが地名の場合、“Kiruna is famous for its beauty.”に、人名の場合、“Kiruna is famous for her(/his) beauty.”になる。このように、「キールナ」のタイプが分かることで、訳文がより正確になることが期待できる。
まず、類型については、単一の類型だけを判定し出力することもできるが、考えられる複数の類型を判定し、それを集計した結果を出力することが望ましい。具体的には、判定結果集計手段40が、検索結果取得手段20により取得されたウェブ検索結果に含まれる所定数の要素(例えば、スニペットなどの要約)に対して、類型判定手段30により判定された類型ごとの数量を集計し(ステップS4)、結果出力手段50が、集計された数量が多い類型を優先して判定結果として出力する(ステップS5)。
判定された類型の用途の一つは、関連検索すなわち関連検索ワードの提示である。この場合、関連提示手段60が、名詞について判定された類型に基づいて、その名詞と同時に検索クエリとして指定する語の候補として、類型に応じた所定の語を提示する。例えば、ウェブ検索のキーワード入力欄において入力された検索クエリである名詞の類型が本発明により地名と判定された場合、その類型に予め関連付けられたホテルや旅行などに関する語(例えば、図2(2)に例示した「旅行」「宿泊」「予約」など)を関連検索ワードとして選定して提示できる。
また、判定された類型の用途を活用する他の例として、ウェブ検索結果におけるURLなど情報項目のリスト順(ランキング順などとも呼ばれる)が考えられる。この場合、リスト順制御手段70が、名詞に基づくウェブ検索結果に含まれる情報項目(例えば、検索結果としてヒットした個々のURLと、そのURLのウェブページの要約文や抽出文など)について、その名詞について判定された類型と同じ類型に係る表現を含むか否かに基づいて、情報項目のリスト順を制御する。
以上のように、検索エンジンの検索結果における名詞に関する文脈に基づくことにより(例えば図3、図4)、与えられた文脈からは類型が不明な名詞についても名詞の類型が判定できるので、判定した類型を、例えば関連検索における関連検索ワードの提示(例えば図5)や、ウェブ検索結果のリスト順の制御に反映するなど、ユーザの意図に基づく情報処理結果の最適化に活用可能となる。
なお、上記各実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、本発明は、日本語以外の中国語、韓国語、フランス語その他の任意の外国語にも適用可能である。
2 自動翻訳サーバ
3 ウェブ検索サーバ
6 演算制御部
7 記憶装置
8 通信手段
10 名詞取得手段
15 検索キーワード入力手段
20 検索結果取得手段
25 パターン記憶手段
30 類型判定手段
35 関連検索語記憶手段
40 判定結果集計手段
50 結果出力手段
60 関連提示手段
70 リスト順制御手段
C 候補表示欄
F 入力欄
N 通信ネットワーク
P マウスポインタ
T 端末
Claims (4)
- 言語処理の対象として与えられた判定対象の名詞を取得する名詞取得手段と、
取得された前記名詞に基づくウェブ検索結果を取得する検索結果取得手段と、
取得された前記ウェブ検索結果における前記名詞に関する文脈に基づいて前記名詞の類型を判定する類型判定手段と、
前記名詞について判定された前記類型に基づいて、その名詞と同時に検索クエリとして指定する語の候補を所定の語として予め記憶する関連検索語記憶手段を参照することにより、前記所定の語を前記関連検索語記憶手段から読み出し、提示する関連提示手段と、
を有することを特徴とする情報処理装置。 - 取得された前記ウェブ検索結果に含まれる所定数の要素に対して前記類型判定手段により判定された前記類型ごとの数量を集計する判定結果集計手段と、
集計された前記数量が多い前記類型を優先して判定結果として出力する結果出力手段と、
を有することを特徴とする請求項1記載の情報処理装置。 - コンピュータが、言語処理の対象として与えられた判定対象の名詞を取得する名詞取得処理と、
コンピュータが、取得された前記名詞に基づくウェブ検索結果を取得する検索結果取得処理と、
コンピュータが、取得された前記ウェブ検索結果における前記名詞に関する文脈に基づいて前記名詞の類型を判定する類型判定処理と、
前記名詞について判定された前記類型に基づいて、その名詞と同時に検索クエリとして指定する語の候補を所定の語として予め記憶する関連検索語記憶手段を参照することにより、前記所定の語を前記関連検索語記憶手段から読み出し、提示する関連提示処理と、
を含むことを特徴とする情報処理方法。 - コンピュータを制御することにより名詞の類型を判定させて関連検索ワードを提示させるコンピュータ・プログラムであって、
コンピュータに、言語処理の対象として与えられた判定対象の名詞を取得させ、
コンピュータに、取得された前記名詞に基づくウェブ検索結果を取得させ、
コンピュータに、取得された前記ウェブ検索結果における前記名詞に関する文脈に基づいて前記名詞の類型を判定させ、
前記名詞について判定された前記類型に基づいて、その名詞と同時に検索クエリとして指定する語の候補を所定の語として予め記憶する関連検索語記憶手段を参照することにより、前記所定の語を前記関連検索語記憶手段から読み出し、提示させる
ことを特徴とする情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010210324A JP5307781B2 (ja) | 2010-09-21 | 2010-09-21 | 情報処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010210324A JP5307781B2 (ja) | 2010-09-21 | 2010-09-21 | 情報処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012068687A JP2012068687A (ja) | 2012-04-05 |
JP5307781B2 true JP5307781B2 (ja) | 2013-10-02 |
Family
ID=46165955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010210324A Active JP5307781B2 (ja) | 2010-09-21 | 2010-09-21 | 情報処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5307781B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390004B (zh) * | 2012-05-11 | 2018-03-02 | 北京百度网讯科技有限公司 | 一种语义冗余的确定方法和装置、对应的搜索方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1115841A (ja) * | 1997-06-24 | 1999-01-22 | Fuji Xerox Co Ltd | 情報検索装置及び情報検索プログラムを記録した媒体 |
JP2002132812A (ja) * | 2000-10-19 | 2002-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 |
JP4089399B2 (ja) * | 2002-11-26 | 2008-05-28 | 沖電気工業株式会社 | 情報検索方法及び装置 |
JP3847273B2 (ja) * | 2003-05-12 | 2006-11-22 | 沖電気工業株式会社 | 単語分類装置、単語分類方法及び単語分類プログラム |
KR100905866B1 (ko) * | 2004-03-15 | 2009-07-03 | 야후! 인크. | 사용자 주석이 통합된 검색 시스템 및 방법 |
JP2006119697A (ja) * | 2004-10-19 | 2006-05-11 | Fuji Xerox Co Ltd | 質問応答システム、質疑応答方法および質疑応答プログラム |
JP4724701B2 (ja) * | 2007-10-30 | 2011-07-13 | 日本電信電話株式会社 | 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体 |
-
2010
- 2010-09-21 JP JP2010210324A patent/JP5307781B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012068687A (ja) | 2012-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
CN107526846B (zh) | 频道排序模型的生成、排序方法、装置、服务器和介质 | |
US9344507B2 (en) | Method of processing web access information and server implementing same | |
US20090313220A1 (en) | Expansion of Search Result Information | |
US8631097B1 (en) | Methods and systems for finding a mobile and non-mobile page pair | |
CN101882149A (zh) | 重排序和提高搜索结果的相关性 | |
US8793120B1 (en) | Behavior-driven multilingual stemming | |
KR20030016037A (ko) | 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치 | |
US20150169564A1 (en) | Supplementing search results with information of interest | |
JP4875911B2 (ja) | コンテンツ特定方法及び装置 | |
TWI417751B (zh) | Information providing device, information providing method, information application program, and information recording medium | |
CN102750081A (zh) | 信息处理设备、信息处理方法和程序 | |
KR101212457B1 (ko) | 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템 | |
JP2012037920A (ja) | 広告マッチング装置、方法及びプログラム | |
CN106919593B (zh) | 一种搜索的方法和装置 | |
JP5256273B2 (ja) | 意図抽出装置、方法及びプログラム | |
US20190347295A1 (en) | Display apparatus and display method | |
JP5579140B2 (ja) | 文書検索装置及び方法及びプログラム | |
JP5151368B2 (ja) | 情報処理装置および情報処理プログラム | |
TWI399657B (zh) | A provider, a method of providing information, a program, and an information recording medium | |
JP5307781B2 (ja) | 情報処理装置、方法及びプログラム | |
KR20050070955A (ko) | 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 | |
Vargas et al. | Term-by-term query auto-completion for mobile search | |
JP2011053996A (ja) | Webブラウザ選択方法および装置 | |
JP2008204198A (ja) | 情報提供システム、及び、情報提供プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20121101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121130 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130418 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130627 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5307781 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |