JP2006072579A - Name retrieval device, name retrieval method, and name retrieval program - Google Patents

Name retrieval device, name retrieval method, and name retrieval program Download PDF

Info

Publication number
JP2006072579A
JP2006072579A JP2004253605A JP2004253605A JP2006072579A JP 2006072579 A JP2006072579 A JP 2006072579A JP 2004253605 A JP2004253605 A JP 2004253605A JP 2004253605 A JP2004253605 A JP 2004253605A JP 2006072579 A JP2006072579 A JP 2006072579A
Authority
JP
Japan
Prior art keywords
name
person
search
input
personal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004253605A
Other languages
Japanese (ja)
Inventor
Nobuhide Yamazaki
信英 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2004253605A priority Critical patent/JP2006072579A/en
Publication of JP2006072579A publication Critical patent/JP2006072579A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a name retrieval device that allows outputting appropriate candidates for a name using certain related keywords even without knowledge of the name of a celebrity or a group. <P>SOLUTION: A list of names serving as candidates is stored in a name list 203 in advance. A URL search part 201 searches web pages on the Internet according to keywords and a text extracting part 202 obtains text information related to the keywords. A score counting part 204 counts from the text information the number of names that appear which are included in the list of names and an output part 205 outputs the web pages in decreasing order of the number of names that appear. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

この発明は、有名人や著名人などの人名やグループ名を検索する人名検索装置、人名検索方法および人名検索プログラムに関する。   The present invention relates to a person name search apparatus, a person name search method, and a person name search program for searching for names and group names of celebrities and celebrities.

現在、インターネット上を含めて有名人や著名人の検索サイトが提供されているが、そのほとんどは五十音別やジャンル別(例えばスポーツ選手、歌手、アナウンサー、政治家等々)に分類されていて、主として名前からプロフィール等その人に関する情報を検索するようになっている。   Currently, search sites for celebrities and celebrities are provided on the Internet, but most of them are classified according to the Japanese syllabary and genre (eg athletes, singers, announcers, politicians, etc.). The information about the person such as the profile is searched from the name.

一方、逆に著名人に関連する情報からその人の名前を知りたい場合も多い。実際、誰かと会話中に著名人の名前を示したいのにどうしても名前が思い出せない。しかし、どのような人かは頭に浮かんでいるので、それらの各種の情報から人名を探し当てたいというニーズがある。   On the other hand, there are many cases where it is desirable to know the name of a person from information related to a celebrity. In fact, I want to show the name of a celebrity during a conversation with someone, but I can't remember the name. However, there is a need to find a person's name from these various types of information because people are coming to mind.

しかしながら、人名がわからない場合にそれを検索するには、従来の人名をもとに分類したシステムでそれを行うには不便であった。例えば、サイトがカテゴリーで分類されている場合には、まず分類で絞った上で、その分類の中から、目的とする人名をひとつひとつ確認していく必要があった。   However, it is inconvenient to search for a person whose name is unknown, using a conventional system based on the person's name. For example, if a site is classified by category, it was necessary to first narrow down by category and then check the target person name one by one.

また、キーワードで検索サイト内の情報(人名に対するプロフィールなどの属性情報)を検索して、そのキーワードを多く含む人名を出力する方法もあるが、通常、ユーザの指定するキーワードは多岐にわたるため、限られたサイト内の情報では、ユーザの指定するキーワードになかなかヒットしないという問題点があった。さらに、刻々と新しくなるキーワードに対処するには、サイト内の情報を常に新しいものに更新しなくてはならなく、手間がかかるという問題があった。   In addition, there is a method of searching information in the search site by keyword (attribute information such as profile for a person's name) and outputting a person's name that contains a lot of the keyword. There is a problem that the information in the site that is given does not easily hit the keyword specified by the user. Furthermore, in order to cope with the keywords that are constantly updated, there is a problem that the information on the site has to be constantly updated, which is troublesome.

この発明は、上記に鑑みてなされたものであって、著名人や有名人の名前やグループ名がわからなくても、関連する任意のキーワードから、妥当な人名やグループ名の候補を出力できる人名検索装置、人名検索方法および人名検索プログラムを提供することを目的とする。   The present invention has been made in view of the above, and it is possible to output a suitable person name or group name candidate from any related keyword without knowing the names and group names of celebrities and celebrities. An object is to provide a device, a person name search method, and a person name search program.

上述した課題を解決し、目的を達成するため、請求項1に記載の発明にかかる人名検索装置は、候補として出力する人名を記憶する人名リスト記憶手段と、検索を所望する人名に関連するキーワードの入力を受け付ける入力手段と、前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、前記検索手段によって取得されたウェブページの内容において、前記人名リスト記憶手段に記憶された人名が出現する数を当該人名毎に計数する計数手段と、前記計数手段によって計数された出現数に基づいて人名を出力する出力手段と、を備えたことを特徴とする。   In order to solve the above-described problems and achieve the object, a personal name search device according to the first aspect of the present invention includes a personal name list storage unit that stores personal names to be output as candidates, and a keyword related to the name of a person who desires a search. In the content of the web page acquired by the search means, the search means for acquiring the content of the web page related to the keyword input by the input means, the personal name list storage means in the content of the web page acquired by the search means A counting means for counting the number of appearances of personal names stored for each personal name, and an output means for outputting personal names based on the number of appearances counted by the counting means.

また、請求項2に記載の発明にかかる人名検索装置は、検索を所望する人名に関連するキーワードの入力を受け付ける入力手段と、前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、前記検索手段によって取得されたウェブページの内容から、人名を抽出する抽出手段と、前記抽出手段によって抽出された人名の数を当該人名毎に計数する計数手段と、前記計数手段によって計数された数に基づいて人名を出力する出力手段と、を備えたことを特徴とする。   According to a second aspect of the present invention, there is provided a personal name search apparatus comprising: an input unit that receives an input of a keyword related to a name of a person who desires a search; and a web page content related to the keyword input by the input unit. From the contents of the web page acquired by the search means, an extraction means for extracting a person name, a counting means for counting the number of person names extracted by the extraction means for each person name, Output means for outputting a person's name based on the number counted by the counting means.

また、請求項3に記載の発明にかかる人名検索方法は、検索を所望する人名に関連するキーワードの入力を受け付ける入力工程と、前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、前記検索工程によって取得されたウェブページの内容において、候補として出力する人名を記憶する人名リストに記憶された人名が出現する数を当該人名毎に計数する計数工程と、前記計数工程によって計数された出現数に基づいて人名を出力する出力工程と、を含んだことを特徴とする。   According to a third aspect of the present invention, there is provided a personal name search method comprising: an input step for receiving an input of a keyword related to a name of a person who desires a search; and a content of a web page related to the keyword input by the input step on the Internet And a counting step of counting the number of appearances of personal names stored in the personal name list for storing personal names to be output as candidates in the contents of the web page acquired by the search step for each personal name, And an output step of outputting a person's name based on the number of appearances counted by the counting step.

また、請求項4に記載の発明にかかる人名検索方法は、検索を所望する人名に関連するキーワードの入力を受け付ける入力工程と、前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、前記検索工程によって取得されたウェブページの内容から、人名を抽出する抽出工程と、前記抽出工程によって抽出された人名の数を当該人名毎に計数する計数工程と、前記計数工程によって計数された数に基づいて人名を出力する出力工程と、を含んだことを特徴とする。   According to a fourth aspect of the present invention, there is provided a personal name search method comprising: an input step for receiving an input of a keyword related to a name of a person who desires a search; and a content of a web page related to the keyword input by the input step From the content of the web page acquired by the search step, an extraction step of extracting a person name, a counting step of counting the number of person names extracted by the extraction step for each person name, And an output step of outputting a person's name based on the number counted by the counting step.

また、請求項5に記載の発明にかかる人名検索プログラムは、請求項3または4に記載の人名検索方法のいずれか一つをコンピュータに実行させることを特徴とする。   According to a fifth aspect of the present invention, a personal name search program causes a computer to execute any one of the personal name search methods according to the third or fourth aspect.

この発明によれば、あらかじめ候補となる人名のリストを記憶しておき、キーワードをもとにインターネット上のウェブページを検索し、キーワードに関連するテキスト情報を取得し、そのテキスト情報から人名リストに含まれる人名の出現数をカウントして、その出現数の多いもの順に出力するようにしているので、著名人等の人名がわからない場合に、その人に関連する任意のキーワードを指定するだけで、その人名を推定して出力する人名検索装置を提供することができるという効果を奏する。   According to the present invention, a list of candidate names is stored in advance, a web page on the Internet is searched based on a keyword, text information related to the keyword is acquired, and the list of person names is obtained from the text information. Since the number of occurrences of the names of people included is counted and output in descending order of the number of occurrences, if you do not know the name of a celebrity, just specify any keyword related to that person, There is an effect that it is possible to provide a personal name search device that estimates and outputs the personal name.

また、この発明によれば、テキスト情報を形態素解析して人名を抽出するようにしたことで、あらかじめ候補となる人名のリストを用意しなくても、任意のキーワードから人名を推定して出力する人名検索装置を提供することができるという効果を奏する。   In addition, according to the present invention, since the text information is subjected to morphological analysis to extract a person name, a person name is estimated from an arbitrary keyword and output without preparing a list of candidate person names in advance. There is an effect that a personal name search device can be provided.

以下に添付図面を参照して、この発明にかかる人名検索装置の好適な実施の形態を詳細に説明する。   Exemplary embodiments of a person name search device according to the present invention will be explained below in detail with reference to the accompanying drawings.

(実施の形態1)
図1は、この発明の実施の形態1にかかる人名検索装置を含む、ネットワークシステムの全体を示す構成図である。図1において、101はキーワードを入力し検索結果を示すことが可能な携帯電話機であり、102は携帯電話機とインターネットを結びつける基地局等の携帯電話機事業者のシステムであり、103はインターネットに接続可能なパソコンまたはPDAなどであり、104はウェブページ等の膨大な情報を含んだインターネットであり、105は本発明の人名検索装置を備えたサーバである。
(Embodiment 1)
FIG. 1 is a configuration diagram showing the entire network system including a person name search device according to Embodiment 1 of the present invention. In FIG. 1, 101 is a mobile phone capable of inputting a keyword and showing a search result, 102 is a system of a mobile phone operator such as a base station linking the mobile phone and the Internet, and 103 is connectable to the Internet A personal computer or a PDA, 104 is the Internet including a huge amount of information such as a web page, and 105 is a server provided with the personal name search device of the present invention.

このネットワークシステムにおいて、まず人名を知りたいユーザは携帯電話機101を操作して、その人物に関連する事項をキーワードとして入力する。例えば、どのようなテレビ番組やコマーシャルに出現しているなどである。次にそのキーワードをサーバ105に向けて送信する。キーワードは携帯電話機事業者のシステム102およびインターネット104を経由してサーバ105に送られる。キーワードを受信したサーバ105内の人名検索装置は、そのキーワードでインターネット104上の情報を検索し、その結果をもとに人名候補を求め、その結果を携帯電話機101に送る。その人名候補はインターネット104、携帯電話機事業者のシステム102を経由して、携帯電話機101に示される。   In this network system, a user who wants to know a person's name first operates the cellular phone 101 and inputs a matter related to the person as a keyword. For example, what kind of television program or commercial appears. Next, the keyword is transmitted to the server 105. The keyword is sent to the server 105 via the mobile phone operator system 102 and the Internet 104. The personal name search device in the server 105 that has received the keyword searches information on the Internet 104 with the keyword, obtains a personal name candidate based on the result, and sends the result to the mobile phone 101. The candidate names are displayed on the mobile phone 101 via the Internet 104 and the mobile phone operator system 102.

また、携帯電話機101の代わりに、インターネットに接続可能なパソコンまたはPDA103を用いることもできる。同様にパソコンまたはPDA103から人名に関するキーワードを入力し、人名検索装置を含むサーバ105へインターネットを介して送信し、人名候補をサーバ105からインターネットを介して受信する。   Further, instead of the mobile phone 101, a personal computer or PDA 103 that can be connected to the Internet can be used. Similarly, a keyword related to a person's name is input from a personal computer or PDA 103, transmitted to the server 105 including the person name search device via the Internet, and candidate names are received from the server 105 via the Internet.

また、別のネットワークシステムの構成として、サーバ105を、携帯電話機事業者のシステム102の内部に含めてもよく、また、人名検索装置あるいはその一部を携帯電話機101の内部に備えるようにしてもよい。   As another network system configuration, the server 105 may be included in the system 102 of the mobile phone operator, and the personal name search device or a part thereof may be provided in the mobile phone 101. Good.

図2は、この発明の実施の形態1にかかる人名検索装置の構成を機能的に示す機能ブロック図である。実施の形態1の人名検索装置は、URL検索部201と、テキスト抽出部202と、人名リスト203と、スコア計数部204と、出力部205とを備えている。   FIG. 2 is a functional block diagram functionally showing the configuration of the personal name search apparatus according to the first embodiment of the present invention. The personal name search apparatus according to the first embodiment includes a URL search unit 201, a text extraction unit 202, a personal name list 203, a score counting unit 204, and an output unit 205.

URL検索部201は、受信したキーワードをもとにインターネット上のウェブページから得た膨大な情報の中から検索を行い、このキーワードを含むウェブページのURLを複数取得し、それをURLリストとしてテキスト抽出部202に出力するものである。このURL検索部201は既存のインターネット検索エンジン(Google(登録商標)やYahoo!(登録商標)など)の技術を用いて実現することができる。求めるURLの数はあらかじめ設定しておいてもよく、また、ユーザが別途指定できるようにしてもよい。   The URL search unit 201 performs a search from a vast amount of information obtained from a web page on the Internet based on the received keyword, acquires a plurality of URLs of the web page including the keyword, and stores the URL as a URL list. This is output to the extraction unit 202. The URL search unit 201 can be realized by using the technology of an existing Internet search engine (Google (registered trademark), Yahoo! (registered trademark), etc.). The number of URLs to be obtained may be set in advance, or may be specified separately by the user.

テキスト抽出部202は、URLリストに従って、順次そのURLアドレスにアクセスを行い、そのページのテキスト情報を獲得(抽出)する。ここで、テキスト情報とは、ウェブページがHTML形式であれば、その中からタグ情報を除いたものを用いることができる。なお、テキスト情報すべてを取得せずに、キーワード周辺のテキスト情報のみを抽出するようにしてもよい。周辺としては、キーワード前後の所定の文字数や単語数を用いることができる。そしてテキスト抽出部202は、取得したテキスト情報をスコア計数部204に出力する。   The text extraction unit 202 sequentially accesses the URL addresses according to the URL list, and acquires (extracts) the text information of the page. Here, as the text information, if the web page is in the HTML format, the information obtained by removing the tag information from the web page can be used. Note that only the text information around the keyword may be extracted without acquiring all the text information. As the periphery, a predetermined number of characters and words before and after the keyword can be used. Then, the text extraction unit 202 outputs the acquired text information to the score counting unit 204.

なお、その都度URLアドレスにアクセスせずに、あらかじめそのURLの内容をキャッシュに保存しておくこともできる。この場合、インターネット経由でテキストを抽出する代わりにキャッシュの中からテキストを取得すればよい。   Note that the contents of the URL can be stored in the cache in advance without accessing the URL address each time. In this case, the text may be acquired from the cache instead of extracting the text via the Internet.

人名リスト203は、候補となりえる人名をリスト状に記憶しておく。これは単純に大量の人名を並べて記憶するだけでもよい。なお、人名リストに記する人名は、個人名だけでなくグループ名などを指定することもできる。個人名には、芸名、芸名の略称や愛称または映画やドラマなどの役柄名などを含んでいてもよい。   The personal name list 203 stores personal names that can be candidates in a list form. You can simply store a large number of person names side by side. In addition, as a personal name to be recorded in the personal name list, not only a personal name but also a group name can be designated. Personal names may include stage names, stage name abbreviations or nicknames, or role names such as movies and dramas.

スコア計数部204は、テキスト情報と人名リスト203の照合を行い、人名毎に、その人名がテキスト情報内に出現する数をカウントする。この数をその人名に対するスコアとして出力する。   The score counting unit 204 collates the text information with the person name list 203 and counts the number of occurrences of the person name in the text information for each person name. This number is output as a score for that person's name.

出力部205は、スコアの高いものから順に指定数の人名を出力する。また、人名だけでなく、その人名に関わる情報(例えば、公式サイトのリンク先、プロフィール、その人の画像など)をあわせて出力するようにしてよい。   The output unit 205 outputs a specified number of personal names in descending order of score. Further, not only the person name but also information related to the person name (for example, the link destination of the official site, the profile, the image of the person, etc.) may be output together.

上記URL検索部201、テキスト抽出部202、スコア計数部204、出力部205は、図示を省略するROMやRAM、ハードディスク、着脱可能な記憶媒体に記憶されたプログラムをCPUが実行することによってその機能を実現する。   The URL search unit 201, text extraction unit 202, score counting unit 204, and output unit 205 function as the CPU executes a program stored in a ROM, RAM, hard disk, or removable storage medium (not shown). To realize.

次に、図3はこの発明の実施の形態1にかかる人名検索装置の処理の手順を示すフローチャートである。   Next, FIG. 3 is a flowchart showing a processing procedure of the personal name search apparatus according to the first embodiment of the present invention.

図3のフローチャートにおいて、まず、キーワードを入力する(ステップS301)。ここで、携帯電話機などの端末とサーバというシステム構成の場合にはキーワードを受信する。なお、キーワードは複数個を指定することが可能である。   In the flowchart of FIG. 3, first, a keyword is input (step S301). Here, in the case of a system configuration of a terminal such as a mobile phone and a server, a keyword is received. A plurality of keywords can be specified.

その後、入力されたキーワードをもとにインターネット上にある膨大なウェブページの情報から検索を行い、そのキーワードを含むウェブページのURLを複数個取得する(ステップS302)。   Thereafter, a search is performed from information on a large number of web pages on the Internet based on the input keyword, and a plurality of URLs of web pages including the keyword are acquired (step S302).

続いて、ステップS302で得たURLにアクセスしてそのウェブページのテキスト情報を取得する(ステップS303)。ここではテキスト全体を取得してもよいし、その中でキーワードが現れる付近のテキストだけを抽出してもよい。なお、URL検索部201にウェブページのテキスト情報を記憶するキャッシュ機能を設ける場合には、インターネットにアクセスすることなく、そのキャッシュデータの記憶手段から読み出すようにすればよい。   Subsequently, the URL obtained in step S302 is accessed to obtain text information of the web page (step S303). Here, the entire text may be acquired, or only the text in the vicinity where the keyword appears may be extracted. In the case where the URL search unit 201 is provided with a cache function for storing the text information of the web page, the cache data may be read from the storage unit without accessing the Internet.

その後、ステップS302で得たURLリストのすべてのURLのテキスト情報を取得したか否かを判定し(ステップS304)、最後まで取得していないと判定した場合(ステップS304:No)は、ステップS303に戻る。一方、URLリストの最後まで取得したと判定した場合(ステップS304:Yes)は、ステップS305に移行する。   Thereafter, it is determined whether or not the text information of all URLs in the URL list obtained in step S302 has been acquired (step S304). If it is determined that the text information has not been acquired to the end (step S304: No), step S303 is performed. Return to. On the other hand, when it is determined that the URL list has been acquired to the end (step S304: Yes), the process proceeds to step S305.

続いて、人名リスト203から人名を一つずつ読み出し、この人名がステップS303で獲得したテキスト情報中にいくつ含まれるか、その出現数をカウントし、その数をその人名に対するスコアとする(ステップS305)。   Subsequently, one person name is read from the person name list 203 one by one, the number of appearances of how many person names are included in the text information acquired in step S303 is counted, and the number is used as a score for the person name (step S305). ).

その後、人名リスト203からすべての人名を読み出したか否かを判定し(ステップS306)、最後まで取得していないと判定した場合(ステップS306:No)は、ステップS305に戻る。一方、人名リストからすべての人名を読み出したと判定した場合(ステップS306:Yes)には、ステップS307へ移行する。   Thereafter, it is determined whether or not all personal names have been read from the personal name list 203 (step S306). If it is determined that all names have not been acquired (step S306: No), the process returns to step S305. On the other hand, if it is determined that all the names have been read from the name list (step S306: Yes), the process proceeds to step S307.

なお、人名を一つずつカウントせずに、ハッシュテーブルを用いるなど文字列検索の技術を用いてステップS305、ステップS306の処理を並列的に行い、処理を高速化することも可能である。   Note that it is also possible to speed up the processing by performing the processing of step S305 and step S306 in parallel using a character string search technique such as using a hash table without counting personal names one by one.

続いて、スコアの高いものから順に人名を出力し(ステップS307)、一連の処理を終了する。ここで図1に示すようなシステム構成の場合には、携帯電話機101等の端末側にそれらの人名を送信する。   Subsequently, personal names are output in descending order of score (step S307), and a series of processing ends. Here, in the case of the system configuration as shown in FIG. 1, the personal names are transmitted to the terminal side such as the mobile phone 101.

なお、人名を出力するだけでなく、その人名に関する付加情報を出力する場合には、人名リスト204の人名それぞれに対する付加情報を記憶する手段から該当する付加情報を読み出して、人名とともに出力すればよい。   In addition to outputting a person name, in the case of outputting additional information related to the person name, the corresponding additional information may be read from the means for storing additional information for each person name in the person name list 204 and output together with the person name. .

次に、この発明の実施の形態1にかかる人名検索装置の入出力画面の例を説明する。図4は、入力画面の例である。ここで、入力ボックス401はキーワードを入力する部分であり、ここを選択すると図5のキーワード入力の画面に移り、実際にはここでキーワードを入力する。ボタン402は検索を指示するボタンであり、キーワードを入力した後にこの検索ボタンを押すことによって、キーワードがサーバに送られ検索処理が開始される。検索処理後は図6の出力画面に移る。   Next, an example of an input / output screen of the personal name search device according to the first embodiment of the present invention will be described. FIG. 4 is an example of an input screen. Here, the input box 401 is a part for inputting a keyword. When this is selected, the screen moves to the keyword input screen shown in FIG. 5, and the keyword is actually input here. A button 402 is a button for instructing a search. When the search button is pressed after inputting a keyword, the keyword is sent to the server and the search process is started. After the search process, the screen moves to the output screen of FIG.

図5は、キーワード入力画面の例である。ここで文字入力画面501には、検索したい人名に関する様々なキーワードを入力する。複数のキーワードを入力するときは空白や改行などで区切って入力する。ボタン502は確定ボタンで、これを選択すると図6の入力画面に戻る。   FIG. 5 is an example of a keyword input screen. Here, in the character input screen 501, various keywords related to the name of a person who wants to search are input. When entering multiple keywords, separate them with spaces or line breaks. A button 502 is a confirmation button. When this button is selected, the screen returns to the input screen of FIG.

図6は、出力画面の例である。ここで出力601には、人名の候補がスコアの高い順に表示される。図6のように順位を表示してもよい。また、人名の候補を選択すると、その人名に関する情報(関連リンク、画像など)を表示するようにしてもよい。ボタン602を選択すると、さらに次の順位の候補が表示される。   FIG. 6 is an example of an output screen. Here, candidate names are displayed in the output 601 in descending order of score. The order may be displayed as shown in FIG. When a candidate for a person name is selected, information (related links, images, etc.) related to the person name may be displayed. When the button 602 is selected, candidates for the next rank are displayed.

以上説明した実施の形態1によれば、あらかじめ、候補となる人名のリストを用意するだけで、インターネット上に散在する膨大でかつ自動的に日々更新されるウェブページの情報をデータベースとして利用するので、これによりキーワードから人名の候補を出力することができる。   According to the first embodiment described above, since a list of candidate names is prepared in advance, a large amount of web page information scattered on the Internet and automatically updated is used as a database. This makes it possible to output candidate names from the keywords.

また、従来のようにサイト内でキーワードのマッチングを行うのではなく、キーワードで検索した情報の中から人名マッチングを行う点で異なり、多岐のキーワードから高精度に人名を検索できる。   In addition, it is different from the conventional method that keyword matching is not performed within the site, but personal name matching is performed from information searched by the keyword, and the human name can be searched from various keywords with high accuracy.

また、データベースにサイト内情報を用いるのでなく、インターネットのウェブ情報を用いるため、常に新しい情報から検索が可能になる。   In addition, since Internet information is used in the database instead of in-site information, it is always possible to search from new information.

なお、図2のテキスト抽出部202でテキスト情報を取得した後で、テキスト情報の形態素解析を行い、あらかじめ人名に関する品詞の情報だけを抜き出してもよい。これにより、スコア計数部204での処理を高速化することができる。   Note that after the text information is acquired by the text extraction unit 202 in FIG. 2, morphological analysis of the text information may be performed, and only the part-of-speech information related to the person name may be extracted in advance. Thereby, the processing in the score counting unit 204 can be speeded up.

また、人名リストを分野別(例えば、歌手、タレント、スポーツ選手など)に用意し、キーワードの指定とともに分野を指定できるようにして、指定のあった分野の人名リストに対してだけスコアを求めるようにすることもできる。   Also, prepare a name list for each field (for example, singer, talent, athlete, etc.) so that the field can be specified along with the keyword, and the score is obtained only for the name list in the specified field. It can also be.

(実施の形態2)
さて、上述した実施の形態1では、人名リスト203を用意したが、以下で説明する実施の形態2では、形態素解析技術を利用して、人名リスト203を使わないようにしてもよい。
(Embodiment 2)
In the first embodiment described above, the personal name list 203 is prepared. However, in the second embodiment described below, the personal name list 203 may not be used by using the morphological analysis technique.

図7は、この発明の実施の形態2にかかる人名検索装置の構成を機能的に示す機能ブロック図である。   FIG. 7 is a functional block diagram functionally showing the configuration of the personal name search device according to the second embodiment of the present invention.

実施の形態2の人名検索装置は、URL検索部701、テキスト抽出部702、形態素解析部703、人名抽出部704、重複カウント部705、出力部706を備えている。   The personal name search apparatus according to the second embodiment includes a URL search unit 701, a text extraction unit 702, a morpheme analysis unit 703, a personal name extraction unit 704, a duplication count unit 705, and an output unit 706.

URL検索部701およびテキスト抽出部702は、それぞれ実施の形態1のURL検索部201およびテキスト抽出部202と同様であるため、ここではそれらの説明を省略する。   Since the URL search unit 701 and the text extraction unit 702 are the same as the URL search unit 201 and the text extraction unit 202 of the first embodiment, respectively, their description is omitted here.

形態素解析部703は、テキスト情報の形態素解析を行い、テキスト情報を単語に分割し、単語および、その単語の品詞を出力する。この形態素解析部には既存の形態素解析技術を利用することができる。これにより、例えば、テキスト情報の中に「山田太郎」が含まれていた場合は[山田:固有名詞・人名・姓][太郎:固有名詞・人名・名]のように分割した単語と品詞が出力される。   The morpheme analysis unit 703 performs morphological analysis of the text information, divides the text information into words, and outputs a word and the part of speech of the word. An existing morpheme analysis technique can be used for this morpheme analysis unit. Thus, for example, if “Taro Yamada” is included in the text information, the divided words and parts of speech such as [Yamada: proper noun / person name / surname] [Taro: proper noun / person name / first name] Is output.

人名抽出部704は、形態素解析部703の出力から、その品詞が人名に関する単語だけを抜き出し、それを候補リストとして出力する。したがってこの出力はテキスト情報の中から人名だけを抜き出したリストとなる。なお、ここでの人名に関するとは、固有名詞の人名だけでなく、グループ名や団体名なども含むことができる。   The personal name extraction unit 704 extracts only words related to personal names from the output of the morphological analysis unit 703 and outputs them as a candidate list. Therefore, this output is a list with only the names of people extracted from the text information. Note that the term “person name” here includes not only the name of a proper noun but also a group name or an organization name.

なお、形態素解析部703を人名の解析に特化して構築すれば、形態素解析部703と人名抽出部704と一つにまとめることもできる。   If the morphological analysis unit 703 is specially constructed for personal name analysis, the morpheme analysis unit 703 and the personal name extraction unit 704 can be combined into one.

重複カウント部705は、人名抽出部704の出力である候補リストの中から、重複している人名の数を人名毎にカウントし、それをその人名に対するスコアとして出力する。   Duplicate counting section 705 counts the number of duplicate names for each person name from the candidate list that is output from person name extracting section 704, and outputs it as a score for that person name.

出力部706は、スコアの高いものから順に指定の数の人名を出力する機能を持つ。また、人名だけでなく、その人名に関わる情報(例えば、公式サイトのリンク先、プロフィール、その人の画像など)を付与して出力してもよい。   The output unit 706 has a function of outputting a specified number of person names in descending order of score. Further, not only a person name but also information related to the person name (for example, a link destination of an official site, a profile, an image of the person, etc.) may be added and output.

次に、図8はこの発明の実施の形態2にかかる人名検索装置の処理の手順を示すフローチャートである。   Next, FIG. 8 is a flowchart showing a processing procedure of the personal name retrieval apparatus according to the second embodiment of the present invention.

図8のフローチャートにおいて、ステップS801のキーワード入力からステップS804のURLリストの最後の判定までは、実施の形態1のステップS301からステップS304までと同様であるので、その説明は省略する。   In the flowchart of FIG. 8, the process from the keyword input in step S801 to the final determination in the URL list in step S804 is the same as that in steps S301 to S304 in the first embodiment, and thus the description thereof is omitted.

ステップS803を繰り返し行ってテキスト情報を取得した後、このテキスト情報を形態素解析する(ステップS805)。形態素解析によりテキスト情報が単語の単位に分割され、それぞれに品詞が与えられる。続いて、形態素解析の結果から品詞が人名やグループ名に関する単語を抜き出してリストアップする(ステップS806)。   After step S803 is repeatedly performed to acquire text information, the text information is subjected to morphological analysis (step S805). Text information is divided into units of words by morphological analysis, and each part of speech is given. Subsequently, from the result of morphological analysis, the part of speech extracts words related to the names of persons and groups, and lists them (step S806).

その後、リストアップした単語の中に同じ人名(またはグループ名)が複数ある場合には、その数を数え、その数をその人名のスコアとする(ステップS807)。続いて、スコアの高いものから順に人名を出力して一連の処理を終了する(ステップS808)。ここで図1に示すようなシステム構成の場合には、携帯電話機101等の端末側にそれらの人名を送信する。   Thereafter, when there are a plurality of the same person names (or group names) in the listed words, the number is counted and the number is set as the score of the person name (step S807). Subsequently, the names are output in descending order of score, and the series of processing ends (step S808). Here, in the case of the system configuration as shown in FIG. 1, the personal names are transmitted to the terminal side such as the mobile phone 101.

この発明の実施の形態2にかかる人名検索装置の入出力例は、図4、図5、図6に示した実施の形態1のそれと同様であるので、その説明は省略する。   Since the input / output example of the personal name retrieval apparatus according to the second embodiment of the present invention is the same as that of the first embodiment shown in FIGS. 4, 5, and 6, description thereof will be omitted.

以上説明した実施の形態2によれば、候補となる人名のリストを用意せずに形態素解析により人名を抽出することによって、人名の候補が制限されることなく、任意の候補を出力することができる。   According to the second embodiment described above, by extracting a person name by morphological analysis without preparing a list of candidate person names, it is possible to output arbitrary candidates without limiting the person name candidates. it can.

なお、図2のスコア計数部204または図7の重複カウント部705において、姓名の完全な一致だけでなく、姓と名のいずれかの一致でもスコアを増やすようにしてもよい。このときのスコアの増分は完全一致より少ない値とし、姓より名が一致した場合のスコアの重みを大きくしてもよい。これにより姓または名だけで表現されることが多い人名に対しても適切なスコアが与えられるようになる。   In addition, in the score counting unit 204 in FIG. 2 or the duplication counting unit 705 in FIG. 7, the score may be increased not only by the complete match of the first and last names but also by the match of either the last name and the first name. In this case, the score increment may be smaller than the complete match, and the weight of the score when the first name matches the last name may be increased. As a result, an appropriate score can be given even to a person name that is often expressed only by a surname or a first name.

また、図2のスコア計数部204または図7の重複カウント部705において、一致した人名が、ウェブページ中のタイトルであった場合のスコアの重みを大きくしてもよい。これにより、より精度の高い人名の推定が可能になる。   Further, in the score counting unit 204 in FIG. 2 or the duplication counting unit 705 in FIG. 7, the weight of the score when the matched person name is the title in the web page may be increased. This makes it possible to estimate a person name with higher accuracy.

また、キーワード中に人名が含まれている場合がある。例えば、グループ名を検索する場合に別のメンバの名前を指定する、共演者の名前を指定するなどが考えられる。この場合、出力する人名にキーワードで指定した人名を表示する必要は無いので、図2の出力部205または図7の出力部706で、キーワードに含まれる人名を出力しないようにする、あるいは、図2のスコア計数部204または図7の重複カウント部705で、キーワードに含まれる人名をカウントしないようにしてもよい。   In some cases, the keyword includes a person's name. For example, when searching for a group name, the name of another member may be specified, or the name of a co-star may be specified. In this case, since it is not necessary to display the person name specified by the keyword as the person name to be output, the output unit 205 in FIG. 2 or the output unit 706 in FIG. 7 is configured not to output the person name included in the keyword. The score counting unit 204 of 2 or the duplication counting unit 705 of FIG. 7 may not count personal names included in the keywords.

なお、本実施の形態で説明した人名検索方法は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。   The person name search method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. Further, this program may be a transmission medium that can be distributed via a network such as the Internet.

以上のように、本発明にかかる人名検索装置、人名検索方法および人名検索プログラムは、著名人等の人名やグループ名がわからない状況において、その人名に関する様々なキーワードにからその人名を推定する場合に適している。   As described above, the person name search device, person name search method, and person name search program according to the present invention estimate the person name from various keywords related to the person name in a situation where the name of the celebrity or the like or the group name is unknown. Is suitable.

この発明の実施の形態1にかかるネットワークシステムの全体を示す構成図である。BRIEF DESCRIPTION OF THE DRAWINGS It is a block diagram which shows the whole network system concerning Embodiment 1 of this invention. この発明の実施の形態1にかかる人名検索装置の構成を機能的に示す機能ブロック図である。It is a functional block diagram which shows functionally the structure of the personal name search device concerning Embodiment 1 of this invention. この発明の実施の形態1にかかる人名検索装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the personal name search device concerning Embodiment 1 of this invention. この発明の実施の形態1にかかる入力画面の例を示す説明図である。It is explanatory drawing which shows the example of the input screen concerning Embodiment 1 of this invention. この発明の実施の形態1にかかるキーワード入力画面の例を示す説明図である。It is explanatory drawing which shows the example of the keyword input screen concerning Embodiment 1 of this invention. この発明の実施の形態1にかかる出力画面の例を示す説明図である。It is explanatory drawing which shows the example of the output screen concerning Embodiment 1 of this invention. この発明の実施の形態2にかかる人名検索装置の構成を機能的に示す機能ブロック図である。It is a functional block diagram which shows functionally the structure of the personal name search device concerning Embodiment 2 of this invention. この発明の実施の形態2にかかる人名検索装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the personal name search device concerning Embodiment 2 of this invention.

符号の説明Explanation of symbols

101 携帯電話機
102 携帯電話機事業者のシステム
103 パソコンまたはPDA
104 インターネット
105 本発明の人名検索装置を含んだサーバ
201 URL検索部
202 テキスト抽出部
203 人名リスト
204 スコア計数部
205 出力部
401 キーワードを入力する入力ボックス
402 検索を指示するボタン
501 キーワードを入力する入力画面
502 確定ボタン
601 出力結果表示
602 次選択ボタン
701 URL検索部
702 テキスト抽出部
703 形態素解析部
704 人名抽出部
705 重複カウント部
706 出力部

101 Mobile phone 102 Mobile phone operator system 103 Personal computer or PDA
104 Internet 105 Server 201 Including Name Search Device of the Present Invention URL Search Unit 202 Text Extraction Unit 203 Person Name List 204 Score Counting Unit 205 Output Unit 401 Input Box 402 for Entering Keywords Input Button 501 for Instructing Search Input Screen 502 Confirm button 601 Output result display 602 Next selection button 701 URL search unit 702 Text extraction unit 703 Morphological analysis unit 704 Person name extraction unit 705 Duplicate count unit 706 Output unit

Claims (5)

候補として出力する人名を記憶する人名リスト記憶手段と、
検索を所望する人名に関連するキーワードの入力を受け付ける入力手段と、
前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、
前記検索手段によって取得されたウェブページの内容において、前記人名リスト記憶手段に記憶された人名が出現する数を当該人名毎に計数する計数手段と、
前記計数手段によって計数された出現数に基づいて人名を出力する出力手段と、
を備えたことを特徴とする人名検索装置。
Personal name list storage means for storing personal names to be output as candidates;
An input means for receiving an input of a keyword related to a name of a person who desires a search;
Search means for acquiring the contents of a web page related to the keyword input by the input means from the Internet;
In the contents of the web page acquired by the search means, a counting means for counting the number of appearances of personal names stored in the personal name list storage means for each personal name,
Output means for outputting a person's name based on the number of appearances counted by the counting means;
A personal name search device characterized by comprising:
検索を所望する人名に関連するキーワードの入力を受け付ける入力手段と、
前記入力手段によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索手段と、
前記検索手段によって取得されたウェブページの内容から、人名を抽出する抽出手段と、
前記抽出手段によって抽出された人名の数を当該人名毎に計数する計数手段と、
前記計数手段によって計数された数に基づいて人名を出力する出力手段と、
を備えたことを特徴とする人名検索装置。
An input means for receiving an input of a keyword related to a name of a person who desires a search;
Search means for acquiring the contents of a web page related to the keyword input by the input means from the Internet;
Extraction means for extracting a person's name from the content of the web page acquired by the search means;
Counting means for counting the number of person names extracted by the extracting means for each person name;
Output means for outputting a person's name based on the number counted by the counting means;
A personal name search device characterized by comprising:
検索を所望する人名に関連するキーワードの入力を受け付ける入力工程と、
前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、
前記検索工程によって取得されたウェブページの内容において、候補として出力する人名を記憶する人名リストに記憶された人名が出現する数を当該人名毎に計数する計数工程と、
前記計数工程によって計数された出現数に基づいて人名を出力する出力工程と、
を含んだことを特徴とする人名検索方法。
An input process for receiving an input of a keyword related to a name of a person who desires a search;
A search step of acquiring the content of a web page related to the keyword input by the input step from the Internet;
In the content of the web page acquired by the search step, a counting step of counting the number of appearances of personal names stored in the personal name list that stores personal names to be output as candidates,
An output step of outputting a person name based on the number of appearances counted by the counting step;
Name search method characterized by including.
検索を所望する人名に関連するキーワードの入力を受け付ける入力工程と、
前記入力工程によって入力されたキーワードに関連するウェブページの内容をインターネットから取得する検索工程と、
前記検索工程によって取得されたウェブページの内容から、人名を抽出する抽出工程と、
前記抽出工程によって抽出された人名の数を当該人名毎に計数する計数工程と、
前記計数工程によって計数された数に基づいて人名を出力する出力工程と、
を含んだことを特徴とする人名検索方法。
An input process for receiving an input of a keyword related to a name of a person who desires a search;
A search step of acquiring the content of a web page related to the keyword input by the input step from the Internet;
From the content of the web page acquired by the search step, an extraction step of extracting a person name;
A counting step of counting the number of person names extracted by the extraction step for each person name;
An output step of outputting a person's name based on the number counted by the counting step;
Name search method characterized by including.
請求項3または4に記載の人名検索方法のいずれか一つをコンピュータに実行させることを特徴とする人名検索プログラム。

A personal name search program that causes a computer to execute any one of the personal name search methods according to claim 3.

JP2004253605A 2004-08-31 2004-08-31 Name retrieval device, name retrieval method, and name retrieval program Pending JP2006072579A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004253605A JP2006072579A (en) 2004-08-31 2004-08-31 Name retrieval device, name retrieval method, and name retrieval program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004253605A JP2006072579A (en) 2004-08-31 2004-08-31 Name retrieval device, name retrieval method, and name retrieval program

Publications (1)

Publication Number Publication Date
JP2006072579A true JP2006072579A (en) 2006-03-16

Family

ID=36153162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004253605A Pending JP2006072579A (en) 2004-08-31 2004-08-31 Name retrieval device, name retrieval method, and name retrieval program

Country Status (1)

Country Link
JP (1) JP2006072579A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140123000A (en) * 2013-04-11 2014-10-21 더 보잉 컴파니 Identifying contextual results within associative memories

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140123000A (en) * 2013-04-11 2014-10-21 더 보잉 컴파니 Identifying contextual results within associative memories
JP2014206974A (en) * 2013-04-11 2014-10-30 ザ・ボーイング・カンパニーTheBoeing Company Identifying contextual results within associative memories
KR102168807B1 (en) 2013-04-11 2020-10-23 더 보잉 컴파니 Identifying contextual results within associative memories

Similar Documents

Publication Publication Date Title
US8001135B2 (en) Search support apparatus, computer program product, and search support system
KR101060594B1 (en) Keyword Extraction and Association Network Configuration for Document Data
WO2002101588A1 (en) Content management system
KR100943962B1 (en) Method and Server for Searching Items and Constructing Database based on Sensitivity
JP5444115B2 (en) Data search apparatus, data search method and program
CN106649778B (en) Interaction method and device based on deep question answering
JP2007334502A (en) Retrieving device, method, and program
JPH11224256A (en) Information retrieving method and record medium recording information retrieving program
RU2698405C2 (en) Method of search in database
KR101122737B1 (en) Apparatus and method for establishing search database for knowledge node coupling structure
JP2017117021A (en) Keyword extraction device, content generation system, keyword extraction method, and program
KR101505673B1 (en) Multi-language searching system, multi-language searching method, and image searching system based on meaning of word
CN112749328A (en) Searching method and device and computer equipment
JP4057962B2 (en) Question answering apparatus, question answering method and program
JP4853915B2 (en) Search system
JP2008299655A (en) Information retrieval device
JP2003208447A (en) Device, method and program for retrieving document, and medium recorded with program for retrieving document
JP2006072579A (en) Name retrieval device, name retrieval method, and name retrieval program
KR102279125B1 (en) Terminal and apparatus for providing recommendation information based on preference filter
KR101308821B1 (en) Keyword extraction system for search engines and extracting method thereof
JP2002157270A (en) System and method for distributing interesting article
JP2009217741A (en) Metadata attachment method, device, and metadata attachment program
JP4484957B1 (en) Retrieval expression generation device, retrieval expression generation method, and program
JP2005234772A (en) Documentation management system and method
JP2006072844A (en) Keyword specifying device, keyword specifying method, and keyword specifying program