JP2003178057A - フレーズ生成装置、フレーズ生成方法、及びプログラム - Google Patents
フレーズ生成装置、フレーズ生成方法、及びプログラムInfo
- Publication number
- JP2003178057A JP2003178057A JP2001379546A JP2001379546A JP2003178057A JP 2003178057 A JP2003178057 A JP 2003178057A JP 2001379546 A JP2001379546 A JP 2001379546A JP 2001379546 A JP2001379546 A JP 2001379546A JP 2003178057 A JP2003178057 A JP 2003178057A
- Authority
- JP
- Japan
- Prior art keywords
- document
- phrase
- word
- keyword
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 フレーズの候補を効率的に生成することがで
きる。 【解決手段】 入力部11は文書DB13に記憶されて
いる文書を指定するためのキーワードを入力する。全文
検索部16は、全文検索用インデックスファイル12を
参照して、入力されたキーワードから、文書DB13に
記憶されている文書を抽出し、抽出した文書をリストし
た文書リストを生成する。文書リスト分配部17は、文
書リストを更にn個の文書サブリストに分割する。第k
の単語抽出部18(k=1,2,・・・,n)は、形態
素解析法を用い、k番目の文書サブリストから単語を抽
出する。第kの単語組合せ部19(k=1,2,・・
・,n)は、抽出された単語を言語ルール記憶ファイル
15に記憶されている言語ルールを参照して、フレーズ
候補を生成する。表示部20は、生成したフレーズ候補
を表示する。
きる。 【解決手段】 入力部11は文書DB13に記憶されて
いる文書を指定するためのキーワードを入力する。全文
検索部16は、全文検索用インデックスファイル12を
参照して、入力されたキーワードから、文書DB13に
記憶されている文書を抽出し、抽出した文書をリストし
た文書リストを生成する。文書リスト分配部17は、文
書リストを更にn個の文書サブリストに分割する。第k
の単語抽出部18(k=1,2,・・・,n)は、形態
素解析法を用い、k番目の文書サブリストから単語を抽
出する。第kの単語組合せ部19(k=1,2,・・
・,n)は、抽出された単語を言語ルール記憶ファイル
15に記憶されている言語ルールを参照して、フレーズ
候補を生成する。表示部20は、生成したフレーズ候補
を表示する。
Description
【0001】
【発明の属する技術分野】この発明は、キャッチフレー
ズ、広告コピー、商品名、メールアドレス等(以下、単
にフレーズという)の候補を生成するフレーズ生成装
置、フレーズ生成方法、及びプログラムに関する。
ズ、広告コピー、商品名、メールアドレス等(以下、単
にフレーズという)の候補を生成するフレーズ生成装
置、フレーズ生成方法、及びプログラムに関する。
【0002】
【従来の技術】従来、上記フレーズの候補を生成するに
は、以下に示す3通りの方法が用いられている。 (1)辞書中の単語をランダムに組み合わせてフレーズ
候補を生成する方法。 (2)ある分野に関係するフレーズ候補を生成する場合
には、予め、当該分野に関係のある単語を集めた辞書を
人手により作成し、その辞書中の単語を組み合わせてフ
レーズ候補を生成する方法。 (3)すべての単語同士の関係度が定義された単語辞書
を予め用意し、ユーザがある分野に関係するキーワード
をいくつか入力すると、入力されたキーワードについて
関連性の強い単語を単語辞書から選択し、選択した単語
を組み合わせて上記フレーズ候補を生成する方法。
は、以下に示す3通りの方法が用いられている。 (1)辞書中の単語をランダムに組み合わせてフレーズ
候補を生成する方法。 (2)ある分野に関係するフレーズ候補を生成する場合
には、予め、当該分野に関係のある単語を集めた辞書を
人手により作成し、その辞書中の単語を組み合わせてフ
レーズ候補を生成する方法。 (3)すべての単語同士の関係度が定義された単語辞書
を予め用意し、ユーザがある分野に関係するキーワード
をいくつか入力すると、入力されたキーワードについて
関連性の強い単語を単語辞書から選択し、選択した単語
を組み合わせて上記フレーズ候補を生成する方法。
【0003】
【発明が解決しようとする課題】しかしながら、(1)
の方法では、辞書中の単語をランダムに組み合わせてフ
レーズ候補を生成するので、キャッチフレーズ、広告コ
ピー、商品名等には関係のない単語を含む、適当でない
フレーズ候補が多数生成されるという問題点があった。
(2)の方法では、予め、当該分野に関係のある単語を
集めた辞書を人手により作成し、辞書中の単語を組み合
わせてフレーズ候補を生成するので、(1)の方法が有
する上記問題点は発生しないが、当該分野に関係のある
単語を集めた辞書を作成するには、時間と費用とが膨大
にかかるという問題点があった。(3)の方法では、す
べての単語同士の関係度が定義された単語辞書を予め用
意しているので、(2)の方法と同様、(1)の方法が
有する上記問題点は発生しないが、上記単語辞書を作成
するには時間と費用とが膨大にかかるという問題点があ
った。また、(3)の方法では、ユーザにより入力され
たある分野に関連するキーワードごとに、関連性の強い
単語を単語辞書から選択するので、入力されたキーワー
ドについての関連性の強い単語を算出するに際して、メ
モリ空間を膨大に必要とするという問題点があった。
の方法では、辞書中の単語をランダムに組み合わせてフ
レーズ候補を生成するので、キャッチフレーズ、広告コ
ピー、商品名等には関係のない単語を含む、適当でない
フレーズ候補が多数生成されるという問題点があった。
(2)の方法では、予め、当該分野に関係のある単語を
集めた辞書を人手により作成し、辞書中の単語を組み合
わせてフレーズ候補を生成するので、(1)の方法が有
する上記問題点は発生しないが、当該分野に関係のある
単語を集めた辞書を作成するには、時間と費用とが膨大
にかかるという問題点があった。(3)の方法では、す
べての単語同士の関係度が定義された単語辞書を予め用
意しているので、(2)の方法と同様、(1)の方法が
有する上記問題点は発生しないが、上記単語辞書を作成
するには時間と費用とが膨大にかかるという問題点があ
った。また、(3)の方法では、ユーザにより入力され
たある分野に関連するキーワードごとに、関連性の強い
単語を単語辞書から選択するので、入力されたキーワー
ドについての関連性の強い単語を算出するに際して、メ
モリ空間を膨大に必要とするという問題点があった。
【0004】この発明は、上述した問題点に鑑み、フレ
ーズの候補を効率的に生成することが可能なフレーズ生
成装置等を提供することを目的とする。また、この発明
は、無駄なフレーズ候補の生成を防止することが可能な
フレーズ生成装置等を提供することを目的とする。ま
た、この発明は、フレーズを生成する際のコストを抑え
ることができるフレーズ生成装置等を提供することを目
的とする。また、この発明は、フレーズを生成するに際
して、使用するメモリ空間を抑えることができるフレー
ズ生成装置等を提供することを目的とする。
ーズの候補を効率的に生成することが可能なフレーズ生
成装置等を提供することを目的とする。また、この発明
は、無駄なフレーズ候補の生成を防止することが可能な
フレーズ生成装置等を提供することを目的とする。ま
た、この発明は、フレーズを生成する際のコストを抑え
ることができるフレーズ生成装置等を提供することを目
的とする。また、この発明は、フレーズを生成するに際
して、使用するメモリ空間を抑えることができるフレー
ズ生成装置等を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、この発明の第1の観点に係るフレーズ生成装置は、
キャッチフレーズ、広告コピー、商品名等のフレーズを
生成するフレーズ生成装置であって、文書を記憶する文
書記憶手段と、前記文書記憶手段に記憶されている文書
を指定するためのキーワードを入力するキーワード入力
手段と、前記キーワード入力手段により入力されたキー
ワードから、前記文書記憶手段に記憶されている文書を
抽出する文書抽出手段と、前記文書抽出手段により抽出
された文書から単語を抽出する単語抽出手段と、前記単
語抽出手段により抽出された単語を組み合わせてフレー
ズを生成する単語組合せ手段と、を備えることを特徴と
する。
に、この発明の第1の観点に係るフレーズ生成装置は、
キャッチフレーズ、広告コピー、商品名等のフレーズを
生成するフレーズ生成装置であって、文書を記憶する文
書記憶手段と、前記文書記憶手段に記憶されている文書
を指定するためのキーワードを入力するキーワード入力
手段と、前記キーワード入力手段により入力されたキー
ワードから、前記文書記憶手段に記憶されている文書を
抽出する文書抽出手段と、前記文書抽出手段により抽出
された文書から単語を抽出する単語抽出手段と、前記単
語抽出手段により抽出された単語を組み合わせてフレー
ズを生成する単語組合せ手段と、を備えることを特徴と
する。
【0006】このような構成によれば、入力したキーワ
ードから、記憶手段に記憶されている文書を抽出し、抽
出した文書の中の単語を組み合わせてフレーズを生成す
るので、無駄なフレーズ候補の生成を防止することがで
きるとともに、フレーズ候補を生成するに際して、使用
するメモリ空間を抑えることができ、加えて、所定の単
語辞書を制作する必要がないため、フレーズ候補の生成
に要するコストを削減することができる。つまり、この
ような構成によれば、フレーズの候補を効率的に生成す
ることができる。
ードから、記憶手段に記憶されている文書を抽出し、抽
出した文書の中の単語を組み合わせてフレーズを生成す
るので、無駄なフレーズ候補の生成を防止することがで
きるとともに、フレーズ候補を生成するに際して、使用
するメモリ空間を抑えることができ、加えて、所定の単
語辞書を制作する必要がないため、フレーズ候補の生成
に要するコストを削減することができる。つまり、この
ような構成によれば、フレーズの候補を効率的に生成す
ることができる。
【0007】キーワードと、該キーワードを含む文書を
指定する文書指定情報とに対応するインデックスデータ
を登録するインデックスデータ登録手段をさらに備え、
前記文書抽出手段は、前記インデックスデータ登録手段
に登録されているインデックスデータを参照し、前記キ
ーワードを含む文書を検索する文書検索手段と、前記文
書検索手段により検索された文書について、前記キーワ
ードの出現頻度に基づいたキーワードの重要度を算出す
るキーワード重要度算出手段と、を備え、前記キーワー
ド重要度算出手段により算出されたキーワードの重要度
の高い順に、前記文書記憶手段に記憶されている文書を
抽出するようにしてもよい。
指定する文書指定情報とに対応するインデックスデータ
を登録するインデックスデータ登録手段をさらに備え、
前記文書抽出手段は、前記インデックスデータ登録手段
に登録されているインデックスデータを参照し、前記キ
ーワードを含む文書を検索する文書検索手段と、前記文
書検索手段により検索された文書について、前記キーワ
ードの出現頻度に基づいたキーワードの重要度を算出す
るキーワード重要度算出手段と、を備え、前記キーワー
ド重要度算出手段により算出されたキーワードの重要度
の高い順に、前記文書記憶手段に記憶されている文書を
抽出するようにしてもよい。
【0008】前記文書抽出手段により抽出されたキーワ
ードの重要度の高い順で文書を指定する情報を備える文
書リストを生成する文書リスト生成手段を備え、前記単
語抽出手段は、前記文書リストに示された文書から単語
を抽出し、前記単語組合せ手段は、前記単語語抽出手段
により抽出された単語を組み合わせてフレーズを生成す
るようにしてもよい。
ードの重要度の高い順で文書を指定する情報を備える文
書リストを生成する文書リスト生成手段を備え、前記単
語抽出手段は、前記文書リストに示された文書から単語
を抽出し、前記単語組合せ手段は、前記単語語抽出手段
により抽出された単語を組み合わせてフレーズを生成す
るようにしてもよい。
【0009】前記文書リスト生成手段により生成された
文書リストから、重要度の高い順で、かつ、交互に所定
の個数の文書サブリストを生成する文書サブリスト生成
手段と、前記単語抽出手段と、前記単語組合せ手段と
は、前記文書サブリスト生成手段が生成した各文書サブ
リストごとに備え、各前記単語抽出手段は、対応する前
記文書サブリストに示された文書から単語を抽出し、各
前記単語組合せ手段は、前記単語語抽出手段により抽出
された単語を組み合わせてフレーズを生成するようにし
てもよい。
文書リストから、重要度の高い順で、かつ、交互に所定
の個数の文書サブリストを生成する文書サブリスト生成
手段と、前記単語抽出手段と、前記単語組合せ手段と
は、前記文書サブリスト生成手段が生成した各文書サブ
リストごとに備え、各前記単語抽出手段は、対応する前
記文書サブリストに示された文書から単語を抽出し、各
前記単語組合せ手段は、前記単語語抽出手段により抽出
された単語を組み合わせてフレーズを生成するようにし
てもよい。
【0010】フレーズが取りうるルールを記憶するルー
ル記憶手段を備え、前記単語組合せ手段は、前記単語抽
出手段により抽出された単語を、前記ルール記憶手段に
記憶されているルールに従い、フレーズを生成するよう
にしてもよい。
ル記憶手段を備え、前記単語組合せ手段は、前記単語抽
出手段により抽出された単語を、前記ルール記憶手段に
記憶されているルールに従い、フレーズを生成するよう
にしてもよい。
【0011】また、この発明の第2の観点に係るフレー
ズ生成方法は、キャッチフレーズ、広告コピー、商品名
等のフレーズを生成するフレーズ生成方法であって、予
め記憶されている文書を指定するためのキーワードを入
力し、入力したキーワードから、予め記憶されている文
書を抽出し、抽出した文書から単語を抽出し、抽出した
単語を組み合わせてフレーズを生成する、ことを特徴と
する。
ズ生成方法は、キャッチフレーズ、広告コピー、商品名
等のフレーズを生成するフレーズ生成方法であって、予
め記憶されている文書を指定するためのキーワードを入
力し、入力したキーワードから、予め記憶されている文
書を抽出し、抽出した文書から単語を抽出し、抽出した
単語を組み合わせてフレーズを生成する、ことを特徴と
する。
【0012】このような構成によれば、入力したキーワ
ードから、記憶手段に記憶されている文書を抽出し、抽
出した文書の中の単語を組み合わせてフレーズを生成す
るので、無駄なフレーズ候補の生成を防止することがで
きるとともに、フレーズ候補を生成するに際して、使用
するメモリ空間を抑えることができ、加えて、所定の単
語辞書を制作する必要がないため、フレーズ候補の生成
に要するコストを削減することができる。つまり、この
ような構成によれば、フレーズの候補を効率的に生成す
ることができる。
ードから、記憶手段に記憶されている文書を抽出し、抽
出した文書の中の単語を組み合わせてフレーズを生成す
るので、無駄なフレーズ候補の生成を防止することがで
きるとともに、フレーズ候補を生成するに際して、使用
するメモリ空間を抑えることができ、加えて、所定の単
語辞書を制作する必要がないため、フレーズ候補の生成
に要するコストを削減することができる。つまり、この
ような構成によれば、フレーズの候補を効率的に生成す
ることができる。
【0013】予め登録されている、キーワードと、該キ
ーワードを含む文書を指定する文書指定情報とを対応す
るインデックスデータを参照し、前記キーワードを含む
文書を検索し、検索した文書について、前記キーワード
の重要度を算出し、算出したキーワードの重要度の高い
順に、予め記憶されている文書を抽出するようにしても
よい。
ーワードを含む文書を指定する文書指定情報とを対応す
るインデックスデータを参照し、前記キーワードを含む
文書を検索し、検索した文書について、前記キーワード
の重要度を算出し、算出したキーワードの重要度の高い
順に、予め記憶されている文書を抽出するようにしても
よい。
【0014】抽出したキーワードの重要度の高い順で文
書を指定する情報を備える文書リストを生成し、前記文
書リストに示された文書から単語を抽出し、抽出した単
語を組み合わせてフレーズを生成するようにしてもよ
い。
書を指定する情報を備える文書リストを生成し、前記文
書リストに示された文書から単語を抽出し、抽出した単
語を組み合わせてフレーズを生成するようにしてもよ
い。
【0015】生成した文書リストから、重要度の高い順
で、かつ、交互に所定の個数の文書サブリストを生成
し、前記文書サブリストごとに、該文書サブリストに示
された文書から単語を抽出し、前記文書サブリストごと
に、該文書サブリストに示された文書から抽出した単語
を組み合わせてフレーズを生成するようにしてもよい。
で、かつ、交互に所定の個数の文書サブリストを生成
し、前記文書サブリストごとに、該文書サブリストに示
された文書から単語を抽出し、前記文書サブリストごと
に、該文書サブリストに示された文書から抽出した単語
を組み合わせてフレーズを生成するようにしてもよい。
【0016】抽出した単語を、予め記憶されているフレ
ーズが取り得るルールに従い、フレーズを生成するよう
にしてもよい。
ーズが取り得るルールに従い、フレーズを生成するよう
にしてもよい。
【0017】また、この発明の第3の観点に係るプログ
ラムは、キャッチフレーズ、広告コピー、商品名等のフ
レーズを生成するプログラムであって、予め記憶されて
いる文書を指定するためのキーワードを入力する手順、
入力したキーワードから、予め記憶されている文書を抽
出する手順、抽出した文書から単語を抽出する手順、抽
出した単語を組み合わせてフレーズを生成する手順、を
実行させる。
ラムは、キャッチフレーズ、広告コピー、商品名等のフ
レーズを生成するプログラムであって、予め記憶されて
いる文書を指定するためのキーワードを入力する手順、
入力したキーワードから、予め記憶されている文書を抽
出する手順、抽出した文書から単語を抽出する手順、抽
出した単語を組み合わせてフレーズを生成する手順、を
実行させる。
【0018】このような構成によれば、入力したキーワ
ードから、記憶手段に記憶されている文書を抽出し、抽
出した文書の中の単語を組み合わせてフレーズを生成す
るので、無駄なフレーズ候補の生成を防止することがで
きるとともに、フレーズ候補を生成するに際して、使用
するメモリ空間を抑えることができ、加えて、所定の単
語辞書を制作する必要がないため、フレーズ候補の生成
に要するコストを削減することができる。つまり、この
ような構成によれば、フレーズの候補を効率的に生成す
ることができる。
ードから、記憶手段に記憶されている文書を抽出し、抽
出した文書の中の単語を組み合わせてフレーズを生成す
るので、無駄なフレーズ候補の生成を防止することがで
きるとともに、フレーズ候補を生成するに際して、使用
するメモリ空間を抑えることができ、加えて、所定の単
語辞書を制作する必要がないため、フレーズ候補の生成
に要するコストを削減することができる。つまり、この
ような構成によれば、フレーズの候補を効率的に生成す
ることができる。
【0019】
【発明の実施の形態】以下、この発明の実施の形態に係
るフレーズ生成装置、フレーズ生成方法を説明する。図
1は、この発明の実施の形態に係るフレーズ生成装置の
構成を示すブロック図である。この実施形態のフレーズ
生成装置は、図1に示すように、入力部11と、全文検
索用インデックスファイル12と、文書DB(データベ
ース)13と、単語辞書14と、言語ルール記憶ファイ
ル15と、全文検索部16と、文書リスト分配部17
と、第1の単語抽出部181から第nの単語抽出部18
nと、第1の単語組合せ部191から第nの単語組合せ
部19nと、表示部20と、ワーク領域部21と、表示
データ生成部22とから構成されている。
るフレーズ生成装置、フレーズ生成方法を説明する。図
1は、この発明の実施の形態に係るフレーズ生成装置の
構成を示すブロック図である。この実施形態のフレーズ
生成装置は、図1に示すように、入力部11と、全文検
索用インデックスファイル12と、文書DB(データベ
ース)13と、単語辞書14と、言語ルール記憶ファイ
ル15と、全文検索部16と、文書リスト分配部17
と、第1の単語抽出部181から第nの単語抽出部18
nと、第1の単語組合せ部191から第nの単語組合せ
部19nと、表示部20と、ワーク領域部21と、表示
データ生成部22とから構成されている。
【0020】全文検索用インデックスファイル12、文
書DB(データベース)13、単語辞書14、及び言語
ルール記憶ファイル15は、図示しない内蔵されたハー
ドディスク装置、又は図示しない外付けされた外部記憶
装置により構成されている。ワーク領域部21は、RA
M(Random Access Memory)等により構成されてい
る。
書DB(データベース)13、単語辞書14、及び言語
ルール記憶ファイル15は、図示しない内蔵されたハー
ドディスク装置、又は図示しない外付けされた外部記憶
装置により構成されている。ワーク領域部21は、RA
M(Random Access Memory)等により構成されてい
る。
【0021】全文検索部16、文書リスト分配部17、
第1の単語抽出部181から第nの単語抽出部18n、
第1の単語組合せ部191から第nの単語組合せ部19
n、及び表示データ生成部22は、図示しないCPU
が、フレーズ候補を生成するための制御プログラムを実
行することにより実現される。
第1の単語抽出部181から第nの単語抽出部18n、
第1の単語組合せ部191から第nの単語組合せ部19
n、及び表示データ生成部22は、図示しないCPU
が、フレーズ候補を生成するための制御プログラムを実
行することにより実現される。
【0022】入力部11は、カーソルキー、数字入力キ
ー及び各種機能キー等を備えたキーボード、及びマウス
を備え、例えば、キーボード及びマウスにより指定され
た、フレーズを生成するためのキーワードを全文検索部
16に出力する。
ー及び各種機能キー等を備えたキーボード、及びマウス
を備え、例えば、キーボード及びマウスにより指定され
た、フレーズを生成するためのキーワードを全文検索部
16に出力する。
【0023】全文検索用インデックスファイル12は、
キャッチフレーズ、広告コピー、商品名、メールアドレ
ス等のフレーズの候補を生成するため必要となる文書を
指定するインデックスデータを記憶する。インデックス
データは、図2に示すように、フレーズを生成するに際
して必要となるキーワードと、このキーワードを有する
文書を指定するID(以下、文書指定IDという)とか
らなるデータ項目を備える。
キャッチフレーズ、広告コピー、商品名、メールアドレ
ス等のフレーズの候補を生成するため必要となる文書を
指定するインデックスデータを記憶する。インデックス
データは、図2に示すように、フレーズを生成するに際
して必要となるキーワードと、このキーワードを有する
文書を指定するID(以下、文書指定IDという)とか
らなるデータ項目を備える。
【0024】文書DB13は、フレーズを生成するとき
に援用される各分野の文書を記憶する。
に援用される各分野の文書を記憶する。
【0025】単語辞書は、文書に含まれている単語を抽
出する際に使用されるとともに、抽出された単語を用
い、後述する言語ルールを参照してフレーズ候補を生成
する際に使用される。この単語辞書に登録されている単
語には、品詞の種類が記述され、さらに、品詞の中の動
詞にはさらに、自動詞、他動詞に分類表示されている。
出する際に使用されるとともに、抽出された単語を用
い、後述する言語ルールを参照してフレーズ候補を生成
する際に使用される。この単語辞書に登録されている単
語には、品詞の種類が記述され、さらに、品詞の中の動
詞にはさらに、自動詞、他動詞に分類表示されている。
【0026】言語ルール記憶ファイル15は、文書から
抽出された単語の組からフレーズ候補を生成するための
言語ルールが記憶されている。上記言語ルールとして、
例えば、図4に示すようなルールがある。 1)形容詞の後に名詞を接続することを許可するルール
例えば、「美しいダイヤモンド」 2)動詞の後に名詞を接続することを許可するルール
例えば、「躍らす心」 3)名詞の後に名詞を接続すること許可するルール 例
えば、「検査結果」 4)名詞の後に自動詞を接続する場合には、名詞と動詞
の間に「は」、「が」、「も」が入るというルール 例
えば、「心が躍る」 5)名詞の後に他動詞を接続する場合には、名詞と動詞
の間に「を」、又は「に」を入るというルール 例え
ば、「心を躍らす」 6)名詞の後に名詞を接続する場合には、2つの名詞を
直接つなげるときと、名詞と名詞との間に「の」を入れ
るというルール 例えば、「検査結果」、「検査の結
果」
抽出された単語の組からフレーズ候補を生成するための
言語ルールが記憶されている。上記言語ルールとして、
例えば、図4に示すようなルールがある。 1)形容詞の後に名詞を接続することを許可するルール
例えば、「美しいダイヤモンド」 2)動詞の後に名詞を接続することを許可するルール
例えば、「躍らす心」 3)名詞の後に名詞を接続すること許可するルール 例
えば、「検査結果」 4)名詞の後に自動詞を接続する場合には、名詞と動詞
の間に「は」、「が」、「も」が入るというルール 例
えば、「心が躍る」 5)名詞の後に他動詞を接続する場合には、名詞と動詞
の間に「を」、又は「に」を入るというルール 例え
ば、「心を躍らす」 6)名詞の後に名詞を接続する場合には、2つの名詞を
直接つなげるときと、名詞と名詞との間に「の」を入れ
るというルール 例えば、「検査結果」、「検査の結
果」
【0027】全文検索部16は、入力部11より入力さ
れたキーワードについて、全文検索用インデックスファ
イル12を検索し、キーワードを有するインデックスデ
ータをすべて読み出す。また、全文検索部16は、読み
出した文書の全てについて、TF(Term Frequency)/
IDF(Inverse Document Frequency)法を用い、キーワ
ードの出現頻度に基づいたキーワードとしての単語の重
要度(以下、単に重要度という)を算出する。さらに、
全文検索部16は、文書の重要度を参照し、フレーズを
生成する際に使用される文書を示す文書リスト200を
生成し、生成した文書リスト200を文書リスト分配部
17に出力する。
れたキーワードについて、全文検索用インデックスファ
イル12を検索し、キーワードを有するインデックスデ
ータをすべて読み出す。また、全文検索部16は、読み
出した文書の全てについて、TF(Term Frequency)/
IDF(Inverse Document Frequency)法を用い、キーワ
ードの出現頻度に基づいたキーワードとしての単語の重
要度(以下、単に重要度という)を算出する。さらに、
全文検索部16は、文書の重要度を参照し、フレーズを
生成する際に使用される文書を示す文書リスト200を
生成し、生成した文書リスト200を文書リスト分配部
17に出力する。
【0028】上記文書リスト200は、図3(a)に示
すように、キーワード、文書指定ID、及び重要度を項
目に備えている。そして、文書リスト200は、重要度
で降順にリストされている。
すように、キーワード、文書指定ID、及び重要度を項
目に備えている。そして、文書リスト200は、重要度
で降順にリストされている。
【0029】文書リスト分配部17は、全文検索用イン
デックスファイル12より入力された文書リスト200
から、図3(b)に示す第1の文書サブリスト3001
から第nの文書サブリスト300nを生成する。
デックスファイル12より入力された文書リスト200
から、図3(b)に示す第1の文書サブリスト3001
から第nの文書サブリスト300nを生成する。
【0030】すなわち、文書リスト分配部17は、全文
検索用インデックスファイル12より入力された文書リ
スト200のうち、重要度がn+1(n=0,1,2,3,
・・・)番目の文書リストデータを第1の文書サブリス
ト3001のリストデータとし、重要度がn+2(n=
0,1,2,3,・・・)番目の文書リストデータを第2の
文書サブリスト3002のリストデータとし、以下同様
にして、第3の文書サブリスト3003から第nの文書
サブリスト300nを生成する。
検索用インデックスファイル12より入力された文書リ
スト200のうち、重要度がn+1(n=0,1,2,3,
・・・)番目の文書リストデータを第1の文書サブリス
ト3001のリストデータとし、重要度がn+2(n=
0,1,2,3,・・・)番目の文書リストデータを第2の
文書サブリスト3002のリストデータとし、以下同様
にして、第3の文書サブリスト3003から第nの文書
サブリスト300nを生成する。
【0031】また、文書リスト分配部17は、作成した
第1の文書サブリスト3001を第1の単語抽出部18
1に出力し、第2の文書サブリスト3002を第2の単
語抽出部182に出力し、以後順次、第3の文書サブリ
スト3003から第nの文書サブリスト300nのそれ
ぞれを、第3の単語抽出部183から第nの単語抽出部
18nに出力する。
第1の文書サブリスト3001を第1の単語抽出部18
1に出力し、第2の文書サブリスト3002を第2の単
語抽出部182に出力し、以後順次、第3の文書サブリ
スト3003から第nの文書サブリスト300nのそれ
ぞれを、第3の単語抽出部183から第nの単語抽出部
18nに出力する。
【0032】第k(k=1,2,・・・,n)の単語抽出
部18kは、第kの文書サブリスト300kに示された
文書サブリストデータ中の重要度の高いものから順次読
み出し、読み出した文書サブリストデータ中に示された
文書指定IDにより示された文書を文書DB13から読
み出す。また、第k(k=1,2,・・・,n)の単語抽
出部18kは、単語辞書14を参照し、読み出した文書
中に含まれる単語を、形態素解析法を用いて所定の個数
読み出し、読み出した所定の個数の単語の組を単語組合
せ部19に出力する。
部18kは、第kの文書サブリスト300kに示された
文書サブリストデータ中の重要度の高いものから順次読
み出し、読み出した文書サブリストデータ中に示された
文書指定IDにより示された文書を文書DB13から読
み出す。また、第k(k=1,2,・・・,n)の単語抽
出部18kは、単語辞書14を参照し、読み出した文書
中に含まれる単語を、形態素解析法を用いて所定の個数
読み出し、読み出した所定の個数の単語の組を単語組合
せ部19に出力する。
【0033】第k(k=1,2,・・・,n)の単語組合
せ部19kは、第k(k=1,2,・・・,n)の単語抽
出部18kから受けた単語の組を用い、言語ルール記憶
ファイル15に記憶されている言語ルールに従ったフレ
ーズを生成する。
せ部19kは、第k(k=1,2,・・・,n)の単語抽
出部18kから受けた単語の組を用い、言語ルール記憶
ファイル15に記憶されている言語ルールに従ったフレ
ーズを生成する。
【0034】表示部20は、CRT(Cathode Ray Tub
e)、液晶表示装置により構成され、各種入力情報を入力
する入力画面、及び例えば生成したフレーズ候補を表示
する表示画面を表示する。
e)、液晶表示装置により構成され、各種入力情報を入力
する入力画面、及び例えば生成したフレーズ候補を表示
する表示画面を表示する。
【0035】ワーク領域部21は、RAM、ハードディ
スク等により構成され、全文検索部16、文書リスト分
配部17、第k(k=1,2,・・・,n)の単語抽出部
18 k及び第k(k=1,2,・・・,n)の単語組合せ
部19kの各構成部が、上述したような処理を実行する
際の作業領域として使用される。
スク等により構成され、全文検索部16、文書リスト分
配部17、第k(k=1,2,・・・,n)の単語抽出部
18 k及び第k(k=1,2,・・・,n)の単語組合せ
部19kの各構成部が、上述したような処理を実行する
際の作業領域として使用される。
【0036】表示データ生成部22は、フレーズ候補を
表示部20に表示させる表示データを生成する。
表示部20に表示させる表示データを生成する。
【0037】次に、この実施形態に係るフレーズ生成装
置の動作を説明する。
置の動作を説明する。
【0038】図5及び図6は、この実施形態に係るフレ
ーズ生成装置の動作を示すフローチャートである。な
お、この実施形態に係るフレーズ生成装置において生成
するフレーズとして、宝石業界で使用されるフレーズを
生成する場合を例にあげて説明する。
ーズ生成装置の動作を示すフローチャートである。な
お、この実施形態に係るフレーズ生成装置において生成
するフレーズとして、宝石業界で使用されるフレーズを
生成する場合を例にあげて説明する。
【0039】操作者は、図7(a)に示すフレーズ生成
指示画面500を表示部20に表示させるための指示
を、入力部11に入力すると、入力部11は、フレーズ
生成指示画面500を表示するための表示データを生成
するように指示を表示データ生成部22に出力する。
指示画面500を表示部20に表示させるための指示
を、入力部11に入力すると、入力部11は、フレーズ
生成指示画面500を表示するための表示データを生成
するように指示を表示データ生成部22に出力する。
【0040】上記フレーズ生成指示画面500は、キー
ワード入力欄501、フレーズを生成する際に組み合わ
せる単語の数を入力する組合せ単語数入力欄502、及
び「OK」ボタン503を備えている。キーワード入力
欄501は、文書DBからフレーズ候補を生成する際に
必要となる文書を抽出するためのキーワードを入力する
欄である。組合せ単語数入力欄は、フレーズ候補を作成
する際の単語の数を入力する欄である。
ワード入力欄501、フレーズを生成する際に組み合わ
せる単語の数を入力する組合せ単語数入力欄502、及
び「OK」ボタン503を備えている。キーワード入力
欄501は、文書DBからフレーズ候補を生成する際に
必要となる文書を抽出するためのキーワードを入力する
欄である。組合せ単語数入力欄は、フレーズ候補を作成
する際の単語の数を入力する欄である。
【0041】表示データ生成部22は、入力部11より
フレーズ生成指示画面500を表示させる表示データを
生成するようにとの指示を受けると、当該表示データを
生成し、生成した表示データを表示部20に出力する。
フレーズ生成指示画面500を表示させる表示データを
生成するようにとの指示を受けると、当該表示データを
生成し、生成した表示データを表示部20に出力する。
【0042】表示部20は、上記表示データを受ける
と、受けた表示データをもとにして、上記フレーズ生成
指示画面500を表示する(ステップS1)。
と、受けた表示データをもとにして、上記フレーズ生成
指示画面500を表示する(ステップS1)。
【0043】操作者により、入力部11を使用して、表
示部20に表示されているフレーズ生成指示画面500
中のキーワード入力欄501に、例えば「宝石」と入力
するとともに、組合せ単語数入力欄502に、例えば
「4」と入力し、その後、「OK」ボタン503をクリ
ックすると、表示部20は、入力された「4」を単語抽
出部18k(k=1,2,3,・・・)に入力するとと
もに、全文検索部16にキーワード「宝石」を入力する
(ステップS2)。
示部20に表示されているフレーズ生成指示画面500
中のキーワード入力欄501に、例えば「宝石」と入力
するとともに、組合せ単語数入力欄502に、例えば
「4」と入力し、その後、「OK」ボタン503をクリ
ックすると、表示部20は、入力された「4」を単語抽
出部18k(k=1,2,3,・・・)に入力するとと
もに、全文検索部16にキーワード「宝石」を入力する
(ステップS2)。
【0044】すると、全文検索部16は、全文検索用イ
ンデックスファイル12を参照し、キーワードが「宝
石」を含む文書を文書DB13から読み出す。その後、
全文検索部16は、読み出した文書中に「宝石」という
単語の重要度をTF・IDF法を用いて算出する。次
に、全文検索部16は、図3(a)に示す文書リストを
生成するための文書リストデータを生成する(ステップ
S3)。
ンデックスファイル12を参照し、キーワードが「宝
石」を含む文書を文書DB13から読み出す。その後、
全文検索部16は、読み出した文書中に「宝石」という
単語の重要度をTF・IDF法を用いて算出する。次
に、全文検索部16は、図3(a)に示す文書リストを
生成するための文書リストデータを生成する(ステップ
S3)。
【0045】続いて、全文検索部16は、生成した文書
リストデータについて、重要度で降順にソートする。そ
の後、全文検索部16は、ソートされた文書リストデー
タを用いて、図3(a)に示す、重要度が降順となる文
書リスト200を生成し、生成した文書リスト200を
文書リスト分配部17に出力する(ステップS4)。
リストデータについて、重要度で降順にソートする。そ
の後、全文検索部16は、ソートされた文書リストデー
タを用いて、図3(a)に示す、重要度が降順となる文
書リスト200を生成し、生成した文書リスト200を
文書リスト分配部17に出力する(ステップS4)。
【0046】文書リスト分配部17は、上記文書リスト
200を受けると、受けた文書リスト200のうち、重
要度がn+1(n=0,1,2,3,・・・)番目の文書リ
ストデータを第1の文書サブリスト3001のリストデ
ータとし、重要度がn+2(n=0,1,2,3,・・・)
番目の文書リストデータを第2の文書サブリスト300
2のリストデータとし、以下同様にして、第3の文書サ
ブリスト3003から第nの文書サブリスト300nを
生成する(ステップS5)。
200を受けると、受けた文書リスト200のうち、重
要度がn+1(n=0,1,2,3,・・・)番目の文書リ
ストデータを第1の文書サブリスト3001のリストデ
ータとし、重要度がn+2(n=0,1,2,3,・・・)
番目の文書リストデータを第2の文書サブリスト300
2のリストデータとし、以下同様にして、第3の文書サ
ブリスト3003から第nの文書サブリスト300nを
生成する(ステップS5)。
【0047】その後、文書リスト分配部17は、作成し
た第1の文書サブリスト3001を第1の単語抽出部1
81に出力し、第2の文書サブリスト3002を第2の
単語抽出部182に出力し、以後順次、第3の文書サブ
リスト3003から第nの文書サブリスト300nのそ
れぞれを、第3の単語抽出部183から第nの単語抽出
部18nに出力する(ステップS6)。
た第1の文書サブリスト3001を第1の単語抽出部1
81に出力し、第2の文書サブリスト3002を第2の
単語抽出部182に出力し、以後順次、第3の文書サブ
リスト3003から第nの文書サブリスト300nのそ
れぞれを、第3の単語抽出部183から第nの単語抽出
部18nに出力する(ステップS6)。
【0048】第kの単語抽出部18k(k=1,2,・・
・,n)は、文書リスト分配部17より第kの文書サブ
リスト3003を受けると、第kの文書サブリスト30
0kに示された文書サブリストデータを重要度が高いも
のから順次読み出し、読み出した文書サブリストデータ
中の文書指定IDにより示された文書を文書DB13か
ら読み出す(ステップS7)。
・,n)は、文書リスト分配部17より第kの文書サブ
リスト3003を受けると、第kの文書サブリスト30
0kに示された文書サブリストデータを重要度が高いも
のから順次読み出し、読み出した文書サブリストデータ
中の文書指定IDにより示された文書を文書DB13か
ら読み出す(ステップS7)。
【0049】続いて、第kの単語抽出部18k(k=
1,2,・・・,n)は、単語辞書14を参照し、読み出
した文書中から、先に入力部11より入力された、フレ
ーズを生成する際に組み合わせる単語の数として、抽出
した文書の中から4つの単語を読み出し、読み出した4
つの単語からなる単語の組を第kの単語組合せ部19k
(k=1,2,・・・,n)に出力する(ステップS
8)。
1,2,・・・,n)は、単語辞書14を参照し、読み出
した文書中から、先に入力部11より入力された、フレ
ーズを生成する際に組み合わせる単語の数として、抽出
した文書の中から4つの単語を読み出し、読み出した4
つの単語からなる単語の組を第kの単語組合せ部19k
(k=1,2,・・・,n)に出力する(ステップS
8)。
【0050】その後、第kの単語組合せ部19k(k=
1,2,・・・,n)は、第kの単語抽出部18k(k=
1,2,・・・,n)から受けた単語の組を用い、言語ル
ール記憶ファイル15に記憶されている言語ルールを参
照して複数のフレーズ候補を生成する(ステップS
9)。
1,2,・・・,n)は、第kの単語抽出部18k(k=
1,2,・・・,n)から受けた単語の組を用い、言語ル
ール記憶ファイル15に記憶されている言語ルールを参
照して複数のフレーズ候補を生成する(ステップS
9)。
【0051】例えば、第kの単語組合せ部19k(k=
1,2,・・・,n)は、第kの単語抽出部19k(k=
1,2,・・・,n)より、「ダイヤモンド」、「心」、
「ときめく」、「美しい」という4つの単語の組を受け
たとすると、以下のようなフレーズ候補を生成する。 (1)心がときめく美しいダイヤモンド(名詞+「が」
+自動詞+形容詞+名詞の関係) (2)美しい心がときめくダイヤモンド(形容詞+名詞
+「が」+自動詞+名詞の関係) (3)ダイヤモンドがときめく美しい心(名詞+「が」
+自動詞+形容詞+名詞の関係) (4)美しいダイヤモンドがときめく心(形容詞+名詞
+「が」+自動詞+名詞の関係) (5)ときめく美しい心ダイヤモンド(動詞+形容詞+
名詞+名詞の関係) (6)ときめく美しい心のダイヤモンド(動詞+形容詞
+名詞+「の」+名詞の関係) (7)ときめく美しいダイヤモンド心(動詞+形容詞+
名詞+名詞の関係) (8)ときめく美しいダイヤモンドの心(動詞+形容詞
+名詞+「の」+名詞の関係)
1,2,・・・,n)は、第kの単語抽出部19k(k=
1,2,・・・,n)より、「ダイヤモンド」、「心」、
「ときめく」、「美しい」という4つの単語の組を受け
たとすると、以下のようなフレーズ候補を生成する。 (1)心がときめく美しいダイヤモンド(名詞+「が」
+自動詞+形容詞+名詞の関係) (2)美しい心がときめくダイヤモンド(形容詞+名詞
+「が」+自動詞+名詞の関係) (3)ダイヤモンドがときめく美しい心(名詞+「が」
+自動詞+形容詞+名詞の関係) (4)美しいダイヤモンドがときめく心(形容詞+名詞
+「が」+自動詞+名詞の関係) (5)ときめく美しい心ダイヤモンド(動詞+形容詞+
名詞+名詞の関係) (6)ときめく美しい心のダイヤモンド(動詞+形容詞
+名詞+「の」+名詞の関係) (7)ときめく美しいダイヤモンド心(動詞+形容詞+
名詞+名詞の関係) (8)ときめく美しいダイヤモンドの心(動詞+形容詞
+名詞+「の」+名詞の関係)
【0052】次に、第kの単語組合せ部19k(k=
1,2,・・・,n)は、生成した複数のフレーズ候補を
ワーク領域部21に記憶させる(ステップS10)。
1,2,・・・,n)は、生成した複数のフレーズ候補を
ワーク領域部21に記憶させる(ステップS10)。
【0053】その後、表示データ生成部22は、ワーク
領域部21に記憶されている、第kの単語組合せ部19
k(k=1,2,・・・,n)により生成されたフレーズ
候補を読み出し、図7(b)に示すフレーズ候補表示画
面550を生成するための表示データを生成し、生成し
た表示データを表示部20に出力する(ステップS1
1)。
領域部21に記憶されている、第kの単語組合せ部19
k(k=1,2,・・・,n)により生成されたフレーズ
候補を読み出し、図7(b)に示すフレーズ候補表示画
面550を生成するための表示データを生成し、生成し
た表示データを表示部20に出力する(ステップS1
1)。
【0054】上記フレーズ候補表示画面550は、図7
(b)に示すように、抽出された単語を表示する表示欄
551、生成されたフレーズ候補を表示する表示欄55
2、「終了」ボタン553、及び「続き」ボタン554
を備えている。
(b)に示すように、抽出された単語を表示する表示欄
551、生成されたフレーズ候補を表示する表示欄55
2、「終了」ボタン553、及び「続き」ボタン554
を備えている。
【0055】表示部20は、表示データ生成部22より
上記表示データを受けると、図7(b)に示すフレーズ
候補表示画面550を表示する(ステップS12)。
上記表示データを受けると、図7(b)に示すフレーズ
候補表示画面550を表示する(ステップS12)。
【0056】その後、表示データ生成部22は、表示部
20から「終了」ボタン553がクリックされたか否か
を判断する(ステップS13)。表示データ生成部22
は、表示部20から「終了」ボタン553がクリックさ
れたと判断した場合には(ステップS13;YES)、
操作者が自己が望むフレーズが表示されてフレーズ生成
処理を終了させたもの、又は、操作者が未だ自己が望む
フレーズが表示されていないがフレーズ生成処理を打ち
切らせたものとして、フレーズ生成処理を終了する。
20から「終了」ボタン553がクリックされたか否か
を判断する(ステップS13)。表示データ生成部22
は、表示部20から「終了」ボタン553がクリックさ
れたと判断した場合には(ステップS13;YES)、
操作者が自己が望むフレーズが表示されてフレーズ生成
処理を終了させたもの、又は、操作者が未だ自己が望む
フレーズが表示されていないがフレーズ生成処理を打ち
切らせたものとして、フレーズ生成処理を終了する。
【0057】一方、表示データ生成部22は、表示部2
0から「終了」ボタン553がクリックされなかったと
判断しない場合(ステップS13;NO)、すなわち
「続き」ボタン554がクリックされた場合には、その
旨を第kの単語組合せ部19k(k=1,2,・・・,
n)に出力する。その後、フレーズ生成装置は、処理を
ステップS8に移行し、上述した処理を行う。
0から「終了」ボタン553がクリックされなかったと
判断しない場合(ステップS13;NO)、すなわち
「続き」ボタン554がクリックされた場合には、その
旨を第kの単語組合せ部19k(k=1,2,・・・,
n)に出力する。その後、フレーズ生成装置は、処理を
ステップS8に移行し、上述した処理を行う。
【0058】なお、第kの単語組合せ部19k(k=
1,2,・・・,n)は、再び単語を抽出するに際し、先
に抽出した単語の組以外の単語の組からなる単語を抽出
する。例えば、第kの単語組合せ部19k(k=1,2,
・・・,n)は、先に「ダイヤモンド」、「心」、「と
きめく」、「美しい」という単語の組を抽出している場
合には、それ以外の新たな単語の組、例えば、「ダイヤ
モンド」、「心」、「ときめく」、「指輪」を抽出す
る。
1,2,・・・,n)は、再び単語を抽出するに際し、先
に抽出した単語の組以外の単語の組からなる単語を抽出
する。例えば、第kの単語組合せ部19k(k=1,2,
・・・,n)は、先に「ダイヤモンド」、「心」、「と
きめく」、「美しい」という単語の組を抽出している場
合には、それ以外の新たな単語の組、例えば、「ダイヤ
モンド」、「心」、「ときめく」、「指輪」を抽出す
る。
【0059】この実施形態のフレーズ生成装置によれ
ば、入力されたキーワードから文書DB13に記憶され
ている文書を抽出し、第kの単語抽出部18k(k=
1,2,・・・,n)が抽出した文書に含まれている単
語を抽出するので、フレーズ候補を生成する際に抽出す
る単語の数を抑えることができる。
ば、入力されたキーワードから文書DB13に記憶され
ている文書を抽出し、第kの単語抽出部18k(k=
1,2,・・・,n)が抽出した文書に含まれている単
語を抽出するので、フレーズ候補を生成する際に抽出す
る単語の数を抑えることができる。
【0060】また、このフレーズ生成装置によれば、キ
ーワードとして所定の分野に関連する単語である場合に
は、当該分野についてのフレーズ候補を絞って生成する
ことができる。
ーワードとして所定の分野に関連する単語である場合に
は、当該分野についてのフレーズ候補を絞って生成する
ことができる。
【0061】また、このフレーズ生成装置によれば、第
kの単語抽出部18k(k=1,2,・・・,n)及び
第kの単語組合せ部19k(k=1,2,・・・,n)
のように、複数の単語抽出部及び単語組合せ部により、
選択された文書から単語を抽出し、抽出した単語からフ
レーズ候補を生成するので、フレーズ候補を迅速に生成
することができる。
kの単語抽出部18k(k=1,2,・・・,n)及び
第kの単語組合せ部19k(k=1,2,・・・,n)
のように、複数の単語抽出部及び単語組合せ部により、
選択された文書から単語を抽出し、抽出した単語からフ
レーズ候補を生成するので、フレーズ候補を迅速に生成
することができる。
【0062】また、このフレーズ生成装置によれば、キ
ーワードの重要度が高い順の文書から、フレーズ候補を
生成するので、所定の分野に関連するフレーズ候補を効
率よく生成することができる。
ーワードの重要度が高い順の文書から、フレーズ候補を
生成するので、所定の分野に関連するフレーズ候補を効
率よく生成することができる。
【0063】この実施形態に係るフレーズ生成装置は、
キーワードをもとにして選択された文書から、第kの単
語抽出部18k(k=1,2,・・・,n)が所定の数
の単語を抽出し、その抽出した単語をもとにして、第k
の単語組合せ部19k(k=1,2,・・・,n)がフ
レーズ候補を生成するように構成されているが、これ以
外として、フレーズ候補を生成するために適さない単
語、例えば、公序良俗を侵す虞がある単語や、フレーズ
に使用したくないものであると明らかに分かっている単
語を登録した使用禁止単語登録DBを備え、抽出した単
語が使用禁止単語登録DBに登録されているかを検査し
たのち、フレーズ候補を生成するような構成にしてもよ
い。
キーワードをもとにして選択された文書から、第kの単
語抽出部18k(k=1,2,・・・,n)が所定の数
の単語を抽出し、その抽出した単語をもとにして、第k
の単語組合せ部19k(k=1,2,・・・,n)がフ
レーズ候補を生成するように構成されているが、これ以
外として、フレーズ候補を生成するために適さない単
語、例えば、公序良俗を侵す虞がある単語や、フレーズ
に使用したくないものであると明らかに分かっている単
語を登録した使用禁止単語登録DBを備え、抽出した単
語が使用禁止単語登録DBに登録されているかを検査し
たのち、フレーズ候補を生成するような構成にしてもよ
い。
【0064】この実施形態に係るフレーズ生成装置は、
キーワードを含む文書をもとにしてフレーズ候補を生成
するような構成になっているが、これ以外として、キー
ワードの重要度が所定の基準値未満のものについては、
フレーズ候補を生成するに際して、使用しないようにし
てもよい。すなわち、この実施形態に係るフレーズ生成
装置を構成する全文検索部16が有する機能に、更に、
重要度が所定の基準値以上の文書を選別する機能を備え
るようにする。こうすることで、一層、フレーズ候補の
生成が迅速になるとともに、メモリ使用を抑えることが
できる。
キーワードを含む文書をもとにしてフレーズ候補を生成
するような構成になっているが、これ以外として、キー
ワードの重要度が所定の基準値未満のものについては、
フレーズ候補を生成するに際して、使用しないようにし
てもよい。すなわち、この実施形態に係るフレーズ生成
装置を構成する全文検索部16が有する機能に、更に、
重要度が所定の基準値以上の文書を選別する機能を備え
るようにする。こうすることで、一層、フレーズ候補の
生成が迅速になるとともに、メモリ使用を抑えることが
できる。
【0065】この実施形態に係るフレーズ生成装置は、
全文検索部16により、入力部11から入力された1つ
キーワードを含む文書を抽出する構成になっているが、
これ以外として、入力部11から複数のキーワードを入
力し、これらのキーワードの全てを含む文書、又はこれ
らのキーワードのいずれか1つを含む文書を抽出するよ
うな構成であってもよい。
全文検索部16により、入力部11から入力された1つ
キーワードを含む文書を抽出する構成になっているが、
これ以外として、入力部11から複数のキーワードを入
力し、これらのキーワードの全てを含む文書、又はこれ
らのキーワードのいずれか1つを含む文書を抽出するよ
うな構成であってもよい。
【0066】この実施形態に係るフレーズ生成装置は、
文書に対するキーワードの重要度を算出する方法とし
て、TF/IDF法を用いているが、これ以外の方法を
用いてもよいことはいうまでもない。
文書に対するキーワードの重要度を算出する方法とし
て、TF/IDF法を用いているが、これ以外の方法を
用いてもよいことはいうまでもない。
【0067】
【発明の効果】以上この発明によれば、フレーズの候補
を効率的に生成することができる。
を効率的に生成することができる。
【図1】この発明の実施形態に係るフレーズ生成装置の
構成を示すブロック図である。
構成を示すブロック図である。
【図2】図1中の全文検索用インデックスファイルの構
成を示す図である。
成を示す図である。
【図3】(a)は、全文検索部により生成される文書リ
ストの内容を示す図である。(b)は、文書リスト分配
部により生成される文書サブリストの内容を示す図であ
る。
ストの内容を示す図である。(b)は、文書リスト分配
部により生成される文書サブリストの内容を示す図であ
る。
【図4】図1中の言語ルール記憶ファイルに記憶されて
いる言語ルールを説明する図である。
いる言語ルールを説明する図である。
【図5】実施形態に係るフレーズ生成装置の動作を示す
フローチャートである。
フローチャートである。
【図6】実施形態に係るフレーズ生成装置の動作を示す
フローチャートである。
フローチャートである。
【図7】
(a)フレーズ生成指示画面を説明する図である。
(b)フレーズ候補表示画面を説明する図である。
11 入力部
12 全文検索用インデックスファイル
13 文書DB
14 単語辞書
15 言語ルール記憶ファイル
16 全文検索部
17 文書リスト分配部
18 単語抽出部
19 単語組合せ部
20 表示部
21 ワーク領域部
22 表示データ生成部
─────────────────────────────────────────────────────
フロントページの続き
Fターム(参考) 5B009 VA02
5B075 ND03 NK32 PP24 PQ75 PR04
UU06
Claims (11)
- 【請求項1】キャッチフレーズ、広告コピー、商品名等
のフレーズを生成するフレーズ生成装置であって、 文書を記憶する文書記憶手段と、 前記文書記憶手段に記憶されている文書を指定するため
のキーワードを入力するキーワード入力手段と、 前記キーワード入力手段により入力されたキーワードか
ら、前記文書記憶手段に記憶されている文書を抽出する
文書抽出手段と、 前記文書抽出手段により抽出された文書から単語を抽出
する単語抽出手段と、 前記単語抽出手段により抽出された単語を組み合わせて
フレーズを生成する単語組合せ手段と、 を備えることを特徴とするフレーズ生成装置。 - 【請求項2】キーワードと、該キーワードを含む文書を
指定する文書指定情報とに対応するインデックスデータ
を登録するインデックスデータ登録手段をさらに備え、 前記文書抽出手段は、 前記インデックスデータ登録手段に登録されているイン
デックスデータを参照し、前記キーワードを含む文書を
検索する文書検索手段と、 前記文書検索手段により検索された文書について、前記
キーワードの出現頻度に基づいたキーワードの重要度を
算出するキーワード重要度算出手段と、 を備え、 前記キーワード重要度算出手段により算出されたキーワ
ードの重要度の高い順に、前記文書記憶手段に記憶され
ている文書を抽出する、 ことを特徴とする請求項1に記載のフレーズ生成装置。 - 【請求項3】前記文書抽出手段により抽出されたキーワ
ードの重要度の高い順で文書を指定する情報を備える文
書リストを生成する文書リスト生成手段を備え、 前記単語抽出手段は、 前記文書リストに示された文書から単語を抽出し、 前記単語組合せ手段は、 前記単語語抽出手段により抽出された単語を組み合わせ
てフレーズを生成する、 ことを特徴とする請求項2に記載のフレーズ生成装置。 - 【請求項4】前記文書リスト生成手段により生成された
文書リストから、単語の重要度の高い順で、かつ、交互
に所定の個数の文書サブリストを生成する文書サブリス
ト生成手段と、 前記単語抽出手段と、前記単語組合せ手段とは、前記文
書サブリスト生成手段が生成した各文書サブリストごと
に備え、 各前記単語抽出手段は、 対応する前記文書サブリストに示された文書から単語を
抽出し、 各前記単語組合せ手段は、 前記単語語抽出手段により抽出された単語を組み合わせ
てフレーズを生成する、 ことを特徴とする請求項3に記載のフレーズ生成装置。 - 【請求項5】フレーズが取り得るルールを記憶するルー
ル記憶手段を備え、 前記単語組合せ手段は、 前記単語抽出手段により抽出された単語を、前記ルール
記憶手段に記憶されているルールに従い、フレーズを生
成することを特徴とする請求項1または4に記載のフレ
ーズ生成装置。 - 【請求項6】キャッチフレーズ、広告コピー、商品名等
のフレーズを生成するフレーズ生成方法であって、 予め記憶されている文書を指定するためのキーワードを
入力し、 入力したキーワードから、予め記憶されている文書を抽
出し、 抽出した文書から単語を抽出し、 抽出した単語を組み合わせてフレーズを生成する、 ことを特徴とするフレーズ生成方法。 - 【請求項7】予め登録されている、キーワードと、該キ
ーワードを含む文書を指定する文書指定情報とを対応す
るインデックスデータを参照し、前記キーワードを含む
文書を検索し、 検索した文書について、前記キーワードの出現頻度に基
づいたキーワードの重要度を算出し、 算出したキーワードの重要度の高い順に、予め記憶され
ている文書を抽出する、 ことを特徴とする請求項6に記載のフレーズ生成方法。 - 【請求項8】抽出したキーワードの重要度の高い順で文
書を指定する情報を備える文書リストを生成し、 前記文書リストに示された文書から単語を抽出し、 抽出した単語を組み合わせてフレーズを生成する、 ことを特徴とする請求項7に記載のフレーズ生成方法。 - 【請求項9】生成した文書リストから、前記重要度の高
い順で、かつ、交互に所定の個数の文書サブリストを生
成し、 前記文書サブリストごとに、該文書サブリストに示され
た文書から単語を抽出し、 前記文書サブリストごとに、該文書サブリストに示され
た文書から抽出した単語を組み合わせてフレーズを生成
する、 ことを特徴とする請求項8に記載のフレーズ生成方法。 - 【請求項10】抽出した単語を、予め記憶されているフ
レーズが取り得るルールに従い、フレーズを生成する、 ことを特徴とする請求項6または9に記載のフレーズ生
成方法。 - 【請求項11】キャッチフレーズ、広告コピー、商品名
等のフレーズを生成するプログラムであって、 予め記憶されている文書を指定するためのキーワードを
入力する手順、 入力したキーワードから、予め記憶されている文書を抽
出する手順、 抽出した文書から単語を抽出する手順、 抽出した単語を組み合わせてフレーズを生成する手順、 を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001379546A JP2003178057A (ja) | 2001-12-13 | 2001-12-13 | フレーズ生成装置、フレーズ生成方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001379546A JP2003178057A (ja) | 2001-12-13 | 2001-12-13 | フレーズ生成装置、フレーズ生成方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003178057A true JP2003178057A (ja) | 2003-06-27 |
Family
ID=19186870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001379546A Pending JP2003178057A (ja) | 2001-12-13 | 2001-12-13 | フレーズ生成装置、フレーズ生成方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003178057A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005050167A (ja) * | 2003-07-29 | 2005-02-24 | Kenpakku:Kk | 禁止用語を除外した文字列の生成方法 |
JP2010515123A (ja) * | 2006-12-20 | 2010-05-06 | マイクロソフト コーポレーション | 中国語バナーの生成 |
JP2016194926A (ja) * | 2015-04-01 | 2016-11-17 | 株式会社発明屋 | 発明系 |
CN107122348A (zh) * | 2017-04-24 | 2017-09-01 | 维沃移动通信有限公司 | 一种信息保存方法及移动终端 |
-
2001
- 2001-12-13 JP JP2001379546A patent/JP2003178057A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005050167A (ja) * | 2003-07-29 | 2005-02-24 | Kenpakku:Kk | 禁止用語を除外した文字列の生成方法 |
JP2010515123A (ja) * | 2006-12-20 | 2010-05-06 | マイクロソフト コーポレーション | 中国語バナーの生成 |
US8862459B2 (en) | 2006-12-20 | 2014-10-14 | Microsoft Corporation | Generating Chinese language banners |
JP2016194926A (ja) * | 2015-04-01 | 2016-11-17 | 株式会社発明屋 | 発明系 |
CN107122348A (zh) * | 2017-04-24 | 2017-09-01 | 维沃移动通信有限公司 | 一种信息保存方法及移动终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5647508B2 (ja) | ショートテキスト通信のトピックを識別するためのシステムおよび方法 | |
US10891700B2 (en) | Methods and computer-program products for searching patent-related documents using search term variants | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
US20120078907A1 (en) | Keyword presentation apparatus and method | |
JP2009245041A (ja) | 文書評価支援方法及びシステム | |
US20120317141A1 (en) | System and method for ordering of semantic sub-keys | |
JP2004178421A (ja) | 文書検索装置、文書検索方法、プログラムおよび記録媒体 | |
US9875298B2 (en) | Automatic generation of a search query | |
JP2006178599A (ja) | 文書検索装置および方法 | |
US20070226208A1 (en) | Information retrieval device | |
JP2003178057A (ja) | フレーズ生成装置、フレーズ生成方法、及びプログラム | |
JPH0944523A (ja) | 関連語提示装置 | |
JPH08287086A (ja) | 適合度順画像強調表示方法及び装置 | |
JP4569179B2 (ja) | ドキュメント検索装置 | |
US20120317103A1 (en) | Ranking data utilizing multiple semantic keys in a search query | |
JP2005031950A (ja) | 情報検索装置、情報検索方法およびプログラム | |
JPH1145252A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2005234772A (ja) | 文書管理装置および方法 | |
JP2009075662A (ja) | 検索支援装置 | |
JP2002056009A (ja) | 文書分類方法および装置 | |
US20080228725A1 (en) | Problem/function-oriented searching method for a patent database system | |
JP2006039811A (ja) | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 | |
JPH1145251A (ja) | 検索機能を用いた情報分析支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2004133510A (ja) | 技術文献検索システム | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041005 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050215 |