JPH07141392A - キーワード作成装置 - Google Patents

キーワード作成装置

Info

Publication number
JPH07141392A
JPH07141392A JP5284621A JP28462193A JPH07141392A JP H07141392 A JPH07141392 A JP H07141392A JP 5284621 A JP5284621 A JP 5284621A JP 28462193 A JP28462193 A JP 28462193A JP H07141392 A JPH07141392 A JP H07141392A
Authority
JP
Japan
Prior art keywords
keyword
word
search word
words
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5284621A
Other languages
English (en)
Inventor
Masa Saito
雅 斎藤
Takahiro Nakajima
孝浩 中島
Kosuke Wakita
幸輔 脇田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP5284621A priority Critical patent/JPH07141392A/ja
Publication of JPH07141392A publication Critical patent/JPH07141392A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 テキストデータから抽出した複合語及びその
展開形とこれらの読みの校閲・修正を効率良く行い、キ
ーワード作成の負荷を軽減する。 【構成】 テキストデータからキーワード辞書を参照し
て抽出した検索語候補(複合語を含む)を含むキーワー
ドデータを入力し(ステップ210)、検索語候補をデ
ィスプレイに名寄せ一覧表示し(ステップ212)、検
索語候補を校閲・修正し(ステップ214)、キーワー
ドを確定し、且つ複合語の分割位置を確定する(ステッ
プ216)。確定した複合語を派生語に展開し(ステッ
プ218)、検索語となる派生語を選択してキーワード
として確定し(ステップ220)、確定した全キーワー
ドに振られたカナを校閲・修正し(ステップ222)、
それを確定し(ステップ220)、確定後のキーワード
とカナを用いてCD−ROM用のキーワードを作成する
(ステップ222)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、キーワード作成装置、
特にCD−ROMに格納されているテキストをダイレク
ト・アクセスにより高速検索するために用いるキーワー
ドの作成に適用して好適なキーワード作成装置に関す
る。
【0002】
【従来の技術】辞典類を始めとして種々の出版物がCD
−ROMに記録収納されて出版されている。このCD−
ROM出版物では、収納されているテキストの内容(説
明文、解説文)を高速検索するために、検索語(キーワ
ード)を用いてダイレクト・アクセスすることが一般に
行われている。このキーワードは、図16に概念的に示
すように、CD−ROMに格納する対象であるテキスト
データから、検索語の候補として多数の名詞を抽出して
キーワードデータを作成し、このキーワードデータの中
から検索語として相応しいキーワードを確定し、それを
文章等のテキストと共にCD−ROMに記録して出版物
としている。
【0003】従来のキーワード作成には、自然言語処理
システムを利用したキーワード抽出システムを用い、テ
キストデータ中から全ての名詞をカナ(読み)を振った
状態で抽出し、その名詞データからキーワードとして可
能性のあるキーワードデータを作成し、このキーワード
データに対して校閲や修正を行って検索語として相応し
い名詞のみとすることにより、キーワードとする作業が
行われている。
【0004】
【発明が解決しようとする課題】しかしながら、前記キ
ーワード抽出システムによってはテキストデータから日
本語として正しくない名詞や、検索語として相応しくな
い名詞が多く抽出される上に、複数の単語が連結された
複合語は、全て分割されて表示されているため、複合語
をキーワードとする場合には単語を合成しなければなら
ず、しかも修正作業を行うディスプレイには名詞とその
読みとが初めから同時に表示されるため、名詞を修正す
る場合には常にその読みをも修正しなければならないた
め、キーワードデータから最終的なキーワードを作成す
るまでに行う校正(校閲)や修正の作業に負荷がかかり
すぎるという問題があった。
【0005】本発明は、前記従来の問題点を解決するべ
くなされたもので、テキストデータから検索語候補とし
て抽出したキーワードデータに対して校閲・修正作業を
効率良く行うことができ、キーワード作成作業の効率を
向上することができるキーワード作成装置を提供するこ
とを課題とする。
【0006】
【課題を解決するための手段】本第1発明は、CD−R
OM用の検索語になる可能性のある名詞と、その読みと
が登録されたキーワード辞書を参照して、CD−ROM
用テキストデータから抽出した検索語候補と、キーワー
ド辞書から読み込んだ該検索語候補の読みとを含むキー
ワードデータをディスプレイに表示し、該ディスプレイ
上でキーワードデータを校閲・修正して検索語として相
応しいキーワードを作成するキーワード作成装置であっ
て、検索語候補が、複数の単語に分割できる複合語であ
る場合、該複合語の分割位置を校閲・修正して確定する
機能と、分割位置が確定した複合語を、該複合語に含ま
れる派生語に展開する機能と、展開された派生語から検
索語として相応しいものを選択し、それをキーワードと
して確定する機能と、を有する構成とすることにより、
前記課題を解決したものである。
【0007】本第1発明、又、前記キーワード作成装置
において、複合語を、その分割位置を明示して、他の検
索語候補と共に、ディスプレイ上に名寄せ一覧表示する
機能が設けられているとしたものである。ここで、名寄
せとは、同一の名詞が複数ある場合にそれを1つにまと
めることを意味する。
【0008】本第2発明は、CD−ROM用の検索語に
なる可能性のある名詞と、その読みとが登録されたキー
ワード辞書を参照して、CD−ROM用テキストデータ
から抽出した検索語候補と、キーワード辞書から読み込
んだ該検索語候補の読みとを含むキーワードデータをデ
ィスプレイに表示し、該ディスプレイ上でキーワードデ
ータを校閲・修正して検索語として相応しいキーワード
を作成するキーワード作成装置であって、検索語候補
が、複数の単語に分割できる複合語である場合、該複合
語を、単語で構成される派生語に展開して表示する機能
と、展開された派生語を校閲・修正してキーワードとし
て確定する機能と、を有する構成とすることにより、同
様に前記課題を解決したものである。
【0009】本第2発明は、又、前記キーワード作成装
置において、検索語候補を、該検索語候補が含まれてい
る本文と対比させて表示する機能が設けられているとし
たものである。
【0010】又、前記第1及び第2発明のいずれのキー
ワード作成装置においても、派生語を校閲・修正する際
の判断を支援するために、複数の分割パターンを有する
複合語についてその分割パターンを表示する機能が設け
られているとしたものである。
【0011】
【作用】本第1発明においては、キーワード作成装置
が、テキストデータから抽出した検索語候補の中に含ま
れる複合語に対して分割位置を校閲・修正して確定する
機能と、分割位置が確定した複合語を派生語に展開する
機能と、検索語として相応しい派生語をキーワードとし
て確定する機能とを有しているので、複合語の分割位置
を、適切な単語に分割できる位置に確定した後に、確定
した分割位置でその複合語を分割し、その派生語に展開
することができるため、複合語自体をキーワードとする
ことができると共に、該複合語に含まれる派生語の中か
ら適切なものをキーワードとして選択することができ
る。
【0012】なお、ここで、派生語とは、複合語を構成
する単語及び単語の連結語を意味する。
【0013】従って、前記キーワード抽出システムを用
いる場合には、複合語があると、初めから単語に全て分
割されて表示されるため、校閲・修正時に複合語を合成
してやる必要があったのに対し、本発明によれば、検索
語候補として始めに複合語を表示させ、その後適切に分
割した単語からなる派生語に展開するようにしたので、
複合語について必要なキーワードを正確に作成できると
共に、そのキーワード作成作業を効率良く行うことが可
能となる。
【0014】本第1発明において、複合語、その分割位
置を明記して他の検索語候補と共に、ディスプレイ上に
名寄せ一覧表示する機能が設けられている場合には、デ
ィスプレイに表示されている検索語候補が複合語である
ことを簡単に視認できると共に、同一の複合語は一つに
まとめて表示することができるため、同一複合語がテキ
ストデータの複数個所にでてくる場合でも、その複合語
については1回の校閲・修正作業で、複合語について適
切なキーワードを作成することができる。
【0015】従来(前記キーワード抽出システムを使用
する場合)は、同一複合語がテキストデータに複数含ま
れている場合には、キーワードデータにもそれと同数の
同一複合語が含まれていたため、同一複合語が出てくる
とその都度同一の校閲・修正作業を繰返す必要があった
のに対し、本発明によれば1回で済むため一段と作業効
率を向上することができる。
【0016】本第2発明においては、キーワード作成装
置が、テキストデータから抽出したキーワードデータの
中に含まれる複合語を、派生語に展開して表示する機能
と、展開された派生語を校閲・修正してキーワードとし
て確定する機能とを有しているので、前記第1発明と同
様に、単語を合成することなく複合語自体をキーワード
とすることができると共に、展開して表示されている派
生語を適切に校閲・修正するだけで該派生語をもキーワ
ードとすることができるため、キーワード作成作業の効
率を向上することが可能となる。
【0017】又、本第2発明において、キーワードデー
タを、該当する本文と対比させて表示する機能が設けら
れている場合には、テキストデータの本文における複合
語の用いられかたを参酌することができるため、該複合
語及びその派生語の校閲・修正を正確に行うことが可能
となる。
【0018】更に、前記第1及び第2発明のいずれにお
いても、派生語を校閲・修正する際の判断を支援するた
めに、複数の分割パターンを有する複合語についてその
分割パターンを表示する機能が設けられている場合に
は、複合語及びその派生語の校閲・修正を一段と正確に
行うことが可能となる。
【0019】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。
【0020】図1は、本発明にかかる第1実施例のキー
ワード作成システムの概略構成と、処理の流れとを示す
説明図であり、図2、図3は同システムによる処理手順
を示すフローチャートである。
【0021】本実施例のキーワード作成システムは、フ
ロッピー・ディスクFD1に格納されている本文テキス
トを入力し、該テキストからキーワード辞書を参照して
キーワードデータを抽出して作成するキーワードデータ
作成装置6と、作成されたキーワードデータを、これが
格納されているフロッピー・ディスクFD2により入力
し、該キーワードデータに対して校閲・修正してキーワ
ードを作成し、それをフロッピー・ディスクFD3に格
納するキーワード校閲・修正装置8とを備えている。但
し、使用する記憶媒体はフロッピー・ディスクに限定さ
れない。
【0022】本実施例においては、図2に示す手順に従
ってキーワードデータの作成が行われるようになってい
る。
【0023】即ち、まずCD−ROMに納める文章に相
当するテキストデータ(本文テキスト)をフロッピー・
ディスクFD1によりデータ作成装置6に入力し(ステ
ップ110)、このテキストデータから、予め作成され
ているキーワード辞書を参照して検索語候補の名詞を抽
出し(ステップ112)、抽出した検索語候補の読み
を、又、検索語候補が複合語である場合はその分割位置
と展開形を、それぞれキーワード辞書から読み込み(ス
テップ114)、検索語候補とその読み、及び複合語の
分割位置と展開形を含むキーワードデータを作成する
(ステップ116)。図4は、以上の処理を概念的に示
したものである。作成されたキーワードデータは、フロ
ッピー・ディスクFD2に格納し、後に詳述する校閲・
修正作業に用いる。
【0024】このキーワードデータ作成装置6として
は、例えばワークステーションを利用することができ、
又、入力するテキストデータとしては、CD−ROM用
に加工された、例えばMS−DOS形式で作成されたも
のを使用できる。
【0025】検索語候補の名詞をテキストデータから抽
出するために用いる上記キーワード辞書には、キーワー
ドとなり得る語(名詞)だけが登録されており、その1
件分の内容は、図5に概念的に示すようにマッチングキ
ーとキーワード情報であり、このキーワード情報には
(A)検索語(キーワード)候補、(B)その読み、
(C)複合語の分割位置、(D)分割単位名詞(展開
形)、(E)展開形の読みが含まれている。なお、複合
語とは、複数の単位名詞が連結された名詞を意味する。
【0026】このキーワード辞書による検索語候補の抽
出は、本文中にマッチングキーに該当する名詞があった
場合、そのマッチングキーに該当するキーワード(検索
語)候補とそのキーワード情報をキーワード辞書から読
み込むことにより行われる。このキーワード辞書は、辞
典類の索引語や見出し語等のデータからキーワードにな
り得る名詞を選択し、予め作成しておく。
【0027】上記キーワード辞書の内容の一例を次に示
す。 (例)マッチングキー:地中海貿易 キーワード情報 ・キーワード :地中海貿易 ・読み :チチュウカイボウエキ ・分割位置 :地中海●貿易 ・展開形 :地中海、貿易 ・展開形読み :チチュウカイ、ボウエキ
【0028】上述したステップ116で作成されたキー
ワードデータは、本実施例の校閲・修正装置(キーワー
ド作成装置)8に入力され、以下の手順に従って処理さ
れ、キーワードの作成が行われる。
【0029】この校閲・修正装置8としては、図6に示
すような装置本体10にディスプレイ12が設けられ、
ペン14により上記ディスプレイ12上で入力すること
ができると共に、フロッピィーディスク16によりデー
タの入力と保存が可能な、ペンコンピュータが用いられ
る。このペンコンピュータには、以下に詳述する図3の
フローチャートに示す手順で行う処理を始めとする各種
の処理手順がプログラム入力されており、校閲・修正装
置として機能するようになっている。
【0030】まず、ステツプ210で、前記ステップ1
16で作成された検索語候補と、その読み(カナ)とを
含むキーワードデータ、本文テキスト(テキストデー
タ)が、格納されているフロッピィーディスク16によ
り校閲・修正装置に入力され、次いで検索語候補をディ
スプレイ12に名寄せ一覧表示する(ステップ21
2)。
【0031】図7は、キーワードデータを校閲・修正す
る作業を行うときのキーワード一覧修正画面(修正モー
ド画面)を模式的に示したものであり、ディスプレイ1
2上には、図の上部に記載したキーワード、修正結果、
個数、メニューの各表示エリア毎に区切られて表示され
るようになっている。
【0032】前記ステップ212で名寄せ一覧表示され
た検索語(キーワード)候補が、図7に示す表示画面の
キーワード表示エリアに示してあり、○△等の記号で表
わした文字からなる検索語候補が1件ずつ上から順に表
示されている。
【0033】図8は、表示された検索語候補の一例を具
体的に示したものである。この図8で江戸幕府は、「江
戸」と「幕府」の分割単語からなる複合語であり、/は
分割位置を表わしている。前記図7のキーワード表示エ
リアに示す3行目の検索語候補も複合語を表わしてい
る。この複合語は、キーワード辞書にデータとして格納
されており、キーワードデータを一覧表示すると自動的
に分割位置が付されて表示されようになっている。
【0034】又、前記図7の修正結果表示エリアには検
索語を修正した結果が、個数表示エリアには名寄せした
同一検索語の個数が、又、メニュー表示エリアには、現
在の表示画面で選択して実行できる処理モードの種類
や、現在の画面から他のモード画面へ移行する際に選択
するモード名が表示されている。
【0035】前記ステップ212でキーワードデータ
(検索語候補群)が一覧表示された後、前記図7の修正
モード画面において各検索語候補について検索語として
相応しいか否かを校閲し、相応しくない場合や、複合語
に付されている分割位置が適切でない場合にはそれをデ
ィスプレイ上でペン14を用いて修正する(ステップ2
14)。
【0036】検索語候補を修正すると、その結果が修正
結果表示エリアに表示される。即ち、図7では、2行目
の検索語候補を削除し、5行目の検索語候補に1文字付
加して4文字とした修正を行ったその結果が表示されて
いる。ここで実行される修正の例と、その方法について
以下に説明する。
【0037】(1)全削除 メニューの全削除モードを選択し、削除する検索語候補
をペンで1回タッチする。図示は省略してあるが、図7
のメニュー表示エリアにある削除モードには、全削除と
部分削除がある。
【0038】(2)部分削除 メニューの部分削除モードを選択し、1文字削除のとき
はその文字をペンで2回タッチし、連続文字削除のとき
は始めの文字と終りの文字をペンで1回ずつタッチす
る。
【0039】(3)付加 メニューの付加モードを選択し、付加する位置に当る検
索語候補の先頭文字又は最終文字を1回タッチした後、
付加する文字(列)をペンで入力する。
【0040】(4)複合語分割位置の修正 メニューの複合語分割モードを選択し、検索語中の文字
をペンで1回タッチするとその直前に分割マーク(/)
が挿入され、既に表示されている分割マークは1回タッ
チすると削除される。
【0041】(5)複合語第2分割位置の決定 1つの複合語に分割の仕方が複数ある場合、例えば複合
語が「物理学者」であり、第1分割位置が「物理/学
者」で、第2分割位置が「物理学/者」である場合、上
記(4)の方法により第1分割位置を決定した後、メニ
ューの複合語第2分割モードを選択する。次いで、上記
(4)で決定した第1分割位置が付された複合語をペン
で1回タッチするとコピーすることができ、そのコピー
された複合語に対して上記(4)と同一の操作を行って
第2分割位置を決定する。
【0042】(6)別キーワードへの分割 本来2つに分割されるべき検索語候補(複合語を除く)
が連結して表示されている場合、メニューの分割モード
を選択し、検索語候補中の文字を1回タッチするとその
直前で分割されて2つのキーワードになる。
【0043】上述した前記ステップ214の校閲・修正
作業が完了し、検索語候補の全てを検索語として相応し
い名詞に修正できた後は、それをキーワードとして確定
すると共に、複合語についてはその分割位置を確定する
(ステップ216)。
【0044】次いで、分割位置が確定した複合語をキー
ワード辞書に記載されているその派生語(展開形)に展
開する(ステップ218)。又、分割位置を修正した時
は、全ての順列組合せの派生語に展開する。ここで派生
語とは分割位置が確定した複合語が「A/B/C」
(A、B、Cはそれぞれ分割単語)である場合、(AB
C)、(A)、(B)、(C)、(AB)、(BC)で
ある。
【0045】この複合語の展開は、前記図7の修正モー
ド画面で、メニューに含まれている複合語展開形選択モ
ード(図示せず)を選択し、図9に示す展開形選択画面
に移行することにより自動的に行うことが可能となって
いる。
【0046】図9は、展開形選択画面を模式的に示した
もので、複合語、展開形、個数、メニューの各表示エリ
アに区切られており、複合語表示エリアには前記ステッ
プ216で分割位置が確定した複合語のみが、又、展開
形表示エリアには、各複合語の派生語がそれぞれ一覧表
示され、個数表示エリアにはテキストデータ中に実際に
でてきた数が表示されている。
【0047】この派生語は、他の検索語候補と同様に、
その読みと共に、各複合語についてキーワード辞書に登
録されており、この辞書からキーワードデータに、その
作成時に取込まれており、この展開形を選択すると自動
的に展開表示されるようになっている。
【0048】ディスプレイ上に展開表示された派生語の
中から検索語として相応しいものを選択し、それをもキ
ーワードとして確定する(ステップ220)。
【0049】ここで派生語を選択する場合、メニューの
修正モードを選択して以下の修正(選択作業)を、複合
語表示エリア及び展開形表示エリアのいずれでも行うこ
とができる。
【0050】(1)削除 メニューで削除モードを選択し、派生語を1回タッチす
るとその派生語を削除できる。
【0051】(2)追加 メニューの追加モードを選択し、必要な派生語が表示さ
れていない場合に、複合語表示エリアの分割単語を1回
タッチするとそれを派生語として展開形表示エリアに追
加でき、又、複合語が前記「A/B/C」で、分割単語
を組合せた、例えば(BC)が派生語として表示されて
いない場合には、B、Cの各単語にそれぞれ1回ずつタ
ッチすることにより展開形表示エリアに(BC)を派生
語として追加することができる。
【0052】以上説明した派生語の削除、追加等の修正
作業により適切な派生語を選択できた後、それをキーワ
ードとして確定する。
【0053】前記ステップ220で全てのキーワードを
確定した後、前記図9の展開形選択画面で、メニューに
含まれているカナ修正モード(図示せず)を選択し、図
10に示すキーワード・カナ校閲・修正画面に移行し
て、以下に説明するカナの校閲・修正を行う(ステップ
222)。なお、図9の展開形選択画面からは、前記図
7の修正モード画面に戻ることもできる。
【0054】図10の表示画面には、キーワード、カ
ナ、個数及びメニューの各表示エリアが設けられてお
り、キーワード表示エリアには、前記ステップ216と
ステップ220の処理で確定した全キーワード(図では
キーワード1〜6と表記)が名寄せして一覧表示され、
カナ表示領域には確定したこれらキーワードについての
読みが表示されている。このカナは、前記キーワードデ
ータを作成する際に、キーワード辞書から取込まれてお
り、キーワードが確定するとそのキーワードに対して自
動的に振られ、表示されるようなっている。
【0055】ここで実行するカナの修正の例と、その方
法について説明する。このカナ修正は、キーワード自体
がカナ表記のものもあるので、キーワード表示エリア及
びカナ表示エリアのいずれでも行うことができるように
なっている。
【0056】カナ修正には、前記検索語候補の修正の場
合と同様に全削除、部分削除、付加があり、この修正は
検索語候補の場合と実質的に同一の操作で行うことがで
きる。このカナ修正には、これら修正モードの他に新規
追加モードと、コピーモードがある。
【0057】新規追加は、同一のキーワードに複数の読
みがある場合に行う修正であり、メニューの新規追加モ
ードを選択し、図9の表示画面でキーワード2とキーワ
ード5について示すように、カナ表示エリアにペンで他
の読みを入力して新しい読みの追加を行う。
【0058】コピーは、キーワード自体がカナ表記され
ている場合に行う修正であり、メニューのコピーモード
を選択し、キーワードを1回ペンでタッチすることによ
りそのままカナ表示エリアにそのキーワードをコピーす
ることにより読みとして入力する。
【0059】上述したステツプ222の校閲・修正処理
により、カナの修正が完了したら、カナを確定し(ステ
ップ224)、確定した前記キーワードとカナとを、例
えばフロッピー・ディスクに保存してキーワードの作成
が完了する(ステップ226)。
【0060】なお、図10のカナの校閲・修正画面から
は、図7の検索語候補の校閲・修正画面又は図9の展開
形選択画面に移れ、又、図7の画面からは図10の画面
へも移れるようになっている。
【0061】以上詳述した本実施例によれば、CD−R
OMに納めるキーワードを作成する際に、検索語候補と
して複合語が含まれている場合には、複合語自体をディ
スプレイに表示し、その分割位置を確定した後、該複合
語を派生語に展開し、その中から検索語として相応しい
ものを選択し、その派生語をキーワードとして確定する
ようにしたので、キーワード作成作業を効率よく行うこ
とが可能となる。
【0062】又、本実施例によれば、キーワードを確定
した後に、その確定したキーワードについてのみ読み
(カナ)を確定するようにしたので、この面でもキーワ
ード作成作業を効率良く行うことが可能となる。
【0063】図11は、本発明に係る第2実施例の校閲
・修正装置における、前記図7に相当する検索語候補の
校閲・修正画面を示すイメージ図である。本実施例の校
正・修正装置は、派生語を校閲・修正する際の判断を支
援するために用いる、複数の分割パターンを有する複合
語についてその分割パターンを表示する機能と、図12
のフローチャートに示す以下の機能を備えいてる以外
は、前記第1実施例のものと実質的に同一である。
【0064】図11の表示画面にはその上部に示すよう
に、本文、キーワード、修正結果、メニューの各表示エ
リアが設けられている。なお、後述するように、この表
示画面には検索語候補が全て表示されるので個数表示エ
リアはない。
【0065】本実施例では、図12に示したフローチャ
ートに従って、キーワードデータを入力し(ステップ3
10)、上記図11に示すようにキーワードデータをデ
ィスプレイに本文と対比させて表示する(ステップ31
2)。
【0066】上記図11に示すキーワード表示領域に
は、キーワード辞書を参照して抽出された検索語候補
が、文章等のテキストデータの始めから全て順番に表示
されると共に、本文表示エリアには、校閲・修正の対象
となっている検索語候補が含まれる本文個所が表示さ
れ、且つ該当する検索語候補が、他の文字部分から明確
に区別できるように、例えば明暗を反転させて表示され
るようになっている。従って、本文を参照して検索語候
補を校閲・修正できるため、その作業を正確に行うこと
ができる。
【0067】又、複合語は、キーワード表示エリアの3
行目に示すように分割位置が付されて表示されると同時
に、同4、5行目に示すように初めから派生語に展開さ
れて表示される。この分割位置や派生語に関する情報
は、キーワードデータ作成時にキーワード辞書から取り
込まれている。
【0068】又、キーワードデータ中に同一の検索語候
補が複数ある場合には、初回出現のものとその後に出現
するものとが区別して表示されるようになっており、
又、初回出現の検索語候補を修正すると、後出の同一検
索語候補についてもその修正内容が反映されるようにな
っている。
【0069】図13は、前記図11に模式的に示した校
閲・修正画面の具体例を示したものである。但し、複合
語の分割位置は●で、メニュー表示エリアは画面下端部
に示してある。
【0070】上記図11(図13も同じ)の表示画面で
実行する検索語候補の修正の種類には、前記第1実施例
の場合と同様に、(1)全削除、(2)部分削除余、
(3)付加、(4)複合語分割位置の修正、(5)複合
語第2分割位置の決定(6)別キーワードへの分割等の
各モードがあるが、前3者(全削除、部分削除、付加)
及び別キーワードへの分割は、キーワード表示エリアだ
けでなく本文表示エリアでも修正できるようになってい
る。又、ここで実行できる修正には、新規追加があり、
メニューの新規追加モードを選択し、本文表示エリアで
本文中に存在するキーワードにしたい文字列の始めの文
字と終りの文字を1回ずつタッチするか、又は、キーワ
ード表示エリアでペンで入力することにより、キーワー
ドを追加することができるようになっている。
【0071】上記校閲・修正時に、複合語の分割位置を
修正し、決定する場合、分割位置の整合をとるために、
そのチェックを行う場合には、メニューの分割整合チェ
ックモード(図示せず)を選択し、ディスプレイ上に図
14に示すような複合語分割位置整合チェック一覧(分
割パターン)を表示させ、この一覧を参照しながら他の
同一複合語との分割位置の整合をとることが可能となっ
ている。この分割位置整合チェック一覧には、複数の分
割方法がある複合語だけが、その異なる分割位置を付し
た分割パターンとして表示されるようになっている。こ
の図14の画面からは、メニューで「戻る」を選択する
と、前記図11の校閲・修正画面に戻れるようになって
いる。
【0072】以上の操作により、複合語及び派生語を含
む全ての検索語候補について修正が終ったら、それをキ
ーワードとして確定する(ステップ316)。
【0073】上記ステップ316で、前記図11の校閲
・修正画面に表示されている検索語候補を適切に修正
し、それをキーワードとして確定した後、メニューのカ
ナ修正モードを選択すると、図15に示す前記図10に
相当するカナ修正画面に移行することができ、この画面
上で前記第1実施例のステップ222〜226と実質的
に同一の校閲・修正を行い、そのカナを確定し、キーワ
ードを作成する(ステップ318〜322)。なお、こ
の図15のキーワード表示エリアに表示されている複合
語(キーワード3に当る)の下に示した「展開」は、こ
の複合語を、その構成単語毎に展開して表示しているこ
とを表わしている。
【0074】以上詳述した如く、本実施例においても、
前記第1実施例の場合と同様に、複合語と派生語とを簡
単な操作でキーワードとして確定できるので、同様に効
率良くキーワードを作成することが可能となり、更に分
割パターンが複数ある複合語が存在する場合でも正確に
分割位置を確定することが可能となる。
【0075】以上、本発明について、具体的に説明した
が、本発明は、前記実施例に示したものに限られるもの
でなく、その要旨を逸脱しない範囲で種々変更可能であ
る。
【0076】例えば、前記実施例では、校閲・修正装置
としてペンコンピュータを使用する場合を示したが、こ
れに限らず、他のコンピュータを使用しても、又は専用
機としてもよい。
【0077】又、前記図12の複合語分割位置整合チェ
ック一覧を表示し、複合語の分割位置の整合をとる操作
は、前記第2実施例に限らず、第1実施例で実行するよ
うにしても良い。
【0078】
【発明の効果】以上説明したとおり、本発明によれば、
CD−ROM用キーワードを作成する際に、検索語候補
として含まれる複合語をキーワードとして確定すると共
に、該複合語を展開して得られる派生語をもキーワード
として確定する作業を簡単に且つ正確に行うことができ
るので、キーワードを効率良く作成することが可能とな
り、負荷を軽減することが可能となる。
【図面の簡単な説明】
【図1】本発明にかかる第1実施例のキーワード作成シ
ステムの概略構成を示す説明図
【図2】第1実施例におけるキーワードデータの作成手
順を示すフローチャート
【図3】第1実施例でキーワードデータからキーワード
を作成するまで手順を示すフローチャート
【図4】キーワード辞書を参照して検索語候補を抽出す
る処理を概念的に示す説明図
【図5】キーワード辞書の内容の一例を示す説明図
【図6】第1実施例のキーワード校閲・修正装置を示す
概略斜視図
【図7】第1実施例の検索語候補の校閲・修正画面を示
す概念図
【図8】一覧表示された検索語の一例を示す説明図
【図9】複合語の展開形選択画面を示す概念図
【図10】第1実施例のカナの校閲・修正画面を示す概
念図
【図11】本発明にかかる第2実施例における検索語候
補の校閲・修正画面を示す概念図
【図12】第2実施例でキーワードデータからキーワー
ドを作成するまで手順を示すフローチャート
【図13】図11に示した検索語候補の校閲・修正画面
の具体例を示す説明図
【図14】複合語の分割位置整合チェック一覧画面を示
す概念図
【図15】第2実施例のカナの校閲・修正画面を示す概
念図
【図16】CD−ROM用キーワード作成方法と、その
使い方を示す概念図
【符号の説明】
10…装置本体 12…ディスプレイ 14…ペン 16…フロッピーディスク

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】CD−ROM用の検索語になる可能性のあ
    る名詞と、その読みとが登録されたキーワード辞書を参
    照して、CD−ROM用テキストデータから抽出した検
    索語候補と、キーワード辞書から読み込んだ該検索語候
    補の読みとを含むキーワードデータをディスプレイに表
    示し、該ディスプレイ上でキーワードデータを校閲・修
    正して検索語として相応しいキーワードを作成するキー
    ワード作成装置であって、 検索語候補が、複数の単語に分割できる複合語である場
    合、該複合語の分割位置を校閲・修正して確定する機能
    と、 分割位置が確定した複合語を、該複合語に含まれる派生
    語に展開する機能と、 展開された派生語から検索語として相応しいものを選択
    し、それをキーワードとして確定する機能と、を有する
    ことを特徴とするキーワード作成装置。
  2. 【請求項2】請求項1において、 複合語を、その分割位置を明示して、他の検索語候補と
    共に、ディスプレイ上に名寄せ一覧表示する機能が設け
    られることを特徴とするキーワード作成装置。
  3. 【請求項3】CD−ROM用の検索語になる可能性のあ
    る名詞と、その読みとが登録されたキーワード辞書を参
    照して、CD−ROM用テキストデータから抽出した検
    索語候補と、キーワード辞書から読み込んだ該検索語候
    補の読みとを含むキーワードデータをディスプレイに表
    示し、該ディスプレイ上でキーワードデータを校閲・修
    正して検索語として相応しいキーワードを作成するキー
    ワード作成装置であって、 検索語候補が、複数の単語に分割できる複合語である場
    合、該複合語を、単語で構成される派生語に展開して表
    示する機能と、 展開された派生語を校閲・修正してキーワードとして確
    定する機能と、を有することを特徴とするキーワード作
    成装置。
  4. 【請求項4】請求項1において、 検索語候補を、該検索語候補が含まれている本文と対比
    させて表示する機能が設けられていることを特徴とする
    キーワード作成装置。
  5. 【請求項5】請求項1又は3において、 派生語を校閲・修正する際の判断を支援するために、複
    数の分割パターンを有する複合語についてその分割パタ
    ーンを表示する機能が設けられていることを特徴とする
    キーワード作成装置。
JP5284621A 1993-11-15 1993-11-15 キーワード作成装置 Pending JPH07141392A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5284621A JPH07141392A (ja) 1993-11-15 1993-11-15 キーワード作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5284621A JPH07141392A (ja) 1993-11-15 1993-11-15 キーワード作成装置

Publications (1)

Publication Number Publication Date
JPH07141392A true JPH07141392A (ja) 1995-06-02

Family

ID=17680837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5284621A Pending JPH07141392A (ja) 1993-11-15 1993-11-15 キーワード作成装置

Country Status (1)

Country Link
JP (1) JPH07141392A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03271962A (ja) * 1990-03-20 1991-12-03 Nec Corp 複合語抽出装置
JPH04330565A (ja) * 1990-11-22 1992-11-18 Dainippon Printing Co Ltd 自然言語処理システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03271962A (ja) * 1990-03-20 1991-12-03 Nec Corp 複合語抽出装置
JPH04330565A (ja) * 1990-11-22 1992-11-18 Dainippon Printing Co Ltd 自然言語処理システム

Similar Documents

Publication Publication Date Title
JP2773652B2 (ja) 機械翻訳装置
JPH0744638A (ja) 表データ検索装置
JPH05101054A (ja) 部品合成による文書作成支援システム
JPH08329108A (ja) テキストのハイパーテキスト化方法
JPH07141392A (ja) キーワード作成装置
JP3313483B2 (ja) キーワード作成装置
JPH04160473A (ja) 事例再利用型翻訳方法および装置
JP3313490B2 (ja) キーワード作成装置
JP3313482B2 (ja) キーワード作成装置
JP5016333B2 (ja) 文書作成支援装置及び文書作成支援プログラム
JPH07219962A (ja) キーワード作成装置
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP3841076B2 (ja) 作詞支援装置、作詞支援方法および記憶媒体
JP2958390B2 (ja) 情報検索装置および方法
JP2005031813A (ja) 抄録作成支援システム、プログラム、抄録作成支援方法及び特許文献検索システム並びにその検索方法
JPH1115826A (ja) 文書解析装置及び方法
JP3952009B2 (ja) 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム
JP2001155017A (ja) タグ付き文書作成装置およびそのプログラムを記録した記録媒体
Orduña et al. Philology and Technology in the Hesperia and AEHTAM Databanks
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP3425329B2 (ja) 離散表現辞書装置
JPH08185401A (ja) 文書検索装置
JPS6370372A (ja) 文書処理装置
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP2583898B2 (ja) 機械翻訳システムの後編集装置