JPH09190438A - 情報処理装置及びその方法 - Google Patents

情報処理装置及びその方法

Info

Publication number
JPH09190438A
JPH09190438A JP8003837A JP383796A JPH09190438A JP H09190438 A JPH09190438 A JP H09190438A JP 8003837 A JP8003837 A JP 8003837A JP 383796 A JP383796 A JP 383796A JP H09190438 A JPH09190438 A JP H09190438A
Authority
JP
Japan
Prior art keywords
additional information
word
color
article
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8003837A
Other languages
English (en)
Inventor
Michio Aizawa
道雄 相澤
Makoto Hirota
誠 廣田
Shiro Ito
史朗 伊藤
Shogo Shibata
昇吾 柴田
Takanari Ueda
隆也 上田
Yuji Ikeda
裕治 池田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP8003837A priority Critical patent/JPH09190438A/ja
Publication of JPH09190438A publication Critical patent/JPH09190438A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 新聞記事等のテキストデータをモニタ上に表
示した場合、全てのテキストデータが同色かつ同フォン
トによって表示されてしまうため、記事の内容が把握し
にくい。 【解決手段】 記事データベース101から記事データ
を読み出し、各文毎に形態素解析部102において解析
辞書103を参照して形態素解析を施して単語に分割す
る。このとき、解析辞書103に保持されている単語毎
の付加情報も付与する。そして、表示色設定部105に
おいて付加情報色対応表104を参照して付加情報に応
じた色を設定し、該色情報を色情報付き記事バッファ1
07に文字情報と共に格納する。そして、記事全てにつ
いて色情報付き記事バッファへの格納が終了すると、ビ
ューワプログラム106により該記事が色付きでモニタ
108に表示される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報処理装置及びそ
の方法に関し、例えば、文書情報を表示する情報処置装
置及びその方法に関する。
【0002】
【従来の技術】近年のパソコン通信技術やCD−ROM
等の大容量記憶デバイス等の発達により、新聞記事等、
従来印刷物として供給されていた情報が電子化されたデ
ータとして入手できる様になってきた。そして、ワープ
ロ等の情報処理装置におけるビューワ機能により、これ
ら新聞記事等の電子化データをコンピュータのモニタ上
に表示させて読むことが容易に可能となっている。
【0003】
【発明が解決しようとする課題】しかしながらこれらの
電子化されたデータは、特に新聞記等の場合大部分がテ
キストデータにより構成されているが、これらテキスト
データは、色やフォント等の属性情報が付加されていな
いプレーンテキストデータがほとんどであった。従っ
て、コンピュータのモニタ上に該テキストデータを表示
した場合、全てのテキストデータが同色かつ同フォント
によって表示されてしまうため、記事の内容が把握しに
くいという欠点があった。
【0004】本発明は上述した課題を解決するためにな
されたものであり、新聞等の電子化データを表示する際
に、記事の内容把握が容易に可能となる情報処理装置及
びその方法を提供することを目的とする。
【0005】
【課題を解決するための手段】上述した目的を達成する
ための一手段として、本発明の情報処理装置は以下の構
成を備える。
【0006】即ち、文書データを入力する入力手段と、
該文書データを単語に分割し、該単語毎に付加情報を付
与する解析手段と、前記単語毎に、前記付加情報に基づ
いた出力特性を設定する設定手段と、前記単語毎に、前
記設定された出力特性による出力を行う出力手段とを有
することを特徴とする。
【0007】例えば、前記出力手段は表示を行うことを
特徴とする。
【0008】例えば、前記解析手段は、形態素解析によ
って前記文書データを単語に分割することを特徴とす
る。
【0009】例えば、前記付加情報は名詞に対して付与
されることを特徴とする。
【0010】更に、形態素解析の際に参照される解析辞
書を有し、該解析辞書は、単語と前記付加情報との関係
を保持することを特徴とする。
【0011】更に、前記付加情報と出力特性との関係を
保持する保持手段を有することを特徴とする。
【0012】例えば、前記設定手段は、前記付加情報が
付与されていない単語に対しては出力特性を設定しない
ことを特徴とする。
【0013】例えば、前記出力特性は出力色であること
を特徴とする。
【0014】例えば、前記出力手段は色表示が可能であ
り、前記設定手段は、前記単語毎に前記出力手段に応じ
た色表示コマンドを生成することを特徴とする。
【0015】例えば、前記出力特性は出力文字フォント
であることを特徴とする。
【0016】また、上述した目的を達成するための一手
法として、本発明の情報処理方法は以下の工程を備え
る。
【0017】即ち、文書データを入力する入力工程と、
該文書データを単語に分割する分割工程と、該単語毎に
付加情報を付与する解析工程と、前記単語毎に、前記付
加情報に基づいた出力特性を設定する設定工程と、前記
単語毎に、前記設定された出力特性による出力を行う出
力工程とを有することを特徴とする。
【0018】
【発明の実施の形態】以下、本発明に係る一実施形態に
ついて、図面を参照して詳細に説明する。尚、本実施形
態においては、電子化された新聞記事を閲覧可能な情報
処理装置を例として説明する。
【0019】図1は、本実施形態にかかる情報処理装置
の構成を示すブロック図である。図1において、101
は電子化された新聞記事等を格納している記事データベ
ースである。102は、新聞記事内容に対して形態素解
析を行い、記事を構成する各文を単語に分割する形態素
解析部である。
【0020】103は、形態素解析部102が解析時に
参照する解析辞書である。この解析辞書103には、各
名詞に対して、該名詞が属する群情報を付加情報として
保持している。これは固有名詞についても同様である。
例えば、「A社」という固有名詞に対しては「会社名」
という付加情報が、「プリンタ」という名詞には「製品
名」という付加情報が予め保持されている。以下、本実
施形態においては説明の簡便のため、付加情報として、
「会社名」,「製品名」,「日付」を用いる例について
説明する。
【0021】104は、上述した付加情報を有する単語
(名詞)を表示する際の色情報を保持している付加情報
色対応表である。付加情報色対応表104の内容の例を
図3に示す。図3の例によれば、形態素解析部102に
おける形態素解析の結果、付加情報「会社名」に対応す
る名詞は「赤」で、「製品名」に対応する名詞は「緑」
で、「日付」に対応する名詞は「青」で表示すべきであ
ることが示されている。
【0022】また、105は記事中の単語毎に表示色を
設定する色表示設定部、106は電子化された新聞記事
等をモニタ108上に表示するビューワプログラム、1
07は表示色設定部105で設定された色情報付き記事
を記憶する色情報付き記事バッファである。108は、
実際に記事を表示するCRT等のモニタであり、109
は他装置との通信を制御するモデムである。
【0023】また、110はシステムバス111を介し
て上述した全構成を制御する制御部であり、CPU及び
ROM,RAMを含み、CPUがROMに予め格納され
た制御プログラムに従い、RAMを作業領域として各種
制御を行う。尚、例えばビューワプログラム106が制
御部110内のROMに格納されていても良い。
【0024】図2に、本実施形態における表示処理のフ
ローチャートを示す。尚、該フローチャートに示す表示
処理は、制御部110内のROMに格納された制御プロ
グラムがCPUで実行されることにより実現される。
【0025】まずステップS1において、記事データベ
ース101から閲覧対象の記事を検索して取り出す。そ
してステップS2では、ステップS1で取り出した記事
の先頭から順に1文づつ切り出し、ステップS3で文の
切り出しに成功したと判断された場合はステップS4へ
進むが、文の切り出しが記事の終わりまで進み、切り出
しができなかった場合にはステップS10へ進む。
【0026】ステップS4においては、ステップS2で
切り出した文に対して形態素解析部102で解析辞書1
03を参照して形態素解析を行い、文を単語に分割す
る。そして、やはり解析辞書103を参照して、各単語
毎に付加情報を付与する。この時、文中の数詞を処理す
る数詞処理を行うことにより、例えば日付等、数を示す
名詞を作成する。例えば、「A会社は3月3日に新型の
プリンタを発売した。」という文について考えると、ま
ず形態素解析によって単語に分割した後、数詞処理によ
って数詞「3」,助数詞「月」,数詞「3」,助数詞
「日」より、名詞「3月3日」を作成する。この数詞処
理において、作成された名詞に助数詞の「年」,
「月」,「日」等が含まれている場合には、該名詞に付
加情報として「日付」を付加する。
【0027】ここで、形態素解析部102における形態
素解析及び数詞処理を行なった結果を、図4に示す。
尚、例文は上述した通りである。図4において、固有名
詞「A社」と名詞「プリンタ」には、それぞれ付加情報
として「会社名」及び「製品名」が付されているが、こ
れは解析辞書103を参照することによって付加された
ものである。一方、名詞「3月3日」の付加情報「日
付」は、上述したように数詞処理において付加されたも
のである。
【0028】形態素解析が終了すると次にステップS5
に進み、解析した文の先頭から順に単語を取り出す。そ
してステップS6で単語が取り出せたと判断された場合
はステップS7へ進むが、単語の取り出しが文の終わり
まで進み、取り出しができなかった場合にはステップS
2に戻って次の文の処理を開始する。
【0029】ステップS7においては、ステップS5で
取り出した単語の付加情報が、図3に示すような付加情
報色対応表104に含まれているか否かを調べる。付加
情報が付加情報色対応表104に含まれていた場合には
処理はステップS8へ進み、表示色設定部105におい
て付加情報色対応表104に基づいて当該単語を表示す
べき色を調べ、該色付きで表示するための制御コマンド
(色情報)を作成する。そしてステップS9において、
該単語の表記(文字コード)と共に該色情報を色情報付
き記事バッファ107へ追加格納する。尚、色付きで表
示するための制御コマンドは、使用するビューワプログ
ラム106に依存する。
【0030】一方、ステップS7において該単語の付加
情報が付加情報色対応表104に含まれていなかった
り、又は単語に付加情報がなかった場合には、ステップ
S9において該単語の表記(文字コード)のみを色情報
付き記事バッファ107へ追加格納する。
【0031】ステップS9における色情報付き記事バッ
ファへの格納処理が終了すると処理はステップS4へ戻
り、次の単語の処理を開始する。
【0032】以上説明したステップS2〜S9までの処
理がステップS1で取り出した記事の全体に亙って終了
すると、上述した様にステップS10へ進み、色情報付
き記事バッファ107に格納された内容をビューワプロ
グラム106へ渡す。即ち、制御部110においてビュ
ーワプログラムをRAMに読み込み、CPUが実行する
ことにより、色付きの記事がモニタ108上に表示され
る。
【0033】ここで、簡単のため例えば「単語」という
単語を「赤」色で表示するための制御コマンドが(単
語,赤)で示されるとすると、記事データベース101
から取り出した文「A社は3月3日に新型のプリンタを
発売した。」に対する色情報付き記事バッファ107に
格納される内容は、「(A社,赤)は(3月3日,青)
に新型の(プリンタ,緑)を発売した。」となる。そし
て、該文がビューワプログラムに従ってモニタ108に
表示されると、例えば図5に示すように「A社」が
「赤」色で、「3月3日」が「青」色で、「プリンタ」
が「緑」色でという様に、各付加情報毎に色分けされた
状態で色付き表示される。
【0034】以上説明した様に本実施形態によれば、記
事中の名詞にその属性に応じた付加情報を付与し、該付
加情報に応じた色で該名詞を表示することができるた
め、操作者が該記事を閲覧する際に所望する分野の単語
を非常に視認し易くなり、効率的な閲覧が可能となる。
【0035】尚、本実施形態においては記事データベー
ス101から記事データを取り出す例について説明を行
ったが、本発明はこの例に限定されず、例えば他装置か
ら送信されてくる記事データをモデム109を介して受
信することにより、リアルタイムに取り出してもよい。
【0036】また、本実施形態においては単語の付加情
報に応じて文字の表示色を変えたが、これに限らず、例
えば文字サイズ等、付加情報に応じて文字属性を変更す
る処理であれば同様の効果が得られる。もちろん、付加
情報に応じて2つ以上の文字属性(色とサイズ等)を同
時に変更しても良い。
【0037】また、本実施形態においては付加情報が
「会社名」,「製品名」,「日付」である全ての単語に
ついてその文字の色を変える例について説明したが、記
事中に同一の単語が複数個含まれている場合には、最初
の単語のみを文字色を変えて表示し、2番目以降は文字
色を変えないように制御することも可能である。
【0038】また、付加情報を名詞に対して付与する例
について説明したが、もちろん動詞や他の単語に対して
も同様に付加情報を付与して表示色やサイズ等を変更す
ることも可能である。
【0039】また、本実施形態においては記事データを
最終的にモニタ108に表示する例について説明した
が、もちろんプリンタ等により記録用紙上に印刷出力す
ることも可能である。
【0040】<他の実施形態>尚、本発明は、複数の機
器(例えばホストコンピュータ,インタフェース機器,
リーダ,プリンタ等)から構成されるシステムに適用し
ても、1つの機器からなる装置(例えば、複写機やファ
クリミリ装置等)に適用しても良い。
【0041】また、本発明の目的は、上述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、該
システム或は装置のコンピュータ(又はCPUやMPU
等)が記憶媒体に格納されたプログラムコードを読み出
し、実行することによっても達成できることは言うまで
もない。即ち、ビューワプログラム106や制御部11
0内のROMに格納された制御プログラム等が記憶媒体
に保持されていても良い。
【0042】この場合、記憶媒体から読み出されたプロ
グラムコード自体が上述した実施形態の機能を実現する
ことになり、該プログラムコードを格納した記憶媒体は
本発明を構成することになる。
【0043】尚、プログラムコードを供給するための記
憶媒体としては、例えばフロッピディスク,ハードディ
スク,光ディスク,光磁気ディスク,CD−ROM,C
D−R,磁気テープ,不揮発性のメモリカード,ROM
等を用いることができる。
【0044】また、コンピュータが読み出したプログラ
ムコードを実行することにより、上述した実施形態の機
能が実現されるだけでなく、該プログラムコードの指示
に基づき、コンピュータ上で稼動しているOS等が実際
の処理の一部又は全部を行い、その処理によって上述し
た実施形態の機能が実現される場合も含まれることは言
うまでもない。
【0045】更に、記憶媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書き込まれた後、該プログラムコードの指示に
基づき、該機能拡張ボードや機能拡張ユニットに備わる
CPU等が実際の処理の一部又は全部を行い、その処理
によって上述した実施形態の機能が実現される場合も含
まれることは言うまでもない。
【0046】本発明を上記記憶媒体に適用する場合、該
記憶媒体には、先に説明した図2に示すフローチャート
に対応するプログラムコードを格納することになるが、
簡単に説明すると、図6のメモリマップ例に示す各モジ
ュールを記憶媒体に格納することになる。即ち、少なく
とも「記事入力モジュール」,「形態素解析モジュー
ル」及び「色情報付与モジュール」等の各モジュールの
プログラムコードを記憶媒体に格納すれば良い。
【0047】
【発明の効果】以上説明したように本発明によれば、新
聞記事等のデータに対して形態素解析を行って単語に分
割し、該単語に付加情報を付すことによって、例えば文
字色やサイズ等の表示属性を変更することができる。従
って、表示された記事の内容の把握が容易になり、特に
大量の記事から操作者の視認によって目的の記事を検索
する場合等に、顕著な効果が得られる。
【0048】
【図面の簡単な説明】
【図1】本発明の一実施形態における情報処理装置の構
成を示すブロック図である。
【図2】本実施形態における表示処理を示すフローチャ
ートである。
【図3】本実施形態における付加情報色対応表の例を示
す図である。
【図4】本実施形態における形態素解析結果の例を示す
図である。
【図5】本実施形態における表示例を示す図である。
【図6】本実施形態における表示処理を実現するプログ
ラムのメモリマップ例を示す図である。
【符号の説明】
101 記事データベース 102 形態素解析部 103 解析辞書 104 付加情報色対応表 105 表示色設定部 106 ビューワプログラム 107 色情報付き記事バッファ 108 モニタ 109 モデム 110 制御部
フロントページの続き (72)発明者 柴田 昇吾 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 上田 隆也 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 文書データを入力する入力手段と、 該文書データを単語に分割し、該単語毎に付加情報を付
    与する解析手段と、 前記単語毎に、前記付加情報に基づいた出力特性を設定
    する設定手段と、 前記単語毎に、前記設定された出力特性による出力を行
    う出力手段と、を有することを特徴とする情報処理装
    置。
  2. 【請求項2】 前記出力手段は、表示を行うことを特徴
    とする請求項1記載の情報処理装置。
  3. 【請求項3】 前記解析手段は、形態素解析によって前
    記文書データを単語に分割することを特徴とする請求項
    1記載の情報処理装置。
  4. 【請求項4】 前記付加情報は名詞に対して付与される
    ことを特徴とする請求項1記載の情報処理装置。
  5. 【請求項5】 更に、形態素解析の際に参照される解析
    辞書を有し、 該解析辞書は、単語と前記付加情報との関係を保持する
    ことを特徴とする請求項1記載の情報処理装置。
  6. 【請求項6】 更に、前記付加情報と出力特性との関係
    を保持する保持手段を有することを特徴とする請求項1
    記載の情報処理装置。
  7. 【請求項7】 前記設定手段は、前記付加情報が付与さ
    れていない単語に対しては出力特性を設定しないことを
    特徴とする請求項1記載の情報処理装置。
  8. 【請求項8】 前記出力特性は出力色であることを特徴
    とする請求項1乃至7のいずれかに記載の情報処理装
    置。
  9. 【請求項9】 前記出力手段は色表示が可能であり、 前記設定手段は、前記単語毎に前記出力手段に応じた色
    表示コマンドを生成することを特徴とする請求項8記載
    の情報処理装置。
  10. 【請求項10】 前記出力特性は出力文字フォントであ
    ることを特徴とする請求項1乃至7のいずれかに記載の
    情報処理装置。
  11. 【請求項11】 文書データを入力する入力工程と、 該文書データを単語に分割する分割工程と、 該単語毎に付加情報を付与する解析工程と、 前記単語毎に、前記付加情報に基づいた出力特性を設定
    する設定工程と、 前記単語毎に、前記設定された出力特性による出力を行
    う出力工程と、を有することを特徴とする情報処理方
    法。
JP8003837A 1996-01-12 1996-01-12 情報処理装置及びその方法 Withdrawn JPH09190438A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8003837A JPH09190438A (ja) 1996-01-12 1996-01-12 情報処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8003837A JPH09190438A (ja) 1996-01-12 1996-01-12 情報処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH09190438A true JPH09190438A (ja) 1997-07-22

Family

ID=11568307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8003837A Withdrawn JPH09190438A (ja) 1996-01-12 1996-01-12 情報処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH09190438A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6825849B1 (en) 1999-09-06 2004-11-30 Sharp Kabushiki Kaisha Method and apparatus for presenting information in accordance with presentation attribute information to control presentation thereof
EP1568199A1 (de) * 2002-10-23 2005-08-31 Vodafone Holding GmbH Kolorieren von digitalen text- und/oder bildelementen
WO2010038540A1 (ja) * 2008-10-02 2010-04-08 インターナショナル・ビジネス・マシーンズ・コーポレーション テキストセグメントを有する文書から用語を抽出するためのシステム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6825849B1 (en) 1999-09-06 2004-11-30 Sharp Kabushiki Kaisha Method and apparatus for presenting information in accordance with presentation attribute information to control presentation thereof
EP1568199A1 (de) * 2002-10-23 2005-08-31 Vodafone Holding GmbH Kolorieren von digitalen text- und/oder bildelementen
JP2006505808A (ja) * 2002-10-23 2006-02-16 ボーダフォン・ホールディング・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング デジタルのテキスト要素および/または画素の着色
WO2010038540A1 (ja) * 2008-10-02 2010-04-08 インターナショナル・ビジネス・マシーンズ・コーポレーション テキストセグメントを有する文書から用語を抽出するためのシステム
JP5106636B2 (ja) * 2008-10-02 2012-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション テキストセグメントを有する文書から用語を抽出するためのシステム
US8463794B2 (en) 2008-10-02 2013-06-11 International Business Machines Corporation Computer system, method, and computer program for extracting terms from document data including text segment
KR101498331B1 (ko) * 2008-10-02 2015-03-03 인터내셔널 비지네스 머신즈 코포레이션 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템
US9043339B2 (en) 2008-10-02 2015-05-26 International Business Machines Corporation Extracting terms from document data including text segment

Similar Documents

Publication Publication Date Title
US6533822B2 (en) Creating summaries along with indicators, and automatically positioned tabs
JPS6283787A (ja) 表示画面の出力制御方式
JPH09190438A (ja) 情報処理装置及びその方法
JPH05135025A (ja) 文書編集装置
JPH0438005B2 (ja)
JPH06227078A (ja) 定型紙印刷用プリンタ装置
JP3080891B2 (ja) 帳票処理装置
JPH06325034A (ja) 情報処理装置
JPH08161350A (ja) 電子ファイリング方法および装置
JP3451289B2 (ja) 表出力装置
JPH02289368A (ja) 印刷方法
JPH07152548A (ja) 文書作成装置
Eisenberg In-house typesetting on a tight budget
JPH0721189A (ja) 翻訳支援装置
JPH04313144A (ja) 文書作成装置
JPS62284458A (ja) 文書作成支援装置
JPH04361362A (ja) 文書作成装置
JPH03147017A (ja) 画像処理装置
JPH01129352A (ja) プレゼンテーション資料作成装置
JPH07146866A (ja) 編集装置
JPH07146865A (ja) 編集装置
JPH03280153A (ja) 情報処理装置
JPH05274311A (ja) 文書作成装置及び方法
JPH04245327A (ja) 処理フロー作図装置
JPH096783A (ja) 索引作成装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030401