JP2001034611A - 読み情報出力装置および記録媒体 - Google Patents

読み情報出力装置および記録媒体

Info

Publication number
JP2001034611A
JP2001034611A JP2000124857A JP2000124857A JP2001034611A JP 2001034611 A JP2001034611 A JP 2001034611A JP 2000124857 A JP2000124857 A JP 2000124857A JP 2000124857 A JP2000124857 A JP 2000124857A JP 2001034611 A JP2001034611 A JP 2001034611A
Authority
JP
Japan
Prior art keywords
word
information
reading information
level
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000124857A
Other languages
English (en)
Inventor
Sadamichi Matsumoto
定道 松本
Narimasa Suzuki
成将 鈴木
Tomokatsu Yanagida
智克 柳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000124857A priority Critical patent/JP2001034611A/ja
Publication of JP2001034611A publication Critical patent/JP2001034611A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文章を理解しやすくさせるために利用者に応
じた読み情報を出力する装置、該装置(コンピュータ)
に読み情報を出力させるためのプログラムを記録した記
録媒体を提供することを目的とする。 【解決手段】 文および指定レベルを入力し、前記入力
文の各文字のレベルを判断し、前記指定レベルと所定関
係のレベルである文字を含む前記入力文中の単語を特定
し、前記特定された単語の読み情報を出力するよう構成
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文章に付加する読み
情報を出力する技術に関する。
【0002】例えば、文章をデータとして扱う装置、シ
ステムとして、スタンドアロンやネットワーク環境で利
用されるワードプロセッサやデータベースシステムなど
が知られており、それらにおいては文章を画面上に表示
させる、またはプリンタに印刷するなどの処理が行われ
ている。
【0003】それら装置、システムは児童から社会人ま
で様々な知識レベルをもった人に使用されるものであ
り、利用者の知識レベルにあった使用を可能にすること
で効率的な利用ができることが望まれている。
【0004】特に、文章が漢字かな混じり文であって利
用者が児童の場合、利用者の学年によってその文章中に
含まれる漢字の読みがわからず文章内容を把握すること
が困難になってしまう。
【0005】
【従来の技術】与えられた文章にふりがなを付与する公
知技術として、特開昭62?233878号公報があ
る。
【0006】この公報においては、漢字かな混じり文字
列を入力し、該漢字かな混じり文字列に含まれるすべて
の漢字について該漢字の学習レベルを判定し、前記判定
された学習レベルと予め設定された漢字レベルとを比較
し、予め設定されたふりがな付与条件に従ってふりがな
を付与して出力することが開示されている。
【0007】また、漢字かな混じり文字列中の単語を特
定するために単語辞書を用いている。
【0008】
【発明が解決しようとする課題】上記公報の開示技術で
は、単語を構成する各漢字がそれぞれ所望の漢字レベル
にあっていない場合に該単語を構成する全漢字にふりが
なが付与されることになる。しかし、単語を構成する漢
字であって、ある漢字が所望の漢字レベルにあってお
り、他の漢字が所望の漢字レベルにあっていない場合に
は、所望の漢字レベルにあっていない漢字に対してしか
ふりがなが付与されない。
【0009】例えば、文字列「問答」を構成する漢字
「問」、「答」のそれぞれが所望の漢字レベルにあって
いない場合には「問答(モンドウ)」として出力される
が、「答」のみが所望の漢字レベルにあっている場合に
は「問(モン)答」として出力されてしまう。他方、
「問」のみが所望の漢字レベルにあっている場合には
「問答(ドウ)」として出力されてしまう。
【0010】このような形式で漢字かな混じり文字列に
ふりがなが付与されて出力されると、利用者に単語の読
みを理解しづらくし、漢字かな混じり文字列である文章
全体を理解しづらくする原因となる。
【0011】また、利用者が読めない漢字を読めるよう
にするためにふりがなを付与するにも関わらず、上記形
式での出力のため、利用者は「問答」の読みを「モンド
ウ」と理解すべきところを「ドウ」と理解してしまい、
ふりがなが付与された単語の読みを誤って学習してしま
う原因ともなる。
【0012】本発明は、文章を理解しやすくさせるため
に利用者に応じた情報を出力する装置、該装置(コンピ
ュータ)にその情報を出力させるプログラムを記録した
記録媒体を提供することを目的とする。また、文章を理
解しやすくさせるために利用者に応じた読み情報を出力
する装置、該装置(コンピュータ)にその読み情報を出
力させるプログラムを記録した記録媒体を提供すること
を目的とする。
【0013】
【課題を解決するための手段】本発明は、好ましくは、
文および指定レベルを入力し、前記入力文の各文字のレ
ベルを判断し、前記指定レベルと所定関係のレベルであ
る文字を含む前記入力文中の単語を特定し、前記特定さ
れた単語の読み情報を出力するよう構成することにより
上記課題を解決する。
【0014】この構成により、単語を構成する文字のい
ずれかが指定レベルと所定関係のレベルにあるときは、
該単語を構成する他の文字も含めて読み情報が出力され
る。
【0015】また、好ましくは、形態素解析により前記
入力文を単語単位に分解するよう構成してもよい。
【0016】この構成により、入力文は正しく単語に分
解され、分解された単語毎に読み情報を出力すべきか否
かが判断される。
【0017】また、好ましくは、前記単語の特定する処
理の際に前記入力文中の該単語の位置情報を特定し、該
特定された単語の読み情報と該単語の位置情報との対応
を出力するよう構成してもよい。
【0018】この構成により、出力された読み情報を入
力文中のどの単語に対して付与すべきか判断できる。
【0019】また、好ましくは、前記単語の位置情報に
基づき、前記文に前記単語の読み情報を付加して出力さ
せるよう構成してもよい。
【0020】この構成により、文中の単語とその読みが
該単語の読みとして理解しやすく出力(例えば、表示)
できる。
【0021】また、好ましくは、複数の出力形式からい
ずれかの出力形式を設定できるようにし、前記設定され
た出力形式に応じて前記単語の読み情報を出力させるよ
う構成してもよい。
【0022】この構成により、利用者は自身にとって最
適な出力形式で入力文およびその読みを閲覧することが
可能となる。
【0023】また、好ましくは、出力された読み情報を
保持しておき、再度前記入力文が処理対象となる場合に
前記保持されている読み情報を出力させるよう構成して
もよい。
【0024】この構成により、同じ文が入力された場合
に、既に生成している読み情報を再利用することが可能
となり、入力文に対応する読みを出力するまでの処理時
間を短縮することができる。
【0025】また、好ましくは、複数の出力形式からい
ずれかの出力形式を設定できるようにし、出力形式の変
更設定に応じて前記保持されている読み情報を当該出力
形式で出力させるよう構成してもよい。
【0026】これにより、出力された読み情報をさらに
有効に利用することが可能となる。
【0027】以上の本発明の構成は、上記処理を実行す
る装置、上記処理をコンピュータ(装置)に実行させる
プログラムを記録したコンピュータ読取可能な記録媒体
で実現できる。
【0028】
【発明の実施の形態】以下に本発明の実施の形態を説明
する。
【0029】図1は、本発明をネットワーク環境で実施
するときのシステム構成図である。
【0030】図1中、1はネットワーク、2および3は
クライアント(端末)、4および5はサーバを示す。こ
こで、ネットワーク1は電話回線網やLAN(ローカル
エリアネットワーク)、インターネットなどであり、ク
ライアント2,3はパーソナルコンピュータやワークス
テーションなどの公知の構成をもつコンピュータであ
る。また、サーバ4,5もワークステーションやパーソ
ナルコンピュータなどの公知の構成をもつコンピュータ
である。
【0031】以下に図1のシステム構成における第一の
実施形態を示し、例えば、サーバ4,5は文章を含むデ
ータを蓄積し、クライアント2,3からの要求に基づき
蓄積データから該要求に合致するデータを検索し、検索
結果をクライアントに2,3に通知する処理を行うもの
とする。
【0032】この第一の実施形態においては、サーバ
4,5に、クライアント2,3からの要求により検索さ
れた蓄積データの読み情報を出力する処理およびそれら
蓄積データと読み情報とを所定のフォーマットで表示さ
せる処理を実行させる。
【0033】次に、上記クライアント2,3やサーバ
4,5であるコンピュータのハードウェア構成について
説明する。
【0034】図2はコンピュータのハードウェア構成を
示す図である。
【0035】このコンピュータのハードウェアは図2に
示されるように、CPU10、ROM11、RAM1
2、ハードディスクドライブ(HDD)13、フロッピ
ーディスクドライブ(FDD)14、CD?ROMドラ
イブ15、グラフィックボード16、ネットワークカー
ドやモデムなどの通信制御装置17、インターフェース
(I/F)18,19で構成される。
【0036】また、そのグラフィックボード16にはデ
ィスプレイ5が接続され、通信制御装置17には通信線
が接続され、インターフェース18,19にはそれぞれ
キーボード21,マウス22が接続される。
【0037】ROM11には起動用プログラムが記憶さ
れており、電源投入時にCPU10により実行され、例
えば、ハードディスクドライブ13に記憶されているオ
ペレーティングシステム,表示や通信処理のための各種
ドライバなどをRAM12にロードして各種処理や制御
を実行可能な状態にするものである。
【0038】RAM12は、コンピュータを制御するプ
ログラムが展開され、プログラムによる処理結果や処理
のための一時的データおよびディスプレイ20の画面上
に表示するために展開されるデータを保持するために使
用される。RAM12に展開された表示用データはグラ
フィックボード16を介してディスプレイ20の画面上
に表示される。
【0039】ハードディスクドライブ13およびフロッ
ピィディスクドライブ14は、プログラムや制御デー
タ、および作成された文書やイメージデータをそれぞれ
に対応する記録媒体(ハードディスクやフロッピィディ
スク)に記録するためのデバイスである。
【0040】CD?ROMドライブ15は、CD?RO
M24に記録されているデータやプログラムの読み取り
に用いられる。
【0041】通信制御装置17は、通信線により他の装
置とのデータのやり取り、プログラムのダウンロードを
行うために使用される。
【0042】キーボード21は複数の文字キーや矢印キ
ーからなり、各種データの入力を行うために用いられ、
マウス22はディスプレイ20の画面上に表示されたマ
ウスカーソルでの選択指示に用いられる。
【0043】本発明の処理をコンピュータに実行させる
ためのプログラムは、フロッピー(登録商標)ディスク
ドライブ14またはCD?ROMドライブ15によりフ
ロッピーディスク23またはCD?ROM24から予め
ハードディスクドライブ13に格納されている。また、
通信制御装置17により通信線を介して該プログラムを
ハードディスクドライブ13に格納するようにしてもよ
い。
【0044】そして、上記プログラムは所定の指示によ
りRAM12にロードされ、コンピュータの各部を制御
して本発明の処理を実行させる。
【0045】次に、本発明の処理における特徴部分につ
いて説明する。
【0046】図3は本発明の第一の実施形態における処
理フローチャートを示す図である。
【0047】まず、読み情報の出力処理の対象となる文
章と指定レベルを入力する。(ステップS1) 次に、入力した文章を形態素に分解し、各形態素に含ま
れる漢字の読みを取得する。(ステップS2,S3) 各形態素の漢字の読みを取得した後、該漢字のレベル
(該漢字を学習する学年を示すレベル)とステップS1
で入力した指定レベルとの比較をし、形態素に含まれる
漢字のレベルが指定レベル以上であれば読み情報を出力
する漢字として特定する。(ステップS4) 上記ステップS4の処理により特定された漢字の読み情
報を該漢字の入力文章中の位置情報(出現位置)と共に
出力する。(ステップS5) 上記ステップS5により出力された各読み情報と位置情
報を用いて前記入力文章に処理を行い所定の表示フォー
マットのデータを生成し、該データにより画面上に文章
とその読み情報を表示する。(ステップS6) さらに、本発明の具体的な実施例について説明する。
【0048】図4は、本発明の一実施例を示す図であ
り、本発明の各処理を機能ブロックとして示している。
【0049】図4中、2,3および4,5は図1で示し
たクライアントおよびサーバであり、サーバ4,5はク
ライアント2,3から送信される要求と学年レベル(以
下、クライアント2,3から受信した学年レベルを指定
レベルと称する)を受信し、該要求と学年レベルを用い
て処理(本例では、主に検索処理と読み情報出力)を行
い、処理結果を要求元のクライアント2,3に返送す
る。そして、クライアント2,3はサーバ4,5からの
処理結果をその受信データに基づきディスプレイ画面上
に表示する。
【0050】サーバ4,5は、主に処理部31と読み情
報作成部33からなる。
【0051】処理部31は、データベース32を用いて
検索処理を行いクライアント2,3からの要求に合致す
るデータを取得し、読み情報作成部33に取得したデー
タ(文章)およびクライアント2,3から受信した指定
レベルを出力し、読み情報作成部33から入力した処理
結果である読み情報と位置情報を用いて所定のフォーマ
ットのデータを作成し、該データをクライアント2,3
へ要求に対する処理結果として返信する。
【0052】読み情報作成部33は、主に主制御部34
と形態素解析部35および学年別フィルタ37からな
る。
【0053】主制御部34は、処理部31から文章およ
び指定レベルを入力し、それらを用いて形態素解析部3
5および学年別フィルタ37を制御して入力した文章に
対する読み情報とその位置情報の作成を行う。
【0054】形態素解析部35は、形態素解析辞書36
を用いて主制御部34から入力した文章を単語単位に分
解し、分解した各単語および単語に含まれる漢字や記号
の読み情報を処理結果として主制御部34に出力する。
【0055】また、学年別フィルタ37は、学年別フィ
ルタ辞書38を用いて主制御部34から入力した文章の
各文字についてその学年レベルを判断する。そして、各
文字の学年レベルと主制御部34から入力した指定レベ
ルとの比較を行い、各文字を指定レベル以上の学年レベ
ルを持つ文字とそれ以外の文字に分類し、それを主制御
部34に処理結果として出力する。
【0056】以下、さらに具体例を用いて本実施例の処
理を説明する。
【0057】サーバ4,5は、クライアント2,3から
の要求に基づく処理部31の検索処理により処「漢字が
大好きだ」という文章を含む検索結果を取得し、また、
クライアント2,3から指定レベルとして「小学三年
生」を受信したとする。
【0058】処理部31は文章「漢字が大好きだ」と指
定レベル「小学三年生」を主制御部34に出力する。主
制御部34は文章「漢字が大好きだ」を形態素解析部3
6と学年別フィルタに出力する。
【0059】形態素解析部36においては、入力した文
章「漢字が大好きだ」について形態素解析辞書36を用
いて形態素解析を行う。この形態素解析辞書36は、文
章を形態素に分解するための各種辞書と単語の読み辞書
を含む。
【0060】形態素解析部36は、文章「漢字が大好き
だ」を形態素解析辞書36を用いて、「漢字」、
「が」、「大好き」、「だ」という各単語に分解し、そ
れらの読み情報と共に処理結果として主制御部34に出
力する。
【0061】この形態素解析部36においては、(1)
活用語の語幹と語尾や助詞もそれぞれ一まとめにする、
(2)直後に単位を伴う数字、例えば「1本」はそれら
を一まとめにする、(3)接頭語は直後の単語とまとめ
る、(4)接尾語は直後の単語とまとめる、(4)名詞
類が連続する場合、例えば「鋸を一時金物屋に預けて」
の「一時金物屋」のように、全てが漢字ならば一まとめ
にする、各処理を行い単語として出力する。
【0062】また、学年別フィルタ37においては、文
章「漢字が大好きだ」を構成する各文字である「漢」、
「字」、「が」、「大」、「好」、「き」、「だ」のそ
れぞれについて学習する学年レベルを学年別フィルタ辞
書38を用いて判断する。
【0063】この学年別フィルタ辞書38には、読みを
必要とする漢字や記号とそれを学習する学年との対応が
記録されている。
【0064】本実施例の文章「漢字が大好きだ」を構成
する「字」、「が」、「大」、「き」、「だ」に対して
「小学一年生」が対応して記録されており、「漢」に対
して「小学二年生」、さらに「好」に対して「小学三年
生」がそれぞれ対応して記録されていたとする。
【0065】学年別フィルタ37は上記学年別フィルタ
辞書38の記録内容に基づき、文章「漢字が大好きだ」
の各文字位置に対応するデータとして「000010
0」を主制御部34に処理結果として出力する。ここ
で、「0」は文字の学習レベルが指定レベル以上である
ことを示し、「1」は文字の学習レベルが指定レベルよ
り小であることを示す。
【0066】主制御部34は学年別フィルタ37から入
力したデータ「0000100」が示す各文字の学年レ
ベルから文章「漢字が大好きだ」の先頭から5桁目の文
字「好」が指定レベル以上であることを識別し、該文字
「好」を含む単語を形態素解析部35からの出力から特
定する。本実施例の場合は、単語「大好き」が特定され
る。
【0067】主制御部34は上記処理により特定した単
語「大好き」の読み情報「だいすき」をその単語の文章
中の先頭からの開始桁位置「4桁」と共に処理部31に
処理結果として出力する。
【0068】処理部31においては読み情報作成部33
から入力した読み情報「だいすき」と開始桁位置「4
桁」に基づき、検索処理により取得した文章「漢字が大
好きだ」に所定の処理を行ってデータを作成し、クライ
アント2,3に該作成データを処理結果として送信す
る。
【0069】上記のデータ作成の方法として下記2通り
があり、いずれかをとり得る。(a)文章中の開始桁位
置の上部に読み情報を表示するデータを作成する。
【0070】 (例) だいすき 漢字が大好き だ この処理において、読み情報を付与する単語が連続する
場合、その読み情報がつながらないように、例えば、空
白を挿入して各単語に対する読み情報を区切る。この
際、先に出現する単語の文字数よりその読み情報の文字
数が少ない場合、後に出現する単語の開始桁位置のから
その単語の読み情報が表示されるように、空白の数を調
整する。
【0071】また、先に出現する単語の文字数より読み
情報の文字数が多い場合、後に出現する単語との間に空
白を挿入して後に出現する単語の開始桁位置のからその
単語の読み情報が表示されるようにする。(b)文章中
の単語を読み情報と置換する。
【0072】(例) 置換前文章:漢字が大好き ?>
置換後文章:漢字がだいすき クライアント2,3はサーバ4,5から受信した処理結
果データを受信し、ディスプレイの画面上にそのデータ
に基づいた表示を行う。
【0073】以上説明した本発明の処理によって、利用
者にとって文章を理解しやすい読み情報を出力すること
ができる。
【0074】以上の構成により、読み情報を出力、表示
することが可能であるが、以下のように構成してもよ
い。
【0075】前述した形態素解析部36は文章を各単語
に分解したが、自立語および接頭語を区切りの先頭とし
て文章を区切り、その区切った各文字列と該文字列に含
まれる漢字や記号などの読みを主制御部34に出力する
よう構成してもよい。
【0076】また、前述した例では、主制御部34が読
み情報と開始桁位置を出力し、処理部31がそれら情報
を用いてクライアント2,3に処理結果として送信する
データの作成を行っているが、以下のように構成しても
よい。(1)主制御部34から各読み情報とその開始桁
位置を処理部31に出力 この場合、主制御部34は形態素解析部35から入力し
た各単語の読み情報とその開始桁位置および学年別フィ
ルタ37の処理結果データを処理部31に出力し、処理
部31において学年別フィルタ37による処理結果デー
タに基づき指定レベル以上の学年レベルを持つ文字を含
む単語について読み情報と開始桁位置を用いた処理を行
う。(2)主制御部34が入力文章中の単語を読み情報
に置換して出力 この場合、主制御部34は学年別フィルタ37の処理結
果データから指定レベル以上の学年レベルを持つ文字を
含む単語を特定し、その単語を形態素解析部35から入
力した単語の読みに置換して、処理部31に出力する。
処理部31においては、読み情報に置換された文章を用
いてクライアント2,3に処理結果として送信するデー
タを作成する。
【0077】また、本実施例ではネットワーク環境での
本発明の実施の形態を示したが、これに限定されるもの
ではなく、ワードプロセッサなどのようにスタンドアロ
ンで文書を扱う装置、その装置に処理を実行させるため
のプログラムを記録したコンピュータ読取可能な記録媒
体においても本発明を実現できる。
【0078】その際には装置(コンピュータ)に上記ク
ライアント2,3とサーバ4,5の本発明に関わる各処
理を実行させるようにすればよい。すなわち、文書ファ
イルから読み出した文書に含まれる文章または利用者が
キー入力した文章を処理対象とし、指定レベルを入力さ
せることにより、それらを用いて本発明の各処理を実行
させればよい。
【0079】本実施の形態においては、読み情報を含む
文章の出力形態として画面表示の例を示したが、プリン
タによる印刷に適用してもよいことは言うまでもない。
【0080】次に、本発明の第二の実施形態を説明す
る。
【0081】上記説明した本発明の第一の実施形態にお
いては、本発明の処理をサーバ4,5で実行するよう構
成している。
【0082】以下に説明する本発明の第二の実施形態で
は、本発明の処理をクライアントで動作するWebブラ
ウザで実行させるよう構成したことを特徴とする。つま
り、上記説明した第一の実施形態におけるサーバ4,5
の処理部31および読み情報作成部33をクライアント
2,3で実現するものである。
【0083】そして、本発明のWebブラウザは、We
bサーバからHTTP(HyperText Tran
sfer Protocol)にて受信したHTML文
書(タグ付き文書)に対して本発明の処理を実行し、読
み情報を含むHTML文書を作成する。
【0084】なお、この実施形態においても本発明のプ
ログラムによってクライアントであるコンピュータを上
記構成要件として機能させるものである。
【0085】図5は、本発明の処理を実行するよう構成
したWebブラウザの画面表示例を示す図である。
【0086】本発明のWebブラウザ40は、公知のW
ebブラウザと同様に、各コマンドの実行指示に対応し
た複数のボタンからなるツールバー41、アクセス先U
RLの指定および該URLを表示するアドレスバー4
3、受信したHTML文書をそれに含まれるタグに基づ
いて表示する表示部44からなる。
【0087】図5においては、ツールバー41に10個
のボタンが表示されており、左から「戻る」ボタン、
「進む」ボタン、「中止」ボタン、「更新」ボタン、
「ホーム」ボタン、「ブックマーク」ボタン、「印刷」
ボタン、「ひらがな設定」ボタン42、「環境設定」ボ
タン、「ヘルプ」ボタンが表示されている。
【0088】これらのボタンのうち、「ひらがな設定」
ボタン42が本発明の処理に関する設定をするためのボ
タンであり、この「ひらがな設定」ボタン42が指定さ
れた際に図6の設定ダイアログボックスが表示される。
【0089】図6は、本発明の処理に関する設定をする
ためのダイアログボックスを示す図である。
【0090】図6に示す設定ダイアログボックス50
は、ひらがな変換ボタン51、無変換ボタン52、出し
方設定コンボボックス53、学年設定コンボボックス5
4、決定ボタン55、取消ボタン56からなる。
【0091】ひらがな変換ボタン51は、指定されたU
RLから受信したHTML文書に対して本発明の処理を
実行することを指示するためのものである。また、この
ひらがな変換ボタン51を指定すると、出し方設定コン
ボボックス53、学年設定コンボボックス54の操作が
有効となる。
【0092】出し方設定コンボボックス53は、本発明
の処理により得られる読み情報の表示形式を設定するた
めのものである。また、学年設定コンボボックス54
は、読み情報を生成する基準レベル(本発明の第一の実
施形態における指定レベルに対応する)を設定するため
のものである。
【0093】決定ボタン55はこの設定ダイアログボッ
クス50により変更した内容を有効にして終了指示をす
るためのボタンであり、取消ボタン56は内容の変更を
キャンセルして終了指示するためのボタンである。
【0094】図7は、設定コンボボックスに関する情報
を示す図であり、同図(a)は出し方設定コンボボック
ス53に関する情報であり、同図(b)は学年設定コン
ボボックス54に関する情報を示しめしている。
【0095】同図(a)に示すように、出し方設定コン
ボボックス53においては、「ひらがなのみ」、「わか
ちがき」、「かっこ」、「ふりがな」、「ふきだし」が
選択項目として表示される。
【0096】「ひらがなのみ」が選択されると、HTM
L文書に含まれる全ての漢字に対する読み情報を生成
し、全漢字を読み情報に置換したひらがなのみの文章か
らなるHTML文書を生成する。
【0097】「わかちがき」が選択されると、「ひらが
なのみ」と同様にHTML文書に含まれる全ての漢字に
対する読み情報を生成して全漢字を読み情報に置換する
と共に、その生成した読み情報を含め文節ごとに空白を
挿入し、文章を文節単位に区切ったひらがなのみのHT
ML文書を生成する。
【0098】「かっこ」が選択されると、学年設定コン
ボボックス54で選択されたレベルに基づき生成された
漢字(単語)の読み情報を当該漢字に対応する態様で括
弧「()」でくくった(漢字の直後にその読み情報を括
弧でくくった)HTML文書を生成する。
【0099】「ふりがな」が選択されると、学年設定コ
ンボボックス54で選択されたレベルに基づき生成され
た漢字(単語)の読み情報を当該漢字のルビとする表示
形式のHTML文書を生成する。
【0100】「ふきだし」が選択されると、学年設定コ
ンボボックス54で選択されたレベルに基づき漢字(単
語)の読み情報を生成し、Webブラウザ40の表示部
44に表示された漢字上にマウスカーソルが位置した際
に、その読み情報がふきだし状(一般にツールチップと
呼ばれる)で表示されるような記述内容のHTML文書
を生成する。
【0101】上記の「ふりがな」、「ふきだし」の選択
項目に関する処理内容をさらに詳細に説明する。なお、
処理対象のHTML文書に文章「平仮名を変換する」が
含まれ、学年設定コンボボックス54で選択されたレベ
ルに基づき、「平仮名」に対して「ひらがな」、「変
換」に対して「変換」の読み情報が生成されるものとす
る。
【0102】「ふりがな」が選択された場合は、読み情
報をルビ表示にするために、<RUBY>タグ,<RB
>タグ,<RT>タグを用いる。これらのタグを用いて
本例では以下のような記述を含むHTML文書が生成さ
れる。 (記述例) <RUBY><RB>平仮名</RB><RT>ひらが
な</RT></RUBY>を <RUBY><RB>変換</RB><RT>へんかん
</RT></RUBY>する 「ふきだし」が選択された場合は、読み情報をふきだし
状のツールチップで表示するために<SPAN>タグを
用い、このタグを用いて本例では以下のような記述を含
むHTML文書が作成される。 (記述例) <SPAN TITLE=”ひらがな”>平仮名</S
PAN>を <SPAN TITLE=”へんかん”>変換</SP
AN>する また、同図(b)に示すように、学年設定コンボボック
ス54においては、「ひらがな」、「1年生」〜「6年
生」、「中学生」および「高校生」の9つが選択項目と
して表示される。
【0103】この「ひらがな」の項目は、文章に含まれ
る漢字を全てひらがなに変換するレベルに対応するもの
である。また、「1年生」〜「6年生」の6つの項目
は、「小学一年生」〜「小学六年生」の各レベルに対応
し、選択された項目に対応するレベル以上の漢字が読み
情報を生成する対象となる。
【0104】さらに、「中学生」の項目は中学一年生以
上のレベルに対応し、「高校生」の項目は常用外漢字が
変換対象とされるレベルである。
【0105】そして、これら出し方設定コンボボックス
53および学年設定コンボボックス54により選択され
た項目に対応する値が後述の処理に利用される。
【0106】以上のWebブラウザ40により実行され
る本発明の第二の実施形態における一連の処理について
説明する。
【0107】図8は、本発明の第二の実施形態における
処理フローチャートを示す図である。
【0108】まず、アドレスバー43を利用したURL
の直接入力指定またはツールバー41のブックマークボ
タンを利用したWebページの指定によりWebページ
情報を要求するための所望のHTML文書名(HTML
ファイル名を含むURL)を入力する。(ステップA
1) ステップA1により入力されたHTML文書名と、クラ
イアントに中間形式(詳細は後述する)でキャッシュさ
れているHTML文書の文書名を比較し、指定されたH
TML文書が既に中間形式データに展開されキャッシュ
されているか否かを判定する。(ステップA2) このステップA2での展開判定においては、HTML文
書名の比較と共に、そのHTML文書が利用者により選
択されている学年レベルで展開が行われているかも判定
する。
【0109】上記ステップA2により、指定されたHT
ML文書が展開されていると判定されると、ステップA
7によりその展開済みの中間形式データを用いてHTM
L文書の生成処理を実行する。
【0110】また、上記ステップA2により、指定され
たHTML文書がキャッシュされていないと判定される
と、そのHTML文書の取得を行いメモリ上に展開す
る。(ステップA3) 取得されたHTML文書をメモリに展開した後、そのH
TML文書に含まれるタグと文章について解析処理を実
行する。(ステップA4) このステップA4による解析処理について図9を用いて
説明する。
【0111】図9は、HTML文書の解析処理に用いら
れるデータの構造を示す図であり、同図(a)はそれぞ
れの文字やタグに関する管理データの構造を示し、同図
(b)は具体的な文章を例にした際の管理データの構造
を示している。
【0112】図9(a)に示されるように、個々の文字
やタグに関する管理データは、文字コード、コード長、
変換フラグから構成される。
【0113】文字コードは文字のコードを示す。なお、
タグに関しては、タグを構成する各文字単位に管理デー
タを作成するのではなく、タグ単位で管理データを作成
する。
【0114】本例では、タグの文字コードとして「ff
ffxx」の形式の管理データを使用している。なお、
「xx」はタグの出現順番を示すシリアル値とする。
【0115】コード長は、その文字コードのデータ長を
バイト単位で示し、半角文字は1、全角文字は2、タグ
は3となる。
【0116】変換フラグは、その文字コードが文字かタ
グかを示すタグ情報と、漢字からひらがなへの変換処理
の際に参照される変換情報からなる。この変換情報は、
利用者により選択された「出し方」での表示が可能か否
かを示す情報(形式有効/形式無効)と、漢字からひら
がなに変換する際に変換対象とするか否かを示す情報
(非変換対象/変換対象)からなる。
【0117】なお、上記文字コードを各文字のバイト数
で示しているが、処理を容易にするために3バイト固定
長のデータフォーマットにしてもよい。この場合には、
コード長の情報から文字コード中の有効データが特定で
きる。
【0118】次に、図9(b)に示す具体例について説
明する。なお、本例は、処理対象のHTML文書に「漢
字が<B>大好き</B>だ。」という行情報が含まれ
ているものである。
【0119】この行情報に含まれる各文字およびタグに
ついて図9(a)に示すフォーマットの管理データを生
成する。
【0120】例えば、文字「漢」については、文字コー
ドが「8ABF」、データ長が2となる。また、この文
字「漢」はひらがなに変換することが可能であり、通常
の文章にあたるため変換フラグが「0x01」となる。
【0121】また、タグ「<B>」については、最初に
出現したタグであることから文字コードが「ffff0
0」となり、データ長が3となる。また、タグが対象で
あることから、変換フラグは、タグ情報が有効、変換情
報が非変換対象に設定されるため、「0x04」とな
る。
【0122】さらに、このように文字データが生成され
る際に、タグそのものはバッファに保存され、そのバッ
ファ中の個々のタグを識別するために、位置情報および
タグの桁数を示すデータ長(バイト)からなるタグ管理
情報が生成される。
【0123】以上のようなタグ解析処理により生成され
た管理データを用いて処理対象文章を特定し、それを読
み情報作成部33に渡す。この特定処理においては、変
換フラグがタグを示している文字データを除いた文章を
処理対象として特定する。
【0124】読み情報作成部33は受け取った処理対象
文章と指定された値で示されるレベルに基づき、上述し
た第一の実施形態と同様の処理によって読み情報と位置
情報を出力する。(ステップA5) 読み情報とその読みに関する位置情報が生成されると、
それらの情報と既に生成されている管理データを用い
て、処理対象のHTML文書に対応する中間形式データ
を生成する。(ステップA6) 図10に中間形式データを示し、同図(a)はデータの
フォーマットを示し、同図(b)は上述の行情報の中間
形式データを示す。
【0125】図10に示されるように、1文の中間形式
データは、レコード開始識別情報、本文開始識別情報、
本文データ、本文終了識別情報、タグデータ、レコード
終了識別情報からなる。
【0126】レコード開始識別情報およびレコード終了
識別情報は、レコードの開始および終了を示す識別情報
である。また、本文開始識別情報および本文終了識別情
報は、処理対象のHTML文書に記述された文章および
タグを含む本文データの開始および終了を示す識別情報
である。
【0127】本文データは、読み情報がない読みなし区
間と、読み情報を含む読みあり区間からなる。なお、読
み情報が生成されない場合には読みあり区間は存在しな
い。
【0128】上記のように読み情報を含む読みあり区間
は、表記開始識別情報、学年情報、表示形式情報、続く
表記情報のデータ長(バイト単位)、表記情報、読み開
始識別情報、続く読み情報のデータ長(バイト単位)、
読み情報、読み終了識別情報から構成される。
【0129】表記開始識別情報は、読みあり区間の先頭
であることを示す識別情報である。
【0130】それに続く学年情報は、学年設定ダイアロ
グボックス54により選択された項目に対応する値(第
一の実施形態の指定レベルに相当)を示すものであり、
表示形式情報は、出し方設定コンボボックス53により
選択された項目に対応する値を示すものである。
【0131】さらに、表記情報のデータ長と実際に処理
対象のHTML文書に含まれる表記情報がそれ以降に続
く。
【0132】また、表記に関する情報に続く読み開始識
別情報は、その表記に対応する読み情報の開始を示す識
別情報であり、読み情報のデータ長と表記に対応する実
際の読み情報がそれに続き、さらに、読み情報に関する
情報の終了を示す読み終了識別情報が続く。この読み終
了識別情報は、読み情報に関する情報の終了を示すと共
に、読みあり区間の終了であることも意味している。
【0133】中間形式データにおけるタグデータは、上
述したタグ情報の開始を示すタグ開始識別情報、タグ表
記、タグ情報の終了を示すタグ終了識別情報からなる。
【0134】上述した行情報の例に対する中間形式デー
タを図10(b)に示す。なお、この例では、出し方設
定コンボボックス53で「ふりがな」が選択され、学年
設定コンボボックス54で「3年生」が選択されたもの
である。
【0135】再び図8の処理フローチャートの説明に戻
り、ステップA6により中間形式データが生成される
と、指定された表示形式で表示させるために、その表示
形式に対応するタグを使用する、表記や読みなどの文章
に空白を挿入するなど編集を施して、その中間形式デー
タを用いた読み情報を含むHTML文書を作成する。
(ステップA7) 上記作成されたHTML文書およびそれに関連するUR
L情報をハードディスク13などの記憶装置に保存する
と共に(ステップA8)、Webブラウザ40の表示部
44に表示させる。(ステップA9) このような処理により、利用者により指定されたレベル
に応じてHTML文書に含まれる文章の読み情報を生成
し、その読み情報を付加したHTML文書の作成、表示
が可能となる。
【0136】なお、ステップA2において入力されたH
TML文書名がキャッシュされていると判定される場合
には、ステップA6から以降の処理により、キャッシュ
されている前記HTML文書の中間形式データを用いて
HTML文書の作成、表示を行う。
【0137】これにより、キャッシュされているHTM
L文書を再利用することが可能となり、HTML文書の
取得処理や読み情報の生成処理を省略することができ、
HTML文書を表示するまでの処理時間が短縮される。
【0138】なお、利用者により指定された学年レベル
が中間形式データの学年情報と一致すればよく、必ずし
も読み情報の表示形式(出し方)も一致する必要はな
い。このように、利用者が指定した出し方と中間形式デ
ータにおける読み情報の表示形式情報が異なる場合に
は、中間形式データの表記データおよび読み情報を用
い、利用者により指定された出し方に対応するタグの利
用、内容の編集を行ってHTML文書を作成すればよ
い。
【0139】また、HTML文書を表示部44に表示し
ている際に、利用者により設定ダイアログボックス50
を用いて出し方のみが変更された場合に、表示部44に
表示しているHTML文書を作成するために利用した中
間形式データを用いてステップA6からの処理を実行さ
せるように構成してもよい。
【0140】これらの処理により、一度受信したデータ
(HTML文書)をさらに有効に利用することができ
る。
【0141】さらに、本発明では、第二の実施形態に示
すように、生成された読み情報の表示形式を利用者が動
的に変更できるようにしている。よって、Webサーバ
から取得されるHTML文書の内容に応じて、利用者は
自身にとって内容を最も把握しやすい表示形態でHTM
L文書を閲覧することができる。
【0142】図11は、異なる学年レベルを設定した際
のWebブラウザの表示例を示す図である。いずれも、
出し方(表示形式)として「ふりがな」が指定され、図
5で表示されているHTML文書を処理対象にしたもの
である。
【0143】図11(a)は学年として「3年生」が選
択されたときのWebブラウザの表示を示すものであ
り、図11(b)は学年として「6年生」が選択された
ときのWebブラウザの表示を示すものである。
【0144】この図11からわかるように、設定される
学年レベルに応じて生成される読み情報が変わるもので
ある。
【0145】また、図11に示す例とは異なる出し方
(表示形式)が選択された場合のWebブラウザの表示
を図12に示す。
【0146】この図12は、図11(a)に示すWeb
ブラウザの表示を得るために利用された中間形式データ
を用い、出し方(表示形式)として「かっこ」が選択さ
れた場合の表示例を示すものである。なお、この出し方
が選択されたときのデータの作成処理、およびその他の
処理については上述しているので、これらの処理に関す
る説明は省略する。
【0147】さらに、本発明の出し方(表示形式)は、
上述したものに限定されるものではない。
【0148】例えば、指定された学年レベル以上の漢字
を含む単語の読みをウィンドウのステータスバーに表示
するような他の出し方(表示形式)を用いてもよい。こ
の場合には、指定された学年レベル以上の漢字を含む単
語上にカーソルが位置したことを検出して、その単語の
読みをウィンドウのステータスバーに表示するようなス
クリプトを記述したHTML文書を作成するよう構成す
ればよい。
【0149】以上、入力文に指定レベル(学年レベル)
以上の漢字が含まれる場合、その漢字が含まれる単語の
読み情報であるふりがなを生成してテキストで表示する
例を説明した。
【0150】しかし、本発明の読み情報の提示方法はこ
れに限定されるものではなく、指定レベル以上の漢字を
含む単語に関連する画像を表示させることや、その単語
の読みを音声で出力させることにも適用可能である。
【0151】上述のように、指定レベル以上の漢字を含
む単語に関連する画像としては、その単語の読みを示す
画像やその単語の読みを想起させるような画像などが考
えられる。この単語の読み示す画像とはひらがな表記
(文字情報)の画像であり、単語の読みを想起させるよ
うな画像とはその単語を絵柄や写真で示した画像であ
る。
【0152】このような画像を表示させるためには、以
下のような処理によりその画像を表示させるデータを作
成すればよい。なお、文書(文章データ)はHTML文
書とする。
【0153】 (例1)単語の読みを画像で表示させる場合 まず、各ひらがなに対応する画像データを予め作成して
サーバに保持しておく。
【0154】クライアント(Webブラウザ)からの要
求に基づいて返信すべき文書を特定し、クライアントか
ら指定された学年レベル以上の漢字がその特定された文
書中の文章データに含まれるか否かを判断する。
【0155】上記学年レベル以上の漢字が文章データに
含まれる場合、その漢字を含む単語を特定し、その単語
の読みを生成する。
【0156】そして、その単語の読みを構成する各ひら
がなに対応する画像データを特定し、その単語に対応す
る位置にその特定された各ひらがなに対応する画像デー
タへのリンク情報、例えば、その画像データを指定した
<A>タグや<IMG>タグを記述したHTML文書を
作成し、それをクライアントに送信する。
【0157】クライアントにおけるWebブラウザにお
いては、サーバから上記作成されたHTML文書を受信
し、その記述内容を解釈して画面上に表示させる。
【0158】このような処理により、利用者は、指定し
た学年レベル以上の漢字を含む文章中の単語について
は、その単語の読みを画像で把握することができる。
【0159】なお、単語の読みを画像で表示させるため
の文書をサーバにより作成する例を説明したが、サーバ
は単に要求されたHTML文書をクライアントに送信
し、クライアントにおいて受信したHTML文書に対し
てクライアントに保持されている画像データへのリンク
情報の記述を付加したHTML文書を作成し、表示する
ようにしてもよい。この場合には、予めひらがなに対応
する画像データを作成し、クライアントに保持するよう
にしておけばよい。
【0160】また、以上の説明においては、ひらがなに
対応する画像データを予め作成して保持するように構成
しているが、読みを表示させるために必要なひらがなが
発生した時点でそのひらがなに対応する画像データを作
成するように構成してもよい。
【0161】(例2)単語の読み情報として、その単語
の読みを想起させる画像を表示させる場合 この例をサーバの処理で実現する場合は、予め単語に関
連する画像データを作成し、その単語の読みと対応付け
て画像データをサーバに保持しておく。
【0162】そして、クライアントからの要求に基づい
て返信すべき文書を特定し、クライアントから指定され
た学年レベル以上の漢字がその特定された文書中の文章
データに含まれるか否かを判断する。
【0163】上記学年レベル以上の漢字が文章データに
含まれる場合、その漢字を含む単語を特定し、その単語
の読みを生成し、その読みを用いて対応付けられた画像
データを検索する。
【0164】単語の読みに対応付けられた画像データが
存在する場合は、その画像データへのリンク情報を記述
したHTML文書を作成し、それをクライアントに送信
する。
【0165】クライアントにおけるWebブラウザにお
いては、サーバから上記作成されたHTML文書を受信
し、その記述内容を解釈して画面上に表示させる。
【0166】なお、本例においても、上述のように、サ
ーバではなくクライアントによる処理で実現することが
可能である。
【0167】つまり、クライント側で、予め単語の読み
に対応付けた画像データを保持しておき、サーバから受
信したHTML文書に対してクライアントに保持されて
いる画像データへのリンク情報の記述を付加したHTM
L文書を作成し、表示するように構成すればよい。
【0168】また、上記の単語の読みを示す画像やその
単語の読みを想起させるような画像は、クライアント、
サーバのいずれに保持するよう構成してもよく、その保
持場所に応じてリンク情報を記述すればよいことは言う
までもない。
【0169】さらに、上記いずれの例の場合にも、単語
とその単語に対応する画像データを同一領域に表示させ
るのではなく、予め単語のみを表示させておき、その単
語に対するカーソルでの指示操作を検出して、例えば、
新たなウィンドウなどの他の領域にその単語に対応する
画像データを表示させるよう構成してもよい。
【0170】次に、単語の読みを音声で出力させる場合
について説明する。
【0171】これまでの説明と同様に、サーバはクライ
アントからの要求に基づいて返信すべき文書を特定し、
クライアント(Webブラウザ)から指定された学年レ
ベル以上の漢字がその特定された文書中の文章データに
含まれるか否かを判断する。
【0172】上記学年レベル以上の漢字が文章データに
含まれる場合、その漢字を含む単語を特定し、その単語
の読みを生成する。
【0173】そして、クライアントにおいて表示された
単語に対するカーソル操作を検出し、その単語に対応す
る読み情報をクライアントの音声合成エンジンに渡すス
クリプトを記述したHTML文書を作成し、それをクラ
イアントに送信する。
【0174】クライアントにおけるWebブラウザにお
いては、サーバから上記HTML文書を受信し、その記
述内容を解釈して画面上に表示させる。
【0175】利用者がこの画面上に表示された単語に対
してカーソル操作をした際に、その操作を検出してその
単語に対応する読み情報を音声合成エンジンに渡す。音
声合成エンジンは、受信した読み情報を基にして音声デ
ータを生成しそれを出力する。
【0176】なお、本例においても、上述のように、サ
ーバではなくクライアントによる処理で実現することが
可能である。
【0177】つまり、クライントにおいて、サーバから
受信したHTML文書中に指定された学年レベル以上の
漢字があるか否か判断し、その漢字を含む単語を特定し
て読み情報を生成し、上述と同様のスクリプトを記述し
たHTML文書を作成するよう構成してもよい。
【0178】このような処理により、利用者は、指定し
た学年レベル以上の漢字を含む文章中の単語について
は、その単語の読みを音声にて把握することができる。
【0179】以上、文章中に指定された学年レベル以上
の漢字が存在する場合、その漢字が含まれる単語を特定
し、その読み情報を出力することを説明したが、その単
語の語彙を出力するように構成してもよい。
【0180】このように、指定された学年レベル以上の
漢字を含む単語の語彙を出力し、表示させることで、利
用者はその単語の語彙を理解し文章の内容を理解するこ
とが可能となる。この語彙の表示方法については、文章
と別領域に上記画像データを表示させるための構成と同
様の方法を用いればよい。
【0181】なお、上述した読み情報を示すテキスト、
画像、音声、語彙を示す情報のうちの一つを出力させる
だけでなく、それらのいずれかの組み合わせや全ての組
み合わせを本発明の処理による出力とする構成にしても
よいことは言うまでもない。
【0182】さらに、以下の発明により従来の問題点を
解決することができる。(発明1) 文および指定レベルを入力し、形態素解析により前記入
力文を単語単位に分解し、該分解した単語単位に前記指
定レベルとの関係を判断し、所定関係にある単語を特定
し、前記特定された単語の読みを出力するよう構成す
る。
【0183】上記各処理をそれぞれ実行する構成要件と
した読み情報出力装置、および各処理をコンピュータに
実行させるためのプログラムを記録したコンピュータ読
取可能な記録媒体により本発明を実現できる。
【0184】従来技術のように、単語辞書のみを用いて
文章中に出現した漢字の先頭から一致する漢字文字列を
特定すると、一致する最も長い漢字文字列を単語として
区切ってしまうことから、複数の漢字単語が連続する複
合語の処理において正確な単語区切りができず、誤った
単語区切りおよび読み情報付与ができなくなってしま
う。
【0185】本発明のこの構成により、入力文章は形態
素解析により分解され正しく入力文章を区切ることがで
きるため、正しい読み情報を出力することが可能とな
る。それにより、文章を理解しづらくさせること、利用
者が誤った読みを学習することを回避することが可能と
なる。(発明2) 文および指定レベルを入力し、前記入力文の各文字を学
習する学年レベルを判断し、前記指定レベルで示される
学年より少なくとも高学年で学習される文字を含む単語
を特定し、前記特定された単語の読みを出力するよう構
成する。
【0186】上記各処理をそれぞれ実行する構成要件と
した読み情報出力装置、および各処理をコンピュータに
実行させるためのプログラムを記録したコンピュータ読
取可能な記録媒体により本発明を実現できる。
【0187】この構成により、従来技術のように、漢字
かな混じり文中の各漢字を学習する学年で判断して指定
の学年以上の漢字に対して読みを付与するのではなく、
漢字を含む単語単位で読みが出力されるため、利用者に
理解しやすい読み情報を得ることが可能となる。(発明
3) 文および指定レベルを入力し、前記入力文の各文字のレ
ベルを判断し、前記指定レベルと所定関係のレベルであ
る文字を含む前記入力文中の単語を特定し、前記入力文
中の前記特定された単語を該単語に対応する読みに置換
して出力するよう構成する。
【0188】上記各処理をそれぞれ実行する構成要件と
した読み情報出力装置、および各処理をコンピュータに
実行させるためのプログラムを記録したコンピュータ読
取可能な記録媒体により本発明を実現できる。
【0189】この構成により、利用者は原文に混在して
いた未学習の漢字を意識する必要がなく、漢字とその読
み情報が付与された文章の表示形式よりも簡単な表示形
式となり、利用者は表示内容を理解しやすくなる。
【0190】以下に本願の特徴を付記する。 (付記1) 文および指定レベルを入力する入力部と、
前記入力文の各文字のレベルを判断する判断部と、前記
指定レベルと所定関係のレベルである文字を含む前記入
力文中の単語を特定する特定部と、前記特定された単語
の読み情報を出力する出力部と、を備える読み情報出力
装置。 (付記2) 形態素解析により前記入力文を単語単位に
分解する分解部を備える付記1記載の読み情報出力装
置。 (付記3) 前記特定部は単語を特定すると共に前記入
力文中の該単語の位置情報を特定し、前記出力部は前記
特定された単語の読み情報と該単語の位置情報との対応
を出力する付記1記載の読み情報出力装置。 (付記4) 前記単語の位置情報に基づき、前記文に前
記単語の読み情報を付加して出力させる出力制御部を備
える付記3記載の読み情報出力装置。 (付記5) 複数の出力形式からいずれかの出力形式を
設定する設定部を備え、前記出力制御部は、前記設定さ
れた出力形式に応じて前記単語の読み情報を出力させる
付記4記載の読み情報出力装置。 (付記6) 前記出力された読み情報を保持する保持部
を備え、前記出力制御部は、再度前記入力文を処理対象
とする場合に、前記保持部に保持されている読み情報を
出力させる付記1記載の読み情報出力装置。 (付記7) 複数の出力形式からいずれかの出力形式を
設定する設定部を備え、前記出力制御部は、前記設定部
による出力形式の変更設定に応じて前記保持部に保持さ
れている読み情報を当該出力形式で出力させる付記6記
載の読み情報出力装置。 (付記8) 前記出力部は、前記特定された単語の読み
情報を画像にて出力する付記1記載の読み情報出力装
置。 (付記9) 前記出力部は、前記特定された単語の読み
情報を音声にて出力させるデータを出力する付記1記載
の読み情報出力装置。 (付記10) コンピュータに、文および指定レベルを
入力する手順と、前記入力文の各文字のレベルを判断す
る手順と、前記指定レベルと所定関係のレベルである前
記文字を含む前記入力文中の単語を特定する手順と、前
記特定された単語の読み情報を出力する手順と、を実行
させるためのプログラムを記録したコンピュータ読取可
能な記録媒体。 (付記11) 形態素解析により前記入力文を単語単位
に分解する手順をさらに実行させる前記プログラムを記
録した付記10記載のコンピュータ読取可能な記録媒
体。 (付記12) 前記単語を特定すると共に前記入力文中
の該単語の位置情報を特定する手順と、前記特定された
単語の読み情報と該単語の位置情報との対応を出力する
手順とをさらに実行させる前記プログラムを記録した付
記10記載のコンピュータ読取可能な記録媒体。 (付記13) 前記単語の位置情報に基づき、前記文に
前記単語の読み情報を付加して出力する手順をさらに実
行させる前記プログラムを記録した付記12記載のコン
ピュータ読取可能な記録媒体。 (付記14) 複数の出力形式からいずれかの出力形式
を設定する手順をさらに実行させ、前記設定された出力
形式に応じて前記単語の読み情報を出力させる前記プロ
グラムを記録した付記13記載のコンピュータ読取可能
な記録媒体。 (付記15) 前記出力された読み情報を保持する手順
をさらに実行させ、再度前記入力文を処理対象とする場
合に前記保持されている読み情報を出力させる前記プロ
グラムを記録した付記10記載のコンピュータ読取可能
な記録媒体。 (付記16) 複数の出力形式からいずれかの出力形式
を設定する手順をさらに実行させ、出力形式の変更設定
に応じて前記保持されている読み情報を当該出力形式で
出力させる前記プログラムを記録した付記15記載のコ
ンピュータ読取可能な記録媒体。 (付記17) 前記特定された単語の読み情報を画像に
て出力する前記プログラムを記録した付記10記載のコ
ンピュータ読取可能な記録媒体。 (付記18) 前記特定された単語の読み情報を音声に
て出力させるデータを出力する付記10記載のコンピュ
ータ読取可能な記録媒体。
【0191】
【発明の効果】以上本発明の構成により、単語を構成す
る文字のいずれかが指定レベルと所定関係のレベルにあ
るときは、該単語を構成する他の文字も含めて読み情報
が出力される。
【0192】従って、利用者は文章を理解しやすく、ま
た誤った読みを学習することを回避することが可能とな
る。
【0193】また、形態素解析により単語単位に分解さ
れ、その単語単位に読み情報が出力されるので、利用者
に正しい読みを学習させることができる。
【0194】また、特定された単語の読み情報とその開
始桁位置を用いることで、処理対象となった文章を様々
な形態で出力することが可能となる。特に、原文の単語
に読みを付加して出力することで、利用者は単語の読み
を学習することができる。
【0195】さらに、その画面表示や印刷出力における
読み情報の出力形態を利用者が選択できるよう構成した
ため、利用者は処理対象文章に最適な出力形態を選択す
ることで、その文章を容易に把握することが可能とな
る。
【0196】また、読み情報の作成処理を行った文章に
ついてその読み情報を保持しておき、その文章が再び処
理対象となった場合に、その保持している読み情報を出
力することで、処理結果を得るまでの処理時間を短縮す
ることができる。
【0197】さらに、読み情報の出力形態が変更された
場合も、その保持している読み情報を用いて変更設定さ
れた出力形態に応じた出力を行うことで、処理結果を得
るまでの処理時間を短縮することができる。
【0198】これらの処理によって、生成された読み情
報を有効活用することができる。
【0199】また、生成された読み情報を画像や音声に
て出力することでも、利用者による文章内容の理解を補
助することが可能となる。
【図面の簡単な説明】
【図1】本発明をネットワーク環境で実施するときのシ
ステム構成図
【図2】コンピュータのハードウェア構成を示す図
【図3】本発明の第一の実施形態における処理フローチ
ャートを示す図
【図4】本発明の一実施例を示す図
【図5】本発明の処理を実行するよう構成したWebブ
ラウザの画面表示例を示す図
【図6】本発明の処理に関する設定をするためのダイア
ログボックスを示す図
【図7】設定コンボボックスに関する情報を示す図
【図8】本発明の第二の実施形態における処理フローチ
ャートを示す図
【図9】HTML文書の解析処理に用いられるデータの
構造を示す図
【図10】中間形式データを示す図
【図11】異なる学年レベルを設定した際のWebブラ
ウザの表示例を示す図
【図12】異なる出し方を設定した際のWebブラウザ
の表示例を示す図
【符号の説明】
31 処理部 32 データベース 33 読み情報作成部 34 主制御部 35 形態素解析部 36 形態素解析辞書 37 学年別フィルタ 38 学年別フィルタ辞書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 柳田 智克 東京都大田区新蒲田一丁目17番25号 株式 会社富士通ラーニングメディア内 Fターム(参考) 5B009 ME11 MJ04 VA01

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文および指定レベルを入力する入力部
    と、 前記入力文の各文字のレベルを判断する判断部と、 前記指定レベルと所定関係のレベルである文字を含む前
    記入力文中の単語を特定する特定部と、 前記特定された単語の読み情報を出力する出力部と、 を備える読み情報出力装置。
  2. 【請求項2】 前記特定部は単語を特定すると共に前記
    入力文中の該単語の位置情報を特定し、 前記出力部は前記特定された単語の読み情報と該単語の
    位置情報との対応を出力する請求項1記載の読み情報出
    力装置。
  3. 【請求項3】 前記単語の位置情報に基づき、前記文に
    前記単語の読み情報を付加して出力させる出力制御部を
    備える請求項2記載の読み情報出力装置。
  4. 【請求項4】 複数の出力形式からいずれかの出力形式
    を設定する設定部を備え、 前記出力制御部は、前記設定部による出力形式の変更設
    定に応じて前記保持部に保持されている読み情報を当該
    出力形式で出力させる請求項3記載の読み情報出力装
    置。
  5. 【請求項5】 コンピュータに、 文および指定レベルを入力する手順と、 前記入力文の各文字のレベルを判断する手順と、 前記指定レベルと所定関係のレベルである前記文字を含
    む前記入力文中の単語を特定する手順と、 前記特定された単語の読み情報を出力する手順と、 を実行させるためのプログラムを記録したコンピュータ
    読取可能な記録媒体。
JP2000124857A 1999-05-18 2000-04-25 読み情報出力装置および記録媒体 Pending JP2001034611A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000124857A JP2001034611A (ja) 1999-05-18 2000-04-25 読み情報出力装置および記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-136971 1999-05-18
JP13697199 1999-05-18
JP2000124857A JP2001034611A (ja) 1999-05-18 2000-04-25 読み情報出力装置および記録媒体

Publications (1)

Publication Number Publication Date
JP2001034611A true JP2001034611A (ja) 2001-02-09

Family

ID=26470413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000124857A Pending JP2001034611A (ja) 1999-05-18 2000-04-25 読み情報出力装置および記録媒体

Country Status (1)

Country Link
JP (1) JP2001034611A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003157252A (ja) * 2001-11-20 2003-05-30 A I Soft Inc 仮名漢字混じり文の変換方法
WO2006137166A1 (ja) * 2005-06-20 2006-12-28 Hitachi Government And Public Corporation System Engineering, Ltd. クライアント端末
JP2009118125A (ja) * 2007-11-06 2009-05-28 Sharp Corp 表示装置、放送受信装置、及び表示文字変換方法
JP2009129258A (ja) * 2007-11-26 2009-06-11 Fujitsu Ltd 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP2009163479A (ja) * 2008-01-04 2009-07-23 Nec Corp テキスト表示装置、アプリケーションプログラム及びテキスト表示制御方法
JP2010072681A (ja) * 2008-09-16 2010-04-02 Sharp Corp 電子辞書装置
JP2021082088A (ja) * 2019-11-20 2021-05-27 キヤノン株式会社 情報処理装置、その制御方法、プログラム、及び記憶媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003157252A (ja) * 2001-11-20 2003-05-30 A I Soft Inc 仮名漢字混じり文の変換方法
WO2006137166A1 (ja) * 2005-06-20 2006-12-28 Hitachi Government And Public Corporation System Engineering, Ltd. クライアント端末
JP2009118125A (ja) * 2007-11-06 2009-05-28 Sharp Corp 表示装置、放送受信装置、及び表示文字変換方法
JP2009129258A (ja) * 2007-11-26 2009-06-11 Fujitsu Ltd 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP2009163479A (ja) * 2008-01-04 2009-07-23 Nec Corp テキスト表示装置、アプリケーションプログラム及びテキスト表示制御方法
JP2010072681A (ja) * 2008-09-16 2010-04-02 Sharp Corp 電子辞書装置
JP2021082088A (ja) * 2019-11-20 2021-05-27 キヤノン株式会社 情報処理装置、その制御方法、プログラム、及び記憶媒体

Similar Documents

Publication Publication Date Title
JPH09259127A (ja) 翻訳装置
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JP2001034611A (ja) 読み情報出力装置および記録媒体
JPH0330177B2 (ja)
JPWO2008018287A1 (ja) 検索装置及び検索データベース生成装置
JP3937741B2 (ja) 文書の標準化
JP4012047B2 (ja) 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム
KR100631086B1 (ko) Xml을 이용한 텍스트 정규화 방법 및 장치
JPH1145278A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2005011301A (ja) 文書処理装置及び文書処理プログラム
JPH0612548B2 (ja) 文書処理装置
JP2003132078A (ja) データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体
JP3497263B2 (ja) マーク付け文書からの定型フォーマット文書生成方法及び装置
JPH06314278A (ja) 文書データ処理システム
JP6886196B2 (ja) 語学の学習支援装置
JPS5994132A (ja) 日本語ワ−ドプロセツサ
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JP3206600B2 (ja) 文書生成装置
JPH11238053A (ja) 文書作成装置および文書作成方法ならびに文書作成プログラムを記録した記録媒体
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2789596B2 (ja) 文書処理装置
JP3447955B2 (ja) 機械翻訳システム及び機械翻訳方法
JPH10161996A (ja) 文書作成方法及び装置
JPH08297659A (ja) 文字列変換処理方式
JPH0721189A (ja) 翻訳支援装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031007