JP2011227849A - 文章変換装置、文章変換方法、プログラムおよびデータ構造 - Google Patents

文章変換装置、文章変換方法、プログラムおよびデータ構造 Download PDF

Info

Publication number
JP2011227849A
JP2011227849A JP2010099501A JP2010099501A JP2011227849A JP 2011227849 A JP2011227849 A JP 2011227849A JP 2010099501 A JP2010099501 A JP 2010099501A JP 2010099501 A JP2010099501 A JP 2010099501A JP 2011227849 A JP2011227849 A JP 2011227849A
Authority
JP
Japan
Prior art keywords
sentence
partial
data
partial sentence
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010099501A
Other languages
English (en)
Inventor
Yoshihiro Inoue
慶大 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2010099501A priority Critical patent/JP2011227849A/ja
Publication of JP2011227849A publication Critical patent/JP2011227849A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】読解力に応じた適切な言い回しを通じて、読解力の低い低年齢層の読者も容易に理解できる文章を提供する。
【解決手段】文章変換装置100は、文章を分割した部分文章152をデータ化したデータ、および、部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データ154と、部分文章データを特定するための部分文章記述子156とを関連付けて保持する保持部112と、読者の読解力を示す読解力情報を取得する操作部114と、取得された読解力情報に応じて部分文章毎に部分文章記述子を特定する記述子特定部130と、特定された部分文章記述子に関連付けられた部分文章データを保持部から抽出し文章データとして組み合わせる文章データ生成部132と、組み合わされた文章データを出力する出力部116とを備える。
【選択図】図2

Description

本発明は、電子書籍の内容を変換する文章変換装置、文章変換方法、プログラムおよび、その文章変換装置に用いられるデータ構造に関する。
旧来より存在する、紙媒体とインクとを用いた印刷物に代わって、近年、文章のコンテンツをデータ化した電子書籍が脚光を浴びている。かかる電子書籍は、CD(Compact Disc)やDVD(Digital Versatile Disk)等の記録媒体や、インターネット上のアプリケーションサーバ等から読み込まれ、読者は、表示部を有する装置を通じてそのコンテンツを見る(読む)ことができる。
しかし、コンテンツの表示手段は変わってもコンテンツの内容までは変わらないので、そのコンテンツが対象とする年齢層が高い場合、低年齢層(低学年)の人には理解できない漢字が文章中に含まれることになる。そこで、読者の学年に応じて、このような難解な漢字を理解可能な仮名漢字混じり文字に機械的に変換する技術が公開されている(例えば、特許文献1、2)。
特開2000−215199号公報 特許第3726323号
上述した特許文献1、2の技術を用いることで難解な漢字を仮名に変換することができるが、読者は、例えば、漢字「邪智暴虐」が「じゃちぼうぎゃく」という読み方であることを把握できるに過ぎず、その漢字の意味まで理解することはできなかった。このとき、漢字仮名変換のみならず単語単位で同義語に変換することができたとしても、実際の文章における当該単語の前後の脈絡や、全文章における意図を汲んだものではないため、結局、読者はその文章の意図する内容を自力で理解しなければならなかった。
上述した漢字仮名変換技術のように、漢字を含む前後の文章の言い回しを、他の文章との脈絡を踏まえ、理解可能となるように機械的に変換することも考えられるが、それには高性能な計算機と膨大なデータベースが必要となり、電子書籍の閲覧といった用途には実現性が乏しい。
本発明は、このような課題に鑑み、読解力に応じた適切な言い回しを通じて、読解力の低い低年齢層の読者も容易に理解できる文章を提供することが可能な文章変換装置、文章変換方法、プログラムおよびデータ構造を提供することを目的としている。
上記課題を解決するために、本発明は下記の文章変換装置、文章変換方法、プログラムおよびデータ構造を提供するものである。
(1)文章を分割した部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、前記部分文章データを特定するための部分文章記述子とを関連付けて保持する保持部と、読者の読解力を示す読解力情報を取得する操作部と、取得された前記読解力情報に応じて前記部分文章毎に前記部分文章記述子を特定する記述子特定部と、特定された前記部分文章記述子に関連付けられた部分文章データを前記保持部から抽出し文章データとして組み合わせる文章データ生成部と、組み合わされた前記文章データを出力する出力部と、を備えることを特徴とする文章変換装置。
(2)前記部分文章に対して抽出可能な部分文章データの総数は、前記部分文章それぞれで独立した数となることを特徴とする上記(1)に記載の文章変換装置。
(3)前記文章データを出力した後に、読者の操作入力に応じて、前記部分文章データを、同一の部分文章に対する異なる部分文章データに変換する文章変換部をさらに備えることを特徴とする上記(1)または(2)に記載の文章変換装置。
(4)文章を分割した部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、前記部分文章データを特定するための部分文章記述子とを関連付けて予め保持部に保持しておき、読者の読解力を示す読解力情報を取得し、取得した前記読解力情報に応じて前記部分文章毎に前記部分文章記述子を特定し、特定した前記部分文章記述子に関連付けられた部分文章データを前記保持部から抽出し文章データとして組み合わせ、組み合わせた前記文章データを出力することを特徴とする文章変換方法。
(5)文章を分割した部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、前記部分文章データを特定するための部分文章記述子とを関連付けて保持する保持部と、読者の読解力を示す読解力情報を取得する操作部と、文章データを出力する出力部とを有するコンピュータを、取得された前記読解力情報に応じて前記部分文章毎に前記部分文章記述子を特定する記述子特定部と、特定された前記部分文章記述子に関連付けられた部分文章データを前記保持部から抽出し、前記出力部が出力する文章データとして組み合わせる文章データ生成部と、して機能させるためのプログラム。
(6)文章を分割した部分文章毎に、読者の読解力に応じた部分文章データを抽出して文章データを組み合わせるためのデータ構造であって、前記部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力のレベルに応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、読者の読解力に応じて前記部分文章毎に前記部分文章データを特定するための部分文章記述子とが関連付けられており、外部装置に設定された前記読解力のレベルに基づいて、前記外部装置に、前記部分文章記述子を特定させ、特定させた前記部分文章記述子に関連付けられた部分文章データを抽出させ、文章データとして組み合わせさせることを特徴とするデータ構造。
以上説明したように本発明によれば、これまで漢字や熟語、または言い回し等が理解できないため読むことができなかった書籍を読解力に応じた適切な言い回しに変換し、読解力の低い低年齢層の読者も容易に理解できる文章を提供することが可能となる。
文章の変換例を示した説明図である。 文章変換装置の基本的な構成を示した機能ブロック図である。 文章データを説明するための説明図である。 部分文章データの例を示した説明図である。 XMLによる文章データのイメージを説明するための説明図である。 最終的に生成される文章例を説明するための説明図である。 操作部への操作入力を説明するための説明図である。 部分文章中の部分文章データの分布を示した説明図である。 文章変換部の動作を説明するための説明図である。 文章変換方法の処理の流れを示したフローチャートである。
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
読者は、文章変換装置を通じて、文章のコンテンツをデータ化した電子書籍を表示し、そのコンテンツを読むことができる。通常、そのようなコンテンツは、ある程度の読解力を有する大人を対象としている場合が多く、漢字のみならず、熟語や言い回し等、低年齢層の読者には理解し難い表現が多数見受けられる。しかしながら、現在、提案、実用化されている技術では、低年齢層の読者を意識し、読者の年齢や学年に合わせてコンテンツの文章を適切に置換するような技術が存在しない。
図1は、既存の文章の変換例を示した説明図である。例えば、図1(a)に示す原文による文章データ10では、「邪智暴虐」等の難解な漢字が用いられている。既存の技術では、読者の学年に応じて、このような難解な漢字を理解可能な仮名漢字混じり文字に機械的に変換することができる。例えば、小学4年生が当該文章データ10を読むとき、文章変換装置は、図1(b)のように、小学4年生までに習う漢字以外の漢字を、その読み方を示す平仮名に変換し、さらに同義語辞書を用いて、図1(c)のように、難解な単語を理解可能な同義語に変換する。しかし、かかる変換は、単語単位の変換に過ぎないので、読者は、その文章の意図する内容までを理解することはできなかった。
このとき低年齢層(低学年)の読者には難解な単語、例えば、「邪悪」について、その単語自体を選択することで、吹き出しにその単語の意味、例えば、「心がねじ曲がって悪いこと。また、そのさまやそのもの。」を表示することもできるが、各単語の煩わしい選択作業を要するばかりか、結局、読者は、各単語の意味をそれぞれ把握して、その文章の意図する内容を自力で理解しなければならなかった。したがって、読者は、かかる辞書機能を用いて単語の意味が解らない苛立ちからは解放されるものの、読書をスムーズに楽しむといった目的を達成することはできなかった。
そこで、本実施形態の文章変換装置100は、読解力に応じた適切な言い回し(言い表し方)を通じて、読解力の低い低年齢層の読者も容易に理解できる文章を提供することを目的とする。以下、文章変換装置100の具体的な構成を述べ、その後、フローチャートを用いて、文章変換方法を詳述する。
(文章変換装置100)
図2は、文章変換装置100の基本的な構成を示した機能ブロック図である。文章変換装置100は、情報取得部110と、保持部112と、操作部114と、出力部116と、表示部118と、制御部120とを含んで構成される。文章変換装置100は、携帯性を有するとしてもよい。読者は、文章変換装置100を通じて、複数の電子書籍から1の電子書籍を選択し、以下に示す機能部によって、自身の読解力に応じた文章の提供を受けることができる。
情報取得部110は、通信装置や記録媒体読取装置で構成され、インターネット、携帯電話回線、LAN(Local Area Network)、専用回線等の通信網102を通じて、または、CDやDVD等の記録媒体104を読み取ることで、電子書籍等の文章データを取得し、保持部112に記憶する。
保持部112は、フラッシュメモリ、HDD(Hard Disk Drive)、不揮発性RAM、EEPROM(Electrically Erasable and Programmable Read Only Memory)等の記憶媒体で構成され、複数の文章データやフォントデータ等、様々なデータを保持する。なお、HDDは正確には装置であるが、説明の便宜上本説明では他の記憶媒体と同義として扱う。
また、本実施形態において、文章データには、文章データの内容である文章を分割した部分文章毎に設けられた1または複数の部分文章データ、および、その部分文章データを特定するための部分文章記述子も含まれ、部分文章データと部分文章記述子とは関連付けられている。
図3は、文章データ150を説明するための説明図である。文章データ150の内容である文章は、上述したように複数の部分文章152に分割され、その部分文章152毎に1または複数の部分文章データ154が準備されている。部分文章152は、言い回しや前後の文章との脈絡等によって適当に纏められた1または複数の文の集合体(例えば段落)であり、各部分文章データ154は、その部分文章152の原文をデータ化したデータ、および、その原文を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータである。
したがって、1つの部分文章152について読解レベルが異なる部分文章データ154が段階的に設定されることとなる。ここでは、各部分文章データ154が、単なる漢字仮名変換や同義語変換のみならず、実際の文章における前後の脈絡や、全文章における意図を汲んだ言い回しで表現されているので、低年齢層の読者であっても文章全体としてその意図を容易に理解することができる。
また、部分文章データ154には、当該文章データ150の原文に相当する部分文章データ154も含まれているので、部分文章152に対して部分文章データ154が1つしか準備されていない場合、その部分文章データ154は原文となる。しかし、読者が理解可能な言語と異なる言語で原文が示されている場合や読解力の高い大人をもってしても読解できない文章である場合は、その原文を適切に置換した文章を原文として用いることもある。
図4は、部分文章データ154の例を示した説明図である。例えば、図1(a)に示した原文を、4つの部分文章「メロスは激怒した。」、「必ず、かの邪智暴虐の王を除かなければならぬと決意した。」、「メロスには政治がわからぬ。」、「メロスは、村の牧人である。笛を吹き、羊と遊んで暮して来た。けれども邪悪に対しては、人一倍に敏感であった。」に分割し、その分割した部分文章152それぞれに対して、図4(a)〜(d)のような複数の部分文章データ154を予め準備する。ここでは、部分文章データ154に、原文も含まれている。
例えば、部分文章「メロスは激怒した。」においては、原文である部分文章データ154a以外にも言い回しの異なる部分文章データ154b、154cが準備されている。部分文章データ154bは、小学5年生から中学1年生までの読者が理解可能な言い回しになっており、部分文章データ154cは、小学4年生以下の読者が理解可能な言い回しになっている。
また、部分文章「必ず、かの邪智暴虐の王を除かなければならぬと決意した。」は、原文の難易度が高いため、言い回しや使用する漢字がより細かく分けられ、部分文章「メロスは激怒した。」より多くの部分文章データ154(154d〜154h)が準備されている。ここでは、部分文章データ154dが原文に相当し、部分文章データ154eは、中学1年生から中学2年生までの読者が理解可能な言い回しになっており、部分文章データ154fは、小学5年生から小学6年生までの読者が理解可能な言い回しになっており、部分文章データ154gは、小学3年生から小学4年までの読者が理解可能な言い回しになっており、部分文章データ154hは、小学2年以下の読者が理解可能な言い回しになっている。
その他の、部分文章「メロスには政治がわからぬ。」には、学年に応じて言い回しの異なる3つの部分文章データ154i〜154kが、部分文章「メロスは、村の牧人である。笛を吹き、羊と遊んで暮して来た。けれども邪悪に対しては、人一倍に敏感であった。」には、学年に応じて言い回しの異なる4つの部分文章データ154l〜154oが準備されている。
ここでは、その部分文章152毎に用いられている漢字や言い回しによって、簡易な部分文章は部分文章データ154が少なく、難解な部分文章152は部分文章データ154が多くなる。このように、異なる言い回しの部分文章データ154をそれぞれの部分文章152において必要最低限準備すればよいので、変換効率の向上とデータの増加抑制を図ることが可能となる。
このような部分文章データ154は、文章データ150と共に予め準備され、例えば、文章やデータの意味や構造を記述するためのマークアップ言語であるXML(eXtension Markup Language)等を通じて提供される。
図5は、XMLによる文章データ150のイメージを説明するための説明図である。ここで、開始タグ「」および終了タグ「」は、部分文章単位を示すXMLタグであり、「gakunen-chikan-num」はその部分文章における原文以外の文章データ150の数を示し、開始タグ「」および終了タグ「」は部分文章データ154単位を示すXMLタグであり、「upper-gakunen」は部分文章データ154を特定するための部分文章記述子156を示す。ただし、図5に示したXML文章は例示に過ぎないことは言うまでもない。
このようなXMLは、インターネットとの親和性も高く、電子書籍のフォーマットとしても提案されている。なお、XMLにおいては、タグに関する「」「」等の独自の記載に限定されず、例えばHTML(Hyper Text Markup Language)に用いられるタグ(「」、「」、「」、「」)を利用してもよい。また、ここでは部分文章記述子156を学年によって特定しているが、かかる場合に限らず、年齢、性別、言語、障害レベル等によって特定することもできる。
また、部分文章記述子156は、部分文章データ154それぞれに設けられ、後述する操作部114によって得られる読者の読解力情報に基づいて1の部分文章データ154が選択されるように機能する。例えば、部分文章記述子156には、適用学年の範囲が記載され、かかる適用学年の範囲を通じて、読解力情報に含まれる学年に適合した部分文章データ154が選択される。
図5の例において、部分文章記述子156であるupper-gakunenには、適用学年の範囲の最大値が記載され、例えば、「upper-gakunen=6」と記載された部分文章記述子156は、同じ部分文章152における、自体より数値が小さく、かつ数値が最も近い部分文章記述子156の記載「upper-gakunen=4」にも基づいて、適用学年の範囲が小学5年生から小学6年生であることを特定できる。なお、部分文章記述子156が「6」を越える数値で表されている場合、その数値は、小学生の学年を基準とした中学生の学年を意味しており、例えば、部分文章記述子156の数値が「7」であれば、中学1年生を表すこととなる。
図4および図5で説明した部分文章データ154を、読者の読解力、例えば学年に応じて組み合わせると、その学年の読者が理解可能な文章が生成される。
図6は、最終的に生成される文章例を説明するための説明図である。例えば、読者が小学6年生である場合、図6(a)のように、原文ほどではないが少々難解な言い回しで表現され、読者が小学4年生であれば、図6(b)のように、図6(a)に比べ、多少読み易い言い回しで表現され、読者が小学2年生であれば、漢字や言い回しすべてにおいて、図6(a)や図6(b)の表現より簡易な表現になっている。
これらの文章は、テキスト文章の抽出(置換)といった軽負荷な処理を通じて生成されるので、その表示までに時間を要さない。また、読者は、読書中に単語の意味を調べなくてはならないといった煩わしい操作も強いられず、自分の読解力に合ったこのような文章があたかも最初から存在していたかの如く読み解くことができるので、その文意をスムーズに理解することが可能になる。
また、文章データ150全体のデータ容量は、準備した部分文章データ154の分だけ増加するが、部分文章データ154は、テキスト型のデータなので、画像や音声データに比べ、その総容量を非常に小さくすることができる。また、単純な文章の切り替えであるため、文脈を認識させて文章の各単語を機械的に変換する処理のように、無駄に高い計算能力や容量の大きなデータベースを準備する必要もない。
操作部114は、後述する表示部118上に設けられたタッチパネル、操作キー、十字キー、ジョイスティック等のスイッチから構成され、読者の操作入力を受け付ける。また、遠隔操作のためのリモートコントローラが設けられている場合、当該リモートコントローラも操作部114として機能する。また、表示部118が当該文章変換装置100と別体に設けられている場合において、表示部118上に設けられたタッチパネル、操作キー、十字キー、ジョイスティック等のスイッチからの操作入力を受け付けてもよい。
図7は、操作部114への操作入力を説明するための説明図である。本実施形態において、操作部114は、読者の操作入力に応じて、読者自身の読解力を示す読解力情報を取得する。例えば、読解力情報を入力する際には、出力部116を介して表示部118に読解力情報の入力画面160が表示され、その入力画面160の一部を読者が押止することで、操作部114であるタッチパネルが読者の押止した位置に対応する読解力情報を特定する。そして、操作部114は、取得した読解力情報を後述する処理のため、保持部112に一時的に記憶する。ここでは、説明の便宜のため、読解力を学年で表しているが、部分文章記述子156同様、年齢、性別、言語、障害レベル等、様々なパラメータによって定めることができる。
このようにして保持された読解力情報は、当該電子書籍の読書完了に伴って消去されてもよいし、当該文章変換装置100の主たる利用者の読解力として保持部112に継続的に保持されるとしてもよい。
出力部116は、後述する表示制御部134の制御指令に応じて様々な画像データを表示部118、または表示部118として機能する外部の表示装置に出力する。本実施形態においては、特に、後述する制御部120によって部分文章毎に抽出された部分文章データ154を組み合わせた文章データ150を出力する。
表示部118は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等で構成され、出力部116から出力される様々な画像データおよび文章データ150を表示する。本実施形態では、表示部118を文章変換装置100の一部として一体的に形成した例を挙げているが、かかる場合に限らず、文章変換装置100とは別体に設け、HDMI(High-Definition Multimedia Interface)ケーブルや無線LAN等の通信手段によって接続されてもよい。
制御部120は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、文章変換装置100全体を制御する。特に本実施形態において、制御部120は、記述子特定部130、文章データ生成部132、表示制御部134、文章変換部136として機能する。
記述子特定部130は、操作部114を通じて取得した読解力情報に応じて部分文章152毎に部分文章記述子156を特定する。部分文章記述子156には、上述したように、部分文章データ154を理解可能な適用学年の範囲が記載されている。したがって、記述子特定部130は、部分文章152毎に、1または複数の部分文章記述子156を読み出し、読解力情報に示された学年が適用学年の範囲に含まれる1の部分文章記述子156を、その読解力情報の部分文章記述子156であると特定する。
また、本実施形態では、部分文章152に対し、画一的に分割された学年毎に部分文章データ154を準備するのみならず、部分文章152毎に、文章の難易度や言い回しのバリエーションに応じて準備する部分文章データ154の数を変えている。すなわち、部分文章152に対して抽出可能な部分文章データ154の総数は、部分文章152それぞれで独立した数(異なり得る数)となる。
図8は、部分文章152中の部分文章データ154の分布を示した説明図である。図4と図5を用いて説明したように、部分文章データ154は、部分文章152それぞれの難易度や言い回しのバリエーションに応じて異なる数で構成され、部分文章「メロスは激怒した。」のように、部分文章データ154が少ないものから、「必ず、かの邪智暴虐〜」のように、部分文章データ154が多いものもあり、さらに、部分文章152間で部分文章データ154の学年の依存性がなく、部分文章152毎に必要かつ最低限の適切な部分文章データ154が生成されている。
また、部分文章152間で、部分文章データ154同士の境界を独立して設定できるため、部分文章毎の部分文章データ154のバリエーションは少ないものの(図8では3〜5)、組み合わせるべき部分文章152の数が多くなると、部分文章データ154の学年に対する組み合わせも多くすることができ、例えば、図8の例では7つのバリエーションを構成することが可能となる。
文章データ生成部132は、記述子特定部130によって特定された部分文章記述子156に関連付けられた部分文章データ154を保持部112から抽出し、文章データ150として組み合わせる。例えば、読解力情報に含まれる学年が小学4年生だとすると、文章データ生成部132は、図8の小学4年生に対応する4つの部分文章データ154c、154g、154k、154nを保持部112から抽出し、その順に組み合わせる。こうして、読解力情報に含まれる学年、すなわち、読者の読解力に合わせた適切な文章データ150が生成され、読者は、その文章データ150による文章を容易に理解することが可能となる。
表示制御部134は、文章データ生成部132が組み合わせた文章データ150を、出力部116を介して表示部118に表示させる。この際、文章データ150はテキストデータで構成されるので、文章データ150に含まれる補足情報であるレイアウト情報を用い、保持部112に保持されたフォントデータも参照して、文章データ150を所定のフォントの所定のポイントでイメージ化する。ここで、レイアウト情報に挿絵等が指定されている場合、表示制御部134は、かかる挿絵を保持部112から抽出し、イメージ化した挿絵をレイアウト情報が指定する位置に表示させる。また補足情報には著者や発行元等の著作権情報も含まれ、読者による操作に応じて参照できるようになっている。
また、表示制御部134は、読解力情報に応じて文章データ150の文字のポイントを調整してもよい。例えば、読解力情報に含まれる学年が低い場合、大きなポイントで文字を表示させることで、小さなポイントで読書するのに慣れていない小学1年生等の低年齢層でも、その文章を容易に把握することが可能となる。
また、読者が操作部114としてのタッチパネルを通じてページ切替操作を入力すると、表示制御部134は、そのページ切替操作で指示されたページ(例えば、次のページや前のページ)まで移動し、上記同様、文章データ150のフォント変換および挿絵挿入を実行して出力部116を介して表示部118に表示させる。
このとき、部分文章152の周囲に、その部分文章152が原文であるか言い回しを変更した文章であるかを示す(把握できる)態様で、何らかの指標を表示させてもよい。例えば、言い回しが変更されている部分文章データ154の背景色を原文の部分文章データ154と異なる色としたり、部分文章データ154の文頭または文末をマーキングしたりする。こうすることで、読者は、その部分文章152が原文であるか否かを直感的に把握することが可能となり、それが原文であること、または原文ではないことを意識して読書することができる。
文章変換部136は、文章データ150が出力部116を介して表示部118に表示された後に、操作部114としてのタッチパネルが、読者による任意の部分文章152を選択する操作入力を受け付けると、その操作入力に応じて、部分文章データ154を、同一の部分文章152に対する異なる部分文章データ154に変換する。
図9は、文章変換部136の動作を説明するための説明図である。例えば、小学4年生の読者が、図9(a)に示す文章データ150を読書しているときに、図9(a)中の部分文章データ154gの文意を理解できなかった場合、読者は、操作部114としてのタッチパネルを通じて、図9(a)の部分文章データ154gが表示されている領域を押止する。かかる押止に伴って、図9(b)に示すような選択案内画面170が表示される。読者が、その選択案内画面170のDOWNボタン「▽」を押止すると、文章変換部136は、その押止の度に部分文章152の表現を理解しやすい表現、すなわち、さらに低学年のために設定される部分文章データ154に変換し、表示制御部134は、図9(c)の如く、その変換された部分文章データ154(例えば、小学2年生以下の読者のための部分文章データ154h)を、出力部116を介して表示部118に表示させる。
ここでは、部分文章データ154を変更するにしても、その段階を大きく変更することは稀なので、選択案内画面170としてUPボタン「△」やDOWNボタン「▽」を示したが、かかる場合に限らず、例えば、その部分文章152に含まれる部分文章記述子156が対象とする年齢を表示させて、その中から所望する年齢を選択させるとしてもよい。
また、UPボタン「△」やDOWNボタン「▽」と共に選択案内画面170に原文ボタンを設け、その文章データ150の原文を直接選択させるようにしてもよい。こうして、部分文章152を読んだ後、原文の表現を知りたいときに、読者は、直接かつ迅速に原文を表示させることができる。かかる文章変換部136は、部分文章152全体を一度に変換しているので、部分文章152中の単語の意味をそれぞれ出して読者にその意味を自力で考えさせるのに比べ、確実に著者の意図を読者に伝えることができる。
以上説明した文章変換装置100によれば、部分文章152毎に読解力に応じた漢字、熟語、言い回し等に変更されるため、読者は自分の読解力を踏まえてその文章を容易に理解できる読解レベルで読書を楽しむことができる。
また、低年齢層で一度読んだ電子書籍を大人になって再度原文を読む等、読解力が身に付いた後に、その読解力に応じた部分文章152(例えば原文)を楽しむこともできる。すなわち、一度読んだ電子書籍が自身の成長に応じて廃れるのではなく、新たな価値を生み出すのである。このような時間方向の付加価値は、従来の印刷物では創造すらできず、電子データを用いるからこその付加価値である。
さらに、文章変換装置100では、部分文章152毎に抽出可能な部分文章データ154の総数が他の部分文章152と独立しているので、それぞれを組み合わせた文章データ150のパターンは無数に拡がる。しかし、その無数のパターン分だけコンテンツを準備せず、言い回しを変更する必要がある部分文章152のみ、必要数部分文章データ154を準備する構成により、そのような無数のパターンをコンパクトに纏めることができ、データ容量の増大を抑制しつつ、読解力に応じた適切な文章を読者に提供することができる。また、異なる年齢層それぞれに対してコンテンツを準備しなくても、同一のコンテンツを共通して提供できるので、コストの低減を図ることができる。このとき、学年毎にパッケージ化して提供することも可能である。
また、文章変換装置100では、変更された部分文章152においても、文章変換部136を通じて部分的に理解が難しい表現をより簡単な表現に変更することができるので、不明な点をその場で解決することが可能となる。また、より原文に近い表現や原文の表現をその都度参照することもできるので、一度その部分文章152の意味を理解した上で原文を読み解くことも可能となり、さらなる付加価値を見出すことができる。
また、コンピュータを、上記文章変換装置100として機能させるプログラムや、そのプログラムを記憶した、コンピュータで読み取り可能な記憶媒体も提供される。さらに、図8に示したような、文章を分割した部分文章152毎に、読者の読解力に応じた部分文章データ154を抽出して文章データ150を組み合わせるためのデータ構造であって、部分文章をデータ化したデータ、および、部分文章152を、想定される読解力のレベルに応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データ154と、読者の読解力に応じて部分文章152毎に部分文章データ154を特定するための部分文章記述子156と、が関連付けられており、外部装置に設定された読解力のレベルに基づいて、外部装置に、部分文章記述子156を特定させ、特定させた部分文章記述子156に関連付けられた部分文章データ154を抽出させ、文章データ150として組み合わせさせるデータ構造やそのようなデータ構造を有する記録媒体も提供される。
(文章変換方法)
次に、図10のフローチャートを用いて、電子書籍の内容を変換する文章変換方法について説明する。文章変換装置100の保持部112は、文章を分割した部分文章152をデータ化したデータ、および、部分文章152を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データ154と、部分文章データ154を特定するための部分文章記述子156とを関連付けて予め保持しているとする。
図10において、読者による操作部114への読書を所望する入力を受け付けると(S200におけるYES)、まず、出力部116を介して表示部118にコンテンツの選択画面が表示される(S202)。読者がその選択画面から1のコンテンツを選択すると(S204におけるYES)、そのコンテンツの文章データ150が保持部112から呼び出される(S206)。このとき文章データ150が保持部112に存在しない場合、情報取得部110は、インターネット等の通信網102を通じて文章データ150を取得する。
次に、表示制御部134は、図7に示した入力画面160を、出力部116を介して表示部118に表示させ(S208)、操作部114は、読者の読解力を示す読解力情報、ここでは読者の学年を取得して保持部112に一時的に記憶する(S210)。
記述子特定部130は、操作部114が取得した読解力情報に応じて、文章データ150の部分文章152毎に、文章データ150に含まれる複数の部分文章記述子156から1の部分文章記述子156を特定する(S212)。具体的に、保持部112には、1の部分文章152に対して、適用学年の範囲が排他的に分けられた複数の部分文章記述子156が準備されており、記述子特定部130は、保持部112から読解力情報である読者の学年を読み込み、その値が、どの部分文章記述子156の適用学年の範囲に含まれるか判断する。また、その部分文章152に対して1の部分文章データ154しか準備されていない場合、原文を示す部分文章データ154に関連づけられた部分文章記述子156が選択され、どの部分文章記述子156にも対応する学年が含まれない場合には、原文または原文に一番近い部分文章データ154に関連付けられた部分文章記述子156が選択される。
文章データ生成部132は、特定された部分文章記述子156に関連付けられた部分文章データ154を保持部112から抽出し文章データ150として組み合わせ(S214)、表示制御部134は、組み合わされた文章データ150を、出力部116を介して表示部118に表示させる(S216)。
以上の文章変換方法においても、これまで漢字や熟語、または言い回し等が理解できないため読むことができなかった書籍を読解力に応じた適切な言い回しに変換し、読解力の低い低年齢層の読者も容易に理解できる文章を提供することが可能となる。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
なお、本明細書の文章変換方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
本発明は、電子書籍の内容を変換する文章変換装置、文章変換方法、プログラムおよび、その文章変換装置に用いられるデータ構造に利用することができる。
100 …文章変換装置
112 …保持部
114 …操作部
116 …出力部
118 …表示部
120 …制御部
130 …記述子特定部
132 …文章データ生成部
134 …表示制御部
136 …文章変換部
150 …文章データ
152 …部分文章
154 …部分文章データ
156 …部分文章記述子

Claims (6)

  1. 文章を分割した部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、前記部分文章データを特定するための部分文章記述子とを関連付けて保持する保持部と、
    読者の読解力を示す読解力情報を取得する操作部と、
    取得された前記読解力情報に応じて前記部分文章毎に前記部分文章記述子を特定する記述子特定部と、
    特定された前記部分文章記述子に関連付けられた部分文章データを前記保持部から抽出し文章データとして組み合わせる文章データ生成部と、
    組み合わされた前記文章データを出力する出力部と、
    を備えることを特徴とする文章変換装置。
  2. 前記部分文章に対して抽出可能な部分文章データの総数は、前記部分文章それぞれで独立した数となることを特徴とする請求項1に記載の文章変換装置。
  3. 前記文章データを出力した後に、読者の操作入力に応じて、前記部分文章データを、同一の部分文章に対する異なる部分文章データに変換する文章変換部をさらに備えることを特徴とする請求項1または2に記載の文章変換装置。
  4. 文章を分割した部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、前記部分文章データを特定するための部分文章記述子とを関連付けて予め保持部に保持しておき、
    読者の読解力を示す読解力情報を取得し、
    取得した前記読解力情報に応じて前記部分文章毎に前記部分文章記述子を特定し、
    特定した前記部分文章記述子に関連付けられた部分文章データを前記保持部から抽出し文章データとして組み合わせ、
    組み合わせた前記文章データを出力することを特徴とする文章変換方法。
  5. 文章を分割した部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力に応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、前記部分文章データを特定するための部分文章記述子とを関連付けて保持する保持部と、読者の読解力を示す読解力情報を取得する操作部と、文章データを出力する出力部とを有するコンピュータを、
    取得された前記読解力情報に応じて前記部分文章毎に前記部分文章記述子を特定する記述子特定部と、
    特定された前記部分文章記述子に関連付けられた部分文章データを前記保持部から抽出し、前記出力部が出力する文章データとして組み合わせる文章データ生成部と、
    して機能させるためのプログラム。
  6. 文章を分割した部分文章毎に、読者の読解力に応じた部分文章データを抽出して文章データを組み合わせるためのデータ構造であって、
    前記部分文章をデータ化したデータ、および、前記部分文章を、想定される読解力のレベルに応じて互いに異なる言い回しに変換してデータ化したデータを含む1または複数の部分文章データと、
    読者の読解力に応じて前記部分文章毎に前記部分文章データを特定するための部分文章記述子と、
    が関連付けられており、
    外部装置に設定された前記読解力のレベルに基づいて、前記外部装置に、前記部分文章記述子を特定させ、特定させた前記部分文章記述子に関連付けられた部分文章データを抽出させ、文章データとして組み合わせさせることを特徴とするデータ構造。
JP2010099501A 2010-04-23 2010-04-23 文章変換装置、文章変換方法、プログラムおよびデータ構造 Pending JP2011227849A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010099501A JP2011227849A (ja) 2010-04-23 2010-04-23 文章変換装置、文章変換方法、プログラムおよびデータ構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010099501A JP2011227849A (ja) 2010-04-23 2010-04-23 文章変換装置、文章変換方法、プログラムおよびデータ構造

Publications (1)

Publication Number Publication Date
JP2011227849A true JP2011227849A (ja) 2011-11-10

Family

ID=45043093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010099501A Pending JP2011227849A (ja) 2010-04-23 2010-04-23 文章変換装置、文章変換方法、プログラムおよびデータ構造

Country Status (1)

Country Link
JP (1) JP2011227849A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9519637B2 (en) 2013-08-22 2016-12-13 Ricoh Company, Ltd. Text processing apparatus and text display system
JP2017215826A (ja) * 2016-06-01 2017-12-07 大日本印刷株式会社 文書データ変換装置及びプログラム
WO2018037951A1 (ja) * 2016-08-25 2018-03-01 ソニー株式会社 情報提示装置、および情報提示方法
JP2020181270A (ja) * 2019-04-23 2020-11-05 ヤフー株式会社 変換装置、変換方法及び変換プログラム
WO2023037569A1 (ja) * 2021-09-08 2023-03-16 日本電気株式会社 文章理解支援装置、文章理解支援方法およびプログラム記憶媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60263256A (ja) * 1984-06-11 1985-12-26 Toshiba Corp 習熟度機能付き計算機
JPH05128095A (ja) * 1991-11-08 1993-05-25 Canon Inc 文字処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60263256A (ja) * 1984-06-11 1985-12-26 Toshiba Corp 習熟度機能付き計算機
JPH05128095A (ja) * 1991-11-08 1993-05-25 Canon Inc 文字処理装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9519637B2 (en) 2013-08-22 2016-12-13 Ricoh Company, Ltd. Text processing apparatus and text display system
JP2017215826A (ja) * 2016-06-01 2017-12-07 大日本印刷株式会社 文書データ変換装置及びプログラム
WO2018037951A1 (ja) * 2016-08-25 2018-03-01 ソニー株式会社 情報提示装置、および情報提示方法
JP6460286B2 (ja) * 2016-08-25 2019-01-30 ソニー株式会社 情報提示装置、および情報提示方法
JPWO2018037951A1 (ja) * 2016-08-25 2019-02-14 ソニー株式会社 情報提示装置、および情報提示方法
JP2019071089A (ja) * 2016-08-25 2019-05-09 ソニー株式会社 情報提示装置、および情報提示方法
JP7087987B2 (ja) 2016-08-25 2022-06-21 ソニーグループ株式会社 情報提示装置、および情報提示方法
US11495209B2 (en) 2016-08-25 2022-11-08 Sony Corporation Information presentation device, and information presentation method
JP2020181270A (ja) * 2019-04-23 2020-11-05 ヤフー株式会社 変換装置、変換方法及び変換プログラム
JP7191763B2 (ja) 2019-04-23 2022-12-19 ヤフー株式会社 変換装置、変換方法及び変換プログラム
WO2023037569A1 (ja) * 2021-09-08 2023-03-16 日本電気株式会社 文章理解支援装置、文章理解支援方法およびプログラム記憶媒体

Similar Documents

Publication Publication Date Title
Waller Graphic literacies for a digital age: The survival of layout
CA2818004C (en) Text conversion and representation system
JP2011227849A (ja) 文章変換装置、文章変換方法、プログラムおよびデータ構造
KR101936208B1 (ko) 현대 한국어에서 대표할 수 있는 발음으로 중국 전통 음운학 사호이론에 부합하는 중성자모체계와 한글 합자법을 활용한 중문표기 제공방법 및 시스템
JP2006024204A (ja) テキストメッセージング装置
Mesch et al. Sign language resources in Sweden: Dictionary and corpus
Dasgupta et al. A speech enabled Indian language text to Braille transliteration system
Rießler Towards a digital infrastructure for Kildin Saami
EP4080399A1 (en) Information processing program, information processing method, and information processing device
WO2020036011A1 (ja) 情報処理装置、情報処理方法、および、プログラム
Yamaguchi et al. Accessible authoring tool for DAISY ranging from mathematics to others
JP2020064428A (ja) コンテンツの表示方法および装置
Jung et al. Solving the great Indian text input puzzle: touch screen-based mobile text input design
Kouroupetroglou Incorporating typographic, logical and layout knowledge of documents into text-to-speech
Heumader et al. The EasyReading framework-keep the user at the digital original
KR101100848B1 (ko) 어휘 데이터베이스를 생성하는 방법 및 그 어휘 데이터베이스를 저장하는 컴퓨터 판독가능 매체
KR102129726B1 (ko) 영어학습교재 및 사용자 단말을 이용한 영어학습방법
Kouroupetroglou Acoustic mapping of visual text signals through advanced text-to-speech: the case of font size
Yamaguchi et al. On necessity of a new method to read out math contents properly in DAISY
Liu et al. Automatic translation for Chinese mathematical Braille code
Mahajan Impact of Digital Communication on Written English Language
Williams et al. The Chinese Language
JP2004185410A (ja) データシステム、電子マニュアル、電子教科書、電子百科事典、ホームページ
Lindmark et al. Introduction: The many faces of literacy
Khalil Arabic Writing in the Digital Age: Towards a Theoretical Framework

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130924