JP2002163250A

JP2002163250A - 文書処理装置

Info

Publication number: JP2002163250A
Application number: JP2001305858A
Authority: JP
Inventors: Osamu Yasui; 治安井
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2001-10-01
Filing date: 2001-10-01
Publication date: 2002-06-07

Abstract

(57)【要約】【課題】文書を読む際の思考を中断させたりする不都合
が生じないように文章作成の際の改行の仕方の当否を的
確に判断することができる文書処理装置を提供する。【解決手段】出力すべき文字列を構文分析し、形態素列
の中の各形態素を葉として有する第１の構文解析木と、
該形態素列の中の各形態素を葉として有する第２の構文
解析木とを求める機構と、出力すべき文字列を意味解析
して、該形態素列の中の各形態素の意味属性を求める機
構と、改行位置の好適性と割り付け方向の幅とに関する
所定の評価に基づき、形態素的にまたは意味的に関連が
深く、その出力時に一行中で占有される文字列の長さが
好適であるような改行箇所を決定する機構とを備え、出
力すべき文字列について所要の構文解析および意味解析
を行い、特に意味的に関連が深い文字列部位が同一行に
出力される位置を改行位置として選択する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ワードプロセッサ等の
日本語の文書処理装置に関するものであり、特に、ある
所定の文書を作成する際の改行位置の選定のまずさに起
因して、当該文書に対して読者の誤解を招いたり、また
は、文書を読む際の思考を中断させたりする不都合が生
じないようにされた、文章作成の際の改行の仕方の当否
を的確に判断することができる文書処理装置に関するも
のである。

【０００２】

【従来の技術】従来の日本語文書処理装置においては、
通常、いわゆるべた書きの文章を入力して、べた書きの
文章を出力するようにしていた。このような従来の装置
においては、例えば句点［。］は文章の行頭には来ない
等の、ある特定の文字による禁則処理は行われる（例え
ば特開昭５２−１６１５０９号公報を参照）ことはある
が、原則的には、（例えば１行当り３６文字というよう
な）ある所定の文字数毎に改行するようにされている。
なお、別の刊行物である特開平４−１６７０４９号公報
［文書処理装置］には、この発明の技術とやや類似する
技術が開示されているけれども、「実際に割り付けるべ
き文字列の幅をそのフォント、サイズを含む形式で算出
して改行位置の好適性を評価する」ようにしている点で
差異が存するものである。

【０００３】

【発明が解決しようとする課題】ところが、上記された
ような従来の日本語文書処理装置においては、取り扱わ
れる文章の内容と文書作成の際の改行位置の選定とは相
互に殆ど無関係に行われていた。このことから、上記従
来の文書処理装置では、以下のように改行位置によって
は著しい誤解を誘発することがあるという問題点があっ
た。即ち、［１］例えば図３２において示されているように、例
文３２Ａの文章中に「杉良太郎」なる姓名が出現した場
合、この姓名が「杉（姓）」＋「良太郎（名）」なの
か、または、この図３２において分割されているような
「杉良（姓）」＋「太郎（名）」なのかは、例文３２Ａ
を一見しただけでは即座に正しく判断することはできな
い。即ち、作成される文章行の切れ目と、当該文章の構
造的な（意味的な）切れ目とを一致させることなく前記
図３２のような改行がなされた場合には、本来は「杉
（姓）」＋「良太郎（名）」と解釈すべきところを、
「杉良（姓）」＋「太郎（名）」と誤解される恐れが生
じることになる。［２］また、例えば図３３において示されているよう
に、例文３３Ａの文章中に「男らしい花子／のお兄さ
ん」（ここで、［／］は改行の位置を示す）なる文節が
出現した場合には、その改行の位置のために、意味的に
は無理のない「花子のお兄さん」なる文字列よりも先
に、「男らしい花子」なる文字列が読者の視界に飛び込
んでくることがある。かくして、本来は「男らしい」＋
「花子のお兄さん」と解釈されるべきところを、「男ら
しい花子」＋「の」＋「お兄さん」のように誤解された
り錯覚されたりして、当該読者の思考過程に混乱を生じ
させることになる。ここで生じる読者の思考過程の混乱
は、「男らしい」という文字列を見た読者が、［男性］
を表す語が前記の文字列に続くものと即座に期待したと
ころ、この期待に反して「花子」という［女性］を想起
させる語だけが存在しており、［男性］を想起させる
「お兄さん」という文字列が見当たらないと錯覚するこ
とに起因している。即ち、ここでの読者は、「花子」と
いう文字列を見た瞬間に、期待していた［男性］を表す
語とは正反対の［女性］を表す語が出現したことに矛盾
を感じるとともに、この矛盾を解消する「お兄さん」と
いう文字列が直ちには発見されないことから、その思考
の過程に混乱が生じて当該思考自体が停止してしまうこ
とになる。

【０００４】本発明は上記のような問題点に鑑みてなさ
れたものであり、ある所定の文章について意味的に結び
付きが弱い文字同士の間（切れ目）で改行を施すように
して、不用意な改行による読者の誤解や、前記読者の思
考停止等を防止できるようにすることを目的とする。

【０００５】

【課題を解決するための手段】本発明は上記問題点を解
決するためになされたものであり、本発明に係る文書処
理装置は、所定の文字列を対象とする割り付け可能領域
の幅と、実際に文字列が割り付けられた領域の幅とを評
価することにより、該所定の文字列における改行箇所を
決定する機構を備えてなる文書処理装置であって、出力
すべき文字列について形態素解析を行うことにより該文
字列を構成する形態素列を求める機構と、出力すべき文
字列を構文分析し、形態素列の中の各形態素を葉として
有する第１の構文解析木と、該形態素列の中の各形態素
を葉として有する第２の構文解析木とを求める機構と、
出力すべき文字列を意味解析して、該形態素列の中の各
形態素の意味属性を求める機構と、ある所定の評価に基
づいて、適切な幅の文字列が同一行に出力可能になるよ
うに、ある所定の文字列の直後における改行位置の好適
性を求める機構と、現在割り付け中の割り付け領域にお
ける割り付け方向の幅を保持する機構と、前記改行位置
の好適性と割り付け方向の幅とに関する所定の評価に基
づき、形態素的にまたは意味的に関連が深く、その出力
時に一行中で占有される文字列の長さが好適であるよう
な改行箇所を決定する機構とを備えてなることを特徴と
するものである。

【０００６】

【作用】本発明に係る文書処理装置によれば、所定の文
字列を対象とする割り付け可能領域の幅と、実際に文字
列が割り付けられた領域の幅とを評価することにより、
該所定の文字列における改行箇所を決定する際に、ある
所定の形態素に対応する位置で改行すると一行に割り付
けられる文字列の幅が所定の閾値を満たさないときに
は、予め設定された改行位置の好適性に関する情報に基
づいて、該当の形態素に対応する位置以外の位置での改
行が許容されるという利点が得られ、出力すべき文字列
について所要の構文解析および意味解析を行い、特に意
味的に関連が深い文字列部位が同一行に出力される位置
が改行位置として選択されるという利点が得られる。

【０００７】

【実施例】図１は、本発明の第１の実施例に係る文書処
理装置の構成を示すブロック図である。この図１におい
て、第１の構成部としての格納部に含まれるものは「文
書ファイル（１）」および「フォント格納装置（２）」
である。そして、前者である「文書ファイル（１）」に
は、ある所定の文章について、当該文章を構成する文字
列と各文字に対応する表示プロパティの並びとして（文
章の）格納がなされている。なお、ここでの表示プロパ
ティとしては、少なくとも文字毎のフォントおよびサイ
ズを指定するものがある。また、後者である「フォント
格納装置（２）」には、例えば［１２ポイントの明朝体
の「あ」］のような、文字毎のフォントが格納されてい
る。次に、第２の構成部としての割り付け部に含まれる
ものは「割り付け装置（３）」および「行バッファ
（６）」である。そして、前者である「割り付け装置
（３）」においては、対象の文章が１文（単位文）ずつ
読み込まれ、また、１行（単位行）ずつ割り付けられ
る。また、後者である「行バッファ（６）」において
は、後段の出力装置（９）に伝送されるべき割り付け結
果が、（１行単位をもって）蓄積されることになる。第
３の構成部としてのレジスタ部に含まれるものは「状態
変数レジスタ（４）」および「全出力幅レジスタ
（５）」である。そして、前者である「状態変数レジス
タ（４）」においては、行バッファ（６）の現在の充満
度を示す所定の値が蓄積される。また、後者である「全
出力幅レジスタ（５）」においては、前記行バッファ
（６）の最大容量を示す所定の値が蓄積されることにな
る。第４の構成部としての改行評価部は「改行可否判定
装置（７）」である。この「改行可否判定装置（７）」
においては、読み込まれた文章に関する解析結果、文字
毎のフォントおよび各レジスタ内の蓄積値に基づいて、
当該文章のある所定の位置における改行の可否（または
改行の好ましさ）のいかんに関する判定がなされる。そ
して、この判定の結果に依存して対象とする文章の改行
箇所が決定され、しかるべき改行命令を発行するように
される。第５の構成部としての解析部は「形態素解析装
置（８）」である。この「形態素解析装置（８）」にお
いては、読み込まれた文章について、所要の形態素解析
が実行される。なお、ここでの第１の実施例に係る文書
処理装置においては、正しい形態素解析結果だけが改行
の可否判定のために用いられる。そして、第６の構成部
としての出力部は「出力装置（９）」である。この「出
力装置（９）」においては、対象とする文章に関する割
り付け処理の結果や、前段の行バッファ（６）側から伝
送された内容が出力される。

【０００８】上記第１の実施例装置は以下のように動作
する。即ち、まず「割り付け装置（３）」においては、
「文書ファイル（１）」に格納されている文章を対象と
して、１文（ある所定の単位長の文）ずつ読み込まれ
る。そして、このように読み込まれた文章は、１行分ず
つ「行バッファ（６）」に格納される。このとき、前記
対象とする文章の改行箇所については、「改行可否判定
装置（７）」によって決定され、この決定に基づく所定
の改行命令が発行される。この改行命令を受け取った
「割り付け装置（３）」においては、「行バッファ
（６）」の内容をクリアしながら「出力装置（９）」に
伝送するようにされる。

【０００９】「改行可否判定装置（７）」においては、
解析対象として読み込まれた文章、その解析結果、文字
毎のフォント、および、レジスタ部の各レジスタ（状態
変数レジスタ４および全出力幅レジスタ５）に蓄積され
ている値に基づいて、前記の文章における改行箇所を決
定するようにされる。

【００１０】ここで読み込まれた文章の解析について
は、解析部をなす「形態素解析装置（８）」によって実
行される。そして、ここで得られた解析結果の所要のも
のは「改行可否判定装置（７）」に対して伝送される。

【００１１】文字毎のフォントおよびレジスタ毎の値
は、それぞれに、「フォント格納装置（２）」および各
レジスタ（即ち、「状態変数レジスタ（４）」および
「全出力幅レジスタ（５）」より得られる。なお、ここ
での各レジスタ値は、「割り付け装置（３）」によって
予め設定されるものである。このような割り付け処理が
なされてから、「出力装置（９）」においては、１行分
ずつ受け取った文章を出力するようにされる。

【００１２】ここでは、「．．．今日の会場は日本橋本
町（にほんばし・ほんまち）です。．．．」なる例の文
章を出力する場合について考察する。ここでの例文にお
いて、前述された従来の方式によると、図２の例文２Ａ
で示されているように、［日本］と［橋本町］との間で
改行されたときには、［日本・橋本町（にほん・はしも
とちょう）］のような甚だしい誤解が起きやすくなって
しまう。これに対して、上記第１の実施例においては、
以下のような改行をするようにされる。前述されたよう
に、「．．．今日の会場は日本橋本町（にほんばし・ほ
んまち）です。．．．」なる文章は「文書ファイル
（１）」に格納されている。ここでの「文書ファイル
（１）」には、前記図１に示されているように、ある文
字列（ｃ）と文字毎に対応する表示プロパティ（少なく
ともフォント（ｆ）とサイズ（ｓ）とを含んでいる）の
並びとして、対象の文章が格納されている。

【００１３】前記「文書ファイル（１）」に格納されて
いる文章は１文ずつ読み込まれていく。そして、このよ
うに読み込まれた文字列データ（ｃ）は、「形態素解析
装置（８）」によって所要の形態素解析がなされる。こ
こで形態素解析がなされた結果は、「改行可否判定装置
（７）」に保持された「ｍ−Ｗテーブル（７１）」
（図４を参照）に書き込まれていく。ここでの「ｍ−Ｗ
テーブル（７１）」は、形態素毎の出力がなされる際
の出力幅を記載するために用いられるテーブルであり、
以下の４個の要素からなる記載欄の並びを備えている。
即ち、ｍ：形態素；ｉ１：該当の形態素は文の何番目の
文字からなのか；ｉ２：該当の形態素は文の何番目の文
字までなのか；Ｗ：該当の形態素を出力する際の出力幅
はいくらなのか；という記載欄の並びを備えている。そ
して、前述された形態素解析の結果として、その中の
ｍ，ｉ１，ｉ２が求められることになる。

【００１４】いま、例えば「今日の会場は日本橋本町で
す。」なる文章部分が読み込まれるとすると、はじめに
下記のような解析がなされる。即ち、［今日／の／会場
／は／日本橋／本町／です。］のような解析がなされ
る。その結果として、前記図４のように「ｍ−Ｗテー
ブル（７１）」のｍ，ｉ１，ｉ２が（例えば、今日：
１：２：のように）埋められることになる。

【００１５】次に、前記「ｍ−Ｗテーブル（７１）」
におけるＷの値は次のようにして求められる。いま、
「文書ファイル（１）」に格納された文字列（ｃ），プ
ロパティのフォント（ｆ）およびサイズ（ｓ）が「改行
可否判定装置［７］」を介して与えられると、「フォン
ト格納装置［２］」からは当該の文字を出力する際の出
力幅（ｗ（ｃ，ｆ，ｓ））が得られる。すると、おのお
のの形態素の出力幅（Ｗ）は以下の式で求められる。

【数１】

【００１６】例えば、「今日の会場は日本橋本町で
す。」の任意の文字のプロパテイが［ｆ＝明朝体，ｓ＝
１２ポイント］であり、このときの［ｗ（ｃ，ｆ，
ｓ）＝１０００（ただし，ｗ（［。］，［明朝体］，
［１２ポイント］）だけは例外で２００）］とする
と、各形態素に対応するＷは以下のように求まり、前
記図４における「ｍ−Ｗテーブル（７１）」は図５に
示されているように完成する。即ち、「ｍ−Ｗテーブ
ル（７１）」におけるＷの欄が所定の値で埋められた
ことになる。

【００１７】前記の図５に示されているように「ｍ−Ｗ
テーブル（７１）」が完成すると、これに続けて割り
付け処理が実行される。ここでの割り付け処理は、「行
バッファ（６）」を有する「割り付け装置（３）」にお
いて１行ずつ実行されるが、対象とする文章の改行位置
の選択については、「改行可否判定装置（７）」におい
て決定されて、対応の改行命令（ＣＲ）を下すようにさ
れる。なお、ここでの「改行可否判定装置（７）」にお
いては、対象とする文章の改行位置を決めるために次の
２個の値（Ｇ，Ｍ）が用いられる。即ち、［１］Ｇ：「割り付け装置（７）」における「行バッフ
ァ（６）」の現在の状態を表す値；この値は「状態変数
レジスタ（４）」に格納されるものである；ここでは、
行バッファ（６）に文字を埋めることができる残りの幅
を示す。［２］Ｍ：「割り付け装置（７）」における現在割り付
け中の「行バッファ（６）」の最大容量幅を表す値；こ
の値は「全出力幅レジスタ（５）」に格納されている。
これらの値は図６に示されたようになる。

【００１８】次に、対象とする文章における改行可否の
判定は、図７のフローチャートで示された手順で実行さ
れる。この図７において、例えば、「今日の会場は日本
橋本町です。」なる文章の割り付けをするときには、以
下のような作業がなされる。なお、ここでは次の場面が
想定されている。即ち、Ｍ＝２００００；Ｇ＝８９０
０（現在の行にはすでに１１１００の幅に割り付けがさ
れている）；なる場面が想定されている。まず、割り付
けの対象となるのは「今日」であることから、Ｓｔｅｐ
１において、次に割り付ける形態素のＷをｍ−Ｗテ
ーブル７１（図５）から求める。ここで問題とされてい
るものは「今日」であるから、前記のｍ−Ｗテーブル
７１に基づいてＷ＝２０００が求められる。次のＳｔ
ｅｐ２においては、現在の対象である「今日」につい
て、Ｇ＞Ｗ？が成立するか否かの判定がなされる。ここ
ではＧ＝８９００，Ｗ＝２０００，であり、前記のＧ
＞Ｗ？は成立する（図８）から、後のＳｔｅｐ５に進
む。Ｓｔｅｐ５においては、現在の対象である「今日」
が行バッファ（６）に伝送される。これに続くＳｔｅｐ
６においては、次のようにしてＧを更新する。即ち、
Ｇ＝８９００−２０００＝６９００が、新しいＧにさ
れる。次のＳｔｅｐ７においては、現在の対象である
「今日」について、これで文章が終りであるか否かの判
定がなされる。ここでは、次の形態素である「の」が続
いており、文章の終りにはならない。そこで、始めのＳ
ｔｅｐ１に戻って、次に続く形態素の処理を続行するよ
うにされる。そして、以下に続く「の」（Ｗ＝１００
０），「会場」（Ｗ＝２０００），「は」（Ｗ＝１００
０），までは始めの「今日」と同様な割り付け処理がな
される。そして、次に「日本橋」を出力する場面を迎え
ることになる。このときには、Ｇ＝２９００にされて
いる。ここで改めてＳｔｅｐ１に戻り、現在の形態素で
ある「日本橋」が処理の対象にされる。ここでｍ−Ｗ
テーブル７１（図５）を参照することにより、Ｗ＝３
０００が求められる。次のＳｔｅｐ２においては、現
在の対象である「日本橋」について、Ｇ＞Ｗ？が成立す
るか否かの判定がなされる。ここではＧ＝２９００，
Ｗ＝３０００，であり、前記のＧ＞Ｗ？は成立しない
（図９）から、後続のＳｔｅｐ３に進むことになる。後
続のＳｔｅｐ３においては、現在の対象である「日本
橋」について、割り付け装置（３）に対して所定の改行
命令を伝送するようにされる。これに続くＳｔｅｐ４に
おいては、改行の実行にともなうＧの初期化がなされ
る。即ち、Ｇ＝２００００（Ｍ）であるようにされる。
後続のＳｔｅｐ５においては、現在の対象である「日本
橋」が行バッファ（６）に伝送される。次に続くＳｔｅ
ｐ６においては、現在の対象である「日本橋」に関連し
てＧの更新がなされる。即ち、Ｇ＝２００００（Ｍ）
−３０００（Ｗ）＝１７０００なる計算に基づくＧの
更新がなされる。次のＳｔｅｐ７においては、現在の対
象である「日本橋」について、これで文章が終りである
か否かの判定がなされる。ここでは、次の形態素である
「本町」が続いており、文章の終りにはならない。そこ
で、始めのＳｔｅｐ１に戻って、次に続く形態素の処理
を続行するようにされる。以下、「本町」（Ｗ＝２００
０），「です。」（Ｗ＝２２００），と同様な割り付け
処理が進行して、最後の形態素である「です。」を対象
とするＳｔｅｐ５を迎えることになるが、この「で
す。」は最後の形態素であることから、これに対するＳ
ｔｅｐ７においては次に続く形態素が存在せず、処理対
象の文章が終ったとしてＥＮＤに進み、これに続く別
の対象の文章に対する処理に入ることになる。

【００１９】なお、本発明には割り付け位置情報そのも
のから改行の可否を判定する場合も含まれているが、上
記第１の実施例においては、前記の値Ｇを「あとどれ
だけの幅の割り付けができるか」を示すものとして改行
の可否を判定する場合について説明した。また、上記第
１の実施例における「割り付け装置（３）」は、ある所
定の改行命令が与えられた時点において、必要に応じて
行バッファ（６）の内容のジャスティファイやセンタリ
ングを行う。そして、その割り付け結果を「出力装置
（９）」に渡し、行バッファ（６）のクリアをする。最
後に、「出力装置（９）」においては、受け取った割り
付け結果を必要に応じて出力することになる。

【００２０】図１０は、本発明の第２の実施例に係る文
書処理装置（改行評価装置）の構成を示すブロック図で
ある。この図１０において、第１の構成部としての格納
部に含まれるものは「文書ファイル（１）」および「フ
ォント格納装置（２）」である。そして、前者である
「文書ファイル（１）」には、ある所定の文章につい
て、当該文章を構成する文字列と各文字に対応する表示
プロパティの並びとして（文章の）格納がなされてい
る。なお、ここでの表示プロパティとしては、少なくと
も文字毎のフォントおよびサイズを指定するものがあ
る。また、後者である「フォント格納装置（２）」に
は、例えば［１２ポイントの明朝体の「あ」］のよう
な、文字毎のフォントが格納されている。次に、第２の
構成部としての割り付け部に含まれるものは「割り付け
装置（３）」および「行バッファ（６）」である。そし
て、前者である「割り付け装置（３）」においては、対
象の文章が１文（単位文）ずつ読み込まれ、また、１行
（単位行）ずつ割り付けられる。また、後者である「行
バッファ（６）」においては、後段の出力装置（９）に
伝送されるべき割り付け結果が、（１行単位をもって）
蓄積されることになる。第３の構成部としてのレジスタ
部に含まれるものは「状態変数レジスタ（４）」，「全
出力幅レジスタ（５）および最小出力幅レジスタ（１
０）」である。そして、第１のレジスタである「状態変
数レジスタ（４）」においては、行バッファ（６）の現
在の充満度を示す所定の値が蓄積される。第２のレジス
タである「全出力幅レジスタ（５）」においては、前記
行バッファ（６）の最大容量を示す所定の値が蓄積され
る。そして、第３のレジスタである「最小出力幅レジス
タ（１０）」においては、行バッファ（６）の充満度の
最低目標値が蓄積されることになる。第４の構成部とし
ての改行評価部は「改行可否判定装置（７）」である。
この「改行可否判定装置（７）」においては、読み込ま
れた文章に関する解析結果、文字毎のフォントおよび各
レジスタ内の蓄積値に基づいて、当該文章のある所定の
位置における改行の可否（または改行の好適性）のいか
んに関する判定がなされる。そして、この判定の結果に
依存して対象とする文章の改行箇所が決定され、しかる
べき改行命令を発行するようにされる。第５の構成部と
しての解析部は「形態素解析装置（８）」である。この
「形態素解析装置（８）」においては、読み込まれた文
章について、所要の形態素解析が実行される。なお、こ
こでの第２の実施例に係る文書処理装置においては、正
しくない形態素解析結果も改行の可否判定のために合わ
せて用いられる。そして、第６の構成部としての出力部
は「出力装置（９）」である。この「出力装置（９）」
においては、対象とする文章に関する割り付け処理の結
果や、前段の行バッファ（６）側から伝送された内容が
出力される。

【００２１】前述された本発明の第１実施例において
は、前記されたような出力がなされることから、図１１
において例文１１Ａとして示されるような、［今日の会
場は日本／橋本町です。］なる文章の［本］と［橋］と
の間で改行されることがなくなり、前記図１１に続く図
１２において例文１２Ａとして示されるように、［今日
の会場は／日本橋本町です。］なる文章の［は］と
［日］との間で改行されることになる。かくして、著し
く誤解を誘発するような表示は巧みに避けられたことに
なる。

【００２２】しかしながら、前記第１実施例の装置にお
いては、著しく誤解されやすい出力がなされることを回
避するために、形態素単位で一律に（即ち、機械的に）
改行するやり方が採用されている。ところで、前記第１
実施例の装置によれば、ある対象の文章における改行位
置を決めるときには、正しく形態素解析された結果の文
章の切れ目と該改行位置とが必ず一致するようにされる
だけであり、例えば、いずれかの出力行が短くなりすぎ
ることが生じるかどうかについては、何等の考慮も払わ
れていない。

【００２３】しかるに、前記図１２に例示された改行箇
所を有する文章のような場合には、形態素［日本橋］の
途中において（図１３に例示されている）［日／本橋］
のように改行箇所が選定されたとしても、必ずしも誤解
しやすい出力になるとは限らないということができる。
この理由は、前記該当の改行箇所が、間違って形態素解
析された結果の切れ目とは一致していないことにある。
ここで、例えば「日本」／「橋本町」のように間違えて
形態素解析される要因としては以下のことが挙げられ
る。いま、次の形態素が存在するとする。即ち、（１）「日本」という形態素は存在する。（２）「橋本町」という形態素は存在する。ここで、「日本／橋本町」なる改行がなされるとする
と、「日本」という文字列の塊と「橋本町」という別の
文字列の塊とが真っ先に（かつ同時に）目に入ってくる
のが通常であり、「日本／「橋」という文字列の塊と
「本町」という別の文字列の塊とが真っ先に（かつ同時
に）目に入ってくることは殆どあり得ないことである。
ところで、１］「日本」という文字列の塊を一つの形態素と解釈し
ても違和感が生じることはない。また、２］「橋本町」という別の文字列の塊についても一つの
形態素と解釈して違和感を生じることはない。このため
に、「日本」＋「橋本町」と誤解してしまうことがある
（なお、ここで、「日本」と「橋本町」との間に切れ目
がないと即座に判断ないし推察をすることは無理もしく
は不可能なことであろう）。その一方、例えば図１３に
おいて「日」＋「本橋」と解釈することには違和感がと
もない、ここでの例文を読む者は「日」と「本橋」と間
には切れ目がないと即座に推察することができる。

【００２４】本発明に係る上記第２実施例装置は前述の
事項に鑑みて構成されたものであり、その最終的な出力
行が短くなりすぎる場合に限り、「正しい形態素解析結
果での切れ目ではなくても、間違った解析結果での切れ
目でもない」ときには、形態素の途中においても改行を
行うことが許容されたものである。なお、ここでの出力
行が短すぎるかどうかを判断する際には、例えば、（標
準的な出力行として）予め設定された、ある所定の閾値
との対比をすることによってなされる。ただし、本発明
の最も重要な目的は「著しく誤解しやすい出力が生じる
ことを回避する」ことにあり、このために、例え出力行
の長さがある所定の閾値以下であっても、これを無視し
て改行することがあり得る。

【００２５】本発明に係る第２の実施例装置の説明にお
いても、前述された第１の実施例装置の場合と同様に、
「．．．今日の会場は日本橋本町（にほんばし・ほんま
ち）です。．．．」なる文章を例として、この文章を具
体的にどのようにして出力するかの検討をする。この第
２の実施例装置においても、対象の文章が「形態素解析
装置（８）」によって形態素解析されるところまでは、
前述された第１の実施例装置の場合と全く同じである。

【００２６】まず、「．．．今日の会場は日本橋本町
（にほんばし・ほんまち）です。．．．」なる前記の文
章は「文書ファイル（１）」に格納されている。なお、
この「文書ファイル（１）」には、ある所定の文字列
（ｃ）と前記文字列の文字毎に対応する表示プロパティ
（例えば、文字毎に少なくともフォント（ｆ）とサイズ
（ｓ）とを含むもの）の並びとからなるデータが、ある
所定の文章として格納されている。この「文書ファイル
（１）」に格納されている文章は１文ずつ読み込まれて
いくことになる。そして、このようにして読み込まれた
文章に対応する文字列データ（ｃ）は「形態素解析装置
（８）」によって所要の形態素解析がなされる。（前述
されたように、この段階までは本発明に係る第１の実施
例装置の場合と同じである。）

【００２７】本発明に係る第２の実施例装置における形
態素解析は次のようにして実行される。即ち、（１）まず、ある所定の形態素解析の結果として、幾
つかの形態素列が選定候補として得られる。（２）このようにして得られた選定候補から、正しい
解析結果の形態素列が決定される。（なお、前記（１）
で得られた形態素列は、間違って形態素解析されたもの
も併せて保持されることになる）。

【００２８】いま、前記された文例としての「今日の会
場は日本橋本町です。」なる文章部分が読み込まれると
すると、ここでは次のように解析された３個の形態素列
が得られる。即ち、（１）今日／の／会場／は／日本橋／本町／です。（２）今日／の／会場／は／日本／橋本町／です。（３）今日／の／会場／は／日本／橋本／町／です。
のように解析された３個の形態素列が得られることにな
る。

【００２９】これに続けて、世界知識［人間世界におい
て約束事とされているような知識。例えば、「日本」と
いうような国名の直後に「橋本町」というような町名が
くることはないというような知識。］などを用いた解析
やユーザ指定［ある所定の情報については現に使用して
いる計算機には与えられておらず、例えば、「日本橋本
町」は「にほん・はしもとちょう」ではなく、「にほん
ばしほんまち」であるという情報が与えられていないと
きに、必要に応じて当該計算機のユーザに指定（入力）
をしてもらうことであり、幾つかの形態素列が得られた
ときに、いずれが正しいものであるかの指定が該ユーザ
によってなされることになる］などのやり方に従って、
形態素解析結果のいずれが正しいものであるかが決定さ
れる。この結果として判明されることは、前記３個の形
態素列の中で、「（１）今日／の／会場／は／日本橋
／本町／です。」が正しい形態素列であるということで
ある。そして、このようにして得られた形態素解析結果
は、その改行位置を判定するために、「形態素解析装置
（８）」内に（誤りの解析結果をも含めて）保持される
（図１４を参照：即ち、この図１４においては、正しい
形態素列については［〇］が付されており、また、誤り
の形態素列については［×］が付された状態にされてい
る）。

【００３０】本発明に係る第２の実施例装置において
は、判定に用いられるべきデータが、予め「改行可否判
定装置（７）」の所定のテーブルに保持されているもの
とする。このテーブルは「ｃ−ｗテーブル（７２）」
と呼ばれるものであり、各々の文字（ｃ）について、そ
れぞれを出力する際の出力幅（ｗ）と、ある所定の文字
の直後における改行の可否に関する評価（ｅｖａｌ）と
を保持するようにされる。ここで、先に得た形態素解析
結果は次の手順で（ｅｖａｌ）に書き込まれていく。即
ち（図１５に示されているように）、Ｓｔｅｐ１：全ての欄を条件付改行可能コード（ここで
は［△］）によって埋める。Ｓｔｅｐ２：間違って解析された形態素列のそれぞれに
対して、切れ目に当る文字の（ｅｖａｌ）欄に改行禁止
コード（ここでは［×］）を書き込む。Ｓｔｅｐ３：正しく解析された形態素列に対して、切れ
目に当る文字の（ｅｖａｌ）欄に改行可能コード（ここ
では［○］）を書き込む。なお、書き込みには上書きも認められている。

【００３１】その一方、ｗの値については、前記され
た本発明に係る第１の実施例装置の場合と同様に（ｃ，
ｆ，ｓ）の各値が与えられると、「フォント格納装置
（２）」を参照することによって次のように得られる。
即ち、（ｗ←ｗ（ｃ，ｆ，ｓ））のようにして得られ
る。なお、前記された（ｃ，ｆ，ｓ）の各値は「文書フ
ァイル（１）」に格納されている。このようにして、所
期の「ｃ−ｗテーブル（７２）」が作成される（図１
６を参照）。

【００３２】ここで「ｃ−ｗテーブル（７２）」が完
成すると、前記された本発明に係る第１の実施例装置の
場合と同様に、これに続けて所要の割り付け処理が実行
される。ここでの割り付け処理は、「行バッファ
（６）」が付属する「割り付け装置（３）」において１
行ずつ実行されるが、対象とする文章の改行位置をどこ
にするかは「改行可否判定装置（７）」が決定する事項
であり、ここでの決定に応じて所定の改行命令（ＣＲ）
を下すようにされる。本発明に係る第２の実施例装置に
よれば、この「改行可否判定装置（７）」においては、
前記の改行位置を決めるために４個の値が用いられる。
即ち、後述されるような４個の値［Ｃ，Ｍ，Ｌ，Ｗ］が
用いられる。（１）Ｃ：「割り付け装置（３）」における現在割り付
け中のテキスト領域の「行バッファ（６）」の現在の状
態を表す値；この値は「状態変数レジスタ（４）」に格
納される；ここでは、「行バッファ（６）」を既に埋め
ている文字の幅を示す。（２）Ｍ：「割り付け装置（３）」における現在割り付
け中のテキスト領域の「行バッファ（６）」の最大容量
幅を表す値；この値は「全出力幅レジスタ（５）」に格
納される；これは絶対的尺度である。（３）Ｌ：「割り付け装置（３）」における現在割り付
け中のテキスト領域の「行バッファ（６）」の最小容量
幅を表す値；出力行が短すぎるか否かを判定するための
しきい値を表す値；ただし、これは絶対的尺度ではない
（例えば、他の尺度を優先させるために、容量幅がＬ未
満になることが容認されることもある；この値は「最小
出力幅レジスタ（１０）」に格納される。（４）Ｗ：割り付け対象である文字列を出力する際の全
出力幅；「ｃ−ｗテーブル（７２）」を参照すること
によって求めることができる。

【００３３】ここでの改行の当否の判定は以下のように
して行われる。ｉｆＣ＋Ｗ ≦ Ｍ．．．．．．．．．．（１）ｔｈｅｎ改行しないｅｌｓｅｉｆＣ＞Ｌ．．．．．．．．．．（２）ｔｈｅｎ改行するｅｌｓｅなるべく形態素中で改行する

【００３４】即ち、まずｅｖａｌ＝○ である箇所を切
れ目とすることにより、前記された第１実施例装置の場
合と同様に、形態素単位での判定が行われる（１）。た
だし、「行バッファ（６）」が十分に埋まっていない場
合には、形態素中で改行できる箇所を探すようにされ
る。なお、形態素中で改行できる箇所がない場合には、
そのままの状態において改行を実行するようにされる
（２）。形態素中での改行については、ｅｖａｌ＝△
であり、しかも最も「行バッファ（６）」が埋まる箇所
で改行を実行するようにされる。即ち、次の条件を満た
すＰが存在するときには、読み込まれた文章における
Ｐ文字目において改行を実行する。

【数２】これらを図示すると図１７のようになることが認められ
る。この図１７においては、ｅｖａｌが〇である文
字の直後（形態素の切れ目）での改行ができないことか
ら、△ の直後での改行をすることが考えられている。
そして、できるだけ多くの文字の割り付けができるよう
にされる（即ち、ここでは、できるだけ右側にある △
の直後で改行するようにされる）。また、この図１７に
おいて、Ｍは１行の最大容量を示し；Ｌは１行の充満
目標容量を示し；そして、Ｃはある現在の時点において
１行に割り付けられている容量を示している。この図１
７における一点鎖線から上では次のような局面が想定さ
れている。即ち、該当の行に対する割り付けが目標容量
に達していない（Ｃ＜Ｌ）。次に続く形態素「たちつて
と」（容量Ｗ）を割り付けると１行に収まらない（Ｃ
＋Ｗ＞Ｍ）。そこで、この図１７における一点鎖線から
下では、前記形態素「たちつてと」の途中の文字（ｅｖ
ａｌが △ である文字）の直後での改行をすることが
工夫される。いま、ｂで指されているものは形態素
「たちつてと」の先頭の文字「た」であり、また、ｎ
で指されているものは該形態素「たちつてと」の最後尾
の文字「と」である。そして、ｐで指されているもの
は該当の行に割り付けられる最後の文字である。このよ
うな状態において、ｐをｎからｂまで移動させな
がら、ｅｖａｌが △ である文字「て」「つ」「た」
の順に、それぞれの直後で改行可能であるか否かのチェ
ックをしていく。この図１７の例においては、文字
「つ」の直後での改行が可能であると判別されることか
ら、形態素「たちつてと」は、その中間の文字である
「つ」の直後で改行されることになる。なお、この文字
「つ」に続く文字「てと」は次に続く行に割り付けられ
ることになる。

【００３５】次に、本発明に係る第２の実施例装置を動
作させる際の改行可否判定の手順について、図１８のフ
ローチャートを参照しながら詳細に説明する。まず、前
記された本発明に係る第１の実施例装置と比較して認め
られることは、Ｓｔｅｐ６からＳｔｅｐ１２までの部分
（図１８において点線で包囲されている部分）が拡張部
分となっていることである。以下、各ステップの説明に
入っていく。Ｓｔｅｐ１：次に割り付けられる対象（の形態素）が文
中の何文字目から始まるのか（ｂ）を初期設定する。Ｓｔｅｐ２：次に割り付けられる対象（の形態素）が文
中の何文字目までなのか（ｎ）を求める。Ｓｔｅｐ３：割り付け対象（となった形態素）の出力幅
Ｗを計算する。Ｓｔｅｐ４：「行バッファ（６）」におけるあふれの有
無を判定する。ここで、割り付け対象が「行バッファ
（６）」に収まることが可能であると判定されたら、こ
れを「行バッファ（６）」に収める（Ｓｔｅｐ１７に進
む）。Ｓｔｅｐ５：「行バッファ（６）」の充満度のいかんを
判定する。「行バッファ（６）」が充満しているときに
は改行を実行する（Ｓｔｅｐ１５に進む）。Ｓｔｅｐ６：判定位置（ｐ）の初期設定を行う。Ｓｔｅｐ７：判定位置の更新を行う。Ｓｔｅｐ８：改行判定の終了のいかんをチェックする。
チェックの結果が終了であるならば改行を実行する（Ｓ
ｔｅｐ１５に進む）。Ｓｔｅｐ９：解析結果の観点から改行禁止であるか否か
のチェックをする。改行禁止であるときには、判定位置
の更新を実行する（Ｓｔｅｐ７に戻る）。Ｓｔｅｐ１０：バッファのあふれの観点から改行が可能
であるか否かのチェックをする。まだあふれが生じてい
るときには、判定位置の更新を実行する（Ｓｔｅｐ７に
戻る）。Ｓｔｅｐ１１：改行前に割り付ける文字列を「行バッフ
ァ（６）」に送る。Ｓｔｅｐ１２：（改行後に割り付ける文字列を「行バッ
ファ（６）」に伝送するために）割り付け対象の更新を
実行する。Ｓｔｅｐ１３：ある所定の改行命令を「割り付け装置
（３）」に伝送する。Ｓｔｅｐ１４：「行バッファ（６）」をクリアする（状
態変数を更新する）。Ｓｔｅｐ１５：割り付け対象としての文字列を「行バッ
ファ（６）」に伝送する。Ｓｔｅｐ１６：「行バッファ（６）」の更新を実行する
（状態変数を更新する）。Ｓｔｅｐ１７：対象とする文章が終りであるか否かの判
定をする。対象とする文章が終りであるときには、ＥＮ
Ｄに進んで、これに次続する文章の処理に移行する。Ｓｔｅｐ１８：割り付け対象を更新してから元のＳｔｅ
ｐ２に戻る。

【００３６】ここで、先にも例示された「今日の会場は
日本橋本町です。」なる文章を対象として、その文を割
り付け作業について説明する。なお、ここでは次の場面
を想定するものとされている。Ｃ＝１１１００；Ｌ＝１８０００；Ｍ＝２００００。Ｓｔｅｐ１，２，３：まず、「今日」なる形態素が割り
付け対象とされる（ここで、ｂ＝１；ｎ＝２；Ｗ＝２０
００：図１９を参照）。Ｓｔｅｐ４：ここでは、Ｃ＋Ｗ≦Ｍが成立してＳｔｅ
ｐ１５に移行する。（図２０において、Ｃ＝１１１０
０；Ｗ＝２０００；Ｍ＝２００００である）。Ｓｔｅｐ１５：ここでは、前記「今日」なる形態素が
「割り付け装置（３）」に付属の「行バッファ（６）」
に伝送される。Ｓｔｅｐ１６，１７，１８，２，３：前記「今日」に続
く「の」なる形態素が割り付け対象となる（ｂ＝３；ｎ
＝３；Ｗ＝１０００；Ｃ＝１３１００）。

【００３７】以下同様にして、「会場」および「は」な
る形態素の処理が順次実行される。これに続けて、「日
本橋」なる形態素が割り付け対象となる場面を迎える。Ｓｔｅｐ１６，１７，１８，２，３：「日本橋」なる形
態素が割り付け対象となる（ｂ＝７；ｎ＝９；Ｗ＝３０
００；Ｃ＝１７１００）。Ｓｔｅｐ４：Ｃ＋Ｗ≦Ｍは成立しない。Ｓｔｅｐ５へ
と移行する（Ｃ＝１７１００；Ｗ＝３０００；Ｍ＝２０
０００）Ｓｔｅｐ５：Ｃ≧Ｌは成立しない。Ｓｔｅｐ６へと移
行する（Ｃ＝１７１００；Ｌ＝１８０００：図２１を参
照）。Ｓｔｅｐ６：ｐ＝９になる。Ｓｔｅｐ７，８：ｐ＜ｂは成立しない。Ｓｔｅｐ９へ
と移行する（Ｗ＝２０００；ｐ＝８；ｂ＝７）。Ｓｔｅｐ９：ｅｖａｌ（ｐ）＝［×］は成立する。Ｓ
ｔｅｐ７へと移行する。Ｓｔｅｐ７，８，９：Ｗ＝１０００；ｐ＝７；ｂ＝７；
ｅｖａｌ（７）＝［△］。Ｓｔｅｐ１０へと移行する
（図２２を参照）。Ｓｔｅｐ１０：Ｃ＋Ｗ≦Ｍが成立する。Ｓｔｅｐ１１
へと移行する（Ｃ＝１７１００；Ｗ＝１０００；Ｍ＝２
００００）。Ｓｔｅｐ１１：「日」なる形態素が「割り付け装置
（３）」に付属の「行バッファ（６）」に伝送される。Ｓｔｅｐ１２：ｂ＝８；Ｗ＝２０００。ここで、「本
橋」が割り付け対象として残る（図２３を参照）。Ｓｔｅｐ１３，１４：「割り付け装置（３）」に対して
所定の改行命令が伝送される。そして、Ｃ＝０にされ
る（「日」までが割り付けられ、「行バッファ（６）」
はクリアされることになる）。Ｓｔｅｐ１５：「本橋」が「割り付け装置（３）」に付
属の「行バッファ（６）」に伝送される（図２４を参
照）。

【００３８】以下、同様な処理が流れることになる。そ
して、「行バッファ（６）」の内容が埋められた「割り
付け装置（３）」では、所定の改行命令が与えられた時
点において、必要に応じてジャスティファイイングやセ
ンタリングのような調整作業が実行される。そして、得
られた割り付け結果を「出力装置（９）」に渡し、「行
バッファ（６）」をクリアするようにされる。最後に、
この「出力装置（９）」においては、受け取った割り付
け結果を出力するようにされる。

【００３９】なお、本発明に係る文書処理装置の動作に
は、［「行バッファ（６）」に後どれだけの幅の割り付
けができるか］という残り幅情報から判定する場合も含
まれているが、ここでの第２の実施例においては、前記
された情報Ｃについて、「今どれだけの幅の割り付け
を行ったか」を示す情報として用いることにより、対象
とする文章について改行可否を判定する場合について説
明した。

【００４０】図２５は、本発明の第３の実施例に係る文
書処理装置の構成を示すブロック図である。この図２５
において、第１の構成部としての格納部に含まれるもの
は「文書ファイル（１）」および「フォント格納装置
（２）」である。そして、前者である「文書ファイル
（１）」には、ある所定の文章について、当該文章を構
成する文字列と各文字に対応する表示プロパティの並び
として（文章の）格納がなされている。なお、ここでの
表示プロパティとしては、少なくとも文字毎のフォント
およびサイズを指定するものがある。また、後者である
「フォント格納装置（２）」には、例えば［１２ポイン
トの明朝体の「あ」］のような、文字毎のフォントが格
納されている。次に、第２の構成部としての割り付け部
に含まれるものは「割り付け装置（３）」および「行バ
ッファ（６）」である。前者である「割り付け装置
（３）」においては、対象の文章が１文（単位文）ずつ
読み込まれ、また、１行（単位行）ずつ割り付けられ
る。そして、後者である「行バッファ（６）」において
は、後段の「出力装置（９）」に伝送されるべき割り付
け結果が、（１行単位をもって）蓄積される。次に、第
３の構成部としてのレジスタ部に含まれるものは、「状
態変数レジスタ（４）」，「全出力幅レジスタ（５）」
および「割り付け対象レジスタ（１３）」である。そし
て、第１のレジスタである「状態変数レジスタ（４）」
においては、行バッファ（６）の現在の充満度を示す所
定の値が蓄積される。第２のレジスタである「全出力幅
レジスタ（５）」においては、前記行バッファ（６）の
最大容量を示す所定の値が蓄積される。そして、第３の
レジスタである「割り付け対象レジスタ（１３）」にお
いては、ある所定の句（例えば「花子のお兄さん」）を
同じ１行以内に出力するもの（即ち、割り付け対象）と
して処理を施すときの、該当の句に対する最大許容出力
幅を示す値が蓄積される。第４の構成部としての改行評
価部は「改行可否判定装置（７）」である。この「改行
可否判定装置（７）」においては、読み込まれた文章に
関する（意味的な解析を含む）解析結果、文字毎のフォ
ントおよび各レジスタ内の蓄積値に基づいて、当該文章
のある所定の位置における改行の可否（または改行の好
ましさ）のいかんに関する判定がなされる。そして、こ
の判定の結果に依存して対象とする文章の改行箇所が決
定され、しかるべき改行命令を発行するようにされる。
第５の構成部としての解析部は、「形態素解析装置
（８）」，「構文解析装置（１１）」および「意味解析
装置（１２）」である。第１の解析装置である「形態素
解析装置（８）」においては、読み込まれた文章につい
て、所要の形態素解析が実行される。第２の解析装置で
ある「構文解析装置（１１）」においては、対象の文章
に関する構文解析結果として考えられるだけの構文解析
木を全て求めてから、正しい構文解析結果を１つだけ決
めるようにされる。そして、第３の解析装置である「意
味解析装置（１２）」は、上記の構文解析において考え
られる全ての解析木から１つの正しい解析木を決める際
に用いられる。このときには、正しくない解析木におい
て意味的に反対な語同士が係り受けになる等の、文章の
読者を混乱させる語句の有無をチェックするようにされ
る。そして、第６の構成部としての出力部は「出力装置
（９）」である。この「出力装置（９）」においては、
対象とする文章に関する割り付け処理の結果や、前段の
行バッファ（６）側から伝送された内容が出力される。

【００４１】上記第３の実施例装置は以下のように動作
する。即ち、まず「割り付け装置（３）」においては、
「文書ファイル（１）」に格納されている文章を対象と
して、１文（ある所定の単位長の文）ずつ読み込まれ
る。そして、このように読み込まれた文章は、１行分ず
つ「行バッファ（６）」に格納される。このとき、前記
対象とする文章の改行箇所については、「改行可否判定
装置（７）」によって決定され、この決定に基づく所定
の改行命令（ＣＲ）が発行される。この改行命令を受け
取った「割り付け装置（３）」においては、「行バッフ
ァ（６）」の内容をクリアしながら「出力装置（９）」
に伝送するようにされる。

【００４２】上記第３の実施例装置においては、図２６
における例文２６Ａのような「．．．男らしい花子の姉
のＢＦ．．．」なる文章に関連して説明する。このよう
な文章例にあっても、従来からのやり方によるときに
は、この図２６のように［男らしい花子］と［姉］との
間が改行位置として選択されると、この文章例を読む者
によっては、［花子が男らしい（？）］かのように解釈
することが生じて、その思考の過程に混乱が起きてしま
うことがあり得る。

【００４３】上記第３の実施例装置においては、前述の
ような混乱が生じる恐れを除く工夫がなされており、図
２７に示されているようにその解決が図られている。即
ち、この図２７における例文２７Ａは、「男らしい」な
る文節が「花子」や「（花子の）姉」のような［性を異
にする単語］に係るのではなく、「男らしい」なる文節
と「花子の姉」なる文節の双方が「ＢＦ」に係る」とい
う解析結果が利用されている。このために、「花子の姉
のＢＦ」なる文節が同一の行に出力するような割り付け
処理（即ち、「花子の姉のＢＦ」なる文節全体が単一の
割り付け対象にされる）を行うことにより、前述された
思考停止のような混乱が生じる恐れが除かれている。

【００４４】次に、前記図２６または図２７で示された
「．．．男らしい花子の姉のＢＦ．．．」なる文章例に
ついて、その出力のさせ方を具体的に説明する。この第
３の実施例装置においても、対象の文章が「形態素解析
装置（７）」によって形態素解析が行われ、ｍ−Ｗテ
ーブル（７１）の該当欄が埋められるまでは、前述され
た第１の実施例装置の場合と同様である。

【００４５】所要の形態素解析が終了すると、これに続
けて「構文解析装置（１１）」による構文解析が実行さ
れる。ここで例えば前記された文章例の中の「男らしい
花子の姉のＢＦ」なる文節における名詞句の部分につい
てみると、この名詞句の部分からは図２８のようにして
所期の候補が得られる。しかる後に、意味解析、格の知
識やユーザの指定等に基づき、前記のように得られた候
補の中から正しい構文解析木（Ａ）が得られることにな
る。

【００４６】上記第３の実施例装置においては、「意味
解析装置（１２）」による意味解析の結果を用いること
により、前記図２８における構文解析木（Ｂ）および構
文解析木（Ｃ）は正しくないものと判断されている。こ
こでそれぞれの構文解析木について検討すると、まず構
文解析木（Ａ）の場合には、意味属性が♂である「男ら
しい」が、意味属性が同じく♂である「ＢＦ」に係るよ
うにされている。これに対して、構文解析木（Ｂ）の場
合には、意味属性が♂である「男らしい」が、意味属性
が♀である「花子」に係るという解釈が出てくることに
なる。また、構文解析木（Ｃ）の場合にも、意味属性が
♂である「男らしい」が意味属性が♀である「姉」に係
るという解釈が出てくることになる。かくして、構文解
析木（Ａ）は正しいものであり、構文解析木（Ｂ）およ
び構文解析木（Ｃ）はいずれも正しくないことになる。

【００４７】そこで、前記の文章を読む者が上記と同様
な判断をし易くするために、例えば構文解析木（Ｂ）の
場合においては、「花子」なる単語から「ＢＦ」（ＢＦ
は「男らしい」の真の係り先）なる単語までの「花子の
姉のＢＦ」なる一塊の文節が同一の行に出力されるよう
な割り付け処理がなされる。

【００４８】上記のような処理を可能にするために、本
発明に係る第３の実施例装置においては、次のような
（１次）拡張ｍ−Ｗテーブル（７３）（図２９を参
照）が導入される。ここでの（１次）拡張ｍ−Ｗテーブ
ル（７３）は、（前記図４および図５で参照される）ｍ
−Ｗテーブル（７１）にあるｍ，ｉ１，ｉ２，Ｗな
る３個の要素に加えて、次のような３個の要素ｅｖａ
ｌ，Ｓ，ｐの記載欄が追加されている。ここで、ｅｖａｌ：その形態素の直後で改行してもよいかどうか
の評価を記す要素；ｐ：その形態素から１行に出力したい範囲を、末尾の形
態素へのポインタで記す要素；Ｓ：上記範囲の文字列の幅を記す要素；にされている。
そして、ここでのｐ欄およびＳ欄は、構文解析や意
味解析等の処理結果に基づき、必要に応じて埋められる
ものである。

【００４９】ここで、前記図２８における構文解析木
（Ｂ）を例にとってみると、「花子の姉のＢＦ」なる文
節を１行に出力・表示させるためには次のような作業が
なされる。即ち、１．図２８における構文解析木（Ａ）から、「男らし
い」なる単語の真の係り先が「ＢＦ」なる単語であるこ
とが認められる。２．そこで、「花子」なる単語のｐ欄に、「ＢＦ」な
る単語に至るポインタ（図２９における矢印（７３Ａ）
を参照）が記載される。３．「花子」なる単語から「ＢＦ」なる単語までのＷ
が合計されて、「花子」なる単語のＳ欄に合計値（６
２００）が記載される。というような手順をもって該当
欄への埋め込み作業がなされる。

【００５０】前記と同様にして、図２８における構文解
析木（Ｃ）を例にとってみると、「姉のＢＦ」なる文節
を１行に出力・表示させるためには次のような作業がな
される。即ち、１．図２８における構文解析木（Ａ）から、「男らし
い」なる単語の真の係り先が「ＢＦ」なる単語であるこ
とが認められる。２．そこで、「姉」なる単語のｐ欄に、「ＢＦ」なる
単語に至るポインタ（図２９における矢印（７３Ｂ）を
参照）が記載される。３．「姉」なる単語から「ＢＦ」なる単語までのＷが
合計されて、「花子」なる単語のＳ欄に合計値（３２
００）が記載される。というような手順をもって該当欄
への埋め込み作業がなされる。

【００５１】上記されたような作業の結果として、図２
９に示されているような（１次）拡張ｍ−Ｗテーブル
は、図３０に示されているような（２次）拡張ｍ−Ｗ
テーブルにされる。なお、この図３０においてはｅｖ
ａｌ欄が埋められた状態のものが示されているが、こ
こでのｅｖａｌを求めるためには「改行可否判定装置
（７）」において次のような値が用いられる。Ｆ：１行への出力を所望するときの句（または文節等）
の出力時における許容最大幅を示す値（極端に長い句や
文節の１行への出力を防止するため）；なお、この値は
予め「割付対象レジスタ（１３）」に格納されることに
なる。

【００５２】ここで、ｅｖａｌは次のような手順をも
って求められる。［１］：全ての形態素のｅｖａｌ欄を［○］にする。［２］：構文解析木の根から１番深いレベルにある句
（文節等）から、該構文解析木の根に向かって順にｐ
を見ていく（同じレベルの句が複数あるときは前のもの
から順にｐを見ていく。また、ある一つの句中では前
にある形態素から順にｐを見ていく）。ｉｆ：ｐのポインタの先が現在ｐを見ている句の
範囲にあり、かつ、ｐに記載された合計値がＦ以下で
ある；ｔｈｅｎ：ポインタの先を除く後の全ｅｖａｌ欄に対
して［△］が埋められる；ｐ欄に記載されたポインタが削除される。（ここで、
ｐを見る形態素が前記削除したポインタの先になるよ
うにされる。）

【００５３】例えば、図２９の場合は次のようになる。
即ち、［１］：全ての形態素のｅｖａｌ欄を［○］にする。［２］：以下のループ処理を行う。［１度目のループ］まず根から１番深いところで「花子
の姉」に着目する。「花子」のｐを見る。ポインタは
着目範囲外の「ＢＦ」を指しているために、ｉｆは不
成立である。「の」のｐを見る。ｐは空欄なので
スキップする。「姉」のｐを見る。ここでのポインタ
も着目範囲外の「ＢＦ」を指しており、ｉｆは不成立
である。［２度目のループ］続いて次に根から深いところの「花
子の姉のＢＦ」に着目する。「花子」のｐを見る。ポ
インタは着目範囲内の「ＢＦ」を指しているために、ｉ
ｆは成立である。「花子」，「の」，「姉」，「の」
のｅｖａｌ欄を［△］にする。「花子」，「の」，
「姉」，「の」のｐ欄をブランクにする。「ＢＦ」の
ｐ欄を見る。該当のｐ欄がブランクであることから
スキップする。［３度目のループ］最後に、１番根に近いところの「男
らしい花子の姉のＢＦ」に着目する。「男らしい」，
「花子」，「の」，「姉」，「の」，「ＢＦ」の順序で
ｐを見ていく。ｐ欄がブランクであることから、全
てをスキップする。

【００５４】ここで、図３０のように（２次）拡張ｍ−
Ｗテーブルが完成すると、これに続けて、ｅｖａｌ欄
における値を考慮しながら割り付け処理を行う。ところ
で、この第３の実施例においては、割り付け処理および
それに続く出力処理を、前記第１の実施例で示したと同
様な手順に帰着させることにする。そこで、図３０に示
された（２次）拡張ｍ−Ｗテーブル（Ｔ１と呼ぶ）か
ら、第１の実施例で示したｍ−Ｗテーブル（図４または
図５を参照）と等価なテーブル（図３１を参照：Ｔ２と
呼ぶ）を作成する手順を示すことにする。さて、前記第
１の実施例においては、割り付け対象は常に１個の形態
素であったが、この第３の実施例において句（複数の形
態素列）となる場合もある。ここでは、前記の（図３１
における）テーブルＴ２は以下の４要素からなる記載
欄を持ったものとされる。即ち、ｍ’：割り付け対象（句または形態素）；ｉ１：その割り付け対象は文の何番目の文字からなの
か；ｉ２：その割り付け対象は文の何番目の文字までなの
か；Ｗ’：その割り付け対象を出力する際の出力幅はいくら
なのか；なる記載欄を持ったテーブルであるとされる。

【００５５】ここで、テーブルＴ１からテーブルＴ
２を作成する手順は以下の通りである。即ち、［１］：（図３０における）テーブルＴ１を上の欄か
ら下の欄まで順に見ていく。［２］：テーブルＴ１のｉ１を（図３１における）
テーブルＴ２のｉ１に書き込む。［３］：ｉｆｅｖａｌ＝［○］，ｔｈｅｎＴ１のＷ，ｍ，ｉ２をＴ２のＷ’，ｍ，ｉ２に書き込む。ｅｌｓｅ（ｅｖａｌ＝［△］），Ｔ１のＳをＴ２のＷ’ に書き込む。［４］：Ｔ１をｅｖａｌ＝［○］となるまで下に見て
いきながら、それぞれのｍをＴ２のｍ’ に書き足
していく。［５］：Ｔ１のｅｖａｌ＝［○］となった欄のｉ２
をＴ２のｉ２に書き込む。（Ｔ１，Ｔ２とも次の
欄に着目する。）

【００５６】例えば、図３０に基づいて図３１を作成す
るには次のような作業がなされる。［１］：まず、Ｔ１における「男らしい」を見る。［２］：Ｔ１の該当するｉ１が１であることか
ら、Ｔ２の該当するｉ１に１を書き込む。［３］：該当するｅｖａｌ＝［○］であることから、
Ｔ１のＷ，ｍ，ｉ２を、そのままの状態でＴ２の
Ｗ’，ｍ，ｉ２に書き込む。［４］：Ｔ１における「花子」を見る。［５］：前記Ｔ１の該当するｉ１が５であること
から、Ｔ２の該当するｉ１に５を書き込む。［６］：該当するｅｖａｌ＝［△］であることから下
記の操作を行う。［７］：Ｔ１におけるＳ欄の値が６２００であるこ
とから、Ｔ２におけるＷ’ 欄に６２００なる値を
書き込む。［８］：Ｔ１を下に見ていくと、ｅｖａｌ＝［○］にな
るのは「ＢＦ」のときであるから、該当のｍ’ 欄には
「花子の姉のＢＦ」を書き込む。［９］：Ｔ１における（「ＢＦ」の）ｉ２欄の値が
１１であることから、Ｔ２におけるｉ２欄に１１
なる値を書き込む。［１０］：以上の手順で図３０における（２次）拡張ｍ
−Ｗテーブルを変形すると、図３１に示されているよう
なテーブルが作成されることになる。そして、これから
後は、前記第１の実施例と全く同様な割り付け処理が行
われて、最後に出力処理が行われる。

【００５７】

【発明の効果】以上説明されたように、この発明に係る
文書処理装置によれば、ある対象の文章を出力・表示さ
せるときに、構造的に結び付きの強い文字列を同じ行に
表示することによって、誤った読解を的確に回避させる
ことが可能になるという著しい効果が奏せられる。即
ち、この発明に係る実施例の文書処理装置によれば、実
際に割り付けるべき文字列の幅をそのフォント、サイズ
を含む形式で算出して、前記算出された幅と文字列割り
付けの領域の幅とについて所定の評価を施すことによっ
て当該文字列における改行箇所を決定することができ
る。また、この発明に係る別の実施例の文書処理装置に
よれば、ある所定の形態素に対応する位置で改行すると
一行に割り付けられる文字列の幅が所定の閾値を満たさ
ないときに、予め設定された改行位置の好適性に関する
情報に基づいて、該当の形態素に対応する位置以外の位
置での改行が許容されるという利点がある。そして、こ
の発明に係る更に別の実施例の文書処理装置によれば、
出力すべき文字列について所要の構文解析および意味解
析を行い、特に意味的に関連が深い文字列部位が同一行
に出力される位置が改行位置として選択される効果もも
たらされる。

【図面の簡単な説明】

【図１】本発明に係る第１の実施例装置の概略構成図
である。

【図２】上記第１の実施例において適用される例文の
表示図である。

【図３】上記第１の実施例において適用される例文の
表示図である。

【図４】上記第１の実施例において適用されるｍ−
Ｗテーブルの例示図である。

【図５】上記第１の実施例において適用されるｍ−
Ｗテーブルの例示図である。

【図６】上記第１の実施例において用いられる所定の
値Ｇ，Ｍの関連例示図である。

【図７】上記第１の実施例における改行可否判定の動
作に関する説明のためのフローチャートである。

【図８】上記第１の実施例において、ある所定の形態
素が行バッファに収まるか否かを判定するための説明図
である。

【図９】上記第１の実施例において、ある所定の形態
素の割り付けが単一行内で可能であるか否かを判定する
ための説明図である。

【図１０】本発明に係る第２の実施例装置の概略構成
図である。

【図１１】上記第２の実施例に関連して適用される例
文の表示図である。

【図１２】上記第２の実施例に関連して適用される例
文の表示図である。

【図１３】上記第２の実施例に関連して適用される例
文の表示図である。

【図１４】上記第２の実施例において、形態素解析の
結果を誤りのものも正しいものに合わせて保持される態
様の例示図である。

【図１５】上記第２の実施例において、ｅｖａｌを
求める態様を説明するための例示図である。

【図１６】上記第２の実施例における、完成したｃ
−Ｗテーブルの例示図である。

【図１７】上記第２の実施例における、所定の改行
（可否）判定手順に関する説明図である。

【図１８】上記第２の実施例において改行（可否）判
定の動作に関する説明のためのフローチャートである。

【図１９】上記第２の実施例において、ある所定の形
態素を割り付ける際の説明図である。

【図２０】上記第２の実施例において、ある所定の形
態素が行バッファに収まるか否かを判定するための説明
図である。

【図２１】上記第２の実施例において、ある所定の形
態素の割り付けが単一行内で可能であるか否かを判定す
るための説明図である。

【図２２】上記第２の実施例において、ある所定の形
態素中の改行位置を探索する動作の説明図である。

【図２３】上記第２の実施例において、ある所定の形
態素中の改行位置を決定することに関する説明図であ
る。

【図２４】上記第２の実施例において、改行の動作に
関連した説明図である。

【図２５】本発明に係る第３の実施例装置の概略構成
図である。

【図２６】上記第３の実施例において適用される例文
の表示図である。

【図２７】上記第３の実施例において適用される例文
の表示図である。

【図２８】上記第３の実施例において適用される構文
解析結果の例示図である。

【図２９】上記第３の実施例において適用される（１
次）拡張ｍ−Ｗテーブルの例示図である。

【図３０】上記第３の実施例において適用される（２
次）拡張ｍ−Ｗテーブルの例示図である。

【図３１】前記図３０の（２次）拡張ｍ−Ｗテーブ
ルから導出される、上記第１の実施例におけると等価の
ｍ−Ｗテーブルの例示図である。

【図３２】従来のこの種の技術を説明するために用い
られる例文の表示図である。

【図３３】従来のこの種の技術を説明するために用い
られる例文の表示図である。

【符号の説明】

１ −− 文章ファイル；２ −− フォント格納装置；３
−− 割り付け装置；４ −− 状態変数レジスタ；５
−− 全出力幅レジスタ；６ −− 行バッファ；７ −−
改行可否判定装置；７１ −− ｍ−Ｗテーブル；８
−− 形態素解析装置；９ −− 出力装置。

Claims

【特許請求の範囲】

【請求項１】所定の文字列を対象とする割り付け可能領
域の幅と、実際に文字列が割り付けられた領域の幅とを
評価することにより、該所定の文字列における改行箇所
を決定する機構を備えてなる文書処理装置であって、出力すべき文字列について形態素解析を行うことにより
該文字列を構成する形態素列を求める機構と、出力すべき文字列を構文分析し、形態素列の中の各形態
素を葉として有する第１の構文解析木と、該形態素列の
中の各形態素を葉として有する第２の構文解析木とを求
める機構と、出力すべき文字列を意味解析して、該形態素列の中の各
形態素の意味属性を求める機構と、ある所定の評価に基づいて、適切な幅の文字列が同一行
に出力可能になるように、ある所定の文字列の直後にお
ける改行位置の好適性を求める機構と、現在割り付け中の割り付け領域における割り付け方向の
幅を保持する機構と、前記改行位置の好適性と割り付け方向の幅とに関する所
定の評価に基づき、形態素的にまたは意味的に関連が深
く、その出力時に一行中で占有される文字列の長さが好
適であるような改行箇所を決定する機構とを備えてな
り、出力すべき文字列について所要の構文解析および意味解
析を行い、特に意味的に関連が深い文字列部位が同一行
に出力される位置が改行位置として選択されることを特
徴とする文書処理装置。