JP4013539B2 - Digital content creation system, digital content creation program, and digital content creation method - Google Patents

Digital content creation system, digital content creation program, and digital content creation method Download PDF

Info

Publication number
JP4013539B2
JP4013539B2 JP2001392900A JP2001392900A JP4013539B2 JP 4013539 B2 JP4013539 B2 JP 4013539B2 JP 2001392900 A JP2001392900 A JP 2001392900A JP 2001392900 A JP2001392900 A JP 2001392900A JP 4013539 B2 JP4013539 B2 JP 4013539B2
Authority
JP
Japan
Prior art keywords
important
document information
phrase
important phrase
digital content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001392900A
Other languages
Japanese (ja)
Other versions
JP2003196263A5 (en
JP2003196263A (en
Inventor
洋貴 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2001392900A priority Critical patent/JP4013539B2/en
Publication of JP2003196263A publication Critical patent/JP2003196263A/en
Publication of JP2003196263A5 publication Critical patent/JP2003196263A5/ja
Application granted granted Critical
Publication of JP4013539B2 publication Critical patent/JP4013539B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書を整形しまたは修飾するシステムおよびプログラム、並びに方法に係り、特に、最新の情勢や話題に即した内容のディジタルコンテンツを作成する場合に、これに含まれる文書を整形しまたは修飾するにあたって話題性キーワードをひとまとめに取り扱うことにより、ディジタルコンテンツの可読性を向上するのに好適な文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法に関する。
【0002】
【従来の技術】
近年、ネットワークサービスの1つに、ニュース等のディジタルコンテンツを配信するサービスがあり、これはコンテンツ配信システムにより提供されている。このシステムでは、一般に、コンテンツデータ登録データベース(以下、データベースのことを単にDBと略記する。)からコンテンツデータを選択し、選択したコンテンツデータを用いてディジタルコンテンツを編集し、編集したディジタルコンテンツをユーザに対して配信する。ディジタルコンテンツの編集過程では、ユーザにとって見やすいまたは読みやすいものとなるようにレイアウトを行っている。
【0003】
コンテンツ配信システムでは、画像や文書その他のマルチメディアを組み合わせてディジタルコンテンツを作成するが、このうち文書については、レイアウト領域に配置された文書情報格納枠に文書情報を格納することによりレイアウトを行っている。この場合、見やすくまたは読みやすくするという観点からは、文書情報を単に文書情報格納枠に格納するのではなく、文章の改行位置、文字修飾、フォントサイズ、フォント種類、文字間隔または行数等を調整することにより、文書情報格納枠において文書を整形しまたは修飾することが望まれる。
【0004】
従来、文書を整形しまたは修飾する技術としては、例えば、特開昭63-245760号公報に開示された文書整形装置(以下、第1の従来例という。)、特開平2-101569号公報に開示された文字処理装置(以下、第2の従来例という。)、特開平6-309310号公報に開示された文書処理装置(以下、第3の従来例という。)、特開平10-283353号公報に開示された文書処理装置(以下、第4の従来例という。)、および特開平11-143869号公報に開示された文書処理装置(以下、第5の従来例という。)があった。
【0005】
第1の従来例は、文書データを入力するための入力部と、文書データ中の文を文節に区切るための文節区切部と、文節区切部により区切られた文節が行送りしないように文書を整形する整形処理部と、整形処理部により整形された文書を表示する表示部とで構成されている。すなわち、文を発音上と意味上の両方からみて不自然でない箇所で改行している。
これにより、発音上および意味上ひとまとまりの語句が複数の行をまたがなくなるので、文書の可読性を向上することができる。
【0006】
第2の従来例は、かな文字を入力する入力部と、入力部で入力したかな文字列を漢字混じりの文字列に変換するかな漢字変換部と、かな漢字変換部で変換した文字列を記憶する文字列記憶部と、文字列記憶部の文字列を印刷する印刷部とを備えた装置である。より具体的には、かな漢字変換部で変換した時の文字列の区切情報を記憶する区切情報記憶部と、印刷用紙の種類や印刷スペース等の印刷条件を設定する印刷条件設定部と、文字列記憶部の文字列を印刷する際に、印刷条件設定部で設定した印刷条件によって定まる1行に印刷可能な文字数と区切情報記憶部の区切情報とから印刷する1行の文字列の区切りを決定して、印刷部で印刷する1行分ごとのデータを作成する1行データ作成部とで構成されている。
【0007】
これにより、文節と文節の間や地名と地名の間で改行が行われるので、文書の可読性を向上することができる。
第3の従来例は、所定の文字列を対象とする割り付け可能領域の幅と、実際に文字列が割り付けられる領域の幅とを評価して、所定の文字列の改行箇所を決定する機構を備える装置である。より具体的には、出力すべき文字列について形態素解析を行って文字列を構成する形態素列を求める機構と、出力すべき文字列を構成する該形態素列の形態素毎に順次割り付けるときに、形態素列の中で各形態素が占有する領域の幅を保持する機構と、割り付け可能領域の幅を保持する機構と、各形態素が占有する領域の幅と割り付け可能領域の幅との評価をして、文字列に含まれるいずれの形態素でも同一の行に出力されるように該当の形態素の切れ目において改行箇所を決定する機構とで構成されている。
【0008】
これにより、ある所定の文章について意味的に結び付きが弱い文字同士の間(いわゆる切れ目)で改行が行われるので、不用意な改行による読者の誤解や、読者の思考停止等を防止することができ、もって文書の可読性を向上することができる。
第4の従来例では、形態素切れ目評価算出部は、形態素解析処理部によって分割された各形態素のいずれを改行位置とするのが適切かを評価する。まず、切れ目評価算出部は、形態素のなかから改行可能候補を求める。切れ目評価算出部は、形態素の優先度に基づいて、改行位置得点を求める。切れ目評価算出部は、各改行可能候補にて改行した場合の文字ピッチのピッチ得点を求める。切れ目評価算出部は、改行位置得点とピッチ得点との和が最大となる改行可能候補を求める。
【0009】
これにより、形態素の途中で改行されず、かつ、文字間の間隔がなくなったり文字同士が重なったりすることがなくなるので、文書の可読性を向上することができる。
第5の従来例では、形態素解析部、単語内改行検出部、単語内改行位置表示部が、改行で2行に分離している単語の位置を検出して表示する。次に、置換候補抽出部、同義語検索部、置換候補表示部が、その単語を含む行内の個々の単語に対して文字数の異なる同義語または異表記の単語を抽出して表示する。さらに、文字列置換部が、文字数の異なる同義語または異表記の単語で置換することで一単語の分離を回避する。
【0010】
これにより、改行により一単語が2行に分離しても、文章のレイアウトや文字のバランスを損なわずに一単語の分離を回避することができるので、文書の可読性を向上することができる。
【0011】
【発明が解決しようとする課題】
ところで、コンテンツ配信システムでは、最新の情勢や話題に即したニュース等をディジタルコンテンツに載せて配信する。こうしたディジタルコンテンツにおいては、見出しや記事のなかで情勢や話題に応じたキーワード(以下、話題性キーワードという。)が比較的頻繁に用いられることがある。話題性キーワードは、複数の形態素からなっていることが多いが、繰り返し用いられることにより次第に特定の意味を有するに至る。例えば、「米国同時多発テロ」というキーワードは、米国でテロ事件が生じる前は、特定の意味をもつことはないが、その事件に関する報道が繰り返し行われるにつれて特定の事件を表すキーワードとなる。したがって、ディジタルコンテンツを見やすくまたは読みやすくするという観点からは、文書を整形しまたは修飾するにあたって話題性キーワードをひとまとめに取り扱うことが望ましい。
【0012】
しかしながら、第1の従来例にあっては、文節と文節の間を区切りとみなして改行を行う構成となっているため、話題性キーワード内で改行が行われる可能性がある。すなわち、話題性キーワードが複数の形態素からなることが多いため、話題性キーワード内に文節の区切りが存在すると判定する場合があり、その場合は、話題性キーワード内で改行が行われてしまう。こうした改行により、話題性キーワードが複数の行をまたがってしまえば、意味が把握しずらく読みにくいものとなり、文書の可読性を低下させる。
【0013】
また、第2の従来例にあっては、かな漢字変換部で変換した時の文字列の区切情報に基づいて文節と文節の間や地名と地名の間で改行を行う構成となっているため、話題性キーワードの入力途中でかな漢字変換を行った場合には、話題性キーワード内で改行が行われてしまう。
また、第3の従来例にあっては、形態素の切れ目をすべての形態素について同一に評価する構成となっているため、評価の結果、話題性キーワード内に形態素の切れ目が存在すると判定した場合には、話題性キーワード内で改行が行われてしまう。
【0014】
また、第4の従来例にあっては、形態素の優先度に基づいて改行位置得点を算出し、改行位置得点とピッチ得点との和が最大となる改行可能候補で改行を行う構成となっているため、形態素の優先度の設定によっては、話題性キーワード内で改行が行われてしまう。この場合、1つの形態素を単位として優先度を設定するのではなく、複数の形態素を単位として優先度を設定するなどの工夫をしなければ、話題性キーワード内での改行を禁止するのは難しい。
【0015】
また、第5の従来例にあっては、改行により一単語が2行に分離することとなるときは、文字数の異なる同義語または異表記の単語で置換することにより一単語の分離を回避する構成となっているため、話題性キーワードに対応する同義語または異表記の単語が存在しない場合には、話題性キーワード内で改行が行われてしまう。
したがって、ディジタルコンテンツの可読性を向上する観点からは、話題性キーワード内で改行が行われないようにすることが望ましい。またこれとは別に、話題性キーワードを文字装飾等により強調表示したり、話題性キーワードについての補足説明を文書中に挿入したりすることも有効である。
【0016】
なお、これらの問題は、ディジタルコンテンツの配信に限らず、最新の情勢や話題に即した内容の文書を作成、編集、表示または印刷する場合についても想定することができる。
そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、最新の情勢や話題に即した内容のディジタルコンテンツを作成する場合に、これに含まれる文書を整形しまたは修飾するにあたって話題性キーワードをひとまとめに取り扱うことにより、ディジタルコンテンツの可読性を向上するのに好適な文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法を提供することを目的としている。
【0017】
【課題を解決するための手段】
上記目的を達成するために、本発明に記載の文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法は、複数の形態素からなる重要語句を記憶する重要語句記憶手段が利用可能となった場合に、前記重要語句記憶手段を参照して可読性が高まるように文書を整形しまたは修飾するシステムであって、出力すべき文書情報が与えられた場合に、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報に基づき出力すべき文書のうち当該重要語句または当該準重要語句について整形または修飾を行うようになっている。
【0018】
このような構成であれば、重要語句記憶手段が利用可能となり、出力すべき文書情報が与えられた場合に、重要語句記憶手段の重要語句が文書情報に含まれていると、文書情報に基づき出力すべき文書のうちその重要語句について整形または修飾が行われる。
また、出力すべき文書情報が与えられた場合に、重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれていると、同様にして、文書情報に基づき出力すべき文書のうちその準重要語句について整形または修飾が行われる。
【0019】
ここで、重要語句または準重要語句について整形することとしては、例えば、重要語句内または準重要語句内での改行を禁止すること、重要語句または準重要語句の文字間ピッチを変更すること、重要語句または準重要語句を他の同義語または異表記の語句に置換することが含まれる。また、重要語句または準重要語句について修飾することとしては、例えば、重要語句または準重要語句の、色、フォントサイズ、フォント種類、行数、1行当たりの文字数、行間ピッチまたは文字間ピッチを変更すること、重要語句または準重要語句についての補足説明を文書中に挿入することが含まれる。
【0020】
また、準重要語句とは、重要語句を構成する各形態素をその順で断片的に含む語句をいい、これには、例えば、A,B,Cの3つの形態素からなる重要語句がある場合に、A,B,D,Cの形態素からなる語句、A,D,B,E,Cの形態素からなる語句、またはA,D,E,F,B,Cの形態素からなる語句が該当する。
【0021】
また、重要語句記憶手段は、重要語句をあらゆる手段でかつあらゆる時期に記憶するものであり、重要語句をあらかじめ記憶してあるものであってもよいし、重要語句をあらかじめ記憶することなく、本システムの動作時に外部からの入力等によって重要語句を記憶するようになっていてもよい。
【0022】
また、本発明に記載の文書整形システムおよびディジタルコンテンツ作成システムは、単一の装置として実現するようにしてもよいし、複数の端末を通信可能に接続したネットワークシステムとして実現するようにしてもよい。後者の場合、各構成要素は、それぞれ通信可能に接続されていれば、複数の端末のうちどの端末に属していてもよい。
さらに、本発明に記載の文書整形システムは、連続した複数の形態素を単位として語句を前記文書情報から取得し、その取得語句をその出現頻度と対応付けて前記重要語句として前記重要語句記憶手段に登録し、前記重要語句記憶手段の重要語句のうち出現頻度が所定以上のものが前記文書情報に含まれているときは、前記文書情報に基づき出力すべき文書のうち当該重要語句について整形または修飾を行うようになっている。
【0023】
このような構成であれば、連続した複数の形態素を単位として語句が文書情報から取得され、その取得語句がその出現頻度と対応付けられて重要語句として重要語句記憶手段に登録される。そして、重要語句記憶手段の重要語句のうち出現頻度が所定以上のものが文書情報に含まれていると、文書情報に基づき出力すべき文書のうちその重要語句について整形または修飾が行われる。
さらに、本発明に記載の文書整形システムは、前記取得語句と同一の重要語句が前記重要語句記憶手段に登録されているときは、前記重要語句記憶手段の出現頻度のうちその重要語句に対応するものを増加し、前記取得語句と同一の重要語句が前記重要語句記憶手段に登録されていないときは、前記取得語句を前記重要語句として前記重要語句記憶手段に登録するようになっている。
【0024】
このような構成であれば、取得語句と同一の重要語句が重要語句記憶手段に登録されていると、重要語句記憶手段の出現頻度のうちその重要語句に対応するものが増加される。これに対し、取得語句と同一の重要語句が重要語句記憶手段に登録されていないと、取得語句が重要語句として重要語句記憶手段に登録される。
さらに、本発明に記載の文書整形システムは、前記重要語句または前記準重要語句が前記文書情報に含まれているときは、前記文書情報に基づき出力すべき文書において前記重要語句内または前記準重要語句内での改行を禁止するようになっている。
【0025】
このような構成であれば、重要語句が文書情報に含まれていると、文書情報に基づき出力すべき文書においてその重要語句内での改行が禁止される。
また、準重要語句が文書情報に含まれていると、文書情報に基づき出力すべき文書においてその準重要語句内での改行が禁止される。
さらに、本発明に記載の文書整形システムにおいては、前記重要語句記憶手段は、情勢または話題に応じた話題性キーワードを前記重要語句として記憶するようになっている。
【0026】
このような構成であれば、重要語句記憶手段の話題性キーワードが文書情報に含まれていると、文書情報に基づき出力すべき文書のうちその話題性キーワードについて整形または修飾が行われる。
また、重要語句記憶手段の話題性キーワードを構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれていると、同様にして、文書情報に基づき出力すべき文書のうちその準重要語句について整形または修飾が行われる。
【0027】
一方、上記目的を達成するために、本発明に記載のディジタルコンテンツ作成システムは、選択されたコンテンツデータを用いて出力レイアウトを決定しディジタルコンテンツを作成するコンテンツ作成手段を備え、前記コンテンツ作成手段は、前記コンテンツデータを構成する文書情報を、レイアウト領域に配置された文書情報格納枠に格納することにより前記ディジタルコンテンツを作成するシステムであって、前記コンテンツ作成手段は、複数の形態素からなる重要語句を記憶する重要語句記憶手段が利用可能となった場合に、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報格納枠内の文書のうち当該重要語句または当該準重要語句について整形または修飾を行うようになっている。
【0028】
このような構成であれば、コンテンツデータが選択されると、コンテンツ作成手段により、選択されたコンテンツデータを構成する文書情報が、レイアウト領域に配置された文書情報格納枠に格納され、これによりディジタルコンテンツが作成される。
レイアウトの過程では、重要語句記憶手段が利用可能となった場合に、重要語句記憶手段の重要語句が文書情報に含まれていると、コンテンツ作成手段により、文書情報格納枠内の文書のうちその重要語句について整形または修飾が行われる。
【0029】
また、重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれていると、同様にして、コンテンツ作成手段により、文書情報格納枠内の文書のうちその準重要語句について整形または修飾が行われる。
ここで、文書情報格納枠のレイアウト領域への配置は、例えば、ディジタルコンテンツのレイアウト時に動的に行うようにしてもよいし、複数の文書情報格納枠をレイアウト領域に配置した状態を定義したレイアウト定義情報をあらかじめ用意しておき、レイアウト定義情報に基づいて行うようにしてもよい。
【0030】
また、出力レイアウトとは、例えば、画面上に表示することを目的としてディジタルコンテンツを作成する場合にはその表示レイアウトを、紙面上に印刷することを目的としてディジタルコンテンツを作成する場合にはその印刷レイアウトをいう。
さらに、本発明に記載のディジタルコンテンツ作成システムは、コンテンツデータを記憶するコンテンツデータ記憶手段と、前記コンテンツデータ記憶手段のなかから前記コンテンツデータを選択するコンテンツデータ選択手段と、前記コンテンツデータ選択手段で選択したコンテンツデータを用いて出力レイアウトを決定しディジタルコンテンツを作成するコンテンツ作成手段とを備え、前記コンテンツ作成手段は、前記コンテンツデータを構成する文書情報を、レイアウト領域に配置された文書情報格納枠に格納することにより前記ディジタルコンテンツを作成するシステムであって、複数の形態素からなる重要語句を記憶する重要語句記憶手段を備え、前記コンテンツ作成手段は、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報格納枠内の文書のうち当該重要語句または当該準重要語句について整形または修飾を行うようになっている。
【0031】
このような構成であれば、コンテンツデータ選択手段により、コンテンツデータ記憶手段のなかからコンテンツデータが選択され、コンテンツ作成手段により、選択されたコンテンツデータを構成する文書情報が、レイアウト領域に配置された文書情報格納枠に格納され、これによりディジタルコンテンツが作成される。
レイアウトの過程では、重要語句記憶手段の重要語句が文書情報に含まれていると、コンテンツ作成手段により、文書情報格納枠内の文書のうちその重要語句について整形または修飾が行われる。
【0032】
また、重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれていると、同様にして、コンテンツ作成手段により、文書情報格納枠内の文書のうちその準重要語句について整形または修飾が行われる。
ここで、コンテンツデータ記憶手段は、コンテンツデータをあらゆる手段でかつあらゆる時期に記憶するものであり、コンテンツデータをあらかじめ記憶してあるものであってもよいし、コンテンツデータをあらかじめ記憶することなく、本システムの動作時に外部からの入力等によってコンテンツデータを記憶するようになっていてもよい。
【0033】
さらに、本発明に記載のディジタルコンテンツ作成システムは、連続した複数の形態素を単位として語句を前記文書情報から取得し、その取得語句をその出現頻度と対応付けて前記重要語句として前記重要語句記憶手段に登録する重要語句登録手段を備え、前記コンテンツ作成手段は、前記重要語句記憶手段の重要語句のうち出現頻度が所定以上のものが前記文書情報に含まれているときは、前記文書情報格納枠内の文書のうち当該重要語句について整形または修飾を行うようになっている。
【0034】
このような構成であれば、重要語句登録手段により、連続した複数の形態素を単位として語句が文書情報から取得され、その取得語句がその出現頻度と対応付けられて重要語句として重要語句記憶手段に登録される。そして、重要語句記憶手段の重要語句のうち出現頻度が所定以上のものが文書情報に含まれていると、コンテンツ作成手段により、文書情報格納枠内の文書のうちその重要語句について整形または修飾が行われる。
【0035】
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記重要語句登録手段は、前記取得語句と同一の重要語句が前記重要語句記憶手段に登録されているときは、前記重要語句記憶手段の出現頻度のうちその重要語句に対応するものを増加し、前記取得語句と同一の重要語句が前記重要語句記憶手段に登録されていないときは、前記取得語句を前記重要語句として前記重要語句記憶手段に登録するようになっている。
【0036】
このような構成であれば、取得語句と同一の重要語句が重要語句記憶手段に登録されていると、重要語句登録手段により、重要語句記憶手段の出現頻度のうちその重要語句に対応するものが増加される。これに対し、取得語句と同一の重要語句が重要語句記憶手段に登録されていないと、重要語句登録手段により、取得語句が重要語句として重要語句記憶手段に登録される。
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記コンテンツ作成手段は、前記準重要語句が前記文書情報に含まれているときは、前記重要語句記憶手段の重要語句のうち当該準重要語句に係るものの出現頻度、および当該準重要語句において前記重要語句を構成する各形態素間の距離に基づいて重要度を算出し、算出した重要度が所定以上であるときは、前記文書情報格納枠内の文書のうち当該準重要語句について整形または修飾を行うようになっている。
【0037】
このような構成であれば、準重要語句が文書情報に含まれていると、コンテンツ作成手段により、重要語句記憶手段の重要語句のうちその準重要語句に係るものの出現頻度、およびその準重要語句において重要語句を構成する各形態素間の距離に基づいて重要度が算出される。そして、算出された重要度が所定以上であると、文書情報格納枠内の文書のうちその準重要語句について整形または修飾が行われる。
【0038】
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記コンテンツ作成手段は、前記重要語句または前記準重要語句が前記文書情報に含まれているときは、前記文書情報格納枠において前記重要語句内または前記準重要語句内での改行を禁止するようになっている。
このような構成であれば、重要語句が文書情報に含まれていると、コンテンツ作成手段により、文書情報格納枠においてその重要語句内での改行が禁止される。
【0039】
また、準重要語句が文書情報に含まれていると、コンテンツ作成手段により、文書情報格納枠においてその準重要語句内での改行が禁止される。
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記コンテンツ作成手段は、前記文書情報について形態素解析を行い、その解析結果に基づいて各形態素の末尾を改行候補位置として設定し、前記改行候補位置のいずれかで改行を行うようになっており、前記重要語句または前記準重要語句が前記文書情報に含まれているときは、前記重要語句内または前記準重要語句内に設定されている改行候補位置についてその設定を解除するようになっている。
【0040】
このような構成であれば、コンテンツ作成手段により、文書情報について形態素解析が行われ、その解析結果に基づいて各形態素の末尾が改行候補位置として設定される。そして、重要語句が文書情報に含まれていると、重要語句内に設定されている改行候補位置についてその設定が解除される。また、準重要語句が文書情報に含まれていると、準重要語句内に設定されている改行候補位置についてその設定が解除される。このように設定が解除された後、最終的には、改行候補位置のいずれかで改行が行われる。
【0041】
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記重要語句記憶手段は、情勢または話題に応じた話題性キーワードを前記重要語句として記憶するようになっている。
このような構成であれば、重要語句記憶手段の話題性キーワードが文書情報に含まれていると、コンテンツ作成手段により、文書情報格納枠内の文書のうちその話題性キーワードについて整形または修飾が行われる。
【0042】
また、重要語句記憶手段の話題性キーワードを構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれていると、同様にして、コンテンツ作成手段により、文書情報格納枠内の文書のうちその準重要語句について整形または修飾が行われる。
ところで、ディジタルコンテンツの編集過程では、レイアウトを機械的に行っては見やすさや見栄えが著しく損なわれる可能性があるため、例えば、デザイナがあらかじめレイアウトのひな形をいくつか設計しておき、そのレイアウトのひな形に基づいてデザイナが意図したレイアウトとなるようにディジタルコンテンツを編集するといった対策が講じられる。この場合、掲載しようとする情報の内容、文字数、論理構造によらず、大体デザイナが意図したレイアウトとなるようにディジタルコンテンツを編集できることが望まれる。
【0043】
これを解決するため、従来技術として、文書情報格納枠に文書情報が格納しきれない場合には、文書情報格納枠の形状や配置位置を変更せず、フォントサイズや行数等の書式を自動的に変更することにより文書情報格納枠に文書情報を格納する構成が知られている。
しかしながら、このような構成では、文書情報格納枠の形状や配置位置については、ある程度デザイナが意図したレイアウトとなることが期待できるが、フォントサイズや行数等の書式については、文書情報の文字数によって書式が変更されることがあり、デザイナが意図したレイアウトを損なう可能性があった。
【0044】
また、従来技術として、文書情報格納枠に文書情報が格納しきれない場合には、文書情報格納枠のフォントサイズや行数等の書式を変更せず、形状や配置位置を自動的に変更することにより文書情報格納枠に文書情報を格納する構成が知られている。
しかしながら、このような構成では、フォントサイズや行数等の書式については、ある程度デザイナが意図したレイアウトとなることが期待できるが、文書情報格納枠の形状や配置位置については、文書情報の文字数によって形状や配置位置が変更されることがあり、デザイナが意図したレイアウトを損なう可能性があった。
【0045】
したがって、文書整形システムにより、文書を整形しまたは修飾した結果、文書情報格納枠に文書情報が格納しきれない場合には、フォントサイズ等を変更したりして文書情報を格納するようにすることが考えられるが、その場合には、デザイナが意図したレイアウトが損なわれないように配慮することが必要である。本発明に記載の文書整形システムは、その点を解決することを目的としている。
【0046】
さらに、本発明に記載のディジタルコンテンツ作成システムは、前記文書情報格納枠の格納文字数に対して影響を及ぼすことがあるパラメータについてその値の変更許容範囲が設定可能であり、前記コンテンツ作成手段は、前記パラメータのうち前記変更許容範囲が設定された特定パラメータの値をその変更許容範囲内で変更して前記文書情報格納枠の格納文字数を調整するようになっている。
【0047】
このような構成であれば、コンテンツ作成手段により、特定パラメータの値がその変更許容範囲内で変更されて文書情報格納枠の格納文字数が調整される。
ここで、パラメータとは、文書情報格納枠の格納文字数に対して影響を及ぼすことがあるパラメータであり、これには、例えば、文書情報格納枠のフォントサイズ、行数、1行当たりの文字数、行間ピッチ若しくは文字間ピッチの設定に関するパラメータ、または文書情報格納枠の大きさ、形状若しくは配置位置の設定に関するパラメータが含まれる。
【0048】
また、パラメータは、文書情報格納枠の格納文字数に対して単独で影響を及ぼす性質のもののほか、文書情報格納枠の格納文字数に対して単独では影響を及ぼさないものの他のパラメータの値との組み合わせで影響を及ぼす性質のものも含む。
また、複数のパラメータについて変更許容範囲を設定する場合は、複数のパラメータについて変更許容範囲をそれぞれ設定してもよいし、複数のパラメータについて、それらパラメータの一部または全部と共用する変更許容範囲を設定してもよい。後者の場合、例えば、文書情報格納枠の行数および1行当たりの文字数をいずれも30以上でかつ40以下に制限したい場合には、行数の設定に関するパラメータおよび1行当たりの文字数の設定に関するパラメータについて、30以上でかつ40以下を範囲とする1つの変更許容範囲を設定することができる。
【0049】
また、変更許容範囲は、上限値および下限値を設定することもできるし、上限値だけまたは下限値だけを設定することもできる。
また、格納文字数の調整は、文書情報の文字数が大きいため、文書情報格納枠に文書情報が格納しきれない場合に、文書情報格納枠に文書情報が可能な限り格納できるように、文書情報格納枠の格納文字数を調整することのほか、逆に、文書情報の文字数が小さいため、文書情報格納枠に文書情報を格納することはできるが文書情報格納枠に余白が生じてしまう場合に、余白が可能な限り少なくなるように、文書情報格納枠の格納文字数を調整することが含まれる。
【0050】
さらに、本発明に記載のディジタルコンテンツ作成システムは、複数の前記パラメータについて前記変更許容範囲がそれぞれ設定可能であり、前記コンテンツ作成手段は、前記パラメータの変更のうち許容されるすべての変更のなかで前記文書情報格納枠の格納文字数が最大となるときの当該格納文字数を限度として、前記文書情報格納枠に前記文書情報が可能な限り格納できるように、前記複数の特定パラメータのうち値を保持すべき重要度が低いパラメータほど優先的にその値をその変更許容範囲内で変更するようになっている。
【0051】
このような構成であれば、コンテンツ作成手段により、パラメータの変更のうち許容されるすべての変更のなかで文書情報格納枠の格納文字数が最大となるときのその格納文字数を限度として、文書情報格納枠に文書情報が可能な限り格納できるように、複数の特定パラメータのうち重要度が低いパラメータほど優先的にその値がその変更許容範囲内で変更される。
ここで、パラメータの変更のうち許容されるすべての変更とは、特定パラメータについては変更許容範囲内で取り得るすべての変更を、パラメータのうち特定パラメータ以外のものについては、他の制約がなければ全範囲内で取り得るすべての変更を、他の制約があればその制約範囲内で取り得るすべての変更をいう。他の制約とは、一の文書情報格納枠と他の文書情報格納枠とが重複した領域に配置されないように、または重複領域に配置しても重複部分が極力小となるように、文書情報格納枠の大きさ、形状または配置位置の変更範囲を制限することが一例として挙げられる。
【0052】
したがって、パラメータの変更のうち許容されるすべての変更のなかで文書情報格納枠の格納文字数が最大となるときのその格納文字数とは、上記のように、特定パラメータおよびそれ以外のパラメータごとにその取り得るすべての変更を行った場合に、それぞれの変更に伴って文書情報格納枠の格納文字数が変化することとなるが、その変化のなかで文書情報格納枠の格納文字数が最大となるときのその格納文字数をいう。
【0053】
さらに、本発明に記載のディジタルコンテンツ作成システムは、前記複数の特定パラメータのうちの一つには、前記文書情報格納枠のフォントサイズの設定に関するフォントパラメータを含み、前記フォントパラメータの変更許容範囲として下限値を設定しておく。
このような構成であれば、フォントサイズについては、コンテンツ作成手段により、文書情報格納枠に文書情報が可能な限り格納できるように、フォントパラメータの値が所定の下限値を限度として変更される。
【0054】
さらに、本発明に記載のディジタルコンテンツ作成システムは、前記複数の特定パラメータのうちの一つには、前記文書情報格納枠の行数または1行当たりの文字数の設定に関する文字間隔パラメータを含み、前記文字間隔パラメータの変更許容範囲として上限値を設定しておく。
このような構成であれば、行数または1行当たりの文字数については、コンテンツ作成手段により、文書情報格納枠に文書情報が可能な限り格納できるように、文字間隔パラメータの値が所定の上限値を限度として変更される。
【0055】
さらに、本発明に記載のディジタルコンテンツ作成システムは、前記複数の特定パラメータのうちの一つには、前記文書情報格納枠の行数または1行当たりの文字数の設定に関する文字間隔パラメータを含み、前記文字間隔パラメータの変更許容範囲として上限値を設定しておく。
このような構成であれば、行数または1行当たりの文字数については、コンテンツ作成手段により、文書情報格納枠に文書情報が可能な限り格納できるように、文字間隔パラメータの値が所定の上限値を限度として変更される。
【0056】
さらに、本発明に記載のディジタルコンテンツ作成システムは、前記フォントパラメータを、前記文字間隔パラメータよりも前記重要度が低いパラメータとして指定しておく。
このような構成であれば、コンテンツ作成手段により、文書情報格納枠に文書情報が可能な限り格納できるように、文字間隔パラメータの値よりもフォントパラメータの値の方が優先的に変更される。
【0057】
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記コンテンツ作成手段は、前記フォントパラメータについてその変更許容範囲内で取り得るいかなる変更によっても前記文書情報格納枠に前記文書情報が格納できないときは、前記文字間隔パラメータの値を所定値上げて、前記フォントパラメータの値を変更するようになっている。
【0058】
このような構成であれば、コンテンツ作成手段により、フォントパラメータについてその変更許容範囲内で取り得るいかなる変更によっても文書情報格納枠に文書情報が格納できないと、文字間隔パラメータの値が所定値上げられて、フォントパラメータの値が変更される。
さらに、本発明に記載のディジタルコンテンツ作成システムは、前記文字間隔パラメータを、前記フォントパラメータよりも前記重要度が低いパラメータとして指定しておく。
【0059】
このような構成であれば、コンテンツ作成手段により、文書情報格納枠に文書情報が可能な限り格納できるように、フォントパラメータの値よりも文字間隔パラメータの値の方が優先的に変更される。
さらに、本発明に記載のディジタルコンテンツ作成システムにおいては、前記コンテンツ作成手段は、前記文字間隔パラメータについてその変更許容範囲内で取り得るいかなる変更によっても前記文書情報格納枠に前記文書情報が格納できないときは、前記フォントパラメータの値を所定値下げて、前記文字間隔パラメータの値を変更するようになっている。
【0060】
このような構成であれば、コンテンツ作成手段により、文字間隔パラメータについてその変更許容範囲内で取り得るいかなる変更によっても文書情報格納枠に文書情報が格納できないと、フォントパラメータの値が所定値下げられて、文字間隔パラメータの値が変更される。
さらに、本発明に記載のディジタルコンテンツ作成システムは、ユーザに関するユーザ情報を記憶するためのユーザ情報記憶手段を備え、前記コンテンツデータ選択手段は、前記ユーザ情報記憶手段のユーザ情報に基づいて、前記コンテンツデータ記憶手段のなかから前記コンテンツデータを選択するようになっている。
【0061】
このような構成であれば、コンテンツデータ選択手段により、ユーザ情報記憶手段のユーザ情報に基づいて、コンテンツデータ記憶手段のなかからコンテンツデータが選択される。
ここで、ユーザ情報には、例えば、ユーザの年齢、性別、興味嗜好、住所、氏名またはユーザ端末に関する使用環境が含まれる。
【0062】
また、ユーザ情報記憶手段は、ユーザ情報をあらゆる手段でかつあらゆる時期に記憶するものであり、ユーザ情報をあらかじめ記憶してあるものであってもよいし、ユーザ情報をあらかじめ記憶することなく、本システムの動作時に外部からの入力等によってユーザ情報を記憶するようになっていてもよい。
さらに、本発明に記載のディジタルコンテンツ作成システムは、ユーザに関するユーザ情報を記憶するためのユーザ情報記憶手段を備え、前記コンテンツ作成手段は、前記ユーザ情報記憶手段のユーザ情報に基づいて、前記コンテンツデータ選択手段で選択したコンテンツデータを用いて出力レイアウトを決定するようになっている。
【0063】
このような構成であれば、コンテンツ作成手段により、ユーザ情報記憶手段のユーザ情報に基づいて、選択されたコンテンツデータを用いて出力レイアウトが決定される。
ここで、ユーザ情報に基づいて出力レイアウトを決定することとして、ユーザ情報に年齢を含む場合は、ユーザが比較的年輩者であるならば、フォントサイズが比較的大きいレイアウトを採用することが考えられる。また、ユーザ情報に性別を含む場合は、性別が女性であれば、丸文字フォントのレイアウトを採用することが考えられる。また、ユーザ情報に興味嗜好を含む場合は、その興味嗜好に応じて、子供向け雑誌風、スポーツ新聞風または技術文書風のレイアウトを採用することが考えられる。また、ユーザ情報に住所を含む場合は、その住所のある土地に特化した風景の画像を背景としたレイアウトを採用することが考えられる。また、ユーザ情報に氏名を含む場合は、その氏名をタイトルとしたレイアウトを採用することが考えられる。また、ユーザ情報にユーザ端末に関する使用環境を含む場合は、ユーザ端末のRAMの容量が少ないときは、データ容量の大きな画像はできるだけ使用しないようなレイアウトを採用することが考えられる。
【0064】
一方、上記目的を達成するために、本発明に記載の文書整形プログラムは、コンピュータシステムからなる本発明に記載の文書整形システムに、文書を整形しまたは修飾する処理を実行させるためのプログラムであって、出力すべき文書情報が与えられた場合に、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報に基づき出力すべき文書のうち当該重要語句または当該準重要語句について整形または修飾を行う処理を実行させるためのプログラムである。
【0065】
このような構成であれば、文書整形システムによってプログラムが読み取られ、読み取られたプログラムに従って文書整形システムが処理を実行すると、本発明に記載の文書整形システムと同等の作用が得られる。
一方、上記目的を達成するために、本発明に記載のディジタルコンテンツ作成プログラムは、コンピュータシステムからなる本発明に記載のディジタルコンテンツ作成システムに、前記コンテンツ作成手段として実現される処理を実行させるためのプログラムであって、前記コンテンツ作成手段は、複数の形態素からなる重要語句を記憶する重要語句記憶手段が利用可能となった場合に、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報格納枠内の文書のうち当該重要語句または当該準重要語句について整形または修飾を行う処理を実行させるためのプログラムである。
【0066】
このような構成であれば、ディジタルコンテンツ作成システムによってプログラムが読み取られ、読み取られたプログラムに従ってディジタルコンテンツ作成システムが処理を実行すると、本発明に記載のディジタルコンテンツ作成システムと同等の作用が得られる。
一方、上記目的を達成するために、本発明に記載の文書整形方法は、複数の形態素からなる重要語句を記憶する重要語句記憶手段が利用可能となった場合に、前記重要語句記憶手段を参照して可読性が高まるように文書を整形しまたは修飾する方法であって、出力すべき文書情報が与えられた場合に、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報に基づき出力すべき文書のうち当該重要語句または当該準重要語句について整形または修飾を行う。
【0067】
一方、上記目的を達成するために、本発明に記載のディジタルコンテンツ作成方法は、選択されたコンテンツデータを用いて出力レイアウトを決定しディジタルコンテンツを作成するコンテンツ作成ステップを含み、前記コンテンツ作成ステップは、前記コンテンツデータを構成する文書情報を、レイアウト領域に配置された文書情報格納枠に格納することにより前記ディジタルコンテンツを作成する方法であって、前記コンテンツ作成ステップは、複数の形態素からなる重要語句を記憶する重要語句記憶手段が利用可能となった場合に、前記重要語句記憶手段の重要語句が前記文書情報に含まれているとき、または前記重要語句記憶手段の重要語句を構成する各形態素をその順で断片的に含む準重要語句が前記文書情報に含まれているときは、前記文書情報格納枠内の文書のうち当該重要語句または当該準重要語句について整形または修飾を行う。
【0068】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら説明する。図1ないし図24は、本発明に係る文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法の実施の形態を示す図である。
本実施の形態は、本発明に係る文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法を、図1に示すように、コンテンツ配信端末100において、ニュース等のディジタルコンテンツをユーザ端末200に配信する場合について適用したものである。
【0069】
まず、本発明を適用するネットワークシステムの構成を図1を参照しながら説明する。図1は、本発明を適用するネットワークシステムの構成を示すブロック図である。
インターネット199には、図1に示すように、コンテンツデータを提供する複数のコンテンツデータ提供端末S1〜Snと、コンテンツデータ提供端末S1〜Snから提供されたコンテンツデータを収集蓄積してディジタルコンテンツを配信するコンテンツ配信するコンテンツ配信端末100と、ユーザの利用に供するユーザ端末200とが接続されている。なお、発明の理解を容易にするため、ユーザ端末200を一台しか図示していないが、実際には、複数のユーザ端末がインターネット199に接続されている。
【0070】
コンテンツデータ提供端末S1〜Snは、CPU、ROM、RAMおよびI/F等をバス接続した一般的なコンピュータと同一機能を有して構成されており、コンテンツデータを作成したときは、コンテンツデータのカテゴリを特定するためのカテゴリNo.をそのコンテンツデータに付加し、コンテンツ配信端末100に送信するようになっている。なお、カテゴリNo.については、後段で詳細に説明する。
【0071】
ユーザ端末200は、CPU、ROM、RAMおよびI/F等をバス接続した一般的なコンピュータと同一機能を有して構成されており、WWW(World Wide Web)ブラウザを有し、WWWブラウザによりコンテンツ配信端末100にアクセスするようになっている。
次に、コンテンツ配信端末100の機能概要を図2を参照しながら詳細に説明する。図2は、コンテンツ配信端末100の機能概要を示す機能ブロック図である。
【0072】
コンテンツ配信端末100は、図2に示すように、XML(eXtensible Markup Language)形式のコンテンツデータファイル10を解析するXMLパーサ11と、XMLパーサ11で解析したコンテンツデータファイル10を入力するコンテンツデータファイル入力部12と、XML形式のレイアウト定義ファイル13を解析するXMLパーサ14と、XMLパーサ14で解析したレイアウト定義ファイル13を入力するレイアウト定義ファイル入力部15と、入力部12,15で入力したコンテンツデータファイル10およびレイアウト定義ファイル13に基づいてレイアウトを行うレイアウティング部16と、レイアウティング部16からのXML形式の描画指定ファイル17を解析するXMLパーサ18と、XMLパーサ18で解析した描画指定ファイル17に基づいて描画を行うことによりPDF(Portable Document Format)形式のファイル20を作成するラスタライズ部19とで構成されている。本実施の形態は、これら構成要素のうち特にレイアウティング部16に特徴があるものである。
【0073】
次に、コンテンツ配信端末100の構成を図3を参照しながら詳細に説明する。図3は、コンテンツ配信端末100の構成を示すブロック図である。
コンテンツ配信端末100は、図3に示すように、制御プログラムに基づいて演算およびシステム全体を制御するCPU30と、所定領域にあらかじめCPU30の制御プログラム等を格納しているROM32と、ROM32等から読み出したデータやCPU30の演算過程で必要な演算結果を格納するためのRAM34と、外部装置に対してデータの入出力を媒介するI/F38とで構成されており、これらは、データを転送するための信号線であるバス39で相互にかつデータ授受可能に接続されている。
【0074】
I/F38には、外部装置として、ユーザ情報を登録するユーザ情報登録DB40と、複数の形態素からなる話題性キーワードとしての重要語句を登録する重要語句登録DB42と、コンテンツデータ提供端末S1〜Snから提供されたコンテンツデータを収集蓄積するコンテンツデータ登録DB44と、インターネット199に接続するための信号線とが接続されている。
次に、ユーザ情報登録DB40のデータ構造を図面を参照しながら詳細に説明する。
【0075】
ユーザ情報登録DB40には、図4に示すように、ユーザ情報を登録するユーザプロファイルテーブル300が格納されている。図4は、ユーザプロファイルテーブル300のデータ構造を示す図である。
ユーザプロファイルテーブル300は、図4に示すように、各ユーザごとに1または複数のレコードが登録可能となっている。各レコードは、ユーザを特定するためのユーザIDを登録するフィールド302と、ディジタルコンテンツの配信先アドレスを登録するフィールド304と、カテゴリNo.を登録するフィールド306と、キーワードを登録するフィールド308と、配信日を登録するフィールド310と、配信時刻を登録するフィールド312と、レイアウトNo.を登録するフィールド314と、最大ページ数を登録するフィールド316とを含んで構成されている。
【0076】
フィールド308には、ユーザが指定したキーワードを含むコンテンツデータを配信対象として選択する場合においてそのキーワードを登録する。キーワードとしては、例えば、ユーザが興味をもっているカテゴリの記事において頻出すると思われるキーワードを与える。図4の例では、フィールド308の第1段目には「プロセッサ」が、フィールド308の第2段目には「OS(Operating System)」がそれぞれ登録されている。
【0077】
フィールド310には、ユーザがディジタルコンテンツの配信を希望する配信日を登録する。配信日としては、例えば、ディジタルコンテンツの配信を毎日希望する場合は「毎日」を指定し、平日のみ配信を希望する場合は「平日」を指定し、週末のみ配信を希望する場合は「週末」を指定する。図4の例では、フィールド310の第1段目には「毎日」が、フィールド310の第2段目には「平日」がそれぞれ登録されている。
【0078】
フィールド312には、ユーザが指定した配信日においてディジタルコンテンツの配信を希望する配信時刻を登録する。配信時刻としては、例えば、1日を0時から23時までの24時間制時刻で表現したときのいずれかの時刻を指定する。図4の例では、フィールド312の第1段目には5時が、フィールド312の第2段目には11時がそれぞれ登録されている。
フィールド314には、ディジタルコンテンツの出力レイアウトを特定するためのレイアウトNo.を登録する。レイアウトNo.としては、例えば、ユーザが希望する出力レイアウトを特定するためのレイアウトNo.を指定する。図4の例では、フィールド314の第1段目にはレイアウトNo.2が、フィールド314の第2段目にはレイアウトNo.5がそれぞれ登録されている。なお、レイアウトNo.については、後段で詳細に説明する。
【0079】
フィールド316には、ディジタルコンテンツの表示または印刷を行ったときにその上限となる最大ページ数を登録する。最大ページ数としては、例えば、上限となる最大ページ数を指定するほか、「u」という表記により上限を設定しないことを指定することもできる。図4の例では、フィールド316の第1段目には2ページが、フィールド316の第3段目には「u」がそれぞれ登録されている。
【0080】
また、ユーザ情報登録DB40には、図5に示すように、ディジタルコンテンツの出力レイアウトを規定した複数のレイアウト定義ファイルform01〜form06と、レイアウト定義ファイルform01〜form06とレイアウトNo.との対応関係を示すレイアウトNo.対応テーブル330とが格納されている。図5は、レイアウト定義ファイルおよびレイアウトNo.対応テーブル330のデータ構造を示す図である。
【0081】
レイアウト定義ファイルform01〜form06は、例えば、文書情報や画像情報を格納するための情報格納枠の大きさおよび配置位置を、文書情報格納枠については、大きさおよび配置位置のほか、フォントサイズ、フォント種類、フォント色、行数(または行間ピッチ)および1行当たりの文字数(または文字間ピッチ)を、画像情報格納枠については、大きさおよび配置位置のほか、画像の数、品質およびアスペクト比を定義しており、XML等により記述されている。
【0082】
レイアウトNo.対応テーブル330には、図5(b)に示すように、各レイアウトNo.ごとに一つのレコードが登録されている。各レコードは、レイアウトNo.を登録したフィールド332と、レイアウト定義ファイルのファイル名を登録したフィールド334とを含んで構成されている。図5(b)の例では、第1段目のレコードには、レイアウトNo.として「1」が、レイアウト定義ファイル名として「form01」がそれぞれ登録されており、第2段目のレコードには、レイアウトNo.として「2」が、レイアウト定義ファイル名として「form02」がそれぞれ登録されている。
【0083】
次に、レイアウト定義ファイルform01〜form06のデータ構造を図6を参照しながら詳細に説明する。図6は、レイアウト定義ファイルのデータ構造の一部を示す図である。なお、各レイアウト定義ファイルform01〜form06は、それぞれ異なるデータ構造となっているが、ここでは、レイアウト定義ファイルform01〜form06のなかから代表的なものを取り上げて説明する。
レイアウト定義ファイルform01は、各ページごとにレイアウト領域360を有し、そのうち例えば1ページ目のレイアウト領域360は、図6(a)に示すように、タイトル情報を格納するためのタイトル情報格納枠362と、文書情報を格納するための文書情報格納枠364と、画像情報を格納するための画像情報格納枠366と、画像情報格納枠368と、文書情報格納枠370とを配置して構成されている。そして、文書情報格納枠364には、IDとして「World」が付されている。
【0084】
また、例えば5ページ目のレイアウト領域360は、図6(b)に示すように、文書情報格納枠372を配置して構成されており、文書情報格納枠372には、IDとして、文書情報格納枠364に付されたのと同一の「World」が付されている。これは、文書情報格納枠364と文書情報格納枠372とがIDによって関連付けられ、文書情報格納枠364に文書情報が格納しきれず溢れた場合には、文書情報のうち文書情報格納枠364に格納しきれなかったフローオブジェクトを、文書情報格納枠372に格納することを意味している。ここで、フローオブジェクトとは、現在のページまたはそれよりも前のページで文書情報格納枠に格納しきれずに溢れた文書情報その他の溢れ情報をいう。以下、同じ。
【0085】
なお、図6の例では、IDを付すことにより文書情報格納枠を関連付けて使用しているが、これはあくまで一例であり、例えば、レイアウト過程において、フローオブジェクトを格納する際に、未使用の文書情報格納枠を、そのフローオブジェクトを格納するための文書情報格納枠として使用してもよい。
また、レイアウト定義ファイルform01は、各文書情報格納枠ごとに、その文書情報格納枠の格納文字数に対して影響を及ぼすパラメータとして、文字の書式設定に関するパラメータおよび文字割付の設定に関するパラメータが設定可能となっている。図7は、XMLで記述したレイアウト定義ファイルform01の内容の一部を示すデータリストである。
【0086】
図7においては、文字の書式設定に関するパラメータ380と、文字割付の設定に関するパラメータ382とが設定されている。図7の例では、パラメータ380には、フォント種類として「MSゴシック」が、フォントサイズの初期値として「13ポイント」が、フォントサイズの下限値として「10.5ポイント」がそれぞれ設定されており、これは、文書情報格納枠に文書情報がちょうど格納できる場合には、13ポイントのフォントサイズとなるが、文書情報格納枠に文書情報が格納しきれない場合には、フォントサイズを10.5ポイントまで減少させてもよいことを意味している。また、パラメータ382には、文字揃えの方法として「中央」が、行数の上限値として「3行」が、フォントサイズおよび行数のうち値を保持すべき重要度が高いものとして「行数」がそれぞれ設定されており、これは、文書情報格納枠に文書情報が格納しきれない場合には、行数を3行まで増加させてもよいことを意味している。ただし、フォントサイズよりも行数の重要度の方が高く設定されているので、行数を増加させる場合は、フォントサイズを10.5ポイントまで減少させても、文書情報格納枠になお格納しきれないときである。
【0087】
なお、図7の例は、フォントサイズよりも行数の重要度の方を高く設定した場合であるが、もちろん、行数よりもフォントサイズの重要度の方を高く設定することもできる。どちらを優先するかは、レイアウトのコンセプトに基づいてデザイナが自由に設定することができる。
また、ユーザ情報登録DB40には、ディジタルコンテンツをレイアウトする際に、図8に示すように、フローオブジェクトを管理するためのフロー管理テーブル400が生成・格納される。図8は、フロー管理テーブル400のデータ構造を示す図である。
【0088】
フロー管理テーブル400は、図8に示すように、フローオブジェクトごとに一つのレコードを登録するようになっている。各レコードは、フローオブジェクトを特定するための記事番号を登録するフィールド402と、文書情報のうちフローオブジェクトの先頭位置(オーバーフロー位置)を登録するフィールド404と、フローオブジェクトが発生した文書情報格納枠が属するページ番号(オーバーフロー元のページ番号)を登録するフィールド408と、フローオブジェクトの末尾を格納した文書情報格納枠が属するページ番号(フローオブジェクトの格納ページ番号)を登録するフィールド410と、フローオブジェクトが未処理か否かを示す処理済フラグを登録するフィールド412とを含んで構成されている。
【0089】
フロー管理テーブル400によれば、フローオブジェクトはFIFO(First In First Out)方式で処理される。すなわち、溢れの回数が1回目のフローオブジェクトについては、フロー管理テーブル400の末尾にそのレコードが登録され、未処理のフローオブジェクトについては、フロー管理テーブル400の先頭から順番に処理される。ただし、未処理のフローオブジェクトを処理した結果、新たな情報格納枠にも格納しきれずに再び溢れた場合には、そのフローオブジェクトについては、例外的にフロー管理テーブル400の先頭にそのレコードが登録される。これは、先頭に登録して優先的に処理することにより、記事の内容が幅広いページ数にわたって分散配置されるのを防止するためである。
【0090】
次に、重要語句登録DB424のデータ構造を図面を参照しながら詳細に説明する。
重要語句登録DB42には、図9に示すように、重要語句をその出現頻度と対応付けて登録する重要語句登録テーブル450が格納されている。図9は、重要語句登録テーブル450のデータ構造を示す図である。
重要語句登録テーブル450は、図9に示すように、各重要語句ごとに1つのレコードが登録可能となっている。各レコードは、重要語句を登録するフィールド452と、出現頻度を登録するフィールド454とを含んで構成されている。
【0091】
図9の例では、第1段目のレコードには、重要語句として「米国同時多発」がフィールド452に、出現頻度として「100」がフィールド454にそれぞれ登録されている。これは、「米国同時多発」という重要語句が、これまで作成したディジタルコンテンツの文書中に100回出現したことを意味している。なお、図9では、3つの形態素からなる重要語句を重要語句登録テーブル450に登録した例を示したが、これに限らず、2つの形態素からなる重要語句または4つ以上の形態素からなる重要語句を重要語句登録テーブル450に登録するようにしてもよい。
【0092】
次に、コンテンツデータ登録DB44のデータ構造を図面を参照しながら詳細に説明する。
コンテンツデータ登録DB44には、図10に示すように、コンテンツデータ提供端末S1〜Snから提供されたコンテンツデータと、メインカテゴリおよびサブカテゴリとカテゴリNo.との対応関係を示すカテゴリ対応テーブル340とが格納されている。図10は、コンテンツデータおよびカテゴリNo.対応テーブル340のデータ構造を示す図である。
【0093】
コンテンツデータ提供端末S1〜Snから提供されたコンテンツデータには、図10(a)に示すように、記事番号およびカテゴリNo.が付されており、コンテンツ配信端末100は、そのカテゴリNo.に基づいて、コンテンツデータをカテゴリごとに分類してコンテンツデータ登録DB44に登録する。登録の際には、カテゴリNo.対応テーブル340を参照して、記事番号およびカテゴリNo.のほか、さらにメインカテゴリおよびサブカテゴリをコンテンツデータに付加して登録する。また、コンテンツデータは、記事のタイトルを示すタイトル情報と、記事の画像に関する画像情報と、記事の文章に関する文書情報とを含んで一つの記事として構成されている。
【0094】
カテゴリNo.対応テーブル340には、図10(b)に示すように、各メインカテゴリおよびサブカテゴリごとに一つのレコードが登録されている。各レコードは、カテゴリNo.を登録したフィールド342と、メインカテゴリを登録したフィールド344と、サブカテゴリを登録したフィールド346とを含んで構成されている。図10(b)の例では、第1段目のレコードには、カテゴリNo.として「1102」が、メインカテゴリとして「ワールドニュース」が、サブカテゴリとして「アメリカ」がそれぞれ登録されており、第6段目のレコードには、カテゴリNo.として「2010」が、メインカテゴリとして「スポーツ」が、サブカテゴリとして「野球」がそれぞれ登録されている。
【0095】
次に、CPU30の構成およびCPU30で実行される処理を図11および図12を参照しながら説明する。
CPU30は、マイクロプロセッシングユニットMPU等からなり、ROM32の所定領域に格納されている所定のプログラムを起動させ、そのプログラムに従って、図11および図12のフローチャートに示すユーザ登録処理およびコンテンツ配信処理をそれぞれ時分割で実行するようになっている。
【0096】
初めに、ユーザ登録処理を図11を参照しながら詳細に説明する。図11は、ユーザ登録処理を示すフローチャートである。
ユーザ登録処理は、アクセスのあったユーザに対してユーザID等の必要なユーザ情報の入力を要求し、入力したユーザ情報をユーザプロファイルテーブル300に登録する処理であって、CPU30において実行されると、まず、図11に示すように、ステップS100に移行するようになっている。なお、以下、各ステップでの入力は、すべてユーザとの対話型通信により行う。
【0097】
ステップS100では、メインカテゴリおよびサブカテゴリを入力し、ステップS102に移行して、ユーザIDおよびパスワードを入力し、ステップS104に移行して、配信先アドレスを入力し、ステップS106に移行して、配信日および配信時刻を入力し、ステップS108に移行する。
ステップS108では、レイアウトNo.を入力し、ステップS110に移行して、最大ページ数を入力し、ステップS114に移行して、ステップS100〜S110で入力したユーザ情報をユーザプロファイルテーブル300に登録し、一連の処理を終了して元の処理に復帰させる。
【0098】
次に、コンテンツ配信処理を図12を参照しながら詳細に説明する。図12は、コンテンツ配信処理を示すフローチャートである。
コンテンツ配信処理は、ユーザプロファイルテーブル300を参照してディジタルコンテンツをユーザ端末200に配信する処理であって、CPU30において実行されると、まず、図12に示すように、ステップS200に移行するようになっている。なお、以下、各ステップの処理は、ユーザプロファイルテーブル300の一つのレコードについての処理である。実際には、ユーザプロファイルテーブル300に登録されているレコード数だけ各ステップの処理を実行する。
【0099】
ステップS200では、ユーザプロファイルテーブル300から配信日および配信時刻を読み出し、ステップS202に移行して、読み出した配信日および配信時刻に基づいてディジタルコンテンツを配信すべき日時であるか否かを判定し、ディジタルコンテンツを配信すべき日時であると判定したとき(Yes)は、ステップS204に移行するが、そうでないと判定したとき(No)は、ステップS200に移行する。
【0100】
ステップS204では、ユーザプロファイルテーブル300からカテゴリNo.を読み出し、ステップS206に移行して、読み出したカテゴリNo.をもとにコンテンツデータ登録DB44のコンテンツデータを検索して、そのカテゴリNo.と一致するカテゴリNo.が付されたコンテンツデータを索出し、ステップS208に移行する。
ステップS208では、ユーザプロファイルテーブル300からレイアウトNo.を読み出し、ステップS210に移行して、レイアウトNo.対応テーブル330を参照して、読み出したレイアウトNo.に対応するレイアウト定義ファイルをユーザ情報登録DB40から読み出し、ステップS212に移行して、読み出したレイアウト定義ファイルに基づいて、ステップS206で索出したコンテンツデータを用いて出力レイアウトを決定しディジタルコンテンツを作成する自動レイアウト処理を実行し、ステップS214に移行する。
【0101】
ステップS214では、ユーザプロファイルテーブル300から配信先アドレスを読み出し、ステップS216に移行して、読み出した配信先アドレス宛に、作成したディジタルコンテンツを配信し、一連の処理を終了して元の処理に復帰させる。
次に、上記ステップS212の自動レイアウト処理を図13を参照しながら詳細に説明する。図13は、自動レイアウト処理を示すフローチャートである。
【0102】
自動レイアウト処理は、上記ステップS212において実行されると、図13に示すように、まず、ステップS300に移行するようになっている。
ステップS300では、ステップS210で読み出したレイアウト定義ファイルのレイアウト領域360のうち先頭ページのものを処理対象として設定し、ステップS302に移行して、ページ内に固定的に配置される固定線の位置を決定し、ステップS304に移行して、ページ内に固定的に配置される固定文書情報の形状および位置を決定し、ステップS306に移行して、ページ内に固定的に配置される固定画像情報の形状および位置を決定し、ステップS308に移行する。
【0103】
ステップS308では、フローオブジェクトを格納する文書情報格納枠の形状および位置を決定し、フローオブジェクトをその文書情報格納枠に格納する処理を実行し、ステップS310に移行して、所定の優先順位に基づいて、ステップS206で索出したコンテンツデータのなかからレイアウト領域360に配置すべき記事を選択し、ステップS312に移行する。
ステップS312では、ステップS310で選択した選択記事に基づいてタイトル情報格納枠の形状および位置を決定し、選択記事に含まれるタイトル情報をそのタイトル情報格納枠に格納する処理を実行し、ステップS314に移行して、選択記事に基づいて画像情報格納枠の形状および位置を決定し、選択記事に含まれる画像情報をその画像情報格納枠に格納する処理を実行し、ステップS316に移行して、選択記事に基づいて文書情報格納枠の形状および位置を決定し、選択記事に含まれる文書情報をその文書情報格納枠に格納する処理を実行し、ステップS318に移行する。
【0104】
ステップS318では、レイアウト領域360内に未処理の情報格納枠が存在するか否かを判定し、未処理の情報格納枠が存在しないと判定したとき(No)は、ステップS320に移行して、ステップS210で読み出したレイアウト定義ファイルのすべてのページについてステップS302〜S318の処理が終了したか否かを判定し、すべてのページについて処理が終了したと判定したとき(Yes)は、ステップS322に移行して、未処理のフローオブジェクトを掲載する処理を実行し、一連の処理を終了して元の処理に復帰させる。
【0105】
一方、ステップS320で、ステップS210で読み出したレイアウト定義ファイルのすべてのページについてステップS302〜S318の処理が終了していないと判定したとき(No)は、ステップS324に移行して、ステップS210で読み出したレイアウト定義ファイルのレイアウト領域360のうち次のページのものを処理対象として設定し、ステップS302に移行する。
一方、ステップS318で、レイアウト領域360内に未処理の情報格納枠が存在すると判定したとき(Yes)は、ステップS310に移行する。
【0106】
次に、上記ステップS316の文書情報格納枠への格納処理を図14を参照しながら詳細に説明する。図14は、ステップS316の文書情報格納枠への格納処理を示すフローチャートである。
文書情報格納枠への格納処理は、新たな文書情報を文書情報格納枠に格納する処理であって、上記ステップS316において実行されると、図14に示すように、まず、ステップS402に移行するようになっている。
【0107】
ステップS402では、選択記事に含まれる文書情報について形態素解析を行う形態素解析処理を実行する。形態素解析処理は、選択記事に含まれる文字列を形態素解析により形態素ごとに分割する。例えば、「米国同時多発テロ犠牲者の追悼集会開催」という文字列が選択記事に含まれている場合、これに対して形態素解析を行うと、この文字列は、記号「|」を形態素の区切りとして用い、「米国|同時|多発|テロ|犠牲者の|追悼|集会|開催」のように形態素ごとに分割される。なお、形態素解析については、従来の一般的な技術を採用することができる。
【0108】
次いで、ステップS404に移行して、選択記事に含まれる文書情報から重要語句を取得して重要語句登録テーブル450に登録する重要語句登録処理を実行し、ステップS406に移行して、選択記事に含まれる文字列について改行候補位置を設定する改行候補位置設定処理を実行し、ステップS408に移行する。ステップS408では、選択記事に含まれる文書情報の文字数を算出し、ステップS410に移行して、算出した文字数に基づいて文書情報格納枠の形状および位置を決定し、ステップS412に移行して、選択記事に含まれる文書情報を文書情報格納枠に格納する。具体的に、ステップS410では、既に形状が決定している他の情報格納枠と重なり合わないように文書情報格納枠の形状および位置を決定する。例えば、既に形状が決定している他の情報格納枠と重なり合っている場合は、文書情報格納枠を移動可能な方向に変形・移動することにより、他の情報格納枠と重なり合わないようにする。このとき、デザイナが意図したレイアウトをできるだけ損なわないようにするには、文書情報格納枠の変形または移動の度合いが最小となるように変形または移動を行うのが好ましい。また、変形または移動の方向は、動的に決定してもよいし、あらかじめ決定しておいてもよい。
【0109】
次いで、ステップS414に移行して、選択記事に含まれる文書情報が文書情報格納枠に格納しきれたか否かを判定し、文書情報が文書情報格納枠に格納しきれた(フローでない)と判定したとき(No)は、一連の処理を終了して元の処理に復帰させる。
一方、ステップS414で、選択記事に含まれる文書情報が文書情報格納枠に格納しきれない(フローである)と判定したとき(Yes)は、ステップS416に移行して、文書情報格納枠のパラメータの設定に基づいて、行数よりもフォントサイズの重要度の方が高く設定されているか否かを判定し、フォントサイズの重要度の方が高く設定されていると判定したとき(Yes)は、ステップS418に移行して、フォントサイズの初期値を可能な限り保持することを優先し、文字数の調整により文書情報格納枠に文書情報を格納する処理(以下、フォントサイズ優先型格納処理という。)を実行し、ステップS420に移行する。
【0110】
ステップS420では、ステップS418,S424の処理によって文書情報が文書情報格納枠に格納しきれたか否かを判定し、文書情報が文書情報格納枠に格納しきれた(フローでない)と判定したとき(No)は、一連の処理を終了して元の処理に復帰させるが、そうでない(フローである)と判定したとき(Yes)は、ステップS422に移行して、そのフローオブジェクトについてフロー処理を実行し、一連の処理を終了して元の処理に復帰させる。
【0111】
一方、ステップS416で、フォントサイズよりも行数の重要度の方が高く設定されていると判定したとき(No)は、ステップS424に移行して、行数の初期値を可能な限り保持することを優先し、文字数の調整により文書情報格納枠に文書情報を格納する処理(以下、行数優先型格納処理という。)を実行し、ステップS420に移行する。
次に、上記ステップS404の重要語句登録処理を図15を参照しながら詳細に説明する。図15は、重要語句登録処理を示すフローチャートである。
【0112】
重要語句登録処理は、上記ステップS404において実行されると、図15に示すように、まず、ステップS500に移行するようになっている。
ステップS500では、選択記事に含まれる文書情報を形態素単位でサーチするためのポインタの現在位置を「0」に設定し、ステップS502に移行して、ポインタの現在位置から文書情報の末尾までの形態素数が所定個数(例えば、3つ)以上あるか否かを判定し、現在位置から文書情報の末尾までの形態素数が所定個数以上あると判定したとき(Yes)は、ステップS504に移行して、ポインタの現在位置を先頭として末尾方向に所定個数の形態素列を取得し、ステップS506に移行する。
【0113】
ステップS506では、取得した形態素列と同一の重要語句が重要語句登録テーブル450に登録されているか否かを判定し、取得した形態素列と同一の重要語句が登録されていないと判定したとき(No)は、ステップS508に移行して、取得した形態素列を重要語句として重要語句登録テーブル450に登録し、ステップS510に移行して、ステップS508で登録した重要語句の出現頻度を「1」に設定し、ステップS512に移行して、ポインタの現在位置を次の形態素の先頭位置に設定し、ステップS502に移行する。
【0114】
一方、ステップS506で、取得した形態素列と同一の重要語句が重要語句登録テーブル450に登録されていると判定したとき(Yes)は、ステップS514に移行して、取得した形態素列と同一の重要語句の出現頻度を「1」加算し、ステップS512に移行する。
一方、ステップS502で、ポインタの現在位置から文書情報の末尾までの形態素数が所定個数未満であると判定したとき(No)は、一連の処理を終了して元の処理に復帰させる。
【0115】
次に、上記ステップS406の改行候補位置設定処理を図16を参照しながら詳細に説明する。図16は、改行候補位置設定処理を示すフローチャートである。
改行候補位置設定処理は、上記ステップS406において実行されると、図16に示すように、まず、ステップS600に移行するようになっている。
ステップS600では、上記ステップS400の形態素解析処理の解析結果に基づいて、選択記事に含まれる文字列について改行候補位置および優先度を設定する。具体的に、ステップS600では、形態素解析処理で分割された各形態素の末尾を改行候補位置として設定する。このとき、図17に示すように、形態素の内容によって改行候補位置に優先度を設定する。図17は、形態素の内容と改行候補位置の優先度との対応を示す表である。
【0116】
図17の例では、形態素が句読点である場合は、その改行候補位置の優先度として最も高い「9」を、形態素が付属語を含む場合は、その改行候補位置の優先度として2番目に高い「8」を、形態素が用言である場合は、その改行候補位置の優先度として3番目に高い「7」を、形態素が名詞である場合は、その改行候補位置の優先度として4番目に高い「6」をそれぞれ設定する。また、形態素が括弧内のものである場合は、その改行候補位置の優先度を「5」減算し、形態素が禁則ルールに違反するものである場合は、その改行候補位置の設定を解除する。これは、形態素が句読点である場合は、その形態素の末尾で最も優先的に改行を行うことを意味している。なお、括弧内の形態素について改行候補位置の優先度が低くなっているのは、括弧内では形態素の意味的な結びつきが強い傾向にあるためである。
【0117】
したがって、図17の表を参考にして、上記禁則処理後の文字列に優先度を割り当てた場合は、「米国|(6)同時|(6)多発|(6)テロ|(6)犠牲者の|(8)追悼|(6)集会|(6)開催」というようになる。括弧内が改行候補位置の優先度を示している。
次いで、ステップS602に移行して、重要語句登録テーブル450から先頭の重要語句を読み出し、ステップS604に移行して、読み出した重要語句が文書情報に含まれているか否かを判定し、読み出した重要語句が文書情報に含まれていると判定したとき(Yes)は、ステップS606に移行して、読み出した重要語句の出現頻度が所定(例えば、80)以上であるか否かを判定し、読み出した重要語句の出現頻度が所定以上であると判定したとき(Yes)は、ステップS608に移行する。
【0118】
ステップS608では、文書情報に含まれる該当の重要語句内に設定されている改行候補位置についてその設定を解除する。例えば、文書情報が「米国|同時|多発|テロ|犠牲者の|追悼|集会|開催」の場合、図9の重要語句登録テーブル450を参照すると、「米国同時多発」および「同時多発テロ」の出現回数が80以上であるため、文書情報の改行候補位置は、「米国同時多発テロ|犠牲者の|追悼|集会|開催」となる。
【0119】
次いで、ステップS610に移行して、重要語句登録テーブル450に登録されているすべての重要語句についてステップS604〜S608,S614〜S620の処理が終了したか否かを判定し、すべての重要語句について処理が終了したと判定したとき(Yes)は、一連の処理を終了して元の処理に復帰させるが、そうでないと判定したとき(No)は、ステップS604に移行する。
一方、ステップS604で、読み出した重要語句が文書情報に含まれていないと判定したとき(No)は、ステップS614に移行して、読み出した重要語句を構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれているか否かを判定し、準重要語句が文書情報に含まれていると判定したとき(Yes)は、ステップS616に移行する。
【0120】
ステップS616では、重要語句登録テーブル450の重要語句のうちその準重要語句に係るものの出現頻度、およびその準重要語句において重要語句を構成する各形態素間の距離に基づいて重要度を算出する。具体的に、重要度evalは、下式(1)により算出する。
【0121】
【数1】

Figure 0004013539
【0122】
上式(1)において、cは、重要語句登録テーブル450に登録されている重要語句を構成する形態素の数を、nは、重要語句登録テーブル450に登録されている重要語句の出現頻度を、Comb(a,b)は、a個のなかからb個(a≧b)を取り出す組み合わせ数をそれぞれ表している。また、S(i)は、重要語句登録テーブル450に登録されている重要語句におけるi番目の形態素を、P(S)は、形態素Sの、評価対象である文字情報の形態素列における出現位置(出現しない場合は無限大の値をとる。)をそれぞれ表している。
【0123】
以下、文字情報において評価対象となる形態素列を「多発|同時|米国|テロ」とし、重要語句登録テーブル450に登録されている重要語句およびその出現頻度を「同時|多発|事件」および100回とした場合を例にとって、重要度evalの算出例を説明する。
まず、「同時|多発|事件」から2つの形態素のすべての組み合わせを取得する。この場合、「同時|多発」、「多発|事件」および「同時|事件」を取得する。
【0124】
「同時|多発」の場合、「同時|多発|事件」との比較においては距離が「1」となり、「多発|同時|米国|テロ」との比較においては距離が「−1」(前後関係が逆の場合は負の値として算出する。)となるので、重要度evalは、上式(1)により「100/3」となる。
「多発|事件」の場合、および「同時|事件」の場合も、同様にして重要度evalを算出することができるが、「多発|同時|米国|テロ」には、それら形態素列が出現していないことから、上式(1)によりいずれも「0」となる。
【0125】
そして、「同時|多発|事件」の重要度evalは、最終的に、「同時|多発」、「多発|事件」および「同時|事件」の重要度evalの平均をとることにより算出する。したがって、「100/9」となる。
次いで、ステップS618に移行して、算出した重要度が所定以上であるか否かを判定し、重要度が所定以上であると判定したとき(Yes)は、ステップS620に移行して、文書情報に含まれる該当の準重要語句内に設定されている改行候補位置についてその設定を解除し、ステップS610に移行する。
【0126】
一方、ステップS618で、重要度が所定未満であると判定したとき(No)、ステップS614で、準重要語句が文書情報に含まれていないと判定したとき(No)、およびステップS606で、読み出した重要語句の出現頻度が所定未満であると判定したとき(No)はいずれも、ステップS610に移行する。
次に、上記ステップS418のフォントサイズ優先型格納処理を図18を参照しながら詳細に説明する。図18は、フォントサイズ優先型格納処理を示すフローチャートである。
【0127】
フォントサイズ優先型格納処理は、上記ステップS418において実行されると、図18に示すように、まず、ステップS700に移行するようになっている。
ステップS700では、文書情報格納枠のパラメータからフォントサイズの初期値および行数の初期値を取得し、取得した初期値をそれぞれ現在のフォントサイズおよび行数として設定し、ステップS702に移行して、文書情報格納枠のパラメータからフォントサイズの下限値および行数の上限値を取得し、ステップS704に移行する。
【0128】
ステップS704では、現在のフォントサイズが下限値未満であるか否かを判定し、現在のフォントサイズが下限値以上であると判定したとき(No)は、ステップS706に移行して、現在の行数が上限値を超えているか否かを判定し、現在の行数が上限値以下であると判定したとき(No)は、ステップS708に移行する。
ステップS708では、ステップS402,S406の解析結果に基づいて改行を行う処理を実行し、ステップS710に移行して、文書情報格納枠に文書情報が格納できたか否かを判定し、文書情報格納枠に文書情報が格納できたと判定したとき(Yes)は、ステップS712に移行して、文書情報の格納が成功したことを元の処理に返し、一連の処理を終了して元の処理に復帰させる。
【0129】
一方、ステップS710で、文書情報格納枠に文書情報が格納できないと判定したとき(No)は、ステップS714に移行して、行数を1つ増加させ、ステップS706に移行する。
一方、ステップS706で、行数が上限値を超えていると判定したとき(Yes)は、ステップS716に移行して、フォントサイズを1つ減少させ、ステップS718に移行して、現在の行数を初期値に設定し、ステップS704に移行する。
【0130】
一方、ステップS704で、フォントサイズが下限値未満であると判定したとき(Yes)は、ステップS720に移行して、文書情報の格納が失敗したことを元の処理に返し、一連の処理を終了して元の処理に復帰させる。
次に、上記ステップS424の行数優先型格納処理を図19を参照しながら詳細に説明する。図19は、行数優先型格納処理を示すフローチャートである。
行数優先型格納処理は、上記ステップS424において実行されると、図19に示すように、まず、ステップS800に移行するようになっている。
【0131】
ステップS800では、文書情報格納枠のパラメータからフォントサイズの初期値および行数の初期値を取得し、取得した初期値をそれぞれ現在のフォントサイズおよび行数として設定し、ステップS802に移行して、文書情報格納枠のパラメータからフォントサイズの下限値および行数の上限値を取得し、ステップS804に移行する。
ステップS804では、現在の行数が上限値を超えているか否かを判定し、現在の行数が上限値以下であると判定したとき(No)は、ステップS806に移行して、現在のフォントサイズが下限値未満であるか否かを判定し、現在のフォントサイズが下限値以上であると判定したとき(No)は、ステップS808に移行する。
【0132】
ステップS808では、ステップS402,S406の解析結果に基づいて改行を行う処理を実行し、ステップS810に移行して、文書情報格納枠に文書情報が格納できたか否かを判定し、文書情報格納枠に文書情報が格納できたと判定したとき(Yes)は、ステップS812に移行して、文書情報の格納が成功したことを元の処理に返し、一連の処理を終了して元の処理に復帰させる。
一方、ステップS810で、文書情報格納枠に文書情報が格納できないと判定したとき(No)は、ステップS814に移行して、フォントサイズを1つ減少させ、ステップS806に移行する。
【0133】
一方、ステップS806で、フォントサイズが下限値未満であると判定したとき(Yes)は、ステップS816に移行して、行数を1つ増加させ、ステップS818に移行して、現在のフォントサイズを初期値に設定し、ステップS804に移行する。
一方、ステップS804で、行数が上限値を超えていると判定したとき(Yes)は、ステップS820に移行して、文書情報の格納が失敗したことを元の処理に返し、一連の処理を終了して元の処理に復帰させる。
【0134】
次に、上記ステップS708,S808の改行処理を図20を参照しながら詳細に説明する。図20は、改行処理を示すフローチャートである。
改行処理は、上記ステップS708,S808において実行されると、図20に示すように、まず、ステップS900に移行するようになっている。
ステップS900では、すべての行に満遍なく文書情報が格納できるように行幅を揃えるか否かを判定し、行幅を揃えると判定したとき(Yes)は、ステップS902に移行して、文書情報の文字数を現在の行数で除算することにより1行当たりの文字数を算出し、ステップS406で設定した改行候補位置のうち、算出した文字数の整数倍の位置に最も近い手前の位置で改行を行って、文書情報格納枠に文書情報を格納し、ステップS904に移行する。なお、図中、ステップS902において、sは、文書情報の文字数を、lは、現在の行数をそれぞれ示している。
【0135】
ステップS904では、文書情報格納枠に文書情報が格納できたか否かを判定し、文書情報格納枠に文書情報が格納できたと判定したとき(Yes)は、ステップS906に移行して、文書情報の格納が成功したことを元の処理に返し、一連の処理を終了して元の処理に復帰させる。
一方、ステップS904で、文書情報格納枠に文書情報が格納できないと判定したとき(No)は、文書情報の格納が失敗したことを元の処理に返し、一連の処理を終了して元の処理に復帰させる。
【0136】
一方、ステップS900で、すべての行に満遍なく文書情報が格納できるようには行幅を揃えないと判定したとき(No)は、ステップS406で設定した改行候補位置のうち、所定の文字数(例えば、初期設定されている1行当たりの文字数)の整数倍の位置に最も近い手前の位置で改行を行って、文書情報格納枠に文書情報を格納し、ステップS904に移行する。
次に、上記ステップS422のフロー処理を図21を参照しながら詳細に説明する。図21は、フロー処理を示すフローチャートである。
【0137】
フロー処理は、上記ステップS422において実行されると、図21に示すように、まず、ステップS1000に移行するようになっている。
ステップS1000では、文書情報のうちフローオブジェクトの先頭位置を算出し、ステップS1002に移行して、処理フラグがクリアされかつ同一の記事番号が登録されたレコードがフロー管理テーブル400に存在するか否かを判定し、処理フラグがクリアされかつ同一の記事番号が登録されたレコードが存在しないと判定したとき(No)は、ステップS1004に移行して、フローオブジェクトについてのレコードを生成し、生成したレコードをフロー管理テーブル400の末尾に登録し、一連の処理を終了して元の処理に復帰させる。具体的に、ステップS1004では、フローオブジェクトの記事番号をフィールド402に登録し、ステップS1000で算出した先頭位置をフィールド404に登録し、現在のページ番号をフィールド408に登録し、処理済フラグをクリアすることにより、フローオブジェクトについてのレコードを生成する。このことは、ステップS1006の処理において同じである。
【0138】
一方、ステップS1002で、処理フラグがクリアされかつ同一の記事番号が登録されたレコードがフロー管理テーブル400に存在すると判定したとき(Yes)は、ステップS1006に移行して、フローオブジェクトについてのレコードを生成し、該当のレコードについてステップS514と同様の処理を実行するとともに、生成したレコードをフロー管理テーブル400の先頭に登録し、一連の処理を終了して元の処理に復帰させる。
【0139】
次に、上記ステップS308の文書情報格納枠への格納処理を図22を参照しながら詳細に説明する。図22は、ステップS308の文書情報格納枠への格納処理を示すフローチャートである。
文書情報格納枠への格納処理は、フローオブジェクトを文書情報格納枠に格納する処理であって、上記ステップS308において実行されると、図22に示すように、まず、ステップS1100に移行するようになっている。
【0140】
ステップS1100では、フロー管理テーブル400の該当レコードを参照してフローオブジェクトを読み出し、ステップS1102に移行して、上記ステップS402と同様の形態素解析処理を実行し、ステップS1104に移行して、上記ステップS404と同様の重要語句登録処理を実行し、ステップS1106に移行して、上記ステップS406と同様の改行候補位置設定処理を実行し、ステップS1108に移行する。
【0141】
ステップS1108では、読み出したフローオブジェクトの文字数を算出し、ステップS1110に移行して、算出した文字数に基づいて文書情報格納枠の形状および位置を決定し、ステップS1112に移行して、読み出したフローオブジェクトを文書情報格納枠に格納し、フロー管理テーブル400の該当レコードにおいて、フローオブジェクトの格納ページ番号を現在のページ番号に設定するとともに処理済フラグをセットし、ステップS1114に移行する。
【0142】
ステップS1114に移行して、読み出したフローオブジェクトが文書情報格納枠に格納しきれたか否かを判定し、フローオブジェクトが文書情報格納枠に格納しきれた(フローでない)と判定したとき(No)は、一連の処理を終了して元の処理に復帰させる。
一方、ステップS1114で、読み出したフローオブジェクトが文書情報格納枠に格納しきれない(フローである)と判定したとき(Yes)は、ステップS1116に移行して、文書情報格納枠のパラメータの設定に基づいて、行数よりもフォントサイズの重要度の方が高く設定されているか否かを判定し、フォントサイズの重要度の方が高く設定されていると判定したとき(Yes)は、ステップS1118に移行して、上記ステップS418と同様のフォントサイズ優先型格納処理を実行し、ステップS1120に移行する。
【0143】
ステップS1120では、ステップS1118,S1124の処理によってフローオブジェクトが文書情報格納枠に格納しきれたか否かを判定し、フローオブジェクトが文書情報格納枠に格納しきれた(フローでない)と判定したとき(No)は、一連の処理を終了して元の処理に復帰させるが、そうでない(フローである)と判定したとき(Yes)は、ステップS1122に移行して、そのフローオブジェクトについて上記ステップS422と同様のフロー処理を実行し、一連の処理を終了して元の処理に復帰させる。
【0144】
一方、ステップS1116で、フォントサイズよりも行数の重要度の方が高く設定されていると判定したとき(No)は、ステップS1124に移行して、上記ステップS424と同様の行数優先型格納処理を実行し、ステップS1120に移行する。
次に、上記ステップS322の未処理フローオブジェクトの処理を図23を参照しながら詳細に説明する。図23は、未処理フローオブジェクトの処理を示すフローチャートである。
【0145】
未処理フローオブジェクトの処理は、上記ステップS322において実行されると、図23に示すように、まず、ステップS1200に移行するようになっている。
ステップS1200では、フロー枠管理テーブル400の先頭から順番に検索し、処理済フラグがクリアされているレコードが存在するか否かを判定し、処理済フラグがクリアされているレコードが存在すると判定したとき(Yes)は、ステップS1202に移行するが、そうでないと判定したとき(No)は、一連の処理を終了して元の処理に復帰させる。
【0146】
ステップS1202では、新たなページのレイアウト領域360を追加し、ステップS1204に移行して、ステップS308と同様に、フローオブジェクトを格納する文書情報格納枠の形状および位置を決定し、フローオブジェクトをその文書情報格納枠に格納する処理を実行し、ステップS1206に移行して、レイアウト領域360内に未処理の情報格納枠が存在するか否かを判定し、未処理の情報格納枠が存在すると判定したとき(Yes)は、ステップS1204に移行するが、そうでないと判定したとき(No)は、ステップS1200に移行する。
【0147】
次に、本実施の形態の動作を図24を参照しながら説明する。図24は、レイアウト結果を示す図である。
まず、ディジタルコンテンツを配信するために必要な情報を登録する場合を説明する。
ユーザがディジタルコンテンツの配信を希望する場合、ユーザは、ユーザ端末200において、WWWブラウザによりコンテンツ配信端末100にアクセスし、ユーザ登録要求を入力する。
【0148】
ユーザ端末200では、ユーザ登録要求が入力されると、コンテンツ配信端末100との通信により、必要なユーザ情報を入力すべき要求がユーザに対して行われる。ここで、ユーザは、その入力要求に応じて、ユーザ情報として、メインカテゴリ、サブカテゴリ、ユーザID、パスワード、配信先アドレス、配信日、配信時刻、レイアウトNo.および最大ページ数を入力すると、それらユーザ情報がコンテンツ配信端末100に送信される。
【0149】
コンテンツ配信端末100では、登録要求に伴ってユーザ情報を受信すると、ステップS100〜S114を経て、受信したユーザ情報がユーザプロファイルテーブル300に登録される。
次に、ユーザプロファイルテーブル300を参照してディジタルコンテンツを配信する場合を説明する。
コンテンツ配信端末100では、ユーザプロファイルテーブル300を参照してディジタルコンテンツを配信すべき日時になると、ステップS204,S206を経て、ユーザプロファイルテーブル300からカテゴリNo.が読み出され、読み出されたカテゴリNo.をもとにコンテンツデータ登録DB44のコンテンツデータが検索される。その結果、そのカテゴリNo.と一致するカテゴリNo.が付されたコンテンツデータが索出されると、ステップS208〜S210を経て、ユーザプロファイルテーブル300からレイアウトNo.が読み出され、レイアウトNo.対応テーブル330を参照して、読み出されたレイアウトNo.に対応するレイアウト定義ファイルがユーザ情報登録DB40から読み出される。そして、ステップS212を経て、読み出されたレイアウト定義ファイルに基づいて、索出されたコンテンツデータを用いて出力レイアウトが決定されディジタルコンテンツが作成される。
【0150】
レイアウトの過程では、ステップS300〜S310を経て、固定線の位置、固定文書情報の形状および位置、並びに固定画像情報の形状および位置がその順で決定され、所定の優先順位に基づいて、ステップS206で索出されたコンテンツデータのなかからレイアウト領域360に配置すべき記事が選択される。
選択記事にタイトル情報が含まれている場合には、ステップS312を経て、選択記事に含まれるタイトル情報がタイトル情報格納枠に格納される。具体的には、選択記事に含まれるタイトル情報の情報量が算出され、算出された情報量に基づいてタイトル情報格納枠の形状および位置が決定され、選択記事に含まれるタイトル情報がそのタイトル情報格納枠に格納される。
【0151】
選択記事に画像情報が含まれている場合には、ステップS314を経て、選択記事に含まれる画像情報が画像情報格納枠に格納される。具体的には、選択記事に含まれる画像情報の情報量が算出され、算出された情報量に基づいて、他の情報格納枠と重なり合わないように画像情報格納枠の形状および位置が決定され、選択記事に含まれる画像情報がその画像情報格納枠に格納される。
選択記事に文書情報が含まれている場合には、ステップS316を経て、選択記事に含まれる文書情報が文書情報格納枠に格納される。具体的には、ステップS402〜S406を経て、選択記事に含まれる文字列が形態素解析により形態素ごとに分割され、形態素解析結果に基づいて重要語句登録処理および改行候補位置設定処理が実行される。
【0152】
まず、重要語句登録処理では、ステップS500〜S504を経て、ポインタの現在位置が「0」に設定され、ポインタの現在位置を先頭として末尾方向に所定個数の形態素列が取得される。次いで、取得された形態素列と同一の重要語句が重要語句登録テーブル450に登録されていないと、ステップS508,S510を経て、取得された形態素列が重要語句として重要語句登録テーブル450に登録され、登録された重要語句の出現頻度が「1」に設定される。これに対し、取得された形態素列と同一の重要語句が重要語句登録テーブル450に登録されていると、ステップS514を経て、取得された形態素列と同一の重要語句の出現頻度が「1」加算される。
【0153】
そして、いずれの場合も、ポインタの現在位置から文書情報の末尾までの形態素数が所定個数未満となるまで、ポインタの現在位置が次の形態素の先頭位置に設定され、ステップS504〜S514の処理が繰り返し実行される。
これにより、比較的最新の情勢や話題に応じた重要語句が重要語句登録テーブル450に登録される。
次に、改行候補位置設定処理では、ステップS600を経て、形態素解析処理で分割された各形態素の末尾が改行候補位置として設定され、形態素の内容によって改行候補位置に優先度が設定される。次いで、ステップS602,S604を経て、重要語句登録テーブル450から先頭の重要語句が読み出され、読み出された重要語句が文書情報に含まれているか否かが判定される。その結果、重要語句が文書情報に含まれていると判定されると、ステップS606,S608を経て、読み出された重要語句の出現頻度が所定以上である場合に、文書情報に含まれる該当の重要語句内に設定されている改行候補位置についてその設定が解除される。
【0154】
また、読み出された重要語句が文書情報に含まれていないと判定されると、ステップS614を経て、読み出された重要語句を構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれているか否かが判定される。その結果、準重要語句が文書情報に含まれていると判定されると、ステップS616を経て、上式(1)により重要度が算出される。このとき、算出された重要度が所定以上であると判定されると、ステップS620を経て、文書情報に含まれる該当の準重要語句内に設定されている改行候補位置についてその設定が解除される。
【0155】
そして、いずれの場合も、重要語句登録テーブル450に登録されているすべての重要語句についてステップS604〜S608,S614〜S620の処理が終了するまで、これらの処理が繰り返し実行される。
これにより、重要語句のうち出現頻度が所定以上のもの、および準重要語句のうち重要度が所定以上のものについてそれら語句内での改行が後段の改行処理において禁止されることとなる。
【0156】
次に、ステップS408〜S412を経て、選択記事に含まれる文書情報の文字数が算出され、算出された文字数に基づいて、他の情報格納枠と重なり合わないように文書情報格納枠の形状および位置が決定され、選択記事に含まれる文書情報がその文書情報格納枠に格納される。このとき、文書情報格納枠に文書情報が格納しきれないと判定されると、ステップS418,S424を経て、フォントサイズ優先型格納処理または行数優先型格納処理のいずれかが行われ、文書情報格納枠に文書情報が可能な限り格納できるようにその文字数が調整される。
【0157】
フォントサイズ優先型格納処理は、文書情報格納枠において行数よりもフォントサイズの重要度の方が高く設定されている場合に行われる。フォントサイズ優先型格納処理が行われると、ステップS700,S702を経て、フォントサイズの初期値および行数の初期値が取得され、取得された初期値がそれぞれ現在のフォントサイズおよび行数として設定され、フォントサイズの下限値および行数の上限値が取得される。
【0158】
次いで、ステップS706,S708,S710,S714を繰り返し経て、取得された上限値を限度として行数を1つずつ増加させながら、文書情報格納枠に文書情報が格納できるまで文書情報の格納が試行される。行数が上限値に達してもまだ格納できないときは、フォントサイズが1つ減少され、行数を初期値から上限値まで1つずつ増加させながら文書情報の格納が再試行される。この繰り返し処理は、ステップS706,S716,S718を繰り返し経て、フォントサイズが、取得された下限値に達するまで行われる。すなわち、フォントサイズ優先型格納処理では、図24(a)に示すように、行数を増加させながら文書情報の格納を試行していき、それでも格納できないときに初めてフォントサイズを減少させることにより、フォントサイズの初期値を可能な限り保持することを優先する。また同時に、図24(a)では、「米国同時多発」および「同時多発テロ」という重要語句内での改行が禁止され、それらが同一行内に格納されていることが分かる。
【0159】
なお、フォントサイズが下限値に達してもまだ格納できないときは、ステップS420,S422,S1000〜S1004を経て、そのフローオブジェクトについてのレコードがフロー管理テーブル400の末尾に登録される。
一方、行数優先型格納処理は、文書情報格納枠においてフォントサイズよりも行数の重要度の方が高く設定されている場合に行われる。行数優先型格納処理が行われると、ステップS800,S802を経て、フォントサイズの初期値および行数の初期値が取得され、取得された初期値がそれぞれ現在のフォントサイズおよび行数として設定され、フォントサイズの下限値および行数の上限値が取得される。
【0160】
次いで、ステップS806,S808,S810,S814を繰り返し経て、取得された下限値を限度としてフォントサイズを1つずつ減少させながら、文書情報格納枠に文書情報が格納できるまで文書情報の格納が試行される。フォントサイズが下限値に達してもまだ格納できないときは、行数が1つ増加され、フォントサイズを初期値から下限値まで1つずつ減少させながら文書情報の格納が再試行される。この繰り返し処理は、ステップS806,S816,S818を繰り返し経て、行数が、取得された上限値に達するまで行われる。すなわち、行数優先型格納処理では、図24(b)に示すように、フォントサイズを減少させながら文書情報の格納を試行していき、それでも格納できないときに初めて行数を増加させることにより、行数の初期値を可能な限り保持することを優先する。また同時に、図24(b)では、「米国同時多発」および「同時多発テロ」という重要語句内での改行が禁止され、それらが同一行内に格納されていることが分かる。
【0161】
なお、行数が上限値に達してもまだ格納できないときは、ステップS420,S422,S1000〜S1004を経て、そのフローオブジェクトについてのレコードがフロー管理テーブル400の末尾に登録される。
そして、このようなタイトル情報格納枠への格納処理、画像情報格納枠への格納処理および文書情報格納枠への格納処理が、レイアウト領域360内に未処理の情報格納枠が存在しなくなるまで繰り返し実行される。これにより、一つのページのレイアウト領域360内に記事が配置される。
【0162】
次に、レイアウト領域360内に未処理の情報格納枠が存在しなくなると、ステップS324を経て、ステップS210で読み出されたレイアウト定義ファイルのレイアウト領域360のうち次のページのものが処理対象として設定され、そのページのレイアウト領域360について、フローオブジェクトを格納する文書情報格納枠への格納処理が実行され、タイトル情報格納枠への格納処理、画像情報格納枠への格納処理および文書情報格納枠への格納処理が、上記同様に、レイアウト領域360内に未処理の情報格納枠が存在しなくなるまで繰り返し実行される。
【0163】
フローオブジェクトの格納処理では、フローオブジェクトが存在する場合には、ステップS308を経て、フローオブジェクトが文書情報格納枠に格納される。具体的には、ステップS1100〜S1106を経て、フローオブジェクトが読み出され、フローオブジェクトに含まれる文字列が形態素解析により形態素ごとに分割され、形態素解析結果に基づいて重要語句登録処理および改行候補位置設定処理が実行される。
【0164】
そして、ステップS1108〜S1112を経て、読み出されたフローオブジェクトの文字数が算出され、算出された文字数に基づいて、他の情報格納枠と重なり合わないように文書情報格納枠の形状および位置が決定され、選択記事に含まれる文書情報がその文書情報格納枠に格納される。このとき、文書情報格納枠に文書情報が格納しきれないと判定されると、ステップS1118,S1124を経て、フォントサイズ優先型格納処理または行数優先型格納処理のいずれかが行われ、文書情報格納枠に文書情報が可能な限り格納できるようにその文字数が調整される。文字数の調整については、上記と同じ要領で行われる。
【0165】
なお、フォントサイズ優先型格納処理にあってはフォントサイズが下限値に達しても、行数優先型格納処理にあっては行数が上限値に達してもまだ格納できないときは、ステップS1120,S1122,S1000,S1002,S1006を経て、そのフローオブジェクトについてのレコードがフロー管理テーブル400の先頭に登録される。
一方、このようなフローオブジェクトを格納する文書情報格納枠への格納処理、タイトル情報格納枠への格納処理、画像情報格納枠への格納処理および文書情報格納枠への格納処理の繰り返し処理が、ステップS210で読み出されたレイアウト定義ファイルのすべてのページについて実行される。これにより、すべてのページのレイアウト領域360内に記事が配置され、ディジタルコンテンツの出力レイアウトが決定される。出力レイアウトが決定されると、ステップS222,S224を経て、ユーザプロファイルテーブル300から配信先アドレスが読み出され、読み出された配信先アドレス宛に、作成されたディジタルコンテンツが配信される。
【0166】
なお、ステップS210で読み出されたレイアウト定義ファイルのすべてのページについてレイアウト領域360を処理した後に、未処理のフローオブジェクトが存在する場合には、未処理のフローオブジェクトが存在しなくなるまで、ステップS1202〜S1206を繰り返し経て、新たなページのレイアウト領域360が追加され、フローオブジェクトを格納する文書情報格納枠が新たなレイアウト領域360内に配置され、フローオブジェクトの文字数に基づいて文書情報格納枠の形状および位置が決定され、フローオブジェクトがその文書情報格納枠に格納される。
【0167】
このようにして、本実施の形態では、コンテンツ配信端末100は、重要語句登録DB42の重要語句が文書情報に含まれているとき、または重要語句登録DB42の重要語句を構成する各形態素をその順で断片的に含む準重要語句が文書情報に含まれているときは、文書情報格納枠において重要語句内または準重要語句内での改行を禁止するようになっている。
これにより、文書情報格納枠において重要語句内または準重要語句内での改行が禁止されるので、最新の情勢や話題に応じた重要語句を重要語句登録DB42に登録しておけば、従来に比して、最新の情勢や話題に即した内容のディジタルコンテンツであってもその可読性を比較的向上することができる。
【0168】
さらに、本実施の形態では、コンテンツ配信端末100は、連続した複数の形態素を単位として語句を文書情報から取得し、その取得語句をその出現頻度と対応付けて重要語句として重要語句登録DB42に登録し、重要語句登録DB42の重要語句のうち出現頻度が所定以上のものが文書情報に含まれているときは、文書情報格納枠において重要語句内での改行を禁止するようになっている。
これにより、ディジタルコンテンツが作成されるたびに、比較的最新の情勢や話題に応じた重要語句が重要語句登録DB42に登録されるので、重要語句登録DB42への登録作業を低減することができる。また、比較的最新の情勢や話題に応じた重要語句を重要語句登録DB42に保持することができるので、最新の情勢や話題に即した内容のディジタルコンテンツについてその可読性をさらに向上することができる。
【0169】
さらに、本実施の形態では、コンテンツ配信端末100は、準重要語句が文書情報に含まれているときは、重要語句登録DB42の重要語句のうちその準重要語句に係るものの出現頻度、およびその準重要語句において重要語句を構成する各形態素間の距離に基づいて重要度を算出し、算出した重要度が所定以上であるときは、文書情報格納枠において準重要語句内での改行を禁止するようになっている。
【0170】
これにより、準重要語句のうち比較的重要性の高いものについてその語句内での改行が禁止されるので、改行の禁止が過剰に行われることにより却って読みづらくなるという不具合を回避することができる。
さらに、本実施の形態では、コンテンツ配信端末100は、フォントサイズまたは行数に関するパラメータの値をその変更許容範囲内で変更して文書情報格納枠の格納文字数を調整するようになっている。
【0171】
これにより、文書情報格納枠の格納文字数に対して影響を及ぼすパラメータについてデザイナが変更許容範囲を設定しておけば、文書情報格納枠に文書情報が格納しきれない場合には、そのようなパラメータの値がその変更許容範囲内で変更されて文書情報格納枠の格納文字数が調整されるので、文書情報の文字数によってレイアウトがデザイナの意図を逸脱することなく、デザイナが意図したレイアウトが損なわれる可能性を低減することができる。特に、フォントサイズおよび行数について、デザイナが意図したレイアウトが損なわれる可能性を低減することができる。
【0172】
さらに、本実施の形態では、コンテンツ配信端末100は、フォントサイズに関するパラメータを、行数に関するパラメータよりも重要度が低いパラメータとして指定した場合には、文書情報格納枠に文書情報が可能な限り格納できるように、フォントサイズに関するパラメータの値を優先的にその変更許容範囲内で変更するようになっている。
これにより、行数の維持をフォントサイズよりも優先させることができるので、行数について、デザイナが意図したレイアウトが損なわれる可能性をさらに低減することができる。
【0173】
さらに、本実施の形態では、コンテンツ配信端末100は、行数に関するパラメータを、フォントサイズに関するパラメータよりも重要度が低いパラメータとして指定した場合には、文書情報格納枠に文書情報が可能な限り格納できるように、行数に関するパラメータの値を優先的にその変更許容範囲内で変更するようになっている。
これにより、フォントサイズの維持を行数よりも優先させることができるので、フォントサイズについて、デザイナが意図したレイアウトが損なわれる可能性をさらに低減することができる。
【0174】
さらに、本実施の形態では、コンテンツ配信端末100は、レイアウト定義ファイルにより定義されるすべてのレイアウト領域360に記事を配置した場合に、未処理のフローオブジェクトが存在するときは、新たなレイアウト領域360を追加し、追加した新たなレイアウト領域360に文書情報格納枠を配置し、配置した文書情報格納枠に未処理のフローオブジェクトを格納するようになっている。
【0175】
これにより、掲載すべきコンテンツデータの漏れを少なくすることができる。さらに、本実施の形態では、コンテンツ配信端末100は、未処理のフローオブジェクトが存在しなくなるまで、新たなレイアウト領域360の追加、フローオブジェクトの配置およびフローオブジェクトの格納を繰り返し行うようになっている。
これにより、掲載すべきコンテンツデータの漏れをさらに少なくすることができる。
【0176】
さらに、本実施の形態では、コンテンツ配信端末100は、フローオブジェクトを格納した文書情報格納枠と他の情報格納枠とが重なり合うこととなるときは、フローオブジェクトを格納した文書情報格納枠と重なり合わないように、他の情報格納枠の形状および位置を決定するようになっている。
これにより、他の情報格納枠に格納する情報の配置よりも、フローオブジェクトの配置を優先的に行うことができる。
【0177】
さらに、本実施の形態では、コンテンツ配信端末100は、ユーザ情報登録DB40のユーザ情報に基づいて、コンテンツデータをコンテンツデータ登録DB44のなかから索出するようになっている。
これにより、コンテンツデータの選択に関してユーザの固有情報やユーザによる指定情報が参照されることから、ユーザの希望に比較的沿った内容のディジタルコンテンツを作成することができる。
【0178】
さらに、本実施の形態では、コンテンツ配信端末100は、ユーザ情報登録DB40のユーザ情報に基づいて、コンテンツデータを用いて出力レイアウトを決定しディジタルコンテンツを作成するようになっている。
これにより、出力レイアウトの決定に関してユーザの固有情報やユーザによる指定情報が参照されることから、ユーザの希望に比較的沿った出力レイアウトでディジタルコンテンツを作成することができる。
【0179】
さらに、本実施の形態では、コンテンツ配信端末100は、タイトル情報、画像情報または文書情報を格納するのに必要最小限の大きさとなるように、タイトル情報格納枠、画像情報格納枠および文書情報格納枠の形状を決定するようになっている。
これにより、タイトル情報格納枠、画像情報格納枠または文書情報格納枠にタイトル情報、画像情報または文書情報を効率的に格納することができる。
【0180】
さらに、本実施の形態では、コンテンツ配信端末100は、タイトル情報格納枠、画像情報格納枠および文書情報格納枠の順番で、その情報格納枠の形状および位置を決定するようになっている。
これにより、レイアウトを重視すべき順番でレイアウトを決定することができるので、比較的見やすい出力レイアウトでディジタルコンテンツを作成することができる。
【0181】
さらに、本実施の形態では、コンテンツ配信端末100は、文書情報格納枠に文書情報が格納しきれないときは、フローオブジェクトについての記事番号およびオーバーフロー位置をフロー管理テーブル400に登録し、フローオブジェクトを文書情報格納枠に格納するときは、記事番号およびオーバーフロー位置をフロー管理テーブル400から読み出し、読み出した記事番号およびオーバーフロー位置に基づいて、文書情報格納枠にフローオブジェクトを格納するようになっている。
【0182】
これにより、フローオブジェクトをある程度規則的に配置することができるので、さらに見やすい出力レイアウトでディジタルコンテンツを作成することができる。
さらに、本実施の形態では、コンテンツ配信端末100は、フロー管理テーブル400への登録をその末尾から行い、フロー管理テーブル400からの読出をその先頭から行うようになっている。
【0183】
これにより、フローオブジェクトをより規則的に配置することができるので、さらに見やすい出力レイアウトでディジタルコンテンツを作成することができる。
さらに、本実施の形態では、コンテンツ配信端末100は、同一の文書情報についてフロー管理テーブル400への登録が2回目以降のフローオブジェクトについては、フロー管理テーブル400への登録をその先頭から行うようになっている。
【0184】
これにより、同一の文書情報について登録が2回目以降のフローオブジェクトを優先的に配置することができるので、文書情報の内容が幅広いページ数にわたって分散配置されるのをある程度防止することができる。
さらに、本実施の形態では、コンテンツ配信端末100は、フローオブジェクトの末尾を文書情報格納枠に格納したときは、処理済フラグをセットし、フローオブジェクトを文書情報格納枠に格納するときは、処理済フラグがクリアされているレコードの記事番号およびオーバーフロー位置をフロー管理テーブル400から読み出すようになっている。
【0185】
これにより、フロー管理テーブル400を用いたフローオブジェクトの処理が比較的容易となる。
上記実施の形態において、ユーザ情報登録DB40は、本発明に記載のユーザ情報記憶手段に対応し、重要語句登録DB42は、本発明に記載の重要語句記憶手段に対応し、コンテンツデータ登録DB44は、本発明に記載のコンテンツデータ記憶手段に対応している。また、ステップS206は、本発明に記載のコンテンツデータ選択手段に対応し、ステップS212は、本発明に記載のコンテンツ作成手段、または本発明に記載のコンテンツ作成ステップに対応している。
【0186】
また、上記実施の形態において、ステップS404,S1104は、本発明に記載の重要語句登録手段に対応し、フォントサイズおよび行数に関するパラメータは、本発明に記載の特定パラメータに対応し、フォントサイズに関するパラメータは、本発明に記載のフォントパラメータに対応している。また、行数に関するパラメータは、本発明に記載の文字間隔パラメータに対応している。
【0187】
なお、上記実施の形態において、コンテンツ配信端末100は、文書情報格納枠において重要語句内または準重要語句内での改行を禁止するように構成したが、これに限らず、文書情報格納枠において重要語句または準重要語句の文字間ピッチを変更するように構成してもよい。また、重要語句または準重要語句を他の同義語または異表記の語句に置換するように構成してもよい。また、重要語句または準重要語句の、色、フォントサイズ、フォント種類、行数、1行当たりの文字数、行間ピッチまたは文字間ピッチを変更するように構成してもよい。また、重要語句または準重要語句についての補足説明を文書中に挿入するように構成してもよい。
【0188】
また、上記実施の形態において、コンテンツ配信端末100は、重要語句が文書情報に含まれているか否かの判定、および重要語句の登録を、重要語句登録テーブル450を利用して行うように構成したが、これに限らず、TF-IFDまたはn-gramを利用して行うように構成してもよい。
また、上記実施の形態において、コンテンツ配信端末100は、重要語句をその出現頻度と対応付けて登録し、重要語句登録DB42の重要語句のうち出現頻度が所定以上のものが文書情報に含まれているときは、文書情報格納枠において重要語句内での改行を禁止するように構成したが、これに限らず、出現頻度を単に過去からの累計によって算出するのではなく、時間的変化を考慮して現在に近いほど優先度が高くなるように出現頻度に重み付けを行い、重要語句登録DB42の重要語句のうち最近の出現頻度が所定以上のものが文書情報に含まれているときは、文書情報格納枠において重要語句内での改行を禁止するように構成してもよい。
【0189】
また、上記実施の形態において、コンテンツ配信端末100は、文書情報から重要語句を取得するように構成したが、これに限らず、コンテンツデータにその内容を表すキーワードが付加されている場合は、そのキーワードを重要語句として重要語句登録DB42に登録するように構成してもよい。この場合は、出現頻度にかかわらず、改行を禁止する対象とする。例えば、新聞記事のタイトル文字列と併せて、その記事の分野を表すような連想文字列(文節が含まれていてもよい)が与えられる場合がある。次の例では、「米国テロ事件」を重要語句として重要語句登録DB42に登録する。
例)
<title>ニューヨークで大統領が犠牲者追悼集会に参加</title>
<keyword>米国テロ事件</keyword>
また、上記実施の形態においては、重要語句の削除について特に説明しなかったが、データ容量の増加を抑制する観点からは、例えば、出現頻度が所定の期間内で所定以上とならなかった重要語句を重要語句登録テーブル450から削除するように構成してもよい。
【0190】
また、上記実施の形態においては、レイアウトの処理速度について特に説明しなかったが、重要語句登録テーブル450の登録数が増加すればそれだけ処理の実行時間を要するので、例えば、所定の期間ごとに重要語句登録テーブル450を作成しておき、ステップS206で索出したコンテンツデータの作成時期に応じて重要語句登録テーブル450を選択し、選択した重要語句登録テーブル450を参照して文書を整形しまたは修飾するように構成してもよい。
【0191】
また、上記実施の形態において、コンテンツ配信端末100は、複数の形態素からなる形態素列を重要語句として取り扱ったが、比較的長い重要語句を取り扱う場合は、文書情報格納枠において1行に極端に多くの文字を収容することとなり、前後の行とのバランスを欠く。そこで、タイトル情報格納枠のタイトル文字列のように、バランスが悪くてもレイアウト上さほど問題がない場合についてはそのままとし、文書情報格納枠の文字列については、次の2つの方法により不具合を是正することができる。
【0192】
第1に、比較的長い重要語句を収容する行に比して短い行については、文字間を広げる。第2に、比較的長い重要語句を収容する行については、その重要語句内での改行を許可する。
また、上記実施の形態において、コンテンツ配信端末100は、レイアウト定義ファイルにおいてフォントサイズに関するパラメータおよび行数に関するパラメータのいずれかを重要度が低いパラメータとして指定するように構成したが、これに限らず、ユーザプロファイルテーブル300において指定するように構成してもよい。すなわち、ユーザ情報は、フォントサイズに関するパラメータおよび行数に関するパラメータのいずれかを重要度が低いパラメータとして指定する重要度指定情報を含み、ユーザ情報登録DB40のユーザ情報に含まれる重要度指定情報に基づいて、フォントサイズに関するパラメータおよび行数に関するパラメータのいずれかの値を優先的に変更する。
【0193】
これにより、デザイナが意図したレイアウトが損なわれる可能性を低減しつつ、ユーザの希望に比較的沿った出力レイアウトでディジタルコンテンツを作成することができる。
また、上記実施の形態において、コンテンツ配信端末100は、レイアウト定義ファイルにおいてフォントサイズの下限値を指定するように構成したが、これに限らず、ユーザプロファイルテーブル300において指定するように構成してもよい。すなわち、ユーザ情報は、フォントサイズに関するパラメータの下限値を変更許容範囲として指定する範囲指定情報を含み、ユーザ情報登録DB40のユーザ情報に含まれる範囲指定情報に基づいて、フォントサイズに関するパラメータの値を変更する。
【0194】
これにより、フォントサイズについて、ユーザの希望に比較的沿った出力レイアウトでディジタルコンテンツを作成することができる。
また、上記実施の形態において、コンテンツ配信端末100は、レイアウト定義ファイルにおいて行数の上限値を指定するように構成したが、これに限らず、ユーザプロファイルテーブル300において指定するように構成してもよい。すなわち、ユーザ情報は、行数に関するパラメータの上限値を変更許容範囲として指定する範囲指定情報を含み、ユーザ情報登録DB40のユーザ情報に含まれる範囲指定情報に基づいて、行数に関するパラメータの値を変更する。
【0195】
これにより、行数について、ユーザの希望に比較的沿った出力レイアウトでディジタルコンテンツを作成することができる。
また、上記実施の形態において、コンテンツ配信端末100は、フォントサイズまたは行数に関するパラメータの値を変更するように構成したが、これに限らず、文書情報格納枠の1行当たりの文字数、行間ピッチ若しくは文字間ピッチに関するパラメータ、または情報格納枠(文書情報格納枠、画像情報格納枠その他の情報格納枠)の大きさ、形状若しくは配置位置の設定に関するパラメータの値を変更するように構成してもよい。
【0196】
また、上記実施の形態において、コンテンツ配信端末100は、フォントサイズまたは行数に関するパラメータのいずれかの値を優先的に変更するように構成したが、これに限らず、それらパラメータの優劣なしに値を変更するように構成してもよい。
また、上記実施の形態において、コンテンツ配信端末100は、フォントサイズまたは行数に関するパラメータの値を変更するように構成したが、これに限らず、フォントサイズに関するパラメータの値だけ、または行数に関するパラメータの値だけを変更するように構成してもよい。
【0197】
また、上記実施の形態において、コンテンツ配信端末100は、フローオブジェクトを格納した文書情報格納枠と他の情報格納枠とが重なり合うこととなるときは、フローオブジェクトを格納した文書情報格納枠と重なり合わないように、他の情報格納枠の形状および位置を決定するように構成したが、これに限らず、フローオブジェクトを格納した文書情報格納枠と他の情報格納枠とが重なり合うこととなるときは、他の情報格納枠と重なり合わないように、フローオブジェクトを格納した文書情報格納枠の形状および位置を決定するように構成してもよい。具体的には、ステップS1110においてステップS410と同様の処理を実行すればよい。
【0198】
これにより、フローオブジェクトの配置よりも、他の情報格納枠に格納する情報の配置を優先的に行うことができる。
また、上記実施の形態においては、レイアウトの過程で情報格納枠に格納しきれずに溢れた場合には、溢れが発生した情報格納枠に対して、溢れたことを示す表示を行うように構成しなかったが、これに限らず、溢れが発生した情報格納枠に、そのフローオブジェクトを参照するための案内情報(例えば、フローオブジェクト格納枠が3ページにある場合は、「Continued To Page 3」)を格納するように構成してもよい。さらにこの場合、そのフローオブジェクトを格納したフローオブジェクト格納枠へのリンク先を示すリンク先情報を案内情報と併せて格納するように構成してもよい。
【0199】
これにより、ディジタルコンテンツの配信を受けたユーザは、案内情報をマウス等でクリックすると、リンク先情報に基づいて、そのフローオブジェクトの配置位置に相当する箇所にジャンプし、参照することができる。
また、上記実施の形態においては、レイアウトの過程で情報格納枠に格納しきれずに溢れた場合には、そのフローオブジェクトを格納したフローオブジェクト格納枠に対して、溢れたことを示す表示を行うように構成しなかったが、これに限らず、そのフローオブジェクトを格納したフローオブジェクト格納枠に、溢れが発生した情報格納枠のオブジェクトを参照するための案内情報(例えば、溢れが発生した情報格納枠が1ページにある場合は、「Continued From Page 1」)を格納するように構成してもよい。さらにこの場合、溢れが発生した情報格納枠へのリンク先を示すリンク先情報を案内情報と併せて格納するように構成してもよい。
【0200】
これにより、ディジタルコンテンツの配信を受けたユーザは、案内情報をマウス等でクリックすると、リンク先情報に基づいて、溢れが発生した情報格納枠のオブジェクトの配置位置に相当する箇所にジャンプし、参照することができる。また、上記実施の形態において、コンテンツ配信端末100は、フローオブジェクトとして文書情報を取り扱うように構成したが、これに限らず、タイトル情報または画像情報を取り扱うように構成してもよい。ただし、タイトル情報または画像情報は、タイトル情報格納枠または画像情報格納枠から溢れることが望ましくないので、文書情報のようなフロー処理はむしろ行わない方がレイアウトの面で好適な場合がある。
【0201】
また、上記実施の形態において、コンテンツ配信端末100は、タイトル情報格納枠、画像情報格納枠および文書情報格納枠の順番で、その情報格納枠の形状および位置を決定するように構成したが、これに限らず、任意の順番で、情報格納枠の形状および位置を決定するように構成してもよい。また、形状および位置の決定順序をユーザ情報としてユーザプロファイルテーブル300に登録しておいてもよい。
【0202】
また、上記実施の形態において、コンテンツ配信端末100は、情報格納枠の形状および位置を動的に決定しながらレイアウトを行うように構成したが、これに限らず、レイアウト領域360内のすべての情報格納枠に一旦情報を格納してから、各情報格納枠の形状および位置を決定することによりレイアウトを行うように構成してもよい。
また、上記実施の形態において、コンテンツ配信端末100は、ユーザ情報に基づいて、ディジタルコンテンツの出力レイアウトを決定するように構成したが、これに限らず、コンテンツデータに含まれる画像の数またはコンテンツデータに含まれる文書情報の量に基づいて、ディジタルコンテンツの出力レイアウトを決定するように構成してもよい。
【0203】
これにより、コンテンツデータに含まれる画像の数またはコンテンツデータに含まれる文書情報の量が多かったり、また逆に少なかったりしても、比較的見やすい出力レイアウトにすることができる。
また、上記実施の形態においては、ステップS212のレイアウト処理をコンテンツ配信端末100で実行するように構成したが、これに限らず、それらレイアウト処理をユーザ端末200で実行するように構成してもよい。
【0204】
これにより、コンテンツ配信端末100に処理負荷が集中するのを低減することができる。
また、上記実施の形態において、図11ないし図16、または図18ないし図23のフローチャートに示す処理を実行するにあたってはいずれも、ROM32にあらかじめ格納されている制御プログラムを実行する場合について説明したが、これに限らず、これらの手順を示したプログラムが記憶された記憶媒体から、そのプログラムをRAM34に読み込んで実行するようにしてもよい。
【0205】
ここで、記憶媒体とは、RAM、ROM等の半導体記憶媒体、FD、HD等の磁気記憶型記憶媒体、CD、CDV、LD、DVD等の光学的読取方式記憶媒体、MO等の磁気記憶型/光学的読取方式記憶媒体であって、電子的、磁気的、光学的等の読み取り方法のいかんにかかわらず、コンピュータで読み取り可能な記憶媒体であれば、あらゆる記憶媒体を含むものである。
また、上記実施の形態においては、本発明に係る文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法を、インターネット199からなるネットワークシステムに適用した場合について説明したが、これに限らず、例えば、インターネット199と同一方式により通信を行ういわゆるイントラネットに適用してもよい。もちろん、インターネット199と同一方式により通信を行うネットワークに限らず、通常のネットワークに適用することもできる。
【0206】
また、上記実施の形態においては、本発明に係る文書整形システム、ディジタルコンテンツ作成システム、文書整形プログラムおよびディジタルコンテンツ作成プログラム、並びに文書整形方法およびディジタルコンテンツ作成方法を、図1に示すように、コンテンツ配信端末100において、ニュース等のディジタルコンテンツをユーザ端末200に配信する場合について適用したが、これに限らず、本発明の主旨を逸脱しない範囲で他の場合にも適用可能である。
【0207】
【発明の効果】
以上説明したように、本発明に記載の文書整形システムによれば、文書情報に基づき出力すべき文書のうち重要語句または準重要語句について整形または修飾が行われるので、最新の情勢や話題に応じた重要語句を重要語句記憶手段に登録しておけば、従来に比して、最新の情勢や話題に即した内容の文書であってもその可読性を比較的向上することができるという効果が得られる。
【0208】
さらに、本発明に記載の文書整形システムによれば、文書情報が与えられるたびに、比較的最新の情勢や話題に応じた重要語句が重要語句記憶手段に登録されるので、重要語句記憶手段への登録作業を低減することができる。また、比較的最新の情勢や話題に応じた重要語句を重要語句記憶手段に保持することができるので、最新の情勢や話題に即した内容の文書についてその可読性をさらに向上することができるという効果も得られる。
【0209】
さらに、本発明に記載の文書整形システムによれば、文書情報に基づき出力すべき文書において重要語句内または準重要語句内での改行が禁止されるので、最新の情勢や話題に即した内容の文書についてその可読性をさらに向上することができるという効果も得られる。
一方、本発明に記載のディジタルコンテンツ作成システムによれば、文書情報格納枠内の文書のうち重要語句または準重要語句について整形または修飾が行われるので、最新の情勢や話題に応じた重要語句を重要語句記憶手段に登録しておけば、従来に比して、最新の情勢や話題に即した内容のディジタルコンテンツであってもその可読性を比較的向上することができるという効果が得られる。
【0210】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、ディジタルコンテンツが作成されるたびに、比較的最新の情勢や話題に応じた重要語句が重要語句記憶手段に登録されるので、重要語句記憶手段への登録作業を低減することができる。また、比較的最新の情勢や話題に応じた重要語句を重要語句記憶手段に保持することができるので、最新の情勢や話題に即した内容のディジタルコンテンツについてその可読性をさらに向上することができるという効果も得られる。
【0211】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、準重要語句のうち比較的重要性の高いものについて整形または修飾が行われるので、整形または修飾が過剰に行われることにより却って読みづらくなるという不具合を回避することができるという効果も得られる。
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、文書情報格納枠において重要語句内または準重要語句内での改行が禁止されるので、最新の情勢や話題に即した内容のディジタルコンテンツについてその可読性をさらに向上することができるという効果も得られる。
【0212】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、文書情報格納枠の格納文字数に対して影響を及ぼすことがあるパラメータについてデザイナが変更許容範囲を設定しておけば、文書情報格納枠に文書情報が格納しきれない場合、または文書情報格納枠に余白が生じてしまう場合には、そのような特定パラメータの値がその変更許容範囲内で変更されて文書情報格納枠の格納文字数が調整されるので、文書情報の文字数によってレイアウトがデザイナの意図を逸脱することなく、デザイナが意図したレイアウトが損なわれる可能性を低減することができるという効果も得られる。
【0213】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、文書情報格納枠に文書情報が格納しきれない場合には、複数の特定パラメータの値がその変更許容範囲内で変更されるので、デザイナが意図したレイアウトが損なわれる可能性をさらに低減することができるという効果も得られる。また、デザイナが特定パラメータの重要度を設定しておけば、その重要度の低いパラメータの変更が優先的に行われるので、レイアウト結果にデザイナの意図を反映しやすくなるという効果も得られる。
【0214】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、フォントサイズについて、デザイナが意図したレイアウトが損なわれる可能性を低減することができるという効果も得られる。 さらに、本発明に記載のディジタルコンテンツ作成システムによれば、行数または1行当たりの文字数について、デザイナが意図したレイアウトが損なわれる可能性を低減することができるという効果も得られる。
【0215】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、行数または1行当たりの文字数について、デザイナが意図したレイアウトが損なわれる可能性を低減することができるという効果も得られる。
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、行数または1行当たりの文字数の維持を、フォントサイズよりも優先させることができるので、行数または1行当たりの文字数について、デザイナが意図したレイアウトが損なわれる可能性をさらに低減することができるという効果も得られる。
【0216】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、フォントサイズの維持を、行数または1行当たりの文字数よりも優先させることができるので、フォントサイズについて、デザイナが意図したレイアウトが損なわれる可能性をさらに低減することができるという効果も得られる。
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、コンテンツデータの選択に関してユーザの固有情報やユーザによる指定情報が参照されることから、ユーザの希望に比較的沿った内容のディジタルコンテンツを作成することができるという効果も得られる。
【0217】
さらに、本発明に記載のディジタルコンテンツ作成システムによれば、出力レイアウトの決定に関してユーザの固有情報やユーザによる指定情報が参照されることから、ユーザの希望に比較的沿った出力レイアウトでディジタルコンテンツを作成することができるという効果も得られる。
一方、本発明に記載の文書整形プログラムによれば、本発明に記載の文書整形システムと同等の効果が得られる。
【0218】
一方、本発明に記載のディジタルコンテンツ作成プログラムによれば、本発明に記載のディジタルコンテンツ作成システムと同等の効果が得られる。
一方、本発明に記載の文書整形方法によれば、本発明に記載の文書整形システムと同等の効果が得られる。
一方、本発明に記載のディジタルコンテンツ作成方法によれば、本発明に記載のディジタルコンテンツ作成システムと同等の効果が得られる。
【図面の簡単な説明】
【図1】 本発明を適用するネットワークシステムの構成を示すブロック図である。
【図2】 コンテンツ配信端末100の機能概要を示す機能ブロック図である。
【図3】 コンテンツ配信端末100の構成を示すブロック図である。
【図4】 ユーザプロファイルテーブル300のデータ構造を示す図である。
【図5】 レイアウト定義ファイルおよびレイアウトNo.対応テーブル330のデータ構造を示す図である。
【図6】 レイアウト定義ファイルのデータ構造の一部を示す図である。
【図7】 XMLで記述したレイアウト定義ファイルform01の内容の一部を示すデータリストである。
【図8】 フロー管理テーブル400のデータ構造を示す図である。
【図9】 重要語句登録テーブル450のデータ構造を示す図である。
【図10】 コンテンツデータおよびカテゴリNo.対応テーブル340のデータ構造を示す図である。
【図11】 ユーザ登録処理を示すフローチャートである。
【図12】 コンテンツ配信処理を示すフローチャートである。
【図13】 自動レイアウト処理を示すフローチャートである。
【図14】 ステップS316の文書情報格納枠への格納処理を示すフローチャートである。
【図15】 重要語句登録処理を示すフローチャートである。
【図16】 改行候補位置設定処理を示すフローチャートである。
【図17】 形態素の内容と改行候補位置の優先度との対応を示す表である。
【図18】 フォントサイズ優先型格納処理を示すフローチャートである。
【図19】 行数優先型格納処理を示すフローチャートである。
【図20】 改行処理を示すフローチャートである。
【図21】 フロー処理を示すフローチャートである。
【図22】 ステップS308の文書情報格納枠への格納処理を示すフローチャートである。
【図23】 未処理フローオブジェクトの処理を示すフローチャートである。
【図24】 レイアウト結果を示す図である。
【符号の説明】
10 コンテンツデータファイル
11,14,18 XMLパーサ
12 コンテンツデータファイル入力部
13 レイアウト定義ファイル
15 レイアウト定義ファイル入力部
16 レイアウティング部
17 描画指定ファイル
19 ラスタライズ部
100 コンテンツ配信端末
200 ユーザ端末
1〜Sn コンテンツデータ提供端末
30 CPU
32 ROM
34 RAM
38 I/F
40 ユーザ情報登録DB
42 重要語句登録DB
44 コンテンツデータ登録DB
300 ユーザプロファイルテーブル
330 レイアウトNo.対応テーブル
340 カテゴリNo.対応テーブル
400 フロー管理テーブル
360 レイアウト領域
362 タイトル情報格納枠
364,370,372 文書情報格納枠
366,368 画像情報格納枠[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a system, a program, and a method for shaping or modifying a document, and in particular, shaping or modifying a document included in the case of creating digital content having contents in accordance with the latest situation or topic. Document formatting system, digital content creation system, document shaping program, digital content creation program, document shaping method and digital content creation method suitable for improving readability of digital content by handling topical keywords collectively About.
[0002]
[Prior art]
In recent years, one of network services is a service for distributing digital contents such as news, which is provided by a content distribution system. In this system, in general, content data is selected from a content data registration database (hereinafter simply referred to as DB), digital content is edited using the selected content data, and the edited digital content is edited by the user. Deliver against. In the editing process of digital content, layout is performed so that it is easy for the user to see or read.
[0003]
In content distribution systems, digital content is created by combining images, documents, and other multimedia. Of these, documents are laid out by storing the document information in a document information storage frame arranged in the layout area. Yes. In this case, from the viewpoint of making it easy to read or read, the document information is not simply stored in the document information storage frame, but the line feed position of the text, character modification, font size, font type, character spacing, number of lines, etc. are adjusted. Thus, it is desired to format or modify the document in the document information storage frame.
[0004]
Conventional techniques for shaping or modifying a document include, for example, a document shaping apparatus disclosed in Japanese Patent Laid-Open No. 63-245760 (hereinafter referred to as a first conventional example) and Japanese Patent Laid-Open No. 2-101569. The disclosed character processing device (hereinafter referred to as the second conventional example), the document processing device disclosed in JP-A-6-309310 (hereinafter referred to as the third conventional example), and JP-A-10-283353 There are document processing apparatuses disclosed in the gazette (hereinafter referred to as a fourth conventional example) and document processing apparatuses disclosed in Japanese Patent Application Laid-Open No. 11-143869 (hereinafter referred to as a fifth conventional example).
[0005]
In the first conventional example, an input unit for inputting document data, a clause delimiter for delimiting a sentence in the document data, and a sentence separated by the phrase delimiter are prevented from being moved. A shaping processing unit for shaping and a display unit for displaying a document shaped by the shaping processing unit. In other words, the sentence is broken at a point where it is not unnatural as seen from both the pronunciation and the meaning.
As a result, a phrase that is pronounced and semantically spans a plurality of lines, so that the readability of the document can be improved.
[0006]
The second conventional example includes an input unit for inputting kana characters, a kana-kanji conversion unit for converting a kana character string input at the input unit into a character string mixed with kanji, and a character for storing a character string converted by the kana-kanji conversion unit. The apparatus includes a column storage unit and a printing unit that prints a character string in the character string storage unit. More specifically, a delimiter information storage unit that stores character string delimiter information when converted by the Kana-Kanji conversion unit, a print condition setting unit that sets print conditions such as the type of print paper and print space, and a character string When printing a character string in the storage unit, the delimiter of the character string to be printed is determined from the number of characters that can be printed in one line determined by the printing conditions set in the print condition setting unit and the delimiter information in the delimiter information storage unit Thus, the printing unit includes a one-line data creation unit that creates data for each line to be printed.
[0007]
Thereby, line breaks are performed between clauses or between place names, and the readability of the document can be improved.
The third conventional example is a mechanism for evaluating the width of an allocatable area for a predetermined character string and the width of an area to which a character string is actually allocated, and determining a line feed position of the predetermined character string. It is a device provided. More specifically, a mechanism for performing a morpheme analysis on a character string to be output to obtain a morpheme string constituting the character string, and a morpheme when sequentially assigning each morpheme of the morpheme string constituting the character string to be output. A mechanism that holds the width of the area occupied by each morpheme in the column, a mechanism that holds the width of the allocatable area, and the width of the area occupied by each morpheme and the width of the allocatable area, It is configured with a mechanism for determining a line break at a break of the corresponding morpheme so that any morpheme included in the character string is output on the same line.
[0008]
As a result, line breaks are made between characters that are semantically weakly linked (so-called breaks) for a given sentence. Therefore, the readability of the document can be improved.
In the fourth conventional example, the morpheme break evaluation calculation unit evaluates which of the morphemes divided by the morpheme analysis processing unit is appropriate as the line feed position. First, the break evaluation calculation unit obtains a line breakable candidate from morphemes. The break evaluation calculation unit obtains a line feed position score based on the priority of the morphemes. The break evaluation calculation unit obtains a pitch score of a character pitch when a line break is made at each line breakable candidate. The break evaluation calculation unit obtains a line feed possible candidate that maximizes the sum of the line feed position score and the pitch score.
[0009]
As a result, line breaks are not generated in the middle of the morpheme, and there is no space between characters or characters do not overlap, so that the readability of the document can be improved.
In the fifth conventional example, the morphological analysis unit, the in-word line break detection unit, and the in-word line break position display unit detect and display the position of the word separated into two lines by the line feed. Next, the replacement candidate extraction unit, the synonym search unit, and the replacement candidate display unit extract and display synonyms or different notation words having different numbers of characters for each word in the line including the word. Furthermore, the character string replacement unit avoids the separation of one word by replacing with a synonym or a different notation word having a different number of characters.
[0010]
As a result, even if one word is separated into two lines by a line feed, it is possible to avoid the separation of one word without impairing the text layout and the balance of characters, so that the readability of the document can be improved.
[0011]
[Problems to be solved by the invention]
By the way, in the content distribution system, the latest situation and the news corresponding to the topic are distributed on the digital content and distributed. In such digital contents, keywords (hereinafter referred to as topical keywords) corresponding to the situation or topic in headlines and articles may be used relatively frequently. A topical keyword often consists of a plurality of morphemes, but gradually has a specific meaning when used repeatedly. For example, the keyword “terrorist attacks in the United States” does not have a specific meaning before the occurrence of a terrorist incident in the United States, but becomes a keyword that represents a specific incident as news reports regarding the incident are repeated. Therefore, from the viewpoint of making digital content easy to read or read, it is desirable to handle topical keywords collectively when shaping or modifying a document.
[0012]
However, since the first conventional example is configured to perform a line break by considering a section as a break, there is a possibility that a line break may be performed within a topical keyword. That is, since the topical keyword is often composed of a plurality of morphemes, it may be determined that there is a paragraph break in the topical keyword, and in that case, a line break is generated in the topical keyword. If a topical keyword spans multiple lines due to such line breaks, the meaning becomes difficult to grasp and difficult to read, and the readability of the document is lowered.
[0013]
In the second conventional example, line breaks between clauses or between place names and place names are performed based on character string delimiter information when converted by the Kana-Kanji conversion unit. When Kana-Kanji conversion is performed during the input of a topical keyword, a line break is generated within the topical keyword.
Further, in the third conventional example, the morpheme break is configured to be evaluated equally for all the morphemes. As a result of the evaluation, when it is determined that a morpheme break exists in the topical keyword. Will cause line breaks in topical keywords.
[0014]
Further, in the fourth conventional example, the line feed position score is calculated based on the priority of the morpheme, and the line feed is performed with the line feed possible candidate having the maximum sum of the line feed position score and the pitch score. Therefore, depending on the setting of the priority of the morpheme, a line break may occur within the topical keyword. In this case, it is difficult to prohibit line breaks in topical keywords unless the priority is set in units of a plurality of morphemes instead of setting the priority in units of one morpheme. .
[0015]
Further, in the fifth conventional example, when one word is separated into two lines by a line feed, the separation of one word is avoided by replacing it with a synonym or a different notation word having a different number of characters. Since there is no synonym or different notation word corresponding to the topical keyword, a line feed is performed within the topical keyword.
Therefore, from the viewpoint of improving the readability of digital content, it is desirable that line breaks are not made within the topical keyword. In addition to this, it is also effective to highlight the topical keyword by character decoration or insert a supplementary explanation about the topical keyword in the document.
[0016]
Note that these problems are not limited to the distribution of digital content, but can also be assumed when a document having contents in accordance with the latest situation or topic is created, edited, displayed, or printed.
Therefore, the present invention has been made paying attention to such an unsolved problem of the conventional technology, and is included in the case of creating digital content having contents in accordance with the latest situation and topic. Document shaping system, digital content creation system, document shaping program, digital content creation program, and document suitable for improving readability of digital content by collectively handling topical keywords when shaping or modifying a document An object is to provide a shaping method and a digital content creation method.
[0017]
[Means for Solving the Problems]
In order to achieve the above object, a document shaping system, a digital content creation system, a document shaping program and a digital content creation program, and a document shaping method and a digital content creation method described in the present invention include important words and phrases formed of a plurality of morphemes. A system for shaping or modifying a document so as to improve readability with reference to the important phrase storage means when the important phrase storage means to be stored becomes available, and document information to be output is given In this case, when the important word / phrase of the important word / phrase storage means is included in the document information, or the quasi-important word / phrase that includes the morphemes constituting the important word / phrase of the important word / phrase storage means in the order is in the document If it is included in the information, the important word or phrase of the document to be output based on the document information It is adapted to perform shaping or modified for quasi-important phrase.
[0018]
With such a configuration, the important phrase storage unit can be used, and when document information to be output is given, if the important phrase of the important phrase storage unit is included in the document information, the document information is based on the document information. The important words or phrases in the document to be output are formatted or modified.
In addition, when document information to be output is given, if the document information includes quasi-important phrases that include the morphemes constituting the important phrases of the important phrase storage means in the order, The quasi-important phrase in the document to be output based on the document information is shaped or modified.
[0019]
Here, formatting important words or quasi-important phrases includes, for example, prohibiting line breaks in important words or quasi-important phrases, changing the pitch between characters of important words or quasi-important phrases, important Substituting a phrase or semi-important phrase with another synonym or notation. In addition, modification of important words or quasi-important phrases includes, for example, changing the color, font size, font type, number of lines, number of characters per line, pitch between lines, or pitch between characters of important words or quasi-important phrases. , Inserting supplementary explanations about important or quasi-important phrases into the document.
[0020]
Further, the quasi-important phrase refers to a phrase that includes each morpheme constituting the important phrase in order, and includes, for example, an important phrase composed of three morphemes A, B, and C. , A, B, D, and C morphemes, A, D, B, E, and C morphemes, and A, D, E, F, B, and C morphemes.
[0021]
The important phrase storage means stores important phrases at any time and at any time. The important phrase storage means may store important phrases in advance or store important phrases in advance without storing important phrases. Important words and phrases may be stored by external input or the like during system operation.
[0022]
Further, the document shaping system and the digital content creation system described in the present invention may be realized as a single device, or may be realized as a network system in which a plurality of terminals are communicably connected. . In the latter case, each component may belong to any terminal among a plurality of terminals as long as each component is communicably connected.
Furthermore, the document shaping system according to the present invention acquires a phrase from the document information in units of a plurality of continuous morphemes, associates the acquired phrase with its appearance frequency, and stores it in the important phrase storage unit as the important phrase. When the document information includes registered important words / phrases having an appearance frequency of a predetermined value or more, the shaping / modification of the important words / phrases in the document to be output based on the document information is performed. Is supposed to do.
[0023]
With such a configuration, a phrase is acquired from the document information in units of a plurality of continuous morphemes, and the acquired phrase is associated with the appearance frequency and registered as an important phrase in the important phrase storage unit. If the document information includes important words / phrases in the important word / phrase storage means whose appearance frequency is a predetermined value or higher, the important words / phrases in the document to be output based on the document information are shaped or modified.
Furthermore, when the same important phrase as the acquired phrase is registered in the important phrase storage unit, the document shaping system according to the present invention corresponds to the important phrase among the appearance frequencies of the important phrase storage unit. When an important phrase that is the same as the acquired phrase is not registered in the important phrase storage means, the acquired phrase is registered in the important phrase storage means as the important phrase.
[0024]
With such a configuration, when the same important phrase as the acquired phrase is registered in the important phrase storage unit, the frequency of appearance of the important phrase storage unit corresponding to the important phrase is increased. On the other hand, if the same important phrase as the acquired phrase is not registered in the important phrase storage means, the acquired phrase is registered in the important phrase storage means as the important phrase.
Furthermore, when the important word or the semi-important phrase is included in the document information, the document shaping system according to the present invention includes the important word or the quasi-important in the important phrase in the document to be output based on the document information. Line breaks in words are prohibited.
[0025]
With such a configuration, when an important word / phrase is included in the document information, line breaks in the important word / phrase are prohibited in a document to be output based on the document information.
If the semi-important phrase is included in the document information, line breaks in the semi-important phrase are prohibited in the document to be output based on the document information.
Furthermore, in the document shaping system according to the present invention, the important phrase storage means stores topical keywords corresponding to the situation or topic as the important phrases.
[0026]
With such a configuration, when the topical keyword of the important phrase storage means is included in the document information, the topical keyword of the document to be output based on the document information is shaped or modified.
In addition, if the document information includes quasi-important phrases that include the morphemes constituting the topical keywords of the important phrase storage means in order, the document should be output based on the document information. The semi-important phrase is shaped or modified.
[0027]
On the other hand, in order to achieve the above object, the digital content creation system according to the present invention comprises content creation means for determining output layout using selected content data and creating digital content, wherein the content creation means includes: A system for creating the digital content by storing document information constituting the content data in a document information storage frame arranged in a layout area, wherein the content creation means includes an important phrase comprising a plurality of morphemes Each of the morphemes constituting the important word / phrase of the important word / phrase storage means when the important word / phrase of the important word / phrase storage means is included in the document information. When the document information contains quasi-important phrases that are fragmented in that order, For the keyword or the quasi keyword of the document serial document information stored in the frame is adapted to perform shaping or modification.
[0028]
In such a configuration, when content data is selected, the content creation means stores the document information constituting the selected content data in the document information storage frame arranged in the layout area, thereby enabling digital Content is created.
In the layout process, when the important phrase storage means becomes available, if the important phrase of the important phrase storage means is included in the document information, the content creation means will select the important phrase storage means from among the documents in the document information storage frame. The key words are formatted or modified.
[0029]
Further, if the document information includes a quasi-important phrase that includes each morpheme constituting the important phrase of the important phrase storage means in order, the content creation means stores the vocabulary in the document information storage frame. The quasi-important phrase of the document is formatted or modified.
Here, the arrangement of the document information storage frame in the layout area may be performed dynamically, for example, during the layout of the digital content, or a layout that defines a state in which a plurality of document information storage frames are arranged in the layout area. Definition information may be prepared in advance and performed based on the layout definition information.
[0030]
The output layout is, for example, when a digital content is created for the purpose of displaying on the screen, and the display layout is printed when the digital content is created for the purpose of printing on paper. Refers to the layout.
Furthermore, the digital content creation system according to the present invention includes a content data storage unit that stores content data, a content data selection unit that selects the content data from the content data storage unit, and the content data selection unit. Content creation means for determining an output layout using the selected content data and creating digital content, wherein the content creation means stores document information constituting the content data in a document information storage frame arranged in a layout area. And storing important words / phrases storing means for storing important words / phrases composed of a plurality of morphemes, wherein the contents creating means includes the important words / phrases stored in the important word / phrase storage means as the document. Included in information Or when the document information includes quasi-important phrases that fragmentally include the morphemes constituting the important phrases of the important phrase storage means in that order, the document in the document information storage frame Among them, the important phrase or the quasi-important phrase is shaped or modified.
[0031]
With such a configuration, content data is selected from the content data storage means by the content data selection means, and the document information constituting the selected content data is arranged in the layout area by the content creation means. It is stored in the document information storage frame, thereby creating digital content.
In the layout process, when an important word / phrase stored in the important word / phrase storage means is included in the document information, the content creation means shapes or modifies the important word / phrase in the document within the document information storage frame.
[0032]
Further, if the document information includes a quasi-important phrase that includes each morpheme constituting the important phrase of the important phrase storage means in order, the content creation means stores the vocabulary in the document information storage frame. The quasi-important phrase of the document is formatted or modified.
Here, the content data storage means stores the content data at any time and at any time, and the content data may be stored in advance, or without storing the content data in advance. The content data may be stored by external input or the like during operation of the system.
[0033]
Furthermore, the digital content creation system according to the present invention acquires a phrase from the document information in units of a plurality of consecutive morphemes, associates the acquired phrase with its appearance frequency, and stores the important phrase storage unit as the important phrase The content creation means includes the document information storage frame when the document information includes important words / phrases having an appearance frequency of a predetermined value or more among the important words / phrases in the important word / phrase storage means. Of these documents, the important words or phrases are shaped or modified.
[0034]
With such a configuration, the keyword is acquired from the document information in units of a plurality of consecutive morphemes by the keyword registration unit, and the acquired word is associated with the appearance frequency in the keyword storage unit as the keyword. be registered. Then, when the document information includes important words / phrases in the important word / phrase storage means whose appearance frequency is greater than or equal to a predetermined frequency, the content creation means shapes or modifies the important words / phrases in the document in the document information storage frame. Done.
[0035]
Furthermore, in the digital content creation system according to the present invention, the important phrase registration unit is configured such that when the same important phrase as the acquired phrase is registered in the important phrase storage unit, the important phrase storage unit appears. The frequency corresponding to the important phrase is increased, and when the same important phrase as the acquired phrase is not registered in the important phrase storing means, the acquired phrase as the important phrase is stored in the important phrase storing means. It comes to register.
[0036]
With such a configuration, when the same important phrase as the acquired phrase is registered in the important phrase storage unit, the important phrase registration unit may correspond to the important phrase among the appearance frequencies of the important phrase storage unit. Will be increased. On the other hand, if the same important phrase as the acquired phrase is not registered in the important phrase storage unit, the acquired phrase is registered in the important phrase storage unit as the important phrase by the important phrase registration unit.
Furthermore, in the digital content creation system according to the present invention, when the quasi-important phrase is included in the document information, the content creation means includes the quasi-important phrase among the important phrases of the important phrase storage means. The importance is calculated based on the appearance frequency of the related words and the distance between the morphemes constituting the important word in the quasi-important word, and when the calculated importance is equal to or greater than a predetermined value, the document information storage frame The quasi-important words / phrases are formatted or modified.
[0037]
With such a configuration, when the semi-important phrase is included in the document information, the content creation means causes the occurrence frequency of the important word / phrase related to the semi-important phrase in the important phrase storage means, and the semi-important phrase The importance is calculated based on the distance between the morphemes constituting the important phrase. If the calculated importance is greater than or equal to a predetermined value, the semi-important phrase in the document in the document information storage frame is shaped or modified.
[0038]
Furthermore, in the digital content creation system according to the present invention, the content creation means includes the important word or phrase in the important word or phrase in the document information storage frame when the important word or the semi-important word or phrase is included in the document information. Alternatively, line breaks are prohibited in the semi-important phrase.
With such a configuration, when an important word / phrase is included in the document information, line breaks in the important word / phrase are prohibited in the document information storage frame by the content creation means.
[0039]
Also, if the semi-important phrase is included in the document information, the content creation means prohibits line breaks within the semi-important phrase in the document information storage frame.
Further, in the digital content creation system according to the present invention, the content creation means performs a morpheme analysis on the document information, sets the end of each morpheme as a line feed candidate position based on the analysis result, and the line feed candidate When a line break is made at any position and the important word or quasi-important phrase is included in the document information, a line break set in the important word or quasi-important phrase The setting is canceled for the candidate position.
[0040]
With such a configuration, the content creation unit performs morpheme analysis on the document information, and the end of each morpheme is set as a line feed candidate position based on the analysis result. If an important word / phrase is included in the document information, the setting of the line feed candidate position set in the important word / phrase is canceled. If the semi-important word / phrase is included in the document information, the setting of the line feed candidate position set in the semi-important word / phrase is canceled. After the setting is canceled as described above, a line feed is finally performed at any one of the line feed candidate positions.
[0041]
Furthermore, in the digital content creation system according to the present invention, the important phrase storage means stores topical keywords corresponding to the situation or topic as the important phrases.
With such a configuration, if the topical keyword of the important phrase storage unit is included in the document information, the content creation unit performs shaping or modification of the topical keyword in the document in the document information storage frame. Is called.
[0042]
Also, if the document information includes quasi-important phrases that include each morpheme constituting the topical keyword of the important phrase storage means in order, the content creation means similarly creates a document information storage frame. The quasi-important phrase of the document is formatted or modified.
By the way, in the editing process of digital contents, since the layout and mechanical appearance may be significantly impaired, for example, a designer may design some layout templates in advance. Based on the template, measures are taken such as editing the digital content so that the designer has the intended layout. In this case, it is desired that the digital content can be edited so that the layout intended by the designer is roughly achieved regardless of the content of information to be posted, the number of characters, and the logical structure.
[0043]
In order to solve this, as a conventional technique, when the document information cannot be stored in the document information storage frame, the format such as the font size and the number of lines is automatically changed without changing the shape and position of the document information storage frame. A configuration is known in which document information is stored in a document information storage frame by making a change to the above.
However, in such a configuration, it can be expected that the layout and the position of the document information storage frame are intended by the designer to some extent, but the format such as the font size and the number of lines depends on the number of characters in the document information. The format could change, potentially breaking the layout that the designer intended.
[0044]
Also, as a conventional technique, when document information cannot be stored in the document information storage frame, the shape and arrangement position are automatically changed without changing the font size, the number of lines, etc. of the document information storage frame. Thus, a configuration for storing document information in a document information storage frame is known.
However, in such a configuration, it can be expected that the layout intended by the designer is to some extent with respect to the format such as the font size and the number of lines, but the shape and arrangement position of the document information storage frame depends on the number of characters in the document information. In some cases, the shape and the arrangement position may be changed, and the layout intended by the designer may be damaged.
[0045]
Therefore, if the document information cannot be stored in the document information storage frame as a result of formatting or modifying the document by the document formatting system, change the font size etc. to store the document information. However, in that case, it is necessary to take care that the layout intended by the designer is not damaged. The document shaping system according to the present invention aims to solve this point.
[0046]
Furthermore, the digital content creation system according to the present invention is capable of setting a change allowable range of a parameter that may affect the number of characters stored in the document information storage frame. The number of characters stored in the document information storage frame is adjusted by changing the value of a specific parameter for which the change allowable range is set, within the change allowable range.
[0047]
With such a configuration, the value of the specific parameter is changed within the allowable change range by the content creation means, and the number of characters stored in the document information storage frame is adjusted.
Here, the parameter is a parameter that may affect the number of characters stored in the document information storage frame. For example, the font size of the document information storage frame, the number of lines, the number of characters per line, Parameters relating to the setting of the line pitch or the character pitch or parameters relating to the setting of the size, shape or arrangement position of the document information storage frame are included.
[0048]
In addition to the nature of parameters that affect the number of characters stored in the document information storage frame independently, combinations with other parameter values that do not affect the number of characters stored in the document information storage frame alone. Including those that affect the
In addition, when setting a change allowable range for a plurality of parameters, a change allowable range may be set for each of the plurality of parameters, or for a plurality of parameters, a change allowable range shared with some or all of the parameters may be set. It may be set. In the latter case, for example, when it is desired to limit both the number of lines in the document information storage frame and the number of characters per line to 30 or more and 40 or less, the parameter relating to the setting of the number of lines and the setting of the number of characters per line. With respect to the parameters, one change allowable range having a range of 30 or more and 40 or less can be set.
[0049]
In addition, an upper limit value and a lower limit value can be set for the change allowable range, or only the upper limit value or only the lower limit value can be set.
In addition, when adjusting the number of characters stored, the document information is stored so that the document information can be stored as much as possible in the document information storage frame when the document information cannot be stored in the document information storage frame because the number of characters in the document information is large. In addition to adjusting the number of characters stored in the frame, conversely, because the number of characters in the document information is small, the document information can be stored in the document information storage frame, but there is a margin in the document information storage frame. Includes adjusting the number of characters stored in the document information storage frame so that the number of characters is as small as possible.
[0050]
In the digital content creation system according to the present invention, the change allowable range can be set for each of the plurality of parameters, and the content creation means can perform the change among all the allowable changes among the parameter changes. A value is held among the plurality of specific parameters so that the document information can be stored in the document information storage frame as much as possible, up to the maximum number of characters stored in the document information storage frame. A parameter having a lower power importance is preferentially changed within the allowable change range.
[0051]
With such a configuration, the content creation means limits the number of characters stored in the document information storage frame to the maximum number of characters stored in the document information storage frame among all the allowable changes among the parameter changes. In order that the document information can be stored in the frame as much as possible, a parameter having a lower importance among a plurality of specific parameters is preferentially changed within the allowable change range.
Here, all allowable changes among parameter changes are all changes that can be made within the allowable change range for specific parameters, and there are no other restrictions for parameters other than specific parameters. All changes that can be made within the full scope are all changes that can be made within the scope of the restrictions if there are other restrictions. Other constraints are document information so that one document information storage frame and another document information storage frame are not placed in the overlapping area, or even if they are placed in the overlapping area, the overlapping portion is minimized. An example is to limit the change range of the size, shape, or arrangement position of the storage frame.
[0052]
Therefore, the number of stored characters when the number of stored characters in the document information storage frame is the maximum among all the permitted changes among the parameter changes is the number of stored characters for each specific parameter and other parameters as described above. When all possible changes have been made, the number of characters stored in the document information storage frame will change with each change, but when the number of characters stored in the document information storage frame becomes the maximum The number of stored characters.
[0053]
Furthermore, in the digital content creation system according to the present invention, one of the plurality of specific parameters includes a font parameter related to a font size setting of the document information storage frame, and the font parameter change allowable range is Set the lower limit.
With such a configuration, the font parameter value is changed with a predetermined lower limit as the limit so that the document information can be stored in the document information storage frame as much as possible with respect to the font size.
[0054]
Furthermore, in the digital content creation system according to the present invention, one of the plurality of specific parameters includes a character interval parameter related to setting of the number of lines of the document information storage frame or the number of characters per line, An upper limit is set as an allowable change range of the character spacing parameter.
With such a configuration, the value of the character spacing parameter is set to a predetermined upper limit for the number of lines or the number of characters per line so that the content creation means can store the document information in the document information storage frame as much as possible. The limit is changed.
[0055]
Furthermore, in the digital content creation system according to the present invention, one of the plurality of specific parameters includes a character interval parameter related to setting of the number of lines of the document information storage frame or the number of characters per line, An upper limit is set as an allowable change range of the character spacing parameter.
With such a configuration, the value of the character spacing parameter is set to a predetermined upper limit for the number of lines or the number of characters per line so that the content creation means can store the document information in the document information storage frame as much as possible. The limit is changed.
[0056]
Furthermore, in the digital content creation system according to the present invention, the font parameter is designated as a parameter that is less important than the character spacing parameter.
With such a configuration, the value of the font parameter is preferentially changed over the value of the character spacing parameter so that the document information can be stored in the document information storage frame as much as possible by the content creation unit.
[0057]
Furthermore, in the digital content creation system according to the present invention, when the content creation unit cannot store the document information in the document information storage frame due to any change that can be made within the allowable change range of the font parameter. The font parameter value is changed by raising the value of the character spacing parameter by a predetermined value.
[0058]
In such a configuration, if the document information cannot be stored in the document information storage frame by any change that can be made within the allowable change range of the font parameter by the content creation means, the value of the character spacing parameter is increased by a predetermined value. The font parameter value is changed.
Furthermore, the digital content creation system according to the present invention designates the character spacing parameter as a parameter having a lower importance than the font parameter.
[0059]
With such a configuration, the value of the character spacing parameter is preferentially changed over the value of the font parameter so that the document information can be stored in the document information storage frame as much as possible by the content creation unit.
Furthermore, in the digital content creation system according to the present invention, when the content creation means cannot store the document information in the document information storage frame due to any change that can be made within the allowable change range of the character spacing parameter. The font parameter value is lowered by a predetermined value to change the character spacing parameter value.
[0060]
With such a configuration, if the content creation unit cannot store the document information in the document information storage frame due to any change that can be made within the allowable change range of the character spacing parameter, the font parameter value is reduced by a predetermined value. The value of the character spacing parameter is changed.
Furthermore, the digital content creation system according to the present invention includes user information storage means for storing user information relating to a user, and the content data selection means is configured to select the content based on user information in the user information storage means. The content data is selected from the data storage means.
[0061]
With such a configuration, the content data selection means selects content data from the content data storage means based on the user information stored in the user information storage means.
Here, the user information includes, for example, the user's age, sex, interest preference, address, name, or usage environment related to the user terminal.
[0062]
The user information storage means stores the user information at any time and at any time, and may store user information in advance, or may store the user information in advance without storing the user information in advance. User information may be stored by external input or the like during system operation.
The digital content creation system according to the present invention further comprises user information storage means for storing user information relating to a user, wherein the content creation means is configured to use the content data based on user information stored in the user information storage means. The output layout is determined using the content data selected by the selection means.
[0063]
If it is such a structure, an output layout will be determined by the content preparation means based on the user information of a user information storage means using the selected content data.
Here, as determining the output layout based on the user information, when the user information includes the age, it is possible to adopt a layout having a relatively large font size if the user is a relatively elderly person. . In addition, when the user information includes gender, if the gender is female, it may be possible to adopt a circular font layout. If the user information includes interests and preferences, it is possible to adopt a magazine-like layout for children, a sports newspaper style, or a technical document-like layout according to the interests and preferences. In addition, when the user information includes an address, it is conceivable to adopt a layout with a background of a landscape image specialized for the land with the address. When the user information includes a name, it is possible to adopt a layout with the name as the title. In addition, when the user information includes the usage environment related to the user terminal, it may be possible to adopt a layout in which an image with a large data capacity is not used as much as possible when the RAM of the user terminal is small.
[0064]
On the other hand, in order to achieve the above object, the document shaping program according to the present invention is a program for causing the document shaping system according to the present invention comprising a computer system to execute processing for shaping or modifying a document. When the document information to be output is given, the important word / phrase of the important word / phrase storage means is included in the document information, or the morphemes constituting the important word / phrase of the important word / phrase storage means are arranged in that order. When the document information includes a quasi-important phrase included in a fragmentary manner in order to execute processing for shaping or modifying the important phrase or the quasi-important phrase in the document to be output based on the document information It is a program.
[0065]
With such a configuration, when the program is read by the document shaping system, and the document shaping system executes processing according to the read program, an operation equivalent to that of the document shaping system according to the present invention is obtained.
On the other hand, in order to achieve the above object, a digital content creation program according to the present invention causes a digital content creation system according to the present invention comprising a computer system to execute processing realized as the content creation means. In the program, when the important phrase storage unit that stores the important phrase composed of a plurality of morphemes becomes available, the content creation unit includes the important phrase of the important phrase storage unit in the document information. Or when the document information includes a quasi-important phrase that includes each morpheme constituting the important phrase of the important phrase storage means in that order, among documents in the document information storage frame It is a program for executing processing for shaping or modifying the important phrase or the quasi-important phrase.
[0066]
With such a configuration, when the program is read by the digital content creation system, and the digital content creation system executes processing in accordance with the read program, an operation equivalent to that of the digital content creation system described in the present invention is obtained.
On the other hand, in order to achieve the above object, the document shaping method according to the present invention refers to the important phrase storage means when the important phrase storage means for storing the important phrases composed of a plurality of morphemes becomes available. A method of shaping or modifying a document so as to improve readability, and when document information to be output is given, when the important phrase of the important phrase storage means is included in the document information, Alternatively, when the document information includes a quasi-important phrase that includes the morphemes constituting the important phrase of the important phrase storage means in order, the important information among the documents to be output based on the document information Format or modify words or quasi-important words.
[0067]
On the other hand, in order to achieve the above object, the digital content creation method according to the present invention includes a content creation step of determining an output layout using the selected content data and creating digital content, the content creation step comprising: A method of creating the digital content by storing document information constituting the content data in a document information storage frame arranged in a layout area, wherein the content creation step includes an important phrase comprising a plurality of morphemes Each of the morphemes constituting the important word / phrase of the important word / phrase storage means when the important word / phrase of the important word / phrase storage means is included in the document information. When the document information contains semi-important words that are fragmented in that order Performs shaping or modified for that keyword or the quasi keyword of the document of the document information storage frame.
[0068]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings. 1 to 24 are diagrams showing embodiments of a document shaping system, a digital content creation system, a document shaping program and a digital content creation program, and a document shaping method and a digital content creation method according to the present invention.
In the present embodiment, as shown in FIG. 1, a content distribution terminal 100, a document shaping system, a digital content creation system, a document shaping program, a digital content creation program, a document shaping method, and a digital content creation method according to the present invention. The present invention is applied to the case where digital content such as news is distributed to the user terminal 200.
[0069]
First, the configuration of a network system to which the present invention is applied will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of a network system to which the present invention is applied.
As shown in FIG. 1, the Internet 199 includes a plurality of content data providing terminals S that provide content data. 1 ~ S n And content data providing terminal S 1 ~ S n The content distribution terminal 100 that collects and accumulates the content data provided from and distributes the digital content is connected to the user terminal 200 that is used by the user. In order to facilitate understanding of the invention, only one user terminal 200 is illustrated, but actually, a plurality of user terminals are connected to the Internet 199.
[0070]
Content data providing terminal S 1 ~ S n Is configured to have the same function as a general computer having a bus, CPU, ROM, RAM, I / F, etc., and when content data is created, it is a category for specifying the category of content data. No. is added to the content data and transmitted to the content distribution terminal 100. The category number will be described in detail later.
[0071]
The user terminal 200 is configured to have the same function as a general computer in which a CPU, a ROM, a RAM, an I / F, and the like are connected by a bus, and has a WWW (World Wide Web) browser. The distribution terminal 100 is accessed.
Next, an outline of functions of the content distribution terminal 100 will be described in detail with reference to FIG. FIG. 2 is a functional block diagram showing an outline of functions of the content distribution terminal 100.
[0072]
As shown in FIG. 2, the content distribution terminal 100 inputs an XML parser 11 that analyzes a content data file 10 in an XML (eXtensible Markup Language) format, and a content data file input that inputs the content data file 10 analyzed by the XML parser 11. Part 12, an XML parser 14 for analyzing the XML format layout definition file 13, a layout definition file input part 15 for inputting the layout definition file 13 analyzed by the XML parser 14, and content data input by the input parts 12 and 15 The layouting unit 16 that performs layout based on the file 10 and the layout definition file 13, the XML parser 18 that analyzes the XML-format drawing designation file 17 from the layouting unit 16, and the drawing finger that is analyzed by the XML parser 18 It is composed of a rasterizing unit 19 to create a PDF (Portable Document Format) format of the file 20 by performing drawing on the basis of the file 17. This embodiment is characterized by the layouting portion 16 among these components.
[0073]
Next, the configuration of the content distribution terminal 100 will be described in detail with reference to FIG. FIG. 3 is a block diagram illustrating a configuration of the content distribution terminal 100.
As shown in FIG. 3, the content distribution terminal 100 reads out from the CPU 30 that controls the calculation and the entire system based on the control program, the ROM 32 that stores the control program of the CPU 30 in a predetermined area, and the ROM 32. It is composed of a RAM 34 for storing data and calculation results required in the calculation process of the CPU 30, and an I / F 38 for mediating input / output of data to / from an external device. These are used for transferring data. The buses 39 as signal lines are connected to each other so as to be able to exchange data.
[0074]
In the I / F 38, as external devices, a user information registration DB 40 for registering user information, an important phrase registration DB 42 for registering important phrases as topical keywords composed of a plurality of morphemes, and a content data providing terminal S 1 ~ S n Are connected to a content data registration DB 44 for collecting and storing content data provided from, and a signal line for connecting to the Internet 199.
Next, the data structure of the user information registration DB 40 will be described in detail with reference to the drawings.
[0075]
As shown in FIG. 4, the user information registration DB 40 stores a user profile table 300 for registering user information. FIG. 4 is a diagram illustrating a data structure of the user profile table 300.
As shown in FIG. 4, the user profile table 300 can register one or a plurality of records for each user. Each record includes a field 302 for registering a user ID for identifying a user, a field 304 for registering a distribution destination address of digital content, a field 306 for registering a category number, a field 308 for registering a keyword, It includes a field 310 for registering a delivery date, a field 312 for registering a delivery time, a field 314 for registering a layout number, and a field 316 for registering the maximum number of pages.
[0076]
In the field 308, when content data including a keyword designated by the user is selected as a distribution target, the keyword is registered. As a keyword, for example, a keyword that appears frequently in articles in a category in which the user is interested is given. In the example of FIG. 4, “processor” is registered in the first level of the field 308, and “OS (Operating System)” is registered in the second level of the field 308.
[0077]
In field 310, a distribution date for which the user desires to distribute digital contents is registered. For example, if you want to distribute digital content every day, specify "Daily". If you want to distribute only on weekdays, specify "Weekday". If you want to distribute only on weekends, select "Weekend". Is specified. In the example of FIG. 4, “daily” is registered in the first row of the field 310, and “weekday” is registered in the second row of the field 310.
[0078]
In the field 312, a distribution time at which distribution of digital contents is desired on the distribution date designated by the user is registered. As the delivery time, for example, any time when a day is expressed by a 24-hour system time from 0:00 to 23:00 is designated. In the example of FIG. 4, 5 o'clock is registered in the first row of the field 312 and 11 o'clock is registered in the second row of the field 312.
In the field 314, a layout number for specifying the output layout of the digital content is registered. As the layout number, for example, a layout number for specifying the output layout desired by the user is designated. In the example of FIG. 4, layout No. 2 is registered in the first level of the field 314, and layout No. 5 is registered in the second level of the field 314. The layout number will be described in detail later.
[0079]
The field 316 registers the maximum number of pages that is the upper limit when digital content is displayed or printed. As the maximum number of pages, for example, in addition to specifying the maximum number of pages as an upper limit, it is possible to specify not to set an upper limit by the notation “u”. In the example of FIG. 4, two pages are registered in the first row of the field 316, and “u” is registered in the third row of the field 316.
[0080]
Further, as shown in FIG. 5, the user information registration DB 40 shows a correspondence relationship between a plurality of layout definition files form01 to form06 defining the output layout of digital contents, and the layout definition files form01 to form06 and the layout number. A layout number correspondence table 330 is stored. FIG. 5 shows the data structure of the layout definition file and the layout number correspondence table 330. As shown in FIG.
[0081]
The layout definition files form01 to form06 include, for example, the size and arrangement position of an information storage frame for storing document information and image information. For the document information storage frame, in addition to the size and arrangement position, the font size and font Type, font color, number of lines (or pitch between lines) and number of characters per line (or pitch between letters), image information storage frame, as well as size and position, number of images, quality and aspect ratio It is defined and described in XML or the like.
[0082]
In the layout number correspondence table 330, as shown in FIG. 5B, one record is registered for each layout number. Each record includes a field 332 in which a layout number is registered and a field 334 in which the file name of the layout definition file is registered. In the example of FIG. 5B, “1” is registered as the layout number and “form01” is registered as the layout definition file name in the first row record, and the second row record is registered in the second row record. “2” is registered as the layout number, and “form02” is registered as the layout definition file name.
[0083]
Next, the data structure of the layout definition files form01 to form06 will be described in detail with reference to FIG. FIG. 6 shows a part of the data structure of the layout definition file. Each layout definition file form01 to form06 has a different data structure. Here, a representative one of the layout definition files form01 to form06 will be described.
The layout definition file form01 has a layout area 360 for each page. For example, the layout area 360 of the first page has a title information storage frame 362 for storing title information as shown in FIG. A document information storage frame 364 for storing document information, an image information storage frame 366 for storing image information, an image information storage frame 368, and a document information storage frame 370. Yes. The document information storage frame 364 is given “World” as an ID.
[0084]
Further, for example, the layout area 360 of the fifth page is configured by arranging a document information storage frame 372 as shown in FIG. 6B, and the document information storage frame 372 stores document information as an ID. The same “World” as that attached to the frame 364 is attached. When the document information storage frame 364 and the document information storage frame 372 are associated with each other by ID and the document information cannot be stored in the document information storage frame 364 and overflows, the document information is stored in the document information storage frame 364. This means that the flow objects that could not be stored are stored in the document information storage frame 372. Here, the flow object refers to document information or other overflow information that overflows without being stored in the document information storage frame on the current page or a page before it. same as below.
[0085]
In the example of FIG. 6, the document information storage frame is associated and used by attaching an ID. However, this is merely an example, and, for example, when storing a flow object in the layout process, it is unused. The document information storage frame may be used as a document information storage frame for storing the flow object.
In addition, in the layout definition file form01, for each document information storage frame, as parameters affecting the number of characters stored in the document information storage frame, parameters relating to character formatting and parameters relating to character assignment settings can be set. It has become. FIG. 7 is a data list showing a part of the contents of the layout definition file form01 described in XML.
[0086]
In FIG. 7, a parameter 380 relating to character format setting and a parameter 382 relating to character assignment setting are set. In the example of FIG. 7, “MS Gothic” is set as the font type, “13 points” as the initial font size, and “10.5 points” as the lower limit of the font size. This is a 13-point font size when the document information can be stored in the document information storage frame. If the document information cannot be stored in the document information storage frame, the font size is set to 10.5. It means that you can reduce it to points. The parameter 382 includes “center” as the character alignment method, “3 lines” as the upper limit of the number of lines, and “number of lines” indicating that the font size and the number of lines are highly important to hold the value. "Is set, which means that if the document information cannot be stored in the document information storage frame, the number of lines may be increased to three. However, since the importance of the number of lines is set higher than the font size, when increasing the number of lines, even if the font size is reduced to 10.5 points, it is still stored in the document information storage frame. It's time you can't.
[0087]
The example of FIG. 7 is a case where the importance of the number of lines is set higher than the font size. Of course, the importance of the font size can be set higher than the number of lines. The designer can set which one is given priority based on the layout concept.
The user information registration DB 40 generates and stores a flow management table 400 for managing flow objects as shown in FIG. 8 when laying out digital contents. FIG. 8 is a diagram illustrating the data structure of the flow management table 400.
[0088]
As shown in FIG. 8, the flow management table 400 registers one record for each flow object. Each record includes a field 402 for registering an article number for specifying a flow object, a field 404 for registering the start position (overflow position) of the flow object in the document information, and a document information storage frame in which the flow object is generated. A field 408 for registering the page number to which the page belongs (overflow source page number), a field 410 for registering the page number to which the document information storage frame storing the end of the flow object (the storage page number of the flow object) belongs, and the flow object And a field 412 for registering a processed flag indicating whether or not it is unprocessed.
[0089]
According to the flow management table 400, the flow object is processed by a FIFO (First In First Out) method. That is, for the flow object with the first overflow, the record is registered at the end of the flow management table 400, and the unprocessed flow object is processed in order from the top of the flow management table 400. However, as a result of processing an unprocessed flow object, if it overflows again without being stored in a new information storage frame, the record is exceptionally registered at the top of the flow management table 400 for that flow object. Is done. This is to prevent the content of the article from being distributed and distributed over a wide range of pages by registering it at the top and preferentially processing it.
[0090]
Next, the data structure of the important phrase registration DB 424 will be described in detail with reference to the drawings.
As shown in FIG. 9, the important phrase registration DB 42 stores an important phrase registration table 450 that registers important phrases in association with their appearance frequencies. FIG. 9 is a diagram showing the data structure of the important phrase registration table 450.
As shown in FIG. 9, the important phrase registration table 450 can register one record for each important phrase. Each record includes a field 452 for registering an important word / phrase and a field 454 for registering an appearance frequency.
[0091]
In the example of FIG. 9, in the first row record, “US simultaneous occurrence” is registered in the field 452 as an important word and “100” is registered in the field 454 as an appearance frequency. This means that the important phrase “US simultaneous occurrence” appears 100 times in digital content documents created so far. FIG. 9 shows an example in which an important word / phrase composed of three morphemes is registered in the important word / phrase registration table 450. However, the present invention is not limited to this, and an important word / phrase composed of two or more morphemes is important. May be registered in the important phrase registration table 450.
[0092]
Next, the data structure of the content data registration DB 44 will be described in detail with reference to the drawings.
In the content data registration DB 44, as shown in FIG. 1 ~ S n And a category correspondence table 340 indicating the correspondence between the main category / subcategory and category No. are stored. FIG. 10 shows the data structure of the content data and category number correspondence table 340. As shown in FIG.
[0093]
Content data providing terminal S 1 ~ S n As shown in FIG. 10A, the article number and the category number are attached to the content data provided from the content distribution terminal 100, and the content distribution terminal 100 classifies the content data for each category based on the category number. And is registered in the content data registration DB 44. At the time of registration, referring to the category number correspondence table 340, in addition to the article number and category number, the main category and sub category are added to the content data and registered. The content data is configured as one article including title information indicating the title of the article, image information relating to the image of the article, and document information relating to the text of the article.
[0094]
In the category number correspondence table 340, as shown in FIG. 10B, one record is registered for each main category and sub category. Each record includes a field 342 in which a category number is registered, a field 344 in which a main category is registered, and a field 346 in which a sub category is registered. In the example of FIG. 10B, “1102” is registered as the category number, “World News” is registered as the main category, and “USA” is registered as the subcategory in the first record. In the row record, “2010” is registered as the category number, “Sports” is registered as the main category, and “Baseball” is registered as the subcategory.
[0095]
Next, the configuration of the CPU 30 and the processing executed by the CPU 30 will be described with reference to FIGS. 11 and 12.
The CPU 30 includes a microprocessing unit MPU and the like, starts a predetermined program stored in a predetermined area of the ROM 32, and performs user registration processing and content distribution processing shown in the flowcharts of FIGS. 11 and 12 respectively according to the program. It is designed to run in splits.
[0096]
First, the user registration process will be described in detail with reference to FIG. FIG. 11 is a flowchart showing user registration processing.
The user registration process is a process for requesting a user who has accessed to input necessary user information such as a user ID and registering the input user information in the user profile table 300, and is executed in the CPU 30. First, as shown in FIG. 11, the process proceeds to step S100. In the following, all input in each step is performed by interactive communication with the user.
[0097]
In step S100, the main category and subcategory are input, the process proceeds to step S102, the user ID and password are input, the process proceeds to step S104, the distribution destination address is input, the process proceeds to step S106, the distribution date Then, the distribution time is input, and the process proceeds to step S108.
In step S108, the layout number is input, the process proceeds to step S110, the maximum number of pages is input, the process proceeds to step S114, and the user information input in steps S100 to S110 is registered in the user profile table 300. A series of processing is terminated and the original processing is restored.
[0098]
Next, the content distribution process will be described in detail with reference to FIG. FIG. 12 is a flowchart showing content distribution processing.
The content distribution process is a process of distributing digital content to the user terminal 200 with reference to the user profile table 300. When the content distribution process is executed in the CPU 30, first, as shown in FIG. 12, the process proceeds to step S200. It has become. Hereinafter, the processing of each step is processing for one record of the user profile table 300. Actually, the process of each step is executed by the number of records registered in the user profile table 300.
[0099]
In step S200, the distribution date and distribution time are read from the user profile table 300, the process proceeds to step S202, and it is determined whether or not the digital content should be distributed based on the read distribution date and distribution time. If it is determined that the date and time when the digital content should be distributed (Yes), the process proceeds to step S204. If not (No), the process proceeds to step S200.
[0100]
In step S204, the category number is read from the user profile table 300, the process proceeds to step S206, the content data in the content data registration DB 44 is searched based on the read category number, and matches the category number. The content data to which the category number is attached is searched, and the process proceeds to step S208.
In step S208, the layout number is read from the user profile table 300, the process proceeds to step S210, and the layout number correspondence table 330 is referred to, and the layout definition file corresponding to the read layout number is read from the user information registration DB 40. Read, move to step S212, and based on the read layout definition file, execute the automatic layout process for determining the output layout using the content data retrieved in step S206 and creating digital content, and move to step S214 To do.
[0101]
In step S214, the distribution destination address is read from the user profile table 300, the process proceeds to step S216, the created digital content is distributed to the read distribution destination address, a series of processing is terminated, and the original processing is restored. Let
Next, the automatic layout process in step S212 will be described in detail with reference to FIG. FIG. 13 is a flowchart showing the automatic layout process.
[0102]
When the automatic layout process is executed in step S212, the process proceeds to step S300 as shown in FIG.
In step S300, the first page of the layout definition area 360 of the layout definition file read in step S210 is set as a processing target, and the process proceeds to step S302 to determine the position of the fixed line that is fixedly arranged in the page. The process proceeds to step S304 to determine the shape and position of the fixed document information fixedly arranged in the page, and the process proceeds to step S306 to determine the fixed image information fixedly arranged in the page. The shape and position are determined, and the process proceeds to step S308.
[0103]
In step S308, the shape and position of the document information storage frame in which the flow object is stored are determined, the process of storing the flow object in the document information storage frame is executed, the process proceeds to step S310, and based on a predetermined priority order. The article to be arranged in the layout area 360 is selected from the content data searched in step S206, and the process proceeds to step S312.
In step S312, the shape and position of the title information storage frame is determined based on the selected article selected in step S310, the title information included in the selected article is stored in the title information storage frame, and the process proceeds to step S314. The process moves to determine the shape and position of the image information storage frame based on the selected article, stores the image information included in the selected article in the image information storage frame, and moves to step S316 to select Based on the article, the shape and position of the document information storage frame are determined, the process of storing the document information included in the selected article in the document information storage frame is executed, and the process proceeds to step S318.
[0104]
In step S318, it is determined whether or not there is an unprocessed information storage frame in the layout area 360. When it is determined that there is no unprocessed information storage frame (No), the process proceeds to step S320. It is determined whether or not the processing in steps S302 to S318 has been completed for all pages of the layout definition file read in step S210. If it is determined that the processing has been completed for all pages (Yes), the process proceeds to step S322. Then, a process for posting an unprocessed flow object is executed, a series of processes are terminated, and the original process is restored.
[0105]
On the other hand, when it is determined in step S320 that the processing in steps S302 to S318 has not been completed for all the pages of the layout definition file read in step S210 (No), the process proceeds to step S324 and is read in step S210. The next page of the layout area 360 of the layout definition file is set as a processing target, and the process proceeds to step S302.
On the other hand, when it is determined in step S318 that an unprocessed information storage frame exists in the layout area 360 (Yes), the process proceeds to step S310.
[0106]
Next, the storage processing in the document information storage frame in step S316 will be described in detail with reference to FIG. FIG. 14 is a flowchart showing the storage processing in the document information storage frame in step S316.
The storage process in the document information storage frame is a process for storing new document information in the document information storage frame. When the process is executed in step S316, as shown in FIG. 14, the process first proceeds to step S402. It is like that.
[0107]
In step S402, a morpheme analysis process for performing morpheme analysis on document information included in the selected article is executed. In the morpheme analysis process, the character string included in the selected article is divided into morphemes by morpheme analysis. For example, if the selected article contains the text “Memorial Meeting for Victims of Terrorist attacks in the United States”, if the morpheme analysis is performed on this, the string “|” It is divided into morphemes like “US | simultaneous | multi-attack | terrorism | victims | memorial | meeting | holding”. For morphological analysis, conventional general techniques can be employed.
[0108]
Next, the process proceeds to step S404, and an important phrase registration process is performed for acquiring the important phrase from the document information included in the selected article and registering it in the important phrase registration table 450, and the process proceeds to step S406 to be included in the selected article. A line feed candidate position setting process for setting a line feed candidate position for the character string to be executed is executed, and the process proceeds to step S408. In step S408, the number of characters of the document information included in the selected article is calculated, the process proceeds to step S410, the shape and position of the document information storage frame is determined based on the calculated number of characters, and the process proceeds to step S412 to select The document information included in the article is stored in the document information storage frame. Specifically, in step S410, the shape and position of the document information storage frame are determined so as not to overlap with other information storage frames whose shapes have already been determined. For example, if it overlaps with another information storage frame whose shape has already been determined, the document information storage frame is deformed / moved in a movable direction so as not to overlap with another information storage frame. . At this time, in order to avoid damaging the layout intended by the designer as much as possible, it is preferable to perform the deformation or movement so that the degree of deformation or movement of the document information storage frame is minimized. Further, the direction of deformation or movement may be determined dynamically or may be determined in advance.
[0109]
Next, the process proceeds to step S414, where it is determined whether or not the document information included in the selected article has been stored in the document information storage frame, and it is determined that the document information has been stored in the document information storage frame (not a flow). When it is (No), the series of processing is terminated and the original processing is restored.
On the other hand, when it is determined in step S414 that the document information included in the selected article cannot be stored in the document information storage frame (is a flow) (Yes), the process proceeds to step S416, and parameters of the document information storage frame are set. Based on the setting, it is determined whether or not the importance of the font size is set higher than the number of lines, and when it is determined that the importance of the font size is set higher (Yes) In step S418, priority is given to holding the initial value of the font size as much as possible, and document information is stored in the document information storage frame by adjusting the number of characters (hereinafter referred to as font size priority type storage processing). ) And the process proceeds to step S420.
[0110]
In step S420, it is determined whether or not the document information has been stored in the document information storage frame by the processing in steps S418 and S424, and when it is determined that the document information has been stored in the document information storage frame (not a flow) ( No) terminates the series of processes and returns to the original process, but when it is determined that it is not (the flow), the process proceeds to step S422 and the flow process is executed for the flow object. Then, the series of processes is terminated and the original process is restored.
[0111]
On the other hand, if it is determined in step S416 that the importance of the number of lines is set higher than the font size (No), the process proceeds to step S424, and the initial value of the number of lines is held as much as possible. Prioritizing this, a process of storing document information in the document information storage frame by adjusting the number of characters (hereinafter referred to as a line number priority type storage process) is executed, and the process proceeds to step S420.
Next, the important phrase registration processing in step S404 will be described in detail with reference to FIG. FIG. 15 is a flowchart showing important phrase registration processing.
[0112]
When the important phrase registration process is executed in step S404, as shown in FIG. 15, the process first proceeds to step S500.
In step S500, the current position of the pointer for searching the document information included in the selected article in units of morphemes is set to “0”, and the process proceeds to step S502, and the morpheme from the current position of the pointer to the end of the document information is set. It is determined whether or not the number is a predetermined number (for example, three) or more. If it is determined that the number of morphemes from the current position to the end of the document information is equal to or more than the predetermined number (Yes), the process proceeds to step S504. Then, a predetermined number of morpheme strings are acquired in the end direction starting from the current position of the pointer, and the process proceeds to step S506.
[0113]
In step S506, it is determined whether or not the same important phrase as the acquired morpheme string is registered in the important phrase registration table 450, and when it is determined that the same important phrase as the acquired morpheme string is not registered (No ) Shifts to step S508, registers the acquired morpheme string as an important phrase in the important phrase registration table 450, shifts to step S510, and sets the appearance frequency of the important phrase registered in step S508 to “1”. Then, the process proceeds to step S512, the current position of the pointer is set to the head position of the next morpheme, and the process proceeds to step S502.
[0114]
On the other hand, when it is determined in step S506 that the same important phrase as the acquired morpheme string is registered in the important phrase registration table 450 (Yes), the process proceeds to step S514, and the same important phrase as the acquired morpheme string is obtained. Add “1” to the appearance frequency of the phrase, and proceed to Step S512.
On the other hand, if it is determined in step S502 that the number of morphemes from the current position of the pointer to the end of the document information is less than the predetermined number (No), the series of processes is terminated and the original process is restored.
[0115]
Next, the line feed candidate position setting process in step S406 will be described in detail with reference to FIG. FIG. 16 is a flowchart showing the line feed candidate position setting process.
When the line feed candidate position setting process is executed in step S406, the process proceeds to step S600 as shown in FIG.
In step S600, a line feed candidate position and a priority are set for the character string included in the selected article based on the analysis result of the morphological analysis process in step S400. Specifically, in step S600, the end of each morpheme divided by the morpheme analysis process is set as a line feed candidate position. At this time, as shown in FIG. 17, the priority is set to the line feed candidate position according to the content of the morpheme. FIG. 17 is a table showing the correspondence between morpheme contents and line feed candidate position priorities.
[0116]
In the example of FIG. 17, when the morpheme is a punctuation mark, “9”, which is the highest priority for the line feed candidate position, is the second highest priority for the line feed candidate position when the morpheme includes an attached word. “8” is the third highest priority for the line feed candidate position when the morpheme is a predicate, and the fourth highest priority for the line feed candidate position when the morpheme is a noun. Set high “6” respectively. If the morpheme is in parentheses, the priority of the line feed candidate position is decremented by “5”, and if the morpheme violates the prohibition rule, the setting of the line feed candidate position is cancelled. This means that when a morpheme is a punctuation mark, a line break is most preferentially performed at the end of the morpheme. The reason why the line feed candidate position has a lower priority for the morphemes in the parenthesis is that the semantic ties of the morphemes tend to be strong in the parentheses.
[0117]
Therefore, referring to the table of FIG. 17, if priority is assigned to the character string after the forbidden processing, “US | (6) simultaneous | (6) frequent occurrence | (6) terrorism | (6) victims | (8) Memorial | (6) Meeting | (6) Held]. The parentheses indicate the priority of the line feed candidate position.
Next, the process proceeds to step S602, the first important word / phrase is read from the important word / phrase registration table 450, and the process proceeds to step S604 to determine whether or not the read important word / phrase is included in the document information. When it is determined that the word / phrase is included in the document information (Yes), the process proceeds to step S606, where it is determined whether the frequency of appearance of the read important word / phrase is equal to or higher than a predetermined value (for example, 80). When it is determined that the appearance frequency of the important word / phrase is equal to or higher than the predetermined value (Yes), the process proceeds to step S608.
[0118]
In step S608, the setting of the line feed candidate position set in the relevant important word / phrase included in the document information is canceled. For example, when the document information is “US | simultaneous | multiple occurrence | terrorism | terrorist | sacrifice | meeting | held”, referring to the key phrase registration table 450 in FIG. 9, “multiple US terrorism” and “multiple terrorism” Since the number of occurrences of the document information is 80 or more, the line feed candidate position of the document information is "US simultaneous terrorist attacks | victims | memorial | gathering | holding".
[0119]
Next, the process proceeds to step S610, where it is determined whether or not the processing of steps S604 to S608 and S614 to S620 has been completed for all the important words registered in the important word registration table 450, and the processing for all the important words is performed. When it is determined that the process has been completed (Yes), the series of processes is terminated and the process returns to the original process. When it is determined that the process is not (No), the process proceeds to step S604.
On the other hand, when it is determined in step S604 that the read important word / phrase is not included in the document information (No), the process proceeds to step S614 to fragment each morpheme constituting the read important word / phrase in that order. It is determined whether or not the included quasi-important phrase is included in the document information. If it is determined that the quasi-important phrase is included in the document information (Yes), the process proceeds to step S616.
[0120]
In step S616, the importance degree is calculated based on the appearance frequency of the important word / phrase related to the quasi-important word / phrase in the important word / phrase registration table 450 and the distance between the morphemes constituting the important word / phrase in the quasi-important word / phrase. Specifically, the importance level eval is calculated by the following equation (1).
[0121]
[Expression 1]
Figure 0004013539
[0122]
In the above formula (1), c is the number of morphemes constituting the important word / phrase registered in the important word / phrase registration table 450, and n is the appearance frequency of the important word / phrase registered in the important word / phrase registration table 450. Comb (a, b) represents the number of combinations for extracting b (a ≧ b) from a. S (i) is the i-th morpheme in the important phrase registered in the important phrase registration table 450, and P (S) is the appearance position of the morpheme S in the morpheme string of the character information to be evaluated ( If it does not appear, it takes an infinite value.)
[0123]
Hereinafter, the morpheme sequence to be evaluated in the character information is “multiple | simultaneous | US | terrorism”, and the important phrases registered in the important phrase registration table 450 and their appearance frequencies are “simultaneous | multiple | incidents” and 100 times. As an example, a calculation example of the importance eval will be described.
First, all combinations of two morphemes are acquired from “simultaneous | multiple occurrence | incident”. In this case, “simultaneous | multiple occurrences”, “multiple occurrences | incidents”, and “simultaneous | incidents” are acquired.
[0124]
In the case of “simultaneous | multiple occurrences”, the distance is “1” in comparison with “simultaneous | multiple incidents”, and in the comparison with “multiple | simultaneous | US | terrorism”, the distance is “−1”. Therefore, the importance level eval is “100/3” according to the above equation (1).
The importance eval can be calculated in the same manner in the case of “multiple occurrence | incident” and in the case of “simultaneous | incident”, but those morpheme sequences appear in “multiple occurrence | simultaneous | US | terrorism”. Therefore, both are set to “0” by the above formula (1).
[0125]
Then, the importance eval of “simultaneous | multiple occurrence | incident” is finally calculated by taking an average of the importance eval of “simultaneous | multiple occurrence”, “multiple | incident” and “simultaneous | incident”. Therefore, “100/9” is obtained.
Next, the process proceeds to step S618, where it is determined whether or not the calculated importance is greater than or equal to a predetermined value. When it is determined that the importance is greater than or equal to a predetermined value (Yes), the process proceeds to step S620 and the document information is determined. The setting of the line feed candidate position set in the corresponding quasi-important phrase included in is canceled, and the process proceeds to step S610.
[0126]
On the other hand, when it is determined in step S618 that the importance is less than a predetermined value (No), in step S614, when it is determined that the semi-important phrase is not included in the document information (No), and in step S606, the reading is performed. When it is determined that the appearance frequency of the important word / phrase is less than the predetermined value (No), the process proceeds to step S610.
Next, the font size priority type storage processing in step S418 will be described in detail with reference to FIG. FIG. 18 is a flowchart showing the font size priority type storage process.
[0127]
When the font size priority type storage process is executed in step S418, the process first proceeds to step S700 as shown in FIG.
In step S700, the initial value of the font size and the initial value of the number of lines are acquired from the parameters of the document information storage frame, the acquired initial values are set as the current font size and the number of lines, respectively, and the process proceeds to step S702. The lower limit value of the font size and the upper limit value of the number of lines are acquired from the parameters of the document information storage frame, and the process proceeds to step S704.
[0128]
In step S704, it is determined whether or not the current font size is less than the lower limit value. When it is determined that the current font size is greater than or equal to the lower limit value (No), the process proceeds to step S706, and the current line size is determined. It is determined whether or not the number exceeds the upper limit value. When it is determined that the current number of rows is equal to or less than the upper limit value (No), the process proceeds to step S708.
In step S708, a process for performing a line feed is executed based on the analysis results in steps S402 and S406, and the process proceeds to step S710 to determine whether or not the document information can be stored in the document information storage frame. If it is determined that the document information can be stored in (Yes), the process proceeds to step S712, the storage of the document information is returned to the original process, the series of processes is terminated, and the original process is restored. .
[0129]
On the other hand, when it is determined in step S710 that the document information cannot be stored in the document information storage frame (No), the process proceeds to step S714, the number of lines is increased by 1, and the process proceeds to step S706.
On the other hand, when it is determined in step S706 that the number of lines exceeds the upper limit value (Yes), the process proceeds to step S716, the font size is decreased by 1, and the process proceeds to step S718, where the current number of lines is reached. Is set to an initial value, and the process proceeds to step S704.
[0130]
On the other hand, when it is determined in step S704 that the font size is less than the lower limit value (Yes), the process proceeds to step S720, the document information storage failure is returned to the original process, and the series of processes ends. To return to the original process.
Next, the row number priority storage processing in step S424 will be described in detail with reference to FIG. FIG. 19 is a flowchart showing a row number priority type storage process.
When the row number priority type storage process is executed in step S424, as shown in FIG. 19, first, the process proceeds to step S800.
[0131]
In step S800, the initial value of the font size and the initial value of the number of lines are acquired from the parameters of the document information storage frame, the acquired initial values are set as the current font size and the number of lines, respectively, and the process proceeds to step S802. The lower limit value of the font size and the upper limit value of the number of lines are acquired from the parameters of the document information storage frame, and the process proceeds to step S804.
In step S804, it is determined whether or not the current number of lines exceeds the upper limit value, and when it is determined that the current number of lines is less than or equal to the upper limit value (No), the process proceeds to step S806, and the current font is determined. It is determined whether or not the size is less than the lower limit, and when it is determined that the current font size is greater than or equal to the lower limit (No), the process proceeds to step S808.
[0132]
In step S808, line feed processing is executed based on the analysis results in steps S402 and S406, and the process proceeds to step S810 to determine whether or not the document information can be stored in the document information storage frame. If it is determined that the document information can be stored in (Yes), the process moves to step S812, returns to the original process that the document information has been successfully stored, ends the series of processes, and returns to the original process. .
On the other hand, when it is determined in step S810 that the document information cannot be stored in the document information storage frame (No), the process proceeds to step S814, the font size is decreased by 1, and the process proceeds to step S806.
[0133]
On the other hand, when it is determined in step S806 that the font size is less than the lower limit (Yes), the process proceeds to step S816, the number of lines is increased by 1, and the process proceeds to step S818 to change the current font size. The initial value is set, and the process proceeds to step S804.
On the other hand, if it is determined in step S804 that the number of lines exceeds the upper limit value (Yes), the process proceeds to step S820 to return to the original process that the storage of the document information has failed, and a series of processes is performed. End and return to the original process.
[0134]
Next, the line feed processing in steps S708 and S808 will be described in detail with reference to FIG. FIG. 20 is a flowchart showing line feed processing.
When the line feed process is executed in steps S708 and S808, as shown in FIG. 20, first, the process proceeds to step S900.
In step S900, it is determined whether or not the line width is aligned so that the document information can be stored uniformly in all lines. If it is determined that the line width is aligned (Yes), the process proceeds to step S902, and the document information is stored. The number of characters is calculated by dividing the number of characters by the current number of lines, and a line feed is performed at a position closest to an integer multiple of the calculated number of characters among the line feed candidate positions set in step S406. Document information is stored in the document information storage frame, and the process proceeds to step S904. In the figure, in step S902, s indicates the number of characters in the document information, and l indicates the current number of lines.
[0135]
In step S904, it is determined whether or not the document information can be stored in the document information storage frame. If it is determined that the document information can be stored in the document information storage frame (Yes), the process proceeds to step S906, and the document information is stored. The fact that the storage was successful is returned to the original process, and a series of processes are terminated and the process returns to the original process.
On the other hand, when it is determined in step S904 that the document information cannot be stored in the document information storage frame (No), the fact that the storage of the document information has failed is returned to the original process, and the series of processes is terminated and the original process is completed. Return to.
[0136]
On the other hand, when it is determined in step S900 that the line widths are not uniform so that document information can be stored uniformly in all lines (No), a predetermined number of characters (for example, among the line feed candidate positions set in step S406) A line feed is performed at a position closest to an integer multiple of the initially set number of characters per line), the document information is stored in the document information storage frame, and the process proceeds to step S904.
Next, the flow process of step S422 will be described in detail with reference to FIG. FIG. 21 is a flowchart showing the flow process.
[0137]
When the flow process is executed in step S422, as shown in FIG. 21, first, the process proceeds to step S1000.
In step S1000, the head position of the flow object in the document information is calculated, and the process proceeds to step S1002, and whether or not a record in which the processing flag is cleared and the same article number is registered exists in the flow management table 400. If it is determined that there is no record in which the processing flag is cleared and the same article number is registered (No), the process proceeds to step S1004 to generate a record for the flow object, and the generated record Is registered at the end of the flow management table 400, a series of processing is terminated, and the original processing is restored. Specifically, in step S1004, the article number of the flow object is registered in the field 402, the head position calculated in step S1000 is registered in the field 404, the current page number is registered in the field 408, and the processed flag is cleared. By doing so, a record for the flow object is generated. This is the same in the process of step S1006.
[0138]
On the other hand, if it is determined in step S1002 that a record in which the processing flag is cleared and the same article number is registered exists in the flow management table 400 (Yes), the process proceeds to step S1006, and a record for the flow object is displayed. Generate and execute the same processing as step S514 for the corresponding record, register the generated record at the head of the flow management table 400, end the series of processing, and return to the original processing.
[0139]
Next, the storage processing in the document information storage frame in step S308 will be described in detail with reference to FIG. FIG. 22 is a flowchart showing the storage processing in the document information storage frame in step S308.
The storage process in the document information storage frame is a process of storing the flow object in the document information storage frame. When the flow object is executed in step S308, as shown in FIG. 22, first, the process proceeds to step S1100. It has become.
[0140]
In step S1100, the flow object is read by referring to the corresponding record in the flow management table 400, the process proceeds to step S1102, the morphological analysis process similar to that in step S402 is executed, the process proceeds to step S1104, and the above step S404 is performed. The important word / phrase registration process is executed, and the process proceeds to step S1106, the line feed candidate position setting process similar to that in step S406 is executed, and the process proceeds to step S1108.
[0141]
In step S1108, the number of characters of the read flow object is calculated, the process proceeds to step S1110, the shape and position of the document information storage frame is determined based on the calculated number of characters, the process proceeds to step S1112, and the read flow object is read. Is stored in the document information storage frame, the flow object storage page number is set to the current page number and the processed flag is set in the corresponding record of the flow management table 400, and the process proceeds to step S1114.
[0142]
In step S1114, it is determined whether or not the read flow object has been stored in the document information storage frame, and it is determined that the flow object has been stored in the document information storage frame (not a flow) (No). Finishes a series of processing and returns to the original processing.
On the other hand, if it is determined in step S1114 that the read flow object cannot be stored in the document information storage frame (is a flow) (Yes), the process proceeds to step S1116 to set parameters for the document information storage frame. Based on this, it is determined whether or not the importance of the font size is set higher than the number of lines, and when it is determined that the importance of the font size is set higher (Yes), step S1118. Then, the same font size priority type storage process as in step S418 is executed, and the process proceeds to step S1120.
[0143]
In step S1120, it is determined whether or not the flow object has been stored in the document information storage frame by the processing in steps S1118 and S1124, and when it is determined that the flow object has been stored in the document information storage frame (not a flow) ( No) ends the series of processes and returns to the original process, but when it is determined that it is not (a flow) (Yes), the process proceeds to step S1122, and the flow object is changed to the above-described step S422. A similar flow process is executed to end a series of processes and return to the original process.
[0144]
On the other hand, when it is determined in step S1116 that the importance of the number of lines is set higher than the font size (No), the process proceeds to step S1124, and the number-of-liness-priority storage similar to step S424 is performed. The process is executed, and the process proceeds to step S1120.
Next, the processing of the unprocessed flow object in step S322 will be described in detail with reference to FIG. FIG. 23 is a flowchart showing processing of an unprocessed flow object.
[0145]
When the process of the unprocessed flow object is executed in step S322, as shown in FIG. 23, first, the process proceeds to step S1200.
In step S1200, the flow frame management table 400 is searched in order from the top, and it is determined whether there is a record with the processed flag cleared, and it is determined that there is a record with the processed flag cleared. If (Yes), the process proceeds to step S1202, but if not (No), the series of processes is terminated and the original process is restored.
[0146]
In step S1202, a new page layout area 360 is added, and the process proceeds to step S1204. As in step S308, the shape and position of the document information storage frame for storing the flow object are determined, and the flow object is stored in the document. The process of storing in the information storage frame is executed, and the process proceeds to step S1206 to determine whether or not there is an unprocessed information storage frame in the layout area 360, and it is determined that there is an unprocessed information storage frame. If (Yes), the process proceeds to step S1204. If not (No), the process proceeds to step S1200.
[0147]
Next, the operation of the present embodiment will be described with reference to FIG. FIG. 24 is a diagram showing a layout result.
First, a case where information necessary for distributing digital contents is registered will be described.
When the user wishes to distribute digital content, the user accesses the content distribution terminal 100 through the WWW browser at the user terminal 200 and inputs a user registration request.
[0148]
In the user terminal 200, when a user registration request is input, a request for inputting necessary user information is made to the user through communication with the content distribution terminal 100. Here, in response to the input request, the user inputs the main category, subcategory, user ID, password, distribution destination address, distribution date, distribution time, layout number, and maximum number of pages as user information. Information is transmitted to the content distribution terminal 100.
[0149]
In the content distribution terminal 100, when user information is received in response to a registration request, the received user information is registered in the user profile table 300 through steps S100 to S114.
Next, a case where digital content is distributed with reference to the user profile table 300 will be described.
In the content distribution terminal 100, when it is time to distribute digital content with reference to the user profile table 300, the category number is read from the user profile table 300 through steps S204 and S206, and the read category number is read out. The content data in the content data registration DB 44 is searched based on. As a result, when content data with a category number that matches the category number is retrieved, the layout number is read from the user profile table 300 through steps S208 to S210, and the layout number correspondence table. Referring to 330, the layout definition file corresponding to the read layout number is read from the user information registration DB 40. Then, through step S212, based on the read layout definition file, the output layout is determined using the retrieved content data, and digital content is created.
[0150]
In the layout process, through steps S300 to S310, the position of the fixed line, the shape and position of the fixed document information, and the shape and position of the fixed image information are determined in that order, and step S206 is performed based on a predetermined priority order. Articles to be arranged in the layout area 360 are selected from the content data searched in step (b).
If the selected article includes title information, the title information included in the selected article is stored in the title information storage frame through step S312. Specifically, the information amount of the title information included in the selected article is calculated, the shape and position of the title information storage frame is determined based on the calculated information amount, and the title information included in the selected article is the title information. Stored in the storage frame.
[0151]
If image information is included in the selected article, the image information included in the selected article is stored in the image information storage frame through step S314. Specifically, the information amount of the image information included in the selected article is calculated, and the shape and position of the image information storage frame are determined based on the calculated information amount so as not to overlap with other information storage frames. The image information included in the selected article is stored in the image information storage frame.
If the selected article includes document information, the document information included in the selected article is stored in the document information storage frame through step S316. Specifically, through steps S402 to S406, the character string included in the selected article is divided into morphemes by morpheme analysis, and an important word / phrase registration process and a line feed candidate position setting process are executed based on the morpheme analysis result.
[0152]
First, in the key word registration process, through steps S500 to S504, the current position of the pointer is set to “0”, and a predetermined number of morpheme strings are acquired in the end direction starting from the current position of the pointer. Next, if the same important phrase as the acquired morpheme string is not registered in the important phrase registration table 450, the acquired morpheme string is registered as an important phrase in the important phrase registration table 450 through steps S508 and S510. The appearance frequency of the registered important word / phrase is set to “1”. On the other hand, if the same important phrase as the acquired morpheme string is registered in the important phrase registration table 450, the appearance frequency of the same important phrase as the acquired morpheme string is incremented by “1” through step S514. Is done.
[0153]
In any case, the current position of the pointer is set to the head position of the next morpheme until the number of morphemes from the current position of the pointer to the end of the document information becomes less than a predetermined number, and the processing of steps S504 to S514 is performed. Repeatedly executed.
As a result, important phrases according to the relatively latest situation and topic are registered in the important phrase registration table 450.
Next, in the line feed candidate position setting process, after step S600, the end of each morpheme divided by the morpheme analysis process is set as a line feed candidate position, and the priority is set to the line feed candidate position according to the contents of the morpheme. Next, through steps S602 and S604, the first important word / phrase is read from the important word / phrase registration table 450, and it is determined whether or not the read important word / phrase is included in the document information. As a result, if it is determined that the important word / phrase is included in the document information, if the appearance frequency of the read important word / phrase is greater than or equal to a predetermined value through steps S606 and S608, the corresponding information included in the document information. The setting for the line feed candidate position set in the important word is canceled.
[0154]
If it is determined that the read important word / phrase is not included in the document information, a quasi-important word / phrase that includes the morphemes constituting the read important word / phrase in a fragmented order in step S614 is obtained. It is determined whether it is included in the document information. As a result, when it is determined that the semi-important phrase is included in the document information, the importance is calculated by the above equation (1) through step S616. At this time, if it is determined that the calculated importance is greater than or equal to a predetermined value, the setting for the line feed candidate position set in the corresponding semi-important phrase included in the document information is canceled through step S620. .
[0155]
In any case, these processes are repeatedly executed until the processes of steps S604 to S608 and S614 to S620 are completed for all the important phrases registered in the important phrase registration table 450.
As a result, line breaks in the important words / phrases whose appearance frequency is greater than or equal to a predetermined value and quasi-important words / phrases whose importance is greater than or equal to a predetermined value are prohibited in the subsequent line break process.
[0156]
Next, the number of characters of the document information included in the selected article is calculated through steps S408 to S412. Based on the calculated number of characters, the shape and position of the document information storage frame so as not to overlap with other information storage frames. The document information included in the selected article is stored in the document information storage frame. At this time, if it is determined that the document information cannot be stored in the document information storage frame, either font size priority type storage processing or line number priority type storage processing is performed through steps S418 and S424, and the document information is stored. The number of characters is adjusted so that document information can be stored in the storage frame as much as possible.
[0157]
The font size priority type storage process is performed when the importance of the font size is set higher than the number of lines in the document information storage frame. When the font size priority type storage processing is performed, the initial value of the font size and the initial value of the number of lines are acquired through steps S700 and S702, and the acquired initial values are set as the current font size and the number of lines, respectively. The lower limit value of the font size and the upper limit value of the number of lines are acquired.
[0158]
Next, steps S706, S708, S710, and S714 are repeated, and storage of document information is attempted until the document information can be stored in the document information storage frame while increasing the number of rows one by one with the acquired upper limit as a limit. The When the number of lines reaches the upper limit value and still cannot be stored, the font size is decreased by one, and storage of the document information is retried while increasing the number of lines one by one from the initial value to the upper limit value. This iterative process is repeated until the font size reaches the acquired lower limit value through steps S706, S716, and S718. That is, in the font size priority type storage process, as shown in FIG. 24A, by trying to store document information while increasing the number of lines, and by still reducing the font size when it cannot be stored, Priority is given to keeping the initial font size as much as possible. At the same time, in FIG. 24A, it can be seen that line breaks are prohibited in the important words “US simultaneous frequent occurrence” and “simultaneous frequent terrorism”, and they are stored in the same line.
[0159]
If the font size reaches the lower limit but cannot be stored yet, a record for the flow object is registered at the end of the flow management table 400 through steps S420, S422, and S1000 to S1004.
On the other hand, the line number priority type storage process is performed when the importance of the number of lines is set higher than the font size in the document information storage frame. When the line number priority type storage process is performed, the initial value of the font size and the initial value of the number of lines are acquired through steps S800 and S802, and the acquired initial value is set as the current font size and the number of lines, respectively. The lower limit value of the font size and the upper limit value of the number of lines are acquired.
[0160]
Next, through steps S806, S808, S810, and S814, the storage of the document information is attempted until the document information can be stored in the document information storage frame while decreasing the font size one by one with the acquired lower limit as a limit. The If the font size reaches the lower limit but cannot be stored yet, the number of lines is increased by one, and storage of the document information is retried while decreasing the font size by one from the initial value to the lower limit. This iterative process is repeated until the number of rows reaches the acquired upper limit value after repeating steps S806, S816, and S818. That is, in the line number priority type storage process, as shown in FIG. 24B, by trying to store the document information while reducing the font size, and when the storage is still impossible, the number of lines is increased for the first time. Priority is given to keeping the initial number of rows as much as possible. At the same time, in FIG. 24 (b), it can be seen that line breaks in the important words “US simultaneous multiple occurrences” and “simultaneous multiple terrorisms” are prohibited and stored in the same line.
[0161]
If the number of rows reaches the upper limit value and still cannot be stored, a record for the flow object is registered at the end of the flow management table 400 through steps S420, S422, S1000 to S1004.
Then, the storage processing in the title information storage frame, the storage processing in the image information storage frame, and the storage processing in the document information storage frame are repeated until there is no unprocessed information storage frame in the layout area 360. Executed. As a result, articles are arranged in the layout area 360 of one page.
[0162]
Next, when there is no unprocessed information storage frame in the layout area 360, the next page of the layout area 360 of the layout definition file read in step S210 is processed as a processing target through step S324. Is set, storage processing in the document information storage frame for storing the flow object is executed for the layout area 360 of the page, storage processing in the title information storage frame, storage processing in the image information storage frame, and document information storage frame In the same manner as described above, the storage process in is repeatedly executed until there is no unprocessed information storage frame in the layout area 360.
[0163]
In the flow object storage process, if a flow object exists, the flow object is stored in the document information storage frame through step S308. Specifically, the flow object is read out through steps S1100 to S1106, the character string included in the flow object is divided into morphemes by morpheme analysis, and based on the morpheme analysis result, the important phrase registration process and the line feed candidate position Setting processing is executed.
[0164]
Then, the number of characters of the read flow object is calculated through steps S1108 to S1112. Based on the calculated number of characters, the shape and position of the document information storage frame are determined so as not to overlap with other information storage frames. Then, the document information included in the selected article is stored in the document information storage frame. At this time, if it is determined that the document information cannot be stored in the document information storage frame, the font size priority type storage process or the line number priority type storage process is performed through steps S1118 and S1124, and the document information is stored. The number of characters is adjusted so that document information can be stored in the storage frame as much as possible. The number of characters is adjusted in the same manner as described above.
[0165]
In the font size priority type storage process, even if the font size reaches the lower limit value, in the line number priority type storage process, even if the number of lines reaches the upper limit value, storage is still not possible, step S1120, Through S1122, S1000, S1002, and S1006, a record for the flow object is registered at the top of the flow management table 400.
On the other hand, the storage processing in the document information storage frame for storing such a flow object, the storage processing in the title information storage frame, the storage processing in the image information storage frame, and the storage processing in the document information storage frame are repeated. The process is executed for all pages of the layout definition file read in step S210. As a result, articles are arranged in the layout area 360 of all pages, and the output layout of the digital content is determined. When the output layout is determined, the distribution destination address is read from the user profile table 300 through steps S222 and S224, and the created digital content is distributed to the read distribution destination address.
[0166]
If there is an unprocessed flow object after processing the layout area 360 for all the pages of the layout definition file read in step S210, the process continues to step S1202 until there is no unprocessed flow object. Step S1206 is repeated, a new page layout area 360 is added, a document information storage frame for storing the flow object is arranged in the new layout area 360, and the shape of the document information storage frame is determined based on the number of characters of the flow object. And the position are determined, and the flow object is stored in the document information storage frame.
[0167]
In this way, in the present embodiment, the content distribution terminal 100, when the important word / phrase in the important word / phrase registration DB 42 is included in the document information, or each morpheme constituting the important word / phrase in the important word / phrase registration DB 42 in that order. In the document information storage frame, line breaks in the important words or quasi-important phrases are prohibited when the document information includes fragmented quasi-important words.
As a result, line breaks in important words or quasi-important words are prohibited in the document information storage frame. Therefore, if important words corresponding to the latest situation or topic are registered in the important word registration DB 42, it is compared with the conventional case. Thus, even a digital content that conforms to the latest situation or topic can be relatively improved in readability.
[0168]
Furthermore, in the present embodiment, the content distribution terminal 100 acquires a word / phrase from document information in units of a plurality of continuous morphemes, and registers the acquired word / phrase in the important word / phrase registration DB 42 as an important word / phrase in association with the appearance frequency. If the document information includes important words / phrases in the important word / phrase registration DB 42 that have a frequency of occurrence of a predetermined value or more, line breaks within the important words / phrases are prohibited in the document information storage frame.
As a result, every time digital content is created, important phrases corresponding to the relatively latest situation and topic are registered in the important phrase registration DB 42, so that the registration work in the important phrase registration DB 42 can be reduced. In addition, since the important phrase corresponding to the relatively latest situation or topic can be held in the important phrase registration DB 42, the readability of the digital content having the contents corresponding to the latest situation or topic can be further improved.
[0169]
Furthermore, in the present embodiment, when the quasi-important words / phrases are included in the document information, the content distribution terminal 100 causes the appearance frequency of the important words / phrases related to the quasi-important words / phrases in the important word / phrase registration DB 42, and the quasi Importance is calculated based on the distance between each morpheme that constitutes an important word in the important word, and when the calculated importance is greater than or equal to a predetermined value, line breaks in the semi-important word are prohibited in the document information storage frame. It has become.
[0170]
This prohibits line breaks in semi-important words and phrases that are relatively important from being difficult to read because excessive line breaks are prohibited. .
Further, in the present embodiment, the content distribution terminal 100 adjusts the number of characters stored in the document information storage frame by changing the parameter value relating to the font size or the number of lines within the allowable change range.
[0171]
As a result, if the designer sets the allowable change range for the parameters that affect the number of characters stored in the document information storage frame, the document information cannot be stored in the document information storage frame. The number of characters stored in the document information storage frame is adjusted within the permissible change range, so the layout intended by the designer can be damaged by the number of characters in the document information without deviating from the designer's intention. Can be reduced. In particular, with respect to the font size and the number of lines, the possibility that the layout intended by the designer is damaged can be reduced.
[0172]
Furthermore, in the present embodiment, the content distribution terminal 100 stores the document information as much as possible in the document information storage frame when the parameter related to the font size is designated as a parameter that is less important than the parameter related to the number of lines. As can be done, the parameter value relating to the font size is preferentially changed within the allowable change range.
Thereby, maintenance of the number of lines can be prioritized over the font size, so that the possibility that the layout intended by the designer is impaired with respect to the number of lines can be further reduced.
[0173]
Furthermore, in the present embodiment, the content distribution terminal 100 stores the document information as much as possible in the document information storage frame when the parameter related to the number of lines is designated as a parameter that is less important than the parameter related to the font size. As can be done, the parameter value related to the number of rows is preferentially changed within the allowable change range.
Thereby, maintenance of the font size can be prioritized over the number of lines, so that the possibility that the layout intended by the designer is damaged for the font size can be further reduced.
[0174]
Furthermore, in the present embodiment, the content distribution terminal 100 arranges articles in all layout areas 360 defined by the layout definition file, and if an unprocessed flow object exists, a new layout area 360 is created. Is added, a document information storage frame is arranged in the added new layout area 360, and an unprocessed flow object is stored in the arranged document information storage frame.
[0175]
As a result, leakage of content data to be posted can be reduced. Furthermore, in the present embodiment, the content distribution terminal 100 repeatedly adds a new layout area 360, arranges flow objects, and stores flow objects until there is no unprocessed flow object. .
As a result, leakage of content data to be posted can be further reduced.
[0176]
Further, in the present embodiment, when the document information storage frame storing the flow object overlaps with another information storage frame, the content distribution terminal 100 overlaps the document information storage frame storing the flow object. The shape and position of other information storage frames are determined so as not to be present.
Thereby, it is possible to preferentially arrange the flow object over the arrangement of information stored in other information storage frames.
[0177]
Further, in the present embodiment, the content distribution terminal 100 searches the content data from the content data registration DB 44 based on the user information in the user information registration DB 40.
As a result, the user's unique information and the user's designation information are referenced with respect to the selection of the content data, so that it is possible to create digital content with content that is relatively in line with the user's wishes.
[0178]
Furthermore, in the present embodiment, the content distribution terminal 100 determines the output layout using content data based on the user information in the user information registration DB 40 and creates digital content.
Thereby, since the user's specific information and the user's designation information are referred to regarding the determination of the output layout, it is possible to create digital contents with an output layout that is relatively in line with the user's wishes.
[0179]
Further, in the present embodiment, the content distribution terminal 100 stores the title information storage frame, the image information storage frame, and the document information storage so as to have a minimum size necessary for storing title information, image information, or document information. The shape of the frame is determined.
Thereby, title information, image information, or document information can be efficiently stored in the title information storage frame, image information storage frame, or document information storage frame.
[0180]
Furthermore, in the present embodiment, the content distribution terminal 100 determines the shape and position of the information storage frame in the order of the title information storage frame, the image information storage frame, and the document information storage frame.
As a result, the layout can be determined in the order in which the layout should be emphasized, so that digital content can be created with an output layout that is relatively easy to see.
[0181]
Further, in this embodiment, when the document information cannot be stored in the document information storage frame, the content distribution terminal 100 registers the article number and overflow position for the flow object in the flow management table 400, and the flow object is stored in the flow information table. When storing in the document information storage frame, the article number and overflow position are read from the flow management table 400, and the flow object is stored in the document information storage frame based on the read article number and overflow position.
[0182]
Thereby, since flow objects can be arranged regularly to some extent, digital contents can be created with an output layout that is easier to see.
Furthermore, in the present embodiment, the content distribution terminal 100 performs registration in the flow management table 400 from the end and performs reading from the flow management table 400 from the beginning.
[0183]
Accordingly, since flow objects can be arranged more regularly, digital content can be created with an output layout that is easier to see.
Furthermore, in the present embodiment, the content distribution terminal 100 performs registration in the flow management table 400 from the beginning of the flow object for which the same document information is registered in the flow management table 400 for the second time and thereafter. It has become.
[0184]
As a result, the flow objects registered for the second time or later can be preferentially arranged for the same document information, so that the content of the document information can be prevented to some extent from being distributed over a wide number of pages.
Furthermore, in the present embodiment, the content distribution terminal 100 sets the processed flag when the end of the flow object is stored in the document information storage frame, and sets the processing flag when storing the flow object in the document information storage frame. The article number and overflow position of the record with the completed flag cleared are read from the flow management table 400.
[0185]
Thereby, the processing of the flow object using the flow management table 400 becomes relatively easy.
In the above embodiment, the user information registration DB 40 corresponds to the user information storage means described in the present invention, the important phrase registration DB 42 corresponds to the important phrase storage means described in the present invention, and the content data registration DB 44 includes This corresponds to the content data storage means described in the present invention. Step S206 corresponds to the content data selection means described in the present invention, and step S212 corresponds to the content creation means described in the present invention or the content creation step described in the present invention.
[0186]
Further, in the above embodiment, steps S404 and S1104 correspond to the key word registration means described in the present invention, and the parameters related to the font size and the number of lines correspond to the specific parameters described in the present invention and relate to the font size. The parameters correspond to the font parameters described in the present invention. The parameter relating to the number of lines corresponds to the character spacing parameter described in the present invention.
[0187]
In the above embodiment, the content distribution terminal 100 is configured to prohibit line breaks in important words or semi-important words in the document information storage frame. However, the content distribution terminal 100 is not limited to this, and is important in the document information storage frame. You may comprise so that the pitch between the characters of a phrase or a semi-important phrase may be changed. Moreover, you may comprise so that an important phrase or a semi-important phrase may be substituted by another synonym or another notation. Further, the color, font size, font type, number of lines, number of characters per line, pitch between lines, or pitch between characters of the important phrase or quasi-important phrase may be changed. Moreover, you may comprise so that the supplementary description about an important phrase or a semi-important phrase may be inserted in a document.
[0188]
Further, in the above embodiment, the content distribution terminal 100 is configured to perform determination as to whether or not an important phrase is included in the document information and registration of the important phrase using the important phrase registration table 450. However, the present invention is not limited to this, and it may be configured to use TF-IFD or n-gram.
Further, in the above embodiment, the content distribution terminal 100 registers important words in association with their appearance frequencies, and the document information includes important words in the important word registration DB 42 that have a frequency of occurrence of a predetermined value or more. In the document information storage frame, line breaks in key words are prohibited, but this is not a limitation, and the frequency of appearance is not simply calculated from the past, but changes in time are taken into account. If the frequency of appearance is weighted so that the priority is higher as it is closer to the present time, and the most recent appearance frequency of the important word / phrase registration DB 42 is greater than or equal to a predetermined value, the document information You may comprise so that the new line in an important word may be prohibited in a storage frame.
[0189]
Moreover, in the said embodiment, although the content delivery terminal 100 was comprised so that an important phrase might be acquired from document information, when the keyword showing the content is added not only to this but content data, The keyword may be registered in the important phrase registration DB 42 as an important phrase. In this case, line feed is prohibited regardless of the appearance frequency. For example, an associative character string (which may include a phrase) that represents the field of the article may be given together with the title character string of the newspaper article. In the next example, the “US terrorist incident” is registered in the important phrase registration DB 42 as an important phrase.
Example)
<Title> President participates in a memorial service for victims in New York </ title>
<Keyword> US terrorist case </ keyword>
Further, in the above embodiment, deletion of important words / phrases was not particularly described. However, from the viewpoint of suppressing an increase in data capacity, for example, important words / phrases whose appearance frequency did not exceed a predetermined value within a predetermined period. May be deleted from the important phrase registration table 450.
[0190]
In the above embodiment, the processing speed of the layout has not been particularly described. However, if the number of registrations in the important phrase registration table 450 increases, the execution time of the process increases accordingly. For example, it is important for every predetermined period. A word / phrase registration table 450 is created, the key word / phrase registration table 450 is selected according to the creation time of the content data searched in step S206, and the document is shaped or modified by referring to the key word / phrase registration table 450 selected. You may comprise.
[0191]
Further, in the above embodiment, the content distribution terminal 100 handles a morpheme string composed of a plurality of morphemes as an important phrase, but when handling a relatively long important phrase, it is extremely large in one line in the document information storage frame. The character will be accommodated and lacks balance with the previous and next lines. Therefore, if there is no problem with the layout even if the balance is bad, such as the title character string in the title information storage frame, leave it as it is, and correct the problem with the following two methods for the character string in the document information storage frame. can do.
[0192]
First, the space between characters is widened for a short line compared to a line containing a relatively long important word / phrase. Second, for lines containing relatively long key words, line breaks are allowed within the key words.
Further, in the above embodiment, the content distribution terminal 100 is configured to designate one of the parameter relating to the font size and the parameter relating to the number of lines in the layout definition file as a low importance parameter. The user profile table 300 may be designated. That is, the user information includes importance designation information that designates either a parameter relating to the font size or a parameter relating to the number of lines as a low importance parameter, and is based on the importance designation information included in the user information in the user information registration DB 40. Then, the value of either the font size parameter or the line number parameter is preferentially changed.
[0193]
This makes it possible to create digital content with an output layout that is relatively in line with the user's wishes while reducing the possibility that the layout intended by the designer will be damaged.
In the above embodiment, the content distribution terminal 100 is configured to specify the lower limit value of the font size in the layout definition file. However, the present invention is not limited to this, and the content distribution terminal 100 may be configured to specify in the user profile table 300. Good. That is, the user information includes range designation information that designates the lower limit value of the parameter relating to the font size as the change allowable range, and the parameter value relating to the font size is set based on the range designation information included in the user information of the user information registration DB 40. change.
[0194]
This makes it possible to create digital content with an output layout that is relatively in line with the user's desire for font size.
In the above embodiment, the content distribution terminal 100 is configured to specify the upper limit of the number of lines in the layout definition file. However, the content distribution terminal 100 is not limited to this, and may be configured to be specified in the user profile table 300. Good. That is, the user information includes range designation information that designates the upper limit value of the parameter relating to the number of lines as the change allowable range, and the parameter value relating to the number of lines is set based on the range designation information included in the user information of the user information registration DB 40. change.
[0195]
This makes it possible to create digital content with an output layout that is relatively in line with the user's desire for the number of rows.
In the above embodiment, the content distribution terminal 100 is configured to change the value of the parameter relating to the font size or the number of lines. However, the present invention is not limited to this, and the number of characters per line in the document information storage frame and the line spacing pitch are not limited thereto. Alternatively, it is also possible to change the parameter value related to the setting of the size, shape, or arrangement position of the parameter related to the pitch between characters or the information storage frame (document information storage frame, image information storage frame or other information storage frame). Good.
[0196]
In the above embodiment, the content distribution terminal 100 is configured to preferentially change any value of the parameter relating to the font size or the number of lines. May be configured to be changed.
Further, in the above embodiment, the content distribution terminal 100 is configured to change the parameter value related to the font size or the number of lines. However, the present invention is not limited to this, and only the parameter value related to the font size or the parameter related to the number of lines is used. It may be configured to change only the value of.
[0197]
In the above embodiment, when the document information storage frame storing the flow object and another information storage frame overlap each other, the content distribution terminal 100 overlaps the document information storage frame storing the flow object. However, the present invention is not limited to this, and the document information storage frame storing the flow object and the other information storage frame overlap each other. The shape and position of the document information storage frame that stores the flow object may be determined so as not to overlap with other information storage frames. Specifically, in step S1110, the same process as in step S410 may be executed.
[0198]
Thereby, the arrangement of information stored in another information storage frame can be preferentially performed rather than the arrangement of flow objects.
Further, in the above embodiment, when the information storage frame overflows without being stored in the information storage frame in the layout process, the information storage frame in which overflow has occurred is displayed to indicate that it has overflowed. However, the present invention is not limited to this, and guidance information for referring to the flow object in the overflowed information storage frame (for example, “Continued To Page 3” when the flow object storage frame is on page 3) May be stored. Further, in this case, the link destination information indicating the link destination to the flow object storage frame storing the flow object may be stored together with the guide information.
[0199]
As a result, when the user who received the distribution of the digital content clicks the guide information with a mouse or the like, the user can jump to a location corresponding to the arrangement position of the flow object and refer to it based on the link destination information.
Further, in the above embodiment, when the data is overflowed without being stored in the information storage frame in the layout process, the flow object storage frame storing the flow object is displayed to indicate that it has overflowed. However, the present invention is not limited to this. Guidance information for referencing an object in the information storage frame that has overflowed into the flow object storage frame that stores the flow object (for example, the information storage frame in which overflow has occurred) May be configured to store “Continued From Page 1”). Further, in this case, the link destination information indicating the link destination to the information storage frame where the overflow has occurred may be stored together with the guide information.
[0200]
As a result, when the user who receives the distribution of the digital content clicks the guidance information with a mouse or the like, the user jumps to a location corresponding to the object arrangement position of the overflowed information storage frame based on the link destination information, and refers to it. can do. In the above embodiment, the content distribution terminal 100 is configured to handle document information as a flow object. However, the present invention is not limited to this, and the content distribution terminal 100 may be configured to handle title information or image information. However, since it is not desirable that the title information or image information overflows from the title information storage frame or the image information storage frame, it may be preferable in terms of layout that the flow processing such as document information is not performed.
[0201]
In the above embodiment, the content distribution terminal 100 is configured to determine the shape and position of the information storage frame in the order of the title information storage frame, the image information storage frame, and the document information storage frame. The configuration and the position of the information storage frame may be determined in any order. Further, the order of determining the shape and position may be registered in the user profile table 300 as user information.
[0202]
In the above embodiment, the content distribution terminal 100 is configured to perform the layout while dynamically determining the shape and position of the information storage frame. However, the present invention is not limited to this, and all information in the layout area 360 is also configured. It may be configured to perform layout by temporarily storing information in the storage frame and then determining the shape and position of each information storage frame.
In the above embodiment, the content distribution terminal 100 is configured to determine the output layout of the digital content based on the user information. However, the present invention is not limited to this, and the number of images included in the content data or the content data The output layout of the digital content may be determined based on the amount of document information included in.
[0203]
Thus, even if the number of images included in the content data or the amount of document information included in the content data is large or conversely small, an output layout that is relatively easy to view can be achieved.
Moreover, in the said embodiment, although it comprised so that the layout process of step S212 might be performed with the content delivery terminal 100, you may comprise so that not only this but these layout processes may be performed with the user terminal 200. .
[0204]
As a result, the concentration of processing load on the content distribution terminal 100 can be reduced.
Further, in the above embodiment, when executing the processing shown in the flowcharts of FIGS. 11 to 16 or FIGS. 18 to 23, the case where the control program stored in advance in the ROM 32 is executed has been described. However, the present invention is not limited to this, and the program may be read into the RAM 34 and executed from a storage medium storing the program showing these procedures.
[0205]
Here, the storage medium is a semiconductor storage medium such as RAM or ROM, a magnetic storage type storage medium such as FD or HD, an optical reading type storage medium such as CD, CDV, LD, or DVD, or a magnetic storage type such as MO. / Optical reading type storage media, including any storage media that can be read by a computer regardless of electronic, magnetic, optical, or other reading methods.
In the above embodiment, the document shaping system, the digital content creation system, the document shaping program, the digital content creation program, the document shaping method, and the digital content creation method according to the present invention are applied to a network system including the Internet 199. However, the present invention is not limited to this. For example, the present invention may be applied to a so-called intranet that performs communication using the same method as the Internet 199. Of course, the present invention is not limited to a network that performs communication in the same manner as the Internet 199, and can be applied to a normal network.
[0206]
In the above embodiment, the document shaping system, the digital content creation system, the document shaping program and the digital content creation program, the document shaping method and the digital content creation method according to the present invention are shown in FIG. The distribution terminal 100 is applied to the case where digital content such as news is distributed to the user terminal 200. However, the present invention is not limited to this and can be applied to other cases without departing from the gist of the present invention.
[0207]
【The invention's effect】
As described above, according to the document shaping system of the present invention, important words or quasi-important words in the document to be output based on the document information are shaped or modified, so that it can be used according to the latest situation or topic. By registering important words / phrases in the important word / phrase storage means, it is possible to relatively improve the readability of documents with contents that are in line with the latest situation and topic as compared to the conventional case. It is done.
[0208]
Further, according to the document shaping system of the present invention, every time document information is given, important words / phrases corresponding to the relatively latest situation and topic are registered in the important word / phrase storage means. The registration work can be reduced. In addition, since it is possible to retain important words / phrases according to the relatively latest situation or topic in the important phrase storage means, it is possible to further improve the readability of a document having contents in accordance with the latest situation / topic. Can also be obtained.
[0209]
Furthermore, according to the document shaping system of the present invention, line breaks in important phrases or quasi-important phrases are prohibited in a document to be output based on document information. There is also an effect that the readability of the document can be further improved.
On the other hand, according to the digital content creation system described in the present invention, important words or quasi-important phrases in a document in the document information storage frame are shaped or modified, so that important phrases according to the latest situation or topic can be changed. If registered in the important word / phrase storage means, it is possible to obtain an effect that the readability can be relatively improved even in the case of digital contents having contents adapted to the latest situation and topic as compared with the prior art.
[0210]
Furthermore, according to the digital content creation system described in the present invention, every time digital content is created, important words / phrases corresponding to the latest situation and topic are registered in the important word / phrase storage means. The registration work to the means can be reduced. In addition, since it is possible to store important phrases according to the latest situation and topic in the important phrase storage means, it is possible to further improve the readability of the digital content with the contents corresponding to the latest situation and topic. An effect is also obtained.
[0211]
Furthermore, according to the digital content creation system described in the present invention, since relatively important words / quasi-important phrases are shaped or modified, it becomes difficult to read due to excessive shaping or modification. The effect that it is possible to avoid the problem is also obtained.
Furthermore, according to the digital content creation system described in the present invention, line breaks in important words or semi-important words are prohibited in the document information storage frame. The effect that the readability can be further improved is also obtained.
[0212]
Furthermore, according to the digital content creation system described in the present invention, if the designer sets a change allowable range for parameters that may affect the number of characters stored in the document information storage frame, If the document information cannot be stored, or if there is a margin in the document information storage frame, the value of such a specific parameter is changed within the allowable change range, and the number of characters stored in the document information storage frame is adjusted. Therefore, the possibility that the layout intended by the designer is damaged can be reduced without the layout deviating from the designer's intention depending on the number of characters of the document information.
[0213]
Furthermore, according to the digital content creation system of the present invention, when document information cannot be stored in the document information storage frame, the values of a plurality of specific parameters are changed within the allowable change range. However, it is possible to further reduce the possibility that the intended layout is damaged. In addition, if the designer sets the importance level of a specific parameter, the parameter with the lower importance level is preferentially changed, so that it is easy to reflect the designer's intention in the layout result.
[0214]
Furthermore, according to the digital content creation system of the present invention, it is possible to reduce the possibility that the layout intended by the designer is damaged with respect to the font size. Furthermore, according to the digital content creation system described in the present invention, it is possible to reduce the possibility that the layout intended by the designer is damaged with respect to the number of lines or the number of characters per line.
[0215]
Furthermore, according to the digital content creation system described in the present invention, it is possible to reduce the possibility that the layout intended by the designer is damaged with respect to the number of lines or the number of characters per line.
Furthermore, according to the digital content creation system of the present invention, maintenance of the number of lines or the number of characters per line can be prioritized over the font size, so the designer can determine the number of lines or the number of characters per line. It is also possible to further reduce the possibility that the intended layout is damaged.
[0216]
Furthermore, according to the digital content creation system of the present invention, the maintenance of the font size can be prioritized over the number of lines or the number of characters per line, so the layout intended by the designer for the font size is impaired. There is also an effect that the possibility can be further reduced.
Furthermore, according to the digital content creation system described in the present invention, since the user's specific information and the designation information by the user are referenced with respect to the selection of content data, the digital content having a content relatively in line with the user's desire is created. The effect that it can do is also acquired.
[0217]
Furthermore, according to the digital content creation system described in the present invention, the user specific information and the designation information by the user are referred to regarding the determination of the output layout, so that the digital content is output with an output layout relatively in line with the user's desire. The effect that it can create is also acquired.
On the other hand, according to the document shaping program described in the present invention, an effect equivalent to that of the document shaping system described in the present invention can be obtained.
[0218]
On the other hand, according to the digital content creation program described in the present invention, an effect equivalent to that of the digital content creation system described in the present invention can be obtained.
On the other hand, according to the document shaping method described in the present invention, an effect equivalent to that of the document shaping system described in the present invention can be obtained.
On the other hand, according to the digital content creation method described in the present invention, the same effect as the digital content creation system described in the present invention can be obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a network system to which the present invention is applied.
FIG. 2 is a functional block diagram showing an outline of functions of the content distribution terminal 100.
3 is a block diagram showing a configuration of a content distribution terminal 100. FIG.
4 is a diagram showing a data structure of a user profile table 300. FIG.
FIG. 5 is a diagram showing a data structure of a layout definition file and a layout number correspondence table 330;
FIG. 6 is a diagram showing a part of the data structure of a layout definition file.
FIG. 7 is a data list showing a part of the contents of a layout definition file form01 described in XML.
FIG. 8 is a diagram showing a data structure of a flow management table 400.
FIG. 9 is a diagram showing a data structure of an important word / phrase registration table 450;
10 is a diagram showing a data structure of content data and a category number correspondence table 340. FIG.
FIG. 11 is a flowchart showing user registration processing;
FIG. 12 is a flowchart showing content distribution processing.
FIG. 13 is a flowchart showing automatic layout processing.
FIG. 14 is a flowchart showing storage processing in a document information storage frame in step S316.
FIG. 15 is a flowchart showing important phrase registration processing;
FIG. 16 is a flowchart showing a line feed candidate position setting process.
FIG. 17 is a table showing correspondences between morpheme contents and line feed candidate position priorities;
FIG. 18 is a flowchart showing font size priority type storage processing;
FIG. 19 is a flowchart showing row number priority type storage processing;
FIG. 20 is a flowchart showing line feed processing.
FIG. 21 is a flowchart showing a flow process.
FIG. 22 is a flowchart showing a storage process in a document information storage frame in step S308.
FIG. 23 is a flowchart showing processing of an unprocessed flow object.
FIG. 24 is a diagram showing a layout result.
[Explanation of symbols]
10 Content data file
11, 14, 18 XML parser
12 Content data file input section
13 Layout definition file
15 Layout definition file input part
16 Layout section
17 Drawing specification file
19 Rasterize section
100 Content distribution terminal
200 User terminal
S 1 ~ S n Content data providing terminal
30 CPU
32 ROM
34 RAM
38 I / F
40 User information registration DB
42 Important phrase registration DB
44 Content data registration DB
300 User profile table
330 Layout No. correspondence table
340 Category No. correspondence table
400 Flow management table
360 Layout area
362 Title information storage frame
364, 370, 372 Document information storage frame
366, 368 Image information storage frame

Claims (3)

ディジタルコンテンツを作成するディジタルコンテンツ作成システムであって、
コンテンツデータを記憶するコンテンツデータ記憶手段と、
複数の形態素を含む重要語句と、前記ディジタルコンテンツ作成システムが以前に作成したディジタルコンテンツに含まれる文書に前記重要語句が出現した回数を表す出現頻度とを関連付けて記憶する重要語句記憶手段と、
前記コンテンツデータ記憶手段のなかから前記コンテンツデータを選択するコンテンツデータ選択手段と、
前記コンテンツデータ選択手段で選択したコンテンツデータを構成する文書情報について形態素解析を行う形態素解析手段と、
前記形態素解析手段の解析結果に基づき各形態素の末尾を改行候補位置に設定する改行候補位置設定手段と、
前記重要語句記憶手段に記憶された重要語句を構成する各形態素を、当該各形態素の前記重要語句における出現順で断片的に含む準重要語句が前記文書情報に含まれているか否かを判定する準重要語句存在判定手段と、
前記準重要語句存在判定手段により前記準重要語句が前記文書情報に含まれると判定された場合、前記重要語句記憶手段に記憶された重要語句のうち前記準重要語句に係るものの前記出現頻度を前記重要語句記憶手段から取得し、前記取得された前記出現頻度および前記準重要語句において重要語句を構成する各形態素間の距離に基づいて重要度を算出する重要度算出手段と、
前記重要度算出手段により算出された重要度が所定値以上の場合、前記準重要語句内に設定された改行候補位置の設定を解除する改行候補位置設定解除手段と、
前記文書情報をレイアウト領域に配置された文書情報格納枠に格納するに際して、設定された改行候補位置のいずれかで改行することにより出力レイアウトを決定し、ディジタルコンテンツを作成するコンテンツ作成手段と、
を備えるディジタルコンテンツ作成システム。
A digital content creation system for creating digital content,
Content data storage means for storing content data;
Important phrase storage means for storing an important phrase including a plurality of morphemes in association with an appearance frequency representing the number of times the important phrase has appeared in a document included in digital content previously created by the digital content creation system ;
Content data selection means for selecting the content data from the content data storage means;
Morphological analysis means for performing morphological analysis on document information constituting the content data selected by the content data selection means;
Line feed candidate position setting means for setting the end of each morpheme to a line feed candidate position based on the analysis result of the morpheme analysis means,
It is determined whether or not the document information includes a semi-important phrase that includes each morpheme constituting the important phrase stored in the important phrase storage means in the order of appearance of each morpheme in the important phrase. Quasi-important phrase presence determination means;
When it is determined by the semi-important phrase presence determining means that the semi-important phrase is included in the document information, the appearance frequency of the important word / phrase related to the semi-important phrase stored in the important phrase storing means is Importance calculation means for obtaining importance based on a distance between each morpheme that constitutes an important word / phrase in the obtained appearance frequency and the quasi-important word / phrase, and obtained from the important word / phrase storage means;
When the importance calculated by the importance calculation means is a predetermined value or more, a line feed candidate position setting release means for releasing the setting of the line feed candidate position set in the quasi-important phrase;
Content storage means for determining the output layout by making a line break at any of the set line feed candidate positions when storing the document information in the document information storage frame arranged in the layout area, and creating digital content;
A digital content creation system comprising:
コンピュータを用いてディジタルコンテンツを作成するディジタルコンテンツ作成プログラムであって、前記コンピュータは、
コンテンツデータを記憶するコンテンツデータ記憶手段と、
複数の形態素を含む重要語句と、前記ディジタルコンテンツ作成プログラムが以前に作成したディジタルコンテンツに含まれる文書に前記重要語句が出現した回数を表す出現頻度とを関連付けて記憶する重要語句記憶手段と、
演算手段と、
を備え、前記ディジタルコンテンツ作成プログラムは、
前記コンテンツデータ記憶手段のなかから前記コンテンツデータを選択するコンテンツデータ選択ステップと、
前記コンテンツデータ選択ステップで選択したコンテンツデータを構成する文書情報について形態素解析を行う形態素解析ステップと、
前記形態素解析ステップの解析結果に基づき各形態素の末尾を改行候補位置に設定する改行候補位置設定ステップと、
前記重要語句記憶手段に記憶された重要語句を構成する各形態素を、当該各形態素の前記重要語句における出現順で断片的に含む準重要語句が前記文書情報に含まれているか否かを判定する準重要語句存在判定ステップと、
前記準重要語句存在判定ステップにより前記準重要語句が前記文書情報に含まれると判定された場合、前記重要語句記憶手段に記憶された重要語句のうち前記準重要語句に係るものの前記出現頻度を前記重要語句記憶手段から取得し、前記取得された前記出現頻度および前記準重要語句において重要語句を構成する各形態素間の距離に基づいて重要度を算出する重要度算出ステップと、
前記重要度算出ステップにより算出された重要度が所定値以上の場合、前記準重要語句内に設定された改行候補位置の設定を解除する改行候補位置設定解除ステップと、
前記文書情報をレイアウト領域に配置された文書情報格納枠に格納するに際して、設定された前記改行候補位置のいずれかで改行することにより出力レイアウトを決定し、ディジタルコンテンツを作成するコンテンツ作成ステップと、
を有する処理を前記演算手段に実行させるディジタルコンテンツ作成プログラム。
A digital content creation program for creating digital content using a computer, the computer comprising:
Content data storage means for storing content data;
Important phrase storage means for storing an important phrase including a plurality of morphemes and an appearance frequency representing the frequency of appearance of the important phrase in a document included in the digital content previously created by the digital content creation program ;
Computing means;
The digital content creation program comprises:
A content data selection step of selecting the content data from the content data storage means;
A morpheme analysis step for performing morpheme analysis on document information constituting the content data selected in the content data selection step;
A line feed candidate position setting step for setting the end of each morpheme as a line feed candidate position based on the analysis result of the morpheme analysis step;
It is determined whether or not the document information includes a semi-important phrase that includes each morpheme constituting the important phrase stored in the important phrase storage means in the order of appearance of each morpheme in the important phrase. A semi-important phrase existence determination step;
When it is determined in the semi-important phrase existence determination step that the semi-important phrase is included in the document information, the appearance frequency of the important phrase stored in the important phrase storage unit is related to the semi-important phrase. Importance calculation step of calculating importance based on a distance between each morpheme that is acquired from an important word storage means, and the acquired appearance frequency and the quasi-important phrase constitute an important phrase;
When the importance calculated in the importance calculation step is a predetermined value or more, a line feed candidate position setting release step for canceling the setting of the line feed candidate position set in the semi-important phrase;
When storing the document information in a document information storage frame arranged in a layout area, a content creation step of determining an output layout by making a line break at any of the set line feed candidate positions and creating digital content;
A digital content creation program for causing the computing means to execute a process having
コンピュータを用いてディジタルコンテンツを作成するディジタルコンテンツ作成方法であって、前記コンピュータは、
コンテンツデータを記憶するコンテンツデータ記憶手段と、
複数の形態素を含む重要語句と、前記ディジタルコンテンツ作成プログラムが以前に作成したディジタルコンテンツに含まれる文書に前記重要語句が出現した回数を表す出現頻度とを関連付けて記憶する重要語句記憶手段と、
演算手段と、
を備え、前記ディジタルコンテンツ作成方法は、
前記コンテンツデータ記憶手段のなかから前記コンテンツデータを選択するコンテンツデータ選択ステップと、
前記コンテンツデータ選択ステップで選択したコンテンツデータを構成する文書情報について形態素解析を行う形態素解析ステップと、
前記形態素解析ステップの解析結果に基づき各形態素の末尾を改行候補位置に設定する改行候補位置設定ステップと、
前記重要語句記憶手段に記憶された重要語句を構成する各形態素を、当該各形態素の前記重要語句における出現順で断片的に含む準重要語句が前記文書情報に含まれているか否かを判定する準重要語句存在判定ステップと、
前記準重要語句存在判定ステップにより前記準重要語句が前記文書情報に含まれると判定された場合、前記重要語句記憶手段に記憶された重要語句のうち前記準重要語句に係るものの前記出現頻度を前記重要語句記憶手段から取得し、前記取得された前記出現頻度および前記準重要語句において重要語句を構成する各形態素間の距離に基づいて重要度を算出する重要度算出ステップと、
前記重要度算出ステップにより算出された重要度が所定値以上の場合、前記準重要語句内に設定された改行候補位置の設定を解除する改行候補位置設定解除ステップと、
前記文書情報をレイアウト領域に配置された文書情報格納枠に格納するに際して、設定された前記改行候補位置のいずれかで改行することにより出力レイアウトを決定し、ディジタルコンテンツを作成するコンテンツ作成ステップと、
を有する処理を前記演算手段に実行させるディジタルコンテンツ作成方法。
A digital content creation method for creating digital content using a computer, the computer comprising:
Content data storage means for storing content data;
Important phrase storage means for storing an important phrase including a plurality of morphemes and an appearance frequency representing the frequency of appearance of the important phrase in a document included in the digital content previously created by the digital content creation program ;
Computing means;
The digital content creation method comprises:
A content data selection step of selecting the content data from the content data storage means;
A morpheme analysis step for performing morpheme analysis on document information constituting the content data selected in the content data selection step;
A line feed candidate position setting step for setting the end of each morpheme as a line feed candidate position based on the analysis result of the morpheme analysis step;
It is determined whether or not the document information includes a semi-important phrase that includes each morpheme constituting the important phrase stored in the important phrase storage means in the order of appearance of each morpheme in the important phrase. A semi-important phrase existence determination step;
When it is determined in the semi-important phrase existence determination step that the semi-important phrase is included in the document information, the appearance frequency of the important phrase stored in the important phrase storage unit is related to the semi-important phrase. Importance calculation step of calculating importance based on a distance between each morpheme that is acquired from an important word storage means, and the acquired appearance frequency and the quasi-important phrase constitute an important phrase;
When the importance calculated in the importance calculation step is a predetermined value or more, a line feed candidate position setting release step for canceling the setting of the line feed candidate position set in the semi-important phrase;
When storing the document information in a document information storage frame arranged in a layout area, a content creation step of determining an output layout by making a line break at any of the set line feed candidate positions and creating digital content;
A digital content creation method for causing the computing means to execute a process having
JP2001392900A 2001-12-25 2001-12-25 Digital content creation system, digital content creation program, and digital content creation method Expired - Fee Related JP4013539B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001392900A JP4013539B2 (en) 2001-12-25 2001-12-25 Digital content creation system, digital content creation program, and digital content creation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001392900A JP4013539B2 (en) 2001-12-25 2001-12-25 Digital content creation system, digital content creation program, and digital content creation method

Publications (3)

Publication Number Publication Date
JP2003196263A JP2003196263A (en) 2003-07-11
JP2003196263A5 JP2003196263A5 (en) 2005-07-28
JP4013539B2 true JP4013539B2 (en) 2007-11-28

Family

ID=27600026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001392900A Expired - Fee Related JP4013539B2 (en) 2001-12-25 2001-12-25 Digital content creation system, digital content creation program, and digital content creation method

Country Status (1)

Country Link
JP (1) JP4013539B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6339343B2 (en) * 2013-10-21 2018-06-06 東芝テック株式会社 Content creation apparatus and program
JP6947497B2 (en) * 2015-09-07 2021-10-13 ヤフー株式会社 Generation device, generation method, and generation program
JP6931517B2 (en) * 2015-09-25 2021-09-08 富士通株式会社 Calibration support device, calibration support method and calibration support program

Also Published As

Publication number Publication date
JP2003196263A (en) 2003-07-11

Similar Documents

Publication Publication Date Title
JP4127194B2 (en) Layout system, layout program, and layout method
KR100432833B1 (en) Digital contents generating system and digital contents generating program
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
JP4079087B2 (en) Layout system
JP3835191B2 (en) Digital content creation system and digital content creation program
JP2004118353A (en) Layout system and layout program and layout method
US20160062707A1 (en) Information processing apparatus, and print control method
US20040225962A1 (en) Layout system, layout program, and layout method
JP3835194B2 (en) Digital content creation system and digital content creation program
JPH11175527A (en) Output controller and output control method
JP4055494B2 (en) Layout system, layout program, and layout method
JP4146620B2 (en) Digital content creation system and digital content creation program
JP4013539B2 (en) Digital content creation system, digital content creation program, and digital content creation method
JP2003122738A (en) Digital contents creation system, digital contents creation program and digital contents creating method
JP5007405B2 (en) Information processing apparatus and program
JP2003122737A (en) Digital contents creation system, digital contents creation program and digital contents creating method
JP3870672B2 (en) Document filing device
JP2002297638A (en) Method for extracting title from document image
JPH0969098A (en) Document preparation device
JP2004152152A (en) Layout system, layout program and layout method
JP4145765B2 (en) Layout system, program
JPH0785092A (en) Method and device for retrieving ambiguous graphic
JPH05101039A (en) Document shaping device
JP2004046842A (en) Output control device
JP2004030691A (en) Output controller

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061130

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070903

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110921

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees