JP2004164134A - 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム - Google Patents

電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム Download PDF

Info

Publication number
JP2004164134A
JP2004164134A JP2002327458A JP2002327458A JP2004164134A JP 2004164134 A JP2004164134 A JP 2004164134A JP 2002327458 A JP2002327458 A JP 2002327458A JP 2002327458 A JP2002327458 A JP 2002327458A JP 2004164134 A JP2004164134 A JP 2004164134A
Authority
JP
Japan
Prior art keywords
character string
conversion
input
tag
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002327458A
Other languages
English (en)
Other versions
JP4012047B2 (ja
Inventor
Naoya Uematsu
直也 植松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2002327458A priority Critical patent/JP4012047B2/ja
Publication of JP2004164134A publication Critical patent/JP2004164134A/ja
Application granted granted Critical
Publication of JP4012047B2 publication Critical patent/JP4012047B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】必要な事項が記述された構造化文書を誰でも容易に作成できるよう操作者を支援すること。
【解決手段】かな漢字変換ソフトによる文字列の入力・変換・確定時に、適切なタグを表示あるいは文字列と一緒に確定してしまう。変換辞書には変換前文字列(読み)と変換後文字列(表記)との組が保持されており、一部の変換後文字列はさらに、特定のDTD(文書型定義)中の特定のタグと対応づけられている。そしてタグと対応づけられた候補が確定されると、当該タグの下位のタグがアイコンで表示されたり、上記候補とともに直接文中に挿入されたりする。かな漢字変換ソフトを利用するので、HTMLエディタなど専用のアプリケーションがなくても容易に構造化文書を作成できる。なお、かな漢字変換時の言語処理を基礎として、入力文中の重要箇所(ポイント部分)に所定のタグを挿入することなども可能。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
この発明は、文字列を表現するデータからなる電子文書を作成する電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラムに関する。
【0002】
【従来の技術】
文書の意味構造を所定のタグによって明確化するマークアップ言語には、従来からSGMLやその一種としてのHTMLが存在し、特にHTMLは近年、インターネットの拡大とともに爆発的な普及を見せている。
【0003】
SGMLは、HTMLに比べて利用範囲が限定されてはいたが、1996年11月にW3C(World Wide Web Consortium)から、従来のSGMLの問題点を改良したXML(Extensible Markup Language)が発表され、様々な分野でこれに則ったXML応用言語(ボキャブラリ)が作成されつつある。
【0004】
これらの言語によりタグ付けされた文書は、テキストであるため人間にとって読みやすいことはもちろん、コンピュータによるデータ処理、たとえば文字列の比較などにおいても解釈が容易なため、これらを対象とする検索技術や情報抽出技術などの研究が活発になされている。
【0005】
【発明が解決しようとする課題】
しかしながら対象となる構造化文書を作成するには、何らかの方法で文書中の適切な箇所に適切なタグを挿入しなければならない。そして、データベースやファイルサーバに蓄積された既存の文書について、自動的・機械的にタグを挿入する技術は従来から存在するが、その結果は必ずしも正確に文書の意味構造を反映したものでなく、実用的なレベルの精度が得られない場合が多い。
【0006】
一方、作成中の文書にタグ付けをする場合には、マークアップの支援機能を実装する専用プログラム(HTMLエディタなど)を利用することでその煩雑さを軽減することができるが、それ以外のプログラムで文書を作成しなければならない場合は、逐一タグを入力するほかはなく、スペルや文法上のミスが生じやすいという問題があった。
【0007】
また、こうした専用エディタでは開始タグと終了タグとの対応関係や、複数のタグの入れ子関係の矛盾などをチェックできるが、DTD(Document Type Definition:文書型定義)で定義されたタグが有効に使用されているかどうかまではチェックしない。
【0008】
たとえばDTDで<議事録タイトル>タグの下位に<日時><場所><議題><出席者>の4つのタグが定義されていても、文書の作成者は<出席者>以外の3つのタグしか使用しないかもしれない。言い換えれば、DTDが要求している事項のすべてを文書中に記述するとは限らない。そのため誰が議事録を作成したかによって会議の出席者が分かったり分からなかったりといった、文書の質のばらつきが生ずるという問題があった。
【0009】
この発明は上記従来技術による問題を解決するため、必要な事項が記述された構造化文書を誰でも容易に作成できるよう操作者を支援することが可能な電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、請求項1に記載の発明にかかる電子文書作成装置は、文字列を表現するデータからなる電子文書を作成する電子文書作成装置において、第1の文字列を表現するデータを入力する文字列入力手段と、前記文字列入力手段により入力されたデータを他のデータに変換すべき旨の指示を入力する変換指示入力手段と、前記変換指示入力手段により前記指示が入力された場合に、前記文字列入力手段により入力されたデータを第2の文字列を表現するデータに変換する変換手段と、前記変換手段により変換されたデータを確定すべき旨の指示を入力する確定指示入力手段と、前記確定指示入力手段により前記指示が入力された場合に、前記第2の文字列を表現するデータに対応づけられた、前記電子文書の意味構造に関する情報を表示する表示手段と、を備えたことを特徴とする。
【0011】
この請求項1に記載の発明によれば、作成中の文書に特定の文字列を追記するだけで、当該文字列を含む文書に相応しい意味構造が操作者に提示される。
【0012】
また、請求項2に記載の発明にかかる電子文書作成方法は、文字列を表現するデータからなる電子文書を作成する電子文書作成方法において、第1の文字列を表現するデータを入力する文字列入力工程と、前記文字列入力工程で入力されたデータを他のデータに変換すべき旨の指示を入力する変換指示入力工程と、前記変換指示入力工程で前記指示が入力された場合に、前記文字列入力工程で入力されたデータを第2の文字列を表現するデータに変換する変換工程と、前記変換工程で変換されたデータを確定すべき旨の指示を入力する確定指示入力工程と、前記確定指示入力工程で前記指示が入力された場合に、前記第2の文字列を表現するデータに対応づけられた、前記電子文書の意味構造に関する情報を表示する表示工程と、を含んだことを特徴とする。
【0013】
この請求項2に記載の発明によれば、作成中の文書に特定の文字列を追記するだけで、当該文字列を含む文書に相応しい意味構造が操作者に提示される。
【0014】
また、請求項3に記載の発明にかかるプログラムによれば、前記請求項2に記載された方法がコンピュータによって実行される。
【0015】
【発明の実施の形態】
以下に添付図面を参照して、この発明による電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラムの好適な実施の形態を詳細に説明する。
【0016】
(発明の概要)
具体的な細部の説明に入る前に、発明の概要だけを簡単に述べれば、本発明はかな漢字変換ソフトウエア(本出願人が製造・販売する「ATOK」など)による文字の入力中に、操作者に対して「作成中の文書に書くべき内容」を提示・教示(push)するものである。
【0017】
図1は、上記ソフトウエアが参照する変換辞書の内容を模式的に示す説明図である。図示するように、変換辞書は変換前文字列(読み)と、変換前文字列に対応する少なくとも一つの変換後文字列(表記)との組を保持している。なお、変換前文字列は通常は変換後文字列の読みであるが、必ずしも読みでなくとも、たとえば郵便番号と町村名など文字列間に何らかの関連が存在すればよい。また、変換前文字列は必ずしも複数の文字でなくとも、単一の文字であってもよい。
【0018】
そしてさらに一部の変換後文字列は、図示するように特定のDTDで定義された特定のタグと対応づけられている。たとえば変換前文字列「ぎじろく」に対応する変換後文字列「議事録」は、「sample#1.dtd」で定義された<議事録タイトル>タグに対応づけられている。
【0019】
そして以下で説明する実施の形態1では、たとえば図2のように確定済文字列「ABCプロジェクト定例ミーティング」に続けて「ぎじろく」と入力し、これを図1の変換辞書を基礎として「議事録」に確定すると、図3に示すように、当該文字列に対応づけられた<議事録タイトル>の下位のタグのアイコン301a〜301dが表示される。
【0020】
図示する例は上述の「ATOK」で変換した文字列を、同じく本出願人が製造・販売するワープロソフトの「一太郎」に送出しつつ文書を作成する例であって、文書内容を表示するための文書ウィンドウ300とは別に、文書作成支援のための各種情報を表示するナレッジウィンドウ301が設けられている。
【0021】
そして、文書ウィンドウ300で確定された「議事録」に対応する<議事録タイトル>の下位のタグ、すなわち<日時><場所><議題><出席者>の各タグを表現するアイコンが、このナレッジウィンドウ301上に表示される。各アイコンをマウスでクリックすると、対応するタグの開始タグと終了タグとを文書ウィンドウ300のカーソル位置に挿入できる。なお、これらのアイコンは操作者に対して、文書中に記述すべき項目を示唆するものであるので、以下では文書作成のガイドという意味で「ガイド情報」と呼ぶ。
【0022】
他方、以下で説明する実施の形態2では、図1の変換辞書はたとえば変換前文字列「ぎじろく」について、
(1)タグの対応づけられていない「議事録」(以下では便宜的に「タグなし議事録」と呼ぶ)
(2)タグの対応づけられた「議事録」(以下では便宜的に「タグあり議事録」と呼ぶ)
(3)タグの対応づけられていない「ぎじろく」
の3つの変換後文字列を定義していると解釈される。
【0023】
そして図2と同様に「ぎじろく」と入力し、スペースキーを押下すると、図4に示すように変換前文字列「ぎじろく」に代えて、その第一候補である「タグなし議事録」がカーソル位置に表示される。
【0024】
この状態でさらにスペースキーを押下すると、図5に示すように、カーソル位置の文字列が第一候補の「タグなし議事録」から第二候補の「タグあり議事録」に切り替えられる。また、カーソル位置の近傍に変換後文字列の一覧(変換候補ウィンドウ500)が表示される。
【0025】
そしてこの状態でエンターキーを押下する、すなわち「タグあり議事録」を確定すると、図6のようにカーソル行(カーソルが位置する行)の行頭に、当該文字列に対応づけられたタグの開始タグ<議事録タイトル>が挿入される。また、カーソル位置には文字列「議事録」と、上記タグに対応する終了タグ</議事録タイトル>、さらにそれに続けて下位のタグ、すなわち<日時></日時>、<場所></場所>、<議題></議題>、<出席者></出席者>が、それぞれ挿入される。なお、各要素の間には主に見やすさの観点から、改行や空白が適宜挿入される。
【0026】
(実施の形態1)
図7は、この発明の実施の形態1による電子文書作成装置のハードウエア構成の一例を示す説明図である。図中、701は装置全体を制御するCPUを、702は基本入出力プログラムを記憶したROMを、703はCPU701のワークエリアとして使用されるRAMを、それぞれ示している。
【0027】
また、704はCPU701の制御にしたがってHD(ハードディスク)705に対するデータのリード/ライトを制御するHDD(ハードディスクドライブ)を、705はHDD704の制御にしたがって書き込まれたデータを記憶するHDを、それぞれ示している。
【0028】
また、706はCPU701の制御にしたがってFD(フレキシブルディスク)707に対するデータのリード/ライトを制御するFDD(フレキシブルディスクドライブ)を、707はFDD706の制御にしたがって書き込まれたデータを記憶する着脱自在のFDを、それぞれ示している。
【0029】
また、708はCPU701の制御にしたがってCD−RW709に対するデータのリード/ライトを制御するCD−RWドライブを、709はCD−RWドライブ708の制御にしたがって書き込まれたデータを記憶する着脱自在のCD−RWを、それぞれ示している。
【0030】
また、710はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示するディスプレイを、711は文字、数値、各種指示などの入力のための複数のキーを備えたキーボードを、712は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうマウスを、それぞれ示している。
【0031】
また、713は通信ケーブル714を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU701とのインターフェースとして機能するネットワークI/Fを、700は上記各部を接続するためのバスを、それぞれ示している。
【0032】
つぎに、図8はこの発明の実施の形態1による電子文書作成装置の構成を機能的に示す説明図である。
【0033】
まず800は変換前文字列入力部であり、操作者からの文字列の入力を受け付ける。すなわち、キーボード711上のどのキーが押下されたのかを特定して、当該キーに対応する文字コードを後述する変換前文字列表示部801および文字列変換部805に引き渡す。
【0034】
801は変換前文字列表示部であり、変換前文字列入力部800から入力した変換前文字列を、ディスプレイ710上のカーソル位置に表示する。なお以下では簡単のため、文字の入力モードとしては「かな漢字入力」が指定されているものとするが、「ローマ字漢字入力」が指定されている場合は、変換前文字列表示部801は入力した文字コードに対応するアルファベットを隣接するもの同士組み合わせ、ひらがなに変換した上で画面に表示する。
【0035】
802は変換指示入力部であり、キーボード711を介して、操作者からの変換指示の入力を受け付ける。変換指示とは、変換前文字列入力部800から入力した文字列につきその変換後文字列を取得する旨の指示であり、ここではキーボード711上のスペースキーの押下が当該指示を意味するものとする。変換指示入力部802は、変換前文字列が存在する状態で上記指示があったことを検知すると、その事実を後述する文字列変換部805に通知する。
【0036】
803は変換辞書であり、変換前文字列と、変換前文字列に対応する少なくとも一つの変換後文字列、および変換後文字列に対応するタグ(もしあれば)の組を多数保持している。804はタグセットDB(データベース)であり、具体的にはDTDが蓄積された文書データベースである。この変換辞書803と、タグセットDB804内のDTDとの関係は図1に模式的に示した通りである。なお、タグセットDB804の内容は必ずしもDTDである必要はなく、XMLスキーマや、用途に合わせてタグ名(要素型)やタグの階層構造、タグで囲まれた要素内容のデータ型を定義するものであれば何であってもよい。
【0037】
805は文字列変換部であり、変換指示入力部802から変換指示があった旨の通知を受けると、変換辞書803を参照して、変換前文字列入力部800から入力した文字列の変換後文字列を取得する。
【0038】
すなわち、まず変換前文字列の区切り方のパターンをいくつか作成し、つぎに各パターン内の各形態素について、その変換後文字列を変換辞書803から取得する。そして、文字列の組み合わせが一番もっともらしい区切りパターンを一応正解とみなし、当該パターンにつき得られた変換後文字列(タグが対応づけられている場合は当該タグの識別情報も)を後述する変換後文字列表示部806に引き渡す。
【0039】
806は変換後文字列表示部であり、文字列変換部805から引き渡された変換後文字列をディスプレイ710に表示する。
【0040】
807は切替指示入力部であり、キーボード711を介して、操作者からの変換候補の切替指示の入力を受け付ける。切替指示とは、変換後文字列表示部806がカーソル位置に表示している変換候補を次候補に切り替える旨の指示であり、ここでは上述の変換指示と同様、スペースキーの押下が当該指示を意味するものとする。同じスペースキーでも、変換前の未確定文字列の表示中に押下された場合は変換指示、変換後の未確定文字列の表示中に押下された場合は切替指示と解釈する。
【0041】
808は確定指示入力部であり、キーボード711を介して、操作者からの確定指示の入力を受け付ける。確定指示とは、変換前文字列表示部801あるいは変換後文字列表示部806により表示中の未確定文字列を確定する旨の指示であり、ここではキーボード711上のエンターキーの押下が当該指示を意味するものとする。
【0042】
確定指示入力部808は、変換前あるいは変換後の未確定文字列が存在する状態で上記指示があったことを検知すると、その事実を変換前文字列表示部801および変換後文字列表示部806に通知する。そして、カーソル位置に未確定文字列を表示中のいずれかの機能部が、当該文字列を後述する確定済文字列記憶部809に引き渡す。なお、当該文字列にタグが対応づけられている場合は、当該タグの識別情報すなわちどのDTDのどのタグであるかを特定できる情報が、変換後文字列表示部806から後述するガイド情報表示部811に送出される。
【0043】
809は確定済文字列記憶部であり、確定指示入力部808から入力した確定指示を契機として、変換前文字列表示部801あるいは変換後文字列表示部806から送出されてきた文字列を順次蓄積している。また、810は確定済文字列表示部であり、確定済文字列記憶部809に保持された確定済文字列をディスプレイ710に表示する。
【0044】
811はガイド情報表示部であり、確定された文字列にタグが対応づけられていた場合に、当該タグを図3に示したようなアイコンの形で画面表示する。たとえば「ぎじろく」が変換されて「議事録」に確定されると、変換後文字列表示部806は「議事録」を確定済文字列記憶部809に送出するとともに、当該「議事録」には「sample#1.dtd」の<議事録タイトル>タグ(図1参照)が対応づけられている旨を、ガイド情報表示部811に通知する。
【0045】
ガイド情報表示部811は上記通知を受けて、タグセットDB804内の「sample#1.dtd」を参照し、<議事録タイトル>タグの下位に定義されているタグ(図1の例では<日時><場所><議題><出席者>の4つ)を特定する。そして、特定した各タグについてアイコンを作成し、図3に示したようなナレッジウィンドウ301に表示する。
【0046】
つぎに、図9はこの発明の実施の形態1による電子文書作成装置における、文書作成処理(そのうち特に文字列の入力・変換・確定処理)の手順を示すフローチャートである。
【0047】
まずその変換前文字列入力部800により、変換前文字列の入力を受け付けるとともに、変換前文字列表示部801により、当該文字列を画面上のカーソル位置に表示する(ステップS901)。
【0048】
この状態で変換指示入力部802が、スペースキーの押下すなわち操作者からの変換指示を検知すると(ステップS902:Yes)、文字列変換部805が変換辞書803を検索して、上記文字列の変換後文字列を取得し(ステップS903)、続いて当該文字列のうち先頭の一つが変換後文字列表示部806により表示される(ステップS904)。
【0049】
そしてさらにスペースキーが押下された場合、すなわち操作者から変換候補の切替指示があった場合は(ステップS905:Yes)、これを検知した切替指示入力部807からの通知にしたがい、変換後文字列表示部806はカーソル位置の変換候補をその次候補に切り替えるとともに、変換候補ウィンドウを表示する(ステップS906)。
【0050】
そして確定指示入力部808が、エンターキーの押下すなわち操作者からの確定指示を待って、確定指示を検知すると、変換前文字列がそのまま確定された場合(ステップS902:No、ステップS907:Yes)は変換前文字列表示部801から、変換後文字列のいずれかが確定された場合(ステップS905:No、ステップS907:Yes)は変換後文字列表示部806から、それぞれカーソル位置に表示中の文字列が出力され、確定済文字列記憶部809内の既存の確定済文字列に追加される(ステップS908)。
【0051】
その後、更新後の確定済文字列を確定済文字列表示部810が再表示する(ステップS909)。既存の確定済文字列の末尾に文字列が追加された場合は、当該文字列だけを新たに表示すればよいが、既存の確定済文字列の途中に文字列が挿入された場合は、挿入位置以降の確定済文字列を順次繰り下げなければならない。なお、上記再表示に伴い変換前文字列表示部801、あるいは変換後文字列表示部806により表示されていた未確定文字列は消去される。
【0052】
一方、確定された変換後文字列にタグが対応づけられていた場合は(ステップS910:Yes)、当該タグの識別情報が変換後文字列表示部806からガイド情報表示部811に通知されるので、ガイド情報表示部811は当該情報によりタグセットDB804を検索する(ステップS911)。そして、上記識別情報により特定されるタグの下位のタグにつき、アイコンを作成して図3のように画面表示する(ステップS912)。
【0053】
以上説明した実施の形態1によれば、「ぎじろく」を「議事録」に変換・確定しただけで、作成中の文書に記述すべき項目、具体的には日時・場所・議題・出席者などがガイド情報として表示される。そして、当該情報により示唆される事項を記入してゆけば、「sample#1.dtd」で定義されるDTDに沿った構造の文書が容易に作成できる。
【0054】
したがってXMLについての知識がない初心者はもちろん、初心者でなくとも上記ガイド情報を参照することで、記述すべき事項を漏れなく、かつ整然とした順序で文書中に盛り込むことができる。これにより作成者による文書の詳細さのばらつきを防ぎ、誰が作ったものでも最低限の内容は記入されているよう、文書の質を担保することができる。
【0055】
(実施の形態2)
さて、上述した実施の形態1では文字列が確定されると、当該文字列に対応づけられたタグの下位のタグをアイコンとして表示するのみであった。このアイコンをマウスクリックすれば、カーソル位置に対応するタグ(たとえば<日時></日時>)を挿入できるものの、あくまでもガイド情報は提案のレベルにとどまり、参考にするかどうかは操作者の任意である。そのため、必ずしもDTDに即した文書が作成されるとは限らない。
【0056】
そこで以下に説明する実施の形態2のように、操作者の自由度をより制限して、DTDに厳密に準拠した文書が作成できるようにしてもよい。
【0057】
実施の形態2による電子文書作成装置のハードウエア構成は、図7に示した実施の形態1のそれと同一なので説明を省略する。図10は、この発明の実施の形態2による電子文書作成装置の構成を機能的に示す説明図である。図8に示した実施の形態1の機能構成との差異は、ガイド情報表示部811の代わりに確定文字列作成部1011が設けられている点のみである。以下、実施の形態1との差異を中心に説明する。
【0058】
実施の形態2による変換後文字列表示部1006は、確定指示入力部1008から確定指示の入力があると、カーソル位置に表示中の変換後文字列を確定済文字列記憶部1009でなく、その前段の確定文字列作成部1011に送出する。また、上記文字列にタグが対応づけられている場合は、当該タグの識別情報も同時に送出する。
【0059】
そして、これらを受け取った確定文字列作成部1011は、まずタグの識別情報(もしあれば)によりタグセットDB1004を検索し、当該タグの下位に定義されているタグを取得する。そしてこれらのタグを表現する文字列と、確定された文字列とを組み合わせて、図11に示すような、既存の確定済文字列に追加すべき新たな文字列のリストを作成する。
【0060】
そして、このリストを確定文字列作成部1011から受け取った確定済文字列記憶部1009は、すでに保持している確定済文字列の指定された位置に、指定された文字列を挿入する。
【0061】
図12はこの発明の実施の形態2による電子文書作成装置における、文書作成処理(そのうち特に文字列の入力・変換・確定処理)の手順を示すフローチャートである。ステップS1201〜S1207は、図9のステップS901〜S907と同様である。
【0062】
そして変換前文字列がそのまま確定された場合は(ステップS1202:No、ステップS1207:Yes)、当該文字列が変換前文字列表示部1001から確定済文字列記憶部1009に引き渡され、既存の確定済文字列のカーソル位置に挿入される(ステップS1208:No、ステップS1211)。そして、この更新後の確定済文字列が確定済文字列表示部1010により表示される(ステップS1212)。
【0063】
一方、変換後文字列のいずれかが確定された場合は(ステップS1205:No、ステップS1207:Yes)、当該文字列は変換後文字列表示部1006からいったん確定文字列作成部1011に引き渡される。
【0064】
そして、確定文字列作成部1011は当該文字列にタグが対応づけられている場合(当該文字列と同時にタグの識別情報も受け取った場合、と言ってもよい)、タグセットDB1004を検索して、当該タグの下位に定義されているタグを特定する(ステップS1209)。つぎに、確定文字列作成部1011は図11に示したような、これから確定すべき文字列のリストを作成し(ステップS1210)、当該リストを確定済文字列記憶部1009に引き渡す。
【0065】
これを受け取った確定済文字列記憶部1009は、当該リスト中で指定される位置に指定される文字列を挿入することで、既存の確定済文字列を更新する(ステップS1211)。そして、更新後の確定済文字列が確定済文字列表示部1010により表示される(ステップS1212)。
【0066】
以上説明した実施の形態2によれば、たとえば「ぎじろく」を「議事録」に変換・確定するだけで、図6に示したような、DTDに厳密に準拠した構造化文書を作成できる。しかもそのために必要なのはかな漢字変換ソフトウエアのみであり、従来のように専用エディタなどを用意する必要がなく、ワープロやメーラーなど任意のアプリケーションで構造化文書を作成することができる。
【0067】
なお、上述した実施の形態1および2による電子文書作成装置は、具体的には一台のパソコンを想定しているが、変換辞書803/1003、タグセットDB804/1004および文字列変換部805/1005のみを切り離して、サーバに実装するようにしてもよい(変換エンジンの共用)。
【0068】
また、上述した実施の形態1および2では、文字列とタグとの対応関係は固定的なものとしたが、状況や利用局面に応じて動的に変更するようにしてもよい。たとえば「議事録」には「sample#1.dtd」の<議事録タイトル>以外にも、複数のタグを対応づけておき、操作者や作成中の文書の特徴などに応じていずれか一つを選択的に採用するようにする。
【0069】
たとえば、上述の例では「議事録」の入力以前に、確定済文字列「ABCプロジェクト定例ミーティング」が存在することから、作成中の文書はABCプロジェクトや会議に関する文書だと推定できる。そこで、この文書の種別に相応しいDTDはどれであるかを特定し、「議事録」に対応づけられた複数のタグのうち、当該DTDで定義されているものを優先的に採用する。
【0070】
あるいは、どのプロジェクトの文書を書いているのか、誰に対して書いているのかなどを手がかりに、過去に作成済みの文書との類似度を算出して、類似文書で採用されているタグセットを優先させるようにしてもよい。タグの動的な変更にあたって考慮してもよい/考慮すべき情報には、たとえば下記のようなものが考えられる。
【0071】
・操作者のプロファイル(個人情報)
・操作者の行動ログ
・作業環境の設定ファイル
・過去の作成文書から抽出された情報
・アプリケーションの情報
・サーバ上に蓄積された情報
・外部データベースに格納された情報 等
【0072】
なお、上述した実施の形態1は比較的弱いpushの例、実施の形態2は比較的強いpushの例であるが、その程度は用途に応じて、様々に調整することが可能である。
【0073】
また、必ずしもタグの挿入にはこだわらず、文書中に必要な事項が記載されていれば足るのであれば、たとえば実施の形態1で表示されるガイド情報のアイコンを、クリックできない(したがってタグの挿入もできない)単なる画像としてもよい。あるいは実施の形態2を変形して、図13に示すように、タグでなくタグの要素型を挿入するようにしてもよい(同図は図5の状態で確定を指示した直後の例)。
【0074】
また、本発明のように文書のタグ付けにかな漢字変換ソフトウエアを利用すると、当該ソフトウエアによる言語処理の結果をタグ付けに流用することができるので、入力文中の重要な箇所やポイントとなる箇所に所定のタグを自動挿入することなどが可能である。
【0075】
たとえば「せんじつのあんけんについてはしゅつがんをみあわせたいとおもいます。」と入力してスペースキーを押すと、「先日の案件については<重要>出願を見合わせたい</重要>と思います。」のように、かな文字列がかな漢字混じり文字列に変換されるとともに、意味的な中心と推定された「出願を見合わせたい」の直前・直後で<重要>タグが出力されるようにする。あるいは、操作者が確定前に所定のキーを押下すると、指定した位置にタグが出力されるようにしてもよい(タグの手動挿入)。
【0076】
なお上述した実施の形態1および2では、タグ(実施の形態1では、タグを表現するアイコン)の表示タイミングを文字列確定後としたが、必ずしも確定後でなくとも、未確定時すなわち変換前や変換中に表示するようにしてもよい。
【0077】
たとえば実施の形態1では、図2の時点、すなわち変換前文字列「ぎじろく」を入力しただけの時点で、すでにナレッジウィンドウにはその変換後文字列「議事録」に対応づけられたタグの下位タグが表示されているようにする。実施の形態2では、たとえば変換候補ウィンドウ上のタグあり候補を選択すると、図14に示すような別ウィンドウ1400が開いて、当該候補に対応づけられたタグが表示されるようにする。
【0078】
そしてさらに実施の形態2では、タグ挿入のタイミングを文字列確定直後に限る必要もなく、たとえば「タグなし議事録」を確定してから様々な文字列を入力した後、確定済の「議事録」について何らかの操作をすると、「ぎじろく」の変換候補ウィンドウが開いて「タグあり議事録」を選択し直せるようになっていてもよい。
【0079】
なお、上述した実施の形態1および2では、文字列を変換・確定した際にタグを表示したり挿入したりしているが、これは日本語文を想定した場合であって、英文の場合はこうしたタイミングが存在しない(文字列の入力=確定となるため)。しかし英文でも、たとえば単語間の区切りであるスペースが入力された時点で、ナレッジウィンドウにアイコンを表示したり変換候補ウィンドウを表示したりすることはできる。すなわち、本発明は入力する言語に依存するものではない。
【0080】
なお、上述した変換前文字列入力部800/1000、変換前文字列表示部801/1001、変換指示入力部802/1002、文字列変換部805/1005、変換後文字列表示部806/1006、切替指示入力部807/1007、確定指示入力部808/1008、確定済文字列表示部810/1010、ガイド情報表示部811および確定文字列作成部1011は、具体的にはHD705からRAM703に読み出されたプログラムをCPU701が実行することにより実現される。このプログラムはHD705のほか、FD707、CD−RW709、MOなどの各種の記録媒体に格納して配布することができ、ネットワークを介して配布することも可能である。
【0081】
また、変換辞書803/1003およびタグセットDB804/1004は、上記プログラムの実行時にHD705からRAM703に読み出され、その読み出し先となったRAM703上の記憶領域が、この変換辞書803/1003あるいはタグセットDB804/1004として機能する。また、確定済文字列記憶部809/1009はRAM703上に確保され、確保された記憶領域がこの確定済文字列記憶部809/1009として機能する。
【0082】
【発明の効果】
以上説明したように請求項1に記載の発明は、文字列を表現するデータからなる電子文書を作成する電子文書作成装置において、第1の文字列を表現するデータを入力する文字列入力手段と、前記文字列入力手段により入力されたデータを他のデータに変換すべき旨の指示を入力する変換指示入力手段と、前記変換指示入力手段により前記指示が入力された場合に、前記文字列入力手段により入力されたデータを第2の文字列を表現するデータに変換する変換手段と、前記変換手段により変換されたデータを確定すべき旨の指示を入力する確定指示入力手段と、前記確定指示入力手段により前記指示が入力された場合に、前記第2の文字列を表現するデータに対応づけられた、前記電子文書の意味構造に関する情報を表示する表示手段と、を備えたので、作成中の文書に特定の文字列を追記するだけで、当該文字列を含む文書に相応しい意味構造が操作者に提示され、これによって、必要な事項が記述された構造化文書を誰でも容易に作成できるよう操作者を支援することが可能な電子文書作成装置が得られるという効果を奏する。
【0083】
また、請求項2に記載の発明は、文字列を表現するデータからなる電子文書を作成する電子文書作成方法において、第1の文字列を表現するデータを入力する文字列入力工程と、前記文字列入力工程で入力されたデータを他のデータに変換すべき旨の指示を入力する変換指示入力工程と、前記変換指示入力工程で前記指示が入力された場合に、前記文字列入力工程で入力されたデータを第2の文字列を表現するデータに変換する変換工程と、前記変換工程で変換されたデータを確定すべき旨の指示を入力する確定指示入力工程と、前記確定指示入力工程で前記指示が入力された場合に、前記第2の文字列を表現するデータに対応づけられた、前記電子文書の意味構造に関する情報を表示する表示工程と、を含んだので、作成中の文書に特定の文字列を追記するだけで、当該文字列を含む文書に相応しい意味構造が操作者に提示され、これによって、必要な事項が記述された構造化文書を誰でも容易に作成できるよう操作者を支援することが可能な電子文書作成方法が得られるという効果を奏する。
【0084】
また、請求項3に記載の発明によれば、前記請求項2に記載された方法をコンピュータに実行させることが可能なプログラムが得られるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の実施の形態による電子文書作成装置の、変換辞書の内容を模式的に示す説明図である。
【図2】この発明の実施の形態1による電子文書作成装置の、表示画面の一例(文字列変換前)を示す説明図である。
【図3】この発明の実施の形態1による電子文書作成装置の、表示画面の他の一例(文字列確定後)を示す説明図である。
【図4】この発明の実施の形態2による電子文書作成装置の、表示画面の一例(文字列変換後・確定前)を示す説明図である。
【図5】この発明の実施の形態2による電子文書作成装置の、表示画面の他の一例(文字列変換後・確定前)を示す説明図である。
【図6】この発明の実施の形態2による電子文書作成装置の、表示画面の他の一例(文字列確定後)を示す説明図である。
【図7】この発明の実施の形態1による電子文書作成装置の、ハードウエア構成の一例を示す説明図である。
【図8】この発明の実施の形態1による電子文書作成装置の構成を機能的に示す説明図である。
【図9】この発明の実施の形態1による電子文書作成装置における、文書作成処理(そのうち特に文字列の入力・変換・確定処理)の手順を示すフローチャートである。
【図10】この発明の実施の形態2による電子文書作成装置の構成を機能的に示す説明図である。
【図11】この発明の実施の形態2による確定文字列作成部1011が作成する、既存の確定済文字列に追加すべき新たな文字列のリストの一例を示す説明図である。
【図12】この発明の実施の形態2による電子文書作成装置における、文書作成処理(そのうち特に文字列の入力・変換・確定処理)の手順を示すフローチャートである。
【図13】この発明の実施の形態2による電子文書作成装置の、表示画面のバリエーション(文字列確定後)を示す説明図である。
【図14】この発明の実施の形態2による電子文書作成装置の、表示画面のバリエーション(文字列変換後・確定前)を示す説明図である。
【符号の説明】
700 バス
701 CPU
702 ROM
703 RAM
704 HDD
705 HD
706 FDD
707 FD
708 CD−RWドライブ
709 CD−RW
710 ディスプレイ
711 キーボード
712 マウス
713 ネットワークI/F
714 通信ケーブル
800,1000 変換前文字列入力部
801,1001 変換前文字列表示部
802,1002 変換指示入力部
803,1003 変換辞書
804,1004 タグセットDB
805,1005 文字列変換部
806,1006 変換後文字列表示部
807,1007 切替指示入力部
808,1008 確定指示入力部
809,1009 確定済文字列記憶部
810,1010 確定済文字列表示部
811 ガイド情報表示部
1011 確定文字列作成部

Claims (3)

  1. 文字列を表現するデータからなる電子文書を作成する電子文書作成装置において、
    第1の文字列を表現するデータを入力する文字列入力手段と、
    前記文字列入力手段により入力されたデータを他のデータに変換すべき旨の指示を入力する変換指示入力手段と、
    前記変換指示入力手段により前記指示が入力された場合に、前記文字列入力手段により入力されたデータを第2の文字列を表現するデータに変換する変換手段と、
    前記変換手段により変換されたデータを確定すべき旨の指示を入力する確定指示入力手段と、
    前記確定指示入力手段により前記指示が入力された場合に、前記第2の文字列を表現するデータに対応づけられた、前記電子文書の意味構造に関する情報を表示する表示手段と、
    を備えたことを特徴とする電子文書作成装置。
  2. 文字列を表現するデータからなる電子文書を作成する電子文書作成方法において、
    第1の文字列を表現するデータを入力する文字列入力工程と、
    前記文字列入力工程で入力されたデータを他のデータに変換すべき旨の指示を入力する変換指示入力工程と、
    前記変換指示入力工程で前記指示が入力された場合に、前記文字列入力工程で入力されたデータを第2の文字列を表現するデータに変換する変換工程と、
    前記変換工程で変換されたデータを確定すべき旨の指示を入力する確定指示入力工程と、
    前記確定指示入力工程で前記指示が入力された場合に、前記第2の文字列を表現するデータに対応づけられた、前記電子文書の意味構造に関する情報を表示する表示工程と、
    を含んだことを特徴とする電子文書作成方法。
  3. 前記請求項2に記載された方法をコンピュータに実行させるプログラム。
JP2002327458A 2002-11-11 2002-11-11 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム Expired - Fee Related JP4012047B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002327458A JP4012047B2 (ja) 2002-11-11 2002-11-11 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002327458A JP4012047B2 (ja) 2002-11-11 2002-11-11 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム

Publications (2)

Publication Number Publication Date
JP2004164134A true JP2004164134A (ja) 2004-06-10
JP4012047B2 JP4012047B2 (ja) 2007-11-21

Family

ID=32806095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002327458A Expired - Fee Related JP4012047B2 (ja) 2002-11-11 2002-11-11 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム

Country Status (1)

Country Link
JP (1) JP4012047B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114182A1 (ja) * 2006-03-31 2007-10-11 Justsystems Corporation データ入力装置、方法、及びプログラム
WO2007114181A1 (ja) * 2006-03-31 2007-10-11 Justsystems Corporation データ入力装置、方法、及びプログラム
JP2009069937A (ja) * 2007-09-11 2009-04-02 Tokyo Metropolitan Univ タグ付与支援システム及びプログラム
JP2010176559A (ja) * 2009-01-30 2010-08-12 Profield Co Ltd データ編集装置、データ編集方法、およびプログラム
JPWO2016072444A1 (ja) * 2014-11-06 2017-05-25 シャープ株式会社 マークアップテキスト編集装置及び制御方法
JPWO2020039702A1 (ja) * 2018-08-21 2021-08-26 ソニーグループ株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09160917A (ja) * 1995-12-06 1997-06-20 Dainippon Screen Mfg Co Ltd タグ付き文書作成装置及びその方法
JPH1185736A (ja) * 1997-09-12 1999-03-30 Nec Corp 文書編集装置および文書編集方法
JP2000148748A (ja) * 1998-11-13 2000-05-30 Nec Corp 仮名漢字変換及び画像検索表示システム
JP2000268033A (ja) * 1999-03-12 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 情報列に対してタグ情報を付与するための方法および装置ならびに同方法が記録される記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09160917A (ja) * 1995-12-06 1997-06-20 Dainippon Screen Mfg Co Ltd タグ付き文書作成装置及びその方法
JPH1185736A (ja) * 1997-09-12 1999-03-30 Nec Corp 文書編集装置および文書編集方法
JP2000148748A (ja) * 1998-11-13 2000-05-30 Nec Corp 仮名漢字変換及び画像検索表示システム
JP2000268033A (ja) * 1999-03-12 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 情報列に対してタグ情報を付与するための方法および装置ならびに同方法が記録される記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114182A1 (ja) * 2006-03-31 2007-10-11 Justsystems Corporation データ入力装置、方法、及びプログラム
WO2007114181A1 (ja) * 2006-03-31 2007-10-11 Justsystems Corporation データ入力装置、方法、及びプログラム
JPWO2007114182A1 (ja) * 2006-03-31 2009-08-13 株式会社ジャストシステム データ入力装置、方法、及びプログラム
JP5065247B2 (ja) * 2006-03-31 2012-10-31 株式会社ジャストシステム データ入力装置、方法、及びプログラム
JP2009069937A (ja) * 2007-09-11 2009-04-02 Tokyo Metropolitan Univ タグ付与支援システム及びプログラム
JP2010176559A (ja) * 2009-01-30 2010-08-12 Profield Co Ltd データ編集装置、データ編集方法、およびプログラム
JPWO2016072444A1 (ja) * 2014-11-06 2017-05-25 シャープ株式会社 マークアップテキスト編集装置及び制御方法
JPWO2020039702A1 (ja) * 2018-08-21 2021-08-26 ソニーグループ株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP4012047B2 (ja) 2007-11-21

Similar Documents

Publication Publication Date Title
Bradley The XML companion
US7877251B2 (en) Document translation system
CN101183355B (zh) 复制和粘贴处理方法及装置
Alexa et al. A review of software for text analysis
US20110264705A1 (en) Method and system for interactive generation of presentations
US20050160065A1 (en) System and method for enhancing resource accessibility
US20050060046A1 (en) Information processing apparatus, its control method, and program
WO2006046523A1 (ja) 文書解析システム、及び文書適応システム
JP2003529845A (ja) ネットワーク経由の多言語翻訳を提供する方法と装置
US20090083300A1 (en) Document processing device and document processing method
JP2008107904A (ja) テキスト及びアニメーションサービス装置及びコンピュータプログラム
WO2007081017A1 (ja) 文書処理装置
EP1830274A1 (en) Server device and name space issuing method
JP4012047B2 (ja) 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム
JPWO2006046665A1 (ja) 文書処理装置及び文書処理方法
KR100522186B1 (ko) 동적으로 홈페이지를 제작하는 방법 및 이 방법을 웹에서구현하는 장치
JP2002215519A (ja) ウェブページ生成方法およびシステム、ウェブページ生成プログラム、記録媒体
US20080005085A1 (en) Server Device and Search Method
Komen Cesax: Coreference editor for syntactically annotated XML corpora
JP2002091963A (ja) 機械翻訳システム
JP2002288175A (ja) 文書の標準化
US20090083620A1 (en) Document processing device and document processing method
JP2001034611A (ja) 読み情報出力装置および記録媒体
JP3737629B2 (ja) 文書編集システム、方法、及び記録媒体
JP2002189740A (ja) データ変換システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070814

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130914

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees