JP2003067368A - 文章処理装置、文章処理方法、及び文章処理プログラム - Google Patents

文章処理装置、文章処理方法、及び文章処理プログラム

Info

Publication number
JP2003067368A
JP2003067368A JP2001260920A JP2001260920A JP2003067368A JP 2003067368 A JP2003067368 A JP 2003067368A JP 2001260920 A JP2001260920 A JP 2001260920A JP 2001260920 A JP2001260920 A JP 2001260920A JP 2003067368 A JP2003067368 A JP 2003067368A
Authority
JP
Japan
Prior art keywords
sentence
input
expression
simplified
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001260920A
Other languages
English (en)
Inventor
Shinji Fujisawa
伸二 藤澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2001260920A priority Critical patent/JP2003067368A/ja
Publication of JP2003067368A publication Critical patent/JP2003067368A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書構造によらず入力文書から箇条書きを生
成することができる箇条書き生成装置などを提供するこ
と。 【解決手段】 入力文書を形態素解析及び構文解析し、
「最初に」、「次に」、「最後に」などの列挙を表す手
がかり語や「〜は」といった形などで表される提題表現
を含む文を抽出する。抽出した抽出文に対し不要語削
除、言い換え処理、文末の体言止め化処理などを施し、
簡潔で箇条書きらしい生成文を生成する。これらの生成
文の行頭に予め指定された数字や文字などの列挙表現を
付加し、列挙して出力する。また、箇条書きが提題表現
から生成されたものである場合は、提題を箇条書きのタ
イトルとして使用する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文章処理装置、文
章処理方法及び文章処理プログラムに関し、例えば、入
力文章からプレゼンテーション用の箇条書きを自動生成
するものに関する。
【0002】
【従来の技術】学術分野や産業界などの分野では、論文
や報告書などを元にプレゼンテーションがよく行われて
いる。一般に、これらのプレゼンテーションでは、図表
を用いたり、論文や報告書などからポイントとなるとこ
ろを箇条書きしたスライドなどが用いられる。そして、
スライドの原稿などのプレゼンテーション用の資料の作
成を支援するため、論文や報告書などの元となる文章か
ら自動的に箇条書きを生成する装置などが提案されてい
る。
【0003】このように、元となる文章から箇条書きを
生成するものに、例えば、特開2000−148752
号公報の文書構造認識装置などがある。この装置は、文
書構造から箇条書きを認定し箇条書きを抽出するもので
ある。この方法では、登録されている箇条書きパタン
(箇条書きの行頭を示す記号”・”や行頭のシリアルナ
ンバー1、2、3、・・・、など)との比較により、箇
条書き候補を抽出し、その中から、位置情報(行頭の空
白や、1行の文字列長など)を使って箇条書き表現を抽
出する。また、この他に箇条書きを自動生成するものに
特開2001−109762号公報の文書処理装置など
がある。この装置は、文書中の見出し及び図への参照か
らスライド資料を自動生成するものである。
【0004】
【発明が解決しようとする課題】しかし、以上の装置
は、元の文章中で予め箇条書きとなっている部分を検出
して箇条書きを生成したり、文章中の見出しを用いるな
ど、所定の構造を持った文章からその構造に基づいて箇
条書きを生成していた。即ち、文章構造解析結果をもと
に箇条書きを抽出したり、スライド資料を生成してい
た。このように、構造を持った文章の箇条書き形式を判
定する手法は存在するが、構造を持たないいわゆるべた
書きの文章から文章構造を用いずに箇条書きを生成する
ものはなかった。
【0005】そこで、本発明の目的は、文章の内容から
箇条書き表現を自動生成することができる文章処理装
置、文章処理方法及び文章処理プログラムを提供するこ
とである。
【0006】
【課題を解決するための手段】本発明は、前記目的を達
成するために、請求項1に記載の発明では、入力文章を
取得する入力文章取得手段と、前記入力文章取得手段に
て取得した入力文章を解析する解析手段と、前記取得し
た入力文章、又は前記解析した入力文章から、予め設定
された表現に関連する文を抽出する抽出手段と、前記解
析手段による解析結果を用いて、前記抽出手段にて抽出
した抽出文から簡略化した文を生成する生成手段と、前
記生成手段にて生成した、簡略化した文を出力する出力
手段と、を具備したことを特徴とする文章処理装置を提
供する。請求項2に記載の発明では、前記生成手段にて
生成された、簡略化した文を列挙して箇条書き文を生成
する箇条書き文生成手段を更に具備し、前記出力手段
は、前記箇条書き文生成手段にて生成された箇条書き文
を出力することを特徴とする請求項1に記載の文章処理
装置を提供する。請求項3に記載の発明では、前記予め
設定された表現が、予め設定された所定の語、又はまと
まった内容をもつ1つ又は複数の文によって構成された
文章において前記内容を提示する表現であることを特徴
とする請求項1又は請求項2に記載の文章処理装置を提
供する。請求項4に記載の発明では、前記生成手段が、
前記抽出文から予め設定されている不要語を削除して前
記簡略化した文を生成することを特徴とする請求項1、
請求項2又は請求項3のうちの何れかの1の請求項に記
載の文章処理装置を提供する。請求項5に記載の発明で
は、前記生成手段が、前記抽出文に含まれる語に対し
て、予め設定されている言い換え語が存在する場合に、
前記抽出文に含まれる語を前記言い換え語で置換するこ
とにより前記簡略化した文を生成することを特徴とする
請求項1から請求項4までのうちの何れかの1の請求項
に記載の文章処理装置を提供する。請求項6に記載の発
明では、前記言い換え語が、前記抽出文に含まれる語に
対して、所定の規則にて対応付けられていることを特徴
とする請求項5に記載の文章処理装置を提供する。請求
項7に記載の発明では、前記生成手段が、体言止め化処
理や動詞の言い換え、助動詞の削除、活用語尾の変換な
どによる文末表現簡略化処理によって前記簡略化した文
を生成することを特徴とする請求項1から請求項6まで
のうちの何れかの1の請求項に記載の文章処理装置を提
供する。請求項8に記載の発明では、前記箇条書き文生
成手段が、前記簡略化した文の行頭に数字や文字などの
所定の行頭マークを付加することを特徴とする請求項2
から請求項7までのうちの何れかの1の請求項に記載の
文章処理装置を提供する。請求項9に記載の発明では、
前記箇条書き文生成手段が、前記抽出手段が、まとまっ
た内容をもつ1つ又は複数の文によって構成された文章
において前記内容を提示する表現に関連する文を抽出し
た場合に、前記内容を提示する表現から生成した表題を
前記箇条書き文に付加することを特徴とする請求項3か
ら請求項8までのうちの何れかの1の請求項に記載の文
章処理装置を提供する。請求項10に記載の発明では、
入力文章取得手段と、解析手段と、抽出手段と、生成手
段と、出力手段と、を備えたコンピュータにおいて、前
記入力文書取得手段で、入力文章を取得する入力文章取
得ステップと、前記解析手段で、前記取得した入力文章
を解析する解析ステップと、前記抽出手段で、前記取得
した入力文章、又は前記解析した入力文章から、予め設
定された表現に関連する文を抽出する抽出ステップと、
前記生成手段で、前記抽出した抽出文から簡略化した文
を生成する生成ステップと、前記出力手段で、前記生成
した、簡略化した文を出力する出力ステップと、から構
成されたことを特徴とする文章処理方法を提供する。請
求項11に記載の発明では、入力文章を取得する入力文
章取得機能と、前記入力文章取得機能にて取得した入力
文章を解析する解析機能と、前記取得した入力文章、又
は前記解析した入力文章から、予め設定された表現に関
連する文を抽出する抽出機能と、前記解析機能による解
析結果を用いて、前記抽出機能にて抽出した抽出文から
簡略化した文を生成する生成機能と、前記生成機能にて
生成した、簡略化した文を出力する出力機能と、をコン
ピュータで実現させるための文章処理プログラム又は文
章プログラムを記憶したコンピュータが読み取り可能な
記憶媒体を提供する。
【0007】
【発明の実施の形態】本実施の形態では、入力された文
章の文章構造を使わずに、「最初に」「次に」「最後
に」などの順序を表すキーワード(手がかり語)を使用
して列挙表現を抽出したり、同じ内容についての記述が
続く提題表現を抽出したりなどして、箇条書き表現を生
成する。更に、形態素解析・構文解析を実行して、その
結果から接続詞や副詞などの語(不要語)を削除した
り、文中の語を所定のルールに従って簡潔な語に言い換
えたり、更にサ行変格活用動詞の活用語尾を削除して体
言止め化したり、意味のあまり変わらない助動詞を削除
したりすることで、箇条書きらしい表現を生成する。
【0008】以下、本発明の好適な実施の形態の1例に
ついて、図1ないし図4を参照して詳細に説明する。図
1は、本実施の形態に係る文章処理装置1の構成を概念
的に示した図である。文章処理装置1は、形態素解析部
4、構文解析部6、簡略表現生成部10、文章構造生成
部14、形態素解析辞書2、構文解析辞書8、簡略表現
辞書12などから構成されている。
【0009】後に説明するように、文章処理装置1は、
例えばパーソナルコンピュータ(以下PCと記す)によ
って構成される。この場合例えば、形態素解析部4、構
文解析部6、簡略表現生成部10、文章構造生成部1
4、はそれぞれプログラムがCPU(Central
Processing Unit)にロードされてソフ
トウェア的に実現され、形態素解析辞書2、構文解析辞
書8、言い換え辞書12は、それぞれ記憶装置に記憶さ
れたデータベースとして構成される。
【0010】入力文章16は、例えば、テキストなどの
文章ファイルであり、箇条書きを生成する元となる文章
である。入力文章16は、段落単位であっても良いし、
1文書であっても良い。入力文章16は、例えば学術論
文や業務報告書、企画書などの文章ファイルであって、
タイトルや章見出し、改行を伴った箇条書きなどの文書
構造を持たないいわゆるべたの文章であっても良い。こ
こで、べたの文章とは、表示面全面に渡って密に書かれ
た文章のことである。
【0011】入力パラメータ18は、箇条書き1項目あ
たりの文字数の上限や、箇条書きの行頭につける行頭マ
ークなどを設定するパラメータであって、これらはユー
ザが設定するようになっている。ここで、行頭マークと
は、例えば、1、2、3、・・・、とか、a、b、c、
・・・、或いは、”・”記号など、各箇条書きの行の先
頭につける数字、文字、記号などである。
【0012】なお、本実施の形態では、入力パラメータ
18は、ユーザが設定するものとするが、これに限定す
るものではなく、予めデフォルト値を設定しておき、必
要に応じてユーザが入力パラメータ18を変更するよう
にしても良い。又は、入力パラメータ18を予め設定さ
れたデフォルト値に固定してしまうことも可能である。
入力パラメータ18のデフォルト値としては、例えば、
箇条書き1項目あたりの文字数の上限を30文字、行頭
マークを”・”記号などとすることができる。
【0013】形態素解析部4は、文章処理装置1に入力
された入力文章16を取得し、形態素解析辞書2を参照
しながらこれを形態素解析するモジュールである。ここ
で、形態素解析とは、与えられた文を形態素の並びに分
解し、それぞれの形態素の属性(品詞、活用、数、性、
人称、格など)を決定することであり、公知として一般
に行われているものである。なお、形態素とは、意味を
持つ最小の言語単位である。
【0014】形態素解析辞書2は、様々な形態素に対し
てそれらの品詞、活用、数、性、人称、格などを関連付
けたデータベースである。形態素解析部4は、形態素解
析辞書2を用いて入力文章2を形態素に分解し、各々の
形態素の品詞などを決定していく。形態素解析部4は、
形態素解析した文章(形態素リスト)を構文解析部6に
出力する。
【0015】構文解析部6は、形態素解析部4から取得
した形態素リストを構文解析辞書8を用いて構文解析
し、箇条書き表現を生成する元となる文(抽出文)を抽
出する。構文解析により、文の入れ子構造や係り受け、
後に述べるように提題が省略されている場合に、提題が
省略されていることなど、文の構造について知ることが
できる。抽出文は、形態素リスト中にあらわれる手がか
り語及び提題表現を用いて抽出される。
【0016】手がかり語とは、項目を列挙する列挙表現
を表す語であって、例えば「最初に」、「初めに」、
「次に」、「最後に」とか、「1番目に」、「2番目
に」、あるいは、「第1に」、「第2に」などといった
語がある。提題表現とは、まとまった内容をもつ1つ又
は複数の文で構成された文章の主題や論題など提示する
表現であって、例えば「〜は」とか「〜とは」といった
形式で文章中にあらわれる。
【0017】構文解析辞書8は、各種の手がかり語や提
題解析ルールを格納したデータベースである。ここで、
提題解析ルールとは、文章中に、名詞句が助詞「は」を
伴う形で出現する提題の認定と、認定された提題の記述
がどこまで続いているかを決定するための規則群が記述
されたものである。構文解析部6は、構文解析辞書8に
格納されている手がかり語や提題表現ルールを参照しな
がら、形態素リストを分析し、手がかり語あるいは提題
表現を含む文を抽出する。なお、本実施の形態では、形
態素解析及び構文解析をした後に所定の文を抽出した
が、これに限定するものではなく、抽出した文に対して
所定の解析を行うように構成することも可能である。
【0018】また、提題が省略されてはいるが、明らか
に以前の文の提題を含む文も多い。これら1つの文を超
える提題についても、解析可能であれば抽出し、ある事
柄について書かれた文の説明を箇条書きの表現として生
成する。構文分析部6は、手がかり語又は提言表現を含
む抽出文を簡略表現生成部10に出力する。
【0019】簡略表現生成部10は、構文解析部6が抽
出した抽出文と入力パラメータとして1項目あたりの文
字数を受け取り、簡略表現辞書12を参照しながら、後
に説明する不要語削除、言い換え処理、文末表現簡略化
処理などを行う。簡略表現生成部10により、抽出文か
ら格要素と動詞句からなる文の骨格を抜き出し、文末表
現を簡略化して、箇条書きらしい簡潔な表現を生成する
ことができる。簡略表現生成部10は、簡略化して生成
した文(以下生成文と記す)を文章構造生成部14に出
力する。なお、簡略表現生成部10は、入力パラメータ
として取得した1項目あたりの文字数内に収まるよう
に、不要語削除、言い換え処理を行う。
【0020】不要語削除は、所定の不要語削除ルールに
従って、抽出文から文の意味の本質と関係の薄い語を削
除する処理である。以下に不要語削除ルールの例を幾つ
か示す。 (1)不要語のリスト(以下不要語リストと記す)を生
成しておき、抽出文中に不要語リストにリストアップさ
れている語がある場合は、その語を抽出文から削除す
る。不要語リストにリストアップされる語としては、例
えば副詞句、接続詞、感動詞、独立語などを文の意味と
直接関わらないものなどがある。 (2)固有名詞句に係る名詞句、動名詞句を削除する。
このルールによって、例えば「〜した日本」という表現
は単に「日本」となる。 (3)「〜によれば」などの従属的な表現を削除する。
【0021】言い換え処理は、意味のあまり変わらない
助動詞やサ行変格活用動詞の活用語尾を削除したり、長
い名詞句を短い名詞句に変換したりして、抽出文をより
箇条書きらしい表現に言い換える処理である。
【0022】一般動詞をサ行変格活用動詞に変換する場
合は、例えば「図を作る」→「作図する」と変換され
る。更に体言止めを行うことにより「作図する」→「作
図」と変換される。この他に、例えば「はっきり述べ
る」→「明言する」→「明言」とか、「指導にあたる」
→「指導する」→「指導」などと変換する。
【0023】長い名詞句を短い名詞句に変換する場合
は、例えば「内閣総理大臣」→「首相」、「日本銀行」
→「日銀」などの変換がある。これらの言い換え表現に
よって、元の文章になかった表現を新たに生成すること
ができる他、文末表現を箇条書きにふさわしい表現にす
ることができる。
【0024】簡略表現辞書12には、不要語削除に関し
ては不要語リストや、不要語削除ルールなどが格納さ
れ、言い換え処理に関しては、各種の一般動詞と当該一
般動詞に対応するサ行変格活用動詞、及び長い名詞句と
当該長い名詞句に対応する短い名詞句などがデータベー
スとして格納されている。簡略表現生成部10は、これ
らの不要語削除ルールや言い換え処理に関する情報を簡
略表現辞書12から読み出して、これに基づいて不要語
削除、言い換え処理、文末表現簡略化処理などを行う。
【0025】文章構造生成部14は、生成文と、箇条書
きの行頭マーク種別(入力パラメータ)を受け取り、各
生成文の行頭に当該列挙表現の項目名を付加して箇条書
き表現データ20を出力する。文章構造生成部14は、
箇条書き表現20を例えばテキストファイルなど、所定
の形式のファイルとして出力する。また、生成文が提題
表現の抽出文から生成されたものの場合は、提題をタイ
トルとして、当該タイトルのしたに、箇条書きを列挙す
ることができる。
【0026】箇条書きの行頭マーク種別は、例えば1、
2、3、・・・、といった行頭番号やa、b、c、・・
・、といった行頭文字、あるいは、”・”といった行頭
記号などを指定することができる。例えば列挙表現の項
目名として行頭番号が指定されている場合は、文章構造
生成部14は、「1.〜」、「2.〜」、・・・、とい
ったように、連番を行頭番号として各箇条書き文の行頭
に付加する。
【0027】以下に、手がかり語を元に箇条書きを生成
する場合の例を示す。 (例文1)「最初にtest.exeをクリックして、
ハードディスクの任意の場所に保存します。次に、ダウ
ンロードしたexeファイルが、記載のサイズと同じで
あることを確認します。最後に、ダウンロードしたファ
イルのフルパス名を入力し、OKをクリックします。」
【0028】文章処理装置1は、例文1から以下の手順
で箇条書きを生成する。まず、形態素解析部4で形態素
解析した後、構文解析部6で列挙表現を探索して列挙表
現が含まれる文を抽出する。例文1の場合、列挙表現
「最初に」、「次に」、「最後に」が含まれている。
【0029】次に、簡略表現生成部10が、抽出文に対
して不要語削除・体言止め化処理などを行って簡略化す
る。例えば、「最初にtest.exeをクリックし
て、ハードディスクの任意の場所に保存します。」に対
しては、「最初に」を削除し、文末の「保存します」
は、「保存します」→「保存する」→「保存」というよ
うに丁寧の助動詞「ます」を削除したあと活用語尾を削
除することで体言止め化処理を行う。
【0030】次に、文章構造生成部14が、予め指定さ
れた箇条書きの行頭マーク種別と、簡略表現生成部10
が簡略化した文を並べて出力する。ここでは、列挙表現
の項目名として数字を指定したものとする。以上の作業
により例文1から次のような箇条書きが生成される。
【0031】1.test.exeをクリックして、ハ
ードディスクの任意の場所に保存 2.ダウンロードしたexeファイルが、記載のサイズ
と同じであることを確認 3.ダウンロードしたファイルのフルパス名を入力し、
OKをクリック
【0032】次に、提題表現を元に箇条書きを生成する
場合の例を示す。 (例文2)「”ネット・イット・プラス”は、あらゆる
ファイル形式のドキュメントをWebブラウザだけで共
有/活用できる文書活用型のナレッジマネジメント・ソ
リューションです。社内のファイルサーバに蓄積された
報告書、提案書、企画書、顧客の声などの文書情報を、
自動的にWebサイトに公開し、Webブラウザだけで
検索、表示して活用できます。社内に蓄積された大量の
文書データをすぐに知識資産として活用できるため、あ
らゆる企業ナレッジマネッジメントに活用して頂ける製
品です。」
【0033】以上の例文に対し、形態素解析部4が形態
素解析を行う。次に構文解析部6が構文解析を実行して
文頭から表題「”ネット・イット・プラス”は、」を抽
出する。また、2番目の文「社内の〜」は、提題「”ネ
ット・イット・プラス”は、」が省略されているが、こ
のように文を超える提題を含む文についても解析可能で
あれば抽出する。
【0034】次に、簡略表現生成部10で不要語削除、
言い換え処理及び文末表現の簡略化処理を行う。例え
ば、「社内のファイルサーバに蓄積された報告書、提案
書、企画書、顧客の声などの文書情報を、自動的にWe
bサイトに公開し、Webブラウザだけで検索、表示し
て活用できます。」という文に対しては、「社内のファ
イルサーバに蓄積された報告書、提案書、企画書、顧客
の声など」を不要語として削除し(1文から箇条書き1
項目を生成する場合)、「活用できます」は「活用可
能」に言い換え処理する。
【0035】次に、文章構造生成部14が提題表現を列
挙表現のタイトルとして、その提題についての説明文を
以下のように列挙する。なお、箇条書き項目の生成は入
力パラメータ18によって、1文から1項目を生成する
か、或いは1文から複数項目を生成するかを設定するこ
とが可能であり、箇条書きの生成例として両者を示す。
【0036】(1文から1項目を生成する場合) ”ネット・イット・プラス” ・文書活用型のナレッジマネジメント・ソリューション ・文書情報を、自動的にWebサイトに公開し、Web
ブラウザだけで検索、表示して活用可能 ・あらゆる企業ナレッジマネッジメントに活用できる製
【0037】(1文から複数項目を生成する場合) ”ネット・イット・プラス” ・あらゆるファイル形式のドキュメントをWebブラウ
ザだけで共有/活用可能 ・文書活用型のナレッジマネジメント・ソリューション ・社内のファイルサーバに蓄積された顧客の声などの文
書情報をWebサイトに公開 ・蓄積された顧客の声などの文書情報をWebブラウザ
だけで検索、表示して活用可能 ・社内に蓄積された大量の文書データをすぐに知識資産
として活用可能 ・あらゆる企業のナレッジマネジメントに活用できる製
【0038】従来の箇条書きを生成する装置は、既に箇
条書きとして文章に含まれるものから箇条書き表現デー
タなどを生成するのに対し、本実施の形態の文章処理装
置1は、べたの文章から手がかり語、提題表現を手がか
りにして箇条書きを生成することができる。このとき、
言い換え表現処理によって本来文章中に含まれていなか
った簡潔な表現を新たに生成することができ、更に文末
表現簡略化処理によって箇条書きらしい文末表現を得る
ことができる。
【0039】図2(a)は、文章処理装置1をPCを用
いて構成した場合の構成図である。文章処理装置1は、
制御部26にバスライン43を介して入力装置34、出
力装置38、通信制御装置42、記憶装置48、記憶媒
体駆動装置46、入出力インターフェース44などが接
続して構成されている。
【0040】制御部26は、箇条書き生成プログラムな
どに従って入力文章16から箇条書きを表現データ20
を生成したり、文章処理装置1全体を制御したりなどす
る。制御部26は、CPU28、ROM(Read O
nly Memory)30、RAM(Random
Access Memory)30などから構成されて
いる。
【0041】ROM30は、CPU28が各種演算や制
御を行うための各種プログラム、データ及びパラメータ
などを格納したリードオンリーメモリである。CPU2
8は、ROM30からプログラムやデータ、パラメータ
などを読み込むことはできるが、これらを書き換えたり
消去することはできない。
【0042】RAM32は、CPU28にワーキングメ
モリとして使用されるランダムアクセスメモリである。
CPU28は、RAM32にプログラムやデータなどを
書込んだり消去したりすることができる。本実施の形態
では、RAM32には、CPU28が入力文章16の格
納、形態素解析、構文解析(手がかり語、提題表現の抽
出)、簡略表現の生成(不要語削除、言い換え処理、文
末表現簡略化処理)、文書構造の生成(箇条書き表現デ
ータの生成)などを行うためのエリアが確保可能となっ
ている。
【0043】入力装置34は、例えばキーボードやマウ
スなどの入力装置から構成されている。キーボードは、
文章処理装置1に対して文字や数字などの情報を入力す
るための装置である。キーボードは、カナや英文字など
を入力するためのキーや数字を入力するためのテンキ
ー、各種機能キー、カーソルキー及びその他のキーによ
って構成されている。
【0044】キーボートは、例えばユーザが文章処理装
置1にログインするためのログインIDやパスワードを
入力したり、あるいは箇条書き生成プログラム50に従
って表示装置に表示される画面の各種入力欄に必要なデ
ータ(例えば入力パラメータ18など)を入力する際に
使用する。また、文章処理装置1をテキストエディタや
ワープロソフトなどが実装している場合は、これらのソ
フトウェアを用いてキーボードから入力文章16を直接
文章処理装置1に入力することも可能である。
【0045】マウスは、ポインティングデバイスであ
る。GUI(Graphical User Inte
rface)などを用いて文章処理装置1を操作する場
合、表示装置上に表示されたボタンやアイコンなどをマ
ウスでクリックすることにより、所定の情報の入力を行
うことができる。
【0046】出力装置38は、例えば表示装置、印刷装
置などのから構成されている。表示装置は、例えば例え
ばCRT(Cathode Ray Tube)ディス
プレイ、液晶ディスプレイ、プラズマディスプレイなど
で構成された情報を画面上に提示するための装置であ
る。表示装置は、キーボードやマウスの入力結果や、入
力文章16、生成した箇条書きなどを表示することがで
きる。
【0047】印刷装置は、例えば、生成した箇条書き表
現データ20や、入力文章16をテキストの形で紙など
の印刷媒体に印刷する装置である。印刷装置は、例え
ば、インクジェットプリンタ、レーザプリンタ、熱転写
プリンタ、ドットプリンタなどの各種プリンタ装置によ
って構成されている。
【0048】通信制御装置42は、専用回線10を介し
て文章処理装置1を端末装置9に接続するための装置で
あって、モデム、ターミナルアダプタその他の装置によ
って構成されている。通信制御装置42は、例えばイン
ターネットやLAN(Local AreaNetwo
rk)などに接続しており、これらのネットワークに接
続した他の端末装置あるいはサーバ装置などから通信に
よって入力文章16を受信したり、あるいはこれらの装
置に対して箇条書き表現データ20を送信したりするこ
とができる。通信制御装置42はCPU28によって制
御され、所定のプロトコルに従ってこれら端末装置やサ
ーバ装置との信号及びデータの送受信を行う。
【0049】記憶装置48は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータを読み書
きするための駆動装置によって構成されている。当該記
憶媒体として主にハードディスクが使用されるが、その
他に、例えば、光磁気ディスク、磁気ディスク、半導体
メモリなどの他の読み書き可能な記憶媒体によって構成
することも可能である。
【0050】記憶装置48は、箇条書きプログラム5
0、その他のプログラム52、形態素解析辞書54、構
文解析辞書56、簡略表現辞書58、その他のデータ6
0などが記憶されている。箇条書きプログラム50は、
CPU28に箇条書き生成機能を発揮させるためのプロ
グラムであって、後に説明する様に各モジュールから構
成されている。
【0051】その他のプログラム52は、例えば、通信
制御装置42を制御し、文章処理装置1とネットワーク
でつながれた端末装置やサーバ装置との通信を維持する
通信プログラムや、メモリ管理や入出力管理などの文章
処理装置1を動作させるための基本ソフトウェアである
OS(Operating System)などで構成
されている。
【0052】CPU28は、記憶装置48の駆動装置を
駆動することにより、記憶装置48に対してプログラム
やデータの読み書きを行うことができる。その他のデー
タ60に入力文章16を格納しておき、記憶装置48を
駆動してCPU28が入力文章16を読み込んで取得す
ることができる。このように、記憶装置48は、入力文
章取得手段として使用することができる。
【0053】記憶媒体駆動装置46は、着脱可能な記憶
媒体を駆動してデータの読み書きを行うための駆動装置
である。着脱可能な記憶媒体としては、例えば、光磁気
ディスク、磁気ディスク、磁気テープ、半導体メモリ、
データをパンチした紙テープ、CD−ROMなどがあ
る。なお、CD−ROMや紙テープは、読み込みのみ可
能である。
【0054】文章処理装置1は、記憶媒体駆動装置46
によって記憶媒体を駆動することにより、入力文章16
を記録した記憶媒体から入力文章16を取得したり、あ
るいは、生成した箇条書き表現データ20を記憶媒体駆
動装置に出力することができる。このように、記憶媒体
駆動装置46は、入力文章取得手段として使用すること
ができる。
【0055】入出力インターフェース44は、例えば、
シリアルインターフェースやその他の規格のインターフ
ェースにより構成されている。入出力インターフェース
44に当該インターフェースに対応した外部機器を接続
することにより、文章処理装置1の機能を拡張すること
ができる。このような外部機器として例えば、ハードデ
ィスクなどの記憶装置、スピーカ、マイクロフォンなど
がある。
【0056】図2(b)は、箇条書き生成プログラム5
0を構成するモジュールを示した図である。箇条書き生
成プログラム50は、形態素解析モジュール62、構文
解析モジュール64、簡略表現モジュール66、文構造
生成モジュール68などから構成されている。
【0057】CPU28は、構文解析モジュール64を
ロードして実行することにより、手がかり語や提題表現
を含んだ文を抽出する抽出手段として作用することがで
きる。また、CPU28は、簡略表現モジュール66を
ロードして実行することにより、抽出した文を不要語削
除処理、言い換え処理、文末表現簡略化処理などして抽
出した文を簡略化した文を生成する生成手段として作用
することができる。
【0058】更に、CPU28は、文構造生成モジュー
ル68をロードして実行することにより、簡略化した文
を列挙して箇条書き文(箇条書き表現データ)を生成す
る箇条書き文生成手段として作用することができる。ま
た、CPU28は、文構造生成モジュール68によって
生成した箇条書き表現データを記憶装置48や記憶媒体
駆動装置46に装着された記憶媒体などに出力する出力
手段として作用することができる。
【0059】CPU28は、これらのモジュールをロー
ドして実行することにより各種機能を発揮することがで
きる。形態素解析モジュール62、構文解析モジュール
64、簡略表現モジュール66、文構造生成モジュール
68は、それぞれCPU28によって実行されることに
より、図1に示した形態素解析部4、構文解析部6、簡
略表現生成部10、文章構造生成部14をソフトウェア
的に構成する。
【0060】図3は、箇条書き生成画面70の一例を示
した図である。箇条書き生成画面70は、CPU28が
箇条書き生成プログラム50に従って表示装置に表示し
たものである。ユーザは、箇条書き生成画面70から入
力文章16や入力パラメータを入力したり、生成された
箇条書きを表示させたり保存させたりすることができ
る。
【0061】箇条書き生成画面70は、入力文章入力欄
72、入力文章表示欄78を含んでいる。入力文章入力
欄72は、箇条書きを生成する元となる入力文章16の
ファイル名を入力する欄である。この入力はキーボード
から直接ファイル名を入力しても良いし、又は、ボタン
73をクリックして記憶装置48や記憶媒体駆動装置4
6で駆動されている記憶媒体などに記憶されているファ
イルの一覧を表示させ、表示されたファイル名をクリッ
クして選択しても良い。なお、クリックは、ポインタ8
4をマウスを用いて移動させ、所望のボタンやアイコン
などに対して行うことができる。
【0062】入力文章表示欄78は、入力文章入力欄7
2で指定された文章を表示する欄である。ユーザは、入
力文章表示欄78に表示された文章を確認することによ
り、これから箇条書きを生成する文章が所望のものであ
るか否かを確認することができる。
【0063】箇条書き生成画面70は、更に文字数入力
欄86、列挙表現指定欄88を含んでいる。ユーザは、
これらの欄から入力パラメータ18を入力することがで
きる。文字数の入力欄86は、箇条書き1項目あたりの
文字数の上限を入力する欄であり、キーボードから入力
することができる。
【0064】列挙表現指定欄88は、箇条書きの各行頭
につける数字や文字を指定する欄である。数字を指定し
た場合、箇条書きの各行の行頭にはシリアルナンバー
1、2、3、・・・、が自動的に添付される。ボタン9
0をクリックすると添付可能な列挙表現の一覧が表れ、
ユーザは、その何れかをクックすることにより列挙表現
を指定することができる。可能な列挙表現としては例え
ば数字、英大文字A、B、C、・・・、英小文字a、
b、c、・・・、記号”・”、”※”、・・・、などが
ある。
【0065】箇条書き生成画面70は、更に実行ボタン
80、保存先入力欄76、箇条書き表示欄82を含んで
いる。実行ボタン80は、箇条書き生成プログラム50
の箇条書き生成機能を実行させるためのボタンである。
ユーザが実行ボタン80をクリックするとCPU28
は、入力文章16から箇条書き表現データ20を生成す
る。
【0066】箇条書き表示欄82は、生成された箇条書
きが表示される欄である。保存先入力欄76には、箇条
書き表現データ20を保存する保存先とファイル名を指
定する欄である。ボタン77をクリックすると記憶装置
48や記憶媒体駆動装置46で駆動されている記憶媒体
などに記憶されているディレクトリなどの一覧が表示さ
れ、ユーザは、表示されたディレクトリをクリックする
ことにより箇条書き表現データ20を格納するディレク
トリを選択することができる。箇条書き表現データ20
のファイル名は、キーボードを用いて入力することがで
きる。
【0067】図4は、文章処理装置1の動作の一例を示
したフローチャートである。まず、文章処理装置1は、
箇条書きを生成する元となる入力文章16を取得する
(ステップ10)。これは、例えば入力文章16を記憶
装置48やRAM32などに格納してCPU28が処理
できる状態にするものである。
【0068】次に、CPU28は、例えばユーザのキー
ボード操作などにより入力パラメータを取得する(ステ
ップ15)。入力パラメータは、各箇条書きの文字数の
上限や1、2、3、・・・、などの各箇条書きの行頭に
付加する列挙表現などから構成されている。次に、CP
U28は、形態素解析辞書2を用いながら入力文章16
を形態素解析して形態素リストを生成する(ステップ2
0)。
【0069】次に、CPU28は、構文解析辞書8を用
いながら形態素リストを構文解析する(ステップ3
0)。構文解析により、例えば、ある提題表現にて提示
される提題がどの文にまで及んでいるかなど、入力文章
16の構造を把握することができる。CPU28は構文
解析した入力文章16から、構造解析辞書8に記録され
ている手がかり語を参照しながら、文章中最初に出てく
る手がかり語を検索する(ステップ40)。手がかり語
がある場合は(ステップ50;Y)、CPU28は手が
かり語を含む文を抽出してRAM32に格納する(ステ
ップ60)。
【0070】次に、CPU28はステップ40に戻り、
入力文章16の中に次に出てくる手がかり語を検索し、
同様に抽出する。CPU28は、以上の動作を入力文章
16中の全ての手がかり語に対して行う。
【0071】CPU28が、ステップ50で入力文章1
6中に手がかり語が無いと判断した場合、即ち、入力文
章16に含まれる全ての手がかり語を含む文を抽出し終
えたか、あるいは入力文章16に最初から手がかり語が
含まれていなかった場合は(ステップ40;N)、CP
U28は、構文解析辞書8に記憶されている提題解析ル
ールを参照しながら入力文章16に含まれる最初の提題
表現を検索する(ステップ80)。
【0072】入力文章16中に提題表現があった場合は
(ステップ90;Y)、CPU28は、提題表現を含む
文を抽出してRAM32に格納する(ステップ10
0)。次に、CPU28はステップ80に戻り、入力文
章16中に含まれる次の提題表現を検索する(ステップ
80)。この場合、構文解析の結果を用いて提題が省略
されていると判断できる場合は、提題があるものとして
扱われる。CPU28は、以上の動作を入力文章16中
の全ての提題表現について行い、入力文章16に含まれ
る提題表現を含む全ての文を抽出する。
【0073】ステップ80にて、CPU28が入力文章
16中に提題表現が無いと判断した場合、即ち、入力文
章16中の全ての提題表現を含む文が抽出された場合、
あるいは最初から入力文章16中に提題表現を含む文が
なかった場合は、CPU28は、RAM32に抽出した
文があるか否かを判断する(ステップ110)。
【0074】CPU28が、RAM32に抽出文が格納
されていないと判断した場合は(ステップ110;
N)、箇条書きを生成する文が無いので作業を終了す
る。CPU28が、RAM32に抽出文が格納されてい
ると判断した場合は(ステップ110;Y)、CPU2
8は、簡略表現辞書12の不要語リストを参照しながら
抽出文から不要語を削除する(ステップ120)。
【0075】次に、CPU28は、簡略表現辞書12を
参照しながら全ての抽出文に対して、言い換え処理を行
う(ステップ130)。次に、CPU28は、全ての動
詞句に対して意味のあまり変わらない助動詞の削除処理
を行うと共に、文末の動詞句に対してはサ行変格活用動
詞の活用語尾の削除により体言止め化処理も行う(ステ
ップ140)。即ちステップ140では文末表現簡略化
処理を行う。CPU28は、ステップ120からステッ
プ140までの各ステップで生成する生成文の文字数が
入力パラメータで指定した文字数内に収まるようにす
る。
【0076】次に、CPU28は、生成文の行頭に入力
パラメータで指定された行頭マークを付加し、更に生成
文が提題表現から生成されたものである場合は、提題を
タイトルとして付加した後、箇条書き表現20を出力す
る(ステップ160)。
【0077】なお、以上に説明した動作では、不要語削
除処理(ステップ120)、言い換え処理(ステップ1
30)、文末表現簡略化処理(ステップ140)の順で
処理したが、これに限定するものでなく、言い換え処理
(ステップ130)、文末表現簡略化処理(ステップ1
40)を行った後に不要語削除処理(ステップ120)
を行っても良い。但し、言い換え処理(ステップ13
0)は文末表現簡略化処理(ステップ140)の前に行
う必要がある。
【0078】以上に説明した本実施の形態では、以下の
効果を得ることかできる。入力文章16が、予め箇条書
きが記載されていないべたの文章であっても手がかり語
や提題表現を元にして箇条書きを生成することができ
る。また、言い換え処理によって、元の入力文章16に
含まれていなかった語を用いて箇条書きらしい簡潔な表
現の文を生成することができる。生成する箇条書き表現
の行頭に付加する行頭マークをユーザが指定することが
できる。
【0079】プレゼンテーションソフトにおいて、テキ
ストを読み込んでプレゼンテーション資料を自動生成す
る「テキスト読込モード」を実現することが可能とな
る。また、要約ソフトの拡張として、より短時間で文章
内容を把握できる「箇条書き生成オプション」を実現可
能となる。一般に、重要文抽出を元にして箇条書きを生
成した場合、箇条書き項目どうしが脈絡の無いものにな
りがちである。本実施の形態では、手順や同一項目に対
する説明の箇条書き化が可能である。
【0080】なお、本実施の形態では、同一項目に対す
る説明を並べる、手順を記述する、という箇条書き化の
目的以外にも派生的な使用方法が考えられる。例えば、
「(〜する)と」「(〜し)たら」「(〜すれ)ば」な
どの条件を表す手がかり語や、「(〜した)ので」など
の理由を表す手がかり語を解析して、判定した箇条書き
項目の付加的な情報を抽出するように構成することもで
きる。
【0081】なお、本実施の形態の文章処理装置1は、
以下に示すような用途に使用することができる。 (1)長文からエッセンスを抜き出し分かりやすく提示
する。これは、例えば新聞の論説などを箇条書きに変換
することにより、論説の内容をやさしく短時間に理解す
ることができる。 (2)プレゼンテーション用アプリケーションで、テキ
スト入力からの箇条書きを自動生成する。これは、例え
ば、学術論文などを用いて公演用のスライドを作成する
場合、当該論文のテキストデータから即座にスライド用
の箇条書きを生成することができる。
【0082】(3)携帯端末装置の限られた表示画面で
長文を閲覧できるように変換する。これは、例えば携帯
電話などの小さな液晶画面に表示しきれない長文であっ
ても、長文を箇条書きに変換することにより、表示可能
となる。 (4)ワープロなどの文章処理アプリケーションにおけ
て箇条書きを自動生成する。ワープロなどの文章処理装
置は、箇条書き生成機能と似た機能として文章要約機能
を備えている。この機能を使用すると時として脈絡の無
い要約が生成される場合がある。本実施の形態は、文章
解析により文章の内容に基づいて箇条書きを生成するた
め、論旨の通った箇条書きを生成することができる。
【0083】本実施の形態の応用例としては例えば以下
の3つのようなことが考えられる。 1.外国語の文章から箇条書きを生成する。 文章処理装置1の各辞書(形態素解析辞書2、構文解析
辞書8、簡略表現辞書12)と形態素解析エンジンと
を、外国語版(英語、独語、仏語、露語、中国語、韓国
語、アラビア語、ペルシャ語など)に変更することで、
これらの外国語の文章から自動的に箇条書きを生成する
ことができる。
【0084】構文解析エンジンは多言語に対応したもの
が既にあり、また、形態素解析エンジンも多言語に対応
したものが既にある。そのため、各言語用の辞書を用意
することで、文章処理装置1は多言語対応可能となる。
手がかり語としては、例えば英語の場合、「firs
t」「second」「last」「firstly」
「secondly」「finally」などがある。
【0085】また、提題表現に対応する言語現象が存在
する言語の場合、提題表現を用いて箇条書きを生成する
ことも可能である。例えば、英語の場合は代名詞化した
主題について、その照応関係を解析することである程度
の対応は可能である。
【0086】2.用語集を作成する。 「名詞+とは」や「名詞+というのは」などで表現され
る定義文を抽出することにより、本や論文あるいはホー
ムページ上から、そこで使用されている用語集を作成す
ることができる。
【0087】例えば、以下の例文があったとする。 (例文3)RASとは、遠隔地からアクセスするための
サーバです。また、インデックスサーバとは、索引を作
成するサーバです。 例文3から以下のように用語集が作成される。 RAS:遠隔地からアクセスするためのサーバ インデックスサーバ:索引を作成するサーバ
【0088】3.年表を作成する。 時間的表現を抽出し、「時間;事柄」の形式で出力する
ことにより年表を作成することができる。感謝のプロフ
ィールなどの記述されている文章(例えば「〇年〇月に
会社を設立して・・・〇年〇月上場した。・・・」とい
ったような文章)があったときに、、「〇年〇月」「〇
年後」「〇ヶ月後」などの時間的表現を抽出し、会社の
年表を自動生成することができる。相対的な時間表現に
対して、基準となる時間表現が特定できる場合は、相対
的な時間表現と基準となる時間表現から、絶対的な時間
表現に変換する。例えば、相対的な表現が「3年後」、
基準となる表現が「1990年」であれば、絶対的な表
現は「1993年」となる。
【0089】以上、本実施の形態の構成及び処理動作に
ついて説明したが、本発明は、これらの形態に限定され
るものではなく、請求項に記載された発明の範囲内で種
々の変形が可能である。
【0090】
【発明の効果】本発明によれば、文章の内容から箇条書
き表現を自動生成することができる。
【図面の簡単な説明】
【図1】本実施の形態に係る文章処理装置の構成を概念
的に示した図である。
【図2】(a)は、文章処理装置をPCを用いて構成し
た場合の構成図であり、(b)は、箇条書き生成プログ
ラムを構成するモジュールを示した図である。
【図3】表示装置に表示された箇条書き生成画面の一例
を示した図である。
【図4】文章処理装置の動作の一例を示したフローチャ
ートである。
【符号の説明】
1 文章処理装置 2 形態素解析辞書 4 形態素解析部 6 構文解析部 8 構文解析辞書 10 簡略表現生成部 12 簡略表現辞書 14 文章構造生成部 16 入力文章 18 入力パラメータ 20 箇条書き表現データ 26 制御部 28 CPU 30 ROM 32 RAM 34 入力装置 38 出力装置 42 通信制御装置 43 バスライン 44 入出力インターフェース 46 記憶媒体駆動装置 48 記憶装置 50 箇条書き生成プログラム 52 その他のプログラム 54 形態素解析辞書 56 構文解析辞書 58 簡略表現辞書 60 その他のデータ 62 形態素解析モジュール 64 構文解析モジュール 66 簡略表現生成モジュール 68 文構造生成モジュール 70 箇条書き生成画面 72 入力文章入力欄 73 ボタン 76 保存先入力欄 77 ボタン 78 入力文章表示欄 80 実行ボタン 82 箇条書き表示欄 84 ポインタ 86 文字数入力欄 88 列挙表現指定欄

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 入力文章を取得する入力文章取得手段
    と、 前記入力文章取得手段にて取得した入力文章を解析する
    解析手段と、 前記取得した入力文章、又は前記解析した入力文章か
    ら、予め設定された表現に関連する文を抽出する抽出手
    段と、 前記解析手段による解析結果を用いて、前記抽出手段に
    て抽出した抽出文から簡略化した文を生成する生成手段
    と、 前記生成手段にて生成した、簡略化した文を出力する出
    力手段と、 を具備したことを特徴とする文章処理装置。
  2. 【請求項2】 前記生成手段にて生成された、簡略化し
    た文を列挙して箇条書き文を生成する箇条書き文生成手
    段を更に具備し、 前記出力手段は、前記箇条書き文生成手段にて生成され
    た箇条書き文を出力することを特徴とする請求項1に記
    載の文章処理装置。
  3. 【請求項3】 前記予め設定された表現は、予め設定さ
    れた所定の語、又はまとまった内容をもつ1つ又は複数
    の文によって構成された文章において前記内容を提示す
    る表現であることを特徴とする請求項1又は請求項2に
    記載の文章処理装置。
  4. 【請求項4】 前記生成手段は、前記抽出文から予め設
    定されている不要語を削除して前記簡略化した文を生成
    することを特徴とする請求項1、請求項2又は請求項3
    のうちの何れかの1の請求項に記載の文章処理装置。
  5. 【請求項5】 前記生成手段は、前記抽出文に含まれる
    語に対して、予め設定されている言い換え語が存在する
    場合に、前記抽出文に含まれる語を前記言い換え語で置
    換することにより前記簡略化した文を生成することを特
    徴とする請求項1から請求項4までのうちの何れかの1
    の請求項に記載の文章処理装置。
  6. 【請求項6】 前記言い換え語は、前記抽出文に含まれ
    る語に対して、所定の規則にて対応付けられていること
    を特徴とする請求項5に記載の文章処理装置。
  7. 【請求項7】 前記生成手段は、体言止め化処理や動詞
    の言い換え、助動詞の削除、活用語尾の変換などによる
    文末表現簡略化処理によって前記簡略化した文を生成す
    ることを特徴とする請求項1から請求項6までのうちの
    何れかの1の請求項に記載の文章処理装置。
  8. 【請求項8】 前記箇条書き文生成手段は、前記簡略化
    した文の行頭に数字や文字などの所定の行頭マークを付
    加することを特徴とする請求項2から請求項7までのう
    ちの何れかの1の請求項に記載の文章処理装置。
  9. 【請求項9】 前記箇条書き文生成手段は、前記抽出手
    段が、まとまった内容をもつ1つ又は複数の文によって
    構成された文章において前記内容を提示する表現に関連
    する文を抽出した場合に、前記内容を提示する表現から
    生成した表題を前記箇条書き文に付加することを特徴と
    する請求項3から請求項8までのうちの何れかの1の請
    求項に記載の文章処理装置。
  10. 【請求項10】 入力文章取得手段と、解析手段と、抽
    出手段と、生成手段と、出力手段と、を備えたコンピュ
    ータにおいて、 前記入力文書取得手段で、入力文章を取得する入力文章
    取得ステップと、 前記解析手段で、前記取得した入力文章を解析する解析
    ステップと、 前記抽出手段で、前記取得した入力文章、又は前記解析
    した入力文章から、予め設定された表現に関連する文を
    抽出する抽出ステップと、 前記生成手段で、前記抽出した抽出文から簡略化した文
    を生成する生成ステップと、 前記出力手段で、前記生成した、簡略化した文を出力す
    る出力ステップと、 から構成されたことを特徴とする文章処理方法。
  11. 【請求項11】 入力文章を取得する入力文章取得機能
    と、 前記入力文章取得機能にて取得した入力文章を解析する
    解析機能と、 前記取得した入力文章、又は前記解析した入力文章か
    ら、予め設定された表現に関連する文を抽出する抽出機
    能と、 前記解析機能による解析結果を用いて、前記抽出機能に
    て抽出した抽出文から簡略化した文を生成する生成機能
    と、 前記生成機能にて生成した、簡略化した文を出力する出
    力機能と、 をコンピュータで実現させるための文章処理プログラ
    ム。
JP2001260920A 2001-08-30 2001-08-30 文章処理装置、文章処理方法、及び文章処理プログラム Pending JP2003067368A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001260920A JP2003067368A (ja) 2001-08-30 2001-08-30 文章処理装置、文章処理方法、及び文章処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001260920A JP2003067368A (ja) 2001-08-30 2001-08-30 文章処理装置、文章処理方法、及び文章処理プログラム

Publications (1)

Publication Number Publication Date
JP2003067368A true JP2003067368A (ja) 2003-03-07

Family

ID=19088041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001260920A Pending JP2003067368A (ja) 2001-08-30 2001-08-30 文章処理装置、文章処理方法、及び文章処理プログラム

Country Status (1)

Country Link
JP (1) JP2003067368A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019164773A (ja) * 2019-02-22 2019-09-26 ヤフー株式会社 情報提供装置、情報提供方法、および情報提供プログラム
JP2019164658A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報提供装置、情報提供方法、および情報提供プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019164658A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報提供装置、情報提供方法、および情報提供プログラム
JP2019164773A (ja) * 2019-02-22 2019-09-26 ヤフー株式会社 情報提供装置、情報提供方法、および情報提供プログラム
JP7027360B2 (ja) 2019-02-22 2022-03-01 ヤフー株式会社 情報提供装置、情報提供方法、および情報提供プログラム

Similar Documents

Publication Publication Date Title
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US5623406A (en) Method and system for entering text in computer equipment
KR101139903B1 (ko) 자연어 문서들에서 전체 부분 관계들을 인식하는 시만틱 프로세서
JP2007287134A (ja) 情報抽出装置、及び情報抽出方法
KR20210041017A (ko) 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
Sezer TS corpus project: An online Turkish dictionary and TS DIY corpus
US20050228635A1 (en) Method for describing existing data by a natural language and program for that
US20070271509A1 (en) Methods and apparatuses for operations on selective document components
JP4021525B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP4499179B1 (ja) 端末装置
JP4030624B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP4469817B2 (ja) 文書検索システム及びプログラム
US20020007382A1 (en) Computer having character input function,method of carrying out process depending on input characters, and storage medium
JP2003323425A (ja) 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム
JP2003067368A (ja) 文章処理装置、文章処理方法、及び文章処理プログラム
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
Antworth et al. PC-Kimmo Reference Manual
JP2007213157A (ja) 用例文検索装置および用例文検索方法
JP2007233724A (ja) 文書検索システム、その方法及びプログラム
KR20240055302A (ko) 문장 템플릿을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
Alam et al. Improving accessibility of archived raster dictionaries of complex script languages
KR20240055290A (ko) 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
KR20240055309A (ko) 논문 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
JPH1145280A (ja) 他言語文書検索システム、他言語文書検索プログラムが記憶された記憶媒体、及び他言語文書検索方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040302