JPH04199270A - 文書等の伝送装置 - Google Patents

文書等の伝送装置

Info

Publication number
JPH04199270A
JPH04199270A JP2318106A JP31810690A JPH04199270A JP H04199270 A JPH04199270 A JP H04199270A JP 2318106 A JP2318106 A JP 2318106A JP 31810690 A JP31810690 A JP 31810690A JP H04199270 A JPH04199270 A JP H04199270A
Authority
JP
Japan
Prior art keywords
word
data
dictionary
document
independent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2318106A
Other languages
English (en)
Inventor
Shinichiro Takagi
伸一郎 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2318106A priority Critical patent/JPH04199270A/ja
Publication of JPH04199270A publication Critical patent/JPH04199270A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
(産業上の利用分野) 本発明は通常の通信用伝送路と文書入力装置と送受信用
の端末を有し、文書等を電子メールどして伝送する文書
等の伝送装置に関し、特に安価“(・・安全性、秘密性
の高い文書やデータの伝送装置に係る。 (従来の技術) 電子スールを使って日本語等の文書や名種データを送受
信Jる機会が増えている、まブー全国に離散している社
内機関間での通信には秘密性が高く緊急性の高い11本
語等の文書データを流通することも多い。しかし、秘密
性の高い日本語等の文書やデータを送りたいどきには、
自前で管理する伝送路を設置(7で使用したり、高伝送
品質高セギャ1、、lティの通信用伝送路を借用したり
しなけれならなかった。 (発明が解決しよ・うとする課題) しかし、十−記自前で管理判る伝送路や品伝送品質高セ
キュリティの通信用伝送路を缶用(−17だ場合には、
通常の伝送路に比べて回線設置金額や月額使用料、伝送
料や通話料が高い欠点があった。1また暗号・化機能の
付加などのセギャリテイ対策が施されている通信用伝送
路を使用しでいでも暗号用キ〜の更新や暗号用3、−の
配送な、−を留意(7で行わねばならず作業負荷が人ぎ
く、暗号用キーが漏れねば秘密性が容易に損なわねる欠
点がありlニー。 (発明のVj的) 本発明は上記の従来技術における欠点を解決し7、通常
の伝送路であっても統7合的に比較的安価な伝送利金で
$かつ高いセキュリティ品質で日本語等の文書やjl!
′−夕等の伝送を行う装置を実現することを目的とする
。1 (課題を解決するだめの手段) 本発明はL記課題を解決し目的を達成するため、通常の
通信用伝送路ど文書人力装置と送受信用の端末を有し、
文書等を電イメールとし、て伝送する装置において、 rff記送受信側の両端末に同一の単語辞書を備え、送
信側では前記文書入力装置で人力し1、て電子フン・イ
ル化した文書ファイルを前記単語辞書を用いて文形態素
解析処理回路で単語分割認定を行う手段と、この単語分
割認定の結果から自立語認定抽出処理回路で自立語及び
自1γ語外の各単語データを認定し抽出する手段と、前
記自立語単語データの単語見出(2を単語番号置換処理
lli′i7路でW語番号ζ、゛置換する手段と、この
単語番号で置換された自立語単語データと前記自立語各
単語データを送信データ統合回路で送信データとして統
合Aる手段と、前記単語辞書に1語を登録しまた場合4
.Tは辞書変りf分抽出処理回路で抽出された辞書変軒
分の単語情報を前記送信データ統合回路で送信デー゛−
夕とし・て統合する手段と、これら送信データを通常の
通信用伝送路を通して信号送信回路で受信側端末に送信
する手段とを具備し、前記受信側では的記fS呂送信回
路で送信されたデータを信号受信回路で受信[7、該受
信データを受信データ分離回路で157語及び自立語イ
1の各単語データと辞書変更分の単語情報とに分離する
手段と、この辞書変更分の単語情報を当該受信側の単語
辞書に反映し5て辞書変りy分イ6止処理[i1路で単
語番号を付け直1手段と、受信側の単語辞書のm語番号
を用いて自立&L’l’語データの単語番号を単語番号
復元処理回路e中詰見出(,7に復元する心段と、文書
統合処理回路で夕畜”ファイルを再生する手段とを具備
することを特徴どする。 (作 用) 本発明においては、例えば、日本語文書ファイルを伝送
する場合に送、受信側の端末に同一の1]本語辞書を予
め備えておき、[1本文形態素解析による。I1語分割
認定によって、重要な情報を有する自立語単語を自動的
に抽出分だし日本語単語辞書の単語番号に置き換え圧縮
するので、伝送データ量が削減される。また、伝送路で
は、主要な情報を一有する自1台語単語データと自立語
各単語データと分割されで伝送されるほか、自立語単語
データの内容が伝送時には単語番号たけどなる。さらに
イの暗しキーに相当する単語番号も辞書の変更分の単語
情報どして容易に伝送でき受信側の日本語単語辞書を自
動的に更新することができる。 こ−のように通常の伝送路を・用いて安価に、(2かも
高品質か二)秘密性をtノたせて文書等の伝送が用能ひ
ある。 (実施例) 第1図は本発明の一実施例の構成を示すブロック図であ
り、図中、1は送信秘密文書′、3を入力する文書入力
装置、2および4は通常の伝送路5ひ接続されたパソコ
ン等の処理装置で構成さ才する夫々の文書送信側および
文書受(、M側の端末装置で」ろり、この送信側端末装
置24.′□は単語辞書用端末6が接続される5 ここで、文書送信側の端末装置2においζ、2!は文書
人力処理回路、22は日本語文書ファイル、23は送信
側の目本語足語辞書、24は日本文形態素解析処理回路
、25は自立語認定抽出処理回路、126は単語番号置
換処理回路、27は自立語単語データ、28は自立語性
単語データ、29は送信データ統合回路、30は信号送
信回路、31は単語登録処理回路、32は辞書変更分抽
出処理回路である。 また、文書受信側の端末装置4において、・Nは信号受
信回路、42は受信デ・−夕分離回路、・4:(,44
は夫々分離された自8q語単語データおよび自さ′1′
語外単語データ、4[5は単語番号復元処理回路、46
は文書統合処理回路、・17は再生さ才■たト1本語交
書−フアイル、48は辞書変更分修正処理回路、411
4はg l((側の日本語単語辞書であり、i″lj記
送信側の端末装置2における日本語単語辞書と同一のも
のであて)5、次に本実施例の動作を第2図おJ、び第
二−l[メ[(′1文書送信側と文書受信側の処理概略
フロー、第、↓し]の文書送信側1文書受信側のは語番
じを史新する処理の概略フロー並びに送信文書例(5−
・、例′l)1゜本語文書データ例(文例2)、日本文
形!!ヒ素解析ター理結果例(文例73)、自立語単語
ギ・−夕例、F)、γ7トI′−。 登詰外単語データ例(文例4〜6)に−より説明、f 
4゜文書送信側の端末装置2を使用”づる利用者Aは、
[−1本語ワードプロセッザや漢字C) C,Rなとの
文書入力装置1を用いて送信し、たいド記秘密文書:3
を入力して(第2図S1、以−ト同じ)送イ、′テ側の
端末装置2上に、電イファイルを作成1”る。 送信じたい秘密文書、(文例1)3 そしで、文書入力処理回路21では入力された電りファ
イル化した文書ファイルについて文書識別I l)付与
や漢字コード変換や解析処理単位(丈)への分離を行い
、日本語文書ファイル22を作成する(S、)。次に、
送信側の日本語単語辞書23を用いて日本文形態素解析
処理回路24で、文単位に単語分割と単語認定を行う(
S、)。 ここで、上記(文例1)に示す送信したい秘密文書3は
、下記1−1本語文書データ(文例2)及び日本文形態
素解析処理結果(文例3)に示すように、前記文書入力
処理回路21で文単位に分離されで名文に通し文番号3
01ど文境界を示1−文セハレー へ3・01:とが付
与される。 次に前記[]本本文形態素解析処理路ご・1で名文を送
信側の日本語単語辞書23を用いτ茸15語分滓j、!
″W語認定を行った各単語に単語境界を示すm語セパレ
ータ30 ’、yを付与し、名詞・接辞なとの品詞から
なる自立語単語には所定のコード;30・1をイ・]午
(実施例ではMZ)する。 (文例2) (文例3) 次に前記「]本文形i素解析処理回路?・1でのq1語
認定結果力曹ら自立語認定抽出処理回路23?・・、名
詞・接辞など゛の品詞からなる自立gデータ27と用言
・助詞・助動詞・記号などの品t1」からなる残、りの
(−=ff属語1自71語外単語データ28)に分離(
て抽出する(S4)。 この時の後記単語番号に置き換えるii″ljの自へ′
1語単、語デー タ(文例4)を1・記に不才5、(文
例4) ■−〜−−−−〜−−−−−− −−−−、、、−、−
、、−,1さら(、゛−自立語単語については単語番号
置換処理回路2.6でW語見出し7を送信側のト1本諸
l訪辞書?3Q)W語番号に置き換えてそれギれ自−’
、、Z i単語データ27の文書データを作成する(8
6)。下記(文例5)は単語番号に置き換えた後の自立
語m語データ27、(文例6)は自立語性単語データ2
8ヒある。この文例5の305は自立語単語見出し、が
置き換えられ八日*語単語辞書の単語番号、文例6の3
06は立向で自立語性単語なし7を示す信号(実施例で
はN)、:307は自立語単語データが埋め込まれる位
置の通し番号である。 即ち、各文ごとに日本文形態素解析処理結呆(文例3)
の分割認定された単語から、名詞・接辞などの品詞から
なる自立語単語を抽出LtT送信側の日本語単語辞書2
3の単語番号;305を付/jして自立語単語データ2
7どし7て作成する1、次(、−113本語文書データ
から自立語単語を認定抽出(7,た残りを自立語外月1
語データ28として抽出する。この自立語夕)単語デー
タは既に−のべたように主に用言・助8・」・助動詞・
記号なとの品詞からなる付属語から構成、する。さらに
自立語m語データが埋め込まれる位置に通(、番号30
’7を句与する。 (文例;)) (文例6) このようにし、で入力した文書の全での文が処理された
かを・日本文形態素解析回路24で判断しくS2)処理
されていない場合は、前記処理(S3)に戻り日本文形
態素解析処理回路24等の処理(S3)〜(S、)が行
なわれる。 次に自立語単語データ27と自立語列単語データ28の
文書データを送信データ統合回路29で統合(2て信号
送信回路30より通常の伝送路5)を通(7て利用者B
の文書受信側の端ぷ4・\送信する(S、)。 上記動作処理の過程において、一方、送信側の日本語単
語辞書23は単語登録処理回路:31で単語辞書用端末
6から単語登録や不要単語の削除などを行って更新され
る(詳細フローを第・1図に示す)、このときの辞書の
変更分の単語情報を辞書変更分抽出処理回路32で抽出
し2て自立語単語デー−夕2′ノ°と自立語列単語デー
タ28とともに送信データ統合回路2.9で統合されて
信号送信回路30から文書データとして利用者Bの受信
側の端末装置4へ送信される。 次に利用者Bの文書受信側の端末装置4では、伝送路5
を通して送られてくる文書データを日庫語文書ファイル
47に再生する。このために、信号受信回路41で文書
データを受信すると(8,)、受信データ分離回路42
で自立語単語データ4;3と自立語列単語データ44と
辞書変更分の単語情報とに分離する(S、)。さらに、
辞書変更分修正処理回路48で辞書変更分の単語情報を
受信側のF1本文書語辞書49に反映修正して単語番号
を付け直i(詳細フローを第4図に示す)。この新しい
単語番号を用いて単語番号復元処理回路45で自立語m
語デ・−タ43の単語番号を単語見出しに復元する(S
、、)。 この後で、文書統合処理回路46において、復元された
自立語単語データと自立語列単語データとを統合して日
本語文書ファイル47を作成再生する(S、、)。この
再生された内容は前記文例1に示す秘密文書である。 上記文書送信側及び文書受信側の動作において、送信側
の単語辞書用端末6からの単語登録や不要単語の削除な
どを行なって日本語単語辞$23.49の更新を行なう
場合について説明する。 第4図は文書送信側9文書受信側の単語番号を更新する
処理の概略フローであり、S、1〜81 gは文書送信
側、Sl。〜S81は文書受信側の各々ステップの処理
内容である。ここで、前提条件としでは送信側と受信側
で同一・の[3文書単語辞書があl:)かしめ有してい
ることである。 ステップS l lでは、単語辞書用端末6からの入力
により単語登録処理回路31で新規の単語の登録や不要
な単語の削除を行う。 S l 3では、全ての単語登録処理が終了したかを単
語登録処理回路31で判断する。 S14では、単語登録処理が終了していないならば、ス
テップS、2へ分岐する。 Sl、では、送信側の日本語単語辞書23の単語番号を
付け直す。 S l mでは、3 、、の処理で変更を受けた単語情
報を辞書変更分抽出処理回路32で抽出する。 Sl、では、抽1+i した辞書変更分の単語情報を送
信データ統合回路29に入力して自立語単語データ27
、自立語列単語データ28の文書データと統合して送信
する。 S、@では、受信側の端末装置4においで受信データ分
離回路42で辞書変更分の単語情報を分離する。 S I !では、辞書変四分の単語情報を受イa側の日
本語単語辞書49に反映修正する。 S、。(テ・は、受(−側のIJ本文書請辞書・伸のW
Jj拓号を付け的1、 これらの処理G−よって、文書送イト)側と文書受信側
で常に同〜・の日本語単語辞書を保持することがひきる
から、文書送信側で単語見出しを単語番日に置き換金て
送信し7ても文書受信側では■身受侶側の1−」文語単
語辞書・19を用いで正L < fg語見出(、を復元
できる、また、本発明では、辞書の単語番号を暗号キー
どして使用慢るか、直接に立゛書送信側から文書受信側
に伝送されるデータは辞書変更分の単語情報であり、た
とえ漏洩し“C4:)以1:の点で文書の安全性の高い
伝送品質を実現する二とができる。 (D基本どなるI]本文書語辞書が必要で・ある。 ■)辞書変釘分の単語情報を基本どなる日本語11を語
辞書(“−反映修nするル・−ルど嘔詔番号−を付(J
直すルールが必要である。 また、11語の登録などの簡易な手段ひ(f6吟ギ〜ど
なる単語番号を自動的にかつ容易に変更子;ぎるほか、
単語番号の意味する単語見出L[逐次り東し、でいるか
七)、たとえ文書ぞ一タを漏洩しでも・内容#う理解づ
−るごどができず、伝送品質の高いFll水臭文書伝送
が実現できる。 以ヒのべた実施例においては理解を容易にする目的−(
゛「1本語の場合について説明t−fか、外国語につい
ても容易(1,実施、が
【1丁能て゛あイ、−とる勿論
C・ある。 (発明の効果) 以−1−説明(、たように本発明によれば、送信側ノー
受信側で・同・の用語辞書をあ鼻:)かじめイ1して、
送信側゛Cは、電子ファイル化した文書データを文形態
素解析し5て単語分割認定を行う手段と、重要な情報を
有する自立語単語を容易に抽出分離シ7w語辞沓辞書語
番5・に置き換える手段と、m語辞書の変更分の1il
i語情報を・文書データと統合し、て送イS橿゛る手段
により文書の伝送処理を行つのであるから、文書データ
をそのまま送信するのに比べ、自立語の単語を自動的に
1語番号とし、で置き換λられ圧縮されるので、統合的
に伝送料金を削減する。二とが\できる。。 さら(J−1主要な情報をイjする自立語単語データと
白q語外単語データと分離されて伝送されるほか、自1
′、r語甲藷う1−夕の内容が伝送時には緯1語搦・号
)−゛げであり、またその暗号キーに相当する単語番号
も辞書の変更分の単語情報として容易に伝送し、。て自
動的CJ7更新】ることかできる。従)で、データが漏
洩しても内容咎理解することがC・きないので、安全性
の高い伝送品質の文書伝送が実現できる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成、を示゛4ブロック図
、第2図および第3図は慎書送信側と文書受信側の処理
概略フローを示す図、第4図は文書送信側2交書受信側
の単語番号をy新する処理の概略フr]−を示す図であ
る、 1 ・・・文書人力装置、 2,4 ・・ それぞれ文
書送信側と文書受信側の各@宋装置、3 ・・・送信秘
密文書、 5 ・・・伝送路、6 ・・ 単語辞書用端
末、21 ・・−文書人力処理回路、21)・・・1日
本語文書ノ戸イル、2:3・・・送信側の日本語単語辞
書、24・・日本文形態素解析処理回路、25  ・ 
自立語認定抽出処理回路、26・・・単語番号置換処理
回路、27・・・ 自立語単語デ〜り、2R・・自立語
性単語データ、29・・ 送信デ・−タ統台回路、30
・・・信号送信回路、31・・・it語登録処理回路、
32・・・辞書変更分抽出処理回路、・′41・・・信
号受信回路、42・・・受信データ分離回路、43.4
4・・・づ、〉離された自立語[「、語データお、4−
び自立語外1v語データ、・′45・・・単語番号復元
処理回路、46・・ 文書統合処理回路、47・・・ 
[3文語文書ファイル、413・・・辞書変更分修正処
理回路、4!〕・・・受信側の[」文語単語辞書。 特許出願人 U*電信電話株式会社 代  理  人   星  野  ′1−1d]−一゛
第2面 一−1

Claims (1)

  1. 【特許請求の範囲】 通常の通信用伝送路と文書入力装置と送受信用の端末を
    有し、文書等を電子メールとして伝送する装置において
    、 前記送受信側の両端末に同一の単語辞書を備え、送信側
    では前記文書入力装置で入力して電子ファイル化した文
    書ファイルを前記単語辞書を用いて文形態素解析処理回
    路で単語分割認定を行う手段と、この単語分割認定の結
    果から自立語認定抽出処理回路で自立語及び自立語外の
    各単語データを認定し抽出する手段と、前記自立語単語
    データの単語見出しを単語番号置換処理回路で単語番号
    に置換する手段と、この単語番号で置換された自立語単
    語データと前記自立語外単語データを送信データ統合回
    路で送信データとして統合する手段と、前記単語辞書に
    単語を登録した場合には辞書変更分抽出処理回路で抽出
    された辞書変更分の単語情報を前記送信データ統合回路
    で送信データとして統合する手段と、これら送信データ
    を通常の通信用伝送路を通して信号送信回路で受信側端
    末に送信する手段とを具備し、 前記受信側では前記信号送信回路で送信されたデータを
    信号受信回路で受信し、該受信データを受信データ分離
    回路で自立語及び自立語外の各単語データと辞書変更分
    の単語情報とに分離する手段と、この辞書変更分の単語
    情報を当該受信側の単語辞書に反映して辞書変更分修正
    処理回路で単語番号を付け直す手段と、受信側の単語辞
    書の単語番号を用いて自立語単語データの単語番号を単
    語番号復元処理回路で単語見出しに復元する手段と、文
    書統合処理回路で文書ファイルを再生する手段とを具備
    することを特徴とする文書等の伝送装置。
JP2318106A 1990-11-26 1990-11-26 文書等の伝送装置 Pending JPH04199270A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2318106A JPH04199270A (ja) 1990-11-26 1990-11-26 文書等の伝送装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2318106A JPH04199270A (ja) 1990-11-26 1990-11-26 文書等の伝送装置

Publications (1)

Publication Number Publication Date
JPH04199270A true JPH04199270A (ja) 1992-07-20

Family

ID=18095560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2318106A Pending JPH04199270A (ja) 1990-11-26 1990-11-26 文書等の伝送装置

Country Status (1)

Country Link
JP (1) JPH04199270A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07250047A (ja) * 1994-03-09 1995-09-26 Keisatsu Daigakukouchiyou 階層符号化無線伝送方法
JP2010033190A (ja) * 2008-07-25 2010-02-12 Fujitsu Ltd 電子メール送受信装置及び電子メール送受信方法
JP2013529345A (ja) * 2010-05-21 2013-07-18 バウルティブ リミテッド メッセージングシステムを安全に使用するシステムおよび方法
WO2015011873A1 (ja) * 2013-07-23 2015-01-29 日本電気株式会社 情報配信システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07250047A (ja) * 1994-03-09 1995-09-26 Keisatsu Daigakukouchiyou 階層符号化無線伝送方法
JP2010033190A (ja) * 2008-07-25 2010-02-12 Fujitsu Ltd 電子メール送受信装置及び電子メール送受信方法
JP2013529345A (ja) * 2010-05-21 2013-07-18 バウルティブ リミテッド メッセージングシステムを安全に使用するシステムおよび方法
US9721119B2 (en) 2010-05-21 2017-08-01 Vaultive Ltd. System and method for secure use of messaging systems
WO2015011873A1 (ja) * 2013-07-23 2015-01-29 日本電気株式会社 情報配信システム

Similar Documents

Publication Publication Date Title
CN1530861B (zh) 语言翻译方法及其系统
CN102831127B (zh) 重复数据处理方法、装置及系统
KR100890691B1 (ko) 언어학적으로 지능적인 텍스트 압축방법 및 그 처리장치
US5621658A (en) Method and apparatus for communicating an electronic action from a data processing system to another data processing system via an audio device
US20150254237A1 (en) Data Security System for Natural Language Translation
CN101636732A (zh) 用于语言独立语音索引和搜索的方法和装置
US10057237B2 (en) Provide insensitive summary for an encrypted document
CN111832318A (zh) 单语句自然语言处理方法、装置、计算机设备及可读存储介质
US20100185438A1 (en) Method of creating a dictionary
CN111259645A (zh) 一种裁判文书结构化方法及装置
Lim et al. Beyond a technical bug: Biased algorithms and moderation are censoring activists on social media
JPH04199270A (ja) 文書等の伝送装置
KR102166102B1 (ko) 개인 정보 보호를 위한 장치 및 기록 매체
CN108073591B (zh) 一种具有身份属性的多源数据的整合存储系统及方法
CN112668325A (zh) 一种机器翻译增强方法、系统、终端及存储介质
CN110334333B (zh) 一种信息修改方法及相关装置
CN116610772A (zh) 一种数据处理方法、装置及服务器
WO2021246658A1 (ko) 개인정보 보호 기반 음성 정보 처리 서비스 제공 시스템
US11681966B2 (en) Systems and methods for enhanced risk identification based on textual analysis
CN114168715A (zh) 生成目标数据集的方法、装置、设备及存储介质
JPH11143864A (ja) 日時表現正規化方法、日時表現正規化装置及び日時表現正規化プログラムを記録した記録媒体
JPH05224687A (ja) 日本文読み上げ単語変換編集処理方式
CN113472686A (zh) 信息识别方法、装置、设备及存储介质
US11947872B1 (en) Natural language processing platform for automated event analysis, translation, and transcription verification
US11870757B1 (en) Protecting customer personal information in application pipeline