JPS58127230A - 漢字仮名変換装置 - Google Patents

漢字仮名変換装置

Info

Publication number
JPS58127230A
JPS58127230A JP57008719A JP871982A JPS58127230A JP S58127230 A JPS58127230 A JP S58127230A JP 57008719 A JP57008719 A JP 57008719A JP 871982 A JP871982 A JP 871982A JP S58127230 A JPS58127230 A JP S58127230A
Authority
JP
Japan
Prior art keywords
kana
words
word
kanji
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57008719A
Other languages
English (en)
Inventor
Norimasa Nomura
典正 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57008719A priority Critical patent/JPS58127230A/ja
Publication of JPS58127230A publication Critical patent/JPS58127230A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は漢字仮名混9の日本語文をその全文に亘って仮
名文に変換する好適な漢字仮名変換装置に関する。
〔発明の背景−技術〕
日本語文章を点字訳する場合等、上記日本語文章を構成
する漢字仮名混9文を、一旦わかち書きした仮名文に蜜
換することが望ましい、その他、漢字仮名混り文の全文
を仮名文Kt換して文章を再編集したいと云う要求もあ
る・〔背景技術の問題点〕 ところが、1本語文章におけるわかち書會には、I¥i
に定まうた規則はなく、かろうじて点字文章において成
る樵のわかち書き規則が見出されるに過ぎない、このわ
かち書きの規則は一自立語の前に区切り(空白二文字ス
ペース)を設け、付属語の前には上記区切シを設けない
と云う原則に立脚している。従って、このような規則を
採用して仮名文をわかち書きする場合、文章中の自立飴
と付属語との区別が極めて重要なS亀となる。然し乍ら
、従来、このような点については全く着目されてなく、
これ故漢字仮名変換された文章が非常に絖難いものとな
ってい友。
〔発明の目的〕
本発明はこのような事情を考慮してなされた屯ので、そ
の目的とするところは、漢字仮冬混りの文として与えら
れた文字列を、わかち書きを行いながら簡易に仮名文に
変換することができ、特に口語体だけからなる文に対し
ては、文語体を一部に含む文に比して高効率に仮名文字
変換することのできる漢字仮名変換装置を提供すること
にある。
〔発明の概要〕
本発明は漢字仮名混夛文を文節単位に区分し、その文節
の自立語および用言活用語尾を口語体および文語体につ
いてそれぞれ検定すると共に、上記文節の自立語および
活用語尾でない文字列については、付属唾として口語体
をよび文語体についてそれぞれ検定して前記漢字仮名諷
p文を自立語と付属語との区別にもとづいてわがち書き
しながら仮名文変換するものである・そして、漢字仮名
混p文が口語体である場合には、その活用語尾および付
属語の検定を口語体に対してのみ行わせることによp1
簡易に且つ高速[K漢字仮名変換旭理を行わせるようK
したものである。
〔発明の効果〕
従って本発明によれば、漢字仮名混〉の文を仮名文に変
換するに際して、適切な文節の区切シを与えた上で、し
か龜その用言活用語尾および付属語を、口語体および文
語体に対してそれぞれ別@に検定して前記洟字仮名混〕
文を分かち書きされた仮名文に変換することができる。
故に1作成された仮名文は非常に絖み島いものとな夛、
1+点字訳するに際しても簡易に行うことを可能とする
等の効果を奏する。また変換処理自体も簡易に行い得る
勢、実用上絶大なる効果を奏する。また上述したように
用言活用語尾および付sinの検定を、口語体および文
語体に対してそれぞれ醜立に行うので、漢字仮名混り又
の文体が明らかな場合には、極めて効率良く変俟処珈を
行うことが可能となる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明する
図は実施例装置の概略構成図である。仮名文変換に供さ
れる漢字仮名混p文からなる日本語文章は、入力文章配
憶装置IK貯えられる0文節切り回路2は、上記記憶装
置1に貯えられ九文章に灼して、−例えば「仮名」から
丁漢字」への変化叫、その文字種の変化を検出する郷し
て、上記入力文章を文節単位に切多出し、これを1文節
毎に文節レジスタ3にセ、トシている。この文節レジス
タ3にセットされた1文節の文字列毎に以下の仮名文字
変換処理が行われる。
−万、単語辞書記憶装置4は、漢字および仮名文字によ
って示される単@(熟語を含む)を、その品詞の情報と
共に記憶し、また率@に対応してその表音(読み)を表
わす仮名文字列をそれぞれ格納登録してiる。単語照合
回路5は、前記文節レジスタ3にセットされた一文節の
文字列を読出し、これに対して上記単語辞書記憶装置4
と単語照合を行りでいる。ζ0$語照合は、前記文節の
最初の文字列と単語辞書4に登録された単語との一致を
駒べることによって行われる。そしてこれによシー欽検
出され良文字列のうち、最も長い文字列のものから、つ
壕り鍛長マツチング単語からJliK変換候補単語とし
て単語照合回路5に設けられた一時記憶装置に格納する
。尚、単語辞書4から読出されるこの候補単語は、見出
し語と文法情報と貌み情報をもつ0例えに候補単@は見
出し飴としてj「取合、文法情報で、(他)は他動詞値
)は亘設活用(わ)は活用性を示す、そして、単語照合
回路Iによ〕検出された最長マツチングの候補単語の上
記読みを表わす仮名文字列が、その前にわかち書き用の
区切り(ス(−ス)が付されて、仮名文節レジスタ6に
転送され、セットされる。
次に1活用語尾検定回路1では、前記文節レノスタ3に
セットされ九文節文字列から上記最長マツチングされた
候補単語を除く、残〕の仮名文字列を入力し、同111
に候補率@O文法情報にもとづいて、活用語尾の検定を
行って−る。
前記候補単語が活用語であるとき、つ1食動詞や形用詞
等の用言である場合、文章形1lIK応じて前記単語の
後に続く仮名文字は必ず活用語尾変化する。この活用語
尾変化は、その文体が口語体であるかf語体であるかK
よって、分類され、口飴活用語尾表記憶装置(辞書)1
および文紐活用語尾表記憶装置(辞書)#にそれぞれ登
録されている。このような活用語尾変化は、文法規則に
従って予め明らかなものであシ、辞書として記憶装置8
.IIにそれぞれ登録されるものである。しかして、活
用語尾検定−#&rは、前記文節の単st論<文字列に
ついて、これらの瞼地表配億装置8.りをそれぞれ検索
し、その−紋を照合検出している。尚、入力され友漢字
仮名混り文が口語体であると予めわかっている場合、例
えばオペレータのル示によpその情報が与えられている
場合には、口語活用語尾表紀憶装置aに対してのみ、活
用語尾の検索が行われる。そして、この活用語尾検索に
よ、す、−歇する語尾が検出されたとき、これを前記候
補単語の用語活用語尾であると検定して、前記仮名文節
レジスタ6に、先に格納し危候補単語読みに続いて格納
する。この場合、セットする文字が活用語尾であるから
、前の文字列に対して区切9(スペース)を入れること
txtない。
また活用語尾検定回路IKより活用語尾が検定できない
場合には、検定回路1から前記単語照合回路jK対して
活用語尾検定不能の信号が送られる。これを受けて単語
照合回路1では、その一時記憶装置に記憶した最長マツ
チング候補単語の次に長い候補単語を読出してその読み
を前記仮名文節レジスタCK転送しなおす、以下、候補
単語が用言である場合、上記活用語尾の検定において上
記候補単語の活用語尾が合格する迄、上配旭理が繰返し
て行われる。
さて、付属照合回路10は、前記単語照合回路5および
活用語尾検定回路IKてそれぞれ検定され次文字列を除
く、前記文節中の文字列(仮名文字)を入力し、口語付
属語辞書配憶装置IIL11および文語付属語辞書記憶
装置12をそれぞれ検索して、付属語に対する照合を行
っている。これらの付属辞書記憶装置12は1文章にお
ける助詞、助動詞等の付属語を、その文体に応じてそれ
ぞれ登録したものであp、付属語照合回路10はこの付
属語辞書と前記文節中の単命およびその活用語尾を除く
文字列とO照合を行う、そして、−歇する付属語を検出
し喪とき、その付属語について、先に求められ大単語と
の接続条件(付属語辞書に登録されている)が満たされ
るか否かを判定している。仁の判定により、接続条件が
満たされたと1、上記検出された付属語が単語に適合す
る付属−として検定され、前記仮名文字レジスタ6に転
送される・そして、付llI4@であるから、仮名文節
レジスタ6に先に薔込壕れた仮名文字夕qとの間に空白
(スペース)を設けゐことなく、上記文字列に続いて格
納セットされる。尚、この付属語検定に際しても、前記
入力文章が口語体のみからなるとの情報が得られえ場合
、口語付属語辞書記憶装置1111C対してのみ照合が
行われ為。
以上のように1仮巻文節レジスタCKは、前記文節レジ
スタjK+、)された文字列の単語の絖みを示す仮名文
字、およびその活用語尾、更には付属語が貯えられ、1
文節の仮名文字列(分かち書きのス(−スを入れられ九
)として出力される。そして、上述した魁珊が、文節レ
ジスタ3に、入力文章から区切られた一文節の文字列が
セットされる都度、繰返して実行される。これによシ、
入力文章はその文節毎Kx−e−スが設けられて仮名変
換され、従ってわかち11き形式の仮名文が作成される
ことに&る。
ところで、1つの文節を構成する文字数が多い場合、単
語、活用語尾、j!には付属語としてそれぞれ検定し次
文字を除いても、上記文節中に文字が残る場合がある。
このようなときKFi、残された文字列について、上述
し要処理を最初から、つま夛単語照合から再び実行する
ようにすればよい、なお、活用語尾検定回路rは、候補
単結が活用語でない場合は、動作せず、直接付属語照合
回路10へ動作が移つる。
以上説明したように、本発tlH装置によれば、入力文
章を効率的に仮名変換することができる・すなわち文節
毎に仮名に変換し効率的にわがち書き形式の文章とする
ことがでする0作成された仮名文章は、−′分かち書き
されてかるので非常に絖み易いものと表る。従って、こ
れを点字訳する場合、その点学葡換処場が極めて匍埜′
&ものとなる。また点字訳に限らず、漢字仮名混り文を
カナグリンタ−を用いて!りントアウトする場合等、絶
大なる効果を奏する。また日本語文章の殆んどは、口語
体で記述されえものであることから、入力文章が口語体
であると指定した場合、文語体に対する辞書および活用
語地表1−照合することなしに仮名文変換処理を行うこ
とができるので、蛮換効皐の向上、および変換効果を奏
する・また、活用語尾の検定および付属語の照合を、口
語体と文語体とでそれぞれ独立に行うので、変換処理体
系が明確・単純化され、変換処理制御の簡易化を図り得
る勢の効果を奏す。
尚、本発明は上記実施例にのみ限定されるものではない
6例えば、あらかじめ別の手段で文節切シをされた文章
を入力文章を入力文章として用−ても、行うことができ
る。要するに本発明は、その要旨を逸脱しない範囲で糧
々変形して実施することができる。
【図面の簡単な説明】
図は本発明の一実施例鏝置【示す概略構成図である。

Claims (1)

    【特許請求の範囲】
  1. 与えられた漢字仮名混〕の日本語文章を文節単位に区切
    る手段と、この文節に含まれる自立飴を検出して仮名文
    字費換すゐ単語照合回路と、上記巣飴の品祠情報に従っ
    て口語活用語尾表辞畳および文語活用語地表辞書をそれ
    ぞれ検索して前記単語の活用語尾を検定する語尾検定回
    路と、前記文節の単語および活用語尾として検定されな
    かった文字列にりいて口語付属語辞書かよひ文飴付NI
    4#辞書をそれぞれ検索して付属語を検定する付属WI
    照合回路とを具備し、上記検定された付属語の前を文節
    の区切ルとすることなしに、前配日本飴文章會文節単位
    で漢字仮名を俟して仮名文章を作成してなることt特徴
    とする漢字仮名変換at。
JP57008719A 1982-01-22 1982-01-22 漢字仮名変換装置 Pending JPS58127230A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57008719A JPS58127230A (ja) 1982-01-22 1982-01-22 漢字仮名変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57008719A JPS58127230A (ja) 1982-01-22 1982-01-22 漢字仮名変換装置

Publications (1)

Publication Number Publication Date
JPS58127230A true JPS58127230A (ja) 1983-07-29

Family

ID=11700747

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57008719A Pending JPS58127230A (ja) 1982-01-22 1982-01-22 漢字仮名変換装置

Country Status (1)

Country Link
JP (1) JPS58127230A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62189567A (ja) * 1986-02-15 1987-08-19 Casio Comput Co Ltd 漢字かな変換装置
JP2022510818A (ja) * 2018-11-20 2022-01-28 アマゾン テクノロジーズ インコーポレイテッド 改良されたデータマッチングのためのデータレコードの字訳

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62189567A (ja) * 1986-02-15 1987-08-19 Casio Comput Co Ltd 漢字かな変換装置
JP2022510818A (ja) * 2018-11-20 2022-01-28 アマゾン テクノロジーズ インコーポレイテッド 改良されたデータマッチングのためのデータレコードの字訳

Similar Documents

Publication Publication Date Title
Karim Technical challenges and design issues in bangla language processing
JP2005520251A (ja) 名前付きエンティティの翻訳
JPH0344343B2 (ja)
JPS5892063A (ja) イデイオム処理方式
JPS58127230A (ja) 漢字仮名変換装置
Ghani et al. Jawi-Malay Transliteration
JPS59140545A (ja) 仮名漢字変換装置
JPS58127231A (ja) 漢字仮名変換装置
Al-Ahmari et al. Cross domains Arabic named entity recognition system
JPS60193074A (ja) 日本語解析装置
JPS58103022A (ja) 文章入力装置
JPH01266670A (ja) 日本語対象文固有用語抽出処理装置
Van Nam et al. Building a Syllable Database to Solve the Problem of Khmer Word Segmentation
Thomas A Tokharī (?) MS.
JPH11184854A (ja) 電子辞書
JPS5832418B2 (ja) 漢字まじり文入力装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPS6132167A (ja) カナ漢字変換処理装置
JPS63173156A (ja) 言語情報提供装置
Pack Possible Lexical Hebraisms in the Book of Mormon:(Words of Mormon-Moroni)
JPH04282764A (ja) 非文訳出装置
KR960018967A (ko) 언어 형태소 분석 시스템의 계층적 기호 접속 정보표기 방법
JPS5972495A (ja) 文字音韻変換装置
JPH0528871B2 (ja)
Liu Dialect Features and Communication Problems in Linxian.