JP2001344237A - コード化を通じた自然語処理装置及び方法 - Google Patents

コード化を通じた自然語処理装置及び方法

Info

Publication number
JP2001344237A
JP2001344237A JP2000317158A JP2000317158A JP2001344237A JP 2001344237 A JP2001344237 A JP 2001344237A JP 2000317158 A JP2000317158 A JP 2000317158A JP 2000317158 A JP2000317158 A JP 2000317158A JP 2001344237 A JP2001344237 A JP 2001344237A
Authority
JP
Japan
Prior art keywords
sentence
code
predicate
information
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000317158A
Other languages
English (en)
Inventor
Hon Won Paku
ホン ウォン パク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2001344237A publication Critical patent/JP2001344237A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 (修正有) 【課題】3ケ国語以上を使用する多国語間に同時に翻訳
が進行されることのできる利点があり、注文型情報検索
システムや、感情情報生成システムや自然語命令システ
ム、自然語対話システム等に適用及び活用が可能である
自然言語処理装置を提供すること。 【解決手段】入力された文章のうちの叙述部の様態、
状、時制、尊卑を基準として統合叙述部コードを付加す
る統合叙述部処理部と;単語の語順と格情報を含む統辞
的情報及び上記統合叙述部処理部で付加された統合叙述
部コードを情報として認識部文型コードと対応する生成
部文型コードを探し、上記生成部文型コードの文型情報
に従って生成文を形成する文型生成処理部と;上記生成
文により必要な作業を遂行する処理部とを含む自然語処
理装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自然語を処理する方
法及び装置に関するもので、より詳しくは自然語を翻訳
したり、意味を認識したりする等多様な分野で必要とさ
れる自然語処理方法及び装置に関するものである。
【従来の技術】自然語処理が必要な分野は広範囲で、益
々その範囲が広くなっており、自然語処理は一つの工学
分野として位置づけられている実情である。例えば、機
械飜訳にも必要であり、情報検索にも必要であり、音声
認識技術の発達で機械との対話及び命令等幅広く適用さ
れる。
【0002】まず翻訳を例に挙げて説明すると、交通、
通信の発展によって、多くの事業は国境を越えてまで拡
張されているが、まだ言語の差によって意思疎通の障害
要因になっている。言語は学者によって異なるが、3000
ないし3500個あまりが地球上に存在し、このような言語
を分類する方式のうち、翻訳作業においては有形的分類
(typological classification)が最も重要になる。この
分類方法により言語は孤立語、膠着語、屈折語等に区分
され、同じ分類でも数多くの単語及び文法を習わなけれ
ばならない問題は依然として残ることになる。
【0003】最近にはインターネット技術の発展に伴っ
て、その応用分野も広くなるようになってWWW.CSCHAT.C
OMのようにインターネット上で他の言語を有する人間と
のチャットできる程度の実時間(real time)で同時翻訳
が可能なインターネットサイトが紹介されている。
【0004】このような翻訳ソフトウェアはこれまで発
展が重なっており、実質的に第1言語と第2言語間の翻訳
機術は例えば、韓国語と日本語、韓国語と英語等は相当
な水準に至った状態である。
【0005】ところが韓国語と日本語は同じ膠着語種類
であるから、比較的語順と語尾の変化等が類似する点が
あって両者間の翻訳が比較的容易に行われる特徴がある
が、韓国語と英語のように言語の形態論的特徴が異なる
言語間には試行錯誤のような多様な経験を基づいて一部
文法と結合して行われている実情である。
【0006】しかし、一つの言語を実時間で多言語に翻
訳できる技術はまだ開発されていないため、多国籍を有
する様々な国の人々に同時に意志疎通ができる方法はな
く、速い翻訳性能を有する2国間のソフトウェアを利用
するとしても多数個を使用して順次的に翻訳する方法し
かないから、実際的にインターネット上の多国籍を有す
る多者間のチャット問題においてもチャットの即時性を
満足させるには足りない。
【0007】次の問題で、empas.comのような注文型情
報検索システムに適用される従来の自然語処理方式は、
例えば「イスンシンの誕生日はいつですか(図3(1)
参照)(原文はハングル表記である。日本国特許庁の電
子出願システムの制約によりハングルを文字として表記
できないので、本明細書のハングル表記は図3に一覧の
形で示す。なお、明細書本文中のハングル表記が入る部
分に対応する部分にはその日本語訳と、図3における対
応するハングル表記を示すための参照符号を記載す
る。)」という質疑を入力すれば、助詞と述語を除い
て、名詞すなわち、「イスンシン(図3(2)参照)」
と「誕生日(図3(3)参照)」と「時間情報(図3
(4)参照)」が一緒に出て来るケースを検索したり、
他の例として「イスンシンの好きな人は?(図3(5)
参照)」という質疑語に対して「好きな(図3(6)参
照)」が含まれた文章だけ検索したりすることになる。
したがって 「好きだった(図3(7)参照)」 あるい
は「好きなくせに(図3(8)参照)」等の活用語は検
索できない実情で、他国語からなる文章も検索出来な
い。
【0008】また、「故郷がプサンではない会員は?
(図3(9)参照)」という質疑に対して「故郷(図3
(10)参照)」、「プサン(図3(11)参照)」、
「会員(図3(12)参照)」が含まれた文章を検索す
る誤りを犯している。
【0009】次に自然語を処理する分野のうちの一つで
ある感情情報生成システムの従来の方式では、感情情報
生成システムとは例えば、音声認識技術に基づいたコン
ピュータとの対話を通じて話者の発話(又は入力)に反応
したコンピュータのサイバーキャラクターが感情を持っ
て反応するようにするものであって、従来に「あなたは
馬鹿だ(図3(13)参照)」と話せば、「馬鹿(図3
(14)参照)」という単語を認識してサイバーキャラ
クターが印象をしかめるように構成している。
【0010】ところが、この方式で例えば、「私は馬鹿
だ(図3(15)参照)」とすると、サイバーキャラク
ターはからかったり、 笑ったりすべきなのに「馬鹿
(図3(16)参照)」という単語だけ認識して、印象
をしかめることになる問題点があるため、正しく感情情
報生成システムが活性化することができない実情であ
る。
【0011】次に、自然語命令システムは使用者が入力
した文章或は話者が発話した文章を認識して特定命令を
特定機械或は特定装置に伝達するシステムのものである
が、代表的な例としてはゲームでキャラクターを操縦す
るか、あるいは使用者が乗った装置を操縦する際、使わ
れるシステムで、TV等を見ることができる音声リモコン
にも応用できる。
【0012】ところが、このようなシステムを察する
と、予め与えられた式や条件に一致する単語や単語の列
が全て存在する場合にのみ特定命令を遂行する低級の水
準である。
【0013】次に、自然語対話システムは人間とコンピ
ュータが対話をするシステムであって、従来国内に「ビ
ョリは十一歳(図3(17)参照)」という教育用プロ
グラムがあったが、文型に関係なく、「何歳(図3(1
8)参照)」という単語が入力されると、予め保存され
た「一歳です(図3(19)参照)」、「私は生まれて
間もないです。(図3(20)参照)」、「なぜ私の年
を聞きますか?(図3(21)参照)」等の文章を交互
に出力するようにする単純な形態であるから、今は殆ど
活用されていない。
【発明が解決しようとする課題】本発明は上記のような
従来の問題点を解決するためになされたもので、本発明
の目的は多様な分野で適用される自然語を処理する水準
を高めることのできる自然語処理装置及び自然語処理方
法を提供することである。
【0014】本発明の他の目的は一つの言語からなる文
章を少なくとも他の二つの言語へ同時的に翻訳できる方
法及び装置を提供することである。
【課題を解決するための手段】上記目的を達成するため
に、本発明は他の言語翻訳機術と同様に言語の形態論に
基づいて、各言語の文章が共通的に有する意思表現を分
析し、その意思表現をコード化することにその核心があ
る。
【0015】本発明はさらには統合叙述部コードを採択
して、文型だけでなく、言語の形態にも関係なく、叙述
部の多様な情報コード化でこれを自然語処理に適用する
ものである。
【0016】本発明は具体的に、入力された自然語の処
理単位別単語を収録した単語辞典データベースと;叙述
部の多様な情報を言語別特性に関係なく、様態、状、時
制、尊卑に対する意味を考慮して統合されたコードで統
一された統合叙述部コードデータベースと;多様な文章
の語順と格情報と上記統合叙述部コードに従って文章を
コード化した認識部文型コードデータベースと;上記認
識部文型コードに対応する生成部文型コードを有し、各
コードは生成文に必要な語順と格情報と統合叙述部コー
ドを有している生成部文型コードデータベースと;処理
する文章を入力する入力部と;上記入力された文章に存
在する単語を上記単語辞典データベースから該当単語を
検索する単語辞典検索部と;上記入力された文章のうち
の叙述部の様態、状、時制、尊卑を基準に上記統合叙述
部コードデータベースで上記統合叙述部コードを付加す
る統合叙述部処理部と;上記単語辞典検索部と上記統合
叙述部処理部で確定された単語の語順と格情報及び統合
叙述部コードを情報として上記認識部文型コードデータ
ベースで認識部文型コードを検索する文型認識処理部
と;上記検索された認識部文型コードと対応する生成部
文型コードを上記生成部文型コードデータベースから探
して生成文を形成する文型生成処理部と;上記生成文に
従って処理する処理部とを含む自然語処理装置を提供す
る。
【0017】本発明が翻訳システムに適用される場合に
は、上記処理部は上記生成文型コードに規定された語順
と格情報及び統合叙述部コードによる翻訳処理作業を遂
行する。
【0018】本発明が翻訳システムに適用される場合に
は、好ましくは生成文型コードが有する生成文型が二つ
以上の言語別に区分されて別個のデータベースを有して
いる。
【0019】本発明が自然語情報検索システムに適用さ
れる場合には、上記処理部は上記生成文型コードに規定
された語順と格情報及び統合叙述部コードによる検索を
遂行する。
【0020】本発明が感情情報生成システムに適用され
る場合には、上記処理部は上記生成文型コードに規定さ
れたところ、感情表現を遂行する。
【0021】本発明が自然語命令システムに適用される
場合には、上記処理部は上記生成文型コードに規定され
たところ、操作や反応を遂行する。
【0022】本発明が自然語対話システムに適用される
場合には、上記処理部は上記生成文型コードに規定され
たところ、応答文を出力する。
【0023】本発明はまた入力された自然語の処理単位
別単語を収録した単語辞典データベースを備える段階
と;叙述部の多様な情報を言語別特性に関係なく、様
態、状、時制、尊卑を基準で叙述部を言語に関係なく統
合してコード化できる情報を有する統合叙述部コードデ
ータベースを備える段階と;多様な文章の語順と格情報
と上記統合叙述部コードに従って文章をコード化した認
識部文型コードデータベースを備える段階と;上記認識
部文型コードに対応する生成部文型コードを有し、各コ
ードは生成文に必要な語順と格情報と統合叙述部コード
を有している生成部文型コードデータベースを備える段
階と;処理する文章を入力する段階と;上記入力された文
章に存在する単語を上記単語辞典データベースから該当
単語を検索する段階と;上記入力された文章のうちの叙
述部の様態、状、時制、尊卑を基準で上記統合叙述部コ
ードデータベースで上記統合叙述部コードを付加する段
階と;上記単語辞典検索段階と上記統合叙述部コード付
加段階で確定された単語の統辞的情報及び統合叙述部コ
ードを情報として上記認識部文型コードデータベースで
認識部文型コードを検索する段階と;上記検索された認
識部文型コードと 対応する生成部文型コードに従って
生成文を形成する段階と;上記生成文に従って処理する
段階とを含む自然語処理方法を提供する。
【0024】本発明で上記統辞的情報は語順と格情報を
含んでいる。
【0025】本発明が翻訳方法に適用される場合には、
上記生成文形成段階は上記生成文型コードに規定された
統辞的情報及び統合叙述部コードに従う翻訳処理作業を
遂行する。
【0026】本発明が翻訳システムに適用される場合に
は、好ましくは生成文型コードが有する生成文型が二つ
以上の言語別に区分されて別個のデータベースを有して
いて、上記処理段階では各言語別に区分されたデータベ
ースの生成文型に従って翻訳処理作業を遂行する。
【0027】本発明が自然語情報検索システムに適用さ
れる場合には、上記処理段階は上記生成文型コードに規
定された語順と格情報及び統合叙述部コードによる検索
を遂行する。
【0028】本発明が感情情報生成システムに適用され
る場合には、上記処理段階は上記生成文型コードに規定
されたところ、感情表現を遂行する。
【0029】本発明が自然語命令システムに適用される
場合には、上記処理段階は上記生成文型コードに規定さ
れたところ、操作や反応を遂行する。
【0030】本発明が自然語対話システムに適用される
場合には、上記処理段階は上記生成文型コードに規定さ
れたところ、応答文を出力する。
【発明の実施の形態】以下、本発明に係る好ましい実施
例が添付された図面を参照して説明する。
【0031】先ず、図1は本発明に係る第1実施例である
翻訳システムのブロック図で、図示の通り、第1言語か
らなる被翻訳文章を入力する入力部(10)を備えていて、
入力された文章に対して単語別情報を有する単語辞典デ
ータベース(20)を備えていて、この単語別検索遂行は単
語辞典検索部(25)で遂行する。この入力部(10)は多様な
入力装置により入力することができ、単語辞典データベ
ース(20)及び単語辞典検索部(25)は多様な方法で設計で
き、これは本発明の要旨ではない。
【0032】ところが、本発明の実施例では統合叙述部
コードデータベース(30)を備えているところ、これは叙
述部に対して言語の特性に関係なく、例えば、該当言語
が屈折語、膠着語等言語の形態論的区分に関係なく、様
態(Modality)、状(Aspect)、時制(Tense)、尊卑(Respec
t)を基準でコード化できる情報を有している。上記入力
された文章に対して叙述部に統合叙述部コードを付加す
ることは統合叙述部処理部(35)である。
【0033】例えば韓国語の場合本用言、補助用言の先
後関係と語尾活用に対して注目し、すなわち、これをデ
ータベース化して用言の属性と語尾活用形態に従ってコ
ードを付与していて、日本語の場合には複合動詞、助動
詞の結合と語尾活用に対して注目し、英語の場合には動
詞と不定詞、分詞、助動詞との関係に注目し、中国語の
場合には動詞と助動詞、虚詞との関係に注目し、これら
の属性と時制を表す副詞語に従ってコードを付与する。
【0034】すなわち、具体的に例えば、韓国語の「愛
した(図3(21)参照)」は過去時制であり、敬語で
はないという情報を基準に統合叙述部コードを付与し、
韓国語の「思慕した(図3(22)参照)」「嫌った
(図3(23)参照)」というものと同じコードを付与
できる。
【0035】これは英語において、「loved」、「disli
ked」、「helped」と同じコードが与えられると思われ
る。
【0036】すなわち、統合叙述部コードは少なくとも
4桁を有していることが好ましいところ、各桁は様態(Mo
dality)、状(Aspect)、時制(Tense)、尊卑(Respect)に
対する情報を有していて、勿論、他の性格を追加してコ
ード化でき、この場合にはコードの桁数はもっと多くな
るだろう。例えば 時制に対して過去完了は0、過去は
1、現在は2、現在完了は3、未来は4、未来完了は5等の
ように区分できる。
【0037】本発明はまた認識部文型コードデータベー
ス(40)を有しているところ、多様な文章の翻訳単位別語
順と格情報のような統辞的情報(syntactical informati
on)及び上記統合叙述部処理部(35)で付加された統合叙
述部コードに従う文型コードを有している。すなわち、
韓国語で[形容詞+名詞+助詞+名詞+助詞+動詞]の順序で
あり、この文章の統合叙述部コードが [SXXX0011]であ
る場合にはコードが例えば、「4784322」と記載されて
おり、入力された文章の認識部文型コードを検索するこ
とは文型認識処理部(45)で遂行する。
【0038】本発明では生成部文型コードデータベース
(50)を備えているところ、これは第2言語そして/または
第3言語等に対する同じコードや対応するコードを有し
ていて、各該当言語の翻訳単位別語順と格情報のような
統辞的情報及び統合叙述部コードが表示されている。
【0039】すなわち、「4784322」という韓国語認識
文型コードに対して日本語は「4784322」という同じコ
ードまたは「784322-1」という対応するコードを有し、
日本語の語順と格情報のような統辞的情報及び統合叙述
部コードを有している。
【0040】この生成文型コードの検索は文型生成処理
部(55)で遂行する。
【0041】すなわち、生成文型コードに従って翻訳作
業を遂行し、この時各翻訳単位別訳語を代入する過程が
遂行される。この時、上記単語辞典データベース(25)ま
たは別個の訳語データベースが介入されることができ
る。
【0042】以後、この翻訳文は処理部(60)である多様
な出力装置の出力部を通じて出力される。
【0043】図2を参照して、より具体的な例を挙げれ
ば、入力部を通じて入力された(S1)ハングルからなる
「私がこの領土の支配者だ(図3(24)参照)」を他
言語へ翻訳することにおいて、「私(図3(25)参
照)」を名詞(句)と認識して、「が(図3(26)参
照)」は助詞、「この領土(図3(27)参照)」を名
詞句、「の(図3(28)参照)」を助詞、「支配者
(図3(29)参照)」を名詞句、「だ(図3(30)
参照)」を語尾と認識をしなければならず(S2)、これは
様々な方法があるが本発明ではこのような翻訳単位別に
認識する方法に対し限定しておらず、多様な方法に従う
ことができる。この時単語辞典データベースにはこのよ
うな翻訳単位別に処理できる充分な資料があるものは通
常の方法と同一である。
【0044】このような翻訳単位に対して対応する言語
の訳語を準備することは従来と同様に膨大なデータベー
スを必要とし、このことを本発明では単語辞典データベ
ース(20)とする。
【0045】ところが、本発明で留意していることはこ
の文章が1番目の名詞+1番目の助詞(この助詞は「が(図
3(31)参照)」または「が(図3(32)参照)」
のうちの一つであり)+2番目の名詞句+2番目の助詞(の
(図3(33)参照)」であり)+3番目の名詞+1番目の
敍述格助詞(この助詞は「だ(図3(34)参照)」ま
たは「だ(図3(35)参照)」である)のように、特
定翻訳単位の種類と順序そして各調査の格に対しては明
確にしなければならない。例えば、翻訳単位は名詞
(句)、助詞、叙述部(句)のようになりうる。
【0046】そして語尾は「だ(図3(36)参照)」
であるから、現在叙述型という点を注目しており、これ
は語尾活用が激しい膠着語では重要な要素である。この
ような用言の多様な形態、すなわち、様態、状、時制、
尊卑等により性格を定め、この性格によりコード化する
こと(S3)が本発明の最大の核心であり、この明細書では
これを統合叙述部コードとし、これをデータベース化し
たことを統合叙述部コードデータベース(30)とする。
【0047】本発明はまた様々な種類の言語に対するこ
のような数多くの文章を分析し、翻訳単位別に語順と格
助詞の性格のような統辞的情報、統合叙述部コードに従
って各文章にコードを付与する。すなわち、多数の文章
が同じコードを有することができ、これを文型コードと
する。すなわち、この文章は現在叙述型であり、主語が
あり、主語を説明する形式の文章であり、説明されるこ
とには名詞句が二つがあり、この名詞句は互いに所有格
的な関係にあり、ハングルにおいては、上の一番目の名
詞が主語になり、二、三番目の名詞句である「この領土
(図3(37)参照)」と「支配者(図3(38)参
照)」が所有格であって、三番目の名詞句が所有者的関
係にある形式である。これを例に挙げて、コードとして
「2222321」と付与するとすれば、一つの言語には多様
な文型が存在することになるため、このようなことをで
きるだけ詳細に分類してコード化し、各コード別に語順
と格助詞の性格を記録して認識部文型コードデータベー
ス(40)化する。従って、このコード付与はできるだけの
言語人類学的観点から詳細に分類し、各言語間に表現で
きる感情や方式が全て含まれなければならない。例えば
所望、命令、仮定等に対する情報別に詳細に区分され
なければならない。
【0048】すなわち、この認識部文型コードデータベ
ースを検索することによって、認識部文型コードが分か
ることになる。(S4) また、英語、日本語、中国語等にもこのようなコードは
全てあり、これは同様に現在叙述型であり、主語を説明
する形式であり、被説明部は二つの名詞句があり、この
二つの名詞句は相互所有関係にあるようになり、このよ
うなことは同じコードとして、または関連したコードと
して各第1言語のコードに対して相互リンクさせてこれ
を生成文型コードデータベース化する。
【0049】もう少し詳細に説明するために、続けて上
の例を挙げれば、ハングルの一番目の名詞である「私
(図3(39)参照)」は英語及び日本語ではどのよう
に表現されるかというのは第1データベースにより決ま
る。すなわち、英語で「I」であり、日本語では「私」
であり、中国語では「我」である。ここで各文章の名
詞、助詞、語尾に対応する各第2言語の表現を探す方法
は本発明の要旨ではない。
【0050】ところが本発明では上のコード化に重点を
おいているところ、英語を例に挙げれば、英語式表現は
「I am the ruler of this land. 」である。すなわ
ち、英語は 「一番目の名詞句+一番目の敍述格助詞+2
番目の名詞句+of+三番目の名詞句」という形式で示され
ることになる。
【0051】すなわち、2222321コード文章に対する各
言語の構造を予め把握してデータベース化しておいた状
態で、このコードの英語において一番目の名詞句はハン
グルにおける一番目の名詞句である「私(図3(40)
参照)」の訳語になり、一番目の敍述格助詞は最後に来
る「だ(図3(41)参照)」の訳語であり、二番目の
名詞句はハングルにおける三番目の名詞句の「支配者
(図3(42)参照)」の訳語になり、三番目の名詞句
はハングルにおける二番目の名詞句である「この領土
(図3(43)参照)」になる。
【0052】従って、これをすぐに代替することによっ
て翻訳が可能になる。
【0053】これをプログラム的に例を挙げてさらに説
明すると以下のどおりである。
【0054】入力された(S1)文章がハングルで「私がこ
の領土の支配者だ(図3(44)参照)」である場合、
翻訳単位別語順と格情報で分析すると(S2)、 NP[0];J[0].SRC==が(図3(45)参照) ‖が(図
3(46)参照) ;NP[1];J[1].SRC==の(図3(4
7)参照);NP[2];VP[0].SRC==だ(図3(48)参
照).UMI=SXXX0011」とすることにしよう。ここでVP
[0].UMI==SXXX0011は統合叙述部コードであって、現
在叙述型を意味するコードとすることができる。これは
文章を翻訳単位別に分析しながら叙述部を把握し、叙述
部が現在叙述型と把握されると、統合叙述部コードデー
タベース(30)で統合叙述部コードを付加する。(S3) かくして、このような語順と格情報をもって、また統合
叙述部コードが SXXX0011を有する文型を認識部文型コ
ードデータベースから探すと、コードは2222321にな
る。
【0055】すなわち、ハングルが第1言語である場合
「私がこの領土の支配者だ(図3(49)参照)」とい
う文章の語順が「一番目の名詞(NP[0])+一番目の助詞(J
[0])+二番目の名詞句(NP[1])+二番目の助詞(J[1])+三番
目の名詞(NP[2])+一番目の敍述格情報(VP[0]) 」とされ
ていて、J[0]が「が(図3(50)参照)」または「が
(図3(51)参照)」のうちの一つであり、J[1]が
「の(図3(52)参照)」であり、VP[0]が「だ(図
3(53)参照)」または「だ(図3(53)参照)」
であり、現在敍述格である「(UMI==SXXX0011) 」とい
う情報を把握する瞬間、この文章は 2222321コードに該
当することを認識部文型コードデータベース(40)から分
かる。(S4) このコードに該当する訳語の配置は生成部文型コードデ
ータベース(50)から探すと、下記のようにデータベース
化されている。(S5) E;;2222321;;NP[0];VP[0];NP[2];of;NP[1].;; すなわち、一番目の位置にハングルのNP[0]に該当する
訳語を位置させ、二番目の位置にハングルのVP[0]に該
当する訳語を位置させ、三番目の位置にハングルのNP
[2]の訳語を位置させ、ofを入れ、次にハングルのNP[1]
に該当する訳語を位置させて句読点を打つ。(S6) このように各言語において、同じ文型コードを探して文
章の順序を知って、その文章の順序にはいかなる順に各
訳語が入るかが予め決まっていることになる。
【0056】従って、この方式によって各訳語は順次位
置して結果値として「I am the ruler of this land.
」が英語へ翻訳される。
【0057】これを出力することによって翻訳処理は完
結される。(S7) これを日本語と中国語に拡張すると、第2生成部文型コ
ードデータベース(51)から日本語はJ;;2222321;;NP
[0];は;NP[1];の;NP[2];VP[0].;;であり、第3生成
部文型コードデータベース(52)から中国語はC;;222232
1;;NP[0];VP;[0];NP[1];的;NP[2];.;;と予めコー
ドに従う語順及び格情報が体系化されていて、各訳語だ
け順次入れれば良く、その結果としての日本語は「私が
この領土の支配者だ。」であり、中国語にも同じ方式を
適用すればよい。
【0058】また、他の例を挙げれば、今回は中国語か
らなる、処理しようとする文章が「制造新的大炮≡」で
あった場合、この文章をまず分析してこの文章がVP[0];
NP[0];J[0].SRC==≡ということを把握する。この文型
は例えば予め「NP[0]を(図3(54)参照)VP[0]しろ
という命令文(図3(55)参照)」と分析された状態
で認識部文型コードデータベース上にコード化されてい
て、データベース上の文型コードを対照して例えば1200
321というコードを検索すると、同じ意味を持つ「VPが
(図3(56)参照)NPを修飾する命令文(図3(5
7)参照))」であるハングルと日本語と英語の120032
1コードを生成部文型データベースから探して、上の中
国語のVP[0]、NP[0]、J[0]がどのように配置され、格情
報がどのように追加され、配置されるかが分かって代入
すればよい。
【0059】韓国語の場合、生成部文型コードデータベ
ース(40)に「K;;1200321;;NP[0];(を(図3(58)参
照))を(図3(59)参照)VP[0].UMI==SOXX0045;;
と情報が保存されているため、単語辞典データベース(2
0)の情報を代入しながら、統合叙述部コードであるSOXX
0045の情報に従ってハングルでは「新しい大砲を作りな
さい(図3(60)参照)」と直ちに翻訳され、第2、3
生成部文型コードデータベース(51)(52)を参照すると、
英語は「E;;1200321;;VP[0]NP[0].;; 」であるから「Ma
ke a new canon. 」になり、日本語には 「J;;120032
1;;NP[0]をVP[0].;; 」であるから 「新しい大砲を作り
なさい. 」となる。
【0060】勿論、「作る(図3(61)参照)」から
「作りなさい(図3(62)参照)」と変える必要があ
るところ、ハングルや日本語のような膠着語には好まし
くはコードに様態、状、時制、尊卑等に対する情報を含
んでいなければならない。その他の訳語で大文字、小文
字へ変えて、助詞のうちの「を(図3(63)参照)」
と「を(図3(64)参照)」とから一つを選択する方
法は、各言語別処理特性に基づいて従来の方法に従う。
【0061】本発明の適用例は様々な分野があるとこ
ろ、例えば、スキャンで文字を認識してコンピュータ内
で翻訳して文字列やファイル形式で出力する方式があ
り、インターネットへのチャットにも利用できる。
【0062】また入力部(10)と出力部即ち、処理部(6
0)は各言語別に区分して第1言語入力部、第2言語入力
部、第1言語出力部、第2言語出力部のように細分できる
ことは勿論である。
【0063】また3ケ言語以上を同時に使用するインタ
ーネットチャットにも適用できることは勿論である。こ
の時それぞれのデータベースとこれを処理するそれぞれ
の処理部はクライアント-サーバー方式で構成してサー
バーあるいはクライアントに分散して処理できる。
【0064】本実施例はまた文字を話へ変えるTTSサー
ビス(text to speech)または逆に話を文字へ変えるサー
ビスにも利用できることは勿論で、多様に2ケ言語以上
の翻訳にもすべて適用されることができる。
【0065】自然語を処理する本発明の第2実施例は情
報検索をする方法及び装置に関するもので、本実施例で
は検索命令に関する文章を入力する入力部と;単語辞典
データベースと;入力された文章を処理単位別に上記単
語辞典データベースから検索する単語辞典検索部と;統
合叙述部コードを有する統合叙述部コードデータベース
と;上記入力された文章の叙述部を把握して上記統合叙
述部コードデータベースで統合叙述部コードを付加する
統合叙述部処理部と;認識文型コードを有する認識文型
データベースと;認識文型コードを検索する文型認識処
理部と;上記認識文型コードに従って対応する命令文型
コードがリンクされた命令(生成部)文型データベース
と;上記命令文型データベースの命令文型コードに従っ
て検索命令文章を生成する文型生成処理部と;文型生成
処理部による命令文に従って検索する処理部を備えてい
る。上記第1実施例と適用される構成が同一で、意味で
だけ多少差があるため、別途の図面は省略する。
【0066】例えば、インターネット上で検索窓に「イ
スンシンの誕生日はいつですか?(図3(65)参
照)」という質疑文章を入力すると、この文章を入力部
で認識し、単語辞典検索部では例えば品詞単位別に単語
辞典から検索する。
【0067】この時文章の叙述部を探して統合叙述部コ
ードデータベースで統合叙述部コードを付加する。
【0068】叙述部コードと語順と格情報等の統辞的情
報に従って認識文型コードが検索される。即ち、下記の
ように表現されることができる。
【0069】K;;2101000;;NP[0];J[0].SRC==の(図3
(66)参照);NP[1];J[1].SRC==は(図3(67)
参照)‖は(図3(68)参照);NP[2].ATR==Tme;VP
[0].SRC==である(図3(69)参照);VP[0].UMI=
=QXXX0018;;この認識文型コードK;;2101000は同じ文型
に対して同じ値を有することは当然で、例えば、「ホン
チルトンの誕生日はいつですか(図3(70)参照)」
も同じ文型コードを有する。このように確定された認識
文型コードに対して対応する検索命令文文型コードがあ
る命令文型コードデータベースにはK;;2101000;;NP[0]&
&NP[1]&&NP[2].ATR<=Tme;;と表示されている。ここで
三番目の出現する名詞句(NP[2])の意味属性が時間属性
(Tme)であるから、韓国語文章に対して情報検索命令は
一番目の出現する名詞句(NP[0])と二番目出現する名詞
句(NP[1])を全て含んでいる文章中で、時間属性の名詞
を含む文章を検索対象文に選定できる。
【0070】ここで 「いつ(図3(71)参照)」が
時間属性というのは上記単語辞典データベースに予め記
録されていて、このような分類は本発明の要旨ではな
く、この技術分野の当業者が既に遂行している作業であ
る。
【0071】ところが、これを多言語からなる文章にも
拡張できるところ、この時必要なものは必要な翻訳辞典
が収録された翻訳辞典データベースのみあればいい。
【0072】即ち、E;;2101000;;NP[0]&&NP[1]&&NP[2].
ATR<=Tme;;は英語からなる文章検索用であり、J;;2101
000;;NP[0]&&NP[1]&&NP[2].ATR<=Tme;;は日本語からな
る文章検索用であり、C;;2101000;;NP[0]&&NP[1]&&NP
[2].ATR<=Tme;;は中国語からなる文章検索用である。
【0073】英語の例を挙げれば、対応する単語である
「SUNSIN LEE」と「BIRTHDAY」は翻訳辞典データベース
で確定され、時間に対する情報(YEAR、MONTH、DATE、WH
EN、YESTERDAY等)が含まれた文章を探すことになる。文
章を探すことは従来に多様に紹介されている検索エンジ
ンで可能である。
【0074】また、例えば「イスンシンの好きな人は誰
ですか(図3(72)参照)」という検索文章に対して
K;;2122110;NP[0];J[0].SRC==‖;VP[0].UMI==SXXX0
001;NP[1];J[1].SRC==‖;NP[2].ATR==Hmn;VP[1].AT
R==QXXX0B03;;と認識文型コードが検索されると、「N
P[0]が'好きだ(Lve)'の意味属性を持つVP[0]する'人(Hm
n)'の意味属性を持ったNP[2]」という文型というのを認
識することになる。ここでVP[0]及びNP[2]等の意味属性
は単語辞典データベースで確認される。
【0075】これを生成部文型コードデータベース即
ち、命令文型コードデータベースでは「K;;2122110;;NP
[0]&&VP[0].ATR<=Lve&&NP[2].ATR<=Hmn」となってい
る。
【0076】即ち、「イスンシン(図3(73)参
照)」と人属性(Hmn)のNPと好むという属性(Lve)を持つ
VPがある文章を検索することになる。従って「イスンシ
ンがヨンランを思慕したが(図3(74)参照)」また
は「イスンシンはヨンランが好きで(図3(75)参
照)」「イスンシンはヨンランを欽慕して(図3(7
6)参照)」等のような文章を検索できることになる。
【0077】他の例として、検索文章が「故郷がブサン
ではない会員は誰ですか?(図3(77)参照) 」と
いう文章に対して認識部文型コードで検索して探された
認識部コードはK;;2231200;;NP[0];J[0].SRC==が(図
3(78)参照)‖が(図3(79)参照);NP[1];J
[1].SRC==||;VP[0].ATR==Ngt.UMI==SXXX0001;N
P[2];J[2].SRC==は(図3(80)参照)||は(図
3(81)参照);NP[3].ATR==Hmn;VP[1].SRC==で
ある(図3(82)参照);VP[1].UMI==QXXX0B03;;
」で、上記認識部文型コードによりこの文章は「NP[0]
がNP[1]が不定属性であるVP[0]するNP[2]は人属性であ
るNP[3]であるか? 」という形態の文章であることが分
かる。
【0078】この時不定属性(Ngt)は単語辞典データベ
ースで確認される。
【0079】これに対して生成部文型コードデータベー
スで対応する生成部文型コードを探すとK;;2231200;;NP
[0]&&!NP[1]&&NP[2]&&NP[3].ATR<=Hmn;;になる。即
ち、これは「NP[1]は出現しなく、NP[0]とNP[2]とNP[3]
が全て発見される文章を検索なさい。」という命令文に
関する生成部文型コードである。
【0080】従って、「故郷がデグであるキンチョルス
会員は昨日交通事故でなくなった(図3(83)参照)
」という文章が検索される。
【0081】本発明の第3実施例は感情情報生成システ
ムに関するもので、やはり文字または対話方式の文章を
入力する入力部と;単語辞典データベースと;入力された
文章を処理単位別に上記単語辞典データベースから検索
する単語辞典検索部と;統合叙述部コードを有する統合
叙述部コードデータベースと;上記入力された文章の叙
述部を把握して上記統合叙述部コードデータベースで統
合叙述部コードを付加する統合叙述部処理部と;認識文
型コードを有する認識文型データベースと;認識文型コ
ードを検索する文型認識処理部と;上記認識文型コード
に従って対応する感情表現文型コードを有する感情表現
(生成部)文型コードデータベースと;上記生成部文型コ
ードデータベースの感情表現文型コードに従って感情表
現文章を生成する文型生成処理部と;文型生成処理部に
よる感情表現文による処理部即ち、感情出力部とを備え
ている。
【0082】例えば「あなたはブスだ(図3(84)参
照)」という文章が入力部に入力されると、単語辞典検
索部で処理単位別に単語辞典データベースから検索し、
統合叙述部コードを付加し、語順と格情報を把握しなが
ら、「NP[0].ATR==「Hm2「;J[0].SRC==は(図3
(85)参照)‖は(図3(86)参照);VP[0].ATR=
=AUg;;」は認識部文型コードデータベースでは例えば2
432230と検索できることになる。
【0083】ここでHm2は例えば2人称名詞属性即ち、
「あなた(図3(87)参照)」や「おまえ(図3(8
8)参照)」がこれに該当し、AUgは外形(外観)の悪さ
を描く形容詞属性であって統合叙述部コードに該当し、
これに 該当する単語は「ブスだ(図3(89)参
照)」の以外に「カボチャだ(図3(90)参照)」、
「不器量だ(図3(91)参照)」、「見苦しい(図3
(92)参照)」等となる。
【0084】また例えば叙述部コードAPrは外形が良い
ことを表すのとする場合、「きれいだ(図3(93)参
照)」、「かっこいい(図3(94)参照)」、「ハン
サムだ(図3(95)参照)」、「美しい(図3(9
6)参照)」等とされることができる。
【0085】一方、上の例によって、感情表現コードを
知るために生成部文型コードデータベースを探すと、
「2432230;;ANGRY」と記載されている。即ち、このよう
な文章の語順と格情報及び叙述部コードの性格により把
握された認識文型コードに対する生成部文型コードを
「ANGRY」とする場合、これは感情表現(命令)コードに
該当し、これは感情表現(命令または生成部文型)データ
ベースから探す。
【0086】この命令コードは例えば「SMILE(笑い)
(図3(97)参照)」「WINK(ウインク)(図3(9
8)参照)) 」「CLOSEEYES(深刻に目を閉じる)(図3
(99)参照)」のように多様な命令文型を作ることが
でき、これはキャラクターの表情を如何に変えられるか
による。
【0087】この命令データベースから探された命令コ
ードに従ってキャラクターは表情を変えることになり、
キャラクターの表情を変える技術は通常の様々な方法に
従うことができ、これは本発明の核心でない。
【0088】一方、このような方法で命令コードを探す
ためのデータベースには英語と日本語、中国語等に多様
にコード化して命令コードをデータベース化できる。
【0089】本発明の第4実施例は自然語命令システム
で、やはり文章を入力する入力部と;単語辞典データベ
ースと;入力された文章を処理単位別に上記単語辞典デ
ータベースから検索する単語辞典検索部と;統合叙述部
コードを有する統合叙述部コードデータベースと;上記
入力された文章の叙述部を把握して上記統合叙述部コー
ドデータベースで統合叙述部コードを付加する統合叙述
部処理部と;認識文型コードを有する認識文型データベ
ースと;認識文型コードを検索する文型認識処理部と;上
記認識文型コードに従って対応する命令文型コードを有
する命令(生成部)文型コードデータベースと;上記生成
部文型コードデータベースの命令文型コードに従って命
令(生成)文章を生成する文型生成処理部と;上記生成文
章による処理部即ち、作動部とを備えている。
【0090】例えば、「ニュースチャンネルのみ順序に
見せて下さい(図3(100)参照)」という話者の要
求に対して入力部では音声認識技術等のような技術で文
章が入力され、単語辞典検索部で単語を検索し、併せて
統合叙述部処理部で統合叙述部コードを付加する。
【0091】このように把握された情報は例えば「NP
[0].CHN-ATR==”Nws”;J[0];VP[0].ATR==Shw;VP
[0].UMI==SOXX0945;; 」とすれば、ここで予め単語辞
典データベースでは”Nws”は該当名詞が「ニュースチ
ャンネル(図3(101)参照)」と予め定められた場
合に該当する。
【0092】また”Shw”「見せる(図3(102)参
照)」のように特定NPを話者に表示すべき動詞属性を表
し、UMI以下部分は第1実施例のような叙述部コードとし
て「-て下さい(図3(102)参照)」のような命令
あるいは要求の叙述部活用語尾(英語や中国語の場合命
令文文型)に該当する。
【0093】これを文型認識処理部では認識部文型デー
タベースを検索して、K;;CNT0010;;NP[0].CHN-ATR=
=”Nws”;J[0];VP[0].ATR==Shw;VP[0].UMI==SOXX0
945;;とされているから、文型コードはCNT0010と把握
し、生成文型コードデータベースから探すと、 例えば
「K;;CNT0010;;SEE;;NP[0].CHN-ATR==”Nws”のよう
になっているので、これによる生成文はNP[0].CHN-ATR
属性に該当されるチャンネルのみ連続的に見せる命令語
であるから、CNT0010コードにより現在放送中であるニ
ュースチャンネルを連続的に見せるようになる。このよ
うな命令は音声リモコンに予め放送中であるプログラム
を把握でき、作動されることができるプログラムがあれ
ばいいため、以下の処理部で遂行する技術は現在通常処
理される自然語命令システムに説明されることができる
ため省略する。
【0094】これもまた上で説明した他の実施例のよう
に多国語に可能であることは当然である。即ち、文型コ
ードを該当言語に対して設定しておき、該当言語が入力
されて単語辞典データベース及び統合叙述コードデータ
ベース及び認識部文型コードデータベースを検索し、生
成文型を生成すれば、同じ方法で行われることができ
る。
【0095】本発明の第5実施例は自然語対話システム
に関するもので、文章を入力する入力部と;単語辞典デ
ータベースと;入力された文章を処理単位別に上記単語
辞典データベースで検索する単語辞典検索部と;統合叙
述部コードを有する統合叙述部コードデータベースと;
上記入力された文章の叙述部を把握して上記統合叙述部
コードデータベースで統合叙述部コードを付加する統合
叙述部処理部と;認識文型コードを有する認識部文型デ
ータベースと;認識文型コードを検索する文型認識処理
部と;上記認識文型コードに従って対応する応答文型コ
ードを有する応答文(生成部)文型コードデータベース
と;上記生成部文型コードデータベースの応答文型コー
ドに従って応答文を生成する文型生成処理部と;応答文
を出力する処理部即ち、音声処理部とを備えている。
【0096】例えば、入力部で「あなたの名前はなんで
すか?(図3(103)参照)」という文章が入力され
ると、単語辞典検索部及び統合叙述部処理部ではこの文
章が「NP[0].ATR==Hm2;J[0].SRC==の(図3(10
4)参照);NP[1];J[0].SRC==は(図3(105)参
照)||は(図3(106)参照);NP[0].ATR==Wht;
VP[0];; 」と把握するようになる。ここで NP[0].ATR=
=Wht;VP[0];;は名詞の属性が何(what)に該当すること
を意味し、これは単語辞典データベースに準備されてい
る。これを認識部文型データベースで探すと、K;;Q;;WH
ATNP010010;;NP[0].ATR==Hm2;J[0].SRC==税;NP[1];
J[0].SRC==精||澗;NP[0].ATR==Wht;VP[0];;とな
っており、ここでQは質疑部(Question)であることを知
らせるコードである。
【0097】一方、生成部の生成部文型コードデータベ
ースによると、K;;A;;WHATNP010010;;NP[0].ATR<=Hm1
の(図3(107)参照);;NP[1];は(図3(108)
参照);NP[0].CNF<=NAME;と記録されており、文型生成
処理部では単語辞典データベースを利用して「私の名前
はアスクリスです(図3(109)参照)」という文章
を生成する。
【0098】Aは応答部(Answer)であることを知らせる
コードであり、NP[0].ATR<=Hm1は認識部で認識した名
詞を1人称の名詞へ変えて出力し、NP[0].CNF<=NAMEは
参照する単語(NP[0])の名前を意味する。
【0099】その他文章の例としては、(質疑部)[あな
たはどこに住みますか(図3(110)参照)] →
(応答部)[私はシンシアリッドに住みます(図3(11
1)参照)] (質疑部) [あなたの職業は何ですか(図3(112)参
照)] → (応答部)[私の職業は狩人です(図3(11
3)参照)]等もこのような認識文型コードと生成文型
コード及び単語辞典データベースを活用することにより
可能である。
【0100】この実施例はゲーム内に対話反応型キャラ
クターを使用することができるため、コンピュータ及び
ビデオゲーム上での活用が可能であり、プレーヤーの注
文、要求、命令に従ってゲーム内で多様に変数として適
用できる対話反応型ストーリー変更システムのようなゲ
ームでも適用可能である。
【0101】またパズル(puzzle)、ハングル教室、ABCD
教室のように子供らとの対話型ゲームのような教育用ソ
フトウェアにも適用が可能であり、翻訳機能を追加して
外国語の作文指導システム、その他外国語関連教育及び
講義プログラムに適用が可能である。
【0102】また航空機、列車等の座席予約やホテル予
約に自動電話予約システムを適用することが可能にな
る。
【0103】また自閉児または言語障害児らを治療でき
る再活機器に活用できる利点がある。
【発明の効果】以上に説明したように、本発明は先ず統
合叙述部コードと認識及び生成文型コードを採択するこ
とにより、いかなる言語でもコードだけ探すとすぐに代
入して翻訳や認識が可能な利点がある新しい自然語処理
方法を提供している。
【0104】また特にこの発明は3ケ国語以上が使用さ
れる装置にも適用されて同時翻訳が可能な利点があり、
上で説明したように、注文型情報検索システムや、感情
情報生成システムや、自然語命令システム、自然語対話
システム等に適用及び活用が可能である。
【0105】以上で本発明に係る実施例を説明したが、
本発明はこのような実施例に限定されることではなく、
本発明の精神を抜け出さないで多様な変化と変形が可能
なことである。
【0106】しかし、このような多様な変化と変形が本
発明の権利範囲に属することになることは添付された請
求範囲を通じて分かることである。
【図面の簡単な説明】
【図1】図1は本発明に係る自然語処理装置の構成ブロ
ック図である。
【図2】図2は本発明に係る自然語処理方法のフローチ
ャートである。
【図3】図3は明細書中に記述されたハングル表記の日
本訳と対応するハングル表記を示す図である。
【符号の説明】
20 単語辞典データベース 30 統合叙述部コードデータベース 40 認識部文型コードデータベース 50 生成部文型コードデータベース

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】自然語の処理単位別単語を収録した単語辞
    典データベースと;叙述部の多様な情報を言語別特性に
    関係なく、様態、状、時制、尊卑を含む情報で叙述部を
    統合叙述部コード化できる情報を有する統合叙述部コー
    ドデータベースと;文章の語順と格情報と上記統合叙述
    部コードに従って文章をコード化した認識部文型コード
    データベースと;上記認識部文型コードに対応し、文型
    情報を有する生成部文型コードを有する生成部文型コー
    ドデータベースと;処理する文章を入力する入力部と;上
    記入力された文章に存在する単語を上記単語辞典データ
    ベースから該当単語を検索する単語辞典検索部と;上記
    入力された文章のうちの叙述部の様態、状、時制、尊卑
    を基準で上記統合叙述部コードデータベースで上記統合
    叙述部コードを付加する統合叙述部処理部と;上記単語
    辞典検索部と上記統合叙述部処理部で確定された統辞的
    情報及び統合叙述部コードを情報として上記認識部文型
    コードデータベースから認識部文型コードを検索する文
    型認識処理部と;上記検索された認識部文型コードと対
    応する生成部文型コードを上記生成部文型コードデータ
    ベースから探して上記文型情報に従って生成文を形成す
    る文型生成処理部と;上記生成文に従って必要な作業を
    遂行する処理部とを含む自然語処理装置。
  2. 【請求項2】上記処理する文章は第1言語からなってい
    て、 上記生成文は第2言語からなっていて、 上記単語辞典データベースは上記第1言語に対する第2言
    語の訳語を有していて、 上記文型生成処理部は上記生成文情報に従って上記単語
    辞典データベースから訳語を探し、生成文型コードの統
    合叙述部コードの情報に従って生成文を生成し、 上記処理部は翻訳文を出力する請求項1記載の自然語処
    理装置。
  3. 【請求項3】上記入力部に入力する文章は検索要求文章
    であり、 上記生成文は検索エンジンのための命令文であり、 上記処理部は上記命令文に従って検索を遂行する請求項
    1記載の自然語処理装置。
  4. 【請求項4】上記生成文は感情情報値であり、上記処理
    部は上記感情情報値に従って感情表現物が感情を表現す
    るようにする請求項1記載の自然語処理装置。
  5. 【請求項5】上記生成文は所定の命令を遂行する命令文
    であり、 上記処理部は上記命令文に従って機械の操作や反応をす
    るようにする請求項1記載の自然語処理装置。
  6. 【請求項6】上記生成文は上記認識される文章に相応す
    る応答文であり、 上記処理部は上記応答文を出力する請求項1記載の自然
    語処理装置。
  7. 【請求項7】自然語の処理単位別単語を収録した単語辞
    典データベースを備える段階と;文章のうちの叙述部の
    多様な情報を言語別特性に関係なく、様態、状、時制、
    尊卑を含む情報として統合された統合叙述部コード化の
    ための情報を有する統合叙述部コードデータベースを備
    える段階と;多様な文章の語順と格情報と上記統合叙述
    部コードに従って文章をコード化した認識部文型コード
    データベースを備える段階と;上記認識部文型コードに
    対応する生成部文型コードを有し、各コードは上記処理
    単位別語順と格情報と統合叙述部コードを有している生
    成部文型コードデータベースを備える段階と;処理する
    文章を入力する段階と;上記入力された文章に存在する
    単語を上記単語辞典データベースから該当単語を検索す
    る段階と;上記入力された文章のうちの叙述部に対して
    上記統合叙述部コードデータベースで統合叙述部コード
    を付加する段階と;上記単語辞典検索段階と上記統合叙
    述部コード付加段階で確定された単語の語順と格情報及
    び統合叙述部コードを情報として上記認識部文型コード
    データベースから認識部文型コードを検索する段階と;
    上記検索された認識部文型コードと対応する生成部文型
    コードを上記生成部文型コードデータベースから探して
    生成文を形成する段階と;上記生成文を処理する段階と
    を含む自然語処理方法。
JP2000317158A 2000-06-01 2000-10-17 コード化を通じた自然語処理装置及び方法 Pending JP2001344237A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2000-0030188A KR100379735B1 (ko) 2000-06-01 2000-06-01 코드화를 통한 자연어 처리장치 및 방법
KR2000-30188 2000-06-01

Publications (1)

Publication Number Publication Date
JP2001344237A true JP2001344237A (ja) 2001-12-14

Family

ID=19671042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000317158A Pending JP2001344237A (ja) 2000-06-01 2000-10-17 コード化を通じた自然語処理装置及び方法

Country Status (2)

Country Link
JP (1) JP2001344237A (ja)
KR (1) KR100379735B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128864A (ja) * 2003-10-24 2005-05-19 Ishisaki:Kk 人体カラーの数値的評価システムおよび評価評価方法
JP2009245466A (ja) * 2009-07-30 2009-10-22 P To Pa:Kk 情報処理システム及び情報処理方法
US7933857B2 (en) 2004-04-14 2011-04-26 Ricoh Company, Ltd. Translator support system, server, method and recording medium

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020042248A (ko) * 2000-11-30 2002-06-05 한가람 문장으로부터의 감정 인식 및 표시 방법과 시스템
KR100480345B1 (ko) * 2002-03-27 2005-04-06 서호일 언어코드를 사용한 언어 학습/번역 서비스 시스템 및 그방법
KR101006491B1 (ko) * 2003-06-10 2011-01-10 윤재민 자연어 기반 감정인식, 감정표현 시스템 및 그 방법
KR100817744B1 (ko) * 2005-10-11 2008-03-31 한양대학교 산학협력단 창의적 컨텐츠 생성 방법 및 시스템
KR100850904B1 (ko) * 2006-04-28 2008-08-08 주식회사 올리브나인 대사 분류 프로그램을 이용한 무인대화시스템
KR100912501B1 (ko) 2007-08-09 2009-08-17 한국전자통신연구원 번역 지식 구축 방법 및 장치
KR101282419B1 (ko) * 2011-07-22 2013-07-04 진용옥 중간 내부 정음 치환코드를 이용한 다국어 검색 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
JPH02302874A (ja) * 1989-05-18 1990-12-14 Sanyo Electric Co Ltd 自然言語の解析変換方法
KR910003519A (ko) * 1989-07-15 1991-02-27 김기중 자연언어 처리 및 번역 방법과 그를 이용한 기계번역 시스템
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
KR100474823B1 (ko) * 1998-02-23 2005-03-16 삼성전자주식회사 자연어의품사태깅장치및그방법
KR100283143B1 (ko) * 1998-07-11 2001-03-02 구자홍 시소러스 코드 압축 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128864A (ja) * 2003-10-24 2005-05-19 Ishisaki:Kk 人体カラーの数値的評価システムおよび評価評価方法
US7933857B2 (en) 2004-04-14 2011-04-26 Ricoh Company, Ltd. Translator support system, server, method and recording medium
JP2009245466A (ja) * 2009-07-30 2009-10-22 P To Pa:Kk 情報処理システム及び情報処理方法

Also Published As

Publication number Publication date
KR20010109047A (ko) 2001-12-08
KR100379735B1 (ko) 2003-04-11

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
Waibel et al. Multilinguality in speech and spoken language systems
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
JP2009193448A (ja) 対話システム、方法及びプログラム
KR20110009205A (ko) 컴퓨터와의 자연어 의사소통 시스템 및 방법
JP6225012B2 (ja) 発話文生成装置とその方法とプログラム
KR20140094919A (ko) 문장 형식별 구성요소 배열 및 확장에 따른 언어 교육 시스템 및 방법과 기록 매체: 팩토리얼 언어 교육법
Almasoud et al. A proposed semantic machine translation system for translating Arabic text to Arabic sign language
Giorgi et al. On the syntax/pragmatics interface: Expressing surprise and disapproval
Grif et al. Development of computer sign language translation technology for deaf people
JP2001344237A (ja) コード化を通じた自然語処理装置及び方法
Schönefeld Where lexicon and syntax meet
WO2022259005A1 (en) Automated no-code coding of app-software using a conversational interface and natural language processing
Sari et al. Recognizing Code Switching and Code Mixing in Talk Show Catatan Najwa with Maudy Ayunda on YouTube
KR950013128B1 (ko) 기계번역장치 및 방법
Othman et al. An XML-gloss annotation system for sign language processing
JP2005506635A (ja) 言語又は方法により限定されないコンピュータ制御のコーダ・デコーダ
Boitet GETA's MT methodology and its current development towards personal networking communication and speech translation in the context of the UNL and C-STAR projects
Boonpa et al. Relationship extraction from Thai children's tales for generating illustration
Ahmedova Stages of creating parallel corpus of english-uzbek similes
KR950013129B1 (ko) 기계번역장치 및 방법
Mote Natural Language Processing-A Survey
Boitet Automated translation
Aouiti et al. Translation system from Arabic text to Arabic sign language
JP3892227B2 (ja) 機械翻訳システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040511