JP2004102554A - 文章画像変換ツール - Google Patents

文章画像変換ツール Download PDF

Info

Publication number
JP2004102554A
JP2004102554A JP2002262181A JP2002262181A JP2004102554A JP 2004102554 A JP2004102554 A JP 2004102554A JP 2002262181 A JP2002262181 A JP 2002262181A JP 2002262181 A JP2002262181 A JP 2002262181A JP 2004102554 A JP2004102554 A JP 2004102554A
Authority
JP
Japan
Prior art keywords
image
sentence
text
term
conversion tool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002262181A
Other languages
English (en)
Inventor
Masatoshi Shibuya
渋谷 正敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2002262181A priority Critical patent/JP2004102554A/ja
Publication of JP2004102554A publication Critical patent/JP2004102554A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】文章を画像で表示する文章画像変換ツール。
【解決手段】入力した文章を形態素解析と構文解析して、文章の主要語を抽出し、さらに主要語の上位概念用語を抽出し、主要語または上位概念用語の画像をファイルより検索し、構文解析の解析結果に基づき、画像の配置等を変更して文章を画像表現したものを出力して、機械翻訳装置等で、機械が入力された文章をどのように解釈したか専門的な高度な知識がなくても容易に判断できるようにする。。
【選択図】    図4

Description

【0001】
【発明が属する技術分野】
この発明は、コンピュータが文章をどのように読み取ったかを画像データで表示させる技術に係り、機械翻訳装置や文章図形化装置等に応用される。
【0002】
【従来の技術】
機械翻訳装置の問題点としては、特開2000−40085号に示されているように、形態素解析辞書の不備や文法の不備のため、機械が文章を誤った解釈をしたり、特開平7−295985号や特開平7−73185号に示されるように1つの単語が「名詞」や「動詞」になる他品詞語ある場合、機械が確率などに基づいてどちらか一方の品詞に決めた場合に誤った解釈をしてしまう場合がある。従って、機械翻訳装置は、翻訳する言語に対する知識がないと安心して使用できるものではない。
【0003】
また、機械がどのように構文解釈したかを表示する方法として、特開平7−295985号に示されるように構文木などを表示する方法もあるが、構文木になれていない者でないと、機械が意図したとおりに文章を解釈したかどうか判断するのは困難である。
【0004】
また、機械翻訳装置で翻訳された文章が正しいか判断できるようにする装置として、特開2001−318918号に開示されているように、第一言語を第二言語に翻訳し、その翻訳文を第一言語に翻訳しなおし、意図したとおりに翻訳されたかどうか判断する方法も提案されている。
【0005】
【発明が解決しようとする課題】
従来の技術に示したように、機械翻訳等における問題点の多くは、初期の文章解析の段階に発生するものと考えられるが、機械が文章を正しく解釈したかどうか判断するために、構文木などの表示は、言語学の知識の無いものにとって解読するのが困難であり、より明快な表示手段が要求される。また、第一の言語を第二の言語に翻訳し、さらにその翻訳文を第一の言語に翻訳しなおし、正しく翻訳されたか判断する方法は、双方向の翻訳機能を備えた装置であれば有効であるが、単方向の翻訳装置や、文章を解析して、ブロック図やフローチャート図などの図形を自動表示させる装置にとっては、有効な手段とはならない。
【0006】
本発明は上記の問題点を解決するためになされたものであり、言語学や翻訳する言語の知識が無い者でも正しく機械が文章を解釈したか判断できる装置または方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
この目的を達成するために、本発明の請求項1に記載の文章画像変換ツールは、入力された文章を形態素解析と構文解析とをして、前記文章の中から複数の主要語の抽出をする主要語特定手段と、前記主要語特定手段により抽出された前記複数の主要語に対する上位概念用語を検索する上位概念用語検索手段と、前記複数の主要語を表現する画像または前記上位概念用語検索手段により検索された前記複数の主要語に対する該上位概念用語を表現する画像を検索する画像検索手段と、前記形態素解析と前記構文解析との解析結果に基づき前記画像検索手段により検索された該画像の配置または表示方法を変更する画像変更手段と、前記画像変更手段により配置または表示方法を変更された該画像を前記データ入出力部に出力する機能とを備えたことを特徴とするものである。
【0008】
従って、この発明によれば、文章を機械がどのように解釈したかを画像として表現されるため、構文木などの言語学の知識がなくても容易に判断できるようになるほか、翻訳した文章を画像で表現することにより、翻訳する言語の知識が無くても正しく翻訳されたかどうか容易に判断できるようになる。
【0009】
また、主要語に対する画像が登録されていない場合でも、上位概念用語に対する画像が登録されていれば、少ないメモリ容量でも文章を画像変換表示することができる。
【0010】
さらに、請求項2に記載のコンピュータプログラムを汎用のパーソナルコンピュータ等にインストールすることにより、汎用のパーソナルコンピュータを用いて、容易に文章を画像変換表示できるようになるため、文章を機械がどのように解釈したかを容易に判断できるようになるほか、翻訳する言語の知識が無くても正しく翻訳されたかどうかを容易に判断できるようになる。
【0011】
【発明の実施の形態】
以下、この発明の文章画像変換ツールをコンピュータプログラムとして具体化した実施の形態について説明する。
【0012】
図1は汎用のパーソナルコンピュータのブロック図であり、この汎用のパーソナルコンピュータにコンピュータプログラムとしての文章画像変換ツールをインストールして、本発明の機能を具体化させるものである。
【0013】
中央演算装置であるCPU1と、RAMまたはROMで構成される内部メモリ2と、入出力インターフェース3とはバスライン11で接続され、入出力インターフェース3には、データ通信端末4とデータ出力端末5とデータ入力端末6と外部メモリドライブ端末7とが接続されている。
【0014】
データ通信端末4としては、外部サーバと接続するためのTA(ターミナルアダプタ)や通信モデム等があり、データ出力端末5としては、モニター画面やプリンター等があり、データ入力端末6としては、キーボードやマウス等があり、外部メモリドライブ端末7としては、記憶媒体のHD(ハードディスク)12やCD(コンパクトディスク)やFD(フロッピディスク)等をドライブするHDドライバーやCDドライバーやFDドライバー等がある。
【0015】
OS(オペレーティングシステム)8とOS8の上で動く文章画像変換ツール9は外部メモリ(CPU1にバスライン11で直結されていないメモリ)ドライブ端末7の一つであるHDドライバーによりアクセスされるHD(ハードディスク)12の中にインストールされていて、OS8が内部メモリに書き込まれた後、文章画像変換ツール9の一部または全部が内部メモリ2に書き込み、図3のフローチャート等で示すプログラムを実行する形態をとる。
【0016】
文章画像変換ツール9で解析対象とする文章は、データ入力端末6のキーボードを介して入力されたり、記憶媒体に記憶されたものを外部メモリドライブ端末7を介して入力されたり、データ通信端末4を介して外部サーバから入力され、データファイル10に格納される。
【0017】
また、データ入力端末6のキーボードやマウス等は、文章画像変換ツール9を操作するために使われ、データの加工結果等は、データ出力端末5のモニター画面やプリンタ等に出力される。
【0018】
図2は、文章画像変換ツール9の構成図である。文章画像変換ツール9の中の文章画像変換を実行する実行ファイル20は、画像変換対象の文章を形態素解析用辞書30で定義された文字列に分解し、各単語の品詞を検索するための形態素解析部21と、形態素解析部21により分割された単語について文法規則ファイル32で定義された法則に基づき構文上の位置づけ等を解析し、文章中の主要語の抽出をする構文解析部22と、それぞれの主要語に対する上位概念用語を上位概念辞書31により抽出する上位概念用語変換部23と、主要語または上位概念用語に対する基本画像を基本画像ファイル33から検索する画像変換部24と、それらの画像を先の形態素解析部21や構文解析部22での解析結果と主要語を修飾する用語と画像変更ルールファイル34の定義とに基づき出力する画像の配置や表示方法を決める画像変更部25と画像の出力処理を行う画像出力部26とに分かれていて、それぞれコンピュータプログラムとして機能する。
【0019】
形態素解析用辞書30は、単語の辞書で単語の品詞や活用変化や単語と単語との関係から品詞を確定させるためのルール等が格納されていて、形態素解析部21で画像変換対象の文章を形態素解析するために用いられる。
【0020】
上位概念辞書31は、語句に対する上位概念の語句が格納されていて、例えば、本発明で画像変換対象の文章の主語格、目的格、補語格等における主要語として「ばね」や「ゴム」といった語句が抽出された場合、それらの語句の上位概念として「弾性体」という語句が上位概念辞書31に格納されていて、その上位概念の語句が自動的に検索できるようにするために用いられる。
【0021】
文法規則ファイル32は、形態素解析部21により分割された単語の構文上の位置づけを解析するためのルールが定義され、文章中の主語格、目的格、補語格、述語部分等における主要語の抽出をするために用いられる。
【0022】
基本画像ファイル33には、主要語や上位概念用語に対応する画像が格納されている。
【0023】
画像変更規則ファイル34には、形態素解析部21または構文解析部22の解析結果により主要語や上位概念用語に対応する画像の配置方法や表示方法が定義されている。
【0024】
図3は、文章入力後、文章に対応する画像を出力するまでの処理手順を示したフローチャートである。
【0025】
図3の処理S1では、画像変換対象の文章を形態素解析部21において、形態素解析用辞書30を参照して形態素解析の処理が行われる。また、形態素解析用辞書30に登録されていない未知語は、すべて名詞句として処理する。
【0026】
図4に示すように原文の文章が「我輩は猫である。」は、形態素解析により、「我輩(代名詞)」、「は(係助詞または副助詞)」、「猫(普通名詞)」、「で(格助詞)」、「ある(動詞)」、「。(句点)」のように分解される。
【0027】
次に、図3の処理S2に進み、構文解析部22において、形態素解析部21により分割された単語について文法規則ファイル32で定義された法則に基づき構文上の位置づけ等を解析する。図4の例では、例えば、助詞と思われる「は」は、名詞「我輩」の直後にあり、後方に用言である「ある」があることから、「は」係助詞と考えられ、「我輩は」がこの例文の主語格と判断される。また、助詞と思われる「で」は、名詞「猫」の直後にあり、動詞「ある」に隣接していることから、「で」は格助詞と考えられ、「猫で」がこの例文の補語格と判断される。「ある」は用言であり、文末にあることから、主語格「我輩は」に対する述語と判断される。
【0028】
次に、図3の処理S3に進み、構文解析部22において、文章の主要構成部分の主要語の抽出を行う。図4の例では、主語格の「我輩は」から助詞の「は」を除いた「我輩」を主語格の主要語として抽出する。また、補語格の「猫で」から助詞「で」を除いた「猫」を補語格の主要語として抽出する。また、述語の主要語としては、「ある」に助詞「で」を付け、「である」を抽出する。
【0029】
次に、図3の処理S4に進み、上位概念用語変換部23において、上位概念辞書31から処理S3で抽出した主要語の上位概念用語を抽出する。図4の例では、「我輩」の上位概念用語として「一人称代名詞」、「猫」の上位概念用語として「哺乳動物、四足小型獣」、「である」の上位概念用語として「等号状態」を抽出する。
【0030】
次に、図3の判断S5に進み、画像変換部24において、それぞれの主要語に対する画像が基本画像ファイル33に有るか無いかを判断し、無ければ判断S6に進むが、有れば、処理S7に進み、それぞれの主要語の画像を基本画像ファイル33から抽出し処理S9に進む。また、判断S6では、それぞれの主要語に対応する上位概念用語に対する画像が基本画像ファイル33に有るか無いかを判断し、無ければ処理S9に進むが、有れば処理S8に進み、それぞれの上位概念用語の画像を基本画像ファイル33から抽出し処理S9に進む。図4の例では、図示のような画像がそれぞれ「我輩」または「一人称代名詞」、あるいは、「猫」または「哺乳動物、四足小型獣」、あるいは、「である」または「等号状態」を表現する画像として抽出される。
【0031】
次に、図3の処理S9で、画像変更部25において、先の形態素解析部21や構文解析部22での解析結果と、画像変更ルールファイル34の定義に基づいて出力する画像の配置等を決める。図4の例では、構文解析の結果、構文が「主語格」、「補語格」、「述語」の順で構成されていると判断されたため、図示のように、画像を「主語格」、「述語」、「補語格」の順番に並べかえる。
【0032】
ここで、画像変換する文章が「我輩は大きい猫である。」と、補語格の主要語である「猫」に「大きい」という修飾語がついていれば、「猫」または「哺乳動物、四足小型獣」を表現する画像を大きくして表示してもよい。
【0033】
最後に、図3の処理S10に進み、画像出力部26において、最終的に変更された画像の状態で、図1のデータ出力端末5に画像データを出力する。
【0034】
以上が、画像変換対象の文章を入力した後、機械が判断した解析結果に基づき、文章に対する画像を出力するまでの具体的な手順である。
【0035】
上記の実施の形態では、上位概念辞書31や基本画像ファイル33は、外部メモリのHDに格納して使用するように説明したが、アクセス時間に問題が無ければ、インターネット上のWebサーバーに格納して使用するようにして、これを利用する者がファイルの内容を随時更新できるように構成してもよい。
【0036】
上記の実施の形態は、汎用のパーソナルコンピュータで動かすコンピュータプログラムとして、実施の形態を説明したが、コンピュータであれば、汎用パーソナルコンピュータに限らず、CPUとプログラムを搭載した専用機として文章画像変換ツールを構成してもよい。
【0037】
【発明の効果】
以上説明したように、本発明によれば、文章を機械がどのように解釈したかを画像として表現されるため、例えば、機械翻訳装置において、機械が意図したとおりに文章を解釈したか、構文木表示よりも容易に判断できるようになる。例えば、特開平7−73185の例文のようなTime flies like an arrow.をある言語に翻訳する時に、入力された文章に対する画像に対する画像変換表示に「ハエ」またはその上位概念用語の「双し目の小型の昆虫」に対応する画像が表示されていれば、誤って翻訳されることが容易に判断できるようになり、「飛ぶ」を表現する画像が表示されれば、正しく翻訳されるものと判断できるようになる。
【図面の簡単な説明】
【図1】ブロック図
【図2】文章画像変換ツールの構成図
【図3】文章画像変換ツールのフローチャート
【図4】文章画像変換のステップ
【符号の説明】
1 CPU
2 内部メモリ
3 入出力インターフェース
4 データ通信端末
5 データ出力端末
6 データ入力端末
7 外部メモリドライブ端末
8 OS
9 文章画像変換ツール
10 データファイル
11 バスライン
12 HD
20 実行ファイル
21 形態素解析部
22 構文解析部
23 上位概念用語変換部
24 画像変換部
25 画像変更部
26 画像出力部
30 形態素解析用辞書
31 上位概念辞書
32 文法規則ファイル
33 基本画像ファイル
34 画像変更規則ファイル
図中、同一符号は同一または相当部分を示す。

Claims (2)

  1. データ入出力部を有する文章画像変換ツールであって、前記データ入出力部に入力された文章を形態素解析と構文解析とをして、前記文章の中から複数の主要語の抽出をする主要語特定手段と、前記主要語特定手段により抽出された前記複数の主要語に対する上位概念用語を検索する上位概念用語検索手段と、前記複数の主要語を表現する画像または前記上位概念用語検索手段により検索された前記複数の主要語に対する該上位概念用語を表現する画像を検索する画像検索手段と、前記形態素解析と前記構文解析との解析結果に基づき前記画像検索手段により検索された該画像の配置または表示方法を変更する画像変更手段と、前記画像変更手段により配置または表示方法を変更された該画像を前記データ入出力部に出力する機能とを備えたことを特徴とする文章画像変換ツール。
  2. コンピュータにインストールすることにより、該コンピュータに請求項1に記載の文章画像変換ツールと同等の機能を持たせるコンピュータプログラム。
JP2002262181A 2002-09-09 2002-09-09 文章画像変換ツール Pending JP2004102554A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002262181A JP2004102554A (ja) 2002-09-09 2002-09-09 文章画像変換ツール

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002262181A JP2004102554A (ja) 2002-09-09 2002-09-09 文章画像変換ツール

Publications (1)

Publication Number Publication Date
JP2004102554A true JP2004102554A (ja) 2004-04-02

Family

ID=32262298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002262181A Pending JP2004102554A (ja) 2002-09-09 2002-09-09 文章画像変換ツール

Country Status (1)

Country Link
JP (1) JP2004102554A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100912502B1 (ko) 2007-07-27 2009-08-17 한국전자통신연구원 Pdf 파일을 대상으로 하는 자동 번역 방법
JP2017219992A (ja) * 2016-06-07 2017-12-14 株式会社エヌ・ティ・ティ・アド 翻訳装置及び翻訳システム
KR20200109749A (ko) * 2019-03-14 2020-09-23 주식회사 이볼케이노 컨셉 이미지를 통한 언어 습득 효율 향상 시스템 및 방법
KR20200134121A (ko) * 2019-05-21 2020-12-01 주식회사 이볼케이노 이미지를 이용한 영어기출문제 학습 시스템
KR20210120302A (ko) * 2020-03-26 2021-10-07 주식회사 이볼케이노 영어 문장 학습을 위한 이미지 구조화 시스템

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100912502B1 (ko) 2007-07-27 2009-08-17 한국전자통신연구원 Pdf 파일을 대상으로 하는 자동 번역 방법
US8108202B2 (en) 2007-07-27 2012-01-31 Electronics And Telecommunications Research Institute Machine translation method for PDF file
JP2017219992A (ja) * 2016-06-07 2017-12-14 株式会社エヌ・ティ・ティ・アド 翻訳装置及び翻訳システム
KR20200109749A (ko) * 2019-03-14 2020-09-23 주식회사 이볼케이노 컨셉 이미지를 통한 언어 습득 효율 향상 시스템 및 방법
KR102307779B1 (ko) * 2019-03-14 2021-10-01 주식회사 이볼케이노 컨셉 이미지를 통한 언어 습득 효율 향상 시스템 및 방법
KR20200134121A (ko) * 2019-05-21 2020-12-01 주식회사 이볼케이노 이미지를 이용한 영어기출문제 학습 시스템
KR102444093B1 (ko) * 2019-05-21 2022-09-16 주식회사 이볼케이노 이미지를 이용한 영어기출문제 학습 시스템
KR20210120302A (ko) * 2020-03-26 2021-10-07 주식회사 이볼케이노 영어 문장 학습을 위한 이미지 구조화 시스템
KR102377787B1 (ko) 2020-03-26 2022-03-23 주식회사 이볼케이노 영어 문장 학습을 위한 이미지 구조화 시스템
KR20220038650A (ko) * 2020-03-26 2022-03-29 주식회사 이볼케이노 영어 문장 학습을 위한 이미지 구조화 시스템
KR102403077B1 (ko) 2020-03-26 2022-05-30 주식회사 이볼케이노 영어 문장 학습을 위한 이미지 구조화 시스템

Similar Documents

Publication Publication Date Title
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
US8583422B2 (en) System and method for automatic semantic labeling of natural language texts
US7844598B2 (en) Question answering system, data search method, and computer program
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
JP4940325B2 (ja) 文書校正支援装置、方法およびプログラム
US20100121630A1 (en) Language processing systems and methods
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
JP2006252382A (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2022055305A (ja) テキスト要約を生成するテキスト処理方法、装置、デバイス及び記憶媒体
JP2004102554A (ja) 文章画像変換ツール
JP5228451B2 (ja) 文書検索装置
Ustalov A text-to-picture system for russian language
US7983899B2 (en) Apparatus for and method of analyzing chinese
JP4435144B2 (ja) データ検索システム及びプログラム
JP4054035B2 (ja) データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体
JP6114090B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
Gasser A dependency grammar for Amharic
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2007133905A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Ouersighni Robust rule-based approach in Arabic processing
JP2004133896A (ja) 特許明細書デバッグツールおよび特許明細書デバッグツールプログラム
JP4812811B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP2005092616A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4149555B2 (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09146958A (ja) 語彙対応辞書作成装置および語彙対応辞書作成方法