JP2002123744A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2002123744A5 JP2002123744A5 JP2000315357A JP2000315357A JP2002123744A5 JP 2002123744 A5 JP2002123744 A5 JP 2002123744A5 JP 2000315357 A JP2000315357 A JP 2000315357A JP 2000315357 A JP2000315357 A JP 2000315357A JP 2002123744 A5 JP2002123744 A5 JP 2002123744A5
- Authority
- JP
- Japan
- Prior art keywords
- translation
- multilingual
- language
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Description
【書類名】 明細書
【発明の名称】 通信ネットワークによる多言語情報提供システム
【特許請求の範囲】
【請求項1】
通信ネットワーク(1)を介して、情報コンテンツを多言語に翻訳して提供する多言語情報提供システムであって、
多言語翻訳ウェブサイト装置(2)とこれに接続された多言語処理用のデータベースと(17)を備え、
前記多言語翻訳ウェブサイト装置(2)は、
前記情報コンテンツをHTMLデータに変換し、当該情報コンテンツのページ毎にページレコードとテキストレコードを付してマスターコンテンツとして前記データベース(17)内に格納する手段と、
前記データベース(17)内に格納された前記情報コンテンツの中から非言語データを除いたテキスト部分を抽出する抽出手段と、
当該情報コンテンツの記載内容における複数のテキスト部分を当該情報コンテンツの前記ページレコードと前記テキストレコードを付して外部の複数の翻訳者装置に対して翻訳依頼を送信する手段と、
前記複数の翻訳者装置から前記情報コンテンツのテキスト部分の多言語による翻訳結果を受信し、各テキスト部分の翻訳結果に付された前記ページレコードと前記テキストレコードに基づいて、前記情報コンテンツの前記多言語による翻訳結果を当該情報コンテンツの非言語データとアセンブリして、これを前記データデース(17)内に多言語コンテンツとして格納する手段と、を有し、
前記データベース(17)に格納された前記多言語コンテンツを予め設定した文字数範囲内で前記通信ネットワーク(1)を介して提供することを特徴とする多言語情報提供システム。
【請求項2】
前記多言語コンテンツは広告情報と共に提供することを特徴とする請求項1に記載の多言語情報提供システム。
【請求項3】
前記抽出手段は、前記原稿の記載内容における前記非言語データと前記テキスト部分の抽出を、所定のテンプレートを使用して言語を含むイメージデータと、言語を含まないイメージデータと、テキストデータと、に分類して行うことを特徴とする請求項1に記載の多言語情報提供システム。
【請求項4】
前記抽出手段は、前記多言語翻訳ウェブサイト装置における画面表示の文字が、前記他言語の言語毎に判読可能な最小フォントの比率を予め定めるとともに、この比率によって前記テキストデータの最大文字数を言語毎に設定する記号番号と関連付けることを特徴とする請求項3に記載の多言語情報提供システム。
【請求項5】
前記通信ネットワーク(1)には、さらに、前記多言語翻訳ウェブサイト装置(2)と、前記翻訳依頼者装置又は前記翻訳者装置間で前記翻訳の料金を決済するためのネットバンク装置(5)が接続されることを特徴とする請求項2に記載の多言語情報提供システム。
【請求項6】
前記多言語コンテンツへのアクセス数に基づいて、当該広告情報の広告料金を前記ネットバンク装置(5)を介して広告主に対して請求することを特徴とする請求項5に記載の多言語情報提供システム。
【請求項7】
前記通信ネットワーク(1)は、TCP/IP環境下の公衆有線通信網又は公衆無線通信網若しくは非公衆有線通信網又は非公衆無線通信網であることを特徴とする請求項1乃至5の何れかの項に記載の多言語情報提供システム。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、通信ネットワークを利用し、一つの言語の情報コンテンツを多言語に翻訳して提供する多言語情報提供システムに関する。
【0002】
【従来の技術】
従来から、情報を多言語に翻訳してこれを提供するようにした翻訳サービスとして、TCP/IP(Transmission Control Protocol/Internet Protocol)の環境下の通信ネットワーク(例えば、インターネット)を利用した例が知られている。
【0003】
図10は、従来の多言語翻訳を実施するウェブ(WEB:World Wide WEB)サイトのアーキテクチャを説明するためのブロック図であり、図11は図10のウェブサイトによる多言語翻訳の作成処理手順を示すフローチャートである。また、図12は図10のウェブサイトによる多言語翻訳メンテナンスの処理手順を示すフローチャートである。
【0004】
この例では、図10に示すように、TCP/IP回線網に接続した、多言語における日本語、英語、ドイツ語、フランス語…ごとのウェブサイトが構築されている。それぞれのウェブサイトでは、各言語(日本語からフランス語…)の処理をウェブサーバが実行している。なお、ウェブサイトは、ハードウェアにソフトウェアを実装した処理システム、すなわち、個々のファームウェアである。
【0005】
このアーキテクチャは、ISDNなどのデジタル回線網に、ウェブサイトとなるUNIXワークステーションなどを接続し、また、翻訳者が使用する小型汎用コンピュータが接続され、さらに、翻訳依頼者が使用する小型汎用コンピュータやUNIXワークステーションなどを接続した構成である。この通信ネットワーク構成では、いわゆる、インターネット通信による双方向通信をウェブブラウザ(アプリケーション)で実行している。
【0006】
このような多言語翻訳サービスでは、図11の多言語翻訳の作成処理において、マスタサイトをTCP/IP回線網からダウンロードしてコピーし(ステップS1) 、言語部分のHTML(HyperText Markup Language)のデータを抜き出して言語データに変換する(ステップS2) 。次に、言語データを目的の言語に翻訳する(ステップS3)。この後で、翻訳した言語をHTMLデータに変換する(ステップS4)。さらに、コピーサイトに言語HTMLデータを移植し、調整する(ステップS5)。これまでの処理を必要な言語だけ繰り返している。
【0007】
また、図12のメンテナンスの処理において、ウェブ管理者にマスタサイトの変更を通知して(ステップS11)、翻訳が必要な言語部分を選択する(ステップS12)。言語部分のHTMLデータを抜き出して言語データに変換する(ステップS13)。次に、言語データを翻訳し(ステップS14)、この翻訳言語データをHTMLデータに変換する(ステップS15)。次に、ウェブサイトに言語HTMLデータを移植し、調整する(ステップS16)。言語部分のHTMLデータを抜き出して言語データに変換する処理から必要な言語だけ繰り返す。このようにして、インターネットを利用した多言語翻訳サービスが提供される。
また翻訳は自国語だけが多く同一コンテンツを複数言語に翻訳されて提供されるものは少ない。
【0008】
【発明が解決しようとする課題】
このような上記従来例では、インターネットによる多言語における言語ごとのウェブサイトを構築して、各言語の処理をウェブサーバが実行している。したがって、処理規模及び装置規模が増大化するという欠点がある。
【0009】
本発明は、このような従来の技術における課題を解決するものであり、通信ネットワークにおける単一のウェブサイトで多言語における翻訳を実施できるようになり、その処理規模及び装置規模の増大化を抑えることが出来る通信ネットワークによる多言語翻訳の実施方法及びその通信システム並びに情報記録媒体の提供を目的とする。
【0010】
上記の翻訳は、翻訳者を常時確保するために翻訳ネットワークを組織して翻訳を行う。情報及び広告を含むマスターコンテンツが多くの言語に翻訳されてデータベースに格納され、端末側が希望する言語で呼び出して見ることができる多言語コンテンツを提供する。広告を掲載した広告主より広告掲載料を徴収出来る方法を提供することを目的とする。さらに、より専門部門に特化した情報を予め登録した対象者に多言語で提供出来るようにすることを目的とする。
【0011】
【課題を解決するための手段】
上記課題を達成するために、本願は、通信ネットワークを介して、情報コンテンツを多言語に翻訳して提供する多言語情報提供システムであって、多言語翻訳ウェブサイト装置とこれに接続された多言語処理用のデータベースとを備え、前記多言語翻訳ウェブサイト装置は、前記情報コンテンツをHTMLデータに変換し、当該情報コンテンツのページ毎にページレコードとテキストレコードを付してマスターコンテンツとして前記データベース内に格納する手段と、前記データベース内に格納された前記情報コンテンツの中から非言語データを除いたテキスト部分を抽出する抽出手段と、当該情報コンテンツの記載内容における複数のテキスト部分を当該情報コンテンツの前記ページレコードと前記テキストレコードを付して外部の複数の翻訳者装置に対して翻訳依頼を送信する手段と、前記複数の翻訳者装置から前記情報コンテンツのテキスト部分の多言語による翻訳結果を受信し、各テキスト部分の翻訳結果に付された前記ページレコードと前記テキストレコードに基づいて、前記情報コンテンツの前記多言語による翻訳結果を当該情報コンテンツの非言語データとアセンブリして、これを前記データデース内に多言語コンテンツとして格納する手段と、を有し、前記データベースに格納された前記多言語コンテンツを予め設定した文字数範囲内で前記通信ネットワークを介して提供するものである。
【0012】
そして、前記多言語コンテンツは、広告情報と共に提供することを特徴としている。
【0013】
また、前記抽出手段は、前記原稿の記載内容における前記非言語データと前記テキスト部分の抽出を、所定のテンプレートを使用して言語を含むイメージデータと、言語を含まないイメージデータと、テキストデータと、に分類して行うのである。
【0014】
さらに、前記抽出手段は、前記多言語翻訳ウェブサイト装置における画面表示の文字が、前記他言語の言語毎に判読可能な最小フォントの比率を予め定めるとともに、この比率によって前記テキストデータの最大文字数を言語毎に設定する記号番号と関連付けるようにしている。
【0015】
また、前記通信ネットワークには、前記多言語翻訳ウェブサイト装置と、前記翻訳依頼者装置又は前記翻訳者装置間で前記翻訳の料金を決済するためのネットバンク装置が接続されることを特徴とする。
【0016】
そして、前記多言語コンテンツへのアクセス数に基づいて、当該広告情報の広告料金を前記ネットバンク装置を介して広告主に対して請求するのである。
【0017】
【0018】
【0019】
【0020】
【0021】
【発明の実施の形態】
次に、本発明に係る多言語情報提供システムの実施形態を、図面を参照しつつ詳細に説明する。
図1は、本実施形態における構成を示すブロック図である。
【0022】
図1において、この例はTCP/IP環境下におけるインターネットの構成例を示している。この例は、ISDN(Integrated Services Digital Network)等のデジタル信号通信網1に、インターネットによる多言語翻訳サービスを提供するための多言語翻訳ウェブサイト装置(プラットフォーム/ウェブサイト)2、及び多言語における翻訳を実行するための複数の翻訳者装置3、広告依頼主装置6、閲覧登録者装置7、端末装置8が接続されている。さらに、デジタル有線通信網1に、インターネットによる翻訳を多言語翻訳ウェブサイト装置2側に依頼するための複数の翻訳依頼者装置4、及び翻訳料金、広告料金、閲覧登録料金のネット決済(電子商取引)を行うデータベースサーバ装置5に接続されている。
【0023】
ネット決済の翻訳料金は、翻訳依頼者装置4側が多言語翻訳ウェブサイト装置2側に依頼した翻訳料金、及び、多言語翻訳ウェブサイト装置2側が翻訳者装置3に依頼した翻訳料金である。広告掲載料金は広告依頼主装置側6が多言語ウェブサイト装置2側に依頼した広告掲載料金である。閲覧登録料金は閲覧登録者側7が多言語ウェブサイト装置2側に依頼した閲覧登録料金である。
【0024】
デジタル有線通信網1は、その構成及び伝送方式がISDNとして良く知られており、デジタル交換機(PBX)を回線網に設置した網構成である。
【0025】
図1中の多言語翻訳ウェブサイト装置2は、この例ではUNIXワークステーションを用いており、また、翻訳者装置3、閲覧登録者装置7は、ここでは、個人翻訳者が使用する小型汎用コンピュータを用いている。なお、翻訳会社などでは、例えば、UNIXワークステーションシステムが用いられる。
【0026】
また、図1中のデータベースサーバ装置5は、この例では、UNIXワークステーションを用いており、さらに、翻訳依頼者装置4、広告依頼主装置6は、ここでは個人使用の小型汎用コンピュータを用いている。なお、翻訳依頼者、広告依頼主が会社などの場合、例えば、UNIXワークステーションシステムが用いられる。
【0027】
翻訳者装置3及び翻訳依頼者装置4、閲覧登録者装置7の小型汎用コンピュータのハードウェアは、周知の構成である。すなわち、回線接続装置(デジタル終端装置DSU、ターミナルアダプタTA等)に接続されるインターフェース(I/F)回路とともに、CPU,ROM、ワーキングRAMなどからなるマイクロプロセッサ(MPU)が設けられている。また、この小型汎用コンピュータには、情報記憶媒体(フロッピーディスク(FD)、CD−ROM、着脱メモリMS)を通じて以降で詳細に説明する「本発明の多言語翻訳及び多言語情報サービスを実施」するための通信プロトコルやプログラムを実装(インストール)したり、処理データの読み出し・書き込みを行う読取・書込装置が設けられている。
【0028】
さらに、この小型汎用コンピュータには、カラー液晶ディスプレイ(LCD)などのモニタ装置、及びキーボード、座標入力装置(マウス、入力パット等)からなる入力操作装置が設けられ、さらに、各部のデータ入出力処理を行う入出力(I/O)回路が設けられている。また、この小型汎用コンピュータには、処理データを記憶するメモリ、及び特に「本発明の多言語翻訳及び多言語情報サービスを実施」するためのファイル処理を実行するハードディスク装置を用いた多言語処理用データベースが設けられ、また、プリンタなどとのドライブ接続を行うI/F回路が設けられている。
【0029】
図1中の多言語ウェブサイト装置2及びデータベースサーバ装置5のUNIXワークステーションシステムのハードウェアは周知の構成である。このUNIXワークステーションシステムには、例えば、DSU、ルータなどを備えた回線接続装置と、基幹的な通信処理を実行するための主コンピュータであるウェブサーバとともに、データベースが設けられている。また、このUNIXサーバシステムには、図形、文字などの配信データをアプリケーションに対応して(例えば、iモード携帯電話機)編集し直すための編集サーバなども設けられるのが一般的である。
【0030】
また、このようなUNIXワークステーションシステムには、ウェブサーバにファイアウォールアプリケーションを実装したり、電子メール/画像(FAX)サーバや、小型汎用コンピュータを接続するためのインターフェース回路が設けられている。さらに、このようなUNIXワークステーションシステムには、この装置でのシーケンスを実行するLANサーバとともに、FTP(File Transfer Protocol)ファイル転送用のFTPサーバ、インターネット上の接続などを処理するインターワーキングファンクション(IWF)サーバ、及び侵入防止のためのファイアウォールアプリケーション実行専用のウェブサーバ等が設けられる構成が周知である。
【0031】
これらの構成に加えて、UNIXワークステーションシステムには、以降の図2をもって説明するように、情報記憶媒体を通じて「本発明の多言語翻訳及び多言語情報サービスを実施」するための通信プロトコルやプログラムを実装したり、処理データの読み出し・書き込みを行うための読取・書込装置が設けられ、また、「本発明の多言語翻訳及び多言語情報サービスを実施」するための各種のファイル処理(リレーショナル方式や網方式によるデータ格納・検索/多言語処理用データベースエンジン)を実行する多言語処理用データベースやコンテンツ・言語データベースを備えている。
【0032】
また、この構成に加えて、データベースサーバ装置5には、分散名前管理システム(DNS:Domain Name System)用のDNSサーバとともに、各種の機密保持のために暗号化伝送に使用される暗号化通信プロトコル(SSL:
Secure Sockets Layer)を実行するSSLサーバが設けられるのが一般的である。なお、このようなTCP/IP環境下のウェブサーバは、コンピュータ装置を用い、かつ、通信プロトコルやプログラムの実装によって、多機能装置として実現されるものである。また、ウェブサーバは、小型汎用コンピュータと同様の構成であるが、前記した「本発明の多言語翻訳及び多言語情報サービスの実施」に対応して、そのアーキテクチャを変更すれば良い。
【0033】
この場合、通信プロトコルの処理ではトラフィック量を勘案し、また、データ処理では、その処理データ量を考慮した構成とすれば良い。例えば、二重化CPU構成、複数の多言語処理用データベースの配置、大容量のメモリの使用などを考慮した構成とする。
【0034】
図2は、本発明を実施するためのウェブサーバの要部構成の一例を示すブロック図である。この例は、UNIXワークステーションシステムのバスに接続されて、図示しない他の装置とインターフェース処理を行うI/F回路10が設けられている。また、この例には、I/F回路10及びバスに接続されるマイクロプロセッサ(MPU)11が設けられている。マイクロプロセッサ11は、ワーキング用RAM、ブート・制御プログラムを格納したRAM、入出力(I/O)回路、CPU等からなる。マイクロプロセッサ11には、小型汎用コンピュータと接続するためのI/F回路12とともに読取・書込装置13が設けられている。
【0035】
読取・書込装置13は、情報記憶媒体(フロッピーディスク(FD)、CD−ROM、着脱メモリMS)を通じて「本発明の多言語翻訳及び多言語情報サービスを実施」するための通信プロトコルやプログラムを実装(インストール)したり、処理データの読み出し・書き込みを行うものである。
【0036】
また、マイクロプロセッサ11には、多言語における言語ごとの表示サイズを変換・生成するためのビデオ(V)−RAM14及び文字フォント変換回路15が設けられている。この文字フォント変換回路15は、言語文字ごとに最小フォントの比率に変換する変換テーブルを備えたRAMなどで構成される。この言語ごとの表示サイズを変換・生成については以降(図12を参照)で説明する。
【0037】
このV−RAM14の出力は、マルチドロップ方式のバスに接続されたモニタ装置16に転送される。また、マイクロプロセッサ11は、バスに接続された多言語処理用データベース装置17との間で「本発明の多言語翻訳を実施」するためのデータ処理を実行する。なお、多言語処理用データベース装置17、コンテンツ・言語データベース18は、分散して遠隔地などに配置することも可能である。
【0038】
次に、この実施形態の処理及びその動作について説明する。先ず、図1の各装置の通信動作に関するアプリケーション(通信プロトコル、プログラム)について説明する。
【0039】
図1に示す各装置は、インターネット通信として周知のTCP/IPによる通信接続処理、HTML(HyperText Markup Language)又はXML(eXtensible Makeup Language)等の言語による言語処理機能(文章、音声、データ圧縮によるJPEG静止画又はMPEG動画処理),及びハイパーリンク機能による転送、HTTP(Hypertext
Transport Protocol)による双方向通信、FTPによるファイル転送、及びCGI(Common Gateway Interface)による外部アプリケーションをそれぞれに実行する。このための電子メール通信やインターネットサーフィンを行うウェブブラウザ(アプリケーション)を各装置が搭載している。
【0040】
図1において、各装置は、TCP/IPリンクによって、周知のIPパケットによるファイル転送を双方向通信で行っている。このようなインターネット上での転送処理は、HTTPにおけるオブジェクト指示(マウスなどの座標入力装置によるラジオボタン、アンカー、プッシュボタン等へのオブジェクト指示(俗称、クリック)によって実行する。この場合、ファイルフォーマットにTCPコネクションの開放の終了記述文字(FIN)や肯定応答文字(ACK)などを格納し、その識別によってファイル転送を実行するが、この表記は以下の説明において省略する。
【0041】
次に、図1に示すデジタル有線通信回線網1の伝送形態について説明する。図1に示すデジタル有線通信回線網1では、例えば、伝送速度64,384kbit/秒,1.5Mbit/秒によるIPパケットを伝送している。伝送速度64kbitでは、2B+D(情報チャネル32kbps×2、制御チャネル16kbps)伝送を、例えば、ITU−T勧告によるパケット交換手順X.31(I.430/I.431,Q.921/Q.931,X.25プロトコル)で実行する。なお、他の高速伝送方式(例えば、非対象型デジタル伝送)を適用しても良く、また、高速通信方式(例えば、ギガビット高速データ通信方式)を適用しても良い。また、図1に示す翻訳者装置3及び翻訳依頼者装置4の小型汎用コンピュータは、良く知られた動作を実行しているので、その説明は省略する。
【0042】
さらに、図1中の多言語ウェブサイト装置2のUNIXサーバシステムは、ウェブサーバやLANサーバがなどを通じて、「本発明の多言語翻訳及び多言語情報サービスを実施」をするためのシーケンスを実行する。例えば、イーサネットLANなどと同様のCSMA/CDランダムアクセス方式、RPC(Remote Procedure Call)遠隔呼び出しの各シーケンスを実行して、その電子メール通信やインターネットサーフィンを実行する。
【0043】
この小型汎用コンピュータ、UNIXワークステーションシステムでは、CPU(ウェブサーバのCPUも含む)が実行する通信プロトコルやプログラムによって、「本発明の多言語翻訳及び多言語情報サービスの実施」を実行する。この通信プロトコルやプログラムは、前記した汎用の通信プロトコルやプログラムとともに、「本発明の多言語翻訳及び多言語情報サービスを実施」するための専用の通信プロトコルやプログラムを各装置に組み合わせて実装する。
【0044】
これらの「本発明の多言語翻訳及び多言語情報サービスの実施」は、そのプログラムが情報記録媒体(例えば、FD,CD−ROMや着脱メモリ)に格納して提供される。換言すれば、流通性のある汎用パッケージとして提供される。
【0045】
次に、各装置の動作に基づいた本システムの概略のシーケンス図である。
【0046】
図3を参照すると、多言語翻訳ウェブサイト装置2が、デジタル有線通信網1を通じて翻訳依頼者装置4からの翻訳依頼を電子メールや多言語翻訳ウェブサイト装置2が公開するウェブサイト(ホームページ/HTTP)を通じて取り込む。この受け取りの言語は、多種の言語の一つである(例えば、日本語)。
【0047】
このため、多言語翻訳ウェブサイト装置2に装備する汎用のウェブブラウザでは、判読できない場合がある。このため、多言語を解読するアプリケーションのウェブブラウザを実装する。例えば、予め転送されてくる可能性のある言語とのトラッキングによって判別するためのアプリケーションを実装する。このトラッキングは、転送されてきた一部の文字列を予め格納している多言語の文字列と比較するものである。また、「cookie」のように、過去のホームページへの訪問者であることを識別して、その言語を判定する。なお、搭載ウェブブラウザが返送するナビゲーション言語、ナビゲーションブラウザ言語を識別するようにしても良い。
【0048】
次に、多言語翻訳ウェブサイト装置2から、翻訳依頼で指示された言語間の翻訳が可能な翻訳者装置3側へ、翻訳の納期や特記事項を添えて、依頼翻訳原稿(情報コンテンツの原文)を転送する。これは、多言語における翻訳を行う翻訳者をインターネットで組織化した「多言語対応翻訳ネットワーク」を通じて行う。
【0049】
次に、翻訳者装置3側は、指示された言語間の翻訳を実施する。この場合、翻訳者装置3の小型汎用コンピュータに翻訳ソフトウェアを実装して、その機械自動翻訳を行ったり、又は、いわゆる、ワードプロセッサソフトウェアによる手動入力操作翻訳を行い、その電子データによる翻訳文を作成して請求書などとともに多言語翻訳ウェブサイト装置2に転送する。
【0050】
なお、機械自動翻訳は、翻訳者装置3で実施する場合、多言語翻訳ウェブサイト装置2の翻訳アプリケーションをCGIで実行したり、翻訳者装置3に翻訳アプリケーションを実装して、スタンドアローンで実行する。また、多言語翻訳ウェブサイト装置2側で機械自動翻訳を実施した後に、翻訳者装置3に転送し、再度点検を含む翻訳を行うようにしても良い。
【0051】
多言語翻訳ウェブサイト装置2は、転送されてきた翻訳文電子データを多言語処理用データベース(図2中の多言語処理用データベース装置17)に格納する。その後、この翻訳者(翻訳者装置3)にデータベースサーバ装置5と多言語翻訳ウェブサイト装置2との間で、デビットカードなどを用いた電子取引決済(振込処理)を実行して、翻訳料金を支払う。
【0052】
この後に、多言語翻訳ウェブサイト装置2が、翻訳依頼者装置4側に電子メールやウェブサイト(ホームページ)とのHTTPリンクを通じて、完了した翻訳文を請求書とともに通知する。この通知の後に、翻訳依頼者装置4側から、多言語翻訳ウェブサイト装置2へ通知時に指定された識別符号ID、パスワードを入力して、その翻訳完了の電子データを受け取って多言語処理用データベースに格納する。
【0053】
このようにして、一つの装置及び一つの翻訳処理体系からなる一つのウェブサイト(単一ウェブサイト)で多言語における翻訳が実施できるようになり、その処理規模及び装置規模の増大化を抑えることが出来る。
【0054】
図4は、多言語翻訳の作成処理手順を示すフローチャートであり、図4において、テンプレートを使用してマスターコンテンツを作成する(ステップS21)。次に、マスターコンテンツの言語データを翻訳する(ステップS22)。このステップS21,S22の処理は、必要な言語だけルーチンが繰り返される。次に、翻訳した言語データを制御情報とともに多言語処理用データベースに格納する(ステップS23)。さらに、要求時に言語データをHTMLデータに変換してマスターコンテンツに書き込む(ステップS24)。
【0055】
次に、多言語処理用データベースについて説明する。
図5は多言語処理用データベース(図2中の多言語処理用データベース装置17)の処理を説明するためのブロック図である。
【0056】
図5において、多言語処理用データベースでは、ここでのデータ処理をアクセスを管理プログラムを実行して行う。このデータ処理をアクセスを管理プログラムによって、多言語処理用データベースへのデータ参照・追加、更新・削除などの依頼・結果取得を実行する。
【0057】
また、データベースアクセス管理プログラムの実行によって、データベース管理データをやり取りする。このデータベース管理データは、コンテンツ・言語などに対応する実際の多言語処理用データベース位置・実際の多言語処理用データベース名である。また、データベースアクセス管理プログラムの実行によって、コンテンツ・言語データベースに対するデータをやり取りする。このコンテンツ・言語データベースは、複数のデータベースサーバからなる。
【0058】
このように多言語処理用データベースは、複数台のサーバを設けて、その分散配置が可能である。言語ID・ページIDなどへの要求に対してデータベース管理データから実際のサーバ名・サーバ位置・多言語処理用データベース名などを取得し、データベースサーバ中の目的とする多言語処理用データベースにアクセスする。
【0059】
図6はテンプレートを使用してマスターコンテンツの作成を説明するための図である。図6において、このテンプレートには、イメージデータ(言語データあり)、イメージデータ(言語データなし)、テキストデータの自動選択用がある。なお、これらのイメージデータ(言語データあり)、イメージデータ(言語データなし)、テキストデータデータは、それぞれにデータ量が異なる複数がある。このようなテンプレートによって言語データを自動選択する。
【0060】
さらに、図6を参照して、イメージ中の言語データの翻訳、表示可能(ホームページにおいて)な最小フォントの比率、及び翻訳後の文字数の変化について説明する。
(a)イメージ中の言語データも翻訳する場合
このイメージ中の言語データは、「alt」と同一に扱う(テキスト形式からバイナリ形式に変換)。このイメージ中の言語データの修正処理は人的作業である。置換などの処理はテキストレコードデータと同様に処理する。
(b)言語によって実質的に表示可能(ホームページにおいて)な最小フォントの比率
この最小フォントの比率は、テーブル(文字フォント変換回路15)で予め定めておく。
【0061】
日本語「1」に対する英語「0.8」、ドイツ語「0.8」…中国語「1.1」のそれぞれの比率が設定されている。これは、文字の複雑差に対応するものである。この比率によってテキストデータレコードの最大文字数を言語IDと関連付ける。
(c)翻訳前の元の言語と翻訳後の文字数の変化
言語によって変化する割合を、例えば、翻訳経験上から割り出している。この割合をテーブルに格納して、その翻訳後の言語での文字数を得る。日本語「1」に対する英語「1.3」、ドイツ語「1.3」…中国語「0.8」のそれぞれの割合が設定されている。これは、言語ごとの文字表記による文章量の差に対応するものである。
【0062】
なお、マスターコンテンツでは、予想される最大文字数に合わせて格納領域を確保(設定)するが、次のような処理を追加して実行すると、最大文字数の処理が確実になる。
【0063】
まず、翻訳前の言語の文字数に対して翻訳後の文字数を計算して最大文字数内に納まるかを判定する。すなわち、格納領域に最大文字数が納まる場合は翻訳を実行し、また、格納領域に最大文字数が納まらない場合は、翻訳前の言語の文字数を、その意味が変わらないように減らして修正する。なお、この修正は人的作業である。
【0064】
次に、他の実施形態としての移動通信ネットワークの併設について説明する。前記した実施形態では、固定通信ネットワーク(デジタル有線通信回線網1及び固定の小型汎用コンピュータ等)のみを配置しているが、移動通信ネットワークにもそのまま適用できる。例えば、翻訳を依頼する翻訳依頼者装置4側が、移動場所(例えば、外国企業)で、各種の説明における翻訳が必要になった場合、この移動場所から翻訳依頼を行い、かつ、この外国企業への翻訳文の転送を指示するなどの場合である。
【0065】
なお、移動通信ネットワークの適用は、翻訳依頼者装置4以外の多言語翻訳ウェブサイト装置2、翻訳者装置3にもそのまま適用可能である。
【0066】
図7は、移動体通信ネットワーク要部構成のブロック図の例を示す。この例は、図1に示すデジタル有線回線網1とともに、通信プロトコル変換などを行う接続装置(ゲートウェイ装置やPHS接続装置)で接続されたPDC(Personal Digital Cellular Telecommunication System)方式、PHS(Personal
Handyphone System)方式などのデジタル移動通信回線網20とともに、セル基地局20aと無線改選で接続される無線通信手段としての携帯端末21を有している。携帯端末21にはモバイルコンピュータ22が接続されている。
【0067】
この携帯端末21は、例えば、送受信無線部、変調・復調部、時分割多重処理部、コーディック(符号化・復号化)部、CPU、周波数切替シンセサイザ、受信電界強度(RSSI)検出部、外部装置接続用インターフェース部、着信表示発光ダイオード、キーパッド、画面表示液晶ディスプレイ、及び着信表示振動発生器などを備えた慣用的な構成である。モバイルコンピュータ22も図1中の翻訳者装置3などの小型汎用コンピュータと同様の構成である。
【0068】
このデジタル移動通信回線網20と携帯端末21との間の伝送方式として、TDMA(PDC)方式、又はTDMA/TDD(PHS)方式、CDMA方式(IS-95/IMT-2000)のいずれでも良く、また、変調方式(PSK方式など)も特に限定しない。デジタル移動通信回線網20と携帯端末21は、例えば、ARIB−27/28規格(PDC方式/PHS方式)による無線区間(エアーインターフェース)によってデジタル移動通信回線網3を通じて通信を行う。この通信では、現状においてデータ転送速度が速い広帯域伝送かつPIAFS(PHS
Internet Access Forum Standard)方式によるインターネットアクセスが容易なPHS方式の適用が好ましい。
【0069】
この携帯端末21及びモバイルコンピュータ22がデジタル移動通信回線網20を通じて、前記した「本発明の多言語翻訳を実施」を実行する。
なお、この実施形態では、以下のような変形例も可能である。デジタル有線通信回線網1は、アナログ電話ネットワークPSTN(Public Switched Telephone Network)でも良く、この場合の回線接続装置には、NCU(Network
Control Unit)及び変復調装置(モデム)を用いれば良い。
【0070】
また、TCP/IPの伝送方式に代えて、デジタル有線通信回線網1を使用し、かつ、Z/YMODEMなどの通信プロトコルによるコンピュータ対コンピュータ通信を組み合わせても本発明の実施が可能である。また、図1の各装置は、インターネット上で、その伝送信頼性の向上や蓄積データの消失防止を考慮して現用系及び予備系からなる二重化による構成としても良い。
【0071】
さらに、本発明の実施は、インターネットにおける公開性(不特定多数の利用)を活用しているが、企業などのイーサネットLAN、FDDI・LANを収容したWAN(Wide Area Network)などの非公開的な閉鎖通信ネットワークにもそのまま適用できる。
【0072】
また、この実施形態では、プログラム実装をFD,CD−ROM、着脱メモリをもって説明したが、例えば、インターネットを通じてダウンロードして実装(インストール)することも可能である。
【0073】
ここまで本発明による1つのコンテンツを多言語に翻訳する方法、その装置及び通信システムについて説明した。つぎに、本発明による情報サービスについて説明する。最初に、多言語翻訳のための翻訳組織の仕組みについて説明する。
【0074】
必要コンテンツの翻訳には従来ウェブサイト運営者が翻訳を行いウェブに掲載するのが普通である。この方式であると翻訳可能な言語が限られてしまう。したがって公開するコンテンツは自社で翻訳可能な言語の範囲を出ない。インターネットでの通信の1つの特徴である、全世界がネットワークされる機能が生かされていない。多数の国の人が自国語でインターネットによるウェブ画面が閲覧出来るようにするために本発明では1つのマスターコンテンツを多数の言語に翻訳するネットワークを構築する。日本だけでなく外国の翻訳者、翻訳業者に呼びかけてフランチャイズ化し常時夫々の言語での翻訳が可能な「多言語翻訳フランチャイズ体制」を構築する。
【0075】
翻訳するコンテンツがあると、インターネット等の通信手段により翻訳すべきコンテンツを開示する。翻訳者は開示されたマスターコンテンツを取り込み自分の登録した言語で翻訳を行う。翻訳はテンプレートを使用し翻訳された文字数、形式を統一したものとすることができる。この翻訳の方式については先に説明した通りである。このため翻訳されたコンテンツは何国語であっても同一の形態をとることができる。このようにして翻訳されたコンテンツは通信ネットワークを使用してウェブサイトに送られ編集してコンテンツ・データベースに格納され、閲覧可能の状態になる。格納されたコンテンツはインターネット上の全世界中の端末から自国語でのアクセスが可能となる環境が構築されていることになる。
【0076】
本発明での情報サービスを提供するウェブアプリケーションの形態はCGI(Common Gateway Interface)経由でプログラムを起動するものである。この形態では、ユーザー端末がプラウザから引数付でURLを指定する。ウェブサーバは該当するCGIプログラムを起動して、その結果を受け取った後、HTML文書としてクライアント端末に伝送する。
【0077】
またユーザー側端末機は、インターネットで使用されているHTTP、HTMLをサポートするウェブ対応機器であれば、モバイル型の端末機(例えば携帯電話)でも通常使用されているPCでも良い。このような基本的なネットワーク構造を利用して行うシステムを次の図8に基づいて、本発明の多言語のコンテンツによる情報サービス提供の実施方法を説明する。
【0078】
図8は、1実施例の多言語情報サービスコンテンツの掲載から広告主に広告掲載料金を請求するまでの流れ図である。先ず、掲載を依頼81された広告を含むコンテンツを翻訳ネットワークを通じて多言語に翻訳82し、編集してコンテンツ・言語データベースに投入する。これをウェブサイトに公開83する。各種端末からウェブサイトに閲覧要求があり、閲覧する言語が自動的に選択される。ページが開かれるとそのページを閲覧する来訪者の回数カウント84を言語別に行う。これを繰り返し行い、定めた期間に閲覧回数に応じた広告掲載料の計算を行い、広告主に広告掲載料金の請求85する。
【0079】
次にその詳細を説明する。ネットワーク、インターネット及び装置に関しては先に説明したので省略する。また、上記に説明した多言語に翻訳された各種情報は、コンテンツ・言語データベース18に格納されている。格納されたコンテンツ・言語データベース18を使用して各種情報を要求された言語で要求した端末に提供する。インターネットによる閲覧に係る閲覧ソフトウェアは通常使用されているもので公知である。
【0080】
また、画面の各ページ上には多言語に翻訳した広告を掲載する。広告はテンプレートの形態でも良い。また、「バナ―広告」と呼ばれている看板形式としても良い。このバナ―形式は広告の所定位置をクリックすると広告主のホームページにリンクする構造と成っている。もう一つの方法としては「メールニュース広告」であり、ネット上の電子メールマガジンの文中にテキスト形式で挿入されている。テキスト文中に表記されたURLは、着色されてクリック可能な形式で表示されており、興味を持ったユーザーがそこをクリックすれば広告主のホームページにリンクするようになっている。広告の形態により夫々の方法を取ることが出来る。
【0081】
多言語情報データベースから希望する言語の選択は、多言語翻訳ウェブサイト装置2に装備する汎用のウェブブラウザで判別するが、言語によっては、判読できない場合がある。このため、多言語を解読するアプリケーションのウェブブラウザを実装する。例えば、予め転送されてくる可能性のある言語とのトラッキングによって判別するためのアプリケーションを実装する。
【0082】
このトラッキングは、転送されてきた一部の文字列を予め格納している多言語の文字列と比較するものである。また、「cookie」のように、過去のホームページへの訪問者であることを識別して、その言語を判定する。なお、搭載ウェブブラウザが返送するナビゲーション言語、ナビゲーションブラウザ言語を識別するようにしても良い。
【0083】
また別の方法として自身のアドレスからシステムに依り自動的に行われるようにしても良い。若しくは、表示されている言語ボタンを選択することで希望する言語での表示がなされるようにしてもよい。
【0084】
公開する各種情報サービス提供の実施例として、次のような情報サービスが提供できる。ゲームのサイトでは、日本のゲーム、世界各国のゲームの紹介を行う。映像・音楽のサイトでは、世界中の映像、音楽の紹介及び、投稿のサイトを設けている。観光・風土のサイトでは、現地の人でなければ知らない場所・情報の紹介や投稿を含んだオリジナルな観光情報を掲載している。スポーツのサイトでは、世界各国で行われている最新のスポーツ情報を掲載する。人材情報のサイトでは、多言語の情報で多国籍の人に対する求人情報の提供や人材情報の提供を行う。
【0085】
本発明では、このように、オリジナルのコンテンツは1個でも世界各国語に翻訳された多言語のコンテンツがデータベース化され閲覧可能なので、世界各国の来訪者が各々の自国語で同一のコンテンツを閲覧できる。
【0086】
さらに、広告についても同様に同一の広告が複数の言語で閲覧出来る。広告主は、1つの広告で多国に複数の広告を行っていると同様な効果が期待できる。このような効果を踏まえて、本発明では広告主に対しては広告掲載料を請求する手段を備えている。システムは各言語別に来訪者をカウントしており、言語別に広告の効果が計れるように設計されている。また効果測定の方法として何ページのページが見られたかを表す、ページアクセス回数のカウントを採る方法を併用しても良い。本発明ではウェブのカウンターでページごとの閲覧回数をカウントしている。
【0087】
広告アクセス分析の方法は、ヒット数、PV(ページビュー)、訪問者数の三つの指標で行われるのが一般的である。ヒット数は、そのサイトに対してどれだけのデータ数の送信要求がされたかという数値である。ここでいうデータ数の単位はコンピュータ上でのデータファイルの数である。ホームページ1頁でもその中にグラフィック情報があるとその分ヒット数は多くなる。逆に1ページに文字ばかりで埋められていても、それがテキストのみの1ファイルならば、あくまでヒット数は1とカウントされる。
【0088】
PVでの指標は、そのサイトで延べ何ページのホームページが見られたかを表す。情報量が多くても少なくても同じ1PVになるがバナ―広告のようにページ単位で露出する広告の媒体価値や効果測定指標としては標準的なものとなっている。またそのサイトのトップページだけのPVの数を訪問者数とする指標がある。PVはあくまで延べ視聴ページ数なので、何人の人がそれを見たかについては把握できない。一人の人が複数回トップページをアクセスすることがあり、ここでの訪問者数は概数としての指標である。本発明の実施例では訪問者数としているが、これら他の分析方法のいずれを使っても良い。この広告料金の徴収管理は、データベースサーバ装置5が行う。決済はネット決済(電子商取引)でも、従来からの決済方法でもよい。
【0089】
さらに本発明の他の実施例を図9に基づき説明する。情報の提供は予め登録した人だけが閲覧出来るように設定された情報サービスである。予め登録された対象者に、IDとパスワードを発行しその登録者だけ情報の閲覧ができるようにする。登録者がウェブの情報を見るためには、与えられたパスワードを入力する必要がある。入力したパスワードが正しいパスワードであると判断された時に情報が閲覧可能となる。パスワードを発行する方法としては、会員登録ページを用意して、メールアドレス、性別、年齢、住所、氏名、会費などを入力する。各項目をデータベースに保存したら、ユーザーにはIDとパスワードを発行し、メールなどで告知する。会員専用サイトに入るためには承認ページを用意して、登録時に発行したIDとパスワードを入力し既にあるデータベースとチェックを行うようにする。
【0090】
ここでは、セキュリティの1実施例としてパスワードを採用したが、近年コンピュータ犯罪の増加に対応して様々な対策が考えられてきた。ハッカーの技術と対応して高度な対応技術も開発されてきた。対策として、まず、ネットワークの安全性を確保することがある。接続を認めない相手からのアクセスを拒否することで不正アクセスやなりすましを防止する。こうした安全性を確保するためのセキュリティ技術としては、IDやパスワードによる本人認証が一般的であるが、ワンタイムパスワードや電子認証、ファイアウオールの設置など、さらに高いセキュリティレベルを実現できるものがある。データの保護・機密性を高めるためには、共通キーや公開キーによる電文の暗号化、VPNによる通信回線の暗号化、及びウイルスウオールによるコンピュータウイルスの撃退などがある。しかし、これらのセキュリティを強化すればするほど利便性が悪くなる。そのため利便性とセキュリティとのバランスを取る必要がある。これらのことを考慮した上でセキュリティの確保の方法を決めていずれの方法をとっても良い。
【0091】
このサービスで提供する情報は、世界中の各分野で特化した最新情報を多言語で提供するものである。提供する情報の1例としては、医学、工学、コンピュータ、エンタテーメント、スポーツ、経済等がある。これらの情報を得るために、世界中の関連情報を常に監視するシステムを持つ。
【0092】
当該情報提供を行うプロセスを図9に示している。図9により情報の収集から情報の提供までを説明する。情報を得るために世界中の提供可能な情報を常に監視91しており、監視に依り掲載する対象情報を発見92した場合は、その情報を取得し、直ちに取得した情報を多言語に翻訳93を行う。翻訳は先に説明した通り翻訳ネットワークを利用し多言語の翻訳を行う。翻訳された情報は、データベースに保管され最新情報として掲載され閲覧可能状態に設定94する。これらのシステムと方法は先に上記で説明した通りである。閲覧が許可された登録者95は、付与されているパスワード、IDを入力し、入力されたパスワードがチェックされ正しいと判定された後閲覧可能となる。
【0093】
閲覧する情報は有料で提供され、閲覧した回数、情報の量(ページ数)又は時間の契約条件に従い課金システムにより自動カウントされて課金処理96がされる。 課金された閲覧者のデータはデータベースサーバ装置5の課金システムファイルに格納される。料金請求は、別に定めた請求期間に従いデータベースサーバ装置5が請求処理97を行う。この場合も電子商取引決済でも、電子決済を行わないで銀行振込などの決済手続きをとっても良い。なお、閲覧許可のための登録者の管理、登録料金の管理、閲覧料金の管理はデータベースサーバ装置5によって行われる。
【0094】
【発明の効果】
以上の説明から明らかなように、本発明の多言語情報提供システムは、通信ネットワークにおける一つの装置及び一つの翻訳処理体系からなる一つのウェブサイト(単一ウェブサイト/ファームウェア)で、その処理規模及び装置規模の増大化を招くことなく、多言語における情報提供を迅速且つ低コストで実施可能にしたのである。
【図面の簡単な説明】
【図1】図1は本発明の実施形態における構成を示すブロック図である。
【図2】本発明を実施するためのウェブサーバの一例を示すブロック図である。
【図3】本システムの実施の概略を示すシーケンス図である。
【図4】本システムの処理手順を示すフローチャートである。
【図5】実施形態にあって多言語処理用データベースの処理を説明するためのブロック図である。
【図6】実施形態にあってテンプレートを使用してマスターコンテンツの作成を説明するための図である。
【図7】移動体通信ネットワーク要部構成のブロック図を示す。
【図8】本発明の実施例としての、コンテンツ掲載依頼から広告料金請求までの実施の流れ図を示す
【図9】本システムにおける登録者専用閲覧方式における実施の流れ図を示す。
【図10】従来の多言語翻訳を実行するウェブサイトのアーキテクチャを説明するためのブロック図である。
【図11】従来例にあって多言語翻訳作成の処理手順を示すフローチャートである。
【図12】従来例にあって多言語翻訳のメンテナンス処理手順を示すフローチャートである。
【符号の説明】
1…デジタル有線通信網
2…多言語翻訳ウェブサイト装置
3…翻訳者装置
4…翻訳依頼者装置
5…データベースサーバ装置
6…広告依頼主装置
7…閲覧登録者装置
8…端末装置
11…マイクロプロセッサ(MPU)
13…読取・書込装置
14…V−RAM
15…文字フォント回路
17…多言語処理用データベース装置
18…コンテンツ・言語データベース装置
20…デジタル移動通信回線網
21…携帯端末
【発明の名称】 通信ネットワークによる多言語情報提供システム
【特許請求の範囲】
【請求項1】
通信ネットワーク(1)を介して、情報コンテンツを多言語に翻訳して提供する多言語情報提供システムであって、
多言語翻訳ウェブサイト装置(2)とこれに接続された多言語処理用のデータベースと(17)を備え、
前記多言語翻訳ウェブサイト装置(2)は、
前記情報コンテンツをHTMLデータに変換し、当該情報コンテンツのページ毎にページレコードとテキストレコードを付してマスターコンテンツとして前記データベース(17)内に格納する手段と、
前記データベース(17)内に格納された前記情報コンテンツの中から非言語データを除いたテキスト部分を抽出する抽出手段と、
当該情報コンテンツの記載内容における複数のテキスト部分を当該情報コンテンツの前記ページレコードと前記テキストレコードを付して外部の複数の翻訳者装置に対して翻訳依頼を送信する手段と、
前記複数の翻訳者装置から前記情報コンテンツのテキスト部分の多言語による翻訳結果を受信し、各テキスト部分の翻訳結果に付された前記ページレコードと前記テキストレコードに基づいて、前記情報コンテンツの前記多言語による翻訳結果を当該情報コンテンツの非言語データとアセンブリして、これを前記データデース(17)内に多言語コンテンツとして格納する手段と、を有し、
前記データベース(17)に格納された前記多言語コンテンツを予め設定した文字数範囲内で前記通信ネットワーク(1)を介して提供することを特徴とする多言語情報提供システム。
【請求項2】
前記多言語コンテンツは広告情報と共に提供することを特徴とする請求項1に記載の多言語情報提供システム。
【請求項3】
前記抽出手段は、前記原稿の記載内容における前記非言語データと前記テキスト部分の抽出を、所定のテンプレートを使用して言語を含むイメージデータと、言語を含まないイメージデータと、テキストデータと、に分類して行うことを特徴とする請求項1に記載の多言語情報提供システム。
【請求項4】
前記抽出手段は、前記多言語翻訳ウェブサイト装置における画面表示の文字が、前記他言語の言語毎に判読可能な最小フォントの比率を予め定めるとともに、この比率によって前記テキストデータの最大文字数を言語毎に設定する記号番号と関連付けることを特徴とする請求項3に記載の多言語情報提供システム。
【請求項5】
前記通信ネットワーク(1)には、さらに、前記多言語翻訳ウェブサイト装置(2)と、前記翻訳依頼者装置又は前記翻訳者装置間で前記翻訳の料金を決済するためのネットバンク装置(5)が接続されることを特徴とする請求項2に記載の多言語情報提供システム。
【請求項6】
前記多言語コンテンツへのアクセス数に基づいて、当該広告情報の広告料金を前記ネットバンク装置(5)を介して広告主に対して請求することを特徴とする請求項5に記載の多言語情報提供システム。
【請求項7】
前記通信ネットワーク(1)は、TCP/IP環境下の公衆有線通信網又は公衆無線通信網若しくは非公衆有線通信網又は非公衆無線通信網であることを特徴とする請求項1乃至5の何れかの項に記載の多言語情報提供システム。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、通信ネットワークを利用し、一つの言語の情報コンテンツを多言語に翻訳して提供する多言語情報提供システムに関する。
【0002】
【従来の技術】
従来から、情報を多言語に翻訳してこれを提供するようにした翻訳サービスとして、TCP/IP(Transmission Control Protocol/Internet Protocol)の環境下の通信ネットワーク(例えば、インターネット)を利用した例が知られている。
【0003】
図10は、従来の多言語翻訳を実施するウェブ(WEB:World Wide WEB)サイトのアーキテクチャを説明するためのブロック図であり、図11は図10のウェブサイトによる多言語翻訳の作成処理手順を示すフローチャートである。また、図12は図10のウェブサイトによる多言語翻訳メンテナンスの処理手順を示すフローチャートである。
【0004】
この例では、図10に示すように、TCP/IP回線網に接続した、多言語における日本語、英語、ドイツ語、フランス語…ごとのウェブサイトが構築されている。それぞれのウェブサイトでは、各言語(日本語からフランス語…)の処理をウェブサーバが実行している。なお、ウェブサイトは、ハードウェアにソフトウェアを実装した処理システム、すなわち、個々のファームウェアである。
【0005】
このアーキテクチャは、ISDNなどのデジタル回線網に、ウェブサイトとなるUNIXワークステーションなどを接続し、また、翻訳者が使用する小型汎用コンピュータが接続され、さらに、翻訳依頼者が使用する小型汎用コンピュータやUNIXワークステーションなどを接続した構成である。この通信ネットワーク構成では、いわゆる、インターネット通信による双方向通信をウェブブラウザ(アプリケーション)で実行している。
【0006】
このような多言語翻訳サービスでは、図11の多言語翻訳の作成処理において、マスタサイトをTCP/IP回線網からダウンロードしてコピーし(ステップS1) 、言語部分のHTML(HyperText Markup Language)のデータを抜き出して言語データに変換する(ステップS2) 。次に、言語データを目的の言語に翻訳する(ステップS3)。この後で、翻訳した言語をHTMLデータに変換する(ステップS4)。さらに、コピーサイトに言語HTMLデータを移植し、調整する(ステップS5)。これまでの処理を必要な言語だけ繰り返している。
【0007】
また、図12のメンテナンスの処理において、ウェブ管理者にマスタサイトの変更を通知して(ステップS11)、翻訳が必要な言語部分を選択する(ステップS12)。言語部分のHTMLデータを抜き出して言語データに変換する(ステップS13)。次に、言語データを翻訳し(ステップS14)、この翻訳言語データをHTMLデータに変換する(ステップS15)。次に、ウェブサイトに言語HTMLデータを移植し、調整する(ステップS16)。言語部分のHTMLデータを抜き出して言語データに変換する処理から必要な言語だけ繰り返す。このようにして、インターネットを利用した多言語翻訳サービスが提供される。
また翻訳は自国語だけが多く同一コンテンツを複数言語に翻訳されて提供されるものは少ない。
【0008】
【発明が解決しようとする課題】
このような上記従来例では、インターネットによる多言語における言語ごとのウェブサイトを構築して、各言語の処理をウェブサーバが実行している。したがって、処理規模及び装置規模が増大化するという欠点がある。
【0009】
本発明は、このような従来の技術における課題を解決するものであり、通信ネットワークにおける単一のウェブサイトで多言語における翻訳を実施できるようになり、その処理規模及び装置規模の増大化を抑えることが出来る通信ネットワークによる多言語翻訳の実施方法及びその通信システム並びに情報記録媒体の提供を目的とする。
【0010】
上記の翻訳は、翻訳者を常時確保するために翻訳ネットワークを組織して翻訳を行う。情報及び広告を含むマスターコンテンツが多くの言語に翻訳されてデータベースに格納され、端末側が希望する言語で呼び出して見ることができる多言語コンテンツを提供する。広告を掲載した広告主より広告掲載料を徴収出来る方法を提供することを目的とする。さらに、より専門部門に特化した情報を予め登録した対象者に多言語で提供出来るようにすることを目的とする。
【0011】
【課題を解決するための手段】
上記課題を達成するために、本願は、通信ネットワークを介して、情報コンテンツを多言語に翻訳して提供する多言語情報提供システムであって、多言語翻訳ウェブサイト装置とこれに接続された多言語処理用のデータベースとを備え、前記多言語翻訳ウェブサイト装置は、前記情報コンテンツをHTMLデータに変換し、当該情報コンテンツのページ毎にページレコードとテキストレコードを付してマスターコンテンツとして前記データベース内に格納する手段と、前記データベース内に格納された前記情報コンテンツの中から非言語データを除いたテキスト部分を抽出する抽出手段と、当該情報コンテンツの記載内容における複数のテキスト部分を当該情報コンテンツの前記ページレコードと前記テキストレコードを付して外部の複数の翻訳者装置に対して翻訳依頼を送信する手段と、前記複数の翻訳者装置から前記情報コンテンツのテキスト部分の多言語による翻訳結果を受信し、各テキスト部分の翻訳結果に付された前記ページレコードと前記テキストレコードに基づいて、前記情報コンテンツの前記多言語による翻訳結果を当該情報コンテンツの非言語データとアセンブリして、これを前記データデース内に多言語コンテンツとして格納する手段と、を有し、前記データベースに格納された前記多言語コンテンツを予め設定した文字数範囲内で前記通信ネットワークを介して提供するものである。
【0012】
そして、前記多言語コンテンツは、広告情報と共に提供することを特徴としている。
【0013】
また、前記抽出手段は、前記原稿の記載内容における前記非言語データと前記テキスト部分の抽出を、所定のテンプレートを使用して言語を含むイメージデータと、言語を含まないイメージデータと、テキストデータと、に分類して行うのである。
【0014】
さらに、前記抽出手段は、前記多言語翻訳ウェブサイト装置における画面表示の文字が、前記他言語の言語毎に判読可能な最小フォントの比率を予め定めるとともに、この比率によって前記テキストデータの最大文字数を言語毎に設定する記号番号と関連付けるようにしている。
【0015】
また、前記通信ネットワークには、前記多言語翻訳ウェブサイト装置と、前記翻訳依頼者装置又は前記翻訳者装置間で前記翻訳の料金を決済するためのネットバンク装置が接続されることを特徴とする。
【0016】
そして、前記多言語コンテンツへのアクセス数に基づいて、当該広告情報の広告料金を前記ネットバンク装置を介して広告主に対して請求するのである。
【0017】
【0018】
【0019】
【0020】
【0021】
【発明の実施の形態】
次に、本発明に係る多言語情報提供システムの実施形態を、図面を参照しつつ詳細に説明する。
図1は、本実施形態における構成を示すブロック図である。
【0022】
図1において、この例はTCP/IP環境下におけるインターネットの構成例を示している。この例は、ISDN(Integrated Services Digital Network)等のデジタル信号通信網1に、インターネットによる多言語翻訳サービスを提供するための多言語翻訳ウェブサイト装置(プラットフォーム/ウェブサイト)2、及び多言語における翻訳を実行するための複数の翻訳者装置3、広告依頼主装置6、閲覧登録者装置7、端末装置8が接続されている。さらに、デジタル有線通信網1に、インターネットによる翻訳を多言語翻訳ウェブサイト装置2側に依頼するための複数の翻訳依頼者装置4、及び翻訳料金、広告料金、閲覧登録料金のネット決済(電子商取引)を行うデータベースサーバ装置5に接続されている。
【0023】
ネット決済の翻訳料金は、翻訳依頼者装置4側が多言語翻訳ウェブサイト装置2側に依頼した翻訳料金、及び、多言語翻訳ウェブサイト装置2側が翻訳者装置3に依頼した翻訳料金である。広告掲載料金は広告依頼主装置側6が多言語ウェブサイト装置2側に依頼した広告掲載料金である。閲覧登録料金は閲覧登録者側7が多言語ウェブサイト装置2側に依頼した閲覧登録料金である。
【0024】
デジタル有線通信網1は、その構成及び伝送方式がISDNとして良く知られており、デジタル交換機(PBX)を回線網に設置した網構成である。
【0025】
図1中の多言語翻訳ウェブサイト装置2は、この例ではUNIXワークステーションを用いており、また、翻訳者装置3、閲覧登録者装置7は、ここでは、個人翻訳者が使用する小型汎用コンピュータを用いている。なお、翻訳会社などでは、例えば、UNIXワークステーションシステムが用いられる。
【0026】
また、図1中のデータベースサーバ装置5は、この例では、UNIXワークステーションを用いており、さらに、翻訳依頼者装置4、広告依頼主装置6は、ここでは個人使用の小型汎用コンピュータを用いている。なお、翻訳依頼者、広告依頼主が会社などの場合、例えば、UNIXワークステーションシステムが用いられる。
【0027】
翻訳者装置3及び翻訳依頼者装置4、閲覧登録者装置7の小型汎用コンピュータのハードウェアは、周知の構成である。すなわち、回線接続装置(デジタル終端装置DSU、ターミナルアダプタTA等)に接続されるインターフェース(I/F)回路とともに、CPU,ROM、ワーキングRAMなどからなるマイクロプロセッサ(MPU)が設けられている。また、この小型汎用コンピュータには、情報記憶媒体(フロッピーディスク(FD)、CD−ROM、着脱メモリMS)を通じて以降で詳細に説明する「本発明の多言語翻訳及び多言語情報サービスを実施」するための通信プロトコルやプログラムを実装(インストール)したり、処理データの読み出し・書き込みを行う読取・書込装置が設けられている。
【0028】
さらに、この小型汎用コンピュータには、カラー液晶ディスプレイ(LCD)などのモニタ装置、及びキーボード、座標入力装置(マウス、入力パット等)からなる入力操作装置が設けられ、さらに、各部のデータ入出力処理を行う入出力(I/O)回路が設けられている。また、この小型汎用コンピュータには、処理データを記憶するメモリ、及び特に「本発明の多言語翻訳及び多言語情報サービスを実施」するためのファイル処理を実行するハードディスク装置を用いた多言語処理用データベースが設けられ、また、プリンタなどとのドライブ接続を行うI/F回路が設けられている。
【0029】
図1中の多言語ウェブサイト装置2及びデータベースサーバ装置5のUNIXワークステーションシステムのハードウェアは周知の構成である。このUNIXワークステーションシステムには、例えば、DSU、ルータなどを備えた回線接続装置と、基幹的な通信処理を実行するための主コンピュータであるウェブサーバとともに、データベースが設けられている。また、このUNIXサーバシステムには、図形、文字などの配信データをアプリケーションに対応して(例えば、iモード携帯電話機)編集し直すための編集サーバなども設けられるのが一般的である。
【0030】
また、このようなUNIXワークステーションシステムには、ウェブサーバにファイアウォールアプリケーションを実装したり、電子メール/画像(FAX)サーバや、小型汎用コンピュータを接続するためのインターフェース回路が設けられている。さらに、このようなUNIXワークステーションシステムには、この装置でのシーケンスを実行するLANサーバとともに、FTP(File Transfer Protocol)ファイル転送用のFTPサーバ、インターネット上の接続などを処理するインターワーキングファンクション(IWF)サーバ、及び侵入防止のためのファイアウォールアプリケーション実行専用のウェブサーバ等が設けられる構成が周知である。
【0031】
これらの構成に加えて、UNIXワークステーションシステムには、以降の図2をもって説明するように、情報記憶媒体を通じて「本発明の多言語翻訳及び多言語情報サービスを実施」するための通信プロトコルやプログラムを実装したり、処理データの読み出し・書き込みを行うための読取・書込装置が設けられ、また、「本発明の多言語翻訳及び多言語情報サービスを実施」するための各種のファイル処理(リレーショナル方式や網方式によるデータ格納・検索/多言語処理用データベースエンジン)を実行する多言語処理用データベースやコンテンツ・言語データベースを備えている。
【0032】
また、この構成に加えて、データベースサーバ装置5には、分散名前管理システム(DNS:Domain Name System)用のDNSサーバとともに、各種の機密保持のために暗号化伝送に使用される暗号化通信プロトコル(SSL:
Secure Sockets Layer)を実行するSSLサーバが設けられるのが一般的である。なお、このようなTCP/IP環境下のウェブサーバは、コンピュータ装置を用い、かつ、通信プロトコルやプログラムの実装によって、多機能装置として実現されるものである。また、ウェブサーバは、小型汎用コンピュータと同様の構成であるが、前記した「本発明の多言語翻訳及び多言語情報サービスの実施」に対応して、そのアーキテクチャを変更すれば良い。
【0033】
この場合、通信プロトコルの処理ではトラフィック量を勘案し、また、データ処理では、その処理データ量を考慮した構成とすれば良い。例えば、二重化CPU構成、複数の多言語処理用データベースの配置、大容量のメモリの使用などを考慮した構成とする。
【0034】
図2は、本発明を実施するためのウェブサーバの要部構成の一例を示すブロック図である。この例は、UNIXワークステーションシステムのバスに接続されて、図示しない他の装置とインターフェース処理を行うI/F回路10が設けられている。また、この例には、I/F回路10及びバスに接続されるマイクロプロセッサ(MPU)11が設けられている。マイクロプロセッサ11は、ワーキング用RAM、ブート・制御プログラムを格納したRAM、入出力(I/O)回路、CPU等からなる。マイクロプロセッサ11には、小型汎用コンピュータと接続するためのI/F回路12とともに読取・書込装置13が設けられている。
【0035】
読取・書込装置13は、情報記憶媒体(フロッピーディスク(FD)、CD−ROM、着脱メモリMS)を通じて「本発明の多言語翻訳及び多言語情報サービスを実施」するための通信プロトコルやプログラムを実装(インストール)したり、処理データの読み出し・書き込みを行うものである。
【0036】
また、マイクロプロセッサ11には、多言語における言語ごとの表示サイズを変換・生成するためのビデオ(V)−RAM14及び文字フォント変換回路15が設けられている。この文字フォント変換回路15は、言語文字ごとに最小フォントの比率に変換する変換テーブルを備えたRAMなどで構成される。この言語ごとの表示サイズを変換・生成については以降(図12を参照)で説明する。
【0037】
このV−RAM14の出力は、マルチドロップ方式のバスに接続されたモニタ装置16に転送される。また、マイクロプロセッサ11は、バスに接続された多言語処理用データベース装置17との間で「本発明の多言語翻訳を実施」するためのデータ処理を実行する。なお、多言語処理用データベース装置17、コンテンツ・言語データベース18は、分散して遠隔地などに配置することも可能である。
【0038】
次に、この実施形態の処理及びその動作について説明する。先ず、図1の各装置の通信動作に関するアプリケーション(通信プロトコル、プログラム)について説明する。
【0039】
図1に示す各装置は、インターネット通信として周知のTCP/IPによる通信接続処理、HTML(HyperText Markup Language)又はXML(eXtensible Makeup Language)等の言語による言語処理機能(文章、音声、データ圧縮によるJPEG静止画又はMPEG動画処理),及びハイパーリンク機能による転送、HTTP(Hypertext
Transport Protocol)による双方向通信、FTPによるファイル転送、及びCGI(Common Gateway Interface)による外部アプリケーションをそれぞれに実行する。このための電子メール通信やインターネットサーフィンを行うウェブブラウザ(アプリケーション)を各装置が搭載している。
【0040】
図1において、各装置は、TCP/IPリンクによって、周知のIPパケットによるファイル転送を双方向通信で行っている。このようなインターネット上での転送処理は、HTTPにおけるオブジェクト指示(マウスなどの座標入力装置によるラジオボタン、アンカー、プッシュボタン等へのオブジェクト指示(俗称、クリック)によって実行する。この場合、ファイルフォーマットにTCPコネクションの開放の終了記述文字(FIN)や肯定応答文字(ACK)などを格納し、その識別によってファイル転送を実行するが、この表記は以下の説明において省略する。
【0041】
次に、図1に示すデジタル有線通信回線網1の伝送形態について説明する。図1に示すデジタル有線通信回線網1では、例えば、伝送速度64,384kbit/秒,1.5Mbit/秒によるIPパケットを伝送している。伝送速度64kbitでは、2B+D(情報チャネル32kbps×2、制御チャネル16kbps)伝送を、例えば、ITU−T勧告によるパケット交換手順X.31(I.430/I.431,Q.921/Q.931,X.25プロトコル)で実行する。なお、他の高速伝送方式(例えば、非対象型デジタル伝送)を適用しても良く、また、高速通信方式(例えば、ギガビット高速データ通信方式)を適用しても良い。また、図1に示す翻訳者装置3及び翻訳依頼者装置4の小型汎用コンピュータは、良く知られた動作を実行しているので、その説明は省略する。
【0042】
さらに、図1中の多言語ウェブサイト装置2のUNIXサーバシステムは、ウェブサーバやLANサーバがなどを通じて、「本発明の多言語翻訳及び多言語情報サービスを実施」をするためのシーケンスを実行する。例えば、イーサネットLANなどと同様のCSMA/CDランダムアクセス方式、RPC(Remote Procedure Call)遠隔呼び出しの各シーケンスを実行して、その電子メール通信やインターネットサーフィンを実行する。
【0043】
この小型汎用コンピュータ、UNIXワークステーションシステムでは、CPU(ウェブサーバのCPUも含む)が実行する通信プロトコルやプログラムによって、「本発明の多言語翻訳及び多言語情報サービスの実施」を実行する。この通信プロトコルやプログラムは、前記した汎用の通信プロトコルやプログラムとともに、「本発明の多言語翻訳及び多言語情報サービスを実施」するための専用の通信プロトコルやプログラムを各装置に組み合わせて実装する。
【0044】
これらの「本発明の多言語翻訳及び多言語情報サービスの実施」は、そのプログラムが情報記録媒体(例えば、FD,CD−ROMや着脱メモリ)に格納して提供される。換言すれば、流通性のある汎用パッケージとして提供される。
【0045】
次に、各装置の動作に基づいた本システムの概略のシーケンス図である。
【0046】
図3を参照すると、多言語翻訳ウェブサイト装置2が、デジタル有線通信網1を通じて翻訳依頼者装置4からの翻訳依頼を電子メールや多言語翻訳ウェブサイト装置2が公開するウェブサイト(ホームページ/HTTP)を通じて取り込む。この受け取りの言語は、多種の言語の一つである(例えば、日本語)。
【0047】
このため、多言語翻訳ウェブサイト装置2に装備する汎用のウェブブラウザでは、判読できない場合がある。このため、多言語を解読するアプリケーションのウェブブラウザを実装する。例えば、予め転送されてくる可能性のある言語とのトラッキングによって判別するためのアプリケーションを実装する。このトラッキングは、転送されてきた一部の文字列を予め格納している多言語の文字列と比較するものである。また、「cookie」のように、過去のホームページへの訪問者であることを識別して、その言語を判定する。なお、搭載ウェブブラウザが返送するナビゲーション言語、ナビゲーションブラウザ言語を識別するようにしても良い。
【0048】
次に、多言語翻訳ウェブサイト装置2から、翻訳依頼で指示された言語間の翻訳が可能な翻訳者装置3側へ、翻訳の納期や特記事項を添えて、依頼翻訳原稿(情報コンテンツの原文)を転送する。これは、多言語における翻訳を行う翻訳者をインターネットで組織化した「多言語対応翻訳ネットワーク」を通じて行う。
【0049】
次に、翻訳者装置3側は、指示された言語間の翻訳を実施する。この場合、翻訳者装置3の小型汎用コンピュータに翻訳ソフトウェアを実装して、その機械自動翻訳を行ったり、又は、いわゆる、ワードプロセッサソフトウェアによる手動入力操作翻訳を行い、その電子データによる翻訳文を作成して請求書などとともに多言語翻訳ウェブサイト装置2に転送する。
【0050】
なお、機械自動翻訳は、翻訳者装置3で実施する場合、多言語翻訳ウェブサイト装置2の翻訳アプリケーションをCGIで実行したり、翻訳者装置3に翻訳アプリケーションを実装して、スタンドアローンで実行する。また、多言語翻訳ウェブサイト装置2側で機械自動翻訳を実施した後に、翻訳者装置3に転送し、再度点検を含む翻訳を行うようにしても良い。
【0051】
多言語翻訳ウェブサイト装置2は、転送されてきた翻訳文電子データを多言語処理用データベース(図2中の多言語処理用データベース装置17)に格納する。その後、この翻訳者(翻訳者装置3)にデータベースサーバ装置5と多言語翻訳ウェブサイト装置2との間で、デビットカードなどを用いた電子取引決済(振込処理)を実行して、翻訳料金を支払う。
【0052】
この後に、多言語翻訳ウェブサイト装置2が、翻訳依頼者装置4側に電子メールやウェブサイト(ホームページ)とのHTTPリンクを通じて、完了した翻訳文を請求書とともに通知する。この通知の後に、翻訳依頼者装置4側から、多言語翻訳ウェブサイト装置2へ通知時に指定された識別符号ID、パスワードを入力して、その翻訳完了の電子データを受け取って多言語処理用データベースに格納する。
【0053】
このようにして、一つの装置及び一つの翻訳処理体系からなる一つのウェブサイト(単一ウェブサイト)で多言語における翻訳が実施できるようになり、その処理規模及び装置規模の増大化を抑えることが出来る。
【0054】
図4は、多言語翻訳の作成処理手順を示すフローチャートであり、図4において、テンプレートを使用してマスターコンテンツを作成する(ステップS21)。次に、マスターコンテンツの言語データを翻訳する(ステップS22)。このステップS21,S22の処理は、必要な言語だけルーチンが繰り返される。次に、翻訳した言語データを制御情報とともに多言語処理用データベースに格納する(ステップS23)。さらに、要求時に言語データをHTMLデータに変換してマスターコンテンツに書き込む(ステップS24)。
【0055】
次に、多言語処理用データベースについて説明する。
図5は多言語処理用データベース(図2中の多言語処理用データベース装置17)の処理を説明するためのブロック図である。
【0056】
図5において、多言語処理用データベースでは、ここでのデータ処理をアクセスを管理プログラムを実行して行う。このデータ処理をアクセスを管理プログラムによって、多言語処理用データベースへのデータ参照・追加、更新・削除などの依頼・結果取得を実行する。
【0057】
また、データベースアクセス管理プログラムの実行によって、データベース管理データをやり取りする。このデータベース管理データは、コンテンツ・言語などに対応する実際の多言語処理用データベース位置・実際の多言語処理用データベース名である。また、データベースアクセス管理プログラムの実行によって、コンテンツ・言語データベースに対するデータをやり取りする。このコンテンツ・言語データベースは、複数のデータベースサーバからなる。
【0058】
このように多言語処理用データベースは、複数台のサーバを設けて、その分散配置が可能である。言語ID・ページIDなどへの要求に対してデータベース管理データから実際のサーバ名・サーバ位置・多言語処理用データベース名などを取得し、データベースサーバ中の目的とする多言語処理用データベースにアクセスする。
【0059】
図6はテンプレートを使用してマスターコンテンツの作成を説明するための図である。図6において、このテンプレートには、イメージデータ(言語データあり)、イメージデータ(言語データなし)、テキストデータの自動選択用がある。なお、これらのイメージデータ(言語データあり)、イメージデータ(言語データなし)、テキストデータデータは、それぞれにデータ量が異なる複数がある。このようなテンプレートによって言語データを自動選択する。
【0060】
さらに、図6を参照して、イメージ中の言語データの翻訳、表示可能(ホームページにおいて)な最小フォントの比率、及び翻訳後の文字数の変化について説明する。
(a)イメージ中の言語データも翻訳する場合
このイメージ中の言語データは、「alt」と同一に扱う(テキスト形式からバイナリ形式に変換)。このイメージ中の言語データの修正処理は人的作業である。置換などの処理はテキストレコードデータと同様に処理する。
(b)言語によって実質的に表示可能(ホームページにおいて)な最小フォントの比率
この最小フォントの比率は、テーブル(文字フォント変換回路15)で予め定めておく。
【0061】
日本語「1」に対する英語「0.8」、ドイツ語「0.8」…中国語「1.1」のそれぞれの比率が設定されている。これは、文字の複雑差に対応するものである。この比率によってテキストデータレコードの最大文字数を言語IDと関連付ける。
(c)翻訳前の元の言語と翻訳後の文字数の変化
言語によって変化する割合を、例えば、翻訳経験上から割り出している。この割合をテーブルに格納して、その翻訳後の言語での文字数を得る。日本語「1」に対する英語「1.3」、ドイツ語「1.3」…中国語「0.8」のそれぞれの割合が設定されている。これは、言語ごとの文字表記による文章量の差に対応するものである。
【0062】
なお、マスターコンテンツでは、予想される最大文字数に合わせて格納領域を確保(設定)するが、次のような処理を追加して実行すると、最大文字数の処理が確実になる。
【0063】
まず、翻訳前の言語の文字数に対して翻訳後の文字数を計算して最大文字数内に納まるかを判定する。すなわち、格納領域に最大文字数が納まる場合は翻訳を実行し、また、格納領域に最大文字数が納まらない場合は、翻訳前の言語の文字数を、その意味が変わらないように減らして修正する。なお、この修正は人的作業である。
【0064】
次に、他の実施形態としての移動通信ネットワークの併設について説明する。前記した実施形態では、固定通信ネットワーク(デジタル有線通信回線網1及び固定の小型汎用コンピュータ等)のみを配置しているが、移動通信ネットワークにもそのまま適用できる。例えば、翻訳を依頼する翻訳依頼者装置4側が、移動場所(例えば、外国企業)で、各種の説明における翻訳が必要になった場合、この移動場所から翻訳依頼を行い、かつ、この外国企業への翻訳文の転送を指示するなどの場合である。
【0065】
なお、移動通信ネットワークの適用は、翻訳依頼者装置4以外の多言語翻訳ウェブサイト装置2、翻訳者装置3にもそのまま適用可能である。
【0066】
図7は、移動体通信ネットワーク要部構成のブロック図の例を示す。この例は、図1に示すデジタル有線回線網1とともに、通信プロトコル変換などを行う接続装置(ゲートウェイ装置やPHS接続装置)で接続されたPDC(Personal Digital Cellular Telecommunication System)方式、PHS(Personal
Handyphone System)方式などのデジタル移動通信回線網20とともに、セル基地局20aと無線改選で接続される無線通信手段としての携帯端末21を有している。携帯端末21にはモバイルコンピュータ22が接続されている。
【0067】
この携帯端末21は、例えば、送受信無線部、変調・復調部、時分割多重処理部、コーディック(符号化・復号化)部、CPU、周波数切替シンセサイザ、受信電界強度(RSSI)検出部、外部装置接続用インターフェース部、着信表示発光ダイオード、キーパッド、画面表示液晶ディスプレイ、及び着信表示振動発生器などを備えた慣用的な構成である。モバイルコンピュータ22も図1中の翻訳者装置3などの小型汎用コンピュータと同様の構成である。
【0068】
このデジタル移動通信回線網20と携帯端末21との間の伝送方式として、TDMA(PDC)方式、又はTDMA/TDD(PHS)方式、CDMA方式(IS-95/IMT-2000)のいずれでも良く、また、変調方式(PSK方式など)も特に限定しない。デジタル移動通信回線網20と携帯端末21は、例えば、ARIB−27/28規格(PDC方式/PHS方式)による無線区間(エアーインターフェース)によってデジタル移動通信回線網3を通じて通信を行う。この通信では、現状においてデータ転送速度が速い広帯域伝送かつPIAFS(PHS
Internet Access Forum Standard)方式によるインターネットアクセスが容易なPHS方式の適用が好ましい。
【0069】
この携帯端末21及びモバイルコンピュータ22がデジタル移動通信回線網20を通じて、前記した「本発明の多言語翻訳を実施」を実行する。
なお、この実施形態では、以下のような変形例も可能である。デジタル有線通信回線網1は、アナログ電話ネットワークPSTN(Public Switched Telephone Network)でも良く、この場合の回線接続装置には、NCU(Network
Control Unit)及び変復調装置(モデム)を用いれば良い。
【0070】
また、TCP/IPの伝送方式に代えて、デジタル有線通信回線網1を使用し、かつ、Z/YMODEMなどの通信プロトコルによるコンピュータ対コンピュータ通信を組み合わせても本発明の実施が可能である。また、図1の各装置は、インターネット上で、その伝送信頼性の向上や蓄積データの消失防止を考慮して現用系及び予備系からなる二重化による構成としても良い。
【0071】
さらに、本発明の実施は、インターネットにおける公開性(不特定多数の利用)を活用しているが、企業などのイーサネットLAN、FDDI・LANを収容したWAN(Wide Area Network)などの非公開的な閉鎖通信ネットワークにもそのまま適用できる。
【0072】
また、この実施形態では、プログラム実装をFD,CD−ROM、着脱メモリをもって説明したが、例えば、インターネットを通じてダウンロードして実装(インストール)することも可能である。
【0073】
ここまで本発明による1つのコンテンツを多言語に翻訳する方法、その装置及び通信システムについて説明した。つぎに、本発明による情報サービスについて説明する。最初に、多言語翻訳のための翻訳組織の仕組みについて説明する。
【0074】
必要コンテンツの翻訳には従来ウェブサイト運営者が翻訳を行いウェブに掲載するのが普通である。この方式であると翻訳可能な言語が限られてしまう。したがって公開するコンテンツは自社で翻訳可能な言語の範囲を出ない。インターネットでの通信の1つの特徴である、全世界がネットワークされる機能が生かされていない。多数の国の人が自国語でインターネットによるウェブ画面が閲覧出来るようにするために本発明では1つのマスターコンテンツを多数の言語に翻訳するネットワークを構築する。日本だけでなく外国の翻訳者、翻訳業者に呼びかけてフランチャイズ化し常時夫々の言語での翻訳が可能な「多言語翻訳フランチャイズ体制」を構築する。
【0075】
翻訳するコンテンツがあると、インターネット等の通信手段により翻訳すべきコンテンツを開示する。翻訳者は開示されたマスターコンテンツを取り込み自分の登録した言語で翻訳を行う。翻訳はテンプレートを使用し翻訳された文字数、形式を統一したものとすることができる。この翻訳の方式については先に説明した通りである。このため翻訳されたコンテンツは何国語であっても同一の形態をとることができる。このようにして翻訳されたコンテンツは通信ネットワークを使用してウェブサイトに送られ編集してコンテンツ・データベースに格納され、閲覧可能の状態になる。格納されたコンテンツはインターネット上の全世界中の端末から自国語でのアクセスが可能となる環境が構築されていることになる。
【0076】
本発明での情報サービスを提供するウェブアプリケーションの形態はCGI(Common Gateway Interface)経由でプログラムを起動するものである。この形態では、ユーザー端末がプラウザから引数付でURLを指定する。ウェブサーバは該当するCGIプログラムを起動して、その結果を受け取った後、HTML文書としてクライアント端末に伝送する。
【0077】
またユーザー側端末機は、インターネットで使用されているHTTP、HTMLをサポートするウェブ対応機器であれば、モバイル型の端末機(例えば携帯電話)でも通常使用されているPCでも良い。このような基本的なネットワーク構造を利用して行うシステムを次の図8に基づいて、本発明の多言語のコンテンツによる情報サービス提供の実施方法を説明する。
【0078】
図8は、1実施例の多言語情報サービスコンテンツの掲載から広告主に広告掲載料金を請求するまでの流れ図である。先ず、掲載を依頼81された広告を含むコンテンツを翻訳ネットワークを通じて多言語に翻訳82し、編集してコンテンツ・言語データベースに投入する。これをウェブサイトに公開83する。各種端末からウェブサイトに閲覧要求があり、閲覧する言語が自動的に選択される。ページが開かれるとそのページを閲覧する来訪者の回数カウント84を言語別に行う。これを繰り返し行い、定めた期間に閲覧回数に応じた広告掲載料の計算を行い、広告主に広告掲載料金の請求85する。
【0079】
次にその詳細を説明する。ネットワーク、インターネット及び装置に関しては先に説明したので省略する。また、上記に説明した多言語に翻訳された各種情報は、コンテンツ・言語データベース18に格納されている。格納されたコンテンツ・言語データベース18を使用して各種情報を要求された言語で要求した端末に提供する。インターネットによる閲覧に係る閲覧ソフトウェアは通常使用されているもので公知である。
【0080】
また、画面の各ページ上には多言語に翻訳した広告を掲載する。広告はテンプレートの形態でも良い。また、「バナ―広告」と呼ばれている看板形式としても良い。このバナ―形式は広告の所定位置をクリックすると広告主のホームページにリンクする構造と成っている。もう一つの方法としては「メールニュース広告」であり、ネット上の電子メールマガジンの文中にテキスト形式で挿入されている。テキスト文中に表記されたURLは、着色されてクリック可能な形式で表示されており、興味を持ったユーザーがそこをクリックすれば広告主のホームページにリンクするようになっている。広告の形態により夫々の方法を取ることが出来る。
【0081】
多言語情報データベースから希望する言語の選択は、多言語翻訳ウェブサイト装置2に装備する汎用のウェブブラウザで判別するが、言語によっては、判読できない場合がある。このため、多言語を解読するアプリケーションのウェブブラウザを実装する。例えば、予め転送されてくる可能性のある言語とのトラッキングによって判別するためのアプリケーションを実装する。
【0082】
このトラッキングは、転送されてきた一部の文字列を予め格納している多言語の文字列と比較するものである。また、「cookie」のように、過去のホームページへの訪問者であることを識別して、その言語を判定する。なお、搭載ウェブブラウザが返送するナビゲーション言語、ナビゲーションブラウザ言語を識別するようにしても良い。
【0083】
また別の方法として自身のアドレスからシステムに依り自動的に行われるようにしても良い。若しくは、表示されている言語ボタンを選択することで希望する言語での表示がなされるようにしてもよい。
【0084】
公開する各種情報サービス提供の実施例として、次のような情報サービスが提供できる。ゲームのサイトでは、日本のゲーム、世界各国のゲームの紹介を行う。映像・音楽のサイトでは、世界中の映像、音楽の紹介及び、投稿のサイトを設けている。観光・風土のサイトでは、現地の人でなければ知らない場所・情報の紹介や投稿を含んだオリジナルな観光情報を掲載している。スポーツのサイトでは、世界各国で行われている最新のスポーツ情報を掲載する。人材情報のサイトでは、多言語の情報で多国籍の人に対する求人情報の提供や人材情報の提供を行う。
【0085】
本発明では、このように、オリジナルのコンテンツは1個でも世界各国語に翻訳された多言語のコンテンツがデータベース化され閲覧可能なので、世界各国の来訪者が各々の自国語で同一のコンテンツを閲覧できる。
【0086】
さらに、広告についても同様に同一の広告が複数の言語で閲覧出来る。広告主は、1つの広告で多国に複数の広告を行っていると同様な効果が期待できる。このような効果を踏まえて、本発明では広告主に対しては広告掲載料を請求する手段を備えている。システムは各言語別に来訪者をカウントしており、言語別に広告の効果が計れるように設計されている。また効果測定の方法として何ページのページが見られたかを表す、ページアクセス回数のカウントを採る方法を併用しても良い。本発明ではウェブのカウンターでページごとの閲覧回数をカウントしている。
【0087】
広告アクセス分析の方法は、ヒット数、PV(ページビュー)、訪問者数の三つの指標で行われるのが一般的である。ヒット数は、そのサイトに対してどれだけのデータ数の送信要求がされたかという数値である。ここでいうデータ数の単位はコンピュータ上でのデータファイルの数である。ホームページ1頁でもその中にグラフィック情報があるとその分ヒット数は多くなる。逆に1ページに文字ばかりで埋められていても、それがテキストのみの1ファイルならば、あくまでヒット数は1とカウントされる。
【0088】
PVでの指標は、そのサイトで延べ何ページのホームページが見られたかを表す。情報量が多くても少なくても同じ1PVになるがバナ―広告のようにページ単位で露出する広告の媒体価値や効果測定指標としては標準的なものとなっている。またそのサイトのトップページだけのPVの数を訪問者数とする指標がある。PVはあくまで延べ視聴ページ数なので、何人の人がそれを見たかについては把握できない。一人の人が複数回トップページをアクセスすることがあり、ここでの訪問者数は概数としての指標である。本発明の実施例では訪問者数としているが、これら他の分析方法のいずれを使っても良い。この広告料金の徴収管理は、データベースサーバ装置5が行う。決済はネット決済(電子商取引)でも、従来からの決済方法でもよい。
【0089】
さらに本発明の他の実施例を図9に基づき説明する。情報の提供は予め登録した人だけが閲覧出来るように設定された情報サービスである。予め登録された対象者に、IDとパスワードを発行しその登録者だけ情報の閲覧ができるようにする。登録者がウェブの情報を見るためには、与えられたパスワードを入力する必要がある。入力したパスワードが正しいパスワードであると判断された時に情報が閲覧可能となる。パスワードを発行する方法としては、会員登録ページを用意して、メールアドレス、性別、年齢、住所、氏名、会費などを入力する。各項目をデータベースに保存したら、ユーザーにはIDとパスワードを発行し、メールなどで告知する。会員専用サイトに入るためには承認ページを用意して、登録時に発行したIDとパスワードを入力し既にあるデータベースとチェックを行うようにする。
【0090】
ここでは、セキュリティの1実施例としてパスワードを採用したが、近年コンピュータ犯罪の増加に対応して様々な対策が考えられてきた。ハッカーの技術と対応して高度な対応技術も開発されてきた。対策として、まず、ネットワークの安全性を確保することがある。接続を認めない相手からのアクセスを拒否することで不正アクセスやなりすましを防止する。こうした安全性を確保するためのセキュリティ技術としては、IDやパスワードによる本人認証が一般的であるが、ワンタイムパスワードや電子認証、ファイアウオールの設置など、さらに高いセキュリティレベルを実現できるものがある。データの保護・機密性を高めるためには、共通キーや公開キーによる電文の暗号化、VPNによる通信回線の暗号化、及びウイルスウオールによるコンピュータウイルスの撃退などがある。しかし、これらのセキュリティを強化すればするほど利便性が悪くなる。そのため利便性とセキュリティとのバランスを取る必要がある。これらのことを考慮した上でセキュリティの確保の方法を決めていずれの方法をとっても良い。
【0091】
このサービスで提供する情報は、世界中の各分野で特化した最新情報を多言語で提供するものである。提供する情報の1例としては、医学、工学、コンピュータ、エンタテーメント、スポーツ、経済等がある。これらの情報を得るために、世界中の関連情報を常に監視するシステムを持つ。
【0092】
当該情報提供を行うプロセスを図9に示している。図9により情報の収集から情報の提供までを説明する。情報を得るために世界中の提供可能な情報を常に監視91しており、監視に依り掲載する対象情報を発見92した場合は、その情報を取得し、直ちに取得した情報を多言語に翻訳93を行う。翻訳は先に説明した通り翻訳ネットワークを利用し多言語の翻訳を行う。翻訳された情報は、データベースに保管され最新情報として掲載され閲覧可能状態に設定94する。これらのシステムと方法は先に上記で説明した通りである。閲覧が許可された登録者95は、付与されているパスワード、IDを入力し、入力されたパスワードがチェックされ正しいと判定された後閲覧可能となる。
【0093】
閲覧する情報は有料で提供され、閲覧した回数、情報の量(ページ数)又は時間の契約条件に従い課金システムにより自動カウントされて課金処理96がされる。 課金された閲覧者のデータはデータベースサーバ装置5の課金システムファイルに格納される。料金請求は、別に定めた請求期間に従いデータベースサーバ装置5が請求処理97を行う。この場合も電子商取引決済でも、電子決済を行わないで銀行振込などの決済手続きをとっても良い。なお、閲覧許可のための登録者の管理、登録料金の管理、閲覧料金の管理はデータベースサーバ装置5によって行われる。
【0094】
【発明の効果】
以上の説明から明らかなように、本発明の多言語情報提供システムは、通信ネットワークにおける一つの装置及び一つの翻訳処理体系からなる一つのウェブサイト(単一ウェブサイト/ファームウェア)で、その処理規模及び装置規模の増大化を招くことなく、多言語における情報提供を迅速且つ低コストで実施可能にしたのである。
【図面の簡単な説明】
【図1】図1は本発明の実施形態における構成を示すブロック図である。
【図2】本発明を実施するためのウェブサーバの一例を示すブロック図である。
【図3】本システムの実施の概略を示すシーケンス図である。
【図4】本システムの処理手順を示すフローチャートである。
【図5】実施形態にあって多言語処理用データベースの処理を説明するためのブロック図である。
【図6】実施形態にあってテンプレートを使用してマスターコンテンツの作成を説明するための図である。
【図7】移動体通信ネットワーク要部構成のブロック図を示す。
【図8】本発明の実施例としての、コンテンツ掲載依頼から広告料金請求までの実施の流れ図を示す
【図9】本システムにおける登録者専用閲覧方式における実施の流れ図を示す。
【図10】従来の多言語翻訳を実行するウェブサイトのアーキテクチャを説明するためのブロック図である。
【図11】従来例にあって多言語翻訳作成の処理手順を示すフローチャートである。
【図12】従来例にあって多言語翻訳のメンテナンス処理手順を示すフローチャートである。
【符号の説明】
1…デジタル有線通信網
2…多言語翻訳ウェブサイト装置
3…翻訳者装置
4…翻訳依頼者装置
5…データベースサーバ装置
6…広告依頼主装置
7…閲覧登録者装置
8…端末装置
11…マイクロプロセッサ(MPU)
13…読取・書込装置
14…V−RAM
15…文字フォント回路
17…多言語処理用データベース装置
18…コンテンツ・言語データベース装置
20…デジタル移動通信回線網
21…携帯端末
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000315357A JP3979621B2 (ja) | 2000-10-16 | 2000-10-16 | 通信ネットワークによる多言語情報提供システム |
PCT/JP2001/005804 WO2002033607A1 (en) | 2000-10-16 | 2001-07-04 | Method for offering multilingual information translated in many languages through a communication network |
US10/149,230 US7130792B2 (en) | 2000-10-16 | 2001-07-04 | Method for offering multilingual information translated in many languages through a communication network |
EP01947817A EP1327214A1 (en) | 2000-10-16 | 2001-07-04 | Method for offering multilingual information translated in many languages through a communication network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000315357A JP3979621B2 (ja) | 2000-10-16 | 2000-10-16 | 通信ネットワークによる多言語情報提供システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002123744A JP2002123744A (ja) | 2002-04-26 |
JP2002123744A5 true JP2002123744A5 (ja) | 2007-04-12 |
JP3979621B2 JP3979621B2 (ja) | 2007-09-19 |
Family
ID=18794473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000315357A Expired - Fee Related JP3979621B2 (ja) | 2000-10-16 | 2000-10-16 | 通信ネットワークによる多言語情報提供システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3979621B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012143782A2 (en) * | 2011-04-19 | 2012-10-26 | LECHOWICZ, Stephen, Paul | A system for an incentive-based distribution of a marketing material |
JP5449633B1 (ja) | 2013-03-22 | 2014-03-19 | パナソニック株式会社 | 広告翻訳装置、広告表示装置、および広告翻訳方法 |
CN113011202B (zh) * | 2021-03-23 | 2023-07-25 | 中国科学院自动化研究所 | 基于多任务训练的端到端图像文本翻译方法、系统、装置 |
-
2000
- 2000-10-16 JP JP2000315357A patent/JP3979621B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7130792B2 (en) | Method for offering multilingual information translated in many languages through a communication network | |
JP4011268B2 (ja) | 多言語翻訳システム | |
US6601108B1 (en) | Automatic conversion system | |
US6883032B1 (en) | Method and system for collecting data on the internet | |
US20030023756A1 (en) | Contents conversion method and server | |
WO2000039666A1 (en) | Converting content of markup data for wireless devices | |
WO1999035777A2 (en) | System for processing and storing internet bookmark address links | |
IL129633A (en) | Automatic conversion system | |
KR20010047541A (ko) | 맞춤 페이지 생성 시스템 및 방법 | |
JP3979621B2 (ja) | 通信ネットワークによる多言語情報提供システム | |
JP2002123744A5 (ja) | ||
JP2002123662A (ja) | コンピュータ双方向通信ネットワークによる多言語市場調査の方法及びその通信システム並びに情報記録媒体 | |
JP2002123662A5 (ja) | ||
US7319859B2 (en) | Wireless LAN device | |
JP2002123745A (ja) | 通信ネットワークによる多言語に翻訳された仮想見本市・展示会の実施方法及びその通信システム並びに記録媒体。 | |
JP2001306520A (ja) | 広告表示可能なサービス提供システム、セキュアプロバイダ装置、サービス提供装置、セキュアプロバイダ方法、サービス提供方法、ならびに、情報記録媒体 | |
WO2001046873A1 (en) | Method and apparatus employing a proxy server for modifying an html document supplied by a web server to a web client | |
JP2000194636A (ja) | インタ―ネット上の情報提供方法およびプログラム記録媒体 | |
JP2003296503A (ja) | インターネット広告評価方法及びシステム | |
JP2002269253A (ja) | 電子文書変換サービスシステムおよび電子文書変換サービスシステムの課金方法 | |
KR20090096578A (ko) | 컨텐츠 정보 처리방법 및 시스템과 이를 위한 기록매체 | |
Schulzrinne | Whither WWW?—Status, Problems, Directions | |
KR100789960B1 (ko) | 검색어에 따른 홈페이지를 직접 노출시키는 인터넷 검색서비스 제공 시스템 및 그 방법 | |
Fordham | Connecting your company to the Internet | |
US20100287186A1 (en) | Method for delivering query responses |