JP2009301248A - 言語処理装置 - Google Patents

言語処理装置 Download PDF

Info

Publication number
JP2009301248A
JP2009301248A JP2008153674A JP2008153674A JP2009301248A JP 2009301248 A JP2009301248 A JP 2009301248A JP 2008153674 A JP2008153674 A JP 2008153674A JP 2008153674 A JP2008153674 A JP 2008153674A JP 2009301248 A JP2009301248 A JP 2009301248A
Authority
JP
Japan
Prior art keywords
language
unit
input
output
language processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008153674A
Other languages
English (en)
Inventor
Hidetaka Kamimura
英孝 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008153674A priority Critical patent/JP2009301248A/ja
Publication of JP2009301248A publication Critical patent/JP2009301248A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】
入力言語の設定の手間を省く。
【解決手段】
入力部(14)は、文字画像を含む映像を認識部(16)に入力する。認識部(16)は、入力部(149からの映像の文字画像を認識し、この文字画像に対応する文字情報、及びその言語を示す言語情報を出力する。ユーザは、言語選択手段(12)により出力言語を選択する。言語処理部(18)は、認識手段(16)で認識された文字情報を出力言語に機械翻訳する。出力部(20)は、言語処理部(18)の翻訳結果を出力する。
【選択図】 図1

Description

本発明は、言語を別の言語に変換、即ち翻訳する言語処理装置に関する。
近年、自然言語処理技術の発展に伴い、様々な言語処理装置が開発されている。図5は、言語を変換する機械翻訳の従来の言語処理装置の概略構成ブロック図を示す。言語処理装置40は、言語選択部42と、入力部44と、言語処理部46と、翻訳結果出力部48とを具備する。言語選択部42は、入力言語と出力言語を選択する選択画面を表示し、ユーザはその画面上で,入力言語又は出力言語を指定する。入力部44により翻訳対象の言語(の文章)が言語処理部46に入力される。言語処理部46は、入力部44により入力された文章を言語選択部42で選択された入力言語及び出力言語に従い翻訳する。翻訳結果出力部48は、言語処理部46で翻訳された翻訳文を出力する。
図6は、図5に示す言語処理装置の動作フローチャートである。入力部44が、言語処理を行いたい任意の言語Xの文章を取り込み、言語処理部46に供給する(S11)。言語処理部46は、形態素解析により、入力文の単語を決定する(S12)。ステップS12の単語決定処理は、文字列のどこからどこまでが単語で、その品詞は何かを決定する処理である。
言語処理部46は、構文解析により、ステップS2で得られた品詞の係り受けを確定する(S13)。例えば、「Aさんと東京に行く」の「Aさん」は「行く」に係り、「東京と神奈川に行く」の「東京」は「神奈川」に係るといった内容である。ステップS13により、構文解析の結果を木構造で表した構文木Xを得ることが出来る。
言語処理部46は次に、ステップS13の処理で得られた構文木Xに入力言語Xと出力言語Yとの間で予め定められた規則を適用し、別の言語Yの構文木Yを得る(S14)。言語処理部46は、ステップS14で得られた構文木Yを用いて、言語Yの文章を生成する(S15)。
言語処理部46は、このようにして生成された言語Yの文章を翻訳結果出力部48に供給し、翻訳結果出力部48は、外部に出力する(S16)。
以上の処理により、任意の言語Xを他の任意の言語Yに翻訳できる。一般的に、ステップS12からS15までの処理が、機械翻訳と呼ばれる。
従来の言語処理装置における言語選択方法には、言語処理装置が現在の位置情報を取得し、取得した位置の使用言語を選択するというものがある(特許文献1,2参照。)。
特開2003−114887号公報 特開2005−190278号公報
従来の言語処理装置では、出力言語を位置情報から決定できる。しかし、入力言語は、ユーザが言語処理装置を使用する際に手動で選択する必要があった。また、仮に現在位置の言語を入力言語とした場合、出力言語を簡易に選択する手段又は方法が望まれる。
本発明は、このような要望を満たす言語処理装置を提示することを目的とする。
本発明に係る言語処理装置は、文字画像を含む映像を入力する入力手段と、前記映像から前記文字画像を認識し、前記文字画像に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、装置の操作画面表示用言語を選択する言語選択手段と、前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、前記言語処理手段の翻訳結果を出力する出力手段とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする。
本発明に係る言語処理装置は、音声を入力する入力手段と、前記音声を認識し、前記音声に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、装置の操作画面表示用言語を選択する言語選択手段と、前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、前記言語処理手段の翻訳結果を出力する出力手段とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする。
本発明によれば、文字認識又は音声認識により言語も同時に認識するので、入力言語の事前設定が不要になり、ユーザの負担が軽減される。また、複数種類の入力言語に同時対応出来る。
以下、図面を参照して、本発明の実施例を詳細に説明する。
図1は、デジタルビデオカメラに適用された本発明の一実施例の概略構成ブロック図を示す。本実施例は、デジタルビデオで撮影した文字を別言語に翻訳し、翻訳結果を再生映像に重畳表示する機能を提供する。
本実施例の言語処理装置10は、言語選択部12と、映像入力部14と、認識部16と、言語処理部18と、翻訳結果出力部20とを具備する。言語選択部12は、出力言語を選択する選択画面を表示し、ユーザはその画面上で出力言語を指定する。出力言語は、通常、メニュー表示言語である。
映像入力部14により被写体の映像(例えば、都市風景等の映像)が言語処理装置10の認識部16に入力される。認識部16は、映像入力部14により入力された映像から文字部分を抽出し、言語と文字を認識する。認識部16は、光学文字認識用に、入力言語として指定される可能性のある複数の言語の文字データベースを具備する。認識部16は、抽出された文字部分を該当する文字データベースとマッチングして個々の文字とその言語を認識し、認識結果の文字情報と、画面上の表示位置と、言語を示す言語情報を言語処理部18に出力する。
言語処理部18は、認識部16からの言語情報で指定される言語を入力言語として、認識部16からの文字を、言語選択部12で選択される出力言語に機械翻訳する。機械翻訳結果は、画面上の表示位置の情報とともに、翻訳結果出力部20に供給される。
翻訳結果出力部20は、言語処理部18からの翻訳結果を、言語処理部18からの表示位置に表示されるように、映像入力部14の入力対象の映像信号に合成する。合成映像信号は、液晶表示パネル又は電子ビューファインダに表示される。
図2は、本実施例の動作フローチャートを示す。映像入力部14により、言語処理を行いたい任意の文字(言語X)を含む映像を取り込み、認識部16に供給する(S1)。
認識部16は、入力画像のパターン認識により、文字画像部分を抽出する(S2)。認識部16は更に、抽出した文字画像と内蔵辞書内の言語とのパターンマッチングを行うことで、文字画像から入力言語Xを特定し、文字列を取得し(S3)。認識部16は、このようにして得られた文字列と入力言語情報(入力言語Xを示す情報)を言語処理部18に供給する。
言語処理部18は、認識部16からの入力言語情報に基づく形態素解析により、認識部16からの文字列を単語に分解し、品詞を決定する(S4)。言語処理部18はまた、構文解析により、ステップS4で得られた単語の品詞の係り受けを確定し、構文解析の結果を木構造で表した構文木Xを生成する(S5)。言語処理部18は次に、ステップS5の構文解析処理で得られた構文木Xに入力言語Xと出力言語Yとの間で予め定められた規則を適用し、別の言語Yの構文木Yを得る(S14)。なお、ユーザは,言語選択部12により、出力言語Yを予め選択している。出力言語Yは、通常、ユーザが日常、使用する言語であり、ビデオカメラに装備される場合には,ビデオカメラのメニューの表示言語でもある。言語処理部18は、ステップS6で得られた構文木Yを用いて、言語Yの文章(翻訳文)を生成する(S7)。
言語処理部18は、このようにして生成された言語Yの文章を翻訳結果出力部20に供給する。翻訳結果出力部20は、映像信号と混合する混合器(図示せず)に、表示位置のタイミングで言語Yの文章の画像データを供給する(S8)。
以上の処理により、映像に含まれる文字を、その言語Xを自動決定した上で、他の任意の言語Yに翻訳できる。即ち、ユーザが手動で入力言語を選択する手間を軽減できる。複数の言語の入力に対応するためには、認識部16でのパターン認識に多大な時間がかかることが予想されるが、言語処理装置10が現在位置情報を基に、現地の言語を優先的に選択することで、認識時間を短縮できる。
図3は、本実施例のメニュー表示言語を選択する画面の一例を示す。図3(a)は、日本語を選択した場合であり、同(b)は、英語を選択した場合をそれぞれ示す。
図4は、実際に韓国で撮影した映像に対する本実施例の表示結果例を示す。撮影映像を再生する際に、本実施例の言語処理装置10が機能する。メニュー言語が日本語に設定されている場合、モニタ画面には(a)に示すように日本語の翻訳文が重畳標示される。他方、メニュー言語が英語に設定されている場合、モニタ画面には(b)に示すように英語の翻訳文が重畳標示される。
図7は、実際に韓国語を入力音声とした本実施例の表示結果例を示す。入力された音声に対する出力を行う際に、本実施例の言語処理装置10が機能する。メニュー言語が日本語に設定されている場合、モニタ画面には(a)に示すように日本語の翻訳文が表示される。他方、メニュー言語が英語に設定されている場合、モニタ画面には(b)に示すように英語の翻訳文が表示される。ここで、出力は音声出力としても良い。また、入力音声がメニュー言語に設定している言語と同様であった場合、従来技術にある位置情報検出の結果から出力言語を決定することが有効であることは言うまでもない。
本発明の一実施例の概略構成ブロック図である。 本実施例の動作フローチャートである。 本実施例を実装したデジタルビデオカメラのメニュー表示言語選択画面例である。 本実施例を実装したデジタルビデオカメラによる再生画面例である。 従来の言語処理装置の概略構成ブロック図である。 従来例の動作フローチャートである。 本実施例を実装した翻訳機による再生画面例である。
符号の説明
10:言語処理装置
12:言語選択部
14:入力部
16:認識部
18:言語処理部
20:翻訳結果出力部
40:言語処理装置
42:言語選択部
44:入力部
46:言語処理部
48:翻訳結果出力部

Claims (4)

  1. 文字画像を含む映像を入力する入力手段と、
    前記映像から前記文字画像を認識し、前記文字画像に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、
    装置の操作画面表示用言語を選択する言語選択手段と、
    前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、
    前記言語処理手段の翻訳結果を出力する出力手段
    とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする言語処理装置。
  2. 前記認識手段が、前記文字画像の表示位置を示す情報を出力し、
    前記出力手段は、前記映像の前記表示位置に対応する位置に前記文字情報を重畳する手段を含む
    ことを特徴とする請求項1に記載の言語処理装置。
  3. 前記言語処理手段は、前記認識手段で認識された前記文字情報を前記言語選択手段で選択された言語に機械翻訳することを特徴とする請求項1又は2に記載の言語処理装置。
  4. 音声を入力する入力手段と、
    前記音声を認識し、前記音声に対応する文字情報、及びその言語を示す言語情報を出力する認識手段と、
    装置の操作画面表示用言語を選択する言語選択手段と、
    前記認識手段で認識された前記文字情報を機械翻訳する言語処理手段と、
    前記言語処理手段の翻訳結果を出力する出力手段
    とを具備し、前記言語選択手段で選択された言語を入力言語又は出力言語とすることを特徴とする言語処理装置。
JP2008153674A 2008-06-12 2008-06-12 言語処理装置 Withdrawn JP2009301248A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008153674A JP2009301248A (ja) 2008-06-12 2008-06-12 言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008153674A JP2009301248A (ja) 2008-06-12 2008-06-12 言語処理装置

Publications (1)

Publication Number Publication Date
JP2009301248A true JP2009301248A (ja) 2009-12-24

Family

ID=41548084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008153674A Withdrawn JP2009301248A (ja) 2008-06-12 2008-06-12 言語処理装置

Country Status (1)

Country Link
JP (1) JP2009301248A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138473A (ja) * 2010-06-08 2011-07-14 Square Enix Co Ltd リアルタイムなカメラ辞書
JP4790080B1 (ja) * 2010-10-01 2011-10-12 株式会社スクウェア・エニックス 情報処理装置,情報表示方法,情報表示プログラム,及び記録媒体
JP2014215965A (ja) * 2013-04-30 2014-11-17 株式会社Nttドコモ 情報処理装置、情報処理方法、及び情報処理プログラム
JP2015210683A (ja) * 2014-04-25 2015-11-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP2017182028A (ja) * 2016-03-31 2017-10-05 株式会社エクシング カラオケ指示操作プログラム、カラオケ指示操作システム、および、カラオケ指示操作装置
CN110741331A (zh) * 2017-09-09 2020-01-31 谷歌有限责任公司 用于图像响应自动助理的系统、方法和装置
JP2021149480A (ja) * 2020-03-18 2021-09-27 株式会社リコー 表示装置、表示方法、プログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138473A (ja) * 2010-06-08 2011-07-14 Square Enix Co Ltd リアルタイムなカメラ辞書
JP4790080B1 (ja) * 2010-10-01 2011-10-12 株式会社スクウェア・エニックス 情報処理装置,情報表示方法,情報表示プログラム,及び記録媒体
JP2014215965A (ja) * 2013-04-30 2014-11-17 株式会社Nttドコモ 情報処理装置、情報処理方法、及び情報処理プログラム
JP2015210683A (ja) * 2014-04-25 2015-11-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP2017182028A (ja) * 2016-03-31 2017-10-05 株式会社エクシング カラオケ指示操作プログラム、カラオケ指示操作システム、および、カラオケ指示操作装置
CN110741331A (zh) * 2017-09-09 2020-01-31 谷歌有限责任公司 用于图像响应自动助理的系统、方法和装置
JP2020530604A (ja) * 2017-09-09 2020-10-22 グーグル エルエルシー 画像応答自動アシスタントのためのシステム、方法、および装置
US11417092B2 (en) 2017-09-09 2022-08-16 Google Llc Systems, methods, and apparatus for image-responsive automated assistants
CN110741331B (zh) * 2017-09-09 2023-12-08 谷歌有限责任公司 用于图像响应自动助理的系统、方法和装置
JP2021149480A (ja) * 2020-03-18 2021-09-27 株式会社リコー 表示装置、表示方法、プログラム
JP7494506B2 (ja) 2020-03-18 2024-06-04 株式会社リコー 表示装置、表示方法、プログラム

Similar Documents

Publication Publication Date Title
US9298704B2 (en) Language translation of visual and audio input
JP2009301248A (ja) 言語処理装置
US20150179173A1 (en) Communication support apparatus, communication support method, and computer program product
US20140372100A1 (en) Translation system comprising display apparatus and server and display apparatus controlling method
JP2018170015A (ja) 情報処理装置
WO2021259221A1 (zh) 视频翻译方法和装置、存储介质和电子设备
JP2017167779A (ja) 画像処理装置、表示装置、アニメーション生成方法、アニメーション表示方法及びプログラム
JP7199061B2 (ja) 翻訳装置
WO2019123854A1 (ja) 翻訳装置、翻訳方法、及びプログラム
US10216732B2 (en) Information presentation method, non-transitory recording medium storing thereon computer program, and information presentation system
CN109792502B (zh) 信息处理设备、信息处理方法、存储介质和信息处理系统
JP3757565B2 (ja) 音声認識画像処理装置
JP7117629B2 (ja) 翻訳装置
JP2004334409A (ja) データ閲覧支援装置、データ閲覧方法及びデータ閲覧プログラム
JP2018045675A (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP6676093B2 (ja) 異言語間コミュニケーション支援装置及びシステム
JP2017102939A (ja) オーサリング装置、オーサリング方法、およびプログラム
JP2006106845A (ja) 文書概要作成装置、表示装置、情報処理装置、プレゼンテーションシステム、文書概要作成プログラム、文書概要作成装置制御プログラム、表示装置制御プログラム、情報処理装置制御プログラム、文書概要作成方法、文書概要作成装置制御方法、表示装置制御方法及び情報処理装置制御方法
JP2003044074A (ja) 印刷処理装置、印刷処理方法、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP2004343352A (ja) 電子機器装置及びテロップ情報処理方法
JP2003345486A (ja) ユーザ補助装置、ユーザ補助方法、ユーザ補助プログラムおよびユーザ補助プログラムを記録した記録媒体
JP2006085418A (ja) プレゼンテーション支援装置、プレゼンテーション支援方法、プレゼンテーション支援プログラム
JP2008065653A (ja) 映像翻訳装置
JP2006267934A (ja) 議事録作成装置および議事録作成処理プログラム
JP6080058B2 (ja) オーサリング装置、オーサリング方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110613

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20121016

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20121106