JP2009122937A - 自動翻訳装置、その方法、そのプログラム - Google Patents

自動翻訳装置、その方法、そのプログラム Download PDF

Info

Publication number
JP2009122937A
JP2009122937A JP2007295845A JP2007295845A JP2009122937A JP 2009122937 A JP2009122937 A JP 2009122937A JP 2007295845 A JP2007295845 A JP 2007295845A JP 2007295845 A JP2007295845 A JP 2007295845A JP 2009122937 A JP2009122937 A JP 2009122937A
Authority
JP
Japan
Prior art keywords
word
translation
parameter
importance
generality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007295845A
Other languages
English (en)
Inventor
Noboru Miyazaki
昇 宮崎
Hideyuki Mizuno
秀之 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007295845A priority Critical patent/JP2009122937A/ja
Publication of JP2009122937A publication Critical patent/JP2009122937A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】重要な単語のみを翻訳することで翻訳誤りの確率を少なくする。
【解決手段】元言語の単語で構成されるテキストを単語毎に分割することで単語列を生成し(2、S2)、前記単語列中の翻訳すべき単語に翻訳フラグを付与し(4、S4)、元言語の単語と、当該単語を翻訳した翻訳先単語と、が対応して予め記憶されている辞書データベース8を参照して、前記翻訳フラグが付与された単語を、対応している翻訳先単語に翻訳し、前記翻訳フラグが付与されていない単語は翻訳しないことで、部分翻訳単語列を生成する(6、S6)。
【選択図】図1

Description

この発明は、例えば、入力されたテキストを自動翻訳して、合成音声を出力する自動翻訳装置、その方法、そのプログラムに関する。
従来、入力されたテキストの内容をFAXや電子メールで伝達したり、ユーザの要求によっては音声合成技術を用いて、テキストを音声に変換し、留守番電話に録音したりするなど、様々な媒体で情報伝達するサービスが存在する(非特許文献1参照)。ここで、入力されるテキストが例えば、日本語で記述されているとして、情報を受け取る側の利用者が日本語を母国語としない(例えば、利用者が米国人)場合、その利用者の母国語(例えば、英語)または理解できる言語に変換して情報提示する必要がある。
このような利用シーンにおいて、情報を受け取る側の利用者は日本に在住し、家族を学校に通学させていることを鑑みると、全く日本語を理解できないわけではなく、最低限の日常用語や、日本語の基本的な語順は理解できる場合もあるため、必ずしも入力テキスト全てを日本語から別言語へ翻訳する必要がないことがある。
ところで、入力されたテキストについて合成音声を出力する装置で、翻訳機能を備えるものとして、例えば特許文献1や特許文献2などの技術がある。これらの技術は、ある言語で記述された入力テキスト全体を、一旦異なる言語に自動的に翻訳し、翻訳先の言語のテキストを受け取り、翻訳先の言語を合成するテキスト音声合成装置を用いて音声を合成していた。
http://www.faircast.jp/ 特開平8−237714号 特願平7−221140号(請求項5、図2、[0018]〜[0020])
自動翻訳技術を用いる際、翻訳誤りの発生を避けることができない。メールやFAXなど文面で翻訳後の情報(翻訳文)を閲覧する場合、翻訳誤りがあったとしても、テキストを全体的に解釈しておおまかな意味を把握できる場合がある。しかし、再生される音声により情報を聞く場合、一部分で翻訳誤りが起きている状況で、その音声を聞き続けると、誤りがある箇所以降の意味が連鎖的に理解できないことがあり、翻訳誤りによる影響が深刻になる。
例えば、「二人の児童が、帽子をかぶった不審者に話しかけられました。本日は、集団下校を行います。」というテキストを、現在Web上で提供されている自動翻訳サービスを用いて、英語に変換すると、「It was talked to the suspicious individual whom two childoren put a hat on.I leave school in a group today.」となる。翻訳されたテキストを読み、様々な解釈を考えれば、意味が通じないことも無い。しかし、翻訳されたテキストを音声合成変換装置を用いて音声に変換し、再生した場合に、当該音声の意味を理解できる可能性は、テキストを読む場合と比べて著しく低い。
この発明は、単語分割部と、辞書データベースと、翻訳単語特定部と、翻訳単語特定部と、を備える。単語分割部は、元言語の単語で構成されるテキストを単語毎に分割する。翻訳単語特定部は、単語列中の翻訳すべき単語に翻訳フラグを付与する。辞書データベースには、元言語の単語と、当該単語を翻訳した翻訳先単語と、が対応して予め記憶されている。翻訳単語特定部は、辞書データベースを参照して、翻訳フラグが付与された単語を、対応している翻訳先単語に翻訳し、翻訳フラグが付与されていない単語は翻訳しないことで、部分翻訳単語列を生成する
また、翻訳単語特定部は、かかり受け解析手段と、重要度パラメータ決定手段と、翻訳フラグ付与手段と、を有しても良い。かかり受け解析手段は、単語列中の句同士のかかり受けを解析する。重要度パラメータ決定手段は、予め定められた規則に基づき、かかり受けの情報を用いて、単語列中の単語の重要性を示す重要度パラメータを決定して各単語に付与する。翻訳フラグ付与手段は、重要度パラメータが、予め定められた重要度パラメータ範囲内にある単語に翻訳フラグを付与する。ここで、重要度パラメータと予め定められた重要度パラメータ範囲について説明する。まず、重要度パラメータについては、重要である単語の重要度パラメータを大きな値とし、重要でない単語の重要度パラメータを小さな値としてもよく、重要である単語の重要度パラメータを小さな値とし、重要でない単語の重要度パラメータを大きな値としてもよい。予め定められた重要度パラメータ範囲内とは、重要である単語の重要度パラメータを大きな値とした場合は、予め定められた閾値より大きい範囲であり、重要である単語の重要度パラメータを小さな値とした場合は、予め定められた閾値より小さい範囲ということである。
更に、重要度パラメータ決定手段は、テキスト中の文の述語を構成する単語、当該述語に直接かかる句を構成する単語、当該述語に直接かからない句を構成する単語、の順番に重要度パラメータの値が異なるように、重要度パラメータを各単語に付与してもよい。
更に、翻訳フラグ付与手段は、重要度パラメータが重要度パラメータ範囲内にある単語のうち、名詞に該当する単語のみに翻訳フラグを付与してもよい。
更に、翻訳単語特定部は、一般単語辞書データベースと、一般度パラメータ決定手段と、を備えても良い。一般単語辞書データベースには、元言語の単語と、当該単語が一般的に使用される程度を示す一般度パラメータと、が対応されて予め記憶されている。一般度パラメータ決定手段は、一般単語辞書データベースを用いて、単語列中の単語一般度パラメータを付与する。この場合、翻訳フラグ手段は、重要度パラメータが重要度パラメータ範囲内にあり、かつ一般度パラメータが予め定められた一般度パラメータ範囲内にある単語に翻訳フラグを付与する。ここで、一般度パラメータと予め定められた一般度パラメータ範囲について説明する。まず、一般度パラメータについては、一般的である単語の一般度パラメータを大きな値とし、一般的でない単語の一般度パラメータを小さな値としてもよく、逆に、一般的である単語の一般度パラメータを小さな値とし、一般的でない単語の一般度パラメータを大きな値としてもよい。予め定められた一般度パラメータ範囲内とは、一般的である単語の一般度パラメータを大きな値とした場合は、予め定められた閾値より小さい範囲であり、一般的である単語の一般度パラメータを小さな値とした場合は、予め定められた閾値より大きな範囲ということである。
また、翻訳単語特定部は、一般単語辞書データベースと、一般度パラメータ決定手段と、翻訳フラグ付与手段のみで構成してもよい。
更に、
部分翻訳単語列中の各単語を音声合成して、合成音声を出力する音声合成部を備えてもよい。
上記の構成により、全ての単語を翻訳せず重要な単語のみを翻訳するので、自動翻訳の誤りによる意味理解が困難となるような音声合成が出力される確率も、従来技術と比べて減らすことができる。また、語順の変換は行わないので、語順変換の誤りにより意味の理解が困難になるような状況がなくなる。以下の説明では、入力されるテキストを構成する言語を元言語とし、翻訳先の言語を翻訳先言語とする。そして、重要な単語のみが翻訳されており語順も元言語の語順と同じであっても、翻訳先言語の語順や意味を理解している利用者(部分的に翻訳された文章を視聴する者)であれば、的確に翻訳先言語を理解できる。
発明を実施するための最良の形態を説明する前に、この発明の概念に対いて説明する。本発明の利用者は、ある程度の翻訳先言語の単語と翻訳先言語の語順規則を大まかに理解しているとする。
翻訳技術は、(1)元言語の単語を翻訳先言語の対応する言語へ翻訳する、(2)元言語の語順を翻訳先言語の適切な語順へ変換する、という2つの過程に分けることができる。この発明では、(1)の過程において、本発明では、必ずしも全ての単語を翻訳せず、利用者が元言語を学習する過程ですぐに学ぶような一般的な単語や、テキストの意味的な構造に関係のない単語は翻訳先言語に変換しない。
また(2)の過程において、本発明では、上述のように、利用者は別言語の語順規則を大まかに理解しているとし、元言語の語順のまま出力する。このように、利用者の持つ元言語に関する知識を仮定することで、自動翻訳処理が行われる単語を少なくし、かつ、語順を変更する必要がないので、翻訳誤りによる影響を減少させることができる。
以下に、発明を実施するための最良の形態を示す。以下の説明では、元言語を日本語とし、翻訳先言語を英語とし、利用者は、例えば、日本語を大体理解している米国人とする。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。
図1に実施例1の自動翻訳装置を示し、図2に実施例1の自動翻訳装置の主な処理の流れを示す。実施例1の自動翻訳装置は、単語分割部2、翻訳単語特定部4、単語翻訳部6、辞書データベース8、とで構成されている。そして、利用者が情報閲覧装置を用いて自動翻訳装置よりの情報を閲覧する。元言語の単語で構成されるテキストを図3に示すように、「二人の児童が、帽子をかぶった不審者に話しかけられました。本日は、集団下校を行います。」とする。「二人の児童が、帽子をかぶった不審者に話しかけられました」を第1文とし、「本日は、集団下校を行います。」を第2文とする。
単語分割部2は、テキストを単語毎に分割することで単語列を生成する(ステップS2)。単語毎の分割処理は、例えば「特許第3379643号(以下、「特許文献A」という。)」に記載されている形態素解析技術を用いて実現できる。単語列の一例を図4に示す。
次に、翻訳単語特定部4は、単語列中の翻訳すべき単語に翻訳フラグを付与する(ステップS4)。実施例1の翻訳単語特定部4−1の機能構成例を図5に示す。翻訳単語特定部4−1は、例えば、かかり受け解析手段402と、重要度パラメータ決定手段404と、翻訳フラグ付与手段406と、で構成される。
かかり受け解析手段402は、文(この実施例では第1文と第2文)を解析することで、単語列中の句同士のかかり受けを解析する。かかり受け解析の手法は、例えば、「特許第2770555号」に記載されている。かかり受け構造の例を図6に示す。図6記載のかかり受け構造は、例えば句ごとで判断される。図6の例では、句「二人の」が句「児童が、」にかかり、句「児童が、」が句「話しかけられました。」にかかる。
重要度パラメータ決定手段404が、予め定められた規則に基づき、かかり受けの情報を用いて、前記単語列中の単語の重要性を示す重要度パラメータを決定して各単語に付与する。ここで、重要度パラメータについて説明する。重要度パラメータについては、重要である単語の重要度パラメータを大きな値とし、重要でない単語の重要度パラメータを小さな値としてもよい。逆に、重要である単語の重要度パラメータを小さな値とし、重要でない単語の重要度パラメータを大きな値としてもよい。以下の説明では、重要である単語の重要度パラメータを大きな値とし、重要でない単語の重要度パラメータを小さな値とし、この場合の重要度パラメータを重要度とする。
次に、重要度パラメータの決定手法の一例を説明する。重要度パラメータ決定手段404は、テキスト中の文の述語を構成する単語、当該述語に直接かかる句を構成する単語、当該述語に直接かからない句を構成する単語、の順番に重要度の値が大、中、小と異なる値になるように、重要度パラメータを各単語に付与する。何故なら、述語(文の最終句)は、重要である場合が多いからである。また、重要である単語の重要度パラメータを小さな値とし、重要でない単語の重要度パラメータを大きな値とした場合は、テキスト中の文の述語を構成する単語、当該述語に直接かかる句を構成する単語、当該述語に直接かからない句を構成する単語、の順番に重要度の値が小、中、大と異なる値としてもよい。
例えば、図7に示すように、第1文の最終の句「話しかけられました。」の重要度を「10」とし、重要度nの句に直接かかる句の重要度をn−1とすればよい。そして、重要度パラメータ決定手段404は、図8に示すような重要度付き単語列を出力する。
翻訳フラグ付与手段406は、重要度パラメータが、重要度パラメータ範囲内にある単語に前記翻訳フラグを付与する。ここで、重要度パラメータ範囲について説明する。重要度パラメータ範囲は、重要度パラメータを重要度とした場合は、予め定められた第1閾値より大きい範囲であり、重要である単語の重要度パラメータを小さな値とした場合は、予め定められた第1閾値より小さい範囲ということである。そして、重要度パラメータ範囲は予め定めていてもよく、利用者が調整できるようにしても良い。この実施例では、重要度パラメータ範囲は予め定められている例を説明する。そして、利用者が調整できる例は、後述する実施例4で説明する。以下の説明では、第1閾値を「8」とし、第1閾値より大きい単語に翻訳フラグを付与する。そうすると、翻訳フラグ付き単語列は、図9に示すようになる。
更に、重要度パラメータが前記重要度パラメータ範囲内にある(重要度が第1閾値より大きい)単語のうち、名詞に該当する単語のみに翻訳フラグを付与してもよい。何故なら、翻訳先言語の中でも名詞が外国人が理解し難い場合が多いから重要であるとするのが適切だからである。この場合の翻訳フラグ付き単語列は、単語「児童」「不審者」「本日」「集団下校」に付与され、図10のようになる。
説明を図1に戻す。単語翻訳部6は、辞書データベース8を用いて、翻訳フラグ付き単語列中の翻訳フラグが付与された単語を翻訳し、翻訳フラグ付き単語列中の翻訳フラグが付与されていない単語は翻訳しないことで、部分翻訳単語列を生成する(ステップS6)。辞書データベース8の一例を図11に示す。図11の記載では、辞書データベース8は、例えば、元言語の単語「児童」と、当該元言語の単語「児童」を翻訳した翻訳先単語「child」と、を対応させて記憶する。図10の例では、「児童」、「不審者」、「本日」、「集団下校」、に翻訳フラグが付与されているので、これらの単語を辞書データベース8を用いて、それぞれ翻訳され、「child」、「prowler」、「today」、「group dismissal」になる。そうすると、図12に示すような部分翻訳単語列が生成される。
音声合成部10は、部分翻訳単語列中の各単語を音声合成して、合成音声を出力する。音声合成部10の機能構成例を図13に示す。音声合成部10は例えば、元言語音声合成手段102と、合成音声作成手段104と、翻訳先言語音声合成手段106と、で構成される。図12のような部分翻訳単語列の場合、翻訳先言語音声合成手段106が、「child」、「prowler」、「today」、「group dismissal」を英語の音声で合成し、元言語音声合成手段102が、部分翻訳単語列中のこれら以外の単語を日本語の音声で合成し、部分翻訳単語列の単語の順番で、合成音声が出力される。
また、自動翻訳合成装置は、音声合成部10を備えずに、単語翻訳部6よりの部分翻訳単語列をテキストで出力してもよい。
この様な構成にすることで、重要な単語のみを翻訳し、入力されたテキストの単語列の順番で音声を合成し、出力できる。従って、翻訳する単語の数を減らすことができ、自動翻訳の誤りによる意味理解が困難となるような音声合成の出力も、従来技術を比べて減らすことができる。また、語順を変更させないので、語順変換の誤りにより意味の理解が困難になるような状況がなくなる。よって、利用者が翻訳先言語(日本語)の語順や大方の意味を理解していれば、翻訳誤り率を低下させることができ、利用者も出力される翻訳先言語を理解できる。
実施例2の自動翻訳装置は、実施例1で説明した翻訳単語特定部4−1が翻訳単語特定部4−2に代替されている点で異なる。図14に翻訳単語特定部4−2の機能構成例を示す。翻訳単語特定部4−2は、一般単語辞書データベース408と、一般度パラメータ決定手段410と、翻訳フラグ付与手段406と、で構成されている。
一般単語辞書データベース408には、図15に示すように、元言語の単語と、当該単語が一般的に使用される程度を示す一般度パラメータと、が対応されて予め記憶されている。ここで、一般度パラメータについて説明する。一般的である単語の一般度パラメータを大きな値とし、一般的でない単語の一般度パラメータを小さな値としてもよく、逆に、一般的である単語の一般度パラメータを小さな値とし、一般的でない単語の一般度パラメータを大きな値としてもよい。以下の説明では、一般的である単語の一般度パラメータを大きな値とし、一般的でない単語の一般度パラメータを小さな値とした場合の一般度パラメータを一般度とする。日常一般に使われる単語とは、例えば、翻訳先言語(この例では、英語)を母国語とする人(この例では、米国人)が、元言語(この例では、日本語)を習う際に、最初に使用する教材や元言語の小学校教材などの学習教材に出現する単語である。そして、このような日常一般に使われる単語の一般度は高く設定されている。図15の例では、一般単語は、「て」「に」「今日」「本日」などであり、これらの単語は日常一般によく使用されるので一般度が高く設定されている。一方、「集団下校」のような単語は、日常一般にはあまり使用されないので、一般度は低く(図15の例では「4」)設定されている。
そして、一般度パラメータ決定手段410は、一般単語辞書データベース408を用いて、単語列中の単語に一般度パラメータを付与する。この例では、一般度が付与された単語列を一般度付き単語列とする。一般度付き単語列の一例を図16に示す。図16に示すように、例えば、「の」であれば一般度10が付与され、「児童」であれば一般度6が付与される。
翻訳フラグ付与手段406は、一般度パラメータが、予め定められた一般度パラメータ範囲内にある単語に翻訳フラグを付与する。ここで、一般度パラメータ範囲内とは、一般的である単語の一般度パラメータを大きな値とした場合は、予め定められた第2閾値より小さい範囲であり、一般的である単語の一般度パラメータを小さな値とした場合は、予め定められた第2閾値より大きな範囲ということである。従って、一般度パラメータを一般度とした場合は、第2閾値より小さい範囲が、一般度パラメータ範囲となる。そして、一般度パラメータ範囲は予め定めていてもよく、利用者が調整できるようにしても良い。この実施例では、一般度パラメータ範囲は予め定められている例を説明する。そして、利用者が調整できる例は、後述する実施例4で説明する。例えば第2閾値を「7」とすれば、図17に示すように、単語「児童」単語「不審者」単語「集団下校」に翻訳フラグが付与される。翻訳フラグ付き単語列は、単語翻訳部6に入力される。
翻訳単語特定部4−2のような構成にして、一般性のある単語は翻訳せず、一般性のない(特殊な)単語のみを翻訳することで、実施例1と同様な効果を得ることができる。
実施例3の自動翻訳装置は、実施例1で説明した翻訳単語特定部4−1が翻訳単語特定部4−3に代替されている点で異なる。翻訳単語特定部4−3は、翻訳単語特定部4−1の構成と翻訳単語特定部4−2の構成とが統合された構成である。図18に翻訳単語特定部4−3の機能構成例を示す。
翻訳単語特定部4−3は、かかり受け解析手段402、重要度パラメータ決定手段404、翻訳フラグ付与手段406、一般単語辞書データベース408、一般度パラメータ決定手段410により構成されている。重要度パラメータ決定手段404が、重要度付き単語列を生成し、一般度パラメータ決定手段410が、一般度付き単語列を生成する。そして、重要度が第1閾値より大きく、かつ、一般度が第2閾値より小さい単語に翻訳フラグを付与する。また、重要度パラメータ決定手段404と一般度パラメータ決定手段410とを統合させて、1つの単語列に重要度と一般度の両方を付与してもよい。
このような構成にすることで、重要であり(重要度が高い)、かつ、一般的でない(一般度が低い)単語のみを翻訳するので、翻訳の必要のない単語数を増やすことができ、より翻訳誤り率を低下させることができる。
実施例4の自動翻訳装置は、利用者により、第1閾値、第2閾値を変更できる。従って、重要度パラメータ範囲、一般度パラメータ範囲を変える事ができ、利用者の翻訳先言語の習得度に合わせた部分翻訳を行うことができる。図19に実施例4の自動翻訳装置と情報閲覧装置500の機能構成例を示す。実施例3の自動翻訳装置は、実施例1で説明した翻訳単語特定部4−1が翻訳単語特定部4−4に代替されている点で異なる。翻訳単語特定部4−4は、翻訳単語特定部4−1、4−2、4−3のうちの何れかに、閾値管理部420が加えられている。図20に、翻訳単語特定部4−3に閾値管理部420が加えられたものを示す。翻訳フラグ付与手段406は、閾値管理部420に保存されている第1閾値、第2閾値を用いて、翻訳フラグを付与する。
一方、情報閲覧装置500は、例えば、入力部502、閾値設定部504で構成されている。利用者は入力部502に所望する第1閾値、第2閾値を入力する。閾値設定部504は、入力された第1閾値、第2閾値を示す閾値指定信号を生成して、図20に示すように、閾値管理部420に送信する。そして、閾値管理部420は、送信された第1閾値、第2閾値を保存する。上述したように、翻訳フラグ付与手段406は、保存されている第1閾値、第2閾値を用いて、翻訳フラグを付与する。
実施例4のような自動翻訳装置にして、利用者は所望する第1閾値、第2閾値を設定することができ、結果として、重要度パラメータ範囲、一般度パラメータ範囲を自由に設定することができる。従って、利用者の翻訳先言語の習得度に応じて、部分翻訳単語列を生成できる。
実施例1〜4の自動翻訳装置の機能構成例を示した図。 実施例1〜4の自動翻訳装置の主な処理の流れを示す図。 入力テキストの例を示す図。 単語列の例を示す図。 実施例1の翻訳単語特定部の機能構成例を示す図。 かかり受けの情報の例を示す図。 重要度を示す図。 重要度付き単語列の例を示す図。 翻訳フラグ付き単語列の例を示す図。 図9記載の翻訳フラグ付き単語列のうち、名詞のみに翻訳フラグを付した翻訳フラグ付き単語列の例を示す図。 辞書データベースの保存形態例を示す図。 部分翻訳単語列を示す図。 音声合成部の機能構成例を示す図。 実施例2の翻訳単語特定部の機能構成例を示す図。 一般単語辞書データベースの保存形態例を示す図。 一般度付き単語列の例を示した図。 実施例2の翻訳単語特定部により出力された翻訳フラグ付き単語列を示す図。 実施例3の翻訳単語特定部の機能構成例を示す図。 実施例4の自動翻訳装置と情報閲覧装置の機能構成例を示す図。 実施例4の翻訳単語特定部の機能構成例を示す図。

Claims (10)

  1. 元言語の単語で構成されるテキストを単語毎に分割することで単語列を生成する単語分割部と、
    前記単語列中の翻訳すべき単語に翻訳フラグを付与する翻訳単語特定部と、
    元言語の単語と、当該単語を翻訳した翻訳先単語と、が対応して予め記憶されている辞書データベースと、
    前記辞書データベースを参照して、前記翻訳フラグが付与された単語を、対応している翻訳先単語に翻訳し、前記翻訳フラグが付与されていない単語は翻訳しないことで、部分翻訳単語列を生成する単語翻訳部と、を備えることを特徴とする自動翻訳装置。
  2. 請求項1記載の自動翻訳装置であって、
    前記翻訳単語特定部は、
    前記単語列中の句同士のかかり受けを解析するかかり受け解析手段と、
    予め定められた規則に基づき、前記かかり受けの情報を用いて、前記単語列中の単語の重要性を示す重要度パラメータを付与する重要度パラメータ決定手段と、
    前記重要度パラメータが、重要度パラメータ範囲内にある単語に前記翻訳フラグを付与する翻訳フラグ付与手段と、
    を有することを特徴とする自動翻訳装置。
  3. 請求項2記載の自動翻訳装置であって、
    重要度パラメータ決定手段は、前記テキスト中の文の述語を構成する単語、当該述語に直接かかる句を構成する単語、当該述語に直接かからない句を構成する単語、の順番に重要度パラメータの値が異なるように、重要度パラメータを各単語に付与することを特徴とする自動翻訳装置。
  4. 請求項2または3記載の自動翻訳装置であって、
    前記翻訳フラグ付与手段は、
    前記重要度パラメータが前記重要度パラメータ範囲内にある単語のうち、名詞に該当する単語のみに前記翻訳フラグを付与することを特徴とする自動翻訳装置。
  5. 請求項2〜4記載の自動翻訳装置であって、
    前記翻訳単語特定部は、更に、
    元言語の単語と、当該単語が一般的に使用される程度を示す一般度パラメータと、が対応されて予め記憶されている一般単語辞書データベースと、
    前記一般単語辞書データベースを用いて、前記単語列中の単語に一般度パラメータを付与する一般度パラメータ決定手段も有し、
    前記翻訳フラグ手段は、前記重要度パラメータが、前記重要度パラメータ範囲内にあり、かつ前記一般度パラメータが、一般度パラメータ範囲内にある単語に前記翻訳フラグを付与することを特徴とする自動翻訳装置。
  6. 請求項1記載の自動翻訳装置であって、
    前記翻訳単語特定部は、
    元言語の単語と、当該単語が一般的に使用される程度を示す一般度パラメータと、が対応されて予め記憶されている一般単語辞書データベースと、
    前記一般単語辞書データベースを用いて、前記単語列中の単語に一般度パラメータを付与する一般度パラメータ決定手段と、
    前記一般度パラメータが、一般度パラメータ範囲内にある単語に前記翻訳フラグを付与する翻訳フラグ付与手段と、を有することを特徴とする自動翻訳装置。
  7. 請求項1〜6記載の自動翻訳装置であって、
    更に、
    前記部分翻訳単語列中の各単語を音声合成して、出力する音声合成部を備えることを特徴とする自動翻訳装置。
  8. 元言語の単語で構成されるテキストを単語毎に分割することで単語列を生成する単語分割過程と、
    前記単語列中の翻訳すべき単語に翻訳フラグを付与する翻訳単語特定過程と、
    元言語の単語と、当該単語を翻訳した翻訳先単語と、が対応して予め記憶されている辞書データベースを参照して、前記翻訳フラグが付与された単語を、対応している翻訳先単語に翻訳し、前記翻訳フラグが付与されていない単語は翻訳しないことで、部分翻訳単語列を生成する単語翻訳過程と、を有することを特徴とする自動翻訳方法。
  9. 請求項8記載の自動翻訳方法であって、
    前記翻訳単語特定過程は、
    前記単語列中の句同士のかかり受けを解析するかかり受け解析ステップと、
    予め定められた規則に基づき、前記かかり受けの情報を用いて、前記単語列中の単語の重要性を示す重要度パラメータを付与する重要度パラメータ決定ステップと、
    前記重要度パラメータが、重要度パラメータ範囲内にある単語に前記翻訳フラグを付与する翻訳フラグ付与ステップと、
    を有することを特徴とする自動翻訳方法。
  10. 請求項1〜7の何れかに記載される自動翻訳装置の各部としてコンピュータを機能させるための自動翻訳装置プログラム。
JP2007295845A 2007-11-14 2007-11-14 自動翻訳装置、その方法、そのプログラム Pending JP2009122937A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007295845A JP2009122937A (ja) 2007-11-14 2007-11-14 自動翻訳装置、その方法、そのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007295845A JP2009122937A (ja) 2007-11-14 2007-11-14 自動翻訳装置、その方法、そのプログラム

Publications (1)

Publication Number Publication Date
JP2009122937A true JP2009122937A (ja) 2009-06-04

Family

ID=40815032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007295845A Pending JP2009122937A (ja) 2007-11-14 2007-11-14 自動翻訳装置、その方法、そのプログラム

Country Status (1)

Country Link
JP (1) JP2009122937A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041284A (ja) * 2013-08-22 2015-03-02 株式会社リコー 文章処理装置、文章表示システム、プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05101094A (ja) * 1991-10-04 1993-04-23 Hitachi Ltd 辞書検索制御方法
JPH08297671A (ja) * 1995-04-26 1996-11-12 Oki Electric Ind Co Ltd 文書の速読支援装置
JP2007233823A (ja) * 2006-03-02 2007-09-13 Advanced Telecommunication Research Institute International 自動要約装置及びコンピュータプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05101094A (ja) * 1991-10-04 1993-04-23 Hitachi Ltd 辞書検索制御方法
JPH08297671A (ja) * 1995-04-26 1996-11-12 Oki Electric Ind Co Ltd 文書の速読支援装置
JP2007233823A (ja) * 2006-03-02 2007-09-13 Advanced Telecommunication Research Institute International 自動要約装置及びコンピュータプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041284A (ja) * 2013-08-22 2015-03-02 株式会社リコー 文章処理装置、文章表示システム、プログラム

Similar Documents

Publication Publication Date Title
Ebden et al. The Kestrel TTS text normalization system
JP4439431B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
Wagner et al. Experimental and theoretical advances in prosody: A review
EP1089256A2 (en) Speech recognition models adaptation from previous results feedback
JP4745036B2 (ja) 音声翻訳装置および音声翻訳方法
KR101735195B1 (ko) 운율 정보 기반의 자소열 음소열 변환 방법과 시스템 그리고 기록 매체
Tsvetkov et al. Cross-lingual bridges with models of lexical borrowing
US20190138270A1 (en) Training Data Optimization in a Service Computing System for Voice Enablement of Applications
US20190138269A1 (en) Training Data Optimization for Voice Enablement of Applications
Blache et al. The corpus of interactional data: A large multimodal annotated resource
JP2019109278A (ja) 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法
JP2012073519A (ja) 読み上げ支援装置、方法、およびプログラム
Tang et al. Mutual intelligibility and similarity of Chinese dialects: Predicting judgments from objective measures
JP2012037790A (ja) 音声対話装置
WO2009107441A1 (ja) 音声合成装置、テキスト生成装置およびその方法並びにプログラム
Calhoun What makes a word contrastive? Prosodic, semantic and pragmatic perspectives
US8401855B2 (en) System and method for generating data for complex statistical modeling for use in dialog systems
JP5636309B2 (ja) 音声対話装置および音声対話方法
Güneş Morphosyntax and phonology of agreement in Turkish
KR20150027465A (ko) 외국어 고유명사에 대한 다중 발음열 생성 방법 및 장치
Che et al. Investigating effect of rich syntactic features on Mandarin prosodic boundaries prediction
Rouhe et al. An equal data setting for attention-based encoder-decoder and HMM/DNN models: A case study in Finnish ASR
JP2009122937A (ja) 自動翻訳装置、その方法、そのプログラム
Cao et al. Syntactic and lexical constraint in prosodic segmentation and grouping
Spiliotopoulos et al. Acoustic rendering of data tables using earcons and prosody for document accessibility

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100114

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120822

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120911