JP6916155B2 - 多言語植字の表示方法、表示装置、端末及びコンピュータ読み取り可能な記憶媒体 - Google Patents

多言語植字の表示方法、表示装置、端末及びコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP6916155B2
JP6916155B2 JP2018194018A JP2018194018A JP6916155B2 JP 6916155 B2 JP6916155 B2 JP 6916155B2 JP 2018194018 A JP2018194018 A JP 2018194018A JP 2018194018 A JP2018194018 A JP 2018194018A JP 6916155 B2 JP6916155 B2 JP 6916155B2
Authority
JP
Japan
Prior art keywords
language text
subject
text
content
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018194018A
Other languages
English (en)
Other versions
JP2019128943A (ja
Inventor
チウゲン シャオ,
チウゲン シャオ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2019128943A publication Critical patent/JP2019128943A/ja
Application granted granted Critical
Publication of JP6916155B2 publication Critical patent/JP6916155B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

本発明は、情報技術分野に関し、特に多言語植字の表示方法、表示装置、ブラウザ、端末及びコンピュータ読み取り可能な記憶媒体に関する。
現在、多言語植字するテキストにおいて、例えば、中国と英語とが混植されるテキストにおいて、中国語の漢字間にスペースという単語を区切る符号がないが、英語の単語間にはスペースという単語を区切る符号が存在し、且つ単語の文字列の長さが異なるため中国語−英語が混植される場合に、文書の閲覧及び編集の歴史で、植字における文字間隔の歪みという問題があり、レイアウトが揃っていなく、美観にならなく、多言語植字のフロントエンド表示の効果に悪影響を与える。特に移動端のアプリケーションでは、画面が小さいため、この欠点がより目立っており、文字間隔の歪みという問題がさらに顕著で、ユーザの閲覧体験に影響する。
従来技術における上記の技術的課題を解決するために、本発明は、多言語植字の表示方法、表示装置、ブラウザ、端末及びコンピュータ読み取り可能な記憶媒体を提供する。
本発明の第1態様として、植字待機のテキストを取得するステップと、前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツは、前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語のコンテンツを含むステップと、前記埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが前記埋め込み言語コンテンツに対応する主体言語テキスト、又は埋め込み言語コンテンツにおける非主体言語テキストの略語を含むステップと、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換えるステップとを含む多言語植字の表示方法を提供する。
上記態様においては、前記植字待機のテキストの前記主体言語テキストにおける前記埋め込み言語コンテンツを識別するステップは、前記主体言語テキストには、非主体言語テキストとそれに対応する主体言語テキストとからなる第1単語対が存在するか否かを識別するステップを含み、前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、前記第1単語対における前記主体言語テキストを前記置き換えコンテンツとして決定するステップを含んでいてもよい。
また、上記態様においては、前記主体言語テキストには前記第1単語対が存在するか否かを識別するステップは、前記主体言語テキストにおける非主体言語テキストを識別するステップと、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別するステップとを含んでいてもよい。
また、上記態様においては、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別するステップは、前記非主体言語テキストを主体言語テキストに翻訳し、又は隣接する前記主体言語テキストを非主体言語テキストに翻訳するステップと、前記非主体言語テキストと前記隣接する主体言語テキストとのマッチング度合いを判断し、該マッチング度合いは、前記翻訳結果に基づいて判断された編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含むステップと、前記マッチング度合いに基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成する確率を算出するステップと、前記確率に基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを決定するステップとを含んでいてもよい。
また、上記態様においては、前記編集距離データは、翻訳された前記テキストと隣接する前記テキストとの編集距離、又は該編集距離が翻訳された前記テキストの長さを占める比率を含んでいてもよい。
また、上記態様においては、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別するステップは、機械翻訳コーパスにより、ニューラルネットワーク機械モデルを用いて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別するステップを含んでいてもよい。
また、上記態様においては、前記植字待機のテキストの前記主体言語テキストにおける前記埋め込み言語コンテンツを識別するステップは、前記主体言語テキストには、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとからなる第2単語対が存在するか否かを識別するステップを含み、前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、前記第2単語対における前記非主体言語テキストの略語を前記置き換えコンテンツとして決定するステップを含んでいてもよい。
また、上記態様においては、前記主体言語テキストには前記第2単語対が存在するか否かを識別するステップは、前記主体言語テキストにおける前記非主体言語テキストを識別するステップと、先頭アルファベットの判断により、前記非主体言語テキストが前記第2単語対に属するか否かを識別するステップとを含んでいてもよい。
また、上記態様においては、前記植字待機のテキストの前記主体言語テキストにおける前記埋め込み言語コンテンツを識別するステップは、前記主体言語テキストには、単語対を構成せずに独立して存在する個別の前記非主体言語テキストが存在するか否かを識別するステップを含み、前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、個別の前記非主体言語テキストを主体言語テキストに翻訳して、翻訳された該主体言語テキストを前記置き換えコンテンツとして決定するステップを含んでいてもよい。
また、上記態様においては、前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、翻訳された前記主体言語テキストには二つ以上の翻訳結果が存在する場合に、二つ以上の該翻訳結果と個別の前記非主体言語テキストのコンテキストとの関連度を判断するステップと、関連度が最も大きい前記翻訳結果を個別の前記非主体言語テキストに対応する前記主体言語テキストとして決定するステップとを含む。
また、上記態様においては、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換えるステップの後に、前記置き換えコンテンツにヒントマークを設定し、設定された該ヒントマークが、予め設定された前記置き換えコンテンツのフォント及び/又は予め設定された前記置き換えコンテンツのマーク符号を含むステップと、予め設定された操作動作に応じて、前記置き換えコンテンツに対応する前記埋め込み言語コンテンツを表示するステップとを含んでいてもよい。
本発明の第2態様として、取得ユニットと、識別ユニットと、決定ユニットと、置き換えユニットとを備え、前記取得ユニットが、植字待機のテキストを取得し、前記識別ユニットが、前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツが前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語のコンテンツを含み、前記決定ユニットが、前記埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが、前記埋め込み言語コンテンツに対応する主体言語テキスト、又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含み、前記置き換えユニットが、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換える多言語植字の表示装置を提供する。
上記態様においては、前記識別ユニットは、前記主体言語テキストには、非主体言語テキストとそれに対応する主体言語テキストとからなる第1単語対が存在するか否かを識別するための第1識別サブユニットを備え、前記決定ユニットは、前記第1単語対における前記主体言語テキストを前記置き換えコンテンツとして決定するための第1決定サブユニットを備えていてもよい。
また、上記態様においては、前記第1識別サブユニットは、前記主体言語テキストにおける前記非主体言語テキストを識別するためのテキスト識別サブユニットと、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別するための翻訳識別サブユニットとを備えていてもよい。
また、上記態様においては、前記翻訳識別サブユニットは、前記非主体言語テキストを前記主体言語テキストに翻訳し、又は隣接する前記主体言語テキストを前記非主体言語テキストに翻訳し、前記非主体言語テキストと隣接する前記主体言語テキストとのマッチング度合いを判断し、該マッチング度合いは、前記翻訳結果に基づいて判断された編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含み、前記マッチング度合いに基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成する確率を算出し、前記確率に基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを決定してもよい。
また、上記態様においては、前記編集距離データが、翻訳された前記テキストと隣接する前記テキストとの編集距離、又は該編集距離が翻訳された前記テキストの長さを占める比率を含んでいてもよい。
また、上記態様においては、前記翻訳識別サブユニットは、機械翻訳コーパスにより、ニューラルネットワーク機械モデルを用いて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別してもよい。
また、上記態様においては、前記識別ユニットが、前記主体言語テキストには、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとからなる第2単語対が存在するか否かを識別するための第2識別サブユニットを備え、前記決定ユニットが、前記第2単語対における前記非主体言語テキストの略語を前記置き換えコンテンツとして決定するための第2決定サブユニットを備えていてもよい。
また、上記態様においては、前記第2識別サブユニットが、前記主体言語テキストにおける前記非主体言語テキストを識別し、先頭アルファベットの判断により、前記非主体言語テキストが前記第2単語対に属するか否かを識別してもよい。
また、上記態様においては、前記識別ユニットは、前記主体言語テキストには、単語対を構成せずに独立して存在する個別の前記非主体言語テキストが存在するか否かを識別するために用いられる第3識別サブユニットを備え、前記決定ユニットが、個別の前記非主体言語テキストを前記主体言語テキストに翻訳して、翻訳された該主体言語テキストを前記置き換えコンテンツとして決定するための第3決定サブユニットを備えていてもよい。
また、上記態様においては、前記第3決定サブユニットが、翻訳された前記主体言語テキストには二つ以上の翻訳結果が存在する場合に、二つ以上の該翻訳結果と個別の前記非主体言語テキストのコンテキストとの関連度を判断し、関連度が最も大きい前記翻訳結果を個別の前記非主体言語テキストに対応する前記主体言語テキストとして決定してもよい。
また、上記態様においては、インタラクションユニットを備え、該インタラクションユニットは、前記置き換えコンテンツにヒントマークを設定し、設定された該ヒントマークが、予め設定された前記置き換えコンテンツのフォント及び/又は予め設定された前記置き換えコンテンツのマーク符号を含み、予め設定された操作動作に応じて、前記置き換えコンテンツに対応する前記埋め込み言語コンテンツを表示してもよい。
参考例として、多言語植字の表示装置が、プロセッサ及びメモリを備え、該メモリは、多言語植字の表示装置が上記の第1態様における多言語植字のフロントエンド表示方法を実行するプログラムを記憶するように構成され、前記プロセッサは、前記メモリに記憶されるプログラムを実行するように構成されてもよい。
本発明の第3態様として、上記の多言語植字の表示装置を備えるブラウザを提供する。
本発明の第4態様として、少なくとも1つのプロセッサと、少なくとも1つのプログラムを記憶するための記憶装置とを備え、少なくとも1つの前記プログラムが少なくとも1つの前記プロセッサによって実行される場合に、少なくとも1つの前記プロセッサが上記第1態様におけるいずれかの多言語植字の表示方法を実現する端末を提供する。
本発明の第5態様として、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行される場合に、上記第1態様におけるいずれかの多言語植字の表示方法が実現されるコンピュータ読み取り可能な記憶媒体を提供する。
上記技術案における1つの技術案は、多言語植字のフロントエンド表示に発生する文字間隔の歪みを回避し、完全な多言語コンテンツを表示することができるだけでなく、ページの表示がより整然且つ美観になり、ユーザ体験を向上させるという利点や有益な効果を有する。
上記技術案における他の技術案は、編集距離が翻訳されたテキストの長さを占める比率を、非主体言語テキストと隣接する主体言語テキストとのマッチング度合いとすることを考慮することにより、単語対の判断の正確さがさらに向上するという利点や有益な効果を有する。
上記技術案におけるさらに他の技術案は、翻訳結果の曖昧さ解消の処理を行い、2つ以上の翻訳結果と個別の非主体言語テキストのコンテキストとの関連度を判断し、文の意味の一貫性を確保し、意味変更の可能性を減らすという利点や有益な効果を有する。
上記の概述は、単に説明の目的を果たすものであり、あらゆる方式で限定することを意図するものではない。上述した例示的な態様、実施形態及び特徴に加えて、図面及び以下の詳細な説明により、本発明のさらなる態様、実施形態及び特徴は、分かり易くなる。
図面において、別途な規定がない限り、複数の図面における同一の符号は、同一または類似する部品または要素を表す。これらの図面は、必ずしも比例した大きさで描かれているとは限らない。なお、これらの図面は、本発明に開示された一部の実施形態だけを示しており、本発明の範囲を限定するものではない。
本発明の一実施形態に係る多言語植字の表示方法の全体のブロック図である。 従来技術における多言語植字のテキストに文字間隔の歪みが発生するページの模式図である。 本発明の一実施形態に係る多言語植字の表示方法のフローチャートである。 本発明の一実施形態に係る多言語植字の表示方法における第1単語対の再構成及びインタラクション効果の模式図である。 本発明の一実施形態に係る多言語植字の表示方法における第1単語対を識別するフローチャートである。 本発明の一実施形態に係る多言語植字の表示方法の変形例を示すフローチャートである。 本発明の一実施形態に係る多言語植字の表示方法の第2単語対の再構成及びインタラクション効果の模式図である。 本発明の一実施形態に係る多言語植字の表示方法の他の変形例を示すフローチャートである。 本発明の一実施形態に係る多言語植字の表示方法における個別の非主体言語テキスト置き換えのフローチャートである。 本発明の一実施形態に係る多言語植字の表示装置の全体のブロック図である。 本発明の一実施形態に係る多言語植字の表示装置の概略構成図である。
以下に、例示する一部の実施形態を簡単に説明する。当業者であれば、本発明の主旨又は範囲から逸脱することなく、様々な異なる方式で記載の実施形態を修正することができる。従って、図面および説明は、本質的に例示するものであり、限定するものではない。
本発明の一実施形態に係る多言語植字の表示方法を提供する。図1は、本発明の一実施形態に係る多言語植字の表示方法の全体のブロック図である。図1に示されるように、本発明の一実施形態に係る多言語植字の表示方法は、植字待機のテキストを取得するステップS110と、植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、埋め込み言語コンテンツは、主体言語テキストに埋め込まれる少なくとも1種類の非主体言語のコンテンツを含むステップS120と、埋め込み言語コンテンツの置き換えコンテンツを決定し、置き換えコンテンツは、埋め込み言語コンテンツに対応する主体言語テキスト、又は埋め込み言語コンテンツにおける非主体言語テキストの略語を含むステップS130と、埋め込み言語コンテンツを置き換えコンテンツに置き換えるステップS140とを含む。
ここで、埋め込み言語コンテンツは、第1単語対、第2単語対又は個別の非主体言語テキストを含み、第1単語対は、非主体言語テキストとそれに対応する主体言語テキストとからなる単語対であり、第2単語対は、非主体言語テキストの略語とフルネームとからなる単語対であり、個別の非主体言語テキストは、単語対を構成せずに独立して存在する非主体言語テキストである。置き換えコンテンツは、埋め込み言語コンテンツに対応するページ適合コンテンツであり、主体言語テキスト、又は非主体言語テキストの略語を含む。
多言語植字のテキストにおいて、通常、母国語又はネイティブ言語が主体であるため、主体言語と呼ばれる。多くの場合、主体言語に少なくとも1種類の他の言語が埋め込まれており、例えば、中国語での英語の埋め込み、主体言語に埋め込まれた他の言語が埋め込み言語と呼ばれる。つまり、主体言語テキストと埋め込み言語テキストとの使用する言語が異なる。
多言語植字のテキストには、植字における文字間隔の歪みという問題が存在するため、レイアウトが不揃いで美観にならなく、多言語植字のプロントエンド表示の効果に影響を与える。特に移動端末での適用で、画面が小さいため、文字間隔の歪みという問題がさらに目立ち、ユーザの閲覧体験に影響し、ユーザが現在の対象(設計者に作り出された)の雰囲気で喜びと満足に浸っている状態が破壊される。
図2は、従来技術における多言語植字のテキストに文字間隔の歪みが発生するページの模式図である。図2に示されるように、矩形枠における英語文字には、文字間隔の歪みが発生している。ここで、左側の矩形枠では、第1単語対の場合であり、即ち、非主体言語テキストである「International Consortium of Investigative Journalists」とそれに対応する主体言語テキストである「国際ジャーナリスト調査連盟」とからなる単語対であり、右側の矩形枠では、第2単語対の場合であり、即ち、非主体言語テキストの略語である「FID」とフルネームである「Frechet Inception Distance」とからなる単語対である。
本実施形態において、文字間隔の歪みという問題を解決するために、埋め込み言語コンテンツを対応するページ適合コンテンツに置き換え、ページ適合コンテンツは、主体言語フロントエンド表示に適合する表示コンテンツであり、即ち、埋め込み言語コンテンツを対応する主体言語テキスト又は非主体言語テキストの略語に置き換える。例えば、中国語と英語とが混植されるテキストにおいて、長さの異なる英語単語を、対応する中国語文字テキスト又は英語の略語に置き換える。従って、多言語植字のフロントエンド表示に発生する文字間隔の歪みを回避し、ページの表示がさらに整然且つ美観になり、ユーザ体験を向上させる。
図3は、本発明の一実施形態に係る多言語植字の表示方法のフローチャートである。図3に示されるように、本発明の一実施形態に係る多言語植字の表示方法によれば、植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別するステップは、主体言語テキストには、非主体言語テキストと対応する主体言語テキストとからなる第1単語対が存在するか否かを識別する単語対単語対ステップS210を含み、埋め込み言語コンテンツの置き換えコンテンツを決定するステップは、第1単語対における主体言語テキストを置き換えコンテンツとして決定するステップS220を含む。
図4は、本発明の一実施形態に係る多言語植字の表示方法の第1単語対の再構成及びインタラクション効果の模式図である。図4に示されるように、再構成された後、第1単語対において、主体言語テキストである「国際ジャーナリスト調査連盟」のみが保留され、それに対応する非主体言語テキストである「International Consortium of Investigative Journalists」が秘匿されるとともに、主体言語テキストである「国際ジャーナリスト調査連盟」の後ろにヒントマーク1が設定されて、ここに秘匿された未読コンテンツがあることを表す。
本発明の一実施形態に係る多言語植字の表示方法によれば、主体言語テキストには第1単語対が存在するか否かを識別するステップは、主体言語テキストにおける非主体言語テキストを識別するステップと、翻訳により非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを識別するステップとを含む。英語と中国語との混植を例とし、一般的に、第1単語対を構成する英語テキストとそれに対応する中国語テキストとは、隣接するテキストであり、しかも、通常、中国語テキストに続く括弧内にあるのが英語テキストである。従って、括弧などの標識符号(小括弧、中括弧、大括弧又はダッシュなどを含む)により中国語−英語の単語対の識別を補助することができる。
図5は、本発明の一実施形態に係る多言語植字の表示方法における第1単語対を識別するフローチャートである。図5に示されるように、本発明の一実施形態に係る多言語植字の表示方法によれば、翻訳により非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを識別するステップは、非主体言語テキストを主体言語テキストに翻訳し、又は隣接する主体言語テキストを非主体言語テキストに翻訳するステップS310と、非主体言語テキストと隣接する主体言語テキストとのマッチング度合いを判断し、マッチング度合いは、翻訳結果に基づいて判断された編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含むステップS320と、マッチング度合いに基づいて、非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成する確率を算出するステップS330と、確率に基づいて、非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを決定するステップS340とを含む。
本実施形態において、英語を中国語に翻訳し、又は中国語を英語に翻訳して、二者が中国語−英語の単語対である確率を算出する。その具体的な技術上での実現は、同一の言語に翻訳すること、及び編集距離、単語ベクトル類似度、テキストでの共起回数等の特徴により判定することができる。
ここで、単語ベクトルは、言語における単語を数学化する方式であり、自然言語が機械学習におけるアルゴリズムにより処理されるために、通常、まず言語を数学化する必要がある。例えば、最も簡単な単語ベクトルの方式は、1つの非常に長いベクトルで1つの単語を表し、ベクトルの長さは、辞書の大きさであり、ベクトルの成分は1つの1しかなく、それ以外はすべて0であり、1の位置は、当該単語の辞書における位置に対応する。コーパス訓練単語ベクトルモデルを用いて単語の類似度を算出することができる。
本実施形態において、上記特徴(編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含む)を組み合わせて、上記特徴により、機械学習モデルを用いて単語対であるか否かを識別する。
本発明の一実施形態に係る多言語植字の表示方法によれば、編集距離データは、翻訳されたテキストと隣接するテキストとの編集距離、又は編集距離が翻訳されたテキストの長さを占める比率を含む。編集距離とは、2つの文字列の間で一方から他方への変換に必要な最少編集操作回数を意味し、許可される編集操作は、1つの文字を他の文字に置き換えること、1つの文字を挿入すること、及び1つの文字を削除することを含む。
通常、編集距離が小さいほど、二つの文字列の類似度が大きい。本実施形態において、具体的な判定モデルは限定されず、編集距離特徴に基づいて両者が中国語−英語の単語対である確率を算出し、又はその延びる特徴、例えば、編集距離が元のセグメントの長さを占める比率に基づいて、回帰モデルで1つの類似度を算出して判定することができる。
単に編集距離を用いて二つの単語のマッチング度合いを判定するのは、充分に正確ではなく、これは、場合によっては編集距離が長い、類似度が低いからではなく、テキスト自体の長さが長いからである。編集距離が翻訳されたテキストの長さを占める比率を、非主体言語テキストと隣接する主体言語テキストとのマッチング度合いとすることを考慮することにより、単語対判断の正確さがさらに向上する。
本発明の一実施形態に係る多言語植字の表示方法によれば、翻訳により非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを識別するステップは、機械翻訳コーパスにより、ニューラルネットワーク機械モデルを用いて、非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを識別するステップを含む。
本実施形態において、ニューラルネットワークにより中国語と英語との類似度を直接的に学習し、機械翻訳コーパスにより、テキストアライメント関係を発掘することができる。バイリンガルテキストアライメントは、バイリンガルコーパスで原言語と目的言語との同一言語単位間の対応関係を構築し、即ち、原言語テキスト中のどの(どれの)言語単位と目的言語テキスト中のどの(どれの)言語単位とは、互いに翻訳関係であるかを決定する。ニューラルネットワークの学習方式で、原言語セグメントと目的言語系列とを入力とし、対応する類似度をフィッティングする。
図6は、本発明の一実施形態に係る多言語植字の表示方法の変形例を示すフローチャートである。図6に示されるように、本発明の一実施形態に係る多言語植字の表示方法によれば、植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別するステップは、主体言語テキストには、非主体言語テキストの略語と非主体言語テキストのフルネームとからなる第2単語対が存在するか否かを識別するステップS410を含み、埋め込み言語コンテンツの置き換えコンテンツを決定するステップは、第2単語対における非主体言語テキストの略語を置き換えコンテンツとして決定するステップS420を含む。
図7は、本発明の一実施形態に係る多言語植字の表示方法における第2単語対の再構成及びインタラクション効果の模式図である。図7に示されるように、再構成された後、第2単語対において、非主体言語テキスト略語である「FID」のみが保留され、それに対応する非主体言語テキストフルネームである「Frechet Inception Distance」が秘匿されるとともに、非主体言語テキスト略語である「FID」の後ろに、ヒントマーク1が設定されて、ここに秘匿された未読コンテンツがあることを表す。
本発明の一実施形態に係る多言語植字の表示方法によれば、主体言語テキストには第2単語対が存在するか否かを識別するステップは、主体言語テキストにおける非主体言語テキストを識別するステップと、先頭アルファベットの判断により、非主体言語テキストが第2単語対に属するか否かを識別するステップとを含む。
英語と中国語との混植を例とし、第2単語対を構成する非主体言語テキスト略語とフルネームとについて、一般的に、非主体言語テキストの略語に続く括弧内にあるのが非主体言語テキストのフルネームである。従って、括弧などの標識符号(小括弧、中括弧、大括弧又はダッシュなどを含む)により非主体言語テキスト略語とフルネームとの識別を補助することができる。
図8は、本発明の一実施形態に係る多言語植字の表示方法の他の変形例を示すフローチャートである。図8に示されるように、本発明の一実施形態に係る多言語植字の表示方法によれば、植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別するステップは、主体言語テキストには、単語対を構成せずに独立して存在する個別の非主体言語テキストが存在するか否かを識別するステップS510を含み、埋め込み言語コンテンツの置き換えコンテンツを決定するステップは、個別の非主体言語テキストを主体言語テキストに翻訳して、翻訳された主体言語テキストを置き換えコンテンツとして決定するステップS520を含む。
本実施形態において、埋め込み言語コンテンツが単語対の形ではなく、独立して存在する非主体言語テキストで現れるのであれば、埋め込み言語コンテンツを翻訳された対応する主体言語テキストに直接に置き換える。
図9は、本発明の一実施形態に係る多言語植字の表示方法における個別の非主体言語テキスト置き換えのフローチャートである。図9に示されるように、本発明の一実施形態に係る多言語植字の表示方法によれば、埋め込み言語コンテンツの置き換えコンテンツを決定するステップは、翻訳された主体言語テキストには二つ以上の翻訳結果が存在する場合に、二つ以上の翻訳結果と個別の非主体言語テキストのコンテキストとの関連度を判断するステップS620と、関連度が最も大きい翻訳結果を個別の非主体言語テキストに対応する主体言語テキストとして決定するステップS630とを含む。
本実施形態において、英語を中国語に翻訳するとともに、曖昧さ解消の判断を行い、例えば、1つの英語単語は、中国語に対応する異なる翻訳結果を有し(例えば、UPSが「無停電電源装置」の略語であるとともに、パリ第11大学の略語でもある)、異なる翻訳結果とコンテキストとの関連度を判断することにより、曖昧さを解消し、文の意味の一貫性を確保し、意味変更の可能性を減らす。
本発明の一実施形態に係る多言語植字の表示方法によれば、埋め込み言語コンテンツを置き換えコンテンツに置き換えるステップの後に、置き換えコンテンツにヒントマークを設定し、ヒントマークは、予め設定された置き換えコンテンツのフォント及び/又は予め設定された置き換えコンテンツのマーク符号を含むステップと、予め設定された操作動作に応じて、置き換えコンテンツに対応する埋め込み言語コンテンツを表示し、予め設定された操作動作は、ページ適合コンテンツ又はマーク符号をクリック又は長押しすることを含むステップとを含む。
本実施形態において、フロントエンド技術の動的インタラクションに基づいて、APPフローティングレイヤーコントロール又はHTML(HyperText Markup Language,ハイパーテキストテキストマークアップ言語)を用いて開発されたjavascriptスクリプトによりフロントエンドインタラクションフォームを完成させ、フロントエンドインタラクションフォームを完成させ、クリック又は長押しに応答する操作を実現し、中国語に対応する英語情報の効果を表示する。
図4において、主体言語テキストである「国際ジャーナリスト調査連盟」の後ろにヒントマーク1が設定されており、図7において、非主体言語テキストである略語「FID」の後ろにヒントマーク1が設定されており、ここに秘匿された未読コンテンツがあることを表し、ヒントマーク1をクリック又は長押しすれば、秘匿された埋め込まれた非主体言語のコンテンツを表示することができ、図4及び図7において、インタラクション後のページ効果が示されている。
また、ヒントマークは、例えば、フォント色のヒント、イタリックのヒント又は下線フォントのヒントのような予め設定されたページ適合コンテンツのフォントであってもよいし、又はヒントを目立たせる作用を奏するために複数のフォント方式の組み合わせであってもよい。具体的なヒントマークのフォントのテキストをクリック又は長押しすれば、秘匿された埋め込まれた非主体言語のコンテンツを表示することができる。
本実施形態においては、多言語植字のフロントエンド表示における文字間隔の歪みを回避し、完全な多言語コンテンツを表示することができるだけではなく、ページの表示がより整然且つ美観になり、ユーザ体験を向上させることができる。
本発明の一実施形態に係る多言語植字の表示方法に用いる多言語植字の表示装置を提供する。図10は、本発明の一実施形態に係る多言語植字の表示装置の全体のブロック図である。図10に示されるように、本発明の一実施形態に係る多言語植字の表示装置は、取得ユニット105と、識別ユニット100と、決定ユニット200と、置き換えユニット300とを備える。
取得ユニット105は、植字待機のテキストを取得する。
識別ユニット100は、植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、埋め込み言語コンテンツは、主体言語テキストに埋め込まれる少なくとも1種類の非主体言語のコンテンツを含む。
決定ユニット200は、埋め込み言語コンテンツの置き換えコンテンツを決定し、置き換えコンテンツは、埋め込み言語コンテンツに対応する主体言語テキスト又は埋め込み言語コンテンツにおける非主体言語テキストの略語を含む。
置き換えユニット300は、埋め込み言語コンテンツを置き換えコンテンツ、即ち対応するページ適合コンテンツに置き換え、埋め込み言語コンテンツは、第1単語対、第2単語対又は個別の非主体言語テキストを含む。第1単語対は、非主体言語テキストとそれに対応する主体言語テキストとからなる単語対であり、第2単語対は、非主体言語テキストの略語とフルネームとからなる単語対であり、個別の非主体言語テキストは、単語対を構成せずに独立して存在する非主体言語テキストであり、対応するページ適合コンテンツは、主体言語テキスト、又は非主体言語テキストの略語を含む。
図11は、本発明の一実施懈怠に係る多言語植字の表示装置の概略構成図である。図11に示されるように、本発明の一実施形態に係る多言語植字の表示装置によれば、識別ユニット100は、主体言語テキストには第1単語対が存在するか否かを識別するための第1識別サブユニット110を備え、第1単語対は、非主体言語テキストとそれに対応する主体言語テキストとからなる単語対である。決定ユニット200は、第1単語対における主体言語テキストを置き換えコンテンツとして決定するための第1決定サブユニット210を備える。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、第1識別サブユニット110は、主体言語テキストにおける非主体言語テキストを識別するためのテキスト識別サブユニット112と、翻訳により非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを識別するための翻訳識別サブユニット114とを備える。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、翻訳識別サブユニット114は、非主体言語テキストを主体言語テキストに翻訳し、又は隣接する主体言語テキストを非主体言語テキストに翻訳し、非主体言語テキストと隣接する主体言語テキストとのマッチング度合いを判断し、マッチング度合いは、翻訳結果に基づいて判断された編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含み、マッチング度合いに基づいて、非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成する確率を算出し、確率に基づいて、非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを決定する。
本実施形態において、上記特徴(編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含む)を組み合わせて、上記特徴により、機械学習モデルを用いて単語対であるか否かを識別する。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、編集距離データは、翻訳されたテキストと隣接するテキストとの編集距離、又は編集距離が翻訳されたテキストの長さを占める比率を含む。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、翻訳識別サブユニット114は、機械翻訳コーパスにより、ニューラルネットワーク機械モデルを用いて非主体言語テキストとそれに隣接する主体言語テキストとが第1単語対を構成するか否かを識別する。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、識別ユニット100は、主体言語テキストには第2単語対が存在するか否かを識別するための第2識別サブユニット120を備え、第2単語対は、非主体言語テキストの略語と非主体言語テキストのフルネームとからなる単語対である。決定ユニット200は、第2単語対における非主体言語テキストの略語を置き換えコンテンツとして決定するための第2決定サブユニット220を備える。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、第2識別サブユニット120は、主体言語テキストにおける非主体言語テキストを識別し、先頭アルファベットの判断により、非主体言語テキストが第2単語対に属するか否かを識別する。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、識別ユニット100は、主体言語テキストには個別の非主体言語テキストが存在するか否かを識別するための第3識別サブユニット130を備え、個別の非主体言語テキストは、単語対を構成せずに独立して存在する非主体言語テキストである、決定ユニット200は、個別の非主体言語テキストを主体言語テキストに翻訳して、翻訳された主体言語テキストを置き換えコンテンツとして決定するための第3決定サブユニット230を備える。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、第3決定サブユニット230は、翻訳された主体言語テキストには二つ以上の翻訳結果がある場合に、二つ以上の翻訳結果と個別の非主体言語テキストのコンテキストとの関連度を判断し、関連度が最も大きい翻訳結果を個別の非主体言語テキストに対応する主体言語テキストとして決定する。
本発明の一実施形態に係る多言語植字のフロントエンド表示装置によれば、多言語植字のフロントエンド表示装置は、インタラクションユニット400を備え、インタラクションユニット400は、置き換えコンテンツにヒントマークを設定し、ヒントマークは、予め設定された置き換えコンテンツのフォント、及び/又は予め設定された置き換えコンテンツのマーク符号を含み、予め設定された操作動作に応じて、置き換えコンテンツに対応する埋め込み言語コンテンツを表示し、予め設定された操作動作は、ページ適合コンテンツ又はマーク符号をクリック又は長押しすることを含む。
なお、本発明においては、多言語植字のフロントエンド表示装置が、プロセッサ及びメモリを備えていてもよい。
この場合、メモリは、多言語植字をサポートするフロントエンド表示装置が本実施形態に係る多言語植字のフロントエンド表示方法を実行するプログラムを記憶するように構成される。また、プロセッサは、メモリに記憶されたプログラムを実行するように構成される。
また、本発明においては、本実施形態に係る多言語植字のフロントエンド表示装置を備えるブラウザを提供してもよい。
また、本発明においては、少なくとも1つのプロセッサと、少なくとも1つのプログラムを記憶するための記憶装置とを備える端末を提供してもよい。この場合、少なくとも1つのプログラムが少なくとも1つのプロセッサに実行される場合に、少なくとも1つのプロセッサが本実施形態に係る多言語植字の表示方法を実現する。
また、本発明においては、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体を提供してもよい。この場合、プログラムがプロセッサに実行される場合に、本実施形態に係る多言語植字の表示方法が実現される。
上記の技術案における一技術案は、多言語植字のフロントエンド表示に発生する文字間隔の歪みを回避し、完全な多言語コンテンツを表示することができるだけではなく、ページの表示がより整然で美観になり、ユーザの体験を向上させるという利点や有益な効果を有する。
上記技術案における他の技術案は、編集距離が翻訳されたテキストの長さを占める比率を、非主体言語テキストと隣接する主体言語テキストとのマッチング度合いとすることを考慮することにより、単語対判断の正確さがさらに向上するという利点や有益な効果を有する。
上記技術案におけるさらに他の技術案は、翻訳結果の曖昧さ解消の処理を行い、二つ以上の翻訳結果と個別の非主体言語テキストのコンテキストとの関連度を判断し、文の意味の一貫性を確保し、意味変更の可能性を減らすという利点や有益な効果を有する。
本発明の説明において、「一実施形態」、「変形例」、「一例」、「具体的な例」、又は「一部の実施例」などの用語を参照した説明とは、実施形態又は実施例に合わせて説明された具体的な特性、構成、材料又は特徴が、本発明の少なくとも一実施形態又は一例に含まれることを意味する。また、説明された具体的な特性、構成、材料又は特徴は、少なくとも1つの実施形態又は実施例において適切に結合することができる。なお、相互に矛盾しない場合、当業者は、本発明に説明された異なる実施形態又は実施例、及び異なる実施形態又は実施例の特徴を結合及び組み合わせることができる。
なお、「第1」、「第2」の用語は、単に目的を説明するためのものであり、比較的な重要性を指示又は暗示するか、又は示された技術的特徴の数を黙示的に指示するものであると理解されるものではない。そこで、「第1」、「第2」が限定されている特徴は、少なくとも1つの当該特徴を含むことを明示又は暗示するものである。本発明の説明において、明確且つ具体的な限定がない限り、「複数」とは、二つ以上を意味する。
フローチャートにおける、又はここで他の形態で記載された任意のプロセス又は方法は、カスタムロジック機能又はプロセスのステップを実現するための少なくとも1つの実行可能な命令コードを含むモジュール、セグメント又は一部を表すと理解されてもよい。また、本発明の好ましい実施形態の範囲は、ここで、示された又は論議された順番ではなく、係る機能に応じてほぼ同時の形態又は逆の順番で機能を実行することができる他の実現を含むことができる。これは、当業者であれば理解することができる。
フローチャートで示された又はここで他の形態で説明されたロジック及び/又はステップは、例えば、ロジック機能を実現するための実行可能な命令の順番付けられたリストと見なすことができ、任意のコンピュータ読み取り可能な記憶媒体に具体的に実装され、命令実行システム、装置、又はデバイス(例えばコンピュータに基づいたシステム、プロセッサを含むシステム、又は他の命令実行システム、装置又はデバイスから命令を獲得して命令を実行するシステム)に利用されるか、又はこれらの命令実行システム、装置又はデバイスと組み合わせて利用される。
本願明細書において、「コンピュータ読み取り可能な記憶媒体」は、命令実行システム、装置又はデバイスによって、又は、命令実行システム、装置又はデバイスと組み合わせて使用するためのプログラムを含む、格納する、通信する、伝播する、又は伝送することができる任意の装置であってもよい。
コンピュータ読み取り可能な記憶媒体のより具体的な例(非限定的なリスト)として、少なくとも1つの配線を備える電気接続部(電子デバイス)、ポータブルコンピュータディスクカートリッジ(磁気デバイス)、ランダムアクセスメモリ(RAM)読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバデバイス、及びポータブルコンパクトディスク読み出し専用リメモリ(CDROM)を含む。
また、コンピュータ読み取り可能な記憶媒体は、プログラムが印刷され得る紙又は他の適切な媒体であってもよく、例えば、紙や他の媒体を光学的スキャンし、次に編集し、解釈し、又は必要な場合に他の適切な形態で処理してプログラムを電子的に取得して、そしてコンピュータメモリに格納するからである。
なお、本発明の各部分は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって実現することができる。上記実施形態において、複数のステップ又は方法は、メモリに記憶された且つ適切な命令実行システムによって実行されるソフトウェア又はファームウェアによって実現することができる。
例えば、ハードウェアで実現される場合に、他の実施形態と同様に、本分野において周知である、データ信号に対してロジック機能を実現するためのロジックゲート回路を備える離散ロジック回路、適切な組み合わせロジックゲート回路を備える特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)などの当分野の周知技術のうちいずれか1つ又はこれらの組み合わせによって実現することができる。
普通の当業者であれば、上記の実施形態に係る表示方法に含まれる全部又は一部のステップは、プログラムによってハードウェアを命令することで実行することができると理解することができる。プログラムは、コンピュータ読み取り可能な記憶媒体に格納することができ、プログラムが実行される場合に、本実施形態の表示方法におけるステップの1つ又はそれらの組み合わせが実行される。ここで、本実施形態の表示装置は、表示方法の実施形態に対応しているため、表示装置の実施形態の説明が簡略であり、関連説明については、表示方法の実施形態の説明を参照することができる。
また、本発明の実施形態における各機能ユニットは、1つの処理モジュールに集積されてもよいし、それぞれが個別の物理的存在であってもよいし、2つ以上のユニットが1つのモジュールに集積されてもよい。集積モジュールは、ハードウェアの形態で実現されてもよいし、ソフトウェア機能モジュールの形態で実現されてもよい。集積モジュールがソフト機能モジュールの形態で実現されるとともに、独立した製品として販売又は使用される場合に、1つのコンピュータ読み取り可能な記憶媒体に記憶されてもよい。記憶メディアは、読み出し専用メモリ、磁気ディスク又はCDなどであってもよい。
以上の記載は、本発明の具体的な実施形態に過ぎず、本発明の範囲はこれに限定されるものではなく、当業者であれば、本発明が開示した技術範囲において、様々な変更または置換を容易に想到することができ、これらは、すべて本発明の範囲内に含まれるべきである。したがって、本発明の保護範囲は、請求の範囲によって定義される。

Claims (18)

  1. 多言語植字の表示装置に適用される多言語植字の表示方法であって、
    前記多言語植字の表示装置が、植字待機のテキストを取得するステップと
    前記多言語植字の表示装置が、使用する言語の種類の異なりに基づいて前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツは、前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語の非主体言語テキスト、又は、該非主体言語テキスト及びそれに隣接し対応する主体言語テキストであるステップと、
    前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて当該埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが前記埋め込み言語コンテンツに対応する主体言語テキスト、又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含むステップと、
    前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換えるステップとを含み、
    前記多言語植字の表示装置が、使用する言語の種類の異なりに基づいて前記植字待機のテキストの前記主体言語テキストにおける前記埋め込み言語コンテンツを識別するステップは、
    前記多言語植字の表示装置が、前記主体言語テキストにおける非主体言語テキストを識別するステップと、
    前記多言語植字の表示装置が、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが第1単語対を構成するか否かを識別するステップとを含み、
    前記第1単語対は、前記非主体言語テキストとそれに対応する主体言語テキストとからなり、
    前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、前記多言語植字の表示装置が、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成すると識別した場合、前記第1単語対における前記主体言語テキストを前記置き換えコンテンツとして決定するステップを含む多言語植字の表示方法。
  2. 多言語植字の表示装置に適用される多言語植字の表示方法であって、
    前記多言語植字の表示装置が、植字待機のテキストを取得するステップと
    前記多言語植字の表示装置が、使用する言語の種類の異なりに基づいて前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツは、前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語の非主体言語テキスト、又は、該非主体言語テキスト及びそれに隣接し対応する主体言語テキストであるステップと、
    前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて当該埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが前記埋め込み言語コンテンツに対応する主体言語テキスト、又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含むステップと、
    前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換えるステップとを含み、
    前記多言語植字の表示装置が、使用する言語の種類の異なりに基づいて前記植字待機のテキストの前記主体言語テキストにおける前記埋め込み言語コンテンツを識別するステップは、
    前記多言語植字の表示装置が、前記主体言語テキストにおける前記非主体言語テキストを識別するステップと、
    前記多言語植字の表示装置が、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとの先頭アルファベットが同じであるか否かを判断することにより、前記非主体言語テキストが第2単語対に属するか否かを識別するステップとを含み、
    前記第2単語対は、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとからなり、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとは、小括弧、中括弧、大括弧又はダッシュを含む標識符号により識別され、
    前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、前記多言語植字の表示装置が、前記非主体言語テキストが前記第2単語対に属すると識別した場合、前記第2単語対における前記非主体言語テキストの略語を前記置き換えコンテンツとして決定するステップを含む多言語植字の表示方法。
  3. 多言語植字の表示装置に適用される多言語植字の表示方法であって、
    前記多言語植字の表示装置が、植字待機のテキストを取得するステップと
    前記多言語植字の表示装置が、使用する言語の種類の異なりに基づいて前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツは、前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語の非主体言語テキスト、又は、該非主体言語テキスト及びそれに隣接し対応する主体言語テキストであるステップと、
    前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて当該埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが前記埋め込み言語コンテンツに対応する主体言語テキスト、又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含むステップと、
    前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換えるステップとを含み、
    前記多言語植字の表示装置が、使用する言語の種類の異なりに基づいて前記植字待機のテキストの前記主体言語テキストにおける前記埋め込み言語コンテンツを識別するステップは、
    前記多言語植字の表示装置が、前記主体言語テキストにおける前記非主体言語テキストを識別するステップと、
    前記多言語植字の表示装置が、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが第1単語対を構成するか否かを識別するとともに前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとの先頭アルファベットが同じであるか否かを判断することにより前記非主体言語テキストが第2単語対に属するか否かを識別し、前記主体言語テキストには、前記第1単語対及び前記第2単語対を構成せずに独立して存在する個別の前記非主体言語テキストが存在するか否かを識別するステップとを含み、
    前記第1単語対は、前記非主体言語テキストとそれに対応する主体言語テキストとからなり、前記第2単語対は、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとからなり、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとは、小括弧、中括弧、大括弧又はダッシュを含む標識符号により識別され、
    前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、前記多言語植字の表示装置が、前記主体言語テキストには個別の前記非主体言語テキストが存在すると識別した場合、個別の前記非主体言語テキストを主体言語テキストに翻訳して、翻訳された該主体言語テキストを前記置き換えコンテンツとして決定するステップを含む多言語植字の表示方法。
  4. 前記多言語植字の表示装置が、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが第1単語対を構成するか否かを識別するステップは、
    前記多言語植字の表示装置が、前記非主体言語テキストを主体言語テキストに翻訳し、又は隣接する前記主体言語テキストを非主体言語テキストに翻訳するステップと、
    前記多言語植字の表示装置が、前記非主体言語テキストと隣接する前記主体言語テキストとのマッチング度合いを判断し、該マッチング度合いは、翻訳結果に基づいて判断された編集距離データ、単語ベクトルの類似度、及び/又はテキストでの共起回数を含むステップと、
    前記多言語植字の表示装置が、前記マッチング度合いに基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成する確率を算出するステップと、
    前記多言語植字の表示装置が、前記確率に基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを決定するステップとを含む請求項に記載の方法。
  5. 前記編集距離データは、翻訳された前記テキストと隣接する前記テキストとの編集距離、又は該編集距離が翻訳された前記テキストの長さを占める比率を含む請求項に記載の方法。
  6. 前記多言語植字の表示装置が、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが第1単語対を構成するか否かを識別するステップは、
    前記多言語植字の表示装置が、翻訳機械コーパスにより、ニューラルネットワーク機械モデルを用いて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別するステップを含む請求項に記載の方法。
  7. 前記多言語植字の表示装置が、識別された前記埋め込み言語コンテンツに基づいて前記埋め込み言語コンテンツの前記置き換えコンテンツを決定するステップは、
    翻訳された前記主体言語テキストには二つ以上の翻訳結果が存在する場合に、前記多言語植字の表示装置が、二つ以上の該翻訳結果と個別の前記非主体言語テキストのコンテキストとの関連度を判断するステップと、
    前記多言語植字の表示装置が、関連度が最も大きい前記翻訳結果を個別の前記非主体言語テキストに対応する前記主体言語テキストとして決定するステップとを含む請求項に記載の方法。
  8. 前記多言語植字の表示装置が、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換えるステップの後に、
    前記多言語植字の表示装置が、前記置き換えコンテンツにヒントマークを設定し、設定された該ヒントマークが、予め設定された前記置き換えコンテンツのフォント及び/又は予め設定された前記置き換えコンテンツのマーク符号を含むステップと、
    前記多言語植字の表示装置が、予め設定された操作動作に応じて、前記置き換えコンテンツに対応する前記埋め込み言語コンテンツを表示するステップとを含む請求項1から請求項のいずれかに記載の方法。
  9. 取得ユニットと、識別ユニットと、決定ユニットと、置き換えユニットとを備え、
    前記取得ユニットが、植字待機のテキストを取得し、
    前記識別ユニットが、使用する言語の種類の異なりに基づいて前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツが前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語の非主体言語テキスト、又は、該非主体言語テキスト及びそれに隣接し対応する主体言語テキストであり、
    前記決定ユニットが、識別された前記埋め込み言語コンテンツに基づいて当該埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが、該埋め込み言語コンテンツに対応する主体言語テキスト又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含み、
    前記置き換えユニットが、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換え
    前記識別ユニットは、前記主体言語テキストにおける前記非主体言語テキストを識別するためのテキスト識別サブユニットと、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが第1単語対を構成するか否かを識別するための翻訳識別サブユニットと、を有する第1識別サブユニットを備え、前記第1単語対は、前記非主体言語テキストとそれに対応する主体言語テキストとからなり、
    前記決定ユニットは、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成すると識別された場合、前記第1単語対における前記主体言語テキストを前記置き換えコンテンツとして決定するための第1決定サブユニットを備える多言語植字の表示装置。
  10. 取得ユニットと、識別ユニットと、決定ユニットと、置き換えユニットとを備え、
    前記取得ユニットが、植字待機のテキストを取得し、
    前記識別ユニットが、使用する言語の種類の異なりに基づいて前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツが前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語の非主体言語テキスト、又は、該非主体言語テキスト及びそれに隣接し対応する主体言語テキストであり、
    前記決定ユニットが、識別された前記埋め込み言語コンテンツに基づいて当該埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが、該埋め込み言語コンテンツに対応する主体言語テキスト又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含み、
    前記置き換えユニットが、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換え
    前記識別ユニットが、前記主体言語テキストにおける前記非主体言語テキストを識別し、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとの先頭アルファベットが同じであるか否かを判断することにより、前記非主体言語テキストが第2単語対に属するか否かを識別する第2識別サブユニットを備え、前記第2単語対は、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとからなり、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとは、小括弧、中括弧、大括弧又はダッシュを含む標識符号により識別され、
    前記決定ユニットが、前記非主体言語テキストが前記第2単語対に属すると識別された場合、前記第2単語対における前記非主体言語テキストの略語を前記置き換えコンテンツとして決定するための第2決定サブユニットを備える多言語植字の表示装置。
  11. 取得ユニットと、識別ユニットと、決定ユニットと、置き換えユニットとを備え、
    前記取得ユニットが、植字待機のテキストを取得し、
    前記識別ユニットが、使用する言語の種類の異なりに基づいて前記植字待機のテキストの主体言語テキストにおける埋め込み言語コンテンツを識別し、該埋め込み言語コンテンツが前記主体言語テキストに埋め込まれる少なくとも1種類の非主体言語の非主体言語テキスト、又は、該非主体言語テキスト及びそれに隣接し対応する主体言語テキストであり、
    前記決定ユニットが、識別された前記埋め込み言語コンテンツに基づいて当該埋め込み言語コンテンツの置き換えコンテンツを決定し、該置き換えコンテンツが、該埋め込み言語コンテンツに対応する主体言語テキスト又は前記埋め込み言語コンテンツにおける非主体言語テキストの略語を含み、
    前記置き換えユニットが、前記埋め込み言語コンテンツを前記置き換えコンテンツに置き換え
    前記識別ユニットが、前記主体言語テキストにおける前記非主体言語テキストを識別し、翻訳により前記非主体言語テキストとそれに隣接する前記主体言語テキストとが第1単語対を構成するか否かを識別するとともに前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとの先頭アルファベットが同じであるか否かを判断することにより前記非主体言語テキストが第2単語対に属するか否かを識別し、前記主体言語テキストには、前記第1単語対及び前記第2単語対を構成せずに独立して存在する個別の前記非主体言語テキストが存在するか否かを識別するための第3識別サブユニットを備え、前記第1単語対は、前記非主体言語テキストとそれに対応する主体言語テキストとからなり、前記第2単語対は、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとからなり、前記非主体言語テキストの略語と前記非主体言語テキストのフルネームとは、小括弧、中括弧、大括弧又はダッシュを含む標識符号により識別され、
    前記決定ユニットが、前記主体言語テキストには個別の前記非主体言語テキストが存在すると識別された場合、個別の前記非主体言語テキストを前記主体言語テキストに翻訳して、翻訳された該主体言語テキストを前記置き換えコンテンツとして決定するための第3決定サブユニットを備える多言語植字の表示装置。
  12. 前記翻訳識別サブユニットは、前記非主体言語テキストを前記主体言語テキストに翻訳し、又は隣接する前記主体言語テキストを前記非主体言語テキストに翻訳し、前記非主体言語テキストと隣接する前記主体言語テキストとのマッチング度合いを判断し、該マッチング度合いは、翻訳結果に基づいて判断された編集距離データ、単語ベクトルの類似度、及び/又は、テキストでの共起回数を含み、前記マッチング度合いに基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成する確率を算出し、前記確率に基づいて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを決定する請求項に記載の多言語植字の表示装置。
  13. 前記編集距離データが、翻訳された前記テキストと隣接する前記テキストとの編集距離、又は該編集距離が翻訳された前記テキストの長さを占める比率を含む請求項12に記載の多言語植字の表示装置。
  14. 前記翻訳識別サブユニットは、機械翻訳コーパスにより、ニューラルネットワーク機械モデルを用いて、前記非主体言語テキストとそれに隣接する前記主体言語テキストとが前記第1単語対を構成するか否かを識別する請求項に記載の多言語植字の表示装置。
  15. 前記第3決定サブユニットが、翻訳された前記主体言語テキストには二つ以上の翻訳結果が存在する場合に、二つ以上の該翻訳結果と個別の前記非主体言語テキストのコンテキストとの関連度を判断し、関連度が最も大きい前記翻訳結果を個別の前記非主体言語テキストに対応する前記主体言語テキストとして決定する請求項11に記載の多言語植字の表示装置。
  16. インタラクションユニットを備え、
    該インタラクションユニットは、前記置き換えコンテンツにヒントマークを設定し、設定された該ヒントマークが、予め設定された前記置き換えコンテンツのフォント及び/又は予め設定された前記置き換えコンテンツのマーク符号を含み、
    予め設定された操作動作に応じて、前記置き換えコンテンツに対応する前記埋め込み言語コンテンツを表示する請求項から請求項15のいずれかに記載の多言語植字の表示装置。
  17. 少なくとも1つのプロセッサと
    少なくとも1つのプログラムを記憶するための記憶装置とを備え、
    少なくとも1つの前記プログラムが少なくとも1つの前記プロセッサによって実行される場合に、少なくとも1つの前記プロセッサが請求項1から請求項のいずれかに記載の多言語植字の表示方法を実現する端末。
  18. コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータプログラムがプロセッサによって実行される場合に、請求項1から請求項のいずれかに記載の多言語植字の表示方法が実現されるコンピュータ読み取り可能な記憶媒体。
JP2018194018A 2018-01-22 2018-10-15 多言語植字の表示方法、表示装置、端末及びコンピュータ読み取り可能な記憶媒体 Active JP6916155B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810061020.8A CN108170660B (zh) 2018-01-22 2018-01-22 多语言排版的显示方法、装置、浏览器、终端及介质
CN201810061020.8 2018-01-22

Publications (2)

Publication Number Publication Date
JP2019128943A JP2019128943A (ja) 2019-08-01
JP6916155B2 true JP6916155B2 (ja) 2021-08-11

Family

ID=62515516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018194018A Active JP6916155B2 (ja) 2018-01-22 2018-10-15 多言語植字の表示方法、表示装置、端末及びコンピュータ読み取り可能な記憶媒体

Country Status (5)

Country Link
US (1) US10884771B2 (ja)
EP (1) EP3514701A1 (ja)
JP (1) JP6916155B2 (ja)
KR (1) KR102218248B1 (ja)
CN (1) CN108170660B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108984694B (zh) * 2018-07-04 2019-07-30 龙马智芯(珠海横琴)科技有限公司 网页的处理方法及装置、存储介质、电子装置
US11106873B2 (en) * 2019-01-22 2021-08-31 Sap Se Context-based translation retrieval via multilingual space
US11163953B2 (en) * 2019-06-12 2021-11-02 International Business Machines Corporation Natural language processing and candidate response evaluation
US11429789B2 (en) 2019-06-12 2022-08-30 International Business Machines Corporation Natural language processing and candidate response identification
CN111079396B (zh) * 2019-12-20 2023-06-16 方正国际软件(北京)有限公司 不规则单元格中文字排版方法及排版装置
CN111240962B (zh) * 2019-12-31 2023-09-05 中移(杭州)信息技术有限公司 测试方法、装置、计算机设备及计算机存储介质
CN112988297A (zh) * 2021-03-10 2021-06-18 深圳市创想三维科技有限公司 基于触摸屏的语言切换方法、装置、电子设备及存储介质
CN113569532B (zh) * 2021-09-22 2022-01-25 北京仁和汇智信息技术有限公司 一种html编辑方法、装置、电子设备及计算机可读存储介质
CN114330277B (zh) * 2021-12-31 2023-08-22 抖音视界有限公司 阅读排版方法、装置、设备和存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133853A (ja) * 1996-10-29 1998-05-22 Nippon Telegr & Teleph Corp <Ntt> 電子メール書換え方法及び装置
US6115686A (en) * 1998-04-02 2000-09-05 Industrial Technology Research Institute Hyper text mark up language document to speech converter
AU1473401A (en) * 1999-11-10 2001-06-06 Global Market Insite, Inc. Reporting and analyzing data from a multi-region research survey
WO2001082111A2 (en) * 2000-04-24 2001-11-01 Microsoft Corporation Computer-aided reading system and method with cross-language reading wizard
GB2366893B (en) * 2000-09-08 2004-06-16 Roke Manor Research Improvements in or relating to word processor systems or the like
US7266767B2 (en) * 2000-11-27 2007-09-04 Parker Philip M Method and apparatus for automated authoring and marketing
JP2003091344A (ja) * 2001-09-19 2003-03-28 Sony Corp 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
US6934908B2 (en) * 2001-10-17 2005-08-23 International Business Machines Corporation Uniform handling of external resources within structured documents
US7418652B2 (en) * 2004-04-30 2008-08-26 Microsoft Corporation Method and apparatus for interleaving parts of a document
US8661332B2 (en) * 2004-04-30 2014-02-25 Microsoft Corporation Method and apparatus for document processing
US8819541B2 (en) * 2009-02-13 2014-08-26 Language Technologies, Inc. System and method for converting the digital typesetting documents used in publishing to a device-specfic format for electronic publishing
US8312390B2 (en) * 2009-06-10 2012-11-13 Microsoft Corporation Dynamic screentip language translation
US20110144972A1 (en) * 2009-12-11 2011-06-16 Christoph Koenig Method and System for Generating a Localized Software Product
CA2801269A1 (en) * 2010-06-11 2011-12-15 Blueprint Growth Institute, Inc. Electronic document delivery, display, updating and interaction systems and methods
CN102455856A (zh) * 2010-10-27 2012-05-16 王博 一种句子的页面生成方法和设备
US9497184B2 (en) * 2011-03-28 2016-11-15 International Business Machines Corporation User impersonation/delegation in a token-based authentication system
CN109756287B (zh) * 2011-10-13 2020-12-29 三星电子株式会社 用于发送和接收多媒体服务的方法和装置
US9779063B1 (en) * 2013-03-15 2017-10-03 Not Invented Here LLC Document processor program having document-type dependent interface
JP6037041B2 (ja) 2013-10-18 2016-11-30 三菱電機株式会社 文字列表示装置
CN104102630B (zh) * 2014-07-16 2017-07-07 复旦大学 一种针对中文社交网络中中英文混合文本的规范方法
US10318614B2 (en) * 2015-07-01 2019-06-11 Tnq Books And Journals Private Limited Transformation of marked-up content into a file format that enables automated browser based pagination

Also Published As

Publication number Publication date
US20190227823A1 (en) 2019-07-25
CN108170660A (zh) 2018-06-15
US10884771B2 (en) 2021-01-05
EP3514701A1 (en) 2019-07-24
CN108170660B (zh) 2021-08-06
JP2019128943A (ja) 2019-08-01
KR20190095860A (ko) 2019-08-16
KR102218248B1 (ko) 2021-02-22

Similar Documents

Publication Publication Date Title
JP6916155B2 (ja) 多言語植字の表示方法、表示装置、端末及びコンピュータ読み取り可能な記憶媒体
Habash Introduction to Arabic natural language processing
US8903707B2 (en) Predicting pronouns of dropped pronoun style languages for natural language translation
US9772998B2 (en) Indicating and correcting errors in machine translation systems
US20120227009A1 (en) Navigable text user interface
US7801722B2 (en) Techniques for customization of phonetic schemes
CN103093252A (zh) 信息输出装置以及信息输出方法
WO2021000756A1 (zh) 英语文本的拼读标注方法、拼读方法、其装置、存储介质和电子设备
Mammadzada A review of existing transliteration approaches and methods
KR102552811B1 (ko) 클라우드 기반 문법 교정 서비스 제공 시스템
JP2010157065A (ja) 機械翻訳システム及び機械翻訳方法
US11126799B2 (en) Dynamically adjusting text strings based on machine translation feedback
US8275620B2 (en) Context-relevant images
Kottwitz LaTeX Beginner's Guide: Create visually appealing texts, articles, and books for business and science using LaTeX
US8847962B2 (en) Exception processing of character entry sequences
JP5483526B2 (ja) 機械翻訳システム及び機械翻訳方法
KR102556563B1 (ko) 텍스트 범위에 대한 폰트 갱신 방법 및 디바이스
Jancewicz et al. Cree syllabic fonts: development, compatibility and usage in the digital world
Khan Urdu and Digital Colonialism: Misrepresentation and Underrepresentation of the Language.
KR101291229B1 (ko) 교정부호 표시방법
KR20200041586A (ko) 마침표를 기준으로 영한 번역시스템
Cook et al. Foundation Html5 With Css3
Boitet Gradable quality translations through mutualization of human translation and revision, and UNL-based MT and coedition
KR20210119698A (ko) 부가 정보를 이용한 번역 방법 및 장치
Welsh A dictionary of Indonesian prepositional constructions: by Totok Suhardijanto & Miel Slager, Zenodo, 2019, 491 pp., online publication (free), available at https://zenodo. org/record/3515813#. Xn_3oUFS82x

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210409

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210409

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210511

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210715

R150 Certificate of patent or registration of utility model

Ref document number: 6916155

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150