JP2022549236A - 機械翻訳方法および電子デバイス - Google Patents

機械翻訳方法および電子デバイス Download PDF

Info

Publication number
JP2022549236A
JP2022549236A JP2022517924A JP2022517924A JP2022549236A JP 2022549236 A JP2022549236 A JP 2022549236A JP 2022517924 A JP2022517924 A JP 2022517924A JP 2022517924 A JP2022517924 A JP 2022517924A JP 2022549236 A JP2022549236 A JP 2022549236A
Authority
JP
Japan
Prior art keywords
content
user
translation
user interface
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022517924A
Other languages
English (en)
Inventor
文俊 ▲陸▼
尊▲偉▼ 柯
玉▲潔▼ 兀
勇 彭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2022549236A publication Critical patent/JP2022549236A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04808Several contacts: gestures triggering a specific function, e.g. scrolling, zooming, right-click, when the user establishes several contacts with the surface simultaneously; e.g. using several fingers or a combination of fingers and pen
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本出願は、機械翻訳方法および電子デバイスを提供し、人工知能(artificial intelligence、AI)、自然言語処理、および機械翻訳などの分野に関する。方法は、以下を含む。電子デバイスは、第1のユーザインターフェースを表示し、ソーステキストコンテンツが第1のユーザインターフェースに表示され、ユーザによりスクロールスクリーンショット撮影をトリガする操作を検出した後、電子デバイスは、スクロールスクリーンショットを自動的に撮影し始め、電子デバイスは、スクロールスクリーンショット撮影を通じて第1の写真を取得し、電子デバイスは、第1の写真に表示されたソーステキストコンテンツに対応する翻訳コンテンツを取得し、電子デバイスは、第2のユーザインターフェースを自動的に表示し、翻訳コンテンツの一部または全部が第2のユーザインターフェースに表示される。本出願の実施形態によれば、電子デバイス(たとえば、携帯電話などのインテリジェント端末デバイス)の知能が向上し、ユーザにより翻訳を閲覧するユーザ体験もまた向上できる。

Description

本出願は、2019年9月20日に中国国家知識産権局に出願され、「機械翻訳方法および電子デバイス」という名称の中国特許出願第201910895234.Xに対する優先権を主張し、この中国特許出願の全体が参照により本明細書に援用される。
本出願は、人工知能の分野に関し、より具体的には、機械翻訳方法および電子デバイスに関する。
現在、便利な翻訳サービスをユーザに提供するために、携帯電話、タブレットコンピュータ、およびパーソナルコンピュータ(personal computer, PC)などの複数のタイプの電子デバイスに、テキスト翻訳が広く適用されている。
テキスト翻訳は、単一写真ベースの翻訳方式を含む。外国の書籍のページを撮影するとき、または外国のニュースアプリケーション(application, APP)を閲覧するときにユーザが現在のインターフェースコンテンツを翻訳しようとするとき、ユーザは、翻訳結果を得るために、現在のインターフェースコンテンツのスクリーンショットを撮影し、次いでスクリーンショット撮影後に取得された写真を翻訳APPに入力する必要がある。ユーザが比較的長いニュース投稿を閲覧している場合、ユーザは常にニュースAPP内のスクリーンショットを撮影し、次いで翻訳結果を得るため対応する写真を入力するために翻訳APPに切り替える必要がある。ユーザは、このような繰り返し動作を通じて、外国のニュース投稿を読み終わることができる。このように、ユーザの操作は面倒であり、ユーザ体験は比較的乏しく、効率は比較的低い。
本出願は、機械翻訳方法および電子デバイスを提供し、電子デバイスの知能およびユーザ体験を向上させるための、人工知能の分野、自然言語処理、および機械翻訳の分野に関する。
第1の態様によれば、機械翻訳方法が提供される。方法は、タッチスクリーンを有する電子デバイスに適用され、方法は、以下を含む。電子デバイスは、タッチスクリーン上に第1のユーザインターフェースを表示する。第1のユーザインターフェースは第1のコンテンツを含み、第1のコンテンツの言語は第1の言語である。電子デバイスは、第1のユーザインターフェースにおいて第1の操作を検出する。第1の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む。第1の操作に応答して、電子デバイスは、第1のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影する。スクロールスクリーンショットプロセスでは、ユーザの第2の操作が第2のユーザインターフェースにおいて検出されると、または第2のユーザインターフェースのスクロールを通じて終了位置に到達すると、電子デバイスは、第2のユーザインターフェースの第2の位置でスクロールスクリーンショットの撮影を停止して、第1の写真を取得する。第1の写真は第2のコンテンツに対応する写真であり、第2のコンテンツは第1の位置から第2の位置までのコンテンツを含み、第2のコンテンツの言語は第1の言語である。電子デバイスは、第1の写真に基づいて、第2のコンテンツの翻訳結果を自動的に取得する。第2のコンテンツの翻訳結果の言語は第2の言語である。電子デバイスは、第2のコンテンツの翻訳結果の一部または全部を自動的に取得した後、第3のユーザインターフェースを自動的に表示する。第3のユーザインターフェースは、第2のコンテンツの翻訳結果の一部または全部を含む。
本出願のこの実施形態では、電子デバイス上のソーステキストコンテンツに対応する翻訳コンテンツを閲覧したいとき、電子デバイスが最初にスクロールスクリーンショットを撮影し、次いでスクロールスクリーンショット撮影を通じて取得されたソーステキストコンテンツに対応する翻訳コンテンツを取得するように、ユーザはスクロール翻訳をトリガするユーザ操作を実行し得る。このようにして、ユーザによる翻訳の閲覧の面倒な操作を回避することができ、1回のスクロール翻訳で複数画面の翻訳コンテンツを取得することができ、ユーザが翻訳コンテンツをブラウズすることを容易にし、これにより、電子デバイスの知能が向上し、ユーザによる翻訳閲覧のユーザ体験も向上する。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、以下を含む。電子デバイスは、第4のユーザインターフェースにおいて第3の操作を検出する。第4のユーザインターフェースは、第2のコンテンツの翻訳結果の最後の部分を含み、第3の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む。第3の操作に応答して、電子デバイスは、第5のユーザインターフェースを自動的に表示し、第5のユーザインターフェースの第3の位置から始まるスクロールスクリーンショットを撮影する。第5のユーザインターフェースは第3のコンテンツを含み、第3の位置は第1の写真に関連付けられ、第3のコンテンツの言語は第1の言語である。スクロールスクリーンショットプロセスでは、ユーザの第4の操作が第6のユーザインターフェースにおいて検出されると、またはスクロールを通じて終了位置に到達すると、電子デバイスは、第6のユーザインターフェースの第4の位置でスクロールスクリーンショットの撮影を停止して、第2の写真を取得する。第2の写真は第4のコンテンツに対応する写真であり、第4のコンテンツは第3の位置から第4の位置までのコンテンツを含み、第4のコンテンツの言語は第1の言語である。電子デバイスは、第2の写真に基づいて、第4のコンテンツの翻訳結果を自動的に取得する。第4のコンテンツの翻訳結果の言語は第2の言語である。電子デバイスは、第4のコンテンツの翻訳結果の一部または全部を自動的に取得した後、第7のユーザインターフェースを自動的に表示する。第7のユーザインターフェースは、第4のコンテンツの翻訳結果の一部または全部を含む。
本出願のこの実施形態では、ユーザが第1のスクロール翻訳を実行した後により多くの翻訳コンテンツを閲覧することをさらに望むとき、ユーザは再びスクロール翻訳をトリガすることができる。このようにして、ユーザによる翻訳の閲覧の面倒な操作を回避することができ、1回のスクロール翻訳で複数画面の翻訳コンテンツを取得することができ、ユーザが翻訳コンテンツをブラウズすることを容易にし、これにより、電子デバイスの知能が向上し、ユーザによる翻訳閲覧のユーザ体験も向上する。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、以下を含む。電子デバイスは、第8のユーザインターフェースにおいて第5の操作を検出する。第8のユーザインターフェースは、第2のコンテンツの翻訳結果の最後の部分を含み、第5の操作は、ユーザによりさらなる翻訳をトリガするユーザ操作を含む。電子デバイスは、第5の操作に応答して、第5のコンテンツの翻訳結果を自動的に取得する。第5のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第2のコンテンツ以外のコンテンツの一部または全部を含み、第5のコンテンツの翻訳結果の言語は第2の言語である。電子デバイスは、第5のコンテンツの翻訳結果の一部または全部を自動的に取得した後に第9のユーザインターフェースを自動的に表示するか、またはユーザのスライド操作を受信した後に第9のユーザインターフェースを表示する。第9のユーザインターフェースは、第5のコンテンツの翻訳結果の一部または全部を含む。
本出願のこの実施形態では、ユーザが第1のスクロール翻訳を実行した後により多くの翻訳コンテンツを閲覧することをさらに望む場合、ユーザはさらなる翻訳をトリガすることができ、電子デバイスは、より多くの翻訳コンテンツを取得するためにより多くの翻訳用のソーステキストコンテンツを自動的に取得するために、ソーステキストインターフェースにジャンプすることができる。あるいは、電子デバイスは、ソーステキストインターフェースにジャンプする必要はなく、より多くの翻訳コンテンツをユーザに表示するために、バックグラウンドでより多くの翻訳コンテンツを自動的にロードし、これにより、ユーザが翻訳コンテンツをブラウズすることを容易にする。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、第5の操作に応答して、第3の写真を取得するためにスクリーンショットを自動的に撮影するステップをさらに含む。第3の写真は、第5のコンテンツに対応する写真である。
いくつかの可能な実装形態では、自動スクリーンショット撮影は、スクリーンショット撮影であってもよく、またはスクロールスクリーンショット撮影であってもよい。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第5のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第3の写真、または第3の写真の一部に対応する写真をサーバに送信する。電子デバイスは、第3の写真または第3の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
本出願のこの実施形態では、第3の写真を取得した後、電子デバイスは、サーバが翻訳結果を取得するために第3の写真または第3の写真の一部に対応する写真上に表示されたソーステキストコンテンツを翻訳するように、第3の写真または第3の写真の一部に対応する写真をサーバに送信する。サーバは、電子デバイスが翻訳結果をユーザに表示するように、翻訳結果を電子デバイスに送信することができる。第3の写真または第3の写真の一部に対応する写真は、複数画面の写真を含んでもよい。これにより、一度に一画面の写真のみを送信することができる従来の技術と比較して、ユーザにより翻訳をブラウズするユーザ体験が向上できるように、翻訳効率を向上させることができる。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第3の写真を取得するためにスクリーンショットを自動的に撮影するステップは、第3の写真を取得するために1つ以上の画面のコンテンツを自動的にキャプチャするステップを含む。自動スクリーンショットプロセスは、ユーザにとって可視または不可視である。
いくつかの可能な実装形態では、電子デバイスは、スクリーンショット撮影を通じて1画面コンテンツをキャプチャすることができる。
いくつかの可能な実装形態では、電子デバイスは、代わりにスクロールスクリーンショット撮影を通じて複数画面コンテンツをキャプチャすることができる。
本出願のこの実施形態では、自動スクリーンショットプロセスは、ユーザに見えない場合がある。ユーザが最初の全画面翻訳またはスクロール翻訳を通じて翻訳を取得した後により多くの翻訳を閲覧し続けたい場合、ユーザは、より多くの翻訳を取得するために、さらなる翻訳を直接トリガしてもよい。ユーザは、ユーザにより翻訳をブラウズするユーザ体験をさらに向上できるように、スクリーンショットまたはスクロールスクリーンショットプロセスを表示するために電子デバイスがソーステキストにジャンプする必要性を伴わずに、前の翻訳に基づいてより多くの翻訳を直接閲覧する。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得する前に、方法は、以下をさらに含む。電子デバイスは、第1の写真を複数の写真に自動的にセグメント化する。第3の位置は、複数の写真のうちの最後の写真内の特定の位置に関し、特定の位置は、最後の写真の開始位置、終了位置、中間位置、または所定割合の位置、または最後の写真の最後の段落の開始位置、または最後のn行の開始位置であり、nは正の整数であり、nは1以上である。
本出願のこの実施形態では、電子デバイスは、第1の言語(ソーステキストとも呼ばれ得る)を現在表示しているインターフェースを取り込むロングスクリーンショットを可能にし、画面を自動的にスクロールダウンし、電子デバイスは、ユーザが画面をタップできることを検出すると、ロングスクリーンショット撮影を停止する。次に、第2の言語(翻訳とも呼ばれ得る)に翻訳されたテキストデータが新しいインターフェースに表示され、ユーザは、上方/下方スライドを通じてテキストデータを閲覧することができる。次に、ユーザは、翻訳インターフェースにおいて、後続のコンテンツを閲覧し続けることを直接選択することができる(ユーザがタップする「スクロール翻訳」ボタンがインターフェースに提供される)。ユーザが「スクロール翻訳」ボタンを再びタップした後、電子デバイスはソーステキストインターフェースにジャンプし、前のロングスクリーンショット撮影が停止した位置の近傍にジャンプする(電子デバイスが位置を記憶している)。電子デバイスは、前のロングスクリーンショット撮影が停止した位置の近傍(または、何らかの冗長なコンテンツを維持することによって前の閲読がどこで終了したかをユーザが思い出せる、その位置の数行前)から再び始まるスクロールスクリーンショット撮影および翻訳を可能にすることができる。方法は、ウェブベースのブラウザクライアントの翻訳に限定されず、適用可能なシナリオが大幅に拡張され、ユーザの閲読体験の継続がさらに保証されるように、第三者情報APPなどの非ブラウザシナリオにおいてさらに使用され得る。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、複数の写真をサーバに送信する。電子デバイスは、複数の写真の各々についてサーバの翻訳結果を受信する。電子デバイスは、複数の写真のうちのいくつかの翻訳結果から第2のコンテンツの翻訳結果の一部を生成するか、または複数の写真の全ての翻訳結果から第2のコンテンツの翻訳結果を生成する。
本出願のこの実施形態では、第1の写真を取得した後、電子デバイスは、第1の写真を複数の写真にセグメント化し、複数の写真を翻訳のためにサーバに送信することができる。サーバは、電子デバイスが翻訳結果をユーザに表示するように、複数の写真の翻訳結果を電子デバイスに送信することができる。第1の写真は複数の写真を含み得る。これにより、一度に一画面の写真のみを送信することができる従来の技術と比較して、翻訳効率を向上させることができ、これにより、ユーザにより翻訳をブラウズするユーザ体験を向上させることができる。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第3の位置が第1の写真に関連付けられることは、以下を含む。第3の位置は、第1の写真内の特定の位置に関連している。特定の位置は、第1の写真の終了位置、中間位置、または所定割合の位置、または第1の写真の最後の段落の開始位置、または最後のn行の開始位置であり、nは正の整数であり、nは1以上である。
本出願のこの実施形態では、電子デバイスは、第1の写真をセグメント化してもよく、または第1の写真をセグメント化しなくてもよい。第2のスクロールスクリーンショット撮影の開始位置は、第1の写真に関連し得る。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第3の位置が第1の写真に関連付けられることは、以下を含む。第3の位置は、第2のコンテンツに関連している。第3の位置は、第2のコンテンツの終了位置、中間位置、または所定割合の位置に関連しているか、または第3の位置は、第2のコンテンツの最後の段落の開始位置、または最後のn行の開始位置に関連しており、nは正の整数であり、nは1以上である。
本出願のこの実施形態では、電子デバイスは、第1の写真をセグメント化してもよく、または第1の写真をセグメント化しなくてもよい。第2のスクロールスクリーンショット撮影の開始位置は、第1の写真に表示された第2のコンテンツに関連し得る。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、第1の写真、または第1の写真の一部に対応する写真をサーバに送信するステップと、第1の写真または第1の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信するステップと、を含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果は、第1の写真に対して光学文字認識(OCR)テキスト認識を実行することによって取得されたテキストコンテンツが第1の言語から第2の言語に翻訳された後に取得されたコンテンツを含む。
本出願のこの実施形態では、電子デバイスは、OCRを通じて、単語または写真が切り取られているか否かを判定することができる。単語または写真がセグメント化位置で切り取られていると携帯電話が判定した場合、携帯電話は、セグメント化位置を空白行位置まで移動させることができる。電子デバイスは、OCRを通じて取得したテキストコンテンツをサーバに送信し、サーバは、対応するテキストコンテンツを翻訳することができる。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第1の写真、または第1の写真の一部に対応する写真をサーバに送信する。電子デバイスは、第1の写真または第1の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果は、第1の写真に対して光学文字認識(OCR)テキスト認識を実行することによって取得されたテキストコンテンツが第1の言語から第2の言語に翻訳された後に取得されたコンテンツを含む。
本出願のこの実施形態では、電子デバイスは、OCRを通じて、単語または写真が切り取られているか否かを判定することができる。単語または写真がセグメント化位置で切り取られていると携帯電話が判定した場合、携帯電話は、セグメント化位置を空白行位置まで移動させることができる。
本出願のこの実施形態では、OCRテキスト認識が電子デバイスによって実行されてもよく、テキスト翻訳がサーバによって実行されてもよいこと、またはOCRテキスト認識およびテキスト翻訳がサーバによって完了されてもよいこと、またはOCRテキスト認識およびテキスト翻訳が同じサーバによって完了されるかまたは異なるサーバによって一緒に完了されてもよいことが、理解されるべきである。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、第3の位置に、または第3の位置の付近に第1のプロンプト情報を表示するステップであって、第1のプロンプト情報は、スクロールスクリーンショット撮影の開始位置をユーザに示すために使用される、ステップ、および/または第2の位置に、または第2の位置の付近に第2のプロンプト情報を表示するステップであって、第2のプロンプト情報は、前の閲読が第2の位置で終了したことをユーザに示すために使用される、ステップを、さらに含む。
第2のスクロールスクリーンショット撮影の翻訳を読む前に第1のプロンプト情報および/または第2のプロンプト情報を表示することによって、ユーザは、第2のスクロールスクリーンショット撮影におけるソーステキストコンテンツに再び慣れることができる。これは、記憶を呼び起こし、ユーザの連続的な閲読を支援する機能を有する。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第1の操作は、ユーザにより、スクロール翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、スクロール翻訳機能をトリガすることができる音声命令を入力することを含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第3の操作は、ユーザにより、スクロール翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、スクロール翻訳機能をトリガすることができる音声命令を入力することを含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、ユーザのスライド操作が第3のユーザインターフェースにおいて受信された後に第10のユーザインターフェースを表示するステップであって、第10のユーザインターフェースは、第3のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む、ステップをさらに含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第3の操作を検出する前に、方法は、第4のユーザインターフェースに、スクロール翻訳をトリガすることができるコントロールを表示するステップをさらに含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第5の操作を検出する前に、方法は、第8のユーザインターフェースに、さらなる翻訳をトリガすることができるコントロールを表示するステップをさらに含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第1のユーザインターフェースにおいて第1の操作を検出するステップは、ユーザの多指押圧操作が第1のユーザインターフェースにおいて検出された後に複数の機能コントロールを表示するステップであって、複数の機能コントロールは、スクロール翻訳をトリガすることができる第1のコントロールを含む、ステップと、ユーザが第1のコントロールをタップしたこと、またはユーザがスクロール翻訳機能をトリガすることができる音声命令を入力したことを検出するステップと、を含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第2のコンテンツは、第1のコンテンツと、第1の言語に対応する全てのコンテンツのうちの第1のコンテンツ以外のコンテンツの一部または全部を含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、第3のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第2のコンテンツ以外のコンテンツの一部を含み、第4のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第2のコンテンツ以外のコンテンツの一部または全部を含む。
第1の態様を参照すると、第1の態様のいくつかの実装形態では、方法は、ユーザのスライド操作が第9のユーザインターフェースにおいて受信された後に第11のユーザインターフェースを表示するステップであって、第11のユーザインターフェースは、第9のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む、ステップをさらに含む。
第2の態様によれば、機械翻訳方法が提供される。方法は、タッチスクリーンを有する電子デバイスに適用され、方法は、以下を含む。電子デバイスは、タッチスクリーン上に第1のユーザインターフェースを表示する。第1のユーザインターフェースは第1のコンテンツを含み、第1のコンテンツの言語は第1の言語である。電子デバイスは、第1のユーザインターフェースにおいてユーザの第1の操作を検出する。第1の操作は、ユーザにより全画面翻訳をトリガするユーザ操作を含む。第1の操作に応答して、電子デバイスは、第1のユーザインターフェースのスクリーンショットを撮影することによって取得される第1の写真を取得する。電子デバイスは、第1の写真に基づいて、第1のコンテンツの翻訳結果を自動的に取得する。第1のコンテンツの翻訳結果の言語は第2の言語である。電子デバイスは、第1のコンテンツの翻訳結果を自動的に取得した後、第2のユーザインターフェースを自動的に表示する。第2のユーザインターフェースは、第1のコンテンツの翻訳結果の一部または全部を含む。電子デバイスは、第2のユーザインターフェースにおいてユーザの第2の操作を検出する。第2の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む。第2の操作に応答して、電子デバイスは、第3のユーザインターフェースを自動的に表示し、第3のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影する。第3のユーザインターフェースは第2のコンテンツを含み、第1の位置は第1の写真に関連付けられ、第2のコンテンツの言語は第1の言語である。スクロールスクリーンショットプロセスでは、ユーザの第3の操作が第4のユーザインターフェースにおいて検出されるか、または第4のユーザインターフェースにおいてスクロールを通じて終了位置に到達すると、電子デバイスは、第2の写真を取得するために、第4のインターフェースの第2の位置でスクロールスクリーンショットの撮影を停止する。第2の写真は第3のコンテンツに対応する写真であり、第3のコンテンツは第1の位置から第2の位置までのコンテンツを含み、第3のコンテンツの言語は第1の言語である。電子デバイスは、第2の写真に基づいて、第3のコンテンツの翻訳結果を自動的に取得する。第3のコンテンツの翻訳結果の言語は第2の言語である。電子デバイス
は、第3のコンテンツの翻訳結果の一部または全部を自動的に取得した後、第5のユーザインターフェースを自動的に表示する。第5のユーザインターフェースは、第3のコンテンツの翻訳結果の一部または全部を含む。
本出願のこの実施形態は、最初に全画面翻訳を実行し、次いでスクロール翻訳を実行するプロセスを提供する。具体的には、ユーザは最初に全画面翻訳を実行することができ、「スクロール翻訳」コントロールが全画面翻訳の翻訳インターフェースに表示されてもよく、次いでユーザはスクロール翻訳を実行することができる。このようにして、全画面翻訳を実行した後、ユーザは、ユーザがソーステキストコンテンツに関心があるか否かを最初に判定することができる。ユーザがソーステキストコンテンツに関心がある場合、ユーザは、より多くの翻訳コンテンツを閲覧するために、スクロール翻訳を引き続き実行することができる。ユーザがソーステキストコンテンツに関心がない場合、ユーザは、現在のソーステキストの閲読を終了し、次いでユーザが関心を持っているソーステキストを検索することができる。
いくつかの可能な実装形態では、第2のコンテンツと第1のコンテンツは同じであってもよい。または、第2のコンテンツは第1のコンテンツの一部を含む。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3のコンテンツの翻訳結果を自動的に取得する前に、方法は、以下をさらに含む。電子デバイスは、第2の写真を複数の写真に自動的にセグメント化する。電子デバイスは、複数の写真をサーバに送信する。電子デバイスは、複数の写真の各々についてサーバの翻訳結果を受信する。電子デバイスは、複数の写真のうちのいくつかの翻訳結果から第3のコンテンツの翻訳結果の一部を生成するか、または複数の写真の全ての翻訳結果から第3のコンテンツの翻訳結果を生成する。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第3のコンテンツの翻訳結果は、第2の写真に対してOCRテキスト認識を実行することによって取得されたテキストコンテンツが第1の言語から第2の言語に翻訳された後に取得されたコンテンツを含む。
本出願のこの実施形態では、電子デバイスは、OCRを通じて、単語または写真が切り取られているか否かを判定することができる。単語または写真がセグメント化位置で切り取られていると携帯電話が判定した場合、携帯電話は、セグメント化位置を空白行位置まで移動させることができる。電子デバイスは、OCRを通じて取得したテキストコンテンツをサーバに送信し、サーバは、対応するテキストコンテンツを翻訳することができる。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、方法は、以下をさらに含む。電子デバイスは、第1の位置に、または第1の位置の付近に第1のプロンプト情報を表示し、第1のプロンプト情報は、スクロールスクリーンショット撮影の開始位置をユーザに示すために使用され、および/または電子デバイスは、第1の写真の終了位置に第2のプロンプト情報を表示し、第2のプロンプト情報は、前の閲読が終了位置で終了したことをユーザに示すために使用される。
本出願のこの実施形態では、第2のスクロールスクリーンショット撮影の翻訳を読む前に第1のプロンプト情報および/または第2のプロンプト情報を表示することによって、ユーザは、第2のスクロールスクリーンショット撮影におけるソーステキストコンテンツに再び慣れることができる。これは、記憶を呼び起こし、ユーザの連続的な閲読を支援する機能を有する。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第2の操作は、ユーザにより、スクロール翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、スクロール翻訳機能をトリガすることができる音声命令を入力することを含む。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第1の位置が第1の写真に関連付けられることは、以下を含む。第1の位置は、第1の写真内の特定の位置に関連している。特定の位置は、第1の写真の終了位置、中間位置、または所定割合の位置、または第1の写真の最後の段落の開始位置、または最後のn行の開始位置であり、nは正の整数であり、nは1以上である。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第1の位置が第1の写真に関連付けられることは、以下を含む。第1の位置は、第1のコンテンツの終了位置、中間位置、または所定割合の位置に関連しているか、または第1の位置は、第1のコンテンツの最後の段落の開始位置、または最後のn行の開始位置に関連しており、nは正の整数であり、nは1以上である。
本出願のこの実施形態では、電子デバイスは、前のスクリーンショット撮影を通じて取得した第1の写真上の位置(または、何らかの冗長なコンテンツを維持することによって前の閲読がどこで終了したかをユーザが思い出せる、その位置の数行前)から始まるスクロールスクリーンショット撮影および翻訳を可能にすることができる。方法は、ウェブベースのブラウザクライアントの翻訳に限定されず、適用可能なシナリオが大幅に拡張され、ユーザの閲読体験の継続がさらに保証されるように、第三者情報APPなどの非ブラウザシナリオにおいてさらに使用され得る。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、方法は、以下をさらに含む。電子デバイスは、第5のユーザインターフェースにおいてユーザのスライド操作を受信した後に第6のユーザインターフェースを表示し、第6のユーザインターフェースは、第5のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第2のユーザインターフェースにおいてユーザの第2の操作を検出する前に、方法は、以下をさらに含む。電子デバイスは、第2のユーザインターフェースに、スクロール翻訳をトリガすることができるコントロールを表示する。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップは、以下を含む。電子デバイスは、第1のユーザインターフェースにおいてユーザの多指押圧操作を検出した後に、複数の機能コントロールを表示する。複数の機能コントロールは、全画面翻訳をトリガすることができる第1のコントロールを含む。電子デバイスは、ユーザが第1のコントロールをタップしたこと、またはユーザが全画面翻訳機能をトリガすることができる音声命令を入力したことを検出する。
第2の態様を参照すると、第2の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第2の写真、または第2の写真の一部に対応する写真をサーバに送信する。電子デバイスは、第2の写真または第2の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
第3の態様によれば、機械翻訳方法が提供される。方法は、タッチスクリーンを有する電子デバイスに適用され、方法は、以下を含む。電子デバイスは、タッチスクリーン上に第1のユーザインターフェースを表示する。第1のユーザインターフェースは第1のコンテンツを含み、第1のコンテンツの言語は第1の言語である。電子デバイスは、第1のユーザインターフェースにおいてユーザの第1の操作を検出する。第1の操作は、ユーザにより全画面翻訳をトリガするユーザ操作を含む。第1の操作に応答して、電子デバイスは、第1の写真を取得するために、第1のユーザインターフェースのスクリーンショットを撮影する。電子デバイスは、第1の写真に基づいて、第1のコンテンツの翻訳結果を自動的に取得する。第1のコンテンツの翻訳結果の言語は第2の言語である。電子デバイスは、第1のコンテンツの翻訳結果を自動的に取得した後、第2のユーザインターフェースを自動的に表示する。第2のユーザインターフェースは、第1のコンテンツの翻訳結果の一部または全部を含む。電子デバイスは、第2のユーザインターフェースにおいてユーザの第2の操作を検出し、ここで第2の操作は、ユーザによりさらなる翻訳をトリガするユーザ操作を含み、第2の操作に応答して、第2のコンテンツの翻訳結果を自動的に取得し、ここで第2のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第1のコンテンツ以外のコンテンツの一部または全部を含み、第2のコンテンツの翻訳結果の言語は第2の言語である。電子デバイスは、第2のコンテンツの翻訳結果の一部または全部を自動的に取得した後に第3のユーザインターフェースを自動的に表示するか、またはユーザのスライド操作を受信した後に第3のユーザインターフェースを表示する。第3のユーザインターフェースは、第2のコンテンツの翻訳結果の一部または全部を含む。
本出願のこの実施形態では、電子デバイスが全画面翻訳を1回実行した後、電子デバイスは、「翻訳を続ける」コントロールをユーザに提供することができる。ユーザが「翻訳を続ける」コントロールをタップしたことを検出した後、電子デバイスは、バックグラウンドで、ソーステキストの残部に対応する翻訳の全部または一部を直接ロードすることができる。このように、電子デバイスは、ユーザにより翻訳を読むユーザ体験をさらに向上できるように、スクロールスクリーンショット撮影のためにソーステキストインターフェースにジャンプする必要がない。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、方法は、第2の操作に応答して、第2の写真を取得するためにスクリーンショットを自動的に撮影するステップをさらに含む。第2の写真は、第2のコンテンツに対応する写真である。第2のコンテンツの翻訳結果を自動的に取得するステップは、第2の写真に基づいて、第2のコンテンツの翻訳結果を自動的に取得するステップを含む。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第2の写真、または第2の写真の一部に対応する写真をサーバに送信する。電子デバイスは、第2の写真または第2の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第2の写真を取得するためにスクリーンショットを自動的に撮影するステップは、以下を含む。電子デバイスは、第2の写真を取得するために、1つ以上の画面のコンテンツを自動的にキャプチャする。自動スクリーンショットプロセスは、ユーザにとって可視または不可視である。
本出願のこの実施形態では、ユーザがスクロールスクリーンショット操作をトリガした後、電子デバイスは、スクリーンショット撮影のためにソーステキストインターフェースにジャンプしなくてもよいが、バックグラウンドで、ソーステキストの残部に対応する翻訳の一部または全部を自動的にロードすることができ、これにより、ソーステキストと翻訳との間で切り替えることによって引き起こされるユーザへの影響を回避する。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第2の写真を複数の写真に自動的にセグメント化する。電子デバイスは、複数の写真をサーバに送信する。電子デバイスは、複数の写真の各々についてサーバの翻訳結果を受信する。電子デバイスは、複数の写真のうちのいくつかの翻訳結果から第2のコンテンツの翻訳結果の一部を生成するか、または複数の写真の全ての翻訳結果から第2のコンテンツの翻訳結果を生成する。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第2の操作は、ユーザにより、さらなる翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、さらなる翻訳機能をトリガすることができる音声命令を入力することを含む。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、方法は、以下をさらに含む。電子デバイスは、第3のユーザインターフェースにおいてユーザのスライド操作を受信した後に第4のユーザインターフェースを表示し、第4のユーザインターフェースは、第3のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第1のユーザインターフェースにおいてユーザの第1の操作を検出する前に、方法は、以下をさらに含む。電子デバイスは、第1のユーザインターフェースに、全画面翻訳をトリガすることができるコントロールを表示する。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第2のユーザインターフェースにおいてユーザの第2の操作を検出する前に、方法は、第2のユーザインターフェースに、さらなる翻訳をトリガすることができるコントロールを表示するステップをさらに含む。
第3の態様を参照すると、第3の態様のいくつかの実装形態では、第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップは、ユーザの多指押圧操作が第1のユーザインターフェースにおいて検出された後に複数の機能コントロールを表示するステップであって、複数の機能コントロールは、全画面翻訳をトリガすることができる第1のコントロールを含む、ステップと、ユーザが第1のコントロールをタップしたこと、またはユーザが全画面翻訳機能をトリガすることができる音声命令を入力したことを検出するステップと、を含む。
第4の態様によれば、装置が提供される。装置は、電子デバイスに含まれ、装置は、前述の態様および前述の態様の可能な実装形態での電子デバイスの動作を実装する機能を有する。機能はハードウェアによって実行されてよく、あるいは対応するソフトウェアを実行することによってハードウェアによって実施されてもよい。ハードウェアまたはソフトウェアは、前述の機能に対応する1つ以上のモジュールまたはユニットを含む。
第5の態様によれば、タッチスクリーン、1つ以上のプロセッサ、メモリ、および1つ以上のコンピュータプログラムを含む電子デバイスが提供される。1つ以上のコンピュータプログラムはメモリに記憶され、1つ以上のコンピュータプログラムは命令を含む。電子デバイスによって命令が実行されるとき、電子デバイスは、第1の態様、第2の態様、または第3の態様の任意の可能な実装形態の機械翻訳方法を実行する。
第6の態様によれば、技術的解決策は、コンピュータ命令を含むコンピュータ記憶媒体を提供する。コンピュータ命令が電子デバイスにおいて実行されるとき、電子デバイスは、前述の態様のいずれか1つの任意の可能な実装形態の機械翻訳方法を実行する。
第7の態様によれば、技術的解決策は、コンピュータプログラム製品を提供する。コンピュータプログラム製品が電子デバイスにおいて実行されるとき、電子デバイスは、前述の態様のいずれか1つの任意の可能な設計の機械翻訳方法を実行する。
第8の態様によれば、この技術的解決策は、チップシステムを提供する。チップシステムは少なくとも1つのプロセッサを含み、少なくとも1つのプロセッサによってプログラム命令が実行されるとき、電子デバイス上の第1の態様の前述の可能な方法のいずれか1つの機能が実現される。
本出願の一実施形態による電子デバイスの構造の概略図である。 本出願の一実施形態による電子デバイスのソフトウェア構造のブロック図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIのグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態によるGUIの別のグループを示す図である。 本出願の一実施形態による機械翻訳方法の概略フローチャートである。 本出願の一実施形態による機械翻訳方法の概略フローチャートである。 本出願の一実施形態による機械翻訳方法の概略フローチャートである。 本出願の一実施形態による機械翻訳方法の概略フローチャートである。
以下の実施形態で使用される用語は、単に特定の実施形態を説明するためのものであり、本出願を限定するためのものではない。本明細書および本出願の添付の特許請求の範囲で使用される単数形の「1つの(one)」、「a」、「前述の」、「この」、および「1つの(the one)」という用語は、文脈において明確に特に指定されない限り、「1つ以上の」などの複数形も含むことが意図されている。本出願の以下の実施形態では、「少なくとも1つ」または「1つ以上」は、1つ、2つ、またはそれ以上を意味することをさらに理解すべきである。「および/または」という用語は、関連付けられる対象間の関連付け関係を記述するために使用され、3つの関係が存在し得ることを表す。たとえば、Aおよび/またはBは、Aのみが存在する場合、AとBの両方が存在する場合、およびBのみが存在する場合を表し得る。AおよびBは、単数形であっても複数形であってもよい。文字「/」は、一般に、関連付けられた対象間の「または」関係を示す。
本明細書で説明される「実施形態」、「いくつかの実施形態」などへの言及は、本出願の1つ以上の実施形態が、実施形態を参照して説明される特定の特徴、構造、または特性を含むことを示す。したがって、本明細書において、異なる箇所に現れる「一実施形態では」、「いくつかの実施形態では」、「いくつかの他の実施形態では」、および「他の実施形態では」などの記述は、特に別の方法で強調されていない限り、必ずしも同じ実施形態を指すことを意味するものではなく、代わりに「全てではないが1つ以上の実施形態」を意味する。「含む」、「備える」、「有する」という用語、およびこれらの用語の変形は全て、特に別の方法で強調されていない限り、「含むが限定されない」を意味する。
以下では、電子デバイス、電子デバイスに使用されるユーザインターフェース、および電子デバイスを使用するために使用される実施形態について説明する。いくつかの実施形態では、電子デバイスは、パーソナルデジタルアシスタント機能および/または音楽プレーヤ機能などの他の機能をさらに含むポータブル電子デバイス、たとえば、携帯電話、タブレットコンピュータ、またはワイヤレス通信機能を有するウェアラブル電子デバイス(たとえば、スマートウォッチ)であってもよい。ポータブル電子デバイスの例示的な実施形態は、iOS(登録商標)、Android(登録商標)、Microsoft(登録商標)、または別のオペレーティングシステムを使用するポータブル電子デバイスを含むが、これに限定されない。携帯用電子デバイスは、代替として、ラップトップコンピュータ(Laptop)などの別の携帯用電子デバイスであってもよい。いくつかの他の実施形態では、前述の電子デバイスは、携帯用電子デバイスではなく、デスクトップコンピュータであり得ることをさらに理解すべきである。
たとえば、図1は、電子デバイス100の構造の概略図である。電子デバイス100は、プロセッサ110、外部メモリインターフェース120、内部メモリ121、ユニバーサルシリアルバス(universal serial bus、USB)インターフェース130、充電管理モジュール140、電源管理モジュール141、バッテリ142、アンテナ1、アンテナ2、移動通信モジュール150、無線通信モジュール160、オーディオモジュール170、スピーカ170A、受信機170B、マイクロフォン170C、ヘッドセットジャック170D、センサモジュール180、コンパス190、モータ191、インジケータ192、カメラ193、表示画面194、加入者識別モジュール(subscriber identification module、SIM)カードインターフェース195などを含み得る。
本出願のこの実施形態で示される構造は、電子デバイス100に対する特定の限定も構成しないことが理解され得る。本出願のいくつかの他の実施形態では、電子デバイス100は、図に示されたものよりも多いまたは少ない構成要素を含むことができ、いくつかの構成要素を組み合わせることができ、いくつかの構成要素を分割することができ、または異なる構成要素配置を有することができる。図に示されている構成要素は、ハードウェア、ソフトウェア、またはソフトウェアとハードウェアの組合せを使用することによって実装され得る。
プロセッサ110は、1つ以上の処理ユニットを含むことができる。たとえば、プロセッサ110は、アプリケーションプロセッサ(application processor、AP)、モデムプロセッサ、グラフィックス処理ユニット(graphics processing unit、GPU)、画像信号プロセッサ(image signal processor、ISP)、コントローラ、ビデオコーデック、デジタル信号プロセッサ(digital signal processor、DSP)、ベースバンドプロセッサ、ニューラルネットワーク処理ユニット(neural-network processing unit、NPU)などを含んでもよい。異なる処理ユニットは、独立した構成要素であってもよく、または1つ以上のプロセッサに統合されてもよい。いくつかの実施形態では、電子デバイス101は、代替として、1つ以上のプロセッサ110を含んでもよい。コントローラは、命令の読み出しおよび命令の実行の制御を完了するために、命令操作コードおよび時系列信号に基づいて操作制御信号を生成し得る。いくつかの他の実施形態では、メモリは、命令およびデータを記憶するために、プロセッサ110にさらに配置されてもよい。たとえば、プロセッサ110内のメモリは、キャッシュメモリであってもよい。メモリは、プロセッサ110によって使用されたばかりの、またはプロセッサ110によって周期的に使用される命令またはデータを記憶することができる。プロセッサ110が命令またはデータを再び使用する必要がある場合、プロセッサ110は、メモリから命令またはデータを直接呼び出すことができる。このようにして、繰り返しアクセスが回避され、プロセッサ110の待ち時間が短縮され、電子デバイス101によってデータを処理する、または命令を実行する効率が向上する。
いくつかの実施形態では、プロセッサ110は、1つ以上のインターフェースを含み得る。インターフェースは、代替として、集積回路間(inter-integrated circuit、I2C)インターフェース、集積回路間サウンド(inter-integrated circuit sound、I2S)インターフェース、パルス符号変調(pulse code modulation、PCM)インターフェース、汎用非同期送受信機(universal asynchronous receiver/transmitter、UART)インターフェース、モバイルインダストリープロセッサインターフェース(mobile industry processor interface、MIPI)、汎用入出力(general-purpose input/output、GPIO)インターフェース、SIMカードインターフェース、USBインターフェースなどを含み得る。USBインターフェース130は、USB標準仕様に準拠したインターフェースであり、具体的には、Mini USBインターフェース、Micro USBインターフェース、USB Type Cインターフェースなどであり得る。USBインターフェース130は、電子デバイス101を充電するために、充電器に接続するように構成されてもよく、または電子デバイス101と周辺機器との間でデータを送信するように構成されてもよい。あるいは、USBインターフェース130は、ヘッドセットに接続され、ヘッドセットを使用してオーディオを再生するように構成されてもよい。
本出願のこの実施形態に例示されているモジュール間のインターフェース接続関係は、あくまでも説明のための一例に過ぎず、電子デバイス100の構造についての限定を構成するものではないことが、理解され得る。本出願のいくつかの他の実施形態では、電子デバイス100は、代替として、この実施形態のものとは異なるインターフェース接続方法、または複数のインターフェース接続方法の組み合わせを使用してもよい。
充電管理モジュール140は、充電器から充電入力を受け取るように構成される。充電器は、無線充電器であっても有線充電器であってもよい。有線充電のいくつかの実施形態では、充電管理モジュール140は、USBインターフェース130を通じて有線充電器から充電入力を受け取ることができる。無線充電のいくつかの実施形態では、充電管理モジュール140は、電子デバイス100の無線充電コイルを通じて無線充電入力を受け取ることができる。充電管理モジュール140は、バッテリ142を充電している間に電源管理モジュール141を使用することによって、電子デバイスに電力をさらに供給することができる。
電源管理モジュール141は、バッテリ142および充電管理モジュール140をプロセッサ110に接続するように構成される。電源管理モジュール141は、バッテリ142および/または充電管理モジュール140の入力を受け取り、プロセッサ110、内部メモリ121、外部メモリ、表示画面194、カメラ193、無線通信モジュール160などに給電する。電源管理モジュール141は、バッテリ容量、バッテリサイクル数、バッテリ健全状態(漏電またはインピーダンス)などのパラメータを監視するように、さらに構成され得る。いくつかの他の実施形態では、電源管理モジュール141は、代替として、プロセッサ110に配置されてもよい。あるいは、いくつかの他の実施形態では、電源管理モジュール141と充電管理モジュール140が、同じ構成要素内に配置されてもよい。
電子デバイス100の無線通信機能は、アンテナ1、アンテナ2、移動通信モジュール150、無線通信モジュール160、モデムプロセッサ、ベースバンドプロセッサなどを使用して実装され得る。
アンテナ1およびアンテナ2は、電磁波信号を送受信するように構成される。電子デバイス100内の各アンテナは、1つ以上の通信帯域をカバーするように構成され得る。アンテナ利用を向上させるために、異なるアンテナがさらに多重化されてもよい。たとえば、アンテナ1は、無線ローカルエリアネットワークのダイバーシティアンテナとして多重化されてもよい。いくつかの他の実施形態において、アンテナは、チューニングスイッチと組み合わせて使用されてもよい。
移動通信モジュール150は、電子デバイス100に応用されるソリューションを、2G、3G、4G、5Gなどを含む無線通信に提供できる。移動通信モジュール150は、少なくとも1つのフィルタ、スイッチ、電力増幅器、および低ノイズ増幅器(low noise amplifier、LNA)などを含み得る。移動通信モジュール150は、アンテナ1を介して処理された電磁波を受信し、受信された電磁波に対してフィルタリングまたは増幅などの処理を実行し、この電磁波を復調のためにモデムプロセッサに送信することができる。移動通信モジュール150は、モデムプロセッサによって変調された信号をさらに増幅し、その信号を、アンテナ1を通して放射するための電磁波に変換することができる。いくつかの実施形態では、移動通信モジュール150の少なくともいくつかの機能モジュールは、プロセッサ110内に配置されてもよい。いくつかの実施形態では、移動通信モジュール150の少なくともいくつかの機能モジュールおよびプロセッサ110の少なくともいくつかのモジュールが、同じ構成要素内に配置されてもよい。
無線通信モジュール160は、電子デバイス100に応用されるソリューションを、無線ローカルエリアネットワーク(wireless local area network、WLAN)(たとえば、ワイヤレスフィディリティ(wireless fidelity、Wi-Fi)ネットワーク)、ブルートゥース(登録商標)(bluetooth、BT)、全地球航法衛星システム(global navigation satellite system、GNSS)、周波数変調(frequency modulation、FM)、近距離無線通信(near field communication、NFC)技術、赤外線(infrared、IR)技術などを含む無線通信に提供し得る。無線通信モジュール160は、少なくとも1つの通信処理モジュールを組み込む1つ以上の構成要素であってもよい。無線通信モジュール160は、アンテナ2を通じて電磁波を受信し、電磁波信号に対して周波数変調とフィルタリングを行い、処理した信号をプロセッサ110へ送信する。無線通信モジュール160はさらに、送信されるべき信号をプロセッサ110から受信し、信号に対して周波数変調と増幅を行い、処理した信号を、アンテナ2を通じて放射するため、電磁波に変換する。
電子デバイス100は、GPU、表示画面194、アプリケーションプロセッサなどを使用することによって表示機能を実施する。GPUは画像処理のためのマイクロプロセッサであり、表示画面194およびアプリケーションプロセッサに接続される。GPUは、数学的および幾何学的計算を実行し、画像をレンダリングするように構成される。プロセッサ110は、プログラム命令を実行して表示情報を生成または変更する、1つ以上のGPUを含み得る。
表示画面194は、画像およびビデオなどを表示するように構成される。表示画面194は、表示パネルを含む。表示パネルは、液晶ディスプレイ(liquid crystal display、LCD)、有機発光ダイオード(organic light-emitting diode、OLED)、アクティブマトリックス式有機発光ダイオード(active-matrix organic light emitting diode、AMOLED)、フレキシブル発光ダイオード(flexible light-emitting diode、FLED)、Miniled、MicroLed、Micro-oLed、量子ドット発光ダイオード(quantum dot light emitting diodes、QLED)などであり得る。いくつかの実施形態では、電子デバイス100は、1つ以上の表示画面194を含み得る。
本出願のいくつかの実施形態では、表示パネルがOLED、AMOLED、またはFLEDなどの材料で構成されている場合、図1の表示画面194を曲げることができる。ここで、表示画面194を曲げることができるとは、表示画面を任意の部分で任意の角度に曲げることができ、なおかつその角度で保持できることを意味する。たとえば、表示画面194は、中央から左右に折り畳まれてもよい。あるいは、表示画面194は、中央から上下に折り畳まれてもよい。
電子デバイス100の表示画面194は、フレキシブル画面であってもよい。現在、フレキシブル画面は、フレキシブル画面の独自の特徴および大きな可能性のため、大きな注目を集めている。従来の画面と比較して、フレキシブル画面は、強力な柔軟性と屈曲性の特徴を備え、電子デバイスに対するユーザのより多くの要求を満たすために、屈曲性の特徴に基づく新しいインタラクションモードをユーザに提供することができる。折り畳み式ディスプレイと併せて構成された電子デバイスの場合は、電子デバイスの折り畳み式ディスプレイを折り畳み形態の小さい画面と拡張形態の大きい画面にいつでも切り替えることができる。したがって、ユーザは、折り畳み式ディスプレイで構成された電子デバイス上で、分割画面機能をより頻繁に使用する。
電子デバイス100は、ISP、カメラ193、ビデオコーデック、GPU、表示画面194、アプリケーションプロセッサ、などを使用することによって写真撮影機能を実現することができる。
ISPは、カメラ193によってフィードバックされるデータを処理するように構成される。たとえば、撮影中に、シャッタが押され、光がレンズを通ってカメラの受光素子へ伝達され、光信号が電気信号に変換され、電気信号を可視画像に変換する処理のために、カメラの受光素子が電気信号をISPへ送る。ISPは、画像のノイズ、輝度、および肌色に対してアルゴリズムの最適化をさらに実行する場合がある。ISPは、撮影シナリオの露出や色温度などのパラメータをさらに最適化できる。いくつかの実施形態では、ISPは、カメラ193内に配置されてもよい。
カメラ193は、静止画像またはビデオをキャプチャするように構成される。物体の光学画像がレンズを通して生成され、受光素子上に投影される。受光素子は、電荷結合素子(charge coupled device、CCD)、または相補形金属酸化膜半導体(complementary metal-oxide-semiconductor、CMOS)フォトトランジスタであり得る。受光素子は、光信号を電気信号に変換し、次いで、電気信号をデジタル画像信号に変換するために、電気信号をISPに送信する。ISPはデジタル画像信号を処理のためにDSPに出力する。DSPは、デジタル画像信号を、RGB形式またはYUV形式などの標準画像信号に変換する。いくつかの実施形態では、電子デバイス100は、1つ以上のカメラ193を含み得る。
デジタル信号プロセッサは、デジタル信号を処理するように構成され、デジタル画像信号に加えて他のデジタル信号を処理することができる。たとえば、電子デバイス100が周波数を選択すると、デジタル信号プロセッサは、周波数エネルギに対してフーリエ変換などを実行するように構成される。
ビデオコーデックは、デジタルビデオを圧縮または展開するように構成される。電子デバイス100は、1つ以上のビデオコーデックをサポートすることができる。この場合、電子デバイス100は、複数の符号化フォーマット、たとえば、ムービングピクチャーエキスパーツグループ(moving picture experts group、MPEG)-1フォーマット、MPEG-2フォーマット、MPEG-3フォーマット、およびMPEG-4フォーマットでビデオを再生または録画することができる。
NPUは、ニューラルネットワーク(neural-network、NN)コンピューティングプロセッサであり、生物学的ニューラルネットワークの構造を参照することによって、たとえば、人間の脳のニューロン間の伝達モードを参照することによって、入力情報を迅速に処理し、自己学習をさらに継続的に行うことができる。電子デバイス100のインテリジェントな認知、たとえば、画像認識、顔認識、音声認識、およびテキスト理解などのアプリケーションは、NPUを使用して実施することができる。
外部メモリインターフェース120は、電子デバイス100の記憶容量を拡張するために、外部メモリカード、たとえばMicro SDカードに接続するように構成され得る。外部ストレージカードは、データ保管機能を実装するために、外部メモリインターフェース120を通じてプロセッサ110と通信する。たとえば、外部ストレージカードには、音楽およびビデオなどのファイルが記憶される。
内部メモリ121は、1つ以上のコンピュータプログラムを記憶するように構成されてもよく、1つ以上のコンピュータプログラムは命令を含む。プロセッサ110は、電子デバイス101が、本出願のいくつかの実施形態において提供される機械翻訳方法、様々なアプリケーション、データ処理などを実行するように、内部メモリ121に記憶された命令を実行し得る。内部メモリ121は、プログラム記憶領域およびデータ記憶領域を含み得る。プログラム記憶領域は、オペレーティングシステムを記憶し得る。プログラム記憶領域は、1つ以上のアプリケーション(ギャラリーおよび連絡先など)などをさらに記憶し得る。データ記憶領域は、電子デバイス101の使用中に作成されたデータ(たとえば、写真および連絡先)などを記憶し得る。加えて、内部メモリ121は、高速ランダムアクセスメモリを含んでもよく、または不揮発性メモリ、たとえば、1つ以上の磁気ディスク記憶デバイス、フラッシュメモリデバイス、またはユニバーサルフラッシュストレージ(universal flash storage、UFS)を含んでもよい。いくつかの実施形態では、プロセッサ110は、電子デバイス101が、本出願のこの実施形態において提供される機械翻訳方法、他のアプリケーション、およびデータ処理を実行するように、内部メモリ121内に記憶された命令、および/またはプロセッサ110内に設けられたメモリ内に記憶された命令を実行し得る。電子デバイス100は、オーディオモジュール170、スピーカ170A、受信機170B、マイクロフォン170C、ヘッドセットジャック170D、アプリケーションプロセッサなどを使用して、オーディオ機能、たとえば音楽再生機能および録音機能を実施し得る。
センサモジュール180は、圧力センサ180A、ジャイロセンサ180B、気圧センサ180C、磁気センサ180D、加速度センサ180E、距離センサ180F、光学式近接センサ180G、指紋センサ180H、温度センサ180J、タッチセンサ180K、周囲光センサ180L、骨伝導センサ180Mなどを含み得る。
圧力センサ180Aは、圧力信号を感知するように構成され、圧力信号を電気信号に変換することができる。いくつかの実施形態では、圧力センサ180Aは、表示画面194上に配置され得る。複数のタイプの圧力センサ180A、たとえば、抵抗式圧力センサ、誘導式圧力センサ、または静電容量式圧力センサがある。静電容量式圧力センサは、導電性材料で作られた少なくとも2つの平行なプレートを含むことができる。圧力センサ180Aに力が加えられると、電極間の静電容量が変化する。電子デバイス100は、静電容量の変化に基づいて圧力強度を決定する。表示画面194上でタッチ操作が行われると、電子デバイス100は、圧力センサ180Aを使用してタッチ操作の強度を検出する。電子デバイス100は、圧力センサ180Aの検出信号に基づいてタッチ位置を計算できる。いくつかの実施形態では、同じタッチ位置で実行されるが異なるタッチ操作強度を有するタッチ操作は、異なる操作命令に対応し得る。たとえば、タッチ操作強度が第1の圧力閾値より小さいタッチ操作がメッセージのアイコン上で行われると、SMSメッセージを閲覧するための命令が実行される。タッチ操作強度が第1の圧力閾値以上であるタッチ操作がメッセージのアイコン上で行われると、SMSメッセージを作成するための命令が実行される。
ジャイロセンサ180Bは、電子デバイス100の移動姿勢を決定するように構成され得る。いくつかの実施形態では、ジャイロセンサ180Bを使用して3軸(すなわち、X軸、Y軸、およびZ軸)の周りの電子デバイス100の角速度が決定され得る。ジャイロセンサ180Bは、写真撮影中に手振れ補正を行うように構成され得る。たとえば、シャッタが押されると、ジャイロセンサ180Bは、電子デバイス100がジッタする角度を検出し、その角度に基づく計算によって、レンズモジュールが補償する必要がある距離を取得し、レンズが逆運動によって電子デバイス100のジッタを相殺することを可能にし、画像安定化を実現する。ジャイロセンサ180Bは、ナビゲーションシナリオおよびモーションセンシングゲームシナリオにおいてさらに使用され得る。
加速度センサ180Eは、電子デバイス100の様々な方向(通常は3軸上の方向)の加速度の大きさを検出できるとともに、電子デバイス100が静止しているときの重力の大きさおよび方向を検出できる。加速度センサ180Eは、電子デバイスの姿勢を識別するようにさらに構成されてもよく、横置きモードと縦置きモードとの切り換えまたは歩数計などの用途に使用される。
周囲光センサ180Lは、周囲光の輝度を感知するように構成される。電子デバイス100は、感知された周囲光の輝度に基づいて表示画面194の明るさを適応的に調整し得る。周囲光センサ180Lは、写真撮影時にホワイトバランスを自動的に調整するようにも構成され得る。周囲光センサ180Lはまた、偶発的なタッチを回避する目的で、電子デバイス100がポケット内にあるかどうかを検出するために、光学式近接センサ180Gと協働することができる。
指紋センサ180Hは、指紋を収集するように構成される。電子デバイス100は、指紋ベースのロック解除、アプリケーションロックアクセス、指紋ベースの写真撮影、および指紋ベースの通話応答などを実施するために、収集された指紋の特徴を使用し得る。
温度センサ180Jは、温度を検出するように構成される。いくつかの実施形態では、電子デバイス100は、温度センサ180Jによって検出される温度に基づいて温度処理ポリシーを実行する。たとえば、温度センサ180Jによって報告された温度が閾値を超えると、電子デバイス100は、消費電力を低減して熱保護を実施するために、温度センサ180Jの近くに配置されたプロセッサの性能を低下させる。いくつかの他の実施形態では、温度が別の閾値より小さいときに、低温に起因して電子デバイス100が異常に電源オフされるのを防止するために、電子デバイス100はバッテリ142を加熱する。いくつかの他の実施形態では、温度がさらに別の閾値より小さいとき、低温によって発生する異常な電源オフを防止するために、電子デバイス100はバッテリ142の出力電圧を上げる。
タッチセンサ180Kは、「タッチパネル」とも呼ばれる。タッチセンサ180Kは、表示画面194に配置されてもよく、タッチセンサ180Kおよび表示画面194はタッチスクリーンを構成し、これは「タッチスクリーン」とも呼ばれる。タッチセンサ180Kは、タッチセンサ180K上またはその近くで行われたタッチ操作を検出するように構成される。タッチセンサは、タッチイベントのタイプを判定するために、検出されたタッチ操作をアプリケーションプロセッサに転送することができる。表示画面194は、タッチ操作に関連する視覚的な出力を提供することができる。あるいは、いくつかの他の実施形態では、タッチセンサ180Kは、電子デバイス100の表面上の、表示画面194の位置とは異なる位置に配置されてもよい。
図2は、本出願のこの実施形態による電子デバイス100のソフトウェア構造のブロック図である。階層化アーキテクチャでは、ソフトウェアが幾つかの層に分割され、各層が明確な役割およびタスクを有する。層は、ソフトウェアインターフェースを介して互いに通信する。いくつかの実施形態では、Androidシステムは、上から下に4つの層、すなわち、アプリケーション層、アプリケーションフレームワーク層、アンドロイド(登録商標)ランタイム(Android runtime)およびシステムライブラリ、ならびにカーネル層に分割される。アプリケーション層は、一連のアプリケーションパッケージを含むことができる。
図2に示されるように、アプリケーションパッケージは、「カメラ」、「ギャラリー」、カレンダー」、「電話」、「マップ」、「ナビゲーション」、「WLAN」、「ブルートゥース」(登録商標)、「音楽」、「ビデオ」、および「メッセージ」などのアプリケーションを含むことができる。
アプリケーションフレームワーク層は、アプリケーション層のアプリケーションにアプリケーションプログラミングインターフェース(application programming interface、API)およびプログラミングフレームワークを提供し、アプリケーションフレームワーク層は、いくつかの所定の機能を含む。
図2に示されるように、アプリケーションフレームワーク層は、ウィンドウマネージャ、コンテンツプロバイダ、ビューシステム、電話マネージャ、リソースマネージャ、通知マネージャなどを含み得る。
ウィンドウマネージャは、ウィンドウプログラムを管理するように構成されており、ウィンドウマネージャは、表示画面サイズを取得し、ステータスバーがあるか否かを判定し、画面をロックし、画面をキャプチャするなどのことができる。
コンテンツプロバイダは、データを記憶および取得し、データがアプリケーションによってアクセスされることを可能にするように構成される。データは、ビデオ、画像、オーディオ、発信および受信された通話、閲覧履歴、ブックマーク、およびアドレス帳などを含み得る。
ビューシステムは、テキストを表示するためのコントロールおよび画像を表示するためのコントロールなどの視覚的コントロールを含む。ビューシステムは、アプリケーションを構築するように構成され得る。表示インターフェースは、1つ以上のビューを含み得る。たとえば、メッセージ通知アイコンを含む表示インターフェースは、テキスト表示ビューおよび写真表示ビューを含み得る。
電話マネージャは、電子デバイス100の通信機能、たとえば、通話状態の管理(応答または拒否を含む)を提供するように構成される。
リソースマネージャは、ローカライズされた文字列、アイコン、画像、レイアウトファイル、およびビデオファイルなどのアプリケーションのための様々なリソースを提供する。
通知マネージャは、アプリケーションがステータスバーに通知情報を表示することを可能にし、通知メッセージを伝達するように構成され得る。通知マネージャは、ユーザとの対話なしで、短い一時停止の後に自動的に消えることができる。たとえば、通知マネージャは、ダウンロードの完了、メッセージプロンプトなどの通知を提供するように構成される。あるいは、通知マネージャは、グラフまたはスクロールバーテキストの形式でシステムの上部ステータスバーに現れる通知、たとえば、バックグラウンドで実行しているアプリケーションの通知またはダイアログウィンドウの形式で画面上に現れる通知であってもよい。たとえば、テキスト情報がステータスバーに表示され、警告音が再生され、電子デバイスが振動し、またはインジケータライトが点滅する。
システムライブラリは、サーフェスマネージャ(surface manager)、メディアライブラリ(media libraries)、3次元グラフィックス処理ライブラリ(たとえば、OpenGL ES)、および2Dグラフィックスエンジン(たとえば、SGL)などの複数の機能モジュールを含み得る。
サーフェスマネージャは、表示サブシステムを管理して、複数のアプリケーションのための2D層および3D層の融合をもたらすように構成される。
メディアライブラリは、一般的に使用される複数のオーディオフォーマットおよびビデオフォーマット、静止画像ファイルなどの再生および記録をサポートする。メディアライブラリは、MPEG4、H.264、MP3、AAC、AMR、JPG、およびPNGなどの複数のオーディオおよびビデオ符号化フォーマットをサポートすることができる。
3次元グラフィック処理ライブラリは、3次元グラフィック描画、画像レンダリング、合成、および層処理などを実施するように構成される。
2Dグラフィックエンジンは、2D描画用の描画エンジンである。
カーネル層は、ハードウェアとソフトウェアとの間の層である。カーネル層は、少なくともディスプレイドライバ、カメラドライバ、オーディオドライバ、およびセンサドライバを含む。
本出願の機械翻訳方法が説明される前に、本出願の実施形態に関するいくつかの概念が最初に説明される。
全画面スクリーンショット撮影:全画面スクリーンショット撮影は、画面と同じ長さおよび幅、ならびに同じコンテンツを有する写真を取得するために、現在の電子デバイス上に表示されたコンテンツに対して「スナップショット」操作を実行することである。たとえば、全画面スクリーンショットは、iPhone(登録商標)ではHomeボタンおよび電源ボタンを同時に押すことによって撮影することができ、または全画面スクリーンショット撮影は、Homeボタンがないモデルでは、音量増加ボタンおよび電源ボタンを同時に押すことによってトリガすることができる。別の例では、全画面スクリーンショット撮影は、Huawei携帯電話の画面を指関節で2回叩くことによってトリガすることができる。別のベンダーは、全画面スクリーンショット撮影を可能にする別の方法を有するかも知れない。
ロングスクリーンショット撮影:対話方式でトリガされた後、ロングスクリーンショット撮影は、電子デバイス上に表示されたコンテンツについて、その長さが画面の高さを超える写真を生成することであり、コンテンツは、その長さが1つの画面の長さを超える長い写真であり、コンテンツはコヒーレントであり、これは現在表示されている位置から始まって下方にキャプチャされる。たとえば、Huawei携帯電話では、ロングスクリーンショット撮影は、指関節で画面に「S」を描くことによって可能となり、タップした後に停止する。別のベンダーは、ロングスクリーンショット撮影を可能にする別の方法を有するかも知れない。
理解を容易にするために、本出願の以下の実施形態では、図1および図2に示される構造を有する携帯電話が一例として使用され、本出願の実施形態で提供される機械翻訳方法は、添付図面を参照して具体的に説明される。
図3(a)から図3(m)は、携帯電話グラフィカルユーザインターフェース(graphical user interface、GUI)のグループを示す。図3(a)から図3(m)は、ユーザが全画面翻訳およびスクロール翻訳を実行するプロセスを示す。
図3(a)に示されるGUIを参照すると、GUIは携帯電話のデスクトップである。携帯電話のデスクトップは3つのデスクトップページを含み、デスクトップページの各々は、1つ以上のアプリケーション(Application, APP)のアイコンを含む。携帯電話によって表示される現在のデスクトップは、第2のデスクトップページ301であり、デスクトップページは、アリペイのアイコン、タスクカードストアのアイコン、Weiboのアイコン、英語閲読のアイコン302、WeChatのアイコン、カードバッグのアイコン、設定のアイコン、およびカメラのアイコンを含む。ユーザによりアイコン302をタップする操作を検出すると、携帯電話は、図3(b)に示されるGUIを表示することができる。
図3(b)に示されるGUIを参照すると、GUIは、英語閲読APPの表示インターフェースである。表示インターフェースは、「A family of four was on a camping trip in Canada. Then a wolf attacked while they were sleeping」と表題を付けられた英語エッセイ303、「Draft law seeks strict action against throwing objects from buildings」と表題を付けられた英語エッセイ、および「71-Year-Old Grandma Sets New Half Marathon World Record in Ohio」と表題を付けられた英語エッセイを含む、複数の英語エッセイを含む。ユーザにより英語エッセイ303をタップする操作を検出した後、携帯電話は、図3(c)に示されるGUIを表示することができる。
図3(c)に示されるGUIを参照すると、GUIは、英語エッセイ303の表示インターフェースである。ユーザは、画面上で上方/下方スライドを実行することによって、英語エッセイのソーステキストを読むことができる。図3(c)に示されるように、携帯電話がユーザにより2本指でインターフェースを押す操作を検出すると、携帯電話は、図3(d)に示されるGUIを表示することができる。
図3(d)に示されるGUIを参照すると、GUIは、AIタッチの表示インターフェースである。携帯電話がユーザにより2本指で画面を押す操作を検出すると、携帯電話は、プロンプトボックス304を自動的に表示することができる。プロンプトボックス304は、AIタッチの表示インターフェースであってもよい。携帯電話は、英語エッセイの「wolf」、「It」、「was」、「Something」、「out」、および「a」などの単語を自動的に識別することができる。プロンプトボックス304は、「検索」、「コピー」、「マップ」、「共有」、および「全画面翻訳」などのコントロールをさらに含むことができる。ユーザによりコントロール305をタップする操作を検出すると、携帯電話は、図3(e)に示されるGUIを表示することができる。
本出願のこの実施形態では、携帯電話はAIタッチ機能を有することができる。AIタッチ機能は、以下を含み得る。2本指でテキストを押したことを携帯電話が検出した後、携帯電話は、押された領域内のテキストコンテンツを自動的に抽出し、キーワードを解析することなどができる。AIタッチ機能は、以下をさらに含むことができる。2本指で写真を押したことを携帯電話が検出した後、携帯電話は、押された領域内の写真コンテンツを抽出し、写真内の記事を解析する。
本出願のこの実施形態では、全画面翻訳は、現在の画面に表示されているソーステキストを翻訳すること、または現在の画面上でスクリーンショット操作が実行された後に表示された1画面コンテンツを翻訳することとしてさらに理解され得ることが、理解されるべきである。ユーザがコントロール305をタップしたことを携帯電話が検出すると、携帯電話は、図3(c)に示される画面上のソーステキストを自動的に翻訳することができる。
図3(e)に示されるGUIを参照すると、GUIは、全画面翻訳のロードインターフェースである。携帯電話は、デフォルトで現在の画面上の英語を中国語に翻訳する。現在の画面上に表示されたコンテンツの翻訳を完了すると、携帯電話は、図3(f)に示されるGUIを自動的に表示することができる。
図3(f)に示されるGUIを参照すると、GUIは、全画面翻訳の翻訳インターフェースである。携帯電話は、図3(c)に表示された英語エッセイを対応する中国語に翻訳する。ユーザは、翻訳インターフェース内の翻訳言語をさらにタップすることができる。たとえば、ユーザが「中国語」をタップすると、複数の他の外国語が表示されてもよく、ユーザは別の翻訳言語を選択することができる。翻訳インターフェースは、「スクロール翻訳」コントロール306および「翻訳をコピーする」コントロールをさらに含む。ユーザによりコントロール306をタップする操作を検出すると、携帯電話は、図3(g)に示されるGUIを表示することができる。
本出願のこの実施形態では、スクロール翻訳は、ロングスクリーンショット翻訳とさらに呼ばれ得ることが、理解されるべきである。スクロール翻訳と全画面翻訳との違いは、以下の通りである。スクロール翻訳では、携帯電話は、最初にソーステキストコンテンツのロングスクリーンショットを撮影し、次いでロングスクリーンショット上のコンテンツ(複数画面コンテンツであってもよい)を自動的に翻訳することができ、全画面翻訳では、携帯電話は、たとえば、図3(c)に示される現在のソーステキストに表示されたコンテンツ(1画面コンテンツ)のみを翻訳することができる。
図3(g)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影のスクロール表示インターフェースである。図3(g)に示されるように、ロングスクリーンショット撮影のスクロール表示インターフェースは、プロンプトボックス307を含むことができる。プロンプトボックス307では、「スクロールスクリーンショットを撮影 ... スクロール領域をタップしてスクリーンショット撮影を完了する」というテキストが、ユーザに表示され得る。携帯電話は、画面を自動的にスクロールダウンすることができる。たとえば、携帯電話が画面を自動的にスクロールダウンするプロセスは、図3(g)から図3(h)、次いで図3(i)に示されている。
図3(i)に示されるGUIを参照すると、携帯電話上のスクロールスクリーンショット撮影中のスクロールを通じて英語エッセイの下(または英語エッセイの最後)に到達すると、携帯電話は、スクリーンショットを自動的に完了することができる。この場合、ロングスクリーンショット撮影の開始位置は、図3(c)に示される英語エッセイの開始であってもよく、ロングスクリーンショット撮影の終了位置は、英語エッセイの最後であってもよい。携帯電話がロングスクリーンショットの撮影を完了すると、携帯電話は、図3(j)に示されるインターフェースを自動的に表示することができる。
図3(j)に示されるGUIを参照すると、GUIは、スクロール翻訳のロードインターフェースである。携帯電話は、ロングスクリーンショット上の英語を対応する中国語に翻訳することができる。翻訳が完了すると、携帯電話は、図3(k)に示されるGUIを自動的に表示することができる。
図3(k)に示されるGUIを参照すると、GUIは、スクロール翻訳の翻訳インターフェースである。携帯電話は、ロングスクリーンショット上の英語エッセイを対応する中国語に既に翻訳している。携帯電話が画面上のユーザの上方スライド操作を検出した後、携帯電話は、スクロールを通じて翻訳コンテンツを表示することができる。スクロールを通じて翻訳コンテンツを表示するプロセスでは、スクロール翻訳の翻訳インターフェースにスクロールバー308がさらに出現し得る。携帯電話が下方へのスクロールを通じて翻訳コンテンツを表示すると、スクロールバー308もまた相応にスライドダウンすることができる。スクロールバー308の位置は、翻訳全体において、現在のインターフェース内の翻訳の位置に対応することができる。
図3(k)から図3(m)は、携帯電話がスクロールを通じて翻訳コンテンツを表示する変更プロセスを示す。ユーザは、上方または下方へのスライドを実行することによって、対応する翻訳を閲覧することができる。
一実施形態では、ユーザがロングスクリーンショットに対応する翻訳の閲覧を完了すると、ユーザはスクロール翻訳の翻訳インターフェースを出るためにコントロール309をタップすることができる。本出願のこの実施形態では、ユーザによりコントロール309をタップする操作を検出した後、携帯電話はソーステキストインターフェースを表示することができる。ソーステキストインターフェースは、電子デバイスがスクロールスクリーンショットを撮影し始めるときに存在するソーステキストコンテンツ表示インターフェースであってもよい。たとえば、ユーザによりコントロール309をタップする操作を検出すると、携帯電話は、図3(c)に示されるGUIを表示することができる。
図3(i)は、スクロールスクリーンショット撮影中にスクロールを通じて英語エッセイの最後に到達した後にロングスクリーンショット撮影が自動的に停止する一例を使用して説明されていることが、理解されるべきである。あるいは、携帯電話の画面が英語エッセイの最後まで自動的にスクロールされる前に、携帯電話は、ユーザのタップ操作を検出した後にロングスクリーンショットの撮影を自動的に停止することができる。対応するプロセスについては、図4(a)から図4(l)のGUIを参照されたい。
図3(k)から図3(i)の翻訳インターフェースでは、「スクロール翻訳」コントロール306がさらに表示され得ることが、さらに理解されるべきである。あるいは、英語エッセイの全てのコンテンツが翻訳されたと携帯電話が判定した後(またはスクロールを通じて英語エッセイの最後に到達したときにロングスクリーンショット撮影が自動的に停止したと携帯電話が判定したとき)、携帯電話は翻訳インターフェースに「スクロール翻訳」コントロール306を表示しなくてもよい。
以上、図3(a)から図3(i)を参照して、ユーザが英語エッセイを開き、全画面翻訳を実行し、次いでスクロール翻訳を実行するプロセスを説明した。具体的には、ユーザは最初に全画面翻訳を実行することができ、「スクロール翻訳」コントロールが全画面翻訳の翻訳インターフェースに表示されてもよく、次いでユーザはスクロール翻訳を実行することができる。このようにして、全画面翻訳を実行した後、ユーザは、ユーザがソーステキストコンテンツに関心があるか否かを最初に判定することができる。ユーザがソーステキストコンテンツに関心がある場合、ユーザは、より多くの翻訳コンテンツを閲覧するために、スクロール翻訳を引き続き実行することができる。ユーザがソーステキストコンテンツに関心がない場合、ユーザは、現在のソーステキストの閲読を終了し、次いでユーザが関心を持っているソーステキストを検索することができる。
図4(a)から図4(l)を参照して、本出願の一実施形態で提供されるGUIの別のグループを、以下で説明する。
図4(a)に示されるGUIを参照すると、GUIは、AIタッチの表示インターフェースである。ユーザは、画面上で上方/下方スライドを実行することによって、英語エッセイのソーステキストを読むことができる。図4(a)に示されるように、携帯電話がユーザにより2本指でインターフェースを押す操作を検出すると、携帯電話は、図4(b)に示されるGUIを表示することができる。
図4(b)に示されるGUIを参照すると、GUIは、AIタッチの別の表示インターフェースである。図3(d)と比較すると、図4(b)のAIタッチインターフェースは、全画面翻訳およびスクロール翻訳の2つのコントロールを含む。ユーザは全画面翻訳を選択してもよく、具体的には、図4(a)に示されるインターフェースのソーステキストコンテンツ(1画面コンテンツ)に対して翻訳が実行される。あるいは、ユーザはスクロール翻訳を選択してもよく、具体的には、ロングスクリーンショットが最初に撮影され、ロングスクリーンショットに表示されたソーステキストコンテンツ(複数画面コンテンツであってもよい)が翻訳される。ユーザによって実行されたコントロール401をタップする操作を検出すると、携帯電話は、図4(c)に示されるGUIを表示することができる。
図4(c)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影のスクロール表示インターフェースである。図4(c)に示されるように、ロングスクリーンショット撮影のスクロール表示インターフェースは、プロンプトボックス402を含むことができる。プロンプトボックス402では、「スクロールスクリーンショットを撮影 ... スクロール領域をタップしてスクリーンショット撮影を完了する」というテキストが、ユーザに表示され得る。携帯電話は、画面を自動的にスクロールダウンすることができる。たとえば、図4(c)および図4(d)は、英語エッセイを自動的にスクロールダウンするプロセスを示す。
図4(d)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影の別のスクロール表示インターフェースである。画面上のユーザのタップ動作を携帯電話が検出すると、携帯電話はロングスクリーンショット操作を完了することができる。携帯電話は、図4(e)に示されるGUIを自動的に表示することができる。
図4(e)に示されるGUIを参照すると、GUIは、スクロール翻訳のロードインターフェースである。携帯電話は、ロングスクリーンショット上の英語を対応する中国語に翻訳することができる。翻訳が完了すると、携帯電話は、図4(f)に示されるGUIを自動的に表示することができる。
図4(f)に示されるGUIを参照すると、GUIは、スクロール翻訳の翻訳インターフェースである。携帯電話は、ロングスクリーンショット上の英語エッセイを対応する中国語に既に翻訳している。携帯電話が画面上のユーザの上方または下方スライド操作を検出した後、携帯電話は、スクロールを通じて翻訳コンテンツを表示することができる。
図4(f)に示されるGUIから図4(g)に示されるGUIに変化するプロセスは、第1のロングスクリーンショット撮影を通じて取得された複数画面コンテンツに対応する翻訳をユーザが閲覧するプロセスである。閲覧後、ユーザがソーステキストの残部に対応する翻訳を閲覧し続けたい場合、ユーザは「スクロール翻訳」コントロール403をタップすることができる。ユーザによりコントロール403をタップする操作を検出した後、携帯電話は、図4(h)に示されるGUIを表示することができる。
図4(h)に示されるGUIを参照すると、GUIは、スクロールスクリーンショット撮影の別の表示インターフェースである。携帯電話は、「Fee said he immediately ... rocks at it」(第1のロングスクリーンショット撮影の最後の段落)からロングスクリーンショットを撮影することができる。
図4(i)に示されるGUIを参照すると、画面上のユーザのタップ操作を検出すると、携帯電話はスクロール翻訳を完了することができる。ロングスクリーンショット撮影の最後の段落は、図4(i)に示される「Incidents like these are extremely ... in Ontario」である。
図4(c)および図4(d)は第1のロングスクリーンショット撮影のプロセスであってもよく、図4(h)から図4(i)は第2のロングスクリーンショット撮影のプロセスであってもよいことが、理解されるべきである。
一実施形態では、携帯電話が次にロングスクリーンショットを撮影するとき、次のロングスクリーンショット撮影の開始点は、現在のロングスクリーンショット撮影の最後の段落であってもよい。図4(h)に示されるように、第2のロングスクリーンショット撮影の開始点は、第1のロングスクリーンショット撮影の最後の段落であってもよい。
一実施形態では、携帯電話が次にロングスクリーンショットを撮影するとき、次のロングスクリーンショット撮影の開始点は、現在のロングスクリーンショット撮影の最後の2つの段落などであってもよい。
たとえば、携帯電話は、代わりに「"The screams were so ... situation," ... in the back hip area」(第1のロングスクリーンショット撮影の最後から2つ目の段落)から始まるロングスクリーンショットを撮ってもよい。
一実施形態では、携帯電話が次にロングスクリーンショットを撮影するとき、次のロングスクリーンショット撮影の開始点は、現在のロングスクリーンショット撮影の最終画面コンテンツであってもよい。
携帯電話がロングスクリーンショットを撮った後、ロングスクリーンショット撮影のコンテンツが1つの画面のサイズを超える場合、携帯電話は、ロングスクリーンショット撮影のコンテンツを複数画面コンテンツにセグメント化し得ることが、理解されるべきである。
たとえば、ロングスクリーンショット撮影を通じて生成された長い写真では、携帯電話は、写真の高さと携帯電話の画面の高さとの関係に基づいて写真をセグメント化し、光学文字認識(optical character recognition、OCR)を通じたセグメント化位置で、単語または写真が切り取られるか否かを判定することができる。単語または写真がセグメント化位置で切り取られていると携帯電話が判定した場合、携帯電話は、その高さが画面の高さよりもわずかに低いかまたは等しいいくつかの写真を取得するために、セグメント化位置を空白行位置まで移動させることができる。次のスクロール翻訳中に、現在のロングスクリーンショット撮影を通じて取得された複数の写真(または複数画面コンテンツ)の最後の写真(または最終画面コンテンツ)から開始して、ロングスクリーンショットを撮影することができる。あるいは、現在のロングスクリーンショット撮影を通じて取得された最後の写真(または最終画面コンテンツ)を解析した後、携帯電話は、次のスクロール翻訳中にロングスクリーンショット撮影の開始点として最後の写真の最後の段落、または最後のいくつかの段落のコンテンツを抽出してもよい。
このようにして、以下の利点が達成される。閲読体験に関して、ユーザは、前の翻訳の最後の写真(または最終画面コンテンツ)、または最後の写真(または最終画面コンテンツ)の最後のいくつかの段落から読み始める。これは、記憶を呼び起こし、ユーザの連続的な閲読を支援する機能を有する。
図4(i)に示されるGUIを参照すると、画面上のユーザのタップ操作を検出すると、携帯電話は図4(j)に示されるGUIを自動的に表示することができる。
図4(j)に示されるGUIを参照すると、GUIは、スクロール翻訳の別のロードインターフェースである。携帯電話は、ロングスクリーンショット上の英語を対応する中国語に翻訳することができる。翻訳が完了すると、携帯電話は、図4(k)に示されるGUIを自動的に表示することができる。
図4(k)に示されるGUIを参照すると、GUIは、スクロール翻訳の翻訳インターフェースである。携帯電話は、ロングスクリーンショット上の英語エッセイを対応する中国語に既に翻訳している。携帯電話が画面上のユーザの上方または下方スライド操作を検出した後、携帯電話は、スクロールを通じて翻訳コンテンツを表示することができる。
図4(k)に示されるGUIから図4(l)に示されるGUIに変化するプロセスは、第2のロングスクリーンショット撮影を通じて取得された複数画面コンテンツに対応する翻訳をユーザが閲覧するプロセスである。閲覧後、ユーザがソーステキストの残部に対応する翻訳を閲覧し続けたい場合、ユーザは「スクロール翻訳」コントロール403をタップすることができる。携帯電話は第3のスクロール翻訳を実行することができる。第3のスクロール翻訳のプロセスについては、前述の第2のスクロール翻訳のプロセスを参照されたい。簡潔にするために、本明細書では詳細は再び記載されない。
本出願の一実施形態は機械翻訳方法を提供する。携帯電話は、まず、現在第1の言語(ソーステキストとも呼ばれ得る)を表示しているインターフェースのロングスクリーンショット撮影を可能にし、画面を自動的にスクロールダウンし、携帯電話は、ユーザが画面をタップできることを検出すると、ロングスクリーンショットの撮影を停止する。次に、第2の言語(翻訳とも呼ばれ得る)に翻訳されたテキストデータが新しいインターフェースに表示され、ユーザは、上方/下方スライドを通じてテキストデータを閲覧することができる。次に、ユーザは、翻訳インターフェースにおいて、後続のコンテンツを閲覧し続けることを直接選択することができる(ユーザがタップする「スクロール翻訳」ボタンがインターフェースに提供される)。ユーザが「スクロール翻訳」ボタンを再びタップした後、携帯電話はソーステキストインターフェースにジャンプし、前のロングスクリーンショット撮影が停止した位置にジャンプする(携帯電話が位置を記憶している)。携帯電話は、エッセイの最後に到達するまで前述のプロセスを繰り返すために、前のロングスクリーンショット撮影が停止した位置(または、何らかの冗長なコンテンツを維持することによって前の閲読がどこで停止したかをユーザが思い出せる、その位置の数行前)から再び始まるロングスクリーンショット撮影および翻訳を可能にすることができる。方法は、ウェブベースのブラウザクライアントの翻訳に限定されず、適用可能なシナリオが大幅に拡張され、ユーザの閲読体験の継続がさらに保証されるように、第三者情報APPなどの非ブラウザシナリオにおいてさらに使用され得る。
本出願のこの実施形態では、ユーザがソーステキストの翻訳の操作をトリガした後、電子デバイスは、複数の翻訳方式が選択のためにユーザに提供されるように、「全画面翻訳」オプションおよび「スクロール翻訳」オプションを表示することができ、これにより、ユーザによりソーステキストを翻訳するユーザ体験が向上する。
図3(a)から図3(m)および図4(a)から図4(l)に示されるGUIの前述の2つのグループは、「スクロール翻訳」コントロールをタップすることによってロングスクリーンショット撮影をトリガし、次いでロングスクリーンショット撮影を通じて取得された1つ以上の写真を翻訳するプロセスである。図5(a)から図5(f)を参照して、最初にロングスクリーンショット操作を実行し、取得されたロングスクリーンショット写真の処理インターフェースでロングスクリーンショット写真の翻訳をトリガするプロセスを、以下で説明する。
図5(a)から図5(f)は、本出願の一実施形態によるGUIの別のグループを示す。
図5(a)に示されるGUIを参照すると、GUIは、英語エッセイ303の表示インターフェースである。ユーザがインターフェースに指関節で「S」を描いたことを携帯電話が検出すると、携帯電話はロングスクリーンショット操作を可能にし、図5(b)に示されるGUIを自動的に表示することができる。
図5(b)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影のスクロール表示インターフェースである。図5(b)に示されるように、ロングスクリーンショット撮影のスクロール表示インターフェースは、プロンプトボックス501を含むことができる。プロンプトボックス501では、「スクロールスクリーンショットを撮影 ... スクロール領域をタップしてスクリーンショット撮影を完了する」というテキストが、ユーザに表示され得る。携帯電話は、画面を自動的にスクロールダウンすることができる。たとえば、図5(b)および図5(c)は、英語エッセイを自動的にスクロールダウンするプロセスを示す。
図5(c)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影の別のスクロール表示インターフェースである。画面上のユーザのタップ動作を携帯電話が検出すると、携帯電話はロングスクリーンショット操作を完了することができる。携帯電話は、図5(d)に示されるGUIを自動的に表示することができる。
図5(d)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影を通じて取得された写真の処理インターフェースである。処理インターフェースは、ロングスクリーンショット撮影を通じて取得された写真の処理方式を含み、処理方式は、共有、編集、削除、および翻訳を含む。ユーザは、「共有」をタップすることによって、ロングスクリーンショット撮影を通じて取得された写真を別のユーザと共有することができる。あるいは、ユーザは、「編集」をタップすることによって、ロングスクリーンショット撮影を通じて取得された写真を編集することができる。たとえば、ユーザは、写真に対して輝度編集、露出編集、およびクロッピングなどの編集処理を実行することができる。あるいは、ユーザは、「削除」をタップすることによって、ロングスクリーンショット撮影を通じて取得された写真を削除することができる。ユーザにより「翻訳」に対応するコントロール502をタップする操作を携帯電話が検出すると、携帯電話は、図5(e)に示されるGUIを表示することができる。
図4(d)および図4(i)との違いは以下の通りであることが、理解されるべきである。図4(d)および図4(i)では、翻訳は、スクロールスクリーンショット撮影(またはロングスクリーンショット撮影)が終了した後に自動的に実行される。言い換えると、ユーザが「スクロール翻訳」コントロールをタップしたことを検出した後、携帯電話は、スクロールスクリーンショット撮影(またはロングスクリーンショット撮影)および機械翻訳の2つの動作を自動的にトリガすることができる。図5(d)では、ユーザにより「翻訳」コントロール502をタップする操作がロングスクリーンショット撮影を通じて取得された写真の処理インターフェース内で検出された後に、機械翻訳がトリガされる。言い換えると、携帯電話は、ロングスクリーンショット撮影および機械翻訳を実行するために、ユーザの異なるトリガ操作を検出する必要がある。
図5(e)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影を通じて取得された写真の翻訳ロードインターフェースである。携帯電話は、ロングスクリーンショット撮影を通じて取得された写真上の英語を対応する中国語に翻訳することができる。翻訳が完了すると、携帯電話は、図5(f)に示されるGUIを自動的に表示することができる。
図5(f)に示されるGUIを参照すると、GUIは、ロングスクリーンショット撮影を通じて取得された写真の翻訳インターフェースである。携帯電話は、ロングスクリーンショット撮影を通じて取得された写真上の英語エッセイを対応する中国語に既に翻訳している。携帯電話が画面上のユーザの上方または下方スライド操作を検出した後、携帯電話は、スクロールを通じて翻訳コンテンツを表示することができる。
一実施形態では、ユーザが英語エッセイ内の残りのコンテンツに対応する翻訳を閲覧し続けたい場合、ユーザは図5(f)に示される「スクロール翻訳」コントロール503をタップすることができ、携帯電話はスクロール翻訳プロセスを実行し続けることができる。スクロール翻訳プロセスについては、図3(a)から図3(m)または図4(a)から図4(l)のGUIを参照されたい。
図6(a)から図6(d)は、本出願の一実施形態によるGUIの別のグループを示す。
図6(a)に示されるGUIを参照すると、GUIは、英語エッセイ303の表示インターフェースである。インターフェース内の単語「family」に対してユーザによって実行された押圧操作を検出すると、携帯電話は、図6(b)に示されるGUIを自動的に表示することができる。
図6(b)に示されるGUIを参照すると、GUIは、英語エッセイ303の別の表示インターフェースである。プロンプトボックス601は、表示インターフェースに自動的にポップアップすることができる。プロンプトボックス601は、「コピー」、「共有」、「全て選択」、「ウェブ検索」、「検索」、およびコントロール602を含む。
図6(c)に示されるGUIを参照すると、GUIは、英語エッセイ303の別の表示インターフェースである。ユーザによりコントロール602をタップする操作を検出した後、携帯電話は、プロンプトボックス603を自動的に表示することができる。プロンプトボックス603は、「スクロール翻訳」および「全画面翻訳」を含む。
図6(d)に示されるGUIを参照すると、GUIは、英語エッセイ303の別の表示インターフェースである。ユーザにより「スクロール翻訳」コントロール604をタップする操作を検出した後、携帯電話は、スクロール翻訳を実行することができる。その後のGUI表示については、図4(c)から図4(g)を参照されたい。簡潔にするために、本明細書では詳細は再び記載されない。
図7(a)から図7(d)は、本出願の一実施形態によるGUIの別のグループを示す。
図7(a)に示されるGUIを参照すると、GUIは、英語エッセイ303の表示インターフェースである。インターフェース内の単語「family」に対してユーザによって実行された押圧操作を検出すると、携帯電話は、図7(b)に示されるGUIを自動的に表示することができる。
図7(b)に示されるGUIを参照すると、GUIは、英語エッセイ303の別の表示インターフェースである。表示インターフェースにおいて、携帯電話は、単語「family」を自動的に選択し、プロンプトボックス701を自動的に表示することができる。プロンプトボックス701は、「コピー」、「共有」、「全て選択」、「ウェブ検索」、「検索」などを含む。ユーザがカーソル701をタップし、カーソル701を右にスライドしたことを携帯電話が検出すると、携帯電話は、より多くの単語を選択し、図7(c)に示されるGUIに表示することができる。
図7(c)に示されるGUIを参照すると、GUIは、英語エッセイ303の別の表示インターフェースである。表示インターフェースにおいて、携帯電話は、ユーザのスライド操作に基づいて複数の単語「family was fast asleep」を自動的に選択し、プロンプトボックス701に「スクロール翻訳」機能オプションを自動的に追加することができる。
図7(d)に示されるGUIを参照すると、ユーザにより「スクロール翻訳」コントロール702をタップする操作を検出した後、携帯電話は、クロール翻訳を実行することができる。その後のGUI表示については、図4(c)から図4(g)を参照されたい。簡潔にするために、本明細書では詳細は再び記載されない。
本出願のこの実施形態では、より多くのプロンプトをユーザに提供するために、次のスクロール翻訳(またはロングスクリーンショット翻訳)を実行するときに、携帯電話は、GUIに、スクリーンショット撮影の開始位置、および前の閲読が終了した位置のプロンプトをさらに追加することができる。
図8(a)から図8(e)は、本出願の一実施形態によるGUIの別のグループを示す。
図8(a)に示されるGUIを参照すると、GUIは、第1のスクロール翻訳の翻訳インターフェースであり得る。携帯電話は、第1のロングスクリーンショット撮影を通じて取得された写真上の英語エッセイを対応する中国語に既に翻訳している。携帯電話が画面上のユーザの上方または下方スライド操作を検出した後、携帯電話は、スクロールを通じて翻訳コンテンツを表示することができる。翻訳インターフェースにおいて、ユーザによりコントロール801をタップする操作を検出すると、携帯電話は、図8(b)に示されるGUIを表示することができる。
図8(b)に示されるGUIを参照すると、GUIは、第2のスクロール翻訳の表示インターフェースであり得る。表示インターフェースは、ユーザのための2つのプロンプト情報を含むことができる。1つのプロンプト情報は、段落「Fee said he immediately ... rocks at it」の前である。携帯電話は、「現在のスクリーンショット撮影の開始位置」をユーザに示し、次いでこの段落の後に、「ここは前の閲読が終了した場所です」をユーザに示すことができる。
図8(c)に示されるGUIを参照すると、GUIは、第2のスクロールスクリーンショット撮影の別の表示インターフェースである。携帯電話が画面上のユーザのタップ操作を検出すると、携帯電話は第2のスクロールスクリーンショット撮影を完了し、図8(d)に示されるGUIを表示することができる。
図8(d)に示されるGUIを参照すると、GUIは、第2のスクロールスクリーンショット撮影の翻訳ロードインターフェースである。第2のスクロールスクリーンショット撮影の翻訳を読む前に、現在のスクロールスクリーンショット撮影の開始点、および前の閲読が終了したソーステキストの位置をユーザが最初に閲覧できるように、前述のプロンプト情報もまたロードインターフェースに表示することができる。このようにして、以下の利点が達成される。第2のスクロールスクリーンショット撮影の翻訳を読む前に、ユーザは、第2のスクロールスクリーンショット撮影におけるソーステキストのコンテンツに再び慣れることができる。これは、記憶を呼び起こし、ユーザの連続的な閲読を支援する機能を有する。
図8(e)に示されるGUIを参照すると、GUIは、第2のスクロールスクリーンショット撮影の翻訳表示インターフェースである。前述のプロンプト情報もまた、翻訳表示インターフェースに表示することができる。
一実施形態では、携帯電話は、前述の2つのプロンプト情報のうちの1つのみを表示することができる。
たとえば、プロンプト情報「ここは前の閲読が終了した場所です」のみを、図8(b)、図8(d)、および図8(e)に表示することができる。
たとえば、プロンプト情報 「現在のスクリーンショット撮影の開始位置」のみを、図8(b)、図8(d)、および図8(e)に表示することができる。
図9(a)から図9(f)は、本出願の一実施形態によるGUIの別のグループを示す。
図9(a)に示されるGUIを参照すると、GUIは、第1のスクロール翻訳の翻訳インターフェースであり得る。翻訳インターフェースにおいて、ユーザによりコントロール901をタップする操作を検出すると、携帯電話は、図9(b)に示されるGUIを表示することができる。
図9(b)に示されるGUIを参照すると、GUIは、第2のスクロール翻訳の表示インターフェースであり得る。図4(h)と比較すると、第2のスクロールスクリーンショット撮影は、前のスクロールスクリーンショット撮影のコンテンツを含まず、すなわち、第2のスクロールスクリーンショット撮影は、冗長なソーステキストコンテンツを含まなくてもよい。
図9(c)に示されるGUIを参照すると、GUIは、第2のスクロールスクリーンショット撮影の別の表示インターフェースである。携帯電話が画面上のユーザのタップ操作を検出すると、携帯電話は第2のスクロールスクリーンショット撮影を完了し、図9(d)に示されるGUIを表示することができる。
図9(d)に示されるGUIを参照すると、GUIは、第2のスクロールスクリーンショット撮影の翻訳ロードインターフェースである。
図9(e)に示されるGUIを参照すると、GUIは、第2のスクロールスクリーンショット撮影の翻訳表示インターフェースである。翻訳表示インターフェースに表示された翻訳コンテンツは、第1のスクロールスクリーンショット撮影の翻訳コンテンツも含まない。
図9(e)から図9(f)は、携帯電話がスクロールを通じて翻訳コンテンツを表示するプロセスを示す。携帯電話がユーザの上方または下方スライド操作を検出すると、携帯電話は、スクロールを通じて翻訳コンテンツを表示することができる。
図3(a)から図9(f)に示されるGUIでは、最初の全画面翻訳が完了し、次のスクロール翻訳が実行されると、電子デバイスは、ユーザが所望の翻訳コンテンツを閲覧できるように、スクロール翻訳のためのソーステキストの表示インターフェースに戻り、次いで翻訳インターフェースに戻る必要がある。本出願のこの実施形態では、電子デバイスが全画面翻訳またはスクロール翻訳を1回実行した後、電子デバイスがユーザにより「スクロール翻訳」コントロールをタップする操作を検出した場合、電子デバイスは、ソーステキストインターフェースに切り替えなくてもよく、バックグラウンドでソーステキストの残部を直接ロードし、ソーステキストの残部のスクロールスクリーンショットを撮影し、ソーステキストの残部の翻訳の一部または全部を取得してもよい。ユーザは、ユーザの閲読体験の継続性が向上するように、複数のインターフェース間で切り替えることなく、翻訳インターフェース内の後続の翻訳を読み続けることができる。
図10(a)から図10(e)は、本出願の一実施形態によるGUIの別のグループを示す。
図10(a)に示されるGUIを参照すると、GUIは、ユーザが第1のスクロール翻訳を実行した後に取得された翻訳表示インターフェースであり、ユーザは、指で上方スライドを実行することによって、第1のスクロール翻訳の翻訳コンテンツを閲覧することができる。
たとえば、図10(a)は、図4(a)から図4(f)に基づいて取得されたGUIを示すことができる。
図10(b)に示されるGUIを参照すると、GUIは、ユーザが第1のスクロール翻訳を実行した後に取得された翻訳表示インターフェースである。第1のスクロール翻訳の最終段落は、
Figure 2022549236000002
であることがわかる。ユーザによりコントロール1001をタップする操作を携帯電話が検出した後、携帯電話は、図10(c)に示されるGUIを表示することができる。
図10(c)から図10(e)に示されるGUIを参照すると、GUIは、別の翻訳表示インターフェースである。ユーザによりコントロール1001をタップする操作を携帯電話が検出した後、携帯電話は、バックグラウンドでソーステキストの残部に対応する翻訳を自動的にロードし、翻訳をユーザに表示することができる。
ユーザがコントロール1001をタップした後、携帯電話はソーステキストの残部の全てを翻訳し、次いでソーステキストの残部の全てに対応する翻訳をユーザに提示することができることは、理解されるべきである。残りの全ての翻訳コンテンツがユーザに表示されると、「翻訳を続ける」1001および「翻訳をコピーする」コントロールは、翻訳表示インターフェースに表示されなくてもよい。
一実施形態では、携帯電話上でコントロール1001がタップされた後、携帯電話は、翻訳のためのソーステキストの残部のパーセンテージを選択するように、ユーザをさらに促すことができる。たとえば、携帯電話は、翻訳のためのソーステキストの残部の20%、40%、60%、80%、または100%を選択するようにユーザを促すことができる。ユーザがパーセンテージをタップしたことを携帯電話が検出した後、携帯電話は、パーセンテージに基づいてソーステキストの残部のスクリーンショットを撮影し、次いで、翻訳をユーザに提示するために、スクリーンショットに対応するコンテンツの翻訳を取得することができる。
一実施形態では、携帯電話上でコントロール1001がタップされた後、携帯電話は、ソーステキストの残部の1つ以上の画面を自動的にキャプチャし、次いで、翻訳をユーザに提示するために、スクリーンショットに対応するコンテンツの翻訳を取得することができる。たとえば、ユーザがコントロール1001を1回タップしたときに携帯電話がソーステキストの残部の2つの画面を自動的にキャプチャする、デフォルトのケースがあり得る。
一実施形態では、ユーザは、最初の全画面翻訳の後に取得された翻訳インターフェース内の「翻訳を続ける」コントロールをタップすることができ、次いで携帯電話は、ソーステキストの残部の全てに対応する翻訳をユーザに自動的に提示することができる。具体的には、この場合、ユーザが「翻訳を続ける」コントロールをタップした後、携帯電話は、ソーステキストの残部のスクロールスクリーンショットを自動的に撮影することができる。キャプチャされたコンテンツは、ソーステキストの残部の全てを含むことができる。スクロールスクリーンショットプロセスは、ユーザにとって可視または不可視である。たとえば、図3(f)に示されるように、ユーザがコントロール306(「スクロール翻訳」または「翻訳を続ける」とも呼ばれ得る)をタップした後、携帯電話は、スクロールスクリーンショットを撮影するために図3(g)に示されるインターフェースに切り替えることなく、図3(k)から図3(m)に示される翻訳インターフェースを直接表示することができる。あるいは、「スクロールスクリーンショット」コントロールおよび「翻訳をコピーする」コントロールは、図3(k)から図3(m)に示されるGUIに表示されなくてもよい。
図10(a)から図10(e)に示されるGUIでは、ユーザがより多くの翻訳を閲覧したい場合、ユーザが「翻訳を続ける」コントロールをタップしたことを携帯電話が検出した後、電子デバイスは、ソーステキストと翻訳との間の切り替えが回避されるように、バックグラウンドでスクリーンショット(全画面スクリーンショットまたはロングスクリーンショットであってもよい)を撮った後にソーステキストのより多くの翻訳結果を自動的に取得し、翻訳結果をユーザに提示することができ、これにより、ユーザにより翻訳を閲覧するユーザ体験がさらに向上する。
以上、図3(a)から図10(e)におけるGUIを参照して、本出願の実施形態で提供される機械翻訳プロセスのGUIを説明した。図11を参照して、本出願の一実施形態で提供される別の機械翻訳方法を、以下で説明する。
図11は、本出願の一実施形態による機械翻訳方法1100の概略フローチャートである。図11に示されるように、方法1100は携帯電話によって実行することができ、方法は、以下のステップを含む。
S1101.携帯電話は、ソーステキスト表示インターフェースにおいて2本指押圧操作を検出し、AIタッチを有効化する。
たとえば、図4(a)に示されるように、英語エッセイの表示インターフェース上の2本指押圧操作を検出した後、携帯電話はAIタッチを有効化する。AIタッチは、「全画面翻訳」機能オプションおよび「スクロール翻訳」機能オプションを含むことができる(機能オプションは、コントロールとも呼ばれ得る)。
S1102.携帯電話は、ユーザにより「スクロール翻訳」をタップする操作を検出し、携帯電話は、画面を自動的にスクロールし始める。
たとえば、図4(b)に示されるように、携帯電話がユーザによりコントロール401をタップする操作を検出すると、携帯電話はスクロール翻訳を有効化することができる。
ユーザがソーステキストを読み、2本指で画面を押すと、「スクロール翻訳」オプションが発生する。オプションは、ロングスクリーンショット操作を有効化するためにタップされ、画面のコンテンツが特定の速度およびリズムで自動的に上にスライドされる。ユーザがタッピングを通じてスクリーンショットの撮影を停止できることを示すプロンプトが、画面コンテンツの上にある。あるいは、スクリーンショット撮影は、エッセイの最後に到達したときに自動的に停止する。
たとえば、図4(c)および図4(d)は、携帯電話が画面を自動的にスクロールするプロセスを示す。
S1103.携帯電話は、ユーザが画面上のある位置をタップしたことを携帯電話が検出したとき、またはスライドを通してソーステキストの最後に自動的に到達したことを携帯電話が検出したときに、スクロールスクリーンショットの撮影を停止することができる。
たとえば、図4(d)に示されるように、ユーザが画面上のある位置をタップしたことを携帯電話が検出したとき、携帯電話はスクロールスクリーンショットの撮影を停止してもよい。
S1104.ロングスクリーンショット撮影を通じて取得された長い写真を取得する。
S1105.その高さが予め設定された高さ以下の複数の小写真を取得するために、ロングスクリーンショット撮影を通じて取得された長い写真をクロップし、小写真は、クロッピングを通じて小写真が取得されるたびに、翻訳のためにクラウドに送信され得る。
一実施形態では、予め設定された高さは、携帯電話の画面の高さである。
一実施形態では、予め設定された高さは、携帯電話の画面の高さより小さい予め設定された値である。
たとえば、ロングスクリーンショット撮影を通じて生成された長い写真では、携帯電話は、写真の高さと携帯電話の画面の高さとの関係に基づいて写真をセグメント化し、OCRを通じたセグメント化位置で、単語または写真が切り取られるか否かを判定することができる。単語または写真がセグメント化位置で切り取られていることがわかった場合、携帯電話は、その高さが画面の高さよりもわずかに低いかまたは等しいいくつかの写真を取得するために、セグメント化位置を空白行位置まで移動させる。
セグメント化プロセスでは、生成された複数の小写真は、ソーステキストの順序に基づいて番号付けされてもよく、小写真は、小写真が生成されるたびに、翻訳のために翻訳クラウドに送信される。
携帯電話が長い写真を複数の小写真にセグメント化すると、小写真はソーステキストの順序に基づいて番号付けされてもよく、または携帯電話によって各小写真にラベル情報が追加されてもよく、これらの小写真は翻訳のために翻訳クラウドに送信されることが、理解されるべきである。
S1106.携帯電話は、クラウドから各小写真の翻訳結果を取得する。
S1107.携帯電話は、各小写真が正常に翻訳されたか否かを判定する。
携帯電話は、各小写真の翻訳結果が正常に保存されたか否かを示すフラグビットに基づいて、各小写真が正常に翻訳されたか否かを判定できることが、理解されるべきである。
S1108.受信した小写真が正常に翻訳されている場合、携帯電話は、小写真に対応する翻訳結果をレンダリングおよび保存する。
S1109.受信した小写真が正常に翻訳されていない場合、携帯電話は、小写真に対応するソーステキストを翻訳結果として保存する。
S1110.携帯電話は、全ての小写真の翻訳結果を受信したか否かを判定する。
S1111.携帯電話が全ての小写真の翻訳結果を受信した場合、携帯電話は、全ての小写真のうちの正常に翻訳された写真の数が予め設定された閾値より小さいか否かを判定し続けることができる。
携帯電話が全ての小写真の翻訳結果を受信していない場合、携帯電話は、S1106を実行し続けることができる。
S1112.全ての小写真のうちの正常に翻訳された写真の数が予め設定された閾値より小さいと携帯電話が判定した場合、携帯電話は、リストビューを使用して全ての翻訳結果を表示することができる。
S1113.全ての小写真のうちの正常に翻訳された写真の数が予め設定された閾値以上であると携帯電話が判定した場合、携帯電話は、翻訳が失敗したこと、および翻訳をもう一度実行すべきか否かをユーザに示すことができる。
一実施形態では、クラウドによって返された翻訳結果を取得した後、携帯電話は、翻訳結果に対応する小写真が正常に翻訳されたか否かを判定する。小写真が正常に翻訳されている場合、携帯電話は、翻訳結果をレンダリングおよび保存する。小写真が正常に翻訳されていない場合、携帯電話は、ソーステキストを翻訳結果として保存する。全ての小写真の翻訳結果を受信した後、携帯電話は、正常に翻訳されなかったページの割合を計算し、割合が指定された閾値を超えるか否かを判定し(たとえば、正常に翻訳されなかったページの合計の割合が60%以上)、ユーザに再入力を促す(この場合の確率は比較的低い)。翻訳が成功した場合、携帯電話は、返されたページの番号または返されたページのラベルの順序(すなわち、ソーステキストの順序)に基づいて翻訳結果をソートし、ソートされた翻訳結果を表示する。翻訳表示コンテンツは、長い写真の最初の小写真から始まる。
たとえば、携帯電話は、10枚の小写真を取得するために、ロングスクリーンショット撮影を通じて取得された長い写真をセグメント化し、小写真は順に番号付けされ、次いでクラウドに送信される。携帯電話はクラウドから10枚の小写真の翻訳結果を取得し、ここで8枚の小写真は正常に翻訳され、2枚の小写真は正常に翻訳されておらず、この場合、携帯電話は、現在のスクロール翻訳が成功したと判定することもできる。翻訳結果を表示するとき、携帯電話は、番号に基づいて10枚の小写真の翻訳結果をつなぎ合わせることができる。2枚の正常に翻訳されなかった小写真の位置にはソーステキストを表示することができ、正常に翻訳された他の8枚の小写真の位置には対応する翻訳を表示することができる。
S1106において、携帯電話は複数の小写真を順にクラウドに送信してもよく、クラウドから複数の小写真の翻訳結果を取得するとき、携帯電話は送信順に基づいて小写真の翻訳結果を取得しなくてもよいことが、理解されるべきである。各小写真のコンテンツは異なるので、クラウドによって小写真に対して翻訳処理を実行する期間も異なる。したがって、携帯電話は、送信順に基づいて小写真の翻訳結果を受信しなくてもよい。各小写真は番号付けまたはラベル付けされているので、携帯電話は、複数の小写真の翻訳結果を受信するときに、番号またはラベルに基づいて複数の小写真の翻訳結果をつなぎ合わせることができる。
S1114.ユーザが再び翻訳を実行するように指示したことを検出すると、携帯電話は、S1106から再び翻訳を実行することができる。
S1115.携帯電話は、ユーザがロングスクリーンショット操作を実行し続けるか否かを判定する。
ユーザにより「スクロール翻訳」をタップし続ける操作を翻訳結果インターフェースにおいて検出すると、携帯電話はS1105からS1114を再び実行することができる。
S1102からS1114を再び実行するとき、携帯電話は、前のロングスクリーンショット撮影を通じて取得された長い写真の最後の小写真に自動的にジャンプし、次のスクロール翻訳を開始してもよく、または前のロングスクリーンショット撮影を通じて取得された長い写真の最後の小写真に自動的にジャンプし、最後の小写真の最後の段落または最後のいくつかの段落から始まるロングスクリーンショットを撮影してもよいことが、理解されるべきである。
第1のロングスクリーンショット撮影の翻訳コンテンツを閲覧した後、ユーザは、後続のコンテンツを閲覧し続けること、言い換えるとスクロール翻訳機能を使用し続けることを選択してもよく、または翻訳結果インターフェースを終了してもよい。ユーザが翻訳結果インターフェースを終了した場合、携帯電話は、前のロングスクリーンショット撮影が停止した、最後の小写真のソーステキストコンテンツもしくは最後の小写真の最後の段落または最後のいくつかの段落の位置に戻る。ユーザがスクロール翻訳を使用し続ける場合(言い換えると、ユーザが後続のコンテンツを読み続けたい場合)、携帯電話は、前のロングスクリーンショット撮影が停止した最後の小写真のソーステキストコンテンツを表示するか、または前のロングスクリーンショット撮影が停止した最後の写真の最後の段落または最後のいくつかの段落のソーステキストコンテンツを表示し、エッセイの最後に到達するまで新しいサイクルに入るための新しいロングスクリーンショット操作も有効化する。
一実施形態では、ユーザが現在のロングスクリーンショット撮影の翻訳結果インターフェースから後続のコンテンツを読み続けたい場合、携帯電話は、現在のロングスクリーンショット撮影が停止した最後の小写真のソーステキストコンテンツに戻り、小写真のコンテンツから始まる次のスクロール翻訳操作を有効化する必要がある。このようにして、以下の利点が達成される。閲読体験に関して、ユーザは、前の翻訳の最後のページから読み始める。これは、記憶を呼び起こし、連続的な閲読を支援する機能を有する。スクロールを通じてエッセイの最後に到達したために現在のロングスクリーンショット撮影が停止した場合、ユーザがタップし続けることができる「スクロール翻訳」オプションは、翻訳結果インターフェースに隠される。
S1116.ユーザがロングスクリーンショット撮影の翻訳結果インターフェースを終了させることを携帯電話が検出すると、携帯電話は、前のロングスクリーンショット撮影を通じて取得された長い写真の最後の小写真を表示することができる。
一実施形態では、携帯電話は、代わりに、前のロングスクリーンショット撮影を通じて取得された長い写真の最後の小写真の最後の段落または最後のいくつかの段落を表示することができる。
ブラウザベースのウェブ翻訳と比較して、本出願のこの実施形態の機械翻訳方法は、より広い適用範囲を有し、ユーザがブラウザを使用してニュースを閲覧する必要がある場合に限定されない。特に携帯電話が使用されるとき、多くのユーザが第三者情報APP、たとえばネットイーズ・ニュース(NetEase News)または今日の見出しを閲覧する。ブラウザベースのウェブフルテキスト翻訳方法は、第三者APPシナリオでは使用することができないが、この実施形態で提供される機械翻訳方法は適用可能である。
同様に、単一写真ベースの翻訳の使用中、操作は面倒である。具体的には、ユーザが複数画面コンテンツの翻訳コンテンツを閲覧したい場合、ユーザは画面ごとに「翻訳」ボタンを1回タップする必要がある。したがって、操作は面倒で時間がかかり、ユーザの連続的な閲読が中断される。この実施形態で提供される機械翻訳方法では、後続のコンテンツの翻訳を読むために、ユーザは「翻訳」ボタンを1回タップし、次いで前の翻訳結果インターフェースのスクロール翻訳をトリガし続けるだけでよい。
本出願のこの実施形態の機械翻訳方法は、ユーザがソーステキストに対応する翻訳を閲覧するときに実行される面倒な操作を低減し、電子デバイスの知能を向上させ、ユーザにより翻訳を閲覧するプロセスにおけるユーザ体験を向上させることができる。
前述の実施形態および関連する添付図面を参照すると、本出願の一実施形態は機械翻訳方法を提供する。方法は、図1および図2のタッチスクリーンを有する電子デバイス(たとえば、携帯電話またはタブレットコンピュータ)によって実施され得る。図12に示されるように、方法は、以下のステップを含むことができる。
S1201.電子デバイスは、タッチスクリーン上に第1のユーザインターフェースを表示し、第1のユーザインターフェースは第1のコンテンツを含み、第1のコンテンツの言語は第1の言語である。
たとえば、第1のユーザインターフェースは、図4(a)に示されるGUIであってもよい。
S1202.電子デバイスは、第1のユーザインターフェースにおいて第1の操作を検出し、第1の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む。
たとえば、図4(b)に示されるGUIにおいて、第1の操作は、ユーザによりコントロール401をタップする操作であってもよい。あるいは、第1の操作は、ユーザにより、スクロール翻訳機能をトリガするために使用される音声命令を入力することであってもよい。
S1203.第1の操作に応答して、電子デバイスは、第1のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影する。
たとえば、図4(c)に示されるGUIにおいて、第1の位置は、英語エッセイ303の開始位置であってもよい。たとえば、タイトル「A family ... were sleeping」から始まるスクロールスクリーンショットが撮影される。
S1204.スクロールスクリーンショットプロセスでは、ユーザの第2の操作が第2のユーザインターフェースにおいて検出されると、または第2のユーザインターフェースのスクロールを通じて終了位置に到達すると、電子デバイスは、第2のユーザインターフェースの第2の位置でスクロールスクリーンショットの撮影を停止して、第1の写真を取得し、第1の写真は第2のコンテンツに対応する写真であり、第2のコンテンツは第1の位置から第2の位置までのコンテンツを含み、第2のコンテンツの言語は第1の言語である。
たとえば、図4(d)に示されるGUIにおいて、第2のユーザインターフェースに表示されるコンテンツは、「I don't think ... she wrote」から「Fee said ... rocks at it.」までである。携帯電話が第2のユーザインターフェースの任意の位置でユーザ操作を検出した後、携帯電話は、第2のユーザインターフェースの最後の段落の終了位置でスクロールスクリーンショットの撮影を停止することができる。図4(d)に示されるように、第2の位置は、段落「Fee said ... rocks at it.」の終了位置であってもよい。
一実施形態では、第2のユーザインターフェースの終了位置が完全な段落ではないとき、第2の位置は、段落のものであって第2のユーザインターフェース内に表示される最後の行の終了位置であってもよい。
一実施形態では、第2のユーザインターフェースの終了位置が写真または写真の一部である場合、第2の位置は、写真または写真の一部の上の段落の終了位置であってもよい。
S1205.電子デバイスは、第1の写真に基づいて、第2のコンテンツの翻訳結果を自動的に取得し、第2のコンテンツの翻訳結果の言語は第2の言語である。
たとえば、第1の写真を取得した後、携帯電話は、方法1100の方法に従って第1の写真を処理することができる。たとえば、携帯電話は、第1の写真の高さと携帯電話の画面の高さとの関係に基づいて、第1の写真を複数の写真にセグメント化し、次いで複数の写真を翻訳のためにサーバに送信することができる。携帯電話は、複数の写真の各々のものであり、サーバによって送信された翻訳結果を受信し、各写真の翻訳結果から第2のコンテンツの翻訳結果を生成することができる。
たとえば、第2のコンテンツの翻訳結果は、タイトルに対応する翻訳
Figure 2022549236000003
から第2の位置の前の最後の段落の翻訳
Figure 2022549236000004
までであってもよい。
S1206.電子デバイスは、第2のコンテンツの翻訳結果の一部または全部を自動的に取得した後、第3のユーザインターフェースを自動的に表示し、第3のユーザインターフェースは、第2のコンテンツの翻訳結果の一部または全部を含む。
本出願のこの実施形態では、第2のコンテンツのものであり、携帯電話によって取得される翻訳結果は、第2のコンテンツの翻訳結果の全部であってもよく、言い換えると、携帯電話は、複数の写真の翻訳結果を取得し、各写真は正常に翻訳されているか、または第2のコンテンツの翻訳結果の一部であってもよい。たとえば、複数の写真を受信した後、サーバは、写真のうちの1つを正常に翻訳しない場合があり、携帯電話はまた、正常に翻訳された写真に対応する翻訳を表示することができる。携帯電話は、正常に翻訳されなかった写真に対応するソーステキストコンテンツおよび別の写真に対応する翻訳コンテンツから、第2のコンテンツの翻訳結果を生成することができる。
たとえば、第3のユーザインターフェースは、図4(f)に示されるGUIであってもよく、第2のコンテンツの一部
Figure 2022549236000005
から
Figure 2022549236000006
までがGUIに表示されてもよい。
第3のユーザインターフェースにおいてユーザの上方スライド操作を検出した後、電子デバイスは、第2のコンテンツの翻訳結果の残部を表示することができる。図4(g)に示されるように、タッチスクリーン上でユーザの上方スライド操作を検出した後、携帯電話は、残りの翻訳結果(
Figure 2022549236000007
から
Figure 2022549236000008
まで)を表示することができる。
一実施形態では、方法1200は、以下をさらに含む。
電子デバイスは、第4のユーザインターフェースにおいて第3の操作を検出し、第4のユーザインターフェースは、第2のコンテンツの翻訳結果の最後の部分を含み、第3の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む。
たとえば、第4のユーザインターフェースは、図4(g)に示されるGUIであってもよい。GUIは、第2のコンテンツの翻訳結果の最後の部分を含む。最後の部分は、
Figure 2022549236000009
であってもよい。第3の操作は、ユーザにより「スクロール翻訳」コントロール403をタップする操作であってもよい。
第3の操作に応答して、電子デバイスは、第5のユーザインターフェースを自動的に表示し、第5のユーザインターフェースの第3の位置から始まるスクロールスクリーンショットを撮影し、第5のユーザインターフェースは第3のコンテンツを含み、第3の位置は第2の位置に関連付けられ、第3のコンテンツの言語は第1の言語である。
たとえば、第5のユーザインターフェースは、図4(h)に示されるGUIであってもよく、第3のコンテンツは、
Figure 2022549236000010
から
Figure 2022549236000011
までに対応する英語コンテンツであってもよい。GUIは、携帯電話が、段落「Fee said ... rocks at it.」から始まるスクロールスクリーンショットを撮影することを示している。
スクロールスクリーンショットプロセスでは、ユーザの第4の操作が第6のユーザインターフェースにおいて検出されると、またはスクロールを通じて終了位置に到達すると、電子デバイスは、第2の写真を取得するために、第6のユーザインターフェースの第4の位置でスクロールスクリーンショットの撮影を停止し、第2の写真は第4のコンテンツに対応する写真であり、第4のコンテンツは第3の位置から第4の位置までのコンテンツを含み、第4のコンテンツの言語は第1の言語である。
たとえば、第6のユーザインターフェースは、図4(i)に示されるGUIであってもよい。携帯電話がGUIにおいてユーザによって実行される任意の操作を検出した後、携帯電話はスクロールスクリーンショットの撮影を停止することができる。第4の位置は、図4(i)に示されるGUIの最後の段落の終了位置「Incidents like these ... and one in Ontario.」であってもよい。この場合、第2の写真に含まれる第4のコンテンツは、「Fee said ... rocks at it.」から「Incidents like these ... and one in Ontario.」までの英語コンテンツであってもよい。
電子デバイスは、第2の写真に基づいて、第4のコンテンツの翻訳結果を自動的に取得し、第4のコンテンツの翻訳結果の言語は第2の言語である。
たとえば、電子デバイスは、第2の写真を複数の写真にセグメント化し、次いで複数の写真を翻訳のためにサーバに送信し、サーバから複数の写真の翻訳結果を取得することができる。電子デバイスは、複数の写真の翻訳結果から、第4のコンテンツの翻訳結果を生成することができる。
電子デバイスは、第4のコンテンツの翻訳結果の一部または全部を自動的に取得した後、第7のユーザインターフェースを自動的に表示し、第7のユーザインターフェースは、第4のコンテンツの翻訳結果の一部または全部を含む。
たとえば、第7のユーザインターフェースは、図4(k)に示されるGUIであってもよく、GUIは、第4のコンテンツの翻訳結果の一部を含む。たとえば、GUIに表示される翻訳結果は、「Fee said ... rocks at it」から「It could ... she wrote.」までである。
第7のユーザインターフェースにおいてユーザの上方スライド操作を検出した後、電子デバイスは、第4のコンテンツの翻訳結果の残部を表示することができる。図4(l)に示されるように、タッチスクリーン上でユーザの上方スライド操作を検出した後、携帯電話は、残りの翻訳結果(
Figure 2022549236000012
から
Figure 2022549236000013
まで)を表示することができる。
一実施形態では、方法1200は、以下をさらに含む。
電子デバイスは、第8のユーザインターフェースにおいて第5の操作を検出し、第8のユーザインターフェースは、第2のコンテンツの翻訳結果の最後の部分を含み、第5の操作は、ユーザによりさらなる翻訳をトリガするユーザ操作を含む。
たとえば、第8のユーザインターフェースは、図10(b)に示されるGUIであってもよく、GUIは、全画面翻訳を通じて取得されてもよく、またはスクロール翻訳を通じて取得されてもよい。GUIは、第2のコンテンツの翻訳結果の最後の部分を含むことができ、最後の部分は
Figure 2022549236000014
であり得る。第5の操作は、ユーザにより「翻訳を続ける」コントロール1001をタップする操作であってもよい。
電子デバイスは、第5の操作に応答して第5のコンテンツの翻訳結果を自動的に取得し、第5のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第2のコンテンツ以外のコンテンツの一部または全部を含み、第5のコンテンツの翻訳結果の言語は第2の言語である。
たとえば、携帯電話がユーザによりコントロール1001をタップする操作を検出した後、携帯電話は、ソーステキストの「A family ... were sleeping」から「Fee said ... rocks at it」までのソーステキストの一部以外のソーステキストコンテンツの翻訳結果を取得することができ、言い換えると、携帯電話は、英語エッセイ303の「Meanwhile ... to safety」から終了位置「2019 Cable ... All rights Reserved.」までの翻訳結果を自動的に取得することができる。
たとえば、ユーザによりコントロール1001をタップする操作を検出した後、携帯電話は第3の写真を取得することができる。第3の写真は、英語エッセイ303の「Meanwhile ... to safety」から終了位置「2019 Cable ... All rights Reserved.」までのコンテンツを含む。携帯電話は、第3の写真を複数の写真にセグメント化し、次いで複数の写真を翻訳のためにサーバに送信し、各写真のものであってサーバによって送信された翻訳結果を取得することができる。携帯電話は、複数の写真の翻訳結果を組み合わせて第5のコンテンツの翻訳結果にすることができる。
たとえば、第5のコンテンツは、代わりに、第2のコンテンツ以外のコンテンツの一部を含んでもよい。たとえば、ユーザによりコントロール1001をタップする操作を検出した後、電子デバイスは、第2のコンテンツ以外のコンテンツを複数の部分にセグメント化してもよく、第2のコンテンツは、複数の部分の第1の部分のコンテンツであってもよい。
たとえば、第5のコンテンツは、代わりに、以前に読まれたコンテンツの一部を含んでもよい。
電子デバイスは、第5のコンテンツの翻訳結果の一部または全部を自動的に取得した後に第9のユーザインターフェースを自動的に表示するか、またはユーザのスライド操作を受信した後に第9のユーザインターフェースを表示し、第9のユーザインターフェースは、第5のコンテンツの翻訳結果の一部または全部を含む。
たとえば、図10(c)に示されるGUIは、第5のコンテンツの翻訳結果の一部、たとえば
Figure 2022549236000015
から
Figure 2022549236000016
までを含む。
一実施形態では、方法1200は、以下をさらに含む。第5の操作に応答して、電子デバイスは、第3の写真を取得するためにスクリーンショットを自動的に撮影し、第3の写真は第5のコンテンツを含む。
たとえば、電子デバイスは、スクリーンショット撮影またはスクロールスクリーンショット撮影を通じて第3の写真を取得することができる。
第3の写真を取得した後、電子デバイスは、第3の写真または第3の写真の一部に対応する写真をサーバに送信することができる。電子デバイスは、第3の写真または第3の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
一実施形態では、電子デバイスが第3の写真を取得するためにスクリーンショットを自動的に撮影することは、電子デバイスが第3の写真を取得するために1つ以上の画面のコンテンツをキャプチャするということであり得る。自動スクリーンショットプロセスは、ユーザにとって可視または不可視である。
たとえば、図10(b)および図10(c)からのプロセスでは、自動スクリーンショットプロセスは、ユーザに見えない。別の例では、図4(g)から図4(k)までのプロセスでは、自動スクリーンショットプロセスは、ユーザから見える。
一実施形態では、第5のコンテンツの翻訳結果を自動的に取得した後、電子デバイスは、第3のユーザインターフェースをさらに表示し続けることができる。しかしながら、ユーザがタッチスクリーン上で上方スライドを実行すると、携帯電話は、第5のコンテンツの翻訳結果の一部または全部を表示することができる。
一実施形態では、第2のコンテンツの翻訳結果を自動的に取得する前に、方法は、以下をさらに含む。電子デバイスは、第1の写真を複数の写真に自動的にセグメント化する。第3の位置は、複数の写真のうちの最後の写真内の特定の位置に関し、特定の位置は、最後の写真の開始位置、終了位置、中間位置、または所定割合の位置、もしくは最後の写真の最後の段落の開始位置、または最後のn行の開始位置であり、ここでnは正の整数であり、nは1以上である。
たとえば、第1の写真は、「A family ... were sleeping」から「Fee said ... rocks at it」までのソーステキストコンテンツを含む。携帯電話は、複数の写真を取得するために、第1の写真をセグメント化することができる。たとえば、セグメント化の後に2つの写真が取得され、第1の写真は「A family ... were sleeping」から「The family was ... clamped onto Matthew's arms.」までのソーステキストコンテンツを含み、第2の写真は「I don't ... she wrote」から「Fee said ... rocks at it」までのソーステキストコンテンツを含む。
たとえば、第3の位置は、第2の写真の開始位置であってもよく、この場合、図4(h)に示されるスクロールスクリーンショット撮影の開始位置は、「I don't ... she wrote」であり得る。
別の例では、第3の位置は、第2の写真の中間位置、たとえば「The wolf was ... jumped into help.」であってもよく、この場合、図4(h)に示されるスクロールスクリーンショット撮影の開始位置は、「The wolf was ... jumped into help.」であり得る。
別の例では、第3の位置は、所定割合の位置であってもよい。たとえば、第3の位置は、第2の写真の3分の2の位置であってもよい。たとえば、行「[the wolf]... in the back」から始まるスクロールスクリーンショットが撮影される。この場合、図4(h)に示されるスクロールスクリーンショット撮影の開始位置は、「[the wolf]... in the back」であり得る。
あるいは、第3の位置は、第2の写真の最後の段落の開始位置であってもよい。図4(h)に示されるように、第2の写真の最後の段落「Fee said ... rocks at it」から始まるスクロールスクリーンショットが撮影されてもよい。
別の例では、第3の位置は、第2の写真の最後の段落の最後のn行であってもよい。たとえば、nが2であるとき、携帯電話は、行「and the two ... throwing rocks」から始まるスクロールスクリーンショットを撮影することができる。
一実施形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、複数の写真をサーバに送信する。電子デバイスは、複数の写真の各々についてサーバの翻訳結果を受信する。電子デバイスは、複数の写真のうちのいくつかの翻訳結果から第2のコンテンツの翻訳結果の一部を生成するか、または複数の写真の全ての翻訳結果から第2のコンテンツの翻訳結果を生成する。
電子デバイスが第1の写真および第2の写真を複数の写真にセグメント化するプロセス、ならびに電子デバイスが複数の写真を翻訳のためにサーバに送信して翻訳結果を取得するプロセスについては、方法1100の説明を参照することが、理解されるべきである。簡潔にするために、本明細書では詳細は再び記載されない。
一実施形態では、第3の位置が第1の写真に関連付けられることは、以下を含む。第3の位置は、第1の写真内の特定の位置に関連している。特定の位置は、第1の写真の終了位置、中間位置、または所定割合の位置、もしくは第1の写真の最後の段落の開始位置、または最後のn行の開始位置であり、ここでnは正の整数であり、nは1以上である。
一実施形態では、第3の位置は、第2のコンテンツの終了位置、中間位置、または所定割合の位置に関連しているか、または第3の位置は、第2のコンテンツの最後の段落の開始位置、または最後のn行の開始位置に関連しており、ここでnは正の整数であり、nは1以上である。
本出願のこの実施形態では、電子デバイスは、第1の写真を複数の写真にセグメント化することができ、第3の位置は、複数の写真のうちの最後の写真、または複数の写真のうちの最後の数枚の写真に関連し得る。あるいは、電子デバイスは、第1の写真をセグメント化しなくてもよく、第3の位置は、第1の写真の特定の位置に関連してもよく、第3の位置は、第1の写真に表示された第2のコンテンツに関連してもよい。
本出願のこの実施形態では、電子デバイスは、ソーステキスト内で前のロングスクリーンショット撮影が停止した位置の近傍にジャンプし(電子デバイスが位置を記憶している)、電子デバイスは、前のロングスクリーンショット撮影が停止した位置の近傍から再び始まるスクロールスクリーンショット撮影を可能にし(位置は第1の写真に関連付けられており、何らかの冗長なコンテンツを維持することによって前の閲読がどこで終了したかをユーザが思い出せる)、スクロールスクリーンショット撮影を通じて取得された写真を翻訳のためにサーバに送信することができる。方法は、ウェブベースのブラウザクライアントの翻訳に限定されず、適用可能なシナリオが大幅に拡張され、ユーザの閲読体験の継続がさらに保証されるように、第三者情報APPなどの非ブラウザシナリオにおいてさらに使用され得る。
一実施形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第1の写真、または第1の写真の一部に対応する写真をサーバに送信する。電子デバイスは、第1の写真または第1の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
たとえば、第1の写真を取得した後、電子デバイスは、セグメント化を実行することなく、第1の写真を翻訳のためのサーバに直接送信してもよく、または電子デバイスが第1の写真をサーバに送信した後に、電子デバイスは、第1の写真を複数の写真にセグメント化し、サーバは、複数の写真を翻訳した後、各写真の翻訳結果を電子デバイスに返す。
たとえば、第1の写真を取得した後、電子デバイスは、第1の写真を複数の写真にセグメント化し、複数の写真のうちの第1の写真または最初の数枚の写真を翻訳のためにサーバに送信することができる。次いで、電子デバイスは、第1の写真または最初の数枚の写真のものであり、サーバによって返された、翻訳結果を取得する。
一実施形態では、第2のコンテンツの翻訳結果は、第1の写真に対して光学文字認識(OCR)テキスト認識を実行することによって取得されたテキストコンテンツが第1の言語から第2の言語に翻訳された後に取得されたコンテンツを含む。
一実施形態では、方法は、第3の位置に、または第3の位置の付近に第1のプロンプト情報を表示するステップであって、第1のプロンプト情報は、スクロールスクリーンショット撮影の開始位置をユーザに示すために使用される、ステップ、および/または第2の位置に、または第2の位置の付近に第2のプロンプト情報を表示するステップであって、第2のプロンプト情報は、前の閲読が第2の位置で終了したことをユーザに示すために使用される、ステップを、さらに含む。
たとえば、図8(b)に示されるGUIでは、第1のプロンプト情報は、「Fee said ... rocks at it」の開始位置に含まれてもよく、第1のプロンプト情報は、「現在のスクリーンショット撮影の開始位置」であってもよい。第2のプロンプト情報は、「Fee said ... rocks at it」の終了位置に含まれてもよく、第2のプロンプト情報は、「ここは前の閲読が終了した場所です」であってもよい。
一実施形態では、第1の操作は、ユーザにより、スクロール翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、スクロール翻訳機能をトリガすることができる音声命令を入力することを含む。
たとえば、第1の操作は、ユーザによりコントロール401をタップする操作であってもよく、または第1の操作は、ユーザによって入力された音声命令「スクロール翻訳」であってもよい。
一実施形態では、第3の操作は、ユーザにより、スクロール翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、スクロール翻訳機能をトリガすることができる音声命令を入力することを含む。
たとえば、第3の操作は、ユーザによりコントロール403をタップする操作であってもよく、または第1の操作は、ユーザによって入力された音声命令「スクロール翻訳」であってもよい。
一実施形態では、方法は、ユーザのスライド操作が第3のユーザインターフェースにおいて受信された後に第10のユーザインターフェースを表示するステップであって、第10のユーザインターフェースは、第3のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む、ステップをさらに含む。
たとえば、図10(d)および図10(e)に示されるように、携帯電話がユーザの上方スライド操作を検出した後、携帯電話は、後続の翻訳結果を表示することができる。
一実施形態では、第3の操作を検出する前に、方法は、第4のユーザインターフェースに、スクロール翻訳をトリガすることができるコントロールを表示するステップをさらに含む。
たとえば、図4(g)に示されるように、携帯電話は、表示画面を使用して、コントロール403を表示することができる。
一実施形態では、第5の操作を検出する前に、方法は、第8のユーザインターフェースに、さらなる翻訳をトリガすることができるコントロールを表示するステップをさらに含む。
たとえば、図10(b)に示されるように、携帯電話は、表示画面を使用して、コントロール1001を表示することができる。
一実施形態では、第1のユーザインターフェースにおいて第1の操作を検出するステップは、以下を含む。電子デバイスは、第1のユーザインターフェースにおいてユーザの多指押圧操作を検出した後に、複数の機能コントロールを表示する。複数の機能コントロールは、スクロール翻訳をトリガすることができる第1のコントロールを含む。電子デバイスは、ユーザが第1のコントロールをタップしたこと、またはユーザがスクロール翻訳機能をトリガすることができる音声命令を入力したことを検出する。
たとえば、図4(a)に示されるGUIでは、ユーザの2本指押圧操作を検出したあと、携帯電話は、図4(b)に示されるGUIを表示することができる。複数の機能コントロールがGUIに表示されてもよく、複数の機能コントロールはコントロール401を含む。
一実施形態では、第2のコンテンツは、第1のコンテンツと、第1の言語に対応する全てのコンテンツのうちの第1のコンテンツ以外のコンテンツの一部または全部を含む。
一実施形態では、第3のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第2のコンテンツ以外のコンテンツの一部を含み、第4のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第2のコンテンツ以外のコンテンツの一部または全部を含む。
一実施形態では、第3のコンテンツはまた、第2のコンテンツの一部または全部を含んでもよく、第4のコンテンツもまた、第2のコンテンツの一部または全部を含んでもよい。
一実施形態では、方法は、ユーザのスライド操作が第9のユーザインターフェースにおいて受信された後に第11のユーザインターフェースを表示するステップであって、第11のユーザインターフェースは、第9のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む、ステップをさらに含む。
たとえば、図4(k)に示されるGUIでは、ユーザのスライド操作を検出した後、携帯電話は、後続の翻訳結果を表示することができる。
図13は、本出願の一実施形態による機械翻訳方法1300の概略フローチャートである。図13に示されるように、方法1300は、以下のステップを含む。
S1301.電子デバイスは、タッチスクリーン上に第1のユーザインターフェースを表示し、第1のユーザインターフェースは第1のコンテンツを含み、第1のコンテンツの言語は第1の言語である。
たとえば、第1のユーザインターフェースは、図3(c)に示されるGUIであってもよく、GUIは、タイトル「A family ... were sleeping」から「The family was ... clamped onto Matthew's arms.」までの英語コンテンツを含む。
S1302.電子デバイスは、第1のユーザインターフェースにおいてユーザの第1の操作を検出し、第1の操作は、ユーザにより全画面翻訳をトリガするユーザ操作を含む。
たとえば、図3(d)に示されるGUIを参照すると、第1の操作は、ユーザによりコントロール305をタップする操作であってもよい。ユーザによりコントロール305をタップする操作を検出した後、携帯電話は、スクリーンショット操作を実行するように最初にトリガされてもよい。
S1303.第1の操作に応答して、電子デバイスは、第1のユーザインターフェースのスクリーンショットを撮影して、第1の写真を取得する。
たとえば、図3(d)に示されるGUIを参照すると、第1の写真は、現在の画面上に表示されたソーステキストコンテンツのスクリーンショットを撮影することにより、携帯電話によって取得されてもよく、タイトル「A family ... were sleeping」から「The family was ... clamped onto Matthew's arms.」までの英語コンテンツが、第1の写真に表示される。
S1304.電子デバイスは、第1の写真に基づいて、第1のコンテンツの翻訳結果を自動的に取得し、第1のコンテンツの翻訳結果の言語は第2の言語である。
たとえば、電子デバイスは、第1の写真をサーバに送信し、第1の写真のものであってサーバによって返された翻訳結果を受信することができる。
第1のコンテンツの翻訳結果は、第1の写真に対して光学文字認識(OCR)テキスト認識を実行することによって取得されたテキストコンテンツが第1の言語から第2の言語に翻訳された後に取得されたコンテンツを含む。
S1305.電子デバイスは、第1のコンテンツの翻訳結果を自動的に取得した後、第2のユーザインターフェースを自動的に表示し、第2のユーザインターフェースは、第1のコンテンツの翻訳結果の一部または全部を含む。
たとえば、第2のユーザインターフェースは、図3(f)に示されるGUIであってもよく、GUIは、第1のコンテンツの翻訳結果を含む。第1のコンテンツの翻訳結果は、タイトル
Figure 2022549236000017
から
Figure 2022549236000018
までである。
S1306.電子デバイスは、第2のユーザインターフェースにおいてユーザの第2の操作を検出し、第2の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む。
たとえば、第2のユーザインターフェースはコントロール306を含んでもよく、第2の操作は、ユーザによりコントロール306をタップする操作であってもよい。携帯電話がユーザによりコントロール306をタップする操作を検出した後、携帯電話はスクロール翻訳操作を実行することができる。
S1307.第2の操作に応答して、電子デバイスは、第3のユーザインターフェースを自動的に表示し、第3のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影し、第3のユーザインターフェースは第2のコンテンツを含み、第1の位置は第1の写真に関連付けられ、第2のコンテンツの言語は第1の言語である。
たとえば、図3(f)に示されるGUIでは、ユーザによりコントロール306をタップする操作を検出した後、携帯電話は、図3(g)に示されるGUIを自動的に表示することができる。図3(g)に示されるGUIは、スクロールスクリーンショット撮影の表示インターフェースであり、第1の位置は、タイトル「A family ... were sleeping」の開始位置であってもよい。
S1308.スクロールスクリーンショットプロセスでは、ユーザの第3の操作が第4のユーザインターフェースにおいて検出されると、または第4のユーザインターフェースのスクロールを通じて終了位置に到達すると、電子デバイスは、第4のインターフェースの第2の位置でスクロールスクリーンショットの撮影を停止して、第2の写真を取得し、第2の写真は第3のコンテンツに対応する写真であり、第3のコンテンツは第1の位置から第2の位置までのコンテンツを含み、第3のコンテンツの言語は第1の言語である。
たとえば、図3(g)から図3(i)に示されるように、スクロールを通じて終了位置に到達すると、電子デバイスは、スクロールスクリーンショットの撮影を自動的に停止することができ、第2の位置は、「2019 Cable News ... rights Reserved.」の終了位置であってもよい。スクロールスクリーンショットを停止すると、電子デバイスは第2の写真を取得することができる。タイトル「A family ... were sleeping」の開始位置から「2019 Cable News ... rights Reserved.」の終了位置までのソーステキストコンテンツが、第2の写真上に表示され得る。
S1309.電子デバイスは、第2の写真に基づいて、第3のコンテンツの翻訳結果を自動的に取得し、第3のコンテンツの翻訳結果の言語は第2の言語である。
たとえば、スクロールスクリーンショット撮影を通じて第2の写真を取得した後、電子デバイスは、第2の写真上の第3のコンテンツの翻訳結果を取得し続けることができる。たとえば、電子デバイスは、第2の写真を複数の写真にセグメント化し、複数の写真を翻訳のためにサーバに送信することができる。電子デバイスは、複数の写真のものであってサーバによって返された翻訳結果を受信する。複数の写真の翻訳結果は、第3のコンテンツの翻訳結果を構成する。
S1310.電子デバイスは、第3のコンテンツの翻訳結果の一部または全部を自動的に取得した後、第5のユーザインターフェースを自動的に表示し、第5のユーザインターフェースは、第3のコンテンツの翻訳結果の一部または全部を含む。
たとえば、第5のユーザインターフェースは図3(k)に示されてもよく、図3(k)に示されるGUIは、第3のコンテンツの翻訳結果の一部、たとえば、タイトル
Figure 2022549236000019
から
Figure 2022549236000020
までを含む。
一実施形態では、方法は、ユーザのスライド操作が第5のユーザインターフェースにおいて受信された後に第6のユーザインターフェースを表示するステップであって、第6のユーザインターフェースは、第5のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む、ステップをさらに含む。
電子デバイスがタッチスクリーン上でユーザの上方スライド操作を検出した後、電子デバイスは、より多くの翻訳コンテンツを表示することができる。たとえば、図3(k)から図3(m)は、ユーザがスライドを実行した後に後続の翻訳を表示するプロセスを示す。
一実施形態では、第3のコンテンツの翻訳結果を自動的に取得する前に、方法は、以下をさらに含む。電子デバイスは、第2の写真を複数の写真に自動的にセグメント化する。電子デバイスは、複数の写真をサーバに送信する。電子デバイスは、複数の写真の各々についてサーバの翻訳結果を受信する。電子デバイスは、複数の写真のうちのいくつかの翻訳結果から第3のコンテンツの翻訳結果の一部を生成するか、または複数の写真の全ての翻訳結果から第3のコンテンツの翻訳結果を生成する。
一実施形態では、第3のコンテンツの翻訳結果は、第2の写真に対してOCRテキスト認識を実行することによって取得されたテキストコンテンツが第1の言語から第2の言語に翻訳された後に取得されたコンテンツを含む。
電子デバイスが第2の写真を複数の写真にセグメント化するプロセスについては、方法1100の説明を参照することが、理解されるべきである。簡潔にするために、本明細書では詳細は再び記載されない。
一実施形態では、方法は、第1の位置に、または第1の位置の付近に第1のプロンプト情報を表示するステップであって、第1のプロンプト情報は、スクロールスクリーンショット撮影の開始位置をユーザに示すために使用される、ステップ、および/または第1の写真の終了位置に第2のプロンプト情報を表示するステップであって、第2のプロンプト情報は、前の閲読が終了位置で終了したことをユーザに示すために使用される、ステップを、さらに含む。
第1のプロンプト情報および第2のプロンプト情報については、図8(a)から図8(e)に示されるGUIを参照することが、理解されるべきである。全画面翻訳が完了すると、携帯電話は、スクロール翻訳を実行するときに、スクロールスクリーンショットインターフェースに第1のプロンプト情報および/または第2のプロンプト情報を表示することができる。
一実施形態では、第2の操作は、ユーザにより、スクロール翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、スクロール翻訳機能をトリガすることができる音声命令を入力することを含む。
たとえば、図3(f)に示されるように、第2の操作は、ユーザによりコントロール306をタップする操作であってもよい。
一実施形態では、第1の位置が第1の写真に関連付けられることは、以下を含む。第1の位置は、第1の写真内の特定の位置に関連している。特定の位置は、第1の写真の終了位置、中間位置、または所定割合の位置、もしくは第1の写真の最後の段落の開始位置、または最後のn行の開始位置であり、ここでnは正の整数であり、nは1以上である。
たとえば、図3(g)に示されるように、段落「It was like ... on Facebook」から始まるスクロールスクリーンショットが撮影されてもよい。
たとえば、所定割合の位置は、第1の写真の3分の2の位置であってもよい。たとえば、行「when the incident ... Friday,」から始まるスクロールスクリーンショットが撮影されてもよい。
一実施形態では、第1の位置が第1の写真に関連付けられることは、以下を含む。第1の位置は、第1のコンテンツの終了位置、中間位置、または所定割合の位置に関連しているか、または第1の位置は、第1のコンテンツの最後の段落の開始位置、または最後のn行の開始位置に関連しており、ここでnは正の整数であり、nは1以上である。
たとえば、A family ... were sleeping」から「The family was ... clamped onto Matthew's arms.」までの英語コンテンツの行または段落から始まるスクロールスクリーンショットが撮影されてもよい。
一実施形態では、第2のユーザインターフェースにおいてユーザの第2の操作を検出する前に、方法は、第2のユーザインターフェースに、スクロール翻訳をトリガすることができるコントロールを表示するステップをさらに含む。
たとえば、コントロール306は、図3(f)に示されるGUIに表示されてもよい。
一実施形態では、第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップは、ユーザの多指押圧操作が第1のユーザインターフェースにおいて検出された後に複数の機能コントロールを表示するステップであって、複数の機能コントロールは、全画面翻訳をトリガすることができる第1のコントロールを含む、ステップと、ユーザが第1のコントロールをタップしたこと、またはユーザが全画面翻訳機能をトリガすることができる音声命令を入力したことを検出するステップと、を含む。
たとえば、ユーザがコントロール305をタップする前に、ユーザは、図3(c)に示されるGUIを2本指で押すことができる。ユーザの2本指押圧操作を検出した後、携帯電話は、複数のコントロールを表示することができる。複数のコントロールは、コントロール305を含む。
一実施形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、以下を含む。電子デバイスは、第2の写真、または第2の写真の一部に対応する写真をサーバに送信する。電子デバイスは、第2の写真または第2の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信する。
図14は、本出願の一実施形態による機械翻訳方法1400の概略フローチャートである。図14に示されるように、方法1400は、以下のステップを含む。
S1401.タッチスクリーン上に第1のユーザインターフェースを表示し、第1のユーザインターフェースは第1のコンテンツを含み、第1のコンテンツの言語は第1の言語である。
S1402.第1のユーザインターフェースにおいてユーザの第1の操作を検出し、第1の操作は、ユーザにより全画面翻訳をトリガするユーザ操作を含む。
S1403.第1の操作に応答して、第1のユーザインターフェースのスクリーンショットを撮影して、第1の写真を取得する。
S1404.第1の写真に基づいて、第1のコンテンツの翻訳結果を自動的に取得し、第1のコンテンツの翻訳結果の言語は第2の言語である。
S1405.第1のコンテンツの翻訳結果が自動的に取得された後、第2のユーザインターフェースを自動的に表示し、第2のユーザインターフェースは、第1のコンテンツの翻訳結果の一部または全部を含む。
S1401からS1405については、S1301からS1305の前述の説明を参照することが、理解されるべきである。簡潔にするために、本明細書では詳細は再び記載されない。
S1406.第2のユーザインターフェースにおいてユーザの第2の操作を検出し、第2の操作は、ユーザによりさらなる翻訳をトリガするユーザ操作を含む。
S1407.第2の操作に応答して、第2のコンテンツの翻訳結果を自動的に取得し、第2のコンテンツは、第1の言語に対応する全てのコンテンツのうちの第1のコンテンツ以外のコンテンツの一部または全部を含み、第2のコンテンツの翻訳結果の言語は第2の言語である。
S1408.第2のコンテンツの翻訳結果の一部または全部が自動的に取得された後、第3のユーザインターフェースを自動的に表示するか、またはユーザのスライド操作が受信された後に第3のユーザインターフェースを表示し、第3のユーザインターフェースは、第2のコンテンツの翻訳結果の一部または全部を含む。
S1406からS1408のプロセスについては、方法1300の関連する説明を参照することが、理解されるべきである。簡潔にするために、本明細書では詳細は再び記載されない。
本出願のこの実施形態では、電子デバイスが全画面翻訳を1回実行した後、電子デバイスは、「翻訳を続ける」コントロールをユーザに提供することができる。ユーザが「翻訳を続ける」コントロールをタップしたことを検出した後、電子デバイスは、バックグラウンドで、ソーステキストの残部に対応する翻訳の全部または一部を直接ロードすることができる。このように、電子デバイスは、ユーザにより翻訳を読むユーザ体験をさらに向上できるように、スクロールスクリーンショット撮影のためにソーステキストインターフェースにジャンプする必要がない。
一実施形態では、第2の操作に応答して、電子デバイスは、第2の写真を取得するためにスクリーンショットを自動的に撮影し、第2の写真は、第2のコンテンツに対応する写真である。第2のコンテンツの翻訳結果を自動的に取得するステップは、第2の写真に基づいて、第2のコンテンツの翻訳結果を自動的に取得するステップを含む。
一実施形態では、第2のコンテンツの翻訳結果を自動的に取得するステップは、第2の写真、または第2の写真の一部に対応する写真をサーバに送信するステップと、第2の写真または第2の写真の一部に対応する写真のものであり、サーバによって返された、翻訳結果を受信するステップと、を含む。
一実施形態では、電子デバイスが第2の写真を取得するためにスクリーンショットを自動的に撮影することは、以下を含む。電子デバイスは、第2の写真を取得するために、1つ以上の画面のコンテンツを自動的にキャプチャする。自動スクリーンショットプロセスは、ユーザにとって可視または不可視である。
一実施形態では、電子デバイスが第2のコンテンツの翻訳結果を自動的に取得することは、以下を含む。電子デバイスは、第2の写真を複数の写真に自動的にセグメント化する。電子デバイスは、複数の写真をサーバに送信する。電子デバイスは、複数の写真の各々についてサーバの翻訳結果を受信する。電子デバイスは、複数の写真のうちのいくつかの翻訳結果から第2のコンテンツの翻訳結果の一部を生成するか、または複数の写真の全ての翻訳結果から第2のコンテンツの翻訳結果を生成する。
セグメント化の実行から翻訳結果の取得までのプロセスについては、方法1100を参照することが、理解されるべきである。簡潔にするために、本明細書では詳細は再び記載されない。
一実施形態では、第2の操作は、ユーザにより、さらなる翻訳機能をトリガすることができる第1のコントロールをタップすること、またはユーザにより、さらなる翻訳機能をトリガすることができる音声命令を入力することを含む。
一実施形態では、方法は、以下をさらに含む。電子デバイスは、第3のユーザインターフェースにおいてユーザのスライド操作を受信した後に第4のユーザインターフェースを表示し、第4のユーザインターフェースは、第3のユーザインターフェースに含まれる翻訳結果に関連付けられた後続の翻訳結果を含む。
一実施形態では、第1のユーザインターフェースにおいてユーザの第1の操作を検出する前に、方法は、以下をさらに含む。電子デバイスは、第1のユーザインターフェースに、全画面翻訳をトリガすることができるコントロールを表示する。
一実施形態では、第2のユーザインターフェースにおいてユーザの第2の操作を検出する前に、方法は、以下をさらに含む。電子デバイスは、第2のユーザインターフェースに、さらなる翻訳をトリガすることができるコントロールを表示する。
一実施形態では、第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップは、以下を含む。電子デバイスは、第1のユーザインターフェースにおいてユーザの多指押圧操作を検出した後に複数の機能コントロールを表示し、複数の機能コントロールは、全画面翻訳をトリガすることができる第1のコントロールを含み、電子デバイスは、ユーザが第1のコントロールをタップしたこと、またはユーザが全画面翻訳機能をトリガすることができる音声命令を入力したことを検出する。
当業者は、本明細書に開示された実施形態に記載されるユニットおよびアルゴリズムステップと組み合わせて、電子ハードウェアまたはコンピュータソフトウェアと電子ハードウェアの組み合わせによって本出願が実装され得ることを認識するであろう。機能がハードウェアとソフトウェアのどちらによって実行されるかは、技術的解決策の特定の用途および設計上の制約に依存する。当業者であれば、特定の用途ごとに異なる方法を用いて、説明されている機能を実施することができるが、その実装形態は、本出願の範囲を超えるものと見なされるべきではない。
簡便かつ簡潔に説明するために、前述のシステム、装置、およびユニットの詳細な動作プロセスについては、前述の方法実施形態における対応するプロセスを参照することは、当業者であれば明確に理解することができ、本明細書では詳細は再び記載されない。実施形態は、相互に参照し、組み合わることができる。
本出願で提供されるいくつかの実施形態では、開示されたシステム、装置、および方法は、他の方法で実装されてもよいことが理解されるべきである。たとえば、記載された装置実施形態は一例に過ぎない。たとえば、ユニットに分割することは、単なる論理的機能分割であって、実際の実装時には他の分割であってもよい。たとえば、複数のユニットまたは構成要素は、別のシステムに組み合わされてもよく、もしくは統合されてもよく、または一部の特徴は無視されてもよく、もしくは実行されなくてもよい。加えて、表示または説明された相互結合または直接結合または通信接続は、いくつかのインターフェースを介して実装されてもよい。装置間またはユニット間の間接的結合または通信接続は、電気的形態、機械的形態、またはその他の形態で実装されてもよい。
別個の部分として説明されているユニットは物理的に分離していてもいなくてもよく、ユニットとして表示されている部分は物理的なユニットであってもなくてもよく、一箇所に置かれてもよく、または複数のネットワークユニット上に分散されてもよい。ユニットの一部または全部は、実施形態の解決策の目的を達成するために、実際の要件に基づいて選択されてもよい。
加えて、本出願の実施形態における機能ユニットは、1つの処理ユニットに統合されてもよく、またはユニットの各々は、物理的に単独で存在してもよく、または2つ以上のユニットが1つのユニットに統合される。
機能がソフトウェア機能ユニットの形で実装され、独立した製品として販売または使用されるとき、機能はコンピュータ可読記憶媒体に保存されてもよい。このような理解に基づき、本出願の技術的解決策を本質的に、または現在の技術に寄与する部分を、または技術的な解決策の一部を、ソフトウェア製品の形態で実現することができる。コンピュータソフトウェア製品は、記憶媒体に記憶され、本出願の実施形態に記載された方法のステップの全部または一部を実施するように、(パーソナルコンピュータ、サーバ、またはネットワーク機器であってもよい)コンピュータデバイスに命令するためのいくつかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、読み出し専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク、または光ディスクなどの、プログラムコードを記憶し得る任意の媒体を含む。
前述の説明は、本出願の特定の実装形態に過ぎず、本出願の保護範囲を限定することを意図されていない。本出願で開示される技術的範囲内で当業者によって容易に考案される任意の変形または代替は、本出願の保護範囲内にあるものとする。したがって、本出願の保護範囲は、請求項の保護範囲に従うものとする。
1 アンテナ
2 アンテナ
100 電子デバイス
110 プロセッサ
120 外部メモリインターフェース
121 内部メモリ
130 USBインターフェース
140 充電管理モジュール
141 電源管理モジュール
142 バッテリ
150 移動通信モジュール
160 無線通信モジュール
170 オーディオモジュール
170A スピーカ
170B 受信機
170C マイクロフォン
170D ヘッドセットジャック
180 センサモジュール
180A 圧力センサ
180B ジャイロセンサ
180C 気圧センサ
180D 磁気センサ
180E 加速度センサ
180F 距離センサ
180G 光学式近接センサ
180H 指紋センサ
180J 温度センサ
180K タッチセンサ
180L 周囲光センサ
180M 骨伝導センサ
190 コンパス
191 モータ
192 インジケータ
193 カメラ
194 表示画面
195 SIMカードインターフェース
301 第2のデスクトップページ
302 アイコン
303 英語エッセイ
304 プロンプトボックス
305 コントロール
306 コントロール
307 プロンプトボックス
308 スクロールバー
309 コントロール
401 コントロール
402 プロンプトボックス
403 コントロール
501 プロンプトボックス
502 コントロール
503 コントロール
601 プロンプトボックス
602 コントロール
603 プロンプトボックス
604 コントロール
701 プロンプトボックス、カーソル
702 コントロール
801 コントロール
901 コントロール
1001 コントロール
1100 機械翻訳方法

Claims (18)

  1. 電子デバイスであって、
    タッチスクリーンと、
    1つ以上のプロセッサと、
    1つ以上のメモリと
    を備え、
    前記1つ以上のメモリは1つ以上のコンピュータプログラムを記憶し、前記1つ以上のコンピュータプログラムは命令を含み、前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記タッチスクリーン上に第1のユーザインターフェースを表示するステップであって、前記第1のユーザインターフェースは第1のコンテンツを備え、前記第1のコンテンツの言語は第1の言語である、ステップと、
    前記第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップであって、前記第1の操作は、前記ユーザにより全画面翻訳をトリガするユーザ操作を含む、ステップと、
    前記第1の操作に応答して、
    前記第1のユーザインターフェースのスクリーンショットを撮影することによって取得される第1の写真を取得するステップと、
    前記第1の写真に基づいて前記第1のコンテンツの翻訳結果を取得するステップであって、前記第1のコンテンツの前記翻訳結果の言語は第2の言語である、ステップと、
    第2のユーザインターフェースを表示するステップであって、前記第2のユーザインターフェースは、前記第1のコンテンツの前記翻訳結果の一部または全部を備える、ステップと、
    前記第2のユーザインターフェースにおいて、前記ユーザの第2の操作を検出するステップであって、前記第2の操作は、前記ユーザによりスクロール翻訳をトリガするユーザ操作を含む、ステップと、
    前記第2の操作に応答して、第3のユーザインターフェースを表示し、前記第3のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影するステップであって、前記第3のユーザインターフェースは第2のコンテンツを備え、前記第1の位置は、前記第1の写真、前記第1のコンテンツ、または前記第1のユーザインターフェースに関連付けられ、前記第2のコンテンツの言語は前記第1の言語である、ステップと、
    前記スクロールスクリーンショットのプロセスにおいて、前記ユーザの第3の操作が第4のユーザインターフェースにおいて検出されるとき、または前記第4のユーザインターフェースのスクロールを通じて終了位置に到達するとき、前記第4のインターフェースの第2の位置で前記スクロールスクリーンショットの撮影を停止して、第2の写真を取得するステップであって、前記第2の写真は第3のコンテンツに対応する写真であり、前記第3のコンテンツは前記第1の位置から前記第2の位置までのコンテンツを備え、前記第3のコンテンツの言語は前記第1の言語である、ステップと、
    前記第2の写真に基づいて前記第3のコンテンツの翻訳結果を取得するステップであって、前記第3のコンテンツの前記翻訳結果の言語は前記第2の言語である、ステップと、
    前記第3のコンテンツの前記翻訳結果の一部または全部が取得された後に第5のユーザインターフェースを表示するステップであって、前記第5のユーザインターフェースは前記第3のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を実行する、電子デバイス。
  2. 前記第1の位置が前記第1の写真に関連付けられることは、前記第1の位置が前記第1の写真の特定の位置に関連しており、前記特定の位置は、
    前記第1の写真の終了位置、中間位置、または所定割合の位置、または
    前記第1の写真の最後の段落の開始位置、または最後のn行の開始位置であり、nは正の整数であり、nは1以上である
    ことを含む、請求項1に記載の電子デバイス。
  3. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記第3のコンテンツの前記翻訳結果が取得される前に、前記第2の写真を複数の写真にセグメント化するステップと、
    前記複数の写真をサーバに送信するステップと、
    前記複数の写真の各々について前記サーバの翻訳結果を受信するステップと、
    前記複数の写真のうちのいくつかの翻訳結果から前記第3のコンテンツの前記翻訳結果の一部を生成するか、または前記複数の写真の全ての翻訳結果から前記第3のコンテンツの前記翻訳結果を生成するステップと
    を実行する、請求項1または2に記載の電子デバイス。
  4. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記第1の位置に、または前記第1の位置の付近に第1のプロンプト情報を表示するステップであって、前記第1のプロンプト情報は、スクロールスクリーンショット撮影の開始位置を前記ユーザに示すために使用される、ステップ、および/または
    前記第1の写真の前記終了位置に第2のプロンプト情報を表示するステップであって、前記第2のプロンプト情報は、前の閲読が前記終了位置で終了したことを前記ユーザに示すために使用される、ステップ
    を実行する、請求項1から3のいずれか一項に記載の電子デバイス。
  5. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記ユーザの多指押圧操作が前記第1のユーザインターフェースにおいて検出された後に複数の機能コントロールを表示するステップであって、前記複数の機能コントロールは、全画面翻訳をトリガすることができる第1のコントロールを含む、ステップと、
    前記ユーザが前記第1のコントロールをタップしたこと、または前記ユーザが全画面翻訳機能をトリガすることができる音声命令を入力したことを検出するステップと
    を実行する、請求項1から4のいずれか一項に記載の電子デバイス。
  6. 電子デバイスであって、
    タッチスクリーンと、
    1つ以上のプロセッサと、
    1つ以上のメモリと
    を備え、
    前記1つ以上のメモリは1つ以上のコンピュータプログラムを記憶し、前記1つ以上のコンピュータプログラムは命令を含み、前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記タッチスクリーン上に第1のユーザインターフェースを表示するステップであって、前記第1のユーザインターフェースは第1のコンテンツを備え、前記第1のコンテンツの言語は第1の言語である、ステップと、
    前記第1のユーザインターフェースにおいて第1の操作を検出するステップであって、前記第1の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む、ステップと、
    前記第1の操作に応答して、前記第1のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影するステップと、
    前記スクロールスクリーンショットのプロセスにおいて、前記ユーザの第2の操作が第2のユーザインターフェースにおいて検出されるとき、または前記第2のユーザインターフェースのスクロールを通じて終了位置に到達するとき、前記第2のユーザインターフェースの第2の位置で前記スクロールスクリーンショットの撮影を停止して、第1の写真を取得するステップであって、前記第1の写真は第2のコンテンツに対応する写真であり、前記第2のコンテンツは前記第1の位置から前記第2の位置までのコンテンツを備え、前記第2のコンテンツの言語は前記第1の言語である、ステップと、
    前記第1の写真に基づいて前記第2のコンテンツの翻訳結果を取得するステップであって、前記第2のコンテンツの前記翻訳結果の言語は第2の言語である、ステップと、
    前記第2のコンテンツの前記翻訳結果の一部または全部が取得された後に第3のユーザインターフェースを表示するステップであって、前記第3のユーザインターフェースは前記第2のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を実行する、電子デバイス。
  7. 前記1つ以上のプロセッサによって前記命令が実行されると、前記電子デバイスは、
    第4のユーザインターフェースにおいて第3の操作を検出するステップであって、前記第4のユーザインターフェースは、前記第2のコンテンツの前記翻訳結果の最後の部分を備え、前記第3の操作は前記ユーザによりスクロール翻訳をトリガするユーザ操作を含む、ステップと、
    前記第3の操作に応答して、第5のユーザインターフェースを表示し、前記第5のユーザインターフェースの第3の位置から始まるスクロールスクリーンショットを撮影するステップであって、前記第5のユーザインターフェースは第3のコンテンツを備え、前記第3の位置は、前記第1の写真、前記第2の位置、前記第2のコンテンツ、または前記第2のユーザインターフェースに関連付けられ、前記第3のコンテンツの言語は前記第1の言語である、ステップと、
    前記スクロールスクリーンショットのプロセスにおいて、前記ユーザの第4の操作が第6のユーザインターフェースにおいて検出されるとき、またはスクロールを通じて終了位置に到達するとき、前記第6のユーザインターフェースの第4の位置において前記スクロールスクリーンショットの撮影を停止して、第2の写真を取得するステップであって、前記第2の写真は第4のコンテンツに対応する写真であり、前記第4のコンテンツは前記第3の位置から前記第4の位置までのコンテンツを備え、前記第4のコンテンツの言語は前記第1の言語である、ステップと、
    前記第2の写真に基づいて前記第4のコンテンツの翻訳結果を取得するステップであって、前記第4のコンテンツの前記翻訳結果の言語は前記第2の言語である、ステップと、
    前記第4のコンテンツの前記翻訳結果の一部または全部が取得された後に第7のユーザインターフェースを表示するステップであって、前記第7のユーザインターフェースは前記第4のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を実行する、請求項6に記載の電子デバイス。
  8. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記第2のコンテンツの前記翻訳結果が取得される前に、前記第1の写真を複数の写真にセグメント化するステップ、
    を実行し、
    前記第3の位置は、前記複数の写真のうちの最後の写真の特定の位置に関連しており、前記特定の位置は、
    前記最後の写真の開始位置、終了位置、中間位置、または所定割合の位置、または
    前記最後の写真の最後の段落の開始位置、または最後のn行の開始位置であり、nは正の整数であり、nは1以上である、
    請求項7に記載の電子デバイス。
  9. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記第3の位置に、または前記第3の位置の付近に第1のプロンプト情報を表示するステップであって、前記第1のプロンプト情報は、スクロールスクリーンショット撮影の開始位置を前記ユーザに示すために使用される、ステップ、および/または
    前記第2の位置に、または前記第2の位置の付近に第2のプロンプト情報を表示するステップであって、前記第2のプロンプト情報は、前の閲読が前記第2の位置で終了したことを前記ユーザに示すために使用される、ステップ
    を実行する、請求項7または8に記載の電子デバイス。
  10. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    第8のユーザインターフェースにおいて第5の操作を検出するステップであって、前記第8のユーザインターフェースは、前記第2のコンテンツの前記翻訳結果の最後の部分を備え、前記第5の操作は、前記ユーザによりさらなる翻訳をトリガするユーザ操作を含む、ステップと、
    前記第5の操作に応答して、第5のコンテンツの翻訳結果を取得するステップであって、前記第5のコンテンツは、前記第1の言語に対応する全てのコンテンツのうちの前記第2のコンテンツ以外のコンテンツの一部または全部を備え、前記第5のコンテンツの前記翻訳結果の言語は前記第2の言語である、ステップと、
    前記第5のコンテンツの前記翻訳結果の一部または全部が取得された後に第9のユーザインターフェースを表示するか、または前記ユーザのスライド操作が受信された後に前記第9のユーザインターフェースを表示するステップであって、前記第9のユーザインターフェースは、前記第5のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を実行する、請求項6に記載の電子デバイス。
  11. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記第2のコンテンツの前記翻訳結果が取得される前に、前記第1の写真を複数の写真にセグメント化するステップと、
    前記複数の写真をサーバに送信するステップと、
    前記複数の写真の各々について前記サーバの翻訳結果を受信するステップと、
    前記複数の写真のうちのいくつかの翻訳結果から前記第2のコンテンツの前記翻訳結果の一部を生成するか、または前記複数の写真の全ての翻訳結果から前記第2のコンテンツの前記翻訳結果を生成するステップと
    を実行する、請求項6から10のいずれか一項に記載の電子デバイス。
  12. 電子デバイスであって、
    タッチスクリーンと、
    1つ以上のプロセッサと、
    1つ以上のメモリと
    を備え、
    前記1つ以上のメモリは1つ以上のコンピュータプログラムを記憶し、前記1つ以上のコンピュータプログラムは命令を含み、前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記タッチスクリーン上に第1のユーザインターフェースを表示するステップであって、前記第1のユーザインターフェースは第1のコンテンツを備え、前記第1のコンテンツの言語は第1の言語である、ステップと、
    前記第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップであって、前記第1の操作は、前記ユーザにより全画面翻訳をトリガするユーザ操作を含む、ステップと、
    前記第1の操作に応答して、
    前記第1のユーザインターフェースのスクリーンショットを撮影して、第1の写真を取得するステップと、
    前記第1の写真に基づいて前記第1のコンテンツの翻訳結果を取得するステップであって、前記第1のコンテンツの前記翻訳結果の言語は第2の言語である、ステップと、
    第2のユーザインターフェースを表示するステップであって、前記第2のユーザインターフェースは、前記第1のコンテンツの前記翻訳結果の一部または全部を備える、ステップと、
    前記第2のユーザインターフェースにおいて前記ユーザの第2の操作を検出するステップであって、前記第2の操作は、前記ユーザによりさらなる翻訳をトリガするユーザ操作を含む、ステップと、
    前記第2の操作に応答して第2のコンテンツの翻訳結果を取得するステップであって、前記第2のコンテンツは、前記第1の言語に対応する全てのコンテンツのうちの前記第1のコンテンツ以外のコンテンツの一部または全部を備え、前記第2のコンテンツの前記翻訳結果の言語は前記第2の言語である、ステップと、
    前記第2のコンテンツの前記翻訳結果の一部または全部が取得された後に第3のユーザインターフェースを表示するか、または前記ユーザのスライド操作が受信された後に前記第3のユーザインターフェースを表示するステップであって、前記第3のユーザインターフェースは、前記第2のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を実行する、電子デバイス。
  13. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記第2の操作に応答して、スクリーンショットを撮影して、第2の写真を取得するステップであって、前記第2の写真は前記第2のコンテンツに対応する写真であり、前記スクリーンショットプロセスは前記ユーザに見えない、ステップと、
    前記第2の写真を複数の写真にセグメント化するステップと、
    前記複数の写真をサーバに送信するステップと、
    前記複数の写真の各々について前記サーバの翻訳結果を受信するステップと、
    前記複数の写真のうちのいくつかの翻訳結果から前記第2のコンテンツの前記翻訳結果の一部を生成するか、または前記複数の写真の全ての翻訳結果から前記第2のコンテンツの前記翻訳結果を生成するステップと
    を実行する、請求項12に記載の電子デバイス。
  14. 前記1つ以上のプロセッサによって前記命令が実行されるとき、前記電子デバイスは、
    前記ユーザの多指押圧操作が前記第1のユーザインターフェースにおいて検出された後に複数の機能コントロールを表示するステップであって、前記複数の機能コントロールは、全画面翻訳をトリガすることができる第1のコントロールを含む、ステップと、
    前記ユーザが前記第1のコントロールをタップしたこと、または前記ユーザが全画面翻訳機能をトリガすることができる音声命令を入力したことを検出するステップと
    を実行する、請求項12または13に記載の電子デバイス。
  15. 機械翻訳方法であって、前記方法は、タッチスクリーンを有する電子デバイスに適用され、
    前記タッチスクリーン上に第1のユーザインターフェースを表示するステップであって、前記第1のユーザインターフェースは第1のコンテンツを備え、前記第1のコンテンツの言語は第1の言語である、ステップと、
    前記第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップであって、前記第1の操作は、前記ユーザにより全画面翻訳をトリガするユーザ操作を含む、ステップと、
    前記第1の操作に応答して、
    前記第1のユーザインターフェースのスクリーンショットを撮影することによって取得される第1の写真を取得するステップと、
    前記第1の写真に基づいて前記第1のコンテンツの翻訳結果を取得するステップであって、前記第1のコンテンツの前記翻訳結果の言語は第2の言語である、ステップと、
    第2のユーザインターフェースを表示するステップであって、前記第2のユーザインターフェースは、前記第1のコンテンツの前記翻訳結果の一部または全部を備える、ステップと、
    前記第2のユーザインターフェースにおいて、前記ユーザの第2の操作を検出するステップであって、前記第2の操作は、前記ユーザによりスクロール翻訳をトリガするユーザ操作を含む、ステップと、
    前記第2の操作に応答して、第3のユーザインターフェースを表示し、前記第3のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影するステップであって、前記第3のユーザインターフェースは第2のコンテンツを備え、前記第1の位置は、前記第1の写真、前記第1のコンテンツ、または前記第1のユーザインターフェースに関連付けられ、前記第2のコンテンツの言語は前記第1の言語である、ステップと、
    前記スクロールスクリーンショットのプロセスにおいて、前記ユーザの第3の操作が第4のユーザインターフェースにおいて検出されるとき、または前記第4のユーザインターフェースのスクロールを通じて終了位置に到達するとき、前記第4のインターフェースの第2の位置で前記スクロールスクリーンショットの撮影を停止して、第2の写真を取得するステップであって、前記第2の写真は第3のコンテンツに対応する写真であり、前記第3のコンテンツは前記第1の位置から前記第2の位置までのコンテンツを備え、前記第3のコンテンツの言語は前記第1の言語である、ステップと、
    前記第2の写真に基づいて前記第3のコンテンツの翻訳結果を取得するステップであって、前記第3のコンテンツの前記翻訳結果の言語は前記第2の言語である、ステップと、
    前記第3のコンテンツの前記翻訳結果の一部または全部が取得された後に第5のユーザインターフェースを表示するステップであって、前記第5のユーザインターフェースは前記第3のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を含む、機械翻訳方法。
  16. 機械翻訳方法であって、前記方法は、タッチスクリーンを有する電子デバイスに適用され、
    前記タッチスクリーン上に第1のユーザインターフェースを表示するステップであって、前記第1のユーザインターフェースは第1のコンテンツを備え、前記第1のコンテンツの言語は第1の言語である、ステップと、
    前記第1のユーザインターフェースにおいて第1の操作を検出するステップであって、前記第1の操作は、ユーザによりスクロール翻訳をトリガするユーザ操作を含む、ステップと、
    前記第1の操作に応答して、前記第1のユーザインターフェースの第1の位置から始まるスクロールスクリーンショットを撮影するステップと、
    前記スクロールスクリーンショットのプロセスにおいて、前記ユーザの第2の操作が第2のユーザインターフェースにおいて検出されるとき、または前記第2のユーザインターフェースのスクロールを通じて終了位置に到達するとき、前記第2のユーザインターフェースの第2の位置で前記スクロールスクリーンショットの撮影を停止して、第1の写真を取得するステップであって、前記第1の写真は第2のコンテンツに対応する写真であり、前記第2のコンテンツは前記第1の位置から前記第2の位置までのコンテンツを備え、前記第2のコンテンツの言語は前記第1の言語である、ステップと、
    前記第1の写真に基づいて前記第2のコンテンツの翻訳結果を取得するステップであって、前記第2のコンテンツの前記翻訳結果の言語は第2の言語である、ステップと、
    前記第2のコンテンツの前記翻訳結果の一部または全部が取得された後に第3のユーザインターフェースを表示するステップであって、前記第3のユーザインターフェースは前記第2のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を含む、機械翻訳方法。
  17. 機械翻訳方法であって、前記方法は、タッチスクリーンを有する電子デバイスに適用され、
    前記タッチスクリーン上に第1のユーザインターフェースを表示するステップであって、前記第1のユーザインターフェースは第1のコンテンツを備え、前記第1のコンテンツの言語は第1の言語である、ステップと、
    前記第1のユーザインターフェースにおいてユーザの第1の操作を検出するステップであって、前記第1の操作は、前記ユーザにより全画面翻訳をトリガするユーザ操作を含む、ステップと、
    前記第1の操作に応答して、
    前記第1のユーザインターフェースのスクリーンショットを撮影して、第1の写真を取得するステップと、
    前記第1の写真に基づいて前記第1のコンテンツの翻訳結果を取得するステップであって、前記第1のコンテンツの前記翻訳結果の言語は第2の言語である、ステップと、
    第2のユーザインターフェースを表示するステップであって、前記第2のユーザインターフェースは、前記第1のコンテンツの前記翻訳結果の一部または全部を備える、ステップと、
    前記第2のユーザインターフェースにおいて前記ユーザの第2の操作を検出するステップであって、前記第2の操作は、前記ユーザによりさらなる翻訳をトリガするユーザ操作を含む、ステップと、
    前記第2の操作に応答して第2のコンテンツの翻訳結果を取得するステップであって、前記第2のコンテンツは、前記第1の言語に対応する全てのコンテンツのうちの前記第1のコンテンツ以外のコンテンツの一部または全部を備え、前記第2のコンテンツの前記翻訳結果の言語は前記第2の言語である、ステップと、
    前記第2のコンテンツの前記翻訳結果の一部または全部が取得された後に第3のユーザインターフェースを表示するか、または前記ユーザのスライド操作が受信された後に前記第3のユーザインターフェースを表示するステップであって、前記第3のユーザインターフェースは、前記第2のコンテンツの前記翻訳結果の一部または全部を備える、ステップと
    を含む、機械翻訳方法。
  18. コンピュータ命令を含むコンピュータ可読記憶媒体であって、前記コンピュータ命令が電子デバイスにおいて実行されるとき、前記電子デバイスは、請求項15から17のいずれか一項に記載の機械翻訳方法を実行する、コンピュータ可読記憶媒体。
JP2022517924A 2019-09-20 2020-09-18 機械翻訳方法および電子デバイス Pending JP2022549236A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910895234.XA CN110781688B (zh) 2019-09-20 2019-09-20 机器翻译的方法和电子设备
CN201910895234.X 2019-09-20
PCT/CN2020/116128 WO2021052458A1 (zh) 2019-09-20 2020-09-18 机器翻译的方法和电子设备

Publications (1)

Publication Number Publication Date
JP2022549236A true JP2022549236A (ja) 2022-11-24

Family

ID=69384112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022517924A Pending JP2022549236A (ja) 2019-09-20 2020-09-18 機械翻訳方法および電子デバイス

Country Status (6)

Country Link
US (1) US11847314B2 (ja)
EP (1) EP4033394A4 (ja)
JP (1) JP2022549236A (ja)
CN (3) CN110781688B (ja)
BR (1) BR112022005108A2 (ja)
WO (1) WO2021052458A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200100918A (ko) * 2019-02-19 2020-08-27 삼성전자주식회사 카메라를 이용하는 어플리케이션을 통해 다양한 기능을 제공하는 전자 장치 및 그의 동작 방법
CN110109593B (zh) * 2019-04-29 2021-04-02 维沃移动通信有限公司 一种截屏方法及终端设备
CN110442879B (zh) * 2019-04-30 2024-02-13 华为技术有限公司 一种内容翻译的方法和终端
CN110781688B (zh) * 2019-09-20 2023-11-07 华为技术有限公司 机器翻译的方法和电子设备
CN111553172A (zh) * 2020-04-02 2020-08-18 支付宝实验室(新加坡)有限公司 翻译文案展示方法、装置、系统及存储介质
CN111401323A (zh) * 2020-04-20 2020-07-10 Oppo广东移动通信有限公司 文字翻译方法、装置、存储介质及电子设备
CN113885973A (zh) * 2020-07-02 2022-01-04 华为技术有限公司 翻译结果显示方法、装置及电子设备
CN114721614A (zh) * 2020-12-22 2022-07-08 华为技术有限公司 一种调用其他设备能力的方法、电子设备和系统
CN114970459A (zh) * 2021-02-26 2022-08-30 Oppo广东移动通信有限公司 文本处理方法、装置以及电子设备
CN114967994A (zh) * 2021-02-26 2022-08-30 Oppo广东移动通信有限公司 文本处理方法、装置以及电子设备
CN112905093B (zh) * 2021-03-10 2022-11-15 Oppo广东移动通信有限公司 内容显示方法、装置、存储介质及电子设备
CN117157613A (zh) * 2021-04-06 2023-12-01 三星电子株式会社 用于执行捕获功能的电子设备和用于操作电子设备的方法
CN115756269A (zh) * 2021-09-02 2023-03-07 荣耀终端有限公司 翻译方法及电子设备
CN113919374B (zh) * 2021-09-08 2022-06-24 荣耀终端有限公司 语音翻译的方法、电子设备及存储介质
CN113970971B (zh) * 2021-09-10 2022-10-04 荣耀终端有限公司 基于触控笔的数据处理方法和装置
CN115016694A (zh) * 2021-11-18 2022-09-06 荣耀终端有限公司 一种应用程序启动方法及电子设备
CN114995698A (zh) * 2022-06-17 2022-09-02 维沃移动通信有限公司 图像处理方法、装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981566A (ja) * 1995-09-08 1997-03-28 Toshiba Corp 翻訳装置及び翻訳方法
US20130246039A1 (en) * 2012-03-13 2013-09-19 Eric Duneau System and method for enhanced screen copy

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004092338A2 (en) * 2003-04-11 2004-10-28 Diadexus, Inc. Compositions, splice variants and methods relating to cancer specific genes and proteins
WO2010096120A1 (en) 2008-10-29 2010-08-26 Google Inc. System and method for translating timed text in web video
US20110216095A1 (en) * 2010-03-04 2011-09-08 Tobias Rydenhag Methods, Devices, and Computer Program Products Providing Multi-Touch Drag and Drop Operations for Touch-Sensitive User Interfaces
CN103294665A (zh) * 2012-02-22 2013-09-11 汉王科技股份有限公司 电子阅读器文本翻译的方法及电子阅读器
CN104636326A (zh) * 2014-12-30 2015-05-20 小米科技有限责任公司 一种文字信息的翻译方法及装置
US9985922B2 (en) * 2015-05-29 2018-05-29 Globechat, Inc. System and method for multi-langual networking and communication
CN105094628A (zh) * 2015-07-31 2015-11-25 联想(北京)有限公司 一种截屏方法及电子设备
CN106776582A (zh) * 2015-11-24 2017-05-31 英业达科技有限公司 实时翻译系统、方法及计算机可读取记录媒体
CN105487766A (zh) * 2015-11-24 2016-04-13 努比亚技术有限公司 一种实现截图的方法和装置
US10324828B2 (en) * 2016-03-28 2019-06-18 Dropbox, Inc. Generating annotated screenshots based on automated tests
US9953030B2 (en) * 2016-08-24 2018-04-24 International Business Machines Corporation Automated translation of screen images for software documentation
WO2018062580A1 (ko) * 2016-09-28 2018-04-05 주식회사 시스트란인터내셔널 문자를 번역하는 방법 및 그 장치
CN107967099A (zh) * 2016-10-19 2018-04-27 中兴通讯股份有限公司 一种终端截屏的方法、装置及移动终端
CN107832311A (zh) * 2017-11-30 2018-03-23 珠海市魅族科技有限公司 一种翻译方法、装置、终端及可读存储设备
CN108829686B (zh) * 2018-05-30 2022-04-15 北京小米移动软件有限公司 翻译信息显示方法、装置、设备及存储介质
CN108959274B (zh) * 2018-06-27 2022-09-02 维沃移动通信有限公司 一种应用程序的翻译方法及服务器
CN110764673A (zh) 2018-07-28 2020-02-07 华为技术有限公司 滚动截屏的方法及电子设备
CN110442879B (zh) * 2019-04-30 2024-02-13 华为技术有限公司 一种内容翻译的方法和终端
CN110209456A (zh) * 2019-05-31 2019-09-06 努比亚技术有限公司 屏幕界面长截图的方法、移动终端及计算机可读存储介质
CN110781688B (zh) 2019-09-20 2023-11-07 华为技术有限公司 机器翻译的方法和电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981566A (ja) * 1995-09-08 1997-03-28 Toshiba Corp 翻訳装置及び翻訳方法
US20130246039A1 (en) * 2012-03-13 2013-09-19 Eric Duneau System and method for enhanced screen copy

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"ジェスチャーと操作", HUAWEI NOVA LITE 2 取扱説明書[ONLINE], JPN6023022939, 19 September 2019 (2019-09-19), pages 10 - 12, ISSN: 0005075271 *

Also Published As

Publication number Publication date
EP4033394A4 (en) 2022-11-16
CN112183121B (zh) 2022-02-25
WO2021052458A1 (zh) 2021-03-25
CN110781688B (zh) 2023-11-07
US11847314B2 (en) 2023-12-19
US20220382448A1 (en) 2022-12-01
BR112022005108A2 (pt) 2022-06-21
CN112183121A (zh) 2021-01-05
CN110781688A (zh) 2020-02-11
CN114503116A (zh) 2022-05-13
EP4033394A1 (en) 2022-07-27

Similar Documents

Publication Publication Date Title
EP4033394A1 (en) Machine translation method and electronic device
JP7385008B2 (ja) スクリーン取り込み方法及び関連するデバイス
EP3226537B1 (en) Mobile terminal and method for controlling the same
CN110362244B (zh) 一种分屏方法及电子设备
WO2020062294A1 (zh) 系统导航栏的显示控制方法、图形用户界面及电子设备
CN110119296B (zh) 切换父页面和子页面的方法、相关装置
US20140226052A1 (en) Method and mobile terminal apparatus for displaying specialized visual guides for photography
JP7302038B2 (ja) ユーザプロフィールピクチャ生成方法および電子デバイス
WO2022062898A1 (zh) 一种窗口显示方法及设备
KR20180133743A (ko) 이동 단말기 및 그 제어 방법
US20220214891A1 (en) Interface display method and electronic device
CN110442277B (zh) 显示预览窗口信息的方法及电子设备
CN110830645B (zh) 一种操作方法和电子设备及计算机存储介质
WO2022228042A1 (zh) 显示方法、电子设备、存储介质和程序产品
WO2024088253A1 (zh) 折叠屏显示方法及电子设备
WO2023160455A1 (zh) 删除对象的方法及电子设备
WO2023246666A1 (zh) 一种搜索方法及电子设备
US20240103717A1 (en) Multi-Interface Display Method and Electronic Device
WO2024125301A1 (zh) 显示方法和电子设备
WO2024078120A9 (zh) 文件管理方法、设备及存储介质
EP4258649A1 (en) Method for determining tracking target, and electronic device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230830

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240326

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240402