JP2020515996A - 認識した語を迅速に挿入する方法およびデバイス - Google Patents

認識した語を迅速に挿入する方法およびデバイス Download PDF

Info

Publication number
JP2020515996A
JP2020515996A JP2020500950A JP2020500950A JP2020515996A JP 2020515996 A JP2020515996 A JP 2020515996A JP 2020500950 A JP2020500950 A JP 2020500950A JP 2020500950 A JP2020500950 A JP 2020500950A JP 2020515996 A JP2020515996 A JP 2020515996A
Authority
JP
Japan
Prior art keywords
image
word
document
camera
edited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020500950A
Other languages
English (en)
Inventor
▲鉞▼▲堅▼ 区
▲鉞▼▲堅▼ 区
志▲軍▼ 黄
志▲軍▼ 黄
延平 高
延平 高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Publication of JP2020515996A publication Critical patent/JP2020515996A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本願の実施形態は、認識した語を迅速に挿入する方法およびデバイスを開示する。方法は、編集対象文書を開くステップと、ユーザの画像取得命令を取得するステップと、必要な語を含む画像を取得するステップと、画像中の必要な語を第1の文書編集ソフトウェアで認識するステップと、必要な語を編集対象文書中に移動するステップとを含む。本願の実施形態にて提供される方法を使用することにより、作業効率を向上できる。【選択図】図1

Description

本願は、参照により、そのすべてが本明細書に組み込まれている2017年3月20日に中華人民共和国国家知的財産局に出願した「認識した語を迅速に挿入する方法およびデバイス」との名称の中国特許出願第201710165750.8号の優先権を主張するものである。
本願は、電子文書編集の分野に関し、詳細には、認識した語を迅速に挿入する方法および装置に関する。
ユーザは、コンピュータおよび移動電話などの端末デバイスの文書編集ソフトウェアを使用して文書を編集する場合、場合により、画像中の語、ビデオ中の語、非複製可能電子文書中の語などの、外部キャリアからのいくつかの非複製可能テキストを文書中に挿入することがある。従来技術において、キャリアは、フォーマット変換ソフトウェアを使用して非画像フォーマットから画像フォーマットに変換され、次に、別の既存の画像認識プログラムを使用して画像中の語が認識され、認識した語が編集対象文書中に複写される。
従来技術の場合、複数のソフトウェアおよびプログラムを使用して、外部キャリア中の語が編集対象文書中に挿入され、また、語は、認識後に編集対象文書中に手作業で複写され、そのため、より低い作業効率をもたらしていることが分かる。
他の解決策では、ユーザが、非複製可能語を編集対象文書中に挿入することを行う場合、ユーザは、手作業でタイプすることで、これらの非複製可能語を文書に追加できるが、より低い作業効率をもたらしている。
本願の実施形態の目的は、認識した語を迅速に挿入し、それにより作業効率を向上する方法およびデバイスを提供することである。具体的な技術的解決策は、以下の通りである。
本願の実施形態は、認識した語を迅速に挿入する方法およびデバイスを開示する。方法は、
編集対象文書を開くステップと、
ユーザから画像取得命令を取得するステップと、
必要な語を含む画像を画像取得命令に従って取得するステップと、
画像中の必要な語を第1の文書編集ソフトウェアで認識するステップと、
必要な語を編集対象文書中に移動するステップと、を含む。
任意選択で、画像取得命令は、
スクリーンショットにて画像を取得する命令、を含む。
任意選択で、必要な語を含む画像を画像取得命令に従って取得するステップは、
画像取得命令がスクリーンショットにて画像を取得する命令である場合、画像取得命令に従ってスクリーンショット範囲を取得するステップであって、スクリーンショット範囲が必要な語を含むステップと、
スクリーンショット範囲中の画像をキャプチャするステップと、を含む。
任意選択で、スクリーンショット範囲を取得するステップは、
マウスボックスにて選択された画像範囲をスクリーンショット範囲として取得するステップ、または、
タッチスクリーン上の軌道ボックスにて選択された画像範囲をスクリーンショット範囲として取得するステップ、を含む。
任意選択で、画像取得命令は、
カメラにて画像を取得する命令、を含む。
任意選択で、必要な語を含む画像をユーザからの画像取得命令に従って取得するステップは、
画像取得命令がカメラにて画像を取得する命令である場合、カメラを起動し、かつ、カメラの視覚可能キャプチャ領域が必要な語を含むことを確認するステップと、
カメラの視覚可能キャプチャ領域に対する画像をキャプチャするステップと、を含む。
任意選択で、必要な語を編集対象文書中に移動するステップは、
必要な語を編集対象文書中の挿入位置へ移動するステップであって、挿入位置は、マウスカーソルが置かれている位置、または、タッチスクリーン上のカーソルが置かれている位置であるステップ、を含む。
本願の実施形態は、さらに、認識した語を迅速に挿入する装置を開示する。装置は、
編集対象文書を開く構成とされた開モジュールと、
ユーザから画像取得命令を取得する構成とされた命令取得モジュールと、
必要な語を含む画像を画像取得命令に従って取得する構成とされた画像取得モジュールと、
画像中の必要な語を第1の文書編集ソフトウェアで認識する構成とされた認識モジュールと、
必要な語を編集対象文書中に移動する構成とされた語移動モジュールと、を備える。
任意選択で、画像取得命令は、
スクリーンショットにて画像を取得する命令、を含む。
任意選択で、画像取得モジュールは、
画像取得命令がスクリーンショットにて画像を取得する命令である場合、画像取得命令に従ってスクリーンショット範囲を取得する構成とされたスクリーンショット範囲取得サブモジュールであって、スクリーンショット範囲が必要な語を含むスクリーンショット範囲取得サブモジュールと、
スクリーンショット範囲中の画像をキャプチャする構成とされたスクリーンショットサブモジュールと、を備える。
任意選択で、スクリーンショット範囲取得サブモジュールは、特に、
マウスボックスにて選択された画像範囲をスクリーンショット範囲として取得、または
タッチスクリーン上の軌道ボックスにて選択された画像範囲をスクリーンショット範囲として取得する、構成とされる。
任意選択で、画像取得命令は、
カメラにて画像を取得する命令、を含む。
任意選択で、画像取得モジュールは、
画像取得命令がカメラにて画像を取得する命令である場合、カメラを起動し、かつ、カメラの視覚可能キャプチャ領域が必要な語を含むことを確認する構成とされたカメラ起動サブモジュールと、
カメラの視覚可能キャプチャ領域に対する画像をキャプチャする構成とされた画像キャプチャサブモジュールと、を備える。
任意選択で、語移動モジュールは、特に、
必要な語を編集対象文書中の挿入位置へ移動する構成とされ、挿入位置は、マウスカーソルが置かれている位置、またはタッチスクリーン上のカーソルが置かれている位置である。
本願の実施形態は、さらに、プロセッサおよびメモリを備える電子デバイスを開示する。
メモリは、コンピュータプログラムを記憶する構成とされる。
プロセッサは、メモリ上に記憶されているプログラムを実行した場合、認識した語を迅速に挿入する上記の方法のいずれかを実施する構成とされる。
本願の実施形態は、さらに、コンピュータプログラムが記憶されるコンピュータ可読記憶媒体を開示する。コンピュータプログラムは、プロセッサにて実行されると、認識した語を迅速に挿入する上記のいずれかを実施する構成とされる。
本願の実施形態は、さらに、認識した語を迅速に挿入する任意の上記方法を実施するように操作される実行可能プログラムコードを開示する。
本願の実施形態にて提供される、認識した語を迅速に挿入する方法およびデバイスは、必要な非複製可能語を外部キャリアから挿入しなければならない場合に適用される。ユーザの画像取得命令が取得される。必要な語を含む画像が画像取得命令に従って取得される。次に、画像中の必要な語が第1の文書編集ソフトウェアで認識される。最後に、必要な語が編集対象文書中に追加される。本願の実施形態では、文書を第1の文書編集ソフトウェアで編集する場合、必要な語を含む画像を取得でき、また、画像中の必要な語を認識し、かつ、編集対象文書中に自動的に挿入できる。本願の実施形態では、認識した語は、単に第1の文書編集ソフトウェアを使用して自動的に挿入し、これは、複数のソフトウェアおよびプログラムを必要とし、また、必要な語を手作業で複写する従来技術、あるいは認識した語を手作業でタイプして挿入する従来技術と比較して、作業効率を向上させる。
当然に、本願を実施するための任意の製品または方法は、必ずしも上述したすべての利点を有する必要はない。
本願の実施形態および従来技術の技術的解決策をより明確に説明するために、以下、本願の実施形態および従来技術で使用される図面について簡単に説明する。以下の図面は本願の一部の実施形態にすぎず、当業者は、これらの図面に基づいて、創造的な努力を全く必要とすることなく他の図面を同様に得ることができることは明らかである。
本願の実施形態に係る、認識した語を迅速に挿入する方法の概略フローチャートである。 本願の実施形態に係る、必要な語を含む画像の概略図である。 図1に示す方法に基づく例の概略フローチャートである。 図1に示す方法に基づく別の例の概略フローチャートである。 本願の実施形態に係る、認識した語を迅速に挿入するデバイスの概略構造図である。 図5に示すデバイスに基づく例の概略構造図である。 図5に示すデバイスに基づく別の例の概略構造図である。 本願の実施形態に係る、電子デバイスの概略構造図である。
本願の目的、技術的解決策ならびに利点をより明確にし、かつ、理解可能にするために、以下、本願について、添付の図面および実施形態を参照してより詳細に説明する。説明する実施形態は、本願の実施形態の全てではなく、一部にすぎないことは明らかである。本願の実施形態に基づいて、創造的な労力を全く必要とすることなく当業者にて得られるその他のすべての実施形態は、本願の保護範囲に含まれる。
本願の実施形態は、認識した語を迅速に挿入する、作業効率を向上できる方法および装置を提供する。
本願の実施形態に係る方法は、ユーザから画像取得命令を取得するステップと、必要な語を含む画像を取得するステップと、画像中の必要な語を第1の文書編集ソフトウェアを使用することで認識するステップと、必要な語を編集対象文書中に第1の文書編集ソフトウェアで追加するステップとを含む。本願の実施形態で、認識した語は、第1の文書編集ソフトウェアのみを使用することで自動的に挿入され、これは、複数のソフトウェアおよびプログラムが使用され、また、必要な語を手作業で複写する従来技術、あるいは認識した語を手作業でタイプして挿入する従来技術と比較すると作業効率を向上することが分かる。
図1は、本願の実施形態に係る、認識した語を迅速に挿入する方法のフローチャートである。方法は、以下のステップを含む。
ステップ101、編集対象文書を開く。
本願の本実施形態は、端末デバイスのプロセッサにて実施される。端末デバイスは、コンピュータ、移動電話、タブレット、電子文書を編集できるデバイス等を備える。
本願の本実施形態では、文書が開かれていない場合、ある文書を編集対象文書として第1の文書編集ソフトウェアにて開くことができる。既に開いている文書がある場合は、ステップ101を実行する必要はない。
電子文書を編集するために、WPS Officeなどの第1の文書編集ソフトウェアが端末デバイスにインストールされる。本願の本実施形態に係るすべてのステップは、第1の文書編集ソフトウェアで実施できる。別の方法としては、ステップ102〜103は、他のソフトウェアにて実施することもできる。
本願の本実施形態に係る第1の文書編集ソフトウェアは、スクリーンショット機能および画像認識機能を含み得る。例えば、第1の文書編集ソフトウェアは、選択された領域のイメージをキャプチャできるスクリーンショットプログラムと統合できる。第1の文書編集ソフトウェアは、さらに、画像中の語を認識できる画像認識プログラムと統合することも可能である。
ステップ102、ユーザから画像取得命令を取得する。
本願の本実施形態では、スクリーンショットまたはカメラ等による画像の取得などの画像を取得するための様々な方法を提供できる。この場合、画像取得命令は、画像取得方法のうちのユーザにて選択された1つを示す命令である。言い換えると、画像取得方法のうちのユーザにて選択された1つを示す命令が受け取られると、それは、画像取得命令がユーザから取得されることを意味している。本願の本実施形態では、ユーザ選択ウィンドウを第1の文書編集ソフトウェアで予め確立できる。ユーザによる選択のために、ユーザ選択ウィンドウには画像取得方法のための様々なオプションが提供され、次に、画像取得方法のためのオプションに対するユーザのクリック操作が取得される。
本願の本実施形態に係るステップ101および102は、特定の順序で実施しなくてもよいことに留意されたい。すなわち、本願の本実施形態では、編集対象文書を開くステップは、編集対象文書を最初に編集し、次に必要な語を取得することが要求されるシナリオのために通常は適用される第1の文書編集ソフトウェアを使用することにより、ユーザから画像取得命令を取得する前に実施できる。別の方法としては、編集対象文書を開くステップは、必要な語のキャリアが分かっており、また、必要な語を最初に取得することが要求されるシナリオのために通常は適用される第1の文書編集ソフトウェアを使用することにより、ユーザから画像取得命令を取得した後に実施することも可能である。このシナリオでは、複数の編集対象文書を開いて、必要な語を複数の編集対象文書中に挿入できる。本願の本実施形態に係るステップ101および102の順序は、ユーザの使用習慣または特定の使用シナリオによって決定される。
ステップ103、必要な語を含む画像を画像取得命令に従って取得する。
本願の本実施形態に係る画像取得命令は、必要な語が置かれているキャリアに関連付けられる。必要な語は、編集対象文書中に挿入することをユーザが実際に意図している語である。例えば必要な語は、画像、ビデオ、非複製可能電子文書などの既存の電子キャリアの中に存在し得る。この場合、画像取得命令は、スクリーンショットにて画像を取得するための命令でもよい。
スクリーンショットにて画像を取得するための命令がユーザから受け取られ、また、必要な語を含む電子キャリアが端末デバイスのスクリーン上に現在表示されていると仮定すると、命令に従ってスクリーンショット範囲を決定でき、また、そのスクリーンショット範囲に従って、必要な語を含む画像を現在表示されている電子キャリアからキャプチャできる。
いくつかの事例では、必要な語は、書籍中の語、壁ポスター中の語、TVスクリーン上の語などの、端末デバイスの外部の既存の物理的キャリア中に存在していてもよい。この場合、イメージ取得命令は、カメラにて画像を取得する命令でもよい。カメラを使用して、カメラにて画像を取得するための命令に従って、必要な語が置かれている物理的キャリアの画像がキャプチャされ、延いては必要な語を含む画像が取得される。
したがって、必要な語を含む画像は、本願の本実施形態では、より一般的に使用できる広範囲にわたるソースから取得できる。
ステップ104、画像中の必要な語を第1の文書編集ソフトウェアで認識する。
例えば、画像中の必要な語は、第1の文書編集ソフトウェアの中に統合されている画像認識プログラムを使用することで認識できる。本願の本実施形態では、複数の画像認識プログラムの交換可能な使用を容易にするために、予めプログラムインタフェースを第1の文書編集ソフトウェアの中に提供できる。
ステップ105、必要な語を編集対象文書中に移動する。
ステップ105は、必要な語を編集対象文書中に第1の文書編集ソフトウェアで追加するステップを含み得る。
本願の本実施形態では、認識した語は、編集対象文書中の予め設定された固定位置、無作為位置またはユーザにて設定された挿入位置に追加できる。
語の追加は、画像認識と同時に実施できる。すなわち、1つの語が認識されると、その1つの語が編集対象文書中に追加されることになる。これは、ユーザが使用するために役に立ち、あるいは認識した語を可能な限り迅速に編集するために役に立つ。別の方法としては、本願の本実施形態では、語は、すべての語が認識された後に全体として追加される。これは、必要な語の完全性を維持するために役に立ち、また、必要な語の内容全体を使用し、あるいは編集する状況に対してより適している。
本願の本実施形態では制限されない、スライド、スクロール、ジャンプなどにより、画像からの語を編集対象文書中に追加するための様々な方法を提供できる。本願の本実施形態では、画像中の語は、手作業による複写、ペースト、ドラッグなどの移動操作を一切必要とすることなく、画像中の認識した語を編集対象文書中に自動的に挿入できるように、編集対象文書中に様々な特定の方法で追加できる。
したがって、本願の本実施形態では、認識した語の編集対象文書中への手作業による複写を回避でき、これは自動挿入を可能にし、また、作業効率を向上する。
本願の本実施形態は、認識した語を迅速に挿入する方法を提供することが分かる。この方法では、ユーザから画像取得命令が取得される。必要な語を含む画像が画像取得命令に従って取得される。画像中の必要な語が第1の文書編集ソフトウェアで認識される。必要な語が編集対象文書中に追加される。本願の本実施形態では、第1の文書編集ソフトウェアで文書を編集する場合に、必要な語を含む画像を取得でき、また、画像中の必要な語を認識し、かつ、編集対象文書中に移動でき、これは、画像中の必要な語の認識、および編集対象文書中へのその自動挿入を可能にする。本願の本実施形態では、認識した語は、第1の文書編集ソフトウェアのみを使用することで自動的に挿入され、これは、複数のソフトウェアおよびプログラムが必要であり、また、必要な語を手作業で複写する従来技術、あるいは認識した語を手作業でタイプして挿入する従来技術と比較すると作業効率を向上する。
本願の実施形態に係る実施態様プロセスは、例によって、以下で例証されている。図2は、必要な語を含む画像である。具体的には、文書編集ソフトウェアを使用することで文書を編集している間にユーザがPDF(Portable Document Format)文書を読むと、ユーザは、いくつかの語が必要な語であることを発見し(図2のボックス内の語を参照)、かつ、その必要な語を編集対象文書中に挿入する。従来技術では、ユーザは、1つの外部フォーマット変換プログラムまたはソフトウェアを使用して、PDF文書を画像フォーマット(すなわち、図2に示す画像)に変換し、次に、別の画像認識プログラムまたはソフトウェアを使用して、この画像中のすべての語を認識し、かつ、ボックス内の必要な語を編集対象文書中に手作業で複写しペーストしなければならない。このプロセスには、文書編集ソフトウェア、フォーマット変換ソフトウェアまたはプログラム、および画像認識ソフトウェアまたはプログラムを開く必要がある。画像中のすべての語を認識すると、ユーザは、必要な語を手作業で選択し、かつ複写しなければならず、これは、より低い作業効率をもたらす。従来技術における他の解決策が採用されても、ユーザは、手作業でタイプしてボックス内の必要な語を取得しなければならず、これもより低い作業効率をもたらす。
本願の本実施形態に係る方法によれば、第1の文書編集ソフトウェアを使用することで文書を編集する場合に、ユーザから画像取得命令を取得できる。例えば、第1の文書編集ソフトウェアで複数のオプションをユーザに提供でき、これらのオプションは、スクリーンショットによる画像の取得、またはカメラの使用による画像の取得などの様々な画像取得方法に対応し得る。ユーザにて選択される画像取得方法は、複数のオプションに対するユーザのクリック操作に基づいて決定され、必要な語を含む画像がユーザにて選択された画像取得方法に従って取得される。
続いて、図2を参照すると、スクリーンショットにて画像を取得する方法では、第1の文書編集ソフトウェアの中に統合されているスクリーンショットプログラムを使用することで、PDF文書中のボックス部分の画像が取得される。例えば、ユーザがマウスを使用して図2のボックス内の語を選択すると、ユーザの操作に従ってボックス部分を含むようにスクリーンショット範囲が決定される。図2のボックス部分の語を含む画像は、このスクリーンショット範囲に従ってスクリーンショットにて取得される。次に、第1の文書編集ソフトウェアの中に統合されている画像認識プログラムを使用することにより、この画像中の必要な語が認識され、すなわちボックス内の語が認識される。最後に、必要な語が編集対象文書中に追加される。本願の本実施形態では、第1の文書編集ソフトウェアのみを使用することでプロセス全体が完了し、また、画像中の語は自動的に認識されて挿入されるため、作業効率を向上できる。
図3は、図1に示す方法の例のフローチャートである。方法は、以下のステップを含む。
ステップ301、編集対象文書を開く。
本願の本実施形態では、既に開いている文書がない場合に、第1の文書編集ソフトウェアを使用して、文書を編集対象文書として開くことができる。既に開いている文書がある場合には、ステップ301を実行する必要はない。
本願の本実施形態では、第1の文書編集ソフトウェアを使用して、編集対象文書を開く。具体的には、端末デバイスは、第1の文書編集ソフトウェアのアイコンに対するユーザのクリック操作、編集対象文書のアイコンに対するユーザのクリック操作、ユーザの音声操作命令などの文書を開く命令をユーザから受け取る。端末デバイスのプロセッサは、編集対象文書を、文書を開く命令に従って開く。
例えば、端末デバイスのプロセッサは、第1の文書編集ソフトウェアのアイコンに対するユーザのクリック操作である、文書を開く命令に従って第1の文書編集ソフトウェアを開き、次に、ユーザに文書を選択させる命令を受け取る。例えば、ユーザによる文書の選択を取得すると、その文書が編集対象文書として開かれる。
例えば、端末デバイスのプロセッサは、編集対象文書のアイコンに対するユーザのクリック操作である文書を開く命令に従って、第1の文書編集ソフトウェア等を使用することで編集対象文書を開く。
例えば、端末デバイスのプロセッサは、ユーザの音声操作命令である文書を開く命令に従って、ユーザのその音声操作命令が「ファイル1」という名称の文書を開く命令である場合、その「ファイル1」という名称の文書を発見し、第1の文書編集ソフトウェアを使用して、この文書を編集対象文書等として開く。
本願の本実施形態では、編集対象文書を開くための様々な方法を提供でき、これらは互いに組み合わせることができるが、ここでは詳述しない。
ステップ302、スクリーンショットにて画像を取得する命令をユーザから取得する。
本願の本実施形態では、第1の文書編集ソフトウェアで予め設定されるユーザ選択ウィンドウの中でユーザにオプションを提供でき、したがって、ユーザは、スクリーンショットにて画像を取得することを選択できる。オプションに対するユーザのクリック操作が検出されると、それは、ユーザの画像取得命令が取得されたと見なすことができる。このオプションは、第1の文書編集ソフトウェアのツールバーの中の選択ウィンドウ、または第1の文書編集ソフトウェアのツールバーの外側のユーザ対話ウィンドウに置くことができる。
本願の本実施形態に係るステップ301および302は、特定の順序で実施しなくてもよいことに留意されたい。すなわち、本願の本実施形態では、編集対象文書を開くステップは、スクリーンショットによるユーザの画像取得命令を取得する前に、第1の文書編集ソフトウェアを使用することで実施できる。別の方法としては、編集対象文書を開くステップは、第1の文書編集ソフトウェアを使用して、スクリーンショットによるユーザの画像取得命令を取得した後に実施することも可能である。これらの2つのステップの順序は、ユーザの使用習慣または特定の使用シナリオによって決定される。
ステップ303、スクリーンショット範囲を取得する。
スクリーンショット範囲は、ステップ303に係る画像取得命令に従って決定できる。
本願の本実施形態では、端末デバイスのタイプに対応する方法を使用してスクリーンショット範囲が取得される。例えば、マウスを使用している端末デバイスの場合、マウスボックスにて選択された画像範囲がスクリーンショット範囲、すなわちスクリーンショットの範囲として取得される。例えば、広く使用されている端末デバイスでは、マウスはデスクトップコンピュータに使用されている。マウスを使用しているデスクトップコンピュータの場合、マウスボックスにて選択された画像範囲がスクリーンショット範囲、すなわちスクリーンショットの範囲として取得される。スクリーンショット範囲は必要な語を含む。マウスボックスにて選択される画像範囲は、必要な語を含む電子キャリア上のマウスの任意のドラッギングにて形成される軌道領域でもよい。この範囲は、長方形、円形または任意の不規則な形等でもよい。図2を例にとると、PDF文書上のマウスの連続クリックおよびドラッグ操作にて形成された長方形の領域(すなわち、図2の長方形のボックス)をスクリーンショット範囲、すなわちスクリーンショットの範囲として取得できる。
本願の本実施形態では、マウスボックスの形は、例えば長方形として予め設定することも同様に可能である。すなわちユーザがマウスをドラッグすると、異なる大きさの長方形ボックスが出現する。ユーザに必要なことは、必要な語がボックス内に含まれ得るよう、長方形ボックスの大きさを調整し、かつ、選択するだけである。これは、ボックスが規則的な形態である場合、スクリーンショットをより容易に、かつ、より効果的に実施できるため、スクリーンショット範囲の基準の統一を容易にする。本願の本実施形態では、マウスボックスの太さおよび色を同様に予め設定できる。マウスボックスの太さおよび色は、容易に知覚でき、また、容易に観察できるよう、ユーザの使用習慣および電子キャリアの背景色に応じて選択でき、これは、ユーザが便利に使用できる。当然に、本願の本実施形態は、マウスボックスにて選択された画像範囲を取得した後の確認プロセスを同様に提供できる。例えば、ユーザ対話ウィンドウを提供してユーザの確認を促すことができ、それによりユーザの操作ミスを回避できる。
別の方法としては、タッチスクリーンを使用している端末デバイスの場合、タッチスクリーン上の軌道ボックスにて選択された画像範囲がスクリーンショット範囲、すなわちスクリーンショットの範囲として取得される。例えば、広く使用されているタッチスクリーン移動電話の場合、タッチスクリーン上の軌道ボックスにて、ユーザにて選択された画像範囲がスクリーンショット範囲として取得される。スクリーンショット範囲は必要な語を含む。タッチスクリーン上の軌道ボックスにて選択される画像範囲は、指または別のツールによる、必要な語を含む電子キャリア上の任意の接触およびドラッギングにて形成される軌道領域でもよい。この範囲は、長方形、円形または任意の不規則な形等でもよい。図2を例にとると、PDF文書上のユーザの指の連続接触およびドラッグ操作にて形成された長方形の領域(すなわち、図2の長方形のボックス)をスクリーンショット範囲として取得できる。当然に、タッチスクリーン上の軌道ボックスにて選択される画像範囲は、一般的には規則的な形ではなく、本願の本実施形態では、タッチスクリーン上の軌道ボックスの形は、長方形、円形などの規則的な形として同様に予め設定できる。すなわち、ユーザにて選択され、取得された不規則な軌道ボックスは、その不規則な軌道ボックスと最も良好に一致する規則的な形に変換されることになる。例えば、タッチスクリーン上のユーザの軌道ボックスの形は不規則であり、必要な語を含む予め設定された規則的な形のボックス(例えば長方形)が、ユーザの軌道ボックス内に含まれている必要な語に基づいて見出される。これは、軌道ボックスが規則的な形態である場合、スクリーンショットをより容易に、かつ、より効果的に実施できるため、スクリーンショット範囲の基準の統一を容易にする。本願の本実施形態では、タッチスクリーン上の軌道ボックスの太さおよび色を同様に予め設定できる。タッチスクリーン上の軌道ボックスの太さおよび色は、容易に知覚でき、また、容易に観察できるよう、ユーザの使用習慣および電子キャリアの背景色に応じて選択でき、これは、ユーザが便利に使用できる。当然に、本願の本実施形態は、タッチスクリーン上の軌道ボックスにて選択された画像範囲を取得した後の確認プロセスを同様に提供できる。例えば、ユーザ対話ウィンドウを提供してユーザの確認を促すことができ、それによりユーザの操作ミスを回避できる。
本願の本実施形態では、全スクリーンのスクリーンショットにより、スクリーンショット範囲を選択することなくスクリーン全体の画像を取得でき、これは、全画像中のすべての語を必要な語として認識する必要があるシナリオにしばしば適用し得る。本願の本実施形態では、マウスまたはタッチスクリーンを使用している端末デバイスのために、移動電話のための全スクリーンのスクリーンショットのショートカットキーなどの対応する全スクリーンのスクリーンショットモードを設定できる。
当然に、マウスまたはタッチスクリーンを実際に使用している多くの他の端末デバイスが存在し、対応するスクリーンショット範囲取得方法については詳細に説明されない。
本願の本実施形態では、スクリーンショット範囲は、第1の文書編集ソフトウェアがロードされた端末デバイス内の、必要な語を含む既存の電子キャリアに対して、あるいはBluetooth(登録商標)伝送、インターネットおよび他の手段にて第1の文書編集ソフトウェアがロードされた端末デバイスの外部の端末デバイスから取得される電子キャリアに対して直接取得できる。別の方法としては、スクリーンショットは、遠隔接続およびインターネットを介した制御にて第1の文書編集ソフトウェアがロードされた電子デバイスの外部の端末デバイス内の、必要な語を含む電子キャリア上で直接実施し、それにより必要な語を含む画像も取得可能であり、次に、必要な語を認識し、かつ、ユーザ端末デバイス内の編集対象文書中の挿入位置へ移動するための後続するステップが実施される。
本願の本実施形態では、スクリーンショット範囲は、様々なソースから、必要な語を含む様々な電子キャリアに対して取得でき、また、スクリーンショット範囲は、マウスまたはタッチスクリーンを使用している様々な端末デバイスに適用できる。本願の本実施形態にて提供される方法は広く適用でき、また、極めて実用的である。
ステップ304、スクリーンショット範囲に対する画像をキャプチャする。
ステップ304は、必要な語を含む画像をスクリーンショット範囲に従ってキャプチャするステップを含み得る。
本願の本実施形態では、第1の文書編集ソフトウェアの中のスクリーンショットプログラムを使用して、ステップ303で決定されたスクリーンショット範囲に基づいて、必要な語を含む画像がキャプチャされる。当然に、本願の本実施形態では、全スクリーンのスクリーンショットにて画像をキャプチャできる。
ステップ305、画像中の必要な語を第1の文書編集ソフトウェアで認識する。
本願の本実施形態では、第1の文書編集ソフトウェアの中の画像認識プログラムを使用して画像中の必要な語が認識される。
ステップ306、必要な語を編集対象文書中の挿入位置へ移動する。
ステップ306で、必要な語を編集対象文書中の挿入位置に第1の文書編集ソフトウェアで追加できる。
例えば、端末デバイスがマウスを使用している端末デバイスの場合、取得される挿入位置はマウスカーソルの位置である。端末デバイスがタッチスクリーンを使用している端末デバイスの場合、取得される挿入位置は、タッチスクリーン上のカーソルの位置である。
本願の本実施形態は、確認プロセスを同様に提供できる。例えば、ユーザ対話ウィンドウを提供して、挿入位置等を確認するようユーザを促すことができ、それによりユーザの操作ミスを回避できる。次に、必要な語が編集対象文書中の挿入位置へ移動される。
画像から編集対象文書中へ語を移動し、かつ、語を追加するための特定の方法は、ステップ105で説明されている方法でもよく、ここでは繰り返して説明されない。
本願の本実施形態では、挿入位置は、ステップ301の後に取得できる。すなわち、編集対象文書がステップ301で開かれた後に、マウスカーソルの位置またはタッチスクリーン上のカーソルの位置を挿入位置として検出できる。当然に、本願の本実施形態は、検出後の確認プロセスを同様に提供できる。例えば、ユーザ対話ウィンドウを提供して、挿入位置を確認するようユーザを促すことができ、それによりユーザの操作ミスを回避できる。次に、ステップ306で、必要な語が編集対象文書中の挿入位置へ直接移動される。
本願の本実施形態は、認識した語を迅速に挿入する方法を提供することが分かる。この方法では、スクリーンショットによるユーザの画像取得命令が取得される。次に、スクリーンショット範囲が取得される。次に、スクリーンショット範囲中の画像が取得される。画像中の必要な語が第1の文書編集ソフトウェアで認識される。最後に、必要な語が編集対象文書中の挿入位置に追加される。本願の本実施形態は、必要な語を含む様々な電子キャリアに適用できる。文書を第1の文書編集ソフトウェアで編集する場合に、必要な語を含む画像をスクリーンショットにて取得できる。画像中の必要な語を認識でき、また、編集対象文書中の挿入位置に自動的に挿入できる。本願の本実施形態では、認識した語は、編集対象文書中の挿入位置に、単に第1の文書編集ソフトウェアのみを使用して自動的に挿入され、これは、複数のソフトウェアおよびプログラムが必要であり、また、必要な語を手作業で複写する従来技術、あるいは認識した語を手作業でタイプして挿入する従来技術と比較すると作業効率を向上する。
図4は、図1に示す方法の別の例のフローチャートである。方法は以下のステップを含む。
ステップ401、編集対象文書を開く。
本願の本実施形態では、既に開いている文書がない場合、第1の文書編集ソフトウェアを使用して、文書を編集対象文書として開くことができる。既に開いている文書がある場合は、ステップ101を実行する必要はない。
本願の本実施形態では、第1の文書編集ソフトウェアを使用して、編集対象文書を開く、具体的には、端末デバイスは、第1の文書編集ソフトウェアのアイコンに対するユーザのクリック操作、編集対象文書のアイコンに対するユーザのクリック操作、ユーザの音声操作命令などの文書を開く命令をユーザから受け取る。端末デバイスのプロセッサは、編集対象文書を、文書を開く命令に従って開く。
例えば、端末デバイスのプロセッサは、第1の文書編集ソフトウェアのアイコンに対するユーザのクリック操作である文書を開く命令に従って第1の文書編集ソフトウェアを最初に開き、次に、文書に対するユーザのクリック操作の取得などの、ユーザに文書を選択させる命令を受け取り、最後に、その文書を編集対象文書として開く。
例えば、端末デバイスのプロセッサは、編集対象文書のアイコンに対するユーザのクリック操作である文書を開く命令に従って、第1の文書編集ソフトウェアを使用することで編集対象文書を開く。
例えば、端末デバイスのプロセッサは、ユーザの音声操作命令である文書を開く命令、例えば「ファイル1」という名称の文書を開く命令に従って、その「ファイル1」という名称の文書を発見し、第1の文書編集ソフトウェアを使用して、この文書を編集対象文書として開く。
本願の本実施形態では、編集対象文書を開くための様々な方法が存在することが可能であり、これらは互いに組み合わせることができるが、ここでは詳述しない。
ステップ402、カメラにて画像を取得する命令をユーザから取得する。
本願の本実施形態では、第1の文書編集ソフトウェアで予め設定されるユーザ選択ウィンドウの中でユーザにオプションを提供でき、したがって、ユーザは、カメラにて画像を取得することを選択できる。オプションに対するユーザのクリック操作が検出されると、それは、ユーザの画像取得命令が取得されたと見なすことができる。このオプションは、第1の文書編集ソフトウェアのツールバーの中の選択ウィンドウ、または第1の文書編集ソフトウェアのツールバーの外側のユーザ対話ウィンドウに置くことができる。
本願の本実施形態に係るステップ401および402は、特定の順序で実施しなくてもよいことに留意されたい。すなわち、本願の本実施形態では、編集対象文書を開くステップは、カメラによるユーザの画像取得命令を取得する前に、第1の文書編集ソフトウェアを使用することで実施できる。別の方法としては、編集対象文書を開くステップは、第1の文書編集ソフトウェアを使用して、カメラによるユーザの画像取得命令を取得した後に実施することも可能である。これらの2つのステップの順序は、ユーザの使用習慣または特定の使用シナリオによって決定される。
ステップ403、カメラを起動し、かつ、カメラの視覚可能キャプチャ領域が必要な語を含むことを確認する。
ステップ403および404で、必要な語を含む画像がカメラにてキャプチャされる。
本願の実施形態に係るカメラは、ユーザのコンピュータのカメラ、移動電話のカメラなどの、第1の文書編集ソフトウェアがロードされた端末デバイスのカメラでも、あるいは他のユーザのコンピュータまたは移動電話のカメラ、および交通監視システムのカメラ、廊下の監視デバイスのカメラなどの、第1の文書編集ソフトウェアがロードされた端末デバイスの外部のカメラでもよい。
本願の本実施形態では、ユーザ端末デバイスのカメラを起動できる。別の方法としては、インターネット、LAN、Bluetooth(登録商標)等を使用することにより、ユーザ端末デバイスと接続された別のカメラを起動することも可能である。
本願の本実施形態では、カメラの視覚可能キャプチャ領域が必要な語を可能な限り鮮明に含んでいることをユーザにて確認でき、したがって、後続する画像キャプチャを容易にできる。必要な語がカメラの視覚可能キャプチャ領域内に含まれている場合、あるいは必要な語が画像キャプチャ要求事項に合致するには十分に鮮明ではない場合、ユーザは、必要な語を含む物理的キャリアまたはカメラを調整できる。例えば、カメラの視覚可能キャプチャ領域内の必要な語と共に印刷された書籍の位置を手作業で調整でき、あるいはカメラのパラメータを調整できる。パラメータは、必要な語がカメラの視覚可能キャプチャ内に含まれるまで、あるいは必要な語が十分に鮮明になって画像キャプチャ要求事項に合致するまで、書籍からの距離、カメラのキャプチャ角度およびカメラの焦点距離等を含む。
別の方法としては、第1の文書編集ソフトウェアがロードされた端末デバイスは、カメラの現在のキャプチャ領域が必要な語を含んでいるかを同様に決定し得る。カメラの現在のキャプチャ領域が必要な語を含んでいる場合、カメラは、現在のキャプチャ領域の画像をキャプチャするように制御されるため、必要な語を含む画像を取得する。カメラの現在のキャプチャ領域が必要な語を含んでいない場合、カメラの位置が調整され、プロセスは、必要な語がカメラの現在のキャプチャ領域に含まれているかを決定するステップに戻る。
すなわち、第1の文書編集ソフトウェアがロードされた端末デバイスにてカメラを調整できるため、カメラは、必要な語を含んだ画像を捕らえることができる。
ステップ404、カメラの視覚可能キャプチャ領域に対する画像をキャプチャする。
本願の本実施形態では、カメラのキャプチャ領域の画像は、ユーザ端末デバイスのカメラにて、あるいはインターネット、LAN、Bluetooth等を介してユーザ端末デバイスに接続している別の外部カメラにてキャプチャできる。例えば、廊下の監視カメラは、カメラの視覚可能キャプチャ領域の画像等をキャプチャするために接続される。
本願の本実施形態では、画像は、書籍、壁ポスター、掲示板などの、必要な語を含む様々な物理的キャリアに対して、カメラにて取得できる。本出の本実施形態にて提供される方法は、必要な語を含むキャリアとして様々な物理的キャリアを使用しており、この方法は広く適用でき、また、極めて実用的である。
ステップ405、画像中の必要な語を第1の文書編集ソフトウェアで認識する。
本願の本実施形態では、第1の文書編集ソフトウェアの中の画像認識プログラムを使用して画像中の必要な語が認識される。
ステップ406、必要な語を編集対象文書中の挿入位置へ移動する。
ステップ406は、必要な語を編集対象文書中の挿入位置に第1の文書編集ソフトウェアで追加するステップを含むことができる。
例えば、端末デバイスがマウスを使用している端末デバイスの場合、取得される挿入位置はマウスカーソルの位置である。端末デバイスがタッチスクリーンを使用している端末デバイスの場合、取得される挿入位置は、タッチスクリーン上のカーソルの位置である。本願の本実施形態は、確認プロセスを同様に提供できる。例えば、ユーザ対話ウィンドウを提供して、挿入位置等を確認するようユーザを促すことができ、それによりユーザの操作ミスを回避できる。必要な語は、編集対象文書中の挿入位置へ移動される。
本願の本実施形態では、挿入位置は、ステップ401の後に取得できる。すなわち、編集対象文書がステップ401で開かれた後に、マウスカーソルの位置またはタッチスクリーン上のカーソルの位置を挿入位置として検出できる。当然に、本願の本実施形態は、検出後の確認プロセスを同様に提供できる。例えば、ユーザ対話ウィンドウを提供して、挿入位置を確認するようユーザを促すことができ、それによりユーザの操作ミスを回避できる。次に、ステップ406で、必要な語が編集対象文書中の挿入位置へ直接移動される。
本願の本実施形態に係る、認識した語を迅速に挿入するデバイスは、カメラによるユーザの画像取得命令を取得することが分かる。次に、必要な語を含む画像がカメラにて取得される。画像中の必要な語が第1の文書編集ソフトウェアで認識される。最後に、必要な語が編集対象文書中の挿入位置に追加される。本願の本実施形態は、必要な語を含む様々な物理的キャリアに適用できる。文書を第1の文書編集ソフトウェアで編集する場合、必要な語を含む画像をカメラにて取得できる。画像中の必要な語を認識でき、また、編集対象文書中の挿入位置に自動的に挿入できる。本願の本実施形態では、認識した語は、編集対象文書中の挿入位置に、単に第1の文書編集ソフトウェアのみを使用して自動的に挿入され、これは、複数のソフトウェアおよびプログラムが必要であり、また、必要な語を手作業で複写する従来技術、あるいは認識した語を手作業でタイプして挿入する従来技術と比較すると作業効率を向上する。
図5は、本願の実施形態に係る、認識した語を迅速に挿入する装置の構造図である。装置は、
編集対象文書を開く構成とされた開モジュール501と、
ユーザから画像取得命令を取得する構成とされた命令取得モジュール502と、
必要な語を含む画像を画像取得命令に従って取得する構成とされた画像取得モジュール503と、
画像中の必要な語を第1の文書編集ソフトウェアで認識する構成とされた認識モジュール504と、
必要な語を編集対象文書中に移動する構成とされた語移動モジュール505と、を備える。
語移動モジュール505は、特に、必要な語を編集対象文書中に第1の文書編集ソフトウェアで追加する構成とされる。
本願の本実施形態にて提供される、認識した語を迅速に挿入するデバイスは、まず、編集対象文書を第1の文書編集ソフトウェアで開き、次に、ユーザの画像取得命令を取得し、必要な語を含む画像を画像取得命令に従って取得し、画像中の必要な語を第1の文書編集ソフトウェアで認識し、最後に、必要な語を編集対象文書中に移動することが分かる。本願の本実施形態では、文書を第1の文書編集ソフトウェアで編集する場合、必要な語を含む画像を取得でき、また、画像中の必要な語を認識して、編集対象文書中に自動的に挿入できる。本願の本実施形態では、認識した語は、単に第1の文書編集ソフトウェアのみを使用して自動的に挿入され、これは、複数のソフトウェアおよびプログラムを開き、また、必要な語を手作業で複写する必要がある従来技術、あるいは認識した語を手作業でタイプして挿入する従来技術とは異なっている。
本願の実施形態にて提供されるデバイスは、上述した、認識した語を迅速に挿入する方法を適用するデバイスであり、また、認識した語を迅速に挿入する方法のすべての実施形態は、このデバイスに適用でき、達成可能な有利な効果は同じであるか、または同様であることに留意されたい。
図6は、図5に基づく、図3に示す方法に対応する好ましい実施形態である。図6は、図5に示すデバイスに基づく例の構造図であり、以下を備える。
本願の本実施形態では、画像取得命令は、スクリーンショットにて画像を取得する命令である。
本願の本実施形態では、画像取得モジュール603は、
画像取得命令に従ってスクリーンショット範囲を決定する構成とされたスクリーンショット範囲取得サブモジュール6031と、
必要な語を含む画像をスクリーンショット範囲に従ってキャプチャする構成とされたスクリーンショットサブモジュール6032と、を備える。
本願の本実施形態では、スクリーンショット範囲取得サブモジュール6031は、特に、
マウスボックスにて選択された画像範囲をスクリーンショット範囲として取得し、または
タッチスクリーン上の軌道ボックスにて選択された画像範囲をスクリーンショット範囲として取得する構成とされる。
本願の本実施形態では、語移動モジュール605は、特に、
必要な語を編集対象文書中の挿入位置へ移動する
構成とされ、挿入位置は、マウスカーソルが置かれている位置、またはタッチスクリーン上のカーソルが置かれている位置である。
本願の本実施形態にて提供される、認識した語を迅速に挿入するデバイスは、まず、編集対象文書を第1の文書編集ソフトウェアで開き、次に、スクリーンショットによるユーザの画像取得命令を取得し、スクリーンショット範囲を取得し、スクリーンショット範囲中の画像をキャプチャし、かつ、画像中の必要な語を第1の文書編集ソフトウェアで認識し、最後に、必要な語を編集対象文書中に移動することが分かる。本願の本実施形態は、必要な語を含む様々な電子キャリアに適用できる。文書を第1の文書編集ソフトウェアで編集する場合、必要な語を含む画像をスクリーンショットにて取得できる。画像中の必要な語を認識でき、また、編集対象文書中の挿入位置に自動的に挿入できる。本願の本実施形態では、認識した語は、編集対象文書中の挿入位置に、単に第1の文書編集ソフトウェアのみを使用して自動的に挿入され、これは、複数のソフトウェアおよびプログラムが必要であり、また、必要な語を認識した語から手作業で選択し、かつ、選択した語を編集対象文書中の挿入位置に複写する従来技術とは異なる。したがって、作業効率が向上される。
図7は、図5に基づく、図4に示す方法に対応する好ましい実施形態である。図7は、図5に示すデバイスに基づく別の例の構造図であり、以下を備える。
本願の本実施形態では、画像取得命令は、
カメラにて画像を取得する命令、である。
本願の本実施形態では、画像取得モジュール703は、特に、必要な語を含む画像をカメラにてキャプチャする構成とされる。
本願の本実施形態では、画像取得モジュール703は、特に、
必要な語がカメラの現在のキャプチャ領域に含まれているかを決定し、
必要な語がカメラの現在のキャプチャ領域に含まれている場合、必要な語を含む画像を取得するために、現在のキャプチャ領域に対する画像をキャプチャするようにカメラを制御し、
必要な語がカメラの現在のキャプチャ領域に含まれていない場合、カメラの位置を調整すること、および必要な語がカメラの現在のキャプチャ領域に含まれているかを決定するステップに戻ることを行う、構成とされる。
本願の本実施形態では、語移動モジュール705は、特に、
必要な語を編集対象文書中の挿入位置に追加する、構成とされ、挿入位置は、マウスカーソルが置かれている位置、またはタッチスクリーン上のカーソルが置かれている位置である。
本願の本実施形態にて提供される、認識した語を迅速に挿入するデバイスは、まず、編集対象文書を第1の文書編集ソフトウェアで開き、次に、カメラによるユーザの画像取得命令を取得し、カメラを起動して、カメラのキャプチャ領域が必要な語を含んでいることを確認し、カメラのキャプチャ領域中の画像を取得し、かつ、画像中の必要な語を第1の文書編集ソフトウェアで認識し、最後に、必要な語を編集対象文書中に移動することが分かる。本願の本実施形態は、必要な語を含む様々な物理的キャリアに適用できる。文書を第1の文書編集ソフトウェアで編集する場合、必要な語を含む画像をカメラにて取得できる。画像中の必要な語を認識でき、また、編集対象文書中の挿入位置に自動的に挿入できる。本願の本実施形態では、認識した語は、編集対象文書中の挿入位置に、単に第1の文書編集ソフトウェアのみを使用して自動的に挿入され、これは、複数のソフトウェアおよびプログラムが必要であり、また、必要な語を認識した語から手作業で選択し、かつ、選択した語を編集対象文書中の挿入位置に複写する従来技術とは異なる。したがって、作業効率が向上される。
本願の実施形態は、図8に示す、プロセッサ801およびメモリ802を備える電子デバイスを同様に開示する。
メモリ802は、コンピュータプログラムを記憶する構成とされる。
プロセッサ801は、メモリ802上に記憶されているプログラムを実行すると、認識した語を迅速に挿入するための任意の上記方法を事前形成する構成とされる。
本願の実施形態は、さらに、コンピュータプログラムが記憶されるコンピュータ可読記憶媒体を開示する。コンピュータプログラムは、プロセッサにて実行されると、認識した語を迅速に挿入するための任意の上記方法を実施する構成とされる。
本願の実施形態は、さらに、認識した語を迅速に挿入する任意の上記方法を実施するように操作される実行可能プログラムコードを開示する。
「第1の」、「第2の」などの本明細書における関係用語は、1つの実体または動作を別の実体または動作から区別するためにのみ用いられており、これらの実体または動作の間に任意の実際の関係または順序が存在することを必ずしも必要とする、または意味するものでないことに留意されたい。さらに、「含む」、「備える」という用語、またはそれらの任意の変形には、一連の要素を備えたプロセス、方法、物品またはデバイスが、列挙されているこれらの要素だけでなく、明確には列挙されていない他の要素、あるいはこれらのプロセス、方法、物品またはデバイスに固有の要素を同様に備えるよう、非排他的包含をカバーすることが意図されている。「〜を備える」という表現にて限定された要素は、さらに制限されることなく、列挙された要素を備えるプロセス、方法、物品またはデバイスに全く同じ追加要素が存在することを排除しない。
説明するすべての実施形態は、互いに関連付けて説明しており、それらの様々な実施形態の間で、同一または同様の部分は相互に参照でき、各実施形態は、他の実施形態との相違点に注目して説明した。具体的には、図5〜図7に示すシステムの実施形態、図8に示す電子デバイスの実施形態、上述したコンピュータ可読記憶媒体の実施形態、および上述した実行可能プログラムコードの実施形態は、図1〜図4に示す認識した語を迅速に挿入する方法の実施形態と基本的に同様であるので、説明が比較的簡略であり、関連する部分については、認識した語を迅速に挿入する方法の実施形態の説明を参照すればよい。
上述した実施形態は、本願の単なる好ましい実施形態にすぎず、本願を限定するためのものではない。本願の趣旨および原理内で行われる任意の修正、等価な置換、改良などは、本願の保護範囲に含まれる。

Claims (15)

  1. 認識した語を迅速に挿入する方法であって、
    ユーザから画像取得命令を取得するステップと、
    必要な語を含む画像を前記画像取得命令に従って取得するステップと、
    前記画像中の前記必要な語を第1の文書編集ソフトウェアで認識するステップと、
    前記必要な語を編集対象文書中に前記第1の文書編集ソフトウェアで追加するステップと、
    を含む、方法。
  2. 前記画像取得命令が、スクリーンショットにて画像を取得する命令であり、
    必要な語を含む画像を前記画像取得命令に従って取得するステップが、
    前記画像取得命令に従ってスクリーンショット範囲を決定するステップと、
    必要な語を含む画像を前記スクリーンショット範囲に従ってキャプチャするステップと、を含む、
    請求項1に記載の方法。
  3. 前記画像取得命令に従ってスクリーンショット範囲を決定するステップが、
    マウスボックスにて選択された画像範囲を前記スクリーンショット範囲として取得するステップ、または
    タッチスクリーン上の軌道ボックスにて選択された画像範囲を前記スクリーンショット範囲として取得するステップ、
    を含む、請求項2に記載の方法。
  4. 前記画像取得命令が、カメラにて画像を取得する命令であり、
    必要な語を含む画像を前記画像取得命令に従って取得するステップが、
    カメラにて前記必要な語を含む画像をキャプチャするステップ、を含む、
    請求項1に記載の方法。
  5. カメラにて前記必要な語を含む画像をキャプチャするステップが、
    前記必要な語が前記カメラの現在のキャプチャ領域に含まれているかを決定するステップと、
    前記必要な語が前記カメラの前記現在のキャプチャ領域に含まれている場合、前記必要な語を含む画像を取得するために、前記現在のキャプチャ領域に対する画像をキャプチャするように前記カメラを制御するステップと、
    前記必要な語が前記カメラの前記現在のキャプチャ領域に含まれていない場合、前記カメラの位置を調整するステップ、および前記必要な語が前記カメラの前記現在のキャプチャ領域に含まれているかを決定する前記ステップに戻るステップと、
    を含む、請求項4に記載の方法。
  6. 前記必要な語を編集対象文書中に前記第1の文書編集ソフトウェアで追加するステップが、
    前記必要な語を前記編集対象文書中の挿入位置に追加するステップであって、前記挿入位置が、マウスカーソルが置かれている位置、またはタッチスクリーン上のカーソルが置かれている位置であるステップ、
    を含む、請求項1に記載の方法。
  7. 認識した語を迅速に挿入する装置であって、
    ユーザから画像取得命令を取得する構成とされた命令取得モジュールと、
    必要な語を含む画像を前記画像取得命令に従って取得する構成とされた画像取得モジュールと、
    前記画像中の前記必要な語を第1の文書編集ソフトウェアで認識する構成とされた認識モジュールと、
    前記必要な語を編集対象文書中に前記第1の文書編集ソフトウェアで追加するための語移動モジュールと、
    を備える装置。
  8. 前記画像取得命令が、スクリーンショットにて画像を取得する命令であり、前記画像取得モジュールが、
    前記画像取得命令に従ってスクリーンショット範囲を決定する構成とされたスクリーンショット範囲取得サブモジュールと、
    必要な語を含む画像を前記スクリーンショット範囲に従ってキャプチャする構成とされたスクリーンショットサブモジュールと、を備える、
    請求項7に記載の装置。
  9. 前記スクリーンショット範囲取得サブモジュールが、
    マウスボックスにて選択された画像範囲を前記スクリーンショット範囲として取得、または
    タッチスクリーン上の軌道ボックスにて選択された画像範囲を前記スクリーンショット範囲として取得する、
    構成とされる、請求項8に記載の装置。
  10. 前記画像取得命令がカメラにて画像を取得する命令であり、
    前記画像取得モジュールが、カメラにて前記必要な語を含む画像をキャプチャする構成とされる、
    請求項7に記載の装置。
  11. 前記画像取得モジュールが、
    前記必要な語が前記カメラの現在のキャプチャ領域に含まれているかを決定し、
    前記必要な語が前記カメラの前記現在のキャプチャ領域に含まれている場合、前記必要な語を含む画像を取得するために、前記現在のキャプチャ領域に対する画像を取得するように前記カメラを制御し、
    前記必要な語が前記カメラの前記現在のキャプチャ領域に含まれていない場合、前記カメラの位置を調整し、前記必要な語が前記カメラの前記現在のキャプチャ領域に含まれているかを決定する前記ステップに戻ることを行う
    構成とされる、請求項10に記載の装置。
  12. 前記語移動モジュールが、
    前記必要な語を前記編集対象文書中の挿入位置に追加する構成とされ、前記挿入位置が、マウスカーソルが置かれている位置、またはタッチスクリーン上のカーソルが置かれている位置である、
    請求項7に記載の装置。
  13. プロセッサおよびメモリを備える電子デバイスであって、
    前記メモリが、コンピュータプログラムを記憶する構成とされ、
    前記プロセッサが、前記コンピュータプログラムを実行すると、請求項1から6までのいずれか一項に記載の、認識した語を迅速に挿入する方法を実施するように、前記メモリ上に記憶されている前記コンピュータプログラムを事前形成する構成とされる、
    電子デバイス。
  14. コンピュータプログラムを記憶するコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサにて実行された場合に、請求項1から6までのいずれか一項に記載の、認識した語を迅速に挿入する方法を実施する構成とされた、
    コンピュータ可読記憶媒体。
  15. 請求項1から6までのいずれか一項に記載の、認識した語を迅速に挿入する方法を実施する構成とされた、
    実行可能プログラムコード。
JP2020500950A 2017-03-20 2018-03-19 認識した語を迅速に挿入する方法およびデバイス Pending JP2020515996A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710165750.8 2017-03-20
CN201710165750.8A CN108628814A (zh) 2017-03-20 2017-03-20 一种快速插入识别文字的方法及装置
PCT/CN2018/079489 WO2018171560A1 (zh) 2017-03-20 2018-03-19 一种快速插入识别文字的方法及装置

Publications (1)

Publication Number Publication Date
JP2020515996A true JP2020515996A (ja) 2020-05-28

Family

ID=63584165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020500950A Pending JP2020515996A (ja) 2017-03-20 2018-03-19 認識した語を迅速に挿入する方法およびデバイス

Country Status (6)

Country Link
US (1) US20200042581A1 (ja)
EP (1) EP3605277A4 (ja)
JP (1) JP2020515996A (ja)
CN (1) CN108628814A (ja)
SG (1) SG11201908705WA (ja)
WO (1) WO2018171560A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109874051A (zh) * 2019-02-21 2019-06-11 百度在线网络技术(北京)有限公司 视频内容处理方法、装置及设备
CN110166621B (zh) * 2019-04-17 2020-09-15 维沃移动通信有限公司 一种文字处理方法及终端设备
CN110275667B (zh) * 2019-06-25 2021-12-17 努比亚技术有限公司 内容显示方法、移动终端及计算机可读存储介质
CN111611945A (zh) * 2020-05-25 2020-09-01 江西金格科技股份有限公司 一种通用的AutoCAD图框识别方法
CN113448461A (zh) * 2020-06-24 2021-09-28 北京新氧科技有限公司 信息处理方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08329190A (ja) * 1995-03-24 1996-12-13 Fuji Xerox Co Ltd 文字認識装置
JP2001175572A (ja) * 1999-12-20 2001-06-29 Minolta Co Ltd 携帯電子メール端末および電子メール文書作成方法
JP2003331217A (ja) * 2002-03-08 2003-11-21 Nec Corp 文字入力装置、文字入力方法及び文字入力プログラム
JP2005346628A (ja) * 2004-06-07 2005-12-15 Omron Corp 文字入力方法、文字入力装置、及びプログラム
JP2010205136A (ja) * 2009-03-05 2010-09-16 Fujitsu Ltd 音声読み上げ装置、携帯電話機及びコンピュータプログラム
JP2011248669A (ja) * 2010-05-27 2011-12-08 Ricoh Co Ltd 文書管理プログラム、記録媒体、情報処理装置、及び文書管理方法
JP2012043079A (ja) * 2010-08-17 2012-03-01 Yahoo Japan Corp 情報表示装置、方法及びプログラム
JP2016177354A (ja) * 2015-03-18 2016-10-06 セコム株式会社 異常検知端末及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
CN1964413A (zh) * 2006-11-25 2007-05-16 王永顺 小型图书馆文字图像扫描摘录系统
CN101262513A (zh) * 2008-04-24 2008-09-10 陶建新 有微型扫描仪的拍照手机
US8373724B2 (en) * 2009-01-28 2013-02-12 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
CN101881999B (zh) * 2010-06-21 2012-11-21 安阳师范学院 甲骨文视频输入系统及实现方法
CN106156761B (zh) * 2016-08-10 2020-01-10 北京交通大学 面向移动终端拍摄的图像表格检测与识别方法
CN106445144A (zh) * 2016-09-27 2017-02-22 宇龙计算机通信科技(深圳)有限公司 一种笔记方法、装置及终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08329190A (ja) * 1995-03-24 1996-12-13 Fuji Xerox Co Ltd 文字認識装置
JP2001175572A (ja) * 1999-12-20 2001-06-29 Minolta Co Ltd 携帯電子メール端末および電子メール文書作成方法
JP2003331217A (ja) * 2002-03-08 2003-11-21 Nec Corp 文字入力装置、文字入力方法及び文字入力プログラム
JP2005346628A (ja) * 2004-06-07 2005-12-15 Omron Corp 文字入力方法、文字入力装置、及びプログラム
JP2010205136A (ja) * 2009-03-05 2010-09-16 Fujitsu Ltd 音声読み上げ装置、携帯電話機及びコンピュータプログラム
JP2011248669A (ja) * 2010-05-27 2011-12-08 Ricoh Co Ltd 文書管理プログラム、記録媒体、情報処理装置、及び文書管理方法
JP2012043079A (ja) * 2010-08-17 2012-03-01 Yahoo Japan Corp 情報表示装置、方法及びプログラム
JP2016177354A (ja) * 2015-03-18 2016-10-06 セコム株式会社 異常検知端末及びプログラム

Also Published As

Publication number Publication date
US20200042581A1 (en) 2020-02-06
SG11201908705WA (en) 2019-10-30
EP3605277A1 (en) 2020-02-05
WO2018171560A1 (zh) 2018-09-27
CN108628814A (zh) 2018-10-09
EP3605277A4 (en) 2020-04-01

Similar Documents

Publication Publication Date Title
JP2020515996A (ja) 認識した語を迅速に挿入する方法およびデバイス
US9335860B2 (en) Information processing apparatus and information processing system
US8949729B2 (en) Enhanced copy and paste between applications
US20220214784A1 (en) Systems and methods for a touchscreen user interface for a collaborative editing tool
US20120185787A1 (en) User interface interaction behavior based on insertion point
US20130198653A1 (en) Method of displaying input during a collaboration session and interactive board employing same
US20140327628A1 (en) Physical object detection and touchscreen interaction
US11385774B2 (en) Intuitive workspace management
WO2020211368A1 (zh) 一种演示文稿交互的方法、装置、终端设备和存储介质
WO2020249044A1 (zh) 窗口层级切换的方法、装置、设备和存储介质
DE112013002409T5 (de) Vorrichtung, Verfahren und grafische Benutzeroberfläche für die Anzeige zusätzlicher Informationen in Reaktion auf einen Benutzerkontakt
JP2003303047A (ja) 画像入力及び表示システム、ユーザインタフェースの利用方法並びにコンピュータで使用可能な媒体を含む製品
US10013156B2 (en) Information processing apparatus, information processing method, and computer-readable recording medium
US20140043255A1 (en) Electronic device and image zooming method thereof
CN103324436A (zh) 一种任务处理方法及装置
WO2018010316A1 (zh) 桌面页面管理的方法及装置
WO2017177820A1 (zh) 一种即时通讯中的文件发送方法及装置
US20160231876A1 (en) Graphical interaction in a touch screen user interface
WO2016173307A1 (zh) 一种消息复制方法和装置、以及智能终端
CN110908552B (zh) 多窗口操作控制方法、装置、设备及存储介质
WO2023155874A1 (zh) 应用图标管理方法、装置和电子设备
US20160350273A1 (en) Data processing method
CN110888581A (zh) 元素传递方法、装置、设备及存储介质
JP6209868B2 (ja) 情報端末、情報処理プログラム、情報処理システム、及び情報処理方法
KR101771900B1 (ko) 단말기의 자동 번역 장치 및 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191111

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191018

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210706