JP7308929B2 - 音声処理方法及び移動端末 - Google Patents

音声処理方法及び移動端末 Download PDF

Info

Publication number
JP7308929B2
JP7308929B2 JP2021511616A JP2021511616A JP7308929B2 JP 7308929 B2 JP7308929 B2 JP 7308929B2 JP 2021511616 A JP2021511616 A JP 2021511616A JP 2021511616 A JP2021511616 A JP 2021511616A JP 7308929 B2 JP7308929 B2 JP 7308929B2
Authority
JP
Japan
Prior art keywords
mobile terminal
interface displayed
input
voice input
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021511616A
Other languages
English (en)
Other versions
JP2021536061A (ja
Inventor
慧子 ▲韓▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Publication of JP2021536061A publication Critical patent/JP2021536061A/ja
Application granted granted Critical
Publication of JP7308929B2 publication Critical patent/JP7308929B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Environmental & Geological Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

(関連出願の相互参照)
本願は、2018年8月30日に中国に提出された中国特許出願201811001519.6の優先権を主張し、その全ての内容が援用によりここに取り込まれる。
本開示は、音声認識技術分野に係り、特に音声処理方法及び移動端末に係る。
電子技術の展開に伴い、音声認識の技術は、ますます成熟し、認識精度がますます高くなっているので、広く応用されている。現在、移動端末(例えばスマートフォンやタブレットパソコンなど)における音声認識は、主に音声入力モードと音声制御モードの2つのモードを有する。
音声入力モードでは、移動端末は、受信した音声をテキストコンテンツに変換し、入力ボックスに書き込む。この音声入力モードは、ユーザがテキストコンテンツを入力する必要があるシナリオ、特に、大量のテキストコンテンツを入力する必要があるシナリオに適し、テキストコンテンツ入力の速度を大きく向上させることができる。
音声制御モードでは、移動端末は、受信した音声を認識し、認識したコンテンツに基づいて、対応する操作を実行するように前記移動端末を制御する。この音声制御モードは、ユーザが移動端末を手動で操作するのに不便なシナリオに適用し、ユーザの両手を解放してユーザに便宜を提供することができる。
関連技術において、移動端末では、音声認識機能をオンにした状態で異なる2つの音声認識モードの切り替えをトリガするように、固定のキーしか設けられていない。
このように、関連技術の音声モードの切り替えは、ユーザの手動による操作を必要とし、利便性が不十分である。
本開示の一部実施例は、音声モードの切り替えにユーザの手動操作を必要とし、利便性が不十分であるという関連技術の問題を解決するために、音声処理方法及び移動端末を提供する。
第1態様として、本開示の一部実施例は、移動端末に応用される音声処理方法を提供する。前記方法は、音声入力を受信することと、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することと、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することとを含む。
第2態様として、本開示の一部実施例は、移動端末を提供する。前記移動端末は、音声入力を受信する受信モジュールと、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示する表示モジュールと、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する制御モジュールとを含む。
第3態様として、本開示の一部実施例は、プロセッサと、メモリと、前記メモリに格納されて前記プロセッサで実行可能なコンピュータプログラムとを含む移動端末を提供し、前記コンピュータプログラムが前記プロセッサによって実行されると、上記音声処理方法のステップが実現される。
第4態様として、本開示の一部実施例は、コンピュータプログラムが格納されているコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータプログラムがプロセッサによって実行されると、上記音声処理方法のステップが実現される。
本開示の一部実施例において、前記音声処理方法は、音声入力を受信し、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示し、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。このように、移動端末に表示されるインターフェースが満たす条件に応じて、移動端末が受信した音声入力を処理することができ、ユーザの手動操作を必要とすることなく、受信した音声入力に対して対応の処理を行うことができ、ユーザが手動で音声モードを切り替える手間が省け、携帯性が向上する。
本開示の一部実施例の技術手段をより明確に説明するために、以下、本開示の一部実施例の記載に必要とされる図面を簡単に紹介する。明らかに、以下の記載に関する図面は、単に本開示の一部の実施例である。当業者にとって、創造性のある作業をしない前提で、これらの図面から他の図面を得ることもできる。
本開示の一部実施例に係る音声処理方法のフローチャートである。 本開示の一部実施例に係るユーザインターフェースの模式図その1である。 本開示の一部実施例に係るユーザインターフェースの模式図その2である。 本開示の一部実施例に係る別のユーザインターフェースの模式図その3である。 本開示の一部実施例に係る音声処理方法のフローチャートである。 本開示の一部実施例に係る移動端末の構造図である。 本開示の一部実施例に係る移動端末のハードウェア構造図である。
以下、本開示の一部実施例の図面とともに、本開示の一部実施例の技術手段を明確且つ完全的に記載する。明らかに、記載する実施例は、本開示の実施例の一部であり、全てではない。本開示の実施例に基づき、当業者が創造性のある作業をしなくても為しえる全ての他の実施例は、いずれも本開示の保護範囲に属するものである。
図1は、本開示の一部実施例に係る音声処理方法のフローチャートである。前記音声処理方法は、移動端末に応用され、図1に示すように、以下のステップを含む。
ステップ101において、音声入力を受信する。
本開示の一部実施例において、ユーザは、前記移動端末の音声認識機能を使用する必要がある場合、音声を入力し、前記移動端末は、音声入力を受信する。具体的には、前記移動端末は、音声認識機能をオンにした状態で音声入力を受信する。前記移動端末の音声認識機能は、仮想キーによるトリガでオンにされてもよく、実体キーによるトリガでオンにされてもよい。前記移動端末の音声認識機能は、入力された音声を認識して文字に変換し、前記移動端末のインターフェースに表示することをサポートし、入力された音声を認識し、入力された音声に応じて、対応する操作を実行するように前記移動端末を制御することもサポートする。
ステップ102において、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示する。
本ステップにおいて、前記移動端末は、前記移動端末に表示されるインターフェースが第1所定条件を満たすか否かを判断し、前記移動端末に表示されるインターフェースが前記第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示する。このように、ユーザから入力した音声をテキストコンテンツに変換して入力ボックスに追加することを実現する。例えば、ユーザから入力した音声が「今日はいい天気だね」であると仮定すると、図2に示すように、前記移動端末は、ユーザから入力した音声を「今日はいい天気だね」という文字コンテンツに変換して、前記移動端末に表示されるインターフェースに表示する。なお、本開示の一部実施例において、前記移動端末は、ユーザから入力した音声のイントネーションを認識し、音声入力から変換された文字コンテンツと組み合わせて、図3に示すように、前記入力ボックスに句読点を追加する。
前記第1所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含むことである。この場合、前記移動端末に表示されるインターフェースに入力コントロールを含むと、前記移動端末に表示されるインターフェース上の入力コントロール内において前記音声入力に対応するテキストコンテンツを表示する。
また、前記第1所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含み、且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではないことであってもよい。この場合、前記移動端末に表示されるインターフェースに入力コントロールを含み、且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではないと、前記移動端末に表示されるインターフェース上の入力コントロール内において前記音声入力に対応するテキストコンテンツを表示する。
更に、前記第1所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含み、且つ前記移動端末が目標アイコンを目標領域に移動させるための第1入力を受信しなかったことであってもよい。この場合、前記移動端末に表示されるインターフェースに入力コントロールを含み、且つ目標アイコンを目標領域に移動させるための第1入力が受信されないと、前記移動端末に表示されるインターフェース上の入力コントロール内おいて前記音声入力に対応するテキストコンテンツを表示する。
前記移動端末は、前記移動端末に表示されるインターフェース中のコンポーネントに基づいて、前記移動端末に表示されるインターフェースに入力コントロールを含むかを判断する。具体的には、前記移動端末は、表示されているインターフェース中のコンポーネントを取得し、前記移動端末に表示されるインターフェース中のコンポーネントに目標コンポーネントを含むかを判断する。前記移動端末に表示されるインターフェース中のコンポーネントに前記目標コンポーネントを含む場合、前記移動端末は、前記移動端末に表示されるインターフェースに入力コントロールを含むと決定する。逆に、前記移動端末に表示されるインターフェース中のコンポーネントに前記目標コンポーネントを含まない場合、前記移動端末は、前記移動端末に表示されるインターフェースに入力コントロールを含まないと決定する。前記目標コンポーネントは、テキストを入力できるコンポーネントであり、例えば「textfiled」コンポーネントである。
ステップ103において、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
本ステップにおいて、前記移動端末は、前記移動端末に表示されるインターフェースが第2所定条件を満たすか否かを判断し、前記移動端末に表示されるインターフェースが前記第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。なお、本開示の一部実施例において、異なるテキストコンテンツは、異なる指示に対応する。前記移動端末に表示されるインターフェースが前記第2所定条件を満たす場合、前記移動端末は、前記音声入力をテキストコンテンツに変換し、前記音声入力に対応するテキストコンテンツに対応する指示を取得し、前記テキストコンテンツに対応する指示を実行するように前記移動端末を制御する。なお、本開示の他の実施例において、異なる音声コンテンツは、異なる指示に対応する。前記移動端末に表示されるインターフェースが前記第2所定条件を満たす場合、前記移動端末は、前記音声入力の音声コンテンツに対応する指示を取得し、前記音声入力の音声コンテンツに対応する指示を実行するように前記移動端末を制御する。
前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含まないことである。この場合、前記移動端末に表示されるインターフェースに入力コントロールを含まないと、ユーザが音声を文字に変換して入力する意図がないことを意味し、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
また、前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含むが、前記音声入力に対応するテキストコンテンツが目標コンテンツであることであってもよい。この場合、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツであると、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
更に、前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含むが、目標アイコンを目標領域に移動させるための第1入力が受信されたことであってもよい。この場合、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記目標アイコンを前記目標領域に移動させるための第1入力が受信されると、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
本開示の一部実施例において、上記移動端末は、携帯電話、タブレットパソコン(Tablet Personal Computer)、ラップトップコンピュータ(Laptop Computer)、携帯情報端末PDA(personal digital assistant)、モバイルネットワークデバイスMID(Mobile Internet Device)又はウェアラブルデバイス(Wearable Device)、デジタルカメラなどの電子機器である。
本実施例において、前記音声処理方法は、音声入力を受信し、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示し、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。このように、移動端末に表示されるインターフェースが満たす条件に応じて、移動端末が受信した音声入力を処理することができ、ユーザの手動操作を必要とすることなく、受信した音声入力に対して対応の処理を行うことができ、ユーザが手動で音声モードを切り替える手間が省け、携帯性が向上する。
選択可能に、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではない場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを含む。
本実施例において、前記第1所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではないことである。前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末は、更に、前記音声入力に対応するテキストコンテンツが目標コンテンツであるか否かを判断する。具体的には、前記音声入力に対応するテキストコンテンツが目標コンテンツではない場合、前記移動端末に表示されるインターフェースが前記第1所定条件を満たすと決定する。逆に、前記音声入力に対応するテキストコンテンツが前記目標コンテンツである場合、前記移動端末に表示されるインターフェースが前記第1所定条件を満たさないと決定する。
選択可能に、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されなかった場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを含む。ここで、前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンである。
本実施例において、前記第1所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記移動端末が目標アイコンを目標領域に移動させるための第1入力を受信しなかったことである。
前記移動端末に表示されるインターフェースに入力コントロールを含むと、前記移動端末は、前記移動端末のインターフェースに目標アイコンを表示する。例えば、図4に示すアイコン401を表示する。ユーザが音声制御機能をトリガする必要があれば、目標アイコンを目標領域(図示の領域402)に移動させる。前記移動端末は、前記目標アイコンを前記目標領域に移動させるための第1入力を受信しなかった場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する。
選択可能に、前記の前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、前記移動端末に表示されるインターフェースに入力コントロールを含まない場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含む。
本実施例において、前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含まないことを含む。なお、前記移動端末に表示されるインターフェースに入力コントロールを含まない場合、ユーザが音声を文字に変換して入力する意図がないことを意味し、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
選択可能に、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツである場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含む。
本実施例において、前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツであることを含む。なお、前記移動端末に表示されるインターフェースに入力コントロールを含む場合、ユーザは、前記移動端末による一部指示の実行を音声で制御する可能性もあり、例えば、音声によるテキスト入力の終了後に、入力したテキストコンテンツを送信する必要があるか、又は、前記移動端末に表示されるインターフェースを終了又は切り替える必要がある。従って、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に前記移動端末による対応する指示の実行をトリガするように、予め目標コンテンツを設定することができる。前記移動端末は、前記音声入力に対応するテキストコンテンツが前記目標コンテンツであるかを判断する。前記テキストコンテンツが目標コンテンツではない場合、前記移動端末は、前記音声入力に対応するテキストコンテンツを前記入力ボックスに表示する。逆に、前記テキストコンテンツが前記目標コンテンツである場合、前記音声入力に対応するテキストコンテンツに対応する指示を実行するように前記移動端末を制御する。
本実施例において、異なる目標コンテンツは、異なる指示に対応する。前記音声入力に対応するテキストコンテンツが第1目標コンテンツである場合、前記第1目標コンテンツに対応する指示を実行するように前記移動端末を制御する。前記音声入力に対応するテキストコンテンツが第2目標コンテンツである場合、前記第2目標コンテンツに対応する指示を実行するように前記移動端末を制御する。具体的には、前記音声入力に対応するテキストコンテンツが第1目標コンテンツ(例えば「送信」)である場合、前記入力コントロール内のコンテンツを送信するように前記移動端末を制御する。前記テキストコンテンツが第2目標コンテンツ(例えば「終了」又は「切り替え」)である場合、前記移動端末のインターフェースを終了又は切り替える。
なお、前記音声入力に対応するテキストコンテンツが第1目標コンテンツである場合、前記移動端末は、まず、前記入力コントロール内のコンテンツについてヌルであるかを判断し、前記入力コントロール内のコンテンツがヌルでない場合のみ、前記入力コントロール内のコンテンツを送信する。
選択可能に、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されると、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含む。ここで、前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンである。
本実施例において、前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含まないことである。又は、前記第2所定条件は、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記移動端末が目標アイコンを目標領域に移動させるための第1入力を受信したことである。
前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末は、前記移動端末のインターフェースに目標アイコンを表示し、例えば、図4に示すアイコン401を表示する。ユーザが音声制御機能をトリガする必要がある場合、目標アイコンを目標領域(図示の領域402)に移動させる。前記移動端末は、前記目標アイコンを前記目標領域に移動させるための第1入力を受信すると、前記移動端末に表示されるインターフェースが第2所定条件を満たすと決定し、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
なお、前記目標アイコンは、音声入力機能に対応するアイコンである。前記移動端末は、移動端末のインターフェースに図4に示すアイコン401を表示する。移動端末の現在の音声モードを分かりやすくするために、「書き取り」をアイコンに付け加えるが、アイコンに「書き取り」を付け加えなくてもよい。前記目標領域は、予め設定された任意の領域である。前記移動端末は、前記目標領域に、図4に示すような「ここまでドラッグして書き取りを終了する」という文字コンテンツを付け加えることによって、目標領域の位置を分かりやすくし、又は、前記移動端末をどのように音声入力モードから終了させるかを分かりやすくするが、前記目標領域に何らのコンテンツも付け加えなくてもよい。図4に示すアイコン401及び目標領域402は、単に例示に過ぎず、これに限定されない。
図5は、本開示の一部実施例に係る別の音声処理方法のフローチャートである。前記方法は、移動端末に応用し、図5に示すように、以下のステップを含む。
ステップ501において、音声入力を受信する。
該ステップ501は、本開示の図1に示す実施例のステップ101と同じであるため、ここでは繰り返して述べない。
ステップ502において、前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する。
前記移動端末に表示されるインターフェースに入力コントロールを含む場合、ユーザが音声を文字に変換して前記入力コントロールに入力する希望があることを意味し、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する。
ステップ503において、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
該ステップ503は、本開示の図1に示す実施例のステップ103と同じであるため、ここでは繰り返して述べない。
本実施例において、前記音声処理方法は、音声入力を受信し、前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末に表示されるインターフェースの入力コントロール内に前記音声入力に対応するテキストコンテンツを表示し、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。このように、移動端末に表示されるインターフェースが入力コントロールを含むか否かに応じて、移動端末が受信した音声入力を処理することができ、ユーザの手動操作を必要とすることなく、受信した音声入力に対して対応の処理を行うことができ、ユーザが手動で音声モードを切り替える手間が省け、携帯性が向上する。
図6は、本開示の一部実施例に係る移動端末の構造図である。図6に示すように、移動端末600は、音声入力を受信する受信モジュール601と、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示する表示モジュール602と、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する制御モジュール603とを含む。
選択可能に、前記表示モジュール602は、具体的に、前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する。
選択可能に、前記表示モジュール602は、具体的に、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではない場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する。
選択可能に、前記表示モジュール602は、具体的に、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されなかった場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する。ここで、前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンである。
選択可能に、前記制御モジュール603は、具体的に、前記移動端末に表示されるインターフェースに入力コントロールを含まない場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
選択可能に、前記制御モジュール603は、具体的に、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツである場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
選択可能に、前記制御モジュール603は、具体的に、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されると、前記音声入力に対応する指示を実行するように前記移動端末を制御する。ここで、前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンである。
本実施例において、前記移動端末は、音声入力を受信し、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示し、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。このように、前記移動端末は、移動端末に表示されるインターフェースが満たす条件に応じて、移動端末が受信した音声入力を処理することができ、ユーザの手動操作を必要とすることなく、受信した音声入力に対して対応の処理を行うことができ、ユーザが手動で音声モードを切り替える手間が省け、携帯性が向上する。
図7は、本開示の各実施例を実現する移動端末のハードウェア構造図である。図7に示すように、該移動端末700は、ラジオ周波数ユニット701と、ネットワークモジュール702と、音声出力ユニット703と、入力ユニット704と、センサ705と、表示ユニット706と、ユーザ入力ユニット707と、インターフェースユニット708と、メモリ709と、プロセッサ710と、電源711などの構成要素を含むが、これらに限定されない。図7に示される移動端末の構造は、移動端末を限定するものではなく、移動端末は、図示されるよりも多い又は少ない構成要素、又は特定の構成要素の組み合わせ、又は異なる構成要素の配置を含むことができることを、当業者は理解可能である。本開示の一部実施例において、移動端末は、携帯電話、タブレットパソコン、ノートパソコン、パームトップパソコン、車載移動端末、ウェアラブルデバイス及び歩数計などを含むが、それらに限定されない。
ここで、プロセッサ710は、音声入力を受信し、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示し、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。
選択可能に、前記プロセッサ710によって実行される、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを含む。
選択可能に、前記プロセッサ710によって実行される、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではない場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを含む。
選択可能に、前記プロセッサ710によって実行される、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されなかった場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを含む。ここで、前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンである。
選択可能に、前記プロセッサ710によって実行される、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、前記移動端末に表示されるインターフェースに入力コントロールを含まない場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含む。
選択可能に、前記プロセッサ710によって実行される、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツである場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含む。
選択可能に、前記プロセッサ710によって実行される、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されると、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含む。ここで、前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンである。
本開示の一部実施例において、移動端末は、音声入力を受信し、前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示し、前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する。このように、移動端末は、移動端末に表示されるインターフェースが満たす条件に応じて、移動端末が受信した音声入力を処理することができ、ユーザの手動操作を必要とすることなく、受信した音声入力に対して対応の処理を行うことができ、ユーザが手動で音声モードを切り替える手間が省け、携帯性が向上する。
なお、本開示の一部実施例において、ラジオ周波数ユニット701は、情報の送受信又は通話中で信号の送受信に用いられ、具体的に、基地局から下りデータを受信した後、プロセッサ710による処理に供し、また、上りデータを基地局に送信する。一般に、ラジオ周波数ユニット701は、アンテナ、少なくとも1つの増幅器、トランシーバ、結合器、低雑音増幅器、デュプレクサなどを含むが、それらに限定されない。また、ラジオ周波数ユニット701は、無線通信システムを介してネットワークや他の機器と通信を行うこともできる。
移動端末は、ネットワークモジュール702を介して、電子メールの送受信、ウェブページの閲覧、ストリーミングメディアへのアクセスを支援するなど、無線ブロードバンドインターネットアクセスをユーザに提供する。
音声出力ユニット703は、ラジオ周波数ユニット701やネットワークモジュール702が受信した音声データや、メモリ709に記憶された音声データを音声信号に変換して音声として出力することができる。また、音声出力ユニット703は、移動端末700が実行する特定の機能に関する音声(例えば、呼出信号着信音、メッセージ着信音等)を出力してもよい。音声出力ユニット703は、スピーカ、ブザー及びレシーバなどを含む。
入力ユニット704は、音声や映像の信号を受信することに用いられる。入力ユニット704は、ビデオキャプチャモード又は画像キャプチャモードでカメラなどの画像キャプチャ装置によって取得された静止画又は動画の画像データを処理するグラフィックスプロセッサGPU(Graphics Processing Unit)7041と、マイク7042とを含む。処理された画像フレームは、表示ユニット706上に表示される。グラフィックスプロセッサ7041で処理された画像フレームは、メモリ709(又は他の記憶媒体)に記憶されるか、又はラジオ周波数ユニット701又はネットワークモジュール702を介して送信される。マイク7042は、音声を受信し、音声データに加工することができる。処理された音声データは、電話通話モードの場合、ラジオ周波数ユニット701を介して移動体通信基地局に送信可能な形式に変換して出力することができる。
移動端末700は、光センサ、モーションセンサ及び他のセンサのような少なくとも1つのセンサ705を更に含む。具体的には、光センサは、周辺光センサ及び近接センサを含む。周辺光センサは、周辺光の明暗に応じて表示パネル7061の輝度を調節し、近接センサは、移動端末700が耳に移動したときに表示パネル7061及び/又はバックライトを消灯する。モーションセンサの1種として、加速度計センサは、様々な方向(一般的には3軸)の加速度の大きさを検出でき、静止時は重力の大きさ及び方向を検出でき、移動端末姿勢の認識(例えば、縦横画面切替、関連ゲーム、磁力計姿勢キャリブレーション)、振動認識関連機能(例えば、歩数計、ストローク)などに用いることができる。センサ705は、指紋センサ、圧力センサ、虹彩センサ、分子センサ、ジャイロスコープ、気圧計、湿度計、温度計、赤外線センサなどを更に含むことができるが、ここでは枚挙しない。
表示ユニット706は、ユーザが入力した情報やユーザに提供した情報を表示するために用いられる。表示ユニット706は、液晶ディスプレイLCD(Liquid Crystal Display)、有機発光ダイオードOLED(Organic Light-Emitting Diode)などからなる表示パネル7061を含んでもよい。
ユーザ入力ユニット707は、数字や文字情報の入力を受け付け、ユーザによる移動端末の設定や機能制御に関するキー信号の入力を行うことに用いられる。具体的に、ユーザ入力ユニット707は、タッチパネル7071と、その他の入力機器7072とを含む。タッチパネル7071は、タッチスクリーンとも呼ばれ、その上又は付近でのユーザのタッチ操作を取得可能である(例えばユーザが指やスタイラスなどの任意の適切な物体や付属部材を用いたタッチパネル7071の上又はタッチパネル7071の付近での操作)。タッチパネル7071は、タッチ検出装置とタッチコントローラの2つの部分を含む。ここで、タッチ検出装置は、ユーザのタッチ方位を検出し、タッチ操作による信号を検出してタッチコントローラに伝達する。タッチコントローラは、タッチ検出装置からのタッチ情報を受信し、それを接点座標に変換してプロセッサ710に送り、プロセッサ710からの命令を受信して実行する。なお、タッチパネル7071は、抵抗膜式、静電容量式、赤外線、表面弾性波など、種々の方式を用いて実現することができる。ユーザ入力ユニット707は、タッチパネル7071の他に、他の入力機器7072を含んでもよい。具体的に、他の入力機器7072は、物理的なキーボード、機能キー(例えば、音量調節キー、スイッチキーなど)、トラックボール、マウス、レバーを含むが、ここでは枚挙しない。
更に、タッチパネル7071は、表示パネル7061に重ねられる。タッチパネル7071は、その上又はその近くでタッチ操作を検出すると、プロセッサ710に送信して、タッチイベントのタイプを決定する。次いで、プロセッサ710は、タッチイベントのタイプに応じて、対応する視覚的出力を表示パネル7061に提供する。図7では、タッチパネル7071と表示パネル7061は、独立した2つの部品として移動端末の入出力機能を実現するが、実施例によっては、タッチパネル7071と表示パネル7061を一体化して移動端末の入出力機能を実現することもでき、具体的にここでは限定しない。
インターフェースユニット708は、外部装置と移動端末700とを接続するためのインターフェースである。例えば、外部装置は、有線又は無線ヘッドホンポート、外部電源(又はバッテリ充電器)ポート、有線又は無線データポート、メモリカードポート、認識モジュールを有する装置を接続するためのポート、オーディオ入出力(I/O)ポート、ビデオI/Oポート、ヘッドホンポート等を含む。インターフェースユニット708は、外部装置から入力(例えば、データ情報、電力など)を受信し、受信した入力を移動端末700内の1つ以上の要素に伝送するために使用されてもよく、又は移動端末700と外部装置との間でデータを伝送するために使用されてもよい。
メモリ709は、ソフトウェアプログラム及び様々なデータを格納するために使用される。メモリ709は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーション(例えば、音声再生機能、画像再生機能など)などを格納することができるプログラム格納領域と、データ格納領域とを主に含んでもよい。データ格納領域は、音声データや電話帳など、携帯電話機の使用に応じて作成されたデータを記憶することができる。更に、メモリ709は、高速ランダムアクセスメモリを含んでもよく、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリデバイス、又は他の揮発性固体記憶デバイスなどの不揮発性メモリを含んでもよい。
プロセッサ710は、移動端末の制御センタであり、各種インターフェースや回線を用いて移動端末全体の各部を接続し、メモリ709に格納されたソフトウェアプログラム及び/又はモジュールを実行、メモリ709に格納されたデータを呼び出して移動端末の各種機能及び処理データを実行し、移動端末全体の監視を行う。プロセッサ710は、1つ以上の処理ユニットを含んでもよい。選択可能に、プロセッサ710は、オペレーティングシステム、ユーザインターフェース及びアプリケーションなどを主に処理するアプリケーションプロセッサと、ワイヤレス通信を主に処理するモデムプロセッサとを統合することができる。上述のモデムプロセッサは、プロセッサ710に統合されなくてもよいことが理解される。
移動端末700は、各構成要素に電力を供給するためのバッテリのような電源711を更に含んでもよい。選択可能に、電源711は、電源管理システムを介してプロセッサ710に論理的に接続されてもよく、電源管理システムを介して充電、放電、及び消費電力管理などを管理する機能を実現してもよい。
また、移動端末700は、図示しない機能モジュールを更に含んでもよく、ここでの説明は省略する。
選択可能に、本開示の一部実施例は、プロセッサ710と、メモリ709と、メモリ709に格納されて前記プロセッサ710で動作可能なコンピュータプログラムを含む移動端末を更に提供し、該コンピュータプログラムがプロセッサ710によって実行されると、上記音声処理方法の実施例の各プロセスが実現され、且つ同じ技術効果を奏することもできるので、重複を避けるために、ここでは繰り返して記載しない。
本開示の一部実施例は、コンピュータプログラムが格納されているコンピュータ読み取り可能な記憶媒体を更に提供し、該コンピュータプログラムがプロセッサによって実行されると、上記音声処理方法の実施例の各プロセスが実現され、且つ同じ技術効果を奏することもできるので、重複を避けるために、ここでは繰り返して記載しない。ここで、前記コンピュータ読み取り可能な記憶媒体は、例えば、ROM(Read-Only Memory)、RAM(Random Access Memory)、磁気ディスク又は光ディスクなどなどである。
なお、本明細書において、「含む」や「含有する」又はそれ以外のあらゆる変形用語は、非排他的に含むことを意味する。よって、一連の要素を含むプロセス、方法、モノ又は装置は、それらの要素を含むだけではなく、明確に列挙されていない他の要素を更に含み、又はこのようなプロセス、方法、モノ又は装置に固有の要素を更に含む。特に限定されない限り、「…を1つ含む」の表現によって限定される要素について、当該要素を含むプロセス、方法、モノ又は装置に他の同一要素の存在を除外しない。
以上の実施形態の記載から、上記実施例の方法が、ソフトウェアに必須の汎用ハードウェアプラットフォームの形態で実現され、もちろんハードウェアによっても実現されてもよく、多くの場合では前者がより好適な実施形態であることは、当業者にとって自明である。このような理解に基づき、本発明の技術手段の実質的又は従来技術に貢献した部分は、ソフトウェアプロダクトの形式で現れる。当該コンピュータソフトウェアプロダクトは、記憶媒体(例えばROM/RAM、磁気ディスク、光ディスク)に記憶され、本開示の各実施例の方法を1台の移動端末機器(携帯電話、コンピュータ、サーバー、空調機又はネットワークデバイスなど)に実行させるいくつかの指示を含む。
以上の記載は、本開示の具体的な実施形態に過ぎない。しかし、本開示の保護範囲は、これに限定されない。当業者が本開示に開示されている技術範囲内に容易に想到できる変化又は差し替えは、いずれも本開示の保護範囲内に含まれるべきである。従って、本開示の保護範囲は、特許請求の範囲を基準とするべきである。
600 移動端末
601 受信モジュール
602 表示モジュール
603 制御モジュール
700 移動端末
701 ラジオ周波数ユニット
702 ネットワークモジュール
703 音声出力ユニット
704 入力ユニット
705 センサ
706 表示ユニット
707 ユーザ入力ユニット
708 インターフェースユニット
709 メモリ
710 プロセッサ
711 電源
7041 グラフィックスプロセッサ
7042 マイク
7061 表示パネル
7071 タッチパネル
7072 入力機器

Claims (13)

  1. 移動端末に応用される音声処理方法であって、
    音声入力を受信することと、
    前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することと、
    前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することとを含み、
    前記の前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されなかった場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを含み、
    前記の前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されると、前記音声入力に対応する指示を実行するように前記移動端末を制御することを含み、
    前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンであり、
    前記目標領域に、前記目標領域の位置又は音声入力モードの終了方法を指示するための文字を付け加えている、音声処理方法。
  2. 前記の前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、
    前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを更に含む、請求項1に記載の音声処理方法。
  3. 前記の前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示することは、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではない場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示することを更に含む、請求項1に記載の音声処理方法。
  4. 前記の前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、
    前記移動端末に表示されるインターフェースに入力コントロールを含まない場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することを更に含む、請求項1~3のいずれか1項に記載の音声処理方法。
  5. 前記の前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツである場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することを更に含む、請求項1又は3に記載の音声処理方法。
  6. 前記の前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御することは、
    前記音声入力に対応するテキストコンテンツが第1目標コンテンツである場合、前記移動端末は、前記入力コントロール内のコンテンツについてヌルであるかを判断し、前記入力コントロール内のコンテンツがヌルでない場合のみ、前記第1目標コンテンツに対応する指示を実行する、請求項1に記載の音声処理方法。
  7. 移動端末であって、
    音声入力を受信する受信モジュールと、
    前記移動端末に表示されるインターフェースが第1所定条件を満たす場合、前記移動端末に表示されるインターフェースに前記音声入力に対応するテキストコンテンツを表示する表示モジュールと、
    前記移動端末に表示されるインターフェースが第2所定条件を満たす場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する制御モジュールとを含み、
    前記表示モジュールは、具体的に、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されなかった場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示し、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ目標アイコンを目標領域に移動させるための第1入力が受信されると、前記音声入力に対応する指示を実行するように前記移動端末を制御し、
    前記目標アイコンは、前記移動端末に表示されるインターフェースに入力コントロールを含む場合に、前記移動端末のインターフェースに表示されるアイコンであり、
    前記目標領域に、前記目標領域の位置又は音声入力モードの終了方法を指示するための文字を付け加えている、
    移動端末。
  8. 前記表示モジュールは、具体的に、
    前記移動端末に表示されるインターフェースに入力コントロールを含む場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示し、
    又は
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツではない場合、前記移動端末に表示されるインターフェース上の入力コントロール内に前記音声入力に対応するテキストコンテンツを表示する、請求項に記載の移動端末。
  9. 前記制御モジュールは、具体的に、
    前記移動端末に表示されるインターフェースに入力コントロールを含まない場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する、請求項又はに記載の移動端末。
  10. 前記制御モジュールは、具体的に、
    前記移動端末に表示されるインターフェースに入力コントロールを含み且つ前記音声入力に対応するテキストコンテンツが目標コンテンツである場合、前記音声入力に対応する指示を実行するように前記移動端末を制御する、請求項又はに記載の移動端末。
  11. 前記制御モジュールは、
    前記音声入力に対応するテキストコンテンツが第1目標コンテンツである場合、前記移動端末は、前記入力コントロール内のコンテンツについてヌルであるかを判断し、前記入力コントロール内のコンテンツがヌルでない場合のみ、前記第1目標コンテンツに対応する指示を実行する、請求項に記載の移動端末。
  12. プロセッサと、メモリと、前記メモリに格納されて前記プロセッサで実行可能なコンピュータプログラムとを含む移動端末であって、
    前記コンピュータプログラムが前記プロセッサによって実行されると、請求項1~のいずれか1項に記載の音声処理方法のステップが実現される、移動端末。
  13. コンピュータプログラムが格納されているコンピュータ読み取り可能な記憶媒体であって、
    該コンピュータプログラムがプロセッサによって実行されると、請求項1~のいずれか1項に記載の音声処理方法のステップが実現される、コンピュータ読み取り可能な記憶媒体。
JP2021511616A 2018-08-30 2019-07-16 音声処理方法及び移動端末 Active JP7308929B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201811001519.6A CN109218526B (zh) 2018-08-30 2018-08-30 一种语音处理方法及移动终端
CN201811001519.6 2018-08-30
PCT/CN2019/096087 WO2020042784A1 (zh) 2018-08-30 2019-07-16 语音处理方法及移动终端

Publications (2)

Publication Number Publication Date
JP2021536061A JP2021536061A (ja) 2021-12-23
JP7308929B2 true JP7308929B2 (ja) 2023-07-14

Family

ID=64986772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021511616A Active JP7308929B2 (ja) 2018-08-30 2019-07-16 音声処理方法及び移動端末

Country Status (6)

Country Link
EP (1) EP3846426B1 (ja)
JP (1) JP7308929B2 (ja)
KR (1) KR102554899B1 (ja)
CN (1) CN109218526B (ja)
ES (1) ES2958814T3 (ja)
WO (1) WO2020042784A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218526B (zh) * 2018-08-30 2020-09-25 维沃移动通信有限公司 一种语音处理方法及移动终端

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092751A (ja) 1999-09-24 2001-04-06 Casio Comput Co Ltd メッセージ送信方法およびメッセージ受信方法ならびに情報処理機器
JP2004234529A (ja) 2003-01-31 2004-08-19 Cross Culture Ltd キオスク端末
JP2010183244A (ja) 2009-02-04 2010-08-19 Fujifilm Corp 撮像装置及び撮像装置の制御方法
US20110165841A1 (en) 2010-01-05 2011-07-07 Baek Sungmin Mobile terminal, mobile terminal system, and method for controlling operation of the same
JP2013055700A (ja) 2012-12-05 2013-03-21 Nec Casio Mobile Communications Ltd 端末装置およびプログラム
US20140218372A1 (en) 2013-02-05 2014-08-07 Apple Inc. Intelligent digital assistant in a desktop environment
JP2018073067A (ja) 2016-10-27 2018-05-10 京セラ株式会社 電子機器、制御方法およびプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US20120089392A1 (en) * 2010-10-07 2012-04-12 Microsoft Corporation Speech recognition user interface
KR102022318B1 (ko) * 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
CN103246648B (zh) * 2012-02-01 2016-04-20 腾讯科技(深圳)有限公司 语音输入控制方法及装置
US20150149354A1 (en) * 2013-11-27 2015-05-28 Bank Of America Corporation Real-Time Data Recognition and User Interface Field Updating During Voice Entry
CN105988581B (zh) * 2015-06-16 2019-03-08 恒大法拉第未来智能汽车(广东)有限公司 一种语音输入方法及装置
KR20170046958A (ko) * 2015-10-22 2017-05-04 삼성전자주식회사 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법
CN105957530B (zh) * 2016-04-28 2020-01-03 海信集团有限公司 一种语音控制方法、装置和终端设备
US10187512B2 (en) * 2016-09-27 2019-01-22 Apple Inc. Voice-to text mode based on ambient noise measurement
CN107608957A (zh) * 2017-09-06 2018-01-19 百度在线网络技术(北京)有限公司 基于语音信息的文本修改方法、装置及其设备
CN108364644A (zh) * 2018-01-17 2018-08-03 深圳市金立通信设备有限公司 一种语音交互方法、终端及计算机可读介质
CN109218526B (zh) * 2018-08-30 2020-09-25 维沃移动通信有限公司 一种语音处理方法及移动终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092751A (ja) 1999-09-24 2001-04-06 Casio Comput Co Ltd メッセージ送信方法およびメッセージ受信方法ならびに情報処理機器
JP2004234529A (ja) 2003-01-31 2004-08-19 Cross Culture Ltd キオスク端末
JP2010183244A (ja) 2009-02-04 2010-08-19 Fujifilm Corp 撮像装置及び撮像装置の制御方法
US20110165841A1 (en) 2010-01-05 2011-07-07 Baek Sungmin Mobile terminal, mobile terminal system, and method for controlling operation of the same
JP2013055700A (ja) 2012-12-05 2013-03-21 Nec Casio Mobile Communications Ltd 端末装置およびプログラム
US20140218372A1 (en) 2013-02-05 2014-08-07 Apple Inc. Intelligent digital assistant in a desktop environment
JP2018073067A (ja) 2016-10-27 2018-05-10 京セラ株式会社 電子機器、制御方法およびプログラム

Also Published As

Publication number Publication date
KR102554899B1 (ko) 2023-07-11
CN109218526A (zh) 2019-01-15
JP2021536061A (ja) 2021-12-23
US20210225376A1 (en) 2021-07-22
KR20210052513A (ko) 2021-05-10
EP3846426B1 (en) 2023-08-30
EP3846426A1 (en) 2021-07-07
EP3846426A4 (en) 2021-11-10
CN109218526B (zh) 2020-09-25
WO2020042784A1 (zh) 2020-03-05
ES2958814T3 (es) 2024-02-15

Similar Documents

Publication Publication Date Title
US20220276909A1 (en) Screen projection control method and electronic device
WO2020258929A1 (zh) 文件夹界面切换方法及终端设备
CN110874147B (zh) 一种显示方法及电子设备
CN110062105B (zh) 一种界面显示方法及终端设备
CN108897473B (zh) 一种界面显示方法及终端
US11354017B2 (en) Display method and mobile terminal
CN109032468B (zh) 一种调节设备参数的方法及终端
CN109032486B (zh) 一种显示控制方法及终端设备
CN109710349B (zh) 一种截屏方法及移动终端
WO2020238497A1 (zh) 图标移动方法及终端设备
WO2021068885A1 (zh) 控制方法及电子设备
CN109710130B (zh) 一种显示方法和终端
CN111309419A (zh) 一种分屏显示方法和电子设备
CN111010523A (zh) 一种视频录制方法及电子设备
CN111475066B (zh) 应用程序的后台切换方法及电子设备
WO2020151490A1 (zh) 应用的控制方法及终端设备
CN111190517B (zh) 分屏显示方法及电子设备
JP7221305B2 (ja) 対象物認識方法及び移動端末
CN110012151B (zh) 一种信息显示方法及终端设备
CN109597546B (zh) 一种图标处理方法及终端设备
CN111443860B (zh) 触控方法和电子设备
JP7308929B2 (ja) 音声処理方法及び移動端末
CN109739430B (zh) 一种显示方法及移动终端
JP2022544809A (ja) アイコン表示方法及び端末
CN111443968A (zh) 一种截图方法及电子设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230704

R150 Certificate of patent or registration of utility model

Ref document number: 7308929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150