JP2019091429A - 情報処理方法および装置 - Google Patents

情報処理方法および装置 Download PDF

Info

Publication number
JP2019091429A
JP2019091429A JP2018188185A JP2018188185A JP2019091429A JP 2019091429 A JP2019091429 A JP 2019091429A JP 2018188185 A JP2018188185 A JP 2018188185A JP 2018188185 A JP2018188185 A JP 2018188185A JP 2019091429 A JP2019091429 A JP 2019091429A
Authority
JP
Japan
Prior art keywords
information
push
text
words
waiting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018188185A
Other languages
English (en)
Other versions
JP6681450B2 (ja
Inventor
ツー、ホアロン
Hualong Zu
ユアン、ハイコアン
Haiguang Yuan
シュイ、ラン
Ran Xu
チェン、チェン
Chen Chen
シー、レイ
Lei Shi
リー、シン
Xin Li
チェン、リーオウ
Liou Chen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2019091429A publication Critical patent/JP2019091429A/ja
Application granted granted Critical
Publication of JP6681450B2 publication Critical patent/JP6681450B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザにより情報をブラウジングするのに不便な状況で情報を再生することにより、ユーザが即時に情報を取得することができる情報処理方法および装置を提供する。【解決手段】端末装置に適用される情報処理方法であって、受信したユーザからの音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得するステップと、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得するステップと、テキストプッシュ情報を処理して、テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップと、プッシュ待ち情報を再生するステップと、を含む。【選択図】図2

Description

本発明は、コンピュータの技術分野に関し、特にインターネットの技術分野に関し、特に、情報処理方法および装置に関する。
人工知能(Artificial Intelligence)は、英語でAIと略記される。これは、人間の知能をシミュレートし、伸び、拡張する理論、方法、技術および応用を研究し開発する新しい技術科学である。人工知能は、コンピュータサイエンスの一つの分岐として、知能の本質を理解し、人間の知能と類似する式で対応できる新しいインテリジェントロボットを生産しようとする。この分野の研究は、ロボット、音声認識、画像認識、自然言語処理とエキスパートシステムなどを含む。
人工知能の急速な発展に伴い、様々な人工知能に基づく応用が次々と登場すると同時に、人々の生活に大きな利便性をもたらす。例えば、会話型人工知能秘書は、音声認識、自然言語処理、機械学習の3つの機能を組み合わせる。ユーザは、音声、テキストまたは画像を使用して会話型人工知能秘書と1対1形式でインタラクションすることができる。会話型人工知能秘書は、対話中でユーザの様々なニーズを明確に理解し、実世界のサービスや情報の広範な索引付けに基づいて、様々な質の高いサービスをユーザに提供することができる。従来の会話型人工知能秘書は、ユーザから送信された音声照会要求を受信すると、音声照会要求などのデータを解析し、処理結果を端末装置の表示画面に表示する。
本発明の実施形態は、情報処理方法および装置を提案する。
第一の方面として、本発明の実施形態は、情報処理方法を提供する。上記方法は、受信されたユーザからの音声照会要求を解析して、上記音声照会要求に対応するテキスト照会情報を取得するステップと、上記テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得するステップと、上記テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップと、上記プッシュ待ち情報を再生するステップと、を含む。
一部の実施形態において、上記テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップは、上記テキストプッシュ情報のワード数が所定のワード数閾値を超えたか否かを確定するステップと、上記テキストプッシュ情報のワード数が所定のワード数閾値を超えたと確定されたことに応じて、上記テキストプッシュ情報における上記テキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とするステップと、上記第1の情報に基づいて、上記プッシュ待ち情報を生成するステップと、を含む。
一部の実施形態において、上記テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップは、上記テキストプッシュ情報のワード数が所定のワード数閾値を超えないと確定されたことに応じて、上記テキストプッシュ情報を第1の情報とするステップを含む。
一部の実施形態において、上記第1の情報に基づいて、上記プッシュ待ち情報を生成するステップは、上記テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するステップと、上記ウェブサイト名と上記第1の情報とを組み合わせて、上記プッシュ待ち情報を生成するステップと、を含む。
一部の実施形態において、上記第1の情報に基づいて、上記プッシュ待ち情報を生成するステップは、上記テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するステップと、上記テキスト照会情報、上記ウェブサイト名及び上記第1の情報を組み合わせて、上記プッシュ待ち情報を生成するステップと、を含む。
一部の実施形態において、上記第1の情報に基づいて、上記プッシュ待ち情報を生成するステップは、上記テキストプッシュ情報の属するウェブサイトのウェブサイト名と、上記テキストプッシュ情報のサブジェクト情報とを取得するステップと、上記サブジェクト情報、上記ウェブサイト名及び上記第1の情報を組み合わせて、上記プッシュ待ち情報を生成するステップと、を含む。
一部の実施形態において、上記方法は、上記プッシュ待ち情報を表示するステップをさらに含み、上記第1の情報に基づいて、上記プッシュ待ち情報を生成するステップは、上記テキスト照会情報で検索を行って獲得された画像プッシュ情報を取得するステップと、上記画像プッシュ情報と上記第1の情報とを組み合わせて上記プッシュ待ち情報を生成するステップと、を含む。
一部の実施形態において、上記プッシュ待ち情報を再生するステップは、上記ユーザから送信された音声再生速度制御コマンドを受信するステップと、上記音声再生速度制御コマンドに対応する音声再生速度を取得するステップと、上記音声再生速度で上記プッシュ待ち情報を再生するステップと、を含む。
一部の実施形態において、上記方法は、上記ユーザから送信された詳細情報取得要求を受信するステップと、上記テキストプッシュ情報を再生するステップと、をさらに含む。
第二の方面として、本発明の実施形態は、情報処理装置を提供する。上記装置は、受信されたユーザからの音声照会要求を解析して、上記音声照会要求に対応するテキスト照会情報を取得するように配置される解析ユニットと、上記テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得するように配置される取得ユニットと、上記テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得するように配置される処理ユニットと、上記プッシュ待ち情報を再生するように配置される第1の再生ユニットと、を含む。
一部の実施形態において、上記処理ユニットは、上記テキストプッシュ情報のワード数が所定のワード数閾値を超えたか否かを確定するように配置される確定サブユニットと、上記テキストプッシュ情報のワード数が所定のワード数閾値を超えたと確定されたことに応じて、上記テキストプッシュ情報における上記テキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とするように配置される抽出サブユニットと、上記第1の情報に基づいて、上記プッシュ待ち情報を生成するように配置される生成サブユニットと、を含む。
一部の実施形態において、上記処理ユニットは、上記テキストプッシュ情報のワード数が所定のワード数閾値を超えないと確定されたことに応じて、上記テキストプッシュ情報を第1の情報とするように配置されるサブユニットをさらに含む。
一部の実施形態において、生成サブユニットは、テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するように配置される第1の取得モジュールと、ウェブサイト名と第1の情報とを組み合わせてプッシュ待ち情報を生成するように配置される第1の結合モジュールと、を含む。
一部の実施形態において、生成サブユニットは、テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するように配置される第2の取得モジュールと、テキスト照会情報、ウェブサイト名及び第1の情報を組み合わせてプッシュ待ち情報を生成するように配置される第2の結合モジュールと、を含む。
一部の実施形態において、生成サブユニットは、テキストプッシュ情報の属するウェブサイトのウェブサイト名とテキストプッシュ情報のサブジェクト情報とを取得するように配置される第3の取得モジュールと、サブジェクト情報、ウェブサイト名及び第1の情報を組み合わせてプッシュ待ち情報を生成するように配置される第3の結合モジュールと、を含む。
一部の実施形態において、上記装置は、プッシュ待ち情報を表示するように配置される表示ユニットをさらに含み、生成サブユニットは、テキスト照会情報で検索を行って獲得された画像プッシュ情報を取得するように配置される第4の取得モジュールと、画像プッシュ情報と第1の情報とを組み合わせてプッシュ待ち情報を生成するように配置される第4の結合モジュールと、を含む。
一部の実施形態において、第1の再生ユニットは、ユーザから送信された音声再生速度制御コマンドを受信するように配置される受信サブユニットと、音声再生速度制御コマンドに対応する音声再生速度を取得するように配置される取得サブユニットと、音声再生速度でプッシュ待ち情報を再生するように配置される再生サブユニットと、を含む。
一部の実施形態において、上記装置は、ユーザから送信された詳細情報取得要求を受信するように配置される受信ユニットと、テキストプッシュ情報を再生するように配置される第2の再生ユニットと、を含む。
第三の方面として、本発明の実施形態は、1つまたは複数のプロセッサと、1つまたは複数のプログラムが記憶されている記憶装置と、を含み、上記1つまたは複数のプログラムが上記1つまたは複数のプロセッサによって実行されると、上記1つまたは複数のプロセッサに第一の方面に記載の方法を実現させる端末装置を、提供する。
第三の方面として、本発明の実施形態は、コンピュータプログラムが記憶されており、上記プログラムがプロセッサにより実行されると、第一の方面に記載の方法を実現させるコンピュータ読み取り可能な記憶媒体を、提供する。
本発明の実施形態により提供される情報処理方法および装置は、ユーザから送信された音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得する。そして、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得し、テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得する。最後に、プッシュ待ち情報を再生する。これにより、ユーザにより情報をブラウジングするのに不便な状況で情報を再生することができ、ユーザが即時に情報を取得することができる。
以下の図面による非限定的な実施例についての詳細な説明を読み、参照することにより、本願の他の特徴、目的及び利点がより明らかになる。
本発明が適用される例示的なシステムアーキテクチャ図である。 本発明に係る情報処理方法の一実施形態のフローチャートである。 本発明に係る情報処理方法の他の実施形態のフローチャートである。 本発明に係る情報処理装置の一実施形態の概略構成図である。 本発明を実現するのに適する端末装置のコンピュータシステムの概略構成図である。
以下、図面と実施例を参照しながら、本願を詳しく説明する。ここで記載される具体的な実施例は、関連の発明を解釈するのみに用いられ、当該発明に対する限定ではないことは理解される。なお、説明の便宜上、図面には、関連の発明に関わる部分のみを示す。
なお、矛盾が生じない限り、本願における実施例及び実施例における特徴は互いに組み合わせることができるものとする。以下、図面を参照しながら、実施例を併せて本願を詳しく説明する。
図1は、本発明が適用される情報処理方法または装置の実施形態の例示的なシステムアーキテクチャ100を示す。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103と、ネットワーク104と、サーバ105とを備えても良い。ネットワーク104は、端末装置101、102、103とサーバ105の間に通信リンクの媒体を提供する。ネットワーク104は、各種の接続タイプ、例えば有線、無線通信リンク又は光ファイバ、ケーブルなどを含んでも良い。
ユーザは、端末装置101、102、103を使用してネットワーク104を介してサーバ105とインタラクションすることにより、メッセージなどを送受信することができる。端末装置101、102、103には、会話型人工知能秘書などの様々な通信クライアントアプリケーションをインストールすることができる。
端末装置101、102、103は、オーディオプレーヤーが配置されている様々な電子機器であり、スマートフォン、タブレット、MP3プレーヤー(Moving Picture Experts Group Audio Layer III)、MP4(Moving Picture Experts Group Audio Layer IV)プレーヤー、ラップトップポータブルコンピュータ、デスクトップコンピュータ、ウェアラブル装置およびスマートスピーカなどを含むが、これに限定されない。
サーバ105は、検索エンジンのバックエンドサーバのような、サービスを提供する様々なサーバであってもよい。検索エンジンのバックエンドサーバは、端末装置101、102、103から受信されたテキスト照会情報などのデータに対して解析などの処理を行い、処理結果(例えば、テキストプッシュ情報)を端末装置101、102、103にフィードバックすることができる。
なお、本発明の一実施形態に係る情報処理方法は、一般に、端末装置101、102、103によって実行される。これに対応して、情報処理装置は、一般的に端末装置101、102、103に設置される。
理解すべきなのは、図1における端末装置、ネットワーク及びサーバの数は例示的なものに過ぎない。実現の必要に応じて、任意の数の端末デバイス、ネットワーク及びサーバを備えることができる。
さらに図2を参照すると、本発明に係る情報処理方法の一実施形態のフロー200が示されている。当該情報処理方法は、以下のステップを含む。
ステップ201において、受信されたユーザからの音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得する。
本実施形態において、情報処理方法を適用した電子機器(例えば、図1に示す端末装置101、102、103)は、ユーザから送信された音声照会要求を受信し、受信された音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得することができる。ここで、上記音声照会要求は、音声照会情報を含むことができる。
本実施形態において、端末装置は、通常、音声アシスタント機能を有する。具体的には、端末装置は、マイクロフォンなどの音声入力モジュールが配置されている装置であり、たとえば、スマートフォン、タブレットコンピュータ、パソコン、ウェアラブルデバイスおよびインテリジェントスピーカーなどであってもよい。ユーザは、端末装置に対して音声照会情報を話すことができ、端末装置に配置されたマイクロフォン等の音声入力モジュールによりユーザの話す音声照会情報が収集されると、ユーザから送信された音声照会要求が端末装置により受信されたと考えられることができる。
本実施形態において、端末装置は、音声照会要求における音声照会情報に対して音声認識を行って、音声照会要求に対応するテキスト照会情報を取得することができる。ここで、端末装置は、音声認識技術(Automatic Speech Recognition,ASR)を用いて音声照会情報に対して音声認識を行い、音声照会情報における語彙内容を書面形式(書面言語の形式)の語彙内容に変換することができ、当該書面形式の語彙内容がテキスト照会情報である。ここで、音声認識技術は、自動音声認識とも呼ばれ、人間の音声における語彙内容をテキストに変換する技術である。
ステップ202において、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得する。
本実施形態において、ステップ201で得られたテキスト照会情報に基づいて、端末装置は、テキスト照会情報を検索エンジンのバックエンドサーバ(例えば、図1に示すサーバ105)に送信し、検索エンジンのバックエンドサーバがテキスト照会情報を用いてインターネット上で検索して、テキスト照会情報に関連するテキストプッシュ情報を取得し、取得されたテキストプッシュ情報を端末装置に送信することができる。ここで、テキストプッシュ情報は、テキスト照会情報と同じ特徴属性を有することができる。一例として、テキスト照会情報が「象」である場合、テキストプッシュ情報は、「象」の百科事典などの「象」に関する情報であることができる。
なお、テキスト照会情報を用いてテキストプッシュ情報を検索する方法は従来技術であり、ここで詳細な説明を省略する。
ステップ203において、テキストプッシュ情報を処理して、テキストプッシュ情報に対応するプッシュ待ち情報を取得する。
本実施形態において、ステップ202で取得されたテキストプッシュ情報に基づいて、端末装置は、テキストプッシュ情報を処理して、テキストプッシュ情報に対応するプッシュ待ち情報を取得することができる。ここで、端末装置は、テキストプッシュ情報を直接にプッシュ待ち情報としてもよく、テキストプッシュ情報から一部の情報を抽出してプッシュ待ち情報としてもよく、テキストプッシュ情報に一部の情報を追加してプッシュ待ち情報を生成してもよい。
ステップ204において、プッシュ待ち情報を再生する。
本実施形態において、ステップ203で取得されたプッシュ待ち情報に基づいて、端末装置は、プッシュ待ち情報を再生することができる。本実施形態において、端末装置は、オーディオプレーヤーなどの音声出力モジュールが配置されている装置であり、たとえば、スマートフォン、タブレットコンピュータ、パソコン、ウェアラブルデバイスおよびインテリジェントスピーカーなどであってもよい。端末装置は、テキスト−音声変換技術を用いてプッシュ待ち情報を対応する音声情報に変換し、変換された音声情報を再生することができる。ここで、テキスト−音声変換技術とは、テキスト情報を解説する技術であり、音声合成技術に基づく音声発生技術として、コンピュータ中のテキスト情報を連続で自然な音声情報に変換することができる。
本実施形態の一部の選択可能な実施形態において、端末装置は、プッシュ待ち情報を表示することもできる。ここで、端末装置は、スマートフォン、タブレット、コンピュータなどの表示画面が配置されている装置であってもよい。端末装置に表示画面とオーディオプレーヤーとの両方が配置されている場合、端末装置は、ユーザの設定に応じて、その上に配置された表示画面によってプッシュ待ち情報を表示するか、またはその上に配置されたオーディオプレーヤーによってプッシュ待ち情報をプレーヤーするかを確定することができる。
本実施形態の一部の選択可能な実施形態において、音声再生速度を制御することができる。一般に、端末装置にはデフォルトの音声再生速度が設定され、例えば、毎秒4.7ワードに設定される。音声再生速度が制御されない場合、オーディオプレーヤーは、毎秒4.7ワードでプッシュ待ち情報を再生する。音声再生速度を制御するとき、以下の手順を参照してもよい。
まず、ユーザから送信された音声再生速度制御コマンドを受信する。
ここで、ユーザは、端末装置に設けられたマイクロフォンなどの音声入力モジュールを介して音声再生速度制御コマンドを入力することができる。音声再生速度制御コマンドは、音声再生速度に関する情報を含むことができ、具体的な音声再生速度の情報、または音声再生速度の増減を制御する情報を含むことができる。例えば、音声再生速度制御コマンドは、「毎秒4ワードの速度で再生」、「速く」、「速く話す」、「スピードを速く」、または「遅い」、「より遅く」、「スピードを遅く」などであってもよい。
そして、音声再生速度制御コマンドに対応する音声再生速度を取得する。
例えば、音声再生速度制御コマンドが「毎秒4ワードの速度で再生」である場合、音声再生速度は、毎秒4ワードであり、音声再生速度制御コマンドが「速く」、「速く話す」、「スピードを速く」などである場合、音声再生速度は、現在の再生速度(例えば毎秒4.7ワード)に一定の値だけ(例えば1)増えして毎秒5.7ワードになる。再生速度制御コマンドが「遅い」、「より遅く」、「スピードを遅く」などである場合、現在の再生速度(例えば毎秒4.7ワード)に一定の値だけ(例えば、「1」)減らして毎秒3.7ワードになる。
最後に、音声再生速度でプッシュ待ち情報を再生する。
本発明の実施例により提供される情報処理方法は、ユーザから送信された音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得する。そして、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得し、テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得する。最後に、プッシュ待ち情報を再生する。これにより、ユーザにより情報をブラウジングするのに不便な状況で情報を再生することができ、ユーザが即時に情報を取得することができる。
さらに図3を参照すると、本発明に係る情報処理方法の他の実施形態のフロー300が示されている。当該情報処理方法は、以下のステップを含む。
ステップ301において、ユーザによって送られた受信された音声照会要求を解析し、音声照会要求に対応するテキスト照会情報を取得する。
本実施形態において、情報処理方法を適用した電子機器(例えば、図1に示す端末装置101、102、103)は、ユーザから送信された音声照会要求を受信し、受信された音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得することができる。ここで、上記音声照会要求は、音声照会情報を含むことができる。
ステップ302において、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得する。
本実施形態において、ステップ301で得られたテキスト照会情報に基づいて、端末装置は、テキスト照会情報を検索エンジンのバックエンドサーバ(例えば、図1に示すサーバ105)に送信し、検索エンジンのバックエンドサーバがテキスト照会情報を用いてインターネット上で検索して、テキスト照会情報に関連するテキストプッシュ情報を取得し、取得されたテキストプッシュ情報を端末装置に送信することができる。
ステップ303において、テキストプッシュ情報のワード数が所定のワード数閾値を超えたか否かを確定する。
本実施形態において、ステップ302で取得されたテキストプッシュ情報に基づいて、端末装置は、テキストプッシュ情報のワード数を取得して、テキストプッシュ情報のワード数と、所定のワード数閾値(例えば200)とを比較し、テキストプッシュ情報のワード数が所定のワード数閾値を超える場合、ステップ304’が実行され、テキストプッシュ情報のワード数が所定のワード数閾値を超えない場合、ステップ304’’が実行される。
ステップ304’において、テキストプッシュ情報におけるテキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とする。
本実施形態において、テキストプッシュ情報のワード数が所定のワード数閾値を超える場合、端末装置は、テキストプッシュ情報におけるテキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とすることができる。これにより、第1の情報に基づいて生成されたプッシュ待ち情報の長さが長すぎることが防止される。一例として、テキストプッシュ情報が複数の段落を含む場合、各段落に対して、端末装置は、まず当該段落の内容とテキスト照会情報との関連度を決定することができる。次に、関連性の順序に従って各段落を並べる。最後に、関連度が大きい側からいくつかの段落を選択し、ここで、選択された段落のワード数の合計が所定のワード数閾値よりも小さい。ここで、端末装置は、一つの段落の内容に含まれている、テキスト照会情報中のキーワードに基づいて、当該段落の内容とテキスト照会情報との関連度を決定することができる。通常、一つの段落の内容に含まれている、テキスト照会情報中のキーワードの数が多くほど、当該段落の内容とテキスト照会情報との関連度が高い。
ステップ304’’において、テキストプッシュ情報を第1の情報とする。
本実施形態において、テキストプッシュ情報のワード数が所定のワード数閾値を超えない場合、端末装置は、テキストプッシュ情報を第1の情報とすることができる。
ステップ305において、第1の情報に基づいてプッシュ待ち情報を生成する。
本実施形態において、ステップ304’または304’’で取得された第1の情報に基づいて、端末装置は、プッシュ待ち情報を生成することができる。ここで、プッシュ待ち情報は、第1の情報であってもよく、第1の情報をもとに一部の情報を付加した情報であってもよい。
本実施形態の一部の選択可能な実施形態において、電子機器は、まず、テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得してから、ウェブサイト名と第1の情報とを組み合わせてプッシュ待ち情報を生成することができる。一例として、テキストプッシュ情報が「象」の百科事典であり、テキストプッシュ情報の属するウェブサイトのウェブサイト名が「XX百科事典」であり、第1の情報が「象」の百科事典における「ゾウ、象として通称し、現生最大の陸生哺乳類であり(長鼻目)、ゾウ科、アフリカゾウ属、アジアゾウ属の1科2属3種だけ現生している」との一段落である場合、プッシュ待ち情報は、「XX百科事典から、ゾウ、象として通称し、現生最大の陸生哺乳類であり(長鼻目)、ゾウ科、アフリカゾウ属、アジアゾウ属の1科2属3種だけ現生している」であってもよい。プッシュ待ち情報にテキストプッシュ情報の属するウェブサイトのウェブサイト名を追加して、ユーザは、ウェブサイト名に基づいて第1の情報の信頼性を判断することができる。
本実施形態の一部の選択可能な実施形態において、端末装置は、まずテキストプッシュ情報の属するウェブサイトのウェブサイト名を取得してから、テキスト照会情報、ウェブサイト名及び第1の情報を組み合わせてプッシュ待ち情報を生成することができる。一例として、テキスト照会情報が「象」であり、テキストプッシュ情報が「象」の百科事典であり、テキストプッシュ情報の属するウェブサイトのウェブサイト名が「XX百科事典」であり、第1の情報が「象」の百科事典における「ゾウ、象として通称し、現生最大の陸生哺乳類であり(長鼻目)、ゾウ科、アフリカゾウ属、アジアゾウ属の1科2属3種だけ現生している」との一段落である場合、プッシュ待ち情報は、「象、XX百科事典から、ゾウ、象として通称し、現生最大の陸生哺乳類であり(長鼻目)、ゾウ科、アフリカゾウ属、アジアゾウ属の1科2属3種だけ現生している」であってもよい。プッシュ待ち情報にテキスト照会情報を追加することにより、ユーザは、テキスト照会情報に基づいて、音声照会情報に対する端末装置の識別が正確であるか否かを確定して、第1の情報がユーザの必要な情報であるか否かを確定することができる。
本実施形態の一部の選択可能な実施形態において、端末装置は、まずテキストプッシュ情報の属するウェブサイトのウェブサイト名と、テキストプッシュ情報のサブジェクト情報を取得してから、サブジェクト情報、ウェブサイト名及び第1の情報を組み合わせてプッシュ待ち情報を生成することができる。一例として、テキスト照会情報が「象」であり、テキストプッシュ情報が「ゾウ」の百科事典であり、テキストプッシュ情報のサブジェクト情報が「ゾウ」であり、テキストプッシュ情報の属するウェブサイトのウェブサイト名が「XX百科事典」であり、第1の情報が「ゾウ」の百科事典における「哺乳綱ゾウ目(長鼻目)ゾウ科の総称である。現生最大の陸生哺乳類である。ジャングルと草原に居り、草食動物で、長寿命、最大80年まで。」との一段落である場合、プッシュ待ち情報は、「象、XX百科事典から、哺乳綱ゾウ目(長鼻目)ゾウ科の総称である。現生最大の陸生哺乳類である。ジャングルと草原に居り、草食動物で、長寿命、最大80年まで。」であってもよい。プッシュ待ち情報にテキストプッシュ情報のサブジェクト情報を追加することにより、ユーザは、テキストプッシュ情報のサブジェクト情報と、音声照会情報との類似度を決定し、その類似度に基づいて、第1の情報がユーザの需要する情報であるか否かを確定することができる。
本実施形態の一部の選択可能な実施形態において、端末装置は、プッシュ待ち情報を表示することもできる。電子装置は、まずテキスト照会情報で検索を行って獲得された画像プッシュ情報を取得してから、画像プッシュ情報と第1の情報とを組み合わせてプッシュ待ち情報を生成することができる。ここで、端末装置は、テキスト照会情報を検索エンジンのバックエンドサーバに送信し、検索エンジンのバックエンドサーバがテキスト照会情報を用いてインターネット上で検索して、テキスト照会情報に関連する画像プッシュ情報を取得し、取得された画像プッシュ情報を端末装置に送信することができる。一例として、テキストプッシュ情報が「象」の百科事典であり、画像プッシュ情報が「象」の画像であり、第1の情報が「象」の百科事典における一段落であると、表示画面上に「象」の画像と第1の情報とが同時に表示されることができる。プッシュ待ち情報に画像プッシュ情報を追加することにより、ユーザは、画像プッシュ情報に基づいて、第1の情報がユーザの需要する情報であるか否かを明確に確定する一方、プッシュ待ち情報の内容が豊かになる。
ステップ306において、プッシュ待ち情報を再生する。
本実施形態において、ステップ305で取得されたプッシュ情報に基づいて、端末装置は、プッシュ待ち情報を再生することができる。
本実施形態の一部の選択可能な実施形態において、端末装置は、プッシュ待ち情報が再生された後に、テキストプッシュ情報をさらに再生することができる。具体的に、プッシュ待ち情報が再生された後に、端末装置は、詳細情報を取得するか否かとの提示情報をユーザに送信することができる。ユーザから詳細情報取得要求が送信されると、端末装置は、テキストプッシュ情報を再生することができる。例えば、プッシュ待ち情報が再生された後に、「より多いコンテンツを知りたいなら、話してください」との音声情報をさらに再生し、ユーザが端末装置に対して「はい」と話したとき、テキストプッシュ情報を再生することができる。
本実施形態の一部の選択可能な実施形態において、端末装置は、プッシュ待ち情報を表示した後、テキストプッシュ情報をさらに表示することができる。具体的に、プッシュ待ち情報が表示された後に、端末装置は、詳細情報を取得するか否かとの提示情報をユーザに送信することができる。ユーザから詳細情報取得要求が送信されると、端末装置は、テキストプッシュ情報を表示することができる。例えば、プッシュ待ち情報が表示された後に、「より多いコンテンツを知りたいなら、話してください」とのテキスト情報をさらに表示し、ユーザが当該テキスト情報をクリックしたとき、テキストプッシュ情報を表示することができる。
図3から分かるように、図2の実施形態と比較して、本実施形態に係る情報処理方法の流れ300は、テキストプッシュ情報を処理してプッシュ待ち情報を取得するステップを強調した。これにより、本実施形態で説明された形態は、適切なワードの、ユーザのニーズを満たす情報を能動的に抽出しユーザに表示して、ユーザにより必要な情報を取得する時間を省くことができる。
さらに図4を参照すると、各図に示される方法の実現として、本発明は、情報処理装置の実施形態を提供し、装置の実施形態は、図2に示される方法の実施形態に対応し、この装置は、具体的に様々な電子機器に適用することができる。
図4に示すように、本実施形態の情報処理装置400は、解析ユニット401と、取得ユニット402と、処理ユニット403と、第1の再生ユニット404とを含んでもよい。ここで、解析ユニット401は、受信されたユーザからの音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得するように配置される。取得ユニット402は、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得するように配置される。処理ユニット403は、テキストプッシュ情報を処理して、テキストプッシュ情報に対応するプッシュ待ち情報を取得するように配置される。第1の再生ユニット404は、プッシュ待ち情報を再生するように配置される。
本実施形態において、情報処理装置400において、解析ユニット401、取得ユニット402、処理ユニット処理403及び再生ユニット404の具体的な処理ともたらされる技術的効果は、図2の実施形態におけるステップ201、ステップ202、ステップ203およびステップ204の関連説明を参照してもよい。ここで詳細な説明を省略する。
本実施形態の一部の選択可能な実施形態において、処理ユニット403は、テキストプッシュ情報のワード数が所定のワード数閾値を超えたか否かを確定するように配置される確定サブユニット(図示せず)と、テキストプッシュ情報のワード数が所定のワード数閾値を超えたと確定されたことに応じて、テキストプッシュ情報におけるテキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とするように配置される抽出サブユニット(図示せず)と、第1の情報に基づいて、プッシュ待ち情報を生成するように配置される生成サブユニット(図示せず)と、を含んでもよい。
本実施形態の一部の選択可能な実施形態において、処理ユニット403は、テキストプッシュ情報のワード数が所定のワード数閾値を超えないと確定されたことに応じて、テキストプッシュ情報を第1の情報とするように配置されるサブユニット(図示せず)をさらに含んでもよい。
本実施形態の一部の選択可能な実施形態において、生成サブユニットは、テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するように配置される第1の取得モジュール(図示せず)と、ウェブサイト名と第1の情報とを組み合わせてプッシュ待ち情報を生成するように配置される第1の結合モジュール(図示せず)と、を含んでもよい。
本実施形態の一部の選択可能な実施形態において、生成サブユニットは、テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するように配置される第2の取得モジュール(図示せず)と、テキスト照会情報、ウェブサイト名及び第1の情報を組み合わせてプッシュ待ち情報を生成するように配置される第2の結合モジュール(図示せず)と、を含んでもよい。
本実施形態の一部の選択可能な実施形態において、生成サブユニットは、テキストプッシュ情報の属するウェブサイトのウェブサイト名とテキストプッシュ情報のサブジェクト情報とを取得するように配置される第3の取得モジュール(図示せず)と、サブジェクト情報、ウェブサイト名及び第1の情報を組み合わせてプッシュ待ち情報を生成するように配置される第3の結合モジュール(図示せず)と、を含んでもよい。
本実施形態の一部の選択可能な実施形態において、情報処理装置400は、プッシュ待ち情報を表示するように配置される表示ユニット(図示せず)をさらに含んでもよい。生成サブユニットは、テキスト照会情報で検索を行って獲得された画像プッシュ情報を取得するように配置される第4の取得モジュール(図示せず)と、画像プッシュ情報と第1の情報とを組み合わせてプッシュ待ち情報を生成するように配置される第4の結合モジュール(図示せず)と、を含んでもよい。
本実施形態の一部の選択可能な実施形態において、第1の再生ユニット404は、ユーザから送信された音声再生速度制御コマンドを受信するように配置される受信サブユニット(図示せず)と、音声再生速度制御コマンドに対応する音声再生速度を取得するように配置される取得サブユニット(図示せず)と、音声再生速度でプッシュ待ち情報を再生するように配置される再生サブユニット(図示せず)と、を含んでもよい。
本実施形態の一部の選択可能な実施形態において、情報処理装置400は、ユーザから送信された詳細情報取得要求を受信するように配置される受信ユニット(図示せず)と、テキストプッシュ情報を再生するように配置される第2の再生ユニット(図示せず)と、を含んでもよい。
以下、図5を参照すると、本発明の一実施形態実現するのに適する端末装置のコンピュータシステム500の概略構成図を示す。図5に示す端末装置は、あくまでも一例であり、本発明の本実施形態の機能及び利用範囲を限定するものではない。
図5に示されたように、コンピュータシステム500は、読み出し専用メモリ(ROM、Read Only Memory)502に記憶されているプログラム又は記憶部506からランダムアクセスメモリ(RAM、Random Access Memory)503にロードされたプログラムに基づいて様々な適当な動作および処理を実行することができる中央処理装置(CPU、Central Processing Unit)501を備える。RAM503には、システム500の操作に必要な様々なプログラムおよびデータがさらに記憶されている。CPU501、ROM502およびRAM 503は、バス504を介して互いに接続されている。入力/出力(I/O、Input / Output)インターフェース505もバス504に接続されている。
I/Oインターフェース505には、キーボード、マウス等からなる入力部506と、陰極線管(CRT)、液晶表示装置(LCD)、スピーカ等からなる出力部507と、ハードディスク等からなる記憶部508と、LANカードやモデム等のネットワークインターフェースカードからなる通信部509とを備えている。通信部509は、インターネットなどのネットワークを介した通信処理を行う。ドライブ510は、必要に応じてI/Oインターフェース505に接続される。リムーバブルメディア511は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライブ510に取り付けられるので、ドライブ510から読み出されたコンピュータプログラムが必要に応じて記憶部508にインストールされる。
特に、本発明の実施形態によれば、フローチャートを参照して上述したプロセスは、コンピュータソフトウェアプログラムで実施することができる。例えば、本発明の一実施形態は、機械可読媒体に有形に埋め込まれたコンピュータプログラムを含むコンピュータプログラム製品を含む。コンピュータプログラムは、フローチャートに示されるような方法を実行するためのプログラムコードを含む。このような実施形態において、このコンピュータプログラムは、通信部509を介してネットワークからダウンロードされインストールされてもよく、リムーバブルメディア511からインストールされてもよい。このコンピュータプログラムが中央処理装置(CPU)501によって実行されると、本発明の方法によって定義される上記機能を実現する。なお、本発明のコンピュータ読取可能な媒体は、コンピュータ読取可能な信号媒体、コンピュータ読取可能な記憶媒体、或いは上記両者の任意の組合わせであっても良い。コンピュータ読取可能な記憶媒体は、例えば電気、磁気、光、電磁気、赤外線、半導体のシステム、サーバ又は部品、或いはこれらの任意の組み合わせであっても良いが、それらに限定されない。コンピュータ読取可能な記憶媒体についてのより具体的な例は、一つ又は複数の導線を含む電気的な接続、携帯可能なコンピュータ磁気ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、消去可能なプログラミング読取専用メモリ(EPROM又はフラッシュ)、光ファイバ、携帯可能なコンパクト磁気ディスク読取専用メモリ(CD−ROM)、光学記憶素子、磁気記憶素子、或いは上記任意の適当の組み合わせを含むが、それらに限定されない。本願において、コンピュータ読取可能な記憶媒体は、プログラムを含むか記憶する任意の有形の媒体であっても良い。当該プログラムは、コマンドによりシステム、サーバ又は部品の使用を実行し、或いはそれらに組合わせて使用されても良い。本願において、コンピュータ読取可能な信号媒体は、ベースバンドに伝送され或いはキャリアの一部として伝送され、コンピュータ読取可能なプログラムコードがロードされるデータ信号を含んでも良い。このような伝送されるデータ信号は、各種の形式を採用しても良く、電磁気信号、光信号又は上記任意の適当の組合わせを含むが、それらに限定されない。コンピュータ読取可能な信号媒体は、コンピュータ読取可能な記憶媒体以外の任意のコンピュータ読取可能な媒体であっても良い。当該コンピュータ読取可能な媒体は、コマンドによりシステム、サーバ又は部品の使用を実行し又はそれらと組合わせて使用されるプログラムを送信し、伝播し又は伝送することができる。コンピュータ読取可能な媒体に含まれるプログラムコードは、任意の適当の媒体で伝送されても良く、無線、電線、光ケーブル、RFなど、或いは上記任意の適当の組み合わせを含むが、それらに限定されない。
一つ又は複数種のプログラミング言語又はそれらの組み合わせで本出願の操作を実行するためのコンピュータプログラムコードをプログラミングすることができる。上記プログラミング言語には、Java(登録商標)、Smalltalk、C++のようなオブジェクト指向プログラミング言語が含まれ、更にC言語又は類似のプログラミング言語のような通常の手続き型プログラミング言語が含まれる。プログラムコードは、全体がユーザコンピュータに実行されても良く、一部がユーザコンピュータに実行されても良く、一つの独立なパッケージとして実行されても良く、一部がユーザコンピュータに実行され且つ一部がリモートコンピュータに実行されても良く、或いは全体がリモートコンピュータ又はサーバに実行されても良い。リモートコンピュータに関する場合に、リモートコンピュータはローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意の種類のネットワークによりユーザコンピュータに接続されても良く、或いは外部のコンピュータ(例えばインターネットサービスプロバイダを利用してインターネットにより接続する)に接続されても良い。
図面におけるフローチャート及びブロック図は、本願の各実施例によるシステム、方法及びコンピュータプログラム製品により実現可能なシステム構造、機能及び操作を示した。この点において、フローチャート又はブロック図における各ブロックは、一つのモジュール、プログラムセグメント、又はコードの一部を表すことができる。当該モジュール、プログラムセグメント、コードの一部には、一つ又は複数の所定のロジック機能を実現するための実行可能なコマンドが含まれる。注意すべきなのは、幾つかの置換としての実現において、ブロックに示される機能は図面に示される順序と異なって発生されても良い。例えば、二つの接続的に表示されるブロックは実際に基本的に併行に実行されても良く、場合によっては逆な順序で実行されても良く、関連の機能に従って確定される。注意すべきなのは、ブロック図及び/又はフローチャートにおける各ブロック、及びブロック図及び/又はフローチャートにおけるブロックの組合わせは、所定の機能又は操作を実行する専用のハードウェアによるシステムで実現されても良く、或いは専用のハードウェアとコンピュータコードの組合わせで実現されても良い。
本発明の実施例に説明されたユニットはソフトウェアの手段で実現されても良く、ハードウェアの手段で実現されても良い。説明されたユニットは、プロセッサに設置されても良い。例えば、解析ユニット、取得ユニット、処理ユニット、および第1の再生ユニットを含むプロセッサとして記載されても良い。なお、これらユニットの名称は、ある場合に当該ユニットの自身に対する限定とされない。例えば、解析ユニットを「ユーザから送信された音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得するユニット」と記載されても良い。
他の局面として、本発明は更にコンピュータ読取可能な媒体を提供した。当該コンピュータ読取可能な媒体は、上記実施形態に説明された端末装置に含まれたものであっても良く、当該端末装置に実装されずに別途に存在するものであっても良い。上記コンピュータ読取可能な媒体に一つ又は複数のプログラムがロードされる。上記一つ又は複数のプログラムが当該装置により実行されると、当該装置は、ユーザから送信された音声照会要求を解析して、音声照会要求に対応するテキスト照会情報を取得し、テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得し、テキストプッシュ情報を処理して、上記テキストプッシュ情報に対応するプッシュ待ち情報を取得し、プッシュ待ち情報を再生する。
以上の記載は、本願の好ましい実施例、及び使われている技術的原理の説明に過ぎない。当業者は、本願に係る保護範囲が、上記の技術特徴による特定お組合せからなる技術方案に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、上記技術特徴又は均等の特徴の任意の組合せからなる他の技術方案も含まれることを理解している。例えば、上記特徴と、本願に開示された類似の機能を持っている技術特徴(これらに限定されていない)とを互いに置き換えてなる技術方案も含まれる。

Claims (15)

  1. 情報処理方法であって、
    受信されたユーザからの音声照会要求を解析して、前記音声照会要求に対応するテキスト照会情報を取得するステップと、
    前記テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得するステップと、
    前記テキストプッシュ情報を処理して、前記テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップと、
    前記プッシュ待ち情報を再生するステップと、
    を含むことを特徴とする情報処理方法。
  2. 前記テキストプッシュ情報を処理して、前記テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップは、
    前記テキストプッシュ情報のワード数が所定のワード数閾値を超えたか否かを確定するステップと、
    前記テキストプッシュ情報のワード数が所定のワード数閾値を超えたと確定されたことに応じて、前記テキストプッシュ情報における前記テキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とするステップと、
    前記第1の情報に基づいて、前記プッシュ待ち情報を生成するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記テキストプッシュ情報を処理して、前記テキストプッシュ情報に対応するプッシュ待ち情報を取得するステップは、
    前記テキストプッシュ情報のワード数が所定のワード数閾値を超えないと確定されたことに応じて、前記テキストプッシュ情報を第1の情報とするステップを
    含むことを特徴とする請求項2に記載の方法。
  4. 前記第1の情報に基づいて、前記プッシュ待ち情報を生成するステップは、
    前記テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するステップと、
    前記ウェブサイト名と前記第1の情報とを組み合わせて、前記プッシュ待ち情報を生成するステップと、
    を含むことを特徴とする請求項2または請求項3に記載の方法。
  5. 前記第1の情報に基づいて、前記プッシュ待ち情報を生成するステップは、
    前記テキストプッシュ情報の属するウェブサイトのウェブサイト名を取得するステップと、
    前記テキスト照会情報、前記ウェブサイト名及び前記第1の情報を組み合わせて、前記プッシュ待ち情報を生成するステップと、
    を含むことを特徴とする請求項2または請求項3に記載の方法。
  6. 前記第1の情報に基づいて、前記プッシュ待ち情報を生成するステップは、
    前記テキストプッシュ情報の属するウェブサイトのウェブサイト名と、前記テキストプッシュ情報のサブジェクト情報とを取得するステップと、
    前記サブジェクト情報、前記ウェブサイト名及び前記第1の情報を組み合わせて、前記プッシュ待ち情報を生成するステップと、
    を含むことを特徴とする請求項2または請求項3に記載の方法。
  7. 前記方法は、前記プッシュ待ち情報を表示するステップをさらに含み、
    前記第1の情報に基づいて、前記プッシュ待ち情報を生成するステップは、
    前記テキスト照会情報で検索を行って獲得された画像プッシュ情報を取得するステップと、
    前記画像プッシュ情報と前記第1の情報とを組み合わせて前記プッシュ待ち情報を生成するステップと、
    を含むことを特徴とする請求項2または請求項3に記載の方法。
  8. 前記プッシュ待ち情報を再生するステップは、
    前記ユーザから送信された音声再生速度制御コマンドを受信するステップと、
    前記音声再生速度制御コマンドに対応する音声再生速度を取得するステップと、
    前記音声再生速度で前記プッシュ待ち情報を再生するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  9. 前記方法は、
    前記ユーザから送信された詳細情報取得要求を受信するステップと、
    前記テキストプッシュ情報を再生するステップと、
    をさらに含むことを特徴とする請求項2に記載の方法。
  10. 情報処理装置であって、
    受信されたユーザからの音声照会要求を解析して、前記音声照会要求に対応するテキスト照会情報を取得するように配置される解析ユニットと、
    前記テキスト照会情報で検索を行って獲得されたテキストプッシュ情報を取得するように配置される取得ユニットと、
    前記テキストプッシュ情報を処理して、前記テキストプッシュ情報に対応するプッシュ待ち情報を取得するように配置される処理ユニットと、
    前記プッシュ待ち情報を再生するように配置される第1の再生ユニットと、
    を含むことを特徴とする情報処理装置。
  11. 前記処理ユニットは、
    前記テキストプッシュ情報のワード数が所定のワード数閾値を超えたか否かを確定するように配置される確定サブユニットと、
    前記テキストプッシュ情報のワード数が所定のワード数閾値を超えたと確定されたことに応じて、前記テキストプッシュ情報における前記テキスト照会情報に関連する、ワード数が所定のワード数閾値を超えない情報を抽出して第1の情報とするように配置される抽出サブユニットと、
    前記第1の情報に基づいて、前記プッシュ待ち情報を生成するように配置される生成サブユニットと、
    を含むことを特徴とする請求項10に記載の装置。
  12. 前記処理ユニットは、
    前記テキストプッシュ情報のワード数が所定のワード数閾値を超えないと確定されたことに応じて、前記テキストプッシュ情報を第1の情報とするように配置されるサブユニットを
    さらに含むことを特徴とする請求項11に記載の装置。
  13. 前記装置は、
    前記ユーザから送信された詳細情報取得要求を受信するように配置される受信ユニットと、
    前記テキストプッシュ情報を再生するように配置される第2の再生ユニットと、
    をさらに含むことを特徴とする請求項11に記載の装置。
  14. 1つまたは複数のプロセッサと、
    1つまたは複数のプログラムが記憶されている記憶装置と、を含み、
    前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜請求項9のいずれか1項に記載の方法を実現させることを特徴とする端末装置。
  15. コンピュータプログラムが記憶されており、前記プログラムがプロセッサにより実行されると、請求項1〜請求項9のいずれか1項に記載の方法を実現させることを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2018188185A 2017-11-16 2018-10-03 情報処理方法および装置 Active JP6681450B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201711139649.1 2017-11-16
CN201711139649.1A CN107808007A (zh) 2017-11-16 2017-11-16 信息处理方法和装置

Publications (2)

Publication Number Publication Date
JP2019091429A true JP2019091429A (ja) 2019-06-13
JP6681450B2 JP6681450B2 (ja) 2020-04-15

Family

ID=61580490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018188185A Active JP6681450B2 (ja) 2017-11-16 2018-10-03 情報処理方法および装置

Country Status (3)

Country Link
US (1) US10824664B2 (ja)
JP (1) JP6681450B2 (ja)
CN (1) CN107808007A (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681567A (zh) * 2018-05-03 2018-10-19 青岛海信移动通信技术股份有限公司 一种信息推荐方法及装置
CN108877804B (zh) * 2018-06-26 2020-08-07 苏州思必驰信息科技有限公司 语音服务方法、系统、电子设备及存储介质
CN109840302A (zh) * 2019-02-12 2019-06-04 北京百度网讯科技有限公司 一种兴趣点的播报方法、装置、电子设备及存储介质
CN111048084B (zh) * 2019-12-18 2022-05-31 上海智勘科技有限公司 在智能语音交互过程中推送信息的方法及系统
WO2021128110A1 (zh) * 2019-12-25 2021-07-01 华为技术有限公司 通信方法及装置
CN111212143A (zh) * 2020-01-06 2020-05-29 杭州涂鸦信息技术有限公司 自动化测试方法及系统、可读存储介质、计算机设备
CN111690831B (zh) * 2020-05-29 2022-05-24 江西理工大学 一种离子型稀土矿的注液工艺优化方法
CN112487765B (zh) * 2020-11-23 2022-10-04 中国建设银行股份有限公司 一种生成通知文本的方法和装置
CN113299293A (zh) * 2021-05-25 2021-08-24 阿波罗智联(北京)科技有限公司 语音识别结果处理方法和装置、电子设备、计算机介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005345751A (ja) * 2004-06-03 2005-12-15 Hitachi Ltd Web情報アクセス方法、その実施装置、及びプログラム
JP2013254395A (ja) * 2012-06-07 2013-12-19 Ricoh Co Ltd 処理装置、処理システム、出力方法およびプログラム
JP2015127758A (ja) * 2013-12-27 2015-07-09 シャープ株式会社 応答制御装置、制御プログラム
US20160284341A1 (en) * 2015-03-27 2016-09-29 Takahiro Hirakawa Computer-implemented method, device and system for converting text data into speech data

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3598742B2 (ja) * 1996-11-25 2004-12-08 富士ゼロックス株式会社 文書検索装置及び文書検索方法
JPH11136394A (ja) * 1997-08-26 1999-05-21 Casio Comput Co Ltd データ出力システムおよびデータ出力方法
US6748361B1 (en) * 1999-12-14 2004-06-08 International Business Machines Corporation Personal speech assistant supporting a dialog manager
US7024363B1 (en) * 1999-12-14 2006-04-04 International Business Machines Corporation Methods and apparatus for contingent transfer and execution of spoken language interfaces
US6721705B2 (en) * 2000-02-04 2004-04-13 Webley Systems, Inc. Robust voice browser system and voice activated device controller
US7219136B1 (en) * 2000-06-12 2007-05-15 Cisco Technology, Inc. Apparatus and methods for providing network-based information suitable for audio output
US7366979B2 (en) * 2001-03-09 2008-04-29 Copernicus Investments, Llc Method and apparatus for annotating a document
US6934675B2 (en) * 2001-06-14 2005-08-23 Stephen C. Glinski Methods and systems for enabling speech-based internet searches
US7403938B2 (en) * 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US7136909B2 (en) * 2001-12-28 2006-11-14 Motorola, Inc. Multimodal communication method and apparatus with multimodal profile
US20030125953A1 (en) * 2001-12-28 2003-07-03 Dipanshu Sharma Information retrieval system including voice browser and data conversion server
US8566102B1 (en) * 2002-03-28 2013-10-22 At&T Intellectual Property Ii, L.P. System and method of automating a spoken dialogue service
US20030200858A1 (en) * 2002-04-29 2003-10-30 Jianlei Xie Mixing MP3 audio and T T P for enhanced E-book application
US7299182B2 (en) * 2002-05-09 2007-11-20 Thomson Licensing Text-to-speech (TTS) for hand-held devices
GB0228245D0 (en) * 2002-12-04 2003-01-08 Mitel Knowledge Corp Apparatus and method for changing the playback rate of recorded speech
US7921091B2 (en) * 2004-12-16 2011-04-05 At&T Intellectual Property Ii, L.P. System and method for providing a natural language interface to a database
JP4287386B2 (ja) * 2005-01-31 2009-07-01 株式会社東芝 情報検索システム、方法及びプログラム
US20100185648A1 (en) * 2009-01-14 2010-07-22 International Business Machines Corporation Enabling access to information on a web page
WO2010105245A2 (en) * 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
KR20120113717A (ko) * 2009-12-04 2012-10-15 소니 주식회사 검색 장치, 검색 방법, 및 프로그램
EP2339576B1 (en) * 2009-12-23 2019-08-07 Google LLC Multi-modal input on an electronic device
US9715540B2 (en) * 2010-06-24 2017-07-25 International Business Machines Corporation User driven audio content navigation
US8504567B2 (en) * 2010-08-23 2013-08-06 Yahoo! Inc. Automatically constructing titles
US8452747B2 (en) * 2010-09-07 2013-05-28 Yahoo! Inc. Building content in Q and A sites by auto-posting of questions extracted from web search logs
US8898159B2 (en) * 2010-09-28 2014-11-25 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
US8799312B2 (en) * 2010-12-23 2014-08-05 Microsoft Corporation Efficient label acquisition for query rewriting
US9098570B2 (en) * 2011-03-31 2015-08-04 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for paragraph-based document searching
US11093692B2 (en) * 2011-11-14 2021-08-17 Google Llc Extracting audiovisual features from digital components
US8805848B2 (en) * 2012-05-24 2014-08-12 International Business Machines Corporation Systems, methods and computer program products for fast and scalable proximal search for search queries
US9684395B2 (en) * 2012-06-02 2017-06-20 Tara Chand Singhal System and method for context driven voice interface in handheld wireless mobile devices
US20140067837A1 (en) * 2012-08-28 2014-03-06 Microsoft Corporation Identifying user-specific services that are associated with user-presented entities
JP5999839B2 (ja) * 2012-09-10 2016-09-28 ルネサスエレクトロニクス株式会社 音声案内システム及び電子機器
JP6277958B2 (ja) * 2012-10-31 2018-02-14 日本電気株式会社 再生装置、設定装置、再生方法およびプログラム
US8874569B2 (en) * 2012-11-29 2014-10-28 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for identifying and visualizing elements of query results
US20160246476A1 (en) * 2013-10-11 2016-08-25 Lexisnexis, A Divison Of Reed Elsevier Inc. Method, system and apparatus for user abandonment verification
US10083002B2 (en) * 2014-12-18 2018-09-25 International Business Machines Corporation Using voice-based web navigation to conserve cellular data
US11829373B2 (en) * 2015-02-20 2023-11-28 Google Llc Methods, systems, and media for presenting search results
US10170014B2 (en) * 2015-07-28 2019-01-01 International Business Machines Corporation Domain-specific question-answer pair generation
CN105491126A (zh) * 2015-12-07 2016-04-13 百度在线网络技术(北京)有限公司 基于人工智能的服务提供方法及装置
CN105550337A (zh) * 2015-12-22 2016-05-04 北京奇虎科技有限公司 移动终端的搜索结果生成方法及装置
US10250925B2 (en) * 2016-02-11 2019-04-02 Motorola Mobility Llc Determining a playback rate of media for a requester
CN105653738B (zh) * 2016-03-01 2020-05-22 北京百度网讯科技有限公司 基于人工智能的搜索结果播报方法和装置
US11086883B2 (en) * 2016-04-15 2021-08-10 Google Llc Systems and methods for suggesting content to a writer based on contents of a document
KR101904889B1 (ko) * 2016-04-21 2018-10-05 주식회사 비주얼캠프 표시 장치와 이를 이용한 입력 처리 방법 및 시스템
CN106649761A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的搜索结果展现方法和装置
CN106844341B (zh) * 2017-01-10 2020-04-07 北京百度网讯科技有限公司 基于人工智能的新闻摘要提取方法及装置
US20180210883A1 (en) * 2017-01-25 2018-07-26 Dony Ang System for converting natural language questions into sql-semantic queries based on a dimensional model
US11200269B2 (en) * 2017-06-15 2021-12-14 Microsoft Technology Licensing, Llc Method and system for highlighting answer phrases
US10127323B1 (en) * 2017-07-26 2018-11-13 International Business Machines Corporation Extractive query-focused multi-document summarization
US11263399B2 (en) * 2017-07-31 2022-03-01 Apple Inc. Correcting input based on user context
US10659544B2 (en) * 2017-11-14 2020-05-19 Google Llc Opt-out compliance
CN110737756B (zh) * 2018-07-03 2023-06-23 百度在线网络技术(北京)有限公司 确定针对用户输入数据的应答的方法、装置、设备和介质
CN109325108B (zh) * 2018-08-13 2022-05-27 北京百度网讯科技有限公司 查询处理方法、装置、服务器及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005345751A (ja) * 2004-06-03 2005-12-15 Hitachi Ltd Web情報アクセス方法、その実施装置、及びプログラム
JP2013254395A (ja) * 2012-06-07 2013-12-19 Ricoh Co Ltd 処理装置、処理システム、出力方法およびプログラム
JP2015127758A (ja) * 2013-12-27 2015-07-09 シャープ株式会社 応答制御装置、制御プログラム
US20160284341A1 (en) * 2015-03-27 2016-09-29 Takahiro Hirakawa Computer-implemented method, device and system for converting text data into speech data

Also Published As

Publication number Publication date
US10824664B2 (en) 2020-11-03
CN107808007A (zh) 2018-03-16
JP6681450B2 (ja) 2020-04-15
US20190147049A1 (en) 2019-05-16

Similar Documents

Publication Publication Date Title
JP6681450B2 (ja) 情報処理方法および装置
US20240155092A1 (en) Interactive information processing method, device and medium
US20240021202A1 (en) Method and apparatus for recognizing voice, electronic device and medium
US20200126566A1 (en) Method and apparatus for voice interaction
JP2023553101A (ja) ライブストリーミングインタラクション方法、装置、デバイス及び媒体
US8495051B2 (en) Search engine inference based virtual assistance
WO2020078300A1 (zh) 一种终端投屏的控制方法和终端
CN111800671B (zh) 用于对齐段落和视频的方法和装置
US20150262571A1 (en) Single interface for local and remote speech synthesis
JP2020008854A (ja) 音声要求を処理するための方法および装置
EP3523718B1 (en) Creating a cinematic storytelling experience using network-addressable devices
CN109582825B (zh) 用于生成信息的方法和装置
CN113035199B (zh) 音频处理方法、装置、设备及可读存储介质
WO2023083142A1 (zh) 分句方法、装置、存储介质及电子设备
CN107452378A (zh) 基于人工智能的语音交互方法和装置
KR20200027331A (ko) 음성 합성 장치
JP2019091423A (ja) マルチメディア再生リストを更新する方法及び装置
JP2022050309A (ja) 情報処理方法、装置、システム、電子機器、記憶媒体およびコンピュータプログラム
CN110138654B (zh) 用于处理语音的方法和装置
CN110379406B (zh) 语音评论转换方法、系统、介质和电子设备
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
CN115967833A (zh) 视频生成方法、装置、设备计存储介质
US11854422B2 (en) Method and device for information interaction
TW202009751A (zh) 多媒體處理電路及電子系統
CN113312928A (zh) 文本翻译方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181003

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200323

R150 Certificate of patent or registration of utility model

Ref document number: 6681450

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250