JP2017517828A - オーディオ情報識別方法及び装置 - Google Patents

オーディオ情報識別方法及び装置 Download PDF

Info

Publication number
JP2017517828A
JP2017517828A JP2017512096A JP2017512096A JP2017517828A JP 2017517828 A JP2017517828 A JP 2017517828A JP 2017512096 A JP2017512096 A JP 2017512096A JP 2017512096 A JP2017512096 A JP 2017512096A JP 2017517828 A JP2017517828 A JP 2017517828A
Authority
JP
Japan
Prior art keywords
audio
information
audio information
keyword
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017512096A
Other languages
English (en)
Other versions
JP6236189B2 (ja
Inventor
ルー リュー
ルー リュー
シェン リー
シェン リー
タオ グオ
タオ グオ
Original Assignee
シャオミ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャオミ・インコーポレイテッド filed Critical シャオミ・インコーポレイテッド
Publication of JP2017517828A publication Critical patent/JP2017517828A/ja
Application granted granted Critical
Publication of JP6236189B2 publication Critical patent/JP6236189B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/29Arrangements for monitoring broadcast services or broadcast-related services
    • H04H60/33Arrangements for monitoring the users' behaviour or opinions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/61Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/65Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/68Systems specially adapted for using specific information, e.g. geographical or meteorological information
    • H04H60/73Systems specially adapted for using specific information, e.g. geographical or meteorological information using meta-information
    • H04H60/74Systems specially adapted for using specific information, e.g. geographical or meteorological information using meta-information using programme related information, e.g. title, composer or interpreter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/402Support for services or applications wherein the services involve a main real-time session and one or more additional parallel non-real time sessions, e.g. downloading a file in a parallel FTP session, initiating an email or combinational services
    • H04L65/4025Support for services or applications wherein the services involve a main real-time session and one or more additional parallel non-real time sessions, e.g. downloading a file in a parallel FTP session, initiating an email or combinational services where none of the additional parallel sessions is real time or time sensitive, e.g. downloading a file in a parallel FTP session, initiating an email or combinational services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • User Interface Of Digital Computer (AREA)
  • Stereophonic System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本発明は、オーディオ情報識別方法及び装置を開示し、オーディオ識別技術分野に関する。上記オーディオ情報識別方法は、再生中のオーディオを識別して、上記オーディオのオーディオ情報を獲得し、上記オーディオ情報の中のキーワードのために設定した移動リンクを情報提示インターフェースに表示し、上記移動リンクがトリガーされると、上記キーワードに対応する事前記憶情報を表示するステップを含む。再生中のオーディオを識別することで、当該オーディオのオーディオ情報を獲得し、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示し、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。移動リンクを提供することで、オーディオに対応されているより多い情報を提供できるため、一つのインターフェースのみでオーディオ情報を表示可能であり、提示可能な情報が比較的少ないという問題を解決し、オーディオ情報の多様性を向上させる効果を達成する。【選択図】図1

Description

本願は、2015年4月15日提出した出願番号が201510178987.0である中国特許の優先権を主張し、その全ての内容を本願に引用する。
本発明は、オーディオ識別技術分野に関し、特に、オーディオ情報識別方法及び装置に関する。
ユーザーは、ラジオ放送を受信する時、受信中のオーディオの関連情報を知らないことが良くある。
ユーザーが受信したオーディオの関連情報を知るようにするために、一部のアプリケーションでは、受信した歌の歌名、演唱者、及び歌詞を識別でき、識別した歌名、演唱者、及び歌詞をユーザーに提示する。
本発明ではオーディオ情報識別方法及び装置を提供する。上記技術案は以下の通りである。
本発明の実施例の第1の視点によれば、オーディオ情報識別方法を提供する。上記方法は、
再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得するステップと、
前記オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示するステップと、
前記移動リンクがトリガーされると、前記キーワードに対応する事前記憶情報を表示するステップとを含む。
本発明の実施例の第2の視点によれば、オーディオ情報識別装置を提供する。上記装置は、
再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得するように配置される識別モジュールと、
前記識別モジュールが識別して獲得した前記オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示するように配置される第1の表示モジュールと、
前記第1の表示モジュールが表示した前記移動リンクがトリガーされると、前記キーワードに対応する事前記憶情報を表示するように配置される第2の表示モジュールとを
含む。
本発明の実施例の第3の視点によれば、オーディオ情報識別装置を提供する。上記装置は、
プロセッサと、
前記プロセッサが実行可能なコマンドを記憶するための記憶装置とを含み、
前記プロセッサは、
再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得し、
前記オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示し、
前記移動リンクがトリガーされると、前記キーワードに対応する事前記憶情報を表示するように配置される。
本発明の実施例で提供する技術案は、以下のような有益な効果を含むことができる。
再生中のオーディオを識別することで、当該オーディオのオーディオ情報を獲得し、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示し、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。移動リンクを提供することで、オーディオに対応するより多い情報を提供できるため、一つのインターフェースのみでオーディオ情報を表示可能であり、提示可能な情報が比較的少ないという問題を解決し、オーディオ情報の多様性を向上させる効果を達成する。
尚、上述した通常的な説明と以下で行われる詳細な説明はただ例示的なものであり、本発明を制限するためのものではないことを理解すべきである。
ここで、図面は、明細書に含まれて明細書の一部を構成し、本発明に符合される実施例を示すものであり、明細書と共に本発明の原理を解釈するためのものである。
図1は、一つの例示的な実施例によるオーディオ情報識別方法を示すフローチャートである。 図2Aは、他の一つの例示的な実施例によるオーディオ情報識別方法を示すフローチャートである。 図2Bは、一つの例示的な実施例によるオーディオ情報取得方法を示すフローチャートである。 図2Cは、一つの例示的な実施例によるオーディオ情報及び移動リンクを表示する模式図を示す。 図2Dは、一つの例示的な実施例による移動ページを表示する模式図を示す。 図3Aは、一つの例示的な実施例による受信したオーディオを再生又はダウンロードする方法を示すフローチャートである。 図3Bは、一つの例示的な実施例によるオーディオの再生リンクおよびダウンロードリンクを表示する模式図を示す。 図4Aは、一つの例示的な実施例によるオーディオ情報の中のキーワードの検索方法を示すフローチャートである。 図4Bは、一つの例示的な実施例によるキーワードに対応する検索結果を表示する模式図を示す。 図5は、一つの例示的な実施例によるオーディオ情報識別装置のブロック図である。 図6は、他の一つの例示的な実施例によるオーディオ情報識別装置のブロック図である。 図7は、一つの例示的な実施例によるオーディオ情報を識別するための装置のブロック図である。
ここで、例示的な実施例について詳細に説明し、その例を図面に示す。以下の説明が図面と関連される時、別の追加説明がない限り、異なる異なる図面における同一な符号は同一又は類似した要素を示す。以下の例示的な実施例で説明した実施形態は、本願に開示された内容と一致する全ての実施形態を表すのではなく、ただ特許請求の範囲で説明した、本発明の一部の方面と一致する装置及び方法の例を示すだけである。
図1は一つの例示的な実施例によるオーディオ情報識別方法を示すフローチャートである。図1に示されたように、該オーディオ情報識別方法は電子設備で使用される。該電子設備は、スマートフォン、タブレットPC、スマートTV、イーブック(e-book)閲覧器、マルチメディアプレーヤー(Multimedia Player)、ラップトップ(laptop)コンピューター、及びデスクコンピューター(desk computer)等であってもいい。当該オーディオ情報識別方法は、以下のステップを含むことができる。
ステップ101において、再生中のオーディオを識別して、当該オーディオのオーディオ情報を獲得する。
ステップ102において、オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示する。
ステップ103において、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。
上述したように、本発明の実施例で提供するオーディオ情報識別方法は、再生中のオーディオを識別することで、当該オーディオのオーディオ情報を獲得し、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示し、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。移動リンクを提供することで、オーディオに対応されているより多い情報を提供できるため、一つのインターフェースのみでオーディオ情報を表示可能であり、提示可能な情報が比較的に少ないという問題を解決し、オーディオ情報の多様性を向上させる効果を達成する。
図2Aは他の一つの例示的な実施例によるオーディオ情報識別方法を示すフローチャートである。図2Aに示されたように、該オーディオ情報識別方法は電子設備で使用される。該電子設備は、スマートフォン、タブレットPC、スマートTV、イーブック閲覧器、マルチメディアプレーヤー、ラップトップコンピューター、及びデスクコンピューター等であってもいい。当該オーディオ情報識別方法は、以下のステップを含むことができる。再生中のオーディオを識別する前に、電子設備は再生中のオーディオを取得すべきである。異なる需要を満たすために、電子設備の再生中のオーディオを取得する形態に対しても、対応的に調整しなければならない。詳しくは、下記ステップ201とステップ202を参照することができる。
ステップ201において、所定時間間隔毎に再生中のオーディオを取得する。
ここでの再生中のオーディオは、電子設備がラジオ放送を受信した後再生するオーディオであってもいいし、該電子設備周囲の他の設備で再生中のオーディオであってもいい。この時、電子設備は、オーディオを再生している他の設備で再生するオーディオを取得できる。当該オーディオは、音楽オーディオであってもいいし、番組オーディオであってもいいし、オーディオフックであってもいい。
電子設備は、所定時間間隔毎に再生中のオーディオを取得できる。該所定時間間隔はユーザーにより設定されることができ、例えば、該所定時間間隔は、3分、4分、又は5分などに設定できる。
電子設備の電力消耗を低下させるために、電子設備は、現在オーディオのリズムに所定閾値を超える変化が発生したことを検出した後、再生中のオーディオを取得できる。例えば、音楽オーディオを例にすると、一つの歌の再生が完了した後とその次の歌を再生する前には、一般的に一定な間隔が存在し、この時、オーディオのリズムと歌を再生している時のリズムには非常に大きい区別が存在する。従って、電子設備が、現在のオーディオのリズムが所定閾値を超える変化が発生したことを検出すると、再生する歌が変換されたことをいう。電子設備がこの時取得したオーディオは、変換した後の歌のオーディオである。
ステップ202において、再生中のオーディオを識別するための識別コマンドを受信して、再生中のオーディオを取得する。
ユーザーの需要をよりよく満たし、且つオーディオを頻繁に識別することによる電子設備の電力消耗を低下させるために、電子設備は、ユーザーがトリガーした、再生中のオーディオを識別するための識別コマンドを受信した後、再生中のオーディオを取得することができる。
一つの具体的な形態において、ユーザーが電子設備を使用してラジオ放送を受信している時、現在再生しているオーディオが面白いと感じて、当該オーディオの関連情報の取得を希望する場合、ユーザーは、再生中のオーディオを識別するための識別コマンドを該電子設備でトリガーして生成し、電子設備は該識別コマンドを受信した後、再生中のオーディオを取得することができる。
他の一つの具体的な形態において、他の設備がオーディオを再生しており、ユーザーが当該他の設備で再生しているオーディオの関連情報の取得を希望する場合、ユーザーは、所持している電子設備を動作させ、再生中のオーディオを識別するための識別コマンドを該電子設備でトリガーして生成し、電子設備は、該識別コマンドを受信した後、再生中のオーディオを取得することができる。
ユーザーが、該電子設備で再生中のオーディオを識別するための識別コマンドをトリガーして生成する時、電子設備の識別ウィジェットをトリガーして識別コマンドを生成してもいいし、電子設備に設置された、指定されたハードウェア(例えばボリューム調節キー)をトリガーして識別コマンドを生成してもいい。
ステップ203において、再生中のオーディオを識別して、当該オーディオのオーディオ情報を獲得する。
電子設備が再生中のオーディオを識別する時、先ず、当該オーディオのオーディオ特徴を識別して獲得して、当該オーディオ特徴をサーバーへ送信し、サーバーによりマッチングを行ってオーディオ情報を獲得できる。具体的な説明は下記ステップ203A乃至ステップ203Cを参照することができる。また、図2Bは、一つの例示的な実施例によるオーディオ情報取得方法を示すフローチャートである。
ステップ203Aにおいて、オーディオを識別して当該オーディオのオーディオ特徴を獲得する。当該オーディオ特徴は、当該オーディオのテキスト情報及び個人識別情報の中の前者又はこれら両者共に関連される。
電子設備は、取得した再生中のオーディオに対して識別を行い、当該オーディオのオーディオ特徴を獲得する。当該オーディオ特徴は、オーディオに現れたテキスト情報、語調特徴、又は音調特徴等と関連される。もし、声紋(Voiceprint)識別技術を通じてオーディオを識別する場合、当該オーディオ特徴は、当該オーディオの個人識別情報とも関連される。例えば、取得したオーディオが音楽オーディオである場合、識別を通じて獲得したテキスト情報は、取得したオーディオに対応されている歌詞であり、声紋識別を通じて獲得した個人識別情報は、当該オーディオに対応されている歌手である。取得したオーディオが番組オーディオである場合、識別を通じて獲得したテキスト情報は、取得したオーディオに対応されている番組の内容で、声紋識別を通じて獲得した個人識別情報は、当該オーディオに対応されている出演者である。
ステップ203Bにおいて、オーディオ特徴をサーバーへ送信する。当該オーディオ特徴は、サーバーをトリガーして当該オーディオ特徴とマッチングされるオーディオ情報を検索し、検索された当該オーディオ情報をフィードバックするためのものである。
電子設備は、獲得したオーディオ特徴をサーバーへ送信する。サーバーは、予め記憶されたデータベースに基づいて、当該オーディオ特徴とマッチングされるオーディオ情報を検索できる。サーバーは、オーディオ特徴とマッチングされるオーディオ情報が検索された後、当該オーディオ情報を電子設備へフィードバックする。
当該オーディオ情報は、当該オーディオ特徴と対応されているオーディオの所有者情報および当該オーディオに対応されているオーディオ名称等を含むことができる。例えば、再生中のオーディオが音楽オーディオである場合、オーディオ情報は、歌名、アルバム名称、歌手、及び歌詞等を含むことができる。再生中のオーディオが番組オーディオである場合、オーディオ情報は番組名称および出演者等を含むことができる。再生中のオーディオがオーディオフックのオーディオである場合、オーディオ情報は書籍の著者、書籍名、及び目次等を含むことができる。
ステップ203Cにおいて、サーバーからフィードバックされるオーディオ情報を受信する。
ステップ204において、オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示する。
電子設備は、サーバーがフィードバックするオーディオ情報を受信した後、ユーザーが移動を通じてより多い情報を取得できるように、オーディオ情報の中のキーワードのために、移動リンクを設定できる。
ここでのキーワードは、当該オーディオの主な特徴を示すことができるキーワードであってもいい。例えば、再生中のオーディオが音楽オーディオである場合、キーワードは、歌名、歌手、及びアルバム名称等であってもいい。再生中のオーディオが番組オーディオである場合、キーワードは、番組名称と出演者等であってもいい。再生中のオーディオがオーディオフックのオーディオである場合、キーワードは、書籍の著者と書籍名等であってもいい。
例えば、図2Cは、一つの例示的な実施例によるオーディオ情報及び移動リンクを表示する模式図を示す。図2Cにおいて、オーディオが音楽オーディオである場合を例にすると、電子設備が受信したオーディオ情報は、“歌タイトル:《歌A》”、“歌手:歌手A”、“アルバム:《アルバムA》”、及び歌Aと対応されている歌詞である。電子設備は、“《歌A》”、“歌手A”、“《アルバムA》”のためにそれぞれ移動リンクを提供し、“歌タイトル:《歌A》”、“歌手:歌手A”、“アルバム:《アルバムA》”、及び歌Aと対応されている歌詞を情報提示インターフェースに表示する。
ステップ205において、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。
情報提示インターフェースにおける移動リンクがトリガーされると、電子設備は、当該キーワードに対応する事前記憶情報を表示する。事前記憶情報は、一般的に、予め記憶されたキーワードの詳細な情報である。例えば、再生中のオーディオが音楽オーディオであり、且つ歌手名称の移動リンクがトリガーされる場合、電子設備は、当該歌手の詳細資料ページへ移動して表示し、再生中のオーディオが番組オーディオであり、且つ番組名称の移動リンクがトリガーされる場合、電子設備は、当該番組の詳細な紹介ページへ移動して表示し、再生中のオーディオがオーディオフックのオーディオであり、且つ書籍著者の移動リンクがトリガーされる場合、電子設備は、該書籍著者のコラムページへ移動して表示する。
例えば、図2Dは、一つの例示的な実施例による移動ページを表示する模式図を示す。図2Dにおいて、依然として、オーディオが音楽オーディオである場合を例にすると、情報提示インターフェースの“歌手A”がトリガーされる場合、電子設備は、当該歌手Aの詳細資料へ移動して表示する。
ユーザーに、識別を通じて獲得したオーディオ情報を便利に閲覧させるために、電子設備は、オーディオ情報の中のキーワードのために設定した移動リンクを情報提示インターフェースに表示した後、オーディオ情報と移動リンクを対応付けて記憶することができる。具体的には、下記ステップ206とステップ207を参照することができる。
ステップ206において、移動リンクを表示した後、自動的にオーディオ情報と移動リンクを事前記憶リストに記憶する。
電子設備が、オーディオ情報の中のキーワードのために設定した移動リンクおよびオーディオ情報を情報提示インターフェースに表示した後、自動的にオーディオ情報および移動リンクを事前記憶リストに記憶できる。ユーザーは、事前記憶リストを確認することで、記憶されたオーディオ情報を検索できる。
ステップ207において、オーディオ情報および移動リンクを記憶するように指示するための記憶コマンドを受信した後、当該オーディオ情報および当該移動リンクを事前記憶リストに記憶する。
電子設備は、オーディオ情報の中のキーワードのために設定した移動リンクおよびオーディオ情報を情報提示インターフェースに表示した後、ユーザーに、当該オーディオ情報および移動リンクを記憶するかを問い合わせることができる。オーディオ情報および移動リンクを記憶するように指示するための記憶コマンドを受信すると、当該オーディオ情報および該移動リンクを事前記憶リストに記憶する。
電子設備は、オーディオ情報および移動リンクを記憶するための記憶ウィジェットを情報提示インターフェースに表示できる。電子設備は、当該記憶ウィジェットがトリガーされたことを検出すると、対応されているオーディオ情報および移動リンクを事前記憶リストに記憶する。
一つの具体的な形態において、ユーザーの車載システムがラジオ放送を受信しており、且つ歌が再生中である場合、ユーザーは、車載システム又は所持しているスマートフォン等の設備を利用して、再生中のオーディオを識別できる。車載システム又はスマートフォン等の設備は、当該オーディオのオーディオ情報を獲得した後、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示情報提示インターフェースにでき、ユーザーにより上述した移動リンクがトリガーされた後、当該キーワードと対応されている事前記憶情報を表示することができる。車載システムを利用して上述の移動リンクを表示する場合、ユーザーが車載システムに表示された移動リンク又は移動リンクと対応されている事前記憶情報を過多に注目して運転に影響することを避けるために、ユーザーが便利な時に、事前記憶リストの中の移動リンクおよびオーディオ情報を閲覧するように、自動的に、移動リンクおよびオーディオ情報を事前記憶リストに記憶することができる。勿論、ユーザーが、オーディオ情報および移動リンクを記憶するための記憶ウィジェットをトリガーし、車載システム又は所持したスマートフォン等の設備が、ユーザーが記憶ウィジェットをトリガーすることにより生成された記憶コマンドを受信した後、オーディオ情報および移動リンクを事前記憶リストに記憶して、ユーザーが便利な時に確認できるようにさせることもできる。
上述したように、本発明の実施例で提供するオーディオ情報識別方法は、再生中のオーディオを識別することで、当該オーディオのオーディオ情報を獲得し、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示し、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。移動リンクを提供することで、オーディオに対応されているより多い情報を提供できるため、一つのインターフェースのみでオーディオ情報を表示可能であり、提示可能な情報が比較的少ないという問題を解決し、オーディオ情報の多様性を向上させる効果を達成する。
また、オーディオ情報および移動リンクを事前記憶リストに記憶することで、該事前記憶リストを利用して、識別したことのあるオーディオのオーディオ情報を検索できるため、ユーザーが、最近識別したことのあるオーディオのオーディオ情報を確認できないという問題を解決し、オーディオ情報を検索する速度を向上させる効果を達成する。
ユーザーが受信したことのあるオーディオを再び便利に鑑賞又は所蔵することができるように、電子設備は、オーディオ情報の中のキーワードのために設定した移動リンクを表示する時、当該オーディオに対応されている完整なオーディオの再生リンクおよびダウンロードリンクも表示できる。図3Aは一つの例示的な実施例による受信したオーディオを再生又はダウンロードする方法を示すフローチャートである。
ステップ301において、オーディオに対応されている完整なオーディオの再生リンクおよびダウンロードリンクを、情報提示インターフェースに表示する。
電子設備は、取得したオーディオ情報によって、オーディオに対応されている完整なオーディオの再生リンクおよびダウンロードリンクを取得し、当該再生リンクおよびダウンロードリンクを情報提示インターフェースに表示できる。
例えば、取得したオーディオ情報の中に歌名がある場合、当該歌名と対応されている歌の再生リンクおよびダウンロードリンクを表示できる。取得したオーディオ情報の中に番組名称がある場合、該プログラム名称と対応されている番組オーディオの再生リンクおよびダウンロードリンクを表示できる。取得したオーディオ情報の中に書籍名がある場合、該書籍名と対応されているオーディオフックの再生リンクおよびダウンロードリンクを表示できる。
例えば、図3Bは、一つの例示的な実施例によるオーディオの再生リンクおよびダウンロードリンクを表示する模式図を示す。図3Bにおいて、オーディオが音楽オーディオである場合を例にすると、電子設備は、情報提示インターフェースに、歌Aを再生するための再生リンク311と、歌Aをダウンロードするためのダウンロードリンク322を表示する。
なお、取得したオーディオ情報の中に書籍名がある場合、電子設備は、該書籍をダウンロードするためのダウンロードリンク、及びオンラインで該書籍を閲覧するためのリンクも表示できる。取得したオーディオ情報の中に番組名称があり、且つ該番組名称と対応されている番組の映像がある場合、電子設備は該番組の映像をダウンロードするためのダウンロードリンク、及び該プログラム映像を再生するための再生リンクも表示できる。
ステップ302において、再生リンクがトリガーされると、当該完整なオーディオを再生する。
ステップ303において、ダウンロードリンクがトリガーされると、当該完整なオーディオをダウンロードする。
電子設備は、再生リンクがトリガーされたことを検出すると、取得したオーディオに対応されている完整なオーディオを再生する。電子設備はダウンロードリンクがトリガーされたことを検出すると、取得したオーディオに対応されている完整なオーディオをダウンロードする。
上述したように、本発明の実施例では、オーディオに対応されている完整なオーディオの再生リンクおよびダウンロードリンクを情報提示インターフェースに表示し、再生リンクがトリガーされると、当該完整なオーディオを再生し、ダウンロードリンクがトリガーされると、当該完整なオーディオをダウンロードする。情報提示インターフェースに、再生リンクおよびダウンロードリンクを提供できるので、ユーザーが受信したことのあるオーディオを再び鑑賞又は所蔵しようとする場合、対応するプログラムを実行して検索してからオーディオを再生又はダウンロードしなければならないため、操作ステップが複雑である問題を解決し、操作ステップを簡単化して作業効率を向上させる効果を達成する。
オーディオ情報の中のキーワードに対するユーザの更なる了解を便利にさせるために、電子設備がオーディオ情報の中のキーワードのために設定した移動リンクを表示する時、さらに、オーディオ情報の中の各キーワードに対応する検索ウィジェットを表示することもできる。図4Aは一つの例示的な実施例によるオーディオ情報の中のキーワードの検索方法を示すフローチャートである。
ステップ401において、オーディオ情報の中のキーワードに対応する検索ウィジェットを、情報提示インターフェース内に表示する。
キーワードに対応する情報をより多く表示して、ユーザーにキーワードと関連されている情報をより了解させるために、電子設備は、オーディオ情報の中のキーワードに対応する検索ウィジェットを、情報提示インターフェース内に表示できる。
ステップ402において、一つのキーワードの検索ウィジェットがトリガーされると、当該キーワードの検索インターフェースを表示する。当該検索インターフェースには当該キーワードに対応する検索結果が表示されている。
電子設備は、情報提示インターフェース内のあるキーワードの検索ウィジェットがトリガーされたことを検出すると、当該キーワードの検索インターフェースを表示し、当該検索インターフェース内に、当該キーワードに対応する検索結果を表示する。
例えば、図4Bは、一つの例示的な実施例による、キーワードに対応する検索結果を表示する模式図を示す。図4Bにおいて、取得したオーディオが音楽オーディオである場合を例にすると、電子設備は、歌手Aの検索ウィジェット411がトリガーされたことを検出すると、歌手Aと対応されている検索インターフェースを表示し、当該検索インターフェース内に、歌手Aと対応されている検索結果を表示する。
上述したように、本発明の実施例では、一つのキーワードの検索ウィジェットがトリガーされると、当該キーワードの検索インターフェースを表示する。当該検索インターフェースには、当該キーワードに対応する検索結果が表示されている。キーワードを検索するための検索ウィジェットを情報提示インターフェースに表示できるため、他のアプリケーションプログラムを実行して検索を行わなければならず、操作ステップが比較的に多いという問題を解決して、操作効率を向上させる効果を達成する。
尚、上述した図2A及び図3Aにおけるステップは一つの実施例に統合できる。上述した図2A及び図4Aにおけるステップは一つの実施例に統合できる。上述した図2A、図3A、及び図4Aにおけるステップは一つの実施例に統合できる。
下記の説明は本発明の装置実施例であり、本発明の方法実施例を実行することができる。本発明の装置実施例で言及しない内容については、本発明の方法実施例を参照するようにする。
図5は一つの例示的な実施例によるオーディオ情報識別装置のブロック図である。図5に示されたように、当該オーディオ情報識別装置は、電子設備で使用される。該電子設備は、スマートフォン、タブレットPC、スマートTV、イーブック閲覧器、マルチメディアプレーヤー、ラップトップコンピューター、及びデスクコンピューター等であってもいい。当該オーディオ情報識別装置は、識別モジュール501、第1の表示モジュール502、及び第2の表示モジュール503を含むことができるが、これに限られない。
該識別モジュール501は、再生中のオーディオを識別して、当該オーディオのオーディオ情報を獲得するように配置される。
該第1の表示モジュール502は、識別モジュール501が識別して獲得したオーディオ情報の中のキーワードのために設定した移動リンクを情報提示インターフェースに表示するように配置される。
該第2の表示モジュール503は、第1の表示モジュール502が表示した移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示するように配置される。
上述したように、本発明の実施例で提供するオーディオ情報識別装置は、再生中のオーディオを識別することで、当該オーディオのオーディオ情報を獲得し、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示し、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。移動リンクを提供することで、オーディオに対応するより多い情報を提供できるため、一つのインターフェースのみでオーディオ情報を表示可能であり、提示可能な情報が比較的少ないという問題を解決し、オーディオ情報の多様性を向上させる効果を達成する。
図6は他の一つの例示的な実施例によるオーディオ情報識別装置のブロック図である。図6に示されたように、当該オーディオ情報識別装置は電子設備で使用される。該電子設備は、スマートフォン、タブレットPC、スマートTV、イーブック閲覧器、マルチメディアプレーヤー、ラップトップコンピューター、及びデスクコンピューター等であってもいい。当該オーディオ情報識別装置は、識別モジュール601、第1の表示モジュール602、及び第2の表示モジュール603を含むことができるが、これに限られない。
当該識別モジュール601は、再生中のオーディオを識別して、当該オーディオのオーディオ情報を獲得するように配置される。
当該第1の表示モジュール602は、識別モジュール601が識別して獲得したオーディオ情報の中のキーワードのために設定した移動リンクを情報提示インターフェースに表示するように配置される。
当該第2の表示モジュール603は、第1の表示モジュール602が表示した移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示するように配置される。
一つの可能な実施例において、該識別モジュール601は、識別サブモジュール601a、送信サブモジュール601b、及び受信サブモジュール601cを含むことができる。
当該識別サブモジュール601aは、オーディオを識別して当該オーディオのオーディオ特徴を獲得するように配置され、当該オーディオ特徴は、当該オーディオのテキスト情報及び個人識別情報の中の前者又はこれら両者に関連される。
当該送信サブモジュール601bは、識別サブモジュール601aが識別して獲得したオーディオ特徴をサーバーへ送信するように配置される。当該オーディオ特徴は、サーバーをトリガーして、当該オーディオ特徴とマッチングされるオーディオ情報を検索させ、検索された当該オーディオ情報をフィードバックさせるためのものである。
当該受信サブモジュール601cは、サーバーがフィードバックしたオーディオ情報を受信するように配置される。
一つの可能な実施例において、当該オーディオ情報識別装置は、第1の取得モジュール604又は第2の取得モジュール605を更に含むことができる。
当該第1の取得モジュール604は、所定時間間隔毎に再生中のオーディオを取得するように配置される。
当該第2の取得モジュール605は、再生中のオーディオを識別する識別コマンドを受信し、再生中のオーディオを取得するように配置される。
一つの実施例において、当該オーディオ情報識別装置は、第3の表示モジュール606、再生モジュール607、及びダウンロードモジュール608を更に含むことができる。
当該第3の表示モジュール606は、オーディオに対応する完整なオーディオの再生リンクおよびダウンロードリンクを、情報提示インターフェースに表示するように配置される。
当該再生モジュール607は、第3の表示モジュール606が表示した再生リンクがトリガーされると、完整なオーディオを再生するように配置される。
当該ダウンロードモジュール608は、第3の表示モジュール606が表示したダウンロードリンクがトリガーされると、完整なオーディオをダウンロードするように配置される。
一つの可能な実施例において、当該オーディオ情報識別装置は、第4の表示モジュール609と第5の表示モジュール610を更に含むことができる。
当該第4の表示モジュール609は、オーディオ情報の中のキーワードに対応する検索ウィジェットを、情報提示インターフェース内に表示するように配置される。
当該第5の表示モジュール610は、第4の表示モジュール609が表示した一つのキーワードの検索ウィジェットがトリガーされると、当該キーワードの検索インターフェースを表示するように配置され、当該検索インターフェース内には、当該キーワードに対応する検索結果が表示されている。
一つの可能な実施例において、当該オーディオ情報識別装置は、第1の記憶モジュール611又は第2の記憶モジュール612を更に含むことができる。
当該第1の記憶モジュール611は、移動リンクを表示した後、自動的にオーディオ情報および移動リンクを事前記憶リストに記憶するように配置される。
当該第2の記憶モジュール612は、オーディオ情報および移動リンクを記憶するように指示するための記憶コマンドを受信し、オーディオ情報および移動リンクを事前記憶リストに記憶するように配置される。
上述したように、本発明の実施例で提供するオーディオ情報識別装置は、再生中のオーディオを識別することで、当該オーディオのオーディオ情報を獲得し、当該オーディオ情報の中のキーワードのために設定した移動リンクを表示し、移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示する。移動リンクを提供することで、オーディオに対応されるより多い情報を提供できるため、一つのインターフェースのみでオーディオ情報を表示可能であり、提示可能な情報が比較的少ないという問題を解決し、オーディオ情報の多様性を向上させる効果を達成する。
また、オーディオ情報および移動リンクを事前記憶リストに記憶することで、当該事前記憶リストを利用して、識別したことのあるオーディオのオーディオ情報を検索できるため、ユーザーが、最近識別したことのあるオーディオのオーディオ情報を確認できないという問題を解決して、オーディオ情報を検索する速度を向上させる効果を達成する。
また、オーディオに対応する完整なオーディオの再生リンクおよびダウンロードリンクを情報提示インターフェースに表示し、再生リンクがトリガーされると、当該完整なオーディオを再生し、ダウンロードリンクがトリガーされると、当該完整なオーディオをダウンロードし、再生リンクおよびダウンロードリンクを情報提示インターフェースに提供できるため、ユーザーが受信したことのあるオーディオを再び鑑賞又は所蔵しようとする場合、対応するアプリケーションプログラム実行して検索してこそオーディオを再生又はダウンロードできることによる操作ステップが複雑になるという問題を解決し、操作ステップを簡単化して作業効率を向上させる効果を達成する。
また、一つのキーワードの検索ウィジェットがトリガーされると、当該キーワードの検索インターフェースを表示する。当該検索インターフェースには、当該キーワードに対応する検索結果が表示されている。キーワードを検索するための検索ウィジェットを情報提示インターフェースに表示できるため、他のアプリケーションプログラムを実行して検索を行わなければならず、操作ステップが比較的に多いという問題を解決し、操作効率を向上させる効果を達成する。
上述した実施例における装置では、各モジュールが操作を行う具体的な形態については、既に上記の関連方法に関する実施例で詳細に説明したため、ここではその詳細な説明を省略することにする。
本発明の一つの例示的な実施例ではオーディオ情報識別装置を提供する。上記装置は、本発明で提供するオーディオ情報識別方法を実現できる。当該オーディオ情報識別装置は、プロセッサ、及びプロセッサが実行可能なコマンドを記憶するための記憶装置、を含み、
ここで、プロセッサは、
再生中のオーディオを識別して、当該オーディオのオーディオ情報を獲得し、
オーディオ情報の中のキーワードのために設定した移動リンクを情報提示インターフェースに表示し、
移動リンクがトリガーされると、キーワードに対応する事前記憶情報を表示するように、配置される。
図7は一つの例示的な実施例によるオーディオ情報を識別するための装置のブロック図である。例えば、装置700は、携帯電話、コンピューター、デジタル放送端末、メッセージ送受信設備、ゲームコンソール、タブレット設備、トレーニング設備、個人用情報端末(Personal Digital Assistant)等であってもよい。
図7を参照すると、装置700は、プロセッサアセンブリ702、記憶装置704、電源アセンブリ706、マルチメディアアセンブリ708、オーディオアセンブリ710、入力/出力(I/O)インターフェース712、センサーアセンブリ714、及び通信アセンブリ716の中の一つ或いは複数の部材を含むことができる。
プロセッサアセンブリ702は、一般的に装置700の全般的な操作、例えば、表示、電話の呼び出し、データ通信、カメラ操作、及び記録操作に関連する操作を制御する。プロセッサアセンブリ702は、一つ又は複数のプロセッサ718を含んでコマンドを実行することで、上述した方法の全部又は一部のステップを完了できる。尚、プロセッサアセンブリ702は、プロセッサアセンブリ702と他のアセンブリとの間のインタラクティブを便利にさせるため、一つ又は複数のモジュールを含むことができる。例えば、プロセッサアセンブリ702は、マルチメディアアセンブリ708とプロセッサアセンブリ702との間のインタラクティブを便利にさせるため、マルチメディアモジュールを含むことができる。
記憶装置704は、さまざまなタイプのデータを保存するよう配置され、装置700の操作をサポートする。このようなデータの例示的な例では、装置700で実行される全てのアプリケーション又は方法のためのコマンド、連絡先データ、電話帳データ、メッセージ、イメージ、映像等が含まれる。記憶装置704は、例えば、SRAM(static random access memory)、EEPROM(Electrically Erasable Programmable Read-Only Memory)、EPROM(Erasable Programmable Read Only Memory)、PROM(Programmable ROM)、リードオンリーメモリ(ROM)、磁気記憶装置、フラッシュメモリ(Flash Memory)、磁気ディスク、又は光ディスクなどの、任意タイプの揮発性又は非揮発性記憶装置又はそれらの組み合わせで実現できる。
電源アセンブリ706は、装置700の各種のアセンブリに電力を提供する。電源アセンブリ706は、電源管理システム、一つ又は複数の電源、及び装置700のための電力の生成、管理、及び配分に関連される他のアセンブリを含むことができる。
マルチメディアアセンブリ708は、装置700とユーザーとの間に一つの出力インターフェースを提供するスクリーンを含む。一部の実施例において、スクリーンは、液晶表示装置(LCD)とタッチパネル(TP)を含むことができる。もし、スクリーンがタッチパネルを含むと、スクリーンはタッチスクリーンとして実現され、ユーザーからの入力信号を受信することができる。タッチパネルは、タッチ、スライド、及びタッチパネル上の手振りを検知できるように、一つ又は複数のタッチセンサーを含むことができる。タッチセンサーは、タッチ又はスライド動作の境界を検知できるだけではなく、タッチ又はスライド操作に関連する持続時間と圧力も検知できる。一部の実施例において、マルチメディアアセンブリ708は、一つの前面カメラ及び/又は後面カメラを含む。装置700が操作モード、例えば撮影モード又はビデオモードにある場合、前面カメラ及び/又は後面カメラは外部のマルチメディアデータを受信できる。前面カメラおよび後面カメラのそれぞれは、固定された光学レンズシステムであってもいいし、又は焦点距離と光学ズーム能力を有してもいい。
オーディオアセンブリ710は、オーディオ信号を出力及び/又は入力するように配置される。例えば、オーディオアセンブリ710は、一つのマイク(MIC)を含む。装置700が操作モード、例えば呼び出しモード、記録モード、及び音声オーディオ識別モードにある場合、マイクは外部のオーディオ信号を受信するように配置される。受信されたオーディオ信号は、更に記憶装置704に記憶されるか、又は通信アセンブリ716を経由して送信されることができる。一部の実施例において、オーディオアセンブリ710は、オーディオ信号を出力するための一つのスピーカーを更に含む。
I/Oインターフェース712は、プロセッサアセンブリ702と外部インターフェースモジュールとの間にインターフェースを提供する。上記の外部インターフェースモジュールは、キーボード、クリックホイール、ボタン等であってもよい。このようなボタンは、メインページボタン、音量ボタン、スタートボタン、及びロックボタンを含むことができるが、これに限られない。
センサーアセンブリ714は、装置700へ各方面の状態に対する評価を提供するための一つ又は複数のセンサーを含む。例えば、センサーアセンブリ714は、装置700のオン/オフ状態、アセンブリ(例えば、アセンブリは装置700の表示装置およびキーパッド)の相対的位置を検出できる。センサーアセンブリ714は、装置700又は装置700の一つのアセンブリの位置変化、ユーザーと装置700との間の接触の発生有無、装置700の方向及び位置、又は加速/減速、及び装置700の温度変化も検出できる。センサーアセンブリ714は、如何なる物理接触も発生しない時の、付近の物の存在を検出するための近接センサーを含むことができる。センサーアセンブリ714は、CMOSまたはCCDイメージセンサのように、イメージングアプリケーションで使用される光センサーを更に含むことができる。一部の実施例において、該センサーアセンブリ714は、加速度センサー、ジャイロスコープセンサー、磁気センサー、圧力センサー又は温度センサーを更に含むことができる。
通信アセンブリ716は、装置700と他の設備との間で有線又は無線によって便利に通信できるように配置される。装置700は、通信標準に基づく無線インターネット、例えば、Wi-Fi(登録商標)、2G又は3G、又はそれらの組み合わせにアクセスできる。一つの例示的な実施例において、通信アセンブリ716は、放送チャンネルを通じて外部放送管理システムからの放送信号又は放送関連情報を受信する。一つの例示的な実施例において、通信アセンブリ716は、近距離無線通信(NFC、Near Field Communication)モジュールを更に含み、近距離通信をサポートする。例えば、NFCモジュールは、RFID(radio frequency identification、無線周波数認識)技術、IrDA(Infrared Data Association、赤外線通信規格)技術、超広帯域通信(UWB)技術、ブルートゥース(BT)(登録商標)技術、及び他の技術に基づいて実現できる。
例示的な実施例において、装置700は、上記のオーディオ情報識別方法を実行するための、一つ又は複数のASIC(application specific integrated circuit、特定用途向け集積回路)、デジタルシグナルプロセッサ(DSP、digital signal processor)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD、Programmable Logic Device)、FPGA(field-programmable gate array、フィールド・プログラマブル・ゲート・アレイ)、コントローラ、マイクロコントローラ、マイクロプロセッサ、又は他の電気素子によって実現することができる。
例示的な実施例では、コマンドを含んでいる非一時的(non-transitory)コンピューター読取可能な記憶媒体、例えば、コマンドを含んでいる記憶装置704を更に提供する。上記のコマンドは、上記のオーディオ情報識別方法を完了させるように、装置700のプロセッサ718によって実行されることができる。例えば、非一時的コンピューター読取可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスク(floppy disk)(登録商標)、及び光データ記憶装置等であってもよい。
当業者は、明細書の内容を考慮し、ここに開示された発明を実施した後、本発明の他の実施方案を容易に想到できる。本願は、本文に開示された発明に対する全ての変形、用途、及び適当な変化を含み、このような変形、用途、及び適当な変化は全て本発明の一般的な原理に基づくものであり、本願に開示されていない当分野の周知常識又は常套的技術手段を含む。明細書と実施例はただ例示に過ぎず、本発明で保護しようとする範囲と宗旨は以下の特許請求の範囲によって決められる。
尚、本願は上述した説明及び図面に示された精密な構成に限られず、本願の範囲を超えない範囲内で、本願に対していろいろな修正及び変形を行える。本願の範囲は特許請求の範囲だけによって決められる。


Claims (13)

  1. 再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得するステップと、
    前記オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示するステップと、
    前記移動リンクがトリガーされると、前記キーワードに対応する事前記憶情報を表示するステップとを含む
    ことを特徴とするオーディオ情報識別方法。
  2. 請求項1において、
    再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得するステップは、
    前記オーディオに対して識別を行い、前記オーディオのオーディオ特徴を獲得するステップと、
    前記オーディオ特徴をサーバーへ送信するステップと、
    前記サーバーからフィードバックした前記オーディオ情報を受信するステップとを含み、
    前記オーディオ特徴は、前記オーディオのテキスト情報及び個人識別情報の中の前者又は両者と関連され、
    前記オーディオ特徴は、前記サーバーをトリガーして、前記オーディオ特徴とマッチングされるオーディオ情報を検索させ、検索された前記オーディオ情報をフィードバックさせるためのものである
    ことを特徴とするオーディオ情報識別方法。
  3. 請求項1において、
    所定時間間隔毎に前記再生中のオーディオを取得するステップ、
    又は、
    再生中のオーディオを識別するための識別コマンドを受信して、前記再生中のオーディオを取得するステップを
    更に含むことを特徴とするオーディオ情報識別方法。
  4. 請求項1において、
    前記オーディオに対応する完整なオーディオの再生リンクおよびダウンロードリンクを、前記情報提示インターフェースに表示するステップと
    前記再生リンクがトリガーされると、前記完整なオーディオを再生するステップと
    前記ダウンロードリンクがトリガーされると、前記完整なオーディオをダウンロードするステップとを
    更に含むことを特徴とするオーディオ情報識別方法。
  5. 請求項1において、
    前記オーディオ情報の中のキーワードに対応する検索ウィジェットを前記情報提示インターフェース内に表示するステップと、
    一つのキーワードの検索ウィジェットがトリガーされると、前記キーワードに対応する検索結果が表示されている、前記キーワードの検索インターフェースを表示するステップとを更に含み、
    ことを特徴とするオーディオ情報識別方法。
  6. 請求項1〜5の何れか一項において、
    前記移動リンクを表示した後、自動的に前記オーディオ情報および前記移動リンクを事前記憶リストに記憶するステップ
    又は、
    前記オーディオ情報および前記移動リンクを記憶するように指示するための記憶コマンドを受信して、前記オーディオ情報および前記移動リンクを事前記憶リストに記憶するステップを
    更に含むことを特徴とするオーディオ情報識別方法。
  7. 再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得するように配置される識別モジュールと、
    前記識別モジュールが識別して獲得した前記オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示するように配置される第1の表示モジュールと、
    前記第1の表示モジュールが表示した前記移動リンクがトリガーされると、前記キーワードに対応する事前記憶情報を表示するように配置される第2の表示モジュールとを含む
    ことを特徴とするオーディオ情報識別装置。
  8. 請求項7において、
    前記オーディオに対して識別を行い、前記オーディオのオーディオ特徴を獲得するように配置され、前記オーディオ特徴が、前記オーディオのテキスト情報及び個人識別情報の中の前者又は両者と関連される、識別サブモジュールと、
    前記識別サブモジュールが識別して獲得した前記オーディオ特徴をサーバーへ送信するように配置され、前記オーディオ特徴が、前記サーバーをトリガーして、前記オーディオ特徴とマッチングされるオーディオ情報を検索させ、検索された前記オーディオ情報をフィードバックさせるためのものである、送信サブモジュールと、
    前記サーバーからフィードバックした前記オーディオ情報を受信するように配置される受信サブモジュールとを含む
    ことを特徴とするオーディオ情報識別装置。
  9. 請求項7において、
    所定時間間隔毎に前記再生中のオーディオを取得するように配置される第1の取得モジュール、
    又は、
    再生中のオーディオを識別するための識別コマンドを受信して、前記再生中のオーディオを取得するように配置される第2の取得モジュールを
    更に含むことを特徴とするオーディオ情報識別装置。
  10. 請求項7において、
    前記オーディオに対応する完整なオーディオの再生リンクおよびダウンロードリンクを前記情報提示インターフェースに表示するように配置される、第3の表示モジュールと、
    前記第3の表示モジュールに表示された前記再生リンクがトリガーされると、前記完整なオーディオを再生するように配置される再生モジュールと、
    前記第3の表示モジュールに表示された前記ダウンロードリンクがトリガーされると、前記完整なオーディオをダウンロードするように配置されるダウンロードモジュールとを
    更に含むことを特徴とするオーディオ情報識別装置。
  11. 請求項7において、
    前記オーディオ情報の中のキーワードに対応する検索ウィジェットを、前記情報提示インターフェース内に表示するように配置される第4の表示モジュールと、
    前記第4の表示モジュールに表示された一つのキーワードの検索ウィジェットがトリガーされると、前記キーワードの検索インターフェースを表示し、前記検索インターフェースに前記キーワードに対応する検索結果が表示されているように配置される第5の表示モジュールとを
    更に含むことを特徴とするオーディオ情報識別装置。
  12. 請求項7〜11の何れか一項において、
    前記移動リンクを表示した後、自動的に前記オーディオ情報および前記移動リンクを事前記憶リストに記憶するように配置される第1の記憶モジュール、
    又は、
    前記オーディオ情報および前記移動リンクを記憶するように指示するための記憶コマンドを受信し、前記オーディオ情報および前記移動リンクを事前記憶リストに記憶するように配置される第2の記憶モジュールを
    更に含むことを特徴とするオーディオ情報識別装置。
  13. プロセッサと、
    前記プロセッサが実行可能なコマンドを記憶するための記憶装置とを含み、
    前記プロセッサは、
    再生中のオーディオを識別して、前記オーディオのオーディオ情報を獲得し、
    前記オーディオ情報の中のキーワードのために設定した移動リンクを、情報提示インターフェースに表示し、
    前記移動リンクがトリガーされると、前記キーワードに対応する事前記憶情報を表示するように配置される
    ことを特徴とするオーディオ情報識別装置。
JP2017512096A 2015-04-15 2015-11-19 オーディオ情報識別方法及び装置 Active JP6236189B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510178987.0A CN104820678B (zh) 2015-04-15 2015-04-15 音频信息识别方法及装置
CN201510178987.0 2015-04-15
PCT/CN2015/095034 WO2016165325A1 (zh) 2015-04-15 2015-11-19 音频信息识别方法及装置

Publications (2)

Publication Number Publication Date
JP2017517828A true JP2017517828A (ja) 2017-06-29
JP6236189B2 JP6236189B2 (ja) 2017-11-22

Family

ID=53730975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017512096A Active JP6236189B2 (ja) 2015-04-15 2015-11-19 オーディオ情報識別方法及び装置

Country Status (8)

Country Link
US (1) US20160306880A1 (ja)
EP (1) EP3082280B1 (ja)
JP (1) JP6236189B2 (ja)
KR (1) KR20160132808A (ja)
CN (1) CN104820678B (ja)
MX (1) MX359479B (ja)
RU (1) RU2634696C2 (ja)
WO (1) WO2016165325A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820678B (zh) * 2015-04-15 2018-10-19 小米科技有限责任公司 音频信息识别方法及装置
CN105005631A (zh) * 2015-08-24 2015-10-28 安徽味唯网络科技有限公司 一种高精度搜索的方法
CN105357588A (zh) * 2015-11-03 2016-02-24 腾讯科技(深圳)有限公司 数据显示方法及终端
CN114464186A (zh) * 2016-07-28 2022-05-10 北京小米移动软件有限公司 关键词确定方法及装置
CN106341728A (zh) * 2016-10-21 2017-01-18 北京巡声巡影科技服务有限公司 一种视频中的产品信息展示方法、装置和系统
CN106851362A (zh) * 2016-12-15 2017-06-13 咪咕音乐有限公司 一种多媒体内容的播放方法及装置
CN106599274A (zh) * 2016-12-23 2017-04-26 珠海市魅族科技有限公司 识别播放音源的装置及方法
CN106897435A (zh) * 2017-02-28 2017-06-27 深圳天珑无线科技有限公司 终端控制方法及装置
CN107040587A (zh) * 2017-03-02 2017-08-11 广州小鹏汽车科技有限公司 一种车载电台音乐内容获取方法及装置
CN107959751A (zh) * 2017-11-14 2018-04-24 优酷网络技术(北京)有限公司 音频播放方法及装置
US20190206102A1 (en) * 2017-12-29 2019-07-04 Facebook, Inc. Systems and methods for enhancing content
CN111723235B (zh) * 2019-03-19 2023-09-26 百度在线网络技术(北京)有限公司 音乐内容识别方法、装置及设备
CN110489573A (zh) * 2019-07-30 2019-11-22 维沃移动通信有限公司 界面显示方法及电子设备
CN112148754A (zh) * 2020-09-01 2020-12-29 腾讯音乐娱乐科技(深圳)有限公司 一种歌曲识别方法和装置
EP4213145A1 (en) * 2022-01-14 2023-07-19 Vestel Elektronik Sanayi ve Ticaret A.S. Device and method for triggering a music identification application

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020073179A1 (en) * 1998-09-29 2002-06-13 Radio Wave.Com, Inc. System and method for providing broadcast
US20060184960A1 (en) * 2005-02-14 2006-08-17 Universal Music Group, Inc. Method and system for enabling commerce from broadcast content
CN103442083A (zh) * 2013-09-10 2013-12-11 百度在线网络技术(北京)有限公司 音频文件传输关联内容的方法、系统、客户端和服务器

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3919479A (en) * 1972-09-21 1975-11-11 First National Bank Of Boston Broadcast signal identification system
US7171018B2 (en) * 1995-07-27 2007-01-30 Digimarc Corporation Portable devices and methods employing digital watermarking
US7028082B1 (en) * 2001-03-08 2006-04-11 Music Choice Personalized audio system and method
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US7752546B2 (en) * 2001-06-29 2010-07-06 Thomson Licensing Method and system for providing an acoustic interface
US20040133558A1 (en) * 2003-01-06 2004-07-08 Masterwriter, Inc. Information management system plus
CN1983253A (zh) * 2005-12-15 2007-06-20 北京中科信利技术有限公司 一种提供音乐搜索服务的方法、设备和系统
US7787697B2 (en) * 2006-06-09 2010-08-31 Sony Ericsson Mobile Communications Ab Identification of an object in media and of related media objects
EP2070231B1 (en) * 2006-10-03 2013-07-03 Shazam Entertainment, Ltd. Method for high throughput of identification of distributed broadcast content
WO2009042697A2 (en) * 2007-09-24 2009-04-02 Skyclix, Inc. Phone-based broadcast audio identification
US20100057781A1 (en) * 2008-08-27 2010-03-04 Alpine Electronics, Inc. Media identification system and method
CN101635002A (zh) * 2009-08-21 2010-01-27 深圳市五巨科技有限公司 一种移动终端音乐搜索的方法和装置
US9264785B2 (en) * 2010-04-01 2016-02-16 Sony Computer Entertainment Inc. Media fingerprinting for content determination and retrieval
US8694533B2 (en) * 2010-05-19 2014-04-08 Google Inc. Presenting mobile content based on programming context
US8158870B2 (en) * 2010-06-29 2012-04-17 Google Inc. Intervalgram representation of audio for melody recognition
KR20120069908A (ko) * 2010-12-21 2012-06-29 삼성전자주식회사 휴대단말기의 정보제공 장치 및 방법
CN103096249A (zh) * 2011-10-28 2013-05-08 M&Service株式会社 内容同时播放终端、其系统以及同时播放方法
CN102868822B (zh) * 2012-09-24 2014-09-03 广东欧珀移动通信有限公司 一种移动终端实施的歌词显示方法
US20150286873A1 (en) * 2014-04-03 2015-10-08 Bruce L. Davis Smartphone-based methods and systems
CN103685520A (zh) * 2013-12-13 2014-03-26 深圳Tcl新技术有限公司 基于语音识别的歌曲推送的方法和装置
CN104820678B (zh) * 2015-04-15 2018-10-19 小米科技有限责任公司 音频信息识别方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020073179A1 (en) * 1998-09-29 2002-06-13 Radio Wave.Com, Inc. System and method for providing broadcast
US20060184960A1 (en) * 2005-02-14 2006-08-17 Universal Music Group, Inc. Method and system for enabling commerce from broadcast content
CN103442083A (zh) * 2013-09-10 2013-12-11 百度在线网络技术(北京)有限公司 音频文件传输关联内容的方法、系统、客户端和服务器

Also Published As

Publication number Publication date
RU2016108039A (ru) 2017-09-07
CN104820678A (zh) 2015-08-05
EP3082280B1 (en) 2018-07-25
WO2016165325A1 (zh) 2016-10-20
MX2016002658A (es) 2017-04-27
KR20160132808A (ko) 2016-11-21
CN104820678B (zh) 2018-10-19
RU2634696C2 (ru) 2017-11-03
EP3082280A1 (en) 2016-10-19
MX359479B (es) 2018-09-28
JP6236189B2 (ja) 2017-11-22
US20160306880A1 (en) 2016-10-20

Similar Documents

Publication Publication Date Title
JP6236189B2 (ja) オーディオ情報識別方法及び装置
US11206448B2 (en) Method and apparatus for selecting background music for video shooting, terminal device and medium
CN110929054B (zh) 多媒体信息应用界面显示方法及装置、终端、介质
CN107396177B (zh) 视频播放方法、装置及存储介质
TWI667917B (zh) Multimedia search result display method and device
US20150350406A1 (en) Method and device for calendar reminding
KR101954794B1 (ko) 영상 표시 장치에서 멀티미디어 컨텐츠의 재생구간을 탐색하기 위한 장치 및 방법
JP6177457B2 (ja) 通話要求をプロンプトする方法、装置、プログラム及び記録媒体
CN104284249A (zh) 视频播放方法及装置
CN105244048A (zh) 音频播放控制方法和装置
CN111246283B (zh) 视频播放方法、装置、电子设备及存储介质
CN105095427A (zh) 搜索推荐方法和装置
CN104166689A (zh) 电子书籍的呈现方法及装置
CN109413478B (zh) 视频编辑方法、装置、电子设备及存储介质
CN107229403B (zh) 一种信息内容选择方法及装置
WO2022142871A1 (zh) 视频录制方法及装置
CN111432288A (zh) 视频播放方法、装置、电子设备和存储介质
CN110719530A (zh) 一种视频播放方法、装置、电子设备及存储介质
CN111061906A (zh) 音乐信息处理方法、装置、电子设备及计算机可读存储介质
US20160249091A1 (en) Method and an electronic device for providing a media stream
CN104881304A (zh) 资源下载方法及装置
CN105472149A (zh) 一种铃声设置方法及装置
CN105426496A (zh) 页面展示方法及装置、电子设备
CN106789943B (zh) 蓝牙设备的播放方法及装置
CN105487746A (zh) 搜索结果的呈现方法和装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171027

R150 Certificate of patent or registration of utility model

Ref document number: 6236189

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250