JP2015522892A - マルチメディア情報検索方法及び電子機器 - Google Patents
マルチメディア情報検索方法及び電子機器 Download PDFInfo
- Publication number
- JP2015522892A JP2015522892A JP2015523408A JP2015523408A JP2015522892A JP 2015522892 A JP2015522892 A JP 2015522892A JP 2015523408 A JP2015523408 A JP 2015523408A JP 2015523408 A JP2015523408 A JP 2015523408A JP 2015522892 A JP2015522892 A JP 2015522892A
- Authority
- JP
- Japan
- Prior art keywords
- multimedia
- search
- recognition
- undetermined
- codes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000008569 process Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明はマルチメディア情報検索方法を提供し、当該方法は
検索待ちマルチメディアから前記検索待ちマルチメディアの音声を抽出するステップ、
前記検索待ちマルチメディアの音声を音声認識して認識テキストを取得するステップ、及び
前記認識テキストによってマルチメディアデータベースで検索して、前記検索待ちマルチメディアのマルチメディア情報を取得するステップを含む。
1つ又は1つ以上のプロセッサ、
メモリ、及び
1つ又は1つ以上のプログラムを含み、前記1つ又は1つ以上のプログラムが前記メモリに記憶され、且つ前記1つ又は1つ以上のプロセッサによって実行するように配置されてマルチメディア情報検索方法を提供し、前記1つ又は1つ以上のプログラムは、機能によって分けられ、
検索待ちマルチメディアから前記検索待ちマルチメディアの音声を抽出するための音声抽出モジュール、
前記検索待ちマルチメディアの音声を音声認識して、認識テキストを取得するための音声認識モジュール、及び
前記認識テキストに基づいてマルチメディアデータベースで検索して前記検索待ちマルチメディアのマルチメディア情報を取得するための検索モジュールを含む。
1つ又は1つ以上のプロセッサ、
メモリ、及び
1つ又は1つ以上のプログラムを含み、前記1つ又は1つ以上のプログラムが前記メモリに記憶され、且つ前記1つ又は1つ以上のプロセッサによって実行するように配置されてマルチメディア情報検索方法を提供し、前記1つ又は1つ以上のプログラムは機能によって分けられ、
マルチメディア情報を記憶するためのマルチメディアデータベース、
検索待ちマルチメディアのダウンロードリンクによって前記検索待ちマルチメディアをダウンロードするためのダウンロードモジュール、
検索待ちマルチメディアから前記検索待ちマルチメディアの音声を抽出するための音声抽出モジュール、
前記検索待ちマルチメディアの音声を音声認識して、認識テキストを取得するための音声認識モジュール、及び
前記認識テキストに基づいて前記マルチメディアデータベースで検索して、前記検索待ちマルチメディアのマルチメディア情報を取得するための検索モジュールを含む。
検索待ちマルチメディアから検索待ちマルチメディアの音声を抽出するステップS301と、
検索待ちマルチメディアの音声に音声認識を行って認識テキストを得るステップS302と、
認識テキストに基づいてマルチメディアデータベースで検索して、検索待ちマルチメディアのマルチメディア情報を得るステップS303と、
マルチメディア情報をユーザに展示するステップS304とを含む。
以下、図3と図4を参照しながら本発明のマルチメディア情報検索方法の各ステップの詳細フローを詳しく説明する。図4は図3に示すマルチメディア情報検索方法におけるステップ303の詳細なフローチャートである。
ステップS3031において、予設定のシソーラスに基づいて認識テキストに単語分割処理を行って複数の未定認識コードを得る。
未定認識コードを未定認識コードのシソーラスにおける単語頻度に基づいて昇順で配列し、次に単語頻度が最も低いn個の未定認識コードを選出し、また、m個の未定認識コードをランダムに選出し、こうしてn個の未定認識コードと前記m個の未定認識コードが重複でなく、最後にn個の未定認識コードと前記m個の未定認識コードを認識コードに設定し、ここでnが1以上であり、mが0以上である。ここでn個の未定認識コードは単語頻度が低いため、ある程度で検索結果の正確性を保証でき、m個の未定認識コードは低単語頻度の未定認識コードのもたらし可能な検索失敗(ここで検索はファジー検索であり、ある程度の検索条件を満たした場合、検索ユーザにフィードバックする)をある程度で回避できる。ここのn値とm値はユーザの要求によって柔軟に設定できる。
検索待ちマルチメディアから検索待ちマルチメディアの音声を抽出するステップS301と、
検索待ちマルチメディアの音声に音声認識を行って認識テキストを得るステップS302と、
認識テキストに基づいてマルチメディアデータベースで検索して、検索待ちマルチメディアのマルチメディア情報を得るステップS303と、
マルチメディア情報をユーザに展示するステップS304とを含む。
以下、図3と図4を参照しながら本発明のマルチメディア情報検索方法の各ステップの詳細フローを詳しく説明する。図4は図3に示すマルチメディア情報検索方法におけるステップS303の詳細なフローチャートである。
Claims (16)
- マルチメディア情報検索方法であって、
検索待ちマルチメディアから前記検索待ちマルチメディアの音声を抽出するステップ、
前記検索待ちマルチメディアの音声に音声認識を行って認識テキストを得るステップ、及び
前記認識テキストに基づいてマルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得るステップ、を含むマルチメディア情報検索方法。 - 前記認識テキストに基づいてマルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得る前記ステップは、
予設定のシソーラスに基づいて前記認識テキストに単語分割処理を行って複数の未定認識コードを得るステップ、
前記未定認識コードの前記シソーラスにおける単語頻度に基づいて、複数の認識コードを確定するステップ、及び
前記複数の認識コードを使用して前記マルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得るステップ、を含む請求項1に記載のマルチメディア情報検索方法。 - 前記未定認識コードが文字、ピンイン及び英語のうちの少なくとも1種である請求項2に記載のマルチメディア情報検索方法。
- 前記未定認識コードの前記シソーラスにおける単語頻度に基づいて、複数の認識コードを確定する前記ステップは、具体的に、
すべての未定認識コードのうちから、前記シソーラスにおける単語頻度が最も低いn個の未定認識コードを選択し、その後、ランダムにm個の未定認識コードを選択し、前記n個の未定認識コードと前記m個の未定認識コードが重複でなく、前記n個の未定認識コード及び前記m個の未定認識コードを認識コードに設定し、nが1以上であり、mが0以上であることを含む請求項2に記載のマルチメディア情報検索方法。 - 前記マルチメディア情報検索方法は、前記マルチメディア情報をユーザに展示するステップをさらに含み、前記マルチメディア情報は歌の名称、シンガー、歌詞、アルバム、バックグラウンド情報、楽譜及びマルチメディアダウンロードリンクのうちの少なくとも1つを含む請求項1に記載のマルチメディア情報検索方法。
- 電子機器であって、
1つ又は1つ以上のプロセッサ、
メモリ、及び
1つ又は1つ以上のプログラムを含み、前記1つ又は1つ以上のプログラムが前記メモリに記憶され、且つ前記1つ又は1つ以上のプロセッサによって実行するように配置されてマルチメディア情報検索方法を提供し、
前記1つ又は1つ以上のプログラムは、機能によって分けられ、
検索待ちマルチメディアから前記検索待ちマルチメディアの音声を抽出するための音声抽出モジュール、
前記検索待ちマルチメディアの音声に音声認識を行って認識テキストを得るための音声認識モジュール、及び
前記認識テキストに基づいてマルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得るための検索モジュール、を含む電子機器。 - 前記検索モジュールは、
予設定のシソーラスに基づいて前記認識テキストに単語分割処理を行って複数の未定認識コードを得るための未定認識コード確定ユニット、
前記未定認識コードの前記シソーラスにおける単語頻度に基づいて、複数の認識コードを確定するための認識コード確定ユニット、及び
前記複数の認識コードを使用して前記マルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得るための検索ユニットを含む請求項6に記載の電子機器。 - 前記未定認識コードが文字、ピンイン及び英語のうちの少なくとも1種である請求項7に記載の電子機器。
- 前記認識コード確定ユニットは具体的に、すべての未定認識コードのうちから前記シソーラスにおける単語頻度が最も低いn個の未定認識コードを選択し、その後、ランダムにm個の未定認識コードを選択し、前記n個の未定認識コードと前記m個の未定認識コードが重複でなく、前記n個の未定認識コード及び前記m個の未定認識コードを認識コードに設定することに用いられ、nが1以上であり、mが0以上である請求項7に記載の電子機器。
- 前記電子機器は、前記マルチメディア情報をユーザに展示するためのマルチメディア展示モジュールをさらに含み、前記マルチメディア情報は歌の名称、シンガー、歌詞、アルバム、バックグラウンド情報、楽譜及びマルチメディアダウンロードリンクのうちの少なくとも1つを含む請求項6に記載の電子機器。
- 電子機器であって、
1つ又は1つ以上のプロセッサ、
メモリ、及び
1つ又は1つ以上のプログラムを含み、前記1つ又は1つ以上のプログラムは前記メモリに記憶され、且つ前記1つ又は1つ以上のプロセッサによって実行するように配置されてマルチメディア情報検索方法を提供し、
前記1つ又は1つ以上のプログラムは、機能によって分けられ、
マルチメディア情報を記憶するためのマルチメディアデータベース、
検索待ちマルチメディアのダウンロードリンクによって前記検索待ちマルチメディアをダウンロードするためのダウンロードモジュール、
検索待ちマルチメディアから前記検索待ちマルチメディアの音声を抽出するための音声抽出モジュール、
前記検索待ちマルチメディアの音声に音声認識を行って認識テキストを得るための音声認識モジュール、及び
前記認識テキストに基づいてマルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得るための検索モジュール、を含む電子機器。 - 前記検索モジュールは、
予設定のシソーラスに基づいて前記認識テキストに単語分割処理を行って複数の未定認識コードを得るための未定認識コード確定ユニット、
前記未定認識コードの前記シソーラスにおける単語頻度に基づいて、複数の認識コードを確定するための認識コード確定ユニット、及び
前記複数の認識コードを使用して前記マルチメディアデータベースで検索を行って前記検索待ちマルチメディアのマルチメディア情報を得るための検索ユニットを含む請求項11に記載の電子機器。 - 前記未定認識コードが文字、ピンイン及び英語のうちの少なくとも1種である請求項12に記載の電子機器。
- 前記認識コード確定ユニットは具体的に、すべての未定認識コードのうちから前記シソーラスにおける単語頻度が最も低いn個の未定認識コードを選択し、その後、ランダムにm個の未定認識コードを選択し、前記n個の未定認識コードと前記m個の未定認識コードが重複でなく、前記n個の未定認識コード及び前記m個の未定認識コードを認識コードに設定することに用いられ、nが1以上であり、mが0以上である請求項12に記載の電子機器。
- 前記電子機器は、
前記マルチメディア情報をユーザにフィードバックするためのフィードバックモジュールをさらに含み、前記マルチメディア情報は歌の名称、シンガー、歌詞、アルバム、バックグラウンド情報、楽譜及びマルチメディアダウンロードリンクのうちの少なくとも1つを含む請求項11に記載の電子機器。 - 前記電子機器は、前記ダウンロードモジュールの取得したダウンロードリンクと相応のマルチメディア情報を関連付けるための関連付けモジュールをさらに含む請求項11に記載の電子機器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210303990.7 | 2012-08-24 | ||
CN201210303990.7A CN103631802B (zh) | 2012-08-24 | 2012-08-24 | 歌曲信息检索方法、装置及相应的服务器 |
PCT/CN2013/081992 WO2014029338A1 (zh) | 2012-08-24 | 2013-08-21 | 多媒体信息检索方法及电子设备 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015522892A true JP2015522892A (ja) | 2015-08-06 |
JP2015522892A5 JP2015522892A5 (ja) | 2016-06-02 |
JP5948671B2 JP5948671B2 (ja) | 2016-07-06 |
Family
ID=50149454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015523408A Active JP5948671B2 (ja) | 2012-08-24 | 2013-08-21 | マルチメディア情報検索方法及び電子機器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9704485B2 (ja) |
EP (1) | EP2889786A4 (ja) |
JP (1) | JP5948671B2 (ja) |
CN (1) | CN103631802B (ja) |
WO (1) | WO2014029338A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104010063B (zh) * | 2014-05-09 | 2018-01-02 | 郑明� | 移动终端回铃信息的显示方法及设备 |
CN104598515A (zh) * | 2014-12-03 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 歌曲搜索方法、装置和系统 |
CN104882146B (zh) * | 2015-05-12 | 2018-05-15 | 北京音之邦文化科技有限公司 | 音频推广信息的处理方法及装置 |
CN105677711A (zh) * | 2015-12-28 | 2016-06-15 | 小米科技有限责任公司 | 信息显示方法和装置 |
CN105828210A (zh) * | 2016-03-15 | 2016-08-03 | 武汉斗鱼网络科技有限公司 | 一种基于弹幕的点播歌曲的方法及装置 |
CN105956014A (zh) * | 2016-04-22 | 2016-09-21 | 成都涂鸦科技有限公司 | 一种基于深度学习的音乐播放方法 |
WO2018018283A1 (zh) * | 2016-07-24 | 2018-02-01 | 张鹏华 | 歌曲信息识别技术的使用情况统计方法和识别系统 |
CN106896933B (zh) * | 2017-01-19 | 2019-12-06 | 深圳情景智能有限公司 | 将语音输入转换成文本输入的方法、装置和语音输入设备 |
US11017771B2 (en) * | 2019-01-18 | 2021-05-25 | Adobe Inc. | Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets |
US10964322B2 (en) | 2019-01-23 | 2021-03-30 | Adobe Inc. | Voice interaction tool for voice-assisted application prototypes |
CN110795593A (zh) * | 2019-10-12 | 2020-02-14 | 百度在线网络技术(北京)有限公司 | 语音包的推荐方法、装置、电子设备和存储介质 |
CN111368136A (zh) * | 2020-03-31 | 2020-07-03 | 北京达佳互联信息技术有限公司 | 歌曲识别方法、装置、电子设备及存储介质 |
KR102362815B1 (ko) * | 2020-05-18 | 2022-02-14 | 니나노 주식회사 | 음성 인식 선곡 서비스 제공 방법 및 음성 인식 선곡 장치 |
CN113658594A (zh) * | 2021-08-16 | 2021-11-16 | 北京百度网讯科技有限公司 | 歌词识别方法、装置、设备、存储介质及产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002258874A (ja) * | 2001-03-01 | 2002-09-11 | Alpine Electronics Inc | 音楽試聴方法、システムおよび情報端末、音楽検索サーバ |
JP2006186426A (ja) * | 2004-12-24 | 2006-07-13 | Toshiba Corp | 情報検索表示装置、情報検索表示方法および情報検索表示プログラム |
JP2007524949A (ja) * | 2004-02-11 | 2007-08-30 | アメリカ オンライン インコーポレーティッド | 自動訂正機能を備えた手書き文字入力およびボイス入力 |
JP2010157080A (ja) * | 2008-12-26 | 2010-07-15 | Ntt Communications Kk | コンテンツ関連情報検索システム、コンテンツ関連情報検索方法、およびコンテンツ関連情報検索プログラム |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4852170A (en) * | 1986-12-18 | 1989-07-25 | R & D Associates | Real time computer speech recognition system |
US4829572A (en) * | 1987-11-05 | 1989-05-09 | Andrew Ho Chung | Speech recognition system |
DE3931638A1 (de) * | 1989-09-22 | 1991-04-04 | Standard Elektrik Lorenz Ag | Verfahren zur sprecheradaptiven erkennung von sprache |
EP0708958B1 (en) * | 1993-07-13 | 2001-04-11 | Theodore Austin Bordeaux | Multi-language speech recognition system |
US6014615A (en) * | 1994-08-16 | 2000-01-11 | International Business Machines Corporaiton | System and method for processing morphological and syntactical analyses of inputted Chinese language phrases |
SG42314A1 (en) * | 1995-01-30 | 1997-08-15 | Mitsubishi Electric Corp | Language processing apparatus and method |
US5749066A (en) * | 1995-04-24 | 1998-05-05 | Ericsson Messaging Systems Inc. | Method and apparatus for developing a neural network for phoneme recognition |
US5737489A (en) * | 1995-09-15 | 1998-04-07 | Lucent Technologies Inc. | Discriminative utterance verification for connected digits recognition |
US5832478A (en) * | 1997-03-13 | 1998-11-03 | The United States Of America As Represented By The National Security Agency | Method of searching an on-line dictionary using syllables and syllable count |
US6032111A (en) * | 1997-06-23 | 2000-02-29 | At&T Corp. | Method and apparatus for compiling context-dependent rewrite rules and input strings |
ITTO980383A1 (it) * | 1998-05-07 | 1999-11-07 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo di riconoscimento vocale con doppio passo di riconoscimento neurale e markoviano. |
US6243713B1 (en) * | 1998-08-24 | 2001-06-05 | Excalibur Technologies Corp. | Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types |
US6345252B1 (en) * | 1999-04-09 | 2002-02-05 | International Business Machines Corporation | Methods and apparatus for retrieving audio information using content and speaker information |
US6219640B1 (en) * | 1999-08-06 | 2001-04-17 | International Business Machines Corporation | Methods and apparatus for audio-visual speaker recognition and utterance verification |
US7165019B1 (en) * | 1999-11-05 | 2007-01-16 | Microsoft Corporation | Language input architecture for converting one text form to another text form with modeless entry |
US7403888B1 (en) * | 1999-11-05 | 2008-07-22 | Microsoft Corporation | Language input user interface |
US6892191B1 (en) * | 2000-02-07 | 2005-05-10 | Koninklijke Philips Electronics N.V. | Multi-feature combination generation and classification effectiveness evaluation using genetic algorithms |
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
US7072827B1 (en) * | 2000-06-29 | 2006-07-04 | International Business Machines Corporation | Morphological disambiguation |
US6973427B2 (en) * | 2000-12-26 | 2005-12-06 | Microsoft Corporation | Method for adding phonetic descriptions to a speech recognition lexicon |
US7013273B2 (en) * | 2001-03-29 | 2006-03-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition based captioning system |
US7124080B2 (en) * | 2001-11-13 | 2006-10-17 | Microsoft Corporation | Method and apparatus for adapting a class entity dictionary used with language models |
US7395203B2 (en) * | 2003-07-30 | 2008-07-01 | Tegic Communications, Inc. | System and method for disambiguating phonetic input |
US20050038814A1 (en) * | 2003-08-13 | 2005-02-17 | International Business Machines Corporation | Method, apparatus, and program for cross-linking information sources using multiple modalities |
US20050071148A1 (en) * | 2003-09-15 | 2005-03-31 | Microsoft Corporation | Chinese word segmentation |
JP2005266198A (ja) * | 2004-03-18 | 2005-09-29 | Pioneer Electronic Corp | 音響情報再生装置および音楽データのキーワード作成方法 |
US20070242071A1 (en) * | 2004-05-24 | 2007-10-18 | Harding Patrick M | Character Display System |
CN1750117A (zh) * | 2004-09-16 | 2006-03-22 | 乐金电子(惠州)有限公司 | 伴唱机歌曲搜索系统及其旋律数据库构成方法 |
US7680648B2 (en) * | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation |
US7996208B2 (en) * | 2004-09-30 | 2011-08-09 | Google Inc. | Methods and systems for selecting a language for text segmentation |
US8463611B2 (en) * | 2004-10-13 | 2013-06-11 | Hewlett-Packard Development Company, L.P. | Method and system for improving the fidelity of a dialog system |
TWI277949B (en) * | 2005-02-21 | 2007-04-01 | Delta Electronics Inc | Method and device of speech recognition and language-understanding analysis and nature-language dialogue system using the method |
US7516125B2 (en) * | 2005-08-01 | 2009-04-07 | Business Objects Americas | Processor for fast contextual searching |
NO326770B1 (no) * | 2006-05-26 | 2009-02-16 | Tandberg Telecom As | Fremgangsmate og system for videokonferanse med dynamisk layout basert pa orddeteksjon |
US8694318B2 (en) * | 2006-09-19 | 2014-04-08 | At&T Intellectual Property I, L. P. | Methods, systems, and products for indexing content |
US20080085099A1 (en) * | 2006-10-04 | 2008-04-10 | Herve Guihot | Media player apparatus and method thereof |
CN101021857A (zh) * | 2006-10-20 | 2007-08-22 | 鲍东山 | 基于内容分析的视频搜索系统 |
US20080221866A1 (en) * | 2007-03-06 | 2008-09-11 | Lalitesh Katragadda | Machine Learning For Transliteration |
US20080300872A1 (en) * | 2007-05-31 | 2008-12-04 | Microsoft Corporation | Scalable summaries of audio or visual content |
US20090031885A1 (en) * | 2007-07-31 | 2009-02-05 | Christopher Lee Bennetts | Networked karaoke system and method |
CN100470633C (zh) * | 2007-11-30 | 2009-03-18 | 清华大学 | 语音点歌方法 |
CN101634987A (zh) * | 2008-07-21 | 2010-01-27 | 上海天统电子科技有限公司 | 多媒体播放器 |
US8155961B2 (en) * | 2008-12-09 | 2012-04-10 | Nokia Corporation | Adaptation of automatic speech recognition acoustic models |
JP5697860B2 (ja) * | 2009-09-09 | 2015-04-08 | クラリオン株式会社 | 情報検索装置,情報検索方法及びナビゲーションシステム |
CN102236686A (zh) * | 2010-05-07 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 语音分段式歌曲检索方法 |
CN102404278A (zh) * | 2010-09-08 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 一种基于声纹识别的点歌系统及其应用方法 |
US20140180762A1 (en) * | 2012-12-12 | 2014-06-26 | Ishlab, Inc. | Systems and methods for customized music selection |
-
2012
- 2012-08-24 CN CN201210303990.7A patent/CN103631802B/zh active Active
-
2013
- 2013-08-21 JP JP2015523408A patent/JP5948671B2/ja active Active
- 2013-08-21 WO PCT/CN2013/081992 patent/WO2014029338A1/zh active Application Filing
- 2013-08-21 EP EP13831356.4A patent/EP2889786A4/en not_active Ceased
-
2015
- 2015-02-04 US US14/613,989 patent/US9704485B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002258874A (ja) * | 2001-03-01 | 2002-09-11 | Alpine Electronics Inc | 音楽試聴方法、システムおよび情報端末、音楽検索サーバ |
JP2007524949A (ja) * | 2004-02-11 | 2007-08-30 | アメリカ オンライン インコーポレーティッド | 自動訂正機能を備えた手書き文字入力およびボイス入力 |
JP2006186426A (ja) * | 2004-12-24 | 2006-07-13 | Toshiba Corp | 情報検索表示装置、情報検索表示方法および情報検索表示プログラム |
JP2010157080A (ja) * | 2008-12-26 | 2010-07-15 | Ntt Communications Kk | コンテンツ関連情報検索システム、コンテンツ関連情報検索方法、およびコンテンツ関連情報検索プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN103631802B (zh) | 2015-05-20 |
CN103631802A (zh) | 2014-03-12 |
EP2889786A1 (en) | 2015-07-01 |
EP2889786A4 (en) | 2016-03-30 |
US9704485B2 (en) | 2017-07-11 |
JP5948671B2 (ja) | 2016-07-06 |
WO2014029338A1 (zh) | 2014-02-27 |
US20150154958A1 (en) | 2015-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5948671B2 (ja) | マルチメディア情報検索方法及び電子機器 | |
US11682380B2 (en) | Systems and methods for crowdsourced actions and commands | |
EP3648099B1 (en) | Voice recognition method, device, apparatus, and storage medium | |
WO2021139701A1 (zh) | 一种应用推荐方法、装置、存储介质及电子设备 | |
US8745051B2 (en) | Resource locator suggestions from input character sequence | |
US10122839B1 (en) | Techniques for enhancing content on a mobile device | |
CN108369580B (zh) | 针对屏幕上项目选择的基于语言和域独立模型的方法 | |
US9342233B1 (en) | Dynamic dictionary based on context | |
US9691381B2 (en) | Voice command recognition method and related electronic device and computer-readable medium | |
JP2015522892A5 (ja) | ||
US10108698B2 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
US11830482B2 (en) | Method and apparatus for speech interaction, and computer storage medium | |
US11675607B2 (en) | Data transfers from memory to manage graphical output latency | |
EP3523718A1 (en) | Creating a cinematic storytelling experience using network-addressable devices | |
JP2020516980A (ja) | コンテキストディープブックマーキング | |
US20140136196A1 (en) | System and method for posting message by audio signal | |
EP3161675B1 (en) | Indexing actions for resources | |
EP3374879A1 (en) | Provide interactive content generation for document | |
JP2023514863A (ja) | 情報を交換するための方法及び装置 | |
WO2023040692A1 (zh) | 语音控制方法、装置、设备及介质 | |
CN117636915A (zh) | 调整播放进度的方法、相关装置及计算机程序产品 | |
CN117828170A (zh) | 一种信息获取方法、设备及系统 | |
CN112162955A (zh) | 用户日志的处理装置及方法 | |
CN112102820A (zh) | 交互方法、交互装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20160405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5948671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |