JP7403571B2 - 音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム - Google Patents
音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム Download PDFInfo
- Publication number
- JP7403571B2 JP7403571B2 JP2022056210A JP2022056210A JP7403571B2 JP 7403571 B2 JP7403571 B2 JP 7403571B2 JP 2022056210 A JP2022056210 A JP 2022056210A JP 2022056210 A JP2022056210 A JP 2022056210A JP 7403571 B2 JP7403571 B2 JP 7403571B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- data set
- text
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000004590 computer program Methods 0.000 title claims description 12
- 238000012545 processing Methods 0.000 claims description 14
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
Description
なお、本願の出願当初の開示事項を維持するために、本願の出願当初の請求項1~13の記載内容を以下に追加する。
(請求項1)
音声データを取得することと、
前記音声データを認識して、対応するテキストデータを取得することと、
前記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することと、
前記マッチングすべきデータセットに基づいて、前記混合マッチングデータセットを選別し、前記音声データに対応する検索結果セットを取得することと
を含んでなる音声検索方法。
(請求項2)
前記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することは、
前記テキストデータをデータ検索して、検索データセットを取得することと、
前記検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得することと
を含む、請求項1に記載の音声検索方法。
(請求項3)
前記テキストデータをデータ検索して、検索データセットを取得することは、
前記テキストデータの測定すべきピンインデータを取得することと、
前記測定すべきピンインデータと同じ発音を持つテキストデータを検索して、検索テキストデータを取得することと、
前記テキストデータ及び前記検索テキストデータを組み合わせて、検索データセットを取得することと
を含む、請求項2に記載の音声検索方法。
(請求項4)
前記テキストデータをデータ検索して、検索データセットを取得することは、
前記テキストデータの測定すべきピンインデータを取得することと、
前記測定すべきピンインデータと同じ発音を持つ検索テキストデータを確定して、検索テキストデータを取得することと、
前記測定すべきピンインデータに対してデータ修正を行い、修正ピンインデータを取得することと、
前記修正ピンインデータと同じ発音を持つテキストデータを検索して、修正テキストデータを取得することと、
前記テキストデータ、前記修正テキストデータ及び前記検索テキストデータを組み合わせて、検索データセットを取得することと
を含む、請求項2に記載の音声検索方法。
(請求項5)
前記マッチングすべきデータセットに基づいて、前記混合マッチングデータセットを選別し、前記音声データに対応する検索結果セットを取得することは、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することと、
前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することと
を含む、請求項2~4のいずれか一項に記載の音声検索方法。
(請求項6)
前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することは、
各中間データセットにおける各中間データをピンインのアルファベットの順で並べ替えて、異なる並べ替えデータセットを取得することと、
各並べ替えデータセットに対して、当該並べ替えデータセットに同じピンインを持つ複数の並べ替えデータがあると判断したことに応答して、前記複数の並べ替えデータを、前記マッチングすべきデータセットのうち、各並べ替えデータと対応するデータの順で並べ替えることと、
各中間データセットの優先度レベルに応じて、すべての並べ替えデータセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することと
を含む、請求項5に記載の音声検索方法。
(請求項7)
前記検索データセットは、テキストデータ及び前記テキストデータよりも優先度が低い検索テキストデータを含み、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、
前記テキストデータと前記混合マッチングデータセットをマッチングして、前記テキストデータとマッチングする測定すべき中間データセットを取得することと、
前記混合マッチングデータセットにおける測定すべき中間データセットを削除して、前記検索テキストデータとマッチングする検索中間データセットを取得することであって、前記検索中間データセットの優先度は前記測定すべき中間データセットよりも低いことと
を含む、請求項5に記載の音声検索方法。
(請求項8)
前記検索データセットは、優先度レベルが順次下がる、テキストデータと検索テキストデータと修正テキストデータとを含み、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、
前記テキストデータと前記混合マッチングデータセットをマッチングして、前記テキストデータとマッチングする測定すべき中間データセットを取得することと、
前記混合マッチングデータセットにおける測定すべき中間データを削除して、段階サブセットを取得することと、
前記検索テキストデータと前記段階サブセットとをマッチングして、前記検索テキストデータとマッチングする検索中間データセットを取得することと、
前記段階サブセットにおける検索中間データセットを削除して、前記修正テキストデータとマッチングする修正中間データセットを取得し、前記測定すべき中間データセットと前記検索中間データセットと前記修正中間データセットとの優先度順位が順次下がるものであることと
を含む、請求項5に記載の音声検索方法。
(請求項9)
音声データを取得するように配置される収集ユニットと、
前記音声データを認識して、対応するテキストデータを取得するように配置される認識ユニットと、
前記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得するように配置されるマッチングユニットと、
前記マッチングすべきデータセットに基づいて、前記混合マッチングデータセットを選別し、前記音声データに対応する検索結果セットを取得するように配置される処理ユニットと
を含んでなる音声検索装置。
(請求項10)
前記マッチングユニットは、
前記テキストデータをデータ検索して、検索データセットを取得するように配置される検索モジュールと、
前記検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得するように配置されるマッチングモジュールと
を含む、請求項9に記載の音声検索装置。
(請求項11)
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリと
を含んでなり、
前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶しており、前記命令は、前記少なくとも1つのプロセッサによって実行されて、請求項1~8のいずれか一項に記載の方法を前記少なくとも1つのプロセッサに実行させることを特徴とする、電子機器。
(請求項12)
請求項1~8のいずれか一項に記載の方法をコンピュータに実行させるためのコンピュータ命令が記憶されていることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
(請求項13)
プロセッサによって実行されると、請求項1~8のいずれか一項に記載の方法を実現するコンピュータプログラム。
Claims (10)
- 音声データを取得することと、
前記音声データを認識して、対応するテキストデータを取得することと、
前記テキストデータをデータ検索して、検索データセットを取得することと、
前記検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得することと、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することと、
前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することと
を含んでなる音声検索方法。 - 前記テキストデータをデータ検索して、検索データセットを取得することは、
前記テキストデータの測定すべきピンインデータを取得することと、
前記測定すべきピンインデータと同じ発音を持つテキストデータを検索して、検索テキストデータを取得することと、
前記テキストデータ及び前記検索テキストデータを組み合わせて、検索データセットを取得することと
を含む、請求項1に記載の音声検索方法。 - 前記テキストデータをデータ検索して、検索データセットを取得することは、
前記テキストデータの測定すべきピンインデータを取得することと、
前記測定すべきピンインデータと同じ発音を持つ検索テキストデータを確定して、検索テキストデータを取得することと、
前記測定すべきピンインデータに対してデータ修正を行い、修正ピンインデータを取得することと、
前記修正ピンインデータと同じ発音を持つテキストデータを検索して、修正テキストデータを取得することと、
前記テキストデータ、前記修正テキストデータ及び前記検索テキストデータを組み合わせて、検索データセットを取得することと
を含む、請求項1に記載の音声検索方法。 - 前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することは、
各中間データセットにおける各中間データをピンインのアルファベットの順で並べ替えて、異なる並べ替えデータセットを取得することと、
各並べ替えデータセットに対して、当該並べ替えデータセットに同じピンインを持つ複数の並べ替えデータがあると判断したことに応答して、前記複数の並べ替えデータを、前記マッチングすべきデータセットのうち、各並べ替えデータと対応するデータの順で並べ替えることと、
各中間データセットの優先度レベルに応じて、すべての並べ替えデータセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することと
を含む、請求項1に記載の音声検索方法。 - 前記検索データセットは、テキストデータ及び前記テキストデータよりも優先度が低い検索テキストデータを含み、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、
前記テキストデータと前記混合マッチングデータセットをマッチングして、前記テキストデータとマッチングする測定すべき中間データセットを取得することと、
前記混合マッチングデータセットにおける測定すべき中間データセットを削除して、前記検索テキストデータとマッチングする検索中間データセットを取得することであって、前記検索中間データセットの優先度は前記測定すべき中間データセットよりも低いことと
を含む、請求項1に記載の音声検索方法。 - 前記検索データセットは、優先度レベルが順次下がる、テキストデータと検索テキストデータと修正テキストデータとを含み、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、
前記テキストデータと前記混合マッチングデータセットをマッチングして、前記テキストデータとマッチングする測定すべき中間データセットを取得することと、
前記混合マッチングデータセットにおける測定すべき中間データを削除して、段階サブセットを取得することと、
前記検索テキストデータと前記段階サブセットとをマッチングして、前記検索テキストデータとマッチングする検索中間データセットを取得することと、
前記段階サブセットにおける検索中間データセットを削除して、前記修正テキストデータとマッチングする修正中間データセットを取得し、前記測定すべき中間データセットと前記検索中間データセットと前記修正中間データセットとの優先度順位が順次下がるものであることと
を含む、請求項1に記載の音声検索方法。 - 音声データを取得するように配置される収集ユニットと、
前記音声データを認識して、対応するテキストデータを取得するように配置される認識ユニットと、
前記テキストデータをデータ検索して、検索データセットを取得し、前記検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得するように配置されるマッチングユニットと、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得し、前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得するように配置される処理ユニットと
を含んでなる音声検索装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリと
を含んでなり、
前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶しており、前記命令は、前記少なくとも1つのプロセッサによって実行されて、請求項1~6のいずれか一項に記載の方法を前記少なくとも1つのプロセッサに実行させることを特徴とする、電子機器。 - 請求項1~6のいずれか一項に記載の方法をコンピュータに実行させるためのコンピュータ命令が記憶されていることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
- プロセッサによって実行されると、請求項1~6のいずれか一項に記載の方法を実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110586407.7A CN113326279A (zh) | 2021-05-27 | 2021-05-27 | 语音搜索方法和装置、电子设备、计算机可读介质 |
CN202110586407.7 | 2021-05-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022103161A JP2022103161A (ja) | 2022-07-07 |
JP7403571B2 true JP7403571B2 (ja) | 2023-12-22 |
Family
ID=77421909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022056210A Active JP7403571B2 (ja) | 2021-05-27 | 2022-03-30 | 音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220269722A1 (ja) |
EP (1) | EP4020951A3 (ja) |
JP (1) | JP7403571B2 (ja) |
KR (1) | KR20220054753A (ja) |
CN (1) | CN113326279A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536764A (zh) * | 2021-09-07 | 2021-10-22 | 湖南双菱电子科技有限公司 | 口令信息匹配方法、计算机设备和计算机可读存储介质 |
KR102708215B1 (ko) * | 2023-11-21 | 2024-09-19 | 길준석 | 기술 정보를 연계, 가공 및 융합하여 기술 조합 정보를 제공하는 시스템 및 이의 제어 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271117A (ja) | 2008-04-30 | 2009-11-19 | Mitsubishi Electric Corp | 音声検索装置および音声検索方法 |
US20140379335A1 (en) | 2013-06-21 | 2014-12-25 | Tencent Technology (Shenzhen) Company Limited | Method and device of matching speech input to text |
JP2018536905A (ja) | 2015-11-06 | 2018-12-13 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 発話認識方法及び装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5008248B2 (ja) * | 2003-06-26 | 2012-08-22 | シャープ株式会社 | 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体 |
US20070074254A1 (en) * | 2005-09-27 | 2007-03-29 | Microsoft Corporation | Locating content in a television environment |
US9104244B2 (en) * | 2009-06-05 | 2015-08-11 | Yahoo! Inc. | All-in-one Chinese character input method |
WO2011061556A1 (en) * | 2009-11-20 | 2011-05-26 | Kim Mo | Intelligent search system |
US8498864B1 (en) * | 2012-09-27 | 2013-07-30 | Google Inc. | Methods and systems for predicting a text |
CN103870000B (zh) * | 2012-12-11 | 2018-12-14 | 百度国际科技(深圳)有限公司 | 一种对输入法所产生的候选项进行排序的方法及装置 |
US20150057994A1 (en) * | 2013-08-20 | 2015-02-26 | Eric Hong Fang | Unified Mobile Learning Platform |
CN106933561A (zh) * | 2015-12-31 | 2017-07-07 | 北京搜狗科技发展有限公司 | 语音输入方法和终端设备 |
CN107707745A (zh) * | 2017-09-25 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
CN111198936B (zh) * | 2018-11-20 | 2023-09-15 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
CN110310634A (zh) * | 2019-06-19 | 2019-10-08 | 广州小鹏汽车科技有限公司 | 车载语音推送方法、终端、服务器以及推送系统 |
CN110428822B (zh) * | 2019-08-05 | 2022-05-03 | 重庆电子工程职业学院 | 一种语音识别纠错方法及人机对话系统 |
CN110880316A (zh) * | 2019-10-16 | 2020-03-13 | 苏宁云计算有限公司 | 一种音频的输出方法和系统 |
CN112231440A (zh) * | 2020-10-09 | 2021-01-15 | 安徽讯呼信息科技有限公司 | 一种基于人工智能的语音搜索方法 |
CN112767925B (zh) * | 2020-12-24 | 2023-02-17 | 贝壳技术有限公司 | 语音信息识别方法及装置 |
CN112818089B (zh) * | 2021-02-23 | 2022-06-03 | 掌阅科技股份有限公司 | 文本注音方法、电子设备及存储介质 |
-
2021
- 2021-05-27 CN CN202110586407.7A patent/CN113326279A/zh active Pending
-
2022
- 2022-03-30 JP JP2022056210A patent/JP7403571B2/ja active Active
- 2022-04-15 KR KR1020220046654A patent/KR20220054753A/ko unknown
- 2022-05-13 US US17/744,120 patent/US20220269722A1/en active Pending
- 2022-05-16 EP EP22173454.4A patent/EP4020951A3/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271117A (ja) | 2008-04-30 | 2009-11-19 | Mitsubishi Electric Corp | 音声検索装置および音声検索方法 |
US20140379335A1 (en) | 2013-06-21 | 2014-12-25 | Tencent Technology (Shenzhen) Company Limited | Method and device of matching speech input to text |
JP2018536905A (ja) | 2015-11-06 | 2018-12-13 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 発話認識方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2022103161A (ja) | 2022-07-07 |
CN113326279A (zh) | 2021-08-31 |
EP4020951A2 (en) | 2022-06-29 |
EP4020951A3 (en) | 2022-11-02 |
US20220269722A1 (en) | 2022-08-25 |
KR20220054753A (ko) | 2022-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7403571B2 (ja) | 音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム | |
US10185772B2 (en) | Query selection method and system | |
RU2589873C2 (ru) | Способ и устройство обработки ввода | |
CN114610845B (zh) | 基于多系统的智能问答方法、装置和设备 | |
WO2023024975A1 (zh) | 文本处理方法、装置和电子设备 | |
WO2016095645A1 (zh) | 笔画输入方法、装置和系统 | |
CN111198936B (zh) | 一种语音搜索方法、装置、电子设备及存储介质 | |
CN112506864B (zh) | 文件检索的方法、装置、电子设备及可读存储介质 | |
CN114238689A (zh) | 视频生成方法、装置、电子设备、存储介质和程序产品 | |
CN114595686A (zh) | 知识抽取方法、知识抽取模型的训练方法及装置 | |
CN117539990A (zh) | 一种问题处理方法、装置、电子设备和存储介质 | |
CN114816578A (zh) | 基于配置表的程序配置文件生成方法、装置及设备 | |
CN117971698A (zh) | 测试用例生成方法、装置、电子设备和存储介质 | |
CN112527819B (zh) | 通讯录信息检索方法、装置、电子设备及存储介质 | |
CN111488464B (zh) | 实体属性处理方法、装置、设备及介质 | |
US11244000B2 (en) | Information processing apparatus and non-transitory computer readable medium storing program for creating index for document retrieval | |
CN115328898A (zh) | 一种数据处理方法、装置、电子设备及介质 | |
CN111309884A (zh) | 机器人对话方法、装置、介质及电子设备 | |
CN112560466A (zh) | 链接实体关联方法、装置、电子设备和存储介质 | |
CN117851575B (zh) | 一种大语言模型问答优化方法、装置、电子设备及存储介质 | |
CN118313383B (zh) | 基于语言模型的命名实体识别方法及装置 | |
CN113553832B (zh) | 文字处理方法和装置、电子设备以及计算机可读存储介质 | |
CN114398321A (zh) | 一种展示文件夹的方法、装置及电子设备 | |
CN111078824A (zh) | 一种减少Lucene无字典n-gram切词占用存储空间的方法 | |
CN114625833A (zh) | 语音搜索方法、搜索装置、可读存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7403571 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |