HUE035388T2

HUE035388T2 - Audiójel osztályozó eljárás és készülék

Info

Publication number: HUE035388T2
Application number: HUE13891232A
Authority: HU
Inventors: Zhe Wang
Original assignee: Huawei Tech Co Ltd
Priority date: 2013-08-06
Filing date: 2013-09-26
Publication date: 2018-05-02
Also published as: HK1219169A1; SG11201600880SA; US11756576B2; KR20170137217A; JP6162900B2; AU2017228659B2; ES2909183T3; MY173561A; EP3667665B1; EP4057284A2; EP3029673B1; CN106409313B; US10090003B2; JP2018197875A; EP4057284A3; KR20160040706A; US20200126585A1; JP6392414B2; AU2013397685A1; US11289113B2

Claims

Audiojei osztályozd eljárás és kèszüiêk Szabadalmi igénypontok

1, Audiójel osztályozó eijárás, amely tartalmazza: egy aktuális audíó ketet hang aktivitása szerint annak meghtJtározásót (löl), hogy meg kell-e kapni az aktuális audio- keret frekvenciaspektrum fluktuációját és a frekvenciaspektrum fluktuációt el kell-e tárolni egy frekvenciaspektrum fluktuáció memóriában, ahol a frekvenciaspektrum fluktuáció egy audiójel frekvencia.-spektrumának energia fluktuációját jelöli; attól függően, hogy at audio keret perkusszív zene-e, a frekvenciaspektrum fluktuáció memóriában tárolt frekvenciaspektrum fluktuációk frissítését (Î02); és 32 aktuális adatkeret osztályozását (.103) beszéd keretként vagy zene keretként, a frekvenciaspektrum fluktuáció memóriában tárolt frekvenciaspektrum fluktuáció egy részének vagy összes hatékony adatának statisztikája szerint.
2, Az 1. igénypont szerinti eljárás, ahol annak a meghatározása, hogy egy aktuális audió keret hang aktivitása szerint meg keil-e a kapni az aktuális audio keret frekvenciaspektrum fluktuációját és a frekvenciaspektrum fluktuációt el kell-e tárolni egy frekvenciaspektrum fluktuáció memóriában, tartalmazza: ha az aktuális audió keret egy aktív keret, úgy az aktuális audió keret frekvenciaspektrum fluktuációjának eltárolását a frekvenciaspektrum fluktuáció memóriában,
3, Az 1, igénypont szerinti eljárás, aboi annak a meghatározása, hogy egy aktuális audió keret hang aktivitása szerint meg keli-e a kapni az aktuális audió keret frekvenciaspektrum fluktuációját és a frekvenciaspektrum fluktuációt el kell-e tárolni egy frekvenciaspektrum fluktuáció memóriában, tartalmazza: ha az aktuális audió keret egy aktív audió keret és az aktuális audíö keret nem tartozik egy energiarohamhoz, az aktuális audio keret frekvenciaspektrum fluktuációjának eltárolását a frekvenciaspektrum fluktuáció memóriában.
4, Az .1. igénypont szerinti eljárás, ahol annak a meghatározása, hogy egy aktuális audio keret hang aktivitása szerint meg kell-e a kapni az aktuális audio keret frekvenciaspektrum fluktuációját és a frekvenciaspektrum fluktuációt el kell-e tárolni egy frekvenciaspektrum fluktuáció memóriában, tartalmazza: ha az aktív audió keret egy aktív audió keret és egyetlen egymás után következő keret sem tartalmazza az aktuális audio keretet és az aktuális audio keret egy történeti kerete egy energiarohamhoz tartozik, az aktuális audió keret frekvenciaspektrum fluktuációjának eltárolását a frekvenciaspektrum fluktuáció memóriában.
5, Az 1-4. igénypontok bármelyike szerinti eljárás, ahol attól függően, hogy az aktuális audió keret perkusszív zene-e, a frekvenciaspektrum fluktuáció tárolóban tárolt frekvenciaspektrum fluktuációk frissítése tartalmazza: ha az aktuális audiö keret perkusszív zenéhez tartozik, a frekvenciaspektrum fluktuáció memóriában tarolt frekvenciaspektrum fluktuáció értékek módosítását. δ. Az í-S. igénypontok bármelyike szerinti eljárás, ahoi a frekvenciaspektrum fluktuáció memóriában táróit frekvenciaspektrum fluktuációk hatékony adatai egy részének vagy egészének e statisztikája szerint az az osztályozás, hogy az aktuális sudló keret: egy beszéd keret vagy egy zene keret., tartalmazza: a frekvenciaspektrum fluktuáció memóriában táróit frekvenciaspektrum fluktuációk hatékony adatai egy részének vagy egészének egy átlagos értekének a megszerzését; és ha a frekvenciaspektrum fluktuációk hatékony adatának megszerzett átlagos értéke kielégít egy zene osztályozási feltételt, úgy az aktuális audió keret osztályozását zene keretként, egyébként az aktuális audió keret osztályozását beszéd keretként,
7, Az i-5. igénypontok bármelyike szerinti eíjárás, ameiy tartalmazza továbbá; egy frekvenciaspektrum nagyfrekvenciás sávi csúcsosság-tartalmának, egy frekvenciaspektrum korrelációs mértéknek, és az aktuális audió keret maradék energia dőlés lineáris előrebecslésének megkapását, áltól a frekvenciaspektrum nagyfrekvenciás sávi csúcsosság-tartaiom csúcsokat vagy energia csúcsokat jelent az aktuális audió keret egy frekvenciaspektrumának egy nagyfrekvenciás sávjában; a frekvenciaspektrum korrelációs mérték az aktuális audio keret egy jei harmonikus struktúrájának szomszédos keretei közötti stabilitást jelenti; és a maradék energia dőlés lineáris előrebecslése egy olyan mértéket jelent, amekkorára az audiójel lineáris előrebecslést maradék energiája megváltozik, ahogy a lineáris előrebecslést sorrend nő; és az aktuális audió keret hang aktivitása szerint annak meghatározását, hogy el keli-e tárolni a frekvenciaspektrum nagyfrekvenciás sáv csúcsosságot, a frekvenciaspektrum korreláfilós mértéket és a lineáris"előrebecslést maradék energia dőlést egy memóriában, aho! az audió keret frekvenciaspektrum fluktuáció memóriában táróit frekvenciaspektrum fluktuációk hatékony adatat egy részének vagy egészének a statisztikája szerinti osztályozása tartalmazza: a tárolt frekvenciaspektrum fluktuációk hatékony adatai átlagos értékének, a tárolt frekvenciaspektrum nagy-frekvenciás .sás' csúcsosság hatékony adatai átlagos értékének, a tárolt frekvenciaspektrum korrelációs mértékek hatékony adata átlagos értékének, és a tároh lineáris előrebecslés! maradék energia dőlések hatékony értéke varianciájánsk megkapását külön-köiön; és ha a következő feltételek közül egy teljesül, úgy az aktuális audió keret osztályozását zene keretként; egyébként az aktuális audió keret osztályozását beszéd keretként; a frekvenciaspektrum fiuktuációk hatékony adatának átlagos értéke kisebb, mint egy első küszöbérték; vagy a frekvenciaspektrum nagyfrekvenciás sáv csúcsosság hatékony adatának az átlagos értéke nagyobb, mint egy második küszöbérték; vagy a frekvenciaspektrum korrelációs mérték hatékony adatának átlagos értéke nagyobb, mint egy harmadik küszöbérték; vagy a lineáris eiőrebecslési maradék energia dőlések hatékony adatának varfanctája kisebb, mint egy negyedik küszöbérték,
8. Audioiéi osztttlyozö berendezés, ahol a berendezés úgy van konfigurálva, hogy bemeneti audiójelet osztályozzon, és tartalmaz: tároiás meghatározó egységes (1301),. ameiy úgy van konfigurálva, hogy egy aktuális audió keret hang aktivitása szerint meghatározza., hogy meg keíl-e kapni az aktuális audio keres frekvenciaspektrum fluktuációját és a frekvenciaspektrum fluktuációt el kell-e tárolni egy frekvenciaspektrum fluktuáció memóriában, aho! a frekvenciaspektrum íiuktuáció egy audiójei frekvenciaspektrumának energia fluktuációját jelöíi; memóriát (1302), amely úgy van konfigurálva, hogy tárolja a frekvenciaspektrum fluktuációt, ha a tárolás meghatározó egység olyan eredményt ad ki, hogy a frekvenciaspektrum fluktuációt el kell tárolni; frissitőegységet (1304), amely úgy van konfigurálva, hogy attól függően, hogy az audió keret perkusszív zene-e, frissítse a frekvenciaspektrum fluktuáció memóriában tárolt frekvenciaspektrum fluktuációkat; és osztályozó egységet (1303), amely úgy van konfigurálva, hogy az aktuális adatkeretet beszéd keretként vagy zene keretként osztályozza a frekvenciaspektrum fluktuáció memóriában táróit frekvenciaspektrum fluktuáció egy részének vagy összes hatékony adatának statisztikája szerint, §, A 8, igénypont szerinti berendezés, ahol a tárolás meghatározó egység kifejezetten úgy van konfigurálva, hogy: ha az került meghatározásra, hogy az aktuális audio keret egy aktiv keret, olyan eredményi adjon ki, hogy az aktuális audió keret frekvenciaspektrum fluktuációját e! keíí táróink 10, A 8. igénypont szerinti berendezés, ahoi a tárolás meghatározó egység kifejezetten úgy van konfigurálva, hogy; ha az kerüit meghatározásra, hogy az aktuális audió keret egy aktív audió keret és az aktuáiis audio keret nem tartozik egy energiarohamhoz, olyan eredményt adjon ki, hogy az aktuális audió keret frekvenciaspektrum fluktuációját el keli tárolni. 11, A 3. igénypont szerinti berendezés, ahoi a tárolás meghatározó egység kifejezetten úgy van konfigurálva, hogy: ha az került meghatározásra, hogy az aktuális audió keret egy aktiv keret, és több egymást követő keret egyike sem tartalmazza az aktuális áudió keretet, és az aktuális audió keret egy történeti kerete egy energiarohamhoz tartozik, olyan eredményt adjon ki, hogy az aktuális audio keret frekvenciaspektrum fluktuációját el kei! tárolni. 12, A 8-l.f. igénypont szerinti berendezés, aho! a frlssítoegység kifejezetten úgy van konfigurálva, hogy ha az aktuális audió keret perkusszív zenéhez tartozik, módosítsa a frekvenciaspektrum fluktuáció memóriában táróit frekvenciaspektrum fluktuációk értékeit, 13, A 8-12. igénypont szerinti berendezés, ahol az osztályozó egység tartalmaz: egy számolóegységet, ameiy úgy van konfigurálva, hogy megkapja a memóriában táróit frekvenciaspektrum fluktuációk hatékony adatai egy részének vagy egészének átíagos értékér; és egy meghatározó egységet, amely úgy van konfigurálva, hogy összehasonlítsa a frekvenciaspektrum fluktuációk hatékony adatának átlagos értékét egy zene osztályozási feltéteíiel; és ha a frekvenciaspektrum fluktuációk hatékony adatának átlagos értéke kielégíti a zene osztályozás feltételt, az aktuális audio keretet zene keretként osztályozza; egyébként az aktuális audió keretet beszéd keretként osztályozza.
14, A S-12. igénypont szerinti berendezés, amely tartalmaz továbbá;. paraméter megszerző egységet, amely úgy van konfigurálva, hogy megkapjon egy frekvenciaspektrum nagy-frekvenciás sáv csúcsosságot, egy frekvenciaspektrum korrelációs mértéket, egy hangzás paramétert, és az aktuális audio keret lineáris eiőrebecsiési maradék energia dőlését, ahol a frekvenciaspektrum nagyfrekvenciás sávi csúcsosságtartalom csúcsokat vagy energia csúcsokat jelent az aktuális audió keret egy frekvenciaspektrumának egy nagyfrekvenciás sávjában; a frekvenciaspektrum korrelációs mérték az aktuális audió keret egy jel harmonikus struktúrájának szomszédos keretei közötti stabilitást jelenti; és á maradék energia dőiés lineáris előrebecslése egy olyan mértéket jelent, amekkorára az audiójef lineáris eiőrebecsiési maradék energiája megváltozik, ahogy 3 iineáris eiőrebecsiési sorrend nő; ahol a tárolás meghatározó egység továbbá úgy van konfigurálva, hogy az aktuális audió keret hang aktivitása alapján meghatározza, hogy el kell-e tárölni a frekvenciaspektrum nagyfrekvenciás sáv csúcsosságot, a frekvenciaspektrum korrelációs mértéket és a iineáris eiőrebecsiési maradvány energia dőlést memóriákban; à memória úgy van továbbá konfigurálva, hogy; ha a tárolás meghatározó egység olyan eredményt ad ki, hogy a frekvenciaspektrum nagyfrekvenciás sáv csúcsosságot, a frekvenciaspektrum korrelációs mértéket, és a lineáris eiőrebecsiési maradék energia dőlést el kell tárolni, úgy a frekvenciaspektrum nagyfrekvenciás sáv csúcsosságoi, a frekvenciaspektrum korrelációs mértéket és a iineáris eiőrebecsiési maradék energia dőlést eltárolja; és az osztályozó egység kifejezetten úgy vsn konfigurálva, bogy megkapja a tárolt frekvenciaspektrum fluktuációk hatékony adatainak statisztikáit, a tárolt frekvenciaspektrum nagyfrekvenciás sáv csúcsosság hatékony adatainak statisztikáit, a tárolt frekvenciaspektrum korrelációs mértékek hatékony adatainak statisztikáit, és a tárolt lineáris eiőrebecsiési maradék energia dőiések hatékony adatainak statisztikáit, és az audió keretet beszéd keretként vagy zene keretként osztályozza a hatékony adatok statisztikái alapján, 15. A 14, igénypont szerinti berendezés, ahol az osztályozó egység tartalmaz: egy számolóegységet, ameiy úgy van konfigurálva, hogy megkapja a tárolt frekvenciaspektrum fluktuációk hatékony adatainak átlagos értekét, a tárolt frekvenciaspektrum nagyfrekvenciás sáv csúcsosság hatékony adatainak adagos értékét, a tárolt frekvenciaspektrum korrelációs mérték hatékony adatainak átlagos értékét, és a táróit iineáris eiőrebecsiési maradék energia dőiések hatékony adatainak átlagos értékét, és a táróit linearis eiőrebecsiési maradék energia dőiések hatékony adatainak varianciáját, kúlön-külön; és egy meghatározó egységet, amely úgy van konfigurálva, hogy: ha a kővetkező feltételek egyike teljesül, osztályozza az aktuális audió keretet zene keretként; egyébként az aktuális audio keretet beszéd keretként osztályozza; a frekvenciaspektrum fluktuációk hatékony adatának átlagos érteke kisebb, mint egy első küszöbérték; vagy a frekvenciaspektrum nagyfrekvenciás sáv csúcsosság hatékony adatának az átlagos értéke nagyobb, mint egy második küszöbérték; vagy 3 frekvenciaspektrum korrelációs mérték hatékony adatának átlagos értéke nagyobb, mint egy harmadik küszöbérték; vagy a lineáris eiörebecslésí maradék energia dőíések hatékony adatának varíancíájs kisebb, mint egy negyedik küszöbérték.