DE60214409T2 - Verfahren und vorrichtung zur zweiphasen-grundfrequenzdetektion - Google Patents

Verfahren und vorrichtung zur zweiphasen-grundfrequenzdetektion Download PDF

Info

Publication number
DE60214409T2
DE60214409T2 DE60214409T DE60214409T DE60214409T2 DE 60214409 T2 DE60214409 T2 DE 60214409T2 DE 60214409 T DE60214409 T DE 60214409T DE 60214409 T DE60214409 T DE 60214409T DE 60214409 T2 DE60214409 T2 DE 60214409T2
Authority
DE
Germany
Prior art keywords
fundamental frequency
autocorrelation
error range
range
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60214409T
Other languages
English (en)
Other versions
DE60214409D1 (de
Inventor
Doill Jung
Hunseok Seo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amusetec Co Ltd
Original Assignee
Amusetec Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amusetec Co Ltd filed Critical Amusetec Co Ltd
Publication of DE60214409D1 publication Critical patent/DE60214409D1/de
Application granted granted Critical
Publication of DE60214409T2 publication Critical patent/DE60214409T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft ein Grundfrequenz-Ermittlungsverfahren und eine -Vorrichtung, und im Speziellen ein Zweiphasen-Grundfrequenz-Ermittlungsverfahren und eine Vorrichtung, um einen Fehlerbereich für ein Grundfrequenz-Ermittlungsergebnis zu reduzieren, indem sequenziell eine Frequenzanalyse und eine Autokorrelation mit Bezug auf ein extern eingegebenes digitales Signal durchgeführt wird.
  • STAND DER TECHNIK
  • Die Technologie, um die Grundfrequenz eine Note, welche von einem Musikinstrument gespielt wird, oder die Grundfrequenz einer Stimme einer Person in Echtzeit zu ermitteln, wurde entwickelt und erforscht, um Ausführungsinformationsdaten über die Note des Musikinstruments oder der Stimme der Person zu extrahieren, oder um Echtzeit-Musik in Konzerten zu spielen. Ein bekanntes Verfahren zur Ermittlung einer Grundfrequenz ist in dem Patentdokument US-A-6124544 offenbart.
  • Zu normalerweise verwendeten Verfahren, um eine Grundfrequenz zu ermitteln, zählen ein Verfahren zur Analyse einer Frequenz eines digitalen Signals einer gespielten Note oder einer Stimme; ein Verfahren des Berechnens einer Spitzenwert- oder Nulldurchgangs-Periode einer Wellenform, um eine Periode einer sich wiederholenden Welle zu berechnen; und ein Verfahren, welches die Autokorrelation einer Wellenformn benutzt.
  • Bei dem Frequenzanalyse-Verfahren ist ein Fehler in einem Hochfrequenz-Band derselbe wie ein Fehler in einem Niedrigfrequenz-Band. Wenn jedoch das Frequenzanalyse-Verfahren verwendet wird, um eine Grundfrequenz eines Tons zu ermitteln, der von einem Musikinstrument erzeugt wird, steigt in dem Niedrigfrequenz-Band, in dem ein Frequenzintervall zwischen Grundfrequenzen schmäler ist, als in dem Hochfrequenz-Band, die Wahrscheinlichkeit für das Fehlschlagen der Grundfrequenz-Ermittlung aufgrund eines Fehlers. In dem Verfahren, welches die Autokorrelation verwendet, ist aufgrund der Charakteristika der Berechnung ein Fehler in dem Hochfrequenz-Band groß.
  • In dem Verfahren der Berechnung einer Wertspitzen- oder Nulldurchgangs-Periode ist es schwierig, eine Periode richtig zu berechnen, beispielsweise aufgrund von Rauschen, und daher ist das Ergebnis dieses Verfahrens ungenau.
  • OFFENBARUNG DER ERFINDUNG
  • Um die oben beschriebenen Probleme zu lösen, ist es ein Ziel der vorliegenden Erfindung, wie sie in den beigefügten Ansprüchen beansprucht ist, ein Zweiphasen-Grundfrequenz-Ermittlungsverfahren und eine -Vorrichtung bereitzustellen, um eine Grundfrequenz richtig zu ermitteln, indem auf ein extern eingespeistes digitales Signal eine Frequenzanalyse durchgeführt wird, und dann in einem vorbestimmten Zeitbereich, der gemäß des Ergebnisses der Frequenzanalyse ausgewählt wird, eine Autokorrelation des digitalen Signals durchgeführt wird.
  • Um das obige Ziel der vorliegenden Erfindung zu erzielen, wird ein Zweiphasen-Verfahren zur Ermittlung einer Grundfrequenz bereitgestellt, welches einen ersten Schritt des Zerlegens eines extern eingespeisten digitalen Signals in Frequenzkomponenten, und das Ermitteln eines ersten Grundfrequenz-Kandidaten auf Basis der Frequenzkomponenten; einen zweiten Schritt des Vergleichens eines Fehlerbereichs für den ersten Grundfrequenz-Kandidaten mit einem Fehlerbereich für das Ergebnis einer Durchführung einer Autokorrelation über einen Autokorrelations-Bereich, der unter Verwendung des Fehlerbereichs des ersten Grundfrequenz-Kandidaten berechnet ist; und einen dritten Schritt des Durchführens einer Autokorrelation des eingespeisten digitalen Signals in einem vorbestimmten Zeitbereich, wenn der Fehlerbereich für das Ergebnis der Autokorrelation kleiner als der oder gleich dem Fehlerbereich für den ersten Grundfrequenz-Kandidaten ist, aufweist, wodurch eine Grundfrequenz ermittelt wird.
  • Es wird auch eine Zweiphasen-Grundfrequenz-Ermittlungsvorrichtung bereitgestellt, welche einen Frequenzanalysator zum Zerlegen eines extern eingespeisten digitalen Signals in Frequenzkomponenten und Ermitteln eines ersten Grundfrequenz-Kandidaten auf Basis der Frequenzkomponenten; eine Fehlerbereichs-Vergleichvorrichtung zum Vergleichen eines Fehlerbereichs für den ersten Grundfrequenz-Kandidaten mit einem Fehlerbereich für das Ergebnis einer Durchführung einer Autokorrelation über einen Autokorrelations-Bereich, der unter Verwendung des Fehlerbereiches für den ersten Grundfrequenz-Kandidaten berechnet wurde; einen Autokorrelations-Rechner zum Durchführen einer Autokorrelation des digitalen Signals in einem vorbestimmten Zeitbereich, wenn der Fehlerbereich für das Ergebnis der Autokor relation kleiner als der oder gleich dem Fehlerbereich für den ersten Grundfrequenz-Kandidaten ist, um einen zweiten Grundfrequenz-Kandidaten zu ermitteln; einen Grundfrequenz-Bestimmer zum Bestimmen einer Grundfrequenz, basierend auf dem Fehlerbereich für den ersten Grundfrequenz-Kandidaten und einem Fehlerbereich für den zweiten Grundfrequenz-Kandidaten; und eine Ergebnis-Ausgabeinheit zum Ausgeben der Grundfrequenz, die von dem Grundfrequenz-Bestimmer bestimmt wurde, enthält.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein schematisches Blockdiagramm einer Zweiphasen-Grundfrequenz-Ermittlungsvorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung.
  • 2 ist ein Flussdiagramm eines Zweiphasen-Verfahrens zur Ermittlung einer Grundfrequenz gemäß einer Ausführungsform der vorliegenden Erfindung.
  • 3A bis 3D sind Signalverarbeitungs-Diagramme, um das Zweiphasen-Verfahren zur Ermittlung einer Grundfrequenz gemäß der Ausführungsform der vorliegenden Erfindung zu erläutern.
  • BESTES VERFAHREN, UM DIE ERFINDUNG DURCHZUFÜHREN
  • Im Folgenden werden hierin Ausführungsformen eines Zweiphasen-Verfahrens zur Ermittlung einer Grundfrequenz und einer Vorrichtung gemäß den Ausführungsformen der vorliegenden Erfindung detailliert mit Bezugnahme auf die beigefügten Zeichnungen beschrieben.
  • 1 ist ein schematisches Blockdiagramm einer Zweiphasen-Grundfrequenz-Ermittlungsvorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung. Bezug nehmend auf 1 enthält die Zweiphasen-Grundfrequenz-Ermittlungsvorrichtung eine Musikinformations-Eingabeeinheit 10, einen Grundfrequenz-Existenz/Nichtexistenz-Ermittler 20, einen Frequenzanalysator 30, eine Fehlerbereichs-Vergleichsvorrichtung 40, einen Autokorrelationsrechner 50, einen Grundfrequenz-Bestimmer 60, und eine Ergebnisausgabeeinheit 70.
  • Die Musikinformations-Eingabeeinheit 10 wandelt einen analogen Signaleingang durch ein Mikrofon in ein digitales Signal, oder empfängt ein digitales Signal, welches durch eine Umwandlung erzeugt wurde.
  • Der Grundfrequenz-Existenz/Nichtexistenz-Ermittler 20 fühlt die Stärke des durch die Musikinformations-Eingabeeinheit 10 empfangenen Signals ab, um zu ermitteln, ob eine Grundfrequenz existiert. In anderen Worten, wenn der Schalldruckpegel des durch die Musikinformations-Eingabeeinheit 10 empfangenen Signals höher ist, als der Schalldruckpegel des Rauschens, welches unter Einbeziehung der Umgebungsbedingungen vorbestimmt ist, wird angenommen, dass der Eingang ein Signal eines Musiktons ist.
  • Der Frequenzanalysator 30 zerlegt digitale Töne, welche von den Grundfrequenz-Existenz/Nichtexistenz-Ermittler 20 eingespeist werden, in Frequenzkomponenten und ermittelt einen ersten Grundfrequenz-Kandidaten auf Basis der Werte der Frequenz-Komponenten. Ein Verfahren zum Ermitteln einer Grundfrequenz unter Verwendung einer Frequenzanalyse ist eine bereits bekannt Technologie und kann auf verschiedene Arten durchgeführt werden. Zum Beispiel wird in einem Aspekt, nachdem die Positionen der Wertspitzen ermittelt werden, indem Frequenz-Komponenten-Werte analysiert werden, ein Intervall zwischen den Wertspitzen als ein Grundfrequenz-Kandidat ermittelt. In einem weiteren Aspekt wird die Position der maximalen Wertspitze unter einer Vielzahl von Wertspitzen als ein Grundfrequenz-Kandidat ermittelt. Indes wird, um digitale Töne in Frequenzkomponenten zu zerlegen, normalerweise die schnelle Fourier-Transformation (FFT) verwendet, es kann jedoch ein anderes Verfahren, wie etwa eine Wavelet-Transformation, verwendet werden.
  • Die Fehlerbereichs-Vergleichsvorrichtung 40 vergleicht einen Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten, der von dem Frequenz-Analysator 30 ermittelt wird, mit einem Fehlerbereich R2 für das Ergebnis der Durchführung einer Autokorrelation über einem Autokorrelationsbereich L1, der unter Verwendung des Fehlerbereichs R1 berechnet wird. Hier ist der Fehlerbereich R1 der Autokorrelations-Bereich L1, und der Fehlerbereich R2 in Echtzeit berechnet, oder im Voraus berechnet und einzeln gespeichert.
  • Wenn der Fehlerbereich R2 für das Autokorrelationsergebnis geringer ist als der, oder gleich ist dem Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten, führt der Autokorrelations-Rechner 50 eine Autokorrelation des digitalen Signals in einem vorbestimmten Zeitbereich durch, um einen zweiten Grundfrequenz-Kandidaten zu ermitteln. Hier wird der vorbestimmte Zeitbereich gemäß dem Autokorrelations-Bereich L1 ermittelt, der von der Fehlerbereichs-Vergleichsvorrichtung 40 berechnet wird. Wenn der Autokorrelations-Bereich L1 verwendet wird, kann er innerhalb eines vorbe stimmten Bereichs geändert werden. In anderen Worten kann der Autokorrelations-Bereich L1 gemäß der Quelle des digitalen Signals (beispielsweise der Art des Musikinstruments oder eine Stimme einer Person) und der Verwendung des digitalen Signals geändert werden.
  • Nachdem der Autokorrelationsbereich L1 bestimmt wird, führt der Autokorrelations-Rechner 50 eine Autokorrelation des digitalen Signals gemäß dem Autokorrelationsbereich L1 durch, um eine Zeitverschiebung zu ermitteln, zu der der Autokorrelationskoeffizient maximal ist, und ermittelt den zweiten Grundfrequenz-Kandidaten für das digitale Signal unter Verwendung der Zeitverschiebung.
  • Der Grundfrequenz-Bestimmer 60 bestimmt eine Grundfrequenz auf Basis des Fehlerbereichs R1 für den ersten Grundfrequenz-Kandidaten und einen Fehlerbereich R2 für den zweiten Grundfrequenz-Kandidaten. Hier wird auf das Ergebnis des von der Fehlerbereichs-Vergleichsvorrichtung 40 durchgeführten Vergleiches zurückgegriffen. In anderen Worten, als Ergebnis des von der Fehlerbereichs-Vergleichsvorrichtung 40 durchgeführten Vergleichs, wird, wenn der Fehlerbereich R2 für das Autokorrelationsergebnis geringer ist als der oder gleich ist dem Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten, eine Grundfrequenz innerhalb des Fehlerbereiches R2 für den zweiten Fehlerbereichs-Kandidaten ermittelt. Andernfalls wird eine Grundfrequenz innerhalb des Fehlerbereiches R1 für den ersten Grundfrequenz-Kandidaten ermittelt. Wenn jedoch die Zeitverschiebung, die ermittelt wurde, um den zweiten Grundfrequenz-Kandidaten zu ermitteln, den Maximal- oder Minimalwert des Autokorrelationsbereiches L1 aufweist, der unter Verwendung des Fehlerbereiches R1 des ersten Grundfrequenz-Kandidaten berechnet wurde, wird eine Grundfrequenz innerhalb einer Überschneidung zwischen dem Fehlerbereich R1 des ersten Grundfrequenz-Kandidaten und dem Fehlerbereich R2 des zweiten Grundfrequenz-Kandidaten ermittelt.
  • Die Ergebnis-Ausgabeeinheit 70 gibt die von dem Grundfrequenz-Bestimmer 60 bestimmte Grundfrequenz aus.
  • 2 ist ein Flussdiagramm eines Zweiphasen-Verfahrens zur Ermittlung einer Grundfrequenz gemäß einer Ausführungsform der vorliegenden Erfindung. Das Zweiphasen-Verfahren zur Ermittlung einer Grundfrequenz gemäß der Ausführungsform der vorliegenden Erfindung wird mit Bezugnahme auf 2 beschrieben.
  • Wenn ein digitales Signal in Schritt S210 extern eingespeist wird, wird der Pegel des digitalen Signals mit dem Rauschpegel verglichen, der unter Miteinbeziehung der Umgebungsbedingungen vorbestimmt ist. Wenn der Pegel des digitalen Signals höher ist, als der vorbestimmten Rauschpegel, wird angenommen, dass ein digitales Signal eingespeist wird, und somit wird mit dem eingespeisten digitalen Signal eine Frequenz-Analyse durchgeführt, um in Schritt S220 einen ersten Grundfrequenz-Kandidaten zu ermitteln. Um einen Grundfrequenz-Kandidaten unter Verwendung einer Frequenz-Analyse zu ermitteln, und um eine Frequenzumwandlung durchzuführen, werden bereits bekannte Techniken verwendet, und diese Techniken werden in der Beschreibung des Frequenz-Analysators 30 erklärt. Daher wird eine detaillierte Beschreibung davon unterlassen.
  • Nachdem der erste Grundfrequenz-Kandidat unter Verwendung einer Frequenz-Analyse ermittelt wurde, wird in Schritt S230 ein Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten berechnet. Als nächstes wird ein Autokorrelations-Bereich (d.h. ein Zeitverzögerungsbereich) L1 in Schritt S240 unter Verwendung des Fehlerbereichs R1 berechnet. Als nächstes wird in Schritt S250 ein Fehlerbereich R2 für das Ergebnis der in dem Autokorrelationsbereich L1 durchgeführten Autokorrelation berechnet. Der Fehlerbereich R1, der Autokorrelationsbereich L1, und der Fehlerbereich R2 können vor dieser Handlung berechnet werden. In diesem Fall können die Schritt S230 bis S250 ausgelassen werden.
  • In Schritt S260 wird der Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten mit dem Fehlerbereich R2 für das Ergebnis der Autokorrelation verglichen. Wenn der Fehlerbereich R2 geringer ist als der oder gleich dem Fehlerbereich R1, wird mit dem digitalen Signal in einem Zeitbereich, der gemäß dem Autokorrelationsbereich L1 ermittelt wird, eine Autokorrelation durchgeführt, um in Schritt S270 einen zweiten Grundfrequenz-Kandidaten zu ermitteln. Danach wird in Schritt S280 eine Grundfrequenz innerhalb einer Überschneidung zwischen dem Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten und dem Fehlerbereich R2 für den zweiten Grundfrequenz-Kandidaten bestimmt. Wenn der Fehlerbereich R2 größer ist als der Fehlerbereich R1, wird in Schritt S290 der erste Grundfrequenz-Kandidat, der unter Verwendung der Frequenz-Analyse ermittelt wurde, als Grundfrequenz bestimmt.
  • Normalerweise ist es nicht notwendig, die Überschneidung zwischen dem Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten und dem Fehlerbereich R2 für den zweiten Grundfrequenz-Kandidaten einzeln zu berechnen. Wenn jedoch eine Zeitverschiebung, die verwendet wird, um den zweiten Grundfrequenz-Kandidaten zu ermitteln, den Maximal- oder Minimalwert des in Schritt S240 berechneten Autokorrelationsbereichs (Zeitverschiebungsbereich) L1 aufweist, muss die Überschneidung zwi schen dem Fehlerbereich R1 und dem Fehlerbereich R2 für den zweiten Grundfrequenz-Kandidaten einzeln berechnet werden.
  • Wie oben beschrieben, kann gemäß der vorliegenden Erfindung eine genaue Grundfrequenz ermittelt werden, indem sequenziell eine Sequenzanalyse und eine Autokorrelation eines eingespeisten digitalen Signals durchgeführt wird.
  • Im Folgenden wird hierin ein Verfahren zum Ermitteln einer Grundfrequenz gemäß der vorliegenden Erfindung mit Bezugnahme auf Formeln beschrieben, unter der Bedingung, dass eine Abtastrate 22,050 Hz, und eine Fenstergröße für die FFT 1024 beträgt.
  • Wenn als erstes eine Frequenzanalyse unter den obigen Bedingungen durchgeführt wird, ist ein Verfahren zum Bestimmen einer Frequenz von einem Frequenzanteil (frequency bin) für die FFT (im Folgenden hierin als ein FFT-Index bezeichnet) als Formel (1) definiert. Hier wird der FFT-Index in Übereinstimmung mit der Fenstergröße für die FFT (im Folgenden hierin als FFT-Fenstergröße bezeichnet) ermittelt. Wenn die FFT-Fenstergröße 1024 ist, wird der FFT-Index in einem Bereich von 1 bis 1024 ermittelt.
  • Figure 00070001
  • Hier wird der tatsächliche Frequenzbereich FR gemäß der Formel (2) ermittelt.
  • Figure 00070002
  • Wenn dementsprechend als Ergebnis der Durchführung einer FFT-Analyse einer auf einem Klavier gestimmten Note C3 der FFT-Index einer Wertspitze bezogen auf eine Basis-Frequenz 7 ist, werden, wenn der FFT-Index von 7, sowie die oben beschriebenen Bedingungen auf die Formeln (1) und (2) angewendet werden, die Ergebnisse der Frequenz-Transformation und der tatsächliche Frequenzbereich bezogen auf den FFT- Index von 7, d.h einen siebenten Frequenzanteil, durch die Formel (3), bzw. Formel (4) berechnet.
  • Das heißt, die Formel (3) richtet sich auf die Berechnung des Ergebnisses der Frequenz-Transformation, und die Formel (4) richtet sich auf die Berechnung eines Fehlerbereichs für das Ergebnis der Frequenztransformation.
  • Figure 00080001
  • Dementsprechend ist, als Ergebnis der Durchführung der FFT mit einem digitalen Signal unter den obigen Bedingungen, ein erster Grundfrequenz-Kandidat 139,96 Hz (129,19~150,73), und der Fehlerbereich R1 für den ersten Grundfrequenz-Kandidaten beträgt 21,53 Hz (150,73-129,19) basierend auf dem Frequenzbereich FRFFT.
  • Der Autokorrelationsbereich L1 kann gemäß der Formel (5) unter Verwendung des Fehlerbereichs R1 berechnet werden.
  • Figure 00080002
  • Hier beträgt die Maximalfrequenz des Frequenzbereichs FRFFT 150,73 Hz, und die Minimalfrequenz des Frequenzbereichs FRFFT 129,19. Dementsprechend wird, wenn diese Werte auf die Formel (5) angewendet werden, der Autokorrelations-Bereich L1, wie in Formel (6) gezeigt, berechnet.
  • Figure 00090001
  • In anderen Worten, der Autokorrelationsbereich L1 beträgt 147~171.
  • In der Zwischenzeit ändert sich der Fehlerbereich R2 für das Ergebnis der Autokorrelation gemäß mit einer Zeitverzögerung. Ein Frequenzbereich FRCOR, der unter Verwendung einer Autokorrelation ermittelt wird, kann gemäß der Formel (7) berechnet werden.
  • Figure 00090002
  • Dementsprechend ist ein Frequenzbereich unter den Zeitverschiebungen von 147 bis 171 entsprechend dem Autokorrelationsbereich am größten bei der geringsten Zeitverschiebung. Wenn die Zeitverschiebung 147 beträgt, wird der Frequenzbereich FRCOR, wie in Formel (8) gezeigt, berechnet.
  • Figure 00090003
  • Dementsprechend beträgt, wenn die Zeitverschiebung unter den obigen Bedingungen von 147 bis 171 beträgt, der Frequenzbereich FRCOR, bei dem das Ergebnis der Durchführung einer Autokorrelation des digitalen Signals einen maximalen Fehler aufweist, (150,51~149,49) Hz, und der Fehlerbereich R2 für das Ergebnis der Autokorrelation beträgt 1,02 Hz (150,51 – 149,49) basierend auf dem Frequenzbereich FRCOR.
  • In anderen Worten, ist der Fehlerbereich R2 (1,02 Hz) für das Ergebnis der Autokorrelation geringer, als der Fehlerbereich R1(21,53 Hz) für das Ergebnis der Frequenz-Transformation. Dementsprechend wird in diesem Fall eine Grundfrequenz unter Verwendung der Autokorrelation bestimmt.
  • Wenn der Fehlerbereich R2 für das Ergebnis der Autokorrelation größer ist, als der Fehlerbereich R1 für das Ergebnis der Frequenz-Transformation, wird das Ergebnis der Frequenz-Transformation als Grundfrequenz bestimmt, ohne eine Autokorrelation durchzuführen. In anderen Worten wird eine Grundfrequenz innerhalb des Fehlerbereichs R1 für das Ergebnis der Frequenz-Transformation bestimmt.
  • Die in der obigen Beschreibung verwendeten Werte können in Reaktion auf die Einspeisung eines neuen Tons immer dann in Echtzeit berechnet werden, wenn eine Grundfrequenz-Ermittlung erforderlich ist, oder sie können basierend auf einer vorbestimmten Abtastrate und FFT-Fenstergröße berechnet, und im Voraus in einer speziellen Speichereinheit gespeichert werden.
  • 3A bis 3D sind Signalverarbeitungs-Diagramme um das Zweiphasen-Verfahren zur Ermittlung einer Grundfrequenz der Ausführungsform der vorliegenden Erfindung zu erklären.
  • 3A zeigt eine extern eingespeiste Wellenform. 3B zeigt das Ergebnis der Durchführung einer Autokorrelation der in 3A gezeigten Wellenform. 3C zeigt das Ergebnis der Durchführung einer Frequenzanalyse der in 3A gezeigten Wellenform. 3D zeigt das Ergebnis der Autokorrelation in einem Autokorrelationsbereich, der basierend auf dem Ergebnis der Durchführung einer Frequenz-Analyse der in 3A gezeigten Wellenform ermittelt wird.
  • 3B zeigt das gesamte Ergebnis der Durchführung einer Autokorrelation der in 3A gezeigten, extern eingespeisten Wellenform. Bezug nehmend auf 3B wird eine Grundfrequenz fehlerhaft bei einer maximalen Wertspitze in einem Bereich einer Zeitverschiebungszeit von 0 ~ 100 oder 300 ~ 400 ermittelt, obwohl eine maximale Wertspitze in einem Bereich einer Zeitverschiebungszeit von 100 ~ 200 eine tatsächliche Grundfrequenz ist.
  • 3C zeigt das Ergebnis der Durchführung einer Frequenzanalyse der extern eingespeisten Wellenform. Bezug nehmend auf 3C wird eine vierte Wertspitze, d.h. die zweite harmonische Frequenz der tatsächlichen Grundfrequenz, fälschlicher Weise als Grundfrequenz ermittelt, wenn eine maximale Frequenz-Wertspitze ausgewählt wird, obwohl eine zweite Wertspitze eine tatsächliche Grundfrequenz ist. Ein Verfahren zum Ermitteln einer Grundfrequenz unter Verwendung der Frequenzanalyse ist jedoch bereits Stand der Technik und kann auf verschiedene Arten durchgeführt werden. Daher nehmen wir an, dass die zweite Wertspitze in diesem Beispiel als tatsächliche Grundfrequenz richtig ermittelt wird.
  • 3D zeigt das Ergebnis der Durchführung einer Autokorrelation in einem Autokorrelations-Bereich, d.h. einer Zeitverschiebungszeit, die basierend auf dem Ergebnis der Frequenzanalyse ermittelt wurde, gemäß der Ausführungsform der vorliegenden Erfindung. Hier kann eine exakte Grundfrequenz ermittelt werden.
  • Bezug nehmend auf 3C und 3D ist in dem Fall einer Note C3 auf einem Klavier ein maximaler FFT-Index gleich 7, und ein Autokorrelationswert ist bei einer Zeitverschiebung von 171 am größten. Wenn die Zeitverschiebung von 171 auf Formel (7) angewendet wird, beträgt ein Frequenzbereich 128,57 ~ 129,32 Hz. Indes beträgt gemäß der Formel (3) ein Frequenzbereich basierend auf dem Ergebnis der Durchführung einer FFT der Note C3 auf dem Klavier 129,19 ~ 150,73 Hz. Wenn dementsprechend die Überschneidung zwischen dem Frequenzbereich für das Ergebnis der FFT und dem Frequenzbereich für das Ergebnis der Autokorrelation erhalten wird, eine Grundfrequenz in einem Bereich von 129,19 ~ 129,32 Hz ermittelt.
  • Hier wird die Überschneidung zwischen dem Frequenzbereich des Ergebnisses der FFT und dem Frequenzbereich für das Ergebnis der Autokorrelation erhalten, da eine Zeitverschiebung, auf welche während der Autokorrelation Bezug genommen wird, der Maximalwert des Zeitverschiebungsbereiches von 147 ~ 171 ist.
  • Wenn wir annehmen, dass eine Grundfrequenz der MIDI-Note C3 130,8 Hz beträgt, ist das Klavier in dem obigen Fall ein wenig tiefer gestimmt. Es ist üblich, dass die Basisfrequenz einer Note auf einem Klavier sich ein wenig von einer Basisfrequenz der MIDI-Note unterscheidet, aufgrund eines Fehlers beim Stimmen des Klaviers. Dementsprechend ermöglicht die vorliegende Erfindung eine exakte Bestimmung der Grundfrequenz.
  • Die obige Beschreibung betrifft nur Ausführungsformen der vorliegenden Erfindung. Die vorliegende Erfindung ist nicht auf die obigen Ausführungsformen beschränkt und verschiedene Modifikationen können innerhalb des Umfangs, der von den beigefügten Ansprüchen definiert ist, daran vorgenommen werden. Beispielsweise kann die Form und die Struktur jedes Teiles, der in den Ausführungsformen angegeben ist, geändert werden.
  • INDUSTRIELLE ANWENDBARKEIT
  • Gemäß der vorliegenden Erfindung wird, nachdem eine Frequenz-Analyse eines extern eingespeisten digitalen Signals durchgeführt wurde, eine Autokorrelation des digitalen Signals in einem Zeitbereich selektiv durchgeführt, der gemäß dem Ergebnis der Frequenz-Analyse ausgewählt ist, wodurch ein Problem, dass die Frequenz-Analyse einen großen Fehlerbereich beim Ermitteln einer Grundfrequenz in einem Niedrig-Frequenzband aufweist, und ein Problem, dass die Autokorrelation einen großen Fehlerbereich beim Ermitteln einer Grundfrequenz in einem Hochfrequenzband aufweist, gelöst wird. Daher bewirkt die vorliegende Erfindung, dass eine exakte Grundfrequenz ermittelt wird.
  • Zusätzlich werden, anstatt der Berechnung von Autokorrelations-Koeffizienten mit Bezug auf ein gesamtes digitales Signal einer Abtastgröße zu berechnen, und die Autokorrelations-Koeffizienten während der Autokorrelation zu vergleichen, Autokorrelations-Koeffizienten mit Bezug auf ein digitales Signal in einem Zeitbereich berechnet und verglichen, der gemäß dem Ergebnis der Frequenzanalyse ausgewählt ist. Dementsprechend kann die Zeit, die erforderlich ist, um Autokorrelations-Koeffizienten zu berechnen und die maximalen Autokorrelations-Koeffizienten zu erhalten, reduziert werden.

Claims (10)

  1. 2-Phasen-Verfahren zur Ermittlung einer Grundfrequenz, welches aufweist: einen ersten Schritt des Zerlegens eines extern eingespeisten digitalen Signals in Frequenzkomponenten und Ermittelns eines ersten Grundfrequenzkandidaten auf Basis der Frequenzkomponenten; einen zweiten Schritt des Vergleichens eines Fehlerbereiches des ersten Grundfrequenzkandidaten mit einem Fehlerbereich des Ergebnisses einer Durchführung einer Autokorrelation über einen Autokorrelationsbereich, der unter Verwendung des Fehlerbereiches des ersten Grundfrequenzkandidaten berechnet ist; einen dritten Schritt des Durchführens einer Autokorrelation des eingespeisten digitalen Signals in einem vorbestimmten Zeitbereich, wenn der Fehlerbereich des Ergebnisses der Durchführung der Autokorrelation kleiner als der oder gleich dem Fehlerbereich des ersten Grundfrequenzkandidaten ist, um einen zweiten Grundfrequenzkandidaten zu ermitteln; und einen vierten Schritt des Bestimmens einer Grundfrequenz, basierend auf dem Fehlerbereich des ersten Grundfrequenzkandidaten und eines Fehlerbereichs des zweiten Grundfrequenzkandidaten.
  2. 2-Phasen-Verfahren zur Ermittlung einer Grundfrequenz nach Anspruch 1, wobei der zweite Schritt folgende Schritte aufweist: (2-1) Berechnen des Fehlerbereichs des ersten Grundfrequenzkandidaten; (2-2) Berechnen des Autokorrelationsbereichs unter Berücksichtigung des eingespeisten digitalen Signals unter Verwendung des Fehlerbereiches des ersten Grundfrequenzkandidaten; (2-3) Berechnen des Fehlerbereiches des Ergebnisses der Durchführung der Autokorrelation über dem Autokorrelationsbereich; und (2-4) Vergleichen des Fehlerbereiches des ersten Grundfrequenzkandidaten mit dem Fehlerbereich des Ergebnisses der Durchführung der Autokorrelation.
  3. 2-Phasen-Verfahren zur Ermittlung einer Grundfrequenz nach Anspruch 1 oder 2, wobei in dem zweiten Schritt der Fehlerbereich des ersten Grundfrequenzkandidaten, der Autokorrelationsbereich, und der Fehlerbereich des Ergebnisses der Durchführung der Autokorrelation aus Informationen ermittelt werden, die im Voraus berechnet und gesondert gespeichert wurden.
  4. 2-Phasen-Verfahren zur Ermittlung einer Grundfrequenz nach einem der vorhergehenden Ansprüche, wobei der dritte Schritt folgende Schritte aufweist: (3-1) Durchführen einer Autokorrelation des eingespeisten digitalen Signals in dem vorbestimmten Zeitbereich, der in Übereinstimmung mit dem Autokorrelationsbereich bestimmt wird, der in dem zweiten Schritt berechnet wurde; (3-2) Ermitteln einer Zeitverschiebung, bei der ein Autokorrelationskoeffizient am größten ist, als Ergebnis der Durchführung der Autokorrelation; und (3-3) Ermitteln eines zweiten Grundfrequenzkandidaten für das eingespeiste digitale Signal unter Verwendung der Zeitverschiebung und Ermitteln einer Grundfrequenz aus dem zweiten Grundfrequenzkandidaten.
  5. 2-Phasen-Verfahren zur Ermittlung einer Grundfrequenz nach Anspruch 4, wobei der Schritt (3-1) das Ändern des Zeitbereichs für die Autokorrelation des eingespeisten digitalen Signals innerhalb eines vorbestimmten Bereichs aufweist, und/oder wobei der Schritt (3-3) aufweist: Bestimmen einer Grundfrequenz innerhalb eine Überschneidung von einem Fehlerbereich des zweiten Grundfrequenzkandidaten und dem Fehlerbereich des ersten Grundfrequenzkandidaten, wenn die in Schritt (3-2) ermittelte Zeitverschiebung ein Maximal- oder Minimalwert des Autokorrelationsbereichs ist, der in dem zweiten Schritt berechnet wurde; und Bestimmen einer Grundfrequenz innerhalb des Fehlerbereichs des zweiten Grundfrequenzkandidaten, wenn die in Schritt (3-2) ermittelte Zeitverschiebung kein Maximal- oder Minimalwert des in dem zweiten Schritt berechneten Autokorrelationsbereiches ist.
  6. 2-Phasen-Verfahren zur Ermittlung einer Grundfrequenz nach einem der Ansprüche 1, 4 und 5, wobei in dem dritten Schritt, wenn der Fehlerbereich des Ergebnisses der Durchführung der Autokorrelation größer ist, als der Fehlerbereich des ersten Grundfrequenzkandidaten, eine Grundfrequenz innerhalb des Fehlerbereiches des ersten Grundfrequenzkandidaten bestimmt wird.
  7. 2-Phasen-Grundfrequenz-Ermittlungsvorrichtung, welche aufweist: einen Frequenzanalysator zum Zerlegen eines extern eingespeisten digitalen Signals in Frequenzkomponenten und Ermitteln eines ersten Grundfrequenzkandidaten auf Basis der Frequenzkomponenten; eine Fehlerbereichs-Vergleichvorrichtung zum Vergleichen eines Fehlerbereiches des ersten Grundfrequenzkandidaten mit einem Fehlerbereich des Ergebnisses einer Durchführung einer Autokorrelation über einen Autokorrelationsbereich, der unter Verwendung des Fehlerbereiches des ersten Grundfrequenzkandidaten berechnet wurde; einen Autokorrelationsrechner zum Durchführen einer Autokorrelation des eingespeisten digitalen Signals in einem vorbestimmten Zeitbereich, wenn der Fehlerbereich des Ergebnisses der Durchführung der Autokorrelation kleiner als der oder gleich dem Fehlerbereich des ersten Grundfrequenzkandidaten ist, um einen zweiten Grundfrequenzkandidaten zu ermitteln; einen Grundfrequenz-Bestimmer zum Bestimmen einer Grundfrequenz, basierend auf dem Fehlerbereich des ersten Grundfrequenzkandidaten und eines Fehlerbereichs des zweiten Grundfrequenzkandidaten; und eine Ergebnis-Ausgabeeinheit zum Ausgeben der Grundfrequenz, die von dem Grundfrequenz-Bestimmer bestimmt wurde.
  8. 2-Phasen-Grundfrequenz-Ermittlungsvorrichtung nach Anspruch 7, wobei die Fehlerbereichs-Vergleichvorrichtung den Fehlerbereich des ersten Grundfrequenzkandidaten, den Autokorrelationsbereich, und den Fehlerbereich des Ergebnisses der Autokorrelation aus Informationen ermittelt, die im Voraus berechnet und gesondert gespeichert wurden; und/oder wobei der Autokorrelationsrechner eine Autokorrelation des eingespeisten digitalen Signals in dem vorbestimmten Zeitbereich durchführt, welcher in Übereinstimmung mit dem Autokorrelationsbereich bestimmt wird, der von der Fehlerbereichs-Vergleichvorrichtung berechnet wurde, um eine Zeitverschiebung zu ermitteln, bei der ein Autokorrelationskoeffizient am größten ist und den zweiten Grundfrequenzkandidaten für das digitale Signal unter Verwendung der Zeitverschiebung ermittelt; und/oder wobei der Grundfrequenz-Bestimmer die Grundfrequenz auf Basis der ersten und zweiten Grundfrequenzkandidaten bestimmt, wenn der Fehlerbereich des Ergebnisses der Autokorrelation geringer ist als der oder gleich ist dem Fehlerbereich des ersten Grundfrequenzkandidaten, als Ergebnis des Vergleichs, der von der Fehlerbereichs-Vergleichvorrichtung durchgeführt wurde und die Grundfrequenz innerhalb des Fehlerbereichess des ersten Grundfrequenzkandidaten bestimmt, wenn der Fehlerbereich des Ergebnisses der Autokorrelation größer ist, als der Fehlerbereich des ersten Grundfrequenzkandidaten als Ergebnis des von der Fehlerbereichs-Vergleichvorrichtung durchgeführten Vergleichs.
  9. 2-Phasen-Grundfrequenz-Ermittlungsvorrichtung nach Anspruch 7, wobei der Autokorrelationsrechner eine Autokorrelation des eingespeisten digitalen Signals in dem vorbestimmten Zeitbereich durchführt, welcher in Übereinstimmung mit dem Autokorrelationsbereich bestimmt wird, der von der Fehlerbereichs-Vergleichvorrichtung berechnet wurde, um eine Zeitverschiebung zu ermitteln, bei der ein Autokorrelationskoeffizient am größten ist und den zweiten Grundfrequenzkandidaten für das eingespeiste digitale Signal unter Verwendung der Zeitverschiebung ermittelt und der Autokorrelationsrechner den Autokorrelationsbereich für das digitale Signal innerhalb eines vorbestimmten Bereiches ändert.
  10. 2-Phasen-Grundfrequenz-Ermittlungsvorrichtung nach einem der Ansprüche 7 bis 9, wobei der Grundfrequenz-Bestimmer: die Grundfrequenz innerhalb einer Überschneidung von dem Fehlerbereich des zweiten Grundfrequenzkandidaten und dem Fehlerbereich des ersten Grundfrequenzkandidaten bestimmt, wenn die Zeitverschiebung, bei der die Autokorrelation am größten ist, der Maximal- oder Minimalwert des Autokorrelationsbereiches ist, der von der Fehlerbereichs-Vergleichvorrichtung berechnet wurde; und die Grundfrequenz innerhalb des Fehlerbereiches des zweiten Grundfrequenzkandidaten bestimmt, wenn die Zeitverschiebung nicht der Maximal- oder Minimalwert des Autokorrelationsbereiches ist.
DE60214409T 2001-07-27 2002-07-26 Verfahren und vorrichtung zur zweiphasen-grundfrequenzdetektion Expired - Lifetime DE60214409T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2001-0045563A KR100393899B1 (ko) 2001-07-27 2001-07-27 2-단계 피치 판단 방법 및 장치
KR2001045563 2001-07-27
PCT/KR2002/001423 WO2003017250A1 (en) 2001-07-27 2002-07-26 2-phase pitch detection method and appartus

Publications (2)

Publication Number Publication Date
DE60214409D1 DE60214409D1 (de) 2006-10-12
DE60214409T2 true DE60214409T2 (de) 2007-09-20

Family

ID=19712642

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60214409T Expired - Lifetime DE60214409T2 (de) 2001-07-27 2002-07-26 Verfahren und vorrichtung zur zweiphasen-grundfrequenzdetektion

Country Status (8)

Country Link
US (1) US7012186B2 (de)
EP (1) EP1436805B1 (de)
JP (1) JP4217616B2 (de)
KR (1) KR100393899B1 (de)
CN (1) CN1216362C (de)
AT (1) ATE338330T1 (de)
DE (1) DE60214409T2 (de)
WO (1) WO2003017250A1 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101199002B (zh) * 2005-06-09 2011-09-07 株式会社A.G.I. 检测音调频率的语音分析器和语音分析方法
US7563975B2 (en) * 2005-09-14 2009-07-21 Mattel, Inc. Music production system
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8666734B2 (en) * 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values
ES2757700T3 (es) 2011-12-21 2020-04-29 Huawei Tech Co Ltd Detección y codificación de altura tonal muy débil
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
US10217448B2 (en) 2017-06-12 2019-02-26 Harmony Helper Llc System for creating, practicing and sharing of musical harmonies
US11282407B2 (en) 2017-06-12 2022-03-22 Harmony Helper, LLC Teaching vocal harmonies
CN109813264A (zh) * 2019-02-21 2019-05-28 重庆潍柴发动机有限公司 测量结果误差评估的方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226108A (en) * 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JP2940835B2 (ja) 1991-03-18 1999-08-25 日本電信電話株式会社 ピッチ周波数差分特徴量抽出法
JPH0736491A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd ピッチ抽出装置
US5619004A (en) * 1995-06-07 1997-04-08 Virtual Dsp Corporation Method and device for determining the primary pitch of a music signal
JP3840684B2 (ja) * 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
US5864795A (en) * 1996-02-20 1999-01-26 Advanced Micro Devices, Inc. System and method for error correction in a correlation-based pitch estimator
KR100269216B1 (ko) 1998-04-16 2000-10-16 윤종용 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6124544A (en) * 1999-07-30 2000-09-26 Lyrrus Inc. Electronic music system for detecting pitch
US6917912B2 (en) * 2001-04-24 2005-07-12 Microsoft Corporation Method and apparatus for tracking pitch in audio analysis
US6653546B2 (en) * 2001-10-03 2003-11-25 Alto Research, Llc Voice-controlled electronic musical instrument

Also Published As

Publication number Publication date
US20040159220A1 (en) 2004-08-19
CN1552058A (zh) 2004-12-01
JP4217616B2 (ja) 2009-02-04
WO2003017250A1 (en) 2003-02-27
EP1436805A4 (de) 2005-06-01
KR100393899B1 (ko) 2003-08-09
EP1436805B1 (de) 2006-08-30
DE60214409D1 (de) 2006-10-12
EP1436805A1 (de) 2004-07-14
US7012186B2 (en) 2006-03-14
JP2005503580A (ja) 2005-02-03
KR20030010898A (ko) 2003-02-06
CN1216362C (zh) 2005-08-24
ATE338330T1 (de) 2006-09-15

Similar Documents

Publication Publication Date Title
DE60223391T2 (de) Tonhöhenbestimmungsverfahren und vorrichtung zur spektralanalyse
DE10232916B4 (de) Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals
EP1371055B1 (de) Vorrichtung zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen des audiosignals unter verwendung einer autokorrelationsfunktion
DE69433254T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE69629486T2 (de) Kontrollstruktur für klangsynthesierung
DE2659096C2 (de)
DE60303993T2 (de) Musikstrukturerkennungsgerät und -verfahren
DE60214409T2 (de) Verfahren und vorrichtung zur zweiphasen-grundfrequenzdetektion
EP1388145B1 (de) Vorrichtung und verfahren zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen
EP0076233B1 (de) Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
DE60315880T2 (de) Datenerzeugungseinrichtung und verfahren für musikkompositionen
EP1280138A1 (de) Verfahren zur Analyse von Audiosignalen
DE60031812T2 (de) Vorrichtung und Verfahren zur Klangsynthesierung
DE10157454B4 (de) Verfahren und Vorrichtung zum Erzeugen einer Kennung für ein Audiosignal, Verfahren und Vorrichtung zum Aufbauen einer Instrumentendatenbank und Verfahren und Vorrichtung zum Bestimmen der Art eines Instruments
DE2622423B2 (de) Elektrische Anordnung zur Übertragung oder Speicherung eines Sprachoder Tonsignals in kodierter Form
DE2636032A1 (de) Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
DE3019823A1 (de) Datenumsetzer und damit ausgestattete sprachsyntheseanordnung
DE102004028693B4 (de) Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt
DE4218623C2 (de) Sprachsynthesizer
DE19500751C2 (de) Verfahren zum Erkennen eines Tonbeginns bei geschlagenen oder gezupften Musikinstrumenten
US4982433A (en) Speech analysis method
EP1377924B1 (de) VERFAHREN UND VORRICHTUNG ZUM EXTRAHIEREN EINER SIGNALKENNUNG, VERFAHREN UND VORRICHTUNG ZUM ERZEUGEN EINER DAZUGEHÖRIGEN DATABANK und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals
DE3023578A1 (de) Verfahren zum bestimmen des akkordtyps und seines grundtons bei einem chromatisch gestimmten musikinstrument
DE102008060385A1 (de) Zeitoptimierte Ermittlung des Frequenzganges von in einem Messobjekt erzeugten Harmonischen
DE4343403A1 (de) Verfahren zum Auswerten von Schall

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: BOCKHORNI & KOLLEGEN, 80687 MUENCHEN