DE60114556T2 - Skalierbares digitales Audio Codec - Google Patents

Skalierbares digitales Audio Codec Download PDF

Info

Publication number
DE60114556T2
DE60114556T2 DE60114556T DE60114556T DE60114556T2 DE 60114556 T2 DE60114556 T2 DE 60114556T2 DE 60114556 T DE60114556 T DE 60114556T DE 60114556 T DE60114556 T DE 60114556T DE 60114556 T2 DE60114556 T2 DE 60114556T2
Authority
DE
Germany
Prior art keywords
bit
section
digital audio
data
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60114556T
Other languages
English (en)
Other versions
DE60114556D1 (de
Inventor
Hong-kee Suwon-City Kim
Sung-pil Nowon-gu Choi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of DE60114556D1 publication Critical patent/DE60114556D1/de
Publication of DE60114556T2 publication Critical patent/DE60114556T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/02Analogue recording or reproducing
    • G11B20/04Direct recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Einrichtung zum Abspielen von Digitaltönen bzw. Digitalaudio, welche Einrichtung eine Speichervorrichtung umfasst zum Speichern von Digitalaudiodaten, eine Wiedergabevorrichtung zum Abspielen von in der Speichervorrichtung gespeicherten Audiodaten, eine Vorrichtung zum Empfangen von Audiosignalen und eine Verarbeitungsvorrichtung.
  • Viele Anregungen zu Audiosignalcodierverfahren sind gemacht worden, die verbesserte Kompression des Audiosignals mit guter Wiedergabetreue bereitstellen können.
  • Der MPEG/Audiostandard für das AC-2/AC-3-Verfahren stellt Audioqualität bereit, die weitgehend ähnlich dem von einer Kompaktscheibe bzw. CD erzeugten Klang ist durch Reduzieren der Bitrate um ein Sechstel oder ein Achtel der Bitrate eines konventionellen Digitalcodierers, d.h. allgemein im Bereich von 64 kB/s bis 384 kB/s.
  • Viel Forschung wurde in die Art und Weise des Bereitstellens von hochklangtreuem Audio bei reduzierter Bitrate investiert. Ein signifikantes Ergebnis ist die fortgeschrittene Audiocodierung bzw. "Advanced Audio Coding" (AAC) von MPEG-2, die ausgewählt worden ist als ein internationaler Standard. MPEG-2-AAC wurde auch von einer Expertengruppe als Verfahren vorgeschlagen, das hochklangtreues Audio bei einer Bitrate von 64 kB/s bereitstellen könnte.
  • In Codierern, die konventionelle Codierverfahren verwenden, werden Audiodaten durch ein Codierverfahren codiert, welches in Übereinstimmung mit einer festen Bitrate festgelegt ist.
  • Tragbare Digitalaudioabspieler sind aufgebaut zum Abspielen von Rudiodateien, die durch ein konventionelles Codierverfahren codiert worden sind durch Herunterladen einer Datei von einem Computer oder einem Verkaufsautomaten. Da jedoch tragbare Digitalaudioabspieler entworfen worden sind, um zur Bequemlichkeit des Trägers eine geringe Größe zu haben, ist es praktisch unmöglich, die Speicherkapazität eines Aufzeichnungsmediums über einen vorbestimmten Grad hinaus auszudehnen. Mit anderen Worten, tragbare Digitalaudioabspieler haben eine eingeschränkte Speicherkapazität.
  • Allgemein haben tragbare Digitalaudioabspielgeräte eine begrenzte Kapazität wie z.B. 16, 32 oder 64 Megabyte, was die Größe und die Anzahl der Audiodateien, die in dem tragbaren Digitalaudioabspieler gespeichert werden können, beschränkt.
  • Um eine Digitalaudiodatei, die durch die konventionellen Codiermethoden erzeugt worden ist, in einen tragbaren Digitalaudioabspieler zu laden, muss ein Benutzer eine Digitalaudiodatei innerhalb einer Speichergrenze des Digitalaudioabspielers auswählen. Beispielsweise, wenn 29 Megabyte Dateien bereits in dem Aufzeichnungsmedium eines Digitalaudioabspielers gespeichert sind, der eine Speicherkapazität von 32 Megabyte hat, kann der Benutzer nur eine zusätzliche Audiodatei laden, die in die verbleibenden freien Bytes passt, d.h. in 3 Megabyte. In dem Fall, dass die Audiodatei, die der Benutzer wünscht, 4 Megabytegröße hat, kann der Benutzer die Audiodatei nicht laden, was bedeutet, dass die freien Byte nicht effizient verwendet werden können.
  • Die 4 Megabyteaudiodatei könnte geladen werden, wenn eine andere Datei, die größer ist als 1 Megabyte, gelöscht wird. Jedoch verursacht dies für den Benutzer eine Unbequemlichkeit, da die gelöschte Datei nicht länger verfügbar ist.
  • Wie oben beschrieben stellen die konventionellen Digitalaudiowiedergabegeräte und Audiodateierzeuger nicht die Bedürfnisse der Benutzer zufrieden, die die Größe der Digitalaudiodateien zu reduzieren wünschen, selbst wenn dies eine Verschlechterung der Audioqualität bedeutet. Mit anderen Worten, Benutzer finden gewöhnlich die konventionellen Digitalaudioabspielgeräte oder die Audiodateien gemäß den konventionellen Codierverfahren erzeugende Audiodateierzeuger als unzufriedenstellend, da die Benutzer nicht die Größe der Daten oder die Bitraten abstimmen können, wenn sie es wünschen.
  • JP 2000 341627 A (Kurzauszug: DATABASE WPI Section EI, Woche 2000161 Derwent Publications Ltd., London, GB; Klasse T01, AN 2001-543796) offenbart ein Gerät zum Abspielen von Digitalaudio, das eine Verarbeitungsvorrichtung umfasst, die die Größe der von Video- und Audiosignalen im Speicher durch Variieren der Kompressionsbitrate reduziert. Das Gerät arbeitet durch Erzeugen von Digitalaudiodaten, die basierend auf einem MPEG-Algorithmus codiert sind. Dieser Digitalaudioabspieler ermöglicht es demnach, die Größe von Digitalaudiodateien zu reduzieren aber ermöglicht es dem Benutzer nicht, die Größe von Daten oder Bitraten wunschgemäß abzustimmen. Dieser Dokument ist als nächstliegender Stand der Technik identifiziert worden und bildet die Grundlage für den Oberbegriff des Anspruchs 1.
  • Gemäß der vorliegenden Erfindung wird ein Gerät zum Abspielen von Digitalton bzw. Digital-Audio bereitgestellt, wobei das Gerät umfasst: eine Speichervorrichtung zum Speichern von Digitalaudiodaten; eine Wiedergabevorrichtung zum Spielen von in der Speichervorrichtung gespeicherten Digitalaudiodaten; eine Vorrichtung zum Empfangen von Audiosignalen; eine Verarbeitungsvorrichtung; und die Verarbeitungsvorrichtung ist konfiguriert zum Verarbeiten von Audiosignalen, die von der Vorrichtung zum Empfang von Audiosignalen empfangen worden sind, um Digitalaudiodaten in einem geschichteten Format zu erzeugen mit einer auswählbaren Bitrate oder Dateigröße, und zum Speichern der Digitalaudiodaten in der Speichervorrichtung; gekennzeichnet dadurch, dass die Verarbeitungsvorrichtung eine Benutzereingabevorrichtung einschließt zum Festlegen der auswählbaren Bitrate oder Dateigröße.
  • Vorzugsweise sind die Audiodaten in einem bitgeteilten arithmetischen Codierverfahren.
  • Die Vorrichtung zum Empfangen von Audiosignalen umfasst vorzugsweise eine Vorrichtung zum Empfangen von Digitalaudiosignalen und die Verarbeitungsvorrichtung ist konfiguriert zum Umsetzen empfangener Digitalaudiosignale mit einem Format, das von dem für die Digitalaudiodaten verwendeten Format abweicht in das für die Digitalaudiodaten verwendete Format.
  • Vorzugsweise ist die Verarbeitungsvorrichtung konfiguriert zum Beschneiden empfangener Digitalaudiosignale mit dem für die Digitalaudiodaten verwendeten Format zum Erzeugen der Digitalaudiodaten.
  • Vorzugsweise umfasst die Vorrichtung zum Empfangen von Audiosignalen eine Vorrichtung zum Empfangen von Audiosignalen vom Internet.
  • Die Speichervorrichtung und die Wiedergabevorrichtung können von einem tragbaren Digitalaudioabspieler umfasst sein während die Verarbeitungsvorrichtung und die Vorrichtung zum Empfangen von Audiosignalen in einem Personalcomputer umfasst sind.
  • Gemäß der vorliegenden Erfindung ist auch ein Digitalaudioabspieler bereitgestellt und ein Computer mit einer Digitalaudioeditiervorrichtung und einem Verfahren zum Codieren eines Audiosignals, wie in den beiliegenden Ansprüchen dargelegt. Bevorzugte Merkmale der Erfindung werden aus den abhängigen Ansprüchen und der folgenden Beschreibung ersichtlich.
  • Nun werden Ausführungsformen der vorliegenden Erfindung beispielhaft unter Bezugnahem auf die beiliegenden Zeichnungen beschrieben, in denen zeigt:
  • 1 ein Blockdiagramm eines Computers mit einer Audioeditiervorrichtung gemäß der vorliegenden Erfindung;
  • 2 ein Beispiel eines Menüschirms, der von einem Menübereitstellungsabschnitt der in 1 gezeigten Audioeditiervorrichtung bereitgestellt wird;
  • 3A bis 3D ein Beispiel eines Editiermenüs einschließlich eines Extraktionsratenauswahlmenüs;
  • 4 ein Ablaufdiagramm eines ersten Prozesses des Extrahierens von Daten auf einem Computer gemäß der vorliegenden Erfindung;
  • 5A ein Blockdiagramm eines ersten Digitalaudioabspielers gemäß der vorliegenden Erfindung;
  • 5B ein Beispiel eines Editiermenüs einschließlich eines Extraktionsratenauswahlmenüs, die sukzessive bereitgestellt werden, wenn eine Editierfunktion in dem in 5A gezeigten Digitalaudioabspieler ausgewählt wird;
  • 6 ein Ablaufdiagramm eines Beispiels der Extraktion von Daten in dem in 5A gezeigten Digitalaudioabspieler;
  • 7 ein Blockdiagramm von Elementen eines bitgeteilten Codierers eines in der vorliegenden Erfindung verwendeten bitgeteilten Codecs;
  • 8 eine Ansicht eines von dem in 7 gezeigten bitgeteilten Codierer ausgeführten bitgeteilten Codierprozesses;
  • 9 eine die Struktur eines geschichteten von dem bitgeteilten Codierprozess erzeugten Bitstroms zeigende Ansicht; und
  • 10 ein Blockdiagramm von Elementen des bitgeteilten Decodierers des in einer Ausführungsform der vorliegenden verwendeten bitgeteilten Codecs.
  • Wie in 1 gezeigt schließt ein Computer 10 eine Zentralverarbeitungseinheit (CPU) 11 ein, ein ROM 12, ein RAM 13, eine Anzeigeinrichtung 14, eine Eingabeeinrichtung 15 wie z.B. eine Maus und/oder eine Tastatur, eine Speichereinrichtung 16 und eine Kommunikationseinrichtung 19.
  • Die Speichereinrichtung 16 speichert ein Betriebssystem (OS bzw. Operating System) 17 wie z.B. Windows 98, Windows 2000 etc. und ein Audio-Editierprogramm 18.
  • Das Audioeditierprogramm 18 stellt ein Menü zum Editieren von Audiodateien unter Unterstützung des Betriebssystems 17 bereit und führt Prozesse entsprechend einer von dem Benutzer getroffenen Auswahl aus. Das Audioeditierprogramm 18 schließt einen Menübereitstellungsabschnitt 18a ein und einen Editierabschnitt 18b. Der Menübereitstellungsabschnitt 18a stellt einen Schirm bereit, der verschiedene Menüs der Audioeditierung darstellt, wenn das Audioeditierprogramm 18 auf dem Computer 10 ausgeführt wird. Ein Beispiel des Menüschirms des Menübereitstellungsabschnittes 18a ist in Menü 2 gezeigt.
  • Der Editierabschnitt 18b führt Prozesse in Übereinstimmung mit der von dem durch den Menübereitstellungsabschnitt 18a bereitgestellten Menü getroffenen Auswahl aus. Der Editierabschnitt 18b schließt ein bitgeteiltes Codec-Programm ein, d.h., bitgeteilte arithmetische Codierung bzw. "Bit Sliced Arithmetic Coding" (BSAC), welche einen geschichtete bitgeteilte Codierung der Digitalaudiodaten ausführt.
  • Vorzugsweise ist das Audioeditierprogramm 18 derart aufgebaut, dass es das Betrachten und Auswählen der in der Speichereinrichtung 16 des Computers 10 gespeicherten Dateien unterstützt und auch eine externe Einrichtung, die mit einem Kommunikationsanschluss wie z.B. einem parallelen Port oder einem seriellen Port verbunden ist.
  • Beispielsweise stellt der Menübereitstellungsabschnitt 18 ein Umgebungseinstellmenü bereit, von welchem ein Kommunikationsport des Computers 10 ausgewählt werden kann, und der Editierabschnitt 18b zeigt die Liste der in der mit einem Kommunikationsport verbundenen externen Einrichtung gespeicherten Dateien und die Liste von in dem Computer 10 gespeicherten Dateien zum Vergleichen auf dem selben Schirm an.
  • Zudem wird vorgezogen, dass das Audioeditierprogramm 18 aufgebaut ist zum Abspielen der Audiodateien, deren Editieren abgeschlossen ist, auf dem Computer 10. Das heißt, das bitgeteilte Codec-Programm des Audioeditierprogramms 18 schließt vorzugsweise ferner einen Decoder ein zum Decodieren einer von dem BSAC-Verfahren erzeugten Datei.
  • Wie in 2 gezeigt wird in einem Fenster 14a auf der Anzeigeeinrichtung 14, welches von dem Audioeditierprogramm 18 angezeigt wird, eine Liste von in der Speichereinrichtung 16 des Computers 10 gespeicherten Dateien in der linken Hälfte des Fensters 14a gezeigt während die Liste von in einer externen Einrichtung gespeicherten Dateien in der rechten Hälfte des Fensters 14a gezeigt wird. Beispielsweise, wenn die externe Einrichtung ein tragbarer Digitalaudioabspieler ist, wird die in dem Speicherabschnitt des tragbaren Digitalaudioabspielers gespeicherte Dateiliste gemeinsam mit der Dateiliste des Computers 10 gezeigt.
  • Ein "Datei"-Menü stellt Zugang zu Befehlsunterpunkten bereit wie z.B. einer Dateiauswahl, einem Dateiherunterladen, einem Dateihochladen, einem Dateiöffnen, einem Dateisichern und einem Umgebungseinrichten, etc.
  • Ein "Editier"-Menü stellt Zugang zu Dateieditierfunktionen bereit.
  • Tastenfelder einschließlich einer Herunterladtaste 25, einer Hochladtaste 26 und einer Abspieltaste 27, die ihre Funktionen angebende Icons tragen, werden in dem Fenster 14a unterhalb der Menüleiste angezeigt.
  • Der Prozess des Editierens einer Audiodatei gemäß einer gewünschten Skalierung eines Benutzers unter Verwendung des Audioeditierprogramms 18 wird nachstehend unter Bezugnahme auf 1 bis 4 beschrieben.
  • Zuerst wird, wenn das Audioeditierprogramm 18 ausgeführt wird, ein Anfangsschirm (s. 2) angezeigt (Schritt 100). Auf dem Anfangsschirm wird ein Menü durch den Menübereitstellungsabschnitt 18a angezeigt und einer Dateienliste der Speichereinrichtung 16 des Computers 10 und eine Dateienlisten eines Speicherabschnittes einer externen Einrichtung (d.h. tragbarer Digitalaudioabspieler), der mit einem Kommunikationsport des Computers 10 verbunden ist, werden angezeigt. Gleichzeitig werden auch die Gesamtspeichergröße und der Umfang des freien verbleibenden Speichers des Speicherabschnittes der externen Einrichtung angezeigt, zur Benutzerreferenz während des Editierprozesses. Wenn es keine mit dem Computer 10 verbundene externe Einrichtung gibt, wird nur die Dateienliste des Computers 10 angezeigt.
  • Wenn der Benutzer eine Datei von den in der Speichereinrichtung 16 des Computers 10 gespeicherten Dateien auswählt, beispielsweise, wenn der Benutzer die "a.PCM"-Audiodatei (durch eine Punktlinie hervorgehoben) durch die Beeinflussung der Eingabeeinrichtung 15 auswählt, zeigt der Editierabschnitt 18b die Größe der ausgewählten Datei, beispielsweise 4 Megabyte, in einem unteren Abschnitt des in 2 gezeigten Anzeigefensters an. Hier sollte vermerkt werden, dass mehr als eine Datei zum Editieren ausgewählt werden kann und demnach das BSAC-Verfahren auf alle ausgewählten Dateien angewendet wird.
  • Als nächstes wird bestimmt, ob eine Auswahl eines Menüunterpunktes vorgenommen worden ist von dem Menü oder nicht (Schritt 110). Wenn nicht, dann wird bestimmt, ob oder nicht der Benutzer eine Auswahl trifft, z.B. X (in der unteren rechten Ecke des Anzeigeschirms) zum Schließen des Anfangsschirms, um den Audioeditierauftrag wirksam zu beenden (Schritt 115).
  • Wenn die Auswahl eines Menüunterpunktes von dem Menü im Schritt 110 getroffen worden ist, wird bestimmt, ob das Editiermenü ausgewählt worden ist oder nicht (Schritt 120). Wenn nicht, dann wird ein Prozess entsprechend dem ausgewählten Menü ausgeführt (Schritt 125).
  • Wenn im Schritt 120 bestimmt wird, dass der Benutzer das Editiermenü unter Verwendung der Eingabeeinrichtung 15 ausgewählt hat, wird ein Datenextraktionsratenauswahlmenü (s. 3A3D) angezeigt. Vorzugsweise stellt der Menübereitstellungsabschnitt 18a ein Menü zum Auswählen einer Bitrate und/oder einer Zieldatengröße für den Editierprozess bereit. Hier dient das Bitratenauswahlmenü der Bequemlichkeit des Benutzers zum Auswählen einer Datengröße und einer Audioqualität der betrachteten Audiodatei eines Audiodateientyps. Die zu beachtende Tatsache ist, dass die höhere Bitrate eine höhere Audioqualität mit größerer Datengröße verursacht während eine niedrigere Bitrate eine niedrigere Audioqualität aber mit einer geringeren Datengröße verursacht.
  • Unterdessen dient das Auswahlmenü für die Zieldatengröße der Bequemlichkeit des Benutzers/der Benutzerin zum Editieren der Audiodatei auf eine abgestimmte Größe, die geeignet ist für die freie Kapazität des Aufzeichnungsmediums, in welchem er/sie geneigt ist, die editiere Audiodatei zu speichern. Beispielsweise kann der Benutzer dieses Menü bequem verwenden, wenn er/sie wünscht, die Audiodatei von mehr als 3 Megabyte anzupassen und in einem tragbaren Digitalaudioabspieler mit einer freien Kapazität von 3 Megabyte zu speichern.
  • Wie in 3A gezeigt, zeigt ein Datenextraktionsratenauswahldialog 14b den Namen "a.PCM" der zum Editieren ausgewählten Datei an, eine Bitratenauswahldreheditiersteuerung, eine Zieldatengrößenauswahldreheditiersteuerung, Grob- und Feinabstimmungsmarkierungsfelder, die der Bitratenauswahldreheditiersteuerung zugeordnet sind, und ein Nach-Editierprozessauswahlmarkierungsfeld. Es sollte ersichtlich sein, dass die dritte Ausführungsform einen Vorschau-Knopf einschließen kann, wie in 3B gezeigt.
  • Wenn bestimmt wird, dass die Datenextraktionsrate im Schritt 130 ausgewählt worden ist durch Auswählen eines von der Bitrate oder der Zielgröße (nachstehend detaillierter beschrieben), editiert der Editierabschnitt 18b die Audiodatei durch das geschichtete bitgeteilte arithmetische Codierverfahren (BSAC-Verfahren) (Schritt 140) gemäß der Bitrate oder Zielgröße, die von dem Benutzer durch den Extraktionsratenauswähldialog der 3A3D ausgewählt worden ist.
  • Nach Abschluss des Editierens, wenn bestimmt wird, dass ein Herunterladen ausgewählt worden ist (Schritte S150 und S160), wird die editierte Audiodatei zu dem mit dem Computer 10 verbundenen Digitalaudioabspieler heruntergeladen (Schritt 170). In Bezug auf 3B jedoch, wenn der Benutzer wünscht, die Ergebnisse des Editierens hörbar im Voraus zu beurteilen, klickt der Benutzer den Vorschau-Knopf nach dem Auswählen eines von der Bitrate oder Zielgröße, dann wird ein Abschnitt der Audiodatei editiert (codiert) durch das BSAC-Verfahren und beispielsweise in einer temporären Datei gespeichert. Der codierte Audioabschnitt wird dann automatisch decodiert und hörbar wiedergegeben. Wenn der Benutzer die Qualität des editieren Audio akzeptiert, dann kann der Benutzer die heruntergeladene Funktion auswählen und nach dem Klicken des "Eingabe-Knopfs" (d.h., OK-Knopf) in dem Dialog 14c, wird die gesamte Datei durch das BSAC-Verfahren editiert und heruntergeladen (Schritte 140 bis 170).
  • Indessen, wenn im Schritt 160 das Herunterladen nicht ausgewählt ist, wird ein neues (nicht dargestelltes) Fenster angezeigt, das den Benutzer auffordert, den Namen der Datei mit editierten Daten anzugeben, die dann gespeichert wird (Schritt 180).
  • Es wird wieder Bezug genommen auf 3A3D, die Bitrate ist vorzugsweise in 1 kb/s-Schritten auswählbar, während die Zieldatengröße in 1 Kilobyteschritten auswählbar ist. Jedoch kann die Bitrate auch in Schritten auswählbar sein, die größer oder kleiner sind als 1 kb/s, beispielsweise 8 kb/s und die Zieldatengröße kann in Schritten auswählbar sein, die größer oder kleiner als 1 Kilobyte sind, beispielsweise 500 Kilobyte, mit Unterstützung des bitgeteilten Codec-Programms des Editierabschnittes 18b.
  • Wenn der Benutzer wünscht, nur eine Bitrate für die Audiodatei auszuwählen, beeinflusst er/sie die Bitratenauswahldreheditiersteuerung durch Anklicken ihrer Aufwärts- und/oder Abwärtspfeile zum Auswählen seiner/ihrer gewünschten Bitrate. Wenn der Benutzer seine/ihre gewünschte in der Bitratenauswahldreheditiersteuerung sieht, stoppt er/sie die Bitratenauswahldreh-Editiersteuerungsbeeinflussung und klickt auf ein Auswahlbestätigungsmarkierungsfeld links von der Bitratenauswahldreheditiersteuerung, um eine Auswahlmarkierung (V) darin zu steuern. Wenn der Benutzer die Auswahlmarkierung (V) in dem Auswahlbestätigungsfeld sieht, wählt er/sie aus, ob herunterzuladen ist oder nicht, und klickt, wenn nötig, das Herunterlade-Markierungsfeld an.
  • Wenn die Bitratenauswahldreheditiersteuerung durch den Benutzer beeinflusst wird, kann sich die Anzeige für die Zieldatengröße ändern, um einen Wert anzuzeigen, der der angezeigten Bitrate entspricht. Demgemäß, wenn die Zieldatengrößenanzeige beschränkt ist auf das Anzeigen nur der um die Normalschrittgröße von beispielsweise 500 kBytes getrennten Werten, d.h. 0,500, 1000 .... 6000 kB, wird die angezeigte Zieldatengröße nicht beschränkt sein auf diese Werte sondern wird diese tatsächliche Dateigröße entsprechend der ausgewählten Bitrate anzeigen.
  • Zusätzlich, wenn ein Benutzer den Durchlaufbalken (Scrollbar) in Entsprechung zu der Zieldatengröße beeinflusst, dann kann die Anzeige entsprechend dem Bitratenwert geändert werden zum Anzeigen einer Bitrate in Entsprechung zu der angezeigten Zieldatengröße, welche außerhalb des Normalbitratenintervalls liegen kann.
  • In der dritten Ausführungsform wird die Bitrate vorzugsweise bei 1 Kilobyte pro Sekunden-Intervallen für eine Feinabstimmung ausgewählt und die Bitrate wird bei 8 Kilobyte pro Sekunden-Intervallen für die Grobabstimmung ausgewählt. Wenn demgemäß das Grobabstimmungsmarkierungsfeld ausgewählt ist, wie in 3C gezeigt, wird eine Beeinflussung der Bitratendreheditiersteuerung Bitraten in 8 Kilobyte pro Sekundenschritten, d.h. 8, 16, 24, 32, 40, 48, 56, 64 .... n Kilobyte pro Sekunden anzeigen. Wenn das Feinabstimmungsmarkierungsfeld ausgewählt ist, wie in 3D gezeigt, wird eine Beeinflussung der Bitratendreheditiersteuerung Bitraten in 1 kb/s-Schritten anzeigen, d.h., von 1, 2, 3, ...., 62, 63, 64 .... n kb/s. Und, wenn wie oben beschrieben, wenn die Dreheditiersteuerung für die Bitrate durch den Benutzer betätigt wird, kann sich die angezeigte Zieldatengröße ändern zum Anzeigen eines Wertes entsprechend der angezeigten Bitrate.
  • Wie nachstehend beschrieben wird, werden die codierten Audiodaten einen Kopfteil einschließen, der Bitrateninformation enthält. Demgemäß werden die ausgewählte Extraktionsrate, beispielsweise 8 Kilobyte pro Sekunden pro Schicht und der Wert der höchsten Schicht, beispielsweise 64 Kilobyte pro Sekunden, in dem Kopf des codierten Audiosignals eingeschlossen sein.
  • Wenn die zum Herunterladen ausgewählte Audiodatei bereits durch das geschichtete BSRC-Verfahren erzeugt worden ist, wird die Extraktion aus einer Schicht entsprechend der ausgewählten Bitrate vorgenommen.
  • Wenn der Benutzer wünscht, die editierte Datei abzuspielen, wählt er/sie seine/ihre gewünschte Datei aus und klickt den Abspielknopf 27. Demgemäß decodiert das Audioeditierprogramm 18 die ausgewählte Audiodatei und gibt die Datei an die Audioausgabeeinrichtung (nicht dargestellt) wie z.B. einen mit dem Computer 10 verbundenen Lautsprecher aus.
  • Wie oben beschrieben kann das Audioeditierprogramm 18 gemäß der vorliegenden Erfindung in einem Aufzeichnungsmedium für die Benutzung aufgezeichnet werden. Auch kann der Benutzer, wenn das Audioeditierprogramm 18 in den Computer 10 installiert ist, Audiodateien auf dem Computer 10 auf eine gewünschte Größe editieren. Nach dem Editieren der Audiodatei durch das geschichtetes BSAC-Verfahren kann der Benutzer wie er/sie wünscht, die Audiodatei durch Herunterladen der vollständig editierten Datei in einen Speicher eines tragbaren Digitalaudioabspielers mit einer Einrichtung benutzen, die im Stande ist, die Audiodatei zu decodieren und abzuspielen.
  • Gemäß einem anderen Aspekt der vorliegenden Erfindung kann der Digitalaudioabspieler eine Audiodatei selbst editieren. Wie in 3A gezeigt, ist der Digitalaudioabspieler 30 mit einem Computer 60 verbunden, der über eine Kommunikationsschnittstelle 50 mit dem Internet 70 verbunden ist. Demnach ist es nicht erforderlich, dass der Computer 60 den Editierabschnitt 18b der 1 enthält.
  • Der Digitalaudioabspieler 30 schließt einen Tasteneingabeabschnitt 31 ein, einen Controller 32, einen Anzeigeabschnitt 33, einen Speicher 35, einen bitgeteilten Codecabschnitt 37, einen A/D-Umsetzer 39, einen D/A-Umsetzer 41 und eine Schnittstelle 49. Der Abspieler 30 schließt auch ein internes Mikrofon (MIC) 43 ein, einen analogen Audiosignaleingangsanschluss 45 und einen analogen Audiosignalausgangsanschluss 47.
  • Es wird vorgezogen, dass die Schnittstelle 49 aufgebaut ist zum Ausführen bidirektionaler Kommunikation mit dem Computer 60 durch einen Parallelport des Computers 60 wie z.B. einen Parallelport für einen Drucker, oder einen Serienport wie z.B. einen USB-Port, und ein geeignetes Kabel 50.
  • Alternativ ist die Schnittstelle 49 aufgebaut zum Ausführen bidirektionaler Kommunikation mit dem Computer 60 oder einer externen Einrichtung durch ein Drahtloskommunikations-Verfahren, beispielsweise gemäß Bluetooth oder IrDA.
  • Der Tasteneingabeabschnitt 31 schließt eine Vielzahl von Tasten zum Einstellen verschiedener Unterstützungsfunktionen ein. Der Tasteneingabeabschnitt 31 schließt auch eine Taste 31a zum Verarbeiten und Speichern eines empfangenen Audiosignals mit einer gewünschten Extraktionsrate ein. Taste 31a kann als Optionstaste bezeichnet werden zum Anzeigen einer Vielzahl von Menüoptionen auf dem Anzeigeabschnitt 33, wobei eine der angezeigten Optionen eine Editier- oder Codieroption sein kann, welche den Anzeigeabschnitt 33 veranlassen wird, einen Schirm ähnlich dem in 5B gezeigten anzuzeigen. Zusätzlich kann die Taste 31a als Editiertaste bezeichnet werden, welche den Anzeigeabschnitt 33 veranlassen kann, unmittelbar einen Schirm ähnlich dem in 5B gezeigten anzuzeigen. Der Anzeigeabschnitt 33 zeigt von dem Controller 32 empfangene Information an. Der Controller 32 verarbeitet Signale, die über den Tasteneingabeabschnitt 31 eingegeben werden, und steuert demgemäß die Komponenten des Abspielers 30.
  • Zudem schließt der Tasteneingabeabschnitt 31 vorzugsweise Speicher-, Abspiel-, Stopp- und Aufnahmetasten ein, die nicht in den Zeichnungen dargestellt sind. Die Tasten können getrennt ausgebildet sein oder eine Taste kann eine Vielzahl von Funktionen haben, die durch die Weise ihrer Beeinflussung unterscheidbar sind.
  • Ein A/D-Umsetzer 39 setzt ein durch den Eingangsanschluss 45 oder durch ein Mikrofon (MIC) 43 eingegebenes Analogeingangssignal in ein Digitalsignal um.
  • Der D/A-Umsetzer 41 setzt ein von dem Controller 32 ausgegebenes Audiosignal in ein Analogsignal um und gibt das Analogsignal über den Ausgangsanschluss 47 aus. Es können mehrere Ausgangsanschlüsse 47 ausgebildet sein zum Verbinden eines Ohrhörers, einer externen Einrichtung etc.
  • Das bitgeteilte Codec 37 schließt einen Codierer ein zum Ausführen eines Codierprozesses durch das geschichtete BSAC-Verfahren und einen Decoder zum Ausführen eines Decodierprozesses für das codierte Signal durch das geschichtete BSAC-Verfahren.
  • Wenn ein Editiersignal eingegeben wird, stellt der Controller 32 einen Schirm bereit zum Anzeigen des Umfangs freien, im Speicher 35 verbleibenden Speichers, und eines Bitraten- und/oder eines Zieldatengrößen-Auswahlmenüs auf dem Anzeigeabschnitt 33. Beachte jedoch, dass der Controller 32 Information in Bezug auf den Umfang an freiem verfügbarem Speicher im Speicher 35 immer bereitstellen könnte, d.h., vor dem Aktivieren der Taste 31b.
  • Die relativ kleine Anzeigekapazität des Anzeigeabschnittes 33 des Digitalaudioabspielers 30 berücksichtigend kann der den Bitratenauswahl- und/oder Zieldatengrößenauswahldialog bereitstellende Schirm sequentiell in Übereinstimmung mit einer Schirmbewegungsbeeinflussung des Tasteneingabeabschnittes 31 bereitgestellt werden. Die Intervalle der Bitraten- und der Zieldatengrößenauswahl, die angewendet werden sind die selben wie sie oben in Bezug auf 1 bis 4 beschrieben worden sind.
  • Wenn eine Datenextraktionsrate unter Verwendung des Tasteneingabeabschnittes 31 ausgewählt worden ist, extrahiert der Controller 32 die über einen der Pfade des Eingabeabschnittes, d.h., Mikrofon 43, Eingangsanschluss 45 und Schnittstelle 49 eingegeben werden, in Übereinstimmung mit dem geschichteten bitgeteilten arithmetischen Codierverfahren, und speichert die extrahierten Daten in dem Speicherabschnitt, d.h. in dem Speicher 35.
  • Beispielsweise, wenn durch das geschichtete BSAC-Verfahren erzeugte Bitstromaudiodaten von dem Computer 60 über die Schnittstelle 49 eingegeben werden, speichert der Controller 32 die Daten in dem Speicher 35 bis die Bitrate der Schicht ausgewählte Rate erreicht, oder bis die Bytes der Daten die ausgewählte Zieldatengröße erreichen. Nach dem Erreichen der ausgewählten Rate oder der ausgewählten Bytes, wenn die Daten nicht gespeichert, wie besser aus der Diskussion der 8 und 9 unten verstanden wird.
  • Jedoch, wenn die Dateneingabe durch die Schnittstelle 49 bestimmt wird als in von dem geschichteten BSAC abweichenden Audiodatenformaten wie z.B. einer Pulskodmodulation (PCM), lädt der Controller 32 den bitgeteilten Codecabschnitt 37 zum Codieren der Daten in Übereinstimmung mit dem geschichteten BSAC-Verfahren auf eine vorbestimmte Extraktionsrate. Dann speichert der Controller 32 die Daten im Speicher 35. Der Typ der Audiodaten kann von der Kopfinformation bestimmt werden, d.h., Bitrateninformation ist im Kopf enthalten. Demgemäß wird die ausgewählte Bitextraktionsrate, beispielsweise 8 Kilobyte pro Sekunden pro Schicht und der Wert der höchsten Schicht, beispielsweise 64 Kilobyte pro Sekunden in dem Kopf des codierten Audiosignals eingeschlossen. Daher kann ein Verfahren, das die beste Effizienz beim Reproduzieren der codierten Audiodaten zeigt, erhalten werden durch Zugriff auf die in dem Kopf gespeicherte Information. Beispielsweise, wenn Audiodaten durch einen Codierer bei einer Bitrate von 96 Kilobyte pro Sekunden codiert werden, kann beispielsweise der qualitativ beste Klang wieder hergestellt werden durch einen Decodierer der entsprechend dem Codierer eine Bitrate von 96 Kilobyte pro Sekunden hat.
  • Wenn die Daten einer Analogsignaleingabe durch das Mikrofon 43 oder den Eingangsanschluss 45 sind, werden die Daten in Digitaldaten umgesetzt, die abgetastet werden bei einer vorbestimmten Abtastrate durch den A/D-Umsetzer 39. Dann werden die Daten durch den bitgeteilten Codecabschnitt 37 in Übereinstimmung mit einer ausgewählten Extraktionsrate codiert, und im Speicher 35 gespeichert.
  • Ein Dateneditierprozess des Digitalaudioabspielers wird nachstehend unter Bezugnahme auf 6 beschrieben. Hier sollte verstanden werden, dass der Benutzer vorzugsweise bereits entweder eine gewünschte Datenextraktionsrate durch Auswahl einer Bitrate oder einer Zieldatengröße ausgewählt hat unter Verwendung von beispielsweise dem Datenextraktionsratenauswahldialog 14e der 5B. Es sollte auch verstanden werden, dass obwohl 5A und 5B sich auf einen tragbaren Digitalaudioabspieler beziehen, der Digitalaudioabspieler auch computererzeugt sein kann und auf einem Schirm des Computers mit einer Optionstaste 31a angezeigt werden kann und die Aktivierung der Optionstaste zu einer Anzeige führen würde, wie in 2 gezeigt, und die Aktivierung einer Editiertaste auf einer Menüleiste zu einer Anzeige entweder wie in 5B oder wie in 3A3D gezeigt führen würde.
  • Zuerst wird bestimmt, ob ein Speicherauswahlsignal in Bezug auf ein externes Audiosignal eingegeben worden ist oder nicht (Schritt 200). Hier ist das externe Signal ein Signal, das über den Eingabeabschnitt eingegeben worden ist, d.h., über die Schnittstelle 49, das Mikrofon 43 oder den Eingangsanschluss 45. Auch schließt das Speicherauswahlsignal ein Signal ein, das durch Manipulation von beispielsweise einer Speicher- oder Aufzeichnungstaste an dem Tasteneingabeabschnitt 31 erzeugt wird, und ein Steuersignal, das den Beginn eines Herunterladens von außen anzeigt.
  • Wenn das Speicherauswahlsignal eingegeben wird, wird bestimmt, ob oder nicht die Datenextraktionsrate ausgewählt worden ist (Schritt 220). Wenn die Datenextraktionsrate als ausgewählt bestimmt worden ist, wird das empfangene Audiosignal durch das geschichtete bitgeteilte arithmetische Codierverfahren (BSAC-Verfahren) in Übereinstimmung mit der ausgewählten Extraktionsrate codiert (Schritt 240). Das codierte Audiosignal wird dann im Speicher 35 gespeichert (Schritt 250).
  • Unterdessen, wenn das empfangene Audiosignal bereits bitstromcodiert ist durch das geschichtete BSAC-Verfahren, werden die Daten gespeichert bis die Bitratenschicht des empfangenen Signals die ausgewählte Extraktionsrate entsprechend entweder der ausgewählten Bitrate oder der ausgewählten Zieldatengröße erreicht, was bedeutet, dass Schritt 240 in diesem Fall weggelassen wird.
  • Wenn bestimmt wird, dass im Schritt 220 keine Extraktionsrate ausgewählt worden ist, wird das empfangene Audiosignal direkt in Speicher 35 gespeichert (Schritt 260). Alternativ kann im Schritt 260 das Audiosignal durch das bitgeteilte arithmetische Codierverfahren in Übereinstimmung mit einer vorbestimmten Normalbitrate codiert werden und dann im Speicher 35 gespeichert werden.
  • Der Prozess des Codierens von Audiodaten durch das geschichtete bitgeteilte arithmetische Codierverfahren mit dem bitgeteilten Codec 37 oder dem Audioeditierprogramm 18 in Übereinstimmung mit der vorbestimmten Extraktionsrate in gemäß der vorliegenden Erfindung wird nachstehend detaillierter beschrieben. Man beachte unterdessen, dass die geschichteten BSAC Codier- und Decodierverfahren, die in der vorliegenden Erfindung verwendet werden, ähnlich denen sind, die in US-A-6122618 und US-A-6148288 offenbart sind.
  • Als erstes werden die bitgeteilten Codier- und Decodierverfahren schematisch beschrieben.
  • Es wird Bezug genommen auf 7, die den bitgeteilten Codierer des bitgeteilten Codecabschnittes 37 zeigt, der geschichtete bitgeteilte Codierer schließt einen Zeit-/Frequenzabbildungsabschnitt 37a ein, einen Psychoakustikabschnitt 37b, einen Quantisierungsabschnitt 37c und einen Bitpackabschnitt 37d.
  • Der Zeit-/Frequenzabbildungsabschnitt 37a setzt Audiosignale eines Zeitbereichs in Signale eines Frequenzbereichs um. Die Signale im Frequenzbereich unterscheiden sich stark voneinander in Übereinstimmung mit einem menschlichen Psychoakustikmodell (z.B. ISO/IEC 1117 2–3) von einem Signal, das von einem Menschen wahrnehmbar ist zu einem nicht wahrnehmbaren Signal. Entsprechend kann durch Differenzieren der den jeweiligen Frequenzbandbreiten zugeordneten Bits die Kompressionseffizienz erhöht werden.
  • Der Psychoakustikabschnitt 37b koppelt die umgesetzten Signale durch Signale vorbestimmter Unterbänder durch den Zeit-/Frequenzabbildungsabschnitt 37a und berechnet einen Maskierschwellwert bei jedem Unterband unter Verwendung eines Maskierphänomens, das durch die Interaktion mit den jeweiligen Signalen erzeugt wird. Mit dem Maskierschwellwert kann ein minimaler Signalpegel, der Töne beinhaltet, die aber nicht vom Menschen wahrnehmbar sind, bedingt durch die Größe des Eingangsignals und die Interaktion der jeweiligen Signale, erhalten.
  • Der Quantisierungsabschnitt 37c quantisiert die Signale für jedes vorbestimmte Codierband derart, dass das Quantisierungsrauschen jedes Bandes kleiner wird als der Maskierschwellwert. Mit anderen Worten, die Frequenzsignale jedes Bandes werden einer skalaren Quantisierung derart unterzogen, dass die Größe des Quantisierungsrauschens jedes Bandes kleiner ist als der Maskierschwellwert, um nicht wahrnehmbar zu sein. Das Quantisieren wird derart ausgeführt, dass ein Rausch-zu-Masken-Verhältniswert (NMR-Wert), der ein Verhältnis des von dem Psychoakustikabschnitt 37b berechneten Maskierungsschwellwert zu dem bei jedem Band erzeugten Rauschen ist, geringer oder gleich 0 dB ist. Der NMR-Wert, der kleiner ist oder gleich 0 dB, bedeutet, dass der Maskierungsschwellwert höher ist als das Quantisierungsrauschen. Mit anderen Worten, das Quantisierungsrauschen ist nicht hörbar.
  • Um das skalierbare Audiocodec zu erzielen, kombiniert der Bitpacketisierungsabschnitt 37d die von dem Quantisierungsabschnitt 37c quantisierten Frequenzdaten mit Nebeninformation über die jeweiligen Unterbänder und die quantisierte Information der Audiodaten in Übereinstimmung mit der Bitrate der jeweiligen Schichten.
  • 8 zeigt ein Beispiel, bei dem der auf 5 Bit quantisierte Wert in Binärdarstellung dargestellt wird. Entsprechend dem geschichteten Verfahren werden die signifikantesten Bits gekoppelt und codiert. Beispielsweise, wenn das Codieren in 4-Bit-Einheiten vorgenommen wird, werden die binären Zahlen 0100 (durch Punkte in Blöcke gefasst) (entsprechend dem signifikantesten Vektor bzw. "Most Significant Vector MSV") zuerst codiert. Dann wird das Codieren weiterhin Vektor pro Vektor fortgesetzt bis zu den am wenigsten signifikantesten Bits. In einer solchen Situation werden die Bits effizient in Codes komprimiert unter Verwendung eines geeigneten Wahrscheinlichkeitsverteilungs- und arithmetischen Codierverfahrens. Die von den obigen Verfahren erzeugte Bitstromstruktur ist in 9 gezeigt.
  • Das heißt, der Codierer codiert das Audiosignal in eine geschichtete Bitstromstruktur, die aus einer Basisschicht (Schicht 0) und einer Vielzahl von Verbesserungsschichten besteht. Jede Schicht besteht aus einem Kopfbereich, einem Nebeninformationsschreibbereich und einem Datenbereich.
  • Die Basisschicht hat die geringste Bitrate und die nächste Verbesserungsschicht hat die Bitrate, die höher ist als die der Basisschicht um ein vorbestimmtes Bitratenintervall. Auf diese Weise haben die Verbesserungsschichten zunehmende Bitraten bei vorbestimmten Intervallen.
  • Nur die MSBs (die am signifikantesten Bits) werden in der Vorhand der Basisschicht dargestellt, so dass nur der Umriss aller Frequenzkomponenten codiert wird. Je mehr Bits in niedrigeren Bits dargestellt werden, um so detaillierter kann die Information ausgedrückt werden. Da Detailinformationsdatenwerte in Übereinstimmung mit zunehmenden Bitraten codiert werden, d.h., ein Verbessern der Schichten, kann die Audioqualität verbessert werden.
  • Als nächstes wird ein Verfahren zum Aufbau eines skalierbaren Bitstroms unter Verwendung der Daten, die wie oben ausgedrückt werden, beschrieben. Zuerst wird neben Nebeninformation, die für die Basisschicht zu verwenden ist, eine Quantisierungsbitinformation für jedes Quantisierungsband codiert. Die quantisierten Werte werden sequenziell von dem MSBs (signifikantesten Bits) zu den LSBs (am wenigsten signifikante Bits) codiert und von den niedrigen Frequenzkomponenten zu den hohen Frequenzkomponenten. Wenn Quantisierungsbits eines bestimmten Bandes weniger sind als jene des Bandes, das momentan codiert wird, wird eine Codierung nicht vorgenommen. Wenn Quantisierungsbits des Bandes gleich jenen von dem Band sind, das momentan codiert wird, wird eine Codierung vorgenommen. Hier können, wenn es keine Bandeinschränkung bei dem Codieren von Signalen der jeweiligen Schichten gibt, Töne, die für das Ohr unangenehm sind, erzeugt werden. Dies ergibt sich, weil Signale beim Neuspeichern von Signalen von Schichten niedriger Bitraten in dem Fall des Vornehmens einer Codierung von dem MSB zu dem LSB unabhängig von den Bändern ein- und ausgeschaltet werden. Daher ist es ratsam, die Bänder in angemessener Weise in Übereinstimmung mit den Bitraten einzuschränken.
  • Nachdem die Basisschicht codiert worden ist, werden die Nebeninformation und der quantisierte Wert der Audiodaten für die nächste Verbesserungsschicht codiert. Auf solche Weise werden Daten aller Schichten in Entsprechung zu der ausgewählten Bitrate codiert. Die derart codierte Information wird zusammengesammelt zum Bilden eines Bitstroms.
  • Wie in 9 gezeigt, hat der von dem Codierer erstellte Bitstrom eine geschichtete Struktur, in der der Bitstrom der niedrigsten Schicht in dem Bitstrom der höheren Schicht enthalten ist.
  • Das Audiosignal mit einer solchen geschichteten Struktur wird von wichtigeren Signalkomponenten zu weniger wichtigen Signalkomponenten codiert. Unter Verwendung derart gebildeter Bitströme können Bitströme mit einer niedrigeren Bitrate gebildet werden durch einfaches Neuanordnen der Bitströme niedriger Bitrate, die in dem Bitstrom mit der höchsten Bitrate enthalten sind auf eine Benutzeranforderung hin. Mit anderen Worten, Bitströme, die auf Echtzeitbasis vom Codierer gebildet werden, oder in einem Medium gespeicherte Bitströme, können neuangeordnet werden, um geeignet zu sein für eine gewünschte Bitrate von einer Anfrage eines Benutzers, um dann gesendet zu werden. Auch, wenn die Leistungsfähigkeit der Hardware des Benutzers schlecht ist oder der Benutzer wünscht, die Komplexität eines Decoders zu reduzieren, selbst bei geeigneten Bitströmen, können nur einige Bitströme wiederhergestellt werden, hierdurch die Komplexität steuernd.
  • Beispielsweise, wenn eine Bitrate auf 64 kb/s ausgewählt worden ist, wird ein Bitstrom von der vorbestimmten Basisschicht gebildet für die obere Schicht, um 64 kb/s zu sein. Demgemäß ist durch Bilden eines skalierbaren Bitstrom die Bitrate einer Basisschicht 16 kb/s, die einer oberen Schicht des 64 kb/s und die jeweiligen Verbesserungsschichten haben Bitratenintervalle von 8 kb/s, d.h., der Bitstrom hat sieben Schichten von 16, 24, 32, 40, 48, 56 und 64 kb/s. Da der von dem Codierer gebildete Bitstrom eine geschichtete Struktur hat, enthält der Bitstrom der oberen Schicht von 64 kb/s die Bitströme der jeweiligen Schichten (16, 24, 32, 40, 48, 56 und 64 kb/s). Wenn ein Benutzer Daten anfordert für die obere Schicht, wird der Bitstrom für die obere Schicht gesendet ohne irgendeine Verarbeitung davon. Auch, wenn ein anderer Benutzer Daten für die Basisschicht anfordert (entsprechend 16 kb/s), werden nur die Vorhand-Bitströme einfach gesendet.
  • Die jeweiligen Schichten haben begrenzte Bandbreiten in Übereinstimmung mit Bitraten und die End-Quantisierungsbänder unterscheiden sich. Wenn die eingegebenen Daten PCM-Daten sind, die bei 48 Kilohertz abgetastet worden sind und die Größe eines Rahmens 1024 ist, ist die Anzahl von für einen Rahmen für eine Bitrate von 64 kb/s verwendbaren Bits 1365, 3333 (= 64000 Bit/s × (1024/48000)) im Mittel. In ähnlicher Weise kann die Anzahl von für einen Rahmen verwendbarer Bits in Übereinstimmung mit den jeweiligen Bitraten berechnet werden.
  • Wenn eine Extraktionsrate ausgewählt worden ist, wird die Bitrate der obersten Schicht der ausgewählten Extraktionsrate bestimmt und demgemäß werden Bitströme von den Bitraten der Basisschicht zu den Zielschichten bei ausgewählten Bitratenintervallen durch den Codierungsprozess in Übereinstimmung mit dem geschichteten BSAC-Verfahren erzeugt.
  • Wie in 10 gezeigt schließt der Decoder einen Bitstromanalyseabschnitt 37e ein, einen Umkehrquantisierungsabschnitt 37f und einen Frequenz-/Zeit-Abbildungsabschnitt 37g.
  • Der Bitstromanalyseabschnitt 37e führt einen Decodierprozess in der Reihenfolge aus, in der die jeweiligen Schichten erzeugt werden. Auch führt der Bitstromanalyseabschnitt 37e einen Decodierprozess für die jeweiligen Schichten in einer Reihenfolge der Wichtigkeit der Bits der jeweiligen Bitströme aus.
  • Der Umkehrquantisierungsabschnitt 37f stellt durch den Bitstromanalyseabschnitt 37e decodierte Daten in einem Signal einer Ursprungsgröße wieder her.
  • Der Frequenz-/Zeitabbildungsabschnitt 37g setzt umgekehrt quantisierte Audiosignale in einem Frequenzbereich um in Signale in einem Zeitbereich.
  • Das decodierte Signal wird durch den D/A-Umsetzer in ein Analogsignal umgesetzt und über den Ausgangsanschluss 37 während des Wiedergabeprozesses ausgegeben.
  • Wie oben beschrieben kann in Übereinstimmung mit dem Audiodateneditierverfahren und das Editierverfahren verwendendem Aufzeichnungsmedium und einem Digitalaudioabspieler der vorliegenden Erfindung, da die Audiodatendatei effizient editiert werden kann bei irgendeiner Skalierung die Speicherkapazität der Digitalaudioeinrichtung, effizienter genutzt werden.

Claims (44)

  1. Gerät zum Abspielen von Digital-Audio, wobei das Gerät umfasst: eine Speichervorrichtung (35) zum Speichern von Digital-Audiodaten; eine Wiedergabevorrichtung (32, 41) zum Abspielen von in der Speichervorrichtung gespeicherten Audiodaten; eine Vorrichtung (49, 60) zum Empfangen von Audiosignalen; eine Verarbeitungsvorrichtung (11, 15, 16; 31, 32, 37); und eine Verarbeitungsvorrichtung (11, 15, 16; 31, 32, 37), die konfiguriert ist zum Verarbeiten von Audiosignalen, die von der Vorrichtung (43, 45, 49) zum Empfangen von Audiosignalen empfangen worden sind, zum Erzeugen von Digital-Audiodaten in einem geschichteten Format, mit einer auswählbaren Bitrate oder Dateigröße, und Speichern der Digital-Audiodaten in der Speichervorrichtung (35); dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung (11, 15, 16; 31, 32, 37) eine Benutzereingabevorrichtung (15, 31) einschließt zum Einstellen der auswählbaren Bitrate oder Dateigröße.
  2. Gerät nach Anspruch 1, wobei die Digital-Audiodaten ein bitgeteiltes arithmetisches Codierformat haben.
  3. Gerät nach Anspruch 1 oder 2, wobei die Vorrichtung (43, 45, 49) zum Empfangen von Audiosignalen eine Vorrichtung umfasst zum Empfangen von Digital-Audiosignalen und die Verarbeitungsvorrichtung (11, 15, 16; 31, 32, 37) konfiguriert ist zum Umsetzen empfangener Digital-Audiosignale mit einem Format, das von dem für die Digital-Audiodaten verwendeten Format abweicht, in das Format, das für die Digital-Audiodaten verwendet wird.
  4. Gerät nach einem der vorhergehenden Ansprüche, wobei die Verarbeitungsvorrichtung (11, 15, 16; 31, 32, 37) konfiguriert ist zum Beschneiden empfangener Digital-Audiosignale mit dem für die Digital-Audiodaten verwendeten Format zum Erzeugen der Digital-Audiodaten.
  5. Gerät nach einem der vorhergehenden Ansprüche, wobei die Vorrichtung (43, 45, 49) zum Empfangen von Audiosignalen eine Vorrichtung umfasst zum Empfangen von Audiosignalen von dem Internet (70).
  6. Gerät nach einem der vorhergehenden Ansprüche, wobei die Speichervorrichtung (35) und die Wiedergabevorrichtung in einem tragbaren Digital-Audioabspieler aufgenommen sind und die Verarbeitungsvorrichtung (11, 15, 16) und die Vorrichtung zum Empfangen von Audiosignalen in einem Personalcomputer (10) aufgenommen sind.
  7. Digital-Audioabspieler zum Speichern von Digital-Audiodaten in einem Speicherabschnitt, wobei die Digital-Audiodaten in einem geschichteten Format vorliegen, umfassend: einen Controller (32) zum Codieren eines über einen Eingabeabschnitt (43, 45, 49) entsprechend einer abgestimmten Datenextraktionsrate empfangener Audiosignale, und Speichern der codierten Audiodaten in dem Speicherabschnitt (35); dadurch gekennzeichnet, dass der Digital-Audioabspieler einen Tasteneingabeabschnitt (31) umfasst mit einer vorbestimmten Taste (31a) zum Ermöglichen des Abstimmens der Datenextraktionsrate in Bezug auf das über den Eingabeabschnitt (43, 45, 49) eingegebene Audiosignal.
  8. Digital-Audioabspieler nach Anspruch 7, ferner eine Anzeige (33) umfassend zum Anzeigen eines für einen Umfang des frei verbleibenden Speichers in dem Speicherabschnitt (35) indikativen Wertes wie durch den Controller (32) bestimmt.
  9. Digital-Audioabspieler nach Anspruch 7, wobei die vorbestimmte Taste (31a), wenn sie von einem Benutzer aktiviert wird, ein vorbestimmtes Tastensignal für den Controller (32) bereitstellt und der Controller (32) ansprechend auf das Tastensignal ein Menü (18a) an einer Anzeige (14) anzeigt, ein Bitratenabstimm-Tool zum Auswählen einer Bitrate bei vorbestimmten Kilobyte pro Sekunden-Intervallen und ein Zieldatengrößen-Tool zum Auswählen einer Zieldatengröße bei vorbestimmten Kilobyte-Intervallen, wobei die Extraktionsrate in Übereinstimmung mit einer ausgewählten Bitrate oder einer ausgewählten Zieldatengröße abgestimmt wird.
  10. Digital-Audioabspieler nach Anspruch 9, wobei die Anzeige (14) einen Wert anzeigt, der indikativ ist für einen Umfang freien verbleibenden Speicher in dem Speicherabschnitt, wie durch den Controller (32) ansprechend auf das Tastensignal bestimmt.
  11. Digital-Audioabspieler nach Anspruch 7, ferner einen bitgeteilte arithmetischen Codec-Abschnitt umfassend, wobei der Controller (32) den bitgeteilte arithmetischen Codec-Abschnitt lädt zum Codieren des über den Eingabeabschnitt (43, 45, 49) empfangenen Audiosignals durch ein bitgeteiltes arithmetisches Codierverfahren gemäß der abgestimmten Datenextraktionsrate, und zum Speichern der codierten Audiodaten als eine Datei in dem Speicherabschnitt (35), wobei der Controller (32) ferner den bitgeteilte arithmetischen Codec-Abschnitt lädt zum Decodieren der in dem Speicherabschnitt (35) gespeicherten Datei durch das bitgeteilte arithmetische Codierverfahren zum Reproduzieren des Audiosignals.
  12. Digital-Audioabspieler nach Anspruch 9, ferner einen bitgeteilte arithmetischen Codec-Abschnitt umfassend, wobei der Controller (32) den bitgeteilte arithmetischen Codec-Abschnitt lädt zum Codieren des über den Eingabeabschnitt (43, 45, 49) empfangenen Audiosignals durch ein bitgeteiltes arithmetisches Codierverfahren gemäß der abgestimmten Datenextraktionsrate, und zum Speichern der codierten Audiodaten als eine Datei in dem Speicherabschnitt, wobei der Controller (32) ferner den bitgeteilte arithmetischen Codier-Abschnitt lädt zum Decodieren der in dem Speicherabschnitt (35) gespeicherten Datei durch das bitgeteilte arithmetische Codierverfahren zum Reproduzieren des Audiosignals.
  13. Digital-Audioabspieler nach Anspruch 7, wobei der Eingabeabschnitt (43, 45, 49) einschließt: eine Schnittstelle (49) zum Unterstützen einer bidirektionalen Kommunikation mit einem Computer (60); ein Mikrofon (43) zum Empfangen eines Audiosignals von einem Benutzer; einen Analog-Audiosignaleingangsanschluss (45) zum Empfangen eines Analog-Audiosignals von einer externen Quelle; und einen Analog-zu-Digitalumsetzer (39) zum Umsetzen eines über das Mikrofon (43) oder den Analog-Audiosignaleingangsanschluss (45) empfangenen Audiosignals.
  14. Digital-Audioabspieler nach Anspruch 9, wobei der Eingabeabschnitt (43, 45, 49) einschließt: einen Schnittstelle (49) zum Unterstützen einer bidirektionalen Kommunikation mit einem Computer (60); ein Mikrofon (43) zum Empfangen eines Audiosignals von einem Benutzer; einen Analog-Audiosignaleingabeanschluss (45) zum Empfangen eines Analog-Audiosignals von einer externen Quelle; und einen Analog-zu-Digitalumsetzer (39) zum Umsetzen eines über das Mikrofon (43) oder den Analog-Audiosignaleingabeanschluss (45) empfangenen Audiosignals.
  15. Digital-Audioabspieler nach Anspruch 14, ferner einen bitgeteilte arithmetischen Codec-Abschnitt umfassend, wobei der Controller (32) den bitgeteilte arithmetischen Codec-Abschnitt lädt zum Codieren des von dem Eingangsabschnitt (43, 45, 49) empfangenen Audiosignals durch ein bitgeteiltes arithmetisches Codierverfahren gemäß der abgestimmten Datenextraktionsrate, und zum Speichern der codierten Audiodaten als eine Datei in dem Speicherabschnitt (35), wobei der Controller (32) ferner den arithmetischen Bitratencodec-Abschnitt (37) lädt zum Decodieren der in dem Speicherabschnitt (35) gespeicherten Datei durch das bitgeteilte arithmetische Codierverfahren zum Reproduzieren des Audiosignals.
  16. Digital-Audioabspieler nach Anspruch 15, wobei der Controller (32) auf dem Empfang eines in Übereinstimmung mit einem geschichteten bitgeteilte arithmetischen Codierverfahren gebildeten und über die Schnittstelle (49) empfangenen Bitstroms hin, die empfangenen Bitstromdaten speichert bis eine Bitratenschicht entsprechend der ausgewählten Bitrate empfangen wird, derart, dass Bitratenschichten, die größer sind als die ausgewählte Bitrate, verworfen werden.
  17. Digital-Audioabspieler nach Anspruch 15, wobei der Controller (32) auf dem Empfang von in Übereinstimmung mit einem geschichteten bitgeteilte arithmetischen Codierverfahren gebildeten und über die Schnittstelle (49) empfangenen Bitstroms, die empfangenen Bitstromdaten speichert bis der Umfang der gespeicherten Bitstromdaten der ausgewählten Zieldatengröße entspricht, und irgendwelche verbleibenden Bitstromdaten verworfen werden.
  18. Digital-Audioabspieler nach Anspruch 7, wobei der Digital-Audioabspieler tragbar ist.
  19. Digital-Audioabspieler nach Anspruch 7, wobei der Digital-Audioabspieler computererzeugt wird.
  20. Digital-Audioabspieler nach Anspruch 11, wobei der bitgeteilte arithmetische Codec-Abschnitt (37) umfasst: einen Quantisierabschnitt (37c) zum Quantisieren von eingegebenen Audiodaten für vorbestimmte Codierbänder; und einen Bitpackabschnitt (37d) zum Erzeugen eines geschichteten Bitstroms durch eine Reihenfolge von Bitsignifikanz, durch Ausdrücken der Quantisierungsdaten in einem Binärausdruck einer vorbestimmten Anzahl von Bits, Koppeln der Daten in Biteinheit und Codieren der Daten von einer oberen Bitfolge mit den signifikantesten Bits zu einer niederen Bitfolge mit den am wenigsten signifikanten Bits.
  21. Digital-Audioabspieler nach Anspruch 11, wobei der bitgeteilte Codec-Abschnitt (37) umfasst: einen Bitstromanalyseabschnitt zum Analysieren von Bitsignifikanz der den Bitstrom bildenden Bits und Decodieren der geschichteten Bitströme durch eine Reihenfolge der Schichterzeugung, von dem signifikantesten Bit zu dem am wenigsten signifikanten Bit; einen Umkehrquantisierungsabschnitt zum Neuspeichern der durch den Bitstromanalyseabschnitt decodierten Daten in ein Ursprungsgrößensignal; und einen Frequenz-/Zeitabbildungsabschnitt (37a) zum Umsetzen des Audiosignals in einem umkehr-quantisierten Frequenzbereich durch den Umkehrquantisierungsabschnitt in ein Signal in einem Zeitbereich.
  22. Digital-Audioabspieler nach Anspruch 19, wobei der Tasteneingabeabschnitt (31) eine Menüleiste umfasst, und die vorbestimmte Taste einer Eingabetaste auf der Menüleiste umfasst.
  23. Digital-Audioabspieler nach Anspruch 18, ferner einen bitgeteilte arithmetischen Codec-Abschnitt (37) umfassend, wobei der Controller (32) den bitgeteilte arithmetischen Codec-Abschnitt (37) zum Codieren des durch den Eingabeabschnitt (43, 45, 49) empfangenen Audiosignals durch ein bitgeteiltes arithmetisches Codierverfahren gemäß der abgestimmten Datenextraktionsrate lädt, und zum Speichern der codierten Audiodaten als eine Datei in dem Speicherabschnitt (35), wobei der Controller (32) ferner den bitgeteilte arithmetischen Codec-Abschnitt (37) zum Decodieren der in dem Speicherabschnitt (35) gespeicherten Datei durch das bitgeteilte arithmetische Codierverfahren lädt zum Reproduzieren des Audiosignals.
  24. Digital-Audioabspieler nach Anspruch 23, wobei der Controller (32) auf den Empfang von in Übereinstimmung mit einem geschichteten bitgeteilte arithmetischen Codierverfahren gebildeten und über eine Schnittstelle (49) empfangenen Bitstroms hin die empfangenen Bitstromdaten speichert bis eine Bitratenschicht entsprechend der ausgewählten Bitrate empfangen wird, derart, dass Bitratenschichten, die größer sind als die ausgewählte Bitrate, verworfen werden.
  25. Digital-Audioabspieler nach Anspruch 23, wobei der Controller (32) auf den Empfang von in Übereinstimmung mit einem geschichteten bitgeteilte arithmetischen Codierverfahren gebildeten und über die Schnittstelle (49) empfangenen Bitstroms hin die empfangenen Bitstromdaten speichert bis der Umfang an gespeicherten Bitstromdaten der ausgewählten Zieldatengröße entspricht, und irgendwelche verbleibenden Bitstromdaten verworfen werden.
  26. Digital-Audioabspieler nach Anspruch 19, wobei die vorbestimmte Taste (31a) wenn sie von einem Benutzer aktiviert wird, ein vorbestimmtes Tastensignal für den Controller (32) bereitstellt und der Controller (32) ansprechend auf das Tastensignal ein Menü auf einer Anzeige anzeigt, ein Bitratenabstimm-Tool zum Auswählen einer Bitrate bei vorbestimmten Kilobyte-pro-Sekunden-Intervallen und ein Zieldatengrößen-Tool zum Auswählen einer Zieldatengröße bei vorbestimmten Kilobyte-Intervallen, wobei die Datenextraktionsrate in Übereinstimmung mit einer ausgewählten Bitrate oder einer ausgewählten Zieldatengröße abgestimmt wird.
  27. Digital-Audioabspieler nach Anspruch 26, wobei der Controller (32) eine Audio-Editiervorrichtung (18) umfasst, die einschließt: einen Menübereitstellungsabschnitt (18a) zum Bereitstellen einer verschiedene Menüs und Audio-Editierungen zeigenden Anzeige; und einen Editierabschnitt (18b) zum Vornehmen einer geschichteten bitgeteilten Codierung des Audiosignals.
  28. Digital-Audioabspieler nach Anspruch 27, wobei der Editierabschnitt (18b) ein bitgeteiltes arithmetisches Codec-Programm umfasst zum Codieren des durch den Eingabeabschnitt (43, 45, 49) empfangenen Audiosignals durch ein bitgeteiltes arithmetisches Codierverfahren in Übereinstimmung mit der abgestimmten Datenextraktionsrate, und Speichern der codierten Audiodaten als eine Datei in dem Speicherabschnitt (35), wobei der Editierabschnitt (18b) ferner das bitgeteilte arithmetische Codierprogramm lädt zum Decodieren der in dem Speicherabschnitt (35) gespeicherten Datei durch das bitgeteilte arithmetische Codierverfahren zum Reproduzieren des Audiosignals.
  29. Digital-Audioabspieler nach Anspruch 27, wobei die vorbestimmten Kilobyte pro Sekunden-Intervalle 1 Kilobyte pro Sekunden-Intervalle umfassen.
  30. Digital-Audioabspieler nach Anspruch 27, wobei die vorbestimmten Kilobyte-Intervalle 1 Kilobyte-Intervalle umfassen.
  31. Computer mit einer Digital-Audioeditiervorrichtung zum Codieren eines Audiosignals und Speichern des codierten Audiosignals in einem Speicher, wobei die Audioeditiervorrichtung (18) gekennzeichnet ist durch: ein geschichtetes bitgeteiltes arithmetisches Codierverfahren zum Codieren des Audiosignals; einen Menübereitstellungsabschnitt (18a) zum Bereitstellen einer verschiedene Menüs der Audioeditierung zeigenden Anzeige, wobei der Menübereitstellungsabschnitt (18a) einen Tasteneingabeabschnitt mit einer vorbestimmten Taste zum Ermöglichen des Abstimmens einer Datenextraktionsrate anzeigt; und einen Editierabschnitt (18b) zum Vornehmen geschichteter bitgeteilter Codierung des Audiosignals in Übereinstimmung mit einem abgestimmten Datenextraktionsrate, und Speichern des codierten Audiosignals in dem Speicher.
  32. Computer nach Anspruch 31, wobei der Editierabschnitt (18b) ein bitgeteiltes arithmetisches Codec-Programm umfasst zum Codieren des Audiosignals in Übereinstimmung mit der abgestimmten Datenextraktionsrate durch das bitgeteilte arithmetische Codierverfahren, wobei der Editierabschnitt ferner das bitgeteilte arithmetische Codec-Programm lädt zum Codieren der in dem Speicher gespeicherten Datei durch das bitgeteilte arithmetische Codierverfahren zum Reproduzieren des Audiosignals.
  33. Computer nach Anspruch 32, wobei die vorbestimmte Taste (31a), wenn sie von einem Benutzer aktiviert wird, ein vorbestimmtes Tastensignal für den Menübereitstellungsabschnitt (18a) bereitstellt und der Menübereitstellungsabschnitt (18a) ansprechend auf das Tastensignal ein vorbestimmtes Menü auf einem Anzeigeschirm des Computers anzeigt, ein Bitratenabstimm-Tool zum Auswählen einer Bitrate bei vorbestimmten Kilobyte pro Sekunden-Intervallen, und ein Zieldatengrößen-Tool zum Auswählen einer Zieldatengröße bei vorbestimmten Kilobyte-Intervallen, wobei die Datenextraktionsrate in Übereinstimmung mit einer ausgewählten Bitrate oder einer ausgewählten Zieldatengröße abgestimmt wird.
  34. Computer nach Anspruch 33, wobei die vorbestimmten Kilobyte-pro-Sekunden-Intervalle 1-Kilobyte-pro-Sekunden-Intervalle umfassen.
  35. Computer nach Anspruch 33, wobei die vorbestimmten Kilobyte-Intervalle 1 Kilobyte-Intervalle umfassen.
  36. Computer nach Anspruch 33, wobei der Tasteneingabeabschnitt (31) eine Menüleiste umfasst, und die vorbestimmte Taste eine Editiertaste auf der Menüleiste umfasst.
  37. Computer nach Anspruch 33, wobei der Menübereitstellungsabschnitt (18a) eine Anzeige bereitstellt, die ein Dateimenü (14a) zeigt, wobei das Dateimenü (14a) umfasst: eine erste Menüleiste einschließlich einem Tasteneingabeabschnitt und der eine Editiertaste umfassenden vorbestimmten Taste; eine unterhalb der ersten Menüleiste positionierte zweite Menüleiste, wobei die zweite Menüleiste eine Herunterlad-Taste (25) umfasst, eine Hochlad-Taste (26) und eine Abspieltaste (27); einen Aufspaltbildschirm mit einem linken Anzeigeschirm und einem rechten Anzeigeschirm, wobei der linke Anzeigeschirm Dateiordner anzeigt, die in dem Speicher des Computers gespeichert sind, der rechte Anzeigeschirm Dateien anzeigt, die in einem Speicher eines tragbaren Digital-Audioabspielers gespeichert sind, wenn der tragbare Digital-Audioabspieler mit einem Ausgangsanschluss des Computers verbunden ist; einen Dateigrößenanzeigeabschnitt zum Anzeigen einer Größe eines der durch einen Benutzer zur weiteren Verarbeitung ausgewählten Dateiordner; und eine Speichergrößenanzeige zum Anzeigen einer Gesamtspeichergröße des Speichers des tragbaren Digital-Audioabspielers und zum Anzeigen eines Wertes, der Indikativ ist für einen Umfang verfügbaren freien Speicherplatzes in dem Speicher des Digital-Audioabspielers.
  38. Computer nach Anspruch 37, wobei der Menübereitstellungsabschnitt (18a) ein Editiermenü (14b, 14c, 14d) als das auf dem Anzeigeschirm angezeigte vorbestimmte Menü bereitstellt, wenn die Editiertaste durch den Benutzer aktiviert wird, wobei das Editiermenü umfasst: das Bitratenabstimm-Tool, wobei das Bitratenabstimm-Tool eine Bitratenanzeige einschließt zum Zeigen auswählbarer Bitratenwerte und eine Bitratendurchblättervorrichtung zum Blättern durch die auswählbaren Bitratenwerte; und ein Zieldatengrößen-Tool, wobei das Zieldatengrößen-Tool eine Zieldatengrößenanzeige einschließt zum Zeigen auswählbarer Zieldatengrößenwerte und eine Zieldatengrößendurchblättervorrichtung zum Blättern durch die auswählbaren Zieldatengrößenwerte.
  39. Computer nach Anspruch 38, wobei das Editiermenü (14b, 14c, 14d) ferner eine Herunterladen-nach-Editierung-Taste umfasst, um das automatische Herunterladen des codierten Audiosignals in den Speicher des tragbaren Digital-Audioabspielers auf das Abschließen der geschichteten bitgeteilten Codierung des Audiosignals hin zu ermöglichen.
  40. Computer nach Anspruch 39, wobei das Editiermenü ferner eine Eingabetaste und eine Abbruchtaste umfasst, wobei die Eingabetaste durch den Benutzer aktiviert wird zum Starten der geschichteten bitgeteilten Codierung des Audiosignals, und die Abbruchtaste durch den Benutzer aktiviert wird zum Schließen des Editiermenüs ohne Editieren des Audiosignals.
  41. Computer nach Anspruch 40, wobei das Editiermenü (14c) ferner eine Vorschau-Taste umfasst, um es dem Benutzer zu ermöglichen, eine Probe einer Qualität eines teilweise durch die geschichtete bitgeteilte Codierung entsprechend der ausgewählten Bitrate oder Zielgröße codierten Audiosignals vor dem Herunterladen zu erzeugen.
  42. Computer nach Anspruch 40, wobei die vorbestimmten Kilobyte-pro-Sekunden-Intervalle 1-Kilobyte-pro-Sekunden-Intervalle umfassend, und das Editiermenü (14b) ferner umfasst: ein Feinabstimm-Tool, wobei das Feinabstimm-Tool die Bitratenanzeige ermöglicht zum Zeigen auswählbarer Bitratenwerte in den 1-Kilobyte-pro-Sekunden-Intervallen; und ein Grobabstimm-Tool, wobei das Grobabstimm-Tool die Bitratenanzeige zum Zeigen auswählbarer Bitratenwerte in 8-Kilobyte-pro-Sekunden-Intervallen ermöglicht.
  43. Verfahren zum Codieren eines Audiosignals und Speichern des codierten Audiosignals in einem Speicher, wobei das Verfahren gekennzeichnet ist durch die Schritte: Codieren des Audiosignals gemäß einem geschichteten bitgeteilte arithmetischen Codierprogramm; Anzeigen eines Hauptmenüs auf einem Schirm des Computers, wobei das Hauptmenü eine Menüleiste einschließt, die einen Tasteneingabeabschnitt mit einer Vielzahl von Menütasten einschließlich einer vorbestimmten Taste zum Ermöglichen der Abstimmung der Datenextraktionsrate umfasst; Bestimmen, ob ansprechend auf das Aktivieren einer der Menütasten ein Tastensignal erzeugt wird; Bestimmen, wenn bestimmt wird, dass ein Tastensignal erzeugt wird, ob das Tastensignal einer vorbestimmten Taste entspricht; Bestimmen, ob eine Datenextraktionsrate ausgewählt worden ist, wenn bestimmt wird, dass das Tastensignal der vorbestimmten Taste entspricht; Editieren einer Audiosignaldatei in Übereinstimmung mit einem bitgeteilte arithmetischen Codierprogramm bei der Datenextraktionsrate, wenn bestimmt wird, dass die Datenextraktionsrate ausgewählt worden ist, und Ausgeben des codierten Audiosignals; Herunterladen des codierten Audiosignals in einen Speicher eines tragbaren Digital-Audioabspielers, wenn der Editierschritt abgeschlossen ist.
  44. Verfahren nach Anspruch 43, ferner die Schritte umfassend: Bestimmen, ob eine automatische Herunterladefunktion ausgewählt worden ist; Speichern des codierten Audiosignals in einen Speicher des Computers, wenn der Editierschritt abgeschlossen ist und es bestimmt worden ist, dass die automatische Herunterladefunktion nicht ausgewählt worden ist; und Vornehmen des Schrittes des Herunterladens, wenn bestimmt wird, dass die automatische Herunterladefunktion ausgewählt worden ist.
DE60114556T 2001-03-02 2001-11-01 Skalierbares digitales Audio Codec Expired - Lifetime DE60114556T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US796691 2001-03-02
US09/796,691 US20020133246A1 (en) 2001-03-02 2001-03-02 Method of editing audio data and recording medium thereof and digital audio player

Publications (2)

Publication Number Publication Date
DE60114556D1 DE60114556D1 (de) 2005-12-08
DE60114556T2 true DE60114556T2 (de) 2006-06-08

Family

ID=25168805

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60114556T Expired - Lifetime DE60114556T2 (de) 2001-03-02 2001-11-01 Skalierbares digitales Audio Codec

Country Status (7)

Country Link
US (2) US20020133246A1 (de)
EP (2) EP1638082A3 (de)
JP (2) JP2002268925A (de)
KR (1) KR100473889B1 (de)
CN (2) CN1252585C (de)
DE (1) DE60114556T2 (de)
TW (1) TW542992B (de)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020133246A1 (en) * 2001-03-02 2002-09-19 Hong-Kee Kim Method of editing audio data and recording medium thereof and digital audio player
KR100419216B1 (ko) * 2001-06-21 2004-02-19 삼성전자주식회사 기록되는 파일의 순서를 변경 가능한 광기록장치
US20030065734A1 (en) * 2001-09-29 2003-04-03 Sundaram Ramakesavan Method and apparatus for an integrated computer and PDA
EP1435619A3 (de) 2003-01-02 2007-07-18 Samsung Electronics Co., Ltd. Multimediagerät mit Diavorführung und zugehörigen Tonsignalen
JP2005267559A (ja) 2004-03-22 2005-09-29 Sony Corp 記録再生装置、情報転送管理方法および記録媒体
RU2007115914A (ru) * 2004-10-27 2008-11-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Кодер звука и способ кодирования звука
US20060098945A1 (en) * 2004-11-08 2006-05-11 Samsung Electronics Co., Ltd. Method for storing audio data of audio and video (AV) device
KR100713386B1 (ko) * 2004-12-16 2007-05-04 삼성전자주식회사 Amr 메시지를 이동통신단말기상에서 재생하는 방법 및 디코더
US20060248235A1 (en) * 2005-03-21 2006-11-02 Sony Corporation Method and apparatus for data collection in a media player
US8719034B2 (en) * 2005-09-13 2014-05-06 Nuance Communications, Inc. Displaying speech command input state information in a multimodal browser
TW200805077A (en) * 2006-07-04 2008-01-16 han-qin Xu A method for driving electronic components by means of file processing
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
KR100903958B1 (ko) * 2006-08-02 2009-06-25 엠텍비젼 주식회사 디지털 오디오 데이터의 복호화 방법, 디지털 오디오데이터의 복호화 장치 및 디지털 오디오 데이터의 복호화방법을 수행하는 기록매체
KR100797390B1 (ko) * 2006-09-29 2008-01-28 한국전자통신연구원 휴대용 디지털 오디오 재생 장치에서의 음악 연출 장치 및그 방법
US20080183755A1 (en) * 2007-01-31 2008-07-31 Sony Ericsson Mobile Communications Ab Methods for storing an alert file by converting the alert file to a lower complexity file format and using the converted alert file to generate an alert and related electronic devices and computer program products
KR101524572B1 (ko) * 2007-02-15 2015-06-01 삼성전자주식회사 터치스크린을 구비한 휴대 단말기의 인터페이스 제공 방법
KR101476138B1 (ko) * 2007-06-29 2014-12-26 삼성전자주식회사 코덱의 구성 설정 방법 및 이를 적용한 코덱
US8073995B2 (en) * 2009-10-19 2011-12-06 Research In Motion Limited Efficient low-latency buffer
CN101789255A (zh) * 2009-12-04 2010-07-28 康佳集团股份有限公司 一种基于手机原有歌曲更改歌词的处理方法及手机
KR101645294B1 (ko) * 2014-10-10 2016-08-03 삼성전자주식회사 코덱의 구성 설정 방법 및 이를 적용한 코덱
CN112433797B (zh) * 2020-11-23 2022-07-08 思必驰科技股份有限公司 可视化语音信号处理方法及系统
CN117221414B (zh) * 2023-11-09 2024-01-16 东莞中杰艾克森电子有限公司 一种调制解调器数据智能传输方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3164162B2 (ja) * 1991-10-24 2001-05-08 キヤノン株式会社 情報信号記憶装置及びその方法
US5302950A (en) * 1992-07-17 1994-04-12 International Business Machines Corp. Method of and apparatus for providing automatic determination of information sampling rate
JPH07131357A (ja) * 1993-10-29 1995-05-19 Matsushita Electric Ind Co Ltd デジタル信号記録装置及びデジタル信号再生装置
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US5903871A (en) * 1996-04-22 1999-05-11 Olympus Optical Co., Ltd. Voice recording and/or reproducing apparatus
US6233017B1 (en) * 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
JPH1166741A (ja) * 1997-08-18 1999-03-09 Hitachi Ltd 情報記録再生装置
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JPH11283332A (ja) * 1998-03-27 1999-10-15 Nippon Columbia Co Ltd 圧縮データ記憶装置
JPH11339392A (ja) * 1998-05-25 1999-12-10 Matsushita Electric Ind Co Ltd 記録装置
JP2000049620A (ja) * 1998-07-31 2000-02-18 Matsushita Electric Ind Co Ltd 音声圧縮伸長装置およびその方法
US6226618B1 (en) * 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
KR20000031335A (ko) * 1998-11-05 2000-06-05 고진 휴대용 디지털 장치
JP4406988B2 (ja) * 1999-03-29 2010-02-03 ソニー株式会社 不揮発性記録媒体、記録方法、記録装置
JP3868145B2 (ja) * 1999-04-12 2007-01-17 オリンパス株式会社 画像記録装置および電子カメラ装置
JP3528682B2 (ja) * 1999-05-28 2004-05-17 日本電気株式会社 映像及び音声信号の録画装置
JP2001290490A (ja) * 2000-01-31 2001-10-19 Casio Comput Co Ltd グラフィックデータ作成及び編集システム、デジタルオーディオプレーヤー、グラフィックデータ作成及び編集方法、及び記録媒体
US20020133246A1 (en) * 2001-03-02 2002-09-19 Hong-Kee Kim Method of editing audio data and recording medium thereof and digital audio player

Also Published As

Publication number Publication date
EP1638082A2 (de) 2006-03-22
CN1373414A (zh) 2002-10-09
JP2002268925A (ja) 2002-09-20
KR20020071691A (ko) 2002-09-13
US20020133246A1 (en) 2002-09-19
EP1638082A3 (de) 2007-02-28
EP1237149B1 (de) 2005-11-02
CN1783299A (zh) 2006-06-07
EP1237149A2 (de) 2002-09-04
TW542992B (en) 2003-07-21
US20070010903A1 (en) 2007-01-11
EP1237149A3 (de) 2003-09-17
DE60114556D1 (de) 2005-12-08
CN1252585C (zh) 2006-04-19
JP2006317972A (ja) 2006-11-24
KR100473889B1 (ko) 2005-03-08

Similar Documents

Publication Publication Date Title
DE60114556T2 (de) Skalierbares digitales Audio Codec
DE69531464T2 (de) Kodiergerät
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE60103424T2 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
DE10053732B4 (de) Gerät und Verfahren zum Schreiben und Wiedergeben von Daten
DE69829802T2 (de) Spracherkennungsapparat zum Übertragen von Sprachdaten auf einem Datenträger in Textdaten
DE69933119T2 (de) Verfahren und vorrichtung zur maskierung des quantisierungsrauschens von audiosignalen
DE4313175C2 (de) Verfahren und Vorrichtung zum Aufzeichnen von Audiosignalen in einen Speicher mit direktem Zugriff
EP0712131B1 (de) Vorrichtung zur Sprachaufzeichnung mit anschliessender Texterstellung
DE60226200T2 (de) Signaländerung mit Hilfe von kontinuierlicher Zeitverschiebung für CELP Kodierung mit niedriger Bitrate
DE19629184C2 (de) Sprachgesteuerte Aufzeichnungsvorrichtung
DE60316099T2 (de) Verfahren und Vorrichtung zur Codierung/Dekodierung von Audiodaten mit Skalierbarkeit
DE10297751B4 (de) Audiocodierverfahren und Vorrichtung, die die Harmonischen-Extraktion verwenden
DE60303346T2 (de) Encodier- und/oder Decodierverfahren für digitale Audiosignale, basierend auf Zeit-Frequenzkorrelation und Vorrichtung hierzu
DE69721404T2 (de) Diktiersystem
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten
DE69828849T2 (de) Signalverarbeitungsgerät und -verfahren sowie Informationsaufzeichnungsgerät
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
DE60307634T2 (de) Audiocodierung
DE60115042T2 (de) Kommunikationsvorrichtung und Verfahren zum Senden und Empfangen von Sprachsignalen unter Kombination eines Spracherkennungsmodules mit einer Kodiereinheit
EP1340352A2 (de) Verfahren und vorrichtung zum steuern der übertragung und wiedergabe von digitalen signalen
DE19906512C2 (de) Verfahren zum unbemerkten Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals
EP0632940B1 (de) Verfahren zur datenreduktion bei der speicherung und/oder übertragung digitaler audiosignale für studio-anwendungen
EP1030290A2 (de) Verfahren zum unbemerkten übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals
JPH11143497A (ja) 圧縮されたテーブルを用いてサブバンドごとに量子化係数を復号化する方法

Legal Events

Date Code Title Description
8364 No opposition during term of opposition