Übung1

Aufgabe 1

1. CD-Aufnahme (aufnahme_cd)

ue1_det_cd

Warum diese Abtastfrequenz? Auf Grund des Abtasttheorems von Shannon gilt: fa > 2 * fmax
Begründung:
In der Praxis bedeutet das Abtasttheorem, dass man vor der Abtastung die maximale Frequenz kennen oder herausfinden muss (zum Beispiel mit Hilfe der Fourier-Analyse eines hochfrequent abgetasteten Signals) und dass dann das Signal (zum Beispiel zum Zwecke der Digitalisierung) mit mehr als der doppelten Frequenz abgetastet werden muss, wenn man das Signal in guter Näherung rekonstruieren will.

2. Sprachaufnahme (aufnahme_stimme)

ue1_det_sprache

Aufgabe 2

1. Einlesen

1.1 sine_lo.wav

ue1_sinelo_txt

ue1_sinelo_gram

1.2 sine_hi.wav

ue1_sinehi_txt

ue1_sinehi_gram

2. Abtasttheorem

Das Abtasttheorem besagt, dass die Quelle mit einer Frequenz, die doppelt so groß ist, wie die höchste im Audiosignal auftretende Frequenz, abgetastet werden muss. Der Grenzfall tritt genau dann auf, wenn die Abtastfrequenz gleich 2 * fmax

3. Antialiasing

Bei herkömmlichen Soundkarten tritt systembedingt kein Aliasing auf, weil das Audiosignal stets geeignet vorbehandelt wird . Die Vorbehandlung wird bei der Aufnahme durch das Filtern des Eingangssignals mittels eines Tiefpassfilter vorgenommen. Durch diesen Filtervorgang werden alle Frequenzen oberhalb von fa / 2 als nicht mehr relevant angesehen und nicht mehr einbezogen . Damit sind verbleibende, restliche Frequenzen wiederherstellbar, rekonstruierbar.

4. Downsampling

Heruntertaktung bzw. Downsampling (engl.) bezeichnet die Reduktion der Stützstellen einer Zeitreihe oder anderer Anordnungen diskreter Werte. Bis auf Sonderfälle ist das Downsampling dadurch mit Informationsverlust verbunden (im Gegensatz zur Kompression). Es ist damit das Gegenstück zum Upsampling. (Quelle:wikipedia)

D.h. jeder zweite Wert in der Anordung wird entfernt. Durch diesen Vorgang halbiert sich die Abtastrate und aus einer ehemals 16 Khz grossen Rate wird eine 8 Khz Grosse modeliert.
Das Theorem verliert deswegen nicht an Bedeutung und muss trotz downsampling eingehalten werden. Falls beispielsweise eine Audiodatei eine Frequenz über 4KHz beinhaltet, ist die Einhaltung das Theorem nicht mehr gegeben. Dementsprechend müssen die Frequenzen über 4KHz liegen, damit das Theorem greift.

4.1 sine_lo.wav

Downsampled sine_lo.wav (ue1_sine_lo_down)

ue1_sinelo_gram_down

4.2 sine_hi.wav

Downsampled sine_hi.wav (ue1_sine_hi_down)

ue1_sinehi_gram_down

Beim Vergleich der Screenshots fällt auf, dass das Downsampling bei der sine_hi.wav die Frequenz von 6kHz auf 2kHz redurziert wurde. Bei der Datei sine_lo.wav ist die Frequenz von 2kHz unverändert.

Aufgabe 3

1. Amplitudenwerte

Die Amplitudenwerte werden auf Grund der 2er-Potenz (Bit) berechnet. Daraus ergeben sich folgende Werte

2^8 = 256 Werte für 8 Bit
2^16 = 65536 Werte für 16 Bit

2.Bitzahlreduzierung der wave_io

Eine Bitzahlreduzierung erreicht man, wenn man einfach die letzten n- Bits auf 0 setzt. N ist hierbei eine Potenz von 2 und bestimmt den Grad der Reduzierung.

3. Bitzahlreduzierung

Ein Unterschied ist erst ab einer Reduzierung um 8 Bit wahrnehmbar. Das auftretende Quantisierungsrauschen macht sich durch sog. Zischgeräusche bemerkbar. Sprachaufnahmen können je nach Qualität der Aufnahme bis auf eine Bitrate von 1 bis 2 Bits gesenkt werden.

Code zur Bitreduzierung

3.1 aufnahme_cd.wav

3.2 aufnahme_stimme.wav

3.3 Beispielbilder

CD Aufnahme 4 Bit reduziert in Gram analysiert:

cd_bitdown_4

CD Aufnahme 8 Bit reduziert in Gram analysiert:

cd_bitdown_8

CD Aufnahme 12 Bit reduziert in Gram analysiert:

cd_bitdown_12

CD Aufnahme 16 Bit reduziert in Gram analysiert:

cd_bitdown_16

4. Quantisierungsrauschen

Um die Quantisierungsfehler aufzuzeigen haben wir mit folgendem Code die Ausgabedatei modifiziert. Der Parameter bit kann zur Einstellung der Rauschsensibilität benutzt werden.

ue1_quanti_code

Kommentieren