Source Coding Techniques
- type: Lecture (V)
- chair: KIT-Fakultäten - KIT-Fakultät für Elektrotechnik und Informationstechnik
- semester: SS 2024
-
time:
Tue 2024-04-16
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-04-23
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-04-30
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-05-07
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-05-14
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-05-28
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-06-04
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-06-11
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-06-18
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-06-25
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-07-02
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-07-09
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-07-16
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
Tue 2024-07-23
09:45 - 11:15, weekly
30.28 Seminarraum 2 (R120)
30.28 Lernzentrum 2012 (1. OG)
- lecturer: Prof. Dr.-Ing. Laurent Schmalen
- sws: 2
- lv-no.: 2310565
- information: Blended (On-Site/Online)
Language of instruction | German |
Quellencodierung
Die Lehrveranstaltung diskutiert Verfahren und Methoden, die sich bei der Betrachtung der Quellencodierung ergeben. Die Quellencodierung ist ein unerlässliches Hilfsmittel in der Nachrichtentechnik, um einerseits Multimediasignale kompakt darzustellen und für die Übertragung vorzubereiten und andererseits Speicherkapazität effizient und ökonomisch zu nutzen. Die Quellencodierung stellt das direkte Bindeglied zwischen dem Benutzer des Nachrichtensystems und der eigentlichen Datenübertragung dar. Die Vorlesung behandelt verschiedene Methoden der Signalverarbeitung und betrachtet diese im Hinblick auf ihren Einsatz in modernen Verfahren der Quellencodierung wie MP3,JPEG, oder H264. Viele der Anwendungen werden mit Beispielimplementierungen in Software (python) illustriert.
Der größte Teil der Vorlesung widmet sich der Quellencodierung von Multimediasignalen und betrachtet insbesondere die Quellencodierung von Audio- und Bildsignalen. Dabei werden zuerst verschiedene Methoden der Quantisierung von Multimediasignalen diskutiert. Neben gleichförmigen Quantisierern betrachten wir ungleichförmige Quantisierung, optimale Quantisier, kompandierende Quantisierer, adaptive Quantisier und Vektorquantisierer und bewerten diese in Bezug auf die Signalqualität. Folgende Abbildung zeigt beispielsweise die Rekonstruktionsqualität (Signal-Rausch-Verhältnis) nach Quantisierung eines Sprachsignals mit einem gleichförmigen und einem adaptiven Quantisierer (AQF).
Nach der Beschreibung der Quantisierung behandelt die Vorlesung Verfahren der Signalverarbeitung, die das Signal so vorbereiten, dass eventuell vorhandene Korrelation und zeitliche Abhängigkeiten entfernt werden. Diese sogenannte lineare Prädiktion bereitet das Signal optimal für eine spätere Quantisierung vor. Die Studierenden lernen in der Vorlesung, wie die lineare Prädiktion automatisch an das Signal adaptiert werden kann und bei praktischen, nicht-stationären Signalen angewandt werden kann. Folgende Abbildung illustriert die lineare Prädiktion eines kurzen Sprachsignals und illustriert, wie die beiden adaptiven Filter der linearen Prädiktion und Langzeitprädiktion das Spektrum des Signals glätten und somit für die die Quantisierung vorbereiten.
Basierend auf Methoden der Quantisierung und linearen Prädiktion wird anschließend die Kombination des Gesamtsystems diskutiert, und verschiedene Methoden der Kombination von Prädiktion und Quantisierung. Dabei werden verschiedene Quantisierer betrachtet und sowohl einfache Systeme beschrieben (und mit python-Code demonstriert) als auch komplexere Verfahren, wie das CELP-Verfahren, welches die Grundlage für die Sprachcodierung mit extrem niedriger Datenrate in modernen Telefonie- und Videotelefoniediensten (z.B. Zoom) bildet. Das Blockdiagramm des CELP-Verfahrens ist nachfolgend dargestellt.
Die Vorlesung widmet sich anschließend mit der spektralen Analyse und Codierung von Audiosignalen (z.B. Musik). Hier erfolgt die Quantisierung in den meisten Fällen im Frequenzbereich und es werden einige Besonderheiten, wie zum Beispiel psychoakustische Modelle, beschrieben. Folgende Abbildung zeigt exemplarische die Spektralanalyse eines Musikstücks.
Im weiteren Verlauf der Vorlesung lernen die Studierenden wie Bild und Videosignal effizient codiert werden. Der Fokus liegt hier auf einer Kombination von mehrdimensionalen Spektraltransformationen, Quantisierung und Entropiecodierung. In der Vorlesung wird eine einfache Variante des JPEG-Verfahrens behandelt und mit python-Code illustriert. Folgende Abbildung zeigt beispielsweise die Codierung eines Bildes mit diesem Verfahren und die anschließende Rekonstruktion, aus der die Rekonstruktionsartefakte sichtbar werden.
Nach der Beschreibung von Videocodierverfahren und Algorithmen zur Bewegungskompensation behandelt die Vorlesung zum Abschluss einige neuere Konzepte zur Übertragung von Multimediasignalen in Netzwerken. Insbesondere beim Auftreten von Paketverlusten sind intelligente Verfahren notwendig, die eine Rekonstruktion der Signale weiterhin erlauben. Als Beispiel sei hier die Codierung mit mehreren Beschreibungen („multiple description coding (MDC)“) genannt, die in nachfolgender Abbildung illustriert ist. Hierzu wird das Signal mithilfe von zwei (oder mehreren) Paketen übertragen. Falls beide Pakete den Empfänger erreichen, kann das Signal mit höchster Qualität rekonstruiert werden. Falls lediglich ein Paket den Empfänger erreicht, kann dieses noch dazu genutzt werden, in einem „Side Decoder“ das Signal in niedrigerer Qualität zu rekonstruieren.