Verteiltes Rechnen

  • Typ: Vorlesung (V)
  • Lehrstuhl: Fakultät für Informatik
  • Semester: WS 14/15
  • Ort: Gebäude 20.21 (SCC-Süd), Raum 217 (2. Stock)
  • Zeit: Mittwoch, 14:00-15:30, wöchentlich
  • Dozent: Prof. Dr. Achim Streit
    Dr. Christopher Jung
    Dr. Jie Tao

     

  • SWS: 2
  • LVNr.: 2400050

Vortragssprache:

Deutsch

Beschreibung:

Die Vorlesung „Verteiltes Rechnen“ gibt eine Einführung in die Welt des verteilten Rechnens mit einem Fokus auf Grundlagen, Technologien und Beispielen aus Grid, Cloud und dem Umgang mit Big Data.

Zuerst wird eine Einführung in die Hauptcharakteristika verteilter Systeme gegeben. Danach wird auf die Thematik Grid näher eingegangen und es werden Architektur, Grid Services, Sicherheit und Job Ausführung vorgestellt. Am Beispiel des WLCG (der Grid Infrastruktur zur Verteilung, Speicherung und Analyse der Daten des LHC-Beschleunigers am CERN) wird die enge Verwandtschaft zwischen Grid Computing und verteiltem Daten-Management dargestellt.

Im zweiten Teil werden Prinzipien und Werkzeuge zum Management großer bzw. verteilter Daten vorgestellt - dies schließt Datenlebenszyklus, Metadaten und Archivierung ein. Beispiele aus Wissenschaft und Industrie dienen zur Veranschaulichung. Moderne Speichersysteme wie z.B. dCache, xrootd, Ceph und HadoopFS werden als praktische Beispiele vorgestellt.

Der dritte Teil der Vorlesung geht auf das Thema Cloud ein. Nach der Definition grundlegender Begriffe und Prinzipien (Iaas, PaaS, SaaS, public vs. private Clouds), auch mittels Beispielen, wird das Thema Virtualisierung als grundlegende Technik des Cloud Computing vorgestellt. Den Abschluss bildet MapReduce als Mechanismus zur Verarbeitung und Analyse großer, verteilter Datenbestände wie es auch von Google eingesetzt wird.

Literaturhinweise:

1. Andrew Tanenbaum, Maarten van Steen: “Distributed systems: principles and paradigms”, Prentice Hall, 2007, ISBN 0-13-613553-6
2. Ian Foster, Carl Kesselmann: “The Grid. Blueprint for a New Computing Infrastructure (2nd Edition)”, Morgan Kaufmann, 2004, ISBN 1-55860-933-4
3. Fran Berman, Geoffrey Fox, Anthony J.G. Hey: “Grid Computing: Making the Global Infrastructure a Reality”, Wiley, 2003, ISBN 0-470-85319-0
4. Tony Hey: “The Fourth Paradigm: Data-intensive Scientific Discovery”, Microsoft Research, 2009, ISBN 978-0-9825442-0-4
5. Rajkumar Buyya, James Broberg und Andrzej M. Goscinski: “Cloud Computing: Principles and Paradigms”, Wiley, 2011, ISBN 978-0-470-88799-8

Lehrinhalte:

  1. Studierende sollen in die Grundbegriffe verteilter Systeme, im Speziellen in die aktuellen Techniken des Grid und Cloud Computing sowie des Management großer bzw. verteilter Daten eingeführt werden. Sie eigenen sich Wissen über die zugrundeliegenden Paradigmen und Services an. Aktuelle Beispiele werden zur Veranschaulichung herangezogen.
  2. Studierende erlernen Methoden und Technologien des Grid und Cloud Computing sowie verteilten Daten-Managements, die für den Einsatz in alltags- und industriellen Anwendungsgebieten geeignet sind bzw. welche heute von Google, Facebook, Amazon, etc. eingesetzt werden.
  3. Im Einzelnen erhalten Studierende einen Einblick in Web/Grid Services, elementare Grid Funktionalitäten, Datenlebenszyklus, Metadaten, Archivierung, Cloud Service Typen (IaaS, SaaS, PaaS) und Public/Private Clouds – jeweils mit Beispielen aus der Praxis anschaulich erklärt.