Veranstaltungsdetails
Google SRE - Auf der Jagd nach Uptime
Karsten Petersen (Cluster System Administrator, Google) / E-Mail:
Samstag, 12:00 Uhr, Raum V4
Der Betrieb eines stark besuchten Internetangebotes stellt ganz besondere Anforderungen an Systemadministration und -architektur: Durch die intensive Nutzung ist ein besonders leistungsfähiges Design notwendig; gleichzeitig verlangt die ausgeprägte internationale Sichtbarkeit, dass das Angebot immer verfügbar ist. Bei Google ist das Site Reliability Engineering (SRE) für den Betrieb und die Zuverlässigkeit der Dienste verantwortlich. Die Mitarbeiter dieser Abteilung administrieren nicht nur die Produktionssysteme, wir helfen auch neue Dienste aufzusetzen. Dieser Vortrag wird die wichtigsten Anforderungen und die bei Google genutzte Hard- und Softwarearchitektur sowie einige Beispiele für in der Vergangenheit aufgetretene Probleme vorstellen.
Erwünschte Vorkenntnisse: Unix/Linux-Systemadministration