AWS re:Invent 2023, Grafana wechselt Autoscaler, „mehr Talent“ bei Coinbase, Incident Response Simulation, Remote bei Basecamp und mehr – allesnurgecloud #126

Willkommen zu allesnurgecloud.com – Ausgabe #126!

Leider war ich nicht auf der re:Invent in den USA – du? Immerhin habe ich eine kleine Zusammenfassung der Woche in Las Vegas im Gepäck.

Im Podcast hatte ich diese Woche „Linus Haverkamp“ zu Gast. Linus streamt Spiele des FC Bayern München auf YouTube und macht mit Spenden, Kanal-Abos und Kooperationen mit Apps schon 4-stellige Umsätze im Monat mit seinem Content.

allesnurgecloud.com ist ein kuratierter Newsletter mit Inhalten aus der Open-Source, Cloud und IT-Welt.
Für weiteren Content folge mir gerne auf Twitter, Mastodon oder LinkedIn.

Möchtest du den Newsletter wöchentlich per E-Mail erhalten?
Einfach hier abonnieren:

526 Abonnenten sind schon dabei - Vielen Dank!

Please enter a valid email address
Diese E-Mail ist bereits registriert.
The security code entered was incorrect
Vielen Dank für Deine Anmeldung - bitte den Opt-In bestätigen.

Neuigkeiten von der AWS re:Invent 2023

In Las Vegas fand letzte Woche die re:Invent statt, die hauseigene Konferenz von AWS. Ich versuche hier mal kurz ein paar Highlights zusammenzufassen.
Als Alternative kannst du dir die 5 Minuten Zusammenfassung von Corey Quinn auf YouTube anschauen.
Für diejenigen mit etwas mehr Zeit: Die Keynote mit Dr. Werner Vogels, dem CTO von Amazon.com, ist ebenfalls bereits auf YouTube online – dauert allerdings keine 5 Minuten, sondern 1 Stunde und 53 Minuten.

Das ist natürlich nur ein Auszug, im Laufe der Woche wurde eine Menge Zeug announced.
Die Zusammenfassung von AWS und Links auf einzelne Blog-Posts im AWS Blog kannst du hier anschauen.

Warst du vor Ort?
Ich weiß, dass einige Leser nach Vegas gehen wollten.
Was hat dir am besten gefallen? Eine bestimmte Keynote? Announcements? Die Messestände? Das Networking?

Top announcements of AWS re:Invent 2023

Grafana spart Kosten durch Switch von Cluster Autoscaler zu Karpenter

Im verlinkten Blog-Artikel klärt Grafana Labs über den Wechsel vom normalen Cluster Autoscaler in AWS EKS (Elastic Kubernetes Service) zu Karpenter auf.
Grafana betreibt nach eigenen Angaben Instanzen bei jedem „Major Cloud Provider“. Interessanterweise ist man erst 2022 so richtig in AWS gelandet, nun macht man etwas über 1 Jahr später den Switch des Autoscalers.

Welche Probleme gab es mit dem normalen Autoscaler in AWS?

  • Teilweise wurden von AWS/EKS unpassende Nodes in den Gruppen gelaunched – das ist ein wenig ein Luxusproblem, welches man hat, wenn man diverse CPU Typen in seinen Node Pools verwendet
  • Dennoch sind die Entscheidungen, welche Nodes nun gestartet werden, dem Grafana Team „zu zufällig“ gewählt gewesen
  • Man kontert das Verhalten, in dem man je nach Use-Case verschiedene Node Gruppen mit unterschiedlichen Architekturen/CPU Typen erstellt – das erhöht die Komplexität
  • Idle Zeiten – manche der Cluster hatten Idle Zeiten von 40 % – also 40 % der Zeit, die man bezahlt, machen die Nodes – nichts
  • Zudem gab es ein Problem mit der maximalen Anzahl der möglich Pods

Das Grafana Team hat sich deshalb Karpenter angeschaut und nun den Switch gemachtKarpenter ist ein Open-Source-Projekt aus dem Hause AWS, daher passt es trotzdem gut zur vorhandenen EKS Strategie.

  • Karpenter verspricht den „Just in Time“ Start von benötigten Nodes – der Provisioner von Karpenter schaut sich die Requirements an eine Node Gruppe an und spawnt auf der Basis passende Nodes.
  • Für die Entwickler, die die Cluster betreiben, sei Karpenter einfacher zu verstehen und zu administrieren
  • Karpenter spricht mit der AWS EC2 API – ist daher gut integriert

Im Mittel habe man nach der Migration die „Idle Ratio“ der Cluster um mehr als 50 % reduziert. Zusätzliche Kosten spart man dadurch, dass Karpenter permanent prüft, ob die Workload nicht noch günstiger betrieben werden kann. Natürlich muss Karpenter entsprechende „Freiheiten“ haben, was die Verwendung von CPU Architekturen und Maschinentypen betrifft. Im Vergleich zum klassischen Autoscaler kommt Karpenter auch mit der Berechnung klar, wenn diverse Typen gemischt verwendet werden.

Interessanterweise ist das auf AWS nötig, bei anderen Cloud-Providern scheinbar nicht – vielleicht liegt das an den unzähligen Typen, die man bei AWS bekommen kann?

We were keeping track of our clusters’ combined memory and CPU utilization ratio, and our AWS clusters were falling way behind the performance of the clusters we were running on other cloud providers

Grafana nennt dazu auch ein paar Nachteile – man verwendet Karpenter nun nur bei AWS – bei den anderen Providern den normalen Autoscaler – der Zoo an Technologien wird also größer. Karpenter supported aktuell auch nur AWS – daher kann man es auch nicht anderswo verwenden. Karpenter ist ansonsten noch ein junges Projekt, soll aber nun in der CNCF aufgenommen werden.

Verwendet du Karpenter schon? Klassisch AutoScaler?

How Grafana Labs switched to Karpenter to reduce costs and complexities in Amazon EKS

Sponsored

Wir kümmern uns nachhaltig um deine Cloud-Infrastruktur – 4 Stunden kostenlos

Wir helfen Dir beim 24×7 Betrieb, bei Performance Problemen, bei Kostenoptimierung oder einfach beim Betrieb Deiner Web-Applikationen.
Betreibst Du Services wie GitLab, Zammad und Matomo selbst – hierbei unterstützten wir ebenfalls gerne – schau Dir einfach mal unsere Leistungen an.
Unsere Kunden kommen in unseren Case Studies zu Wort – wie beispielsweise everysize.com – eine Sneaker-Suchmaschine mit Preisvergleich und Community.

Eugen Falkenstein, CEO von Everysize, sagt beispielsweise über uns:

We Manage ist für uns ein optimaler Partner zur zuverlässigen Unterstützung unserer Web Applikationen und das 24/7. Neben kompetenter und zuverlässiger Beratung sind wir vor allem für die schnelle und direkte Kommunikation dankbar

Mit unseremaktuellen Angebot erhältst Du die ersten 4 Stunden gratis– 1 Stunde für die Analyse Deiner Infrastruktur und um zu schauen, ob und wie wir Dir helfen können.
Die ersten 3 Stunden einer folgenden Beauftragung sind dann für Dich kostenlos.

zum „4 Stunden Gratis“ Angebot bei We Manage

5 Maßnahmen für „mehr Talent“ bei Coinbase

Coinbase hat kürzlich in einem Blogbeitrag detailliert fünf neue Maßnahmen zur Steigerung der Talentendichte innerhalb des Unternehmens vorgestellt. Das Unternehmen legt einen enormen Wert auf die Anziehung und Bindung von Top-Talenten, die einen signifikanten Einfluss auf die Mission des Unternehmens haben können.

Die Maßnahmen zielen darauf ab, außergewöhnliche Talente anzuziehen und zu halten, die nicht nur über herausragende Fähigkeiten, sondern auch über den berühmten „Cultural Fit“ verfügen:

  1. Verbesserte strukturierte Bewertungen mit kognitiven Tests: Coinbase wird künftig kognitive Tests als Teil seiner Bewertungsprozesse einführen, um die Vorhersagbarkeit der Leistung der Kandidaten zu erhöhen. Diese Tests sollen „Live Interviews“ und Probearbeiten ergänzen, um eine konsistente Bewertung zu gewährleisten und Voreingenommenheit zu reduzieren.
  2. Erhöhung des Prozentsatzes der Neueinstellungen aus Praktika: Das Unternehmen plant, den Anteil der Vollzeitmitarbeiter, die zuvor Praktika bei Coinbase absolviert haben, deutlich zu erhöhen. Diese Praktika sollen dazu dienen, vielversprechende Talente zu identifizieren und frische Perspektiven in das Unternehmen einzubringen.
  3. CEO & COO genehmigen alle Neueinstellungen: Um das Niveau der Neueinstellungen zu erhöhen, werden alle neuen Mitarbeiter vorerst von Brian Armstrong (CEO) und Emilie Choi (COO genehmigt. Dies soll sicherstellen, dass die Kandidaten außergewöhnliche Fähigkeiten und einen nachgewiesenen Einfluss in der realen Welt besitzen.
  4. Echtzeit-Feedback und Leistungsmanagement: Das Unternehmen plant, die vierteljährlichen Leistungsüberprüfungen zu verbessern, indem Manager Bewertungen sowohl für die Arbeitsergebnisse als auch für das Verhalten der Mitarbeiter abgeben. Zusätzlich wird an einem internen Tool gearbeitet, das auf Slack basiert, um häufigeres und vielfältigeres Feedback zu erfassen.
  5. Executive-Verantwortlichkeit für Talentdichte: Coinbase betont, dass die Schaffung einer Umgebung mit dichter Talentbesetzung nicht nur das Anstellen und Halten von Top-Performern erfordert, sondern auch eine gezielte Herangehensweise bei unterdurchschnittlicher Leistung. Um dies sicherzustellen, wird die Talentdichte in die individuelle Leistungsbeurteilung jedes Executive-Mitglieds integriert.

Finde ich in Summe einen spannenden Ansatz – Coinbase habe im Jahr 2023 über 30.000 Bewerbungen für Praktikanten-Stellen erhalten. Man habe als Ziel, in Zukunft 20 % der Mitarbeitenden aus dem Internship Programm zu gewinnen.
Um die Qualität des Praktikums sicherzustellen, sollen diese vor allem vor Ort in der „Bay Area“ und in New York durchgeführt werden.
Coinbase bleibe ansonsten aber eine „remote-first“ Company.

Talent density at Coinbase

Incident Response: Katastrophenfall simulieren

Jenny Gray, Software Engineering Managerin bei Kooth, hat im verlinkten Artikel beschrieben, wie sie bei Kooth einen Desaster-Fall simuliert und die Reaktion der On-call Engineers erprobt haben.
So ganz freiwillig war der Test nicht – im Rahmen von ISO 27001 erfordert die Zertifizierung die Durchführung eines Desaster Recovery Tests. Die Engineers wurden informiert, dass der Test in den nächsten 2 Wochen stattfinden würde – wussten aber nicht genau, was genau passieren wird und wann der Test tatsächlich stattfinden sollte.

Man startete den Incident mit einem Fake Alert an das On-Call Team und fütterte die Monitoring-Tools mit entsprechenden Hinweisen auf einen Ausfall. Zusätzlich hat man „Fake Meldungen“ des Cloud-Providers integriert, wie beispielsweise „Datenbank ist down“.
Übrigens hat man ein Test-Environment genutzt, um das ganze zu simulieren, natürlich hat man das produktive System nicht beeinträchtigt.

Im Artikel erklärt Jenny die Limitierungen eines solchen Tests, aber zeigt auch, wie toll das Team reagiert und sich während des Incidents abgestimmt hat.
Am Tag nach dem Test gab es eine ausführliche Retro zum Test – jeder konnte sein Feedback sharen und Verbesserungen vorschlagen.
Beispielsweise fand man heraus, dass die amerikanische Präsenz von Kooth keine spezielle Maintenance Page hatte.

Zudem haben die Engineers auch einiges gelernt:

It wasn’t just an audit requirement in the end, and we will definitely do it again. Engineers who haven’t seen that large an incident learned a lot about our process, our infrastructure and monitoring tools. That could be invaluable knowledge the next time a serious incident happens.

Wenn man nicht viele Ausfälle hat, helfen solche regelmäßigen Tests, damit die Mitarbeitenden entsprechend routiniert mit solchen Indidents umgehen können.

Gaming a disaster recovery test

Basecamp bleibt „Remote“

Elaine Richards, die COO von Basecamp, hat in einem Blog-Artikel bei Basecamp ein kurzes Statement zu Remote vs. Hybrid abgegeben.
Basecamp bleibt Remote – warum?

Sie glaubt, dass Hybrid der schlechteste Kompromiss zwischen Office und Remote sei – die Leute wären an teure Großstädte gebunden, nur um für ein paar Zoom Calls in das Büro zu fahren:

Hybrid schedules might sound like the best compromise, but it’s actually the worst of office and remote worlds, with people still tied to expensive cities and congested commutes, only to go into an office for Zoom calls.

In vielen aktuellen Artikeln liest man, dass gute Ideen nur im Büro entstehen – das war zuletzt ja auch die Argumentation des CEO des Spiele-Entwicklers Roblox.
Den Artikel von David Heinemeier Hansson aus dem Juni zu „Remote vs. Hybrid“ hatte ich schon verlinkt, er hat hier jedenfalls ein paar gute Argumente gegen „hybride Arbeitsweise“.

Elaine argumentiert zusätzlich, dass Ideen überall entstehen können – das hat Basecamp CEO Jason Fried aufgeschrieben:

Ideas aren’t contained. They aren’t located. They don’t reside. They’re nomadic.
They aren’t something you control — they bubble up, they arise. You don’t get to have them when you want. They come to you.

Da hat er einen Punkt – die coolsten Ideen hat man ja meist gar nicht, wenn man am Rechner sitzt, sondern eher, wenn der Geist etwas baumeln kann oder man anderweitig inspiriert wird.

Bei Basecamp habe man über 20 Jahre Erfahrung mit „Remote“ only und damit diverse neue Produkte und Features veröffentlicht. Klar, Basecamp ist auch kein Konzern mit ein paar Tausend Mitarbeitenden – sondern es arbeiten nur um die 50 Leute dort.
Ich finde trotzdem, dass man sich zumindest die beiden Bücher „Remote“ und „It doesn’t have to be crazy at Work“ der Basecamp mal durchlesen kann, da kann man doch einiges mitnehmen, egal ob man „remote-only“ oder „hybrid“ arbeitet.

Going, and staying, Remote

Nextcloud gibt Vereinigung mit Roundcube bekannt

Das populäre Open-Source-Projekt Nextcloud übernimmt den Open-Source Webmail Client Roundcube.

Der in Nextcloud vorhandene Web Client soll aber erst einmal nicht durch Roundcube ersetzt werden – Nextcloud möchte aber dennoch weitere Mitarbeitende für die Weiterentwicklung von Roundcube rekrutieren:

With opportunities remaining to be explored, a direct merger between Roundcube and Nextcloud is not planned.
Neither will Roundcube replace Nextcloud Mail or the other way around.

Roundcube wird beispielsweise in Harvard, Cambridge, an der University of Victoria und bei den Providern HostGator, Telekom Italy, GoDaddy und OVH eingesetzt.
Das offizielle Announcement zum Merge findest du hier.

Kennst du einen anderen, vernünftigen Open-Source Web Client?

Nextcloud übernimmt Roundcube

GitLab Version 16.6 veröffentlicht

GitLab 16.6 wurde am 16. November 2023 released, das ist das erste Release mit dem neuen Release Cylcle, ohne an der Veröffentlichung am 22. eines Monats festzuhalten.

Das nächste Release ist 16.7 – und wie immer gibt es schon eine Upcoming Release Page dafür.

GitLab 16.6 Release

Schmunzelecke

Physical Security 101: „Make sure no one can physically touch your hardware“.
Sieht fast aus wie Jackson Pollocks No.5.

💡 Link Tipps aus der Open Source Welt

Dragonfly – Redis und Memcached Replacement

Dragonfly ist ein OpenSource Ersatz für Memcached und Redis. Laut der Feature-Page kannst du Dragonfly einfach als Ersatz von Redis verwenden und dabei eine bis zu 25x mal bessere Performance erreichen. Dabei spart Dragonfly bis zu 80 % der Ressourcen im Vergleich zu „normalem“ Redis.

Bei einem Benchmark hat man mit einem c6gn.16xlarge Server (AWS, 64 CPU Cores, 128GB RAM) über 3,8 Millionen Queries per Second erreicht.

Soweit ich das sehen kann, gibt es noch keinen Cluster Mode – man arbeitet aber daran. Aktuell werden 185 Redis Kommandos unterstützt. Die aktuelle Roadmap hat mehr Details dazu. Und im Produkt integriert sind schon Prometheus kompatible Metriken und ein Beispiel-Dashboard – coole Sache.

https://github.com/dragonflydb/dragonfly

GoAccess – Real-Time Weblog Analyzer

GoAccess ist ein Open Source Real-Time Weblog Analyzer für das Terminal oder den Webbrowser.

Nach der Installation, beispielsweise über den Paketmanager in Debian/Ubuntu, kannst du mit dem Command goaccess access.log -c einfach auf dein Access Log ausführen und dann die Requests analysieren. GoAccess unterstützt diverse Log-Formate, unter anderem das Common Log Format (CLF), Combined Log Format (XLF/ELF), mit virtual host, W3C format (IIS), Amazon CloudFront oder auch das JSON Format von Caddy. Du kannst aber auch dein individuelles LogFormat angeben und GoAccess funktioniert ebenfalls.

In der Public Demo kannst du prüfen, wie das dann im Browser aussieht – cooles Tool!

https://goaccess.io/

❓ Feedback & Newsletter Abo

Vielen Dank, dass du es bis hierhin geschafft hast!
Kommentiere gerne oder schicke mir Inhalte, die du passend findest.

Falls dir die Inhalte gefallen haben, kannst du mir gerne auf Twitter folgen.
Gerne kannst du mir ein Bier ausgeben oder mal auf meiner Wunschliste vorbeischauen – Danke!

Möchtest du den Newsletter wöchentlich per E-Mail erhalten?
Einfach hier abonnieren:

526 Abonnenten sind schon dabei - Vielen Dank!

Please enter a valid email address
Diese E-Mail ist bereits registriert.
The security code entered was incorrect
Vielen Dank für Deine Anmeldung - bitte den Opt-In bestätigen.


  • Neueste Beiträge

  • Neueste Kommentare


  • Share

    By About
    Abonnieren
    Benachrichtige mich bei
    guest

    0 Comments
    Oldest
    Newest Most Voted
    Inline Feedbacks
    View all comments

    allesnurgecloud.com

    © 2024 allesnurgecloud.com
    0
    Would love your thoughts, please comment.x