#38 Monitoring, Metriken, Tracing, Alerting, Observability
Engineering Kiosk - Ein Podcast von Wolfgang Gassler, Andy Grunwald - Dienstags
Kategorien:
Wie würde heutzutage ein moderner Logging, Metriken, Monitoring, Alerting und Tracing-Stack aussehen?Im Infrastruktur-Bereich gibt es zu jedem Bereich etliche Tools. Cloud-Native ist das Buzzword der Stunde. In dieser Episode erzählt Andy, wie er einen modernen Stack für ein Side-Projekt für die Bereiche Logging, Metriken, Monitoring, Alerting und Tracing aufsetzen würde. Unter anderem geht es dabei um Fragen wie: Was sollte man eigentlich alles loggen? Wie kann man von einem Alert angerufen werden? Wie visualisiert man Daten in schönen Graphen? Brauchen wir Tracing? Und was ist Observability?Bonus: Engineering Porn und Buzzword-Bingo.Feedback (gerne auch als Voice Message)Email: [email protected]: https://twitter.com/EngKioskWhatsApp +49 15678 136776Gerne behandeln wir auch euer Audio Feedback in einer der nächsten Episoden, einfach Audiodatei per Email oder WhatsApp Voice Message an +49 15678 136776LinksEpisode #37 Mit IT-Büchern Geld verdienen? Wer liest überhaupt noch Bücher?: https://engineeringkiosk.dev/podcast/episode/37-mit-it-b%C3%BCchern-geld-verdienen-wer-liest-%C3%BCberhaupt-noch-b%C3%BCcher/?pkn=shownotes Episode #17 Was können wir beim Incident Management von der Feuerwehr lernen?: https://engineeringkiosk.dev/podcast/episode/17-was-k%C3%B6nnen-wir-beim-incident-management-von-der-feuerwehr-lernen/?pkn=shownotes Sentry: https://sentry.io/Datadog: https://www.datadoghq.com/Splunk: https://www.splunk.com/Elasticsearch: https://www.elastic.co/de/enterprise-search/Logstash: https://github.com/elastic/logstashKibana: https://github.com/elastic/kibanaOpenSearch: https://opensearch.org/Elastic Cloud: https://www.elastic.co/de/cloud/Aiven: https://aiven.io/Fluentd: https://www.fluentd.org/Amazon S3 und S3 Glacier: https://aws.amazon.com/de/s3/Amazon Athena: https://aws.amazon.com/de/athena/Prometheus: https://prometheus.io/VictoriaMetrics: https://github.com/VictoriaMetrics/VictoriaMetricsInfluxDB: https://www.influxdata.com/M3 Metrics Engine: https://m3db.io/Prometheus Node Exporter: https://github.com/prometheus/node_exporterGrafana: https://github.com/grafana/grafanaPromQL: https://prometheus.io/docs/prometheus/latest/querying/basics/OpsGenie: https://www.atlassian.com/de/software/opsgenieJaeger: https://www.jaegertracing.io/Zipkin: https://zipkin.io/OpenTracing: https://opentracing.io/OpenTelemetry: https://opentelemetry.io/yak shaving: https://seths.blog/2005/03/dont_shave_that/Cloud Native Computing Foundation: https://www.cncf.io/Sprungmarken(00:00:00) Intro(00:00:50) Wolfgangs MySQL-Buch(00:02:11) Heutiges Thema: Wie würde Andy die Themen Monitoring, Alerting, Metriken und Logging bei einem Side Projekt angehen?(00:04:49) Warum brauchst du Logging, Monitoring, Metriken und Tracing?(00:07:29) Logging von Exceptions, Warnings und anderen Fehler, Logging und der ELK-Stack(00:16:06) Was sollte man eigentlich alles loggen?(00:19:22) Log-Rotation und Log-Retention auf Object-Storage(00:27:30) Metriken mit Prometheus(00:31:46) Visualisierung von Metriken mit Grafana(00:34:25) Intelligente Alerting Systeme und die richtigen Schwellenwerte finden(00:38:47) Alerts senden und anrufen lassen(00:43:22) Tracing: Was ist das und brauchen wir das?(00:48:49) Was ist Observability?(00:51:42) Iterativer Aufbau seiner Plattform und Alternativen(00:54:49) Keine bezahlte Werbung(00:55:14) Outro und FeedbackHostsWolfgang Gassler (https://twitter.com/schafele)Andy Grunwald (https://twitter.com/andygrunwald)Feedback (gerne auch als Voice Message)Email: [email protected]: https://twitter.com/EngKioskWhatsApp +49 15678 136776