Вот уже 11 лет мы записываем подкасты про сети. И вы представляете себе? Мы ни разу как-то основательно так и не поговорили про то, как эту самую сеть мониторить. За какими метриками хотим следить, какие аварии и где зажигать? Ну ладно, один раз-таки говорили, но это было так давно и не так уж и глубоко, что почему бы не повторить? Разбираться будем на примере гиперскейлера и клауд-титана - Яндекса. Что такое система мониторинга в широком смысле? Как могла бы выглядеть система мониторинга мечты? Что (какие метрики/состояния чего) мы хотим собирать? Как работать с системой? Парк OS. Blackbox/whitebox Интерфейсы. snmp/ssh/netconf/restconf/gnmi Готовые инструменты. Коробочные решения. Берём или пишем своё? Building blocks. Библиотеки, фрэймворки и что есть в мире opensource, что можно использовать и из чего можно собрать свою? Архитектура и дизайн системы. Компоненты системы/подсистемы. Масштабируемость/отказоустойчивость/надёжность Какой язык выбрать Команда мониторинга? Это что, не один человек? Сетевики, разработчики, SRE —---------------------------------------------------------- Пишите нам: info@ Канал в телеграме: Подкаст доступен в iTunes, Google Подкастах, Яндекс Музыке, Castbox Сообщество в вк: Группа в фб: Пообщаться в общих чатах в тг: - - Поддержите проект: - - - —----------------------------------------------------------
Hide player controls
Hide resume playing