十多年ML系統SRE經驗,Google練出4大ML可靠性戰略 - iThome Online

3/14/2022 12:00:00 AM3 years 1 month ago
13年前,Google在匹茲堡設立了第一個ML SRE團隊,開始將累積了好幾年的SRE經驗,開始運用到ML系統,先從改善搜尋引擎關鍵字廣告投放精準做起,後來擴大導入到各式各樣的ML服務,甚至要發展成可以支援多模型類型多租戶架構的ML維運平臺
SREMLGoogle ML SRETodd Underwood10SREGoogle13SREML Google 2003 SRESite Reliability Engineering2014GoogleSRE 13GoogleSRESREMLGoogle AdsGoogle GoogleML Todd UnderwoodSREML SRETodd Underwood 13Ads M… [+826 chars]
full article...