
Rack fermi per ore, danni milionari: $31M per il monitoraggio liquidi data center
Un rack di GPU che si blocca per cinque o sei ore può costare milioni di dollari. Eppure, fino a poco tempo fa, l’unico modo per sapere cosa stava succedendo al liquido di raffreddamento era spedire un campione in...
Bitcoin 1 Minute
Uno sviluppo di rilievo scuote i mercati delle criptovalute. Un rack di GPU che si blocca per cinque o sei ore può costare milioni di dollari. Eppure, fino a poco tempo fa, l’unico modo per sapere cosa stava succedendo al liquido di raffreddamento era spedire un campione in laboratorio e aspettare. Omen AI ha deciso di cambiare questo approccio con un minuscolo spettrometro capace di fare il monitoraggio dei liquidi nei data center in tempo reale, intercettando la contaminazione batterica prima che diventi un’emergenza operativa.
La startup ha appena annunciato un round Series A da 31 milioni di dollari, confermando che il mercato sta iniziando a prendere sul serio il problema. Punti chiave Omen AI ha sviluppato uno spettrometro compatto per il monitoraggio in tempo reale dei fluidi di raffreddamento nei data center, sostituendo i lenti test di laboratorio. La contaminazione batterica nei sistemi di liquid cooling può costringere allo spegnimento di un rack per cinque o sei ore, con potenziali danni economici nell’ordine dei milioni.
Dinamiche di mercato
Il round Series A da 31 milioni di dollari è stato guidato da Nava Ventures, con la partecipazione di CRV, Vanderbilt University, Mann+Hummel, Starhill Holdings e Hard Launch Capital. Omen AI lavora già con una dozzina di clienti nel settore data center, tra cui TensorWave, che costruisce infrastrutture di calcolo AI su chip AMD. Il fondatore Zach Laberge ha avviato la sua prima startup nel 2020 a soli 14 anni; Omen AI è stata fondata nel 2024.
Lo spettrometro di Omen AI per i data center Il dispositivo sviluppato da Omen AI è piccolo, ma risolve un problema enorme. Installato direttamente nell’impianto di raffreddamento a liquido, legge in continuo la composizione chimica del fluido circolante, segnalando in anticipo la presenza di batteri, metalli come rame o cromo — indicatori di pompe usurate — oppure silicio, spia di guarnizioni danneggiate. «Non si rischia un enorme downtime perché non si ha nessuna visibilità su quello che sta succedendo chimicamente», spiega Zach Laberge, CEO e fondatore di Omen AI.
Come funziona e perché supera i test tradizionali Fino ad oggi, la prassi consolidata era estrarre campioni di fluido a intervalli regolari e inviarli a laboratori esterni per l’analisi. Un processo lento, costoso, e soprattutto cieco agli eventi che si sviluppano nel mezzo: una contaminazione batterica può diventare critica in poche ore, mentre il campione è ancora in transito. Lo spettrometro di Omen AI elimina questa finestra di ignoranza.
Impatto sui mercati
Sfruttando i recenti progressi nelle tecnologie ottiche e nel software di elaborazione dei segnali, rende economicamente sostenibile un’analisi continua in loco. «L’hardware è abbastanza economico da avere senso su scala, e poi l’elaborazione del segnale ci consente di estrarre informazioni utili dal rumore», ha dichiarato Laberge. La sfida del raffreddamento a liquido nei data center La domanda di calcolo alimentata dall’intelligenza artificiale sta spingendo i gestori di data center verso configurazioni sempre più aggressive.
Più chip, più calore da smaltire, sistemi di raffreddamento sempre più sofisticati. Più acqua, più rischio Il liquido refrigerante è tipicamente una miscela di acqua e sostanze batteriostatiche. Aumentare la percentuale d’acqua migliora la capacità di assorbimento del calore — utile quando si vogliono spingere i chip ai limiti delle loro prestazioni — ma abbassa contestualmente la protezione contro la proliferazione batterica.
Il risultato è un fluido che può intasarsi, bloccare il flusso e richiedere uno spurgo completo del sistema. Il costo operativo della contaminazione batterica Quando la contaminazione si manifesta, l’intervento è radicale: svuotare e flussare l’intero circuito. Un’operazione che impone lo spegnimento del rack interessato per cinque o sei ore, con perdite potenzialmente nell’ordine dei milioni di dollari per i grandi operatori.
Questo cambiamento continua a plasmare il panorama delle attività digitali.




