Briser le goulot d'étranglement de la mémoire hôte : Comment Peer Direct a transformé les performances cloud de Gaudi
Google utilise libfabric, DMA-BUF et HCCL pour obtenir des performances similaires à RDMA sur les cartes réseau cloud. Cela permet de restaurer l'évolutivité de l'entraînement distribué.