lire les livres blancs sur les protocoles de formation d'IA

lire les livres blancs sur les protocoles de formation d'IA décentralisés de style essaim cette semaine et je suis stupéfait par ce qui n'y est pas : le déterminisme.
l'inférence GPU est célèbre pour sa fragilité - de petites réorganisations fp32, des atomiques dans les convolutions, des conversions de tensor-core, des courses multi-flux - tout cela s'additionne à des logits différents lors du même passage avant. la littérature regorge de solutions de contournement (modes déterministes cuDNN, noyaux à verrouillage de billet, constructions de moteurs figés), pourtant rien de tout cela n'apparaît dans les articles dtrain brillants.
pourquoi s'en soucier ? si chaque pair dans un maillage produit des gradients légèrement différents, bonne chance pour atteindre un consensus on-chain ou prouver une contribution honnête. les coûts de vérification explosent, la logique de réduction échoue, et tout le slogan « formation à confiance minimisée » commence à sembler plus un idéal qu'une mise en œuvre. 
donc, crypto-ml twitter : qui s'attaque réellement à la non-déterminisme dans un cadre distribué et adversarial ? des articles / blogs que je devrais lire ? des analogies avec d'autres couches de consensus ? laissez des liens ci-dessous.

.css-1iqe90x{box-sizing:border-box;margin:0;min-width:0;color:#EAECEF;}lire les livres blancs sur les protocoles de formation d'IA décentralisés de style essaim cette semaine et je suis stupéfait par ce qui n'y est pas : le déterminisme.

lire les livres blancs sur les protocoles de formation d'IA décentralisés de style essaim cette semaine et je suis stupéfait par ce qui n'y est pas : le déterminisme.