Înainte de a înțelege acest lucru, am cunoaște câteva cuvinte despre algoritmii de învățare automată, algoritmii de învățare automată pot fi utilizați în diverși algoritmi de învățare, cum ar fi învățarea supravegheată, învățarea nesupravegheată sau ambele. Algoritmii de învățare supravegheați folosesc date etichetate pentru a învăța modele și pentru a face predicții, în timp ce algoritmii de învățare nesupravegheați identifică anomalii sau grupuri cu datele fără etichete preexistente. Mai multe modele pot fi antrenate simultan pentru a surprinde diferite aspecte ale activității suspecte.

Inginerii Binance Machine Learning folosesc de obicei două tipuri de conducte. Acestea sunt Batch și Streaming.

Lot: este utilizat pentru volume mari de date

Streaming: înseamnă date în timp real pe măsură ce sunt colectate. Acest lucru face situații care necesită un răspuns aproape instantaneu, cum ar fi detectarea hackerului înainte de a retrage fonduri din orice cont.

Deasupra ambelor conducte foarte important. Loturile sunt cele mai bune la manipularea unor cantități mari de date, în timp ce Streaming-ul este mai bun pentru a oferi răspuns în timp real.

Să presupunem că este vorba despre prevenirea fraudei, trebuie să prioritizeze datele în timp real pentru a evita o situație numită „Model Staleness”.

Impactul învechirii

Dacă oamenii nu rămân la curent cu cele mai recente informații sau tehnici, modelele de învățare automată pot deveni, de asemenea, mai puțin precise. Conform acestei situații, aș prefera ca toată lumea să te țină mereu la curent cu informații sau tehnici.

Modelul de preluare a contului (ATO).

Antrenamentul ATO Model pentru a identifica conturile pe care un utilizator nelegitim le-a deturnat cu un obiectiv rău intenționat. Apoi, acest model măsoară numărul de tranzacții care au fost efectuate în ultimul minut.

Hackerii urmează acești pași.

1.     Model secvenţial

2.     Număr mare de operațiuni (Retrageri într-o perioadă scurtă de timp)

În această condiție, Binance System calculează această caracteristică cât mai curând posibil în cazul unor potențiale amenințări. Înseamnă că minimizarea întârzierilor dintre acțiunea utilizatorului și datele despre activitatea utilizatorului sunt procesate prin acest model.

Pentru mai multe informații vizitați

https://engineering.linkedin.com/blog/2022/near-real-time-features-for-near-real-time-personalization

Rol de calcul în lot:

Importanța învechirii caracteristicilor poate depinde de model. Unele caracteristici, de exemplu, sunt relativ stabile. În cazul ATO menționat mai sus, ar trebui, de asemenea, să recupereze date despre retragerile utilizatorului din ultimele 30 de zile pentru a calcula un raport bazat pe cele mai recente tranzacții ale acestuia.

În această situație, calculul batch pe perioade de timp mai lungi, cum ar fi intervale zilnice sau orare, este acceptabilă, în ciuda stării mai mari care rezultă din așteptarea ca datele să ajungă în depozitele de date și ca joburile batch să ruleze periodic.

În acest articol, unele date au fost preluate de pe Blogul Binance, prin urmare, dacă doriți să aflați mai multe detalii, vizitați Blogul Binance. #azuki #pepe #crypto2023 #DYOR