Spędziłem dziś zdecydowanie za dużo czasu, goniąc drobnego buga, który ostatecznie okazał się jedną brakującą literą 😅. Nic nadzwyczajnego. Zwróciło jednak moją uwagę to, jak inaczej się zachowałem, gdy przełączyłem się na Claude Fable 5 w OpenGradient Chat.
Zwykle, kiedy debuguję coś, co faktycznie należy do prawdziwego projektu, zaczynam usuwać fragmenty kodu przed wklejeniem ich do czatu z AI. Nazwy zmiennych, komentarze, trasy API… Kończę na tym, że poświęcam prawie tyle samo czasu na „oczyszczanie” promptu, co na rozwiązywanie problemu.
Dziś nie.
Już wiedziałem, że Fable 5 osiąga świetne wyniki w kodowaniu — 95,0 na SWE-bench Verified, 80 na SWE-bench Pro, 84,3 na Terminal-Bench — więc spodziewałem się solidnych odpowiedzi. Zaskoczeniem nie był benchmark. To było uświadomienie sobie, że wreszcie przestałem myśleć o tym, co muszę ukryć, zanim poproszę o pomoc.
Odpowiedzi nie były magicznie idealne. Wciąż musiałem się nieco przeciwstawić kilku sugestiom i wszystko sam przetestować. Tak po prostu działa programowanie.
Co wydawało się inne, to workflow. Skupienie pozostawało na bugu, a nie na ciągłym pytaniu siebie: „Czy najpierw mam usunąć ten fragment?”
Śmieszne, że ludzie porównują modele AI prawie wyłącznie na podstawie wyników benchmarków. Po dzisiejszym dniu zaczynam myśleć, że większy zysk produktywności bierze się z tego, że nie przerywasz własnego toku pracy co pięć minut tylko dlatego, że martwisz się, gdzie ostatecznie trafi twój kod
@OpenGradient #opg $OPG
Zwykle, kiedy debuguję coś, co faktycznie należy do prawdziwego projektu, zaczynam usuwać fragmenty kodu przed wklejeniem ich do czatu z AI. Nazwy zmiennych, komentarze, trasy API… Kończę na tym, że poświęcam prawie tyle samo czasu na „oczyszczanie” promptu, co na rozwiązywanie problemu.
Dziś nie.
Już wiedziałem, że Fable 5 osiąga świetne wyniki w kodowaniu — 95,0 na SWE-bench Verified, 80 na SWE-bench Pro, 84,3 na Terminal-Bench — więc spodziewałem się solidnych odpowiedzi. Zaskoczeniem nie był benchmark. To było uświadomienie sobie, że wreszcie przestałem myśleć o tym, co muszę ukryć, zanim poproszę o pomoc.
Odpowiedzi nie były magicznie idealne. Wciąż musiałem się nieco przeciwstawić kilku sugestiom i wszystko sam przetestować. Tak po prostu działa programowanie.
Co wydawało się inne, to workflow. Skupienie pozostawało na bugu, a nie na ciągłym pytaniu siebie: „Czy najpierw mam usunąć ten fragment?”
Śmieszne, że ludzie porównują modele AI prawie wyłącznie na podstawie wyników benchmarków. Po dzisiejszym dniu zaczynam myśleć, że większy zysk produktywności bierze się z tego, że nie przerywasz własnego toku pracy co pięć minut tylko dlatego, że martwisz się, gdzie ostatecznie trafi twój kod
@OpenGradient #opg $OPG
