Cześć, dzisiaj pokażę Wam wyniki pomiarów do mojego doktoratu. Pracuję nad pierwszą publikacją o DarkNet na OpenCL. Kod źródłowy tego projektu można znaleźć pod adresem https://github.com/sowson/darknet. Publikacja IEEE musi być spójna i inteligentna. Nie mogę umieścić zbyt wielu grafik i dużych stołów, ale mam publiczny blog. Więc, Mogę to tutaj opublikować. Najpierw najważniejsze rzeczy, bohaterowie bitwy wychodzą na scenę.
Moja stacja robocza korzysta z 2x NVIDIA Titan RTX 24 GB DDR6 lub 2x XFX AMD Radeon VII 16 GBHBM2, i w zasadzie na Ubuntu 18.04 Zrobiłem pomiary. Pierwszy, Chciałbym pokazać wam charakterystykę propagacji wstecznej, częścią procesu szkoleniowego. Prawda została powiedziana, Kilka razy prosiłem społeczność o zmierzenie wydajności i porównanie wersji OpenCL. To się nie wydarzyło, więc zdecydowałem się zainwestować w procesory graficzne AMD i sam dokonać porównania. Teraz pokażę wam wspomniane porównanie czasów części propagacji wstecznej.
Teraz pokażę tylko ostatnią warstwę splotową propagacji wstecznej, ale ze wszystkimi subjądrami w środku, aby dać ci możliwość caparison i wyboru najlepszego procesora graficznego dla DarkNet na OpenCL.
Piękny wynik prawego AMD? Ale tylko z CLBlast zamiast clBLAS. Wygląda na to, że AMD musi naprawić te podstawowe podsystemy algebry liniowej. W przeciwnym razie, nie ma sensu tego używać. Ostatnią rzeczą, o której należy wspomnieć, jest to, że porównuję najlepsze procesory graficzne głównego nurtu firm NVidia i AMD, i AMD, Myślę, że dzięki HBM2 VRAM, działa super cudownie.
Odnośnie publikacji IEEE, pracuję nad tym; będzie piękna historia o podróży DarkNet na OpenCL, wiele punktów widzenia, pomiary, wyniki, wnioski, i więcej, bądźcie na bieżąco. Dziękuje za przeczytanie!
P ;).