Привет, сегодня я покажу вам некоторые результаты измерений для моей докторской диссертации. Я работаю над первой публикацией о DarkNet на OpenCL.. Исходный код этого проекта вы можете найти по адресу https://github.com/sowson/darknet. Публикация IEEE должна быть последовательной и разумной. Я не могу разместить слишком много графики и больших таблиц., но у меня есть публичный блог-сайт. Так, Я могу разместить это здесь. Сначала обо всем по порядку, герои битвы выходят на сцену.
На моей рабочей станции установлено 2x NVIDIA Titan RTX 24 ГБ DDR6 или 2x XFX AMD Radeon VII 16 ГБ HBM2, и в основном на Ubuntu 18.04 Я сделал измерения. Первый, Я хотел бы показать вам пример обратного распространения., часть тренировочного процесса. По правде говоря, Я несколько раз просил сообщество измерить производительность и сравнить версии OpenCL. Этого не произошло., поэтому я решил инвестировать в графические процессоры AMD и провести сравнение самостоятельно. Теперь я покажу вам упомянутое сравнение временных характеристик части обратного распространения..
Теперь позвольте мне показать вам только последний сверточный слой обратного распространения., но со всеми подъядрами внутри, чтобы дать вам возможность настроить и выбрать лучший графический процессор для DarkNet на OpenCL.
Прекрасный результат AMD, верно? Но только с CLBlast вместо clBLAS. Похоже, AMD придется исправить эти базовые подсистемы линейной алгебры. В противном случае, нет смысла его использовать. Последнее, что следует упомянуть, это то, что я сравниваю топовые массовые графические процессоры от NVidia и AMD., и АМД, Я считаю, что благодаря HBM2 VRAM, работает супер прекрасно.
Относительно публикации IEEE, Я работаю над этим.; будет прекрасная история о путешествии DarkNet на OpenCL, много точек зрения, измерения, Результаты, выводы, и более, так что следите за обновлениями. Спасибо за прочтение!
п ;).