DarkNet CUDA 대 OpenCL 및 CPU 대 NVIDIA 대 AMD

안녕, 오늘은 제 박사학위 측정 결과를 보여드리겠습니다.. 저는 OpenCL에서 DarkNet에 관한 첫 번째 출판물을 작업 중입니다.. 이 프로젝트의 소스 코드는 다음에서 찾을 수 있습니다. https://github.com/sowson/darknet. IEEE 출판물은 일관되고 지능적이어야 합니다.. 너무 많은 그래픽과 큰 테이블을 놓을 수는 없습니다., 하지만 공개 블로그 사이트가 있어요. 그래서, 여기에 게시하면 돼요. 먼저 첫 번째 것들, 전투 영웅들이 무대에 등장하다.
 박사. CUDA 대. OpenCL 및 CPU 대. 엔비디아 대. AMD내 워크스테이션은 2개의 NVIDIA Titan RTX를 사용하고 있습니다. 24 GB DDR6 또는 2x XFX AMD Radeon VII 16 GB HBM2, 기본적으로 우분투에서는 18.04 측정을 했어요. 첫 번째, 역전파의 변형을 보여드리고 싶습니다., 훈련 과정의 일부. 진실을 말하다, 성능을 측정하고 OpenCL 버전을 비교해달라고 커뮤니티에 여러 번 요청했습니다.. 그것은 일어나지 않았다, 그래서 AMD의 GPU에 투자하고 직접 비교하기로 결정했습니다.. 이제 앞서 언급한 역전파 부분의 타이밍 비교를 보여드리겠습니다..
박사. CUDA 대. OpenCL 및 CPU 대. 엔비디아 대. AMD BW 이제 마지막 역전파 컨벌루션 레이어만 보여드리겠습니다., 하지만 모든 하위 커널이 내부에 포함되어 Caparison 옵션을 제공하고 OpenCL의 DarkNet에 가장 적합한 GPU를 선택할 수 있습니다..
박사. CUDA 대. OpenCL 및 CPU 대. 엔비디아 대. AMD BW 마지막 AMD 권리의 멋진 결과? 하지만 clBLAS 대신 CLBlast를 사용하는 경우에만 가능. AMD는 이러한 기본 선형 대수 하위 시스템을 수정해야 하는 것 같습니다.. 그렇지 않으면, 그것을 사용하는 것은 의미가 없습니다. 마지막으로 언급할 점은 NVidia와 AMD의 최고 주류 GPU를 비교하고 있다는 것입니다., 그리고 AMD, HBM2 VRAM 덕분이라고 믿습니다, 정말 멋지게 일하고 있어요.
IEEE 출판물에 관하여, 나는 그것을 위해 노력하고 있다; OpenCL에서 DarkNet의 여정에 대한 사랑스러운 이야기가 있을 것입니다., 많은 관점, 측정, 결과, 결론, 그리고 더, 그러니 계속 지켜봐 주시기 바랍니다. 읽어 주셔서 감사합니다!
피 ;).

답장을 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필요 입력 사항은 표시되어 있습니다 *

*

이 사이트는 스팸을 줄이기 위해 Akismet을 사용합니다.. 댓글 데이터가 처리되는 방법 알아보기.