4-way GTX 1080 system 런타임 테스트

오유인페이지

개인차단 상태

BLUE_FLAG님의
개인페이지입니다

가입 : 13-01-28

방문 : 2948회

닉네임변경 이력

일반게시판
베스트게시판
베스트오브베스트
댓글목록

회원차단

회원차단해제

게시물ID : computer_316338

작성자 : 푸렁이★

추천 : 10

IP : 141.223.***.39

댓글 : 23개

등록시간 : 2016/08/04 15:21:31

http://todayhumor.com/?computer_316338

모바일

4-way GTX 1080 system 런타임 테스트

안녕하세요, 이번 게시물은 linux환경하에서의 4-way GTX 1080 시스템을 테스트한 결과입니다. 주로 딥러닝용 장비인만큼 CUDA프로그램을 돌리기 위한 OS, 드라이버, 툴 셋팅과 프로그램 실행시 온도, 속도, 안정성을 엉성하게나마 다룰려고 합니다. 본론으로 들어갑니다. 시스템 스펙 & 테스트 환경: CPU: Xeon E5-1650 3.5Ghz, 6 cores, 12 threads RAM: 64GB DDR4 GPU: GTX 1080 @ 1733Mhz x 4EU SSD: Intel pro 2500 480GB x 4EU (RAID 0 x 2) OS: Ubuntu 14.04 LTS server 64bit CUDA: 8.0 RC version Driver: NVIDIA graphics driver for linux 64bit ver. 367.35 <div style="text-align:left;"><img src="http://thimg.todayhumor.co.kr/upfile/201608/14702911056abe80d072ad48dcaa0219fe0629dcb0__mn364901__w5312__h2988__f2838983__Ym201608.jpg" width="800" height="450" alt="14700489120a4158d8ee234912a690ba0400f5817a__mn364901__w5312__h2988__f2839063__Ym201608.jpg" class="chimg_photo" style="border:none;" filesize="2838983"></div> OS, DRIVER, TOOL 셋팅 먼저 Ubuntu 14.04 LTS server 64bit를 설치합니다. 설치후 재부팅하는 도중에 “nouveau failed to create 0x000…, -22” “unknown hardware 어쩌구” 하는 문구가 뜹니다. 역시 우분투 만악의 근원 nouveau이 말썽을 일으키는군요. Nouveau는 우분투에서 쓰는 오픈소스 그래픽 드라이버입니다. 서드파티라 업데이트가 느려 최신 하드웨어는 인식 못합니다;;; 강제 재부팅후 grub 화면에서 “e”를 누르면 부팅 옵션을 넣을수 있습니다. 눌러주고 맨 마지막 두번째 줄 맨 마지막에 nomodeset 이라는 문구를 넣어주고 부팅하면 정상적으로 로그인 됩니다. 재부팅하면 아까 grub에서의 설정이 리셋되기 때문에 nouveau를 영구적으로 정지시켜야 합니다. 일단 /etc/default/grub 파일을 열고 GRUB_CMDLINE_LINUX_DEFAULT 옵션에 nomodeset를 추가합니다. 다음 /etc/modprobe.d/blacklist.conf 에 다음과 같은 라인을 추가합니다. blacklist nouveau blacklist vga16fb blacklist rivafb blacklist nvidiafb blacklist rivatv blacklist lbm-nouveau options nouveau modeset=0 alias nouveau off alias lbm-nouveau off 재부팅하면 nouveau를 다시는 볼수 없습니다^^ 이제 nvidia 사이트에 가서 최선 그래픽 드라이버하고 cuda 8.0 RC버전을 다운받아 설치하면 됩니다. (주의할 점은 두 개를 제각기 설치하고 cuda에 딸린 드라이버는 건너뛰는게 정신건강에 유리합니다) 단 설치하기전 gcc설치하고 sudo apt-get install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev 명령어로 필요한 의존 라이브러리 설치합니다. 설치해도 libGLU.so 가 없다고 뜨는데 /usr/lib/x86_64-linux-gnu 경로를 환경변수 LD_LIBRARY_PATH에 추가하면 됩니다. 다 끝났으면 cuda sample 폴더에 들어가 make합니다. bin에 들어가 deviceQuery를 실행해보면 아래와 같이 뜨면 일단 cuda는 설치성공입니다. <div style="text-align:left;"><img src="http://thimg.todayhumor.co.kr/upfile/201608/147029124100951e3953e54f09a08de88c48fec4dd__mn364901__w1349__h687__f210832__Ym201608.png" width="800" height="407" alt="devicequery.PNG" class="chimg_photo" style="border:none;" filesize="210832"></div> Peer access는 GPU간 통신으로 CPU를 거치지 않고 PCI-E bus를 통해 직접 통신하는 방식을 말합니다. 일단 스크린샷에서는 잘 되는것으로 나옵니다. (나중에 멀티 GPU관련 작업에 유리합니다) 이대로 진행해도 괜찮지만 저는 호불호가 좀 갈리는 방식으로 GPU를 셋팅해둡니다. /etc/rc.local에 다음과 같은 라인들을 추가하고 재부팅합니다. sudo nvidia-smi -pm 1 sudo nvidia-smi -i 0 -ac 10010,1733 sudo nvidia-smi -i 1 -ac 10010,1733 sudo nvidia-smi -i 2 -ac 10010,1733 sudo nvidia-smi -i 3 -ac 10010,1733 exit 0 첫 라인의 의미는 persistence mode 를 부팅할때마다 켜는 명령입니다. Persistence mode 는 GPU를 사용하지 않아도 nvidia driver를 항상 미리 로딩해두는 모드로 빠른 프로그램 실행에 유리합니다. 그 아래 라인들의 의미는 GPU를 시종일관 강제로 최고 클럭에서 작동하게 해줍니다. (그래서 호불호죠) 10010은 VRAM 클럭이고 1733는 GPU boost 클럭입니다. 제품별로, 레퍼/비레퍼에 따라 다르기에 본인이 구매한 제품에 맞게 해줘야 합니다. Tesla제품의 경우에는 sudo nvidia-smi -i 0 --ecc-config=0 옵션도 줘서 딥러닝에 쓸데없는 ECC를 꺼야 하지만 1080은 해당사항이 아니므로 안해도 됩니다. 0 1 2 3 은 GPU ID로 시스템에 GPU가 몇 개 있으면 다 설정해줘야 합니다. 이제 theano, torch, tensorflow, cntk, caffe 등 딥러닝 툴 중에서 원하시는거로 설치하시면 됩니다. 일단 theano로 테스트 해봅니다. Openblas를 설치하고 openblas기반으로 numpy를 컴파일한다음 cudnn 5.0을 설치하고 theano를 설치하면 됩니다. 아나콘다라는 통합툴이 있지만 귀찮아서 안 씁니다;;; numpy 설치는 여기를 참고 <a target="_blank" href="http://stackoverflow.com/questions/11443302/compiling-numpy-with-openblas-integration" target="_blank">http://stackoverflow.com/questions/11443302/compiling-numpy-with-openblas-integration</a> CUDA 프로그램 실행, 안정성, 온도, 속도 테스트 이제 실제 프로그램 테스입니다. 일단 실행전 GPU 정보를 확인합니다. <div style="text-align:left;"><img src="http://thimg.todayhumor.co.kr/upfile/201608/14702912805bf22cc0e53d4b0780f2935b64805e51__mn364901__w799__h491__f109674__Ym201608.png" width="799" height="491" alt="GPU_info.PNG" style="border:none;" filesize="109674"></div> 온도가 준수한 수준이고 GPU점유율이 0%입니다. Persistence mode 는 on으로 되어있고 GPU상태는 idle을 의미하는 P8 모드에 있습니다. 딥러닝 트레이닝 프로그램을 4개 GPU에 따로 돌립니다. 대략 6시간 경과후 … ;;;; <div style="text-align:left;"><img src="http://thimg.todayhumor.co.kr/upfile/201608/14702912928c83ddc0ada64365a214a1ad145a2981__mn364901__w801__h575__f119195__Ym201608.png" width="800" height="574" alt="temp.PNG" class="chimg_photo" style="border:none;" filesize="119195"></div> 맨 위의 카드의 온도가 92도에 항상 고정되어 있습니다;;; (1080 공홈에서 표기한 최고온도입니다;;;;) nvidia-smi로 확인한 결과 96도에서 속도저하, 99도에서 GPU 셧다운이 일어난다고 합니다. 엄청 높은 온도이지만 6시간동안 이로 인해 다운되거나 속도저하는 일어나지 않았습니다. 서버룸에 에어컨을 추가해달라고 해야겠네요. 참고로 처리속도는 동일 프로그램에서 대략 Tesla K40 (4.4 ~ 5.0 TFLOPS, GTX 980 상당) 의 두배정도 나옵니다. 단점이라면 램이 8GB밖에 안됩니다. Float 타입을 16bit로 하면 램 두배의 효과가 나지만 지원하는 툴이 많지 않습니다. 이상입니다. 감사합니다.

이 게시물을 추천한 분들의 목록입니다.

[1] 2016/08/04 15:33:30 174.25.***.111 근군 113207
[2] 2016/08/04 15:47:04 203.253.***.242 가공쟁이 23273
[3] 2016/08/04 16:18:14 203.109.***.142 거덜스 84748
[4] 2016/08/04 16:23:48 116.36.***.206 아키호시노 122613
[5] 2016/08/04 16:41:48 143.215.***.252 까라 411381
[6] 2016/08/04 18:07:53 61.42.***.42 사랑여우별 621554
[7] 2016/08/04 18:30:59 175.197.***.7 진지진지해 69201
[8] 2016/08/04 22:43:27 110.14.***.236 Elminster 517255
[9] 2016/08/05 03:12:52 110.70.***.105 Iodien 441854
[10] 2016/08/05 12:48:39 182.211.***.111 cobain 273427

푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
(단,비공감수가 추천수의 1/3 초과시 해당없음)

죄송합니다. 댓글 작성은 회원만 가능합니다.

번호

제 목

이름

날짜

조회

분류	게시판
베스트	베스트오브베스트 베스트 오늘의베스트
유머	유머자료 유머글
이야기	자유 고민 연애 결혼생활 좋은글 자랑 공포 멘붕 사이다 꿈 똥 군대 밀리터리 미스터리 술한잔 오늘있잖아요 투표인증 새해
이슈	시사 시사아카이브 사회면 사건사고
생활	패션 패션착샷 아동패션착샷 뷰티 인테리어 DIY 요리 커피&차 육아 법률 동물 책 지식 취업정보 식물 다이어트 의료 영어 맛집 추천사이트 해외직구
취미	사진 사진강좌 카메라 만화 애니메이션 포니 자전거 자동차 여행 바이크 민물낚시 바다낚시 장난감 그림판
학술	경제 역사 예술 과학 철학 심리학
방송연예	연예 음악 음악찾기 악기 음향기기 영화 다큐멘터리 국내드라마 해외드라마 예능 팟케스트
방송프로그램	무한도전 더지니어스 개그콘서트 런닝맨 나가수
디지털	컴퓨터 프로그래머 IT 안티바이러스 애플 안드로이드 스마트폰 윈도우폰 심비안
스포츠	스포츠 축구 야구 농구 바둑
야구팀	삼성 두산 NC 넥센 한화 SK 기아 롯데 LG KT 메이저리그 일본프로야구리그
게임1	플래시게임 게임토론방 엑스박스 플레이스테이션 닌텐도 모바일게임
게임2	던전앤파이터 롤 마비노기 마비노기영웅전 하스스톤 히어로즈오브더스톰 gta5 디아블로 디아블로2 피파온라인2 피파온라인3 워크래프트 월드오브워크래프트 밀리언아서 월드오브탱크 블레이드앤소울 검은사막 스타크래프트 스타크래프트2 베틀필드3 마인크래프트 데이즈 문명 서든어택 테라 아이온 심시티5 프리스타일풋볼 스페셜포스 사이퍼즈 도타2 메이플스토리1 메이플스토리2 오버워치 오버워치그룹모집 포켓몬고 파이널판타지14 배틀그라운드
기타	종교 단어장 자료창고
운영	공지사항 오유운영 게시판신청 보류
임시게시판	메르스 세월호 원전사고 2016리오올림픽 2018평창올림픽 코로나19 2020도쿄올림픽