=================주로사용하는 명령어============================ # 큐 확인 bqueues # 큐 선택방법 Deep learning을 할거면 s822lc_p100nvme 라는 queue job을 submit HPC을 할거면 s822lc_p100 라는 queue job을 submit # 스케쥴링 걸어서 실행 (-x는 혼자 한장의 GPU만 쓰더라도 전체를 독점적으로 쓰겠다는 옵션) bsub -R "select[ngpus>0] rusage[ngpus_excl_p=1]" -x -q s822lc_p100nvme PYTHONPATH=/~/bin/python /~/cifar10_main.py # 수행 중인 Job-id에 대한 정보 (Job-id는 위에 스케쥴링 걸어서 실행하면 보여줌) bhist -l Job-id =================명령어 설명============================ bqueues : job을 submit할 큐의 정보를 보여줍니다 bsub : job을 큐에 submit 해줍니다 bjobs : 큐에 submit된 job의 상태를 보여줍니다 bhist : 현재 수행 중인, 혹은 이미 수행이 끝난 job의 history를 보여줍니다 bkill : submit되어 현재 수행 중인 상태의 job을 도중에 kill 시켜 줍니다 bhosts : 수퍼컴 클러스터 내의 노드들 상황을 보여줍니다. ==================예제=========================== # 쉘스크립트 작성 b7p193aa@p10login1:~$ cat cifar10.sh #!/bin/bash source /opt/DL/tensorflow/bin/tensorflow-activate source /opt/DL/bazel/bin/bazel-activate export FLOWERS_DIR=/gpfs/gpfs_gl4_16mb/...
가상화 환경 혹은 클라우드에서 새로운 디스크를 추가하고 리눅스 서버 리부팅 없이 인식하여 사용할 필요성이 생겼다. =============================== cd /sys/class/scsi_host ls -al host0 부터 들어가서 아래와 같이 한다 echo "- - -" > /sys/class/scsi_host/host0/scan host1이 있으면 그것도.. echo "- - -" > /sys/class/scsi_host/host1/scan fisk -l 하면 나온다
어제까지 설치를 잘 해놓고 리부팅해도 오픈스텍이 웹브라우저로 잘 접속됨을 확인하가 CentOS보다 Ubuntu에 정이 더 가려던 찰라 오늘 인스턴스를 만들려고 하니 생성이 안되는거였다. 보니깐 인스턴스 생성시 네트워크를 선택할 수 가 없었다. 네트워크 메뉴로가서 Private 네트웍을 192.168.1.0/24에 Gateway 192.168.1.1을 만들고 다시 인스턴스 생성을 해보았다 이번엔 인스턴스는 생성이 되었다. 하지만 에러가 났다. 자세히보니 볼륨을 못만들고 에러가 나고 있었다. CentOS에 Devstack 설치했을때는 Private 네트웍도 만들어지고 인스턴스 생성시 에러도 없었는데 (다만 리부팅하면 Devstack이 기동이 안되었었지... 역시 복잡하다...) 인터넷을 열심히 찾아보고 이것저것 해보았는데 문제는 Cinder에 있나보다. 생각보다 많은 사람이 겪는 문제인듯 몇년이 지나면 아무런 문제 없이 Fix된 버전이 나오겠지만 아직은 이런게 많은건가... 암튼 아래와 같이 해보고 인스턴스를 생성하니 잘 생성이되고 콘솔 접속도 성공했다. 한번 따라해보자 -------------- RC 스크립트 수정 sudo vi /etc/rc.local losetup /dev/loop2 /opt/stack/data/stack-volumes-lvmdriver-1-backing-file sudo dd if=/dev/zero of=cinder-volumes bs=1 count=0 seek=2G sudo losetup /dev/loop2 cinder-volumes sudo fdisk /dev/loop2 순서대로 아래를 입력 n p 1 ENTER ENTER t 8e w sudo pvcreate /dev/loop2 sudo v...
댓글
댓글 쓰기