본문 바로가기

분류 전체보기209

[kubeflow, kubernetes] 디플로이먼트 재시작하는 방법 (restart deployment) 다음 명령어를 통해 디플로이먼트를 재시작할 수 있다. kubectl rollout restart deployment [deployment_name] 2022. 10. 28.
[kubeflow, kubernetes] 에러 파드 삭제하는 방법 (kubeflow delete error pod) 아래 명령어를 통해 에러 파드를 모두 삭제 가능하다. 이를 응용하여 Error -> Completed 또는 Running으로 변경하여 다른 상태의 파드도 삭제 가능함. # default namespace kubectl get pods | grep Error | awk '{ print $1 }' | xargs kubectl delete pod # specific namespace kubectl get pods -n | grep Error | awk '{ print $1 }' | xargs kubectl delete pod -n # all namespace kubectl get pods -A | grep Error | awk '{ print $1 }' | xargs kubectl delete pod -A 2022. 10. 28.
[linux] 우분투 캐시 삭제하는 방법(ubuntu cache 삭제) sudo 권한이 있어야 하며, 아래 명령어를 통해 삭제할 수 있다. 다만 기존에 동작하던 것들이 중단될 수 있으니 심사숙고 후에 수행해야 한다. sudo sysctl -w vm.drop_caches=2 2022. 10. 28.
[linux] 쉘 커맨드를 vi 모드로 사용하기(terminal command vi mode) 아래 문장을 ~/.bash_profile 에 추가한다. # ~/.bash_profile set -o vi 2022. 10. 26.
[docker] docker GPU 설정 예전 글들을 보면 docker container에서 gpu 를 사용하기 위해서는 nvidia-docker를 새로 설치해야된다고 합니다. 하지만, docker 19.*.* 이후부터는 docker 자체에서도 gpu를 지원하게 되었습니다. 따라서 현 시점에서 접할 수 있는 대부분의 docker는 nvidia-docker의 설치 없이, nvidia-container-runtime의 설치와 docker 재실행만으로 gpu 인식 및 활용이 가능합니다. Prerequisites: docker (me: 20.10.20) nvidia-driver (nvidia-smi 입력 시, gpu 인식이 되어야 함, me: 470.63.01) 설정 방법 1. nvidia-container-runtime 설치 $ apt-get ins.. 2022. 10. 23.
[디버깅] tensorflow assertion failed: [predictions must be >= 0] 에러 해결 딥러닝 모델 학습을 시도하였는데, 다음과 같은 assertion failed이 발생함. 에러메시지는 아래와 같음 Epoch 1/20 Traceback (most recent call last): File "lifelog_modeling.py", line 152, in main() File "lifelog_modeling.py", line 129, in main history = model.fit( File "/home/***/anaconda3/envs/wsi-py3.8/lib/python3.8/site-packages/tensorflow/python/keras/engine/training.py", line 108, in _method_wrapper return method(self, *args, **kw.. 2022. 10. 7.