Bash样式设置 在bash terminal中,使用上箭头来调用之前的命令时,如果命令较长,偶尔会出现命令混杂的情况。实际上这是由于terminal的提示文字使用了颜色导致的。 Prompt: 终端最前方显示的 用户名:Host $ 修改PS1的内容 查看当前PS1的设置: echo $PS1 more ...
C/C++ macro笔记 C/C++ macro 通过宏改变函数调用 宏函数macro在有些场景下非常有用,下面的例子记录了如果通过一个变量在编译时,将调用的函数改为带着_dummy后缀的函数。 #ifdef STANDALONE #include more ...
Pytorch源码编译 安装依赖 先安装anaconda,再创建虚拟环境。手动激活conda eval "$(/home/find/anaconda3/bin/conda shell.bash hook)" more ...
使用GVProf测试Python程序 以pytorch/benchmark的alexnet为例,正常执行的命令是python3 run.py alexnet -d cuda -t eval hpcrun -e gpu=nvidia python3 run.py alexnet -d cuda -t eval rm hpct more ...
nvidia docker笔记 nvidia docker的安装参考Installation Guide — NVIDIA Cloud Native Technologies documentation。 移动docker存储目录 参考 more ...
设置NVIDIA GPU的时钟频率 NVIDIA GPU默认是自动调频,如果需要profile程序,通过ncu获得的结果可能会不准确,尤其是对于一些比较小的程序来说。因此,测试需要固定gpu的时钟频率。需要执行的命令如下: sudo nvidia-smi -pm 1 nvidia-smi -q -d CLOCK sudo nvidia-smi -lgc 2100,2100 nvidia-smi -q -d CLOCK more ...
通过rclone加快本地与服务器的文件拷贝 在某些情况下,自己的机器直接scp或者rsync拷贝文件到服务器上,速度非常慢。可能的原因之一是服务器端限制了大部分这样的流量。但是在多数情况下,我们自己的机器直接上传/下载文件到google drive或者服务器上传/下载到google drive通常速度可以打满带宽。利用这个特性,就可以借助google drive作为中转,提高本地与服务器之间的文件拷贝。 配置google drive api 参考 more ...
监听HPC上提交的job状态 一般HPC集群都会有任务调度系统,比如PBS或者LSF。这些调度系统会默认内置job的开始和结束邮件通知,但是不好用,甚至管理员可能并没有提供相应的实现。由于消息通知对于我来说是一个比较普遍的需求,不只是在HPC job调度上,且之前购买了pushover的服务,于是写了一个简单的任务监听工具。 usage: notif more ...
Ubuntu下开启TPM2.0安装nvidia driver windows 11 发布了,新系统要求开启TPM2.0(一个安全芯片标准,8代及以后的intel和较新的amd cpu都支持)。但是之前在ubuntu下使用run包装nvidia 驱动时,一般都会遵循一些教程关闭UEFI的secure boot,同时也就关闭了TPM等。本文记录了如何开启TPM,在ubuntu下安装nvidia gpu driver。 开启TPM 以华硕主板, amd cpu为例,在UEFI中找到启动-->安全启动-->OS Type,选择Windows UEFT 模式。 在高级-->AMD fTPM设置, more ...
AMD ROCm学习 rocm是amd推出的类NVIDIA CUDA的开源的开发平台。 架构的变化(todo) 与cuda对比 CUDA ROCm Description SM Compute Unit, CU One of many more ...