FindHao

监听HPC上提交的job状态

一般HPC集群都会有任务调度系统，比如PBS或者LSF。这些调度系统会默认内置job的开始和结束邮件通知，但是不好用，甚至管理员可能并没有提供相应的实现。由于消息通知对于我来说是一个比较普遍的需求，不只是在HPC job调度上，且之前购买了pushover的服务，于是写了一个简单的任务监听工具。 usage: notif more ...

Ubuntu下开启TPM2.0安装nvidia driver

windows 11 发布了，新系统要求开启TPM2.0（一个安全芯片标准，8代及以后的intel和较新的amd cpu都支持）。但是之前在ubuntu下使用run包装nvidia 驱动时，一般都会遵循一些教程关闭UEFI的secure boot，同时也就关闭了TPM等。本文记录了如何开启TPM，在ubuntu下安装nvidia gpu driver。开启TPM 以华硕主板, amd cpu为例，在UEFI中找到启动-->安全启动-->OS Type，选择Windows UEFT 模式。在高级-->AMD fTPM设置， more ...

AMD ROCm学习

rocm是amd推出的类NVIDIA CUDA的开源的开发平台。架构的变化(todo) 与cuda对比 CUDA ROCm Description SM Compute Unit, CU One of many more ...

配置CLion使用gdb

因为CLion的debug界面非常好用，现在想用它来debug一个executable。项目环境比较特殊，project是一个library，编译会生成so文件。然后通过LD_PRELOAD=XX.so vetorAdd来执行测试的vectorAdd程序。但是debug时，主要是在这个library的源码。library的CMakeList.txt并不包含要测试的vectorAdd程序。打开Run-->Edit Configurations-->侧边栏的+ -->Remote GDB Server，设置对应的参数如下： more ...

cuda程序运行时间

写了两个脚本来获得通过nsys profile出来的cuda程序执行时间。 1. runnsys.sh runnsys.sh working_dir program args 第一个参数working_dir是设置后面你的程序在哪里跑。比如有些程序是编译在build/，但是实际input和work的目录在另外的目录下。这个参数设置为实际程序运行的目录即可。同时，reports也将生成在这个目录。后面是正常运行cuda程序时的命令和参数。 more ...

opencv4 c++ 编译

1. 下载 https://github.com/opencv/opencv/releases https://github.com/opencv/opencv_contrib/releases 下载两个压缩包解压出来。 2. Cmake more ...

在vpn下通过win10转发ssh

部分学校或公司的服务器需要先登录vpn才能登录，本文记录了在虚拟机的win10中登录vpn，host的Linux下ssh登录服务器的方法。配置虚拟机里的win10 正常安装win10，并打开ubuntu子系统（或许也可以直接使用win10的ssh），然后sudo apt install openssh-server安装openssh server。编辑/etc/ssh/sshd_config里的端口配置，sudo service ssh start重启ssh。安 more ...

gdb的使用

断点 break if, b if break [break-args] if (condition) break main if argc more ...

获得带源码行信息的cuda汇编

之前记录的一些cuda的用法中也有关于cuda汇编的一些介绍。本文主要记录了带源代码行信息的cuda汇编文件的获取。主要内容参考CUDA Binary Utilities 程序编译时需要添加的参数在makefile或者cmakelist文件中，添加如下内容到nvccflag或者手动添加到nvcc编译的参 more ...

cuda unified memory

在Pacsal及更新的GPU中，managed memory在调用cudaMallocManaged()分配以后，不一定在device memory上实际malloc。或者说，page和page table直到被GPU或CPU访问以后才被创建。page可以在任意时间迁移到任意memory，driver会采用启发算法来维护数据局部性和防止过多的page faults产生。 Reference https://developer.nvidia.com/blog/unified-memory-cuda-beginners/ more ...