Spack基础 Spack 是一个跨平台的包管理器,可以用来安装和编译不同版本的软件,使得他们不与系统环境冲突并且多个版本可以共存。 1. 下载和安装 spack无需安装,下载完成后,直接调用/spack/bin/下的可执行文件即可。 git clone https://github.com/spack/spack.git export SPACK_ROOT more ...
写作Tips diagrams 使用app.diagrams.net画图时,如果文字有多行,实际显示效果可能不同。尽管app里文字有自动换行,但是在生成的svg里,文本还是单行。在导出时,需要选择文本设置-->转换标签为svg,才能导出正确的svg。然后使用在线的svg转pdf来生成pdf。 表格 在excel里做好表格,ctrl + c复制要绘制的表格区域,然后在tablesgenerator --> File --&g more ...
nsight compute和nsight system的使用笔记 使用ncu和nsys cli的笔记,持续更新。 Nsight Compute ncu主要是获取更细粒度的intra kernel的hardware counters。 官方手册 官方的profile 指导手册 more ...
Pytorch源码编译 安装依赖 先安装anaconda,再创建虚拟环境。手动激活conda eval "$(/home/find/anaconda3/bin/conda shell.bash hook)" more ...
使用GVProf测试Python程序 以pytorch/benchmark的alexnet为例,正常执行的命令是python3 run.py alexnet -d cuda -t eval hpcrun -e gpu=nvidia python3 run.py alexnet -d cuda -t eval rm hpct more ...
AMD ROCm学习 rocm是amd推出的类NVIDIA CUDA的开源的开发平台。 架构的变化(todo) 与cuda对比 CUDA ROCm Description SM Compute Unit, CU One of many more ...
cuda程序运行时间 写了两个脚本来获得通过nsys profile出来的cuda程序执行时间。 1. runnsys.sh runnsys.sh working_dir program args 第一个参数working_dir是设置后面你的程序在哪里跑。比如有些程序是编译在build/,但是实际input和work的目录在另外的目录下。这个参数设置为实际程序运行的目录即可。同时,reports也将生成在这个目录。 后面是正常运行cuda程序时的命令和参数。 more ...
opencv4 c++ 编译 1. 下载 https://github.com/opencv/opencv/releases https://github.com/opencv/opencv_contrib/releases 下载两个压缩包解压出来。 2. Cmake more ...
获得带源码行信息的cuda汇编 之前记录的一些cuda的用法中也有关于cuda汇编的一些介绍。本文主要记录了带源代码行信息的cuda汇编文件的获取。主要内容参考CUDA Binary Utilities 程序编译时需要添加的参数 在makefile或者cmakelist文件中,添加如下内容到nvccflag或者手动添加到nvcc编译的参 more ...