nsight compute和nsight system的使用笔记 使用ncu和nsys cli的笔记,持续更新。 Nsight Compute ncu主要是获取更细粒度的intra kernel的hardware counters。 官方手册 官方的profile 指导手册 more ...
cuda程序运行时间 写了两个脚本来获得通过nsys profile出来的cuda程序执行时间。 1. runnsys.sh runnsys.sh working_dir program args 第一个参数working_dir是设置后面你的程序在哪里跑。比如有些程序是编译在build/,但是实际input和work的目录在另外的目录下。这个参数设置为实际程序运行的目录即可。同时,reports也将生成在这个目录。 后面是正常运行cuda程序时的命令和参数。 more ...