Spack基础

Spack 是一个跨平台的包管理器,可以用来安装和编译不同版本的软件,使得他们不与系统环境冲突并且多个版本可以共存。 1. 下载和安装 spack无需安装,下载完成后,直接调用/spack/bin/下的可执行文件即可。 git clone https://github.com/spack/spack.git export SPACK_ROOT more ...

写作Tips

diagrams 使用app.diagrams.net画图时,如果文字有多行,实际显示效果可能不同。尽管app里文字有自动换行,但是在生成的svg里,文本还是单行。在导出时,需要选择文本设置-->转换标签为svg,才能导出正确的svg。然后使用在线的svg转pdf来生成pdf。 表格 在excel里做好表格,ctrl + c复制要绘制的表格区域,然后在tablesgenerator --> File --&g more ...




AMD ROCm学习

rocm是amd推出的类NVIDIA CUDA的开源的开发平台。 架构的变化(todo) 与cuda对比 CUDA ROCm Description SM Compute Unit, CU One of many more ...

cuda程序运行时间

写了两个脚本来获得通过nsys profile出来的cuda程序执行时间。 1. runnsys.sh runnsys.sh working_dir program args 第一个参数working_dir是设置后面你的程序在哪里跑。比如有些程序是编译在build/,但是实际input和work的目录在另外的目录下。这个参数设置为实际程序运行的目录即可。同时,reports也将生成在这个目录。 后面是正常运行cuda程序时的命令和参数。 more ...



获得带源码行信息的cuda汇编

之前记录的一些cuda的用法中也有关于cuda汇编的一些介绍。本文主要记录了带源代码行信息的cuda汇编文件的获取。主要内容参考CUDA Binary Utilities 程序编译时需要添加的参数 在makefile或者cmakelist文件中,添加如下内容到nvccflag或者手动添加到nvcc编译的参 more ...