不重启服务器重新挂载nvidia gpu driver

大部分情况下,更新nvidia gpu驱动不需要重启机器。如果你的驱动成功更新,但是使用nvidia-smi提示有Failed to initialize NVML: Driver/library version mismatch,一般情况下是因为更新的驱动没有被成功加载。 查看当前nvidia driver是否被使用 执行第二条命令可以直接列出正在使用gpu的程序。比如nv-hosten是DCGM的server端,直接kill或者使用nv-hostengine -t将其退出即可 more ...

ubuntu nvidia gpu driver的安装

之前记录过一篇使用nvidia提供的run包安装驱动的文章,现在更新下使用apt source更新的方法。 目前主要有三个apt源可以更新nvidia gpu driver ubuntu XX-updates/restricted,ubuntu官方源里的闭源驱动 https://launchpad.net/~graphics-drivers/+archive/ubuntu/ppa graphics driver的 more ...

设置NVIDIA GPU的时钟频率

NVIDIA GPU默认是自动调频,如果需要profile程序,通过ncu获得的结果可能会不准确,尤其是对于一些比较小的程序来说。因此,测试需要固定gpu的时钟频率。需要执行的命令如下: sudo nvidia-smi -pm 1 nvidia-smi -q -d CLOCK sudo nvidia-smi -lgc 2100,2100 nvidia-smi -q -d CLOCK more ...

Ubuntu下开启TPM2.0安装nvidia driver

windows 11 发布了,新系统要求开启TPM2.0(一个安全芯片标准,8代及以后的intel和较新的amd cpu都支持)。但是之前在ubuntu下使用run包装nvidia 驱动时,一般都会遵循一些教程关闭UEFI的secure boot,同时也就关闭了TPM等。本文记录了如何开启TPM,在ubuntu下安装nvidia gpu driver。 开启TPM 以华硕主板, amd cpu为例,在UEFI中找到启动-->安全启动-->OS Type,选择Windows UEFT 模式。 在高级-->AMD fTPM设置, more ...