在Pacsal及更新的GPU中,managed memory在调用cudaMallocManaged()
分配以后, 不一定在device memory上实际malloc。或者说,page和page table直到被GPU或CPU访问以后才被创建。page可以在任意时间迁移到任意memory,driver会采用启发算法来维护数据局部性和防止过多的page faults产生。
Reference
https://developer.nvidia.com/blog/unified-memory-cuda-beginners/
Comments