内在美的震仔
+关注
博主要求身份验证
登录用户ID:
虽然目前v4版本没有正式发布,但是根据最新的论文架构可以看出来,在原来的架构下要增加一个存储模块架构,以便节省gpu的重复计算工作。通俗来说就是把算好的结果加载到内存,gpu计算需要的话直接从内存中调取。从模型推理角度来说,后期模型使用需要配的内存容量可能会更大,GPU的内存压力减小,对更高性能的GPU需求减小。
目前deep seekv4还没有发布,散户对其认识还需要一个过程,假如deep seek在春节期间或者春节前发布,我估计内存会先在短期拉升后杀一波,正式发布后主力建仓完毕直接拉升。