最新文章

LLM并行训练7-混合并行总结

LLM并行训练7-混合并行总结

如果靠脑补来调整这些参数, 会存在一个非常巨大的搜索空间, 很难找到最优于计算效率的方法, ...