关于

Let's Make AGI Real

I, Robot

订阅可看

2025-02-11

什么是MLA多头潜在注意力机制？

继续学习DeepSeek的技术创新点：MLA。 MLA（Multi-Head Latent Attention… Continue reading

订阅可看, 大模型技术
2025-02-11

MOE架构大模型的内部实现机制

DeepSeek V3模型在架构方面的创新主要是采用了MOE（Mixture of Experts）和MLA（… Continue reading

订阅可看, 大模型技术

我是谁

平行宇宙的数字游民
常年徘徊于技术与人文的十字路口
被AGI裹挟
未能以图书馆员终老
灵魂无所寄托

Tumblr
共享图标
Instagram

近期文章

AI图像十问——2026年AI图像生成赛道总结与展望
AI应用巡礼第45期：可图Kolors与通义万相——中国AI图像生成的双旗之争
当 AI 的成绩单开始发烫*——Stanford HAI《AI Index Report 2026》深度解读：能力狂奔、信任塌方，以及一个新时代的账本
GTP5.5与DeepSeek v4——一个在云端修补世界，一个把一百万 token 塞进开源机器
《一周AI速览202605A》：从模型军备到智能体作业系统：AI 的竞争正在从“大脑”转向“工位”

电子报

输入您的电子邮件…

近期文章

AI图像十问——2026年AI图像生成赛道总结与展望
AI应用巡礼第45期：可图Kolors与通义万相——中国AI图像生成的双旗之争
当 AI 的成绩单开始发烫*——Stanford HAI《AI Index Report 2026》深度解读：能力狂奔、信任塌方，以及一个新时代的账本

Follow Me

电子报

输入您的电子邮件…

在WordPress.com的博客.

订阅已订阅
- Let's Make AGI Real
- 已有 WordPress.com 帐户？立即登录。