一些常用 Model 的结构图

Transformer

是谁翻译的名字叫变形金刚来着!!变形金刚明明是 transformers ,我建议翻译成变压器更适合电子系学生

m-transformer.jpg

GPT

对,就是 Chat-GPT 他太爷爷

m-gpt.png

BERT

在 NLP 采用双向 transformer 的开山之作,名字来源于《芝麻街》

m-bert.jpg

ViT

首次将纯 Transformer 比较完整地应用到 CV 领域下的 Classification 任务中,不依赖于 CNN 且在大模型预训练上表现更好,作者称比较便宜(大嘘)

m-vit.jpg

MEA

何凯明为什么是神

m-mea.jpg

CLIP

最熟悉的一集

m-clip.jpg


碎碎念

以上所有论文的学习基本来自李沐老师的论文精讲 李沐论文精讲

模型的具体其他信息可以去 https://paperswithcode.com/

公若不弃,布愿拜为义父