Where models get real | 工程不是魔法,是逻辑的奇迹
Yoan AI Lab 专注于 AI 工程与模型部署全流程,探索从模型训练、推理优化到容器化部署的系统化实现路径。
我们的目标是将理论模型转化为可复现、可扩展、可交付的生产级 AI 应用。
| 项目名称 | 技术栈 | 简介 |
|---|---|---|
| GPT-2 Train & Deploy Demo | PyTorch · Flask · Docker | 从训练到部署的端到端文本生成项目 |
| GPT-2 TensorRT Deploy | TensorRT · ONNX | 推理加速与性能对比实现 |
| Quantization & K8s Deploy | INT8量化 · Kubernetes | 模型压缩与自动扩缩容演示 |
| Distributed Inference Demo | PyTorch DDP | 多进程推理与Rank分配优化 |
我们相信 AI 工程的价值在于「落地」。
从模型实验到推理服务,从单机训练到分布式架构,
Yoan AI Lab 致力于让每个 AI 项目都能真正被运行、被部署、被使用。
💬 “Engineering turns imagination into systems.”