Python

“2026年，AI 应用爆发式增长。但一个残酷的现实是：大部分 AI 项目死在’最后一公里’——部署。” 一、为什么 Modal 值得关注传统部署路径太沉重了：先写 Dockerfile，再配置 CI/CD，最后处理 GPU 驱动和依赖库版本地狱。Modal 的核心价值在于——把这一切压缩到一行命令。三个让人无法拒绝的理由： gpu 秒级开箱：modal run 就能启动 A100/H100 容器，按秒计费 Python 原生：没有复杂的 K8s YAML，纯 Python 装饰器定义任务和流水线云端持久化：文件系统和环境自动保存，下次启动复用二、Modal 快速上手安装与认证 pip install modal modal token new # 浏览器完成 OAuth 第一个无服务器函数 # hello.py import modal app = modal.App("hello-world") @app.function() def greet(name: str) -> str: return f"Hello, {name}!" if __name__ == "__main__": with modal.run(): print(greet.remote("Modal")) 运行： modal run hello.py GPU 推理实战：LLM 部署 # llm_serve.py import modal app = modal.App("llm-deploy") # 定义环境（只构建一次，缓存复用） image = (modal.Image.debian_slim() .pip_install("torch", "transformers")) @app.function(image=image, gpu="A100") def generate(prompt: str) -> str: from transformers import pipeline pipe = pipeline("text-generation", model="gpt2") return pipe(prompt, max_length=50)[0]["generated_text"] # Web 端点暴露 @app.function(image=image, gpu="A100") @modal.web_endpoint() def web_generate(prompt: str): return {"result": generate.remote(prompt)} 核心命令： ...