职位描述
工作模式
📍 远程协作 | 🕒 灵活工时 | 💻 项目制合作
• 基于里程碑交付成果,报酬按项目阶段支付(可协商按小时计费) • 使用项目管理工具进行任务管理,定期视频会议同步进展
核心技术栈要求
🛠️ 必备技能:
- 精通 LangChain/Coze 框架开发,能设计多模型协同工作流(如 DS+GPT-4 混合调用)
- 3 年以上后端开发经验,至少精通以下一项: • Node.js 生态( NestJS + TypeScript 最佳) • Golang 开发(熟悉 gin+gRPC 生态)
- LLM 深度集成能力: • 熟练 RESTful/WebSocket 接口开发 • 掌握 Function Calling 、RAG 优化、LoRA 微调等实战经验 • 具备 prompt engineering 系统化设计能力
核心职责
🚀 你将负责:
- 构建企业级 AIGC 应用架构
• 设计支持 100+ QPS 的高可用服务
• 实现多模型路由与 fallback 机制 - 全流程 AI 工程化落地
• 从 PoC 验证到生产部署的全周期开发
• 模型服务成本优化( Token 消耗降低 30%+) - 前沿技术方案实施
• 私有化模型部署(支持 vLLM/TGI 等推理框架)
• 分布式推理加速(模型并行/流水线并行)
加分项
🌟 优先考虑:
• 有 AI 客服/智能创作平台等千万级调用量项目经验
• 熟悉模型量化( GGUF/AWQ )与蒸馏技术
• 掌握 LangGraph 工作流编排或 AutoGen 多智能体开发
• 有 LLM-Ops 监控平台搭建经验( Prometheus+LangSmith )
申请方式
需附材料:
- GitHub 技术账号(重点展示 LLM 相关项目)
- 最满意的 AI 应用案例说明(含技术架构图)
- 可投入的每周工时说明