最新• 2年+ AI应用/算法工程经验，精通Python• RAG实战：Milvus/Qdrant/Chroma，Embedding选型、混合检索、Rerank• 多模态打标：Qwen-VL/CLIP图像/视频打标• 图像生成：Stable Diffusion/SDXL/ComfyUI，LoRA训练• 开源部署：HuggingFace生态，GPU模型部署• 成本意识：批处理、量化、缓存控制成本远程工作招聘信息

LLM 应用工程师新

25k-50k 远程全职远程工作

知名影视传媒科技有限公司

• 2年+ AI应用/算法工程经验，精通Python• RAG实战：Milvus/Qdrant/Chroma，Embedding选型、混合检索、Rerank• 多模态打标：Qwen-VL/CLIP图像/视频打标• 图像生成：Stable Diffusion/SDXL/ComfyUI，LoRA训练• 开源部署：HuggingFace生态，GPU模型部署• 成本意识：批处理、量化、缓存控制成本

登录后申请

LLM 应用工程师 25K-40K

岗位职责：

1. 多模态内容检索（RAG）系统将公司海量图文、视频内容向量化（Embedding），结合多模态打标（Qwen-VL / CLIP 对封面、关键帧、标题标签打标），构建可语义搜索的内容检索库。设计并落地内容抽取管道（对接多套站点 / CMS 的内容目录），优化检索策略（混合检索、Rerank、去重），让 AI 在对话中”读懂空气”，精准、自然地推送相关媒体资源。

2. 海量数据管道与打标负责存量内容的批量打标与增量更新流程：规范标签体系、清洗低质与违规内容、控制打标算力成本（批处理、模型选型、缓存）。保证检索库的覆盖率、准确率与时效性。

3. 图像生成（生图）能力基于开源模型（Z-Image、Stable Diffusion / SDXL 等）搭建生图服务（ComfyUI / Diffusers），训练并管理风格 LoRA、实现主体一致性（同一角色多场景”还是她”）、按需出图与换装。优化出图质量、速度与单张成本。

4. 向量数据库与检索工程负责向量数据库（Milvus / Qdrant 等）的搭建、调优与运维，解决海量数据下的检索性能、召回与排序问题，控制存储与查询成本。

5. 内容理解微调基于自有内容与标签语料，使用 LoRA 等做内容理解 / 多模态方向的微调，提升打标与检索质量；研究 abliteration 等实践。

6. 接口对接与协作使用 Python（FastAPI / Flask）将检索、打标、生图等能力封装为稳定接口，接入统一模型网关，与 AI 应用工程师、后端、前端协同迭代。

任职要求：

2 年以上 AI 应用 / 数据 / 算法工程经验，精通 Python，熟悉 Linux / GPU 环境。

RAG 与向量检索实战：熟练至少一种向量数据库（Milvus / Qdrant / Chroma），有真实海量数据的 RAG 调优经验，了解 Embedding 选型、混合检索、Rerank，知道如何解决”检索不准 / 召回低 / 幻觉”。

多模态打标：用过 Qwen-VL / CLIP 或同类模型做图像 / 视频内容理解与打标，能设计标签体系与批量处理管道。

图像生成实战：有 Stable Diffusion / SDXL / ComfyUI 的实际使用经验，理解采样、LoRA 训练、主体一致性、出图调参与成本控制。

开源部署能力：熟悉 HuggingFace 生态，能在 GPU 上独立部署开源模型（不依赖官方 API）。

成本意识：对算力成本敏感，懂得用工程手段（批处理、量化、缓存、模型选型）压低打标与出图成本。

加分项：

掌握 LoRA 轻量级微调（SFT）的原理与流程；有 abliteration / 去拒绝实践经验。

有大规模内容平台（视频 / 图库 / 电商）的内容理解、推荐或搜索经验。

用过开源 TTS（VITS / CosyVoice 等）或视频生成模型。

懂二次元、懂网文，或对海外泛娱乐 / 亚文化（NSFW）互动娱乐有理解力和包容度。

如何申请

简历投递邮箱 linlinli88200@gmail.com TG @hr88868

登录后申请

按分类筛选

开发运营设计产品其他市场销售职能

按性质筛选

远程全职远程兼职远程实习

职位订阅

微信扫码关注微信服务号