最新• 2年+ AI应用/算法工程经验,精通Python• RAG实战:Milvus/Qdrant/Chroma,Embedding选型、混合检索、Rerank• 多模态打标:Qwen-VL/CLIP图像/视频打标• 图像生成:Stable Diffusion/SDXL/ComfyUI,LoRA训练• 开源部署:HuggingFace生态,GPU模型部署• 成本意识:批处理、量化、缓存控制成本远程工作招聘信息

LLM 应用工程师  25K-40K

岗位职责:

 

1. 多模态内容检索(RAG)系统 将公司海量图文、视频内容向量化(Embedding),结合多模态打标(Qwen-VL / CLIP 对封面、关键帧、标题标签打标),构建可语义搜索的内容检索库。设计并落地内容抽取管道(对接多套站点 / CMS 的内容目录),优化检索策略(混合检索、Rerank、去重),让 AI 在对话中”读懂空气”,精准、自然地推送相关媒体资源。

2. 海量数据管道与打标 负责存量内容的批量打标与增量更新流程:规范标签体系、清洗低质与违规内容、控制打标算力成本(批处理、模型选型、缓存)。保证检索库的覆盖率、准确率与时效性。

3. 图像生成(生图)能力 基于开源模型(Z-Image、Stable Diffusion / SDXL 等)搭建生图服务(ComfyUI / Diffusers),训练并管理风格 LoRA、实现主体一致性(同一角色多场景”还是她”)、按需出图与换装。优化出图质量、速度与单张成本。

4. 向量数据库与检索工程 负责向量数据库(Milvus / Qdrant 等)的搭建、调优与运维,解决海量数据下的检索性能、召回与排序问题,控制存储与查询成本。

5. 内容理解微调  基于自有内容与标签语料,使用 LoRA 等做内容理解 / 多模态方向的微调,提升打标与检索质量;研究 abliteration 等实践。

6. 接口对接与协作 使用 Python(FastAPI / Flask)将检索、打标、生图等能力封装为稳定接口,接入统一模型网关,与 AI 应用工程师、后端、前端协同迭代。

 

任职要求:

 

2 年以上 AI 应用 / 数据 / 算法工程经验,精通 Python,熟悉 Linux / GPU 环境。

RAG 与向量检索实战:熟练至少一种向量数据库(Milvus / Qdrant / Chroma),有真实海量数据的 RAG 调优经验,了解 Embedding 选型、混合检索、Rerank,知道如何解决”检索不准 / 召回低 / 幻觉”。

多模态打标:用过 Qwen-VL / CLIP 或同类模型做图像 / 视频内容理解与打标,能设计标签体系与批量处理管道。

图像生成实战:有 Stable Diffusion / SDXL / ComfyUI 的实际使用经验,理解采样、LoRA 训练、主体一致性、出图调参与成本控制。

开源部署能力:熟悉 HuggingFace 生态,能在 GPU 上独立部署开源模型(不依赖官方 API)。

成本意识:对算力成本敏感,懂得用工程手段(批处理、量化、缓存、模型选型)压低打标与出图成本。

 

加分项:

 

掌握 LoRA 轻量级微调(SFT)的原理与流程;有 abliteration / 去拒绝实践经验。

有大规模内容平台(视频 / 图库 / 电商)的内容理解、推荐或搜索经验。

用过开源 TTS(VITS / CosyVoice 等)或视频生成模型。

懂二次元、懂网文,或对海外泛娱乐 / 亚文化(NSFW)互动娱乐有理解力和包容度。

如何申请

简历投递邮箱 linlinli88200@gmail.com TG @hr88868