Large Language Model Engineer**
岗位职责
大模型训练与优化
1、负责大语言模型(LLM)的预训练、微调(SFT/LoRA/PEFT)、强化学习(RLHF/RLAIF)。
2、优化模型推理效率,包括量化、蒸馏、分布式训练与部署。
多轮对话系统与工具链
1、构建多轮对话系统、提示工程(Prompt Engineering)、Agent 工具链与系统能力。
2、制定 LLM 评测体系和指标,提升可控性与稳定性。
业务落地
1、将大模型能力应用到 Suppart 的 AI 创作、艺术推荐、智能客服、审核系统等场景。
2、结合用户增长需求,构建大模型驱动的智能运营能力。
工程化能力
1、构建 LLM 推理服务,支持高并发的在线调用。
2、负责模型版本管理、自动化训练 pipeline 搭建。
团队协作
1、指导初中级工程师,推动团队技术成长。
2、与前后端、数据工程师合作进行端到端部署。
任职要求
1、5 年以上 NLP/LLM 研发经验,硕士优先
2、深入理解 Transformer、LLM 架构(GPT、LLaMA、Mistral 等)
3、精通 Python、Pytorch,熟悉 DeepSpeed / HuggingFace
4、熟悉模型训练、分布式训练、推理加速、量化/蒸馏
5、有实际业务场景大模型落地经验
加分项:
1、熟悉中/英/日多语言模型
2、有 Agent 工具链、RAG 产品化经验
3、有艺术、创作、内容平台相关经验