-
首页
-
认识凯恒
- 企业介绍
- 公司文化
- 荣誉资质
- 凯恒风貌
-
新闻资讯
- 企业新闻
- 企业活动
-
业务范围
- 热缩管
- 编织类产品
- 标识类产品
- 电子连接件
- 模缩套
- 线束辅材
- 电线电缆
- 航空航天设备
-
服务中心
- 服务流程
- 服务优势
- 服务承诺
- 客户评价
- 售后支持
-
招贤纳士
- 岗位招聘
- 校园招聘
- 员工生活
- 职场发展
-
分支机构
-
合作案例
-
联系我们
- 产品咨询
- 企业地址
-
首页
-
认识凯恒
- 企业介绍
- 公司文化
- 荣誉资质
- 凯恒风貌
-
新闻资讯
- 企业新闻
- 企业活动
-
业务范围
- 热缩管
- 编织类产品
- 标识类产品
- 电子连接件
- 模缩套
- 线束辅材
- 电线电缆
- 航空航天设备
-
服务中心
- 服务流程
- 服务优势
- 服务承诺
- 客户评价
- 售后支持
-
招贤纳士
- 岗位招聘
- 校园招聘
- 员工生活
- 职场发展
-
分支机构
-
合作案例
-
联系我们
- 产品咨询
- 企业地址
招贤纳士
以人为本,以精立业。以质取胜,以诚服务。
Agent开发工程师
岗位职责
1. 负责公司大模型技术体系的整体架构设计与落地,包括大模型应用平台、模型服务平台、RAG 知识库、Agent 智能体、模型评测、推理部署等核心模块。
2. 结合业务场景,设计可生产落地的大模型解决方案,支撑智能问答、知识检索、业务 Copilot、流程自动化、多模态应用等场景建设。
3. 负责大模型训练、微调、对齐、推理加速、模型压缩、长上下文、知识增强等关键技术方案设计与技术攻关。
4. 主导大模型应用的工程架构设计,保障系统在高并发、低延迟、高可用、可扩展、安全合规等方面满足生产级要求。
5. 负责 RAG、Agent、Function Calling、工具调用、向量检索、知识图谱、GraphRAG 等技术方案的设计、选型与优化,提升模型回答准确性、稳定性和可控性。
6. 负责大模型推理服务优化,包括推理引擎选型、显存优化、KV Cache 优化、批处理、流式输出、成本控制和服务稳定性建设。
7. 参与大模型平台化建设,制定模型接入、数据处理、Prompt 管理、评测体系、权限控制、日志监控、灰度发布等工程规范。
8. 跟踪国内外大模型技术发展趋势,评估并引入 Transformer 架构演进、多模态模型、长记忆、持续学习、模型即服务等前沿技术。
9. 负责核心技术难题攻关,指导团队成员完成关键模块设计与实现,提升团队在大模型工程化和架构设计方面的能力。
任职要求
1. 计算机、人工智能、软件工程、数学等相关专业本科及以上学历,具备扎实的计算机基础、算法基础和工程实现能力。
2. 具备 5 年以上 AI、后端架构、算法工程、数据平台或云原生平台相关经验,有 2 年以上大模型应用、模型平台或 AI 平台建设经验优先。
3. 深入理解大模型核心原理,熟悉 Transformer、Attention、Embedding、Tokenization、Prompt Engineering、Fine-tuning、RLHF/RLAIF、RAG、Agent 等技术。
4. 熟悉主流大模型工程技术栈,包括但不限于 PyTorch、Transformers、DeepSpeed、Ray、vLLM、TensorRT-LLM、SGLang、LangChain、LlamaIndex、Milvus、Qdrant、Elasticsearch 等。
5. 具备扎实的软件架构能力,熟悉分布式系统、高并发服务、微服务、云原生、容器化、服务治理、监控告警、CI/CD 等工程体系。
6. 熟悉大模型推理部署与性能优化,能够针对延迟、吞吐、显存占用、并发能力、稳定性和成本进行系统性优化。
7. 熟悉 RAG 与企业知识库建设,理解文档解析、切分策略、向量化、召回排序、重排、上下文组装、答案评估和幻觉控制等关键环节。
8. 至少熟练掌握 Python,熟悉 Java、Go、C++ 中一种或多种语言,具备较强的代码能力和复杂系统问题排查能力。
9. 具备完整的大模型项目落地经验,能够从业务需求分析、技术选型、架构设计、研发实施、上线运维到效果优化形成闭环。
10. 基础扎实,技术判断力强,能在复杂业务约束下做出可落地、可扩展、可维护的技术方案;具备较强的技术攻坚能力和团队技术带动能力。