工作地点:
北京市
工作职责:
1.跟踪大模型领域的前沿研究成果和技术动态,开展航天领域相关的大模型基础理论研究,根据工程任务与空间科学研究中的具体业务需求,对大模型进行持续的性能优化和调优,提升模型的泛化能力、推理速度和资源利用效率,以适应不同规模和类型的数据智能分析任务;
2.将研发的大模型技术集成到现有的工程任务系统中,实现大模型在数据的处理生产、存储管理、分发共享等业务流程中的实际应用;
3.利用大模型对工程任务与科学数据进行深度挖掘和分析,发现新的科学规律和应用价值,提供创新性的解决方案;
4.积极申请并完成各类横/纵向科研项目。
任职资格:
1.教育背景:研究生学历,博士学位;
2.专业方向:计算机类、软件工程类、通信类、自动化类、电子信息类、航天类等相关专业或学科方向;
3.技能与经验:
1)精通至少一种主流的深度学习框架,如 PyTorch、TensorFlow 等,具备扎实的编程能力,熟练掌握 Python、C++ 等编程语言;
2)熟悉大模型的原理和架构,如 GPT、BERT 等,有参与过大模型训练、微调、部署等相关项目的经验;
具备良好的数据处理和分析能力,熟悉数据挖掘、机器学习、自然语言处理等相关技术,能够运用这些技术对海量数据进行预处理和特征提取。
3)了解分布式计算和并行计算原理,有在分布式环境下进行模型训练和推理的经验,能够利用云计算平台进行大规模计算;
4)有大模型技术相关项目经验,有在航天、遥感、地理信息等领域应用大模型解决实际问题的经验者优先;
5)参与过至少一个大型科研项目或工程任务,有项目管理和团队协作经验,能够带领团队完成大模型技术的研发和应用工作者优先;
6)具有较强的科研能力和创新意识,以第一作者身份在高水平学术期刊或会议上发表过相关论文者优先
4.具备较强的团队合作意识、强烈的工作责任心和良好的组织协调能力,热爱航天事业。