工作地点:
北京市
工作职责:
1.多模态数据仓库/数据湖的架构设计,适用于科学实验数据、时序数据、文档报告、音视频等不同模态数据的存储方案、数据分层、主题域与数据模型。
2.结构化、非结构化数据治理,结合工程大数据平台、相关工具/算法,开展元数据管理、质量监控、数据清洗、数据预处理、生命周期管理等工作。
3.多模态数据对齐与融合技术研究,将载人航天工程不同来源、不同结构的数据进行有效对齐、关联,为科研提供支持。
4.编写相关技术文档、数据治理规范及标准。
任职资格:
1.学历学位:研究生学历,硕士及以上学位;
2.专业方向:计算机类、软件工程类、通信类、自动化类、电子信息类、航天类等相关专业或学科方向;
3.技能和经验:
1)熟悉Hadoop、Hive、Spark、Flink等主流大数据生态组件,熟悉结构化数据预处理、ETL方法,熟悉图像/视频等非结构化数据处理分析方法/库。
2)具备大数据治理或大数据平台建设经验,理解数据仓库建模理论、数据湖架构,并能根据业务场景进行技术选型和架构设计
3)至少熟练掌握如下一种语言Java/Python/PHP,具备扎实的编程能力和脚本开发经验
4)有机器学习/深度学习/大模型项目经验者优先。
4.具备较强的团队合作意识、强烈的工作责任心和良好的组织协调能力,热爱航天事业。