一、大数据从事于什么工作
1、大数据从事的是开源工作,更倾向于“**”,由于大数据属新兴领域,专业人才比较缺乏,高端人才更是企业争抢的对象。薪资上升容易,职业发展潜力巨大。
2、大数据职业发展的方向:大数据开发、数据分析挖掘
3、主要负责大数据的大数据挖掘,数据清洗的发展,数据建模工作。大数据数据开发工程师偏重建设和优化系统。
4、一种偏向产品和运营,更加注重业务,主要工作包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等;
5、另一种则更注重数据挖掘技术,门槛较高,需要扎实的算法能力和代码能力。同时薪资待遇也更好。

二、自动驾驶开发者说|模块|轨迹预测有哪些开源的数据集
自动驾驶中,常用轨迹预测的开源数据集整理如下:
nuScenes:提供车辆和行人预测,数据集于2020年4月发布,包含波士顿和新加坡的1000个驾驶场景,可用于论文研究。预测任务为对象未来轨迹预测,结果为一系列xy位置,预测时长为6秒,采样频率为2赫兹。
Argoverse Motion Forecasting Dataset:数据集包括324,557个场景,每个场景时长5秒,用于训练和验证。数据集由自动驾驶测试车队精选,包含以10 Hz采样的每个跟踪对象的2D鸟瞰图质心。
NGSIM:包含车辆在高速公路上和城市道路上的行驶轨迹数据,数据集为CSV文件,包含四个不同场景:US101、I-80、Lankershim Boulevard和Peachtree Street。
INTERACTION:数据集涵盖不同**的驾驶场景,包含道路使用者如车辆、行人等的大量交互*行为预测。
ApolloScape:提供小车、大车、行人等轨迹预测数据,数据集包含帧数ID、目标ID、目标类别、位置xyz,长宽高信息以及heading。数据结构包括基于相机的图像、激光雷达扫描的点云和手动注释的轨迹。
TRAF:数据集聚焦高密度交通状况,每帧包含约13辆机动车辆、5名行人和2辆自行车,帮助算法更好地分析不确定环境下人类驾驶员行为。
HighD:大型自然车辆轨迹数据集,记录德国科隆附近六个地点的11.5小时测量值和110500辆车辆行驶数据,适用于驾驶员模型参数化、自动驾驶、交通模式分析等任务。
ETH/UCY:包含5个场景、2206条人体运动轨迹,广泛用于评估行人轨迹预测方法。
总结:相比感知数据集,轨迹预测数据集在**环境下轻松获取,成本较低。
往期回顾:自动驾驶开发者的相关工作、数据集、行业动态、技术栈、前沿研究等内容整理。













