Waymo开放最大规模自动驾驶传感器数据集,覆盖多地点1000驾驶段高质标注数据

雷锋网 AI 开发者按:近日,谷歌母公司 Alphabet 旗下的自动驾驶公司 Waymo 宣布开源他们团队的自动驾驶数据库,以帮助研究界在机器感知与自动驾驶技术方面实现突破。公开的数据集由 Waymo 自驾汽车在各种条件下采集的高度标注数据组成,包括了覆盖多个地点的 1000 个驾驶段上收集的数据。

Waymo 首席科学家兼项目负责人 Drago Anguelov 表示,该数据集是有史以来最大、最丰富、最多样化的自动驾驶数据集之一。Waymo 也发布了相关博客来介绍该数据集,雷锋网 AI 开发者将其整理编译如下。

Waymo开放最大规模自动驾驶传感器数据集,覆盖多地点1000驾驶段高质标注数据

数据集简介

数据是机器学习的关键要素。我们的车辆在 25 个城市收集了超过 1000 万英里的自动行驶里程数据;这一丰富多样的实际数据帮助我们的工程师和研究人员开发了 Waymo 的自动驾驶技术和创新的模型及算法。

现在,我们邀请研究界加入我们的 Waymo 开放数据集中,该数据集是一个用于自主驾驶的高质多模式标注数据集。它由 Waymo 自驾车辆收集的高度标注数据组成,数据集涵盖了各种各样的环境,从密集的城市中心到郊区景观,以及白天和黑夜、黎明和黄昏、晴天和下雨天中收集的数据。所有感兴趣的研究人员都可以在 https://waymo.com/open/免费下载。

Waymo开放最大规模自动驾驶传感器数据集,覆盖多地点1000驾驶段高质标注数据

图 1 Waymo 开放数据集涵盖了从密集的城市中心到郊区景观的各种环境

数据集具体内容

我们相信它是有史以来最大、数据最丰富、最多样化的自动驾驶数据集之一。数据集包含:

  • 尺寸和覆盖范围:此版本包含 1,000 个自动驾驶路段的数据。每个数据片段捕获 20 秒的连续驾驶过程,相当于每个镜头标注参数为 10 Hz 的 200,000 帧。这样的连续镜头可以使得研究人员易于开发模型来跟踪和预测其它道路使用者的行为。

  • 多样化的驾驶环境:该数据集涵盖凤凰城、亚利桑那州、柯克兰、华盛顿州、山景城、加利福尼亚州和加利福尼亚州旧金山的密集城市和郊区环境,并捕捉了各种驾驶条件下的数据(包含:白天和黑夜、黎明和黄昏、晴天和下雨天)。

  • 高分辨率的 360 度视图:每个分段包含了来自五个高分辨率 Waymo 激光雷达和五个前置与侧面摄像头的数据。

  • 密集标注:数据集包括激光雷达框架和图像;车辆、行人、骑自行车者和标识牌都经过了精心的标记,共捕获了 1200 万个 3D 标注和 120 万个 2D 标注。

Waymo开放最大规模自动驾驶传感器数据集,覆盖多地点1000驾驶段高质标注数据

图 2 数据集包括 Waymo 高清摄像机的摄像机镜头和 120 万个 2D 标签

  • 相机 – 激光雷达同步:我们一直致力于融合了来自多个摄像头和激光雷达数据的 3D 感知模型。我们设计了整个自驱动系统,包括可以无缝地协同工作的硬件和软件,也包括了对传感器位置的选择和高质量时间同步设置。

Waymo开放最大规模自动驾驶传感器数据集,覆盖多地点1000驾驶段高质标注数据

图 3 数据集包含了高质时间同步的激光雷达与相机拍摄数据

数据集现状

Waymo 开发的数据集目前包含来自 1000 个片段(每个数据片段大小为 20s)的激光雷达和相机拍摄数据,以下是当前包含的内容:

  • 1000 个片段,每段 20s 录像,在不同的地理位置和条件下以 10 Hz(200000 帧)参数进行收集。

  • 传感器数据

1 个中程激光雷达

4 个短程激光雷达

5 个摄像头(正面和侧面)

时间同步的激光雷达和相机拍摄数据

激光雷达到相机的投影数据

传感器校准和车辆姿态数据

  • 标记数据

4 个对象类别的标注,包括:车辆、行人、骑自行车者、标志

所有 1000 个区段的激光雷达数据的高质量标注

带有激光雷达数据跟踪 ID 的 12M 3D 边界框标注

100 段摄像机数据的高质量标注(之后将添加更多内容)

具有摄像机数据追踪 ID 的 1.2M 2D 边界框标注

  • 代码

可通过 GitHub 进行访问,https://github.com/waymo-research/waymo-open-dataset。

这些数据可用于非商业用途,但研究的定义相当广泛,其他企业、学者和研究人员都可以使用;可通过(https://waymo.com/open/terms/)查看详细许可协议。

数据集意义及未来计划

在机器学习研究方面,获得相应的数据能很好的将想法变成真正的创新。这些数据有可能帮助研究人员在 2D 和 3D 感知方面取得进展,并在场景适应、场景理解和行为预测等领域取得进展。我们希望研究界能够通过我们的数据发现更多令人兴奋的研究方向,这不仅有助于使自动驾驶车辆更加安全强大,而且还会影响其他相关领域和应用,例如:计算机视觉和机器人技术。

虽然这个数据集不能反映我们传感器系统的全部功能,并且它只包含 Waymo 自动驾驶系统训练所依据数据的一小部分,但我们相信出于研究目的,这个大型、多样化和高质量的数据集是非常有价值的。

我们计划将很快扩大这个数据集的规模。除此之外,我们还计划后续在此数据集上发布一些基准模型的性能;到时,我们会为使用该数据集的人提供相应的挑战赛。

Waymo开放最大规模自动驾驶传感器数据集,覆盖多地点1000驾驶段高质标注数据

Waymo 官网

https://waymo.com/open/

博客地址

https://medium.com/waymo/waymo-open-dataset-6c6ac227ab1a

GitHub 地址

https://github.com/waymo-research/waymo-open-dataset

雷锋网 AI 开发者 雷锋网

主题测试文章,只做测试使用。发布者:觉鸟网,转转请注明出处:https://www.jueniao.cn/n/21269.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022年6月13日 10:36
下一篇 2022年6月13日 10:37

相关推荐

  • 公有云市场一览:阿里云稳坐第一,腾讯已被华为超越

    文/杨剑勇 那么,扎根消费互联网,拥抱产业互联网的腾讯,在赋能千百行业数字化转型的腾讯云成绩单如何?首先,国内云端赛道上,在公有云IaaS市场中被华为云反超。930战略调整作为腾讯重大变革时间点,腾讯云也呈现出高速发展态势。2018年,腾讯云服务收入同比增长100%至91亿元,2019年腾讯云营收规模达170亿。这个期间,腾讯云位居全球第五、国内第二。只是近…

    2022年6月28日
    3500
  • 小鹏又一款车型现身!股价却下跌逾7%

    小鹏P5的亮相意味着激光雷达上车的脚步又前进了一步 小鹏P5正式亮相 4月14日晚间,小鹏汽车(NYSE:XPEV)第三款车型小鹏P5正式发布,定位为一款紧凑型纯电轿车,并成为首款搭载激光雷达的量产车型。新车型将在本周末举办的上海车展亮相,并接受预定。 小鹏汽车还表示,小鹏P5进行国际版的开发,将销售至挪威及欧盟等国家区域,预计在2021年第四季度交付。不过…

    2022年6月21日
    2500
  • 激光雷达“市场分化”加剧,专注汽车赛道才是大赢家

    激光雷达赛道,正在经历新一轮市场分化。 随着部分新车前装量产定点合同进入释放周期,业务来源的不同,间接体现在激光雷达上市公司及初创公司的估值数字上。 已经公开表示激光雷达商业化的第一波浪潮将出现在工业、机器人等领域的几家公司,尤其是Velodyne、Ouster两家公司,最新市值已经跌落至5亿美元左右,此前两家公司高峰期市值在25-50亿美元左右。 数据显示…

    智能科技 2022年6月15日
    3900
  • 神策数据A—B测试:以变应变,给用户更好的体验“宠爱”

    伴随着企业数字化转型进程的加速及用户行为分析理念的深入,各种各样的数据分析模型,比如事件分析、漏斗分析、留存分析等,早已成为企业日常运营不可或缺的小助手。 作为大数据分析与营销科技服务提供商,神策数据在过去 6 年累计服务了 30 多个行业的 1500+ 企业,在这个过程中我们逐渐意识到,数据分析只是企业数字化转型过程中的一环,要想让数据真正对企业产生价值,…

    2022年6月17日
    3400
  • 基于python3实现Azure机器学习最接近人声的文本转语音功能

    上期文章,我们介绍了如何使用Azure来创建一个语音服务API,哪里,我们得到了API的key,以及语音服务的基本信息,包含地区等,这些都是本期代码需要的参数 听了那么多AI合成的语音,Azure机器学习的文本转语音最接近人声 下图是Azure官方的一个语音合成流程图,大致包含如下步骤 准备需要合成语音的text文件或者SSML文件 向API发送请求 API…

    2022年6月14日
    2900

发表回复

您的电子邮箱地址不会被公开。

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信