ARKitScenes 是一個多樣化的真實世界數據集,用於使用移動RGB-D 數據理解3D 室內場景。
ARKitScenes 不僅是第一個使用現在廣泛使用的深度傳感器捕獲的RGB-D 數據集,而且還是有史以來收集到的最大的室內場景理解數據。除了原始數據和處理後的數據,ARKitScenes 還包括使用固定激光掃描儀捕獲的高分辨率深度圖,以及用於大型家具分類的手動標記的3D 定向邊界框。
ARKitScenes 還為兩個下游任務提供了幫助腳本:3D 對象檢測和RGB-D 引導上採樣。
該倉庫包含論文中描述的數據、用於可視化和處理資產的腳本以及訓練代碼。使用這些數據或源代碼時,請引用
@inproceedings{
dehghan2021arkitscenes,
title={{ARK}itScenes - A Diverse Real-World Dataset for 3D Indoor Scene Understanding Using Mobile {RGB}-D Data},
author={Gilad Baruch and Zhuoyuan Chen and Afshin Dehghan and Tal Dimry and Yuri Feigin and Peter Fu and Thomas Gebauer and Brandon Joffe and Daniel Kurz and Arik Schwartz and Elad Shulman},
booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 1)},
year={2021},
url={https://openreview.net/forum?id=tjZjv_qh_CE}
}
主要特徵
• ARKitScenes 是第一個使用廣泛使用的Apple LiDAR 掃描儀捕獲的RGB-D 數據集。除了原始數據,還為每個場景提供相機姿勢和表面重建。
• ARKitScenes 是最大的室內3D 數據集,由1,661 個獨特場景的5,047 個捕獲組成。
• 提供註冊RGB-D 幀和房間定義對象的定向邊界框的高質量地面實況。
下面是與ARKitScenes 相比的RGB-D 數據集及其地面實況資產的概述。 HR 和LR 分別代表高分辨率和低分辨率,可用於841 個獨特場景的2,257 個捕獲的子集。
數據採集
下圖中提供了iPad Pro 掃描設置的圖示, 網格覆蓋以協助使用iPad Pro 收集數據,使用iPad pro 捕獲的掃描模式之一的示例,紅色標記顯示該房間中固定激光掃描儀的選定位置。
#ARKitScenes首頁文檔和下載 #使用RGBD #數據理解3D #室內場景 #程式开发