為了促進對于大規模時空范圍內的人群活動的長時間、長距離分析,清華大學部推出一個新的十億像素級別視訊數據集:PANDA,
該數據集在自然場景中由十億像素相機收集,能同時保證寬視場(最大可覆蓋1平方千米的自然場景)和高分辨率(每幀視訊接近10億像素),以此提供一個標準化的評測基準,促進新的算法來理解大規模現實世界場景中復雜的人群活動及社交行為,
近日,百度智能云數據眾包與清華大學部開展項目合作,推進全球首個十億像素級視訊數據集PANDA的建設工作,用以支持未來在公共安全、智慧城市、虛擬現實等領域的各項研究及應用。
本次項目共完成7200余幀億級像素圖片,共計超過106萬張切圖的數據標注工作,包括物體間關系近2萬組、交互行為近20萬個、移動物體軌跡點近30萬組,以及數十億3D點云數據的語義分割及實例標注,
據了解,PANDA是全球首個十億像素級視訊數據平臺,它突破了人眼視覺分辨率的極限,賦予視覺計算更高質、更真實、更全面的源數據,填補了國際上“寬視場、多對象、高分辨率”數據平臺的空白,為新一代智能處理技術研究提供了不可或缺的數據基礎,
清華大學部電子工程系副教授、PANDA 數據集項目負責人方璐介紹,此前清華大學部團隊曾圍繞 PANDA 數據集,在計算機視覺頂級國際會議ECCV 2020上,組織了GigaVision 2020挑戰賽并引起廣泛關注。
目前,團隊正在籌辦ACMMM 2021會議的GigaVision主題挑戰賽,以及全球人工智能技術創新大賽,