2017/12/22 Xuan Li, Kunfeng Wang, Member, IEEE, Yonglin Tian, Lan Yan, and Fei-Yue Wang, Fellow, IEEE
https://arxiv.org/pdf/1712.08394.pdf https://www.arxiv-vanity.com/papers/1712.08394/
(まとめ:yuji38kwmt)
- ParalellEyeという画像データセットの説明
- 作り方
- 地図データから、北京中関村(Zhongguancun )の3D Modelを作成
- Then, we use the computer graphics, virtual reality, and rule modeling technologies to create a realistic, large-scale virtual urban traffic scene, in which the fidelity and geographic information can match the real world well.
- シーンレンダリング、自動的なアノテーションを実施するために、Unity3D開発環境を使う
- ground truth labels including pixel-level semantic/instance segmentation, object bounding box, object tracking, optical flow, and depth.
- Unity3Dを使うことにより、正確(主観的でない)で効率的なアノテーションが可能
- 人がアノテーションするときの問題
- ビデオ画像データセットのアノテーションは時間がかかる。間違えやすい
- 専門家はsparse
- 意見が一致しないとき、どう対応するか
- アノテーションは時間がかかる30-60分
- virtual KITTIは、拡張できない
- 多くのデータセットはセマンティックセグメンテーションアノテーションを提供していない
- Parallel Vision
- ACP(Artificial Systems、Computational Experiment、Parallel Execution)
- よくわからなかった
- OpenStreetMap(OSM)で、都市のネットワークを抽出
- CityEngineはCGA(Computer Generated Architecture)ルールの作成、または人工的なシーン(道路、建物、車、樹木、歩道など)の設計に使われる
- 人工的なシーンは、Unity3Dに取り込まれ、レンダリングされる
- Unity3Dは環境条件の制御のために使われる
Discussionなし。
感想
- ParalellEyeデータセットを使って学習したらうまくいく?
- Joint Semantic Segmentation and 3D Reconstruction from Monocular Video
- アノテーション時間に関して書いてある?
- Semantic Instance Annotation of Street Scenes by 3D to 2D Label Transfer
- "curse of dataset annoation"のグラフあり
- ACP (Artificial systems, Computational experiments, and Parallel execution) theory
- Optical Flow
- Parallel Vision?
- optical flow, and depth
- virtual datasetの歴史は古い 2007年?
- セマンティックセグメンテーション:10-20カテゴリ、高品質、1枚:30-60分
- “curse of dataset annotation” : データセットの呪縛?
- Google Mapsはオープンソースでない