안녕하세요! 이번에는 영상 데이터 중 물체를 탐지할 때 사용할 수 있는 데이터셋에 대해 알아보겠습니다.
데이터셋의 규모가 굉장히 크고, 세계적으로 많은 연구자들이 인용하여 활용한 데이터이므로 반드시 활용해야 하는 중요한 데이터셋입니다.
저 또한 VQA 모델을 학습할 때 사용했던 기억이 나네요.
* COCO Panoptic Segmentation Task
영상 내의 모든 픽셀을 대상으로 한 세그멘테이션 데이터입니다.
* COCO Object Detection Task
픽셀 단위 레이블링을 제공하는 데이터셋입니다.
80종 이상의 카테고리의 이미지와 레이블된 이미지가 포함되어 있습니다.
* COCO Keypoint Detection Task
인체의 주요 뼈대와 그 연결을 예측하는 데이터입니다.
포즈인식 작업에 사용할 수 있습니다.
인체의 구조를 세분화하여, 정교한 인식을 요구합니다.
* COCO Stuff Segmentation Task
하늘, 벽면, 잔디 등 사진에서 주요 객체를 제외한 나머지 물체에 대한 레이블이 되어 있습니다.
누끼 작업이나 크로마키 작업을 위한 배경 제거 AI 제작에 사용할 수 있겠습니다.
* COCO Image Captioning Task
이미지를 입력받아 그 이미지를 잘 설명하는 문장을 생성하는 데이터입니다.
https://storage.googleapis.com/openimages/web/index.html
구글이 제작한 세계 최대 규모의 영상 데이터셋입니다.
* Image-Level Labels
대규모 이미지에 사람이 직접 부착한 레이블과 구글의 AI가 부착한 레이블을 추가하여 제작한 데이터셋입니다.
* Bounding Boxes
세계 최대 규모의 바운딩 박스 데이터셋입니다.
구글에서 여러 차례의 처리 과정을 거쳤기에, 신뢰도가 상당히 높은 수준입니다.
* Visual Relationship
이미지상의 오브젝트들을 관계 트리플렛으로 묶은 데이터 레이블이 제공됩니다.
<클래스 1, 관계, 클래스2> 와 같은 구조입니다.
관계에는 전치사, 동명사, 동사와 동사구까지 다양한 품사가 포함됩니다.
* Object Segmentations
COCO에 비해 훨씬 다양한 카테고리에 대한 Segmentation Annotation이 제공됩니다.
오브젝트 경계면의 품질이 정교하게 레이블링되어 있습니다.
규모 대비 데이터의 품질 측면에서는 세계 최고 수준입니다.
* Localized Narratives
사진과 그에 대한 내러티브 데이터셋입니다.
사진 안에 있는 오브젝트에 대한 설명을 시간 순서에 따라 구분하여 데이터가 제작되었습니다.
따라서 어떤 문장이 어떤 영역에 해당하는 설명인지 알 수 있는 데이터셋입니다.
https://www.robots.ox.ac.uk/~vgg/data/pets/
개와 고양이 사진에 Annotation을 추가한 데이터입니다.
'AI, 빅데이터 활용이 쉬워지는 142가지 데이터셋'을 참고하여 작성하였습니다.
'참고 > IT' 카테고리의 다른 글
데이터셋 - 자세인식 (1) | 2022.09.21 |
---|---|
데이터셋 - 안면인식 (0) | 2022.09.15 |
데이터셋 - 의미론적 연관성 (0) | 2022.09.15 |
데이터셋 - 이미지 분류 (0) | 2022.09.13 |
데이터 포털 (0) | 2022.09.13 |