본문 바로가기
참고/IT

데이터셋 - 탐지 및 표지

by Foxy현 2022. 9. 14.
728x90
반응형

안녕하세요! 이번에는 영상 데이터 중 물체를 탐지할 때 사용할 수 있는 데이터셋에 대해 알아보겠습니다.


https://cocodataset.org/#home

 

COCO - Common Objects in Context

 

cocodataset.org

데이터셋의 규모가 굉장히 크고, 세계적으로 많은 연구자들이 인용하여 활용한 데이터이므로 반드시 활용해야 하는 중요한 데이터셋입니다.

저 또한 VQA 모델을 학습할 때 사용했던 기억이 나네요.

 

* COCO Panoptic Segmentation Task

영상 내의 모든 픽셀을 대상으로 한 세그멘테이션 데이터입니다.

 

* COCO Object Detection Task

픽셀 단위 레이블링을 제공하는 데이터셋입니다.

80종 이상의 카테고리의 이미지와 레이블된 이미지가 포함되어 있습니다.

 

* COCO Keypoint Detection Task

인체의 주요 뼈대와 그 연결을 예측하는 데이터입니다.

포즈인식 작업에 사용할 수 있습니다.

인체의 구조를 세분화하여, 정교한 인식을 요구합니다.

 

* COCO Stuff Segmentation Task

하늘, 벽면, 잔디 등 사진에서 주요 객체를 제외한 나머지 물체에 대한 레이블이 되어 있습니다.

누끼 작업이나 크로마키 작업을 위한 배경 제거 AI 제작에 사용할 수 있겠습니다.

 

* COCO Image Captioning Task

이미지를 입력받아 그 이미지를 잘 설명하는 문장을 생성하는 데이터입니다.

 

https://storage.googleapis.com/openimages/web/index.html

 

Open Images V6

Open Images Dataset V6 + Extensions 15,851,536 boxes on 600 categories 2,785,498 instance segmentations on 350 categories 3,284,280 relationship annotations on 1,466 relationships 675,155 localized narratives 59,919,574 image-level labels on 19,957 categor

storage.googleapis.com

구글이 제작한 세계 최대 규모의 영상 데이터셋입니다.

 

* Image-Level Labels

대규모 이미지에 사람이 직접 부착한 레이블과 구글의 AI가 부착한 레이블을 추가하여 제작한 데이터셋입니다.

 

* Bounding Boxes

세계 최대 규모의 바운딩 박스 데이터셋입니다.

구글에서 여러 차례의 처리 과정을 거쳤기에, 신뢰도가 상당히 높은 수준입니다.

 

* Visual Relationship

 이미지상의 오브젝트들을 관계 트리플렛으로 묶은 데이터 레이블이 제공됩니다.

<클래스 1, 관계, 클래스2> 와 같은 구조입니다.

관계에는 전치사, 동명사, 동사와 동사구까지 다양한 품사가 포함됩니다.

 

* Object Segmentations

COCO에 비해 훨씬 다양한 카테고리에 대한 Segmentation Annotation이 제공됩니다.

오브젝트 경계면의 품질이 정교하게 레이블링되어 있습니다.

규모 대비 데이터의 품질 측면에서는 세계 최고 수준입니다.

 

* Localized Narratives

사진과 그에 대한 내러티브 데이터셋입니다.

사진 안에 있는 오브젝트에 대한 설명을 시간 순서에 따라 구분하여 데이터가 제작되었습니다.

따라서 어떤 문장이 어떤 영역에 해당하는 설명인지 알 수 있는 데이터셋입니다.

 

https://www.robots.ox.ac.uk/~vgg/data/pets/

 

Visual Geometry Group - University of Oxford

 

www.robots.ox.ac.uk

개와 고양이 사진에 Annotation을 추가한 데이터입니다.

 


'AI, 빅데이터 활용이 쉬워지는 142가지 데이터셋'을 참고하여 작성하였습니다.

 

728x90
반응형

'참고 > IT' 카테고리의 다른 글

데이터셋 - 자세인식  (1) 2022.09.21
데이터셋 - 안면인식  (0) 2022.09.15
데이터셋 - 의미론적 연관성  (0) 2022.09.15
데이터셋 - 이미지 분류  (0) 2022.09.13
데이터 포털  (0) 2022.09.13