본문 바로가기

머신러닝, 딥러닝/컴퓨터비전9

[컴퓨터비전] Super Resolution Super Resolution Super Resolution : 저해상도 영상을 고해상도 영상으로 변환하는 작업을 의미 Image Super Resolution은 저해상도(Low Resolution) 이미지를 고해상도(High Resolution) 이미지로 변환 시키는 문제를 의미. TV 영상 화질 개선, MRI, CT 이미지 개선, 범죄 예방을 위한 CCTV 화질 개선 등 다양한 분야에서 활용됨. Image Super-Resolution 문제의 어려움 - Image Super-Resolution은 유일한 정답이 존재하지 않는 ill-posed problem 존재. - 저해상도 이미지를 고해상도로 복원할 때 정답이 단 1개만 존재하지 않음 딥러닝 모델을 적용한 Image Super-Resolution C.. 2023. 5. 1.

COCO, Pascal VOC data format (Object detection) COCO Dataset : JSON Pascal VOC : XML COCO Dataset format 각 섹션에 대해 살펴보자. info : 데이터 세트에 대한 정보를 제공 licenses : 데이터 세트에 사용된 다양한 이미지 라이선스 목록을 제공 categories : 각 카테고리 ID는 고유해야한다. 범주는 상위 범주에 속할 수 있다. 예를 들어, 꽃과 과일을 식별하는 데이터 세트가 있는 경우 꽃은 슈퍼 카테고리가 될 것이고 장미, 백합, 튤립은 detect 하고자 하는 꽃의 이름이 될 것 이다. Images : 데이터 세트의 모든 이미지 목록을 포함한다. 이미지 ID는 고유해야 한다. flickr_url, coco_url, data_captured는 선택사항이다. annotations : 데이터 .. 2023. 4. 21.

[컴퓨터비전] 컴퓨터 비전의 모든 것 (3. Seg & Det - 2) 네이버 부스트코스의 '컴퓨터 비전의 모든 것' 정리 내용입니다. Object Detection Computer Vision 분야에는 가장 간단한 Image Classification부터 Semantic Segmentation, 그리고 더 발전된 task인 Instance Segmentation, Panoptic Segmentation등의 task들이 있다. 이때 각 개체들을 구분하기 위해서는 본 강의에서 소개할 Object Detection 기술이 필요하다. 따라서 Object Detection은 Semantic Segmentation을 보다 근본적인 scene understanding 기술이라고 보면 될 것 같다. What is Object Detection? Object Detection은 class.. 2023. 2. 13.

[컴퓨터비전] 컴퓨터 비전의 모든 것 (3. Seg & Det - 1) 네이버 부스트코스의 '컴퓨터 비전의 모든 것' 정리 내용입니다. Semantic Segmentation What is Semantic Segmentation? 앞서 살펴보았던 Image Classification이 이미지 단위로 분류를 수행하는 거라면, Semantic Segmentation은 픽셀 단위로 분류를 수행하는 것이라 볼 수 있다. 하나의 픽셀이 사람에 속하는지, 오토바이에 속하는지, 자동차에 속하는지 등을 분류하는 task 이때 주의할 점은 여러 명의 사람을 각각 사람1, 사람2, ... 이런 식으로 한명한명 구분하는 것이 아니라 모두 "사람"으로 분류한다는 점이다. Where can Semantic Segmentation be applied to? 그렇다면 Semantic Segmentat.. 2023. 2. 5.

[컴퓨터비전] 컴퓨터 비전의 모든 것 (2. 컴퓨터 비전과 딥러닝 - 2) 네이버 부스트코스의 '컴퓨터 비전의 모든 것' 정리 내용입니다. 2. 컴퓨터 비전과 딥러닝 영상 인식의 이해 Image Classificaiton (2) : 대표 모델 Problems with Deeper Layers Going Deeper with Convolutions AlexNet과 VGGNet이 등장하면서 연구자들은 네트워크가 깊을수록 receptive field가 커지고, 더욱 복잡한 관계에 대해 학습이 가능하다는 강력한 특징들을 가진다는 것을 확인하였다. 그렇기 때문에 네트워크를 더욱 더 깊게 쌓으려는 움직임이 이뤄졌는데, 과연 네트워크를 단순히 깊게 쌓는다고 해서 무조건 성능이 향상될까? Hard to Optimize 단순히 네트워크를 깊게 쌓게된다면 최적화하기 어렵다는 문제가 발생한다. 대.. 2023. 2. 5.

[컴퓨터비전] 컴퓨터 비전의 모든 것 (2. 컴퓨터 비전과 딥러닝 - 1) 네이버 부스트코스의 '컴퓨터 비전의 모든 것' 정리 내용입니다. 2. 컴퓨터 비전과 딥러닝 데이터 부족 문제 완화 Data Augmentation Neural network는 데이터에 포함된 정보를 압축하여 weight로 주입하는 모델 즉 모델이 데이터를 기반으로 학습되기 때문에 데이터의 퀄리티에 따라 성능이 좌우 허나 현실의 데이터는 모두 bias가 존재. 가령 인터넷 상에 존재하는 수많은 이미지 데이터를 활용한다고 했을 때, 사람이 촬영한 이미지는 대부분 사람이 보기 좋은 구도로 촬영되었기 때문에 bias가 데이터에 존재한다고 볼 수 있을 것 또한 이 세상의 모든 데이터를 확보하는 것은 불가능하기 때문에, 실제로 사용하게 되는 데이터는 real data distribution에서 샘플링된 일부라고 볼.. 2023. 2. 5.

[컴퓨터비전] 컴퓨터 비전의 모든 것 (1. 컴퓨터 비전의 시작) 네이버 부스트코스의 '컴퓨터 비전의 모든 것' 정리 내용입니다. 1. 컴퓨터 비전의 시작 머신러닝 : Input → Feature extraction → Classification → Output 딥러닝 : Input → Feature extraction + Classification → Output 머신러닝은 사람이 Feature을 추출해내지만 딥러닝은 자동으로 이루어진다. End-to-end로 학습! 사람이 일일이 특징을 분석하는 것과 Gradient descent가 대응하는 관계. 데이터에서 중요한 정보를 추출하는 작업에서 후자가 전자보다 훨씬 낫다. Image Classification (1) : 개념 Image Classification은 주어진 입력 이미지를 특정 클래스로 분류하는 task. .. 2023. 2. 4.

컴퓨터비전 용어 정리 IoU (Intersection over Union) 2개 영역 사이의 중첩되는 정도를 측정. 이는 Object detector가 실제 Ground truth와 예측결과(Predicton)가 얼마나 정확히 겹치는 지를 계산하여 예측이 얼마나 잘 되는지를 측정. Ground-truth를 데이터의 label값으로 생각하면 이해가 쉬움 AP (Average Precision) CNN의 모델 성능 평가 지표 Precision = TP/(TP+FP) 정확도. 검출 결과 중 옳게 검출한 비율 Recall = TP/(TP+FN) 재현율. 실제 옳게 검출 된 결과물 중에서 옳다고 예측한 것의 비율 TP : 예측한 것 중 정답인 것 TP + FP : 예측한 것 TP + FN : 실제 정답인 것 일반적으로 Precisio.. 2023. 1. 17.

DeepFaceLab 사용 방법 (Window) 이번에 대한상공회의소 주관 WE-MEET Project에 참여하게 되었다. 맡은 주제는 '인공지능기반 쌍방향 자율대화가 가능한 디지털 휴먼 개발' 이며 소속된 팀은 딥페이크 팀이다. 딥페이크 생성을 위해 DeepFaceLab이란 오픈소스를 사용하게 되었는데 이 오픈소스의 사용법을 기록한다. 프로그램 다운로드 https://github.com/iperov/DeepFaceLab GitHub - iperov/DeepFaceLab: DeepFaceLab is the leading software for creating deepfakes. DeepFaceLab is the leading software for creating deepfakes. - GitHub - iperov/DeepFaceLab: DeepFac.. 2023. 1. 16.

이전 1 다음

티스토리툴바