데이터셋으로 roboflow에서 라벨링을 했다면 colab에 roboflow의 데이터 셋을 넘겨줄 차례이다.
내가 원한 데이터셋을 클릭하고
왼쪽 하단에 Generate를 클릭한다
Preprocessing에서 Modify Classes를 하면 라벨 이름을 바꿀 수 있다.
코랩에서 한글 이름은 깨져서 영어 이름으로 바꿔줬다.
나는 다 continue하고 generate를 해줬다.
generate를 하고 난 후
나는 YOLOv5를 사용할 것이기 때문에 YOLOv5 버전을 선택해주고 Get Snippet을 한다.
원하는 코드를 복사해준다.
Jupyter와 Terminal 모두 가능했다(Raw URL은 사용해보지 않아서 모르겠음)
코랩으로 돌아와서
colab은 리눅스 기반이기 때문에 리눅스 명령어를 사용한다.
mkdir [생성할 디렉토리]
mv [원본 파일] [이동 위치]
%은 shell 매직 명령어로 코랩에서 제공하는 특별한 명령어,
!는 shell 명령어로 명령 프롬포트(CMD) 실행을 위해 사용
참고: https://digital-play.tistory.com/25
1. roboflow를 깔아준다.
2. 복사한 코드를 붙여넣기 한다.
3. dataset이라는 디렉토리 생성-> test, train, valid, data.yaml을 dataset에 옮겨준다.
/content/dataset 안에 깔끔하게 정렬된다
참고: https://whyou-story.tistory.com/m/35
test, train, valid 파일에는 무엇이 있을까?
images와 labels 폴더가 있는데
images에는 이미지 사진들이
labels에는 x좌표, y좌표, width(가로), height(세로)가 있다.
정규화를 하기 때문에 0~1사이의 값으로 나타난다.
x=x 중심 좌표 / 이미지 가로 길이
y=y 중심 좌표 / 이미지 세로 길이
w=바운딩 박 가로 길이 / 이미지 가로 길이
h=바운딩 박스 세로 길이 / 이미지 세로 길이
나의 라벨로 살펴보자면
x는 왼쪽에서 49%에 위치, y는 위쪽에서 50%에 위치 w는 이미지 가로 길이의 49% 차지, h는 이미지 세로 길이의 91% 차지를 한다는 것이다.