목록Project (5)
러닝머신 하는 K-공대생
Ⅰ. 글을 시작하며 전에 최적화 분야를 공부하기 위해 ‘영상 이해를 위한 최적화 기법’강의를 듣던 중 영상 분할과 관련된 내용이 있었다. 영상 분할은 이미지를 여러 개의 픽셀 집합으로 나누는 것으로 컴퓨터 비전에서 중요한 주제다. 에너지 함수를 가지고 variational한 방법으로 최적화를 진행하거나 조합적 방법으로 그래프 컷에 기반하여 물체/배경 으로의 영상 분할을 진행하는 아이디어를 얻을 수 있었고 특히 그래프 컷을 활용해 영상 분할을 하는 아이디어가 흥미로웠다. 이에 영상 분할에 대한 최적화 방법들을 정리하고 관련 알고리즘을 학습하며 아이디어를 구체화시켜 밑바닥부터 직접 구현해 실제로 이미지를 주었을 때 영상 분할을 진행할 수 있는 프로젝트를 진행했었다. 나중에 정리해야지 미루고 있었는데 입시가 ..
0. 글을 시작하며 여름방학이 시작되었고 자소서 시즌이 되면서 나의 고등학교 인생을 되돌아볼 때가 되었다. 이번 글에서는 고등학교 올라와서 중간중간 블로그나 유튜브, 깃헙 등에 기록을 자주 했었는데 너무 정리가 안 되어있어 기억나는 거 위주로 기록한 내용들을 정리해보고자 한다. 1. 캔위성 경연대회 교내 정보동아리 SADA에 들어가고 동아리 선배와 진행한 첫 프로젝트였다. 영상 분할을 딥러닝으로 구현하는 것과 영상처리 쪽 프로그래밍을 담당했었다. FCN, U-Net 등 영상 분할을 위한 딥러닝 모델을 공부해보고 이론에서 벗어나 딥러닝을 활용해본 제대로 된 프로젝트였고 하드웨어 작업하는 것을 도우면서 UART 통신과 라즈베리파이도 익숙해졌었다. GitHub - taegukang35/2020cansat: 2..
0. Intro 이전에 Tensorflow Korea에서 시각장애인의 보행을 돕는 프로젝트를 진행하신 윤기님의 연구를 봤고 매우 인상깊었는데 이에 아이디어를 얻어서 공간정보를 음성말고 효과적으로 전달할 수 있는 방법이 없을까 프로젝트를 진행하고있는데 곧 있을 중간 고사 이전에 중간 결과를 공유하고자 올립니다. 어떻게 하면 공간을 쉽게 알려줄 수 있을까 고민하다 bird eye view로 위에서 내려다보는 것처럼 스마트폰 화면위에 촉각지도를 만들어서 직접 톺아보면서 이동가능한 영역을 파악할 수 있게 하자는 것이 TOBDA 앱의 아이디어입니다. 기숙사 학교에 살고 있기에 대상은 교내로 한정했습니다. 복도 사진을 찍어서 라벨링하고 U-net 아키텍쳐 기반으로 세그멘테이션 모델을 학습시키고, Depth Esti..
1. 프로젝트 소개 및 진행 의도 프로젝트 내용: 톺다(TOBDA)는 지팡이로는 부족한 공간적 정보를 시각장애인들에게 제공함에 목표를 둔다. 촉각 지도로 나타내어 손으로 길을 톺아보면서 공간을 이해하는 Bird-Eye View 모드, 계단의 개수를 알려주는 Stair Counting 모드와 현재 공간을 설명하는 Image Captioning 모드로 다양한 상황에서 종합적으로 공간을 이해한다. 해결하고 싶은 문제: 인간에게 있어서 시각은 어떤 감각기관보다도 발달해 있어 정상적인 상태에서 사물을 인지하는 작용 중 가장 큰 역할을 하고 있다. 시각장애인의 경우 수차례 반복에 의한 경험에 익숙해진 경우에는 독립 보행을 할 수 있으나, 처음 접하는 환경에서는 환경인지, 거리 측정 등 여러 가지 문제로 인해 독립적..