카이스트에서의 도전적인(?) 한 학기가 드디어 끝났다.
정말 많은 일들을 한꺼번에 진행하느라 힘들었지만, 그만큼 의미있었던 한 학기였다.
나의 무기를 가지고 싶어 시작했던 일들이었던 만큼, 재미있고 가슴뛰는 무언가를 찾아서 움직였던 과거와는 달리 모든 일에 조금 진지하게 임하였던 것 같다.
나는 데이터 가반의 의사 결정 방법이 스타트업의 서비스 설계에 있어 대단히 중요하다고 생각한다.
단순히 데이터를 쌓아놓고, 그 후에 어떻게 이 데이터를 읽어낼 것인가를 이야기 하는 것이 아니라, 첫 단계부터 어떤 유저들에게 어떤 데이터를 수집할 것인지, 그것을 어떻게 처리하여 다시 우리의 유저에게 어떤 영향을 미칠 것인지 그 시스템 자체를 설계하기를 원했다.
지금까지 해왔던 것 처럼, 경영 분야의 지식을 익히고 또 다른 창업 팀에서 활동하는 선택지도 분명 있었다.
하지만, 스스로 해보고 싶어졌다. 창업을 경험하면서 조금만 진전이 없으면 따라오던 답없는 질문.. 내가 정말 잘하는 것이 무엇인가? 나는 정말 대체가능한 인원이 아닌건가? 우리 회사의 성장에 꼭 필요한 인재일까? 하는 의문들…
나 스스로에게 무기를 쥐어주고 싶었다. 창업이 원래 답없고 실패 확률이 매우 높은 일 아닌가. 뭐라도 믿는 구석이 있어야 뚝심있게 밀고 나갈 수 있는 것 같다. 스스로에게 자신감이 떨어지면 이도저도 어렵지 않을까.
그래서 다시 코딩을 시작했다. 학부때 기본 과정은 들었고, 수학에 자신이 있었기 때문에 어떻게든 할 수 있지 않을까 생각했다.
기회가 되어 기초과학연구원의 데이터 사이언스 연구실에서 일할 수 있게 되었고, 데이터를 직접 수집하기 시작했다.
동시에 카이스트 전산학부 및 산업공학과의 빅데이터, 알고리즘, 머신러닝 및 딥러닝 관련 전공 수업들을 전부 수강했다.
솔직히 엄청 힘들었다.. 사실 전공 수업만 따라가기도 벅찬데 연구실에서 맡은 프로젝트도 있었고, 창업석사의 메인 트랙인 창업 수업이 기본적으로 조별과제라서 그냥 개인 시간이 거의 없었던 것 같다.
그래도 끝내고 나니 확실히 기본적인 개념들은 전부 익힌 것 같고, 최신 논문을 읽어도 무슨 말인지 따라갈 수 있게 되었다!
그리고.. 힘든 것과는 별개로, 더 해보고 싶어졌다. 내가 수집한 데이터에 새로운 모델을 적용해 보고 싶고, 전처리를 더 잘하고 싶고, 수집도 더 우아하게 (?) 해보고 싶고 막 하고 싶은 것들이 쑥쑥 늘어났다. 욕심이 생긴다고 해야할까?
이번 방학은 연구실에 오롯히 매진할 생각이다. 현재 맡은 프로젝트는 네이버 뉴스 데이터를 기반으로 한 의견성 기사 분류 및 분석, 특정 키워드를 포함한 트위터 데이터 수집 및 분석 등이다.
프로젝트의 주제들을 보면 한국어 NLP인데, 이번에 구글브레인에서 발표한 XLNet을 적용해보고 싶고.. 이때까지는 형태소 분석기를 Mecab을 사용했는데 딥러닝 기반의 Khaiii를 사용해서 여러 모델들을 적용해 볼 생각이다.
이와 별개로 연구실에서 Twitch 채팅 로그를 기반으로 Hatespeech 분석, 비언어적 특성 (이모티콘 등) 분석 등을 진행하고 계신 분들이 있는데, 여력이 된다면 조인하고 싶다.
2019년 한국정보과학회 참여 사진