KAIST Startup팅 X 오름테라퓨틱 후기


KAIST Startup팅 6번째 시간은 대전의 바이오테크 스타트업 오름테라퓨틱과 함께 했습니다.

오름테라퓨틱은 세포침투항체 플랫폼 기술을 기반으로 혁신신약을 개발하는 바이오텍 스타트업입니다. 대전 본사와 보스턴 연구소에 다양한 경험을 가진 직원들이 모여 기존 치료제의 혜택을 받지 못하는 난치병 환자를 위한 치료제 개발을 위해 힘쓰고 있는 기업입니다.

바이오텍 스타트업에 취업하면 하루종일 뭐하나요? 라는 주제를 가지고 전개되었고, KAIST본원이 아닌 문지동 플랜아이 코워킹 스페이스라는 오픈된 공간에서 개최하였습니다. 이번 Startup팅은 KAIST 생명과학과,바이오뇌공학과,생명화학공학과,의과학대학원 4개의 학부생과 대학원생들이 참여하였습니다.

바이오 스타트업과 대기업, 연구소와의 차이점을 알고자 하며 창업에 대해 관심있는 학생들이 모여 그 공간은 학생들의 열기로 가득했습니다.



크게 시간표는 강연과 스피드데이팅으로 이루어졌습니다. 강연의 첫번째 순서는 오름에 대해 소개하고 현재 오름에서 연구중인 내용들이었습니다. 전공과 관련된 분야라 학생들은 눈을 빛내며 강연에 열중하였습니다. 두번째 강연은 오름에서의 과학자로의 삶과 실질적인 라이프에 대해 오름의 직원이 발표하였습니다. Life as a scientist at Orum. 오름에 입사하기 전까지의 상황을 재미있게 이야기하며 학생들에게 현실공감을 이끌었습니다. 과학자로서 대한민국에서 살아가는 것이 어떤지와 오름에서의 장점에 대해 말하며 능력만 있다면 오름에서는 성장할 수 있다고 덧붙였습니다.

두 번의 강연을 진행하며 학생들은 자유롭게 피자와 음료를 즐길 수 있었습니다. 그 후에는 오름테라퓨틱만의 스피드 데이팅이 있었습니다. 스피드 데이팅은 학생들을 세 그룹으로 나뉘어 직원 12명과 자유롭게 주제별로 이야기를 나누며 질의응답 시간을 가졌습니다. 세 그룹으로 나눈 학생들에게 직원들이 직접 찾아가 소개하며 데이트를 시작했습니다. A그룹은 오름연구자들의 이야기, B그룹은 대표님과 함께하는 창업 이야기, C그룹은 오름에서 일하는 KAIST선배가 들려주는 이야기였습니다. 학생들은 강연 때보다 더 열중하고 적극적인 참여로 스피드데이팅에 만족을 보였습니다.



스피드데이팅에 참여하여 학생들은 적극적으로 질문을 하였습니다. 스타트업에서 논문을 쓸 수 있는지, 전문연구요원으로 오름에서는 근무가 가능한데, 불이익은 없는지 등 평소 궁금한 것을 물을 수 있었습니다. 이에 현재 오름에서 전문연구요원으로 근무 중인 직원이 오름에는 직급도 없고 개방적인 문화로 능력만 있으면 누구든지 프로젝트를 이끌 수 있는 문화가 있다고 답하였습니다.

대표님과 함께한 그룹에서 한 학생은 창업과 대학교 연구실의 차이점을 묻기도 하였습니다. 이에 이승주 대표님은 연구실의 책임은 교수에게, 창업의 책임은 창업자에게 있고 창업자가 연구하기에 가장 편한 환경을 만들게 됩니다. 스탠포드에서 공부했을 때 바이오 관련 스타트업이 많아지길 기대했고 청년들의 도전정신이 필요하다고 생각한다고 말했습니다.

카이스트 선배들 그룹에서는 학생들이 전공과 관련된 일을 하는 것이 맞는지 등의 진로고민 등을 털어놓으며 카이스트 선배들은 무슨 일을 하고 있는지 물었습니다. 오름의 직원이자 카이스트 선배들은 자신의 실제 경험을 이야기해주며 어떻게 일하는 것이 내가 하고 싶은 일에 가까워지는지 물어보며 나아가라고 답변을 해주기도 하였습니다. 카이스트 선배가 들려주는 이야기라 학생들도 더 주의깊게 관심을 갖고 이야기를 듣고 자유롭게 토론을 이어나갈  수 있었습니다.



플랜아이 코워킹 스페이스에서 스피드데이팅을 마치고 오름테라퓨틱 사무실 투어로 이어졌습니다. 귀로 듣는 것에서 그치지 않고 실질적으로 일하는 현장을  보고연구원들과 대화하며 학생들은 오름테라퓨틱을 더 알아갈 수 있었습니다. 바이오벤처에 대해 많이 알게 되고, 다른 기업과 다들 바 없다는 것을 깨닫고 벤처와 스타트업에 대해 긍정적으로 생각하게 되는 시간이었습니다.

오름테라퓨틱에서는 학생들과 소개팅을 하기 위해서 다양한 각도로 준비를 해왔습니다. 학생들도 이에 만족하고 벤처, 스타트업에 대해 다시 생각하게 되는 계기가 되었다는 피드백을 주었습니다. 창업관련 실질적인 이야기뿐 아니라 실제 일하는 직원들의 목소리를 통해 오름테라퓨틱과 같은 스타트업이 어떤 곳이고 대기업, 연구소와 달리 자유로운 기업 문화에 대해서도 알게 되었다고 합니다. 단순히 박사후 과정에서 사람들이 말하는 대기업, 공기업 같은 곳을 들어가려는 것보다 스타트업에서 인턴을 경험해보는 것도 좋을 것 같고, 다양한 길을 생각할 수 있게 되었다는 답변도 들었습니다.

스타트업팅은 KAIST창업원 판교센터와 기업이 함께 주최합니다. 다음 번 Startup팅도 많은 기대와 관심 부탁드립니다.

유튜브 크리에이터 클럽 모집!

KAIST창업원의 이야기를 트렌디하게 전할 Startup KAIST 크리에이터 클럽을 모집합니다

  • 지원 자격

    유튜브 영상 제작 및 편집이 가능한 KAIST 재(휴)학생으로 이루어진 팀

  • 모집 규모

    5인 이내로 이루어진 1개 팀

  • 모집 기간

    2019. 11. 06 ~ 11. 22

  • 활동 기간

    2019. 12. 1 ~ 2020. 3. 30 (4개월)

  • 활동 내용

    KAIST창업원 유튜브 채널 관리 및 영상콘텐츠 제작/편집

    ※ 영상 촬영에 필요한 장비 제공 가능(필요 시)

  • 활동 혜택

    • 클럽 활동비 지급(50만 원/월)
    • 콘텐츠 제작비 편당 지급(30만 원/편)
    • W8 교육지원동 2층 Startup KAIST Studio 입주 혜택 (*추후 스타트업 빌리지 입주 시 가점 부여됨)
  • 지원 방법

  • 문의처

    seunghoc@kaist.ac.kr / 042-350-6495

E*5 KAIST 참가팀 모집 (2019 하반기)

E*5 KAIST

KAIST 대표 학생창업지원 프로그램 E*5 KAIST, 그 주인공이 되어보세요!

  • 모집개요

    [Track A] 아이디어 기반 창업 – 창업 아이디어의 사업화 검증 및 지원

    [Track B] 연구 기반 창업 – 사업화 실현 가능성이 높은 연구과제 검증 및 지원

    • 아래 “Track 비교표” 클릭하여 확인 가능
  • 신청자격

    [Track A] KAIST 재(휴)학생을 1인 이상 포함한 팀 또는 개인

    [Track B] KAIST 재(휴)학생 중 기존 연구과제를 보유한 팀 또는 개인

    [신청 제외 대상]

    • 프로그램 시작일(9/20) 기준 사업자등록일이 1년을 초과한 법인 대표는 참가 불가
    • E*5 KAIST에 4회 이상 참가 불가
    • E*5 KAIST 참가이력이 있는 자는 동일 사업아이디어로 참가 불가
    • E*5 KAIST에 참가하여 최우수팀 및 우수팀으로 선정된 이력이 있는 자는 참가 불가 (단, 특별상은 제외)
  • 지원사항(Track A/B 공통)

    • 창업과 관련된 교육 및 멘토링, 자금, 공간 등
    • 전담멘토 : 대한민국 최고의 스타트업 투자자 및 전문가로 구성된 멘토들의 전담멘토링 (멘토-멘티 매칭)
    • 멘토단 : 씨엔티테크, 카카오벤처스, 본엔젤스벤처파트너스, 블루포인트파트너스, 빅베이슨캐피탈
    • 지원금액 : 팀별 활동비 지원 및 각 미션별 우수팀 지원금 추가 지원
    • 최종상금 : 최종 우수팀 선정 시 최대 2,000만원
  • 신청방법(Track A/B 공통)

    [신청기간] 2019년 8월 19일(월) ~ 2019년 9월 5일(목) 23:59

    [신청방법]

    하단의 “신청서 다운로드 및 신청하기(클릭)” 탭 클릭 > 신청서 다운로드 > “신청하기” 탭 클릭 후 기본 내용 작성 및 신청서 업로드

  • 향후일정(Track A/B 공통) - 중요!!

    [서류평가] 9월 6일(금) ~ 9월 10일(화)

    [서류평가 결과 공지] 9월 11일(수)

    [Businees Model Camp] 9/20~9/21 캠프(천안)를 통해 프로그램 참가자 최종 선발(18개 팀)

2018 KAIST TECH DAY

  • 일 정

    2018년 11월 1일(목), 13:30~

    • ISK FORUM-Sillicon Valley

            14:10~14:50

    • TECH DEMO

            15:00~16:30

  • 장 소

    KAIST 학술문화관 5층 정근모홀 & 스카이 라운지

  • 문의사항

    • (전화) 031-739-7171,7173
    • (메일) KAIST 창업원 alissa@kaist.ac.krstartup_pangyo@kaist.ac.kr

6/27 Startup People at Pangyo “일본의 스타트업 기업문화” 후기

“당신의 고객은 한 번만 행복해도 되나요?” 주제로 6월 Startup People at Pangyo 행사를 에우레카의 홍석영 VP님께서 열띤 강연과 토론을 해주셨습니다.

홍석영VP님은 국내외 기업들에서 인정받으며 싸이월드, 골프존, 피코마 등의 개발을 거쳐 지금의 에우레카에서 페어즈를 개발하고 담당합니다. 미국의 매치그룹에 속해 있는 에우레카에서 페어즈와 글로벌 팀의 리더로서 해외사업,마케팅 전략 등을 맡고 있습니다.


  • 일본 스타트업의 특징은 정보공유, 성공의 재현, 직원의 성장입니다.

한국의 어느 스타트업과 마찬가지겠지만 성공의 재현은 일본에서 조금 더 쉽게 성취할 수 있는 것으로 보입니다. 일본의 기업들도 위성, 인력, 로봇, 중고 매매, 금융, AI 등 사업영역에 있어서도 다른 국가와 큰 차이가 나지 않습니다. 각각 다른 특색을 지니고 있습니다. 일본에서 잘 나가는 기업들의 공통점은 투자금 유치나 M&A, 기업 상장인데 이는 기업 확장을 위한 수단일 뿐입니다. 일본 기업에서 가장 중요한 것은 기업의 비전이 최우선으로 여겨지는데 기업의 비전은 즉 고객의 가치와 연결됩니다. 일본의 벤처기업은 아래와 같이 성장해왔습니다.

제1세대: 인프라사업 투자형 모델-소프트뱅크 그룹

제2세대: 플랫폼형 웹서비스 모델, 메가 벤처-Yahoo Japan, 사이버 에이전트, DeNA 등

제3세대: Vertical 영역에 특화된 모바일 서비스- 스타트업(에우레카, ZOZOTOWN)

최근 일본 스타트업은 장인정신과 IT서비스가 결합되어 있습니다. 이는 업데이트가 느리고 기업 가치에 힘쓰는 IT서비스를 뜻합니다. 과거 일본 제조사에 대한 반성으로부터 시작되었습니다. 과거 일본의 제품은 편리하지만 구매의 이유가 약했습니다. 이제는 그것을 넘어서서 소비자가 선택하는 시장에서 소비자의 니즈를 충족시키고자 합니다.

결국, 일본 스타트업이 지향하는 것은 고객의 문제점을 해결해주거나 니즈를 충족시키는 서비스입니다. 비전이나 미션은 스타트업의 각 단계에 따라 다르지만 기업의 비전이 고객의 가치로 이어지는 기업이 성장하는 모습을 나타냅니다.

그래서 니즈 X 구매고객수= 시장성이라 할 수 있습니다.

당신의 고객은 한 번만 행복해도 되나요?”


규모보다는 로얄고객을 잡는 것이 중요합니다. 니즈 X 재구매 고객수= 시장 성장성

앞에서 일본 스타트업의 특징 중 한 가지인 성공의 재현이 여기에서 부각될 수 있습니다. 싸게 많이 팔자가 아니라 지속적으로 비싸게 팔기 위한 고민을 하며 니즈의 절대 모수보다 고객의 문제점에 대한 지속적인 해결에 초점을 둡니다.

고 부가가치의 지속이 시장의 크기를 결정하여 일본에서는 한 방보다도 한 번 만든 서비스가 얼마나 오래갈 것이냐가 더 중요합니다. 몇 명의 사람에게 High Value, High Price로 여러 번 팔 수 있다면 시장성이 있다고 판단합니다. 에우레카도 개발한 서비스들을 고객들이 얼마나 오래 사용할 수 있을까를 늘 고민하며 나아가고 있습니다. 여기서 말하는 High Value란 단지 높은 브랜드 가치나 최고의 서비스를 의미하는 것이 아닙니다. 그 서비스가 정말로 필요한 사람한테 주어졌을 때, 고객은 서비스가 높은 가치가 있다고 판단하고 High Price를 지급할 용의가 있게 되는 것을 뜻합니다. 한 분야에서만 성공해도 가치 창출이 가능한 일본 내수 시장에서 한 방을 노리기보다는 장기적인 고객 가치 창출에 힘쓰는 모습을 모입니다.

로얄 고객을 잡고 High Value, High Price를 향해 나아나는 일본의 떠오르는 기업은 바로 에우레카입니다.

에우레카-대만, 일본의 NO.1 데이팅 서비스 앱


“누구나 인생의 동반자를 찾을 수 있도록, 데이팅 서비스를 아시아의 문화로”

To help people find their life partner and make dating services a social norm in Asia. 사람들이 그들의 삶의 동반자를 찾고 데이트 서비스를 아시아의 사회적 규범으로 만들 수 있도록 돕는 것이 에우레카의 모토입니다.

현재, 미국의 경우 해외 온라인 데이팅 시장은 3쌍 중 1쌍이 온라인을 통해 만나고 있습니다. 일본의 온라인 데이팅 시장도 처음에는 소극적이었다가 최근 들어서는 21쌍 중 1쌍이 온라인을 통해 만남을 가집니다. 미국 규모로 충분히 성장할 수 있다고 생각합니다.

에우레카의 “페어즈” 서비스는 아시아 TOP3 Market인 일본, 대만, 대한민국을 공략 중에 있습니다. 현재 대만과 일본에서는 페어즈가 데이팅 서비스 앱으로 1위를 차지하고 있고, 한국에서는 서비스를 시행한 지 얼마 되지 않았습니다. 검색, 프리미엄 서비스, 추천화면, 빅데이터 기반으로 AI가 추천하고 관심사 기능이 탑재되어 있어 관심사 기반으로 서로를 찾을 수 있습니다. 성인인증을 기본으로 안전을 담보해오고 있습니다. 다른 앱과 달리 24시간동안 불량유저 감시, 에우레카는 감시팀이 내부에 있어 24시간 감시 가능(in house)합니다. 특히 AI로 불량유저 감시하고 있습니다. 탈퇴 시에는 앙케이트 조사, 트랙킹 조사를 시행하여 탈퇴 원인을 파악하여 결과를 분석합니다. 결과를 보면, 보통 긍정적인 결과로 인해 탈퇴하는 경우가 많다고 합니다.

18500명. 이 숫자가 무엇인지 아시겠나요?

바로 2017년에 페어즈를 통해 결혼한 커플 18500 쌍(앞으로 결혼할 사람 포함)입니다.

이어지는 자유로운 토론 시간에는 페어즈에 대한 궁금증부터 일본 스타트업계에 대한 질문들이 많았습니다.

대한민국의 페어즈 유저를 늘리기 위해서는 한국사회에 뿌리 깊게 자리 잡고 있는 온라인 만남에 대한 불신을 바로잡아야 한다는 의견이 많았습니다. 또한 개인정보의 유출에 대한 두려움과 불신으로 온라인 데이팅 앱에 대한 신뢰도가 낮은 것도 극복해야 할 문제라고 이야기할 수 있었습니다. 일본과 페어즈에 대해 알 수 있는 유익한 시간이었습니다. 끝까지 열정적으로 강연해주신 홍석영 VP님께 감사합니다.

페어즈가 한국에서 데이팅 서비스 앱 NO.1이 되는 날까지. 응원하겠습니다.

[6/27] Startup People at pangyo “일본 스타트업 기업문화”

  • 일 정

    2018년 6월 27일(수), 오후 5:40~8:00

    • 일본의 스타트업 기업문화 ” 당신의 고객은 한 번만 행복해도 되나요”
  • 장 소

    KAIST 창업원 판교센터 & 대전 KAIST W8동 3층

          * 판교→대전 이원생중계 진행 예정

  • 참석자

    일본 스타트업에 관심있는 모든 분들

  • 문의사항

    • (전화) 031-739-7171,7173
    • (메일) startup_pangyo@kaist.ac.kr

KAIST Startup Alliance-Healthcare & Blockchain Startup Summit in Pangyo

본 행사는 Invitation Only 로 진행됩니다.

꼭 참석을 원하시는 학생은 참가동기와 함께 신청해주시면 확인 후 초대해드리겠습니다.

  • 일 정

    2018년 5월 9일(수), 오후 3~7시

    • Session 1 : “블록체인 비즈니스 동향“- 황성재 대표(파운데이션X)
    • Session 2 : “헬스케어 블록체인 혁명“- 고우균 대표(메디블록)
  • 장 소

    KAIST 창업원 판교센터

  • 참석자

    교수 및 학생, 스타트업 관계자

    본 행사는 Invitation Only 로 진행됩니다.

    꼭 참석을 원하시는 학생은 참가동기와 함께 신청해주시면 확인 후 초대해드리겠습니다.

  • 문의사항

    • (전화) 031-739-7171,7173
    • (메일) startup_pangyo@kaist.ac.kr

KAIST창업원 판교센터 STARTUP WEEK with Sky Labs 후기

Can you feel my heartbeat?

여러분의 심장은 어떠십니까

이번에 새롭게 시작한 KAIST창업원 판교센터 STARTUP Week의 첫 주자는 심방세동 질환을 진단할 수 있는 반지형 심방세동 탐지기 카트(CART)를 개발한 스카이랩스입니다. 스카이랩스와 함께 한 2일의 런치타임과 저녁시간에 스카이랩스에 대해 상세히 알 수 있던 시간이었습니다.


About Sky Labs(창업,과거와 현재)& CART-이병환 대표님


Atrial Fibrillation(AF)-심방세동. 심장이 규칙적으로 뛰지 않고 빠르게 뛰는 경우를 말합니다. 40대 이상 인구 4명 중 1명이 앓고 있는 만성질환입니다. 부정맥 환자가 많고 위험한 것은 잠재적인 뇌졸중 환자로 간주됩니다. 보통 일반인보다 심방세동을 가진 사람들은 뇌질환 환자로 발전될 경향이 5배는 높다고 합니다.


그러나 이러한 심방세동은 진단하기가 어렵습니다. 현재 시행되고 있는 홀터모니터 등의 방법은 정확성도 떨어지고 지속적인 관찰하기가 쉽지 않습니다. 그래서 글로벌 헬스케어 기업인 스카이랩스 심방세동의 정확한 진단과 맞춤 관리를 위한 초소형 반지형 탐지기기 ‘카트(CART, Cardio Tracker)’를 개발했습니다.

스카이랩스의 카트는 손가락에 착용하는 것만으로도 사용자의 지속적인 심방세동 탐지 및 맞춤 관리 가이드를 제공합니다. 일상생활 자가진단 데이터를 통해 심방세동 위험을 감지, 병원에서 관리를 받도록 하려고 합니다.

이를 위해 끊임없이 임상실험과 연구 등이 진행되고 있습니다. 서울대병원과 함께 공동연구를 하기도 하며 임상실험을 통해 다른 진단보다 정확성이 97%나 높음을 결과를 통해서 알 수 있습니다.

스카이랩스는 스파크랩 IOT 엑셀러레이터 1기에 선정되기도 하고 바이엘과 KOTRA가 진행하는 ‘그랜츠포앱스 코리아(Grants4Apps Korea)’ 프로그램 참여 스타트업으로 최종 선정되었습니다. 바이엘과 파트너십을 이루며 지금도 진행중입니다. 2017년 있었던 슬러쉬에서도 데모데이를 진행하며 스카이랩스는 글로벌 기업으로 성장 중에 있습니다.


Healthcare Business & Sky Labs in Europe-홍진겸PD


스카이랩스에 대한 소개와 함께 유럽 헬스케어 동향에 대해서도 전해주셨습니다. 전세계는 크게 4가지의 만성질환과 싸우고 있습니다. WTO가 발표한 만성질환 4가지는 크게 심혈관 질환, 호흡기 질환, 당뇨병, 암으로 구분하였습니다. 이에 유럽은 RPM(Remote Patient Monitoring)원격의료가 해결방안이라고 여기고 있고 시행 중에 있는 곳들도 있습니다. 대표적인 예가 영국의 NHS의 Telecare, 독일의 Vitaphone 등이 있습니다. 그러나 RPM에는 한계가 있습니다. 연속적이지 못하고 정확하지 않다는 단점들이 있습니다.

요즘에는 모바일 헬스케어를 비롯헤 웨어러블 기기들도 등장하고 있습니다. 제니코어, 템프트랙, 카디아밴드, 코알라 라이프 등이 있습니다. 다양한 글로벌 제약회사들도 웨어러블 헬스케어 기기에 관심이 많으며 적극적으로 뛰어들고 있으며 새로운 신약을 개발하고 있습니다.

이에 스카이랩스는 유럽을 타겟시장으로 잡고 글로벌 헬스케어 기업으로의 도약을 하고 있습니다. 크게 헬스케어 사업은 B2C/B2B/B2G로 나뉩니다. B2C는 병원과 사업을 전개하고, B2B는 바이엘같은 제약회사와 전개합니다. B2G는 각국의 정부와 협약을 맺고 만성질환자들을 위한 시스템들을 구축하고자 합니다. 핀란드와 스웨덴 같은 북유럽 쪽이 유망한 것으로 여겨집니다. 이들 국가는 개방적인 마인드로 의료기기에 대한 지출이 높은 편입니다. 영국은 NHS로 시장접근이 가능한 상황으로 혁신적인 파트너십을 구축하고 있습니다.


Atrial Fibrillation Detection Technology & Clinical Trials in Sky Labs-조성미 PD


현재 심장관련 질환들은 ECG(Electrocardiogram) Sensor를 사용합니다. 이것은 간편하긴 하지만 정확하지 않고 소형화할 수 없는 단점이 있습니다. 스카이랩스의 CART는 PPG(Photoplelethysmography) Sensor를 사용하여 LED(Lighy Emitting Diode)와 PD(Photodiode)를 사용합니다. 이 기술들은 스마트폰이나 스마트워치에 쓰이는 기술들입니다. 스카이랩스의 CART는 이 기술들을 이용하여 PPG를 받아 심방세동 및 심방조동을 탐지하는데 잡음 제거가 제일 중요합니다. 잡음제거를 하는 데 있어서 머신러닝을 기반으로 필터링을 해서 바이탈 신호를 체크하게 됩니다. 그랬을 때 기존의 스마트 밴드 같은 의료기기보다 정확성이 높음을 도출할 수 있었습니다.

스카이랩스는 임상실험을 AF환자들을 대상으로 실시하고 임상데이터를 가지고 심방세동탐지 알고리즘을 만들고 있습니다. 이를 바탕으로 심장질환으로 고통받는 환자들을 도와주고 후에 발전될 수 있는 뇌질환 등을 막기 위해 달려가고 있습니다.


중간 중간 많은 질문들도 이어졌습니다. 스카이랩스 디바이스만의 특징을 비롯하여 스카이랩스의 향후 방향성 등을 묻기도 하고 CART에 대한 질문도 쏟아졌습니다. CART가 대표님의 바람대로 심장이상 환자들에게 희망이 되어 더 큰 병을 예방하는 글로벌 헬스케어 기업으로 우뚝 설 수 있기를 바랍니다.

KAIST-엘리스 데이터 사이언티스트 에듀 챌린지 후기


KAIST와 엘리스가 야심차게 준비한 프로젝트

데이터 사이언티스트 에듀 챌린지가 지난 주 워크숍을 끝으로 무사히 마칠 수 있었습니다.

2017년 12월부터 시작해서 약 1개월정도 온라인상으로 지속되었던 이번 챌린지에는 데이터 구조를 처음 배운 대학생부터 현업에서 종사하고 있는 데이터 사이언티스트 전문가까지 참여해서 챌린지의 의미가 있었습니다. 한국의 캐글과 같이 경쟁만이 아닌 누구나 함께 공부하는 데이터사이언스 축제가 되었으면 하는 소망으로 시작되었습니다.


1라운드 12월 4일 주를 시작으로 12월 26일 주까지 4라운드에 걸쳐 챌린지가 진행되었고 1월 13일 워크숍에서는 시상식과 함께 네트워킹 시간이 있었습니다. 상금이 걸려있는 대회였기 때문에 보다 많은 사람들이 참가해 경쟁하였습니다. 대회 전체의 1~4라운드별 합산 대상 1명, 최우수상 2명, 우수상 4명을 정하였습니다. 그리고 챌린지에 열심히 참여한 분에게는 노력상이 돌아갔습니다.

이번 대회는 기초적인 알고리즘만을 사용해서도 문제를 풀 수 있고, 복잡한 모델을 사용하면 높은 점수를 받을 수 있도록 설계했습니다. 가상 데이터가 아닌 Real World에서 만들어진 데이터를 바탕으로 진행했습니다. 평소에도 흥미 있을 만한 주제를 선정하여 파트별로 전개하였습니다. 아래는 라운드별 출제의도와 풀이 방법을 소개합니다. 라운드별 출제의도는 문제를 낸 엘리스에서 발표를 하였고 라운드별 우수자들이 문제해결방법에 대해 발표하였습니다.


데이터 사이언티스트 문제풀이 전에는 현업 데이터사이언티스트 전문가의 PT가 있었습니다. 원래는 데이터 사이언티스트가 아니었지만 엘리스의 교육을 받고 이직을 해서 현재는 쎄트렉아이 현 서버 개발자 및 데이터 사이언티스트입니다.발표자가 전에 엘리스에서 받은 교육은 16주 과정으로 국회의원처럼 말하는 챗봇을 만드는 프로젝트였습니다.

2012.07.02.~2016.05.19.일까지의 국회 회의록을 dataset을 했습니다. Proposed Models로는 토픽별로 분류한 모델, 진보/보수 정당모델, 전체 문장 + 추가 정보를 활용한 모델을 개설하였습니다. 그 결과, LSM을 이용하여 간단히 구현할 수 있었고 Web으로 UI제공하였습니다. 카카오 플러스 친구로 제공하기도 하였습니다. 이 교육과정을 통해서 데이터 조작능력을 함양할 수 있었으며 어디에 있는 데이터를 어떻게 가져올 수 있는지-크롤링 에 대해 배울 수 있었습니다. 동시에 어떤모델을 쓰면 좋을 지에 대한 문제 해결도 기를 수 있었습니다. 또한 시스템 구성 및 구현 능력을 갖출 수 있었습니다. 엘리스 교육 후 발표자는 리쿠르팅 데이를 통해 각종 기업들과 컨택한 후 데이터 사이언티스트로서 지금의 자리에 있게 된 것이라고 했습니다.

이번 에듀 챌린지도 참가자들에게 하나의 도전이 되어 데이터 사이언티스트로 거듭날 수 있는 시간이 되었으면 좋겠습니다.


P1. 네이버 영화평 감정분석

네이버 영화 서비스에서 가져온 140자 한줄 평 안에 들어있는 감정을 맞추는 것이었습니다. 한줄 평에 있는 별점을 성능측정(accuracy)을 합니다. 문제의 의도는 다음과 같았습니다.

“Classic NLP”

Seed word expansion, Naive Bayes. WordNet, BOW+SVM. pLSI/Topic Modeling, x-level Word Embdding.

발표자의 문제풀이는 아래와 같습니다.

먼저, 네이버 영화평 감정분석한 것을 설명하며 baseline model에서 Scikit-learn을 사용하며 Naive Bayes, Random Forest,SVM을 하였으며 약 60점이었습니다. 그 다음에는 Baseline deep learning model에서 PyTorch를 사용하였으며 RNN-Bidirectional GRU를 약 70점이었습니다. Tuning에서는 CRNN-RNN 모델의 앞단에 Conv layer를 붙여 비슷한 성능을 나타내었습니다. Attention에서는 약 71점으로 BiLSTM에서는 GRU가 더 좋았음을 발견할 수 있었습니다. 더 많은 데이터에서는 네이버 영화평을 직접 크롤링하여 약 300만건 데이터 사용으로 BiGRU 86점과 BiGRU + Attention 88점을 하였습니다.


P2. 리그 오브 레전드 프로게이머 대전 승패 예측

팀별 정보와 선수별 정보를 가지고 38,679 EU Master 대전 데이터(2016)을 가지고 시작했습니다. 아무래도 인기 있는 게임이다 보니 이번 챌린지에서 가장 참가자가 많은 항목이었습니다. 성능측정은 어떤 팀이 승리할지 Accuracy로 하였습니다. 문제의도는 다음과 같습니다.

“Feature Engineering”

Normalization, Linear/Logistic Regression, Decision tree/Regression tree SVC/SVR, Factor Analysis, Probabilistic Model, DNN.

이에 우수자의 문제풀이방식은 처음에 챔피언 정보만을 사용하여 RF,XGB,DNN 약 85점이었습니다. 두 번째는 소환사 정보만을 사용하여 Data augmention 약 85점이었습니다. 그 다음 소환사 정보와 챔피언 정보를 통합하여 85점이 나왔습니다. 두 정보를 같이 하면 성능 개선이 일어날 수 있을 거라 기대했지만 성능 개선은 없었습니다.


P3. 뉴스 기사 텍스트로 언론사 추론

요즘 가짜뉴스가 많고 뉴스별로 논조가 조금씩 차이가 있습니다. 기사의 논조를 보고 어떤 언론사인지 맞추는 것이 아니라 특정 데이터를 분석하여 언론사를 맞추는 항목이었습니다. 가장 확률이 높은 언론사부터 낮은 언론사까지 분석하였습니다. 성능측정은 MRR(Mean Reciprocal Rank)로 하였습니다.

Text classification

Feature Engineering(text), Word Count Bag of Words, SVC, Topic Models Ideal Point Model(in Politics), x-level Word Embedding.

3라운드 우수자의 문제풀이방식은 다음과 같습니다. 뉴스 기사 텍스트로 언론사를 추론하기 위해 논조,스타일,단어나 포맷을 분석하였고 인터뷰 형식과 기사 업로드 시 사용하는 텍스트 레이아웃이 다름에서 접근하였습니다. 문제해결책으로 먼저 음절단위의 학습을 시작으로 음절의 위치, 순서를 반영한 학습. 마지막으로는 특수기호를 보존해서 학습에 이용하였습니다. 음절기반을 CNN or RNN 이용하였습니다. 데이터 셋에 있는 가각의 음절들을 정수로 매핑해 음절 사전을 제작하였습니다. 학습 데이터의 문장 길이는 900으로 설정하고 짧은 경우 padding으로 채워주었습니다. 그 이후 모델을 설계하여 예측하는 결과를 도출했습니다. 최종 결과 94점이 나왔고 음절 임베딩과 Dripout과 CNN을 결합한 구조가 유효했던 것 같다고 말했습니다. 문장의 길이를 500을 했을 때보다 성능이 높아짐을 확인할 수 있었습니다.


P4. 그래프로 미래의 주식 가격 예측하기

주식그래프가 참가자들에게 주어지고 참가자들은 기업의 이름도, 가치도, 좋업원 수도, 사업분야를 모릅니다. 단지 그래프만 보고 내일 주식가격을 예측하는 항목이었습니다. 2010.01.30.~2016.12.30.일까지의 주식그래프를 분석하여 2016.12.31.일의 종가를 예측하는 것이었습니다. 성능측정은 종가의 방향(오른다/내린다): 50점, 실제 주식 종가(MSE): 50점이었습니다.

Just print the last price, Moving average, Momentum, Black-Scholes ,Thousand of Heuristics and Theories, Bayesian Probabilistic Models , RNN.

마지막으로 주식가격 예측하기 문제풀이에서는 training data형식을 사용하였고 성능 측정을 하였습니다. 성능은 MSE(Mean squared error)로 측정됩니다. Data Processing에서는 volume 값 transformation, close_diff  변수 추가:종가/ 최대, 최저 변동폭을 설정하였습니다.

X:high,low,open,close,volume,close_diff(6 vars)

Y(target): X에 대해 다음 날의 close

data, symbol은 구분하지 않는다. train:data<=’2016-12-29’

test:date==’2016-12-29’

시도했던 알고리즘은 Random/ForestRegressor/Extra Tree Regressor/Gradient Boosting Regressor 최종선택에서는 2 hidden layers, 1 final output 이 나왔습니다. 최종결과는 82점이 나왔습니다. 이번 과제를 통해 어떻게 더 공부해야 하고 시계열 분석 알고리즘을 적용해봐야겠다고 느꼈다고 합니다.

이번 에듀 챌린지는 KAIST와 엘리스가 함께 처음으로 준비한 프로젝트였습니다. 한국의 캐글과 같은 경연을 만들려고 하였지만 서버의 문제 등 개선해야 할 점도 발견하였던 대회였습니다. 그럼에도 대학생부터 현업 데이터 사이언티스트까지, 다양한 연령대 직업군을 망라한 참가로 이번 대회의 의미를 살릴 수 있었습니다. 참가자들의 후기처럼 이러한 형태의 챌린지를 더 발전시키고 더 연구하고 심화해서 다음을 준비하겠습니다.

상을 받으신 분들 축하드리고 상의 유무를 떠나 열정적으로 챌린지에 참가한 모든 참가자분들께 감사드립니다. 다음 번 챌린지를 기대해주세요.

KAIST X 엘리스 데이터 사이언티스트 에듀 챌린지 참가자 모집(~11/30)

  • 일정

    2017124~ 2018114

    (워크숍: 2018113, 오후 1~6)

  • 장소

    • 워크숍:  KAIST 창업원 판교센터

    ※ 워크숍에서는 이전 챌린지를 합산하여 최종 우승자를 선발하고 수상

         문제별 강의(교육), 관련 기업과 네트워킹 진행

  • 참가자

    • 기본 프로그래밍 언어를 숙지한 학생/예비창업자/개발자
    • 기초 인공지능과 데이터 사이언스 과정 수강 희망자, 현업 데이터 사이언티스트
  • 문의사항

    (전화) 031-739-7171,7173

    (메일)  startup_pangyo@kaist.ac.kr

포트폴리오 항목