[Startup人터뷰] 디지털 트윈기반 가상 데이터 생성 서비스 ‘AUTODATA‘를 개발하는 ’GSD’의 김재운 대표

이번에 만나볼 팀은 2021년 상반기 E*5KAIST 최우수팀으로 선정된 GSD입니다. GSD는 AI학습을 위한 디지털 트윈기반 가상 데이터 생성 서비스를 하는 팀입니다.

지금부터 GSD의 김재운 대표님을 만나보겠습니다.

GSD에 대한 간단한 소개(대표님 및 팀원 소개 포함) 부탁드립니다.

안녕하세요, 저는 GSD 대표 김재운입니다. GSD는 KAIST 석박사 출신 기술창업팀으로, 인공지능 개발 파이프라인에서 가장 큰 문제인 데이터 수집 및 가공 작업을 혁신적으로 해결하는 가상 데이터 생성 솔루션 AUTODATA를 개발하고 있습니다.

가상 데이터 생성 솔루션이라는 것이 생소할 수 있는데요. AUTODATA에 대해서는 아래에서 더 자세한 설명이 나옵니다.

GSD라는 명칭의 뜻은 무엇인가요?

저희 GSD의 뜻을 물어보는 분들이 정말 많으세요. 누구는 ‘Great Super Data’라 하기도 하고, 다른 분들께서는 ‘군싹돌(‘군침 싹 도네’의 준말)’이라고 알고 계시기도 한데요. GSD는 “갑시다!”라는 뜻입니다 🙂 장난스럽게 지었지만 나름 깊은 뜻이 있습니다. 처음 GSD가 설립될 당시, 당시 팀원들끼리 처음으로 모였던 장소가 어은동 카페 ‘가배’, 그리고 그 옆 일본 가정식 음식점인 ‘요시다’였습니다. 처음 시작할 때의 결의를 잊지 말자, 그리고 끝까지 계속 나아가자는 의미에서 가배와 요시다를 합쳐 ‘갑시다’로 명명했습니다.

도원결의처럼 도전을 결의한 곳에서의 명칭을 따 팀명을 정했다는 것이 특별한 것 같습니다.

GSD가 해당 아이템을 창업 아이템으로 정하게 된 이유에 대해 말씀해주세요.

사실 지금 아이템을 선정하기까지 고난의 여정이 많았습니다. 작년인 2020년 8월에 처음 팀이 결성되어 E5를 우승하기까지, 아이템이 4번이나 바뀌었습니다. 특정한 문제를 해결하기 위해 모였다기 보다 다들 창업이 하고 싶어 모인 케이스라 중간에 많이 헤맸습니다.

다양한 아이템을 구상하고 찾아보던 중, 김명철 크루 덕분에 지금의 아이템과 직결되는 문제를 발견했습니다. 연구실에서 AI 관련 과제를 진행하던 중, 인공지능 학습에 필요한 데이터셋을 구축하기 위해 견적을 내보니 비용이 상상을 초월했습니다. 이유는 바로 사람이 손수 작업하는 노동집약적인 일이었기 때문이에요. 말이 안 된다고 생각했습니다. 사람을 편리하기 위해 존재하는 것이 인공지능인데, 정작 그 인공지능이 잘 작동하기 위해서는 수많은 사람들이 고된 노동을 해야 한다는 사실이요. 그러다 보니 데이터 가공에 많은 시간이 들 뿐만 아니라 데이터의 일관성, 다양성 측면에서 문제가 있었어요. 그 중에서도 사람이 가공하기 힘든 유형의 데이터, 예를 들면 3D 이미지나 Point Cloud 데이터는 더더욱 사람이 한다는 게 말이 안 될 정도의 난이도, 시간, 비용이 소모된다는 것을 알 수 있었습니다. 데이터 획득과 가공의 높은 난이도가 인공지능의 발전을 가로막는다는 것을 알고서, 이 문제를 혁신적으로 해결하기 위해 찾은 것이 지금의 아이템 AUTODATA입니다.

디지털 트윈 기반 가상 데이터 생성 서비스에 대해 자세한 설명을 부탁드립니다.

AUTODATA는 인공지능 컴퓨터 비전 학습을 위한 디지털 트윈 기반 가상 데이터 생성 서비스입니다. 데이터는 인공지능 개발에서 핵심적인 요소입니다. AI 개발 파이프라인에서 데이터를 수집하고 가공하는 작업의 비중은 80%를 차지할 만큼 중요한 작업인데요. 하지만 이런 데이터 가공 작업, 특히나 이미지 데이터의 경우 현재로서는 사람이 일일이 단순 반복적인 노동으로 가공하고 있습니다. 그로 인해 발생하는 시간 비용과 낮은 정확도가 가장 큰 문제입니다. 이를 현실과 동일한 모습의 가상 환경을 구축한 뒤, 시뮬레이션 상에서 데이터를 생성 및 증강하여 해결하는 솔루션이 바로 AUTODATA입니다. 구체적으로는 현실과 동일한 환경의 3D 시뮬레이션 상에서 가상의 이미지 데이터를 생성한 뒤, 조도 혹은 그림자, 물체의 질감 등 다양한 조건을 세팅해 인공지능 학습에 필요한 학습 데이터를 추출합니다. 이 과정에서 만들어지는 디지털 트윈 데이터는 물체의 정보가 디지털화되어 있어 추가적으로 사람이 가공할 필요가 없습니다. 현재는 데이터 가공 난이도가 높은 영역인 인공지능 로보틱스 시장에서 필요로 하는 학습 데이터를 제공하고 있어요.

AI개발 과정에 데이터가 중요한 부분을 차지하는데 데이터 가공 작업이 사람의 노동으로 이어고 있었다는 것이 놀라웠습니다. 당연히 인공지능 기술을 이용해서 프로세스화가 되어 있을 것이라고 생각했는데 AI분야가 아직도 가야할 길이 많다는 것을 보여주는 예인 것 같습니다. 데이터 가공 과정에서 데이터를 추출하는 데 GSD가 개발한 AUTODATA를 활용한다면 사람의 노동이 추가될 필요없이 시간과 비용이 절약될 수 있겠네요.

다른 기존 AI기반 데이터 가공 스타트업과 차이점 및 특징은 무엇이 있을까요?

기존 AI 데이터 가공 솔루션은 모두 사람이 수작업으로 하는 방식입니다. 크라우드 소싱 방식을 활용해 비교적 값싸고 빠르게 진행하는 경우도 있지만, 가공 난이도가 높은 작업, 예를 들어 3D 이미지 등은 사람이 하면 오래 걸리고 정확도도 낮아요. 저희는 가상에서 데이터를 생성해 고객사의 인공지능 모델에 필요한 데이터를 기존 솔루션 대비 1/10,000배 저렴한 가격, 그리고 120배 빠른 속도로 데이터를 생성 및 증강해서 제공합니다. 디지털 상에서 이미 가공되어 있는 데이터를 생성하기 때문에 추가적인 노동 없이도 정확도 100%의 고품질 데이터를 얻을 수 있어요. 그러다 보니 고객사가 만드는 AI 개발 파이프라인을 훨씬 더 빠르고 향상된 성능으로 운영할 수 있도록 도울 수 있습니다.

데이터를 가공하는 기업들도 늘어나고 있는 것으로 알고 있는데요. 과정마다 조금씩 차이가 있는 것 같습니다. 가상에서 데이터를 생성해 고객사에 필요한 데이터를 훨씬 빠른 속도와 저렴한 가격으로 AI개발 파이프라인 프로세스가 빠르게 구축될 수 있을 것으로 보입니다. 그렇게 되면 더 많은 고객사에서 GSD의 AUTODATA를 찾을 것으로 예상됩니다.

팀원을 어떻게 모으게 되고, 창업을 결심하게 되었나요?

저희 모두 이전부터 친구로 지내던 사이였어요. 다들 기본적으로 창업에 매우 관심이 많은 상황이었죠. 그러다 작년 8월, 강홍구 크루가 제게 연락을 주며 같이 소규모 프로젝트를 해보지 않겠냐고 먼저 제안해줬어요. 처음에는 둘이서 뚝딱뚝딱 만들다 제가 김명철 크루에게 제안하며 지금의 GSD가 만들어졌답니다 🙂

창업에 관심을 갖게 된 계기는 저희 모두 세상에 이로운 영향을 주고 싶다는 꿈이 있기 때문이었어요. 제 경우, 직접 만든 결과물이 사람들에게 이전에는 당연하게 여겼던 것을 다른 관점에서 생각하고 행동하는 영감을 준다는 믿음이 있어요. 제가 만든 것으로 세상을 바꾸고 싶다는 열망이 늘 마음 한 편에 있었습니다. 이를 실현하는 가장 가까운 길이 창업이라 생각해 창업가의 길을 선택했습니다.

세상을 이롭게 하고 싶다는 열망으로 창업에 도전하는 것은 쉽지 않은 일인데 그 꿈을 현실로 실현시키신 것이네요. GSD같은 팀이 있기에 과학기술과 개발이 더 속도를 낼 수 있는 것으로 보입니다.

E*5 KAIST에 참여하게 된 동기는 무엇이고, E*5 KAIST를 통해 배운 점은 무엇이 있을까요?

E*5 KAIST는 부스터와 같은 존재였습니다. E*5에 참가하기 이전부터 창업을 준비했지만 셋 다 처음이다 보니 이 길이 맞는지, 저 길은 아닌지 고민과 걱정이 많았습니다. 빠른 실행과 피드백이 필요하던 차에 E5는 저희에게 급속한 성장을 만들어 준 고마운 프로그램입니다.

E*5를 진행하면서 가장 크게 배운 것은 고객과 시장의 문제를 집요하게 찾아내는 마음가짐, 그 과정에서 끊임없는 실행과 피드백의 반복을 통한 성장이었습니다. 아이디어를 면밀히 검증하기 위한 일련의 프로그램과 국내 최고의 벤처캐피탈 및 엑셀러레이터에 계시는 멘토님들의 상세한 조언 덕분에 지금의 저희가 있다고 해도 과언이 아닙니다. 이 자리를 빌어 저희를 도와주신 모든 멘토님과 E*5 프로그램 관계자 분들께 감사의 말씀을 드리고 싶습니다 🙂

창업을 준비할 때 E*5KAIST와 같은 창업지원 프로그램이 도움이 될 수 있습니다. 전문가들이 직접 멘토가 되어 시장성, 발전 가능성, 사업성에 대해 실질적인 조언과 개선책을 마련해주므로 막막한 창업의 길에 말씀하신 대로 부스터 같은 역할이 될 수 있다고 봅니다. 많은 분들이 창업원의 창업지원 프로그램에 참여하시면 좋겠습니다.

GSD의 단기적 목표는 무엇인가요?

저희는 1년 6개월 이내에 고객사가 필요로 하는 이미지 데이터를 상시 제공하는 자동화 파이프라인 기술을 구축하고, 이를 기반으로 글로벌 시장에 진출하는 것을 초기 목표로 선정하고 있습니다. 아직 시장이 작은 국내와 달리 세계적으로 머신러닝 서비스 운영(MLOps)에 필요한 인프라 시장에서는 가상 데이터 서비스가 새로운 트렌드를 만들고 있어요. 이 시장에 빠르게 진입해 저희 역시 글로벌 기업으로 성장하는 발판을 만드는 것이 현재 가장 큰 숙제입니다.

데이터를 상시 제공하는 자동 파이프라인 기술을 구축하고 인공지능기업들과 협업을 하며 글로벌 시장으로 진출하면 좋을 것 같습니다.

GSD가 최종적으로 이루고 싶은 목표는 무엇인가요?

저희의 비전은 “Dream to Real with AI”입니다. 30년 뒤 사람의 역할은 무엇이 될까요? 저희가 내렸던 결론은 “계속해서 꿈꾸는 것”이었습니다. 다른 모든 것들이 자동화되더라도 계속 새로운 것을 생각해내고 도전하는 것만은 사람의 역할이라고 생각합니다. 그렇다면 AI의 역할은 무엇이 될까요? 결국 사람의 꿈을 현실로 이룰 수 있도록 돕는 동반자라고 저희는 믿고 있습니다. 이를 실현하기 위한 구체적인 목표는 스스로 학습하는 인공지능인 Self-supervised AI를 저희의 가상 데이터 생성 서비스로 구현하는 것입니다. 이를 통해 AI 발전을 10년 앞당기고자 하는 것이 저희의 포부입니다.

인공지능 개발을 위해 가장 필요한 부분인 데이터 생성 및 가공과정에서 GSD는 가상 데이터를 생성하여 데이터를 추출하고 있습니다. 그 과정으로 시간과 비용이 절약되고, AI기술을 향상시키는 데 도움이 되려고 합니다. 꿈에서 그치는 것이 아니라 사람이 할 수 있는 역할들을 기술로 개발하여 현실에서 더 이롭게 사용할 수 있게 하는 것이 GSD가 추구하는 바인 것 같습니다. 지금의 AI기술도 과거에 비해 발전했지만 앞으로의 AI기술은 GSD와 같은 팀이 있기에 발전할 것이고 다양한 AI기업들과 함께 성장할 것으로 예상합니다.

GSD의 발전을 기대하고 응원합니다. 지금까지 GSD의 김재운 대표님을 만나보았습니다.