MNC Inside/AI CONNECT

2022 암 예후예측 데이터 구축 AI 경진대회 수상자 인터뷰

MNC 2023. 1. 6. 14:51

인공지능 경진대회 플랫폼 AI CONNECT에서 열린 2022년 마지막 경진대회, 바로 '2022 암 예후예측 데이터 구축 AI 경진대회'! 총 상금 2,000만원이 걸린 이번 대회는 다음 두 가지 과제로 나눠서 진행됐습니다. 

  1. 고해상도 병리 슬라이드 이미지를 기반으로 악성 종양 개체를 분할하는 이미지 세그멘테이션(Image Segmentation)
  2. 암 환자에 대한 임상 및 병리 정보를 기반으로 암 예후 예측

두 과제에 모두 132팀, 336명이 참가한 이번 대회! 총 6일간 진행된 본선 대회가 종료되고, 12월 22일 최종 수상팀 6팀(과제당 3팀)이 선정되었습니다. 

 

이번 경진대회는 '악성 종양'이라는 특수 분야라는 점은 물론 의료 데이터의 특성상 데이터 유출을 막기 위해 폐쇄형 GPU 서버 환경에서 진행되는 등, 참가자들에게도 기존의 경진대회와는 다른 점이 많은 경진대회였을 텐데요. 이 특별한 대회의 수상자들을 AI CONNECT가 직접 만나, 이번 대회의 A to Z를 듣고 왔습니다👀

 


 

Q. 이번 대회에 참여하게 된 계기가 궁금해요 
  • 딥러닝삼형제 ('폐암 병리 슬라이드 이미지 세그멘테이션' 대상)
    후배가 우연히 알게 되어서 같이 해보자 했는데, 의료 영상 데이터 쪽에서는 손을 대본 적이 한 번도 없어서 잘할 수 있을까라는 생각에 조금 망설였는데요. 그래도 이미지 세그멘테이션이나 Detection 관련된 것들을 많이 해 왔으니 도전해 보자는 마음으로 임하게 되었습니다.

  • 폐쏠로지 ('폐암 병리 슬라이드 이미지 세그멘테이션' 최우수상)
    평소에 의료 인공지능 관련 기술에 관심이 많아서 인터넷을 보다가 이런 대회가 있다는 것을 발견했어요. 개발자 분들을을 구하고 팀을 함께 꾸려서 참가하게 되었습니다.

  • 롯벤져스 ('폐암 병리 슬라이드 이미지 세그멘테이션' 우수상)
    평소에 의료 영상 쪽 경험을 많이 할 수가 없었기 때문에 새로운 곳에 분야에 도전하고 싶어서 참여했습니다. 

  • shj0325 ('암 융합 데이터를 이용한 암 예후 예측' 대상)
    평소에 대회에 참여하는 걸 좋아하는 편인데요. 특히 이번 대회는 이제 데이터를 쉽게 구할 수 없는 의료 쪽 데이터다 보니까 더 궁금함이 생겨서 지원을 하게 되었습니다. 

  • cain ('암 융합 데이터를 이용한 암 예후 예측' 최우수상)
    저는 현재 학부생 3학년으로 인공지능 관련을 공부를 하면서 각종 공모전을 찾고 있었는데요. 한 해가 마감이 되다 보니까 공모전들이 거의 다 끝난 상황이었습니다. 그런데 찾아보니 이런 암 예후 예측 대회라는 게 열린다고 해서 참가해 보았고요. 그렇게 참여한 이번 대회에서 이번에 좋은 성적을 거두게 되어 기분이 좋습니다.


  • 섭섭이와 친구들 ('암 융합 데이터를 이용한 암 예후 예측' 우수상)
    평소에 생존 분석 분야에 관심이 많았고 마침 이 분야에 해당 문제는 대회가 열린다고 해서 다른 주변에 훌륭한 분들과 함께 참여하게 되었습니다. 암 관련 데이터는 사실 일반인들에게 제공이 되지 않는 데이터인데, 이번 기회를 통해서 새로운 분야에 대해서 많이 배울 수 있다는 것이 제일 좋았습니다.

Q. 이번 대회에 대한 전체적인 소감을 말씀해주세요.
  • shj0325 ('암 융합 데이터를 이용한 암 예후 예측' 대상)
    참여해보니 데이터셋이 정말 잘 정제됐다고 느꼈는데요. 학습 데이터와 실제로 평가한 데이터의 분포가 비슷해서 '굉장히 데이터 정제 과정에서 많은 고생을 하셨구나'라는 것을 느꼈습니다. 폐쇄형으로 진행되는 대회라 불편할 수도 있지만, 한편으로는 모두가 동등한 이제 자원을 가지고 경쟁을 한다는 점에서 하나의 공정한 대회 방법이지 않을까 라는 생각이 들어요. 이런 부분이 전 장점이라고 생각합니다.

  • cain ('암 융합 데이터를 이용한 암 예후 예측' 최우수상)
    암이란 분야가 생소한 분야인데 이런 걸 접해 볼 수 있는 기회를 얻은 게 좀 뜻깊었습니다. 

Q. 수상 소식을 처음 들었을 때 어떠셨나요? 
  • 딥러닝삼형제 ('폐암 병리 슬라이드 이미지 세그멘테이션' 대상)
    대상까지 받게 돼서 기분이 너무 좋고요. 운도 많이 따랐던 거 같습니다. 다양한 실험들을 진행을 하면서 전후 처리도 많이 해보고 다양한 네트워크들을 돌려보면서 실험을 진행했었지만, 운이 많이 따른 거 같아요. 팀원들이랑 같이 여러 가지 실험을 해 볼 수 있어서 너무 좋았고 그 노력의 결과물이 대상이라는 점에서 기분이 너무 좋습니다.
  • 폐쏠로지 ('폐암 병리 슬라이드 이미지 세그멘테이션' 최우수상)
    저희는 퍼블릭 데이터에서는 4등이었다가, 합산 데이터에서 종합 2등을 차지하게 되었는데요. 결과 최종 결과가 나온 순간 굉장히 기뻤고, 그 기쁨 같이 카톡으로 함께 나눴던 순간이 기억에 남습니다. 제출 10분 전에 다른 팀이 치고 올라와서 3등이었다가 저희가 4등으로 밀려놨는데 최종 결과에서는 2등으로 나왔거든요. 그랬을 때는 수상을 못하나 싶었다가, 3등까지 줄어드니까 '됐다!'는 마음이었다가, 종합 2등으로 나오는 순간 아주 큰 기쁨이 있었습니다.

  • 롯벤져스 ('폐암 병리 슬라이드 이미지 세그멘테이션' 우수상)
    평소 공부를 해왔던 지식들이 많은 도움이 되었었고요. 그리고 3 등도 나쁜 성적은 아닌데, 1등이나 2등을 하지 못해서 좀 아쉽습니다.이번에 3등을 했기 때문에 다음에 또 열리면 반드시 참여해서 또 더 적극적으로 진행해가지고 더 좋은 성적 얻을 수 있도록 노력하겠습니다.

  • cain ('암 융합 데이터를 이용한 암 예후 예측' 최우수상)
    퍼블릭 점수에서는 제가 7등이었어서, 원래 수상은 거의 못한다고 거의 마음을 가지고 있었어요. 그러다 마지막에 2등을 해서 좀 얼떨떨하게 수상하지 않았나 싶어도 기분은 상당히 좋습니다. 저는 혼자서 대회를 나갔는데, 새벽 네 시까지 계속 제출하고, 제출도 한 시간마다 한 번밖에 안 되어서 엄청 많은 노력을 들었는데 성적이 안 나오다 보니까.... 이번 대회, 올해 마지막 대회도 좀 안 좋게 성적이 끝나겠구나라고 생각을 했는데요. 딱 세 시에 딱 결과가 나왔는데 2등으로 올라갔을 때는, 솔직히 좀 눈물이 찔끔 나오지 않았나 싶을 정도로 기뻤어요.

  • 섭섭이와 친구들 ('암 융합 데이터를 이용한 암 예후 예측' 우수상)
    상 받은 것도 기쁘지만 과정에서 생존 분석이라는 분야에 대해서 조금이나마 배울 수 있다는 기회를 얻은 것을 굉장히 기쁘게 생각합니다.

Q. 대회를 참여하며 가장 어려웠던 점은 무엇이었고, 그 어려운 점은 어떻게 해결하셨나요? 
  • 딥러닝삼형제 ('폐암 병리 슬라이드 이미지 세그멘테이션' 대상)
    가장 어려웠던 점은 폐쇄망이라는 것입니다. 보통은 저희 이미지 분야에서 딥러닝을 하다 보면, 이미지의 인풋과 최종 아웃풋의 결과를 직접 눈으로 보면서 어떤 것들이 잘 안 되는지를 살펴볼 수 있는데요. 병원 쪽의 데이터이고 폐쇄망이다보니 그런 것들을 직접 확인하고 손 볼 수가 없는 것들이 조금 많이 답답했습니다. 결과들을 무조건 숫자로만 보고 실시간으로 우리가 몇 등인지를 볼 수 없는 것들이 조금 어려웠던 점이었습니다.
  • 폐쏠로지 ('폐암 병리 슬라이드 이미지 세그멘테이션' 최우수상)
    폐쇄망에서 진행하다 보니 필요한 라이브러리들을 미리 설치하고, 그게 잘 되는지 테스트도 해야 되고, 이런 부분들이 조금 곤란했습니다. 그런데 생각보다 의외로 개발 환경들이 잘 구축되어있어서 잘 준비했던 것 같습니다.

  • 롯벤져스 ('폐암 병리 슬라이드 이미지 세그멘테이션' 우수상)
    이미지들을 이제 눈으로 직접 보지는 못했는데 이미지 크기를 찍어보니까 평소에 다루던 이미지들보다 훨씬 크더라고요. 그래서 전처리를 어떻게 해야할지 어려웠습니다. 여러 가지 실험을 해봤을 때, 일괄적으로 동일한 크기로 리사이즈를 하는 것이 가장 효과적이라고 판단했고 그렇게 진행을 했습니다.
  • cain ('암 융합 데이터를 이용한 암 예후 예측' 최우수상)
    아무래도 폐쇄형 대회다 보니까 무조건 라이브러리를 사전에 설치해야 되는 어려움이 있었습니다. 제가 대회 한 2~3일차쯤에 필요한 라이브러리가 있었는데, 그때는 그걸 설치할 수 없는 상황이어서 해보고 싶었던 알고리즘을 적용하지 못했다보니 이걸 적용했으면 좀 더 좋은 모델을 만들 수 있지 않았나 생각이 들어요.

Q.  정말 쉽지 않은 과정이었을텐데요. 수상의 비법이 있다면 무엇일까요?
  • 딥러닝삼형제 ('폐암 병리 슬라이드 이미지 세그멘테이션' 대상)
    비법이라는 건 사실 없죠. 근데 열심히 노력했고, 다양한 실험들을 진행을 했었어요. 다양한 논문들을 이전부터 항상 읽어왔었고, 개인적으로 석사 전공 이후 관련 분야에서 계속 일하고 있기 때문에 이 분야에 대해서 그래도 조금 정확하게 잘 알고 있습니다. 어떤 게 안 좋고 어떤 게 좋은지, 어떻게 전후 처리를 해야 성능이 나아질 수 있을 것인지를 생각하며 실험에 임하면 좋은 결과를 낼 수 있을 것이라고 생각합니다. 

  • shj0325 ('암 융합 데이터를 이용한 암 예후 예측' 대상)
    짧은 시간 동안 많이 집중해서 대회를 임했던 거 같아요. 아무래도 '의료' 분야이다 보니까, 처음에 이 부분을 이해해 보겠다고 공부도 많이 했고요. 한 시간에 한 번씩 제출한다는 점을 최대한 활용하기 위해서 모델링에서도 많은 실험을 했던 그런 고생들이 쌓였어요. (고생이라면?)
    짧은 시간이지만 관련된 병리나 영상에 관련된 데이터를 좀 이해하고 싶어서 관련된 논문들을 조금 보기도 했고요. 모델링 같은 경우에는 한개, 두개에서 그치지 않고 여러 알고리즘들을 실험하고 계속 feature 추가하면서 때까지 계속 실험해 봤던 것들이 고생이라고 생각합니다.

Q.  함께 한 팀원들에게 한 마디 남겨주세요. 
  • 폐쏠로지 ('폐암 병리 슬라이드 이미지 세그멘테이션' 최우수)
    사실 이 대회를 통해서 알게 된 분들이라 다 처음 뵌 분들인데, 이렇게 신뢰해 주시고 다 같이 으쌰으쌰하면서 진행할 수 있어서 더 감사드리고 좋은 시간이었습니다. 운 좋게 이렇게 능력 있는 분들과 함께 협업하여서 좋은 결과를 해서 정말 기쁩니다. 앞으로도 이제 팀원들 분들이랑 다른 대회든 추후에도 함께 할 수 있었으면 좋겠어요.

Q.  다음 도전자들에게 남겨주실 팁이 있다면?
  • 딥러닝삼형제 ('폐암 병리 슬라이드 이미지 세그멘테이션' 대상팀)
    요즘 이미지 분야 쪽에서는 트랜스포머들을 주로 사용을 하는데, GPU가 좀 많이 한정되어 있습니다. 폐쇄망 대회에서는 그런 것들을 알 수가 없기 때문에 여러 가지 모델들에 대해서 이해도를 갖추는 준비를 해 둬야 할 것 같고요. 5일이라는 기간이 생각보다 많이 짧아서 잘 준비할 수 있도록 스케줄 정리를 다 해 둬야 될 거 같습니다. 저도 나중에 똑같이 참여를 하게 된다면 연차를 쓰던지 시간을 많이 확보해 두고 노력을 할 것 같습니다.


  • 폐쏠로지 ('폐암 병리 슬라이드 이미지 세그멘테이션' 최우수)
    대회 기간이 못지 않게 중요한 게, 사전에 대회 준비하면서 비슷한 데이터셋을 조금 직접 돌려보는 것처럼 철저한 준비가 선행되어야 대회 당일 기간이 되어서도 당황하지 않고 잘 준비할 수 있지 않을까 싶습니다. 또 서로 소통을 충분히 하는 것도 중요하다고 생각합니다. 서로 각자의 일상이 있고 직장이 있으니까요. 보통은 카톡으로 소통하고요. 저희는 퇴근 후에 미팅을 많이 한 편인데, 이렇게 서로 오해가 없고 원활한 소통이 되도록 이런 자리를 좀 자주 가지면 좋을 것 같습니다.

  • 롯벤져스 ('폐암 병리 슬라이드 이미지 세그멘테이션' 우수상)
    경진대회와 관련한 오픈소스들이 많이 있기 때문에 그것들을 최대한 참고해서 진행하시면 좋은 성적을 얻으실 수 있을 것 같아요. 

  • shj0325 ('암 융합 데이터를 이용한 암 예후 예측' 대상)
    일주일 정도 진행되는데 생각보다 시간이 금방 가더라고요. 그래서 지치지 않고 꾸준하게 끝까지 달리시면 좋은 결과가 있지 않을까 생각합니다. 
  • cain ('암 융합 데이터를 이용한 암 예후 예측' 최우수상)
    이번같은 폐쇄형 대회가 열린다면, 자신의 로컬 컴퓨터에 라이브러리들을 최대한 거의 대부분 설치하길 권장 드리고요. 그리고 아무래도 도메인 지식이 어느정도는 기반이 되어야 성적이 나올 수 있다고 생각하는 편이기 때문에, 이러한 주제가 나왔을 때 사전에 어느 정도 공부를 하는 것을 추천하고 있습니다. 이번 대회가 아주대학교에서 열렸는데, 만약 저희 후배가 이런 대회에 지원하게 된다면 '뭐든지 까볼 때까지 모른다. 끝까지 가봐야 안다'고 말해 주고 싶습니다. 포기하지 않고, 좌절하더라도 끝까지 한다면 좋은 성적을 거둘 수 있을 것이라고 전해 주고 싶습니다.
  • 섭섭이와 친구들 ('암 융합 데이터를 이용한 암 예후 예측' 우수상)
    이전에 열린 여러 대회들에서 사용한 기술이나 여러 방법들을 참고한다면, 다음 대회 참가자분들이 좋은 성적을 거둘 수 있으리라 생각합니다.

"까볼 때까지(?) 모른다!" 수상 엔딩을 맞이한 모든 수상팀, 다시 한번 축하합니다!


AI CONNECT에서 더 많은 경진대회를 살펴보세요.