딥러닝 9

[민팃] 쉽게 알아보는 민팃 딥러닝 모델 성능평가 - Dice score부터 Kappa까지

안녕하세요! 마인즈앤컴퍼니 민팃 팀입니다. *** 마인즈앤컴퍼니는 지난 2019년부터 중고 휴대폰 거래 플랫폼 민팃의 ATM을 위한 딥러닝 파손 탐지 AI 모델을 개발하고 있습니다. 본 포스트는 민팃 시리즈의 네 번째 포스트입니다. 오늘의 포스트에서는 민팃 팀의 AI 모델을 평가하는 방법에 대해 소개할 예정인데요. 먼저 민팃 모델에 사용되는 Segmentation과 Classification 태스크에서 사용되는 평가지표에는 어떤 것이 있는지 민팃의 Real-world 서비스에서 이러한 평가지표들을 활용할 때 중요하게 고민한 부분이 무엇인지 등 민팃에서 활용하고 있는 모델의 평가지표와 그 적용 방향성에 대해 공유하고자 합니다. (1) 만약 민팃 서비스와 민팃의 AI 모델이 궁금하시다면: 2022.06.02..

추천시스템 모델 개발과 현업 프로젝트 적용

E-Commerce 회사에서 데이터 직무에 재직 중인 김대리. 최근 김대리는 데이터 파이프라인의 스케줄링 관련 업무를 맡게 되었다. 해당 업무에 익숙하지 않았던 김대리는 데이터 스케줄링 프레임워크인 Apache Airflow 관련 내용을 더듬더듬 구글링을 하며 작업을 진행 중이었다. 내용이 쉽지 않아 관련 강의를 하나정도 보면 좋겠다고 생각하던 참이었는데, 마침 평소에 사용중이던 소셜 미디어에 Airflow 강의가 추천 광고로 뜨게 되었고 해당 강의를 신청하게 되었다. 나는 어쩌다 이 글을 읽게 되었을까? 아침에 눈을 뜨고 밤에 눈을 감는 순간까지 우리는 수많은 추천과 마주치게 됩니다. 음식, 옷 등 온라인 플랫폼을 통한 구매에서 연관 상품을 추천받기도 하고, 평소 즐겨 쓰는 소셜미디어에서는 새로운 친구..

[RL] 2-1. Exploration과 Exploitation: Multi-armed Bandit Problem

2022.04.26 - [[스터디] 강화학습] - [RL] 1-1. 강화학습이란? [RL] 1-1. 강화학습이란? 안녕하세요. 마인즈앤컴퍼니 (이하 MNC) 입니다. :-) MNC의 새로운 'RL' 시리즈를 소개드립니다. 테크리더 명대우 파트너님의 지도 아래, MNC 의 Data scientist 인 최창윤 매니저가 뜻을 모아 강화학습에 blog.mnc.ai 2022.04.28 - [[스터디] 강화학습] - [RL] 1-2. 강화학습의 구성 요소 [RL] 1-2. 강화학습의 구성 요소 이전 포스팅에서 Agent가 Action을 수행했을 때 Environment와의 상호작용을 통해 Agent가 학습한다고 배웠습니다. Agent와 Environment, Action 에 대해 구체적이지는 않지만 간단한 개념을..

[민팃] 야 너두 할 수 있어! 유지보수가 쉬운 AI 모델 서비스 운영 코드 설계하기

안녕하세요. 본 포스트에서는 AI 모델을 서비스에 반영할 때 겪을 수 있는 어려움과, 이를 해결하기 위한 효율적인 설계 방안을 소개합니다. *** 마인즈앤컴퍼니는 지난 2019년부터 중고 휴대폰 거래 플랫폼 민팃의 ATM을 위한 딥러닝 파손 탐지 AI 모델을 개발하고 있습니다. 본 포스트는 민팃 시리즈의 세 번째 포스트입니다. 이전 발행글이 궁금하다면 클릭해주세요. 2022.06.02 - [AI 프로젝트 소개] - [민팃] 중고 휴대폰 외관파손 탐지 AI 모델 개발기 [민팃] 중고 휴대폰 외관파손 탐지 AI 모델 개발기 안녕하세요! 마인즈앤컴퍼니는 지난 2019년부터 올해로 4년째 민팃 중고폰 ATM에서 사용되는 AI 모델 개발을 담당하고 있습니다. 이번 주부터 4주 간 발행되는 민팃 포스트 시리즈를 통..

01. [AI to the Real World] 를 시작하며

안녕하세요. 마인즈앤컴퍼니 (이하 MNC) 입니다. 여러분들은 다니고 싶은, 혹은 다니고 있는 회사의 최고의 복지는 무엇이라고 생각하시나요? 물론 여러 가지 중요한 복지들이 있겠지만 아마도 AI 업계에 있으신 분들이라면 다들 공감하실 거 같아요. 최고의 동료와 함께 일하는 것! MNC를 짧은 기간 안에 이만큼이나 성장하게 한 원동력은 바로 이것이 아닐까요? 그리고 그 멤버들을 이끄는 대표 두 분과 임원진 분들이 기둥이 되어 직원 모두에게 영감이 되고 있습니다. 전상현, 고석태 대표는 컨설팅 출신으로 잘 알려져 있습니다. 그만큼 AI 업계에서 엔지니어로 시작한 다른 업체들과 차별화된 가치관과 비전을 갖고 계실 것 같습니다. 또한 딥러닝 전문가 명대우 파트너, 통계학 박사 김현선 파트너, AI 경진대회를 전..

[캐글탐험대] PetFinder 대회 (2편)

안녕하세요. 1편에 이어 Kaggle Petfinder 대회 수상후기와 인사이트를 정리해드리려고 합니다! 저번 편에서 Transformer 모델에 대해서 소개해 드렸는데요, 이번 편에서는 Multi-head 모델과 BCE Loss 를 활용하여 학습했던 이야기를 해보려고 합니다. Insight 2 - Multi-head model is powerful! 그리스 신화에 나오는 케르베로스처럼, 하나의 몸에 여러 개의 머리가 달린 모델을 만들면 더 강력하지 않을까요? 실제로 이번 대회에서는 하나의 backbone (feature extractor)에 5개의 Head (predictor)를 붙여 사용했습니다. 이와 같은 Multi-head 모델을 4개 사용해서, 총 20개의 Head의 예측 결과를 앙상블 했습니다..

[ML101] #6. Overfitting

앞의 과정들을 통해 머신러닝이 어떻게 작동하는지 살펴보았습니다. 머신러닝 모델이란 실제 데이터를 대체할 수 있는 모형이고 이러한 모델을 통해 실제 데이터 없이도 현실 세계에서 활용할 수 있습니다. 그런데 이 모델은 정교해지기 위해 복잡하게 만들면 학습한 데이터와 조금만 다른 데이터가 들어와도 큰 오차를 만들 수 있고, 반대의 경우는 변수들과의 관계를 충분히 설명할 수 없게 되는 Trade-off 문제가 발생하게 됩니다. 이러한 문제를 수학적으로 표현한 것이 Bias-Variance(편향-분산) Trade-off 입니다. 조금 더 자세히 알아보겠습니다. Bias-Variance Trade-off 를 설명하는 유명한 그림 중 하나 입니다. 사격 게임을 할 때 가장 높은 점수를 받는 방법은 나에게 주어진 총알..

AI Study/ML101 2022.04.26

[ML101] #4. Gradient descent

[ML101] 시리즈의 세 번째 주제는 경사 하강법(gradient descent)입니다. 지난 시리즈에서 손실 함수(loss function)를 통해 모델의 예측값이 실제값과 차이가 나는 정도, 즉 오차값을 측정하는 방법들을 알아보았습니다. 우리가 가지고 있는 데이터들을 잘 설명할 수 있도록 손실 함수, 비용 함수(loss function, cost function), 또는 목적 함수(objective function)를 이용하여 가장 최적의 모델을 만듭니다. 이 과정은 최적화(optimization)라고도 하는데, 여기에서 사용되는 방법이 경사 하강법입니다. 경사 하강법은 손실함수의 결과값(오차값, 그림의 y축)이 최소값이 되는 최적인 모델의 파라미터 θ(x축)를 찾는 과정입니다. 그림에서 볼 수 있..

AI Study/ML101 2022.04.26

[ML101] #0. Foreword

Machine Learning, Deep Learning 등 최신 AI 기술을 이해하기 위해서는 기본적인 이론 학습이 필요합니다. [ML101] 시리즈에서는 입문자를 위해 AI와 관련된 주요 이론을 챕터별로 소개합니다. 본 내용은 AI의 거장 Andrew Ng 교수의 강의 syllabus를 참고하여 주요 개념들을 정리한 내용입니다. 세부 이론을 살펴보기에 앞서 Machine Learning 프로젝트를 설계하는 일반적인 방법을 생각해 보겠습니다. 다소 진부한 내용이긴 합니다만 프로젝트를 실행할 때 결과 도출까지의 전체 과정을 머릿속으로 그려보고 시작하는 것은 효율과 성과를 높이는 중요한 방법이라고 생각됩니다. 자, 그럼 Machine Learning 프로젝트는 어디서부터 어떻게 시작해야 할까요? 1. 문제..

AI Study/ML101 2022.04.25