AI to the Real World 14

🥈은메달 수상기 (2) OTTO 추천시스템 대회: 챌린지와 우리의 솔루션

안녕하세요. 마인즈앤컴퍼니의 AI 경진대회 플랫폼 ‘AI CONNECT’를 운영하는 AI 커넥트팀입니다. 저희 팀의 데이터사이언티스트들이 Kaggle에서 개최된 OTTO - Multi-Objective Recommender System 경진대회에서 2,587 팀 중 128등이라는 기록을 내며 은메달을 차지했다는 소식, 지난 번 첫번째 수상기 글을 통해 알려드렸습니다. 이번에는 OTTO 대회가 어떤 챌린지가 있었는지, 그리고 그 챌린지를 어떻게 풀어냈는지에 대해 두 번째 글로 소개해드립니다. 작성: 마인즈앤컴퍼니 Data Scientist 곽치영 매니저 (AI커넥트사업부) 마인즈앤컴퍼니 전혜령 인턴 (연세대 응용통계학 19) 검수: 마인즈앤컴퍼니 Data Scientist 박기돈 매니저 (AI커넥트사업부)..

🥈은메달 수상기 (1) OTTO 추천시스템 대회 A to Z

안녕하세요. 마인즈앤컴퍼니의 AI 경진대회 플랫폼 ‘AI CONNECT’를 운영하는 AI 커넥트팀입니다. 저희 팀에서 함께 데이터사이언스의 세계를 파헤치고 있는 전혜령 인턴과 커넥트팀의 데이터사이언티스트들이 Kaggle에서 개최된 OTTO - Multi-Objective Recommender System 경진대회에서 2,587 팀 중 128등이라는 기록을 내며 은메달을 차지했습니다! 이 기쁜 소식과 함께, 은메달 수상기를 블로그를 통해 미래의 데이터사이언티스트 및 AI 과학자들과 공유하려 하는데요. 첫 번째 편인 이번 글에서는 OTTO 대회에 대한 자세한 소개 및 대회에 참여하며 얻게 된 몇 가지 팁을 소개합니다. 작성: 마인즈앤컴퍼니 전혜령 인턴 (연세대 응용통계학 19) 검수: 마인즈앤컴퍼니 Data..

TrOCR을 활용한 Text Recognition 모델 개발기

안녕하세요, 저희는 현장실습 프로그램으로 마인즈앤컴퍼니에서 근무하고 있는 정지현(홍익대 컴퓨터공학 19), 정기윤(한양대 산업공학 17) 인턴입니다! 이번 글에서는 저희가 6주간 참여한 프로젝트를 소개해드리려고 합니다. 1. OCR 이란? OCR (Optical Character Recognition) 이란 손글씨, 인쇄된 글자, 스캔한 문서, 문서의 사진 등의 형태의 텍스트 이미지를 기계가 읽을 수 있을 수 있는 텍스트 포맷으로 변환하는 기술입니다. 문자를 디지털화 해주기 때문에 일상생활에서도 많이 쓰이고 있는데요, 스마트폰으로 카드결제를 진행할 때, 카메라로 카드를 인식하면 자동으로 카드 번호가 입력되는 경우도 해당됩니다. OCR TASK 단계는 크게 5단계(Preprocessing, Text Det..

마이데이터 활용을 위한 업종 분류 모델 개발기

안녕하세요. 마인즈앤컴퍼니입니다. 연세대학교 현장실습 프로그램으로 최명헌님, 김서연님께서 6주간 참여해주셨는데요. 마이데이터 구축에 필요한 가맹점 업종 분류 모델을 개발하고, 해당 모델로 웹사이트까지 구현하며 탄탄한 실무 경험을 쌓을 수 있었다고 합니다. 인턴 프로그램을 성공적으로 수료하고 그 과정을 김서연님이 작성해주셨습니다. 마인즈앤컴퍼니는 학점 연계로 오시는 학생 인턴분들을 특히나 더 아끼고 챙겨주려고 합니다. 의미 없는 잡무를 하면서 일손을 거드는 게 아니라 실무 경험을 쌓고 그 과정에서 많은 것을 체득할 수 있도록 든든한 선배들이 되어줄 것이니 학생분들 많관부 🤗 안녕하세요, 저희는 연세대학교 현장실습 프로그램으로 마인즈앤컴퍼니에서 근무하고 있는 최명헌, 김서연 인턴입니다! 이번 글에서는 저희가..

SNU 빅데이터 핀테크 캡스톤 프로젝트 후기

안녕하세요. 마인즈앤컴퍼니입니다. 마인즈앤컴퍼니에서는 서울대학교 AI 연구원에서 진행하는 '빅데이터 핀테크 전문가 양성과정'의 캡스톤 프로젝트의 실습 기업으로 참가하게 되었습니다. 빅데이터 핀테크 전문가 양성과정은 서울대학교 교수진에게 5개월 간 빅데이터/핀테크 분야의 핵심 개념 및 기술에 대한 강의를 듣고, 2개월 간 기업과 연계하여 실제 프로젝트 수행하는 과정입니다. 총 4분이 오셔서 2개월 간 실습 프로젝트에 참여하였고, 그중 2분이 인턴으로 채용되어 근무 중입니다. 회사 입장에서도 우수한 인재를 선점할 수 있고, 수강생 입장에서도 실제 현업에서 데이터를 다뤄볼 수 있는 좋은 기회였다고 생각합니다. 캡스톤 프로젝트를 통해 AI CONNECT 부서의 인턴이 된 도성진 매니저가 전하는 생생한 후기를 지..

[민팃] 쉽게 알아보는 민팃 딥러닝 모델 성능평가 - Dice score부터 Kappa까지

안녕하세요! 마인즈앤컴퍼니 민팃 팀입니다. *** 마인즈앤컴퍼니는 지난 2019년부터 중고 휴대폰 거래 플랫폼 민팃의 ATM을 위한 딥러닝 파손 탐지 AI 모델을 개발하고 있습니다. 본 포스트는 민팃 시리즈의 네 번째 포스트입니다. 오늘의 포스트에서는 민팃 팀의 AI 모델을 평가하는 방법에 대해 소개할 예정인데요. 먼저 민팃 모델에 사용되는 Segmentation과 Classification 태스크에서 사용되는 평가지표에는 어떤 것이 있는지 민팃의 Real-world 서비스에서 이러한 평가지표들을 활용할 때 중요하게 고민한 부분이 무엇인지 등 민팃에서 활용하고 있는 모델의 평가지표와 그 적용 방향성에 대해 공유하고자 합니다. (1) 만약 민팃 서비스와 민팃의 AI 모델이 궁금하시다면: 2022.06.02..

추천시스템 모델 개발과 현업 프로젝트 적용

E-Commerce 회사에서 데이터 직무에 재직 중인 김대리. 최근 김대리는 데이터 파이프라인의 스케줄링 관련 업무를 맡게 되었다. 해당 업무에 익숙하지 않았던 김대리는 데이터 스케줄링 프레임워크인 Apache Airflow 관련 내용을 더듬더듬 구글링을 하며 작업을 진행 중이었다. 내용이 쉽지 않아 관련 강의를 하나정도 보면 좋겠다고 생각하던 참이었는데, 마침 평소에 사용중이던 소셜 미디어에 Airflow 강의가 추천 광고로 뜨게 되었고 해당 강의를 신청하게 되었다. 나는 어쩌다 이 글을 읽게 되었을까? 아침에 눈을 뜨고 밤에 눈을 감는 순간까지 우리는 수많은 추천과 마주치게 됩니다. 음식, 옷 등 온라인 플랫폼을 통한 구매에서 연관 상품을 추천받기도 하고, 평소 즐겨 쓰는 소셜미디어에서는 새로운 친구..

[민팃] 야 너두 할 수 있어! 유지보수가 쉬운 AI 모델 서비스 운영 코드 설계하기

안녕하세요. 본 포스트에서는 AI 모델을 서비스에 반영할 때 겪을 수 있는 어려움과, 이를 해결하기 위한 효율적인 설계 방안을 소개합니다. *** 마인즈앤컴퍼니는 지난 2019년부터 중고 휴대폰 거래 플랫폼 민팃의 ATM을 위한 딥러닝 파손 탐지 AI 모델을 개발하고 있습니다. 본 포스트는 민팃 시리즈의 세 번째 포스트입니다. 이전 발행글이 궁금하다면 클릭해주세요. 2022.06.02 - [AI 프로젝트 소개] - [민팃] 중고 휴대폰 외관파손 탐지 AI 모델 개발기 [민팃] 중고 휴대폰 외관파손 탐지 AI 모델 개발기 안녕하세요! 마인즈앤컴퍼니는 지난 2019년부터 올해로 4년째 민팃 중고폰 ATM에서 사용되는 AI 모델 개발을 담당하고 있습니다. 이번 주부터 4주 간 발행되는 민팃 포스트 시리즈를 통..

[민팃] 딥러닝 파손탐지 모델 서비스 with Data-centric AI

안녕하세요! 마인즈앤컴퍼니 민팃 팀입니다. 마인즈앤컴퍼니는 지난 2019년부터 중고 휴대폰 거래 플랫폼 민팃의 ATM을 위한 딥러닝 파손 탐지 AI 모델을 개발하고 있습니다. 본 포스트는 민팃 시리즈의 두 번째 포스트입니다. 오늘 포스트에서는 민팃 팀에서 데이터를 다루는 방법을 소개합니다. 요즘 Data-centric AI라는 아주 핫한 용어가 많은 관심을 받고 있는데요. 오늘은 Data-centric AI가 무엇인지, 또 민팃 팀에서는 Data-centric AI 구현을 위해 어떻게 데이터를 다루고 있는지를 알아보겠습니다. 만약 민팃 서비스와 민팃의 AI 모델에 대해 더 궁금하시다면 첫 번째 포스트를 읽어주세요. 2022.06.02 - [AI 프로젝트 소개] - [민팃] 중고 휴대폰 외관파손 탐지 AI..

[민팃] 중고 휴대폰 외관파손 탐지 AI 모델 개발기

안녕하세요! 마인즈앤컴퍼니는 지난 2019년부터 올해로 4년째 민팃 중고폰 ATM에서 사용되는 AI 모델 개발을 담당하고 있습니다. 이번 주부터 4주 간 발행되는 민팃 포스트 시리즈를 통하여 민팃 프로젝트에서 어떤 일을 하고 있는지를 공유하고자 합니다. 첫 포스팅인 만큼 이번 글에서는 민팃 프로젝트 전반에 대한 개요와 함께 프로젝트의 문제 정의와 그에 따른 솔루션을 설명하고, 현재 민팃 파손 탐지에 어떤 모델이 사용되고 있는지 소개하겠습니다. 민팃이란? 민팃(MINTIT)은 전국 최대 규모의 비대면 중고 휴대폰 거래 플랫폼입니다. 대형마트나 휴대폰 대리점에서 쉽게 접할 수 있는 민팃 ATM을 이용하여 서랍 속에 잠들어있던 중고 휴대폰을 손쉽게 판매할 수 있는 서비스를 제공합니다. ATM에서 거래가 이루어..