DataScience 14

[LLMOps]LangChain 소개 (3) - 활용 사례 및 실습

MNC는 ChatGPT 기반 검색 솔루션 딥서핑(Deep Searfing)의 자연어 처리 기술과 MLOps상의 ML 플랫폼 기술을 더한 LLMOps(Large Language Model Operations)를 개발하고 있는데요. 총 3편에 걸친 이번 시리즈 'LangChain의 모든 것'에서는 MNC는 LLM 레벨의 워크플로우 구성을 누구나 쉽게 할 수 있도록 지원하는 라이브러리인 LongChain에 대해 소개하고자 합니다. 오늘 소개해드릴 내용은 지금까지 다뤘던 Lang Chain과 컨셉과 구성 요소를 바탕으로, 실제로 LangChain을 이용해 어플리케이션을 구성해보는 실습을 다뤄보려 합니다. LangChain의 활용 사례까지 전달해드리는, 이번 시리즈의 마지막 글입니다. 🗒️ 1편 보러가기: htt..

AI 솔루션/LLMOps 2023.08.16

[커넥트로그] 2022 국방 AI 경진대회 해커톤 현장 스케치

안녕하세요, 마인즈앤컴퍼니의 Data Scientist 이녕민, 한두희입니다. 갑작스러운 추위가 찾아온 11월 30일, 마인즈앤컴퍼니의 인공지능 경진대회 AI CONNECT에서 한파도 잊게 만드는 뜨거운 대회가 열렸습니다. 바로 무박2일로 진행된 2022 국방 AI 경진대회(Military AI Competition, MAICON) 해커톤인데요. 대회가 종료된 지 한달이 채 안된 지금, 현장에서 '국방 AI'라는 새로운 도전을 지켜본 이야기를 풀어보려 합니디. MAICON은 군 장병 및 일반인을 대상으로 AI 기술을 활용해 주어진 문제를 해결하는 경진대회입니다. 군 AI 역량 검증 및 AI 우수 인재를 발굴해 AI 과학기술 강군을 육성에 기여하는 것을 목표로 이번 대회는 대한민국 국방부와 과학기술정보통신..

[RL] 2-2. Exploration과 Exploitation: Greedy Method vs. Epsilon-greedy Method

앞의 포스팅에서는 강화학습의 개념을 이해하고, 강화학습을 구성하는 필수 요소들에 대해 알아봤습니다. 이번 포스팅에서는 강화학습 분야에서 오랜 기간동안 연구되어 온 Multi-armed Bandit 문제를 기반으로 Exploration과 Exploitation에 대해 살펴보려고 합니다. Multi-armed Bandit 문제에 대해 설명하고 이 문제를 구현하여 Exploration과 Exploitation 에 대해 설명드리겠습니다. 본 포스팅에서 다루는 설명은 Sutton의 강화학습 책을 많이 참고하였습니다. 관련 코드는 Github 에서 확인할 수 있습니다. Greedy Method Exploitation을 하기 위해서 우리는 행동에 대한 평가가 필요합니다. 이 평가는 이전 포스팅에서 배운 Value라는..

SNU 빅데이터 핀테크 캡스톤 프로젝트 후기

안녕하세요. 마인즈앤컴퍼니입니다. 마인즈앤컴퍼니에서는 서울대학교 AI 연구원에서 진행하는 '빅데이터 핀테크 전문가 양성과정'의 캡스톤 프로젝트의 실습 기업으로 참가하게 되었습니다. 빅데이터 핀테크 전문가 양성과정은 서울대학교 교수진에게 5개월 간 빅데이터/핀테크 분야의 핵심 개념 및 기술에 대한 강의를 듣고, 2개월 간 기업과 연계하여 실제 프로젝트 수행하는 과정입니다. 총 4분이 오셔서 2개월 간 실습 프로젝트에 참여하였고, 그중 2분이 인턴으로 채용되어 근무 중입니다. 회사 입장에서도 우수한 인재를 선점할 수 있고, 수강생 입장에서도 실제 현업에서 데이터를 다뤄볼 수 있는 좋은 기회였다고 생각합니다. 캡스톤 프로젝트를 통해 AI CONNECT 부서의 인턴이 된 도성진 매니저가 전하는 생생한 후기를 지..

[민팃] 딥러닝 파손탐지 모델 서비스 with Data-centric AI

안녕하세요! 마인즈앤컴퍼니 민팃 팀입니다. 마인즈앤컴퍼니는 지난 2019년부터 중고 휴대폰 거래 플랫폼 민팃의 ATM을 위한 딥러닝 파손 탐지 AI 모델을 개발하고 있습니다. 본 포스트는 민팃 시리즈의 두 번째 포스트입니다. 오늘 포스트에서는 민팃 팀에서 데이터를 다루는 방법을 소개합니다. 요즘 Data-centric AI라는 아주 핫한 용어가 많은 관심을 받고 있는데요. 오늘은 Data-centric AI가 무엇인지, 또 민팃 팀에서는 Data-centric AI 구현을 위해 어떻게 데이터를 다루고 있는지를 알아보겠습니다. 만약 민팃 서비스와 민팃의 AI 모델에 대해 더 궁금하시다면 첫 번째 포스트를 읽어주세요. 2022.06.02 - [AI 프로젝트 소개] - [민팃] 중고 휴대폰 외관파손 탐지 AI..

[MLOps] MLOps 이해와 플랫폼 소개

안녕하세요 마인즈앤컴퍼니입니다. MLOps에 대하여 여러분들께서는 얼마나 알고 계신가요? 오늘은 소프트웨어의 빈번한 변화와 배포에 대응하는 프로세스의 향상을 도모하며, 개발과 운영 사이의 갭을 줄이는 도구로 사용되는 DevOps 기반의 소프트웨어 개발 방법과 함께 ML 모델 개발 전 과정의 프로세스를 통합하는 방법인 MLOps에 대하여 알아보겠습니다! MLOps 의 이해와 대표적인 MLOps 플랫폼 소개 작성: 마인즈앤컴퍼니 함명호 상무 AI 기술의 발전에 따라 최근 많은 소프트웨어 제품이나 서비스들은 AI를 결합하는 형태로 발전하고 있습니다. 이에 따라 소프트웨어 개발 프로세스에도 많은 변화가 생겼는데 1. 데이터를 분석하고 정제하는 과정 2. 정제된 데이터로 예측값을 도출해 내기 위한 모델을 만드는 ..

AI 솔루션/MLOps 2022.06.09

[캐글탐험대] Happy Whale 대회

안녕하세요. 마인즈앤컴퍼니입니다. 마인즈앤컴퍼니 AI CONNECT 부서에서는 중소벤처기업진흥공단이 주관하는 [스타트업 청년인재 이어드림] 프로젝트에 참여하고 있습니다. AI CONNECT는 AI 경진대회를 주관하는 부서인데요! 풍부한 AI 경진대회 수행 경험을 기반으로 모의 경진대회와 실전 경진대회를 담당하여 교육과 멘토링을 지원합니다. 작년 (2021년) 진행된 이어드림에서도 Kaggle 경진대회에 출전한 입교생들에게 특강과 멘토링을 지원해주었습니다. 그 중 은메달을 수상한 팀의 팀원이 마인즈앤컴퍼니에 입사하게 되었는데요! Data Scientist 로 입사하신 이남주, 김준철 매니저가 Happy Whale 대회 은메달 수상후기와 Insight를 작성해서 공유해주셨습니다. Kaggle 대회 준비하시는..

[직무인터뷰] Data scientist는 무슨 일해요?

안녕하세요. 마인즈앤컴퍼니입니다. 마인즈앤컴퍼니는 인공지능 Data Scientist를 적극 채용 중에 있는데요. 입사하게 되면 구체적으로 어떤 업무를 하게 될지 궁금하신 분들이 많았죠? 2021년 하반기에 Data Scientist 로 (이하 DS) 입사하여 프로젝트를 수행하고 계신 홍승우 매니저님을 만나간단하게 인터뷰를 해보았습니다. 어떤 계기로 마인즈앤컴퍼니에 입사하게 되었는지, 입사 후 어떤 프로젝트를 어떻게 했는지, 솔직하게 털어놓는 시간이 되었는데요. 부끄러움 많은 샤이가이이지만 일할 때만큼은 열정가이인 홍승우 매니저님의 인터뷰 지금 바로 공개합니다! Q. 안녕하세요! 간단하게 본인 소개 부탁드려요. 안녕하세요, 저는 2021년부터 마인즈앤컴퍼니 DS팀에서 AI 모델을 개발하고 있는 홍승우 매..

MNC Inside 2022.04.26

[캐글탐험대] PetFinder 대회 (2편)

안녕하세요. 1편에 이어 Kaggle Petfinder 대회 수상후기와 인사이트를 정리해드리려고 합니다! 저번 편에서 Transformer 모델에 대해서 소개해 드렸는데요, 이번 편에서는 Multi-head 모델과 BCE Loss 를 활용하여 학습했던 이야기를 해보려고 합니다. Insight 2 - Multi-head model is powerful! 그리스 신화에 나오는 케르베로스처럼, 하나의 몸에 여러 개의 머리가 달린 모델을 만들면 더 강력하지 않을까요? 실제로 이번 대회에서는 하나의 backbone (feature extractor)에 5개의 Head (predictor)를 붙여 사용했습니다. 이와 같은 Multi-head 모델을 4개 사용해서, 총 20개의 Head의 예측 결과를 앙상블 했습니다..

[ML101]#8.Clustering (2)

지난글에서는 대표적인 Unsupervised learning 모델의 하나인 clustering의 개요, 유형에 대해 알아봤습니다. 이번 글에서는 clustering의 대표적인 모델인 K-means clustering / Mean-shift clustering / DBSCAN (Density-based spatial clustering of applications with noise) / EM clustering using Gaussian mixture 에 대해서 좀 더 자세히 알아보고자 합니다. 1. K-means clustering K-means clustering은 대표적인 분할 군집 기법입니다. 군집 별로 centroid (중심)을 가지고 있으며, centroid에 가까운 data들 끼리 묶어 군집..

AI Study/ML101 2022.04.26