이번엔 네이버 부스트캠프 AI Tech 4기에 참여하면서 온보딩 키트를 받게되어 리뷰해보겠습니다. Contents 1. 온보딩키트의 구성 boostcamp 박스와 검은색 귀여운 가방이 왔습니다~~ 1) boostCamp 박스의 구성 부스트캠프 박스에는 맛있는 과자여러개, 부스트캠프 1주차부터 22주차까지 진행되는 일정표, 여러가지 스티커들, 부캠생활을 잘하기 위한 여러가지 팁들, 웰컴메시지 카드로 구성되어 있습니다. 2) 일정표 일정표는 세워서 넘길 수 있는 구조로 되어있고, 아래처럼 각 주마다 일정과 스페셜 이벤트들의 요일 이 적혀있습니다. 3) 스티커 그 외에 귀여운 스티커들이 왔습니다~ 읽어주셔서 감사합니다.
Contents 1. 배경 M1 맥북에서 Pytorch를 이용해 딥러닝 모델을 학습할 때, CPU를 사용하는 것보다 GPU를 사용하면 매우 빠르게 학습을 할 수 있습니다. 이번에 PyTorch가 1.12 버전으로 업데이트되며 M1 Mac에서도 GPU 연산을 지원합니다. 그 방법을 알아보도록 하겠습니다. 2. 해결 방법 1️⃣ PyTorch 최신 버전 설치 # conda 이용 pytorch 최신 버전 설치 conda install -c pytorch pytorch # pip 이용 설치 python -m pip install torch 현재(22.10.03) 기준 pytorch 최신버전은 1.12.1 버전입니다. 1.12.0 이상이면 괜찮습니다. 2️⃣ device에 적용하는 코드! device = torc..
Contents 1. 배경 파이 토치에서 tensorboard를 통해 학습 그래프, Metric, 학습 결과를 시각화할 수 있는 기능을 제공해 줍니다. 주피터 노트북 상에서 해당 텐서 보드를 볼 수 있는데, Tensorboard를 실행하려고 보니 아래와 같은 에러가 나는 경우가 있습니다. TypeError: entry_points() got an unexpected keyword argument 'group' * 출력 화면 이를 해결하는 방법을 알아보겠습니다. 2. 해결 원인은 Tensorboard가 주피터 노트북에서 표현될 때 의존적인 markdown의 버전이 낮기 때문입니다. 아래 처럼 markdown을 다시 설치하고, 셀을 다시 시작하면 됩니다. # 주피터 노트북에서 ## conda 이용시 !con..
Contents 부스트캠프 AI tech 4기를 진행한 지 1주가 지났습니다. 슬랙에는 정말 많은 채널과 Tip들 그리고 자유롭게 채널을 생성하고 정보 공유를 하며, 스터디도 구하고 공유하는 문화가 잘 갖춰져 있습니다. 특히 운영진들과 멘토 조교님들이 활발하게 공유문화를 장려해서 캠퍼분들도 열정 있게 적극적으로 임하는 느낌입니다. 이번 포스팅에선 1주 동안 배운내용과 부스트캠프의 이벤트들을 간략히 정리하고자 합니다. 1. 강의 내용 1) Python 1️⃣ Python 기초 1~2 강에 걸쳐, 파이썬의 설치부터 환경설정(conda)과 기초적인 변수, 조건문, 반복문, string 관련 메소드들을 배웠습니다. 한 가지 특이했던 점은 함수에서 전역 변수에 있는 리스트를 호출해서 값을 변경하면 전역 변수에 있..
* 전체 코드 import pandas as pd from pydataset import data df = data('Titanic') ### 테스트 데이터셋 불러오기 ### 비교 연산 cond_adult = df.Age=='Adult' # == 연산 df[cond_adult] # True인 값들만 출력 cond_freq_under4 = df.Freq
Contents 안녕하세요. 이번엔, 인프런의 파이썬 머신러닝 완벽 가이드 강의의 [섹션 9 - 추천 시스템]을 요약해보겠습니다. 목표는 추천 시스템의 전반적인 그림을 이해하는 것입니다. 1. 추천 시스템의 중요성 유튜브, 쿠팡, 넷플릭스, 아마존 등의 이커머스 기업에서 추천 알고리즘은 이제 필수 요소가 되었습니다. 사용자에게 맞춤 아이템(상품, 콘텐츠 등)을 제공해줌으로써, 사용자의 온라인 경험을 대폭 향상시킬 수 있고, 이는 매출로 이어지기 때문입니다. 추천 시스템은 사용자가 온라인에서 남긴 모든 흔적을 데이터로 사용합니다. 추천 시스템은 사용자 자신도 모르는 취향을 저격하여 취향의 한계 폭을 넓혀줌으로써, 신뢰도를 올립니다. 그러면, 사용자는 추천 시스템을 적극 이용함으로써 추천 시스템에 양질의 데..
* 전체 코드 import sympy as sp from sympy.abc import x, y ## 미분 exp = x**2 +2*x + 3 sp.diff(exp, x) ## 사용된 변수와 도메인과 함께 표시 sp.poly(sp.diff(exp, x)) # Z:정수, Q:유리수, R:실수, C:복소수 # x로 2번 미분 sp.diff(exp, x, x) ## dx/dy or dy/dx sik=x**2 + y**2 +2*x + 3 sp.idiff(sik, x, y) # dx/dy sp.idiff(sik, y, x) # dy/dx ## 적분 sik=sp.log(x**2+sp.E**x) # 수식 정의 sp.integrate(sik, x) # 적분 ### 적분이 안되는 경우 sp.integrate(sp.cos..
* 전체 코드 import pandas as pd from pydataset import data titanic = data('titanic') # titanic 데이터셋 가져오기 df = titanic.sample(5,random_state=90) #랜덤 5개만 가져오기 ## iterrows 행 반복 for index, row in df.iterrows(): print(f"{index=}, {row.age=}, {row['sex']=}") ## itertuples 행 반복 for row in df.itertuples(): print(f"{row.age=}, {row.sex=}") ## df.index 사용 for idx in df.index: print(f"{df.loc[idx,'class']=}, {..
안녕하세요 이번 포스팅에선 MLOps의 핵심 문제와 이를 이해하기 위한 배경을 알아보겠습니다. 인프런의 "머신러닝 엔지니어 실무" 강의의 첫 번째 맛보기 영상을 보고, 공부하며 정리한 내용입니다. 목표 1. 머신러닝 파이프라인의 개념에 대해 이해 2. 머신러닝 기반의 소프트웨어가 갖고 있는 특징을 이해 3. MLOps에서 풀어야 하는 핵심 문제 이해 4. MLOps 성숙도 레벨에 따른 특징 이해 Contents 1. 머신러닝 파이프라인의 필요성 파이프라인은 산업혁명 시대에 자동화의 시작을 알린 개념입니다. 이를 통해 생산성 향상, 예측 가능한 품질, 장애 대응능력 향상이라는 이점을 얻었습니다. 이렇게 자동화를 하면, 수십수백 개의 머신러닝 모델을 제공한다는 생산성 향상을 얻을 수 있습니다. 또한, 자동화..
* 전체 코드 install.packages("RMySQL") # RMySQL 설치 install.packages("DBI") # DBI 설치 library(DBI) library(RMySQL) # 문자열 컬럼에 대해 UTF-8로 인코딩 set_utf8
이번엔 JSON파일을 데이터 프레임으로 상호 변환하는 방법에 대해 알아보겠습니다. #전체 코드 import json, pandas as pd # test.json 내용: [{"name":"Jack","age":26},{"name":"Ace","age":87}] with open('test.json') as f: js = json.loads(f.read()) ## json 라이브러리 이용 df = pd.DataFrame(js) df = pd.read_json('test.json') ## pd.read_json 이용 ## orient df.to_json() # default : orient='columns' # Output : '{"name":{"0":"Jack","1":"Ace"},"age":{"0":26..
위와 같은 엑셀 파일이 있을 때, pandas로 쉽게 읽고, 처리하는 방법에 대해 알아보겠습니다. 두 사진 모두 Pandas에선 Multiindex 형태라고 지칭합니다. 좀 더 자세히 말하자면, 첫 번째 엑셀은 Multi column 형태입니다. 즉, 열(column)이 여러 계층(Multiple)으로 이루어져 있습니다. 두 번째 엑셀은 Multi index 형태입니다. 행과 열 앞부분인 인덱스(index) 부분이 여러 계층(Multiple)으로 이루어집니다. 위의 예시를 직접 pandas로 읽고 처리하며 자세히 알아보겠습니다. 읽기 첫 번째 엑셀(Multi Column) 데이터 프레임 역시 Multi Column을 갖는 것을 볼 수 있습니다. pd.read_excel함수로 엑셀을 읽을 수 있습니다. p..