본문 바로가기

STUDY

(136)
[Pythonic Code] Assignment-Basic Linear Algebra(1) * 부스트코스 "머신러닝을 위한 파이썬"를 듣고 작성한 포스트입니다. https://github.com/TEAMLAB-Lecture/AI-python-connect/tree/master/lab_assignments/lab_1 GitHub - TEAMLAB-Lecture/AI-python-connect Contribute to TEAMLAB-Lecture/AI-python-connect development by creating an account on GitHub. github.com 1. vector_size_check # vector간 연산이 가능한 사이즈인지 확인한 후 True/False 반환하는 함수. 위 코드를 보면 *vector_variables는 [1,2,3],[2,3,4],[5,6,7]이 ..
Deep Learning 평가하기 * 혼동행렬 Confusion Matrix : 모델 성능 평가에 사용 * 정확도 Accuracy 전체 데이터 중 실제 데이터 정답과 모델 예측 정답이 같은 비율 ACC = (TP+TN)/(TP+TN+FP+FN) 데이터 불균형할 때 사용하면 잘못된 지표로 사용될 수 있음. * 정밀도Precision 와 재현율Recall Precision : True라고 예측한 정답 중 실제 True인 비율 Recall : 실제데이터가 True인 것 중 모델이 True라고 예측한 비율 Precosion = TP/(TP+FP) Recall = TP/(TP+FN) * F1-Score 정밀도 재현율의 중요성이 같다고 가정하고, 두 지표의 조화 평균으로 새로운 지표를 ㅔㅈ공. F1 = 2*((Precosopm*Recall)/(Pr..
Deep Learning 학습하기 * Hyper Parameter 경험에 의해 결정되는 요소 learning rate, batch size, epoch 등 적합한 값을 찾기 위해 반복적인 실험과 많은 시간 투자가 필수이다. * batch & batch size data를 한개만 사용하기엔 정확한 정답을 찾는데 방해가 될 수 있다. 그러나, 전부를 사용하기엔 시간이 너무 오래 걸리므로 batch를 사용한다. 1000개 data의 batch가 10이면, 각 batch는 100개의 data보유. batch size는 기존의 예시를 사용하거나 2의 제곱수를 사용. * 에폭 Epoch & 스텝 Step Epoch : 전체 데이터를 활용하여 학습하는 횟수 전체 데이터를 10회 반복? 10에폭 Step : 모델이 가진 weight를 1회 update..
Deep Learning 데이터 준비하기 이번 포스팅은 간단 개념만 정리한 것입니다! * Class Imbalance 클래스 불균형 - 은행 거래 사기, 희귀 질병, 기계 분량음 등의 사례 - 이상 탐지 Anomaly Detection * UnderSampling 과소표집 & OverSampling 과대표집 - 과소표집 : 다른 class에 비해 상대적으로 많이 나타나있는 class개수를 줄이는 것 - 과대표집 : 개수가 적은 클래스를 복제하는 것 * 회귀 Regression - 여러개 특징을 통해 연속적인 숫자로 이루어진 정답 예측 - 영화 관객수, 축구선수연봉, 주식 가격 등 - 0과 1 예측하는 Logistic Regression => 이진 분류...? * 분류 Classification - 이진분류, 다중분류, 다중레이블분류 * 원핫 인..
딥러닝에 들어가기 앞서,, * ML Process 문제정의&data 준비 -> 학습 -> 추론&평가 * 성능 우수한 모델 모델을 정의해보며 경험에 의해 찾아간다. * 문제 정의 탐색적 데이터 분석(EDA) 활용하자. 무엇에 사용할거냐? 어떻게 사용할거냐? 사용자는 누구인가? 성능평가는 어떤방식을 이용하나? * 데이터 전처리! 데이터 셋의 domain확인해서 사용하기 충분한 데이터 준비하기 * 모델 선택 어떤 data 적용할 것이냐? 적용 사례가 있는가? 깊이는 어느 정도인가? 환경은 어떤 환경인가? optimizer? loss function? GPU 메모리? * SOTA 모델 활용하자 이미지? VGG, ResNet, Inception 자연어처리? ELMO, BERT, GPT => 전이 학습으로 해보기 * 모델 선택, hyper ..
[프로그래머스] 수박수박수박수 * 문제 설명 길이가 n이고, "수박수박수박수...."와 같은 패턴을 유지하는 문자열을 리턴하는 함수, solution을 완성하세요. 예를 들어 n이 4이면 "수박수박"을 리턴하고 3이라면 "수박수"를 리턴하면 됩니다. * 제한 조건 n은 길이 10,000이하인 자연수입니다. * 생각 해보기 for문: i를 n까지 1씩 증가시킨다. if문: i가 짝수면 "수" 출력 else문: i가 홀수면 "박" 출력 * 코드 * 다른 코드들 * 사용된 파이썬 코드 정리 1. 파이썬 슬라이싱(slicing) 연속적인 객체에 범위를 정해서 새로운 객체를 생성하는 것.(일부분 복사) Ex[start:end:step] start : 슬라이싱 시작 위치 end : 슬라이싱 끝나는 위치 (end 포함 안함!!) step : 몇개..
CSS 기억 요소 ◎ 유형 선택기 1. 요소 선택기(태그/유형 선택기) 지정된 유형의 모든 HTML 요소 P =================== 선택한다. 2. ID selector 지정된 ID가 있는 페이지의 요소 HTML 페이지에서 각 id 값은 고유해야 함 #my-id =================== 또는 선택 3. Class selector 지정된 클래스가 있는 페이지의 요소 동일한 클래스의 여러 인스턴스가 한 페이지에 나타날 수 있음. .my-class =================== 하고선택 4. Attribute selector 지정된 속성이 있는 페이지의 요소 img[src] ================== 선택. 선택 하지 않음. 5. Pseudo-class selector 지정된 요소이지만 지정..
[핵심 머신러닝] 머신러닝 및 인공지능 개요 ****공부한 강의 : https://youtu.be/pFyFHUmxgu0 [핵심 머신러닝] 머신러닝 및 인공지능 개요 ◎ 머신러닝(Machine Learning) 인간이 개발한 알고리즘을 컴퓨터 언어를 통해 기계에게 학습시키는 행위 Machine learned by computer languages(인간과 컴퓨터가 소통하기 위한 수단) //C++, Python, Java, Matplotlib, R, Python 등 to perform the algorithm(문제를 해결하기 위한 방법들의 체계적인 모임) //Backpropagation, Gradient 등 created by numan ◎다변량 데이터 2개 이상의 데이터가 있으면 "다변량 데이터" 라고 부름. 하나면? 단변량 데이터 관측치: 샘플(고객..

728x90