본문 바로가기
728x90
반응형

Programming/Machine Learning8

[Data Science] r^2를 계산하는 두 가지 방법!! (Python 코드 포함) Introduction 회귀모델을 평가할때 주로 r^2 값을 계산한다. 이것은 대략적으로 참(true)값과 예측값(predicted) 사이의 상관관계의 정도를 평가한다고 이해할 수 있지만 실제 계산은 이것보다는 약간 복잡하다. 또한, r^2에 대한 다른 두 개의 정의가 존재한다. 물론 결과는 동일하지만 계산과정이 다르기 때문에 직접 계산을 해보고 r^2값의 의미를 생각해보는 것이 좋을 것 같다. 이 포스팅에서는 다음의 두 방법으로 r^2를 이해해보고자 한다. Pearson's correlation coefficient Coefficient of Determination r^2 Preprocessing 1. Import libraries import os import pandas as pd import n.. 2022. 6. 11.
Relative Standard Deviation(RSD) 란? (ft. 간단한 Python 예제) Relative Standard deviation(RSD)는 해석하자면 '상대적인 표준편차'이고, 다른 말로는 Coefficient of variation (CV) (변화의 계수)라고 하기도 한다. 이것은 주로 측정의 반복성(Repeatability)을 테스트하는 데 사용된다. 특히, 반도체 분야의 계측에서 wafer의 하나의 die에 대한 측정을 여러 번 반복하여 데이터를 얻은 후 그 측정값들의 RSD를 계산하여 계측의 정밀도(precision)를 평가하게 된다. 따라서, RSD가 작을 수록 정밀도가 높은 계측이 된다. 가령 측정값이 모두 같게 나왔다면, RSD=0%이 될 것이다. 이는 상대적 표준편차가 0이고 계측의 정밀도가 아주 높다는 뜻이다. 이것이 일반적인 표준편차하고 어떻게 다른지는 정의를 보.. 2022. 5. 9.
1D Convolutional Neural Network 이해하기 (CNN in numpy & keras) 목차 도입 머신러닝 분야에서 예측 모델을 만드는데 가장 많이 사용되는 신경망 모델은 바로 Convolutional Neural Network(CNN)일 것이다. CNN은 특히 이미지 분류에서 높은 정확도를 보이며 많은 예측 모델의 토대를 이루었다. 반면, 1차원 CNN은 이미지가 아닌 시계열 분석 (time-series analysis)나 텍스트 분석을 하는데 주로 많이 사용된다. 여기에서 1차원이라는 것은 합성곱을 위한 커널과 적용하는 데이터의 sequence가 1차원의 모양을 가진다는 것을 의미한다. 실제 문제에 적용하기에 앞서, 이 포스팅에서는 1차원의 합성곱이 어떻게 이루어지는지 numpy와 keras.layers.Conv1D 를 이용해 알아보도록 하겠다. 우선 필요한 라이브러리를 import한다.. 2021. 8. 27.
Feature Importance with Information Gain Table of Contents 1 Description of Problem2 Load data3 Visualizing sensor signals4 Split dataset into features and target5 Clustering algorithm5.1 Principal Component Analysis5.2 k-means clustering5.3 Visualizing clustering results6 Ranking sensors6.1 Helper functions6.2 Information Gain6.3 Ranking Sensors Problem6.3.1 Check how it works (for sensor 0)6.3.2 IG scores for all sensors6.4 Alternati.. 2021. 8. 21.
728x90
반응형