본문 바로가기
728x90
반응형

Programming52

[Data Science] r^2를 계산하는 두 가지 방법!! (Python 코드 포함) Introduction 회귀모델을 평가할때 주로 r^2 값을 계산한다. 이것은 대략적으로 참(true)값과 예측값(predicted) 사이의 상관관계의 정도를 평가한다고 이해할 수 있지만 실제 계산은 이것보다는 약간 복잡하다. 또한, r^2에 대한 다른 두 개의 정의가 존재한다. 물론 결과는 동일하지만 계산과정이 다르기 때문에 직접 계산을 해보고 r^2값의 의미를 생각해보는 것이 좋을 것 같다. 이 포스팅에서는 다음의 두 방법으로 r^2를 이해해보고자 한다. Pearson's correlation coefficient Coefficient of Determination r^2 Preprocessing 1. Import libraries import os import pandas as pd import n.. 2022. 6. 11.
Relative Standard Deviation(RSD) 란? (ft. 간단한 Python 예제) Relative Standard deviation(RSD)는 해석하자면 '상대적인 표준편차'이고, 다른 말로는 Coefficient of variation (CV) (변화의 계수)라고 하기도 한다. 이것은 주로 측정의 반복성(Repeatability)을 테스트하는 데 사용된다. 특히, 반도체 분야의 계측에서 wafer의 하나의 die에 대한 측정을 여러 번 반복하여 데이터를 얻은 후 그 측정값들의 RSD를 계산하여 계측의 정밀도(precision)를 평가하게 된다. 따라서, RSD가 작을 수록 정밀도가 높은 계측이 된다. 가령 측정값이 모두 같게 나왔다면, RSD=0%이 될 것이다. 이는 상대적 표준편차가 0이고 계측의 정밀도가 아주 높다는 뜻이다. 이것이 일반적인 표준편차하고 어떻게 다른지는 정의를 보.. 2022. 5. 9.
[Python] Conda 가상환경을 다른 컴퓨터로 옮기기 (ft. 윈도우 버전) 파이썬은 일반적으로 가상환경에 설치하고 실행한다. 이렇게 하는 이유는 파이썬 프로그램의 버전과 다른 여러 API의 버전 관리를 위해서이다. 가상환경을 이용하면 버전이 다른 프로그램을 하나의 컴퓨터에 설치하고 필요에 맞게 환경을 바꿔서 작업할 수 있다. 이것이 파이썬 가상환경의 가장 큰 장점이다. 주로 Conda를 이용해 가상환경을 구축하게 된다. Conda는 패키지 관리가 편할 뿐만 아니라 각종 에디터도 제공하기 때문에 편리한 프로그램이다. 이렇게 Conda 환경에서 작업을 하다, 다른 컴퓨터로 옮겨서 작업을 해야 할 일이 생기기도 한다. 이럴 땐, 원래 가상환경에 있던 모든 프로그램을 다시 설치해야 하기 때문에 여간 귀찮은 일이 아닐 수 없다. 이럴 때 원래의 가상환경을 그대로 옮기면 일이 훨씬 줄어들.. 2022. 5. 4.
[Python] Pandas groupby 결과를 list의 dictionary로 바꾸기!! 여러 행으로 구성된 데이터를 다루다 보면, 어떤 특정한 행에 의해 데이터를 정렬해야 하는 일이 빈번하게 발생한다. 이것은 pandas의 groupby로 아주 간단하게 처리할 수 있다. 우선 간단한 데이터를 만들어보자 Column1 Column2 Column3 0 23 1 1 5 2 1 2 3 1 19 5 2 56 1 2 22 2 3 2 4 3 14 5 4 59 1 5 44 1 5 1 2 5 87 3 이것은 data라는 이름의 텍스트 파일로 만들어 읽어, dataframe으로 변환해보자. with open (path to data.txt) as f: lines = f.readlines() data = [] for line in lines: data.append([ int(el) for el in line... 2022. 5. 2.
728x90
반응형