본문 바로가기
728x90
반응형

Programming52

[OpenCV] 이미지 이진화(Image binarization)를 이용한 image segmentation (Python) 이미지 이진화(image binarization)는 아래의 도식에서 보이듯이 여러 이미지 분리(image segmentation)의 기법 중 가장 간단한 방법이다. 이진화라는 용어로부터 알 수 있듯이 이 방법은 이미지 픽셀의 여러 값들을 0 또는 255, 이를 테면 물체와 배경을 0과 255 혹은 그 반대의 방식으로, 이 두 값만으로 이미지의 모든 픽셀 값을 변환하는 것이다. 이 방법은 픽셀값이 0~255 사이의 값을 가지는 흑백 이미지에만 적용할 수 있다. 픽셀값을 0과 255만으로 바꾸기 위해 thresh라는 임계값을 먼저 정해야 한다. 임계값 보다 큰 픽셀은 모두 0 그렇지 않으면 모두 255 이런 식으로 픽셀값을 변환하는 것이다. 임계값을 수동으로 혹은 알고리즘에 의해 자동으로 설정할 수 있다. .. 2021. 6. 28.
[Python] 압축 파일(zip) 다루기 (ft. 압축 풀지 않고 데이터 읽기) 목차 많은 양의 데이터를 이동하거나 보관할 때 주로 이들을 압축하며, zip과 tar 확장자가 대표적이다. 최근 시그널 프로세싱에 관련된 데이터 분석을 하면서 많은 실험 데이터를 다루게 되었다. 이것들은 실험의 조건에 따라 여러 그룹으로 나누어져 있고, 각 조건마다 수십 개의 파일들이 있어 데이터를 옮기는 데만 상당히 많은 시간이 걸리게 되었다. 클라우딩 스토리지를 사용하면 좋겠지만, 아직 그 단계의 시스템이 구축된 것이 아니어서 일단 압축 파일의 형태로 데이터를 옮기고 읽어 들이기로 하였다. 이번 포스팅에서 python에서 zip 파일의 압축을 풀고 데이터를 읽는 법에 대해서 정리해보았다. 또한, 압축을 풀지 않고 내부 파일의 데이터를 로딩하는 방법에 대해서도 정리했다. 특히, 후자의 경우는 디스크 사.. 2021. 6. 14.
[matplotlib] plt.boxplot 박스색 바꾸기 Python의 matplotlib 라이브러리를 이용해 데이터를 시각화 할 때 boxplot이 많이 사용된다. 특히, 이 boxplot은 데이터의 분포에 대한 통계 정보를 포함해 그릴수 있다는 장점이 있다. 2021.05.03 - [Programming/Machine Learning] - Seaborn boxplot으로 five-number summary 이해하기 2020.11.02 - [Programming/Tips] - [seaborn] 그림의 폰트 사이즈 바꾸기 이 포스팅에서 boxplot의 그림을 더 보기 좋게 꾸미는 방법, 특히, 박스별 다르게 색을 지정하는 것에 대해서 정리해 보았다. Table of Contents 1 load modules 2 create data 3 boxplot 3.1 박.. 2021. 6. 5.
[Python] pandas 파일 로딩 속도 비교 (CSV vs. Pickle 포맷) [Python] Pandas 파일 로딩 속도 비교 (CSV vs. Pickle) 0. Motivation 시그널 프로세싱에 관련된 데이터를 분석하게 되었다. 어떤 시그널이 다양한 조건에서 시간에 따라 기록된 데이터를 분석하여, 네트워크 모델을 세우는 것이 목표이다. csv 파일로 저장된 많은 데이터가 내 앞에 떨어졌다. 얼핏 보니 데이터가 아주 엉망이다. 시그널을 기록한 시간의 간격이 일정하지 않고 제멋대로다. 설상가상으로 어떤 데이터셋은 중간에 중복되어 기록된 것들도 눈에 띈다. 모델링까지 가는 길이 쉽지는 않아 보인다. 데이터를 cleaning up 하는 코드를 먼저 만들어 보기로 했다. 그리고 정제된 데이터를 따로 저장하여, 앞으로의 분석에서 바로 이용할 수 있게 하는 것이다. 갑자기 궁금해졌다. .. 2021. 6. 2.
728x90
반응형