본문 바로가기

분류 전체보기209

[응용통계학] 2장. 자료의 요약 및 정리(2) - 도표를 이용한 자료의 정리 도표를 이용한 자료의 정리 이전 포스팅에서는 자료의 특성을 몇 개의 숫자로 요약하였다면, 이번엔 자료를 도표나 그림을 이용하여 정리 1. 도수분포표와 상대도수분포표 자료의 개수가 많으면, 자료를 몇 개의 그룹으로 나누어, 각 그룹에 해당하는 자료의 수를 통해 요약하는 것이 편리 대표적인 예가 도수분포표와 상대도수분포표 예를 들어, 15세대로 구성된 한 구역의 세대별 자녀수를 조사하여 다음과 같은 자료를 얻었다면, 0,1,3,1,2,0,4,6,3,2,2,1,0,1,2 위 자료는 0에서 6까지 7가지의 종류로 구성되어 있으며, 아래의 표로 요약 가능함. 계급(자녀수) 도수 0 3 1 4 2 4 3 2 4 1 5 0 6 1 합계 15 1) 도수분포표 계급(class): 자료를 요약하기 위해 사용하는 값, 위 .. 2021. 2. 28.
[응용통계학] 2장. 자료의 요약 및 정리(1) - 자료의 요약 1. 모집단과 표본 - 원소: 통계적 자료를 얻기 위한 조사에서 조사대상이 되는 개체 하나하나를 칭함 - 모집단(population): 원소 전체의 모임 - 무한모집단(infinite population): 원소의 수가 무한인 모집단, 유한모집단(finite poluation): 원소의 수가 유한인 모집단 - 표본(sample): 모집단의 일부 - 전수조사(census): 모집단 원소 전체를 빠짐없이 모두 조사하는 방법. - 모집단 자료: 전수 조사를 통해 얻은 자료 - 표본조사(sampling survey): 모집단의 일부를 조사하는 방법 - 표본 자료: 표본조사를 통해 얻은 자료 모집단의 특성을 가장 잘 반영하는 자료는 당연히 모집단 자료이겠지만, 무한모집단의 경우, 전수조사가 불가능하며, 유한모집단.. 2021. 2. 23.
[응용통계학] 1장. 통계학 개요 통계학은 어떤 학문인가? 특정 목적을 이루기 위하여 올바른 자료를 수집하고 생성하는 효과적인 방법을 연구하고, 이러한 자료를 효율적으로 정보화하여 이를 바탕으로 과학적인 의사결정 방법을 연구하고 개발하는 학문 통계적 자료(statistical data) 통계적 연구를 목적으로 수집한 자료 - 모집단 자료(population data): 조사대상 전체에서 수집한 자료 - 표본 자료(sample data): 조사대상의 일부에서 수집한 자료 통계학의 종류 - 기술통계학(descriptive statistics): 자료를 정리하고 요약하여 그 특성을 정확하게 기술하는 기법을 연구하는 분야 대표값과 산포도를 이용한 자료의 요약기법, 다양한 도쵸의 활용법, 확률변수를 활용하여 자료의 분포를 기술하는 방법 등 - 추.. 2021. 2. 21.
NIH dataset unzip/ load/ handling 이번 포스팅의 목적 - NIH CXR Dataset Info 에서 데이터 셋의 readme를 해석하여 얻은 데이터에 대한 기초 정보를 기반으로, 데이터를 다운로드하여 1) 압축을 풀고, 2) 주피터 노트북에서 데이터를 로드한 뒤, 3) 데이터를 간단하게 핸들링하여 파악해보자!! 0. 데이터 다운로드 NIH cxr dataset 데이터 경로에 들어가면 readme를 비롯한 다양한 파일들과 영상 정보가 존재함을 알 수 있다. 전체 데이터를 다운로드하려니, 용량이 너무 커서 다운로드되지 않는다고 하여, 필요한 정보를 로컬로 일부 다운로드하여 핸들링해본 뒤, 나머지도 다운로드하기로 결심하였다. 현재 다운로드한 파일의 정보: - train_val_list.txt & test_list.txt - images - i.. 2021. 2. 21.
NIH Chest X-ray Dataset info 이번 포스팅의 목적 - NIH Chest X-ray dataset를 이용하여 질병 분류 딥러닝 모델을 구축하고, 데이터를 핸들링하기 전, readme를 해석하여 데이터에 대한 기초 정보를 얻자!! 데이터는 어디에? - 데이터 관련 article: www.nih.gov/news-events/news-releases/nih-clinical-center-provides-one-largest-publicly-available-chest-x-ray-datasets-scientific-community NIH Clinical Center provides one of the largest publicly available chest x-ray datasets to scientific community The data.. 2021. 2. 20.