본문 바로가기

분류 전체보기207

[응용통계학] 4장. 확률변수와 확률분포 응용통계학 4장 확률변수와 확률분포는 다음 목차로 구성 4.1 확률변수 4.2 이산형 확률분포 4.3 연속형 확률분포 4.4 결합확률분포 4.5 주변확률분포 4.6 두 확률변수의 독립성 4.7 확률변수의 기대값 4.8 확률변수의 분산 4.9 공분산과 상관계수 4.10 기대값, 분산의 성질 4.1 확률변수 확률 변수 개념이 필요한 이유를 예로 들어 이해해보자. 1) 표본공간의 각각의 표본점을 하나의 실수로 대응시키면, 표본공간의 표현의 임의성을 배제할 수 있음. 1개의 동전을 1회 던지는 실험에서 앞면이 나타나는 경우를 표본점 H, 뒷면이 나타나는 경우를 표본점 T로 표기하면, 표본공간 S = {H, T} 로 표기할 수 있음. 그러나 표현에 따라 H와 T를 각각 앞, 뒤로 표기 가능하며, 이런 경우 S =.. 2021. 3. 28.
[Tesseract] 이미지 텍스트 파싱 Tesseract(테서렉트) 광학 문자 인식 엔진. 무료 소프트웨어이며, Google에서 개발 후원 영상 내 문자를 인식하는 OCR 엔진으로, pip, brew 등을 통해 설치 가능 - homebrew 를 이용한 tesseract 설치 brew install tesseract - tesseract 설치 및 버전 확인 tesseract -v - 설치 후 텍스트 파싱 코드 tesseract [이미지경로] stdout 2021. 3. 22.
[응용통계학] 3장. 확률 응용통계학 3장 확률은 다음의 목차로 이루어져 있다. 3.1 표본공간과 사상 3.2 사상의 확률 3.3 확률법칙 3.4 조건확률 3.5 베이즈 정리 3.1 표본공간과 사상 확률의 두 가지 전제조건 i ) 어떠한 '실험이나 조사'가 있어야 함 ii ) 실험이나 조사의 '결과'가 있어야 함 1) 표본공간과 표본점 - 표본공간(Sample Space): 어떤 실험이나 조사에서 얻을 수 있는 '모든 결과의 집합', S로 표기 - 표본점(Sample Point): 표본공간에 속하는 각각의 원소 - 표본공간은 표본점의 유한성에 따라 유한표본공간(finite sample space): 표본점의 개수가 유한인 공간 무한표본공간(infinite sample space): 표본점의 개수가 무한인 공간 - 표본공간은 표본점.. 2021. 3. 20.
[응용통계학] 2장. 자료의 요약 및 정리(3) - 도표를 이용한 자료의 정리_박스 플롯(상자그림) 상자그림(box plot) 자료의 사분위수, 좌우로의 치우침, 꼬리의 상태 등 자료의 분포적 특성을 파악하기 위해 사용 이상점을 분류하거나 여러 종류의 자료의 특성을 동시에 비교할 수 있음 * 용어 정리 - 스텝(step): 사분위편차(IQR = Q3 - Q1)의 1.5배 - 안 울타리(inner fence): 제1, 3 사분위수에서 1스텝 바깥쪽 값 - 아래쪽 안 울타리(lower inner fence): f1 = Q1 - 1 x 스텝 - 위쪽 안 울타리(upper inner fence): f2 = Q3 + 1 x 스텝 - 바깥 울타리(outer fence): 제1, 3 사분위수에서 2스텝 바깥쪽 값 - 아래쪽 바깥 울타리(lower outer fence): F1 = Q1 - 2 x 스텝 - 위쪽 바깥.. 2021. 3. 8.
[응용통계학] 2장. 자료의 요약 및 정리(2) - 도표를 이용한 자료의 정리 도표를 이용한 자료의 정리 이전 포스팅에서는 자료의 특성을 몇 개의 숫자로 요약하였다면, 이번엔 자료를 도표나 그림을 이용하여 정리 1. 도수분포표와 상대도수분포표 자료의 개수가 많으면, 자료를 몇 개의 그룹으로 나누어, 각 그룹에 해당하는 자료의 수를 통해 요약하는 것이 편리 대표적인 예가 도수분포표와 상대도수분포표 예를 들어, 15세대로 구성된 한 구역의 세대별 자녀수를 조사하여 다음과 같은 자료를 얻었다면, 0,1,3,1,2,0,4,6,3,2,2,1,0,1,2 위 자료는 0에서 6까지 7가지의 종류로 구성되어 있으며, 아래의 표로 요약 가능함. 계급(자녀수) 도수 0 3 1 4 2 4 3 2 4 1 5 0 6 1 합계 15 1) 도수분포표 계급(class): 자료를 요약하기 위해 사용하는 값, 위 .. 2021. 2. 28.
[응용통계학] 2장. 자료의 요약 및 정리(1) - 자료의 요약 1. 모집단과 표본 - 원소: 통계적 자료를 얻기 위한 조사에서 조사대상이 되는 개체 하나하나를 칭함 - 모집단(population): 원소 전체의 모임 - 무한모집단(infinite population): 원소의 수가 무한인 모집단, 유한모집단(finite poluation): 원소의 수가 유한인 모집단 - 표본(sample): 모집단의 일부 - 전수조사(census): 모집단 원소 전체를 빠짐없이 모두 조사하는 방법. - 모집단 자료: 전수 조사를 통해 얻은 자료 - 표본조사(sampling survey): 모집단의 일부를 조사하는 방법 - 표본 자료: 표본조사를 통해 얻은 자료 모집단의 특성을 가장 잘 반영하는 자료는 당연히 모집단 자료이겠지만, 무한모집단의 경우, 전수조사가 불가능하며, 유한모집단.. 2021. 2. 23.