data science를 위한 핵심 통계학 (4) 썸네일형 리스트형 심화 가설 검정 심화 가설 검정 파트까지 들음으로써, 기초 통계학 강의를 다 들었다. 오늘 배운 내용 중 인상 깊었던 주제는 스튜던트 T 분포다. 이전까진 모집단의 모수치를 알고, 충분한 표본이 있어야 통계적인 분석을 할 수 있다고 생각했는데, 스튜던트 T 분포는 모집단의 표준편차를 모르고, 표본수가 30개 미만일 때 사용할 수 있다. 실생활에 많이 도움이 되리라 느꼈던 다른 하나는 유의확률의 오용과 남용의 위험성이다. 회사나 연구자들 중 이를 악용하는 사람들이 있다. 유의확률은 규모를 나타내지 않는다. 즉 정확히 얼마나 증감했는 지 알려주지 않는다. 예를 들어 집중력을 향상하는 약이 신뢰도 99%로 연구를 통과했다고 하자. 그렇다면 이 약은 집중력을 향상 시켜준다. 그런데 얼마나 향상 시켜주는 지는 알지 못한다. 0... 통계적 유의성 통계적 유의성이 정확히 뭔지 설명하긴 어렵지만 어느정도 이해는 했다. 강의에서도 직관적인 이해를 한 후, 여러 예제를 풀며 개념을 확립하는 방식을 사용했다. 내가 생각하는 통계적 유의성은 그 값보다 작으면 가설을 폐지할 수 있는 도구다. 중심 극한 정리가 여기서도 사용되는 걸 보면서, 정말 유용하다고 생각했다. 중심극한 정리 배운내용 - 중심극한 정리 - z-score - 실제 사례에 적용해보기 강의가 정말 매우 흥미롭다. 특히 중심극한 정리는 정말 신기하다. 모집단과 상관없이 충분히 많은 표본을 추출하면, 표본 평균의 표본 분포는 정규 분포와 같다. 이 것은 매우 강력해서 현실에서도 다양한 분야에서 사용할 수 있다. 정말 재미있는 강의다. 분포 배운 내용 - 연속 vs 불연속 - 분포, 표준 편차, 정규분포, 편포도, 평균, 중간값, 최빈값 이전 1 다음