#### normal distribution ( mean=80, sd=10 ) ####
# 1. x의 범위 정하기 **** 많이 빼먹는다**** sd가 10이면, 평균 80좌우로 3~4배 왔다리 갔다리 면 충분하다.
x <- seq(40, 120, length = 300) # ***연속 정수는 c(40:120) 겠지만, 연속실수범위는 seq(from=,to=, by=증감도, length = 구간 개수 )
x
# 2. dnorm(구간속 x값, mean, sd) :  x구간 속 300개의 각 값들에 대한 정규분포 만들어주기
y <- dnorm(x, mean = 80, sd = 10)
# 3. 단순 plot(x, y)그리기
plot(x, y) # 동그라미들은 x에 대응하여 300개..
plot(x, y, type = "l") # 동그라미를 type="l"로 라인으로
plot(x, y, type = "l", col = "red") # 색도..

image

# plot(type="l") 대신 lines()함수로 바로 그릴 수 있다.
# sd 5
#lines(x, dnorm(x, mean = 80, sd = 5), col = "blue")

image


# 1. dnorm() : x범위에 대해 해당 정규분포의 <전체 분포>를 그릴 때 y값
# 2. pnorm() : x범위에 대해 해당 정규분포의 <넓이 = percentage>를 구할 때
#   - %는 왼쪽끝에서 시작한 영역이 반환됨. (lower.tail = TRUE 가 default)
# 3. qnorm() : 정규분포의 영역에 대해, x값(cutoff)를 구할 때
#   - %, 넓이를 인자로 넣을 땐, 1보다 작은 소수점으로 대입

# 4. rnorm() : 임의의 정규분포


#### 문제1. 65 ~ 75까지는 몇 확률(% ->pnorm, 넓이*100)에 해당할까? ####
# 참고) 정규분포의 일부영역을 그래프로 그리기
x_cf <- seq(65, 75, length = 200) # 해당영역 x범위 정하기
y_cf <- dnorm(x_cf, mean = 80, sd = 10) # y에 똑같은 정규분포 그리기
polygon( c(65, x_cf, 75), c(0, y_cf,0 ), col="gray") # polygon(c( 아래변 ), c(덮는 윗변), col="배경색")

image

# ***정규분포의 %, 넓이를 구하는 문제이므로 pnorm()을 사용한다.
# pnorm( %(넓이*100), mean, sd)
# 큰 면적 - 작은면적의 원리이다.

pnorm(75, mean = 80, sd = 10) # 0.308
pnorm(65, mean = 80, sd = 10) # 0.066
pnorm(75, mean = 80, sd = 10) - pnorm(65, mean = 80, sd = 10) # 0.2417



#### 문제2. x=92보다 클 때의 확률(%->pnorm)은?
# -> 92일의 pnorm을 구한 다음, 1에서 빼자.
pnorm(92, mean = 80, sd = 10) # 0.884
1 - pnorm(92, mean = 80, sd = 10) # 0.1150697
# *** 오른쪽끝에서 92까지의 면적을 구하고 싶다면 lower.tail = FALSE로 준다)
pnorm(92, mean = 80, sd = 10, lower.tail = FALSE) # 0.1150697



#### 문제3. x가 68보다 작을때의 확률은? ####
pnorm(68, mean = 80, sd = 10) # 0.115069


#### 문제4. 하위 30%를 잘라내는 cutoff( % -> x구하기 : qnorm)는?
# *** 정규분포 영역에 대한 -> x값을 구할때는 qnorm()을 사용한다.
# *** 첫번째 인자에서는 영역의 %-> /100 이므로 1보다 작은 소수점으로 넣어줘야한다.

qnorm(0.3, mean = 80, sd = 10) # 30% -> 0.3으로 대입할 것!**** : 74.75


#### 문제5. 하위 80% 자르는 지점은?
qnorm(0.8, mean = 80, sd= 10) # 88.41


#### 문제6. 중간 60%를 자르는 지점은?
# 하위20%, 상위20 **= 하위80% 을 찾는다...
qnorm(0.2, mean = 80, sd= 10) # 71.58
qnorm(0.8, mean = 80, sd= 10) # 88.41


#검산해보기*** 2개의 값이 대칭(하위20, 상위20)인가?
# 평균은 80에서 하위20%의 x값을 빼면,, 그 절대값이 똑같아야함.
80 - qnorm(0.2, mean = 80, sd= 10) # 8.416
80 - qnorm(0.8, mean = 80, sd= 10) # -8.416

+ Recent posts