본문 바로가기

확률론(in R)

(10)
[R] 몬테카를로 시뮬레이션(Monte Carlo Simulation) 어떤 통계책을 보아도 처음에는 확률을 끼고 시작한다. 일단 내가 느끼기에는 통계학 중 상당히 지루하고 어렵게 생각한다면 또 끝도 없이 어려운 파트가 제일 첫 파트 확률 파트가 아닐까싶다. 대학원 수리통계학 수업을 복습하면서 확률계산에 도움이 되는 것 같아 포스팅으로 남긴다.사실 위 몬테카를로 시뮬레이션 방법은 일부 수리통계학 교재에서 소개하긴 한다.밑에 예시로 든 hogg 수리통계학 교재에서도 위 시뮬레이션에 대한 내용이 있으니 궁금한 사람들은 찾아보길 권장한다. 위 시뮬레이션과 비슷한 방식으로https://pastryofjsmath.tistory.com/3 확률론2-1 : 코딩을 활용한 확률계산[in r]-1R코딩으로 기본적인 확률계산을 해보겠습니다.install.package("dplyr")insta..
Markov Chain-1 마르코프 체인의 특성은 현시점을 기준으로 과거와 미래는 독립이라는 특성이 있습니다.간단하게 n차 전이확률 행렬은 n번 곱해주면 됩니다.n번을 계속 곱해주다 보면 P는 안정상태(수렴)에 들어가게 됩니다. 아래는 여러 행렬곱에 대해 각 파이를 구하는데 있어 어려움이 있기에 다음과 같이 나타냅니다. 아래는 왜 안정상태가 pi=pi*P인지 간단하게 써놨습니다. 만약 계수행렬이 뭔지 모른다면?https://pastryofjsmath.tistory.com/39 LA-2) 방정식 해의 존재 유무 판단(Augment matrix, rank)이번 포스팅은 고등학생분들에게도 강력추천합니다.수학문제를 풀다보면 연립방정식을 만나게 됩니다.그 연립방정식을 모두 x,y,z.. 해를 구해야 존재함을 알 수 있을까요?특히 고등학생분..
확률론1-2: 확률의공리와 덧셈법칙 확률론1과 이어집니다.https://pastryofjsmath.tistory.com/2 확률론1(표본공간,상호배반,확률적독립)-출처: AI소프트웨어학과 이두호교수님 강의파일pastryofjsmath.tistory.com'확률'의 공리는 확률 안에서는 불변의 규칙(공리)이라고 생각하시면 편합니다. empty set(=null set)의 확률이 0인 이유는 어느 확률(A)를 잡고 생각하시면 편합니다. 이러한 법칙을 보일 때는 항상 공리를 이용한다고 생각하시면 좋습니다. 상호배반이기에 합사상으로 쉽게 계산되는 모습입니다.2번도 동일합니다. 3번은 B를 기준으로 각 교사상의 합으로 나타납니다. 각 교사상의 교사상은 empty set이므로상호배반에 의해 쉽게 합으로 나타낼 수 있습니다.7번은 모든 사건이 상호배반..
확률론3-2 : 나이브 베이즈(Naive Bayes)분류기 [in r] 베이즈정리를 모르신다면 아래의 글을 보시길 권장합니다.https://pastryofjsmath.tistory.com/11 확률론3 - 베이즈정리(Bayes Theorem)나이브 베이즈 분류기법을 설명하기전에 베이즈 정리를 설명하려고 합니다.앞서 베이즈정리를 알기위해 사전지식으로 전확률(Total Prob.)과 분할(Partition)을 알아야합니다. 어려워 보여도 문제를pastryofjsmath.tistory.com 나이브 베이즈 분류기는 입력변수 간 서로 독림임을 가정으로 시작합니다조건부 확률의 조건부 독립이 성립해야 합니다.  분류모델 성능 측정으로 매우 유명한 타이타닉 데이터 셋으로 해보겠습니다. 제일 먼저, 나이브 베이즈 사용을 위한 패키지를 라이브러리를 해주어야합니다.install.package..
확률론3-1 : 베이즈정리(Bayes Theorem) 나이브 베이즈 분류기법을 설명하기전에 베이즈 정리를 설명하려고 합니다.앞서 베이즈정리를 알기위해 사전지식으로 전확률(Total Prob.)과 분할(Partition)을 알아야합니다. 어려워 보여도 문제를 풀면 금방 이해 될 것이다.결론적으로 전확률과 베이즈정리의 이용한 확률이 어떻게 다른지 알아야 한다. 전확률(Q1)에서는 불량품일 확률에만 포커스가 되어있고,베이즈정리(Q2)에서는 불량품인데 어디에서 온 불량품인 것인지를 묻고 있는 것이다. -출처: AI소프트웨어학과 이두호교수님 강의파일
R로 하는 확률 문제 풀이(수능 2024 확률과통계 26번) > coin coin [1] "H" "T" > omega26 omega26 c1 c2 c3 c4 1 H H H H 2 T H H H 3 H T H H 4 T T H H 5 H H T H 6 T H T H 7 H T T H 8 T T T H 9 H H H T 10 T H H T 11 H T H T 12 T T H T 13 H H T T 14 T H T T 15 H T T T 16 T T T T #카운팅함수 만들기. > countH countT omega26$H_sum omega26$T_sum omega26 %>% head() c1 c2 c3 c4 H_sum T_sum 1 H H H H 4 0 2 T H H H 3 1 3 H T H H 3 1 4 T T H H 2 2 5 H H T H 3 1 6 T H T ..
R로 하는 확률 문제 풀이(수능 2024 확률과통계 25번) 손 풀이는 다음과 같다. 간단한 문제 같은경우는 손으로 푸는게 확실히 빠른 경향이 있다. 아래는 R코딩의 풀이이다. 답은 당연히 같다. #install.packages("gtools") #library(gtools) > permu permu %>% View() > permu %>% head() [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 2 3 4 5 6 [2,] 1 2 3 4 6 5 [3,] 1 2 3 5 4 6 [4,] 1 2 3 5 6 4 [5,] 1 2 3 6 4 5 [6,] 1 2 3 6 5 4 #행렬 형태이므로, 데이터 처리를 위해서 데이터프레임으로 변환하자! > permu %% as.data.frame() > permu[permu[1]+permu[6]% nrow() [1..
확률론2-2 : 코딩을 활용한 확률계산[in r] # 3##### 파란 공 3개, 빨간 공 7개, 노란 공 4개, 녹색 공 6개가 # 들어 있는 바구니에서 공을 여섯개를 뽑을 때[컨비네이션]# 표본공간basket% data.frame() 그런데 combn함수는 행렬로 뱉어주고 위에는 데이터프레임으로 변환하였으나, 열로 데이터를 나타내준다.우리가 알고 있는 폼으로 변환하기 위해 전치를 시켜주자.omega3% t %>% data.frame()> # 색깔별로 공의 개수를 세는 함수> # 이것도 세는데 문자형이므로, 계산이 안된다. 함수를 이용하자!> countB countR countY countG # Pr{3B,3Y} B가 3개 그리고 Y가 3개일 확률> omega3$B % apply(1,countB)> omega3$R % apply(1,countR..