이 문서는 대한민국에서 현재 운영되는 복권 "로또 6/45" 에 대해 통계적·수학적 관점에서 필요한 모든 배경 지식을 한 페이지에 정리한 교육용 가이드입니다. 당첨 번호를 예측하거나 구매를 권유할 목적이 아니며, 게임의 작동 원리와 확률 구조를 투명하게 이해함으로써 이용자가 본인의 판단으로 합리적인 결정을 내릴 수 있도록 돕는 것이 목적입니다.
대한민국의 근대식 복권 역사는 1969 년 한국주택은행이 발행한 주택복권 에서 시작합니다. 매주 100 원에 판매되던 이 복권은 주택 건설 기금을 마련하는 공공 목적 자금 조달 수단으로 설계되었고, 수십 년간 "복권" 하면 떠올리는 대표 이미지로 자리 잡았습니다.
"숫자형 복권" 의 본격적인 시작은 2002 년 12 월 7 일 1 회차 추첨이 이루어진 "로또 6/45" 입니다. 이전의 즉석식 복권과 달리, 로또 6/45 는 이용자가 직접 번호를 고를 수 있고, 당첨금이 누적(rollover) 되는 구조라서 회차별 당첨금 변동폭이 크다는 특징이 있습니다. 초기에는 여러 은행·기관 컨소시엄이 위탁 운영했고, 2013 년부터는 나눔로또, 그리고 2018 년 12 월부터는 동행복권 이 공공기관 위탁으로 운영을 이어받았습니다.
운영 주체가 여러 번 바뀌는 동안에도 게임의 기본 규칙 — 1 부터 45 까지 중에서 6 개 번호를 맞히는 방식 — 은 출시 첫 회차부터 단 한 번도 바뀌지 않았습니다. 이 점이 역대 회차 데이터의 시계열 비교를 가능하게 만드는 중요한 전제입니다.
로또 6/45 의 규칙은 지극히 단순합니다. 이용자는 1 부터 45 까지의 정수 중 서로 다른 6 개 를 선택합니다. 각 회차 토요일 저녁 TV 생중계 추첨에서 기계식 추첨기가 공(ball) 을 하나씩 총 7 개 뽑으며, 먼저 나온 6 개가 "당첨 번호", 마지막 7 번째가 "보너스 번호" 입니다. 이용자의 선택과 추첨 결과가 얼마나 겹치는지에 따라 1 등부터 5 등까지 등수가 결정됩니다.
한 게임의 가격은 1,000 원 이며, 한 장의 복권에는 최대 5 개 게임(A~E) 을 담을 수 있습니다. 번호를 직접 고르는 "수동" 과 컴퓨터가 무작위로 골라주는 "자동", 그리고 두 방식을 혼합한 "반자동" 이 있으며, 세 방식 모두 확률 측면에서는 완전히 동일 합니다.
구매 연령 제한은 만 19 세 이상 입니다. 미성년자는 어떤 경우에도 복권을 구매하거나 당첨금을 수령할 수 없습니다. 판매 마감은 매주 토요일 저녁 8 시 이며, 그 이후 구매분은 다음 회차로 자동 적용됩니다.
로또 6/45 의 당첨 등수는 총 5 개입니다. 아래 표는 각 등수의 조건과 일반적인 당첨금 특성을 정리한 것입니다.
| 등수 | 조건 | 당첨금 특성 |
|---|---|---|
| 1 등 | 6 개 번호 모두 일치 | 총 당첨금 1 등 배당분(가변, 보통 10~30 억 원) |
| 2 등 | 5 개 일치 + 보너스 번호 일치 | 2 등 배당분(보통 5,000 만 ~ 1 억 원) |
| 3 등 | 5 개 일치 | 3 등 배당분(보통 100 ~ 200 만 원) |
| 4 등 | 4 개 일치 | 고정 50,000 원 |
| 5 등 | 3 개 일치 | 고정 5,000 원 |
1 등, 2 등, 3 등의 당첨금은 변동 입니다. 각 회차의 전체 판매금 중에서 운영비·조세·공익기금을 제외한 나머지가 당첨금 총액이 되고, 이 총액을 등수별로 사전에 정해진 비율로 나눈 뒤, 해당 등수의 당첨자 수로 다시 나누기 때문입니다. 1 등 당첨자가 많이 나오면 1 인당 당첨금은 줄고, 한 명만 당첨되면 그 사람이 전부 가져갑니다.
반면 4 등과 5 등은 각각 50,000 원과 5,000 원으로 고정 되어 있습니다. 이는 낮은 등수에 해당하는 당첨자가 매 회차 수십만 명 단위로 나오기 때문에, 총 배당 규모를 안정적으로 예측하기 위한 설계입니다.
당첨금이 3 억 원을 초과 하는 경우 22% 의 기타소득세 + 2.2% 의 지방소득세, 도합 약 24.2% 가 원천징수됩니다. 1 억 원 ~ 3 억 원 구간은 약 22% 가 원천징수되며, 그 이하 구간은 세금이 부과되지 않습니다. 실제 수령 금액은 세전 금액이 아니라는 점을 염두에 두셔야 합니다.
가장 유명한 사실부터 이야기하면, 로또 6/45 의 1 등 당첨 확률은 약 1/8,145,060 입니다. 이 숫자는 마법이 아니라 고등학교 수학 교과서의 조합론(Combinatorics) 만으로 도출됩니다.
"서로 다른 45 개 대상 중 순서를 고려하지 않고 6 개를 선택하는 경우의 수"는 이항 계수(binomial coefficient) 로 표현되며, C(45, 6) 또는 ₄₅C₆ 라고 씁니다.
수식을 풀어 쓰면 다음과 같습니다.
즉 45 개 번호에서 만들 수 있는 6 개 번호 조합은 정확히 8,145,060 개이며, 추첨기는 이 중 하나를 완벽한 무작위로 고르므로 특정 조합이 뽑힐 확률은 1 / 8,145,060 이 됩니다.
다른 등수의 확률도 같은 방식으로 유도할 수 있습니다. 예를 들어 3 등(5 개 일치) 의 확률은 "6 개 중 5 개를 맞히고 나머지 1 개는 틀리는" 경우의 수를 전체 조합수로 나눈 값입니다.
여기서 C(6,5) 는 당첨 번호 6 개 중 어떤 5 개를 맞히느냐의 경우의 수(=6), C(39,1) 은 남은 39 개의 비당첨 번호 중 어떤 1 개가 나의 6 번째 선택이 되느냐의 경우의 수(=39) 입니다.
| 등수 | 확률 (근사) | 해석 |
|---|---|---|
| 1 등 | 1 / 8,145,060 | 한 장으로 당첨될 확률은 0.0000123% |
| 2 등 | 1 / 1,357,510 | 1 등의 6 배 |
| 3 등 | 1 / 35,724 | 1 등의 약 228 배 |
| 4 등 | 1 / 733 | 흔하지만 당첨금 5 만원 고정 |
| 5 등 | 1 / 45 | 약 45 장 중 1 장은 당첨, 당첨금 5 천원 고정 |
여기서 꼭 짚고 넘어가야 할 점이 있습니다. 5 등 당첨 확률이 "1/45" 라는 의미는 "45 장을 사면 5 등 1 번이 보장된다" 가 아니라 "평균적으로 45 장당 5 등 1 번 꼴로 기대된다" 입니다. 단기적으로는 100 장 사고도 5 등이 안 나올 수 있고, 5 장 만에 나올 수도 있습니다. 이것이 확률의 핵심 — 기대값은 장기적인 경향이지 단기적인 보장이 아니다 — 입니다.
확률론에서 "기대값(expected value)" 이란 한 번의 시행에서 평균적으로 얻을 수 있는 금액을 의미합니다. 로또 6/45 한 게임(1,000 원) 의 기대값은 각 등수의 확률과 상금을 곱해 모두 더한 값입니다.
간단한 근사 계산을 해보면, 5 등 기대값은 5,000 × 1/45 ≈ 111 원, 4 등은 50,000 × 1/733 ≈ 68 원, 3~1 등은 회차별 변동이 있어 확정할 수 없지만 장기 평균적으로 대략 100 ~ 300 원 수준의 기여를 합니다. 이를 합치면 1,000 원짜리 티켓 한 장의 기대값은 대략 400~600 원 구간에 위치합니다.
즉, "사는 순간 장기 평균으로 1,000 원을 내고 400~600 원의 가치를 돌려받는 게임" 입니다. 이 기대값 손실분(=약 40~60%) 은 운영비, 조세, 그리고 공익사업 환원금으로 쓰이며, 로또 6/45 의 수익금 상당 부분은 복권기금 을 통해 저소득층 주거 지원, 국가유공자 보훈 지원 등 공공 목적으로 재분배됩니다.
즉 로또 구매는 "투자" 나 "재테크" 가 아니라 "소액의 오락적 지출 + 공익기금 기부" 라는 관점으로 이해하는 것이 가장 정확한 프레이밍입니다.
로또를 둘러싼 가장 큰 문제는 확률을 잘못 직관적으로 이해하는 데서 옵니다. 다음 세 가지는 통계학 교과서에 반드시 등장하는 대표적인 오류입니다.
"지난 10 회차 동안 7 번이 한 번도 안 나왔다. 이번 회차엔 나올 때가 됐다." 이런 생각은 수학적으로 완벽하게 틀렸습니다. 각 회차의 추첨은 완벽하게 독립적이며, 공은 이전 회차의 결과를 "기억" 하지 않습니다. 7 번이 과거 10 회차에서 0 번 나왔다 해도 다음 회차에서 7 번이 나올 확률은 여전히 6/45 ≈ 13.3% 입니다. 변하지 않습니다.
"최근에 자주 나온 번호는 '기세가 좋으니' 또 나올 것이다." 역시 틀렸습니다. 추첨기에 "기세" 는 존재하지 않습니다. 빈도가 높게 관찰된 것은 무작위 분포에서 발생할 수 있는 정상적인 변동 범위 안에 있을 가능성이 높고, 그것이 다음 회차의 확률에 영향을 주지 않습니다.
이 사이트의 "가중치 추첨" 기능은 "자주 나온 번호가 앞으로도 자주 나올 것이다" 라고 주장하지 않습니다. 오히려 반대입니다 — 과거 통계에 '편향된' 조합을 만들어 보여주는 시각화 도구 로, 이 편향이 미래 결과와 통계적으로 무관하다는 사실을 투명하게 공개합니다.
1-2-3-4-5-6 같은 조합은 "나올 리 없다" 고 여겨지지만, 수학적 확률은 14-22-25-33-38-41 같은 "무작위스러운" 조합과 정확히 동일 합니다. 각 조합은 8,145,060 분의 1. 차이가 나는 것은 "나올 확률" 이 아니라 "만약 그 조합이 실제로 나오면 얼마나 많은 사람이 같은 조합을 골랐는가" 입니다. 직관적으로 "그럴싸한" 조합은 많은 사람이 동시에 고르기 때문에, 1 등 당첨자가 여러 명 나와 당첨금이 쪼개집니다.
더 깊이 있는 데이터 분석은 통계 심화 분석 페이지에서, 알고리즘의 구체적인 구현은 사이트 소개 에서 확인하실 수 있습니다.