가장 자주 나온 번호 vs 가장 덜 나온 번호 — 정말 차이가 있을까

"자주 나오는 번호로 사라" 와 "잘 안 나오는 번호가 이제 나올 차례다" — 두 주장은 정반대인데도 모두 확률적으로 틀렸습니다. 그 이유를 같이 풀어봅니다.

두 가지 상반된 전략

로또 번호 선택에 관한 대표적인 두 가지 민간 "전략" 이 있습니다.

재미있는 점은 이 두 주장이 논리적으로 정반대 라는 것입니다. 같은 데이터를 두고 "기세 유지" 와 "균형 회귀" 라는 완전히 반대되는 결론을 내립니다. 두 사람이 대화하다가 "너는 HOT 을 봐, 나는 COLD 을 볼게" 라고 합의하는 장면을 상상해 보세요. 두 전략이 모두 유효할 수는 없습니다.

진실은 — 둘 다 틀렸습니다.

왜 둘 다 틀린가 — 사건의 독립성

확률론의 가장 기본적인 사실 중 하나는 "독립 사건" 이라는 개념입니다. 두 사건이 독립이라는 것은, 한 사건의 결과가 다른 사건의 결과에 영향을 주지 않는다는 뜻입니다. 로또 추첨은 매 회차 완벽하게 독립입니다 — 지난 회차의 결과가 다음 회차의 추첨기 속에 "기억" 될 어떤 물리적 메커니즘도 존재하지 않습니다.

이것은 추상적인 주장이 아닙니다. 추첨기의 공은 매 회차 똑같은 방식으로 섞이며, 그 공들은 지난 주에 자기가 뽑혔는지 뽑히지 않았는지 "알지 못합니다". 따라서 7 번이 지난 10 회차 동안 한 번도 안 나왔다 해도, 다음 회차에 7 번이 뽑힐 확률은 여전히 정확히 6/45 ≈ 13.3% 입니다.

관찰된 빈도 차이는 "자연스러운 분산"

그런데 실제 데이터를 보면 어떤 번호는 다른 번호보다 더 자주 나온 것처럼 보입니다. 본 사이트의 내장 데이터에서는 1 번이 163 회, 38 번이 197 회 출현했습니다. 차이가 34 회나 납니다. "이건 너무 큰 차이 아닌가?" 라고 생각할 수 있습니다.

그러나 이 차이를 확률론적으로 해석하면 매우 정상입니다. 1,161 회차 동안 각 번호가 뽑힌 평균 횟수는 약 1,161 × 6/45 ≈ 155 회입니다. 이항분포의 표준편차를 계산해 보면 약 σ ≈ 12 정도이며, 95% 의 번호가 155 ± 24 구간 안에 들어올 것으로 예상됩니다. 실제 데이터의 158 ~ 197 구간은 이 예상과 거의 일치합니다.

즉 "HOT 번호" 와 "COLD 번호" 의 차이는 정상적인 무작위 변동 범위 안에 있는 자연스러운 편차 이지, 물리적인 "성향" 이 아닙니다.

대수의 법칙과의 관계

통계학의 대수의 법칙 은 이 문제를 한 문장으로 요약해 줍니다 — "시행 횟수가 무한히 늘어나면, 각 사건의 관찰 빈도는 이론 확률로 수렴한다." 로또의 경우, 회차가 많이 쌓일수록 모든 번호의 출현 횟수가 서로 비슷해진다는 예측입니다. 1,161 회차는 이미 상당히 긴 시계열이며, 관찰된 빈도 분포가 이론 예측에 잘 부합한다는 것은 추첨기가 공정하다 는 가장 강한 증거입니다.

가중치 추첨 도구는 "예측 도구" 가 아니다

그렇다면 이 사이트가 제공하는 "가중치 추첨" 이나 "자주 나오는 번호 추첨" 기능은 무엇일까요? 그것은 예측 도구가 아니라 시각화 도구 입니다. "만약 당신이 역대 빈도가 높은 번호에 편향된 조합을 고르고 싶다면, 그 조합이 어떤 모양일까" 라는 질문에 답을 보여주는 것 뿐입니다.

이 답은 흥미롭지만, 미래 당첨 확률을 올려주지 않습니다. 앞에서 설명한 것처럼 추첨은 독립이기 때문입니다. 만약 이 기능을 쓰신다면, "재미와 학습을 위한 시각화" 로 사용해 주세요.