선거 데이터 포렌식 · 2014–2026

관내사전투표 ‘동일값’ 분석

“다른 동네에서 같은 후보가 똑같은 사전투표수를 받았다”는 의혹을, 전국 7개 선거의 읍·면·동 개표결과로 직접 세어보고 우연인지 조작인지 통계로 검증한다.

생성 2026-06-11 · 임계값 ≥25표 · 비례대표 제외

무엇을 분석했나

선거 부정 의혹에서 반복되는 주장이 있다.

“서로 다른 동네에서 같은 후보가 똑같은 사전투표 득표수를 받았다. 한 곳의 숫자를 다른 곳에 복사·붙여넣기 한 조작의 흔적이다.”

이 리포트는 이 주장을 전국 읍·면·동 개표결과로 직접 세어 검증한다. 2014년 제6회 지방선거부터 2026년 제9회 지방선거까지 7개 전국 선거의 모든 개표 단위에서, 같은 후보가 여러 동에서 정확히 같은 관내사전투표 득표를 받은 경우를 전수 수집했다. (사전투표는 2014년 도입 — 그 이전 선거는 분석 대상이 아니다.)

두 가지를 센다.

수집 기준 (노이즈 제거):

데이터 규모

7
분석 선거
2014–2026
~16,500
개표 단위(동)
지방선거 1회 기준
166
유형 B 동쌍 총합
7개 선거 합계
14건
거대 1·2위 동시일치
시도지사 65건 중

지방선거는 한 회에 약 1만6천 개 동에서 여러 종류 선거가 동시에 치러진다. 이 막대한 단위를 둘씩 짝지으면 비교 횟수는 수천만 쌍에 이른다 — 이 점이 뒤의 분석에서 핵심이 된다.

선거별로 보면 동시 일치는 교육감·시도지사 같은 시·도 단위 선거에 몰린다. 동을 비교하는 풀이 가장 크기 때문이다.

유형 B 동쌍, 선거별 합계 (2014–2026)
0 24 47 71 94 94 교육감 65 시도지사 4 국회의원 3 구청장

동을 비교하는 풀이 큰 시·도 단위 선거(교육감·시도지사)에 집중. 구청장·국회의원 등 좁은 단위는 희소.

연도별로 늘고 있나?

“조작이 갈수록 늘고 있다”면 동시 일치 건수가 우상향해야 한다. 실제 추이는 그렇지 않다.

유형 B 동쌍 건수, 연도별 (파랑=지방, 주황=총선)
0 13 26 38 51 38 2014 3 2016 50 2018 0 2020 23 2022 1 2024 51 2026

지방선거(2014·2018·2022·2026)와 총선(2016·2020·2024)은 규모가 달라 직접 비교 불가. 같은 종류 안에서도 단조 증가 없음.

건수 차이는 연도(시간) 가 아니라 그 해 선거의 구조(동 수·선거 종류·후보 수)로 설명된다. 뒤에서 보듯, 각 해의 건수는 “순수한 우연”이 만들어내는 양과 거의 같은 배율로 움직인다.

우연인가, 조작인가

핵심 질문이다. 네 가지 독립적인 증거가 모두 우연(조합적 노이즈) 을 가리킨다.

1. 우연만으로도 이만큼 나온다 — 몬테카를로 검정

각 동의 후보 득표를 관측값을 평균으로 하는 독립 난수(포아송) 로 다시 뽑아, “복붙이 전혀 없을 때” 동시 일치가 몇 건 생기는지 200회 모의실험했다. 아래 회색 띠가 순수 우연의 95% 범위, 빨간 점이 실제 관측이다.

실제 관측 vs 우연(귀무가설) — 지방선거
0 16 32 48 64 38 2014 50 2018 23 2022 51 2026

우연 가정 95% 구간 우연 평균 실제 관측

복붙이 없어도 우연만으로 해마다 수십 건이 생긴다. 실제 관측은 우연 평균의 약 1.1–1.7배 — 같은 자릿수다.

실제 관측치는 우연 기댓값의 약 1.1–1.7배에 그친다. 복사·붙여넣기 조작이라면 우연 기댓값의 수십~수백 배가 나와야 한다. 관측이 우연과 같은 자릿수라는 것은, 이 일치들이 조작이 아니라 독립적인 개표 숫자가 우연히 겹친 것임을 뜻한다. (관측이 우연 평균을 조금 웃도는 해가 있는데, 이는 인접·유사 규모 동끼리 비슷한 소수 득표가 더 자주 겹치는 공간적 군집 때문이며 복제와는 무관하다.)

총선(2016·2020·2024)은 관측이 0~3건으로, 우연 범위 안에 완전히 든다.

2. 비교 풀이 클수록 늘어난다 — 생일의 역설

서로 다른 두 동에서 한 자릿수~세 자릿수 숫자가 우연히 겹칠 확률은 낮아 보여도, 비교 횟수가 수천만 쌍이면 우연 일치는 피할 수 없다(생일의 역설). 실제로 한 선거 안에서 동이 많을수록(N↑) 일치도 정확히 그만큼 늘어난다.

동 수(N) vs 동일값 일치 — 시·도 단위 선거
0926185227793705 동 수 (N) (로그) 동일값 동쌍

교육감시도지사

점 하나가 한 시·도의 한 선거. 비교 풀(N)이 클수록 일치가 증가 — 조작이 아니라 조합의 산물.

3. 작은 표에만 몰리고, 큰 표에서는 사라진다

우연 일치라면 값이 작을수록(겹칠 여지가 큼) 많고, 값이 클수록 급감해야 한다. 조작이라면 반대로 크고 중요한 표에서 나와야 한다. 데이터는 전자다 — 전체 일치의 69%가 100표 미만, 1,000표 이상은 6% 에 불과하다.

동일값 크기별 일치 동쌍 수 (로그 스케일, 전 연도 합산)
19,766 25–49 10,572 50–99 6,269 100–199 4,873 200–499 1,774 500–999 855 1000+ 동일값 크기(표) — 클수록 거대후보

작은 값에 압도적으로 집중(파랑), 거대후보 규모(초록, 500표+)에서는 희소. 조작이라면 정반대여야 한다.

4. 거대 양강이 함께 겹치는 일은 거의 없다

복붙 조작이라면 1·2위 거대 후보의 큰 표가 함께 복제돼야 한다. 그러나 시·도지사 동시일치 65건 중 1·2위가 함께 겹친 경우는 14건뿐이고, 그나마 인접한 두 동에서 비슷한 표심이 우연히 맞은 사례다.

가장 눈에 띄는 사례(아래 표 첫 줄, 인천 송도1·2동 시장 선거 3,030/1,440 동시 일치)조차, 같은 생활권 두 동의 사전투표 규모·표심이 거의 같아 생긴 단일 우연이다 — 전국 어디서도 이런 거대값 동시일치가 반복되지 않는다는 점이 오히려 조작이 아님을 보여준다.

선거묶음동 A ↔ 동 B동시 일치 내역
시도지사 인천 인천_연수구/송도1동 ↔ 인천_연수구/송도2동 더불어민주당박찬대=3030; 국민의힘유정복=1440
시도지사 서울 서울_강동구/천호제3동 ↔ 서울_송파구/잠실4동 더불어민주당 정원오=2057; 정의당 권영국=28
시도지사 서울 서울_송파구/가락본동 ↔ 서울_은평구/갈현제2동 국민의힘 오세훈=1167; 개혁신당 김정철=33
시도지사 서울 서울_송파구/가락2동 ↔ 서울_영등포구/양평제1동 국민의힘 오세훈=1013; 개혁신당 김정철=31
시도지사 전남 전남_무안군/현경면 ↔ 전남_함평군/학교면 더불어민주당민형배=950; 진보당이종욱=30
시도지사 서울 서울_구로구/구로제3동 ↔ 서울_동작구/신대방제2동 국민의힘 오세훈=917; 여성의당 유지혜=25

2026 제9회 지방선거 유형 B 상위 사례(일치값합 순). 대부분 시·도 단위 1개 후보+군소 또는 인접 동의 우연.

5. 사전투표만의 문제가 아니다 — 당일투표도 똑같다

이것이 가장 결정적이다. 만약 동일값이 사전투표를 노린 조작이라면, 같은 날 같은 개표소에서 센 당일(선거일)투표에는 나타나지 않아야 한다. 그러나 당일투표에서도 똑같이 발생한다.

동일값 동쌍: 사전투표 vs 당일투표 (연도별)
013263851 38 10 2014 3 1 2016 50 33 2018 0 1 2020 23 12 2022 1 1 2024 51 20 2026

사전투표(관내사전)당일투표(선거일)

당일투표도 0이 아니다 — 지방선거마다 수십 건. 조작이 아니라 개표 숫자의 일반적 성질.

당일투표 동시 일치는 7개 선거에서 총 78건, 지방선거만 보면 10·33·12·20건이다. 사전투표보다 다소 적은데, 이는 조작 여부와 무관하다 — 당일투표는 표가 더 많아(값이 큼) 두 동이 정확히 같은 숫자가 될 확률이 낮을 뿐이다. 앞의 ③(작은 값일수록 잘 겹친다)과 정확히 같은 원리다.

사전투표든 당일투표든 동일값은 똑같이 나타난다. “사전투표함에서만 벌어진 복붙”이라는 전제 자체가 성립하지 않는다. 이 현상은 투표 방식이 아니라, 수천만 쌍을 비교할 때 숫자가 우연히 겹치는 — 어떤 개표 데이터에서도 나타나는 — 조합적 성질이다.

결론

다섯 가지 증거 — ① 우연 모의실험과 같은 자릿수, ② 비교 풀 크기에 비례, ③ 작은 표에 집중·큰 표에서 소멸, ④ 거대 양강 동시일치 거의 없음, ⑤ 사전·당일투표에서 똑같이 발생 — 이 일관되게 한 방향을 가리킨다.

관내사전투표의 ‘동일값 일치’는 조합적 우연으로 설명된다. 2014년부터 2026년까지 어느 해에서도 ‘복사·붙여넣기’ 조작의 신호는 나타나지 않는다.

건수가 해마다 다른 것은 조작이 늘어서가 아니라 그 해 선거의 규모와 구조 때문이며, 정규화하면 추세는 평탄하다.


재현: 데이터는 중앙선거관리위원회 읍·면·동 개표결과(data/<연도>/). 수집·집계 코드는 analyze/, 통계·리포트 생성은 report/. 기준 — 개별 값 ≥25표, 동쌍 일치값합 > 200표, 비례대표 제외, 몬테카를로 200회. npm run build 로 이 페이지가 그대로 재생성된다.