모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 게시물ID : science_63373
    작성자 : 치우율무차
    추천 : 15
    조회수 : 1206
    IP : 149.43.***.128
    댓글 : 191개
    등록시간 : 2017/04/24 00:56:37
    http://todayhumor.com/?science_63373 모바일
    [더플랜] 문과생/수포자 히치하이커를 위한 k=1 vs k=1.5 안내서
    옵션
    • 창작글
    • 본인삭제금지

    이 글은 더 플랜에 나오는 k값(논란이 되고 있는 1과 1.5를 중점으로)이 의미하는게 무엇인가를 아주 원론적인 측면에서만, 문과생도(최대한) 이해하기 쉽게 설명하기 위한 글입니다. 

    작성자 본인이 문과가 아니라 이 중차대한 작업을 제대로 수행할 자격이 충분한지는 모르겠습니다만 가능한 한도에서 최대한 노력하겠습니다.

     이 k라 불리는 통계학적 수치에 대한 해석은 안타깝게도 주관이 끼어들 여지가 다분하며 과게 내에서도 저와 해석이 갈리는 분들이 많습니다. 해당 쟁점도 짚어볼 생각입니다.

    k의 정의
    정의.k는 박근혜 표가 미분류표로 분리되는 확률과 문재인 표가 미분류표로 분리될 확률 간의 비율을 의미합니다.

     예제.위 1번 정의가 어려우신 분들을 위해 예시로써 부연설명하자면
    예제-1. k=1인 경우, 분류기는 문재인표 100개중 3개를 미분류표로 분리하며 박근혜표 100개중 3개를 미분류표로 분리했음을 의미합니다.
    예제-2. k=1.5인 경우, 분류기는 문재인표 100개중 2개를 미분류표로 분리하며 박근혜표 100개 중 3개를 미분류표로 분리했음을 의미합니다.

    위 정의에서 하나 더 정의해야할 용어가 보이는군요. "미분류표"가 무엇인지 정의해야합니다
    미분류표는 다음 두 가지 경우에 의해 발생하는 표입니다

    1.기기 자체의 부정확성으로 인해 이게 박근혜표인지 문재인표인지 무효표인지 가려내지 못한 표
    2.(중요*) 도장 번짐, 표 찢어짐, 도장 선걸침 등으로 인해 기기로 판독할 수 없고 사람의 눈으로 판독해야만 하는 표. 이 표들은 무효표, 박근혜표, 문재인표를 모두 포함

    선관위가 공개한 스펙에 따르면 2012 대선에 활용한 분류기는 1번 경우로 인해 미분류표가 발생할 확률이 0.1퍼센트 미만이라고 합니다.

    이를 근거로 미분류표 3.6퍼센트는 너무 큰 게 아닌가?라는 주장이 보이는데 이는 2번경우로 발생하는 미분류표를 무시하는 처사입니다. 미분류표는 1번 2번 모두 합해서 전체
    표의 3.6퍼센트가 미분류표로 분류되었습니다. 이는 다른 총선 대선과 비교하더라도 정상적인 수치입니다.

    또한 선관위가 공개한 스펙이 맞다면, 3.6퍼센트라는 수치는 미분류표가 1번경우보다 2번경우로 인해 생겼을 확률이 압도적으로 높다는 증거이므로 후에 나오는 "미분류표"는 1번경우의 미분류표는 없고 2번경우의 미분류표가 거의 전부라고 가정합니다.

    자 정의가 끝났으니 본론으로 넘어갑니다.


    k값은 과연 어떤 조건에서 1이어야 하는가?

    여기서 한가지 큰 쟁점이 발생하는데요
    랜덤추출(임의추출)이 필요한가? vs 필요하지 않은가?

     단언하자면 분류기는 애초에 미분류 표들을 랜덤추출하지 않습니다. 만약 미분류표가 1번 경우에 의해서만 발생한다면 미분류표는 랜덤추출에 가까운 성향을 보일 것입니다. 

    하지만 2번경우는 "도장/기표용지의 상태"라는 요소에 의해서 좌우되는, 말 그대로 랜덤하지 않고 일정한 기준에 의해서 추출되는 미분류표들입니다.


    여기서 "미분류표는 랜덤추출이 아니므로 k는 1이 아니다"라는 논리를 즐겨쓰는 분들이 있는데요. 맞는 말이지만 k를 꽤나 무시하는 처사입니다...이걸로는 k가 1이 아니라 1.5라는걸 설명하기엔 많이 부족합니다...

    사실 현실세계에서 랜덤추출은 어렵습니다 아니 불가능합니다. 최근 뉴스를 봐도 우리가 여론조사에서 유무선비율을 따지고 국번을 따지는 것도 국민이라는 표본에서 완전 랜덤한 샘플을 얻는게 불가능하기 때문에 그렇죠

    k의 힘은 여기서 나옵니다. 이 싱기방기한 통계수치인 k는 랜덤추출이 아니더라도 1에 수렴할 수 있습니다! 이에 대한 증명은 통계학 원서에서 다루는 매우 중요하고 흥미롭지만 복잡한 과정이기에 생략하겠습니다.

    다만 그게 항상 그런건 아니고. k는 "추출이 랜덤" 뿐만 아니라 "모집단 내에 타겟집단이 랜덤"인지도 잡아내는 역할을 합니다. 무슨 말인가하면, 랜덤추출이 아님에도 불구하고 k=1이다라는 답을 얻었을 때. 한 가지 결론을 내릴 수 있습니다: "우리가 조사하고있는 타겟집단이 모집단 내에 균등하게/랜덤하게 분포하고 있다!"

    k=1.5라는 것은 바로 위 문장이 사실이 아님을 나타냅니다. 즉 조사하는 타겟집단이 모집단 내에 균등하게 분포하지 않는다는 것이죠.

    어렵네요. 그러므로 좀 더 알기 쉽게 설명합니다.
    풀어서 말하면, 이번 2012대선에서 관찰된 데이터와 k=1.5는 다음과 같은 의미를 지나고 있습니다.

    타겟집단:미분류표를 만든 사람
    모집단:박근혜에기 투표한 그룹과 문재인에게 투표한 그룹
    k=1.5이므로 박근혜 투표자그룹에는 문재인 투표자그룹보더 미분류표를 생산한 사람들이 더 많이 분포해 있었음.

    즉 박근혜 투표자 중에 미분류표를 찍은 사람이 3퍼센트, 문재인 지지자 중에 미분류표를 찍은 사람이 3퍼센트 이런식으로 균등하게 분배되어 있는게 아니라

    박근혜 지지자 중에 미분류표를 찍은 사람이 3퍼센트
    문재인 지지자 중에 미분류표를 찍은 사람이 2퍼센트
    이런식으로 차이가 나게 분배되어 있다는 얘기입니다.



    자 다시 k는 언제 1인가? 라는 최초 질문으로 돌아가서
    1.k는 표본이 랜덤추출일 경우 1에 근접한다
    2. 만약 랜덤추출이 아니더라도 모집단에 타겟집단(현재 상황에선 미분류표를 생산하는 집단)이 랜덤분포하면 k= 1에
    근접한다.
    2-1. k=1이 아니라는 것은 미분류표를 생산하는 집단이 한쪽(2012 대선에선 박근혜투표자쪽)에 치우쳐서 분포한다는 얘기이다. 
    사족. 또 한 발 더 나아가서 k=1이 아닌 값에 무려 정규분포를 보인다는 것은 미분류표를 생산하는 집단이 일정한 패턴을 가지고 한쪽에 집중된다는 의미이다.
    3. 왜 이러한 패턴이 발생했는가?에 대해서는 여러가지 가설을 세울 수 있으며, 가능성이 있는 가설 중에는 현재 해킹설, 연령설이 있다.


    일단 이 글은 k의 의미를 설정하고 설명하는 것이 목적이고 소기 목적을 충분히 달성했다고 개인적으로 판단되므로 여기서 끝마칩니다.

    이 정보를 바탕으로 과게와 다른 커뮤니티에서 불타고 있는 논란과 온갖 데이터를 해석하기 더 편해졌기를 바랍니다. 더 플랜의 주장이 옳은지 아닌지를 판단하는 것은 이제 기초를 배운 여러분의 몫으로 남기겠습니다.

    길고 부족한 글 읽어주셔서 감사합니다. 
    진실의 침몰을 막기 위한 노력이 계속되길 바라는 마음에서
    이 부족한 글에 대한 온갖 태클을 환영합니다.

    이 게시물을 추천한 분들의 목록입니다.
    [1] 2017/04/24 00:58:35  182.222.***.96  오유댓글실록  472282
    [2] 2017/04/24 01:05:56  1.11.***.14  Young.K  25347
    [3] 2017/04/24 01:08:25  1.235.***.162  자이언트로보  740181
    [4] 2017/04/24 01:10:44  222.99.***.162  dacoon  113114
    [5] 2017/04/24 01:14:59  108.162.***.234  영재발골단  644189
    [6] 2017/04/24 01:21:24  211.57.***.24  뭐냐?  551803
    [7] 2017/04/24 01:25:56  61.109.***.140  S.Guri  5374
    [8] 2017/04/24 01:28:31  125.135.***.53  럭키쓰리  525931
    [9] 2017/04/24 01:30:20  124.56.***.120  brianjung  694018
    [10] 2017/04/24 01:30:52  218.147.***.207  때때찌찌  660362
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    68808
    인공태양 KSTAR! 운전은 누가 할까?[KSTAR 제어실의 모든 것] 옆집미남 24/05/10 14:47 333 2
    68807
    PH 측정기 있으신분.. 남의 수돗물 측정좀. [5] 삼월이집 24/05/08 22:28 460 1
    68806
    [펌] 자기부상이 어려워? 난 드릴로 띄운다. [6] Young.K 24/05/01 01:41 998 11
    68805
    확실히 나사는 범접할 수 없는것 같습니다. [1] ㅗㅠㅑ 24/04/30 09:22 642 3
    68804
    [펌] 쨔잔~ 고양이를 이중슬릿에 던져 보겠습니다~ [1] Young.K 24/04/29 01:00 825 4
    68803
    삼체문제가 이해가 안되서 질문드려요 [7] 본인삭제금지 Oh_My!_Girl 24/04/24 12:42 1008 1
    68802
    “빅뱅이론 시효 끝나“... ‘우리가 알고 있던 우주‘가 흔들린다 [12] 펌글 89.1㎒ 24/04/22 18:54 1208 5
    68801
    이중슬릿 실험 반박 [5] visualwhit 24/04/21 13:56 1029 0
    68800
    관상, 사주팔자, 손금 다 과학이라고 생각하는데.. [4] 철철대마왕 24/04/19 17:34 870 1
    68799
    인간의 유전자는 퇴화되고 있다는 논문 [10] visualwhit 24/04/19 16:14 1126 1
    68798
    요즘들어 부쩍 과학에 대한 관심이 높아진듯 [3] 창작글 wanimemine 24/04/12 15:52 861 2
    68797
    국사선생이라서 괜찮아 [2] ㅗㅠㅑ 24/04/12 13:16 872 1
    68796
    수학선생이라서 괜찮아 [1] ㅗㅠㅑ 24/04/12 13:13 859 2
    68795
    중력파를 측정한 방법이 저의 머리론 이해가 잘 안돼요 [7] 열정사랑니 24/04/05 01:26 1147 1
    68794
    1m × 1m × 1m 부피의 증류수의 무게는? [11] ㅗㅠㅑ 24/04/01 10:53 1182 2
    68793
    gpt4와 클로드3의 대화입니다 (충격주의) [1] 창작글 일단짤라 24/03/11 20:45 1470 3
    68792
    주말에 비올 확률 15% 에 관한 수학 숙제 [1] Rekiel 24/03/07 07:40 1395 3
    68791
    [펌] AI 행렬연산? 그까이꺼 적당히 반올림 하고 계산하면 되잖아? [2] 펌글 Young.K 24/03/06 21:32 1224 3
    68790
    전기에 대한 오해: 실제 전기가 작동하는 방식 [2] 펌글 우가가 24/02/29 18:43 1541 3
    68789
    할로겐화합물 및 불활성기체의 화학식 [4] 뉴체어맨66 24/02/13 14:05 1453 0
    68788
    소방수리학 수두손실 해석필요 합니다. [2] 뉴체어맨66 24/02/01 07:14 1571 0
    68787
    [가설] 중력이 발생하는 이유. [7] Young.K 24/01/29 13:34 1974 2
    68786
    우주로 증발한 물은 어디로 갔을까요? [18] Young.K 24/01/19 00:15 2513 10
    68785
    만약 전인류가 고도비만이 된다면 환경문제가 생길까요? [2] 창작글 씨스루감자떡 24/01/04 00:49 1925 0
    68784
    (유투브) 흙, 미생물, 식물 [4] 펌글 솔로궁디Lv99 23/12/17 19:18 1969 4
    68783
    이산화탄소로 불끄기 펌글 우가가 23/12/15 17:47 2019 2
    68782
    방사능검사 관련하여 질문있습니다. [5] 푸루루딩딩 23/12/04 17:24 1969 0
    68781
    「지적 호기심을 위한 뇌과학 만화」셀프 책 홍보(하는 만화) 창작글 이즐라 23/11/30 14:03 2070 4
    68780
    최적멈춤문제 - 소개팅에서 성공하는 방법에 대하여 Rekiel 23/11/24 00:29 2357 8
    68779
    이 벌레 뭔가요 [2] 도시샤 23/11/03 14:58 2762 1
    [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [다음10개▶]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈