모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 게시물ID : humorbest_1420734
    작성자 : 치우율무차
    추천 : 65
    조회수 : 3541
    IP : 149.43.***.128
    댓글 : 191개
    베스트 등록시간 : 2017/04/24 01:30:52
    원글작성시간 : 2017/04/24 00:56:37
    http://todayhumor.com/?humorbest_1420734 모바일
    [더플랜] 문과생/수포자 히치하이커를 위한 k=1 vs k=1.5 안내서
    옵션
    • 창작글
    • 본인삭제금지

    이 글은 더 플랜에 나오는 k값(논란이 되고 있는 1과 1.5를 중점으로)이 의미하는게 무엇인가를 아주 원론적인 측면에서만, 문과생도(최대한) 이해하기 쉽게 설명하기 위한 글입니다. 

    작성자 본인이 문과가 아니라 이 중차대한 작업을 제대로 수행할 자격이 충분한지는 모르겠습니다만 가능한 한도에서 최대한 노력하겠습니다.

     이 k라 불리는 통계학적 수치에 대한 해석은 안타깝게도 주관이 끼어들 여지가 다분하며 과게 내에서도 저와 해석이 갈리는 분들이 많습니다. 해당 쟁점도 짚어볼 생각입니다.

    k의 정의
    정의.k는 박근혜 표가 미분류표로 분리되는 확률과 문재인 표가 미분류표로 분리될 확률 간의 비율을 의미합니다.

     예제.위 1번 정의가 어려우신 분들을 위해 예시로써 부연설명하자면
    예제-1. k=1인 경우, 분류기는 문재인표 100개중 3개를 미분류표로 분리하며 박근혜표 100개중 3개를 미분류표로 분리했음을 의미합니다.
    예제-2. k=1.5인 경우, 분류기는 문재인표 100개중 2개를 미분류표로 분리하며 박근혜표 100개 중 3개를 미분류표로 분리했음을 의미합니다.

    위 정의에서 하나 더 정의해야할 용어가 보이는군요. "미분류표"가 무엇인지 정의해야합니다
    미분류표는 다음 두 가지 경우에 의해 발생하는 표입니다

    1.기기 자체의 부정확성으로 인해 이게 박근혜표인지 문재인표인지 무효표인지 가려내지 못한 표
    2.(중요*) 도장 번짐, 표 찢어짐, 도장 선걸침 등으로 인해 기기로 판독할 수 없고 사람의 눈으로 판독해야만 하는 표. 이 표들은 무효표, 박근혜표, 문재인표를 모두 포함

    선관위가 공개한 스펙에 따르면 2012 대선에 활용한 분류기는 1번 경우로 인해 미분류표가 발생할 확률이 0.1퍼센트 미만이라고 합니다.

    이를 근거로 미분류표 3.6퍼센트는 너무 큰 게 아닌가?라는 주장이 보이는데 이는 2번경우로 발생하는 미분류표를 무시하는 처사입니다. 미분류표는 1번 2번 모두 합해서 전체
    표의 3.6퍼센트가 미분류표로 분류되었습니다. 이는 다른 총선 대선과 비교하더라도 정상적인 수치입니다.

    또한 선관위가 공개한 스펙이 맞다면, 3.6퍼센트라는 수치는 미분류표가 1번경우보다 2번경우로 인해 생겼을 확률이 압도적으로 높다는 증거이므로 후에 나오는 "미분류표"는 1번경우의 미분류표는 없고 2번경우의 미분류표가 거의 전부라고 가정합니다.

    자 정의가 끝났으니 본론으로 넘어갑니다.


    k값은 과연 어떤 조건에서 1이어야 하는가?

    여기서 한가지 큰 쟁점이 발생하는데요
    랜덤추출(임의추출)이 필요한가? vs 필요하지 않은가?

     단언하자면 분류기는 애초에 미분류 표들을 랜덤추출하지 않습니다. 만약 미분류표가 1번 경우에 의해서만 발생한다면 미분류표는 랜덤추출에 가까운 성향을 보일 것입니다. 

    하지만 2번경우는 "도장/기표용지의 상태"라는 요소에 의해서 좌우되는, 말 그대로 랜덤하지 않고 일정한 기준에 의해서 추출되는 미분류표들입니다.


    여기서 "미분류표는 랜덤추출이 아니므로 k는 1이 아니다"라는 논리를 즐겨쓰는 분들이 있는데요. 맞는 말이지만 k를 꽤나 무시하는 처사입니다...이걸로는 k가 1이 아니라 1.5라는걸 설명하기엔 많이 부족합니다...

    사실 현실세계에서 랜덤추출은 어렵습니다 아니 불가능합니다. 최근 뉴스를 봐도 우리가 여론조사에서 유무선비율을 따지고 국번을 따지는 것도 국민이라는 표본에서 완전 랜덤한 샘플을 얻는게 불가능하기 때문에 그렇죠

    k의 힘은 여기서 나옵니다. 이 싱기방기한 통계수치인 k는 랜덤추출이 아니더라도 1에 수렴할 수 있습니다! 이에 대한 증명은 통계학 원서에서 다루는 매우 중요하고 흥미롭지만 복잡한 과정이기에 생략하겠습니다.

    다만 그게 항상 그런건 아니고. k는 "추출이 랜덤" 뿐만 아니라 "모집단 내에 타겟집단이 랜덤"인지도 잡아내는 역할을 합니다. 무슨 말인가하면, 랜덤추출이 아님에도 불구하고 k=1이다라는 답을 얻었을 때. 한 가지 결론을 내릴 수 있습니다: "우리가 조사하고있는 타겟집단이 모집단 내에 균등하게/랜덤하게 분포하고 있다!"

    k=1.5라는 것은 바로 위 문장이 사실이 아님을 나타냅니다. 즉 조사하는 타겟집단이 모집단 내에 균등하게 분포하지 않는다는 것이죠.

    어렵네요. 그러므로 좀 더 알기 쉽게 설명합니다.
    풀어서 말하면, 이번 2012대선에서 관찰된 데이터와 k=1.5는 다음과 같은 의미를 지나고 있습니다.

    타겟집단:미분류표를 만든 사람
    모집단:박근혜에기 투표한 그룹과 문재인에게 투표한 그룹
    k=1.5이므로 박근혜 투표자그룹에는 문재인 투표자그룹보더 미분류표를 생산한 사람들이 더 많이 분포해 있었음.

    즉 박근혜 투표자 중에 미분류표를 찍은 사람이 3퍼센트, 문재인 지지자 중에 미분류표를 찍은 사람이 3퍼센트 이런식으로 균등하게 분배되어 있는게 아니라

    박근혜 지지자 중에 미분류표를 찍은 사람이 3퍼센트
    문재인 지지자 중에 미분류표를 찍은 사람이 2퍼센트
    이런식으로 차이가 나게 분배되어 있다는 얘기입니다.



    자 다시 k는 언제 1인가? 라는 최초 질문으로 돌아가서
    1.k는 표본이 랜덤추출일 경우 1에 근접한다
    2. 만약 랜덤추출이 아니더라도 모집단에 타겟집단(현재 상황에선 미분류표를 생산하는 집단)이 랜덤분포하면 k= 1에
    근접한다.
    2-1. k=1이 아니라는 것은 미분류표를 생산하는 집단이 한쪽(2012 대선에선 박근혜투표자쪽)에 치우쳐서 분포한다는 얘기이다. 
    사족. 또 한 발 더 나아가서 k=1이 아닌 값에 무려 정규분포를 보인다는 것은 미분류표를 생산하는 집단이 일정한 패턴을 가지고 한쪽에 집중된다는 의미이다.
    3. 왜 이러한 패턴이 발생했는가?에 대해서는 여러가지 가설을 세울 수 있으며, 가능성이 있는 가설 중에는 현재 해킹설, 연령설이 있다.


    일단 이 글은 k의 의미를 설정하고 설명하는 것이 목적이고 소기 목적을 충분히 달성했다고 개인적으로 판단되므로 여기서 끝마칩니다.

    이 정보를 바탕으로 과게와 다른 커뮤니티에서 불타고 있는 논란과 온갖 데이터를 해석하기 더 편해졌기를 바랍니다. 더 플랜의 주장이 옳은지 아닌지를 판단하는 것은 이제 기초를 배운 여러분의 몫으로 남기겠습니다.

    길고 부족한 글 읽어주셔서 감사합니다. 
    진실의 침몰을 막기 위한 노력이 계속되길 바라는 마음에서
    이 부족한 글에 대한 온갖 태클을 환영합니다.

    이 게시물을 추천한 분들의 목록입니다.
    [1] 2017/04/24 00:58:35  182.222.***.96  오유댓글실록  472282
    [2] 2017/04/24 01:05:56  1.11.***.14  Young.K  25347
    [3] 2017/04/24 01:08:25  1.235.***.162  자이언트로보  740181
    [4] 2017/04/24 01:10:44  222.99.***.162  dacoon  113114
    [5] 2017/04/24 01:14:59  108.162.***.234  영재발골단  644189
    [6] 2017/04/24 01:21:24  211.57.***.24  뭐냐?  551803
    [7] 2017/04/24 01:25:56  61.109.***.140  S.Guri  5374
    [8] 2017/04/24 01:28:31  125.135.***.53  럭키쓰리  525931
    [9] 2017/04/24 01:30:20  124.56.***.120  brianjung  694018
    [10] 2017/04/24 01:30:52  218.147.***.207  때때찌찌  660362
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.


    현재 게시판의 베스트게시물입니다.  
    번호 제 목 이름 날짜 조회 추천
    1426448
    스브스의 K가설 기사. [27] 펌글 엘랑™ 17/05/01 10:22 5108 35
    1425530
    자로가 子羔(자고)를 천거하여 비(費) 고을의 K값을 맡도록 했다. [15] 창작글본인삭제금지 오유댓글실록 17/04/30 00:51 3169 28/15
    1425149
    알파고의 완벽한 번역이 불가능한 이유 - 외국어의 존댓말 [38] 창작글 rabelais 17/04/29 15:05 6541 57
    1424125
    [혐주의] 안아키: 약을 안 쓰고 우리 아이 키우기 [117] RedPain 17/04/28 22:45 6141 69
    1423840
    10원의 기적 [13] 눈물한스푼 17/04/28 14:33 6799 54
    1423824
    더플랜을 부정한다고 하여 ... [14] greenmaker 17/04/28 14:05 3144 38
    1423798
    알바고는 이길 수 없습니다 여러분. 이세돌도 못한걸 우리가 어떻게 해요. [115] 창작글본인삭제금지 치우율무차 17/04/28 13:22 6221 80/35
    1423785
    과게분들께 꿀팁 드립니다. 한번 써보세요. [12] Radiance 17/04/28 13:05 2645 38
    1423084
    일본의 금형기술.gif [15] 펌글 탱구왔서현 17/04/27 12:32 5707 25
    1422951
    [더플랜] k값과 노인가설. 호남을 빼면 어떻게 될까? [63] 치우율무차 17/04/27 07:24 5006 45
    1422515
    K값에 대해서 [20] 창작글본인삭제금지 오유댓글실록 17/04/26 15:48 2774 35
    1422169
    확증편향의 아이러니 [41] 마제소바 17/04/26 01:02 3505 51
    1422151
    과게와서 싸우지 말았으면 합니다. [16] 창작글본인삭제금지 제주살이 17/04/26 00:37 2296 37
    1420767
    님들 왜 돈을 못받나요? [28] 돌아온빌런 17/04/24 03:04 5846 54
    [더플랜] 문과생/수포자 히치하이커를 위한 k=1 vs k=1.5 안내서 [191] 창작글본인삭제금지 치우율무차 17/04/24 01:30 3541 65
    1420720
    고전] dc인사이드의 과학수준 [17] 대지의법도 17/04/24 01:05 8117 28
    1420712
    3줄요약 [12] 돌아온빌런 17/04/24 00:57 3910 48
    1419583
    춘향이가 감옥에 간 이유는? [32] 펌글 アンノウン 17/04/22 17:14 4615 72
    1419439
    K=1.5가 우연히 나올 수 있는 수치라구요? [84] SSumRiDa 17/04/22 13:56 4771 67
    1419259
    요즘 핫한 더 플랜을 알아보자.jpg [54] 스톤골렘 17/04/22 07:07 5973 58/22
    1419247
    가설 검증이 잘 된 글의 예시 [19] S.Guri 17/04/22 06:08 4913 50/26
    1418789
    우주를 좋아하시는분에게 꼭 기억해야할 날이 왔네요 [3] 중동사람 17/04/21 15:45 5318 39
    1418023
    공룡에 대해 너무너무 충격적인 사실을 알게됬어요. [42] 싸펑피펑? 17/04/20 13:35 9318 64
    [◀이전10개] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [다음10개▶]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈