모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 게시물ID : science_63373
    작성자 : 치우율무차
    추천 : 15
    조회수 : 1198
    IP : 149.43.***.128
    댓글 : 191개
    등록시간 : 2017/04/24 00:56:37
    http://todayhumor.com/?science_63373 모바일
    [더플랜] 문과생/수포자 히치하이커를 위한 k=1 vs k=1.5 안내서
    옵션
    • 창작글
    • 본인삭제금지

    이 글은 더 플랜에 나오는 k값(논란이 되고 있는 1과 1.5를 중점으로)이 의미하는게 무엇인가를 아주 원론적인 측면에서만, 문과생도(최대한) 이해하기 쉽게 설명하기 위한 글입니다. 

    작성자 본인이 문과가 아니라 이 중차대한 작업을 제대로 수행할 자격이 충분한지는 모르겠습니다만 가능한 한도에서 최대한 노력하겠습니다.

     이 k라 불리는 통계학적 수치에 대한 해석은 안타깝게도 주관이 끼어들 여지가 다분하며 과게 내에서도 저와 해석이 갈리는 분들이 많습니다. 해당 쟁점도 짚어볼 생각입니다.

    k의 정의
    정의.k는 박근혜 표가 미분류표로 분리되는 확률과 문재인 표가 미분류표로 분리될 확률 간의 비율을 의미합니다.

     예제.위 1번 정의가 어려우신 분들을 위해 예시로써 부연설명하자면
    예제-1. k=1인 경우, 분류기는 문재인표 100개중 3개를 미분류표로 분리하며 박근혜표 100개중 3개를 미분류표로 분리했음을 의미합니다.
    예제-2. k=1.5인 경우, 분류기는 문재인표 100개중 2개를 미분류표로 분리하며 박근혜표 100개 중 3개를 미분류표로 분리했음을 의미합니다.

    위 정의에서 하나 더 정의해야할 용어가 보이는군요. "미분류표"가 무엇인지 정의해야합니다
    미분류표는 다음 두 가지 경우에 의해 발생하는 표입니다

    1.기기 자체의 부정확성으로 인해 이게 박근혜표인지 문재인표인지 무효표인지 가려내지 못한 표
    2.(중요*) 도장 번짐, 표 찢어짐, 도장 선걸침 등으로 인해 기기로 판독할 수 없고 사람의 눈으로 판독해야만 하는 표. 이 표들은 무효표, 박근혜표, 문재인표를 모두 포함

    선관위가 공개한 스펙에 따르면 2012 대선에 활용한 분류기는 1번 경우로 인해 미분류표가 발생할 확률이 0.1퍼센트 미만이라고 합니다.

    이를 근거로 미분류표 3.6퍼센트는 너무 큰 게 아닌가?라는 주장이 보이는데 이는 2번경우로 발생하는 미분류표를 무시하는 처사입니다. 미분류표는 1번 2번 모두 합해서 전체
    표의 3.6퍼센트가 미분류표로 분류되었습니다. 이는 다른 총선 대선과 비교하더라도 정상적인 수치입니다.

    또한 선관위가 공개한 스펙이 맞다면, 3.6퍼센트라는 수치는 미분류표가 1번경우보다 2번경우로 인해 생겼을 확률이 압도적으로 높다는 증거이므로 후에 나오는 "미분류표"는 1번경우의 미분류표는 없고 2번경우의 미분류표가 거의 전부라고 가정합니다.

    자 정의가 끝났으니 본론으로 넘어갑니다.


    k값은 과연 어떤 조건에서 1이어야 하는가?

    여기서 한가지 큰 쟁점이 발생하는데요
    랜덤추출(임의추출)이 필요한가? vs 필요하지 않은가?

     단언하자면 분류기는 애초에 미분류 표들을 랜덤추출하지 않습니다. 만약 미분류표가 1번 경우에 의해서만 발생한다면 미분류표는 랜덤추출에 가까운 성향을 보일 것입니다. 

    하지만 2번경우는 "도장/기표용지의 상태"라는 요소에 의해서 좌우되는, 말 그대로 랜덤하지 않고 일정한 기준에 의해서 추출되는 미분류표들입니다.


    여기서 "미분류표는 랜덤추출이 아니므로 k는 1이 아니다"라는 논리를 즐겨쓰는 분들이 있는데요. 맞는 말이지만 k를 꽤나 무시하는 처사입니다...이걸로는 k가 1이 아니라 1.5라는걸 설명하기엔 많이 부족합니다...

    사실 현실세계에서 랜덤추출은 어렵습니다 아니 불가능합니다. 최근 뉴스를 봐도 우리가 여론조사에서 유무선비율을 따지고 국번을 따지는 것도 국민이라는 표본에서 완전 랜덤한 샘플을 얻는게 불가능하기 때문에 그렇죠

    k의 힘은 여기서 나옵니다. 이 싱기방기한 통계수치인 k는 랜덤추출이 아니더라도 1에 수렴할 수 있습니다! 이에 대한 증명은 통계학 원서에서 다루는 매우 중요하고 흥미롭지만 복잡한 과정이기에 생략하겠습니다.

    다만 그게 항상 그런건 아니고. k는 "추출이 랜덤" 뿐만 아니라 "모집단 내에 타겟집단이 랜덤"인지도 잡아내는 역할을 합니다. 무슨 말인가하면, 랜덤추출이 아님에도 불구하고 k=1이다라는 답을 얻었을 때. 한 가지 결론을 내릴 수 있습니다: "우리가 조사하고있는 타겟집단이 모집단 내에 균등하게/랜덤하게 분포하고 있다!"

    k=1.5라는 것은 바로 위 문장이 사실이 아님을 나타냅니다. 즉 조사하는 타겟집단이 모집단 내에 균등하게 분포하지 않는다는 것이죠.

    어렵네요. 그러므로 좀 더 알기 쉽게 설명합니다.
    풀어서 말하면, 이번 2012대선에서 관찰된 데이터와 k=1.5는 다음과 같은 의미를 지나고 있습니다.

    타겟집단:미분류표를 만든 사람
    모집단:박근혜에기 투표한 그룹과 문재인에게 투표한 그룹
    k=1.5이므로 박근혜 투표자그룹에는 문재인 투표자그룹보더 미분류표를 생산한 사람들이 더 많이 분포해 있었음.

    즉 박근혜 투표자 중에 미분류표를 찍은 사람이 3퍼센트, 문재인 지지자 중에 미분류표를 찍은 사람이 3퍼센트 이런식으로 균등하게 분배되어 있는게 아니라

    박근혜 지지자 중에 미분류표를 찍은 사람이 3퍼센트
    문재인 지지자 중에 미분류표를 찍은 사람이 2퍼센트
    이런식으로 차이가 나게 분배되어 있다는 얘기입니다.



    자 다시 k는 언제 1인가? 라는 최초 질문으로 돌아가서
    1.k는 표본이 랜덤추출일 경우 1에 근접한다
    2. 만약 랜덤추출이 아니더라도 모집단에 타겟집단(현재 상황에선 미분류표를 생산하는 집단)이 랜덤분포하면 k= 1에
    근접한다.
    2-1. k=1이 아니라는 것은 미분류표를 생산하는 집단이 한쪽(2012 대선에선 박근혜투표자쪽)에 치우쳐서 분포한다는 얘기이다. 
    사족. 또 한 발 더 나아가서 k=1이 아닌 값에 무려 정규분포를 보인다는 것은 미분류표를 생산하는 집단이 일정한 패턴을 가지고 한쪽에 집중된다는 의미이다.
    3. 왜 이러한 패턴이 발생했는가?에 대해서는 여러가지 가설을 세울 수 있으며, 가능성이 있는 가설 중에는 현재 해킹설, 연령설이 있다.


    일단 이 글은 k의 의미를 설정하고 설명하는 것이 목적이고 소기 목적을 충분히 달성했다고 개인적으로 판단되므로 여기서 끝마칩니다.

    이 정보를 바탕으로 과게와 다른 커뮤니티에서 불타고 있는 논란과 온갖 데이터를 해석하기 더 편해졌기를 바랍니다. 더 플랜의 주장이 옳은지 아닌지를 판단하는 것은 이제 기초를 배운 여러분의 몫으로 남기겠습니다.

    길고 부족한 글 읽어주셔서 감사합니다. 
    진실의 침몰을 막기 위한 노력이 계속되길 바라는 마음에서
    이 부족한 글에 대한 온갖 태클을 환영합니다.

    이 게시물을 추천한 분들의 목록입니다.
    [1] 2017/04/24 00:58:35  182.222.***.96  오유댓글실록  472282
    [2] 2017/04/24 01:05:56  1.11.***.14  Young.K  25347
    [3] 2017/04/24 01:08:25  1.235.***.162  자이언트로보  740181
    [4] 2017/04/24 01:10:44  222.99.***.162  dacoon  113114
    [5] 2017/04/24 01:14:59  108.162.***.234  영재발골단  644189
    [6] 2017/04/24 01:21:24  211.57.***.24  뭐냐?  551803
    [7] 2017/04/24 01:25:56  61.109.***.140  S.Guri  5374
    [8] 2017/04/24 01:28:31  125.135.***.53  럭키쓰리  525931
    [9] 2017/04/24 01:30:20  124.56.***.120  brianjung  694018
    [10] 2017/04/24 01:30:52  218.147.***.207  때때찌찌  660362
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    68303
    수학 문의 드립니다 [7] 본인삭제금지 배고프다_참자 20/06/04 12:30 1152 0
    68302
    일론 머스크는 혼자 이세계물 찍는 느낌이네요 [4] 루빠 20/06/02 00:14 1564 3
    68301
    [상상] 200601. 에너지02 - 수소발전소 - 대산그린에너지 가동 커피스킨 20/06/01 14:49 762 0
    68300
    [상상] 200601. 에너지01 - 수소발전소 창작글 커피스킨 20/06/01 14:23 679 0
    68299
    알츠하이머 위험인자라던 유전인자가 [3] ↕永久童精 20/06/01 11:02 1008 1
    68298
    이제 은하수를 관찰하기 좋은 여름입니다.. [3] 레몬자몽주스 20/05/30 22:02 994 2
    68297
    이거 운동량 보존법칙을 이용해서 풀면 안되나요 [15] 본인삭제금지 숫사자갈기 20/05/29 13:56 1044 1
    68296
    종양에 대한 바이오메스 지도를 처음 만들어 봤고, 그 결과... ↕永久童精 20/05/29 08:22 872 2
    68295
    소화 관련 질문드립니다. [7] 본인삭제금지 will 20/05/28 20:51 709 0
    68293
    침팬치가 인간이 말하는 것처럼 입술을 움직여 소리내는 것을 관측 ↕永久童精 20/05/28 08:15 998 0
    68292
    남자유전자의 놀라운 사실! [3] 펌글 아스키월드 20/05/26 17:53 1759 0
    68291
    냄새나 공기를 눈으로 볼수 있나요? [4] genie0731 20/05/26 14:38 1095 0
    68290
    4% 인간인 쥐 배아 만들어냄 [3] ↕永久童精 20/05/23 16:48 1392 2
    68289
    행성 형성 중 ↕永久童精 20/05/23 16:39 985 0
    68288
    스페이스x 팔콘9의 2단계 로켓은 어떻게 되는건가요? [3] 체리맛효자손 20/05/23 15:51 761 0
    68284
    인간 망막 정도로 민감한 인조 눈이 5년 이내로 개발될 것이라는 뉴스 ↕永久童精 20/05/21 08:27 1157 4
    68283
    그레이엄 핸콕 풀발기할 뉴스 [5] ↕永久童精 20/05/18 16:17 1544 1
    68279
    신은 존재한다 [4] 허니앤밀크 20/05/18 01:35 1438 0
    68278
    고양이를 던져! ↕永久童精 20/05/17 08:40 1164 7
    68277
    지금 스카이 콩콩 타고 태양에서 가장 가까운 별로 가면 [4] ↕永久童精 20/05/11 10:32 2378 5
    68276
    지구에 가장 가까운 블랙홀까지 시속 100 km로 소나타 타고 가면 [13] ↕永久童精 20/05/11 08:35 1973 12
    68275
    지구에서 꽤 가까운 곳에 블랙홀 발견 [3] ↕永久童精 20/05/10 06:56 1776 5
    68274
    한 달간 굶으면 일 년간 굶을 수 있는 잠재력이 생긴다. [1] 윔크 20/05/09 18:10 2043 0/6
    68273
    실험용 쥐의 뇌를 완전히 3d atlas화 하는데 성공 ↕永久童精 20/05/09 11:35 1222 0
    68272
    어... 달에 오줌누러 갈래? ↕永久童精 20/05/09 11:12 1213 0
    68271
    인조 엽록체를 만들어서 이산화탄소를 유기물로 바꾸는데 성공 ↕永久童精 20/05/09 11:03 1082 8
    68268
    모동숲 꽃 교배를 보고 있는데요.. [4] TY 20/04/30 17:52 1173 1
    68267
    생물학 전공자 분들께 공부 커리큘럼 좀 질문드립니다 [4] 초고전파 20/04/29 16:08 763 1
    68266
    담달 말까지 과학 잡지 무료로 볼 수 있네요. [1] 붉은낙타 20/04/25 18:19 1050 5
    68264
    화학 공부하고 있는데 질문있습니다! [10] 본인삭제금지 달콤한드리머 20/04/24 23:01 862 0
    [◀이전10개] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [다음10개▶]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈