모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 오유인페이지
    개인차단 상태
    만두소보로님의
    개인페이지입니다
    가입 : 16-04-11
    방문 : 414회
    닉네임변경 이력
    회원차단
    회원차단해제
    게시물ID : programmer_19040
    작성자 : 만능소보로
    추천 : 10
    조회수 : 9293
    IP : 222.233.***.141
    댓글 : 13개
    등록시간 : 2016/11/18 21:40:17
    http://todayhumor.com/?programmer_19040 모바일
    [Python3] 네이버 카페 댓글 수집 스크립트 입니다.
    * 2016년 11월 19일 02:08 추가

    글 올린 이후에 권한이 필요한 댓글 수집은 막혔어요. 공개글 댓글만 가능해요.




    네이버 카페 댓글 수집기 코드를 짰습니다. 월요일에 짰는데 사정이 있어 지금에야 올리네요.

    카페번호(clubid)와 글번호(articleid)를 입력하면 댓글을 모아 csv로 출력해서 스프레드시트(엑셀)로 읽을수 있게 했어요.

    Python3로 작성했구요. (파이썬2로는 실행안되요)
    웹이나 앱쪽이 아니다보니까 파이썬은 제대로 공부한적이 없어서 문법적으로 틀린게 있을지도 몰라요 . for문 문법도 몰라서 인터넷 찾아보고;;; 그래도 인터넷 찾아 뚝딱 이런걸 만들수 있는걸 보면...
    파이썬이 정말 강력하네요.

    * 아래의 주소(페이스트빈)로 보는게 깔끔해요. Run(온라인테스트)은 안되더라요.
    https://glot.io/snippets/ekff7ak3lo


    import json
    import urllib.request
    import random
    import time

    # by 만능소보로 in 오늘의유머 when 2016.11.14

    def requestComment(clubID, articleID, page):
        commentURL = "http://cafe.naver.com/CommentView.nhn?search.clubid=" + clubID + "&search.articleid=" + articleID + "&search.page=" + str(page)

        # 가져오기.
        try:
            print("요청중[" + str(page) + "] : " + commentURL)
            requestResult = (urllib.request.urlopen(commentURL).read()).decode("utf-8")
        except:
            print("연결에 문제가 생겼어요...")
            exit()

        # JSON으로 파싱하기.
        try:
            commentJson = json.loads(requestResult)
        except:
            print("혹시 숫자 잘못입력한거 아니죠? 확인하고 다시 시도해주세요.")
            exit()

        # 정상적으로 파싱됬나?
        commentResult = commentJson.get("result")
        if commentResult is None:
            print("어? 필요한 값이 사라졌어요...(바뀌었나?)")
            exit()
        return commentResult

    # 입력.
    clubID = input("카페 번호(clubid)는? : ")
    articleID = input("글 번호(articleid)는? : ")

    # 첫페이지 가져와요.
    commentResult = requestComment(clubID, articleID, 1)

    # 변수 확인!!!
    commentTotalCount = commentResult["totalCount"]
    commentCountPerPage = commentResult["countPerPage"]
    commentPage = 0
    if commentTotalCount > 0:
        commentPage = ((commentTotalCount - 1) // commentCountPerPage) + 1;

    print("")
    print("총 댓글수 : " + str(commentTotalCount))
    print("댓글 페이지 : " + str(commentPage))
    print("")

    resultText = "번호\t날짜\t유저ID\t유저닉네임\t내용\t대댓글여부\t삭제여부\n"
    for page in range(1, commentPage + 1):
        if commentResult is None:
            commentResult = commentResult = requestComment(clubID, articleID, page)
        else:
            print("요청중[" + str(page) + "] : 이미 가져왔었음.")

        # 개별 댓글 수집
        commentLists = commentResult["list"]
        for eachComment in commentLists:
            #
            eachCommentID = eachComment["commentid"]
            eachCommentDate = eachComment["writedt"]
            eachCommentUserNickname = eachComment["writernick"]
            eachCommentUserID = eachComment["writerid"]
            eachCommentContent = eachComment["content"].replace("\t", " ")
            eachCommentReplayID = eachComment["refcommentid"]
            eachCommentIsReply = eachComment["refComment"]
            eachCommentISDeleted = eachComment["deleted"]
            #
            resultText += str(eachCommentID) + "\t"
            resultText += eachCommentDate + "\t"
            resultText += eachCommentUserNickname + "\t"
            resultText += eachCommentUserID + "\t"
            resultText += eachCommentContent + "\t"
            if eachCommentIsReply == True:
                resultText += str(eachCommentReplayID) + "\t"
            else:
                resultText += "\t"
            resultText += str(eachCommentISDeleted) + "\n"

        commentResult = None # 비우면 다음 루프때 받을거야.
        time.sleep(random.uniform(0.75, 1.25)) # 예의상 사람인척 딜레이를 주었다.



    try:
        resultFile = open("navercafe_comment_" +  clubID + "_" + articleID + ".csv", 'w')
        resultFile.write(resultText)
    finally:
        resultFile.close()

    # 작업 완료
    print("\n\n끝!!!")
    time.sleep(random.uniform(1.5, 2.5))
    print("\n\n\(안녕)/\n\n")
    time.sleep(random.uniform(1.5, 2.5))


    예제로 아사모의 공지글로 테스트를 했습니다.
    * 왜 아사모냐 하면... 이 글을 쓰는 게시판이 "프로그래머 게시판"이라, 현재 컴퓨터 카페 랭킹 1위로 골랐어요. 댓글 많은 공지글도 있구요.


    글번호나 카페번호 확인하는 방법은 다음과 같구요.

    ncc_001.png

    (왜 덧글수가 왜 1 차이 나는지는 잘 모르겠어요;;; 일일히 확인할수도 없고...)



    ncc_002.png

    결과물(.csv)는 탭으로 구분해서 열면 되요. (콤마, 세미콜론등 다 빼고 으로만 나누세요! 섞이면 본문하고 충돌나요.)

    5000개급 댓글 수집 잘 됬으니까 만개도 충분할거에요.

    이벤트 운영같은 선의의 목적(꼬릿말 참고)으로만 참고하세요~



    _.png


    * 꼬릿말이 기니까 짤려보여서 본문에도 옮겨요.

    1.
    VBA가 웹페이지 접속이나 JSON 다룰수 있다면 컨버팅도 가능할거에요.

    2.
    질문글 올리셨던 분은 몇일간 기다려도 접속않고... 드디어 접속수 1늘긴했는데 답이없고...
    이러려고 코드짰나 자괴감 들어...

    3.
    조금 충격적인데... 네이버 카페 댓글 API에 보안장치가 없어요;;;
    다시 말하면, 비밀글(회원 전용, 특정 등급 전용)의 댓글을 아무나 열람할수 있어요.
    막말로 파폭, 크롬, IE(인터넷 익스플로러)의 기본 개발자도구만 있어도 확인할수 있더만요... 그래도 나름 네이버인데 댓글API에 세션검사같은거 전혀없고... API주소 + 카페번호 + 글번호면 본문은 못보더라도 댓글은 확인할수 있었다니...
    운영게시판 있거나 회원제로 운영하는 카페에게는 상당히 예민할수 있는 보안문제입니다.

    글 올린 이후에 권한이 필요한 댓글 수집은 막혔어요. 공개글 댓글만 수집 가능해요.

    4.
    지나친 자동화는 누군가의 일자리를 빼앗습니다. 그게 당신일수도 있구요.
    상사에게 들키지 마세요. :D



    만능소보로의 꼬릿말입니다
    1. 
    VBA가 웹페이지 접속이나 JSON 다룰수 있다면 컨버팅도 가능할거에요.

    2.
    질문글 올리셨던 분은 몇일간 기다려도 접속않고... 드디어 접속수 1늘긴했는데 답이없고... 
    이러려고 코드짰나 자괴감 들어...

    3. 
    조금 충격적인데... 네이버 카페 댓글 API에 보안장치가 없어요;;;
    다시 말하면, 비밀글(회원 전용, 특정 등급 전용)의 댓글을 아무나 열람할수 있어요.
    막말로 파폭, 크롬, IE(인터넷 익스플로러)의 기본 개발자도구만 있어도 확인할수 있더만요... 그래도 나름 네이버인데 댓글API에 세션검사같은거 전혀없고... API주소 + 카페번호 + 글번호면 본문은 못보더라도 댓글은 확인할수 있었다니...
    운영게시판 있거나 회원제로 운영하는 카페에게는 상당히 예민할수 있는 보안문제입니다.
    -> 변경) 글 올린 이후에 권한이 필요한 댓글 수집은 막혔어요. 공개글 댓글만 수집 가능해요.

    4.
    지나친 자동화는 누군가의 일자리를 빼앗습니다. 그게 당신일수도 있구요.
    상사에게 들키지 마세요. :D

    이 게시물을 추천한 분들의 목록입니다.
    [1] 2016/11/18 21:45:58  121.180.***.146  2ane  620419
    [2] 2016/11/18 21:56:11  61.255.***.63  돈로사리오  555749
    [3] 2016/11/18 22:13:33  119.204.***.6  을파소  440752
    [4] 2016/11/18 22:27:58  182.224.***.219  노력의천재  214821
    [5] 2016/11/19 01:13:25  39.120.***.54  高坂麗奈  535623
    [6] 2016/11/19 01:49:54  182.211.***.111  cobain  273427
    [7] 2016/11/19 13:27:47  211.219.***.56  앵켕  591582
    [8] 2016/11/20 08:28:20  118.223.***.34  금간유리멘탈  730909
    [9] 2016/11/20 19:25:46  121.141.***.184  오늘의컴퓨터  620131
    [10] 2016/11/20 20:11:49  210.180.***.19  사닥호  425608
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    9
    BBC 방송사고 아이들 너무 귀여워요.gif (움짤) [2] 만두소보로 17/03/11 19:07 582 11
    8
    오징어머리로 해석한 디지털뉴스 이용규칙 만두소보로 17/01/22 14:07 367 4
    [Python3] 네이버 카페 댓글 수집 스크립트 입니다. [14] 만능소보로 16/11/18 21:40 65 10
    6
    오유에서 간단하게 움짤(GIF) 저장하는 방법. 렛즈 짤줍타임! [4] 만능소보로 16/11/16 01:26 126 5
    5
    [사과글]2016년10월6일 SBS 8시 뉴스 욱일기 오해 사과글 [2] 본인삭제금지 만능소보로 16/10/07 23:16 194 8
    4
    중고나라에서 공장B품(파품)을 받은것 같습니다. 어떻게해야할까요? [11] 창작글본인삭제금지외부펌금지 소보로장인 16/07/11 17:31 190 3
    3
    오늘의유머 RSS(개인용) 및 Feed43 스크립트 정리 [1] 창작글 소보로장인 16/06/11 04:18 40 2
    2
    일상 짤방/움짤.gif 몇개 [6] 소보로장인 16/05/29 02:45 76 6
    1
    분유에다가 물타고 우유조금 더 넣어 밀크(=우유)라고 파네요 [14] 소보로장인 16/05/15 16:01 336 7
    [1]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈