모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 오유인페이지
    개인차단 상태
    칸나찡님의
    개인페이지입니다
    가입 : 07-07-02
    방문 : 3467회
    닉네임변경 이력
    회원차단
    회원차단해제
    게시물ID : programmer_577
    작성자 : 글냥이
    추천 : 0
    조회수 : 1610
    IP : 124.197.***.248
    댓글 : 6개
    등록시간 : 2014/01/19 01:25:18
    http://todayhumor.com/?programmer_577 모바일
    [자바에요]인터넷 신문기사 내용을 가져와서 저장하는건데요 크릉
    네이버나 다음이나 인터넷 기사 내용을 가져와서 저장하고 싶어요.
    근데 그냥 읽어오면 소스코드 그대로 긁어오게 되어버려서요...
    본문 내용만 가져오구 싶어요ㅠㅠ
    인터넷 기사 페이지 소스코드를 보면 
    (부분만 가져왔습니당. 실제로는 http://media.daum.net/politics/newsview?newsid=20140118183306795 에요)

    <div id="mArticlerole="main"> 
        <div id="newsWrap"> 
            <div class="news_wrap"> 
                <!-- 기사 상단 제목--> 
                <div class="section_subject"> 
                                    <div id="newsTitle"> 
                        <h3 class="tit_subjectid="newsTitleShadow">박원순 서울시장 "자치단체장은 갈등 조정자"</h3> 
                        <span class="tit_subtit"></span>  
                        <span class="info_data"> 
                        <span class="data">연합뉴스</span> </span> 
                    </div> 
                </div> 
                <!-- 기사 툴박스 --> 
                <div id="newsToolBox"></div> 
                <!-- 기사 본문 --> 
                <div class="section_contentid="contentsWrapper"> 
                    <h4 class="screen_outid="newsBodyShadow">(안양=연합뉴스) 이복한 기자 = 박원순 서울시장은 18일 "현장에 답이 있고 소통하면 해결점이 보인다"고 말했다.<br><br>박 시장은 이날 오후 5시 안양시청 대강당에서 열린 명사 초청 강연회에서 '소통이 답이고, 밥이고, 일자리입니다'라는 주제의 강연을 통해 이같이 밝혔다.<br><br>박 시장은 "올해는 말띠해인데 진짜 훌륭한 말은 말귀를 잘 알아듣는 말, 즉 소통"이라며 "현장에 답이 있고 대화가 소통"이라고 강조했다.<br><br><div class="imagestyle="width:500px;"><class="img"><img src="http://i2.media.daumcdn.net/svc/image/U03/news/201401/18/yonhap/20140118213206813.jpgwidth="500height="369alt=""></p><class="txt">↑ 강연하는 박원순 서울시장    (안양=연합뉴스) 이복한 기자 = 박원순 서울시장이 18일 오후 안양시청 대강당에서 '소통'을 주제로 강연하고 있다. 2014.1.18    [email protected]</p></div><div class="imagestyle="width:500px;"><class="img"><img src="http://i2.media.daumcdn.net/svc/image/U03/news/201401/18/yonhap/20140118213206866.jpgwidth="500height="393alt=""></p><class="txt">↑ 강연하는 박원순 서울시장    (안양=연합뉴스) 박원순 서울시장이 18일 오후 안양시청 대강당에서 '소통'을 주제로 강연하고 있다. 2014.1.18  << 안양시청 제공 >>   [email protected]</p></div>그는 은평뉴타운 문제, 동대문 거리상점(노점상) 해결 등을 예로 들며 "자치단체장은 갈등 조정자로 시민들과의 소통 속에 아이디어가 나왔다"고 소개했다.<br><br>그는 "21세기 행정은 시민들의 이야기를 잘 들어야 한다"며 "지역 발전은 멀리 있는 것이 아니라 자세히 보면 다 그 안에 답이 있다"고도 했다.<br><br>박 시장은 소통의 중요성을 강조했으나 정치 문제와 관련해서는 언급하지 않았다.<br><br>[email protected]<br><br>(끝)<br><br><dl><dd><br><br></dd><dt></dt></dl><저작권자(c)연합뉴스. 무단전재-재배포금지.><br><br></h4> 
                    <div class="screen_outid="newsCopyrightShadow">저작권자(c)연합뉴스. 무단전재-재배포금지</div> 
                    <div id="banner250"></div> 
                    <!--뉴스 동영상--> 
                    <div class="videoid="medipotArea"></div> 
                    <!-- 뉴스 본문 --> 
                    <div id="newsBody"></div> 
                    <!--뉴스 관련기사--> 
                    <div id="cpRelatedNewsList"></div> 
                    <div id="cpRealtimeMainNewsList"></div> 
                    <!--뉴스 하단 툴박스--> 
                    <div class="news_footerid="newsFooter"></div> 
                    <!-- 추천버튼 --> 
                    <div class="news_btn"> 
        <class="btn_news btn_recommid="recommendBtndata-rankup-object-type="MediaNewsdata-rankup-object-id="20140118183306795href="#none"> 
            <span class="inner_recomm"> 
                <span class="screen_out">추천 </span> 
                <span class="txt_num"></span> 
            </span> 
        </a> 
    </div>


    id="newsBodyShadow">를 기점으로 본문내용이 시작됩니다.
    저걸 이용해서 처음 가져올 때 본문 내용만 가져올 수 없나...싶은데요
    어케 해야 할까요?ㅠㅠ
    밑에 자바코드는 지금까지 만든 코드입니당. ㅜㅜ



    /* 
     * 이 프로그램은 인터넷 신문 기사 내용을 저장하기 위해 만들었습니당. 
     * Daum의 경우 신문 기사 url은 보통  
     * http://media.daum.net/society/?newsId=20140118211405428 
     * 형식으로 되어있습니다. 
     * 맨 뒤의 수를 1씩 증가시켜가면서 각 인터넷 기사의 소스코드에 있는 "본문" 부분을 가져올거에요. 
     */
     

    import java.io.*; 
    import java.net.*; 

    public class Boogi { 
        public static void main(String[] args) { 
            // urlName = urlNameDir + urlNameNum; 이런 식으로... 
            String urlNameDir = "http://media.daum.net/society/?newsId="
            long urlNameNum = 20140118211405428L;     
            String urlName = null
             
            // outFileName = dirName + fileName + count + fileFormat; 이런 식으로... 
            // result1.txt, result2.txt, ... 이런 형식으로 저장할거에요. 
            String dirName = "c:/users/woongjin/desktop/data/"
            String fileName = "result"
            int count = 0
            String fileFormat = ".txt"
            String outFileName = null
                 
             
            URL url; // 여기서 InputStream을 가져올거에요. 
            BufferedInputStream bis; 
            BufferedOutputStream bos; 
            FileOutputStream fos; 
             
             
            try { 
                for(int i = 0; i < 10; i++) { // 신문기사 몇 개를 가져올건지 정할 수 있어요. 
                    // url로부터 InputStream을 가져오구요 
                    urlName = urlNameDir + String.valueOf(urlNameNum);     
                    url = new URL(urlName); 
                    bis = new BufferedInputStream(url.openStream()); 
                     
                    // 각 기사에 따라 count를 1씩 늘려가며 새로운 파일을 만들어요. 
                    outFileName = dirName + fileName + (++count) + fileFormat; 
                    fos = new FileOutputStream(outFileName); 
                    bos = new BufferedOutputStream(fos); 
                     
                    // 읽어오고 저장합니당. '\\r'은 안하면 이상하게 나오더라구요 킁... 
                    int data = 0
                    while((data = bis.read()) != -1) { 
                        if(data == '\\n'
                            bos.write('\\r'); 
                        bos.write(data); 
                    } 
                     
                    bis.close(); 
                    bos.close(); 
                    urlNameNum++; 
                } 
            } catch(Exception e) { 
                e.printStackTrace(); 
                System.exit(0); 
            } 
        } 
    }
    글냥이의 꼬릿말입니다



    <style>#okNokBookDiv img{content:url("http://thimg.todayhumor.co.kr/upfile/201312/1387635212a6x9jURsp.jpg");}#okNokBookDiv img:nth-child(2){content:url("http://thimg.todayhumor.co.kr/upfile/201312/1387635212a6x9jURsp.jpg");}#okNokBookDiv a img{content:url("http://thimg.todayhumor.co.kr/upfile/201312/1387635212a6x9jURsp.jpg");}</style>

    <style> div.writerInfoBgMiddle {background-image:url(http://thimg.todayhumor.co.kr/upfile/201401/1389094315vQEcRW5LGs6zwzEn82Y2Ok.png);} </style>

    <style>#login_span span b a:before{content: "글냥이의 사역마 ";}#memo_insert_ div b:before{content: "글냥이의 사역마 ";}</style>

    <style>textarea{background:url(http://thimg.todayhumor.co.kr/upfile/201401/1388604479R9q6U8rB8uCQHJVyexn6.png);background-position:bottom right;}</style>

    <style>div.whole_box {background: url('http://thimg.todayhumor.co.kr/upfile/201401/1388605374NhBJXzKSRLK8YGdpLsL7PpFqsayzyI.jpg'); background-attachment: fixed; background-repeat: no-repeat; background-position: bottom center; background-size: 1700px;}</style>

    이 게시물을 추천한 분들의 목록입니다.
    푸르딩딩:추천수 3이상 댓글은 배경색이 바뀝니다.
    (단,비공감수가 추천수의 1/3 초과시 해당없음)

    죄송합니다. 댓글 작성은 회원만 가능합니다.

    번호 제 목 이름 날짜 조회 추천
    41
    [이클립스] 단어에 커서 옮겨놓으면요 [1] 글냥이 14/03/10 22:12 27 0
    40
    [Java/AWT] 윈도우즈 탐색기같은거 어케 만들어요? [2] 글냥이 14/03/09 16:11 28 0
    39
    [Java/AWT] TextField에서 getText()의 defaul [3] 글냥이 14/03/05 15:01 21 0
    38
    [JAVA/AWT] 이벤트를 코드로 발생시킬 수 있나요? [1] 글냥이 14/03/03 20:07 12 0
    37
    [Java/AWT] 레이아웃이 null 이 아닐 때 크기 지정이...ㅜㅜ [1] 글냥이 14/02/23 22:35 17 0
    36
    [Java/AWT] repaint 시켜도 화면이 바뀌지 않아요 ㅜㅜ 글냥이 14/02/23 01:17 11 0
    35
    [자바, jar파일 실행] 더블클릭으로 실행하고 싶은데요.... [3] 글냥이 14/02/13 21:52 19 0
    34
    [자바 AWT] 하아...Panel에 그린게 없어져요 ㅜ 글냥이 14/02/12 23:41 13 0
    33
    sql은 여기에 물어봐도...되겠죠? [5] 글냥이 14/02/12 13:41 58 0
    32
    안드로이드 개발 공부해보려는데요 [4] 글냥이 14/02/04 14:53 34 0
    31
    자바 AWT 질문좀요 ㅜㅜ 글냥이 14/01/30 16:36 18 0
    [자바에요]인터넷 신문기사 내용을 가져와서 저장하는건데요 크릉 [6] 글냥이 14/01/19 01:25 17 0
    29
    취업 준비중인데요 막막해요 ㅜㅜ [1] 글냥이 14/01/15 17:40 52 0
    28
    javac 명령어 질문좀요 ㅜㅜ [2] 글냥이 13/12/21 13:42 25 0
    27
    C++ string 배열의 크기를 어떻게 알아내면 좋을까요? [12] 글냥이 13/12/18 23:57 64 0
    26
    윈도8 단축키 설정할 수 있나요? 글냥이 13/12/15 22:20 18 0
    25
    그 오유 화면 꾸미는거 어케 해요?? [3] 글냥이 13/11/21 14:49 63 1
    24
    노트북이랑 모니터 연결할때요 [3] 글냥이 13/08/04 03:01 27 0
    23
    윈도8 cpu점유율 왤케 높나요 ㄷㄷ [3] 치즈브라우니 13/03/16 17:38 46 0
    22
    램 듀얼채널 이거 신기하네영 ㅎㅎ [6] 치즈브라우니 13/02/05 21:18 47 1
    21
    울트라북으로 빔프로젝트 연결할때 [3] 치즈브라우니 13/01/24 17:29 24 0
    20
    여러장의 CD에 나뉘어져있는 설치파일을 usb로 옮기는거요 [1] 치즈브라우니 13/01/19 18:16 30 1
    19
    노트북 구매하려는데요 사양 보는게 좀 힘드네요 ㅎㅎ 도움을.. [2] 치즈브라우니 13/01/16 17:24 44 0
    18
    Intel Celeron 1007U 치즈브라우니 13/01/13 21:25 26 0
    17
    이거 여기에 물어봐도 되는건가 모르겠지만요...ㅜㅜ 치즈브라우니 12/02/22 22:15 17 0
    16
    kt 와이브로로 맵 어플 사용할 수 있나요? MMS는요? [2] 불토끼 11/09/14 00:09 28 0
    15
    요즘 3G 연결 잘 되나요? [4] 불토끼 11/09/13 13:05 123 0
    14
    kt와이브로 에그 속도 문의드립니다. [1] 불토끼 11/09/10 12:23 61 1
    13
    갤2 중고 싸게 살려면 어케 해야되요? [1] 불토끼 11/09/10 10:11 77 0
    12
    geforce 9800gt 사용중입니다. 게임 얼마나가능한가요? [3] 불토끼 11/09/02 13:14 115 0
    [1] [2] [3] [4] [5]
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈