總網頁瀏覽量

2015年10月2日 星期五

[Java] 截取網路原始碼

雖然大學寫過, 但是都忘的差不多了,
只少參考一下別人的範例熟悉一下,
感覺頗有研究.

http://robertvmp.pixnet.net/blog/post/26585200-java---%E8%AE%80%E7%B6%B2%E9%A0%81%E7%AF%84%E4%BE%8B-


我只試了第一個範例, 其他以後再說.
 import java.net.*;
import java.io.*;

public class Read_web_page{
    public static void main(String args[]){
        String s = "http://www.taiwanlottery.com.tw/lotto/Lotto649/history.aspx";
        read(s);
    }
   
    public static void read(String str){
        int chunksize = 4096;
        byte[] chunk = new byte[chunksize];
        int count = 0;
       
        try{
            URL pageUrl = new URL(str);
           
            BufferedInputStream bis = new BufferedInputStream(pageUrl.openStream());
            BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("URL_1.txt",false));
            System.out.println("read run");
           
            while((count = bis.read(chunk, 0, chunksize))!=-1){
                    bos.write(chunk, 0, count);
            }
           
            bos.close();
            bis.close();
           
            System.out.println("Done");
        }catch(IOException e){
            e.printStackTrace();
        }
    }
}


目前這樣看, 好像是把原始碼先寫到chunk上,
在寫道開好擋的txt上.

之前寫抓奇摩某寫網站還要換個伺服器之類的,
目前好像應該不用.

沒有留言:

張貼留言