Java爬虫.入门
发布日期:2021-05-07 02:45:58 浏览次数:22 分类:精选文章

本文共 2241 字,大约阅读时间需要 7 分钟。

**

Java爬虫.入门小实例:

今天看视频跟着大神进行爬取CSDN上的主页面,感觉很牛的样子,分享以下,哈哈~~

**

4.0.0
cn.itcast
itcast-crawler-first
1.0-SNAPSHOT
//这里开始是从网上maven官网借套的~~
org.apache.httpcomponents
httpclient
4.5.2
org.slf4j
slf4j-log4j12
1.7.25
test
package cn.itsast.crawlar.test;import org.apache.http.HttpEntity;import org.apache.http.client.methods.CloseableHttpResponse;import org.apache.http.client.methods.HttpGet;import org.apache.http.impl.client.CloseableHttpClient;import org.apache.http.impl.client.HttpClients;import org.apache.http.util.EntityUtils;import java.io.IOException;public class CrawlarFirst {       public static void main(String[] args) throws IOException {           // 1.打开浏览器,创建HttpClient对象        CloseableHttpClient httpClient = HttpClients.createDefault();        // 2.输入网址,创建HttpGet对象        String url = "https://www.csdn.net/";        HttpGet httpGet = new HttpGet(url);        // 3.回车键,请求,响应,使用HttpClient对象发起请求        CloseableHttpResponse response = httpClient.execute(httpGet);        // 4.解析响应,获取数据        // 判断状态码是否为200        if (response.getStatusLine().getStatusCode() == 200) {               HttpEntity httpEntity = response.getEntity();            String content = EntityUtils.toString(httpEntity, "utf8");            System.out.println(content);        }    }}

结果:

    
CSDN-专业IT技术社区
上一篇:超炫粒子漩涡
下一篇:java.面向对象.封装性.this关键字

发表评论

最新留言

不错!
[***.144.177.141]2025年03月23日 13时03分56秒