ASP.NET抓取网页内容-文字
ASP.NET抓取网页内容-图片
ASP.NET抓取网页内容-Post数据
ASP.NET抓取网页内容-防止重定向
ASP.NET抓取网页内容-保持登录状态
ASP.NET抓取网页内容-把当前会话带到WebRequest中
ASP.NET中抓取网页内容是非常方便的,而其中更是解决了ASP中困扰我们的编码问题。
需要三个类:WebRequest、WebResponse、StreamReader。
WebRequest、WebResponse的名称空间是:
System.Net
StreamReader的名称空间是:
System.IO
核心代码
WebRequest request = WebRequest.Create("http://www.cftea.com/");
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
WebRequest类的Create为静态方法,参数为要抓取的网页的网址;
Encoding指定编码,Encoding中有属性ASCII、UTF32、UTF8等全球通用的编码,但没有gb2312这个编码属性,所以我们使用GetEncoding获得gb2312编码。
示例
<%@ Page Language="C#" %>
<%@ Import Namespace="System.Net" %>
<%@ Import Namespace="System.IO" %>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<script runat="server">
void Page_Load(object sender, EventArgs e)
{
try
{
WebRequest request = WebRequest.Create("http://www.cftea.com/");
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
tb.Text = reader.ReadToEnd();
reader.Close();
reader.Dispose();
response.Close();
}
catch (Exception ex)
{
tb.Text = ex.Message;
}
}
</script>
<html xmlns="http://www.w3.org/1999/xhtml" >
<head runat="server">
<title>抓取网页内容-千一网络</title>
</head>
<body>
<form id="form1" runat="server">
<div>
<asp:TextBox ID="tb" runat="server" Width="500" Height="300" TextMode="multiLine"></asp:TextBox>
</div>
</form>
</body>
</html>
相关阅读
如何用Encoding指定编码
在ASP.NET中发送邮件(带SMTP验证、带附件)
ASP “小偷”程序
WebRequest发送Cookie、Referer
分享到:
相关推荐
内容索引:.NET源码,上传下载,图片上传,水印,生成缩略图 图片上传:生成缩略图,并加文字水印或图片水印,远程图片抓取(保存到本地)支持jpg、gif、bmp、png等,将抓取的图片以日期+原名称命名并保存,支持Html输入...
供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) ----------NONONONO-------------- 全局统一的缓存类(Cache.cs) 常用显示日期时间、农历、生肖的...
WHC.OrderWater.Commons 伍华聪 公共类源码 类库 帮助...供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) 简单写了点,还有很多,希望能对大家有帮助
----------Database-------------- 1.DataTable帮助类(DataTableHelper.cs) ...供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs)
----------Database-------------- 1.DataTable帮助类(DataTableHelper.cs) ...供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs)
----------Database-------------- 1.DataTable帮助类...供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) 简单写了点,还有很多,希望能对大家有帮助
22.供Asp.Net直接调用的包装类(WebPreview.cs) 23.计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) ----------NONONONO-------------- 1.全局统一的缓存类(Cache.cs) 2.常用显示日期时间、农历...
供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) 简单写了点,还有很多,希望能对大家有帮助 ====================================================...
22. 供Asp.Net直接调用的包装类(WebPreview.cs) 23. 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) ----------NONONONO-------------- 1. 全局统一的缓存类(Cache.cs) 2. 常用显示日期时间、...
供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) 简单写了点,还有很多,希望能对大家有帮助 ==================================================...
供Asp.Net直接调用的包装类(WebPreview.cs) 计算机重启、关电源、注销、关闭显示器辅助类(WindowsExitHelper.cs) 简单写了点,还有很多,希望能对大家有帮助 =================================================...
一改以往的用javascript打开目标站点的方法,从而成功的突破了两个一直限制文字交换系统发展的瓶颈--被插件的拦截和搜索引擎无法抓取链接代码中的数据和网站。链接中的合法站点都会被搜索引擎收录,其中部分站点的...
、远程抓取即为会员相册可以通过其它网站上的图片地址,系统会抓取该图片并保存到空间中! (9)验证码设置: 如果选择关闭,那么模板中所有相关的验证码表单都要手工去掉保存提交。 (10)服务升级设置:...
在一些抓取、过滤等情况下, 正则表达式 regular expression 的优势是很明显的。 例如,有如下的字符串: 代码如下:<li><a>”article-date”>[09/11]</span>FCKEditor高亮代码插件测试</a></li> 现在,需要提取 href...
特色功能:产品、新闻内容图片可以批量上传(免去一张张上传的烦恼),全站伪静态(优化SEO,对搜索引擎更友好),全站关键词可自动设置(每个页面关键词都有针对性),文章内容可以分页,图片渐显载入(优化显示速度...
特色功能:产品、新闻内容图片可以批量上传(免去一张张上传的烦恼),全站伪静态(优化SEO,对搜索引擎更友好),全站关键词可自动设置(每个页面关键词都有针对性),文章内容可以分页,图片渐显载入(优化显示速度...
24.网站集权,加入nofollow标签,不追踪无价值链接,引导搜索引擎蜘蛛更好的抓取有价值网页,快速提升排名;25.百度分享插件,用户将网站内容分享到第三方网站,引入社会化流量,给网站加权,快速提升排名;26.网站...