• ----:)欢迎访问源码网(:----
    • 首页
    • 博客
    • 学院
    • 下载
    • 论坛
    • 影视
    • 发布源码
    • RSS
    • ITPig
    • 笑话网
    • 百家姓
    • 繁體中文

源码网 - 中国第一源码门户
选择镜像:网通镜像 - 电信主站
  • 首 页
  • 新闻动态
  • 网站运营
  • 网页制作
  • WEB开发
  • 编程开发
  • 图像媒体
  • 操作系统
  • 数据库
  • 服务器
热门搜索 优化 SEO 故事 cms IIS7 MySQL 个人 AdSense 主题推广 | 文章搜索: 高级搜索
会员登录/控制面版您的位置: 学院首页 >> WEB开发 >> ASP开发 >> ASP技巧 >> 详细内容
 

推荐文章

 
 

热点文章

  • ASP采集教程基础篇
  • ASP+JS三级联动下拉菜单[调用数据库数据]
  • 根据IP地址自动判断转向分站的代码
  • 如何使ASP程序暂停指定的时间后再继续执行
  • WEB打印大全
  • 同一个空间不同的域名实现访问不同的文件夹
  • 防止网上重复投票的方法
  • 精华ASP代码
  • 小偷程序原理和简单示例
  • Asp限制IP访问
  • ASP自动解压RAR文件
  • 实现页面重定向
 
 

相关文章

 
 

百度搜索

 
 

ASP采集教程基础篇

  • 阅览次数:
  • 文章来源: CRXB
  • 原文作者: kittenchen
  • 整理日期: 2007-02-15
  • 发表评论
  • 字体大小:
  • 小
  • 中
  • 大

    做一个好的教程就是要让人看懂,我早先买教程书看到第一章千篇一律都是计算机发展史再加历史回顾和前景展望,烦死。
所以本教程就不讲一些没用的东西了,直接转入正题(我的风格),大家有什么问题可以联系
我的QQ:15057835.
也可以到我的小站:
软  件  站:http://www.crxb.com/
个人论坛:http://www.51too.com/
    ASP采集其它就是利用微软自带的XMLHTTP组件取得远程页面的源代码,再经过程序的过滤替换处理转换成我们想要的数据。我们也不管用什么,反正我教你的就是用一段代码取得目标代码,  再把目标代码加工一下。然后直接显示啊还是写入数据库。就这么简单!
引用组件CreateObject("Microsoft.XMLHTTP")  --->取得目标代码(get) ---> 数据处理(截取,过滤,替换) --->  直接显示(小偷)或 写入数据库(采集)
说了这么多是要开始实战了.
     二话不说,先写个刚刚讲到的引用组件和取得代码的函数
    ' 获取远程HTML
    Function GetURL(url)
            Set Retrieval = CreateObject("Microsoft.XMLHTTP")
            With Retrieval
                .Open "GET", url, False
               .Send
               GetURL = .responsebody
            if len(.responsebody)<100 then
                response.write "获取远程文件 <a href="&url&" target=_blank>"&url&"</a> 失败。"
                response.end
            end if
            End With
            Set Retrieval = Nothing
        End Function
上面这段函数的URL值就是我们的目标网页,也就是要偷的页面了。
当然我们得到的代码是以二进制返回给我们的,那我们得把他转换成我们要的字符,怎么办?
怕什么?我自己不会写难道还不会上网找啊。找到了,怎么实现的我们当然不管它了,只要能用就行了,函数代码如下:
' 二进制转字符串
function bytes2bstr(vin)
       strreturn = ""
       for i = 1 to lenb(vin)
       thischarcode = ascb(midb(vin,i,1))
       if thischarcode < &h80 then
              strreturn = strreturn & chr(thischarcode)
       else
              nextcharcode = ascb(midb(vin,i+1,1))
              strreturn = strreturn & chr(clng(thischarcode) * &h100 + cint(nextcharcode))
              i = i + 1
       end if
       next
       bytes2bstr = strreturn
end function
OK!
有了这两个函数基本上可以实现简单的小偷了。
我今天就找天空的软件资讯开刀,地址是: http://www.skycn.com/article/index_article.html
开工:
1,建立一个ASP文件,我建的是index.asp
<%
%>
先写好啊,要养成这样的习惯哦。
定义一下地址和调用函数
dim url,html
    url="http://www.skycn.com/article/index_article.html"
    Html=GetURL(url) '把地址url传递到GetURL这个函数
       Html=Bytes2BStr(Html) '二进制转换成字符一下
再把刚刚两个函数写进去
最后看一下是否偷到了,我们response一下
Response.write html
整个文件内容就是:
<%
On Error Resume Next
Server.ScriptTimeOut=9999999
dim url,html
    url="http://www.skycn.com/article/index_article.html"
    Html=GetURL(url) '把地址url传递到GetURL这个函数
       Html=Bytes2BStr(Html) '二进制转换成字符一下
' 获取远程HTML
Function GetURL(url)
    Set Retrieval = CreateObject("Microsoft.XMLHTTP")
    With Retrieval
        .Open "GET", url, False
        .Send
        GetURL = .responsebody
       if len(.responsebody)<100 then
              response.write "获取远程文件 <a href="&url&" target=_blank>"&url&"</a> 失败。"
              response.end
       end if
    End With
    Set Retrieval = Nothing
End Function
' 二进制转字符串
function bytes2bstr(vin)
       strreturn = ""
       for i = 1 to lenb(vin)
       thischarcode = ascb(midb(vin,i,1))
       if thischarcode < &h80 then
              strreturn = strreturn & chr(thischarcode)
       else
              nextcharcode = ascb(midb(vin,i+1,1))
              strreturn = strreturn & chr(clng(thischarcode) * &h100 + cint(nextcharcode))
              i = i + 1
       end if
       next
       bytes2bstr = strreturn
end function
Response.write html
%>
试了一下,果真取到了。有图为证:

为什么我们得到的内容图片啊链接啊什么的都不会对呢?
那是因为我们只是仅仅得到目标的源码代并在我们的文件上显示而已。
怎么才能显示正确的图片和正确的链接呢,那就是我们下一篇要讲的数据处理部分了
如何?学到了吗?换其它地址试试!!
祝你愉快,下一课马上就来!

[1] [2]

上一篇:比AcdSee功能还强大的图片处理、编辑软件,推荐下载!
下一篇:ASP上传漏洞防范
  • 网友评论:
  • 查看所有评论
  • 我要发表评论
您的网名:
留言主题:
你要发表的内容:

 

关于本站 | 广告联系 | 版权声明 | 网站地图 | 发布软件 | 帮助中心 | 源码论坛

Copyright © 2005-2007 CodePub.Com  程序支持:木翼  滇ICP备05005971号