自己写一个网络爬虫蜘蛛程序 28 April 2010 22:33 Wednesday by 小屋 浏览(2730)

 

这里是维基百科对网络 爬虫的词条页面网络 爬虫以叫网络 蜘蛛网络 机器人,这是一个程序 ,其会自动的通过网络 抓取 互联网 上的网页 ,这种技术 一般可能用来检查你的站点上所有的链接是否是都是有效的。当然,更为高级的技术 是把网页 中的相关数据 保存下来,可以成为搜索引 擎。

从技相来说,实现抓取 网页 可能并不是一件很困难的事情 ,困难的事情 是对网页 的分析和整理 ,那是一件需要有轻量智能,需要大量数学计算的程序 才能做的事情 。下面一个简单的流程:


阅读全文>>

web标准常见问题整理 09 December 2009 22:19 Wednesday by小屋 浏览(912)

1.超链接访问过后hover样式就不出现的问题
2.FF下如何使连续长字段自动换行
3.ff下为什么父容器的高度不能自适应
4. IE6的双倍边距BUG
5. IE6下绝对定位的容器内文本无法正常选择的问题
6. IE6下为什么图片下方有空隙产生
7. IE6下这两个层中间怎么有间隙
8. list-style-image无法准确定位的问题
9. LI中内容超过长度后以省略号显示的方法
10.web标准中定义id与class有什么区别吗
11.如何垂直居中文本
12.如何对齐文本与文本输入筐
13.为什么FF下面不能水平居中呢
14.为什么FF下文本无法撑开容器的高度
15.为什么IE6下容器的宽度和FF解释不同呢
16.为什么web标准中IE无法设置滚动条颜色了
17.为什么我定义的样式没有作用呢
18.为什么无法定义1px左右高度的容器
19.为什么这个背景颜色无法显示
20.怎么样才能让层显示在FLASH之上呢
21.怎样使一个层垂直居中于浏览器中
22 .图片垂直与容器内
23.如何让三列横向排列
24.通用的加入收藏夹代码
25.复制到系统剪贴板之IE,ff兼容版
26.javascript为FF设置首页
27.IE6使用滤镜使PNG图片透明后,容器内链接失效的问题
28.禁用文本框中文输入法的通用方法

1.超链接访问过后hover样式就不出现的问题

阅读全文>>

apache的多站点配置方法 01 December 2009 1:15 Tuesday by小屋 浏览(1786)

 

本文来自小屋sjolzy.cn【原创】

例:主机IP是:192.168.1.1

你的主机上有三个域名:
www.a.com 网页文件放在E:\web\www\1
www.b.com 网页文件放在E:\web\www\2
www.c.com 网页文件放在E:\web\www\3

apache的httpd.conf中加入
#设置不同的域名到不同的目录
NameVirtualHost 192.168.1.1
<VirtualHost 192.168.1.1>  
DocumentRoot "E:\web\www\a"
ServerName www.a.com            
</VirtualHost>

<VirtualHost 192.168.1.1>  
DocumentRoot "E:\web\www\b"
ServerName www.b.com            
</VirtualHost>

阅读全文>>