------------------------------------- http://hi.baidu.com/4410828 ----------------------------------------
以www.dede.com的html教程中的数据库为例,地址是
http://www.dedecms.com/web-art/htmlbase/HTML/index.html
一,打开dedecms,进入【采集节点管理】,新建一个节点,模型我们就选择

------------------------------------- http://hi.baidu.com/4410828 ----------------------------------------
二,填写节点的基本信息:

名称就自己定义吧。
编码就比较重要,大家可以在页面点击右键来看该页面的编码。
来源就自己定义吧。
防盗链就看目标站点的有无刷新限制,有就设置一下超时时间。
------------------------------------- http://hi.baidu.com/4410828 ----------------------------------------
三,设置采集列表:
我们要采集的列表是这样的:

而我们要设置的列表是这样的:

下面我们来说明一下这个设置是怎么填的。
来源网址很重要的。列表的获取就是从这里得到的。
自己打开:http://www.dedecms.com/web-art/htmlbase/HTML/list_33_2.html
看看分页的规律。不难看出吧?
然后我们在设置列表分页时,就转换为变量值的形式:
http://www.dedecms.com/web-art/htmlbase/HTML/list_33_[var:分页] .html
而变量起始值是1,结束值是3,就代表1至3的列表页了。
正则配置网址就看本身是否有比较特定的文章网址字符。例如page1.html之类的。
下面的html范围就比较重要。
我们看原dede的列表。我们在浏览器里查看源文件。
查找以下代码:

看到这里,你一定要认识常用的html代码。
这里要复制代码起始就是那个文章列表的表格的开始部分吧。
下面就是文章列表的表格的结束部分的代码:

都相应地复制过去,这样列表的获取就成功了。
下面的制定网址就不用说吧?你想特别采集什么网址,就直接填上吧。
RSS订阅






收 藏
推 荐