立即注册找回密码
 

奇瑰网

社区官方在线联系

工作时间: 周一到周五早上09:00-11:00, 下午03:00-05:00, 晚上08:30-10:30(周六、日休息)
点击这里给我发消息 点击这里给我发消息
QQ: 1721016987  TEL: qiguiqiqiku@foxmail.com  E-Mail: qiguiqiqiku@foxmail.com
用户交流QQ群
①群87904533 ③群943814120 ④群123475361 ←提醒:请勿重复加群, 谢谢合作

[分享源码] 织梦DEDECMS在线小说网整站24H全自动采集源码+WAP手机版

[复制链接]

533

主题

743

帖子

113万

积分

奇瑰技术组

Rank: 7Rank: 7Rank: 7

G币
1122260
信用
1814
体力
2612

技术大神论坛版主分享大神

发表于 2019-10-7 19:49:02 | 显示全部楼层 |阅读模式
织梦DEDECMS在线小说网整站24H全自动采集源码+WAP手机版 小说源码截图.jpg " _! @0 B# x% q( E4 i, _& }* i

3 y6 f& ^4 S/ f% ?DEDECMS织梦新书织梦新书小说网站源码,选用dedecms5.7sp1作为核心,全主动收集各大小说站,可主动生成主页、分类、目录、排行榜、sitemap页面静态html,全站拼音目录化,章节页面伪静态,自动生成小说txt文件,主动生成zip压缩包。此源码功用可谓是强悍至极,其他更多功用请自己下载体会吧。. J+ ~' C, Q! x) f" ]
3 }! p) I, b/ u2 Z' u/ x% ^

& |/ l  E: s5 u+ Z8 `8 @% y环境言语:PHP5.2/5.3/5.4/5.5+MYSQL5+伪静态 编码类型:GBK 由于对源码进行了修改和优化,因此不要主动晋级。一般没有bug的情况下也不需要晋级。  D+ T, Z) l. _, c0 b0 r

' c+ X+ l  o% c1 @- M2 c程序说明
2 G" l2 O! O/ E# O! D- h1、源码类型:小说整站源码
9 c. Z0 p' m' O9 S% `/ o/ O2、环境语言:PHP5.2/5.3/5.4/5.5+MYSQL5+伪静态
4 u+ m: S! F% e* z- N3、原始程序:源码采用dedecms5.7sp1作为核心,由于对源码进行了修改和优化,因此不要自动升级。一般没有bug的情况下也不需要升级,店主会不定时提供必要的升级包。
8 l% r% _. ^7 v* O9 C$ d! c6 j4、编码类型:GBK  g3 u* w4 I/ Y9 }+ U* s
5、可否采集:全自动采集
9 f  q- Y( F- u# W4 }6、演示站点:http://www.17ksl.com
7 K% X9 V: q7 [" K- [7、其他特点:
2 s  w% I9 n& t3 r# K: j* e(1)自动生成首页、分类、目录、排行榜、sitemap页面静态html(分类页面、小说封面、作者页面的html文件如果不存在或者超过设置的时间没有更新,会自动更新一次。如果有采集的,采集时会自动更新小说封面和对应的分类页面),通过PHP直接调用html文件,而不是生成在根目录中,访问速度与纯静态没有区别,且可以在保证源码文件管理方便的同时减少服务器压力,还能方便访问统计,增加搜索引擎认可度。# l; F$ {! N  ^1 Y- z" x- B: k
(2)全站拼音目录化,章节页面伪静态。
" Q( M: h4 \" ^3 l. ?( a(3)自动生成小说txt文件,也可以后台自己重新生成txt文件。
8 }& Z% \0 d: M(4)自动生成小说关键词及关键词自动内链。
" o9 T* h1 Y8 w(5)自动伪原创词语替换(采集时替换) 。
' `- p* }. ]3 y(6)增加小说总点击、月点击、周点击、总推荐、月推荐、周推荐的统计和作者推荐统计等新功能。. x& j+ _( V  X  P' Z
(7)配合CNZZ的统计插件,能方便实现小说下载明细统计和书籍被收藏的明细统计等。: |6 m3 H" V1 Z$ ?2 G- y9 C

7 }: U6 ]/ |9 C# F0 g一、安装说明  U3 F6 z0 C5 y  L( i7 I( r
本程序要求服务器或虚拟空间必须支持伪静态,如果没有支持这些组件,请首先安装(安装包内已经提供了用于IIS6的这个插件。
; s" c- R5 f7 q/ B1 ]
2 f( _) K; S! K+ M# _1、按照里面的说明放入对应的位置。
' g) x/ Q: Q" i/ m
1 k% n* Q" ~& g" Q8 g2.1、修改根目录下.htaccess文件中的对应的域名为您自己的域名。
- r, Y0 Q) I7 {- w7 I7 ?, y/ }+ m& Y( v
2.2、上传dede-novel目录下的所有文件到服务器(如果用FTP上传,请选择二进制传送模式),并设置好目录权限,网站所有目录最好都给完全控制的权限。! U$ j/ o( ]2 P/ F
(1)目录css (读取)
7 ?3 Q( ^1 h. o+ z5 n(2)目录dede-admin (读取、执行)
/ V) o. ]. ?3 |9 m' E$ _0 o(3)目录download (读取、写入、修改、执行)
. g7 j; E" k; P) g(4)目录html (读取、写入、修改)
2 W# r3 z# l* l(5)目录images (读取)+ O* W. X2 H3 V4 ^( K( }( r
(6)目录js (读取)- o+ x3 j3 s- z+ H/ }5 ~
(7)目录templets (读取、写入、修改)0 E! m1 p- A( `* r. W
(8)目录uploads (读取、写入、修改): n% b9 o( l0 w( H7 K
(9)目录include (读取)0 g* E/ t1 H2 m( J6 v- y3 v! x+ v
(10)目录data (读取、写入、修改)% g9 i( B! @: Y
(11)目录plus (读取、执行)
0 N  H5 b' z. {( ?; z0 D0 n
! m4 k" z2 J" b9 |" ]  Y2.3、配置您的web服务器,把【电脑版】和【手机版】的域名都绑定到你的网站根目录上,并做好域名解析。
; R# n5 v. M& d  S$ h: n1 G) D8 A; a8 x. b. a& w# R) Z) D" w
3、访问http://域名/,根据提示输入对应的信息,直到安装完成。
) n5 [. }" {8 t8 i. b5 J. n3 W5 |
* ?- j; q( T) i4、后台管理登录地址:http://域名/dede-admin/index.php,用户名和密码是你在安装的时候设置的,登录后请修改后台系统参数中的站点网址和移动版网址为你的网站地址,修改【主页链接名】为你的首页标题,以及其他相关参数。; W, L8 Q/ z# P8 a" e3 ^
9 x- A) W0 z6 O4 z# d# z- z5 r% i0 ]1 {$ r
5、确认程序安装好后,可以修改dede-admin目录为其他名称,防止恶意攻击。. u( y* H+ s3 k: R3 p' u

' F6 X/ k' |( ~- q( t' [6、小说分类建议只分6类,现有的分类可以修改,但最好不要删除,因为本程序的模版和采集分类都是根据6种小说分类来制作的。栏目【作品集】的ID为45,不能修改。' u/ n9 C8 q* t) F

4 }& N0 F/ i; O% |. @- k7、LOGO总共3个,上下各一个(images/logo.png,images/bot_logo.png)、搜索页一个(images/search_list.gif),按照源码上的尺寸和格式制作即可,手机版页头的logo是背景图片,因此需要修改背景图片images/all_bg.png。
2 V% S- z. V- o8 x1 M6 K1 V2 a, c! U( x8 W1 c0 I7 J& l! j  ^
8、404.html页面是当客户访问不存在的目录或者网页时返回给客户端显示的,需要根据您的网站实际情况重新做一个。
: x% I& `9 ~1 A+ A$ P2 o0 f
( h  I4 {" z8 R1 U( T7 I9、首页的SEO都是在后台系统参数修改;分类的SEO是在后台栏目管理那里改; 小说封面、下载页、文章页、作者页的标题、关键字、描述要修改对应的模版(请参照下面的模版说明)。+ |$ i6 L% I* j* }* K3 e
9 W1 v/ p) m/ d
10、统计代码在后台【模块】-【广告管理】中添加,也可以在后台【系统基本参数】-【底部版权声明】中添加。
4 G8 z3 M6 w& J( v
( j( D8 [2 N  P8 x0 m/ b0 O6 W  }% ]二、使用说明% P9 c  [9 @! o; g$ {3 A3 z
1、采集说明:; m) E% v3 V+ l; x' `4 Y

1 o' X8 ?1 A) f& d7 h9 p(1)采集的主要参数设置在:【系统】-【系统基本参数】-【模块设置】。这里是全局的采集控制,比如【被采集的页面无法访问时】,如果这个参数设置为2,那么不管你在采集节点管理里面怎么设定的,都会自动跳过那个章节,采集时自动生成的关键词会在文章页和小说封面页里自动内链,可以在文档关键词里面进行维护。其他的设置基本都能看懂的,就不多说了。! c5 \: K) W0 ^; Y8 b
, F7 T9 |: d% I
(2)在开始采集前,有两个重要参数是必须认真确认的:
+ R. Z& }) A8 M/ W% h2 U" va、被采集页面无法访问时,你选择手动处理还是跳过该章节?如果设置为1,就是手动处理,你要从其他的网站上复制这个章节的内容添加到下一个章节的前面,让两章合并,这样就不会漏章。如果设置为2,就是跳过。+ |0 \: f! n$ T7 F* w
b、被采集的章节内容为空时,你选择手动处理还是跳过该章节?如果设置为1,就是手动处理,你要从其他的网站上复制这个章节的内容添加到这个章节的采集就结果里面,这样就不会出现没有内容的章节。如果设置为2,就是跳过。9 {4 D8 d; b# T

3 U; H3 x8 @8 H! n5 a7 T" C(3) 采集分为【小说封面】采集和【章节】采集,采集到小说封面后,程序会自动生成对应小说的章节采集规则,并自动采集,也可以手动添加单本小说的采集规则;所以,要采集小说,就直接采集小说的封面就好了,其他的系统会自动处理。
/ S/ ]  Z, {2 s1 Y' r
: T3 t6 f. |" q2 g( c) ~' L& ^+ K(4)要采集小说,请不要勾选任何规则,直接点最下面的【红色】的【开始采集】,会打开采集页面,只要不关闭采集页面,就一直不断的采集。也可以直接运行http://域名/download/caiji.htm来采集(可以自行修改该文件的名称,但后缀必须是.htm)。" L8 }6 V0 Q0 v

9 N- x# }2 H: d% |(5) 每个规则都有一个“采集”链接,打开后就会一直采集这个规则;在列表的最下面有个红色的“开始采集”按钮,如果有勾选了规则,点击后之后采集已经被勾选的“全自动”或“半自动”的规则,如果都没有勾选,就会采集所有“全自动”或“半自动”的规则。& v: b) U5 l1 c) a) I- k

0 {$ C+ o- K) _: p& y1 k(6)章节采集模版的规则不能删除,不能设置为自动采集,也不要采集,这个是采集章节采集默认套用的采集样板,删除后将不能从该站采集新的小说,如果你不从这个站采集小说,可以删除。
5 ~( y  C: o7 ~+ G1 A1 e6 q- }6 Y8 x. A+ [3 j9 H  Q8 W
(7)添加规则时必须先添加章节采集规则,再添加小说封面采集规则(需要用到章节采集规则的ID)。小说封面采集后会自动生成对应小说的章节采集规则,也可以手动添加单本小说的采集规则。6 `( [% c5 S' w4 q  q  h8 R3 G
/ D% x4 i2 o9 i$ Y- B. N9 X
(8)当一个采集规则的所有章节都采集完后,这条规则会自动合并到其他同一目标站的采集规则中,一条采集规则最多同时采集的小说数量在系统参数中设置;也可以手动合并,)合并采集规则时,必须合并到同一个目标网站的规则上。
# u1 C/ F, d" T+ ^0 W+ |' v- t9 v: a* H% q" u+ y7 s
(9)当采集到的章节内容为空或者采集的网址不能访问时,会根据你的设置自动停止采集该规则或者跳过该章节的采集,当设置为停止采集时,会在备注中提供采集错误的网址ID。/ R: G$ |0 v6 e8 \8 q( j
A、如果目标站网址不能访问,但是又是正常的章节,就要你手动从其他网站把内容源码复制过来,粘贴到采集结果中的body字段中,然后改为自动;
" {# i& g# |4 S5 B# F2 M+ VB、如果是非正常章节,就直接点【设置为已采集已导出】,然后改为自动;7 r! O) i" {* A* `1 t1 m
C、如果是目标网址内容为空,那么你需要到其他网站拷贝这章的内容源码到采集结果中的body字段中,然后改为自动。
# \* ?/ k( B6 [& CD、如果目标站缺少章节的,你可以将缺少的章节内容加入到其上一章或者下一章的内容中,同时修改一下标题,这样可以保证不缺章。% j9 ~6 C2 t5 G' Z* ~3 F

' O/ f* K3 @: Y(10)全自动、半自动、手动的区别:4 C: e! Z# v/ K/ m# H# j+ R
A、全自动:当目标站的章节内容为空或者打不开页面的时候,自动跳过这个章节采集后面的章节。
& h) R$ _9 |6 }7 YB、半自动:半自动就是当目标站的章节内容为空或者打不开页面的时候,停止采集这条规则等待手动处理。/ u. ^$ x( q8 l* f  u
C、手动:停止采集这条规则,但是可以在后台手动点击采集菜单来采集。
. e( O3 b" F& L* M" r" Z0 [0 B$ X- @; g! Y
(11)采集规则编写和普通DEDE采集规则一样,本程序已经对部分不需要采集的章节进行了过滤,详情可以查看后台设置。
6 z( K6 X8 D/ s. T: D# W% U, S
# {0 {) X/ {  }8 N(12)可以在后台采集单条规则,可以采集选定的规则或者全部规则(采集多条规则时,设置为【已取消采集】的规则不会采集)。
/ e8 A8 ?, c4 l4 `  M! c
3 o! t, Z2 M9 z7 x* n6 S1 }2、目录和文件说明:1 X) l( q9 z% t2 ^" ~% F
(1)目录css:存放模版css样式文件,可根据需要修改。" J1 K6 {( x# u' O
(2)目录dede-admin:后台管理目录,目录名称可以随意修改,但不要有中文,目录内的文件一般情况下请不要自行修改,除非你对DEDECMS的文件架构非常熟悉。
. L& f& x% G8 e$ `# L* c(3)目录download:存放采集文件和生成的txt文件(zip文件是由txt文件在下载的时候自动生成的,下载完成后自动删除)。
' N# k* k0 _. }# ~(4)目录html:存放生成的html文件,包括分类、小说页面、作者页面(章节页面不会自动生成html文件)。
+ j, G1 W  V/ z. ]7 }" y& l(5)目录images:存放模版需要用到的所有图片,包括logo。8 F5 H' {' z, c. ^: X6 ^
(6)目录js:存放模版需要用到的js文件。
. k; E4 M( c9 F) D2 ?7 s(7)目录templets:存放模版文件,其中duoben目录是PC站模版、wap目录是手机站模版。" N& U, M, F4 I+ y0 K
(8)目录uploads:存放小说图片和章节图片。3 Q$ Z, R" X% M; K& r  l
(9)目录include:存放DEDECMS的函数库文件和配置文件,非必要时请不要修改,否则可能会出现程序错误。! _& e( _: C: C7 d1 g/ D$ J2 B
(10)文件.htaccess、web.config:.htaccess是Apache服务器下的伪静态配置文件(2003系统装了ISAPI_Rewrite3插件也可以用,kangle服务器可以直接使用,西部数码网站助手做的服务器需要稍微修改),web.config是win2008 iis7或者7.5以上的服务器下的配置文件和伪静态规则。2 c( u$ u9 ?$ `% Y# H/ Q
(11)文件404.html:非法访问或者文件不存在时返回客户端的页面,可以自己修改。
: p% {5 P6 a* {; m(12)文件praise.php:小说、作者推荐动态更新文件,不要删除。' r/ y) Q2 l! `2 w# S. ~
(13)文件shuku.php:小说书库页面文件,不要删除。
# M  m# S, d, Y; G& N(14)文件sitemap.html:网站地图文件,不要删除。
+ Q4 E! ?5 j, V( H& N- \2 }(15)文件word_replace.txt:整理好的伪原创替换词,如果需要伪原创的话,在采集功能那里提交进去就好,建议不要提交太多,否则会影响采集速度。
6 k; F6 Q9 D1 n  w9 e: g" a* Z$ ]7 j7 t2 d
3、模板说明  F" K5 Q% f! ?$ M. M) y6 n
模版目录duoben  J7 Y3 k- s3 Z. z* ~: W3 n' j
article_article.htm 章节主模版
! w% b$ h+ f3 q7 ldownlist.htm 下载页主模版0 |9 ]" A2 H" M( @+ r5 u
footer.htm 分类页底部模版
+ }6 a) B- N$ f% I% Pfooter2.htm 小说封面、下载页底部模版4 `: h7 \* ]. ?! y
footer3.htm 文章页底部模版3 h# U/ _2 z/ m: @
google_sitemap.htm 后台生成xml网站地图的模版,现在没什么用
) u. m3 _, j) l$ Ahead.htm 分类导航条模版
' \. ^/ G0 l/ h2 X7 ?) Jindex.htm首页主模版! I" ?1 v' `. u* C! ^
index_article.htm 分类页主模版
. u  u4 d* e/ A0 [index_article45.htm 作者页主模版, w% h% Y2 G" S6 s  F3 ~
list_article.htm 小说封面主模版3 I( z" H- E! {) M' ^* ]
paihang.htm 排行榜中部模版8 Y' c3 e/ I2 |
paihang1.htm 系统自动生成的排行榜页面,请不要修改这个页面
$ V" ]5 V+ T8 y) u8 Lpaihang2.htm 排行榜主模版( ]1 n# ]) K: b
rss.htm 后台生成rss信息的模版,这个没什么用% [3 O3 s2 c5 n  F* H0 g- ]! d* y+ a5 l
search.htm 搜索页主模版
% O3 E* ?2 _/ V# I/ \! ?5 Jshuku.htm 书库页主模版; |. r  ^! [) a
sitemap.htm 网站地图模版% W! @6 i+ a/ W
其他的文件都可以删除) B& U6 R9 X# j2 @  Q  F9 I
# j1 d# N& [2 R4 ]% v
三、其他说明:1 O9 G' ~* g+ a* G7 @3 r: O, W8 `
1、本程序是店长经过长达1年的不断修改完善起来的,其中艰辛难以对旁人道,保证全世界仅本店一家有提供销售服务。
# x) O. ~3 y; X' Y3 |  ?* Z$ _& g8 @$ ]+ K0 {# [9 P: u
2、织梦DEDECMS的强大功能,相信你能来到本页面,那一定对其有深刻体会了。google最认可的国内开源程序莫过于织梦,基本上放出没几天收录至少50%全站页面。
: y8 H6 J* q! }9 e/ F) x# w" Q
  T; `* E8 R$ O1 x( q1 L; ~3、源码这个东西大家都知道,退货什么的是不厚道的,大家也体谅一下。/ e( k, n  ?# |# X# |9 r
: u# `$ v9 I) `% ]+ b$ [
4、小说站的数据库都是异常庞大的,一本100万字的小说就要占用2M多点的数据库空间(中文字要乘以2的),1000本的话那至少也要有2G以上的数据库空间,如果都是500万字以上的,那可以自己算算,这个是必须要承担的。
' r* `, n4 u6 q4 u( ~' e8 W, A0 G$ P% A1 {) s' J
5、小说站由于章节比较多,搜索引擎采集的频率会比较高,某些该死的不厚道的搜索引擎甚至1秒钟内就会来十几二十次,服务器是有一定压力的。如果只是网友的访问的话,那是没有任何压力的。, W- b  f. p$ x! g

1 Y- X( M  @3 C8 C$ D6、关于采集,虽然是全自动采集,但是也分为两种,一种是通过网站的流量来采集,一种是通过刷新采集页面来采集,如果需要采用前一种方式,只需要在前台页面的任意位置加上下面的这段代码即可,也可以添加到统计代码的位置。: i; k1 e" w1 e# f0 _" T
# M2 P# B" b9 V9 M& R& R9 c: h
<script type=”text/javascript”>(function() { function async_load(){ var s = document.createElement(‘script’); s.type = ‘text/javascript’; s.async = true; s.src = ‘/download/spider.php’; var x = document.getElementsByTagName(‘script’)[0]; x.parentNode.insertBefore(s, x); } if (window.attachEvent) window.attachEvent(‘onload’, async_load); else window.addEventListener(‘load’, async_load, false); })(); </script>
- u, F& L8 R) E2 L
& d1 J* Y/ z. e" i4 A7 i+ D

1 s# T9 A& O5 ~7 z
# C7 @9 r; b6 S4 l2 d6 t8 @




上一篇:自用跳转页面go.php源码
下一篇:Thinkphp周易八字起名网宝宝起名在线下单网站源码
我们尊重所有会员!只要你付出了,大家都会看在眼里,态度决定一切!
感谢您对奇瑰资源论坛的关注与支持!希望各位朋友帮忙一起宣传下社区,好社区需要大家的推广.谢谢!
目前,很多网站和论坛盗用或者利用奇瑰资源论坛免费发布的资源搞所谓的vip或者销售,请谨防上当受骗!
一分钱一分货,好货不便宜,便宜没好货,记住这句,你上当受骗的概率基本为0,贪便宜就已经为你受骗打下基础!
特别说明:奇瑰资源论坛是正规网站,严格遵守相关法律法规,
回复

使用道具 举报

0

主题

204

帖子

196

积分

资深会员

Rank: 2

G币
10
信用
0
体力
0
发表于 2019-10-7 19:54:33 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
谢谢分享,下载下来试试,希望一切好用
回复

使用道具 举报

2

主题

29

帖子

161

积分

资深会员

Rank: 2

G币
30
信用
0
体力
46
发表于 2019-10-7 19:56:56 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
再来一次..........
回复

使用道具 举报

0

主题

218

帖子

195

积分

资深会员

Rank: 2

G币
10
信用
0
体力
-4
发表于 2019-10-7 20:08:49 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
能不能用
回复

使用道具 举报

【新用户限量秒杀】热门云产品限量秒杀,云服务器1核2G 16.5元/月起

0

主题

209

帖子

192

积分

资深会员

Rank: 2

G币
10
信用
0
体力
-4
发表于 2019-10-7 20:12:13 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
支持支持
回复

使用道具 举报

0

主题

17

帖子

55

积分

资深会员

Rank: 2

G币
0
信用
0
体力
22
发表于 2019-10-7 20:12:58 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
好,很好,非常好!
回复

使用道具 举报

0

主题

31

帖子

89

积分

资深会员

Rank: 2

G币
0
信用
0
体力
32
发表于 2019-10-7 20:13:22 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
看起来不错
回复

使用道具 举报

2

主题

17

帖子

686

积分

高级会员

Rank: 4

G币
0
信用
0
体力
309
发表于 2019-10-8 21:18:51 | 显示全部楼层
马上来领取免费的邀请码加入奇瑰吧
感觉很厉害的样子 下载看看
回复

使用道具 举报

使用高级回帖 (可批量传图、插入视频等)

发表回复

您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
Powered by Discuz! X3.4 粤ICP备18094825号-1  知道创宇云安全  |网站地图
Copyright © 2014-2019 www.qiguiwl.cn All Rights Reserved.
快速回复 返回顶部 返回列表