分享88个PHP留言日记源码,总有一款适合您
88个PHP留言日记源码下载链接:https://pan.baidu.com/s/15Q-sYJ0IcpZy9eZOZevpng?pwd=9h8u
提取码:9h8u
Python采集代码下载链接:采集代码.zip - 蓝奏云
我的博客地址:亚丁号-知识付费平台 支付后可见 扫码付费可见
地铁客开源轻博客 V1.8 Beta Build 120513
雨楠PHP留言板 Phpbook V1.0 Beta
Simple PHPBlog V0.8.0 多国语言版
记事狗3.5正式版升级包 GBK
记事狗3.5正式版升级包 UTF-8
博客迷 BlogMi V1.0
import os
import shutilimport requests
from bs4 import BeautifulSoupfrom framework.base.BaseFrame import BaseFrame
from sprider.access.SpriderAccess import SpriderAccess
from sprider.plugin.SpriderTools import SpriderTools
from sprider.plugin.UserAgent import UserAgent
class CNSourceCoder:
base_url = "http://www.downcode.com" max_pager = 10 # 每页的数量 影响再次采集的起始位置.
word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量 page_end_number = 0
word_content_list = []
haved_sprider_count = 0 # 已经采集的数量
sprider_detail_index = 0 # 明细方法采集的数量 累加
Essay Php+Html日志程序 V2.0
PHP简单留言系统 V1.0
DYHB.BLOG_X 2.0.1
Sablog-X 2.0 Build 20120305
点拓企业留言板 V1.0
失物招领留言板 V1.0
拍旁Php开源轻博客系统 V1.0 Beta Build 0114
Tikiwiki CMS V6.6 LTS
尘烟博客 V1.0
Eoo!碎碎念 V0.1
FlatPress V1.0
EDiary私密日记本 V1.0
Web_star留言板 V2.0
结婚祝福程序 V1.0
PHP地址簿(Address Book) 6.2.12
O-Blog V2.6
LionWiki 3.2.7
SandBox V2.1
狂想海豚博客 V0.1 Beta
DYHB.BLOG V1.1.1 正式版
俏微博 V1.0
Tipask问答系统 V1.4 Build 1130 UTF-8
Tipask问答系统 V1.4 Build 1130 GBK
身旁网轻博客开源系统 V0.5
PHPSay-Microblog 微博客系统 V1.5
云边轻博客(开源轻博客) V1.0 Beta Bulid1111
简单纯洁的Php日历 V1.3
Simple-Log V1.5 Build20111106
Gazelle CMS V1.0
Tikiwiki V7.2
def sprider(self,sprider_name,sprider_count,start_number,
pager_number,sprider_type,is_show_browse,root_path,
first_column_name,second_column_name,is_record_db):
"""
http://www.downcode.com/sort/j_1_2_1.shtml
:param sprider_name:
:return:
"""
self.first_folder_name=sprider_type.upper()
self.base_path=root_path
self.first_column_name = first_column_name
self.second_column_name = second_column_name
self.sprider_start_count=start_number
self.is_record_db=is_record_db
BaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...")
BaseFrame().right("本次采集参数:sprider_count(采集数量):" + str(sprider_count) + "")
BaseFrame().right("本次采集参数:sprider_name(采集名称):" + sprider_name + "")
sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URL
BaseFrame().debug("本次采集参数:sprider_url:" + sprider_url) self.second_folder_name = str(sprider_count) + "个" + sprider_name # 二级目录也是wordTitle
self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集
self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name
BaseFrame().right("本次采集参数:file_path=" + self.file_path + "")
# 浏览器的下载路径
self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\Temp\\"
BaseFrame().right("本次采集参数:down_path=" + self.down_path + "")
# First/PPT/88个动态PPT模板/动态PPT模板
self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_name
BaseFrame().right("本次采集参数:save_path=" + self.save_path + "")
if os.path.exists(self.down_path) is True:
shutil.rmtree(self.down_path)
if os.path.exists(self.down_path) is False:
os.makedirs(self.down_path) if os.path.exists(self.save_path) is True:
shutil.rmtree(self.save_path)
if os.path.exists(self.save_path) is False:
os.makedirs(self.save_path)
response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'gb2312'
soup = BeautifulSoup(response.text, "html5lib")
#print(soup)
element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
page_end_number = 1
page_end_url = ""
page_end_title = soup.find("a", attrs={"title": '最后页'})
page_end_url = page_end_title.get("href")
if page_end_url is None or page_end_url == "":
page_end_number = 1
else:
page_end_number = (page_end_url.split(".shtml")[0].split("_")[3]) self.page_count = self.merchant while self.page_count <= int(page_end_number): # 翻完停止
try:
if self.page_count == 1:
self.sprider_detail(element_list, page_end_number,sprider_count)
pass
else:
if int(self.haved_sprider_count) == int(sprider_count):
BaseFrame().debug("sprider采集到达数量采集停止...")
BaseFrame().debug("开始写文章...")
SpriderTools.builder_word(self.second_folder_name,
self.word_content_list,
self.file_path,
self.word_image_count,
self.first_folder_name)
SpriderTools.copy_file(self.word_content_list,
self.save_path,
self.second_folder_name,
self.file_path)
SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path)
BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")
break
next_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name,
self.second_column_name,
self.page_count) response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))
response.encoding = 'gb2312'
soup = BeautifulSoup(response.text, "html5lib")
element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})
self.sprider_detail(element_list, page_end_number,sprider_count)
pass
self.page_count = self.page_count + 1 # 页码增加1
except Exception as e:
BaseFrame().error("sprider()执行过程出现错误:" + str(e))
JD-GB 留言板程序 V2
PHP留言反馈 V1.1
Xweibo V2.2 Beta
猫语微言系统 V1.0
IWeibo V2.0 SP1
2011年中秋许愿程序 V1.0
Tinyblog V1.1
简易个人博客LnBlog V1.0.0
Simple-Log V1.3.2 For Sina SAE
超小文本留言本美化版 V0.1
鹿城影院留言本 V1.0
3xdoing留言本 V2.0.0
LogX V0.9 Beta3
Tikiwiki V7.0 多国语言正式版
PageCookery Microblog V0.9.8
在线挂号系统 V1.0
迅捷网络留言本 1.1 GBK
Xweibo媒体微博解决方案 V1.0
PHP自动发送到邮箱手机反馈系统 V1.0
Habari V0.7.1
Simple-Log V1.3.1 Build 20110511
Arevb!微博客系统 0.2
LifeType博客 V1.2.11 多国语言版
Haoweboard 留言板 V1.0 GBK Beta
PhpWiki V1.4.0 Rc1 多国语言版
Sharetronix微博客系统(带简繁体语言包) V1.5.4
倒霉网美化版许愿墙 V2.1
Gelato CMS V0.95
Gelato CMS V1.0 ALPHA
阿西多用户日志系统 V1.0
Nucleus V3.64 多国语言版
光明博客(L4mp Blog ) V2.0
MinIsay笔记程序 V1.1.4 Beta
阿西在线信使系统 V1.0
PhpSay 开源贴吧系统 V2.1
Isay-简单的笔记程序 V3.0.2 Beta2
小爬虫留言板 V0.1
无觅相关文章插件 V1.0.4.7
丽物微博 V1.0 Beta
大嶝开源微博系统 V0.8
枫叶留言板 V1.9
MyCMS V1.2
FastCGI邓州博客系统 V2.0
JQuery+PHP 实现Ajax评论系统 V1.0
蓝天留言板 V1.0
蓝天留言板 V1.0
漠岚博客 V0.3.2 内测版
Memory Hall简单个人网站系统 V1.0
WordPress For Linux V3.03 简体中文版
漠岚博客 V0.3
泡泡留言板 测试版
PHPK留言墙仿QQ爱墙 V1.1
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。
发表评论 取消回复