包罗万象--好东西要收藏--共享无限: 三月 2020

Linux下用Wget命令克隆获取整站/仿站

2020年3月29日星期日 | | 0 评论 |

wget -m -e robots=off https://www.fjbjdd.com
-m是克隆整个网站,-e robots=off是让wget忽视robots.txt

如果网站有中文路径，最好用以下命令

wget -r -p -np -k --restrict-file-names=nocontrol http://www.fjbjdd.com

Wget参数说明：

-r --recursive（递归） specify recursive download.（指定递归下载）

-k --convert-links（转换链接） make links in downloaded HTML point to local files.（将下载的HTML页面中的链接转换为相对链接即本地链接）

-p --page-requisites（页面必需元素） get all images, etc. needed to display HTML page.（下载所有的图片等页面显示所需的内容）

-np --no-parent（不追溯至父级） don't ascend to the parent directory.

这里写代码片额外参数：

-nc 断点续传

-o 生成日志文件

2020年3月2日星期一 | | 0 评论 |

在写配置的时候, 会有这么一种情况，nginx的常量值，是一个长长的串，而且里面包含了特殊字符（保留字符）
如果直接使用，那么会报错的。
但是这个值还不能随便改，怎么解决？

这样：

注意: geo 最好写在 nginx.conf 主配置文件下的 http { ... }里面.

http://www.ttlsa.com/nginx/using-nginx-geo-method/