司白画博客 - 技术 2025-05-31T21:40:00+08:00 Typecho http://blog.cll.tw/feed/atom/tag/%E6%8A%80%E6%9C%AF/ <![CDATA[Wget 爬取 完整的 HTML 网页]]> http://blog.cll.tw/archives/crawl-html.html 2025-05-31T21:40:00+08:00 2025-05-31T21:40:00+08:00 司白画 https://blog.cll.tw 缘起

今天没事回想起了以前的.tk域名,于是到Dot Tk网站浏览了一番。

发现这个网站特别精美,尤其是它的壁纸非常有海岛特色,而且能够随机切换。

于是我就想把这个网站给保存下来。

可是,如果用浏览器直接保存的话,页面就会有很多元素缺失,且网页也会变成静态的。

于是我就询问了一个DeepSeek,得到了使用wget工具爬取html网页的方法。

代码

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://example.com

参数说明

--mirror: 镜像模式
--convert-links: 转换链接为本地可用
--adjust-extension: 调整文件扩展名
--page-requisites: 下载所有页面资源(CSS、JS、图片等)
--no-parent: 不爬取父目录

执行方法

使用ssh终端连接Linux服务器或使用宝塔面板的终端执行命令。

下载完成后会在执行文件夹下生成一个文件夹,即为爬取的网站。

]]>
<![CDATA[Dot TK,大美!]]> http://blog.cll.tw/archives/dok-tk.html 2025-05-31T14:40:00+08:00 2025-05-31T14:40:00+08:00 司白画 https://blog.cll.tw Dot TK 官网

干巴的描写

随机海岛背景,纯粹的蓝;黑色透明的导航...再加上它免费提供域名的初衷...

重写第250806号

其实,Dot TK不仅美在他的官网,还美在他提供免费域名的初衷。

还记得,0914.tk是我拥有的第一个顶级域名,还是免费的。

虽然许多网站并不承认他,但他确是我的唯一。

或许可以说,是在他的指引下,我才能不断进步。

他是互联网的钥匙,尽管不是金子,不是白银,但是可以开门。

直到现在,我还常常想注册回曾经的0914.tk。

可是,freenom却已经不支持域名注册了。

但我并不会因此而恨你,毕竟,你曾经给我伸过援手。

等哪一天,你支持低价注册的时候,

我一定会第一个把你买下!

]]>
<![CDATA[网盘,没有一个好东西]]> http://blog.cll.tw/archives/bad-netdisk.html 2025-01-25T14:25:00+08:00 2025-01-25T14:25:00+08:00 司白画 https://blog.cll.tw 起因

由于最近日益注重数据的存储,所以准备开始选一家网盘作为年费使用。

选择无疑是非常困难的,因为国内各种网盘数不胜数。

但实际上又无可选择,因为国内的大部分网盘都和谐得很厉害。

但在我心目中和谐最厉害的,还是阿里云盘。

阿里和谐王

阿里云盘横空出世时,自称不限速。

当时以百度网盘为主力的我也入坑了阿里云盘。

因为使用得多了,也发现了它的尿性————各种和谐。

无论是政治还是黄色,它一律和谐。

无论是在资源库还是保险箱中,它一律和谐。

而且到现在,它甚至开始了限速。

果然,国内的网盘就没有一个可信的。

于是我重新回到了百度网盘。

百度的怀抱是否温暖?

也是和谐王

看到了曾经那些珍贵的数据依然存在,我毅然决然地开通了百度网盘的年卡,成为了SVIP2。

但是,只有我开始认真使用时,才发现,百度网盘也是一坨。

它和谐得跟阿里云盘一样,甚至更加厉害。

一切有关政治的书籍全都被封禁了,不过阿里云盘也是这样。

但是,压缩包能够幸免一下。

然而,你只要手贱双击压缩包,它就会被在线解压,百度网盘就会开始入侵你的压缩包,

将你的压缩包一览无余,随后将整个压缩包封禁。我真的会无语。不过,我当然知道它的尿性,重要资料都另用Onedrive存储了一番。

至此,百度网盘也成功让我后悔了。

我是个很喜欢稳定的人,所以我选择了百度网盘,选择了开年费。

但我又是个容易后悔的人。

然而,这一切已无法改变。

百度网盘也只能勉强备份一下手机图片和日常资料了。

那我的年费又有何用呢?

云下载,好的

幸好,百度网盘的云下载功能还是不错的。

虽然有的冷门资源下不下来,但是近期的热门资源都还是OK的。

这不就成为我的影视库备选方案了吗。

但是,我害怕会员过期,害怕存储爆满。

毕竟,百度网盘是要作为我的主力网盘的。

所以我只用百度网盘存一些最近要看的电视,或者只有百度网盘有资源的电视。

那我想要收藏的影视资源存在哪里呢?

变心的115

当然是115网盘。虽然业界经常传言115网盘要跑路了,但直到现在,115网盘依然屹立不倒。

甚至,它对普通用户也没有丝毫限速。

但最令人震惊的,是它不会和谐。

是这样的,我存在115网盘上的任何敏感资源都没有被和谐过。

还有一个优点就是,它的内存真的非常大。

只需要在闲鱼上花十几块就能得到一个15TB左右的账号。

这样看来,115网盘简直就是国内的网盘之神。

而且,它的会员在暑假时只要115元。

那我为什么没有选择115呢,因为,我害怕它跑路。

数据的价值是最为重要的。

若115跑路了,那么它的一切优点都将失效。

还有一点,它的备份功能真的太难用了,或者说,它的APP真的太臃肿了,甚至比百度网盘还卡。

这是我无法忍受的。

所以,现在115网盘只作为我的影视收藏库。

但是,115网盘是我重要的数据底裤。

[scode type="blue"]补充一点,115网盘是刀子嘴豆腐心。虽然它在用户协议里说普通用户限速100KB,但是实际上没有限速。不像某些网盘,自称不限速,到后来又开始限速,言行不一,令人可笑。[/scode]

[scode type="yellow"]2025年3月最新更新:115网盘开始限速250KB了,我的影视存储库计划彻底作废。[/scode]

百度,还行

回到主题,百度网盘真的那么烂吗?

其实不然。

作为国内市场占有率第一的网盘,或者说最多人使用的网盘,它跑路的可能性最小,功能最为成熟,是作为养老安家的不二之选。

虽然在我未开通百度网盘会员之前,我一见到百度网盘的资源就十分头痛,因为它限速100KB,要下到猴年马月才能下完啊。

但是开通会员后,百度网盘的带宽实际上是能跑满的,是能和115网盘的免费版匹敌的。

但是,百度网盘在Alist端限速在5MB左右,还是太吝啬了。

而且和谐这种东西真的很讨厌,使得我现在重要敏感资料都需要压缩加密后上传。

不明攻击对象的升华?

网盘变得越来越麻烦,数据使用变得越来越复杂,这一切都是谁害的?

不言而喻。

]]>
<![CDATA[免费SSL看Cloudflare]]> http://blog.cll.tw/archives/free-ssl.html 2025-01-23T14:12:00+08:00 2025-01-23T14:12:00+08:00 司白画 https://blog.cll.tw 背景

Cloudflare作为一家专为白嫖而生的企业大家自然是熟悉。

可是要问起来如何正确食用Cloudflare的免费SSL服务时,或许很多人就说不清了。

我曾经在互联网上搜过许多教程,但无一是有效的。

或许可能是我没有查找到精髓。

不过,我想,如今,我已正确掌握了Cloudflare的免费SSL服务食用方法。

通过这个方法,你无需在其他网站上再申请SSL证书,也无需通过各种繁琐的域名所有权验证,你只需要把你的域名托管到Cloudflare上即可。

相关链接

https://dash.cloudflare.com/

流程

一、将域名托管到Cloudflare

这一步相信很多人已经做到了,网上亦有很多教程,这里不再赘述。

二、在源服务器上安装Cloudflare的源服务器证书

注意,这个源服务器证书不能脱离Cloudflare的服务单独使用,否则浏览器会报不安全提示。(即必须使用Cloudflare的流量代理服务)

1.登录Cloudflare后台,选择一个域名,进入你的域名的后台(管理中心)。

2025-01-23T05:59:29.png

2.在左侧栏中选择SSL/TLS——源服务器证书,并创建证书。

2025-01-23T06:02:07.png

3.在宝塔面板或虚拟主机面板安装该源服务器证书。

点击下载键查看该证书的内容秘钥。请注意保存相关信息。部分信息无法再次查看。

打开宝塔面板或虚拟主机面板,分别将内容秘钥填入框中。

2025-01-23T06:04:24.png

[scode type="blue"]不建议在SSL中打开强制https,避免与Cloudflare的功能重复造成网站无法访问。[/scode]

这个源服务器证书有效期为15年,但是它不能脱离Cloudflare单独使用。所以就有了接下来的步骤。

三、在Cloudflare中配置SSL服务

在左侧栏中选择SSL/TLS——概述,将SSL/TLS 加密模式配置为完全

2025-01-23T06:10:12.png

四、大功告成

现在,你的网站应该已经能通过https访问了。而实际网页上显示的证书为谷歌诚信所颁发。

结语

通过Cloudflare所申请的证书,不仅申请方式简单,并且还能自动更新,免去了许多麻烦工作。

]]>
<![CDATA[巨款拿下新域名]]> http://blog.cll.tw/archives/new-domain.html 2024-10-02T23:06:00+08:00 2024-10-02T23:06:00+08:00 司白画 https://blog.cll.tw .tw域名矢量标志

背景

在经过近两个月的折磨后学校终于放了七天的假期,对此我表示非常开心。

但是,我的作业还没有开始写,且假后就要月考,这使我非常担心。

不过这一切都无法影响我折腾的心。

域名注册

其实早在几周前我就对cll.tw这个域名有热烈的感情了,因为如此短的域名竟然没有人注册。

再加上我对于台湾这片土地的热爱,终于还是忍不住注册了。

只可惜卡里的余额越来越少。

不得不说,.tw真的是太贵了吧,花了我150大洋,比我一直梦寐以求的.com还贵,难怪没人注册。

可是我真的很喜欢台湾和这个域名。

注册商Dynadot还附赠了网站搭建服务,不过只是一个单页,拿来当我的个人主页也不错。

因为我是通过别人的邀请链接注册的,理论上消费5美元就能获得5美元的余额,然而我并没有收到。

于是我就发邮件去问,客服说不要心急,已经到账了。我这才放心。

[scode type="green"]顺便贴一下我的邀请码,互利共赢:6i8BJ73639M808l[/scode]

旧域名管理

友链里面用的还是sibh.cn这个域名,况且博客关停(跑路)很久了,都被拉入黑名单了,也就不再一一去联系了。

sibh.cn就301跳转到www.cll.tw吧。希望有缘人能发现博客复活了~

原先的友链就都保留着吧,还是一段回忆。

服务器迁移

碎碎念

原本7月底我也是狠下心来买下了阿里云的99套餐境内服务器。

结果是,阿里云境内服务器把所有的端口都封了,导致我的所有站点都只能用ip访问,严重影响观感和SEO。

这不,今天恰好看到腾讯云有99套餐的境外服务器,又狠下心来买了。

幸亏阿里云是个好人,联系了客服把剩下的钱都退回来了。

不过客服说只允许这一次。那好吧,转战腾讯了。

腾讯云也还算方便,一键安装宝塔面板也很省事,只是有流量限制,1000GB也够用了,带宽还是阿里云的十倍。

[scode type="share"]我真是太贱了,把腾讯云也退订了。这下再也买不了腾讯云境外的良心服务器了![/scode]

换新域名?sql语句来帮你

[scode type="blue"]另外贴一个SQL语句,迁移博客时替换域名很方便,来源于:https://www.coderocku.com/archives/12.html

# 修改网站设置里的域名:
UPDATE `typecho_options` SET `value` = '新域名' WHERE `typecho_options`.`name` = 'siteUrl' AND `typecho_options`.`user` =0;

# 替换文章的域名
UPDATE `typecho_contents` SET `text` = REPLACE(`text`,'原域名','新域名');

# 将管理员的个人网站进行替换
UPDATE `typecho_users` SET `url` = REPLACE(`url`,'原域名','新域名');

# 替换评论中的域名
UPDATE `typecho_comments` SET `url` = REPLACE(`url`,'原域名','新域名');
UPDATE `typecho_comments` SET `text` = REPLACE(`text`,'原域名','新域名');

[/scode]

越来越高的墙

之前sibh.cn一直无法访问,让我一直以为是我域名或者垃圾虚拟主机的问题,今天通过和轻云互联客服掰扯才知道原来福建已经把所有的海外网站都封了。

这让我十分震惊。刚开始也只听说是泉州开始实行白名单制,结果福建都直接封了……

至于门是越开越大还是越来越小我就不知道了。

其他工作

尽早把图片迁移到本地,完。

祝大家生活愉快!

]]>
<![CDATA[谷歌、必应快速收录新域名]]> http://blog.cll.tw/archives/search-engine-inclusion.html 2023-02-26T05:15:00+08:00 2023-02-26T05:15:00+08:00 司白画 https://blog.cll.tw 前言

今天早上10:30注册了这个新域名(sibh.cn),到现在Google和必应都有收录啦。

Google收录了一篇文章,必应收录了首页。

其实新域名Google和必应收录都很简单,在相对应的站长平台添加站点后提交收录就可以了。

不过我看百度是永远收不了了。

流程

必应网站管理员:
http://www.bing.com/webmasters/about

Google Search Console:
https://search.google.com/search-console

在对应搜索引擎的站长平台添加站点,添加并验证站点的域名即可。

快去试试吧 ~

]]>