Q:为什么玩春物哏,你不是还没看吗?
A:因为我整这玩意就是为了下载春物啊……
没错,为了在 wenku8 上下载全篇小说,这个人用 C++ 写了个小脚本。
甚至这人不会多线程,下载只会用curl
。
然后下载速度巨慢,爬爬爬。
我们姑且不提某个已经完善然而只能下epub的下载器。
wenku8 除了无版权小说的插图下载以外都被人研究透彻了。现在下载无版权小说插图还是只能跑几十万次请求。
已解决问题
正则表达式从不会到不会
有人说用正则表达式徒增负担,但没正则我更不会写。
于是 30min 修炼正则表达式基础,玩 RegExr(顺带一提这网站在今天下午证书过期了,真是够巧的)。
curl从不会到略懂
啊这个东西好像还真是学学就行。
大概就主要看了这一篇。
在C++中实现编码互转
至今不会,所以脚本中完全没有关于这个的。
code
过程经历太多,只留下这份代码来表示我的付出终于有了些回报。
编译后运行,输入文章 id 即可观察到它慢慢爬爬爬。
顺带一提由于上面说的原因不能下载无版权小说的插图。
命名格式不规范警告.webp
1 | //author: Okazaki Yumemi |
未解决
多线程下载
不会,咕了。
部分文章的vid非章节号减去1
正解也许是章节号 -1,0,+1 都有可能。
这个下次来修。
断点续传
偶尔来个网不稳就会出现 Time Out,被迫全部重下。
所以啥时候写个断点续传啊(