科学文库原版PDF下载方法思路分析

(编辑：jimmy 日期: 2024/12/24 浏览：2)

我自己总算是捣鼓出来了原版PDF的下载方法了

以下为分析过程：

抓包分析

经过抓包分析，阅读PDF的时候图片地址类似于https://wkobwp.sciencereading.cn/asserts/cd4bf6f17b42403fb192ef570a5b111d/image/4/tiles/100/400/2/2?accessToken=accessToken

这样，经过修改比较，发现各个参数分别代表：

https://wkobwp.sciencereading.cn/asserts/图书编码ID/image/页码/tiles/分辨率/图片尺寸/纵向第n块/横向第n块?accessToken=accessToken

由是观之，其实服务器返回的只是图片罢了～

因此最笨的方法便是获取每一张图片并合并，其中的分辨率共有50，75，100，125，150，200，400，800，1000九个级别

但是显而易见，这肯定不是下载文档的最优解，于是继续分析

继续抓包，就可以和楼主一样发现打印时返回每一页的图片，

结合页面上的分辨率，和不断尝试，抓取如下图片分析得到：

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/50/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/75/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/100/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/125/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/150/400/2/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/200/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/400/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/800/400/3/3?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/1000/400/4/3?accessToken=accessToken

【整页图片】

https://wkobwp.sciencereading.cn/asserts/cd4bf6f17b42403fb192ef570a5b111d/image/2/1000?accessToken=accessToken

确实可以获取原PDF，但是需要修改别的参数，大家可以自己抓包试一下，应该不难发现

至于为什么知道了方法不在论坛公布，我想是因为论坛人流量太大，一旦公之于众，即使设置较高的权限，官方都会很快修复