(编辑:jimmy 日期: 2024/12/24 浏览:2)
我自己总算是捣鼓出来了原版PDF的下载方法了
以下为分析过程:
经过抓包分析,阅读PDF的时候图片地址类似于https://wkobwp.sciencereading.cn/asserts/cd4bf6f17b42403fb192ef570a5b111d/image/4/tiles/100/400/2/2?accessToken=accessToken
这样,经过修改比较,发现各个参数分别代表:
https://wkobwp.sciencereading.cn/asserts/图书编码ID/image/页码/tiles/分辨率/图片尺寸/纵向第n块/横向第n块?accessToken=accessToken
由是观之,其实服务器返回的只是图片罢了~
因此最笨的方法便是获取每一张图片并合并,其中的分辨率共有50,75,100,125,150,200,400,800,1000九个级别
但是显而易见,这肯定不是下载文档的最优解,于是继续分析
继续抓包,就可以和楼主一样发现打印时返回每一页的图片,
结合页面上的分辨率,和不断尝试,抓取如下图片分析得到:
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/50/400/1/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/75/400/1/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/100/400/1/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/125/400/1/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/150/400/2/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/200/400/1/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/400/400/1/1?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/800/400/3/3?accessToken=accessToken
https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/1000/400/4/3?accessToken=accessToken
【整页图片】
https://wkobwp.sciencereading.cn/asserts/cd4bf6f17b42403fb192ef570a5b111d/image/2/1000?accessToken=accessToken
确实可以获取原PDF,但是需要修改别的参数,大家可以自己抓包试一下,应该不难发现
至于为什么知道了方法不在论坛公布,我想是因为论坛人流量太大,一旦公之于众,即使设置较高的权限,官方都会很快修复