- 作者帖子
dariyus游客书格的各位大佬好,有一个印度的名为雷赫塔(Rekhta)的电子数据库,向各位大佬请教,链接如下:
书本详情页: www.rekhta.org/ebook...ruf-ebooks
在线阅读页: www.rekhta.org/ebook...ruf-ebooks
详情阅读页的截图:
这个数据库没有给出具体的下载链接,求教各位大佬,如何才能把在线阅读页的电子版下载下来呢,有大佬知道下载方法的话,还请不吝赐教,谢谢各位大佬。
无银三百两游客链接: pan.baidu.com/s/14F...d3Cb9R3TpQ 提取码: 1234
小透明游客用 python可以尝试,不过工程量不小,网页虽提供原始图片,不过是乱的,要自己切割拼接的。
下面是比较核心的拼接逻辑,示例代码可供测试,运行成功输出 007号的原图 (完整下书需要其他自动化代码配合)
import requests from PIL import Image from io import BytesIO #img 中的 src image_url = 'https://ebooksapi.rekhta.org/images/c313bc20-0628-460c-b7ce-de67af2b6ea8/007.jpg' #包含img 的div的属性: data-pageid="24eae819-d295-4606-932a-490734e1bc22" page_info = "24eae819-d295-4606-932a-490734e1bc22" #来自 script 中的 访问API的 地址头 url = "https://ebooksapi.rekhta.org/api_getebookpagebyid_websiteapp/?wref=from-site&pgid=" url = url + page_info response = requests.get(url) data = response.json() #数据为dict ,供参考,截取部分,sub实际长度是308 ''' {'X': 14, 'Y': 22, 'PageHeight': 1080, 'PageWidth': 653, 'Width': 0, 'PageId': '24eae819-d295-4606-932a-490734e1bc22', 'Sub': [{'X1': 7, 'X2': 0, 'Y1': 2, 'Y2': 0},... ] } ''' #根据 js的 drawImage() 方程说明,原图是50×50 打乱的小块,要重新切出来绘制 def get_origin(data, index, m = 50): res = data['Sub'][index] x_b = res['X1'] * (50 + 16) y_b = res['Y1'] * (50 + 16) #x_b,y_b 原图切割起点,x_a,y_a 是新图绘制起点 x_a = res['X2'] * m y_a = res['Y2'] * m return x_b, y_b, x_a , y_a len_sub = len(data['Sub']) # 读取原始图像 try: response_img = requests.get(image_url) original_image = Image.open(BytesIO(response_img.content)) except Exception as e: print(e) #create new canvas 创新图 或画布 canvas_width, canvas_height = data['PageWidth'], data['PageHeight'] canvas = Image.new("RGB", (canvas_width, canvas_height), color="white") width = height = 50 for i in range(len_sub): x , y ,x_2, y_2 = get_origin(data, i) # 切割图像 cropped_image = original_image.crop((x, y, x + width, y + height)) # 重新拼接 canvas.paste(cropped_image, (x_2, y_2)) # 显示拼接后的图像(可选) #canvas.show() #original_image.save("./original_image.jpg") # 保存拼接后的图像 canvas.save("./test_image.jpg")
guozibaba游客
dariyus游客@无银三百两 #137662
谢谢大佬分享,我保存了,这个图书馆之前是有一个下载器的,一位巴基斯坦的外网大佬提供的,前段时间还能用,不过不知为何,可能是这个数据库更新了链接,用那个下载器就下载不了了。
大佬,您看方便的话,能否抽空再帮忙下载一下下面这两个链接的同为雷赫塔数据库的波斯文古籍发一下,再次感谢大佬,不好意思,麻烦您了。
dariyus游客@小透明 #137670
谢谢大佬分享下载方法,有点复杂,我研究研究。
dariyus游客@guozibaba #137671
谢谢大佬分享,我保存了,您发的下载器,我下载下来试了一下,可能是电脑版本比较低(我用的64位的win7系统),解压后一点击Downloader.exe就闪退。
guozibaba游客
guozibaba游客@guozibaba #137675
dariyus游客
guozibaba游客@dariyus #137683
解压缩文件后,进入文件夹,在空白处点右键,点如下图,然后输入命令。
dariyus游客@guozibaba #137693
谢谢大佬讲解,我这边电脑系统太低(Win7),按照您截图上点击右键,是截图上的显示,所以只能按Win+R再输入cmd进入调用页面。
guozibaba游客
dariyus游客@guozibaba #137700
谢谢大佬,我试试。
小透明游客这个下载器可以用,也可以用python召唤,随便找个文件夹,新建python代码即可
要修改两个变量,一个是「url」另一个是「文件地址」,执行完毕后,会在代码所在的文件夹 生成相应的 pdf 文件。(要是操作频繁,可以考虑加入 Tkinter 方便快速输入地址)
代码如下:(非常简单)
import subprocess #书籍网址(浏览界面的网址) url = "https://www.rekhta.org/ebooks/anfas-ul-akabir-anwar-ul-zamair-maulana-mohammad-naimullah-ebooks" #软件的地址 ,可直接复制进去,格式为 r'地址' exe_path = r"C:\Users\user\Desktop\downloader-x64\Downloader.exe" #子线程处理 try: result = subprocess.run([exe_path ,'--url', url], shell=True,check=True,stdout=subprocess.PIPE) print(result.stdout.decode('utf-8')) print("程序执行成功!") except subprocess.CalledProcessError as e: print("程序执行失败:", e)
dariyus游客
guozibaba游客@dariyus #137705
換另一個壓縮包試試。或更新win系統。
dariyus游客@guozibaba #137706
好的,谢谢大佬,我试试。
dariyus游客@小透明 #137704
好的,谢谢大佬讲解,我这边用下载器还是显示截图所示红字部分的"The SSL connection could not be established, see inner exception.",我请一位大佬用您说的下载器执行相同的操作步骤,也是显示"The SSL connection could not be established, see inner exception."请问大佬,这种情况有解决方法吗,另外,请问大佬您说的新建python代码,是要用pycharm新建吗,请您不吝赐教,再次感谢大佬。
小透明游客你说的问题,我也没遇到过,不过你也不用着急,着急的任务发上来,大家先帮你下载就是。
--这个downloader 程序,是C# 语言写的,我没写过,这个一般做游戏的人会精通,大概是基于 Net框架来和windows交互的,你可以尝试更新下版本(搜索NET Framework,了解相关)。
实在解决不了,就换电脑吧,windows 7 大家都不用了,真喜欢除非是稳定的程序,不用更新的那种。不玩游戏,电脑性能垃圾点都没关系。
--python 也是一种编程语言,你不妨学习下,专长是处理字符串,还有现在比较火的AI。(简单说,对于一个新手来说,要运行我的脚本,需要安装python,安装点第三方库,会新建代码文件写代码 ,很简单,b站也有入门视频,自己不会写,那就抄别人写好的就行)
dariyus游客@小透明 #137727
谢谢大佬讲解,不好意思,这两天麻烦您和其他几位大佬了,我试着安装了最新版的net framework,还是不行(见截图),我需要换电脑了,您说的Python和Pycharm,我安装win7的版本试试,谢谢大佬。。
大佬,您看方便的话,能否抽空帮忙下载这两个链接的波斯文古籍,发一下,我这会儿有点急用,再次感谢大佬,真的不好意思,给您添麻烦了。
www.rekhta.org/ebook...lah-ebooks
www.rekhta.org/ebook...lah-ebooks
小透明游客不需要那么客气,我也是菜鸟,也不是科班出身,大家一起互助成长本所当然。
确认下分享的是不是你要的两本,就用的上面那个下载器下的,文字是一点都看不懂。
pan.baidu.com/s/1Si...Q?pwd=3enx
dariyus游客@小透明 #137822
收到,谢谢大佬帮助,实在抱歉,我这几天因为有点事,没来得及回复您,我确认了一下,就是我要的这两本,这两本是印度的一些出版社于19世纪下半叶出版的一些石版画印刷书,文字是波斯文,内容是有挂一些历史文化方面的,我做一些兴趣方向的研究需要,再次感谢大佬的帮助。
大佬,网盘的链接是我找到的三本有关杨公的民间古籍手稿,分享给您,以表谢意。
链接:https://pan.baidu.com/s/19oA2JrBHyeMgwrnI3zjjTg?pwd=lvpw
提取码:lvpw另外,大佬,还有一本和那两本同内容的石版画古籍有点急用(详见下方链接),需要请您帮忙下载发一下,我这边检查了一下系统,使用下载器时还是像之前那样出现下载不了的问题,需要您的帮助,您看方便的话,能抽空下载了帮忙发一下吗,再次感谢大佬,真的不好意思,给您添麻烦了。
dariyus游客- 作者帖子
正在查看 24 个帖子:1-24 (共 24 个帖子)
正在查看 24 个帖子:1-24 (共 24 个帖子)
正在查看 24 个帖子:1-24 (共 24 个帖子)