正在查看 22 个帖子:1-22 (共 22 个帖子)
  • 作者
    帖子
  • @137651 回复 ⚑举报 

    dariyus
    游客

    书格的各位大佬好,有一个印度的名为雷赫塔(Rekhta)的电子数据库,向各位大佬请教,链接如下:

    书本详情页: www.rekhta.org/ebook...ruf-ebooks

    在线阅读页: www.rekhta.org/ebook...ruf-ebooks

    详情阅读页的截图:

    2024-05-11_101539

     

    这个数据库没有给出具体的下载链接,求教各位大佬,如何才能把在线阅读页的电子版下载下来呢,有大佬知道下载方法的话,还请不吝赐教,谢谢各位大佬。

    @137662 回复 ⚑举报 

    无银三百两
    游客

    链接: pan.baidu.com/s/14F...d3Cb9R3TpQ 提取码: 1234

    @137670 回复 ⚑举报 

    小透明
    游客

    用 python可以尝试,不过工程量不小,网页虽提供原始图片,不过是乱的,要自己切割拼接的。

    下面是比较核心的拼接逻辑,示例代码可供测试,运行成功输出 007号的原图 (完整下书需要其他自动化代码配合)

    import requests
    from PIL import Image
    from io import BytesIO
    
    #img 中的 src
    image_url = 'https://ebooksapi.rekhta.org/images/c313bc20-0628-460c-b7ce-de67af2b6ea8/007.jpg'
    #包含img 的div的属性: data-pageid="24eae819-d295-4606-932a-490734e1bc22"
    page_info = "24eae819-d295-4606-932a-490734e1bc22"
    #来自 script 中的 访问API的 地址头
    url = "https://ebooksapi.rekhta.org/api_getebookpagebyid_websiteapp/?wref=from-site&pgid="
    url = url + page_info
    
    response = requests.get(url)
    data = response.json()
    
    #数据为dict ,供参考,截取部分,sub实际长度是308 
    '''
    {'X': 14,
     'Y': 22,
     'PageHeight': 1080,
     'PageWidth': 653,
     'Width': 0,
     'PageId': '24eae819-d295-4606-932a-490734e1bc22',
     'Sub': [{'X1': 7, 'X2': 0, 'Y1': 2, 'Y2': 0},...
     ]
    }
    '''
    #根据 js的 drawImage() 方程说明,原图是50×50 打乱的小块,要重新切出来绘制
    def get_origin(data, index, m = 50):
        res = data['Sub'][index]
        x_b = res['X1'] * (50 + 16)
        y_b = res['Y1'] * (50 + 16)
        #x_b,y_b 原图切割起点,x_a,y_a 是新图绘制起点
        x_a = res['X2'] * m
        y_a = res['Y2'] * m
        return x_b, y_b, x_a , y_a
    
    len_sub = len(data['Sub'])
    
    
    # 读取原始图像
    try:
        response_img = requests.get(image_url)
        original_image = Image.open(BytesIO(response_img.content))
    except Exception as e:
        print(e)
    
    #create new canvas 创新图 或画布
    canvas_width, canvas_height = data['PageWidth'], data['PageHeight']
    canvas = Image.new("RGB", (canvas_width, canvas_height), color="white")
    
    width = height = 50
    for i in range(len_sub):
        x , y ,x_2, y_2 = get_origin(data, i)
        # 切割图像
        cropped_image = original_image.crop((x, y, x + width, y + height))
        # 重新拼接
        canvas.paste(cropped_image, (x_2, y_2))
    # 显示拼接后的图像(可选)
    #canvas.show()
    #original_image.save("./original_image.jpg")
    
    # 保存拼接后的图像
    canvas.save("./test_image.jpg")
    @137671 回复 ⚑举报 

    guozibaba
    游客

    @dariyus #137651

    实测有效:

    github.com/insha...r/releases

    下载文件如下:10.8m,可惜原网站图片质量不高。

    链接: pan.baidu.com/s/129...A?pwd=n7mh 提取码: n7mh

    @137672 回复 ⚑举报 

    dariyus
    游客

    @无银三百两 #137662

    谢谢大佬分享,我保存了,这个图书馆之前是有一个下载器的,一位巴基斯坦的外网大佬提供的,前段时间还能用,不过不知为何,可能是这个数据库更新了链接,用那个下载器就下载不了了。

    大佬,您看方便的话,能否抽空再帮忙下载一下下面这两个链接的同为雷赫塔数据库的波斯文古籍发一下,再次感谢大佬,不好意思,麻烦您了。

    www.rekhta.org/ebook...lah-ebooks

    www.rekhta.org/ebook...lah-ebooks

    @137673 回复 ⚑举报 

    dariyus
    游客

    @小透明 #137670

    谢谢大佬分享下载方法,有点复杂,我研究研究。

    @137674 回复 ⚑举报 

    dariyus
    游客

    @guozibaba #137671

    谢谢大佬分享,我保存了,您发的下载器,我下载下来试了一下,可能是电脑版本比较低(我用的64位的win7系统),解压后一点击Downloader.exe就闪退。

    @137675 回复 ⚑举报 

    guozibaba
    游客

    @dariyus #137674

    这是命令行工具,进入命令行界面,运行如下命令:

    Downloader.exe --url 预览网址

    @137677 回复 ⚑举报 

    guozibaba
    游客

    @guozibaba #137675

    屏幕截图 2024-05-11 144122

    @137683 回复 ⚑举报 

    dariyus
    游客

    @guozibaba #137677

    谢谢大佬讲解,我按照您说的方法在cmd界面输入您输入的Downloader.exe --url 预览网址,结果像如下截图显示的这样,有解决方法吗,再次感谢大佬。

     

    2024-05-11_155536

    @137693 回复 ⚑举报 

    guozibaba
    游客

    @dariyus #137683

    解压缩文件后,进入文件夹,在空白处点右键,点如下图,然后输入命令。

    屏幕截图 2024-05-11 173042

    @137697 回复 ⚑举报 

    dariyus
    游客

    @guozibaba #137693

    谢谢大佬讲解,我这边电脑系统太低(Win7),按照您截图上点击右键,是截图上的显示,所以只能按Win+R再输入cmd进入调用页面。

    2024-05-11_182010

    @137700 回复 ⚑举报 

    guozibaba
    游客

    @dariyus #137697

    jingyan.baidu.com/artic...5f860.html

    如何在Windows7中快速打开命令行窗口

    @137703 回复 ⚑举报 

    dariyus
    游客

    @guozibaba #137700

    谢谢大佬,我试试。

    @137704 回复 ⚑举报 

    小透明
    游客

    这个下载器可以用,也可以用python召唤,随便找个文件夹,新建python代码即可

    要修改两个变量,一个是「url」另一个是「文件地址」,执行完毕后,会在代码所在的文件夹 生成相应的 pdf  文件。(要是操作频繁,可以考虑加入 Tkinter  方便快速输入地址)

    代码如下:(非常简单)

    import subprocess
    
    #书籍网址(浏览界面的网址)
    url = "https://www.rekhta.org/ebooks/anfas-ul-akabir-anwar-ul-zamair-maulana-mohammad-naimullah-ebooks"
    
    #软件的地址 ,可直接复制进去,格式为 r'地址' 
    exe_path = r"C:\Users\user\Desktop\downloader-x64\Downloader.exe"
    
    #子线程处理
    try:
        result = subprocess.run([exe_path ,'--url', url], shell=True,check=True,stdout=subprocess.PIPE)
        print(result.stdout.decode('utf-8'))
        print("程序执行成功!")
    except subprocess.CalledProcessError as e:
        print("程序执行失败:", e)
    @137705 回复 ⚑举报 

    dariyus
    游客

    @guozibaba #137700

    大佬,我按照您说的操作了,但是还是有报错,就像截图上这样的,具体怎么解决呢,请您帮忙看看,谢谢大佬。

     

    2024-05-11_193854

    @137706 回复 ⚑举报 

    guozibaba
    游客

    @dariyus #137705

    換另一個壓縮包試試。或更新win系統。

    @137716 回复 ⚑举报 

    dariyus
    游客

    @guozibaba #137706

    好的,谢谢大佬,我试试。

    @137723 回复 ⚑举报 

    dariyus
    游客

    @小透明 #137704

    好的,谢谢大佬讲解,我这边用下载器还是显示截图所示红字部分的"The SSL connection could not be established, see inner exception.",我请一位大佬用您说的下载器执行相同的操作步骤,也是显示"The SSL connection could not be established, see inner exception."请问大佬,这种情况有解决方法吗,另外,请问大佬您说的新建python代码,是要用pycharm新建吗,请您不吝赐教,再次感谢大佬。

    2024-05-11_215200

    @137727 回复 ⚑举报 

    小透明
    游客

    你说的问题,我也没遇到过,不过你也不用着急,着急的任务发上来,大家先帮你下载就是。

    --这个downloader 程序,是C# 语言写的,我没写过,这个一般做游戏的人会精通,大概是基于 Net框架来和windows交互的,你可以尝试更新下版本(搜索NET Framework,了解相关)。

    实在解决不了,就换电脑吧,windows 7 大家都不用了,真喜欢除非是稳定的程序,不用更新的那种。不玩游戏,电脑性能垃圾点都没关系。

    --python 也是一种编程语言,你不妨学习下,专长是处理字符串,还有现在比较火的AI。(简单说,对于一个新手来说,要运行我的脚本,需要安装python,安装点第三方库,会新建代码文件写代码 ,很简单,b站也有入门视频,自己不会写,那就抄别人写好的就行)

     

    @137792 回复 ⚑举报 

    dariyus
    游客

    @小透明 #137727

    谢谢大佬讲解,不好意思,这两天麻烦您和其他几位大佬了,我试着安装了最新版的net framework,还是不行(见截图),我需要换电脑了,您说的Python和Pycharm,我安装win7的版本试试,谢谢大佬。。

    大佬,您看方便的话,能否抽空帮忙下载这两个链接的波斯文古籍,发一下,我这会儿有点急用,再次感谢大佬,真的不好意思,给您添麻烦了。

    www.rekhta.org/ebook...lah-ebooks

    www.rekhta.org/ebook...lah-ebooks

    2024-05-12_095358

     

    2024-05-12_161112

     

    @137822 回复 ⚑举报 

    小透明
    游客

    不需要那么客气,我也是菜鸟,也不是科班出身,大家一起互助成长本所当然。

    确认下分享的是不是你要的两本,就用的上面那个下载器下的,文字是一点都看不懂。

    pan.baidu.com/s/1Si...Q?pwd=3enx

     

正在查看 22 个帖子:1-22 (共 22 个帖子)
正在查看 22 个帖子:1-22 (共 22 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:求问各位大佬关于印度雷赫塔(Rekhta)电子图书馆的下载方法。
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。