Sách scan Tội ác trên Thiên đường mật - Nhiều tác giả

Thảo luận trong 'Thư Viện Sách Scan' bắt đầu bởi Vũ Bá Liêm, 19/5/21.

Moderators: Zhiqiang
  1. Vũ Bá Liêm

    Vũ Bá Liêm Mầm non

    Mình có bản scan sách Tội ác trên thiên đường mật, thực hiện từ lâu rồi nhưng do nghiệp dư nên một số trang hơi lệch. Bây giờ mình muốn chuyển đổi các trang scan này thành text để tạo ebook chữ cho dễ lưu trữ và đọc. Mình có thể dùng cách nào được nhỉ, mong mọi người hướng dẫn ạ!
    Đây là link sách:
    Link gốc:
    Vui lòng đăng nhập hoặc đăng ký để xem link

    Link đã xử lý:

    Vui lòng đăng nhập hoặc đăng ký để xem link

    Link text ebook đã hoàn thành:

    Vui lòng đăng nhập hoặc đăng ký để xem link
     
    Last edited by a moderator: 18/8/21
    hnxuan, votanhau and dhq like this.
  2. machine

    machine Lớp 6

    Có 2 cách OCR:
    C1: Vui lòng đăng nhập hoặc đăng ký để xem link
    C2: dùng Adode Acrobat xuất (export) file pdf ra thành ảnh rồi dùng vFlat
    Vui lòng đăng nhập hoặc đăng ký để xem link
    (file pdf bạn đưa ra có kiểu chữ cũ và các dòng không thẳng hàng, dùng ABBYY để OCR cho kết quả không tốt lắm)

    Sau khi OCR có text rồi thì soát lỗi chính tả và có 2 cách chuyển thành ebook:
    C1: dùng Calibre chuyển đổi (convert) file Word thành ebook
    C2: dùng Sigil hoặc Calibre Editor đóng gói thành ebook

    Trong diễn đàn có các topic hướng dẫn đó, bạn tìm sẽ thấy.
     
    Chỉnh sửa cuối: 19/5/21
    amylee thích bài này.
  3. machine

    machine Lớp 6

    Xóa vì post nhầm
     
  4. Dr. No

    Dr. No Không không thấy Thành viên BQT

    Đây là kết quả ocr 99 trang đầu bằng vFlat. Hy vọng hợp ý bạn.
     

    Các file đính kèm:

    Vũ Bá Liêm thích bài này.
  5. Vũ Bá Liêm

    Vũ Bá Liêm Mầm non

    Em cảm ơn bác đã hướng dẫn ạ, Google Drive em đã thử nhưng nặng quá nên không chạy được.
     
  6. Vũ Bá Liêm

    Vũ Bá Liêm Mầm non

    Em cảm ơn bác rất nhiều ạ, kết quả thế này là quá tuyệt vời rồi ạ.
    Em đã có file ảnh rồi nhưng điện thoại iPhone 6 không cài được vFlat nên đoạn OCR lại bó tay. Khi nào bác có thời gian thì cảm phiền bác chuyển thành text hộ em cả cuốn được không ạ, em sẽ soát lỗi chính tả và tạo ebook đóng góp cho thư viện vì cuốn này khá hay, thư viện lại chưa có mà trên một số diễn đàn khác em thấy cũng có người hỏi ạ. Một lần nữa em xin cảm ơn các bác rất nhiều!!!
    Đây là link định dạng ảnh: Vui lòng đăng nhập hoặc đăng ký để xem link
     
  7. Dr. No

    Dr. No Không không thấy Thành viên BQT

    Không cần. Tôi đã dùng Screenshot_2021-05-19-23-28-37-43.jpg trên điện thoại xuất pdf thành ảnh rồi vì thế mới chạy được vFlat.

    Gửi bạn luôn phần còn lại.
     

    Các file đính kèm:

    amylee and Vũ Bá Liêm like this.
  8. Vũ Bá Liêm

    Vũ Bá Liêm Mầm non

    Em xin cảm ơn bác rất nhiều ạ.
    Em đăng ký làm thành viên đã lâu nhưng mà nay mới đăng bài, và thấy rất tuyệt vời vì mọi người thân thiện và nhiệt tình như thế này ạ.
    Em sẽ làm thành ebook và đóng góp cho forum.
    Xin chân thành cảm ơn mọi người ạ!!!
     
  9. Dr. No

    Dr. No Không không thấy Thành viên BQT

    Cần chia nhỏ file ra dưới 50 trang một gói thì mới chạy được bằng Google Drive. Ngay vFlat cũng phải chia ra dưới 100 trang mà.
     
    Vũ Bá Liêm thích bài này.
  10. Dr. No

    Dr. No Không không thấy Thành viên BQT

    Cuốn này hay, tôi đã chuyển sang box Thư viện sách scan và thêm 1 phiên bản đã xử lý: làm thẳng dòng, crop trang sách cho đẹp, tối ưu hóa dung lượng, file này thêm vào post #1.

    Về phần text tôi đã sửa file ocr gần xong rồi, còn độ 50 trang nữa thôi.
     
    Vũ Bá Liêm thích bài này.
Moderators: Zhiqiang

Chia sẻ trang này