Hướng dẫn Làm ebook từ sách giấy

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi machine, 9/2/22.

  1. machine

    machine Sinh viên năm I

    Ở phần ngôn ngữ Vietnamese bạn thêm cả English vào nữa sẽ khắc phục được mấy lỗi tiếng Anh.
    Một số lỗi tiếng Việt trong "dữ liệu" cho Text Crawler đã có sẵn rồi nên sau khi OCR bằng ABBYY chạy Text Crawler cũng đỡ lắm.
    Mình không có ý bênh vực ABBYY.
    Do đặc thù hay đọc sách non-fiction có một vài trăm cụm từ in nghiêng mà vFlat hiện chưa nhận dạng được nên mình tiếp tục dùng ABBYY. Ngoài ra ABBYY còn có ưu điểm là OCR được cả quyển sách vài trăm trang 1 lần và tự động loại bỏ được số trang và Header/Footer của sách giấy.
    Nếu sách dạng tiểu thuyết thì vFlat phù hợp hơn.
    Về độ chính xác khi nhận dạng, ABBYY kém hơn vFlat nhưng kết hợp cả 3 thao tác: chạy Text Crawler, soát lỗi trong Sigil, soát lỗi bằng Google Docs thì độ chính xác tăng lên đáng kể (còn sót khoảng 100-300 lỗi chính tả trên tổng số 100.000 từ) mà không mất quá nhiều công sức.
    Kết luận: mỗi phần mềm/ứng dụng sẽ phù hợp với những mục đích khác nhau :D
     
  2. Đậu Bơ

    Đậu Bơ Mầm non

    Đang tính tự làm cuốn sách mình thích từ file PDF mà đọc bài này xong cái nản quá :confused:
     
  3. machine

    machine Sinh viên năm I

    Làm thử 1 lần đi bạn. Chỗ nào vướng mắc thì post lên mọi người cùng giải đáp.
     
    Đậu Bơ thích bài này.
  4. tran ngoc anh

    tran ngoc anh Cử nhân

    Đọc TUT hay bị mất cảm hứng lắm. Thà lúc bắt đầu cứ làm theo hứng, vướng ở đâu tìm tut đọc giải quyết ở đó thì lại theo bền hơn :D nhích từng nhích một.
     
    Đậu Bơ and machine like this.
  5. Minhnh

    Minhnh Mầm non

    Cho mình hỏi, mình nên cắt gáy sách thế nào để scan cho đẹp, và mình nên dùng máy scan nào để tự động scan được những cuốn sách dày cỡ 600-700 trang trở lên. Mình tính phương án thuê máy để scan sách. Cảm ơn mọi người.
     
  6. Xung Ca

    Xung Ca Mầm non

    cảm ơn bạn rất nhiều
     
  7. machine

    machine Sinh viên năm I

    Mình không dùng có máy scan nên không rõ.
    600-700 trang dùng điện thoại có vFlat mất khoảng 2 giờ là xong. Muốn đẹp hơn nữa thì xử lý tiếp bằng ABBYY hoặc Scan Tailor Experiment.
     
    Minhnh and sucsongmoi like this.
  8. duynguyen275

    duynguyen275 Lớp 2

    công cụ keep notes của google nó lấy text từ hình cũng chuẩn ghê, có bác nào thử chưa.
     
  9. machine

    machine Sinh viên năm I

    Vấn đề là xử lý ở số lượng lớn.
    Nếu có 400-500 ảnh thì Keep note có cho phép nhập đồng thời trong một lần được không? hay chỉ được phép nhập mỗi lần 1 ảnh?
     
  10. duynguyen275

    duynguyen275 Lớp 2

    mình mới thử mỗi lần chục trang thì vẫn được, nhiều hơn thì mình chưa thử.
     
    machine thích bài này.
  11. machine

    machine Sinh viên năm I

    Cảm ơn bạn.
     
  12. SCCBAV

    SCCBAV Lớp 5

    Có ai biết cách làm từ sách theo kiểu scan hai mặt, 4 trang khum nạ hướng dẫn mình với. Đang có mấy quyển 10 Vạn câu hỏi vì sao cũ năm 1995-1996 theo nội dung của TQ, giải thích khá khoa học, mình rất thích muốn rã ra làm ebook để lưu được lâu dài. Nếu làm được sẽ share lên diễn đàn cho mọi người cùng xem
     
    machine thích bài này.
  13. machine

    machine Sinh viên năm I

    Này chắc sách phải là loại khâu từng tép, tháo từng tép ra thôi. Mà cũng hơi lằng nhằng vì các trang sẽ không theo thứ tự, sau khi được file ảnh sẽ mất nhiều công sắp xếp lại.
    Ví dụ: tép đầu tiên có 20 trang (5 tờ gập đôi) thì tờ đầu tiên khi quét mặt trên sẽ là trang 2 và trang 19, mặt dưới là trang 1 và trang 20. Tờ thứ 2 mặt trên sẽ là trang 4 và 17, mặt dưới là trang 3 và 18...
    --> quét 2 mặt 4 trang có lẽ không khả thi vì sẽ mất nhiều công sức để sắp xếp lại ảnh chụp theo số trang tăng dần 1, 2, 3, 4, 5...
    Chắc chỉ còn cách cắt gáy quét 2 trang 1 thôi.
    Hoặc nếu làm túc tắc thì mua "đồ nghề" về chụp, vẫn giữ được sách, mỗi giờ được khoảng 300-500 trang.
    Tham khảo ở đây:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    hoặc
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
    SCCBAV, sucsongmoi and tran ngoc anh like this.
  14. SCCBAV

    SCCBAV Lớp 5

    THanks bác để nghiên cứu xem sao
     
    machine thích bài này.
  15. oldman20

    oldman20 Lớp 2

    thật là thêm nhiều kiến thức bổ ích, cám ơn bạn OP
     
  16. lindamaria

    lindamaria Mầm non

    Mình cần tìm bạn nào ở Sài Gòn để chuyển giúp mình vài quyển sách giấy sang ebook ạ! Đa số sách mình chuyển là sách về tâm lý hành vi, tổ chức, marketing. Hic nếu bạn nào nhận được hay biết ai nhận làm thì nhắn giúp mình nhé. Mình cảm ơn nhiều!
     
    SCCBAV thích bài này.

Chia sẻ trang này