Hướng dẫn Lỗi font khi đọc trên kindle và cách khắc phục

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi paolo379, 21/1/15.

  1. paolo379

    paolo379 Mầm non

    Vấn đề này mình đã trình bày:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    Thêm 1 cuốn nữa:
    Vui lòng đăng nhập hoặc đăng ký để xem link

    Xin lỗi vì lập thêm topic, mong bạn nào hướng dẫn mình cách làm để đọc đc sách.
    Chân thành cám ơn.
     
  2. tamchec

    tamchec Sinh viên năm I

    Một số ebook bị lỗi font khi đọc trên kindle

    1. Nguyên nhân thường do khi làm ebook, có bạn sử dụng unicode tổ hợp để type.
    => Cách khắc phục: convert từ unicode tổ hợp sang unicode dựng sẵn

    2. Hướng dẫn

    2.1. Các phần mềm cần thiết
    - Calibre (download tại Vui lòng đăng nhập hoặc đăng ký để xem link)
    - Sigil 0.7.4 (download tại Vui lòng đăng nhập hoặc đăng ký để xem link)
    - Vietpad (download tại Vui lòng đăng nhập hoặc đăng ký để xem link)
    Để có thể chạy vietpad yêu cầu phải cài máy ảo java. (download tại Vui lòng đăng nhập hoặc đăng ký để xem link)

    2.2. Các bước thực hiện
    - Dùng calibre convert file ebook sang định dạng epub

    - Mở file epub bằng sigil, tìm đến file html/xhtml bị lỗi font, ở chế độ code view sẽ nhìn thấy.
    [​IMG]

    - Copy toàn bộ nội dung, mở vietpad (chạy file VietPad.jar) rồi paste vào.

    - Ở VietPad, chọn tool -> convert to unicode, ở from chọn Unicode composite và tick vào html source. Sau đó bấm convert.
    [​IMG]

    - Copy toàn bộ nội dung đã convert từ Vietpad sang sigil đè lên chỗ cũ.
    [​IMG]

    - Các file html/xhtml làm tương tự. (file epub thực ra là một bao chứa các file html/xhtml)

    - Cuối cùng save file epub lại, dùng calibre để convert sang mobi, cop vào kindle đọc sẽ hết lỗi.
     
    vinives, VọngAlpha, Rafa and 5 others like this.
  3. paolo379

    paolo379 Mầm non

    Cám ơn nhiều, mình sẽ làm thử và báo cáo kết quả.

    update:
    Báo cáo: làm y như hướng dẫn và kết quả tuyệt vời.
     
    Chỉnh sửa cuối: 22/1/15
    Rafa, superlazy and tamchec like this.
  4. vutananh

    vutananh Lớp 3

    Các bạn cho mình xin (tên của) ứng dụng đổi tên sách định dạng .prc... thành có dấu tiếng Việt với vì lâu ngày mình quên mất tên rồi nên cũng không biết search như thế nào! Cảm ơn các bạn!
     
  5. 4DHN

    4DHN Tiêu Dao

    Tôi nhớ là hồi còn TVE, bạn @quocsan có giới thiệu phần mềm do bạn đó viết. :D
     
    vutananh thích bài này.
  6. nhim201

    nhim201 Lớp 4

    là ebooktitle.exe đó
     
    vutananh thích bài này.
  7. vutananh

    vutananh Lớp 3

    Cảm ơn các bạn @4DHN và bạn @nhim201 đã gợi ý! Cảm ơn bạn @quocsan! Mình đã tìm được và xin được đưa lại lên để mọi người có thể sử dụng khi cần đến!

    Sau khi giải nén mở công cụ ra, các bạn rename ở ô dưới với tên truyện tiếng Việt có dấu, nhấn update. Sau khi thoát ra thì các bạn rename cùng tên đối với file truyện đang bị lỗi dấu đó là OK!
     

    Các file đính kèm:

    Chỉnh sửa cuối: 2/10/15
  8. Rafa

    Rafa SV

  9. vinhtruyen92

    vinhtruyen92 Lớp 4

    @tamchec bác ơi, thế nếu file PDF mà lỗi vậy thì sao ạ?
    Vì nếu convert sang epub thì nó lại thành lỗi nhiều hơn (sai chính tả, xuống dòng...)
     
  10. Dr. No

    Dr. No Lớp 3

    File đâu bạn? Không có thì biết làm sao?

    Thông thường, nếu file là scan pdf người ta sẽ dùng OCR bằng phần mềm để chuyển hình ảnh thành text. Nếu là text pdf thì cứ copy sang word rồi dùng Unikey chuyển mã thành Unicode.
     
    vinhtruyen92 thích bài này.
  11. vinhtruyen92

    vinhtruyen92 Lớp 4

    File đây ạ.



    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  12. Dr. No

    Dr. No Lớp 3

    Đây là text pdf. Mai sẽ xem kỹ thêm nhé.

    Copy thử một đoạn. :)

    Ban hành kèm theo Quyết định này tài liệu chuyên môn “Hướng dẫn
    sử dụng kháng sinh
     
    vinhtruyen92 thích bài này.
  13. vinhtruyen92

    vinhtruyen92 Lớp 4

    [​IMG]

    Như này bác ạ. File pdf này em tải trên mạng về, nên ko có bản word. Muốn có word thì phải ocr thì lại lỗi nhiều hơn @@
     
  14. Dr. No

    Dr. No Lớp 3

    Bạn copy tất cả sang word xem.

    Dùng OCR chắc chắn sẽ lỗi chính tả. Như hôm qua tôi thử thì thấy đây là một file pdf được convert từ word cho nên có thể copy được. Tất nhiên sẽ xuất hiện lỗi xuống dòng ở cuối mỗi dòng của trang pdf. Ngoài ra, tài liệu này có rất nhiều bảng, cho nên phải làm trên word để khôi phục rồi mới tạo epub, mobi...

    Về lỗi xuống dòng không đúng chỗ thì trong word có thể dùng lệnh:
    Find: ^p
    Replace: một khoảng trắng

    F: ,^p
    R: , một khoảng trắng
    .....
    Trong đó: ^p tương đương một lệnh Enter
    Tuy nhiên ở các tiêu đề sẽ bị nối xuống dòng dưới, nên cần ngắt dòng lại.

    Cũng có thể sửa lỗi này trong epub qua Sigil, cần tìm hướng dẫn của tamchec trong topic

    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  15. Dr. No

    Dr. No Lớp 3

    Về lỗi font, thì cần đọc bài của Rafa về xử lý lỗi sau OCR, mục đích để có text thuần và giữ lại các định dạng như đậm, nghiêng.
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
    vinhtruyen92 thích bài này.
  16. vinhtruyen92

    vinhtruyen92 Lớp 4

    Tks bác. thế có cách nào mình xử lý trên kindle, để nó đọc được đúng font như trên máy tính ko bác?

    Vì máy tính thì đọc ngon lành, sang kindle thì lỗi, nên em thắc mắc là chữa tại kindle ấy, ko phải chữa file?
     
  17. Dr. No

    Dr. No Lớp 3

    Về lỗi font, thì cần đọc bài của Rafa về xử lý lỗi sau OCR, mục đích để có text thuần và giữ lại các định dạng như đậm, nghiêng.
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  18. Dr. No

    Dr. No Lớp 3

    Sau khi thử thấy cách OCR là hay nhất. Gửi bạn bản thô.
     

    Các file đính kèm:

  19. vinhtruyen92

    vinhtruyen92 Lớp 4

    Tks bác. Từ pdf sang word của bác bằng cách nào thế?

    ABBYY hay Callibre hay ilovepdf.com?
     
  20. Dr. No

    Dr. No Lớp 3

    ABBYY. Dùng cách khác gây ra nhiều lỗi về trình bày hơn, nhất là những chỗ dạng bảng, rất khó sửa.

    File word nói trên cần khôi phục các bảng rồi dùng Calibre convert sang epub, mobi.

    Ví dụ: ngay ở đầu
    upload_2018-12-7_12-7-26.png
    nó là một cái bảng để No Border.
     

Chia sẻ trang này