Hướng dẫn Lỗi copy chữ từ foxit pdf reader bị dính chữ

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi phaithatmanhme19, 11/1/22.

  1. phaithatmanhme19

    phaithatmanhme19 Mầm non

    Chào mọi người, mình đang tập tành làm ebook. Hiện mình đang gặp vấn đề khi copy text từ file pdf sang word để làm ebook. Đó là những hàng kết thúc bằng dấu "-" khi copy qua word sẽ bị dính với chữ đầu tiên hàng phía dưới.
    Liệu có fix được lỗi này không, làm ở word hoặc ở sigil cũng được ạ
    Ở trong hình là chữ "độc-giả"
    Bạn nào từng bị lỗi này giúp mình chút nhé !
     
    Chỉnh sửa cuối: 12/1/22 lúc 09:03
  2. phaithatmanhme19

    phaithatmanhme19 Mầm non

  3. sucsongmoi

    sucsongmoi Mầm non

    Dùng chức năng tìm kiếm và thay thế trong Word
    upload_2022-1-11_10-20-29.png upload_2022-1-11_10-20-29.png
     
    phaithatmanhme19 thích bài này.
  4. phaithatmanhme19

    phaithatmanhme19 Mầm non

    dạ, mình vẫn đang dùng cách này, nhưng mà cả cuốn thì phải >100 từ khác nhau như thế, dò find and replace cũng hơi lâu.
    Mình không hiểu vì sao copy lại không nhận được ký tự "-" nếu nó ở mỗi cuỗi hàng.
     
  5. phaithatmanhme19

    phaithatmanhme19 Mầm non

  6. nhat1395

    nhat1395 Lớp 6

    Hầu hết chuyển text đều bị như này, bạn thử xài abbyy chuyển từ pdf qua word thử.
     
    phaithatmanhme19 thích bài này.
  7. tran ngoc anh

    tran ngoc anh Cử nhân

    Mình cũng có tí kinh nghiệm với chuyển text, bạn up pdf gốc mình test thử xem.
     
    phaithatmanhme19 thích bài này.
  8. phaithatmanhme19

    phaithatmanhme19 Mầm non

    Mình làm sách có tiếng pali khi convert bị lỗi dấu, nên mình chỉ copy thôi:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    B xem giúp mình nhé
     
    tran ngoc anh thích bài này.
  9. tran ngoc anh

    tran ngoc anh Cử nhân

    Hiện thì mình dùng Word kiểm tra cũng phát hiện cả những gạch nối ở giữa dòng có lúc bị nuốt mất, chứ không chỉ những gạch cuối dòng, mình đang tìm các xử lý chuyển sang html xem có đỡ hơn không!
     
    phaithatmanhme19 thích bài này.
  10. tran ngoc anh

    tran ngoc anh Cử nhân

    Mình nhận xử lý text cuốn này nhé ^^
     
    phaithatmanhme19 and huytran like this.
  11. phaithatmanhme19

    phaithatmanhme19 Mầm non

    Mình làm thủ công được 4,5 cuốn như thế mà chậm lắm. B có kinh nghiệm chia sẻ thêm cho mình với nhé !
     
  12. tran ngoc anh

    tran ngoc anh Cử nhân

    Tức là bạn dùng chức năng rà lỗi chính tả của Word để sửa các lỗi dính từ đó đúng không? Mình thì dùng Acrobat chuyển pdf sang html để xử lý, không bị lỗi mất gạch nối đó.
     
    phaithatmanhme19 thích bài này.
  13. phaithatmanhme19

    phaithatmanhme19 Mầm non

    ^^ mình tìm tay thôi à. Lướt từ trên xuống thấy có dích chữ thì dùng lệnh find and replace, tiện thể thêm mục lục, rồi chỉnh mấy thứ nữa
     

Chia sẻ trang này