Hoàn thành Ăn gì không chết (How Not To Die)

Thảo luận trong 'Dự án eBook cho Thư viện' bắt đầu bởi duykhan, 18/1/23.

Moderators: rhea, thuannguyen1088
  1. duykhan

    duykhan Lớp 3

    Mời mọi người cùng làm bản sách điện tử cho "How Not to Die" - Ăn gì không chết bản Tiếng Việt.

    Các bản cần sửa : Vui lòng đăng nhập hoặc đăng ký để xem link


    Nơi đăng bản đã sửa xong :
    Vui lòng đăng nhập hoặc đăng ký để xem link


    Mình sẽ chia ra làm 6 phần sửa (Mọi người soát theo trình tự các tệp mình chia ra trong thư mục trên Drive nghen) :
    Ở phần 1 :
    - Sửa thông tin sách, sắp xếp các thứ : @duykhan (Đã xong)
    - Người phụ trách gõ từ phần 1 (Phần 1 -> 5 trong Drive) : @Anan Két (Đã xong)
    - Người phụ trách gõ từ phần 1 (Phần 6 -> 10 trong Drive) : @duykhan (Đã xong :D)
    - Người phụ trách gõ từ phần 1 (Phần 11 -> 15 trong Drive) :
    @duykhan (Đang sửa)

    Ở phần 2 : Giới thiệu + Lượng ăn hàng ngày :
    - Phần giới thiệu + Các phần (Đậu, quả mọng, các loại trái cây, rau củ, rau xanh, các loại rau củ khác) : @bophiyen
    - Phần 2 (Hạt lạnh, quả hạch và các loại hạt, các loại thảo mộc, ngũ cốc, thức uống, thể dục) : @bophiyen (Đã xong)

    Phần phụ lục + chỉ mục + Các phần giới thiệu :
    USER=272002]@bophiyen[/USER] (Đã xong)

    Mọi người tham khảo bản pdf được scan ở đây :
    Vui lòng đăng nhập hoặc đăng ký để xem link
     

    Các file đính kèm:

    Chỉnh sửa cuối: 23/2/23
  2. Mình chỉ thắc mắc mấy ông sư ăn mỗi rau không sau béo với hồng hào thế?
     
  3. xversion1

    xversion1 Lớp 3

    Vì định nghĩa rau của các ông ấy khác bình thường. Cứ suy từ "đậu phụ" ra là biết.
     
  4. Anan Két

    Anan Két Lớp 8

    Bạn @duykhan, cuốn này mới nên OCR bằng Abbyy rất tốt, không cần đánh máy đâu. Bạn xem hướng dẫn dùng Abbyy tại topic sau nhé:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    Bạn Vui lòng đăng nhập hoặc đăng ký để xem link, không cần cài đặt, bấm vào xài luôn.
    Lâu rồi trên diễn đàn mới có 1 dự án soát lỗi chính tả, mình đăng ký gói từ trang 1-50 mở hàng nhé! :D
     
    oldman20 thích bài này.
  5. duykhan

    duykhan Lớp 3

    Mình thử OCR bằng Acrobat (Cái này lỗi do không có tiếng Việt) và một số trang web trên mạng á, nhưng mà kết quả mỗi khi copy thử đều lỗi á, nên tính nhờ mn cùng làm rồi đối chiều từ sách thật với bản scan mình tìm trên mạng. Còn về chia phần thì có thể mình nên chia theo trang hơn là theo mục. Có khoảng hơn 500 trang chính với 200 trang còn lại là reference, okay thế thì mình làm phần sau, mình sẽ soạn lại bài thông báo ở trên.
     
  6. Anan Két

    Anan Két Lớp 8

    @duykhan Bạn cứ từ làm nhé, sau khi OCR bằng Abbyy xong thì thêm bước Xử lý sau OCR để loại bỏ headers, footers như file word mình đính kèm dưới đây (Nguồn: @Dr. No).
    Vướng chỗ nào bạn comment nhé, trên diễn đàn có rất nhiều bạn rành về Abbyy. :)
     

    Các file đính kèm:

    machine thích bài này.
  7. xversion1

    xversion1 Lớp 3

    Sao ko crop header/footer bằng Abbyy trước rồi hãy chạy OCR bác?
     
  8. Anan Két

    Anan Két Lớp 8

    Crop headers + footers trước cũng được bạn, nhưng đằng nào cũng phải xử lý sau OCR để loại bỏ các định dạng không cần thiết của pdf gốc.
     
  9. duykhan

    duykhan Lớp 3

    Mình đã chuyển đổi về .epub và gói lại ở trên gòi nha :>. Mọi người chia phần sao thì cmt để mình ghi tên vô nha.
     
  10. machine

    machine Lớp 11

    Bạn đóng gói ebook luôn rồi thì phân chia công việc làm sao?
    Mình rón rén góp ý như này:
    - ví dụ quyển này bạn chia thành 10 gói tương ứng với 10 file Word, ai nhận gói nào thì sửa lỗi chính tả trong phạm vi file Word đó thôi.
    - sau khi các file Word đã được soát lỗi chính tả xong thì mới tập hợp lại để đóng gói thành ebook.
     
    Anan Két, duykhan and sucsongmoi like this.
  11. bophiyen

    bophiyen Mầm non

    Mình đăng ký 200 trang nhé.
    Với mình thấy nhận dạng bằng abbyy độ chính xác không cao bằng app Vflat Scanner trên android (tuy nhiên bị giới hạn 100 trang / ngày, không giữ lại định dạng và hình ảnh) bạn có thể tham khảo.
     
    machine thích bài này.
  12. sucsongmoi

    sucsongmoi Lớp 6

    Ngoài lề xíu, Tết này ăn gì không mập, không no và không lo ngộ độc?:p
     
    machine thích bài này.
  13. duykhan

    duykhan Lớp 3

    Chào bạn,
    Mình cảm ơn bạn vì góp ý nha, mình sẽ sửa lại và chia ra thành một số lượng file word cho mọi người, mình để nguyên Epub như này cũng khá khó khăn để chia đều công việc, thanks nhìu nghen ^^>!
     
    machine thích bài này.
  14. machine

    machine Lớp 11

    Sau khi OCR, nếu chọn lưu thành file word ở dạng editable thì Abbyy tự động loại bỏ Header/Footer và số trang luôn (có thể sót 1 vài chỗ), đâu cần phải loại bỏ Header/Footer trước khi OCR?
     
    xversion1 and Anan Két like this.
  15. duykhan

    duykhan Lớp 3

    Tất cả các phần chia + File đã được cập nhật ở trên, mọi người kiểm tra giúp mình nha. Nếu mọi người muốn soát lỗi phần nào thì tag mình rồi ghi tên phần như đã được cập nhật ở bài đăng trên nha. Mình cảm ơn mọi người nhiều.
     
  16. Mấy ông ăn chay trường nhưng đường bánh kẹo với dầu mỡ ăn nhiều thì béo thôi vs cả họ tập khí công nữa nên máu huyết tốt ạ
     
  17. Anan Két

    Anan Két Lớp 8

    Mình xác nhận soát 1-5 nha. Bạn soát tổng và đóng gói bằng phần mềm gì (Word, Sigil...) để mình format file soát cho phù hợp?
     
  18. duykhan

    duykhan Lớp 3

    Mình làm bằng Calibre nha, nếu được thì bạn nên để định dạng HTML nghen, nếu .docx hay .txt thì mất chút thời gian convert :v
     
    Anan Két thích bài này.
  19. bophiyen

    bophiyen Mầm non

    @duykhan Đầu năm đã khai bút xong, file word là chuẩn style + định dạnh theo sách gốc, còn mấy file html là xuất ra để bạn làm ebook (nhớ đính kèm 1 file hình + main.css)

    Link chú thích thì để theo tên file + stt, ai tạo chú thích thì nhớ link back lại sau khi xem chú thích nhé.
     
  20. Thanh khê

    Thanh khê Mầm non

    Sách này rất hay, đọc theo kiểu ngẫu nhiên từng đoạn được.
     
    Chỉnh sửa cuối: 23/1/23
Moderators: rhea, thuannguyen1088

Chia sẻ trang này