Hoàn thành Bố Già - Mario Puzo (Đông A phát hành)

Thảo luận trong 'Dự án eBook cho Thư viện' bắt đầu bởi V/C, 9/3/19.

Moderators: rhea, thuannguyen1088
  1. V/C

    V/C Mầm non

    Lại thích bản Đông A.
     
  2. Dr. No

    Dr. No Không không thấy

    Mua vài năm rồi, cũng tưởng nó xịn, để gối đầu giường, biết bị lừa rồi thì bỏ thôi. Có một lần có bản 1989, đọc nát từ hồi đó, sau cho bạn mượn nó xé mất một tờ đúp nên lại vứt đi.

    Thật sự thì chưa biết bản dịch Ngọc Thứ Lang xịn là thế nào, chính ở topic này (một trang của bạn @Nga Hoang và độ chục trang hồi trước cô giáo t.a scan cho từ bản 1974) mới biết mình bị NXB nó lừa từ lâu rồi, chưa bao giờ được cầm bản dịch xịn. Đọc thì không tính vì chính bản hiện có trên vnthuquan là gần với bản gốc nhất.
     
    nhockon_cm thích bài này.
  3. Dr. No

    Dr. No Không không thấy

    Đang chờ cuốn sách này, review cái bìa, bìa cuối, trang lót.

    [​IMG]

    [​IMG]

    [​IMG]
     
    Chỉnh sửa cuối: 5/4/19
    tran ngoc anh thích bài này.
  4. teacher.anh

    teacher.anh Rùa lười Thành viên BQT

    Em đang canh vé máy bay giá rẻ để mang sách ra cho anh đây :D . Nhân tiện cho em hỏi anh có đang ở HN trong tháng 4 hay tháng 5 không?

    P/s: Xin lỗi @V/C vì nhắn bác @Dr. No ở đây, tại bác tóm cổ mình ở topic này nên đành làm loãng topic vậy. Không có ý gì khác đâu.
     
    Chỉnh sửa cuối: 5/4/19
    Dr. No thích bài này.
  5. Dr. No

    Dr. No Không không thấy

    Có ở HN chứ. Nếu có gì thay đổi sẽ gửi mật thư nhé! :D

    Nhân đây có một mong muốn, một ước mơ là số hóa (chuyển từ bản cứng thành bản mềm, scanpdf cũng ok) tất cả những cuốn sách quý hiếm.

    P.S Đừng coi thường những cuốn đó, có khi trả mấy củ mà không mua được đấy. :)
     
    maxiqboy, Logan2910 and teacher.anh like this.
  6. tran ngoc anh

    tran ngoc anh Cử nhân

    Đang soát lại cuốn này. Ái chà, mới lướt qua chương 19 xong, nội chương 19 thôi có tới 39 lỗi. Ai soát lần một gói nào có đoạn này vậy ta, rốt cuộc có soát không hay nhận về rồi đọc PDF? Xong quăng lại file docx đã sửa tên? :D Chưa kể trong lúc đóng epub đã sửa rất nhiều lỗi trùng lặp, hoặc lỗi mà từ điển phát hiện được.
    Thấy lỗi dầy quá nên ngán làm biếng sửa :D
     
  7. nhockon_cm

    nhockon_cm Lớp 1

    Bác ơi, mấy năm rồi cô giáo cổ có gởi cuốn xịn 1974 chưa ạ?
     
  8. HPA105

    HPA105 Mầm non

    Giờ dùng OCR là làm được mà bạn.
     
    Last edited by a moderator: 24/1/24
  9. tran ngoc anh

    tran ngoc anh Cử nhân

    Bạn ơi, dự án ban đầu do mình OCR đó! Cái đoạn mà bạn trích mình là đọc lại sản phẩm hoàn chỉnh đã qua nhiều khâu soát lỗi hậu OCR. Bạn còn góp ý dùng OCR để làm gì?

    Mình nghĩ bạn không thực sự hiểu OCR hoạt động như thế nào trong một dự án ebook đâu đúng không?
     
    Chỉnh sửa cuối: 24/1/24
    machine thích bài này.
  10. HPA105

    HPA105 Mầm non

    Sorry bạn, mình tưởng mọi người vẫn còn soát thủ công.
    Giờ thì OCR rồi cho vào AI nó soát lỗi là cũng nhanh đáng kể rồi. Những bạn cẩn thận thêm khâu soát thủ công thì nên thêm mấy tool có từ điển để sửa lỗi chủ động + tool so sánh giữa 2 bản để đối soát lại.
     
    Last edited by a moderator: 24/1/24
  11. HPA105

    HPA105 Mầm non

    Chủ thớt đưa lên #1 ý cho ace dễ tìm file download ^^
    Thanks chủ thớt vì tâm huyết với sách
     
  12. tran ngoc anh

    tran ngoc anh Cử nhân

    Mình cũng có dùng rồi bạn ơi.
     
  13. bánh mì sữa

    bánh mì sữa Mầm non

    Vẫn phải soát thủ công chứ bạn. Những cái bạn nói ai làm ebook đều đã biết. AI và những tool bạn nói là gì? Bạn hình như chưa biết quy trình làm epub từ sách giấy ra như thế nào nhỉ hoặc chưa từng làm một ebook bao giờ.

    Hai cái tôi in đậm ở phần còm của bạn thì đối nhau chan chát.
     
    Chỉnh sửa cuối: 24/1/24
  14. machine

    machine Lớp 12

    Bạn đã làm thực tế bao giờ chưa? Có thể hướng dẫn cụ thể hơn được không?
    Bạn có thể liệt kê và hướng dẫn cụ thể hơn được không?
     
  15. HPA105

    HPA105 Mầm non

    Mình thì scan đơn giản bằng điện thoại:
    - Nếu là truyện tranh, nhiều hình ảnh thì dùng Adobe scan hoặc app tương tự. Xong là ra sách ngay. Scan hơi thủ công 1 chút so với bạn mua máy scan, nhưng nó phù hợp cho tất cả, vì không phải ai cũng có máy scan. Về chất lượng thì do Camera của máy quyết định, về cơ bản mình thấy đủ nét để in ra luôn, đọc trên máy tính, tablet hay máy đọc sách không vấn đề. Nếu mà mọi người đều làm, mỗi người 1 cuốn thì chắc đỡ vất vả và nhanh hơn 1 người với cái máy scan.
    - Nếu là scan sách toàn chữ, truyện chữ
    + B1: mình dùng Google Lens hoặc vẫn là chụp ảnh rồi dùng tool OCR trên máy tính (tuy nhiên, để ai cũng làm được, tham gia được 1 dự án scan nào đó thì nên là Google lens)
    * Lưu ý dùng máy có camera ok 1 tí, bỏ gáy để đảm bảo quét hết chữ trên giấy - mình chưa gặp lỗi nào về scan sai chữ nếu dùng Google Lens và máy mình là Samsung Note10 thôi cũng đã được rồi.
    + B2: Copy hết text ra rồi đưa vào AI bất kỳ như ChatGPT rà soát chính tả 1 lượt. Như vậy đến đây là bản cứng đã convert thành bản mềm rồi (draft thôi). Vì dùng điện thoại thì làm đến đây là tốt rồi.
    + B3: Đoạn này cần máy tính. Dùng mấy soft app cho đối chiếu compare nội dung 2 file text để xem AI nó xử lý chính tả ổn không (nhiều lúc không được như ý thì 1 là viết prompt lại cho chi tiết hơn, dùng AI xịn hơn, train nó trước - làm lâu dài...). Trường hợp không dùng AI để soát lỗi chính tả mà muốn soát bằng tool thì Calibre hỗ trợ soát mấy vụ này. Mà kể cả dùng AI thì chắc chắn ai làm biên tập cũng sẽ soát 1 vài lần nữa rồi. Dùng tool gi thì tùy mỗi người.
    + B4: Làm đẹp, format ebook thì thôi, đoạn này cũng tùy mỗi người rồi.

    Note thêm 1 chút: Scan truyện tranh thì thôi, cứ coi như là máy scan nó xịn sò, ra hình đẹp hơn, tốc độ scan nhanh hơn... còn với sách chữ thì không hiểu lưu trữ mấy cái scan vài trăm KB/ thậm chí vài MB/ 1 ảnh làm gì. Do đó, từ khi có Google Lens mà OCR ngon lành thì cứ biến thành chữ luôn cho nhanh.

    Mình vẫn đang làm như thế cho cá nhân, đương nhiên là không phải quyển sách hàng nghìn trang nên không nói to tát. Mình không làm theo quy trình ebook nào đó vì mình không biết. Mình chỉ cần biết mục tiêu là biến nó thành bản mềm với đầy đủ nội dung thì mình vẫn đang làm được.

    Trên đây là chia sẻ về kinh nghiệm số hóa của mình thôi. Có thể không phù hợp với các bạn làm ebook lớn, nhiều trang... Có gì các bạn góp ý thêm để mình hoàn thiện.
     
    Last edited by a moderator: 24/1/24
    nhockon_cm and machine like this.
  16. amylee

    amylee Super Moderator Thành viên BQT

    Không có nguồn sách chụp và lưu trữ thì làm gì ra chữ :D. Ra chữ phải soát lỗi chính tả (2 lần đối với mình) và đóng gói eBook là cả một quá trình tốn rất nhiều thời gian, nhanh cũng không được. Nên có sách scan đọc là quý lắm rồi. Và bây giờ mọi người đòi hỏi độ chính xác cao. Như mình hồi trước cũng nghĩ giống như bạn nên các eBook mình làm trước đó đều đã xóa file PDF và sách thì đem tặng. Bây giờ có bạn nào thắc mắc chỗ nào đó thì mình cũng không còn sách để mà tra. Rút từ kinh nghiệm đó, bây giờ mình đã phải lưu trữ một file PDF để còn đối chiếu trong khi đã ra chữ rồi.

    Bạn có thể chia sẻ một thành quả eBook bạn tự làm từ A-Z không?
     
    Chỉnh sửa cuối: 24/1/24
  17. machine

    machine Lớp 12

    Adobe scan có tính năng tự nắn thẳng trang sách cong không bạn? Và có tính năng tự động scan sau mỗi khoảng thời gian cố định (5 giây hoặc 7 giây)?

    Ví dụ sách có 300 trang, chụp 300 ảnh, nếu dùng Google Lens để OCR thì phải copy 300 lần hay sao bạn? (mình đã thử mà chỉ thấy Google Lens xử lý từng ảnh một)

    Chỗ này phải hỏi lại là bạn đã làm bao giờ chưa? Nếu làm rồi thì bạn có thể hướng dẫn chi tiết được không? (một lần tối đa được bao nhiêu từ? cú pháp promt như nào?...)

    File scan tính chính xác cao hơn (trừ khi cố ý thay đổi nội dung), nhiều họa tiết trang trí ebook (chính xác là file epub) sẽ không thể hiện chính xác được như sách in đâu.
    Sách chữ 300 trang chẳng hạn, sau khi xử lý các kiểu sẽ được file scanned pdf khoảng 4-5Mb/300 trang thôi, nghĩa là mỗi trang chưa đến 20KB.
    Ví dụ như Vui lòng đăng nhập hoặc đăng ký để xem link scan bằng điện thoại đó.

    Rất mong bạn trao đổi thêm kinh nghiệm để mọi người cùng tham khảo.
     
Moderators: rhea, thuannguyen1088

Chia sẻ trang này