Sách scan Những cây thuốc và vị thuốc Việt Nam - Đỗ Tất Lợi

Thảo luận trong 'Thư Viện Sách Scan' bắt đầu bởi conguyen, 3/1/14.

Moderators: Zhiqiang
  1. trangpx

    trangpx Mầm non

    Bạn nói phá định dạng ở những file nén đó là sao, mình chưa hiểu, mình copy nội dung của file Word qua file template của mình rồi sửa chín tả thôi bạn. Bạn xem file mình đang làm nè. Còn nếu bạn có ý tưởng nào soát nhanh hơn thì chỉ cho mình với.

    Thanks.
     

    Các file đính kèm:

  2. Dr. No

    Dr. No Không không thấy

    Vừa tìm trong email của dự án thấy vẫn còn khá nhiều. Tôi sẽ down về, được bao nhiêu thì hay bấy nhiêu.
    Bạn cứ so sánh file ban đầu (chưa soát lỗi) và những file tôi mới đính lên thì rõ. File ban đầu (file nén ấy), nó định dạng theo sách in, có những text box khá khó chịu. Phá định dạng là chuyển về trang word bình thường.
     

    Các file đính kèm:

  3. Dr. No

    Dr. No Không không thấy

    Thêm được ba gói nữa nhé.

    Hết nhé bạn.
     

    Các file đính kèm:

    Chỉnh sửa cuối: 20/7/21
  4. trangpx

    trangpx Mầm non

    Cám ơn bạn nhiều nhé. Mình sẽ check và hoàn thiện tiếp những phần còn thiếu.
     
  5. Dr. No

    Dr. No Không không thấy

    Phá định dạng file sau OCR là như hướng dẫn trong post này:

    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  6. Dr. No

    Dr. No Không không thấy

    Bạn nên dùng gói 1 của tôi post trên kia vì đã làm công thức hóa học và đã chèn hình minh họa.
     
    trangpx thích bài này.
  7. Dr. No

    Dr. No Không không thấy

    Thấy một gói nữa nhé.
     

    Các file đính kèm:

  8. Dr. No

    Dr. No Không không thấy

    Vừa liếc qua file của bạn @trangpx, thì thấy bạn bỏ hết định dạng chữ nghiêng, không làm footnote, công thức hóa học không làm subscript....

    Còn một số gói: 4, 5, 6, 9, 11, 12 để tôi xử lý cho, sẽ giữ lại những chỗ chữ nghiêng.
     
  9. trangpx

    trangpx Mầm non

    Bạn ơi vì mình cần làm file này chuyển ra audio và epub3 cho các bạn khiếm thị nên về phần giao diện mình cũng không có định dạng nhiều, mình có làm footnote mà, file của mình chưa hoàn chỉnh đang làm. Với lại mấy cái sơ đồ hoặc table mình sẽ chuyển dịch sang dạng mô tả khác để các bạn đọc dễ hiểu, và sẽ không giống như sách giấy. Còn phần 4, 5, 6, 9, 11, 12 bạn làm giúp. Mình rất cám ơn.
     
  10. Dr. No

    Dr. No Không không thấy

    Gửi nốt bạn nhé, y như hồi làm dự án. (còn 3 file nữa)
     

    Các file đính kèm:

  11. Dr. No

    Dr. No Không không thấy

    Gửi nốt nhé. Còn gói 24-25 là dạng bảng, cứ dùng luôn file nén trên kia thôi.
     

    Các file đính kèm:

  12. Dr. No

    Dr. No Không không thấy

    OK bạn! Tất cả các file của tôi đều có định dạng hết. epub3 thì ở đây vẫn làm đại trà, định dạng trên epub lại càng dễ.
     
  13. trangpx

    trangpx Mầm non

    Thanks bạn nhiều.:)
     
  14. vinaguy

    vinaguy Lớp 11

    Em mới xem qua một số part file word của bác @Dr. No mới ấp lên. Em có: Một số nhận xét:
    Về định dạng... tương đối tốt nên không phải quá lo lắng về in nghiêng in đứng và chữ la tinh.
    Về chữ Hán thì em chịu... không biết nó đúng hay sai.
    Về hình ảnh: Thực sự xấu mù luôn nhìn không được gì cả.
    Một số đề xuất:
    (Trước tiên là thành thật xin lỗi Giáo sư Đỗ Tất Lợi và Nhà Xuất Bản).
    Về chính tả: Phân ra các gói, nhiều mắt cùng soát thì sẽ không thành vấn đề
    Về Chữ Hán: Trong diễn đàn mình có rất nhiều bác giỏi.
    Về Hình ảnh: Cần phải xử lý mạnh ở chỗ này: Đối với Công thức cấu tạo --> Làm lại; Đối với hình ảnh: Hiện tại có rất nhiều hình CHỤP tiêu bản (cây thật) về các loại cây này. Chúng ta có thể chèn thêm cả hình CHỤP mới vào bên cạnh hình của Giáo Sư (Phương án này sẽ rất đẹp - nhưng file sẽ rất lớn).
    Trên đây là một số ý kiến của em. Có gì không phải các bác đừng banned nick em nhé
     
  15. Dr. No

    Dr. No Không không thấy

    Đồng ý hết, trừ chỗ này, :P "các bác" rảnh lắm hay sao mà động tí là đeo khẩu trang cho Mem? :)
     
  16. Dr. No

    Dr. No Không không thấy

    Thêm một ý kiến về tên file các gói, cần có sự nhất quán để tiện cho việc nối file sau này, phần đầu tên file cần theo một trật tự, abc part1, abc part1... abc part n, hoặc tốt nhất là abc part01, abc part02... abc part##. Nếu tên file đặt được như thế thì khi xong hết các gói, để hết vào một folder rồi mở một file word trắng, vào Insert rồi tìm đến Objects / Texts from files, dẫn đến folder kia, chọn tất cả (Ctrl+A), nhấn Insert là xong.

    Phần cuối tên file có thể ghi abc part 05 (x soat lan 2), như vậy có thể biết ai soát, soát lần thứ mấy.
     
  17. Dr. No

    Dr. No Không không thấy

    Đang làm lại mấy trang pdf bị lẹm, thấy đoạn này:

    Loi.jpg

    Sách in cũng có lỗi chính tả: chuổi, phân từ, câu tạo. Mấy lỗi này thì dễ nhận biết, tôi chỉ thắc mắc chỗ 1-galactoza hay l-galactoza? Mấy lỗi này tôi sẽ sửa thẳng vào pdf.

    (đã sửa)

    upload_2021-7-21_12-2-14.png

    Vừa tra Google thì là l-galactoza

    upload_2021-7-21_11-55-10.png
     
    Chỉnh sửa cuối: 21/7/21
  18. Dr. No

    Dr. No Không không thấy

    Đã sửa xong pdf, link xem ở post #1.

    Các bạn làm text cần xem kỹ các dòng cuối những trang này nhé, vì bản OCR là làm theo bản cũ.

     
    amylee thích bài này.
  19. Dr. No

    Dr. No Không không thấy

    File pdf có trang 481, 482 bị lặp lại: ....480, 481, 482, 481, 482, 483, nhưng không thể xóa được vì xóa thì hỏng mất bookmark vì sẽ lệch 2 trang, mà làm lại bookmark thì quá mệt. Các bạn làm text chú ý đối chiếu pdf để xóa chỗ lặp này nhé.
    Vừa cập nhật tiếp một chỗ rất nhỏ ở trang 864 vì crop nhầm mất một chữ trong tên khoa học:
    1.jpg

    2.jpg
    Tôi cũng kết thúc việc ở topic này ở đây. Chúc các bạn có được epub đẹp! :D
     
  20. vinaguy

    vinaguy Lớp 11

    Như thế này là đẹp lắm rồi bác ạ. Còn chỗ trang lặp thì theo em, Bác xóa hẳn chữ đi (để lại trang trắng) thôi, kẻo lệch bookmark. Còn ai làm word thì đến đó là OCR nó tự nhảy qua thôi bác ạ.
     
    Dr. No thích bài này.
Moderators: Zhiqiang

Chia sẻ trang này