Đánh máy Mời soát lỗi chính tả Thể Xác và Tâm Hồn (tập 2) - Maxence Van Der Meersch

Thảo luận trong 'Dự án eBook cho Thư viện' bắt đầu bởi Trúc Quỳnh Đặng, 21/3/19.

Trạng thái chủ đề:
Không mở trả lời sau này.
Moderators: rhea, thuannguyen1088
  1. Trúc Quỳnh Đặng

    Trúc Quỳnh Đặng Moderator Thành viên BQT

    BIA-THE-XAC-VA-TAM-HON-tap 2.png
    Thể Xác Và Tâm Hồn (Tập 2)

    Tác giả: MAXENCE VAN DER MEERSCH
    Nhà xuất bản: NXB Lao Động T.P Hồ Chí Minh 1989
    (Tái bản 1993)
    Người dịch: Phan Minh Hồng và Mai Thái Lộc
    (dịch từ bản Pháp văn « CORPS ET ÂMES »
    của Maxence Van Der Meersch
    Nhà xuất bản Madrigal - 1948)

    Tiểu thuyết đoạt giải Hàn Lâm Viện Pháp năm 1943
    Tác phẩm này nhiều ý nghĩa và đầy tính chất nhân văn
    —★—
    TẬP 1: @annie_tuongminh đang solo (ĐÃ DROP)
    Tham khảo link tải pdf scan tập 01 tại đây:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    TẬP 2
    SCAN & OCR: @thanhbinhtran
    LINK PDF SCAN: Vui lòng đăng nhập hoặc đăng ký để xem link
    (check lại thì thấy là link tải file tập 2 này của bạn chủ nguồn sách đã bị xóa nên tôi update lại link tôi mới reup nhé)
    Vui lòng đăng nhập hoặc đăng ký để xem link
    SOÁT LỖI:
    Phần 1: @bungbu
    Phần 2: @tulipviet
    --- CHỐT NHÉ (ĐÃ DROP) ---​
     
    Chỉnh sửa cuối: 25/10/20
  2. bungbu

    bungbu Mầm non

    Bạn cho mình đăng ký đánh máy nhé.
     
  3. Trúc Quỳnh Đặng

    Trúc Quỳnh Đặng Moderator Thành viên BQT

    Cám ơn bạn ni nhiều nhé!

    Thế này, mình sẽ gửi cho bạn một file text và link pdf scan nhé, xong nếu bạn cảm thấy phần text đó ổn và có thể soát - chỉnh sửa trực tiếp được thì bạn soát sửa trên đó luôn nà, còn hông thì bạn cứ đánh máy lại từ pdf cũng được, hoặc kết hợp cả 2 :D Nhé! ^^ Của bạn gói 1 từ trang 7 đến 42 của pdf nhé! Rồi, tạm thời là vậy, hén! Cứ thong thả mần nha! Có gì thắc mắc cứ réo mình tiếng há, mình sẽ ới lại trả lời nà! ^^ Have a nice day!~~
     
    Natsumi, lonelystar, Alissa and 4 others like this.
  4. annie_tuongminh

    annie_tuongminh Lớp 4

    tulipviet thích bài này.
  5. tulipviet

    tulipviet Sinh viên năm II

    Gửi mình 1 gói nhé 3D_42
     
    Trúc Quỳnh Đặng thích bài này.
  6. Trúc Quỳnh Đặng

    Trúc Quỳnh Đặng Moderator Thành viên BQT

    Haha, vậy hốt xác phần cuối nhé, cách thức giống như trên mình đã trình bày, cả gõ (quoánh máy) và soát lỗi ocr trên cùng một file, bạn thích kiểu nào mần kiểu ấy, hoặc kết hợp cả 2 hén :D Từ từ thong thả mần nà, phần 1 - phần lớn text phần đầu đã có bạn siêu nhưn bụng bự hốt xác goài, phần đọc và SLCT lại so với file pdf để đó mình chịu trách nhiệm nhận lãnh nà, hehe! Gửi vô inbox nhén! ^^ Thanks before! ^^
     
  7. tulipviet

    tulipviet Sinh viên năm II

    Mình gửi gói 2 phần 2 như file đính kèm nhé.
     

    Các file đính kèm:

  8. tulipviet

    tulipviet Sinh viên năm II

    Mình không rõ các bạn đang soát lỗi theo nguyên tắc/quy trình như thế nào, nhưng hiện nay mình đang làm như sau:
    - Nhận file text và clear all formating
    - Lướt qua xem những lỗi sai chính tả phổ biến rồi replace all (ví dụ như ờ, ớ, ổng), một số chữ có trong nhiều cụm từ có nghĩa khác nhau, thì find next rồi replace dần.

    Nói chung sau khi làm xong 2 bước trên thì số lượng lỗi đã giảm khá nhiều. Còn lại thì đọc và nhặt thôi. Những lúc như thế này mới thấy nếu áp dụng được AI thì tốt quá, những cụm từ phổ biến sẽ được tự động sửa.
     
    Trúc Quỳnh Đặng thích bài này.
  9. Trúc Quỳnh Đặng

    Trúc Quỳnh Đặng Moderator Thành viên BQT

    Trước khi clear format nên giữ lại định dạng nghiêng trước đã, bằng cách sợt và thay bằng lệnh trên Word.
    Sau đó cóp mớ text đó dán vô Sigil và chạy lệnh regex :
    Find: <(.*?)>
    Replace: <i>\1</i>
    Rồi lại cóp cái mớ text đó dán vô word trở lại, sạch sẽ format mà lại giữ lại được định dạng nghiêng, tất nhiên, mấy chỗ bỏ dấu <^&> sẽ còn lệch đôi chút nên có thể sẽ phải fix một chút trong code html :D
    Nói chung là vậy, mà nói chung là sau khi ocr ra nên xử lý đồng loạt một lượt cả đống text full cả cuốn đó, thì cũng đã sửa được kha khá lỗi rồi. Vấn đề là siêng và có thời gian để xử lý qua hay không thôi, đôi khi do lười và không có tâm nên thây kệ để nguyên vậy giao luôn :D Mà nói chung cũng hên xui, có cuốn ra text đẹp như mơ, mướt mờ; có cuốn ra text rất nham nhở :D
     
    Chỉnh sửa cuối: 1/5/19
  10. tulipviet

    tulipviet Sinh viên năm II

    Mình chưa dùng Sigil bao giờ, chắc lúc nào search rồi tìm hiểu thêm.
     
  11. thanhbinhtran

    thanhbinhtran Lớp 3

    @Trúc Quỳnh Đặng Một số bạn hỏi tôi về file scan cuốn này. Bây giờ tôi public file pdf có ảnh hưởng đến dự án của các bạn không ạ? Thân mến!
     
  12. Trúc Quỳnh Đặng

    Trúc Quỳnh Đặng Moderator Thành viên BQT

    @thanhbinhtran Hỏi ý kiến em Minh @annie_tuongminh , mà theo ý mình khi một cuốn nào đó chưa hoàn thành sản phẩm dự án thì không nên public pdf full, ý kiến cá nhân! Còn lại quan trọng là ở bạn chủ nguồn sách và chủ dự án. Mình chỉ là cái trạm trung chuyển thông tin thôi, hehe!
     
  13. thanhbinhtran

    thanhbinhtran Lớp 3

    Tôi là chủ nguồn sách, tôi thấy bạn annie_tuongminh muốn lập dự án cuốn này nên gửi file cho bạn ấy. Cảm ơn bạn đã mở dự án, nhưng tôi có thể góp ý với bạn một chút không? Bạn có thể thêm ảnh bìa cùng thông tin về tác giả, tác phẩm để những người quan tâm có thể biết thêm về cuốn này (Những thông tin này có sẵn trong file.) Các bạn ấy do không tìm thấy thông tin lại phải inbox hỏi tôi.
     
  14. annie_tuongminh

    annie_tuongminh Lớp 4

    Dạ. File pdf chị có quyền public mà. Có file cho các bạn đọc cũng tốt ạ. Còn Ebook là 1 định dạng khác cho độc giả lựa chọn ạ :)
     
  15. thanhbinhtran

    thanhbinhtran Lớp 3

    Cảm ơn @annie_tuongminh, tôi sẽ tôn trọng ý kiến của bạn Trúc Quỳnh Đặng và chưa public file pdf cuốn này. Lúc nào ebook hoàn thành, nhờ bạn dẫn thêm link download file scan nhé. Rất trân trọng tâm huyết của bạn trong dự án này. Thân mến!
     
  16. Trúc Quỳnh Đặng

    Trúc Quỳnh Đặng Moderator Thành viên BQT

    Thể theo Yêu Cầu của bạn @thanhbinhtran - chủ nguồn sách, và em @annie_tuongminh cũng không phản đối, trên post #1 của topic này tôi đã cho public link down pdf scan của tập 2 rồi đấy ạ!

    Rất xin lỗi vì sự chậm trễ của tình hình tiến độ dự án làm ảnh hưởng đến mọi người, đặc biệt đến với nhất là những ai quan tâm và yêu mến, đang trông đợi ebook hoàn thành của cuốn sách này!

    Khi nào nhận đủ text của các gói/các phần lẻ được giao, tôi sẽ nhờ em annie chuyển tiếp phần text full sang cho bạn và nhờ đóng ebook dùm ạ! Rất xin lỗi và cám ơn rất nhiều! Trân trọng!
     
    Chỉnh sửa cuối: 1/5/19
  17. tudonald78

    tudonald78 Lớp 11

    Bạn nào có tập 1 cho mình xin với?
    Không tìm thấy trên diễn đàn!
     
Moderators: rhea, thuannguyen1088
Trạng thái chủ đề:
Không mở trả lời sau này.

Chia sẻ trang này