Đánh máy Soát lỗi chính tả Bà Bovary - Gustave Flaubert

Thảo luận trong 'Dự án eBook cho Thư viện' bắt đầu bởi Văn.Cường, 7/3/16.

  1. Văn.Cường

    Văn.Cường Banned

    Bà Bovary - Gustave Flaubert
    0001.jpg
    Tác phẩm: Bà Bovary
    Tác giả: Gustave Flaubert
    NXB Văn học 2012
    Định dạng: pdf ảnh (chụp từ máy ảnh)

    Về tác giả:
    Gustave Flaubert (12.12.1821 - 8.5.1880) là một tiểu thuyết gia người Pháp, được coi là một trong những tiểu thuyết gia lớn của phương Tây.
    Gustave Flaubert được nhiều người biết tới vì các cuốn tiểu thuyết của ông được viết theo trường phái hiện thực (realism), mang đặc tính là sự chú ý từng chi tiết, cách quan sát chính xác, sự quan tâm rất nhiều vào ngôn ngữ và hình thức của cách hành văn. Cuốn tiểu thuyết nổi danh nhất của Gustave Flaubert là cuốn "Bà Bovary" (1857) được coi là một trong các tác phẩm quan trọng nhất của nền văn chương Pháp.
     
    Ngaymua thích bài này.
  2. Văn.Cường

    Văn.Cường Banned

    Trước khi tiến hành vui lòng đọc kỹ các mục sau:

    1. Vui lòng đăng nhập hoặc đăng ký để xem link.
    2. Vui lòng đăng nhập hoặc đăng ký để xem link.
    3. Vui lòng đăng nhập hoặc đăng ký để xem link.
    4. Để vào nơi làm bạn nhấn vào chữ Page ở góc trên bên trái:
    [​IMG]
    5. Để đăng ký, bạn chọn 1 gói và nhấn nút sửa trên tiêu đề, thêm tên bạn vào và lưu lại.
    [​IMG]
    6. Trong trường hợp bạn muốn đánh máy offline thì nhấn vào chữ Link pdf ở trong gói là có thể download được file pdf về máy.
    wiki sua6.jpg
    7. Trong quá trình làm nếu cần thảo luận, thì từ dự án ở wiki bạn nhấn nút Discussion là sẽ trở lại topic này.
    [​IMG]

    Yêu cầu: Đối chiếu bản gốc, đánh máy theo đúng nguyên bản.

    Xin cảm ơn các bạn! :rose::rose::rose::rose::rose:
     
  3. Caruri Tlkd

    Caruri Tlkd Lớp 10

    Các bạn thử xem công sức đánh máy với OCR rồi sửa chính tả cái nào nhàn hơn? Tôi thử nhận dạng vài trang đầu thì thấy được khoảng 50 60% đấy.
     
    Văn.Cường thích bài này.
  4. Văn.Cường

    Văn.Cường Banned

    50-60% thì thấp quá bạn ạ! Khi soát lỗi thì chậm hơn đánh máy!
     
    Ngaymua thích bài này.
  5. Ngaymua

    Ngaymua Lớp 3

    Mình tham gia. Đánh máy hay soát lỗi đều được. Gửi file cho mình nhé
     
    Văn.Cường thích bài này.
  6. Văn.Cường

    Văn.Cường Banned

    Cảm ơn bạn đã tham gia, bạn nhấp vào dòng chữ được tô màu xanh: (View this Page on the Wiki) ở phía trên để chọn gói cần đánh máy nhé!
     
  7. 4DHN

    4DHN --------- Thành viên BQT

    Có một số chỗ trang sách bị cong nên không nhận dạng được, nếu dùng cách nhận dạng thì phải đánh máy lại những chỗ đó. Có thể cách nhận dạng vẫn nhàn hơn.
     
    Văn.Cường thích bài này.
  8. Văn.Cường

    Văn.Cường Banned

    Đánh máy thôi anh Tư! Em thấy rất nhiều người quan tâm đến cuốn này! Nếu OCR được 80% thì cuốn này được khởi động lâu rồi, chứ chẳng đến phiên anh em mình đâu.
     
  9. Văn.Cường

    Văn.Cường Banned

    Mình đã đánh dấu các gói bạn đã nhận rồi nhé.
     
    Ngaymua thích bài này.
  10. Caruri Tlkd

    Caruri Tlkd Lớp 10

    Không hiểu các bạn phân gói kiểu gì, tôi tưởng mỗi chương là một gói chứ sao lại khoảng độ chục trang vậy. Thường đánh máy phải trọn vẹn một chương thì mới có cảm hứng chứ.
     
    Ngaymua and 4DHN like this.
  11. Văn.Cường

    Văn.Cường Banned

    Thế thôi bạn ơi! Nhiều trang quá nhìn là muốn bỏ chạy rồi! Nếu bạn tham gia mình sẽ gửi trọn chương cho bạn.
     
    4DHN thích bài này.
  12. Caruri Tlkd

    Caruri Tlkd Lớp 10

    Đánh mà không đầu không đuôi thì oải chè đậu. Thà là bạn cắt một chương dài ra làm hai thì hợp lý hơn là cứ cắt cơ học 10 trang một. Tôi đang thử OCR chương cuối cùng.

    Chú ý có một số cái tên riêng: lão lái buôn L’heureux (người hạnh phúc Mourinho :D), cô Lebœuf (hoặc Leboeuf nếu không gõ được ký tự œ)
     
    4DHN thích bài này.
  13. 4DHN

    4DHN --------- Thành viên BQT

    Tôi chia gói và lập dự án đó. Vì là dùng phần mềm cắt file pdf nên chỉ cắt đều mỗi gói một số trang bằng nhau thôi. Nếu chia thành từng chương thì sẽ tốn công hơn rất nhiều và từng chương một cũng là không đầu không đuôi tuy ở mức độ tốt hơn một chút.
     
    Caruri Tlkd thích bài này.
  14. Văn.Cường

    Văn.Cường Banned

    Cái này thì có khác gì khi bạn gõ chương 1 rồi lại nhảy sang chương 5 gõ tiếp đâu. mục đích cắt nhỏ ra là để tạo tâm lý cho người đánh máy, chứ làm một gói 1 chương hay hai gói 1 chương thì có gì khó khăn đâu bạn, rẹc rẹc là xong ấy mà.
     
  15. Caruri Tlkd

    Caruri Tlkd Lớp 10

    Tôi rất ủng hộ việc số hóa các cuốn tiểu thuyết kinh điển. Do vậy để ủng hộ dự án tôi đã chuyển text xong chương cuối cùng (tương ứng phần lớn gói 46 và cả gói 47) và để ở wiki. Vì tôi đang bận làm cuốn Tiếu ngạo giang hồ chưa xong và một cuốn khác đang làm dở nữa nên không tham gia được. Khi nào dự án xong thì có thể tôi sẽ giúp một tay sửa chính tả.
     
    teacher.anh and 4DHN like this.
  16. Ngaymua

    Ngaymua Lớp 3

    Mình cũng tưởng thế
     
    Văn.Cường thích bài này.
  17. Văn.Cường

    Văn.Cường Banned

    He he! Chia như thế là hợp lý đấy bạn. Nếu cuốn này là dự án riêng của một nhóm thì sẽ chia gói theo chương, thậm chí 3, 4 chương cho 1 gói và giao cho người tham gia hoàn thành.
    Nhưng đây là dự án cộng đồng để ai quan tâm đến cuốn này có thể tham gia. Những ai muốn giúp mà thấy nhiều trang quá là nản ngay. Giống như soát lỗi ấy mà, thường thì mọi người sẽ chọn cuốn nào ít lỗi nhất để làm, chứ lỗi tùm lum thì sẽ bỏ qua ngay.
     
  18. 4DHN

    4DHN --------- Thành viên BQT

    Tôi ví dụ về cách chia theo chương từ pdf có sẵn nhé:
    1. Dùng phần mềm cắt file pdf thành ảnh rời, mỗi trang thành 1 ảnh, resize ảnh một cách thích hợp.
    2. Nhặt ảnh từng chương vào từng folder tương ứng.
    3. Dùng phần mềm tạo lại file pdf trong từng folder. Rồi đưa vào dự án.

    Thường thì những cuốn sách do chính tôi scan (hoặc chụp ảnh) thì tôi làm thành từng chương ngay khi scan, nếu là chụp ảnh thì làm như từ bước 2. Đợt này tôi cũng hơi bận nên buộc phải làm theo cách nào đơn giản nhất, cụ thể ở cuốn này thì cắt đều mỗi gói 10 trang để người làm dự án đỡ ngại.
     
    Caruri Tlkd thích bài này.
  19. Ngaymua

    Ngaymua Lớp 3

    Mình đã đánh máy xong gói 8. Nhưng mình thấy Cuốn này dịch có vẻ không ok lắm. Nếu kiếm được bản nào dịch tốt hơn thì làm ebook sẽ có hứng hơn.
     
    Văn.Cường thích bài này.
  20. Văn.Cường

    Văn.Cường Banned

    Bạn nói chính xác! Ngay lời giới thiệu đã thấy dở rồi. Mình đang phân vân là có nên tiếp tục nữa không đây.
     

Chia sẻ trang này