Góp ý Công cụ để Scan sách tiện lợi

Thảo luận trong 'Hỏi đáp - Góp ý' bắt đầu bởi Diaojay, 21/2/16.

  1. Diaojay

    Diaojay Mầm non

    Theo mình được biết thì hiện nay để làm ebook một là các bạn dùng phần mềm nhận dạng chữ trên file pdf rồi chỉnh sửa, hai là đánh máy lại từ đầu. Cách này tuy đơn giản, tiết kiệm nhưng cần số lượng người lớn để làm việc cũng như điều hành. Tuy nhiên mình thắc mắc là tại sao Tve ko đầu tư vào 1 số công cụ Scan tài liệu nhỉ? Chỉ cần quét là tài liệu tự động chạy vào word, như thế chả tiện lắm ru, và diễn đàn cũng chỉ cần 2,3 người là có thể hoàn thành khối lượng công việc khổng lồ. Những cuốn sách cả ngàn trang giấy không còn là vấn đề nữa.

    [​IMG]

    [​IMG]
     
  2. khiconmtv

    khiconmtv Cử nhân

    Mấy cái trên chỉ là scan trang tài liệu thôi. Muốn scan sách, nhất là sách dày thì phải là cái này:
    [​IMG]

    [​IMG]
     
  3. 4DHN

    4DHN Tiêu Dao

    Bạn đã làm thử chưa, tốc độ và chất lượng file text thế nào với các loại sách có chất lượng in tốt xấu khác nhau?

    Tôi còn chưa nói đến giá thành nữa. Bạn nên nhớ đây là diễn đàn chia sẻ sách miễn phí làm không công. Nên sẽ phù hợp hơn nếu sử dụng các công cụ cá nhân có sẵn mà không phải đầu tư thêm thiết bị chuyên dụng.
     
    Chỉnh sửa cuối: 21/2/16
  4. Diaojay

    Diaojay Mầm non

    Giá thành của những thiết bị scan này loanh quanh 40-200 usd. Mình có thể quyên góp, kêu gọi ủng hộ từ các thành viên, được chăng? Nếu thật sự những sản phẩm này cho kết quả 4s/ 1 bản in màu, 2s/ bản in đen trắng, chất lượng ảnh 900 dpi như quảng cáo thì quá tuyệt vời rồi. Thủ công thì đơn giản, miễn phí nhưng chỉ e kết quả của mấy trăm người lại không bằng 1 tiếng đồng hồ áp dụng thiết bị chuyên dụng.

    Mình chưa sử dụng các loại máy scan này, nhưng từng chứng kiến một bạn giới thiệu sản phẩm chuột tương tự như vậy rồi, là hàng nhái Trung Quốc nhưng quét trên tờ báo nhân dân ngon lành lắm. Đây chỉ là chút thắc mắc của mình, vì diễn đàn hoạt động kể cũng coi là chuyên nghiệp mà ko nghĩ đến chuyện công nghiệp hóa thì mình cảm thấy hơi ngạc nhiên.

    Đây là bảng giá. Link tham khảo thông số. Vui lòng đăng nhập hoặc đăng ký để xem link
    [​IMG]
     
    Minhnh, lamtam, Ngaymua and 2 others like this.
  5. lotus

    lotus Lớp 4

    Mình có con chuột quét mà khi scan thấy còn lâu và khó hơn để vô máy scan nữa... :D
     
  6. Diaojay

    Diaojay Mầm non

    Máy này ở VN có đại lý Vui lòng đăng nhập hoặc đăng ký để xem link Mình gửi mail khảo giá mà ko thấy hồi âm.
    [​IMG]
     
  7. hanhdb

    hanhdb Sinh viên năm II

    Ý tưởng độc đáo, hành động táo bạo. À việc này các thành viên khác đã làm từ .... vài năm trước rồi. :fish:
     
  8. Diaojay

    Diaojay Mầm non

    Cái này có gì mới đâu. Mình cũng đoán là mọi người đã từng nghĩ đến việc sử dụng thiết bị scan rồi, nhưng chawcs do khó khăn về kinh phí hoặc một lý do gì khác mà chưa làm được.
     
  9. 4DHN

    4DHN Tiêu Dao

    Trong 1 dự án ebook nếu dùng cách chuyển hình ảnh thành file word thì công việc vất vả nhất là soát lỗi và sửa lỗi. Số lượng lỗi phụ thuộc vào chất lượng in, do đó việc sử dụng nhiều người là không thể tránh khỏi. Nói chung thì bạn chủ topic nên trải nghiệm thực tế hoặc có những khảo sát ở những đối tượng khác nhau rồi hẵng viết bài. Viết như bạn thì sẽ làm người ta hiểu lầm, ví dụ 1 cuốn sách 500 trang 3 ngày số hóa xong ngon lành hoặc 5 phút được 20 trang không lỗi chính tả. cute_smiley18cute_smiley26
     
    Heoconmtv and Ngaymua like this.
  10. hanhdb

    hanhdb Sinh viên năm II

    Hầu hết ebook đều phải scan sang pdf dạng ảnh, rồi mới nhận dạng ocr thành text được. Nhưng đâu dễ ăn thế. Cái máy 2 tỏi ở thư viện quốc gia cũng chả sản xuất ebook mỳ ăn liền được. Bookeye giá khoảng 200- 500 củ về cơ chế gồm 2 cái máy ảnh dslr và bộ cơ lật trang thôi, không có gì đặc biệt.
    Với một máy ảnh hoặc điện thoại camera tốt bạn cũng scan sách được dĩ nhiên thủ công mất thời gian hơn.
     
    Heoconmtv thích bài này.
  11. Văn.Cường

    Văn.Cường Banned

    Quyên góp thì không thành vấn đề là, mua về rồi thì ai nhận trách nhiệm scan, scan xong rồi thì ai làm.
     
    Heoconmtv thích bài này.
  12. khiconmtv

    khiconmtv Cử nhân

    Con chuột quét thì mình thấy lâu lắm rồi, từ hồi 286 cổ lổ sĩ lận.
     
  13. Văn.Cường

    Văn.Cường Banned

    Chắc bạn @Diaoday cho là scan xong rồi thì đóng gói luôn thì phải, bỏ qua phần OCR và soát lỗi.
     
  14. sannyas60

    sannyas60 Lớp 8

    Khổ quá>? Sao không có ông hacker nào đột nhập vào mấy tính của các nhà xuất bản, hack sách về cho diễn đàn nhỉ???
    cute_smiley20
     
  15. 4DHN

    4DHN Tiêu Dao

    Cuốn Almanach mà @hanhdb xin được từ NXB đâu rồi? Hỏi lần này là lần thứ 50 hay 100 không nhớ nữa. :D
     
  16. Diaojay

    Diaojay Mầm non

    Uh. Mình chưa tham gia số hóa nên không biết các quy trình sửa lỗi ra sao, nên đây chỉ là bài thắc mắc, góp ý để nghe phản hồi chứ ko phải đòi hỏi, yêu cầu diễn đàn phải làm cái này, cái kia. Và mình thấy bộ công cụ của thằng IRISscan scan luôn hình và chữ lên word,excel, đâu phải mỗi PDF ??? Như thế việc soát lỗi đâu phức tạp? Thậm chí chẳng cần soát lỗi chứ nhỉ?

    // CHuột Trung Quốc vẫn scan được lên word, máy mấy tỏi nhẽ nào hichcic
     
    Chỉnh sửa cuối: 21/2/16
    Heoconmtv and Văn.Cường like this.
  17. 4DHN

    4DHN Tiêu Dao

    Thì mọi người cũng phản hồi bạn từ kinh nghiệm thực tế thông qua các dự án số hóa mà dùng biện pháp scan rồi chuyển file hình ảnh thành file word đó thôi. Bạn nói diễn đàn là "chuyên nghiệp" tôi nghĩ chữ đó không hợp vì mọi người cũng chỉ tranh thủ thời gian rảnh rỗi để tham gia thôi chứ không phải là dành toàn bộ thời gian của mình. Bạn nói "Như thế việc soát lỗi đâu phức tạp? Thậm chí chẳng cần soát lỗi chứ nhỉ?" nhưng thực tế không phải vậy. Bạn nói bạn "chưa hiểu các quy trình sửa lỗi" nhưng tôi nghĩ bạn "chưa từng chuyển bất kỳ trang sách nào từ hình ảnh sang file word" mới đúng. Nếu bạn đã làm thì sẽ thấy rất nhiều vấn đề chứ không đơn giản như bạn nghĩ đâu. Sách mới chất lượng in tốt thì chắc vẫn còn vài % lỗi (chính tả), sách chất lượng in xấu thì có thể là vài chục % hoặc hoàn toàn không ra chữ gì có nghĩa. Cho nên tùy theo chất lượng sách in mà dự án sẽ dùng biện pháp sửa lỗi (file word xuất ra từ file scan) hoặc đánh máy 100%. :D

    Để minh họa tôi xin đưa một vài ví dụ rồi bạn so sánh giữa file scan và file word được xuất ra nhé:

    Scan bằng máy scan, in bằng sắp con chữ chì:
    0011.jpg

    Thêm một trang sách khác có chất lượng in (bằng sắp chữ chì) tốt hơn scan bằng máy scan:

    0131.jpg

    Lại thêm một trang sách có chất lượng in (bằng máy tính) tốt chụp ảnh bằng máy ảnh KTS nữa:
    IMG_1759 [1600x1200].JPG

     
    Văn.Cường thích bài này.
  18. Diaojay

    Diaojay Mầm non

    Ồ cảm ơn. Mình cũng nghĩ nó chỉ có ích cho những sách mới in thôi, và quét trực tiếp trên giấy chứ ko phải quét qua file PDF nên sách cổ chắc sẽ khó nhận diện chuẩn. Dù sao thì áp dụng máy scan cũng khó khăn vì sẽ phải mua sách hoặc mượn sách của thư viên để scan, đầu sách sẽ phải hạn chế. Mình viết bài này để xin ý kiến mọi người, nếu mọi người cũng có ý như thế thì mình xin đóng góp chút đỉnh, còn ko thì mình với đứa bạn cũng đang định mua thiết bị scan này để 2 đứa làm ebook đọc cho tiết kiệm. Sorry nếu làm mất thời gian của các mod. Chúc mọi người trên diễn đàn được vui.
     
    Văn.Cường thích bài này.
  19. 4DHN

    4DHN Tiêu Dao

    Ví dụ thứ 3 tôi đưa phía trên là sách mới in đó và nó có chất lượng file word xuất ra là tốt nhất, dùng máy scan chắc cũng tương tự thế thôi.

    À, việc này có gì mà mất thời gian, chúng ta trao đổi kinh nghiệm thôi mà. Bạn cứ mua máy scan hoặc thiết bị nào bạn cho là tốt nhất đi, làm xong 1 cuốn rồi quay lại topic này bàn luận tiếp.

    Chúc bạn thành công nhé!
     
    Chỉnh sửa cuối: 21/2/16
  20. Văn.Cường

    Văn.Cường Banned

    Anh Tư trình bày rõ ràng thiệt!
    @Diaojay: Bạn thử làm là biết khó hay dễ thôi mà. Chúc bạn cho ra những ebook hay nhé!
     
    Nguyễn Phú Hải and 4DHN like this.

Chia sẻ trang này