Góp ý Công cụ để Scan sách tiện lợi

Thảo luận trong 'Hỏi đáp - Góp ý' bắt đầu bởi Diaojay, 21/2/16.

  1. teacher.anh

    teacher.anh Rùa lười Thành viên BQT

    Mình đã từng sử dụng qua máy scan cầm tay như hình bạn chụp, nhận định cá nhân như sau:
    Chất lượng nhận dạng chữ khi xuất ra bản word khoảng 60% với sách mới xuất bản gần đây, với các bản sách cũ trước 75, khả năng nhận dạng xuất ra word chỉ đạt 15%.
    Ưu điểm của máy: nhỏ, nhẹ.
    Nhược điểm: để sử dụng scan 1 cuốn sách thì scan xong tay người cầm cũng rã rời, chất lượng scan trung bình kém.
     
    Diaojay, 4DHN and Heoconmtv like this.
  2. Diaojay

    Diaojay Mầm non

    Cảm ơn bạn nhiều lắm nha. Chất lượng chỉ vào trung bình kém thì thất vọng quá. Bộ nó không hỗ trợ tiếng việt sao.
     
  3. 4DHN

    4DHN Tiêu Dao

    Nói chung, bạn cần trải nghiệm thực tế: tự mình dùng thiết bị chuyển cuốn sách giấy thành file word để có những hiểu biết tối thiểu về vấn đề bạn đang quan tâm, chứ chưa biết gì thì những câu hỏi của bạn sẽ rất khó trả lời.

    Nói sơ sơ thì thế này: thiết bị sẽ ghi hình cuốn sách, rồi có một phần mềm (có thể là đã có sẵn trong thiết bị) chuyển hình ảnh đó thành dạng text, ví dụ là file word. Nếu xuất hình ảnh ghi được ra file pdf hoặc file ảnh thì cũng có những phần mềm chuyển file đó sang word. Có nhận dạng được tiếng Việt hay không là ở phần mềm này, cái này do người sử dụng set. Thiết bị scan sách tốc độ cao thì có giá rất đắt từ vài trăm triệu đến vài tỷ, nên chỉ phù hợp với các cơ quan có nhu cầu scan sách với số lượng rất lớn và được nhà nước cấp kinh phí. Ở TVE-4U thì chuyện scan chưa bao giờ là vấn đề cả vì trong 1 dự án ebook khâu scan là khâu khá nhàn, khâu tạo ra file text sạch lỗi mới là khâu tốn công sức, nhân lực.
     
    Redami and Heoconmtv like this.
  4. Heoconmtv

    Heoconmtv Moderator Thành viên BQT

    Nếu chưa thực hiện dự án ebook nào mà phán thì theo em chỉ có chém gió thôi. Để hoàn thành một ebook phải qua nhiều công đoạn, tốn nhiều thời gian công sức của mọi người. Nhiều lúc soát lỗi cũng mờ mắt luôn, chưa kể những cuốn sách xưa phải đánh máy lại chứ không OCR được.

    Như bạn @Văn.Cường đã nói cứ thực hiện được một ebook hoặc tham gia một dự án thì sẽ biết được ưu nhược điểm thôi.
     
    4DHN thích bài này.
  5. 4DHN

    4DHN Tiêu Dao

    Hồi lâu rồi có người lấy cái máy ảnh chuyên nghiệp Canon giá gần 1k USD chụp 1 tờ A4 in đẹp, dùng ABBYY nhận dạng, thấy không sai một lỗi luôn. :D
     
    Heoconmtv thích bài này.
  6. Caruri Tlkd

    Caruri Tlkd Sinh viên năm III

    Đấy là bác lý tưởng tất cả các công đoạn (máy ảnh xịn, chữ in tốt, phần mềm ngon) thì độ chính xác mới lên đến 99,9%, chứ còn bình thường đạt được 80% là mừng húm rồi.

    Đang vật vã đến tập 6 Tiếu ngạo mà chưa có thời gian để hoàn thành. Bạn Diaojay có hứng làm giùm nốt tập 7 và 8 :D
     
    teacher.anh thích bài này.
  7. 4DHN

    4DHN Tiêu Dao

    Thực ra chụp chơi 1 trang thì được chứ lấy máy đó chụp cả ngàn trang thì không được vì không ai chịu cho người khác dùng máy của mình để chụp nhiều thế. Chưa kể máy rất nặng nếu không chế thêm giá đỡ để cố định máy thì cũng không khả thi. Chụp giấy rời thì khá dễ chứ chụp sách là rất khó, ngay cả dùng máy scan xịn như ở các văn phòng mấy giây 1 trang cũng là scan giấy rời, chứ scan sách là phải lật trang bằng tay. Nếu có bộ như thế này thì tốt (nghe nói vài tỷ):







    Trong video này có chụp sách bằng máy chụp ảnh:



    Tôi cũng đang vật vã với bộ Lộc đỉnh ký đây. Còn hơn 1 tập (bộ 5 cuốn) nữa là xong. :D
     
    viettran_ru and teacher.anh like this.
  8. 4DHN

    4DHN Tiêu Dao

    :D Tôi vừa dùng điện thoại Sony Experia C4 và phần mềm CamScanner chụp vào file Lộc đỉnh ký đang đọc dở ở Kinndle (vì không sẵn cuốn sách nào có chất lượng in tốt). Và xuất file pdf ra rồi dùng ABBYY 12 nhận dạng. Kết quả cũng không tệ, xem ở file đính kèm nhé. Tốc độ scan cỡ 5 giây/trang. :p

    Lưu ý: scan ở điều kiện ánh sáng đèn compact, nếu được ánh sáng ban ngày thì tốt hơn.
     

    Các file đính kèm:

    teacher.anh thích bài này.
  9. khiconmtv

    khiconmtv Cử nhân

    [​IMG]

    Bộ này hơi bị hay ho nhỉ
     
  10. lengkeng

    lengkeng Lớp 2

    Mình mới phát hiện ra cái app Text Scanner, gần như ko có lỗi chính tả luôn. Đang làm 1q băng băng mà nhìn lại hoá ra chưa đc 2 năm nên phải gác lại. Chỉ việc chụp dọc chứ cũng ko cần tháo sách để scan. Các bạn dùng thử coi sao. Mình muốn up hình mà ko up đc.
     
    machine thích bài này.
  11. jun276

    jun276 Lớp 4

    Link máy trên: Vui lòng đăng nhập hoặc đăng ký để xem link
    Cái này bác nào biết vẽ làm in 3D hoặc cắt laze thì rẻ.
     
    welcom1985 thích bài này.
  12. NQK

    NQK Lớp 10

    Phần demo toàn làm cho những cuốn bìa cứng, mở ra trang nào cũng bẹp, cũng phẳng, rất dễ chụp, kể cả dùng một tay. Nhưng đời thật toàn các cuốn dán gáy, khâu gáy, lật đẹp chỉ có vài trang đầu và vài trang cuối thôi, mở ra đoạn giữa là cong vút cả. Thế nên các cụ nào đi vào con đường này thì nên lưu ý loại sách mình có.
     
    inno14 thích bài này.
  13. Dr. No

    Dr. No Không không thấy

    Chụp bằng cả cái điện thoại thì hay bị bóng của cái điện thoại in lên trang sách. Khu vực đó chữ hơi đậm hơn. Không biết ở đâu có bán cụm camera rời không nhỉ?

    Để set vị trí để cho camera bắt chặt khuôn hình thì có n cách, không đến nỗi phải in 3D hay máy cắt laser đâu hay tệ hơn nữa bỏ ra hơn 5 củ để mua.
     
  14. thanhvbnd

    thanhvbnd Mầm non

    Hôm kia làm hết cuốn 500 trang sách marketing dùng camscaner, đúng cuốn gấy giầy mà thân thì bé giữ mỏi hết cả tay! Trang nào mà có hình ảnh là bung bét luôn...mà cái bảo cũng đòi phí ko ah,.phí khá tốn. Cái món này phải làm chuyên nghiệp là đúng rồi! Có dịch vụ scan sách xong bán ko các bác
     
  15. quangdct

    quangdct Mầm non

    Dùng Scanner pro hay Halo pdf thì dễ ợt chứ có gì.
    Đây là Iphone nhé
     
  16. Dr. No

    Dr. No Không không thấy

    Sách gáy cứng, dày cộp, bìa mềm thì con iphone thần thánh không làm phẳng trang sách được, những trang ở giữa cuốn ấy.
     
  17. jun276

    jun276 Lớp 4

    Em đang dùng Scanner pro đây, nó có kéo phẳng giấy, nhưng gặp mấy qu đóng gáy sát chữ, gáy cứng dày phần chữ gần gáy vẫn bị cong nhé. OCR ra được, lỗi nhiều hơn chút. Scan dịch vụ thì tiền scan cao hơn tiền sách.
     
  18. machine

    machine Lớp 11

    Với sự xuất hiện của vFlat, tấm mica không còn quan trọng nữa. Mình xoá đi cho đỡ loãng topic.
     
    Chỉnh sửa cuối: 7/1/21
    nhaque and amylee like this.
  19. Dr. No

    Dr. No Không không thấy

    Như thế này có được không? :)

    [​IMG]

    [​IMG]
     
    machine and amylee like this.
  20. Nga Hoang

    Nga Hoang Lớp 11

    upload_2020-11-19_11-28-36.png
    upload_2020-11-19_11-29-19.png
    upload_2020-11-19_11-30-28.png

    Dụng cụ chỉ có một miếng mica và một Phone Holder, tổng cộng chưa tới 100.000 đồng.
    Phone Samsung Galaxy Note 9
    Chụp trong phòng với ánh sáng tự nhiên ban ngày không cần đèn. Thời gian chụp 280 trang: dưới nửa tiếng.
    Cho chạy Scan Tailor: nửa tiếng
    Kết quả như sau : Nàng thứ ba - Henryk Sienkiewicz (File PDF hình).

    Một chút kỹ thuật:
    Chụp tất cả trang lẻ từ trang bìa đến trang 279, bỏ vào folder lẻ
    Lật ngược sách chụp tất cả trang chẵn từ bìa cuối đến trang 2 bỏ vào folder chẵn.
    (tổng số trang lẻ sẽ luôn luôn bằng tổng số trang chẵn)
    Dùng Total commander đổi tên file folder lẻ : 1, 3, 5 ...
    Cũng làm vậy với folder chẵn và đảo chiều thứ tự trước khi đổi tên 2, 4, 6... và nhớ rotate tất cả hình trước khi ghép chung folder lẻ và chẵn làm một để chạy Scan Tailor.
     

    Các file đính kèm:

    Chỉnh sửa cuối: 20/11/20

Chia sẻ trang này