Hướng dẫn Cách lấy dữ liệu text bằng cách chụp ảnh màn hình

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi averelle, 5/6/16.

  1. averelle

    averelle Lớp 2

    Mình có một câu hỏi:
    Liệu ebook có đặt mật khẩu, không copy được nhưng có thể chụp ảnh màn hình, sau đó dùng OCR (vd ABBYY gì đó) để ra văn bản được không nhỉ?
    Còn một khi đã đăng lên web thì chắc có cách để copy được.
     
    4DHN and tran ngoc anh like this.
  2. teacher.anh

    teacher.anh Rùa lười Thành viên BQT

    Đương nhiên vẫn có thể làm thế, nhưng sao phải khổ sở đi chụp lại khi có sách gốc để làm? Scan/chụp từ sách luôn rõ hơn, đồng thời bản scan từ sách chụp cũng là căn cứ để đối chiếu và tra cứu khi cần.
     
    4DHN and Heoconmtv like this.
  3. 4DHN

    4DHN Tiêu Dao

    Cách này tất nhiên là được, tôi cũng đã từng làm từ lâu rồi nhưng rất ít dùng, công chụp thế ngang với công chụp sách in chất lượng OCR thì tương đương. Thêm chút kinh nghiệm cho bạn nào cần này: chọn chế độ hiển thị cỡ chữ, font chữ (arial là lựa chọn tốt), hiển thị 1 cột... sao cho chất lượng OCR là tốt nhất, nhỏ quá và to quá đều không tốt (test trước vài cái trước khi làm đại trà). Đặt sẵn Paint thường trực trên start bar. Tên file ảnh đặt theo chương và có đuôi 001.jpeg (png)... Và nên làm gọn từng chương ở mỗi loạt để lần sau dễ dàng tiếp tục khi tạm dừng việc. Chụp xong hết thì dùng photoshop crop cả loạt những chỗ thừa ở lề để loại bớt lỗi khi OCR.

    Đã đăng lên web thì lấy dễ hơn, có thể copy hay dùng cách như trên. Chống copy kiểu vnthuquan còn có thể dùng cách khác nữa. :D
     
    Heoconmtv, Cải and averelle like this.
  4. averelle

    averelle Lớp 2

    Có cách chụp màn hình cả loạt nhanh hơn: setting ban đầu 1', mỗi lần chụp 1 nhấn phím, nên công chụp đỡ hơn scan sách rất nhiều: dùng ứng dụng Greenshot: Vui lòng đăng nhập hoặc đăng ký để xem link (miễn phí).
    Đây là context menu (chuột phải vào icon chương trình khi đã chạy-thường trú ở khu icon chỗ đồng hồ trên taskbar):
    002078.jpg
    Các bước:
    1. Chạy Greenbox
    2. Vào preferences:
      • Tab General Chọn phím tắt: như hình của mình Capture region là Ctrl+prnt scrn (Chọn vùng màn hình để chụp tấm đầu tiên là tổ hợp Control+Print screen), Capture last region là Prnt scrn (sau khi đã chọn vùng rồi thì lần sau cứ nhấn Print screen nó chụp cho 1 phát cho thẳng vào thư mục đã chọn luôn). Để chuột vào ô hotkey muốn đặt, nhấn phím/tổ hợp phím cần thiết, nó sẽ hiện thành chữ trong ô đó (vd Ctrl+Prnt scrn)
      • Tab Capture: Chọn Play camera sound để mỗi lần nhấn chụp nó kêu choạch một cái cho mình biết là ảnh đã vào thư mục, rất có ích khi mình không xem lại ảnh ngay vì để nguyên màn hình, chỉ chuyển trang và chụp tiếp. Show magnifier: khi chụp lần đầu nó phóng đại chỗ con trỏ để mình căn tọa độ lấy vùng chụp được chính xác.
      • Tab Output: Chọn kiểu ảnh (jpg, png,...), và nơi lưu (thư mục sẽ chứa ảnh chụp quyển sách). Chọn chất lượng ảnh mong muốn (vd 100%)
      • Tab Destination: Chọn Save directly (using preferred file output settings): lưu ảnh trực tiếp vào thư mục đã chọn. Không chọn thêm option nào khác
    3. Mở ebook và thiết lập như bác Tư đã khuyên, để cửa sổ hiện càng lớn càng tốt (được nhiều chữ)
    4. Control+Print screen để chọn vùng chụp đầu tiên. Dùng chuột chọn điểm đầu tiên và điểm cuối cùng của vùng màn hình cần chụp (1 hình chữ nhật)
    5. Chuyển sang trang tiếp theo, nhấn Print screen để chụp vùng đã chọn ở bước 4.
    6. Lặp lại bước 5 đến khi hết sách.
    7. Mở thư mục đã chọn xem thành quả và xử lý tiếp (OCR,...)
    Vâng, scan được từ sách thật thì tốt nhất vì bớt được sai sót từ khâu làm ebook ebook cũ, nhưng sẽ mất công đánh máy.
     
    Chỉnh sửa cuối: 5/6/16
    utitgg and Heoconmtv like this.
  5. teacher.anh

    teacher.anh Rùa lười Thành viên BQT

    Cái này thì cũng còn tùy cuốn, có cuốn chất lượng tốt sau khi OCR chỉ cần soát lỗi, có cuốn chất lượng kém thì cần đánh máy. Không phải cuốn nào cũng cần phải đánh máy.
     
    averelle and Cải like this.
  6. tran ngoc anh

    tran ngoc anh Cử nhân

    Cách này có áp dụng cho việc chụp sách được cho đọc online nhưng không cho tải không bạn? Mình có link một cuốn dạng giống như file pdf cho đọc online vậy đó. vì cỡ trang cố định mà màn hình của mình có chiều cao 768p thôi nên chắc chụp không được rõ, nếu bạn đã rành cách này mà là dân đồ họa nữa thì có thể chụp giúp mình không? Vì nghe nói dân đồ họa sắm màn hình cỡ bự không hà :)
     
    averelle thích bài này.
  7. averelle

    averelle Lớp 2

    Có chứ, miễn hiện lên màn hình là dùng được. Mình không phải dân đồ hoạ, chỉ dùng laptop (cũng cao 768 thôi) nhưng có thể nối ra màn hình 23". Nếu bạn cần nhờ thì pm nhé. Nhưng phải khoảng 10 ngày nữa mới về đến HN (mới có màn hình to :) )
    Xin lỗi chủ topic là lại làm loãng thêm. Thôi thì mod 4DHN dọn dẹp giúp sau vậy ;)
     
  8. tran ngoc anh

    tran ngoc anh Cử nhân

    Mình cần là màn hình lớn để chụp rõ thôi :) bạn xem Vui lòng đăng nhập hoặc đăng ký để xem link xem có thể chụp được không nhá? Nếu được thì tháng sau cũng được nói chi có 10 ngày :D Thank bạn!
     
  9. averelle

    averelle Lớp 2

    Vừa xem thử bằng laptop, chắc màn hình to thì chụp thì không vấn đề gì, có 578 trang thôi :think:. Bạn muốn output là file ảnh gì nào. Đợi mình đi về rồi thu xếp nhé. g9
     
  10. tran ngoc anh

    tran ngoc anh Cử nhân

    Dạng nào nhẹ nhất thì lấy để mình nén sang pdf cho nhỏ gọn :) thank bạn!
     
  11. averelle

    averelle Lớp 2

    Sách của bạn Vui lòng đăng nhập hoặc đăng ký để xem link, khi nào chuyển sang pdf xong lại share lên cho mọi người nhé (nhớ báo mình :))
     
  12. tran ngoc anh

    tran ngoc anh Cử nhân

    Thank nhiều nha :)
     
  13. khiconmtv

    khiconmtv Cử nhân

    averelle thích bài này.
  14. Missfly82

    Missfly82 Mầm Non

    Sao mấy Bác dùng phần mềm TechSmith Snagit
    Vui lòng đăng nhập hoặc đăng ký để xem link
    . Cho thoải mái nhỉ?
     

Chia sẻ trang này