PC [Google OCR] OCR bằng Google Drive và công cụ cmd trên PC

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi tran ngoc anh, 13/1/22 lúc 23:55.

  1. tran ngoc anh

    tran ngoc anh Cử nhân

    Chào các bạn, hôm nay chúng ta tiếp tục với một mẹo nhỏ để OCR với Google Drive thông qua cmd nữa nhé!

    Cụ thể là một phần mềm có khả năng đẩy kéo các file pdf và ảnh lên tài khoản Google và OCR cho chúng ta, phần mềm hoạt động thông qua cmd nên là rất nhẹ, chỉ nhập lệnh (rất ngắn) là nó OCR thôi ^_^



    [​IMG]

    Đặt file Vui lòng đăng nhập hoặc đăng ký để xem link vào nơi các bạn dùng luôn để dành cho các dự án OCR, và dẫn thành lối tắt ra desktop để tiện truy cập. Trường hợp này mình đặt vào thư mục "Drive OCR".

    [​IMG]

    Mở cmd tại thư mục "Drive OCR".

    [​IMG]

    drive init để bắt đầu thiết lập liên kết với tài khoản Google. Cmd sẽ đưa cho ta một đường dẫn, copy để nhập vào trình duyệt rồi đăng nhập với tài khoản google (tạo riêng để dành OCR, trống 15GB OCR cho thoải mái).

    [​IMG]

    Đăng nhập xong thì trình duyệt trả lại ta đoạn mã, bấm nút copy để về nhập trả lại vào cmd để xác nhận với cmd cho thư mục "Drive OCR" (liên kết tài khoản google với chỉ cái thư mục đó, sẽ chỉ ocr được các file được đặt trong "Drive OCR" mà thôi).

    [​IMG]

    Nhập trả lại code xong cmd xác nhận, ta gõ tiếp drive features sẽ thấy chức năng OCR đã khả dụng.

    [​IMG]

    Bắt đầu OCR, ta tạo một thư mục có tên "ocr" bên trong thư mục "Drive OCR". Chú ý, tên có thể đặt tùy ý và nhiều thư mục tương ứng với các dự án OCR khác nhau. Nếu tên thư mục có khoảng trắng thì đặt trong ngoặc kép cho chắc. Ví dụ thư mục có tên "Bàn về văn minh".

    Sau đó chép các trang ảnh vào thư mục "ocr", hoặc "Bàn về văn minh" ^_^ gì đó. Khuyến khích các bạn làm trắng ảnh về monochrome (trắng đen) trước khi OCR, ảnh monochrome nhẹ và sạch, OCR rất tốt. Vừa hay trước đó mình có một bài TUT cách làm trắng với Image Magick cũng với dòng lệnh cmd khá gọn.

    Sau đó gõ lệnh drive push -ocr ocr hoặc drive push -ocr "Bàn về văn minh" ^^

    Chọn Y hoặc y để xác nhận cho cmd làm việc. Lệnh này là lệnh đẩy (push) nguyên thư mục ocr lên google drive và tiến hành OCR (-ocr) các ảnh bên trong.

    [​IMG]

    Như thế là đã tải lên xong, việc OCR là google thực hiện trên máy chủ của họ.

    [​IMG]

    Tiến hành kéo file OCR về bằng lệnh drive pull -export txt ocr

    txt là dạng file xuất, chỉ có text thuần, hiện tại thì google đã hỗ trợ nghiêng đậm và định dạng docx.

    [​IMG]

    Nhấn y xác nhận xong drive sẽ tải các file OCR về, từng file txt tương ứng từng file ảnh.

    [​IMG]

    Đây là file drive tải về, chỉ 1 trang.

    [​IMG]

    Vì có nhiều trang, mà drive trả về mỗi trang một file txt nằm trong một thư mục riêng cùng tên. Ta dùng everything kéo hết txt ra thư mục "ocr".

    [​IMG]

    Sau đó di chuyển cmd vào thư mục ocr để nối các trang txt lại, cd ocr. Hoặc có thể vào bằng explorer rồi mở cmd tại thư mục ocr.

    Và cuối cùng nối tất cả các txt lại thành một file duy nhất với lệnh copy *.txt output.txt.

    => Theo mình thấy thì Google OCR rất là mượt mà luôn ^_^. Bài viết hơi thô, các bạn chịu khó đọc, thấy giao diện cmd đen thui vậy chứ nó không phức tạp gì đâu, sau khi thiết lập liên kết với tài khoản Google rồi thì mỗi lần OCR chỉ dùng có 3 câu lệnh thôi:

    drive push -ocr ocr (để đẩy file trong thư mục ocr lên gdrive và yêu cầu gdrive ocr)
    drive pull -export txt ocr (để kéo kết quả ocr về)
    copy *.txt output.txt (để nối các trang lại)

    Và không quên xóa thư mục ocr trong tài khoản gdrive của các bạn trước khi thực hiện dự án ocr mới nhé, còn nếu không thì khi ocr dự án mới thì đặt tên thư mục mới, tránh trùng với thư mục cũ.


    CHÚC CÁC BẠN THÀNH CÔNG!







    Bổ sung: bác @vinaguy nhắc vụ nhiều trang mình mới nhớ ra, thay vì cho vào OCR các trang ảnh thì các bạn cũng có thể cho vào đó các trang pdf, các đoạn pdf.. cũng được luôn, song để cho cẩn thận thì mình hay cắt khúc pdf ra khoảng 30 trang pdf mỗi khúc, vì google giới hạn số trang cũng như dung lượng tối đa cho mỗi file pdf dưới 2.5MB.
     
    Chỉnh sửa cuối: 14/1/22 lúc 10:32
    maidorim, vinaguy, welcom1985 and 2 others like this.
  2. vinaguy

    vinaguy Lớp 5

    Em thấy gì cũng có thể làm được hết. Riêng đoạn này thì "nhìn là thấy ghét" rồi bác nhỉ? :)
    Cơ mà em thấy vFlat làm chính xác hơn cả Google Drive luôn bác ạ. Em mới thử 3-4 cuốn. Không biết bác có nhận xét gì khác không?
     
  3. tran ngoc anh

    tran ngoc anh Cử nhân

    Thật ra em từng OCR bằng cả hai để so sánh một vài trang, chênh nhau vài chữ thì phải, ưu điểm của Vflat là nó tích hợp trình xử lý ảnh nữa, nên là trước khi OCR thì ảnh của nó đã ngon hơn hẳn bên phía Google. Nên trường hợp này không hề cân sức bác nhé.

    Nếu so kèo là một trang scan phẳng phiu và được xử lý trắng đẹp trước rồi, khi OCR với cả hai và Vflat không chọn cho nó xử lý ảnh thì chưa đoán được kết quả ^^

    Và em nghe đồn rằng Vflat dùng chính engine OCR của google và trình xử lý ảnh unpaper, các bác IT nói thế chứ em cũng không có cách nào kiểm chứng. Nhưng nếu làm ra cái app mà người dùng khen và thấy nó ngon hơn hẳn google thì đó là cái hay của nhà sản xuất Hàn Quốc ^_^ lại còn có giao diện tiện dụng nữa chứ, mỗi tội mỗi lần nó chạy là máy em bị đơ luôn, vi xử lý Snapdragon 625 mà chạy muốn liệt.. cái điện thoại khi phải xử lý ảnh như thế.

    Mà em nghe nói Vflat bị giới hạn số trang thì phải, gần đây không tìm thấy Vflat trên Playstore nữa nên không rõ em ấy có thu phí hay chưa, còn google thì "phờ ri" :D

    Bác tự quyết định chọn em nào thôi bác ạ, hai tay hai em cũng chả ai nói gì, em nghĩ vợ bác có biết thì bác ấy cũng chẳng có phàn nàn gì đâu hí hí >?
     
  4. Wanderman

    Wanderman Mầm non

    Sao bạn không làm file BAT nhỉ?
     
  5. tran ngoc anh

    tran ngoc anh Cử nhân

    Vì mình chưa biết làm.
     
  6. machine

    machine Lớp 7

    Nếu tăng cường chất lượng ảnh bằng bằng Image Magick:
    - dùng lệnh trực tiếp trong cửa sổ cmd cho kết quả tốt
    - dùng lệnh trong file BAT: không có tác dụng
    Tham khảo: Vui lòng đăng nhập hoặc đăng ký để xem link
     
    Chỉnh sửa cuối: 15/1/22 lúc 08:59
  7. tran ngoc anh

    tran ngoc anh Cử nhân

    Để em thử xem ^^
     

Chia sẻ trang này