PC [Google OCR] OCR bằng Google Drive và công cụ cmd trên PC

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi tran ngoc anh, 13/1/22.

  1. tran ngoc anh

    tran ngoc anh Cử nhân

    Chào các bạn, hôm nay chúng ta tiếp tục với một mẹo nhỏ để OCR với Google Drive thông qua cmd nữa nhé!

    Cụ thể là một phần mềm có khả năng đẩy kéo các file pdf và ảnh lên tài khoản Google và OCR cho chúng ta, phần mềm hoạt động thông qua cmd nên là rất nhẹ, chỉ nhập lệnh (rất ngắn) là nó OCR thôi ^_^

    Credit đến cụ @iamtnl đã giới thiệu phần mềm, hướng dẫn cách dùng với cmd.

    [​IMG]

    Đặt file Vui lòng đăng nhập hoặc đăng ký để xem link vào nơi các bạn dùng luôn để dành cho các dự án OCR, và dẫn thành lối tắt ra desktop để tiện truy cập. Trường hợp này mình đặt vào thư mục "Drive OCR".

    [​IMG]

    Mở cmd tại thư mục "Drive OCR".

    [​IMG]

    drive init để bắt đầu thiết lập liên kết với tài khoản Google. Cmd sẽ đưa cho ta một đường dẫn, copy để nhập vào trình duyệt rồi đăng nhập với tài khoản google (tạo riêng để dành OCR, trống 15GB OCR cho thoải mái).

    [​IMG]

    Đăng nhập xong thì trình duyệt trả lại ta đoạn mã, bấm nút copy để về nhập trả lại vào cmd để xác nhận với cmd cho thư mục "Drive OCR" (liên kết tài khoản google với chỉ cái thư mục đó, sẽ chỉ ocr được các file được đặt trong "Drive OCR" mà thôi).

    [​IMG]

    Nhập trả lại code xong cmd xác nhận, ta gõ tiếp drive features sẽ thấy chức năng OCR đã khả dụng.

    [​IMG]

    Bắt đầu OCR, ta tạo một thư mục có tên "ocr" bên trong thư mục "Drive OCR". Chú ý, tên có thể đặt tùy ý và nhiều thư mục tương ứng với các dự án OCR khác nhau. Nếu tên thư mục có khoảng trắng thì đặt trong ngoặc kép cho chắc. Ví dụ thư mục có tên "Bàn về văn minh".

    Sau đó chép các trang ảnh vào thư mục "ocr", hoặc "Bàn về văn minh" ^_^ gì đó. Khuyến khích các bạn làm trắng ảnh về monochrome (trắng đen) trước khi OCR, ảnh monochrome nhẹ và sạch, OCR rất tốt. Vừa hay trước đó mình có một bài TUT cách làm trắng với Image Magick cũng với dòng lệnh cmd khá gọn.

    Sau đó gõ lệnh drive push -ocr ocr hoặc drive push -ocr "Bàn về văn minh" ^^

    Chọn Y hoặc y để xác nhận cho cmd làm việc. Lệnh này là lệnh đẩy (push) nguyên thư mục ocr lên google drive và tiến hành OCR (-ocr) các ảnh bên trong.

    [​IMG]

    Như thế là đã tải lên xong, việc OCR là google thực hiện trên máy chủ của họ.

    [​IMG]

    Tiến hành kéo file OCR về bằng lệnh drive pull -export txt ocr

    txt là dạng file xuất, chỉ có text thuần, hiện tại thì google đã hỗ trợ nghiêng đậm và định dạng docx.

    [​IMG]

    Nhấn y xác nhận xong drive sẽ tải các file OCR về, từng file txt tương ứng từng file ảnh.

    [​IMG]

    Đây là file drive tải về, chỉ 1 trang.

    [​IMG]

    Vì có nhiều trang, mà drive trả về mỗi trang một file txt nằm trong một thư mục riêng cùng tên. Ta dùng everything kéo hết txt ra thư mục "ocr".

    [​IMG]

    Sau đó di chuyển cmd vào thư mục ocr để nối các trang txt lại, cd ocr. Hoặc có thể vào bằng explorer rồi mở cmd tại thư mục ocr.

    Và cuối cùng nối tất cả các txt lại thành một file duy nhất với lệnh copy *.txt output.txt.

    => Theo mình thấy thì Google OCR rất là mượt mà luôn ^_^. Bài viết hơi thô, các bạn chịu khó đọc, thấy giao diện cmd đen thui vậy chứ nó không phức tạp gì đâu, sau khi thiết lập liên kết với tài khoản Google rồi thì mỗi lần OCR chỉ dùng có 3 câu lệnh thôi:

    drive push -ocr ocr (để đẩy file trong thư mục ocr lên gdrive và yêu cầu gdrive ocr)
    drive pull -export txt ocr (để kéo kết quả ocr về)
    copy *.txt output.txt (để nối các trang lại)

    Và không quên xóa thư mục ocr trong tài khoản gdrive của các bạn trước khi thực hiện dự án ocr mới nhé, còn nếu không thì khi ocr dự án mới thì đặt tên thư mục mới, tránh trùng với thư mục cũ.


    CHÚC CÁC BẠN THÀNH CÔNG!







    Bổ sung: bác @vinaguy nhắc vụ nhiều trang mình mới nhớ ra, thay vì cho vào OCR các trang ảnh thì các bạn cũng có thể cho vào đó các trang pdf, các đoạn pdf.. cũng được luôn, song để cho cẩn thận thì mình hay cắt khúc pdf ra khoảng 30 trang pdf mỗi khúc, vì google giới hạn số trang cũng như dung lượng tối đa cho mỗi file pdf dưới 2.5MB.
     
    Chỉnh sửa cuối: 24/3/22
    huydatvns, maidorim, vinaguy and 3 others like this.
  2. vinaguy

    vinaguy Lớp 11

    Em thấy gì cũng có thể làm được hết. Riêng đoạn này thì "nhìn là thấy ghét" rồi bác nhỉ? :)
    Cơ mà em thấy vFlat làm chính xác hơn cả Google Drive luôn bác ạ. Em mới thử 3-4 cuốn. Không biết bác có nhận xét gì khác không?
     
    nhockon_cm thích bài này.
  3. tran ngoc anh

    tran ngoc anh Cử nhân

    Thật ra em từng OCR bằng cả hai để so sánh một vài trang, chênh nhau vài chữ thì phải, ưu điểm của Vflat là nó tích hợp trình xử lý ảnh nữa, nên là trước khi OCR thì ảnh của nó đã ngon hơn hẳn bên phía Google. Nên trường hợp này không hề cân sức bác nhé.

    Nếu so kèo là một trang scan phẳng phiu và được xử lý trắng đẹp trước rồi, khi OCR với cả hai và Vflat không chọn cho nó xử lý ảnh thì chưa đoán được kết quả ^^

    Và em nghe đồn rằng Vflat dùng chính engine OCR của google và trình xử lý ảnh unpaper, các bác IT nói thế chứ em cũng không có cách nào kiểm chứng. Nhưng nếu làm ra cái app mà người dùng khen và thấy nó ngon hơn hẳn google thì đó là cái hay của nhà sản xuất Hàn Quốc ^_^ lại còn có giao diện tiện dụng nữa chứ, mỗi tội mỗi lần nó chạy là máy em bị đơ luôn, vi xử lý Snapdragon 625 mà chạy muốn liệt.. cái điện thoại khi phải xử lý ảnh như thế.

    Mà em nghe nói Vflat bị giới hạn số trang thì phải, gần đây không tìm thấy Vflat trên Playstore nữa nên không rõ em ấy có thu phí hay chưa, còn google thì "phờ ri" :D

    Bác tự quyết định chọn em nào thôi bác ạ, hai tay hai em cũng chả ai nói gì, em nghĩ vợ bác có biết thì bác ấy cũng chẳng có phàn nàn gì đâu hí hí >?
     
  4. Wanderman

    Wanderman Lớp 4

    Sao bạn không làm file BAT nhỉ?
     
  5. tran ngoc anh

    tran ngoc anh Cử nhân

    Vì mình chưa biết làm.
     
    Wanderman thích bài này.
  6. machine

    machine Lớp 12

    Nếu tăng cường chất lượng ảnh bằng bằng Image Magick:
    - dùng lệnh trực tiếp trong cửa sổ cmd cho kết quả tốt
    - dùng lệnh trong file BAT: không có tác dụng
    Tham khảo: Vui lòng đăng nhập hoặc đăng ký để xem link
     
    Chỉnh sửa cuối: 15/1/22
  7. tran ngoc anh

    tran ngoc anh Cử nhân

    Để em thử xem ^^
     
  8. iamtnl

    iamtnl Lớp 4

    nay mới đọc thấy bài này :D

    những gì cần thiết thì @tran ngoc anh đã trình bày hết rồi. có một lưu ý nhỏ là trước khi OCR thì nên bỏ các trang cover hoặc các trang full hình đi. vì nếu OCR 1-2 trang đầu mà không ra chữ thì Google sẽ tự động bỏ qua file đó không OCR tiếp nữa.

    giới thiệu vs mọi người công cụ xử lý pdf mới là CPDF. Vui lòng đăng nhập hoặc đăng ký để xem link

    cắt file PDF trong 1 nốt nhạc

    Mã:
    cpdf -split file.pdf -chunk 20 -o split_%%%.pdf
    
    trong đó -chunk 20 là cắt thành các file có độ dài 20 trang. còn phần split_%%% là định dạng tên file sau khi cắt, %%% sẽ được thay bằng số thứ tự.
     
  9. tran ngoc anh

    tran ngoc anh Cử nhân

    Hay quá bác ơi, lại có thêm công cụ để dùng ^^
     
  10. huydatvns

    huydatvns Lớp 7

    Tới chỗ này thì bị bí, ko làm sao để copy được trong cmd luôn =))
    upload_2022-3-24_13-8-6.png
    Help @tran ngoc anh ơi :)
    Cũng đã thử google, bật copy nhưng vẫn ko đc
    upload_2022-3-24_13-15-19.png
     
    tran ngoc anh thích bài này.
  11. iamtnl

    iamtnl Lớp 4

    à và bổ sung thêm cái disclaimer.

    file drive.exe được chia sẻ là lấy từ nguồn ở đây và build cho windows. Vui lòng đăng nhập hoặc đăng ký để xem link

    đây là công cụ rất mạnh, có thể quản lý toàn bộ drive của bạn. nên hãy cẩn thận khi dùng. :D
     
    huydatvns and tran ngoc anh like this.
  12. iamtnl

    iamtnl Lớp 4

    cứ ấn paste xong enter thôi. password ko hiện ra trong cmd đâu.
     
  13. tran ngoc anh

    tran ngoc anh Cử nhân

    Tức là chọn được nhưng chuột phải không xuất hiện lệnh copy đúng không?

    Đơn giản là nhấn Ctrl+C thôi bạn ^^
     
    huydatvns thích bài này.
  14. huydatvns

    huydatvns Lớp 7

    Nghe xong thấy nhột nhột haha, ghê quá :D
     
  15. huydatvns

    huydatvns Lớp 7

    Đúng rồi bạn, kéo chuột rồi copy, ctrl+c các kiểu nhưng khi paste thì ra trống trơn à :D
     
  16. tran ngoc anh

    tran ngoc anh Cử nhân

    Tức là vẫn chưa copy được link để nhập vào trang web luôn sao? Kỳ lạ quá.
     
  17. tran ngoc anh

    tran ngoc anh Cử nhân

    Chọn nội dung trong cmd thì chỉ cần kéo chuột hoặc nhấn giữ phím Shift rồi nhấn các phím mũi tên, sau đó ctrl+C là đã copy được. Hoặc có thể Ctrl+A, Ctrl+C để copy toàn bộ, đem ra ngoài thì cắt gọt thêm tùy ý.

    Còn khi dán vào cmd thì chỉ cần nhấn nút chuột phải là nội dung đã được dán vào cmd, hay nhấn ctrl+V cũng là một cách.
     
    huydatvns thích bài này.
  18. huydatvns

    huydatvns Lớp 7

    Sau khi thử chụp ảnh, orc lấy text các kiểu cũng như dò gõ lại cũng vài lần rồi, paste lên trình duyệt lại dính lỗi của google. Thôi mình xin bỏ cuộc, ko chơi ca này nữa :D (có khi nên cài lại win cho con lap, 3 năm rồi :D).
    upload_2022-3-24_16-36-7.png
     
  19. vinaguy

    vinaguy Lớp 11

    Bác khoan bỏ bác ơi. Từ từ chờ em tí. Thế này... Bác muốn OCR pdf và làm theo cách của @tran ngoc anh phải không? Nếu không được thì về với team của em, chuyển sang làm cách em xem thử.
    1. Bác có 1 file pdf bự tổ trảng thì bác xiến nó thành nhiều file. Mỗi file cỡ 20-30 trang gì đó (như có bác đã hướng dẫn ở trên).
    2. Bác mở google drive lên và kéo thả tất cả các file bác vừa mới xiến ở bước 1 thả vào thư mục nào đó của google drive mà bác thích (để ấp các file đó lên GD thôi).
    3. Nhấp chuột phải vào mỗi file vừa mới ấp lên và chọn Open with Google Doc. Rồi vứt đó đi làm ly trà, vài phút quay lại.
    Thử cách em xem có được không bác? Em cứ hay làm đại thủ công như vậy bác ạ.
     
    huydatvns thích bài này.
  20. songuyento

    songuyento Lớp 1

    Nếu lỡ dùng rồi thì có cách nào để gỡ quyền quản lý này ko nhỉ ? :D
     

Chia sẻ trang này