Đăng nhập

PC [Google OCR] OCR bằng Google Drive và công cụ cmd trên PC

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi tran ngoc anh, 13/1/22.

Trang 1 của 2 trang

tran ngoc anh Cử nhân

Chào các bạn, hôm nay chúng ta tiếp tục với một mẹo nhỏ để OCR với Google Drive thông qua cmd nữa nhé!

Cụ thể là một phần mềm có khả năng đẩy kéo các file pdf và ảnh lên tài khoản Google và OCR cho chúng ta, phần mềm hoạt động thông qua cmd nên là rất nhẹ, chỉ nhập lệnh (rất ngắn) là nó OCR thôi ^_^

Credit đến cụ @iamtnl đã giới thiệu phần mềm, hướng dẫn cách dùng với cmd.

Đặt file Vui lòng đăng nhập hoặc đăng ký để xem link vào nơi các bạn dùng luôn để dành cho các dự án OCR, và dẫn thành lối tắt ra desktop để tiện truy cập. Trường hợp này mình đặt vào thư mục "Drive OCR".

Mở cmd tại thư mục "Drive OCR".

Gõ drive init để bắt đầu thiết lập liên kết với tài khoản Google. Cmd sẽ đưa cho ta một đường dẫn, copy để nhập vào trình duyệt rồi đăng nhập với tài khoản google (tạo riêng để dành OCR, trống 15GB OCR cho thoải mái).

Đăng nhập xong thì trình duyệt trả lại ta đoạn mã, bấm nút copy để về nhập trả lại vào cmd để xác nhận với cmd cho thư mục "Drive OCR" (liên kết tài khoản google với chỉ cái thư mục đó, sẽ chỉ ocr được các file được đặt trong "Drive OCR" mà thôi).

Nhập trả lại code xong cmd xác nhận, ta gõ tiếp drive features sẽ thấy chức năng OCR đã khả dụng.

Bắt đầu OCR, ta tạo một thư mục có tên "ocr" bên trong thư mục "Drive OCR". Chú ý, tên có thể đặt tùy ý và nhiều thư mục tương ứng với các dự án OCR khác nhau. Nếu tên thư mục có khoảng trắng thì đặt trong ngoặc kép cho chắc. Ví dụ thư mục có tên "Bàn về văn minh".

Sau đó chép các trang ảnh vào thư mục "ocr", hoặc "Bàn về văn minh" ^_^ gì đó. Khuyến khích các bạn làm trắng ảnh về monochrome (trắng đen) trước khi OCR, ảnh monochrome nhẹ và sạch, OCR rất tốt. Vừa hay trước đó mình có một bài TUT cách làm trắng với Image Magick cũng với dòng lệnh cmd khá gọn.

Sau đó gõ lệnh drive push -ocr ocr hoặc drive push -ocr "Bàn về văn minh" ^^

Chọn Y hoặc y để xác nhận cho cmd làm việc. Lệnh này là lệnh đẩy (push) nguyên thư mục ocr lên google drive và tiến hành OCR (-ocr) các ảnh bên trong.

Như thế là đã tải lên xong, việc OCR là google thực hiện trên máy chủ của họ.

Tiến hành kéo file OCR về bằng lệnh drive pull -export txt ocr

txt là dạng file xuất, chỉ có text thuần, hiện tại thì google đã hỗ trợ nghiêng đậm và định dạng docx.

Nhấn y xác nhận xong drive sẽ tải các file OCR về, từng file txt tương ứng từng file ảnh.

Đây là file drive tải về, chỉ 1 trang.

Vì có nhiều trang, mà drive trả về mỗi trang một file txt nằm trong một thư mục riêng cùng tên. Ta dùng everything kéo hết txt ra thư mục "ocr".

Sau đó di chuyển cmd vào thư mục ocr để nối các trang txt lại, cd ocr. Hoặc có thể vào bằng explorer rồi mở cmd tại thư mục ocr.

Và cuối cùng nối tất cả các txt lại thành một file duy nhất với lệnh copy *.txt output.txt.

=> Theo mình thấy thì Google OCR rất là mượt mà luôn ^_^. Bài viết hơi thô, các bạn chịu khó đọc, thấy giao diện cmd đen thui vậy chứ nó không phức tạp gì đâu, sau khi thiết lập liên kết với tài khoản Google rồi thì mỗi lần OCR chỉ dùng có 3 câu lệnh thôi:

drive push -ocr ocr (để đẩy file trong thư mục ocr lên gdrive và yêu cầu gdrive ocr)
drive pull -export txt ocr (để kéo kết quả ocr về)
copy *.txt output.txt (để nối các trang lại)

Và không quên xóa thư mục ocr trong tài khoản gdrive của các bạn trước khi thực hiện dự án ocr mới nhé, còn nếu không thì khi ocr dự án mới thì đặt tên thư mục mới, tránh trùng với thư mục cũ.

CHÚC CÁC BẠN THÀNH CÔNG!

Bổ sung: bác @vinaguy nhắc vụ nhiều trang mình mới nhớ ra, thay vì cho vào OCR các trang ảnh thì các bạn cũng có thể cho vào đó các trang pdf, các đoạn pdf.. cũng được luôn, song để cho cẩn thận thì mình hay cắt khúc pdf ra khoảng 30 trang pdf mỗi khúc, vì google giới hạn số trang cũng như dung lượng tối đa cho mỗi file pdf dưới 2.5MB.

Chỉnh sửa cuối: 24/3/22

tran ngoc anh, 13/1/22

#1

huydatvns, maidorim, vinaguy and 3 others like this.
vinaguy Lớp 12

tran ngoc anh nói: ↑

Vì có nhiều trang, mà drive trả về mỗi trang một file txt nằm trong một thư mục riêng cùng tên.
Click to expand...

Em thấy gì cũng có thể làm được hết. Riêng đoạn này thì "nhìn là thấy ghét" rồi bác nhỉ?
Cơ mà em thấy vFlat làm chính xác hơn cả Google Drive luôn bác ạ. Em mới thử 3-4 cuốn. Không biết bác có nhận xét gì khác không?

vinaguy, 14/1/22

#2

nhockon_cm thích bài này.
tran ngoc anh Cử nhân

vinaguy nói: ↑

Cơ mà em thấy vFlat làm chính xác hơn cả Google Drive luôn bác ạ.
Click to expand...

Thật ra em từng OCR bằng cả hai để so sánh một vài trang, chênh nhau vài chữ thì phải, ưu điểm của Vflat là nó tích hợp trình xử lý ảnh nữa, nên là trước khi OCR thì ảnh của nó đã ngon hơn hẳn bên phía Google. Nên trường hợp này không hề cân sức bác nhé.

Nếu so kèo là một trang scan phẳng phiu và được xử lý trắng đẹp trước rồi, khi OCR với cả hai và Vflat không chọn cho nó xử lý ảnh thì chưa đoán được kết quả ^^

Và em nghe đồn rằng Vflat dùng chính engine OCR của google và trình xử lý ảnh unpaper, các bác IT nói thế chứ em cũng không có cách nào kiểm chứng. Nhưng nếu làm ra cái app mà người dùng khen và thấy nó ngon hơn hẳn google thì đó là cái hay của nhà sản xuất Hàn Quốc ^_^ lại còn có giao diện tiện dụng nữa chứ, mỗi tội mỗi lần nó chạy là máy em bị đơ luôn, vi xử lý Snapdragon 625 mà chạy muốn liệt.. cái điện thoại khi phải xử lý ảnh như thế.

Mà em nghe nói Vflat bị giới hạn số trang thì phải, gần đây không tìm thấy Vflat trên Playstore nữa nên không rõ em ấy có thu phí hay chưa, còn google thì "phờ ri"

Bác tự quyết định chọn em nào thôi bác ạ, hai tay hai em cũng chả ai nói gì, em nghĩ vợ bác có biết thì bác ấy cũng chẳng có phàn nàn gì đâu hí hí >?

tran ngoc anh, 14/1/22

#3
Wanderman Lớp 5

Sao bạn không làm file BAT nhỉ?

Wanderman, 14/1/22

#4
tran ngoc anh Cử nhân

Wanderman nói: ↑

Sao bạn không làm file BAT nhỉ?
Click to expand...

Vì mình chưa biết làm.

tran ngoc anh, 14/1/22

#5

Wanderman thích bài này.
machine Sinh viên năm I

tran ngoc anh nói: ↑

Vì mình chưa biết làm.
Click to expand...

Nếu tăng cường chất lượng ảnh bằng bằng Image Magick:
- dùng lệnh trực tiếp trong cửa sổ cmd cho kết quả tốt
- dùng lệnh trong file BAT: không có tác dụng
Tham khảo: Vui lòng đăng nhập hoặc đăng ký để xem link

Chỉnh sửa cuối: 15/1/22

machine, 15/1/22

#6
tran ngoc anh Cử nhân

machine nói: ↑

Nếu tăng cường chất lượng ảnh bằng bằng Image Magick:
- dùng lệnh trực tiếp trong cửa sổ cmd cho kết quả tốt
- dùng lệnh trong file BAT: không có tác dụng
Tham khảo: Vui lòng đăng nhập hoặc đăng ký để xem link
Click to expand...

Để em thử xem ^^

tran ngoc anh, 15/1/22

#7
iamtnl Lớp 4
nay mới đọc thấy bài này

những gì cần thiết thì @tran ngoc anh đã trình bày hết rồi. có một lưu ý nhỏ là trước khi OCR thì nên bỏ các trang cover hoặc các trang full hình đi. vì nếu OCR 1-2 trang đầu mà không ra chữ thì Google sẽ tự động bỏ qua file đó không OCR tiếp nữa.

giới thiệu vs mọi người công cụ xử lý pdf mới là CPDF. Vui lòng đăng nhập hoặc đăng ký để xem link

cắt file PDF trong 1 nốt nhạc

Mã:

cpdf -split file.pdf -chunk 20 -o split_%%%.pdf

trong đó -chunk 20 là cắt thành các file có độ dài 20 trang. còn phần split_%%% là định dạng tên file sau khi cắt, %%% sẽ được thay bằng số thứ tự.
iamtnl, 24/3/22

#8

Cao Đức Hiếu and tran ngoc anh like this.
tran ngoc anh Cử nhân

iamtnl nói: ↑

giới thiệu vs mọi người công cụ xử lý pdf mới là CPDF. Vui lòng đăng nhập hoặc đăng ký để xem link

cắt file PDF trong 1 nốt nhạc
Click to expand...

Hay quá bác ơi, lại có thêm công cụ để dùng ^^

tran ngoc anh, 24/3/22

#9
huydatvns Lớp 7

Tới chỗ này thì bị bí, ko làm sao để copy được trong cmd luôn

Help @tran ngoc anh ơi
Cũng đã thử google, bật copy nhưng vẫn ko đc

huydatvns, 24/3/22

#10

tran ngoc anh thích bài này.
iamtnl Lớp 4

à và bổ sung thêm cái disclaimer.

file drive.exe được chia sẻ là lấy từ nguồn ở đây và build cho windows. Vui lòng đăng nhập hoặc đăng ký để xem link

đây là công cụ rất mạnh, có thể quản lý toàn bộ drive của bạn. nên hãy cẩn thận khi dùng.

iamtnl, 24/3/22

#11

huydatvns and tran ngoc anh like this.
iamtnl Lớp 4

huydatvns nói: ↑

Tới chỗ này thì bị bí, ko làm sao để copy được trong cmd luôn
View attachment 90284
Help @tran ngoc anh ơi
Cũng đã thử google, bật copy nhưng vẫn ko đc
View attachment 90285
Click to expand...

cứ ấn paste xong enter thôi. password ko hiện ra trong cmd đâu.

iamtnl, 24/3/22

#12
tran ngoc anh Cử nhân

huydatvns nói: ↑

Tới chỗ này thì bị bí, ko làm sao để copy được trong cmd luôn
View attachment 90284
Help @tran ngoc anh ơi
Cũng đã thử google, bật copy nhưng vẫn ko đc
View attachment 90285
Click to expand...

Tức là chọn được nhưng chuột phải không xuất hiện lệnh copy đúng không?

Đơn giản là nhấn Ctrl+C thôi bạn ^^

tran ngoc anh, 24/3/22

#13

huydatvns thích bài này.
huydatvns Lớp 7

iamtnl nói: ↑

à và bổ sung thêm cái disclaimer.

file drive.exe được chia sẻ là lấy từ nguồn ở đây và build cho windows. Vui lòng đăng nhập hoặc đăng ký để xem link

đây là công cụ rất mạnh, có thể quản lý toàn bộ drive của bạn. nên hãy cẩn thận khi dùng.
Click to expand...

Nghe xong thấy nhột nhột haha, ghê quá

huydatvns, 24/3/22

#14
huydatvns Lớp 7

tran ngoc anh nói: ↑

Tức là chọn được nhưng chuột phải không xuất hiện lệnh copy đúng không?

Đơn giản là nhấn Ctrl+C thôi bạn ^^
Click to expand...

Đúng rồi bạn, kéo chuột rồi copy, ctrl+c các kiểu nhưng khi paste thì ra trống trơn à

huydatvns, 24/3/22

#15
tran ngoc anh Cử nhân

huydatvns nói: ↑

Đúng rồi bạn, kéo chuột rồi copy, ctrl+c các kiểu nhưng khi paste thì ra trống trơn à
Click to expand...

Tức là vẫn chưa copy được link để nhập vào trang web luôn sao? Kỳ lạ quá.

tran ngoc anh, 24/3/22

#16
tran ngoc anh Cử nhân

Chọn nội dung trong cmd thì chỉ cần kéo chuột hoặc nhấn giữ phím Shift rồi nhấn các phím mũi tên, sau đó ctrl+C là đã copy được. Hoặc có thể Ctrl+A, Ctrl+C để copy toàn bộ, đem ra ngoài thì cắt gọt thêm tùy ý.

Còn khi dán vào cmd thì chỉ cần nhấn nút chuột phải là nội dung đã được dán vào cmd, hay nhấn ctrl+V cũng là một cách.

tran ngoc anh, 24/3/22

#17

huydatvns thích bài này.
huydatvns Lớp 7

tran ngoc anh nói: ↑

Chọn nội dung trong cmd thì chỉ cần kéo chuột hoặc nhấn giữ phím Shift rồi nhấn các phím mũi tên, sau đó ctrl+C là đã copy được. Hoặc có thể Ctrl+A, Ctrl+C để copy toàn bộ, đem ra ngoài thì cắt gọt thêm tùy ý.

Còn khi dán vào cmd thì chỉ cần nhấn nút chuột phải là nội dung đã được dán vào cmd, hay nhấn ctrl+V cũng là một cách.
Click to expand...

Sau khi thử chụp ảnh, orc lấy text các kiểu cũng như dò gõ lại cũng vài lần rồi, paste lên trình duyệt lại dính lỗi của google. Thôi mình xin bỏ cuộc, ko chơi ca này nữa (có khi nên cài lại win cho con lap, 3 năm rồi ).

huydatvns, 24/3/22

#18
vinaguy Lớp 12

huydatvns nói: ↑

Sau khi thử chụp ảnh, orc lấy text các kiểu cũng như dò gõ lại cũng vài lần rồi, paste lên trình duyệt lại dính lỗi của google. Thôi mình xin bỏ cuộc, ko chơi ca này nữa (có khi nên cài lại win cho con lap, 3 năm rồi ).
Click to expand...

Bác khoan bỏ bác ơi. Từ từ chờ em tí. Thế này... Bác muốn OCR pdf và làm theo cách của @tran ngoc anh phải không? Nếu không được thì về với team của em, chuyển sang làm cách em xem thử.
1. Bác có 1 file pdf bự tổ trảng thì bác xiến nó thành nhiều file. Mỗi file cỡ 20-30 trang gì đó (như có bác đã hướng dẫn ở trên).
2. Bác mở google drive lên và kéo thả tất cả các file bác vừa mới xiến ở bước 1 thả vào thư mục nào đó của google drive mà bác thích (để ấp các file đó lên GD thôi).
3. Nhấp chuột phải vào mỗi file vừa mới ấp lên và chọn Open with Google Doc. Rồi vứt đó đi làm ly trà, vài phút quay lại.
Thử cách em xem có được không bác? Em cứ hay làm đại thủ công như vậy bác ạ.

vinaguy, 24/3/22

#19

huydatvns thích bài này.
songuyento Lớp 1

iamtnl nói: ↑

à và bổ sung thêm cái disclaimer.

file drive.exe được chia sẻ là lấy từ nguồn ở đây và build cho windows. Vui lòng đăng nhập hoặc đăng ký để xem link

đây là công cụ rất mạnh, có thể quản lý toàn bộ drive của bạn. nên hãy cẩn thận khi dùng.
Click to expand...

Nếu lỡ dùng rồi thì có cách nào để gỡ quyền quản lý này ko nhỉ ?

songuyento, 24/3/22

#20

(Bạn phải Đăng nhập hoặc Đăng ký để trả lời bài viết.)

Trang 1 của 2 trang

Chia sẻ trang này