PC Chụp ảnh màn hình và OCR trực tiếp bằng Capture2Text

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi khiconmtv, 28/9/16.

  1. khiconmtv

    khiconmtv Sinh viên năm IV

    Capture2Text là 1 phần mềm không cần cài đặt, cho phép chụp ảnh màn hình máy tính rồi nhận dạng ký tự quang học (OCR) trực tiếp.

    Tải bản mới nhất ở đây: bản mới nhất 3.9
    Vui lòng đăng nhập hoặc đăng ký để xem link

    Tải từ điển ngôn ngữ nhận dạng ở đây:
    Vui lòng đăng nhập hoặc đăng ký để xem link

    Các ngôn ngữ được hỗ trợ:
    Gói ngôn ngữ tải về thì giải nén vào thư mục Capture2Text\Utils\tesseract\tessdata.

    Muốn OCR ngôn ngữ nào thì click phải vào icon dưới góc > OCR Language.
    [​IMG]

    Mặc định phím tắt Windows+Q (tuỳ ý chọn tổ hợp khác cũng được) để bật OCR, di chuyển con trỏ rồi click 1 phát để đóng khung khu vực cần OCR, mặc định nó sẽ lưu vào clipboard. Sau đó paste vào Word để xử lý.
    [​IMG]

    Mức độ chính xác phụ thuộc vào tuỳ chỉnh tốc độ ở trong Preferences... > thẻ OCR > mục OCR Method (mặc định là đơn giản và nhanh).
     
    Chỉnh sửa cuối: 29/9/16
  2. khiconmtv

    khiconmtv Sinh viên năm IV

    Test thử 1 đoạn tiếng Việt:

    Image 001.jpg

    Kết quả: (chỗ sai màu xanh)

    Việt Nam Phong Tục đề cập đến nền văn minh nước nhà. Tác giả là Phan KểBỉnh, người mà ta có thể nói là một học giả uyên bác, sống từ cuối thếleỹ thứ 19 qua những năm đầu thểleỷ thứ 20, nhờ vậy thâỳ sự xáo trộn của đất nước, khi tỉêJv xúc với văn minh Phương Tây. Kinh tếthay đổi thì phong tục phải thay đổi. Ông viết nhiều bài ngắn đăng từng kỳ trên Đông Dương Tạp Chí, vào năm 1913 — 1914, tỉnh đến nay đã non 80 năm! Đức tỉnh lớn của ông là biết nhiều nhưng viết ngắn gọn, không thêm thắt, cường điệu, lâỳ sự sống còn của dân tộc làm đường lối cơ bản.
     
    Chỉnh sửa cuối: 29/9/16
  3. khiconmtv

    khiconmtv Sinh viên năm IV

    Test 1 đoạn tiếng Trung giản thể:

    Image 001.jpg

    Kết quả:

    南宋年间, 金国四狼主兀术进犯中原, 因连连失利, 便调来义子陆文龙助战o 陆文龙武艺高强, 宋菅数员大将出马, 都不能胜他。
     
  4. quang3456

    quang3456 Lớp 3

    Cảm ơn bạn hướng dẫn.
    Mày mò mãi rồi cũng làm được, kết quả như sau:

    Tôi phải xin lỗi nhà văn Nguyễn Huy Thiệp, vì tôi chưa có dịp được gặp ông lần nào, cũng chỉ là mới đọc truyện của ông thôi. Truyện nào của ông được in ra tôi cũng tìm đọc. Và càng đọc, tôi càng phục ông. Thế mới biết cái sự khen chê ở đời lăm điều phức tạp. Nhưng cũng nên nghĩ cho nhẹ nhàng, cho giản dị, thì đó chẳng qua chỉ là quan niệm của mỗi người. Đến như ông Vũ Trọng Phụng hồi xưa, trung thực, sắc sảo là thế, vẫn có người tìm ra điều để mà chẽ, để mà trách nữa là. Cái truyện mới nhất của ông Thiệp mà tôi được đọc là truyện "Cún". Tôi cứ hình dung chàng "Cún" của ông đang tồn tại trong ngõ Lỗ Thùng chúng tôi. Tôi sống ở ngõ Lỗ Thùng này có tới hơn chục năm rồi. Kỳ thực thì, nếu làm cuộc phỏng vấn, hắn chẳng ai muốn mình phải sinh ra và

    Nhưng phần mềm AVG lại báo có threat trong Capture2Text và đòi xóa, có vấn đề gì không nhỉ?
    Và Capture thì lúc được lúc không
     
    Chỉnh sửa cuối: 29/9/16
  5. khiconmtv

    khiconmtv Sinh viên năm IV

    Chắc engine của nó có liên quan hệ thống nên bị nhận dạng (cơ chế nhận dạng text giống như keylog chôm mật khẩu), bạn xem nó báo file nào thì nén file đó lại để backup rồi xóa thử xem chương trình có lỗi gì không, nếu có thì phục hồi lại file đó.
     
  6. quang3456

    quang3456 Lớp 3

    Nó báo luôn file .exe, xóa thì hết chạy, để thì không yên tâm.
     
  7. khiconmtv

    khiconmtv Sinh viên năm IV

    Nó được đánh giá là an toàn, bạn có thể Google các thông tin về nó.
     
  8. khiconmtv

    khiconmtv Sinh viên năm IV

    Test 1 đoạn tiếng Trung phồn thể, đọc từ trên xuống, từ phải sang trái:

    Image 001.jpg

    Kết quả: (nhận dạng đúng chiều)

    黑龍不赴絕心約戰,老遠跑到泰國招惹蚩尤 。
     
    chichi.myluckycharm thích bài này.
  9. quang3456

    quang3456 Lớp 3

    Tôi làm lần 1 thì được, đến lần sau thì không capture text được, phải làm đi làm lại mấy lần mới được 1 lần
     
  10. khiconmtv

    khiconmtv Sinh viên năm IV

    Bạn nhìn lên cạnh trên màn hình, khi nào nó nhận dạng xong thì mới xuất hiện pop-up phần text nhận dạng được, lúc đó thì mới click để copy text.
     
  11. quang3456

    quang3456 Lớp 3

    Cảm ơn bạn. Mà có lúc cái phần được đánh dấu cứ hiện ra mãi không mất đi, ấn ESC thì kết thúc luôn action, bạn có biết vì sao không?
     
    Chỉnh sửa cuối: 29/9/16
  12. hueduc

    hueduc Mầm non

    Ko có cho MAC OS hả?
     

Chia sẻ trang này