PC Orpalis PDF OCR Pro - Biến PDF ảnh thành PDF copy text

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi khiconmtv, 15/9/16.

  1. khiconmtv

    khiconmtv Cử nhân

    Thấy hấp dẫn chưa? :D

    Bình thường những phần mềm OCR như ABBYY sẽ chuyển PDF sang Word (Doc/Docx), nhưng thằng này vẫn sẽ là file PDF như file gốc nhưng ta sẽ copy được text.

    File PDF gốc là file scan nên các trang nội dung là hình ảnh, không copy text được.
    Image 003.jpg

    Sau khi dùng Orpalis PDF OCR Pro thì như thế này, bôi đen văn bản và copy được text ngon lành.
    Image 002.jpg

    Như hình trên thì tỷ lệ chính xác cho tiếng Việt là hơn 90%.

    Giao diện chương trình:
    Image 001.jpg

    Bản free không hỗ trợ tiếng Việt, chỉ có bản Pro mới có (hơn 60 ngôn ngữ). Nó hỗ trợ hơn 100 định dạng nguồn (PDF, JPG, PNG, BMP...) nên thoải mái xử lý khỏi cần convert file nguồn. File hoàn tất sẽ là PDF.

    Download:
    Orpalis PDF OCR Pro 1.1.6 Portable
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
    Chỉnh sửa cuối: 26/4/17
  2. khiconmtv

    khiconmtv Cử nhân

    À, nói thêm là cái này giúp giữ được file PDF như sách gốc mà mình vẫn search được nội dung, tra từ điển luôn nhé.
    Lưu ý là chỗ chọn file gốc (Source) mặc định nó là chọn nguyên thư mục, vào Options mục Input Mode chọn lại kiểu chọn file hoặc kéo thả...
    Ngoài ra máy tính nào mạnh muốn soft nó chạy nhanh thì chỗ Threads chọn Multi.
     
  3. angoc1234

    angoc1234 Lớp 2

    Cái file patch . keygen làm sao đây a.
     
  4. khiconmtv

    khiconmtv Cử nhân

    Copy vào thư mục cài rồi chạy nó, cho nó patch là xong.
     
  5. HaiTrungHuy

    HaiTrungHuy Mầm non

    Cái này với ABBYY Fine Reader thì cái nào hơn vậy bác?
     
    tungpham2610 thích bài này.
  6. khiconmtv

    khiconmtv Cử nhân

    ABBYY là OCR rồi chuyển sang Word, còn cái này nó thêm layer text vào file PDF.
     
    tungpham2610 thích bài này.
  7. tran ngoc anh

    tran ngoc anh Sinh viên năm IV

    ABBYY vẫn có thể thêm player text vào pdf y chang anh này mà khiconmtv.
     
  8. maxiqboy

    maxiqboy Lớp 3

    Có cách nào mà thêm layer text đồng thời giảm tải được ebook đi không ạ ?

    Em thấy có nhiều cuốn, nó thay thế hoàn toàn đoạn ảnh text bằng text thật luôn, zoom ra vẫn nét.

    Dạng file này thì dung lượng siêu nhỏ chứ không phình tướng như pdf scan khác ạ
     
  9. khiconmtv

    khiconmtv Cử nhân

    True text thì dung lượng nhỏ, còn là file image thì là bitmap nên dung lượng lớn.
    Text thì mỗi ký tự unicode nó chỉ có 16bit thôi, nhưng nếu là hình bitmap thì tùy độ phân giải của hình mà ký tự đó từ vài byte tới vài chục KB. Chưa kể một trang text thì nó chỉ tính dung lượng của ký tự, còn một trang ảnh nó tính luôn dung lượng của nền, nền trắng thì nhẹ nhất, nhưng chỉ cần cho nó xám một chút là đã tăng dung lượng lên rồi.
     
  10. buoncuoivaihaha

    buoncuoivaihaha Mầm non

    Không patch được là sao anh khiconmtv. Copy vào thư mục cài đặt, chạy file patch, Hiện lên cái hình gấu trúc Panda, xong...không biết làm gì tiếp...:(
     
  11. khiconmtv

    khiconmtv Cử nhân

    Có nút Patch đấy, nhấn nó đợi nó báo xong thì nhấn Close.
     
  12. buoncuoivaihaha

    buoncuoivaihaha Mầm non

    Winxp sp3. Ko thấy nút bấm nào ạ! image.jpeg
     
  13. khiconmtv

    khiconmtv Cử nhân

    Vậy là do Windows rồi. Phải có 3 nút, đằng này chữ nó nhảy lung tung kìa...:confused:
     
  14. khiconmtv

    khiconmtv Cử nhân

    Xài portable thử xem, mới up link ở post 1 đấy.
     
    buoncuoivaihaha thích bài này.

Chia sẻ trang này