Thấy hấp dẫn chưa? Bình thường những phần mềm OCR như ABBYY sẽ chuyển PDF sang Word (Doc/Docx), nhưng thằng này vẫn sẽ là file PDF như file gốc nhưng ta sẽ copy được text. File PDF gốc là file scan nên các trang nội dung là hình ảnh, không copy text được. Sau khi dùng Orpalis PDF OCR Pro thì như thế này, bôi đen văn bản và copy được text ngon lành. Như hình trên thì tỷ lệ chính xác cho tiếng Việt là hơn 90%. Giao diện chương trình: Bản free không hỗ trợ tiếng Việt, chỉ có bản Pro mới có (hơn 60 ngôn ngữ). Nó hỗ trợ hơn 100 định dạng nguồn (PDF, JPG, PNG, BMP...) nên thoải mái xử lý khỏi cần convert file nguồn. File hoàn tất sẽ là PDF. Download: Orpalis PDF OCR Pro 1.1.6 Portable Vui lòng đăng nhập hoặc đăng ký để xem link
À, nói thêm là cái này giúp giữ được file PDF như sách gốc mà mình vẫn search được nội dung, tra từ điển luôn nhé. Lưu ý là chỗ chọn file gốc (Source) mặc định nó là chọn nguyên thư mục, vào Options mục Input Mode chọn lại kiểu chọn file hoặc kéo thả... Ngoài ra máy tính nào mạnh muốn soft nó chạy nhanh thì chỗ Threads chọn Multi.
Có cách nào mà thêm layer text đồng thời giảm tải được ebook đi không ạ ? Em thấy có nhiều cuốn, nó thay thế hoàn toàn đoạn ảnh text bằng text thật luôn, zoom ra vẫn nét. Dạng file này thì dung lượng siêu nhỏ chứ không phình tướng như pdf scan khác ạ
True text thì dung lượng nhỏ, còn là file image thì là bitmap nên dung lượng lớn. Text thì mỗi ký tự unicode nó chỉ có 16bit thôi, nhưng nếu là hình bitmap thì tùy độ phân giải của hình mà ký tự đó từ vài byte tới vài chục KB. Chưa kể một trang text thì nó chỉ tính dung lượng của ký tự, còn một trang ảnh nó tính luôn dung lượng của nền, nền trắng thì nhẹ nhất, nhưng chỉ cần cho nó xám một chút là đã tăng dung lượng lên rồi.
Không patch được là sao anh khiconmtv. Copy vào thư mục cài đặt, chạy file patch, Hiện lên cái hình gấu trúc Panda, xong...không biết làm gì tiếp...