mình gặp file pdf này mà không hiểu là như sao, nhờ mọi người chỉ giáo nhìn rất giống file scan (text bị lem nhem, ảnh của trang tiếp theo mờ mờ phía sau,...) nhưng lại bôi đen copy paste được (cơ mà paste bị lỗi font) vậy đây là kiểu định dạng gì mọi người?
Đây là file scan, file ảnh, sở dĩ chọn text được là nhờ vào chức năng của trình đọc pdf có thể nhận diện đc text
Đây là file scan, sở dĩ chọn được text là do khi đóng file PDF họ có chọn nhúng Text đã OCR vào file.
File scan nhưng được chạy OCR để thêm 1 lớp text. Đây là cách làm nhanh gọn hơn so với làm file text, vừa không lo soát lỗi sai của OCR, vừa vẫn có thể copy 1 đoạn text khi cần, tất nhiên có khả năng gặp từ sai.
Oài... câu trả lời cho bác nằm ở bên thread mà @tran ngoc anh mới trả lời bác đó: Vui lòng đăng nhập hoặc đăng ký để xem link Đây chính là PDF Searchable được tạo ra từ Abbyy Finereader đó bác.
Nhưng em đoán file đó từ internet archive chứ không được đóng bằng Finereader đâu bác. Finereader sản phẩm sẽ trắng đẹp hơn và đặc biệt không lỗi font như mô tả của chủ thread.
Cám ơn bạn, không dùng abbyy nữa nên cũng chỉ đọc lướt qua, vừa search lại định nghĩa thì đúng loại này rồi