Đây là vấn đề các bạn đã nói nhiều năm nay, Cách giải quyết không phải -resize ảnh bằng Image Magick trước khi đóng PDF, mà hôm nay mình muốn giới thiệu với các bạn một “thượng sách” để giải quyết nan đề này. 1. Xử lý PDF bị lệch kích thước trang do ai đó đóng gói sẵn. Áp dụng cho cả true PDF và scan PDF. - Bằng Vui lòng đăng nhập hoặc đăng ký để xem link: Chú ý khung màu xanh, đặt về 0 để file PDF không bị chèn thêm lề quá rộng không cần thiết. 2. Đóng gói trực tiếp từ ảnh gốc ban đầu, không cần resize bằng IM. - Bằng module python Vui lòng đăng nhập hoặc đăng ký để xem link: mở cmd tại thư mục chứa ảnh cần đóng gói, xác định kích thước trang pdf cần thiết, ví dụ đặt cho tất cả các trang pdf thành 5"x7", rồi nhập lệnh theo: Mã: img2pdf -o out.pdf --pagesize 5inx7in *.png Đơn vị là in hay cm gì đều được nha. Thay vì 5inx7in thì có thể 10cmx12cm cũng được. Ngoài ra còn có thể đặt lề cho các trang pdf ví dụ đặt mỗi trang đều có lề 1cm thì thêm luôn vào dòng lệnh: --border 1cm:1cm Mã: img2pdf -o out.pdf --pagesize 5inx7in --border 1cm:1cm *.png => Nghĩa là thay vì dùng IM -resize các trang ảnh rồi mới đóng gói pdf là 2 công đoạn mà vả lại IM resize rất mất thời gian; thì chúng ta đặt kích thước cụ thể cho các trang pdf khi đóng gói bằng module này, cho dù ảnh lớn ảnh nhỏ gì cũng được giữ nguyên kích thước nhưng lại được nằm gọn trong khung kích thước 5inx7in của trang PDF. Và ưu điểm là img2pdf đóng gói cực kỳ nhanh. Sau đó thêm mục lục hay nén bằng Acrobat nữa là xong.
Nghiêng thì chắc là pdf scan nhỉ? Dùng Abbyy bạn nhé, phần xử lý ảnh, có mục deskew ý. Acrobat vẫn được, OCRmyPDF nữa. Cho mình nợ bài tut sau vậy.
Bạn hướng dẫn luôn có phần mềm nào chỉnh phần các chữ trong pdf scan ở các trang luôn ở trung tâm hàng loạt được ko? (Pdf scan có những trang chữ ra tận mép trái, có những trang ra tận mép phải không ở chính giữa trang).
Cách xử lý thì có 2, hoặc là dùng scantailor chạy crop lề sát nội dung, hoặc là dùng acrobat bổ sung lề toàn bộ rồi lại crop theo chẵn lẻ phần lề rộng hơn.
Bạn nào xài Vui lòng đăng nhập hoặc đăng ký để xem link thì dùng tính năng resize thử. Thích hợp cho việc xử lý PDF bị lệch kích thước trang do ai đó đóng gói sẵn (mục 1 ở trên bài). Thường PDF mình dùng hay bị lệch kích thước một vài trang thì mình chọn kích thước của 1 trang chuẩn và áp lên mấy trang bị sai kích thước. Nếu bạn nhập kích thước bằng tay bằng inch hoặc cm mà sau khi chỉnh xong vẫn bị lệch so với các trang khác thì chọn thử point vì point là đơn vị nhỏ nhất trong quản lý kích thước PDF nên chính xác hơn là dùng cm hay inch.
Bạn cho mình file mẫu để mình xem cách nào phù hợp hơn nha. Với lại mình cũng chưa có thời gian mở máy tính.
Dùng ScanTailor xong nét chữ sẽ dày hơn (đậm hơn) bản gốc. Có cách nào làm nét chữ mảnh lại không? (Hỏi cho mấy trường hợp bản pdf có sẵn mà chất lượng hơi thấp, độ phân giải kém chứ bản pdf mình tự chụp tự làm thì khỏi).
Có, nếu buộc phải dùng ScanKéo thì mình xuất ảnh tiff màu, không cho ScanKéo làm trắng chi hết. Như vậy ScanKéo chỉ cắt lề cho mình thôi, làm trắng thì để cho IM, IM chỉ cần hạ % của -threshold xuống là nét mảnh lại thôi. Cũng xin lưu ý khi ScanKéo làm trắng, vẫn có tùy chọn để làm mảnh nét ở mục output cuối. Song mình từ lâu đã không làm trắng bằng ScanKéo nữa vì nét của ẻm làm trông có khá "mất gốc". Bổ sung: dùng IM resize ảnh lên 200% rồi làm trắng sao cho nét mảnh như ý muốn trước. Rồi mới cho số png đó vào ScanKéo cắt lề, png monochrome này để cho ScanKéo xử lý sẽ không bị mất chất lượng thêm, trong khi nó đã được nét mảnh như mong muốn ở bước IM rồi.
Mình cũng nghĩ vậy. Trớ trêu là ở năm 2023 chúng ta vẫn không có app nào thay thế được ScanKéo cái khoảng crop lề cực chuẩn như thế.
Cách giải quyết vẫn là -resize ảnh bằng Image Magick trước khi đóng PDF nhưng phải tìm hiểu thêm một chút. Ví dụ: Có 2 file ảnh 01.jpg và 02.jpg cùng độ rộng 1850 nhưng khi đóng gói thành file pdf thì độ rộng các trang không đều nhau Xem các thuộc tính (Properties) của từng file ảnh, nhận thấy mật độ điểm ảnh (horizontal resolution, vertical resolution) của 2 file ảnh khác nhau mặc dù 2 ảnh cùng độ rộng 1850 như hình dưới: --> dùng phần mềm nào đó (Photoshop?) điều chỉnh mật độ điểm ảnh (horizontal resolution, vertical resolution) của file 01.jpg lên bằng với mật độ điểm ảnh của file 02.jpg (96 dpi). Khi đó chiều rộng (và cả chiều cao) của ảnh 01.jpg sẽ tăng lên --> dùng Image Magick resize lại về chiều rộng 1850 rồi đóng gói lại file pdf sẽ có các trang đều nhau. Ảnh và pdf ban đầu trong 2 file rar bên dưới. Kết luận: để file pdf đóng gói từ ảnh (chụp, scan) cho ra các trang đều nhau thì các ảnh đó phải có cùng kích thước (dimension) và mật độ điểm ảnh (resolution). Link tham khảo: Vui lòng đăng nhập hoặc đăng ký để xem link Vui lòng đăng nhập hoặc đăng ký để xem link
Thì đúng là như vậy, nhưng đây chỉ là trung sách như mình đã nói từ đầu. Thượng sách là dùng PDFill, img2pdf, trực tiếp đóng gói 2 cái ảnh đó thành 2 trang PDF đều nhau luôn, không phải qua một bước resize nào cả.
Còn cái mật độ điểm ảnh này mà dùng Photoshop vừa cồng kềnh (bản thân cái Photoshop quá cồng kềnh), vừa không phù hợp xử lý hàng loạt trang ảnh. Thay vào đó dùng AbbyyFine Reader để chỉnh dpi phù hợp hơn tuy vẫn khá cồng kềnh. Không khuyên dùng. Dưới là đóng PDF với 300 dpi: Còn dưới là đóng theo kích thước cố định 6.167 x 10.3 inch : Xem đính kèm, đổi đuôi rar thành pdf. File số 1 là dùng PDFill đóng theo 300 dpi. File số 2 là dùng PDFill đóng theo kích thước 6.167 x 10.3 inch. Lý do mình không thích resize là vì lạm dụng sẽ giảm chất lượng ảnh và ĐẶC BIỆT là LÂU. Ai resize thường xuyên sẽ tự biết nó mất thời gian như nào, bào mòn thể lực máy tính dữ lắm. Tóm lại là vẫn không cần resize.