Thảo luận Edit một file scan pdf có dễ không?

Thảo luận trong 'Bàn Trà' bắt đầu bởi 4DHN, 14/10/19.

Moderators: amylee
  1. 4DHN

    4DHN Tiêu Dao

    Đúng ra topic này nên đặt ở Hướng dẫn chung, nhưng tôi thấy mọi người thích bóng bàn (đánh qua, đỡ lại) hơn (thực tế nhiều topic hướng dẫn rất nghiêm túc đã xảy ra) nên tôi để đây cho vui. :D

    Cụ thể tôi ghi lại quá trình dùng Vui lòng đăng nhập hoặc đăng ký để xem link, Vui lòng đăng nhập hoặc đăng ký để xem link để xử lý file:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    thành:
    Vui lòng đăng nhập hoặc đăng ký để xem link

    Đầu tiên cần download Acrobat DC Portable 15.009.20079 Lite, chạy file đó sẽ ra một folder, trong folder đó mở file AcrobatPortable.exe, rồi theo đường File/Open... dẫn đến file bạn cần xử lý, trong trường hợp cụ thể này là file Vui lòng đăng nhập hoặc đăng ký để xem link

    Bước 1: Xuất file ảnh từ pdf, như hình dưới đây. Ảnh cần xuất vào một folder tạo từ trước:

    [​IMG]

    Bước 2: Tạo một project của Scantailor. Cài đặt Scantailor, khi mở chương trình sẽ có giao diện như hình minh họa. Bấm vào New Project:

    [​IMG]

    Sau đó dẫn đến folder hình ảnh đã tạo ra ở bước trên, bấm OK, rồi ở ô Files in project bấm Select All. Nhấn nút OK phía dưới. Ở bước này có thể chọn thêm Fix DPI, even it looks OK, có thể xảy ra trường hợp chữ sau này sẽ đậm hơn bình thường. Nên test cả quá trình trước độ chục hình để xác định quy trình tối ưu nhất.

    [​IMG]


    Ở góc trên bên trái, từ 1 đến 6 là những chức năng của chương trình, cụ thể thế nào xem trong Vui lòng đăng nhập hoặc đăng ký để xem link.

    Vì hình đã đúng chiều nên tôi chọn 2 luôn, vì là trang đôi nên ở Page layout tôi chọn cái thứ 3, rồi bấm nút tam giác (hình giống như nút play):

    [​IMG]

    ....và phần mềm sẽ cắt hình đôi thành hình đơn:

    [​IMG]

    Chạy xong 2 thì chạy tiếp 3 (chỉnh các khung chữ ngay ngắn), nhớ chọn Aply to... All pages - các bước sau đều thế nhé. Nếu chạy xong có hình nào bị nghiêng:

    [​IMG]

    ...thì điều chỉnh thủ công:

    [​IMG]

    Tiếp theo là chọn vùng text, chạy xong mà có hình nào không khớp sát vùng text:
    [​IMG]

    ... dùng thủ công xử lý, có khi cả 3, 4 cạnh đều sai:
    [​IMG]

    Tạo lề mới cho trang. Bấm chuột vào Top/Botom Left/Right để điều chỉnh bề rộng:

    [​IMG]

    Bỏ dấu tích ở ô Alignment:
    [​IMG]

    Xuất hình ra, ở đây có 3 chế độ, nói chung về text cần chọn Black and white, hình minh họa màu chọn Mixed hoặc Color/Grey:
    [​IMG]

    Hình xuất ra ở folder Out trong folder hình gốc.

    Cần lưu project lại để sau này xử lý thêm lỗi các hình lẻ khi cần và nhiều khi phải buông máy để chạy đi kiếm cơm, bạn giục đi nhậu, có người giục đi ngủ....

    [​IMG]


    Lưu ý: Có thể quay trở lại từng bước trước ở từng hình riêng lẻ để xử lý thủ công nếu có hình nào chưa được như ý muốn, ví dụ: cắt hình đôi sai, phạm vào vùng text, chọn sai vùng text, cần hình màu chứ không phải hình đen trắng...

    Đến đây cơ bản là xong phần Scantailor.

    ... Phần đóng ebook bằng AcrobatPortable sẽ viết sau, tiếp tục câu view... :D
     
    Chỉnh sửa cuối: 15/10/19
    Yan Yuan, Forest and tran ngoc anh like this.
  2. Trechantrau9x

    Trechantrau9x Mầm non

    e cũng đang muốn xử lí một file như vậy, nhưng chưa làm được, mong được thấy quá trình xử lí của a
     
  3. inno14

    inno14 Lớp 8

    Tất cả PDF em từng xử lý cho cá nhân và cho nhóm chỉ dùng duy nhất 1 phần mềm Abbyy. Lần đầu có thể cảm thấy không thuận tay lắm và ngó nghiêng muốn xài thêm phần mềm khác hỗ trợ. Nhưng may mắn là mình quyết tâm, nên cuối cùng chỉ với Abbyy thôi đã có đc PDF đủ làm hài lòng bản thân và thao tác thuần thục :D
     
    kenjikama thích bài này.
  4. 4DHN

    4DHN Tiêu Dao

    ABBYY cũng hay lắm vì những tính năng (chỉ xét riêng trong lĩnh vực hình ảnh): crop, chỉnh hình méo, tăng level, xóa vết bẩn, làm trắng... Tôi cũng dự định bàn cụ thể, kỹ càng từng tính năng một trong topic này, sau khi trình bày về Scantailor và Adobe Acrobat Pro (sẽ cập nhật ở post trên). Nói về các phần mềm phụ trợ cho làm image pdf thì ngay cả Paint của Windows cũng rất hữu ích trong một số trường hợp, cũng sẽ nói rõ cụ thể sau. :D
     
  5. 4DHN

    4DHN Tiêu Dao

    Đang bận quá, chưa có nhiều thời gian để ngồi máy tính. Mới tạm up lên #1 một số hình ảnh, chưa có nội dung.

    Tin rằng khi hoàn thành sẽ có thêm nhiều chuyên gia mới về scan pdf. :D
     
    svcntnk42a1 thích bài này.
  6. svcntnk42a1

    svcntnk42a1 Lớp 5

    Bác @4DHN có thể giúp mình làm cuốn này được không ạ. Mình đã thử mà xấu hoắc à, không cần đẹp lắm chỉ cần dễ đọc là được rồi ạ.
    Link file ảnh: Vui lòng đăng nhập hoặc đăng ký để xem link
     
  7. svcntnk42a1

    svcntnk42a1 Lớp 5

    Bác thay đổi quyền xem ảnh đi ạ, mấy ảnh bác up cái xem được cái không đó ạ.
     
    4DHN thích bài này.
  8. 4DHN

    4DHN Tiêu Dao

    File này cần xử lý bằng ABBYY trước (làm thẳng dòng, chỉnh ảnh minh họa bị méo và xử lý thành 300dpi...), rồi xuất ra ảnh tiff, sau đó dùng Scantailor để crop file tiff, rồi dùng Acrobat DC Portable 15.009.20079 Lite đóng ebook.

    Làm thử 2 chương thôi nhé. Ảnh bạn chụp khá xấu: méo, nghiêng, trang sách cong... cho nên phải dùng tay hơi bị nhiều. Ảnh chụp đẹp thì xử lý tự động được nhiều hơn. :D
     

    Các file đính kèm:

  9. 4DHN

    4DHN Tiêu Dao

    Trên post #1 tôi đã tạm viết xong phần chạy Scantailor, tất nhiên chỉ những thứ cơ bản, chi tiết hơn thì nhường các vọc sỹ. :D
     
  10. tran ngoc anh

    tran ngoc anh Cử nhân

    Tve4u có rất nhiều cao thủ về xử lý PDF ảnh lắm anh Tư. Thấy được sản phẩm của họ đẹp. Chứ ít khi thấy họ lộ diện :D
     
    4DHN thích bài này.
  11. tran ngoc anh

    tran ngoc anh Cử nhân

    Kinh nghiệm là nên vào ngay số4 select content mà chạy. Vì cả cái project, trước khi cuối cùng chạy xuất ảnh kết quả thì phần mềm chỉ yêu cầu tối thiểu một lần chạy thôi. Khi chạy từ số 4, 3 giai đoạn đầu cũng được xử lý cùng lúc, nhưng không ảnh hưởng tốc độ, nếu ta chạy lần lượt từ 1 đến 4 thì phải ngồi canh để bấm 4 lần. Nhưng chạy ngay từ 4 thì chỉ cần 1 lần bấm rồi bỏ đi làm chuyện khác.
    Một ý nữa là nên cắt trang và xoay bằng abbyy trước, vì dù gì thì cũng cần một app khác để có ảnh cho scantailor xử lý, nên hãy xuất ảnh bằng abbyy, song song đó cũng là vì abbyy trẻ trung xử lý cắt và xoay trang nhanh hơn ông cụ scantailor nhiều. Thứ ba nữa là với những trang scan có rìa nhiều như cuốn này. Rõ ràng là khi scantailor chạy cắt đôi, nó không thể cắt bỏ các mép rìa đó, dẫn đến bước sau khi select content kết quả là chọn sai vùng text rất nhiều (gần như là toàn bộ mép phải, như trường hợp cuốn này, sửa tay là mệt xỉu luôn). Nhưng nếu đã được cắt đôi trước ở abbyy thì khi scantailor cắt, có thể chọn chế độ cắt là cắt rìa, thì mỗi trang lúc này sẽ được giữ lại phần chính, cái phần rộng hơn ấy, và bỏ đi phần rìa. Lạ một cái là chỉ như vậy thôi mà select content chuẩn lại liền. Bởi vậy ở đây có một mẹo là khi select content bị không bám sát khung text thì quay lại bước cắt, kéo sát vết cắt lại gần mép khung text rồi quay lại bước select content thì khung text sẽ được xử lý bám sát tự động. Thao tác như vậy để tiết kiệm thời gian sửa khung text thủ công.
    Và cuối cùng. Không nên dùng acrobat để đóng gói PDF. Không vì lý do nào chuyên môn cả :D chỉ lại là abbyy trẻ trung vẫn vượt trội ông cụ acrobat về khoảng tốc độ ra file PDF nhé. Thật ra vẫn còn một app khác đóng pdf còn nhanh hơn cả abbyy, mà còn đóng được những file PDF khổng lồ hàng GB dạng ảnh chụp bằng điện thoại, ảnh gốc luôn ý nên nó nặng lắm. Nhưng anh này không quen biết với anh em nhà tiff, tif nên thôi. :D
    Sau đó thì quăng PDF từ abbyy qua cho acrobat để nén lại thôi, và cũng để thêm lề trang cho nó đồng bộ với size bìa.
     
    4DHN thích bài này.
  12. 4DHN

    4DHN Tiêu Dao

    Tất nhiên đã có rất nhiều, anh Tư mong sẽ có thêm rất nhiều. :D
     
  13. 4DHN

    4DHN Tiêu Dao

    Scantailor hay nhất ở select content (4) và margin (5), nó crop ảnh cực kỳ thông minh, lề đều tăm tắp và có thể điều chỉnh độ rộng lề tùy ý, thậm chí lề = 0. ABBYY thì lại mạnh ở xoay đứng hình (cái này của scantailor kém), chỉnh hình méo, làm thẳng dòng chức năng tăng level cũng rất hay[*]. Nói chung cần kết hợp các phần mềm trong những trường hợp cụ thể để đạt hiệu quả cao nhất.

    Vì chưa kịp viết đến phần ABBYY nên chưa kịp nói về cái hay, cái mạnh của ABBYY. :)

    [*] Hồi anh Tư chế bộ đồ chụp sách gặp trường hợp ánh sáng không đều trên trang sách, dù đã cực kỳ cẩn thận, chụp dưới ánh sáng ban ngày, chọn vị trí tốt. Ảnh xuất ra (đã dùng cả ABBYY, lẫn Scantailor xử lý) vẫn bị mất, mờ một số chữ. Chụp đi chụp lại mà hiệu quả không hơn được nhiều lắm. Cuối cùng, chỉ cần tăng level lên chút ít là xong.
     
    nhat1395 and tran ngoc anh like this.
  14. inno14

    inno14 Lớp 8

    Anh Tư mở topic này là hay quá rồi, em cũng mong diễn đàn có thêm nhiều thật nhiều chuyên gia PDF scan. Pdf scan tốt thì để đọc hay làm gì cũng sẽ thuận tiện và... sướng :D
     
    tran ngoc anh and 4DHN like this.
  15. 4DHN

    4DHN Tiêu Dao

    Đã xong toàn bộ, khá vất vả vì phải dùng tới 5 phần mềm: ABBYY 12, Scantailor, AcrobatPortable, MS Paint - dùng để đẩy số trang vào cho gọn, Images Resizer - dùng để đồng bộ hóa kích cỡ ngang ảnh minh họa màu.

    Vui lòng đăng nhập hoặc đăng ký để xem link.
     
  16. duckhai2691

    duckhai2691 Lớp 3

    Mình mạn phép Bác 4DHN tút lại thêm 1 chút, cho sách được hoàn chình hơn tí . Xin gởi lại các bác :

    Lan dau thay trang-Vo dieu Thanh.pdf-9,4mb

    Vui lòng đăng nhập hoặc đăng ký để xem link

    Nếu bác nào thích tối ưu dung lượng cho nhỏ lại hơn, xin theo hướng dẫn của bác Ngoc Anh và 4DHN heeeeeeeeeee, mình lại không làm được cái công đoạn này heeeeeeeeeeeee, học mãi mà vẫn làm chưa được đây.

    Bác svcntnk42a1 nh7 là người có rừng , Bác 4DHN như người phá rừng chặt rẫy, cưa, gom, đốt.......... mình chỉ là người đi thu dọn tàn dư lại lần cuối cho sạch sẽ trước khi giao đất lại cho các bác trồng trọt heeeeeeeeeeeeeeee. Xin cám ơn bác 4DHN và svcntnk42a1 rất nhiều ạ
     
    hungbc1010 and 4DHN like this.
  17. 4DHN

    4DHN Tiêu Dao

    Tôi chưa biết nhiều về PS, được bác giúp thêm cho thì tốt quá.

    Để rảnh rảnh làm tiếp cuốn Bí ẩn nĩa ba răng của bạn Giang để lấy tư liệu cho việc sử dụng ABBYY, đặc biệt chức năng chỉnh hình méo. :D
     
    duckhai2691 thích bài này.
  18. 4DHN

    4DHN Tiêu Dao

    Có thêm một câu hỏi hơi ngoài lề là bạn chụp sách bằng điện thoại gì thế?
     
    tran ngoc anh thích bài này.
  19. vaymuc

    vaymuc Lớp 1

    Không có ý gì, chứ mình thấy bạn edit sách thì sách còn nát hơn ấy chứ. Mục đích bạn edit sách để làm gì ?
     
  20. putin503

    putin503 Lớp 1

    Anh 4 nội công thâm hậu hỏi 1 câu làm em sướng quá đi (có dịp giải đáp cho anh 4 "thâm hậu").
    Mạn phép tác giả em trả lời anh 4 : Iphone X dual camera đấy anh ạ .
    Máy xịn chụp ra vậy chắc do bố trí, ánh sáng ... thôi.
     
    4DHN thích bài này.
Moderators: amylee

Chia sẻ trang này