PC Scantailor - Tổng hợp các nhánh đang phát triển trên Github

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi tran ngoc anh, 13/8/23.

  1. tran ngoc anh

    tran ngoc anh Cử nhân

    [​IMG]

    Vui lòng đăng nhập hoặc đăng ký để xem link là một huyền thoại, song bản gốc đã dừng phát triển. Mã nguồn của bản cuối cùng Vui lòng đăng nhập hoặc đăng ký để xem link phát hành ngày 02/05/2016 trên github, nhưng họ không phát hành file cài đặt. Bản Vui lòng đăng nhập hoặc đăng ký để xem link phát hành trước đó vào ngày 07/04/2014 mới có file cài.

    Nay mình muốn làm một tổng hợp nhỏ các nhánh của Scantailor gần đây, ít nhất cũng có bản phát hành trong đôi ba năm đổ lại, thêm một vài tính năng nhỏ thuận tiện hơn, một vài phương pháp threshold mới.

    Điểm hay ho của "nguồn mở" là có tính kế thừa, ai biết mã có thể phát triển thêm, hoặc biến thành một nhánh mới với một cái tên mới. Mã nguồn đóng thì không, một khi chết là hết. Dưới đây là những nhánh con nổi bật của gốc mẹ Scantailor:

    I. Scan Tailor Experimental: bản thử nghiệm.
    1. Mở nhánh là Tulon: phân nhánh trực tiếp từ Vui lòng đăng nhập hoặc đăng ký để xem link, chỉ hỗ trợ Win, thử được 2 năm thì nghỉ thử, cập nhật cuối tháng 02/2016 :D. Vui lòng đăng nhập hoặc đăng ký để xem link.
    2. Bản của ImageProcessing-ElectronicPublications: cập nhập hôm qua nhưng chưa chịu dựng bản cài. Kéo xuống cuối trang phát hành thì có bản cài được gắn thẻ 0.2017.04.10 trông như từ năm 2017 nhưng lịch sử tập tin cho thấy được cập nhật 2 tuần trước, khá mới. @Anan Két đã cài bản này và xác nhận có tính năng mới rất ổn. Nhưng mà thử nghiệm gì từ 2014 đến giờ chưa nghỉ thử :D. Vui lòng đăng nhập hoặc đăng ký để xem link.
    II. Scantailor Experimental PDF (tạm gọi)
    1. Bản của subjut: có tên là scantailor-pdf, tạm gọi Experimental luôn, vì hắn bảo đây là bản “Experimental” của Experimental của Tulon mà. Chỉ có 1 bản phát hành duy nhất vào tháng 07/2019, đặc biệt hỗ trợ đầu vào PDF. Vui lòng đăng nhập hoặc đăng ký để xem link.
    Ghi chú: nhưng mà thực tế nhập PDF bị văng app, tính năng không hoạt động.
    III. ScanTailor Universal
    1. Mở nhánh là trufanov-nok: có vẻ như phân nhánh từ bản Experimental của Tulon theo như phần giới thiệu lịch sử và tính năng. Tên là Universal nhưng cũng chỉ hỗ trợ Windows và Ubuntu, chuyến này Ubuntu bị các distro Linux khác chửi thầm cho coi :D cập nhật cuối vào tháng 10/2021. Vui lòng đăng nhập hoặc đăng ký để xem link.
    2. Bản của ImageProcessing-ElectronicPublications: lại là anh chàng ImageProcessing-ElectronicPublications này. Cập nhật cuối vào 2 tuần trước. Vui lòng đăng nhập hoặc đăng ký để xem link.
    Ghi chú: mình cài cả 2 bản Universal này trên Win11 đều không mở được, cần một bạn thử trên các bản win khác.​

    IV. ScanTailor Advanced
    1. Mở nhánh là 4lex4: kế thừa mã nguồn từ Experimental của Tulon, với một vài nâng cấp, sửa đổi, 4lex4 duy trì khoảng 3 năm đến tháng 08/2019 thì dừng, chỉ hỗ trợ Windows. Vui lòng đăng nhập hoặc đăng ký để xem link.
    2. Bản của ScanTailor-Advanced: phân nhánh từ bản số 6 của 4lex4 và chỉ hỗ trợ Win 64bit, cập nhật cách đây 1 tháng. Vui lòng đăng nhập hoặc đăng ký để xem link. Ghi chú: từ bản này đổ xuống, tính năng chọn xuất 1200dpi được đưa trực tiếp vào bảng chọn. [​IMG]
    3. Bản của yb85: lấy nguồn từ bản số 2 để xây dựng file cài cho macOS, cập nhật cuối tháng 05/2022, chỉ biên dịch trễ 1 bản thôi. Vui lòng đăng nhập hoặc đăng ký để xem link.
    4. Bản của ImageProcessing-ElectronicPublications: lại phân nhánh từ bản số 2, dường như hỗ trợ cho cả Win và Linux, cập nhật cách đây mấy tuần. Vui lòng đăng nhập hoặc đăng ký để xem link.
    Ghi chú: Từ bản số 2 về sau, Advanced có một dàn nút đứng cho các công cụ như di chuyển trang lên xuống, chế độ thumbnail dạng lưới...
    [​IMG]
    Cập nhật: sau khi test qua các bản, mình chọn dùng ScanTailor Advanced, mới hơn, nhiều tính năng hơn, đặc biệt có dùng macOS cũng được hỗ trợ :D

    Các bạn cùng thử nhé, xem bản nào tính năng đáp ứng tốt nhu cầu của các bạn ấy, rồi tốc độ xử lý nữa, với lại cứ ai phát hành sau mà dùng, phần mềm mà càng mới thì càng ngon :D

    Sau một lượt tìm hiểu về scantailor mới biết mấy dự án scan sách của Internet Archive và Google book cũng dùng cái app nặng chưa đầy 10 MB này, nguồn mở là một sự cho đi không vụ lợi, tác động của nó quả thực vô cùng to lớn.

    Nhắn @amylee tạo giúp mình cái tag scantailor, nhắn @machine xem link tải ở đây rồi viết tut so sánh cảm nhận đi nhé, cụ với @Anan Két mê mẩn cái cây kéo này, ngày đêm cận kề thì còn ai viết tut hợp lý hơn nhị vị nữa chớ! :D :)
     
    Chỉnh sửa cuối: 28/12/23
  2. machine

    machine Sinh viên năm I

    Scan Tailor Advanced tui xài 1 lần rùi bỏ vì nó không có tính năng nắn thẳng trang sách cong.
    Mục đích của tui là nắn thẳng trang sách cong nên chủ yếu dùng Scan Tailor Experimental. Do chủ yếu chụp sách trong điều kiện thiếu ánh sáng mặt trời :p nên buộc phải dùng Scan Tailor xử lý thêm chớ hông gì.
    Scan Tailor Experimental bản cũ có nhược điểm là gặp trang sách trắng hoặc quá ít chữ là ở bước 3 (Geometric Distortions/Curved lines) nhiều khi nó dừng giữa chừng nhảy ra ngoài luôn nên cũng đau thương lắm :( nhiều khi mất cả tiếng chạy được 600-700 trang rùi nó ngắt lại mất công chỉnh sửa rùi ngậm ngùi chạy lại. Qua được bước 3 thì 3 bước còn lại không có vấn đề gì.
    Bản mới thì để hôm nào tui chụp sách rùi chạy thử một thời gian cái đã :D
     
  3. tran ngoc anh

    tran ngoc anh Cử nhân

    Mới cài em này hồi sáng chưa biết sao nữa, giờ người máy check lại đi chứ cách mấy năm mọi thứ khác lắm. Với lại cái nắn dòng "tự động" thì Abbyy tốt nhất. Sau đó vẫn chưa ưng phải xử lý thêm thủ công thì không tính :D

    À với lại có nhớ lúc trước dùng bản fork nào không? Ở trên có đến 3 bản cho Win, 1 bản macOS đó. Giờ lựa bản mới nhất mà test lại đi.
    Ngã ở đâu chạy tiếp ở đó, không phải chạy lại từ trang đầu đâu nha.
     
    nhanjkl thích bài này.
  4. Anan Két

    Anan Két Lớp 8

    Trên diễn đàn đã có topic Scan Tailor rất chi tiết ở đây :D:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    Nên tụi mình viết thêm sẽ tập trung vào tính năng SC Experimental mà SC đời đầu không có: nắn thẳng khung text bị cong, co kéo khung text các trang cho bằng nhau. Về khả năng tẩy trắng trang sách thì SC làm đẹp hơn Abbyy. Ngoài ra, SC có thể điều chỉnh độ đậm nhạt của text, cái này Abbyy không làm được.
    Cảm ơn bài tổng hợp chi tiết của Ngọc Anh nha :p.
     
    machine thích bài này.
  5. tran ngoc anh

    tran ngoc anh Cử nhân

    Tất nhiên, làm về bản Exp và các bản sau í. :D
    Nhưng mà mình nhớ bản Scantailor gốc ít nhất cũng có thể fix trang méo mó mà ta?
     
    machine thích bài này.
  6. Anan Két

    Anan Két Lớp 8

    Giống y mình :D, thử cài các bản rồi gắn với SC Experimental đến bây giờ.
    Sao mình ít gặp chuyện này nhỉ, mới gặp có 1 lần, chắc do ảnh gốc dung lượng nặng quá nên SC treo và tự động tắt luôn :D. Sau đợt đó, mình luôn lưu project ngay từ đầu, nhưng lại không gặp thêm lần nào nữa :D.
     
    machine thích bài này.
  7. Anan Két

    Anan Két Lớp 8

    SC gốc không có tính năng đó luôn, chỉ SC Ex sau này mới có. Trước đây, mình chưa biết SC Ex, mấy trang có khung text bị méo cũng phải ngậm ngùi để nguyên :D.

    CẬP NHẬT: Xem lại thì SC gốc có tính năng này ở phần Output, do hồi xưa không để ý :D.
     
    Chỉnh sửa cuối: 14/8/23
    machine thích bài này.
  8. tran ngoc anh

    tran ngoc anh Cử nhân

    Bản Advanced không phải tự nhiên mà có tên Advanced, nếu không phải do dev tự nổ :D

    Advanced không kế thừa trực tiếp từ scantailor gốc, mà kế thừa từ bản Experimental của Tulon, đứa con trực tiếp của Tulon-Experimental.
    [​IMG]
    Nên tất nhiên, nếu như 4lex4 không rảnh rỗi loại bỏ các tính năng đó thì Advanced cũng có tính năng sửa trang méo, nắn dòng một cách mặc định :D
    [​IMG]
    Và advanced ở chỗ có thêm mấy cái hay ho như chế độ xem lưới như hình:
    [​IMG]
    Chờ bản review chi tiết hơn của nhị vị :D
     
    machine and Anan Két like this.
  9. tran ngoc anh

    tran ngoc anh Cử nhân

    Không tìm thấy chỗ sửa cong vênh trên bản Experimental:
    [​IMG]

    Ngược lại bản gốc 0.9.11.1 lại có (chỗ chọn dpi cũng linh hoạt hơn):
    [​IMG]

    Bản Advanced cũng có sửa cong vênh, cột thumnnail có thể kéo dãn tùy ý, tính năng mới mà bản gốc và Experimental chưa có, có thể chọn trực tiếp 1200dpi, một cải tiến như đã nhắc đến từ bản fork Advanced số 2 của ScanTailor-Advanced:
    [​IMG]
     
    Chỉnh sửa cuối: 14/8/23
    machine and Anan Két like this.
  10. Anan Két

    Anan Két Lớp 8

    @tran ngoc anh, mình mới tải bản ST Advanced mới nhất thì thấy thêm nhiều tính năng mới như sau:
    — Giữ lại được tính năng sửa dpi đầu vào và đầu ra của SC cơ bản (SC Ex bỏ tính năng này).
    — Thumbnails trang sách có thể hiển thị nhiều cột (2 bản kia chỉ có 1 cột).
    — Có thanh công cụ để đánh dấu trang chú ý, phóng to, thu nhỏ...
    06.jpg
    — Có nhiều tùy chọn về định dạng đầu ra hơn.

    Tuy nhiên, 2 tính năng mà tụi mình cần nhất lại không ổn :D:
    — Không thể co kéo khung text các trang bằng nhau như SC Ex.
    — Phần chỉnh méo được tích hợp ở khâu cuối Output, gây ra nhiều bất tiện:
    + Trang đã thiết lập lề xong xuôi, sau khi chỉnh méo thì lề lại bị sai lệch.
    + Phần chỉnh méo không chạy tự động cả cuốn như SC Ex.
    @machine tải bản này xem thử nhé :p.
     
    Chỉnh sửa cuối: 14/8/23
    machine thích bài này.
  11. Anan Két

    Anan Két Lớp 8

    Chỗ sửa cong vênh trên SC Ex nằm ở bước 3 đó, và có thể bấm để chạy tự động cả cuốn. Tính năng chạy tự động này mình không thấy trên bản SC Advanced :p.
    upload_2023-8-14_10-57-39.png
     
    machine and tran ngoc anh like this.
  12. tran ngoc anh

    tran ngoc anh Cử nhân

    Phần chỉnh méo ở khâu cuối output có từ scantailor gốc cơ, mình đã cài bản gốc và thấy có, như ảnh chụp ở cmt phía trên, Advanced có mà Experimental mình không thấy có ở output quả là lạ. Vì thực ra cả Advanced và tất cả các bản fork phía sau đều từ một gốc Experimental của Tulon mà ra.
    Còn tính năng này mình chưa hình dung ra được, không thấy chỗ chỉnh méo của Experimental nên chưa test được gì :D
     
  13. tran ngoc anh

    tran ngoc anh Cử nhân

    Cái này đúng là nhìn trực quan hơn nè :D
    Cũng vừa để ý Ex bỏ deskew mà tích hợp và bước Geometric Distortions luôn.
     
  14. sucsongmoi

    sucsongmoi Lớp 8

    '-Tính năng chạy tự động này'
    Hình như là có, bạn chéc như hình xem sao?
     

    Các file đính kèm:

    • cong.png
      cong.png
      Kích thước:
      291.3 KB
      Đọc:
      11
    Anan Két thích bài này.
  15. tran ngoc anh

    tran ngoc anh Cử nhân

    Nhìn kỹ hơn vào Advanced: một nùi bảng chọn ở khâu output, cái gì cũng có, vẫn tin yêu Advanced như cái tên mà nó mang theo :D
    [​IMG]
    [​IMG]
    Chỉnh méo mà chạy tự động thì được gì nhỉ? Khác gì auto deskew và auto select content? Như bản gốc và bản Advanced khi xuất ra thấy trang nào méo thì mới chỉnh tay trang đó, phải tự kéo sửa chứ sao phó mặc cho tự động được đúng không? Tự động chỉnh méo thì mình tin vFlat hơn, sau đó cho Abbyy nắn dòng mới là chuẩn nhất, nắn thẳng từng dòng bất chấp khung của khối text thì Abbyy làm rất tốt, SC bản nào cũng không làm được cái này đâu.
     
    Chỉnh sửa cuối: 14/8/23
    Anan Két and machine like this.
  16. tran ngoc anh

    tran ngoc anh Cử nhân

    Đây chỉ là sửa nghiêng thôi, Ex tích hợp vô bước geometric rồi. Cái tự động sửa nghiêng và tự động chọn nội dung là cơ bản từ scantailor gốc rồi.
     
    machine, Anan Két and sucsongmoi like this.
  17. sucsongmoi

    sucsongmoi Lớp 8

    Bản đầu tay, mong các cao nhân chỉ bảo thêm. :D
    Vui lòng đăng nhập hoặc đăng ký để xem link nước.
     
    Chỉnh sửa cuối: 14/8/23
    machine, Anan Két and tran ngoc anh like this.
  18. machine

    machine Sinh viên năm I

    Đẹp đó bạn :D
    Dưới 5Mb thì post trực tiếp được mà: nén pdf thành file zip hoặc đổi đuôi.
     
    sucsongmoi thích bài này.
  19. Anan Két

    Anan Két Lớp 8

    Ảnh chụp bằng điện thoại thường không đều nhau. Nếu dùng chức năng Match size by scaling trong SC Ex thì các khung text các trang nhỏ sẽ được kéo lên cho bằng khung của trang lớn nhất, nên tất cả các trang có khung text bằng nhau:
    07.jpg
    SC cơ bản và Advanced không có tính năng này, dẫn tới Output có kích cỡ bằng nhau, nhưng khung text không đều:
    08.jpg
    Tính năng này cực kỳ hữu ích để chỉnh ảnh chụp ảnh điện thoại, bớt đi công đoạn dùng phần mềm trung gian resize hình :D.
    Các vFlat thường có khung text hình thang, chứ không hoàn toàn là hình chữ nhật (đầu trên thường nhỏ hơn dưới). Vì thế mình có thể chọn chỉnh méo cho cả nguyên cuốn (1 cuốn 500 trang khoảng 1h), đi làm việc khác, rồi sau quay lại kiểm tra. SC tạo khung lưới dựa vào mối tương quan các dòng nên ở những trang ít chữ thì khung lưới này thường không chính xác, mình bỏ khung lưới ở các trang này đi. SC Ex tích hợp phần chỉnh méo vào Output luôn nên hơi bất tiện ở chỗ này :D.
     
    machine, tran ngoc anh and sucsongmoi like this.
  20. Anan Két

    Anan Két Lớp 8

    File đẹp bạn ơi, mà có mấy trang bị lệch nên mất chữ (như tr71), bạn kiểm tra lại xem sao nhé :D.
     
    sucsongmoi and machine like this.
: scantailor

Chia sẻ trang này