Hướng dẫn Một số vấn đề khi làm sách dạng PDF

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi Caruri Tlkd, 6/6/17.

  1. NQK

    NQK Lớp 10

    Bạn hiểu về điện thoại nhỉ. Nói có mấy câu mà toàn cái mình không biết.

    Mình muốn hỏi là cái giá để sách thế nào, bố trí máy chụp thế nào, đèn đóm bố trí thế nào, hiệu quả của hệ thống đó thế nào (tốc độ chụp, chất lượng ảnh, độ đồng đều...). Phần mềm thì mình mua rồi.

    Bạn chụp cho mình hệ thống, ảnh mẫu, sản phẩm mẫu v.v. , nếu tiện.
     
    Chỉnh sửa cuối: 11/6/17
  2. V/C

    V/C Mầm non

    Ác thật.
     
  3. V/C

    V/C Mầm non

     
  4. khiconmtv

    khiconmtv Cử nhân

    Vớ vẩn...
    Tất cả phần mềm liên quan tới chụp ảnh theo camera của ĐT (phần mềm chụp ảnh mặc định hay phần mềm của bên thứ 3) đều tuân theo hàm camera.api đi theo phiên bản Android và model máy. Cho dù có Việt hóa, Lào hóa, sao Hỏa hóa ngôn ngữ cũng chẳng ảnh hưởng gây lỗi. Chưa kể việc ngôn ngữ hóa bản địa từng app cũng phải do đội ngũ lập trình thực hiện, app uy tín của các hãng lớn lại càng phải cẩn thận, không phải thích thì làm.
    Một số máy có tăng cường chất lượng ảnh nhờ phần mềm riêng độc quyền như Sony từng làm thì nếu root máy sẽ làm mất nó, nhưng không đáng kể nếu chỉ chụp đơn giản.
     
    Chỉnh sửa cuối: 11/6/17
    Heoconmtv and inno14 like this.
  5. 4DHN

    4DHN Tiêu Dao

    @Missfly82 Đang bàn về việc: làm sao để cho kích thước các trang pdf (có sẵn) đồng đều, chứ không phải là bàn về nên tạo file pdf từ sách in như thế nào? Vấn đề bạn bàn lạc đề với topic nhé.

    Khi bàn về việc tạo pdf bạn đã gặp trường hợp này chưa: giả sử sách in là một cuốn rất cũ, chất lượng in rất xấu thì bạn làm thế nào để tạo pdf?

    Đây tôi dùng Scan Tailor và ABBYY để tạo pdf từ một file gốc, xem và so sánh chất lượng nhé bạn.

    Vui lòng đăng nhập hoặc đăng ký để xem link, Vui lòng đăng nhập hoặc đăng ký để xem link, Vui lòng đăng nhập hoặc đăng ký để xem link.
     
  6. Missfly82

    Missfly82 Mầm Non

    Mình xin lỗi mấy Bác đã trả lời lạc đề. Còn như Bác hỏi thì mình dùng phần mềm Camscanner, nó làm hết từ a tới z, kể cả sách cũ khi chụp xong tự động scan nhìn trắng như mới, tự động canh chỉnh file ảnh. Nói thì hơi khó hiểu. Nhưng chụp giống như em nói chừng một cuốn là tự khắc hiểu liền. rùi rút kinh nghiệm cuốn sau.
    Chắc Bác nói đúng, mình xài win 7 ultimate 64 bit và điện thoại Note 4 đều hỗ trợ font đa ngôn ngữ nên cảm thấy thế.
    mình không có rườm rà vậy đâu. Mình chỉ lấy cuốn sách ra và đặt dưới thềm. Rùi chụp hình. Còn tất cả việc làm lại đều do phần mềm Camscanner lo hết. Còn thành phẩm thì cuốn 72 tuyệt kỷ. Nếu Bác Thích thì mình gửi link xem. Có gì trao đổi thêm
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  7. NQK

    NQK Lớp 10

    Camscanner ai chả biết. Mình dùng lâu rồi. Thành phẩm của bạn chỉ là một bài quảng cáo. Chụp kiểu gì thì chụp, quan trọng là khi chụp xong, cho chạy ocr, tỷ lệ lỗi nhận dạng cao hay thấp. Nếu chỉ để PDF thì các trang có đồng đều không. Nếu chỉ dùng camscanner để hoàn thiện mà PDF đẹp, đồng đều thì bạn quả là cao nhân.

    Mà Note 4 thì "đa ngôn ngữ", máy nào thì đơn?
     
    Chỉnh sửa cuối: 12/6/17
  8. 4DHN

    4DHN Tiêu Dao

    Camscaner thì tôi cũng dùng từ lâu, trước Vui lòng đăng nhập hoặc đăng ký để xem link rất lâu và hằng ngày dùng trong công việc kiếm cơm. :D Tại đầu đề topic này là: làm sao để chèn thêm ảnh mới vào file pdf có kích thước giống kích thước ở file hiện có nên tôi cũng đóng góp một cách. Chứ không phải là không biết đến những cách khác để làm scan pdf. :p

    P.S Bạn @Missfly82 nên bỏ bớt sự quan trọng hóa, bớt đao to búa lớn trong những vấn đề bạn trình bày. Hãy đơn giản hóa, nhẹ nhàng hóa mọi chuyện. :)
     
  9. Missfly82

    Missfly82 Mầm Non

    Dạ, chẳng có gì. Xưa giờ biết gì nói nấy. Còn Mấy Bác nói thế thì em chịu. Người Việt Nam đều hay như thế cả. Chờ nói ra xong, đều bảo biết rùi. Bài đăng đầu tiên trong topic em cũng chả lời mấy phần mềm đưa ra đều làm được. Còn em chỉ trả lời theo kinh nghiệm nhận thức bản thân thôi. Còn làm được hay không được thì tùy theo đánh giá. Em thì chỉ học hỏi. Cảm ơn mấy Bác đưa ra đánh giá Bản thân em. Em rút kinh nghiệm trong lần tới.
    Còn những câu hỏi trên thì chỉ cần gõ vào google.com.vn là sẽ ra thui.
     
  10. 4DHN

    4DHN Tiêu Dao

    Bạn không theo dõi các topic khác à? Về Camscaner và các phần mềm tương đương thì đã có topic bàn từ lâu. Bạn biết thì mọi người cũng biết và chắc gì bạn đã biết nhiều hơn người khác. Trong cách nói chuyện của bạn, không thể hiện sự khiêm nhường, bạn làm như mỗi bạn biết về nó ấy.
     
    tran ngoc anh thích bài này.
  11. Missfly82

    Missfly82 Mầm Non

    Sao Bác lại nói thế? Bắt đầu tham gia topic, mình chỉ trả lời những câu hỏi thôi. Còn câu nào của Bản thân thì để riêng ra không trích dẫn. Còn ngữ khí hay câu nghĩa do mỗi người suy nghĩ. Thật sự, từ đầu mình tôn trọng Bác chưa bao giờ suy nghĩ như Bác nói. Mình cũng không trình bày mọi việc đao búa. Đó chỉ học hỏi và kinh nghiệm của bản thân từ xưa đến giờ.
     
  12. 4DHN

    4DHN Tiêu Dao

    Bạn đọc lại chữ tôi tô đậm kia, còn nhiều câu tương tự nữa.

    Bạn thử nghiên cứu Vui lòng đăng nhập hoặc đăng ký để xem linktrong này tôi dùng cả Camscaner và Microsoft Office Picture Manager để xử lý hình ảnh minh họa cho một ebook. Chắc phải đợi bạn nói thì chúng tôi mới biết về Camscaner sao? Bạn cứ việc trình bày cụ thể cái bạn biết, nhưng nên bỏ cái giọng kẻ cả, coi thường những người khác.
     
    tran ngoc anh thích bài này.
  13. 4DHN

    4DHN Tiêu Dao

    Về Camscaner có topic này (upload hình xong thì bận tối mắt nên tôi chưa viết lời - sau không thấy ai thắc mắc nên lại thôi không viết nữa):

    Vui lòng đăng nhập hoặc đăng ký để xem link (4DHN, Mar 10, 2016)

    Viết ra có mấy mục đích:
    - Giới thiệu một phần mềm hay, chứ không phải để khoe khoang kiến thức.
    - Lấy chỗ để bàn luận về nó để cùng nhau hiểu sâu hơn và có thể bàn sang cả những phần mềm khác hay hơn...
     
    tran ngoc anh and Missfly82 like this.
  14. Missfly82

    Missfly82 Mầm Non

    Cho mình nói lại vấn đề này nhé. Không lại gây nhầm lẫn giữa chúng ta. có thể chúng ta xuất phát không đồng một quan điểm chăng?
    Mình đọc kỹ lại từ bài post 3 phần mềm ra đến bài Về Camscaner ở trên thì mình làm quy trình ebook: chụp hình trên điện thoại bằng phần mềm Camscaner, sau đó chuyển qua orc bằng ABBYY với việc nhắc nhở từ Bác @4DHN(Đang bàn về việc: làm sao để cho kích thước các trang pdf (có sẵn) đồng đều, chứ không phải là bàn về nên tạo file pdf từ sách in như thế nào? Vấn đề bạn bàn lạc đề với topic nhé.). Riêng mình sử dụng font đa ngôn ngữ thì làm ebook(không phải là ebook scan) ít lỗi chữ hơn vì nó đồng bộ do có sẵn chữ Việt Nam.
    theo cách nói @NQK tạo ra một ebook scan. Phải có kỹ thuật chỉnh sửa file ảnh giỏi như Bác @Vui lòng đăng nhập hoặc đăng ký để xem link , @4DHN hay anh Ngô Đức Khải... Chứ không phải là ebook dạng chữ.
     
  15. 4DHN

    4DHN Tiêu Dao

    Bạn vẫn chưa hiểu vấn đề. Tôi lấy post này nhé.
    Post này của bạn nếu bỏ câu cuối đi thì OK, vì những phần mềm bạn dùng thuộc loại rất thông dụng. Câu bạn viết thêm nó có tính tự đề cao mình, và có thể gây khó chịu cho những người khác. Những post khác của bạn cũng có những câu gây khó chịu tương tự. Những phần mềm này thì bất cứ người làm ebook nào cũng đã vọc qua. Riêng về Calibre thì tôi thấy chưa ai qua nổi bạn @NQK.

    Tất nhiên nếu đi sâu vào từng tính năng cụ thể thì sẽ có thể tìm ra chức năng cần cho một mục đích nào đó, ví dụ như đề bài của topic này. Nếu bạn biết thì bạn chỉ ra thật cụ thể, như bạn @inno14 đã làm trên kia chẳng hạn.

    ABBYY là một phần mềm dùng để chuyển dữ liệu dạng hình ảnh sang dạng text, cái này ai cũng biết. Nó có thể xuất ra dạng scan PDF và có một số tính năng tương tự Scan Tailor. Nhưng vì nó "nhận dạng" xong mới xuất ảnh ra cho nên những chỗ mờ, tối, sáng quá trong ảnh sẽ bị vỡ chữ. Vì thế ABBYY không phải là một phần mềm tạo scan pdf tốt.

    Cũng cần hiểu rõ là khi tôi nói về một phần mềm ở một tính năng cụ thể là tôi đang đánh giá nó chứ không đánh giá bạn. À, tôi có đánh giá bạn thật, nhưng ở những câu bạn viết thêm một cách "dại dột" cơ.
     
    Missfly82 thích bài này.
  16. NQK

    NQK Lớp 10

    Font bạn dùng là font gì thế? Tên font ấy. Máy thì mình biết là Note 4 bản quốc tế đa ngôn ngữ không làm tiếng việt ở Việt Nam rồi (bản đặc biệt này mình không nhớ có chuẩn không).
    Tiêu đề bài viết đang là pdf (thiếu mỗi chữ scan), nội dung cũng làm về scan mà. Cái mình hỏi cũng hỏi rõ: độ đồng đều giữa các trang (không to nhỏ, không thò thụt). Bạn bảo bạn chỉ làm với Camscanner - có trỏ kết quả sang một trang quảng cáo cho kết quả và không có kết quả thật nên mình không rõ bạn làm tốt hay không tốt - mà đồng đều được thì rất giỏi đấy. Nói thực lòng, vì mình không làm được.

    Còn trường hợp bạn chỉ chụp rồi OCR bằng AABB thì những cái trên nói làm khỉ gì cho mệt - cả mình và bạn, cả bác 4 hờ nờ nữa.

    Lạy bác. Em đang có 10201 vấn đề chưa làm được đây ạ.
     
    Chỉnh sửa cuối: 13/6/17
    tran ngoc anh and 4DHN like this.
  17. inno14

    inno14 Lớp 8

    Một vấn đề khác về pdf scan/chụp đó là dung lượng những file scan của nước ngoài dù ở mức 600dpi nhưng vẫn rất nhẹ, vấn đề này bạn @tranngocanh đã hỏi tui từ rất lâu rồi nhưng vẫn chưa có câu trả lời chắc chắn. Sau khi chính tay chụp và hiệu chỉnh bằng scantailor thì đã biết được cốt lõi vấn đề. Một trang tài liệu cùng dpi khi lưu ở mode bitmap (chỉ có trắng và đen) nó nhẹ hơn rất nhiều khi lưu ở mode color/grayscale (mix các kênh màu để tạo màu output). Vấn đề này có thể thực nghiệm ở phần output của scantailor. 400 trang dpi 600 khi xuất ảnh ở mode bitmap chưa đến 20mb (đã tính luôn trang bìa lót lưu ở mode color gần 2mb). Số ảnh bitmap này đóng pdf sẽ rất nhẹ (vẫn là 20mb). Nhưng nếu dùng acrobat xuất ngược số ảnh này ra ngoài dù ở bất kỳ mức dpi nào cũng sẽ có dung lượng rất khủng vì acrobat xuất ngược ảnh ở mode color. Dẫn đến việc nếu dùng ảnh xuất ngược này + ảnh ta muốn thêm vào để đóng pdf mới thì dung lượng bao khủng. Đó cũng là lý do ta chỉ nên thêm vào 1pdf sưu tầm (ảnh hoặc trang word) chứ đừng xuất ngược ảnh rồi đi build pdf lại từ số ảnh xuất ngược đó (xuất 1 (một số) trang để xem kích thước hoặc sử dụng cho mục đích cụ thể khác thì ok, nhưng nếu chỉ để xem kích thước thì rê chuột xuống góc trái tài liệu là nó hiện ra rồi.)
     
    tran ngoc anh, IronMan and 4DHN like this.
  18. khiconmtv

    khiconmtv Cử nhân

    Thằng Acrobat nó còn cho optimize nên những file đã lưu ở dạng trắng đen còn có thể giảm dung lượng xuống được hơn nữa.
     
    tran ngoc anh, 4DHN and inno14 like this.
  19. inno14

    inno14 Lớp 8

    Sự cần thiết của một phần mềm xử lý chuyên dụng như scantailor để tối ưu dung lượng pdf (scantailor chỉ là 1 trong số thôi nha các bạn, tui lấy nó làm ví dụ thôi :D )
    • Rất khó khi scan trực tiếp ở chế độ trắng đen
    [​IMG]
    • Nếu scan ở chế độ màu + xử lý scantailor ta có:
    [​IMG]
    * Dung lượng rất khủng nhé:
    [​IMG]
    * qua Scantailor để chuyển về trắng đen
    [​IMG]
    * đều là 600 dpi cả nhé, nhưng dung lượng rất khác biệt:
    [​IMG]
     
    tran ngoc anh, IronMan and 4DHN like this.
  20. khiconmtv

    khiconmtv Cử nhân

    Thuật toán optimize của Acrobat là nó dựa vào độ đậm nhạt của văn bản và độ trắng sáng của nền. Nó sẽ giảm độ đậm xuống, tăng độ trắng lên, cũng như làm mỏng bớt ký tự (tùy mình chọn mức độ miễn sao vẫn đọc tốt). Một số trường hợp ký tự rõ đẹp thì có thể giảm độ phân giải hiển thị xuống nữa.
    Cần phân biệt độ phân giải ảnh và độ phân giải in ấn (mật độ điểm ảnh). Ví dụ ảnh 600x900 tức là ngang 600pixel và dọc 900pixel (chưa xác định được kích thước ảnh khi in), nhưng độ phân giải in ấn là 300dpi thì ảnh đó sẽ in ra được ảnh kích thước 2x3inch, nếu là 200dpi thì ảnh sẽ là 3x4.5inch.
    Với PDF ảnh muốn rõ đẹp thì dpi cao, khuyến nghị 300dpi, nhưng chỉ là văn bản để đọc thì 150dpi nếu chữ rõ đẹp, font dễ nhìn.
     
    tran ngoc anh thích bài này.

Chia sẻ trang này