Hoàn thành Sherlock Holmes Toàn Tập < Đông A phát hành>

Thảo luận trong 'Dự án eBook cho Thư viện' bắt đầu bởi V/C, 25/4/17.

Moderators: rhea, thuannguyen1088
  1. V/C

    V/C Mầm non

    Đấy là sách mới nên text ngon, mà đây có lẽ là dự án text đẹp nhất.
    Còn lại thì như gân gà, chú cứ sang bên dự án Ỷ Thiên Đồ Long Ký thì biết, nhìn là muốn bỏ chạy. Chú soát 1 chap bên ấy chắc bằng 1 tập HP, lỗi như kiến.
     
    maxiqboy thích bài này.
  2. narutotxd

    narutotxd Lớp 3

    cái đó không cần đâu , em chỉnh ngay ở máy ảnh lúc chụp là đc ngay , về khoảng 300kb một bức thôi, chất lượng vẫn tốt , tại em nghĩ càng tốt các huynh càng làm dễ @@, thế từ tập thứ 2 em sẽ chụp giảm chất lượng đi
     
  3. 4DHN

    4DHN Tiêu Dao

    Không. Ảnh gốc cần chụp ở độ phân giải cao. Nếu chụp ở độ phân giải thấp thì chất lượng OCR cũng thấp theo.
     
  4. V/C

    V/C Mầm non

    Không, vẫn như cũ, chất lượng ảnh càng nét thì ra text càng chất lượng. Mà nét thì nặng là chuyện thường. Như tập 1 nhé.
    Còn giảm dung lượng và đóng thành hẳn 1 tập thì khâu khác sẽ đảm trách.
     
  5. narutotxd

    narutotxd Lớp 3

    không , chất lượng size vẫn cao, nhưng độ nén size tăng lên ấy, cơ chế như kiểu phần mềm nén ảnh thôi mà @@
     
  6. 4DHN

    4DHN Tiêu Dao

    Chắc không? Chất lượng chẳng có gì thay đổi.

    Rồi lấy cái ảnh gốc tương ứng làm và so sánh. Anh Tư đã từng OCR không biết bao nhiêu rồi, cũng test chán ra rồi. Không nghe thì vất vả cho những người OCR vì máy tính chạy rất ỳ ạch mà hiệu quả vẫn vậy.

    Lần cuối tham gia topic này. Chanh lộn mất thời gian.
     

    Các file đính kèm:

  7. 4DHN

    4DHN Tiêu Dao

    Cần test để so sánh, chuyện kỹ thuật không thể nói suông.

    Thôi cày xiền tiếp.
     
  8. V/C

    V/C Mầm non

    Đảm bảo chắc ăn là phải thế, chạy OCR thì cứ mở cho chạy thôi, chậm thì đã sao, máy chạy chứ người chạy đâu mà lo.
    Cái gì cũng chắc cú, text là hàng đầu, lâu tí cũng được.
    Mà 1,7G thì có gì là nặng lắm.
     
  9. Caruri Tlkd

    Caruri Tlkd Sinh viên năm III

    Bạn có học về Machine Learning (Học máy) và Image Processing (Xử lý ảnh) không, nếu có thì tạo vài tập mẫu để huấn luyện nó, nhưng tôi nghĩ thứ nhất là sẽ mất công trong việc training, thứ hai là khó vì ABBYY là phần mềm đóng (thương mại) chứ không mở, nên plugin không biết cắm vô thế nào.

    Rất tiếc đã làm chú phải mệt nhọc vì promo ra sau ngày dự án mở. Nếu chap 15 mà Mỹ Giang không nhận thì để anh cân nốt cho.
     
  10. maxiqboy

    maxiqboy Lớp 6

    Bác ơi, phần mềm nó có mục đó mà :D

    Để người dùng nhận diện hộ nó những chữ nó có thể không hiểu,

    Có 3 mode : AI, AI + User Training và chỉ User Traning


    Dự án HP của em chỉ là trẻ con so với người lớn thôi ạ :D

    HP của em ngày trước chắc cao thủ nào cũng OCR soát chính tả chán chê rồi, giờ còn sơ sơ mấy lỗi vặt thôi ạ,
     
  11. V/C

    V/C Mầm non

    Mỹ Giang nhận rồi, nhưng em bảo là cứ thong dong mà soát vì còn đợi text của mod thanhbt, chứ cần gấp là có ngay.
     
  12. V/C

    V/C Mầm non

    Ban bệ đã đầy đủ, xóa đi anh Tư. Trừ lại post 1.
     
  13. V/C

    V/C Mầm non

    Xong cắt làm 4 nhé, các tập sau chú ôm OCR luôn đi.
     
  14. V/C

    V/C Mầm non

    Cứ như cũ đi bạn, không nhất thiết phải thay đổi, rồi cũng giải tán thôi.
     
  15. narutotxd

    narutotxd Lớp 3

    Huynh @4DHN cập nhật đoạn text test sang bài này nhe, bài ở bên kia em ấn nhầm ,lẫn lộn 2 bên khó theo dõi quá @@
     
  16. V/C

    V/C Mầm non

    Thôi, xóa thôi, lắm thủ tục đâm rối.
     
  17. maxiqboy

    maxiqboy Lớp 6

    Em đang OCR được 1/4 tập 1 rồi ạ, Anh đợi em gửi thử file docx test xem có cần chỉnh sửa gì không ạ ?
     
  18. V/C

    V/C Mầm non

    Trau kỹ thì ngon, nhưng không cần hầm kỹ thế, kiểu gì anh cũng lông mày lá lốt lại.
     
  19. maxiqboy

    maxiqboy Lớp 6

    Tại bản xịn nhiều ảnh minh họa, nhiều lúc Abbyy nó ko biết đọc cái gì trước, cái gì sau, em gửi anh xem thử nhé

    Em thấy còn nhiều lỗi phết ạ @@

    File OCR này tạm chấp nhận được thì em sẽ làm tiếp phần còn lại ạ,
     

    Các file đính kèm:

  20. V/C

    V/C Mầm non

    Thế thôi, đòi hỏi gì nửa, có mà làm là ngon rồi.
    Tiếp tục thôi.
    Những ảnh mà không cần thiết là loại bớt, đôi ảnh minh họa cho sống động thôi, text mới là hàng đầu.
     
Moderators: rhea, thuannguyen1088

Chia sẻ trang này