PC Portable ABBYY FineReader Corporate 15.0.112.2130

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi khiconmtv, 21/1/20.

  1. khiconmtv

    khiconmtv Cử nhân

    Cập nhật bản mới hơn nhé mọi người.
    :D
     
  2. khiconmtv

    khiconmtv Cử nhân

    Bản portable mới này build mới hơn, cũng tách riêng các ứng dụng ra thành các file độc lập để dễ dùng hơn.
     
    Redami and tran ngoc anh like this.
  3. tran ngoc anh

    tran ngoc anh Cử nhân

    Đúng rồi, với lại bản hôm trước mở lên lâu quá.
     
    vanthach thích bài này.
  4. vudinhthinh

    vudinhthinh Lớp 2

    Các bác ơi sao mình chỉnh sửa gõ tiếng việt không được trong khung text sau khi OCR được vậy các bác?
     
  5. vanthach

    vanthach Lớp 2

    Bạn thử tắt word đi bật lại thử xem hoặc bộ gõ thử xem sao. Mình từng bị trên word 2019 với cái unikey. Cứ thi thoảng phải tắt đi bật lại cái unikey.
     
    Redami thích bài này.
  6. Bọ Cạp

    Bọ Cạp Moderator Thành viên BQT

    OCR xong phải tách khung với text ra, bạn tìm lại bài cũ mà làm.
     
  7. tudonald78

    tudonald78 Lớp 11

    OCR xong chọn Save as DOCX, copy hết text bên Word dán vào Notepad, sau đó copy text ở Notepad dán lại vào file Word tạo mới, như thế sẽ tách được khung ra, chỉ còn text thuần để xử lý tiếp...
     
    Redami thích bài này.
  8. 4DHN

    4DHN Tiêu Dao

    Thiếu bước giữ các định dạng nghiêng, đậm... của sách in rồi.
     
    vanthach thích bài này.
  9. Các bạn dùng cách sau để làm hết khung hiệu quả hơn:
    1. OCR xong chọn Save as DOCX
    2. Dùng Calibre chuyển file Docx sang epub.
    3. Dùng Calibre chuyển lại file epub sang docx.
    Kết quả hết khung và vẫn giữ được định dạng chữ (nghiêng, đậm).
     
  10. tran ngoc anh

    tran ngoc anh Cử nhân

    Giữ nghiêng đậm, loại bỏ các kiểu định dạng rác khác mình sẽ xử lý với, save as docx, chạy xử lý cho cặp tag <i></i> bao quanh nghiêng và cặp <b></b> bao quanh đậm.
    Add vào calibre convert sang txt, mở txt bằng notepad++ xử lý cắt khoảng trắng ở đầu và đuôi của dòng, chỉ với một câu lệnh, cũng như xoá dòng trống có hoặc không có ký tự trắng gì cũng được, tổng cộng 2 câu lệnh thao tác trong khoảng hơn 20s.
    Thực hiện convert txt thành epub, mở epub, chạy lệnh để chuyển cặp tag nghiêng đậm ở dạng text của docx thành cặp tag nghiêng đậm thật sự của html. Xong.

    Tiến hành thêm css, chạy trình kiểm tra chính tả với từ điển trên calibre editor luôn. Bảo đảm hiệu quả hơn xử lý trên word nhiều.
     
  11. vudinhthinh

    vudinhthinh Lớp 2

    Em dùng bộ gõ của windows 10 chỉnh sửa trực tiếp được rồi, do nguồn xấu nên scan từng trang rồi dò sửa luôn ak.
     
    Cảnh1711 thích bài này.
  12. vanthach

    vanthach Lớp 2

    đây là file mình mình scan chế độ 300 dpi. khá là nét . nhận dạng bằng bản 15 vẫn còn 1 số lỗi
     

    Các file đính kèm:

    Redami thích bài này.
  13. tran ngoc anh

    tran ngoc anh Cử nhân

    Do font chữ của trang in nữa bạn. Font tốt kết quả tốt. Font tệ kết quả tệ.
     
    Redami and vanthach like this.
  14. vanthach

    vanthach Lớp 2

    Đúng rồi bạn ạ. Mình mới thử demo scan ảnh và ảnh mầu thử xem nhưng anh màu không đạt yêu cầu lắm. Xuất ra file image thì nó nặng hơn file pdf. Nhưng mình cảm thấy để file pdf nhận dạng cũng tốt lắm. ảnh vừa rồi là file pdf m chụp lại đó
     
  15. vanthach

    vanthach Lớp 2

    ví dụ như file này
     

    Các file đính kèm:

    Redami thích bài này.
  16. vanthach

    vanthach Lớp 2

    Mình thấy nếu scan ảnh đen trắng sẽ giúp cho file sau scan rất là nhẹ và nhận diện rất tốt.
     
  17. vanthach

    vanthach Lớp 2

    Hôm nay mình thử để ảnh xoay ngang lộn ngược nhưng orc trên bản 15 rất là tốt nó tự động xoay và tách ra 2 trang cho mình rất là tiện. Nếu cái tiếng việt nó báo lỗi rất dễ hiểu để mình sửa nữa !
     
  18. Phiêu Lãng Du

    Phiêu Lãng Du Mầm non

    bạn cho mình xin 2 câu lệnh này được không ? cảm ơn bạn
     
  19. tran ngoc anh

    tran ngoc anh Cử nhân

    Đây bạn. Tính năng chứ không phải câu lệnh, lần trước mình viết chưa đúng :D

    Screenshot_20200322-124033_Zalo.png
    Screenshot_20200322-124022_Zalo.png
     
    Chỉnh sửa cuối: 22/3/20
  20. Phiêu Lãng Du

    Phiêu Lãng Du Mầm non

    Cảm ơn bạn nhiều
     
: abby

Chia sẻ trang này