PC Portable ABBYY FineReader Corporate 15.0.112.2130

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi khiconmtv, 21/1/20.

  1. vinaguy

    vinaguy Lớp 11

    Xác nhận!!! Bản này chạy tốt trên win11 nhé.
    Trong version @Nguyễn Trường Minh ấp ở trên có cả cờ roách rồi nhé. Chắc do @tran ngoc anh lúc giải nén ra, lại giải nén vào thư mục khác với thư mục lưu bộ cài... nên nó mất file cờ roách. Cứ giải nén ngay vào thư mục lưu các thứ tải về từ link trên, rồi cài thì máy nó sẽ tự nhận cái cờ roách đính kèm luôn nhé.
    Chính xác là nó không tự ấp đếch gì hết nhé. Nên cứ yên tâm mà xài, không gặp vấn đề gì hết.
    Mình đang xài bản của @Nguyễn Trường Minh, và thấy chạy hoàn toàn tốt, không gặp vấn đề gì nên chưa thử bản này nhé.

    P/S: Lúc chạy OCR thì soát lỗi trực tiếp trong ABBYY nhanh hơn là xuất ra word rồi mới soát lỗi nhé cả nhà. Soát lỗi trực tiếp trong ABBYY thì nó còn xuất hiện bản gốc cho mình đối chiếu luôn nên đỡ phải nhảy tới nhảy lui. Chỉ trừ những từ có trong từ điển thì ABBYY nó không bắt được thì lúc đó phải đọc qua bản word hoặc đọc trực tiếp trên ABBYY để sửa luôn. (Ở đây toàn cao thủ, nên em chỉ nhắc lại cho bác nào chưa áp dụng mà cứ xuất thẳng ra word rồi mới soát, nó khổ ra nhé)
     
    machine and Anan Két like this.
  2. tran ngoc anh

    tran ngoc anh Cử nhân

    Editor của A.F dùng đã lắm :⁠^⁠) và cũng lưu ý là đừng ngại A.F nặng mà ngại soát bằng editor của A.F. Microsoft Word nó lại nặng hơn gấp rưỡi ᕙ⁠(⁠ ͡⁠°⁠ ͜⁠ʖ⁠ ͡⁠°⁠)⁠ᕗ
     
    Chỉnh sửa cuối: 18/11/22
  3. machine

    machine Lớp 11

    [Tự động dồn chú thích về cuối file văn bản]
    File Word xuất ra từ ABBYY đã có chú thích rồi (dạng foot note, tuy đôi khi không đủ hết) nên sau khi thêm thẻ p, i, b, sup thì chọn Save As → Plain Text → Other Encoding → Unicode
    Khi đó toàn bộ nội dung chú thích sẽ được tự động dồn về cuối file văn bản.
     
  4. guramsergienko

    guramsergienko Mầm non

    phần mềm này so với OCR bằng google drive thì cái nào ổn hơn mn, bữa giờ xài script cho google drive được share trên này nhưng giờ dùng hết được rồi
     
    tran ngoc anh thích bài này.
  5. gachi00

    gachi00 Lớp 4

    Cảm giác Abbyy OCR lỗi khá nhiều so với Google Drive, mọi người có thấy vậy ko?
     
    Last edited by a moderator: 28/12/22
    machine thích bài này.
  6. tran ngoc anh

    tran ngoc anh Cử nhân

    Mình có so sánh trong quá trình dài dùng Abbyy Finereader và Google Drive, Vflat, Tesseract; theo cá nhân mình Google Drive có tỉ lệ lỗi thấp nhất.

    Tuy nhiên, với những tài liệu đặc thù, mình luôn luôn dùng Abbyy Finereader để soát trực tiếp trong editor của ẻm. Vì có tính năng hiện 2 cửa sổ edit text và ảnh gốc rất tiện đối chiếu mà 2 app kia hiện chưa cung cấp. Và đặc biệt là nghiêng đậm cũng như dàn trang là điểm mạnh mà chỉ duy nhất Abbyy Finereader đang có so với gần như phần còn lại các phần mềm OCR khác.
     
    gachi00 thích bài này.
  7. gachi00

    gachi00 Lớp 4

    tò mò chỗ "đặc thù" là như nào bạn nhỉ? mình làm chủ yếu là text tiếng việt nên thấy gg drive là xịn xò nhất luôn, dò chính tả thì chia đôi màn hình PC, 1 bên text, 1 bên ảnh scan thấy cũng ổn
     
  8. tran ngoc anh

    tran ngoc anh Cử nhân

    Để cho rõ hơn thì: 2 cột text, nghiêng, đậm, khung ảnh xen lẫn khung text phức tạp chẳng hạn... mà đặc đặc hơn một chút nữa thì như OCR và soát sạch chính tả trong editor của Abbyy xong thì xuất thành PDF scan searchable chẳng hạn. Với Google Drive thì mình chưa biết cách làm :D

    Haha thì vẫn OCR tiếng Việt chứ tiếng Anh thì chắc same same nhau á :D.
    Vui lòng đăng nhập hoặc đăng ký để xem link
    Nói chung về chính tả tiếng Việt thì mình là fan của Google Drive, song bật mí một chút fan của Vflat trong diễn đàn mình đông hơn gấp bội vì Vflat còn một tính năng khác rất cao cấp mà Abbyy và Google đều không có :D

    Video bên dưới mình quay lại khi edit vài trang, mình chỉ mở Abbyy toàn màn hình vừa có khung edit text, vừa có khung ảnh gốc đối chiếu trong Ô thu phóng; và đặc biệt như bạn có thể thấy trong video, vị trí chữ cái trong ảnh gốc sẽ di chuyển theo vị trí con trỏ chuột trên bản text để có thể đối chiếu theo thời gian thực. Đây là tính năng giá trị mà chỉ mỗi Abbyy Finereader đang có và mình rất cưng tính năng này.
     
    gachi00 thích bài này.
  9. vinaguy

    vinaguy Lớp 11

    Thêm tính năng nữa mà em hay dùng đó là Find n Replace của Abbyy Finereader luôn các bác ạ. Sửa các lỗi từ sai hệ thống nhanh cực kỳ luôn. Ví dụ: đuờng, tuờng... vân vân thì Find: uờ và replace all: ườ và còn nhiều nhiều thứ sai hệ thống khác.
    Với cả nó tua ảnh gốc và text "theo thời gian thực", cái mà @tran ngoc anh nói á, nên sửa nhanh hơn nhiều.
    Không giống như bác @gachi00 tua tay đâu ạ - mệt mỏi lắm.
     
  10. tran ngoc anh

    tran ngoc anh Cử nhân

    Tri kỷ nha bác :D em còn phát hiện nếu bác dùng kết hợp với editor của Calibre thì số zách luôn nhá.

    Ví dụ thế này: bác OCR bằng Finereader xong, xuất ngay ra txt rồi từ txt đó tạo thành epub trơn không có định dạng. Mục đích để lấy danh sách các lỗi hàng loạt để copy paste qua công cụ find & replace của Finereader.

    Em đang ủ viết một tut đầy đủ về quy trình từ đầu đến cuối xoay quanh Finereader này, mà đang lười :D
     
    Cảnh1711, vinaguy and gachi00 like this.
  11. gachi00

    gachi00 Lớp 4

    vậy chắc cái lại abbyy vọc thử rồi, trước ko biết xài mà thấy nhiều cửa sổ trong app nhìn rối quá nên cũng ngại :D
    hóng bài mới của mod @tran ngoc anh nhé ;)
     
  12. machine

    machine Lớp 11

    Trong Finereader nó có thay thế hàng loạt cụm từ như TextCrawler được không?
     
  13. vinaguy

    vinaguy Lớp 11

    Bỏ chữ LƯỜI đi nhé bác. Bọn em chờ cái TUT đấy.
    Bác đây cũng đang chờ nè.
    Cái này thực hiện được, nhưng có vẻ cũng hơi mất thời gian do làm epub bác nhễ. Giải quyết câu hỏi của bác @machine được thì bớt được bao nhiêu công đoạn bác nhễ.
     
    machine thích bài này.
  14. tran ngoc anh

    tran ngoc anh Cử nhân

    Không bạn, nếu được nữa thì ai chơi lại nó :D
     
    machine thích bài này.
  15. tran ngoc anh

    tran ngoc anh Cử nhân

    Không hề mất thời gian luôn bác. Nếu bác không dùng epub, bác phải đọc dò trên chính Finereader mà không biết từ hay cụm từ lỗi đó nó có tần suất là bao nhiêu. Trong khi xem list bên epub bác sẽ biết ngay những từ lỗi có tần suất cao nhất để ưu tiên mà sửa.

    Còn tạo cái epub thì siêu nhanh. Theo cách của bác thì bác cứ xuất epub, 3 giây, mở epub, xoá hết css rồi bấm nút bông tulip nữa để thành epub trơn chắc chỉ thêm vài giây. Như thế chỉ mất chưa đầy một phút để có một cái epub trơn hỗ trợ show list lỗi thì em nghĩ kiểu gì nó cũng đáng giá bác ạ.
     
    vinaguy thích bài này.
  16. tran ngoc anh

    tran ngoc anh Cử nhân

    Ở menu View bạn có thể tùy chọn để chỉ hiện những cửa sổ mà bạn cần để tránh mất tập trung. Như trong video mình chỉ để một cửa sổ edit text và ô thu phóng được thu gọn còn khoảng 2 dòng chữ, tạo điều kiện để khung edit được hiển thị to nhất có thể, chữ to dễ soát, và ô thu phóng cũng hiện vừa đủ dòng text đang sửa mà thôi.

    Còn lúc OCR thì các ô mặc định không ảnh hưởng gì, OCR xong rồi mới ẩn bớt các cửa sổ để tiến hành soát text.
     
    vinaguy and gachi00 like this.
  17. vinaguy

    vinaguy Lớp 11

    Cũng có lý ấy nhỉ? Để em thử chiêu này xem sao. Làm epub mà không trang trí gì thì đúng là chỉ mất 3 giây thiệt.
    Chưa có cái app nào hoàn hảo cả, nên buộc anh chị em Ebookers nhà mình cứ chạy vòng quanh tìm hướng xử lý các bác nhễ. Điên tiết thiệt, em thử xem Cali nó có biết đọc file txt không, mà nó không biết đọc, vấn đề là mình cần cái từ điển "kiểu giống như Cali", nhưng lại không có app nào như vậy.
    Trong Abbyy nó cũng có từ điển tiếng Việt, nhưng nó lại chả báo cho mình biết "tần số lỗi" là bao nhiêu cả (thế có chết không chứ nị), chứ em tin là từ điển của Abbyy sẽ tốt hơn từ điển Cali. Để em đâm đầu vào vọc từ điển Abbyy xem có cách nào khá khẩm hơn không.
     
    tran ngoc anh thích bài này.
  18. tran ngoc anh

    tran ngoc anh Cử nhân

    Nếu muốn có list lỗi cho txt giống như epub trong calibre editor thì em nghĩ phải vọc Notepad++ đi bác.
     
  19. Nguyễn Duy Công

    Nguyễn Duy Công Mầm non

    upload_2023-3-16_7-27-43.png
    Cho em hỏi sao nó lại bị lỗi như vầy ạ.
     
  20. tran ngoc anh

    tran ngoc anh Cử nhân

    Bạn thử bản ở post 97 xem, mình dùng trên Windows 11.
    Vui lòng đăng nhập hoặc đăng ký để xem link
     
: abby

Chia sẻ trang này