Android Sử dụng Vflat để chụp sách trên Android/iOS

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi Numeron, 5/5/20.

  1. songuyento

    songuyento Mầm non

    Phần mềm này có nhập file pdf vào để ocr đc ko ạ hay bắt buộc đầu vào phải là file ảnh ạ? Trên ios đã có phần mềm này nhưng mới chỉ có tính năng scan chứ chưa có ocr
     
  2. Dr. No

    Dr. No Không Không Thấy Thành viên BQT

    Phải xuất pdf ra ảnh bạn ạ. Dùng Vui lòng đăng nhập hoặc đăng ký để xem link để làm là tốt nhất.
     
    songuyento thích bài này.
  3. Mountain King

    Mountain King Lớp 3

    Phần mềm hay, tiếc là trên iOS chỉ mới có chức năng chụp ảnh mà chưa có tính năng OCR cần thiết để có thể xử lý trọn gói việc quét + nhận dạng cùng lúc.
     
  4. Dr. No

    Dr. No Không Không Thấy Thành viên BQT

    Đây là kết quả ocr trang này của hình gốc của cuốn Đầu xanh tuổi trẻ. Khi add vào không cần xoay hình, cứ để nằm ngang cũng được. Chất lượng ocr phải nói là quá tốt.

    DSC_0700.JPG

    ĐẦU XANH TUỔI TRẺ

    làm sao bà có thể, trong vòng chưa đầy mười lăm ngày, rơi vào một tội lỗi như thể được? Mẹ tôi đâu phải người đàn bà lầm đường lạc lối. Trái lại, giờ đây tôi có thể nói trước được rằng, trong suốt cuộc đời của mẹ tôi, khó có thể tưởng tượng được một tâm hồn nào trong sạch hơn bà. Lời giải thích duy nhất là mẹ tôi không í thức được những gì bà đã làm, không phải theo như định nghĩa mà mấy ông luật sư ngày nay đã gán cho mấy thân chủ giết người hoặc trộm cướp, mà bà đã hành động theo những cảm giác mạnh đã lôi cuốn một nạn nhân có phần chất phác một cách thê thảm, không tránh nổi. Biết đâu bà đã tiêu ông đến chết được... vì cách phục sức của ông, vì đường ngồi rẽ theo kiểu Ba lê, và giọng nói tiếng Pháp, phải, tiếng Pháp, mà bà chẳng hiểu gì cả và vì bản tình ca mà ông vừa hát vừa đàn dương cầm. Bà đã iêu những gì bà chưa hề nghe và chưa hề trông thấy đông là một người đàn ông rất bảnh trai) để rồi từ đó bà đã kêu ông toàn diện, iêu đền ngất ngây, với những bộ quần áo và những bản tình ca của ông. Tôi thường nghe nói những việc tương tự thường xảy ra với các cô nông nô son trẻ trong thời kì cực thịnh của chế độ nông nô và, ngay cả với các cô lương thiện nhất. Tôi hiểu rõ điều đó. Thật là xấu hổ cho ai định giải thích điều đó vỏn vẹn bằng chế độ nông nô và sự & sự hạ mình ). Vậy thì, con người thanh niên đó đã có đủ sức mạnh và sức quyến rủ để thu hút được một con người trong trắng đến thế, và nhất là bà lại là người hoàn toàn xa lạ với bản chất của ông ấy, một người thuộc một thế giới hoàn toàn khác hẳn và từ một mảnh đất xa lạ đến đây, để sa vào một vực thẳm hiển nhiên như vậy. Dù đó là một vực thẳm, tôi tin rằng mẹ tôi cũng đã thấy rõ; duy có điều bà không nghĩ tới mặc dù chân bà vẫn đều đặn bước đến; những con người không tự vệ , đó đều giống nhau cả: họ biết đó là vực thẳm mà họ vẫn lăn xả tới.

    DSC_0662.JPG

    ĐẦU XANH TUỔI TRẺ CỦA TÁC GIẢ DOSTOIEVSKI NGUIÊN TÁC NGA NGỮ VŨ TRINH DỊCH SANG VIỆT NGỮ TỪ BẢN PHÁP VĂN TỰA LÀ L'ADOLESCENT CỦA DỊCH GIẢ PIERRE PASCAL ẤN BẢN LE LIVRE DE POCHE BÀI GIỚI THIỆU TÁC PHẨM VỚI PHẦN KHẢO LUẬN VỀ DOSIOIEVSKI VÀ THỂ GIỚI DO NGUYỄN HỮU HIỆU VIỆT

    NGUỒN SÁNG XUẤT BẢN - In lần thứ nhất 1974
     
    Numeron thích bài này.
  5. tran ngoc anh

    tran ngoc anh Cử nhân

    Một thủ thuật nhỏ nếu như một số trang bị cong quá không OCR tốt. Cứ xuất ra thư viện, cop vào PC cho abbyy làm thẳng dòng. Xử lý hai lần như thế này trang chụp phẳng phiu đáng iu lắm. :D
     
  6. machine

    machine Lớp 5

    Trong abbyy bấm vào chỗ nào để làm thẳng dòng vậy bạn? Thanks.
     
  7. tran ngoc anh

    tran ngoc anh Cử nhân

    Mình demo tí luôn để có cái nhìn sâu vào xử lý:
    Dưới là ảnh gốc:
    IMG_20200308_153437.jpg
    Dưới là ảnh vflat đã xử lý, nhìn khá ổn, ít nhất là với chỉ một thao tác, ko cần photoshop quá phức tạp :D
    20210116_153213449.jpg
    Ta thấy vflat nhận diện mép trang và bẻ lại tương đối, nhưng chưa làm thẳng được dòng chữ với những trang cong nhiều như trang này.

    .... Và abbyy 15 cứu được như sau:
    abbyy15-str.png
    Abbyy 12 như sau:

    abbyy12-be.png
    Abbyy 12 có vẻ làm tốt nhiệm vụ hơn nhỉ? :D

    Sau đó xuất ảnh từ FineReader ra - (tùy máy các bạn đang chạy loại nào chứ không phải chạy cả 2 em như minh họa đâu nhé, chỉ là xử lý ảnh thì Fine 12 là đủ dùng, em ấy bị thất sủng rồi, giờ OCR thì nên để cho Vflat "O", cao cấp hơn thì dùng API của google nhưng cái này mình cũng chưa cài được cho máy mình nên đành tìm hiểu Vflat vậy) - rồi lại nhập vào Vflat OCR, nhớ lúc nhập đừng chọn các tùy chọn xử lý ảnh mà ẻm đề xuất nnhé, nhập vào rồi thì vi vu mà OCR thôi.
     
    Chỉnh sửa cuối: 16/1/21
    Numeron, machine and svcntnk42a1 like this.
  8. machine

    machine Lớp 5

    Cảm ơn bạn.
     
  9. sonzin1304

    sonzin1304 Mầm non

    Mấy hôm nay thằng Vflat nó update bản mới nó fix lỗi xóa đi rồi OCR tiếp 100 trang rồi, có bác nào có cách nào khác để ocr ổn không ạ?
     
  10. Dr. No

    Dr. No Không Không Thấy Thành viên BQT

    Chắc nhiều người lách luật quá đây mà! :)
     
  11. Numeron

    Numeron Lớp 3

    Cách OCR hơn 100 trang Vflat bản mới:
    - Dùng Trình duyệt tập tin vào thư mục /Vflat.
    - Copy 3 file bookshelf.db vào một thư mục tạm nào đó
    - Vào Vflat OCR => xuất nội dung OCR
    - Copy + đè 3 file ở thư mục tạm trước đó
     
    tran ngoc anh, amylee and Dr. No like this.
  12. Dr. No

    Dr. No Không Không Thấy Thành viên BQT

    Đã làm theo và ocr ngay được 400 trang. :D
     
    Mountain King thích bài này.
  13. tran ngoc anh

    tran ngoc anh Cử nhân

    Nice!
     
    taiphan118 thích bài này.
  14. sonzin1304

    sonzin1304 Mầm non

    Tuyệt vời luôn. Thanks bạn rất rất nhiều!
     
  15. Trechantrau9x

    Trechantrau9x Mầm non

    bạn ơi làm như nào vậy ạ, mình chưa hiểu cách làm lắm ạ mong bạn chỉ cụ thể hơn với
     
  16. Dr. No

    Dr. No Không Không Thấy Thành viên BQT

    Dùng trình quản lý file mở thư mục vFlat, rồi copy 3 file cuối ra một thư mục tạm.
    Screenshot_2021-03-27-14-03-47-82_119d523df17ae5cc3e88ec22b89ba917.jpg

    Screenshot_2021-03-27-14-05-52-37_119d523df17ae5cc3e88ec22b89ba917.jpg

    Ocr xong 100 trang thì copy 3 file đó trở lại ghi đè lên 3 file trong thư mục vFlat là lại ocr được 100 trang nữa.
     
    tran ngoc anh thích bài này.
  17. Trechantrau9x

    Trechantrau9x Mầm non

    em cảm ơn nhiều ạ.
     

Chia sẻ trang này