Hướng dẫn Chia sẻ kinh nghiệm khi soát lỗi và biên tập text

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi Trúc Quỳnh Đặng, 9/8/19.

  1. Conan-tieudao

    Conan-tieudao Lớp 4

    Chỉ kiểm tra chính tả được trên đuôi txt thôi. Chứ trên đuôi docx không có phần ấy đâu
     
  2. maxiqboy

    maxiqboy Lớp 6

    upload_2020-4-12_20-6-6.png

    ủa file docx mà bác ???
     
    Conan-tieudao thích bài này.
  3. Conan-tieudao

    Conan-tieudao Lớp 4

    Mình dùng trên đt nên không thấy phần đấy
     
  4. maxiqboy

    maxiqboy Lớp 6

    À sr bác, điện thoại để em test thêm và bổ sung bài ạ

    update: đt ko hỗ trợ các bác ợ :(
     
    Chỉnh sửa cuối: 13/4/20
  5. Nga Hoang

    Nga Hoang Lớp 5

    Đã test thử và quả nhiên hay hơn các phần mềm sửa lỗi chính tả VN từ trước đến giờ mà tôi sử dụng, vì những đặc điểm @maxiqboy nhận xét ở trên.

    Ngoài ra chức năng Speech to Text của Google docx cũng khá tốt với ngôn ngữ VN. Tôi đã cho thử chuyển STT qua mục Đọc truyện trên Youtube. Khả năng ghi lại rất tốt nếu người đọc chậm một chút.

    Đây là một đoạn tôi cho Google docx nghe qua Youtube và viết lại từ cuốn truyện mà Mod Quỳnh yêu cầu hôm trước:

    “Chào mừng bạn đến với chuyên mục văn học học đường trên kênh hẻm radio sau khi bơi bài nghe Truyện ngắn Những Đứa Con Trong Gia Đình tác giả Nhà văn Nguyễn Thị giọng đọc Trần Ngọc Xanh trên kênh hẻm radio.

    Anh em gọi việc là cậu tư mỗi lần nghe miệng ra cười cái đầu nghe như có họ lấy vui nữa vậy mà trước đây tiểu đội trưởng tính có hỏi việc gì nói cha bị tay bắn chết hồi 95 mẹ mới bị đài phát của giặc giết hồi năm ngoái ở nhà chứ Còn thằng em nhỏ ở với chú còn người chị thứ hai thì đã đi lấy chồng xa thì đi công tác với chồng vậy thôi nhưng một vườn thì là tại là đội trưởng giao cho tiểu đội một bức thư để tên quyết chiến ở tỉnh Bến Tre thân gửi em tôi là Nguyễn Văn Việt ở đơn vị x. Viết dấu thì kỷ mà anh em cũng mở ra được tầm sầu tiểu đội trưởng đáng tuyên bố em lên rằng việc của còn một người chị ruột thứ ba nữa echo tên là Quyết chiến ấy mới 20 tuổi thôi hơn việc 2 tuổi hiện là tiểu đội trưởng của bộ đội nữ địa phương Quỳnh Bến Tre Vậy là lộ bí mật trọn việc giấu chị như dấu của riêng Vậy cậu ta sợ mất chị mà cái miệng ống loa của tánh không dịch lại được cho tới bữa này nằm trong bệnh viện hay mắc bệnh bằng kín mít việc làm nghe thấy hai tiếng cậu Tư anh em gọi mình cậu Tư viết thư cho chị kiến chưa Anh em mình phải không có cứ hậu từ lại cười loãng dưới cái băng trắng hai gò má cằm ước người và trái vú sữa thời hiện lên việc muốn viết thư cho chị Chiến lắm nhưng biết nói gì cũng đã báo tin mình bị thương đầu được phải nói làm sao chứ và có viết thì cũng phải nhờ người khác Viết giùm Như vậy anh Em sẽ gạo lên hồi vậy việc trùm chăn kín Đầu Gió Chướng thổi lau rau trên mái nhà Trời lạnh nhưng đừng tưởng việc ngủ việc nằm ở đó với cây viết chì mượn của chị hồi lý một cuốn tạp còn cất trong vòng việc mà mò viết thử nói cái gì Câu đầu đập làm sao đây nó hơi gầy gò việc trời Bình Trọng thôi ở nhà Vì có làm đuôi cho các ngành du kích đi bắn tàu một lần sống Định Thủy hẹp chỉ vài chục phải lần đầu tiên Vì mình thấy rõ một thằng Mỹ nó mở ở trần ngồi chồm hỗm trên con đổi cái nó có tài chè gái Lọ Lem trước cây súng máy đi đoạn vào bờ nằm Phát bán đỏ của du kích đã nổi một lượt trong đó có hai phát của chị Chín và việc coi đạn bù Lên trực thăng nó giàu tới bắn xong có biết nó chết đâu mãi 3 ngày sau một buổi sớm các bà đi chợ bỗng la lên trên chiếc vì thế xác một thành thống kê đầu vào bếp xuồng người ta lôi lên mới rõ là càng nghĩ nó vẫn ở trần cái nón có tay bị mất một lỗ đạn bằng cái khu Tô nằm giữa thước ngực trắng nước hay còn mắc gì hay cái trứng thối vẫn còn ló ra nhưng không phải giúp cây súng máy mà trước chị em Việt .”


    Những chữ mà Google doc viết sai có lẽ một phần là do tiếng nhạc nền to quá át tiếng đọc và một phần do đọc nhanh.

    Tôi đã thử đọc cho Google xuất ra text thấy kết quả tới 99% nếu đọc chậm và với micro tốt một chút.

    Sở dĩ mà muốn tìm hiểu phần này là vì muốn so sánh giữa cách đọc để ra text và dùng OCR để ra text những cuốn sách quá cũ, mờ và dùng chữ chì để in (như những cuốn sách in từ những năm 1980 trở về trước); cách nào nhanh và tiện cho newbie hơn.

    Trước mắt tôi thấy đọc cho Google nhận diện ra text nhanh và tiện hơn là cho OCR. Vì khi đọc xong, ta chỉ cần edit lại các dấu , - ? . ; : và xuống hàng.

    Vì đang mần ebook cuốn Phi Trường của Arthur Hailey. OCR xong thì thấy sửa lỗi chính tả còn lâu hơn là type lại từ đầu.


    Để tiếp tục vọc thêm và cho các bạn biết kết quả.
     
    daohaine, maxiqboy, Missfly82 and 2 others like this.

Chia sẻ trang này