PC textcrawler công cụ hỗ trợ tìm kiếm và thay thế hàng loạt.

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi welcom1985, 14/8/20.

  1. xversion1

    xversion1 Lớp 3

    Đâu cần bấm 500 lần bác, dùng Replace All là nó thay hết 1 lượt mà? Hay ý bác là nó thay 1 lúc 500 lỗi sai khác nhau?
     
  2. machine

    machine Lớp 11

    Ý mình là nó thay 1 lúc 500 (hoặc hơn) lỗi sai khác nhau đó (nếu từ điển chính tả đủ tốt).
     
    xversion1 thích bài này.
  3. xversion1

    xversion1 Lớp 3

    Tiếng Việt có luôn hả bác?
     
  4. machine

    machine Lớp 11

    Uh, ngôn ngữ nào cũng được hết, miễn là theo chuẩn Unicode.
     
    xversion1 thích bài này.
  5. welcom1985

    welcom1985 Lớp 3

    Ứng dụng cơ bản của Regular Expression mà tôi rút ra được, còn những cái khác thì mọi người có thể google thêm

    1. Rút gọn từ điển.
    ta có 5 dòng sau
    nghim trọng nghiêm trọng
    nghiếm trọng nghiêm trọng
    nghim trọng nghiêm trọng
    nghim trọng nghiêm trọng
    nghim trọng nghiêm trọng

    rút ngắn lại thành 1 dòng
    nghi[ềếễểệ]m trọng nghiêm trọng
    hoặc
    nghi(|ế|||)m trọng nghiêm trọng

    giải thích:
    [ềếễểệ]: tìm một từ trong các từ: ,ế,,,
    (ề|ế|ễ|ể|ệ): tìm một từ (cụm từ) trong các từ (cụm từ) : ,ế,,,

    Sự khác nhau giữa [ ] và ( ) là :
    [ ] chỉ tìm 1 từ
    ( ) có thể tìm 1 từ hoặc 1 cụm từ
    Vd: thánh th(ịệ|ìê|ịể)n
    Tùy trường hợp mà ta phang.


    2. Dự đoán một số trường hợp xuất hiện
    Vd: ng[à]n gọn ngắn gọn

    vào một ngày đẹp trời nào đấy , khi nhìn vào bảng từ điển, ta thấy có thể thêm vào một số trường hợp mà lúc trước ta chưa thấy hoặc chưa gặp

    ng[ẳà]n gọn - - - > ng[ẳàãá]n gọn


    một số ví dụ khác

    tr..ng hợp <=> trường hợp, traừng hợp, trựờng hợp, trướng hợp . . . . .
    trư[^ơờ]ng hợp <=> trưng hợp, trưng hợp, trưng hợp, trưng hợp . . . . .


    dấu “.” tượng trưng cho một ký tự bất kỳ
    [^ơờ] : tìm 1 ký tự bất kỳ, không phải là “ơ” hoặc “ờ”
    Trong vd trên: “trư[^ơờ]ng hợp” sẽ ko tìm “trương hợp” hoặc “trưng hợp”
     
  6. machine

    machine Lớp 11

    Cái này hữu ích lắm. Cảm ơn bạn đã chia sẻ.
     
    Chỉnh sửa cuối: 28/2/21
    tran ngoc anh and welcom1985 like this.
  7. machine

    machine Lớp 11

    TextCrawler "cẩn thận" quá làm lãng phí thời gian không cần thiết.
    Sau khi thay thế xong, xuất ra file kết quả rồi (từ giây 48 đến 51 trong video đính kèm) nó còn mất công chạy thêm để xuất ra báo cáo chi tiết: đã thay thế những cụm từ nào ở vị trí nào (từ giây 52 về sau).
    Có bạn nào biết cách tắt tính năng xuất báo cáo của TextCrawler không?
    Chạy lần lượt cả hơn 20 file từ điển mà phải đợi vậy tốn thời gian quá.
     

    Các file đính kèm:

    tran ngoc anh thích bài này.
  8. Numeron

    Numeron Lớp 5

    Các file đính kèm:

    machine and Lan Giao like this.
  9. machine

    machine Lớp 11

    Bạn có thể hướng dẫn thêm về cách thay thế Regular Expression trong Text Crawler được không?
    Ví dụ: có cụm từ sau muốn thay thế hàng loạt

    Ấn đọ. --> Ấn Độ.
    Ấn đọ, --> Ấn Độ,
    Ấn đọ? --> Ấn Độ?
    Ấn đọ; --> Ấn Độ;
    Ấn đọ: --> Ấn Độ:
    Ấn đọ! --> Ấn Độ!
    Ấn đọc sách --> Ấn đọc sách (không thay thế)
    TextCrawler.jpg

    Thông thường trong Sigil chỉ cần:
    Find: Ấn đọ[.,?;:]
    Replace: Ấn Độ\1
    Mode: Regex

    Trong Text Crawler cũng làm như vậy, kết quả thu được là chuỗi "Ấn Độ\1" như ảnh dưới. TextCrawler.jpg
     
    welcom1985 and tran ngoc anh like this.
  10. tran ngoc anh

    tran ngoc anh Cử nhân

    Để dùng được \1 khi thay thế thì ở tìm kiếm phải nhóm đối tượng lại, ở tìm kiếm có bao nhiêu nhóm thì ở thay thế sẽ \ với số nhóm tương ứng. Vậy:

    Find: Ấn đọ([.,?;:])
    Replace: Ấn Độ\1

    Em lại có cách tìm khác, bác thử xem:

    Find: (\bẤn đ)ọ\b
    Replace: \1ộ
     
    machine and welcom1985 like this.
  11. welcom1985

    welcom1985 Lớp 3

    Tôi chỉ làm đơn giản như vầy thôi:
    Ấn Đọ. ===> chuyển thành Ấn Đọ . (thêm vào khoảng trống trước dấu .)
    Ấn Đọ, ===> chuyển thành Ấn Đọ , (thêm vào khoảng trống trước dấu ,)
    Ấn Đọ! ===> chuyển thành Ấn Đọ ! (thêm vào khoảng trống trước dấu !)

    sau khi find and replace xong thì chỉ việc chuyển dấu " ." thành dấu "." là xong . Chứ đâu có nghĩ phức tạp như thế đâu
     
    machine thích bài này.
  12. welcom1985

    welcom1985 Lớp 3

    Hổng có liên quan j đến phần mềm, nhưng hông biết post vào đâu, quăng đại vào đây, tìm mãi mới ra được cái regular expression này , mong muốn chia sẻ cho mọi người, ai biết rồi thì thôi vậy, dùng để sau khi orc bằng các phần mềm xong ra được text thô, kiểm tra xem cái dòng nào nó rơi rớt không theo như nguyên bản. (notepad++ nhé)

    + tìm kí tự in thường đầu câu ^[[:lower:]] hoặc ^[^A-Z]
    + tìm kí tự in hoa đầu câu ^[[:upper:]] hoặc ^[^a-z]


    hoặc tìm các kí tự cuối câu có phải là kí tự in hoa hay in thường không (chủ yếu xem cuối câu đó có thiếu dấu "." , dấu ":" hay ko)

    + tìm kí tự in thường cuối câu [[:lower:]]$ hoặc [^A-Z]$
    + tìm kí tự in hoa cuối câu [[:upper:]]$ hoặc [^a-z]$

    Cũng nhờ cái này mình có thể tìm những từ toàn là in thường, toàn là in hoa, hoặc vừa hoa vừa thường
    vd :
    - toàn in thường : [[:lower:]]{3,} .... hoàn, hoang , tàng ...
    - toàn in hoa: [[:upper:]]{2,} .... NAM, VIỆT ....
    - vừa hoa vừa thường [[:upper:]][[:lower:]]{3,} .... Phong, Nha ....

    còn ứng dụng vào đâu nữa ko thì mình không biết.
     
    Chỉnh sửa cuối: 1/3/22
    machine and Cảnh1711 like this.
  13. welcom1985

    welcom1985 Lớp 3

    Tìm và thay thế các chữ in thường đầu dòng, vấn đề đôi khi lại đơn giản đến không ngờ :)
     

    Các file đính kèm:

    • 111.png
      111.png
      Kích thước:
      31.8 KB
      Đọc:
      25
    machine thích bài này.
  14. zodngok

    zodngok Mầm non

    Mình chạy Exe rồi nhưng nó ko hiện icon chương trình trên Destop mà chỉ ở trong Folder.
    Không biết mình có cài thiếu sót gì không?
     
  15. Numeron

    Numeron Lớp 5

    Đây là phần mềm portable nên thế là đúng. Để có icon trên Desktop thì bạn: chuột phải file .exe => Create shortcut => Chuyển file shortcut vừa tạo ta Desktop.
     
    zodngok thích bài này.
  16. zodngok

    zodngok Mầm non

    Cảm ơn bạn nhé.
     
  17. tran ngoc anh

    tran ngoc anh Cử nhân

    Vừa phát hiện có cái file từ điển từ ghép của phần mềm GõtiếngViệt luôn các bạn ạ ^_^
     

    Các file đính kèm:

  18. vinaguy

    vinaguy Lớp 11

    Chỉ cần copy và dán vào thư mục từ điển của nó là được hé @tran ngoc anh ?

    P/S: Sao máy em nó có sẵn từ điển này rồi ta? Mà không thấy nó bắt bớ gì lúc em làm sai các từ này cả. Sử dụng như thế nào vậy @tran ngoc anh ?
     
    Chỉnh sửa cuối: 3/8/22
  19. tran ngoc anh

    tran ngoc anh Cử nhân

    Em cũng chưa biết dùng nó như nào với GotiengViet cả. Chắc là để dùng cho tính năng kiểm tra chính tả khi gõ của GotiengViet á mà.

    Còn lý do em post vào đây và vì phần mềm này cần list từ vựng, em post cho mọi người tham khảo ^^
     
    machine thích bài này.
  20. machine

    machine Lớp 11

    Cái này là các cụm từ chuẩn, coi như là "đáp án" (cột B trong file Excel của tui), chỉ việc điền các cụm từ sai (vào cột A) rồi copy ra file text (*.txt) là dùng được cho TextCrawler :D
    Danh sách này khá là đồ sộ, tới hơn 68.000 cụm từ. Cảm ơn bạn N.A
     
    tran ngoc anh thích bài này.

Chia sẻ trang này