Công nghệ làm Mục lục cho các box trong vòng 10p

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi Deathshine, 1/10/13.

  1. tamchec

    tamchec Sinh viên năm I

    Em đã sửa lại bài, anh thử làm xem sao nhé.
    Có một số chỗ khá lằng nhằng, em cũng không biết trình bày sao nữa. :D
     
    tducchau thích bài này.
  2. 4DHN

    4DHN Tiêu Dao

    Đơn giản lắm:
    1. Mở sigil bằng chế độ Book View
    2. Mở một tủ sách bất kỳ rồi chọn tất cả trang (Ctrl+A), sau đó copy (Ctrl+C) là copy được trang 1
    H1.jpg
    3. Vào sigil, rồi paste, rồi để cho trỏ ở cuối chỗ vừa paste
    4. Lặp lại bước 2 (ở lần này thì ở tủ sách chọn trang 2
    H2.jpg )
    và bước 3.
    5. Sau khi đã copy hết các trang của Tủ sách (cụ thể là 39 trang của Tủ sách Tôn giáo) sang sigil thì chuyển sigil sang chế độ Code View
    6. Copy tất cả code trong sigil sang word.
    7. Dùng lệnh Find (Ctrl+H) ở chế độ Use Wildcard.
    Find: ?<h3*h3>?
    Rồi bấm Find / Main document
    Là nó sẽ highlight tất cả các chuỗi ký tự giữa <h3 và h3>, chỉ việc bấm Ctrl+C là copy hết luôn tất cả các cụm đó.
    H3.jpg
    8. Dán sang sigil ở chế độ Code View, rồi chuyển sang chế độ Book View là có được các dòng có link.
    9. Copy các dòng này sang excel rồi xử lý tiếp là OK.

    (Bây giờ quá khuya, chỉ viết tạm thế này, có gì chưa hiểu mong bạn tduchau cứ trao đổi tiếp).
     
    Chỉnh sửa cuối: 6/1/15
    tamchec, Deathshine and tducchau like this.
  3. tducchau

    tducchau "Nhặt lá..." Thành viên BQT

    ... :(! ...

    ... Loay hoay hoài, 3-4 lần mà sau khi chuyển trạng thái từ Code View sang Book View (trên Sigil 0.7.4 32 bit) thì ... thành ra một nùi vầy nè 4DHN & tamchec!...

    [​IMG]
    -> Vui lòng Hướng dẫn thêm! :)!

    (Nt: Mà mình nhớ không lầm thì trước có chế độ view-tree gì đó, chỉ cần copy lại bỏ vô excel xử lý chút là Ok mừ! :)!)

    À, hay tại máy mình chạy 64 bit (Windows Technical Preview + Google Chrome Canary) nên vậy chăng... ?!? ...
     
    Deathshine thích bài này.
  4. Deathshine

    Deathshine Administrator Thành viên BQT

    @tducchau : Cài teamviewer đó.
    Chỉ cần 2 người cùng xài teamviewer thì người kia có thể sử dụng máy tính của người này dù ở bất cứ nơi đâu có internet.
    @tamchec ơi Em dùng teamviewer giúp bạn @tducchau bằng hình ảnh cho nó sinh động dễ hiểu vụ này với Em, lâu rồi chị không xài cũng không rành lắm.

    @tducchau : Có thể tải tại đây Vui lòng đăng nhập hoặc đăng ký để xem link cài đặt lên máy tính và nhờ bạn @tamchec giúp cho Bạn nhé! 30s là xong, viết thì nhiều vậy chớ nhìn có tí xíu là rõ rồi ý :)
     
    thichankem and tducchau like this.
  5. 4DHN

    4DHN Tiêu Dao

    @tducchau:
    Đầu tiên hãy làm thử với 2-3 trang thôi.
     
  6. tducchau

    tducchau "Nhặt lá..." Thành viên BQT

    1 trang cũng bị mừ, các phần phía trên đều Ok, chỉ là lúc convert giữa Code View & Book View, Sigil la lỗi, đưa hai lựa chọn, Auto fix or manual, theo tamchec khuyên, dùng auto lun... ra vậy...

    Giờ ngóng cổ cò vậy! :)! ... Đang search tìm bản 64 bit trên Google... À, mình vừa cài xong Teamviewer...

    Hừ hừ!... Các bạn Hướng dẫn luôn cho tducchau làm cái luôn cái vụ nầy nha: tỉ dụ, một tựa đề mà có nhiều định dạng khác nhau, .prc, .epub, pdf,... thì làm thế nào, chả lẽ lại mỗi định dạng một dòng sao?!?... Thú thực, tducchau cũng chưa ưng bụng lắm với các bảng Mục lục... Vẫn cần 'đầu tư' thêm về mảng nầy a! :)!
     
    Chỉnh sửa cuối: 7/1/15
    Deathshine thích bài này.
  7. 4DHN

    4DHN Tiêu Dao

    Đây nhé, tôi đính lên đây 3 file word của 3 bước:
    - Bước 1: Code thu được sau chuyển từ book view sang code view (sau khi copy 2 trang vào chế độ book view).
    - Bước 2: Code còn lại sau khi dùng lệnh Find and Replace như trên.
    - Bước 3: Cái thu được sau khi chuyển từ code view sang book view ở bước 8.
    Tôi nghĩ bạn tducchau đã nhầm lẫn ở khâu nào đó.
    Đó là hồi TVE-4U xài phần mềm Vbulletin, còn bây giờ là Xenforo. :D

    À, bạn tducchau cũng copy các code ở từng bước như của tôi vừa làm xem nào! Có thể từ đó tìm ra sai sót ở đâu. :D

    @Deathshine: Cái hướng dẫn phía trên rất đơn giản, Deathshine cũng làm thử xem sao. :D

    "bạn tducchau cũng copy các code ở từng bước" -->> Copy rồi gửi lên đây nhé!
     

    Các file đính kèm:

    Chỉnh sửa cuối: 7/1/15
    tducchau thích bài này.
  8. tamchec

    tamchec Sinh viên năm I

    ?<h3*h3>?

    À, giờ mới để ý cái này có dấu ? ở cuối, anh @tducchau thiếu nên lúc copy chỉ được <h3*h3 mà thiếu dấu ">".
     
    tducchau and 4DHN like this.
  9. tducchau

    tducchau "Nhặt lá..." Thành viên BQT

    Rồi! Để tduchau 'tự xử' cho nhuyễn rùi sẽ lập thành bộ Hướng dẫn Căn bản lun! :)!

    À! bên cạnh cái dấu hỏi (?) đó, mới té ra thêm cái vụ chữ a thay cho chữ h nữa ... :(! mà a nầy cũng có 'xẹc' như h mới 'khủng bố' chớ! (</a></h3>) :)!! Đang mần tiếp...

    Trời Phật! 4DHN dự tducchau chỉ nên làm trước 2-3 trang thôi, mừ cái file của bác, mới mở thử bước 1 đã 118 trang rùi... :(! :)!...

    Tiếp luôn vụ cập nhật Mục lục cho các bài mới nữa 4DHN a! Vụ đó tamchec cũng 'chạy' luôn... :)!
     
    thanhbt and S.MOD like this.
  10. 4DHN

    4DHN Tiêu Dao

    2-3 trang là của Tủ sách mà chứ có phải là của file word hay sigil đâu. :)

    Như bạn @tamchec nói, bạn @tducchau đã thiếu dấu ?, đúng ra ở lệnh Find and Replace ô Find phải nhập: ?<h3*h3>? nhưng bạn chỉ nhập ?<h3*h3> sai sót là ở đó. Tôi cũng thử bớt dấu ? trong lệnh, đúng là nó ra "mớ bùi nhùi" thật. :D
     
    thanhbt and tducchau like this.
  11. tducchau

    tducchau "Nhặt lá..." Thành viên BQT

    HƯỚNG DẪN LÀM MỤC LỤC CHO CÁC TỦ SÁCH TVE-4U
    (
    Căn bản)

    - Các Giảng sư: 4DHN, tamchec.
    - Lục Sự: tducchau.​

    A. Các phần mềm cần thiết

    - Google Sigil Ebook Editor (Download tại Vui lòng đăng nhập hoặc đăng ký để xem link=;

    hoặc Vui lòng đăng nhập hoặc đăng ký để xem link (Sigil 64bit for Windows) _ Sigil là software miễn phí của Google cho phép bạn tạo, xem các tài liệu ePub, và làm việc với các ngôn ngữ đánh dấu mở rộng (XML) mã trực tiếp...

    - Microsoft Office (Word & Excel)

    B. Các bước thực hiện

    1. Chạy Sigil, giao diện mặc định của chương trình trong như hình dưới đây ( & ở chế độ Book View)

    [​IMG]

    - Click chọn chế độ Book View trên thanh công cụ

    [​IMG]

    2. Tiếp tục, theo Hướng dẫn của 4DHN & tamchec, các bạn mở một tủ sách bất kỳ trên TVE-4U, rồi chọn một trang nào đó cần tạo Mục lục, ví dụ ở đây là trang 1 của Tủ sách Tôn giáo

    [​IMG]

    Nhấn Ctrl+A (selec All), sau đó Click phải mouse chọn Sao chép hay dùng copy (Ctrl+C) trên keyboard đều được, thế là chúng ta đã copy được trang 1
    [​IMG]
    3. Vào Sigil, rồi paste, rồi để cho trỏ ở cuối chỗ vừa paste

    (Nếu các bạn sử dụng Sigil 64 bit thì sẽ có thêm một thông báo như thế này

    [​IMG]
    (chọn No)

    thì sẽ được như sau:

    [​IMG]
    4. Lặp lại bước 2 (ở lần này thì ở tủ sách chọn trang 2)

    [​IMG]

    và bước 3. (Nếu chúng ta muốn tiếp tục tạo thêm Mục lục cho các trang khác)

    5. Sau khi đã copy hết các trang cần thiết để làm Mục lục cho Tủ sách; Chúng ta thực hiện chuyển Sigil từ chế độ Book View sang chế độ Code View bằng cách nhấn vô nút Code View trên thanh công cụ

    [​IMG]

    Sẽ được như thế này

    [​IMG]
    6. Tiếp tục, các bạn nhấn Ctrl+A (selec All), rồi (Ctrl+C) là chúng ta đã thực hiện copy tất cả code trong Sigil, chuẩn bị dán (paste) sang Word để xử lý tiếp.

    7. Mở Word, rồi dùng lệnh Paste hoặc Ctrl+V dán tất cả code trong Sigil vừa copy vào Word; các bạn phải được như thế này

    [​IMG]

    Dùng lệnh Find (Ctrl+H) ở chế độ mở rộng

    [​IMG]

    Với Search Option ‘Use Wildcards’ được chọn

    [​IMG]

    Find what: ?<h3*h3>?
    Rồi bấm Find / Main document

    [​IMG]

    Là nó sẽ highlight tất cả các chuỗi ký tự giữa <h3 và h3>, chỉ việc bấm Ctrl+C là copy hết luôn tất cả các cụm đó.

    8. Chuyển qua lại Sigil; ở chế độ Code View (nguyên như ở bước 6), dán tất cả các đoạn vừa copy từ Word vào, chúng ta được thế này

    [​IMG]

    Nhấn nút Book View lần 1, Sigil sẽ bật ra một bảng thông báo

    [​IMG]

    [​IMG]

    Các bạn chọn nút Fix Automatically.

    Sau đó nhấn nút Book View lần 2 là Sigil sẽ chuyển qua hiển thị ở chế độ Book View có được các dòng có link.

    [​IMG]

    9. Copy các dòng này sang Excel rồi xử lý tiếp là OK. :)!


    THE END!


    (Nt: Mọi vấn đề ‘sắc mắc’… vui lòng liên hệ trực tiếp hoặc postmail cho các Giảng sư để được hỗ trợ. Xin cám ơn! :)! _ Ghi nhớ: chớ nên kiếm Lục Sự vì ‘hắn ta’ có thể còn ‘cùi bắp’ hơn cả bạn! :)!)

    Files đính kèm: - Hướng dẫn căn bản (.docx & .pdf); - Tổng Mục lục TVE-4U (bản thô, tính đến ngày 09.01.2015, .xlsx)
     

    Các file đính kèm:

    Chỉnh sửa cuối: 23/5/15
    thanhbt, Zhiqiang, hoalienbao and 4 others like this.
  12. Zhiqiang

    Zhiqiang \m/(∆_∆)\m/ Thành viên BQT

    Mọi người cho em hỏi, bây giờ nếu làm mục lục thì loại các tiền tố như thế nào ạ!
     
    4DHN thích bài này.
  13. 4DHN

    4DHN Tiêu Dao

    Ở word, dùng lệnh Find and Replace xóa. Ô Find nhập tiền tố và 1 khoảng trắng (nếu cần) ô Replace không nhập gì rồi bấm Replace all. Làm sao cho đầu dòng không có khoảng trắng. 3D_37:3D_28:3D_42
     
  14. 4DHN

    4DHN Tiêu Dao

    Cần thêm một số bước trong sigil sau khi lấy được các thẻ h3 nữa:

    - Làm gọn thẻ h3: <h3....> thành <h3>. Cái này để cho dễ đọc thôi, không có ý nghĩa gì lắm. Đại khái một dòng mục lục cuối cùng có dạng: <h3><a href="Vui lòng đăng nhập hoặc đăng ký để xem link">Tiêu đề thread</a></h3> là OK. :D
    - Tiền tố nằm trong thẻ span, nên cần xóa hết span đi.
    - Có cái ô đầu dòng nằm trong thẻ input nên cũng xóa thẻ đó đi.
    - Những chữ lặp lại ở trong thẻ h3 cần xóa (cả thẻ) đi như: Nội Quy Thư viện Ebook TVE-4U (áp dụng từ 21:54 ngày 26.07.2016) (chú ý nếu xóa ở regex thì thêm dấu \ trước dấu "(" và dấu ")" , GIÚP TVE-4U MỘT TAY VỚI 5 PHÚT MỖI NGÀY, CÙNG ĐÁNH MÁY, CÙNG SOÁT LỖI CHÍNH TẢ, còn một dòng chữ tiếng Anh mà tôi quên mất nội dung (hình như chỉ khi đăng nhập bằng nick của Mod mới có) nữa cũng lặp lại. Những cái này có thể xóa ở word cũng được.

    Cuối cùng khi đã có những dòng sạch về nội dung thì copy từ sigil sang Word và cần xóa khoảng trống đầu dòng trước (bằng Word) khi xử lý bằng Excel.

    Lệnh

    Find: ^p^w
    Replace: ^p

    ^w là một khoảng trắng có thể thay bằng 1 lần gõ phím Space, cần phải xóa sạch nếu không Excel nó không sắp xếp theo thứ tự được.

    Kinh nghiệm: nếu gặp trường hợp một Box có rất nhiều trang như Tủ sách VHNN (129 trang - khi copy code chưa xử lý vào word là hơn 4000 trang) thì cần chia ra làm 2 hoặc 3 file epub hoặc nhiều file html (trong 1 file epub) cho dễ chạy, nếu để dài quá epub sẽ load rất chậm. Cuối cùng khi được code gọn ghẽ sẽ ghép lại (tất nhiên là sẽ đọc ở Bookview) hoặc copy nội dung từng file sang Word. :D
     
    thanhbt thích bài này.
  15. 4DHN

    4DHN Tiêu Dao

    Để minh họa cho code của thẻ h3 chưa xử lý tôi copy nguyên một thẻ để so sánh:

    Chưa xử lý:

    0001.jpg

    Hiển thị thành:

    Vui lòng đăng nhập hoặc đăng ký để xem link Vui lòng đăng nhập hoặc đăng ký để xem link

    Trong Word hoặc chế độ Bookview nó như thế này:

    upload_2017-1-6_10-40-5.png

    Đã xử lý:

    0002.jpg

    Hiển thị thành:

    Vui lòng đăng nhập hoặc đăng ký để xem link
     
  16. Caruri Tlkd

    Caruri Tlkd Sinh viên năm II

    @4DHN: bác cho xin vài cái ảnh minh họa với, sao cái đoạn này không thấy đâu nhỉ?

     
  17. 4DHN

    4DHN Tiêu Dao

    Cái đó lạc hậu rồi, vì nó phù hợp với forum dùng Vbulletin, không phù hợp với dạng hiện tại là Xenforo.
     
  18. Caruri Tlkd

    Caruri Tlkd Sinh viên năm II

    Tôi gõ thử /archive như một số site nhưng site này báo lỗi không có trang.

    Vậy làm theo cách của bác tducchau à?
     
  19. 4DHN

    4DHN Tiêu Dao

    Đọc kỹ topic đi. :p
     
  20. inno14

    inno14 Lớp 7

    Hì, xenforo + calibre mà getlink + title hết box luôn chắc chưa đến 10' đó anh Tư ơi :)
    • Đoạn code trong ảnh minh họa:
    Mã:
    #Find: data-previewUrl=.*?\.(\d+).*?>(.*?)</a>
    def replace(match, number, file_name, metadata, dictionaries, data, functions, *args, **kwargs):
        toc='''[URL='http://tve-4u.org/threads/'''+match.group(1)+'''']'''+match.group(2)+'''[/URL]'''
        print(toc)
        return ''
    replace.file_order = 'spine'
    • Ảnh minh họa:
    F12
    [​IMG]
    Copy hết cho vào Calibre edit book
    [​IMG]
    Chạy code regex function trên
    [​IMG]
    Replace all
    [​IMG]
    Xong!
    [​IMG]
     
    Chỉnh sửa cuối: 18/10/17
    Lan Giao, 4DHN, thanhbt and 3 others like this.

Chia sẻ trang này