Hướng dẫn Soạn từ điển điện tử

Thảo luận trong 'Hướng dẫn chung' bắt đầu bởi DeanN, 22/4/16.

  1. DeanN

    DeanN Mầm non

    Soạn từ điển với phần mềm-Phần 1

    Dù với công trình soạn thảo công phu như tự điển, từ điển, hay đơn giản hơn như bảng tra, danh sách, các phần mềm chuyên dụng ngày nay giúp ích cho ta tiết kiệm được công sức rất nhiều và đa năng trong cách truyền tải đến người đọc.

    Các ứng dụng dùng soạn từ điển thường bắt ta soạn từ khởi đầu từng chữ một. Nhưng nếu ta đã có một khối dữ liệu sẵn (nội dung cuốn từ điển), thì việc nhập liệu không đơn giản. Chẳng lẽ ta lại đánh máy lại? Do đó một ứng dụng tốt sẽ giúp bạn:

    -nhập hàng loạt dữ liệu đã có vào ứng dụng mà không đòi hỏi nhiều công sức (importing)

    -xấp xếp theo thứ tự do bạn qui định (sorting) và có thể hoán chuyển các thứ tự với nhau.

    -tạo được bản in trên giấy (printing).

    -tạo được bản trên trang web mà không cần biết chút gì về lập trình (on-line dictionary).

    -tạo được bản trên máy tính hay trên điện thoại mà không cần phải truy cập internet (off-line application).

    Một ứng dụng như thế thật tế chưa có, nhưng tôi sẽ giới thiệu với các bạn cách tôi đã làm và tôi nghĩ ai cũng có thể làm được.

    Tôi xin lấy thí dụ về bảng tra chữ tắt y khoa Anh-Việt, Việt Anh trong địa chỉ web dưới đây:

    Mã:
    http://dinhvan.ca/Medical Abbr/lexicon/index.htm
    Như bạn thấy, bạn có thể tìm chữ qua 3 hạn mục: theo chữ tắt, theo tiếng Anh, theo tiếng Việt.

    Các ứng dụng tôi dùng để soạn ra bộ tra on-line nầy theo thứ tự gồm:

    1.MS Word (hoặc Libre Office Writer): để xếp dữ liệu có sẵn vào bảng (tables)

    2.MS Excel (hoặc Libre Office Calc): ứng dụng trung chuyển để nhập dữ liệu vào SheetSwiper.

    3.SheetSwiper: ứng dụng trung chuyển để nhập dữ liệu vào FLEx

    4.FLEx (Fieldwork Language Explorer): ứng dụng chính thức để quản lý từ điển.

    5.Lexique Pro: ứng dụng trình bày từ điển.

    Ba ứng dụng dưới đều miễn phí và sử dụng không bị hạn chế. Hai ứng dụng trên (MS Office) là quá phổ thông. Nếu bạn không muốn dùng chúng, bạn có thể thay thế bằng Libre Office (miễn phí)

    Nếu bạn không có dữ liệu ngay từ đầu mà chỉ bắt đầu nhập số liệu, bạn không cần ứng dụng 1, 2 và 3 mà đi ngay thẳng vào FLEx.

    Trong phần kế tiếp, tôi sẽ giới thiệu cách làm từng bước một và sẽ cung cấp cho các bạn ứng dụng 3, 4, và 5.
     
    Last edited by a moderator: 31/8/16
  2. hungbc1010

    hungbc1010 Lớp 4

    "Sắp xếp" bạn ơi! :)
     
  3. DeanN

    DeanN Mầm non

    Xin lỗi, sống ở nước ngoài đã hơn 25 năm, chổ làm lại không có một bóng người Việt nên chính tả mình quên gần hết, rán rà theo cuốn tự điển Hội Khai Trí Tiến Đức mà vẫn bị sót lỗi, đáng bị phạt 1 điểm!
     
  4. hungbc1010

    hungbc1010 Lớp 4

    Chỗ này cũng có 2 lỗi nè! Ráng lên nha bạn! :)
     
  5. DeanN

    DeanN Mầm non

    Hay quá, có ông thầy sửa (không phải sữa) lỗi cho để nhớ!
    Bài phần 2 viết rồi nhưng phải rà lại thêm lần nữa cách xài chữ cho chắc ăn. Coi bộ viết bằng tiếng Anh nhanh hơn viết bằng tiếng Việt!
     
  6. quocsan

    quocsan Lớp 12

    Rán = Ráng. :)
    [​IMG]

    ♪ZF²♪
     
    Zhiqiang thích bài này.
  7. DeanN

    DeanN Mầm non

    Soạn từ điển với phần mềm-Phần 2

    Giả định là bạn đã có dữ liệu (data), bạn phải sắp xếp thế nào để nạp vô ứng dụng quản lý từ điển?

    Trong ngôn ngữ học, mỗi từ gốc (headword) gọi là lexeme, ký hiệu \lx

    Từ gốc có nhiều trường (field), thí dụ trường từ loại (part of speech= danh từ, động từ, tính từ…), ký hiệu \ps; trường đồng âm khác nghĩa (homonym), ký hiệu \hm; trường đồng nghĩa khác âm (synonym), ký hiệu \sy; trường định nghĩa (definition), ký hiệu \dv; trường giảng nghĩa (gloss), ký hiệu \gv; trường từ nguyên (etymology), ký hiệu \et; trường phiên dịch (translation), ký hiệu \xn; trường phiên âm (phonetic), ký hiệu \ph v.v…Có cả hơn 60 trường như thế để cho ta sử dụng. Tuy nhiên ta chỉ cần một vài trường, tùy theo mục đích của từ điển ta soạn ra.

    Thí dụ bạn đã có sẵn bộ dữ liệu như dưới đây bằng dạng văn bản (text) gồm 10 hàng chia làm 3 cột:

    CHỮ TẮT Nghĩa tiếng Anh Nghĩa tiếng Việt

    AC, ac before meals trước bữa ăn

    Acc accommodation nơi ngơi nghỉ

    ACD* acid-citrate-dextrose chất chống đông máu ACD

    ACD** anterior chest diameter đường kính trước sau của ngực

    ACE Angiotensin-converting enzyme diếu tố chuyển đổi angiotensin

    ACG* angiocardiography mạch tâm đồ

    ACG** apex cardiogram tâm đỉnh đồ

    ACH adrenocortical hormone nội tiết tố vỏ tuyến thượng thận

    ACL anterior cruciate ligament dây chằng chữ thập trước


    Chú ý: một từ có nhiều nghĩa được tách ra với dấu * (nghĩa 1), ** (nghĩa 2)…

    Bạn đưa các hàng và các cột đó vào bảng (tablet) trong MS Word hay trong MS Excel. Vì tôi không rành Excel lắm nên dùng MS Word (bạn nào rành Excel xin chỉ giáo cho)

    Dùng MS word, “Select” toàn bộ văn bản, chuyển dạng văn bản qua dạng khung (Insert ->Table -> Convert Text to Table…)

    [​IMG]
    Thế là ta có 3 cột: cột chữ tắt, cột tiếng Anh và cột tiếng Việt.

    Word3.png


    Tôi muốn thêm 2 cột nữa, một cột cho cụm từ đồng âm khác nghĩa là ACD và ACG, và một cột cho phần chú thích. Bằng lệnh “Insert Columns to the Right” tôi thêm 2 cột nữa bên phải cột chữ tắt và cột tiếng Việt. Tổng cộng tôi có 5 cột.

    [​IMG]

    Word4.png
    Trong hàng đầu tiên, tuần tự thay các chữ bằng ký hiệu \lx, \hm, \ge, \gn, \cf vào 5 cột:

    Word5.png
    Chú ý: các dấu * và ** ở cột 1 được thế bằng 1 và 2 ở cột 2.

    Giải thích: Đây là cách sắp xếp theo ngôn ngữ học. Trong trường hợp này, mỗi cột đại diện cho một trường (field) theo ý muốn của người soạn. Ta không nhất thiết là phải giữ 5 cột mà có thể chỉ dùng 2 cột hoặc làm cả 10 cột tùy thích, miễn sao theo đúng ký hiệu qui định của ngôn ngữ học.

    Cột đầu tiên: \lx Đây là cột từ gốc (lexeme).

    Cột thứ 2: \hm 1 và 2 là nghĩa thứ nhất và nghĩa thứ hai (homonyms)

    Cột thứ 3: \gv Nghĩa theo ngôn ngữ thứ nhất (vernacular gloss).

    Cột thứ 4: \gn Nghĩa theo ngôn ngữ thứ hai (national gloss).

    Cột thứ 5: \cf Tham khảo (cross-reference): nếu cần chú giải gì thêm.

    Bạn có thể tham khảo thêm chi tiết về các trường trong cuốn “Making Dictionaries” của Coward và Grimes.
    Link download:
    Vui lòng đăng nhập hoặc đăng ký để xem link

    Cuối cùng, ta “Save” dữ liệu dưới dạng doc hay docx.

    Bước kế tiếp: chuyển dạng doc sang dạng db qua trung gian của Excel và SheetSwipe.
     
    Chỉnh sửa cuối: 24/4/16
  8. VọngAlpha

    VọngAlpha Lớp 2

    Cảm ơn bạn. Hy vọng có phần 3
     
  9. hungbc1010

    hungbc1010 Lớp 4

    Hôm nay mới biết cái từ "rán" này lâu nay đang bị nhiều người sử dụng sai thành "ráng" (trong đó có mình) :p
     
  10. quocsan

    quocsan Lớp 12

    Đều đúng cả!
    [​IMG]

    ♪ZF²♪
     
  11. DeanN

    DeanN Mầm non

    Soạn từ điển với phần mềm-Phần 3

    Giờ thì bạn đã có tập tin dạng doc chứa bảng dữ liệu được sắp xếp từng cột theo trường (field) của ngôn ngữ học.

    Copy nguyên bảng dữ liệu, “Paste Special” với “Formated Text” vào ô A1 của Excel hay Libre Office Calc, rồi “Save As…” dưới dạng xls (Đừng save dưới dạng xlsx, Sheet Swiper sẽ không đọc được)

    [​IMG]

    Bạn nào rành Excel có thể nhập thẳng liệu vào Excel mà không cần qua MS Word. Sở dĩ tôi dùng Word vì tôi quen cách dùng sorting và replace của Word mà thôi.

    Sau khi đã có xls rồi, bạn nhập tập tin vào Sheet Swiper, “Save SFM…” có đuôi là .db

    Link:

    Vui lòng đăng nhập hoặc đăng ký để xem link

    SheetSwiper1.png
    SheetSwiper2.png

    Đó chỉ là text sắp xếp theo tiêu chuẩn của ứng dụng quản lý từ điển điện tử, như bạn đã thấy trong cửa sổ Review của Sheet Swiper.

    Bước kế tiếp: FLEx, ứng dụng của SIL.
     
    VọngAlpha, chis and Ngọc Sơn like this.
  12. newcomer1026

    newcomer1026 Mầm non

    Viết tiếp đi Vui lòng đăng nhập hoặc đăng ký để xem link ơi. Đại khái là mình cần làm 1 từ điển chạy được trên kindle. Mình có sẵn file word rồi. Bây giờ phải làm sao để có thể index trong kindle được.
     
  13. DeanN

    DeanN Mầm non

    Xin lỗi hiện nay mình quá bận để viết tiếp phần hướng dẫn, tuy nhiên nếu bạn có thể đọc được tiếng Anh thì là tiếp các bước sau:

    1. Download SIL Fieldwork Language Explorer (FLEx)(miễn phí). Link:
    Vui lòng đăng nhập hoặc đăng ký để xem link
    2. Install và mở FLEx -> File-> Import -> Standard Format Lexicon. Nhập file có đuôi db tạo ra bởi Sheet Swiper.
    3. Chỉnh sửa: đây là phần phức tạp nhất, bạn có thể phải xem hướng dẫn từ trang SIL (tôi mất khá nhiều thì giờ để chỉnh sửa như hiển thị các cột, font size, màu font v.v... Tuy nhiên nếu bạn muốn xuất ra kindle thì không cần màu, có thể không cần font size...)
    4. Export -> dạng XHTML, Classified dictionary hay Configured dictionary đều được.
    5. Vào Calibre -> Add books, nhập file XHTML, nó sẽ cho dạng ZIP.
    6. ->Convert books, chuyển ZIP thành MOBI hoặc AZW3.

    Thế là bạn có cuốn tự điển dùng trong Kindle, có table of contents (word list) và search từ. Chúc bạn thành công!
     
  14. newcomer1026

    newcomer1026 Mầm non

    Ví dụ mình có 1 file word Vui lòng đăng nhập hoặc đăng ký để xem link
    Bây giờ mình muốn tạo index cho các từ in hoa, đậm, đỏ
    Tạo liên kết với những từ liên hệ.
    1. Mình có tham khảo tạo từ điển bằng Mobipocket Creator. Cách này đơn giản,mình chỉ mất công copy và dán từng mục từ, có tạo liên kết với những từ liên hệ.
    2. Trên trang hướng dẫn sử dụng phần mềm Mobipocket. Vui lòng đăng nhập hoặc đăng ký để xem link có hướng dẫn tạo từ điển bằng mã html. Mình không rành về html, nhưng mình nghĩ có cách để thêm câu lệnh search vào file word (đã tạo index), rồi dùng phần mềm chuyển về file prc từ điển. Nếu có thể, bạn chỉ mình làm cách 2 này.
    Cám ơn bạn.
    Mình có file mẫu gửi bạn.
     

    Các file đính kèm:

  15. DeanN

    DeanN Mầm non

    Từ bài soạn trên MS Word mà copy, paste thủ công qua Mobipocket Creator thì từ chết tới bị thương. Phải soạn bằng Mobipocket Creator ngay từ đầu, chứ soạn xong mà hoán chuyển thì phải dùng cách tôi đã chỉ dẫn bên trên. May mắn tôi được xem mẫu tự điển của bạn (xin phép gọi là vậy, vì tôi đã trên 60), tôi có ý kiến để làm công việc bạn dễ dàng hơn như sau:
    1. Bạn đã chọn headword đúng (AARON, ABBA -> Heading 1), là chuẩn để Word làm Table of Contents.
    2. Nếu bạn muốn làm index (thí dụ:Môsê, tư tế, Messiah v.v.) dùng References->Mark Entry để soạn Index. Đây là chổ tốn công nhất. Bạn muốn index các từ đậm và đỏ thì dùng lệnh: Advanced Find->More->Find Format->Font->Font Style->Bold; Font Color_>Red; Không có lệnh tìm từ in hoa, trong trường hơp nầy có thể tìm Font Color->Blue.
    3. Nhập docx vào phần mềm Calibre, hoán chuyển thành mobi hay epub đều được. Các phần mầm đọc sách đều có chức năng tra chữ.
    Gởi lại bạn đã chuyển sang dạng mobi.
     

    Các file đính kèm:

  16. newcomer1026

    newcomer1026 Mầm non

    Chào bác DeanN, cám ơn bác đã hướng dẫn tận tình. Nhưng sau khi đã ra table of content rồi gồm các từ cần tra, con muốn có 1 ô search để tiện tra từ nữa thì phải làm sao? giống như các từ điển anh việt trên diễn đàn ấy.
    Cám ơn.
     
  17. DeanN

    DeanN Mầm non

    Trả lời bạn newcomer1026: Bận quá hôm nay mới có dịp vào TVE.
    Trước hết cần phải xác định cuốn từ điển viết cho ebook reader hay cho website?
    Nếu cho ebook reader, lúc nào nó cũng có chức năng search, tuy có thể có hình thái khác nhau. Dường như Kindle không cho phép tra chữ có dấu cho chữ Việt.
    Nếu cho website thì mỗi website builder có cách dựng khác nhau cho chức năng search. Riêng tôi thì dùng WordPress với plugin là CM Tooltip Grossary Pro+ có chức năng search rất đa dạng. Bạn có thể dùng bản miễn phí, tuy có ít chức năng hơn.
    Xin xem thử trang web tôi làm:
    Vui lòng đăng nhập hoặc đăng ký để xem link
     

Chia sẻ trang này