Hỏi đáp Số lượng đầu sách cũ trước năm 75

Thảo luận trong 'Hỏi đáp - Góp ý' bắt đầu bởi deathshine, 22/4/15.

  1. deathshine

    deathshine Administrator Thành viên BQT

    Hi mọi người,

    Sắp tới TVE-4U sẽ thực hiện dự án "SỐ HÓA SÁCH CŨ"
    Ngoài những sách xuất bản trước năm 2000 thì còn có một lượng lớn số lượng sách xuất bản trước năm 75, đây là nguồn sách quý, cần giữ gìn còn lưu lạc đâu đó trong tủ sách của những người yêu sách, trong những thư viện lớn.

    Mình không hình dung được là số lượng bao nhiêu, các cao nhân biết thông tin có thể chia sẻ với chúng mình:
    1. Số lượng đầu sách cũ xuất bản trước năm 75.
    2. Nếu tốt hơn nữa thì thêm cho chúng mình một chút thông tin về vùng miền, địa điểm nơi có đầu sách.

    Khi có số lượng đầu sách và vùng miền rồi bản thân mình sẽ có thể hình dung ra được khối lượng công việc. Bàn bạc với BQT rồi tuyển nhân sự và có kế hoạch tương ứng.

    Mình chia sẻ một chút: Bản thân là admin của diễn đàn này nhưng mình không hề biết làm 1 quyển ebook, không biết tì tí ti gì về thống kê sách, thể loại sách, không tiền, không kiến thức, không kỹ năng và còn không nhiều thứ nữa.
    Mình chỉ có duy nhất 1 trái tim muốn làm cuộc sống đẹp hơn bằng mục tiêu, công việc cụ thể, cái gì không biết thì hỏi.

    Mong mọi người giúp BQT và mình một tay nhé!

    Trân trọng,
     
  2. Số lượng sách cũ trước 1975, có các trang sách cũ như timsach.com cũng có rất nhiều. Chúng ta có thể số hóa tủ sách từ trang này rồi đóng gói eBook thành bản quyền của tve-4u.org. Chị thấy thế nào ?
     
  3. hanhdb

    hanhdb Sinh viên năm II

    Chà câu hỏi này không dễ trả lời, nhưng mình sẽ cố gắng thử giải đáp dựa trên kiến văn hạn hẹp.
    Bao nhiêu:
    sách cũ là quốc ngữ hay chữ nôm, chữ Hán, tiếng Pháp?
    Vì chữ Nôm, chữ Hán, tiếng Pháp nằm ngoài khả năng của chúng ta. Nên chỉ tập trung vào chữ Quốc ngữ thôi:
    - Từ 1860 đến 1920: số sách xuất bản không nhiều mỗi năm chỉ 100 cuốn là hết cỡ: lượng sách khoảng 4000 cuốn. Có lẽ còn ít hơn vì chữ quốc ngữ chưa phổ biến. Số lượng phát hành mỗi cuốn chừng 100 - 200 bản. Một số cuốn sách được in dưới dạng mộc bản 5-10 bản, chắc chỉ còn trong kho của một số nhà sưu tập có tiếng.
    - 1920 - 1945: khoảng 500 cuốn/năm: 20x 500: 10000 cuốn
    - 45-75: 1000 cuốn/ năm: 25000 cuốn
    Tổng cộng tạm tính 40000 cuốn. Nếu sử dụng nguyên lý parento: số sách giá trị và hay chiếm 10 - 20% khoảng 4000 - 8000 cuốn. Tương đương 2000.000 - 4000.000 trang sách = 10.000.000.000 :D - 20.000.000.000 chữ ( giả định một cuốn trung bình 500 trang, 1 trang có 500 chữ).
    Việc tìm hết là gần như không thể, vì trong thế kỷ 20 Việt Nam có 2 lần "đốt sách chôn nho" cộng với khí hậu nóng ẩm điều kiện bảo quản kém. Rất nhiều đầu sách đã tuyệt bản.
    Ở đâu:
    - Diễn đàn Sachxua: Diễn đàn này tập trung nhiều nhà sưu tầm sách cả nước. Ngoài ra trang timsach cũng có một số.
    - Các nhà sưu tầm sách chủ yếu ở TP lớn: Nha Trang (Vienteacher của Sachxua), Đồng Tháp (bác Sadec TVE cũng ở ĐT) đặc biệt là Huế, Hà Nội (Dư 180 Bà Triệu, a Giang 27 Ngô Thì Nhậm, bác gì ở Bát Đàn, Hợp - sách cũ Hà Thành), Sài Gòn (Giaygoixoi, sài gòn mình không rõ lắm).
    - Thư viện quốc gia, Viện Bác Cổ, thư viện khoa học tự nhiên HCM: ba nơi này không thể tiếp cận với những tài liệu quý.
    - Thư viện quốc gia Pháp: họ có đưa một số tài liệu lên net. Bản " chuyện đời xưa" mình tìm trên trang của họ. (Bác Sadec mới gửi cho mình bản làm lại của nhà Khai Trí, mừng quá.). Nếu có nơi nào có nguồn tài liệu đầy đủ nhất mình nghĩ nó nằm ở đây vì người Pháp họ lưu trữ rất cẩn thận và khoa học.
    Thế nào:
    Với số lượng khổng lồ ở trên, quan điểm của mình là không xơi hết được ngay và luôn đâu. Nên cần có một chiến lược lâu dài và kế hoạch rõ ràng đồng thời cần hoàn thiện quy trình số hóa.
    Mục tiêu Số hóa: là chúng ta phải scan, nhận dạng soát lỗi để chế bản ra bản text thuần dưới dạng ebook dạng epub, mobi, hay pdf. Điều đó mới đảm bảo tiếp cận sâu rộng tới người đọc và thực sự đáng bỏ sức làm.
    Những tác phẩm ưu tiên phải đảm bảo một trong các tiêu chí:
    - Những tác phẩm tiêu biểu có giá trị văn hóa lịch sử:
    - Sách của những tác giả nổi tiếng: ví dụ về văn hóa có Đào Duy Anh, Hoàng Xuân Hãn, Sơn Nam, Toan Ánh, Nguyễn Hiến Lê... Ví dụ Happiness Project đang số hóa Việt Nam Sử cương - Đào Duy Anh, Thú chơi chữ - Lãng Nhân (Bún đang soát). 4DHN và tamchec đang quản lý dự án Kinh Dịch của Ngô Tất Tố.
    - Những tác phẩm quốc ngữ thời kỳ sơ khai có ý nghĩa mở đường: của Trương Vĩnh Ký, Huỳnh Tịnh Của, tạp chí Nam Phong, Tự Lực Văn Đoàn...
    - Mảng sách miền Nam 1954 -1975: vì hoàn cảnh lịch sử thời mới GP bị tiêu hủy rất nhiều. Mình thực sự rất quan tâm mảng sách dịch trong thời gian này.
    Điểm thuận lợi:
    - Gần đây lượng sách cũ hoặc cổ đã được tái bản lại rồi nên không nhất thiết phải dùng sách cũ scan: Bộ góc nhìn Sử Việt của Alphabook (nghe bảo khoảng 100 cuốn), nxb Trẻ cũng tái bản nhiều cuốn cũ của Nguyễn Duy Cần, trước 75... Tạm thời có thể dùng nguồn sách này cho dễ số hóa.
    - Sách của cụ Nguyễn Duy Cần, Duyên Anh, Nguyễn Hiến Lê, Hồ Biểu Chánh... cũng đã được số hóa khá nhiều trong vòng 10 năm trở lại đây, diễn đàn cũng số hóa hòm hòm (công bác Goldfish lớn lắm).
    Deathshine có băn khoăn thì mình sẽ xây dựng một danh sách trong vòng 160 năm từ khi chữ Quốc Ngữ ra đời cho bạn tham khảo. Chắc khoảng 200 cuốn - số hóa được số lượng này cũng là một thành công lớn rồi. Chỉ sợ không có người soát thôi chứ với loại sách chưa tuyệt bản thì việc chọn và bỏ sức tìm sách chúng ta sẽ làm được. Rất nhiều bản sách mình đã nhờ bác Sadec và một số người khác tìm hộ, nhiệt huyết của cộng đồng và sức mạnh của đám đông là vô tận.
     
    Chỉnh sửa cuối: 22/4/15
  4. deathshine

    deathshine Administrator Thành viên BQT

    Thư viện KHTN HCM có phải là thư viện KH Tổng Hợp ở 69 Lý Tự Trọng, Q1 không?
    Trong thư viện đó có cho scan đó, nhưng mà cũng hạn chế.
    Hồi còn sinh viên mình ăn dầm ở dề nơi đây suốt mấy năm riết mấy cô quen mặt luôn nhưng mà hồi đó mình đâu có liên quan gì tới TVE nên mình chỉ vô đó đọc sách khoa học, đọc báo và sách kinh tế thôi nên mình cũng không biết nhiều về nó lắm.

    Chờ thông tin từ Bạn.
     
    nguyễn công minh thích bài này.
  5. hanhdb

    hanhdb Sinh viên năm II

    Chính xác là em nó. Thành lập từ thời Pháp thuộc. Sinh viên chỉ tiếp cận tài liệu gần đây thôi. Nếu muốn mò vào kho tài liệu cổ phải có thẻ kiểu nghiên cứu làm luận án luận văn gì đó. Thư viện này hỏi @bun_oc sẽ rõ hơn.
     
  6. 4DHN

    4DHN Tiêu Dao

    Hồi xưa, tôi còn nguyên một tờ Nhân Dân giấy ố vàng khè, xuất bản năm 1958 hay 1956 không nhớ. Thấy có mấy bài tố cáo tội ác Mỹ Diệm và thắng lợi của sản xuất nông nghiệp miền Bắc XHCN. Xong rồi không tìm thấy đâu, nhưng chắc không mất. Chắc nằm kẹt trong tủ sách. :(
     
  7. teacher.anh

    teacher.anh Rùa lười Thành viên BQT

    Mình có một số tờ báo và một số bản chép tay vài bài báo cả báo Việt lẫn báo Pháp giai đoạn từ năm 54 đến 86; Vài quyển tài liệu chuyên ngành Hoá silicat bản tiếng Đức, tiếng Nga dành cho trình độ bậc đại học, đào tạo tiến sĩ; Hồi ký viết về ông Nguyễn Văn Nguyễn, Nguyễn An Ninh... Không biết nhà ta có cần không hay đã có chưa?
     
  8. nguyenthanh-cuibap

    nguyenthanh-cuibap Cử nhân

    Mình đề nghị Add mở thêm một box nữa ( phòng 5) với 1 chuyên mục một mà thôi: SÁCH XƯA hoặc SÁCH CỔ và kêu gọi các thành viên tích cực sưu tầm những tác phẩm xưa có thời gian xuất bản từ 1975 trở về trước - thậm chí có những tác phẫm ở các thế kỉ trước - đưa vào box ở mọi định dạng ( Epub, PDF, Prc...) cho mọi người tham khảo ( thí dụ như những tác phẫm: Việt sử tiêu án của Ngô Thời Sĩ ở thế kỉ 18, Đại việt thông sử của Lê Quý Đôn thế kỉ 18, Nam kì phong tục nhơn vật diễn ca của Nguyễn Liên Phong đầu thế kỉ 20 (1909)....đã được dịch thuật hiệu đính lại. Tất cả những dạng sách đó đều cho vào box sách xưa (sách cổ) để những ai thích sưu tầm" đồ cổ thì vào đấy mà tìm.
     
  9. 4DHN

    4DHN Tiêu Dao

    Sao không thấy ai nhắc đến mảng này nhỉ?
    11077921_436351639866934_9143011396964600743_n.jpg
    Nói một cách nghiêm túc, mấy cuốn này mà có ai bán, 200k 1 cuốn tôi cũng mua. :D
     
    maihuu, viettran_ru, tducchau and 5 others like this.
  10. 4DHN

    4DHN Tiêu Dao

    Ở Vui lòng đăng nhập hoặc đăng ký để xem link có rất nhiều tấm bản đồ quy hoạch của người Pháp ở Đông Dương. Hồi xưa có 1 lần chém gió tranh luận với 1 HVB để xem người Pháp có công hay có tội. Thế là tìm ra trang này để làm bằng chứng. :D

    Quy hoạch Bà nà 1921:
    [​IMG]

    Sài Gòn 1861:
    [​IMG]

    Quy hoạch Sài gòn 1867:
    [​IMG]

    Quy hoạch Sài Gòn 1893:
    [​IMG]

    Quy hoạch Hà nội 1885. Ngày xưa còn có hồ Hàng Đào. :D
    [​IMG]
     
    Chỉnh sửa cuối: 22/4/15
  11. deathshine

    deathshine Administrator Thành viên BQT

    Mình cũng quan tâm đến những mảng sách này, đặc biệt là sách bị tiêu hủy.


    Bạn xây dựng giúp mình với đi, mình không giỏi mấy việc này lắm.

    Mình thì dự tính là chọn khoảng 1000 quyển, lý do: Vì số 1000 là con số dễ kêu gọi vận động mọi người chung tay hơn.
    Mình mong TVE-4U làm gì cũng được sự chung sức của nhiều người.
     
    fyafog, viettran_ru, tducchau and 2 others like this.
  12. deathshine

    deathshine Administrator Thành viên BQT

    Tất nhiên nếu được 1000 quyển đúng theo yêu cầu thì chúng ta có thể làm ra 2000 - 3000 quyển vì nhiều khi tự dưng bắt gặp quyển sách hay, điều kiện thuận lợi -> làm luôn.

    Con số 40.000 nó hơi nhiều mà.
     
    tducchau and hanhdb like this.
  13. angoc1234

    angoc1234 Lớp 2

    Có thể nhờ mấy bác trên diễn đàn sachhiem , sachxua scan sách để chúng ta đánh máy được không nhỉ?
    Máy scan chuyên nghiệp quét xong nhận dạng ra file ebook luôn hả bác hanhdb
     
    Chỉnh sửa cuối: 23/4/15
  14. 4DHN

    4DHN Tiêu Dao

    Tôi đã viết một ý kiến tương tự như thế này ở Vui lòng đăng nhập hoặc đăng ký để xem link ở post #91. Cần chú ý là làm ebook mới tốn thời gian gấp nhiều lần là chế bản lại ebook cũ vì chế bản lại ebook cũ chỉ tốn thời gian soát lỗi chính tả. Con số 2000 - 3000 ebook mới là con số khủng khiếp! :eek:

    Chỉ tính riêng khâu scan hoặc chụp ảnh thì mỗi tuần cố sức cũng chỉ được độ 400 trang vì chỉ có thể làm vào ngày nghỉ. Cái máy scan chuyên nghiệp như bạn @hanhdb nói không thể có được với điều kiện cá nhân.
    Cũng trong topic đó tôi có một ý kiến quan trọng ở post #101 về nơi lưu trữ ebook cũ được chế bản lại mà không thấy phản hồi, chắc Ad chưa đọc?
     
  15. 4DHN

    4DHN Tiêu Dao

    Với điều kiện là sách phải in đẹp cơ, sách cổ, công nghệ in lạc hậu thì phần mềm nhận dạng bó tay, buộc phải đánh trực tiếp. Ví dụ Vui lòng đăng nhập hoặc đăng ký để xem link đang nóng hổi. :D

    À, với sách mới, sau khi dùng phần mềm nhận dạng (xuất text từ file ảnh, scan ra word) còn phải soát lỗi phê lòi mắt mới ra được ebook đấy bạn. :)
     
  16. deathshine

    deathshine Administrator Thành viên BQT

    Đừng nói làm không được!
    Hãy nói làm thế nào để đạt mục tiêu được không các bạn?
    Làm cái gì mà có chữ: không được, không thể, khó khăn... thì chưa đánh đã thua rồi còn gì? :D :D :D

    Việc số hóa sách đâu chỉ có mình các bạn làm, nếu có dấn thân mình cũng chỉ đề nghị các bạn làm trong khả năng thôi, mình đâu có quăng cả 1000 quyển sách trên vai các bạn đâu :p :D :D
     
    Chỉnh sửa cuối: 23/4/15
    Thekids66, whatcsvt100 and tducchau like this.
  17. deathshine

    deathshine Administrator Thành viên BQT

    Thôi nói chung là câu hỏi của mình đã được trả lời rồi :).
    Cảm ơn bạn @hanhdb nhiều lắm.

    Các bạn kinh nghiệm cho mình biết thêm với 1 quyển sách 500 trang:
    Trung bình
    - 1 quyển ebook với sức 1 người làm thì mất thời gian bao lâu? (chỉ tính đúng thời gian làm, ví dụ 1 ngày bỏ ra 10p thì chỉ tính 10p đó thôi nhé)
    - Nếu 2 người thì mất bao lâu?
    - Nếu 3 người thì mất bao lâu?

    Cảm ơn các bạn rất nhiều.
     
    tducchau thích bài này.
  18. 4DHN

    4DHN Tiêu Dao

    Đánh máy thì tùy theo tốc độ có người nhanh có người chậm (phải có người cụ thể trả lời). Còn soát lỗi nhận dạng thì 2 giờ liên tục được 60 trang suy ra 10 phút được 5 trang. Đó là tính cho 1 người, còn 2, 3, 4... thì cứ nhân lên (quên mất, đây là tính với sách đẹp). :D

    Nói chung, đã chơi số hóa ebook, tối thiểu phải bỏ ra mỗi ngày 1 giờ, chứ không ai chỉ bỏ ra 10 phút. :D
     
  19. deathshine

    deathshine Administrator Thành viên BQT

    Em sau khi đi HN và TN về em đọc sau Anh nhé!
    Em chỉ có thể tập trung từng cái 1.
    Giờ đang tính coi số lượng sách như thế nào để đi khỏi SG, xa rời nền văn minh thì em có thời gian sắp xếp công việc, lên kế hoạch....trong những lúc rảnh rỗi nên em hỏi cái này trước.

    Mấy cái lưu trữ đó Anh cứ đề xuất, nếu hợp lý thì ok làm luôn, em không có ý kiền ý cò gì đâu.
     
    tducchau thích bài này.
  20. deathshine

    deathshine Administrator Thành viên BQT

    Ý em là ví dụ cụ thể ra! Chứ không phải là 10p :D :D
    Em sợ nhất là mấy từ: rất khó khăn, rất nhiều, rất tốt... mà không có số liệu đi kèm cụ thể, làm răng mà tưởng tượng được :D :D
     
    tducchau thích bài này.

Chia sẻ trang này