Thư viện số với hệ thống nguồn mở
Bạn đang xem tài liệu "Thư viện số với hệ thống nguồn mở", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
thu_vien_so_voi_he_thong_nguon_mo.pdf
Nội dung text: Thư viện số với hệ thống nguồn mở
- BẢN TIN THƯ VIỆN - CÔNG NGHỆ THÔNG TIN THANG 8 /2006 THƯ VIỆN S Ố với HỆ THỐNG NGUỒN MỞ NGUYỄN MINH HIỆP, BA., MS. GĐ. Thư viện Đại học Khoa học Tự nhiên TP. Hồ Chí Minh iện nay trên thế giới, xu thế phát ‘chiếc bánh’ theo yêu cầu và nhu cầu của triển HThư vi ện số đã trở thành một phần chủ người sử dụng. Nói một cách chuyên đạo trong toàn cảnh hoạt động thông tin thư nghiệp, chúng ta phải xây dựng những Bộ viện, trong khi phần mềm nguồn mở trở sưu tập kỹ thuật số nhằm hình thành Thư thành một hiện tượng toàn cầu. Giống như viện số. Những định nghĩa có giá trị sau nhiên liệu và động cơ trong kỹ thuật, nguồn đây cho chúng ta thấy rõ ý nghĩa này. mở và thư viện số là hai yếu tố không thể 1. Định nghĩa Thư viện số của tách rời. Liên đòan Thư viện số thế giới – DLF : “Thư viện số là một tổ chức cung cấp tài Thư viện số nguyên, bao gồm cả đội ngũ chuyên Từ năm 1994, một dự án xây dựng Thư nghiệp, để chọn lọc, cấu trúc, cung ứng viện số của Liên bang Hoa kỳ do bốn trường truy cập, biên dịch, phân phối, bảo quản đại học lớn thực hiện đã khai sinh ra Thư nguyên vẹn, và đảm bảo bền vững theo viện số. Đã có nhiều định nghĩa khác nhau thời gian những bộ sưu tập kỹ thuật số để về Thư viện số, tuy nhiên đều thống nhất sẳn sàng phục vụ cộng đồng một cách một mục tiêu chung xây dựng Thư viện số là kinh tế” . nhằm đối phó với tình trạng ‘quá tải thông DLF (Digital Library Federation) là tin – information overload’ đồng thời tiến một liên hiệp thư viện và các cơ sở liên hệ hành ‘quản lý tri thức – knowledge có nhiệm vụ tổ chức việc sử dụng công management’. nghệ thông tin điện tử nhằm mở rộng việc Tri thức là thông tin có ý nghĩa và hữu sử dụng các bộ sưu tập và phát triển dịch ích. Xây dựng Thư viện số là chọn lọc, sưu vụ. tầm, và tổ chức thông tin có ý nghĩa và hữu 2. Định nghĩa Thư viện số của ích hay tri thức nhằm đáp ứng đúng yêu cầu TS. Ian Witten : của người sử dụng. Theo Branscomb, một “Thư viện số là tập hợp những bộ sưu nhà kinh tế tri thức thì ‘Nếu ví thông tin như tập thông tin của các đối tượng số hoặc bột mì thì tri thức chính là bánh mì’. Dựa đã được số hóa có tổ chức và tập trung. vào lời ví von đầy ý nghĩa đó, ta có thể hiểu Tập trung theo đề tài hay chủ đề và có tổ một cách nôm na rằng ‘Xây dựng thư viện số chức để thông tin dễ truy cập và lưu trữ là làm những chiếc bánh mì’. Hay nói một theo những tiêu chuẩn chuyên biệt cung cách khác, nếu chúng ta xây dựng thư viện cấp hai khả năng chính: số có nghĩa là chúng ta không phải chỉ phục • P hương thức truy cập, chọn lọc, vụ ‘bột mì’ tức là tài nguyên thông tin mình hiển thị tài nguyên số (dành cho có, mà phải nhào nắn bột mì đó thành những người sử dụng); 2
- BẢN TIN THƯ VIỆN - CÔNG NGHỆ THÔNG TIN THANG 8 /2006 • Phương thức xây dựng, tổ chức và nguồn mở đa ngôn ngữ thư viện số lưu hành (dành cho cán bộ thư viện). Greenstone (Greenstone digital library TS. Ian Witten là chuyên gia Thư viện multilingual open source software). số của Đại học Waikato, New Zealand, chủ biên Phần mềm nguồn mở Thư viện số Hệ thống nguồn mở Greenstone. Phần mềm nguồn mở cũng có một mối quan hệ cộng đồng. Mặc dù những định Bộ sưu tập nghĩa về Phần mềm nguồn mở luôn chú Một bộ sưu tập thông tin bao gồm trọng đến việc có thể sử dụng mã nguồn, nhiều tài liệu dưới nhiều dạng thức khác điều chúng ta đáng lưu ý hơn là phần mềm nhau: văn bản, hình ảnh, âm thanh, hình ảnh nguồn mở được tạo nên và nuôi dưỡng bởi động. Tài liệu là đơn vị căn bản từ đó sưu một cộng đồng. OSI (Open Source tập thông tin được xây dựng. Một bộ sưu tập Initiative), đã nắm giữ thương hiệu phần có thể chứa nhiều loại tài liệu khác nhau. Ví mềm nguồn mở, là một tổ chức phi lợi dụ một bộ sưu tập về đề tài "Phố cổ Hội An" nhuận nhằm thiết kế nên việc quản lý và sẽ bao gồm những tài liệu dạng văn bản về xúc tiến việc xác định quyền hạn của lịch sử, văn hoá, phong tục, vv ; tài liệu nguồn mở đối với sản phẩm công cộng, đã dạng hình ảnh về những di tích, trang phục, có một định nghĩa về phần mềm nguồn mở các bản thiết kế, vv ; tài liệu dạng âm như sau: thanh về những bài hát, dân ca, vv ; tài “Phần mềm nguồn mở không chỉ là liệu dạng phim về những lễ hội, sinh hoạt một thuật ngữ cho biết việc có thể sử cộng đồng, vv Một bộ sưu tập chứa nhiều dụng mã nguồn, mà còn sử dụng những tài liệu với dạng thức khác nhau, tuy nhiên tiêu chí bao gồm việc tự do phân phối cung cấp một giao diện đồng nhất qua đó tất phần mềm ứng dụng, cũng như dự cả các tài liệu có thể được truy cập, mặc dù phòng cho việc sử dụng tương lai của cách mà tài liệu đó hiển thị sẽ tuỳ thuộc vào những mã nguồn nhằm chỉnh sửa và phương tiện và dạng thức của tài liệu đó. thực hiện việc mở rộng ứng dụng mà Một bộ sưu tập như thế trước khi trình không phân biệt đối xử giữa những bày phải qua một quá trình hình thành để tạo người hay nhóm người sử dụng chúng”. nên những cấu trúc hỗ trợ cho việc truy tìm Phần mềm nguồn mở thường mang và lướt tìm được dùng cho việc truy cập sưu đặc tính như phần mềm tự do. Một sản tập. Khi xây dựng xong, bộ sưu tập có thể phẩm phần mềm nguồn mở sẽ thông được xuất bản trên Internet hoặc xuất ra CD- thường được phân phối với một giấy phép ROM một cách hoàn toàn tự động. Một khi khống chế việc sử dụng và phân phối sản sưu tầm thêm tài liệu mới, ta có thể dễ dàng phẩm đó. Richard Stallman, người sáng bổ sung thêm vào bộ sưu tâp bằng cách tái lập Dự án GNU (GNU là viết tắt của xây dựng. Gnu’s Not UNIX) và là người đứng đầu Một thư viện nói chung bao gồm nhiều trong thế giới phần mềm nguồn mở, cũng bộ sưu tập khác nhau, mỗi sưu tập tổ chức là người được giới Tin học Việt Nam đánh mỗi khác, tuy nhiên hoàn toàn giống nhau giá là “người cộng sản của xã hội phần về phương cách hiển thị. Những bộ sưu tập mềm” nhân dịp ông viếng thăm Hà Nội như thế có thể được tạo nên bằng một Phần vào tháng 3/2004, đã ấn định bốn loại tự mềm nguồn mở, chẳng hạn như Phần mềm 3
- BẢN TIN THƯ VIỆN - CÔNG NGHỆ THÔNG TIN THANG 8 /2006 do cho những phần mềm ứng dụng nguồn Tham gia ứng dụng phần mềm nguồn mở được hỗ trợ cho việc cấp giấy phép là: mở nhiều nhất đối với hầu hết những • Tự do chạy chương trình với bất người sử dụng máy tính là thông qua cứ mục đích nào; Internet, không chỉ bởi vì hạ tầng cơ sở • Tự do chỉnh sửa cho phù hợp với này được xây dựng dựa trên những ứng yêu cầu của mình; dụng phần mềm nguồn mở, mà còn bởi vì • Tự do tái phân phối bản sao để Internet đã trở nên có mặt mọi lúc mọi nơi, giúp người khác sử dụng; điều này khiến cho những công nghệ nổi • Tự do phát triển chương trình và trội được dễ dàng công nhận và sử dụng bán rộng rãi phần phát triển đó nhằm rộng rãi. Hệ điều hành nguồn mở Linux là mang đến lợi ích chung cho cộng một ví dụ điển hình. Linux còn được xem đồng. như là một bích chương quảng bá phần Những lọai giấy phép thông dụng bao mềm nguồn mở. gồm: Thuật ngữ then chốt kết nối thư viện số • GNU General Public License với phần mềm nguồn mở là mở. Thật vậy, (GPL) thư viện số đôi khi được xem như là thư • Creative Commons viện số mở (ODL – Open Digital Library), và mô hình “mở” chẳng hạn như lưu trữ • GNU Lesser Public License (LGPL), Artistic mở đã nảy sinh ra trong chừng mực nào đó vấn đề chia sẻ quyền sở hữu trí tuệ. Nhiều • Berkley System Distribution (BSD) người cho rằng, thư viện đã bắt nguồn từ License, Apache Software License, cơ sở lý luận rằng một xã hội mở là phụ MIT License, NCSA License thuộc vào việc trao đổi tự do những quan Mozilla Public License (MPL hay • niệm và ý tưởng, cũng như hiện hữu một MozPL), Netscape Public License cộng đồng cư dân am hiểu. Thư viện số và (NPL) phần mềm nguồn mở là một sản phẩm tự • OCLC Research Public License nhiên của những mô hình trao đổi mở giúp Giấy phép phần mềm nguồn mở được cho xã hội phát triển và thịnh vượng. xem như là mối tương quan đặc thù giữa một hệ thống sắp được tái đóng gói để phân Vài phần mềm nguồn mở thư viện phối với những hệ thống khác sử dụng sản số tiêu biểu. phẩm đó trong môi trường thương mại. 1. Phần mềm xây dựng bộ sưu tập: Vốn tài liệu thư viện, đội ngũ nhân Greenstone viện thư viện, và ngay cả hạ tầng cơ sở, Greenstone là một trong những hệ trang thiết bị thư viện thường được dùng để thống phần mềm nguồn mở thư viện số nổi phục vụ rộng rãi cho cộng đồng người sử tiếng và phổ biến nhất hiện nay. Được phát dụng dựa trên cơ sở phi lợi nhuận. Thư viện triển bởi Dự án thư viện số New Zealand cũng giống như những tổ chức khác, người của trường đại học Waikato, New Zealand sử dụng thường xuyên phần mềm nguồn mở và được UNESCO phân phối, Greenstone thông qua đội ngũ nhân viên thư viện là một phần mềm đa ngôn ngữ được dịch thường không quan tâm đến bao nhiêu dịch sang gần 50 thứ tiếng, bản tiếng Việt do vụ thư viện được cung cấp đã dùng những Công ty IES của Phần Lan ở Việt Nam phần mềm nguồn mở nào. phối hợp với Thư viện Đại học Khoa học 4
- BẢN TIN THƯ VIỆN - CÔNG NGHỆ THÔNG TIN THANG 8 /2006 Tự nhiên TP. HCM biên dịch. Phần mềm phát hành phiên bản 4.0.2a vào 5/2002, nguồn mở thư viện số Greenstone và tài liệu SiteSearch được sản xuất và cấp phép với hướng dẫn bằng tiếng Việt có thể tải xuống danh nghĩa Giấy phép nguồn mở OCLC và thông qua trang web GreenstoneWiKi là một trong ít ví dụ trong thế giới thư ( viện, một sản phẩm thương mại trở thành x.php/GreenstoneWiki). Greenstone được nguồn mở. SiteSearch có một tầng Z39.50 dùng để thu gom và biên mục tài liệu theo mạnh và có thể cung cấp một giao diện đối Dublin Core, đồng thời tổ chức thành bộ sưu với những bộ sưu tập địa phương hay từ tập và xuất ra đĩa CD hay Internet. xa. Nhiều máy chuyển đổi và những công Greenstone được lưu hành với giấy phép cụ khác có thể được dùng để chuyển tải GPL, được dùng rộng rãi khắp nơi trên thế nội dung vào trong SiteSearch, và nó có giới như là một “mốt – fashion”. Ở Việt thể chỉ mục trực tiếp những khổ mẫu Nam nhiều thư viện đã sử dụng Greenstone MARC, XML, và SGML. để xây dựng nhiều bộ sưu tập có giá trị cao, đáng kể nhất là Thư viện ĐH Khoa học Tự 4. Phần mềm chuyển đối MARC- nhiên và Thư viện ĐH Ngân hàng TP. Hồ Dublin Core và Dublin Core-MARC: Chí Minh. MarcEdit MarcEdit được xây dựng bởi Terry 2. Phần mềm gặt hái metadata: Reese, ĐH Oregon, Hoa Kỳ. Phần mềm dlbox. được thiết kế nhằm hỗ trợ các dạng khác dlbox hay “Digital Libraries-in-a-Box” nhau của MARC như MARC 21, được phân phối bởi Phòng thí nghiệm Thư UNIMARC, vv đồng thời cung cấp các viện số thuộc trường đại học Virginia Tech, chức năng chuyển đổi từ MARC sang Hoa Kỳ. Phần mềm này được dùng để hỗ trợ Text, Text sang MARC; MARC sang việc tích hợp những thành phần mô tả dữ MARC-XML; MARC sang Dublin Core liệu biên mục. Đây là một ứng dụng việc mở và ngược lại. MarcEdit được thiết kế dựa rộng giao thức OAI (Open Archives trên Window COM. Cho phép tận dụng Initative) cho việc gặt hái metadata (XOAI- các tiện ích của Windows Scripting Host. PMH). Những thành phần có thể được tải MarcEdit là một chương trình lý tưởng cho xuống và được xây dựng bởi những công cụ bất kỳ dự án liên quan đến MARC – từ bảo Pert và Java. Nếu chúng ta đã xây dựng cấu trì dữ liệu đến tạo biểu ghi cơ sở. trúc cho một bộ sưu tập kỹ thuật số rồi trong một cơ sở dữ liệu quan hệ, thì những thành Biên mục trên Web hay tạo lập phần này có thể bổ sung thêm chức năng metadata. cho cấu trúc hiện hữu. Gặt hái metadata là Như chúng ta đã nhận thấy, xây dựng để tạo nên những bộ sưu tập mới dựa vào tài thư viện số đồng nghĩa với việc xây dựng nguyên bên ngòai. những bộ sưu tập. Cơ sở của bộ sưu tập là những tài liệu do cán bộ thư viện sưu tầm, 3. Phần mềm truy hồi và quản lý chọn lọc, và biên mục từng tài liệu. Cũng thông tin: SiteSearch giống như trong thư viện truyền thống, Vào Tháng Sáu 2001, OCLC công bố chúng ta biên mục để tạo nên những phiếu rằng SiteSearch, một bộ gồm những công cụ hay biểu ghi mục lục để giúp độc giả tra truy hồi và quản lý thông tin, sẽ không còn cứu sách; trong thư viện số với sự hỗ trợ là một sản phẩm thương mại nữa. Với việc của phần mềm nguồn mở, người ta biên 5
- BẢN TIN THƯ VIỆN - CÔNG NGHỆ THÔNG TIN THANG 8 /2006 mục để tạo nên metadata cũng nhằm giúp viện truyền thống. Cách biên mục này người sử dụng có thể truy cập tài liệu. được gọi là biên mục trên Web (Web- Metadata và phiếu mục lục tương đồng based cataloging), cũng đồng nghĩa với với nhau về mục đích sử dụng, thậm chí còn việc tạo lập metadata. giống nhau về nội dung. Tuy nhiên khác Phần mềm nguồn mở, cụ thể là nhau cơ bản là phiếu mục lục thì tách rời với Greenstone hỗ trợ chúng ta biên mục trên kho sách, trong khi metadata thì thường gắn web bằng Dublin Core để tạo nên những liền vào nội dung tài liệu. Điều này giải bộ sưu tập với hệ thống mục lục tra cứu thích rằng, nếu tra cứu vào phiếu mục lục thì chuyên nghiệp theo tác giả, nhan đề, đặc ta chỉ được lý lịch của tài liệu mà ta gọi là biệt là tiêu đề đề mục (Subject Heading), biểu ghi thư tịch (bibliographic record) vv mới thực sự là để xây dựng Thư viện trong khi tra cứu vào metadata thì ta có thể số. Việc sử dụng bộ máy tra cứu Search có được cả nội dung tài liệu đó. Engine nhúng vào một cơ sở dữ liệu Tài liệu điện tử hay kỹ thuật số ở dạng điện tử để tìm kiếm theo từ khóa một toàn văn và đa phương tiện phải được đóng cách máy móc thì chỉ là một hình thức gói bằng công nghệ Web. Vì metadata phải thông tin trên web, hòan tòan khác hẳn gắn liền vào nội dung tài liệu nên cũng phải với Thư viện số. được đóng gói để trở thành siêu dữ liệu thư tịch (bibliographic metadata). Chẳng hạn Kết luận. như những biểu ghi thư tịch sử dụng khổ Xây dựng bộ sưu tập (collections) là mẫu MARC 21 trong thư viện truyền thống, cốt lõi trong việc hình thành Thư viện số. khi sử dụng với tài nguyên điện tử thì phải Công việc này đòi hỏi người cán bộ thông được đóng gói bằng ngôn ngữ XML để trở tin thư viện tạo lập và gặt hái metadata thành MARC-XML. Nhiều phần mềm hơn là chỉ biết sử dụng search engine. Hệ nguồn mở hỗ trợ việc chuyển đổi này, trong thống nguồn mở là trợ thủ đắc lực cho đó có MarcEdit. công việc này. Nếu sử dụng Dublin Core với 15 thành Sử dụng Hệ thống nguồn mở nói phần đã được đóng gói bằng XML để biên chung và Phần mềm Greenstone do mục tài liệu truyền thống lẫn điện tử như UNESCO quảng bá nói riêng để xây dựng Thư viện ĐH Khoa học Tự nhiên TP. HCM Bộ sưu tập trong việc hình thành Thư viện đang sử dụng hiện nay thì ta không cần phải số là rất cần thiết và là cơ hội đồng đều chuyển đổi. Nếu có chuyển đổi thì chuyển cho tất cả các thư viện ở Việt Nam hiện đổi sang MARC để có thể trao đổi với hệ nay. thống cũ những biểu ghi thư tịch trong thư THAM KHẢO 1. How to build a Digital Library / Ian H. Witten and David Bainbridge.- New York: Morgan Kaufmann, 2003 2. Using Open Source Systems for Digital Libraries / Art Rhyno.- Westport, Connecticut: Libraries Unlimited, 2004 3. Digital and Digital Libraries Module - Information Management Resource Kit / FAO and UNESCO, 2005 (CD-ROM) 6



