Đo lường và đánh giá trong giáo dục
Bạn đang xem 20 trang mẫu của tài liệu "Đo lường và đánh giá trong giáo dục", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- do_luong_va_danh_gia_trong_giao_duc.pdf
Nội dung text: Đo lường và đánh giá trong giáo dục
- ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC PGS.TS Trần Khánh Đức Đại học quốc gia Hà nội 1
- Đặt vấn đề Một vấn đề sôi động trong thực tiễn và lý luận dạy học và quản lý giáo dục hiện nay là vấn đề nghiên cứu - ứng dụng các phương pháp đánh giá - kiểm tra quá trình và kết quả dạy-học, quá trình quản lý giáo dục một cách khách quan, chính xác và nhanh chóng. Trong hoạt động dạy- học, việc kiểm tra - đánh giá không chỉ đơn thuần chú trọng vào kết quả học tập của học sinh mà còn có vai trò to lớn hơn trong việc thúc đẩy động cơ, thái độ tích cực, chủ động và sáng tạo trong học tập của người học, hoàn thiện quá trình dạy - học và kiểm chứng chất lượng - hiệu quả giờ học và trình độ nghề nghiệp của giáo viên.Trong hoạt động quản lý kiểm tra-đánh giá cũng không chỉ đơn thuần hướng vào đánh giá kết quả công việc mà còn có tác động thúc đẩy, hỗ trợ và nâng cao chất lượng, hiệu quả hoạt động của tổ chức và cong tác quản lý của tổ chức. Các hình thức kiểm tra, đánh giá truyền thống trong hoạt động dạy - học nặng về đánh giá khả năng ghi nhớ, trình bày lại những nội dung mà người dạy truyền thụ như kiểm tra vấn đáp bài học cũ, kiểm tra viết trong thời gian ngắn hoặc dài theo chương, mục bài giảng v.v đã và đang bộc lộ nhiều hạn chế nâng cao tính tích cực học tập và khả năng vận dụng linh hoạt - sáng tạo các kiến thức - kỹ năng của người học trong các tình huống thực tế đa dạng. Để khắc phục các hạn chế trên, ở nhiều nước trên thế giới đã nghiên cứu và vận dụng các phương pháp đánh giá bằng các trắc nghiệm (test) khách quan. Các bộ trắc nghiệm (test) được nghiên cứu thử nghiệm cho từng loại hình dạy - học và mục đích khác nhau rất công phu (Trắc nghiệm trí thông minh IQ; Trắc nghiệm kiểm tra tiếng Anh; Trắc nghiệm kiểm tra luật giao thông v.v ). Cũng có những loại trắc nghiệm đánh giá đơn giản để đáp ứng yêu cầu đánh giá kiến thức hoặc kỹ năng trong một bài dạy lý thuyết hoặc thực hành. Trong quản lý giáo dục còn có các loại hình đánh giá giáo dục khác như đánh giá giáo viên; đánh giá nhà trường, đánh giá chất lượng giáo dục vv với nhiều phương pháp, quy trình và bộ công cụ đánh giá khác nhau. I. MỘT SỐ THUẬT NGỮ THƯỜNG DÙNG TRONG ĐO LƯỜNG VÀ ĐÁNH GIÁ. 1.1.Kiểm tra : Theo từ điển tiếng Việt thuật ngữ kiểm tra được định nghĩa như sau : “ Kiểm tra là xem xét tình hình thực tế để đánh giá, nhận xét “ (Hoàng Phê- Từ điển Tiếng Việt. NXB khoa học xã hội, H.1998 ) Theo Tự điển Giáo dục học -NXB Tự điểm Bách khoa 2001 thuật ngữ Kiểm tra được định nghĩa như sau : “ Là bộ phận hợp thành của quá trình hoạt động dạy- học nhằm nắm được thông tin về trạng thái và kết quả học tập của học sinh, về những nguyên nhân cơ bản của thực trạng đó để tìm ra những biện pháp khắc phục những lỗ hổng, đồng thời củng cố và tiếp tục nâng cao hiệu quả của hoạt động dạy- học. Như vậy trong lĩnh vực giáo dục, kiểm tra là một thuật ngữ chỉ sự đo lường, thu thập thông tin để có được những phán đoán, xác định xem mỗi người học sau khi học đã nắm được gì 2
- (kiến thức), làm được gì (kỹ năng) và bộc lộ thái độ ứng xử ra sao ,đồng thời có được những thông tin phản hồi để hoàn thiện quá trình dạy-học 2.2. Đo lường: ( Measurement) Theo Hoàng Phê- Từ điển Tiếng Việt. NXB khoa học xã hội, H.1998 , thuật ngữ “ Đo lường” được định nghĩa là : xác định độ lớn của một đại lượng bằng cách so sánh với một đại lượng cùng loại được chọn làm đơn vị “ Đo lường trong tiếng Anh ( Measurement ) là một khái niệm chuyên dùng để chỉ sự so sánh một vật hay hiện tượng với một thước đo hay chuẩn mực, có khả năng trình bày kết quả về mặt định lượng .Nói cách khác đo lường là một cách lượng giá với mục đích gán con số hoặc thứ bậc cho đối tượng đo ( nghiên cứu ) theo một hệ thống quy tắc hay chuẩn mực nào đó. Trong lĩnh vực giáo dục có nhiều định nghĩa khác nhau về đo lường - Theo K.D.Hopkins và J.C.Stalay : Đo lường là quá trình mà với nó, sự việc được phân biệt . - Theo Q. Stodola và K.Stordahl : Đo lường trong giáo dục là phương tiện để thu thập, phân tích dữ liệu về đặc tính, hành vi con người một cách có hệ thống làm cơ sở cho những hành động thích hợp . Trong đo lường, các loại thang đo có vai trò cực kỳ quan trọng. Những công cụ đo lường trong nghiên cứu giáo dục có các loại sau : - Thang đo định danh : ( nominal scale ) là kiểu đo lường đánh giá sự vật , hiện tượng hay đặc tính theo tên gọi ( định danh ) theo giói tính nam-nữ; theo vùng miền ( bắc, nam ,trung) ; theo nhóm tuổi ( trẻ em, người lớn ); theo trình độ học lực ( kém, trung bình , khá, giỏi ) hoặc khi cần phân loại theo đặc trưng mầu sắc ( xanh, dỏ, vàng vv) Thang định danh là phép đo khái quát không nhằm cung cấp thông tin cụ thể, chính xác về đặc tính và sự khác biệt của các đối tượng đo. - Thang định hạng : ( ordinal scale ) là kiểu đo lường đánh giá sự vật , hiện tượng hay đặc tính theo thứ bậc hay trật tự của chúng. Ví dụ khi muốn phân loại năng lực học tập một môn nào đó ( như môn Toán chẳng hạn ) của một nhóm học sinh theo thứ hạng điểm thi hoặc tổng kết từ điểm cao nhất đến điểm thấp nhất hoặc muốn phân loại đồ vật theo kích cỡ, trọng lượng từ to nhất, nặng nhất đến bé nhất, nhẹ nhất vv. Thang định hạng cũng là phép đo khái quát không nhằm cung cấp thông tin cụ thể, chính xác về đặc tính và mức độ khác biệt giữa các đối tượng mà chỉ nhằm chỉ ra vị trí, mối tương quan thứ bậc của các đối tượng đo. - Thang định khoảng : ( interval scale ) là kiểu đánh giá, phân loại các sự vật, hiện tượng hay đặc tính theo những đơn vị phân loại bằng nhau ở bất kỳ khoảng nào trên thang đo . Vị dụ cụ thể nhất là các phép đo bằng thước mét. Phép đo chiều cao bằng thước mét là một kiểu đo theo thang định 3
- khoảng : sự khác biệt giữa người cao 175 cm-170cm và người cao 160 cm - 155 cm đều ở một khoảng như nhau là 5 cm. Hay các thang đo định khoảng về điểm đánh giá theo thang 10 điểm, 100 điểm vv . Cần lưu ý một số đối tượng đo do tính chất đặc thù ( khác với các phép đo cơ học ) có sự khác biệt giữa các khoảng tuyệt đối ở các mức khác nhau . Ví dụ khi đo vượt xà ở mức cao thì chênh 1-2 cm là khó đạt hơn khi còn ở mức xà thấp ; những người có chỉ số IQ tưong ứng là 110 và 120 ( cách nhau 10 điểm) không có nghĩa giống sự cách biệt 10 điểm ở các mức 80-90 và như vậy ở đây mang tính chát của phép đo định hạng. - Thang định tỷ lệ ( Ratio scale ) là lại thang đo khi cần phân loại các sự vật, hiện tượng hay đặc tính với thang đo khoảng mà thang đo có điểm không thực sự . Ví dụ khi dùng thang đo vận tốc ( km/giờ ). Số km/giờ nói lên tốc độ chuyển động của một vật ( ví dụ ôtô có vận tốc 50 km/giờ ) . Mỗi km/giờ chỉ sự gia tăng tốc độ theo khoảng còn ở okm/giờ ôtô đứng yên. Trong lĩnh vực đo đánh giá nhận thức , thái độ, năng lực, hành vi của một cá nhân trên thực tế không có điểm o thực sự mà là điểm o tự đặt ( Arbitrary zero point ) Người ta cho rằng ít nhất là có năm trình độ/bậc chất lượng cần được định rõ trong một thang đánh giá tốt với nhiều bậc, với những mô tả về ít nhất là 3 trong 5 bậc đó. Thêm vào, có 3 loại chủ yếu của thang đánh giá nhiều bậc để lựa chọn: số, đồ hoạ và đồ hoạ mô tả. Thang đánh giá bằng số: Ví dụ 5. Ưu tú, đạt được tất cả các tiêu chuẩn 4. Rất tốt, đạt được hầu hết các tiêu chuẩn 3. Tốt, đạt được một số tiêu chuẩn 2. Đạt, đạt được một số ít tiêu chuẩn 1. Kém, Không đạt tiêu chuẩn. Trong thang đánh giá theo đồ hoạ Mỗi tính chất được chia theo trên một đờng nằm ngang với s phân loại trả lời được vạch trên đó. Các mức độ được tạo ra bằng cách đặt sự kiểm tra vào vị trí thích hợp trên đờng kẻ trên nh trong ví dụ được chỉ ra sau đây. Kém (Poor) Đạt ( Pass) Khá Tốt (Good) Ưu tú (Excellent) Thang chia độ đồ thị mô tả cũng giống như đồ hoạ, ngoại trừ những sự mô tả trên đó là những phác thảo ngắn gọn về hành vi của người học ở mỗi trình độ trên thang. Ví dụ: 4
- Cát viền rách Cắt viền đúng Cắt viền rất hoàn toàn nống vải mợt và phẳng hoặc không phẳng nhng bị không rách phẳng, lệch vài chỗ không viền hay lệch nống vân. phẳng hay nống vải tông nhẹ 13. Đánh giá ( Assesssment) Đánh giá là quá trình thu thập thông tin, chứng cứ về đối tượng đánh giá và đưa ra những phán xét, nhận định về mức độ đạt được theo các tiêu chí đã được đưa ra trong các tiêu chuẩn hay kết quả học tập. Đánh giá có thể là đánh giá định lượng( quantitative )dựa vào các con số hoặc định tính ( qualitative)dự vào các ý kiến và giá trị Đánh giá là sự phán xét trên cơ sở đo lường, kiểm tra, bao giờ cũng đi liền với kiểm tra. Trong đánh giá, ngoài sự đo lường một cách khách quan dựa trên kiểm tra (hay trắc nghiệm), còn có ý kiến bình luận, nhận xét, phê phán mang tính chủ quan để tiến tới sự phán xét. Theo Tự điển Giáo dục học –NXB Tự điểm Bách khoa 2001 thuật ngữ đánh giá kết quả học tập được định nghĩa như sau: “ Xác định mức độ nắm được kiến thức, kỹ năng, kỹ xảo của học sinh so với yêu cầu của chương trình đề ra “ Ta có thể hiểu kiểm tra đánh giá kết quả học tập là sự so sánh, đối chiếu kiến thức, kỹ năng, thái độ thực tế đạt được ở người học để tìm hiểu và chuẩn đoán ( diagnostic ) trước và trong quá trình dạy-hoc (formative ) hoặc sau một quá trình học tập với các kết quả mong đợi đã xác định trong mục tiêu dạy học( đánh giá kết tthúc – summative ) Sản phẩm của hoạt động dạy- học, của lao động sư phạm trên lớp học, trong phòng thí nghiệm, xưởng trường, bãi tập, vv rất đa dạng và phức tạp , rất khó xác định. Bởi vì những sản phẩm dó là những người học đã thay đổi ít hoặc nhiều trong phẩm chất và năng lực của họ sau một thời gian học tập nhất định hay nói cách khác là đã có các giá trị ra tăng. Đó chính là kết quả học tập của người học, thành tố chủ yếu tạo nên chất lượng của hoạt động dạy học trong nhà trường. 2.4. Trắc nghiệm -Trắc nghiệm là một phép thử ( kiểm tra ) để nhận dạng, xác định, thu nhận những thông tin phản hồi về những khả năng, thuộc tính, đặc tính ,tính chất của một sự vật hay hiện tượng nào đó. ví dụ : trắc nghiệm đo chỉ số 5
- thông minh ( IQ ); trắc nghiệm do thị lực mắt; trắc nghiệm do nồng độ cồn ở người lái xe; vv Trắc nghiệm trong giảng dạy cũng là là một phép thử (một phương pháp kiểm tra đánh giá ) nhằm đánh giá khách quan trình độ , năng lực cũng như kết quả học tập của ngưòi học trước, trong quá trình và khi kết thúc một giai đoạn học tập nhất định ( phần hoặc bài giảng lý thuyết hoặc thực hành ); một chương hoặc một chương trình đào tạo vv Trắc nghiệm thường có các dạng thức sau : trắc nghiệm thành quả ( achievêmnt ) để đo lường kết quả, thành quả học tập của người học; trắc nghiệm năng khiếu hoặc năng lực (aptitude ) để đo lưòng khả năng và dự báo tương lai. Phương pháp trắc nghiệm có thể là khách quan ( objective ) hoặc chủ quan ( subjective ) II . VAI TRÒ, VỊ TRÍ VÀ MỤC ĐÍCH CỦA KIỂM TRA ĐÁNH GIÁ TRONG QUÁ TRÌNH DẠY HỌC VÀ QUẢN LÝ GIÁO DỤC 2.1. Kiểm tra đánh giá quá trình dạy-học Chất lượng và hiệu quả dạy -học phụ thuộc và nhiều yếu tố trước, trong và sau quá trìnhđạy-học . Có thể nói rằng, quá trình dạy-học sẽ đạt được kết quả tốt nếu người quản lý nhà trường và đội ngũ giảng viên nắm vững các quy luật vận động của quá trình dạy học và giải quyết tốt mối quan hệ biện chứng giữa các nhân tố cấu thành quá trình dạy-học như một chỉnh thể trọn vẹn. Với vị trí là một khâu của quá trình dạy học, kiểm tra- đánh giá xác định mức độ đạt được mục tiêu của quá trình dạy học và góp phần trực tiếp thúc đẩy và hoàn thiện quá trình dạy học ( xem hình 1) Mục tiêu dạy học Nội dung Phương pháp Hình thức tổ chức Phương tiện Kiểm tra- dánh giá Hình 1. Cấu trúc các nhân tố của quá trình đào tạo Mục đích của đánh giá trong quá trình dạy -học là : 1. Xác định kiến thức, kỹ năng và thái độ hiện có ở mỗi người học trước khi vào học. Nhờ kiểm tra đánh giá, giáo viên biết được trình độ người học, những điểm yếu của người trước khi vào học. Điều này rất quan trọng đối với các 6
- khoá học ngắn hạn, bồi dưỡng nâng cao vì nó giúp giáo viên xác định được nhu cầu của người học để có thể đề ra mục tiêu học tập sát hợp. 2. Thúc đẩy người học học tập, thông báo kịp thời cho ngưòi học biết tiến bộ của họ trong quá trình dạy học. - Trước hết là có tác dụng thúc bách người học học tập. Không có kiểm tra, thi cử chắc là nhiều người học “không học” thật sự . - Động viên, khích lệ người học học nhiều hơn, tốt hơn - Chỉ cho người học thấy họ học tốt nội dung nào chưa tốt, nội dung nào cần học thêm, học lại, v.v 3. Cải tiến việc dạy và việc học Giáo viên cần biết rõ là nội dung đã được dạy và học đủ chưa, cần bổ sung cái gì, phương pháp dạy học đã phù hợp chưa, cần hỗ trợ thêm cho ngưòi học nào, cần được giúp thêm ở nội dung nào? Muốn biết rõ những điều đó và để có những quyết định phù hợp, giáo viên phải căn cứ vào kiểm tra kết quả học tập. .4. Xác nhận hoặc chứng nhận trình độ, năng lực của ngưòi học( đánh giá quá trình và kết quả học tập ) Kiểm tra đánh giá nhằm khẳng định năng lực của ngưòi học có tương xứng với bằng cấp, chứng chỉ, đặc biệt là với chức năng, nhiệm vụ mà người học tốt nghiệp sẽ phải đảm nhận hay không. Để chứng nhận trình độ, năng lực của người tốt nghiệp, trong kiểm tra đánh giá theo lối truyền thống lâu nay, người ta thường chú trọng kiểm tra đánh giá bằng một kỳ thi cuối khoá. Làm như vậy cho kết quả không chính xác. Điều quan trọng là phải xác định được một hệ thống kiểm tra đánh giá phù hợp bao gồm từ quy chế thi và kiểm tra, tiêu chí kiểm tra đánh giá, hình thức kiểm tra đánh giá, loại công cụ, câu hỏi thích hợp, số lượng câu hỏi, cách xác định điểm đạt, mức đạt, v.v 2.2. Quản lý và kiểm tra đánh giá trong quản lý giáo dục. Kiểm tra-đánh giá cũng là một khâu quan trọng của quá trình quản lý nói chung và quản lý giáo dục nói riêng. Theo từ điển Tiếng Việt thông dụng- NXB Giáo dục-1998 thuật ngữ quản lý được định nghĩa là : "Tổ chức, điều khiển hoạt động của một đơn vị, cơ quan" Quản lý là một hoạt động có chủ đích , được tiến hành bởi một chủ thể quản lý nhằm tác động lên khách thể quản lý để thực hiện các mục tiêu xác định của công tác quản lý . Trong mỗi chu trình quản lý chủ thể tiến hành những hoạt động theo các chức năng quản lý như xác định mục tiêu, các chu trương, chính sách; hoạch định kế hoạch , tổ chức chỉ đạo thực hiện, điều hoà, phối hợp , kiểm tra, đánh giá và huy động, sử dụng các nguồn lực cơ bản như tài lực, vật lực, nhân lực vv để thực hiện các mục tiêu, mục đích mong muốn trong bối cảnh và thời gian nhất định 7
- Chung quanh khái niệm quản lý còn có rất nhiều định nghĩa khác nhau. - F.W TayLor cho rằng: “ Quản lý là biết chính xác điều bạn muốn người khác làm và sau đó thấy rằng họ đã hoàn thành công việc một cách tốt nhất và rẻ nhất”. - Còn H.Koontz thì lại khẳng định : “Quản lý là một hoạt động thiết yếu, nó đảm bảo phối hợp những nỗ lực hoạt động cá nhân nhằm đạt được các mục đích của nhóm (tổ chức). Mục tiêu của quản lý là hình thành một môi trường mà trong đó con người có thể đạt được các mục đích của nhóm với thời gian, tiền bạc, vật chất và sự bất mãn cá nhân ít nhất.” .v.v Từ quan niệm của các học giả đã nêu, chúng ta có thể khái quát lại: "Quản lý là hoạt động có ý thức của con người nhằm phối hợp hành động của một nhóm người hay một cộng động người để đạt được các mục tiêu đề ra một cách hiệu quả nhất”. Trong quản lý có các hoạt động tác nghiệp cụ thể được gọi là quản trị. Khái niện Quản trị ( Administation) được hiểu là : “ Những hoạt động phát sinh từ sự tập hợp của nhiều người một cách có ý thức để nhằm hoàn thành những mục tiêu chung “ .Sự tập hợp con người thành tổ chức là môi trường và đối tượng của công việc quản trị . Như vậy , bất kỳ một tổ chức nào : văn hoá, xã hội, giáo dục, quân sự , hành chính vv đều cần có sự quản lý nói chung và quản trị trong đó có nhiều chức năng, nhiệm vụ cần được vạch ra cụ thể và có sự điều hành, phân công, phân nhiệm cho từng bộ phận, cho tưng thành viên trong tổ chức. Như vậy khái niệm quản trị có thể hiểu là một khâu, một thành phần của quản lý gắn cụ thể với một tổ chức và nặng về thừa hành , tác nghiệp, điều hành các hoạt động cụ thể của một tổ chức. Quản lý có tầm rộng và bao quát hơn cả về mô hình tổ chức, tầm nhìn và chiến lược phát triển của tổ chức vv Theo Gulích và Urwich công tác quản trị có 7 chức năng chủ yếu sau ( viết tắt là POSCORB : Planning ( kế hoạch); organizing (Tổ chức ) ;Staffing ( nhân sự ); Coordinating ( Phối hợp) ; Rviewing ( Kiểm tra); Budgetting ( Tài chính ) Những chức năng trên là phổ biến với mọi nhà quản lý, quản trị của một tổ chức song có sự khác nhau ở mức độ tầng cấp quản lý . Sự phân phối thời gian và công sức cho các chức năng quản trị của các cấp được thể hiện trong bảng sau : ST Cấp quản lý Kế Tổ chức Điều Kiểm Ghi chú T hoạch khiển tra 1 Cao cấp 28% 36% 22% 14% 2 Trung gian 18% 33% 36% 13% 3 Cơ sở 15% 24% 51% 10% 8
- Nguồn : Quản trị học. Đào Duy Huân- NXB Thống kê, 1996. III. CÁC LOẠI VÀ YÊU CẦU CỦA KIỂM TRA ĐÁNH GIÁ KẾT QUẢ HỌC TẬP 3.1. Phân loại kiểm tra đánh giá - Về mặt hình thức, đánh giá kết quả học tập có hai loại là: a/ Đánh giá hình thành (Formative Assessment) (còn được gọi là Kiểm tra đánh giá thường xuyên) Đây là loại hình là kiểm tra đánh giá từng bước một cách chính thức hoặc cũng có thể không chính thức, "đi kèm" với quá trình hình thành kiến thức, kỹ năng, kỹ xảo và thái độ ở người học , cung cấp những thông tin phản hồi nhanh để kịp thời bổ cứu ở mỗi giai đoạn cần thiết của sự phát triển trong suốt quá trình học tập. Kiểm tra đánh giá hình thành được thực hiện thường xuyên trong quá trình dạy học và định kỳ cuối mỗi chương, phần hoặc cuối học kỳ, cuối năm học vv Lợi ích của loại hình kiểm tra này là : - Do có nhiều lần kiểm tra nên sai sót trong một giai đoạn được bổ cứu kịp thời, đảm bảo ngưòi học đạt được kết quả học tập chung cuối cùng - Loại bỏ được những lo âu, căng thẳng trong một kỳ thi cuối khoá duy nhất - Thúc đẩy người học nỗ lực học tập thường xuyên trong cả khoá - Giáo viên có cơ sở để điều chỉnh phương pháp dạy học và giúp đỡ người học kịp thời. B/ Đánh giá kết thúc (Summative Assessment). (còn được gọi là Kiểm tra đánh giá tổng kết) Được thực hiện vào cuối môn học lý thuyết, thực hành hoặc một môđun và cuối khoá học - Dựa vào mục tiêu học tập của môn học hoặc môđun và mục tiêu đào tạo của khoá học - Phải kiểm định được toàn bộ mục tiêu đã đật ra, phản ánh đúng năng lực thực sự của người học - Nếu thực hiện việc đánh giá một cách thường xuyên trong suốt cả khoá học thì đánh giá kết thúc trở nên nhẹ nhàng hơn. - 9
- - Về tính chất, có hai loại kiểm tra đánh giá: a/ Kiểm tra đánh giá đối chiếu hay theo chuẩn tương đối (Norm Referenced Assessment) Đây là loại kiểm tra đánh giá có tính chất tương đối, chủ yếu là so sánh kết quả học tập giữa các ngưòi học với nhau. Loại này phù hợp với việc thi tuyển, lựa chọn một số lượnh nhất định những người tốt nhất trong số người học dự thi. B/ Kiểm tra đánh giá theo tiêu chí (Criterion Referenced Assessment) Đây là loại kiểm tra đánh giá có tính chất tuyệt đối, đánh giá kết quả học tập của từng người học đạt được thực tế so với các tiêu chí đã đề ra. Dù người học chỉ không đạt được một tiêu chí nào đó thôi thì người học vẫn phải học lại bài đó, môđun đó để thi, kiểm tra lại. 3.2. Những yêu cầu của kiểm tra đánh giá 3.2.1. Độ tin cậy (Reliability) Độ tin cậy được sử dụng để nói về sự chính xác (Precision) của việc đo đạc.Chúng liên quan đến việc đo cái gì và đã đo như thế nào, thông tin đem lại có đúng mục đích đo đạc đã nêu ra không. Nói đơn giản, độ tin cậy chỉ cho ta biết khoảng cách, sai số hay sai lệch giữa kết quả với mục đích đo đạc nêu ra. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trác nghiệm. Kiểm tra đánh giá để giúp cho nhận định, phán xét về kết quả học tập của người học không thể chỉ căn cứ vào một vài câu hỏi của bài kiểm tra mà còn phải nhận định, đánh giá hay phán xét về sự phát triển trong quá trình hoặc khả năng của người học bởi vì những bài làm và câu hỏi kiển tra đó có thể được sao chép hoặc học thuộc lòng từ một bài làm có sẵn. Do đó cần phải tập hợp đầy đủ những quan sát tương tự để tăng thêm độ tin cậy của việc đo lường, đánh giá . Độ tin cậy phụ thuộc vào sai số của đo đạc, càng hạn chế được sai số thì càng làm tăng độ tin cậy. Sai số này có thể là do sinh viên, do sử dụng bài kiểm tra, do công cụ đo, do quản lý kiểm tra - đánh giá. Cần tìm cách biết được sai số này để làm tăng giá trị của thông tin đánh giá. - Sai số nảy sinh từ người học do họ thiếu động lực khi làm bài kiểm tra, do những kinh nghiệm trước đó đã không giúp ích gì cho họ, do lo lắng về kết quả kiểm tra, do tình trạng tâm sinh lý không ổn định, bất thường chẳng hạn như buồn bực, ốm đau hoặc do không được chuẩn bị làm bài kiểm tra. 10
- - Sai số do công cụ kiểm tra. Ví dụ trong trắc nghiệm đa phương án có các câu hỏi chứa đựng các từ mơ hồ, không rõ ràng, không sáng sủa có thể hiểu theo nhiều cách, những thông tin không được liên hệ với nhau, thang phân loại không rõ hoặc không đúng với tên gọi, những câu hỏi nêu ra so với mục tiêu chưa phải là đặc trưng, thích hợp. Những nội dung bài giảng, những điều giải thích, hướng dẫn có ý nghĩa khác nhau đối với từng người học . Một câu hỏi về dòng điện chạy qua dây dẫn có yêu cầu khác nhau giữa môn vật lý và môn kỹ thuật điện, dẫn đến điểm kiểm tra khác nhau đối với bài kiểm tra hai môn này. Vì vậy từng câu hỏi, từng câu hướng dẫn cần được lựa chọn cẩn thận trong từng bài kiểm tra. Những phần về cảm xúc trong mục tiêu giáo dục thường không rõ ràng và khó đo đạc, do đó khi đo sẽ phạm sai số lớn hơn khi đo phần nhận thức trong môn học. Sự khác nhau về độ tin cậy cũng có thể liên quan đến sự đo đạc nội dung môn học. Trong thực tiễn, các mục tiêu của quốc gia thường là mờ và khó đo đạc bằng các phương pháp kiểm tra đánh giá. Sai số cũng có thể do điều kiện quản lý bài kiểm tra về cả thủ tục lẫn sản phẩm. Các nhà nghiên cứu giáo dục mong muốn không có sự khác nhau về điều kiện quản lý vì đó là nguyên nhân làm nhiễu các kết quả học tập, tác động rất xấu đến động lực học tập của sinh viên và tác hại đến kết quả giảng dạy. Các dạng độ tin cậy Có bốn dạng độ tin cậy khi xem xét tổng quan các dụng cụ đo đã được tiêu chuẩn hoá: - Dạng thứ nhất: Tin cậy về tính ổn định (Stability) của kết quả kiểm tra hàng năm. Nếu như lặp lại kiểm tra với cùng một loại sinh viên thì kết quả điểm số của nó cũng tương tự như điểm số kiểm tra trước đó một thời gian ngắn. Cả trắc nghiệm theo chuẩn và theo tiêu chí, xét về tính ổn định đều có thể cho kết quả với độ tin cậy cao. - Dạng thứ hai: Tin cậy về sự tương đương (Equivalence). Kết quả kiểm tra đối với một tập hợp sinh viên sẽ tương đương nếu ta thay bằng đề thi khác nhau trong cùng một bộ đề được soạn theo cùng bảng đặc tính. - Dạng thứ ba: Tin cậy về sự đồng nhất (Homogeneity). Kết quả kiểm tra đánh giá sẽ tương tự cho cùng đối tượng nếu ta thay đổi bài kiểm tra. 11
- - Dạng thứ tư: Tin cậy cùng loại (Interrater Reliability). Công việc của người học phù hợp với độ đo cùng thang kiểu đánh giá nghệ thuật hay thang phân loại kiểu đánh giá tác phẩm văn chương. Trong thống kê, độ tin cậy được gọi là hệ số tin cậy. Nếu kết quả đo có độ tin cậy 1 thì có nghĩa là hoàn toàn tin tưởng, và có độ tin cậy 0 nghĩa là không tin tưởng một chút nào. Khi tiến hành kiểm tra, đề kiểm tra nếu đạt độ tin cậy từ 0,6 trở lên là có thể chấp nhận được, đối với cá nhân đòi hỏi độ tin cậy cao hơn, từ 0,7 trở lên. Khi tính toán độ tin cậy cho phù hợp, chúng ta sử dụng hai công thức khác nhau. Nếu trong các câu hỏi ta yêu cầu sinh viên trả lời riêng biệt là đúng hay sai thì ta áp dụng công thức Kuder- Richardson số 20 mà nhiều tài liệu đã nói đến (xem Trắc nghiệm và đo lường cơ bản trong giáo dục của Patric-Griffin, 1995) để tính độ tin cậy nội tại. Nếu trong các phương án trả lời có nhiều hơn một câu đúng thì ta tính hệ số tin cậy theo công thức của Cronbach. Các phương pháp xác định độ tin cậy Có nhiều phương pháp để xác định độ tin cậy của bài kiểm tra. Thứ nhất: Phương pháp kiểm tra – kiểm tra lại Phương pháp này đòi hỏi hai lần tiến hành cùng một bài kiểm tra cho cùng một nhóm học sinh và tính toán độ tương quan giữa hai bộ điểm số thu được. Tuỳ thuộc vào bản chất của bài kiểm tra và khoảng thời gian giữa hai lần kiểm tra mà độ tin cậy có thể sẽ bị ảnh hưởng ở một mức độ nào đó bởi các nhân tố thuộc về người học (thay đổi về động cơ, tích luỹ thêm hay quên bớt một số điều v.v ). Nhược điểm chính của phương pháp này là phụ thuộc vào khoảng thời gian giữa hai lần kiểm tra. Thứ hai: Phương pháp dùng bài kiểm tra tương đương Đòi hỏi tiến hành hai bài kiểm tra có dạng tương đương nhau trên cùng một nhóm sinh viên và tính toán hệ số tương quan giữa hai bộ điểm số thu được. Cả hai bài kiểm tra này được tiến hành trong những thời điểm gần nhau nên độ tương quan thu được ít bị ảnh hưởng bởi các yếu tố thuộc về người học nói trên. Phương pháp dùng bài tương đương thông dụng hơn phương pháp kiểm tra lại, tuy nhiên việc xây dựng được hai bài kiểm tra tương đương về nội dung, về các đặc điểm của câu hỏi thì khó hơn. 12
- Thứ ba: Phương pháp phân nhỏ (phương pháp phù hợp nội tại) Phương pháp này đòi hỏi ước lượng hệ số tin cậy từ việc phân tích các điểm chấm của một lần kiểm tra, do vậy việc đánh giá độ tin cậy không phải tính đến các nhân tố thay đổi theo thời gian. Một trong những cách để thực hiện phương pháp này là phân chia bài kiểm tra thành hai phần tương đương nhau về tính chất, nội dung, độ khó của câu hỏi. Thông thường các câu hỏi đánh số chẵn được ghép thành một bộ, các câu hỏi đánh số lẻ được ghép thành một bộ, tính hệ số tương quan giữa hai bộ điểm số của hai nửa bài kiểm tra theo phương pháp thông thường. Một trong những khó khăn của cách tính này là do sự phân đôi theo cách khác nhau nên giá trị thu được có thể khác nhau về hệ số tương quan, mặt khác hệ số tương quan này thực ra là hệ số tương quan của nửa bài kiểm tra. Những yếu tố ảnh hưởng đến độ tin cậy Quá trình kiểm tra chịu ảnh hưởng của rất nhiều yếu tố, những yếu tố cơ bản ảnh hưởng đến độ tin cậy là: - Những yếu tố may rủi: Đối với những câu hỏi loại đúng – sai (2 lựa chọn) thì yếu tố may rủi cao hơn so với loại câu nhiều lựa chọn. Tuy nhiên, nhiều chuyên gia cho rằng không nên áp dụng công thức sửa chữa việc đoán mò vì công thức này thường chỉ dùng đối với loại trắc nghiệm tốc độ. - Tính chất khó dễ của bài kiểm tra: Bài quá dễ, các điểm số có khuynh hướng tập trung vào đầu cao của thang điểm; bài quá khó, các điểm số sẽ tập trung vào phía đầu thấp của thang điểm. Điểm số không trải rộng nên khó thấy được sự khác biệt trong kết quả học tập. - Độ dài bài kiểm tra: Bài càng dài thì độ tin cậy càng cao (trong giới hạn chưa gây mệt mỏi và chán ngán). Những yêu cầu để gia tăng độ tin cậy Cùng với việc đưa ra các yếu tố ảnh hưởng đến độ tin cậy, một số tác giả có đề cập tới những điều cần thiết có thể làm gia tăng độ tin cậy cho bài kiểm tra. Đó là: - Hạn chế sử dụng các câu hỏi có ít lựa chọn để giảm các yếu tố may rủi đến mức tối đa. 13
- - Bài kiểm tra nên có độ dài phù hợp. - Các câu hỏi cần đảm bảo được yêu cầu về độ khó và độ phân biệt. - Các chỉ dẫn cho việc làm bài cần rõ ràng để sinh viên khỏi nhầm lẫn. 3.2.2. Độ giá trị (Validity) Độ giá trị nói lên rằng các phương pháp và dụng cụ đo đạc cho phép thu được những thông tin cần phải có, đo được cái ta định đo, tức là mức độ đạt được mục đích đó. Việc đo chỉ có giá trị khi ta biết rõ ta đo lường cái gì, ở nhóm người nào. Phép đo bằng bài trắc nghiệm đạt được mục đích đo lường là phép đo có giá trị. Đội giá trị của bàI trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bàI trắc nghiệm. Độ giá trị của kiểm tra đánh giá không thể đi vay mượn mà phải phù hợp với nội dung và phải có phương pháp thích hợp, nghĩa là không thể có phương pháp đúng cho tất cả mọi trường hợp mà chỉ đúng tùy người sử dụng nó. Một bài kiểm tra có thể là chứng cứ về giá trị cho kết quả dạy học của trường đại học này mà không thể là chứng cứ cho một trường đại học khác. Chẳng hạn Toán thống kê dùng trong trường Đại học Kinh tế có yêu cầu khác với Toán thống kê của trường Đại học Bách khoa. Theo truyền thống người ta nói đến: 1. Các độ giá trị bề mặt; 2. Độ giá trị liên quan đến tiêu chí; 3. Độ giá trị về nội dung; 4. Độ giá trị về cấu trúc Năm 1989, Messick nêu ra 6 loại độ giá trị: Loại thứ nhất: Giá trị thích hợp và tiêu biểu về nội dung. Đó là giá trị về mức độ bao trùm nội dung của môn học, bài học cần kiểm tra. Các câu hỏi trong bài kiểm tra phải là mẫu tiêu biểu cho tổng thể nội dung chương trình. Về mặt này thì với một số câu hỏi kiểm tra theo dạng tự luận sẽ khó đạt được độ giá trị cao so với một số lượng lớn các câu hỏi theo dạng trắc nghiệm lựa chọn đa phương án. Để chứng minh về độ giá trị này người ta phải lập bảng miêu tả chúng, trong đó chỉ ra ở bài kiểm tra chúng ta kiểm tra sự nắm vững môn học qua những câu hỏi nào. Loại thứ 2: Giá trị những chứng cứ cấu trúc trong của bài kiểm tra chỉ ra các câu hỏi kiểm tra đã bao phủ hầu hết nội dung giảng dạy cũng như mức độ bao phủ của các câu hỏi kiểm tra ở các trình độ từ dễ đến khó. 14
- Loại thứ 3: Giá trị của những chứng cứ về cấu trúc ngoài của bài kiểm tra. Đây là điều rất cần thiết để so sánh điểm của bài kiểm tra với các cách đo khác có liên quan. Loại thứ 4: Giá trị của những chứng cứ về sự trung thực trong quá trình kiểm tra nói lên điểm và thang phân loại qua kiểm tra có phản ánh đúng thực chất. Khi đó người xây dựng bài kiểm tra tin tưởng rằng sinh viên ít có điều kiện gian dối khi làm bài kiểm tra. Loại thứ 5: Giá trị của những chứng cứ về sự tương tự cũng như sự khác nhau qua nhiều lần tiến hành và với các nhóm người làm bài kiểm tra. Loại thứ 6: Giá trị chứng cứ về những mối liên quan của kiểm tra đánh giá với hệ quả xã hội mà việc thi cử, kiểm tra gây ra. Đây là những cơ sở giúp cho việc xây dựng qui trình kiểm tra. Trong quá trình lựa chọn các phương pháp cũng như các công cụ kiểm tra, bên cạnh sự quan tâm đến mục tiêu của chương trình, kiểm tra đánh giá còn phải chú ý đến sự công bằng và bình đẳng giữa các sinh viên, thể hiện ở độ tin cậy và độ giá trị. Theo truyền thống, độ tin cậy phải được xem xét trước hết bởi vì giá trị của kiểm tra đánh giá bị giới hạn bởi sự chính xác của nó. Mặt khác độ giá trị lại bị hạn chế bởi độ tin cậy của kiểm tra. Một bài kiểm tra muốn có giá trị thì phải có độ tin cậy. Nếu bài kiểm tra, bài thi có độ tin cậy thấp thì việc kiểm tra đó không thể dẫn đến một kết quả gì cả về nội dung cũng như dự báo. Vì vậy, khi kiểm tra kết quả học tập cần quan tâm đến độ tin cậy. IV. CÁC KIỂU DẠY HỌC VÀ PHƯƠNG PHÁP KIỂM TRA ĐÁNH GIÁ 4.1. Đặc điểm các kiểu dạy-học Việc kiểm tra đánh giá phải theo cách thức giảng dạy và học tập. Quá trình phát triển của giáo dục cho thấy có ba cách dạy và học: Kiểu sao chép, kiểu học tập có phân tích, phê phán và kiểu học tập có tìm hiểu, sáng tạo (bảng 1) Bảng 1: Đánh giá theo các kiểu dạy - học KIỂU SAO CHÉP KIỂU PHÂN TÍCH KIỂU SÁNG TẠO Phươn Đọc bài và ghi Cung cấp thông tin. Nghiên cứu, tìm tòi, thử g chép. Thảo luận nhóm. nghiệm, khám phá, tự pháp Giải quyết các bài Giao bài tập và nhiệm đề xuất các phương toán mang tính giả vụ cho từng cá nhân. pháp và các phương án, định. Khảo sát điển hình. giả thiết. Học xử lý theo tình huống. 15
- Thảo luận, nêu và giải quyết những vấn đề mới. Các Tóm tắt, mô tả, Chất vấn, đánh giá, Tìm tòi, thu thập, lập hoạt phân tích, xác định kiểm tra, chứng minh luận, giả thiết tổng hợp, động và áp dụng những quyết định và tổng hợp đánh giá và sáng tạo ra công thức và thông các ý kiến và thông tin các ý kiến và thông tin tin đã có. thành những cơ sở lập mới. luận. Các Cái gì? Tại sao? Trên cơ sở Tại sao? Cái gì? Xảy ra câu Như thế nào? nào? nếu ? Có cái gì khác hỏi Mức độ quan trọng. nữa không? Tại sao lại đặc không? trưng Kiểm Những năng lực và Những kỹ năng về phê Những kỹ năng để đổi tra kết kỹ năng về nhớ và phán và các năng lực mới và những năng lực quả sao chép lại. phân tích. ứng biến, cần thiết để tự phát Nhớ, bắt chước, sao cách tân. triển. Tự tìm hiểu những chép. phương thức, giải pháp. Sáng tạo và phát minh. Thái Có khuynh hướng Có khuynh hướng thể Có xu hướng thể hiện độ sao chép và giữ hiện cá nhân một cách sáng tạo trong suy nghĩ được nguyên hiện trạng đơn giản và xử lý các tạo ra những ý kiến độc hình chấp nhận những tư liệu sẵn có theo các đáo và cách tiếp cận thành mô hình có sẵn. hình thức khác nhau. hoàn toàn mới. Có xu Có xu hướng thích ứng hướng triển khai các và hoàn thiện các mô mẫu hình mới. hình hiện có. 4.2. Các phương pháp đánh giá kết quả học tập (Xem sơ đồ sau) CÁC PHƯƠNG PHÁP KIỂM TRA ĐÁNH GIÁ KẾT QUẢ HỌC TẬP VIẾT KIỂM TRA ĐÁNH VẤN ĐÁP QUAN SÁT GIÁ CÔNG VIỆC 16 THỰC HÀNH
- Trắc nghiệm tự Trắc nghiệm khách luận ( Essay tests ) quan( Objective ) Trả Ghép Lựa chọn đa Tự Đúng/ Điền lời Cung cấp đôi phương án luận thế ngắn thông tin Sai . Các loại câu hỏi trắc nghiệm sau đây được xem là khách quan: - Lựa chọn đa phương án - Ghép đôi - Điền khuyết - Đúng - sai Việc cho điểm các câu hỏi này là khách quan vì người cho điểm là giáo viên không cần phải dùng sự lượng giá nào để xác định xem liệu người học trả lời như vậy là đúng hay sai. Các câu trả lời của người học có thể chỉ đơn giản được so sánh với đáp án có sẵn. Các loại trắc nghiệm khác được gọi là chủ quan vì chúng đòi hỏi sử dụng số lợng giá, phán xét và diễn giải trong việc cho điểm. Đó là các loại câu hỏi trắc nghiệm: - Tự luận - Trả lời miệng. Có sự khác biệt cơ bản trong các câu hỏi trắc nghiệm. Một số câu đòi hỏi người học phải cung cấp câu trả lời lấy từ trí nhớ của họ (tài liệu). Cả hai loại trắc nghiệm chủ quan nói trên đều là trắc nghiệm cung cấp chỉ có một loại trắc nghiệm điền khuyết là loại đòi hỏi người học phải điền vào chỗ trống hoặc trả lời ngắn (từ, số, ký hiệu ) lấy từ trí nhớ (tái hiện). Các loại trắc nghiệm khách quan khác đều là loại lựa chọn, người học phải lựa chọn câu trả lời đúng từ 2 hay nhiều phương án có thể cho trước . Các loại trắc nghiệm này kiểm tra khả năng của người học trong việc nhận ra những thông tin đúng, trong khi đó các kiểu trắc nghiệm cung cấp kiểm tra khả năng trong việc tái hiện, nhớ lại thông tin đúng. 4.3. So sánh các phương pháp đánh giá 17
- STT Phương pháp đánh giá Mức độ phán xét Thời gian cần thiết để ( Judgement ) thiết kế bài đánh giá (The time required ) 1 Câu hỏi lựa chọn Rất ít phán xét Cần rất nhiều thời (Multiple choice ) gian 2 Bài kiểm tra hoàn thành ít phán xét Cần nhiều thời gian câu ( Sentence completion test ) 3 Bài kiểm tra trả lời ngắn Một vài phán xét thời gian vừa phải ( Short answer test ) 4 Bài viết có chủ đề chặt Nhiều phán xét Cần ít thời gian chẽ (Structrured essay ) 5 Bài kiểm tra mở ( Open- Rất nhiều phán xét Cần rất ít thời gian ended esay 4.4. So sánh đánh giá trắc nghiệm và tự luận ST Đánh giá bằng câu hỏi Đánh giá bằng T tự luận trắc nghiệm 1 Câu hỏi áp đặt : Trình bày; Câu hỏi hành động : Lựa chọn; Hãy Nêu; là gì ? Thế nào ? quan sát và nhận dạng; Tìm mối quan hệ vv 2 Thời gian dài : 5; 10; 15 phút Thời gian ngắn 1,2,5 phút 3 Yêu cầu chủ yếu học sinh phải Yêu cầu học sinh hiều và vận dụng là nghi nhớ, trình bày theo bài chủ yếu; tạo cơ hội bộc lộ cá tính; sáng học; thụ động tạo; chủ động 4 Nội dung đơn giản; bó hẹp Nội dung đa dạng; phong phú trong bài giảng 5 Đánh giá được ít học sinh Đánh giá được nhiều học sinh trong thời trong thời gian ngắn gian ngắn 6 Không có khả năng đoán mò Dễ xẩy ra đoán mò ( Xác xuất đoán mò 18
- tuỳ theo loại trắc nghiệm ) 7 Dễ ra các câu hỏi kiểm tra Cần nghiên cứu, thử nghiệm trắc nghiệm 8 Không kích thích tâm lý tích Có khả năng kích thích tính sáng tạo; cực; sáng tạo của học sinh hứng thú của học sinh 9 Chủ yếu kiểm tra, đánh giá Tạo nhiều cơ hội thảo luận, làm việc, theo cá nhân .Không tạo cơ làm bài kiểm tra theo nhóm hội làm việc theo nhóm 4.5. Các yêu cầu làm trắc nghiệm 1. Trắc nghiệm kiểm tra đánh giá là một bộ phận cấu thành nội dung của quá trình đào tạo nói chung và bài giảng nói riêng 2. Trắc nghiệm kiểm tra đánh giá được thực hiện liên tục thường xuyên trước, trong và kết thúc quá trình dạy- học hay bài giảng . 3. Trắc nghiệm kiểm tra đánh giá mang tính tự thực hiện việc kiểm tra - đánh giá và tự điều chỉnh quá trình học tập của người học . 4. Trắc nghiệm kiểm tra đánh giá hướng tới việc khuyến khích và giúp người học củng cố , nắm vững nội dung học tập., tự đánh giá kết quả học tập 5. Trắc nghiệm kiểm tra đánh giá mang tính đơn mục tiêu . Mỗi một Trắc nghiệm kiểm tra - đánh giá chỉ nhằm xác định được mức độ nhận thức ( kiến thức ) hoặc mức độ hình thành kỹ năng với một nội dung cụ thể . 6. Trắc nghiệm kiểm tra đánh giá phải có khả năng đo đếm, lượng giá, quan sát hoặc mô tă được ( Định tính và định lượng ) 7. Kết quả trắc nghiệm là nguồn thông tin phản hồi để đánh giá, nhận xét điều chỉnh, hoàn thiện hoạt đông dạy học. 4.6. Các nguyên tắc và căn cứ để thiết kế trắc nghiệm 1. Việc lựa chọn kiểu, loại dạng trắc nghiệm và độ khó của nó phụ thuộc vào mục tiêu học tập ( mục tiêu thực hiện ) của từng bài học, phần học ; vào quỹ thời gian để đánh giá ; vào tính chất , đặc điểm nội dung học tập ; vào trình độ và năng lực của chính giáo viên và học sinh. 2. Thiết kế trắc nghiệm để dánh giá xác định ( đo ) mức độ đạt được của người học về kiến thức, kỹ năng và thái độ có thể theo thang phân loại sau : CÁC MỨC ĐỘ NẮM VỮNG KIẾN THỨC 19
- Trình độ Định nghĩa Sự thực hiện Ghi chú 1. Biết Nhắc lại các sự kiện, khái -Có thể nhắc lại một định luật, niệm, tri thức nói lại, mô tả các thuộc tính, tính chất của một sự vật, hiện tượng 2 Hiểu Nắm được bản chất; đặc - Có thể so sánh, đối chiếu, tính ; nguyên lý , quy luật thực hiện các tính tính toán theo công thức 3.Vận dụng thể hiện khả năng sử - Tính toán theo công thức dụng hiểu biết, tri thức - Đọc được bản vẽ vào các tình huống cụ thể - Giải thích được hiện tượng, biết được nguyên nhân - Lựa chọn, tìm mối quan hệ 4.Phân thể hiện khả năng phân - Phân tích mạch điện tích/tổng tích các sự kiện , hiện - Phân tích các đặc tính của một hợp tượng và khái quá hoá, loại vật liệu tổng hợp hoá -Hệ thống hoá và phân loại vật loệu 5. Đánh Vận dụng tri thức vào - Đánh giá chất lượng vật liệu, giá thực tế một cách sâu sắc sản phẩm . Làm chủ tri thức - Đánh giá tính hợp lý của các hoạt động, quy trình 6.Sáng tạo Phát triển hệ thống tri thức trong các điều kiện và hoàn cảnh mới CÁC MỨC ĐỘ HÌNH THÀNH KỸ NĂNG Trình độ Đặc trưng Khả năng thực hiện Ghi chú 1. Bắt chước Quan sát hình Thực hiện các thao động tác thành biểu tượng theo như thao tác mẫu và sao chép, dập -Thụ động, kém tự tin khuôn 20
- 2.Làm được ( kỹ Quan sát và có -Tự chủ, tự tin khi thao tác, năng cơ bản bước khả năng thực thực hiện các kỹ năng. đầu ) hiện công việc độc -thực hiện được các kỹ năng cơ lập như chậm., bản, không phức tạp cần có sự hỗ trợ -Chưa tạo được mói liên hệ, phối hợp giữa các kỹ năng 3. Làm chính xác ( Quan sát và có -Thao , động tác chuẩn mực, kỹ năng thực hiện khả năng thực chính xác độc lập ) hiện công việc độc -Tạo được sự liên tục khi thực lập chính xác hiện công việc 4.Làm biến hoá ( Quan sát và có - Bảo đảm tốc độ làm việc kỹ xảo tổng hợp ) khả năng thực - . Thao tác và động tác chuản hiện công việc độc mực lập nhanh và - Xử lý linh hoạt tìmh huống chính xác -Kết hợp nhiều loại kỹ năng - Thực hiện công việc 5.Làm thuần thục, không cần sự kiểm soát tự động hoá ( kỹ thường xuyên của ý thức ( xảo bậc cao ) Tự động hoá ) - Mang tính sáng tạo . Kiểm tra đánh giá kiến thức Mục đích kiểm tra đánh giá kiến thức là xác định xem hoc sinh đã biết gì, ở mức độ nào trong các nội dung đã học.Tuỳ theo mục tiêu học tập mà có những mức độ yêu cầu khác nhau từ đơn giản nhất là tái hiện được (kể được, mô tả được, trình bày được), đến áp dụng được, so sánh, phân tích, giải thích, Trong thực tế nghiên cứu xã hội nói chung và nghiên cứu giáo dục nói riêng còn có nhiều nội dung cần đo lường và đánh giá như đo lường, đánh giá năng lực trí tuệ , trí thông minh ( IQ ) vv-. - Kiểm tra đánh giá kỹ năng Mục đích kiểm tra đánh giá kỹ năng là xác định xem người học đã làm được gì ở mức độ nào trong các nội dung đã học.Mức độ yêu cầu người 21
- học làm được cũng từ đơn giản nhất là bắt chớc được đến làm đúng, chuẩn xác rồi đến làm nhanh và thành thạo. - Kiểm tra đánh giá thái độ Kiểm tra đánh giá thái độ nhằn xem xét ngưòi học có cách ứng xử, cách biểu lộ tình cảm, hứng thú, cách bộc lộ những phẩm chất nhân cách như thế nào trước một sự kiện, hiện tượng, trước công việc, trước đồng nghiệp, Kiểm tra đánh giá thái độ là khó nhất vì điều mà giáo viên biết được chỉ là “phần nổi của tảng băng”. Còn “giá trị thực” của người học thì được xác định một cách chính xác không thể qua vài lần kiểm tra đánh giá mà phải qua cả quá trình tương đối lâu dài. Vì vậy, giáo viên cần kết hợp giữa việc theo dõi, giám sát thường xuyên với kết quả của những đợt kiểm tra đánh giá định kỳ hay cuối khoá. 4.7. Xây dựng bảng trọng số Trên cơ sở xãc định rõ các mục tiêu dạy học ( Chương, mục, bài ) cần phân tích mục tiêu dạy-học ( kiến thức, kỹ năng, thái độ ) . Hệ thống tri thức bao gồm các thành tố cơ bản sau : ( Xem hình 2 ) - Tri lý : Các quy luật, nguyên lý, khái niệm khoa học v.v - Tri sự : Các hiểu biết về các sự kiện, hiện tượng trong tự nhiên, xã hội, thực tiễn cuộc sống .v.v -Tri hành : Các tri thức hướng dẫn hành động như quy trình, hướng dẫn, các chuẩn mức v.v - Tri nhân : Hiểu biết về con ngưòi, quan hệ xã hội, hệ thống giá trị v.v Tri lý Tri sự CƠ CẤU CÁC THÀNH TỐ TRI THỨC Tri hành Tri nhân Hình 2. Cơ cấu các thành tố tri thức Hệ thống các kỹ năng bao gồm : 22
- - Các kỹ năng tư duy : Phân tích; tổng hợp; so sánh ; khái quát; dự đoán; chuẩn đoán vv. - Các kỹ năng quản lý: Lập kế hoạch; tổ chức chỉ đạo; phối hợp; kiểm tra & đánh giá - Các kỹ năng giao tiếp : Sử dụng ngôn ngữ, tiếp xúc; hướng dẫn; trình bày vv -Các kỹ năng thông tin : Thu thập, lựa chọn; xử lý thông tin vv -Các kỹ năng thực hành & tác nghiệp : thiết kế; vận hành; sửa chữa; thí nghiệm, giải quyết vấn đề vv - Các kỹ năng hành chính.vv Các kỹ năng trên được hình thành và phát triển thông qua quá trình đào tạo và hành nghề thực tế. Trong quá trình đào tạo, học tập là một quá trình nhận thức và hành động của người học nhằm thu nhận kiến thức mới, hình thành và phát triển các kỹ năng trí tuệ và hành động trong một lĩnh vực cụ thể (khoa học-công nghệ, xã hội hoặc nghề nghiệp) góp phần hình thành và phát triển nhân cách, tạo ra thái độ và giá trị đúng đắn trong cuộc sống và lao động nghề nghiệp của mỗi cá nhân trong xã hội khi vận dụng thang đo Blool cần xây dựng bảng trong số ( ma trận hai chiều ) để xác định và cân đối các mức độ đo đối với từng mục ( chủ đề , bàI giảng ) trong nội dung dạy học và phù hợp với mục tiêu dạy học CÁC MỨC ĐỘ ĐÁNH GIÁ TRỌNG STT CHỦ ĐỀ SỐ (%) BIẾT HIỂU VẬN DỤNG ĐÁNH GIÁ A B C TỔNG 100 SỐ Các căn cứ để xác định trọng số là ; - Vai trò , vị trí và tầm quan trọng của chủ đề - Kế hoạch, thời lưọng dành cho giảng dạy và học tập từng chủ đề - Mục tiêu dạy học của từng chủ đề - V. ĐÁNH GIÁ CÂU HỎI TRẮC NGHIỆM : 23
- 5.1 Đánh giá câu hỏi trắc nghiệm : a/ độ khó ( FV ) Độ khó của câu hỏi trắc nghiệm có tác dụng phân tán điểm số của nhóm học sinh làm trắc nghiệm . Phổ các điểm kiểm tra càng rộng càng tốt. Sự phân tán hoặc sự trảI rộng điểm số sẽ đạt mức thích hợp khi các câu hỏi trắc nghiệm có độ khó thích hợp và độ phân biệt cao. Độ khó của câu trắc nghiệm được xác định căn cứ vào số lượng thí sinh làm đúng câu trắc nghiệm đó. Công thức : FV = Nd/N x100% trong đó : F V : Chỉ số độ khó Nd : Số thí sinh làm đúng N : Tổng số thí sinh tham gia làm trắc nghiệm Chỉ số FV thưòng trong khoảng >25% và < 75%. Nếu FV =0 –Câu hỏi quá khó còn FV =1 –Câu trác nghiệm quá dễ. Thang phân loại độ khó đực quy ước như sau : - Câu dễ : có 70 đến 100 % thí sinh trả lời đúng - Câu trung bình : từ 30% đến 70% thí sinh trả lời đúng - Câu khó : từ 0% đến 30% thí sinh trả lời đúng Độ khó trung bình của câu trắc nghiệm còn có thể đựoc tính theo tỷ lệ may rủi và bằng tỷ số giữa điểm trung bình của bài trắc nghiệm với tổng số điểm có thể có được của bàI trắc nghiệm. b/ Độ phân biệt ( DI) Độ phân biệt của câu trắc nghiệm thể hiện ở chỗ những người đạt điểm bàI trắc nghiệm cao sẽ làm đúng câu đó và những người đạt điểm thấp sẽ làm sai câu đó. Có thể xem độ phân biệt (DI) là sự phân bố tỷ lệ thí sinh trả lời đúng hoặc sai câu trắc nghiệm đó ( nhóm khá hoặc nhóm kém ) Công thức tính độ phân biệt ( DI ) là : DI = N khá - N kém / n DI : Chỉ số độ phân biệt N khá : Số thí sinh của nhóm đạt điểm kiểm tra cao làm đúng câu đó N kém : Số thí sinh của nhóm đạt điểm kiểm tra thấp làm đúng câu đó N ; Trung bình cộng của số thí sinh nhóm khá và nhóm kém 24
- Độ phân biệt tốt trong khoảng > 0,3. Nếu DI <0,1 thì câu trắc nghiệm có độ phân biệt quá thấp không nên dùng . Trong câu hỏi trắc nghiệm nhiều lựa chọn, ngoàI phân tích độ khó,độ phân biệt còn cần phân tích các câu nhiễu của câu trắc nghiệm. Khi phân tích phương án nhiễu cần căn cứ vào các dấu hiệu sau : - Tần số lựa chọn câu nhiễu . Nếu có nhiều lựa chọn hoặc không ai lựa chọn câu nhiễu thì cần xem xét lại - Số thi sinh khá lựa chọn câu nhỉễu nhiều hơn số thí sinh kém 5.2. Đánh giá bài trắc nghiệm khách quan a/ Độ tin cậy ( R) -Độ tin cậy là khái niệm cho biết bài trắc nghiệm đo bất cứ cài gì mà nó đo đáng tin cậy đến đâu và ổn định đến mức nào .Độ tin cậy được xem như là mức độ chính xác của phép đo về mặt lý thuyết . Độ tin cậy cũng có thể được xem như là số đo về sự khác biệt giữa điểm số quan sát được và điểm số thực . Hệ số tin cậy là hệ số tương quan của tỷ lệ trả lời đúng – sai giữa các câu trắc nghiệm bằng các bàI trắc nghiệm tương quan. Độ tin cậy được tính theo công thức Kuder-Richardson cho một giá trị gần đúng như sau : R = R. : Độ tin cây của bài trắc nghiệm X : Giá trị trung bình của bài trắc nghiệm : Phương sai của bài trắc nghiệm n : Số lượng câu hỏi trong bàI trắc nghiệm b/ Độ giá trị : Theo các tác giả Stodola và Stordahl thì độ giá trị phản ảnh mức độ mà một bàI trắc nghiệm đo được đúng cái mà nó định đo. Độ giá trị nói đến tính hiệu quả của một bàI trắc nghiệm trong việc đạt được những mục đích xác định. c/ Độ khó của bài trắc nghiệm ( FVB ) Độ khó của bài trắc nghiệm phụ thuộc vào trình độ học sinh và đựoc tính theo công thức sau : 25
- FBV = X / K - X : Điểm trung bình của bài trắc nghiệm - K : Tổng số câu trắc nghiệm bằng điểm tối đa của bài trắc nghiệm ( mỗi câu trắc nghiệm đúng tính 1 điểm ) VI. CÁC LOẠI TRẮC NGHIỆM VÀ PHƯƠNG PHÁP THIẾT KẾ 6.1 .Xây dựng các bài trắc nghiệm đánh giá mức độ nắm và vận dụng kiến thức Trong thực tế giáo dục ở nước ta, có thể nghiên cứu vận dụng một số phương pháp trắc nghiệm (test) đánh giá tri thức đơn giản như sau : A/ Chọn lựa câu trả lời đúng. VD. Xi măng là một loại vật liệu có nguồn gốc ; 1. Hữu cơ 2. Vô cơ 3. Cả vô cơ và hữu cơ B/ Đánh dấu vào các ô trống cần thiết. VD. Các tính chất của kim loại là : -Dẫn điện -Dẫn nhiệt -Chịu nén tốt - Dễ thay đổi hình dạng - Dễ thấm nước C/ Tìm các chỗ sai hoặc chưa chính xác trong sơ đồ - bản vẽ. 26
- Quan sát bản vễ , sơ đồ sau : Lấy Sơ đồ mạch điện hoặc sơ đồ, trình tự lấp ráp một sản phẩm theo tài liệu của học viên tham dự lớp học D/ Lựa chọn và điền thêm vào đoạn trống. E/ Nhận biết các dấu hiệu - ký hiệu - Lấy ký hiệu trong các bản vẽ xây dựng hoặc cơ khí, điện, sơ đồ cắt may vv do học viên chuẩn bị để minh hoạ - F/ Tìm và nhận dạng các mối quan hệ Phím bàn máy tính Chức năng Enter Viết chữ hoa Cáp Lock Xoá Delete Xuống dòng Shift 3.2. Xây dựng các loại trắc nghiệm đánh giá kỹ năng thực hành như : - Kỹ năng quan sát - kỹ năng tính toán - Kỹ năng nhận dạng - Kỹ năng giao tiếp -Kỹ năng trình diễn - Kỹ năng so sánh 27
- - Kỹ năng đo. kiểm - Kỹ năng thực hiện các thao động tác - Kỹ năng xử lý tình huống -Kỹ năng thông tin 6.2. . Quy trình thiết kế và thử nghiệm bài kiểm tra bằng trắc nghiệm Xác định mục đích và mức độ kiểm tra- đánh giá7 Lập bảng trọng số Lựa chọn loại trắc nghiệm - Thiết kế câu hỏi trắc nghiệm / thử nghiệm Thiết kế cấu trúc và nội dung Bài trắc nghiệm. Xác định và phân bổ thang điểm đánh giá , thời gian trắc nghiệm 28 -Chỉnh sửa - Lựa chọn hình thức phiếu trắc nghiệm
- VII. ĐÁNH GIÁ THỰC HÀNH BÀI TRẮC NGHIỆM 7.1. Bài trắc nghiệm tốt trong các môn lý thuyết Cái gì làm cho bài trắc nghiệm tốt hay dở ? Các bài trắc nghiệm của Bạn có chất lượng nào ? Bạn chọn dùng loại trắc nghiệm nào, khách quan hay chủ quan, tái hiện hay lựa chọn ? Nhiều tài liệu, nhiều chuyên gia trắc nghiệm đồng ý rằng một bài trắc nghiệm tốt phải có những đặc điểm sau: 7.1.1. Trắc nghiệm phải có tính giá trị: Tính giá trị là phạm vi mà trắc nghiệm đo lường được cái gì đã dự định là cần phải đo. Giáo viên có thể đi sai nếu trắc nghiệm của giáo viên đo nhiều hơn cái giáo viên định đo. Khi giáo viên đánh giá kiến thức của người học về các sự kiện, số liệu hay thông tin cụ thể nào đó. Trắc nghiệm sẽ ít giá trị hơn nếu chúng đo được cả những kiến thức khác. Ví dụ, điều rất quan trọng là người học đã đọc một chương tài liệu trứơc khi bước tiếp sang hoạt động học tập sau. Khi muốn trắc nghiệm để khẳng 29
- định rằng người học đã đọc và hiểu phần đọc đó. Một trong các câu hỏi trắc nghiệm sẽ là câu hỏi lựa chọn đa phơng án sau đây: Nước nào hiện nay là đi đầu trong lĩnh vực hàn ma sát ? (1) Ấn Độ (2) Hy Lạp (3) Nicaragoa (4) Nga Một số người học có khả năng trả lời đúng câu hỏi này có sử dụng kiến thức chung cho dù họ có đọc bài hay không. Một số người học có thể biết được rằng trong số 4 nớc đó thì Nga là nước có nền công nghệ tiên tiến hơn cả. Do đó, Nga có khả năng nhiều nhất là nứơc đi đầu trong lĩnh vực công nghệ này. Một sự đoán mò dựa trên lý do đó có thể là đúng. Câu trắc nghiệm muốn đo cả kiến thức chung và cả kiến thức riêng về phần tài liệu được giao đọc đó thì phải được sử dụng theo hớng các phương án trả lời phải bình đẳng với nhau (ví dụ tất cả các nớc nêu ra đều phải có nền công nghệ tiên tiến như nhau), lúc đó kiến thức chung ít công dụng hơn. Người học phải biết nội dung chứa đựng trong phần tài liệu đọc để trả lời câu hỏi. Nh vậy bài trắc nghiệm đo cái dự định đó nên có tính giá trị cao hơn. Tính giá trị của bài trắc nghiệm cũng bị vi phạm nếu câu hỏi của bài trắc nghiệm đã được trả lời ở câu hỏi khác. Ví dụ có 2 câu hỏi điền khuyết sau: vô hại sống và lớn lên trên các đối tượng không phải động vật. Khi các sinh vật vô hại vào được trong cơ thể con người, có thể bắt đầu. Câu trả lời đúng ở câu thứ nhất là sinh vật đã được cho biết ở câu thứ hai. Người học không học bài cũng có thể trả lời đúng. Do vậy, tính giá trị của bài trắc nghiệm bị giảm sút. Tính giá trị của một bài trắc nghiệm cũng có thể bị giảm nếu người học phải dùng các kỹ năng khác với những kỹ năng dự định kiểm tra để trả lời các câu hỏi. Ví dụ trắc nghiệm viết đòi hỏi người học dùng các kỹ năng đọc 30
- sách. Các trắc nghiệm tự luận đòi hỏi dùng kỹ năng viết. Trắc nghiệm miệng đòi hỏi sử dụng các kỹ năng giao tiếp bằng lời nói. Sự cần thiết đối với người học sử dụng các kỹ năng khác đó có thể là một vấn đề nghiêm trọng, gây ra việc giảm giá trị, nếu một số người học không có khả năng đọc hoặc hiểu các câu hỏi để bắt đầu làm bài. Nếu điều đó xảy ra thì bài trắc nghiệm của Bạn đo lờng hai thứ, đó là kiến thức kỹ thuật và kỹ năng giao tiếp của người học, mặc dù Bạn có dự định đo lờng đúng hay không. Người học cần đạt trình độ kỹ năng giao tiếp nhất định để thành đạt trong thế giới lao động, chúng là rất quan trọng, nhng nếu Bạn muốn đo lờng kiến thức kỹ thuật thì phải đảm bảo rằng trắc nghiệm của Bạn cho phép người học chỉ rõ xem học thực tế có được bao nhiêu kiến thức. Nếu kỹ năng giao tiếp của người học yếu thì điều đó cần được xác định và sửa chữa nhng nó không được phép che phủ mất việc đo lờng các kỹ năng kỹ thuật. Vấn đề này có thể khắc phục, tránh được nếu các câu hỏi được soạn cẩn thận với chú ý đến các trình độ kỹ năng giao tiếp của người học. Nói cách khác, các câu hỏi viết phải phù hợp với trình độ của người học, phải diễn đạt rõ ràng, đơn giản sao cho người học đủ hiểu để có thể trình bày được kiến thức kỹ thuật của họ. Bằng cách đó, tác động của kỹ năng giao tiếp sẽ không đáng kể đối với tính giá trị. Độ dài của bài trắc nghiệm cũng có tác động đến tính giá trị. Ví dụ Bạn chuẩn bị một bài thi kết thúc bao hàm hết tất cả nội dung kỹ thuật của học kỳ, và Bạn muốn trắc nghiệm kiến thức kỹ thuật và khả năng của người học trong việc sử dụng kiến thức đó. Bài thi sẽ phải dài đủ để bao hàm tất cả kiến thức và việc sử dụng kiến thức mà Bạn dự định trắc nghiệm. Nếu bài thi chỉ có 5 câu trắc nghiệm lựa chọn đa phơng án thì chỉ có thể trắc nghiệm kiến thức của người học về 5 vấn đề nhỏ chứ không thể về tất cả nội dung của học kỳ. Bài thi kết thúc với 5 câu hỏi đó sẽ có giá trị rất thấp. Nếu trắc nghiệm để đo lường kiến thức của nhiều phần nội dung thì nó phải đủ dài để bao gồm đại diện của tất cả các phần đó. 31
- Mặt khác, một bài trắc nghiệm 5 câu hỏi có thể có tính giá trị rất cao trong các tình huống khác. Có thể Bạn muốn xác định xem nếu người học đã sẵn sàng đi tiếp sang các hoạt động chân tay cha sau khi đọc xong thông tin. Một bài trắc nghiệm 5 câu hỏi có thể là vừa đủ để kiểm tra 5 thông tin nhỏ. 7.1.2. Bài trắc nghiệm phải có độ tin cậy Độ tin cậy là sự nhất quán của kết qủa mà trắc nghiệm đo được. Các chuyên gia lý thuyết trắc nghiệm cho rằng một bài trắc nghiệm đáng tin cậy luôn luôn là tin cậy được, có nghĩa là nó nhất quán, kiên định đo cái dự định đo. Một vài nhà lý luận coi độ tin cậy nh là một phần của tính giá trị. ở bất cứ trờng hợp nào điều quan trọng cần ghi nhớ là một bài trắc nghiệm có thể đáng tin cậy (ví dụ có thể đạt một sự đo đạc nhất quán) kể cả nếu nh nó không có tính giá trị (ví dụ nó không đo cái dự định đo). Điều này có thể được minh hoạt bằng một ví dụ cực đoan nh sau. Cho rằng Bạn quyết định đo kiến thức của người học về một số thông tin. Đối với một số lý do không giải thích được - nh Bạn có một ngày xui xẻo chẳng hạn - Bạn viết bài trắc nghiệm bằng tiếng Đức, cho dù chẳng có người học nào của Bạn hiểu lấy một từ tiếng Đức. Bây giờ, bài trắc nghiệm này sẽ không có giá trị gì đối với bất cứ người học nào không thể nói được tiếng Đức. Nh vậy là nó không có giá trị đối với người học của Bạn. Nó không đo cái dự định đo, thay vào đó nó đo kiến thức của người học về tiếng Đức. Tuy nhiên, nh thế thì bài trắc nghiệm vẫn có độ tin cậy chứ. Chẳng hạn Bạn tổ chức trắc nghiệm đối với người học của Bạn, đó là một cơ hội tốt để tất cả người học đều được điểm “không”. Hơn nữa, họ đều có cùng điểm “không” nhất quán. Hôm sau, Bạn lại trắc nghiệm đúng nh vậy và người học lại chỉ nhận điểm “không” (trừ phi tất cả người học đã dành cả tối hôm trớc để học thầy dạy tiếng Đức). Vì vậy, mặc dù bài trắc nghiệm tiếng Đức này không có giá trị gì đối với những người học nói tiếng Anh nhng nó lại có kết quả tin cậy được, đó là các điểm số nhất quán. Một yếu tố có tác động lớn đến độ tin cậy của bài trắc nghiệm đó là tính chủ quan của việc cho điểm. Nếu một bài trắc nghiệm có độ tin cậy cao, Bạn có thể tổ chức và tổ chức lại đối với một nhóm người học và thu được các điểm số giống nhau. Hoặc hai điểm số khác nhau cần có ở một loạt bài trắc 32
- nghiệm người học, nhng khi phân hạng chúng một cách độc lập và đều đạt tới các điểm nh sau: Tuy nhiên, việc cho điểm một cách chủ quan có thể làm giảm độ tin cậy của trắc nghiệm vì nó có thể cho phép đo không nhất quán. Hai giáo viên khác nhau có thể độc lập cho điểm người học làm bài trắc nghiệm tự luận và đa ra các điểm số khác nhau cho cùng một câu trả lời. Đối với vấn đề này, một người chấm điểm có thể cho điểm bài trắc nghiệm lần này lại khác lần sau. Các nghiên cứu tâm lý học khẳng định rằng vậc cho điểm không nhất quán có thể là một vấn đề nghiêm trọng với các câu hỏi trắc nghiệm chủ quan. Người chấm phải có những quyết định nhất quán trên cơ sở sự lợng giá của cá nhân họ về những câu trả lời của người học. Vì vậy cần phải khách quan hoá việc chấm các bài trắc nghiệm chủ quan. Ví dụ, trớc khi tổ chức bài trắc nghiệm tự luận, Bạn cần phải xác định xem liệu có bớt đi một số điểm bởi người học trả lời viết câu không hoàn chỉnh hay có lỗi chính tả (chúng có phải là những yêu cầu hay những kỹ năng Bạn cần đo hay không ? Bạn định trừ đi tối đa bao nhiêu cho mỗi lỗi ?). Bạn 33
- phải chuẩn bị một barem cho điểm, thông qua đó có thể giảm đến mức tối thiểu các vấn đề về độ tin cậy của các trắc nghiệm chủ quan. Độ tin cậy là quan trọng, tuy nhiên cũng cần phải cân đối với các vấn đề khác. Nói chung, các câu hỏi trắc nghiệm khách quan là tốt để đo kiến thức ở trình độ thấp hpn (ví dụ tái hiện các sự kiện). Kiến thức ở trình độ cao hơn được đo một cách có hiệu quả bằng các câu hỏi trắc nghiệm chủ quan. Vì vậy không nhất thiết chỉ dùng trắc nghiệm khách quan do đảm bảo được độ tin cậy (và dễ cho điểm nữa). Tốt hơn, Bạn cần chú ý làm sao cho quy trình chấm các bài trắc nghiệm chủ quan càng khách quan được càng tốt. 7.1.3. Trắc nghiệm cần phải sử dụng được Cho dù bài trắc nghiệm có giá trị và tin cậy đến đâu đi nữa thì nó cũng không có ích lắm đối với Bạn nếu nó khó và tốn kém thời gian quá để chuẩn bị, tổ chức thực hiện hay chấm điểm. Một bài thi kết thúc với 1000 câu hỏi trắc nghiệm khách quan có thể rất có giá trị và đáng tin cậy, song nó đơn giản là không thực tế chút nào về mặt sử dụng. Cũng vậy, trắc nghiệm tự luận hoặc vấn đáp có thể được dùng trong lý thuyết để trắc nghiệm người học tái hiện sự kiện, số liệu hoặc thông tin trình độ thấp nhất của kiến thức. Tuy nhiên, chúng có thể tốn kém thời gian, người học cần nhiều thời gian hơn để làm bài, giáo viên cũng cần nhiều thời gian để chấm bài. Để trắc nghiệm kiến thức ở trình độ thấp nh vậy ta nên dùng trắc nghiệm khách quan bởi có tính thực tế va sử dụng được. 7.2. Bài trắc nghiệm tốt trong phần thực hành Bạn xây dựng các bài trắc nghiệm nh thế nào để chún có tính giá trị, độ tin cậy và tính sử dụng được ? Hãy dựa vào các mục tiêu thực hiện của người học để soạn bài trắc nghiệm. Do các mục tiêu thực hiện đó được xác định theo kiến thức, kỹ năng và thái độ cần dạy và học nên chúng đã tạo nên cơ sở để đánh giá người học. Khi Bạn xác định các mục tiêu thực hiện về kiến thức cần đa vào trắc 34
- nghiệm, Bạn cũng có thể xác định các tiêu chí cụ thể ghi trong mục tiêu, theo đó để đo kết quả người học đạt được. Dới đây là một số yêu cầu đối với bài trắc nghiệm .Bài trắc nghiệm phải có độ phân biệt Nếu bài trắc nghiệm đo cái định đo thì nó phải phân biệt được giữa các người học xem ai biết những cái cần trắc nghiệm, ai không biết. Nếu trắc nghiệm không phân biệt được điều đó thì tính giá trị của nó là thấp. Thông thơờng, những người học khá làm bài trắc nghiệm cũng đạt khá, những người học lâu nay học kém thì làm bài trắc nghiệm cũng kém Nếu vậy thì bài trắc nghiệm đó có độ phân biệt và đa vào sử dụng được. Tuy nhiên Bạn cũng cần so sánh giữa kết quả qua trắc nghiệm và kết quả học tập hàng ngày, nh khi thực hành tiếp sau phần lý thuyết ấy để khẳng định người học nào nắm được bài, người học nào cha. . Tối thiểu hoá những tác động của kỹ năng giao tiếp Mỗi loại trắc nghiệm đều đỏi hỏi người học sử dụng một số kỹ năng giao tiếp để hiểu và trả lời bài. Bài trắc nghiệm sẽ có ít giá trị hơn nếu nó đòi hỏi người học phải sử dụng những kỹ năng giao tiếp mà họ không có. Vì vậy, Bạn cần phải lựa chọn các câu hỏi một cách cẩn thận. Ví dụ, trắc nghiệm tự luận có thể yêu cầu trình độ cao nhất của kỹ năng giao tiếp. Nếu mục tiêu thực hiện đòi hỏi người học phải tự tổ chức và trình bày thông tin thì ta phải dùng trắc nghiệm tự luận là đơng nhiên. Nhng mục tiêu chỉ đơn giản là người học tái hiện kiến thức thôi thì là dùng loại trắc nghiệm khách quan không đòi hỏi trình độ giao tiếp cao. Bạn có thể giảm thiểu tác độn của kỹ năng giao tiếp bằng cách viết các câu hỏi trắc nghiệm rõ ràng và đơn giản để mọi người học có thể đọc và hiểu nó nh nhau và trả lời đúng được nếu họ nắm được bài. Điều đó không có nghĩa là Bạn không trắc nghiệm được những vấn đề đặc biệt, riêng trong kiến thức người học. Ngợc lại, thỉnh thoảng Bạn cũng cần phải làm điều đó do các lĩnh vực ngành nghề khác nhau đều có những 35
- vấn đề riêng biệt. Dù sao thì vẫn phải soạn trắc nghiệm một cách rõ ràng, đơn giản, dễ hiểu một cách trực tiếp. Tơng tự, ta cũng cần chú ý đến đối tợng người học, ai khiếm thị sẽ gặp khó khăn trong các bài trắc nghiệm viết, ai khiếm thính sẽ gặp rắc rối khi kiểm tra miệng. .Phần hướng dẫn phải rõ ràng, đầy đủ và đơn giản Phần hớng dẫn khó, phức tạp, không đầy đủ sẽ làm giảm tính giá trị và độ tin vậy của bài trắc nghiệm do người học không đọc được, không hiểu được câu hỏi giống nh nhau và sẽ đoán và trả lời theo ý mình hiểu, việc đo l- ờng không nhất quán được. Để đảm bảo được sự rõ ràng, đầy đủ và đơn giản, ta có thể thử các câu trắc nghiệm mới được soạn ở một số người học. Phần hớng dẫn phải giải thích các chi tiết cần chú ý làm trong bài trắc nghiệm: Thời gian làm bài, thời gian cho từng phần, điểm cho bài, cho từng phần và cho từng câu hỏi một, người học phải đánh dấu ngay trên tờ giấy kiểm tra hay trên một tờ riêng, họ phải đánh dấu câu trả lời của mình nh thế nào. Người học phải biết điền từ thích hợp vào chỗ trống, khoanh tròn vào số của câu trả lời đúng hay đánh dấu X, T vào chỗ phù hợp ý mình, nếu cần thiết còn phải nêu ví dụ để người học hiểu cách thức làm bài. Không sử dụng quá nhiều dạng câu hỏi khác nhau Nói chung người ta đồng ý là không nên dùng nhiều hơn 3 dạng câu hỏi khác nhau trong một bài trắc nghiệm. Các câu hỏi cùng dạng cần được xếp vào một nhóm cùng với nhau. Nhng lu ý là đánh số thứ tự các câu hỏi liền một mạch từ đầu đến cuối bài. Bài trắc nghiệm cần có độ dài vừa phải Độ dài của bài trắc nghiệm được xác định có tính đến sự dung hoà giữa tính giá trị, độ tin cậy và tính sử dụng được. Đối với những bài trắc nghiệm về phạm vi kiến thức rộng thường là dài, ta cần soạn nhiều câu hỏi hơn. Tuy nhiên nếu bài trắc nghiệm dài quá thì độ tin cậy sẽ bị ảnh hởng do nó làm cho người học dễ chán, mệt mỏi, không còn hứng thú, mất sự kiên định, thậm chí còn nghi nhờ, lẫn lộn trí nhớ v.v Độ dài thích hợp của bài trắc nghiệm còn tuỳ thuộc vào tình huống cụ thể, ở đó kinh nghiệm của giáo viên sẽ giúp giáo viên quyết định. 36
- Tránh những yếu tố đoán mò Để giảm đoán mò, ta cần chú ý sao cho ở mỗi câu hỏi các câu trả lời không lộ manh mối gì với câu trả lời đúng. Mỗi người học có một bản copy bài trắc nghiệm Nếu Bạn tổ chức trắc nghiệm viết thì mỗi HS cần phải có bản kiểm tra riêng của mình. Bản kiểm tra cần phải được chuẩn bị tốt, sạch sẽ, rõ ràng và không bị lỗi. Tạo ra môi trờng thuận lợi cho trắc nghiệm Trong phòng học hoặc phòng thí nghiệm phải có môi trờng vật lý, môi trờng tâm lý thuận lợi, dễ chịu. Lập kế hoạch bài trắc nghiệm một cách cẩn thận Bạn cần hiểu rằng riêng đặc điểm uan trọng nhất của một bài trắc nghiệm tốt là có tính giá trị. Một yếu tố tác động chủ yếu đến tính giá trị của một bài trắc nghiệm là làm thế nào để nó kiểm tra được kiến thức của HS một cách tổng hợp. Chỉ có một số ít các bớc đơn giản trong việc lập kế hoạch trắc nghiệm. Trớc hết, Bạn phải xác định được các mục tiêu về kiến thức của HS mà Bạn muốn đo lường . Thứ hai là lập được danh mục các mục tiêu đó lên một tờ giấy hay tờ mẫu kế hoạch. Danh mục đó cần mô tả được nội dung kiến thức mà bài trắc nghiệm bao quát. Thứ ba là Bạn cần xem xét lại các giá án hàng ngày hay các bộ tài liệu học tập, nếu thấy cần, để xác định những nội dung bổ sung cần đa vào trắc nghiệm. Thỉnh thoảng các mục tiêu về sự thực hành của HS không được trình bày đủ chi tiết để xác định noọi dung cần trắc nghiệm. Nếu Bạn gặp tr- ờng hợp nh vậy thì Bạn có thể có sự trợ giúp từ các giáo án hay bộ tài liệu học tập đó. Thứ t, Bạn cần xác định phải có bao nhiêu câu hỏi cho mỗi mục tiêu mà Bạn đã ghi trong danh mục. Điều đó phụ thuộc vào mục tiêu đó có tầm quan trọng nh thế nào so với các mục tiêu khác được bao quát trong bài tắc nghiệm. Một số chỉ dấu về tầm quan trọng tơng đối này nh (1) Tổng 37
- số thời gian dành cho mỗi một mục tiêu là bao nhiêu, (2) Tổng số những chỗ nhấn mạnh trong dạy học đối với mục tiêu đó và (3) Tổng số tài liệu, nội dung mà mục tiêu đó bao hàm. Có thể còn những chỉ dấu khác nũa cần được xem xét trong tình huống cụ thể của Bạn. Mục tiêu càng quan trọng thì cần phải có càng nhiều câu hỏi để trắc nghiệm. Trong việc xác định số lợng câu hỏi cho mỗi mục tiêu, Bạn cần xác định trọng số tơng đối cho từng nội dung khác nhau trong bài trắc nghiệm. Bạn có thể xác định số điểm hay trọng sô cho mỗi câu hỏi hoặc một nhóm các câu hỏi. Nếu mục tiêu A được bao quát gấp đôi so với mục tiêu B vì nó quan trọng gấp đôi thì tổng số điểm của các câu hỏi dành cho A phải gấp đôi số điểm của các câu hỏi dành cho B. 38
- Tài liệu tham khảo chính 1. Dương Thiệu Tống : Trắc nghiệm và đo lường thành quả học tập ( Phương pháp thực hành) .Trưòng đại học tổng hợp TP Hồ Chí Minh-1995 2. Đặng Bá Lãm. Kiểm tra-đánh giá dạy học đại học. NXB Giáo dục -2002 2. Lâm Quang Thiệp . Đo lường và đánh giá thành quả học tập. Khoa Sư phạm-ĐHQG Hà nội- Hà nội-2003 3. Lê Đức Ngọc . Bài giảng đo lường và đánh giấ thành quả học tập trong giáo dục. Khoa Sư phạm-ĐHQG Hà nội- Hà nội-2003 4. Trần Khánh Đức : Sư phạm kỹ thuật - NXB Giáo dục. Hà nội - 2002 5. Trần Khánh Đức . Quản lý và kiểm định chất lượng đào tạo nhân lực theo ISO&TQM. NXB Giáo dục. Hà nội -2004 6. Assessment in Teachinh Methodology- Project VAT ( Australia ) 7. Tài liệu về đánh giá của dự án Swisscontact 39