Thi trắc nghiệm môn Toán: Thế giới có kinh nghiệm gì?

► “Giờ ra chơi nào giáo viên cũng thảo luận về thi cử"

Trước khi nói về vấn đề sử dụng bài thi trắc nghiệm cho môn Toán, việc đặt bài thi này trong hệ thống các công cụ đo lường phổ biến trong giáo dục có thể giúp bạn đọc có một cái nhìn tổng thể hơn.

Hệ thống đo lường giáo dục

Trong hệ thống giáo dục, các công cụ đo lường giáo dục phổ biến như các bài thi, bài kiểm tra trình độ có thể được chia ra thành hai loại chính (i) các công cụ đo lường cuối quá trình (summative assessment) và (ii) các công cụ đánh giá trong quá trình hoặc trên lớp học (formative assessment).

Mỗi nền giáo dục có chính sách riêng trong việc ưu tiên sử dụng hai loại công cụ này. Các nước Châu Âu có truyền thống sử dụng nhiều các công cụ đo lường trong quá trình như các bài kiểm tra trên lớp, bài thi giữa kỳ, cuối kỳ, cuối năm học. Các nước Châu Á như Trung Quốc, Việt Nam, Nhật Bản, Hàn Quốc lại có xu hướng sử dụng kết quả các bài thi đánh giá cuối quá trình trong việc ra các quyết định tốt nghiệp và tuyển sinh đại học hơn.

Thí sinh tham khảo thông tin xét tuyển năm 2016. Ảnh: Lê Văn

Tuy nhiên, xu hướng chung hiện nay là sử dụng phối hợp hai loại hình đo lường này bởi vì mỗi loại hình có ưu điểm và nhược điểm riêng. Trong hơn một thập kỷ vừa qua, Hoa Kỳ có vẻ như chú trọng nhiều đến các đo lường cuối quá trình. Nhưng những chính sách cải cách gần đây của nước này cho thấy các đánh giá trong quá trình đang được chú trọng, đầu tư phát triển và sử dụng nhiều hơn.

Về mặt hình thức, các công cụ đo lường cuối quá trình thường là các bài thi chuẩn hóa (standardized). Các câu hỏi thi ở của bài thi này thường là câu hỏi trắc nghiệm đa lựa chọn có một hoặc vài phương án trả lời đúng, hoặc các câu hỏi điền tô (grid-in), hoặc các câu hỏi yêu cầu các câu trả lời ngắn (short answers).

Lý do của lựa chọn này nằm ở những ưu điểm của các bài thi trắc nghiệm như khả năng bao phủ rộng của đề thi, tính khách quan của quá trình chấm thi và khả năng áp dụng các mô hình và công cụ tâm trắc học để tính điểm thang đo (scaling), tổ chức thi trên máy tính (computer adaptive testing), phát hiện các câu hỏi có khả năng tiềm ẩn bất công cho một nhóm sinh viên (differential item functioning) và so bằng điểm giữa các bài thi, đợt thi (equating).

Trong khi đó, dạng thức các bài thi đánh giá trong quá trình thường đa dạng hơn, có thể chứa nhiều loại câu hỏi hơn và cũng có thể tích hợp nhiều loại câu hỏi trong một đề thi hơn.

Đề thi đánh giá trong quá trình sát với việc học và nhu cầu đánh giá của các thầy cô giáo, các trường, nhóm trường hơn. Các câu hỏi thi của các bài thi này có thể là các câu hỏi tự luận, các câu hỏi trắc nghiệm đa lựa chọn. Các bài thi này cũng có thể yêu cầu học sinh làm các thí nghiệm, đo đạc một số đại lượng, mô tả một số hiện tượng (performance assessment).

Tuy nhiên, việc tổ chức và sử dụng các hình thức thi này trên diện rộng cho hàng triệu thí sinh trong một khoảng thời gian ngắn là một việc làm phức tạp, tốn kém thời gian và công sức. Việc áp dụng các mô hình tâm trắc học để đánh giá các bài thi đo lường trong quá trình này cũng tốn kém và phức tạp hơn rất nhiều các bài thi chuẩn hóa sử dụng các câu hỏi trắc nghiệm.

Tóm lại, mỗi loại hình đo lường có ưu điểm và nhược điểm riêng. Việc phối hợp sử dụng hiệu quả các loại hình này trong toàn bộ hệ thống giáo dục là một việc làm cần thiết để đảm bảo hiệu quả giáo dục cũng như tạo điều kiện tốt cho công tác thống kê và các nghiên cứu định lượng về giáo dục.

Về các bài thi trắc nghiệm môn Toán

Việc sử dụng các câu hỏi tự luận cho các đề thi tốt nghiệp và tuyển sinh đại học môn Toán và Văn học có lẽ là một truyền thống trong nhiều năm của nền giáo dục Việt Nam. Trong khi nhiều môn khác đã sử dụng các bài thi trắc nghiệm trong khoảng hơn một thập kỷ, thì các bài thi trắc nghiệm cho lĩnh vực Toán hoặc đo lường tư duy định lượng mới hơn và ít phổ biến hơn. Gần đây nhất, ĐHQG Hà Nội có lẽ là một trong những nơi đầu tiên ở Việt Nam sử dụng dạng thức câu hỏi này cho các câu hỏi liên quan đến môn Toán.

Việc một số nhà Toán học hoặc các thầy cô giáo giảng dạy môn Toán ở phổ thông hoặc đại học quan ngại về vấn đề này cũng là một điều dễ hiểu.

Lý do đầu tiên là nằm ở chỗ Việt Nam đã quá quen sử dụng các bài thi tự luận môn Toán trong một thời gian rất dài.

Ngoài lý do lịch sử trên thì việc những người có chuyên môn về Toán cho rằng dạng thức thi như vậy sẽ làm học sinh học vẹt, bấm máy tính để ra kết quả và không cần hiểu bản chất vẫn có thể làm tốt bài thi được. Hệ quả của việc này là có thể làm hỏng tư duy toán học của học sinh.

Đây thực ra chỉ là những quan sát dựa trên kinh nghiệm cá nhân và cần thêm chứng cứ khoa học trên mẫu đại diện để có thể đưa ra khẳng định có căn cứ.

Trên thực tế, với các bài thi trắc nghiệm phần Toán phổ biến như bài thi SAT, ACT cho thấy, trên những mẫu đủ lớn, các điểm phần Toán của các bài thi này dự đoán khá tốt khả năng hoàn thành và đạt kết quả tốt ở các khóa học cấp độ đại học ở Hoa Kỳ. Khi được sử dụng cùng với điểm trung bình chung trong học tập, khả năng dự đoán của điểm của các bài thi này được cải thiện một cách đáng kể.

Nếu đặt các bài thi đánh giá cuối quá trình bằng các câu hỏi trắc nghiệm trong hệ thống đo lường giáo dục, chúng ta có thể thấy ngoài các công cụ này, các bài kiểm tra trên lớp, các bài thi giữa kỳ, cuối kỳ có thể đóng vai trò định hướng để học sinh học tập toàn diện, rèn luyện tư duy, rèn rũa khả năng trình bày, năng lực giải quyết vấn đề và tư duy sáng tạo trong một lĩnh vực hoặc môn học cụ thể.

Trong khi đó, các bài thi cuối giai đoạn như thi tốt nghiệp hoặc tuyển sinh đại học, cao đẳng có thể hướng tới đo lường các năng lực chung, kiến thức phổ rộng hơn như khả năng đọc hiểu, khả năng giải quyết vấn đề, tính toán trong khoảng thời gian hạn chế. Ngoài ra, việc xây dựng và phát triển các câu hỏi thi trắc nghiệm dạng thức mới như các câu thí sinh tự điền câu trả lời, hoặc viết các câu trả lời ngắn, hoặc điền từ vào ô trống, kết nối các cụm từ để tạo thành một câu trả lời hoàn chỉnh cũng có thể giúp cải thiện khả năng đo lường của các bài thi trắc nghiệm.

Nếu xây dựng tốt cả hai thành tố của hệ thống đo lường trong giáo dục này, chất lượng và hiệu quả của công tác đo lường, thống kê trong giáo dục sẽ được cải thiện đáng kể.Các yếu tố quyết định tới chất lượng và hiệu quả của các bài thi đo lường trong quá trình hay cuối quá trình có thể kể đến là (i) chất lượng của thiết kế các bài thi, (ii) chất lượng từng câu hỏi thi , (iii) quá trình tổ chức thi, chấm điểm; (iv) chất lượng và độ tin cậy của các phương pháp tính, rà soát và cân bằng điểm.

Một số kết luận và khuyến nghị

Xuất phát từ những luận điểm trên đây về hệ thống đo lường trong giáo dục cũng như một số kinh nghiệm quốc tế, người viết bài này có một số kiến nghị chính sách như sau để các cơ quan hữu trách và cộng đồng xem xét và áp dụng hoặc kiến nghị áp dụng.

Thứ nhất, các cơ quan hoạch định chính sách, quản lý nhà nước về giáo dục, các cơ sở giáo dục cần tiếp tục hoàn thiện các chính sách liên quan đến việc xây dựng và vận hành thành công các chính sách giáo dục có liên điều chỉnh các hoạt động đo lường trong giáo dục. Cần có chính sách đồng bộ để các phương thức đo lường trong quá trình cũng như cuối quá trình được sử dụng hợp lý, hiệu quả trong toàn bộ hệ thống giáo dục.

Việc tạo điều kiện về nguồn lực để các thầy cô giáo và người học hiểu và sử dụng hiệu quả các bài kiểm tra thường xuyên, bài thi trong quá trình sử dụng hình thức tự luận hoặc quan trắc thực chứng (performance assessment) là một việc làm quan trọng để các kết quả đo lường này trở thành thông tin hữu ích cho quá trình học tập của học sinh và giảng dạy của người học.

Điểm các bài thi này sẽ được sử dụng để tính điểm trung bình chung học tập. Do có các ưu thế vì chi phí, tính chuẩn hóa và khách quan, các bài thi trắc nghiệm sử dụng một số dạng thức câu hỏi khác nhau cũng cần được khuyến khích sử dụng cho các bài thi đánh giá cuối quá trình. Công tác truyền thông và chia sẻ thông tin để toàn bộ hệ thống giáo dục hiểu và cùng chung sức từng bước xây dựng các thành tố của hệ thống đo lường giáo dục là bước đi ban đầu quyết định sự thành công của các bước triển khai tiếp theo.

Thứ hai, các đơn vị được giao trọng trách thiết kế các bài thi đo lường cuối giai đoạn và xây dựng các câu hỏi thi cần đảm bảo chất lượng của các bài thi này. Do đảm bảo chất lượng là một quá trình liên tục, việc xây dựng các cơ chế để theo dõi và cải tiến toàn bộ quy trình thiết kế, xây dựng, chuẩn hóa, tổ chức thi, phân tích dữ liệu thi, tính điểm thi, so bằng điểm thi là việc làm cần thiết. Các đơn vị này cũng cần được tạo điều kiện để hợp tác và học hỏi kinh nghiệm từ các tổ chức khảo thí quốc tế, các cơ sở đào tạo về đo lường, tâm trắc học giáo dục có uy tín trên thế giới.

Quan trọng nhất, cộng đồng có chuyên môn và quan tâm đến đổi mới đo lường, đánh giá trong giáo dục cần tiếp tục đưa ra các ý kiến đóng góp cho dự thảo mới đây cũng như các phiên bản tiếp theo và các dự thảo khác về lĩnh vực này.

Các đóng góp có thể xuất phát từ kinh nghiệm, quan sát của cá nhân. Các ý kiến cũng có thể xuất phát từ các tài liệu chuyên môn, các nghiên cứu thực chứng về chủ đề này.

Việc có các ý kiến khác nhau thậm chí là mâu thuẫn nhau là điều không thể tránh khỏi nhưng cần thiết để cộng đồng cũng như các nhà quản lý giáo dục có thể thống nhất được những chính sách phù hợp nhất với điều kiện và hoàn cảnh hiện tại của giáo dục nước nhà.

Chính sách như vậy chắc chắn sẽ không thể làm hài lòng tất cả mọi người, nhưng chúng có thể điều chỉnh các hoạt động thi cử, tuyển sinh của chúng ta theo hướng từng bước tích cực hơn, phù hợp hơn với các chuẩn mực quốc tế.