ChatGPT gần như vượt qua kỳ thi cấp phép hành nghề y của Mỹ

Ở bài kiểm tra cấp phép chứng chỉ hành nghề y tại Mỹ, ChatGPT trả lời đúng 52,4-75% số câu hỏi trong 3 phần, trong khi ngưỡng vượt qua bài thi là 60%.

44
0

Để đánh giá khả năng của ChatGPT, các nhà nghiên cứu yêu cầu ChatGPT thực hiện bài kiểm tra cấp phép hành nghề y ở Mỹ (USMLE), bao gồm 350/376 câu hỏi trong kỳ thi hồi tháng 6/2022 và không có sẵn câu trả lời hoặc ngữ cảnh liên quan trên Google.

Đề thi chia làm 3 phần, phần đầu tiên của kỳ thi tập trung vào kiến thức khoa học cơ bản và dược lý. Phần thứ 2 tập trung vào lý luận lâm sàng, quản lý y tế và đạo đức sinh học. Phần cuối cùng là kiến thức khi các bác sĩ hoàn thành chương trình đào tạo y và bước vào năm đầu tiên của bác sĩ nội trú.

Kết quả, ChatGPT trả lời đúng 52,4-75% số câu hỏi trong 3 phần của bài kiểm tra mà không cần trải qua khóa đào tạo chuyên môn hoặc sự hỗ trợ từ con người. Trong khi đó, để vượt qua bài kiểm tra này, ứng viên cần trả lời đúng khoảng 60%.

Ngoài ra, ChatGPT cũng tạo ra một số thông tin, chi tiết quan trọng – mới và không rõ ràng nhưng có giá trị lâm sàng.

Các tác giả tin rằng những phát hiện của họ cho thấy ChatGPT có thể trở thành một công cụ có giá trị trong giáo dục y tế. Đây được coi là dấu mốc đáng chú ý trong quá trình “trưởng thành” của AI lâm sàng.

Cụ thể, ChatGPT sở hữu khả năng dạy y học bằng cách đưa ra những khái niệm mới lạ và không rõ ràng, không nằm trong phạm vi nhận thức của người học. AI sẽ được định vị sớm và trở nên phổ biến trong thực hành lâm sàng với nhiều ứng dụng trên tất cả lĩnh vực chăm sóc sức khỏe.

Nhóm AnsibleHealth rất tin tưởng vào ChatGPT, thậm chí bác sĩ lâm sàng tại công ty bắt đầu thử nghiệm, sử dụng nó như một phần trong quy trình làm việc, yêu cầu nó viết lại các báo cáo có nhiều từ ngữ chuyên môn. Ngay cả nhóm nghiên cứu cũng sử dụng ChatGPT để viết ra những phát hiện của họ.

“ChatGPT đóng góp đáng kể vào việc viết bản thảo. Chúng tôi tương tác với ChatGPT giống như đồng nghiệp, yêu cầu ChatGPT tổng hợp, đơn giản hóa và đưa ra các điểm đối lập cho các bản nháp đang thực hiện… Tất cả đồng tác giả đều đánh giá cao ý kiến ​​đóng góp của ChatGPT”, TS Tiffany Kung, một trong những tác giả của nghiên cứu, cho biết.

Tuy nhiên, một số chuyên gia nhấn mạnh những hạn chế khi sử dụng kết quả mà AI đưa.

GS Nello Cristianini, chuyên gia về Trí tuệ nhân tạo tại Đại học Bath (Anh), cho biết sự thông minh của ChatGPT không thể khẳng định chúng có mọi kiến thức mà con người sở hữu.

Ngay cả OpenAI cũng thừa nhận xu hướng phản hồi bằng các câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa. Công ty vẫn đang tìm cách khắc phục vấn đề này.

Trong khi đó, TS Stuart Armstrong, trưởng nhóm nghiên cứu tại Aligned AI, tin rằng “ChatGPT có màn trình diễn ấn tượng, con người nên kỳ vọng sẽ thấy nhiều thành công hơn nữa về AI trong tương lai”.

Có nhiều lĩnh vực con người sẽ làm tốt hơn AI. Tuy nhiên, ưu thế này sẽ không tồn tại mãi mãi. Một ngày nào đó, AI sẽ giỏi hơn chúng ta ở hầu hết nhiệm vụ“, TS Armstrong nói.

Ông Andrew Karolyi, Hiệu trưởng trường Kinh doanh SC Johnson của Đại học Cornell, đồng tình với nhận định trên.

ChatGPT sẽ không biến mất. Dù có bất kì điều gì xảy ra, những công nghệ AI như vậy sẽ ngày càng lợi hại. Các nhà quản lý ở các trường đại học cần đầu tư vào nó để phát triển giáo dục“, ông Karolyi trả lời tờ Financial Times.

Joyce Nguyễn
WRITTEN BY

Joyce Nguyễn

'the difference between stupidity and genius is that genius has its limits'

Leave a Reply