Phương pháp nghiên cứu khoa học cơ bản dành cho bác sĩ lâm sàng (Phần 2)
Bạn đang xem 20 trang mẫu của tài liệu "Phương pháp nghiên cứu khoa học cơ bản dành cho bác sĩ lâm sàng (Phần 2)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
phuong_phap_nghien_cuu_khoa_hoc_co_ban_danh_cho_bac_si_lam_s.pdf
Nội dung text: Phương pháp nghiên cứu khoa học cơ bản dành cho bác sĩ lâm sàng (Phần 2)
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 57 CHƯƠNG 6 Nghiên cứu cắt ngang Yuriko Suzuki, Nguyễn Thị Bội Ngọc 1. Khái niệm cơ bản và mục tiêu nghiên cứu Nghiên cứu cắt ngang đánh giá tỷ lệ hiện mắc của bệnh hay vấn đề (kết cục - outcomes) của bệnh trong một quần thể xác định, và mối liên hệ giữa các biến số và kết cục tại một thời điểm. 1) Biết được tỷ lệ hiện mắc của kết cục Mục tiêu của một nghiên cứu cắt ngang là tính tỷ lệ hiện mắc của một kết cục trong một dân số xác định. Nghiên cứu bao gồm tỷ lệ tại một thời điểm và tỷ lệ trong một thời gian. Trong nghiên cứu cắt ngang, tỷ lệ hiện mắc của một kết cục được mô tả, và có thể được phân tầng sâu hơn theo nhiều yếu tố, như con người (giới, tuổi, công việc, lối sống, v.v.), vị trí địa lý (vùng miền, quốc gia, v.v.), thời gian (mùa, năm, v.v.). Khi biết được tỷ lệ hiện mắc, chúng ta có thể đánh giá được gánh nặng của một kết cục hay một bệnh và so sánh với nhóm dân số khác. Thông tin về tỷ lệ hiện mắc của một bệnh đặc biệt có ích cho một bệnh mạn tính với thời gian mắc bệnh kéo dài. Bằng cách đánh giá tỷ lệ hiện mắc trong năm với một loạt các nghiên cứu cắt ngang, chúng ta có thể
- 58 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C đánh giá xu hướng của một vấn đề sức khỏe. Đây chỉ là những thông tin rất đơn giản, nhưng lại là một bước đầu rất quan trọng trong việc phát triển một chiến lược bảo vệ sức khỏe cộng đồng. 2) Hình thành một giả thuyết về kết cục và yếu tố tiếp xúc và đặt nền tảng cho các nghiên cứu sâu hơn Một mục tiêu khác của nghiên cứu cắt ngang là xác định mối liên hệ giữa kết cục và yếu tố phơi nhiễm (yếu tố tiếp xúc) có thể gây ảnh hưởng đến kết cục. Theo truyền thống trước kia, ốm i liên hệ giữa kết cục và yếu tố tiếp xúc được đánh giá đơn giản; tuy nhiên ngày nay, mối liên hệ hữu ích trong việc hình thành các chính sách về sức khỏe sẽ được đánh giá. Ví dụ như: Mối liên hệ giữa một kết cục và các yếu tố nguy cơ (ví dụ, trầm cảm sau sinh và các yếu tố liên quan đến thai kỳ) Mối liên hệ giữa một vấn đề sức khỏe và sử dụng dịch vụ, và so sánh với quốc tế Mối liên hệ giữa sử dụng dịch vụ và kiến thức, thái độ và niềm tin về các vấn đề sức khỏe 2. Thiết kế Để xây dựng đề cương cho một nghiên cứu cắt ngang, cần xem xét một cách cẩn thận về việc lấy mẫu dân số nghiên cứu và xác định rõ ràng kết cục. Lấy mẫu nghiên cứu đòi ỏh i việc xem xét mẫu số, trong khi đó xác định một kết cục đòi hỏi việc xem xét đến tử số của tỷ lệ lưu hành. Lấy
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 59 mẫu không thích hợp có thể gây ra sai lệch lấy mẫu (sam- pling bias), và một định nghĩa không cụ thể về kết cục có thể gây ra sai lệch đo lường. 1) Lấy mẫu Thực hiện nghiên cứu trên toàn bộ quần thể mục tiêu trong một thời gian và nguồn nhân lực hạn định là điều không khả thi. Trong thực hành, một quần thể nghiên cứu được rút ra từ quần thể mục tiêu, và các đối tượng tham gia nghiên cứu là một phần của quần thể nghiên cứu do có những đối tượng không thể tiếp cận được, hay từ chối tham gia nghiên cứu, hay vì lý do khác. Liệu kết quả thống kê rút ra từ các đối tượng tham gia nghiên cứu có thể suy luận cho quần thể mục tiêu (giá trị nội tại - internal validity) phụ thuộc vào việc lấy mẫu phù hợp. Kết quả nghiên cứu có thể khái quát hóa cho một quần thể rộng lớn hơn ngoài quần thể mục tiêu được định nghĩa là giá trị ngoại suy (external validity). Những khía cạnh khác, như nơi tuyển bệnh (cộng đồng hay bệnh viện), và thời gian nghiên cứu là những yếu tố cực kỳ quan trọng trong việc đánh giá khả năng khái quát hóa của nghiên cứu. Lấy mẫu ngẫu nhiên nhằm đảm bảo từng người trong quần thể mục tiêu có cùng cơ hội được chọn vào nghiên cứu, và thường được dùng để tối thiểu hóa sự khác nhau giữa nhóm chọn mẫu và không chọn vào mẫu. Trong thực tế, bạn chỉ có thể tiếp cận được một nhóm người, như cách lấy mẫu thuận tiện được trình bày ở chương 1. Trong trường hợp này, bạn nên chú ý đến đặc điểm của địa điểm nghiên cứu (phòng khám sức khỏe gia đình, bệnh viện tuyến cuối,
- 60 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C đơn vị săn sóc đặc biệt, v.v.) và thận trọng trong việc khái quát hóa kết quả từ mẫu lấy theo cách thuận tiện. Cố gắng giảm thiểu tỷ lệ không trả lời là cần thiết vì những người đạt tiêu chí nhận vào và không tham gia có thể khác những người tham gia ở một số đặc điểm quan trọng. Bạn cần nỗ lực để giảm tỷ lệ từ chối tham gia ở các đối tượng tham gia nghiên cứu. Khi báo cáo kết quả nghiên cứu, tốt nhất nên trình bày số liệu so sánh nhóm tham gia và nhóm từ chối (nếu có thể), như vậy người đọc có thể đánh giá sai lệch (bias) có thể gặp. 2) Định nghĩa biến số Khi viết đề cương nghiên cứu, bạn nên định nghĩa và xác định rõ ba nhóm đề mục khảo sát (biến số); kết cục, phơi nhiễm, và yếu tố nhiễu. Các biến số này cần được định nghĩa rõ ràng trước khi thu thập số liệu. Đầu tiên, định nghĩa kết cục (outcome) là một nhiệm vụ khó khăn. Ví dụ, với kết cục là rối loạn tâm thần, có các tiêu chuẩn vàng là các hướng dẫn chẩn đoán như Phân Loại Bệnh Tật Quốc Tế (ICD), và Cẩm Nang Chẩn Đoán và Thống Kê Các Rối loạn Tâm Thần (DSM, Hiệp Hội Bệnh Tâm Thần Mỹ), tuy vậy vẫn rất khó để mô tả bệnh và các rối loạn, vì không có phân ịđ nh rõ ràng giữa bình thường và bất thường, và thường có trạng thái trung gian giữa hai thái cực. Tuy nhiên, trong nghiên cứu, người ta thường đòi hỏi phải phân định rõ ràng giữa ‘bình thường’ và ‘bất thường’. Vì thế các nhà nghiên cứu cần phải định nghĩa một cách rõ ràng các kết cục mà mình quan tâm. Phơi nhiễm (Exposure) là yếu tố có thể có ảnh hưởng đến kết cục. Dựa vào các quan sát trên lâm sàng và tổng quan y
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 61 văn về chủ đề quan tâm, các nhà nghiên cứu cần chọn ra các biến số có thể có mối liên hệ với kết cục để đánh giá. Vài ví dụ về biến phơi nhiễm gồm đặc điểm nhân khẩu (giới tính, tuổi, nghề nghiệp, v.v.), vị trí địa lý (vùng miền, quốc gia, v.v.), thời gian (mùa, năm, v.v.), lối sống và yếu tố di truyền. Yếu tố gây nhiễu là thành tố thứ ba có liên quan độc lập với cả kết cục và yếu tố phơi nhiễm. Ví dụ như ung thư cổ tử cung và hoạt động tình dục, hai yếu tố này dường như có mối liên hệ với nhau. Tuy nhiên, đằng sau hai yếu tố nêu trên có một yếu tố thứ ba, virus papilloma có mối liên hệ độc lập với cả ung thư cổ tử cung và hoạt động tình dục. Nếu không kiểm soát yếu tố nêu trên, ta có thể kết luận sai rằng có một mối liên hệ trực tiếp giữa ung thu cổ tử cung và hoạt động tình dục. Trong nhiều nghiên cứu dịch tễ, tuổi, giới, tình trạng kinh tế xã hội, và thói quen hút thuốc lá được xem là yếu tố gây nhiễu trong quá trình thiết kế nghiên cứu. 3. Thu thập dữ liệu Phương pháp thu thập dữ liệu bao gồm nghiên cứu dùng bộ câu hỏi tự điền trả lời qua thư, phỏng vấn trực tiếp, hồi cứu hồ sơ bệnh án, hay sổ bộ đăng ký, v.v. Nguồn dữ liệu hay cách đo lường dữ liệu sẽ được chọn tùy vào loại biến số như đã trình bày ở trên. Ví dụ, nếu kết cục chính của nghiên cứu là tỷ lệ hiện mắc của một bệnh, hồi cứu sổ bộ đăng ký hay tổng kết biểu đồ bệnh lý trong đó chẩn đoán bệnh được xác định bởi các chuyên gia sẽ hợp lý hơn bệnh nhân trả lời bộ câu hỏi tự điền. Nếu kết cục chính là một vấn đề mang tính nhạy cảm hay chủ quan, như chức năng cương dương
- 62 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C vật ở nam giới, phỏng vấn trực tiếp sẽ đóng góp cụ thể hơn hơn là trả lời bảng câu hỏi tự điền. Về khía cạnh đo lường, điều quan trọng là cần phải xác định và trình bày được các thông tin về độ tin cậy và tính giá trị của phương pháp đo lường được chọn. Độ tin cậy (Relia- bility) hay khả năng lặp lại là mức độ cho ra những kết quả giống nhau khi lặp lại ớv i cùng một phương pháp đo lường. Các quy trình đo lường khác nhau hay việc thực hiện các quy trình đó có thể làm độ tin cậy thấp. Tính giá trị (Validity) là mức chính xác mà một phương pháp đo lường có thể đánh giá đúng chủ thể. Tính giá trị bao gồm giá trị cấu trúc (construct validity), giá trị nội dung (content validity), và giá trị theo tiêu chí (criterion validity). Ví dụ về giá trị nội dung, trong trường hợp đo lường đánh giá chất lượng cuộc sống bằng công cụ đo lường xây dựng từ nguồn văn hóa và ngôn ngữ khác, cần phải sử dụng thang lượng giá đã được thẩm định trong văn hóa và ngôn ngữ nơi nghiên cứu được tiến hành. Đặc biệt trong trường hợp sử dụng thang lượng giá có nguồn gốc từ các nước phương Tây, việc dịch xuôi và dịch ngược bảng câu hỏi gốc, và việc đánh giá độ tin cậy và tính giá trị cần được hoàn chỉnh trước khi đưa vào sử dụng trong nghiên cứu. Thông thường vấn đề bản quyền và tiền tác quyền sẽ nảy sinh, và cần được nhấn mạnh trong khi chuẩn bị đề cương nghiên cứu. 4. Trình bày kết quả Danh sách các chỉ tố có thể tính toán từ một nghiên cứu cắt ngang sẽ được trình bày bên dưới.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 63 1) Tỷ lệ lưu hành (prevalence) Tỷ lệ điểm (Point prevalence) = số ca bệnh hay có vấn đề về sức khỏe (kết cục - outcome) trong một quần thể đã xác địnhạ t i một thời điểm / số người trong quần thể đã xác địnhở cùng thời điểm. Tỷ lệ khoảng (Period prevalence) = số ca bệnh hay có vấn đề về sức khỏe (kết cục - outcome) trong một quần thể đã xác định trong một khoảng thời gian / số người trong quần thể đã xác định trong một khoảng thời gian xác định 2) Các chỉ tố kết hợp Trình bày dạng bảng (bảng chéo) kết cục và yếu tố phơi nhiễm giúp đánh giá mối liên hệ của chúng. Có kết cục Không có kết cục Tiếp xúc a b Không tiếp xúc c d ỷ lệ chung của kết cục = a+c / a+b+c+d ỷ lệ của kết cục trong nhóm tiếp xúc = a / a+b ỷ lệ kết cục trong nhóm không tiếp xúc = c / c+d Tỷ số nguy cơ (Risk ratio) (RR) = Tỷ lệ của kết cục trong nhóm tiếp xúc / Tỷ lệ kết cục trong nhóm không tiếp xúc = (a/a+b) / (c/c+d) Odds ratio (OR)=(a/b)/(c/d)=ad / bc Nếu OR bằng 1, yếu tố tiếp xúc không có liên quan đến kết cục. Nếu OR lớn hơn 1, yếu tố tiếp xúc có liên quan dương đến việc xảy ra kết cục, điều đó có nghĩa là có yếu tố tiếp xúc sẽ tăng nguy cơ có kết cục. Nếu OR nhỏ hơn 1, yếu
- 64 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C tố tiếp xúc có liên quan âm đến việc xảy ra kết cục, điều đó có nghĩa là có yếu tố tiếp xúc sẽ giảm nguy cơ có kết cục. Khi tỷ lệ lưu hành rất thấp, OR gần bằng RR. Để tính ộđ khác biệt có ý nghĩa thống kê của mối liên hệ, bạn có dùng phép kiểm Chi bình phương hay phép kiểm Fisher chính xác. Các phép kiểm này được trình bày ở Chương10. 5. Độ mạnh và hạn chế Trong nghiên cứu cắt ngang, tần xuất của kết cục được tính tại một thời điểm. Cách làm này tương đối tốn ít chi phí, khả thi và có thể góp phần cho kết quả nhanh với một vấn đề sức khỏe nào đó. Nhìn chung, mức độ bằng chứng của nghiên cứu cắt ngang được xếp hạn thấp, nhưng nghiên cứu cắt ngang là nền tảng cho các loại nghiên cứu khác như nghiên cứu cohort (nghiên cứu đoàn hệ) và nghiên cứu can thiệp. Do nghiên cứu cắt ngang đưa ra thông tin về gánh nặng bệnh tật của quần thể, đây có thể là sự mô tả của một tình trạng ban ầđ u của các nghiên cứu sâu hơn tiếp theo. Hạn chế lớn nhất của nghiên cứu cắt ngang là mối liên hệ nhân quả không thể xác định được do bản chất một lần. Vì thế, luôn xem xét khả năng của nguyên nhân ngược lại (yếu tố lầm tưởng là hậu quả lại chính là nguyên nhân). Bạn cũng cần phải thận trọng nếu thiết kế nghiên cứu chỉ lấy các trường hợp bệnh sẵn có, và không phải trường hợp mới chẩn đoán. Một tỷ lệ hiện mắc cao có thể gán cho tần suất bệnh cao, nhưng cũng có khả năng bệnh kèo dài do bản chất chính của bệnh hay việc điều trị không hiệu quả.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 65 6. Ví dụ Một ví dụ về nghiên cứu cắt ngang xác định tỷ lệ hiện mắc của một bệnh và mối liên hệ giữa các biến số được trình bày dưới đây. Một nghiên cứu được thực hiện để xác định tỷ lệ trầm cảm ở các bà mẹ ở Việt Nam, và đánh giá các yếu tố nguy cơ ở khía cạnh hỗ trợ xã hội và thái độ chăm sóc con của mẹ.2 Trong nghiên này, đối tượng tham gia nghiên cứu là 299 bà mẹ đến khám định kỳ trong vòng 1 đến 3 tháng sau sanh tại một bệnh viện tuyến cuối ở Việt Nam, và họ được lần lượt mời tham gia vào nghiên cứu. Kết cục chính là tình trạng trầm cảm được đánh giá bằng dụng cụ tìm ca với hai câu hỏi dành cho trầm cảm.3 Bảng câu hỏi được điền bởi một nghiên cứu viên là bác sĩ nhi được đào tạo để nghiên cứu trong khoảng từ tháng 10 đến tháng 12 năm 2007. Kết quả cho thấy, tỷ lệ các bà mẹ có trầm cảm là 23.1% (69 trong số 294 các bà mẹ). Yếu tố nguy cơ cho trầm cảm là mâu thuẫn trong gia đình và giữa cha mẹ và mới chuyển chỗ ở trong thời gian gần đây. Ở khía cạnh nuôi con, các yếu tố sau tăng nguy cơ trầm cảm ở mẹ - thiếu tự tin (OR hiệu chỉnh = 2,74; khoảng tin cậy 95%: 1,40 – 5,38), và cảm giác không thoải mái (OR hiệu chỉnh = 2,85, khoảng tin cậy 95%: 2 Suzuki Y, Goto A, Nguyen QV, Nguyen TTV, Pham NM, Chung TMT, Trinh HP, Pham VT, Yasumura S. Postnatal depression and associated parenting indicators among Viet- namese women. Asia-Pacific Psychiatry. 2011; 3: 219–227. 3 Whooley MA, Avins AL, Miranda J, Browner WS. Case- finding instruments for depression. Two questions are as good as many. Journal of General Internal Medicine. 1997; 12: 439-45.
- 66 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C 1,21 – 6,71) sau khi điều chỉnh vơi sức khỏe chủ quan. Từ những kết quả trên, bà mẹ ở mức tự tin thấp và các bà mẹ thiếu thoải mái khi nuôi con tăng nguy cơ trầm cảm. Vì thế chúng tôi ếđ n kết luận rằng các yếu tố hỗ trợ xã hội có thể có vai trò trong trầm cảm. Áp dụng trong thực hành, sẽ rất hữu ích khi có một công cụ tầm soát nhanh trầm cảm để xác định những người cần hỗ trợ thêm trong lúc nuôi con tại Việt Nam.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 67 C H Ư Ơ N G 7 Nghiên cứu cohort Nguyễn Quang Vinh, Nguyễn Thị Từ Vân 1. Khái niệm căn bản và mục đích Cohort là một nhóm các đối tượng có cùng một tình trạng chung nào đó. Nghiên cứu cohort (còn gọi là nghiên cứu đoàn hệ, nghiên cứu thuần tập) là nghiên cứu theo dõi một hay nhiều nhóm mà lúc khởi đầu không có kết cục được nghiên cứu, để đánh giá tỷ lệ phát sinh của kết cục chính theo thời gian. Thời gian theo dõi cần thiết cho nghiên cứu nên dài hơn thời gian tiềm ẩn của kết cục chính trong nghiên cứu. Trong nghiên cứu cohort, các nhóm theo dõi có thể là 2 nhóm (nhóm có hoặc không có tiếp xúc yếu tố nguy cơ) hoặc > 2 nhóm (các nhóm có mức độ tiếp xúc khác nhau). Mục đích của nghiên cứu cohort là đo lường (luôn luôn), và so sánh (thông thường) tỷ lệ phát sinh của kết cục trong một hay nhiều nhóm cohort. 2. Cách thiết kế 1) Cohort tiến cứu (prospective) hoặc cohort hồi cứu (retrospective)
- 68 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C Một nghiên cứu cohort được phân loại thành cohort tiến cứu hoặc cohort hồi cứu tùy thuộc vào mối liên hệ thời gian giữa thời điểm bắt đầu nghiên cứu và thời điểm xuất hiện các kết cục chính của nghiên cứu. Hồi cứu: kết cục được quan tâm xuất hiện trước thời điểm tiến hành nghiên cứu Tiến cứu: kết cục được quan tâm xuất hiện sau thời điểm tiến hành nghiên cứu Việc chọn mô hình hồi cứu hay tiến cứu là một cân nhắc giữa giá trị khoa học và khả năng thực hiện được nghiên cứu. Đối với cohort tiến cứu, có thể giảm thiểu sai lệch hệ thống (bias). Tuy nhiên mô hình này tốn nhiều thời gian và tiền bạc. Đối với cohort hồi cứu, có thể thực hiện nhanh chóng hơn với kinh phí ít hơn, nhưng phụ thuộc vào hồ sơ bệnh án có đầy đủ và sẵn có hay không. Ví dụ 1. Một nghiên cứu cohort tiến cứu phân tích: đánh giá xu hướng mang thai (yếu tố tiếp xúc), theo dõi thời gian hậu sản, và hỏi về sự tự tin khi nuôi con (kết cục). Ví du 2. Một nghiên cứu cohort hồi cứu phân tích: đánh giá hạng tốt nghiệp của sinh viên y khoa (kết cục) và xem lại điểm lúc thi đầu vào đại học (yếu tố tiếp xúc). 2) Cách chọn một cohort Trong nghiên cứu cohort, bạn có thể chọn chuyên biệt 2 nhóm cohort có tiếp xúc và cohort không tiếp xúc yếu tố nguy cơ khi chọn mẫu, hoặc có thể chọn một nhóm cohort rồi chia ra thành nhóm có tiếp xúc và nhóm không có tiếp xúc trong khi xử lý dữ liệu. Đối với các biến số phổ biến như hút thuốc lá, uống bia rượu, có thể chọn dễ dàng một cohort từ quần thể cộng đồng. Riêng đối với các biến số hiếm gặp như tình
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 69 trạng phơi nhiễm nghề nghiệp, thảm họa, tiếp xúc dioxin và nhiễm phóng xạ, việc chọn mẫu nên hướng vào một cohort có chọn lựa. Trong trường hợp này, bạn nên thận trọng đối với các đặc trưng của cohort được chọn ra. Đối với tình trạng phơi nhiễm nghề nghiệp, dân lao động thường khỏe mạnh hơn người bình thường (sai lệch do người lao động khỏe mạnh hơn). 3) Các biến số Nhóm tiếp xúc và nhóm không tiếp xúc nên tương đồng ngoại trừ tình trạng tiếp xúc với yếu tố nguy cơ đang được nghiên cứu, tuy nhiên không phải lúc nào cũng được như vậy. Do vậy, các thông tin về các biến số gây nhiễu (v.d. tình trạng kinh tế xã hội, đặc điểm bản thân, nơi cư trú) và các yếu tố nguy cơ đồng thời (v.d. thói quen rượu bia, hút thuốc lá, tình trạng dinh dưỡng) phải được thu thập và đưa vào xử lý. 4) Theo dõi nghiên cứu Đảm bảo tỷ lệ theo dõi được đến khi hoàn tất nghiên cứu ở mức cao rất quan trọng trong nghiên cứu cohort. Thời gian làm nghiên cứu càng dài, càng khó đạt được tỷ lệ này. Mất dấu là một vấn đề lớn có thể dẫn đến thiên lệch cho nghiên cứu. Những người tuân thủ hơn thường là những người khỏe mạnh hơn, những người có kết cục “không tốt” thường ngừng tham gia nghiên cứu, mà không được ghi nhận.
- 70 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C 3. Thu thập dữ liệu Như đã nhấn mạnh trong chương trước, chúng ta có thể cân nhắc rất nhiều nguồn dữ liệu, tùy thuộc mục tiêu nghiên cứu – phỏng vấn, bộ câu hỏi, khám lâm sàng, các xét nghiệm, chỉ số về môi trường sống, các biểu đồ y khoa theo dõi hoặc các cơ sở dữ liệu/hồ sơ y khoa khác. Bạn nên xây dựng cách thức thu thập dữ liệu cho cohort tiến cứu, còn các dữ liệu sẵn có được dùng cho cohort hồi cứu. 4. Trình bày kết quả nghiên cứu 1) Tính toán nguy cơ Việc tính toán dựa vào bảng 2x2 . Ghi chú: E+= Nhóm có tiếp xúc; E- = Nhóm không tiếp xúc Có kết cục Không có kết cục Tiếp xúc a b Không tiếp xúc c d Tỷ lệ phát sinh trong nhóm có tiếp xúc E+ : (IE+) = a/(a+b). IE+ là nguy cơ phát sinh kết cục trong nhóm E+. Tỷ lệ phát sinh trong nhóm không tiếp xúc E-: (IE-) = c/(c+d). IE- là nguy cơ phát sinh kết cục trong nhóm E-. Tỷ lệ phát sinh chung (I) = (a+c)/(a+b+c+d). I là nguy cơ phát sinh kết cục trong quần thể nghiên cứu. Nguy cơ tương đối - Relative Risk (RR) = Risk Ratio (RR) = IE+/IE- = [a/(a+b)]/[c/(c+d)].
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 71 RR là khác biệt tương đối về tỷ lệ phát sinh giữa nhóm E+ và nhóm E-. Nguy cơ tuyệt đối - Excess Risk (ER) = IE+ - IE- = a/(a+b) - c/(c+d). ER là khác biệt tuyệt đối về tỷ lệ phát sinh giữa nhóm E+ và nhóm E-. Nguy cơ quy trách - Attributable Risk (AR) = ER/E+ = [a/(a+b) - c/(c+d)] / [a/(a+b)] = (RR-1)/RR Nguy cơ trong một quần thể nhất định - Population Risk (PR) = (IE+) x P + (IE-) x (1-P). PR là nguy cơ xuất hiện kết cục trong quần thể nhất định. Nguy cơ quy trách trong quần thể - Population Attributa- ble Risk (PAR) = Nguy cơ tuyệt đối x Tỷ lệ hiện hành tiếp xúc yếu tố nguy cơ trong một quần thể (P) = ([IE+] – [IE-]) x P PAR là nguy cơ khác biệt do tiếp xúc trong quần thể nhất định Phân xuất nguy cơ quy trách quần thể - Population At- tributable Fraction (PAF) = PAR/tỷ lệ phát sinh kết cục trong quần thể. PAF là tỷ lệ kết cục trong quần thể nghiên cứu do tiếp xúc yếu tố nguy cơ. 2) Khái niệm thời gian-người (person-time) Trong một vài nghiên cứu, yếu tố tiếp xúc liên tục và lặp lại theo chu kỳ là một đơn vị thời gian (v.d. năm, tháng, tuần, ngày). Tuy nhiên, các đối tượng được theo dõi với khoảng
- 72 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C thời gian dài ngắn khác nhau. Khái niệm thời gian – người (person-time) là một đo lường thời gian đến nguy cơ (time- at-risk) thực sự của cá nhân đó khi tiếp xúc yếu tố nguy cơ. Tỷ lệ phát sinh mật độ (incidence density rate), số lượng các ca mắc mới chia cho số nguy cơ person-time được theo dõi trong một khoảng thời gian, là một ước đoán sự xuất hiện kết cục nhanh chậm như thế nào. 5. Điểm mạnh và giới hạn Tính từ lúc bắt đầu theo dõi một cohort, tỷ lệ phát sinh của một kết cục có thể được đo lường và mối liên hệ thời gian giữa yếu tố tiếp xúc và kết cục có thể được xác lập rõ ràng. Mô hình cohort thích hợp nhất để khảo sát nhiều kết cục liên quan đến một yếu tố tiếp xúc hay yếu tố tiếp xúc hiếm gặp, chẳng hạn các yếu tố liên hệ với nghề nghiệp hoặc môi trường nguy cơ cao. Có thể dễ dàng chọn và theo dõi một cohort trong một quần thể chuyên biệt so với quần thể chung, nhưng cẩn thận với các ca bệnh hiện tồn tại/ca bệnh còn sống sót (prevalent/survival cases). Giới hạn chính của nghiên cứu cohort là vấn đề thời gian, kinh phí, mất dấu theo dõi, và khó đánh giá các kết cục hiếm xảy ra. Vì vậy, mô hình này không nên sử dụng để khảo sát các kết cục hiếm gặp, trừ phi nguy cơ quy trách (A) và/hoặc nguy cơ quy trách trong quần thể (PAR) cao.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 73 6. Ví dụ minh họa Một ví dụ tiêu biểu của nghiên cứu cohort là nghiên cứu được tiến hành sau thảm họa nhà máy điện hạt nhân tại Fu- kushima, Nhật Bản.4 Nghiên cứu này đưa vào tất cả cư dân sống tại Fukushima sau sự cố hạt nhân. Tất cả thông tin được lưu trữ trong cơ sở dữ liệu và sẽ được sử dụng để giúp đỡ người dân và phân tích những tác động lên sức khỏe tinh thần và thể chất của những người tiếp xúc phóng xạ liều thấp trong thời gian dài. Rõ ràng là mô hình cohort tỏ ra phù hợp trong trường hợp này bởi vì yếu tố tiếp xúc ở đây hiếm xảy ra và có thể quan sát cùng lúc nhiều kết cục. Tuy nhiên, tỷ lệ tham gia thấp (<30%) phần nào tác động lên ước đoán của những ảnh hưởng sức khỏe. 4 Yasumura S, Hosoya M, Yamashita S, Kamiya K, Abe M, Akashi M, Kodama K, Ozasa K; Fukushima Health Manage- ment Survey Group. Study protocol for the Fukushima Health Management Survey. Journal of Epidemiology. 2012; 22: 375-83.
- 74 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C C H Ư Ơ N G 8 Nghiên cứu bệnh – chứng Hirohide Yokokawa, Trần Thế Trung 1. Khái niệm cơ bản và mục đích Trong một nghiên cứu bệnh - chứng, những đối tượng có biến cố kết cục (thường được gọi là “nhóm bệnh”) được so sánh với những người không có biến cố kết cục (gọi là “nhóm chứng”) về tình trạng phơi nhiễm với yếu tố quan tâm. Dạng thiết kế này có thể ước tính mối liên quan giữa yếu tố phơi nhiễm và một kết cục. Nếu nhóm bệnh có tình trạng phơi nhiễm nhiều hơn nhóm chứng, yếu tố phơi nhiễm được xác định là một yếu tố nguy cơ. Ngược lại, nếu nhóm bệnh ít phơi nhiễm hơn so với nhóm chứng, yếu tố phơi nhiễm được xem là một yếu tố bảo vệ. Nghiên cứu bệnh – chứng có thể giúp xác định một yếu tố mới, có liên quan đến một kết cục, và cũng có khả năng làm sáng tỏ thêm một mối liên hệ của một yếu tố đã biết từ trước có liên quan với kết cục trên một quần thể khác.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 75 2. Thiết kế Tiêu chuẩn xác định ca bệnh và ca chứng phải được định nghĩa rõ ràng; sau đó tình trạng phơi nhiễm với yếu tố quan tâm mới được hồi cứu xác định. Các bước chính của tiến trình nghiên cứu được trình bày bên dưới. Hình 8.1. Tiến trình của một nghiên cứu bệnh - chứng Phơi nhiễm CÓ kết cục (bệnh) KHÔNG phơi nhiễm Phơi nhiễm KHÔNG có kết cục (chứng) KHÔNG phơi nhiễm 1. Định nghĩa và chọn các ca bệnh và ca chứng 2. Thu thập thông tin về tình trạng phơi nhiễm với yếu tố quan tâm 3. Thành lập bảng 2 x 2 4. Tính toán mối liên hệ 1) Chọn các ca bệnh Tiêu chí nhận vào và tiêu chí loại trừ nên được trình bày rõ ràng trước khi tuyển chọn. Các câu hỏi đáng quan tâm lúc này gồm: Bạn xác định một ca bệnh như thế nào? Bạn có loại ra những người với đặc điểm/ tình trạng đặc biệt? Trong nghiên cứu đa trung tâm, một đề cương thống nhất xác định
- 76 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C tiêu chí nhận vào và loại trừ là rất cần thiết để giảm thiểu sự khác biệt về phương pháp trong khi tuyển chọn mẫu. 2) Chọn nhóm chứng Các ca chứng nên đại diện cho những đối tượng không có biến cố kết cục (không bệnh) và nên được tuyển chọn, tối ưu nhất, từ cùng quần thể như nhóm bệnh. Tuy nhiên, thường khó thực hiện cách chọn ngẫu nhiên để chọn các ca chứng theo cách lí tưởng. Trong thực hành, có nhiều cách để chọn nhóm chứng. Cách thứ nhất là chọn nhóm chứng cộng đồng (population control). Chúng ta chọn những người chứng đủ tiêu chuẩn dựa trên sổ bộ dân số hoặc sổ đăng ký hộ khẩu, sổ theo dõi chăm sóc sức khỏe ban đầu, quan hệ hàng xóm và hệ thống trường học. Cách thứ hai là chọn nhóm chứng bệnh viện (hospital control), với ưu điểm thuận lợi về tiếp cận các thông tin y khoa. Với các bác sĩ lâm sàng, phương pháp này có tính khả thi cao nhất. Khi cả nhóm chứng và nhóm bệnh được tuyển chọn từ cùng một bệnh viện, điều này làm gia tăng sự tương đồng giữa hai nhóm. Tuy nhiên, những bệnh nhân ở nhóm chứng bệnh viện có thể mắc một số bệnh chuyên biệt và những đặc tính của họ có thể khác so với những người trong cộng đồng. Do vậy, tính khái quát của nghiên cứu sẽ bị hạn chế. Cách thứ ba là chọn nhóm chứng hàng xóm (neighborhood control), với lợi điểm là tương đồng cao về mặt kinh tế - xã hội. Tuy nhiên, sự khó khăn trong việc xác định và tiếp cận được những “ca” chứng hàng xóm là trở ngại lớn đối với các nhà nghiên cứu – bác sĩ lâm sàng làm việc tại bệnh viện. Bảng 8.1. Những dạng nhóm chứng
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 77 Ưu điểm Không thuận lợi Nhóm chứng Đại diện cho dân số Kém khả thi cộng đồng mục tiêu Nhóm chứng Thuận tiện đối với Khác biệt với người bệnh viện bác sĩ lâm sàng và có trong cộng đồng dẫn thể tăng giá trị nội tại đến hạn chế giá trị ứng dụng (giá trị ngoại suy) Nhóm chứng Bắt cặp (tương tự) về Khả năng tiếp cận hàng xóm các đặc tính kinh tế - hạn chế do vấn đề an xã hội ninh 3) Số lượng nhóm chứng Thông thường, số lượng ca bệnh không nhiều và không thể tăng thêm. Trong trường hợp đó, tăng số lượng ca chứng có thể cải thiện sức mạnh thống kê cho nghiên cứu. Tỷ số ca bệnh: chứng có thể tăng đến tỷ lệ 1:4 là một cách có tính hiệu quả - kinh tế để tăng sức mạnh nghiên cứu. 4) Bắt cặp ca bệnh và ca chứng Một vấn đề quan tâm lớn trong nghiên cứu bệnh – chứng là mức độ khác nhau giữa các ca bệnh và ca chứng. Theo khuyến cáo, việc đánh giá sự phân bố các đặc điểm cơ bản của hai nhóm cần phải thực hiện vào các giai đoạn khởi đầu của nghiên cứu. Khi dự trù có một sự khác biệt rõ ràng về một đặc tính quan trọng nào đó, cách tiếp cận hiệu quả là bắt cặp (matching) các ca bệnh và các ca chứng về đặc tính đó. Trong thực hành, bạn chọn một ca chứng giống với một ca bệnh về một số đặc tính cụ thể. Những đặc tính này thường bao gồm tuổi và giới. Để bắt cặp theo nhóm, bạn chọn nhóm
- 78 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C chứng có cùng một tỷ lệ về đặc tính đó như ở nhóm bệnh. Ví dụ, nếu 30% nhóm bệnh là nam giới, thì nhóm chứng cũng được tuyển chọn theo một cách mà sẽ có 30% nam giới. Trong bắt cặp cá thể, ví dụ theo giới và tuổi, bạn chọn một ca chứng có cùng giới tính và có cùng độ tuổi (khác biệt trong giới hạn hai năm) tương ứng với một ca bệnh được bắt cặp. Bắt cặp cá nhân thường được sử dụng đối với nhóm chứng bệnh viện. 3. Thu thập dữ liệu Sau khi xác định nhóm bệnh và nhóm chứng, các số liệu phải được thu thập theo cùng cách thức như nhau cho cả hai nhóm. Thông tin về việc phơi nhiễm, tiếp xúc với yếu tố quan tâm được thu thập hồi cứu từ nhiều loại hồ sơ, bao gồm hồ sơ y tế, hồ sơ tuyển dụng việc làm, nhật ký nhà thuốc, hồ sơ kiểm tra sức khỏe hoặc dữ liệu khảo sát cộng đồng. Bạn cũng có thể phỏng vấn đối tượng nghiên cứu về các yếu tố tiềm năng liên quan đến hành vi trong quá khứ của họ (như về tiền sử hút thuốc lá, chế độ ăn, sử dụng thuốc hoặc thói quen tình dục). Một ưu điểm của thu thập dữ liệu trong nghiên cứu bệnh – chứng so với nghiên cứu đoàn hệ là ít tốn kém và cần ít thời gian. Ngược lại, những biến số nghiên cứu bị hạn chế (rất khó thêm biến số mới) và sai lệch nhớ lại (recall bias) là những quan ngại lớn của dạng thiết kế này. Chi tiết của sai lệch nhớ lại (recall bias) được trình bày trong Chương 3.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 79 4. Trình bày kết quả Trong nghiên cứu bệnh – chứng, nguy cơ tương đối (RR – relative ratio) không thể tính trực tiếp được bởi vì tần xuất mắc mới (incidence) của biến cố chính không thể tính được. Thay vào đó, chúng ta có thể tính tần suất phơi nhiễm (với yếu tố quan tâm) ở nhóm bệnh và nhóm chứng, sau đó tính tỷ số chênh (Odds ratio - OR) như là chỉ số đo mối liên hệ giữa yếu tố phơi nhiễm và kết cục. Số chênh (odds) được định nghĩa là tỷ số giữa số trường hợp có biến cố với số trường hợp không có biến cố đó. Trong nghiên cứu bệnh – chứng, OR là tỷ số giữa số chênh của yếu tố quan tâm ở nhóm bệnh với số chênh của yếu tố quan tâm ở nhóm chứng. Bảng 2x2 trong nghiên cứu bệnh – chứng Nhóm bệnh Nhóm chứng Phơi nhiễm a b Không phơi nhiễm c d Odds ratio (OR) = (a/c)/(b/d) = ad/bc Nếu OR bằng 1, yếu tố phơi nhiễm không liên quan đến kết cục. Nếu OR lớn hơn 1, yếu tố phơi nhiễm có liên quan dương (cùng chiều) với biến cố kết cục (gọi là yếu tố nguy cơ). Nếu OR nhỏ hơn 1, tình trạng phơi nhiễm có liên quan âm (ngược chiều) với biến cố kết cục (gọi là yếu tố bảo vệ). OR = 1 Không liên quan OR≧1 Yếu tố nguy cơ OR≦1 Yếu tố bảo vệ
- 80 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C Khi tính chỉ số OR, cần tính khoảng tin cậy 95% (KTC), để ước lượng mức độ dao động của OR (hoặc ước lượng khoảng của OR). Khoảng tin cậy 95% có nghĩa là xác suất 95% khoảng này có chứa giá trị OR thật. Nếu KTC 95% này có chứa số “1” bên trong, mối liên hệ không có ý nghĩa thống kê bởi vì có thể xảy ra cả hai khả năng, yếu tố phơi nhiễm là yếu tố nguy cơ (OR > 1) hoặc là yếu tố bảo vệ (OR < 1). Nếu giới hạn dưới của KTC 95% lớn hơn 1, yếu tố phơi nhiễm thể hiện là một yếu tố nguy cơ với xác suất hơn 95%. Nếu giới hạn trên của KTC 95% nhỏ hơn 1, yếu tố phơi nhiễm có tính bảo vệ với xác suất hơn 95%. Những khái niệm này được giải thích chi tiết hơn trong chương 9. Chú ý, trường hợp những ca bệnh và ca chứng đã được bắt cặp, bảng 2x2 sẽ phức tạp hơn. Những con số trong các ô bây giờ biểu thị số cặp. Ví dụ, số “a” trong ô đầu tiên thể hiện số cặp - một của nhóm bệnh, một của nhóm chứng – cả hai đều có phơi nhiễm với yếu tố quan tâm. OR được tính theo số cặp không cùng phơi nhiễm. Bảng 2x2 trong nghiên cứu bệnh – chứng bắt cặp Nhóm chứng Nhóm bệnh Phơi nhiễm Không phơi nhiễm Phơi nhiễm a b Không phơi nhiễm c d Odds ratio (OR) = b/c
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 81 5. Điểm mạnh và hạn chế So với nghiên cứu đoàn hệ, thiết kế này có nhiều điểm mạnh, bao gồm 1) ít tốn kém, 2) không tốn thời gian theo dõi, 3) hiệu quả trong nghiên cứu các bệnh hiếm và 4) có thể đánh giá nhiều yếu tố phơi nhiễm cùng lúc. Tuy nhiên, thiết kế có nhiều hạn chế, bao gồm: 1) dễ xảy ra sai lệch (bias), đặc biệt là sai lệch chọn mẫu, sai lệch nhớ lại và sai lệch do quan sát, 2) chỉ đánh giá một kết cục, 3) không thể ước tính tần xuất mắc mới của bệnh, 4) khó khảo sát nếu yếu tố phơi nhiễm hiếm, 5) khó đánh giá tính nhân quả của mối liên hệ, và 5) tính khái quát hóa bị hạn chế. 6. Ví dụ Một điển hình của nghiên cứu bệnh – chứng là luận án nghiên cứu của tôi (tác giả - Yokokawa H).5 Tỷ lệ tử vong do bệnh mạch máu não ở Nhật Bản cao hơn nhiều so với Bắc Mỹ và Tây Âu. Do vậy, tôi khảo sát mối liên hệ giữa nhồi máu não với các yếu tố nhân khẩu học, bệnh sử và các đo lường lâm sàng khác trong đó có vận tốc sóng mạch (pulse wave velocity - PWV), một phương pháp mới, không xâm lấn, dùng đánh giá độ cứng động mạch chủ. Đây là nghiên cứu bệnh – chứng, bắt cặp, chứng bệnh viện, thực hiện tại miền bắc Nhật Bản, nơi có xuất độ bệnh mạch máu não cao. Đối 5 Yokokawa H, Goto A, Watanabe K, Yasumura S. Evaluation of atherosclerosis-associated factors and pulse wave velocity for predicting cerebral infarction: a hospital-based, case- control study in Japan. Internal Medicine Journal. 2007; 237: 161-167.
- 82 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C tượng gồm 92 cặp bệnh nhân nhồi máu não (nhóm bệnh) và những người khỏe mạnh nhập viện để kiểm tra sức khỏe toàn bộ (nhóm chứng) tại Bệnh viện đa khoa Nam Tohoku ở tỉnh Fukushima, Nhật Bản. Tôi phát hiện tình trạng PWV cao hơn 1600 cm/giây, cùng ớ v i những yếu tố nguy cơ truyền thống khác (tiền căn gia đình có tăng huyết áp và bệnh mạch máu não, chỉ số HDL-cholesterol nhỏ hơn hoặc bằng 40 mg/dL) có liên quan đến tăng nguy cơ nhồi máu não. Thiết kế nghiên cứu bệnh – chứng phù hợp trong trường hợp này bởi vì kết cục hiếm (mặc dù tử vong cao hơn so với các nước phương Tây nhưng nhồi máu não không phải là phổ biến so với, ví dụ như, bệnh đái tháo đường), mong muốn khảo sát nhiều yếu tố nguy cơ, và thời gian thực hiện luận án của tôi có giới hạn. Thiết kế này cũng thuận lợi cho bác sĩ lâm sàng làm việc tại bệnh viện.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 83 CHƯƠNG 9 Nghiên cứu can thiệp: Lý luận cơ bản và thực tế Aya Goto, Trần Quang Nam 1. Định nghĩa nghiên cứu can thiệp Nghiên cứu can thiệp là nghiên cứu theo dõi trong đó nhà nghiên cứu sẽ ấn định tình trạng tiếp xúc. Nghiên cứu được gọi là thử nghiệm ngẫu nhiên có đối chứng (randomized con- trol trial: RCT) nếu quá trình ấn định tình trạng tiếp xúc này ngẫu nhiên. Theo cấp độ thiết kế nghiên cứu, nghiên cứu can thiệp được xếp vào loại nghiên cứu cung cấp chứng cứ khoa học mức giá trị cao, với điều kiện là nghiên cứu phải được thiết kế và thực hiện tốt. Tuy nhiên điều này cũng cho thấy rằng tiến hành nghiên cứu can thiệp trong hoàn cảnh thực tế có rất nhiều khó khăn. Chứng cứ khoa học chất lượng cao chỉ có thể có được khi thực hiện nghiên cứu ngẫu nhiên, có “mù” và dùng ảgi dược phù hợp. 2. Ngẫu nhiên hóa và sự tuân thủ Phương pháp ngẫu nhiên hóa kinh điển dùng phong bì cho thấy khái niệm cụ thể về ngẫu nhiên hóa. Hãy thử tượng
- 84 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C tượng bạn quyết định cỡ mẫu của bạn là 100, thì có 50 sẽ được phân vào nhóm can thiệp và 50 vào nhóm chứng (không can thiệp). Bạn chuẩn bị 50 phong bì dán kín có tờ giấy ở trong ghi “phân người này vào nhóm can thiệp” và 50 phong bì khác có tờ giấy ghi “phân người này vào nhóm chứng”, và trộn lẫn các phong bì này một cách ngẫu nhiên. Khi gặp bệnh nhân bạn sẽ bốc 1 phong bì. Bạn không được phép bốc nhiều hơn 1 lần. Hiện nay công việc này có thể dùng máy vi tính. Nhờ sự ngẫu nhiên hóa này mà cả 2 nhóm (nhóm can thiệp và nhóm chứng) đều có các đặc điểm tương đồng với nhau. Nếu không dùng ngẫu nhiên, thầy thuốc có xu hướng cho bệnh nhân vào nhóm điều trị mà người thầy thuốc nghĩ là có lợi nhất cho bệnh nhân. Do đó, phương pháp ngẫu nhiên hóa là cách để kiểm soát được ý định điều trị của thầy thuốc. Mặt khác bệnh nhân cũng có mong muốn của họ có nên dùng phương pháp ề đi u trị được phân ngẫu nhiên hay không. Điều này gọi là sự tuân thủ. Từ dự án Coronary Drug Project6 cho thấy ý nghĩa quan trọng là những người tuân thủ kém có những đặc điểm khác với những người tuân thủ tốt. Có một nghiên cứu RCT đã được thực hiện để đánh giá hiệu quả và an toàn của vài loại thuốc tác động lên lipid gồm có Clofibrate. Nghiên cứu cho thấy tỷ lệ tử vong 5 năm trong nhóm bệnh nhân tuân thủ tốt thấp hơn so với bệnh nhân tuân thủ kém, điều này thấy cả trong nhóm chứng. Rất thú vị là tỷ lệ tử vong của những bệnh nhân tuân thủ tốt trong 6 The Coronary Drug Project Research Group. Influence of adherence to treatment and response of cholesterol on mor- tality in the coronary drug project. New England Journal of Medicine. 1980; 303: 1038-1041.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 85 nhóm chứng thấp hơn nhiều so với bệnh nhân tuân thủ kém trong nhóm can thiệp. Ngay cả khi bệnh nhân đã ký đồng thuận tham gia nghiên cứu RCT, một số người có dùng điều trị được phân nhóm và một số bệnh nhân không dùng theo sự phân nhóm. Khi phân tích có thể bạn thường muốn đưa những bệnh nhân trong nhóm can thiệp không dùng theo chế độ điều trị sang nhóm chứng hay ngược lại. Tuy nhiên, bạn không nên làm như vậy. Phân tích này được gọi là phân tích theo ý định điều trị (intention-to-treat analysis) trong đó sẽ không thay đổi sự phân nhóm ngẫu nhiên mà bạn đã làm lúcắ b t đầu vào nghiên cứu. Điều này đảm bảo rằng cả 2 nhóm có đặc điểm tương đồng; nói cách khác là tránh những yếu tố gây nhiễu (confounders) có thể xảy ra. 3. Mù đôi và giả dược Nhằm mục đích ngăn ngừa sự ảnh hưởng thêm của ý định ừt tất cả mọi người liên quan trong nghiên cứu, bạn cần thực hiện “mù” đôi. Quá trình làm “mù” này bao gồm các bệnh nhân tham gia nghiên cứu, thầy thuốc thực hiện phân phối cách điều trị cho bệnh nhân và đánh giá kết cục, và ảc những nhà nghiên cứu quản lý nghiên cứu và xử lý dữ liệu. Nếu bệnh nhân biết họ được phân vào nhóm điều trị nào thì sẽ ảnh hưởng tới sự tuân trị và sự nhận thức về kết cục. ếN u thầy thuốc biết bệnh nhân thuộc nhóm nào có thể sẽ ảnh hưởng tới sự quan sát và đánh giá kết cục. ếN u nhà nghiên cứu biết nhóm nào dùng thuốc điều trị, sự phân tích của họ
- 86 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C sẽ bị sai lệch hệ thống do cố gắng có kết quả theo ý định nghiên cứu. Để làm “mù” bệnh nhân, người ta dùng giả dược. Khi Kar- lowski và cộng sự7 thực hiện một nghiên cứu RCT nhằm đánh giá hiệu quả của acid Ascorbic ngăn ngừa cảm lạnh, quá trình mù đôi của họ bị thất bại. Nhiều người tham gia nghiên cứu có thể biết họ đang dùng thuốc gì (Ascorbic acid hay giả dược) do họ nhận biết qua vị giác. Dựa vào đặc điểm này, họ đã phân tích so sánhự s xảy ra cảm lạnh ở những người đã biết đúng, những người không biết và người đoán sai viên thuốc họ đang uống. Kết quả cho thấy sự phân bố rất lý thú trong nhóm người đoán sai. Nhóm đã dùng acid Ascorbic mà họ nghĩ là đang dùng giả dược cảm lạnh xảy ra nhiều hơn nhóm người dùng giả dược mà nghĩ là đang dùng acid Ascorbic. Ở đây bạn có thể thấy hiệu quả của giả dược. Giả dược không chỉ làm “mù” bệnh nhân để họ không biết thuộc nhóm nào, mà còn biết được hiệu quả thực của biện pháp can thiệp. 4. Nghiên cứu giống can thiệp Mặc dù không khó khăn để hiểu biết khái niệm về sự ngẫu nhiên hóa và mù, nhưng rất khó để thực hiện trong thực tế. Bạn có thể thuyết phục giám đốc bệnh viện hay lãnh đạo thành phố về sự phân bố ngẫu nhiên không? Người tham gia có chấp nhận phân ngẫu nhiên không? Bạn có thể giải quyết 7 Karlowski TR, Chalmers TC, Frenkel LD, Kapikian AZ, Lew- is TL, Lynch JM. Ascorbic acid for the common cold. A prophylactic and therapeutic trial. JAMA. 1975; 231: 1038- 1042.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 87 và thực hiện những việc liên quan tới quá trình mù không? Mặc dù giả thiết ban đầu của nghiên cứu can thiệp là bạn không biết hiệu quả của biện pháp can thiệp, nếu có một ít khả năng biện pháp can thiệp mới sẽ tốt hơn thì mọi người sẽ thích được vào nhóm can thiệp hơn. Nói chung những người chăm sóc y tế cộng đồng ở châu Á ưa thích cho mọi người có cơ hội ngang nhau để nhận được dịch vụ cung cấp. Do đó khái niệm ngẫu nhiên hóa sẽ không phù hợp. Các nghiên cứu RCT đánh giá hiệu quả của biện pháp can thiệp trong bối cảnh lý tưởng. Một số tình huống không thực hiện được RCT, hoặc khi bạn muốn đánh giá tính khả thi và hiệu quả của biện pháp can thiệp trong thực tế trên cộng đồng mục tiêu của bạn. Những trường hợp như vậy thì nghiên cứu giống can thiệp có thể giúp ích. Các nghiên cứu này có thể phân loại theo một vài cách,8 nhưng thường chia thành hai loại: một loại không có nhóm chứng và một loại khác có nhóm chứng nhưng không phân ngẫu nhiên. Bảng 9.1. Nghiên cứu giống can thiệp: các loại dữ liệu so sánh Không có Có nhóm chứng nhóm chứng Chỉ đánh giá Đánh giá sau can thiệp của sau can nhóm bệnh so với đánh giá thiệp sau can thiệp của nhóm (Post-test chứng (Post-test of cases vs only) Post-test of controls) 8 Harris AD, McGregor JC, Perencevich EN, Furuno JP, Zhu J, Peterson DE, Finkelstein J. The use and interpretation of quasi-experimental studies in medical informatics. J Am Med Inform Assoc. 2006; 13: 16-23.
- 88 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C Đánh giá Đánh giá Đánh giá sự khác biệt trước& trước và sau sau can sau can thiệp của nhóm bệnh can thiệp) thiệp so so với sự khác biệt trước& (Pre- and với đánh sau can thiệp của nhóm post-tests) giá trước chứng can thiệp (Pre&post test difference of (Post-test cases vs. vs. Pre&post test differences of Pre-test) controls) Nghiên cứu giống can thiệp có ưu điểm là cung cấp chứng cứ về hiệu quả trong hoàn cảnh thực tế, nhưng cần lưu ý những nhược điểm chính của nó. Thứ nhất, khó kiểm soát những yếu tố nhiễu quan trọng. Thứ hai, khi lặp lại kiểm định của 1 nhóm có thể dẫn đến kết quả sẽ qui tụ về giá trị trung bình – sự giảm hay tăng của yếu tố chỉ dấu có thể xảy ra theo thống kê ngay cả khi không có sự can thiệp. Thứ ba, có thể có hiệu ứng trưởng thành (hiệu ứng chín mùi - matu- ration effect) liên quan với những biến đổi tự nhiên theo thời gian mà không phải do sự can thiệp 5. Ví dụ nghiên cứu Dưới đây là một ví dụ thực tế về nghiên cứu giống thực nghiệm.9 Do ở châu Á có ít các nghiên cứu can thiệp trên cha mẹ, chúng tôi chấp nhận chương trình đa ngôn ngữ hỗ 9 Goto A, Yabe J, Sasaki H, Yasumura S. Short-term opera- tional evaluation of a group-parenting program for Japanese mothers with poor psychological status: adopting a Canadian program into the Asian public service setting. Health Care for Women International. 2010; 31: 636-651.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 89 trợ cha mẹ của Canada để đưa vào áp dụng cho cung cấp dịch vụ sức khỏe cho người Nhật và đã đánh giá ảnh hưởng của chương trình này. Chúng tôi đánh giá sự thay đổi trạng thái tinh thần của 32 bà mẹ tham gia vào can thiệp so sánh với số liệu của 156 bà mẹ tham gia chương trình kiểm tra sức khỏe cho trẻ. Nghiên cứu được thực hiện với sự cộng tác của trung tâm sức khỏe thành phố, và rất khó mà phân ngẫu nhiên biện pháp can thiệp, biện pháp này đã ợđư c cung cấp như một chương trình chăm sóc cộng đồng. Mặt khác, chúng tôi có thể tiếp cận để lấy hồ sơ kiểm tra sức khỏe lưu giữ ở trung tâm sức khỏe. Chúng tôi so sánh sự thay đổi (sau khi dùng biện pháp can thiệp trừ đi lúc mới vào nghiên cứu) về mức độ tự tin của các bà mẹ tham gia vào chương trình can thiệp với sự thay đổi cùng chỉ số đó trong cùng thời gian của những bà mẹ dựa trên các dữ liệu so sánh. Nghiên cứu cho thấy chương trình mới có tính khả thi để làm một dịch vụ y tế công cộng và có tác động tích cực lên sự tự tin của người mẹ.
- 90 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C CHƯ Ơ N G 10 Các khái niệm sinh thống kê căn bản Nguyễn Quang Vinh, Nguyễn Thị Từ Vân 1. Giới thiệu Khi tìm hiểu một sự việc chưa được biết rõ, chúng ta cần phải thu thập dữ liệu liên quan vấn đề đó. Thống kê là môn học để xử lý các dữ liệu có được, nhằm đưa ra những thông tin hữu ích, rút ra một kết luận hợp lý nhất về tổng thể được nghiên cứu. Với lượng thông tin đồ sộ thông qua sách báo, phương tiện truyền thông trong xã hội hiện đại của chúng ta, một nhà lâm sàng không những cần biết cách đọc tài liệu, mà còn biết cách lý giải dữ liệu để ứng dụng các bằng chứng khoa học vào thực hành lâm sàng. Hai mục tiêu chính của nghiên cứu dịch tễ học là (1) tóm lược dữ liệu của mẫu nghiên cứu (2) rút ra những suy luận từ mẫu nghiên cứu vào quần thể chung. Thống kê là công cụ quan trọng bởi vì nó cung cấp khía cạnh thống kê mô tả, được xem là mục tiêu thứ nhất, và thống kê suy lý là mục tiêu thứ hai. Trong chương này và chương kế tiếp về thống kê sinh học, chúng tôi cố gắng tối đa không đề cập về các công thức
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 91 toán học, mà chủ yếu tập trung giúp độc giả hiểu được các khái niệm chính yếu. Các tính toán cụ thể được trình bày trong các bài giảng, và độc giả có thể tìm hiểu thêm trong các phần mềm thống kê. 2. Thống kê mô tả Thống kê mô tả giúp bạn tóm lược dữ liệu có sẳn bằng cách phân nhóm và tính toán các đo lường để diễn tả sự phân bố của dữ liệu. 1) Phân nhóm dữ liệu Một nghiên cứu được thiết kế kỹ lưỡng cho những dữ liệu thô quý giá, tuy nhiên dữ liệu cần được sắp xếp lại. Để chuyển tải thành những thông tin có giá trị ứng dụng hữu ích, dữ liệu thô phải được trình bày một cách rõ ràng. Dữ liệu được phân loại thành các nhóm liên tục nhau và không chồng lấp. Không nên phân thành nhiều nhóm quá (không tóm lược dữ liệu) hay ít quá (không ủ đ thông tin). Độ rộng của các nhóm có thể bằng nhau hay khác nhau. Một ví dụ cổ điển của phân loại thành nhóm cùng ộđ rộng là chia cấu trúc tuổi sinh đẻ thành những nhóm cách nhau 5 tuổi: 15-19, 20- 24, 25-29, 30-34, 35-39, 40-44, và 45-49. Khi trình bày dữ liệu với độ rộng của các nhóm khác nhau, cần có lập luận tùy theo mục tiêu của nghiên cứu. Ví dụ trong một nghiên cứu về viêm nhiễm đường sinh dục ở phụ nữ tuổi sinh đẻ, tuổi có thể chia thành 3 nhóm: dưới 20, 20-39, và từ 40 tuổi trở lên, do có sự khác nhau về độ dày của thành âm đạo ảnh hưởng bởi sự thay đổi của mức độ nội tiết và các hoạt động tình dục. Ví dụ của một bảng trình bày dữ liệu đã được tổ chức:
- 92 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C Loại Tần Tần số Tần Tần số số tương đối số tương đối tích tích lũy lũy Dưới 20 100 20% 100 20% 20 – 39 350 70% 450 90% 40 trở lên 50 10% 500 100% 2) Tóm lược các thông số về dữ liệu Các đo lường sự tập trung của dữ liệu Ngoài việc phân loại dữ liệu, có ba cách đo lường tóm lược để mô tả sự tập trung của dữ liệu. Trung bình (trung bình số học) = Tổng tất cả các dữ liệu / n Trung vị = giá trị ở bách phânị v thứ 50 Yếu vị = (các) giá trị xuất hiện nhiều nhất Cách tính trung bình đơn giản, nhưng bị ảnh hưởng nhiều bởi các giá trị quá lớn hay quá nhỏ, là con số ước lượng xấp xỉ tốt chỉ khi dữ liệu có phân phối bình thường (có dạng hình chuông). Trung vị cũng đơn giản, nhưng không bị ảnh hưởng bởi các giá trị quá lớn hay quá nhỏ. Các đo lường sự phân tán của dữ liệu Thông tin từ con người đều có nhiều biến thiên giữa mỗi cá thể. Vì vậy, cần phải đánh giá sự phân tán của dữ liệu so với giá trị của các đo lường tóm lược. Khoảng dãn rộng từ giá trị nhỏ nhất đến lớn nhất Phương sai = trung bình của bình phương khoảng cách giữa các dữ liệu với giá trị trung bình. Độ lệch chuẩn (ĐLC) = căn bậc hai của phương sai. ĐLC đo lường giá trị tuyệt đối của khoảng cách giữa các
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 93 dữ liệu với giá trị trung bình. ĐLC đo lường sự phân tán tuyệt đối. Hệ số phương sai (CV) = Tỷ số của ĐLC với giá trị trung bình. CV đánh giá sự biến đổi (variability) tương đối của dữ liệu so với giá trị trung bình. CV vượt quá 100%, chứng tỏ dữ liệu có sự phân tán rất rộng. CV không lệ thuộc vào đơn vị đo lường, do đó có thể dùng ểđ so sánh giữa các nhóm dữ liệu bất kỳ. Các đo lường vị trí Các đo lường vị trí của một giá trị cho sẵn nhằm so sánh và mô tả sự liên hệ của dữ liệu đó với các dữ liệu khác trong bộ dữ liệu của một biến số. Hai cách đo lường vị trí được dùng là bách phân vị (và tứ phân vị), và giá trị z. Bách phân vị= là vị trí có số % dữ liệu từ giá trị này trở xuống Tứ phân vị= các bách phân vị thứ 25, 50, và 75 Giá trị z= giá trị chuẩn hóa đo khoảng cách giữa một giá trị ớv i trung bình chia cho với độ lệch chuẩn (cùng đơn vị). 3. Thống kê suy lý 1) Ước lượng Mong muốn của người làm nghiên cứu là đi tìm các thông số trong quần thể, tuy nhiên không thể tìm ra các thông số này ở những quần thể vô hạn. Do đó, sự hiểu biết về các con số thống kê trong một mẫu nghiên cứu giúp chúng ta ước lượng các thông số trong quần thể qua suy lý, mà không cần phải chờ đến khi khảo sát toàn thể quần thể. Các con số thống kê thường được dùng để ước lượng là trung bình, tỷ
- 94 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C lệ, và phương sai. Có hai kiểu ước lượng: ước lượng điểm và ước lượng khoảng. Ý tưởng về ước lượng điểm khá đơn giản. Số thống kê tính từ mẫu gọi là ước lượng điểm, còn gọi là “estimator” được xem là tham số để suy luận cho quần thể. Một estimator tốt cần thỏa hai tiêu chuẩn: dữ liệu thu thập được không bị sai lầm hệ thống (systematic error) và độ lệch chuẩn của giá trị này là nhỏ hơn độ lệch chuẩn của các estimator khác (nghĩa là cân nhắc xem lấy giá trị trung bình hay trung vị tính từ mẫu của bạn là số ước lượng tốt nhất cho quần thể). Ước lượng khoảng đưa ra một ước lượng với một khoảng theo công thức ước lượng điểm (estimator) ± hệ số tin cậy (reliability coefficient) x sai số chuẩn (standard error). Khi mẫu được rút ra từ quần thể có phân phối bình thường, hệ số tin cậy chính là z-score trong trường hợp biết phương sai, nhưng cũng có thể tính được khi không biết phương sai. Khoảng giá trị được tính từ công thức trên có thể diễn giải như sau “khi lặp lại việc lấy mẫu, 100(1-α)% của tất cả các khoảng ước lượng tính được sẽ chứa trung bình của quần thể”. Giá trị (1-α) gọi là hệ số tin cậy (confidence coefficient) và khoảng giá trị tính ra gọi khoảng tin cậy (confidence interval). Các hệ số tin cậy thường dùng là ,90; ,95; ,99, và giá trị z-scores (reliability factors) tương ứng lần lượt là 1,645, 1,96, 2,58. Trong các chương trước, chúng tôi có nhắc đến khái niệm 95% khoảng tin cậy. Về mặt thực hành, có thể diễn giải như sau “chúng tôi tin đến 95% rằng khoảng tin cậy chứa giá trị thực của trung bình quần thể”. Hình 10.1. minh họa cho thấy nếu lặp lại lấy mẫu 100 lần, có 5 lần
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 95 khoảng tin cậy tính được không chứa trung bình của quần thể. Hình 10.1. 95% khoảng tin cậy Trị số trung bình thực True mean 2) Kiểm định giả thuyết thống kê và trị số p Để đưa ra một quyết định liên quan sự khác biệt, bạn cần thiết lập một giả thuyết. Kiểm định giả thuyết thống kê là một phương pháp giúp bạn đưa ra quyết định đánh giá xem sự khác biệt được quan sát trong mẫu là khác biệt có tính hệ thống hay khác biệt chỉ do tình cờ mà có. Một định nghĩa chính xác hơn là “kiểm định giả thuyết thống kê là cách thức để tính ra xác suất của sự khác biệt chỉ do ngẫu nhiên”. Có hai loại giả thuyết: giả thuyết nghiên cứu và giả thuyết thống kê. Giả thuyết nghiên cứu thường khởi nguồn từ sự quan sát tăng dần, mà từ đó trực tiếp dẫn đến giả thuyết thống kê, được viết với ngôn ngữ thống kê để được xử lý bằng phép kiểm phù hợp. Có hai loại giả thuyết thống kê: giả thuyết không (null hypotheses) và giả thuyết đảo (alternative hypotheses). Giả thuyết đảo là cái mà bạn muốn đưa ra kết luận về quần thể (v.d: hiệu quả của trị liệu mới A có khác biệt trị liệu thường qui B) và giả thuyết không là ngược lại với giả thuyết đảo
- 96 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C (v.d: hiệu quả của trị liệu A tương tự trị liệu B). Quyết định bác bỏ giả thuyết không tùy thuộc vào tầm mức của số thống kê của phép kiểm định được tính từ công thức chung này: [số thống kê tính từ mẫu (relevant statistic of your sample) – tham số được kiểm định trong quần thể (hypothesize parameter in a population)] / sai số chuẩn (standard error). Dựa trên kết quả của phép tính này, bạn có thể tra ra trị số p tương ứng trong các bảng thống kê, thường nằm ở phần cuối trong bất kỳ cuốn sách giáo khoa thống kê nào. Có nhiều bảng thống kê, và bạn cần chọn bảng phù hợp với phân phối mà bạn muốn kiểm định. Khi dùng các phần mềm thống kê, bước này được tích hợp trong phần mềm. Một luật căn bản là khi trị số p nhỏ, bác bỏ giả thuyết không (nghĩa là hiệu quả của trị liệu A và B không khác biệt) và ủng hộ cho giả thuyết đảo (nghĩa là hiệu quả của trị liệu A và B khác nhau) dẫn đến kết luận có sự khác biệt. Có hai cách kiểm định giả thuyết thống kê: phép kiểm một đuôi và hai đuôi. Một nhà nghiên cứu cẩn trọng nên chọn cách kiểm định hai đuôi trừ khi biết rất rõ là sự khác biệt chỉ xảy ra theo một hướng (v.d trị liệu A tốt hơn B và trị liệu B không bao giờ tốt hơn A). Nên nhớ rằng không có một phép kiểm định nào có thể “chứng minh” giả thuyết. Cách kiểm định giả thuyết thống kê chỉ cho biết duy nhất một điều là giả thuyết đó có được “ủng hộ” bởi dữ liệu được thu thập được từ mẫu hay không. Quy chuẩn này nhằm để quyết định việc hoặc là bác bỏ hoặc là chấp thuận một giả thuyết. Trị số p không phải là chỉ tố nhị giá nhằm để bác bỏ hay không một giả thuyết, nó còn mang nhiều ý nghĩa hơn nữa. Trị số p biểu hiện mức độ tin cậy vào giả thuyết không của nhà nghiên cứu. Nói cách khác, trị số p là một xác suất (p)
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 97 của nhà nghiên cứu tin rằng giả thuyết không là đúng. Ý nghĩa nằm sau khái niệm trị số p được trình bày ở bên dưới. Điểm mấu chốt đó là việc quyết định có bác bỏ giả thuyết không hay không bác bỏ, còn sự thật trong quần thể thì không biết được. Ký hiệu α gọi là ngưỡng ý nghĩa thống kê, là một xác suất cho phép mắc sai lầm bác bỏ giả thuyết không khi bản chất giả thuyết không là đúng. Ký hiệu β là xác suất của sai lầm không bác bỏ giả thuyết không khi giả thuyết không là sai. Khi β nhỏ, khả năng của phép kiểm bác bỏ chính xác một giả thuyết sai sẽ tăng lên. Giá trị (1 –β) gọi là độ mạnh của một phép kiểm. Sự thật trong quần thể Giả thuyết không Giả thuyết không SAI ĐÚNG Kết quả từ Bác bỏ Quyết định đúng Sai lầm loại I mẫu nghiên = α (ngưỡng cứu thống kê) Không Sai lầm loại II Quyết định đúng bác bỏ = β (1-power) Có năm bước trong kiểm định một giả thuyết thống kê. Phần mềm thống kê chỉ giúp bạn bước 4, còn các bước còn lại bạn phải làm. Bước 1 Thiết lập giả thuyết không và giả thuyết đảo. Bước 2 Chọn phép kiểm thống kê (dựa vào phân phối của dữ liệu). Bước 3 Quyết định ngưỡng ý nghĩa thống kê. Bước 4 Tính toán số thống kê của phép kiểm định và sau đó xác định trị số p. Bước 5 Đưa ra một phát biểu rõ ràng không dùng thuật ngữ thống kê để diễn giải kết quả.
- 98 K H Ó A T Ậ P H U Ấ N N GH I Ê N C Ứ U D Ị C H T Ễ H Ọ C Nói chung, cỡ mẫu cần được xem xét sớm trong giai đoạn thiết kế nghiên cứu. Việc tính toán này nhằm để ước lượng số đối tượng thích hợp cho một thiết kế nhất định. Số đối tượng quá ít sẽ ảnh hưởng đến tính chuẩn xác của ước lượng điểm; khi cỡ mẫu quá lớn sẽ gánh thêm nhiều nguồn lực. Khi ước tính cỡ mẫu cho mục đích mô tả, chúng ta chỉ cần cân nhắc sai lầm loại I. Khi tính cỡ mẫu để kiểm định giả thuyết thống kê, cần đưa thêm vào sai lầm loại II. Hầu hết phần mềm thống kê có thể tính được cỡ mẫu để cho một kết quả ước lượng tốt nhất và chọn một phép kiểm định thống kê phù hợp (so sánh trung bình/tỷ lệ một mẫu với giá trị giả thu- yết của quần thể hoặc so sánh trung bình/tỷ lệ của hai mẫu). Khi cỡ mẫu bị chốt lại do những lý do như ràng buộc về kinh phí và/hoặc thời gian, thì chúng ta nên suy nghĩ về độ chuẩn xác của dữ liệu có được, và xem nó có ý nghĩa với mục tiêu nghiên cứu hay không.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 99 C H Ư Ơ N G 11 Các phép kiểm căn bản Nguyễn Quang Vinh, Nguyễn Thị Từ Vân 1. Giới thiệu Trong chương này, chúng tôi sẽ giới thiệu bốn phép kiểm thống kê căn bản. Phép kiểm chi bình phương (bao gồm McNemar) và phép kiểm Fisher’s exact để xử lý các tỷ lệ; phép kiểm t và Mann-Whitney để so sánh hai số trung bình. Ngoài ra, phần cuối chương sẽ tóm lược về xử lý các xét nghiệm chẩn đoán. Có nhiều phần mềm thống kê nhưng ở đây chúng tôi giới thiệu hai phần mềm tin cậy (có thể tải miễn phí trên mạng). OpenEpi: dễ thao tác, có cả phần tính cỡ mẫu. Phiên bản chuyên sâu là Epi Info. R: một phần mềm chuyên cho thống kê.
- 100 K H Ó A T Ậ P H U Ấ N N G H I Ê N C Ứ U D Ị C H T Ễ H Ọ C 2. Phép kiểm chi bình phương Chi bình phương là một phép kiểm thông dụng nhất, tính toán dựa trên phân phối chi bình phương. Điểm mấu chốt của tính toán này là so sánh tần xuất quan sát được và tần xuất lý thuyết ở những ô của bảng chéo với độ tự do tương ứng. Tần xuất lý thuyết trong một ô, ví dụ a, tính theo công thức (a+c)x(a+b)/(a+b+c+d). Kết cục + Kết cục - Tiếp xúc A B a+b Không tiếp xúc C D c+d a+c b+d a+b+c+d Độ tự do trong phân phối chi bình phương tính từ số ô trong bảng. Giá trị này quyết định hình dạng của phân phối, dựa vào trị số p sử dụng. Số thống kê chi bình phương áp dụng trong ba phép kiểm: phép kiểm sự phù hợp phân bố của đặc tính có sẵn (test of goodness-of-fit), phép kiểm sự độc lập của hai biến số (test of independence), và phép kiểm tính ồ đ ng nhất của hai biến số (test of homogeneity). Kiểm định sự khác biệt giữ hai tỷ lệ (hay nhiều hơn) là test of inde- pendence. Giả thuyết không: 2 biến phân loại độc lập nhau. Giả thuyết đảo: 2 biến phân loại không độc lập nhau. Độ tự do = (số hàng - 1) x (số cột - 1) Nói chung, không nên dùng kiểm chi bình phương khi n<20 hoặc tần xuất lý thuyết ở bất kỳ ô nào trong bảng <5. Số thống kê chi bình phương = tổng [(Tần xuất quan sát – Tần xuất lý thuyết)2 / Tần xuất lý thuyết] tính cho mỗi ô
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 10 1 Một phần bảng bên dưới được dùng để tìm giá trị p ứng với độ tự do và giá trị số thống kê tính được. Ví dụ, khi độ tự do là 1 và số thống kê chi bình phương tính ra là 4, thì giá trị p tính ra dưới 0,05 và kết quả có ý nghĩa thống kê. p value df 0.25 0.20 0.15 0.10 0.05 0.025 0.02 0.01 0.005 0.0025 0.001 1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.6 11.98 13.82 Ghi chú, trong trường hợp dữ liệu được bắt cặp (xem Chương 8), bạn nên chọn phép kiểm McNemar’s (Chi bình phương). Giả thuyết không trong trường hợp này là b và c bằng nhau Bảng 2x2 trong nghiên cứu bệnh chứng bắt cặp Nhóm chứng Nhóm bệnh Tiếp xúc Không tiếp xúc Tiếp xúc A b Không tiếp xúc C d 3. Phép kiểm Fisher’s exact Phép kiểm Fisher’s exact được sử dụng khi tần xuất lý thuyết ở bất kỳ ô nào trong bảng chéo nhỏ (thông thường nhỏ hơn 5). Phép kiểm này tính chính xác giá trị xác suất p để có những giá trị đã quan sát được, hoặc các giá trị ở thái cực. Liệt kê tất cả các tổ hợp kết quả cho cùng giá trị tổng ở biên, tính xác suất kèm theo, và xác định giá trị xác suất chính xác ểđ có bộ tổ hợp quan sát này. Nói ngắn gọn, phép kiểm chi bình phương cho một kết quả xấp xỉ, còn phép kiểm Fisher’s exact tính ra giá trị xác suất chính xác.
- 102 K H Ó A T Ậ P H U Ấ N N G H I Ê N C Ứ U D Ị C H T Ễ H Ọ C 4. Phép kiểm Student’s t Điểm quan trọng của phép kiểm Student’s t là so sánh giá trị trung bình của mẫu với trung bình của quần thể, cân nhắc đến cả sai số chuẩn (standard error), và độ tự do tương ứng. Giống như trong phép kiểm chi bình phương, mức độ của độ tự do quyết định hình dạng của phân phối t, dựa trên đó giá trị p được xác định. Với cùng một giá trị kiểm định thống kê, giá trị p càng nhỏ khi độ tự do càng lớn. Giả thuyết không: giá trị trung bình mẫu và trung bình cho trước (trung bình giả định) ằb ng nhau Giả thuyết đảo: giá trị trung bình mẫu và trung bình cho trước (trung bình giả định) khác nhau Độ tự do = n (cỡ mẫu) - 1 Giá trị thống kê t = (trung bình mẫu – trung bình cho trước) / sai số chuẩn (standard error) 5. Phép kiểm Mann-Whitney Phép kiểm Mann-Whitney thay thế cho phép kiểm t hai mẫu và dùng khi cỡ mẫu nhỏ và biến kiểm định trong quần thể không có phân phối bình thường. Phép kiểm quan tâm đến thứ hạng của quan sát hơn là giá trị của quan sát, sau đó so sánh tổng các thứ hạng giữa hai nhóm. Giả thuyết không: 2 quần thể có cùng phân phối xác suất Giả thuyết đảo: 2 quần thể không có cùng phân phối xác suất
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 10 3 6. Test chẩn đoán Nhiều phương pháp đo lường khác nhau bao gồm các test y khoa được sử dụng cho nhiều mục đích bao gồm chẩn đoán bệnh, đánh giá tình trạng sức khỏe, sàng lọc yếu tố nguy cơ, và đánh giá dự hậu. Kết quả của test có thể dưới dạng biến nhị giá, biến phân loại, hoặc biến liên tục. Một test chẩn đoán có thể được đánh giá bằng cách so sánh với tiêu chuẩn vàng hiện tại. Các chỉ tố chính đánh giá test chẩn đoán được trình bày ở bảng 2 bên dưới. Một test chẩn đoán có giá trị cao nếu test có độ nhạy cao, độ đặc hiệu cao, và giá trị tiên đoán dương cao. Độ hữu dụng của một test được đo lường tốt nhất bằng tỷ số khả dĩ (likelihood ratio). Bệnh (+) Bệnh (-) Test dương A b Test âm C d Chỉ tố Công thức Đánh giá câu hỏi Độ nhạy a / (a+c) Khả năng của test để xác (Sen) định người có bệnh? (test có thể xác định người có bệnh tốt đến mức nào) Độ đặc hiệu d / (b+d) Khả năng của test để xác (Sp) định người không bệnh? Giá trị tiên a / (a+b) Xác suất một người mắc đoán dương bệnh khi test dương? Giá trị tiên d / (c+d) Xác suất một người không đoán âm mắc bệnh khi test âm? Độ chính xác (a+d) / (a+b+c+d) Tỷ lệ kết quả chính xác (độ đúng) (đúng) của test Tỷ số khả dĩ Sen / (1-Sp) Với test dương, một người dương có khả năng mắc bệnh so với không mắc bệnh là bao nhiêu lần
- 104 K H Ó A T Ậ P H U Ấ N N G H I Ê N C Ứ U D Ị C H T Ễ H Ọ C Độ nhạy 1-Độ đặc hiệu Giá trị xác định ranh giới giữa kết quả âm và kết quả dương gọi là điểm cắt (cutoff point), cần cân nhắc lợi hại giữa độ nhạy và độ đặc hiệu. Bạn phải trọng lượng hóa tầm quan trọng tương đối của độ nhạy cũng như độ đặc hiệu. Nếu kết quả dương giả dẫn bệnh nhân đến một trị liệu rủi ro, thì nên xác định điểm cắt bằng cách tối đa hóa độ đặc hiệu. Nếu kết quả âm giả dẫn bệnh nhân đến chẩn đoán sai một bệnh nghiêm trọng có thể điều trị được, thì nên xác định điểm cắt bằng cách tối đa hóa độ nhạy. Một cách tiếp cận hệ thống khác để xác định điểm cắt là dùng đường cong ROC (receiver operator characteristic). Một hướng dẫn để tham khảo là, điểm cắt thích hợp nằm ở góc nơi mà đường cong ROC chuyển tiếp từ dạng dốc sang dạng nằm ngang Giá trị tiên đoán chỉ được xác định sau khi biết kết quả của test, và cũng được gọi là xác suất sau hay xác suất hậu nghiệm (post-test probability). Giá trị này bị chi phối bởi đặc tính của test (độ nhạy và độ đặc hiệu) và đặc tính của bệnh trong cộng đồng (tỷ lệ lưu hành bệnh). Giá trị tiên đoán dương phụ thuộc vào tỷ lệ lưu hành bệnh trong quần thể mà test đó được áp dụng. Trong thực hành lâm sàng, test càng đặc hiệu (tỷ lệ dương giả ít) cần cho bệnh hiếm (tỷ lệ lưu
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 10 5 hành thấp). Nếu không, khi test dương thì có khả năng là dương giả. Trái lại, khi bệnh phổ biến hơn (tỷ lệ lưu hành cao), nên chọn test có độ nhạy cao (tỷ lệ âm giả ít). Nếu không, khi test âm thì có khả năng là âm giả. Một test trở nên càng hữu dụng khi tỷ lệ lưu hành bệnh không quá cực đoan, nói chung từ 0,3 đến 0,7. Tỷ số khả dĩ là một đo lường có tính hữu dụng cao cho thấy những đặc tính của test tại nhiều điểm cắt khác nhau được chọn lựa. Tỷ số khả dĩ lớn hơn 1 chứng tỏ một test dương dễ xảy ra ở người có bệnh so với người không có bệnh. Nói cách khác, tỷ số khả dĩ lớn hơn 1 cho thấy kết quả test có liên hệ đến sự hiện diện của bệnh. Trái lại, tỷ số khả dĩ nhỏ hơn 1 cho thấy liên quan đến tình trạng không bệnh. Một test có tỷ số khả dĩ trên 10, hoặc dưới 0,1 được xem là bằng chứng mạnh mẽ để chẩn đoán xác định, hoặc loại trừ một bệnh. Khi áp dụng nhiều test chẩn đoán bệnh một cách độc lập, tỷ số khả dĩ chung được tính bằng cách nhân tất cả các tỷ số khả dĩ của các test khác nhau được áp dụng.
- 106 K H Ó A T Ậ P H U Ấ N N G H I Ê N C Ứ U D Ị C H T Ễ H Ọ C CHƯ Ơ N G 12 Sự không trung thực về học thuật Chihaya Koriyama, Nguyễn Thy Khuê Trách nhiệm và nghĩa vụ của những nhà khoa học chúng ta là nghiên cứu tìm hiểuự s thật. Chúng ta được trông đợi nỗ lực chân thành để tập trung vào chủ đề khoa học trong suốt quá trình nghiên cứu. Ở đây chúng tôi cố gắng cung cấp ba định nghĩa phổ quát về vi phạm đạo đức liên quan học thuật để làm tài liệu tham khảo bước đầu cho các bạn. 1. Ngụy tạo dữ liệu (Fabrication): hành động tạo ra một bảng dữ liệu không dựa trên bất kỳ một nghiên cứu, đo lường, thực nghiệm hay phương pháp nghiên cứu nào khác, 2. Gọt dũa dữ liệu hay Bóp méo dữ liệu (Falsification): hành động cố ý thay ổđ i bảng dữ liệu gốc theo xu hướng có lợi cho tác giả, 3. Đạo văn (Plagiarism): hành động trình bày các kết quả của người khác thành của mình một cách chủ ý mà không ghi lời cảm tạ thích hợp về nguồn dữ liệu/thông tin. Gần đây, tình trạng tự đạo văn, self-plagiarism (trình bày kết quả hay ý tưởng của chính mình trong các nghiên cứu đã công bố trước đó của mình) cũng là một mối quan ngại liên quan đến tác quyền của nhà xuất bản.
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 10 7 Bởi vì ban biên tập và ban bình duyệt rất khó phân biệt đâu là lỗi do sơ suất/không chủ đích (lỗi thực) với lỗi đạo văn hay gọt dũa dữ liệu, các tác giả được khuyên nên cẩn thận trong toàn bộ quá trình nghiên cứu. Nói một cách đơn giản, bất kỳ hình thức nào của sự lệch lạc có chủ ý vượt quá điều mà dữ liệu của bạn phản ánh cũng như việc lặp lại kết quả của người khác là không được chấp nhận. Theo nghĩa rộng, tất cả các mục dưới đây cũng được như là vi phạm đạo đức khoa học: 1. Trích dẫn tài liệu tham khảo thiếu sót hoặc không đúng 2. Hyperbole: Thổi phồng các kết quả nghiên cứu 3. Mô tả sai lệch các điểm mới của kết quả nghiên cứu 4. Công bố nhiều nơi: gửi cùng một dữ liệu/kết quả cho nhiều tập san khoa học có bình duyệt một lúc 5. Nguồn tác giả không minh bạch: Ủy ban quốc tể của các biên tập viên tập san y khoa (International Committee of Medical Journal Editors) đã tóm lược định nghĩa về tác giả và người đóng góp. Chi tiết xem tại: submission/authorship-contributorship Khi tiến hành một nghiên cứu, trách nhiệm của bạn là tránh các vi phạm đạo đức này, ngay cả khi sai sót này là vô tình. Khoa học chỉ có thể tiến bộ nếu các nhà nghiên cứu phản ánh sự liêm khiết và nếu kiến thức có được chỉ dựa trên các phương pháp đúng đắn khi trích xuất và diễn giải dữ liệu.
- 108 K H Ó A T Ậ P H U Ấ N N G H I Ê N C Ứ U D Ị C H T Ễ H Ọ C Danh mục tìm kiếm theo thuật ngữ bác bỏ, 95 hai đuôi, 95 bách phân vị, 92 hệ số phương sai, 92 bắt cặp, 46 hiệu chỉnh bằng thống kê, 48 bộ câu hỏi, 16 hồi cứu, 67 các đo lường tóm lược, 91 kết cục, 56 các đo lường vị trí, 92 khoảng dãn rộng, 91 câu lạc bộ đọc báo, 30 kiểm định giả thuyết thống kê, chọn mẫu ngẫu nhiên, 19 94 chọn mẫu thuận tiện, 20 một đuôi, 95 đánh giá có hệ thống các bài mù đôi, 84 báo khoa học, 30 ngẫu nhiên hóa, 83 đề cương nghiên cứu, 16 nghiên cứu cắt ngang, 53 dịch tễ học, 15 nghiên cứu đoàn hệ (cohort), điểm cắt, 103 66 độ chính xác (độ đúng), 102 nghiên cứu giống can thiệp, độ đặc hiệu, 102 85 độ lệch chuẩn, 91 nghiên cứu mô tả, 50 độ mạnh của một phép kiểm, nghiên cứu thử, 20 96 ngưỡng ý nghĩa thống kê, 96 độ nhạy, 102 nguy cơ quy trách trong quần độ tin cậy, 61 thể, 70 độ tự do, 99 nguy cơ quy trách, 70 đường cong ROC, 103 nguy cơ trong quần thể nhất giả dược, 85 định, 70 giả thuyết đảo, 94 nguy cơ tương đối, 69 giả thuyết không, 94 nguy cơ tuyệt đối, 70 giá trị ngoại suy, 58 nhiễu, 43 giá trị nội tại, 58 nhóm bệnh (ca bệnh), 74 giá trị tiên đoán âm, 102 nhóm chứng (ca chứng), 75 giá trị tiên đoán dương, 102 nhóm chứng bệnh viện, 75 giá trị z, 92 nhóm chứng cộng đồng, 75 giới hạn của nghiên cứu, 17 nhóm chứng hàng xóm, 75
- PHƯƠNG PHÁP NGHIÊN C Ứ U K H O A H Ọ C C Ơ B Ả N CHO BÁC SĨ LÂM SÀN G 10 9 phân nhóm dữ liệu, 90 tứ phân vị, 91 phân phối bình thường, 91 tỷ lệ (lưu hành) điểm, 62 phân tầng, 48 tỷ lệ (lưu hành) khoảng, 62 phân tích theo ý định điều trị, tỷ lệ theo dõi được đến khi 84 hoàn tất nghiên cứu, 68 phép kiểm chi bình phương, tỷ lệ tham gia, 20 99 tỷ số chênh, 78 phép kiểm Fisher's exact, 100 tỳ số khả dĩ dương, 102 phép kiểm Mann-Whitney, tỷ số khả dĩ, 102 101 tỷ số nguy cơ, 62 phép kiểm McNemar's, 100 ước lượng điểm, 93 phép kiểm Student's t, 101 ước lượng khoảng, 93 phương sai, 99 ước lượng, 92 sai lầm hệ thống, 36 xác suất hậu nghiệm, 103 sai lầm ngẫu nhiên, 36 xếp nhóm sai có phân biệt, 38 sai lệch do người lao động xếp nhóm sai không có phân khỏe mạnh hơn, 68 biệt, 38 sai lệch lựa chọn, 41 yếu tố phơi nhiễm (tiếp xúc), sai lệch nhớ lại, 43 73 sai lệch phát hiện, 42 yếu vị, 91 sinh thống kê, 15 sự thay đổi của mối liên hệ, 48 sự tuân thủ, 82 test chẩn đoán, 102 thiết kế nghiên cứu, 16 thời gian - người, 71 thống kê mô tả, 90 thư mục chú thích, 28 thử nghiêm ngẫu nhiên có đối chứng, 82 tiến cứu, 67 tiêu chí nhận vào và tiêu chí loại trừ, 74 tìm kiếm y văn, 15 tính giá trị, 61 tính khả thi, 20 trị số p, 94 trung bình, 91 trung vị, 91



