- reset +

Phân tích sai sót trong đo lường

Chúng tôi xin giới thiệu một mục mới trên statistics.vn về phân tích dữ liệu. Chúng tôi đặt tên là Q&A (hỏi và trả lời). Mỗi tuần, chúng tôi cố gắng post một câu hỏi và kèm theo câu trả lời, bằng cách dùng R để phân tích. Đây là câu hỏi thứ nhất liên quan đến việc đánh giá sự tương đồng giữa hai đo lường.

Thứ tư, 16 Tháng 5 2012 10:16  

Thư giãn cuối tuần (17)

Nói đến trung bình mà không nhắc đến phương sai thì hoặc là sai sót hoặc là để nói ...dối. Bức tranh sau trích từ quyển Biostatistics: A Methodology for the Health Sciences của Gerald van Belle và Lloyd D. Fisher là một minh họa khá sâu sắc.

Thứ bảy, 21 Tháng 4 2012 21:44  
 

Phương pháp tính “population attributable fraction”

clip_image002Khái niệm population attributable fraction (PAF) thường dùng để đánh giá tầm ảnh hưởng của một yếu tố nguy cơ. Tuy nhiên, phương pháp tính được giảng dạy trong sách giáo khoa thường đơn giản, và chỉ áp dụng cho các yếu tố nguy cơ chỉ có 2 giá trị (biến nhị phân). Trong bài này, tôi sẽ chỉ phương pháp ước tính PAF cho các biến phân loại có hơn 2 giá trị.

Thứ sáu, 20 Tháng 4 2012 10:51  
 

Nhân kỷ niệm 100 năm thảm họa Titanic: một ví dụ về phân tích dữ liệu định tính

Cách đây đúng 100 năm, ngày 15 tháng 4 năm 1912, con tàu “không thể đắm” Titanic bị chìm, mang theo sinh mệnh của hơn 1000 người. Dữ liệu về tử vong của thảm họa này là một dữ liệu đặc biệt của một sự kiện “natural” cực kỳ hiếm có. Bài này dùng nó để minh họa việc biểu diễn, phân tích dữ liệu định tính (phân loại) với R.

Thứ ba, 17 Tháng 4 2012 11:00  
 

Giới thiệu ggplot2: package vẽ đồ thị trong R.

Khi viết báo cáo khoa học, hoặc trong quá trình phân tích dữ liệu chúng ta cần phải vẽ biểu đồ. Trong R có nhiều package để giúp chúng ta làm việc này. Hôm nay, chúng tôi sẽ giới thiệu với bạn đọc một package rất hữu hiệu để vẽ biểu đồ, đó là ggplot2. Với ggplot2 chúng ta có thể vẽ những biểu đồ chất lượng cao dùng để công bố quốc tế, thậm chí với những biểu đồ rất chuyên biệt. ggplot2 được thiết kế làm việc theo kiểu nhiều lớp, bắt đầu với dữ liệu thô, sau đó tới những chú thích và thống kê tóm tắt.

Thứ hai, 19 Tháng 3 2012 09:49  
 

Kiểm định t (t-test)

Vấn đề. Các nhà nghiên cứu đo nồng độ cholesterol (mg/dl) ở hai nhóm cá nhân, phân biệt bằng cá tính. Tạm gọi là cá tính A và B. Mỗi nhóm có 20 cá nhân. Kết quả như sau:

Thứ năm, 01 Tháng 3 2012 16:08  
 

Phân tích mô tả bảng số liệu tần số (CrossTable)

imageĐứng trước dữ liệu thu thập từ một nghiên cứu, công việc đầu tiên đơn giản nhất, nhưng rất có ích, là xem xét sự phân bố của số liệu. Đối với các biến liên tục (continuous variables), việc xem xét phân bố số liệu có thể thể hiện qua các biểu đồ histogram. Nhưng đối với các biến phân nhóm (categorical variables) thì có hai cách làm: một là xem xét tần số, và hai là biểu đồ tần số (mosaic plot).

Thứ hai, 20 Tháng 2 2012 15:01  
 

Thư giãn cuối tuần (16)

 

Chủ nhật, 26 Tháng 2 2012 08:14  
 

Những sai sót phổ biến trong ước tính cỡ mẫu

Có thể nói rằng ước tính cỡ mẫu trong nghiên cứu y khoa ở nước ta là một vấn đề … nhức nhối. Nhức nhối là bởi vì rất nhiều nghiên cứu đã tính toán cỡ mẫu không phù hợp với mục tiêu nghiên cứu, thậm chí sai. Bài này sẽ minh hoạ vài trường hợp thực tế nhưng rất tiêu biểu …

Thứ năm, 16 Tháng 2 2012 10:26  
 

Phân tích mô tả với package mosaic

Trong R có (rất) nhiều package dùng cho nhiều phân tích khác nhau. Có package rất chuyên biệt, nhưng cũng có package có ích cho việc giảng dạy và học thống kê. Một trong những package đơn giản đó là mosaic mà tôi sẽ giới thiệu dưới đây.

Thứ ba, 14 Tháng 2 2012 08:39  
 

RStudio: Làm việc dễ hơn với R (Bài 2)


Tiếp theo bài 1, bài này chúng tôi giới thiệu cách làm việc với dữ liệu trong RStudio.

Thứ bảy, 11 Tháng 2 2012 14:39  
 

<< Bắt đầu < Trước 1 2 3 4 5 6 7 8 9 10 Sau > Cuối >>

Trang 1 trong tổng số 15