Trong thời gian ở VN tôi chú ý đến một trường hợp đau lòng, mà không có thì giờ viết vài hàng đóng góp ý kiến. Hôm nay, nhân ngày cuối tuần, tôi muốn nêu lại vấn đề liên quan đến một người đau khổ mà tôi chưa bao giờ gặp mặt và chưa quen biết.
Báo Tuổi trẻ ngày 14/12/2009 có một bài viết đáng chú ý về DNA. Câu chuyện có thể tóm lược như sau. Ông Nguyễn Văn Tho (người địa phương quen gọi là Tư Tho), quê quán ở xã Phú Kiết, huyện Chợ Gạo, tỉnh Tiền Giang, 47 tuổi, góa vợ từ năm 30 tuổi. Cách đây 12 năm, con gái ông lúc đó mới 15 tuổi có quan hệ với T, một thanh niên trong làng làm nghề tài xế xe tải. Kết quả của mối quan hệ này là một đứa bé. Gia đình bên T thoạt đầu đồng ý làm đám cưới nhưng sau đó thì không giữ lời hứa. Những gì xảy ra sau đó là một chuỗi sự việc buồn:
• Ngày 14/11/1998, Tư Tho bị bắt vì kết quả giám định DNA tại phân viện khoa học hình sự của Bộ Công an xác định ông Tư Tho là cha ruột của đứa trẻ với xác suất 99.97%.
• Ông Tư Tho kêu oan. Tổ chức giám định pháp y trung ương của Bộ Y tế làm xét nghiệm DNA thì thấy T là cha ruột đứa trẻ chứ không phải ông Tư Tho.
• Đến ngày 10/9/2001, Bộ công an lại làm giám định do Tiến sĩ Nguyễn Trọng Toàn làm chủ tịch, và kết luận rằng ông Tư Tho là cha ruột đứa bé với xác suất 99.999%. Ông Tư Tho bị phạt 3 năm tù giam.
• Đến tháng 7/2003, Tòa án phúc thẩm tối cao TPHCM tuyên án hủy hồ sơ vì quá trình lấy mẫu đã vi phạm qui định tố tụng.
• Tòa án tỉnh Tiền Giang không chịu kết luận của tòa án TPHCM nên lại đưa ông Tư Tho ra tòa và kết quả là ông bị phạt 3 năm tù.
• Không đầy 2 tháng sau, Tòa án phúc thẩm tối cao TPHCM lại tuyên bố hủy bỏ vụ án.
• Ngày 29/9/2005, công an tỉnh Tiền Giang lại cho xét nghiệm DNA (lần thứ 4) và Viện khoa học hình sự kết luận rằng ông Tư Tho là cha đứa bé với xác suất 99.997%. Dựa vào kết quả này tòa án Tiền Giang tuyên phạt ông Tư Tho 5 năm tù giam.
• Ông Tư Tho và con gái kêu oan. Ngày 24/8/2007, Tòa án phúc thẩm tối cao TPHCM lại tuyên bố hủy bỏ vụ án.
Câu chuyện đến đó, tôi không biết kết cục sự việc ra sao, vì bài báo không tường thuật thêm. (Báo chí VN thường rất chán, tường trình câu chuyện chẳng đến nơi đến chốn, cứ để lơ lửng như là nhà văn viết tiểu thuyết vậy). Tuy nhiên, câu chuyện nói lên sự nguy hiểm trong việc dựa vào DNA để kết tội. Trước đây, tôi cũng đã có một bình luận chung về vấn đề này và chỉ ra những sai sót trong suy luận mang tính “Prosecutor’s Fallacy” và những bất định trong việc xét nghiệm DNA. Tôi nghi ngờ rằng phía Bộ Công an đã sai lầm khi kết tội ông Tư Tho. Sai lầm này rất cổ điển mà giới luật sư và khoa học các nước phương Tây đã từng kinh qua.
Xác định quan hệ huyết thống qua xét nghiệm DNA là một việc làm cực kì khó khăn và phức tạp. Khó khăn và phức tạp là do sự kết hợp giữa hai lĩnh vực đòi hỏi chuyên môn rất cao: đó là di truyền học và toán thống kê. Cách làm đơn giản và cơ bản nhất là phân tích allele (biến thể gien) của nhiều gien từ người mẹ, đứa bé, và người tình nghi là cha. Sau đó là một loạt tính toán phức tạp để ước tính (chỉ có thể “ước tính” mà thôi) xác suất quan hệ huyết thống hay probability of paternity (POP).
Mỗi bước và qui trình trên đều có thể sai sót. Nếu sai sót xảy ra từ bước thứ nhất thì tất cả các kết quả và thông tin hai bước sau trở thành vô nghĩa, và bằng chứng không được chấp nhận trước tòa. Đặc biệt là trong bước một, kết quả xét nghiệm DNA có thể sai sót về kĩ thuật như enzyme có vấn đề, hoặc mẫu máu bị nhiễm hay hư hỏng, hoặc nồng độ muối [dùng cho phân tích DNA] bất bình thường, hoặc do lẫn lộn mẫu máu, hoặc đơn giản do sai sót của kĩ thuật viên. Rất khó biết tỉ lệ sai sót trong bước một là bao nhiêu (vì ít ai chịu công bố sai sót kĩ thuật!), nhưng kinh nghiệm của người viết bài này thì tỉ lệ sai sót có thể dao động từ 1 đến 5%. Ở Mĩ, qua tái thẩm định 75 báo cáo trùng hợp hồ sơ DNA, người ta phát hiện 3 sai sót trong bước 1, tức tỉ lệ 4%.
Ước tính xác suất POP khá phức tạp, và có khi phải có sự hỗ trợ của chuyên gia toán thống kê. Chúng ta biết rằng 50% biến thể gien của đứa trẻ được di truyền từ cha, và 50% từ mẹ. Thông thường, một số gien hay loci được phân tích để tăng cao xác suất POP. Mỗi gien có 2 hay nhiều biến thể gien (allele), và 2 biến thể gien này kết hợp thành dạng gien (genotype). Trong xét nghiệm xác định quan hệ huyết thống, biến thể gien của đứa trẻ được so sánh với mẹ và “cha” để xác định xem một biến thể đó xuất phát từ mẹ hay “cha”. Chẳng hạn như nếu đứa bé có dạng gien AB, và người mẹ có dạng gien AC, thì có thể xác định rằng biến thể A đến người mẹ, và biến thể B xuất phát từ người “cha”. Do đó, nếu người “cha” không có biến thể B thì chắc chắn không phải là cha đứa bé (với giả định rằng không có mutation hay đột biến gien).
Trong trường hợp không thể loại trừ khả năng người đàn ông là cha, thì câu hỏi kế tiếp là xác suất mà một người đàn ông chọn ngẫu nhiên từ cộng đồng dân số có hồ sơ DNA (qua biến thể gien) trùng hợp với đứa bé là bao nhiêu? Thông thường, người ta phải xét nghiệm nhiều gien chứ không phải chỉ 1 gien. Bao nhiêu là đủ? Khó có câu trả lời, nhưng ở Mĩ người ta thường xét nghiệm 9-15 gien. Trong ví dụ trên, tôi dùng A, B, C để kí hiệu biến thể gien, nhưng trong thực tế vì có nhiều gien nên các chuyên gia thường sử dụng mã số từ các microsatellite markers (như 9, 17, 21, v.v…) để nhận dạng biến thể gien.
Đầu tiên là tính “chỉ số cha” (paternity index hay PI). Chỉ số này được tính cho mỗi gien với công thức: PI = X / Y, trong đó X là xác suất mà người đàn ông truyền biến thể gien đến đứa bé, Y là xác suất mà một người đàn ông khác chọn ngẫu nhiên từ cộng đồng truyền biến thể đó cho đứa bé. X = 1 nếu người “cha” có dạng gien homozygous (tức AA hay BB), và X = 0.5 nếu người “cha” có dạng gien heterozygous (như AB). Còn Y có thể ước tính từ tần số biến thể gien trong cộng đồng.
Để minh họa cho vấn đề, tôi lấy một ví dụ trong y văn như sau. Trong trường hợp này các chuyên gia phân tích 9 markers của người mẹ, đứa bé, và người đàn ông bị tình nghi là cha. Cột sau cùng là biến thể gien cần tìm hiểu. Chẳng hạn như với marker D81179, đứa bé có dạng gien 13/14 và người đàn ông là 13/15, cho nên biến thể cần tìm hiểu là 13. Đối với marker FGA, dạng gien của người đàn ông là 21/21, tức là homozyygous.
Bước kế tiếp là xác định tần số biến thể gien cần tìm hiểu trong cộng đồng. Để có những số liệu này cần phải làm nghiên cứu rất khó khăn. Số liệu về tần số biến thể gien trong cộng đồng ở Mĩ là như sau:
Dựa vào những tần số này, chúng ta có thể ước tính PI như sau. Chẳng hạn như với marker D8179, người đàn ông có dạng gien 13/15 (tức heterozygous), nên X là 0.5, và tần số biến thể 13 xuất hiện trong cộng đồng là 0.308; do đó, PI = 0.5 / 0.308 = 1.62. Riêng đối với marker FGA thì PI = 1 / 0.176 = 5.68 vì người đàn ông có dạng gien homozygous:
Từ đó, chỉ số tích lũy PI, gọi tắt là CPI là:
CPI = 1.62 x 12.2 x 4.0 x 3.6 x 2.28 x 5.68 x 1.4 x 1.82 x 2.9 = 27,234.
Bước kế tiếp là áp dụng định lí xác suất Bayes để ước tính POP. Xác suất POP thực ra được ước tính dựa vào công thức:
POP = CPI / (CPI + (1 – prior probability)),
trong đó “1 – probability” là “xác suất tình nghi”, tức là trước khi có kết quả xét nghiệm, xác suất mà người đàn ông là cha đứa bé. Xác suất này thường được ước tính là 0.5 (50%), nhưng đây là một sai lầm nghiêm trọng. Giả dụ như probability là 0.5, số liệu trên cho phép chúng ta ước tính POP như sau:
POP = 27234 / (27234 + (1-0.5)*100) = 99.99%.
Bây giờ, quay lại trường hợp ông Tư Tho, có nhiều câu hỏi đặt ra:
1. Qui trình lấy mẫu máu như thế nào, nhiệt độ bảo quản là bao nhiêu, lab phân tích DNA được các hiệp hội sinh hóa quốc tế công nhận chưa? Tỉ lệ sau sót trong phân tích DNA là bao nhiêu?
2. Những gien hay markers mà các trung tâm của Bộ Công an và Bộ Y tế phân tích là những gien hay markers nào? Sử dụng SNP hay là microsatellite? Hai cách chọn này có ảnh hưởng lớn đến kết quả.
3. Tần số biến thể của các gien này trong cộng đồng được ước tính ra sao? Theo tôi biết ở VN rất ít làm nghiên cứu về gien, vậy thì tần số của những gien đó đến từ đâu, sắc dân nào, ai làm, và đã công bố trên tập san khoa học nào? Không có những con số này, tất cả tính toán đều vô nghĩa.
4. Phương pháp tính POP của Bộ Công an và Bộ Y tế cần phải minh bạch hóa. Phương pháp tính cụ thể là gì, và những giả định đằng sau của cách tính là gì. Đây là vấn đề cực kì quan trọng, vì Viện khoa học hình sự kết luận rằng ông Tư Tho là cha đứa bé với xác suất 99.997%.
Đây là những câu hỏi rất quan trọng và có liên quan đến bản án dành cho ông Tư Tho. Sự thật là có khác biệt về kết quả phân tích giữa Bộ Y tế và Bộ Công an, và điều này nói lên vấn đề kĩ thuật. Do đó, vấn đề nằm ở khâu kĩ thuật và phương pháp, kể cả phương pháp tính toán. Những gì tôi trình bày trên đây cực kì cơ bản và có tính cách minh họa; trong thực tế cách tính toán phức tạp hơn nhiều và đòi hỏi phải có chương trình máy tính hỗ trợ. Ngay cả cách tính PI cũng phải hết sức cẩn thận vì có thể sai lầm như mô tả trong bài báo từ thập niên 1980s (CC Li, et al. Basic fallacies in the formulation of the Paternity Index. Am J Hum Gent 1985;37:809-18). Một phương pháp ước tính khác tốt hơn là do một “tổ sư” di truyền học đề nghị vào năm 1986 (RC Elston, Probability and Paternity Testing. Am J Hum Gent 1986; 39:112-122) nhưng khá phức tạp nên tôi không mô tả ở đây. Điểm chính cần biết là: ước tính PI và POP không dễ chút nào. Nhất là ở đây, trong trường hợp người cha tình nghi lại là ông ngoại, thì việc tính toán phức tạp hơn. Không biết những chuyên gia pháp y trong Bộ Công an và Bộ Y tế tính toán như thế nào. Phương pháp này cần phải minh bạch hóa để người khác có thể bình luận.
Nhưng nếu sai sót trong khâu phân tích DNA hay trước đó là các lấy và bảo quản mẫu máu, dù có máy tính đi nữa thì kết quả vẫn sai sót nghiêm trọng. Trong quá khứ đã có nhiều (rất nhiều) trường hợp mà công lí bị sai lầm nghiêm trọng chỉ vì sai lầm về cách phân tích và diển giải DNA. Do đó, kết án một người nào đó dựa trên DNA cần phải hết sức thận trọng. Nếu không chắc ăn, cách tốt nhất là chờ và tham vấn chuyên gia, kể cả chuyên gia nước ngoài. Tôi nghĩ không nên kết tội ông Tư Tho khi những bằng chứng về DNA vẫn còn bất định. Trong bối cảnh thiếu nghiên cứu khoa học như ở VN thì việc kết tội ông ấy là quá vội vàng.
Nguồn: Blog của GS Nguyễn Văn Tuấn