Cần bao nhiêu bằng chứng?

Eliezer Yudkowsky

Trong bài trước, tôi đã định nghĩa bằng chứng là “một sự kiện vướng mắc, bằng các mối liên hệ nhân quả, với bất cứ điều gì bạn muốn biết” và vướng mắc là “xảy ra khác nhau đối với các trạng thái khác nhau có thể xảy ra của đối tượng”. Vậy thì cần bao nhiêu vướng mắc — bao nhiêu bằng chứng duy lý — để hỗ trợ một niềm tin?

Hãy bắt đầu với một câu hỏi đơn giản đủ để có thể tính toán: Bạn phải vướng mắc với xổ số đến mức nào để có thể trúng thưởng? Giả sử có 70 quả bóng, được rút ra mà không được thay thế, và có 6 số phải trùng để trúng thưởng. Khi đó, có 131.115.985 tổ hợp có thể trúng thưởng, do đó, một vé được chọn ngẫu nhiên sẽ có xác suất trúng thưởng là 1/131.115.985 (0,0000007%). Để trúng xổ số, bạn cần bằng chứng đủ chọn lọc để ủng hộ một tổ hợp hơn 131.115.984 tổ hợp khác.

Giả sử có một số thử nghiệm bạn có thể thực hiện để phân biệt, theo xác suất, giữa các số trúng và không trúng xổ số. Ví dụ, bạn có thể nhập một tổ hợp vào một hộp nhỏ màu đen luôn phát ra tiếng bíp nếu tổ hợp đó là tổ hợp trúng thưởng, và chỉ có 1/4 (25%) cơ hội phát ra tiếng bíp nếu tổ hợp đó sai. Theo thuật ngữ Bayesian, chúng ta sẽ nói rằng tỷ lệ khả nănglà 4 trên 1. Điều này có nghĩa là hộp có khả năng phát ra tiếng bíp gấp 4 lần khi chúng ta nhập tổ hợp chính xác, so với khả năng phát ra tiếng bíp khi nhập tổ hợp sai.

Vẫn còn rất nhiều tổ hợp có thể xảy ra. Nếu bạn nhập 20 tổ hợp sai, hộp sẽ phát ra tiếng bíp ở 5 tổ hợp trong số đó (trung bình). Nếu bạn nhập tất cả 131.115.985 tổ hợp có thể, thì mặc dù hộp chắc chắn sẽ phát ra tiếng bíp cho một tổ hợp chiến thắng, nhưng nó cũng sẽ phát ra tiếng bíp cho 32.778.996 tổ hợp thua (trung bình).

Vì vậy, hộp này không cho phép bạn trúng xổ số, nhưng vẫn tốt hơn là không có gì. Nếu bạn sử dụng hộp này, tỷ lệ trúng thưởng của bạn sẽ tăng từ 1 trên 131.115.985 lên 1 trên 32.778.997. Bạn đã đạt được một số tiến bộ trong việc tìm kiếm mục tiêu, sự thật, trong không gian khả năng vô cùng rộng lớn.

Giả sử bạn có thể sử dụng một hộp đen khác để kiểm tra các tổ hợp hai lần, độc lập với nhau. Cả hai hộp chắc chắn sẽ phát ra tiếng bíp cho vé trúng thưởng. Nhưng xác suất một hộp phát ra tiếng bíp cho tổ hợp thua là 1/4 độc lập cho mỗi hộp; do đó, xác suất cả hai hộp phát ra tiếng bíp cho tổ hợp thua là 1/16. Chúng ta có thể nói rằng bằng chứng tích lũycủa hai thử nghiệm độc lập có tỷ lệ xác suất là 16:1. Số vé số thua vượt qua cả hai thử nghiệm sẽ là (trung bình) 8.194.749.

Vì có 131.115.985 vé số có thể trúng thưởng, bạn có thể đoán rằng bạn cần bằng chứng có sức mạnh khoảng 131.115.985 so với 1 — một sự kiện hoặc một chuỗi sự kiện có khả năng xảy ra 131.115.985 lần cao hơn so với tổ hợp thua. Trên thực tế, số lượng bằng chứng này chỉ đủ để mang lại cho bạn 50% cơ hội trúng xổ số. Tại sao? Bởi vì nếu bạn áp dụng bộ lọc có sức mạnh như vậy cho 131 triệu vé thua, trung bình sẽ có một vé thua vượt qua bộ lọc. Vé trúng thưởng cũng sẽ vượt qua bộ lọc. Vì vậy, bạn sẽ còn lại hai vé vượt qua bộ lọc, chỉ một trong số đó là vé trúng thưởng. Tỷ lệ thắng là 50%, nếu bạn chỉ có thể mua một vé.

Một cách tốt hơn để nhìn nhận vấn đề: Ban đầu, có 1 vé trúng thưởng và 131.115.984 vé thua, vì vậy tỷ lệ thắng của bạn là 1:131.115.984. Nếu bạn sử dụng một hộp duy nhất, tỷ lệ phát ra tiếng bíp là 1 cho vé trúng thưởng và 0,25 cho vé không trúng thưởng. Vì vậy, chúng ta nhân 1:131.115.984 với 1:0,25 và nhận được 1:32.778.996. Thêm một hộp bằng chứng nữa sẽ nhân tỷ lệ này với 1:0,25 một lần nữa, nên bây giờ tỷ lệ là 1 vé trúng thưởng trên 8.194.749 vé thua.

Việc đo lường bằng chứng bằng bit khá thuận tiện—không phải bit trên ổ cứng, mà là bit của nhà toán học, đây là hai khái niệm khác nhau. Bit của nhà toán học là logarithm cơ số 1/2 của xác suất. Ví dụ, nếu có bốn kết quả có thể xảy ra là A, B, C và D, với xác suất lần lượt là 50%, 25%, 12,5% và 12,5%, và tôi nói với bạn kết quả là “D”, thì tôi đã truyền ba bit thông tin cho bạn, vì tôi đã thông báo cho bạn kết quả có xác suất là 1/8.

Thật trùng hợp, 131.115.984 là một số nhỏ hơn một chút so với 2 mũ 27. Vậy 14 hộp hoặc 28 bit bằng chứng — một sự kiện có xác suất xảy ra cao hơn 268.435.456 lần nếu giả thuyết vé là đúng so với khi nó sai — sẽ làm thay đổi tỷ lệ từ 1:131.115.984 thành 268.435.456:131,115.984, giảm xuống còn 2:1. Tỷ lệ 2:1 có nghĩa là có hai cơ hội thắng cho mỗi cơ hội thua, vì vậy xác suất thắng với 28 bit bằng chứng là 2/3. Thêm một hộp nữa, tức là thêm 2 bit bằng chứng, sẽ đưa tỷ lệ lên 8:1. Thêm hai hộp nữa sẽ đưa cơ hội thắng lên 128:1.

Vì vậy, nếu bạn muốn cấp phép cho một niềm tin mạnh mẽ rằng bạn sẽ trúng xổ số — được định nghĩa tùy ý là xác suất sai dưới 1% — thì 34 bit bằng chứng về tổ hợp chiến thắng là đủ.

Nói chung, các quy tắc để cân nhắc “cần bao nhiêu bằng chứng” theo một mô hình tương tự: Không gian khả năng của giả thuyết càng lớn, hoặc giả thuyết đó càng có vẻ không thể xảy ra so với các giả thuyết khác, hoặc bạn càng muốn chắc chắn, thì bạn càng cần nhiều bằng chứng.

Bạn không thể phá vỡ quy tắc; bạn không thể hình thành niềm tin chính xác dựa trên bằng chứng không đầy đủ. Giả sử bạn có 10 hộp xếp thành một hàng và bạn bắt đầu nhập các tổ hợp vào các hộp. Bạn không thể dừng lại ở tổ hợp đầu tiên phát ra tiếng bíp từ cả 10 hộp và nói: “Nhưng tỷ lệ xảy ra tổ hợp thua là một triệu phần một! Tôi sẽ bỏ qua những quy tắc Bayesian trên lý thuyết và dừng lại ở đây.” Trung bình, cứ mỗi người thắng sẽ có 131 vé thua vượt qua bài kiểm tra như vậy. Xem xét không gian khả năng và xác suất trước đó, bạn đã đưa ra kết luận quá mạnh mẽ dựa trên bằng chứng thiếu thốn. Đó không phải là quy định quan liêu vô nghĩa, mà là toán học.

Tất nhiên, bạn vẫn có thể tin dựa trên bằng chứng không đầy đủ, nếu đó là ý thích của bạn; nhưng bạn sẽ không thể tin một cách chính xác. Điều đó giống như cố gắng lái xe mà không có nhiên liệu, vì bạn không tin vào khái niệm cổ hủ rằng cần phải có nhiên liệu để đi đến nơi. Sẽ không vui hơn và tiết kiệm hơn rất nhiều nếu chúng ta quyết định bãi bỏ luật quy định xe hơi cần nhiên liệu?

Vâng, bạn có thể thử. Bạn thậm chí có thể nhắm mắt lại và giả vờ xe đang chạy. Nhưng để thực sự đạt được niềm tin chính xác, bạn cần bằng chứng - nhiên liệu, và nếu bạn muốn đi xa hơn, bạn cần nhiều nhiên liệu hơn.

Bài tiếp theo

Vắng mặt bằng chứng là bằng chứng của sự vắng mặt

Tiếp tục đọc