Vắng mặt bằng chứng là bằng chứng của sự vắng mặt

Eliezer Yudkowsky

Từ cuốn sách Rational Choice in an Uncertain World (Lựa chọn hợp lý trong một thế giới không chắc chắn) của Robyn Dawes:

Trên thực tế, việc điều chỉnh bằng chứng sau khi giả thuyết đã được đưa ra đã xảy ra trong một thời kỳ đen tối nhất trong lịch sử Hoa Kỳ: việc giam giữ người Mỹ gốc Nhật vào đầu Thế chiến thứ hai. Khi Thống đốc California Earl Warren điều trần trước Quốc hội tại San Francisco vào ngày 21 tháng 2 năm 1942, một người đặt câu hỏi đã chỉ ra rằng cho đến thời điểm đó, người Mỹ gốc Nhật chưa từng có hành vi phá hoại hay gián điệp nào. Warren trả lời: “Tôi cho rằng sự thiếu vắng [hoạt động phá hoại] này là dấu hiệu đáng lo ngại nhất trong tình hình hiện tại. Điều này thuyết phục tôi hơn bất kỳ yếu tố nào khác rằng các hành vi phá hoại mà chúng ta sẽ phải đối mặt, các hoạt động của Đội quân thứ Năm, đều được lên kế hoạch một cách có chủ đích, giống như vụ tấn công Trân Châu Cảng... Tôi tin rằng chúng ta đang bị ru ngủ bởi một cảm giác an toàn giả tạo.”

Hãy xem xét lập luận của Warren từ góc độ Bayesian. Khi chúng ta thấy bằng chứng, các giả thuyết gán tỷ lệ cao hơn cho bằng chứng đó sẽ có xác suất cao hơn, trong khi các giả thuyết gán tỷ lệ thấp hơn cho bằng chứng đó sẽ có xác suất thấp hơn. Đây là hiện tượng của tỷ lệ tương đối và xác suất tương đối. Bạn có thể gán tỷ lệ cao cho bằng chứng nhưng vẫn giảm xác suất cho một giả thuyết khác, nếu giả thuyết đó gán tỷ lệ thậm chí còn cao hơn.

Warren dường như đang lập luận rằng, do chúng ta không thấy có hành vi phá hoại, điều này xác nhận rằng có sự tồn tại của Đội quân thứ Năm. Bạn có thể lập luận rằng Đội quân thứ Năm có thể trì hoãn hành vi phá hoại của mình. Nhưng khả năng không có Đội quân thứ Năm sẽ không có hành vi phá hoại vẫn cao hơn.

Hãy để E là quan sát về hành vi phá hoại, và ¬E là quan sát về việc không có hành vi phá hoại. Ký hiệu H1 là giả thuyết về Đội quân thứ Năm Nhật-Mỹ, và H2 là giả thuyết rằng Đội quân thứ Năm không tồn tại. Xác suất có điều kiện P(E | H), hoặc “E với H”, là mức độ tin tưởng mà chúng ta mong đợi sẽ thấy bằng chứng E nếu giả định giả thuyết H là đúng.

Dù khả năng Đội quân thứ Năm không thực hiện phá hoại là bao nhiêu, xác suất P(¬E | H1), nó sẽ không lớn bằng khả năng không có phá hoại với điều kiện không có Đội quân thứ Năm, xác suất P(¬E | H2). Vì vậy, quan sát thấy không có phá hoại làm tăng xác suất rằng Đội quân thứ Năm không tồn tại.

Việc không có hành động phá hoại không chứng minh rằng Đội quân thứ Năm không tồn tại. Sự vắng mặt của bằng chứng không phải là bằng chứng của sự vắng mặt. Trong logic, (A ⇒ B), đọc là “A hàm ý B”, không tương đương với (¬A ⇒ ¬B), đọc là “không-A hàm ý không-B”.

Nhưng trong lý thuyết xác suất, sự vắng mặt của bằng chứng luôn là bằng chứng của sự vắng mặt. Nếu E là một sự kiện nhị phân và P(H | E) > P(H), tức là quan sát E làm tăng xác suất của H, thì P(H | ¬E) < P(H), tức là không quan sát E làm giảm xác suất của H. Xác suất P(H) là sự pha trộn có trọng số của P(H | E) và P(H | ¬E), và luôn nằm giữa hai giá trị đó.1

Trong hầu hết các tình huống thực tế, một nguyên nhân có thể không tạo ra các dấu hiệu của chính nó một cách đáng tin cậy, nhưng sự vắng mặt của nguyên nhân thậm chí còn ít khả năng tạo ra các dấu hiệu đó hơn. Sự vắng mặt của một quan sát có thể là bằng chứng mạnh mẽ về sự vắng mặt hoặc bằng chứng rất yếu về sự vắng mặt, tùy thuộc vào việc nguyên nhân có khả năng tạo ra quan sát đó đến mức nào. Sự vắng mặt của một quan sát chỉ được phép một cách yếu (ngay cả khi giả thuyết thay thế không cho phép nó) là bằng chứng rất yếu về sự vắng mặt (mặc dù nó vẫn là bằng chứng). Đây là sai lầm của "khoảng trống trong hồ sơ hóa thạch" — hóa thạch chỉ hình thành hiếm hoi; việc khoe khoang về sự vắng mặt của một quan sát chỉ được phép một cách yếu là vô nghĩa khi đã có nhiều quan sát tích cực mạnh mẽ được ghi nhận. Nhưng nếu không có bất kỳ quan sát tích cực nào, thì đó là lúc cần lo lắng; do đó mới có nghịch lý Fermi.

Sức mạnh của bạn với tư cách là một người duy lý là khả năng của bạn bị hư cấu làm cho bối rối hơn là thực tế; nếu bạn giỏi giải thích bất kỳ kết quả nào như nhau, thì bạn không có kiến thức gì cả. Sức mạnh của một mô hình không phải là những gì nó có thể giải thích, mà là những gì nó không thể giải thích, vì chỉ có những điều cấm đoán mới hạn chế sự dự đoán. Nếu bạn không nhận ra khi mô hình của bạn làm cho bằng chứng khó xảy ra, bạn thà không có mô hình còn hơn, và bạn cũng thà không có bằng chứng; không có não và không có mắt.

Nếu bất kỳ điều nào trong số này nghe có vẻ khó hiểu, hãy xem phần thảo luận của tôi về cập nhật Bayesian ở phần cuối của The Machine in the Ghost, tập thứ ba của Rationality: From AI to Zombies.
Bài tiếp theo

Bảo tồn bằng chứng dự kiến

Tiếp tục đọc