Luận điểm loại trừ Uy tín

Eliezer Yudkowsky

Tình huống 1: Barry là một nhà địa chất nổi tiếng. Charles là một thiếu niên phạm pháp 14 tuổi có tiền án tiền sự dài dằng dặc và thỉnh thoảng có những cơn rối loạn tâm thần. Barry khẳng định một cách dứt khoát với Arthur một số tuyên bố trái lẽ thường về đá, và Arthur đánh giá khả năng đúng của tuyên bố đó là 90%. Sau đó, Charles đưa ra một khẳng định trái lẽ thường tương tự về đá, và Arthur đánh giá nó có 10% khả năng đúng. Rõ ràng, Arthur đã xem xét thẩm quyềncủa người nói khi quyết định có tin vào khẳng định của họ hay không.

Tình huống 2: David đưa ra một tuyên bố trái logic về vật lý và giải thích chi tiết các lập luận, bao gồm cả các nguồn tham khảo. Ernie đưa ra một tuyên bố trái logic tương tự, nhưng lập luận của anh ta không thuyết phục và dựa trên nhiều giả định không có cơ sở. Cả David và Ernie đều khẳng định rằng đây là giải thích tốt nhất mà họ có thể đưa ra (cho bất kỳ ai, không chỉ Arthur). Arthur gán xác suất 90% cho phát biểu của David sau khi nghe giải thích, nhưng gán xác suất 10% cho phát biểu của Ernie.

Có thể thấy hai tình huống này dường như đối xứng: cả hai đều xem xét bằng chứng hữu ích, dù là uy tín mạnh so với yếu, hay lập luận mạnh so với yếu.

Nhưng giờ giả sử Arthur yêu cầu Barry và Charles đưa ra lập luận kỹ thuật đầy đủ, kèm theo nguồn tham khảo; và Barry và Charles trình bày các lập luận ngang nhau, Arthur kiểm tra các nguồn tham khảo và chúng đều chính xác. Sau đó Arthur yêu cầu David và Ernie cung cấp lý lịch, và hóa ra David và Ernie có lý lịch tương đương nhau—có thể cả hai đều là hề, có thể cả hai đều là nhà vật lý.

Giả sử Arthur có đủ kiến thức để hiểu tất cả các lập luận kỹ thuật — nếu không thì chúng chỉ là những âm thanh ấn tượng — có vẻ như Arthur nên coi David có lợi thế lớn hơn Ernie về tính khả thi, trong khi Barry chỉ có lợi thế nhỏ hơn Charles.

Thật vậy, nếu các lập luận kỹ thuật đủ tốt, lợi thế của Barry so với Charles có thể không đáng để theo dõi. Một lập luận kỹ thuật tốt là lập luận loại bỏ sự phụ thuộc vào uy tín cá nhân của người nói.

Tương tự, nếu chúng ta thực sự tin rằng Ernie đã đưa ra lập luận tốt nhất mà anh ta có thể đưa ra, bao gồm tất cả các bước suy luận mà Ernie đã thực hiện, và tất cả các bằng chứng mà Ernie đã xem xét—bao gồm cả các nguồn tham khảo mà Ernie có thể đã nghe—thì chúng ta có thể bỏ qua hầu hết thông tin về trình độ của Ernie. Ernie có thể là một nhà vật lý học hoặc một diễn viên xiếc, điều đó không quan trọng. (Lại một lần nữa, điều này giả định rằng chúng ta có đủ khả năng kỹ thuật để xử lý lập luận. Nếu không, Ernie chỉ đang phát ra những âm tiết huyền bí, và việc chúng ta “tin” vào những âm tiết đó phụ thuộc rất nhiều vào uy tín của anh ta.)

Vậy có vẻ như có sự bất đối xứng giữa lập luận và uy tín. Nếu chúng ta biết uy tín, chúng ta vẫn quan tâm đến việc nghe lập luận; nhưng nếu chúng ta đã hiểu rõ lập luận, chúng ta còn rất ít điều để học hỏi từ uy tín.

Rõ ràng (theo quan điểm của người mới) sự uy tín và lập luận là hai loại bằng chứng cơ bản khác nhau, một sự khác biệt không thể giải thích được trong các phương pháp nhàm chán và rõ ràng của lý thuyết xác suất Bayesian.1 Bởi vì mặc dù sức mạnh của các bằng chứng — 90% so với 10% — là như nhau trong cả hai trường hợp, nhưng chúng không hoạt động giống nhau khi được tổ hợp. Làm thế nào để giải thích điều này?

Dưới đây là một nửa minh họa kỹ thuật về cách thể hiện sự khác biệt này trong lý thuyết xác suất. (Phần còn lại bạn có thể tin vào uy tín cá nhân của tôi hoặc tra cứu trong các tài liệu tham khảo.)

Nếu P(H|E1) = 90% và P(H|E2) = 9%, thì xác suất P(H|E1,E2) là bao nhiêu? Nếu biết E1 là đúng dẫn chúng ta đến việc gán 90% xác suất cho H, và biết E2 là đúng dẫn chúng ta đến việc gán 9% xác suất cho H, thì chúng ta nên gán xác suất nào cho H nếu biết cả E1 và E2? Đây không phải là điều bạn có thể tính toán trong lý thuyết xác suất từ thông tin được cung cấp. Không, thông tin còn thiếu không phải là xác suất trước của H. Các sự kiện E1 và E2 có thể không độc lập với nhau.

Giả sử H là “Lối đi của tôi trơn trượt”, E1 là “Hệ thống tưới nước đang hoạt động”, và E2 là “Đang là ban đêm”. Lối đi trở nên trơn trượt bắt đầu sau một phút kể từ khi hệ thống tưới nước bắt đầu hoạt động, cho đến ngay sau khi hệ thống tưới nước ngừng hoạt động, và hệ thống tưới nước hoạt động trong mười phút. Vì vậy, nếu chúng ta biết hệ thống tưới nước đang hoạt động, xác suất lối đi trơn trượt là 90%. Vòi phun nước hoạt động trong 10% thời gian ban đêm, vì vậy nếu biết rằng đang là ban đêm, xác suất vỉa hè trơn trượt là 9%. Nếu biết rằng đang là ban đêm và vòi phun nước đang hoạt động—tức là biết cả hai sự kiện—xác suất vỉa hè trơn trượt là 90%.

Chúng ta có thể biểu diễn điều này trong một mô hình đồ họa như sau:

Mô hình về việc Ban đêm gây ra việc hệ thống Phun nước bật hay tắt, và việc hệ thống Phun nước bật gây ra vỉa hè Trơn trượt hay Không Trơn trượt.

Hướng của các mũi tên có ý nghĩa. Ví dụ, nếu chúng ta có:

Điều này có nghĩa là, nếu tôi không biết gì về hệ thống phun nước, xác suất của "Ban đêm" và "Trơn trượt" sẽ độc lập với nhau. Ví dụ, giả sử tôi tung Xúc xắc Một và Xúc xắc Hai, sau đó cộng các số hiển thị để được Tổng:

Nếu bạn không cho tôi biết tổng của hai con số và bạn cho tôi biết con xúc xắc đầu tiên hiển thị số 6, thì điều này vẫn chưa cho tôi biết gì về kết quả của con xúc xắc thứ hai. Nhưng nếu bây giờ bạn cũng cho tôi biết tổng là 7, thì tôi biết con xúc xắc thứ hai hiển thị số 1.

Việc tìm ra khi nào các thông tin khác nhau phụ thuộc hoặc độc lập với nhau, dựa trên các kiến thức nền tảng khác nhau, thực sự trở thành một chủ đề khá kỹ thuật. Các cuốn sách nên đọc là Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference và Causality: Models, Reasoning, and Inference của Judea Pearl. (Nếu bạn chỉ có thời gian đọc một cuốn, hãy đọc cuốn đầu tiên.)

Nếu bạn biết cách đọc đồ thị nhân quả, thì bạn sẽ nhìn vào đồ thị xúc xắc và ngay lập tức thấy:

P(Xúc xắc 1, Xúc xắc 2) = P(Xúc xắc 1) ✕ P(Xúc xắc 2)

P(Xúc xắc 1, Xúc xắc 2|Tổng) ≠ P(Xúc xắc 1)|Tổng) ✕ P(Xúc xắc 2|Tổng) .

Nếu bạn nhìn vào sơ đồ vỉa hè chính xác, bạn sẽ thấy những sự thật như:

P(Trơn trượt|Đêm) ≠ P(Trơn trượt)

P(Trơn trượt|Vòi phun nước) ≠ P(Trơn trượt)

P(Trơn trượt|Đêm,Vòi phun nước) = P(Trơn trượt|Vòi phun nước) .

Tức là, xác suất vỉa hè trơn trượt, cho biết thông tin về hệ thống phun nước và thời gian ban đêm, là xác suất tương tự mà chúng ta sẽ gán nếu chỉ biết về hệ thống phun nước. Thông tin về hệ thống phun nước đã làm cho thông tin về thời gian ban đêm trở nên không liên quan đến việc suy luận về độ trơn trượt.

Điều này được gọi là loại trừ, và tiêu chí cho phép chúng ta đọc các sự độc lập điều kiện này từ đồ thị nhân quả được gọi là D-separation.

Trong trường hợp lập luận và quyền uy, đồ thị nhân quả trông như sau:

Nếu một điều là sự thật, thì nó có xu hướng có những luận điểm ủng hộ nó, và do đó các chuyên gia quan sát những bằng chứng này và thay đổi ý kiến của họ. (Theo lý thuyết!)

Nếu chúng ta thấy một chuyên gia tin vào điều gì đó, chúng ta suy luận ngược lại về sự tồn tại của bằng chứng trừu tượng (mặc dù chúng ta không biết bằng chứng đó chính xác là gì), và từ sự tồn tại của bằng chứng trừu tượng này, chúng ta suy luận ngược lại về sự thật của đề xuất.

Nhưng nếu chúng ta biết giá trị của nút Lập luận, thì D sẽ tách nút “Sự thật” khỏi nút “Niềm tin của chuyên gia” bằng cách chặn tất cả các đường dẫn giữa chúng, theo một số tiêu chí kỹ thuật nhất định về “chặn đường dẫn” có vẻ khá rõ ràng trong trường hợp này. Vì vậy, ngay cả khi không kiểm tra phân phối xác suất chính xác, chúng ta vẫn có thể đọc từ biểu đồ rằng:

P(sự thật|lập luận,chuyên gia) = P(sự thật|lập luận) .

Điều này không mâu thuẫn với lý thuyết xác suất thông thường. Đây chỉ là một cách ngắn gọn hơn để diễn đạt một số sự kiện xác suất nhất định. Bạn có thể đọc các phép bằng và bất bằng tương tự từ một phân phối xác suất không có trang trí — nhưng sẽ khó nhìn thấy hơn bằng mắt thường. Quyền lực và lập luận không cần hai loại xác suất khác nhau, cũng như vòi phun nước không được làm từ vật liệu khác với ánh sáng mặt trời.

Trong thực tế, bạn không bao giờ có thể loại bỏ hoàn toàn sự phụ thuộc vào uy tín. Những người có uy tín tốt có nhiều khả năng biết về bất kỳ bằng chứng phản bác nào tồn tại và cần được tính đến; những người có uy tín thấp hơn ít có khả năng biết điều này, khiến cho lập luận của họ kém tin cậy hơn. Đây không phải là yếu tố bạn có thể loại bỏ chỉ bằng cách nghe bằng chứng mà họ đã tính đến.

Cũng rất khó để giảm các lập luận xuống thành toán học thuần túy; và nếu không, việc đánh giá sức mạnh của một bước suy luận có thể dựa vào trực giác mà bạn không thể lặp lại nếu không có cùng ba mươi năm kinh nghiệm.

Có một tính hợp pháp không thể xóa bỏ khi gán xác suất hơi cao hơn cho những gì E. T. Jaynes nói với bạn về xác suất Bayesian, so với xác suất bạn gán cho Eliezer Yudkowsky khi ông ấy đưa ra tuyên bố giống hệt như vậy. Năm mươi năm kinh nghiệm thêm không nên được coi là không có ảnh hưởng gì cả.

Nhưng sức mạnh nhỏ bé của quyền lực này chỉ là ceteris paribus, và có thể dễ dàng bị lấn át bởi những lập luận mạnh mẽ hơn. Tôi đã viết một bản đính chính lỗi nhỏ trong một cuốn sách của Jaynes — bởi vì toán học quan trọng hơn uy tín.

Bài tiếp theo

Cần bao nhiêu bằng chứng?

Tiếp tục đọc