Home Chưa phân loại Review the Signal and the Noise: khiêm tốn để dự đoán tốt hơn về thế giới

Review the Signal and the Noise: khiêm tốn để dự đoán tốt hơn về thế giới

Signal and NoiseCuốn sách The Signal and the Noise là một cuốn sách thú vị, trước hết vì cách trình bày theo lối tổng hợp những câu chuyện ngắn, gần gũi và dễ hiểu, đủ để người đọc phổ thông cũng có thể đọc sách và rút ra những điều bổ ích cho bản thân. Điểm đặc biệt là khả năng của tác giả Nate Silver, nghiên cứu hoạt động dự báo trong rất nhiều lĩnh vực, không chỉ riêng lĩnh vực của tác giả là Poker, dự báo chính trị, dự báo bóng chày. Ở trong lĩnh vực nào tác giả cũng tìm ra được một số điểm đáng chú ý liên quan tới cách dự báo của con người, lỗi của họ và hướng giải quyết chúng.

Vì sự đa dạng của cuốn sách, tùy người đọc khác nhau, hoặc tùy lần suy ngẫm khác nhau, người đọc có thể tìm ra những ý tưởng mới. Ở đây tôi xin phép chỉ review một ý tưởng trong cuốn sách, liên quan tới sự quá tự tin, ảo giác kiểm soát, tác hại của nó và giải pháp.

Tóm tắt:

Dự đoán là hoạt động quan trọng và cũng dễ sai sót, vì nó kết nối giữa thực tế và thế giới như chúng ta thấy. Nate Silver, tác giả cuốn sách cho rằng chúng ta không thể đưa ra dự đoán hoàn toàn khách quan, mà sẽ luôn bị ảnh hưởng bởi góc nhìn chủ quan. Khi chúng ta quá tự tin, dự đoán của chúng ta lại kém chính xác đi, gây ra hậu quả to lớn. Những điều gây ra sự quá tự tin này gồm có bản chất của con người, sự quá tải thông tin, cơ chế hoạt động của thị trường. Để dự đoán tốt hơn, chúng ta cần phương pháp tư duy mới, đối mặt với sự không hoàn hảo của con người. Nate Silver đưa ra phương pháp tư duy xác suất Bayes và một số giải pháp kèm theo, giúp con người đưa ra các dự báo chính xác hơn.

Dự đoán:

Dự đoán là một hoạt động không thể thiếu trong khoa học và trong đời sống. Mỗi khi chúng ta chọn đường đi làm, chọn bạn để chơi, quyết định đầu tư, chúng ta đều dự đoán về tương lai. Những dự đoán này có thể được thực hiện có ý thức hoặc trong vô thức. Cuốn sách The Signal and the Noise tập trung vào dự đoán như một hoạt động của loài người, không phải một công việc của các chuyên gia.
Dự đoán kết nối giữa thực tế và thế giới như chúng ta thấy. Nate Silver, tác giả cuốn sách cho rằng chúng ta không thể đưa ra dự đoán hoàn toàn khách quan, mà sẽ luôn bị ảnh hưởng bởi góc nhìn chủ quan. Chỉ khi nhận ra sự thiếu hoàn hảo này, con người mới không rơi vào những sai lầm đã xảy ra trong lịch sử và có thể đưa ra những dự đoán chính xác hơn.

            Chúng ta có nhận ra sự thiếu hoàn hảo của mình không?

Tác giả đưa ra ví dụ về 2 giai đoạn mà con người tự tin vào khả năng dự đoán của mình, cả hai giai đoạn đều gắn liên với sự tăng vọt về thông tin. Giai đoạn đầu tiên là giai đoạn thế kỉ 15, sau khi máy in Gutenberg ra đời tại Đức. Giai đoạn thứ hai là những năm 1970, khi máy vi tính bắt đầu được sử dụng nhiều trong nghiên cứu khoa học.

Giai đoạn đầu tiên:

Máy in Gutenberg ra đời đã giúp cho giá thành xuất bản sách giảm nhanh chóng, một cuốn sách sản xuất mất 20 000 USD trước đó thì chỉ còn mất 70 USD. Lượng sách xuất bản tăng gấp 30 lần chỉ trong 100 năm. Người dân giờ đây có thể mua được sách để đọc, nhất là Kinh thánh. Tuy nhiên thời này lại chứng kiến sự tách biệt các quốc gia và tôn giáo. Quá nhiều thông tin khiến chúng ta không xử lý được, không phân biệt được thông tin hữu ích và thông tin gây nhiễu, vì vậy chúng ta đã chọn con đường dễ dàng là chọn những thông tin mình thích, không xem thông tin còn lại, kết đồng minh với người cùng ý kiến và thù ghét những người khác ý kiến với mình.

Martin Luther, một thầy tu Đức đã dùng máy in để truyền bá tư tưởng đổi mới của mình: cuốn Ninety-five theses khơi mào cho cuộc cải cách đạo Tin lành (Protestant Reformation). Điều này đưa châu Âu vào chiến tranh đẫm máu, từ 1524 và 1648, chủ yếu ở Đức.

Trong thời đại này, với sự khuyến khích của đạo Tin lành, ý tưởng rằng con người kiểm soát được số phận của mình nổi lên. Từ forecast được hình thành nên để chỉ việc con người có thể dùng kiến thức (foresight) để lên kế hoạch cho tương lai. Đây là từ Anh gốc Đức, khác với từ Predict,(tiên đoán) được hình thành từ gốc Latin và có ý nghĩa như việc thầy bói nói về số phận của con người. Tuy nhiên phải mất 330 năm và hàng triệu người chết tại châu Âu thì những nước theo đạo Tin Lành mới tạo ra sự tăng trưởng kinh tế.

Shakespeare, nhà văn và nhà viết kịch Anh, đã viết về sự khác biệt giữa mong muốn kiểm soát số phận và khả năng làm điều đó trong tác phẩm Bi kịch của Julius Caesar: Hoàng đế này nhận được những dự đoán về số phận của mình, rằng lễ đăng quang của mình có thể trở thành cuộc chém giết. Caesar lại tin rằng những thông tin này đang chỉ kẻ thù của mình. Nhân vật Cicero đã thay lời Shakespeare chỉ ra con người thích nghe những gì thuận lợi, tự sáng tác ý nghĩa của dữ liệu nhằm tạo ra kết cục tốt đẹp (confirmation bias).

Giai đoạn thứ hai:

Mỗi dự đoán đều liên quan đến việc thu thập thông tin và xử lý thông tin. Trong kỉ nguyên thông tin (từ giữa thế kỷ 20 tới nay), lượng thông tin tăng nhanh chóng, thu thập không tin trở nên dễ dàng, cùng với khả năng xử lý thông tin vượt trội của máy tính, khiến con người tự tin vào khả năng dự đoán của mình. Năm 2008, Chris Anderson, editor của tạp chí Wired cho rằng Big Data sẽ khiến cho các học thuyết và phương pháp khoa học là không cần thiết. Năm 1971, các nhà khoa học dự đoán chỉ 10 năm nữa là động đất sẽ được dự đoán chính xác, nhưng việc này đến nay vẫn chưa thành hiện thực, ví dụ như thảm họa động đất – hạt nhân ở Nhật 2011. Nước Mỹ chịu ảnh hưởng rất mạnh của phong trào Tin Lành, lại càng tin vào khả năng dự đoán và kiểm soát số phận của mình. Tuy nhiên vụ 11/9, hay khủng hoảng tài chính Mỹ 2008 vẫn chưa được dự báo cho tới khi quá muộn.

Dưới đây là biểu đồ về tần suất xuất hiện của từ predictable và unpredictable trong các nghiên cứu khoa học. Từ năm 1970, các nghiên cứu khoa học dùng từ “đoán được” rất nhiều so với từ “không đoán được” cho thấy họ tự tin về khả năng dự đoán thế giới của mình.

perception of predictability
Ngược lại, năng suất của khoa học và kinh tế trong những năm 1970 và 1980 lại giảm. Lượng đầu tư (đã được điều chỉnh bởi lạm phát) dành cho 1 patent trong những năm 1970 và 1980 lại cao hơn so với những năm trước đó.
cost of patent
Những điều trên cho thấy con người đã tự tin thái quá vào khả năng dự đoán của mình.Theo tác giả, những dự đoán của thời Big Data cũng chưa đạt kì vọng. Dữ liệu không thể nói, mà con người nói hộ chúng, cho chúng ý nghĩa. Chúng ta có xu hướng giống Caesar, dịch dữ liệu theo cách có kết cục tốt đẹp. Để điều này chấm dứt, con người cần nhận ra vai trò của mình trong quá trình và việc thiên vị sẽ tăng khi có nhiều dữ liệu hơn.

Vì sao con người thường đánh giá sai khả năng dự báo của mình?

Pattern recognizing, overfitting 

Khả năng nhận biết hình mẫu là đặc điểm sinh học đã giúp con người tồn tại trong tự nhiên. Người cổ không có khả năng chạy nhanh, không có móng vuốt, giáp bảo vệ cơ thể. Vì vậy họ cần biết được những hình mẫu của mối đe dọa, ví dụ như lùm cây chuyển động mà không có gió.

Khả năng và mong muốn nhận biết hình mẫu tồn tại trong chúng ta một cách bẩm sinh. Theo Tomaso Poggio, nhà thần kinh học ở MIT, “một đứa trẻ mơi sinh cũng có thể nhận biết hình mẫu cơ bản của khuôn mặt.” Cách tư duy này lại là điểm yếu khi chúng ta sống trong môi trường quá nhiều thông tin nhiễu. Chúng ta tìm được những hình mẫu ở nơi mà không thực tế có hình mẫu ở đó.

Tác giả đưa ra ví dụ về điểm yếu này trong ngành dự báo động đất. Thường trước khi xảy ra động đất lớn, chúng ta có thể đo được các chấn động, hoặc sẽ thấy được có những thay đổi trong tự nhiên. Nhưng lượng chấn động hàng năm rất nhiều, và các dấu hiệu lạ của động vật, thực vật xảy ra không hề ít. Phần lớn đó là nhiễu. Điều này khiến các nhà khoa học gặp khó khăn trong việc phân biệt tín hiệu và nhiễu, họ tạo ra các mô hình phức tạp, sử dụng nhiễu để giải thích động đất trong quá khứ. Đây được gọi là lỗi Overfitting. Các mô hình này giải thích rất tốt quá khứ, vì vậy các nhà khoa học đánh giá sai lầm khả năng dự báo của mô hình đối với động đất trong tương lai.

Một ví dụ nữa được tác giả đưa ra ở hoạt động dự báo kinh tế. Tại Mỹ, có hàng triệu biến dữ liệu đầu vào, nhưng chỉ có khoảng 10 biến đầu ra. Vì vậy rất dễ tìm thấy những biến có sự tương quan với nhau, nhưng trên thực tế không hề có mối quan hệ nhân quả hữu ích.

Approximation, Ignore Uncertainty, Confirmation bias 

Bộ não con người chứa được khoảng 3 ngàn tỷ byte, nhưng theo IBM, mỗi ngày thế giới tạo ra khoảng 2.5 tỉ tỉ byte thông tin, gấp 1 triệu lần khả năng chứa của não. Vì vậy chúng ta cần chọn lọc thông tin nhận vào. Thế giới bên trong não là thế giới được đơn giản hóa, gần đúng với sự thật (approximation) thông qua các hình mẫu và quy luật.

Trong hoàn cảnh khác lạ hoàn toàn so với những hình mẫu bắt gặp hàng ngày (stress, thảm họa…) con người không thể nhớ được môi trường. Những người sống sót trong thảm kịch 11/9 chỉ nhớ được một vài phút trải nghiệm và hoàn toàn không kết nối được với bức tranh tổng thể. Trong những hoàn cảnh này, từ việc tiếp nhận thông tin kém sẽ dẫn đến hành động sai, không nhận ra mối hiểm họa. Những người đã trải qua hoàn cảnh stress, thảm họa thì lại có những quyết định sáng suốt hơn.
Khi chúng ta rơi vào tình trạng quá tải thông tin, cơ chế tự vệ khiến chúng ta chỉ tiếp nhận thông tin đúng với suy nghĩ trước đó của mình (confirmation bias) và gạt đi các yếu tố bất định (uncertainty). Một ví dụ mà tác giả đưa ra là trong hoạt động phân tích bóng chày, các nhà phân tích theo trường phái sử dụng máy tính (IT, geek) thường gạt bỏ các thông tin không đo lường định lượng được, không cho vào mô hình, còn các nhà phân tích theo trường phái dùng quan sát trực tiếp và cảm giác (Scout) thường chỉ đo các thông tin khớp với thang đo của mình, và bị chi phối nhiều bởi cảm nhận ban đầu.
Việc tiếp nhận thông tin phù hợp với cách nhìn của mình, gạt bỏ đi yếu tố bất định tạo những vòng lặp khiến chúng ta tin tưởng hơn vào quan niệm của mình về thế giới. Việc tin tưởng vào quan niệm của mình lại khiến chúng ta rơi vào confirmation bias nhiều hơn.

Emotional need to control – need to ignore uncertainty

Tác giả cũng chỉ ra rằng yếu tố cảm xúc đối với đối tượng cần dự báo cũng khiến ta dự báo sai lệch. Ví dụ được nêu ra trong hoạt động phân tích biến đổi khí hậu. Khí hậu thay đổi chỉ thấy được trong dài hạn, nhưng muốn ngăn chặn khí hậu biến đổi xấu đi lại cần hành động ngay, và những hành động này ảnh hưởng tới lợi ích của rất nhiều bên, đặc biệt là các công ty nhiên liệu hóa thạch. Các nhà khoa học có xu hướng tự tin hơn với dự báo của mình, tránh nêu ra những yếu tố bật định, vì những điểm này dễ bị phe đối lập lợi dụng.

Những yếu tố xã hội góp phần gây nên dự đoán sai

Yếu tố môi trường ổn định (kinh tế, động đất lớn, an ninh)

Môi trường ổn định khiến con người tự tin hơn vào khả năng kiểm soát của mình, kể cả khi những yếu tố này không kiểm soát được. Tác giả Nate Silver đã ví dụ về môi trường ổn định trong 3 lĩnh vực: kinh tế, động đất, an ninh. Trong lĩnh vực kinh tế ở Mỹ, những năm ổn định (1986 – 2006) được các nhà kinh tế và các công ty đánh giá chứng khoán sử dụng để xây dựng mô hình, nên không phù hợp để dự đoán khủng hoảng 2008. Trong những năm này, giá bật động sản Mỹ liên tục tăng, chỉ giảm trong 3% thời gian. Nhưng thời gian này nợ chính phủ, nợ tiêu dùng tăng, nhiều tài sản bị thổi bong bóng.
Trong lĩnh vực dự báo động đất tại Nhật, vùng Fukushima chưa từng có động đất trên 8 độ từ năm 1964, vì vậy các nhà khoa học tự tin xây dựng nhà máy hạt nhân chịu được đến 8.6 độ, chứ không phải 9.1 độ như điều đã xảy ra vào tháng 3 năm 2011.

Trong lĩnh vực an ninh vào thế chiến thứ 2, nước Mỹ đã không tính đến khả năng Nhật sẽ ném bom Trân Châu Cảng mà chỉ tính đến việc dân gốc Nhật trên đảo Hawaii sẽ nổi dậy. Vì vậy họ co cụm các điểm tập kết máy bay lại để dễ phòng thủ nếu cuộc nổi dậy xảy ra, càng khiến việc ném bom trở nên dễ dàng. Nước Mỹ chưa từng bị tấn công trong thế chiến 2 và quá tự tin vào khả năng quân sự của mình.

Quá tải thông tin

Mỗi ngày lượng thông tin mà con người tiếp nhận vào ngày càng tăng, do công nghệ thông tin phát triển, điều này dẫn tới việc con người nhất thời chưa thích ứng được, phải dựa vào cơ chế phòng thủ, chọn lọc thông tin phù hợp với niềm tin, mô hình, quy luật của mình.

Sự tự tin được đề cao

Trong xã hội thông tin không hoàn hảo, con người chú ý tới những thông tin gây sốc, được tuyên bố một cách tự tin. Tác giả ví dụ ở chương 2 – dự báo về chính trị: những người dự đoán tự tin, bạo dạn, ý tưởng lớn thường được lên các kênh truyền thông hơn, mặc dù họ lại đưa ra những dự báo kém chính xác. Độ chính xác của dự báo của họ tỉ lệ nghịch với số lượt được lên các kênh truyền thông. Tuy nhiên họ vẫn không bị phát giác, vì người ta thường nhớ những thành công, và quên đi những dự báo thất bại của họ.

Thương hiệu quan trọng hơn chất lượng

Tác giả lấy ví dụ về công ty đánh giá tài chính Moody và S&P. S&P và Moody không nhất thiết là người đánh giá đầu tư giỏi nhất, họ chỉ là người đến sớm nhất và phát triển to nhất, trở nên độc quyền, hưởng rào cản gia nhập được chính phủ tạo ra. Lợi nhuận của Moody tăng 800% từ 1997 đến 2007 và phần lớn lợi nhuận tới từ những năm bong bóng. Moody trong năm 2010 vẫn có lợi nhuận là 25%.
Việc tập trung vào các CDO (một loại chứng khoán ở Mỹ, được thổi bong bóng trước năm 2008) đem lại thành công trong thời gian dài, và không có cách nào để các nhà đầu tư kiểm tra sự chính xác của các dự báo, khiến tổ chức đánh giá không có động lực cải thiện chất lượng. CEO của Moody là Raymond McDaniel đã công khai nói với hội đồng quản trị rằng chất lượng đánh giá là yếu tố ít quan trọng nhất trong những yếu tố quyết định lợi nhuận của công ty.

Không có thị trường cho sự không chắc chắn

Người dân không quen với dự báo có yếu tố không chắc chắn trong đó, làm giảm động lực để các nhà dự báo đưa yếu tố này vào kết quả. Trong hoạt động dự báo thời tiết, giả dụ như dự báo cho rằng ngày mai có 60% khả năng sẽ mưa, kênh truyền thông về thời tiết có thể sẽ nói ngày mai có mưa. Tuy nhiên việc công bố dự báo thiếu trung thực có thể gây hậu quả: người dân thiếu lòng tin vào việc dự báo thời tiết, đến khi có bão lớn xảy ra, cần sơ tán người dân, công tác tuyên truyền sẽ không hiệu quả.

Nỗi sợ trở thành lòng tham

Sự cân bằng giữa nỗi sợ và lòng tham khiến cho con người dự báo chính xác hơn. Tuy nhiên khi nỗi sợ tăng không khiến lòng tham giảm mà còn khiến lòng tham tăng, con người sẽ đưa ra những dự báo sai lầm. Điều này được tác giả đưa ra trong chương 1, trong giai đoạn bong bóng nhà đất được thổi, chính nỗi sợ mình sẽ mất đi món hời khiến cho các nhà đầu tư nhanh chóng làm theo những người khác, có những suy nghĩ sai lệch về tiềm năng sinh lời của bất động sản.

Dự đoán tự khiến mình đúng do truyền thông

Truyền thông làm ảnh hưởng tới sự chính xác của dự đoán. Ví dụ như các dự đoán tích cực đối với 1 cổ phiếu được truyền thông khiến cho mọi người tin vào cổ phiếu đó, làm cho giá cổ phiếu đó tăng thật. Đây là dạng dự đoán tự khiến mình đúng. Dự đoán dạng này làm cho người dự báo càng tự tin vào khả năng dự báo của mình. Ngược lại, một dự báo về thảm họa bệnh dịch có thể khiến cho người dân tích cực đề phòng, dẫn đến bệnh dịch không trở thành thảm họa. Dự báo tự khiến mình sai làm cho người dự đoán bị mất tín nhiệm, giống như chính phủ Mỹ trong chương 7 cuốn sách.

Thành công được nhấn mạnh hơn thất bại

Nate Silver có nhắc tới văn hóa của nước Mỹ, nhấn mạnh vào thành công hơn thất bại, cho rằng thành công là do nỗ lực, thất bại là do rủi ro. Điều này khiến cho người dự báo tin tưởng vào khả năng của mình và ảo tưởng rằng mình kiểm soát được nhiều thứ hơn thực tế.

Không có thị trường cho dự đoán chính xác

Dự báo của các công ty có uy tín thường thận trọng hơn, còn dự báo của những công ty chưa nổi tiếng thì lại táo bạo hơn, với hi vọng gây sự chú ý.

Các dự báo cũng bị chi phối bởi mong muốn của bên cầu. Ví dụ như một nhà quản lý đầu tư tiền và công sức vào một dự án sẽ không muốn nghe các dự báo xấu liên quan đến dự án. Những nhà đấu tư thì muốn những dự báo khả quan hoặc những dự báo bi quan để trục lợi.

Trong trường hợp nhà ra quyết định đầu tư là người làm thuê, không sử dụng tiền của mình, đôi khi họ không có động lực đưa ra dự báo chính xác. Nếu người làm thuê cho rằng thị trường lên điểm, mà thị trường lại giảm điểm, thì không bị mất việc (vì anh ta đổ lỗi được), nhưng nếu cho rằng thị trường xuống điểm, mà thị trường lại lên điểm, anh ta sẽ bị mất việc. Vì vây người đặt cược luôn có động cơ thổi bong bóng. Năm 1960 chỉ có 15% chứng khoán được giữ bởi các tổ chức. Tới năm 2007, 68% chứng khoán được giữ bởi các tổ chức.

Môi trường may rủi
Những môi trường dự báo có yếu tố may rủi lớn như Poker khiến cho các nhà dự báo (người chơi) đánh giá sai khả năng của mình. Theo tác giả, bạn có thể chơi kém nhưng vẫn trúng lớn, hoặc chơi giỏi nhưng vẫn thua tiền, và trong ngắn hạn không có cách nào để biết được khả năng của mình thông qua kết quả chơi. Tác giả chơi Poker online và đã thành công lớn trong giai đoạn thị trường Poker được thổi bong bóng, nhưng khi bong bóng vỡ thì đã thua rất nhanh.

Biểu hiện và tác hại của quá tự tin

Sự quá tự tin khiến cho chúng ta bỏ qua những yếu tố không xác định và làm những việc mình vẫn làm. Điều này được tác giả nói đến trong chương dự báo về an ninh, dự báo về kinh tế. Đặc biệt trong lĩnh vực an ninh, khi đối thủ liên tục tìm những điểm không được đề phòng để tấn công, các thảm họa khủng khiếp có thể xảy ra: vụ Chân Châu Cảng, vụ khủng bố 11/9.

Sự quá tự tin khiến con người không có nhu cầu học hỏi thêm, giống như tác giả đã trải qua trong giai đoạn bong bóng Poker. Tác giả cũng đưa ra ví dụ khác trong hoạt động dự báo bóng chày: ngành được chia ra làm hai cách phân tích, những người phân tích theo mô hình toán và những người phân tích theo quan sát trực tiếp, cảm giác (scout). Hai nhóm người này từng đối đầu với nhau, và những người nhóm scout cho rằng nhóm kia có thể khiến mình mất việc. Tuy nhiên sau 2004, khi hai nhóm kết hợp vào với nhau, lĩnh vực phân tích và dự báo bóng chày có sự nhảy vọt.

Việc đánh giá sai khả năng dự báo của mình, hoặc tin tưởng quá mức vào các dự báo của các công ty đánh giá chứng khoán có thương hiệu có thể khiến bong bóng được tạo nên, không có lợi cho thị trường và tạo nguy cơ khủng hoảng tài chính.

Sự tin tưởng vào quan niệm của mình khiến con ngươi không rút lại được quyết định đã đưa ra. Có nghĩa là người dự đoán đưa ra những dự đoán để bảo vệ những dự đoán trước đó của mình. Sự bảo thủ này cũng khiến người dự báo không chấp nhận quan niệm mới, tạo ra sự đối đầu không cần thiết.

Cách giải quyết sự quá tự tin trong dự đoán

Tác giả tập trung vào giải quyết vấn đề phát sinh từ sự thiếu hoàn hảo của con người thông qua một bước nhảy vọt lớn và các bước nhỏ. Bước nhảy vọt lớn là phương pháp tư duy Bayes.

Phương pháp tư duy Bayes:

Bayes không nói rằng thế giới có bản chất là may rủi và bất định. Bayes tin vào sự hoàn hảo thiêng liêng, ông ta cũng tin vào công trình của Newton, gợi ý rằng tự nhiên tuân theo những quy luật ổn định và đoán biết được. Công trình của Bayes là khẳng định được biểu hiện dưới dạng lập luận triết học và toán học về cách chúng ta tìm hiểu vũ trụ: chúng ta biết về nó thông qua phép ước lượng, càng thu thập nhiều bằng chứng thì càng tiến gần tới sự thật hơn.

Vì vậy trong mỗi khẳng định và con người đưa ra đều cần có xác suất ban đầu. Sau đó khi tiếp cận thêm thông tin, con người thay đổi xác suất trên, đưa ra xác suất chính xác hơn. Nếu khẳng định ban đầu của chúng ta không có xác suất (xác suất là 100%, hoặc 0%) chúng ta sẽ không học được thêm điều gì.

Phép toán đơn giản của định lý Bayes:

Ý tưởng đằng sau định lý Bayes là giúp chúng ta cập nhật phỏng đoán xác suất liên tục mỗi khi có thông tin mới.
Công thức của định lý Bayes:
Xác suất ban đầu của biến cố A là x
Khi biến cố B xảy ra:
Xác suất mà biến cố B xảy ra nếu biến cố A là đúng: y
Xác suất mà biến cố B xảy ra nếu biến cố A là sai: Z
Tính xác suất của biến cố A biết biến cố B đã xảy ra:
ScreenClip1
Ví dụ:
ScreenClip2
Trong ví dụ này, biến cố A là khủng bố tấn công vào tòa nhà ở Manhattan. Biến cố B là máy bay thứ nhất đâm vào tòa nhà. Xác suất máy bay đâm nếu khủng bố nhắm vào tòa nhà: 100% (coi khủng bố không thất bại). Xác suất máy bay đâm do tai nạn là 0.008% (rất hạn hữu). Ở ví dụ này chúng ta thấy xác suất ban đầu rất nhỏ, chỉ 0.005%, nhưng sau khi máy bay đâm vào tòa nhà WTC, xác suất khủng bố tấn công tăng đáng kể, lên 38%. Tuy nhiên do xác suất ban đầu nhỏ, nên chúng ta chưa thể khẳng định ngay rằng vụ máy bay đâm là do khủng bố. Nhưng khi máy bay thứ 2 đâm vào, chúng ta có thể khẳng định gần chắc chắn là có khủng bố tấn công:
ScreenClip3
Xác suất ban đầu khiến con người phải đối diện với định kiến của mình với vấn đề. Tác giả cho rằng, khi một người phủ nhận rằng mình có định kiến ban đầu với một khẳng định nào đó, điều này không có nghĩa là người đó hoàn toàn khách quan, mà do người đó đang có rất nhiều định kiến.

Tìm đến chiến lược tốt nhất có thể, chứ không tìm chiến lược hoàn hảo

Theo định lý Bayes, dự đoán là hoạt động xử lý thông tin: sử dụng dữ liệu mới để thử nghiệm giả thuyết về thế giới khách quan, với mục tiêu đạt tới quan niệm chính xác hơn về nó.

Trong chương nói về cuộc đấu cờ giữa Kasparov và Deep Blue, tác giả cho rằng chiến lược đấu cờ chính là việc đưa ra dự đoán. Người chơi phải xử lý thông tin (vị trí các quân cờ, nước cờ của đối phương…) để tính toán nước đi của mình. Họ sử dụng thông tin để đưa ra chiến lược chiếu tướng đối thủ. Những chiến lược này chính là các giả thuyết về cách thắng đối thủ. Người thắng là người có giả thuyết đúng hơn.

Cờ vua là xác định, nhưng chúng ta hay máy tính vẫn chưa thể tính toán hết các nước đi (Deep Blue sẽ mất 10 mũ 90 năm để tính hết các nước cờ vua), vì vậy cả máy tính cũng có nhu cầu sử dụng các mô hình, quy luật để đơn giản hóa ván cờ và đưa ra dự đoán. Các mô hình đều sai, một số là hữu ích. Khi đấu cờ với nhau, Kasparov và Deep Blue tìm những điểm yếu của mô hình của nhau để giành chiến thắng. Ví dụ như việc Kasparov đưa ra những thế cờ khiến Deep Blue không có dữ liệu quá khứ, hoặc đánh vào điểm yếu của máy tính là khả năng nhìn bao quát và tưởng tượng.

Kasparov và Deep Blue đưa tới người đọc bài học về dự báo: người chơi cờ chuyên nghiệm không tìm kiếm những nước đi hoàn hảo, cố gắng tính toán 20 nước, mà thường chấp nhận khả năng tính toán giới hạn của mình, chọn mức đánh đổi giữa tính toán sâu (nhiều nước đi trong tương lai) hoặc tính toán rộng (nhiều cách đi), và tìm chiến lược đem lại lợi thế cạnh tranh cho mình. Người chơi cờ giỏi cũng quan tâm tới cách mình tìm chiến lược, thay đổi cách tư duy khi thấy không hiệu quả, và tìm ra điểm cân bằng giữa tính toán sâu và tính toán rộng.

Cách thử và sai này được các công ty như Google sử dụng để khiến hệ thống của họ đưa ra các dự đoán chính xác hơn. Thay vì nghiên cứu để tìm ra lý thuyết hoàn hảo, Google thực hiện khoảng 10 000 thí nghiêm mỗi năm. Nhân viên được giao nhiệm vụ nghĩ ra thật nhiều ý tưởng, và máy tính sẽ thực hiện phần thử nghiệm ý tưởng đó. Những ý tưởng có tiềm năng sẽ được đào sâu hơn. Tinh thần của Bayes được thể hiện ở việc Google không ngừng học hỏi.

Trong chương này, tác giả cũng nói về những điểm yếu của máy tính, điểm yếu của mô hình, điểm yếu của con người, và việc kết hợp máy tính với con người sẽ giúp khắc phục khả năng xử lý thông tin kém của chúng ta hiện nay.

Học hỏi liên tục

Trong chương 10, Poker Bubble, tác giả nói về việc rèn luyện trong môi trường bị chi phối bởi yếu tố may rủi như chơi poker.

Trong giai đoạn bong bóng Poker, chỉ cần người chơi poker có kỉ luật là đã có thể thắng, vì có rất nhiều người chơi vô kỷ luật, là con cá lớn cho những người chơi khác, tạo nên hệ sinh thái một nhóm người thua lớn, còn các nhóm còn lại được lợi:
pareto

Tuy nhiên việc chơi có kỷ luật chỉ là phần dễ nhất trong việc dự đoán trong lĩnh vực poker. Tác giả sử dụng biểu đồ Pareto để nêu lên điều này:
fish
Khi tất cả người chơi đều biết chơi bạc có kỷ luật, trò chơi trở nên phức tạp, người chơi khó đoán biết hơn và phân tích được đối thủ, khi đối thủ cũng đang che giấu hành vi của mình, mới có thể giành được lợi thế. Đây chính là lý do tác giả thua Poker ngay sau khi bong bóng poker vỡ và không còn đối thủ chơi bạc vô kỉ luật. Hiện tượng cuộc đấu trở nên phức tạp hóa được bắt gặp ở rất nhiều lĩnh vực có sự đối đầu khác.

May mắn và kĩ năng:

Một người chơi Poker thời của tác giả có thể thấy mình quá giỏi, trong khi họ không thực sự như vậy, mà chỉ là vì họ gặp may, đúng lúc thị trường được thổi bong bóng. Không có cách nào để biết được mình trong dài hạn có tiếp tục thắng hay tiếp tục thua không. Cách giúp người chơi ước lượng khả năng trở thành người chiến thắng là áp dụng thống kê của Bayes: trình độ của người chơi đánh giá bằng kết quả và kì vọng ban đầu.

Người chơi ban đầu nên tin là mình thua trong dài hạn, vì nếu chơi ở mức trung bình thì người chơi cũng mất tiền phí cho ban tổ chức. Trong ngắn hạn và trung hạn, kết quả chơi có thể không liên quan nhiều tới kĩ năng. Chúng ta thường hay tự khen mình khi chiến thắng và đổ lỗi cho may rủi khi bị thua.
Xã hội Mỹ là xã hội định hướng kết quả, nếu ai giàu có, chúng ta tin rằng họ xứng đáng với điều đó. Tuy nhiên thành công được quyết định bởi sự chăm chỉ, tài năng, cơ hội và môi trường. Để đánh giá tài năng thông qua thành công sẽ gặp rất nhiều nhiễu.

Một phần giải pháp là nghiêm khắc với việc đánh giá các dự đoán của chính mình, và sử dụng dữ liệu dài hạn. Nhưng trong môi trường khi dữ liệu nhiều nhiễu là tập trung vào quá trình hơn kết quả. Người chơi Poker (tác giả) hiểu rõ điều này do đã trải nghiệm sự lên xuống của sự nghiệp rất thất thường.
Người chơi chuyên nghiệp về Poker đã trả lời phỏng vấn của tác giả: Tôi không tập trung vào những thành công mà tập trung vào việc cải thiện khả năng của bản thân. Nếu có ai đó nghĩ họ đã đủ giỏi để đánh bại poker, họ đang chuẩn bị đi xuống.

Một số lời khuyên từ tác giả (được tóm tắt, sẽ không thể hiện được đầy đủ ý nghĩa tại đây):

  • Đặt cược vào dự đoán của bạn là cách để bạn biết mình có dự đoán đúng không nhanh nhất. Nếu bạn thắng tiền, bạn đang dự đoán chính xác hơn mặt bằng chung.
  • Liên tục đưa ra dự đoán là cách để kiểm tra giả thuyết của mình, tránh được các giả thuyết chỉ giải thích tốt quá khứ mà không có tác dụng dự báo tương lai.
  • Tâm lý của một người đưa ra dự báo tốt (được nêu ở chương 2) là một người biết sử dụng nhiều cách tiếp cận với vấn đề, chấp nhận sai lầm của mình, khiêm nhường trước sự phức tạp của vũ trụ, đưa ra dự báo dưới dạng xác suất, kết hợp ý tưởng từ nhiều nguồn, kể cả các phe đối lập nhau.

 Reviewer: Nguyễn Phương Mạnh

“Lửa Thiêng” của Huy Cận – “Mang mang thiên cổ sầu”

"Một chiếc linh hồn nhỏ Mang mang thiên cổ sầu Những nàng tiên dần chết Mơ mộng thuở xưa đâu" (Trích "Ê chề" - Huy Cận) "Mang mang thiên cổ sầu" là cảm hứng xuyên suốt trong tập thơ "Lửa thiêng" của Huy Cận. Không dục tính, không điên rồ đập phá, chỉ một cảm giác mênh mang không thể diễn tả. Một nỗi buồn phảng phất từ ngàn xưa trong tiền kiếp xa xôi. Mặc dù Đinh Hùng nhắc đến tiền kiếp rất nhiều,
Xem

9 TVseries về vấn đề tội phạm (tâm lý và giải quyết) mà bạn nhất định nên xem

Cơ chế tâm lý của các tội phạm luôn là một bí ẩn đối với các nhà quản lý xã hội nói riêng và toàn bộ xã hội nói chung. Tại sao một người lại trở thành tội phạm? Luật pháp và bộ máy hành pháp có thực sự giúp giải quyết tội phạm không? Tất cả đều khó lý giải. Chúng tôi xin được giới thiệu với các bạn 9 TV series về vấn đề tội phạm, bao gồm cả các phim khai thác

Nghiên cứu mô hình chất lượng không khí dựa trên các yếu tố kiểm soát của bụi mịn (PM2.5) tại Hà Nội: Một nghiên cứu về ô nhiễm không khí vào tháng 12 năm 2010

Tóm tắt Khí tượng và nguồn phát thải là hai yếu tố chính quyết định nồng độ các chất ô nhiễm không khí, bao gồm cả các chất dạng hạt mịn. Một hệ thống mô hình chất lượng không khí khu vực đã được sử dụng để phân tích các nguồn ô nhiễm không khí hạt mịn ở Hà Nội, Việt Nam, vào tháng 12 năm 2010. Tác động của lượng mưa và gió lên nồng độ PM2.5 đã được điều tra. Lượng mưa có

Book Hunter – Chúng ta là những kẻ săn tìm Chân lý

Kỷ niệm 1 năm hoạt động của website Book Hunter  Sau một năm Website của Book Hunter đi vào hoạt động, Book Hunter đã nhận được rất nhiều sự ủng hộ của những người quan tâm đến các vấn đề học thuật, các vấn đề về phát triển cá nhân. Thành công lớn nhất của Book Hunter, với chúng tôi, không phải là số lượng kiến thức truyền tải đến với đông đảo bạn đọc, mà là Book Hunter dường như đã tạo được một

Book Hunter

29/03/2014

BỘ NÃO THANH THIẾU NIÊN KHI TIẾP XÚC TRUYỀN THÔNG MẠNG XÃ HỘI

Những phát hiện từ một nghiên cứu ở Trường Đại học California, Los Angeles (UCLA) đã làm sáng tỏ tác động của truyền thông mạng xã hội đến bộ não của thanh thiếu niên. Một nghiên cứu tiên phong trong lĩnh vực này được thực hiện tại UCLA bằng cách quét não của các bạn trẻ độ tuổi thanh thiếu niên khi đang sử dụng truyền thông mạng xã hội. Kết quả quét não đã cho thấy các mạch não vốn được kích hoạt bằng

Minh Hùng

17/08/2019