Hầu hết các bạn có thể đã nghe tin- Ding Liren là Nhà vô địch Cờ vua Thế giới mới. Bản thân là một người hâm mộ cờ vua, tôi theo dõi diễn biến của các trò chơi một cách tự nhiên - và phân tích chúng bằng cách sử dụng bot AI có tên Stockfish.
Vẫn chưa rõ cách các công cụ cờ vua như Stockfish phân tích và đánh giá các vị trí một cách chính xác - nhưng con người có thể hiểu được kết quả đầu ra của chúng. Đánh giá tích cực có nghĩa là quân trắng thắng, đánh giá hòa được đánh giá là 0 và đánh giá tiêu cực có nghĩa là quân đen thắng, v.v.
Nhưng con số này đến từ đâu? Nó xuất phát từ sự đánh giá của chính Stockfish về vị thế, lấy nhiều yếu tố và đưa ra một con số. Chúng ta thường được nghe nói rằng con số đó gần tương đương với lợi thế mà một bên có được.
Tuy nhiên, đây là một cách cực kỳ thiếu trực quan để người chơi cờ hiểu được các thế cờ.
Con số cho chúng ta câu trả lời, vâng. Và con số này hầu hết đều chính xác một cách khách quan vì AI đã tính đến rất nhiều yếu tố khác nhau, các động thái có thể xảy ra trong tương lai, v.v. để đưa ra đánh giá xem ai là người chiến thắng và đâu là động thái tốt nhất.
Điều quan trọng hơn nhiều là câu hỏi ‘tại sao lại đánh giá vị trí đó như vậy?’ Và việc biết câu trả lời không hề làm sáng tỏ lý do cho câu trả lời.
Là một người chơi cờ, điều này có thể khiến bạn tức giận. Nó buộc chúng ta phải dành thời gian để tìm ra lý do đánh giá các động cơ cờ vua và đôi khi rất khó tìm ra những lý do này.
Hãy tưởng tượng một giáo viên đưa cho bạn một bài toán cực kỳ khó, người này cũng cho bạn câu trả lời nhưng từ chối giải thích với bạn hoặc đưa ra gợi ý. Bạn có thể kết luận một cách đúng đắn rằng một giáo viên như vậy là một giáo viên tồi. Tuy nhiên, câu trả lời gần như chắc chắn là đúng - có lý do chính đáng cho điều đó.
Và đây không phải là lần duy nhất các thuật toán AI làm chúng ta bối rối. Các thuật toán AI được sử dụng trên các trang web như Netflix và Youtube để đề xuất video cho chúng ta xem, trong đó chúng ta ở lại trang web càng lâu thì thuật toán càng tốt, nhưng có rất ít điều chúng ta thực sự hiểu về các thuật toán AI này ngoài việc chỉ ra số liệu mà chúng tôi đo lường sự thành công của họ bằng dữ liệu mà các thuật toán này có quyền truy cập.
Nhưng hiểu được lý do thành công của chúng sẽ giúp ích rất nhiều cho chúng ta và đây chính là nơi mà sự phát triển vượt bậc tiếp theo của AI sẽ diễn ra - trong việc tạo ra AI mà chúng ta có thể hiểu được.
Tính khách quan không giống như tính dễ hiểu
Ý tôi là khi làm cho AI trở nên dễ hiểu đối với chúng ta không có nghĩa là chúng ta có thể hiểu AI đang nói gì - đúng hơn, đó là một AI có thể được giải thích theo kiểu trực quan.
Đối tác của Stockfish là AlphaZero- được xây dựng bởi Deepmind, công ty con của Google. Thay vì đánh giá các vị trí và nước đi của cờ vua và đưa ra một con số dường như ngẫu nhiên, AlphaZero đo các vị trí bằng xác suất. Bất kỳ đầu ra nào của AlphaZero sẽ nằm trong khoảng từ -1 đến 1, trong khi Stockfish thường đưa ra những con số có thể lên đến hàng trăm mà không rõ chính xác những con số này có ý nghĩa gì.
Biểu đồ bên dưới cho thấy các đánh giá của công cụ cờ vua truyền thống, thường được biểu thị bằng con rết, tương quan như thế nào với các đánh giá của Leela (người kế nhiệm AlphaZero).
Điều quan trọng là AlphaZero và Leela vẫn đưa ra những đánh giá khách quan- nhưng những đánh giá này mang lại cảm giác trực quan hơn nhiều. Tại sao? Bởi vì nó đưa ra đánh giá phù hợp hơn với mức độ cảm nhận của bạn.
Việc có nước đi từ 0 đến +5 tương ứng với ván đấu chuyển từ hòa sang trắng có khả năng thắng cao. Nhưng có thực sự có nhiều khác biệt giữa việc tăng vị thế từ +5 lên +10 không? Trong khi Stockfish đưa ra sự khác biệt trong đánh giá tương tự, thì việc tăng từ 0 lên +5 gần như phản ánh sự thay đổi từ không có cơ hội thắng sang 80% cơ hội thắng, trong khi việc tăng từ +5 lên +10 chỉ làm tăng cơ hội thắng thêm 10 %.
Tại sao số liệu này tốt hơn? Bởi vì nó cũng tương quan nhiều hơn với cảm giác của chúng ta về vị trí đó. Chứng kiến một thế trận chuyển từ hòa 0 sang lợi thế +5, có cảm giác như Trắng đang gây áp lực rất tốt cho đối thủ trong khi đối thủ của anh ta đang không chịu nổi áp lực. Mặt khác, việc tăng lợi thế từ +5 lên +10 có vẻ không nhiều vì hầu hết công việc đã được hoàn thành.
Đây là một phần ý tôi khi làm cho AI trở nên dễ hiểu hơn - AI trong trường hợp này dễ hiểu hơn. Nó trực quan hơn nhiều và đưa ra kết quả chính xác về mặt khách quan nhưng cũng là kết quả mà chúng ta có thể cảm nhận được.
AI truyền thống luôn giỏi về tính khách quan - nhưng nhân loại sẽ không thấy những cải tiến lớn từ việc AI tiếp tục cải thiện tính khách quan của nó. Đây là điều mà người sáng lập Paypal Peter Thiel gọi là 'đi từ 1 đến n'. Thay vào đó, điều chúng ta cần là 'đi từ 0 đến 1' và làm điều gì đó khác biệt - và đó là làm cho AI trở nên dễ hiểu hơn đối với con người.
AlphaZero đã đạt được một phần điều này - bằng cách làm cho đầu ra của nó trở nên trực quan hơn, nó đang trên đường làm cho AI trở nên dễ hiểu hơn đối với con người. Nhưng còn có thể làm gì hơn nữa?
Thấu hiểu nhân loại
Năm 1983, Electronic Arts xuất bản một quảng cáo trên tạp chí. Nó được xuất bản trong thời đại mà máy tính mới bắt đầu phát triển. Trong đó, quảng cáo hứa hẹn sẽ phát huy hết tiềm năng của máy tính cá nhân.
Nó bắt đầu bằng một câu hỏi quan trọng và một số điều cần suy nghĩ:
“Máy tính có thể làm bạn khóc không? Hiện tại, không ai biết. Điều này một phần là do nhiều người coi ý tưởng này là phù phiếm. Nhưng đó cũng là vì người trả lời thành công câu hỏi này trước hết phải trả lời được nhiều câu hỏi khác.
Tại sao chúng ta khóc? Tại sao chúng ta cười, hay yêu, hay cười? Tiêu chuẩn cảm xúc của chúng ta là gì?
Cho đến nay, những người hỏi những câu hỏi như vậy có xu hướng không phải là những người điều hành các công ty phần mềm. Thay vào đó, họ là nhà văn, nhà làm phim, họa sĩ, nhạc sĩ. Theo nghĩa truyền thống, họ là những nghệ sĩ.”
Đây là những câu hỏi mang tính tiên tri vào năm 1983 - khi máy tính lần đầu tiên trở thành sản phẩm tiêu dùng đại chúng. Nhưng ngày nay chúng cũng có liên quan. Trong những thập kỷ qua, chúng ta đã phát triển AI ngày càng tốt hơn về tính toán, tính khách quan và hiểu biết về khái niệm.
Nhưng ngày nay, những câu hỏi này, mặc dù vẫn còn quan trọng, nhưng ngày càng không còn là những câu hỏi duy nhất cần được trả lời. Cần phải đặt ra những câu hỏi mới, về cách AI thể hiện bản thân theo cách mà con người có thể hiểu hoặc về cách con người có thể hiểu AI tốt hơn.
Việc AI tự giải thích tốt hơn về các câu trả lời mà họ đưa ra sẽ mang lại sự rõ ràng hơn nhiều về những gì dẫn đến quyết định của họ và tại sao câu trả lời của họ lại đúng. Xét cho cùng, khi các nhà nghiên cứu xuất bản công trình của họ, điều quan trọng không chỉ là kết luận mà còn phải bao gồm phương pháp luận, bộ dữ liệu, lý luận định tính, v.v.
Để học hỏi từ AI, nhân loại cần hiểu rõ hơn về AI và AI cần giao tiếp tốt hơn với nhân loại - không chỉ thông qua các con số, tín hiệu và ánh sáng, mà còn thông qua từ ngữ, hình ảnh và cảm xúc. Để giải thích các quyết định có thể được đưa ra, các tính toán được thực hiện và mục đích của các hoạt động này là những gì AI cần để có thể thực hiện tốt hơn.
Bước tiếp theo trong AI sẽ không được thực hiện bằng cách tăng sức mạnh tính toán của máy tính - mà nó sẽ được thực hiện bằng cách làm cho AI thể hiện bản thân theo những cách mà nhân loại có thể hiểu rõ hơn về nó và những cách mà ngay cả những người không phải là lập trình viên cũng có thể làm như vậy.