“Trí Tuệ Nhân Tạo” Alphago Là Gì Mà Khiến Con Người Thán Phục?

Related Articles

Những người quan tâm đến Cờ vây – bộ môn board game đối kháng, băn khoăn rằng, bằng cách nào một thuật toán AI nào có thể chiến thắng được trí tuệ của người chơi vĩ đại nhất trong bộ môn Cờ Vây? Bài viết ngày hôm nay chính là lời giải đáp về câu hỏi này.Bạn đang xem: Alphago là gì

Cờ vây (tiếng Anh: Go) là một trò chơi cổ xưa của loài người, và là một trong những trò chơi bảng (board game) lâu đời nhất còn tồn tại đến ngày nay. Luật chơi của Cờ vây đơn giản, mục tiêu chính tập trung vào việc bao vây được một vùng lãnh thổ lớn hơn so với đối thủ. Một kỳ thủ (người chơi cờ) cầm quân cờ trắng, còn người còn lại sẽ cầm quân màu đen. Quân cờ trong Cờ vây còn được gọi với một cái tên khác là “quân cờ đá” (stone). Tất cả quân cờ trong một bộ cờ chỉ có một hình dạng duy nhất (cong đều hai mặt hoặc một mặt phẳng, một mặt lồi lên). Một bàn Cờ vây tiêu chuẩn có kích cỡ lưới 19×19 đường kẻ, ngoài ra còn có một số kích thước khác như 13×13 hay 9×9; thậm chí kích thước 17×17 cũng đã từng được sử dụng trong lịch sử.

Đang xem : Alphago là gì

*

Hình ảnh một bàn Cờ vây 19×19 tiêu chuẩn cùng các quân cờ đá (stone).1. Luật chơi

Các kỳ thủ lần lượt đặt quân cờ trên những nút giao còn trống. Nút giao ( điểm nút, tiếng Anh : point ) là giao điểm của những đường kẻ. Sau khi một quân cờ được đặt lên bàn, quân cờ đó sẽ không hề vận động và di chuyển. Tuy nhiên, một quân cờ hoàn toàn có thể bị “ bắt ” ( capture ) và bị loại khỏi bàn cờ khi nó bị vây hãm bởi những quân cờ đối thủ cạnh tranh ở toàn bộ những điểm nút lân cận gần kề. Ván cờ sẽ kết thúc khi có một bên chịu nhận thua ( resign ), hoặc hai bên không muốn thực thi tiếp nước đi nào nữa. Thắng thua được xác lập bằng cách đếm vùng chủ quyền lãnh thổ cùng với quân cờ bị bắt và điểm komi ( số điểm thêm vào tổng điểm của người chơi cầm quân trắng để tạo một lợi thế bù đắp cho việc mở màn ván cờ sau người còn lại – cầm quân đen ). Bên nào có tổng điểm lớn hơn sẽ giành thắng lợi .

Quy tắc chơi Cờ vây tương đối đơn thuần, nhưng về mặt giải pháp, Cờ vây lại vô cùng thiên biến. Bạn biết rõ mình được phép làm gì, nhưng khi ngồi xuống chơi, bạn lại không biết nên làm gì cả. So với Cờ vua, số nước đi khả thi cho một vị trí lớn hơn rất nhiều lần : ở Cờ vua, số lượng này là 20, nhưng ở Cờ vây số lượng này là 200. Nếu xét số lượng năng lực cho hàng loạt những nước đi trên bàn cờ, thậm chí còn nó còn nhiều hơn tổng số nguyên tử trong ngoài hành tinh. Đây là thử thách cực lớn so với những điều tra và nghiên cứu về AI khi muốn tạo ra một ứng dụng đánh Cờ vây với con người .

2. DeepMind và AlphaGo

DeepMind (hay Google DeepMind sau khi được Google mua lại vào năm 2014) là một công ty Trí tuệ nhân tạo (AI) của Anh được thành lập vào tháng 9 năm 2010 với tên DeepMind Technologies. Kể từ tháng 1/2014, sau khi về tay Google, DeepMind đã bắt tay vào thực hiện các dự án chuyên sâu về AI. Hiện nay, CEO và đồng sáng lập của công ty là Tiến sĩ Demis Hassabis.

AlphaGo là một chương trình máy tính được DeepMind phát triển để có thể chơi Cờ vây. Trước năm 2015, các chương trình chơi Cờ vây tốt nhất thế giới chỉ đạt được đến mức độ nghiệp dư. Thậm chí từ nhiều thập niên qua, người ta tin rằng Cờ vây khó có thể bị đánh bại bởi các máy tính do nó chứa nhiều nước cờ sáng tạo và phức tạp mà chỉ bộ óc con người mới làm chủ được. AlphaGo là chương trình có sự khác biệt đáng kể nhất so với những nỗ lực AI trước đó ở chỗ: nó được áp dụng mạng thần kinh nhân tạo, trong đó phương pháp tự giải quyết vấn đề bằng cách đánh giá, thử nghiệm và rút kinh nghiệm không bị mã hóa cứng bởi con người, mà thay vào đó là sự tự học ở mức độ lớn bởi bản thân chương trình, thông qua hàng chục triệu ván cờ vây cũng như những ván cờ tự chơi của chính nó.

*

Logo AlphaGo – chương trình máy tính chơi Cờ vây của Google DeepMind.3. Trận đấu lịch sử giữa AlphaGo và Lee Sedol

Trước hết hãy tìm hiểu một chút về hệ thống xếp hạng của Cờ vây. Đẳng cấp của Cờ vây được phân tách trên hai hệ thống riêng biệt: hệ thống đẳng cấp nghiệp dư và hệ thống đẳng cấp chuyên nghiệp. Người ta sử dụng thuật ngữ kyu và thuật ngữ dan để xếp hạng kỳ thủ. Đối với một kỳ thủ chuyên nghiệp, đẳng cao nhất mà họ có thể đạt tới được là chuyên nghiệp 9-dan (9p).

Bối cảnh trận đấu

Tháng 10 năm năm ngoái, AlphaGo vượt mặt nhà Vô địch Cờ vây châu Âu Fan Hui. Fan Hui khi đó là một kỳ thủ chuyên nghiệp 2 – dan ( 2 p ). Đây là lần tiên phong một loại sản phẩm của Trí tuệ tự tạo ( AI ) hoàn toàn có thể vượt mặt một kỳ thủ con người chuyên nghiệp trong một trận đấu sử dụng bàn cờ cỡ lớn tiêu chuẩn 19 × 19 và không sử dụng lợi thế. Trận đấu kết thúc với tác dụng thắng lợi trọn vẹn của AlphaGo trước Fan Hui ( 5-0 ). Sau trận đấu quá nhanh chóng ấy, giới Cờ vây chuyên nghiệp không tin về sức mạnh thực sự của AlphaGo. Họ đặt ra câu hỏi “ Sức mạnh thực sự của AlphaGo là gì ? ” và “ Cần thêm bao lâu nữa để nó hoàn toàn có thể vượt mặt những kỳ thủ giỏi nhất quốc tế ? ” Những câu hỏi này thúc giục những nhà nghiên cứu của DeepMind liên tục cải tổ chương trình, và họ muốn đẩy thuật toán AI đến số lượng giới hạn để xem quy trình tự học tập và cải tổ này hoàn toàn có thể đi bao xa. Để kiểm tra điều đó, những chuyên viên của DeepMind cần phải tìm một đối thủ cạnh tranh mới mạnh hơn …

Lee Sedol là một kỳ thủ chuyên nghiệp 9-dan (đẳng cấp cao nhất của Cờ vây) người Hàn Quốc. Anh là người hùng, niềm tự hào dân tộc của xứ sở kim chi và là một trong những kỳ thủ mạnh nhất trong lịch sử Cờ vây. Lee Sedol bắt đầu thi đấu chuyên nghiệp vào năm 13 tuổi (thăng cấp bậc dan chuyên nghiệp ở tuổi 12). Lee Sedol thống trị Cờ vây thế giới trong hơn một thập kỷ với 18 chức Vô địch thế giới. DeepMind lựa chọn Lee Sedol vì họ muốn chọn một người chơi huyền thoại, người mà được công nhận là kỳ thủ Cờ vây vĩ đại nhất trong thập kỷ vừa qua.

*

Lee Sedol – Kỳ thủ Cờ vây vĩ đại người Nước Hàn .

Demis Hassabis nói về trận đấu đặc biệt quan trọng giữa AlphaGo và Lee Sedol : “ Đây là khoảnh khắc lịch sử dân tộc của cả quốc tế Trí tuệ tự tạo lẫn quốc tế Cờ vây. Đến hiện tại, AlphaGo đã vượt mặt mọi thử thách mà chúng tôi đưa ra. Nhưng chúng tôi không hề biết sức mạnh thực sự của nó cho tới khi chúng tôi cho đấu với kỳ thủ Cờ vây số 1 quốc tế như Lee Sedol. ”

Fan Hui cũng đưa ra phản hồi : “ Cả quốc tế đang đặt áp lực đè nén lên Lee Sedol. Trước đây, anh ấy tham gia những giải đấu vì tổ quốc, vì bản thân anh ta. Còn lần này, anh ấy tranh tài quả đât, ví trí tuệ con người. ”

Trái ngược lại, Lee Sedol cảm thấy tự tin về trận đấu này. Anh ấy tin rằng trực giác của con người vẫn còn quá hạng sang để cho Trí tuệ tự tạo hoàn toàn có thể bắt kịp. Lee Sedol hy vọng sẽ giành được thắng lợi 5-0 hoặc 4-1 trước AlphaGo .

Trận đấu chính thức

Trận thách đấu của DeepMind trước kỳ thủ Cờ vây mạnh nhất quốc tế Lee Sedol diễn ra từ ngày 8 tháng 3 năm năm nay đến ngày 15 tháng 3 năm năm nay tại khách sạn Four Seasons ở Seoul, Nước Hàn. Michael Redmond ( 9 – dan chuyên nghiệp ) cùng Chris Garlock là 2 bình luận viên của trận đấu. 5 ván đấu được diễn ra vào những ngày 9/3, 10/3, 12/3, 13/3 và 15/3 và được truyền hình trực tiếp dưới sự theo dõi của 8 triệu người chơi Cờ vây tại Nước Hàn. Hai bên sẽ tranh tài theo luật Trung Quốc, với 7.5 điểm komi. Trong mỗi ván, thời hạn tranh tài số lượng giới hạn trong 2 giờ, sau đó là quá trình byo-yomi, mỗi người có 60 giây để đưa ra mỗi nước đi, không quá 3 lần để hoàn thành xong ván cờ. Aja Huang là đại diện thay mặt bên phía DeepMind chịu nghĩa vụ và trách nhiệm đặt quân cờ vào bàn cờ vây cho AlphaGo .

Xem thêm : Cách Cúng Khai Trương Cửa Hàng Gồm Những Gì, Bài Văn Cúng Khai Trương Dành Cho Doanh Nghiệp, Cửa

*

Trong ván đấu tiên phong này, AlphaGo cầm quân trắng. Lee Sedol đi trước. Lee đã giành quyền trấn áp trong hầu hết cả ván đấu, nhưng AlphaGo đã đạt được lợi thế trong 20 phút cuối và Lee Sedol đã chịu thua. Trận đấu kết thúc sau 186 nước đi. Đen 123 và Đen 129 là lỗi sai ở đầu cuối của Lee và anh đã không hề lật ngược tình thế. Lee tự trách mình với lỗi sai ở Đen 123 và 129 ngay sau khi ván đấu kết thúc .

*

Ván đấu thứ nhất – AlphaGo ( Trắng ) thắng .

AlphaGo cầm quân đen trong ván đấu thứ hai và có lợi thế đi trước đã liên tục giành thắng lợi. Lee Sedol sau đó đã nói rằng “ AlphaGo có một ván đấu gần như tuyệt vời và hoàn hảo nhất ”. Nước đi 37 của AlphaGo được nhìn nhận là một nước đi vô cùng đẹp, phát minh sáng tạo và độc lạ. AlphaGo đã cho thấy những sự dị thường từ những nước đi, nó nhìn ở một góc nhìn rộng hơn khi những kỳ thủ Cờ vây chuyên nghiệp nghĩ rằng đó là một nước đi sai lầm đáng tiếc nhưng thực ra AlphaGo đã đi một nước đi có chủ ý .

Ván đấu thứ hai – AlphaGo ( Đen ) thắng .

Ván thứ ba AlphaGo cầm quân trắng. Nó đã có một trận đấu vô cùng thuyết phục và trong thực tiễn nó đã chơi tốt đến mức … gần như là đáng sợ. Trận đấu kết thúc ở nước đi thứ 176 và AlphaGo đã viết nên lịch sử dân tộc khi có 3 thắng lợi liên tục trước Lee Sedol .

Ván đấu thứ ba – AlphaGo ( Trắng ) thắng .

Ván thứ tư là một ván đấu đặc biệt quan trọng. Lee Sedol đã giành được thắng lợi tiên phong trước AlphaGo. 3 thắng lợi liên tục đã khiến nhà phản hồi Chris Garlock phải thốt lên “ Liệu AlphaGo có điểm yếu nào không ? ”. Thế nhưng, trong ván đấu thứ tư này, AlphaGo đã mắc phải một sai lầm đáng tiếc lẽ ra không đáng có ở nó : Quá tự tin. Nước đi thứ 78 của Lee Sedol được diễn đạt là “ thần thánh ” ( Lee Sedol magic ! ) và ở ngay nước đi sau đó, AlphaGo đã mắc sai lầm đáng tiếc. Tỉ lệ thắng mà nó ước tính đang ở 70 % đùng một cái giảm mạnh ở nước đi thứ 87. Lee Sedol khiến AlphaGo phải “ đầu hàng ” sau 180 nước tranh tài. Chiến thắng này có ý nghĩa rất lớn với Lee Sedol và những người cổ vũ. Nó biểu lộ rằng trí tuệ của con người vẫn hoàn toàn có thể đứng vững, mặc dầu trong tương lai có lẽ rằng sẽ rất khó để vượt mặt AI .

Ván đấu thứ tư – Lee Sedol ( Trắng ) thắng .

Ván đấu thứ năm, Fan Hui cho rằng “ Hình như điểm yếu của Lee Sedol lại quay trở lại khiến anh ấy có 1 số ít nước đi rất tệ. ” Ván đấu kết thúc nhẹ nhàng với thắng lợi giành cho AlphaGo sau 280 nước đi .

Ván thứ năm – AlphaGo (Trắng) thắng.4. Bài học từ AlphaGoNam Chi-hyung (Giáo sư nghiên cứu Cờ vây – Đại học Myongji): “Chúng ta đã nói nhiều về những nước đi rất ‘dị’ và kỳ lạ của AlphaGo, trông thì có vẻ như đó là nước đi lỗi. Cho đến khi ván đấu kết thúc, chính chúng ta phải nghi ngờ về bản thân mình, nghi ngờ về những đánh giá của mình.”Frank Lantz (Giám đốc Trung tâm Trò chơi – Đại học New York): “Với tôi, điều thú vị nhất mà tôi học được ở trò chơi này xuất phát từ việc xem cách mà AlphaGo chơi, nó gọi là ‘những nước đi chùng xuống’. AlphaGo muốn dạy cho chúng ta một điều, chúng ta đang quá phụ thuộc vào điểm số, và dựa vào đó để xác định cơ hội giành chiến thắng. Ở thời điểm này bạn có thể vây được nhiều đất hơn, có được nhiều điểm hơn, tôi đang ít điểm và thất thế, điều đó không có nghĩa là bạn sẽ thắng. Tôi chỉ cần một điểm nút duy nhất để đảo ngược tình hình. Tại sao tôi phải giành thêm đất trong khi tôi không thực sự cần đến nó? Đó là điều mà AlphaGo muốn thay đổi chúng ta về cách nhìn nhận trò chơi này trong tương lai.”Lee Sedol: “Điều làm tôi bất ngờ nhất là cách AlphaGo chỉ cho chúng ta những nước đi mà con người nghĩ rằng ‘thật sáng tạo’, thực chất với nó lại là rất bình thường.”5. Bình luận

DeepMind đã sử dụng công nghệ tiên tiến mạng lưới thần kinh – mô phỏng mạng nơ ron thần kinh của não người cho AlphaGo. AlphaGo tự học chơi cờ vây bằng cách nghiên cứu và phân tích hàng ngàn hàng vạn nước đi của người chơi trước. Sau đó, phối hợp với công nghệ học tăng cường ( reinforcement learning ), nó tự chơi cờ với chính bản thân mình để đẩy trình độ của mình lên những quý phái cao hơn. Về thực chất, những lần tự chơi này giúp tạo ra những nước đi mới mà máy tính hoàn toàn có thể sử dụng để giảng dạy lại chính bản thân. Vì vậy, đây không phải là nước đi của con người. Nói cách khác, mạng lưới hệ thống AlphaGo không quản lý và vận hành để chơi theo cách thường thì, nó chơi theo cách con người sẽ không khi nào làm .

Xem thêm: Cách Làm Ma Trận Trên Máy Tính Vinacal 570Es Plus, Cách Làm Ma Trận Trên Máy Tính Casio Fx

Video về Hành trình đánh bại Lee Sedol của AlphaGo:

Vũ Duy Long – FPT Software

FPT cungdaythang.com chính thức ra mắt chuyên mục mới – “GÓC NHÌN BẠN ĐỌC” là nơi bạn đọc có thể chia sẻ những bài viết về công nghệ mới, kinh nghiệm lập trình, tham gia dự án,… đến cộng đồng yêu công nghệ. Các bài viết chất lượng và được đăng tải trên website FPT cungdaythang.com sẽ nhận được một khoản nhuận bút hấp dẫn thay lời cảm ơn vì những đóng góp của tác giả cho cộng đồng.

More on this topic

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Advertismentspot_img

Popular stories