Sự trỗi dậy của trí tuệ nhân tạo (AI) đang khuấy động những cuộc tranh luận gay gắt về ranh giới sáng tạo, về khả năng của máy móc trong lĩnh vực vốn được xem là thành trì của tư duy và cảm xúc con người, không gì khác ngoài “nghệ thuật”. Đối với AI, giờ đây không chỉ là công cụ phân tích dữ liệu khô khan hay tự động hóa những quy trình lặp đi lặp lại, nó đã bước chân vào thế giới của âm nhạc, hình ảnh, văn chương, tạo ra những sản phẩm mang dáng dấp của nghệ thuật.
Nhưng liệu đó có thực sự là nghệ thuật? Hay chỉ là sự mô phỏng tinh xảo, một bản sao hoàn hảo được nhào nặn từ dữ liệu khổng lồ? Và nếu AI có thể tạo ra cái đẹp, liệu vẻ đẹp đó có chiều sâu, có ý nghĩa, có khả năng chạm đến trái tim như những tác phẩm được sinh ra từ tâm hồn con người?
Một trong những hướng tiếp cận của AI là nỗ lực “lượng hóa cái đẹp” biến những phẩm chất thẩm mỹ trừu tượng thành những con số cụ thể. Mô hình Audiobox-Aesthetics được thiết kế để dự đoán cảm nhận của con người về âm thanh, gán điểm số cho chất lượng sản xuất, độ phức tạp, mức độ thưởng thức và tính hữu ích của nội dung. Tuy nhiên, ý tưởng này vấp phải sự hoài nghi sâu sắc. Jeffrey Anthony, một chuyên gia phân tích âm nhạc cho rằng vẻ đẹp không thể bị “giải phẫu” từ một dạng sóng âm. Nó nằm ở ngữ cảnh, ở sự liên kết của các yếu tố, chứ không phải ở những giá trị trung bình khô khan.
“Ý nghĩa thẩm mỹ” ông khẳng định là không thể xuất hiện từ việc thống kê các khoảnh khắc rời rạc. Anthony thừa nhận tính hữu dụng của mô hình trong việc gợi ý nội dung, nhưng nhấn mạnh rằng nó không thể “thấu hiểu” được sức mạnh lay động của một bản nhạc.
Sự hoài nghi về khả năng AI thấu hiểu và cảm nhận vẻ đẹp không chỉ dừng lại ở lĩnh vực âm thanh. Khi chúng ta chuyển hướng sang phân tích thẩm mỹ trong không gian thị giác, câu hỏi liệu một trí tuệ nhân tạo có thực sự “nhìn thấy” và “đánh giá” được vẻ đẹp của một hình ảnh hay không càng trở nên phức tạp và cấp thiết, đòi hỏi một sự mổ xẻ sâu hơn về bản chất của quá trình “nhận thức” và “phán đoán” từ máy móc.
Tuy nhiên, một câu hỏi sâu hơn nảy sinh khi một AI “nhận định” một bức ảnh là đẹp hay xấu, liệu nó có thực sự “thấy” được vẻ đẹp như con người cảm nhận? Bản chất của sự đánh giá này là gì? Khi chúng ta gửi một tấm ảnh cho AI và nó đưa ra phán quyết, đó không phải là một trải nghiệm thẩm mỹ nội tâm tương tự như con người. Thay vào đó, AI vận hành dựa trên các thuật toán phức tạp và một kho dữ liệu khổng lồ gồm hàng triệu, thậm chí hàng tỷ hình ảnh đã được con người gán nhãn ví dụ như “đẹp”, “hấp dẫn”, “hài hòa” hoặc ẩn ý qua các chỉ số tương tác như lượt thích, chia sẻ, thời gian xem. AI học cách nhận diện các mẫu hình, các mối tương quan thống kê giữa những đặc điểm thị giác như màu sắc, bố cục, đường nét, đối tượng và các nhãn thẩm mỹ do con người định nghĩa. Do đó, nhận định của nó là một dự đoán dựa trên xác suất, một sự quy chiếu về những gì số đông đã từng coi là đẹp.
Bản chất “vẻ đẹp” mà AI nhận diện, vì thế là một sự phản ánh của thị hiếu tập thể, một dạng “vẻ đẹp đồng thuận” hay “vẻ đẹp phổ thông” được chắt lọc từ dữ liệu huấn luyện. Điều này có nghĩa là AI có thể rất giỏi trong việc xác định những hình ảnh tuân theo các chuẩn mực thẩm mỹ truyền thống, những gì dễ dàng được chấp nhận rộng rãi. Tuy nhiên, nó sẽ gặp khó khăn với vẻ đẹp độc đáo, phá cách, mang tính tiên phong hoặc thuộc về những “thị hiếu ngách”, bởi những biểu hiện này thường đi ngược lại hoặc nằm ngoài các quy tắc đã học. Quan trọng hơn, AI không “hiểu” được tại sao một điều gì đó lại đẹp ở tầng sâu triết học hay cảm xúc. Nó có thể xác định một bức tranh có bố cục “cân bằng vàng” hoặc phối màu “hài hòa” theo lý thuyết, nhưng không cảm nhận được sự rung động, ý niệm hay câu chuyện mà người nghệ sĩ gửi gắm.
Giới hạn cốt lõi trong sự “cảm thụ” của AI nằm ở việc thiếu vắng hoàn toàn trải nghiệm chủ quan và nhận thức ngữ cảnh tinh vi. Con người nhìn nhận vẻ đẹp qua một lăng kính đa chiều, được hun đúc từ kinh nghiệm cá nhân, nền tảng văn hóa, trạng thái cảm xúc tức thời và bối cảnh cụ thể của sự vật, hiện tượng. AI không sở hữu thế giới nội tâm này, không có “qualia” – những phẩm chất cảm giác chủ quan. Nó không biết đến sự kinh ngạc trước một cảnh hoàng hôn hùng vĩ, nỗi nhớ nhung khi nhìn một bức ảnh cũ, hay những tầng ý nghĩa ẩn dụ mà một tác phẩm nghệ thuật có thể khơi gợi. Một bức ảnh mờ, có lỗi kỹ thuật về một kỷ niệm thời thơ ấu có thể mang vẻ đẹp vô song đối với một cá nhân, nhưng AI, với sự phân tích thuần túy dựa trên thông số, có thể lạnh lùng xếp nó vào loại “chất lượng thấp”.
Cần phân biệt giữa “vẻ đẹp chức năng” và “vẻ đẹp thẩm mỹ thuần túy” khi xem xét khả năng của AI. “Vẻ đẹp chức năng” có thể được tìm thấy trong một bức ảnh sản phẩm được tối ưu hóa cho mục đích tiếp thị, một giao diện người dùng trực quan, hay một thiết kế công nghiệp hiệu quả. AI có thể học và trở nên xuất sắc trong việc nhận diện và thậm chí tạo ra dạng vẻ đẹp này, dựa trên các tiêu chí rõ ràng như tỷ lệ chuyển đổi, mức độ dễ sử dụng, hoặc sự tuân thủ các nguyên tắc thiết kế đã được chứng minh. Tuy nhiên, “vẻ đẹp thẩm mỹ” trong nghệ thuật lại thường mang tính đột phá, thách thức các quy ước, và đòi hỏi một sự đồng cảm sâu sắc từ người xem, những phẩm chất mà AI với bản chất dựa trên dữ liệu lịch sử, rất khó để nắm bắt trọn vẹn hoặc tự mình khai phá.
Trong tương lai, khả năng phân tích các mẫu hình thị giác của AI chắc chắn sẽ là một công cụ hỗ trợ đắc lực cho nghệ sĩ, nhà thiết kế, và những người làm công tác giám tuyển. Nó có thể giúp nhận diện xu hướng, đề xuất cải tiến dựa trên phân tích dữ liệu, hoặc thực hiện các thử nghiệm A/B để tối ưu hóa hiệu quả thị giác. Dù vậy, việc coi AI như một “thẩm phán tối cao” về vẻ đẹp tiềm ẩn nguy cơ đồng hóa thị hiếu thẩm mỹ, làm suy giảm sự đa dạng và kìm hãm những sáng tạo độc đáo không phù hợp với các chuẩn mực thống kê. Bản chất của sự phán xét từ AI là thuật toán và dựa trên dữ liệu, chứ không phải là trải nghiệm hay cảm xúc. Nó phản ánh “những gì đã được coi là đẹp” hơn là một sự “thấu thị” hay “cảm nhận” nội tại về chính vẻ đẹp. Do đó, AI “nhận định” dựa trên sự so khớp mẫu, chứ không thực sự “thấy” hay “cảm” được vẻ đẹp theo cách mà con người vốn có.
Cory Doctorow, nhà văn và nhà hoạt động xã hội đã đưa ra một lập luận tương tự về hình ảnh do AI tạo ra. Ông cho rằng, nghệ thuật đích thực không nằm ở độ sắc nét hay vẻ ngoài bóng bẩy. Nó là kết tinh của vô vàn lựa chọn vô thức, những dấu ấn cá nhân không thể sao chép. Thiếu đi “dòng chảy ý niệm” này, hình ảnh AI có thể ấn tượng về mặt kỹ thuật, nhưng lại trống rỗng về mặt cảm xúc. Doctorow coi đây là một khiếm khuyết chết người của nghệ thuật AI.
Tuy nhiên, lập luận này không phải không có những ý kiến phản biện. Nhiều người cho rằng, ngay cả khi sử dụng AI, ý định sáng tạo của con người vẫn đóng vai trò then chốt. Hãy tưởng tượng một nghệ sĩ sử dụng Midjourney để tạo chân dung nhân vật trong tiểu thuyết của mình. Họ đưa ra những yêu cầu chi tiết, tinh chỉnh kết quả, lặp đi lặp lại quá trình cho đến khi có được hình ảnh ưng ý. Đó không phải là sự “khoán trắng” cho máy móc, mà là sự hợp tác, là việc sử dụng công nghệ để hiện thực hóa một tầm nhìn nghệ thuật. Những hình ảnh này không chỉ giúp họ hình dung rõ hơn về nhân vật, mà còn mang lại cảm giác trực quan, sống động, vượt xa những mô tả khô khan.
Vậy đâu là bản chất của nghệ thuật? Nhiều người cho rằng, nó là một “hành động giao tiếp,” một nỗ lực truyền tải những cảm xúc sâu xa, những trải nghiệm không lời từ tâm hồn nghệ sĩ đến người thưởng lãm. Khi một nhà văn viết, họ đưa ra vô số quyết định nhỏ, từ việc chọn từ ngữ đến việc xây dựng cấu trúc câu, tất cả đều nhằm mục đích gợi lên một cảm xúc cụ thể trong lòng người đọc. Mỗi quyết định đó là một “tín hiệu,” một phần của một “mật mã” cảm xúc. Dù cuốn sách đó hay hay dở, nó vẫn mang trong mình “ý định giao tiếp” mạnh mẽ.
Câu chuyện về những lá thư giới thiệu tại một trường luật là một ví dụ điển hình cho thấy sự khác biệt giữa thông tin cô đọng và “sự tô vẽ” của AI. Trước đây, một lá thư giới thiệu từ một giáo sư danh tiếng là một “chứng chỉ” về năng lực của sinh viên. Nhưng với sự xuất hiện của chatbot, việc tạo ra một lá thư giới thiệu trở nên quá dễ dàng. Chỉ cần vài gạch đầu dòng, AI có thể tạo ra một đoạn văn hoa mỹ, nhưng lại thiếu đi sự chân thành và đánh giá thực chất. Khi những lá thư này được “giải mã” bởi một AI khác, những gì còn lại chỉ là những gạch đầu dòng ban đầu. Tất cả những từ ngữ hoa mỹ kia trở nên vô nghĩa.
Điều tương tự cũng xảy ra với nghệ thuật AI. “Câu lệnh” (prompt) mà chúng ta đưa cho AI để tạo ra một tác phẩm, dù là văn bản hay hình ảnh, chính là “ý định giao tiếp” duy nhất được truyền vào tác phẩm. Khi chúng ta chỉ đưa ra một vài từ khóa, AI sẽ “pha loãng” ý định đó vào hàng ngàn chi tiết, tạo ra một tác phẩm có vẻ ngoài ấn tượng, nhưng lại thiếu đi chiều sâu cảm xúc. Đó có lẽ là lý do tại sao nhiều người cảm thấy nghệ thuật AI “vô hồn” và “lạnh lẽo.”
Tuy nhiên, nếu chúng ta tương tác nhiều hơn với AI, kết quả có thể khác. Nếu AI tạo ra hàng chục phiên bản dựa trên câu lệnh của chúng ta, và chúng ta chọn ra một phiên bản ưng ý nhất, đó là một “quyết định nghệ thuật” khác được đưa vào tác phẩm. Nếu chúng ta liên tục tinh chỉnh câu lệnh, “dẫn dắt” AI, chúng ta đang “truyền” thêm ý định giao tiếp vào tác phẩm. Lúc đó, AI không còn là một công cụ thụ động, mà là một cộng sự, một người đồng sáng tạo.
Hơn nữa, không phải mọi biểu hiện nghệ thuật giá trị đều cần đến sự phức tạp trong cấu trúc hay sự cầu kỳ trong chi tiết. Lịch sử nghệ thuật đã ghi nhận sức mạnh của sự tối giản, nơi những tác phẩm với hình thức vô cùng tinh gọn, đôi khi chỉ là một vài nét vẽ chủ đạo hay một ý niệm được cô đọng, lại có khả năng khơi gợi những tầng cảm xúc mãnh liệt và thách thức sâu sắc những định nghĩa truyền thống về nghệ thuật. Một bài thơ haiku ngắn ngủi với vài âm tiết, hay một vòng tròn enso đơn nhất trong thiền họa phương Đông, dù kiệm lời và tinh giản đến cùng cực, vẫn có thể hàm chứa cả một vũ trụ ý niệm và lay động tâm thức người xem một cách sâu sắc.
Vậy đâu là câu trả lời cuối cùng? Liệu AI có thể tạo ra nghệ thuật? Có lẽ câu hỏi đúng không phải là “liệu” mà là “như thế nào.” AI có thể “bắt chước” cái đẹp, nhưng nó không thể “thấu hiểu” được cái đẹp. Ý nghĩa đến từ góc nhìn, từ trải nghiệm, từ những cảm xúc phức tạp của con người. AI có thể là một công cụ mạnh mẽ, nhưng nó cần được dẫn dắt bởi ý niệm, bởi sự sáng tạo của con người. Chỉ khi đó, nó mới có thể giúp chúng ta nhìn thấy vẻ đẹp của thế giới, và vẻ đẹp của chính mình, một cách rõ ràng hơn.
Xem thêm: Giải mã tư duy AI: Những góc tối được hé mở