Quên thú cưng ảo đi – trào lưu video AI tiếp theo là mèo thực hiện màn lặn Olympic, tất cả nhờ đối thủ Veo 3 mới này của Google

Nhìn con mèo bước lên ván nhảy, tôi có thể tưởng tượng ra những cuộc gọi đến sở cứu hỏa hoặc một đám đông khổng lồ đổ xô đi cứu nó, gây ra một thảm họa, trong khi con mèo chỉ đơn giản chớp mắt trước bi kịch đó. Thay vào đó, con mèo đã thực hiện một cú lộn ba vòng đẳng cấp Olympic xuống hồ bơi. Nếu không phải vì hành động không thể tin được đó và việc tôi biết đó là một video do AI tạo ra, thì tôi đã nghĩ xem liệu có tình huống Freaky Friday (hoán đổi thân xác) nào xảy ra với đội bơi lội của Hoa Kỳ không.
Thay vào đó, đó là một video lan truyền mạnh mẽ được sản xuất bằng mô hình Hailuo 02 của nhà phát triển video AI Trung Quốc MiniMax. Hàng triệu người xem video về những chú mèo lặn có thể không phải là thật, nhưng nó đủ chân thực để chen chân vào cuộc cạnh tranh giành quyền thống trị video AI, cùng với Google Veo 3 và Sora của OpenAI, cùng nhiều đối thủ khác.
MiniMax đã ra mắt Hailuo 02 vào đầu mùa hè này, nhưng sự lan truyền của video Olympic giả mạo cho thấy nó sẽ trở thành một công cụ rất phổ biến để biến hình ảnh tĩnh hoặc lời nhắc văn bản thành video. Hiện tại, mô hình này chỉ tạo ra các clip dài năm đến mười giây, nhưng khả năng tùy chỉnh chuyển động, hiệu ứng camera và mô phỏng vật lý thế giới thực ấn tượng, như chuyển động của lông hoặc nước bắn tung tóe, khiến nó trở nên hấp dẫn hơn.
Việc thử nghiệm Hailuo 02 với các video mèo lặn dường như diễn ra một cách tự nhiên khi người dùng X R.B Keeper (có lẽ không phải tên thật của họ) đã thử một lời nhắc mà họ thấy đã được thử nghiệm trên Veo 3. Ý tưởng này lan rộng từ đó sang một phiên bản thu hút hàng triệu lượt xem chỉ trong vài giờ và xuất hiện trên TikTok, Reddit, và Instagram, với vô số biến thể. Hailuo 02 sử dụng mô phỏng vật lý từng khung hình, lời nhắc chuyển động được ánh xạ sự chú ý, và phân tích đầu vào đa phương thức. Nói cách khác, nếu bạn gõ một ý tưởng kỳ lạ, mô hình sẽ cố gắng hết sức để làm cho nó trông và hoạt động giống như trong một sự gần đúng với thế giới thực.
Đáng chú ý, Hailuo 02 được cho là rẻ hơn và nhanh hơn nhiều so với Veo 3, mặc dù có thể không có độ bóng bẩy cao cấp bằng. Tuy nhiên, nó dễ tiếp cận hơn, không bị giới hạn trong các dịch vụ doanh nghiệp và chương trình beta như Veo 3.
Các video mèo lặn là đỉnh cao của một biểu đồ Venn rất cụ thể về các xu hướng internet, công cụ dễ tiếp cận và niềm vui không quá rủi ro. Bạn không cần phải là một biên tập viên chuyên nghiệp hay sở hữu một siêu máy tính để thử nó. Và nhiều nâng cấp hơn đang ở phía chân trời. MiniMax đã vạch ra kế hoạch tích hợp âm thanh đồng bộ, kiểm soát ánh sáng và kết cấu, cũng như các clip dài hơn. Đối với Google Veo 3 và các ông lớn khác, hiện tại họ có phân khúc chuyên nghiệp của mình. Nhưng nếu muốn mở rộng sức hấp dẫn đối với đại chúng, họ có thể xem xét những gì MiniMax và các nhà phát triển nhỏ hơn như Midjourney, với mô hình video V1 của họ, đang làm. Hailuo 02 là loại công cụ sẽ khiến mọi người, giống như những chú mèo, “nhảy vào” cuộc chơi.