Gã khổng lồ công nghệ Trung Quốc Alibaba gần đây đã công bố một trình tạo video hỗ trợ AI mới như một phần trong danh mục đầu tư mở rộng Tongyi Wanxiang, đánh dấu bước đột phá đầy tham vọng của công ty vào lĩnh vực sáng tạo video hỗ trợ AI.
Sự ra mắt này, được tiết lộ trong Hội nghị Alibaba Cloud Apsara, tiếp nối sự ra mắt thành công của công cụ tạo hình ảnh AI vào năm ngoái.
Model Qwen 2.5 mới có tiềm năng cách mạng hóa việc sản xuất nội dung bằng cách cho phép người dùng tạo nội dung video chất lượng cao từ lời nhắc văn bản bằng cả tiếng Trung và tiếng Anh.
Là một phần của chương trình LLM, Qwen 2.5 bao gồm 100 mô hình AI nguồn mở, cung cấp các tính năng mở rộng ứng dụng trên nhiều ngành công nghiệp khác nhau.
Nâng cao danh mục đầu tư Tongyi Wanxiang bằng công cụ video mạnh mẽ
Bộ sưu tập Tongyi Wanxiang của Alibaba, ban đầu được ra mắt với công cụ tạo hình ảnh AI, đang phát triển nhanh chóng.
Sự bổ sung mới nhất — trình tạo video AI — mang đến những khả năng mới cho cả doanh nghiệp và người sáng tạo cá nhân. Điểm khác biệt của công cụ này là khả năng không chỉ tạo video từ mô tả văn bản mà còn chuyển đổi hình ảnh tĩnh thành nội dung video động.
Tính linh hoạt này mở ra cánh cửa cho những nhà sáng tạo muốn sản xuất nhiều loại phương tiện truyền thông khác nhau, từ clip hoạt hình đến cảnh quay thực tế.
Các giám đốc điều hành của Alibaba đã nhấn mạnh cam kết của công ty trong việc tạo ra công cụ video linh hoạt và thích ứng với đối tượng khán giả toàn cầu, chia sẻ rằng "công cụ video này nhằm mục đích tạo ra nội dung video chất lượng cao từ lời nhắc văn bản bằng cả tiếng Trung và tiếng Anh".
Việc hỗ trợ song ngữ này có thể sẽ đưa trình tạo video của Alibaba trở thành đối thủ cạnh tranh mạnh mẽ trên một thị trường đang phát triển.
Kiến trúc máy biến áp khuếch tán tiên tiến của Alibaba
Điểm cốt lõi của máy tạo video mới của Alibaba là kiến trúc biến áp khuếch tán (DiT) tiên tiến.
Công nghệ này đảm bảo chất lượng video được giữ nguyên, bất kể phong cách hình ảnh nào được chọn.
Cho dù người dùng lựa chọn phong cách thẩm mỹ thực tế hay hoạt hình, DiT đều cho phép nội dung được tạo ra đáp ứng nhiều nhu cầu sáng tạo khác nhau mà không làm mất đi độ trung thực về mặt hình ảnh.
Một trong những tính năng nổi bật của mô hình này là khả năng phục vụ cho cả lĩnh vực sáng tạo và doanh nghiệp.
Các doanh nghiệp có thể tận dụng nó để tạo video quảng cáo hoặc video khuyến mại, trong khi các công ty giải trí có thể thấy nó có giá trị trong việc tạo hiệu ứng hình ảnh hoặc chuỗi sự kiện.
Với nhiều khả năng đa dạng, công cụ của Alibaba sẵn sàng tạo ra tác động trong nhiều lĩnh vực khác nhau.
Tăng cường sự hiện diện trên thị trường trong bối cảnh cạnh tranh ngày càng tăng
Việc phát hành trình tạo video của Alibaba diễn ra vào thời điểm quan trọng trong thị trường video AI đang phát triển nhanh chóng.
Trong khi các công cụ tạo video hỗ trợ AI gần như chưa được người tiêu dùng biết đến chỉ vài năm trước, thì kể từ đó, một số công ty đã tham gia vào lĩnh vực này.
Mô hình Sora của OpenAI đã thu hút sự chú ý nhờ các tính năng sáng tạo nhưng vẫn chỉ giới hạn ở một số đối tác được chọn, tạo cơ hội cho các đối thủ cạnh tranh giành được sự chú ý.
Runway, Stability AI, Pika và Hotshot đều đã phát triển các giải pháp thay thế, giúp lấp đầy khoảng trống cho người dùng đang tìm kiếm các công cụ video AI dễ tiếp cận và tinh vi.
Luma Labs, với Dream Machine, cũng nổi lên như một đơn vị chủ chốt, cung cấp các giải pháp sáng tạo video cực kỳ tiên tiến.
Mỗi công ty này đều đang tích cực mở rộng ranh giới của AI trong sản xuất nội dung video.
Bất chấp thị trường đông đúc, sự gia nhập của Alibaba vẫn đáng chú ý nhờ năng lực công nghệ và tác động tiềm tàng đến ngành.
Tuy nhiên, không chỉ cạnh tranh với các công ty phương Tây, các công ty Trung Quốc khác cũng đang cạnh tranh để thống trị lĩnh vực này.
Bytedance, công ty mẹ của TikTok, đang phát triển công cụ video AI của riêng mình có tên là mô hình Jimeng, được coi là đối thủ cạnh tranh trực tiếp với Tongyi Wanxiang của Alibaba.
Khi cả hai công ty đều cải tiến sản phẩm dịch vụ của mình, cuộc cạnh tranh giành vị trí dẫn đầu thị trường sẽ ngày càng trở nên gay gắt.
Các tính năng mới mang đến các giải pháp sáng tạo cho nhiều ngành công nghiệp
Một trong những khía cạnh thú vị nhất của trình tạo video của Alibaba là ứng dụng của nó trong nhiều ngành công nghiệp khác nhau.
Từ sản xuất phim và quảng cáo đến phát triển trò chơi và giáo dục, mô hình này cung cấp nhiều trường hợp sử dụng.
Trong thông báo, các giám đốc điều hành nhấn mạnh rằng công cụ này được tối ưu hóa đặc biệt cho tính thẩm mỹ của người Trung Quốc, một tính năng giúp công cụ này trở nên nổi bật trên thị trường.
Khả năng phản ánh chính xác các yếu tố văn hóa Trung Quốc mang lại cho Alibaba một lợi thế riêng biệt, đặc biệt là trong việc sáng tạo nội dung cho thị trường trong nước và quốc tế đang tìm kiếm phong cách hình ảnh đích thực của Trung Quốc.
Ngoài ra, mô hình này còn hỗ trợ đầu vào đa ngôn ngữ và tạo ra độ phân giải khác nhau, cho phép người dùng tùy chỉnh đầu ra tùy theo đối tượng hoặc nền tảng mong muốn.
Tính linh hoạt này còn được tăng cường hơn nữa nhờ tính năng "Mở rộng cảm hứng", được thiết kế để hỗ trợ người dùng khi họ thiếu ý tưởng sáng tạo.
Bằng cách mở rộng các lời nhắc văn bản ngắn thành các mô tả chi tiết, công cụ này giúp người dùng tạo ra các video tinh tế và hấp dẫn hơn về mặt hình ảnh.
Tích hợp liền mạch sản xuất âm thanh và video
Một trong những tính năng nổi bật của trình tạo video AI mới của Alibaba là khả năng tích hợp âm thanh trực tiếp vào nội dung video.
Bằng cách tự động tạo hiệu ứng âm thanh phù hợp với hình ảnh, công cụ này giúp đơn giản hóa quá trình đồng bộ hóa âm thanh với video thường tốn nhiều công sức.
Kết quả là một quy trình sản xuất hiệu quả có thể nâng cao đáng kể năng suất sáng tạo.
Tính năng đồng bộ hóa âm thanh-video này giúp người dùng dễ dàng tạo nội dung hoàn chỉnh mà không cần phần mềm bổ sung hoặc công cụ chỉnh sửa âm thanh bên ngoài.
Hơn nữa, dịch vụ này hiện đang được cung cấp miễn phí trên ứng dụng, nơi người dùng có thể sử dụng không giới hạn hàng ngày, khiến nó trở thành lựa chọn hấp dẫn cho cả doanh nghiệp và cá nhân sáng tạo.
Alibaba tiếp tục mở rộng sang AI
Mô hình video AI Tongyi Wanxiang của Alibaba, với các tính năng sáng tạo và sự hiện diện ngày càng tăng trên thị trường, là một bước tiến quan trọng trong chiến lược AI rộng lớn hơn của công ty.
Khi gã khổng lồ công nghệ tiếp tục mở rộng danh mục đầu tư Tongyi, họ định vị mình là một đối thủ đáng gờm trong không gian sáng tạo do AI thúc đẩy.
Mặc dù Alibaba vẫn chưa cung cấp đầy đủ thông tin chi tiết về tất cả các ứng dụng tiềm năng, nhưng công cụ này hiện đang được xem xét cho nhiều lĩnh vực khác nhau, bao gồm phim ảnh, quảng cáo, trò chơi và giáo dục.
Việc công ty tập trung vào việc phát triển quan hệ đối tác với bên thứ ba cho thấy công cụ video Tongyi Wanxiang có thể được tích hợp vào các nền tảng hiện có, bao gồm cả hệ thống chơi game, để tạo cảnh cắt hoặc chuỗi hình ảnh.
Sẽ rất thú vị khi chứng kiến công nghệ này phát triển như thế nào và các đối thủ cạnh tranh khác trong lĩnh vực này phản ứng ra sao trước những tiến bộ của Alibaba.