Các mô hình Veo và Imagen của Google: Thúc đẩy quá trình chuyển đổi văn bản thành video và tạo hình ảnh
Google đã bước vào không gian chuyển văn bản thành video với Veo, một mô hình cung cấp đầu ra video chân thực và chất lượng cao.
Khách hàng Google Cloud hiện có thể truy cập Veo thông qua Vertex AI, cung cấp cho các nhà phát triển và nhà khoa học dữ liệu các công cụ tiên tiến để tạo, đào tạo và triển khai các mô hình ngôn ngữ lớn (LLM) phù hợp với nhiều ứng dụng khác nhau.
Veo: Tạo video thực tế với tính nhất quán nâng cao
Được giới thiệu lần đầu tiên tại Google I/O vào tháng 5, Veo được thiết kế để tạo ra các video chân thực dựa trên lời nhắc của người dùng, duy trì chuyển động mượt mà ở tốc độ 24 hoặc 30 khung hình mỗi giây.
Mô hình này nổi bật nhờ giải quyết được những thách thức thường gặp trong việc tạo video, đặc biệt là đảm bảo tính nhất quán giữa các chuyển động.
Google cũng đã giới thiệu cách Veo có thể biến hình ảnh tham chiếu thành video hoạt hình, giữ nguyên phong cách ban đầu, cho thấy tiềm năng sáng tạo của nó.
Các ví dụ bên dưới cho thấy khả năng làm việc của Veo với cả hình ảnh được tạo bằng Imagen 3 (hai hình trên cùng) và ảnh thực tế (hai hình dưới cùng).
Imagen 3: Trình tạo văn bản thành hình ảnh có thể tùy chỉnh
Imagen 3 của Google, phiên bản mới nhất của trình tạo văn bản thành hình ảnh, cũng có sẵn trên Vertex AI.
Mô hình này bao gồm tính năng tùy chỉnh cho phép người dùng kết hợp hình ảnh tham chiếu vào lời nhắc của họ, hợp lý hóa quy trình tạo nội dung dành riêng cho thương hiệu.
Ngoài ra, Imagen 3 còn giới thiệu các công cụ chỉnh sửa như inpainting để điều chỉnh chính xác và outpainting để mở rộng hình ảnh được tạo ra, giúp người dùng kiểm soát tốt hơn sản phẩm cuối cùng.
Chuyển đổi ngành công nghiệp tiếp thị và sáng tạo
Theo Google, những mô hình này đặc biệt có giá trị cho hoạt động tiếp thị và quảng cáo.
Các doanh nghiệp có thể sử dụng Veo để sản xuất video quảng cáo hoặc Imagen 3 để tạo hình ảnh cho các chiến dịch truyền thông xã hội, bài đăng trên blog và sự kiện.
Ngoài ra, các nhà làm phim có thể tận dụng Veo để tạo ra các video clip phù hợp với nhu cầu sáng tạo cụ thể.
Truy cập Veo và Imagen 3 trên Vertex AI
Vertex AI, nền tảng triển khai LLM của Google Cloud, cung cấp điểm vào dễ tiếp cận cho những ai quan tâm đến việc khám phá các mô hình này.
Nó bao gồm các tài nguyên như hướng dẫn và thuật ngữ để hỗ trợ người dùng, cho dù họ là người mới làm quen với việc tạo nội dung bằng AI hay là chuyên gia giàu kinh nghiệm.
Google cung cấp bản dùng thử miễn phí và liên hệ trực tiếp với đội ngũ bán hàng cho bất kỳ ai quan tâm đến việc tìm hiểu thêm về khả năng của Vertex AI.