Meta phát hành CM3leon, một mô hình ngôn ngữ đa phương thức chỉ dành cho bộ giải mã, dựa trên mã thông báo, được tăng cường truy xuất, có khả năng tạo và phổ biến văn bản và hình ảnh. Đây là mô hình đa phương thức đầu tiên được đào tạo bằng cách sử dụng một công thức được điều chỉnh từ mô hình ngôn ngữ văn bản thuần túy, bao gồm giai đoạn đào tạo trước tăng cường truy xuất quy mô lớn và giai đoạn tinh chỉnh (SFT) được giám sát đa tác vụ thứ hai. Là một mô hình chung, nó có thể thực hiện tạo văn bản thành hình ảnh và hình ảnh thành văn bản, cho phép giới thiệu các phương pháp giải mã tương phản độc lập tạo ra đầu ra chất lượng cao.