Google Imagen 3, một trong những mô hình AI chuyển văn bản thành hình ảnh mạnh mẽ nhất hiện nay, đã được tích hợp vào các ứng dụng Gemini từ lâu. Tuy nhiên, khả năng tạo ra hình ảnh người trước đây chỉ là một đặc quyền dành cho người dùng trả phí. Giờ đây, điều đó đã thay đổi, mở ra một kỷ nguyên mới cho người dùng Gemini miễn phí.
Gemini Mở Rộng Tính Năng Tạo Ảnh Người Cho Người Dùng Miễn Phí
Nếu bạn thường xuyên sử dụng ứng dụng web, máy tính để bàn hoặc di động của Gemini, chắc hẳn bạn đã trải nghiệm khả năng tạo hình ảnh của nó, được hỗ trợ bởi mô hình Google Imagen 3. Google đã công bố phát hành rộng rãi công cụ này cho tất cả người dùng vào tháng 8 năm 2024, với các tùy chọn đa dạng từ “phong cảnh siêu thực” đến “cảnh đất sét sống động”, theo thông báo trên Google’s The Keyword.
Tuy nhiên, việc tạo hình ảnh có người lại là một câu chuyện khác. Google đã giới hạn tính năng cụ thể này cho các thuê bao trả phí, bao gồm người dùng Gemini Advanced, Business và Enterprise. Nếu bạn sở hữu một tài khoản miễn phí và cố gắng yêu cầu Gemini tạo một hình ảnh có người, bạn sẽ nhận được thông báo tương tự như sau: “Tính năng tạo hình ảnh người chỉ có sẵn trong quyền truy cập sớm với Gemini Advanced. Nhận quyền truy cập sớm vào các tính năng mới của Gemini khi bạn đăng ký Advanced tại đây.”
Hiện tại, kể từ tháng 2 năm 2025, hầu hết người dùng Gemini miễn phí đã có thể tạo thành công các hình ảnh có liên quan đến người. Mặc dù vậy, nếu bạn vẫn nhận được thông báo lỗi, có thể tính năng này vẫn đang trong quá trình triển khai đến tài khoản của bạn. Việc triển khai dường như diễn ra dần dần, bắt đầu từ những người dùng ở Hoa Kỳ và sử dụng Gemini với ngôn ngữ tiếng Anh.
Người dùng tương tác với Gemini để yêu cầu tạo ảnh một phụ nữ đang ăn kem, minh họa tính năng tạo hình ảnh AI.
Cần lưu ý rằng bạn vẫn không thể tạo ra hình ảnh thực tế của những người có thể nhận dạng được hoặc trẻ em, theo hướng dẫn chính sách của Gemini.
Imagen 3 Hoạt Động Hiệu Quả Thế Nào Trên Gemini Flash 2.0?
Cũng trong tháng 2 năm 2025, Google đã phát hành rộng rãi mô hình Gemini nhanh nhất của mình cho người dùng miễn phí. Google mô tả mô hình này, có tên là Gemini 2.0 Flash, là một “ngựa chiến hiệu quả cao”, hứa hẹn những điều tốt đẹp cho khả năng tạo hình ảnh AI. Theo truyền thống, việc tạo hình ảnh AI thường tốn nhiều năng lượng và thời gian hơn so với tạo văn bản thông thường. Do đó, về lý thuyết, chất lượng hình ảnh AI có thể đạt được cao hơn khi được hỗ trợ bởi một mô hình mạnh mẽ hơn làm công cụ.
Chất lượng dường như đặc biệt quan trọng khi nói đến việc mô tả con người. Chúng ta đều đã chứng kiến những hình ảnh người do AI tạo ra trong giai đoạn đầu, từ những bàn tay bị biến dạng với các chi thừa đến đôi mắt trống rỗng đầy ám ảnh. Vì vậy, người viết có thể hiểu sự e dè khi tin tưởng vào công cụ tạo hình ảnh AI của Google với tư cách là người dùng miễn phí.
Giao diện Gemini hiển thị một loạt hình ảnh AI được tạo ra, cho thấy khả năng đa dạng của Imagen 3.
Trái ngược với những lo ngại ban đầu, chất lượng của Imagen 3 trên Gemini khi tạo các hình ảnh có người đã thực sự gây ấn tượng mạnh. Đặc biệt khi xem xét đây là một dịch vụ miễn phí, những lần thử nghiệm tạo ảnh đầu tiên đã cho ra kết quả chất lượng cao, chân thực và rất phù hợp với yêu cầu đã cung cấp. Một điểm cộng lớn là bạn có thể yêu cầu Gemini tiếp tục chỉnh sửa hình ảnh mà không cần phải bắt đầu lại từ đầu mỗi lần.
Một trong những hình ảnh AI chất lượng cao do Gemini tạo ra, mô tả một phụ nữ đang ăn kem, minh chứng cho việc Gemini có thể tạo ảnh người một cách tự nhiên.
Việc truy cập Imagen 3 thông qua Gemini hoàn toàn miễn phí chắc chắn là một trải nghiệm thú vị, nhưng việc phải tránh tạo hình ảnh có người luôn là một hạn chế đáng kể. Bản cập nhật mới nhất của Google đã mở rộng đáng kể sân chơi, khiến dịch vụ miễn phí của Gemini trở thành một đối thủ cạnh tranh xứng tầm với các dịch vụ trả phí như Midjourney. Mặc dù các dịch vụ trả phí có thể cung cấp nhiều tùy chọn nâng cao hơn, chẳng hạn như kích thước hình ảnh tùy chỉnh, cách tiếp cận của Gemini lại rất dễ sử dụng và sẵn sàng hoạt động. Với rất nhiều tính năng miễn phí, điều này đặt ra câu hỏi liệu quyền truy cập sớm có còn đủ sức thuyết phục người dùng trả tiền cho Gemini Advanced hay không.