Kể từ khi ra mắt, DALL-E đã có những bước tiến vượt bậc, khẳng định vị thế là một trong những công cụ tạo ảnh AI hàng đầu hiện nay. Tuy nhiên, bất chấp những cải tiến đáng kể, DALL-E vẫn còn xa mới đạt đến sự hoàn hảo. Khi người dùng tương tác với công cụ này thường xuyên hơn, những hạn chế của DALL-E và các vấn đề cố hữu bắt đầu trở nên rõ ràng. Từ sự thiếu nhất quán trong phong cách, khả năng xử lý văn bản kém, đến việc không tuân thủ các yêu cầu cụ thể, những nhược điểm DALL-E này có thể ảnh hưởng đến trải nghiệm và hiệu quả sử dụng. Bài viết này sẽ đi sâu phân tích các vấn đề của DALL-E mà bạn có thể gặp phải, giúp bạn hiểu rõ hơn về công cụ AI tạo ảnh này trước khi bắt tay vào sáng tạo.
1. Gặp Khó Khăn Với Văn Bản Trong Hình Ảnh
Trong số hàng chục công cụ tạo ảnh AI mà tôi đã thử nghiệm, DALL-E vẫn là một trong những ứng dụng tệ nhất trong việc tạo ra văn bản chính xác trong hình ảnh. Mặc dù bạn có thể thành công hơn với các yêu cầu đơn giản, nhưng như ví dụ dưới đây, phần mềm vẫn gặp khó khăn trong việc viết đúng dấu giọng trong từ “Café”.
Hình ảnh quán cà phê được tạo bằng DALL-E với lỗi văn bản dấu tiếng Pháp
Trong nhiều thử nghiệm, DALL-E cũng thường xuyên viết sai chính tả văn bản mà tôi cung cấp – mặc dù tôi đã đưa ra các prompt rất rõ ràng và cố gắng điều chỉnh nhiều lần. Trong các trường hợp khác, văn bản bị bóp méo hoặc không thể đọc được. Bạn cũng sẽ nhận thấy rằng DALL-E không thể tạo ra văn bản rõ ràng cho các biển báo đường phố hoặc các vật thể tương tự.
2. Không Thay Đổi Kích Thước Ảnh Khi Được Yêu Cầu
DALL-E hiểu khá tốt nhu cầu tạo ra một hình ảnh, nhưng lại rất kém trong việc điều chỉnh kích thước ảnh khi được yêu cầu. Ví dụ, tôi đã nhiều lần yêu cầu phần mềm thay đổi kích thước hình ảnh cho các bài đăng blog khác nhau; mỗi lần, DALL-E chỉ đơn thuần tạo lại một bức ảnh mới thay vì resize ảnh hiện có.
May mắn thay, việc cắt và chỉnh sửa kích thước ảnh AI khá đơn giản. Nhiều công cụ miễn phí như Canva cho phép bạn thực hiện điều này. Tuy nhiên, sẽ tiện lợi hơn nếu có thể thực hiện trực tiếp trong DALL-E mà không cần phải dùng đến phần mềm bên thứ ba.
3. Kém Trong Việc Tạo Ảnh Chân Thực
DALL-E không gặp quá nhiều vấn đề với độ sâu trường ảnh, nhưng theo tôi, nó khá kém trong việc tạo ra những hình ảnh ảnh chân thực AI. Chẳng hạn, tôi đã yêu cầu AI tạo một hình ảnh chú chó Golden Retriever trong núi (mà không chỉ định loại ảnh).
Một chú chó Golden Retriever trong khung cảnh núi non được tạo bởi DALL-E
Mặc dù hình ảnh này khá tốt, nhưng vẫn khá rõ ràng rằng đây là một bức ảnh được tạo bằng AI. Vì vậy, tôi đã yêu cầu DALL-E làm cho nó chân thực hơn. Ngược lại, hình ảnh trông càng giả hơn (và thành thật mà nói, hơi đáng sợ).
Nỗ lực tạo ảnh chân thực một chú chó bằng DALL-E nhưng kết quả kém tự nhiên
Việc sử dụng Photorealistic Custom GPT có thể giúp cải thiện điều này, nhưng bạn cần có gói đăng ký cao cấp để truy cập. Nếu không, tôi có thể gợi ý nhiều công cụ tạo ảnh AI khác cho ra hình ảnh chân thực hơn, trong đó Adobe Firefly là lựa chọn hàng đầu của tôi.
4. “Phớt Lờ” Lệnh Phủ Định Từ Người Dùng
Một cách để viết prompt DALL-E và các công cụ AI khác như Midjourney, ChatGPT hiệu quả hơn là chỉ rõ những gì bạn không muốn phần mềm thực hiện. Trong nhiều trường hợp, việc này giúp mang lại kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều lần, tôi đã yêu cầu DALL-E không bao gồm một số yếu tố nhất định trong bức ảnh. Thế nhưng, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có thể khắc phục được, nhưng sẽ tốt hơn nếu không phải làm đi làm lại nhiều lần như vậy. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Thiếu Nhất Quán Trong Một Số Chi Tiết
Nhiều công cụ tạo ảnh AI có những điểm yếu riêng; chẳng hạn, khi tôi thử nghiệm Photo AI, nó đặc biệt tệ trong việc tạo ra bàn tay người. DALL-E cũng có lỗi tương tự với sự thiếu nhất quán trong nhiều lĩnh vực khác nhau.
Mặc dù DALL-E rất giỏi trong việc tạo ra các hình ảnh tổng quát, nhưng nó không phải lúc nào cũng tốt trong việc tạo ra hình ảnh người đang cầm đồ vật. Kỳ lạ hơn, phần mềm này còn kém trong việc tạo ra màn hình máy tính. Thông thường, bạn sẽ nhận được một cụm hình dạng ngẫu nhiên. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải luôn luôn) có thể giúp khắc phục.
6. Phong Cách Hình Ảnh Không Đồng Nhất
DALL-E có thể tạo ra nhiều loại hình ảnh khác nhau; bạn có thể tạo AI vẽ tranh với phong cách giống như tranh sơn dầu, và cũng có thể tạo ra hình ảnh trông 3D hơn. Tuy nhiên, sự đa dạng trong việc tạo hình ảnh này đôi khi dẫn đến các phong cách không nhất quán.
Khi yêu cầu DALL-E tạo một hình ảnh, bạn phải cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Đây không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại là một nhược điểm lớn nếu bạn muốn một phong cách đồng nhất trong toàn bộ tác phẩm của mình.
7. Kích Thước Vật Thể Không Chính Xác (Artifact Sizing)
Việc làm cho các vật thể trong hình ảnh của bạn trông cân đối với kích thước thực tế là rất quan trọng nếu bạn quan tâm đến độ chính xác của bức ảnh. Thật không may, DALL-E đôi khi không thể làm cho các vật thể trông đúng như chúng nên có. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trong tay, chiếc điện thoại đôi khi sẽ quá lớn.
Ban đầu, tôi nghĩ rằng yêu cầu phần mềm tạo ảnh góc rộng hơn sẽ giải quyết vấn đề. Tuy nhiên, điều này thực sự làm mọi thứ tồi tệ hơn. Hơn nữa, người đó trông cũng giả hơn. Thử các prompt DALL-E chỉnh sửa khác có thể hiệu quả với bạn, nhưng tôi vẫn chưa tìm ra cách khắc phục cho vấn đề này.
Hình ảnh người đang cầm điện thoại được tạo bởi DALL-E với kích thước vật thể không cân đối
8. Hạn Chế Với Vật Liệu Bên Ngoài (External Materials)
Tôi ban đầu nghĩ DALL-E sẽ là một cách tuyệt vời để tạo lịch cá nhân hóa, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng nhận ra rằng phần mềm này không làm tốt trong lĩnh vực này.
Ví dụ, tôi đã thử làm bìa thiệp sinh nhật bằng DALL-E trong quá khứ. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải nó lên một dịch vụ như Moonpig. Thật không may, tôi liên tục nhận được một thiết kế bao gồm một chiếc thiệp sinh nhật ngay trong bức ảnh.
Ảnh thiệp sinh nhật được tạo bởi DALL-E 3 với lỗi văn bản và thiết kế lặp lại
Nếu bạn thực sự muốn sử dụng DALL-E cho những loại thiết kế này, tôi khuyên bạn không nên nói rằng bạn sẽ sử dụng nó trên một tấm thiệp sinh nhật. Thay vào đó, hãy chỉ định những gì bạn muốn chương trình tạo ra. Sau đó, bạn có thể điều chỉnh kích thước sau. Cách tốt nhất có thể là chỉ tạo hình ảnh trong DALL-E và thêm văn bản bằng một ứng dụng khác.
9. Ảnh Kém Chất Lượng Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, tôi không biết chính xác thiết kế AI nào mình muốn sử dụng. Trong những trường hợp này, việc yêu cầu các công cụ tạo ra nhiều biến thể hình ảnh là hợp lý. Nhưng từ kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp cho tôi nhiều tùy chọn.
Trong nhiều trường hợp, các bức ảnh tôi nhận được thường trông rất giống nhau. Do đó, bạn phải cực kỳ cụ thể. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một hoạt động tốt hơn là yêu cầu nhiều biến thể cùng lúc.
Mặc dù tôi rất thích sử dụng DALL-E nói chung, nhưng phần mềm này không hoàn hảo và bạn chắc chắn sẽ gặp phải các vấn đề. Chẳng hạn, nó kém trong việc tạo ra hình ảnh chân thực mà không cần Custom GPTs. Hơn nữa, phần mềm thường không loại trừ các yếu tố mà tôi không muốn có trong ảnh. Tuy nhiên, tôi vẫn khuyên bạn nên thử DALL-E; hãy tự mình trải nghiệm xem những vấn đề này có xuất hiện với bạn hay không.
Bạn có gặp phải những hạn chế của DALL-E tương tự hoặc có giải pháp nào hay ho khi sử dụng công cụ AI tạo ảnh này không? Hãy chia sẻ kinh nghiệm của bạn trong phần bình luận bên dưới nhé!