Stable Diffusion có thể gây nhầm lẫn cho nhiều người mới khi họ lần đầu tiếp xúc vì có rất nhiều loại mô hình khác nhau để lựa chọn. Làm thế nào để chọn rất nhiều mô hình, chúng có chức năng gì? Tôi sẽ cung cấp cho bạn một cách phổ biến khoa học đơn giản và bạn có thể thêm nó vào khu vực bình luận!

Ưu điểm của mô hình Stable Diffusion là: hình ảnh tạo ra có chất lượng cao, độ phân giải cao, độ đa dạng mạnh khó phân biệt với hình ảnh thực, đồng thời mô hình có thể xử lý nhiều loại, nhiều kiểu văn bản và hình ảnh khác nhau. đầu vào và tránh hình ảnh chung Tạo ra các vấn đề như làm mờ, giả, lặp lại và không tự nhiên.

Các mô hình khuếch tán ổn định thường được sử dụng có thể được chia thành bốn loại:

1. Mô hình lớn/mô hình cơ bản-mô hình cơ bản (models)

Còn được gọi là mô hình cài đặt sẵn, cơ sở bản vẽ của phần mềm SD là mô hình lớn, phải được sử dụng cùng nhau sau khi cài đặt. Các mô hình lớn khác nhau có phong cách vẽ và lĩnh vực chuyên môn độc đáo. Hậu tố tệp: ckpt và safetensors, chức năng chính là xác định phong cách chính của Al Hình

2. Mô hình Lora

Mô hình tinh chỉnh So sánh mô hình cơ sở với móng của một ngôi nhà, thì mô hình Lora giống như một ngôi nhà tùy chỉnh được xây dựng trên cơ sở này. Nó thường được gọi là một mô hình tinh chỉnh và có thể được sử dụng để đáp ứng nhu cầu về phong cách hoặc thuộc tính ký tự cụ thể. Khi độ tương tự dữ liệu cao, sử dụng mô hình tinh chỉnh có thể tiết kiệm rất nhiều thời gian đào tạo và nguồn lực để đạt được kết quả mong muốn. Nó chủ yếu được sử dụng để tái tạo các đặc điểm của nhân vật và đồ vật, và để rèn luyện phong cách hội họa, nó cần được sử dụng với mô hình chính. Đường dẫn vị trí mô hình: *modelslora, hậu tố tệp thường là safetensors. Kích thước của mô hình là hàng chục mb đến hai đến ba trăm mb và một số Lora sẽ cần các từ kích hoạt để sử dụng, nếu không hiệu quả sẽ không rõ ràng.

3. Mô hình làm đẹp VAE

Tên đầy đủ là Variational autoenconder, thuật ngữ trong tiếng Việt có thể gọi là bộ mã hóa tự động biến đổi. Nó tương đương với việc thêm bộ lọc vào ảnh và nó cần được sử dụng với kiểu máy chính. Chức năng là: lọc + tinh chỉnh. Một số mô hình lớn sẽ có VAE riêng, chẳng hạn như Chilloutmix thường được sử dụng của chúng tôi. Nếu VAE được thêm vào, hiệu ứng hình ảnh có thể phản tác dụng và các hậu tố của tệp thường là: ckpt, pt

4. Mô hình cá nhân hóa Embeddings

Embeddings cũng là một mô hình tinh chỉnh, cũng có thể hiểu là mô hình đóng gói teleprompter, có thể tạo ra các đặc điểm, phong cách hoặc phong cách vẽ của một nhân vật cụ thể. Nhúng được gọi là đảo ngược văn bản và chỉ bằng cách sử dụng một vài hình ảnh, các khái niệm mới có thể được dạy cho mô hình. Được sử dụng để tạo hình ảnh được cá nhân hóa. Giống như mô hình lora, Embeddings cũng phải được sử dụng với mô hình cơ sở. Do mô hình Nhúng thực chất là một gói nhắc từ nên kích thước của loại mô hình này thường rất nhỏ (thường là vài kb), tuy tiết kiệm được dung lượng và tài nguyên nhưng do kích thước nhỏ mang ít thông tin nên càng nhiều người đang sử dụng loại mô hình này bây giờ.

Kết luận

Như vậy qua bài viết trên, GenZ Academy tin rằng ít nhiều gì bạn cũng đã hiểu được một vài bước cơ bản nhưng hết sức quan trọng trong quá trình làm quen Stable Diffusion rồi đúng không. Và đừng quên tiếp tục đón chờ tiếp các bài viết chia sẻ kiến thức khác bạn nhé.

Biên tập: GenZ Academy

Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.

THE END

AIGC Stable Diffusion
# stable diffusion # cơ bản