Stable Diffusion là gì ? Các kiến thức cơ bản

Stable Diffusion có thể gây nhầm lẫn cho nhiều người mới khi họ lần đầu tiếp xúc vì có rất nhiều loại mô hình khác nhau để lựa chọn. Làm thế nào để chọn rất nhiều mô hình, chúng có chức năng gì? Tôi sẽ cung cấp cho bạn một cách phổ biến khoa học đơn giản và bạn có thể thêm nó vào khu vực bình luận!

stable diffusion la gi

Ưu điểm của mô hình Stable Diffusion là: hình ảnh tạo ra có chất lượng cao, độ phân giải cao, độ đa dạng mạnh khó phân biệt với hình ảnh thực, đồng thời mô hình có thể xử lý nhiều loại, nhiều kiểu văn bản và hình ảnh khác nhau. đầu vào và tránh hình ảnh chung Tạo ra các vấn đề như làm mờ, giả, lặp lại và không tự nhiên.

Các mô hình khuếch tán ổn định thường được sử dụng có thể được chia thành bốn loại:

1. Mô hình lớn/mô hình cơ bản-mô hình cơ bản (models)

Còn được gọi là mô hình cài đặt sẵn, cơ sở bản vẽ của phần mềm SD là mô hình lớn, phải được sử dụng cùng nhau sau khi cài đặt. Các mô hình lớn khác nhau có phong cách vẽ và lĩnh vực chuyên môn độc đáo. Hậu tố tệp: ckpt và safetensors, chức năng chính là xác định phong cách chính của Al Hình

35fea91e 091c 4d87 a88c 33814e66fdf7

2. Mô hình Lora

Mô hình tinh chỉnh So sánh mô hình cơ sở với móng của một ngôi nhà, thì mô hình Lora giống như một ngôi nhà tùy chỉnh được xây dựng trên cơ sở này. Nó thường được gọi là một mô hình tinh chỉnh và có thể được sử dụng để đáp ứng nhu cầu về phong cách hoặc thuộc tính ký tự cụ thể. Khi độ tương tự dữ liệu cao, sử dụng mô hình tinh chỉnh có thể tiết kiệm rất nhiều thời gian đào tạo và nguồn lực để đạt được kết quả mong muốn. Nó chủ yếu được sử dụng để tái tạo các đặc điểm của nhân vật và đồ vật, và để rèn luyện phong cách hội họa, nó cần được sử dụng với mô hình chính. Đường dẫn vị trí mô hình: *modelslora, hậu tố tệp thường là safetensors. Kích thước của mô hình là hàng chục mb đến hai đến ba trăm mb và một số Lora sẽ cần các từ kích hoạt để sử dụng, nếu không hiệu quả sẽ không rõ ràng.

21157739 56d1 4f41 8a24 9d053bc87d4f

3. Mô hình làm đẹp VAE

Tên đầy đủ là Variational autoenconder, thuật ngữ trong tiếng Việt có thể gọi là bộ mã hóa tự động biến đổi. Nó tương đương với việc thêm bộ lọc vào ảnh và nó cần được sử dụng với kiểu máy chính. Chức năng là: lọc + tinh chỉnh. Một số mô hình lớn sẽ có VAE riêng, chẳng hạn như Chilloutmix thường được sử dụng của chúng tôi. Nếu VAE được thêm vào, hiệu ứng hình ảnh có thể phản tác dụng và các hậu tố của tệp thường là: ckpt, pt

updated vae released by stability reproducible before and v0 qj4uo7nq9vv91

4. Mô hình cá nhân hóa Embeddings

Embeddings cũng là một mô hình tinh chỉnh, cũng có thể hiểu là mô hình đóng gói teleprompter, có thể tạo ra các đặc điểm, phong cách hoặc phong cách vẽ của một nhân vật cụ thể. Nhúng được gọi là đảo ngược văn bản và chỉ bằng cách sử dụng một vài hình ảnh, các khái niệm mới có thể được dạy cho mô hình. Được sử dụng để tạo hình ảnh được cá nhân hóa. Giống như mô hình lora, Embeddings cũng phải được sử dụng với mô hình cơ sở. Do mô hình Nhúng thực chất là một gói nhắc từ nên kích thước của loại mô hình này thường rất nhỏ (thường là vài kb), tuy tiết kiệm được dung lượng và tài nguyên nhưng do kích thước nhỏ mang ít thông tin nên càng nhiều người đang sử dụng loại mô hình này bây giờ.

11

Kết luận

Như vậy qua bài viết trên, GenZ Academy tin rằng ít nhiều gì bạn cũng đã hiểu được một vài bước cơ bản nhưng hết sức quan trọng trong quá trình làm quen Stable Diffusion rồi đúng không. Và đừng quên tiếp tục đón chờ tiếp các bài viết chia sẻ kiến thức khác bạn nhé.

Biên tập: GenZ Academy

© Thông báo bản quyền
THE END
Nếu bạn thích nó, xin vui lòng để lại bình luận.
点赞0 Chia sẻ
Bình luận Bình luận đầu tiên

Vui lòng đăng nhập để viết bình luận

    Chưa có bình luận nào