Selode.AI phá vỡ các rào cản AI cục bộ với việc phát hành Qwen-3.6-35B-A3B-VRAP:

selode huggingface

(SeaPRwire) –   Thế hệ lực lượng Agent mã nguồn mở tối đa

Sydney, New South Wales – 12 tháng 5 năm 2026  –  Hôm nay, Selode.AI công bố ra mắt chính thức mô hình Qwen-3.6-35B-A3B-VRAP, một mô hình định lượng AWQ 4-bit tiên tiến nhất giúp mang trí thông minh hàng đầu lên GPU với độ chính xác cao, thay vì yêu cầu 2 GPU, giúp cho người dùng sử dụng một card đồ họa cá nhân. Được hỗ trợ bởi phương pháp tinh chỉnh sau định lượng VRAP độc quyền của Selode, việc ra mắt này là một bước ngoặt cho các nhà phát triển và nhà nghiên cứu đòi hỏi khả năng suy luận Agent cao với lượng tài nguyên vận hành và tiêu thụ năng lượng rất nhỏ khi triển khai.

Năng suất cao, lượng tài nguyên thấp

Được tối ưu bởi Selode.AI thành gói định lượng AWQ 4-bit 21.2GB, mô hình này được thiết kế cụ thể để vừa với không gian VRAM 24GB của card GPU cá nhân như NVIDIA RTX 3090, 4090 hoặc AMD 7900XTX.

Lợi ích của VRAP

Biểu tượng “VRAP” đại diện cho quy trình tối ưu hóa đặc trưng của Selode.AI. Phương pháp độc quyền này đảm bảo rằng ngay cả khi được định lượng 4-bit, mô hình vẫn giữ được logic tinh tế và khả năng “Agent” của phiên bản nén không. Bằng cách áp dụng VRAP, Selode.AI đã thành công giảm bớt hiện tượng “suy giảm trí tuệ” thường gặp ở các mô hình nén nâng cao, đảm bảo rằng mô hình không chỉ xử lý văn bản mà còn suy nghĩ với độ chính xác cao trong các nhiệm vụ phức tạp đa bước.

Đặc điểm nổi bật:

  • Phương pháp cắt ngắn sau định lượng đầu tiên trên kiến trúc xen kẽ : Sử dụng công nghệ tiên tiến đầu tiên trên thế giới, Selode.AI mang đến độ chính xác tối ưu cho các mô hình AWQ định lượng nhỏ (độ chính xác đa độ tinh khiết nhất quán).
  • Bảo mật cục bộ, sức mạnh toàn cầu: Chạy hoàn toàn ngoại tuyến, trao quyền toàn quyền cho người dùng về dữ liệu của họ trong khi duy trì khả năng cao.
  • Tương thích với card cá nhân: Vừa với một card GPU cao cấp (24GB VRAM), loại bỏ “thuế thiết bị” cho các mô hình AI mã nguồn mở hàng đầu.
  • Sự thành thục trong Agent: Được thiết kế cho các nhiệm vụ tự động hóa, lập trình từng repository và suy luận kỹ thuật phức tạp.
  • Hỗ trợ ngữ cảnh khổng lồ: Xây dựng để hỗ trợ việc nhập và suy luận nhanh chóng trên các tài liệu và mã nguồn lớn một cách nội bộ.

Một thời đại mới cho suy luận nội bộ

“Việc ra mắt Qwen-3.6-35B-A3B-VRAP là về việc vượt qua mâu thuẫn với đám mây,” một người đại diện của Selode.AI nói. “Bằng cách áp dụng phương pháp VRAP cho kiến trúc Qwen-3.6, chúng tôi đã giúp mọi nhà phát triển ở Sydney hoặc bên ngoài có thể chạy một Agent hàng đầu trên máy tính cá nhân của họ. Đây là AI hàng đầu, được mở khóa.”

Khả dụng

Các trọng số mô hình và tệp cấu hình đã có sẵn ngay bây giờ để tải về trên Hugging Face.

  • Tải xuống: huggingface.co/selode-ai/Qwen-3.6-35B-A3B-VRAP-4-bit-AWQ-21.2GB
  • Website: selode.ai

Về Selode.AI: Selode.AI là một nhóm AI được cơ giới hóa tại Sydney, tập trung vào tối ưu hóa các mô hình hàng đầu cho cộng đồng mã nguồn mở, chuyên về định lượng cao hiệu suất và phương pháp tăng cường độc quyền cho suy luận nội bộ.

Liên hệ truyền thông:

  • Email: enquiries@selode.ai
  • LinkedIn: linkedin.com/showcase/selode-artificial-intelligence/
architecturedemo output

Liên hệ truyền thông

Selode.AI

enquiries@selode.ai

https://selode.ai/

Nguồn :Selode.AI

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.