WEKO3
Item
Hardware-Friendly Fully Quantized Mamba-2 Model
https://aist.repo.nii.ac.jp/records/2003437
https://aist.repo.nii.ac.jp/records/20034373d68491f-d255-4bcf-8887-e770eac37fe0
| Item type | Research Data v10(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| PubDate | 2026-05-19 | |||||||||
| Data name | ||||||||||
| Title | Hardware-Friendly Fully Quantized Mamba-2 Model | |||||||||
| Language | en | |||||||||
| Description of data | ||||||||||
| Description Type | Abstract | |||||||||
| Description | We developed a fully quantized Mamba-2 model employing ternary weights and 8-bit integer activations. This repository includes the Python code for the model as well as the trained model parameters. |
|||||||||
| Language | en | |||||||||
| Author (Creator) name |
Fuketa, Hiroshi
× Fuketa, Hiroshi (代表作成者)
ORCID
0000-0003-0171-6679
|
|||||||||
| Terms of Use | ||||||||||
| Rights Resource | https://creativecommons.org/licenses/by-nc/4.0/deed.en | |||||||||
| Rights | Creative Commons Attribution-NonCommercial 4.0 International | |||||||||
| Language | en | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | 大規模言語モデル | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | ニューラルネットワーク | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | 深層学習 | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | State Space Model | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Mamba | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | 量子化 | |||||||||
| Keyword | ||||||||||
| Language | ja | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Hardware-Friendly | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Large Language Model | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Neural Network | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Deep Learning | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | State Space Model | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Mamba | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Quantization | |||||||||
| Keyword | ||||||||||
| Language | en | |||||||||
| Subject Scheme | Other | |||||||||
| Subject | Hardware-Friendly | |||||||||
| Publisher | ||||||||||
| Publisher | National Institute of Advanced Industrial Science and Technology (AIST) | |||||||||
| Language | en | |||||||||
| Date | ||||||||||
| Date | 2026-05-19 | |||||||||
| Date Type | Issued | |||||||||
| Language | ||||||||||
| Language | eng | |||||||||
| Resource Type | ||||||||||
| Resource Type Identifier | http://purl.org/coar/resource_type/c_ddb1 | |||||||||
| Resource Type | dataset | |||||||||
| Identifier | ||||||||||
| Identifier | https://doi.org/10.57765/2003437 | |||||||||
| Identifier Type | DOI | |||||||||