Add/update the quantized ONNX model files and README.md for Transformers.js v3

## Applied Quantizations

### ✅ Based on `model.onnx` *with* slimming

↳ ❌ `int8`: `model_int8.onnx` (added but JS-based E2E test failed)
```
/home/ubuntu/src/tjsmigration/node_modules/.pnpm/onnxruntime-node@1.21.0/node_modules/onnxruntime-node/dist/backend.js:25
__classPrivateFieldGet(this, _OnnxruntimeSessionHandler_inferenceSession, "f").loadModel(pathOrBuffer, options);
^

Error: Could not find an implementation for ConvInteger(10) node with name '/convnextv2/embeddings/patch_embeddings/Conv_quant'
at new OnnxruntimeSessionHandler (/home/ubuntu/src/tjsmigration/node_modules/.pnpm/onnxruntime-node@1.21.0/node_modules/onnxruntime-node/dist/backend.js:25:92)
at Immediate.<anonymous> (/home/ubuntu/src/tjsmigration/node_modules/.pnpm/onnxruntime-node@1.21.0/node_modules/onnxruntime-node/dist/backend.js:67:29)
at process.processImmediate (node:internal/timers:485:21)

Node.js v22.16.0
```
↳ ✅ `uint8`: `model_uint8.onnx` (added)
↳ ✅ `q4`: `model_q4.onnx` (added)
↳ ✅ `q4f16`: `model_q4f16.onnx` (added)
↳ ✅ `bnb4`: `model_bnb4.onnx` (added)

Files changed (5) hide show

README.md +4 -4
onnx/model_bnb4.onnx +3 -0
onnx/model_q4.onnx +3 -0
onnx/model_q4f16.onnx +3 -0
onnx/model_uint8.onnx +3 -0

README.md CHANGED Viewed

@@ -7,15 +7,15 @@ https://huggingface.co/facebook/convnextv2-large-22k-384 with ONNX weights to be
 ## Usage (Transformers.js)
-If you haven't already, you can install the [Transformers.js](https://huggingface.co/docs/transformers.js) JavaScript library from [NPM](https://www.npmjs.com/package/@xenova/transformers) using:
 ```bash
-npm i @xenova/transformers
 ```
 **Example:** Perform image classification with `Xenova/convnextv2-large-22k-384`.
 ```js
-import { pipeline } from '@xenova/transformers';
 // Create image classification pipeline
 const classifier = await pipeline('image-classification', 'Xenova/convnextv2-large-22k-384');
@@ -23,7 +23,7 @@ const classifier = await pipeline('image-classification', 'Xenova/convnextv2-lar
 // Classify an image
 const url = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/tiger.jpg';
 const output = await classifier(url);
-console.log(output)
 ```
 ---

 ## Usage (Transformers.js)
+If you haven't already, you can install the [Transformers.js](https://huggingface.co/docs/transformers.js) JavaScript library from [NPM](https://www.npmjs.com/package/@huggingface/transformers) using:
 ```bash
+npm i @huggingface/transformers
 ```
 **Example:** Perform image classification with `Xenova/convnextv2-large-22k-384`.
 ```js
+import { pipeline } from '@huggingface/transformers';
 // Create image classification pipeline
 const classifier = await pipeline('image-classification', 'Xenova/convnextv2-large-22k-384');
 // Classify an image
 const url = 'https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/tiger.jpg';
 const output = await classifier(url);
+console.log(output);
 ```
 ---

onnx/model_bnb4.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8a181e98a0a30836cc573f6e061b2cdb90501abdfe9b8ac753febe543bac935f
+size 144575649

onnx/model_q4.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e019764bc231a87fab0dd456df651b684b7b991946619fc4718e3e2903e3843
+size 156353136

onnx/model_q4f16.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c8c403ce91de5ede4fe8a8f62fc4cc9dc2b2997ca7a0eddc3ffad38676a1156
+size 125559087

onnx/model_uint8.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f70961c8f2aafd1ce7a5014e280b94e5f9118f98b0bf454f080b1765f3b912b5
+size 200020872