Claude/transcode deepnsm rust o na1 z by AdaWorldAPI · Pull Request #51 · AdaWorldAPI/ndarray

AdaWorldAPI · 2026-03-30T07:06:04Z

No description provided.

https://claude.ai/code/session_01Y69Vnw751w75iVSBRws7o7

BF16 optimizations for Maverick-scale (801 GB): - BF16-direct: skip f32 Vec allocation (saves 283 MB per tensor) - Strided octave + halftone: 97% fewer BF16→f64 conversions (stride=16) - Reusable u16 buffer: one alloc for entire shard - stream_index_gguf_bf16(): fast path for BF16, fallback for other dtypes - 4 new tests: halftone coverage, bf16 accuracy, stride agreement, f32 parity Shard 4/5: 4.1 MB. All 5 Scout shards now committed (~43 MB total). https://claude.ai/code/session_01Y69Vnw751w75iVSBRws7o7

claude added 2 commits March 30, 2026 06:58

data: Llama 4 Scout BF16 shard 3/5 → bgz17 (5.4 MB)

5bef1d8

https://claude.ai/code/session_01Y69Vnw751w75iVSBRws7o7

AdaWorldAPI merged commit 66e4b60 into master Mar 30, 2026
4 of 10 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Claude/transcode deepnsm rust o na1 z#51

Claude/transcode deepnsm rust o na1 z#51
AdaWorldAPI merged 2 commits into
masterfrom
claude/transcode-deepnsm-rust-oNa1Z

AdaWorldAPI commented Mar 30, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

AdaWorldAPI commented Mar 30, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants