StevenSong · StevenSong · May 5, 2026 · Mar 13, 2026 · Mar 13, 2026 · Mar 17, 2026
@@ -3,6 +3,7 @@
 .gitmodules @StevenSong
 .pre-commit-config.yaml @StevenSong
 .secrets.baseline @StevenSong
+configs/audio @StevenSong
 configs/multi-arm-heedb @StevenSong
 configs/pretrain-supervised.yaml @StevenSong
 configs/pretrain-unsupervised.yaml @StevenSong
@@ -13,21 +14,28 @@ configs/target-unguided.yaml @StevenSong
 data-preprocessing/ @StevenSong
 env.yaml @StevenSong
 external/PierreElias-IntroECG @StevenSong
+external/vuno-ST-MEM @StevenSong
 hf-token-plugin.py @StevenSong
 LICENSE @StevenSong
+results/ @StevenSong
 protossl/__init__.py @StevenSong
 protossl/datasets/__init__.py @StevenSong
-protossl/datasets/streaming_loaders @StevenSong
+protossl/datasets/_audioset_contrastive_wrapper_dataset.py @sahilsethi0105
 protossl/datasets/_audioset_dataset.py @sahilsethi0105
-protossl/datasets/_base_ecg_dataset.py @StevenSong
+protossl/datasets/_base_dataset.py @StevenSong
 protossl/datasets/_cinc_dataset.py @StevenSong
 protossl/datasets/_code15_dataset.py @StevenSong
 protossl/datasets/_echonext_dataset.py @StevenSong
 protossl/datasets/_heedb_dataset.py @StevenSong
+protossl/datasets/_iemocap_dataset.py @StevenSong
 protossl/datasets/_mimic_dataset.py @StevenSong
 protossl/datasets/_pclr_wrapper_dataset.py @StevenSong
 protossl/datasets/_ptbxl_dataset.py @StevenSong
+protossl/datasets/_urbansound8k_dataset.py @StevenSong
+protossl/datasets/_utils.py @StevenSong
+protossl/datasets/_voxceleb1id_dataset.py @StevenSong
 protossl/datasets/_zzu_dataset.py @StevenSong
+protossl/datasets/streaming_loaders @StevenSong
 protossl/defines.py @StevenSong
 protossl/lightning_utils.py @StevenSong
 protossl/models/__init__.py @StevenSong
@@ -42,6 +50,7 @@ protossl/models/_prototype_supervisor.py @StevenSong
 protossl/models/encoders/__init__.py @StevenSong
 protossl/models/encoders/_base_encoder.py @StevenSong
 protossl/models/encoders/_net1d.py @StevenSong
+protossl/models/encoders/_panns_encoder.py @sahilsethi0105
 protossl/models/encoders/_prototype_encoder_with_assignment.py @StevenSong
 protossl/models/encoders/_prototype_encoder.py @StevenSong
 protossl/models/encoders/_resnet1d.py @StevenSong
@@ -50,27 +59,38 @@ protossl/models/helpers/__init__.py @StevenSong
 protossl/models/helpers/_prototype_ilp_assigner.py @sahilsethi0105
 protossl/models/layers/__init__.py @StevenSong
 protossl/models/layers/_multi_input_linear.py @StevenSong
+protossl/models/layers/_panns_backbones.py @StevenSong
 protossl/trainer.py @StevenSong
-plot/ecg-results.ipynb @StevenSong
 pyproject.toml @StevenSong
 README.md @StevenSong @sahilsethi0105
 requirements.txt @StevenSong
 scripts/_cache_data.py @StevenSong
-scripts/_eval_probs.py @StevenSong
 scripts/_eval_probs_bootstrapped.py @StevenSong
+scripts/_eval_probs.py @StevenSong
 scripts/_linear_probe.py @StevenSong
 scripts/_slurm_wrapper.sh @StevenSong
 scripts/_submit_job.sh @StevenSong
 scripts/0-run-cache-data.sh @StevenSong
 scripts/1-run-blackbox-direct.sh @StevenSong
 scripts/2-run-labsup-proto-direct.sh @StevenSong
+scripts/2-z-* @StevenSong
 scripts/3-run-protossl-heedb-pila.sh @StevenSong
+scripts/3-z-* @StevenSong
 scripts/4-run-labsup-proto-heedb-rila.sh @StevenSong
-scripts/5-run-ecgfounder-logreg.sh @StevenSong
+scripts/4-y-* @StevenSong
+scripts/4-z-* @StevenSong
+scripts/5-1-run-ecgfounder-logreg.sh @StevenSong
+scripts/5-2-run-stmem-logreg.sh @StevenSong
 scripts/6-run-protossl-heedb-pia.sh @StevenSong
-scripts/ablations @StevenSong
-scripts/audio-1-1-run-proto-from-scratch.sh
-scripts/ecgfounder/_compute_ecgfounder_embeddings.py @StevenSong
+scripts/7-run-protossl-heedb-pit.sh @StevenSong
+scripts/8-run-protossl-heedb-pip.sh @StevenSong
+scripts/9-0-run-ecgfounder-patches.sh @StevenSong
+scripts/9-1-run-ecgfounder-lap.sh @StevenSong
+scripts/9-2-run-ecgfounder-clustering.sh @StevenSong
+scripts/9-3-run-ecgfounder-random.sh @StevenSong
+scripts/audio @StevenSong
+scripts/ecg-fms/_compute_ecgfounder_embeddings.py @StevenSong
+scripts/ecg-fms/_compute_stmem_embeddings.py @StevenSong
 scripts/echonext/_tabular_logreg.py @StevenSong
 scripts/echonext/run-columbia-minimodel.sh @StevenSong
 scripts/echonext/run-tabular-logreg.sh @StevenSong
@@ -80,10 +100,11 @@ scripts/pretrain/run-heedb-normalizations.sh @StevenSong
 scripts/pretrain/run-pass-heedb-pretrain-no-attn.sh @StevenSong
 scripts/pretrain/run-pass-heedb-pretrain.sh @StevenSong
 scripts/pretrain/run-prosup-heedb-pretrain.sh @StevenSong
+scripts/prototypes-from-fms @StevenSong
 scripts/queue-experiments.sh @StevenSong
 scripts/README.md @StevenSong @sahilsethi0105
-user-study/prepare_samples.ipynb @StevenSong
-user-study/decode_samples.ipynb @StevenSong
+user-study/analyze_results.ipynb @StevenSong
 user-study/images @StevenSong
 user-study/metadata.csv @StevenSong
+user-study/prepare_samples.ipynb @StevenSong
 user-study/results.csv @StevenSong
@@ -217,5 +217,5 @@ temp/
 outputs*/
 OLD/
 slurm-logs/
-plot/figs/
+results/figs/
 ecgfounder-checkpoint/
@@ -4,3 +4,6 @@
 [submodule "user-study/images"]
 	path = user-study/images
 	url = git@github.com:StevenSong/protossl-user-study-images.git
+[submodule "external/vuno-ST-MEM"]
+	path = external/vuno-ST-MEM
+	url = git@github.com:vuno/ST-MEM.git
@@ -9,6 +9,7 @@ repos:
     hooks:
       - id: detect-secrets
         args: ['--baseline', '.secrets.baseline']
+        exclude: data-preprocessing/hf_audioset_ids
   - repo: https://github.com/pre-commit/pre-commit-hooks
     rev: v5.0.0
     hooks:

@@ -18,7 +18,7 @@ git clone git@github.com:StevenSong/ProtoSSL.git
 cd ProtoSSL
 
 # 2) create and activate environment
-# NOTE: you don't have to use conda, just make sure you're using the same python version and install from `requirements.txt` instead
+# NOTE: if you don't use conda, make sure you're using the same python version, install from `requirements.txt`, and MAKE SURE YOU HAVE FFMPEG 5.* FOR TORCHCODEC (see below)
 conda env create -f env.yaml
 conda activate protossl
 
@@ -30,3 +30,20 @@ pip install -e .
 
 # 5) dev away
 ```
+
+**torchcodec:** torchcodec is a bit fragile with dependencies. We've pinned `torch==2.7.0` which is compatible with `torchcodec==0.4.0`, both compiled against CUDA 12.8 (which we use on our machines). This torchcodec version is only compatible with `datasets==4.0.0`. If you see errors relating to torchcodec (you can diagnose this by just importing torchcodec), make sure the dependencies are compatible not just relative to versioning, but also relating to the CUDA versions. We also use `ffmpeg=5.*` installed via conda. If you see an error relating to not being able to find `libnppicc.so.12`, it might be that the linker can't find the binaries (which we ensure are available by installing `nvidia-npp-cu12`). To fix this, you can try setting the `LD_LIBRARY_PATH` environment variable:
+```bash
+export LD_LIBRARY_PATH=$CONDA_PREFIX/lib/python3.10/site-packages/nvidia/npp/lib:$LD_LIBRARY_PATH
+# test by importing torchcodec in a python runtime
+```
+If this works, you can consider making the fix automatic via the following conda activate scripts:
+```bash
+mkdir -p $CONDA_PREFIX/etc/conda/activate.d
+mkdir -p $CONDA_PREFIX/etc/conda/deactivate.d
+
+# Set on activate
+echo 'export LD_LIBRARY_PATH=$CONDA_PREFIX/lib/python3.10/site-packages/nvidia/npp/lib:$LD_LIBRARY_PATH' > $CONDA_PREFIX/etc/conda/activate.d/npp_lib.sh
+
+# Unset on deactivate
+echo 'export LD_LIBRARY_PATH=$(echo $LD_LIBRARY_PATH | sed "s|$CONDA_PREFIX/lib/python3.10/site-packages/nvidia/npp/lib:||g")' > $CONDA_PREFIX/etc/conda/deactivate.d/npp_lib.sh
+```
@@ -0,0 +1,60 @@
+# lightning.pytorch==2.6.0
+seed_everything: 42
+trainer:
+  devices: 1
+  precision: 32
+  logger:
+    class_path: protossl.lightning_utils.StrictWandbLogger
+    init_args:
+      project: ProtoSSL-Audio
+      # save_dir: /path/to/runs/
+      # name: exp-name
+  callbacks:
+    - class_path: lightning.pytorch.callbacks.EarlyStopping
+      init_args:
+        monitor: val_loss
+        mode: min
+        patience: 10 # check reduce lr on plateau
+    - class_path: lightning.pytorch.callbacks.LearningRateMonitor
+      init_args:
+        logging_interval: epoch
+    - class_path: lightning.pytorch.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        mode: min
+        save_last: True
+    - class_path: PredictionWriter
+  max_epochs: 5
+  log_every_n_steps: 1
+optimizer:
+  class_path: torch.optim.AdamW
+  init_args:
+    lr: 0.001
+    weight_decay: 0.01
+lr_scheduler:
+  class_path: lightning.pytorch.cli.ReduceLROnPlateau
+  init_args:
+    monitor: val_loss
+    patience: 5 # check early stopping
+model:
+  class_path: LitModel
+  init_args:
+    backbone_type: Cnn14
+    conv_type: PANNS
+    input_channels: 1
+    prototype_type: partial
+    partial_len: 32000 # 1-second @ 32 kHz
+    partial_overlap: 0.5
+    prototype_h: 1
+    prototype_w: 1
+    n_prototypes_per_label: 5
+    # pretrained_weights: /path/to/weights
+data:
+  class_path: LitData
+  init_args:
+    # dataset_path: /path/to/dataset
+    sampling_rate: 32000
+    batch_size: 128
+    num_workers: 12
+    prefetch_factor: 2
+# pipeline_stage: learn-prototypes-supervised|project-prototypes-supervised|compute-embeddings|train-classifier
@@ -0,0 +1,63 @@
+# lightning.pytorch==2.6.0
+seed_everything: 42
+trainer:
+  devices: 1
+  precision: 32
+  logger:
+    class_path: protossl.lightning_utils.StrictWandbLogger
+    init_args:
+      project: ProtoSSL-Audio
+      # save_dir: /path/to/runs/
+      # name: exp-name
+  callbacks:
+    - class_path: lightning.pytorch.callbacks.EarlyStopping
+      init_args:
+        monitor: val_loss
+        mode: min
+        patience: 10 # check reduce lr on plateau
+    - class_path: lightning.pytorch.callbacks.LearningRateMonitor
+      init_args:
+        logging_interval: epoch
+    - class_path: lightning.pytorch.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        mode: min
+        save_last: True
+    - class_path: PredictionWriter
+  max_epochs: 5
+  log_every_n_steps: 1
+optimizer:
+  class_path: torch.optim.AdamW
+  init_args:
+    lr: 0.001
+    weight_decay: 0.01
+lr_scheduler:
+  class_path: lightning.pytorch.cli.ReduceLROnPlateau
+  init_args:
+    monitor: val_loss
+    patience: 5 # check early stopping
+model:
+  class_path: LitModel
+  init_args:
+    backbone_type: Cnn14
+    conv_type: PANNS
+    input_channels: 1
+    prototype_type: partial
+    partial_len: 32000 # 1-second @ 32 kHz
+    partial_overlap: 0.5
+    prototype_h: 1
+    prototype_w: 1
+    n_prototypes: 2635 # 527 audioset labels, comparing to 5 prototypes per label for supervised pretraining
+    model_kwargs: '{"cola_loss_weight": 2, "clar_loss_weight": 1, "koleo_loss_weight": 1}'
+    # pretrained_weights: /path/to/weights
+data:
+  class_path: LitData
+  init_args:
+    # dataset_path: /path/to/dataset
+    sampling_rate: 32000
+    batch_size: 128
+    num_workers: 12
+    prefetch_factor: 2
+    data_kwargs: '{"cola_view_seconds": 2}'
+contrastive_pair_mode: cola+clar
+# pipeline_stage: learn-prototypes|project-prototypes|compute-embeddings|train-classifier
@@ -0,0 +1,53 @@
+# lightning.pytorch==2.6.0
+seed_everything: 42
+trainer:
+  devices: 1
+  precision: 32
+  logger:
+    class_path: protossl.lightning_utils.StrictWandbLogger
+    init_args:
+      project: ProtoSSL-Audio
+      # save_dir: /path/to/runs/
+      # name: exp-name
+  callbacks:
+    - class_path: lightning.pytorch.callbacks.EarlyStopping
+      init_args:
+        monitor: val_loss
+        mode: min
+        patience: 20 # check reduce lr on plateau
+    - class_path: lightning.pytorch.callbacks.LearningRateMonitor
+      init_args:
+        logging_interval: epoch
+    - class_path: lightning.pytorch.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        mode: min
+        save_last: True
+    - class_path: PredictionWriter
+  max_epochs: 1000
+  log_every_n_steps: 1
+optimizer:
+  class_path: torch.optim.AdamW
+  init_args:
+    lr: 0.001
+    weight_decay: 0.01
+lr_scheduler:
+  class_path: lightning.pytorch.cli.ReduceLROnPlateau
+  init_args:
+    monitor: val_loss
+    patience: 10 # check early stopping
+model:
+  class_path: LitModel
+  init_args:
+    backbone_type: Cnn14
+    conv_type: PANNS
+    input_channels: 1
+    model_kwargs: '{"label_type": "multiclass"}'
+data:
+  class_path: LitData
+  init_args:
+    # dataset_path: /path/to/dataset
+    sampling_rate: 32000
+    batch_size: 128
+    num_workers: 4
+pipeline_stage: train-classifier
@@ -0,0 +1,60 @@
+# lightning.pytorch==2.6.0
+seed_everything: 42
+trainer:
+  devices: 1
+  precision: 32
+  logger:
+    class_path: protossl.lightning_utils.StrictWandbLogger
+    init_args:
+      project: ProtoSSL-Audio
+      # save_dir: /path/to/runs/
+      # name: exp-name
+  callbacks:
+    - class_path: lightning.pytorch.callbacks.EarlyStopping
+      init_args:
+        monitor: val_loss
+        mode: min
+        patience: 20 # check reduce lr on plateau
+    - class_path: lightning.pytorch.callbacks.LearningRateMonitor
+      init_args:
+        logging_interval: epoch
+    - class_path: lightning.pytorch.callbacks.ModelCheckpoint
+      init_args:
+        monitor: val_loss
+        mode: min
+        save_last: True
+    - class_path: PredictionWriter
+  max_epochs: 1000
+  log_every_n_steps: 1
+optimizer:
+  class_path: torch.optim.AdamW
+  init_args:
+    lr: 0.001
+    weight_decay: 0.01
+lr_scheduler:
+  class_path: lightning.pytorch.cli.ReduceLROnPlateau
+  init_args:
+    monitor: val_loss
+    patience: 10 # check early stopping
+model:
+  class_path: LitModel
+  init_args:
+    backbone_type: Cnn14
+    conv_type: PANNS
+    input_channels: 1
+    prototype_type: partial
+    partial_len: 32000 # 1-second @ 32 kHz
+    partial_overlap: 0.5
+    prototype_h: 1
+    prototype_w: 1
+    n_prototypes_per_label: 2
+    # model_kwargs: '{"label_type": "multiclass", "use_default_weights": True}' # granularly set these on each stage
+    # pretrained_weights: /path/to/weights
+data:
+  class_path: LitData
+  init_args:
+    # dataset_path: /path/to/dataset
+    sampling_rate: 32000
+    batch_size: 128
+    num_workers: 4
+# pipeline_stage: learn-prototypes-supervised|learn-prototype-assignments|project-prototypes-supervised|compute-embeddings|train-classifier