Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

README.md +48 -0
config.json +192 -0
generation_config.json +8 -0
model.safetensors +3 -0
model.safetensors.index.json +1099 -0
preprocessor_config.json +27 -0
special_tokens_map.json +6 -0
tokenizer.json +0 -0
tokenizer_config.json +205 -0

README.md ADDED Viewed

	@@ -0,0 +1,48 @@

+---
+license: cc-by-nc-4.0
+tags:
+- vision
+- nougat
+pipeline_tag: image-to-text
+---
+# Nougat model, base-sized version
+Nougat model trained on PDF-to-markdown. It was introduced in the paper [Nougat: Neural Optical Understanding for Academic Documents](https://arxiv.org/abs/2308.13418) by Blecher et al. and first released in [this repository](https://github.com/facebookresearch/nougat/tree/main).
+Disclaimer: The team releasing Nougat did not write a model card for this model so this model card has been written by the Hugging Face team.
+Note: this model corresponds to the "0.1.0-base" version of the original repository.
+## Model description
+Nougat is a [Donut](https://huggingface.co/docs/transformers/model_doc/donut) model trained to transcribe scientific PDFs into an easy-to-use markdown format. The model consists of a Swin Transformer as vision encoder, and an mBART model as text decoder.
+The model is trained to autoregressively predict the markdown given only the pixels of the PDF image as input.
+<img src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/transformers/model_doc/nougat_architecture.jpg"
+alt="drawing" width="600"/>
+<small> Nougat high-level overview. Taken from the <a href="https://arxiv.org/abs/2308.13418">original paper</a>. </small>
+## Intended uses & limitations
+You can use the raw model for transcribing a PDF into Markdown. See the [model hub](https://huggingface.co/models?search=nougat) to look for other
+fine-tuned versions that may interest you.
+### How to use
+We refer to the [docs](https://huggingface.co/docs/transformers/main/en/model_doc/nougat).
+### BibTeX entry and citation info
+```bibtex
+@misc{blecher2023nougat,
+      title={Nougat: Neural Optical Understanding for Academic Documents},
+      author={Lukas Blecher and Guillem Cucurull and Thomas Scialom and Robert Stojnic},
+      year={2023},
+      eprint={2308.13418},
+      archivePrefix={arXiv},
+      primaryClass={cs.LG}
+}
+```

config.json ADDED Viewed

	@@ -0,0 +1,192 @@

+{
+    "architectures": [
+        "VisionEncoderDecoderModel"
+    ],
+    "decoder": {
+        "_name_or_path": "",
+        "activation_dropout": 0.0,
+        "activation_function": "gelu",
+        "add_cross_attention": true,
+        "add_final_layer_norm": true,
+        "architectures": null,
+        "attention_dropout": 0.0,
+        "bad_words_ids": null,
+        "begin_suppress_tokens": null,
+        "bos_token_id": 0,
+        "chunk_size_feed_forward": 0,
+        "classifier_dropout": 0.0,
+        "cross_attention_hidden_size": null,
+        "d_model": 1024,
+        "decoder_attention_heads": 16,
+        "decoder_ffn_dim": 4096,
+        "decoder_layerdrop": 0.0,
+        "decoder_layers": 10,
+        "decoder_start_token_id": null,
+        "diversity_penalty": 0.0,
+        "do_sample": false,
+        "dropout": 0.1,
+        "early_stopping": false,
+        "encoder_attention_heads": 16,
+        "encoder_ffn_dim": 4096,
+        "encoder_layerdrop": 0.0,
+        "encoder_layers": 12,
+        "encoder_no_repeat_ngram_size": 0,
+        "eos_token_id": 2,
+        "exponential_decay_length_penalty": null,
+        "finetuning_task": null,
+        "forced_bos_token_id": null,
+        "forced_eos_token_id": 2,
+        "id2label": {
+            "0": "LABEL_0",
+            "1": "LABEL_1"
+        },
+        "init_std": 0.02,
+        "is_decoder": true,
+        "is_encoder_decoder": false,
+        "label2id": {
+            "LABEL_0": 0,
+            "LABEL_1": 1
+        },
+        "length_penalty": 1.0,
+        "max_length": 20,
+        "max_position_embeddings": 4096,
+        "min_length": 0,
+        "model_type": "mbart",
+        "no_repeat_ngram_size": 0,
+        "num_beam_groups": 1,
+        "num_beams": 1,
+        "num_hidden_layers": 12,
+        "num_return_sequences": 1,
+        "output_attentions": false,
+        "output_hidden_states": false,
+        "output_scores": false,
+        "pad_token_id": 1,
+        "prefix": null,
+        "problem_type": null,
+        "pruned_heads": {},
+        "remove_invalid_values": false,
+        "repetition_penalty": 1.0,
+        "return_dict": true,
+        "return_dict_in_generate": false,
+        "scale_embedding": true,
+        "sep_token_id": null,
+        "suppress_tokens": null,
+        "task_specific_params": null,
+        "temperature": 1.0,
+        "tf_legacy_loss": false,
+        "tie_encoder_decoder": false,
+        "tie_word_embeddings": false,
+        "tokenizer_class": null,
+        "top_k": 50,
+        "top_p": 1.0,
+        "torch_dtype": null,
+        "torchscript": false,
+        "typical_p": 1.0,
+        "use_bfloat16": false,
+        "use_cache": true,
+        "vocab_size": 50000
+    },
+    "encoder": {
+        "_name_or_path": "",
+        "add_cross_attention": false,
+        "architectures": null,
+        "attention_probs_dropout_prob": 0.0,
+        "bad_words_ids": null,
+        "begin_suppress_tokens": null,
+        "bos_token_id": null,
+        "chunk_size_feed_forward": 0,
+        "cross_attention_hidden_size": null,
+        "decoder_start_token_id": null,
+        "depths": [
+            2,
+            2,
+            14,
+            2
+        ],
+        "diversity_penalty": 0.0,
+        "do_sample": false,
+        "drop_path_rate": 0.1,
+        "early_stopping": false,
+        "embed_dim": 128,
+        "encoder_no_repeat_ngram_size": 0,
+        "eos_token_id": null,
+        "exponential_decay_length_penalty": null,
+        "finetuning_task": null,
+        "forced_bos_token_id": null,
+        "forced_eos_token_id": null,
+        "hidden_act": "gelu",
+        "hidden_dropout_prob": 0.0,
+        "hidden_size": 1024,
+        "id2label": {
+            "0": "LABEL_0",
+            "1": "LABEL_1"
+        },
+        "image_size": [
+            896,
+            672
+        ],
+        "initializer_range": 0.02,
+        "is_decoder": false,
+        "is_encoder_decoder": false,
+        "label2id": {
+            "LABEL_0": 0,
+            "LABEL_1": 1
+        },
+        "layer_norm_eps": 1e-05,
+        "length_penalty": 1.0,
+        "max_length": 20,
+        "min_length": 0,
+        "mlp_ratio": 4.0,
+        "model_type": "donut-swin",
+        "no_repeat_ngram_size": 0,
+        "num_beam_groups": 1,
+        "num_beams": 1,
+        "num_channels": 3,
+        "num_heads": [
+            4,
+            8,
+            16,
+            32
+        ],
+        "num_layers": 4,
+        "num_return_sequences": 1,
+        "output_attentions": false,
+        "output_hidden_states": false,
+        "output_scores": false,
+        "pad_token_id": null,
+        "patch_size": 4,
+        "prefix": null,
+        "problem_type": null,
+        "pruned_heads": {},
+        "qkv_bias": true,
+        "remove_invalid_values": false,
+        "repetition_penalty": 1.0,
+        "return_dict": true,
+        "return_dict_in_generate": false,
+        "sep_token_id": null,
+        "suppress_tokens": null,
+        "task_specific_params": null,
+        "temperature": 1.0,
+        "tf_legacy_loss": false,
+        "tie_encoder_decoder": false,
+        "tie_word_embeddings": true,
+        "tokenizer_class": null,
+        "top_k": 50,
+        "top_p": 1.0,
+        "torch_dtype": null,
+        "torchscript": false,
+        "typical_p": 1.0,
+        "use_absolute_embeddings": false,
+        "use_bfloat16": false,
+        "window_size": 7
+    },
+    "is_encoder_decoder": true,
+    "model_type": "vision-encoder-decoder",
+    "quantization": {
+        "group_size": 32,
+        "bits": 8
+    },
+    "tie_word_embeddings": false,
+    "torch_dtype": "float32",
+    "transformers_version": "4.34.0.dev0"
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "forced_eos_token_id": 2,
+  "pad_token_id": 1,
+  "transformers_version": "4.34.0.dev0"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:356469a41e642a7db1174257bebb544dc17eaccc976735cc19d08714937204d9
+size 437466920

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,1099 @@

+{
+    "metadata": {
+        "total_size": 437330048
+    },
+    "weight_map": {
+        "decoder.lm_head.biases": "model.safetensors",
+        "decoder.lm_head.scales": "model.safetensors",
+        "decoder.lm_head.weight": "model.safetensors",
+        "decoder.model.embed_positions.biases": "model.safetensors",
+        "decoder.model.embed_positions.scales": "model.safetensors",
+        "decoder.model.embed_positions.weight": "model.safetensors",
+        "decoder.model.embed_tokens.biases": "model.safetensors",
+        "decoder.model.embed_tokens.scales": "model.safetensors",
+        "decoder.model.embed_tokens.weight": "model.safetensors",
+        "decoder.model.layer_norm.bias": "model.safetensors",
+        "decoder.model.layer_norm.weight": "model.safetensors",
+        "decoder.model.layernorm_embedding.bias": "model.safetensors",
+        "decoder.model.layernorm_embedding.weight": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.0.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.0.fc1.bias": "model.safetensors",
+        "decoder.model.layers.0.fc1.biases": "model.safetensors",
+        "decoder.model.layers.0.fc1.scales": "model.safetensors",
+        "decoder.model.layers.0.fc1.weight": "model.safetensors",
+        "decoder.model.layers.0.fc2.bias": "model.safetensors",
+        "decoder.model.layers.0.fc2.biases": "model.safetensors",
+        "decoder.model.layers.0.fc2.scales": "model.safetensors",
+        "decoder.model.layers.0.fc2.weight": "model.safetensors",
+        "decoder.model.layers.0.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.0.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.0.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.0.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.0.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.0.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.0.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.0.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.1.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.1.fc1.bias": "model.safetensors",
+        "decoder.model.layers.1.fc1.biases": "model.safetensors",
+        "decoder.model.layers.1.fc1.scales": "model.safetensors",
+        "decoder.model.layers.1.fc1.weight": "model.safetensors",
+        "decoder.model.layers.1.fc2.bias": "model.safetensors",
+        "decoder.model.layers.1.fc2.biases": "model.safetensors",
+        "decoder.model.layers.1.fc2.scales": "model.safetensors",
+        "decoder.model.layers.1.fc2.weight": "model.safetensors",
+        "decoder.model.layers.1.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.1.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.1.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.1.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.1.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.1.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.1.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.1.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.2.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.2.fc1.bias": "model.safetensors",
+        "decoder.model.layers.2.fc1.biases": "model.safetensors",
+        "decoder.model.layers.2.fc1.scales": "model.safetensors",
+        "decoder.model.layers.2.fc1.weight": "model.safetensors",
+        "decoder.model.layers.2.fc2.bias": "model.safetensors",
+        "decoder.model.layers.2.fc2.biases": "model.safetensors",
+        "decoder.model.layers.2.fc2.scales": "model.safetensors",
+        "decoder.model.layers.2.fc2.weight": "model.safetensors",
+        "decoder.model.layers.2.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.2.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.2.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.2.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.2.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.2.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.2.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.2.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.3.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.3.fc1.bias": "model.safetensors",
+        "decoder.model.layers.3.fc1.biases": "model.safetensors",
+        "decoder.model.layers.3.fc1.scales": "model.safetensors",
+        "decoder.model.layers.3.fc1.weight": "model.safetensors",
+        "decoder.model.layers.3.fc2.bias": "model.safetensors",
+        "decoder.model.layers.3.fc2.biases": "model.safetensors",
+        "decoder.model.layers.3.fc2.scales": "model.safetensors",
+        "decoder.model.layers.3.fc2.weight": "model.safetensors",
+        "decoder.model.layers.3.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.3.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.3.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.3.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.3.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.3.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.3.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.3.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.4.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.4.fc1.bias": "model.safetensors",
+        "decoder.model.layers.4.fc1.biases": "model.safetensors",
+        "decoder.model.layers.4.fc1.scales": "model.safetensors",
+        "decoder.model.layers.4.fc1.weight": "model.safetensors",
+        "decoder.model.layers.4.fc2.bias": "model.safetensors",
+        "decoder.model.layers.4.fc2.biases": "model.safetensors",
+        "decoder.model.layers.4.fc2.scales": "model.safetensors",
+        "decoder.model.layers.4.fc2.weight": "model.safetensors",
+        "decoder.model.layers.4.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.4.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.4.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.4.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.4.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.4.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.4.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.4.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.5.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.5.fc1.bias": "model.safetensors",
+        "decoder.model.layers.5.fc1.biases": "model.safetensors",
+        "decoder.model.layers.5.fc1.scales": "model.safetensors",
+        "decoder.model.layers.5.fc1.weight": "model.safetensors",
+        "decoder.model.layers.5.fc2.bias": "model.safetensors",
+        "decoder.model.layers.5.fc2.biases": "model.safetensors",
+        "decoder.model.layers.5.fc2.scales": "model.safetensors",
+        "decoder.model.layers.5.fc2.weight": "model.safetensors",
+        "decoder.model.layers.5.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.5.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.5.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.5.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.5.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.5.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.5.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.5.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.6.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.6.fc1.bias": "model.safetensors",
+        "decoder.model.layers.6.fc1.biases": "model.safetensors",
+        "decoder.model.layers.6.fc1.scales": "model.safetensors",
+        "decoder.model.layers.6.fc1.weight": "model.safetensors",
+        "decoder.model.layers.6.fc2.bias": "model.safetensors",
+        "decoder.model.layers.6.fc2.biases": "model.safetensors",
+        "decoder.model.layers.6.fc2.scales": "model.safetensors",
+        "decoder.model.layers.6.fc2.weight": "model.safetensors",
+        "decoder.model.layers.6.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.6.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.6.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.6.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.6.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.6.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.6.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.6.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.7.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.7.fc1.bias": "model.safetensors",
+        "decoder.model.layers.7.fc1.biases": "model.safetensors",
+        "decoder.model.layers.7.fc1.scales": "model.safetensors",
+        "decoder.model.layers.7.fc1.weight": "model.safetensors",
+        "decoder.model.layers.7.fc2.bias": "model.safetensors",
+        "decoder.model.layers.7.fc2.biases": "model.safetensors",
+        "decoder.model.layers.7.fc2.scales": "model.safetensors",
+        "decoder.model.layers.7.fc2.weight": "model.safetensors",
+        "decoder.model.layers.7.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.7.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.7.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.7.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.7.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.7.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.7.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.7.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.8.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.8.fc1.bias": "model.safetensors",
+        "decoder.model.layers.8.fc1.biases": "model.safetensors",
+        "decoder.model.layers.8.fc1.scales": "model.safetensors",
+        "decoder.model.layers.8.fc1.weight": "model.safetensors",
+        "decoder.model.layers.8.fc2.bias": "model.safetensors",
+        "decoder.model.layers.8.fc2.biases": "model.safetensors",
+        "decoder.model.layers.8.fc2.scales": "model.safetensors",
+        "decoder.model.layers.8.fc2.weight": "model.safetensors",
+        "decoder.model.layers.8.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.8.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.8.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.8.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.8.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.8.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.8.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.8.self_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.9.encoder_attn_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.9.fc1.bias": "model.safetensors",
+        "decoder.model.layers.9.fc1.biases": "model.safetensors",
+        "decoder.model.layers.9.fc1.scales": "model.safetensors",
+        "decoder.model.layers.9.fc1.weight": "model.safetensors",
+        "decoder.model.layers.9.fc2.bias": "model.safetensors",
+        "decoder.model.layers.9.fc2.biases": "model.safetensors",
+        "decoder.model.layers.9.fc2.scales": "model.safetensors",
+        "decoder.model.layers.9.fc2.weight": "model.safetensors",
+        "decoder.model.layers.9.final_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.9.final_layer_norm.weight": "model.safetensors",
+        "decoder.model.layers.9.self_attn.k_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.self_attn.k_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.self_attn.k_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.self_attn.k_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.self_attn.out_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.self_attn.out_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.self_attn.out_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.self_attn.out_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.self_attn.q_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.self_attn.q_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.self_attn.q_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.self_attn.q_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.self_attn.v_proj.bias": "model.safetensors",
+        "decoder.model.layers.9.self_attn.v_proj.biases": "model.safetensors",
+        "decoder.model.layers.9.self_attn.v_proj.scales": "model.safetensors",
+        "decoder.model.layers.9.self_attn.v_proj.weight": "model.safetensors",
+        "decoder.model.layers.9.self_attn_layer_norm.bias": "model.safetensors",
+        "decoder.model.layers.9.self_attn_layer_norm.weight": "model.safetensors",
+        "encoder.embeddings.norm.bias": "model.safetensors",
+        "encoder.embeddings.norm.weight": "model.safetensors",
+        "encoder.embeddings.patch_embeddings.projection.bias": "model.safetensors",
+        "encoder.embeddings.patch_embeddings.projection.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.0.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.0.blocks.1.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.0.downsample.norm.bias": "model.safetensors",
+        "encoder.encoder.layers.0.downsample.norm.weight": "model.safetensors",
+        "encoder.encoder.layers.0.downsample.reduction.biases": "model.safetensors",
+        "encoder.encoder.layers.0.downsample.reduction.scales": "model.safetensors",
+        "encoder.encoder.layers.0.downsample.reduction.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.0.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.1.blocks.1.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.1.downsample.norm.bias": "model.safetensors",
+        "encoder.encoder.layers.1.downsample.norm.weight": "model.safetensors",
+        "encoder.encoder.layers.1.downsample.reduction.biases": "model.safetensors",
+        "encoder.encoder.layers.1.downsample.reduction.scales": "model.safetensors",
+        "encoder.encoder.layers.1.downsample.reduction.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.0.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.1.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.10.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.11.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.12.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.13.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.2.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.3.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.4.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.5.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.6.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.7.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.8.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.2.blocks.9.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.2.downsample.norm.bias": "model.safetensors",
+        "encoder.encoder.layers.2.downsample.norm.weight": "model.safetensors",
+        "encoder.encoder.layers.2.downsample.reduction.biases": "model.safetensors",
+        "encoder.encoder.layers.2.downsample.reduction.scales": "model.safetensors",
+        "encoder.encoder.layers.2.downsample.reduction.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.0.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.output.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.key.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.key.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.key.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.key.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.query.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.query.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.query.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.query.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.relative_position_bias_table": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.relative_position_index": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.value.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.value.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.value.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.attention.self.value.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.intermediate.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.intermediate.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.intermediate.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.intermediate.dense.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.layernorm_after.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.layernorm_after.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.layernorm_before.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.layernorm_before.weight": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.output.dense.bias": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.output.dense.biases": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.output.dense.scales": "model.safetensors",
+        "encoder.encoder.layers.3.blocks.1.output.dense.weight": "model.safetensors"
+    }
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "do_align_long_axis": false,
+  "do_crop_margin": true,
+  "do_normalize": true,
+  "do_pad": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "do_thumbnail": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "NougatImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "processor_class": "NougatProcessor",
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 896,
+    "width": 672
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,205 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[START_REF]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "[END_REF]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "6": {
+      "content": "[IMAGE]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "7": {
+      "content": "<fragments>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "8": {
+      "content": "</fragments>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "9": {
+      "content": "<work>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "10": {
+      "content": "</work>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "11": {
+      "content": "[START_SUP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "12": {
+      "content": "[END_SUP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "13": {
+      "content": "[START_SUB]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "14": {
+      "content": "[END_SUB]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "15": {
+      "content": "[START_DNA]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "16": {
+      "content": "[END_DNA]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "17": {
+      "content": "[START_AMINO]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "18": {
+      "content": "[END_AMINO]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "19": {
+      "content": "[START_SMILES]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "20": {
+      "content": "[END_SMILES]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "21": {
+      "content": "[START_I_SMILES]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "22": {
+      "content": "[END_I_SMILES]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "max_length": 4096,
+  "model_max_length": 4096,
+  "pad_to_multiple_of": null,
+  "pad_token": "<pad>",
+  "pad_token_type_id": 0,
+  "padding_side": "right",
+  "processor_class": "NougatProcessor",
+  "stride": 0,
+  "tokenizer_class": "NougatTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "<unk>",
+  "vocab_file": null
+}