yuchenlin
/

LLM-fuser-3b-v2

Text2Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LLM-fuser-3b-v2

1 contributor

History: 3 commits

yuchenlin's picture

3500

06977c0 over 1 year ago

.gitattributes

1.48 kB

initial commit over 1 year ago
config.json

1.53 kB

ckpt-3000 over 1 year ago
generation_config.json

142 Bytes

ckpt-3000 over 1 year ago
latest

15 Bytes

ckpt-3000 over 1 year ago
pytorch_model.bin
Detected Pickle imports (3)
- "collections.OrderedDict",
- "torch.BFloat16Storage",
- "torch._utils._rebuild_tensor_v2"
What is a pickle import?
5.7 GB
LFS

3500 over 1 year ago
rng_state_0.pth

17.7 kB
LFS

ckpt-3000 over 1 year ago
rng_state_1.pth

17.7 kB
LFS

ckpt-3000 over 1 year ago
rng_state_2.pth

17.7 kB
LFS

ckpt-3000 over 1 year ago
rng_state_3.pth

17.7 kB
LFS

ckpt-3000 over 1 year ago
special_tokens_map.json

2.2 kB

ckpt-3000 over 1 year ago
spiece.model

792 kB
LFS

ckpt-3000 over 1 year ago
tokenizer.json

2.42 MB

ckpt-3000 over 1 year ago
tokenizer_config.json

2.35 kB

ckpt-3000 over 1 year ago
trainer_state.json

318 kB

ckpt-3000 over 1 year ago
training_args.bin
Detected Pickle imports (10)
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.IntervalStrategy",
- "torch.float32",
- "transformers.training_args_seq2seq.Seq2SeqTrainingArguments",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.HubStrategy",
- "torch.device",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.deepspeed.HfTrainerDeepSpeedConfig"
How to fix it?
5.31 kB
LFS

ckpt-3000 over 1 year ago
zero_to_fp32.py

23.6 kB

ckpt-3000 over 1 year ago