metadata
language: sv
license: mit
datasets:
- Gabriel/citesum_swe
tags:
- summarization
widget:
- text: >-
Många samtidiga programmeringsmodeller möjliggör både transaktionsminne
och meddelandepassage. För sådana modeller har forskare byggt upp allt
effektivare implementeringar och fastställt rimliga korrekthetskriterier,
samtidigt som det fortfarande är ett öppet problem att få det bästa av
båda världarna. Vi presenterar en programmeringsmodell som är den första
som har ogenomskinliga transaktioner, säkert asynkront meddelande som
passerar, och ett effektivt genomförande. Våra semantik använder
preliminärt meddelande passerar och håller reda på beroenden för att
möjliggöra ångra meddelande passerar om en transaktion avbryter. Vi kan
programmera kommunikation idiomer som barriär och mötesplats som inte
dödläge när de används i ett atomblock. Våra experiment visar att vår
modell tillför lite overhead till rena transaktioner, och att den är
betydligt effektivare än Transaktionshändelser. Vi använder en ny
definition av säkert meddelande som kan vara av oberoende intresse.
inference:
parameters:
temperature: 0.7
min_length: 30
max_length: 120
model-index:
- name: Gabriel/bart-base-cnn-xsum-cite-swe
results:
- task:
type: summarization
name: summarization
dataset:
name: Gabriel/citesum_swe
type: Gabriel/citesum_swe
split: validation
metrics:
- name: Validation ROGUE-1.
type: rouge-1
value: 29.6279
verified: true
- name: Validation ROGUE-2
type: rouge-2
value: 11.5697
verified: true
- name: Validation ROGUE-L
type: rouge-l
value: 24.2429
verified: true
- name: Validation ROGUE-L-SUM
type: rouge-l-sum
value: 24.4557
verified: true
train-eval-index:
- config: Gabriel--citesum_swe
task: summarization
task_id: summarization
splits:
eval_split: test
col_mapping:
document: text
summary: target
co2_eq_emissions:
emissions: 0.0334
source: Google Colab
training_type: fine-tuning
geographical_location: Fredericia, Denmark
hardware_used: Tesla P100-PCIE-16GB
bart-base-cnn-xsum-cite-swe
This model is a fine-tuned version of Gabriel/bart-base-cnn-xsum-swe on the None dataset. It achieves the following results on the evaluation set:
- Loss: 2.4203
- Rouge1: 29.6279
- Rouge2: 11.5697
- Rougel: 24.2429
- Rougelsum: 24.4557
- Gen Len: 19.9371
Model description
More information needed
Intended uses & limitations
More information needed
Training and evaluation data
More information needed
Training procedure
Training hyperparameters
The following hyperparameters were used during training:
- learning_rate: 2e-05
- train_batch_size: 16
- eval_batch_size: 16
- seed: 42
- gradient_accumulation_steps: 2
- total_train_batch_size: 32
- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
- lr_scheduler_type: linear
- lr_scheduler_warmup_steps: 500
- num_epochs: 1
- mixed_precision_training: Native AMP
Training results
Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
---|---|---|---|---|---|---|---|---|
2.4833 | 1.0 | 2558 | 2.4203 | 29.6279 | 11.5697 | 24.2429 | 24.4557 | 19.9371 |
Framework versions
- Transformers 4.22.2
- Pytorch 1.12.1+cu113
- Datasets 2.5.1
- Tokenizers 0.12.1