flax-community
/

vit-gpt2

Model card Files Files and versions Metrics Training metrics Community

ydshieh commited on Jul 17, 2021

Commit

a722530

•

1 Parent(s): 3c34a2e

upload coco summary script

Files changed (1) hide show

run_summarization_coco.py +11 -5

run_summarization_coco.py CHANGED Viewed

@@ -37,6 +37,7 @@ import nltk  # Here to have a nice missing dependency error message early on
 import numpy as np
 from datasets import Dataset, load_dataset, load_metric
 from tqdm import tqdm
 import jax
 import jax.numpy as jnp
@@ -418,19 +419,24 @@ def main():
     # Setting padding="max_length" as we need fixed length inputs for jitted functions
     def preprocess_function(examples):
         _pixel_values = []
-        for y in examples[image_file_column]:
             with Image.open(y) as image:
-                encoder_inputs = feature_extractor(images=image, return_tensors="np")
                 x = encoder_inputs.pixel_values
                 _pixel_values.append(x)
         pixel_values = np.concatenate(_pixel_values)
-        targets = examples[caption_column]
         # Add eos_token!!
-        targets = [x.lower() + ' ' + tokenizer.eos_token for x in targets]
         model_inputs = {}
         model_inputs['pixel_values'] = pixel_values

 import numpy as np
 from datasets import Dataset, load_dataset, load_metric
 from tqdm import tqdm
+from PIL import Image
 import jax
 import jax.numpy as jnp
     # Setting padding="max_length" as we need fixed length inputs for jitted functions
     def preprocess_function(examples):
         _pixel_values = []
+        _captions = []
+        for y, z in zip(examples[image_file_column], examples[caption_column]):
             with Image.open(y) as image:
+                try:
+                    encoder_inputs = feature_extractor(images=image, return_tensors="np")
+                except:
+                    continue
                 x = encoder_inputs.pixel_values
                 _pixel_values.append(x)
+                _captions.append(z + ' ' + tokenizer.eos_token)
         pixel_values = np.concatenate(_pixel_values)
+        targets = _captions
         # Add eos_token!!
+        #targets = [x + ' ' + tokenizer.eos_token for x in targets]
         model_inputs = {}
         model_inputs['pixel_values'] = pixel_values