Question 1

What is the Flickr30K Entities dataset?

Accepted Answer

Dataset contains 244k coreference chains and 276k manually annotated bounding boxes for each of the 31,783 images and 158,915 English captions (five per image) in the original dataset.

Question 2

Is Flickr30K Entities a benchmark?

Accepted Answer

Flickr30K Entities is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download Flickr30K Entities?

Accepted Answer

Flickr30K Entities is available at its source: https://github.com/BryanPlummer/flickr30k_entities.

Flickr30K Entities

About Flickr30K Entities

Details

Related Automatic Image Captioning datasets

FAQ