Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions

🔥 Dataset can be found in 🤗Huggingface, which contain 219,437 image descriptions. Link to our paper: arxiv.

Install

See detailed instructions in install.md.

Datasets

Images

COCO: Download here train2017.
SAM: Click here SAM (sa_000000.tar ~ sa_000024.tar).
VG: Click here VG.

After downloading, organize the image datasets as follows in ./dataset/:

├── coco
│   └── train2017
├── sam
    └── images
├── vg

Use

After install all the requirements, you can follow use.md to generate description on your datasets.

Visualization

Acknowledgement

If you find our work useful for your research or applications, please cite using this BibTeX:

@misc{pi2024image,
      title={Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions}, 
      author={Renjie Pi and Jianshu Zhang and Jipeng Zhang and Rui Pan and Zhekai Chen and Tong Zhang},
      year={2024},
      eprint={2406.07502},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Name		Name	Last commit message	Last commit date
Latest commit History 91 Commits
benchmark		benchmark
docs		docs
extract		extract
fg_annotation		fg_annotation
filter		filter
refine		refine
script		script
utils		utils
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions

Contents

Install

Datasets

Images

Use

Visualization

Acknowledgement

About

Releases

Packages

Languages

sterzhang/image-textualization

Folders and files

Latest commit

History

Repository files navigation

Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions

Contents

Install

Datasets

Images

Use

Visualization

Acknowledgement

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages