Two large-scale and complementary visio-linguistic datasets (aka Nr3D and Sr3D) for identifying fine-grained 3D objects in ScanNet scenes. Nr3D contains 41.5K natural, free-form utterances, and Sr3d contains 83.5K template-based utterances.
🔗 Visiter Referit3DDescription
Two large-scale and complementary visio-linguistic datasets (aka Nr3D and Sr3D) for identifying fine-grained 3D objects in ScanNet scenes. Nr3D contains 41.5K natural, free-form utterances, and Sr3d contains 83.5K template-based utterances.
💬 Our review
Referit3D est un projet intéressant qui se concentre sur des ensembles de données visio-linguistiques pour l'identification d'objets 3D dans des scènes ScanNet. En gros, il propose deux bases de données : Nr3D et Sr3D, qui sont assez impressionnantes avec des milliers de phrases naturelles et des phrases basées sur des modèles. Si tu es chercheur ou développeur dans le domaine de la vision par ordinateur, cela pourrait t'être utile. Cependant, il faut reconnaître que le site est peu connu et peut être un peu technique à comprendre pour ceux qui ne sont pas déjà familiers avec ce domaine. En comparaison, des projets comme COCO ou ImageNet sont beaucoup plus en vue et peuvent offrir des données similaires mais avec une plus grande reconnaissance. Ce qui est un peu regrettable, c'est que le site ne fournit pas beaucoup d'informations sur comment utiliser ces ensembles de données ou s'il y a des coûts associés. Pour ceux qui cherchent à approfondir leurs recherches, ça peut être un peu frustrant de ne pas avoir de support ou de guides clairs sur l'utilisation de ces ressources. Néanmoins, si tu es vraiment intéressé par l'analyse d'objets 3D, ça vaut le coup d'y jeter un œil.
📊 Global score
🤖 AI-enriched data
Pros
Ensembles de données riches
Utilisation dans la recherche
Complémentarité des ressources
Cons
Peu connu
Manque de documentation claire