Channel - Tony Shin

VeRA: Vector-based Random Matrix Adaptation

Tony Shin
260 views • 8 months ago

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

Tony Shin
433 views • 8 months ago

HyperAttention: Long-context Attention in Near-Linear Time

Tony Shin
373 views • 8 months ago

Fast Feedforward Networks

Tony Shin
418 views • 8 months ago

Nougat: Neural Optical Understanding for Academic Documents

Tony Shin
238 views • 8 months ago

Retentive Network: A Successor to Transformer for Large Language Models

Tony Shin
797 views • 8 months ago

LLava: Visual Instruction Tuning

Tony Shin
899 views • 8 months ago

BloombergGPT: A Large Language Model for Finance

Tony Shin
424 views • 1 year ago

ImageBind: One Embedding Space To Bind Them All

Tony Shin
878 views • 1 year ago

Segment Anything

Tony Shin
470 views • 1 year ago

Are Emergent Abilities of Large Language Models a Mirage?

Tony Shin
2.6K views • 1 year ago

Synthetic Data Boosts ImageNet Classification

Tony Shin
214 views • 1 year ago

Unlimiformer: Long-Range Transformers with Unlimited Length Input

Tony Shin
718 views • 1 year ago

[Tutorial] Image Super Resolution without Photoshop

Tony Shin
1.1K views • 2 years ago

YOLO9000: Better, Faster, Stronger

Tony Shin
1.1K views • 2 years ago

NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion

Tony Shin
1K views • 2 years ago

Florence: A New Foundation Model for Computer Vision

Tony Shin
1.2K views • 2 years ago

DSSD: Deconvolutional Single Shot Detector

Tony Shin
585 views • 2 years ago

MAE: Masked Autoencoders Are Scalable Vision Learners

Tony Shin
4.8K views • 2 years ago

PVANet: Deep but Lightweight Neural Networks forReal-time Object Detection

Tony Shin
374 views • 2 years ago

SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers

Tony Shin
4.2K views • 2 years ago

R-FCN: Object Detection via Region-based Fully Convolutional Networks

Tony Shin
1K views • 2 years ago

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Tony Shin
2.2K views • 2 years ago

Pix2Seq: A Language Modeling Framework for Object Detection

Tony Shin
1.6K views • 2 years ago

Improved Regularization of Convolutional Neural Networks with Cutout

Tony Shin
395 views • 2 years ago

VICReg: Variance-Invariance-Covariance Regularization for Self-Supervised Learning

Tony Shin
2.6K views • 3 years ago

SSD: Single Shot MultiBox Detector

Tony Shin
5.6K views • 3 years ago

Barlow Twins: Self-Supervised Learning via Redundancy Reduction

Tony Shin
2K views • 3 years ago

MLP-Mixer: An all-MLP Architecture for Vision

Tony Shin
1.6K views • 3 years ago

YOLO: Unified, Real-Time Object Detection

Tony Shin
850 views • 3 years ago

Load More