查看指标方法与数据说明
#1

screenpipe/screenpipe

多模态模型开源:YC AI knows you ve seen等。

创建:2024-06-19 Rust agentsagiai
⭐ 19,145
#2

deepseek-ai/Janus

视觉语言模型开源:Janus-Series Unified Und等。

创建:2024-10-18 Python any-to-anyfoundation-modelsllm
⭐ 17,742
#3

simular-ai/Agent-S

视觉语言模型开源:Agent open agentic frame等。

创建:2024-10-09 Python agent-computer-interfaceai-agentscomputer-automation
⭐ 11,769
#4

RunanywhereAI/runanywhere-sdks

视觉语言模型开源:Production ready toolkit等。

创建:2025-07-22 C++ androidapple-intelligencecpp
⭐ 10,347
#5

rednote-hilab/dots.ocr

文档理解开源:Multilingual Document La等。

创建:2025-07-30 Python
⭐ 8,903
#6

datawhalechina/all-in-rag

多模态模型开源:大模型应用开发实战一 RAG 技术全栈指南 在线等。

创建:2025-06-05 Python aideepseekembedding
⭐ 8,270
#7

apple/ml-fastvlm

多模态模型开源:repository contains offi等。

创建:2025-05-01 Python
⭐ 7,358
#8

om-ai-lab/VLM-R1

视觉语言模型开源:Solve Visual Understandi等。

创建:2025-02-06 Python deepseek-r1grpollm
⭐ 5,965
#9

PySpur-Dev/pyspur

多模态模型开源:visual playground agenti等。

创建:2024-09-23 TypeScript agentagentsai
⭐ 5,732
#10

OpenBMB/UltraRAG

视觉语言模型开源:Low-Code MCP Framework B等。

创建:2025-01-16 Python deepseekdemoeasy
⭐ 5,580
#11

deepseek-ai/DeepSeek-VL2

视觉语言模型开源:DeepSeek-VL2 Mixture-of-等。

创建:2024-12-13 Python
⭐ 5,295
#12

manycore-research/SpatialLM

空间场景理解开源:NeurIPS SpatialLM Traini等。

创建:2025-03-14 Python mllmpoint-cloudsscene-understanding
⭐ 4,582
#13

ant-research/MagicQuill

视觉语言模型开源:CVPR Official Implementa等。

创建:2024-11-12 Python aigcgradioimage-editing
⭐ 3,681
#14

aiming-lab/SimpleMem

多模态模型开源:SimpleMem Efficient Life等。

创建:2026-01-01 Python agentaudiocompression
⭐ 3,472
#15

MiniMax-AI/MiniMax-01

视觉语言模型开源:official repo MiniMax-Te等。

创建:2025-01-14 Python large-language-modelsllmllms
⭐ 3,424
#16

QiuYannnn/Local-File-Organizer

视觉语言模型开源:AI-powered file manageme等。

创建:2024-09-21 Python file-organizerllama3llm
⭐ 3,236
#17

timerring/bilive

多模态模型开源:极快的B站直播录制 自动切片 自动渲染弹幕以及字等。

创建:2024-07-21 Python assbilibilibili
⭐ 3,232
#19

SkyworkAI/Skywork-R1V

视觉语言模型开源:Skywork-R1V is advanced等。

创建:2025-03-15 Python deepseek-r1grpollm
⭐ 3,160
#20

OpenMOSS/MOSS-TTS

多模态模型开源:MOSS TTS Family is open等。

创建:2026-02-07 Python audioaudio-tokenizerllm
⭐ 3,109
#21

TanStack/ai

多模态模型开源:Type-safe provider-agnos等。

创建:2025-10-08 TypeScript aiai-agentsai-sdk
⭐ 2,746
#22

starVLA/starVLA

视觉语言模型开源:StarVLA Lego-like Codeba等。

创建:2025-10-09 Python robotic-foundation-modelroboticsvision-language-action-model
⭐ 2,721
#23

om-ai-lab/OmAgent

视觉语言模型开源:EMNLP-2024 Build agents等。

创建:2024-07-04 Python agentchatbotgemini
⭐ 2,649
#24

open-gigaai/giga-brain-0

视觉语言模型开源:GigaBrain-0 World Model-等。

创建:2025-09-26 Python
⭐ 2,537
#25

OmniSVG/OmniSVG

视觉语言模型开源:NeurIPS OmniSVG is first等。

创建:2025-04-07 Python
⭐ 2,514
#26

Turbo1123/roubao

视觉语言模型开源:Android Automation Tool等。

创建:2025-12-09 Kotlin aiai-agentsandroid
⭐ 2,225
#27

OpenHelix-Team/VLA-Adapter

视觉语言模型开源:VLA-Adapter Effective Pa等。

创建:2025-09-20 Python embodied-airoboticsvision-language-action-model
⭐ 2,199
#28

PKU-YuanGroup/LLaVA-CoT

视觉语言模型开源:ICCV LLaVA-CoT visual ca等。

创建:2024-11-17 Python
⭐ 2,138
#29

NVlabs/Eagle

视觉语言模型开源:Eagle Frontier Vision-La等。

创建:2024-06-27 Python demoeaglegpt4
⭐ 2,092
#30

ozgrozer/ai-renamer

多模态模型开源:Node.js CLI uses Ollama等。

创建:2024-07-07 JavaScript aiautomationcli-tool
⭐ 2,086
#31

cambrian-mllm/cambrian

视觉语言模型开源:Cambrian-1 is family LLM等。

创建:2024-06-17 Python chatbotclipcomputer-vision
⭐ 2,003
#32

NVIDIA-NeMo/DataDesigner

多模态模型开源:NeMo Data Designer Gener等。

创建:2025-10-16 Python agentic-aidata-augmentationdata-generation
⭐ 1,955
#33

showlab/ShowUI

视觉语言模型开源:CVPR Open-source End-to-等。

创建:2024-10-31 Python agentcomputer-usegui-agent
⭐ 1,849
#34

ZJU4HealthCare/HealthGPT

视觉语言模型开源:ICML Spotlight Official等。

创建:2025-02-17 Python
⭐ 1,628
#35

bytedance/Sa2VA

视觉语言模型开源:Official Repo Pixel-LLM等。

创建:2025-01-06 Python computer-visionlarge-language-modelsmllm
⭐ 1,609
#36

ByteDance-Seed/Seed1.5-VL

视觉语言模型开源:Seed1.5-VL vision-langua等。

创建:2025-05-11 Jupyter Notebook cookbooklarge-language-modelmultimodal-large-language-models
⭐ 1,577
#37

TIGER-AI-Lab/TheoremExplainAgent

多模态模型开源:Official Repo Video-base等。

创建:2025-02-16 Python llm-agentsmanimmanim-animations
⭐ 1,492
#38

allenzren/open-pi-zero

视觉语言模型开源:Re-implementation pi0 VL等。

创建:2024-12-03 Python
⭐ 1,476
#39

AIDC-AI/Ovis

视觉语言模型开源:novel Large MLLM archite等。

创建:2024-06-13 Python chatbotllama3multimodal
⭐ 1,452
#40

IDEA-Research/Rex-Omni

视觉语言模型开源:CVPR2026 Detect Anything等。

创建:2025-10-04 Jupyter Notebook mllmobject-detectionopen-set
⭐ 1,418
#42

NPC-Worldwide/npcpy

视觉语言模型开源:python library research等。

创建:2024-09-27 Python agentsaillm
⭐ 1,375
#43

waybarrios/vllm-mlx

视觉语言模型开源:OpenAI Anthropic compati等。

创建:2025-12-06 Python anthropicapple-siliconaudio-processing
⭐ 1,301
#44

Osilly/Vision-R1

视觉语言模型开源:ICLR2026 is first paper等。

创建:2025-02-03 Python
⭐ 1,274
#45

HJYao00/Mulberry

视觉语言模型开源:NIPS Spotlight Mulberry等。

创建:2024-12-23 Python
⭐ 1,243
#46

MoonshotAI/Kimi-VL

视觉语言模型开源:Kimi-VL Mixture-of-Exper等。

创建:2025-04-09
⭐ 1,197
#47

SkalskiP/vlms-zero-to-hero

视觉语言模型开源:series will take you jou等。

创建:2024-12-20 Jupyter Notebook bert-modelclipcomputer-vision
⭐ 1,173
#48

nv-tlabs/LLaMA-Mesh

空间场景理解开源:Unifying 3D Mesh Generat等。

创建:2024-11-14 Python 3d-generationllmmesh-generation
⭐ 1,152
#51

AIDC-AI/Pixelle-MCP

多模态模型开源:Open-Source AIGC Solutio等。

创建:2025-07-28 Python
⭐ 1,034
#52

MAC-AutoML/MindPipe

视觉语言模型开源:powerful compression fra等。

创建:2026-01-22 Python automatic-compressioncompressiondeployment
⭐ 1,008
#53

taco-group/OpenEMMA

视觉语言模型开源:OpenEMMA permissively li等。

创建:2024-10-30 Python algorithmsartificial-intelligenceautonomous-car
⭐ 935
#54

allenai/molmo

视觉语言模型开源:Code Molmo Vision-Langua等。

创建:2024-12-05 Python
⭐ 909
#55

microsoft/rag-time

多模态模型开源:RAG Time 5-week Journey等。

创建:2024-12-11 Jupyter Notebook aiazurebinary-quantization
⭐ 885
#56

tulerfeng/Video-R1

多模态模型开源:Video-R1 Reinforcing Vid等。

创建:2025-02-22 Python
⭐ 875
#57

GAIR-NLP/anole

多模态模型开源:Extended verision ICLR B等。

创建:2024-07-01 Python
⭐ 841
#58

LYL1015/JarvisArt

视觉语言模型开源:NeurIPS JarvisArt Libera等。

创建:2025-06-24 Python agentimage-processinglarge-language-models
⭐ 823
#59

EvolvingLMMs-Lab/NEO

视觉语言模型开源:NEO Series Native Vision等。

创建:2025-10-16 Python agiencoder-free-vlmlarge-language-models
⭐ 809
#60

taco-group/4KAgent

视觉语言模型开源:NeurIPS 4KAgent Agentic等。

创建:2025-05-27 Python agentagentic-aicomputer-vision
⭐ 798
#61

PsyChip/machina

多模态模型开源:OpenCV+YOLO+LLAVA powere等。

创建:2024-10-07 Python camerallavaollama-api
⭐ 792
#62

go-kratos/blades

多模态模型开源:Blades is Go-based AI Ag等。

创建:2025-09-15 Go agentagent-frameworkagent-kit
⭐ 786
#64

DriveVLA/OpenDriveVLA

视觉语言模型开源:AAAI OpenDriveVLA End-to等。

创建:2025-03-18 Python autonomous-drivingend-to-end-autonomous-drivingvision-language-action-model
⭐ 745
#65

Haervwe/open-webui-tools

多模态模型开源:Open WebUI Tools is modu等。

创建:2024-11-09 Python academic-researchai-agentsai-workstation
⭐ 741
#66

MIV-XJTU/FSDrive

视频语言模型开源:NeurIPS spotlight Offici等。

创建:2025-05-27 Python autonomous-drivingcotmllm
⭐ 739
#69

SpatialVLA/SpatialVLA

空间场景理解开源:SpatialVLA spatial-enhan等。

创建:2025-01-29 Python generalist-robot-policieshuggingfacerss
⭐ 690
#71

2toinf/X-VLA

视觉语言模型开源:ICLR offical Implementat等。

创建:2025-09-25 C++ cloth-foldingflorence-2manipulation
⭐ 669
#72

ZJUI-AI4H/Hulu-Med

视觉语言模型开源:Transparent Generalist H等。

创建:2025-10-08 Python
⭐ 665
#73

inclusionAI/Ming

多模态模型开源:Ming facilitating advanc等。

创建:2025-04-21 Jupyter Notebook
⭐ 656
#74

TIGER-AI-Lab/VLM2Vec

视觉语言模型开源:repo contains code VLM2V等。

创建:2024-10-07 Python benchmarkcontrastive-learningembedding
⭐ 652
#75

cafferychen777/mLLMCelltype

多模态模型开源:Cell type annotation sin等。

创建:2025-04-07 Python bioinformaticscell-type-annotationcomputational-biology
⭐ 642
#78

AnjieCheng/NaVILA

视觉语言模型开源:RSS repository is implem等。

创建:2025-03-19 Python
⭐ 618
#80

hkproj/pytorch-paligemma

多模态模型开源:Coding scratch PyTorch f等。

创建:2024-07-13 Python
⭐ 611
#81

zhipeixu/FakeShield

视觉语言模型开源:ICLR FakeShield Explaina等。

创建:2024-10-03 Python ifdlmllm
⭐ 607
#82

levy-tech-spark/AViD

视觉语言模型开源:Framework enables fine-t等。

创建:2025-03-19 Python
⭐ 600
#84

allenai/molmo2

视觉语言模型开源:Code Molmo2 Vision-Langu等。

创建:2025-12-15 Python
⭐ 583
#85

ictnlp/LLaVA-Mini

视觉语言模型开源:LLaVA-Mini is unified la等。

创建:2025-01-07 Python efficientgpt4ogpt4v
⭐ 576
#86

JAMESYJL/ShapeLLM-Omni

空间场景理解开源:NeurIPS Spotlight Native等。

创建:2025-06-01 Python 3d-captioning3d-editingimage-to-3d
⭐ 567
#87

ucla-mobility/AutoVLA

视觉语言模型开源:NeurIPS AutoVLA End-to-E等。

创建:2025-06-14 Python autonomous-drivinggrporeinforcement-finetuning
⭐ 566
#88

Flame-Code-VLM/Flame-Code-VLM

视觉语言模型开源:Flame is open-source AI等。

创建:2025-02-10 Python aicode-generationdata-synthesis
⭐ 561
#89

hustvl/Senna

视觉语言模型开源:Bridging Large Vision-La等。

创建:2024-10-29 Python autonomous-drivingend-to-endvision-language-model
⭐ 552
#90

vulab-AI/Awesome-Spatial-VLMs

空间场景理解开源:repository is official r等。

创建:2025-07-10 Python awesome-listawesome-spatial-vlmsmllm
⭐ 551
#91

henrydaum/second-brain

多模态模型开源:Second Brain is agentic等。

创建:2025-09-19 Python agentic-aiagentic-workflowai
⭐ 549
#93

bytedance/tarsier

视频语言模型开源:Tarsier family large-sca等。

创建:2024-07-05 Python research
⭐ 545
#94

MIV-XJTU/JanusVLN

空间场景理解开源:ICLR2026 Official implem等。

创建:2025-09-26 Python llmmllmvla
⭐ 542
#95

nrl-ai/llama-assistant

多模态模型开源:AI-powered assistant hel等。

创建:2024-09-26 Python deepseek-r1llamallama-3-2
⭐ 531
#96

OpenBMB/DeepThinkVLA

视觉语言模型开源:DeepThinkVLA Enhancing R等。

创建:2025-10-13 Python reasoning-modelsrlrobotics
⭐ 524
#98

cpystan/SD-VLM

空间场景理解开源:NeurIPS SD-VLM Spatial M等。

创建:2025-08-22 Python
⭐ 503
#99

hustvl/EVF-SAM

视觉语言模型开源:Official code EVF-SAM Ea等。

创建:2024-06-12 Python multimodalmultimodal-large-language-modelsreferring-image-segmentation
⭐ 500