mistralrs_core/vision_models/
mod.rs

1use std::any::Any;
2
3use candle_core::Tensor;
4
5pub(crate) mod clip;
6pub(crate) mod conformer;
7pub(crate) mod idefics2;
8pub(crate) use idefics2::idefics2_input_processor;
9pub(crate) mod image_processor;
10pub(crate) mod llava;
11pub(crate) mod mllama;
12pub(crate) mod phi3;
13pub(crate) use phi3::phi3_inputs_processor;
14pub(crate) mod preprocessor_config;
15pub(crate) mod processor_config;
16pub(crate) mod qwen2_5_vl;
17pub(crate) mod qwen2vl;
18pub(crate) use llava::llava15;
19pub(crate) use llava::llava_inputs_processor;
20pub(crate) use llava::llava_next;
21pub(crate) use llava::llava_next_inputs_processor;
22pub(crate) mod idefics3;
23pub(crate) mod minicpmo;
24pub(crate) mod phi4;
25pub(crate) use phi4::inputs_processor;
26pub(crate) mod gemma3;
27pub(crate) mod gemma3n;
28pub(crate) mod llama4;
29pub(crate) mod mistral3;
30pub(crate) mod qwen3_vl;
31pub(crate) mod qwen3_vl_moe;
32pub(crate) mod siglip;
33
34use crate::pipeline::text_models_inputs_processor::{FlashParams, PagedAttentionInputMetadata};
35
36pub struct ModelInputs {
37    pub input_ids: Tensor,
38    pub seqlen_offsets: Vec<usize>,
39    pub context_lens: Vec<(usize, usize)>,
40    pub position_ids: Vec<usize>,
41    pub pixel_values: Option<Tensor>,
42    pub model_specific_args: Box<dyn Any>,
43    pub paged_attn_meta: Option<PagedAttentionInputMetadata>,
44    pub flash_meta: FlashParams,
45}
mistralrs_core/vision_models/mod.rs

mistralrs_core/vision_models/
mod.rs