unitorch.cli.models.siglip¤

SiglipProcessor¤

Tip

core/process/siglip is the section for configuration of SiglipProcessor.

Bases: SiglipProcessor

Processor for Siglip models.

Source code in src/unitorch/cli/models/siglip/processing.py

def __init__(
    self,
    vocab_path: str,
    vision_config_path: str,
    max_seq_length: Optional[int] = 128,
    position_start_id: Optional[int] = 0,
):
    super().__init__(
        vocab_path=vocab_path,
        vision_config_path=vision_config_path,
        max_seq_length=max_seq_length,
        position_start_id=position_start_id,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/siglip/processing.py

@classmethod
@config_defaults_init("core/process/siglip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/process/siglip")
    pretrained_name = config.getoption("pretrained_name", "siglip-base-patch16-224")
    vocab_path = config.getoption("vocab_path", None)
    vocab_path = pop_value(
        vocab_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "vocab"),
    )
    vocab_path = cached_path(vocab_path)

    vision_config_path = config.getoption("vision_config_path", None)
    vision_config_path = pop_value(
        vision_config_path,
        nested_dict_value(
            pretrained_siglip_infos, pretrained_name, "vision_config"
        ),
    )

    vision_config_path = cached_path(vision_config_path)

    return {
        "vocab_path": vocab_path,
        "vision_config_path": vision_config_path,
    }

_classification ¤

_classification(
    text: str,
    image: Union[Image, str],
    max_seq_length: Optional[int] = None,
)

Source code in src/unitorch/cli/models/siglip/processing.py

@register_process("core/process/siglip/classification")
def _classification(
    self,
    text: str,
    image: Union[Image.Image, str],
    max_seq_length: Optional[int] = None,
):
    if isinstance(image, str):
        image = Image.open(image)

    outputs = super().classification(
        text=text,
        image=image,
        max_seq_length=max_seq_length,
    )
    return TensorInputs(
        input_ids=outputs.input_ids,
        attention_mask=outputs.attention_mask,
        position_ids=outputs.position_ids,
        pixel_values=outputs.pixel_values,
    )

_text_classification ¤

_text_classification(
    text: str, max_seq_length: Optional[int] = None
)

Source code in src/unitorch/cli/models/siglip/processing.py

@register_process("core/process/siglip/text_classification")
def _text_classification(
    self,
    text: str,
    max_seq_length: Optional[int] = None,
):
    outputs = super().text_classification(
        text=text,
        max_seq_length=max_seq_length,
    )
    return TensorInputs(
        input_ids=outputs.input_ids,
        attention_mask=outputs.attention_mask,
        position_ids=outputs.position_ids,
    )

_image_classification ¤

_image_classification(image: Union[Image, str])

Source code in src/unitorch/cli/models/siglip/processing.py

@register_process("core/process/siglip/image_classification")
def _image_classification(
    self,
    image: Union[Image.Image, str],
):
    if isinstance(image, str):
        image = Image.open(image)
    outputs = super().image_classification(image=image)
    return TensorInputs(pixel_values=outputs.pixel_values)

SiglipForPretrain¤

Tip

core/model/pretrain/siglip is the section for configuration of SiglipForPretrain.

Bases: SiglipForPretrain

Siglip model for pretraining.

Source code in src/unitorch/cli/models/siglip/modeling.py

def __init__(
    self,
    config_path: str,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
    use_all_gather: Optional[bool] = True,
):
    super().__init__(
        config_path=config_path,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
        use_all_gather=use_all_gather,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/siglip/modeling.py

@classmethod
@config_defaults_init("core/model/pretrain/siglip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/pretrain/siglip")
    pretrained_name = config.getoption("pretrained_name", "siglip-base-patch16-224")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)
    use_all_gather = config.getoption("use_all_gather", True)

    inst = cls(
        config_path=config_path,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
        use_all_gather=use_all_gather,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids: Tensor,
    pixel_values: Tensor,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/siglip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids: torch.Tensor,
    pixel_values: torch.Tensor,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        pixel_values=pixel_values,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return LossOutputs(loss=outputs)

SiglipForClassification¤

Tip

core/model/classification/siglip is the section for configuration of SiglipForClassification.

Bases: SiglipForClassification

Siglip model for multimodal classification.

Source code in src/unitorch/cli/models/siglip/modeling.py

def __init__(
    self,
    config_path: str,
    num_classes: Optional[int] = 1,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/siglip/modeling.py

@classmethod
@config_defaults_init("core/model/classification/siglip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/classification/siglip")
    pretrained_name = config.getoption("pretrained_name", "siglip-base-patch16-224")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    num_classes = config.getoption("num_classes", 1)
    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids: Tensor,
    pixel_values: Tensor,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/siglip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids: torch.Tensor,
    pixel_values: torch.Tensor,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        pixel_values=pixel_values,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return ClassificationOutputs(outputs=outputs)

SiglipForTextClassification¤

Tip

core/model/classification/siglip/text is the section for configuration of SiglipForTextClassification.

Bases: SiglipForTextClassification

Siglip model for text classification.

Source code in src/unitorch/cli/models/siglip/modeling.py

def __init__(
    self,
    config_path: str,
    num_classes: Optional[int] = 1,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/siglip/modeling.py

@classmethod
@config_defaults_init("core/model/classification/siglip/text")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/classification/siglip/text")
    pretrained_name = config.getoption("pretrained_name", "siglip-base-patch16-224")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    num_classes = config.getoption("num_classes", 1)
    freeze_base_model = config.getoption("freeze_base_Truemodel", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids=None,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/siglip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids=None,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return ClassificationOutputs(outputs=outputs)

SiglipForImageClassification¤

Tip

core/model/classification/siglip/image is the section for configuration of SiglipForImageClassification.

Bases: SiglipForImageClassification

Siglip model for image-only classification.

Source code in src/unitorch/cli/models/siglip/modeling.py

def __init__(
    self,
    config_path: str,
    num_classes: Optional[int] = 1,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/siglip/modeling.py

@classmethod
@config_defaults_init("core/model/classification/siglip/image")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/classification/siglip/image")
    pretrained_name = config.getoption("pretrained_name", "siglip-base-patch16-224")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    num_classes = config.getoption("num_classes", 1)
    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(pixel_values: Tensor)

Source code in src/unitorch/cli/models/siglip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    pixel_values: torch.Tensor,
):
    outputs = super().forward(pixel_values=pixel_values)
    return ClassificationOutputs(outputs=outputs)

SiglipForMatching¤

Tip

core/model/matching/siglip is the section for configuration of SiglipForMatching.

Bases: SiglipForMatching

Siglip model for image-text matching.

Source code in src/unitorch/cli/models/siglip/modeling.py

def __init__(
    self,
    config_path: str,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/siglip/modeling.py

@classmethod
@config_defaults_init("core/model/matching/siglip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/matching/siglip")
    pretrained_name = config.getoption("pretrained_name", "siglip-base-patch16-224")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_siglip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids: Tensor,
    pixel_values: Tensor,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/siglip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids: torch.Tensor,
    pixel_values: torch.Tensor,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        pixel_values=pixel_values,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return ClassificationOutputs(outputs=outputs)

unitorch.cli.models.siglip¤

SiglipProcessor¤

from_config classmethod ¤

_classification ¤

_text_classification ¤

_image_classification ¤

SiglipForPretrain¤

from_config classmethod ¤

forward ¤

SiglipForClassification¤

from_config classmethod ¤

forward ¤

SiglipForTextClassification¤

from_config classmethod ¤

forward ¤

SiglipForImageClassification¤

from_config classmethod ¤

forward ¤

SiglipForMatching¤

from_config classmethod ¤

forward ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤