unitorch.cli.models.clip¤

ClipProcessor¤

Tip

core/process/clip is the section for configuration of ClipProcessor.

Bases: ClipProcessor

Processor for the CLIP model.

Source code in src/unitorch/cli/models/clip/processing.py

def __init__(
    self,
    vocab_path: str,
    merge_path: str,
    vision_config_path: str,
    max_seq_length: Optional[int] = 128,
    position_start_id: Optional[int] = 0,
):
    super().__init__(
        vocab_path=vocab_path,
        merge_path=merge_path,
        vision_config_path=vision_config_path,
        max_seq_length=max_seq_length,
        position_start_id=position_start_id,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/clip/processing.py

@classmethod
@config_defaults_init("core/process/clip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/process/clip")
    pretrained_name = config.getoption("pretrained_name", "clip-vit-base-patch16")
    vocab_path = config.getoption("vocab_path", None)
    vocab_path = pop_value(
        vocab_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "vocab"),
    )
    vocab_path = cached_path(vocab_path)

    merge_path = config.getoption("merge_path", None)
    merge_path = pop_value(
        merge_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "merge"),
    )
    merge_path = cached_path(merge_path)

    vision_config_path = config.getoption("vision_config_path", None)
    vision_config_path = pop_value(
        vision_config_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "vision_config"),
    )

    vision_config_path = cached_path(vision_config_path)

    return {
        "vocab_path": vocab_path,
        "merge_path": merge_path,
        "vision_config_path": vision_config_path,
    }

_classification ¤

_classification(
    text: str,
    image: Union[Image, str],
    max_seq_length: Optional[int] = None,
)

Source code in src/unitorch/cli/models/clip/processing.py

@register_process("core/process/clip/classification")
def _classification(
    self,
    text: str,
    image: Union[Image.Image, str],
    max_seq_length: Optional[int] = None,
):
    if isinstance(image, str):
        image = Image.open(image)

    outputs = super().classification(
        text=text,
        image=image,
        max_seq_length=max_seq_length,
    )
    return TensorInputs(
        input_ids=outputs.input_ids,
        attention_mask=outputs.attention_mask,
        position_ids=outputs.position_ids,
        pixel_values=outputs.pixel_values,
    )

_text_classification ¤

_text_classification(
    text: str, max_seq_length: Optional[int] = None
)

Source code in src/unitorch/cli/models/clip/processing.py

@register_process("core/process/clip/text_classification")
def _text_classification(
    self,
    text: str,
    max_seq_length: Optional[int] = None,
):
    outputs = super().text_classification(
        text=text,
        max_seq_length=max_seq_length,
    )
    return TensorInputs(
        input_ids=outputs.input_ids,
        attention_mask=outputs.attention_mask,
        position_ids=outputs.position_ids,
    )

_image_classification ¤

_image_classification(image: Union[Image, str])

Source code in src/unitorch/cli/models/clip/processing.py

@register_process("core/process/clip/image_classification")
def _image_classification(
    self,
    image: Union[Image.Image, str],
):
    if isinstance(image, str):
        image = Image.open(image)
    outputs = super().image_classification(image=image)
    return TensorInputs(pixel_values=outputs.pixel_values)

ClipForPretrain¤

Tip

core/model/pretrain/clip is the section for configuration of ClipForPretrain.

Bases: ClipForPretrain

CLIP model for pretraining.

Source code in src/unitorch/cli/models/clip/modeling.py

def __init__(
    self,
    config_path: str,
    projection_dim: Optional[int] = 512,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
    use_all_gather: Optional[bool] = True,
):
    super().__init__(
        config_path=config_path,
        projection_dim=projection_dim,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
        use_all_gather=use_all_gather,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/clip/modeling.py

@classmethod
@config_defaults_init("core/model/pretrain/clip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/pretrain/clip")
    pretrained_name = config.getoption("pretrained_name", "clip-vit-base-patch16")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    projection_dim = config.getoption("projection_dim", 512)
    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)
    use_all_gather = config.getoption("use_all_gather", True)

    inst = cls(
        config_path=config_path,
        projection_dim=projection_dim,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
        use_all_gather=use_all_gather,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids: Tensor,
    pixel_values: Tensor,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/clip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids: torch.Tensor,
    pixel_values: torch.Tensor,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        pixel_values=pixel_values,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return LossOutputs(loss=outputs)

ClipForClassification¤

Tip

core/model/classification/clip is the section for configuration of ClipForClassification.

Bases: ClipForClassification

CLIP model for classification.

Source code in src/unitorch/cli/models/clip/modeling.py

def __init__(
    self,
    config_path: str,
    projection_dim: Optional[int] = 512,
    num_classes: Optional[int] = 1,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        projection_dim=projection_dim,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/clip/modeling.py

@classmethod
@config_defaults_init("core/model/classification/clip")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/classification/clip")
    pretrained_name = config.getoption("pretrained_name", "clip-vit-base-patch16")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    projection_dim = config.getoption("projection_dim", 512)
    num_classes = config.getoption("num_classes", 1)
    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        projection_dim=projection_dim,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids: Tensor,
    pixel_values: Tensor,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/clip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids: torch.Tensor,
    pixel_values: torch.Tensor,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        pixel_values=pixel_values,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return ClassificationOutputs(outputs=outputs)

ClipForTextClassification¤

Tip

core/model/classification/clip/text is the section for configuration of ClipForTextClassification.

Bases: ClipForTextClassification

CLIP model for text classification.

Source code in src/unitorch/cli/models/clip/modeling.py

def __init__(
    self,
    config_path: str,
    projection_dim: Optional[int] = 512,
    num_classes: Optional[int] = 1,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        projection_dim=projection_dim,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/clip/modeling.py

@classmethod
@config_defaults_init("core/model/classification/clip/text")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/classification/clip/text")
    pretrained_name = config.getoption("pretrained_name", "clip-vit-base-patch16")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    projection_dim = config.getoption("projection_dim", 512)
    num_classes = config.getoption("num_classes", 1)
    freeze_base_model = config.getoption("freeze_base_Truemodel", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        projection_dim=projection_dim,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(
    input_ids=None,
    attention_mask: Optional[Tensor] = None,
    position_ids: Optional[Tensor] = None,
)

Source code in src/unitorch/cli/models/clip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    input_ids=None,
    attention_mask: Optional[torch.Tensor] = None,
    position_ids: Optional[torch.Tensor] = None,
):
    outputs = super().forward(
        input_ids=input_ids,
        attention_mask=attention_mask,
        position_ids=position_ids,
    )
    return ClassificationOutputs(outputs=outputs)

ClipForImageClassification¤

Tip

core/model/classification/clip/image is the section for configuration of ClipForImageClassification.

Bases: ClipForImageClassification

CLIP model for image classification.

Source code in src/unitorch/cli/models/clip/modeling.py

def __init__(
    self,
    config_path: str,
    projection_dim: Optional[int] = 512,
    num_classes: Optional[int] = 1,
    freeze_base_model: Optional[bool] = True,
    gradient_checkpointing: Optional[bool] = False,
):
    super().__init__(
        config_path=config_path,
        projection_dim=projection_dim,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )

from_config `classmethod` ¤

from_config(config, **kwargs)

Source code in src/unitorch/cli/models/clip/modeling.py

@classmethod
@config_defaults_init("core/model/classification/clip/image")
def from_config(cls, config, **kwargs):
    config.set_default_section("core/model/classification/clip/image")
    pretrained_name = config.getoption("pretrained_name", "clip-vit-base-patch16")
    config_path = config.getoption("config_path", None)
    config_path = pop_value(
        config_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "config"),
    )

    config_path = cached_path(config_path)

    projection_dim = config.getoption("projection_dim", 512)
    num_classes = config.getoption("num_classes", 1)
    freeze_base_model = config.getoption("freeze_base_model", True)
    gradient_checkpointing = config.getoption("gradient_checkpointing", False)

    inst = cls(
        config_path=config_path,
        projection_dim=projection_dim,
        num_classes=num_classes,
        freeze_base_model=freeze_base_model,
        gradient_checkpointing=gradient_checkpointing,
    )
    pretrained_weight_path = config.getoption("pretrained_weight_path", None)
    weight_path = pop_value(
        pretrained_weight_path,
        nested_dict_value(pretrained_clip_infos, pretrained_name, "weight"),
        check_none=False,
    )
    if weight_path is not None:
        inst.from_pretrained(weight_path)

    return inst

forward ¤

forward(pixel_values: Tensor)

Source code in src/unitorch/cli/models/clip/modeling.py

@autocast(device_type=("cuda" if torch.cuda.is_available() else "cpu"))
def forward(
    self,
    pixel_values: torch.Tensor,
):
    outputs = super().forward(pixel_values=pixel_values)
    return ClassificationOutputs(outputs=outputs)

unitorch.cli.models.clip¤

ClipProcessor¤

from_config classmethod ¤

_classification ¤

_text_classification ¤

_image_classification ¤

ClipForPretrain¤

from_config classmethod ¤

forward ¤

ClipForClassification¤

from_config classmethod ¤

forward ¤

ClipForTextClassification¤

from_config classmethod ¤

forward ¤

ClipForImageClassification¤

from_config classmethod ¤

forward ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤

from_config `classmethod` ¤