dae.duckdb_storage package

Submodules

dae.duckdb_storage.duckdb2_variants module

class dae.duckdb_storage.duckdb2_variants.DuckDb2Runner(connection_factory: DuckDBPyConnection, query: list[str], deserializer: Any | None = None, limit: int | None = None)[source]

Bases: QueryRunner

Run a DuckDb query in a separate thread.

run() → None[source]: Execute the query and enqueue the resulting rows.

class dae.duckdb_storage.duckdb2_variants.DuckDb2Variants(connection_factory: DuckDbConnectionFactory, db2_layout: Db2Layout, gene_models: GeneModels, reference_genome: ReferenceGenome)[source]

Bases: QueryVariantsBase

Backend for DuckDb storage backend.

build_family_variants_query_runner(*, regions: list[Region] | None = None, genes: list[str] | None = None, effect_types: list[str] | None = None, family_ids: list[str] | None = None, person_ids: list[str] | None = None, inheritance: list[str] | None = None, roles: str | None = None, sexes: str | None = None, affected_statuses: str | None = None, variant_type: str | None = None, real_attr_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, categorical_attr_filter: list[tuple[str, list[str] | list[int] | None]] | None = None, ultra_rare: bool | None = None, frequency_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, return_reference: bool | None = None, return_unknown: bool | None = None, limit: int | None = None, study_filters: list[str] | None = None, tags_query: TagsQuery | None = None, **kwargs: Any) → QueryRunner | None[source]: Create a query runner for searching family variants.

build_summary_variants_query_runner(*, regions: list[Region] | None = None, genes: list[str] | None = None, effect_types: list[str] | None = None, variant_type: str | None = None, real_attr_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, categorical_attr_filter: list[tuple[str, list[str] | list[int] | None]] | None = None, ultra_rare: bool | None = None, frequency_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, return_reference: bool | None = None, return_unknown: bool | None = None, limit: int | None = None, **kwargs: Any) → QueryRunner | None[source]: Create query runner for searching summary variants.

fetch_annotation() → str[source]

query_summary_variants(*, regions: list[Region] | None = None, genes: list[str] | None = None, effect_types: list[str] | None = None, variant_type: str | None = None, real_attr_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, categorical_attr_filter: list[tuple[str, list[str] | list[int] | None]] | None = None, ultra_rare: bool | None = None, frequency_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, return_reference: bool | None = None, return_unknown: bool | None = None, limit: int | None = None, **kwargs: Any) → Generator[SummaryVariant, None, None][source]: Execute the summary variants query and yields summary variants.

query_variants(*, regions: list[Region] | None = None, genes: list[str] | None = None, effect_types: list[str] | None = None, family_ids: list[str] | None = None, person_ids: list[str] | None = None, inheritance: list[str] | None = None, roles: str | None = None, sexes: str | None = None, variant_type: str | None = None, real_attr_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, categorical_attr_filter: list[tuple[str, list[str] | list[int] | None]] | None = None, ultra_rare: bool | None = None, frequency_filter: list[tuple[str, tuple[float | None, float | None]]] | None = None, return_reference: bool | None = None, return_unknown: bool | None = None, limit: int | None = None, tags_query: TagsQuery | None = None, **kwargs: Any) → Generator[FamilyVariant, None, None][source]: Execute the family variants query and yields family variants.

dae.duckdb_storage.duckdb_connection_factory module

class dae.duckdb_storage.duckdb_connection_factory.DuckDbConnectionFactory[source]

Bases: ABC

Abstract factory for DuckDb connection.

abstract connect() → DuckDBPyConnection[source]: Create a new DuckDb connection.

dae.duckdb_storage.duckdb_genotype_storage module

class dae.duckdb_storage.duckdb_genotype_storage.AbstractDuckDbStorage(dd_config: DuckDbConf | DuckDbS3Conf | DuckDbParquetConf | DuckDbS3ParquetConf)[source]

Bases: GenotypeStorage, DuckDbConnectionFactory

Defines abstract DuckDb genotype storage.

build_backend(study_config: dict, genome: ReferenceGenome, gene_models: GeneModels) → DuckDb2Variants[source]: Construct a query backend for this genotype storage.

abstract build_study_layout(study_config: dict[str, Any]) → Db2Layout[source]: Construct study layout from study and storage configuration.

connect() → DuckDBPyConnection[source]: Create a new DuckDb connection.

is_read_only() → bool[source]

shutdown() → AbstractDuckDbStorage[source]: Frees all resources used by the genotype storage to work.

class dae.duckdb_storage.duckdb_genotype_storage.DuckDbParquetStorage(dd_config: DuckDbParquetConf)[source]

Bases: AbstractDuckDbStorage

Defines duckdb_parquet genotype storage.

build_study_layout(study_config: dict[str, Any]) → Db2Layout[source]: Construct study layout from study and storage configuration.

classmethod get_storage_types() → set[str][source]: Return the genotype storage type.

start() → DuckDbParquetStorage[source]: Allocate all resources needed for the genotype storage to work.

class dae.duckdb_storage.duckdb_genotype_storage.DuckDbS3ParquetStorage(dd_config: DuckDbS3ParquetConf)[source]

Bases: AbstractDuckDbStorage

Defines duckdb_s3_parquet genotype storage.

build_study_layout(study_config: dict[str, Any]) → Db2Layout[source]: Construct study layout from study and storage configuration.

classmethod get_storage_types() → set[str][source]: Return the genotype storage type.

start() → DuckDbS3ParquetStorage[source]: Allocate all resources needed for the genotype storage to work.

class dae.duckdb_storage.duckdb_genotype_storage.DuckDbS3Storage(dd_config: DuckDbS3Conf)[source]

Bases: AbstractDuckDbStorage

Defines duckdb genotype storage.

build_study_layout(study_config: dict[str, Any]) → Db2Layout[source]: Construct study layout from study and storage configuration.

get_db_filename() → str[source]: Construct database full filename.

classmethod get_storage_types() → set[str][source]: Return the genotype storage type.

start() → DuckDbS3Storage[source]: Allocate all resources needed for the genotype storage to work.

class dae.duckdb_storage.duckdb_genotype_storage.DuckDbStorage(dd_config: DuckDbConf)[source]

Bases: AbstractDuckDbStorage

Defines duckdb genotype storage.

build_study_layout(study_config: dict[str, Any]) → Db2Layout[source]: Construct study layout from study and storage configuration.

get_db_filename() → str[source]: Construct database full filename.

classmethod get_storage_types() → set[str][source]: Return the genotype storage type.

start() → DuckDbStorage[source]: Allocate all resources needed for the genotype storage to work.

dae.duckdb_storage.duckdb_genotype_storage.duckdb_parquet_storage_factory(storage_config: dict[str, Any]) → DuckDbParquetStorage[source]: Create duckdb_parquet genotype storage.

dae.duckdb_storage.duckdb_genotype_storage.duckdb_s3_parquet_storage_factory(storage_config: dict[str, Any]) → DuckDbS3ParquetStorage[source]: Create duckdb_s3_parquet genotype storage.

dae.duckdb_storage.duckdb_genotype_storage.duckdb_s3_storage_factory(storage_config: dict[str, Any]) → DuckDbS3Storage[source]: Create duckdb_s3 genotype storage.

dae.duckdb_storage.duckdb_genotype_storage.duckdb_storage_factory(storage_config: dict[str, Any]) → DuckDbStorage[source]: Create duckdb genotype storage.