—
Total de Linhas
—
Total de Colunas
—
Linhas com Valores Ausentes
—
Completude do Dataset
Análise de Valores Ausentes
Verificação célula a célula para cada coluna do dataset| Coluna | Tipo de Dados | Valores Ausentes | Estado |
|---|
Estatísticas por Coluna
Métricas descritivas para validação dos valores do dataset| Coluna | Count | Mín | Máx | Média | Mediana | Desvio P. | Q1 (25%) | Q3 (75%) | IQR | Assimetria | Curtose | Outliers |
|---|
Outliers: valores fora de [Q1 − 1.5×IQR, Q3 + 1.5×IQR]. Assimetria: 0 = simétrico, >0 = cauda direita, <0 = cauda esquerda. Curtose: 0 = distribuição normal, >0 = pico acentuado, <0 = pico suave.
Gerar Dataset Processado
Converte variáveis categóricas para números — ficheiro usado nas fases seguintesTransformações aplicadas
| Coluna | Transformação |
|---|---|
Couple_ID | Removida — sem valor preditivo |
PCOS | Yes → 1 / No → 0 |
Female_Smokes | Yes → 1 / No → 0 |
Male_Smokes | Yes → 1 / No → 0 |
Period_Regularity | Regular → 1 / Irregular → 0 |
Female_Alcohol | No_Alcohol=0 · Low=1 · Moderate=2 · High=3 |
Male_Alcohol | No_Alcohol=0 · Low=1 · Moderate=2 · High=3 |
Female_Exercise | No_Exercise=0 · Light=1 · Moderate=2 · Active=3 |
Male_Exercise | No_Exercise=0 · Light=1 · Moderate=2 · Active=3 |
Pregnancy_Success | Success → 1 / Failure → 0 |